利用 ML Firepower 扑灭 AI 火灾

加州大学圣地亚哥分校计算机科学博士毕业生孔志峰是该故事的第一作者。

“现代深度生成模型经常产生不良输出，例如冒犯性文本、恶意图像或捏造的言论，并且没有可靠的方法来控制它们。这篇论文是关于如何从技术上防止这种情况发生。”计算机科学与工程系博士毕业生、论文第一作者孔志峰说。

计算机科学教授 Kamalika Chaudhuri 说：“这项工作的主要贡献是正式确定如何思考这个问题以及如何正确地构建它以便解决它。”

消除有害内容的新方法

传统的缓解方法采用两种方法之一。第一种方法是使用排除所有不需要的样本的训练集从头开始重新训练模型；另一种方法是应用分类器来过滤不需要的输出或在内容生成后编辑输出。

这些解决方案对于大多数现代大型模型都有一定的局限性。除了成本高昂（需要数百万美元从头开始重新训练行业规模模型）之外，这些缓解方法的计算量很大，而且无法控制第三方在获得源代码后是否会实施可用的过滤器或编辑工具。此外，它们甚至可能无法解决问题：有时，即使训练数据中不存在，也会出现不需要的输出，例如带有伪影的图像。

1714683452
2024-05-02 20:42:58
#利用 #Firepower #扑灭 #火灾

Related

Tags: Firepower, 利用, 扑灭, 火灾

相关新闻

科林·法雷尔的《Sugar》系列回顾

May 19, 2024

一名妇女被神秘绑架的令人毛骨悚然的细节 (24)：调查人员发现了一段重要视频！然而，在此之后，他们却不知所措

May 19, 2024

防止DHF传播，大都市政府推动清洁健康环境运动（GELIAT）

May 19, 2024

乌克兰人以分歧判定战胜泰森·富里的官方记分卡被揭晓，球迷们声称“腐败且令人尴尬”的裁判“试图抢劫亚历山大·乌西克，但失败了”

May 19, 2024

两次怀孕期间患有糖尿病会严重增加以后患糖尿病的风险

May 19, 2024

PGA 锦标赛总季后赛历史记录格式、使用的洞数、规则结束时是否打平的规则

May 19, 2024

通过这些课程获得网络安全认证

May 19, 2024

斯特凡尼克在议会演讲中斥责拜登限制对以色列的武器：-

May 19, 2024

华尔道夫酒店运营商在长时间关闭后对重新开业日期保持沉默

May 19, 2024

Apple TV+ 再次免费长达三个月 › ifun.de

May 19, 2024

小牛队中锋德里克·莱弗利在获胜后向已故的母亲致敬

May 19, 2024

斯塔默试图通过周日早午餐坦杜里来讨好选民政治

May 19, 2024

Leave a Reply Cancel reply

近期新闻

科林·法雷尔的《Sugar》系列回顾

May 19, 2024

一名妇女被神秘绑架的令人毛骨悚然的细节 (24)：调查人员发现了一段重要视频！然而，在此之后，他们却不知所措

May 19, 2024

防止DHF传播，大都市政府推动清洁健康环境运动（GELIAT）

May 19, 2024

乌克兰人以分歧判定战胜泰森·富里的官方记分卡被揭晓，球迷们声称“腐败且令人尴尬”的裁判“试图抢劫亚历山大·乌西克，但失败了”

May 19, 2024

两次怀孕期间患有糖尿病会严重增加以后患糖尿病的风险

May 19, 2024

PGA 锦标赛总季后赛历史记录格式、使用的洞数、规则结束时是否打平的规则

May 19, 2024

编辑精选

Web Analytics