人工智能新闻:创造者敦促渥太华强制披露“黑匣子”训练

加拿大的创作者和出版商希望政府对未经授权且通常未报告的使用其内容来训练生成人工智能系统的行为采取措施。

生成式人工智能可以根据简单的提示创建文本、图像、视频和计算机代码,但要做到这一点,系统必须首先研究大量现有内容。

据代表作家、视觉艺术家和出版商的“版权访问” (Access Copyright) 称,这项工作是在“黑匣子”中进行的。

“权利人知道这种事情正在发生,但由于他们与人工智能平台之间的信息不对称,他们无法确定是谁在进行这种活动,使用谁的作品,也没有机制来阻止这种事情的发生。”

代表加拿大主要唱片公司的加拿大音乐协会 (Music Canada) 去年表示,一首模仿 Drake 和 The Weeknd 声音的人工智能生成的假歌曲“清楚地表明了一件事:人工智能模型和系统已经在未经数据源头或版权所有者授权的情况下获取了大量专有数据集。”

加拿大作家协会要求政府首先实施基本的披露和报告义务。协会表示,开发人员对正在挖掘的作品及其使用方式了如指掌,而创作者则对此一无所知。

一些组织已与人工智能公司签署了许可协议。但加拿大作家协会表示,版权持有者在授权其内容方面面临“巨大障碍”,因为他们不知道哪些公司使用了他们的哪些作品。

加拿大媒体制作人协会表示,法律案件说明了缺乏透明度所带来的问题,并列举了一个案例,其中人工智能公司辩称,除非权利人能够具体说明用于培训的具体作品,否则他们无法继续侵权指控。

“权利人无疑也将面临类似的证据问题,因为许多用于训练生成式人工智能系统的数据集据称在初始训练完成后就被销毁了,”报告说。

该组织表示,这是一个“需要立即关注”的问题,并要求政府实施透明度要求。

但人工智能公司坚持认为权利人要求的那种透明度是不现实的。

微软告诉政府,训练大规模人工智能系统涉及“大量”数据,公司不应该保留这些数据记录或披露用于训练的内容。

报告称:“记录此类信息是不可行的,任何此类要求都会阻碍人工智能的发展。”

谷歌表示,要求获得使用内容进行培训的许可将会暴露竞争敏感信息,并且“将有效阻止大型语言模型和其他类型的尖端人工智能的开发和使用”。

“事实上,世界上任何地方都不存在这样的事实来源。因此,遵守披露规则可能从一开始就是不可能的。”

加拿大人工智能公司 Cohere 表示,使用内容训练人工智能系统与个人通过阅读书籍来获取更多信息的方式类似。

代表加拿大科技行业的加拿大创新者委员会表示,披露要求将损害小公司的利益,而不是大型科技公司的利益。该委员会警告称,这将“严重阻碍加拿大公司大幅扩张的潜力”。

加拿大新闻通讯社于 2024 年 6 月 30 日首次发布本报道。

2024-06-30 16:35:00
1719820224

Leave a Reply

Your email address will not be published. Required fields are marked *

近期新闻​

编辑精选​