从来没有“开放”人工智能这样的东西

在世纪之交,当现代网络刚刚兴起、微软称王时,一场规模虽小但不断发展的技术运动对公司构成了生存威胁。 微软时任首席执行官史蒂夫·鲍尔默 (Steve Ballmer) 称为其中之一 它的核心要素是“一种将自身附着在其接触到的一切事物上的癌症”。 这种疾病是一种竞争性操作系统 Linux 及其代表的开源软件:与 Microsoft Windows 和 Office 等昂贵的专有软件相比,任何人都可以免费下载、修改和使用的程序。

开源软件最终确实融入了互联网的大部分内容——Mozilla 火狐浏览器, 这 安卓 操作系统,以及 维基百科 都是“开放”项目,但科技行业成功地将平等主义理念转化为商业机会。 价值数万亿美元的公司使用免费的开源软件来构建或增强自己的产品。 开源的任何东西仍然经常被设计用于,并且 依靠 依次调解大多数互联网访问的大型科技平台、小工具和数据服务器 吸引 用户 世界上最强大的公司。 仅仅运行一个应用程序或托管一个网站几乎肯定需要从微软、谷歌或亚马逊等公司运营的云服务器购买计算时间。

现在,新兴的生成人工智能行业也面临着类似的问题。 越来越多 人们正在使用大公司提供的人工智能产品,并且 很少 对技术的运作方式有任何见解或发言权。 作为回应,越来越多的研究人员和组织开始支持开放 AI(不要与 ChatGPT 背后的秘密公司 OpenAI 混淆)。 这个想法是创建相对透明的模型,让公众可以更容易、更便宜地使用、研究和复制,试图使高度集中的技术民主化,这种技术可能有潜力改变工作、政治、休闲,甚至 宗教。 但这场运动,就像之前的开源革命一样,面临着被大型科技公司吞并的风险。

没有比《骆驼 2》更好地说明这种紧张局势的了,它是最突出和最重要的。 有争议的 自称“开放”的人工智能系统是由 Facebook、Instagram、WhatsApp 和 Threads 的巨头 Meta 创建的。 去年夏天发布的 Llama 2 是一个大型语言模型,虽然不如 ChatGPT 和 Google 的 Bard 底层语言模型强大,但 自由的 用于研究和商业用途。 但是,尽管模型的最终代码可以下载,Meta 禁止 该代码的某些用途。 开发者不能利用 Llama 2 来改进任何其他语言模型,他们需要 Meta 的明确许可才能将 Llama 2 集成到每月有超过 7 亿用户的产品中——例如,这项政策将禁止 TikTok 自由使用该技术。 Llama 的大部分开发流程都是秘密的,特别是 Meta 之外的人都不知道该模型是根据哪些数据进行训练的。 独立程序员和倡导者表示确实如此 不符合开放条件

尽管如此,初创企业、大学和非营利组织基本上可以出于任何目的下载和使用 Llama 2。 除了将模型整合到产品中之外,他们还可以在某种程度上调查 Llama 2 功能和限制的来源——使用 ChatGPT 和 Bard 等“封闭”技术来完成更困难的任务。 在一份书面声明中,Meta 发言人告诉我,该公司的开放方式“允许 AI 社区使用 Llama 2 以安全和负责任的方式帮助推进”AI。

抛开使用限制不谈,要使生成式人工智能模型真正开放,需要发布的不仅仅是最终程序。 训练数据、用于处理数据的代码、微调算法所采取的步骤等等是理解、复制或修改人工智能的关键。 旧形式的开放软件可以打包在一个简单的 .zip 文件中并免费分发; 人工智能并不那么容易被遏制或访问。 Mozilla 全球产品政策主管 Udbhav Tiwari 告诉我:“有人可能会说,我们目前谈论的许多‘开放’人工智能项目根本就不是开源的。” 一些批评家认为这种名义上可访问的发布示例“开放式洗涤”,其中公司积累声誉和免费研究,但实际上并未提供某人深入研究、重新创建或与其模型竞争所需的信息; 全球的 努力 正在重新定义人工智能的“开源”。

更加开放的模式,通常由非营利组织和小型初创企业发布,提供有关培训的更多详细信息,并且使用限制较少。 但即使是这些模型也面临着生成人工智能的巨大复杂性和资源需求。 如果说经典的开源程序就像自行车一样易于理解和修复,那么人工智能则更像是特斯拉。 鉴于如此先进的汽车的工程计划,很少有人能够自己修理它,更不用说制造它了。 同样,当您向 ChatGPT 或 Bard 提出问题时,屏幕上的响应就是最终结果 亿万 美元 计算能力,更不用说购买计算机的支出 筹码, 工资, 和更多。 几乎没有人除了 科技巨头 与他们合作的初创公司(例如 OpenAI)有能力承担这些费用。

为大量用户运行这些模型同样昂贵。 麻省理工学院斯隆管理学院研究人工智能行业的努尔·艾哈迈德告诉我,大学、非营利组织和初创企业“无法自行创建此类模型”。 人工智能风险投资池已经 出现迹象 由于投资者担心初创企业没有资源与最强大的科技公司竞争,科技正在枯竭。

“你正在以某种组合方式开源代码、权重或数据。 但不是计算,也不是基础设施,”多伦多大学计算机科学家研究大型科技对人工智能的影响的穆罕默德·阿卜杜拉 (Mohamed Abdalla) 告诉我。 大公司无法提供成为小型竞争对手或大幅影响人工智能发展方向所需的计算能力或人才。 即使是“开放”模型的审核也需要大量资源——花了近两年的时间 识别儿童性虐待的图像 用于训练生成人工智能的最大开源图像数据集。 AI Now Institute 董事总经理 Sarah Myers West 告诉我:“说开源将使人工智能的使用民主化,和开源将使整个行业民主化,这两者之间确实有很大的区别。”

一些努力正试图将人工智能基础设施从占主导地位的科技公司转移到公众身上。 联邦政府已 计划 建立国家人工智能研究资源; 几所大学合作创建了一个 高性能计算中心 在波士顿进行高级人工智能研究。 波士顿大学的计算机科学家雅尼斯·帕斯卡利迪斯 (Yannis Paschalidis) 为该计算中心做出了贡献,他告诉我,目前,“我认为我无法用数万亿个参数训练下一代 ChatGPT,但我可以微调建模或训练一个更小的、专门的模型。”

研究人员还在设计更小的、 打开 对于许多商业用途来说足够强大的模型,以及 更便宜训练和跑步。 例如,EleutherAI 是一个发布开源 AI 的非营利性研究实验室,它的一群研究人员开始尝试为 OpenAI 的封闭式 GPT-3 提供一个开放的替代方案。 “我们想要训练这样的模型,我们想要了解它们是如何工作的,我们想要公开它们的较小规模版本,”EleutherAI 的执行董事斯特拉·比德曼 (Stella Biderman) 告诉我。 尽管如此,许多程序员、初创企业、非营利组织和大学在没有大量资助的情况下无法创建更小的模型,或者只能修改较富裕公司提供的模型。

即使是表面上帮助开源社区的资源也可能是 有利 对于科技巨头来说:例如,Google 和 Meta 创建并帮助维护广泛使用的免费机器学习软件库。 在去年春天的财报电话会议上,Meta 首席执行官马克·扎克伯格 (Mark Zuckerberg) “提供这一点对我们来说非常有价值,因为现在业内所有最好的开发人员都在使用我们内部也在使用的工具。” 当人工智能项目使用Meta的工具构建时,它们很容易商业化,并且可以吸引用户进入Meta产品生态系统。 (当被问及开放人工智能库背后的盈利动机时,Meta 发言人告诉我,“我们相信可以直接使 Meta 受益的方法,同时也有助于刺激健康和充满活力的人工智能生态系统。”)倡导某种形式的“开放”人工智能开发, 作为 许多 科技 高管 也可能是一种对抗不必要的监管的策略; 为什么要限制理论上代表市场更多竞争的开源项目? 当然,资源限制意味着这些项目不太可能严重威胁领先的人工智能公司。

与此同时,硅谷有能力吸引人才并生产最大、性能最好的人工智能产品,这意味着 研究注意力 弯曲 面向那些公司认为最有价值的程序、软件架构和任务。 艾哈迈德说,这反过来最终“塑造了人工智能的研究方向”。

目前,科技行业重视规模并从中获利:在公司数据服务器上运行更大的模型,以追求特定基准的小幅改进。 一个 分析 近年来有影响力的人工智能论文发现,研究优先考虑性能和新颖性,而“尊重人”和“正义”等价值观几乎不存在。 这些技术论文为许多产品和服务中使用的人工智能程序设定了方向。 “下游影响可能是某人被剥夺了工作或某人被剥夺了住房机会,”该研究的合著者、Mozilla 人工智能研究员 Abeba Birhane 告诉我。

构建生成式人工智能所需的资源使科技行业能够扭曲公众对技术的期望:如果 ChatGPT 是你可以想象的语言模型工作的唯一方式,那么任何不能像 ChatGPT 那样工作的东西都是不够的。 但这也将是构建和使用生成式人工智能的一种非常狭窄的方式。 很少有人仅仅根据马力来购买汽车。 大多数人会考虑尺寸、设计、里程、信息娱乐系统、安全性等。 人们可能还愿意牺牲性能来换取更加公平和透明的聊天机器人——从开放人工智能中受益不仅需要重新定义开源,还需要重新想象人工智能本身可以和应该是什么样子。

1704652874
#从来没有开放人工智能这样的东西
2024-01-04 20:55:33

Leave a Reply

Your email address will not be published. Required fields are marked *

近期新闻​

编辑精选​