OpenAI、Anthropic AI 研究揭示了法学硕士如何影响安全和偏见

由于大型语言模型使用类似神经元的结构来运作,这些结构可能会将许多不同的概念和模式联系在一起,因此人工智能开发人员很难调整他们的模型来改变模型的行为。如果你不知道哪些神经元连接哪些概念,你就不知道要改变哪些神经元。 5月21日, Anthropic 发布了一张非常详细的地图 了解 Claude AI 微调版本(特别是 Claude 3 Sonnet 3.0 模型)的内部工作原理。大约两周后,OpenAI 发布了自己的研究成果,旨在弄清楚 GPT-4 如何解释模式。 借助 Anthropic 的地图,研究人员可以探索类似神经元的数据点(称为特征)如何影响生成式人工智能的输出。否则,人们只能看到输出本身。 其中一些特征是“与安全相关的”,这意味着如果人们能够准确识别这些特征,它可以帮助调整生成式人工智能,以避免潜在的危险话题或行为。这些特征对于调整分类很有用,而分类可能会影响偏见。 人类学发现了什么? Anthropic 的研究人员从当代大型语言模型 Claude 3 中提取了可解释的特征。可解释的特征可以从模型可读的数字转化为人类可理解的概念。 可解释的特征可能适用于不同语言中的同一概念以及图像和文本。 检查特征可以揭示 LLM 认为哪些主题是相互关联的。在这里,Anthropic 显示了与金门大桥相关的单词和图像上激活的某个特征。不同的颜色阴影表示激活的强度,从白色表示无激活到深橙色表示强激活。图片:Anthropic 研究人员写道:“我们这项研究的高层目标是将模型(Claude 3 Sonnet)的激活分解为更易于解释的部分。” 他们表示:“可解释性的一个希望是,它可以成为一种‘安全测试集’,让我们判断在训练期间看似安全的模型在部署时是否真的安全。” 查看:Anthropic 的 Claude Team 企业计划为中小型企业提供了 AI 助手。 特征由稀疏自动编码器生成,稀疏自动编码器是一种神经网络架构。在人工智能训练过程中,稀疏自动编码器受缩放定律等指导。因此,识别特征可以让研究人员了解人工智能将哪些主题关联在一起的规则。简而言之,Anthropic 使用稀疏自动编码器来揭示和分析特征。 研究人员写道:“我们发现了各种高度抽象的特征。它们(这些特征)既响应抽象行为,又在行为上引发抽象行为。” 有关试图弄清楚 LLM 内部情况的假设的详细信息,请参阅 Anthropic 的研究论文。 OpenAI 发现了什么? OpenAI 的研究于 6 […]

谷歌的人工智能建议在披萨上加胶水

The Prompt 每周都会发布人工智能领域最热门的初创企业、最大突破和商业交易摘要。若要将其发送到您的收件箱, 在此订阅。 欢迎回来《The Prompt》。 今天,OpenAI 宣布,它最近开始训练一种新的 AI 模型,该模型将 接替GPT-4 (ChatGPT 的模型)并产生所谓的“下一级能力”(尽管它没有说明这些能力是什么)。这家人工智能公司还表示,它正在创建一个 新安全与保障委员会 评估该技术带来的风险,并在未来 90 天内提出初步建议以减轻风险。该委员会将由公司董事会成员领导,包括 Bret Taylor、Adam D'Angelo、Nicole Seligman 和首席执行官 Sam Altman。OpenAI 表示,该委员会将咨询 外部专家 比如前国家安全局网络安全主管罗布·乔伊斯和前司法部官员约翰·卡林。 现在,让我们进入头条新闻。 道德与法律 在本月早些时候发布的 TikTok 上,Cassey Ho 表示,在一段视频中,Begoing 换了她的脸,她在视频中展示了自己的衣服。 何凯西 时装设计师 人体通过 AI 进行深度伪造 工具,以便 出售仿冒其自家产品的商品 在亚马逊和沃尔玛等平台上。 福布斯 采访了时尚品牌 Popflex 的首席执行官兼创始人 Cassey Ho,他也是热门服装单品的创造者, “旋转卡” 她说这些作品都是假的。何说她发现了这些“深度伪造”极其违反”她的品牌模特和顾客的照片也 被盗并发布在亚马逊商品清单上 销售假冒商品,她说。 市场走势 芯片制造商英伟达在华尔街度过了精彩的一周。在周三的财报电话会议上,这家人工智能巨头报告称,其 […]

在心智理论测试中,人工智能击败了人类

心智理论——理解他人心理状态的能力——是人类社交世界得以运转的动力。 它可以帮助您决定在紧张的情况下说什么,猜测其他汽车上的司机将要做什么,并与电影中的角色产生共鸣。 根据一项新的研究, 大语言模型 (法学硕士)那种力量 聊天GPT 诸如此类的人出人意料地擅长模仿这种典型的人类特征。 研究合著者表示:“在进行这项研究之前,我们都确信大型语言模型无法通过这些测试,尤其是评估心理状态的微妙能力的测试。” 克里斯蒂娜·贝奇奥,认知神经科学教授 汉堡-埃彭多夫大学医学中心 在德国。 她称之为“出乎意料且令人惊讶”的结果 今天发布——有点讽刺的是,在日记中 自然 人类行为。 然而,结果并没有让所有人相信我们已经进入了一个像我们一样思考的机器的新时代。 两位审查了调查结果的专家建议“持保留态度”,并警告不要就可能引起“公众炒作和恐慌”的话题得出结论。 另一位外部专家警告说,软件程序拟人化存在危险。 研究人员小心翼翼地没有说他们的结果表明法学硕士实际上拥有心理理论。 本研究的作者很清楚这场争论。 “我们在论文中的目标是利用广泛的心理测试,以更系统的方式应对评估机器心理理论的挑战,”研究合著者说 詹姆斯·斯特拉坎,一位认知心理学家,目前是汉堡-埃彭多夫大学医学中心的访问科学家。 他指出,进行严格的研究意味着还需要测试人类执行与法学硕士相同的任务:该研究将 1,907 名人类的能力与几个流行的法学硕士(包括 OpenAI 的法学硕士)的能力进行了比较。 GPT-4 模型和开源 拨打 2-70b 模型来自 元。 如何测试法学硕士的心理理论 法学硕士和人类都完成了五种典型的心理理论任务,其中前三种是理解暗示、反讽和失礼。 他们还回答了“错误信念”问题,这些问题通常用于确定幼儿是否已发展出心智理论,例如:如果爱丽丝在鲍勃离开房间时移动了某个东西,那么鲍勃回来时会在哪里寻找它? 最后,他们回答了关于“奇怪的故事”的相当复杂的问题,这些故事的特点是人们互相撒谎、操纵和误解。 总体而言,GPT-4 名列前茅。 它的分数与人类在错误信念测试中的分数相匹配,并且高于人类在讽刺、暗示和奇怪故事方面的总分; 它只是在失礼测试中表现比人类差。 有趣的是,Llama-2 的得分与 GPT-4 相反——它在错误信念上与人类相匹配,但在讽刺、暗示和奇怪故事上的表现比人类差,而在失礼方面的表现则比人类更好。 “我们目前没有方法,甚至不知道如何测试 存在 心智理论。” —James Strachan,汉堡-埃彭多夫大学医学中心 研究人员小心翼翼地没有说他们的结果表明法学硕士实际上拥有心理理论,而是说他们“在心理理论任务中表现出的行为与人类行为没有区别”。 这就引出了一个问题:如果仿制品和真品一样好,你怎么知道它不是真品? 斯特拉坎说,这是社会科学家以前从未试图回答的问题,因为对人类的测试假设这种质量或多或少存在。 “我们目前没有方法,甚至不知道如何测试 存在 […]

2024 年完整指南

好处 缺点 开放模型可以根据您的业务进行定制。 Meta 对 Llama 3 进行公共信息训练,因此,与其他生成人工智能一样,这可能会产生有害内容或违反版权法。 生成文本或图像,尤其是使用 Imagine 功能来快速迭代图像。 在我们的测试中,与 ChatGPT 使用 GPT-3.5 编写的电子邮件相比,Llama 3 生成的专业电子邮件往往有点模糊和蓬松。 与您现有的云提供商一起使用。 与其他生成式 AI 一样,如果您打算自定义模型,训练 Llama 3 可能会耗费大量时间和资源。 当谈到商业生成人工智能时,OpenAI 可能是更知名的名字,但 Meta 已经通过开源强大的大型语言模型成功地占据了一席之地。 Meta 于 4 月 18 日发布了迄今为止最大的生成式 AI 模型 Llama 3,该模型在一些标准 AI 基准测试中的表现优于 GPT-4。 骆驼 3 是什么? Llama 3 是 Meta 创建的法学硕士。 它可用于创建生成式人工智能,包括可以用自然语言响应各种查询的聊天机器人。 Llama 3 的评估用例包括集思广益、创意写作、编码、总结文档以及以特定人物或角色的声音回答问题。 完整的 […]

谷歌的 Med-Gemini 在诊断方面优于 OpenAI GPT-4,但我们可以相信它吗?

据谷歌称,他们的尖端医疗人工智能 Med-Gemini 在事实准确性、可靠性以及处理复杂的临床推理方面优于 OpenAI 的 GPT-4。 谷歌研究院与 Google DeepMind 合作,发表了一篇新论文(发表于 Arxiv)详细介绍了他们即将推出的专为医疗保健领域设计的人工智能工具 Med-Gemini。 据谷歌研究人员称,尽管目前正在进行研究,Med-Gemini 利用了尖端技术,甚至超过了既定的行业基准。 Med-Gemini 拥有大型多模式模型 (LMM),所有模型均针对不同的目的和应用而设计。 默认情况下,谷歌的 Gemini 模型配备了先进的技术。 他们可以处理来自文本、图像、视频和音频的信息。 Med-Gemini 的效率要高得多,因为它针对所有这些专业进行了微调。 Med-Gemini 系列推出了专门针对 2D 和 3D 放射学、组织病理学、眼科、皮肤病学和基因组学等医疗任务进行优化的模型。 推特/BluechipAI | 基于 zkSync @Bluechip_AI 构建 访问、处理信息和自我训练能力的能力: Med-Gemini 利用其网络搜索功能来增强其先进的临床推理能力。 Med-Gemini 展示了其实力,在测试的 14 个医疗基准中,有 10 个在测试中实现了最先进 (SOTA) 的性能,在所有可比指标上都超越了 GPT 模型系列。 Med-Gemini 是针对医疗任务进行微调的 Gemini 模型系列。 推特/亚历克斯·班克斯@thealexbanks Med-Gemini 在此基准上设定了 […]

《AI Town》:一款有自己想法的模拟游戏

“AI Town”是一个由 OpenAI 的 GPT-4 和 Meta 的 Llama 3 等大型语言模型 (LLM) 提供支持的虚拟世界。在这里,AI 驱动的角色可以生活、互相聊天,甚至形成社会纽带。 “AI Town”是风险投资公司 Andreessen Horowitz (a16z) 在 Convex 平台上打造的开源项目,可让开发人员创建自己的由 AI 驱动的角色组成的模拟世界。 这种“永远在线的模拟人生”环境是各种语言模型的试验场,使它们能够自由交互并发展其能力。 与《模拟人生》中的角色遵循预先编写的指令不同,人工智能小镇的居民拥有一定程度的自由意志。 “人工智能小镇”的居民进行对话,探索他们的世界,并建立塑造他们个性的关系。 2023 年 8 月,a16z 团队在 X 上宣布,这个雄心勃勃的项目的目标是“通过 AI 代理民主化构建自己的模拟环境”。 该项目的目标是通过人工智能代理民主化构建您自己的模拟环境。 团队 (@stuffyokodraws, @martin_casado 和 @ianmacartney)希望看到社区在此基础上构建更复杂的交互。 让他们知道您的想法! — a16z (@a16z) 2023 年 8 月 15 日 感谢本地版本 凸台,在 MacBook […]

人工智能速查表:人工智能初学者指南

简单来说什么是人工智能? 人工智能是一种计算机系统,可以对数据进行预测并以新的方式重新排列数据。 人工智能一词可以广泛应用于从电子邮件中自动建议的文本到逼真的实时生成视频等一切事物。 从广义上讲,商业软件中可能遇到的人工智能类型包括生成式人工智能、自然语言处理和机器学习。 人工智能有多种形式,从通过聊天响应客户的简单工具到预测整个组织轨迹的复杂机器学习算法。 尽管多年来人们对人工智能的承诺过高,但人工智能并不意味着像人类一样有感知能力的机器。 相反,人工智能涵盖了更集中的大规模模式匹配,以补充人类推理。 为了帮助企业领导者了解什么是人工智能功能、如何使用人工智能以及从哪里开始人工智能之旅,必须首先消除围绕人工智能技术巨大飞跃的神话。 什么是人工智能? 人工智能在很大程度上是一种模式识别和预测计算机系统,其运行规模远远超出人类,但从未完全取代人类。 即使在最好的情况下,人工智能也能提供可接受的(尽管并不完美)结果,让人们介入,观察数据并从中推理。 请注意,虽然我们在整个备忘单中都使用人工智能,但大多数企业都使用人工智能的一个子集,称为机器学习或深度学习。 这个词在商业中的当代用法可能意味着生成式人工智能,即经过训练的模型重新混合现有内容,以新的方式形成图像或句子。 我们将在这里使用 AI 作为包括机器学习和深度学习的简写,并在适当的时候指定生成式 AI。 事实是,当前的人工智能技术是有限的,但它仍然非常强大。 无论其过程在实践中看起来多么复杂,人工智能驱动的应用程序的核心是识别模式并根据这些模式进行推理的简单能力。 人工智能并不是真正的智能,它通常与我们选择输入机器学习模型的数据一样存在偏见。 这并不意味着人工智能对于试图解决现实世界问题的企业和消费者没有用处——这意味着我们离能够在不首先获得正确数据的情况下真正做出独立决策或得出结论的机器还相去甚远。 人工智能确实倾向于确认我们的偏见,而不是消除它们。 人工智能是如何工作的? 人工智能是一个复杂的系统,旨在模拟人类行为和智力。 它将大量数据与算法(有时以神经元为模型)相结合,以分析、理解并做出有关未来状态的决策或预测。 为了做出准确的预测,人工智能系统需要大量数据进行学习; 这些数据是从各种来源收集的,并以适合人工智能算法的格式进行处理、分析和组织。 人工智能算法是人工智能系统的核心,旨在分析和解释数据、识别模式并根据输入做出预测或决策。 通过不断收集新数据并重新训练模型,人工智能系统可以适应不断变化的条件并提高其性能。 人工智能工作的核心流程涉及以下子领域: 机器学习: 人工智能的一个分支,专注于算法和统计模型的开发,使计算机系统无需明确编程即可从数据中学习和改进。 深度学习: 机器学习的一个子领域,模仿人脑神经网络的工作原理,使用多层人工神经网络来学习和理解数据中的复杂模式和特征。 神经网络: 一种受人脑结构和功能启发的计算模型,可以处理和分析大量数据以识别模式、做出预测或对信息进行分类。 自然语言处理: 人工智能的一个分支,专注于计算机和人类语言之间的交互,使机器能够理解、解释和生成人类语言。 计算机视觉: 人工智能的一个分支,使机器能够解释和理解图像或视频中的视觉信息。 认知计算: 该模型旨在创建能够模拟类人智能并以更自然、直观的方式与人类交互的人工智能系统。 生成式人工智能: 生成式人工智能结合了该列表中的其他子领域,包括机器学习、深度学习、自然语言处理和认知计算机,可创建对话或视频等重新混合的内容。 生成式人工智能 生成式人工智能系统能够创建图像、视频、音乐或文本等内容,这些内容与人类生成的内容几乎没有区别。 他们可以根据学到的模式和风格自主生成新的输出。 生成对抗网络是生成人工智能的一个例子,其中一个网络生成内容,另一个网络评估并提供反馈以提高生成输出的质量。 生成式人工智能的流行示例包括: OpenAI 的 ChatGPT: 生成式预训练 Transformer 是 […]

OpenAI 为即将推出的高级 GPT-5 模型做准备

OpenAI 是 Sam Altman 领导的人工智能 (AI) 公司 据报道正在准备 在未来几个月内发布下一代多模式大语言模型 GPT-5。 据 Business Insider 援引两名知情人士的报道称,OpenAI 可能会在今年夏天的某个时候推出 GPT-5。 据报道,该公司已向企业客户提供演示,一位最近看到 GPT-5 版本的首席执行官将其描述为“非常好,就像物质上更好一样”。 2023 年 3 月,该公司推出了 GPT-4。 同年晚些时候推出了一个改进的迭代版本,称为 GPT-4 Turbo。 OpenAI 在一份报告中写道:“GPT-4 Turbo 能力更强,并且了解截至 2023 年 4 月的世界事件” 博客文章 当它被引入的时候。 “它有一个 128k 上下文窗口,因此可以在单个提示中容纳相当于 300 多页文本的内容。” 除了开发 GPT-5 之外,OpenAI 还致力于通过 与Figure AI合作。 此次合作旨在通过赋予其人形机器人处理和“推理”自然语言的能力来加快Figure的开发进度。 大型科技公司之间开发人形机器人的竞赛愈演愈烈。 英伟达最近宣布 GR00T项目,一个用于人形机器人的通用基础模型,以及一台名为 Jetson Thor 的新计算机及其 […]

ChatGPT 等生成式 AI 工具可以加快放射学工作流程

据一位专家称,ChatGPT 等人工智能工具可以极大地帮助加快放射学工作流程。 新研究发表在《美国伦琴学杂志》上。 该研究题为“使用 GPT-4 和单次学习来识别放射学报告中的偶然发现” 让加拿大研究人员措手不及,因为它展示了 ChatGPT 如何执行识别 CT 扫描等任务。根据这项研究,可以训练生成式 AI 通过重复暴露相似图像来区分 CT 扫描。 为了了解 ChatGPT 是否可以加快放射学工作流程,加拿大科学家通过一种称为“单次学习”的过程训练 ChatGPT-4 来读取 CT 扫描报告。 该方法通过重复比较两个图像来训练生成人工智能平台。 GPT-4 被重复给予两张 CT 扫描图像,直到它学会识别图像中的微小差异。 这些差异可能因具体情况而异,并且与患者和放射科医生相关。 研究人员认为,这可以减轻包括放射科医生在内的医疗保健专业人员的负担,并加快重大疾病的诊断速度。 多伦多综合医院实验团队的一名研究人员 Rajesh Bhayana 博士说:“自动识别放射学报告中的偶然发现可以通过向临床医生突出显示发现、自动化管理或促进人口健康举措来改善患者护理。 ” 与此同时,来自卡迪夫大学的英国研究人员展示了有效利用 生成式人工智能增强乳腺癌检测和诊断。 科学家们随机选择并分析了 1000 份放射学报告来测试和训练 ChatGPT-4。 所有报告都是从多伦多综合医院记录中获取的腹部 CT 扫描。 由具有四年经验的医生和具有多年培训后经验的经验丰富的放射科医生设置的标准参考进一步检查了人工智能的准确性。 他们两人都为要分析的 GPT-4 设定了某些基准,包括由小于一厘米的肾上腺结节测量、胰腺病变或血管钙化引起的潜在新恶性肿瘤。 肾上腺结节是一种肿块或组织生长,在正常情况下不会引起健康恐慌。 然而,在它们身上可以发现异常的激素产生和恶性肿瘤。 因此,它是疾病诊断的有效市场。 血管钙化是血管中的矿物质沉积物,可能是血管堵塞、动脉粥样硬化和其他心脏问题的征兆。 这些标记对于放射科医生了解 CT 扫描的变化至关重要,以便做出正确的诊断。 一旦建立了这一点,一位拥有十多年临床经验的更有经验的放射科医生就会检查图像的 […]

OpenAI 的 GPT 商店现已向聊天机器人构建者开放

OpenAI 一直在戏弄其店面提供定制版本的 聊天GPT 两个月后,GPT 商店的大门现已敞开。 ChatGPT 订阅者可以访问该商店,它提供了一个 GPT 库,这些 GPT 是经过专门调整的生成式 AI 聊天机器人,用于图像生成、写作、教育、编程等。 聊天机器人构建者将能够推广他们的创作,而专业人士和消费者可能会发现聊天机器人比 ChatGPT 更专业、更实用,更能满足他们的需求。 如何访问 GPT 商店? 这 GPT商店 (图一) 订阅 ChatGPT Plus、ChatGPT Enterprise 和 ChatGPT Team(适用于较小用例的 ChatGPT Enterprise 的变体)的用户可以在 chat.openai.com/gpts 上使用。 图A GPT 商店的屏幕截图。 图片来源:OpenAI 一些组织已经与 OpenAI 合作,通过 GPT Store 提供服务。 例如, Canva 的 GPT 让专业人士使用自然语言提示设计社交媒体帖子或演示文稿。 OpenAI 计划建立一个收入系统,美国的聊天机器人开发者可以通过 GPT 获得报酬。 预计将于 2024 […]