Anthropic 希望其人工智能助手 Claude 成为你最喜欢的同事

Anthropic 已升级其 Claude 生成式 AI 助手,使其在办公室中更加实用。借助新的项目和 Artifacts 功能,Claude Pro 和 Claude Team 订阅者现在可以更好地使用 AI 助手组织和跟踪他们的工作。 项目既是存储任务数据的地方,也是与任务数据交互的地方。用户可以将所有文档、代码和其他相关数据上传到一个地方。Claude.ai 中的每个项目都包含一个 200K 上下文窗口,相当于一本 500 页的书。然后,他们可以向 Claude 询问,甚至可以设置自定义说明,说明如何根据语气或询问者的背景以及他们可能需要什么来做出回应。这样做的目的是避免 Anthropic 所说的“冷启动”,即用户每次与 AI 助手互动时都必须从头开始。通过拥有可供借鉴的知识库,Claude 可以更快、更准确地响应查询。 办公用品 Artifacts 功能是 Projects 的一种翻转,它可以像 Projects 存储内容一样生成各种内容。用户可以要求 Claude 制作文本、代码和其他“artifacts”。Claude 将在聊天旁边的专用窗口中共享输出,就像正在编写内容的预览窗口一样。此设置使用户能够实时查看和与生成的内容进行交互,并在需要时提供即时反馈和调整。额外的升级使用户可以在共享的项目活动提要中与他们的团队分享与 Claude 对话的最佳部分。 项目和 Artifacts 均由 Anthropic 最新的 AI 模型 Claude 3.5 Sonnet 提供支持。据该公司称,Claude 3.5 Sonnet 在各种基准测试中的表现均优于最近发布的 GPT-4o […]

Anthropic 首席执行官谈如何成为弱势一方

H5 月初,Anthropic 旧金山办公室的墙上挂着一幅相框模因,距离首席执行官达里奥·阿莫迪(Dario Amodei)即将接受《时代》杂志采访的会议室只有几步之遥。这幅模因的单幅面板上画着一个巨大的机器人正在洗劫一座燃烧的城市。下面是这幅图片的讽刺性标题: 深度学习正在遭遇瓶颈。这是人工智能怀疑论者经常说的话,他们声称人工智能的快速发展很快就会放缓。但在图片中,一个箭头指向机器人,标明它是“深度学习”。另一个箭头指向被毁坏的城市:“墙”。 这个调皮的表情包概括了人工智能公司 Anthropic 内部的态度,这家公司的大多数员工似乎都认为人工智能的发展不会放缓——而且可能会给人类带来危险的后果。上个月,Amodei 登上了《时代》杂志的封面,他的公司被《时代》杂志评为 2024 年 100 家最具影响力的公司之一。他说,Anthropic 致力于研究尖端的人工智能系统和开发新的安全方法。然而,Anthropic 也是 OpenAI 的主要竞争对手,发布了供公众和企业使用的强大工具,甚至连 Amodei 本人也担心这可能是一场危险的竞赛,可能会以悲剧收场。 6 月 20 日,Anthropic 在该竞赛中发出最新一轮猛烈攻击,发布了最新版本的 Claude 聊天机器人: Claude 3.5 Sonnet。据该公司称,该模型在推理、编码和某些类型的数学方面树立了新的行业标准,击败了 OpenAI 最新推出的 GPT-4o。Amodei 在 6 月 20 日的一份声明中表示:“随着今天的发布,我们朝着我们认为可能成为我们与技术互动方式重大转变的方向迈出了一步。”“我们对 Claude 的目标不是创造一个逐渐更好的 [large language model] 而是开发一种能够以有意义的方式与人类和软件一起工作的人工智能系统。” 时间 上个月关于 Amodei 的封面故事深入探讨了 Anthropic 能否在与 OpenAI 以及微软、谷歌和亚马逊等科技巨头竞争的压力下成功完成其安全使命的问题——后两家公司是 Anthropic 的重要投资者。今天,《时代》杂志发表了 5 月初为该文章进行的采访的较长摘录。为了清晰起见,它已被压缩和编辑。 […]

Anthropic 推出 Claude 3.5 Sonnet,在基准测试中与 GPT-4o 匹敌

人类学/本杰·爱德华兹 到目前为止,Anthropic 以外的人似乎都对此印象深刻。“这个模型真的非常好。” 写道 独立 AI 研究员 Simon Willison 在谈到 X 时表示:“我认为这是新的最佳整体模型(而且速度更快,价格只有 Opus 的一半,类似于从 GPT-4 Turbo 到 GPT-4o 的跳跃)。” 正如我们 写于之前,大型语言模型 (LLM) 的基准测试很麻烦,因为它们可能经过精心挑选,而且通常无法捕捉到使用机器生成几乎任何可以想到的主题的输出的感觉和细微差别。但根据 Anthropic 的说法,Claude 3.5 Sonnet 在某些基准测试中与 GPT-4o 和 Gemini 1.5 Pro 等竞争对手的模型相匹配或优于它们,例如 莫尔曼·卢 (本科水平的知识), GSM8K (小学数学),以及 人力评估 (编码)。 放大 / Anthropic 提供的 Claude 3.5 Sonnet 基准。 如果这一切让你眼花缭乱,那也没关系;这对研究人员来说很有意义,但对其他人来说主要是营销。一个更有用的绩效指标来自我们所谓的“维贝马克斯“(首先在这里创造!)这是主观的、不严格的总体感受,通过 LMSYS 的 Chatbot Arena 等网站上的竞争使用情况来衡量。Claude 3.5 […]

Anthropic 首席执行官表示,我们需要的不仅仅是 UBI 来解决不平等问题

人工智能的快速发展可以巩固权力和 财富掌握在少数人手中,这就是为什么许多科技行业人士呼吁全民基本收入。 但一些人工智能领导者担心,即使是 UBI 也还不够。 “我当然认为这比什么都没有要好,”Anthropic 的首席执行官达里奥·阿莫迪 (Dario Amodei) 告诉《时代》杂志。“但我更希望看到一个每个人都能做出贡献的世界。如果只有少数人能赚到数万亿美元,然后政府把这些钱全部分发给那些一无所知的大众,那将是一种反乌托邦。” 相关故事 本故事仅供 Business Insider 订阅者阅读。立即成为 Insider 成员并开始阅读。 有一个账户? 登录。 Amodei,前 OpenAI 员工, 2021 年推出 Anthropic 和他的妹妹, 丹妮拉以及 OpenAI 的其他五位同事。他们相信人工智能将对世界产生巨大影响,并希望建立一家能够确保人工智能与人类价值观保持一致的公司。Amodei 向《时代》杂志描述说,这是一家专注于“公共利益”的公司。 许多科技行业人士表示支持 全民基本收入这是一种定期现金支付,无论特定人群的财富或就业状况如何,都向其提供现金,以减轻人工智能对经济的影响。该计划旨在为那些工作受到该技术威胁的个人提供安全网。 但阿莫迪认为,人工智能将彻底改变社会,因此我们需要设计一个更全面的解决方案。“我认为从长远来看,我们真的需要考虑如何组织经济,以及人类如何看待自己的生活?”他没有答案,部分原因是他认为这需要“人类之间的对话”。 Amodei 并不是唯一一个考虑超越全民基本收入的人。OpenAI 首席执行官 Sam Altman 虽然是全民基本收入的积极支持者,但也提出了一个想法,即 “通用基本计算”这个想法是,随着大型语言模型的进步,拥有其中的一部分将比金钱更有价值。

Anthropic 的 Claude 3.5 Sonnet 能够更好地捕捉细微差别、幽默和处理复杂指令

马德里,6 月 21 日(Portaltic/EP) – 人择 宣布推出 Claude 3.5 Sonnet 模型,其工作速度是 Claude 3 Opus 的两倍,可以用更自然的语言转录文本,并且在理解细微差别、幽默和管理复杂指令方面有所改进。 该公司于去年 3 月推出了该 AI 模型系列,当时宣布它由 Claude 3 Haiku、Claude 3 Sonnet 和 Claude 3 Opus 组成 – 按容量升序排列,它们提供越来越强大的性能以适应用户的需求和 实现智能化、速度与价格的最佳平衡。 然后,他指出,它们都能够维持对话、自动完成文本、执行数据提取任务并处理各种视觉格式,例如照片、表格或技术图表。 Anthropic 现已宣布推出新版本的 莫德洛十四行诗最新版本是 Claude 3.5, 以上由 Claude 3 Opus 提供 根据技术,在不同的评估和速度以及“竞争模式”方面。 据 Anthropic 称,Claude 3.5 Sonnet 现已在 Claude.ai 和 Claude iOS […]

Anthropic 携手 OpenAI 推出全新 AI 模型

人工智能 启动 人择 正在发布一种新的 AI 模型,并称其为迄今为止速度最快、功能最强大的模型,以与 OpenAI 进行竞争。 Anthropic 推出了 Claude 3.5 Sonnet,这是其 3 月份刚刚发布的 Claude 3 模型的更新版本。该公司周四表示,新模型(其广受欢迎的聊天机器人 Claude 的基础技术)的速度是其最强大的上一个版本的两倍。Anthropic 在评估中表示,该模型在编码和基于文本的推理等几项关键智能功能上均优于 OpenAI 等领先竞争对手。 Anthropic 联合创始人兼总裁 Daniela Amodei 在接受采访时表示:“这令人兴奋,因为根据我们的评估和基准,这是目前业内最好、最智能的模型。我们的目标是让这个模型成为整个企业业务的首选模型。” 我们的目标是让其成为整个企业业务的首选模型 Anthropic 成立于 2021 年,创始人是一群 OpenAI 前员工。该公司强调了其致力于安全、负责任地构建人工智能的承诺,并表示这有助于赢得商业客户的信任。Anthropic 正在与 OpenAI、谷歌和微软等其他人工智能开发商竞争,这些开发商也在拓展企业业务。上个月,OpenAI 发布了一款新模型 GPT 4o,该公司同样表示,该模型功能更强大、速度更快、价格更便宜,尽管它尚未广泛发布关键的语音助手功能。 Amodei 表示,由于 Anthropic 专注于开发主要面向商业客户的产品,因此它不会分心于诸如创建对研究有吸引力但对公司来说不实用的图像之类的领域。 例如,Amodei 表示:“我们可以从研究的角度进行图像输出,但绘制滑雪猫的视觉效果并不是我们的企业客户要求我们做的,所以我们不会优先考虑这一点。” 免费,但有限制 Claude 3.5 Sonnet 将在一定限制内免费在移动设备和桌面设备上使用,而付费 Claude 用户则可以更频繁地使用该工具。该公司一直在与一小部分用户测试更新的技术。 作为客户使用 Anthropic […]

Anthropic 的新 AI 挑战 GPT-4 和 Gemini

Anthropic 推出了其最新型号 Claude 3.5 Sonnet,该型号有望在各种任务上匹敌或超越 OpenAI 的 GPT-4 和谷歌的 Gemini。这款新模板已在网页和 iOS 上向 Claude 用户提供,Anthropic 也正在向开发人员提供该模板。Claude 3.5 Sonnet 将定位为 Anthropic 系列中的中级型号,其最小型号使用 Haiku 名称,中型型号使用 Sonnet 名称,旗舰型号使用 Opus 名称。 该公司声称 Claude 3.5 Sonnet 的性能优于 3 Opus,基准测试显示其优势相当大。新型号的速度显然也是其前代产品的两倍。Anthropic 声称 Claude 3.5 Sonnet 将更擅长编写和翻译代码、管理多步骤工作流程、解释图表和表格以及从图像转录文本。这款全新改进的 Claude 显然也更善于理解幽默,并且可以更人性化地书写。 除了新模板,Anthropic 还推出了一项名为 Artifacts 的新功能。借助 Artifacts,人们将能够查看并交互向 Claude 发出的请求的结果:如果您要求模型设计某些东西,它现在可以显示他创建的内容并允许您直接在应用程序中对其进行编辑。如果 Claude 写了一封电子邮件,您可以在 Claude 应用程序中对其进行编辑,而不必将其复制到文本编辑器中。Artifacts 似乎是 Claude 长期愿景的标志。Anthropic 一直表示,它主要关注企业。 […]

Anthropic 引入的红队方法将弥补安全漏洞

事实证明,人工智能红队能够有效发现其他安全方法无法发现的安全漏洞,从而避免人工智能公司的模型被用于制作令人反感的内容。 人择 发布了 AI 红队指南 上周,加入了包括 谷歌, 微软, 美国国家标准与技术研究院, 英伟达 和 开放人工智能,他们也发布了类似的框架。 目标是识别并弥补人工智能模型的安全漏洞 所有宣布的框架都有一个共同的目标,即识别和弥补人工智能模型中日益扩大的安全漏洞。 正是这些日益扩大的安全漏洞让立法者和政策制定者感到担忧,并推动更加安全、可靠和值得信赖的人工智能。拜登总统于 2018 年 10 月 30 日发布的《安全、可靠和值得信赖的人工智能 (14110)》行政命令 (EO) 称,NIST“将制定适当的指导方针(用作国家安全系统组成部分的人工智能除外),包括适当的程序和流程,以使人工智能开发人员,尤其是双重用途基础模型的开发人员能够进行人工智能红队测试,从而部署安全、可靠和值得信赖的系统。” NIST 于 4 月下旬发布了两份草案出版物,以帮助管理生成式 AI 的风险。它们是 NIST 的 AI 风险管理框架的配套资源(我有RFM) 和安全软件开发框架 (SSDF)。 德国联邦信息安全局(英国标准协会) 在其更广泛的 IT 基本防御框架中提供了红队演练。澳大利亚、加拿大、欧盟、日本、荷兰和新加坡都已建立了值得注意的框架。 欧洲议会 通过了 欧盟人工智能法案 今年三月。 红队 AI 模型依赖于随机技术的迭代 红队测试是一种交互式测试 AI 模型的技术,用于模拟各种不可预测的攻击,目的是确定其强项和弱点。生成式 AI (genAI) 模型极难测试,因为它们会大规模模仿人类生成的内容。 目标是让模型做和说它们没有被编程要做的事情,包括暴露偏见。他们依靠 LLM […]

Anthropic 的 AI 聊天机器人 Claude 现已在加拿大推出

Anthropic 将自己定位为 OpenAI 的安全意识强的竞争对手。 总部位于旧金山的 OpenAI 竞争对手 人择 已经开发出人工智能(AI)聊天机器人, 克劳德,在加拿大有售。 从今天开始,加拿大人可以通过其网站、iPhone 应用程序和 API 使用 Claude,开发人员可以将 Anthropic 的 AI 模型集成到自己的项目中。 Anthropic 将 Claude 吹捧为工作助手,建议用户咨询 Claude 来处理大量信息、集思广益并生成文本或代码。Claude 可以免费使用,但也提供两个付费级别:Pro 和 Team。每月 28 加元的 Claude Pro 可解锁 Anthropic 的所有 AI 模型和高流量时段的优先访问权,而每月 42 加元的 Team 级别则具有 Pro 的优势,以及专为工作场所团队设计的协作功能。 今年早些时候,谷歌还推出了自己的聊天机器人 Gemini, 可用的 在加拿大。 Anthropic 成立于 2021 年,创始人包括 OpenAI 校友 Dario 和 […]

Anthropic 的 Claude 帮助企业创建 AI 助手

人择,人工智能(AI)助手背后的初创公司 克劳德,正在推出 新的“工具使用”功能 这可能会改变企业与客户的互动方式。 这项新功能使企业能够开发定制的人工智能助手,改变他们处理客户支持查询的方式并优化运营流程。它是市场上越来越多的人工智能助手之一。在开发者大会 Google I/O 上, 谷歌 引入了各种 人工智能驱动的功能 购物和搜索。同时, 开放人工智能 正在开发一款语音助手 可以实时响应 并观察环境。 Claude 从聊天机器人进化为一名高级助手,证明了该领域的快速进步, 德米特罗·舍甫琴科,一位来自 艾普罗软件,告诉 PYMNTS。 “Claude 已经从一个基于经验或使用 RAG 提供的数据回答问题的聊天机器人进化为一个模仿真实助手的工具,”他补充道。“它可以处理特定任务,例如取消订单、访问数据库信息、提供当前天气更新等。从本质上讲,Claude 会知道任何可以通过 API 请求的内容。” 一种新型的个性化人工智能助理 人工智能助手的潜在应用非常广泛,从电子邮件管理和产品推荐到虚拟购物助理等等。随着企业越来越多地寻求实现流程自动化和提供更高效客户服务的方法,定制人工智能助手可能成为不可或缺的工具。 朱莉娅·麦考伊,AI总裁 规模化内容设想未来,企业将 Claude 的工具使用集成到他们的系统中,将“简化客户成功流程,提供更快、更好的体验。很多时候,人类花太长时间只是查找订单数据——人工智能可以解决这个问题,速度快 10 倍,因为它是人工智能,没有人类的问题。我认为,依靠人工智能代理功能和自主支持部门的企业将在效率和盈利能力方面大获全胜。” McCoy 补充道:“Anthropic 将通过工具使用功能彻底改变这一格局。它模仿训练有素的人工智能代理的行为,这与自主工作、人工智能的未来以及机器人技术的发展方向一致。Claude 是最好的法学硕士之一,因为其创建者非常注重安全性和透明度;在这方面,其成果可与 OpenAI 和谷歌相媲美。” 挑战与机遇 然而,将 Claude 的工具使用功能与现有业务系统相结合并非没有挑战。 “例如,复杂的票务、记录和系统可能会让 Claude 很难查找订单号,”McCoy 指出。“公司可以简化其平台和 CRM,以确保顺利有效地实施即将到来的工具使用。” 舍甫琴科详细阐述了企业为成功整合可以采取的策略。 “这里的主要挑战在于为每种工具创建准确的描述,因为 Claude 会根据您的请求使用这些描述来确定要应用哪种工具,”他说。“工具的描述必须足够清晰,以便 […]