OpenAI 宣布 GPT-4o

OpenAI 有 宣布 流行的聊天机器人 ChatGPT 的最新版本:GPT-4o。 “o”源自“Omni”一词,象征着 OpenAI 创造计算机与人类之间更自然的交互的使命。

这次迭代在功能和可用性方面超越了以前的版本,特别是对于最终消费者而言。 突破了之前版本处理文本、音频和视频文件的限制。 现在用户可以更自然地交互 即时的

OpenAI 演示日和 GPT-4o 发布

OpenAI获得微软投资支持,估值达800亿美元。 该公司成立于 2015 年,致力于保持市场领先地位 生成式人工智能 并创建一个盈利的商业模式,加上 训练 人工智能及其开发基础设施的建设花费了大量资金。

传统上, 大语言模型 (法学硕士)专注于文本数据处理。 该模型为全球人工智能的交互和使用提供了新的突破。 然而,这种有限的文本输入也限制了我们与 AI 模型交互的方式,有时感觉不太自然,过于生硬。

在演示日,OpenAI 提供了几种与 GPT-4o 交互的新方法。 最新的模型现在可以理解语调以及用户说话和提供信息的方式。

首席技术官 Mira Murati 在两位 OpenAI 研究主管 Mark Chen 和 Barret Zoph 的协助下演示了 GPT-4o 现在如何对笑声、歌声作出反应,甚至提供实时翻译。 即时的 通过语音模式。 语音模式正在准备在智能手机和桌面平台上公开发布。

演示日的一些 GPT-4o 功能

GPT-4o 模型处理和生成音频、视觉和文本模式的能力可用作各种问题的解决方案。 OpenAI 计划下周测试这种语音模式,并将其发布给付费 ChatGPT Plus 客户。

Mira 还表示,GPT-4o 模型只需 232 毫秒即可响应用户的音频提示,平均为 320 毫秒,类似于人类在典型对话中的响应速度。

OpenAI 演示日上语音模式的一个例子是,Chen 展示了 GPT-4o 讲睡前故事的能力,并指示改变讲故事的语调,使其在唱歌时更具戏剧性。

接下来,Chen演示了GPT-4o作为翻译器。 在语音模式下,经过 GPT-4o 增强的 ChatGPT 可以翻译说意大利语的 Mira,并与直接说英语的 Chen 建立对话桥梁。 即时的

GPT-4o提供了丰富的功能,当然也存在一定的风险。 OpenAI 也认识到了这种风险,即可能会滥用可以产生自然声音的语音模式。 为了降低这种风险,OpenAI 在流程中采取了保障措施 训练 AInya 并将发布 输出 定期播放音频。

已为 ChatGPT Plus 和 Team 客户发布了富含 GPT-4o 的 ChatGPT。 企业用户会接受 更新 接下来,免费用户将能够在有限的基础上享受这些新功能。 ChatGPT Plus 用户的消息容量是免费用户的五倍。

1715853623
#OpenAI #宣布 #GPT4o
2024-05-16 07:38:23

Leave a Reply

Your email address will not be published. Required fields are marked *

近期新闻​

编辑精选​