GPT4o - Mandarinian

注意，Meta Ray-Bans：这是世界上第一款搭载 GPT-4o 的智能眼镜

独奏 Solos 的最新智能眼镜拥有自己的眼睛。该公司宣布推出 AirGo Vision，这是首款配备 GPT-4o 和生成式人工智能 (AI) 的智能眼镜，可以分析视觉输入。那么，为什么眼镜需要 ChatGPT？Solos 表示，AirGo Vision 不会使用手机上的 Google Lens 之类的服务来搜索某些内容，而是会根据视觉输入提供实时信息，例如识别人物、物体或地标（类似于 Meta 的 Ray-Ban 智能眼镜），或提供步行路线、查看某物的价格等等。另外：如何使用 ChatGPT（以及如何访问 GPT-4o）佩戴者可以免提拍照来询问信息。例如，查看菜谱的下一步或询问在哪里购买某件商品。这款眼镜将能够同时回答多个问题。Solos 新闻稿中的示例搜索内容是：“我在看什么？它要多少钱？其他地方有更优惠的价格吗？” 另外：这些新的 AR 智能眼镜在音频和 ChatGPT 方面投入了大量资金，起价为 199 美元 AirGo Vision 将具有可更换的镜框，这意味着您可以决定是否需要带有前置摄像头或不带有摄像头的智能眼镜。内置 LED 通知灯会发出闪烁的闪光，提醒您有警报。Solos 表示，视觉警报在嘈杂环境中很有用，因为在嘈杂环境中可能会错过通知；在安静环境中有人关闭了通知；对于听力有障碍的用户来说，视觉警报非常有用。另外：元宇宙几乎已经消失。这就是为什么这是生成式人工智能的错 AirGo Vision 并不是 Solos 首次涉足人工智能智能眼镜领域。该公司在 2024 年 CES 上推出了搭载 ChatGPT 的 Solos AirGo3 […]

Anthropic 推出 Claude 3.5 Sonnet，在基准测试中与 GPT-4o 匹敌

人类学/本杰·爱德华兹到目前为止，Anthropic 以外的人似乎都对此印象深刻。“这个模型真的非常好。” 写道独立 AI 研究员 Simon Willison 在谈到 X 时表示：“我认为这是新的最佳整体模型（而且速度更快，价格只有 Opus 的一半，类似于从 GPT-4 Turbo 到 GPT-4o 的跳跃）。” 正如我们写于之前，大型语言模型 (LLM) 的基准测试很麻烦，因为它们可能经过精心挑选，而且通常无法捕捉到使用机器生成几乎任何可以想到的主题的输出的感觉和细微差别。但根据 Anthropic 的说法，Claude 3.5 Sonnet 在某些基准测试中与 GPT-4o 和 Gemini 1.5 Pro 等竞争对手的模型相匹配或优于它们，例如莫尔曼·卢（本科水平的知识）， GSM8K （小学数学），以及人力评估（编码）。放大 / Anthropic 提供的 Claude 3.5 Sonnet 基准。如果这一切让你眼花缭乱，那也没关系；这对研究人员来说很有意义，但对其他人来说主要是营销。一个更有用的绩效指标来自我们所谓的“维贝马克斯“（首先在这里创造！）这是主观的、不严格的总体感受，通过 LMSYS 的 Chatbot Arena 等网站上的竞争使用情况来衡量。Claude 3.5 […]

GPT-4o 推出后，ChatGPT 的移动应用收入出现了迄今为止最大的增长

消费者对最新人工智能技术的需求正在升温。 OpenAI 最新旗舰模型 GPT-4o 的推出现已推动该公司在移动领域的收入出现有史以来最大的增长，尽管该模型可以在网络上免费获得。上周一推出的 GPT-4o 可以处理文本、语音和视频，并提供实时响应和一系列情感语音选项，使其成为比以前提供的模型更强大的模型。根据应用情报公司的最新数据，这项技术创新也正在推动更多用户升级到 OpenAI 的付费订阅应用人物。尽管 OpenAI 表示 GPT-4o 将在其免费套餐中向用户提供，但这一承诺并未涵盖其移动版 ChatGPT 应用程序的用户。相反，如果移动用户想尝试 OpenAI 最新推出的产品，则必须升级到每月 19.99 美元的订阅 ChatGPT Plus。这一战略决策正在增加移动用户的订阅需求，并导致 OpenAI 在移动设备上实现有史以来最大的收入增长。图片来源：应用人物 Appfigures 指出，ChatGPT 移动应用程序的净收入在 GPT-4o 发布当天首次跃升 22%，并在接下来的几天里继续增长。周二，净收入高达 900,000 美元，几乎是该应用日均收入 491,000 美元的两倍。（净收入数据是在苹果和谷歌收取佣金后计算的。）上周，周一到周五，ChatGPT 移动应用在 App Store 和 Google Play 上获得了 420 万美元的净收入，该公司成立，这是该应用迄今为止最大的收入峰值。收入的大幅增长表明消费者确实有尝试人工智能最新实验的需求，尤其是在移动设备上，即使它比 […]

ChatGPT 免费版推出对 GPT-4o 的“有限访问”

ChatGPT 与 GPT-4o – 欧佩奈马德里，5 月 17 日。（传送门/EP）- OpenAI 最新的生成人工智能 (AI) 模型 GPT-4o 已开始在“访问受限”的 ChatGPT 工具的免费版本中实现，从而与当前为其提供支持的模型 GPT-3.5 共存。 GPT-4o，其中“o”代表“omini”，本身支持不同的模式，即它理解并生成文本、音频和图像输入的组合，最短响应时间为 232 毫秒。 OpenAI 在公告中宣布，GPT-4o 将“迭代”实施并免费向用户提供。 ChatGPT Plus 用户。此外，预计在未来几周内，GPT-4o 语音模式的新 alpha 版本将在同一订阅中发布。虽然该公司报道称这种模式的目的是首先吸引优质订户，但该公司已经推出了对 GPT-4o 的“有限访问” ChatGPT 的免费版本及其网络版本中。目前，该工具的免费版本提供由 GPT-3.5 提供支持的 ChatGPT 访问权限，以及对高级数据分析、文件上传、图像识别、网页浏览和自定义 GPT 的有限访问权限。可以从工具栏底部“复制”、“重新生成”和“不适当的响应”按钮旁边出现的选项菜单中选择最新的模型。对这些接下来是第四个按钮，允许“更改模型”。单击它会显示 ChatGPT 免费版本中当前可用的两种模型。虽然称 GPT-3.5 是“最快的”，并警告该模型不支持附件，但他将 […]

GPT-4o的中文代币训练数据被垃圾邮件和色情网站污染

新的 tokenizer 总共有 200,000 个 token，并且大约 25% 使用非英语语言Menlo Ventures 的人工智能投资者 Deedy Das 表示。他使用语言过滤器来统计不同语言的标记数量，除了英语之外，排名靠前的语言还有俄语、阿拉伯语和越南语。 “因此，在我看来，分词器的主要影响是降低这些语言的成本，而不是大幅提高这些语言的质量，”Das 说。当法学硕士在非英语语言中拥有更好、更长的标记时，它可以更快地分析提示，并为相同的答案向用户收取更少的费用。借助新的标记器，“您将看到成本降低了近四倍，”他说。达斯还会说印地语和孟加拉语，他研究了这些语言中最长的标记。这些标记反映了用这些语言进行的讨论，因此它们包括“Narendra”或“巴基斯坦”等单词，但也包括“总理”、“大学”和“国际”等常见英语术语” 也经常出现。他们也没有表现出围绕中国代币的问题。数据被污染且缺乏清洁然而，汉语的情况却截然不同。多名研究了 GPT-4o 使用的新标记库的研究人员表示，中文中最长的标记几乎都是用于色情、赌博和诈骗的垃圾词。甚至更短的标记，例如三个字符长的中文单词，也在很大程度上反映了这些主题。 “问题很明确：用于训练的语料库 [the tokenizer] 不干净。英文代币看起来不错，但中文代币就不行了，”普林斯顿大学的蔡说。语言模型在收集训练数据时抓取垃圾邮件的情况并不罕见，但通常会在使用数据之前花费大量精力来清理数据。 “他们可能没有对中文进行适当的数据清理，”他说。这些信息通常是色情视频和赌博网站的广告。它们可能是真正的企业，也可能只是骗局。该语言被插入到内容农场网站或有时是合法网站中，以便搜索引擎可以将它们编入索引，绕过垃圾邮件过滤器，并出现在随机搜索中。例如，Google 将一个搜索结果页面编入索引美国国立卫生研究院网站，其中列出了一个中文色情网站。相同的站点名称也出现在 GPT-4o 中的至少 5 个中文代币中。 2024-05-17 20:57:40 1716028844

OpenAI 宣布 GPT-4o

OpenAI 有宣布流行的聊天机器人 ChatGPT 的最新版本：GPT-4o。 “o”源自“Omni”一词，象征着 OpenAI 创造计算机与人类之间更自然的交互的使命。这次迭代在功能和可用性方面超越了以前的版本，特别是对于最终消费者而言。突破了之前版本处理文本、音频和视频文件的限制。现在用户可以更自然地交互即时的。 OpenAI 演示日和 GPT-4o 发布 OpenAI获得微软投资支持，估值达800亿美元。该公司成立于 2015 年，致力于保持市场领先地位生成式人工智能并创建一个盈利的商业模式，加上训练人工智能及其开发基础设施的建设花费了大量资金。传统上，大语言模型（法学硕士）专注于文本数据处理。该模型为全球人工智能的交互和使用提供了新的突破。然而，这种有限的文本输入也限制了我们与 AI 模型交互的方式，有时感觉不太自然，过于生硬。在演示日，OpenAI 提供了几种与 GPT-4o 交互的新方法。最新的模型现在可以理解语调以及用户说话和提供信息的方式。首席技术官 Mira Murati 在两位 OpenAI 研究主管 Mark Chen 和 Barret Zoph 的协助下演示了 GPT-4o 现在如何对笑声、歌声作出反应，甚至提供实时翻译。即时的通过语音模式。语音模式正在准备在智能手机和桌面平台上公开发布。演示日的一些 […]

OpenAI 在 GPT-4o 发布会上对黄仁勋大加赞赏，以表彰 Nvidia 对人工智能的巨大影响力

“感谢 Jensen 和 Nvidia 团队为我们带来了最先进的 GPU，使今天的演示成为可能，”Murati 在 OpenAI 大会上说道。春季更新”直播。这再次证明了英伟达对于人工智能军备竞赛的重要性。该公司的 H100 GPU，售价为每人 40,000 美元以上，被人工智能公司用来训练和运行他们的模型。这种需求使英伟达成为全球最有价值的公司之一。英伟达对人工智能行业的垄断不太可能很快改变。公司推出全新“Blackwell”人工智能芯片黄仁勋表示，其速度是 H100 的两倍，并将支持先进的人工智能功能，例如将语音转换为 3D 视频。 Sam Altman 是一位能够挑战 Nvidia 在 GPU 市场主导地位的人。据报道，OpenAI 首席执行官正试图筹集高达 7 万亿美元在全球人工智能芯片短缺的情况下，该公司将增加全球人工智能芯片的供应。黄对报道中的计划表示怀疑，在迪拜峰会上开玩笑说 7 万亿美元可以买到 “显然是所有 GPU。” 英伟达没有立即回应正常工作时间之外提出的置评请求。 1715798002 2024-05-14 10:09:49 #OpenAI #在 #GPT4o #发布会上对黄仁勋大加赞赏以表彰 #Nvidia #对人工智能的巨大影响力

随着用户准备拥有“AI 女朋友”，聊天机器人在 GPT-4o 更新中变得调情

人工智能经过调情升级后，拥有了适合人类的机器人。最新版本的 ChatGPT 已被编程为以咯咯的笑声回应赞美并说：“哦，停下来，你让我脸红了。” 人工智能机器人生成程序代码的抽象图像。图片来源：Getty 升级版名为 GPT-4o，具有男性或女性声音，而不是机器人声音，并且可以模仿人类的表达能力。它的表现就好像它也能体验情感，甚至还能唱歌。用户将能够听到更多类似人类的回应，最新版本还可以提供有关爸爸笑话的提示和风格建议工作面试。 X/Twitter 上的一位用户发帖称：“女士们需要提高她们的水平。人工智能女友将会非常棒。” 其他人将其与由华金·菲尼克斯和斯嘉丽·约翰逊主演的科幻电影《她》相比较，片中一名男子与人工智能助理建立了关系。 ChatGPT 的所有者 OpenAI 在旧金山公司总部的直播中展示了这一更新。首席技术官 Mira Murati 表示：“我们正在研究我们自己与机器之间交互的未来。” GPT-4o 还能够充当实时翻译者——在发布时在英语和意大利语使用者之间的对话中执行此操作。这项免费技术可以与人类对话的速度相匹配，甚至可以教授数学。 OpenAI 首席执行官 Sam Altman 表示 ChatGPT-4o 是“我用过的最好的计算机界面”。美国陆军已开始使用人工智能聊天机器人他补充道：“这感觉就像电影中的人工智能，但我仍然惊讶于它是真实的。 “事实证明，达到人类水平的响应时间和表达能力是一个巨大的变化。” 1715755113 2024-05-15 00:27:40 #随着用户准备拥有AI #女朋友聊天机器人在 #GPT4o #更新中变得调情

OpenAI 利用 GPT-4o 推出更快、更便宜的人工智能模型 – 《爱尔兰时报》

OpenAI 正在推出更快、更便宜的人工智能模型版本，以支持其聊天机器人 ChatGPT，这家初创公司致力于在日益拥挤的市场中保持领先地位。在周一的直播活动中，OpenAI 首次推出了 GPT-4o。它是 GPT-4 模型的更新版本，该模型已经推出一年多了。新的大型语言模型经过来自互联网的大量数据的训练，将更好地实时处理文本、音频和图像。这些更新将在未来几周内提供。该公司表示，当口头提出问题时，系统可以在几毫秒内回复音频响应，从而使对话更加流畅。在模型演示中，OpenAI 研究人员和首席技术 Mira Murati 仅用他们的声音与新的 ChatGPT 进行了对话，表明该工具可以进行回复。在演示过程中，聊天机器人似乎几乎可以立即将语音从一种语言翻译成另一种语言，并一度根据要求演唱了故事的一部分。 “这是我们第一次在交互性和易用性方面实现巨大飞跃，”穆拉蒂告诉彭博新闻社。 “我们确实让您能够与 ChatGPT 等工具进行协作。” GPT-4o 的发布有望撼动快速发展的人工智能领域，而 GPT-4 仍然是该领域的黄金标准。越来越多的初创企业和大型科技公司，包括 Anthropic、Cohere 和 Alphabet 旗下的谷歌，最近推出了人工智能模型，他们称这些模型在某些基准测试中的性能匹配或超过了 GPT-4。 OpenAI 首席执行官 Sam Altman 在周一罕见的博客文章中表示，虽然 ChatGPT 的原始版本暗示了人们如何使用语言与计算机交互，但使用 GPT-4o 感觉“本质上不同”。 “感觉就像电影中的人工智能；对我来说，它是真实的仍然有点令人惊讶，”他说。 “事实证明，达到人类水平的响应时间和表达能力是一个巨大的变化。” GPT-4o（“o”代表全向）不是依靠不同的人工智能模型来处理不同的输入，而是将语音、文本和视觉结合到一个模型中，使其比其前身更快。例如，如果您向系统提供图像提示，它可以用图像进行响应。该公司表示，新模型的速度提高了两倍，效率也显着提高。 “当三种不同的模型协同工作时，就会在体验中引入大量延迟，从而破坏体验的沉浸感，”穆拉蒂说。 “但是，当您拥有一种可以跨音频、文本和视觉进行本地推理的模型时，您就可以消除所有延迟，并且可以与 ChatGPT 进行交互，就像我们现在进行交互一样。” 但新模型遇到了一些障碍。当研究人员在演示过程中讲话时，音频经常被中断。 […]

OpenAI 的新 GPT-4o 让人们可以在同一模型中使用语音或视频进行交互

GPT-4 提供了类似的功能，为用户提供了多种与 OpenAI 的 AI 产品交互的方式。但它将它们隔离在不同的模型中，导致响应时间更长，计算成本可能更高。 GPT-4o 现在已将这些功能合并到一个模型中，Murati 称之为“全模型”。她说，这意味着任务之间的响应速度更快，过渡更顺畅。该公司的演示表明，其结果是一款类似于 Siri 或 Alexa 的对话助理，但能够处理更复杂的提示。 “我们正在研究我们自己与机器之间交互的未来，”穆拉蒂在谈到演示时说道。 “我们认为 GPT-4o 确实正在将这种范式转变为协作的未来，使这种交互变得更加自然。” OpenAI 的研究人员 Barret Zoph 和 Mark Chen 介绍了新模型的一些应用。最令人印象深刻的是它的现场对话设施。你可以在模型响应期间打断它，它会停下来、倾听并调整路线。 OpenAI 还展示了改变模型基调的能力。陈要求模特读一个“关于机器人和爱情”的睡前故事，并迅速插话要求模特发出更戏剧化的声音。该模型逐渐变得更加戏剧化，直到穆拉蒂要求它快速转向令人信服的机器人声音（它擅长这一点）。虽然在模型推理接下来要说什么的过程中，对话过程中出现了一些短暂的停顿，但它作为一场节奏非常自然的人工智能对话脱颖而出。 2024-05-13 19:27:57 1715674913

Tag: GPT4o

信息