谷歌宣布推出具有百万代币上下文长度的多模式 Gemini 1.5

公告发布一周后 双子座1.0超,谷歌宣布了有关其下一代模型的更多细节, 双子座1.5。 新的迭代扩大了上下文窗口,并采用了“专家混合”(MoE)架构,有望使人工智能更快、更高效。 新模型还包括扩展的多式联运功能。

它能够处理多达 100 万个代币,使其竞争对手甚至其前身的能力相形见绌。 谷歌首席执行官桑达尔·皮查伊 突出显示 该功能的变革潜力,指出:“这允许您在查询时添加大量个人上下文和信息的用例……我认为这是我们所做的更大突破之一。”

Gemini 1.5 的利用 专家荟萃 技术代表着优化人工智能效率的又一步。 通过根据查询有选择地激活模型的相关部分,它可以确保速度和资源节约,随着人工智能模型变得越来越复杂和耗电,这是一个关键的进步。 这种方法不仅通过减少等待时间来增强用户体验,而且还与更广泛的努力相结合,使人工智能更具可持续性。

“该模型的多模式功能意味着您可以以复杂的方式与整本书、很长的文档集、数百个文件中数十万行的代码库、完整的电影、整个播客系列等进行交互,”根据 杰夫·迪恩,谷歌 DeepMind 和谷歌研究院首席科学家。 想要观看 Gemini 1.5 组织演示的人可以参考它的视频 解决问题 跨越 100,000 行代码或 检索 跨越一部44分钟的电影。

随着 OpenAI 最近推出了 ChatGPT 的内存功能,并发出进军网络搜索的信号,这场竞赛不仅是为了构建最强大的人工智能。 在面向更广泛的消费者推出之前,Google 将 Gemini 1.5 的重点放在开发人员和企业用户上,这突显了人工智能作为业务创新和个人生产力工具的重要性。

真正重要的是模型如何有效地利用上下文来解决现实世界的问题,而 Gemini-1.5 已经出色地超越了 SOTA。 – 范吉姆

尽管 Gemini 1.5 令人兴奋,但很明显 Google 仍处于探索其全部潜力的早期阶段。 Gemini 1.5 将仅通过 Vertex AI 和 AI Studio 向商业用户和开发人员提供。 该模型令人印象深刻的功能也伴随着挑战,特别是涉及最大上下文窗口的任务的处理速度。 正如 Google DeepMind 研究副总裁 Oriol Vinyals 所说: 承认,“延迟方面 [is something] 我们正在……努力优化——这仍处于实验阶段、研究阶段。”然而,未来优化的承诺和对更大上下文窗口的探索表明,谷歌只是触及了可能性的表面。

有兴趣了解更多有关 Gemini 1.5 的开发人员可以查看技术报告,了解有关模型的其他信息,包括模型卡、培训信息以及有关模型评估的其他详细信息。


1708214477
2024-02-17 23:28:32
#谷歌宣布推出具有百万代币上下文长度的多模式 #Gemini

Leave a Reply

Your email address will not be published. Required fields are marked *

近期新闻​

编辑精选​