谷歌宣布推出具有百万代币上下文长度的多模式 Gemini 1.5

公告发布一周后双子座1.0超，谷歌宣布了有关其下一代模型的更多细节，双子座1.5。新的迭代扩大了上下文窗口，并采用了“专家混合”（MoE）架构，有望使人工智能更快、更高效。新模型还包括扩展的多式联运功能。

它能够处理多达 100 万个代币，使其竞争对手甚至其前身的能力相形见绌。谷歌首席执行官桑达尔·皮查伊突出显示该功能的变革潜力，指出：“这允许您在查询时添加大量个人上下文和信息的用例……我认为这是我们所做的更大突破之一。”

Gemini 1.5 的利用专家荟萃技术代表着优化人工智能效率的又一步。通过根据查询有选择地激活模型的相关部分，它可以确保速度和资源节约，随着人工智能模型变得越来越复杂和耗电，这是一个关键的进步。这种方法不仅通过减少等待时间来增强用户体验，而且还与更广泛的努力相结合，使人工智能更具可持续性。

“该模型的多模式功能意味着您可以以复杂的方式与整本书、很长的文档集、数百个文件中数十万行的代码库、完整的电影、整个播客系列等进行交互，”根据杰夫·迪恩，谷歌 DeepMind 和谷歌研究院首席科学家。想要观看 Gemini 1.5 组织演示的人可以参考它的视频解决问题跨越 100,000 行代码或检索跨越一部44分钟的电影。

随着 OpenAI 最近推出了 ChatGPT 的内存功能，并发出进军网络搜索的信号，这场竞赛不仅是为了构建最强大的人工智能。在面向更广泛的消费者推出之前，Google 将 Gemini 1.5 的重点放在开发人员和企业用户上，这突显了人工智能作为业务创新和个人生产力工具的重要性。

真正重要的是模型如何有效地利用上下文来解决现实世界的问题，而 Gemini-1.5 已经出色地超越了 SOTA。 – 范吉姆

尽管 Gemini 1.5 令人兴奋，但很明显 Google 仍处于探索其全部潜力的早期阶段。 Gemini 1.5 将仅通过 Vertex AI 和 AI Studio 向商业用户和开发人员提供。该模型令人印象深刻的功能也伴随着挑战，特别是涉及最大上下文窗口的任务的处理速度。正如 Google DeepMind 研究副总裁 Oriol Vinyals 所说：承认，“延迟方面 [is something] 我们正在……努力优化——这仍处于实验阶段、研究阶段。”然而，未来优化的承诺和对更大上下文窗口的探索表明，谷歌只是触及了可能性的表面。

有兴趣了解更多有关 Gemini 1.5 的开发人员可以查看技术报告，了解有关模型的其他信息，包括模型卡、培训信息以及有关模型评估的其他详细信息。

1708214477
2024-02-17 23:28:32
#谷歌宣布推出具有百万代币上下文长度的多模式 #Gemini