谷歌发布 Gemini,一款人工智能驱动的聊天机器人和语音助手

首先,有 Siri、Alexa 和 Google Assistant 等会说话的数字助理。 然后还有 ChatGPT 和 Google Bard 等在线聊天机器人。 现在,两者正在融合。

周四,谷歌推出了 Gemini,这是一款智能手机应用程序,其行为就像一个会说话的数字助理和一个会话聊天机器人。 响应语音和文本请求,它可以回答问题、写诗、生成图像、起草电子邮件、分析个人照片以及采取其他操作,例如设置计时器或拨打电话。

Gemini 取代了 Bard 和 Google Assistant,可立即供包括美国在内的 150 多个国家和地区的英语使用者使用。 它以该公司自去年初以来一直在开发的人工智能技术为基础。

谷歌表示,这款新应用程序旨在完成一系列任务,包括充当个人导师、帮助计算机程序员完成编码任务,甚至为求职者面试做好准备。

“它可以帮助你在各种场景中进行角色扮演,”Sissie Hsiao 说。 负责该公司 Google Assistant 部门的谷歌副总裁在向记者通报情况时表示。

什么时候 ChatGPT 已抵达 2022 年底 OpenAI 发布,其回答问题、撰写学期论文和生成计算机代码的方式让公众惊叹不已,谷歌发现自己正在追赶。 与其他科技巨头一样,该公司 花费数年开发类似技术 但还没有发布像 ChatGPT 这样先进的产品。

(纽约时报 被起诉 OpenAI 及其合作伙伴微软于 12 月声称侵犯了与人工智能系统相关的新闻内容的版权。)

谷歌 发布了自己的聊天机器人,巴德,三月份的评论中等。 在接下来的几周内,该公司合并了两个领先的人工智能实验室——谷歌大脑和 DeepMind——并宣布合并后的实验室正在开发名为 Gemini 的新人工智能技术。

Gemini 是研究人员所说的大型语言模型(LLM),这是一种数学系统,可以通过分析大量数据(包括书籍、计算机程序和在线聊天)来学习技能。 通过识别所有文本中的模式,法学硕士可以学习自己生成文本。 这意味着它可以写诗、生成计算机代码,甚至可以进行对话。

它也容易出错。 它可能会弄错事实或“产生幻觉”——编造一些东西。

Gemini 是一个“多模式”系统,这意味着它可以对图像和声音做出响应。 在分析了包含图形、形状和其他图像的数学问题后,它可以像高中生一样回答问题。

12 月,谷歌使用了该技术的有限版本 升级吟游诗人。 现在,该公司已经不再使用 Bard 这个名字,并通过 Gemini 应用程序发布了该技术的更强大版本,该应用程序可在 Android 手机和网络上使用。 谷歌表示,iPhone 版本将在“未来几周内”推出。

谷歌创建了一个免费但有限的 Gemini 应用程序版本。 功能更强大的版本称为 Gemini Advanced,以 Google Ultra 语言模型版本为基础,每月订阅费用为 19.99 美元。 谷歌提供两个月的免费试用。

谷歌发布了基准测试结果,声称 Ultra 在几个关键领域(包括生成计算机代码和总结新闻文章)优于 OpenAI 的最新技术 GPT-4。

Gemini 应用程序还可以生成、分析和响应图像。 例如,用户可以上传超级碗派对的照片,并要求应用程序生成标题。

谷歌还表示,将通过 Google Workspace 和 Google Cloud 商业服务提供类似的技术。 这将允许客户将该技术与 Gmail 和 Google Docs 等应用程序一起使用。

在 Android 手机上,如果用户下载 Gemini,新应用程序将取代 Google Assistant。 与 Google Assistant 一样,它可以响应语音命令,但也可以响应文本命令。

谷歌表示,还将继续提供和改进 Google Assistant。

去年,OpenAI 发布了 ChatGPT 聊天机器人的类似版本 可以响应语音命令。 大多数业内人士认为,驱动 ChatGPT 等聊天机器人的人工智能技术将与苹果 Siri 和亚马逊 Alexa 等数字助理合并并取代。

1707400816
2024-02-08 13:00:29

Leave a Reply

Your email address will not be published. Required fields are marked *

近期新闻​

编辑精选​