xAI 将升级Grok 为多模态AI 模型,可处理图像输入扩充应用范畴

xAI 将升级Grok 为多模态AI 模型,可处理图像输入扩充应用范畴

在多间开发AI 的企业之中,马斯克(Elon Musk)的xAI 算是比较特别的一个,主力产品Grok 拥有社交平台X 上的内容作为辅助资料,也加入罕有的「有趣模式」可以开玩笑。最近他们更在开发者文件中表示,即将升级模型到多模态版本,支援图像输入。

xAI 在上个月已经预告将会推出Grok-1.5V 模型,为目前的Grok 聊天机械人加入多媒体处理能力,据称新版本将会可以处理多种影像资讯,包括文件、图表、萤幕截图和相片等等。他们更声称新版本在多个基准测试中都相当接近甚至超越目前其他竞争对手,例如GPT-4、Claude 3 和Gemini Pro 1.5。

(来源:人工智能

而在最新公开的开发者文件中,xAI 更提供了Python 脚本范例,展示了开发者如何使用xAI 的软体开发工具包(SDK)库来生成基于文字和图像的回应。该脚本可以读取图像,设定文字提示,并利用xAI SDK 产生回应。 Grok-1.5V 到底在实际应用上能否业界顶级标准仍然有待观察,不过相信不用等很久就可以知道了。

(本文由 香港无线网 授权转载;首图来源:人工智能

1716675395
#xAI #将升级Grok #为多模态AI #模型可处理图像输入扩充应用范畴
2024-05-25 16:00:48

Leave a Reply

Your email address will not be published. Required fields are marked *

近期新闻​

编辑精选​