2024 年完整指南

好处 缺点
开放模型可以根据您的业务进行定制。 Meta 对 Llama 3 进行公共信息训练,因此,与其他生成人工智能一样,这可能会产生有害内容或违反版权法。
生成文本或图像,尤其是使用 Imagine 功能来快速迭代图像。 在我们的测试中,与 ChatGPT 使用 GPT-3.5 编写的电子邮件相比,Llama 3 生成的专业电子邮件往往有点模糊和蓬松。
与您现有的云提供商一起使用。 与其他生成式 AI 一样,如果您打算自定义模型,训练 Llama 3 可能会耗费大量时间和资源。

当谈到商业生成人工智能时,OpenAI 可能是更知名的名字,但 Meta 已经通过开源强大的大型语言模型成功地占据了一席之地。 Meta 于 4 月 18 日发布了迄今为止最大的生成式 AI 模型 Llama 3,该模型在一些标准 AI 基准测试中的表现优于 GPT-4。

骆驼 3 是什么?

Llama 3 是 Meta 创建的法学硕士。 它可用于创建生成式人工智能,包括可以用自然语言响应各种查询的聊天机器人。 Llama 3 的评估用例包括集思广益、创意写作、编码、总结文档以及以特定人物或角色的声音回答问题。

完整的 Llama 3 型号有四种型号:

  • 预训练 80 亿个参数。
  • 80亿参数指令微调。
  • 预训练了 700 亿个参数。
  • 700亿参数指令微调。

Llama 3 的生成式 AI 能力可以使用 在浏览器中 或者通过 Meta 的 Facebook、Instagram、WhatsApp 和 Messenger 中的人工智能功能。 模型本身可以从Meta或主要企业云平台下载。

Llama 3 何时发布以及在哪些平台上发布?

Llama 3 于 4 月 18 日在 Google Cloud Vertex AI、IBM 的 watsonx.ai 等大型 LLM 托管平台上发布。 AWS 紧随其后,于 4 月 23 日将 Llama 3 添加到 Amazon Bedrock。截至 4 月 29 日,Llama 3 可在以下平台上使用:

  • 数据块。
  • 拥抱脸。
  • 卡格尔。
  • 微软Azure。
  • NVIDIA NIM。

AMD、AWS、戴尔、英特尔、NVIDIA 和高通的硬件平台均支持 Llama 3。

Llama 3 开源吗?

Llama 3 是开源的,就像 Meta 的其他法学硕士一样。 创建开源模型一直是 Meta 的一个宝贵的差异化因素。

参见:斯坦福大学人工智能指数报告揭示 商业人工智能的 8 个趋势 今天。 (科技共和国)

关于大型语言模型的代码或权重有多少需要公开才能算作开源,存在一些争论。 但就商业目的而言,Meta 为 Llama 3 提供了比竞争对手对其法学硕士更开放的视角。

骆驼 3 免费吗?

只要按照以下条款使用 Llama 3,它就是免费的 执照。 模型可以下载 直接来自元 或在上面列出的各种云托管服务中使用,尽管这些服务可能会产生相关费用。

浏览器上的 Meta AI 起始页提供了要求 Llama 3 做什么的选项。 图片:Meta / 梅根·克劳斯 (Megan Crouse) 截图

Llama 3 是多式联运吗?

Llama 3 不是多模态的,这意味着它无法理解视频、音频或文本等不同模态的数据。 Meta 计划在不久的将来将 Llama 3 打造为多式联运。

Llama 3 相对于 Llama 2 的改进

为了使 Llama 3 比 Llama 2 更强大,Meta 添加了一个新的分词器来更有效地编码语言。 Meta 通过分组查询注意力增强了 Llama 3,这是一种提高模型推理效率的方法。 Meta 表示,Llama 3 训练集的大小是 Llama 2 训练集的七倍,其中代码量是 Llama 2 的四倍。 Meta 将新的效率应用于 Llama 3 的预训练和指令微调。

由于 Llama 3 被设计为开放模型,Meta 为开发人员添加了护栏。 Code Shield 是一种新的护栏,旨在捕获模型可能产生的不安全代码。

骆驼 3 的下一步是什么?

元计划:

  • 为 Llama 3 添加多种语言。
  • 展开上下文窗口。
  • 总体上提升模型的未来能力。

Meta正在研究400B参数模型,这可能有助于塑造下一代Llama 3。在早期测试中,Llama 3 400B具有指令调优 得分 根据 Meta 的说法,MMLU 知识评估(人工智能基准测试)的得分为 86.1,这使其与 GPT-4 具有竞争力。 Llama 400B 将是 Meta 迄今为止最大的法学硕士。

Llama 3 在竞争激烈的生成式 AI 领域中的地位

Llama 3 直接与 GPT-4 和 GPT-3.5、Google 的 Gemini 和 Gemma、Mistral AI 的 Mistral 7B、Perplexity AI 和其他 LLM 竞争,用于个人或商业用途,以构建生成 AI 聊天机器人和其他工具。 Llama 3 发布大约一周后,Snowflake 推出了自己的具有类似功能的开放式企业人工智能,称为 北极雪花

像 Llama 3 这样的法学硕士不断增长的性能要求正在加剧人工智能 PC 的军备竞赛,这些 PC 至少可以部分在设备上运行模型。 与此同时,生成式人工智能公司可能会因繁重的计算需求而面临更严格的审查,这可能会导致气候变化恶化。

骆驼 3 与 GPT-4

Llama 3 在 HumanEval 上的表现优于 OpenAI 的 GPT-4,HumanEval 是一个标准基准,用于比较 AI 模型生成代码与人类编写代码的能力。 Llama 3 70B 得分 81.7,相比之下 GPT-4 的得分为 67

然而,GPT-4 在知识评估 MMLU 上的表现优于 Llama 3,得分为 86.4,而 Llama 3 70B 的得分为 79.5。 Llama 3 在更多测试中的表现可以在 Meta 的博客文章

您的组织应该使用 Llama 3 吗?

假设您已经确定生成式 AI 适合您的业务,那么选择是否使用 Llama 3 可能会取决于可用性。 与竞争对手相比,Llama 3 可以免费使用,并且可以在一定范围内进行定制。

Llama 3 可能比 GPT-4 或 Claude 3 等竞争对手的编码更有效。 然而,Llama 3 在编码领域还有其他竞争对手。 例如,GitHub 最近首次亮相 副驾驶工作区,它是为编码而定制的,可以根据自然语言提示创建代码。

如果您想要通用的开源 AI 模型系列,Llama 3 可能适合您的组织。

1715583097
#年完整指南
2024-05-06 19:38:03

Leave a Reply

Your email address will not be published. Required fields are marked *

近期新闻​

编辑精选​