Nvidia 的“Nemotron-4 340B”模型重新定义了合成数据生成,可与 GPT-4 相媲美

是时候庆祝引领 AI 发展的杰出女性了!立即提名您身边的杰出领导者,获得 VentureBeat 的 AI 女性奖,截止日期为 6 月 18 日。了解更多 英伟达 通过发布“Nemotron-4 340B”这是一系列开创性的开放模型,旨在彻底改变用于训练大型语言模型 (LLM) 的合成数据生成。这一发展标志着人工智能行业的一个重要里程碑,因为它使各个行业的企业能够创建功能强大、特定领域的 LLM,而无需大量且昂贵的真实世界数据集。 该模特一直以神秘的化名“六月聊天机器人“ 在 LMSys.org 聊天机器人竞技场,现已被正式确定并推出,在人工智能界引起了不小的轰动。 Nemotron-4 340B:无与伦比的性能和多功能性,适用于合成数据生成 Nemotron-4 340B 系列包括 根据, 指导, 和 报酬 模型,形成了一个用于生成高质量合成数据的综合管道。Nemotron-4 340B 在训练中使用了惊人的 9 万亿个 token,拥有 4,000 个上下文窗口,并支持 50 多种自然语言和 40 种编程语言,其表现远超其竞争对手,包括 Mistral 的 混合-8x22B,人类的 克劳德·桑奈特、Meta 的 骆驼3-70B, Qwen-2,甚至可与GPT-4的性能相媲美。 Nemotron-4 340B 最引人注目的方面之一是其商业友好的许可。 松舒布拉·马宗达高级深度学习研究工程师在 X.com 的一篇文章中强调了这一点,他表示:“该许可证具有商业可行性。是的,你可以使用它来生成你想要的所有数据。” […]