了解生成式 AI 时代的 AI 堆栈 | 作者:MongoDB | MongoDB | 2024 年 6 月

只需一次 API 调用,您就可以拥有一个拥有数十亿个参数的强大 LLM。这让我们了解了 AI 堆栈的最关键组件,即模型提供程序或模型本身。 模型提供商是提供现成的 AI 模型(例如嵌入模型、微调模型和基础模型,以便集成到生成式 AI 应用程序中)的组织,无论规模大小。 当今的人工智能领域提供了大量模型,可实现预测分析、图像生成、文本补全等功能。人工智能领域(包括生成式人工智能)中的模型可访问性分为闭源模型和开源模型。 闭源模型是指具有私有内部配置、架构和算法的模型,不与模型使用者共享。相反,负责该模型的创建者或组织掌握有关该模型的关键信息。诸如模型的训练方式以及模型训练所依据的数据等信息也不向公众公开,不可供审查、修改或使用。闭源模型可通过 API(应用程序编程接口)端点或应用程序接口访问。 闭源模型的关键方面在于,模型的使用者(非创建者)无法大幅改变模型的行为,只能通过 API 等抽象来改变创建者公开的模型部分。闭源模型及其提供者的常见示例包括: 克劳德由 Anthropic 提供,可通过网络聊天界面和 API 访问。 开放人工智能,这使得 GPT-3.5 和 GPT-4 等 LLM 以及 text-embedding-3-small、text-embedding-3-large 和 text-embedding-ada-002 等嵌入模型可通过 API 和聊天界面使用。 开源模型的内部架构、网络配置、训练数据、权重、参数等都是公开的。开源社区及其努力促进了人工智能社区内的协作和开放。 讨论与 AI 模型相关的开源软件框架是件复杂的事情,因为开源有多种版本。长话短说,开源并不一定意味着完全开放。为简单起见,以下是与 AI 堆栈相关的常见开源类型。 开源:模型的各个方面,例如权重、架构配置、训练数据、训练方法等,都是公开可用的,没有任何限制。 开放式重量:仅模型权重和参数公开供使用。 开放模型:模型权重和参数可供使用,但需要同意创建者的使用条款。 开源模式带来的机遇在于,技术获取途径的民主化,此前,只有拥有足够资源大规模培训和发展法学硕士的在职人员才能获得这些技术。开源法学硕士降低了开发人员探索各种用例的门槛,而这些用例对于大公司来说太小众了。 开源法学硕士 (LLM) 及其提供者的示例包括: 骆驼 是一个拥有数百亿个变体和参数的文本生成模型。LLaMA 模型家族类由 Meta 创建和发布。 混合-8×7 由 […]

CIO 如何打造适应 AI 时代的 IT 团队

特雷弗·舒尔茨 人工智能的快速崛起正促使首席信息官迅速重新评估他们对未来的愿景、IT 的作用以及建立一支强大团队的意义。 CIO 处于独特的地位: 为他们的组织提供有关人工智能投资的建议 同时领导负责实施的团队。 作为业务和技术之间的重要桥梁,首席信息官必须立即开始组建合适的团队,以推动其组织走向未来。 构建这座桥梁的三个关键方法至关重要。 1. 扮演变革推动者的角色。 随着人工智能的加速发展及其近乎持续的发展通过自身的转型推动 IT 领导力的发展,首席信息官不能将自己的角色仅限于运营。 当前的形势要求他们成为采用新技术的变革推动者。 变革推动者必须考虑业务影响做出决策,并以业务术语清楚地传达拟议技术进步的价值。 这种领导方式为 IT 团队的思考和运营方式奠定了基础。 变革推动者的角色有责任建立由拥有不同且更广泛技能的人员组成的 IT 团队,使他们能够积极探索与人工智能相关的各种机会。 最近 Alteryx 的受访者 民意调查 绝大多数的商界领袖表示,拥有多种技能(72%)与专注于特定领域(28%)对于未来的职业生涯至关重要。 2. 培养团队更好地理解业务,以数据素养为核心。 数据素养和数据分析能力可以说是释放人工智能全部潜力的最重要技能。 然而,许多 IT 领导者发现自己面临着数据技能差距。 在一个 民意调查 在调查分析的使用情况时,不到三分之一的美国数据工作者表示他们意识到数据的重要性,不到四分之一的人表示他们的整个组织都可以访问数据。 IT 团队必须完全掌握数据驱动工具,以帮助其他需要并想要了解和评估其用例、痛点和技术知识的人。 为员工提供访问数据和分析数据的工具可以促进业务发展,但除非员工充分了解如何使用数据工作、提出问题和解决问题,否则这种访问不会有任何帮助。 以数据为人工智能的基础,多技能 IT 团队有机会向业务用户展示如何使用数据并展示自己作为数据的门户和守护者的价值,从而为业务提供支持。 现代 IT 团队还必须熟悉与企业生成式人工智能激增相关的各种道德、知识产权、版权和数据隐私问题。 企业依靠首席信息官及其团队来开发和管理技术解决方案,以加速增长并在不损害合规或道德义务的情况下获取更多价值。 人工智能代表了整个研究领域,远远超出了当今主导对话并要求教育和探索的生成式人工智能技术。 首席信息官及其团队明智的做法是与学术机构合作、参加行业联盟并参加会议,以帮助他们了解整个行业的最新见解。 3.永远不要停止学习。 绝不 停止辅导。 学习并不以技能培训开始和结束;而是以技能培训为起点和终点。 它必须涉及做。 专注于降低风险的 IT […]