微软研究院揭晓 人工智能运维实验室,一个开源框架,旨在推进云操作人工智能代理的开发和评估。该工具提供了一个标准化且可扩展的平台,以解决复杂云环境中的故障​​诊断、事件缓解和系统可靠性方面的挑战。

随着微服务和无服务器架构成为企业 IT 的标准,它们的复杂性带来了新的运营挑战。中断可能会扰乱关键业务运营,这凸显了旨在维护系统可用性的工具的重要性。许多现有解决方案依赖于专有服务或临时方法,这可能缺乏灵活性和一致性。 AIOpsLab 通过提供标准化框架来评估和增强不同云环境中的 AIOps 代理来解决这些问题。

AIOpsLab 引入了几个关键组件来支持其目标。该框架的核心是代理云接口(ACI),它通过编排器将人工智能代理与应用程序服务分开。该协调器定义任务、验证操作并与 API 交互以执行问题解决策略。通过动态工作负载和故障生成器,模拟资源耗尽或级联故障等实际操作场景,进一步增强任务。

这种界面的想法引起了社区的兴趣。 马可·卡苏拉,雀巢的解决方案架构师, 共享 他的观点:

有趣的想法。我们还提倡使用编排层来处理用户和机器人之间的状态。此外,就像为所有代理提供预定义接口的想法一样,它使管理基础设施版本变得更加容易(我们称之为 GenAI 虚拟代理规范)。我会更深入地研究它;我很好奇他们如何解决域外、主题外和所需操作等问题。

通过支持一系列操作任务,包括事件检测、根本原因分析和缓解,AIOpsLab 既充当基准又充当培训环境。研究人员可以使用它来评估 AIOps 代理在可重复条件下的性能,同时利用其模块化设计将框架扩展到新的应用程序和挑战。

AIOpsLab 还集成了 React、Autogen 和 TaskWeaver 等流行的代理框架,使其可供广大开发人员社区使用。其故障注入功能可以对系统相互依赖性进行详细测试,从而提高云服务的弹性。

此外,AIOpsLab 遵守 Microsoft 的安全标准和 Responsible AI 原则。计划包括与生成式人工智能团队合作,将 AIOpsLab 作为评估最先进模型的基准。

AIOpsLab 作为开源项目提供 GitHub 根据麻省理工学院的许可。

1737055651
2025-01-16 18:56:00
#微软研究院推出 #AIOpsLab人工智能驱动的云运营框架

Leave a Reply

Your email address will not be published. Required fields are marked *