微软研究院推出 AIOpsLab:人工智能驱动的云运营框架

微软研究院揭晓 人工智能运维实验室,一个开源框架,旨在推进云操作人工智能代理的开发和评估。该工具提供了一个标准化且可扩展的平台,以解决复杂云环境中的故障诊断、事件缓解和系统可靠性方面的挑战。 随着微服务和无服务器架构成为企业 IT 的标准,它们的复杂性带来了新的运营挑战。中断可能会扰乱关键业务运营,这凸显了旨在维护系统可用性的工具的重要性。许多现有解决方案依赖于专有服务或临时方法,这可能缺乏灵活性和一致性。 AIOpsLab 通过提供标准化框架来评估和增强不同云环境中的 AIOps 代理来解决这些问题。 AIOpsLab 引入了几个关键组件来支持其目标。该框架的核心是代理云接口(ACI),它通过编排器将人工智能代理与应用程序服务分开。该协调器定义任务、验证操作并与 API 交互以执行问题解决策略。通过动态工作负载和故障生成器,模拟资源耗尽或级联故障等实际操作场景,进一步增强任务。 这种界面的想法引起了社区的兴趣。 马可·卡苏拉,雀巢的解决方案架构师, 共享 他的观点: 有趣的想法。我们还提倡使用编排层来处理用户和机器人之间的状态。此外,就像为所有代理提供预定义接口的想法一样,它使管理基础设施版本变得更加容易(我们称之为 GenAI 虚拟代理规范)。我会更深入地研究它;我很好奇他们如何解决域外、主题外和所需操作等问题。 通过支持一系列操作任务,包括事件检测、根本原因分析和缓解,AIOpsLab 既充当基准又充当培训环境。研究人员可以使用它来评估 AIOps 代理在可重复条件下的性能,同时利用其模块化设计将框架扩展到新的应用程序和挑战。 AIOpsLab 还集成了 React、Autogen 和 TaskWeaver 等流行的代理框架,使其可供广大开发人员社区使用。其故障注入功能可以对系统相互依赖性进行详细测试,从而提高云服务的弹性。 此外,AIOpsLab 遵守 Microsoft 的安全标准和 Responsible AI 原则。计划包括与生成式人工智能团队合作,将 AIOpsLab 作为评估最先进模型的基准。 AIOpsLab 作为开源项目提供 GitHub 根据麻省理工学院的许可。 1737055651 2025-01-16 18:56:00 #微软研究院推出 #AIOpsLab人工智能驱动的云运营框架
编写安全的 Go 代码 |雅库布·雅罗斯
编写 Go 代码时牢记安全意味着什么?在一篇短文中回答这个问题似乎是不可能的。出于这个原因,我们将其范围缩小到一些具体的实践。 当持续应用时,它们将导致编写健壮、安全和高性能的代码。 我们如何及时了解 Go 安全公告? 我们如何保持 Go 代码的补丁和最新状态? 我们如何测试 Go 代码的安全性和健壮性? 什么是 CVE?我们从哪里了解最常见的软件漏洞? 邮件列表 让我们从最明显的地方开始 – Go 邮件列表。我们需要订阅才能从源头获取所有关键安全信息。所有包含安全修复程序的版本都会向 [email protected] 列表。一旦我们订阅了该列表,我们就可以确保不会错过任何重要的公告。 保持 Go 版本最新 第二步是使我们项目中的 Go 版本保持最新。尽管我们不使用最新和最好的语言功能,但升级 Go 版本为我们提供了针对已发现漏洞的所有安全补丁。此外,新的 Go 版本确保了与新依赖项的兼容性。它可以保护我们的应用程序免受潜在集成问题的影响。 第三步是了解 Go 版本中解决了哪些安全问题和 CVE。我们可以在Go发布历史网站上查看,然后在Go中更新到最新版本 go.mod 我们项目中的文件。 升级到新版本的Go后,我们应该确保操作不会引入兼容性和依赖问题,尤其是第三方包。当我们处理具有数十个甚至数百个直接和间接包依赖项的大型项目时,风险可能更大。 重点是通过消除潜在的依赖性问题来维持风险。这些问题可能包括迫切需要重构现有代码以使其能够与新的依赖项一起工作。此类问题的示例包括更改的包、API 或函数签名。 当我们知道我们将使用没有安全问题的Go版本后,我们就可以专注于项目源代码。我们可以通过使用静态代码分析器开始评估代码质量和安全性。 兽医 在安装和使用第三方分析器之前,最好使用 Go “native” go vet 命令。 我们可以使用 go vet 命令来分析我们的 Go 代码。这 […]
人工智能和平台工程正在改变 DevOps

一项针对 3,000 名员工的调查显示,全球超过 75% 的专业人士每天至少在工作中使用一次人工智能,但信任人工智能生成的代码的人却少得多。 Google 的 2024 年加速 DevOps 状态报告 (朵拉)。 该研究于 10 月 22 日发布,显示 76% 的专业人士使用人工智能来编写代码、总结信息、解释不熟悉的代码、优化代码和记录代码。它概述了采用生成式人工智能的许多好处,包括提高注意力、生产力、工作满意度和代码质量。 然而,报告指出,生成式人工智能也会对软件交付性能、产品质量以及员工花在有价值工作上的时间产生负面影响。研究还发现,使用人工智能并不一定会减少花在“辛苦工作”或缺乏“意义”的任务上的时间。 报告指出:“人工智能对许多重要的个人和组织因素产生积极影响,这些因素为软件交付的高绩效创造了条件。” “但是,人工智能似乎并不是万能药。” 谷歌调查概述了生成式人工智能的优缺点 今年的研究是第十次迭代,重点关注人工智能如何影响倦怠、注意力、工作满意度、生产力以及产品、组织和团队的绩效。 DORA 通过四个关键指标衡量稳定性成功与否:变更提前时间、部署频率、变更失败率和失败部署恢复时间。 请参阅:从我们的 2024 年 10 款最佳项目组合管理 (PPM) 软件和工具列表中进行选择。 日常工作中与人工智能的互动往往以以下形式出现: 聊天机器人(78.2%)。 外部网络接口(73.9%)。 集成开发环境中嵌入的人工智能工具(72.9%)。 一些受访者表示,采用人工智能是为了应对竞争压力,一位受访者指出,不采用人工智能的公司可能会“落后”。另一位提到他们的组织将人工智能视为“一个重要的营销点”。不到 10% 的受访者表示,他们的生产力受到人工智能的负面影响。 其他调查结果显示: 81% 的受访者表示,“他们的组织已经改变了优先事项,以更多地将人工智能融入到他们的应用程序中。” 使用人工智能时,开发人员感觉工作效率更高,67% 的受访者表示人工智能可以帮助他们改进代码。 近 40% 的受访者表示,他们对人工智能“几乎没有”信任。 另一方面,大多数受访者表示,他们只是“在某种程度上”信任人工智能生成代码的质量。采访以及该研究的作者表明,这可能意味着开发人员希望使用人工智能作为调整和纠正结果的基线。 报告称:“然而,受访者还预计人工智能将对他们的职业、环境和整个社会产生净负面影响。”超过 30% 的受访者认为人工智能会对环境有害。 人工智能还可能影响软件交付性能、稳定性和吞吐量。这可能是因为人工智能编写的代码可以生成如此大量的代码。报告称,这些较大的变化“速度较慢且更容易不稳定”。小批量仍然是软件开发中的一个重要原则,直接关系到质量。 必读的开发人员报道 近十分之九的专业人士使用内部开发人员平台 […]
Java 新闻综述:OpenJDK 更新、Piranha Cloud、Spring Data 2024.0.0、GlassFish、Micrometer

本周 2024 年 5 月 13 日的 Java 综述重点介绍了新闻:JEP 477,隐式声明的类和实例主要方法(第三次预览),建议针对 JDK 23; Piranha Cloud 2024 年 5 月版; 春季数据2024.0.0; Spring Framework、GlassFish 和 Micrometer 的点发布和里程碑发布。 OpenJDK JDK 23 构建 23 JDK 23 的 早期访问版本 已于上周推出 更新 从 Build 22 开始,其中包括对各种问题的修复 问题。 有关此版本的更多详细信息,请参阅 发行说明。 玻璃鱼 这 第六个里程碑版本 的 玻璃鱼 8.0.0 提供错误修复、依赖项升级和显着改进,例如:改进的 Jakarta 上下文和依赖项注入 TCK; 新的 Jakarta JSON […]
Rider 2024.1:新的监控工具窗口、Collection Vizualizer、.NET Aspire、AI Assistant 插件

JetBrains 发布了 Rider 2024.1。 此版本包含一个新的监控工具窗口和一个集合可视化工具。 还出现了插件:.NET Aspire、AI Assistant 和有关调试的功能。 JetBrains Rider 提供了一个集成的监控工具,可以显示应用程序的各个方面,包括 CPU 和内存使用情况、计数器、环境变量等。 默认情况下,每次运行或调试项目时,JetBrains Rider 都会显示包含实时数据的监控工具窗口。 该窗口可用于跟踪应用程序性能并分析特定时间点运行时环境的状态。 Rider 2024.1 中的集合可视化工具提供集合(数组、列表、字典和其他可枚举类型)的图形表示,支持元素的扩展和折叠、查看各个值以及轻松浏览数据结构。 此功能有助于在调试期间了解程序数据的状态以及诊断数据收集、操作或处理的问题。 在 Twitter 威胁中,一位用户询问有关支持 Unity Native Collections 的问题。 马特·埃利斯JetBrains 的开发者倡导者回答说: 不幸的是,集合可视化工具是使用托管 dotnet 集合构建和测试的。 我们需要做一些进一步的工作,以确保它们能够与 Unity 的本机集合正常工作。 此外,新版本中还发布了AI助手,现在可以单独使用 插入。 这一变化是由于需要在基于人工智能的技术的使用方面提供更大的决策灵活性,从而提供对工作环境中的偏好和要求的更多控制。 AI助手仍然需要一个活跃的 JetBrains AI 订阅。 此外,还有一个 .NET Aspire 插件 – 一种解决在 .NET 堆栈上构建分布式应用程序的复杂问题的新方法。 该插件可以直接从 JetBrains Marketplace […]
使用 Azure Monitor Pipeline 增强基于云的监视

Azure 监视器 是 Microsoft 的云监控服务,用于收集、可视化和分析来自应用程序、基础设施和网络的遥测数据。 该公司最近在预览版中添加了数据收集功能 边缘管道,它可以在将遥测数据发送到云之前对其进行收集和路由。 这 Azure Monitor 边缘管道 就像一个 提取、转换、加载 (ETL) 过程 并提供改进的数据收集方法。 据该公司称,它通过利用统一的摄取管道和标准化的配置方法来简化来自多个来源的数据收集,从而更加高效和可扩展。 这对于基于 Azure 云的监控特别有利。 该管道是部署在 支持 Arc 的 Kubernetes 集群。 它利用 打开遥测收集器 以及用于管理传入客户端数据流的管道配置文件。 随后,它会在需要时将它们转发到云端,同时使用本地缓存。 对 Azure Monitor 的开放遥测支持基于该公司的确认,如下: 马修·麦克利里微软 Azure Monitor 高级产品经理在早期的 Azure Monitor 中写道 博客文章: 管道配置文件是边缘管道的重要组成部分,用于建立数据流和缓存设置。 这 数据收集规则 另一个关键要素(DCR)定义了云管道传输的数据模式、转换标准和目的地。 管道配置中的每个数据流定义指定了 DCR 及其关联的流,以便在云管道内进行处理,从而确保无缝且高效的操作。 要利用管道,用户必须在其环境中的单个启用 Arc 的 Kubernetes 群集上部署 Azure […]
AWS 推出 CloudWatch 互联网气象图

AWS 最近宣布 互联网气象图的可用性是 CloudWatch 的一项新功能,可显示互联网延迟和可用性中断的 24 小时全球快照。 这张新地图提供了有关互联网状况的全球视角,允许用户放大并分析特定城市或特定服务提供商的性能和可用性问题。 互联网天气地图上的红色和黄色圆圈分别表示当前影响可用性和性能的问题,而灰色圆圈表示过去 24 小时内已解决的问题。 杰夫·巴尔, AWS 副总裁兼首席布道师, 写: 互联网有大量的移动部件:路由器、交换机、集线器、陆地和海底电缆、硬件侧的连接器以及软件侧复杂的协议栈和配置。 当出现问题导致互联网速度减慢或中断并影响您的客户时,您希望能够尽快定位并了解问题。 每个问题都会影响特定的城市网络,该网络通过位置和自治系统编号 (ASN) 的组合进行识别,通常对应于单个 ISP。 根据 常见问题页面,地图每 15 分钟更新一次,忽略持续时间少于 5 分钟的短暂事件。 利用AWS运营的全球监控器,新服务使用户能够在Internet Monitor控制台中设置监控器,跟踪根据客户的应用程序流量和客户端位置定制的信息。 巴尔补充道: 如果您想了解互联网天气如何影响您的特定 AWS 应用程序并利用健康事件通知和流量洞察等其他功能,您可以使用 CloudWatch Internet Monitor。 虽然 Internet Monitor 主要是 CloudWatch 控制台的一项功能,但也可以通过编程方式使用。 根据 文档,新的 ListInternetEvents 函数每次调用最多返回 100 个性能或可用性事件。 可以选择按时间范围、状态(活动或已解决)或类型(性能或可用性)进行过滤。 每个 JSON 事件都包含各种详细信息,例如中断的纬度和经度。 这些数据来自对互联网的主动和被动探测的组合,云提供商概述了如何 AWS 测量连接问题。 […]
InfoQ 波士顿和慕尼黑开发峰会:关于生成式 AI、安全性、现代 Web 应用程序的可行见解

提高您的开发技能并保持领先地位 InfoQ 波士顿开发峰会 (6 月 24 日至 25 日),以及 InfoQ 慕尼黑开发峰会 (9 月 26 日至 27 日)。 了解新兴趋势、探索用例并直接从领先的高级软件从业者那里实施最佳实践。 由于大众的需求,我们延长了早鸟优惠日期 InfoQ 波士顿开发峰会 对于 InfoQ 读者来说,慕尼黑提前一周。 使用促销代码参加 InfoQ 波士顿开发峰会可节省 100 美元 有限优惠 波士顿24 75 欧元 InfoQ 慕尼黑开发峰会 使用促销代码 有限优惠慕尼黑24 注册时。 有效期至5月6日。 InfoQ 波士顿开发峰会增加了新的演讲 “在 InfoQ 开发峰会上,高级开发人员将清楚地了解如何应对当今关键的开发挑战。我们将超越理论和炒作,直接向面临同样障碍的从业者学习行之有效的方法。他们的现实世界策略将帮助您取得良好的成果——在我们快速发展的环境中,就对您的发展路线图真正重要的优先事项做出明智的决策,获得专注、实用的见解,提供方向,消除噪音,推动明智的选择,产生立竿见影的效果。” 埃德·伊格纳托维奇 InfoQ 开发峰会波士顿 2024 主席、高级首席软件工程师和架构师 @RedHat 在 2024 年波士顿 InfoQ 开发峰会(6 […]
Rachael Greaves 在 QCon London 上:道德人工智能可以减少数据泄露的影响

在 QCon 伦敦, Rachael Greaves,Castle Systems 首席执行官,介绍了数据最小化作为减少数据泄露影响的机制的义务和好处。 只要考虑道德原则,人工智能自动分类和自动决策工具就可以帮助应对不断增加的数据量,从而允许对决策提出挑战。 格里夫斯在演讲开始时指出,网络安全主要侧重于通过培训、防火墙和加密来降低泄露的可能性。 但是,风险是可能性和影响的组合,即 “渗透的可能性很小,但影响重大”。 数据最小化 是一种降低数据泄露影响的机制。 她表示,创建一个坚不可摧的系统是不可能的:“总会有 零日漏洞、值得信赖的内部人员或错误配置”。 这是一项安全和隐私原则,要求组织限制其持有的信息量,因为他们知道自己可能随时被泄露或数据泄露到公共领域。 除了法律义务之外,格里夫斯还指出了实施数据最小化的好处: 威慑:数据最小化减少了数据泄露时可能造成的潜在危害,但也阻止了进一步侵入系统的尝试(最大限度地减少恶意行为者可以货币化的数据量将阻止进一步的尝试)。 响应和恢复:如果您完全了解您的数据,这是数据最小化的第二个好处。 在事件发生之前了解这一点将使您知道“谁参与了泄漏”(哪个客户受到了影响)。 如果发生违规,您可以迅速向受影响方发出警报,将影响降至最低。 可保性和风险转移:即使评估过程不透明,网络保险公司的评估也有与敏感数据相关的广泛部分。 研究还发现,包含大量敏感信息的组织的保险成本往往较高。 组织有效性:您需要了解您持有的所有信息,即哪些信息有风险,哪些信息有价值,以及重要的是哪些规则适用于该信息(保留规则、保密规则、监管义务)。 数据最小化实现组织最大化 数据最小化不是项目中的额外阶段,而是在从创建或捕获到最终处置的整个数据生命周期中持续进行的工作。 数据最小化的三个关键要素脱颖而出: 最大限度地减少收集:不要收集无关的个人详细信息,不要在两项不同服务中两次收集相同的数据,不要保留重复项、过多的备份或离线副本,并收集 仅有的 需要什么。 最大限度地减少访问权限:最大限度地减少有权访问的人员数量、他们的权限和访问持续时间(“了解谁对数据做了什么,并就敏感和高价值数据上的操作发出警报,有助于识别特权蔓延……”)。 数据生命周期管理:数据一次性不仅仅是硬盘驱动器 消磁。 通过围绕记录管理和保留政策的政策和治理可以完成很多工作。 格里夫斯再次强调,即使许多结果来自流程和治理,随着数据隐私和治理向左移动,开发人员接受并支持“数据最小化理念”也是至关重要的。 鉴于数据的复杂性和海量,技术可以及时、准确地揭示“什么是有价值的、什么是敏感的”(最小化风险并最大化结果)。 人工智能非常适合此类任务,尤其是数据的自动分类和 自动决策 (阿德米德)。 系统需要能够跨多个系统收集和标记敏感数据,而不影响源系统,但它们仍然应该让人类作为最终决策者: 对于像数据治理这样有风险的事情,重要的是不要将人员完全排除在循环之外。 为了避免人工智能偏见、幻觉或人工智能系统被恶意使用的风险,一些软件辅助义务(无论是否支持人工智能)需要是可解释和透明的。 这样,他们就可以避免对最脆弱的社区造成伤害。 格里夫斯结束了她丰富的例子(OPM 数据泄露, 澳大利亚大学数据泄露, 疾风丑闻等)包含包含预先提出的最佳实践的清单的演示。 她表示,隐私法倾向于销毁数据,记录法倾向于保护数据,而国家安全法则倾向于处理敏感数据。 因此,无论系统看起来多么困难,都需要通过系统设计来平衡数据风险和数据价值之间的紧张关系。 1714148728 2024-04-26 16:16:10 #Rachael #Greaves #在 […]
Visual Studio 17.10 预览版 2:GitHub Copilot 支持的 Pull 请求,ARM64 中对 VS 的 SSDT 支持

微软发布了 Visual Studio 17.10 预览版 2。 此版本包含有关 GitHub Copilot 支持的拉取请求的功能、对 ARM64 上 VS 中的 SQL Server 开发人员工具的支持以及对托管内存窗口中的垃圾收集见解的支持。 Visual Studio 17.10 Preview 2 支持 GitHub Copilot 支持的拉取请求描述。 通过 Copilot 对拉取请求中包含的所有更改的分析,可以生成拉取请求描述的初稿。 要试用它,需要拥有有效的 GitHub Copilot 订阅并安装 GitHub Copilot 聊天扩展。 此外,微软开发人员在“提交详细信息”窗口中添加了由 GitHub Copilot 支持的解释功能。 这使得更容易理解每次提交的范围。 双击任何提交将在 Git 存储库窗口中打开“提交详细信息”面板。 然后需要单击“解释批准”图标以与代码并排显示更改摘要。 下一个功能是直接在 Visual Studio 的工作文件中访问 GitHub 和 Azure DevOps 拉取请求注释。 Visual […]