什么是 AIOps
AIOps 定义
AIOps 是 "IT 运营人工智能 "的缩写。它指的是利用 机器学习(ML) 和分析技术实现 IT 运营自动化的平台。AIOps 利用运营设备的大数据,具有即时检测和响应问题的独特能力。利用 ML 的强大功能,AIOps 可通过各种形式的数据来制定战略,从而产生自动洞察力,并持续改进和迭代。AIOps 致力于利用机器学习、自动化和大数据带来的便利,应对快速发展的 IT 环境。视频简要介绍了什么是 AIOps 及其工作原理。
AIOps 产品具有标准化的功能方法。流程的第一步是提取数据。工具必须收集来自不同系统的数据,然后以适当的方式将其聚类,使流程中的下一步工作最有效率。然后,对汇总数据进行全面分析。通过使用 ML 算法,这些工具可以检测数据块之间的模式和关系,同时识别系统内的根本问题和焦点。在下一阶段,AIOps 希望运用其 "批判性思维技能",对前一阶段的分析结果做出反应。这就需要对 IT 运营进行自动优化部署,同时还利用其检测到的模式进行学习,并通过漏斗更接近潜在的痛点。这种技术一般都能提供全面的分析报告,帮助人们做出更明智的、以数据为导向的决策。
AIOps 工具
工具必须具备一定的操作能力,才能成为 AIOps 解决方案。首先,他们必须能够对来自不同来源、应用程序和基础设施的数据进行规范化处理,以便进行准确的分析。其次,这些工具必须能够理解连接组织内不同 IT 资产的逻辑流。寻找关联和合并事件同样重要,因为这可以减少人为干预,这也是 人工智能(AI)的本质。AIOps 平台的主要功能是利用遥测技术(从远程点收集数据并导入 IT 系统进行分析)来预测、预防或检测问题,然后利用机器学习来调整和完善流程。

图 1:AIOps 事件关联与分析
为什么选择 AIOps?
AIOps 可对 IT 问题进行实时分析和检测,同时利用机器学习优化其方法。随着云技术的日益普及,AIOps 对优化 IT 运营将变得更加必要。AIOps 平台的价值在于其核心目的是识别模式、学习,然后通过使用无需人工干预的机器学习框架改进其检测 IT 问题的方法。不过,AIOps 并不仅限于发出警报,它还负责对检测到的基础设施问题采取行动。
AIOps 最有力的配合之一就是不断努力提高 云的安全性。鉴于与威胁情报数据源的整合,AIOps 有能力预测甚至避免对云框架的攻击。AIOps 还可以在安全事件管理自动化方面发挥重要作用,安全事件管理是在 IT 环境中识别和编译安全事件的过程。通过人工智能的优势,AIOps 可以发展事件管理流程,从而改革可观测性和警报方法。欺诈检测当然也是 AIOps 的一个用例,因为这在传统上需要通过筛选数据和使用预测分析来形成对欺诈的正确检测,过程十分繁琐。将这一过程中所要求的大量输入和数据来源自动化,将为组织节省时间和成本。在最简单的自动化用例中,AIOps 可以根据为数据定义的特定规则和类别来监控和 "标记 "数据。
该演示深入探讨了 AIOps 的工作原理,并可为准备实施的人员提供 AIOps 用例和培训。
AIOps 的优势
在 AIOps 提供的众多优势中,最明显的可能就是将几种不同的监控工具功能聚合在一处。随着监控环境变得越来越复杂,最大的挑战之一就是必须在五到十个监控工具中进行搜索,才能找出根本原因。AIOps 提供了一个单一平台,在这个平台上,异构数据源之间的所有数据都被规范化并关联起来,这样,在一个仪表板上显示所有数据就更合乎逻辑了。
最令人担忧的问题之一是监控工具中的警报数量越来越多,以及如何管理这些警报。这就是 AIOps 发挥作用的地方。拥有一个由 ML 算法驱动的工具,它能持续调整和积累知识,有助于组织这些警报,并为组织节省有效完成这项工作所需的时间和人力资本。AIOps 有助于减少停机时间,同时还能识别问题和警报并确定其优先级。
AIOps 还有一项人类不具备的特殊能力:预测分析。如前所述,AIOps 流程的初始阶段之一是汇编和分析数据。这项技术能够利用所提供的数据做出明智的自动决策。更进一步,AIOps 能够预测未来的问题,并在这些问题对性能产生负面影响之前加以纠正。
总之,这些优势和用例证明,广泛采用 AIOps 来提高 IT 运营效率是合理的。
AIOps 解决方案
SD-WAN 和 AIOps
近年来, SD-WAN(即软件定义广域网)为广域网架构带来了很多便利,增加了灵活性、弹性并降低了成本。COVID-19 病毒式爆发进一步加速了这一宝贵机制的采用,因为网络连接成为企业的头等大事。虽然这减少了部署过程中对昂贵 IT 人力的需求,但检测和解决广域网中断的问题依然存在。这就是 AIOps 在 SD-WAN 领域的优势所在。自动事件关联与 SD-WAN 集成后,将有助于在环境中准确定位网络问题,而这种环境由于弹性较高,往往会掩盖故障。利用人工智能的系统可以处理大量数据,并通过预测分析识别最复杂的红色信号。AIOps 无疑是扩大 SD-WAN 功能和效率范围的手段。
Palo Alto Networks 通过 Prisma SD-WAN 在 AIOps 方面取得了长足进步。传统的 SD-WAN 侧重于实现从 多协议标签交换 (MPLS)的转变,以削减成本,但 Palo Alto Networks 相信下一代解决方案能够交付自动化、更低的总体拥有成本、更高的应用性能以及丰富的云交付的安全和网络服务。Prisma SD-WAN 最近发布的强大的新 AIOps 增强 功能包括事件关联和分析、改进的仪表板视图以及向第三方采集器输出遥测数据。随着组织规模的不断扩大,网络运营的简单化和自动化变得前所未有的重要。
Gartner 有一份《AIOps 平台市场指南》,对供应商进行了评估,并为领导者提供了有关人工智能驱动的技术与 ML 和预测分析如何使组织的 IT 运营受益并进而节约成本的见解。随着 AIOps 平台的持续增长,Gartner 还提供了发展趋势和主要发现。Prisma SD-WAN 具有 AIOps 功能,可帮助减少繁琐的网络操作并使其自动化。Prisma SD-WAN 最近在 2021 年 Gartner 广域网边缘基础设施魔力象限 报告中被评为 "领导者"。
进一步了解如何利用 Prisma SD-WAN简化网络运营。