什么是 AIOps

AIOps 定义

AIOps 是 "IT 运营人工智能 "的缩写。它指的是利用 机器学习(ML) 和分析技术实现 IT 运营自动化的平台。AIOps 利用运营设备的大数据,具有即时检测和响应问题的独特能力。利用 ML 的强大功能,AIOps 可通过各种形式的数据来制定战略,从而产生自动洞察力,并持续改进和迭代。AIOps 致力于利用机器学习、自动化和大数据带来的便利,应对快速发展的 IT 环境。视频简要介绍了什么是 AIOps 及其工作原理。

AIOps 产品具有标准化的功能方法。流程的第一步是提取数据。工具必须收集来自不同系统的数据,然后以适当的方式将其聚类,使流程中的下一步工作最有效率。然后,对汇总数据进行全面分析。通过使用 ML 算法,这些工具可以检测数据块之间的模式和关系,同时识别系统内的根本问题和焦点。在下一阶段,AIOps 希望运用其 "批判性思维技能",对前一阶段的分析结果做出反应。这就需要对 IT 运营进行自动优化部署,同时还利用其检测到的模式进行学习,并通过漏斗更接近潜在的痛点。这种技术一般都能提供全面的分析报告,帮助人们做出更明智的、以数据为导向的决策。

 

AIOps 工具

工具必须具备一定的操作能力,才能成为 AIOps 解决方案。首先,他们必须能够对来自不同来源、应用程序和基础设施的数据进行规范化处理,以便进行准确的分析。其次,这些工具必须能够理解连接组织内不同 IT 资产的逻辑流。寻找关联和合并事件同样重要,因为这可以减少人为干预,这也是 人工智能(AI)的本质。AIOps 平台的主要功能是利用遥测技术(从远程点收集数据并导入 IT 系统进行分析)来预测、预防或检测问题,然后利用机器学习来调整和完善流程。

图 1:AIOps 事件关联与分析

 

为什么选择 AIOps?

AIOps 可对 IT 问题进行实时分析和检测,同时利用机器学习优化其方法。随着云技术的日益普及,AIOps 对优化 IT 运营将变得更加必要。AIOps 平台的价值在于其核心目的是识别模式、学习,然后通过使用无需人工干预的机器学习框架改进其检测 IT 问题的方法。不过,AIOps 并不仅限于发出警报,它还负责对检测到的基础设施问题采取行动。

AIOps 最有力的配合之一就是不断努力提高 云的安全性。鉴于与威胁情报数据源的整合,AIOps 有能力预测甚至避免对云框架的攻击。AIOps 还可以在安全事件管理自动化方面发挥重要作用,安全事件管理是在 IT 环境中识别和编译安全事件的过程。通过人工智能的优势,AIOps 可以发展事件管理流程,从而改革可观测性和警报方法。欺诈检测当然也是 AIOps 的一个用例,因为这在传统上需要通过筛选数据和使用预测分析来形成对欺诈的正确检测,过程十分繁琐。将这一过程中所要求的大量输入和数据来源自动化,将为组织节省时间和成本。在最简单的自动化用例中,AIOps 可以根据为数据定义的特定规则和类别来监控和 "标记 "数据。

该演示深入探讨了 AIOps 的工作原理,并可为准备实施的人员提供 AIOps 用例和培训。

 

AIOps 的优势

在 AIOps 提供的众多优势中,最明显的可能就是将几种不同的监控工具功能聚合在一处。随着监控环境变得越来越复杂,最大的挑战之一就是必须在五到十个监控工具中进行搜索,才能找出根本原因。AIOps 提供了一个单一平台,在这个平台上,异构数据源之间的所有数据都被规范化并关联起来,这样,在一个仪表板上显示所有数据就更合乎逻辑了。

最令人担忧的问题之一是监控工具中的警报数量越来越多,以及如何管理这些警报。这就是 AIOps 发挥作用的地方。拥有一个由 ML 算法驱动的工具,它能持续调整和积累知识,有助于组织这些警报,并为组织节省有效完成这项工作所需的时间和人力资本。AIOps 有助于减少停机时间,同时还能识别问题和警报并确定其优先级。

AIOps 还有一项人类不具备的特殊能力:预测分析。如前所述,AIOps 流程的初始阶段之一是汇编和分析数据。这项技术能够利用所提供的数据做出明智的自动决策。更进一步,AIOps 能够预测未来的问题,并在这些问题对性能产生负面影响之前加以纠正。

总之,这些优势和用例证明,广泛采用 AIOps 来提高 IT 运营效率是合理的。

 

AIOps 解决方案

SD-WAN 和 AIOps

近年来, SD-WAN(即软件定义广域网)为广域网架构带来了很多便利,增加了灵活性、弹性并降低了成本。COVID-19 病毒式爆发进一步加速了这一宝贵机制的采用,因为网络连接成为企业的头等大事。虽然这减少了部署过程中对昂贵 IT 人力的需求,但检测和解决广域网中断的问题依然存在。这就是 AIOps 在 SD-WAN 领域的优势所在。自动事件关联与 SD-WAN 集成后,将有助于在环境中准确定位网络问题,而这种环境由于弹性较高,往往会掩盖故障。利用人工智能的系统可以处理大量数据,并通过预测分析识别最复杂的红色信号。AIOps 无疑是扩大 SD-WAN 功能和效率范围的手段。

Palo Alto Networks 通过 Prisma SD-WAN 在 AIOps 方面取得了长足进步。传统的 SD-WAN 侧重于实现从 多协议标签交换 (MPLS)的转变,以削减成本,但 Palo Alto Networks 相信下一代解决方案能够交付自动化、更低的总体拥有成本、更高的应用性能以及丰富的云交付的安全和网络服务。Prisma SD-WAN 最近发布的强大的新 AIOps 增强 功能包括事件关联和分析、改进的仪表板视图以及向第三方采集器输出遥测数据。随着组织规模的不断扩大,网络运营的简单化和自动化变得前所未有的重要。

Gartner 有一份《AIOps 平台市场指南》,对供应商进行了评估,并为领导者提供了有关人工智能驱动的技术与 ML 和预测分析如何使组织的 IT 运营受益并进而节约成本的见解。随着 AIOps 平台的持续增长,Gartner 还提供了发展趋势和主要发现。Prisma SD-WAN 具有 AIOps 功能,可帮助减少繁琐的网络操作并使其自动化。Prisma SD-WAN 最近在 2021 年 Gartner 广域网边缘基础设施魔力象限 报告中被评为 "领导者"。

进一步了解如何利用 Prisma SD-WAN简化网络运营。

 

AIOps 常见问题

AIOps 或 IT 运营人工智能(Artificial Intelligence for IT Operations)不同于传统的 IT 运营管理,它利用人工智能和机器学习来分析大量实时数据。传统的 IT 运营通常依赖人工流程和被动应对方法,而 AIOps 可提供预测性洞察力,自动执行常规任务,并能主动解决问题,从而更快地发现问题,提高整体效率。
AIOps 平台的关键组成部分包括从各种来源(日志、指标、事件)摄取数据、实时数据处理、用于模式识别和异常检测的机器学习算法、关联相关事件的关联引擎、用于补救的自动化工具以及用于可视化和报告的仪表板。这些组件可实现持续监控、预测分析和自动事件响应。
是的,AIOps 可以通过自动化日常任务、减少人工干预的需要,以及通过预测分析最大限度地减少停机时间,帮助降低 IT 成本。通过在影响业务之前发现并解决问题,AIOps 可以最大限度地减少用于事件管理的时间和资源,优化 IT 运营,并能更有效地利用基础设施,最终降低总体运营成本。
AIOps 通过提供一个统一的平台,提供对 IT 运营的实时洞察力和可见性,从而改善 IT 部门与其他业务部门之间的协作。借助 AIOps,利益相关者可以访问相关数据,了解 IT 性能如何影响业务成果,并在解决问题和决策过程中进行更有效的协作。这种透明度有助于更好地协调 IT 与业务目标。
从采用 AIOps 中获益最多的行业包括金融、医疗保健、电信、零售和制造业。这些行业通常需要处理大量数据、复杂的 IT 基础设施,以及对高可用性和高性能的需求。AIOps 可帮助这些行业缩短事件检测和解决时间,确保合规性,提升客户体验,并支持数字化转型计划。
下一页 什么是 NGFW 的 AIOps?