异常日志的智能检测和分析

饶琛琳

日志易  产品研发  总监

日志易产品总监,曾任职微博系统架构师、人人网技术专家。十年互联网运维工作经验,著有《ELK Stack权威指南》、《网站运维技术与实践》,译有《Puppet 3 Cookbook》、《Learning Puppet 4》。

演讲概要

Gartner在2016年提出AIOps概念,之后IT运维各环节逐渐都有不同场景的机器学习运用。其中,最为普遍和有效的手段,是在业务KPI(关键性能指标)的异常检测、根因定位等方面。
而在基础设施层面,不管是硬件设备还是各种开源中间件,都不像业务应用可以任意改造,完备的各种日志输出是比性能指标更丰富和重要的数据源。本次分享主要介绍如何利用IT日志数据的特性,进行基础设施的异常检测和根因分析。

听众收益

1. 了解在文本检测方面常见的机器学习算法;
2. 了解IT日志在运维工作中可以利用的特性;
3. 掌握基础设施日志的异常检测算法运用场景和效果。