拿来就能用!如何用 AI 算法提高安全运维效率? | 技术头条(13)

这里具体的原理我们暂时不做解释 , 感兴趣的同学可以通过搜索引擎自行了解 。

算法实践 为了大家方便了解 , 我们提取了部分数据做一个简单的分析演示 。 这是某个系统 , 敏感接口的访问日志(IP地址和页面信息已经做了脱敏处理) , 我们现在简单的从用户的访问频次来进行分析 。

我们现在主要目的是区分正常用户和异常用户 , 这里我们并没有之前的用户数据参考 , 所以选择非监督学习的K-Means算法 。 提取特征 首先是提取特征 , 为了方便演示 , 我们这里仅使用单个维度特征(用户每天的访问次数):

我们可以先直接通过折线图看一下各个用户的访问情况 :

通过访问情况图表 , 我们只能比较直观的观察到一些比较明显的数量较多的情况 。 因为这个特征本身是数字特征 , 所以可以直接作为算法的特征 , 又是单一维度 , 也省掉了特征转换的一个过程 。 提取完特征 , 我们借助K-Means算法来进行分类 , 算法会根据业务情况将数据分为几类 , 到底分为几类需要用户指定 , 那到底几类比较合理呢?我们可以通过一些方法帮我们决定 。 比较直观和常用的方法时肘部法则(Elbow Method) , 我们来看一下运行的结果:

推荐阅读