拿来就能用!如何用 AI 算法提高安全运维效率? | 技术头条(18)
然后取正样例中出现次数最多的300个词 , 构成词汇表(其他词统一用特定的字符如“NSRC”替代) , 使用gensim模块的word2vec类处理 。
我们可以看看XSS Payload的部分分词情况:分类完成 , 挖掘XSS攻击 同样的 , 我们把正常样本也进行类似的处理 , 然后这里我们使用支持向量机(Support Vector Machines SVM)算法进行识别 。 SVM比较适合二分类问题 , 即我们所说的好/坏的情况 。
SVM是一种监督学习算法 , 在学习复杂的非线性方程时 , 能够提供一种更为清晰和更加强大的方式 。 之前很多有使用SVM进行图片验证码识别 , 识别的效果也是挺不错的 。
而在Python中 , 我们通过直接引入sklearn的 SVM 算法实现即可直接调用: from sklearn.svm import LinearSVC 通过已有的数据测试 , SVM数据的准确率基本上是98% , 召回率是97% 。 这时候我们就开始对日志进行分析 , 通过SVM的训练模型进行查找 , 确实发现了很多我们之前没有发现的情况 。 对发现的日志进行人工分析 , 有些场景的误报比较多 , 特别是参数值包含http请求的情况 , 这个和我们之前提取的特征有密切关系 。推荐阅读
- steam|何广智首秀金铲铲之战?上来就要PK神超红莲,这位是来搞笑的吧?
- edg战队|青史待留名!多么希望这些中国队员们能用我们中国人自己的名字
- 阴阳师|阴阳师:这几位看似过气实则偶尔确实能用 六星练度务必一直保留
- 原神|原神:托马培养方案一览,胡桃不来就算了,他总没那么大面子吧?
- 金泰相|LOL:Doinb知耻而后勇,直播苦练妖姬和佐伊,希望明年能用到
- ag战队|英雄联盟手游,拳头本来就懒得做,谁知道他怎么开窍了
- 赤色要塞|玩经典游戏《赤色要塞》魔改版:吉普车也能用激光炮,童年梦想实现了
- lpl|为什么LPL被淘汰的三支战队不能用“可惜”这个词?
- 剑网3|梦幻西游:龙宫的新经脉怪物能用吗?抗法爆属性的灵饰要涨价了
- 谛听|梦幻西游:涛哥千亿领须弥,12JN谛听合出来就是四轮车