机器学习入门必读:6种简单实用算法及学习曲线、思维导图( 五 )

关联分析最典型的应用就是购物车分析 。 我们可以从用户的订单中寻找经常被一起购买的商品 , 并挖掘这些商品之间的潜在关系 , 这样有助于线上、线下商家指定购买与销售策略 。

最著名的关联分析算法就是Apriori算法和FP-growth算法 。 Apriori算法就是根据有关频繁项集特性的先验知识而命名的 。 它使用一种称作逐层搜索的迭代方法 。 而FP-growth是针对Apriori算法的改进算法 , 通过两次扫描事务数据库 , 把每个事务所包含的频繁项目按其支持度降序压缩存储到FP-tree中 。

在以后发现频繁模式的过程中 , 不需要再扫描事务数据库 , 而仅在FP-tree中进行查找即可 , 并通过递归调用FP-growth的方法来直接产生频繁模式 , 因此在整个发现过程中也不需产生候选模式 。 该算法克服了Apriori算法中存在的问题 , 在执行效率上也明显好于Apriori算法 , 同时能生成有向关系 , 比Apriori更为泛用 。

5. 集成算法

前面几节介绍了常见的机器学习算法 , 但是我们会发现每个单独的机器学习算法往往只能解决特定场景下的特定问题 , 如果问题会变得更为复杂 , 就难以使用一个学习器达到目标 。 这时候我们就需要集成多个学习器 , 协同完成机器学习任务 。

推荐阅读