说明:如果访问 GitHub 比较慢的话,可以关注我的知乎账号(Python-Jack),上面的“从零开始学Python”专栏(对应本项目前 20 天的内容)比较适合初学者,其他的专栏如“数据思维和统计思维”、“基于Python的数据分析”、“说走就走的AI之旅”等也在持续更新中 ...
数据科学Apriori算法是一种数据挖掘技术,用于挖掘频繁项集和相关的关联规则。本模块重点介绍什么是关联规则挖掘和Apriori算法,以及Apriori算法的用法。此外,在小型企业场景中,我们将借助Python编程语言构建一个Apriori模型。 什么是关联规则挖掘? 如前所述 ...
随着大数据概念的火热,啤酒与尿布的故事广为人知。我们如何发现买啤酒的人往往也会买尿布这一规律?数据挖掘中的用于挖掘频繁项集和关联规则的Apriori算法可以告诉我们。本文首先对Apriori算法进行简介,而后进一步介绍相关的基本概念,之后详细的介绍 ...
我们发现同时购买啤酒与尿布的消费者比较多,一个可能的猜测是年轻的爸爸们在为孩子购买尿布时顺便买了啤酒。 基于上述发现,可以给我们的商品上架或者划分消费人群等提供参考。 本篇给定超市购物记录集sales_detail.csv,提取其中的交易标识符和商品名称 ...