关联分析一般分为两个步骤分别为

如题所述

关联分析一般分为两个步骤分别为:通过迭代找到数据库中的所有频繁项集、利用频繁项集构造出满足用户最小置信度的关联规则。

关联分析又称关联挖掘,就是在交易数据、关系数据或其他信息载体中,查找存在于项目集合或对象集合之间的频繁模式、关联、相关性或因果结构。或者说,关联分析是发现交易数据库中不同商品(项)之间的联系。

关联分析是一种简单、实用的分析技术,就是发现存在于大量数据集中的关联性或相关性,从而描述了一个事物中某些属性同时出现的规律和模式。关联分析是从大量数据中发现项集之间有趣的关联和相关联系。关联分析的一个典型例子是购物篮分析。

该过程通过发现顾客放入其购物篮中的不同商品之间的联系,分析顾客的购买习惯。通过了解哪些商品频繁地被顾客同时购买,这种关联的发现可以帮助零售商制定营销策略。其他的应用还包括价目表设计、商品促销、商品的排放和基于购买模式的顾客划分。

可从数据库中关联分析出形如“由于某些事件的发生而引起另外一些事件的发生”之类的规则。如“67%的顾客在购买啤酒的同时也会购买尿布”,因此通过合理的啤酒和尿布的货架摆放或捆绑销售可提高超市的服务质量和效益。可以通过强化“C语言”的学习来提高教学效果。

关联规则生成

得到了频繁项集,而此时的任务就是在频繁项集里面挖掘出大于最小置信度阈值的关联规则。怎么挖呢?把频繁项集分成前件和后件两部分,然后求规则前件→后件的置信度。

如果大于最小置信度阈值,则它就是一条强关联规则。但是把频繁项集分成前件和后件的情况有很多,我们可以对其进行一些优化。减少交易个数。减少用于未来扫描事务集的大小,基本原理就是当一个事务不包含长度为志的大项集时,则必然不包含长度为走k+1的大项集。

温馨提示:答案为网友推荐,仅供参考
相似回答