当前位置:问答库>论文摘要

问题:

题目:关联分析中的价值模式挖掘与应用研究

关键词:关联规则;兴趣度指标;余弦度量;余弦价值模式;条件反单调性

参考答案:

  参考解析

关联分析最初来源于对超市购物篮的分析,主要用于发现数据集中项与项之间的相关联系。由于发现的规则形式简洁易于理解,近年来,关联分析已经成为数据挖掘领域的一个热点。关联规则挖掘主要采用“支持度-置信度”框架,这种挖掘策略会产生许多冗余的模式,其中可能包含大量无用的,甚至误导的、错误的模式。有鉴于此本文对关联分析领域的算法及评价指标进行了深入的研究和讨论,力求发现那些真正有“价值”的模式。本文的主要内容如下所述:本文首先分析讨论了数据挖掘技术产生的背景及实际应用,接着介绍了关联分析的提出背景、关联规则挖掘的应用、关联规则挖掘算法的研究现状、及衡量关联模式的评价指标。本文着重讨论了传统的关联规则挖掘体系——“支持度-置信度”体系在处理具有倾斜支持度分布数据时的不足,并提出采用余弦度量进行“剪枝式价值模式挖掘”。这种方法不仅能够消除交叉支持模式,还可以得到稀有的价值模式。为将余弦度量融入价值模式的挖掘过程中,本文重点讨论了余弦度量的条件反单调性,这种性质可以替代反单调性实现空间遍历剪枝。本文在FP-growth算法的基础上,提出了余弦度量的“剪枝式价值模式挖掘算法” COSI-tree。通过实验,对比了“剪枝式价值模式挖掘”算法与“评价式价值模式挖掘”算法在效率上的差异,证明COSI-tree可以在较短时间内获得支持度很低甚至为0的价值模式。而且生成的模式质量高,关联性强。最后本文将余弦价值模式应用于超图聚类中。这种聚类方法使用超图模型表示项之间的关联关系,避免了对数据集进行降维处理,从而更适用于高维数据进行聚类分析。实验证明,相比传统的基于频繁模式的超图划分聚类算法,基于余弦价值模式的超图聚类算法聚类效果好,簇内对象的相似性高。

在线 客服