当前位置:问答库>论文摘要

问题:

题目:基于粗糙集的数据挖掘方法研究

关键词:数据挖掘,粗糙集,不完备信息系统,属性约简,文本分类

参考答案:

  参考解析


粗糙集是一种长于分析和处理不完整、不确定信息的数学理论,由波兰的Z.Pawlak教授1982年提出。粗糙集理论以信息系统的形式表示研究对象,而信息系统常用数据表的形式表示,表的每一行表示一个研究对象,每一列表示一种属性。经过20多年的发展,粗糙集在理论研究方面不断完善,并且成功地应用到许多领域,如机器学习、图像处理、专家系统、模式识别、数据库知识发现(KDD)、医疗诊断、金融数据分析等。
本文首先介绍了数据挖掘技术的产生背景和研究现状, 探讨了数据挖掘的相关概念、工作步骤和关键技术。另外介绍了粗糙集的基本理论、粗糙集研究中的重要内容之一属性约简以及粗糙集理论在数据挖掘中的应用-数据属性约简方法。目前已有的大部分基于粗糙集理论的数据挖掘算法都是基于完备信息系统的,对于不一致信息系统以及数据动态变化的情况很少考虑。本文重点研究了在不完备信息系统中数据动态变化情况下的属性约简问题,针对已有算法提出了改进的算法。
本文将粗糙集应用于文本分类中,介绍了文本分类的基本内容和方法,提出了基于容差粗糙集的文本分类方法,采用基于属性重要性的属性约简算法得到分类规则,根据规则对测试文本进行了分类,得出了该方法的有效性和优越性。

在线 客服