问题:
关键词:支持向量机;文本分类;二叉搜索树;相对可分性
● 参考解析
近年来,国内外频繁发生家具和儿童玩具等消费品质量安全问题和产品召回事件,严重影响了人民生活质量和社会经济发展。消费品质量安全关系到人民群众的健康与社会的稳定发展,因此消费品质量安全问题越来越受到人们的重视。而中国作为消费品制造大国,提高消费品质量安全标准水平尤为重要,开展我国“消费品质量安全影响因子研究和标准研制”是提高我国消费品质量安全标准水平的重要基础工作。文本分类是“消费品质量安全影响因子研究和标准研制”项目的重要组成部分,是进行因子识别与案例推理、预警等工作不可缺少的前提。本文选取家具类消费品为研究对象,对其质量安全问题的现状进行研究,搜集大量出现质量安全的案例,采用本文提出的层次型多分类模型进行分类。本文的核心内容是建立用于消费品案例文本分类的分类模型,采用的是机器学习领域的支持向量机算法,该算法在文本分类领域具有良好的效果,但具有相当的复杂性,有关研究尚不尽细化、深入,故支持向量机算法成为近年来国内外学术界的研究热点及难点。本文针对消费品案例分布的特点,引入相对可分性概念,与二叉搜索树思想结合,建立了BST-SVM层次分类模型。随后,在MATLAB平台上实现本文所用的算法,使本模型得以验证,最后又将此与传统的两种分类模型进行对比实验。实验结果表明,本文的分类器模型具有良好的分类性能,其分类准确率较高。本文开创性地将支持向量机算法用于消费品案例文本的分类中,并且针对消费品案例文本的特点进行了改进,建立了层次型BST-SVM模型,对消费品案例文本分类的研究具有重要的借鉴或者指导意义。
相关内容
相关标签