问题:
关键词:区间数据;典型相关分析;主成分分析;科学引文数据库;文献计量学
● 参考解析
区间数据是一种重要的符号数据,其数据表中的数据单元不再是传统的数值型数据,而是一个实数域区间。采用区间数据对大规模数据进行打包处理,既能有效降低整个数据系统的规模量,又能够同时反映数据集合的集中趋势和离散程度,从而有助于从整体上把握数据集合的表现特征和内在规律。现有的区间数据处理方法在应用中会导致维数灾难、计算误差等问题。为解决这些问题,本文引进一种新的区间数据处理方法,即通过引进区间数据的点积定义的概念,推导区间数据的均值、方差和协方差的表达式,并利用Moore提出来的区间数据线性组合计算公式,目前已应用到回归分析、主成分分析中,称为全信息的区间数据回归分析及全信息的区间数据主成分分析。与现有的方法相比,全信息法由于在计算过程中考虑了区间样本内的所有信息,因此所得的计算结果是最准确的。本文将该方法延伸到典型相关分析当中,称为全信息的区间数据典型相关分析。在理论研究的基础上,本文以学科分类作为生成区间数据的标准,将全信息的区间数据主成分分析和典型相关分析应用于CSCD、JCR、ESI三个科学引文数据库的实证研究中,挖掘其中重要的内部信息规律和不同数据库之间的联系,分析我国学术期刊及国际学术期刊的总体特性和学科差异,探寻不同数据库中文献计量指标的不同内在含义,从而进一步反映我国学术期刊及科研水平整体及不同学科领域在国际上的发展地位和发展方向。上述实证研究得到了一些有益的结论,同时验证了所提出方法的实用性和有效性。
相关内容
相关标签