您当前的位置:首页>论文资料>面向临床检验信息系统数据挖掘的因子分析

面向临床检验信息系统数据挖掘的因子分析

资料类别:论文资料

文档格式:PDF电子版

文件大小:257.92 KB

资料语言:中文

更新时间:2024-12-20 15:02:42



推荐标签:

内容简介

面向临床检验信息系统数据挖掘的因子分析 热求净发用
学术论坛
面向临床检验信息系统数据挖掘的因子分析
张维朋
(宁波大红鹰学院机电分院浙江宁波315000)
摘要:针对临床检验信息系统的数据信息量大,利用率低的问题,选取大量健康女性血液生化指标数据,送用限子分析法从女性的血液生化指标 TP、ALB、ALP、GLU、UA、CHOL、TG、Ca和年龄等9个指标中提取了6个至不相关的公共图子,这6个因子可以代表原始指标的85.413%信息。通过正交旋转后,6个因子的实际更意义清晰,依次反映女性的个体营养状况和肝脏合成功能、胆固醇代谢、糖代谢、骨代谢、尿酸代谢、甘油三脂代谢。分析结果表明:因子分析法定量描述生化指标之间的关系,能够为女性健康水平提供综合评价。
关键调:数据挖据因子分析生化指标正交旋转
文献标识码:A文章编号:1007-9416(2011)05-0097-03
中图分类号:R319
随着现代信息技术的迅速发展,医院临床检验系统积累了大量的数据,这些宝贵的医学信息资源对于疾病的预防和医学研究是非常有价值的。如何从这些数据中挖掘潜在的知识与规律,数据挖掘的理论和方法为我们提供了有效途径。因子分析是数据挖据中的一个重要研究领域。因子分析法是研究原始变盘的内部关系,通过寻找变量的共同因子来简化和分析变量中存在的复杂关系",是一种探索不易观测或不能观测的潜在因素,用有限个隐变量来解释原始变量之间相关关系的技术。女性由于具有自身生理特殊性,一生经过青春期、孕期、绝经期、老年期,在这个过程中卵巢功能逐渐衰退导致雌激素分泌量下降,临床上表现免疫系统,心血管系统、内分泌系统、神经系统,骨质疏松等症状,面这些症状可以通过血清中的一些生化指标的变化得到体现。习
本文应用因子分析法对大量临床检验信息系统数据信息的女性生化指标进行数据挖据,寻找有高度相关关系的变量群,定量分析各属性之间的关系,找出描述系统本质特征因素,为女性预
防保健和评价女性健康水平提供参考依据。 1、研究的方法
1.1因子分析的基本原理
因子分析思想是根据相关性的大小将变量分组,使组内变量间的相关性较高,不同组的变量相关性较低。因子分析的目的是从一些错综复杂的关系问题中找出少数几个主要因子,每个因子代表原始变量间相互依龄的一种作用。这些彼此不相关的因子代替原来较多高度相关的原始随机变量,同时这些主要因子尽可能多的反映原始变量的信息用。
1.2研究数据
本文收集了准北矿工总医院2010年1-6月期间,19-97岁1159 例健康女性的生化数据。采用日历7800和7600-020全自动生化仪检测。
选取女性生化指标中的总蛋白(totalprotein,TP),白蛋白(albumin,ALB),碱性磷酸酶(alkalinephosphatase,ALP),葡萄糖(glucose,GLU),尿酸(uria acid,UA),总胆固醇(cholesterol CHOL),甘油三酯(triglyeried,TC),钙(calciumand,Ca)及女性年龄9个指标,采用DPS7.05软件进行处理。
1.3因子分析过程
(1)因子分析检验;因子分析的前提是要求原变量之间应具有较强的相关关系,否则就不能运用因子分析法。本文检验方法采用Bartlett球度和KMO检验[5]。Bartlett球度检验是假设相关系数矩阵是一个单位阵,如果统计量值比较大,且其相对应的概率值小于用户指定的显著性水平,拒绝原假设,认为适合作因子分析。反之,接受原假设,不适合作因子分析。本例Bartlett球形检验的卡方值为1909.8453,p=0.0001<0.01.拒绝原假设,适合做因子分析。KMO是通过比较相关系数和偏相关系数的大小来评估
万方数据
样本量是否充足,其取值范围0-1,其取值越大越好,取值越小(<0.6),说明不适合做因子分析。一般KM0>0.8时效果最好,本例KM0=0.6511,可进行因子分析。
(2)相关系数矩阵
[% JaY..Yap
设原始数据矩阵为Y:Y
y..ya.
y
n为样本数,P为观测变量数,
本文n=552,P=9。本文中变换还包括定性数据的量
化:令女性=2,男性=1。将原始数据进行标准化处理:
-(=1,, 1,, ) (1)
S
其中:
1
ye n
设相关矩阵为R:
R
其中:
s"
-1
[1·riz ra
Fe?
yt-x
(2)
1
x,X(i,j=1,2...p) n-1台
(3)求特征值,确定主因子数;设特征值为
>>..>≥0 用雅可比方法求特征方程
R-=0
上一章:基于数据挖掘的试验数据利用研究 下一章:电子政务应用关键成功因素实证研究

相关文章

GB/T 41818-2022 信息技术 大数据 面向分析的数据存储与检索技术要求 DL/T 698.45-2017 电能信息采集与管理系统 第4-5部分:通信协议——面向对象的数据交换协议 因子分析与地统计学在化探数据分析中的应用 面向对象模型数据库系统的开发 DB33/T 893.2-2013 临床实验室信息系统 第2部分 数据传输与交换 面向对象的液压系统CAD数据库的建立 面向配电网企业的信息集成系统研究与应用 基于面向对象和数据库技术的机床选择专家系统