【公卫考研公共清洁考研】不看后悔,手把手教你SAS成果解读…(公卫考研)

2023年 12月 24日 作者 gong2022 0

大数据年代,咱们吞没在了数据的海洋中,获取很大都据现已变得非常简略,谁掌控了数据,谁就掌控了将来。要发掘出这些数据不和的信息,数据分析作业尤为重要,因而咱们可以使用sas进行数据分析作业。

01?sas简介

sas的全称是statistical analysis system(计算分析体系,官网:http//:www.sas.com)。

1966年,美国农业部搜集了许多的农业数据,因而需要一种在核算机上可以快速进行分析的计算程序。美国国立清洁研讨院(nih)赞助的8所大学联合会为晓得决这个疑问研发了计算分析体系sas。sas就此诞生,这时的sas体系仅有一般线性模型分析法,已暇用于ibm大型主机。

1972年,sas软件及其运用手册初度对外揭露租借。1976年,sas公司树立,总部位于美国北卡罗来纳州,初步从事sas体系的开发、维护、出售和培训作业。80年代,sas以多元架构为要点,使其可以运转在不一样的操作体系。随后,sas功用不断增强,

版别不断更新,还打造了全新翻开云平台sas viya云平台[1]。

40多年来,sas一向占有着计算软件的高端商场,用户广泛金融、医药清洁、防护平安、政府和教育科研等领域。sas功用健壮,运转平稳,是最常用的计算分析软件之一,被称为世界标准软件。

02?sas体系的特征
?? 产品多样化;
???功用模块化;
???杰出的可移植性——广泛用于各种操作环境;
???不管何种版别,何种界面,何种操作体系,sas编程言语是相同的;
???选用输出交给体系(output delivery system,ods)增强输出。

03?sas计算办法解读–卡方查验
?? 卡方查验的三品种型?
① 独立样本列联表材料的x2查验
例1:?某研讨者欲比照膳食干与(实验组)和一般安康教育(对照组)对糖尿病患者血糖的控制合格情况,将171例糖尿病患者随机分为两组,干与6个月后成果如下表。问两组控制空腹血糖的全体合格率有无不一样?

表1 两组糖尿病患者空腹血糖合格率比照

?解析?
两组或多组率之间比照常用的查验办法为卡方查验,本题归于两独立样本率的比照,在sas中输入代码后,输出成果如下:
▲ 图1 ?2×2四格表数据
▲?图2 ?2×2四格表查验计算量
▲?图3 ?fisher切当概率法成果

?? 图1为2×2独立四格表材料的根柢描绘,每个格子中有3个数字,以第一个格子为例,“30”标明实践频数、“36.713”标明理论频数(核算公式为86×73÷171),“34.88”标明行所占百分比(核算公式为30÷86)。

???图2为2×2独立四格表材料的各种计算量,包括卡方、似然比卡方查验、接连调整卡方、mantel-haenszel卡方、phi系数、列联络数和cramer v,咱们首要重视第一个计算量卡方和第三个计算量接连调整卡方:

①当样本量n≥40,且每个格子的理论频数t≥5,选用第一个计算量卡方;
②当样本量n≥40,但有1≤t<5时,选用第三个计算量接连调整卡方;
③当样本量n<40,或有t<1时,用四格表材料的fisher切当概率法。

???图3为fisher切当概率法的成果。当需要选用fisher切当概率法时选择该表。

本题中,从第一个表中可以看出本例n>40,理论频数t>5,所以选用第一个计算量卡方,从表中可得p=0.0379,按α=0.05的水准,差异具有计算学意义,可以认为两种办法的有功率不一样。

② 配对方案材料的χ2查验
例2:?某实验室别离用乳胶凝集法和免疫荧光法对58例可疑体系性红斑狼疮患者血清中抗核抗体进行测定成果见下表。问两种办法的检测成果有无不一样?

表2 乳胶凝集和免疫荧光血清抗核抗体检测成果表

?解析?
两组或多组率之间比照常用的查验办法为卡方查验,本例为配对方案的计数材料,计数材料的配对方案常用于两种查验办法、培育办法、确诊办法的比照,因而本例选用配对方案材料的卡方查验。

sas成果如下:

▲ 图4??配对方案卡方查验成果

b+c<40,所以大约用配对四格表校正公式。sas输出成果标明:校正x2=5.78571,p=0.016157,差异具有计算学意义,可以认为两种办法的检测成果不一样。

③ 四格表材料的fisher切当概率法
例3:某医生为研讨乙型肝炎(乙肝)免疫球蛋白避免胎儿宫内感染hbv的作用,将33例乙型肝炎表面抗原(hbsag)阳性孕妇随机分为避免打针组和非避免组,成果见下表。问两组重生儿的hbv全体感染率有无不一样?

表3 两组重生儿hbv感染率的比照

?解析?
当四格表资猜中呈现n<40或t<1,或得到的概率p≈α,需改用四格表材料的fisher切当概率法。本题n<40,因而选用fisher切当概率法。sas输出成果如下:
▲ 图5 ?fisher切当概率法成果

本题比照两组重生儿的hbv全体感染率有无不一样,故应选用双侧查验,选择双侧查验成果。当需要进行单侧查验时,选择上面的单侧查验成果。由表可知,p=0.1210,差异没有计算学意义,尚不能认为避免打针与非避免的重生儿hbv的感染率不一样。

04?sas计算办法解读–秩和查验

例1:?选用配对方案,用两种饲料喂8对大鼠后,测得其肝中维生素a的含量(iu/mg)如下表。问不一样饲料大鼠肝中维生素a的含量有无不一样?

表4 ?不一样饲料组肝中维生素a的含量

?解析?
sas成果如下:
▲ 图6?正态性查验成果
▲?图7 秩和查验计算量成果

?? 图6是正态性查验的成果,因为该材料归于小样本数据,所以在正态性查验中咱们读取shapiro-wilk的成果,p=0.0370,故材料不遵守正态分布。

?? 图7的查验成果给出了t查验、符号查验和符号秩查验,因为本例归于配对方案,而且不遵守正态分布,所以咱们首要重视符号秩查验的成果,p=0.0156,差异有计算学意义,可认为两种饲料大鼠肝中维生素a的含量不一样。

例2:?在某大学随机搜集12岁男童和女童各10名的头发样品,检测发样中钙(ca)含量(ug/g),数据如下表。男童与女童头发中ca含量有无差异?

表5 12岁男童与女童发样中ca含量(ug/g)的比照

?解析?
sas成果如下:
▲ 图8 ?正态性查验成果
▲?图9 ?正态性查验成果
▲?图10 ?wilcoxon秩和查验成果
▲?图11 ?kruskal-wallis查验成果

?? 图8为男童发样中ca(μg/g)的含量的正态性查验成果,p=0.0002,故不遵守正态分布。

???图9为女童发样中ca(μg/g)的含量的正态性查验成果,p=0.0088,故不遵守正态分布。因而本例选用秩和查验。

???图10为双样本查验成果,本题谈论男童与女童头发中ca含量有无差异,应选择双侧查验成果,p=0.0376,差异具有计算学意义,可以认为12岁男童和女童头发中ca(μg/g)的含量不一样。

?? 假定组别数多于两组时,咱们选择图11中的kruskal-wallis查验的成果进行分析。

例题来历
医学计算学第5版、清洁计算学第8版

参阅文献:
[1] 胡良平. sas实验方案与计算分析[m].北京:公民清洁出书社,2010:45-170,565-573.