统计计算课程设计报告_第1页
统计计算课程设计报告_第2页
统计计算课程设计报告_第3页
统计计算课程设计报告_第4页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、.题型一:1 、某医生随机抽取正常人和脑病病人各 11 例,测定尿中类固醇排出量( mg/dl ),结果如表 1。该医生根据此资料算得正常人尿中类固醇排出量的均数 =4.266mg/dl ,标准差 S1=0.985mg/dl ;脑病病人尿中类固醇排出量的均数 =5.732mg/dl ,标准差 S2=1.626mg/dl ,配对 t 检验结果, t = 3.098 ,P 0.05 ,脑病病人的尿中类固醇排出量的正态性统计量W的 P 值为:0.54040.05 。所以正常人和脑病病人的尿中类固醇排出量都通过正态性检验,即正常人和脑病病人的尿中类固醇排出量的分布都服从正态分布。我们再观察两个QQ图(

2、图 1.3 ,图 1.4 ),可见两个图的星号大多数覆盖在加号上,这也就说明了正常人和脑病病人的尿中类固醇排出量的分布都服从正态分布。我们于是选择使用两样本T 检验。图 1.5T检验输出结果如图 1.5的输出结果,首先是方差齐性检验。从Equality of Variances的表中 F 统计量值为 2.72 对应的P 值为 0.1298,这比显著性水平0.05 大。说明了两组样本方差齐性。再进行T 检验。由于我们已知方差齐性,我们选用 Pooled 检验方法,统计量 T 为 -2.56 ,对应的 P 值为 0.0188 小于显著性水平 0.05 。这说明正常人和脑病病人的尿中类固醇排出量有显

3、著差异。同时我们通过题目中的两组样本的均值,正常人尿中类固醇排出量的均数 =4.266mg/dl ;脑病病人尿中类固醇排出量的均数=5.732mg/dl 。脑病病人尿中类固醇排出量高于正常人。2、某研究者为研究核黄素缺乏对尿中氨基氮的影响,将 60 只 Wistar 大白鼠随机分为核黄素缺乏、限食量、不限食量三组不同饲料组。每组20 只大白鼠。一周后测尿中氨基氮的三天排出量,结果如表 2。该研究者对上述资料采用了两样本均数t 检验进行两两比较,得出结论:三组之间均数.差异均有统计学意义( P0.05)。检验进行两两比较, 得出结论:三组之间均数差异均有统计学意义( P |Z| 0.0001。三

4、组之间均数差异均有统计学意义。说明这三组不同饲料组的大白鼠进食一周后尿中氨基氮的三天排出量(mg)是有差别的。最后我们用Bonferroni法进行多重比较来考察三组中差别所在,程序如下:procrankdata =researcherout =reout;var Wistar;ranksr;procanova data =reout;classn;model r=n;means n/ bon;run ;输出结果如下:图 2.3 多重比较结果结果显示这三组不同饲料组的大白鼠进食一周后尿中氨基氮的三天排出量(mg)两两不同。并且可以看出不限食量组的大白鼠进食一周后尿中氨基氮的三天排出量(mg)最大

5、,核黄素缺乏组次之、限食量组最小。3、某医师用改良的Seldinger s插管技术对 8 例经临床和病理证实的恶性滋养细胞肿瘤进行选择性盆腔动脉插管灌注化疗。测定治疗前后血中的HCG含量如表 3。该医师考虑到数据相差较大,采用对数变换后进行两样本均数比较的t 检验,得 t =2.460 ,P0.05 ,差异有统计学意义,故.认为治疗前后血中HCG的含量有差别。表 3灌注化疗前后 HCG含量测定结果( pmol/L )病例号灌注前( X)灌注后(X)lg Xlg X1212112800002100006.10725.322227550033004.87793.518531245022104.09

6、523.3444415000009.36.17610.968551000025004.00003.39796970012033.98683.080371558848254.19283.6835842239143.62562.9609【问题 3】 1 、这是什么资料 ?2、该实验属于何种设计方案?3、该医师统计方法是否正确?为什么?请用SAS程序和 SAS结果解释原因。【答】1、这是成对组(配对)数据的资料。2、该实验属于配对比较设计方案。3、该医师统计方法是不正确的,分析如下首先我们先观察X1,X2 的平均数和方差。程序如下:dataSeldingers;inputX1 X2 lgX1 lgX

7、2;cards ;12800002100006.10725.32227550033004.87793.51851245022104.09523.344415000009.36.17610.96851000025004.00003.3979970012033.98683.08031558848254.19283.683542239143.62562.9609run ;procmeans data = Seldingers;.var X1 X2;run ;输出结果如下:图 3.1 均值与方差输出结果由输出结果可以看出X1 的均值为363432.63 较 X2 的均值 28120.16 的大,同时X

8、1 的方差 636737.67 也比 X2的方差73505.72 的大。我们可以判定两样本X1 与 X2 不等方差。我们进行方差齐性检验。同时我们可以进行对数变换消除异方差。也进行对数变换后的方差齐性检验。程序如下:/* 整理数据将X1和 X2重命名在 X下并以 i=1,2 分别进行分组*/* 目的是用 anova 过程进行方差齐性检验*/dataanse;set Seldingers(rename=(X1=X) rename=(lgX1=lgX);i= 1; output ;set Seldingers(rename=(X2=X) rename=(lgX2=lgX);i= 2; output

9、 ;keep X lgX i;run ;procprintdata =anse; run ;procanova data =anse;classi;anse 数据集显示model X lgX=i;means i/hovtest=bartlett;/* 方差齐性检验*/run ;变量解释: X 为样本, lgX 为变换后样本, i=1 代表灌注化疗前 HCG含量测定结果( pmol/L ),i=2 代表灌注化疗后 HCG含量测定结果( pmol/L )。方差齐性检验输出结果:XlgX图 3.2 方差齐性检验结果由于 p-value0.0001 ,小于显著性水平 0.05 。更加进一步说明 X 与

10、 X 不等方差。即灌注化疗前后HCG含12量测定结果( pmol/L )的方差是非齐性的。于是我们对样本进行对数变换。这也正是该医生进行的对数变换。我们再一次进行检验后结果显示p-value=0.6501 大于显著性水平0.05 。说明两样本方差齐性,即对数变换后的灌注化疗前后 HCG含量测定结果( pmol/L )方差齐性。由题目样本可以知道 lgX1, lg X2 间是存在部变化关系,所以我们并不能认为lg X1, lg X2 是独立的,有在关系的,并且是成对出现的。而该医生进行的两样本均数比较的t检验是用于独立样本组检验。显然该医生的统计方法不正确。.现令 diff= lgX1-lg X

11、2,对 diff进行正态性检验并进行分析:程序如下:dataSe;set Seldingers;diff=lgX1-lgX2;procprintdata =Se; run ;procunivariatedata =Se normal ;var diff;run ;Se 数据集显示输出结果如下:图 3.3univariate过程结果显示由于样本量为8,属于小样本,所以观察Shapiro-Wilk检验结果(图3.3 ):在 0.05 的显著性水平下,对数变换后的差值的正态性统计量W=0.56,对应的P 值小于 0.0001 ,这说明对数变换后的差值不属于正态分布。于是进行Wilcoxon 符号秩检

12、验。Wilcoxon 符号秩统计量M=4,对应的P 值为 0.00780.05 ,拒绝 diff为 0 的假设。即可以说明差异有统计学意义。也就是对数变换后两组样本的有区别的。最后也就说治疗前后血中HCG的含量有差别。.题型二: 设有一个由两个服务台串联组成的服务机构(双服务太串联排队系统)。顾客在第一个服务台接受服务后进入第二个服务台,服务完毕后离开。假定顾客达到第一个服务台的时间间隔是均值为 1 分钟的指数分布,顾客在第一个和第二个服务台的服务时间分别是均值为0.7 分和0.9 分的指数分布。请模拟这种双服务台串联排队系统(分别模拟600 分和 1000 分的系统);并估计出顾客在两个服务

13、台的平均逗留时间和排队中的顾客平均数。分析: 该模拟可看成是一个关于顾客的属性(第几名顾客,等待状态,服务状态,离开状态,状态的改变)与时间之间的关系。假定条件: 顾客是无限的,并且在模拟时,只是模拟0 到 600 分或 1000 分这时间段的顾客的状态的变化。流程图如图4.1( 1)估计顾客在两个服务台的平均逗留时间设定主要变量:达到第一个服务台的时间间隔:e,顾客在第二服务台前等待时间:wait2,顾客到达时刻:T_arrive,顾客接受第二服务台服务时间:T_in2,顾客在第一服务台前等待时间:wait1,顾客接受第一服务台服务时间:serve2,顾客进入第一服务台时刻:T_in1,顾客

14、离开时刻:T_leave2,顾客接受第一服务台服务时间:serve1,顾客逗留时间:stay,顾客离开第一服务台时刻:T_leave1,顾客服务时间:serveSAS程序:datacounter;arrayT( 5) T_arrive T_in1 T_leave1 T_in2 T_leave2;arrayTI(4) wait1 serve1 wait2 serve2;max_time= 600;seed= 3;do n= 1 to1000 ;T_arrive=0;T_leave1= 0;T_leave2= 0;wait1= 0;serve1= 0;wait2= 0;serve2= 0;do w

15、hile (T( 1)max_timethen T( 1)=max_time;ifT( 1)max_timethendo;T( 3)=max_time;TI( 2)=T( 3)-T( 1)-TI(1);.end;ifT( 3)max_timethen T( 4)=max_time;T( 5)=T( 3)+TI(3)+TI(4);ifT( 5)max_timethendo;T( 5)=max_time;TI( 4)=T( 5)-T( 4);end;stay=T( 5)-T( 1);serve=TI(2)+TI(4);output ;end;end;procprintdata =counter;w

16、here ( n=1);var e T_arrive wait1 T_in1 serve1 T_leave1 wait2 T_in2 serve2 T_leave2 stay serve;run ;procmeans data =counternoprint;var wait1 serve1 wait2 serve2 serve stay;classn;outputout =outC mean=mean_wait1 mean_serve1 mean_wait2 mean_serve2 mean_serve mean_stay;run ;procmeans data =outC mean;var

17、 mean_wait1 mean_serve1 mean_wait2 mean_serve2 mean_serve mean_stay;where ( n0); run ;.开始设定初值到达时间T_arrive 0=0, 进入第一服务台时间T_in1 0=0,离开第一服务台时间T_leave1 0=0,进入第二服务台时间T_in1 0=0,离开服务台 T_leave20=0,第 i 个人的顾客达到第一个服务台的时间间隔是ei : e(1),顾客在第一个和第二个服务台的服务时间分别是 serve1i : e(10 / 7) , serve2i : e(10 / 9)T_arrive i= T_a

18、rrive i-1 +ei否T_arrive i T_leave1i -1?是该顾客在第一服务台前等待时间 wait1 i=T_arrive i -T_leave1i -1 进入时刻 T_in1 i= T_leave1 i-1该顾客离开第一个服务台的时间T_leave1i= T_in1 i+serve1i否T_leave1i T_leave2 i-1?是该顾客在第一服务台前等待时间 wait2 i=T_leave1 i-T_leave2 i-1 进入时刻 T_in1 i= T_leave2 i-1该顾客离开第一个服务台的时间T_leave1i= T_in1 i+serve2i是T_arrive

19、 imax_time?否对 T_arrive ,T_in1 ,T_leave1 ,T_in2 ,T_leave2大 于 max_time 的 都 数 令 其 等 于 max_time, 并 且wait1=T_in1-T_arrive , serve1= T_leave1- T_in1 , wait2=T_in2-T_leave1 ,serve2= T_leave2- T_in2 。wait1 i=0T_in1 i= T_arrive iwait2 i=0T_in2 i = T_leave1i计算顾客在两个服务台的平均逗留时间 stay=T_leave2- T_arrive, 服务时间 serv

20、e= serve1+ serve2.图 4.1流程框图输出结果及分析系统模拟部分结果输出(图4.2 ):图 4.2部分 counter数据集各变量均值输出结果(图4.3 ):图 4.3 600 分 means过程输出结果 1由图 4.3 可知,这种双服务台串联排队系统的600 分钟情况下,模拟估计出每名顾客在第一服务台的平均排队时间为:1.5751226 ,在第一服务台的平均接受服务时间为:0.6947977 ;每名顾客在第二服务台的平均排队时间为: 6.6817698 ,在第二服务台的平均接受服务时间为:0.8824689 ,平均顾客在两个服务台服务时间为:1.5772665 ,所以平均顾客

21、在两个服务台的总逗留时间为:9.8341590 。同样的可以得出1000 分系统各变量均值(如图4.4 )图 4.4 1000分 means过程输出结果1由图 4.4 可知,这种双服务台串联排队系统的1000 分钟情况下, 模拟估计出每名顾客在第一服务台的平均排队时间为:1.6007557 ,在第一服务台的平均接受服务时间为:0.6974116 ;每名顾客在第二服务台的平均排队时间为: 7.1837529 ,在第二服务台的平均接受服务时间为:0.8884401 ,平均顾客在两个服务台服务时间为:1.5858517 ,所以平均顾客在两个服务台的总逗留时间为:10.3703603 。.( 2)排队

22、中的顾客平均数排队中的顾客平均数计算方法:时间作为自变量,排队人数作为因变量。并且某一时刻有一名顾客到达服务台或者离开第一服务台准备接受第二服务台服务时,排队人数加1,某一时刻有一名顾客正好进入服务台接受服务时,排队人数减1。设定变量:状态改变时刻: TT第一服务台前等待人数:cumi两服务台前等待人数: waiting状态持续时间: diffT第二服务台前等待人数:cumkSAS程序:datanumberA;k=0;i=1; set counter(rename=(T_arrive=TT);output;i=- 1; setcounter;TT=T_in1;output ;keep n i k TT max_time;datanumberB;i= 0;k= 1; set counter(rename=(T_leave1=TT);output;k=- 1; setcounter;TT=T_in2;output ;keep n i k TT

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论