非参实验报告.总结.docx_第1页
非参实验报告.总结.docx_第2页
非参实验报告.总结.docx_第3页
非参实验报告.总结.docx_第4页
非参实验报告.总结.docx_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

非参数统计课程设计指导书一、课程设计的目的1.加深理解本课程的研究方法、思想精髓,提高解决实际问题的能力,熟练掌握Minitab常用统计软件的应用。2.掌握两样本Brown-Mood中位数检验法,并解决两样本中心位置的一致性检验问题.3.掌握两样本Wilcoxon秩和检验法,解决两样本中心位置的一致性检验问题。二、设计名称:不同学科的博士论文除了内容外,页数有没有不同三、设计要求1.数据来源要真实,必须注明数据的出处。2.尽量使用计算机软件分析,说明算法或过程。3.必须利用到应用回归分析的统计知识。4.独立完成,不得有相同或相近的课程设计。四、设计过程1.思考研究课题,准备搜集数据。2.确立课题,利用图书馆、上网等方式方法搜集数据。3.利用机房实验室等学校给予的便利措施开始分析处理数据。4.根据试验结果,写出课程设计报告书。5.对实验设计报告书进行完善,并最终定稿。五、设计细则1.利用的统计学软件主要为Minitab,因为其方便快捷,功能也很强大,界面美观。2.对Word文档进行编辑的时候,有些特殊的数学符号需要利用数学编辑器这款小软件进行编辑。3.数据来自较权威机构,增加分析的准确性与可靠性。4.力求主题突出,观点鲜明,叙述简洁明了。六、说明1.数据来源于21实际统计学系列教材非参数统计;2.所选取数据可能不会涉及到所学的各种分析方法,本课程设计最后会对此情况作出解释。3.同一题可以采用不同的方法来检验,从而得出更详细的分析与解释4.a=0.05姓名学号班级12金统课程名称非参数统计分析课程性质专业课设计时间2014年6月3日2014年6月17日设计名称不同学科的博士论文除了内容外,页数有没有不同设计要求1.掌握两样本Brown-Mood中位数检验法,并解决两样本中心位置的一致性检验问题。2.掌握两样本Wilcoxon秩和检验法,解决两样本中心位置的一致性检验问题。3.通过实验加深理解非参数统计在实践中的应用意义。设计思路与设计过程设计思路:先对理论部分进行掌握,再搜集数据,然后对数据进行分析处理。设计过程:先对相关定理和结论进行整理搜集数据用统计软件对数据进行处理对结果进行分析计划与进度6月3日5月10日:思考准备研究课题;6月11日5月14日:确立课题,搜集数据;6月15日6月17日:进行数据处理,并对结果进行分析,定稿。任课教师意见课程设计任务书说明1.数据来源于21实际统计学系列教材非参数统计;2.所选取数据可能不会涉及到所学的各种分析方法,本课程设计最后会对此情况作出解释3.同一题可以采用不同的方法来检验,从而得出更详细的分析与解释4.a=0.05课程设计报告课程:非参数统计分析学号:姓名:班级:12金统教师:孙丽玢江苏师范大学数学与统计科学学院观测值Mxy的数目观测值Mxy的数目合计X的样本Am-AmY的样本Bn-Bn合计A+B=tm+n-tm+n设计名称:不同学科的博士论文除了内容外,页数有没有不同日期:2014年6月16日设计内容:不同学科的博士论文除了内容以外还有什们不同呢?分别对一个大学的数学20个和经济学的18个博士论文的页数进行的抽样结果如下(单位:页数):数学:5610563887211296936510594876465688790987675经济学:8894939699799194911009990100110102959885仅仅从页数上看,这两个学科的博士论文有什么不同?(1)使用两样本Brown-Mood中位数检验法进行分析。(2)使用两样本Wilcoxon秩和检验法进行分析。设计目的与要求:1.加深理解本课程的研究方法、思想精髓,提高解决实际问题的能力,熟练掌握Minitab常用统计软件的应用。2.掌握两样本Brown-Mood中位数检验法,并解决两样本中心位置的一致性检验问题.3.掌握两样本Wilcoxon秩和检验法,解决两样本中心位置的一致性检验问题。设计环境或器材、原理与说明:设计环境器材:机房计算机Windows7系统Minitab软件原理与说明:(1)Brown-Mood中位数检验法小样本方法假设样本X1,X2,,Xm和Y1,Y2,,Yn分别取自相互独立的连续型随机变量X和Y,记X和Y的中位数分别为x0.5,y0.5Brown-Mood中位数检验法的原假设和备择假设都有三种情况,这三种情况的原假设H0都是x0.5=y0.5,而备择假设H1分别是x0.5y0.5,x0.5y0.5,将样本X1,X2,,Xm和Y1,Y2,,Yn混合在一起,记样本X1,X2,,Xm和Y1,Y2,,Yn的中位数为mxy,构成四格表:在零假设成立时,A服从超几何分布:P(A=k)=CCCmnkt-ktm-n,k=0,1,minm,t(m+n个产品,m个次品,取出t个,其中有k个次品的概率)如果A值太大或太小,则应怀疑零假设。设A的取值为a1)H0:X0.5=Y0.5,H1:X0.5Y0.5W=Ac,P=P(Aa)2)H0:X0.5=Y0.5,H1:X0.5Y0.5W=Ad,P=P(Aa)3)H0:X0.5=Y0.5,H1:X0.5Y0.5W=AcAd,P=2minP(Aa),P(Aa)大样本方法在零假设成立时,A服从超几何分布,Ah(t,m+n,m)P(A=k)=CCCmnkt-ktm-n,k=0,1,minm,t则E(A)=tmm+n,D(A)=tmn(m+n-t)(m+n)2(m+n-1)当ty1,P值=P(Zz0)222)H1:x1y1,W=WYc,P=P(WYk)22H1:x1y1,W=WYd,P=P(WYk)22H1:x1y1,W=WYcWYd,P=2minP(WYk),P(WYk)当H0为真时,若min(m,n),且ml(0,1),l是一个常数。3、渐进正态性NWY-E(WY)WY-n(N+1)2L则=N(0,1)D(WY)mn(n+1)12n(N+1)mn(N+1)当n充分大时,WYN(212,)若数据中有结,采用平均秩法,这时WY=a(Ri)4、Wilcoxon秩和检验的平均秩法ni=1a(r)是计分函数(r=1,2,,N)若结的长度为1,a(Ri)=Ri若结的长度大于1,a(Ri)为秩的平均。可以证明:当H0为真时,当混合样本数据中有g个结,结长分别为t1,t2,tg时,E(WY)=n(N+1)2j=1(tj3-tj)D(WY)=nm(N+1)12-mn12N(N-1)gn充分大时n(N+1)nm(N+1)mn(tj3-tj)WYN(212,-g12N(N-1)j=1设计过程(步骤)或程序代码:(1)描述性统计分析a.进入minitab系统,建立数据文件;b.数据堆叠列选择C1、C2在弹出的对话框中输入:当前工作表的列C3,将下表存储在:C4确定;d.选择统计基本统计量显示描述性统计;e.在描述性统计对话框键入C3单击确定。(2)Brown-Mood中位数检验法精确a.将所有数据输入到Minitab中;b.数据堆叠列选择C1、C2在弹出的对话框中输入:当前工作表的列C3,将下表存储在:C4确定;c.画出箱线图:图形箱线图多个选择C1、C2确定d.Mood中位数检验:统计非参数Mood中位数检验在弹出的对话框中选择响应变量C3,因子:C4确定e.求P值:计算概率分布超几何在弹出的对话框中输入:总体大小:38总体中的事件计数:18样本数量:19输入常量:12确定近似a.先进行修正,利用正态分布的性质求出Z0的值为1.6092b.计算概率分布正态分布在弹出的对话框中输入常量:1.6092确定c.求相应的p值用“1-所求P值”(3)Wilcoxon秩和检验法a.将所有数据输入到Minitab中;b.数据堆叠列选择C1、C2在弹出的对话框中输入:当前工作表的列C3,将下表存储在:C4确定;c.统计非参数Mann-Whitney第一样本:数学第二样本:经济学备择:小于确定d.数据排秩排秩数据在:C3将秩储存在:C5e.将C5列中C2的秩的单元格复制到C6列,求和并填在C7列f.计算概率分布正态均值:351标准差:34.1790输入常量:269.5确定设计结果与分析(可以加页):(1)描述性统计分析描述性统计:C3平均值下四分上四分变量NN*平均值标准误标准差最小值位数中位数位数最大值C338088.502.2714.0156.0078.2592.0098.25112.00(2)Brown-Mood中位数检验法.数学,经济学的箱线图Mood中位数检验:C3与C4C3的Mood中位数检验卡方=3.80DF=1P=0.051单组95.0%置信区间C4N中位数Q3-Q1-+-+-+-+-经济学61294.58.5(-*-)数学13787.029.8(-*-)-+-+-+-+-708090100整体中位数=92.0中位数(经济学)-中位数(数学)的95.0%置信区间:(-2.0,27.0)累积分布函数超几何分布,N=38、M=20以及n=19xP(X92合计X的样本13720Y的样本61218合计191938累积分布函数正态分布,平均值=0和标准差=1xP(X=x)1.60290.945522解:设X、Y分别表示数学和经济学的博士论文的页数,中位数分别是x0.5和y0.5,分别抽取样本X1,X2,X20;Y1,Y2,Y19首先可以画箱线图,易看出mxmy,所以有理由猜测:H0:x0.5=y0.5,H1:x0.5y0.5合并数据的中位数mxy=92将两组数据与mxy比较后可以列出列联表(四格表):选取X的样本中“mxy”的数据个数A的检验统计量,为真时,P(A=k)=CCC当H0mnnt-ktm+n,k=1,2,19这里m=20,n=18,t=19由实测值A=13相应的=p值=P(A13)=1-P(A12)1-0.948430=0.05157大样本近似A-tA-19当H0为真时,Z=mm+ntmn(m+n-t)=203819201819N(0,1)(m+n)2(m+n-1)3823712.5-19z0=203819201819=1.602938237相应的P值=P(Zz0)=1-P(Zz0)=1-0.945522=0.054478当a=0.05时,接受原假设,认为数学的博士论文的页数和经济学的博士论文的页数一样多。(3)Wilcoxon秩和检验法Mann-Whitney检验和置信区间:数学,经济学N中位数数学2087.00经济学1894.50ETA1-ETA2的点估计为-11.00ETA1-ETA2的95.2置信区间为(-23.00,-2.00)W=308.5在0.0089上,ETA1=ETA2与ETA1ETA2的检验结果显著在0.0089显著性水平上,检验结果显著(已对结调整)C6的和C6的和=432.5累积分布函数正态分布,平均值=351和标准差=34.179xP(X=x)269.50.0085511解:设X、Y分别表示数学和经济学的博士论文的页数,中位数分别是x0.5和y0.5,分别抽取样本X1,X2,X20;Y1,Y2,Y18要检验:H0:x0.5=y0.5,H1:x0.5y0.5,WY=Ri,当H0为真时,选取Y样本的Wilcoxon秩和检验统计量ni=1其中Ri为混合样本中Yi的秩CP(WX=d)=t20,18(d)1838其中d=18192=171,18192+2018=531,t20,18(d)表示从1,2,38中任取18个数,其和恰为d有多少种取法。由实测值得WY=432.5P值=P(WY432.5)=P(WY1839-432.5)=P(WY269.5)大样本近似混合样本中数据有g=11个结,10结长为2,1个结的结长为3,即t1=t2=t3=t10=2,t11=3,E(WY)=n(N+1)2=18392=351,2018(23-2)+(33-3)1168.207D(WY)=18203912-10123837j=1由于WY-351.由实测值WY=432.5Z=WY-E(WY)D(WY)=1168.59N(0,1)P值=P(WY432.5)=P(WY269.5)=P(269.5-351f()=0.00855111168.59WY-3511168.59269.5-3511168.59)若a=0.05时拒绝原假设,认为数学的博士论文的页数比经济学的博士论文的页数少。设计体会与建议:平时学习都过于松懈,学得东西多了,容易遗忘和混淆,做课程设计,不仅仅是必须要完成的学习任务,同时加强了我的动手、思考和解决问题的能力,受益匪浅。在课程设计过程中,我觉得是对课本知识的巩固和加强,由于课本上的知识太多,同时平时课间又没有地方能运用到我们所学的内容,而且考试的内容具有局限性。通过这次的课程设计,我更切身运用到了许多有关费阐述的知识,对其在实际生活中的用途有了更多的了解。在大学里,大家对于学习一般都是比较浅层次的,大多是为了应付考试,只流于表面的理解,而现在要求我们做课程设计,就不得不要求我们对所学的知识有更深层次的理解。因为课程设计的内容笔记书本中的理论知识而言,更接近于现实生活,而理论到实践的转化往往是一个艰难的过程,它犹如一只拦路虎,横更在我的面前。但是我毫不畏惧,因为我相信我能行。通过这次课程设计使我懂得了理论知识与实践相结合起来,从理论中得出结论,才能真正为社会服务,从而提高自己的的实际动手能力和独立思考的能力。在设计的过程中遇到问题,可以说得是困难重重,这已经是我第二次做课程设计了,虽然有一次的经历,但是依然遇到了各

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论