非参实验报告_第1页
非参实验报告_第2页
非参实验报告_第3页
非参实验报告_第4页
非参实验报告_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 非参数统计课程设计指导书一、 课程设计的目的 1. 加深理解本课程的研究方法、思想精髓,提高解决实际问题的能力,熟练 掌握Minitab常用统计软件的应用。 2.掌握两样本Brown-Mood中位数检验法,并解决两样本中心位置的一致性检 验问题. 3.掌握两样本Wilcoxon 秩和检验法,解决两样本中心位置的一致性检验问 题。二、 设计名称: 不同学科的博士论文除了内容外,页数有没有不同三、 设计要求 1.数据来源要真实,必须注明数据的出处。 2.尽量使用计算机软件分析,说明算法或过程。 3.必须利用到应用回归分析的统计知识。 4.独立完成,不得有相同或相近的课程设计。四、 设计过程1.思

2、考研究课题,准备搜集数据。2.确立课题,利用图书馆、上网等方式方法搜集数据。3.利用机房实验室等学校给予的便利措施开始分析处理数据。4.根据试验结果,写出课程设计报告书。 5.对实验设计报告书进行完善,并最终定稿。五、设计细则1.利用的统计学软件主要为Minitab,因为其方便快捷,功能也很强大,界面美观。2.对Word文档进行编辑的时候,有些特殊的数学符号需要利用数学编辑器这款小软件进行编辑。3.数据来自较权威机构,增加分析的准确性与可靠性。 4.力求主题突出,观点鲜明,叙述简洁明了。六、说明 1.数据来源于21实际统计学系列教材 非参数统计;2.所选取数据可能不会涉及到所学的各种分析方法,

3、本课程设计最后会对此 情况作出解释。 3.同一题可以采用不同的方法来检验,从而得出更详细的分析与解释 4.课程设计任务书姓 名学 号班 级12金统课程名称非参数统计分析课程性质专业课设计时间 2014年 6月 3日 2014年 6月 17日设计名称不同学科的博士论文除了内容外,页数有没有不同设计要求1.掌握两样本Brown-Mood中位数检验法,并解决两样本中心位置的一致性检验问题。2.掌握两样本Wilcoxon 秩和检验法,解决两样本中心位置的一致性检验问题。3.通过实验加深理解非参数统计在实践中的应用意义。设计思路与设计过程设计思路:先对理论部分进行掌握,再搜集数据,然后对数据进行分析处理

4、。设计过程:先对相关定理和结论进行整理搜集数据用统计软件对数据进行处理对结果进行分析计划与进度6月3日5月10日:思考准备研究课题;6月11日5月14日:确立课题,搜集数据;6月15日6月17日:进行数据处理,并对结果进行分析,定稿 。任课教师意 见说 明1.数据来源于21实际统计学系列教材 非参数统计;2.所选取数据可能不会涉及到所学的各种分析方法,本课程设计最后会对此情况作出解释3.同一题可以采用不同的方法来检验,从而得出更详细的分析与解释4.课程设计报告课程:非参数统计分析学号: 姓名: 班级: 12金统 教师: 孙丽玢 江苏师范大学数学与统计科学学院设计名称:不同学科的博士论文除了内容

5、外,页数有没有不同 日期:2014年 6 月 16 日 设计内容:不同学科的博士论文除了内容以外还有什们不同呢?分别对一个大学的数学20个和经济学的18个博士论文的页数进行的抽样结果如下(单位:页数):数学: 56 105 63 88 72 112 96 93 65 105 94 87 64 65 68 87 90 98 76 75经济学:88 94 93 96 99 79 91 94 91 100 99 90 100 110 102 95 98 85 仅仅从页数上看,这两个学科的博士论文有什么不同?(1) 使用两样本Brown-Mood中位数检验法进行分析。(2) 使用两样本Wilcoxon

6、 秩和检验法进行分析。设计目的与要求:1. 加深理解本课程的研究方法、思想精髓,提高解决实际问题的能力,熟练掌握Minitab常用统计软件的应用。2.掌握两样本Brown-Mood中位数检验法,并解决两样本中心位置的一致性检验问题.3.掌握两样本Wilcoxon 秩和检验法,解决两样本中心位置的一致性检验问题。设计环境或器材、原理与说明:设计环境器材:机房 计算机Windows7系统 Minitab软件原理与说明:(1) Brown-Mood中位数检验法小样本方法假设样本和分别取自相互独立的连续型随机变量X和Y,记X和Y的中位数分别为,Brown-Mood中位数检验法的原假设和备择假设都有三种

7、情况,这三种情况的原假设都是,而备择假设分别是,和,将样本和混合在一起,记样本和的中位数为,构成四格表: 观测值的数目观测值的数目合计X的样本Am-AmY的样本Bn-Bn合计A+B=tm+n-tm+n在零假设成立时,A服从超几何分布:(m+n个产品,m个次品,取出t个,其中有k个次品的概率)如果A值太大或太小,则应怀疑零假设。设A的取值为a1) 2) 3) 大样本方法在零假设成立时,A服从超几何分布,则当时,每次抽取可近似认为不变这时超几何分布可用二项近似(不放回抽样可近似看成放回抽样)超几何的期望,方差可以证明当n充分大时连续修正 当时,相当精确。另还可以证明当以,代入得后来又有了进一步的结

8、论设Z的取值为,p值计算方法:1)2)3) 用近似,的取值为,(2) Wilcoxon秩和检验法1、 秩(无结点数据)1、 定义:设为取自总体X的样本,称为的秩,为秩统计量。2、 分布在由(1,2,n)的所有排列组成的空间上市均匀分布,即对(1,2,n)的任一排列有:3、 数字特征2、 Wilcoxon秩和检验统计量的选择总体不要求对称。假定和分别为来自两独立连续总体X,Y的样本,且形状参数相同,要检验,事实上,原假设为 X与Y同分布若为真,考虑Y样本的秩, 3、 Wilcoxon秩和检验统计量的性质1、 的分布(小样本方法) 服从离散型分布,其所有可能取值为性质5.1 若为真其中表示从1,2

9、,N=m+n中任取n个数,其和恰为d有多少种取法。2、 的对称性 性质5.2 当为真时,服从对称分布,对称中心为的中点设的取值为k1)2)3)3、渐进正态性当为真时,若,且是一个常数。则当n充分大时,4、 Wilcoxon秩和检验的平均秩法若数据中有结,采用平均秩法,这时是计分函数(r=1,2,,N)若结的长度为1,若结的长度大于1,为秩的平均。可以证明:当为真时,当混合样本数据中有g个结,结长分别为时,n充分大时设计过程(步骤)或程序代码:(1) 描述性统计分析 a.进入minitab系统,建立数据文件; b.数据堆叠列选择C1、C2在弹出的对话框中输入:当前工作表 的列 C3,将下表存储在

10、:C4确定; d.选择统计基本统计量显示描述性统计; e.在描述性统计对话框键入C3单击确定。(2)Brown-Mood中位数检验法精确a.将所有数据输入到Minitab中; b.数据堆叠列选择C1、C2在弹出的对话框中输入:当前工作表 的列 C3,将下表存储在:C4确定;c.画出箱线图:图形箱线图多个选择C1、C2确定 d.Mood中位数检验:统计非参数Mood中位数检验在弹出的对话 框中选择响 应变量C3,因子:C4确定e.求P值:计算概率分布超几何在弹出的对话框中输入:总体大小: 38总体中的事件计数:18样本数量:19输入常量:12确定近似a.先进行修正,利用正态分布的性质求出的值为1

11、.6092 b.计算概率分布正态分布在弹出的对话框中输入常量:1.6092确 定c.求相应的p值用“1-所求P值”(3)Wilcoxon秩和检验法 a.将所有数据输入到Minitab中; b.数据堆叠列选择C1、C2在弹出的对话框中输入:当前工作表的 列 C3,将下表存储在:C4确定; c.统计非参数Mann-Whitney第一样本:数学 第二样本:经济学 备择:小于确定 d.数据排秩排秩数据在:C3 将秩储存在:C5 e.将C5列中C2的秩的单元格复制到C6列,求和并填在C7列 f.计算概率分布正态均值:351 标准差:34.1790 输入常量:269.5 确定设计结果与分析(可以加页):(

12、1)描述性统计分析描述性统计: C3 平均值 下四分 上四分变量 N N* 平均值 标准误 标准差 最小值 位数 中位数 位数 最大值C3 38 0 88.50 2.27 14.01 56.00 78.25 92.00 98.25 112.00(2) Brown-Mood中位数检验法.数学, 经济学 的箱线图Mood 中位数检验: C3 与 C4 C3 的 Mood 中位数检验卡方 = 3.80 DF = 1 P = 0.051 单组 95.0% 置信区间C4 N 中位数 Q3-Q1 -+-+-+-+-经济学 6 12 94.5 8.5 (-*-)数学 13 7 87.0 29.8 (-*-)

13、 -+-+-+-+- 70 80 90 100整体中位数 = 92.0中位数 (经济学) - 中位数 (数学) 的 95.0% 置信区间: (-2.0,27.0) 累积分布函数 超几何分布,N = 38、M = 20 以及 n = 19 x P( X = x )12 0.948430 累积分布函数 正态分布,平均值 = 0 和标准差 = 1 x P( X = x )1.6029 0.945522解:设X、Y分别表示数学和经济学的博士论文的页数,中位数分别是和,分别抽取样本首先可以画箱线图,易看出,所以有理由猜测: , 合并数据的中位数 将两组数据与比较后可以列出列联表(四格表):观测值观测值合

14、计X的样本13720Y的样本61218合计191938选取X的样本中“”的数据个数A的检验统计量,当为真时,这里由实测值A=13相应的大样本近似当为真时,相应的P值=当时,接受原假设,认为数学的博士论文的页数和经济学的博士论文的页数一样多。(3) Wilcoxon秩和检验法Mann-Whitney 检验和置信区间: 数学, 经济学 N 中位数数学 20 87.00经济学 18 94.50ETA1-ETA2 的点估计为 -11.00ETA1-ETA2 的 95.2 置信区间为 (-23.00,-2.00)W = 308.5在 0.0089 上,ETA1 = ETA2 与 ETA1 ETA2 的检

15、验结果显著在 0.0089 显著性水平上,检验结果显著(已对结调整) C6 的和 C6 的和 = 432.5 累积分布函数 正态分布,平均值 = 351 和标准差 = 34.179 x P( X = x )269.5 0.0085511解:设X、Y分别表示数学和经济学的博士论文的页数,中位数分别是和,分别抽取样本要检验: , ,当为真时,选取Y样本的Wilcoxon秩和检验统计量 ,其中为混合样本中的秩 其中,表示从1,2,38中任取18个数,其和恰为d有多少种取法。由实测值得 大样本近似混合样本中数据有g=11个结,10结长为2,1个结的结长为3,即 ,由于由实测值 若时拒绝原假设,认为数学

16、的博士论文的页数比经济学的博士论文的页数少。设计体会与建议: 平时学习都过于松懈,学得东西多了,容易遗忘和混淆,做课程设计,不仅仅是必须要完成的学习任务,同时加强了我的动手、思考和解决问题的能力,受益匪浅。在课程设计过程中,我觉得是对课本知识的巩固和加强,由于课本上的知识太多,同时平时课间又没有地方能运用到我们所学的内容,而且考试的内容具有局限性。通过这次的课程设计,我更切身运用到了许多有关费阐述的知识,对其在实际生活中的用途有了更多的了解。 在大学里,大家对于学习一般都是比较浅层次的,大多是为了应付考试,只流于表面的理解,而现在要求我们做课程设计,就不得不要求我们对所学的知识有更深层次的理解。因为课程设计的内容笔记书本中的理论知识而言,更接近于现实生活,而理论到实践的转化往往是一个艰难的过程,它犹如一只拦路虎,横更在我的面前。但是我毫不畏惧,因为我相信我能行。通过这次课程设计使我懂得了理论知识与实践相结合起来,从理论中得出结论,才能真正为社会服务,从而提高自己的的实际动手能力和独立思考的能力。在设计的过程中遇到问题,可以说得是困难重重,这已经是我第二次做课程设计了,虽然有一次的经历,但是依然遇到了各种各样的问题,同时在设计的过程中发现了自己的不足之处,对以前所学过的知识理解的不够深刻,掌握的不够牢固。 这次课程设计我发现了一点,就是两种方法得出的结

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论