




已阅读5页,还剩5页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
实 验 报 告实验课程名称 统计建模与R软件 实验项目名称 统计描述性分析 年 级 2010级 专 业 信 计 学生姓名 陈秀美 学 号 1007010238 理 学 院实验时间: 2013 年 06 月 11 日学生实验室守则一、按教学安排准时到实验室上实验课,不得迟到、早退和旷课。二、进入实验室必须遵守实验室的各项规章制度,保持室内安静、整洁,不准在室内打闹、喧哗、吸烟、吃食物、随地吐痰、乱扔杂物,不准做与实验内容无关的事,非实验用品一律不准带进实验室。三、实验前必须做好预习(或按要求写好预习报告),未做预习者不准参加实验。四、实验必须服从教师的安排和指导,认真按规程操作,未经教师允许不得擅自动用仪器设备,特别是与本实验无关的仪器设备和设施,如擅自动用或违反操作规程造成损坏,应按规定赔偿,严重者给予纪律处分。五、实验中要节约水、电、气及其它消耗材料。六、细心观察、如实记录实验现象和结果,不得抄袭或随意更改原始记录和数据,不得擅离操作岗位和干扰他人实验。七、使用易燃、易爆、腐蚀性、有毒有害物品或接触带电设备进行实验,应特别注意规范操作,注意防护;若发生意外,要保持冷静,并及时向指导教师和管理人员报告,不得自行处理。仪器设备发生故障和损坏,应立即停止实验,并主动向指导教师报告,不得自行拆卸查看和拼装。八、实验完毕,应清理好实验仪器设备并放回原位,清扫好实验现场,经指导教师检查认可并将实验记录交指导教师检查签字后方可离去。九、无故不参加实验者,应写出检查,提出申请并缴纳相应的实验费及材料消耗费,经批准后,方可补做。十、自选实验,应事先预约,拟订出实验方案,经实验室主任同意后,在指导教师或实验技术人员的指导下进行。十一、实验室内一切物品未经允许严禁带出室外,确需带出,必须经过批准并办理手续。学生所在学院:理学院 专业: 信 计 班级:101姓 名陈秀美学 号1007010238实验组实验时间2013/06/11指导教师杨剑峰成 绩实验项目名称统计描述性分析实验目的及要求:1、 学习掌握课本第三章的内容2、 选择一些统计方法对课本第161页的数据统计进行描述性分析实验(或算法)原理:1. 偏度系数是刻画数据的对称性的指标,关于均值对称的数据其偏度系数为0,右侧更分散的数据偏度系数为正,左侧更分散的数据偏度系数为负。当数据的总体分布为正态分布时,峰度系数近似为0,当分布较正态分布的尾部更分散时,峰度系数为正,否则为负。当峰度系数为正时,两侧极端数据较多,当峰度系数为负时,两侧极端数据较少。2. 可以使用函数hist(x)画出样本的直方图,使用density(x)(核密度估计函数)可以对已知的样本估计其密度。3. 显示多变量数据,用函数coplot(xy|z)实现,表示在给定z值下,x关于y的散点图4. 二元函数相关性检验,使用函数cor.test(x,y),返回值为x和y的相关系数,Ruben给出了总体相关系数的区间估计的近似逼近公式,可以得出置信区间和相关性。实验硬件及软件平台:pc机,R软件实验步骤:1. 对课本上的方法进行了解和学习,选择数据统计性描述需要使用的方法2. 输入数据,编写程序,得到实验结果3. 对实验的结果进行分析实验内容(包括实验具体内容、算法分析、源代码等等):1 分布形状的度量:1.关于年龄的度量(1)执行data_outline(Age)后得到的结果如下: N Mean Var std_dev Median std_mean CV CSS USS R R119 13.31579 2.22807 1.492672 13 0.3424425 11.20979 40.10526 3409 5 2.5 Skewness Kurtosis0.06361167 -1.110926其中,样本个数=19,样本均值=13.31579,样本方差=2.22807,样本标准差=1.492672,样本中位数=13,样本标准误=0.3424425,样本变异系数=11.20979,样本矫正平方和=40.10526,样本未矫正平方和=3409,样本极差=5,样本半极差=2.5,偏度系数=0.06361167,峰度系数=-1.110926.(2)执行data_outline(AgeF)的结果为: N Mean Var std_dev Median std_mean CV CSS USS R R1 9 13.22222 1.944444 1.394433 13 0.4648111 10.54613 15.55556 1589 4 2 Skewness Kurtosis-0.1463545 -1.060058(3) 执行data_outline(AgeM)的结果为: N Mean Var std_dev Median std_mean CV CSS USS R R1 10 13.4 2.711111 1.646545 13.5 0.5206833 12.28765 24.4 1820 5 2.75 Skewness Kurtosis 0.1269424 -1.257295(2) 和(3)比较,女生年龄的右侧数据比左侧分散,男生年龄的右侧数据比左侧集中。男生和女生年龄的数据两端比正态分布的更集中,两侧极端数据较少。2.关于身高的度量(1)执行data_outline(Height)的结果:N Mean Var std_dev Median std_mean CV CSS USS R19 62.33684 26.2869 5.127075 62.8 1.176232 8.224791 473.1642 74304.92 20.7 R1 Skewness Kurtosis 7.65 -0.2596696 -0.1389692其中,样本个数=19,样本均值=62.33684,样本方差=26.2869,样本标准差=5.127075,样本中位数=62.8,样本标准误=1.176232,样本变异系数=8.224791,样本矫正平方和=473.1642,样本未矫正平方和=74304.92,样本极差=20.7,样本半极差=7.65,偏度系数=-0.2596696,峰度系数=8.224791.(2) data_outline(Height.F)的执行结果:N Mean Var std_dev Median std_mean CV CSS USS R9 60.58889 25.18361 5.018328 62.5 1.672776 8.282587 201.4689 33240.59 15.2 R1 Skewness Kurtosis7.8 -0.7238643 -0.3464949(3) data_outline(Height.M)的执行结果:N Mean Var std_dev Median std_mean CV CSS USS R R110 63.91 24.38322 4.937937 64.15 1.561513 7.726392 219.449 41064.33 14.7 7 Skewness Kurtosis 0.04095917 -0.934876(2) 和(3)比较,女生身高的左侧数据比右侧分散,男生年龄的右侧数据比左侧分散。男生和女生年龄的数据两端比正态分布的更集中,两侧极端数据较少。3. 关于体重的度量在此就不作分析了2 作出学生的年龄,身高,体重的直方图、密度估计曲线和正态分布密度曲线,分析数据1. 年龄直方图、密度估计曲线和正态分布密度曲线(黑色代表总体年龄的密度曲线,蓝色代表男生年龄密度曲线,黄色代表女生年龄密度曲线,红色代表总体的正态分布的概念密度曲线) 由图可知,年龄阶段在1112之间的人最多,在1516之间的最少;年龄的密度估计曲线在1112之间上升,在1215之间平稳,在1516之间下降;但是密度估计曲线和正态分布的概率密度曲线还是有一定的差别。不同之处就是在1314之间,总体的和男生的密度曲线都是呈下凹状态,女生的确有一点凸起。2. .体重直方图、密度估计曲线和正态分布密度曲线(黑色代表总体体重的密度曲线,蓝色代表男生体重密度曲线,黄色代表女生体重密度曲线,红色代表总体的正态分布的概念密度曲线)体重在80100之间的人数最多,在4060,6080,140160的人数差不多,都最少;总体、男生的密度曲线和正态分布的相似,但是女生的呈现出不平衡,落差很大3. 身高直方图、密度估计曲线和正态分布密度曲线(黑色代表总体身高的密度曲线,蓝色代表男生身高密度曲线,黄色代表女生身高密度曲线,红色代表总体的正态分布的概念密度曲线)总体、男生、女生和正态分布的密度曲线非常相似,都呈抛物线形状。3 散点图1. 年龄一定时,身高和体重的散点图如下:由图可知,在1112.5岁之间,身高集中在6065之间,体重集中在8090之间;在12.514.5岁之间,身高集中在5565之间,体重集中在80100之间;在14.516之间,身高和体重都比较分散;2. 身高一定时,年龄和体重的散点图如下:在各个身高阶段,体重和年龄的分布都比较分散3. 体重一定时,年龄和身高的散点图如下:在各个体重阶段,体重和年龄的分布都比较分散4 身高和体重的相关性1.用cor.test(Weight,Height)求它的相关系数:运行结果如下: cor.test(Weight,Height) Pearsons product-moment correlationdata: Weight and Height t = 7.5549, df = 17, p-value = 7.887e-07alternative hypothesis: true correlation is not equal to 0 95 percent confidence interval: 0.7044314 0.9523101 sample estimates: cor 0.8777852 P= 7.887e-070.05,拒绝原假设,认为Weight和Height是相关的cor =0.8777852是相关系数2. 用相关系数可以得到它的置信区间,编写ruben.test.R程序执行,得
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 人与交通安全
- 《诫子书》课件教学课件
- 公司节前安全教育培训课件
- 亲子共读课件设计意图
- 血透室护理质量总结分析
- 亭子乐高搭建课件
- 护理管理工作总结
- 事故应急救援安全培训课件
- 《蒹葭》课件内容
- 公司级安全培训内容课件
- HGT-2521-2008工业硅溶胶的内容
- 译林版三年级英语上册全册课件
- 爱是我的眼睛合唱简谱
- 如何书写护理个案
- 内科学第十一章心脏骤停与心脏性猝死
- GB/T 2831-1981光学零件的面形偏差检验方法(光圈识别)
- GB/T 19077-2016粒度分布激光衍射法
- GB/T 1220-1992不锈钢棒
- GB/T 1094.1-2013电力变压器第1部分:总则
- 水工监测工竞赛试试题库
- 2023年安仁县林业系统事业单位招聘笔试题库及答案解析
评论
0/150
提交评论