第1章 统计数据的收集与整理_第1页
第1章 统计数据的收集与整理_第2页
第1章 统计数据的收集与整理_第3页
第1章 统计数据的收集与整理_第4页
第1章 统计数据的收集与整理_第5页
已阅读5页,还剩41页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、(1)科学的发展总是从定性研究到定量(2)研究生物学和数学之间的一门交叉科学(3)生物统计的基础:概率论和数理统计(4) 生态数学、数量遗传学、群体遗传学、数量分类方法 确定性现象在一定的条件下必然发生(结果可以预言)。 非确定性现象又称随机现象在一定条件下,具有多种可能结果,而究竟出现哪种结果,事先不可断言在个别试验中呈现出不确定性,但经大量重复试验,又具有统计规律性1研究简缩数据和描述数据描述统计学2研究样本和总体的关系A.从已知的总体研究样本的特性。b.根据部分样本数据去推断总体。3研究实验设计。 学时51学时作业辅导5学时+计算器使用2学时+统计软件使用3学时。 成绩理论成绩:70(闭

2、卷50,开卷50)平时成绩:作业30%。 准备课代表一人练习本一本,带统计功能的计算器1、掌握数据分析的基本方法会算2、理解统计学的基本概念弄懂3、提高分析问题和解决问题的能力灵活应用,包括分析数据的合理性,针对具体研究项目,进行合理的试验设计1、生物统计刘来福 北师大出版社2、现代生物统计杨纪柯 安徽教育出版社3、统计学导论美A.M穆德, 科学出版社4、田间试验和统计方法5、生物统计 总体指研究对象的全体,可以看成一个集合每一个研究对象个体,元素无限总体和有限总体 样本总体的一部分,即总体的一个子集样本含量 研究样本的目的上为了推断总体 要求总体中的每一个个体被抽到的机会相等1抽样的方式:有

3、放回抽样和无放回抽样样本容量的大小,是统计学研究的课题之一2抽样的方法:(1) 抽签、抓阄(2) 计算机,RND( )(3) 随机数字表1368962191512066120826649822659969115112595359362541401104083593367913785936265172269466955376718599211953375953635568898883345467738207557663867487019008671298702252811168409980698721835399528006904545761853788424513488128648437719

4、67953953871514167028461634709938570301963465003440110408222476260643114988346429869101431400369444823608123882215129610553148385637018840820485491616509712340706759611345225749808439327678354900516761695270417195623464267148994503583242051965501327 005408102937204022994198084639373986101951665433038

5、196865670512921031125340487851247379374157819178305064878767398406629852978427203184486197404421599696948564389733440436692422151024409225887488311779307295959049012495136954529719771973239267146901550226225978034078529784409023791110250327575199740457720640286339813480391603592304999333206086113039

6、15789992624752144188620793504968656694367930625955336584529956446569436411085870554169066680804230155165278974335356771099690373985250577894094516726087638187607885435660398074187873043 506806171770504877217032362396363638140657313978806872389715336307392644491788663632539951757422247626076713304181

7、338749883567453597347638163455777593150432832708611515229733753713917485992122684292020810293615142090306735747955375052541126555347139605790916585490476600707260603379970109599375925436127251651670253488118231372179475719264013949111051327518256293177831281653172596993166710847889896370188617638107

8、2349264551 连续型数据由称量、度量或测量等计量方法所得到的数据,又称计量数据 离散型数据(间断性数据):用计数的方法获得的数据。是整数、可数的、又称计数数据。 观察值每一个个体的某一性状、特征的测定数值 举例: 每10个新生儿中体重超过3公斤的人数 共调 查120次,每次只调查10人)特点:根据样本数据的自然值进行分组如果观察值个数较多,变异幅度较大, 可扩大以几个观察值为一组。组值组值(体重超过(体重超过3kg人数)人数)频数计算频数计算数数频率频率000.000100.000200.0003一一10.0084正丅正丅20.0175正正丅正正丅120.1006正正正正正正190.1

9、587正正正正正正正正正正正正正正390.3258正正正正正正正正正正正正340.2839正正正正100.0831030.025总计总计1200.999 举例:高梁“三尺三”株高测量结果,样本容量100,株高数据,p4。 表1-2155 153 159 155 150 159 157 159 151 152159 158 153 153 144 156 150 157 160 150150 150 160 156 160 155 160 151 157 155159 161 156 141 156 145 156 153 158 161157 149 153 153 155 162 154 1

10、52 162 155161 159 161 156 162 151 152 154 157 162158 155 153 151 157 156 153 147 158 155148 163 156 163 154 158 152 163 158 154164 155 156 158 164 148 164 154 157 165158 166 154 154 157 167 157 159 170 158组下限组上限组距组中值155 153 159 155 150 159 157 159 151 152159 158 153 153 144 156 150 157 160 150150 15

11、0 160 156 160 155 160 151 157 155159 161 156 141 156 145 156 153 158 161157 149 153 153 155 162 154 152 162 155161 159 161 156 162 151 152 154 157 162158 155 153 151 157 156 153 147 158 155148 163 156 163 154 158 152 163 158 154164 155 156 158 164 148 164 154 157 165158 166 154 154 157 167 157 159 1

12、70 1581求极差:又称全距R = 最大观察值最小观察值 170-141292确定组数: 考虑到:(1)观察值的多少(2)便于计算(整数)(3)能反映出资料的真实面貌 两种确定组数的方法: 经验 公式:G=1.87(N-1)2/5 样本数(n)分组的组数306068601007101002009122005001217500以上17303确定组距:每一组的范围称为组距分组时要求各组的距离相等一般以整数作为组距 31029组数极差组距4选定组限与组中值(1)选定第一组的组中值 最好接近于最小观察值,141 组中值最好是整数或与观察值的位数相同。(2)求第一组的组下限:下限=组中值-1/2组距(

13、3)求各组的组中值和组限: (组中值)i(组中值)i-1 +组距 (组限)i =(组限)i-1 +组距组距组下限组上限组下限组中值2125.唱票 唱票程序 L第一组下限;D组距 Dim Frequency(N) As Integer, Data(nSample) As Single Dim i As Integer, nGroup As Integer For i = 1 To nSample nGroup = Int(Data(i) - L) / D) Frequency(nGroup) = Frequency(nGroup) + 1 Next i说明说明第组的下限等于第组的几种处理方法:(

14、1)组限明确,比原始数据多一位小数, LXH(2)对各组的下(上)限不记载,用一缺横表示607080LXH组组 限限组中值组中值频数计算频数计算频数频数频率频率139.5 - 142.5141一一10.01142.5 - 145.5144丅丅20.02145.5 - 148.514730.03148.5 - 151.5150正正100.10151.5 - 154.5153正正正190.19154.5 - 157.5156正正正正正丅丅270.27157.5 - 160.5159正正正正200.20160.5 - 163.5162正正一一110.11163.5 - 166.5165正50.051

15、66.5 - 169.5168一一10.01169.5 - 172.5171一一10.01总计1001.00图1-2“三尺三 ”株高直方图直方图0 05 510101515202025253030139.5 142.5 145.5 148.5 151.5 154.5 157.5 160.5 163.5 166.5 169.5 172.5频率1、可以看出数据的集中情况 平均、大部分数据集中在何处、重心所在。2、可以看出数据的变异情况 是整齐还是分散,这些数据是集中在平均数附近,还是分散在平均数的两侧3、可以看出数据的分布是否对称 1意义(1)资料中观察值的中心位置(2)不同资料进行比较2算术平均

16、数(arithmetic mean)设x1,x2, x3 ,xn表示样本内的几个观察值xxnxniin13中位数(median)有序数列的中点上的数排序,中间位置所对应的那个数样本为奇数和偶数的情况4众数(mode)具有最高频数的组值或组中值5几何平均数nniinnxxxxxG/113211特征(1) 每个观察值都对 有贡献1/n (2) (3) (4) 如果 (5) 样本平均数是总体平均数的无偏估计xxknxknkxkxnkx1)(1AxnAxAAxnx)(1xnxxnx11122211,212211212121,nnxnxnnnxxxnn个数的算术平均数2算法(1)一般算法:根据定义的公式。(2)频数分组资料用组中值代表每一组的平均数.:,:,:,:组数总观察个体数组的频数第组的组值第kNifixiiikiixfNx111、极差 又称全距,记作R是资料中最大观察值与最小观察值的差数。 R=max(x)min(x)优点:简单。样本数小于10时常用缺点:没有充分利用资料,完全受极端值的影响2平均离差(mean deviation) 平均离差nxx3样本方差(sample variance)说明:(1)平方的作用:消除负号,加重较大的分量(2)样本方差是总体方差的无偏估计 (3)除以n-1的问题sxxniin2211比较

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论