下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、2 统计基本定义:(1)总体:在统计中, 所有考查对象的全体叫做全体.(2) 个体:在所有考查对象中的每一个考查对象都叫做个体. (3) 样本:从总体中抽取的一部分个体叫做总体的样本. (4) 样本容量:样本中个体的数目叫做样本容量. 抽样方法:(1)简单随机抽样 (simple random sampling) :设一个总体的个数为n.如果通过逐个抽取的方法从中抽取一个样本, 且每次抽取时每个个体被抽到的概率相等, 就称这样的抽样为简单的随机抽样, 简单随机抽样常用的方法有抽签法 和随机数表法 . (关于制签和随机数表的制作,请参照课本第41 页)(2) 系统抽样 (systematic s
2、ampling):将总体平均分成几个部分,然后按照一定的规则,从每一部分抽取一个个体作为样本。先用随机的方法将总体进行编号,如果整除不能被 nn就从中用随机数表法剔除几个个体,使得能整除,然后分组,一般是样本容量是多少,就分几组,间隔nnk,然后从第一组中用简单实际抽样的方法抽取一个个体,假设编号为l,然后就可以将编号为knlklkll1.2,的个体抽出作为样本,实际就是从每一组抽取与第一组相同编号的个体。(3) 分层抽样 (stratifed sampling) :当已知总体是由有差异明显的几部分组成时,常将总体分成几部分,然后按各部分所占的比例进行抽样,这种抽样叫做分层抽样,其中所分成的各
3、部分叫做层. 样本容量越大,估计越精确!颜老师友情提醒:1.把每一种抽样的具体步骤看清楚,要求会写过程2. 个体数 n 的总体中抽取一个样本容量为 n 的样本,那么在整个抽样过程中每个个体被抽到的概率都相等,且等于nn. 其实三种抽样的每一个个体都是等几率的被抽到的3. 三种抽样都是不放回的抽样4. 在具体问题中对于样本,总体,个体应该时代单位的, 如考察一个班级的学生的视力状况,从中抽取20 个同学,则个体应该是20 名同学的视力,而不是20 名同学,样本容量则为20,同样的总体也是全班级同学的视力两种抽样方法的区别与联系:类别共同点各自特点相互联系适用范围简单随机抽样抽取过程中每个个体被抽
4、取的概率相等从总体中逐个抽取总体中个体数较少分层抽样将总体分成几层进行抽取各 层 抽 样 可 采 用简单随机抽样或系统抽样总体有差异明显的几部分组成系统抽样将总体平均分成几部分,按事先确定的规则分别在各部分抽取在 起 始 部 分 抽 样时采用简单随机抽样总体中的个体较多 典型例题剖析:例 1、一个总体含有6 个个体,从中抽取一个样本容量为2 的样本,说明为什么在整个抽样过程中每个个体被抽到的概率相等. 解:设任意一个个体为,那么个体 被抽到分两种情况:(1)第一次被抽到:根据等可能事件概率得p1=61,(2)第二次被抽到:即是个体第一次没被抽到、第二次被抽到这两件事都发生. 个体 第一次没被抽
5、到的概率是65, 个体 第一次没被抽第二次被抽到的概率是51. 根据相互独立事件同时发生的概率公式, 个体 第二次被抽到的概率是p2=6551=61.( 也可这样分析:根据等可能事件的概率求得,一共取了两次,根据分步原理所有可能结果为65=30,个体 第一次没被抽到第二次被抽到这个随机事件所含的可能结果为51=5,所以个体第二次被抽到的概率是p2=305=61) 。个体在第一次被抽到与在第二次被抽到是互斥事件, 根据互斥事件的概率加法公式, 在先后抽取2个个体的过程中 , 个体 被抽到的概率p= p1+ p2=61+61=31。 由个体 的任意性 , 说明在抽样过程中每个个体被抽到的概率都相等
6、( 都等于31) 点评: 注意区分“任一个个体每次抽取时被抽到的概率”与“任一个个体在整个抽样过程中个体被抽到的概率”的区别, 一般地 ,如果用简单随机抽样从个体数为n 的总体中抽取一个容量为n 的样本 , 那么“任一个个体每次抽取时被抽到的概率”都相等且等于n1,“任一个个体 在整个抽样过程中被抽到的概率”为nn. 例 2、 (1)在 120 个零件中,一级品24 个,二级品 36 个,三级品60 个,从中抽取一个容量为20 的一个样本,求 每个个体被抽到的概率,若有简单随机抽样方法抽取时,其中个体第 15 次被抽到的的概率,若用分层抽抽样样方法抽取时其中一级品中的每个个体被抽到的概率. 解
7、:因为总体个数为120,样本容量为20,则每个个体被抽到的概率p1=12020=61 因为总体个数为120,则体 第 15 次被抽到的的概率p2=1201 用分层抽样方法:按比例12020=61分别在一级品、二级品、三级品中抽取2461=4 个,3661=6 个,6061=10,所以一级品中的每个个体被抽到的概率为p3=244=61. 注:其实用分层抽样方法抽取时二级品、三级品中每个体被抽到的概率也都为61. 点评: 本题说明两种抽样方法都能保证在抽样过程中,每个个体被抽到的概率都相等. 且为nn. 例 3、某地区有3000 人参加今年的高考,现从中抽取一个样本对他们进行分析,每个考生被抽到的
8、概率为101,求这个样本容量. 解:设样本容量为n,则3000n=101,所以 n=300. 点评 :“在整个抽样过程中个体被抽到的概率”为nn这一结论的逆用. 例 4、下列抽取样本的方式是否属于简单随机抽样?说明理由 . (1) 从无限多个个体中抽取50 个个体作样本 . (2) 盒子里共有 100 个零件 , 从中选出 5 个零件进行质量检验. 在抽样操作时 , 从中任意拿出一个零件进行质量检验后再把它放回盒子里. 解: (1) 不是简单随机抽样. 由于被抽取样本的总体个数是无限的. (2) 不是简单随机抽样. 由于不符合“逐个抽取”的原则, 且抽出的结果可能是只有一个零件重复出现. 点评
9、: 简单随机抽样的特点: (1) 它要求被抽取样本的总体个数是有限的. (2) 它是从总体中逐个地进行抽取. (3) 它是一种不放回抽样. 例 5、 某校有学生1200 人, 为了调查午休对学习成绩的影响情况, 计划抽取一个样本容量为60 的样本 , 问此样本若采用简单随机抽样将如何进行 ? 解:可用两种方法:方法一:(抽签法)(1)编号:将 1200 名学生进行随机编号为1,2, ,, 1200, (可按学生的学号或按学生的生日进行编号). (2)制签:做1200 个大小、形状相同的号签,分别写上这1200 个数,放在个容器里,并进行均匀搅拌. (3)逐个抽取:连续抽取60 个号签,号签对应
10、的同学即为样本. 方法二:(随机数表法)(1)编号:将 1200 名学生进行编号分别为0000,0001,,, 1199 ,(2)选数:在课本附表1 随机数表中任选一个数作为开始.( 如从第 11 行第 7 列的数 9 开始 ) (3) 读数:从选定的数开始向右(或向上、向下、向左)读下去,选取介于范围的号码,直到满60 个号码为止 . (4) 抽取:抽取与读出的号码相对应的学生进行分析. 点评: 抽签法和随机数表法是常见的两种简单随机抽样方法,本问题显然用随机数表法更方便一些,因为总体个数较多.另外随机数表法编号时 , 位数要一样 , 首数确定后 , 可向左、向右、向上、向下各个确定的方向进
11、行抽取. 例 6、某工厂中共有职工3000 人, 其中 , 中、青、老职工的比例为532,从所有职工中抽取一个样本容量为400 的样本,应采取哪种抽样方法较合理?且中、青、老年职工应分别抽取多少人?解:采用分层抽抽样样方法较为合理. 由样本容量为400, 中、青、老职工的比例为532, 所以应抽取中年职工为400105=200 人, 应抽取青年职工为400103=120 人, 应抽取青年职工为400102=80 人. 例 6. 见课本43p例 1. 点评: 因为总体由三类差异较明显的个体构成,所以应采用分层抽抽样样方法进行抽取. 总体分布的估计. 频率分布表: 见课本第 51 页: 例 1 1
12、. 注意全距,组距的确定。一般是先查出最大值,最小值,其差值取适当的量作为全距,正常情况下分为十组左右,组数全距组距,也就是合理分组2. 分组的时候一般取左闭右开区间,最后一个区间取闭区间,然后填写分组、频数、频率、合计3. 如果全距不利于分组(如不能被组数整除)就可适当的增大全距,即在左右两端增加相同的量4. 分组过少,总体的特征不明显;分组过多,总体特征不利于比较. 频率分布直方图:1. 横轴表示数据的内容,每一线段表示一个组的组距,注意横轴要有单位2. 纵轴表示的是 :组距频率 3.每个小矩形的面积都是该组所对应的频率. 频率分布折线图: 1.由频率分布直方图直接得到,取值区间的两端点分
13、别向外延伸半个组距并取此组距上再x 轴上的点,然后顺次连接直方图中每一个小矩形上底边的中点,形成折线图 2.当样本容量足够大,分组的组距取得足够小时,折线图取与一条平滑的曲线,称这条曲线为 总体分布的密度曲线,而且曲线与横轴围成的面积为1 3.在总体密度曲线中,总体在区间(a,b )内取值的可能性就是直线x=a , x=b , y=0 和总体密度曲线围成的面积 4. 累计频率分布曲线上任意一点bap,的纵坐标标b 表示的连续型总体,取小于等于 a 的值的可能性. 三者的特点频率分布表: 数据翔实、具体、清晰明了,便于查阅频率分布直方图:形象直观,对比效果强烈频率分布折线图:能够反映变化趋势.
14、茎叶图的特点:优点 简单易行,杂乱的数据在用茎叶图表示后能直观地反映出数据的水平状况、稳定程度;所有的数据都可以在茎叶图中找到 . 缺点 分析只是粗略的,对差异不大的两组数据不易分析,另外,对位数较多的数据不易操作,数据较多时效果不是很好. 注意点: 1.对重复出现的数据要重复记录,不能遗漏2. 茎要从小到大自上而下的排列,中间用一条竖线隔开 3 . 叶也要按照从小到大的顺序排列,对于两组数据的可以用两条竖线把茎和叶隔开,左边的叶最好按照从大到小的顺序排列,右边的叶按照从小到大的顺序排列 4.茎叶图一般在衡量一位或者两位运动员在比赛时的得分情况( 例题见课本58p)总体特征数的估计反映总体某种
15、特征的量较总体特征数,比如平均数、中位数、方差、众数等. 平均数( average ) 或均值( mean ) :niinannaaaa1211.其原理: 最小二乘法 设与实验数据近似的值为 x 则它与这n 个实验数据的离差为.,321naxaxaxax由于上面的离差有正有负,故不易直接相加,就考虑离差的平方和22221.naxaxaxxfnnaaaxaaanx.22221212所以当niinannaaax1211.时,离差的平方和的函数取得最小,误差也就最小,故而用naaan.21作为这组数据的理想近似值 . . 平均数的求法 : 题目类型有 离散型 和连续型 两种情况niinxnnxxxx
16、1211.加权平均数 : niiinnpxpxpxpxx12211.(其中i21p,.,p,p为i21 x,., x,x对应的频率),这里也是为我们今后将要学习的数学期望作铺垫见课本例 2 6564p注: 特别地,对于连续型的随机变量在分好组后,其i21 x,., x,x应该取每一组的组中值近似的表示. 样本方差( variance ): 2121niixxns=22221231()()()() nxxxxxxxxn样本标准差 (standard deviation):niixxns121说明: 1. 平均数、中位数、众数是描述数据集中趋势的统计量2. 方差、 标准差是反映一组数据波动大小或稳
17、定程度或各个数据与平均数的离散程度的统计量,记住它们的表达形式,在选择题中常出现关于它们的判断3. 一个重要结论:21221xxnsnii4. 方差与越大,稳定性越差5. 关于它们的运算,分连续型和离散型两种情况,见课本6867p对于离散型的随机变量也要注意选择组中值例题: 从两块玉米地里各抽取10 株玉米苗,分别测得它们的株高如下(单位:cm ): 甲: 25 41 40 37 22 14 19 39 21 42 乙: 27 16 44 27 44 16 40 40 16 40 根据以上数据回答下面的问题:(1)哪种玉米苗长得高?(2)哪种玉米苗长得齐? 分析 :看哪种玉米苗长得高,只要比较
18、甲乙两种玉米苗的平均高度即可;要比较哪种玉米苗长得齐,只要比较哪种玉米苗高的方差即可,方差越小,越整齐,因为方差反映的是一组数据的稳定程度解: (1)cmxcmx31401640401644274416271013042213919142237404125101乙甲乙种玉米长得高乙甲xx(2)222222222223042302130393019301430223037304030413025101甲s22.104cm2222228.12831442314033161331272101cms乙甲种玉米长得齐乙甲22xx评: 1.特别注意本题中的两问的说法的不同,所以算法就不同2.一般的说哪组数据齐、稳定、波动情况等都是通过方差来判断. 几个重要的结论:对于一组数据n21 x,., x,x的平均数为x方差为2s标准差为s若n,.,21,i,ix都增加a , 则平均数为ax方差为2s标准差为s也可以这样解释:同时增加a,也就是相当数据平移了,不会改变数据的波动程度,所以方差和标准差都不会变.若n,.,21,i,ix都递增a% ,则平均数为xa%1方差为22%1sa标准差为sa%1若n,.,21,i,ix都变为原来的a倍,则平
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 净零排放方案践行承诺书8篇
- 市场推广成功承诺书范文3篇
- 基础底板及结构施工方案
- 健康安全优先保障承诺书3篇
- 我的成长经历周记写作分享10篇
- 创意文化产业健康持续发展承诺书4篇
- 环保办公与生态改善承诺函3篇范文
- 高效能安全运行承诺书范文7篇
- 技术保障无故障服务承诺函3篇范文
- 微服务营销方案(3篇)
- 2025-2030中国成像流式细胞仪市场行情走势与投资前景研究研究报告
- 2026年安徽卫生健康职业学院单招综合素质考试题库附答案详解(a卷)
- 2026年安徽工贸职业技术学院单招职业技能考试题库及答案详解(真题汇编)
- 新春开学第一课:小学法治教育课件
- 2026年及未来5年中国黄花菜行业市场发展现状及投资策略咨询报告
- 2026龙江森工集团权属林业局限公司春季公开招聘635人易考易错模拟试题(共500题)试卷后附参考答案
- 医疗注射治疗风险告知书范本
- 生长监测生物标志物研究进展
- 2026年高考时事政治时事政治考试题库完整参考答案
- 大专移动通信技术
- 锅炉房拆除安全培训记录课件
评论
0/150
提交评论