




免费预览已结束,剩余1页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二章 统计2.1.1简单随机抽样1总体和样本 总体:在统计学中 , 把研究对象的全体叫做总体个体:把每个研究对象叫做个体总体容量:把总体中个体的总数叫做总体容量为了研究总体的有关性质,一般从总体中随机抽取一部分:, , , 研究,我们称它为样本其中个体的个数称为样本容量。2简单随机抽样,也叫纯随机抽样。就是从总体中不加任何分组、划类、排队等,完全随 机地抽取调查单位。特点:每个样本单位被抽中的可能性相同(概率相等),样本的每个单位完全独立,彼此间无一定的关联性和排斥性。简单随机抽样是其它各种抽样形式的基础。通常只是在总体单位之间差异程度较小和数目较少时,才采用这种方法。3简单随机抽样常用的方法: (1)抽签法;随机数表法;计算机模拟法;使用统计软件直接抽取。在简单随机抽样的样本容量设计中,主要考虑:总体变异情况;允许误差范围;概率保证程度。4抽签法: (1)给调查对象群体中的每一个对象编号; (2)准备抽签的工具,实施抽签 (3)对样本中的每一个个体进行测量或调查 例:请调查你所在的学校的学生做喜欢的体育活动情况。5随机数表法: 例:利用随机数表在所在的班级中抽取10位同学参加某项活动。2.1.2系统抽样1系统抽样(等距抽样或机械抽样):把总体的单位进行排序,再计算出抽样距离,然后按照这一固定的抽样距离抽取样本。第一个样本采用简单随机抽样的办法抽取。K(抽样距离)=N(总体规模)/n(样本规模)前提条件:总体中个体的排列对于研究的变量来说,应是随机的,即不存在某种与研究变量相关的规则分布。可以在调查允许的条件下,从不同的样本开始抽样,对比几次样本的特点。如果有明显差别,说明样本在总体中的分布承某种循环性规律,且这种循环和抽样距离重合。2系统抽样,即等距抽样是实际中最为常用的抽样方法之一。因为它对抽样框的要求较低,实施也比较简单。更为重要的是,如果有某种与调查指标相关的辅助变量可供使用,总体单元按辅助变量的大小顺序排队的话,使用系统抽样可以大大提高估计精度。2.1.3分层抽样1分层抽样(类型抽样):先将总体中的所有单位按照某种特征或标志(性别、年龄等)划分成若干类型或层次,然后再在各个类型或层次中采用简单随机抽样或系用抽样的办法抽取一个子样本,最后,将这些子样本合起来构成总体的样本。两种方法:1先以分层变量将总体划分为若干层,再按照各层在总体中的比例从各层中抽取。2先以分层变量将总体划分为若干层,再将各层中的元素按分层的顺序整齐排列,最后用系统抽样的方法抽取样本。2分层抽样是把异质性较强的总体分成一个个同质性较强的子总体,再抽取不同的子总体中的样本分别代表该子总体,所有的样本进而代表总体。分层标准:(1)以调查所要分析和研究的主要变量或相关的变量作为分层的标准。(2)以保证各层内部同质性强、各层之间异质性强、突出总体内在结构的变量作为分层变量。(3)以那些有明显分层区分的变量作为分层变量。3分层的比例问题: (1)按比例分层抽样:根据各种类型或层次中的单位数目占总体单位数目的比重来抽取子样本的方法。 (2)不按比例分层抽样:有的层次在总体中的比重太小,其样本量就会非常少,此时采用该方法,主要是便于对不同层次的子总体进行专门研究或进行相互比较。如果要用样本资料推断总体时,则需要先对各层的数据资料进行加权处理,调整样本中各层的比例,使数据恢复到总体中各层实际的比例结构。三种抽样方法的比较类 别共同点各自特点联 系适 用范 围简 单随 机抽 样(1)抽样过程中每个个体被抽到的可能性相等(2)每次抽出个体后不再将它放回,即不放回抽样从总体中逐个抽取总体个数较少将总体均分成几部 分,按预先制定的规则在各部分抽取在起始部分样时采用简随机抽样总体个数较多系 统抽 样将总体分成几层,分层进行抽取分层抽样时采用简单随机抽样或系统抽样总体由差异明显的几部分组成分 层抽 样2.2.1 频率分布直方图与茎叶图1、我们把样本抽取后,要对样本进行分析来研究总体的分布情况,对样本进行分析常采取两种方式:列频率分布表; 频率分布直方图.频率分布是指一个样本数据在各个小范围内所占比例的大小。一般用频率分布直方图反映样本的频率分布。画频率分布直方图一般步骤为:求极差(即样本中的最大值与最小值的差);决定组距与组数();将数据分组;列频率分布表.(5)画频率分布直方图根据频率分布表做频率分布直方图应注意两点:纵轴的意义:横轴的意义:样本内容(每个矩形下面是组距).频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图2.茎叶图:当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图。(见课本P6例子)制作茎叶图的方法是:先将数据按大小进行排列,再将所有两位数的十位数字作为“茎”,个位数字作为“叶”,茎相同者共用一个茎,茎按从小到大的顺序从上向下列出,共茎的叶一般按从大到小(或从小到大)的顺序同行列出.注意:在制作茎叶图时,重复出现的数据要重复记录,不能遗漏,特别是“叶”部分;同一数据出现几次,就要在图中体现几次.茎叶图的特征:()用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示。()茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰。总体分布指的是总体取值的频率分布规律,由于总体分布不易知道,因此我们往往用样本的频率分布去估计总体的分布。4.总体的分布分两种情况:当总体中的个体取值很少时,用茎叶图估计总体的分布;当总体中的个体取值较多时,将样本数据恰当分组,用各组的频率分布描述总体的分布,方法是用频率分布表或频率分布直方图。制作频率分布表时,若容量是n, 可按公式将数据分成大约 K=1+lg n 段。(这类的经验公式只对分段起参考作用)二、典例精析例1:下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位) (1)列出样本频率分布表(2)一画出频率分布直方图;(3)估计身高小于134的人数占总人数的百分比.。2.3.1用样本的数字特征估计总体的数字特征1、众数、中位数、平均数:众数:在一组数据中,出现次数最多的数据。中位数:将一组数据按大小依次排列,把处在中间位置的一个数据(或中间两个数据的平均数)叫做这组数据的中位数。平均数:2、样本标准差:3方差在刻画样本数据的分散程度上,方差和标准差是一样的,但在解决实际问题时,一般多采用标准差。用样本的数字特征估计总体的数字特征分两类:a) 用样本平均数估计总体平均数。b) 用样本标准差估计总体标准差。样本容量越大,估计就越精确。特点:(1)平均数对数据有“取齐”的作用,代表一组数据的平均水平。(2)标准差描述一组数据围绕平均数波动的大小,反映了一组数据变化的幅度。4用样本估计总体时,如果抽样的方法比较合理,那么样本可以反映总体的信息,但从样本得到的信息会有偏差。在随机抽样中,这种偏差是不可避免的。虽然我们用样本数据得到的分布、均值和标准差并不是总体的真正的分布、均值和标准差,而只是一个估计,但这种估计是合理的,特别是当样本量很大时,它们确实反映了总体的信息。4(1)如果把一组数据中的每一个数据都加上或减去同一个共同的常数,标准差不变(2)如果把一组数据中的每一个数据乘以一个共同的常数k,标准差变为原来的k倍(3)一组数据中的最大值和最小值对标准差的影响,区间的应用;“去掉一个最高分,去掉一个最低分”中的科学道理2.3.2两个变量的线性相关1、概念: 如果散点图中点的分布从整体看大致分布在一条直线的附近,我们称这两个变量之间具有线性相关关系,这条直线叫回归直线. (1)回归直线方程 :,(*) , 其中b是回归方程的斜率,a是截距.系数4.求线性回归方程的步骤:(1)计算平均数;(2)计算的积,求;(3)计算;(4)将结果代入公式,求b;(5)用 ,求a;(6)写出回归方程 2最小二乘法3直线回归方程的应用 (1)描述两变量之间的依存关系;利用直线回归方程即可定量描述两个变量间依存的数量关系 (2)利用回归方程进行预测;把预报因子(即自变量x)代入回归方程对
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 保护边境人员管理办法
- 仓库盘点管理办法流程
- 企业仓储物资管理办法
- 仓库货物出租管理办法
- 保税仓储收费管理办法
- 保险日常活动管理办法
- 产业资金扶持管理办法
- 临沂档案查询管理办法
- 传媒集团管理办法细则
- 企业委托安全管理办法
- 小学生卫生健康知识讲座
- 自尊主题班会课件
- 基金公司印章管理办法
- 海洋经济政策效果评估
- 工厂安全生产吹哨人制度模板
- 煤矿井下工程预算课件
- 徳龙全自动咖啡机ECAM 22.110.SB 中文使用说明书
- 2025江苏扬州大数据集团子公司管理人员招聘1人笔试备考题库及一套完整答案详解
- 高三一轮复习学案 铁及其重要化合物(课中案)
- 单刀赴会课本剧:演绎三国英雄的高光时刻
- 同等学力申硕临床医学学科综合水平考试历年真题题库-上(A1题)
评论
0/150
提交评论