版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、用样本的频率估计总体分布分层抽样系统抽样随机数法抓阄抽签简单随机抽样抽样方法)(用样本的频率估计总体分布类别类别共同点共同点各自特点各自特点相互联系相互联系适用范围适用范围 简单随机简单随机 抽样抽样 系统系统 抽样抽样 分层抽样分层抽样三种抽样方式比较三种抽样方式比较1.不放不放回抽样回抽样2.抽样过抽样过程中程中,每每个个体个个体被抽取被抽取的机会的机会均等均等从总体中从总体中逐个抽取逐个抽取将总体均分为将总体均分为几部分几部分,按简单按简单随机抽样抽取随机抽样抽取第一个样本,第一个样本,然后按相同的然后按相同的间隔抽取其他间隔抽取其他样本样本将总体分成将总体分成几层,分层几层,分层进行抽
2、取进行抽取 抽取第一抽取第一个样本时个样本时采用简单采用简单随机抽样随机抽样 各层抽样时,各层抽样时,采用简单随采用简单随机抽样或系机抽样或系统抽样统抽样总体中的个总体中的个体数较少体数较少总体中的个体总体中的个体数较多数较多 (间隔相同的间隔相同的时间或距离时间或距离)总体由差异总体由差异明显的几部明显的几部分组成分组成用样本的频率估计总体分布1某单位有老年人某单位有老年人28人,中年人人,中年人54人,青人,青年人年人81人为了调查他们的身体状况,需从人为了调查他们的身体状况,需从他们中抽取一个容量为他们中抽取一个容量为36的样本,最适合抽的样本,最适合抽取样本的方法是取样本的方法是( )
3、A简单随机抽样简单随机抽样 B系统抽样系统抽样 C分层抽样分层抽样 D先从老年人中剔除一人,然后分层抽样先从老年人中剔除一人,然后分层抽样D课堂练习课堂练习用样本的频率估计总体分布2.从从2004名学生中选取名学生中选取50名组成参加观团名组成参加观团,若若采用下面的方法选取采用下面的方法选取:先用简单随机抽样从先用简单随机抽样从2004人中剔除人中剔除4人人,剩下的剩下的2000人再按系统抽人再按系统抽样的方法进行样的方法进行,则每人入选的机会则每人入选的机会( ) A.不全相等不全相等 B.均不相等均不相等 C.都相等都相等 D.无法确定无法确定C用样本的频率估计总体分布3.某校高一年级有
4、某校高一年级有x个学生个学生,高二年级有高二年级有y个学个学生生,高三年级有高三年级有z个学生个学生,采用分层抽样抽取一采用分层抽样抽取一个容量为个容量为45人的样本人的样本,高一年级抽取高一年级抽取20人人,高高二年级抽取二年级抽取10人人,高三年级共有学生高三年级共有学生300人人,则则此学校共有此学校共有_人人.900用样本的频率估计总体分布 如何从样本数据中提取基本信息来如何从样本数据中提取基本信息来 估计总体的情况呢?估计总体的情况呢?用样本的频率估计总体分布2.2 2.2 用样本估计总体用样本估计总体一、用样本的频率分布估计总体的分布一、用样本的频率分布估计总体的分布二、用样本的数
5、字特征估计总体的特征二、用样本的数字特征估计总体的特征平均数、中位数、众数、平均数、中位数、众数、极差、方差、标准差极差、方差、标准差频率分布表、频率分布直方图、频率分布表、频率分布直方图、频率折线图、茎叶图频率折线图、茎叶图用样本的频率估计总体分布用样本的频率估计总体分布1、求极差、求极差(即一组数据中最大值与最小值的差即一组数据中最大值与最小值的差) 知道这组数据的变动范围知道这组数据的变动范围4.3-0.2=4.12、决定组距与组数(将数据分组)、决定组距与组数(将数据分组)3、 将数据分组将数据分组(8.2取整取整,分为分为9组组)画频率分布直方图的步骤画频率分布直方图的步骤4、列出、
6、列出频率分布表。频率分布表。5、画出、画出频率分布直方图频率分布直方图.组距组距:指每个小组的两个端点的距离指每个小组的两个端点的距离组数组数:将数据分组,当数据在将数据分组,当数据在100个以内时,个以内时, 按数据多少常分按数据多少常分5-12组。组。4.18.20.5极差组数=组距用样本的频率估计总体分布分组频数频率频率/组距0,0.5)0.5,1)1,1.5)1.5,2)2,2.5)2.5,3)3,3.5)3.5,4)4,4.54815222514 6 4 20.040.080.150.220.250.140.060.040.02频率分布表频率分布表0.080.160.300.440.
7、500.280.120.080.04用样本的频率估计总体分布频率分布直方图如下频率分布直方图如下:月均用水量月均用水量/t频率频率组距组距0.100.200.300.400.500.511.5 22.533.544.5小长方形的小长方形的面积面积=?用样本的频率估计总体分布频率分布直方图如下频率分布直方图如下:月均用水量月均用水量/t频率频率组距组距0.100.200.300.400.500.511.5 22.533.544.5小长方形的面小长方形的面积总和积总和=?用样本的频率估计总体分布频率分布直方图如下频率分布直方图如下:月均用水量月均用水量/t频率频率组距组距0.100.200.300
8、.400.500.511.5 22.533.544.5月均用水量最月均用水量最多的在那个区多的在那个区间间?用样本的频率估计总体分布P174 例例4跟踪练习跟踪练习4用样本的频率估计总体分布注意注意第几组频数(1)第几组频率样本容量(2)纵坐标为纵坐标为:频率组距用样本的频率估计总体分布频率分布直方图如下频率分布直方图如下:月均用水量月均用水量/t频率频率组距组距0.100.200.300.400.500.511.5 22.533.544.5连接频率分布直方图连接频率分布直方图中各小长方形上端的中各小长方形上端的中点中点,得到得到频率分布折频率分布折线图线图用样本的频率估计总体分布利用样本频分
9、布对总体分布进行相应估计利用样本频分布对总体分布进行相应估计(3)当样本容量无限增大,组距无限缩小,)当样本容量无限增大,组距无限缩小,那么频率折线图就会无限接近于一条光滑曲那么频率折线图就会无限接近于一条光滑曲线线总体密度曲线总体密度曲线。(2)样本容量越大,这种估计越精确。)样本容量越大,这种估计越精确。(1)上例的样本容量为)上例的样本容量为100,如果增至,如果增至1000,其频率分布直方图的情况会有什么变化?假如增其频率分布直方图的情况会有什么变化?假如增至至10000呢?呢?用样本的频率估计总体分布总体密度曲线总体密度曲线频率频率组距组距月均用月均用水量水量/tab (图中阴影部分
10、的面积,表示总体在(图中阴影部分的面积,表示总体在某个区间某个区间 (a, b) 内取值的百分比)。内取值的百分比)。用样本的频率估计总体分布 用样本分布直方图去估计相应的总体分布时,用样本分布直方图去估计相应的总体分布时,一般样本容量越大,一般样本容量越大,频率分布直方图频率分布直方图就会无限接就会无限接近近总体密度曲线总体密度曲线,就越精确地反映了总体的分布,就越精确地反映了总体的分布规律,即越精确地反映了总体在各个范围内取值规律,即越精确地反映了总体在各个范围内取值百分比。百分比。 总体密度曲线反映了总体在各个范围内取值的总体密度曲线反映了总体在各个范围内取值的百分比百分比,精确地反映了
11、总体的分布规律。是研究总精确地反映了总体的分布规律。是研究总体分布的工具体分布的工具.总体密度曲线总体密度曲线用样本的频率估计总体分布茎叶图茎叶图 某赛季甲、乙两名篮球运动员每场比赛某赛季甲、乙两名篮球运动员每场比赛得分的原始记录如下:得分的原始记录如下:甲运动员得分:甲运动员得分:13,51,23,8,26,38,16,33,14,28,39乙运动员得分:乙运动员得分: 49,24,12,31,50,31,44,36,15,37,25用样本的频率估计总体分布茎叶图茎叶图甲甲乙乙0123452 55 41 6 1 6 7 94 9 084 6 36 83 8 9 1用样本的频率估计总体分布几种
12、表示频率分布的方法的优点与不足几种表示频率分布的方法的优点与不足1.频率分布表频率分布表在数量表示上比较确切,但不够直在数量表示上比较确切,但不够直观、形象,分析数据分布的总体态势不太方便。观、形象,分析数据分布的总体态势不太方便。2.频率分布直方图频率分布直方图能够很容易地表示大量数据,能够很容易地表示大量数据,非常直观地表明分布的形状,使我们能够看到非常直观地表明分布的形状,使我们能够看到在分布表中看不清楚的数据模式。但是从直方在分布表中看不清楚的数据模式。但是从直方图本身得不出原始的数据内容。图本身得不出原始的数据内容。3.频率分布折线图频率分布折线图的优点是它反映了数据的变化的优点是它
13、反映了数据的变化趋势。如果样本容量不断增大,分组的组距不断趋势。如果样本容量不断增大,分组的组距不断缩小,那么折线图就趋向于总体分布的密度曲线。缩小,那么折线图就趋向于总体分布的密度曲线。4.用用茎叶图茎叶图刻画数据有两个优点:一是所有的信刻画数据有两个优点:一是所有的信息都可以从这个茎叶图中得到;二是茎叶图便于息都可以从这个茎叶图中得到;二是茎叶图便于记录和表示,能够展示数据的分布情况。但当样记录和表示,能够展示数据的分布情况。但当样本数据较多或数据位数较多时,茎叶图就显得不本数据较多或数据位数较多时,茎叶图就显得不太方便了。太方便了。用样本的频率估计总体分布用样本的数字特征估计总体的用样本
14、的数字特征估计总体的数字特征数字特征众数、中位数、平均数众数、中位数、平均数用样本的频率估计总体分布1.三数的概念三数的概念众数众数:_在一组数据中,出现次数最多的数据。在一组数据中,出现次数最多的数据。中位数中位数:_ _ _.平均数平均数:_ _.将一组数据按从大小依次排列,处将一组数据按从大小依次排列,处在最中间位置的一个数据(或两个数在最中间位置的一个数据(或两个数据的平均数)据的平均数) 。一组数据的总和除以数据的个数一组数据的总和除以数据的个数所得的值所得的值.用样本的频率估计总体分布例如例如:5、5、5、6、6、6、6、7、7、7这一这一组数据,它的众数为组数据,它的众数为_;中
15、位数为中位数为_;平均数为平均数为_.666 也可以说平均数为各个不同数字乘以也可以说平均数为各个不同数字乘以相应频率的和。相应频率的和。用样本的频率估计总体分布标准差的概念:标准差的概念: 标准差是样本数据到平均数的一种标准差是样本数据到平均数的一种平平均距离均距离,一般用,一般用s表示。表示。计算标准差的公式:计算标准差的公式:222121()()() nsxxxxxxn用样本的频率估计总体分布【对标准差的理解】【对标准差的理解】 (1)标准差是用来描述样本数据的离散程)标准差是用来描述样本数据的离散程度的,它反映了各个样本数据聚集于样本平度的,它反映了各个样本数据聚集于样本平均数周围的程
16、度。标准差越小,表明各个样均数周围的程度。标准差越小,表明各个样本数据在样本平均数的周围越集中;反之,本数据在样本平均数的周围越集中;反之,标准差越大,表明各个样本数据在样本平均标准差越大,表明各个样本数据在样本平均数的两边越分散。数的两边越分散。 (2)在实际应用中,标准差常被理解为)在实际应用中,标准差常被理解为稳定性。稳定性。用样本的频率估计总体分布(3)标准差的取值范围是什么?标准差为)标准差的取值范围是什么?标准差为0的样本数据有什么特点?的样本数据有什么特点?答:标准差是非负的。标准差为答:标准差是非负的。标准差为0意味着所意味着所有的样本数据都相等的特性,且与样本平均有的样本数据
17、都相等的特性,且与样本平均数也相等。数也相等。用样本的频率估计总体分布标准差的平方标准差的平方s2方差方差2222121()()() nsxxxxxxn用样本的频率估计总体分布例例2(08山东山东)从某项综合能力测试中抽从某项综合能力测试中抽取取100人的成绩,统计如表,则这人的成绩,统计如表,则这100人人成绩的标准差为成绩的标准差为()分数54321人数2010303010用样本的频率估计总体分布例例3某化肥厂甲、乙两个车间包装肥料,某化肥厂甲、乙两个车间包装肥料,在自动包装传送带上每隔在自动包装传送带上每隔30min抽取一包抽取一包产品,称其重量,分别记录抽查数据如产品,称其重量,分别记
18、录抽查数据如下:下:甲:甲:102,101,99,98,103,98,99;乙:乙:110,115,90,85,75,115,110.(1)这种抽样方法是哪一种?这种抽样方法是哪一种?(2)将这两组数据用茎叶图表示;将这两组数据用茎叶图表示;(3)将两组数据比较,说明哪个车间产品较将两组数据比较,说明哪个车间产品较稳定稳定用样本的频率估计总体分布用样本的频率估计总体分布在频率分布直方图中如何求在频率分布直方图中如何求众数众数?月均用水量月均用水量/t频率频率组距组距0.100.200.300.400.500.511.5 22.533.544.5众数:频率分布直方图众数:频率分布直方图中中最高最高小长方形底边中小长方形底边中点的点的横坐标横坐标. 左图中,众数为左图中,众数为_.2.25用样本的频率估计总体分布在频率分布直方图中如何求在频率分布直方图中如何求中位数中位数?月均用水量月均用水量/t频率频率组距组距0.100.200.300.400.500.511.5 22.533.544.5中位
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 法律事务部合同审核标准流程
- 2026山东潍坊市寿光市选聘市外骨干教师25人笔试模拟试题及答案解析
- 2026西南证券股份有限公司招聘30人笔试参考题库及答案解析
- 2026丽水景宁畲族自治县事业单位招聘31人-统考笔试参考题库及答案解析
- 2026上海第一财经传媒有限公司招聘2人笔试备考题库及答案解析
- 2026福建莆田市秀屿区市场监督管理局招聘编外食品安全协管员1人笔试备考题库及答案解析
- 数字化转型中的企业管理策略
- 2026北京市农业农村局所属事业单位招聘19人笔试模拟试题及答案解析
- 2026年河北石家庄灵寿县招聘青年就业见习岗位人员笔试备考题库及答案解析
- 2026中国太平春季校园招聘笔试备考题库及答案解析
- 部编版三年级下册语文课课练全册(附答案)
- 军用靶场设计方案
- 管理会计学 第10版 课件 第3章 本-量-利分析
- Unit 3 Zhong Nanshan- Part B(小学英语教学)闽教版英语五年级下册
- 消防维保方案(消防维保服务)(技术标)
- 车辆交通危险点分析预控措施
- QC成果提高SBS防水卷材铺贴质量一次合格率
- 大舜号海难事故案例分析
- TGRM 057.1-2023 非煤岩岩爆倾向性评价规范 第1部分:室内指标测定及等级分类
- 2023年安徽新闻出版职业技术学院单招考试职业技能考试模拟试题及答案解析
- LY/T 2271-2014造林树种与造林模式数据库结构规范
评论
0/150
提交评论