




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、/内容提要/ 总体样本、频数数(频率)直直方图 一、内容提要:1、总体与样本本2、频数直方图图二、考试大纲1.掌握总体与与样本的概念念和表示方法法2.熟悉频数(频率)直方图三、内容讲解 第三节 统计基基础知识一、总体与样本本(一)总体与个个体研究对象的全体体为总体,构构成总体的每每个成员称为为个体。若研究对象用某某个数量指标标来表示,那那么将每个个个体具有的数数量指标x称为个体,这这样一来,总总体可以看做做是一个随机机变量X,总体就是是某数量指标标值x的全体(即一堆数),这一堆数数有一个分布布,从而总体体可用一个分分布描述,简简单地说,总总体就是一个个分布。(1)研究总体体是什么分布布?(2)
2、这个总体体(即分布)的均值、方方差(或标准差)是多少?例1.3-11 (1)对某产品仅仅考察其合格格与否,记合合格品为0,不合格品品为1,那么:总体=该产品品的全体=由0或1组成的一堆堆数。这一堆数的分布布是什么呢?若记1在总体中所所占比例为PP,则该总体体可用二点分分布b(1,p)(n=l的二项分分布)表示: X0 1P1-p p 比如,有两个工工厂生产同一一产品,甲厂厂的不合格品品率p=0.01,乙厂厂的不合格品品率p=0.08,甲乙两两厂所生产的的产品(即两两个总体)分分别用如下两两个分布描述述:X甲0 1P X乙0 1P 如此认识总体,既既能看到总体体的本质,又又能看到不同同总体的差别
3、别。(2)考察某橡橡胶件的抗张张强度,它可可用0到上一个个实数表示,这这时总体可用用区间0,上的一个概概率分布表示示。通过研究究,认为橡胶胶件的抗张强强度服从正态态分布,该总总体常称为正正态总体。这这时统计要研研究的问题是是:正态均值是多多少?正态分布方方差是多少?又如若对橡橡胶件进行技技术改进,如如通过改进配配料,提高了了该橡胶件抗抗张强度的均均值(见图1.3-1)。这时时我们要研究究的问题是:技术改进前前后的正态均均值有多大改改变?(3)用非对称称分布(即偏态分布布)描述的总体体也是常见的的。比如某型型号电视机寿寿命的全体所所构成的总体体就是一个偏偏态分布(见图1.3-2)。 样本 (二)
4、样本从总体中抽取部部分个体所组组成的集合称称为样本。样样本中所包含含的个体的个个数称为样本本量,常用nn表示。人们从总体中抽抽取样本是为为了认识总体体,即从样本本推断总体,如如推断总体是是什么类型的的分布?总体体均值为多少少?总体的标准准差是多少?为了使此种种统计推断有有所依据,推推断结果有效效,对样本的的抽取应有所所要求。满足下面两个条条件的样本称称为简单随机机样本,简称称随机样本。(1)随机性。总总体中每个个个体都有相同同的机会。比比如,按随机机性要求抽出出5个样品,记记为X1,X2,X5,则其中每每一个个体的的分布都应与与总体分布相相同。只要随随机抽样就可可保证此点实实施。 (2)独立性
5、。从从总体中抽取取的每个个体体对其他个体体的抽取无任任何影响。假假如总体是无无限的,独立立性容易实现现;若总体很很大,特别地地,与样本量量n相比是很大大时,即使总总体是有限的的,此种抽样样独立性也可可得到基本保保证。综上两点,随机机样本X1,X2,Xn可以看做n个相互独立立的、同分布布的随机变量量,每一个个个体的分布与与总体分布相相同。今后讨讨论的样本都都是指满足这这些要求的简简单随机样本本。在实际中中抽样时,也也应按此要求求从总体中进进行抽样。这这样获得的样样本能够很好好地反映实际际总体。图11.3-3显显示两个不同同的总体,图图上用虚线画画出的曲线是是两个未知总总体。若是按按随机性和独独立
6、性要求进进行抽样,则则机会大的地地方 (概率率密度值大)被抽出的样样品就多;而而机会少的地地方(概率密度值值小),被抽出的的样品就少。分分布愈分散,样样本也很分散散;分布愈集集中,样本也也相对集中。 抽样切忌受到干干扰,特别是是人为干扰。某某些人为的倾倾向性会使所所得样本不是是简单随机样样本,从而使使最后的统计计推断失效。若是从总体X中中获得的样本本,那么是独独立同分布的的随机变量。样样本的观测值值用表示,这这也是我们常常说的数据。有有时,为了方方便起见,不不分大写与小小写,样本及及其观测值都都用表示,今今后将采用这这一方法表示示。 例1.3-2例1.3-22 样本的例子子及表示方法法。(1)
7、某食品厂厂用自动装罐罐机生产净重重为345gg的午餐罐头头。由于生产产中众多因素素的干扰,每每只罐头净重重都有差别,现现从生产线上上随机抽100个罐头,称称其净重,得得: 3443363453420 338344348344346 这就是样本量为为10的一个样样本,它是来来自该生产线线上罐头净重重这个总体的的一个样本。 (2)某型号的的20辆汽车记记录了各自每每加仑汽油行行驶的里程数数(单位:kkm)如下: 29.827.628.328.727.930.129.928.028.727.928.529.527.226.928.427.928.030.029.629.1 这是来自该型号号汽车每加仑
8、仑汽油行驶里里程这个总体体的一个样本本,样本量是是20。 (3)(分组样样本)对3663个零售商商店调查其周周零售额(单单位:千元)的的结果如下表表1.3-11所示:表1.3-1 周零零售额的调查查结果(单位位:千元) 零售额(1,5(5,10(10,20(20,30商店数611351104215 这是一个样本量量为363的样本本,对应的总总体是该地区区全部零售商商店的周零售售额。这个样样本与前两个个样本不同,它它仅给出样本本所在区间,没没有给出具体体的零售额。这这样做虽会失失去一些信息息,但要准确确获得每个零零售店的周零零售额并非易易事,能做到到的是把区间间再缩小一些些。这种样本本称为分组样样本。在样本本量n很大时,比比如几百甚至至上千个,罗罗列所有数据据非常不便,且且使人眼花缭缭乱,不得要要领,这时可可把样本作初初步整理转化化为分组样本本并加以表达达,这样可立立即给人一个个大致的印象象。以后在作作频率直方图图时,也要用用到这个方法法。(4)(有序样样本)设是从从某总体随机机抽取的一个个样本。将它它们按从小到到大的顺序排排列为,这便便是有序样本本。比如,在在本例中(11)的样本量量为10的样本,经经排序可得如如下的有序样样本:从有序样本可获获得一些有用用信息。比如如,样本中的的最小值为最最大值为,两两者之差,即样本极差差。这些量对对
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 岚山保安考试题及答案
- 课件显示不全的原因
- 四川省广元市川师大万达中学2025-2026学年高二上学期第一次月考(8月)物理试题
- 酒店工程考试题及答案
- 后勤管理员三级安全教育(班组级)考核试卷及答案
- 精准扶贫考试题及答案
- 进阶物理考试题及答案
- 铸管精整操作工技能巩固考核试卷及答案
- 幻灯机与投影机维修工应急处置考核试卷及答案
- 清罐操作工晋升考核试卷及答案
- 江苏省扬州市2025年中考语文试卷(含答案)
- 2025年版《煤矿安全规程》考试题库(含答案)
- 押运员持枪证考试试题及答案
- 二次供水卫生监督课件
- 2025浙江省储备粮管理集团有限公司所属企业招聘7人(第一批)笔试参考题库附带答案详解(10套)
- 常州墓地管理办法
- 麻精药品管理课件
- 2025年潍坊市中考英语试卷(含答案解析)
- GB/T 45933-2025养老机构康复辅助器具基本配置
- 实验室生物安全监督制度
- 中国城市轨道交通全自动运行系统技术指南
评论
0/150
提交评论