版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、1 .统计学是收集、分析、表述和解释数据的科学(不列颠百科全书)按照计量层次分:分类数据、顺序数据、数值型数据按收集方法分:观测数据和实验数据按时间状况分:截面数据和时间序列数据总体:所研究的全部个体(数据)的集合,其中的每一个个体也称为元素样本:从总体中抽取的一部分元素的集合,构成样本的元素的数目称为样本容量或样本量参数:描述总体特征的概括性数字度量,是研究者想要了解的总体的某种特征值,所关心的参数主要有总体均 值(?)、标准差(?)、总体比例等统计量:用来描述样本特征的概括性数字度量,它是根据样本数据计算出来的一些量,是样本的函数,所关心 的样本统计量有样本均值(?x)、样本标准差(s)、
2、样本比例(p)等数据的间接来源:系统外部的数据和系统内部的数据二手数据的特点:搜集容易,采集成本低、作用广泛、在研究中应优先考虑二手数据的可靠性评估:数据是谁搜集的?为什么目的而搜集的?数据是怎样搜集的?什么时候搜集的?数据的直接来源:调查数据、实验数据概率抽样的特点:按一定的概率以随机原则抽取样本,每个单位被抽中的概率是巳知的,或是可以计算出来 的,当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率简单随机抽样:从总体N个单位中随机地抽取n个单位作为样本,每个单位入抽样本的概率是相等的,最基 本的抽样方法,是其它抽样方法的基础。分层抽样:将抽样单位按某种特征或某种规则划分为不同
3、的层,然后从不同的层中独立、随机地抽取样本整群抽样:将总体中若干个单位合并为组(群),抽样时直接抽取群,然后对中选群中的所有单位全部实施调查系统抽样:将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始 单位,然后按事先规定好的规则确定其它样本单位。先从数字1到k之间随机抽取一个数字r作为初始单位,以 后依次取r+k,r+2k等单位多阶段抽样:先抽取群,但并不是调查群内的所有单位,而是再进行一步抽样,从选中的群中抽取出若干个 单位进行调查非概率抽样:相对于概率抽样而言。抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用 某种方式从总体中抽出部分单位
4、对其实施调查。有方便抽样、判断抽样、自愿样本、滚雪球抽样、配额抽样等方 式方便抽样:调查过程中由调查员依据方便的原则,自行确定入抽样本的单位判断抽样:研究人员根据经验、判断和对研究对象的了解,有目的选择一些单位作为样本自愿样本:被调查者自愿参加,成为样本中的一分子,向调查人员提供有关信息滚雪球抽样:先选择一组调查单位,对其实施调查之后,再请他们提供另外一些属于研究总体的调查对象,调 查人员根据所提供的线索,进行此后的调查。这个过程持续下去,就会形成滚雪球效应配额抽样:先将总体中的所有单位按一定的标志(变量)分为若干类,然后在每个类中采用方便抽样或判断抽样 的方式选取样本单位概率抽样与非概率抽样
5、的比较:概率抽样依据随机原则抽选样本;样本统计量的理论分布存在可根据调查的结果推断总体非概率抽样:不是依据随机原则抽选样本样本统计量的分布是不确定的无法使用样本的结果推断总体问卷调查的方式:自填式问卷调查;面访式问卷调查;电话式问卷调查实验往往将研究对象分为两组:实验组和对照组抽样误差:由于抽样的随机性所带来的误差,它是所有样本可能的结果与总体真值之间的平均性差异。影响抽样误差的大小的因素:样本量的大小,总体的变异性非抽样误差。相对抽样误差而言,除抽样误差之外的,由于其他原因造成的样本观察结果与总体真值之间的 差异。存在于所有的调查之中:有抽样框误差、回答误差、无回答误差、调查员误差、测量误差
6、非抽样误差的控制:调查员的挑选,调查员的培训,督导员的调查专业水平,调查过程控制原始数据审核的要点:完整性审核;准确性审核;适用性审核;时效性审核数据的排序与筛选要用到excel中哪个选项按钮?分类数据的排序:汉字型数据,可按汉字的首位拼音字母排列,也可按笔画排序,其中也有笔画多少的升序 降序之分数据的整理与显示:对分类数据和顺序数据主要是作分类整理,对数值型数据则主要是作分组整理。适合于低层次数据的整理和显示方法也适合于高层次的数据;但适合于高层次数据的整理和显示方法并不适 合于低层次的数据饼图:也称圆形图,是用圆形及圆内扇形的角度来表示数值大小的图形,主要用于表示样本或总体中各组成 部分所
7、占的比例,用于研究结构性问题环图与饼图区别:饼图只能显示一个总体各部分所占的比例,环形图则可以同时绘制多个样本或总体的数据 系列,每一个样本或总体的数据系列为一个环确定组数:在实际分组时,组数一般为5?K ?15做图形时,图形的长宽比例大致为10 : 7二维散点图展示二个变量之间的关系气泡图展示三个变量之间的关系雷达图是展示多个变量之间关系的图形众数:一组数据中出现次数最多的变量值。不受极端值的影响。一组数据可能没有众数或有几个众数。主要用于分类数据,也可用于顺序数据和数值 型数据。中位数:排序后处于中间位置上的值。不受极端值的影响主要用于顺序数据,也可用数值型数据,但不能用 于分类数据 46
8、中位数位置=土2个家庭的人均月收入数据原始数据:1500 750 780 1080 850 960 2000 1250 1630个家庭的人均月收入数据排 序: 660 750 780 850960 1080 1250 1500 1630 2000平均数集中趋势的最常用测度值易受极端值的影响有简单平均数和加权平均数之分一位投资者购持有一种股票,在2000、2001、2002和2003年收益率分别为、。计算该投资者在这 四年内的平均收益率51.不同品牌饮料的频数分布饮料品牌频数比例百分比(%)饮料品牌频数比例百分比(%)果汁612矿泉水1020绿茶1122其他816碳酸饮料1530合计501100
9、52.四分位差上四分位数与下四分位数之差Qd = QU - QL反映了中间50%数据的离散程度不受极端值的影响用于衡量中位数的代表性方差和标准差数据离散程度的最常用测度值反映了各变量值与均值的平均差异经验法则表明:当一组数据对称分布时约有68%的数据在平均数加减1个标准差的范围之内约有95%的数据在平均数加减2个标准差的范围之内约有99%的数据在平均数加减3个标准差的范围之内离散系数标准差与其相应的均值之比对数据相对离散程度的测度消除了数据水平高低和计量单位的影响用于对不同组别数据离散程度的比较概率非负性对任意事件A,有0 ? P(A) ? 1规范性必然事件的概率为1;不可能事件的概率为0。即
10、P ( ? ) = 1; P ( ? ) = 0可加性若 A 与 B 互斥,则 P ( AUB ) = P ( A ) + P ( B )推广到多个两两互斥事件 A1,A2,,An,有 P (A1UA2U UAn)= P ( A1 ) + P(A2) +P(An)连续型随机变量的概率分布连续型随机变量可以取某一区间或整个实数轴上的任意一个值它取任何一个特定的值的概率都等于0不能列出每一个值及其相应的概率设XN(0, 1),求以下概率:P(X 2);(3) P(-1X ?3) ;(4) P(|X | ? 2)解:(1) P(X 2)=1- P(X ? 2)=P(-1X ?3)= P(X ?3)-
11、 P(X -1)=?(3)- ?(-1)= ?(3) - 1-?(1)P(|X | ? 2) = P(-2? X ? 2)= ?(2)- ?(-2)=?(2)- 1-?(2)=2 ?(2)- 1=设XN(5, 32),求以下概率P(X ?10) ;(2) P(2X 10)设X1, X2,Xn是从总体X中抽取的容量为n的一个样本,如果由此样本构造一个函数T(X1, X2,Xn),不 依赖于任何未知参数,则称函数T(X1,X2,Xn)是一个统计量样本均值、样本比例、样本方差等都是统计量样本统计量的概率分布,是一种理论分布枷、t分布、F分布,常称之为统计三大分布。分旅的变量值始终为正可加性:若U和V
12、为两个独立的?2分布随机变量,顶?2(n1),V?2(n2),则U+V这一随机变量服从自由度为 n1+n2的?2分布从均值为?,方差为? 2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服 从均值为U、方差为o2/n的正态分布设从一个均值为10、标准差为的总体中随机选取容量为36的样本。假定该总体不是很偏的,要求:计算样本均值小于的近似概率。计算样本均值超过的近似概率。计算样本均值在总体均值10附件范围内的近似概率。样本比例的数学期望重复抽样,样本比例的方差为:设X N(9,22 ),试描述10X的抽样分布。解: X N(9,22),根据上述性质10X也服从正态分布,
13、由于E(10X)=10E(X)=90D(10X)=100D(X)=100 X 22=400所以 10X N (90,400)常用的置信水平值有99%, 95%, 90%,相应的??为,一家食品生产企业以生产袋装食品为主,为对食品质量进行监测,企业质检部门经常要进行抽检,以分析每 袋重量是否符合要求。现从某天生产的一批食品中随机抽取了 25袋,测得每袋重量如下表所示。巳知产品重量 的分布服从正态分布,且总体标准差为10g。试估计该批产品平均重量的置信区间,置信水平为95%25袋食品的重量解:巳知XN(?,102),n=25,1-?=95%,z?/2=。根据样本数据计算得:由于是正态总体,且方差巳
14、知。总体均值?在1-?置信水平下的置信区间为。由于是正态总体,且解:巳知XN(?,102),n=25, 1-?=95% z?/2=。根据样本数据计算得:。由于是正态总体,且方差巳知。总体均值?在1-?置信水平下的置信区间为该食品平均重量的置信区间为该食品平均重量的置信区间为71. 一家保险公司收集到由36个投保人组成的随机样本,得到每个投保人的年龄(单位:周岁)数据如下表。试建 立投保人平均年龄90%的置信区间36个投保人年龄的数据233539273644364246433133425345544724342839364440394938344850343945484532解:巳知n=36,
15、1-? = 90%, z?/2=。根据样本数据计算得: 总体均值?在1-?置信水平下的置信区间为x N.g 壬厂 39、壬士 LS * 碧=39.5 2.13(37)投保人平均年龄的置信区间为岁岁已知某种灯泡的寿命服从正态分布,现从一批灯泡中随机抽取16只,测得其使用寿命(单位:h)如下。建立 该批灯泡平均使用寿命95%的置信区间16灯泡使用寿命的数据1510152014801500145014801510152014801490153015101460146014701470解:巳知XN(?, ?2), n=16, 1-? = 95%, t?/2=根据样本数据计算得:,总体均值?在1a置信水
16、平下的置信区间为74 77卫 1490 2.131 xT V16= 1490 13 .2该种灯泡平均使用寿命的置信区间为某城市想要估计下岗职工中女性所占的比例,随机地抽取了 100名下岗职工,其中65人为女性职工。试以95%的置信水平估计该城市下岗职工中女性比例的置信区间解:巳知 n=100,p = 65% ,1-a = 95%,Zgf 5%E MX E MX 主 LX =ASME(5S .65字该城市下岗职工中女性比例的置信区间为%某机床厂加工一种零件,根据经验知道,该厂加工零件的椭圆度近似服从正态分布,其总体均值为0=0.081mm,总体标准差为=。今换一种新机床进行加工,抽取n=200个
17、零件进行检验,得到的椭圆度为 0.076mm。试问新机床加工零件的椭圆度的均值与以前有无显著差异?(=)解:H : |!= 0.081 H 1: |1。0.081 a= 5 n=200F ft076-ftOSlA 0=/ lr p戒最 a(fc25v200决策:在a = .5的水平上拒绝H0结论:有证据表明新机床加工的零件的椭圆度与以前有显著差异根据过去大量资料,某厂生产的灯泡的使用寿命服从正态分布N(1020,1002)。现从最近生产的一批产品 中随机抽取16只,测得样本平均寿命为1080小时。试在的显著性水平下判断这批产品的使用寿命是否有显著提 高?(=解:H 0:“ 1020H :目10
18、201a = 0.05 n = 16 检验统计量:X-1L 1080-1020 v 艺一。&一 100 而一 决策:在a = 0.05的水平上拒绝H0结论:有证据表明这批灯泡的使用寿命有显著提高某电子元件批量生产的质量标准为平均使用寿命1200小时。某厂宣称他们采用一种新工艺生产的元件质量 大大超过规定标准。为了进行验证,随机抽取了 100件作为样本,测得平均使用寿命1245小时,标准差300小 时。能否说该厂生产的电子元件质量显著地高于规定标准?(=H : 口 V 1200解:H : 口1200a = 0.05n = 100检验统计量:决策: 在a = 0.05的水平上不拒绝H0结论:不能认为该厂生产的元件寿命显著地高于1200小时某机器制造出的肥皂厚度为
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026全国计算机二级考试题及答案
- 2026年交安三类c证考试题型及答案
- 2026年银行私人银行岗招聘考试笔试试题(含答案)
- 水库淹没区及移民安置土地复垦方案报告书
- 2026年疾控中心地方病防制科招聘试题及答案
- 生态旅游度假区项目使用林地可行性报告
- 农业项目水土保持方案报告
- 2025华夏银行西安分行校园招聘笔试历年典型考题及考点剖析附带答案详解
- 2025北京烁科中科信校园招聘笔试历年典型考点题库附带答案详解
- 2025北京京能清洁能源电力股份有限公司华南分公司招聘8人笔试历年备考题库附带答案详解
- 江苏省兴化市顾庄学区2026届中考数学五模试卷含解析
- 2026年中国临床肿瘤学会结直肠癌诊疗指南版
- 2025年湖南省技术产权交易所有限责任公司专业岗位招聘4人笔试参考题库附带答案详解
- AI赋能下北师大版小学数学四年级上册《确定位置》教学设计反思
- 11080《工程数学》国家开放大学期末考试题库
- 2025新疆机场(集团)有限责任公司喀什管理分公司第一季度招笔试备考试题附答案
- 雨课堂学堂在线学堂云《临床流行病学(山东大学)》单元测试考核答案
- 工厂化学品使用安全培训
- 棋牌室场所安全管理制度
- 江苏浩凯丰水力发电科技股份有限公司介绍企业发展分析报告模板
- 电机更换施工方案
评论
0/150
提交评论