




已阅读5页,还剩43页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
统计初步推断统计的基本原理,2,“分布”,3,直方图用长条的面积来表示频次或相对频次;折线图用直线连接直方图中条形顶端的中点;当组距逐渐减小时,折线将逐渐平滑为曲线。,某报100期新闻数量的频率分布直方图,25,26,29,31,33,35,新闻数量(条),频率,30,27,28,32,34,36,20%,10%,15%,5%,25%,200期新闻数量的频率分布直方图,频率,新闻数量(条),25,26,27,28,29,30,31,32,33,34,35,36,5%,10%,15%,20%,25%,样本容量增大时频率分布直方图,频率,总体密度曲线,新闻数量(条),总体密度曲线,新闻数量(条),8,一、正态分布,9,1.1什么是正态分布?,1、由德国数学家高斯提出,也叫高斯分布;2、自然界、社会经济生活中大量存在的分布规律;3、经典统计推断的基础;4、在所有的分布中,正态分布居于首要位置;,10,1.2正态分布的基本特征,特征一:一个高峰特征二:一条对称轴特征三:一条渐近线,M0Md=,众值=中位值均值,11,1.3两个参数的影响(,),均值(读“miu”),标准差(的小写形式,读“西格玛”),形状参数,位置参数,12,1.3.1对正态曲线的影响,123,正态曲线的位置由均值决定;,13,1.3.2对正态曲线的影响,曲线A和B的比较,14,正态曲线的形状“高,矮,胖,瘦”的特点由标准差决定;当较小时,曲线“高”且“瘦”;当较大时,曲线“矮”且“胖”。,15,1.4正态曲线下面积的涵义,随机变量的频次总和;一般把正态曲线下的总面积约等于1,这时一定区间内的频次分布表现为概率分布。,16,1.5正态曲线的一个重要性质,无论正态曲线具有哪种均值和标准差,在均值和横坐标某一点的距离内(用标准差来表示)曲线下的面积是常数。下图说明此意。,17,正态曲线下的面积(图),-,+,68.26%,95.44%,二、抽样分布,三种分布:总体分布、样本分布、抽样分布,总体中各元素的观察值所形成的分布分布通常是未知的可以假定它服从某种分布,总体分布(populationdistribution),一个样本中各观察值的分布也称经验分布(Empiricaldistribution)当样本容量n逐渐增大时,样本分布逐渐接近总体的分布,样本分布(sampledistribution),抽样分布(samplingdistribution),抽样分布的形成过程,是一种理论概率分布样本统计量是随机变量样本均值,样本比例,样本方差等结果来自容量相同的所有可能样本是进行推断的理论基础,也是抽样推断科学性的重要依据,例:假设有10个人,他们接受教育的年限分别为6,7,8,9,10,11,12,13,14,15年。如果一次抽1个人,那可以有10种抽样方法,可得出10个样本统计值的分布;如果一次抽2个人,那么有45种抽样方法,可以得出45个样本统计值的分布;,如果一次抽3个人,那么有120种抽样方法,可以得出120个样本统计值的分布;如果一次抽4个人,那么有210种抽样方法,可以得出210个样本统计值的分布;如果一次抽5个人,那么有252种抽样方法,可以得出252个样本统计值的分布;,三、统计推断,统计推断,点估计,区间估计,参数估计,假设检验,参数假设检验,非参数假设检验,29,样本与总体,总体(Population)所关心的所有元素的集合样本(Sample)从总体中按一定方式抽取出的一部分元素的集合,30,统计量与参数值,参数值(Parameter)总体的数字特征,通常用希腊字母表示;例如总体均值,总体标准差;统计量(Statistic)样本的概括性测度值,通常用罗马字母表示;例如样本均值,样本标准差S。,(一)参数估计1.点估计(pointestimate),用样本的估计量直接作为总体参数的估计值例如:用样本均值直接作为总体均值的估计例如:用10位同学的平均身高来估计全班同学的平均身高。没有给出估计值接近总体参数程度的信息点估计的方法有矩估计法、顺序统计量法、最大似然法、最小二乘法等,2、区间估计(intervalestimate),在点估计的基础上,给出总体参数估计的一个区间范围,该区间由样本统计量加减抽样误差而得到的根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量比如,某班级平均分数在7585之间,置信水平是95%,区间估计的图示,(二)假设检验,8.1,若对参数有所了解,但有怀疑猜测需要证实之时,用假设检验的方法来处理,假设检验的一般步骤,3.抽样,根据样本观察值确定接受还是拒绝H0,假设检验的一般提法是:在给定备择假设H1下,利用样本对原假设H0作出判断,若拒绝原假设H0,那就意味着接受备择假设H1,否则,就接受原假设H0。反证法,为什么要通过检验原假设来检验研究假设?,张三、李四在考试中有没有舞弊?曾参杀人、三人成虎的故事?,假设检验的基本思想,假设检验的基本思想,.因此我们拒绝假设=50,样本均值,m,=50,抽样分布,H0,怎么通过检验原假设来检验研究假设?通过显著性水平显著怎么理解?试着用“显著”造句。发生概率小才称显著。我们常说少见多怪,也是这个意思,见到概率小的事件,当会另眼相看(显著)。简而言之,显著性水平,就是小概率的标准。,显著性水平即小概率水平为多少?概率是01之间的一个数,因此小概率就是接近0的一个数著名的英国统计家RonaldFisher把20分之1作为标准,也就是0.05,从此0.05或比0.05小的概率都被认为是小概率。Fisher没有任何深奥的理由解释他为什么选择0.05,只是说他忽然想起来的常用的值有0.01,0.05,0.10,小概率原理发生概率很小的随机事件(小概率事件)在一次实验中几乎是不可能发生的。根据这一原理,可以先假设总体参数的某项取值为真,也就是假设其发生的可能性很大,然后抽取一个样本进行观察,如果样本信息显示出现了与事先假设相反的结果且与原假设差别很大,则说明原来假定的小概率事件在一次实验中发生了,这是一个违背小概率原理的不合理现象,因此有理由怀疑和拒绝原假设;否则不能拒绝原假设。检验中使用的小概率是检验前人为指定的。,小概率原理举例:,某工厂质检部门规定该厂产品次品率不超过4方能出厂。今从1000件产品中抽出10件,经检验有4件次品,问这批产品是否能出厂?如果假设这批产品的次品率P4,则可计算事件“抽10件产品有4件次品”的出现概率为:可见,概率是相当小的,1万次实验中可能出现4次,然而概率如此小的事件,在一次实验中居然发生了,这是不合理的,而不合理的根源在于假设次品率P4,因而认为假设次品率P4是不能成立的,故按质检部门的规定,这批产品不能出厂。,假设检验的两个特点:,第一,假设检验采用逻辑上的反证法,不直接检验一个H1(备择假设)是否成立,而是通过检验相反假设H0(原假设)是否成立来达到目的。,第二,假设检验采用的反证法带有概率性质。所谓假设的不合理不是绝对的,而是基于实践中广泛采用的小概率事件几乎不可能发生的原则。至于事件的概率小到什么程度才算是小概率事件,并没有统一的界定标准,而是必须根据具体问题而定。如果一旦判断失误,错误地拒绝原假设会造成巨大损失,那么拒绝原假
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 大唐电力大兴安岭地区2025秋招半结构化面试模拟30问及答案
- 达州市中石化2025秋招笔试模拟题含答案炼油工艺技术岗
- 中国移动宜春市2025秋招企业文化50题速记
- 外墙真石漆施工方案
- 大庆市中石油2025秋招面试半结构化模拟题及答案炼油设备技术岗
- 攀枝花市中石化2025秋招面试半结构化模拟题及答案炼化装置操作岗
- 五级祈祷测试题及答案
- 2025湖南永州市东安县招聘第一批就业见习岗位121人考前自测高频考点模拟试题及答案详解(名师系列)
- 2025年武汉工程大学人才引进33人考前自测高频考点模拟试题及答案详解(考点梳理)
- 2025河北省人民医院招聘考前自测高频考点模拟试题及参考答案详解一套
- 采光顶玻璃拆除施工方案
- 医院电梯乘坐安全培训课件
- 《公共机构建筑机电系统调适技术导则》
- 测控技术与仪器技术面试
- 三年级数学简便计算300题及答案
- 生涯发展报告
- 企业活跃度分析报告
- 管理学原理说课课件
- 关于自愿放弃缴纳社保协议书
- 梦想课程《去远方》(版)分享课程
- 2023年政府采购评审专家考试真题模拟汇编(共681题)
评论
0/150
提交评论