版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、几种统计分析模型介绍第1页,共53页,2022年,5月20日,9点17分,星期一张业圳福建师范大学经济学院副教授、博士、财金系副主任主要教学研究方向:数量经济学与金融实证分析联系电话:87369087 Email: Q Q: 107345901地址:福建师范大学经济学院邮编:350108第2页,共53页,2022年,5月20日,9点17分,星期一经济统计分析 统计学研究如何测定、收集、整理、归纳和分析反映客观现象总体数量的数据,以便给出正确认识的方法论科学。 经济统计分析就是用统计方法来分析经济现象数量特征和经济变量之间的关系。主要的工作有:1)分析经济现象中变量之间相互关系2)经济预测3)政
2、策评价第3页,共53页,2022年,5月20日,9点17分,星期一什么是经济统计分析模型模型 对现实的描述和模拟。 用不同方法对现实进行描述和模拟,就构成不同的模型。语义模型、物理模型、几何模型、数学模型和计算机模拟模型。 经济数学模型:用数学方法描述经济活动。采用的数学方法不同,对经济活动提示的程度不同,构成各类不同的经济数学模型。数理经济模型计量经济学模型 第4页,共53页,2022年,5月20日,9点17分,星期一本次培训主要模型1、聚类分析2、回归分析3)因子分析和主成分分析4)时间序列分析第5页,共53页,2022年,5月20日,9点17分,星期一第一部分:预备知识第6页,共53页,
3、2022年,5月20日,9点17分,星期一样本与统计量 总体与样本 在数理统计中,把研究对象的全体称为总体(population)或母体,而把组成总体的每个单元称为个体。 抽样 要了解总体的分布规律,在统计分析工作中,往往是从总体中抽取一部分个体进行观测,这个过程称为抽样。 第7页,共53页,2022年,5月20日,9点17分,星期一样本与统计量 子样 子样 是n个随机变量,抽取之后的观测数据 称为样本值或子样观察值。 在抽取过程中,每抽取一个个体,就是对总体X进行一次随机试验,每次抽取的n个个体 ,称为总体X的一个容量为n的样本(sample)或子样;其中样本中所包含的个体数量称为样本容量。
4、第8页,共53页,2022年,5月20日,9点17分,星期一随机抽样方法的基本要求 独立性即每次抽样的结果既不影响其余各次抽样的 结果,也不受其它各次抽样结果的影响。 满足上述两点要求的子样称为简单随机子样.获得简单随机子样的抽样方法叫简单随机抽样. 从简单随机子样的含义可知,样本 是来自总体 、与总体 具有相同分布的随机变量.代表性即子样( )的每个分量 与总体 具有相同的概率分布。 第9页,共53页,2022年,5月20日,9点17分,星期一简单随机抽样 例如:要通过随机抽样了解一批产品的次品率,如果每次抽取一件产品观测后放回原来的总量中,则这是一个简单随机抽样。 但实际抽样中,往往是不再
5、放回产品,则这不是一个简单随机抽样。但当总量N很大时,可近似看成是简单随机抽样。 例如:为了分析福建省居民家庭收入状况,对福建省居民家庭收入进行调查。第10页,共53页,2022年,5月20日,9点17分,星期一统计量 则 例如: 设 是从正态总体 中抽取的一个样本,其中 为已知参数, 为未知参数,是统计量 不是统计量 定义 设( )为总体X的一个样本, 为不含任何未知参数的连续函数,则称 为样本( )的一个统计量。第11页,共53页,2022年,5月20日,9点17分,星期一几个常用的统计量 样本均值(sample mean)设 是总体 的一个样本,样本方差(sample variance)
6、 第12页,共53页,2022年,5月20日,9点17分,星期一样本均方差或标准差 它们的观测值用相应的小写字母表示.反映总体X取值的平均,或反映总体X取值的离散程度。几个常用的统计量 设 是总体 的一个样本,第13页,共53页,2022年,5月20日,9点17分,星期一子样的K阶(原点)矩几个常用的统计量 设 是总体 的一个样本,子样的K阶中心矩第14页,共53页,2022年,5月20日,9点17分,星期一它包括两个方面数据整理 计算样本特征数数据的简单处理 为了研究随机现象,首要的工作是收集原始数据.一般通过抽样调查或试验得到的数据往往是杂乱无章的,需要通过整理后才能显示出它们的分布状况。
7、数据的简单处理是以一种直观明了方式加工数据。第15页,共53页,2022年,5月20日,9点17分,星期一计算样本特征数: 数据的简单处理 数据整理:将数据分组 计算各组频数 作频率分布表 作频率直方图(1)反映趋势的特征数 样本均值中位数:数据按大小顺序排列后,位置居中的那个数 或居中的两个数的平均数。众数:样本中出现最多的那个数。 第16页,共53页,2022年,5月20日,9点17分,星期一数据的简单处理 (2)反映分散程度的特征数:极差、四分位差 极差样本数据中最大值与最小值之差, 四分位数将样本数据依概率分为四等份的3个数椐, 依次称为第一、第二、第三四分位数。第一四分位数Q1: 第
8、二四分位数Q2: 第三四分位数Q3: 第17页,共53页,2022年,5月20日,9点17分,星期一第二部分:参数估计第18页,共53页,2022年,5月20日,9点17分,星期一第一节 参数的点估计 一、点估计问题 设总体 X 的分布函数的形式为已知的F ( x, ) ,其中 x 是自变量,为未知参数(它可以是一个数,也可以是一个向量)借助于总体 X 的一个样本(X 1, X 2, , X n ),来估计未知参数的值的问题,称为参数的点估计问题 点估计的问题就是要构造一个适当的统计量 ( X1, X2, ,Xn ),用样 本的一组观察值( x1, x2, ,xn ),得到 的观察值 ( x1
9、, x2, ,xn ), 以此来估计未知参数 称统计量 ( X 1, X 2, , X n )为的估计量,称( x1, x2, ,xn )为的估计值第19页,共53页,2022年,5月20日,9点17分,星期一二、矩估计法 的函数,记作l=l( ) 即 ,l=1,2,,k 设总体 X 的分布函数为 , 其中 为 k 个未知参数. 假设总体 X 的各阶原点矩 存在, 则E (X l )是 对于总体 X 的样本( X1, X2, ,Xn ),样本的 l 阶原点矩为 ,l = 1, 2, ,k 令l = Al , l=1,2,,k,第20页,共53页,2022年,5月20日,9点17分,星期一即 从
10、上述方程组中解出 ,分别记作以此作为未知参数 的估计量,称为矩估计量第21页,共53页,2022年,5月20日,9点17分,星期一 如果样本观察值为( x1, x2, ,xn ),则得未知参数 的矩估计值为上述估计未知参数的方法就叫做矩估计法第22页,共53页,2022年,5月20日,9点17分,星期一解此方程组得到 与 的矩估计量为令即解 例1 设总体 X 的均值为,方差为 ,且 ,但与 均未知,又设总体 X 的一个样本为(X1, X2 , , Xn),求与 的矩估计量第23页,共53页,2022年,5月20日,9点17分,星期一 解 由例4可得 例2 某厂生产一批铆钉,现要检验铆钉头部直径
11、,从这批产品中随机抽取12只,测得头部直径(单位:mm)如下: 13.3013.3813.4013.4313.3213.48 13.5413.3113.3413.4713.4413.50设铆钉头部直径这一总体 X 服从正态分布 ,试求 与 的矩估计值 注 此例说明,无论总体 X 服从什么分布,样本均值 都是总体均值 的矩估计量,样本二阶中心矩就是总体方差 的矩估计量第24页,共53页,2022年,5月20日,9点17分,星期一三、极大似然估计法 1设总体X为离散型随机变量,其分布律为其中为未知参数,取值范围为 设 X1, X2, , Xn为来自 X 的样本,则 X1, X2, ,Xn 的联合分
12、布律为 又设 x1, x2, , xn 为一组样本值,令 称 L()为样本的似然函数(1) 若有 ,使得对一切 ,有成立,则称 为的极大( 或最大 )似然估计值,相应的统计量 称为的极大( 或最大 )似然估计量第25页,共53页,2022年,5月20日,9点17分,星期一 我们规定,使得 的 就是的极大似然估计值由于ln x是单增函数,所以 与 有相同的驻点,因此只需从 中解出 就是的极大似然估计值,称方程(2)(2)为极大似然方程第26页,共53页,2022年,5月20日,9点17分,星期一 例3 设总体 , 与 未知,( X1, X2 , , Xn )为总体 X 的样本,求 与的极大似然估
13、计量 解 X 的概率密度为设 x1, x2, xn 为样本值,似然函数为第27页,共53页,2022年,5月20日,9点17分,星期一令解得 与 的极大似然估计值为因此, 与 的极大似然估计量为第28页,共53页,2022年,5月20日,9点17分,星期一四、估计量的评选标准 1无偏性 估计量是样本的函数,它是一个随机变量,由不同的方法得到的估计量可能相同也可能不同而对同一估计量,由不同的样本观察值得到参数的估计值也可能不同我们很自然地要求估计量的期望等于参数的真值,即无偏性 定义 设 是未知参数的估计量,若 ,则称 为的无偏估计(量)第29页,共53页,2022年,5月20日,9点17分,星
14、期一 例4 设总体 X 的均值为 ,( X1, X2, X3 )是总体 X 的样本,证明下列两个估计量都是 的无偏估计 证 由于 所以 与 都是 的无编估计(只需 k1+ k2 + + kn =1,则 = k1 X1 + k2 X2 + + kn Xn 就是 的无偏估计)第30页,共53页,2022年,5月20日,9点17分,星期一 设 为参数的估计量,若当 时, 按概率收敛于 ,即对于任意正数,有 ,则称 为的一致估计(量) 3一致性 根据大数定律可知,样本均值 是总体均值 的一致估计量 设 与 是参数的两个无偏估计量,若 ,则称 比 有效.2有效性第31页,共53页,2022年,5月20日
15、,9点17分,星期一第二节 参数的区间估计 点估计是通过构造统计量 (X1, X2, , Xn)来对总体 X 中的未知参数进行估计,由一个样本值( x1, x2, , xn )可得到的估计值 ( x1, x2, , xn ) 这种估计值是无法知道误差的我们要定出一个范围,并要求以一定的概率保证这个范围包含着的真值这个范围通常以区间的形式给出,我们把这个区间称为置信区间 定义 设总体 X 的分布中含有一个未知参数 ,(X1, X2, , Xn )是来自总体 X 的一个样本如果对于给定的常数 ,统计量 1= 1 (X1, X2, , Xn )与2= 2(X1, X2, , Xn )满足 (1)则称
16、随机区间(1 ,2 )是的置信度为 的置信区间,分别称1与2为的置信下限与置信上限第32页,共53页,2022年,5月20日,9点17分,星期一 例1 设总体 , 为已知, 未知,( X1, X2, ,Xn )为来自总体 X 的一个样本,求 的置信度为 的置信区间 解 由于 是 的无偏估计,且有由正态分布表可查得 ,使 1 称为置信度或置信水平(1)式的含义是,随机区间(1 ,2 )以 的概率包含着 , 也就是说,对每一个样本值 ( x1, x2, , xn )可求得一个具体的区间(1(x1, x2, , xn ),2 (x1, x2, , xn )在这些众多的区间中,包含的有100 ( )
17、%个,不包含的有100 %个第33页,共53页,2022年,5月20日,9点17分,星期一即有取 ,于是得到 的置信度为 的置信区间为第34页,共53页,2022年,5月20日,9点17分,星期一 求未知参数的置信区间的一般方法: 1对于给定的样本X1, X2, , Xn,构造样本函数 ,它包含待估参数 ,而不含其它未知参数,并且 Z 的分布已知,在 Z 的分布中不依赖任何未知参数 2对于给定的置信度 ,定出两个常数 a,b(一般地,按 Z 所服从的分布的上 分位点来确定),使 3从 a Z (X1, X2, , Xn ) b 得到等价的不等式1(X1, X2, , Xn ) 68引例2中的备
18、择假设是双侧的如果根据以往的生产情况,0=68现采用了新工艺,关心的是新工艺能否提高螺钉强度, 越大越好此时,可作如下的假设检验:第48页,共53页,2022年,5月20日,9点17分,星期一当原假设H0 : = 0 = 68为真时,取较大值的概率较小当备择假设H1: 68为真时,取较大值的概率较大给定显著性水平 ,根据可确定拒绝域第49页,共53页,2022年,5月20日,9点17分,星期一因而,接受域称这种检验为右边检验备择假设H1: 68另外,可设原假设H0: 68;若原假设正确,则第50页,共53页,2022年,5月20日,9点17分,星期一但现不知 的真值,只知 0 = 68 小概率事件故取拒绝域显著性水平不超过第51页,共53页,2022年,5月20日,9点17分,星
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 民办合肥经济技术职业学院《歌曲弹唱(Ⅱ)》2024-2025学年第二学期期末试卷
- 2026年中国电建集团核电工程有限公司招聘考试参考题库及答案解析
- 2026陕西省肿瘤医院临床护士招聘(18人)考试参考试题及答案解析
- 2026春季贵州六盘水市第二十四中学学期招聘3人考试备考试题及答案解析
- 自贡市嘉祥外国语学校招聘笔试备考试题及答案解析
- 工业企业内部会计制度
- 公司内部文控管理制度
- 幼儿园内部防疫管理制度
- 一人处公证内部管理制度
- 律所内部风险控制制度
- 停用加气站处置方案
- 小学英语科普版单词表三至六年级词汇表-合并方便打印版-(带音标按单元顺序)(三年级至六年级全8册)1850
- DB1410-T 110-2020 地震宏观观测网建设和管理要求
- 园艺植物种子加工、贮藏与运输-园艺植物种子贮藏与运输(园艺植物种子生产)
- 《创新创业基础》教案
- 检验检测机构资质认定评审准则释义
- GB/T 39489-2020全尾砂膏体充填技术规范
- GB/T 14598.301-2010微机型发电机变压器故障录波装置技术要求
- 我国的环境标准体系
- 部编版小学道德与法治五年级下册第1课《读懂彼此的心》课件
- 医疗机构消防安全管理九项规定(2020版)-精品原创课件
评论
0/150
提交评论