




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、多元统计复习概要 1考试范围 本次考试共分作9个考点,其中有4个考点:抽样分布、方差分析、卡方检 验以及回归分析是老师课件上的内容,多元正态分布、均值向量、协方差矩阵、 聚类分析、主成分分析以及因子分析5个考点均为书本上的内容。看上去内容很 多,实质上除了最后两个考点计算涉及到矩阵和行列式的运算外,其他的都基本 只是将数值代入公式进行计算,掌握其原理就行了。 2题型 A卷:1道简答题,7道计算题 B卷:3道简答题,5道计算题 根据本校生透露,同济考试一般来说都采用A卷 3预备知识 数理统计: (1) 假设检验:Z检验、t检验都可以针对均值的检验,卡方(x2)检验是针 对方差的检验,Z检验是针对
2、样本比例的检验。 (2) 点佔计以及区间佔计:与参数的假设检验是一个问题的两个方面。 线性代数: 矩阵的基本运算法则 矩阵的相关性质,如(正交矩阵、对称矩阵、逆矩阵、相似矩阵等性 (1) (2) 质) 行列式的基本运算法则及基本变换 齐次方程的求解方法 (3) (4) H 4考试内容: lx抽样分布 a)比例的区间估计、精度、样本容量的确定 说明:1)比例的区间佔计。这是本科学的数理统计的内容,有时间的同学可以 对照任一本数理统计的书中“参数检验”章节进行学习,区间估计与单总体的参 数检验其实是一个问题的两个方面,前者是以一定的把握(如95%)估计理想的 总体参数(未知)存在于以我们所得的样本
3、参数(如平均值、方差、比例)什么 样的允许误差范围内;后者则是已知理想的总体参数,以一定的把握检验所得的 样本参数是否在此把握对应的误差范H内。 2)精度。即d,佔计区间的误差大小 n. 3)样本容量。即n,即需要抽样的个数,越大越能达到精度的要求。 公式:d=ZaJp其中,Z为标准正态分布的分位点,P为 样本比例,n为样本容量,d为误差大小 例题:“抽样分布和参数估计”课件p6061页、p70 2、多元正态分布 a) b) c) 说明: 数字特征、性质 马氏距离、欧氏距离 均值向量和协方差阵的估计 a)因为随机抽样的样本是随机的,只能山不同的统il数字表示,所以我们 可用统计的参数来代表所有
4、的统计样本,称作数字特征。一般来说,有三个参数 最重要,平均值、方差以及样本比例。从概率论的理想角度来说,对应分别就是 均值、方差、总体比例。样本向量指的是有许多个变量的样本,于是就成为了向 量。对应这个向量X,于是它的数字特征也成为了向量,分别对应为均值向量、 协方差矩阵(无论及样本比例向量了)。性质是不必死记的,考试也不会直接考, 但可通过概率论的基础知识类比得出(参看书本P4P5)。 b)欧氏距离就是n维空间里的距离,没有考虑到统计样本的概率分布悄况, 马氏距离相当于是空间距离与概率单位距离的比值。不理解不要紧,直接代入公 式计算就行了。但在这里还要记清楚二元正态方差的逆矩阵表达式以及矩
5、阵的相 关运算。 C)对应一元统计的参数估计,对于均值向量用平均值的矩阵估计,对于协 方差均值则用离差阵估计,不过貌似都不考 公式:马氏距离p9:正态分布的协方差逆矩阵pH 例题:课本p63 3、均值向量和协方差阵的检验 说明:其实原理与一元参数检验的方法是一致的,只是所用到的检验函数不一样 (如t检验变成了 T检验)。但考试应该只考p26的均值检验步骤。 4、方差分析1 a) b) c) 说明: 方差分析的u的、原理 单因素方差分析表 双因素方差分析表 a)本章节十分重要,是对那些具有多种影响水平的因素对实际试验的影 响,简而言之,前面的章节着眼与对单个正态总体的数字特征的研究;而本章节 则
6、涉及到因变量以及统计变量(即具有不同水平的W素)之间的关系,确定因素 变量对因变量的影响显著性。但是,方差分析并不能得出因变量与自变量的具体 线性关系,只能基于对统计数总偏差平方和的分解而进行方差分析,进而确定 其对试验影响的显著性。而回归分析则补充了单纯的方差分析所带来的缺陷,能 够得出具体的回归方程。因此,有些教材J概率论与数理统计,刘次华,高等敎 育出版社、将方差分析与回归分析合在一起作为一个章节。 b)单因素分析是指仅对一种影响因素的影响显著性进行分析,U标是为了 清楚到底试验的总体偏差是山于不同水平效应差异(组间平均和)引起的还是曲 随机误差(组内平均和)引起的,于是我们将两者相除得
7、出F值,看F值是否 能通过F检验,如果能则说明该因素对试验影响十分显著。 C)双因素分析与单因素分析的原理是一样的,只是多了一个因素,公式 上有所调整。而考虑到因素与因素之间的交互作用的双因素分析是我们的考试内 容。的确,在这个分析里,因素与因素之间的交互作用是最值得我们注意的地方, 但是课件上已经没有将这种交互作用的量化公式给出,证明这题的计算过程在考 试中是不必考的。对统计学有兴趣的同学可以随便借一本统计学的教材看交互作 用效应差异是如何用统计数据表示的(统计学,贾俊平,清华大学出版社,p270 但是,我们起码应该将方差分析表中各个字母代表的含义记住,分别是a、b、n; 以及记住自山度和F
8、值的计算公式。 呢H 公式或表格: 来源 平方和 iMrti 度 均方和 A Sa a- /(41) B Sb b-i Sb/a AyzB SaxB (41)(01) 1)3-1) 误差 I ab(n-1) Se /abn-1) 总和 St abn-1 s/a-i) S/agV) 彳/如一1) SgJ fD 1) 孚/a如一D 其中,a为A因素的样本的影响水平,b为B因素的样本的影响水平,n为 每个交互作用的试验结果的样本容量 例题:“方差分析”课件:p3538 5v回归分析1 a) b) c) d) e) f) 回归分析的主要内容和分析步骤 一元部分: 回归方程的显著性检验、方差分析表 预测
9、区间的近似计算、精度控制、 控制:以案例1为例。 曲线回归的分析步骤、线性化 回归方程的标准误差 回归分析是统讣学里三大分析之首 (主成分分析、判别分析),因为既简 因为大家都学了这么久了。B0, 0 1 说明: 单乂实用。过程和原理我就不必多说了, 是不必我们手算的。只是增加了方程的检验、预测和控制,也是考试的重点所在。 C)方程的显著性检验其实就是上一章单因素分析的一个特例,其中参数的个 数就是因素的水平个数。此时,我们可以注意到9对于一元回归分析:方差分析 二 11 表中对应3=2 (对应两个参数00, P 1);对于多元回归分析,a=p+l, P为解释 变量的个数。同样地,我们需要知道
10、方差分析表的各项指标需要我们知道是怎么 得来的。 d)方程的预测区间估计比样本的区间估计要来的复杂,有比较多繁琐的证明, 所以同学们只要记住公式就行了。在运用公式的时候,记得所查t函数的自山度 为N-2, 乂因为我们所要做的双边区间估汁(即d),所以用到对应的分位点为 0/2.这在我们査表时是需要注意:到的。至于Se ,即我们所说的残差平方和,是很 容易通过统计数据计算出来的(见“一元回归”课件p21) e)预测与控制是回归分析里的同一个问题的两个方面。前者是已知解释变量 求因变量的区间;后者是预设了因变量的区间反求解释变量的控制区间。控制的 计算方法是建立在区间预测的基础上的(此时假定每一点
11、的区间估计值都是常量 d),然后将预设W变量y代入控制的不等式来求X。我们需要注意的是分位点选 取问题以及不等式的建立问题,当双侧控制需要用Z检验的1/2分位点,当单侧 控制是用单侧分位点;建立控制不等式时,y的可能最小值(y-d)应大于控制值 下界;最大值(y+d)应小于控制值上界。 f)考试基本不考,大家注重曲线回归的分析步骤和线性化的方法即可。 公式或表格: 1、方程检验的方差分析表(一元回归分析) ms 尸匕匕 fil 耳二 鼻 1 TVS Sr Se/(N-2) $ yvi 注:多元回归的将自由度1改作P,N2改作N-P-1 2、一元回归的区间预测以及控制: dZadSE/(N- 注
12、:Se为残差平方和,N为样本容量(取的点个数),Z为标准正态分布的分位点值,双侧 控制时用1/2分位点0/2,单侧控制时则改用单侧分位点a。 例题:书本:P7173,老师所给的K聚类例题 7、卡方检验 a) b) c) d) 总体分布的卡方检验、思想原理 两个比例差异的检验 独立性检验 两个相关样本比例差异检验 a)在以往我们学过的但总体正态分布的比例检验当中,对比例的检验用 说明: 到的还是Z检验,如今从另一个角度出发,针对多个正态总体的比例进行卡方 检验,不仅仅大大降低了计算强度,还能够对具有多指标的正态主体进行检验, 其参数检验的范W可以说是大大扩展了。 b)在复习总体间的比例差异检验的
13、时候,不妨可以对比一下这个与方差 分析的差别(形式相似但实质差异很大),在两个总体的比例检验中,其实只有 一个因子(酒店),每个存在两个水平(酒店1和2),但是这两个水平是独立的, 其和是一个常数ni (即样本i的容fi),我们的研究对象是在每个水平下的结果 (成功或失败)。而且,它并非如方差分析那样是分析样本的具体指标值,而是 分析样本的频数。有了这样的类比之后,可能对两种统计分析方法都会有比较清 楚的理解。 C)相较于比例差异检验,独立性检验就是多引入了一个因子(例题中是 不入住的理111),而且每个因子都有2个或2个以上的水平(酒店n),我们研究 的对象是在不同因子的不同水平下的频数大小
14、,从而分析这两种因子是否独立。 还得注意卡方检验函数的自山度为(a-1) (b-1), a、b为两个因子的水平多少。 d)因为引入一个条件,这个条件使得原来的一个的因子(酒店)变作了两 个(改革前的酒店和改革后的酒店),并且这两个因子(即样本)存在相关关系, 如今的研究U的就集中在了二者之间的差异性上。还有另一个区别就是最后的检 验用到的方法是Z检验,在通过显著性检验后,我们还可以通过比较样本比例 得出样本比例的变化趋势。 公式:1、两个比例差异检验: 桝11 火7小$出72、, 注:其中fo为歹辔表中特定单元的观测频数,fe为列联表中特定单元的期 望频数。=. ni为第i个因子的样本容量,
15、_ =召+ X2 =兰 + Z?2 Z? 即为比例估计值 2、独立性检验 ;讥护八尸山皆X瞬容量 行总计 SXX n 行总计X列总计 其他同比例差异检验,只是对于每一个单元格来说,都有各自不一样的期 望频数。 3、相关样本的比例差异检验 条住g)2 是 Ait 是 A B A-B 否 C D C*D 总计 aY B-D McNEMAR拔嘶 22列$賽 0 O 刚样本比例是 上三为对条件1艮应为是的比例, /,匕1为对条件2反应为昱的比例, 8 n 为此,定义统计S 检验此统计量Z能否通过Z检验,能通过则说明两个样本存在显著差异。 例题:“卡方检验与非参数检验”课件pM17: P25-29; P
16、3334 8、主成分分析1 e) 思想、累计贡献率、信息提取率 f)计算过程、例题 9、因子分析1 a) b) c) 说明: 因子分析模型 各个符号(阿、hi2、gj2)的统计学意义 利用主成分法寻找因子分析模型、计算 这两章联系的太紧密了,必须合起来讲。 1)这是本次考试当中技术含量比较拓的章节,详细原理什么的我就直接略 去了,因为说起来乂一大通了,大家容易烦。简单来说,主成分分析就是用儿个 X的线性组合来表示几个Y,因子分析则用儿个X的线性组合来表示几个Y。 询者是为了能将指标减少到儿个(即方差的重新分配);后者则是为了能够找到指 标之间的共性(同样是方差的重新分配)。共同点是同样用方差来
17、表示指标的信 息量,原始方差损失越少代表信息损失越少。课件上说,因子分析比主成分分析 更加有实际的意义,这个问题可以留待大家去挖掘。 2)概念说明: 累计贡献率:每个Yi特征值通过排序所加起来占总方差的百分比(可以证 明Yi的总方差等于Xi的总方差),表示从询儿个主成分中提取总信息的白分比。 信息提取率:每个主成分对Xi贡献的方差与Xi总方差的比值,表示前儿个 主成分提取了某个变量的信息的百分比 aij: Xi与Fj之间的协方差。若Xi为各分量已标准化了的随机变量,贝呃ij 为Xi与Fj之间的相关系数 hi?:反映了公共因子对Xi的影响,可以看成是公共因子对Xi的方差贡献, 称为共性方差(co
18、ininunality) gj-:反映了公共因子Fj对所有指标变量XI、X2的影响,可视为公共因子 Fj对XI、X2的总方差贡献。其实这两个很容易分辨,惯例上i为行,j为列, 因此含有i的字母自然是表示对行的影响(每一行代表一个Xi);含有j的字 母表示对列的影响(每一列代表一个公共因子Fj) 3)计算过程:求解两个分析模型的荷载矩阵的方法是一致的,但实际上主 成分法求解因子分析模型是有问题的(课本上有介绍,P198),有兴趣的同学可 以自行研究一下。现在总结一下求解步骤: (1)利用协方差矩阵Z,列行列式方程求解特征值入。别看这个很简单,但 如果这协方差阵变得一般化以后就必须解三次方程了。对于较为特殊的协方差 阵,如“主成分分析”课件P10的例题,可以通过行列式的行列变换先将行列式 化简,再用行或列展开行列式,避免入三次方的出现。本例题的特殊性在于矩阵 11 对角线上存在两个相同的数值,因此可以通过用第3行加上第2行(性质:行列 式值不变),使得2行1列的值为0,2行2列与3列的数值相同,然后乂可以用 第3列减去第2列,使得2行3列的值为0,此时我们就可以用第2行进行行列 式展开,避免了三次项的出现。不过这个只是个特例,对于一般的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 水产干腌制过程中的颜色变化考核试卷
- 炼铁产业链优化与整合考核试卷
- 双十一胜利密码
- 内蒙古鸿德文理学院《健康教育学》2023-2024学年第一学期期末试卷
- 江苏省泰州市高港区许庄中学2025届初三下学期开学暑假验收考试生物试题含解析
- 内蒙古自治区呼和浩特市四中学2024-2025学年初三下学期9月阶段性检测试题化学试题含解析
- 宁夏艺术职业学院《基因工程原理》2023-2024学年第二学期期末试卷
- 四川省遂宁市重点中学2024-2025学年初三下学期第一次大练习(期末)生物试题含解析
- 焦作大学《医学微生物学A》2023-2024学年第二学期期末试卷
- 山西省泽州县晋庙铺镇拦车初级中学校2025年初三第一次中考模拟统一考试(物理试题文)试题含解析
- 2023版肝硬化腹水诊疗指南解读
- 工程竣工验收申请表范本
- 《香格里拉松茸保护与利用白皮书》
- 台州职业技术学院《大数据财务分析》2023-2024学年第一学期期末试卷
- 先天性高胰岛素性低血糖血症病因介绍
- Excel高效办公应用与技巧知到智慧树章节测试课后答案2024年秋四川职业技术学院
- 数字化赋能应用型高校实践教学改革研究
- 《前列腺癌筛查及治疗的临床研究进展》
- 2024年云南省初中学业水平考试地理试卷含答案
- 11.5 歌曲《卖报歌》课件(14张)
- 2024年新疆中考数学试卷(含答案解析)
评论
0/150
提交评论