复试经验-2015年人大432统计学笔记by csc_第1页
复试经验-2015年人大432统计学笔记by csc_第2页
复试经验-2015年人大432统计学笔记by csc_第3页
复试经验-2015年人大432统计学笔记by csc_第4页
复试经验-2015年人大432统计学笔记by csc_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2015 432统计学读书笔——By第一 导第二 数据的搜集与抽样设−抽样理 数理统为𝐶𝑛个;欲求总体特征为总̅,n=E(y)=E(y)=1−V(̅ 概率抽样与非概率抽样的比较:信区间;非概率抽样则适合用于探索性的研究,及市场中的概念测试,或是作为概率抽样的预调单作为抽样框,N很大时不便;抽取的单元很分散,不便;没有利用辅助信息提高估计精度。N(+n不够大时更优。 𝜎(1−),有的版本也 ,n相对N非常小时可忽略、抽样组 第三 数据的图表展比例:一个样本(或总体)100%为百分比。比率:样本(或总体)中不同类别数据之间的比值,可能大于1.组距:上限-下限 ::第四 数据的概括性度 平均数(数值型数据:简单平均数𝑥̅̅=𝑥̅1+𝑥̅2+⋯+𝑥̅𝑛平均数(分组数据)𝑥̅̅几何平均数(多用于变量值为比例时)𝑥̅̅𝑛√𝑥̅1𝑥̅2异众比率(分类数据)V=1𝑓𝑚∑:Qd=Q-:变量值的计量单位相同、标准分数(3异常值)

偏态系数:SK=𝑛∑[(𝑥̅𝑖−𝑥̅̅)/𝑠]^3𝑜𝑟分组SK= 峰态系数:K

𝑛(𝑛+1)∑[(𝑥̅𝑖−𝑥̅̅)/𝑠]^4

𝑜𝑟K=∑(𝑀𝑖−𝑥̅̅)4𝑓𝑖3

众数:𝑀=𝐿+∆1𝑖其中,L是众数组的组下限,i是组距,∆∆

=𝐿 平均数:𝑥̅̅=∑∑

标准差:𝑠2=

第五 概率分𝐶𝑥̅𝐶何分布(非重复抽样P(X=x)=𝑀概率近似计算:二项分布(n<=0.25,n>20,np<=5)𝐶𝑥̅𝑝𝑥̅𝑞𝑛−𝑥̅≈

P-P图:评估观测数据的累计概率与理论分布(如正态分布)的累计概率的符合程度。Q-Q图:评估观测数据的实际分位数与理论分布(如正态分布)的分位数的符合程度。K-S检验第六 统计量及其抽样分由样本构造的函数布,即从N总体中抽取n样本时,所有可能的样本统计值所形成的分布。渐进统计量:n无限增大时,统计量Tt分布:E=0D=n/(n-2);对称性;通常比正态分布平坦;n>=30接近正态分布,对统计学中小样本运用有

=第七 参数估ZXnn

(0,)ntXnS

~t(n正态总体假定,未知,小样本p(pnZ p p(pn2n1)S22~2(n正态总体假定2122 ZX1X212)~2122 SS 1SS 11 tX1X212)~t(nn21 S𝑆2

(𝑛1−1)𝑠2+(𝑛2− 𝑛1+𝑛2−SS 1 tX1X212)~tSS 1 𝑠22(𝑛1+𝑛2v= 𝑛1− 𝑛2−d Zd12)~Nd Sd p1(1p1)p2(1p2 Z p1p1(1p1)p2(1p2 (11)p(1p) Z (11)p(1p) 2S2/S2F

𝑝1𝑛1+p𝑛1+22~F(n11,n22)两个正态总体 z2nEEz n2 (1表示可靠性,E表示精度nE第八 假设检::假设检验的流程:提出原假设和备择假设→确定检验统计量,计算数值→确定域→进行统计决策显著性水平。P值是关于数据的概率,它与原假设的对错概率无关。与传统的统计量决策相比,P值卡方统计量:𝜒2=

第九 分类数据分计算卡方统计量的步骤四步。𝑓判断期望频数与观察频数之间是否存在显著差异。H0:观察频数与期望频数一致。𝜒2=.分类变量之间是独立的(不存在依赖关系。𝜒2=∑∑(𝑓𝑜−𝑓𝑒)2~𝜒2(𝑅−1)(𝐶−1).V相关系数:V=

𝑛∗𝑚𝑖𝑛[(𝑅−1

𝜒2,主要用于大于2x2的列联表,独立为0,最大值不大于1(取决于列√𝜒√条件百分表的方向:当XYX放在列的位置,百分比也按照列的方第十 方差分差的均方应该很接近,比值趋近与1,否则就会大于1,大到某种程度时,认为有显著性影响。x,i1,K,n;j1,K, ij~N(0,2各ij相互独立H01Lk1Lk0H1jj1,Kk)

FF———————𝑹𝟐表示自变量对因变量的影响效应占总效应的比例最小显著差异方法(LSD:H0:μi=μj→计算检验统计量𝑥̅̅𝑖𝑥̅̅𝑗→LSD𝑡(𝑛 𝛼/2√𝑀𝑆𝐸(𝑛𝑖+x,i1,K,s;j1,K,

:LL

假设为

01:1

1

s kij i1 j1SSR/(k SSC/(rFRSSEk1)(r1,FCSSEk1)(r1(k行r列x(),i1,K,s;j1,K,k;l1,K,

s~N(0,2),各

k

s() k()i1 j1 j H01:1Ls1L 假设 L HH

:两因素个水平间无交互作用(

L()skF SSR/(k SSE/[rk(m

,

SSC/(rSSE/[rk(m

,

SSRC/[(r1)(kSSE/[rk(m

(rkm重复:种处理随机指派给各个区组。实质:从MSE中消除分组变量的影响。第十一 一元线性回r=

相关系数的显著性检验(r服从正态分布)t=|𝑟|𝑛−2~𝑡(𝑛√1−𝑟√一元线性回归模型:y=β0β1x一元线性回归方程:E(y|x)=β0=高斯-马尔科夫条件:即上述假定的后三个(不包括正态,数学表达式为E(𝜀𝑖=0,cov(𝜀𝑖𝜀𝑖)𝜎2(𝑖=0(𝑖𝑗),此时,两个估计量是最佳线性无偏估计(BLUE∑𝑥̅𝑖𝑦𝑖−1∑𝑥̅𝑖∑==

∑2𝑛1 残差具有性质:𝑒𝑖=0,𝑥̅𝑖𝑒𝑖=

𝑥̅−

:var(

var(𝛽̂0)=(𝑛+判定系数:𝑅2𝑆𝑆𝑅,实际意义:Yxy的线性关系解释的变差比例。 =√𝑆𝑆𝐸=√𝑀𝑆𝐸,也是对误差项ε标准差σ的估计。实际意义:反映了用估计的回方程预测y

~𝐹(1𝑛2)和回归系数的检验t=1~𝑡(𝑛𝑠𝛽̂回归结果的评价:回归系数的符号是否与预期一致;xy的关系是否与相关分析的结果吻合;判定系数置信区间:0± 𝑠√1+(𝑥̅0−𝑥̅̅)2,这里也就是𝑦0的方差。影响预精度的五个因素𝛼/2𝑒 预测区间:0±

√1+1+

= √1−ℎii

第十二 多元线性回多元线性回归模型:y=β0β1x1β2x2βkxkεy=Xβ多元回归方程:𝐄(yβ0β1x1β2x2估计的多元回归方程:𝑦=β0β1x1β2x2所有x方差相同;服从正态分布且相互独立(一组xi对应的ε与其他组对应的ε不相关)(BLUE普通最小二乘估计:𝛽̂=(X′X)−1𝑋′𝑦i.e.𝑦=X(X′X)−1𝑋′𝑦HX(X′X)−1𝑋′多重判定系数:𝑅2=𝑆𝑆𝑅,平方根称为多重相关系数(负相关系数) R^2变大。为避免高估R^2,使用调整的R^2 估计的标准误:𝑠𝑒= =线性关系的检验:F

~𝐹(𝑘,𝑛−𝑘−回归系数的检验:𝑡=𝛽̂𝑖~t(nk𝑠𝛽̂进行最小二乘估计。系数解释:自变量1%的相对变化,引起因变量均值的相对变化百分数。Seaan(WLS:Q权数确定:若σ2~𝑥̅2,则w=1x

t验迭代法:𝜌̂≈1−1 − =(𝛽̂−𝜌̂𝛽̂)+𝛽̂(x− )+(ε− 差分法:ρ1时,y𝑡−y𝑡−1=𝛽̂1(x𝑡−x𝑡−1)+(ε𝑡−判别:方差扩大因子VIF=110;X’X0,条件数

=√𝜆𝑚10100

观判定法:模型中各自变量之间显著相关;F检验显著,t检验却几乎都不显著;回归系数的正负号与岭回归:𝛽̂(𝑘𝑋′𝑋𝑘𝐼)−1X′yMSE较小。根据岭迹图、VIF范围内确定k值,剔除稳定但绝对值小、很不稳定的自变量。原为XF统计量:𝐹=(𝑆𝑆𝑅−𝑆𝑆𝑅(𝑗))/1=𝑡2t 进行F检验,以确保方程中只包含显著变量。要求α进小于α出,否则死循环。Logit模型 或ln(𝑝𝑖)=logit(𝑝)=𝛽̂+𝛽̂𝑖=1+𝑒𝑥̅𝑝(𝛽̂+𝛽̂

ProbitΦ−1(𝜋𝑖𝛽̂0+第十三 时间序列分宽平稳序列:E(𝑋2)<∞;E(𝑋𝑡)=𝜇;γ(t,s)=γ(k,k+s-t)白噪声序列(纯随机序列):E(𝑋)=𝜇;( 𝜎2,𝑡=𝑠 γt,s={0,𝑡≠环比增长率𝑌𝑖−𝑌𝑖−1定基增长率𝑌𝑖−𝑌0,描述现象在整个观察期内总的增长变化速平均增长率𝑛𝑌𝑛−增长1%的绝对值=前期水平日ARE()0,Var()2,E()0(sE(xt)0(s s sMAxtt1t1Lqtq(p,qE()0,Var()2,E()0(sE(xt)0(s s sARMAxt01xt1Lpxtpt1t1Lqtq(p,qE()0,Var()2,E()0(sE(xt)0(s s s计、ML、LS)→模型检验(LB统计量、T统计量)→模型优化(AIC、BIC)→预测加法模型:𝑌𝑡=𝑇𝑡+𝑆𝑡+𝐶𝑡+𝐼𝑡乘法模型:𝑌𝑡=𝑇𝑡𝑆𝑡𝐶𝑡趋势拟合法:线性回归法𝑡𝑏𝑜𝑏1𝑡;指数曲线:𝑌𝑡𝑏0𝑏𝑡1,对数化,用最小二乘法拟合;多阶曲线:𝑌𝑡=𝑏0+𝑏1𝑡+𝑏2𝑡2:𝑡+1( 移动)𝐹𝑡+1=̅̅̅𝑌=

:𝐹𝑡Holt两参数指数平滑(线性趋势:𝐹𝑡=𝛼𝑥̅𝑡(1𝛼)(𝐹𝑡−1+ =𝛾(𝐹− )+(1− 𝐹=𝛼𝑥̅𝑡+(1− + 𝑟𝑡=𝛾(𝐹𝑡−𝑥̅𝐹𝑡−1)+(1− 𝐼=𝛿𝑡+(1− 季节性多元回归:𝑌𝑡=𝑏0𝑏1𝑡𝑏2𝑄1𝑏3𝑄2:(Y/CMA3)分离季节成分:𝑌=𝑇5)残差检验:𝑌𝑇=(5)-11过程:ARIMA(B)dx E(xt)0(s s s(B)dx (B)(B)Ddx(B)(B) S 𝑋𝑡=𝑇𝑡+𝑆𝑡+𝜀𝑡=𝜙1𝜀𝑡−1+⋯+𝜙𝑝𝜀𝑡−𝑝+

第十四 多元统计分分为Q型聚类(样本)和R型聚类(变量。− ′ − (𝑖)−𝑥̅(𝑗)) ::算每个样品到K(常用欧氏距离K布函数或训练样本X,判断它来自哪个总体。线性判别函数W(X)是X的线性函数,协方差阵相等时为线性,不相等时则为二次函数,实质是x到两个 j希尔判别法:kmup1Yu'Xuup1 11

u'u1(i1,L, Yu'XuX i基本理论:YUX 21 up2X subtoY,Y相互无 Yu'XuX 1p

uppX主成分的性质:D(Y@diag(1,Lp),即Var(Yi)iCov(Yi,Yj)0(ij);原始 量的总方差被分解为互不相关的主成分的方差之和iii

,Xp2(Y,X);p2(Y,X)1

k 主成分求法:X1,X2,…,Xp(or)的非零特征值𝜆1𝜆2𝜆𝑝>0对应的标准化特征向量𝛾1𝛾2𝛾𝑝分别作为系数向量,𝑌𝑖𝛾𝑖′X即为第i量标准化后的协方差矩阵。相关阵求主成分的特殊性质如下:Y的协方差阵为对角阵;∑𝑣𝑎𝑟(𝑌𝑖)=i∑𝑣𝑎𝑟(𝑍𝑖)=∑𝜆𝑖=𝑝;累积贡献率∑𝜆𝑖;(Y,X) (𝜎𝑖𝑖=i (变量)和Q(样品)X1a11F1 a1mFmXaF aFXAF

21

2m apmFm协方差阵为I;ε(特殊因子)与F相互独立,协方差阵是对角阵。因子载荷COV(𝑋𝑖𝐹𝑗)=𝑎𝑖𝑗𝐯𝐚𝐫(𝑿𝒊)=𝟏=𝒉𝟐共同度(式中𝑎𝑖𝑗行和𝝈𝟐(剩余方差)Xi ,BartletY1u11X1 up1X X1u11Y1 X1u11Y1 u1mYm X1a11F1 a1mFm YuX u XuY u XuY uY XaF aF 1p pp

p1

pp

p1

pm

p1

pm 相关阵对角线上的元素1,并以得到的调整相关阵来进行求解。区别:因子分析将变量看成公共因子和特殊因子的线性组合,构造因子模型,主成分则只是从空间角(标准化矩阵Z:R型因子分析和Q型因子分析都是一个总体的不同侧面,Z矩阵将它们联系第十五 指(1)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论