版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
多元统计分析期末复习试题及答案1.单选(每题2分,共20分)1.1在p维正态总体N_p(μ,Σ)中,若Σ已知,样本容量n=36,检验H_0:μ=μ_0,应采用的统计量是A.T²=n(X̄−μ_0)ᵀΣ⁻¹(X̄−μ_0)B.T²=(n−1)(X̄−μ_0)ᵀΣ⁻¹(X̄−μ_0)C.T²=n(X̄−μ_0)ᵀS⁻¹(X̄−μ_0)D.T²=(n−p)(X̄−μ_0)ᵀS⁻¹(X̄−μ_0)答案:A解析:Σ已知时用HotellingT²=n(X̄−μ_0)ᵀΣ⁻¹(X̄−μ_0)~χ²(p)。B错在系数,C、D把Σ换成S,属于Σ未知情形。1.2对同一组n=50、p=4的数据,若欲检验协方差阵Σ是否等于给定的Σ_0,应选用的检验统计量服从A.χ²分布B.F分布C.似然比统计量−2lnΛ~χ²D.WilksΛ分布答案:C解析:Σ的检验属于似然比范畴,−2lnΛ在正则条件下渐近χ²,自由度为p(p+1)/2。1.3主成分分析中,第k主成分的方差贡献率等于A.λ_k/(∑λ_i)B.λ_k/pC.λ_k/nD.λ_k/(∑λ_i²)答案:A解析:贡献率定义为该特征值占全部特征值之和的比例。1.4若样本协差阵S的特征值为8,3,1,0.2,则前两个主成分的累计贡献率为A.11/12.2B.8/12.2C.11/8D.8/11答案:A解析:(8+3)/(8+3+1+0.2)=11/12.2≈90.16%。1.5在典型相关分析中,若X为p维、Y为q维,则第一对典型变量(a₁ᵀX,b₁ᵀY)的相关系数ρ₁满足A.ρ₁=maxcorr(aᵀX,bᵀY)B.ρ₁=mincorr(aᵀX,bᵀY)C.ρ₁=maxvar(aᵀX)D.ρ₁=maxcov(aᵀX,bᵀY)答案:A解析:典型相关即最大化两组变量的相关系数。1.6对n=30、p=5的数据做聚类,若采用Ward法,其合并准则本质上是A.组间平方和增量最小B.组内平方和增量最小C.全linkage最大距离D.重心距离答案:B解析:Ward法最小化合并后组内平方和的增量。1.7若判别分析中两个总体的协差阵相等,则Fisher线性判别函数等价于A.距离判别B.Bayes判别C.主成分得分D.逻辑回归答案:A解析:等协差阵时,Fisher、距离、Bayes(等先验)三者等价。1.8对同一数据,若逐步判别选入变量的准则为WilksΛ最小化,则每一步实质在做A.单变量t检验B.多变量方差分析C.似然比检验D.主成分提取答案:C解析:WilksΛ是多元方差分析的似然比统计量。1.9若样本协差阵S奇异,则A.不能做主成分B.不能做因子分析C.不能求广义逆D.不能求Mahalanobis距离答案:D解析:Mahalanobis距离需S⁻¹,奇异时无通常逆;但可用广义逆做PCA、FA。1.10在多维尺度分析(MDS)中,若选择欧氏模型,则最终得到的坐标矩阵X满足A.XXᵀ=ΔB.XᵀX=ΔC.XXᵀ≈−½JΔJD.XᵀX≈−½JΔJ答案:C解析:经典MDS对双中心化后的距离矩阵做谱分解,XXᵀ≈−½JΔJ。2.多选(每题3分,共15分,多选少选均不得分)2.1下列哪些统计量可用来检验多元正态性A.Mardia偏度B.Mardia峰度C.Royston’sHD.WilksΛE.Q-Q图答案:ABCE解析:WilksΛ用于均值或协差检验,不直接检验正态性。2.2关于主成分回归(PCR),正确的是A.用全部主成分做回归等价于最小二乘B.舍弃小特征值主成分可缓解多重共线C.主成分回归系数可解释回原变量D.PCR对样本外预测一定优于OLSE.PCR需标准化答案:ABCE解析:D错,PCR未必总是优于OLS,取决于舍弃信息是否含噪声。2.3以下哪些方法属于无监督学习A.K-meansB.层次聚类C.DBSCAND.线性判别E.自组织映射答案:ABCE解析:D为监督。2.4若因子分析模型X=ΛF+ε,满足A.cov(F,ε)=0B.E(F)=0C.cov(ε)=对角D.Λ唯一E.F可观测答案:ABC解析:Λ不唯一,F不可观测。2.5关于Bayes判别,正确的是A.需先验概率B.需类条件密度C.最小化期望错判损失D.等价于Fisher当协差阵相等且先验相等E.对异常值不敏感答案:ABCD解析:Bayes对异常值仍敏感。3.填空(每空2分,共20分)3.1若X~N_3(μ,Σ),Σ=[[4,2,1],[2,3,0],[1,0,2]],则X₁与X₂的偏相关系数ρ₁₂|₃=____。答案:2/√(3×3)=2/3解析:ρ₁₂|₃=σ₁₂|₃/√(σ₁₁|₃σ₂₂|₃),其中σ₁₂|₃=σ₁₂−σ₁₃σ₂₃/σ₃₃=2−1×0/2=2,σ₁₁|₃=4−1²/2=3.5,σ₂₂|₃=3−0²/2=3,故ρ=2/√(3.5×3)≈0.617。3.2对n=100、p=6的样本,检验H_0:μ=μ_0,Σ未知,HotellingT²=25.3,则对应的F统计量为____,自由度为____。答案:F=(n−p)/p(n−1)T²=(94/6)×25.3≈396.2,df1=6,df2=94解析:T²~p(n−1)/(n−p)F(p,n−p)。3.3若样本相关阵R的特征值为3.5,1.2,0.8,0.3,0.2,则Kaiser准则下应保留____个主成分。答案:3解析:特征值>1。3.4在Q型聚类中,样本间距离常用____距离;在R型聚类中,变量间距离常用____距离。答案:欧氏;1−|r|3.5若两总体π₁,π₂的密度分别为f₁,f₂,先验π₁=0.6,错判损失c(1|2)=5,c(2|1)=1,则Bayes判别规则为:若f₁(x)/f₂(x)____,则判x∈π₁。答案:>(0.4×5)/(0.6×1)=10/33.6因子分析中,共性方差h_i²表示____。答案:第i个变量能被公因子解释的部分方差。3.7若样本协差阵S=[[5,2],[2,3]],则第一主成分的方向向量为____。答案:对应最大特征值7.162的特征向量(0.923,0.385)ᵀ。3.8在多维尺度分析中,Stress-I公式为____。答案:√(∑(d_ij−d̂_ij)²/∑d_ij²)3.9对n=200、p=10的数据,若Bartlett检验球形假设的χ²=450,df=45,则p值____0.05(填<或>)。答案:<解析:450远大于χ²_{0.95}(45)≈61.66。3.10若X~N_p(μ,Σ),则(X−μ)ᵀΣ⁻¹(X−μ)服从____分布。答案:χ²(p)4.判断并改错(每题3分,共15分)4.1主成分分析要求变量间相互独立。答案:错。改:主成分分析要求变量间存在相关,否则无降维意义。4.2典型相关分析中,典型变量对之间一定正交。答案:错。改:同一组典型变量之间正交,不同组之间仅相关系数最大化,未必正交。4.3若S奇异,则无法做任何因子分析。答案:错。改:可用广义逆或缩减变量做因子分析。4.4K-means算法对初始中心不敏感。答案:错。改:K-means对初始中心敏感,常用k-means++改进。4.5判别分析中,当总体非正态时,Fisher线性判别完全失效。答案:错。改:Fisher判别仍可用,但未必最优。5.简答(每题8分,共24分)5.1写出多元线性回归模型Y=XB+E的矩阵形式,并给出最小二乘估计及协差阵。答案:模型:Y_{n×m}=X_{n×(p+1)}B_{(p+1)×m}+E_{n×m},vec(E)~N(0,Σ⊗I_n)。最小二乘:B̂=(XᵀX)⁻¹XᵀY。协差阵:cov(vec(B̂))=Σ⊗(XᵀX)⁻¹。5.2简述WilksΛ分布与HotellingT²的关系。答案:当m=1时,WilksΛ=1/(1+T²/(n−1)),即T²可转化为Λ,二者均检验均值向量差异;m>1时,Λ为广义似然比,T²为其特例。5.3说明在聚类分析中,单链接可能产生“链式”现象的原因及改进方法。答案:单链接以最近邻距离为组间距离,易因中间点串联远离簇,形成长链;改进可用全链接、Ward法或DBSCAN密度方法。6.计算与综合(共46分)6.1(10分)随机抽取n=50名大学生,测得数学(X₁)、物理(X₂)、编程(X₃)成绩,样本均值X̄=(75,70,80)ᵀ,样本协差阵S=[[100,40,60],[40,64,32],[60,32,144]]。(1)检验H_0:μ=(80,80,80)ᵀ,α=0.05。(2)若拒绝,求μ的95%同时置信区间(Bonferroni)。答案:(1)T²=50(X̄−μ_0)ᵀS⁻¹(X̄−μ_0)=50×[−5,−10,0]S⁻¹[−5,−10,0]ᵀ=50×3.125=156.25。临界值T²_{0.05}=p(n−1)/(n−p)F_{0.05}(p,n−p)=3×49/47×2.81≈8.78。156.25>8.78,拒绝。(2)Bonferronit_{0.05/6}(49)=2.47,标准误=√(S_ii/n),得μ₁:75±2.47×√(100/50)=75±3.49→[71.51,78.49]μ₂:70±2.47×√(64/50)=70±2.79→[67.21,72.79]μ₃:80±2.47×√(144/50)=80±4.18→[75.82,84.18]6.2(12分)对同一数据做主成分分析,求载荷矩阵及前两个主成分对总方差的贡献率;若用前两个主成分得分做后续回归,解释其优缺点。答案:特征值:λ₁=204.8,λ₂=67.2,λ₃=36.0。贡献率:λ₁/(λ₁+λ₂+λ₃)=65.1%,前二累计86.5%。载荷:第一主成分a₁=(0.68,0.48,0.55)ᵀ,解释“综合学业”;第二主成分a₂=(−0.25,0.86,−0.44)ᵀ,解释“文理差异”。优点:降维去噪、克服共线;缺点:主成分可能难以解释,且舍弃的13.5%方差或含重要信息。6.3(12分)设两个多元正态总体π₁,π₂,μ₁=(0,0)ᵀ,μ₂=(2,2)ᵀ,Σ₁=Σ₂=I₂,先验相等,损失c(1|2)=c(2|1)=1。(1)求Bayes判别函数及决策边界。(2)若实测点x=(1,1)ᵀ,求后验概率及判类。答案:(1)判别函数:δ_i(x)=xᵀμ_i−½μ_iᵀμ_i,δ₁=0,δ₂=2x₁+2x₂−4,决策边界:δ₁=δ₂⇒2x₁+2x₂−4=0⇒x₁+x₂=2。(2)x=(1,1)在边界上,后验相等,可随机判;通常判样本量大的类或任一类。6.4(12分)对某城市15个区县测得8项经济指标,经标准化后做因子分析,得共性方差h_i²均在0.75以上,前三个因子累计贡献率82%,旋转后因子载荷如下(节选):F1:工业产值0.91,固定资产投资0.85…F2:零售总额0.88,餐饮收入0.82…F3:专利申请0.79,高校数量0.75…(1)命名三个公因子。(2)计算第一因子得分系数(回归法),已知相关阵R及Λ₁。答案:(1)F1:工业投资因子;F2:消费服务因子;F3:科技创新因子。(2)
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- GB/T 45969-2025颗粒表征术语
- GB/T 45915-2025动力锂电池运输安全及多式联运技术要求
- GB/T 1749-2025厚漆、腻子稠度测定法
- 肿瘤学面试题库及答案
- 重庆社区考试试题及答案
- 执业医师加试之儿科考试真题试卷+答案
- 专升本词汇试题及答案
- 银行专业知识试题及答案
- 助产面试题库及答案
- 教师招聘之《中学教师招聘》预测复习附参考答案详解【能力提升】
- 浙江省杭州市萧山区2024-2025学年六年级上学期语文期末试卷(含答案)
- 学堂在线 雨课堂 学堂云 实绳结技术 章节测试答案
- 铸牢中华民族共同体意识课件
- 推广经理半年工作计划
- 110kV线路运维方案
- 智能化弱电工程常见质量通病的避免方法
- 屋顶光伏安全专项施工方案
- 医疗器械拓展性临床试验管理规定(试行)YY/T-0292.1-2020《医用诊断X射线辐射防护器具》
- 《中国古代文学通识读本》pdf
- 罐区加温操作规程
- 国有企业干部选拔任用工作系列表格优质资料
评论
0/150
提交评论