




已阅读5页,还剩5页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
本科生1213学年第2 学期公选课课程期末考试试卷(A卷)专业: 年级: 学号: 姓名: 成绩: 设有X1、X2、X3和X4四个来自同一总体的变量,其数值如下: X1 X2 X3 X4 3.513.422.436.54.819.632.360.10.78.313.52.33.918.832.140.63.318.027.029.01.710.216.812.22.69.717.821.23.313.521.331.66.622.638.3107.75.827.039.882.21.78.715.910.36.024.638.890.73.715.826.339.32.915.623.926.43.714.625.337.92.810.618.624.02.910.820.025.04.519.432.254.44.417.931.453.24.417.929.553.43.718.927.137.11.811.016.711.93.716.528.337.64.622.133.355.73.513.924.834.84.018.529.746.23.717.929.738.22.712.619.023.03.315.324.731.42.29.315.517.5 第 1 页,共 6 页 得 分 一、在MATLAB环境下,将X1、X2、X3和X4数据输入到你的计算机中,生成一个文件名为exam.txt的文本格式数据文件。请你简单写出你的数据文件生成过程,包括主要命令。(5分) a=load(exam.txt);x1=a(:,1);x2=a(:,2);x3=a(:,3);x4=a(:,4);得 分 2、 以exam.txt中的X1数据为基础,完成以下单变量统计分析。(40分) 1计算X的算术均值( mean ),几何均值( geomean ),调和均值(harmmean ),10%的截尾均值( trimmean),最大值( max ),最小值( min ), 极差(range ),方差(var ),标准差( std ),半极差( iqr ),峰值( kurtosis )和偏度( Skewness ),计算四分位数( 、 、 ),平均绝对偏差( mad ),均值的标准误差(std/sqrt(length(x1) ),变异系数( Std(x)./abs(mean(x) )。(每空1分,共16分)。mu1=mean(x1);mu2=geomean(x1);mu3=harmmean(x1);mu4=trimmean(x1,10);Max_x1=max(x1);Min_x1=min(x1);D=Max_x1-Min_x1;D_=range(x1)Var_x1=var(x1)std_x1=std(x1)midrange_x1=iqr(x1)peak_x1=kurtosis(x1)bias_x1=skewness(x1)interval4=prctile(x1,25 50 75)mad_x1=mad(x1)SEM_x1=std_x1/sqrt(length(x1)change=std(x1)./abs(mu1) 2 在图框中绘出: X1的直方图。写出MATLAB的相应绘图代码。(2分) hist(x1,8); X的直方图。 3判断X1是否是正态分布?如果是正态分布,写出其总体密度分布函数。绘出X1数据段内的概率密度分布。写出MATLAB的相应绘图代码。(5分) h,p,kstat,critval = lillietest(x1) h=0 接收h0 X1数据段内的概率密度分布第 2 页,共 6 页 4 以X1的均值、标准差和样本大小为基础,拟合一个正态分布D。绘出X4与D之间的Q-Q图。写出相应的MATLAB代码。(3分 ) spec1=Min_x1,Max_x1; D=normspec(spec1,mu1,std_x1) ; qqplot(x1,D);%函数normspec在制定界限之间画正态密度曲线。格式 p = normspec(specs,mu,sigma) %specs指定界线,mu,sigma为正态分布的参数,p 为样本落在上、下界之间的概率。 5 绘出X1、X2、X3、X4的BOX图。写出MATLAB的相应代码。(3分)x=x1 x2 x3 x4;boxplot(x) 6检验X1的均值是否与3.5有显著差异,给出95%的均值置信区间和p值。(3分) h1,p1,ci1=ttest(x1,3.5,0.05); 7检验X1的方差是否与1.3有显著差异,给出95%的方差置信区间和p值。(3分) h,p = vartest(x1,1.5); 8. 科学与工程中,需要哪四个基本假设?为什么随机性非常重要?EDA中,如何判断随机性?(5分) 1 数据随机得到2 数据来自特定分布3 数据在分布中有特定位置4 数据分布中的方差固定非随机性的结果是所有的经典统计检验都将是病态的、无效的;借助统计计算的不确定性就无意义;给定容限下,计算的最小样本大小也变得没有意义;前述的简单模型:x=常数+误差,也是无效的;参数估计也变得不可靠和值得怀疑。产生非随机性的主要原因之一是存在自相关性。自相关是指xt与xt-k之间的相关,其中k是定义滞后(Lag)的整数。通过自相关图(autocorrelation plot)或滞后图(lag plot),可以检测自相关。自相关引起数据的非随机性,则相邻数值可能具有关联;既无法验证数据中的异常值是“垃圾”还是“富含信息”;研究数据可能不是自然现象的n个独立的“快照”。第 3 页,共 6 页得 分 三、以exam.txt中的X1、X2数据为基础,完成以下双变量统计分析。(35分)1 绘出X1与X2、X1与X3、X1与X4的散点图,写出相应的MATLAB代码。(6分)subplot(1,3,1)scatter(x1,x2,*);subplot(1,3,2)scatter(x1,x3);subplot(1,3,3)scatter(x1,x4,filled);2计算X1与X2之间的协方差和相关系数,并完成相关系数的统计检验。(4分)cov13=cov(x1,x3)r13 = corrcoef(x1,x3);rhos=bootstrp(1000,corrcoef,x1,x3);hist(rhos(:,2),30)3写出X1与X2之间的线性回归方程(X1为自变量,X2是因变量),绘出X1与X2拟合直线及其2误差范围。并写出相应的MATLAB代码。(10分) polytool(x1,x3);第 4 页,共 6 页 4分析X1与X2之间的残差是否服从正态分布? 采用bootstrap方法评价回归系数。(10分) p_bootstrp=bootstrp(1000,polyfit,x1,x3,1);hist(p_bootstrp(:,1),15);mean(p_bootstrp(:,1); 5计算X1与X4之间的2次多项式回归方程(X1是自变量,X4是因变量)。(5分) polytool(x1,x2,2)得 分 四、以exam.txt中的X1、X2、X3和X4数据为基础,完成以下多元数据分析和空间数据分析。(20分)1写出X1、X2、X3的3维散点图(plot3或scatter3)和人脸图(glyphplot)的MATLAB绘图代码(注意:不需要绘图!)。(2分) figurescatter3(x1,x2,x3);x=x1 x2 x3;glyphplot(x,glyph,face, grid,2 3);2重组X1X4数据: X11=X1(1:15), X12=X1(16:30), X21=X2(1:15), X22=X2(16:30), X31=X3(1:15),X32=X3(16 :30),X41=X4(1:15),X42=X4(16:30),对数组B=X11,X12,X21,X22,X31,X32,X41,X42, 完成B的主成分分析,写出用于主成分分析的MATLAB代码,绘出每个主成分的方差百分比及累积曲线。(8分)X11=x1(1:15); X12=x1(16:30);X21=x2(1:15); X22=x2(16:30);X31=x3(1:15);X32=x3(16 :30);X41=x4(1:15);X42=x4(16:30);B=X11 X12 X21 X22 X31 X32 X41 X42;boxplot(B);stdr=std(B);meanr=mean(B);meanr=repmat(meanr,30,1);%改sr=(B-meanr)./repmat(stdr,30,1);coefs, scores, variance,t2=princomp(sr);I=coefs*coefs;plot(scores(:,1),scores(:,2),+);percent_explained=100*variance/sum(variance);pareto(percent_explained);第 5 页,共 6 页3. 对题四.2所产生的数组B,完成系统聚类和以城市距离为基础的KNN聚类。要求写出相应的MATLAB代码,绘制聚类相关的谱系图,评价聚类结果(10分)。%K-means聚类size(B)IDX,sumd,DD = kmeans(B,3,distance,city);silh3,h = silhouette(B
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年事业单位工勤技能-河北-河北图书资料员三级(高级工)历年参考题库含答案解析(5套)
- 2025年事业单位工勤技能-江苏-江苏防疫员三级(高级工)历年参考题库含答案解析
- 2025年事业单位工勤技能-江苏-江苏工程测量工四级(中级工)历年参考题库含答案解析
- 2025年事业单位工勤技能-广西-广西计量检定工三级(高级工)历年参考题库典型考点含答案解析
- 2025年事业单位工勤技能-广东-广东热处理工二级(技师)历年参考题库典型考点含答案解析
- 2025年事业单位工勤技能-广东-广东林木种苗工一级(高级技师)历年参考题库典型考点含答案解析
- 2025年事业单位工勤技能-安徽-安徽热力运行工三级(高级工)历年参考题库典型考点含答案解析
- 2025年事业单位工勤技能-安徽-安徽城管监察员三级(高级工)历年参考题库典型考点含答案解析
- 2025年事业单位工勤技能-北京-北京房管员一级(高级技师)历年参考题库典型考点含答案解析
- 2025年事业单位工勤技能-北京-北京地图绘制员五级(初级工)历年参考题库典型考点含答案解析
- 山西省持有《危险废物经营许可证》单位一览表
- PCB全制程培训教材
- 《李将军列传》教学教案及同步练习 教案教学设计
- 烟草配送车辆GPS管理方案
- 中图法分类号与中图分类法查询
- 酒店客房验收工程项目检查表(双床房、大床房、套房)
- 开音节闭音节中元音字母的发音规律练习
- 电力设备预防性试验及维护保养方案
- 融资性担保贷款保后检查表
- 公司人力资源管理制度管理制度
- 合同转让三方协议范本
评论
0/150
提交评论