雨课堂学堂在线学堂云《基于R语言的社会统计分析(清华)》单元测试考核答案_第1页
雨课堂学堂在线学堂云《基于R语言的社会统计分析(清华)》单元测试考核答案_第2页
雨课堂学堂在线学堂云《基于R语言的社会统计分析(清华)》单元测试考核答案_第3页
雨课堂学堂在线学堂云《基于R语言的社会统计分析(清华)》单元测试考核答案_第4页
雨课堂学堂在线学堂云《基于R语言的社会统计分析(清华)》单元测试考核答案_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第1题观察性研究和实验性研究的根本区别是A调查研究以人为对象B实验研究只有临床研究才会使用C观察性研究要遵循随机化原则D观察性研究只进行客观记录而不进行干预第2题下列陈述中错误的是A统计学是一套获取与分析数据的方法B统计学为设计、描述、和推断提供方法学基础C研究者所感兴趣的通常是样本本身的特性D统计推断是指利用样本信息对总体进行推测第3题下面关于因果关系的陈述中错误的是A单纯通过观察性研究建立因果关系几乎是不可能的B因果关系总是可以通过严谨的统计建模得以证明C实验性研究在证明因果关系方面更具优势D使用双胞胎样本研究吸烟与健康的关系是为了更好的控制基因(作为混淆因素)对健康的影响第4题盖洛普公司于2015年8月6日到9月10日之间,通过电话调查的方式随机抽取了3010名18岁及以上的、居住在美国50个州以及哥伦比亚特区的成年人。调查发现61%的研究对象背负着至少一种债务。请问61%是A总体参数B总体统计量C样本参数D样本统计量第5题下面哪种抽样方法不属于简单随机抽样A计算机生成随机数法B从抽奖箱里抽取中奖号码C在麦当劳门口拦截路人回答问题第1题以下哪个变量属于定性变量?A空气质量指数B班级人数C每季流行色D过去一年的日平均气温第2题下面哪些变量属于连续变量A图书馆每天归还图书的数量B上海证券综合指数(上证综指)每天收市时的数值C每分钟心跳的次数D你每天的手机通话次数第3题当我们为某项研究收集数据时,为什么需要对数据收集过程进行严格设计和监控?A为了可以得到正确的均值B为了减少偏差C为了避免错误D为了确定我们得到了最好的数据第4题以下哪个测量值是用来度量数据的离散程度的?A众数和均值B中位数C第一和第三四分位数D标准差和方差第5题某个变量的最小值为3,第一四分位数(Q1)为4.5,中位数为9,第三四分位数(Q3)是10.5,最大值是20,根据这5个数值,下面哪个陈述是正确的?A数据中没有异常值B3和20都是异常值C数据呈对称分布D数据呈右偏分布E20是一个异常值正确答案:E第四章:概率分布--4.5习题第1题使用R,计算下列数据的方差、标准差和极差。9,7,8,6,9,12,11,5,9,10A方差:5;标准差:2.2;极差:7B方差:4.7;标准差:2.2;极差:7C方差:4.7;标准差:2.0;极差:7D方差:5;标准差:2.2;极差:6E方差:5;标准差:2.0;极差:7第2题以下频数分布表展示了一个样本量为50的随机样本中每个家庭户订阅杂志的数量分布。请计算每户订阅杂志数量的均值。订阅杂志数为(0,1,2,3,4,5,6),对应频数为(12,8,17,7,3,1,2)。A2.0B1.8C1.5D3.0E92第3题以下哪个不是随机变量?A掷一个均匀的筛子得到的点数B温哥华的气温C不同选举候选人获得的票数D一小时的分钟数ELongBeachMemorial医院中病人的心率第4题以下哪些关于连续型随机变量及其概率分布的陈述是正确的:I.概率分布可以由一个概率密度函数来描述II.一个事件E发生的概率可以由P(X=E)来计算III.概率曲线下的面积总和为1A只有I正确B只有I和II正确C只有I和III正确D只有II正确E只有III正确第5题下列关于概率的陈述中正确的是I.P(E)大于等于0并且小于等于1II.所有可能事件发生的概率之和为1III.一件事情发生的概率等于成功事件数与失败事件数的比值A只有I正确B只有I和IIIC只有II正确D只有I和II正确E只有III正确第五章:统计推断-估计--5.5习题第1题以下哪项关于样本均值的抽样分布的陈述不正确?A样本均值抽样分布的均值等于总体均值μ,标准差为σ/√nB如果总体服从正态分布,那么样本均值的抽样分布也服从正态分布C对于较小的样本量,样本均值的抽样分布和原总体的分布形态类似D如果获得了超过30个由样本量相同的样本得出的样本均值,那么样本均值的分布将近似的服从正态分布E样本均值的抽样分布是由相同样本量的样本中获得的所有可能样本均值的分布第2题一个分布形态未知的总体有均值25和标准差3.4,当样本量为n=16时,以下哪项关于样本均值抽样分布均值和标准差的陈述是正确的?A25;0.85B25;3.4C6.25;0.85D6.25;3.4E由于样本量过小,均值和标准差无法获得第3题某个实验有三个互斥的结果,A、B和C。如果P(A)=0.11,P(B)=0.62,并且P(C)=0.27。以下哪个选项是正确的?I.A与C相互独立II.P(AandC)=0III.P(BorC)=P(B)+P(C)A只有I正确B只有I和II正确C只有I和III正确D只有II和III正确EI、II和III都正确第4题下列关于点估计的描述中错误的是:A点估计是用样本统计量来估计总体参数的一种统计推断方法B点估计适用于对推断的准确程度与可靠程度要求很高的情况C一个参数可能有多个点估计值D好的点估计值要求其抽样分布的标准误越小越好第六章:统计推断-区间估计--6.5习题第1题一个包含100个气球的随机样本中,有30个气球是蓝色的.构建一个置信水平为95%的区间用于估计总体中蓝色气球的数量。A(0.210,0.390)B(0.193,0.407)C(0.165,0.334)D(0.200,0.380)E(0.198,0.378)第2题你希望构建一个置信水平为95%的关于总体比例的置信区间,如果你希望把边际误差控制在0.05之内,那么你至少需要多大的样本量?(注:当对总体比例的状况毫不知情时,可以假设总体比例的估计为0.5,此时的乘积达到最大)A93B200C325D384E1093第3题当总体均值置信区间中的其它元素保持不变时,下面哪项变化可以使置信区间的边际误差减小。I.标准误减小II.样本量变小III.置信水平降低A只有I和II正确B只有I和III正确C只有II和III正确DI,II和III均正确E均不正确第4题一所中学里有500名学生,在这个总体中,棕色头发的学生的比例为17.8%.如果你用一个样本量为n=50的样本构建一个置信区间去估计这个总体比例,以下哪项陈述是正确的:I.置信区间会涵盖17.8%II.一个置信水平为95%的置信区间会包含17.8%III.这个置信区间的中心位于17.8%.A只有I和II正确B只有I和III正确C只有II和III正确DI,II和III均正确E均不正确正确答案:E第5题对于任意一个置信区间,如果样本量变为原来的3倍,这种变化会如何影响置信区间的大小?A置信区间会缩小3倍B置信区间会增加1.732倍C置信区间会缩小1.732倍D置信区间会增大3倍E以上陈述均不正确第七章:统计推断-显著性检验--7.6习题第1题原假设是关于什么的陈述A总体参数B总体均值C总体比例D总体区间第2题药监局为决定一种治疗感冒的新药是否符合上市标准而设计临床试验,下面哪种陈述可能导致药监局犯第二类错误A新药对治疗感冒没有作用B新药对治疗感冒有作用第3题下面关于第一类错误和第二类错误的陈述中错误的是A当原假设为真时,拒绝原假设,会造成第一类错误B当备择假设为假时,拒绝原假设,会造成第二类错误C在样本量一定的前提下,两类错误此消彼长D我们有时会更在意控制第二类错误,即β错误,因为它使得成功证明研究假设的概率增大第4题一项消费调查显示从某一供应商购买的手机中高于12%的比例有瑕疵。为了证明这个判断,正确的备择假设应该是Aπ=0.12Bπ≠0.12Cπ<0.12Dπ>0.12Eπ<0.88第5题一从正态总体中抽取的样本量为15的样本的均值为43,标准差为4.7。为证明总体均值小于45所进行的假设检验的p值是多少?(注:需使用R或高级计算器计算p值)A0.0608B0.1216C0.4696D0.9392第八章:两组比较和多组比较--8.6习题第1题1,假设2015年北京市PM2.5浓度的年均值为150μg/m3,标准差为50μg/m3;上海的PM2.5浓度年均值为80μg/m3,标准差为25μg/m3。12月30日那天,北京和上海的PM2.5浓度峰值恰巧都是100μg/m3,那么这个读数对哪个城市来说更加异常?A北京B上海C一样异常D证据不足,无法得出结论第2题2,研究人员设计了一个小型研究来探讨当地汽车经销商是否在销售同一款汽车时向女性顾客的要价高于男性。使用当地的缴税记录,研究人员在从同一经销商处、购买同一款配置相同的汽车的顾客中随机抽取一名男性和一名女性,对他们的成交价格进行对比。这个过程针对8款随机抽取的汽车型号重复了8次。为相对严格的证明女性购车的成交价格高于男性,研究者对以上过程所收集的数据进行了假设检验。请选择该检验是什么检验?A单样本t检验B独立样本t检验C配对样本t检验第3题3,公司A从45个月的缴费记录中获得每月平均电话费为标准差为49,标准差为10.5,类似的公司B从45个月的缴费记录中获得每月平均电话费为标准差为52,标准差为12.10,为证明公司A的月平均话费小于公司B的假设,以下哪个检验统计量的取值是正确的?A-1.256B-1.237第4题4,GSS数据从486名女性和354名男性中获取的数据显示,女性和男性分别有8.3(s=15.6)和8.9(s=15.5)个好朋友。如果用置信区间的方法研究男性好友平均数是否大于女性这个问题,那么我们所应构造的置信水平为95%的置信区间应是什么?A(-1.6,2.6)B(-1.5,2.7)第5题5,从上题所构建的95%置信区间,你可以得到以下哪个结论?A男性平均好友数多于女性,因为置信区间有更大比例大于0B无法得出男性平均好友数多于女性的结论,因为置信区间涵盖0C无法得出确切结论,因为并没有完成假设检验第九章:变量间的关联分析--9.4习题第1题1.研究者希望使用美国一般社会调查数据分析不同教育程度的个人在收入上是否存在显著差异,其中教育程度的类别包括小学、中学、高中等,收入是以美元为单位记录的数值型变量。研究者应该使用哪种分析手段来进行两变量间的关联分析?A相关系数B卡方检验CANOVA方差检验D比较两组均值第2题2.每年,在加州大学洛杉矶分校由高等教育研究学院实施的一个大规模的大学新生的民意调查询问他们对各种问题的看法。2002年,在283000名大学新生的调查中,46%的男生和35%的女生表明支持大麻合法化。如果大学新生总体的结果同上述结果相似,那么性别和有关大麻合法化的看法将是独立的还是相依的?A独立B相依第3题3.2004年美国一般社会调查中政党身份变量和种族变量之间的分布情况如下,黑人中,支持民主党、独立人士和共和党的人数分别为250、106和17,白人中为640、783和775。求在假设两变量无关时,黑人民主党的的期望频数。A129.1B114.9C243.3第4题4.下表取自2006年美国一般社会调查中交叉分类的幸福(HAPPY)和婚姻状况(MARITAL)。请使用R软件对婚姻状况及幸福两变量进行卡方检验,得到的卡方检验值及p值分别是多少?AX-squared=235.9BX-squared=236.4CX-squared=234.3DX-squared=238.5第5题5.下列四种情况中,相关系数绝对值最大的是?A美国某年7个州的贫困率与谋杀率,贫困率9.117.420.015.418.29.98.5,谋杀率9.011.610.286.13.15.86.3。By=3+x^2Cy=5+2x+ε(ε为随机项)Dy=7-0.5x第十章:简单线性回归--10.6习题第1题以下关于回归分析的陈述中错误的是:A回归分析是一种简化数据的方法B回归分析在统计学习的语境下属于监督式学习(supervisedlearning)的范畴C回归分析研究变量间的相关关系D回归分析的目的是证明变量间的因果关系第2题以下关于评价回归模型系数的陈述中错误的是:A比起截距项,研究者通常更关注对斜率项的统计推断B在对β1进行假设检验时,原假设是β1=1,即自变量与因变量之间无关Cβ1的取值代表自变量x增加1个单位时,因变量y的平均变化幅度D系数的标准误代表该系数抽样分布的标准差第3题在一次试验中测得(x,y)的观测值分别为(7,2),(10,4),(6,6),(5,8),则x与y的回归方程为Ay=13-1.14xBy=10-0.71xCy=9-0.57xDy=9.5-0.5x第4题以下关于判定系数的陈述中错误的是:A判定系数等=残差平方和/总平方和B判定系数是一个取值在0和1之间的数C判定系数越大,说明模型对数据的拟合程度越高D判定系数测量了y的变化中可以由模型解释关系解释的那部分变化的占比第5题关于以下陈述的评价正确的是:I.回归分析是指最小二乘回归(LeastSquareRegression)II.之所以选择最小二乘法,是因为由该方法求得的回归系数可以最好的代表自变量和因变量之间的关系III.最小二乘法是多种估计回归系数的方法之一IV.最小二乘回归线是一条到样本各

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论