《社会统计学与SPSS应用》期末考试a试题及参考答案_第1页
《社会统计学与SPSS应用》期末考试a试题及参考答案_第2页
《社会统计学与SPSS应用》期末考试a试题及参考答案_第3页
《社会统计学与SPSS应用》期末考试a试题及参考答案_第4页
《社会统计学与SPSS应用》期末考试a试题及参考答案_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

《社会统计学与SPSS应用》期末考试a试题及参考答案一、单项选择题(每题2分,共20分)1.在SPSS中,若要对“月收入”变量进行分组,最佳操作路径是A.转换→重新编码为不同变量B.分析→描述统计→频率C.分析→比较均值→独立样本T检验D.图形→图表构建器【答案】A【解析】“重新编码为不同变量”可将连续变量切分为有序类别,同时保留原变量,符合分组需求;B仅输出频数;C用于均值差异检验;D用于可视化。2.某社区调查样本量n=1200,其中“教育程度”为定序变量,欲检验性别与教育程度是否独立,应选用A.皮尔逊χ²检验B.曼-惠特尼U检验C.克鲁斯卡尔-沃利斯检验D.二项分布检验【答案】A【解析】性别与教育程度均为分类变量,检验独立性用χ²;B、C用于定序与连续变量差异;D用于二分类比例。3.在SPSS输出表中,若“显著性(双尾)”值为0.002,可认为A.在0.01水平下显著B.在0.05水平下不显著C.效应量一定大D.无需报告置信区间【答案】A【解析】0.002<0.01,拒绝原假设;显著性仅说明统计差异,不直接反映效应量;置信区间仍应报告。4.对同一批被试前后测“焦虑得分”,若差值通过Shapiro-Wilk检验p=0.08,则后续优先采用A.配对样本t检验B.威尔科克森符号秩检验C.独立样本t检验D.弗里德曼检验【答案】A【解析】p=0.08>0.05,差值服从正态,满足配对t检验前提;B用于非正态;C、D设计不符。5.在多元线性回归中,若某自变量VIF=4.3,应A.立即删除该变量B.忽略,继续建模C.检查交互项D.考虑岭回归或主成分分析【答案】D【解析】VIF>4提示中度共线,可岭回归压缩系数;删除变量可能损失信息;交互项不能解决共线。6.SPSS中“标准化残差”大于3的个案,系统会在输出中标记为A.离群值B.杠杆值高C.库克距离大D.影响点【答案】A【解析】|Zresidual|>3为绝对离群;杠杆值看hat矩阵;库克距离综合杠杆与残差。7.当因变量为二分类,且样本不平衡(事件率2%),最佳评估指标是A.总体准确率B.召回率C.F1值D.AUC【答案】D【解析】不平衡时准确率失真;AUC对阈值不敏感,综合灵敏度与特异度;F1需先定阈值。8.在SPSS语法中,若运行COMPUTEnew=MEAN.3(x1,x2,x3,x4).则new变量含义为A.四题均值,允许最多1个缺失B.四题均值,允许最多3个缺失C.四题均值,必须全答D.四题总和【答案】A【解析】MEAN.3表示至少3个有效值才计算,即允许1个缺失;小数点前为最小有效数。9.对定类变量“血型”进行哑变量化,若保留A、B、AB、O四分类,回归模型中应引入A.3个哑变量B.4个哑变量C.1个哑变量D.无需引入【答案】A【解析】k类需k-1哑变量,避免虚拟变量陷阱;O型为参照。10.在SPSS“交叉表”对话框中,勾选“卡方”后,若最小期望频数=2.1,应A.改用费希尔精确检验B.继续读取皮尔逊χ²C.合并单元格D.增加样本量【答案】B【解析】Cochran准则要求<5的期望频数不超过20%,且最小≥1即可;2.1>1,无需改用精确。二、多项选择题(每题3分,共15分)11.下列哪些操作可在SPSS“变量视图”完成A.定义值标签B.设置缺失值范围C.更改变量类型D.插入新个案【答案】ABC【解析】“变量视图”管结构;插入个案在“数据视图”。12.关于效应量,下列说法正确的是A.η²用于ANOVAB.Cohen’sd用于t检验C.Cramer’sV用于χ²D.OR用于相关分析【答案】ABC【解析】OR用于病例-对照研究,非相关;其余正确。13.在Logistic回归输出中,可用来评估模型拟合优度的指标有A.-2LLB.霍斯默-莱梅肖检验C.伪R²D.方差膨胀因子【答案】ABC【解析】VIF用于线性回归共线;其余均用于Logistic。14.下列哪些图适合展示连续变量与分类变量关系A.箱线图B.小提琴图C.误差条形图D.帕累托图【答案】ABC【解析】帕累托用于缺陷频次排序;其余均可。15.在SPSS中,可通过“分析→降维→因子”实现A.主成分分析B.公因子分析C.最大似然法D.斜交旋转【答案】ABCD【解析】因子分析对话框集成PCA与EFA,提供多种估计与旋转。三、判断题(每题1分,共10分)16.SPSS数据文件后缀为.sav,可同时存储数据与元数据。【答案】√17.若Levene检验p<0.05,则独立样本t检验结果必须放弃。【答案】×【解析】可选“不假设等方差”行结果,即Welcht。18.在SPSS中,变量名允许以数字开头。【答案】×19.配对样本t检验的零假设为两总体均值相等。【答案】√20.当样本量极大时,p值会趋于变小,效应量显得不重要。【答案】×【解析】p与效应量概念不同,大样本仍需报告效应量。21.箱线图的箱体范围代表25%-75%分位数。【答案】√22.在Logistic回归中,OR=1.0表示自变量与因变量无关联。【答案】√23.SPSS无法直接输出肯德尔和谐系数。【答案】×【解析】分析→非参数→旧对话框→k相关样本即可。24.若Cronbach’sα=0.95,说明量表信度完美,无需再检。【答案】×【解析】过高可能冗余,需结合维度与内容效度。25.在SPSS语法中,RECODE与IF可嵌套使用。【答案】√四、简答题(每题8分,共24分)26.简述在SPSS中进行缺失值多重插补(M=5)的完整步骤,并指出如何合并结果。【答案】步骤:1)分析→多重插补→插补缺失数据;2)将含缺失变量选入“插补变量”,设置M=5,选择预测均值匹配或完全条件指定;3)在“输出”选项卡勾选创建新数据集;4)点击确定,生成含_Imputation_变量的长数据文件;5)对该文件运行目标分析(如回归),并在“选项”中勾选“插补池化”;6)SPSS自动输出合并系数、标准误及p值,依据Rubin规则计算池化方差。解析:多重插补优于列删,可减少偏差并给出正确标准误;M=5为常用起点,若缺失比例高可增至20。27.解释“标准化回归系数”与“非标准化回归系数”的区别,并给出何时优先报告前者。【答案】非标准化系数B表示自变量每增加1个原始单位,因变量的平均变化量,单位依存;标准化系数Beta将变量Z分数化后回归,消除量纲,可直接比较相对重要性。优先报告Beta场景:1)变量单位不同(如收入元与年龄岁);2)探讨解释力排序;3)跨模型比较。报告B场景:需制定实际干预方案,如工资涨1000元的影响。28.某研究欲检验“锻炼时长”对“减重比例”的影响,收集80名参与者数据,但发现残差呈明显漏斗形,简述诊断与补救流程。【答案】诊断:1)绘制标准化残差vs拟合值图,确认异方差;2)做Breusch-Pagan检验,若p<0.05则正式存在。补救:1)变量转换:对因变量取ln或平方根;2)加权最小二乘:以拟合值平方的倒数为权重;3)稳健标准误:使用HC3修正t检验;4)若异方差与遗漏变量有关,加入年龄、性别等协变量;5)重新检验残差,直至漏斗形消失。五、计算与分析题(共31分)29.(10分)某校随机抽取男女各50人,调查其每日手机使用时间(分钟),结果如下:男:mean=185,s=42;女:mean=168,s=38。(1)建立假设并选择检验;(2)手工计算t值(假设方差齐性);(3)若SPSS输出双尾p=0.018,请给出结论及效应量Cohen’sd。【答案】(1)H0:μ男=μ女;H1:μ男≠μ女;独立样本t检验。(2)合并方差Sp²=[(50-1)×42²+(50-1)×38²]/(50+50-2)=1604Sp=40.05t=(185-168)/√[1604×(1/50+1/50)]=17/√64.16=17/8.01=2.12(3)p=0.018<0.05,拒绝H0,男女手机使用时间差异显著;d=(185-168)/√[(42²+38²)/2]=17/40.02≈0.42,中等效应。30.(11分)研究者建立Logistic回归预测“是否愿意生育二孩”,自变量含“年龄(岁)”“受教育年限”“家庭收入(万元)”“性别(男=1)”,SPSS主要结果如下:变量BS.E.WaldpExp(B)年龄-0.150.0414.060.0000.86受教育0.220.087.560.0061.25收入0.090.039.000.0031.09性别0.850.317.500.0062.34常数2.100.806.890.0098.17(1)写出Logit(P)方程;(2)解释Exp(B)含义;(3)预测一名35岁、受教育16年、收入20万元、女性愿意生育二孩的概率;(4)指出哪变量对因变量影响最大,并说明依据。【答案】(1)Logit(P)=2.10-0.15×年龄+0.22×受教育+0.09×收入+0.85×性别。(2)Exp(B)即OR:年龄每增1岁,愿意生育优势乘以0.86,下降14%;受教育每增1年,优势乘以1.25;收入每增1万,优势乘以1.09;男性比女性优势乘以2.34。(3)女性→性别=0Logit=-0.15×35+0.22×16+0.09×20+2.10=-5.25+3.52+1.8+2.10=2.17P=e^2.17/(1+e^2.17)=0.897≈89.7%(4)年龄|β|=0.15最大,且Wald最大,对数优势变化幅度最大,故影响最大。31.(10分)某问卷“数字焦虑”量表含8题,Likert5点,Cronbach’sα=0.78。现欲提高到0.90,若删除某题后α=0.82,求该题与其余题总相关(rit)的近似值,并说明是否应删除。【答案】使用α公式反推:原α=k×r̄/[1+(k-1)r̄]→0.78=8r̄/(1+7r̄)→r̄=0.78/(8-7×0.78)=0.78/2.54=0.307设删除题与其余总相关rit,删后α’=(k-1)r̄’/[1+(k-2)r̄’]=0.82令k-1=7,0.82=7r̄’/(1+6r̄’)→r̄’=0.82/(7-6×0.82)=0.82/2.08=0.394又r̄’=[k×r̄-rit]/(k-1)→0.394=[8×0.307-rit]/7→rit=2.456-2.758≈-0.30rit为负,拉低整体信度,应删除。六、SPSS实操综合题(共30分)32.使用文件“employee.sav”,完成以下任务并截图粘贴关键输出:(1)绘制“当前工资”直方图并叠加正态曲线,描述分布形态;(2)检验“性别”与“少数族裔”是否独立(α=0.05);(3)建立多元线性回归,以“当前工资”为因变量,纳入“起始工资”“受教育年数”“工作经验月数”“性别”“少数族裔”,报告调整后R²及显著变量;(4)检查模型假设:正态性、同方差性、线性、无多重共线,给出诊断结果与改进建议;(5)写出最终模型方程,并解释起始工资系数。【答案】(1)图形→直方图→变量选salary,勾选正态曲线。输出显示右偏,峰度>0,存在高工资长尾。(2)分析→描述统计→交叉表→行gender,列minority,勾选卡方。皮尔逊χ²=4.62,p=0.032<0.05,拒绝独立,性别与族裔存在弱相关,Cramer’sV=0.12。(3)回归→线性→因变量salary,自变量salbegin、educ、prevexp、gender、minority。结果:调整后R²=0.789,F=402.3,p<0.001;显著变量:salbeginβ=0.78(p<0.001),educβ=0.09(p<0.001),genderβ=-0.11(p<0.001),minorityβ=-0.04(p=0.018),prevexpβ=0.002(p=0.210不显著)。(4)诊断:a)正态:P-P图基本沿对角线,Shapiro-Wilkp=0.04略<

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论