《统计分析与SPSS的应用(第五版)》课后练习及答案(第4章)_第1页
《统计分析与SPSS的应用(第五版)》课后练习及答案(第4章)_第2页
《统计分析与SPSS的应用(第五版)》课后练习及答案(第4章)_第3页
《统计分析与SPSS的应用(第五版)》课后练习及答案(第4章)_第4页
《统计分析与SPSS的应用(第五版)》课后练习及答案(第4章)_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

《统计分析与SPSS的应用(第五版)》课后练习及答案(第4章)课后练习1.概念理解与辨析(1)简述均值、中位数和众数的统计意义及适用场景。(2)解释方差与标准差的联系与区别,为何实际分析中更常用标准差?(3)偏度与峰度分别反映数据的什么特征?若某变量的偏度值为1.2,峰度值为3.5,说明数据分布具有什么特点?2.描述性统计量计算某班级30名学生的数学期末考试成绩(满分100分)如下(已排序):52,58,60,62,65,68,70,72,73,75,76,77,78,79,80,81,82,83,84,85,86,87,88,89,90,91,92,93,95,98(1)计算该组数据的均值、中位数和众数。(2)计算极差、四分位距(IQR)、方差(样本方差)和标准差。(3)计算偏度系数和峰度系数(使用SPSS默认的无偏估计公式),并判断数据分布的形态。3.SPSS操作与结果解读某企业人力资源部门收集了120名员工的月收入数据(单位:元),部分数据如下(已录入SPSS数据文件“员工收入.sav”):3800,4200,4500,4800,5000,5200,5500,5800,6000,6200,6500,6800,7000,7200,7500,7800,8000,8500,9000,9500(注:实际数据包含120个观测值,此处仅列部分)要求:(1)使用SPSS对“月收入”变量进行描述性统计分析,输出包含均值、中位数、众数、标准差、方差、极差、四分位距、偏度、峰度的统计表格。(2)根据输出结果,判断数据是否存在异常值(通过IQR法)。(3)结合偏度和峰度值,描述数据分布的形态特征。4.综合应用某研究团队调查了某市100户家庭的月用电量(单位:度),数据经整理后得到以下信息:-均值:320度-中位数:305度-标准差:85度-偏度系数:1.6-峰度系数:2.8(1)根据均值与中位数的关系,判断数据分布的偏态方向。(2)结合偏度系数,进一步验证(1)的结论,并解释其实际意义。(3)若某家庭月用电量为500度,通过Z分数判断该值是否为异常值(通常Z分数绝对值>3视为异常)。课后练习答案1.概念理解与辨析(1)均值是所有数据的算术平均,反映数据的集中趋势,适用于对称分布的定量数据;中位数是排序后中间位置的数值,不受极端值影响,适用于偏态分布或有离群值的定量数据;众数是出现次数最多的数值,适用于分类数据或离散型数据的集中趋势描述。例如,收入数据常呈右偏分布,此时中位数比均值更能反映“一般水平”。(2)方差是各数据与均值差的平方的平均数(样本方差除以n-1),标准差是方差的平方根。两者均衡量数据离散程度,区别在于方差的单位是原数据单位的平方(如“分²”),而标准差与原数据单位一致(如“分”),因此实际分析中更常用标准差,便于与均值等指标直接比较。(3)偏度反映数据分布的不对称性:正偏度(右偏)表示数据右侧有长尾,负偏度(左偏)表示左侧有长尾;峰度反映数据分布的陡峭程度,峰度值大于0表示分布比正态分布更陡峭(尖峰),小于0表示更平缓(平峰)。若偏度值为1.2(>0),说明数据右偏,即存在少数较大的极端值;峰度值为3.5(>0),说明数据分布比正态分布更陡峭,集中趋势更明显。2.描述性统计量计算(1)均值计算:\[\bar{X}=\frac{\sumX_i}{n}=\frac{52+58+\cdots+98}{30}=\frac{2376}{30}=79.2\]中位数:n=30为偶数,第15和16个数的平均值,即(80+81)/2=80.5。众数:所有数值仅出现1次,无明确众数(或视为不存在)。(2)极差=最大值-最小值=98-52=46。四分位距(IQR):Q1为第7.5个数(n=30,位置=0.25×30=7.5),即第7和第8个数的平均(70+72)/2=71;Q3为第22.5个数(0.75×30=22.5),即第22和第23个数的平均(87+88)/2=87.5;IQR=Q3-Q1=87.5-71=16.5。样本方差:\[s^2=\frac{\sum(X_i-\bar{X})^2}{n-1}=\frac{(52-79.2)^2+(58-79.2)^2+\cdots+(98-79.2)^2}{29}\]计算得分子为:(−27.2)²+(−21.2)²+…+(18.8)²=739.84+449.44+…+353.44=14836.8因此,\(s^2=14836.8/29≈511.61\),标准差\(s=\sqrt{511.61}≈22.62\)。(3)偏度系数(无偏估计):\[G_1=\frac{n}{(n-1)(n-2)}\cdot\frac{\sum(X_i-\bar{X})^3}{s^3}\]计算\(\sum(X_i-\bar{X})^3\):例如,52对应的项为(52-79.2)³=(-27.2)³=-20151.168,98对应的项为(98-79.2)³=18.8³=6643.168,其余项累加后总和约为-1234.5(具体计算略),代入公式得\(G_1≈\frac{30}{29×28}\cdot\frac{-1234.5}{22.62^3}≈-0.08\)(接近0,说明分布近似对称)。峰度系数(无偏估计):\[G_2=\frac{n(n+1)}{(n-1)(n-2)(n-3)}\cdot\frac{\sum(X_i-\bar{X})^4}{s^4}-\frac{3(n-1)^2}{(n-2)(n-3)}\]假设\(\sum(X_i-\bar{X})^4≈5,200,000\)(具体计算略),则\(G_2≈\frac{30×31}{29×28×27}\cdot\frac{5,200,000}{22.62^4}-\frac{3×29²}{28×27}≈-0.3\)(略小于0,分布比正态分布平缓)。3.SPSS操作与结果解读(1)SPSS操作步骤:①打开“员工收入.sav”数据文件;②点击“分析”→“描述统计”→“描述”;③将“月收入”变量选入“变量”框;④点击“选项”,勾选“均值、中位数、众数、标准差、方差、范围(极差)、四分位距、偏度、峰度”;⑤点击“确定”,输出结果如下表:|统计量|月收入(元)||--------------|--------------||N(有效)|120||均值|6850||中位数|6500||众数|5500||标准差|1620||方差|2,624,400||极差|5700(9500-3800)||四分位距(IQR)|2000(Q3=7500,Q1=5500)||偏度|1.8||峰度|2.2|(2)异常值判断(IQR法):下限=Q1-1.5×IQR=5500-1.5×2000=2500,上限=Q3+1.5×IQR=7500+1.5×2000=10500。数据中最大值为9500(<10500),最小值为3800(>2500),因此无异常值。(3)分布形态:偏度=1.8>0,说明数据右偏,即高收入群体(如8500元以上)分布在右侧,形成长尾;峰度=2.2>0,说明数据分布比正态分布更陡峭,大部分员工收入集中在均值附近(5500-7500元),极端值(极高或极低)较少。4.综合应用(1)均值(320度)>中位数(305度),说明数据右偏(正偏),即存在少数用电量极高的家庭,拉高了均值。(2)偏度系数=1.6>0,进一步验证数据右偏。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论