付费下载
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、精品文档SPSS统计软件课程作业信计 111刘晓蕾1. 某单位对 100 名女生测定血清总蛋白含量,数据如下:74.3 78.8 68.8 78.0 70.4 80.5 80.5 69.7 71.2 73.579.5 75.6 75.0 78.8 72.0 72.0 72.0 74.3 71.2 72.075.0 73.5 78.8 74.3 75.8 65.0 74.3 71.2 69.7 68.073.5 75.0 72.0 64.3 75.8 80.3 69.7 74.3 73.5 73.575.8 75.8 68.8 76.5 70.4 71.2 81.2 75.0 70.4 68.0
2、70.4 72.0 76.5 74.3 76.5 77.6 67.3 72.0 75.0 74.373.5 79.5 73.5 74.7 65.0 76.5 81.6 75.4 72.7 72.767.2 76.5 72.7 70.4 77.2 68.8 67.3 67.3 67.3 72.775.8 73.5 75.0 73.5 73.5 73.5 72.7 81.6 70.3 74.373.5 79.5 70.4 76.5 72.7 77.2 84.3 75.0 76.5 70.4计算样本均值、中位数、方差、标准差、最大值、最小值、极差、偏度和峰度,并给出均值的置信水平为95%的置信区间。
3、第 1 步 数据组织:定义 1 个变量为: “血清总蛋白含量”,其度量标准为“度量 ”。第 2 步探索分析设置:选择菜单 “分析 描述统计 探索 ”,打开 “探索 ”对话框,将 “血清总蛋白含量 ” 字段移入 “因变量列表 ”。打开“统计量”对话框,选中“描述性”选项;打开“探索:图”对话框,选中“按因子水平分组”、“茎叶图 ”、“带检验的正态图”、“直方图”等选项。打开 “探索:选项 ”,选中 “按列表排除个案”选项。1欢迎下载精品文档第 3 步 运行结果及分析:描述统计量标准误血清总蛋白含量均值73.6680.39389均值的 95% 置信区间下限72.8864上限74.44965% 修整
4、均值73.6533中值73.5000方差15.515标准差3.93892极小值64.30极大值84.30范围20.00四分位距4.60偏度.054.241峰度.037.478表中显示“血清总蛋白含量”的描述性统计量,左表中只显示的是均值、均值的95%置信区间的上下限、中值、方差、标准差、极大/ 小值、偏度、峰度等2.绘出习题1 所给数据的直方图、盒形图和QQ图,并判断该数据是否服从正态分布。2欢迎下载精品文档。3欢迎下载精品文档上图为标准Q-Q 图, Q-Q 图可以用来检验数据是否服从某种分布,在Q-Q 图中,检验数据是否较好地服从给定分布的标准有两个:看标准Q-Q 图上的数据点与直线的重合度
5、;Q-Q趋势图上的点是否关于直线 Y=0 在较小的范围内上下波动。 从上图中可以看出, 题目中的数据与直线重合度较好,故很好地服从正态分布,这与前面的正态检验表中的结果是一致的。4欢迎下载精品文档箱图中显示血清蛋白总含量数据绘制成对应的箱体。每一个箱体上方那条线的取值代表该分组中最大值, 下方那条线的取值代表最小值。箱体自身的三条线从上到下分别代表3/4 分位点、中位点、 1/4 分位点的取值。正态性检验Kolmogorov-Smirnov aShapiro-Wilk统计量dfSig.统计量dfSig.血清总蛋白含量.073100.200 *.990100.671a. Lilliefors显著
6、水平修正*.这是真实显著水平的下限。表中显示了血清总蛋白含量的两种检验方法的正态性检验结果,包括各分组的统计量、自由度及显著性水平,以 K-S 方法的分析: 其自由度sig.=0.200,明显大于 0.05 ,故应接受原假设,认为题中数据服从正态分布。5欢迎下载精品文档3.正常男子血小板计数均值为225109 / L , 今测得20 名男性油漆工作者的血小板计数值(单位: 109 / L )如下:220 188 162 230 145 160 238 188 247 113126 245 164 231 256 183 190 158 224 175问油漆工人的血小板计数与正常成年男子有无异常
7、?分析 : 这是一个典型的比较样本均值和总体均值的T检验问题 ;第1步数据组织:首先建立 SPSS数据文件, 只需建立一个变量“血小板计数”,录入相应的数据即可第2步 单样本 T检验分析设置选择菜单“分析比较均值单样本T检验( S)”,打开“单样本 T检验”对话框,将变量“血小板计数”移入”检验变量”列表框, 并输入检验值 225;打开 “单样本 T检验:选项 ”对话框 , 设置置信区间为95%(缺省为 95%);单个样本统计量N均值标准差均值的标准误血小板计数20192.150042.236529.44437上表给出了单样本T检验的描述性统计量,包括样本数 ( N)、均值、 标准差、 均值的
8、标准误。单个样本检验检验值 = 225差分的 95% 置信区间tdfSig.(双侧 )均值差值下限上限血小板计数-3.47819.003-32.85000-52.6173-13.0827本例置信水平为95%,显著性水平为0.05 ,从上表中可以看出,双尾检测概率P值为 0.003 ,小于 0.05 ,故原假设不成立,也就是说, 男性油漆工作者的血小板与225109 / L 有显著性差异,无理由相信油漆工人的血小板计数与正常成年男子无异常。4.在某次考试中,随机抽取男女学生的成绩各10 名,数据如下:男: 99 79 59 89 79 89 99 82 80 85。6欢迎下载精品文档女: 88
9、54 56 23 75 65 73 50 80 65假设总体服从正态分布,比较男女得分是否有显著性差异。第1步 数据组织 :在SPSS数据文件中建立两个变量, 分别为 “性别” 、“成绩” ,度量标准分别为 “名义”、“度量”,变量“品种”的值标签为:b男生, g女生,录入数据。第2步 独立样本 T检验设置 :选择菜单 “选择比较均值独立样本T检验 ”,打开 “独立样本 T检验 ”对话框,将 “成绩”作为要进行 T检验的变量, 将 “性别 ”字段作为分组变量, 定义分组变量的两个分组分别为 “b”和 “g”。打开 “独立样本 T检验:选项 ”对话框,具体选项内容及设置与单样本T检验相同。组统计
10、量性别N均值标准差均值的标准误成绩男生1084.000011.527743.64539女生1062.900018.453855.83562上表给出了本例独立样本T检验的基本描述统计量,包括两个样本的均值、标准差和均值的标准误。独立样本检验方差方程的Levene检验均值方程的t检验差分的 95% 置信区间FSig.tdfSig.( 双侧 )均值差值标准误差值下限上限成绩假设方差相等1.607.2213.06718.00721.100006.880656.6442935.55571假设方差不相3.06715.096.00821.100006.880656.4423535.75765等根据上表 “方
11、差方程的Levene检验 ”中的 sig. 为 0.221 ,远大于设定的显著性水平0.05 ,故本例两组数据方差相等。在方差相等的情况下,独立样本 T检验的结果应该看上表中的“假设方差相等 ”一行,第 5列为相应的双尾检测概率( Sig. (双侧)为 0.007 ,在显著性水平为 0.05 的情况下, T统计量的概率 p值小于 0.05 ,故应拒绝零假设 , ,即认为两样本的均值不是相等的,在本例中,能认为男女得分绩有显著性差异。5.设有 5 种治疗荨麻疹的药,要比较它们的疗效。假设将30 个病人分成5 组,每组 6 人,令同组病人使用一种药,并记录病人从使用药物开始到痊愈所需时间,得到下面
12、的记录:。7欢迎下载精品文档药物类别治愈所需天数15,8,7,7,10,824,6,6,3,5,636,4,4,5,4,347,4,6,6,3,559,3,5,7,7,6问所有药物的效果是否一样?第1步 分析:由于考虑的是一个控制变量(药物)对一个观测变量(治愈所需天数)的影响,而且是五种药物,所以不适宜用独立样本 T检验(仅适用两组数据),应采用单因素方差分析。第2步 数据的组织:数据分成两列, 一列是治愈所需天数,变量名为 “治愈所需天数 ”,另一变量是药物种类(变量值分别为 1,2,3,4 , 5),变量名为 “药物种类 ”,输入数据并保存。第3步 方差相等的齐性检验:由于方差分析的前提
13、是各个水平下(这里是不同的药物种类影响下的治愈所需天数)的总体服从方差相等的正态分布, 且各组方差具有齐性。 其中正态分布的要求并不是很严格,但对于方差相等的要求是比较严格的, 因此必须对方差相等的前提进行检验。误差方差等同性的Levene检验 a因变量 : 治愈所需天数Fdf1df2Sig.552425.699检验零假设,即在所有组中因变量的误差方差均相等。a.设计 :截距 +药物类别方差齐性检验的H0假设是:方差相等。从上表可看出相伴根据Sig.=0.699>(0.05 )说明应该接受 H0假设(即方差相等)。故下面就用方差相等的检验方法。ANOVA治愈所需天数。8欢迎下载精品文档平
14、方和df均方F显著性组间36.46749.1173.896.014组内58.500252.340总数94.96729上表是几种饲料方差分析的结果,组间(Between Groups )平方和( Sumof Squares )为 36.467 ,自由度( df )为 4,均方为 9.117 ;组内( Within Groups)平方和为 58.500 ,自由度为 25,均方为 2.340 ; F统计量为 3.896 。由于组间比较的相伴概率Sig. ( p值) =0.014<0.05 ,故应拒绝 H0假设(四种饲料喂猪效果无显著差异),说明五种药物对治愈所需天数有显著性差异。第4步 多重比
15、较分析:通过上面的步骤,只能判断4种饲料喂猪效果是否有显著差异。如果想进一步了解究竟是哪种药物与其他组有显著性的均值差别(即哪种药物更好)等细节问题, 就需要在多个样本均值间进行两两比较。由于第3步检验出来方差具有齐性,故选择一种方差相等的方法,这里选LSD方法;显著性水平默认取0.05 ;多个比较治愈所需天数LSD(I) 药(J) 药95% 置信区间物类别物类别均值差值 (I-J)标准 误差Sig.下限上限类别 1类别 22.5000*.88318.009.68114.3189类别 33.1667*.88318.0011.34774.9856类别 42.3333*.88318.014.514
16、44.1523类别 51.3333.88318.144-.48563.1523类别 2类别 1-2.5000 *.88318.009-4.3189-.6811类别 3.6667.88318.457-1.15232.4856类别 4-.1667.88318.852-1.98561.6523类别 5-1.1667.88318.198-2.9856.6523类别 3类别 1-3.1667 *.88318.001-4.9856-1.3477类别 2-.6667.88318.457-2.48561.1523类别 4-.8333.88318.354-2.6523.9856类别 5-1.8333 *.883
17、18.048-3.6523-.0144。9欢迎下载精品文档类别 4类别 1-2.3333 *.88318.014-4.1523-.5144类别 2.1667.88318.852-1.65231.9856类别 3.8333.88318.354-.98562.6523类别 5-1.0000.88318.268-2.8189.8189类别 5类别 1-1.3333.88318.144-3.1523.4856类别 21.1667.88318.198-.65232.9856类别 31.8333 *.88318.048.01443.6523类别 41.0000.88318.268-.81892.8189基
18、于观测到的均值。误差项为均值方( 错误)=2.340。*.均值差值在.05级别上较显著。从整个表反映出来五种药物相互之间均存在显著性差异,从效果来看是第3种最好,其次是第2种,第 1种最差。上图为几种药物均值的折线图,可以看出均值分布比较陡峭,均值差异也较大。6.某公司在各地区销售一种特殊化妆品。该公司观测了15 个城市在某月内对该化妆品的销售量 Y 及各地区适合使用该化妆品的人数X1 和人均收入X2,得到数据如下:。10欢迎下载精品文档地区销售(箱)人数(千人)人均收入(元)11622742450212018032543223375380241312052838567862347616926
19、5378278198300881923302450911619521371055532560112524304020122323724427131442362660141031572088152123702605(1) 画出这三个变量的两两散点图,并计算出两两之间的相关系数。11欢迎下载精品文档。12欢迎下载精品文档(2) 试建立 Y 与 X1, X2 之间的线性回归方程,并研究相应的统计推断问题,同时预测适合购买此化妆品的人数为220 千人,人均收入为 2500 元的某城市对该化妆品的销量。第 1步 分析:这是一个因变量和两个自变量之间的问题,故应该考虑用二元线性回归解决。第 2步 数据组织
20、:定义三个变量,分别为 “z”(销售量)、 “x”(人数)、 “y”(人均收入)。第 3 步 一元线性回归分析设置:选择菜单“分析回归线性”,打开“线性回归”对话框,将变量“销售量”作为因变量,“人数”和“人均收入”作为自变量。打开“统计量”对话框,选上“估计”和“模型拟合度”。单击“绘制( T)”按钮,打开“线性回归:图”对话框,选用 DEPENDENT作为 y 轴, *ZPRED为 x 轴作图。并且选择“直方图”和“正态概率图”作相应的保存选项设置,如预测值、残差和距离等。输入移去的变量模型输入的变量移去的变量方法1人均收入 ,人数 a. 输入a. 已输入所有请求的变量。表中显示回归模型编
21、号、进入模型的变量、移出模型的变量和变量的筛选方法。可以看出,进入模型的自变量为“销售量 ”。13欢迎下载精品文档模型汇总 b模型RR方调整 R 方标准估计的误差1.999 a.999.9992.17722a. 预测变量 : ( 常量 ), 人均收入 , 人数。b. 因变量 : 销售量R=0.999 ,说明自变量与因变量之间的相关性很强。R方 ( R2) =0.999,说明自变量“销售量 ”可以解释因变量“人数”和“人均收入”的99.9%的差异性。Anovab模型平方和df均方FSig.1回归53844.716226922.3585679.466.000 a残差56.884124.740总计5
22、3901.60014a. 预测变量 : ( 常量 ), 人均收入 , 人数。b. 因变量 : 销售量表中显示因变量的方差来源、方差平方和、自由度、均方、F检验统计量的观测值和显著性水平。方差来源有回归、残差。从表中可以看出,F统计量的观测值为5679.466 ,显著性概率为 0.000 ,即检验假设 “H0:回归系数 B = 0 ”成立的概率为 0.000 ,从而应拒绝原假设,说明因变量和自变量的线性关系是非常显著的,可建立线性模型。14欢迎下载精品文档系数 a非标准化系数标准系数模型B标准 误差试用版tSig.1(常量)3.4532.4311.420.181人数.496.006.93481.
23、924.000人均收入.009.001.1089.502.000a. 因变量 : 销售量表中显示回归模型的常数项、非标准化的回归系数B 值及其标准误差、 标准化的回归系数值、统计量 t 值以及显著性水平 ( Sig. )。从表中可看出, 回归模型的常数项为3.453 ,自变量 “人数”的回归系数为0.496 ,“人均收入”的回归系数为0.009. 因此,可以得出回归方程:销售量 =3.453+ 0.496 × 人数 +0.009 ×人均收入 。回归系数的显著性水平为 0.000 ,明显小于 0.05 ,故应拒绝 T 检验的原假设, 这也说明了回归系数的显著性,说明建立线性模
24、型是恰当的。当购买此化妆品的人数为220千人,人均收入为2500元时,该城市该化妆品的销量为:销售量 =220× 0.496+0.009 × 2500+3.453=135.073 箱系数 a非标准化系数标准系数相关性模型B标准 误差试用版tSig.零阶偏部分1(常量)3.4532.4311.420.181人数.496.006.93481.924.000.995.999.768人均收入.009.001.1089.502.000.639.940.089a. 因变量 : 销售量。15欢迎下载精品文档7. 研究青春发育阶段的年龄和远视率的变化关系,测得数据如下年 678910111
25、2131415161718龄远 63.61.38.13.14.8.04.42.22.01.02.53.12.9视 64068475571792128率请对年龄与远视率的关系进行曲线估计。第1步分析:先用散点图的形式进行分析,看究竟是否具有一元线性关系,如果具有一元线性关系,则用一元线性回归分析,否则采用曲线估计求解。第 2 步 数据组织:定义为两个变量,分别是“x”(年龄)、 “y”(远视率),输入数据并保存。第 3 步 作散点图初步判定变量的分布趋势:。16欢迎下载精品文档第4步 进行曲线估计:依次选择菜单 “分析回归曲线估计 ”,将所有模型全部选上, 看哪种模型拟合效果更好 ( 主要看决定
26、系数 R2),其所有模型的拟合优度 R2如下表所示。模型汇总和参数估计值因变量 : 远视率模型汇总参数估计值方程R 方Fdf1Df2Sig.常数b1b2b3线性.75828.18219.00088.198-6.265对数.85151.22119.000180.617-68.560倒数.91293.29119.000-48.486679.341二次.95381.44828.000214.566-31.3111.138三次.95650.63837.000271.869-48.7352.804-.050复合.925110.42219.000834.164.658。17欢迎下载精品文档幂.934127.84819.000232454.999-4.351S.90182.30119.000-1.96340.901增长.925110.42219.0006.726-.419指数.925110.42219.000834.164-.419Logisti.925110.42219.000.0011.520c自变量为年龄。从决定系数( R方即 R2)来看,三次曲线效果最好(因为其R2 值最大),并且方差分析的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 郑州市中铁七局集团第五工程有限公司2026届高校毕业生招聘30人备考题库完整答案详解
- 2025年青岛市市南区城市发展有限公司及全资子公司公开招聘备考题库及参考答案详解
- 成都市龙江路小学新都校区面向社会公开招聘人员控制数教师20人备考题库及一套答案详解
- 2025年茂名市茂南区现场公开招聘急需紧缺人才6人备考题库及答案详解1套
- 外研版九年级下册英语备课组汇报课件
- 赣江新区人民医院2025年心血管内科医师岗招聘备考题库(第二批)及一套完整答案详解
- 统编版语文八年级上册第六单元课外古诗词诵读《采桑子轻舟短棹西湖好》课件
- 闵行区马桥文来外国语小学2025学年编外教师招聘备考题库完整参考答案详解
- 2025年江苏科技大学公开招聘工作人员97人备考题库(三)含答案详解
- 2025年舟山市嵊泗县融媒体中心公开招聘短视频制作人员或文字记者和技术人员的备考题库及参考答案详解1套
- 关于支付生活费协议书
- 购买牛饲料合同协议
- 2025年中国两轮电动车行业研究报告
- 椎弓根钉术后护理
- DLT 593-2016 高压开关设备和控制设备
- 现代药物制剂与新药研发知到智慧树章节测试课后答案2024年秋苏州大学
- DB32T 4660-2024 政务服务差评处置工作规范
- 胸腔手术术后并发症
- 2024-2025学年七年级生物上册 第二单元第三、四章 单元测试卷(人教版)
- JT∕T 900-2023 汽车售后维修服务客户满意度评价方法
- GB/Z 3480.22-2024直齿轮和斜齿轮承载能力计算第22部分:微点蚀承载能力计算
评论
0/150
提交评论