医用数理统计作业(最后一次)_第1页
医用数理统计作业(最后一次)_第2页
医用数理统计作业(最后一次)_第3页
医用数理统计作业(最后一次)_第4页
医用数理统计作业(最后一次)_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一题,分布拟合检验 一、问题:在西南医院儿科收集到 21 名周岁儿童身高的 样本数据,分析周岁儿童身高的总体是否服从正态分布。 二、数据: 70cm,71cm, 68cm,72cm ,76cm ,74cm,68cm,71cm,75cm,79c m,73cm ,64cm,68cm,70cm,69cm,70cm ,71cm,71cm ,78cm, 71cm,80cm 三、统计处理:该实际问题涉及 21 个样本,利用样本 的数据来推断样本是否来自服从正态分布的总体。因此, 采用 K-S 检验方法分析。 四、结果及分析: One-Sample Kolmogorov-Smirnov Test 身高 ( CM) N 21 Mean 71.8571Normal Parameters(a,b) Std. Deviation 3.97851 Absolute .204 Positive .204 Most Extreme Differences Negative -.119 Kolmogorov-Smirnov Z .936 Asymp. Sig. (2-tailed) .344 a Test distribution is Normal. b Calculated from data. 分析:由SPSS的结果表明,数据的均值为71.8571 ,标准差为 3.97851。最大绝对差值为0.204,最大正值为0.204,最小负值 为-0.119 。如果显著水平为0.05,由于Sig.为0.3440.05,因 此不能拒绝原假设,可以认为周岁儿童身高的总体分布与正态分 布无显著差异。 第二题,两正态总体间的均值比较 一、问题:从两处煤矿各区若干样品,得其含灰率为 (百分数): 甲:24.3 20.8 23.7 21.3 17.4 乙:18.2 16.9 20.2 16.7 问甲、乙两煤矿的平均含灰率有无显著差异?取 =0.05,设含灰率服从正态分布且 1= 2。 二、数据 编 号: 1 1 1 1 1 2 2 2 2 含灰率:24.3 20.8 23.7 21.3 17.4 18.2 16.9 20.2 16.7 三、统计处理 该实验是对甲乙两总体之间均值的比较,由于甲乙两总 体都服从正态分布,且 1= 2。故采用两独立样本t检 验,通过比较P值来确定甲乙两煤矿的平均含灰率有无 显著差异。 四、结果和分析 1, 表1 Group Statistics 分组 N Mean Std. Deviation Std. Error Mean 含灰率 1.00 5 21.5000 2.73953 1.22515 2.00 4 18.0000 1.61038 .80519 分析,表1是甲乙两煤矿含灰率的基本描述统计量。可以看出甲乙 两煤矿的平均含灰率分别是21.5和18.0,有些差距。 表2 分析,表2是甲乙两煤矿含灰率均值差的检验结果。该检验的F统 计量的观察值为0.827,对应的频率为 0.393。由于显著水平 为 0.05,概率P值大于,不能拒绝原假设,即甲乙两煤矿的含灰 率无显著差异。 第三题,回归分析 一,问题:今有年龄 X(岁)和血压 Y(kPa) ,资料如 下: 年 龄 13 17 19 20 23 26 28 33 34 38 42 45 血 压 12.3 12.3 12.8 13.6 13.3 13.9 13.6 14.0 14.5 14.3 14.5 15.9 Independent Samples Test .827 .393 2.245 7 .060 3.50000 1.55885 -.18608 7.18608 2.387 6.568 .051 3.50000 1.46606 -.01345 7.01345 Equal variancesassumed Equal variancesnot assumed F Sig. Levenes Test forEquality of Variances t df Sig. (2-tailed) MeanDifference Std. ErrorDifference Lower Upper 95% ConfidenceInterval of the Difference t-test for Equality of Means (1) 试问年龄和血压之间有无相关关系 (2)试求年龄和血压的回归方程 二、数据 编 号 1 2 3 4 5 6 7 8 9 10 11 12 年 龄 13 17 19 20 23 26 28 33 34 38 42 45 血 压 12.3 12.3 12.8 13.6 13.3 13.9 13.6 14.0 14.5 14.3 14.5 15.9 三、统计处理 该实际问题涉及两个连续型随机变量:年龄(X)和血 压(Y)。根据实验数据和处理目的,我们首先应对其进行 相关性分析,随后进行一元线性回归分析,因此选用 SPSS 统计软件中的双变量相关性分析和线性回归分析对 数据进行处理。 四、结果和分析 1. 相关分析结果 表 1 Descriptive Statistics 28.1667 10.29416 12 13.7500 1.02203 12 年龄 血压 Mean Std. Deviation N 表 2 Correlations 1 .931* .000 1165.667 107.700 105.970 9.791 12 12 .931* 1 .000 107.700 11.490 9.791 1.045 12 12 Pearson Correlation Sig. (2-tailed) Sum of Squares and Cross-products Covariance N Pearson Correlation Sig. (2-tailed) Sum of Squares and Cross-products Covariance N 年龄 血压 Correlation is significant at the 0.01 level (2-tailed). *. 分析:从表1可一得到两个考察对象的一些相关描述统计量: 平均值、标准差、样本容量等。 由表2得知:两个变量间相关系数为0.931 ,P值小于0.01, 因此在显著性水平0.01下认为进食量与体重增量具有一定的相关 性,且为显著相关。 2. 一元线性回归结果 表3 Model Summary Model R R Square Adjusted R Square Std. Error of the Estimate 1 .931(a) .866 .853 .39233 a Predictors: (Constant), 年龄 表 4 ANOVAb 9.951 1 9.951 64.648 .000 a 1.539 10 .154 11.490 11 Regression Residual Total Model 1 Sum of Squares df Mean Square F Sig. Predictors: (Constant), 年龄a. Dependent Variable: 血压b. 表 5 Coefficientsa 11.148 .343 32.509 .000 .092 .011 .931 8.040 .000 (Constant) 年龄 Model 1 B Std. Error Unstandardized Coefficients Beta Standardized Coefficients t Sig. Dependent Variable: 血压a. 分析:从表 5 可以得到血压和年龄间的一元线性回归方程: Y= 11.148+0.092X 该回归方程效果的好坏可以由表 3 和表 4 检验得结果:由 表 3 可知回归可决系数 R2=0.866,较大,认为该回归方程有意 义;同时,由表 4 知道关于自变量 X 的系数是否为零的检验中, 其 P 值远小于 0.01,故我们认为在显著性水平 0.01 下,回归方 程的线性回归效果非常显著。 第四题、r*c 列联表分析 一,问题:下表为某药治疗感冒的 3*3 列联表,问年龄 与疗效是否有关? 年龄 儿童 成年 老年 显著 58 38 32 一般 28 44 45 疗效 较差 23 18 14 二、数据 三、统计处理 该实际问题为 3*3 列联表分析,涉及两个因素,每个因 素涉及 3 个水平,疗效分:显著、一般、较差三个水平, 年龄分:儿童、成年、老年三个水平。根据实验数据和 处理目的,我们应该先进行卡方皮尔森检验,再进行残 差分析。 四、结果和分析 表 1 Chi-Square Tests 13.586a 4 .009 13.937 4 .008 1.449 1 .229 300 Pearson Chi-Square Likelihood Ratio Linear-by-Linear Association N of Valid Cases Value df Asymp. Sig. (2-sided) 0 cells (.0%) have expected count less than 5. The minimum expected count is 16.68. a. 由表1 可知,概率P值为0.009/21.96,则表明在(固定)疗效显 著的人群中,儿童的疗效显著的概率高于整体人群。 3.002.001.00 疗效 60 50 40 30 20 10 0 Count 3.00 2.00 1.00 年龄 表 3 Bar Chart 表3,通过直方图上直观的比较,可以发现疗效显著组中,“儿 童”代表的矩形是最高的,也印证了以上两个表的结论。 第五题、方差分析 一,问题:某种橡胶的配方中,考虑试用三种不同的促 进剂和四种不同的氧化剂,同样的配方各试验了两次, 测得它们的拉力如下表: 氧化锌 B1 B2 B3 B4 A1 31,33 34,36 36,36 39,38 A2 33,34 36,37 37,39 38,41 促凝剂 A3 35,37 37,38 39,40 42,44 试问:促凝剂、氧化锌以及它们的交互作用对拉伸力的 影响是否显著(=0.01)? 二、数据 三、统计处理 该实际问题为等重复试验交叉分组双因素方差分析,双 因素为促凝剂和氧化锌,促凝剂有三个水平 (A 1、A 2、A 3) ,氧化锌有四个水平( B1、B 2、B 3、B 4) , 来分析促凝剂、氧化锌以及它们之间的交互作用对拉伸 力的影响。首先要进行方差齐性的分析,然后再根据方 差是否齐性来进行下一步的检验。 四、结果和分析 1)方差齐性检验 表 1 Levenes Test of Equality of Error Variancesa Dependent Variable: 拉伸力 . 11 12 . F df1 df2 Sig. Tests the null hypothesis that the error variance of the dependent variable is equal across groups. Design: Intercept+促凝剂+氧化锌+ 氧化剂* 促凝剂a. 分析:由表1可知,P值=0.0000.01,说明促凝剂和氧化锌的组 合对拉伸力的影响无统计学差异。 3)描述性结果 1. Dependent Variable: - 35.375 .421 34.090 36.660 36.875 .421 35.590 38.160 39.000 .421 37.715 40.285 1.00 2.00 3.00 Mean Std. Error Lower Bound Upper Bound 99% Confidence Interval 2. Dependent Variable: - 33.833 .486 32.349 35.318 36.333 .486 34.849 37.818 37.833 .486 36.349 39.318 40.333 .486 38.849 41.818 1.00 2.00 3.00 4.00 Mean Std. Error Lower Bound Upper Bound 99% Confidence Interval 以上为描述性结果,主要是描述各水平的平均值以及标准差。同 时可以发现,促凝剂和氧化锌的组合对拉伸力的影响并是不很显 著。 4)多重性比较 Multiple Comparisons Dependent Variable: - -1.5000 1.30076 .608 -6.0890 3.0890 -3.6250 1.38793 .061 -8.5337 1.2837 1.5000 1.30076 .608 -3.0890 6.0890 -2.1250 1.38148 .379 -7.0133 2.7633 3.6250 1.38793 .061 -1.2837 8.5337 2.1250 1.38148 .379 -2.7633 7.0133 -1.5000 1.30076 .590 -6.0739 3.0739 -3.6250 1.38793 .059 -8.5171 1.2671 1.5000 1.30076 .590 -3.0739 6.0739 -2.1250 1.38148 .364 -6.9967 2.7467 3.6250 1.38793 .059 -1.2671 8.5171 2.1250 1.38148 .364 -2.7467 6.9967 (J) 2.00 3.00 1.00 3.00 1.00 2.00 2.00 3.00 1.00 3.00 1.00 2.00 (I) 1.00 2.00 3.00 1.00 2.00 3.00 Tamhane Dunnett T3 MeanDifference (I-J) Std. Error Sig. Lower Bound Upper Bound 99% Confidence Interval Based on observed means. 3. * Dependent Variable: - 32.000 .842 29.429 34.571 35.000 .842 32.429 37.571 36.000 .842 33.429 38.571 38.500 .842 35.929 41.071 33.500 .842 30.929 36.071 36.500 .842 33.929 39.071 38.000 .842 35.429 40.571 39.500 .842 36.929 42.071 36.000 .842 33.429 38.571 37.500 .842 34.929 40.071 39.500 .842 36.929 42.071 43.000 .842 40.429 45.571 1.00 2.00 3.00 4.00 1.00 2.00 3.00 4.00 1.00 2.00 3.00 4.00 1.00 2.00 3.00 Mean Std. Error Lower Bound Upper Bound 99% Confidence Interval Multiple Comparisons Dependent Variable: - -2.5000 1.00277 .192 -6.9835 1.9835 -4.0000 1.09036 .027 -8.6848 .6848 -6.5000* 1.29314 .003 -12.0569 -.9431 2.5000 1.00277 .192 -1.9835 6.9835 -1.5000 .89753 .558 -5.3870 2.3870 -4.0000 1.13529 .047 -9.2964 1.2964 4.0000 1.09036 .027 -.6848 8.6848 1.5000 .89753 .558 -2.3870 5.3870 -2.5000 1.21335 .350 -7.8557 2.8557 6.5000* 1.29314 .003 .9431 12.0569 4.0000 1.13529 .047 -1.2964 9.2964 2.5000 1.21335 .350 -2.8557 7.8557 -2.5000 1.00277 .166 -6.9117 1.9117 -4.0000 1.09036 .024 -8.6250 .6250 -6.5000* 1.29314 .003 -11.9858 -1.0142 2.5000 1.00277 .166 -1.9117 6.9117 -1.5000 .89753 .498 -5.3349 2.3349 -4.0000 1.13529 .041 -9.1912 1.1912 4.0000 1.09036 .024 -.6250 8.6250 1.5000 .89753 .498 -2.3349 5.3349 -2.5000 1.21335 .305 -7.7757 2.7757 6.5000* 1.29314 .003 1.0142 11.9858 4.0000 1.13529 .041 -1.1912 9.1912 2.5000 1.21335 .305 -2.7757 7.7757 (J) 2.00 3.00 4.00 1.00 3.00 4.00 1.00 2.00 4.00 1.00 2.00 3.00 2.00 3.00 4.00 1.00 3.00 4.00 1.00 2.00 4.00 1.00 2.00 3.00 (I) 1.00 2.00 3.00 4.00 1.00 2.00 3.00 4.00 Tamhane Dunnett T3 MeanDifference (I-J) Std. Error Sig. Lower Bound Upper Bound 99% Confidence Interval Based on observed means. The mean difference is significant at the .01 level.*. 结论:促凝剂1和氧化锌1的95% 区间与促凝剂1和氧化锌4的95% 区间无重叠;促凝剂2和氧化锌1的95% 区间与促凝剂2和氧化锌4 的95%区间无重叠;促凝剂 3和氧化锌1的95%区间与促凝剂3和 氧化锌4的95%区间无重叠;促凝剂3和氧化锌2的95%区间与促 凝剂3和氧化锌4 的95%区间无重叠;故11与14之间有显著性 差异,12与 24 之间有显著性差异, 34与13、23间有显 著性差异。即促凝剂1与氧化锌的组合取14(估计值38.5);促 凝剂2与氧化锌的组合取24 (估计值39.5);促凝剂3与氧化锌 的组合取34(估计值43.0)。又由均值大小可得最佳组合为促 凝剂3与氧化锌4 的组合。 第六题、判别分析(连续型) 一,问题:为了研究中小企业的破产模型,选定 4 个经 济指标:X1 总负债率(现金收益 /总负债) ,X2 收益性 指标(纯收入/总财产) ,X3 短期支付能力(流动资产/ 流动负债) ,X4 生产效率性指标(流动资产/纯销售额) 对 21 个破产企业( 1 类)和 25 个正常运行企业(2 类) 进行了数据收集,得到数据如下,请对破产企业和非破 产企业进行判别分析。另外还有 1 个待判的企业,请将 它合理分类。 分类 X1 总负债率 X2 收益性指标 X3 短期支付能力 X4 生产效率性指标 1 -0.45 -0.41 1.09 0.45 1 10.56 -0.31 1.51 0.16 1 0.06 0.02 1.01 0.4 1 0.07 -0.09 1.45 0.26 1 -0.1 -0.09 1.56 0.67 1 -0.14 -0.07 0.71 0.28 1 0.04 0.01 1.5 0.71 1 -0.07 -0.06 1.37 0.4 1 0.07 -0.01 1.37 0.34 1 -0.14 -0.14 1.43 0.43 1 -0.23 -0.3 0.33 0.18 1 0.07 0.02 1.31 0.25 1 0.01 0 2.15 0.7 1 -0.28 -0.23 1.19 0.66 1 0.15 0.05 1.88 0.27 1 0.37 0.11 1.99 0.38 1 -0.08 -0.08 1.51 0.42 1 0.05 0.03 1.68 0.95 1 0.01 0 1.26 0.6 1 0.12 0.11 1.14 0.17 1 -0.28 -0.27 1.27 0.51 2 0.51 0.1 2.49 0.54 2 0.08 0.02 2.01 0.53 2 0.38 0.11 3.27 0.35 2 0.19 0.05 2.25 0.33 2 0.32 0.07 4.24 0.63 2 0.31 0.05 4.45 0.69 2 0.12 0.05 2.52 0.69 2 -0.02 0.02 2.05 0.35 2 0.22 0.08 2.35 0.4 2 0.17 0.07 1.8 0.52 2 0.15 0.05 2.17 0.55 2 -0.1 -0.01 2.5 0.58 2 0.14 -0.03 0.46 0.26 2 0.14 0.07 2.61 0.52 2 0.15 0.06 2.23 0.56 2 0.16 0.05 2.31 0.2 2 0.29 0.06 1.84 0.38 2 0.54 0.11 2.33 0.48 2 -0.33 -0.09 3.01 0.47 2 0.48 0.09 1.24 0.18 2 0.56 0.11 4.29 0.44 2 0.2 0.08 1.99 0.3 2 0.47 0.14 2.92 0.45 2 0.17 0.04 2.45 0.14 2 0.58 0.04 5.06 0.13 ? 0.07 -0.01 1.37 0.34 二、数据: 三、统计处理:该实际问题涉及 2 个类别和 4 个连续型 判别变量。其中两个类别为:破产企业(1 类)和 25 个 正常运行企业(2 类) ;4 个连续型判别变量为:X1 总 负债率(现金收益/总负债) ,X2 收益性指标(纯收入/ 总财产) ,X3 短期支付能力(流动资产/流动负债) ,X4 生产效率性指标(流动资产/纯销售额) 。根据数据和处 理目的,采用连续型判别分析法,求出 Fisher 线性判别 函数,再对待判定企业进行分类。 四、结果和分析 表 1 Group Statistics .4671 2.31948 21 21.000 -.0814 .14492 21 21.000 1.3671 .40542 21 21.000 .4376 .21114 21 21.000 .2352 .21691 25 25.000 .0556 .04874 25 25.000 2.5936 1.02312 25 25.000 .4268 .16242 25 25.000 .3411 1.55880 46 46.000 -.0070 .12395 46 46.000 2.0337 1.00639 46 46.000 .4317 .18415 46 46.000 x1 x2 x3 x4 x1 x2 x3 x4 x1 x2 x3 x4 group 1.00 2.00 Total Mean Std. Deviation Unweighted Weighted Valid N (listwise) 分析:从表 1 中,描述的是:平均值、标准差、样本容量。 表 2 Tests of Equality of Group Means .994 .248 1 44 .621 .690 19.765 1 44 .000 .623 26.588 1 44 .000 .999 .039 1 44 .845 x1 x2 x3 x4 Wilks Lambda F df1 df2 Sig. 分析:表 2 是各变量的区分能力。 表 3 Pooled Within-Groups Matricesa 2.471 -.040 .093 -.072 -.040 .011 .016 .002 .093 .016 .646 .033 -.072 .002 .033 .035 1.000 -.246 .074 -.248 -.246 1.000 .197 .086 .074 .197 1.000 .219 -.248 .086 .219 1.000 x1 x2 x3 x4 x1 x2 x3 x4 Covariance Correlation x1 x2 x3 x4 The covariance matrix has 44 degrees of freedom.a. 表 4 Test Results 160.213 14.420 10 8603.929 .000 Boxs M Approx. df1 df2 Sig. F Tests null hypothesis of equal population covariance matrices. 分析:表 3 和表 4 是各分类间协方差齐性的检验,由结果可知, 方差不齐,但是这对 Fisher 判别影响不大,仍然可以在方差不齐 的情况下使用判别分析。 表 5 Eigenvalues .938 a 100.0 100.0 .696 Function 1 Eigenvalue % of Variance Cumulative % Canonical Correlation First 1 canonical discriminant functions were used in the analysis. a. 表 6 Wilks Lambda .516 27.780 4 .000 Test of Function(s) 1 Wilks Lambda Chi-squa

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论