版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二章定量数据的统计描述第1页,共50页。2.354.213.325.354.174.132.784.263.584.344.844.414.783.953.92 3.583.664.283.263.502.704.614.752.913.914.594.19 2.684.524.913.183.684.833.873.953.914.154.554.80 3.414.123.955.084.533.923.585.353.843.603.514.06 3.073.554.233.574.833.523.844.503.964.503.274.52 3.194.593.753.984.134.263.633.875.713.304.734.17 5.133.784.573.803.933.783.994.484.284.065.265.25 3.985.033.513.863.023.704.333.293.254.154.364.95 3.003.26试编制频数分布表。第2页,共50页。1、频数表的编制找全距(range)定组距(classinterval):
一般分为10~15组,如组距约为全距/10写组段:每个组段的起点称为下限,lowerlimit;每个组段的终点称为上限,upperlimit;下限≤X<上限第3页,共50页。频数表的编制--续1.计算极差:极大值-极小值5.71-2.35=3.362.组数:10
组距3.36/10=0.336
取0.33.分组段:最小组段2.3~最大组段5.6~5.94.列表划记:101名正常成年女子的血清总胆固醇频数分布胆固醇组段频数2.30~12.60~32.90~63.20~83.50~173.80~204.10~174.40~124.70~95.00~55.30~5.60~5.9021第4页,共50页。二、频数分布图(graphoffrequencydistribution)以各组段总胆固醇含量为横轴,频数为纵轴。第5页,共50页。SPSS中的操作:1.建立数据库2.使用Frequencies
命令3.先使用Recode命令,再用Frequencies命令第6页,共50页。频数分布的类型对称分布:集中位置居中,左右两边对称偏态分布:正偏态分布(右偏态)峰左尾右负偏态分布(左偏态)正偏态分布对称分布负偏态分布第7页,共50页。三、频数表和频数分布图的用途揭示变量的分布特征和分布类型;便于进一步计算指标和统计分析处理;便于发现某些特大或特小的可疑值。第8页,共50页。频数分布的两个特征集中趋势,centraltendency指变量值的中心数值或中心位置所在。离散趋势,tendencyofdispersion指变量值围绕中心数值或中心位置的分布情况。第9页,共50页。第二节集中趋势的描述平均数(average):用于观察一组同质变量值的平均水平/集中位置。亦称中心位置指标。它不但给人一个简明概括的印象,而且便于事物间的分析比较。常用的平均数算术均数(arithmeticmean/mean)几何均数(geometricmean)中位数(median)第10页,共50页。一、算术均数,简称均数
(arithmeticmean/mean)均数是算术均数的简称。总体均数用希腊字母μ(缪,mu)表示样本均数(Xbar)表示。均数反映一组观察值在数量上的平均水平。第11页,共50页。均数的应用主要用于对称性或近似对称性分布的资料;尤其是在正态分布或近似正态分布上的应用。第12页,共50页。计算方法1.直接法Σ:希腊字母(西格马,sigma),求和符号例9.2有8名正常人的空腹血糖值(mmol/L):
6.2,5.4,5.7,5.3,6.1,6.0,5.8,5.9
第13页,共50页。2.频数表法(加权法)组段频数f组中值XfXfX22.30~12.452.456.002.60~32.758.2522.692.90~63.0518.3055.823.20~83.3526.8089.783.50~173.6562.05226.483.80~203.9579.00312.054.10~174.2572.25307.064.40~124.5554.60248.434.70~94.8543.65211.705.00~55.1525.75132.615.30~25.4510.9059.415.60~5.9015.755.7533.06合计101——409.751705.09第14页,共50页。频数表计算均数:Xj为各组的组中值。组中值等于该组的上限加下限之和除以2。
fj为各组的频数。101名正常成年女子的血清总胆固醇均值为:
=409.75/101=4.06(mmol/L
)第15页,共50页。补充:均数的两个重要特征(1)离均差之和为零第16页,共50页。均数的两个重要特征(2)离均差平方和为最小第17页,共50页。(二)几何均数Geometricmean,G反映一组呈倍数关系的观察值的平均水平适用:数据呈正偏态分布,经对数转换后呈正态分布。多用于观察值之间呈倍数关系,如抗体滴度计算方法直接法加权法第18页,共50页。1.直接法第19页,共50页。例:有8份血清的抗体效价为为1:5,1:10,1:20,1:40,1:80,1:160,1:320,1:640。求平均效价。用直接法计算G将各效价的倒数代入公式,得该8份血清的平均抗体效价为1:56.57,近似为1:57注意:变量值不能有0第20页,共50页。2.频数表法式中f为频数。第21页,共50页。用频数表法计算G例30名麻疹易感儿童接种麻疹疫苗一个月后,血凝抑制抗体滴度如下表所示,试求其平均抗体滴度。第22页,共50页。30名麻疹易感儿童血凝抑制抗体滴度抗体滴度人数f滴度倒数XlgXflgX1:8280.90311.80621:166161.20417.22461:325321.50517.52551:6410641.806118.06201:12841282.10728.42881:25622562.40824.81641:51215122.70932.7093合计30∑flgX=50.58第23页,共50页。30名麻疹易感儿童接种麻疹疫苗一个月后血凝抑制抗体滴度为1:48.5同一组资料求得的几何均数小于均数。第24页,共50页。(三)中位数Median,M将一组观察值从小到大按顺序排列,位次居中的观察值,即为中位数。一半的值比M小,一半的值比M大。例:1,3,5,7,18(奇数)
1,3,5,7,18,20(偶数)计算n为奇数时n为偶数时第25页,共50页。M计算方法例:9人某病潜伏期(天)分别为3,4,4,5,6,7,7,19,19,求中位数。例:6名新生儿身长(cm)分别为50.1,52.0,53.0,55.0,55.0,56.0,求中位数。第26页,共50页。中位数的应用中位数可用于任何分布的定量资料;资料的分布呈明显偏态,特别是负偏态;分布的一端或两端无确定的数值;
(如:>50,或<10)资料的分布不清。注意:在完全对称的单峰曲线分布中,同一组资料的均数与中位数相同,Mean=Median第27页,共50页。中位数的优缺点优点:不受个别特大或特小的观察值影响;其它平均数不宜使用时,中位数就显示出它的优越性。缺点:掉失了大量信息,其敏感性不够。第28页,共50页。百分位数(Percentile,Px)百分位数位置指标;界值;分布数列的百等份分割值。有x%的比Px小,有(100-x)%的比Px大。中位数是一个特定的百分位数P50。第29页,共50页。百分位数的计算fX为PX所在组段的频数,
i为该组段的组距,
L为该组段的下限,
fL为小于L各组段的累计频数。第30页,共50页。某传染性疾病的潜伏期(天)如下表,求其
中位数和百分位数P95潜伏期
(天)人数f累计频数∑f累计频率%4~262624.048~487468.5212~259991.6716~610597.2220~3108100.00第31页,共50页。百分位数的应用描述一组观察值在某百分位置上的水平。用于确定医学正常值范围。用一组百分位数描述一组观察值的变异度,如四分位数。第32页,共50页。应用平均数时的注意事项同质的变量值才能求平均数;根据资料的分布特点,选用适应的平均数指标。第33页,共50页。平均水平SPSS统计描述命令AnalyzeDescriptiveStatisticsFrequenciesDescriptives注意:频数表资料要用weight命令第34页,共50页。使用频数表资料时SPSS操作中应注意的事项频数表资料要用weight命令;进行数据输入时要使用组中值;并且在Frequencies命令中要选择
Valuesaregroupmidpoints:根据分组资料计算百分位数。
第35页,共50页。SPSS操作求几何均数时有三种方法:
1.是先计算对数的均数,然后求其反对数,得出几何均数;2.直接用ReportCaseSummaries命令;3.用CompareMeans命令,但要个增加分组变量。第36页,共50页。第三节变异程度的统计指标例有3组同龄男孩体重(kg)如下,其体重均数都是30(kg),试分析离散程度。甲组2628303234乙组2427303336丙组2629303134第37页,共50页。离散程度(或变异程度)指数据参差不齐的程度,反映资料的离散趋势。将反映平均水平与离散程度的指标结合起来使用,可全面地描述数据的分布规律。第38页,共50页。一、全距(或极差,Range)全距=最大值–最小值优点:简单明了缺点:不能反映组内其他数据的变异,样本含量相差较大时,不宜用极差比较分布的离散程度。第39页,共50页。二、四分位数间距(inter-quartilerange)百分位数:指把数据从小到大排列后处于第X百分位置的数值。它将全部数据分为两部分,在不包括PX的全部数据中有X%数据小于PX,有1-X%的数据大于PX%。中位数是一个特定的百分位数P50。四分位数:下四分位数P25;上四分位数P75P0——P25——P50——P75——P100
四分位数间距:P75-P25
或QU-QL
比极差稳定,但仍未考虑每个数据的大小。常和中位数结合使用描述数据的分布规律。第40页,共50页。三、离均差平方和(sunofsquare)、方差(variance)和标准差(standarddeviation)平均偏差(meandifference):离均差平方和(sunofsquare,SS)第41页,共50页。方差和标准差离均差平方和:考虑每个观察值,但受N的影响。对离均差平方和求均数,得总体方差
2
,开根号得标准差
。第42页,共50页。一般未知,常常用来估计之,数理统计证明,如用样本的变量个数n来代替N,计算出的样本方差比实际
2低,需要用n-1校正,得样本方差S2。开根号得样本标准差s。
第43页,共50页。自由度,degreeoffreedom方差计算公式中的n-1被称为自由度,它描述了当选定时,n个X中能自由变动的X(变量值)的个数。例:某样本含有3个数据,要求∑X=10。则在自由确定了2个数据后,第3个数据只能是10-(x1+x2)。即有2个数据可以自由变动,其自由度=2。推而广之,任何统计量的自由度
=n-k,k为限制条件的个数。自由度:是随机变量可以“自由”取值的个数。第44页,共50页。总体标准差样本标准差标准差standarddeviation应用于频数表资料:第45页,共50页。标准差的计算甲组26
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 苏州工学院《教育学原理》2025-2026学年期末试卷
- 促销管理专业知识与实践技能试题及答案
- C6-Biotin-phytoceramide-t18-0-6-0-Biotin-ceramide-t18-0-6-0-生命科学试剂-MCE
- BTTAA-Standard-生命科学试剂-MCE
- 高空作业机械维修工岗前实操知识水平考核试卷含答案
- 海水珍珠养殖工操作评估知识考核试卷含答案
- 压延玻璃成型工岗前复测考核试卷含答案
- 竹藤师班组评比能力考核试卷含答案
- 纺粘熔喷热轧非织造布制作工岗前管理应用考核试卷含答案
- 化学清洗工岗前技术规范考核试卷含答案
- 政治●湖北卷丨2024年湖北省普通高中学业水平选择性考试政治试卷及答案
- 语文●浙江卷丨2021年普通高等学校招生全国统一考试语文试卷及答案
- (高清版)DB2105∕T 016-2024 林下朝鲜淫羊藿种植技术规程
- 国家开放大学国开电大《理工英语1》综合测试标准答案
- 用电缴费合同协议
- 妇科输卵管结扎术操作规范
- 环卫工作培训
- 供应商ROHS环保协议
- 2025年宁波卫生职业技术学院高职单招职业技能测试近5年常考版参考题库含答案解析
- 2025年汽车修理厂安全生产工作计划
- 酒水广告合同模板
评论
0/150
提交评论