




已阅读5页,还剩86页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1,第二章个体变异与变量分布IndividualVariationandVariableDistribution,易洪刚,DepartmentofEpidemiology2.一组数据的均衡点所在;3.易受极端值的影响。对于偏态资料,均数不能较好地反映其集中趋势。,(一)集中趋势的描述(average),37,张村有个张千万,隔壁九个穷光蛋平均起来算一算,人人都是张百万这说明了什么?,(一)集中趋势的描述(average),38,几何均数(geometricmean),加权法:,直接法:,(一)集中趋势的描述(average),39,1:10,1:20,1:40,1:80,1:160,(一)集中趋势的描述(average),40,几何均数的应用:,1.等比资料,如抗体平均滴度,2.对数正态分布资料,(一)集中趋势的描述(average),41,使用几何均数时的注意点:,1)观察值不能有0。,2)观察值不能同时有正值和负值。若全为负值,在计算时先把负号去掉,得出结果再加上负号。,(一)集中趋势的描述(average),42,中位数(median)将一组数据按从小到大的顺序排列,位置居中的数即是中位数。反映一组观察值在位次上的平均水平。,(一)集中趋势的描述(average),M,43,中位数例,9例正常人的发汞值:1.1,1.83.54.24.85.65.97.110.5M=4.8,9例正常人的发汞值:1.1,1.83.54.24.85.65.97.116M=4.8,10例正常人的发汞值:1.1,1.83.54.24.85.65.97.110.516M=(4.8+5.6)/2=5.2,中位数应用:1.不易受极端值的影响;2.可用于任何分布的资料。常用于:大样本偏态分布资料;有不确定值资料;资料分布不明等;3.中位数和均数在对称分布上理论上是相同的。,44,(一)集中趋势的描述(average),45,百分位数(percentile)X%PX(100-X)%50%分位数就是中位数25%,75%分位数称四分位数(quartile),(一)集中趋势的描述(average),46,集中趋势的描述指标小结,(一)集中趋势的描述(average),47,只用平均数描述资料的弊病,Ithasbeensaidthatafellowwithonelegfrozeniniceandtheotherleginboilingwateriscomfortable.ONAVERAGE!,48,主要内容,个体变异(IndividualVariation)频数分布(FrequencyDistribution)定量资料的统计指标(StatisticsofData)集中趋势的描述离散程度的描述正确应用总结(Summary),49,例如,设有三组同年龄、同性别儿童体重(kg)数据如下:甲组2628303234乙组2427303336丙组2629303134,(二)离散程度的描述,50,(二)离散程度的描述,51,极差(range)四分位数间距(inter-quartilerange)方差(variance)标准差(standarddeviation)变异系数(coefficientofvariation),(二)离散程度的描述,52,极差(range),极差(全距),用字母R表示,描述数据分布的范围。极差大,说明数据分布较分散。,(二)离散程度的描述,53,特点,方法简单明了;不灵敏,除了最大最小值外,不能反映组内其他数据的变异;不稳定,样本较大时抽到较大值与较小值的可能性也较大,因而样本极差也较大,故样本含量相差较大时,不宜用极差来比较分布的离散度。,54,如上述三组数据中:甲组数据的极差R=34-26=8乙组数据的极差R=36-24=12丙组数据的极差R=34-26=8甲组、丙组数据分布较乙组集中。甲组与丙组的离散程度相同?,55,四分位数间距(inter-quartilerange),(1)四分位数(quartile,Q),下四分位数即第25百分位数,常用QL表示;上四分位数即第75百分位数,常用QU表示。(2)四分位数间距指上、下四分位数的间距,既QL与QU间的差距,它是从小到大排列后中间一半数据所在的范围。,(二)离散程度的描述,56,(三)方差与标准差,57,(三)方差与标准差,58,(三)方差与标准差,59,(三)方差与标准差,60,标准差的计算直接法,总体标准差:,样本标准差:,(三)方差与标准差,61,加权法,xi是各组段的组中值,fi是相应的频数,(三)方差与标准差,62,甲组:2628303234乙组:2427303336丙组:2629303134极差方差标准差甲组:810.03.16乙组:1222.54.74丙组:88.52.92,(三)方差与标准差,63,(四)变异系数,变异系数(coefficientofvariation,CV),64,由于度量单位不同,故不能直接比较两者的标准差,而应比较变异系数:身高体重由此可见,该地20岁男子体重的变异度大于身高的变异度。,例题,某地20岁男子100人,身高均数为166.06cm,标准差为4.98cm;体重均数为53.7kg,标准差为4.96kg,试比较身高和体重的变异何者为大。,65,(二)离散程度的描述,离散程度的描述指标小结,66,66,主要内容,个体变异(IndividualVariation)频数分布(FrequencyDistribution)定量资料的统计指标(StatisticsofData)总结(Summary),67,总结(1),不同质的资料应考虑分别计算平均数。各个指标都有其适用范围;中位数和百分位数在样本含量较少时不稳定,越靠两端越不稳定;中位数在抗极端值的影响方面,比均数具有较好的稳定性,但不如均数精确。因此,当资料适合计算均数或几何均数时,不宜用中位数表示其平均水平。,68,标准差的基本内容是离均差,它显示一组变量值与其均数的间距,故标准差直接地、总结地、平均地描述了变量值的离散程度。在同质的前提下,标准差大表示变量值的离散程度大,即变量值的分布分散、不整齐、波动较大;反之,标准差小表示变量值的离散程度小,即变量值的分布集中、整齐、波动较小。变异系数派生于标准差,其应用价值在于排除了平均水平的影响,并消除了单位。,总结(2),69,均数标准差(min,max)中位数四分位数间距(min,max)变异度小,则均数代表性好!变异度大,数据分散,则均数代表性差!平均数所表示的集中性与变异度所表示的离散性,从两个不同的角度阐明计量资料的特征!,总结(3),平均数与变异度,70,每个观察指标均有其特定的变异规律;描述变异:图形描述统计量描述平均数:均数、几何均数、中位数变异度:标准差(方差)、四分位数间距、变异系数、极差不同分布的指标,用不同的统计量描述;用平均数与变异度共同描述。,总结,71,AirQualityandDiabetesPrevalenceinUnitedStates2002-2006:aTimeSeriesCross-sectionAnalysis.,HonggangYi1,2,WeiYang11NevadaCenterforHealthStatisticsandInformatics,SchoolofCommunityHealthSciences,UniversityofNevada,Reno,NV,USA.2DepartmentofEpidemiologyandBiostatistics,SchoolofPublicHealth,NanjingMedicalUniversity,Nanjing,Jiangsu,P.R.China,Objective:Tostudytheassociationbetweendiabetesmellitusingeneralpopulationandannualmeanlevelsofparticulatematter(PM2.5)airqualityindex(AQI).,72,TherelationshipbetweenPM2.5andDMintheUnitedStated,2002-2006,Methods:Thispaperpresentsaseriesofanalysisoftime-seriescross-sectionaldatafrom56metropolitanareasoftheU.Scoveringdifferentperiodsbetween2002and2006.,Results:AstatisticalassociationwasfoundbetweentheweightedprevalenceofdiabetesmellitusbytheannualmeanofPM2.5AQIvalue(P0.05).,Conclusions:OurstudysuggestedthatexposuretorelativelyhigherlevelsofaverageannualPM25AQImayincreasethelikelihoodofdiabetesmellitus.,1979,1980,1981,1982,Cross-sectional1,Cross-sectional2,Cross-sectional3,Cross-sectional4,TimeSeries,CopyrightReservedHonggangYi,74,75,76,77,DataStructure:,TherelationshipbetweenPM2.5andDMintheUnitedStated,2002-2006,1.2StatisticalDescriptionofData1.2.1Summarystatisticsforkeystudyvariables.1.2.2Summarydescriptionsfordependentvariable.1.2.3Summarydescriptionsforindependentvariables.1.2.4Summarydescriptionsforsocioeconomic,demographicvariables.,78,TherelationshipbetweenPM2.5andDMintheUnitedStated,2002-2006,TherelationshipbetweenPM2.5andDMintheUnitedStated,2002-2006,1.2.1Summarystatisticsforkeystudyvariables.,80,(1)ThefrequencydistributionofdependentvariableisshowedinFigure1;ThePvalueofSkewness/KurtosistestsforNormalityis0.0015.,1.2.2Summarydescriptionsfordependentvariable.,(2)ThetrendofdependentvariablegraphedbyMSACodeisshowedinFigure2.,81,1.2.2Summarydescriptionsfordependentvariable.,82,(3)ThetrendofdependentvariableanditspredictedlinertrendareshowedinFigure4.,1.2.2Summarydescriptionsfordependentvariable.,83,1.2.3Summarydescriptionsforindependentvariables.,(1)ThefrequencydistributionPM2.5isshowedinFigure5;ThePvalueofSkewness/KurtosistestsforNormalityis0.1542.,84,1.2.3Summarydescriptionsforindependentvariables.,(2)ThetrendofAQIofPM2.5graphedbyMSACodeisshowedinFigure6.,85,(3)ThetrendofAQIofPM2.5anditspredictedtrendareshowedinFigure8.,1.2.3Summarydescriptionsforindependentvariables.,86,1.2.4Summarydescriptionsforsocioeconomic,demographicvariables.,(1)ThetrendofHighPercapitalIncome(proportionofpopulation,%),87,1.2.4Summarydescriptionsforsocioeconomic,demographicvariables.,(2)ThetrendofHispanicpopulation(proportionofpopulation,%),88,1.2.4Summarydescriptionsforsocioeconomic,demographicvar
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 【正版授权】 ISO 17831-2:2025 EN Solid biofuels - Determination of mechanical durability of pellets and briquettes - Part 2: Briquettes
- 【正版授权】 ISO 15237:2025 EN Coal - Determination of total mercury
- 【正版授权】 IEC 62608-1:2025 RLV EN Multimedia home network configuration - Basic reference model - Part 1: System model
- 【正版授权】 ISO 13909-4:2025 EN Coal and coke - Mechanical sampling - Part 4: Preparation of test samples of coal
- 校园应急知识培训课件作文
- 债务规划面试题及答案
- 教师业务考试题及答案
- 云南b类面试题及答案
- 砌砖工程试题及答案
- 幼儿英语考试试题及答案
- 2025年事业单位工勤技能-河南-河南农机驾驶维修工一级(高级技师)历年参考题库含答案解析(5套)
- 2025年幼儿园教师岗位聘任协议(含资格认证及薪酬激励)
- 成都东部集团有限公司招聘考试真题2024
- 银行收息管理办法
- 海外房产投资项目方案(3篇)
- 消防员心理健康课件
- 2024年中级注册安全工程师《安全生产技术基础》考试真题及答案
- JJG 597-2025交流电能表检定装置检定规程
- DBJT 13-318-2025建筑施工盘扣式钢管脚手架安全技术标准
- 2025年中国儿童学习机市场竞争格局及投资战略规划报告
- 厨师专业论文
评论
0/150
提交评论