




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第2章单变量描述统计分析第1节统计分组单项式分组组距式分组统计分组按数量标志分组等距、不等距重合、不重合按品质标志分组一、分布(distribution)变量各种可能取值及其出现的次数或频次,又称频次分布。频数、频次、次数(frequency)二、统计表表2.5家庭结构的频次分布家庭结构频次百分比(%)核心家庭105049.30直系家庭72033.80联合家庭1105.16其他25011.74总数2130100.00多选项二分法
abcde样本1√√√×√样本2××√√√样本3√××√√样本4√√××√样本5√√××√多选项二分法
abcde样本111101样本200111样本310011样本411001样本511001合计43225多选项分类法P26例2P27例33、加权平均法P28例4(二)定序变量
表2-7单位对武打片的反映统计喜爱程度频次百分比(%)很反感37.69不爱看1025.64一般1025.64爱看923.08非常爱看717.95总数39100.00(三)定距变量统计分组的步骤(等距、重合、组距式分组)第一:确定组数。经验公式
k=1+lgn/lg2k=1+lg100/lg2=7.64第二:确定组距。组距
=(最大值-最小值)/组数=(1.56-1.27)/10=0.029原则:以5或10的倍数作为组距。本例选择:0.03第三:确定组限。要求:第一组下限要小于所有数据的最小值,最后一组上限要大于所有数据的最大值原则:以5或10的倍数作为组限。(三)定距变量统计分组的步骤(等距、重合、组距式分组)第四:计数。以0.03作为组距的分组情况。1.265-1.295;1.295-1.325,……1.255-1.285;1.285-1.315,……1.245-1.275;1.275-1.305,……(三)定距变量身高组中值人数频率向上累计向下累计人数频率人数频率1.265~1.2951.2811111001001.295~1.3251.31445599991.325~1.3551.3477121295951.355~1.3851.372222343488881.385~1.4151.402424585866661.415~1.4451.432424828242421.445~1.4751.461010929218181.475~1.5051.49669898881.505~1.5351.52119999221.535~1.5651.551110010011合计—100100————表2.11100名儿童身高统计分组表向上累计:由低到高,上限以下向下累计:由高到低,下限以上思考:360体您本次开机共用时1分10秒,击败了全国12%的电脑……关于统计分组的个人认识原则:统计分组没有对错,只有好坏。开口组实际中应用更广。极端值,extremevalue判断依据:发生概率非常小,后果很严重911事件2004印度洋海啸飞机失事、英法核潜艇相撞、美、俄卫星相撞,股灾,亚洲金融危机图2.1家庭结构分布图饼图(Pie)条形图bar
按年龄和分人口数(2012年,0.83%人口抽样调查)100名儿童身高向上累计直方图
100名儿童身高向下累计直方图父亲身高(800名)母亲身高(800名)父亲体重(800名)母亲体重(800名)分年龄别的死亡率三次产业构成比数据描述的数值方法数据描述的数值方法分布的形状集中趋势离散程度众数中位数均值离散系数方差和标准差峰度四分位距极差偏态第2节第3节一、众数(Mode)概念:出现次数最多的标志值计算(一)定类数据表2.5P24第二节:集中趋势的测量表2.5家庭结构的频次分布家庭结构频次百分比(%)核心家庭105049.30直系家庭72033.80联合家庭1105.16其他25011.74总数2130100.00Mo=“核心家庭”(二)定序表2.7P29
表2-7单位对武打片的反映统计喜爱程度频次百分比很反感37.69不爱看1025.64一般1025.64爱看923.08非常爱看717.95总数39100.00Mo=“不爱看”Mo=“一般”(三)定距1.未分组资料表2.102.单项式表2.143.组距式表2.11Mo=1.38,1.39,1.40,1.41,1.42,1.43,1.44Mo=1,2Mo=1.40,1.43二、中位数Median(一)定序表2.7①找中位数组:向上累计次数首次超过N/2的组即为中位数组;②该组的标志值即为中位数值Me=“一般”(二)定距1.未分组资料表2.10方法:中位数位置=(N+1)/2概念解释:次序统计量
(orderstatistics)x1x2x3x4x59.229.659.209.259.309.209.229.259.309.65表2.102.分组资料(1)单项式分组表2.18①向上累计次数首次超过N/2的组即为中位数组;②该组的标志值即为中位数Me=“乙”(三)组距式分组①首先确定中位数组;②使用公式下限公式:上限公式:公式中各字母含义U:中位数组的上限;
L:中位数组的下限;fm:中位数组的频数;Sm-1:向上累计时中位数组前一组的累计频数,即中位数前一组所对应的向上累计频数;Sm+1:向下累计时中位数组后一组的累计频数即中位数后一组所对应的向下累计频数;i:中位数组的组距。∑f2x向上累计Sm-1SmLUMeAb中位数组前一组中位数组BCaED下限公式Me=L+a上限公式Me=U-b下限公式推导身高组中值人数频率向上累计人数频率1.265~1.2951.2811111.295~1.3251.3144551.325~1.3551.347712121.355~1.3851.37222234341.385~1.4151.40242458581.415~1.4451.43242482821.445~1.4751.46101092921.475~1.5051.496698981.505~1.5351.521199991.535~1.5651.5511100100合计—100100——表2.11100名儿童身高统计分组表∑f中位数组次数中位数组上限首次大于50%首次大于50中位数组前一组所对应向上累计次数中位数组中位数组下限L=1.385U=1.415fm=24Sm-1=34i=0.03西藏辽宁天津上海图1我国分地区人口年龄中位数(2000年)北京河南三、四分位数(quartile)概念:数据排序后处在25%,50%和75%位置上的数。25%25%25%25%Q1Q2Q3Q2=Me(一)定序表2.7①找Q1、Q2、Q3所在组Q1所在组:向上累计次数首次超过Σf/4的组;
Q2所在组:向上累计次数首次超过Σf/2的组;Q3所在组:向上累计次数首次超过3Σf/4的组;②Q1=Q1所在组标志值;Q2=Q2所在组标志值;Q3=Q3所在组标志值;喜爱程度频次百分比向上累计很反感37.693不爱看1025.6413一般1025.6423爱看923.0832非常爱看717.9539总数39100.00
>19.5>9.75Q1所在组Q1=“不爱看”Q2所在组Q2=“一般”>29.25Q3所在组Q3=“爱看”(二)定距数据1、未分组资料(spss版本)Q1位置=(n+1)/4;Q2位置=(n+1)/2;Q3位置=3(n+1)/4表2.10Q1位置=(n+1)/4=25.25;Q2位置=(n+1)/2=50.5;Q3位置=3(n+1)/4=75.75Q1=x(25)+0.25×[x(26)-x(25)]=1.37+0.25×[1.37-1.37]=1.37Q2=x(50)+0.5×[x(51)-x(50)]=1.4+0.5×[1.41-1.4]=1.405Q3=x(75)+0.75×[x(76)-x(75)]=1.44+0.75×[1.44-1.44]=1.44(二)定距数据1、未分组资料(excel版本)Q1位置=(n+3)/4;Q2位置=(n+1)/2;Q3位置=(3n+1)/4表2.10Q1位置=(n+3)/4=25.75;Q2位置=(n+1)/2=50.5;Q3位置=(3n+1)/4=75.25Q1=x(25)+0.75×[x(26)-x(25)]=1.37+0.75×[1.37-1.37]=1.37Q2=x(50)+0.5×[x(51)-x(50)]=1.4+0.5×[1.41-1.4]=1.405Q3=x(75)+0.25×[x(76)-x(75)]=1.44+0.25×[1.44-1.44]=1.44Excel操作:quartile2.分组资料(1)单项式分组①找Q1、Q2、Q3所在组Q1所在组:向上累计次数首次超过Σf/4的组;
Q2所在组:向上累计次数首次超过Σf/2的组;Q3所在组:向上累计次数首次超过3Σf/4的组;②Q1=Q1所在组标志值;Q2=Q2所在组标志值;Q3=Q3所在组标志值;(2)组距式分组②使用公式①找Q1、Q2、Q3所在组Q1所在组:向上累计次数首次超过Σf/4的组;
Q2所在组:向上累计次数首次超过Σf/2的组;Q3所在组:向上累计次数首次超过3Σf/4的组;身高组中值人数频率向上累计人数频率1.265~1.2951.2811111.295~1.3251.3144551.325~1.3551.347712121.355~1.3851.37222234341.385~1.4151.40242458581.415~1.4451.43242482821.445~1.4751.46101092921.475~1.5051.496698981.505~1.5351.521199991.535~1.5651.5511100100合计—100100——表2.11100名儿童身高统计分组表∑f首次大于50首次大于25Q3所在组首次大于75Q1所在组Q2所在组L1=1.355U1=1.385身高人数向上累计人数频率1.265~1.2951111.295~1.3254551.325~1.355712121.355~1.3852234341.385~1.4152458581.415~1.4452482821.445~1.4751092921.475~1.505698981.505~1.535199991.535~1.5651100100合计100——表2.11100名儿童身高统计分组表L1=1.355U1=1.385Sm1-1=12f1=22L2=1.385U2=1.415Sm2-1=34f2=24L3=1.415U3=1.445Sm3-1=58f3=24三、均值(一)未分组资料(简单算术平均数)(二)分组资料(加权算术平均数)三、均值(一)未分组资料(简单算术平均数)(二)分组资料(加权算术平均数)
例2.10Excel内置函数=average()例2.11Excel内置函数
sumproduct(),sum()众数、中位数和算术平均数的关系对称分布
均值=中位数=众数分配为钟形、轻微不对称的经验公式:左偏分布均值
中位数
众数<<右偏分布众数
中位数均值<<第三节:离散趋势测量法数据集中趋势的测度指标确实能反映某种事物的一般水平,在比较不同空间和时间上的情况是能消除规模大小的影响,是衡量其差距的重要指标。但只依据平均指标来评价事物的优劣远远不够。因为总体内部各单位标志值具有差异,有高低、大小、多少之别。就总体而言,平均数背后隐藏最大值与最小值之间的差距,有的差距不大,有的则非常悬殊。总体内部各单位标志值差距悬殊的平均数就掩盖着尖锐的矛盾,让人们感到不真实。所以,在反映具体问题时,除了从集中趋势角度分析外,还应把总体内部各单位标志值中最大值、最小值及其差距摆出来,要列出平均差异大小和差异的相对程度,即要对待研究现象进行离散程度的测度。一、异众比率表2.5家庭结构的频次分布家庭结构频次百分比(%)核心家庭105049.30直系家庭72033.80联合家庭1105.16其他25011.74总数2130100.00异众比率=1-1050/2130=50.70%一、异众比率(定类数据)2.全距(Range)全距也称极差,是一组数据的最大值与最
小值之差。R=最大值-最小值组距分组数据可根据最高组上限-最低组下限计算。受极端值的影响。
1.未分组资料表2.10R=1.56-1.27=0.29Excel操作最大值=max(),=large(data,1)最大值=min(),=large(data,1)2.分组资料表2.11R=1.565-1.265=0.3等于上四分位数与下四分位数之差反映了中间50%数据的离散程度,数值越小说明中间的数据越集中。不受极端值的影响。可以用于衡量中位数的代表性。
2四分位距(Inter-QuartileRange,IQR)2,2,3,4,4,4,5,5,6,6,7Q1=3,Q2=6,Q3=6方差是一组数据中各数值与其算术平均数离差平方的平均数,标准差是方差正的平方根。总体方差和样本方差的符号不同,计算公式也不一样。是反映定量数据离散程度的最常用的指标。3方差和标准差方差的计算公式总体方差样本方差未分组
数据分组数据样本方差用(n-1)去除,从数学角度看是因为它是总体方差σ2的无偏估计量。P56.表2-26(一)未分组资料Excel操作总体方差=varp(data)总体标准差=stdevp(data)样本方差=var(data)样本标准差=stdev(data)(二)分组资料表2.114离散系数(CoefficientofVariation)标准差与其相应的均值之比,表示为百分数。特点:反映了相对于均值的相对离散程度
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论