




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、整理课件计量资料的统计描述整理课件目录概概 述述1统计图表统计图表2统计指标统计指标3小小 结结4STATA命令命令5整理课件概述统计图表统计图表统计指标统计指标 频数表;频数频数表;频数/频率图频率图 集中趋势;离散趋势集中趋势;离散趋势计量资料的统计描计量资料的统计描述述整理课件统计图表o频数表n某市1995年110名7岁男童身高资料121.4121.4119.2119.2124.7124.7125125115115112.8112.8120.2120.2110.2110.2120.9120.9120.1120.1125.5125.5120.3120.3122.3122.3118.2118
2、.2116.7116.7121.7121.7116.8116.8121.6121.6120.2120.2122122121.7121.7118.8118.8121.8121.8124.5124.5121.7121.7122.7122.7116.3116.3124124119119124.5124.5121.8121.8124.9124.9130130123.5123.5128.1128.1119.7119.7126.1126.1131.3131.3123.8123.8116.7116.7122.2122.2122.8122.8128.6128.6122122132.5132.512212212
3、3.5123.5116.3116.3126.1126.1119.2119.2126.4126.4118.4118.4121121119.1119.1116.9116.9131.1131.1120.4120.4115.2115.2118118122.4122.4120.3120.3116.9116.9126.4126.4114.2114.2127.2127.2118.3118.3127.8127.8123123117.4117.4123.2123.2119.9119.9122.1122.1120.4120.4124.8124.8122.1122.1114.4114.4120.5120.51201
4、20122.8122.8116.8116.8125.8125.8120.1120.1124.8124.8122.7122.7119.4119.4128.2128.2124.1124.1127.2127.2120120122.7122.7118.3118.3127.1127.1122.5122.5116.3116.3125.1125.1124.4124.4112.3112.3121.3121.3127127113.5113.5118.8118.8127.6127.6125.2125.2121.5121.5122.5122.5129.1129.1122.6122.6134.5134.5118.31
5、18.3132.8132.8整理课件统计图表频数表的制作频数表的制作确定组数:不宜过多或过少,一般确定组数:不宜过多或过少,一般10组组确定组距:可等可不等;确定组距:可等可不等; 一般等组距一般等组距=极差极差/组数;组数; 本例组距,实际取本例组距,实际取2确定各组上下限确定各组上下限(每个组段的起点和终点每个组段的起点和终点): 第一组包含最小值第一组包含最小值 组段不能重叠组段不能重叠 每一组段都为半开半闭区间每一组段都为半开半闭区间 最后一组应为闭区间最后一组应为闭区间 离散型资料的组段通常为一个取值离散型资料的组段通常为一个取值整理课件利用Stata产生频数表o Excel文件:o
6、 直接粘贴到Stata软件中o 求最大值和最小值的命令:su xo 最小值为,取最小区组的下限为110o gen y=int(x-110)/2)*2)+110o tab yo 注意:stata命令一般都是小写英文字母x121.4125.5121.7121.8122.2126.4120.3119.9125.8118.3118.8119.2120.3118.8124.9122.8118.4116.9整理课件统计图表表2.1 110名7岁男童身高频数分布整理课件统计图表连续变量连续变量离散变量离散变量以直方顶点的纵坐标以直方顶点的纵坐标(等距分组等距分组)或直方的面积大小或直方的面积大小(不等距分组
7、不等距分组)表示频数的多少表示频数的多少以各直条的长短表示频数的多少以各直条的长短表示频数的多少频数分布图频数分布图整理课件统计图表o连续变量频数分布图等距分组:横轴表示观察变量,纵轴表示每个横轴组段的频数。Frequencyg1101121141161181201221241261281301321341360246810121416182022整理课件统计图表o连续变量频数分布图不等距分组:横轴表示观察变量取值,由于不等距分组会影响频数描述,所以纵轴表示每个横轴单位的频数/组距整理课件统计图表o频数表/图的用途 揭示资料分布类型:频数图较频数表更直观揭示资料分布类型:频数图较频数表更直观
8、描述频数分布的重要特征:集中趋势与离散趋势描述频数分布的重要特征:集中趋势与离散趋势 便于发现特大与特小的可疑值便于发现特大与特小的可疑值 便于进一步计算统计指标和做统计处理便于进一步计算统计指标和做统计处理整理课件统计指标o集中趋势描述 算术均数:简称均数n总体均数总体均数,样本均,样本均数数n当数据对称分布时,位于分布的中心,是频数分布最集中的当数据对称分布时,位于分布的中心,是频数分布最集中的位置位置 直接法: 加权法: (一般适合频数表资料)XXnifXXf整理课件统计指标o集中趋势描述 几何均数Gn适用于经对数转换后呈对称分布的数据,如医学上的滴适用于经对数转换后呈对称分布的数据,如
9、医学上的滴 n (一般适合频数表资料)12.nnGX XXlglg()fXGf整理课件统计指标o集中趋势描述 中位数n将一组观察值从小到大排列位置居中的数将一组观察值从小到大排列位置居中的数n适用于适用于 任何分布的定量数据 不完全资料(开口资料):没有确切最大值或最小值的资料当n为偶数时当n为奇数时 1221()2nnMXX12nMX整理课件统计指标o集中趋势描述n中位数计算中位数计算n 离散型变量:直接法n 连续型变量:借助频数分布表o 以组中值代替公式中的Xo 计算公式o LM中位数所在组下限;iM中位数所在组的组距;fM中位数所在组的频数; 中位数所在组前一组的累积频数()2MMLMi
10、nMLffLf整理课件统计指标o离散程度的描述 极差n极差极差(range):最大值:最大值-最小值最小值 优点:简单明了:简单明了 缺点:不能反映其它数据的变异:不能反映其它数据的变异 样本量较大时极差也较大样本量较大时极差也较大 不宜比较不宜比较整理课件统计指标o离散程度的描述 四分位间距n百分位数百分位数(percentile):位置指标:位置指标n第x百分位数Px:将所有数据从小到大排列后,处于第x百分位置的数值。中位数记为 P50。n连续型变量连续型变量( %) ( %)n xn x( %) ( %)n xn x ( %) ( %) 11()2xn xn xPXX ( %) 1n x
11、PxX ( %)n x为乘积取整部分(%)xXXLxiPLnXff整理课件统计指标o 离散程度的描述 四分位间距n上下四分位数上下四分位数(QU(QU、QL)QL):第:第2525百分位数和第百分位数和第7575百分位数百分位数n四分位间距四分位间距P75-P25P75-P25:n上下四分位数之间的距离,包括了一半的数据,越大表明离散程度越高 n描述了50%数据的分布宽度n比极差稳定 n四分位数范围四分位数范围P25P75P25P75(inter-quartile rangeinter-quartile range)n描述了50%数据分布的宽度n反映分布的位置特征整理课件统计指标o离散程度的描
12、述 方差n方差方差variance :适用于对称分布的资料:适用于对称分布的资料n总体方差 n样本方差n离均差平方和:描述每个数据离均差平方和:描述每个数据X相对于相对于 分布的集中程分布的集中程度;与样本含量度;与样本含量n有关,样本含量不同时不宜直接比较)有关,样本含量不同时不宜直接比较)22()XXn22()1XXSn2S2X整理课件统计指标o离散程度的描述 方差n方差:相当于平均每个数据的离均差的平方;可用于不方差:相当于平均每个数据的离均差的平方;可用于不同样本含量数据离散度的比较同样本含量数据离散度的比较。n自由度自由度(degree of freedom):当:当 选定时选定时n
13、个个X中中能自由变动的能自由变动的X的个数的个数X整理课件统计指标o离散程度的描述 标准差n标准差标准差(standard deviation)2()1XXSn222()()XXXXn整理课件统计指标o 离散程度的描述 变异系数n变异系数变异系数coefficiedt of variatlion (CV) CV=标准差/均数100%o 描述了数据的变异相对其平均水平的大小o 描述的是相对离散度o 无单位量纲n比较度量衡单位不同资料的变异度n比较均数相差悬殊资料的变异度整理课件数据分析中的一般统计描述策略o 如果资料近似呈对称分布,则o 如果资料取对数后才呈对称分布,则o 如果资料呈偏态分布o
14、在确认性研究中,往往统计描述采用均数,中位数,标准差, , ,最小值,最大值。2575()Median PP( )ln( )yy Gsyx其中xs25P75P整理课件小 结集中趋势指标:不同分布情况下,描述指标的选择集中趋势指标:不同分布情况下,描述指标的选择离散趋势指标:各个指标的应用和特点离散趋势指标:各个指标的应用和特点如何从集中趋势和离散趋势两个角度对数据进行合理的描述如何从集中趋势和离散趋势两个角度对数据进行合理的描述 整理课件STATA命令o)nuse use 光盘符光盘符:例题例题ex2-1ex2-1 打开数据库文件ex2-1.dta ngen f=int(x-110)/2)ge
15、n f=int(x-110)/2)* *2+1102+110产生用以作频数表的新变量“f”ntab ftab f对变量“f”作频数表ngraph f,bin(13) freqgraph f,bin(13) freq作频数图 X整理课件STATA命令o不等距分组频数图(例2.2)nuse use 光盘符光盘符:例题例题ex2-2ex2-2 打开数据库文件ex2-2.dta ngraph num age, c (J) s(.) xlab (0 5 to graph num age, c (J) s(.) xlab (0 5 to 60) ylab(0 5 to 25)60) ylab(0 5 to 25) 作频数图,其中作频数图,其中c(J),以阶梯状横线连接各数据点。,以阶梯状横线连接各数据点。Xlab 和和ylab为为x轴和轴和y轴的刻度轴的刻度整理课件STATA命令o求均数、标准差(例2.1)nuse use 光盘符光盘符:例题例题ex2-1ex2-1 直接法nsum x sum x 综述变量综述变量x x 间接法ngen xx=int(x-110)/2)gen xx=int(x-110)/2)* *2+1112+111nsu
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 意识形态教育效果评估-洞察及研究
- 2025混凝土搅拌站购销合同
- 2025装载机租赁合同
- 2025合同管理类合同文本适用与填写培训
- 超聚变招聘笔试题库2025
- 2025年标准期限劳动合同范本(合同样式)
- 2025年度资金借款合同协议书
- 2025年北京市买卖合同范本
- 2025仓储租赁合同范本协议书
- 2025物业管理公司物业服务合同协议
- 超高压线下有限净空内地连墙施工工法
- 附表耶鲁抽动程度综合量表
- HJX104桁架式泵吸泥机技术说明
- 《港珠澳大桥的影响实证分析10000字(论文)》
- 食品安全 课件 高中主题班会
- YS/T 320-2007锌精矿
- YS/T 226.12-2009硒化学分析方法第12部分:硒量的测定硫代硫酸钠容量法
- GB/T 24218.3-2010纺织品非织造布试验方法第3部分:断裂强力和断裂伸长率的测定(条样法)
- GB/T 10799-2008硬质泡沫塑料开孔和闭孔体积百分率的测定
- 系统工程原理 - 国防科技大学信息系统与管理学院
- 博微配电网工程设计软件
评论
0/150
提交评论