




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第二章 统计描述的Stata实现本章主要用到的Stata主要命令*描述性统计: summary 变量名 weight,detail频数表: tabulate 变量名 weight计算均数: means 变量名 weight频数分布图: histogram 变量名,bin() start()*Stata的命令可以用前几个字母代替,如summary可以由su代替,tabulate可以由tab代替。下面就直接用缩写,不再赘述。例2-1 某市1982年调查120名20岁男子的身高(cm)资料如下,试编制频数表和频数图。164.4169.2174.7175.0165.0162.8170.2160.117
2、0.9170.1175.5170.3172.3168.2166.7171.7166.8171.6165.2172.0171.7168.8171.8174.5171.7172.7166.3174.0169.0174.5171.8174.9180.0173.5178.1169.7176.1181.3173.8164.7172.2172.8178.6172.0182.5172.0173.5166.3176.1169.2176.4168.4171.0169.1166.9181.1170.4165.2168.0172.4164.3166.9176.4164.2177.2168.3177.8173.016
3、7.4173.2169.9172.1170.4174.8172.1164.4170.5165.0172.8166.8175.8171.1174.8172.7169.4178.2174.1177.2170.0172.7168.3177.1172.5166.3175.1174.4162.3171.3177.0163.5168.8177.6175.2171.5172.5179.1172.6184.8168.3182.8170.3167.5171.2170.4166.9178.5164.1169.5173.4170.3数据格式如下:x1164.42175.53171.74171.85172.26176
4、.47164.38169.99175.810168.311168.812170.313169.214170.315168.816174.917172.818168.419166.920172.121171.122177.123177.624167.525174.726172.327171.82818029178.63017131176.432170.433174.834172.535175.236171.23717538168.239174.540173.54117242169.143164.244174.845172.746166.347171.548170.44916550166.7511
5、71.752178.153182.554166.955177.256172.157169.458175.159172.560166.961162.862171.763172.764169.76517266181.167168.368164.469178.270174.471179.172178.573170.274166.875166.376176.177173.578170.479177.880170.581174.182162.383172.684164.185160.186171.68717488181.389166.390165.2911739216593177.294171.3951
6、84.896169.597170.998165.299169100173.8101176.1102168103167.4104172.8105170106177107168.3108173.4109170.1110172111174.5112164.7113169.2114172.4115173.2116166.8117172.7118163.5119182.8120170.3 为制作频数表,键入Stata命令:.gen f=int(x-160)/2)*2+160产生用以作频数表的新变量“f”.tab f对变量“f”作频数表“gen”命令产生新变量“f”,将各观察值转换成相应该组的下限值。 i
7、nt为取整函数,结果为括号内函数值的整数部分,如int(3.24)=3。“160”为第一组的下限,“2”为组距。以第一例观察值160.1cm为例,f=int(160.1-160)/2)*2+160=160,则它应归入“160”组。结果如下: f | Freq. Percent Cum.-+- 160 | 1 0.83 0.83 162 | 3 2.50 3.33 164 | 10 8.33 11.67 166 | 11 9.17 20.83 168 | 16 13.33 34.17 170 | 22 18.33 52.50 172 | 22 18.33 70.83 174 | 14 11.67
8、 82.50 176 | 10 8.33 90.83 178 | 5 4.17 95.00 180 | 3 2.50 97.50 182 | 2 1.67 99.17 184 | 1 0.83 100.00-+- Total | 120 100.00hist f,start(160) width(2)作频数图结果如下:例2-2某医生测定230名正常成年男子的空腹血清胰岛素样生长因子-1(IGF-1F)水平,整理后编制为频数分布表(表2-2),请根据该频数分布表作频数图。表2-2 230名正常人空腹血清胰岛素样生长因子-1水平中位数的计算 IGF-1F (1) 人数 (2)频率(%)(3)累计频
9、数(4) 累计频率(%) (5)=(4)/ 50 30 13.04 30 13.0 150 71 30.87 101 43.9 250 49 21.30 150 65.2 350 28 12.17 178 77.4 450 14 6.09 192 83.5 550 12 5.22 204 88.7 650 10 4.35 214 93.0 750 8 3.48 222 96.5 850 5 2.17 227 98.7 9501050 3 1.30 230100.0 合计230100.00Stata数据格式如下: xf150302150713250494350285450146550127650
10、108750898505109503tab x weight=f制作汇总表的频数表在本例中,x的取值为各组的下限,而f是各组的频数,所以需要用Stata的频数选项weight=。结果: x | Freq. Percent Cum.-+- 50 | 30 13.04 13.04 150 | 71 30.87 43.91 250 | 49 21.30 65.22 350 | 28 12.17 77.39 450 | 14 6.09 83.48 550 | 12 5.22 88.70 650 | 10 4.35 93.04 750 | 8 3.48 96.52 850 | 5 2.17 98.70
11、950 | 3 1.30 100.00-+- Total | 230 100.00hist x weight=f,start(50) width(100)制作频数图例2-3 随机测量某地10名2030岁健康男性居民血清铁含量(),测量值分别为6.58,7.42,15.32,15.78,17.60,17.98,15.21,17.53,20.11,22.64,试求其平均血清铁含量。Stata数据为x16.5827.42315.32415.78517.6617.98715.21817.53920.111022.64su x计算均数标准差结果: Variable | Obs Mean Std. Dev
12、. Min Max-+- x | 10 15.617 5.075254 6.58 22.64所以平均平均血清铁含量为15.617。例2-4 计算例2-1的频数表(表2-3)中120名男子的平均身高显然,如果用Stata,对于例2-1的资料不需要事先转化为频数表,然后再计算均数。不妨用例2-2作为例子展示Stata计算频数表资料的均数。su x weight=f计算频数表资料的均数结果: Variable | Obs Weight Mean Std. Dev. Min Max-+- x | 10 230 290 223.4123 50 950例2-5 8名麻疹易感儿接种麻疹疫苗3周后,其血凝抑制
13、抗体滴度分别为1:4,1:8,1:16,1:32,1:64,1:128,1:256,1:512。试求其平均抗体滴度。数据格式:x1428316432564612872568512gen logx=log(x)计算x的自然对数su logx计算自然对数的均数,得到3.81231disp exp(3.81231)计算均数的反对数,即指数得到几何均数为45.254857另外,Stata还有一个直接计算几何均数的命令:means x结果为: Variable | Type Obs Mean 95% Conf. Interval-+- x | Arithmetic 8 127.5 -20.53203 2
14、75.532 | Geometric 8 45.25483 10.94481 187.1206 | Harmonic 8 16.06275 . . -Missing values in confidence interval(s) for harmonic mean indicate that confidence interval is undefined for corresponding variable(s).Consult Reference Manual for details.Means命令计算算术均数、几何均数以及调和均数,其中几何均数为45.25483,和前面的结果相同。例2
15、-6 某地区50名麻疹易感儿童接种麻疹疫苗3周后,测其血凝抑制抗体滴度,如表2-4中第(1)栏和第(2)栏,求平均抗体滴度。表2-4 50名麻疹易感儿童平均抗体滴度计算表 抗体滴度 (1) 人数 (2) 滴度倒数 (3)(4)(5)=(2)(4)1:4 1 40.6021 0.60211:8 2 80.9031 1.80621:16 6 161.2041 7.22461:3210 321.505115.05101:6416 641.806228.89921:128 81282.107216.85761:256 52562.408212.04101:512 25122.7093 5.4186 合
16、 计5087.9003数据如下:xf14128231664321056416612887256585122gen logx=log(x)计算x的自然对数su logx weight=f计算自然对数的均数,得到4.04798disp exp(4.04798)计算均数的反对数,即指数得到几何均数为57.281631也可以用means x weight=f结果:(analytic weights assumed) Variable | Type Obs Mean 95% Conf. Interval-+- x | Arithmetic 8 95.76 -2.30755 193.8275 | Geom
17、etric 8 57.2816 22.59723 145.2029 | Harmonic 8 32.82051 . . -Missing values in confidence interval(s) for harmonic mean indicate that confidence interval is undefined for corresponding variable(s).Consult Reference Manual for details.例2-7 5名成年男子的体重(kg)为60,70,75,80, 90,求中位数。例2-8 某医生测定了6名正常成年男子的空腹血清胰岛
18、素样生长因子-1(IGF-1F)水平为150,170,185,245,265,280,求中位数。注:这两个例子用软件算实在是浪费,可以用su x,detail来处理。对于summary,加上detail后可以输出百分位数,其中的P50就是中位数。 x- Percentiles Smallest 1% 60 60 5% 60 7010% 60 75 Obs 525% 70 80 Sum of Wgt. 550% 75 Mean 75 Largest Std. Dev. 11.1803475% 80 7090% 90 75 Variance 12595% 90 80 Skewness 099% 90 90 Kurtosis 2.05例2-9 8名7岁男孩的身高(cm)分别为116,118,119,120,121,123,125,126。请计算这8名7岁男孩身高的第25百分位数和第90百分位数。Stata数据为:x116118119120121123125126Stata命令为:su x,d结果为: x- Percentiles Smallest 1% 116 116 5% 116 11810% 116 119 Obs 825% 118.5 120 Sum of Wgt. 850% 120.5 M
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年护士职业指导与规划试题及答案
- 行政管理的动态管理试题及答案
- 执业药师考试终极复习试题及答案
- 行政服务创新的实际案例与分析的试题及答案
- 2025年文化价值观试题及答案
- 行政法学知识检查试题与答案
- 2025年自考行政管理试题及答案全景
- 药物使用中的风险管理相关考点试题及答案
- 影响力较大的主管护师试题及答案
- 2025年执业药师的考试结构分析试题及答案
- 110~750kV架空输电线路设计规范方案
- 项目部职责牌
- 车辆采购、维修服务投标方案
- 药剂科病房麻醉药品精神药品处方流程
- 营销策划模版课件
- 智慧楼宇设计方案.pdf
- 外架悬挑防护棚施工方案完整
- (精选)社区管理网上形成性考核作业
- 以天然气制合成气的工艺
- 设备计算与选型——孙景海
- 恩格勒系统整理17页
评论
0/150
提交评论