




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、计算机应用SPSS中随机抽样的精确实现南方医科大学珠江医院信息科(510282中山大学公共卫生学院统计与流行病学系(510080颜杰谢薇方积乾SPSS在菜单中仅提供了两种从数据表中随机抽取记录的功能。一种是近似法,即由用户指定抽取比例,系统按该比例在全部记录中进行无返回的抽样。此时系统对于每条记录都是用独立的伪随机数发生器进行抽样,故抽样结果只能近似符合指定的比例。根据大样本代表性好的原理,数据文件中的记录条数越多,比例越接近50%,结果就会越接近。另外一种方法是精确法,由用户指定需抽取的记录条数和从前面多少条记录中抽取,系统就从指定的范围内抽取相应条记录。以上两种方法的局限就是无法根据用户的
2、需要,在任意指定抽取范围进行精确抽样。前者只能进行近似抽样,而后一种方法又不能任意指定抽取范围,应用起来不方便。我们在实际应用过程中,发现借助SPSS对话框中的Paste按钮,利用SPSS的程序编辑窗口对抽样程序作一些修改就可以实现任意指定范围的抽样。具体方法如下:假定当前数据文件中有2000条记录,分为2个组,11000条为A组,10012000条为B组。现分别要从2组中各随机抽取50条记录。首先实现从第1组中抽样,此时直接利用SPSS 就可实现。在菜单中选择DataSelect Cases,在弹出的Select Cases对话框中选择Random Sample of cases 选项,又弹
3、出Select Cases:Random Sample对话框,其中第1选项是按比例近似抽样,第2选项就是指定范围精确抽样。选中第2选项,在相应的框中分别填入50和1000(见图1。图1Select Cases:Random Sample对话框然后点击Continue按钮返回Select Cases对话框,再点击框中的Paste按钮,系统自动打开程序编辑窗口,并将上述过程翻译为相应SPSS程序。程序语句内容如下:01USE ALL.02do if$casenum= 1.03compute#s-$-1=50.04compute#s-$-2=1000.05end if.06do if#s-$-2&g
4、t;0.07compute filter-$=uniform(13#s-$-2<#s-$-1.08compute#s-$-1=#s-$-1-filter-$.09compute#s-$-2=#s-$-2- 1.10else.11compute filter-$=0.12end if.13VARIABL E LABEL filter-$.50from the first1000cases (SAMPL E14FORMAT filter-$(f110.15FIL TER B Y filter-$.16EXECU TE.上段程序中使用了临时变量(scratch variable# s-$-1和
5、#s-$-2,这种变量常被用作循环指针。这里也是利用它们实现条件循环。程序的基本流程是,首先指定需要抽取的初始记录条数#s-$-1和初始可抽取范围内记录条数#s-$-2(1#s-$-2,这就决定了抽样比例(#s-$-1/#s-$-2,即每条记录被抽中的可能性为#s-$-1/#s-$-2。然后通过控制#s-$-1和#s-$-2的变化来实现抽样。具体抽样由07行语句compute filter-$=uniform (13#s-$-2<#s-$-1完成,其中uniform(1是SPSS中提供的伪随机数函数,它可产生一个服从0 1均匀分布的随机数,统计中常用此函数模拟随机抽样。将该语句变换成co
6、mpute filter-$=uniform (13<#s-$-1/#s-$-2,就很容易理解了,它就是按#s-$-1/#s-$-2的可能性随机决定当前记录是否被抽中。若抽中则筛选指示变量filter-$赋值为1,同时#s-$-1减1表示剩下还需抽取记录数;否则为0。此后#s-$-2减1表示剩下的可抽取记录数。这样反复直到#s-$-2=0表示所有范围内的记录都判定完了。程序的巧妙之处是利用可变的# s-$-1/#s-$-2实现精确抽样,其作用类似于一个杠杆,当抽满时,#s-$-1=0,compute filter-$=552中国卫生统计2005年8月第22卷第4期uniform(13&l
7、t;0就控制剩下的记录都不会被抽中;若#s-$-1=#s-$-2,则表示还需抽取的记录数就是剩下的记录数,compute filter-$=uniform(1 3<1就控制剩下的记录都被抽中。明白了程序的原理后就很容易修改了。现在我们来实现从10012000条中抽取50条,这时只需要对程序作如下改动:11将02行语句中的临时变量$casenum赋值为1001,即指定抽取范围的起始值;21在02行语句后增加一条语句:compute#s-$-3=$casenum1,新增加临时变量#s-$-3来控制范围起始值的变化,而用临时变量#s-$-2表示范围结束值,则抽取范围内记录条数变为#s-$-2-
8、# s-$-3+1;31将07行和08行语句中#s-$-2改为#s-$-2-#s-$-3+1。整个修改后程序如下: USE ALL.do if$casenum=1001.compute#s-$-1=50.compute#s-$-2=2000.compute#s-$-3=$casenum.end if.do if#s-$-2-#s-$-3+1>0.compute filter-$=uniform(13(#s-$-2-#s-$-3+1 <#s-$-1.compute#s-$-1=#s-$-1-filter-$compute#s-$-3=#s-$-3+1.pute fil
9、ter-$=0.end if.VARIABL E LABEL filter-$50from the first1000cases(SAM2 PL E.FORMAT filter-$(f110.FIL TER B Y filter-$.EXECU TE.运行上述程序就可以实现在10012000条记录中抽取50条记录了。具体操作方法是:在程序编辑窗口的菜单中选择RunAll,程序就会运行,系统会在数据集中生成筛选指示变量filter-$,并且在相应的记录号上加斜杠表示未选中。在实际应用中,可根据需要重新定义变量$casenum(起始记录值、#s-$-1(需抽取记录条数和#s-$-2(结束记录值,就
10、可以实现任意范围内的精确抽样了。该算法具有普适性,如果将其写成SAS语言,也就可以在SAS中实现任意范围的精确抽样。SPSS是国际通用的统计软件包,一般应用时都强调它的菜单式的操作界面友好,因此被誉为“非统计专业人士的首选软件”。其实它的编程功能也很强大,对菜单功能是一个极好的补充。尤其是系统在对话框中都提供Paste按钮,大大简化了编程工作,在此基础上对程序作一些改动,就可以根据自己的需要实现许多菜单方式完成不了的功能。(上接第244页V2=-01150y1-01026y2-01038y3+01311y4+ 01309y5+01351y6+01046y7+01306y8W2=01120x1+
11、01201x2-01194x3+ 01256x4-01018x5-01079x6-01507x7+01542x8+01082x9+01317x10可利用典则变量这一综合指标代替原来的多变量信息。从标准化指标线性组合的系数可了解各指标对典则变量的影响大小,系数绝对值越大,影响越大,对应的变量即为该典则变量的的主要变量,以此可找出各指标组中的主要指标。标准系数的正、负符号不同,表明影响的方向不同。分析表明反映生命质量的第一典则变量V1主要反映活力(y6、社会功能(y4及精神健康(y5,第二典则变量V2主要反映活力(y6、社会功能(y4、精神健康(y5及总体健康(y8。反映健康观的第一典则变量W1主
12、要反映睡眠质量(x6、烦恼事件(x7及生活态度(x3,第二典则变量W2主要反映解压能力(x8、烦恼事件(x7及饮食习惯(x10。讨论本研究分析结果表明,生命质量和健康观两者之间存在正相关关系。生命质量的高低主要由活力、社会功能及精神健康来体现,而健康观主要由睡眠质量及解压能力来反映。生命质量和健康观的相关主要是第一对典则变量V1和W1的相关,而V1主要由y6、y4及y5决定,W1主要由x6决定,所以主要是活力、社会功能及精神健康和睡眠的正相关,即良好的睡眠使人充满活力并有良好的社会交往能力及精神健康。第二对典则变量主要是活力、社会功能、精神健康及总体健康和解压能力的正相关,即良好的解压能力使人充满
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- GB/T 45536-2025感官分析实验室质量控制指南
- GB/T 45575-2025工业产品表面缺陷自动检测系统技术要求
- 2025年计算机:IT.程序员职业技能资格知识考试题与答案
- 主题婚礼策划与流程
- 全科医学转岗培训课件
- 宣传信息工作培训
- 个人能力培训教程课件
- 物业安全人员岗前培训
- 园林景观设计与施工培训课件
- 车辆维修报账合同协议
- GA/T 1556-2019道路交通执法人体血液采集技术规范
- 作业现场安全监督检查卡(配电)
- 幼儿园绘本故事:《小熊不刷牙》
- 安全生产会议记录(12个月)
- 旅行管家实务全套ppt课件最全电子教案完整版教学教程整套全书课件ppt
- 做好孩子的引路人课件
- 丽声北极星分级绘本第一级上My Noisy Schoolbag教学设计
- (完整版)管理经济学题库
- 毕业设计粗饲料粉碎机的设计全套CAD图纸
- 植物基酸奶项目说明(范文模板)
- 钣金报价计算表(强)
评论
0/150
提交评论