统计学实验SPSS和R软件应用与实例第16章抽样调查理论与方法R_第1页
统计学实验SPSS和R软件应用与实例第16章抽样调查理论与方法R_第2页
统计学实验SPSS和R软件应用与实例第16章抽样调查理论与方法R_第3页
统计学实验SPSS和R软件应用与实例第16章抽样调查理论与方法R_第4页
统计学实验SPSS和R软件应用与实例第16章抽样调查理论与方法R_第5页
已阅读5页,还剩26页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2026/3/7《统计学实验》第16章抽样调查理论与方法16-1统计学实验

—SPSS和R软件应用与实例

主编:费宇(第二版)2026/3/7《统计学实验》第16章抽样调查理论与方法16-2第16章

抽样调查理论与方法2026/3/7《统计学实验》第16章抽样调查理论与方法16-3一、实验目的熟悉R软件的抽样调查扩展程序包samplingpakage中各种常用的抽样方法,用srswr()函数作简单随机抽样,strata()函数作分层抽样,UPsystematic()函数作系统抽样,cluster()函数作整群抽样。掌握运用R进行抽样的基本操作过程,并能读懂R输出的结果。2026/3/7《统计学实验》第16章抽样调查理论与方法16-4二、实验环境1、系统软件Windows2000或WindowsXP或Windows7;2、统计软件R3.3.1或更高版本(sampling程序包的运行环境的最低要求是R2.14.0版本)。2026/3/7《统计学实验》第16章抽样调查理论与方法16-5三、实验内容简单随机抽样调查方法分层随机抽样调查方法等距抽样调查方法整群抽样调查方法

2026/3/7《统计学实验》第16章抽样调查理论与方法16-6注意:本章例题中使用的数据太长,具体数据文件参见附录。本章使用的各种抽样函数均不是R软件的默认安装函数,需要从R官网(两个zip格式的安装程序包(package),解压缩后放在R软件安装目录下的“library”文件夹中。在R的主窗口下用library(sampling)和library(lpSolve)语句调入程序包,这样就可以在R中里使用sampling程序包中的各种常用的抽样函数。2026/3/7《统计学实验》第16章抽样调查理论与方法16-7第16章

抽样调查理论与方法16.1简单随机抽样调查方法16.2分层抽样调查方法16.3等距抽样调查方法16.4总体比例之差的估计2026/3/7《统计学实验》第16章抽样调查理论与方法16-816.1简单随机抽样调查方法【例16.1】(数据文件为li16.1.txt)某大学会计学院为了解学生月平均基本生活水平的基本情况,准备用简单随机抽样方法从全学院

个学生中抽选一个

的学生组成的样本进行调查。2026/3/7《统计学实验》第16章抽样调查理论与方法16-9【统计理论】简单随机抽样(Simplerandomsampling)是对于一个大小为N的总体,抽取一个容量为n的样本,对于全部可能的样本每一个被抽中的概率都相等。简单随机抽样也称为纯随机抽样,所得样本称为简单随机样本。2026/3/7《统计学实验》第16章抽样调查理论与方法16-10【统计理论】抽取单元的具体方法有重复抽样和不重复抽样。如果抽样是不放回的,则称为不重复简单随机抽样,此时全部可能样本总数为

;如果抽样是放回的,则称为重复简单随机抽样,此时全部可能样本总数为

简单随机重复抽样的误差公式为:

2026/3/7《统计学实验》第16章抽样调查理论与方法16-11【软件操作】用Sampling程序包里的srswr()函数作简单随机抽样library(sampling)#调入sampling程序包library(lpSolve)#调入lpSolve程序包setwd("D:/R-Statistics/data/chap-16")#设定工作路径x=read.table(“li16.1.txt”,header=T)#从li16.1.txt中读入样本数据xnumber=x$XH#读取学生的学号name=x$XM#读取学生的姓名n=100#抽选样本的样本容量N=length(number)#总体容量r=srswor(n,N)#抽取样本,返回只有0和1的向量,用1标记选中的样本as.vector(name[r==1])#列出选中的学生的姓名2026/3/7《统计学实验》第16章抽样调查理论与方法16-12运行结果运行结束后随机抽取的100名学生为

[1]"""罗坤琼""浦黎""""""韩佳""""邹易"[9]"""""常化盼""倪思圆"""""""""[17]"宋圆媛""闫紫艳""墨珊""""""耿静""帅青青"""………[97]"""凌方芳""付敏""邓思琪"2026/3/7《统计学实验》第16章抽样调查理论与方法16-1316.2分层随机抽样方法【例16.2】(数据文件为li16.1.txt)某大学会计学院为了解学生月平均生活水平的基本情况,准备用分层抽样方法从全学院

个学生中抽选一个

的学生组成的样本进行调查。2026/3/7《统计学实验》第16章抽样调查理论与方法16-14【统计理论】分层抽样(Stratifiedsampling)是把容量为的总体划分成不同的层,在各层中分别独立地按某种概率抽样方式进行抽样,总的样本由各层样本组成,根据各层样本汇总对总体参数进行估计的方法。分层抽样又称为类型抽样和分类抽样,所得样本称为分层样本。2026/3/7《统计学实验》第16章抽样调查理论与方法16-15【统计理论】在重复抽样条件下:式中::

或(表示平均数的平均层内方差)2026/3/7《统计学实验》第16章抽样调查理论与方法16-16【软件操作】用strata()函数作分层随机抽样library(sampling)#调入sampling程序包library(lpSolve)#调入lpSolve程序包setwd("D:/R-Statistics/data/chap-16")#设定工作路径x=read.table(“li16.1.txt”,header=T)#从li16.1.txt中读

入样本数据xgrade=rbind(matrix(rep("08",600),600,1,byrow=TRUE),matrix(rep("09",550),550,1,byrow=TRUE),matrix(rep("10",650),650,1,byrow=TRUE),matrix(rep("11",1050),1050,1,byrow=TRUE))#产生一列标示变量,

2026/3/7《统计学实验》第16章抽样调查理论与方法16-17data=data.frame(grade,x$XM,x$YJSH)#提取出由学生所在年级、学生姓名和学生的月平均收入水平三个变量构成的数据s=strata(data,c("grade"),size=c(25,25,25,25),method="srswr")#参数c("grade")标明分层变量的名称,参数size控制每一层字样的样本容量,参数method控制

抽选样本的方法,method="srswr"表示重复的简单随机抽样。a=getdata(data,s)#获取抽选的样本【软件操作】2026/3/7《统计学实验》第16章抽样调查理论与方法16-18运行结果

x.XMx.YJSHgradeID_unitProbStratum1石仪1200810.04166714邓晓丹1200840.0416671……………………………………752170097520.0454552……………………………………1197何兴玲12001011970.0384623……………………………………1873陈娇12001118730.023814……………………………………2841樊万艳7001128410.023814表16.1分层抽样的部分学生的样本信息2026/3/7《统计学实验》第16章抽样调查理论与方法16-1916.3等距抽样方法【例16.3】(数据文件为li16.1.txt)某大学会计学院为了解学生月平均生活水平的基本情况,准备用等距抽样方法从全学院个学生中抽选一个的学生组成的样本进行调查。2026/3/7《统计学实验》第16章抽样调查理论与方法16-20【统计理论】等距抽样是将总体中的所有单元(抽样单元)按一定顺序排列,在规定的范围内随机地抽取一个单元作为初始单元,然后按事先规定好的规则确定其它样本单元。这种抽样方法又称为机械抽样,一般也称为系统抽样(Systematicsampling)。2026/3/7《统计学实验》第16章抽样调查理论与方法16-21【统计理论】1、按无关标志排队:在重复抽样条件下:在不重复抽样条件下:2026/3/7《统计学实验》第16章抽样调查理论与方法16-222、按有关标志排队:在重复抽样条件下:在不重复抽样条件下:

等距系统抽样虽然是用不重复抽样方法,但实质上是使用重复抽样公式。【统计理论】2026/3/7《统计学实验》第16章抽样调查理论与方法16-23【软件操作】

用Upsystematic()函数可以作系统抽样library(sampling)#调入sampling程序包library(lpSolve)#调入lpSolve程序包setwd("D:/R-Statistics/data/chap-16")#设定工作路径x=read.table(“li16.1.txt”,header=T)#从li16.1.txt中读入样本数据xorder=x$BH#读取学生编号name=x$XM#读取学生的姓名n=100#样本容量

2026/3/7《统计学实验》第16章抽样调查理论与方法16-24pik=inclusionprobabilities(order,n)#计算从学生编号向量中抽取100个编号的入选概率。需要注意的是:inclusionprobabilities()函数的使用方式inclusionprobabilities(a,n),其中a必须是正数组成的向量,n为样本容量。s=UPsystematic(pik)#依据编号的入选概率作系统抽样as.vector(name[s==1])#列出选中学生的姓名【软件操作】2026/3/7《统计学实验》第16章抽样调查理论与方法16-25运行后抽选的100名学生为[1]"严子云""""""陈泓卓""曹颖""""刀娟"""[9]"倪钜""凌继霄""""""宁东""康苏"""""[17]"""和焕南""""""左杭烜""符小敏""陈晓冰""史燕蓉"………[97]"""""""钟文诗"运行结果2026/3/7《统计学实验》第16章抽样调查理论与方法16-2616.4整群抽样方法【例16.4】(数据文件为li16.1.txt)某大学会计学院为了解学生月平均生活水平的基本情况,准备用整群抽样方法从全学院

个学生中抽选100个学生组成的样本进行调查。2026/3/7《统计学实验》第16章抽样调查理论与方法16-27【统计理论】整群抽样是将总体中若干个单元合并为组(群),抽样时直接抽取群,然后对中选群中的所有单元全部实施调查的抽样方法。整群抽样群的划分可以是按自然的或行政的区域划分,也可以是人为地组成群。2026/3/7《统计学实验》第16章抽样调查理论与方法16-28【统计理论】 整群抽样抽样平均误差的计算公式:其中:

或2026/3/7《统计学实验》第16章抽样调查理论与方法16-29【软件操作】用cluster()函数可以作整群随机抽样library(sampling)#调入sampling程序包library(lpSolve)#调入lpSolve程序包setwd("D:/R-Statistics/d

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论