抽样调查实验指导书_第1页
抽样调查实验指导书_第2页
抽样调查实验指导书_第3页
抽样调查实验指导书_第4页
抽样调查实验指导书_第5页
已阅读5页,还剩25页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

抽样调查实验指导书李浩 编浙江万里学院计算机与信息学院2010 年 6 月2说 明1、本指导书共设置六个实验,为抽样调查实验课专用。2、学生比须按照要求在实验课时间内,独立完成每个实验。3、每个实验最后都有相应的课外拓展,学生可适量练自学。4、每个实验都要求上交电子版实验报告。* 实验报告要求:(1)写出具体的实验步骤;(2)出现的问题及解决方法;(3)一些必要的过程贴图、文字说明、统计表输出内容;(4)应实验要求回答相关问题。3目 录实验一 SPSS 的安装与初步使用 4实验二 简单随机抽样 7实验三 数据的整理与预处理 10实验四 均值分析与单样本 T 检验 .15实验五 频数分析与统计图 20实验六 相关性分析 244实验一 SPSS 的安装与初步使用一、实验目的。学会 SPSS13.0 for Windows 软件的下载与安装,熟悉软件的操作界面,并通过实例掌握 SPSS 一些初步的功能。二、实验仪器安装有 Windows XP 及以上系统的微机一台,并安装有 office 办公软件。三、实验要求。(1)熟悉 SPSS 安装步骤。(2)熟悉 SPSS 操作界面,包括数据编辑器、语法编辑器、输出查看器、草稿输出器、脚本输出器等;(3)通过几个实例熟悉 SPSS 的一些基本的统计功能。四、实验内容。实验 1 SPSS 13.0 的安装:双击 ,显示以下界面,下一步,选择安装路径,完成安装。实验 2 几个基本的统计功能实现:5(i) 参数估计:测得在条件一致的 8 个小区种植的某小麦良种的千粒重(g)分别为:35.6、37.6、33.4、35.1、32.7、36.8、35.9、34.6,使用 SPSS 估计其均值与方差。Step1:进 SPSS 系统,建立或读入数据文件,定义变量 X,标号“千粒重” ,其他默认;Step2:单击“Analyse”菜单,选择“Descriptive Statistics”中的“Explore”过程,打开对话框,选择“千粒重X ”为分析变量,显示框选择显示“Statistics” ,按下“Statistics”按钮,只选择“Descriptive”中的置信区间选 95%,返回后单击“OK” 。要求:求出 8 个小区的均值;均值 95%的置信区间;方差;极差。 (ii) Means 过程某医师测得血红蛋白值(g%)如表 3.1,试利用 Means 过程作基本的描述性统计分析。对象编号性别 年龄血红蛋白值对象编号性别 年龄血红蛋白值123456789101112女男女女男男女男女女男男18161817161816181817181812.8315.5012.2510.0610.889.658.3611.668.547.7813.6610.57212223242526272829303132女男男女女女女男男男男女16161818171817161618161611.3612.7815.098.678.5612.5611.5614.677.8812.3513.659.8761314151617181920男女女女男男女男161717171716161812.569.878.9911.3514.5612.408.0514.033334353637383940女女男男男男女男181818181717161610.0912.5516.0413.7811.6710.988.7811.35Step1:建立数据文件。定义 4 个变量:ID、Gender、Age 和 HB,分别表示编号、性别、年龄和血红蛋白值。Step2: 选择菜单“AnalyzeCompare MeansMeans”,弹出“Means”对话框。在对话框左侧的变量列表中,选择变量“血红蛋白值”进入“Dependent List”列表框,选择变量“性别”进入 “Independent List”,单击“Next”按钮,选择变量“年龄”进入“Independent List” 。Step3:单击“Options”按钮,在弹出的“选择描述统计量”对话框中设置输出的描述统计量。Step4:单击“OK”按钮,得到输出结果。要求:求出 18 岁男士的血红蛋白均值;所有女士的血红蛋白均值;所有 16岁人士的血红蛋白均值。(iii )回归分析:某水稻品种在 5 月 5 日至 8 月 5 日(每隔 10 天播一期) ,测定播种至齐穗的天数 x 和播种至齐穗的总积温 y(单位:d)的数据见下表,试使用线性回归确定 y 与 x 的关系式。x 70 67 55 52 51 52 51 60 64y 1616.3 1610.9 1440.0 1440.7 1423.3 1471.3 1421.8 1547.1 1533.0Step1:建立数据文件,定义变量,输入数据。Step2:菜单“AnalyzeRegressionLinear” ,弹出“Linear”对话框。Step3:选 y 为因变量,x 为自变量。Step4:单击“Statistics”按钮,选择“Estimates” 、 “Confidence 7Interval”、 “Covariance Matrix”、 “Model Fit”、 “R Squared Change”、“Durbin Watson”,其他默认。可得回归模型分析表。要求:写出 x 与 y 的回归方程;两个变量之间的相关系数。课外拓展:想办法利用 SPSS 作出(iii)中的数据线性回归图。实验二 简单随机抽样一、实验背景。简单随机抽样(simple random sampling, SRS)是最简单的概率的抽样方法,也是其他抽样方法的基础。这样抽取的样本称为简单随机样本,在此方法下总体中的每一个体被抽到的概率完全相同。简单随机抽样是最为常用的方法,也最能体现抽样统计的思想。二、设备要求。PC 一台,安装软件有 Excel 2003 以上版本和 SPSS 10.0 以上版本。三、实验目的。(1) 学会建立简单的电子抽样框;(2) 在 Excel 中,通过随机函数或随机数发生器产生随机数实现简单随机抽样;(3) 利用 SPSS 软件实现简单随机抽样,并进行初步的数据分析。四、实验要求。实验 1 在 EXCEL 中,采用 RAND 函数随机抽样本班中的 8 个同学的学号,并调查抽到的同学的身高数据,同时录入保存。实验 2 某电视台举行幸运观众抽奖,需要从编号为 000001 到 999999 的热心观众中随机抽取 20 位幸运观众赠送礼品,采用 RANDBETWEEN 函数随机选出幸运观众的号码,并对号码排序。实验 3 某中学为了调查全校 2818 名同学身体素质的基本状况,现利用SPSS软件简单随机抽取 300 个样本进行调查(参照课本 68 页) 。8五、友情提示。1. RAND 函数的一个例子: (1)RAND 返回一个 01 的均匀分布随机数,若要生成 a 与 b 之间的随机实数。可使用公式 RAND*(b-a)+a;(图 1.1)图 1.1(2)鼠标拖拽自动填充单元格,完成 20 个样本抽样(图 1.2 左) 。抽样取得后(有重或缺勤) ,只要按 F9(或重新打开文件) ,就会得到一组新的抽样。点击工具栏 取得整数抽样(图 1.2 右) 。图 1.29(3)保存随机数。选中随机抽样数据,右击-复制,再次右击-选择性粘贴,弹出对话框中粘贴选项选择数值,运算选项选择无,确定即可。至此公式转化为常数,不再变化。图 1.32RANDBETWEEN(a, b)函数返回 ab 之间的随机数。如果函数不能用,并返回错误值#NAME?,请通过工具-加载宏,安装并加载“分析工具库”加载宏(图 1.4) 。图 1.4(1) 设置数字类型。右击菜单-设置单元格格式- 数字- 自定义-类型“000000”(2) 输入随机函数“=RANDBETWEEN(0,999999)” ,自动填充 20 个单元格。(3) 固定抽取结果。选择数据区域,右击-复制-单击工具栏粘贴按钮下拉菜单-值。(4) 结果排序。数据-排序- 主要关键字“观众编号”- 升序-确定。要求:比较两个函数的优劣。课外拓展:使用 Excel 产生随机数据,还有其他那些方法?10实验三 数据的整理与预处理一、实验目的。(1)熟悉 SPSS 数据编辑框,会定义和设置变量,会输入数据;(2)会对数据进行排序、筛选、转置等预处理;(3)会通过计算定义新变量。二、实验要求及步骤。实验 1 用 SPSS 输入数据表2-3 需要录入的数据 编号 班级 性别 考试成绩1 1 0 852 1 1 903 2 0 874 2 1 695 3 0 786 3 1 937 4 0 838 4 1 91Step1:在变量表第一列中依次输入“编号”“ 班级”等四个变量名, SPSS会自动为这些变量的其他属性赋予系统默认值。Step2:可以进行必要的修改,例如把小数位设为0 。也可以为变量加上标签,以对变量的含义进行更详细的说明。在输出结果中可以让SPSS输出变量的标签。 以“班级”这个变量为例加以说明(图 1) 。单击“班级”变量的“Values”单元格的右侧,会弹出一个“ 数值标签 ”(Value Labels)的对话框。在定义标签对话框的中有三个小矩形框。在第一个矩形框中输入变量值1,在第二个矩形框中输入“统计”,这时“Add”按钮变亮,点击Add按钮,下面的清单中显示1=“ 统计”。按照这种方法继续定义2=“经济 ”,3=“ 金融” ,4=“ 会计 ”。 变量定义好以后,就可以在数据表中依次输入数据了。对于定义了数值标签的变量,单击工具栏中的 按钮可以显示数值标签,再单击一下则可以显11示数值。图 1 在 SPSS 中定义数值标签要求:输出带标签的数据表。实验 2 用 SPSS 进行数据的排序Step1:用鼠标选择“Data - Sort Cases” ,会弹出以下对话框(图 2) 。选中“考试成绩”,单击中间的黑三角,把这个变量移至右面的矩形框中(这个过程也可以通过双击“ 考试成绩 ”完成) 。再选择排序方式(升序或降序) ,点击“OK”就可以了。图 2 对数据进行排序的对话框要求:输出排序后的数据。实验 3 用 SPSS 进行数据筛选在数据分析中我们常常需要对数据的一个子集进行分析。这时需要首先从数据集中筛选出符合条件的数据。 12筛选出成绩在85分以上的女生进行分析。Step1:选择Data Select Cases,进入Select Cases 对话框(图3) 。图 3 用SPSS筛选数据的对话框Step2:选择If condition is satisfied,然后单击If按钮进入If 对话框(图4) ,在该对话框中的条件表达式栏中输入“考试成绩85 & 性别=1”的条件表达式,单击Continue 按钮,在Select Cases 对话框中单击OK 按钮。筛选的结果中,未被选中的观测的行号被打上了反斜杠(注意SPSS自动生成一个了筛选变量) 。这样,在随后的分析中就会只对选中的观测进行分析了。如果想再次选中全部观测,再次打开图2-13的对话框,选择“All cases” 就可以了。 Step3:在图 3 的对话框中如果把“Unselected cases are ”的选项改为“Deleted” ,SPSS 会删除未被选中的观测,但删除的观测是无法恢复的。SPSS 还可以用其他方法筛选数据,例如从数据集中按一定比例随机选择数据,选一定区域的数据等。13图 4 SPSS 中定义筛选条件的对话框要求:输出筛选后的数据表。实验 4 使用 SPSS 对考试成绩的数据进行重新编码Transform 菜单中的 Recode 命令也经常用到。这个命令可以对已有的数据进行重新编码。把百分制的成绩换算为九级制的成绩(0-59=1,F ;60-64=2, D;65-69=3,D+ ;70-74=4,C;75-79=5,C+;80-84=6,B;85-89=7, B+;90-74=8,A; 95-99=9,A+) 。Step1:单击 Transform-Recode-into different variables,会得到图 6 的对话框。把左侧考试成绩变量选入中间的矩形框,在右侧的矩形框中输入变量名“九级制”,单击下面的“Change”,这时中间的矩形框中会出现以下对应关系:考试成绩 九级制。图 6 对数据重新编码的对话框14Step2:接下来单击“Old and News Values”按钮,会弹出图 7 的对话框。我们可以用这个对话框来定义新旧数值的对应关系。在 Old Value 栏中首先选择“Range: Lowest through”的选项,在矩形框中输入 59,在 New Value 中输入 1。这时 Add 按钮变亮,单击这个按钮,在右下方的矩形框中出现了 Lowest through 59 -1 的对应关系。接下来在左侧选择并输入区间 60 through64,在右侧输入新变量值 2,依次类推。最后一个区间可以输入为 95 through Highest。定义好这些对应关系以后,单击 Continue,再单击图 2-17 中的“OK”按钮,就可以完成重新编码的过程了。图 7 定义新旧数值的对应关系Step3:用前面讲过的方法为新变量“九级制” 加上数值标签:1=“F”,2=“D”, ,9=“A+”。整个重新编码过程就完成了。 要求:输出重新计算的变量输出图。课外拓展:自学数据文件的合并、拆分、转置等操作。1516实验四 均值分析与单样本 T 检验一、实验背景。在统计学中,我们往往从样本的特性推知随机变量总体的特性。但由于总体中个体之间存在差异,样本的统计量和总体的参数之间往往会有误差。因此,均值不相等的样本未必来自不同分布的总体,而均值相等的样本未必来自有相同分布的总体。也就是说,如何从样本均值的差异推知总体的差异,这就是均值比较的内容。SPSS 提供了均值比较过程,在主菜单栏单击 “Analyze”菜单下“Compare Means”项,该项下有 5 个过程,如图 1。图 1 “Compare Means”项二、实验目的。(1)掌握 SPSS 中的 Means 过程;(2)掌握 SPSS 中的 One-Sample T Test 过程;(3)会解释均值分析与检验结果。三、实验要求及步骤。实验 1 调查了棉铃虫百株卵量在暴雨前后的数量变化,统计暴雨前和暴雨后的统计量。其数据如下:暴雨前 110 115 133 133 128 108 110 110 140 104 160 120 120暴雨后 90 116 101 131 110 88 92 104 126 86 114 88 112Step1:定义变量,输入并保存数据。Step2:启动分析过程。在 SPSS 主菜单中依次选择“AnalyzeCompare MeansMeans”。出现对话框如图 2。Step3:设置分析变量。从左边的变量列表中选中“百株卵量” 变量后,点击变量选择右拉按钮,该17变量就进入到因子变量列表“Dependent List:”框里,用户可以从左边变量列表里选择一个或多个变量进行统计。多个分组变量既可放在一层,又可放在不同层。利用图中的“Previous”和“Next”按钮可以在不同层之间切换。图 2 Means 对话框Step4:选择输出统计量。单击“Options”按钮,将打开如下图所示的对话框。在“Options”对话框中,“Statistics”框中列出了 SPSS 可求的统计量。图 3 Means 选项其中各项的意义分别为:181. Mean 均值。 2. Number of Cases 观测量数目 3. Standard Deviation 标准差 4. Median 中位数。 5. Grouped Median 分组的中位数 6. Std. Error of Mean 均值的标准误 7. Sum 观测值之和 8. Minimum 最小值 9. Maximum 最大值 1. Range 极差 2. First 第一个观测值 3. Last 最后一个观测值 4. Variance 方差 5. Kurtosis 峰度 6. Std. Error of Kurtosis 峰度的标准误 7. Skewness 偏度 8. Std. Error of Skewness 偏度的标准误 其中,“Mean”、“Number of Cases”和“Standard Deviation”项为系统的默认选项。在“Cell”框中列出了已选中的统计量。从“Statistics”框中选择要生成的统计量。“Statistics for First Layer”框中列出了第一层分组的另外两个统计量。“Anova table and eta”选中将给出方差分析表和 eta 统计量。方差分析表的前提条件是按照分组变量分组后各组的均值都相等。eta 统计量为分组变量与生成统计量的变量关系紧密程度的度量。“Test for Iinearity”选中给出分析变量和分组变量的线性关系参数,其前提条件为:分组变量和分析变量线性相关。本例子选定统计量为“Mean”、“Number of Cases”、“Standard Deviation”3 个统计变量。选中复选项“Anova table and eta”。 Step5: 提交执行及分析结果输出。在图 2 对话框里单击“OK”按钮,SPSS 在输出窗口的输出结果。要求:输出描述性统计分析表和方差分析表,并给出降雨是否影响卵量的回答。实验 2 如果已知总体均数,进行样本均数与总体均数之间的差异显著性检验属于单一样本的 T 检验。在 SPSS 中,单一样本的 T 检验由“One-Sample T Test”过程来完成。有一种新型农药防治柑桔红蜘蛛,进行了 9 个小区的实验,其防治效果为:95%,92% ,88% ,92% ,93%,95%,89%,98%,92%与原用农药的防治效果 90%比较,分析其效果是否高于原用农药。19Step1:准备分析数据。在数据编辑窗口输入分析的数据,如图 4 所示。图 4 数据窗口Step2: 启动分析过程在 SPSS 主菜单选中“AnalyzeCompare MeansOne-Sample T Test”,打开单一样本 T 检验主对话框,如图 5。图 5 单一样本 T 检验变量选择窗Step3:设置分析变量。设置检验变量: 从左边的变量列表中选中“防治效果”变量后,点击中部的右拉按钮后,这个变量就进入到检验分析“Test Variable(s):”框里,用户可以从左边变量列表里选择一个或多个变量进行分析。输入检验值: 在“Test Variable(s)”输入栏里,输入用于比较检验的均值:在本例中为 90。Step4:设置其他参数。单击“Options”按钮,打开设置检验的置信度和缺失值对话框。20图 6 选项对话框在“Confidence Interval:”框输入置信度水平,系统默认为 95%。在“Missing Values”栏里选择缺失值处理方式:Step5:提交执行。输入完成后,在图 5 过程主窗口中单击“OK”按钮,SPSS 输出分析结果。要求:输出单一样本的统计量列表和均值检验结果,并给出较详细的统计解释。课外拓展:如何实现独立样本的 T 检验?21实验五 频数分析与统计图一、 实验背景。频数分布分析主要通过频数分布表、条形图和直方图,以及集中趋势和离散趋势的各种统计量来描述数据的分布特征。二、实验目的。(1)学会简单的频数分析操作;(2)会输出简单的统计图形;(3)会解释频数分析结果。三、实验要求及步骤。根据提供数据,分析三化螟蚁螟虫口频数分布。Step1:读入数据文件:虫口.sav。Step2:在主菜单栏单击“Analyze”,在出现的下拉菜单里移动鼠标至“Descriptive Statistics”项上,在出现的次菜单里单击“Frequencies”项,打开如图1 所示的对话框。图 1 频数分析对话框Step3: 设置分析变量。单击“Statistics”按钮,打开图 2 所示的对话框,该对话框用于选择统计量:22图 2 统计量设置 选择百分位显示“Percentiles Values”栏:Quartiles:四分位数,显示 25%、50%和 75%的百分位数。Cut points for 10 equal groups:将数据平分为输入的 10 个等份。Percentile(s)::用户自定义百分位数,输入值 0100 之间。选中此项后,可以利用“Add”、 “Change”和“Remove” 按钮设置多个百分位数。 选择变异程度的统计量“Dispersion”:(离散趋势)Std.deviation 标准差 Minimum 最小值Variance 方差 Maximum 最大值Range 极差 S.E.mean 均值标准误 选择表示数据中心位置的统计量“Central Tendency”:(集中趋势)Mean 均值Median 中位数Mode 众数Sum 算术和 选择分布指标“Distribution” : Skewness 偏度Kurtosis 峰度23Step4: 设置统计图形输出。单击“Charts” 按钮,将弹出如图 3 所示的对话框:图 3 “Charts”对话框 Chart Type 图形选择栏: None: 不输出图形; Bar charts: 输出条形图; Pie charts: 输出饼图; Histograms: 输出柱状图。若选中“With normal curve”项,则在绘制柱状图中加绘一条正态分布曲线。 当用户选中条形图或饼图时,在“Chart Values”框的选项中可选择: Frequencies:绘制频数图。 Percentages:绘制频率图。Step5: 设置频数表格式。在图 1 对话框中,单击“Format” 按钮,打开如图 4 所示的对话框:图 4 “Format”对话框24 设置排序的方法“Order by”: Ascending values:按变量值的升序排列。 Descending valus:按变量值的降序排列。 Ascending counts:按频数的升序排列。 Descending counts:按频数的降序排列。 选择多变量输出设置“Multiple Variables ”: Compare variables 选项,所有变量在一个图形中输出,以便进行比较。 Organize output by variables 选项,为每一个变量单独输出一个图。 设置在频数表中显示的组数选中此项,输入分组数,系统缺省为 10 组。设置完成后,点击“Continue”按钮回到上一级对话框。Step6: 提交执行及分析结果输出。在图 1 对话框里单击“OK”按钮,SPSS 在输出窗口的输出结果。要求:输出频数分析结果,并给出较详细的统计解释。课外拓展:练习其他常用统计图的画法。25实验六 相关性分析一、实验背景。描述变量之间线性相关程度的强弱,并用适当的统计指标表示出来的过程为相关分析。可根据研究的目的不同,或变量的类型不同,采用不同的相关分析方法。为了能够更加准确地描述变量之间的线性相关程度,可以通过计算相关系数来进行相关分析。相关系数是衡量变量间相关程度的一个量值。在统计学中常用样本相关系数估计总体相关系数。二、实验目的。(1)学会简单相关系数的计算;(2)学会画数据散点图;三、实验要求及步骤。实验 1 二元定距变量的相关分析。某班级学生数学和化学的期末考试成绩如表 6-1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论