已阅读5页,还剩24页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
抽样调查实验指导书李浩 编浙江万里学院计算机与信息学院2010年6月说 明1、本指导书共设置六个实验,为抽样调查实验课专用。 2、学生比须按照要求在实验课时间内,独立完成每个实验。 3、每个实验最后都有相应的课外拓展,学生可适量练自学。 4、每个实验都要求上交电子版实验报告。* 实验报告要求:(1)写出具体的实验步骤;(2)出现的问题及解决方法;(3)一些必要的过程贴图、文字说明、统计表输出内容;(4)应实验要求回答相关问题。目 录实验一 SPSS的安装与初步使用4实验二 简单随机抽样7实验三 数据的整理与预处理10实验四 均值分析与单样本T检验15实验五 频数分析与统计图20实验六 相关性分析24实验一 SPSS的安装与初步使用一、 实验目的。学会SPSS13.0 for Windows软件的下载与安装,熟悉软件的操作界面,并通过实例掌握SPSS一些初步的功能。二、 实验仪器安装有Windows XP及以上系统的微机一台,并安装有office 办公软件。三、 实验要求。(1)熟悉SPSS安装步骤。(2)熟悉SPSS操作界面,包括数据编辑器、语法编辑器、输出查看器、草稿输出器、脚本输出器等;(3)通过几个实例熟悉SPSS的一些基本的统计功能。四、实验内容。实验1 SPSS 13.0 的安装:双击,显示以下界面,下一步,选择安装路径,完成安装。实验2 几个基本的统计功能实现:(i) 参数估计:测得在条件一致的8个小区种植的某小麦良种的千粒重(g)分别为:35.6、37.6、33.4、35.1、32.7、36.8、35.9、34.6,使用SPSS估计其均值与方差。Step1:进SPSS系统,建立或读入数据文件,定义变量X,标号“千粒重”,其他默认;Step2:单击“Analyse”菜单,选择“Descriptive Statistics”中的“Explore”过程,打开对话框,选择“千粒重X”为分析变量,显示框选择显示“Statistics”,按下“Statistics”按钮,只选择“Descriptive”中的置信区间选95%,返回后单击“OK”。要求:求出8个小区的均值;均值95%的置信区间;方差;极差。 (ii) Means过程某医师测得血红蛋白值(g%)如表3.1,试利用Means过程作基本的描述性统计分析。对象编号性别年龄血红蛋白值对象编号性别年龄血红蛋白值1234567891011121314151617181920女男女女男男女男女女男男男女女女男男女男181618171618161818171818161717171716161812.8315.5012.2510.0610.889.658.3611.668.547.7813.6610.5712.569.878.9911.3514.5612.408.0514.032122232425262728293031323334353637383940女男男女女女女男男男男女女女男男男男女男161618181718171616181616181818181717161611.3612.7815.098.678.5612.5611.5614.677.8812.3513.659.8710.0912.5516.0413.7811.6710.988.7811.35Step1:建立数据文件。定义4个变量:ID、Gender、Age和HB,分别表示编号、性别、年龄和血红蛋白值。Step2: 选择菜单“AnalyzeCompare MeansMeans”,弹出“Means”对话框。在对话框左侧的变量列表中,选择变量“血红蛋白值”进入“Dependent List”列表框,选择变量“性别”进入“Independent List”,单击“Next”按钮,选择变量“年龄”进入“Independent List”。Step3:单击“Options”按钮,在弹出的“选择描述统计量”对话框中设置输出的描述统计量。Step4:单击“OK”按钮,得到输出结果。要求:求出18岁男士的血红蛋白均值;所有女士的血红蛋白均值;所有16岁人士的血红蛋白均值。(iii)回归分析:某水稻品种在5月5日至8月5日(每隔10天播一期),测定播种至齐穗的天数x和播种至齐穗的总积温y(单位:d)的数据见下表,试使用线性回归确定y与x的关系式。x70 67 55 52 51 52 51 60 64y1616.3 1610.9 1440.0 1440.7 1423.3 1471.3 1421.8 1547.1 1533.0Step1:建立数据文件,定义变量,输入数据。Step2:菜单“AnalyzeRegressionLinear”,弹出“Linear”对话框。Step3:选y为因变量,x为自变量。Step4:单击“Statistics”按钮,选择“Estimates”、“Confidence Interval”、“Covariance Matrix”、“Model Fit”、“R Squared Change”、“Durbin Watson”,其他默认。可得回归模型分析表。 要求:写出x与y的回归方程;两个变量之间的相关系数。课外拓展:想办法利用SPSS作出(iii)中的数据线性回归图。实验二 简单随机抽样一、 实验背景。简单随机抽样(simple random sampling, SRS)是最简单的概率的抽样方法,也是其他抽样方法的基础。这样抽取的样本称为简单随机样本,在此方法下总体中的每一个体被抽到的概率完全相同。简单随机抽样是最为常用的方法,也最能体现抽样统计的思想。二、设备要求。 PC一台,安装软件有Excel 2003以上版本和SPSS 10.0以上版本。三、实验目的。(1) 学会建立简单的电子抽样框;(2) 在Excel中,通过随机函数或随机数发生器产生随机数实现简单随机抽样;(3) 利用SPSS软件实现简单随机抽样,并进行初步的数据分析。四、 实验要求。实验1 在EXCEL中,采用RAND函数随机抽样本班中的8个同学的学号,并调查抽到的同学的身高数据,同时录入保存。实验2 某电视台举行幸运观众抽奖,需要从编号为000001到999999的热心观众中随机抽取20位幸运观众赠送礼品,采用RANDBETWEEN函数随机选出幸运观众的号码,并对号码排序。实验3 某中学为了调查全校2818名同学身体素质的基本状况,现利用SPSS软件简单随机抽取300个样本进行调查(参照课本68页)。五、 友情提示。1. RAND函数的一个例子: (1)RAND返回一个01的均匀分布随机数,若要生成a与b之间的随机实数。可使用公式RAND*(b-a)+a;(图1.1) 图1.1(2)鼠标拖拽自动填充单元格,完成20个样本抽样(图1.2左)。抽样取得后(有重或缺勤),只要按F9(或重新打开文件),就会得到一组新的抽样。点击工具栏取得整数抽样(图1.2右)。 图1.2(3)保存随机数。选中随机抽样数据,右击-复制,再次右击-选择性粘贴,弹出对话框中粘贴选项选择数值,运算选项选择无,确定即可。至此公式转化为常数,不再变化。图1.32RANDBETWEEN(a, b)函数返回ab之间的随机数。如果函数不能用,并返回错误值#NAME?,请通过工具-加载宏,安装并加载“分析工具库”加载宏(图1.4)。 图1.4(1) 设置数字类型。右击菜单-设置单元格格式-数字-自定义-类型“000000”(2) 输入随机函数“=RANDBETWEEN(0,999999)”,自动填充20个单元格。(3) 固定抽取结果。选择数据区域,右击-复制-单击工具栏粘贴按钮下拉菜单-值。(4) 结果排序。数据-排序-主要关键字“观众编号”-升序-确定。要求:比较两个函数的优劣。课外拓展:使用Excel产生随机数据,还有其他那些方法?实验三 数据的整理与预处理一、实验目的。(1)熟悉SPSS数据编辑框,会定义和设置变量,会输入数据;(2)会对数据进行排序、筛选、转置等预处理;(3)会通过计算定义新变量。二、 实验要求及步骤。实验1 用SPSS输入数据表2-3 需要录入的数据 编号班级性别考试成绩1108521190320874216953078631937408384191Step1:在变量表第一列中依次输入“编号”“班级”等四个变量名, SPSS会自动为这些变量的其他属性赋予系统默认值。Step2:可以进行必要的修改,例如把小数位设为0。也可以为变量加上标签,以对变量的含义进行更详细的说明。在输出结果中可以让SPSS输出变量的标签。 以“班级”这个变量为例加以说明(图1)。单击“班级”变量的“Values”单元格的右侧,会弹出一个“数值标签”(Value Labels)的对话框。在定义标签对话框的中有三个小矩形框。在第一个矩形框中输入变量值1,在第二个矩形框中输入“统计”,这时“Add”按钮变亮,点击Add按钮,下面的清单中显示1=“统计”。按照这种方法继续定义2=“经济”,3=“金融”,4=“会计”。 变量定义好以后,就可以在数据表中依次输入数据了。对于定义了数值标签的变量,单击工具栏中的按钮可以显示数值标签,再单击一下则可以显示数值。图1在SPSS中定义数值标签要求:输出带标签的数据表。实验2用SPSS进行数据的排序 Step1:用鼠标选择“Data - Sort Cases”,会弹出以下对话框(图2)。选中“考试成绩”,单击中间的黑三角,把这个变量移至右面的矩形框中(这个过程也可以通过双击“考试成绩”完成)。再选择排序方式(升序或降序),点击“OK”就可以了。 图2对数据进行排序的对话框要求:输出排序后的数据。实验3用SPSS进行数据筛选在数据分析中我们常常需要对数据的一个子集进行分析。这时需要首先从数据集中筛选出符合条件的数据。 筛选出成绩在85分以上的女生进行分析。Step1:选择Data Select Cases,进入Select Cases 对话框(图3)。图3 用SPSS筛选数据的对话框Step2:选择If condition is satisfied,然后单击If按钮进入If 对话框(图4),在该对话框中的条件表达式栏中输入“考试成绩85 & 性别=1”的条件表达式,单击Continue 按钮,在Select Cases 对话框中单击OK 按钮。筛选的结果中,未被选中的观测的行号被打上了反斜杠(注意SPSS自动生成一个了筛选变量)。这样,在随后的分析中就会只对选中的观测进行分析了。如果想再次选中全部观测,再次打开图2-13的对话框,选择“All cases”就可以了。 Step3:在图3的对话框中如果把“Unselected cases are ”的选项改为“Deleted”,SPSS会删除未被选中的观测,但删除的观测是无法恢复的。SPSS还可以用其他方法筛选数据,例如从数据集中按一定比例随机选择数据,选一定区域的数据等。图4 SPSS中定义筛选条件的对话框要求:输出筛选后的数据表。实验4 使用SPSS对考试成绩的数据进行重新编码Transform菜单中的Recode命令也经常用到。这个命令可以对已有的数据进行重新编码。把百分制的成绩换算为九级制的成绩(0-59=1,F;60-64=2,D;65-69=3,D+;70-74=4,C;75-79=5,C+;80-84=6,B;85-89=7,B+;90-74=8,A;95-99=9,A+)。Step1:单击Transform-Recode-into different variables,会得到图6的对话框。把左侧考试成绩变量选入中间的矩形框,在右侧的矩形框中输入变量名“九级制”,单击下面的“Change”,这时中间的矩形框中会出现以下对应关系:考试成绩九级制。图6对数据重新编码的对话框Step2:接下来单击“Old and News Values”按钮,会弹出图7的对话框。我们可以用这个对话框来定义新旧数值的对应关系。在Old Value栏中首先选择“Range: Lowest through”的选项,在矩形框中输入59,在New Value中输入1。这时Add按钮变亮,单击这个按钮,在右下方的矩形框中出现了Lowest through 59 -1的对应关系。接下来在左侧选择并输入区间60 through64,在右侧输入新变量值2,依次类推。最后一个区间可以输入为 95 through Highest。定义好这些对应关系以后,单击Continue,再单击图2-17中的“OK”按钮,就可以完成重新编码的过程了。图7 定义新旧数值的对应关系Step3:用前面讲过的方法为新变量“九级制”加上数值标签:1=“F”,2=“D”, ,9=“A+”。整个重新编码过程就完成了。 要求:输出重新计算的变量输出图。课外拓展:自学数据文件的合并、拆分、转置等操作。实验四 均值分析与单样本T检验一、 实验背景。在统计学中,我们往往从样本的特性推知随机变量总体的特性。但由于总体中个体之间存在差异,样本的统计量和总体的参数之间往往会有误差。因此,均值不相等的样本未必来自不同分布的总体,而均值相等的样本未必来自有相同分布的总体。也就是说,如何从样本均值的差异推知总体的差异,这就是均值比较的内容。SPSS提供了均值比较过程,在主菜单栏单击“Analyze”菜单下“Compare Means”项,该项下有5个过程,如图1。图1 “Compare Means”项二、实验目的。(1)掌握SPSS中的Means过程;(2)掌握SPSS中的One-Sample T Test过程;(3)会解释均值分析与检验结果。三、实验要求及步骤。实验1 调查了棉铃虫百株卵量在暴雨前后的数量变化,统计暴雨前和暴雨后的统计量。其数据如下:暴雨前 110 115 133 133 128 108 110 110 140 104 160 120 120 暴雨后 90 116 101 131 110 88 92 104 126 86 114 88 112Step1:定义变量,输入并保存数据。Step2:启动分析过程。在SPSS主菜单中依次选择“AnalyzeCompare MeansMeans”。出现对话框如图2。Step3:设置分析变量。从左边的变量列表中选中“百株卵量”变量后,点击变量选择右拉按钮,该变量就进入到因子变量列表“Dependent List:”框里,用户可以从左边变量列表里选择一个或多个变量进行统计。多个分组变量既可放在一层,又可放在不同层。利用图中的“Previous”和“Next”按钮可以在不同层之间切换。 图2 Means对话框Step4:选择输出统计量。单击“Options”按钮,将打开如下图所示的对话框。在“Options”对话框中,“Statistics”框中列出了SPSS可求的统计量。图3 Means选项其中各项的意义分别为:1. Mean 均值。 2. Number of Cases 观测量数目 3. Standard Deviation 标准差 4. Median 中位数。 5. Grouped Median 分组的中位数 6. Std. Error of Mean 均值的标准误 7. Sum 观测值之和 8. Minimum 最小值 9. Maximum 最大值 1. Range 极差 2. First 第一个观测值 3. Last 最后一个观测值 4. Variance 方差 5. Kurtosis 峰度 6. Std. Error of Kurtosis 峰度的标准误 7. Skewness 偏度 8. Std. Error of Skewness 偏度的标准误 其中,“Mean”、“Number of Cases”和“Standard Deviation”项为系统的默认选项。在“Cell”框中列出了已选中的统计量。从“Statistics”框中选择要生成的统计量。 “Statistics for First Layer”框中列出了第一层分组的另外两个统计量。“Anova table and eta”选中将给出方差分析表和eta统计量。方差分析表的前提条件是按照分组变量分组后各组的均值都相等。eta统计量为分组变量与生成统计量的变量关系紧密程度的度量。“Test for Iinearity”选中给出分析变量和分组变量的线性关系参数,其前提条件为:分组变量和分析变量线性相关。本例子选定统计量为“Mean”、“Number of Cases”、“Standard Deviation”3个统计变量。选中复选项“Anova table and eta”。 Step5: 提交执行及分析结果输出。在图2 对话框里单击“OK”按钮,SPSS在输出窗口的输出结果。要求:输出描述性统计分析表和方差分析表,并给出降雨是否影响卵量的回答。实验2 如果已知总体均数,进行样本均数与总体均数之间的差异显著性检验属于单一样本的T检验。在SPSS中,单一样本的T检验由“One-Sample T Test”过程来完成。有一种新型农药防治柑桔红蜘蛛,进行了9个小区的实验,其防治效果为:95%,92%,88%,92%,93%,95%,89%,98%,92%与原用农药的防治效果90%比较,分析其效果是否高于原用农药。Step1:准备分析数据。在数据编辑窗口输入分析的数据,如图4所示。图4 数据窗口Step2: 启动分析过程在SPSS主菜单选中“AnalyzeCompare MeansOne-Sample T Test”,打开单一样本T检验主对话框,如图5。图5 单一样本T检验变量选择窗Step3:设置分析变量。设置检验变量: 从左边的变量列表中选中“防治效果”变量后,点击中部的右拉按钮后,这个变量就进入到检验分析“Test Variable(s):”框里,用户可以从左边变量列表里选择一个或多个变量进行分析。输入检验值: 在“Test Variable(s)”输入栏里,输入用于比较检验的均值:在本例中为90。Step4:设置其他参数。单击“Options”按钮,打开设置检验的置信度和缺失值对话框。图6 选项对话框在“Confidence Interval:”框输入置信度水平,系统默认为95%。在“Missing Values”栏里选择缺失值处理方式:Step5:提交执行。输入完成后,在图5过程主窗口中单击“OK”按钮,SPSS输出分析结果。要求:输出单一样本的统计量列表和均值检验结果,并给出较详细的统计解释。课外拓展:如何实现独立样本的T检验?实验五 频数分析与统计图一、 实验背景。频数分布分析主要通过频数分布表、条形图和直方图,以及集中趋势和离散趋势的各种统计量来描述数据的分布特征。二、实验目的。(1)学会简单的频数分析操作;(2)会输出简单的统计图形;(3)会解释频数分析结果。三、实验要求及步骤。根据提供数据,分析三化螟蚁螟虫口频数分布。Step1:读入数据文件:虫口.sav。Step2:在主菜单栏单击“Analyze”,在出现的下拉菜单里移动鼠标至“Descriptive Statistics”项上,在出现的次菜单里单击“Frequencies”项,打开如图1所示的对话框。图1 频数分析对话框 Step3: 设置分析变量。单击“Statistics”按钮,打开图2所示的对话框,该对话框用于选择统计量:图2 统计量设置 选择百分位显示“Percentiles Values”栏:Quartiles:四分位数,显示25%、50%和75%的百分位数。 Cut points for 10 equal groups:将数据平分为输入的10个等份。 Percentile(s)::用户自定义百分位数,输入值0100之间。选中此项后,可以利用“Add”、“Change”和“Remove”按钮设置多个百分位数。 选择变异程度的统计量“Dispersion”:(离散趋势)Std.deviation 标准差 Minimum 最小值 Variance 方差 Maximum 最大值 Range 极差 S.E.mean 均值标准误 选择表示数据中心位置的统计量“Central Tendency”:(集中趋势)Mean 均值 Median 中位数 Mode 众数 Sum 算术和 选择分布指标“Distribution”: Skewness 偏度 Kurtosis 峰度Step4: 设置统计图形输出。单击“Charts”按钮,将弹出如图3所示的对话框:图3 “Charts”对话框 Chart Type 图形选择栏: None: 不输出图形; Bar charts: 输出条形图; Pie charts: 输出饼图; Histograms: 输出柱状图。若选中“With normal curve”项,则在绘制柱状图中加绘一条正态分布曲线。 当用户选中条形图或饼图时,在“Chart Values”框的选项中可选择: Frequencies:绘制频数图。 Percentages:绘制频率图。Step5: 设置频数表格式。在图1对话框中,单击“Format”按钮,打开如图4所示的对话框:图4 “Format”对话框 设置排序的方法“Order by”: Ascending values:按变量值的升序排列。 Descending valus:按变量值的降序排列。 Ascending counts:按频数的升序排列。 Descending counts:按频数的降序排列。 选择多变量输出设置“Multiple Variables ”: Compare variables 选项,所有变量在一个图形中输出,以便进行比较。 Organize output by variables选项,为每一个变量单独输出一个图。 设置在频数表中显示的组数选中此项,输入分组数,系统缺省为10组。设置完成后,点击“Continue”按钮回到上一级对话框。Step6: 提交执行及分析结果输出。在图1 对话框里单击“OK”按钮,SPSS在输出窗口的输出结果。要求:输出频数分析结果,并给出较详细的统计解释。课外拓展:练习其他常用统计图的画法。实验六 相关性分析一、 实验背景。描述变量之间线性相关程度的强弱,并用适当的统计指标表示出来的过程为相关分析。可根据研究的目的不同,或变量的类型不同,采用不同的相关分析方法。为了能够更加准确地描述变量之间的线性相关程度,可以通过计算相关系数来进行相关分析。相关系数是衡量变量间相关程度的一个量值。在统计学中常用样本相关系数估计总体相关系数。二、实验目的。(1)学会简单相关系数的计算;(2)学会画数据散点图;三、实验要求及步骤。实验
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年中考数学复习热搜题之图形的对称
- 医学生基础医学 产褥感染防控护理课件
- 医学生基础医学 腹腔引流护理课件
- 2026外研版高考英语复习讲义 选择性必修第四册 Unit 3 The world meets China
- 医学女性高血压昼夜节律管理案例教学课件
- 2026冀教版八年级英语上册全册知识点
- 医学流行病学远程医疗防疫教学课件
- 医学铝尘肺流行病学防控教学课件
- 《JBT 6246-1992 实验室用震摆式筛砂仪》(2026年)实施指南
- 《JBT 6185.25-1992 16mm 槽系组合夹具支承件 双槽伸长板》(2026年)实施指南
- 2025浙江杭州市拱墅区小河街道招聘编外人员3人笔试备考试题及参考答案
- 长期照护师基础知识考核试卷及答案
- 【《基于PLC控制的混料搅拌控制系统设计》10000字】
- 生理学课件第四章血液循环
- 云南动物科学真题及答案
- 企业转让协议合同范本
- 2025-2030中国啤酒行业终端动销策略优化与经销商管理模式创新研究
- 日本足球青训教学课件
- 高速公路环保知识培训课件
- 骑手安全知识培训内容课件
- 2025中国文化概论考试题库与答案
评论
0/150
提交评论