《市场调查与预测》实验指导.doc_第1页
《市场调查与预测》实验指导.doc_第2页
《市场调查与预测》实验指导.doc_第3页
《市场调查与预测》实验指导.doc_第4页
《市场调查与预测》实验指导.doc_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

实验二:调查数据处理之一:统计分组目的原理:通过Excel“数据分析”中“直方图”功能对原始调查数据进行统计分组、编制分布数列、计算向上累计和向下累计、绘制累计分布图。实验对象与用品Excel2003完全安装版方法步骤该实验用一个实例来进行说明具体操作步骤:【例2-1】:某地区进行农产量抽样调查,抽取50个单位构成样本。样本资料如下:表2-1亩产量数据单位:公斤240440400375500528412425320400520600485600588412444430342364450455465500580345340320300403445360517390410360422428520400425385440380548304448605325500要求:(1)编制次数分布数列(组距为100,进行等距分组),并绘制次数分布图;(2)分别向上累计和向下累计并绘制累计分布图。主要步骤如下:1、 输入数据。如图2-2所示,A列输入亩产量,A1为列标志“亩产量”,C列为分组标志,B2:B7为分组组限,B1为列标志“组限”。(在EXCEL中要使一行数据方便的放在一列的时候,可以适用“转置”功能,方法是:选中一行数据复制粘贴复制(在同一个工作薄中可省略)选择性粘贴(鼠标右键)转置)在确定组限时,需要注意:(1) 组限指的是某一组的上限,如299.9是300以下(也即200-300)这一组的上限,399.9是300-400这一组的上限。(2) 对未排序的亩产量数据,可先用MAX与MIN函数确定亩产量的最大与最小值,以方便确定组限。(3) 直方图工具分组时采用的是“上限在内”原则,为符合统计分组的“上限不在内”原的则,每个组限均不应与亩产量相同。如本例中组限399.9表示将统计出亩产量大于299.9而小于等于399.9的数据点个数,如果亩产量中有399.9这个数,则可将300-400这一组的上限上为399.99。2、 调出直方图对话框,其主要选项的含义如下。3、 从菜单栏“工具数据分析”路径打开“数据分析”对话框,选择“直方图”分析工具。(如果没有“数据分析”选项,则需要执行“工具加载宏”,从“加载宏”对话框中选择“分析工具库”,点击确定后再执行“工具数据分析”路径打开“数据分析”对话框,选择“直方图”分析工具。)输入区域:在此输入待分析数据区域的单元格范围。本例输入区域为“$A$1:$A$51”。接收区域(可选):在此输入接收区域的单元格范围,该区域应包含一组可选的用来计算频数的边界值。这些值应当按升序排列。只要存在的话,Excel将统计在当前边界点和相邻的高值边界点之间的数据点个数。如果某个数值等于或小于某个边界值,则该值将被归到以该边界值为上限的区间中(注意:与统计分组“上限不在内”原则有所区别)。如果省略此处的接收区域,Excel将在数据组的最小值和最大值之间创建一组平滑分布的接收区间。本例接收区域为“$B$1:$B$6”。图2-1标志:如果输入区域的第一行或第一列中包含标志项,则选中此复选框;如果输入区域没有标志项,则清除此该复选框,Excel将在输出表中生成适宜的数据标志。柏拉图:选中此复选框,可以在输出表中同时显示按降序排列频率数据。如果此复选框被清除,Excel将只按升序来排列数据。累积百分比:选中此复选框,可以在输出结果中添加一列累积百分比数值,并同时在直方图表中添加累积百分比折线。如果清除此选项,则会省略以上结果。图表输出:选中此复选框,可以在输出表中同时生成一个嵌入式直方图表。本例直方图对话框的填写如图2-1所示。4、 单击确定按钮即可。完整的结果通常包括三列和一个频率分布图,第一列是数值的区间范围,第二列是数值分布的频数,第三列是频数分布的累积百分比。在输出的结果中,“频率”指的是统计中所指的“频数”,“累积%”指的是“向上累计频率”。结果中原本还有一“其它”行的数据,该行是亩产量大于699.9的频数与累计频率(位于单元格区域D7:F7),因本例中没有大于699.9的数据,所以可将该行删除,即选定D7:F7,然后执行菜单命令编辑删除命令。由于该工具总会自动统计出大于最大组限的数据的频数,所以本例中组限也可以不使用699.9,即在第2步中接收区域为“$B$1:$B$6”,在输出的结果中,将“其它”更改为我们所需要的标志性文字,如改为“699.9”。经过修改的结果如图2-2所示。图2-25、 绘制次数分布图(1) 选中频数这一列数据,如(1,15,21,10,3),选择工具栏的 插入图表折线图(图表类型)下一步完成。(2) 在图表的空白处点击鼠标右键选择“源数据”选项,点“分类(x)轴标志”选择“组限”那一列数据,如(299.9,399.9699.9)确定。(3) 结果如下图所示:6、 计算向下累计频率。在G1单元格输入列标志“向下累计”。在G6单元格输入“=E6/SUM($E$2:$E$6)”,计算出最后一组的频率,在G5单元格中输入“=E5/SUM($E$2:$E$6)+G6”得到最后一组和倒数第二组的累计频率,将G5单元格的公式复制到G2:G4,计算出向下累计这一列。7、 在图表中加入向下累计曲线。选定图表区,敲鼠标右键,选择【源数据】,调出源数据对话框。在源数据对话框的系列页框中,单击添加按钮,输入所添加系列的名称与值。要输入系列名称,请单击名称文本框,再用鼠标单击工作表中的G1单元格,此时名称文本框显示“=分布数列!$G$1”(“分布数列”为工作表标签名);要输入系列值,请单击值文本框,再用鼠标在工作表上选定G2:G6单元格,此时值文本框中显示“=分布数列!$G$2:$G$6”。最后单击确定按钮,结果见图2-3。图2-3此时“向上累计”曲线在图表中消失,应对图表进行适当修改。1) 点击图中黄色部分(即“向下累计”图表域),点击鼠标右键,选择“数据系列格式”,选“坐标轴”选项卡,选择“系列绘制在”选项的“次坐标轴(s)”选项。结果如图2-4所示:图2-42) 点击图中黄色部分(即“向下累计”图表域),点击鼠标右键,选择“图表类型”,在“图表类型”中选“折线图”选项卡。结果如图2-5所示:图2-5注意事项1、 在从菜单栏“工具数据分析”路径打开“数据分析”对话框时,如果没有“数据分析”选项,则需要执行“工具加载宏”,从“加载宏”对话框中选择“分析工具库”,点击确定后再执行“工具数据分析”路径打开“数据分析”对话框,选择“直方图”分析工具。2、 如果不能执行“加载宏”选项则需要卸掉Office2003,重新安装Office2003,选择完全安装就可以执行“数据分析”功能了。要求与思考1、 能够调用Excel2003“数据分析功能”。2、 能够在Excel2003中编辑公式,并对公式进行复制。10实验三:调查数据处理之二:统计描述目的原理:通过Excel“数据分析”中“统计描述”功能对原始调查数据进行集中趋势分析和离中趋势分析。实验对象与用品Excel2003完全安装版方法步骤该实验用一个实例来进行说明具体操作步骤:常用的描述统计量有众数、中位数、算术平均数、调和平均数、几何平均数、极差、四分位差、标准差、方差、标准差系数等。一般来说,在Excel中求这些统计量,可用函数计算和描述统计计算。【例3-1】:为了解某经济学院新毕业大学生的工资情况,随机抽取30人,月工资如下:1560134016001410159014101610157017101550149016901380168014701530156012501560135015601510155014601550157019801610151014401. 试分别用函数和“数据分析”工具求该题的各项描述统计量。2. 计算在概率95%保证下,该经济学院新毕业大学生平均工资分布的置信区间。一、 用函数计算描述统计量(一)众数用函数方法求众数,应先将30个人的工资数据输入A1:A30单元格,然后单击任一空单元格,输入“=MODE(A1:A30)”,回车后即可得众数为1560。(二)中位数仍采用上面的例子,单击任一空单元格,输入“=MEDIAN(A1:A30)”,回车后得中位数为1550。(三)算术平均数单击任一单元格,输入“=AVERAGE(A1:A30)”,回车后得算术平均数为1535。(四)标准差单击任一单元格,输入“=STDEV(A1:A30)”,回车后得标准差为135.0287。一个一个统计量分别计算,显得比较麻烦。有没有一个方便的方法,可以一次性求出所有指标值?通过Excel“数据分析”功能的“描述统计”工具可以满足以上要求。二、 描述统计工具的使用仍使用上面的例子,我们已经把数据输入到A1:A30单元格,然后按以下步骤操作:1、 在工具菜单中选择“数据分析”选项,从其对话框中选择“描述统计”,按确定后打开“描述统计”对话框,如图3-1所示:图3-12、 在输入区域中输入$A$1:$A$30,在输出区域中选择$C$1,其他复选框可根据需要选定,选择汇总统计,可给出一系列描述统计量;选择平均数置信度,会给出用样本平均数估计总体平均数的置信区间;第K大值和第K小值会给出样本中第K个大值和第K个小值。3、 单击确定,可得输出结果,如图3-2所示:图3-2上面的结果中,平均指样本均值;标准误差指样本平均数的标准差;中值即中位数;模式指众数;标准偏差指样本标准差,自由度为n-1;峰值即峰度系数;偏斜度即偏度系数;区域实际上是极差,或全距。三、 计算平均数置信区间1、 分析:要进行平均数区间估计,需要计算出样本平均数,然后根据平均数区间估计公式:置信上限=样本平均+极限误差,置信下限=样本平均-极限误差,计算置信区间。在描述统计结果中,已直接求出样本平均值“平均”,而“置信度(95.0%),50.42058”就是样本平均数的极限误差。2、 编辑公式求置信区间注意事项1、 在从菜单栏“工具数据分析”路径打开

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论