数据的分析讲义_第1页
数据的分析讲义_第2页
数据的分析讲义_第3页
数据的分析讲义_第4页
数据的分析讲义_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二十章数据分析一.基本知识1.人口、个人、样本和样本容量总体:指所有调查对象个体:群体中的每个调查对象都被称为个体。样本:从人群中抽取的一些个体样本量:样本中的个体数量2.平均值和加权平均值平均值:一组数据的平均大小或集中趋势加权平均:当一组数据中的许多数据重复出现,或者每个指标在总结果中的权重不同时,用加权平均表示3.中间值和模式中位数:一组数据中从小到大(或从大到小)排列的数据(或中间两个数据的平均值)。模式:在一组数据中出现频率最高的数据。4.范围:一组数据中最大值和最小值之间的差值,反映了一组数据的变化范围。5.标准偏差和方差方差:一组数据中的数据与其平均值之间的差值的平方的平均值。反映一组数据围绕其平均值的波动。方差越小,这组数据的波动越小,越稳定。方差越大,这个数据集的波动和不稳定性就越大。标准差:方差的算术平均根,也用来描述一组数据的波动。第二,经典的例子:示例1一组数据中有3个7、4个11和3个9,那么它们的平均值是_ _ _ _ _ _。示例2如果一组数据x1、x2、x3、x4、x5的平均值是X,则另一组数据x1、X2 1、X3 2、X4 3、X5 4的平均值是示例3如果男子篮球队在10场比赛中得分为80、86、95、86、79、65、98、86、90、81,则该队在10场比赛中的得分模式为_ _ _ _ _ _ _ _,中位数为_ _ _ _ _ _ _ _。公园里有两组游客,A组和B组。两组游客的年龄如下(单位:岁):A组:13,13,14,15,15,15,16,17,17;B组:3、4、4、5、5、6、6、54、57;回答以下问题:(1)甲类游客的平均年龄为_ _ _ _ _ _ _岁,中位数为_ _ _ _ _ _ _岁,模式为_ _ _ _ _ _,其中_ _ _ _ _ _ _能较好地反映该类游客的年龄特征;(2)B组游客的平均年龄为_ _ _ _ _ _,中位数为_ _ _ _ _ _,模式为_ _ _ _ _ _,其中_ _ _ _ _ _能较好地反映该组游客的年龄特征。例5一所学校的九年级举行了一次数学考试。为了估计平均分数,选择了619份试卷中的一些,结果如下:1名学生得100分,2名学生得90分,12名学生得85分,8名学生得80分,10名学生得75分,5名学生得70分。(1)计算样本的平均值、中值和模式数;(2)估算平均评分点。示例6样本平均值20.1、20.2、19.7、20.2、19.8=_ _ _ _ _ _,方差S2=_ _ _ _ _ _。示例7一家工厂共有50名员工,他们的月工资差异为2。现在每个员工的月薪加200元,然后他们的新的工资差额()。(a)成为S2 200 (b)不变(c)较大(d)较小例8A组和B组各有10名学生参加了五次英语口语会话测试。每个学生通过测试的次数如下:甲组:4 1 2 2 1 3 1 2 1;B组:4 3 0 2 1 3 0 1 3。(1)如果通过3次以上(含3次)的考试为及格标准,请指出哪一组的及格率最高。(2)请比较两组之间合格口语对话的数量,谁更稳定。例9小方连续五天测量最低温度,并整理出下表:日期,一个二三四五变化空气平均温度最低气温132531.由于4号的墨迹和方差,这两个数据分别是和。2.如果数据a、c、b、c、d、b、c、a和a b c d是已知的,则该数据集的模式为_ _ _ _ _ _,中间值为_ _ _ _ _ _。3.在数据-1,0,4,5,8中插入一个数字x,使这组数据的中位数为3,然后x=例10如今,青少年视力水平的下降引起了全社会的关注。为了了解某市3万名学生的视力状况,对部分学生进行了抽样调查。使用获得的数据绘制的频率分布直方图如下:回答以下问题:(1)本次抽样调查共抽取_ _ _ _ _ _名学生;(2)参加测试的学生的视觉模式在_ _ _ _ _ _以内;中位数在_ _ _ _ _ _以内。(3)如果视力在4.9及以上,估计该市视力正常的学生人数是多少?五、习题一、填空1.从一组数据中取出M x1、N x2和P x3,形成一个数据样本,该样本的平均值为_ _ _ _ _ _。2.如果数据1、x、2和5的中值是3,则x=_ _ _ _。3.一所中学举行了一次演讲比赛,参赛学生的分数按以下表格分段计算(分数为整数,满分为100分)。分数段60x7070x8080x9090x (b) (c)=(d)不确定性12.已知一组数据5、15、75、45、25、75、45、35、45、35。那么40是()a,平均值,但不是中位数b,平均值也是中位数c,模式d,中间值,但不是平均值13.样本中方差计算公式=(x-20)。(x-20),10和20表示()a,容量,方差b,平均值,容量c,容量,平均值d,标准偏差,平均值14.一个6口之家向汶川灾区捐款的金额如下:(单位:元)200,170,150,170,30,120。请问这些数据的平均值和模式是()140和160b,140和170c 170和170d 170和16015.在共有15人参加的“我爱我的国家”演讲比赛中,如果参赛者想知道他们是否能进入前8名,他们只需要知道自己的成绩和分数()a,中间值b,模式c,平均值d,方差16.假设一组数据的平均值为2。方差是另一组数据的平均值和方差a、2、B、2、1 C、4、D、4、317.在自然数4,5,5之后,x,y从小到大排列,其中位数是4。如果这组数据的唯一模式是5,那么x y的最大值是()甲、3乙、4丙、5丁、6三。回答问题18.一个农民在山上种了44棵脐橙树,现在已经是第三年收获了。在收获季节,他会随意从5棵果树上摘脐橙。每棵树上脐橙的重量如下(公斤):35,35

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论