版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第九章统计9.2.1课时1频率分布直方图及其画法情境:我国是世界上严重缺水的国家之一,水资源呈现“南多北少、东多西少”的分布特点,北方城市人均水资源量远低于国际缺水警戒线.以某市为例,年降水量仅为全国平均水平的60%,城市供水高度依赖跨区域调水,水资源短缺已成为制约城市可持续发展的关键瓶颈.问题1:从地理困境到数学决策
假设你是一名政府决策人员,面对严峻的缺水形势,市政府计划推行居民生活用水定额管理:确定一个月用水量标准
a,用水量不超过
a
的部分按平价收费,超过
a
的部分按议价收费.
如果希望大部分居民的日常生活不受影响,标准
a
定多少才合理?分析1:水资源短缺的紧迫性要求我们必须节水,但节水不能以牺牲居民基本生活为代价;分析2:“大部分居民”需要用数据量化(如覆盖90%居民的用水量),这就需要我们通过统计分析,找到科学的
a
值.问题2:为了让月用水量标准
a
符合“大部分居民”(至少覆盖90%居民)的实际需求,我们可以通过什么方式进行调查?①
为了确定一个较为合理的用水标准,必须先了解在全市所有居民用户中,月用水量在不同范围内的居民所占的比例情况;②由于全市居民用户很多,通常采用抽样调查的方式,通过分析样本观测数据,来估计全市居民用户月均用水量的分布情况;③
在这个问题中,总体是该市的全体居民用户,个体是每户居民用户,调查的变量是居民用户的月均用水量.问题3:假设通过简单随机抽样,获得了该市
100
户居民用户的月均用水量数据
(单位:t)(1)从这组数据我们能发现什么信息?很难从中直接看出规律;9.013.614.95.94.07.16.45.419.42.02.28.613.85.410.24.96.814.02.010.52.15.75.116.86.011.11.311.27.74.92.310.016.712.012.47.85.213.62.622.43.67.18.825.63.218.35.12.03.012.022.210.85.52.024.39.93.65.64.47.95.124.56.47.54.720.55.515.72.65.75.56.016.02.49.53.717.03.84.12.35.37.88.14.313.36.81.37.04.91.87.128.010.213.817.910.15.54.63.221.6试着将数据从小到大进行排序;1.31.31.82.02.02.02.02.12.22.32.32.42.62.63.03.23.23.63.63.73.84.04.14.34.44.64.74.94.94.95.15.15.15.25.35.45.45.55.55.55.55.65.75.75.96.06.06.46.46.86.87.07.17.17.17.57.77.87.87.98.18.68.89.09.59.910.010.110.210.210.510.811.111.212.012.012.413.313.613.613.813.814.014.915.716.016.716.817.017.918.319.420.521.622.222.424.324.525.628.0①
排序后可以发现,这组数据的最小值是1.3t,最大值是28.0t;②
选择频率分布表和频率分布直方图,可以更清晰的反映月均用水量在不同范围内的居民用户占全市居民用户的比例;③
制作频率分布表和频率分布直方图的步骤如下:(1)求极差:极差为一组数据中最大值与最小值的差.这说明样本观测的数据变化范围是26.7t.28.0-1.3=26.7;非负数它反映了一组数据的最大幅度,对极端值敏感描述数据的离散程度极差1.31.31.82.02.02.02.02.12.22.32.32.42.62.63.03.23.23.63.63.73.84.04.14.34.44.64.74.94.94.95.15.15.15.25.35.45.45.55.55.55.55.65.75.75.96.06.06.46.46.86.87.07.17.17.17.57.77.87.87.98.18.68.89.09.59.910.010.110.210.210.510.811.111.212.012.012.413.313.613.613.813.814.014.915.716.016.716.817.017.918.319.420.521.622.222.424.324.525.628.0极差、组距、组数之间的关系:组距是指每个小组的两个端点之间的距离.组距与组数的确定没有固定的标准,数据的分组可以是等距的,也可以是不等距的,为方便起见,往往按等距分组.组数一般与数据的个数有关(样本容量):样本容量越大,分组越多;样本容量不超过100时,常分成5~12组;(2)决定组距与组数:若取组距为3,则即可将数据分为9组;由于组距为3,9个组距的长度超过极差,我们可以使第一组的左端点略小于数据中的最小值,最后一组的右端点略大于数据中的最大值;
例如:可以取区间为[1.2,28.2],按如下方式把样本数据以组距3分成9组:[1.2,4.2),[4.2,7.2),...,[25.2,28.2]通常对组内数据所在区间:左闭右开,最后一组取闭区间.(3)将数据分组:1.31.31.82.02.02.02.02.12.22.32.32.42.62.63.03.23.23.63.63.73.84.04.14.34.44.64.74.94.94.95.15.15.15.25.35.45.45.55.55.55.55.65.75.75.96.06.06.46.46.86.87.07.17.17.17.57.77.87.87.98.18.68.89.09.59.910.010.110.210.210.510.811.111.212.012.012.413.313.613.613.813.814.014.915.716.016.716.817.017.918.319.420.521.622.222.424.324.525.628.0统计频数,计算各小组的频率,作出频率分布表.(4)列频率分布表:第一组[1.2,4.2)的频数:23;1.31.31.82.02.02.02.02.12.22.32.32.42.62.63.03.23.23.63.63.73.84.04.14.34.44.64.74.94.94.95.15.15.15.25.35.45.45.55.55.55.55.65.75.75.96.06.06.46.46.86.87.07.17.17.17.57.77.87.87.98.18.68.89.09.59.910.010.110.210.210.510.811.111.212.012.012.413.313.613.613.813.814.014.915.716.016.716.817.017.918.319.420.521.622.222.424.324.525.628.0频率===0.23.频数样本容量23100分组频数频率[1.2,4.2)230.23[4.2,7.2)320.32[7.2,10.2)130.13[10.2,13.2)90.09[13.2,16.2)90.09[16.2,19.2)50.05[19.2,22.2)30.03[22.2,25.2)40.04[25.2,28.2]20.02合计1001.00(4)列频率分布表:频率/组距0.0770.1070.0430.0300.0300.0170.0100.0130.007(5)画频率分布直方图:组距×组距频率频率:小长方形的面积=
小长方形的高度;反映各组样本观测数据的疏密程度;(1)求极差:即一组数据中最大值与最小值的差;(2)决定组距与组数:(将数据分组)
组距:指每个小组的两个端点的距离;
组数:将数据分组,当数据在100个以内时,按数据多少常分5~12组.(3)将数据分组;(4)列出频率分布表;(5)画出频率分布直方图.画频率分布直方图的一般步骤问题4:观察下列频率分布表和频率分布直方图,说说数据中蕴含了哪些有用的信息?试用适当的语言描述居民用户月均用水量的分布规律.(1)从频率分布表中可以看出,样本观测数据落在各个小组的比例大小;例如,月均用水量在区间[4.2,7.2)内的居民用户最多,在区间[1.2,4.2)内的次之,而月均用水量超过16.2的各区间内数据所占比例较小,等等.(2)从频率分布直方图能直观地表明数据分布的形状和总体趋势;如图,数据的分布不对称,图形左边高、右边低,右边有一个较长的“尾巴”;这表明大部分居民用户的月均用水量
集中在一个较低值区域,尤其在
[1.2,7.2)
最为集中,
少数用户居民的月均用水量偏多,而且随着月均用
水量的增加,居民用户数呈现降低趋势.
有了样本观测数据的频率分布,我们可以用它估计总体的取值规律.
根据100户居民用户的月均用水量的频率分布,可以推测该市全体居民用户月均用水量也会有类似的分布,即大部分居民用户月均用水量集中在较低值区域.
这使我们确定用水量标准时,可以定一个合适的值,以达到既不影响大多数居民用户的水费支出,又能节水的目的.
需要注意的是,由于样本的随机性,这种估计可能会存在一定误差,但这一误差一般不会影响我们对总体分布情况的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 护理服务流程优化与医疗服务特色发展
- 浙江中考:政治重点知识点归纳
- 护理心理学与心理健康
- 第四节 二力平衡教学设计初中物理鲁科版五四学制八年级下册-鲁科版五四学制2012
- 护理伦理基础
- 2026国家纳米科学中心刘晶课题组招聘1人考试备考试题及答案解析
- 护理实践中的宗教支持
- 2026浙江杭州萧悦医院招聘笔试参考题库及答案解析
- 2026江西吉安吉州区曲濑卫生院招聘就业见习人员2人考试备考题库及答案解析
- 贵州省贵阳市2025-2026学年高一上学期12月月考语文试题(解析版)
- 2025年中煤集团笔试题目及答案
- 2024-2025学年广东省深圳市福田区统编版六年级下册期中考试语文试卷(解析版)
- 深圳高血压管理办法
- JJF(浙) 1095-2014 洛杉矶磨耗试验机校准规范
- 医疗器械检测员岗位面试问题及答案
- 小学美术教育读书分享
- 茶叶食品追溯管理制度
- 鄂尔多斯市委办公室所属事业单位引进笔试真题2024
- 非标设备装配管理制度
- 小学50米跑教育
- 《计算机基础与应用(Office和WPS Office通-用)》中职全套教学课件
评论
0/150
提交评论