版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第一章统订自我校准阶层取样系统取样扇形统一校正图茎叶图频率分布直方图频率折线图最小二乘法线性回归式抽样方法的选择和应用1 .在执行系统采样之前,需要满足总容量除以采样容量。 如果不能整除,则用简单随机抽样的方法从整体中去除一部分个体,其中去除的个体数是整体个体数除以样本容量的馀数2 .在进行阶层取样的情况下,在各层提取的个数应该以各层的个数占全体的比例进行提取,取样比=。在实际操作中,必须首先校正采样比=,然后按照采样比决定需要按各层提取的个体数:该层的个体数(1)在下列问题中,可以分别用什么方法抽取样品?a .从20台液晶电视中抽出4台进行检查b .某校有300名教职员,其中教师210人,行
2、政人员35人,办公服务人员55人,为了了解教职员对学校工作的满意度,有必要抽取容量为60的样本c .从800辆车中抽出8辆进行检查(2)汽车厂生产a、b、c三种轿车,各种轿车有舒适型和标准型两种型号,某月产量(单位:台)如下表所示轿车a小轿车b轿车c舒适型100150z标准型300450600按级别分层抽样的方法从本月生产的轿车中抽出50辆,其中a级轿车有10辆求z的值用分层取样的方法从c级轿车中提取容量为5的样品(1)研究整体修正问题的基本想法是从整体中提取样本,用样本估计整体,所以选择适当的采样方法提取代表性的样本对整体修正问题起到了重要的作用(2)一般来说,在整体中个体多的情况下,多采用
3、系统的采样,在整体由明显的差异的几个部分构成的情况下,多采用分层的采样(1)a只要通过简单的随机采样提取样本即可b用分层抽样的方法抽样,不同职位的人的满意度不同c因为样品容量大,所以适合系统取样(2)设该工厂本月生产的轿车为n辆,标题为=,n=2 000,z=2 000-100-300-150-450-600=400。假设提取的样品中有m台舒适型轿车,采用分层采样的方法从c级轿车中提取出1台容量为5的样品,所以从=、m=2,即c级轿车中提取出2台舒适型轿车、3台标准型轿车。再练习一次1 .一所高级中学有学生270人,其中一年级学生108人,二、三年级学生各81人.现参加抽样方法抽10人的调查,
4、考虑选择简单随机抽样、分层抽样和系统抽样3种方案使用分层抽样时,使用将学生按1、2、3年级的顺序统一的系统抽样时,将学生统一为随机编号1、2、270,将整个编号按顺序分为10段。 查号码有以下四种情况7、34、61、88、115、142、169、196、223、250;5、9、100、107、111、121、180、195、200、265;11、38、65、92、119、146、173、200、227、254;20、57、84、111、138、165、192、219、246、270。关于上述样品的以下结论中,正确的是()A.不能同时进行系统的取样B.均不能进行分层取样C.均可进行系统采样D.均
5、可分层取样【解析】在分层抽样的情况下,一年级抽取108=4(人),二年级、三年级分别抽取81=3(人),在编号段1、2、108中抽取4个编号,在编号段109、108中按系统进行抽样的情况下抽取【回答】d用样品的频率分布推断整体分布1 .制作频率分布直方图时应注意的5个问题:(1)为了修正全距离,需要找到该组数的最大值和最小值。 如果数据很多,请选择一个数字进行参照(2)为了描述数据的分布规则,对数据批次进行分组,并且根据数据量来确定数据包的数量。(3)在对数据进行分组并确定点时,通常使点比数据多1位小数,而且使第1组的起点比最小值稍小(4)在制作频度分布直方图的情况下,纵轴表示频度与组距离之比
6、,不一定能够标记频度.2 .在频率分布的直方图中,纵轴的意思是频率比组距离有1个容量100个样本,数据的分组和各组的度数如下所示12.5、15.5 )、6; 15.5、18.5 )、16; 18.5、21.5、18; 21.5、24.5、22; 24.5、27.5 )、20; 27.5、30.5 )、10; 30.5、33.5、8。(1)样本的频率分布表(包括累计频率)(2)制作频度分布的直方图(3)推定数据不足30.5的数据占多大比例制作【高光】频度分布表的频度=、频度分布直方图,可以估计结果(1)样品的频率分布表如下所示分组度数频率累积频率12.5和15.560.060.0615.5和18
7、.5160.160.22 18.5,21.5 180.180.4021.5、24.5220.220.6224.5和27.5200.200.8227.5和30.5100.100.9230.5和33.580.081.00合订1001.00(2)频度分布的直方图如下图所示。(不足30.5的数据约占92%。再练习一次2 .有容量200个样本,数据分组和各组的频率如下-20、-15 )、7; -15、-10 )、11; -10、-5)、15; -5,0 ,40; 零、五、四十九; 五、十、四十一; 十、十五、二十; 十五、二十、十七。(1)表示样品的频度分布表(2)描绘频度分布直方图和频度分布折线图(3
8、)求出样本数据小于0的频度。(1)频度分布表如下分组度数频率-20,-1570.035-15,-10110.055-10,-5150.075-5,0 400.20,5490.245五、十410.205十、十五200.1十五、二十170.085合订2001.00(2)图为频度分布直方图和频度分布折线图(3)样本数据小于0的频率0.035 0.055 0.075 0.2=0.365。用样品的数字特征估计整体的数字特征在实际问题中,平均数不能完全反映问题,数据偏离平均数的偏差程度(即方差或标准偏差)也要考虑的标准偏差越小,表示数据的离散性越小或数据集中、稳定某厂甲、乙两厂包装同一产品,用自动包装输送
9、机每隔1小时提取一次产品,说明其重量(单位:克)是否合格,分别记录提取数据,得到重量数据茎叶图11(1)写甲的众数和乙的中值(2)根据样品数据,对甲、乙两家工厂的产品重量平均和方差进行修正,说明哪家工厂的产品重量相对稳定图11(1)从众数、中位数的概念中找出众数和中位数(2)根据平均、方差的定义及修正公式,通过比较它们的大小来分析稳定性(1)甲的最频值为111,乙的中值为113.5(2)甲、乙两家工厂的产品重量平均值分别为甲、乙、方差值分别为s、s。甲=113,零=113,s= (122-113 )2(114-113 )2(113-113 )2(111-113 )2(111-113 )s= (
10、124-113 )2(110-113 )2(112-113 )2(115-113 )2(108-113 )由于s乙,ss。应当选择乙方工人参加比赛线性回归分析解决回归分析问题的四个注意事项:(1)首先使用散布图决定是否为线性相关(2)正确计算回归式中的各系数(3)回归直线必须通过样品的中心点(4)用线性回归式求出的值是推定值,与实际值有一定的误差(5)回归直线必须通过样本的中心点,样本的数据点不一定在回归直线上众所周知,10只狗的血球体积及红血球数的测定值如下表所示血球体积机动战士gundam 00登场机体列表45424648423558403950红血球数y (百万)6.536.309.52
11、7.506.995.909.496.206.558.72(1)根据上表画散点图(2)根据散布图,判断血球体积x与红血球数y间是否存在相关关系(3)求回归式图的两个变量之间的相关关系的研究通常制作变量的散布图并且基于散布图来确定这两个变量是否具有相关关系。 如果两个变量具有线性相关关系,则代入式求回归线性方程,根据方程预测变量,分析实际问题(1)散点图如下图所示。(2)从散点图可以看出,两个变量的对应点都集中在一条直线附近,并且y随着x的增大而增大,因此血细胞体积x和红细胞数y之间存在相关关系。(3)=(45 42 46 48 42 35 58 40 39 50 )=44.50。=(6. 536
12、. 309. 527. 506. 995. 909. 496. 206. 558. 72 )=7. 37。xiyi=3 346.32,x=20 183,设回归式为y=a bx,b0.175,a=-b-0.418。回归公式是y=0.175x-0.418。再练习一次4 .某个个人服装店经营某服装,某周获得纯利润y (元),该周每天销售这种服装的件数x之间有以下数据【导学编号:】x3456789y66697381899091已知: x=280、x=45 309、xiyi=3 487。(1)求得,(2)求纯利润y和每天销售件数x之间的线性回归公式你认为每天销售10件这样的服装时的纯利润是多少?(1)从
13、已知开始=(3 4 5 6 7 8 9)=6,=(66 69 73 81 89 90 91)79.86。(2)设线性回归式为y=bx a时b=4.75,a=-b=79.86-4.756=51.36。求出的线性回归式是y=4.75x 51.36。(x=10时,y=98.86,每天销售10件这种服装预计可以获得纯利润98.86元。数形结合思想数形结合思想的应用在本章中出现的比较清楚.统一修正主要是收集数据,整理数据,进行整体的估计.把收集的数据制成表或图(如频率分布表、频率分布直方图、折线图、茎叶图、散布图),用表或图表示样本数据.根据2011年4月的生活报,某省的有关部门要求各中小学把“每天1小
14、时训练”写在课程表上。 为了响应这个呼吁,某学校说:“你最喜欢的体育活动是什么? (只写一个)”这个问题,对在校学生进行了随机抽样调查,得到了数据集.图12是根据这个数据集制作的条形图.请结合统一修正图回答以下问题图12(1)有多少学生需要校对进行抽样调查?在这次抽样调查中,有多少人最喜欢篮球活动? 占被调查者人数的比例是多少?(3)该校9年级学生有200人时,下图是根据各年级学生人数占全校学生总人数的比例绘制的扇形统一订正图13。 全校学生中最喜欢跳绳活动的人数是多少?图13好的拨号。(1)由上图可知,4 8 10 18 10=50 (名)。也就是说,这个校对50名学生进行了抽样调查。(2)在这次调查中,最喜欢篮球活动的有18人,占100%=36%。也就是说,最喜欢篮球活动的人数占被实验者的36%。(3)1-(30% 26% 24%)=20%,20020%=1 000 (人),一千=一百六十。也就是说,全校学生中最喜欢跳绳活动的人数估计约为160人再练习一次5 .某试验田分别栽培甲、乙两种水稻,为了研究这两种水稻的产量,分别提取了甲、乙两种水稻穗各000株。 根据统订,每株穗粒数的频度分布直方图如图14所示图14(1)求出乙种水稻穗的粒数
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026-2030隐形防蚊窗纱市场投资前景分析及供需格局研究研究报告
- 2025~2026学年河北省石家庄市赵县第三中学七年级上册历史期末检测试卷
- 小学生集体荣誉感培养说课稿
- 先进压缩空气储能项目风险应对方案
- 初中职业体验2025年职业认知说课稿
- 从“固定班级”到“流动课程”+课件-2025-2026学年高二上学期选课走班后的班级管理变革经验交流
- 企业文件修订与发放流程方案
- 煤矿资源整合项目环境影响报告书
- 建设单位对建筑工程分包行为的规范化管理研究
- (2026年)ICU患者谵妄的评估与治疗课件
- 物业小区消防安全隐患排查及整改措施
- 2025年一级造工程师(交通)案例分析真题及答案
- 2026年中国实体剧本杀消费洞察报告
- 食品安全检测与评估培训教材(标准版)
- 2025年度陕西延长石油(集团)有限责任公司“汇才”-管理人才储备招聘130人(春招)笔试参考题库附带答案详解
- 电力线路巡检报告模板
- DB22∕T 1056-2022 梅花鹿产品初加工技术规程
- 足球一对一防守课件教学
- 人力资源管理信息系统介绍
- 2026中国中医药服务贸易发展路径研究报告
- 多发性共患糖尿病疾病修正治疗(DMT)方案
评论
0/150
提交评论