统计与概率上课课件_第1页
统计与概率上课课件_第2页
统计与概率上课课件_第3页
统计与概率上课课件_第4页
统计与概率上课课件_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、随机抽样内容知识内容一、 简单随机抽样1. 总体、个体、样本、样本容量的概念以及统计的基本思想方法总体:所考察对象的某一数值指标的全体构成的集合看作总体个体:构成总体的每一个元素作为个体样本:从总体中抽出若干个体所组成的集合叫做样本样本容量:样本中个体的数目叫样本容量统计的基本思想方法:用样本估计总体,即通常不去直接去研究总体,而是通过从总体中随机抽取一个样本,根据样本的情况去估计总体的相应情况2. 简单随机抽样的概念:从元素个数为的总体中不放回地抽取容量为样本,如果每一次抽取时总体中的各个个体有相同的可能性被抽到,这种抽样方法叫做简单随机抽样3. 简单随机抽样的特点:(1) 被抽取样本的总体

2、的个数有限;(2) 从总体中逐个地进行抽取,使抽样便于在实践中操作;(3) 它是不放回抽样,使其具有广泛的应用性;(4) 它是等可能抽样,每个个体被抽到的可能性都是,保证了抽样方法的公平性4. 常用的简单随机抽样方法:(1) 抽签法:把总体中的个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一张号签,连续抽取次,就得到一个容量为的样本 抽签法的步骤:编号,即给总体中的所有个体编号,号码可以从到制签,即将这个号码写在形状、大小相同的号签上(号签可以用小球、卡片、纸条等制作)搅拌均匀,即将号签放在一个不透明的容器中,搅拌均匀逐个不放回抽取,即从容器中每次抽取一个号签,并

3、记录其编号,连续抽取次 抽签法的优缺点:优点:简单易行缺点:当总体的容量非常大时,费时、费力又不方便况且,如果号签搅拌的不均匀,可能导致抽样的不公平(2) 随机数表法:随机数表是由这个数字组成的数表,并且表中的每一位置出现各个数字的可能性相同通过,随机数表,根据实际需要和方便使用的原则,将几个数组合成一组,然后通过随机数表抽取样本 随机数表法的步骤:编号,即将总体中的所有个体进行编号(每个号码位数一致);在随机数表中任选一个数作为起始号码;从选定的数开始按一定的方向读下去,得到的号码若不在编号中,则跳过,若再编号中,则取出,如果得到的号码前面已经取出,也跳过,如此继续下去,直到取满为止; 随机

4、数表法的优缺点:优点: 简单易行,它很好的解决了用抽签法当总体中的个体数较多时制签难的问题缺点:当总体中的个体数很多,需要的样本容量也很大时,用随机数表法抽取仍不方便5. 简单随机抽样的应用常用的简单随机抽样方法有抽签法和随机数表法抽签法一般适用于容量较小的总体,易于操作;随机数表法解决了制签比较麻烦的问题,但在利用“随机数表法”进行简单随机抽样时,要严格按照课本中介绍的步骤,否则易出错误结合具体的问题,我们应灵活使用这两种方法二、 系统抽样1. 系统抽样的概念:当总体元素个数很大时,可将总体分成均衡的若干部分,然后按照预先制定 的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样方法叫

5、做系统抽样(由于抽样样的间隔相等,因此系统抽样也被称作等距抽样)2. 系统抽样的步骤: 编号,即将总体中的个体编号为方便起见,也可直接利用个体所带有的号码,如准考证号、门牌号等; 分段,即为将整个的编号进行分段,要确定分段的间隔当是整数时,;当不是整数时,则可用简单随机抽样的方法从总体中剔除一些个体,使剩下的总体中个体个数能被整除,这时 确定起始个体编号,即由数字中随机抽取一个数 按照预先确定的规则抽取样本,即通常是将依次加上间隔的倍数,这样样本的编号依次是:3. 系统抽样的公平性当是整数时,;当不是整数时,则可用简单随机抽样的方法从总体中剔除一些个体,使剩下的总体中个体个数能被整除,这时,上

6、述过程中,总体的每个个体被剔除的可能性相同,也就是说每个个体不被剔除的可能性相同,所以在整个抽样过程中每个个体抽取的可能性仍然相同4. 系统抽样的特点 适用于总体容量较大的情况; 剔除多余个体及第一段抽样都用简单随机抽样,因而与简单随机抽样有密切联系; 它是等可能抽抽样,每个个体被抽到的可能性都是三、 分层抽样1. 分层抽样的概念:当总体由有明显差别的几部分组成时,为了使抽取的样本更好地反映总体的情况,我们经常将总体中各个个体按某种特征分成若干个互不重叠的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行简单随机抽样或系统抽样,这样的抽样方法叫做分层抽样2. 分层抽样的步骤: 分层,即将

7、总体中各个个体按某种特征分成若干个互不重叠的几部分; 按比例确定每层抽取个体的个数; 各层抽样,即各层中采用简单随机抽样或系统抽样抽取相应的个数; 汇合成样本3. 分层抽样的特点 适用于总体由差异明显的几部分组成的情况; 更充分的反映了总体的情况; 它是等可能抽样,每个个体被抽到的可能性都是四、 三种抽样方法的比较类别共同点各自特点相互联系适用范围简单随机抽样抽样过程中每个个体被抽取的可能性相同从总体中逐个抽取总体中的个体数较少系统抽样将总体均匀分成几部分,按事先确定的规则在各部分抽取在起始部分和剔除部分抽样时采用简单随机抽样总体中的个体数较多分层抽样将总体分成几层,分层进行抽取各层抽样时采用

8、简单随机抽样或系统抽样总体由差异明显的几部分组成1. 简单随机抽样【例1】 为了调查全国人口的寿命,抽查了十一个省市的2500名城镇居民,则该问题中的2500名城镇居民是( )A总体 B个体 C样本 D样本容量【例2】 在简单抽样中,某一个个体被抽的可能是( )A与第次抽样有关,第一次抽中的可能性大些B与第次抽样无关,每次抽中的可能性相等C与第次抽样有关,最后一次抽中的可能性较大D与第次抽样无关,每次都是等可能抽取,但各次抽取的可能性不一样【例3】 现从80件产品中随机抽出20件进行质量检验下列说法正确的是( )A80件产品是总体 B20件产品是样本 C样本容量是20 D样本容量是80【例4】

9、 利用简单随机抽样从含有6个个体的总体中抽取一个容量为3的样本,则总体中每个个体被抽到的可能是( ) A B C D【例5】 对总数为的一批零件抽取一容量为30的样本,若每个零件被抽取的可能性为25%,则为( )A150 B200 C100 D1202. 系统抽样【例6】 下列抽样试验中,最适宜用系统抽样法的是( )A某市的4个区共有2000名学生,且4个区的学生人数之比为,从中抽取200人入样B从某厂生产的2000个电子元件中随机抽取5个入样C从某厂生产的2000个电子元件中随机抽取200个入样D从某厂生产的20个电子元件随机抽取5个入样【例7】 有件产品,编号从至,现在从中抽取件检验,用系

10、统抽样法所抽的编号可能为()ABCD3. 分层抽样【例8】 某中学高中部有三个年级,其中高一有学生人,采用分层抽样抽取一个容量为的样本,高二年级抽取人,高三年级抽取人,问高中部共有多少学生?【例9】 某单位名职工的年龄分布情况如图,现要从中抽取名职工作样本,用系统抽样法,将全体职工随机按编号,并按编号顺序平均分为组(号,号,号)若第组抽出的号码为,则第组抽出的号码应是 若用分层抽样方法,则岁以下年龄段应抽取_人用样本估计总体一、 用样本的频率分布估计总体的频率分布1. 频率分布直方图(1)列出样本数据的频率分布表和频率分布直方图的步骤:计算极差:找出数据的最大值与最小值,计算它们的差;决定组距

11、与组数:取组距,用决定组数;决定分点:决定起点,进行分组;列频率分布直方图:对落入各小组的数据累计,算出各小数的频数,除以样本容量,得到各小组的频率绘制频率分布直方图:以数据的值为横坐标,以的值为纵坐标绘制直方图。(2)易知小长方形的面积组距×频率;所有长方形的面积之和等于1;(3)频率分布折线图:将频率分布直方图各个长方形上边的中点用线段连接起来,就得到频率分布折线图,一般把折线图画成与横轴相连,所以横轴左右两端点没有实际意义(4)总体密度曲线:样本容量不断增大时,所分组数不断增加,分组的组距不断缩小,频率分布直方图可以用一条光滑曲线来描绘,这条光滑曲线就叫做总体密度曲线总体密度曲

12、线精确地反映了一个总体在各个区域内取值的规律2. 茎叶图(1)制作茎叶图的步骤:将数据分为“茎”、“叶”两部分;将最大茎与最小茎之间的数字按大小顺序排成一列,并画上竖线作为分隔线;将各个数据的“叶”在分界线的一侧对应茎处同行列出 (2)茎叶图的优点:没有原始信息的损失,所有的数据信息都可以从茎叶图中得到;茎叶图可以在比赛时随时记录,方便记录与表示二、用样本的数字特征估计总体的数字特征1. 用样本的平均数估计总体平均数(1)众数:在样本数据中,出现次数最多的那个数据;(2)中位数:将样本数据按大小顺序排列,若数据的个数为奇数,则最中间的数据为中位数,若样本数据个数为偶数,则取中间两个数据的平均数

13、作为中位数。(3)平均数:一般地,设样本的数据为,则样本的算术平均数为;(4)众数、中位数、平均数的异同: 众数、中位数、平均数都是描述一组数据集中趋势的量,平均数是最重要的量;平均数的大小与一组数据里每个数据均有关系,任何一个数据的变动都会引起平均数的变动;众数考察各数据出现的频率,大小只与这组数据中的部分数据有关,当一组数据中有不少数据多次重复出现时,众数往往更能反映问题;中位数仅与数据的排列位置有关,某些数据的变动对中位数没有影响,中位数可能出现在所给数据中,也可能不在所给数据中,当一组数据中的个别数据变动较大时,可用中位数描述其集中趋势;实际问题中求得的平均数、众数和中位数应带上单位。

14、(5)平均数相关结论:如果两组数和的平均数分别是和,则一组数的平均数是;如果一组数的平均数为,则一组数的平均数为。如果一组数的平均数为,则一组数的平均数为2. 用样本的标准差估计总体的标准差(1)数据的离散程度可以用极差、方差或标准差来描述;(2)极差(又叫全距)是一组数据的最大值和最小值之差,反映一组数据的变动幅度;(3)样本方差描述了一组数据围绕平均数波动的大小; 一般地,设样本的数据为,样本的平均数为,定义样本方差为;简化公式:=(方差等于原数据平方的平均数减去平均数的平方)(4)样本的标准差是方差的算术平方根样本标准差。(5)方差相关结论:如果一组数的方差为,则一组数的方差为;如果一组

15、数的方差为,则一组数的方差为。1.频率分布直方图【例1】 已知一个样本容量为的样本数据的频率分布直方图如图所示,样本数据落在内的样本频数为 ,样本数据落在内的频率为 【例2】 从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图)由图中数据可知 若要从身高在,三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在内的学生中选取的人数应为 【例3】 一个容量为的样本,其数据的分组与各组的频数如下:组别频数则样本数据落在上的频率为( )ABCD2. 茎叶图【例4】 甲、乙两名运动员的次测试成绩如下图所示设分别表示甲、乙两名运动员测试成绩的标准差,分别表

16、示甲、乙两名运动员测试成绩的平均数,则有( )A, B, C, D,【例5】 随机抽取某中学甲,乙两班各10名同学,测量他们的身高(单位:cm),获得身高数据的茎叶图如图 ,则下列关于甲,乙两班这10名同学身高的结论正确的是 ( )A 甲班同学身高的方差较大B 甲班同学身高的平均值较大C 甲班同学身高的中位数较大D 甲班同学身高在175以上的人数较多 【例6】 在一次数学统考后,某班随机抽取名同学的成绩进行样本分析,获得成绩数据的茎叶图如下计算样本的平均成绩及方差;3数字特征的计算 【例7】 某校高中年级开设了丰富多彩的校本课程,甲、乙两班各随机抽取了5名学生的学分,用茎叶图表示(如右图),分

17、别表示甲、乙两班各自5名学生学分的标准差,则 (填“”、“”或“”)【例8】 个正数的平方和是,方差是,那么平均数为( )ABC D变量的相关性一、 变量间的相关关系1两个变量之间的关系:(1)常见的有两类:确定性的函数关系;相关关系:变量间存在关系,但又不具备函数关系所要求的确定性,它们的关系是带有一定随机性的当一个变量取值一定时,另一个变量的取值带有一定随机性的两个变量之间的关系叫做相关关系(2)相关关系与函数关系的异同点:相同点:两者均是指两个变量的关系不同点:函数关系是一种确定的关系,相关关系是一种非确定的关系函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系2散点图

18、:将样本中的个数据点描在平面直角坐标系中,就得到了散点图散点图形象地反映了各个数据的密切程度,根据散点图的分布趋势可以直观地判断分析两个变量的关系3正相关与负相关:(1)正相关:如果当一个变量的值变大时,另一个变量的值也在变大,则这种相关称为正相关;此时,散点图中的点在从左下角到右上角的区域(2)负相关:如果一个变量的值变大时,另一个变量的值由大变小,这种相关称为负相关此时,散点图中的点在从左上角到右下角的区域二、 两个变量的线性相关1回归分析:对于具有相关关系的两个变量进行统计分析的方法叫做回归分析,即回归分析就是寻找相关关系中这种非确定关系的某种确定性2 回归直线:如果散点图中的各点都大致

19、分布在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线3 最小二乘法:记回归直线方程为:,称为变量对变量的回归直线方程,其中叫做回归系数是为了区分的实际值,当取值时,变量的相应观察值为,而直线上对应于的纵坐标是设的一组观察值为,且回归直线方程为,当取值时,的相应观察值为,差刻画了实际观察值与回归直线上相应点的纵坐标之间的偏离程度,称这些值为离差我们希望这个离差构成的总离差越小越好,这样才能使所找的直线很贴近已知点记,回归直线就是所有直线中取最小值的那条这种使“离差平方和为最小”的方法,叫做最小二乘法用最小二乘法求回归系数有如下的公式:,其中上方加“”,表示是由观察值按最小

20、二乘法求得的回归系数4线性回归系数的最佳估计值:利用最小二乘法可以得到的计算公式为,其中,由此得到的直线就称为回归直线,此直线方程即为线性回归方程其中,分别为,的估计值,称为回归截距,称为回归系数,称为回归值1. 变量的相关关系【例1】 下列关系中,是相关关系的为( )学生的学习态度与学习成绩之间的关系;教师的执教水平与学生的学习成绩之间的关系;学生的身高与学生的学习成绩之间的关系;家庭的经济条件与学生的学习成绩之间的关系A B C D【例2】 对变量,有观测数据,得散点图1;对变量,有观测数据,得散点图2 由这两个散点图可以判断( )A变量与正相关,与正相关B变量与正相关,与负相关C变量与负

21、相关,与正相关D变量与负相关,与负相关2. 两个变量的线性相关【例4】 下列有关线性回归的说法,不正确的是( )A相关关系的两个变量不是因果关系B散点图能直观地反映数据的相关程度C回归直线最能代表线性相关的两个变量之间的关系D任一组数据都有回归方程【例5】 据两个变量x,y之间的观测数据画成散点图如图,这两个变量是否具有线性相关关系(填“是”或“否”)_【例6】 已知x,y之间的数据如表所示,则回归直线过点( )x12345y1218253238A(0,0) B(2,18) C(3,25) D(4,32)【例7】 鲁北化工厂为预测某产品的回收率y,需要研究它和原料的有效成分含量之间的相关关系现

22、取了8对观测值,经计算得:i52,i228,478,iyi1849,则y与x的回归方程为( )A262x1147 B262x1147C1147x262 D262x1147随机事件的概率一、 随机现象1. 必然现象:在一定条件下必然发生某种结果的现象叫做必然现象;2. 随机现象:在相同条件下,很难预料哪一种结果会出现的现象叫做随机现象;3. 试 验:我们把观察随机现象或为了某种目的而进行的实验统称为试验;把观察结果或实验的结果称为试验的结果一次试验是指事件的条件实现一次二、 事件与基本事件空间1. 事件:(1)不可能事件:在同样的条件下重复进行试验时,始终不会发生的结果,称为不可能事件;(2)必

23、 然 事件:在每次试验中一定会发生的结果,称为必然事件;(3)随 机 事件:在试验中可能发生,也可能不发生的结果称为随机事件通常用大写英文字母来表示随机事件,简称为事件2. 基本事件:在一次试验中,可以用来描绘其它事件的,不能再分的最简单的随机事件,称为基本事 件;它包含所有可能发生的基本结果3. 基本事件空间:所有基本事件构成的集合称为基本事件空间,常用表示三、 频率与概率1. 频率:在相同的条件下重复次试验,观察,某一事件A是否出现,称次试验中事件A出现的次 数为事件A出现的频数,称事件A出现的比例为事件A出现的频率2. 概率的统计定义:一般地,在次重复进行的试验中,事件发生的频率,当很大

24、时,总是在某个常数附近摆动,随着的增加,摆动幅度越来越小,这时就把这个常数叫做事件的概率,记为从概率的定义中,我们可以看出随机事件的概率满足:当是必然事件时,当是不可能事件时,3. 频率与概率的区别:频率随着试验次数的变化而变化,概率却是一个常数,它是频率的科学抽象当试验次数越来越多时,频率向概率靠近,只要次数足够多,所得频率就近似地当作随机事件的概率四、 概率的加法公式1. 互斥事件与事件的并:互斥事件:不可能同时发生的两个事件叫做互斥事件,或称互不相容事件事件的并:由事件和事件至少有一个发生(即发生,或发生,或 都发生)所构成的事件,称为事件与的并(或和),记作2. 互斥事件的概率加法公式

25、若、是互斥事件,有若事件两两互斥,有事件“”发生是指事件中至少有一个发生3. 对立事件:不能同时发生且必有一个发生的两个事件叫做互为对立事件事件的对立事件记作有事件及样本空间【例1】 在10个同类产品中,有8个正品,2个次品,从中任意抽出3个检验,据此列出其中的不可能事件,必然事件,随机事件1. 随机事件的概率【例2】 在天气预报中,如果预报“明天的降水概率为”,这是指( )A明天该地区约有的地区降水,其它的地区不降水B明天该地区约有的时间降水,其它时间不降水C气象台的专家中,有的人认为会降水,另外的专家认为不会降水D明天该地区降水的可能性为【例3】 盒中装有只相同的白球与只相同的黄球从中任取

26、一只球试指出下列事件分别属于什么事件?它们的概率是多少?“取出的球是白球”;“取出的球是蓝球”;“取出的球是黄球”;“取出的球是白球或黄球”【例4】 一个容量为100的样本,其数据的分组与各组的频数如下:则样本数据落在(10,40上的频率为组别(0,10(10,20(20,30(30,40(40,50(50,60(60,70频数1213241516137A013 B039 C052 D0643. 互斥事件与对立事件【例5】 某县城有两种报纸甲、乙供居民订阅,记事件为“只订甲报”,事件为“至少订一种报”,事件为“至多订一种报”,事件为“不订甲报”,事件为“一种报也不订”判断下列每对事件是不是互斥

27、事件,再判断它们是不是对立事件与;与;与;与;与【例6】 某产品分甲、乙、丙三级,其中乙、丙两级均属次品,若生产中出现乙级品的概率为003,丙级品的概率为001,则对产品抽查,抽得正品的概率为_【例7】 一盒中装有12个球,其中5个红球、4个黑球、2个白球,1个绿球从中随机取出1球,求:(1)取出1球是红球或黑球的概率;(2)取出1球是红球或黑球或白球的概率古典概型一、 古典概型1. 基本事件:一次试验中所有可能的结果都是随机事件,这类随机事件称为基本事件2. 基本事件的特点:(1)任何两个基本事件是互斥的;(2)任何事件(除不可能事件)都可以表示成基本事件的和我们将具有这两个特点的概率模型称

28、为古典概率模型,其特征是:(1)有限性,即在一次试验中所有可能出现的基本事件只有有限个(2)等可能性,每个基本事件发生的可能性是均等的;称这样的试验为古典概型3. 基本事件的探索方法:(1)列举法:此法适用于较简单的实验(2)树状图法:这是一种常用的方法,适用于较为复杂问题中的基本事件探索4. 在古典概型中涉及两种不通的抽取放方法,下列举例来说明:设袋中有个不同的球,现从中一次模球,每次摸一只,则有两种摸球的方法:(1)有放回的抽样每次摸出一只后,任放回袋中,然后再摸一只,这种模球的方法称为有放回的抽样,显然对于有放回的抽样,依次抽得球可以重复,且摸球可以无限地进行下去(2)无放回的抽样每次摸

29、球后,不放回原袋中,在剩下的球中再摸一只,这种模球方法称为五放回抽样,每次摸的球不会重复出现,且摸球只能进行有限次二、 古典概型计算公式1. 如果一次试验中可能出现的结果有个,而且所有结果出现的可能性都相等,那么每一个基本事件的概率都是;2. 如果某个事件A包括的结果有m个,那么事件A的概率P(A)=3. 事件与事件是互斥事件4. 事件与事件可以是互斥事件,也可以不是互斥事件因此在使用上述公式时要根据题意判断事件与事件可以是互斥事件,然后再根据公式进行计【例1】 (崇文一模)从张扑克牌(没有大小王)中随机的抽一张牌,这张牌是或或的概率为_【例2】 (上海)从一副混合后的扑克牌(张)中随机抽取张,事件A为“抽得红桃K”,事件B为“抽得为黑桃”,则概率 (结果用最简分数表示)【例3】 (湖北)投掷一枚均匀硬币和一枚均匀骰子各一次,记“硬币正面向上”为事件,“骰于向上的点数是3”为事件,则事件,中至少有一件发生的概率是( ) A B C D【例4】 某学生做两道选择题,已知每道题均有个选项,其中有且只有一个正确答案,该学生随意填写两个答案,则两个答案都选错

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论