《教育和心理统计学》章读书笔记_第1页
《教育和心理统计学》章读书笔记_第2页
《教育和心理统计学》章读书笔记_第3页
《教育和心理统计学》章读书笔记_第4页
《教育和心理统计学》章读书笔记_第5页
已阅读5页,还剩19页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、绪论1 .什么是教育与心理统计学2 .教育与心理统计学是应用统计学的一个分支,是数理统计学与教育学、心理学的一 门交叉学科,它把统计学的理论方法应用于教育实际工作和各种心理实验、心理测 验等科学研究中,通过对所得数据的分析和处理,达到更为准确地掌握情况、探索 规律、制订方案、目的,为教育与心理的科学研究提供了一种科学的方法。3 .教育与心理统计学的基本内容及本书体系。4 . 1)描述统计学:这一部分主要是研究和简缩数据和描述这些数据。5 .例如:计算平均数、中位数、众数等,以这些参数来反映观测数据的集中趋势。6 .计算标准差、方差等,以这些参数来反映观测数据的离散趋势。7 .描述统计学主要是描

2、述事务的典型性、波动范围以及相互关系,提示事物的内部规 律。8 . 2)推断统计学:这部分内容主要是研究如何利用数据去作出决策的方法。推断统计学则是一种依据部份数剧去推论全体的一种科学方法,它是进行教育与心理实验、 对教育与心理研究或实验作出预测和规划的有力工具。推断统计学的主要内容有:统计检验、统计分析和非参数统计法。9 . 3)多元统计分析:这部分内容主要是研究超过两个因素的教育与心理的研究和实验。10 .多元统计分析的主要任务就是寻找出主要的因素,相近或相关的因素合并或归类。11 .多元统计分析的主要内容有:主成分分析、因素分析、聚类分析、多元方差分析、 多元回归分析等。12 .教育与心

3、理统计学的昨天、今天和明天13 . 1)与心理统计学的昨天:1904年美国人桑代克写的心理与社会测量导论14 . 2)教育与心理统计学的今天:叶佩华主编的教育统计学,张厚粲主编的心理与教育统计等。15 .预备知识16 . 1)概念与术语17 . 随机变量:18 .教育与心理实验或观测,在相同的条件下,其结果可能不止一个,同实验或观测所 得到的数据,事先无法确定,这类现象称为随机现象。因为可以用数字来表现,则 称这些数字为随机变量。19 .它的特点是:离散性、变异性和规律性。20 .依其性质可分为:称名变量、顺序变量、等距变量、比率变量四种21 .称名变量:用于说明一事物与其它事物在属性上的不同

4、或类别上的差异,但不说明 事物与事物之间差异的大小。22 .顺序变量:指可以按事物的某一属性,把它们按多少或大小顺序加以排列的变量。23 .等距变量:指变量之间具有相等的距离。它除了有量的大小外,还具有相等的单位。24 .比率变量:除了有量的大小、相等单位之外,还有绝对零点。25 .变量依其相互关系可分为自变量(一般将相互关系中作为原因的称为自变量)与因 变量(作为结果的称为因变量)。函数关系式y=f(x)表示,y为因变量,x为自变量。26 . 总体、样本、个体27 .总体是指具有某一种特征的一类事物的全体。28 .个体是指构成总体的每一个基本元素。29 .样本是在总体中按一定规则抽取的一部分

5、个体,称为总体的一个样本。30 . 2)常用的符号与计算31 . 连加号及运算法则32 .三表示连加符号,同时表示想加的观测数值共有n个,这些数值的下标编号i从1起至n止。运算法则如下:33 .若c是一个常数,而xi是观测变量,则常与变量的乘积的连加和等于变量连加和 与常数的乘积。34 .设c是一个常数,则连加和竺于 nc.35 .若xi和yi都是变量,则变量和的连加和等于各个变量连加和的和。36 . 几个常用符号。37 .变量一般以大写英文字母表示,而变量中的元素则以小写英文字母表示。38 .变量平均数、变量标准差、方差,一般都用大写英文字母表示。39 .第1章第1节 次数分布表与图(适用于

6、描述一元连续变量的观测数据)1. 次数分布及其表达方式概述2. 次数分布指的是一批数据中各个不同数值所出现的次数情况,或者是指一批数据在 量各等距区组所出现的次数情况。3. 次数分布表:我们通常是对数据进行分组归类,考察这批数据在量尺上各等距区内 的次数分布情况,并把这种情况用规范的表格形式加以体现,这就是次数分布表, 若用图形来表达,那就叫做次数分布图。4. 次数分布表的编制5. 1)简单次数分布表6. 简单次数分布表,通常简称为次数分布表,其实质是反映一批数据在各等距区组内 的次数分布结构。其编制的主要步骤为:7. 求全距,字母 r表示。全距等于最大值减最小值,公式为:r=max-min8

7、. 定组数,字母k表示。把整批数据划分为多少个等距的区组。公式: k=(n-1)2/59. 定组距,字母i表示。i=r/k10. 写出组限。(表述组限与实际两个不同的概念,但它们之间有规律性的联系;当 各相邻组的组限已经相互承接而没有间断时,便认为已把表述的组限与实际的组限统一起来,且不管这里表述的实下限与实上限是整数还是小数;按照本书上述规定的组限表述方法即可形成规范的组限表述方式,并与其他学科中的区间表达方法统一起来。11. 求组中值。组中值=(组实上限+ 组实下限)/2.12. 归类划记13. 登记次数14. 次数分布图的绘制15. 次数分布图有次数直方图和次数多边图两种表达方式。16.

8、 1 )次数直方图(是由若干宽度、高度不一的直方条紧密排列在同一基线上构成的图形)17. 绘制步骤:18. 以细线条标出横轴和纵轴(取正半轴即可),使其垂直相交;19. 每一直方条的宽度由组距i 确定并已体现在横轴的等距刻度上;20. 在直方图横轴下边标上图的编号和图的题目,并检查一下图形结构的完整性。21. 2 )次数多边图(利用闭合的折线构成多边形以反映次数变化情况的一种图示方法)22. 3 )相对次数直方图与多边图23. 4 )累积次数分布图24. (有直方图式和曲线图式两种,曲线图式常用,它是根据累积次数分布或累积相对次数分布制作而成。 )25. 5 )累积相对次数曲线图与累积百分数曲

9、线图26.第 2 节 几种常用的统计分析图 (散点图、折线图、条形图和圆形图)1. 散点图 (适合于描述二元变量的观测数据)2. 散点图是用平面直角坐标系上点的散布图形来表示两种事物之间的相关性及联系模式。3. 绘制散点图注意:在平面直角坐标系中,横轴一般代表自变量,纵轴一般代表因变量;横轴既可作为连续性变量的量尺,也可作为离散性变量的量尺,但纵轴一般均代表连续变量的量尺;点的描绘依二元观测数据而定,但在具体描绘时应注意 用细线画坐标轴,用稍粗黑点描绘各个坐标点,点位置的确定按平面解析几何学中的方法;注意图形的调和比例和必要的图注说明。4. 线形图(是以起伏的折线来表示某种事物的发展变化及演变

10、趋势的统计图。 )5. 适用于描述某种事物在时间序列上的变化趋势、描述一种事物随另一事物发展变化的趋势模式、 比较不同的人物团体在同一心理或教育现象上的变化特征及相互联系。6. 条形图(是用宽度相同的长条来表示各个统计事项之间的数量关系。 )7. 通常用于描述离散性变量的统计事项。8. 1)简单条形图(它适用于统计事项按一种特征进行分类的情况)9. 2)复合条形图(用两类或三类不同色调的直方长条来表示多特征分类下的统计事项 之间数量关系的一种图示方法)10. 圆形图(是以单位圆内各扇形面积所占整个圆形面积的百分比来表示各统计事项在 其总体中所占相应比例的一种图示方法。)特别适用于描述具有百分比

11、结构的分类数 据。11.第1章自测练习【练习1】试比较简单条形图与简单次数直方图在制作和应用方面的异同点。解答:条形图和直方图都是次数分布图, 但前者适用于离散型随机变量的次数分布描述, 其所依据的次数分布表是离散型次数分布表。 后者则适用于连续型随机变量的次数分布 描述,其所依据的次数分布表是连续型次数分布表。这一区别决定了它们在制作上的不同。即相应于不同类型的次数分布表, 条形图中的直条对应离散变量各类别,因而直条没有宽度的要求,直条之间是间隔排列的;而直方图的直条则对应连续变量次数分布的 各取值区间,宽度即组距,直条比较相连排列。具体参照教材有关内容。【练习2】简述散点图、折线图、条形图

12、和圆形图这四种统计分析图的应用特点。解答:如上题所述,条形图适用于离散型变量的次数分布,是一种次数分布图;圆形图的适用条件与之相同。 所不同的是,圆形图使用圆中的扇面弧度来替代直条表 达次数或相对次数,所有扇面组成整个圆周。因而圆形图本身就包含有相对次数信息。散点图是专用于分析两个连续变量或至少是等级变量间相关关系的统计图,它用两个相关变量的配对数据分别作为散点的横、纵坐标在平面直角坐标系中描点, 根据散点分布的区域的形状就可以大致判断两变量间的相关关系。例如如果散点区域形状是一个椭圆,则变量为直线性相关,椭圆长轴的方向还可以表达相关的方向。折线图在教材中之牵涉到所谓的均值图,即描述某个因变量

13、(指标)在一个离散型自变量的各水平上取值均值的统计图, 将指标在自变量各水平上取值的均值作为纵坐标先 描出散点,然后用线段连接这些散点构成折线,故而叫折线图。折线图通常用在组间均值比较中帮助直观分析各均值间的差异。第2章常用统计参数中心位置:用以度量一级数据的集中趋势, 描述它们的中心位于何处, 故对其数量化描 述称为置度量数或集中量数。离散性:反映一组数据的分散程度, 即次数分布的离散程度。对其数量化描述称为次数 分布变异特性的度量或差异量数。参数:总体统计特征的量数。统计量:样本统计特征的量数。第1节 集中量数(描述数据集中趋势的统计量。包括:算术平均数、加权平均数、几何平均数、中数,等。

14、它们的作用都是试题次数分布的集中趋势。)1. 算术平均数2. 只有在与其他几种集中量数相区别时,才称它为算术平均数。3. 算术平均数是用以度量连续变量次数分布集中趋势的最常用的集中量数。4. 公式:5.6.7.8. 1)总体平均数与样本平均数。9. 2)加权平均数10.11.12.13. 3)算术平均数具有以下性质:c后,计算得到的平均数等于原平均数加上这14. 每一个观测值都加上一个相同常数 个常数;15.16.17. 每一个观测值都乘以一个相同常数 个常数;18.19.20. 每一个观测值都乘以一个相同常数c后,c后,计算得到的平均数等于原平均数乘以这21.数等于原平均数乘以这个常数c再加

15、上常数观测值与平均数离差的总和为零再加上一个常数d后,计算得到的平均 d.22 .23 .观测值与任意常数c的离差平方和,不小于观测值与平均数的离着平方和。24 .25 . 4)算术平均数的优点:26 .反应灵敏、确定严密、简明易解、计算简便并能作进一步的代数演算等优点,是应 用最普遍的一种集中量数。27 . 5)算术平均数的缺点:28 .易受极端数据影响、出现模糊数据和存在不等质数据时无法计算算术平均数的缺29 .几何平均数(mg)30 .当出现以下两种情况时需用几何平均数:31 .一组数据中任何两个相邻数据之比接近于常数,即数据按一定的比例关系变化。在教育与心理研究中,求平均增长率或对心理

16、物理学中的等距与等比量表实验的数 据处理;32 .当一组数据中存在极端数据,分布呈偏态时,算术平均数不能很好的反映数据的 典型情况,此时应使用几何平均数或其他集中量数(如中数、众数)来反映数据的33.34.35.36.x21gmsg n(1gx1 lgx2 h| lgxj公式变形:nlgxiii 11n37.38.39.未来情况的预测数x= x ( xg x表示预测的基础。中数(又称中位数,mdrj)1)中数是指位于一组数据数列中间位置的那个数。中数可能是观测数据中的某一个,也可能根本不是原有的数。中位数的位置 nmdn=(n+1) /240 . 2)当一组观测数据中出现极端数据时,或一组数据

17、的两端有模糊数据出,此时不 能用算术平均数来作为这组数据的代表值,而应求中数。41 . 3)中数的优缺点是:具有计算简单、不受极端数据的特点,但由于中数是根据数 据的相对位置来确定的,在计算时不是每个数据都加入计算,从而有较磊的抽样误 差,不如平均数稳定;同时,由于中数难以作进一步的代数运算,故而在多数情况 下,中数不如平均数应用广泛。42 .众数(m指次数分布中出现最多的那个数的数值)43 .当一组数据出现不同质的情况,或分布中出现极端数据时,也用众数作为集中量数 的粗略估计。皮尔逊计算方法:麻3mdn-2第2节差异量数次数分布数据间彼此差异的程度称作数据的离中趋势。它反映了次数分布的变异性

18、。集中量数反映次数分布的典型情况,差异量数则反映次数分布的特殊性。1.2.3.4.平均差(ad)adxi xxi n.方差与总体标准差6. 1) (variance ):也叫变异数、均方,是每个观测值与该组数据的平均数之差平方后 和的均值,即离均差平方和的平均数。7. 2)样本方差和总体方差的计算方法和含义是一致的,但符号不同,前者用s,表示,s2xn-122 (x )n后者用a 表示。8.9. 3)标准差(standard deviation ):即方差的平方根,样本方差常用符号 s或sd 表不,总体方差则用(x表示。10.12.13.14.15.11.标准差的合成i 5s)+/、( 一、/

19、 *1_ i = x十十16. 标准差的性质17. 1) 一组数据的每一个观测值都加上一个常数c,其标准差不变。即 yi=x+c18. 2) 一组数据的每一个观测值都乘以一个常数c,其标准差为原标准差乘以常数co即 y=x c19. 3)每个观测值都乘以同一个常数c(c才0),再加上一个常数 d,所以标准差等于原标准差乘以这个常数 c。即s=c-s20. 方差(推断统计最常用的统计量数)和标准差的意义21. 方差与标准差是表示一组数据离散程度的最好指标,值越大说明离散程度越大,反 之亦然。22. 具有以下优点:23. 1)反应灵敏,每个数据取值的变化,方差与标准差都会随之变化;24. 2)有一

20、定的计算公式严密确定;25. 3)容易计算并适合代数运算;26. 4)受抽样变动的影响小;27. 5)具有可加性,因此可以分解并确定出属于不同来源的变异性,并可进一步说明 每种变异对总结果的影响,是以后统计推论部分常用的统计特征数。28. 差异系数(cv)29. cv=s/x *100%第3节地位量数原始变量在其所处分布中地位的量数,称为地位量数。地位量数常被用来表示各种常模。1.2.3.4.5.种类:百分位分数、百分等级分数、标准分数、 t分数百分位数(pm。计算公式如下:其中:pm 第n分位分数 m赤?n fblpm所在组在组的组p l 100?ipm l fu pm所在组在组的组(1 d

21、)?n ff pm所在组在组的pm u 100-a?ifb 小于l的累积累积ffa 大于u的累积累积6.7.8.百分等级分数(pr某个已知原始分数在其所处分布中的相对位置叫百分等级分数。)9.计算公式如下:10 .百分等级越小,原始数据在分布中的相对位置越低11 .百分等级越大,则越高。12 .百分位分数和百分等级分数称为百分位量表。13 .优点是:计算简便,意义明确,对各种测验普遍适用。14 .缺点是:它是一个顺序量表,不具相等单位,从而不能作进15 . 一步的运算,无法作进一步的统计分析,另外,由于百分位fb pri100 n其中l某特定原始分数所在组的下限f某特定原始分数所在组的次数x某

22、特定原始分数fb小于l的累积累积16.量表的分布呈长方形,当测验分数的分布为正态或接近正态时,百分位量表将夸大分布中间的原始分数的差异而缩小分布两端的原始分数的差异。第4节相关分析1 .相关2 .相关:即两类现象在发展变化的方向与大小方面存在一定的关系。3 .相关分析:用一些合理的指标对相关事物的观测值进行统计分析,以判断两事物相 关的程度,称为相关分析。4 .相关散点图:1)呈曲线趋势,称曲线相关或非线性相关。5 .2)直线称线性相关6 .3)x和y正相关7 .4)x和y负相关8 .相关系数及其解释9 .相关系数:用来表示两个具有相关关系的变量之间相关程度的数值。10.通常样本的相关系数用(

23、relationship) 表示11 .总体的相关系数用p表示。12 .相关系数取值范围介于至+之间,即 r13 .常用相关分析方法及其计算 + (零相关、完全相关)14. 1)积差相关系数15.英国的统计学家皮尔逊(pearson)于20世纪初提出了积差相关概念,用来计算线性关系的两列变量的相关程度。16. 2)积差相关系数(rxy的计算17.18.19.20. 3)等级相关(r r)等级相关是积差相关的特例计算公式如下:中工4上了切的意文均同前所述“蓍记工的一,二31一则1 , .收成m21. 二者可以互相推导,等级相关引进了计算误差,没有积差相关精确,能够用积差相关计算的数据一定不能用等

24、级相关计算。26 d3 c 4rxryrr12rr?22.23.24.25.26.27.28.29.30.31.32.33.34.35.36.37.38.39.40.41.42.43.44.45.46.47.48.49.50.51.52.53.54.55.56.斯皮尔曼等级相关的基本公式:如不用对偶等级之差,而用原始等级序数计算:4)肯德尔 w系数(肯德尔和谐系数)又叫肯德尔和谐系数(thekendallcoeficientofconcordance),用w!示。在心理 与教育研究中,肯德尔和谐系数常用来考察评分者的一致性程度。评定有两种情况,即不同评定者对同一组个体的等级评定,或者同一评定者

25、对同一个体等级的几次评定。5)质量相关57.k 等缠交融的列效或评优者敢目e内被评竹树象吗;种中怛个评价者对几华” 存地标数q于这么一种七 :当人等1定,如果可个牌价哲的意见完全一致,则个氏分别月1 ijj = 夏 k (祚 廿 八此印,的i u个泮侨片的理见完全不一致,则5s* = 0,此时的w个u春的意虬存在一电的关系,但也不是完全 阳湍翼2真变化范围为涔ww1.汨翎 它仅表而漏买而由于-w.1,海口(1用 a i1ml i58.59.60.61.62.63.64.65.第i章练习1 .落在某一特定类别或组中的数据个数称为()。a.次数b ,频率c .次数分布表 d .累积次数【答案】a【

26、解析】次数是指某一特定类别或组中的数据个数;频率又称相对次数,是各组的次数f与总次数n之间的比值;次数分布表是将数据进行分组归类,考察这批数据在量尺上各等距区组内的次数分布情况,并把这种情况用规范的表格形式加以体现;累积次数是指某个数值以下或以上的数据的次数。2 .把各个类别及落在其中的相应次数全部列出,并用表格形式表现出来,称为()。a.次数b ,次数分布表 c.频率d.累积频率【答案】b【解析】对数据进行分组归类,考察这批数据在量尺上各等距区组内的次数分布情况,并把这种情况用规范的表格形式加以体现,这就是次数分布表。3 .下面哪一个图形最适合描述结构性问题()。a.条形图b .饼图c,直方

27、图d.多边图【答案】b【解析】饼图又称圆形图,是以单位圆内各扇形面积所占整个圆形面积的百分比来表示各统计事项在其总体中所占相应比例的一种图示方法。在这里,整个圆代表所研究事物的总体,各扇形可用不同的色调加以区别,分别代表对总体事物进行分类后的统计事项;扇形的面积比例大小,完全依某一统计事项在其总体事物中的比例大小而定。因此,圆形图有其独特的功能,特别适用于描述具有百分比结构的分类数据。4 .下面图形中最适合描述一组数据分布的图形是()。a.散点图b ,直方图c ,条形图d .圆形图【答案】b【解析】散点图是用来表示两种事物之间的相关性及联系模式的点散布的图形,适用于描述二元变量的观测数据;直方

28、图是由若干宽度相等、高度不等的直方条紧密排列在同一基线上构成的图形;条形图是用宽度相同的长条来表示各个统计事项之间的数量关系,通常应用描述离散性变量的统计事项;圆形图是以单位圆内各扇形面积所占整个圆形面积的百分比来表示各统计事项在其总体中所占相应比例的一种图示方法。5 .为描述身高与体重之间是否有某种关系,适合采用的图形是()。a.条形图b ,线形图c ,散点图d .直方图【答案】c【解析】散点图是用来表示两种事物之间的相关性及联系模式的点散布的图形,适用于描述二元变量的观测数据。6 .对于时间序列数据,用于描述其变化趋势的图形通常是()。a.条形图b ,直方图c ,多边图d .线形图【答案】

29、d 【解析】线形图是以起伏的折线来表示某种事物的发展变化趋势及演变趋势的统计图,适用于描述某种事物在时间序列上的变化趋势,也适用于描述一种事物随另一事物发展变化的趋势模式,还可以适用于比较不同的人物团体在同一心理或教育现象上的变化特征及相互联系。7下列不能用于描述某年级某班 60 名学生的期末测验成绩的是 ( ) 。a.条形图b.累积百分数图 c.相对次数表d.散点图【答案】 d【解析】散点图是用来表示两种事物之间的相关性及联系模式的点散布的图形,适用于描述二元变量的观测数据。8描述定性数据两种常用的图示法是 ( ) 。a.条形图和饼图b .散点图和饼图c.散点图和条形图 d.条形图和茎叶图【

30、答案】 a【解析】定性数据包括分类数据和顺序数据两种类型,分类数据的取值是对事物的一种分类,而顺序数据的取值是对事物的分类排序。条形图和饼图可用于显示分类数据和顺序数据取值所对应的频数或频率分布。9特别适用于描述具有百分比结构的分类数据是 ( ) 。a.散点图b ,线形图c ,条形图d .圆形图【答案】 d【解析】圆形图是以单位圆内各扇形面积所占整个圆形面积的百分比来表示各统计事项在其总体中所占相应比例的一种图示方法。10与直方图相比,茎叶图( ) 原始数据信息。a.没保留b .保留了 c .掩盖了 d .浪费了【答案】 b【解析】茎叶图类似于横置的直方图,但又有不同:茎叶图既能给出数据的分布

31、状况,又能给出每一个原始数据,从而保留了原始数据的信息,一般适用于小批量数据;直方图能够反映定性变量取值的分布,但不能保留原始的数据信息,通常适用于大批量数据。11一组数距的最大值与最小值之差称为( ) 。a.标准差b .方差c.组距d .全距【答案】 d【解析】所谓全距是指一批数据中最大值与最小值之间的差距,在其他书中也称为两极差。12将各有序类别或组的次数逐级累加起来得到的次数称为( ) 。a.次数b ,累积次数 c .比例d .比率【答案】 b【解析】累积次数是把各族的次数由下而上,或由上而下累加在一起。13对于小样本的数据,最适合描述其分布的图形是( ) 。a.条形图b .茎叶图c .

32、直方图d .圆形图【答案】 b【解析】茎叶图既能给出数据的分布状况,又能给出每一个原始数据,从而保留了原始数据的信息,一般适用于小批量数据。14由一组数据的最大值、最小值、中位数和两个四分位数五个特征值绘制而成,反映原始数据分布的图形,称为( ) 。a.条形图b .茎叶图c ,箱形图d .直方图【答案】 c【解析】箱形图主要用来反映原始数据的分布特征,由一组数据的最大值、最小值、中位数、上下四分位数这个五个特征数值组成。与茎叶图相比,箱形图不能够反映出每一个原始数据的信息,但却提供了简明有效的视图。15在一次考试中,依照成绩分了四个组,根据“上组限不在内”的原则,分数为60 分的同学应归入下列

33、哪一个组 ( )a. 60分以下b . 6070分c . 7080分d. 8090分【答案】 b【解析】根据上组限不在内”的原则,60分归入6070分一组.16组距分组中,一个组的最小值称为( ) ,一个组的最大值称为( ) 。【答案】下限;上限【解析】17条形图适合应用于哪些场合答:条形图通常用于描述离散性变量 ( 如属性变量) 的统计事项。其中,简单条形图是用同类的直方长条来比较若干统计事项之间数量关系的一种图示方法,它适用于统计事项仅按一种特征进行分类的情况。复合条形图一般是用两类或三类不同色调的直方长条来表示多特征分类下的统计事项之间数量关系的一种图示方法。18.请使用spss软件,自

34、编数据,绘制散点图、线形图、条形图和圆形图。【答案】略【解析】19数据分组的基本要求是什么答:在整理和描述定性变量时,需要根据分类变量和顺序变量的取值进行统计分组,同时计算每一组对应的频数;而对于定量变量,通常采用统计分组,得到每一组所对应的频数、频率或比例表,用来对数据特征进行描述。数据分组过程的要求如下:( 1 )求全距全距是一批数据中最大值与最小值之间的差距,以符号r表示,也称为两极差,其计算公式为:( 2 )定组数定组数就是要确定把整批数据划分为多少个等距的区组。组数用符号k表示。组数的大小要依数据的多少而定。组数太多,往往会削弱对数据分组整理的功用;太少,又可能会湮没数据内含的重要信

35、息。当一批数据的个数在200个以内时,组数可取 818组。如果数据来自一个正态的总体,则可利用下述经验公式来确定组数,即:公式中的n为数据个数。注意:事先计划的组数可能与实际分组时因考虑组距取整以及最低一组的起点位置不同而略有差异,这种差异是正常的,最终结果应以实际划归的组数为准。( 3 )定表距组距用符号i表示,其一般原则是取奇数或5的倍数,如1,3,5,7,9,10等。具体的取值过程可通过全距r与组数k的比值来取整确定。( 4 )写出表限表限是每个表的起始点界限。( 5 )求表中值表中值是各表的表中点在量尺上的数值,其计算公式为:组中值=(组实上限+组实下限):2。( 6 )归类划记具体方

36、法可以类似唱票的方式依次把每个数据准确地划归所属的表别。20编制简单次数分布表的步骤有哪些答: 简单次数分布表,通常简表为次数分布表,其实质是反映一批数据在各等距区表内的次数分布结构。编制次数分布表的主要步骤如下:( 1 )求全距全距是一批数据中最大值与最小值之间的差距,以符号r表示,也称为两极差,其计算公式为:2 )定表数k 表示。表数的大小要依数据的多少而定。表数太多,往往会削弱对数据分表整理的功用;太少,又定组数就是要确定把整批数据划分为多少个等距的区组。组数用符号 可能会湮没数据内含的重要信息。当一批数据的个数在200个以内时,组数可取818组。如果数据来自一个正态的总体,则可利用下述

37、经验公式来确定组数,即:公式中的n为数据个数。注意:事先计划的组数可能与实际分组时因考虑组距取整以及最低一组的起点位置不同而略有差异,这种差异是正常的,最终结果应以实际划归的组数为准。(3)定组距组距用符号i表示,其一般原则是取奇数或5的倍数,如1,3,5, 7,9,10等。具体的取值过程可通过全距r与组数k的比值来取整确定。( 4 )写出组限组限是每个组的起始点界限。( 5)求组中值组中值是各组的组中点在量尺上的数值,其计算公式为:组中值=(组实上限+组实下限):2。( 6)归类划记具体方法可以类似唱票的方式依次把每个数据准确地划归所属的组别,并以正号或”号的记录方式体现在表中,便于计数检查

38、。( 7)登记次数根据划记结果,点at各组的次数f。21.简述直方图与条形图的区别。答:(1)条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)则是固定的;直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度表示各组的组距,因此,其高度与宽度均有意义。(2)由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是分开排列。(3)条形图主要用于展示分类数据,而直方图主要用于展示数值型数据。22.下面是40个人的血型资料:试编制其次数分布表,并绘制圆形图。【答案】次数分布表如下表,图略频率百分比有效百分比累计百分比a1845. o45. o有b41

39、0. o10. o55. o样ab25. o5. o数01640. o40. o合计40第3章概率和分布第1节概率1 .概率2 . 1)随机现象3 .确定性现象:在一定条件下事先可以断言必然会发生某种结果的现象;(分必然现象和不可能现象)4 .随机现象:在一定条件下,事先不能断言会出现哪种结果的现象。5 .随机现象具有两个特征:6 .一次试验前,不能预言发生哪一种结果,这说明随机现象具有偶然性;7.8.9.10.11.12.13.14.15.在相同条件下,进行大量次重复试验,呈现出统计规律性,这说明随机现象具有 必然性。随机事件:随机现象中出现的各种可能的结果称为随机事件。在每次实验中一定要发

40、生的事件称为必然事件。在每次实验中一定不发生的事件称为不可能事件。2)事件与概率频率(frequency ):在n次实验中,某一事件出现的相对次数称为该事件的频率。即如果某一事件 a在n次实验中出现了 n次,则事件a发生的频率为:f (a) =n/n对于某一随机事件a,当实验次数足够多时,其频率会趋向于某一个稳定的值,即频率具有稳定性。这个稳定的频率反映了事件a发生的可能性的大小,即反映了事件a发生的概率(probability) 。频率是事件发生的外部表现,而概率才体现事件发现的内存实质。频率用符号f表示,概率常用符号 p表示。如事件a的概率用p (a)表示,事件b的概率用p (b)表示,。

41、16. 概率的统计定义(后验概率):若实验满足两个条件,1是每次试验中某一事件发生的可能性不变。2是试验能大量重复,且每次试验相互独立。即某随机事件在n次实验中出现m次,其发生的频率 m/n随实验次数的增多会渐趋稳定,这个需 定的频率即可作为该随机事件发生的概率。这样计算到的概率叫后验概海。后附 一n n率的计算:17.18.19.概率的古典定义(先验概率):它要求满足两个条件,1是每次试验中所可能出现的结果的个数是有限的。这些结果叫作基本事件或样 本点。20. 2是每次试验中每个基本事件的出现是等可能的,21. 即每个基本事件发生的概率相等。即若试验同n个有限的基本事件组成,且每次试验中每个基本事件出现是等可能的,有利事件a发生的次数为 m,则事件a的概率为:p(a)=m/n22.23.24.25.26.27.28.29

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论