2 教育统计基础_第1页
2 教育统计基础_第2页
2 教育统计基础_第3页
2 教育统计基础_第4页
2 教育统计基础_第5页
已阅读5页,还剩253页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

教育统计与质量评价之

第2讲

教育统计基础山西财经大学工商管理学院

教育经济与管理

张爱文

邮箱:kzzaw@163.com11/13/20231教育统计与质量评价教育统计与质量评价的内容第1讲概率论(基础)第2讲教育统计基础第3讲教育测量概论第4讲教育测量指标第5讲教育质量评价11/13/20232教育统计与质量评价教育统计基础

EducationalStatistics在终极的分析中,一切知识都是历史在抽象的意义下,一切都是科学数学在理性的基础上,所有的判断都是统计学C.R.劳11/13/20233教育统计与质量评价统计规律(一些例子)(1)正常条件下新生儿的性别比为107/100;(2)投掷一枚均匀的硬币,出现正面和反面的频率各为1/2;投掷一枚骰子出现1~6点的频率各为1/6;(3)农作物产量与施肥量之间存在相关关系;(4)某课程所花时间与学习效果之间的关系。11/13/20234教育统计与质量评价统计无处不在在诺贝尔经济学获奖者中,2/3以上的研究成果与统计和定量分析有关。因此,著名经济学家萨缪尔森在其经典的教科书《经济学》12版中特别提到:“在许多与经济学有关的学科中,统计学是特别重要的”。11/13/20235教育统计与质量评价有关统计学的几则笑谈(1)凯恩斯:我宁愿含糊地正确,不要精确地错误。(2)统计数据就像比基尼,暴露出来的那部分固然重要,但没有暴露的那部分才更致命。(3)世界上有两样东西你不了解其生产过程反而感觉更好:香肠和经济计量数据。(4)数字不会骗人,但骗人的都会利用数字。11/13/20236教育统计与质量评价(5)某乘客得到信息:“每一百万乘座飞机人中只有一个人会携带炸弹”。于是他每次座飞机要携带一个炸弹,被机场管理员发现后,他解释原因说:一架飞机上有一个人携带炸弹的几率是百万分之一,同时有两个人携带炸弹的几率是万亿分之一,所以不可能发生。”11/13/20237教育统计与质量评价(6)1981年,首届国际《红楼梦》研讨会在美国召开,威斯康星大学讲师陈炳藻独树一帜,宣读了题为《从词汇上的统计论〈红楼梦〉作者的问题》的论文。他从字、词出现频率入手,通过计算机进行统计、处理、分析,对《红楼梦》后40回系高鹗所作这一流行看法提出异议,认为120回均系曹雪芹所作。11/13/20238教育统计与质量评价(7)大仲马的作品多曲折感人,而他生活中又多私生子。取笑讥讽他的人,往往把他的作品比作他的私生子。最使他头痛的是巴黎统计学会的秘书长李昂纳,这人是大仲马的朋友,每次举统计数字的例子,总是说大仲马的情妇和私生子有多少。有一年该统计学会开年会,大仲马估计,李昂纳又要大放厥词,说他的坏话了,于是他请求参加年会,获得了批准。11/13/20239教育统计与质量评价果然不出大仲马所料,李昂纳又举他的情妇和私生子的例子。李昂纳报告完毕,请大仲马致词。一向不愿在大庭广众之下发表演讲的大仲马,这次却破例登台说:“所有统计数字都是撒谎的,包括有关本人的数字在内”。台下的听众哄堂大笑。11/13/202310教育统计与质量评价(8)一名统计学家遇到一位数学家,统计学家调侃数学家,说道:“你们不是说,若X=Y且Y=X,则可以推导出X=Z吗?那么这就是说,想必你若是喜欢一个女孩,那个女孩喜欢另一位男生,那你也一定会喜欢那个男生了?”数学家想了一下,反问道:“如果你把左手放到一锅一百度的开水中,右手放到一锅零度的冰水里,想来你也没事吧!因为它们平均水温不过是五十度而已!”11/13/202311教育统计与质量评价(9)18世纪某健康大臣对一个统计学者的报告提到的去年由于某种疾病,平均1000人中死亡人数为3.2人这个数字发生了兴趣。他问他的私人秘书,一个行政官,3.2个人是如何死法?他的秘书说:“先生,当一个统计学家说死了3.2个人时,这意味着3个人已经死了,2个人正在等死。”11/13/202312教育统计与质量评价(10)某医生在手术前与病人谈话,以鼓励其战胜病疼,增加对康复的信心。医生对对病人安慰道:“据国外权威研究成果报道,现在的医学条件对您这种病的治愈率是1%,我已经治疗过99位您这种病,都已经不在了,您正好是我收治的第100位病人……,所以您放心养病好了,保证可以治愈的。”11/13/202313教育统计与质量评价2.1

统计学发展2.2统计图表2.3集中量数2.4差异量数2.5相关系数2.6线性回归2.7抽样原理第2讲教学内容11/13/202314教育统计与质量评价2.1统计学发展①最初的统计是统治者用以治国的方法,对于人口、土地、物产、贡赋、士兵与战车等都需要统计;②随着科学的进步,在概率论的基础上逐步形成了推测性的数理统计;③数理统计的发展经历了两个阶段:描述统计学与推论统计学。描述统计学产生于20世纪20年代之前,以高尔顿和皮尔逊为代表。推论统计学产生于20年代之后,以费舍为代表。11/13/202315教育统计与质量评价④二战以后,非参数方法、序列分析、随机过程的研究、小样本分布这些都逐渐被认识和应用。而且随着一元统计方法的逐步完善与拓宽,多元统计理论与方法也被应用到各种实际研究中。11/13/202316教育统计与质量评价2.1.1统计学及其应用统计学的英文定义Statisticsisthescienceofcollecting,organizing,presenting,analyzing,andinterpretingnumericaldatatoassistinmakingmoreeffectivedecisions.11/13/202317教育统计与质量评价统计学是数据收集、分析、呈现、解释和帮助决策的科学。数据采集:取得数据,如调查问卷数据分析:分析数据,如区间估计数据呈现:图表展示,如直方图表数据解释:统计指标,如均值方差数据决策:估计推断,如假设检验11/13/202318教育统计与质量评价统计:就是“统而计之”对所考察事物的量的取值在其出现的全部范围内作总体的把握,全局性的认识。教育统计:对教育领域各种现象量的取值从总体上的把握与认识,它是为教育工作的良好进行,科学管理、革新发展服务的。教育统计学:社会科学中的一门应用统计,是数理统计跟教育学、心理学交叉结合产物。11/13/202319教育统计与质量评价统计研究的过程1实际问题提出问题2收集数据取得数据5解释数据决策判断4分析数据研究数据3整理数据处理数据11/13/202320教育统计与质量评价统计的应用“学者不能离开统计而研学,政治家不能离开统计而施政,事业家不能离开统计而执业,军事家不能离开统计而谋略。”

——著名教育家马寅初11/13/202321教育统计与质量评价统计的应用领域统计学经济学管理学医学工程学社会学…11/13/202322教育统计与质量评价统计的应用领域ActuarialWork(精算)Agriculture(农业)AnimalScience

(动物学)Anthropology(人类学)Archaeology(考古学)Auditing(审计学)Education(教育学)

Crystallography

(晶体学)Demography

(人口统计学)Dentistry(牙医学)Ecology(生态学)Econometrics

(经济计量学)11/13/202323教育统计与质量评价ElectionForecasting

andProjection

(选举预测和策划)Engineering(工程)Epidemiology

(流行病学)Finance(金融)Fisheriesresearch

(水产渔业研究)Gambling(赌博)Genetics(遗传学)Geography(地理学)Geology(地质学)HistoricalResearch

(历史研究)HumanGenetics

(人类遗传学)11/13/202324教育统计与质量评价Hydrology(水文学)Industry(工业)Linguistics(语言学)Literature(文学)Manpowerplanning

(劳动力计划)ManagementScience

(管理科学)Logistics(物流学)Marketing(市场营销学)MedicalDiagnosis

(医学诊断)Meteorology(气象学)MilitaryScience

(军事科学)NuclearMaterialSafeguards

(核材料安全管理)11/13/202325教育统计与质量评价Ophthalmology

(眼科学)Pharmaceutics

(制药学)Physics(物理学)PoliticalScience

(政治学)Psychology(心理学)Psychophysics

(心理物理学)QualityControl

(质量控制)ReligiousStudies

(宗教研究)Sociology(社会学)

SurveySampling

(调查抽样)Taxonomy(分类学)WeatherModification

(气象改善)11/13/202326教育统计与质量评价2.1.2什么是教育统计学教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析教育科学研究中获得的随机性数据资料,并根据这些数据资料所传递的信息,进行科学推论找出教育活动规律的一门科学。具体讲,就是在教育研究中,通过调查、实验、测量等手段有意获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。11/13/202327教育统计与质量评价(1)教育统计学的性质教育统计学是心理学与统计学交叉结合的学科,是数理统计方法在教育领域的具体应用,属于应用统计学的范畴,是应用统计学的一个分支。它是教育科学研究中广泛应用的、也是最基本的一种定量化的研究工具。11/13/202328教育统计与质量评价(2)教育统计学和数理统计学的关系数理统计学研究的领域包括怎样设计一个实验,如何从局部观测推论整体情况,如何从特殊情况推论一般规律,如何对假设进行推论估计与检验等等。教育统计学偏重于数理统计方法如何在教育科学研究中的应用,因而对各种统计方法公式的推导及理论上的证明介绍较少,着重介绍各种统计方法在不同的教育研究中应用的条件和具体方法,及其统计结果的解释。11/13/202329教育统计与质量评价一般讲,教育统计学介绍的方法,大都是数理统计学已确认的,但是,随着教育科学研究的发展与深入,实践中会提出更多的如何处理数据的问题,需要教育统计学加以研究解决,这又为数理统计提供或补充了新的研究内容。可见,数理统计学和教育统计学二者之间是理论与实践的关系。11/13/202330教育统计与质量评价(3)学习教育统计学的意义①统计学为科学研究提供了一种科学方法。②教育统计学是教育科学研究定量分析的重要重要工具。③广大教育工作者学习教育统计学既可以顺利地阅读国内外先进的研究成果,又可以提高工作的科学性和效率,同时也为学习教育测量打下基础。11/13/202331教育统计与质量评价(4)教育科学研究数据的特点①教育科学研究数据与结果多用数字形式呈现;②教育科学研究数据具有随机性和变异性;③教育科学研究数据具有规律性;教育科学研究的目的是通过部分数据来推测总体特征。总之,在教育科学实验或调查中,所获得的数据都具有变异性与规律性的特点。11/13/202332教育统计与质量评价(5)学习与应用教育统计学要注意的问题①在学习教育统计学时,必须克服畏难情绪;②在学习时要重点掌握各种统计方法使用的条件;③克服“统计无用”与“统计万能”的思想,要注意科研道德;④正确地选用统计方法,防止乱用统计。11/13/202333教育统计与质量评价选用统计方法步骤①要分析实验设计是否合理。即所获得的数据是否适合用统计方法去处理,正确的数量化是应用统计方法的起步,若对数量化的过程及意义不了解,则对数据统计处理是无意义的。②要分析实验数据类型。不同数据类型所使用的统计方法有很大差别,了解实验数据的类型和水平,对选用恰当的统计方法至关重要。③要分析数据的分布规律。如总体方差情况,确定其是否满足所选用的统计方法的前提条件。11/13/202334教育统计与质量评价2.1.3统计学中几个基本概念(1)总体、个体和样本总体-是指具有某种特征的一类事物的全体。分为无限总体与有限总体,N表示数目。构成总体的每个基本单元称为个体。从总体中抽取的一部分个体,称为总体的一个样本。样本中包含的个体数目称为样本容量,一般用n表示。一般情况下,n>30

的样本称为大样本;n<30的样本称为小样本。总体与样本是相对的概念。11/13/202335教育统计与质量评价总体、样本与个体总体样本个体变量X或XNxi(i=1,2…n)xi容量Nni结果参数统计量数据统计方法推断统计描述统计计数11/13/202336教育统计与质量评价(2)统计量和参数①统计量是指样本的特征值。它是根据科研实验所获得的一组观测值计算出来的一些量数,它可以描述一组数据的情况。②参数是指总体的特征值。它是描述一个总体情况的一些统计指标。11/13/202337教育统计与质量评价(3)统计量与参数之间有何区别和联系区别:①参数是从整个总体中计算得到的量数,通常是通过相应样本特征值来预测得到;统计量是从一个样本中计算出来的一些量数,它可以描述一组数据的情况。②参数代表总体的特性,它是一个常数;统计量代表样本的特性,它是一个变量,随着样本的变化而变化。③参数与统计量之间最明显的区别是参数常用希腊字母表示,而统计量常用英文字母表示。11/13/202338教育统计与质量评价联系从数值计算上讲,当总体大小已知并与实验观测的总次数相同时,统计量与参数是同一统计指标;当总体为无限时,统计量与总体参数不同,但统计量可在某种程度上作为总体参数的估计值。通过样本统计量,对总体参数做出预测和估计。11/13/202339教育统计与质量评价(4)关系图总体样本统计量描述统计作出推断随机抽样11/13/202340教育统计与质量评价2.1.4教育统计学的分类依研究的问题实质来划分,教育统计学的研究内容可划分为描述一件事物的性质、比较两件事物之间的差异、分析影响事物变化的因素、一件事物两种不同属性之间的相互关系、取样方法等等。依统计方法的功能进行分类,教育统计学的研究内容可分为描述统计、推论统计和实验设计(统计)。11/13/202341教育统计与质量评价(1)统计学或教育统计学具体内容11/13/202342教育统计与质量评价(2)描述统计(descriptivestatistics)主要研究如何整理科学实验或调查得来的大量数据,描述一组数据的全貌,表达一件事物的性质。具体内容包括:

①数据如何分组,如何使用各种统计图表描述一组数据的分布情况;②怎样计算一组数据的特征值,简缩数据,进一步描述一组数据的全貌;③表示一事物两种或两种以上属性间相互关系的描述及各种相关系数的计算及应用条件,描述数据分布特征的峰度及偏度系数计算方法等。11/13/202343教育统计与质量评价①内容搜集数据整理数据展示数据描述性分析②目的描述数据特征找出数据的基本规律02550Q1Q2Q3Q4¥x=30s2=10511/13/202344教育统计与质量评价(3)推断统计(inferentialstatistics)主要研究如何通过局部数据所提供的信息,推论总体的情形。具体内容包括:①如何对假设进行检验,即各种各样的假设检验,包括大样本检验方法(z检验),小样本检验方法(t检验),各种计数资料的假设检验的方法(百分数检验、χ2检验等),变异数分析的方法(F检验),回归分析方法等等。②总体参数的估计方法。③各种非参数的统计方法等。11/13/202345教育统计与质量评价推断统计目的对总体特征作出推断样本抽样总体推断11/13/202346教育统计与质量评价(4)实验设计主要目的在于研究如何科学地、经济地以及更有效地进行实验。具体内容包括:在实验以前对研究的基本步骤、取样方法、实验条件的控制、实验结果数据的统计分析方法等作出严格的规定。11/13/202347教育统计与质量评价(5)描述统计与推断统计的关系反映客观现象数据总体内在的数量规律性概率论(包括分布理论/大数定律和中心极限定理等)推断统计(利用样本信息和概率论对总体的数量特征进行估计和检验等)描述统计(统计数据的搜集/整理/分析/图示)总体

数据样本

数据11/13/202348教育统计与质量评价(6)描述统计、推论统计和实验设计这三部分统计内容的关系教育统计学的三个组成部分的内容不是截然分开的,而是相互联系的。描述统计是推论统计的基础,推论统计离不开描述统计计算所获得的特征值;描述统计只是对数据进行一般的分析归纳,如果不进一步应用推论统计作进一步的分析,描述统计的结果就不会产生更大的价值和意义,达不到统计分析的最终目的要求。11/13/202349教育统计与质量评价同样,只有良好的实验设计才能使所获得的数据具有意义,进一步的统计处理才能说明问题。当然一个好的实验设计,也必须符合基本统计方法的要求,否则,再好的设计,如果事先没有确定适当的统计方法处理,在处理研究结果时可能会遇到许多麻烦问题。11/13/202350教育统计与质量评价(7)教育统计与心理统计的异同相同之处:二者的研究对象都是人,教育现象在很多情况下要通过人的心理现象去观察和分析,统计方法基本相同。不同之处:①在统计方法上:在教育方面的研究中,大样本的统计方法应用较多;而在心理学上小样本的方法较多。②在实验设计的水平上:教育实验中控制因素较难,采用自然实验、准实验设计方式较多,对统计结果的解释需要特别谨慎;而心理学实验则在实验室条件下进行较多,对各种实验变量的控制相对容易,统计处理结果的解释也较易进行。11/13/202351教育统计与质量评价(8)统计在教育与心理研究中的应用①作为一门应用统计学分支学科,教育统计学基本上是随着数理统计的发展而发展的;同时心理与教育研究的发展也不断充实着统计学的方法。许多现代统计学理论最初是来自教育与心理研究的。例如,因子分析就是源出于心理学研究。11/13/202352教育统计与质量评价②英国的高尔顿最早将统计方法应用于心理学研究,首创回归原理。皮尔逊也将相关系数及χ2检验等应用于心理研究中。斯皮尔曼对心理统计的发展做了很多工作,延伸了相关系数的概念,导出等级相关系数的计算方法;提出因子分析的思想,用统计方法处理心理实验结果。11/13/202353教育统计与质量评价③贡献较大的有卡特尔、桑代克、瑟斯顿等人。1904年,桑代克出版《心理与社会测量》一书,极力提倡以心理学与统计学为工具而研究教育学,推广运用统计方法研究心理与教育方面的实验结果。20世纪20年代,瑟斯顿等人对因素分析在心理学研究中的广泛应用也作了很大贡献。11/13/202354教育统计与质量评价2.1.5数据的分类(1)从数据的观测方法和来源划分,研究数据可区分为计数数据和测量数据两大类。计数数据是指计算个数的数据,一般属性的调查获得的是此类数据,它具有独立的分类单位,一般都取整数的形式。测量数据是借助于一定的测量工具或一定的测量标准而获得的数据。11/13/202355教育统计与质量评价(2)根据数据反映的测量水平,可把数据区分为称名数据、顺序数据、等距数据和比率数据四种类型。称名数据只说明某一事物与其它事物在属性上的不同或类别上的差异,它具有独立的分类单位,其数值一般都取整数形式,只计算个数,并不说明事物之间差异的大小。11/13/202356教育统计与质量评价顺序数据是指既无相等单位,也无绝对零点的数据,是按事物某种属性的多少或大小,按次序将各个事物加以排列后获得的数据资料。等距数据是具有相等单位,但无绝对零点的数据。比率数据既表明量的大小,也有相等单位,同时还具有绝对零点的数据。11/13/202357教育统计与质量评价(3)按照数据是否具有连续性,把数据划分为离散数据和连续数据。离散数据一般取整数,在两个单位之间不能再划分细小单位。连续数据的单位可以划得很细微,细微的程度能达到只可想象而不能看见的程度。11/13/202358教育统计与质量评价(4)变量、观测值、随机变量变量是指教育实验、观察、调查中想要获得的数据。观测值是指某一变量的某个确定的取值。随机变量是指在取值之前不能预料取到什么值的变量。作为连续随机变量,其数值只是表示连续变量的中央点值,在数轴上表示的是一段距离,或一个区间。因此,一个随机变量不管写成整数或小数,实际是用一个单位的中央点表示在它以上和以下各有一段距离。11/13/202359教育统计与质量评价例如:连续随机变量1是表示0.5~1.499…。但在心理统计中也有例外的情况。如年龄的表示,一般5岁是指5岁开始到5岁11个月又30天。而作为离散的随机变量,其数值表示的是数轴上的一个点值。11/13/202360教育统计与质量评价2.2统计图表数据的初步整理次数分布表次数分布图其它类型的统计图表11/13/202361教育统计与质量评价2.2.1数据初步整理的方法(1)数据排序数据排序是指按照某种标准,对收集到的杂乱无章的数据按照一定的顺序标准进行排列。数据排序是整理数据最简单的方法。(2)统计分组统计分组是指根据被研究对象的特征,将所得数据划分到各个类别中去。对研究中所获得的大量数据进行统计分组是对数据进行整理的重要步骤。11/13/202362教育统计与质量评价统计分组应注意的事项统计分组前的准备将数据进行分组前,先要对观测数据做进一步的核对和校验。校核数据的目的是为了尽可能地消去记录误差,以便后续的统计分析建立在一个坚实的基础上。统计分组时应注意的问题①分组要以被研究对象的本质特性为基础;②分类标志要明确,要能包括所有的数据。11/13/202363教育统计与质量评价统计分组标志的类型①性质类别主要是根据事物的属性不同将被观测的事物加以划分,反映事物在组别、种类上的不同,不说明事物之间的数量差异。性质类别可根据事物的性质及研究的需要分成不同的层次,每个层次又可分为不同数量的细目。②数量类别这是以数据的取值大小为分类标志,把数据按数值大小以分组或不分组的形式排出一个顺序来。11/13/202364教育统计与质量评价(3)统计表统计表的作用统计表是用来表达统计指标与被说明的事物数量关系的表格。它可以将大量数据的分类结果,清晰、概括、一目了然地表达出来,明显地反映出事物的全貌及其蕴涵的特性,具有简明、清晰、准确的特点,表中的数据易于比较分析。统计表的结构统计表一般由表号、名称、标目、数字、表注等项构成。11/13/202365教育统计与质量评价2.2.2统计表的编制要求(1)标题,要能概括表的内容,写于表的上端中央,一般应注明时间与地点。(2)标目,标目是表格内的项目。以横、纵向标目分别说明主语与谓语,文字简明,层次清楚。医.学教育网搜集整理横标目列在表的左侧,一般用来表示表中被研究事物的主要标志;纵标目列在表的上端,一般用来说明横标目的各个统计指标的内容。11/13/202366教育统计与质量评价标目内容一般应按顺序从小到大排列,小的放在上/前面,不同时期的资料可按年份、月份先后排列,有助于说明其规律性。(3)线条不易过多,常用三条线表示,谓之“三线图”。表的上下两条边线可以用较粗的横线,一般省去表内的线条,但合计可用横线隔开。表的左右两侧的边线可省去,表的左上角一般不用对角线。11/13/202367教育统计与质量评价(4)数字以阿拉伯数字表示。表内的数字必须正确,小数的位数应一致并对齐,搜集整理暂缺与无数字的位置,分别以“…”、“-”表示,为“0”者记作“0”,不应有空项。为方便核实与分析,表一般应有合计。(5)说明一般不列入表内。必要说明者可标“*”号,置于表下加以说明。11/13/202368教育统计与质量评价统计表的结构和组成要素图示80总计93010256①非常不尽职②不尽职③不置可否④尽职⑤非常尽职人数80名员工对主管尽职情况评定表2-180名员工对部门主管尽职程度调查结果表编号表标题表目表注*注:表中的数据来源于XX表目顶线表线数据底线11/13/202369教育统计与质量评价2.2.3统计图的作用与结构(1)统计图的作用统计图是用来表达统计指标与被说明的事物之间数量关系的图形。它以直观形象的形式表达出事物的全貌及其分布特征,给人简明扼要、清晰易懂的印象,便于学习与记忆。统计图的结构统计图由图号、图题、图目、图尺、图形、图例、图注等项构成。统计图的绘制要求按统计图的组成部分逐项说明绘制要点。11/13/202370教育统计与质量评价(2)统计图结构要素意图图2-1单位员工对部门主管尽职程度评价条形图35302520151050很不

尽职不

尽职不

知道尽职非常

尽职评价人数Y轴

名称刻度

标记图尺度量单位图编号图标题轮廓线图目X轴名称填充底色X轴基线Y轴

基线11/13/202371教育统计与质量评价2.2.4常见的统计图(1)简单次数分布表简单次数分布表就是依据每一个分数值在一列数据中出现的次数或总计数资料编制成的统计表。在心理与教育研究中,许多态度、兴趣、偏好等测验或调查的结果,都能制作成这种简单次数分布表。11/13/202372教育统计与质量评价(2)排列图意大利经济学家Pareto和Lorenz在研究社会财富与人口的关系时,发现社会财富与人口的多少不是成正比关系而是近似对数关系,原因是在社会财富的分配中,少数富有者占有了社会财富的大部分,而多数人只占有其中的小部分,形成所谓“关键的少数,次要的多数”。美国质量管理专家J.M.Juran将其引进QC中用以寻找关键因素。11/13/202373教育统计与质量评价排列图例频数累积频率A类B类C类100%0Ⅰ因素Ⅱ因素

Ⅲ因素

Ⅳ因素11/13/202374教育统计与质量评价A类因素:累积频率在80%左右的因素——主要因素B类因素:累积频率在80%~90%的因素——次要因素C类因素:累积频率在90%~100%的因素——一般因素11/13/202375教育统计与质量评价注意①一般情况下,主要原因的数量不宜过多,一般不超过3个以免分散注意力。②左侧纵坐标可以是金额、件数、时间等,选择的依据是,不良品件数要与价值成正比,亦即要把造成损失大的项目放在前面。③有时能找出很多影响产品质量的因素,这时可将那些相对不重要的因素归并成一类,标以“其它”类。④通过画排列图,找出主要因素,解决以后,必然能将质量提高一大步,而后循此方法,最终能使质量达到十分完美的境界。11/13/202376教育统计与质量评价例:某校调查了大四275人次旷课的学生,他们给出的旷课原因统计如下:原因频数(人次)频率%累积频率%Ⅰ考研15556.3756.37Ⅱ私事8029.0985.46Ⅲ公事259.0994.55Ⅳ生病124.3698.91Ⅴ其它31.09100

总计27510011/13/202377教育统计与质量评价排列图如下A类B类C类频数累积

频率100%类别考研私事公事生病其它11/13/202378教育统计与质量评价(3)因果分析图来源:日本质量专家石川馨。特点:以结果为特性,以原因为因素,用箭头联系起来,表示因果关系。作图步骤:1.明确问题的结果(特性),绘出主干线和鱼刺图;2.明确5M1E因素,并绘出分支线;3.分析、寻找影响质量的中原因、小原因等,并绘出分支线;4.找出影响质量的关键因素。11/13/202379教育统计与质量评价因果分析图(鱼刺图)按照5M1E分类的鱼刺图质量

结果MaterialMachineManMethodsMeasurementEnvironment中原因小原因11/13/202380教育统计与质量评价说明应用方法:通过对生产现场人员(工人、技术员等)收集到尽可能全面的信息,按5M1E分类,同时必须将这些原因细化到可采取措施的程度。还可以将因果图与排列图结合起来用,成为因果排列概率图,可用定量方法来解决因素重要性的顺序。11/13/202381教育统计与质量评价例:复印不清楚因果分析图复印模糊复印纸药液原稿环境复印法操作人员使用时间感光度保管时间保管方法纸质量新旧度保管时间液量污染书写强弱清晰度颜色深浅稿纸质量强度卷曲度透明度手不洁房间不洁干燥时间精神不集中压稿方法交错量操作速度灯泡亮度水平灯泡不洁复印机滚筒转动不灵活11/13/202382教育统计与质量评价(4)分组、次数(频数)、分布图表当数据量很大时,应该把所有的数据先划分为若干分组区间,然后将数据按其数值大小划归到相应的组别内,分别统计各个组别中包括的数据个数,再用列表形式呈现出来,就构成了分组次数分布表。11/13/202383教育统计与质量评价分组次数分布表的编制步骤①求全距(R)

R=Xmax-Xmin②决定组数(K)与组距(i)

决定组距的大小,需要以全距为参考。组数的多少要根据数据的多少来定。如果数据的总体分布为正态,可用经验公式:K=1+3.322*lg(n)

或:K=1.87(n-1)2/5

来计算组数,然后由公式:i=R/K

来确定组距(n是样本容量)。11/13/202384教育统计与质量评价③列出分组区间列分组区间要注意以下几点:最高组区间内应包含最大值的数据,最低组区间应能含最小值的数据;最高组或最低组的下限最好是组距的整数倍;各分组区间一般在纵坐标上按顺序排列,数值大的分组区间排在上面,数值小的分组区间排在下面。11/13/202385教育统计与质量评价登记次数依次将数据登记到各个相应的组别内,一般用划线记数或写正字的方法。计算次数根据登记的结果计算各组的次数,计算各组次数的总和即总次数。抄录新表新表包括的栏目有:第一列为分组区间,第二列为各分组区间的组中值,第三列为次数11/13/202386教育统计与质量评价例,对下列50个分数,做次数分布表/图59,56,52,50,50,47,46,44,43,43,42,42,40,39,38,38,38,37,37,37,36,36,36,36,35,35,34,34,33,32,32,32,31,31,31,30,30,29,29,28,27,27,27,25,24,22,21,20,18,1711/13/202387教育统计与质量评价例次数(累积次数)分布表组别区间范围组中值次数f(频数)累积次数相对次数累积相

对次数55~5954.5~59.5572500.0410050~5449.5~54.5523480.060.9645~4944.5~49.5472450.040.9040~4439.5~44.5426430.120.8635~3934.5~39.53713370.260.7430~3429.5~34.53211240.220.4825~2924.5~29.5277130.140.2620~2419.5~24.522460.080.1215~1914.5~19.517220.040.04N=501.0011/13/202388教育统计与质量评价次数(累积次数)分布图(例)14121086420100%80%60%40%20%10%017222732374247525711/13/202389教育统计与质量评价分组次数分布表的意义与缺点分组次数分布表的意义编制分组次数分布表,可将一堆杂乱无序的数据排列成序。从表中可以发现各个数据的出现次数是多少,其分布的状态如何。分组次数分布表的缺点分组次数分布表也有缺点,仅从这张表看,原始数据不见了,只见到各分组区间及各组的次数。根据这样的统计表提供的数据资料计算得到的平均值,会与用原始数据计算的值有一定的出入。11/13/202390教育统计与质量评价(5)相对次数(频数)分布表将分组次数分布表中各组的实际次数转化为相对次数,即用频数比率(f/N)或百分比(f/N*100%)来表示次数,就可制成相对次数分布表。11/13/202391教育统计与质量评价(6)双列次数分布表双列次数分布表是对有联系的两列变量用同一表表示其次数分布。所谓有联系的两列变量,是指同一组被试中每个被试两门学业成绩分数,或两种能力分数或两种心理特点的指标,或同一组被试在两种实验条件下获得的结果等。再如,各方面基本相同的两个被试进行同一测量所得的结果也是有联系的。如果有多个这样的被试,他们的测试数据也构成有联系的两列变量。11/13/202392教育统计与质量评价编制双列次数分布表,首先按照分组次数分布表的编制方法,分别列出各变量的分组区间,将一列变量的分组区间竖列,将另一变量横列。竖列的小数端在下,大数端在上,横列的小数端在左而大数端在右。登记时,每次同一对变量同时登记在相应的格内。11/13/202393教育统计与质量评价双列次/频数分布图11/13/202394教育统计与质量评价(7)不等距次数分布表一般分组次数分布表都是等距的。但实际研究中常遇到不等距的情况,如工资级别,年龄分组等,若按等距分组不能确切地反映实际情况,这时可采用不等距分组的方法。这样的不等距分组的分组次数分布表就叫做不等距次数分布表。11/13/202395教育统计与质量评价(8)直方图(后面有详细介绍)直方图(等距直方图)是以矩形的面积表示连续性随机变量次数分布的图形。直方图一般用纵轴表示数据的次数(频数),横轴表示数据的等距分组点(即各分组区间的下限)。在制作直方图时,以组距为底边,以分组区间的精确上下限为底边二端点,以次数或频数为高画矩形,各直条矩形之间不留空隙,没有间隔。也可以不画矩形,只要使直方图包围的面积成封闭的图形即可。11/13/202396教育统计与质量评价(9)次数多边形图次数多边形图是表示连续性随机变量次数分布的线性图。绘制次数多边形图时,横坐标是以各分组区间组中值表示的连续变量,纵坐标是数据的频数。以每个分组区间的组中值为横坐标,以各组的次数为纵坐标标点,连接各点,就成为一条折线。11/13/202397教育统计与质量评价多边形图与直方图虽然都是以面积表示表示连续性数据的次数分布,但次数多边形对次数的轮廓显示得更好,组与组之间的次数过渡是连续而直接的。如果样本很大,能描绘出一条分布曲线,还可据此找到次数分布的经验公式。这样就能够对于总体的理论次数分布的分析提供很多有用的信息。11/13/202398教育统计与质量评价例:2013年工商管理班88人质量管理学考核成绩如下74.6783.2078.0069.8171.9687.3672.7083.7782.5089.5073.1983.9081.1086.7084.5687.3677.5676.0775.4693.6673.2785.3083.1687.4095.1078.3080.4073.4087.3692.3086.0083.7784.6087.4084.6081.8093.0083.9084.5680.4075.5088.8083.2087.3178.0086.0074.7683.9089.5093.7096.50

83.8680.4087.4083.9092.3086.0077.4388.1090.2090.2095.1085.3081.8082.4190.2090.2090.9083.9086.0081.0180.2781.8083.8686.0088.1073.1485.3090.2095.1083.9086.0081.7671.1381.1080.2369.7374.0611/13/202399教育统计与质量评价2013年工商管理班88人质量管理学考核成绩分布表分组区间频/次数频率累积频率%0~60[0,60)000.00%60~65[60,65)000.00%65~70[65,70)20.02272.27%70~75[70,75)100.113613.63%75~80[75,80)80.090922.72%80~85[80,85)310.352357.95%85~90[85,90)220.2582.95%90~95[90,95)110.12595.45%95~100[95,100]40.0455100%11/13/2023100教育统计与质量评价2013年工商管理班88人质量管理学考核成绩直方图频数多边形直方图边界直方图11/13/2023101教育统计与质量评价(10)其它常用的统计图的类型①条形图(直条图)条形图主要用于表示离散型数据资料,它是以条形长短表示各事物间数量的大小与数量之间的差异情况。②圆形图(饼图)圆形图主要用于描述间断性资料,目的为显示各部分在整体中所占的比重大小,以及各部分之间的比较。圆形图显示的资料多以相对数(如百分数)为主。11/13/2023102教育统计与质量评价2013年工商管理班88人质量管理学考核成绩饼图

区间频率[0,60)0[60,70)2[70,80)18[80,90)53[90,100]1511/13/2023103教育统计与质量评价③线性图线性图更多地用于连续资料,凡欲表示两个变量之间的函数关系,或描述某种现象在时间上的发展趋势,或一种现象随另一种现象变化的情形,用线性图表示是较好的方法。④散点图散点图是用相同大小圆点的多少或疏密表示统计资料数量的大小,以及变化趋势的图。通常以圆点的分布的形态表示两种现象间相关程度。11/13/2023104教育统计与质量评价例下表是某公司2013年各月份营业额统计表,试根据所给数据绘制统计图(单位万元)。月份123456789101112产值20273235424346515263687211/13/2023105教育统计与质量评价⑤柱状图(条形图)11/13/2023106教育统计与质量评价⑥折线图11/13/2023107教育统计与质量评价⑦散点图11/13/2023108教育统计与质量评价⑧多变量数据—气泡图用以展示三个变量之间关系的一种图形。在散点图的基础上,将点变成有大小的气泡。一个变量为横坐标,一个变量为纵坐标,而第三个变量用气泡的大小表示。如。在下图中就是以降温度、雨量与产量为变量的气泡图。11/13/2023109教育统计与质量评价例研究某行业企业产值与所拥有的人力资源素质之间的关系,现在收集到如下数据,试作雷达图。

高工以上(人)本科以上(人)净产量(万元)16252250284034503105845004136857505141105800616987500721120825011/13/2023110教育统计与质量评价11/13/2023111教育统计与质量评价⑨多变量数据—雷达图设有n组样本S1,S2,…Sn,每个样本测得P个变量X1,X2,…,Xp,要绘制这P个变量的雷达图,其具体做法是先做一个圆,然后将圆P等分,得到P个点,令这P个点分别对应P个变量,在将这P个点与圆心连线,得到P个幅射状的半径,这P个半径分别作为P个变量的坐标轴,每个变量值的大小由半径上的点到圆心的距离表示,再将同一样本的值在P个坐标上的点连线。这样,n个样本形成的n个多边形就是一个雷达图。11/13/2023112教育统计与质量评价多变量数据—雷达图例2013年某区城乡居民家庭平均每人各项生活消费支出构成数据如表。试绘制雷达图。2013年平均每人生活消费支出构成(%)项目城镇居民农村居民食品衣着家庭设备用品/服务医疗保健交通通讯娱乐教育文化服务居住杂项商品与服务39.1810.018.796.367.9012.5610.015.1749.305.754.525.245.5811.1815.473.1411/13/2023113教育统计与质量评价11/13/2023114教育统计与质量评价某企业月产值雷达图11/13/2023115教育统计与质量评价⑩数据类型及图示(小结)学会用Excel制作所需图形数据分类数值数据品质数据饼图环形图直方图茎叶图线型图雷达图箱线图折线图散点图气泡图条形图汇总表分组数据原始数据时序数据多元数据11/13/2023116教育统计与质量评价思考直方图、条形图、圆形图、线性图、散点图等这些常用的统计图,根据它们表现的作用和内容,把它们可分为哪几类?答:根据它们的作用和内容,可分为五类。(1)表现分布的图,比如直方图。(2)表现内容的图,如条形图和圆形图。(3)表现变化的图,这种图形的代表是线性图。(4)表现比较的图,这几种图形都能采用。(5)表现相关的图,如散点图。11/13/2023117教育统计与质量评价2.3集中量数算术平均数中数众数其它集中量数

(加权平均数、几何平均数、调和平均数等)11/13/2023118教育统计与质量评价2.3.1集中量数的概念集中量数就是对一组数据的集中趋势特点进行度量和描述的统计量。它反映了次数分布中大量数据向某方向集中的程度。常用的集中量数有算术平均数、中数、众数、加权平均数、几何平均数、调和平均数等。11/13/2023119教育统计与质量评价2.3.2算术平均数的概念(1)定义算术平均数是所有观察值的总和除以总频数所得之商。用或M表示。若以X1,X2,···,XN表示变量X的各个观察值,N表示观察值的个数,则算术平均数可表示为:11/13/2023120教育统计与质量评价(2)算术平均数的特点①在一组数据中每个变量与平均数之差的总和等于0,即。②在一组数据中,每一个数都加上一常数C,则所得的平均数为原来的平均数加常数C,即。③在一组数据中,每一个数都乘以一常数C,则所得的平均数为原来的平均数乘以常数C,即。11/13/2023121教育统计与质量评价(3)算术平均数的计算方法①未分组数据(原始数据)计算法②数据分组后(次数分布表)计算法

(式中XC为各区间的组中值,f为各区间的次数)11/13/2023122教育统计与质量评价(4)算术平均数的优缺点算术平均数具备一个良好的集中量数所应具备的一些条件:①反应灵敏;②严密确定;③简明易懂;④计算简单;⑤适合代数运算;⑥较少受抽样变动的影响。11/13/2023123教育统计与质量评价此外,算术平均数还有以下一些特殊的优点①只知一组观察值的总和及总频数就可以求出算术平均数;②用加权法可以求出几个平均数的总平均数;③用样本数据推断总体集中量数时,算术平均数最接近总体集中量数的真值,它是总体平均数的最好估计值;④在计算方差、标准差、相关系数以及进行统计推断时,都要用到它。11/13/2023124教育统计与质量评价但是算术平均数也有一些缺点:①易受极端数据的影响;②若出现模糊不清的数据时,无法计算平均数。11/13/2023125教育统计与质量评价(5)算术平均数意义、适用条件及应用原则①算术平均数的意义

算术平均数是应用最普遍的集中量数,它是“真值”渐近、最佳的估计值。②算术平均数的适用的条件

一组数据是比较准确,可靠又同质,而且需要每一个数据都加入计算,同时还要作进一步代数运算时,这时就需要用算术平均数表示其集中趋势。11/13/2023126教育统计与质量评价2.3.3中数(中位数)的概念(1)定义中数是按顺序排列在一起的一组数据中居于中间位置的数,即在这组数据中,有一半的数据比它大,有一半的数据比它小。中数用Md

表示。11/13/2023127教育统计与质量评价(2)未分组数据(原始数据)求中数的方法①一组数据中无重复数值的情况

指一组数据中没有相同的数,这时取处于序列中间位置的那个数为中数。如果数据个数为奇数,则中数为(n+1)/2位置的那个数;如果数据个数为偶数,则中数为居于中间位置两个数的平均数,即第n/2与第n/2+1位置的两个数据的平均数。11/13/2023128教育统计与质量评价②一组数据中有重复数值的情况指一组数据中有相同数值的数据,这时计算中数的方法基本与无重复数值的单列数据相同。但根据重复数值数据在该组数据中所处的位置又细分为以下两种情况:当重复数值没有位于数列中间时,求中数的方法与无重复数据时求中数的方法相同。当重复数目位于数列中间时,需要假设位于中间的几个重复数目为连续数目,取序列中上下各n/2那一点上的数值为中数。11/13/2023129教育统计与质量评价数据分组后(次数分布表)求中数的方法将原始数据整理成次数分布表后,求中数的原理同重复数目求中数是一样的,也是取序列中将N平分为两半的那一点的值作为中数。

式中Lb为中数所在分组区间的精确下限,La为中数所在分组区间的精确上限,Fb为该组以下各组的累加次数,Fa为该组以上各组的累加次数,fMa为该组的次数。11/13/2023130教育统计与质量评价(3)中数的意义与应用①中数的意义中数虽然也具备一个良好集中量数所应具备的一些条件,如计算简单,严密确定,简明易懂;但与算术平均数相比是相形见绌的,如反应不够灵敏,受抽样的影响较大,不适合代数运算等。因此,在一般情况下,中数不被普遍应用,但在一些特殊情况下,它的应用受到重视。11/13/2023131教育统计与质量评价②中数适用的情况当一组观测结果中出现两极端数目时;当次数分布的两端数据或个别数据不清楚时;当需要快速估计一组数据的代表值时。11/13/2023132教育统计与质量评价例一项研究调查了19名大学生,他们的月消费(单位:人民币元)如下:720,727,730,731,732,732,735,

736,737,739,740,745,746,749,

753,758,760,1210,1300如何评价他们的平均月消费?11/13/2023133教育统计与质量评价解:由于这19名大学生的月消费中存在极端数据,算术平均数(793.68元)不能很好地反映他们的平均月消费(19人中17人月消费低于772.63元),应求中数:

(N+1)/2=(19+1)/2=10

Md=739元

即:这些大学生的平均月消费是739元。11/13/2023134教育统计与质量评价2.3.4众数的概念(1)定义众数有理论众数和粗略众数两种定义方法。理论众数是指与次数分布曲线最高点相对应的横坐标上的一点。粗略众数是指一组数据(或次数分布)中次数出现最多的那个数的数值。众数用Mo表示。11/13/2023135教育统计与质量评价(2)众数的计算方法①用观察法直接寻找粗略众数

在一组原始数据中,次数出现最多的那个数值就是众数;在次数分布表中,次数最多一组的组中值就是粗略众数。11/13/2023136教育统计与质量评价②用经验公式求理论众数的近似值皮尔逊经验法

Mo=3Md-2M

(适合正态分布)金氏插补法

(适合偏态分布)

其中Lb为含众数这一区间的精确下限,fa为高于众数所在组一个组距那一分组区间的次数,fb为低于众数所在组一个组距那一分组区间的次数。11/13/2023137教育统计与质量评价(3)众数的意义与应用①众数的意义众数虽然简明易懂,较少受两极端数值的影响,但它并不具备一个良好集中量数的基本条件。如极不准确、稳定,反应不灵敏,不适合代数运算,受抽样的影响较大等。因此,在一般情况下,众数应用也不广泛,但在一些特殊情况下也常有应用。11/13/2023138教育统计与质量评价②众数适用的情况当需要快速而粗略地寻求一组数据的代表值时;当一组数据出现不同质的情况时;当次数分布中有两极端的数目时;当粗略估计次数分布的形态时。11/13/2023139教育统计与质量评价例学校要召开运动会,决定从高一年级8个班中抽调40名男生组成一个整齐的彩旗方阵队,如果从高一(1)班的体检表中任意抽出10份男生表格,得到10个男同学的身高(单位:米)如下:1.631.601.681.661.66

1.631.751.661.581.65请根据这10个身高值提供的信息确定参加方队学生的最佳身高值应取多少?并说明理由。11/13/2023140教育统计与质量评价解参加方队学生的最佳身高值应取1.66。这是因为从这10个身高值可以看出,1.66出现的次数最多,是这组数的众数,既然这10个男生中有3个身高为1.66米,而一个班远不止10个男生,那么8个班的男生中应该能选出40名这种身高的人。11/13/2023141教育统计与质量评价2.3.5算术平均数、中数、众数之间的关系(1)当次数分布呈正态时:

M=Md=Mo(2)当次数分布呈正偏态时:

M>Md>Mo

且M-Mo=3(M-Md)

(3)当次数分布呈负偏态时:

M<Md<Mo

且M-Mo=3(M-Md)11/13/2023142教育统计与质量评价位置平均数与算术平均数的关系当倾斜不大时:Mo=3Md=2MfMo=Md=MfMo<Md<MfM<Md<Mo对称分布正偏态分布(右)负偏态分布(左)11/13/2023143教育统计与质量评价2.3.6加权平均数加权平均数是不同比重数据(或平均数)的平均数,用Mw表示。加权平均数的计算方法(式中Wi为权数)加权平均数的应用当测量所得的数据,其单位权重并不相等时,要用加权平均数来求平均数。11/13/2023144教育统计与质量评价2.3.7几何平均数几何平均数是N个数值连乘积的N次方根,用Mg表示。几何平均数的计算方法。

Mg=(X1X2…Xn)1/n=(ΠXi)1/n

几何平均数的应用(1)直接应用公式计算几何平均数

当一组实验数据中有少数数据偏大或偏小,数据的分布呈偏态时,要用几何平均数作为集中趋势代表(2)应用几何平均数的变式计算

当一组数据彼此间变异较大,几乎是按一定的比例关系变化时,要用几何平均数计算平均比率。11/13/2023145教育统计与质量评价2.3.8调和平均数调和平均数(倒数平均数)是一组数据倒数的算术平均数的倒数,用MH表示。调和平均数的计算方法调和平均数的应用调和平均数在心理与教育研究方面的应用,主要是用以描述学习速度方面的问题。11/13/2023146教育统计与质量评价2.4差异量数全距与百分位差平均差、方差与标准差标准差的应用差异量数的选用11/13/2023147教育统计与质量评价(1)差异量数的概念差异量数就是对一组数据的变异性(离中趋势)特点进行度量和描述的统计量。它反映了次数分布中数据彼此分散的程度。常用的差异量数有全距、四分位差、百分位差、平均差、标准差与方差等等。11/13/2023148教育统计与质量评价(2)为什么要引入差异量数在教育研究中,要全面描述数据的特征,不但要了解数据的典型情况,而且还要了解特殊情况。这些特殊性常表现为数据的变异性。因此,只有集中量数不可能真实地反映它们的分布情况。为了全面反映数据的总体情况,除了使用集中量数外,还需要引入差异量数。11/13/2023149教育统计与质量评价2.4.1全距(1)全距的概念全距是一组数据中最大值与最小值之差。全距用R表示。全距的计算方法

①原始数据的全距是最大值与最小值之差。

②次数分布表的全距一般是最大一组与最小一组的组中值之差,或者是最大一组上限与最小一组下限之差。11/13/2023150教育统计与质量评价(2)全距的意义与应用全距概念清楚,意义明确,计算简单,但它仅由最大值与最小值而求得,易受两极端数值影响。不考虑中间数值的差异,它反应不灵敏,因此,它只是一种低效的差异量数。它的用处一般只用于研究的预备阶段,用它检查数据的大概散布范围,以便确定如何进行统计分组。11/13/2023151教育统计与质量评价2.4.2百分位数(1)百分位数的概念百分位数是位于依一定顺序排列的一组数据中某一百分位置的数值。百分位数一般用Pp表示。百分位数的计算方法这里Lb

表示百分位数所在组的精确下限,Fb表示小于Lb的各组次数的和。11/13/2023152教育统计与质量评价(2)百分等级百分等级的概念百分等级是指表示某一分数在整个分数分布中所处的百分位置。百分等级用PR表示。百分等级的计算方法这里Lb

表示该分数所在组的精确下限,Fb表示小于Lb的各组次数的和。11/13/2023153教育统计与质量评价(3)百分位差概念和计算。百分位差是指两个百分位数之差。常用的百分位距有两种:一种为第90与第10百分位数之差,用P90-P10表示。二种为第93与第7百分位数之差,用P93-P7表示。百分位差的意义与应用百分位差与全距相比,虽然少受两极端数值的影响,但仍然不能很好地反映中间数据的散布情况,因此只作为主要差异量的补助量数,在实践中很少使用。11/13/2023154教育统计与质量评价(4)四分位差Ⅰ四分位差是指在一个次数分布中,中间50%的次数的全距的一半。四分位差用Q表示。四分位差的计算方法

①未分组数据(原始数据)计算法

Q=(Q3-Q1)/2

其中Q1(第25百分位数)与Q3(第75百分位数),求法可参照原始数据中位数的计算方法。11/13/2023155教育统计与质量评价②数据分组后(次数分布表)计算法Q=(Q3-Q1)/2,其中

这里Lb表示百分位数所在组的精确下限,Fb表示小于Lb的各组次数的和,f表示百分位数所在组的次数。11/13/2023156教育统计与质量评价四分位差Ⅱ①四分位差的意义四分位差简明易懂,计算简便,较少受两极端数值的影响,比全距可靠得多。但它忽略了左右共50%数据的差异,又不适合代数运算,反应不够灵敏,因而也限制了它的应用,它通常与中数联系起来共同应用。②四分位差适用的情况有特大或特小两极端数值,有个别数值不确切、不清楚,以及用等级表示的数据等情况。11/13/2023157教育统计与质量评价(5)动差体系动差是指力与力点与原点之间距离的乘积。统计学用此概念表示次数分布的离散情况。它把各组次数当做力学上的力,用数值(或组中值)与原点之差作为距离来计算动差,并且把以平均数为原点的动差叫做中心动差。常见的中心动差有:一级动差

11/13/2023158教育统计与质量评价二级动差

(μ2是表示一个分布中离中趋势的指标)

三级动差

(μ3是表示一个分布中偏斜度或偏态性的指标)四级动差

(μ4是表示一个分布中峰态性的指标)11/13/2023159教育统计与质量评价(6)平均差平均差的概念平均差是指次数分布中所有原始数据与平均数绝对离差的平均值。平均差用A.D.表示。平均差的计算方法①未分组数据(原始数据)计算法

②数据分组后(次数分布表)计算法11/13/2023160教育统计与质量评价平均差意义平均差意义明确,计算容易,反应灵敏,较好地代表了数据分布的离散程度。但它计算要用绝对值,不利于进一步做统计分析,应用受到了限制,属于一种低效差异量数。11/13/2023161教育统计与质量评价2.4.3方差与标准差的概念(1)定义方差是指离均差(即每个数据与该组平均数之差)平方的算术平均数,用s2表示。标准差是指方差的算术平方根,用s表示。11/13/2023162教育统计与质量评价(2)方差与标准差的计算方法(1)未分组数据(原始数据)计算法

基本公式:

变式公式:11/13/2023163教育统计与质量评价(2)数据分组后(次数分布表)计算法基本公式:

变式公式:

或式中(AM为估计平均数)11/13/2023164教育统计与质量评价(3)总标准差的的合成由于方差、标准具有可加性,在已知几个小组的方差或标准差的情况下,可以计算出几个小组联合在一起的总的方差或标准差。计算总方差和总标准差的公式如下:

式中,为总平均数,为各小组的平均数。11/13/2023165教育统计与质量评价(4)方差与标准差的性质①每一个观

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论