现代心理与教育统计学_第1页
现代心理与教育统计学_第2页
现代心理与教育统计学_第3页
现代心理与教育统计学_第4页
现代心理与教育统计学_第5页
已阅读5页,还剩49页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

心理统计学第一章概述描述统计定义:研究如何把心理与教育科学实验或调查得来的大量数据科学的科学的加以整理概括和表述作用:使杂乱无章的数字更好的显示出事物的某些特征,有助于说明问题的实质。具体内容:1数据分组:采用图与表的形式。计算数据的特征值:集中量数(平均数中数)离散量数(方差)计算量事物间的相关关系:积差相关(2列3列多列)推断统计定义:主要研究如何利用局部数据(样本数据)所提供的信息,依据数理统计提供的理论和方法,推论总体情形。作用:用样本推论总体。具体内容:1如何对假设进行检验。如何对总体参数特征值进行估计。各种非参数的统计方法。心理与教育统计基础概念数据类型一从数据来源来划分1计数数据:计算个数或次数而获得的数据。(都是离散数据)2测量数据:借助一定测量工具或测量标准而获得的数据。(连续数据)二根据数据所反映的测量水平1称名数据(分类)定义:指用数字代表事物或数字对事物进行分类的数据。特点:数字只是事物的符号,而没有任何数量意义。统计方法:百分数次数众数列联相关卡方检验等。(非参检验)2顺序数据(分类排序)定义:指代事物类别,能够表明不同食物的大小 等级或事物具有的某种特征的程度的数据。(年级)特点:没有相等单位没有绝对零点。不表示事物特征的真正数量。统计方法:中位数百分位数等级相关肯德尔和谐系数以及常规的非参数检验方法。3等距数据(分类排序加减(相等单位))(真正应用最广泛的数据)定义:不仅能够指代物体的类别 等级,而且具有相等的单位的数据。(成绩温度)特点:真正的数量,能进行加减运算,没有绝对零点,不能进行乘除计算。统计方法:平均数标准差积差相关Z检验t检验F检验等。4比率数据(分类排序加减法乘除法(绝对零点))定义:表明量的大小,也具有相等单位,同时具有绝对零点。(身高反应时)特点:真正的数字,有绝对零点,可以进行加减乘除运算。在统计中处理的数据大多是顺序数据和等距数据。按照数据是否具有连续性连续数据变量观测值随机变量变量:指心理与教育实验观察调查种想要获得的数据。数据获得前用“ X”表示,即为一个可以取不同熟知的物体的属性或事件,其数值具有不确定性,因而称为变量。观测值:是研究中确定的某一变量的取值。随机变量:表示随机现象各种结果的变量称为随机变量三 总体 样本个体总体 :具有某种共同特质的一类事物。(欲研究的研究范围)样本 :构成总体的每个基本单元。个体:从总体重抽取的部分个体组成的群体。样本容量超过 30为大样本反之为小样本。四 次数比率频率与概率次数:某一事件在某一类别中的数目。比率:(比例百分数)两个数相比。频率:(相对次数)某一事件发生的次数被总的事件数目出。常用比例百分数表示。概率:用符号 P表示,指某一事件在无限观测中所能预料的相对出现的次数。五统计量和参数1参数:(总体参数)描述一个总体情况的统计指标用希腊字母表示。(小写)(大写表示运算符)总体平均数总体标准差总体相关系数总体回归系数2统计量:(特征值样本统计量)描述一组数据的情况。样本统计量用英文表示样本平均数样本标准差样本相关系数样本回归系数小结描述统计心理与教育统计学内容 推论统计实验设计计数数据测量数据比率数据数据类型 称名数据顺序数据等距数据比率数据离散数据计数数据变量观测值随机变量心理与教育统计基础概念 总体样本个体次数频数概率参数统计量练习题1等距量表的特点是()A无绝对零点,无相同单位。B无绝对零点,有相同单位。C有绝对零点,无相同单位。D有绝对零点,有相同单位。2下列量表中具有绝对零点的是()A称名量表B顺序量表C等距量表D比率量表教师的职称和薪水这两个变量的数据类型分别属于()A命名数据 等比数据B等距数据 等比数据C顺序数据 等距数据D顺序数据 等比数据下列数据类型属于比率数据的是()A智商分数B反应时C年纪D 数学成绩练习题思路解析B 见第一页D 见第一页D 职称:讲师副教授教授 这三个职称能排序,但不能做加减法。(顺序数据)薪水:xyz能排序能做加减法,也具有绝对零点(没工资)能做乘除法。(比率数据)(等距数据)B智商分数:加减法可做不能做乘除(智商测量表测量出来人为规定零)(等距数据)反应时:有绝对零点(比率数据)年级:只能大小排序(顺序数据)数学成绩:人为规定零点(等距数据)第二章统计图表(重要但不怎么考)(图表的特点)第一节数据的初步整理(将数据制成统计图表的第一步)一数据排序排序就是按照某种标准,对收集到的杂乱无章的数据按照一定的顺序标准进行排列。数据排序是正理数据最简单的方法。二统计分组统计分组只根据被研究对象的特征,将所得到的数据划分到各个分组中去。

数据的取舍原则:三个标准差原则二统计表统计表:用来表达统计指标与被说明的事物间关系的表格。特点:简洁清晰准确表中数据易于比较分析。三线表H*门口看管I5.I帝权联4,4广H*门口看管I5.I帝权联4,4广"中Cf网*tKK喷】甘I甘怅职悔戒的博』' J四统计图统计图:用来表达统计指标与被说明事物之间数量关系的图形,是统计数据资料的可视化显示方式。第二节次数分布表(最重要的一类统计表)(皮尔逊 次数分布表次数分布图)一简单次数分布表(既可用于计数数据的整理,又可用于测量数据的整理)简单次数分布表:依据每一个分数值在一列数据中出现的次数或总计数资料编制成的统计表。特点:对数据资料的来源没有过多要求,编制过程简单,应用广泛。二分组次数分布表当数据的取值过多时,不适合每个值记录一个频次。把所有数据先划分为若干个分组区间, 然后将数据按其数值大小划归相应组内, 分别计算各个组别中的数据个数,再用列表的形式呈现出来,就构成了 分组次数分布表。制作过程:1求全距(离散量度)全距=最大值-最小值(离散2决定组数0.4组数K1.87N1 (N为数据个数,K取近似整数)(经验公式)3决一组距(任意一组的起点和终点之间的距离)组距是一个组的上限与下限之差 组距=全距/组数4列出分组区间(组限)(一个组起点值与终点值之间的距离)组上限:一个组的终止点组下限:一个组的起始点表示方法:表述组限:10-19 20-29 30-39精确组限:分组次数分布表的意义与缺点意义:显示数据的分布状况,集中状况。假设:各区间的数据均匀分布,并用各组的组中值代表各原始数据。缺点:由于假设所造成的误差为 归组效应。三相对次数分布表1含义:相对次数是指各组次数 f对数据总>个数N的比值,用符号f/N表示。所有相对次数之和 汇f/N等于1.2制作:将分组次数分布表的各组次数转化为相对次数,用f/N或f/NX100%作标志来表示次数就制成了相对次数分布表。四累加次数分布表1实际累加次数把各组次数f由下而上或由上而下依次累加的和,用符号 cf表示。2相对累加次数1.把各组的相对次数p由上而下或由下而上依次累加的和,累加之和为1.五双列次数分布表(相关次数分布表)1含义:对有联系的两列变量用一个表来表示次数分布。(体重与血压;智力与成绩)2制作:先按照分组次数表的编制方法,分别列出各变量的分组区间,登记时,每次同一对变量同时登记在相应的格内。第三节次数分布图一直方图(又称等距直方图,用于等距变量)用一系列宽度相等、高度不一的矩形表示数据分布的统计图。 以矩形的面积表示连续性随机变量次数分布的图形。一般用纵轴表示数据的频数,用数轴表示数据的等距分组点,也就是各组分组区间的上限和下限,有时也使用组中值。二次数多边图(变化趋势)一种线形图,凡是等距分组的可以用直方图表示的数据,都可以用次数多边图表示。绘制时,横坐标是用各分组区间组中值表示的连续变量,纵坐标是数据的次数。以每分组区间的组中值为横坐标,一个组的次数为纵坐标标点,连接各点,就成为一条折线。

三累加次数分布图在累加次数分布表的基础上绘制的, 有直方图式和曲线式两种,最为常用的是累加曲线图。累加次数分布曲线横轴:原始分数 百分位数纵轴:等级排名 百分等级正偏态分布:小端的数据特别多,大端的数据不是很多,比较分散,表现在曲线就是上肢长于下肢。(分数分布在低端)负偏态分布:大端的数据比较多,小端的数据不是很多,但比较分散,表现在曲线就是下肢长于上肢。(分数分布在高端)50%)正态分布:中端的数据最多,两端的数据少,平均两侧的数据个数差不多,表现在曲50%)是上肢和下肢长度相当。(中数众数平均数三合一、曲线上拐点

第四节其他类型的统计图表条形图表示的是离散型数据资料,宜用宽度相同的条形长短或高低来表示统计数据的大小或变动情况的统计图。一个是分类轴(横轴),表示类别,描述的是计数的数据。(离散数据(类别))一个是数量轴(纵轴),表示大小多少,描述的是计量数据。(连续数据(测量数据))aVWM帧#"节14ifrluaVWM帧#"节14ifrluribbV1冷的陋6摩,|中A的条形图与直方图的本质区别(选择 简答多选)条形图与直力图的本质区别条形图直观图数据类型离散数据(分类)连续数据(分组区间)数据表示方式直条的长度面积坐标轴(横轴)分类轴刻度值直观状态有间隔没有间隔二圆形图(饼图)以整个圆的面积带鞭被研究对相的总体,按照组成部分占总体的比重大小,把圆面积成若干扇形,用来表示某一现象的部分对总体的比例关系。适用于离散性的数据。三线形图1用来表示连续性资料.是以起伏的线条来说明事物因时间、条件推移而变迁的趋势。(考点)2表示的是两边两之间的函数关系或描述某种现象的发展趋势,或一种现象随着另一现象变化发展的情形。3通常用横轴表示自变量,用纵轴表示因变量。1*四散点图1用相同大小的圆点的多少或疏密表示统计资料数量的大小以及变化趋势等。2还可以表示相关程度。 (正相关、负相关、无相关、可能相关)练习题1某考生最高分为81分,在下列次数分布表中,能直接判断有多少考生得分比他低的是()A简单次数分布表B分组次数分布表C累加次数分布表D相对次数分布表2运用相对累加次数分布曲线,可以快速计算出原始分数相对应的统计量是()A百分等级BZ分数CT分数D频次适用于描述某种心里属性在时间上的变化趋势的统计分析图()A茎叶图B箱形图C散点图D线形图用于描述两个变量之间相关关系的统计图()A直方图B线形图C条形图D散点图答案及解析C见第5页AD见第7页点9年次数4卜小j衣,”次畋"&411乂寸7欠 布j分化it& 火力117欠敬9>益我小/irt,次数4AAi友XX歹“7欠数4〉<\i&]|*1-次数手小I,仁I乜阳inirrjjwIKAllIlliid£统“伯东)移阁IMI心BH线性图恢儿Y图前两章没什么特别重要的知识但不要放松必拿分数。

第三章集中量数(2-3选择)数据的集中趋势就是指数据分布中大连数据朝向某个方向集中的程度,用于描述数据集中程度的统计量。第一节算书平均数概念及计算公式1概念算术平均数,是所有观测值(或变量)的总和除以总数所得得商。符号:X或M2计算公式公式一(平均数的定义公式)Xi公式二(平均数的估算公式)XXAM AM估算值N例题现有一组实验观测数据, 25272827252930343233.计算他们的平均数。解法一:根据题意已知N=10,根据公式:X -- 2闵解法二:先设定一个估计平均数AM=27,求x=Xi-A的值。Xi 252728272529303432X -2010 -22375先估计平均值为27(预估计)(大的数据用估计法好算 有利于简化计算过程)平均数的特点一组变量值的和等于变量的个数与平均数的乘积,

一XNX一组变量值的离均差之和等于零,(说明了平均数是一组数据的重心 最能表达组数据的集中趋势)一(XX)0在一组变量中,每个变量值加上或减去、乘以或除以常数 c,所得的平均数等于原平均数加上或减去、乘以或除以常数 Co三平均数的意义平均数是应用最普遍的一种集中量数。2是真值渐进、最佳的估计值。(概率分布中心极限定理)(真值 二科总体平均数)3当观测次数无限增加时,算术平均数趋近于真值。(样本平均数量趋近于总体平均数)(观测次数较少时样本统计量是总体参数的无偏估计)四平均数的优缺点(选择题的重要内容)1优点:反应灵敏;计算严密:计算简单;内容容易理解;适合进一步代数运算、较少受抽样变动的影响。2缺点:容易受极端数据的影响;如果出现模糊不清的数据,无法使用。第二节中数与众数中数中数又称中位数,间称中数用Md表示,是按一定顺庄排列的一组数中央位置的数值。中数是一种位置量数。中数的计算(主要考中数的计算方式)1中数附近无重复数时若数据个数(N)佥数时,中数则为(N+1)/2位置的那个数。若数据个数(N)偶数时,中数则为居于中间两个数的平均数2中数附近有重复数时(难点没考过考很正常)采用画图法例:求111111111313131717分析:N=9中间位置为5,第5个数为13。但数据中有3个13,意味着3个13占了一个单位。(统计学上把13看为一个区间,三个13共享这个区间,把区间划分为三段,

第一小段的组中值众数1含义:众数(mode)是指一群数据中出现次数最多的那个数 ,不只有一个,用示。2计算方法:(1)直接观察法未分组数据一次数最多的数值次数分布表一次数最多一组的组中值(2)公式计算法皮尔逊经验公式:(牢记)一平均数中数众数三者间的关系(出小了计算形式为主的选择题出大了简答题)1正态分布MdMoX2偏态分布平均数中数众数三者间的关系(出小了计算形式为主的选择题出大了简答题)1正态分布MdMoX2偏态分布Xo3Md2XMo表■i*।左偏分布=负偏态右偏分布=正偏态(比较三数大小直接画图即可直观看出)第三节其他集中数(往往没怎么考过)(统计中基本不考)一加权平均数是观测数据(Xi)与相应的权数(W)乘积的和除以总权数(W|W2W3 Wn)所得的商。用符号Mw表示。权数是指各变量在构成总体重的相对重要性,权数的大小,由观测者依据一定的理论或经验而定。MWiXiW2X2..…WnXnn WiW2…..…Wn每个数对总体的贡献不一样权重不一样二几何平均数三调和平均数:先将各个数据取倒数平均,然后再取倒数,表述符号为 Mh,主要用于描述速度方面的集中趋势。练习题1现有一列数据,4453552。这列数据的平均数、众数和全距依次是()TOC\o"1-5"\h\zA 4 4 2B 4 5 3C 5 4 4D 5 5 12有一组数据 36273248要描述这组苏剧的特征,受极端数据之影响的统计量是()A平均数B中数C四分位数D众数3数据259118910131024的中位数是()4一组数据的分布曲线称双峰状态,据此可以推测改组数据中可能有两个()A中数B众数C平均数D几何平均数5要比较几个不同性质的测验分数,比较恰当的是比较()A原始分数B众数C百分等级D平均数6测验总分呈负偏态分布说明测验难度()A偏难B偏易C适中7甲乙两图表示数据分布形态分别是()8描述甲乙靓图特征的集中量数中,数据最大的分别是()答案及解析B选择题用省时间的方式哪个好算先算那个A见第B5C百分等级是原始分数在所在团体中的位置7正偏态负偏态框架小结算术平均数(定义公式特点)集中量数 中数(特点计算方法)众数(计算特点)三者之间的关系(正态 偏态)众数 最具代表性的最具优势的中数 当个别数据偏大或偏小时用中数比较合适平均数第四章差异量数表示一组数据的差异情况或离散程度的量数.:反应数据的分布的离中趋势:描述事物差出生的表现。差异量越小,平均数的代表性越好。差异量越大,平均数的代表性越差。第一节全距与百分位差(容易受极端数据影响 不怎么用)一全距(没用)定义:一列数据中最大数与最小数之差特点:不可靠不灵敏百分位差(一)百分位数(原始分数) --百分等级定百分比,量尺上的一个点,在此点以下包括数据分布中全部数据个数的一定百分比,定百分比,号为 PP。P75 90百分位数为90(90为原始分数)在90分以下的包含了整个数据的75%(二)百分位差TOC\o"1-5"\h\zP90 P10四分位差四分位数可视为百分位数的特例,用Q来表示。P25P50P75把数据分成四等份,所以称为四分位数。P25(第一个四分位, Q1)P50(第二个四分位, Q2)P75(第三个四分位, Q3)3四分位差是百分位差的特例:(P75P25)/2(Q3Qi)/2实质:反映了中间50%数据的离散程度。四分位差越小中间50%数据越集中四分位差越大中间50%数据越离散四百分等级 (Pr表示)1含义:指某个数据在整个数据中所处的百分位置。2作用:可以表示任何一个分数在该团体中的相对位置。Pp百分等级一百分位数PR百分位数一百分等级第二节平均差/方差与标准差(有单位不能比较不同事物的离散程度)平均差1含义:原始数据与平均数绝对离差的平均值。2符号:A.D.xinA.D. 平均差x 离均差3特点:

较好反映了数据分布的离散程度;平均差是绝对值,使用受到了限制; (绝对值不容易进一步代数运算)属于低效的差异量数。方差与标准差1含义:(1)方差:离均差平方的算数平均数,表示一列数据平均差距的平方。2符号: 样本方差一一S22总体方差一一22S2(定义公式)(XX)S2(定义公式)N(2)标准差:方差的算数平方根,表示一列数据的平均差距。符号样本标准差符号样本标准差总体标准差2一XXs N计算过程 1先计算平均数2求离均差的平方和3代入方差和标准差的公式完整表述一列数据:X(M,S)2方差、标准差的性质和意义(1)性质每一个观测值加一个常数C标准差不变。每一个观测值乘一个常数C,新数据标准差为原标准差乘此常数。(2)意义表述数据离散程度的最好指标。第三节标准差的应用一变异系数(CV)(相对离散程度没有单位可以比较不同类型数据的离散程度)一组数据的标准差与其相应的均值之比。CV100%CVX适应范围:(1)不同质的数据(2)同质但是差距大标准分数(没有单位有正负)(线性变换 变换完了保持相对位置)(一)概念和公式标准分数:又称Z分数,是以标准差为单位的一种量数。表示的是 一个原始分数在团体中所处的相对位置。计算公式:一ZXX

sX原始数据一X原始数据的平均数s 原始数据的标准差Xi Z1X2 Z2XX. 用Z 将X转换为Zs.Xn Zn(二)性质:

Z分数是一个相对量,以平均数为参照点,以标准差为单位。Z分数分布:平均数为Z分数分布:平均数为0,标准差为1。0。Iz2因为Z0所以SzJ :N2XX2z 2SZ分数的均值为I~~~ -7°(ZZ)sZ\ N-一XX因为Z 所以s2XX所以 z所以 z2 N因为S2 N所以Sz1即一组原始数据的Z分数分布:平均数为0,标准差为1(三)标准分数的应用1观测值在数据分布中相对位置的高低2当已知各不同质的观测值的次数分布为正态时,可用 Z分数求不同的观测值的和或平均值,以表明在总体中的位置。 (可加性)3表示标准测验分数转换成正态标准分数,线性转换Z'aZb4异常值的取舍 标准:34异常值的取舍 标准:3三个z就占了。itn得便.方便篇使荷伊Mm.re律itn得便.方便篇使荷伊Mm.re律tft着MIHMiSMT痛话收计忧口、Xm推注线tt前四种低效的用的不多 方差标准差表示离散程度最好的差异量数。百分等级无相等单位是顺序数据 z分数有相等单位(标准差) 等距数据框架小结全距百分位差四分位:差差异累数平均差方差与标准一差异系数标准分数% %%Z分数只适合符合正态分布的的数据网上资料所有正态分布都可以通过Z分数公式转换成标准正态分布将成正态分布的数据中的原始分数转换为 z分数,我们就可以通过查阅z分数在正态曲线下面积的表格来得知平均数与 z分数之间的面积,进而得知原始分数在数据集合中的百分等级。第五章相关量数描述统计的重点(理解记忆)两列或两列以上的的数据第一节相关系数与散点图一相关(一)实物可能存在的关系1因果关系:A是引起B的原因,B是导致A的结果。2共变关系:表面看似有关系的两个事物,实际上是因为两者都与第三个事物有关的缘故。3相关关系:A与B在发展变化方向与大小方面(关系密切程度) 存在一定系。(二)相关类别1方向上正相关负相关零相关2形状上直线相关曲线相关3相关程度上完全相关强相关弱相关零相关二相关系数概念:相关系数是变量之间相关程度的指标,计算相关系数一般需要大样本。符号:样本相关系数:r总体相关系数:取值:-1—+1性质:顺序数据(没有单位)第二节积差相关一概念级适用范围是计算两个变量线性相关的一种方法适用范围:数据成对。

两变量总体正态分布或接近正态分布。两变量是连续变量。两变量为线性关系。计算公式(定义公式)(XX)(YY)

r NSxSyN为成对数据的数目1或r ZxZyxy之间的相关关Nxy之间的相关关协方差:两个变量离均差乘积的平均数,协方差的绝对值越大越强这些点越接近一条直线。xyNxy(XX)(YY)第三节等级相关等级相关的意义

等级相关是根据等级资料(顺序数据)来研究变量之间相互关系的方法。数据来源:一是等级评定的资料,二是等距或比率资料转化而成的等级评定资料。优点:适用范围比积差相关更广缺点:没积差相关精确。斯皮尔曼等级相关斯皮尔曼等级相关:是根据两列变量的成对等级差数计算计算相关系数,又叫等级差数法。条件:成对;线性相关;无正态假设;无大样本设定 。结论:比皮尔逊积差相关应用范围广。计算公式无相同等级时:(1)利用等级差计算26D26D2「R1——2NN21N为等级个数DN为等级个数D指二列成对变量的等级差数(2)利用等级直接计算有相同等级的计算公式(不考)肯德尔和谐系数(测量意义:多列等级数据评价一致性)1肯德尔W系数又称和谐系数,是表示多列等级变量下个关程度的一种方法。2适用范围:(1)采用等级评定的方法收集等级数据,让k个评委(被试)评定事物,或一个评委(被试)先后k次评定N件事物。1,(2)每个评价者对N件事物排出一个等级顺序,最小的等级顺序为最大为N,若并列等级时,则评分共同应该占据的等级。1,3计算公式:K2N3N122R2RiRisN NR代表评价对象获得的 K个等级之和N代表被等级评定的对象的数目K代表等级评定者的数目有相同等级时分母减KT3Tn-n

12n为相同等级数(有几个相同的就加几次)肯德尔U系数与W系数处理问题相同但评价者采用对偶比较法第四节质与量相关一点二列相关(应用较二列相关广)(一)定义:研究一列等距数据或比率数据与一列 “二分”名称变量之间相关的统计方法称做点二列相关,符号: rpb(二)适用范围:一列数据等比或等距,总体服从正态分布;(2)另一列变量按事物的性质划分为两类的变量 (真正二分变量)(3)多用于测验中评价题目的区分度(三)计算公式rXpXq?pqStXp是与二分称名变量的一个值对应的连续变量的平均数;Xq是与二分称名变量的另一个值对应的连续变量的平均数;p与q是二分称名变量的两个值各自所占的比率, pq1;st是连续变量的标准差;取值在-1~1之间相关越高,绝对值越接近1。二列相关(不考)(一)定义:二列相关系数是研究一列正态的比率或等距变量和一列人为“二分” 名称变量之间的相互关系的统计方法,符号: %(二)适用范围:两个变量都是等距或等比数据,服从正态分布,其中一列被人为地划分为两列。在测验中用于测验效度和试题区分度的分析。(三)计算公式:|——XPXqpq「b ?st y一St与Xt分别是连续变量的标准差与平均数;一Xp为与二分变量中某一分类对偶的连续变量的平均数;一Xq为与二分变量中另一分类对偶的连续变量的平均数;p为某一分类在所有二分变量中所占比的比率;y为标准正态曲线中p值对应的高度,查正态分布表能得到;二列相关系数的取值正~之间。绝对值越接近,其相关程度越高。第五节品质相关四分相关(不考) 两个都是人为二分的相关两列数据都是真正二分ladbc

r abacbdcd第六章概率分布(基础)

前三节每年都要出题选择理解简答多选这一章才刚刚进入统计前三节每年都要出题选择理解简答多选这一章才刚刚进入统计第一节概率的基本概念概率实验,事件:在相同条件下,对某事物或现象所进行的观察或实验叫试验,把观察或试验的结果叫做事件。基本事件:如果某一随机实验可以分成有限的 n种可能结果,这n种结果之间是互不交叉的,而且这些结果出现的可能性相等,该结果就为基本事件。概率:事件在试验中出现的可能性大小,事件A的概率用P(A)表示。(一)古典概率(先验概率)在只含有有限个基本事件白^试验中,任意事件 A发生的概率定义为事件A所包含的基本事件数(m)P(A) 基本事件数(n)(二)统计概率(后验概率)在相同条件下进行n次试验,事件A出现了m次,如果试验次数n充分大,且事件A出现的频率稳定在某一数值p附近,则p为事件A的概率。由于p也是一抽象的值,常常用n在充分大时的代替。P(A)概率的基本性质(选择)1加法定理(n种情况,或)两个互不相容事件A,B之和的概率,等于两个事件概率之和。P(AB)P(A)P(B)2乘法定理(n个步骤,与)两个独立事件何时出现的概率等于该两件事件概率的乘积,P(AB)P(A)?P(B)三概率分布是用来描述随机变量取某些值时的概率的数学模型。类型:离散分布与连续分布经验分布与理论分布基本随机变量分布与抽样分布分布三要素形态平均数标准差基本随机变量分布:基本随机变量分布是一个与随机变量的函数相对应的。随机变量的函数,依然是随机变量。抽样分布:抽样是从总体中随机的,选取一个样本的过程,每一个样本都可以计、算平均数,方差标准差,相关系数,等指标。这些指标的概率分布就是抽样分布。第二节正态分布(一)正态分布定义正态分布也呈常态分布,是连续随机变量概率分布的一种,中间量次数分布多,两量次数分布少,呈对称的概率分析。在正态分布中:平均数决定着曲线在轴上的位置。标准数决定的曲线的形状。(离散程度宽窄)当标准差相同而平均数不同时:曲线形状相同位置各异。当平均数相同而标准差不同时正本曲线有不同的形状: 娥大:曲线娥杲“低调”,越/I、曲线越是“高窄”(二)正态分布的特征(选择简答).正态分布的形式是对称的,对称轴是经过平均数的垂线。.正态分布的中央点最高,然后逐渐向两侧下降,曲线先向内弯,后向外弯,两端靠近基线处无限延伸。(拐点在正负一个标准差处).正态曲线下的面积为1,故对称轴正态曲线下的面积划分为相等的两部分。.正态分布是一族分布.标准正态分布均值为0。标准差为1只有一条三正态分布表的编制与使用。标准正态分布函数的数值表:将一般正太分布化为标准正态分布, 通过查表可解决正态分布的概率计算问题。(1)正态分布曲线的面积,高度与标准分数。(2)标准正态分布曲线相应内容的求解方法。1.已知Z值,求面积p1)求均数(Z=0)与某个Z之间p的值,可直接查正态曲线表例如:求至Z=0~Z=-1之间的面积2)求任何两个z之间的p例如:求z=1~z=2之间的面积3)求每个z值以下或以上的面积。例如:z=以下和z=以上的面积(三)正态分布中的几个常用值。双侧1s 68.26%1.96s 95%2.58s 99%3s 99.7%单侧1.64s 95%2.33s 99%正态分布的特点(它有的标准正态都有)1.正态分布的形式是对称的,对称轴是经过平均数的垂线。2.2.正态分布的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论