现代心理与教育统计学2_第1页
现代心理与教育统计学2_第2页
现代心理与教育统计学2_第3页
现代心理与教育统计学2_第4页
现代心理与教育统计学2_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

心理统计学

第一章概述

描述统计

定义:研究如何把心理与教育科学实验或调查得来的大量数据科学的科学的加以整理概

括和表述

作用:使杂乱无章的数字更好的显示出事物的某些特征,有助于说明问题的实质。

具体内容:1数据分组:采用图与表的形式。

2计算数据的特征值:集中量数(平均数中数)离散量数(方差)

3计算量事物间的相关关系:积差相关(2列3列多列)

推断统计

定义:主要研究如何利用局部数据(样本数据)所提供的信息,依据数理统计提供的理

论和方法,推论总体情形。

作用:用样本推论总体。

具体内容:1如何对假设进行检验。

2如何对总体参数特征值进行估计。

3各种非参数的统计方法。

心理与教育统计基础概念

数据类型

一从数据来源来划分

1计数数据:计算个数或次数而获得的数据。(都是离散数据)

2测量数据:借助一定测量工具或测量标准而获得的数据。(连续数据)

二根据数据所反映的测量水平

1称名数据(分类)

定义:指用数字代表事物或数字对事物进行分类的数据。

特点:数字只是事物的符号,而没有任何数量意义。

统计方法:百分数次数众数列联相关卡方检验等。(非参检验)

2顺序数据(分类排序)

定义:指代事物类别,能够表明不同食物的大小等级或事物具有的某种特征的程度的数

据。(年级)

特点:没有相等单位没有绝对零点。不表示事物特征的真正数量。

统计方法:中位数百分位数等级相关肯德尔和谐系数以及常规的非参数检验方法。

3等距数据(分类排序加减(相等单位))(真正应用最广泛的数据)

定义:不仅能够指代物体的类别等级,而且具有相等的单位的数据。(成绩温度)

特点:真正的数量,能进行加减运算,没有绝对零点,不能进行乘除计算。

统计方法:平均数标准差积差相关Z检验t检验F检验等。

4比率数据(分类排序加减法乘除法(绝对零点))

定义:表明量的大小,也具有相等单位,同时具有绝对零点。(身高反应时)

特点:真正的数字,有绝对零点,可以进行加减乘除运算。

在统计中处理的数据大多是顺序数据和等距数据。

三按照数据是否具有连续性

离散数据连续数据

1

变量观测值随机变量

变量:指心理与教育实验观察调查种想要获得的数据。数据获得前用“X”表示,即为一

个可以取不同熟知的物体的属性或事件,其数值具有不确定性,因而称为变量。

观测值:是研究中确定的某一变量的取值。

随机变量:表示随机现象各种结果的变量称为随机变量

三总体样本个体

总体:具有某种共同特质的一类事物。(欲研究的研究范围)

样本:构成总体的每个基本单元。

个体:从总体重抽取的部分个体组成的群体。样本容量超过30为大样本反之为小样本。

四次数比率频率与概率

次数:某一事件在某一类别中的数目。

比率:(比例百分数)两个数相比。

频率:(相对次数)某一事件发生的次数被总的事件数目出。常用比例百分数表示。

概率:用符号P表示,指某一事件在无限观测中所能预料的相对出现的次数。

五统计量和参数

1参数:(总体参数)描述一个总体情况的统计指标用希腊字母表示。(小写)(大写

表示运算符)

总体平均数

总体标准差

总体相关系数

总体回归系数

2统计量:(特征值样本统计量)描述一组数据的情况。

样本统计量用英文表示

样本平均数

样本标准差

样本相关系数

样本回归系数

小结

描述统计

心理与教育统计学内容推论统计

实验设计

计数数据测量数据

数据类型称名数据顺序数据等距数据比率数据

离散数据计数数据

变量观测值随机变量

心理与教育统计基础概念总体样本个体

次数频数概率

参数统计量

2

练习题

1等距量表的特点是()

A无绝对零点,无相同单位。

B无绝对零点,有相同单位。

C有绝对零点,无相同单位。

D有绝对零点,有相同单位。

2下列量表中具有绝对零点的是()

A称名量表

B顺序量表

C等距量表

D比率量表

3教师的职称和薪水这两个变量的数据类型分别属于()

A命名数据等比数据

B等距数据等比数据

C顺序数据等距数据

D顺序数据等比数据

4下列数据类型属于比率数据的是()

A智商分数

B反应时

C年纪

D数学成绩

练习题思路解析

1B见第一页

2D见第一页

3D职称:讲师副教授教授这三个职称能排序,但不能做加减法。(顺序数据)

薪水:xyz能排序能做加减法,也具有绝对零点(没工资)能做乘除法。

(比率数据)

4B智商分数:加减法可做不能做乘除(智商测量表测量出来人为规定零)(等距数据)

反应时:有绝对零点(比率数据)

年级:只能大小排序(顺序数据)

数学成绩:人为规定零点(等距数据)

3

第一章统计图表(重要但不怎么考)(图表的特点)

第一节数据的初步整理(将数据制成统计图表的第一步)

一数据排序

排序就是按照某种标准,对收集到的杂乱无章的数据按照一定的顺序标准进行

排列。数据排序是正理数据最简单的方法。

二统计分组

统计分组只根据被研究对象的特征,将所得到的数据划分到各个分组中去。

数据的取舍原则:三个标准差原则

三统计表

统计表:用来表达统计指标与被说明的事物间关系的表格。

特点:简洁清晰准确表中数据易于比较分析。

三线表

员工对上筑尽职情况,的评定人数VT―1

9*:标目J

X1.非常不尽职

2.不尽职30

、>3.不置可否10

.标日J

4尽职25[故字]

5.非常尽职6

总计80_____

〜中数树源IXX

四统计图

统计图:用来表达统计指标与被说明事物之间数量关系的图形,是统计数据资料的可

视化显示方式。

4

第二节次数分布表(最重要的一类统计表)(皮尔逊次数分布表次数分布图)

一简单次数分布表(既可用于计数数据的整理,又可用于测量数据的整理)

简单次数分布表:依据每一个分数值在一列数据中出现的次数或总计数资料编制成的统

计表。

特点:对数据资料的来源没有过多要求,编制过程简单,应用广泛。

二分组次数分布表

当数据的取值过多时,不适合每个值记录一个频次。

把所有数据先划分为若干个分组区间,然后将数据按其数值大小划归相应组内,分别计

算各个组别中的数据个数,再用列表的形式呈现出来,就构成了分组次数分布表。

制作过程:

1求全距(离散量度)

全距=最大值-最小值(离散

2决定组数

组数K=L87(N-1)”(N为数据个数,K取近似整数)(经验公式)

3决定组距(任意一组的起点和终点之间的距离)

组距是一个组的上限与下限之差组距=全距/组数

4列出分组区间(组限)(一个组起点值与终点值之间的距离)

组上限:一个组的终止点

组下限:一个组的起始点

表示方法:

表述组限:10T920-2930-39

精确组限:9.5-19.49919.5-29.49929.5-39.499

分组次数分布表的意义与缺点

意义:显示数据的分布状况,集中状况。

假设:各区间的数据均匀分布,并用各组的组中值代表各原始数据。

缺点:由于假设所造成的误差为归组效应。

三相对次数分布表

1含义:相对次数是指各组次数f对数据总个数N的比值,用符号f/N表示。

所有相对次数之和Ef/N等于1.

2制作:将分组次数分布表的各组次数转化为相对次数,用f/N或f/Nx100%作标

志来表示次数就制成了相对次数分布表。

四累加次数分布表

1实际累加次数

把各组次数f由下而上或由上而下依次累加的和,用符号cf表示。

2相对累加次数

把各组的相对次数p由上而下或由下而上依次累加的和,累加之和为1.

五双列次数分布表(相关次数分布表)

1含义:对有联系的两列变量用一个表来表示次数分布。(体重与血压;智力与成

绩)

2制作:先按照分组次数表的编制方法,分别列出各变量的分组区间,登记时,每

次同一对变量同时登记在相应的格内。

5

第三节次数分布图

一直方图(又称等距直方图,用于等距变量)

用一系列宽度相等、高度不一的矩形表示数据分布的统计图。以矩形的面积表示连续性

随机变量次数分布的图形。

一般用纵轴表示数据的频数,用数轴表示数据的等距分组点,也就是各组分组区间的

上限和下限,有时也使用组中值。

二次数多边图(变化趋势)

一种线形图,凡是等距分组的可以用直方图表示的数据,都可以用次数多边图表示。

绘制时,横坐标是用各分组区间组中值表示的连续变量,纵坐标是数据的次数。以每个

分组区间的组中值为横坐标,一个组的次数为纵坐标标点,连接各点,就成为一条折线。

三累加次数分布图

在累加次数分布表的基础上绘制的,有直方图式和曲线式两种,最为常用的是累加曲线

图。

累加次数分布曲线

横轴:原始分数百分位数

纵轴:等级排名百分等级

正偏态分布:小端的数据特别多,大端的数据不是很多,比较分散,表现在曲线就是上肢

长于下肢。(分数分布在低端)

负偏态分布:大端的数据比较多,小端的数据不是很多,但比较分散,表现在曲线就是下

肢长于上肢。(分数分布在高端)

正态分布:中端的数据最多,两端的数据少,平均两侧的数据个数差不多,表现在曲线

是上肢和下肢长度相当。(中数众数平均数三合一、曲线上拐点50%)

6

第四节其他类型的统计图表

一条形图

表示的是离散型数据资料,宜用窗度相同的条形长短或高低来表示统计数据的大小或变

动情况的统计图。

一个是分类轴(横轴),表示类别,描述的是计数的数据。(离散数据(类别))

一个是数量轴(纵轴),表示大小多少,描述的是计量数据。(连续数据(测量数据))

W2-2aVftVl1成FtO人&HI2-3bIIKV)

条形图与直方图的本质区别(选择简答多选)

条形图与直方图的本质区别条形图直观图

数据类型离散数据(分类)连续数据(分组区间)

数据表示方式直条的长度面积

坐标轴(横轴)分类轴刻度值

直观状态有间隔没有间隔

二圆形图(饼图)

以整个圆的面积带鞭被研究对相的总体,按照组成部分占总体的比重大小,把圆面积分

成若干扇形,用来表示某一现象的部分对总体的比例关系。

适用于离散性的数据。

三线形图

1用来表示连续性资料,是以起伏的线条来说明事物因时间、条件推移而变迁的趋势。

(考点)

2表示的是两边两之间的函数关系或描述某种现象的发展趋势,或一种现象随着另一种

现象变化发展的情形。

3通常用横轴表示自变量,用纵轴表示因变量。

7

四散点图

1用相同大小的圆点的多少或疏密表示统计资料数量的大小以及变化趋势等。

2还可以表示相关程度。(正相关、负相关、无相关、可能相关)

iltil3tilK

20人的“骑及^^的卢阳

练习题

1某考生最高分为81分,在下列次数分布表中,能直接判断有多少考生得分比他低的

是()

A简单次数分布表

B分组次数分布表

C累加次数分布表

D相对次数分布表

2运用相对累加次数分布曲线,可以快速计算出原始分数相对应的统计量是()

A百分等级

BZ分数

CT分数

D频次

3适用于描述某种心里属性在时间上的变化趋势的统计分析图()

A茎叶图

B箱形图

C散点图

D线形图

4用于描述两个变量之间相关关系的统计图()

A直方图

B线形图

C条形图

D散点图答案及解析

1C见第5页

2A

3D见第7页

4D

8

徜'V次数分&

分外I次数分作表

411xf次数分/|J&

统“衣火力”次数分布j正

不6成,次数分作衣

双夕U次数分/IJ&

统it图友广工力图

次数《必形图

岖则1I。力图

家加“III纹

统”图条形图

IMI形图

约inw

攸点图

前两章没什么特别重要的知识但不要放松必拿分数。

9

第三章集中量数(2-3选择)

数据的集中趋势就是指数据分布中大连数据朝向某个方向集中的程度,用于描述数据

集中程度的统计量。

第一节算书平均数

一概念及计算公式

1概念

算术平均数,是所有观测值(或变量)的总和除以总数所得得商。

符号:X或M

2计算公式

公式一(平均数的定义公式)

N

公式二(平均数的估算公式)

X=AM+AM估算值

N

例题

现有一组实验观测数据,25272827252930343233.计算他们的平均数。

解法一:

根据题意已知N=10,根据公式:

<A25+27++33290

A-29

HIOIO

解法二:

先设定一个估计平均数AM=27,求X=Xi-A的值。

Xi252728272529303432

X-2010-22375

V\25+27-1+33290»

A-29

〃1()10

l\/

先估计平均值为27(预估计)(大的数据用估计法好算有利于简化

计算过程)

10

二平均数的特点

1一组变量值的和等于变量的个数与平均数的乘积,

£x=NX

2一组变量值的离均差之和等于零,(说明了平均数是一组数据的重心最能表达一

组数据的集中趋势)

X)=0

3在一组变量中,每个变量值加上或减去、乘以或除以常数c,所得的平均数等于

原平均数加上或减去、乘以或除以常数c。

三平均数的意义

1平均数是应用最普遍的一种集中量数。

2是真值渐进、最佳的估计值。(概率分布中心极限定理)(真值=□总体平均数)

3当观测次数无限增加时,算术平均数趋近于真值。

(样本平均数量趋近于总体平均数)

(观测次数较少时样本统计量是总体参数的无偏估计)

四平均数的优缺点(选择题的重要内容)

1优点:反应灵敏:计算严密;计算简单;内容容易理解;适合进一步代数运算、

较少受抽样变动的影响。

2缺点:容易受极端数据的影响;如果出现模糊不清的数据,无法使用。

第二节中数与众数

―中数

中数又称中位数,间称中数用血表示,是按一定顺序排列的一组数中央位置的数值。

中数是一种位置量数。

中数的计算(主要考中数的计算方式)

1中数附近无重复数时

若数据个数(N)奇数时,中数则为(N+D/2位置的那个数。

若数据个数(N)偶数时,中数则为居于中间两个数的平均数

[XN/2+XN/2+l]/2

2中数附近有重复数时(难点没考过考很正常)采用画图法(王老师开创)

例:求111111111313131717

分析:N=9中间位置为5,第5个数为13。但数据中有3个13,意味着3个13占

了一个单位。(统计学上把13看为一个区间,三个13共享这个区间,把区

间划分为三段,

12.5+1/6第一小段的组中值

11

二众数

1含义:

众数(mode)是指一群数据中出现次数最多的那个数,不只有一个,用表

zj\O

2计算方法:

(1)直接观察法

未分组数据一-次数最多的数值

次数分布表一-次数最多一组的组中值

(2)公式计算法

皮尔逊经验公式:(牢记)

X。=3Md—2X

三平均数中数众数三者间的关系(出小了计算形式为主的选择题出大了简答题)

1正态分布Md=Mo=X

左偏分布=负偏态右偏分布=正偏态(比较三数大小直接画图即可直观看出)

第三节其他集中数(往往没怎么考过)(统计中基本不考)

一加权平均数

是观测数据(4)与相应的权数(W)乘积的和除以总权数(%+%+/+....+%)

所得的商。用符号血却表示。

权数是指各变量在构成总体重的相对重要性,权数的大小,由观测者依据一定的理论

或经验而定。

-W,X,+W,X,+..…+WX,,

n

wx+w2+..+wn

每个数对总体的贡献不一样权重不一样

二几何平均数

三调和平均数:先将各个数据取倒数平均,然后再取倒数,表述符号为主要用于

描述速度方面的集中趋势。

12

练习题

1现有一列数据,4453552。这列数据的平均数、众数和全距依次是()

A442

B453

C544

D551

2有一组数据36273248要描述这组苏剧的特征,受极端数据之影响的统计

量是()

A平均数

B中数

C四分位数

D众数

3数据259118910131024的中位数是()

4一组数据的分布曲线称双峰状态,据此可以推测改组数据中可能有两个()

A中数

B众数

C平均数

D几何平均数

5要比较几个不同性质的测验分数,比较恰当的是比较()

A原始分数

B众数

C百分等级

D平均数

6测验总分呈负偏态分布说明测验难度()

A偏难

B偏易

C适中

7甲乙两图表示数据分布形态分别是()

8描述甲乙靓图特征的集中量数中,数据最大的分别是()

答案及解析

1B选择题用省时间的方式哪个好算先算那个

2A见第

39.5

4B

5C百分等级是原始分数在所在团体中的位置位置量数

6B

7正偏态负偏态

13

框架小结

算术平均数(定义公式特点)

集中量数中数(特点计算方法)

众数(计算特点)

三者之间的关系(正态偏态)

众数最具代表性的最具优势的

中数当个别数据偏大或偏小时用中数比较合适

平均数

第四章差异量数

表示一组数据的差异情况或离散程度的量数:反应数据的分布的离中趋势;描述事物差

异性的表现。差异量越小,平均数的代表性越好。差异量越大,平均数的代表性越差。

第一节全距与百分位差(容易受极端数据影响不怎么用)

一全距(没用)

定义:一列数据中最大数与最小数之差

特点:不可靠不灵敏

二百分位差

(一)百分位数(原始分数)一百分等级

量尺上的一个点,在此点以下包括数据分布中全部数据个数的一定百分比,符

号为巴。

65=90百分位数为90(90为原始分数)

在90分以下的包含了整个数据的75%

(二)百分位差

三四分位差

1四分位数可视为百分位数的特例,用。来表示。

2025尸50尸75把数据分成四等份,所以称为四分位数。

打5(第一个四分位,01)

品)(第二个四分位,。2)

片5(第三个四分位,。3)

14

3四分位差是百分位差的特例:

(45—W)/2=(Q—9)/2

实质:反映了中间50%数据的离散程度。

四分位差越小中间50%数据越集中

四分位差越大中间50%数据越离散

四百分等级(弓表示)

1含义:指某个数据在整个数据中所处的百分位置。

2作用:可以表示任何一个分数在该团体中的相对位置。

品-百分等级一百分位数

4-百分位数一百分等级

第二节平均差/方差与标准差(有单位不能比较不同事物的离散程度)

一平均差

1含义:原始数据与平均数绝对离差的平均值。

2符号:A.D.

nn

A.D.平均差

x离均差

3特点:

较好反映了数据分布的离散程度;

平均差是绝对值,使用受到了限制;(绝对值不容易进一步代数运算)

属于低效的差异量数。

二方差与标准差

1含义:

(1)方差:离均差平方的算数平均数,表示一列数据平均差距的平方。

符号:样本方差一一52

总体方差一一CT?

,>(X-X)2

S2=4--------L(定义公式)

N

15

(2)标准差:方差的算数平方根,表示一列数据的平均差距。

符号:样本标准差一一s

总体标准差一一b

Z-x

s=1----------—

\N

计算过程1先计算平均数

2求离均差的平方和

3代入方差和标准差的公式

完整表述一列数据:X{M,S)

2方差、标准差的性质和意义

(1)性质

每一个观测值加一个常数C标准差不变。

每一个观测值乘一个常数C,新数据标准差为原标准差乘此常数。

(2)意义

表述数据离散程度的最好指标。

第三节标准差的应用

一变异系数(。「)(相对离散程度没有单位可以比较不同类型数据的离散程度)

一组数据的标准差与其相应的均值之比。

V

CK=—xlOO%

X

适应范围:

(1)不同质的数据

(2)同质但是差距大

二标准分数(没有单位有正负)(线性变换变换完了保持相对位置)

)概念和公式

标准分数:又称Z分数,是以标准差为单位的一种量数。表示的是一个原始分

数在团体中所处的相对位置。

计算公式:

Z=------

s

X原始数据

X原始数据的平均数

16

s原始数据的标准差

乜------4

X】--------z

2V_V

用2=---------将X转换为Z

s

X“------乙

(二)性质:

1Z分数是一个相对量,以平均数为参照点,以标准差为单位。

2一组原始数据的Z分数分布:平均数为0,标准差为1。

3Z分数的均值为0。

X—X力-叶

因为Z所以

S

因为/=_V---------2所以gz2=N

N乙

所以”=1即一组原始数据的z分数分布:平均数为0,标准差为1

(三)标准分数的应用

1观测值在数据分布中相对位置的高低

2当已知各不同质的观测值的次数分布为正态时,可用Z分数求不同的观测值的总

和或平均值,以表明在总体中的位置。(可加性)

3表示标准测验分数转换成正态标准分数,线性转换

Z=aZ+b

4异常值的取舍标准:团〉3三个z就占了99.73。

17

全部敢树计不代咬方法评价

全却百荷使、方便差不能

白分伯/自循便不能

酒用F

描述统计

四分他宣

否徜使不・

牛均芳n商使不能

方星.

优、2犯

nX%尸监饯H算R

懵论统计J

前四种低效的用的不多方差标准差表示离散程度最好的差异量数。

百分等级无相等单位是顺序数据Z分数有相等单位(标准差)等距数据

框架小结

全距

百分位差

四分位差

差异城数平均差

方差与标准差

差异系数

标准分数

68.26%95.44%99.73%

Z分数只适合符合正态分布的的数据

网上资料

所有正态分布都可以通过z分数公式转换成标准正态分布

将成正态分布的数据中的原始分数转换为Z分数,我们就可以通过查阅Z

分数在正态曲线下面积的表格来得知平均数与z分数之间的面积,进而得

知原始分数在数据集合中的百分等级。

18

第五章相关量数

描述统计的重点(理解记忆)

两列或两列以上的的数据

第一节相关系数与散点图

一相关

(一)实物可能存在的关系

1因果关系:A是引起B的原因,B是导致A的结果。

2共变关系:表面看似有关系的两个事物,实际上是因为两者都与第三个事物

有关的缘故。

3相关关系:A与B在发展变化方向与大小方面(关系密切程度)存在一定关

系。

(二)相关类别

1方向上

正相关负相关零相关

2形状上

直线相关曲线相关

3相关程度上

完全相关强相关弱相关零相关

二相关系数

概念:相关系数是变量之间相关程度的指标,计算相关系数一般需要大样本。

符号:样本相关系数:r

总体相关系数:p

取值:-1—+1

性质:顺序数据(没有单位)

第二节积差相关

一概念级适用范围

是计算两个变量线性相关的一种方法

适用范围:

数据成对。

两变量总体正态分布或接近正态分布。

两变量是连续变量。

两变量为线性关系。

二计算公式(定义公式)

_^(x-x)(y-y)

NS*Sy

N为成对数据的数目

或r=—YZvZv

NJ丫

19

协方差:两个变量离均差乘积的平均数,协方差的绝对值越大砂之间的相关关系

越强这些点越接近一条直线。

E町

N

£町立心工)「丫)

第三节等级相关

一等级相关的意义

等级相关是根据等级资料(顺序数据)来研究变量之间相互关系的方法。

数据来源:一是等级评定的资料,二是等距或比率资料转化而成的等级评定资料。

优点:适用范围比积差相关更广

缺点:没积差相关精确。

二斯皮尔曼等级相关

斯皮尔曼等级相关:是根据两列变量的成对等级差数计算计算相关系数,又叫等级差

数法。

条件:成对;线性相关;无正态假设;无大样本设定。

结论:比皮尔逊积差相关应用范围广。

计算公式

一无相同等级时:

(1)利用等级差计算

6\£)2

2一而刁

N为等级个数

D指二列成对变量的等级差数

(2)利用等级直接计算

二有相同等级的计算公式(不考)

三肯德尔和谐系数(测量意义:多列等级数据评价一致性)

1肯德尔沙系数又称和谐系数,是表示多列等级变量下个关程度的一种方法。

2适用范围:

(1)采用等级评定的方法收集等级数据,让k个评委(被试)评定N个

事物,或一个评委(被试)先后k次评定N件事物。

(2)每个评价者对N件事物排出一个等级顺序,最小的等级顺序为1,

最大为N,若并列等级时,则评分共同应该占据的等级。

20

3计算公式:

s

W=----------------

[片俨―N)

、2SR2(»)

s=Z&一=/A,----------------

NJ乙'N

&代表评价对象获得的K个等级之和

N代表被等级评定的对象的数目

K代表等级评定者的数目

有相同等级时分母减

3

、T"一"

乙乙12

〃为相同等级数(有几个相同的就加几次)

肯德尔U系数与W系数处理问题相同但评价者采用对偶比较法

第四节质与量相关

—点二列相关(应用较二列相关广)

(一)定义:研究一列等距数据或比率数据与一列“二分”名称变量之间相关的统计方

法称做点二列相关,符号:rpb

(二)适用范围:

(1)一列数据等比或等距,总体服从正态分布;

(2)另一列变量按事物的性质划分为两类的变量(真正二分变量)

(3)多用于测验中评价题目的区分度

(三)计算公式

Xp是与二分称名变量的一个值对应的连续变量的平均数;

Xg是与二分称名变量的另一个值对应的连续变量的平均数;

P与q是二分称名变量的两个值各自所占的比率,夕+q=l;

s,是连续变量的标准差;

21

取值在-1〜+1之间相关越高,绝对值越接近1。

二二列相关(不考)

(一)定义:二列相关系数是研究一列正态的比率或等距变量和一列人为“二分”名称

变量之间的相互关系的统计方法,符号:rb

(二)适用范围:两个变量都是等距或等比数据,服从正态分布,其中一列被人为地划

分为两列。

在测验中用于测验效度和试题区分度的分析。

(三)计算公式:

Xp-Xqpq

rb=----------,一

Stv

邑与x,分别是连续变量的标准差与平均数;

xP为与二分变量中某一分类对偶的连续变量的平均数;

Xg为与二分变量中另一分类对偶的连续变量的平均数;

P为某一分类在所有二分变量中所占比的比率;

y为标准正态曲线中夕值对应的高度,查正态分布表能得到;

二列相关系数的取值正T.001.00之间。绝对值越接近1.00,其相关程度越高。

第五节品质相关

四分相关(不考)两个都是人为二分的

。相关两列数据都是真正二分

%+町<7+c)(b+d)(c+d)

22

第六章概率分布(基础)

前三节每年都要出题选择理解简答多选这一章才刚刚进入统计

第一节概率的基本概念

一概率

实验,事件:在相同条件下,对某事物或现象所进行的观察或实验叫试验,把观

察或试验的结果叫做事件。

基本事件:如果某一随机实验可以分成有限的72种可能结果,这,种结果之间是

互不交叉的,而且这些结果出现的可能性相等,该结果就为基本事件。

概率:事件在试验中出现的可能性大小,事件/的概率用尸(Z)表示。

(一)古典概率(先验概率)

在只含有有限个基本事件的试验中,任意事件z发生的概率定义为

=事件z所包含的基本事件数(掰)

(基本事件数(〃)

(二)统计概率(后验概率)

在相同条件下进行〃次试验,事件Z出现了加次,如果试验次数〃充分大,

且事件Z出现的频率稳定在某一数值p附近,则p为事件Z的概率。由于p

也是一抽象的值,常常用〃在充分大时的代替。

P(A)=p如巴(n48)

n

二概率的基本性质(选择)

1加法定理(〃种情况,或)

两个互不相容事件Z,3之和的概率,等于两个事件概率之和。

尸(Z+8)=P(Z)+P(8)

2乘法定理(〃个步骤,与)

两个独立事件同时出现的概率等于该两件事件概率的乘积,

P(AB)=P(A)・P(B)

三概率分布

是用来描述随机变量取某些值时的概率的数学模型。

类型:

离散分布与连续分布

经验分布与理论分布

基本随机变量分布与抽样分布

分布三要素形态平均数标准差

23

基本随机变量分布:

基本随机变量分布是一个与随机变量的函数相对应的。随机变量的

函数,依然是随机变量。

抽样分布:

抽样是从总体中随机的,选取一个样本的过程,每一个样本都可以计、

算平均数,方差标准差,相关系数,等指标。这些指标的概率分布就

是抽样分布。

第二节正态分布

(一)正态分布定义X~

正态分布也呈常态分布,是连续随机变量概率分布的一种,中间量次数分

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论