5第五章 概率及概率分布.ppt_第1页
5第五章 概率及概率分布.ppt_第2页
5第五章 概率及概率分布.ppt_第3页
5第五章 概率及概率分布.ppt_第4页
5第五章 概率及概率分布.ppt_第5页
已阅读5页,还剩46页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第五章概率及概率分布 概率的基本概念正态分布二项分布样本分布 1 后验概率 统计概率 的定义随机事件A在n次试验中出现m次 m与n的比值 就是随机事件A出现的频率 即相对频数 随着试验次数n的无线增大 随机事件A的频率稳定于一个常数P 这个常数P就是随机事件A出现概率的近似值 概率的定义 2 先验概率 古典概率 的定义要求满足两个条件 1试验的所有可能结果是有限的 2每一种可能结果出现的可能性 概率 相等 若所有可能结果的总数为n 随机事件A包括m个可能结果 则事件A的概率为 概率的定义 1 概率的公理系统 任何一个随机事件A的概率都是在0与1之间的正数 即 必然事件 是指在一定条件下必然发生的事件 U的概率为1 即 不可能事件 是指在一定条件下必然不发生的事件 V的概率为0 即 概率的基本性质 2 概率的加法定理两个互不相容事件A B 是指在一次实验或调查研究中 若事件A发生则事件B就一定不发生 之和的概率 等于两个事件概率之和 写作 概率的基本性质 3 概率的乘法定理两个独立事件A B 是指一个事件的出现对另一个事件的出现不发生影响 同时出现的概率等于该两事件概率的乘积 写作 概率的基本性质 1 按随机变量是否具有连续性来分类 可分为离散分布与连续分布 2 按分布函数的来源来分类 可分为经验分布 是指根据观察或实验所获得的数据而编制的次数分布或相对频数分布 与理论分布 一是指随机变量概率分布的函数 数学模型 二是指按某种数学模型计算出的总体的次数分布 3 按概率分布所描述的数据特征来分类 可分为基本随机变量分布与抽样分布 概率分布的类型 正态分布曲线函数 密度函数 正态分布的特征 0 1 标准正态分布曲线 正态分布的标准差x 随机变量X的取值 x 正态分布的平均数 3 14159 e 2 71828 正态分布中的 N都是常量 在每个正态分布中 它们的变化会导致正态曲线 NORMALCURVE 不同 如下图 尽管平均数相同 但由于 不同而正态分布的形态差异较大 正态分布的特征 1 正态分布的形式是对称的 它的对称轴是过平均数点的垂线 2 正态分布的中央点最高 然后逐渐向两侧下降 曲线的形式是先向内弯 然后向外弯 拐点位于正负1个标准差处 曲线两端向靠近基线处无限延伸 但终不能与基线相交 3 正态曲线下的面积为1 正态曲线下各对应的横坐标 即标准差 处与平均数之间的面积可用积分公式加以计算 正态分布的特征 正态分布的特征 4 正态分布是一族分布 它随随机变量的平均数 标准差的大小与单位不同有不同的分布形态 5 正态分布中各种差异量数的值皆有固定的比率 6 在正态分布曲线下 标准差与概率 面积 有一定的数量关系 如 正负一个标准差之间 包含总面积的68 26 正负1 96个标准差之间 包含总面积的95 正负2 58个标准差之间 包含总面积的99 正负3个标准差之间 包含总面积的99 74 正态分布的特征 正态分布的特征 正态分布的特征 正态分布表的编制本书附表1的正态分布表的编制 是从Z 0开始 逐渐变化Z分数 计算从Z 0至某一定值之间的概率 这是因为正态分布为对称分布 且对称轴为过Z 0点的纵线 故Z 0当时 其概率与Z 0时的相应的Z分数下的概率值相等 正态分布表的编制与结构 正态分布表的结构正态分布表 参见附表1 一般包括三栏 第一栏是Z分数单位 一般标为Z 第二栏为密度函数或比率数值 Y 即某一Z分数点上的曲线纵坐标的高度 第三栏为概率值 P 即不同Z分数点与平均数之间的面积与总面积之比 正态分布表的编制与结构 1 依据Z分数求概率 P 即已知标准分数求面积 求Z分数与平均数 Z 0 之间的概率 求某Z分数以上或以下的概率 求两个Z分数之间的概率 正态分布表的使用 例1 例2 例3 例4 例5 例6 例7 例8 2 从概率 P 求Z分数 即从面积求标准分数值 已知从平均数开始的概率值求Z值 已知位于正态分布两端的概率值求该概率值分界点的Z值 若已知正态曲线下中央部分的概率 求Z分数是多少 3 已知概率或Z值 求概率密度Y 即正态曲线的高 正态分布表的使用 在正偏态中M Md M0 在负偏态中M Md M0 在正态分布中三者合于一点 皮尔逊发现在偏态分布中平均数距中数较近而离众数较远 根据平均数与众数或中数的距离 提出一个偏态量数公式 用以描述分布形态 当SK 0时 分布对称 当SK 0时 分布属正偏态 当SK 0时 分布属负偏态 次数分布是否正态的检验方法 1皮尔逊偏态量数法 1 偏度系数当g1 0时 分布是对称的 当g1 0时 分布为正偏态 当g1 0时 分布呈负偏态 当观测数据数目N 200时 这个偏态系数的统计量才较可靠 次数分布是否正态的检验方法 2峰度 偏度检验法 2 峰度系数当g2 0时 分布的峰度是正态分布的峰度 当g2 0时 分布的峰度比正态分布的峰度低阔 当g2 0时 分布的峰度比正态分布的峰度高峡 当N 1000时 值才比较可靠 次数分布是否正态的检验方法 2峰度 偏度检验法 因为标准正态分布的形式固定 因此其累加概率与标准差的关系也固定 根据这一点 可将一般分布的累加概率与标准正态分布累加概率相比较 比较的具体方法是 次数分布是否正态的检验方法 3累加次数曲线法 1 制作样本的累加次数分布表 列出累加比率和观察值相应的标准分数 2 制作样本的累加频率曲线图 3 在同一坐标系中 制作累加正态分布概率曲线图 4 画好图后 从图上直接比较正态分布概率曲线与样本的累加频率曲线 若两曲线完全重合 说明某样本的分布呈正态 若样本的累加频率曲线偏离正态累积曲线较大 则不符合正态分布 次数分布是否正态的检验方法 3累加次数曲线法 正态分布的使用化等级评定为测量数据确定测验题目的难易度在能力分组或等级评定时确定人数测验分数的正态化 在心理与教育评价中 对有些心理量如爱好程度 能力大小等常用等级评定法赋予于一定的评价分数或等级分数 应用这种方法在最后处理结果时 常会遇到以下两个问题 第一是不同的评定者由于各自的标准不同 同一个心理量进行评定时可能给的等级分数不等 这时应如何综合每个评定者的结果 第二是等级分数界线宽 又不一定是等距尺度 要比较不同被评定的心理量的差异 应如何进行 上述两个总是的解决 都需要首先将等级评定转化为测量数据 1化等级评定为测量数据 将等级评定转化为测量数据 首先要考虑被评定的心理量是否为正态分布 若为正态分布 可以转化为测量数据 即标准分数 若不是正态分布 则不能将等级评定转化为分数 具体步骤如下 1化等级评定为测量数据 1 根据各等级被评者的数目求各等级的人数比率 2 求各等级比率值的中间值 作为该等级的中点 3 求各等级中点以上 或以下 的累加比率 4 用累加比率查正态表求值 该分数就是各等级代表性的测量值 5 求被评者所得评定等级的测量数据的算术平均数 即为每个被评者的综合评定分数 1化等级评定为测量数据 测验题目的难易度一般用答对者的百分数确定 但是百分数不是等距尺度 有时要比较不同难易度题目之间的难度距离 需要将难易百分数根据正态分布概率转换成难度分数 确定题目难易分数的具体步骤如下 2确定测验题目的难易度 1 计算各题目的通过率 即答对人数与参加测验人数的比例 在正态表中它代表的是曲线下的面积 2 用0 5减去通过率 不计正负号 获得正态表中的概率值 即表6 5中第三列的P值 3 依照P值查正态表中相应的Z值 通过率大于50 的Z值计为负值 通过率小于50 的Z值计为正值 4 将查表得到的Z分数加上5 假定正负5个标准差包括了全体 便可得到从0 10的十进制的难度分数值 这样就有理由认为难度分数是等距的尺度 不同题目之间的难易差异就可直接比较了 2确定测验题目的难易度 假定能力是正态分布 这时若将能力分组 各组人数应是多少 或评定不同等级 各等级人数应是多少才能使分组或评定等级构成等距的尺度 依据正态分布理论确定各组或各等级的人数 具体方法如下 3在能力分组或等级评定时确定人数 1 将6个标准差 假定6个标准差包括了全体 除以分组的或等级的数目 做到Z分数等距 2 查正态分布表 从Z求P 即各等级或各组在等距的情况下应有的比率 3 将比率乘以欲分组的人数 便得到各等级或分组该有的人数 3在能力分组或等级评定时确定人数 学生的学习成绩 能力或智力等教育或心理现象 一般都是正态分布 因而在研究中总是从理论上假设研究对象在总体上是正态分布的 但是 由于抽样误差或测试题目难度等偶然因素的影响 实际得到的原始分数分布不是正态分布 为了解决这类问题 可采用一定的统计方法将非正态的原始分数转换成正态分布 在编制测验时 也常会遇到已知某总体的分布为正态 但由于所取样本不是正态的 这时需要按其总体将样本分布正态化 这种将样本原始分数分布转换成正态分布 称作次数分布的正态化 4测验分数的正态化 正态化步骤如下 1 将原始分数整理成次数分布表 2 计算各分组上限以下的累加次数cf 3 计算每组中点的累加次数 即前一组上限以下的累加次数加上该组次数的一半 4 各组中点以下的累加次数除以总数求累积比率 5 将各组中点以下的累积比率视为正态分布的概率 查正态表 将概率转化为Z分数 6 将正态化的Z值利用公式 T 10Z 50 加以直线转化 4测验分数的正态化 练习1 在某一幼儿园的一次点数比赛中 全园的平均分是70 标准分是12 5 甲幼儿得78分 乙幼儿得83分 丙幼儿得65分 问这三幼儿的点数成绩在园中各处于怎样的位置 解 70S 12 5 甲幼儿 Z Z 0 64乙幼儿 Z Z 1 04丙幼儿 Z Z 0 4 答 甲幼儿的成绩在全园平均成绩以上0 64标准差 乙幼儿的成绩在全园平均成绩以上1 04标准差 丙幼儿的成绩在全园平均成绩以下0 4个标准差 练习2 某幼儿园毕业生平均身高118厘米 标准差1 9厘米 平均体重为22 9公斤 标准差为0 8公斤 试问甲幼儿的身高和体重在毕业生中的位置哪个高 甲幼儿身高 体重的标准分数表 520 12 表24 甲乙两幼儿语言 常识 计算成绩测试成绩表 练习3 甲乙两幼儿在语言 常识 计算活动中测试的成绩如下表 试分析说明谁的总成绩较好 凡符合以下条件的试验称为二项试验 贝努里试验 1 任何一次试验恰好有两个结果 成功与失败 2 共有n次试验 且n是预先给定的任一正整数 3 每次试验各自独立 各次试验之间无相互影响 4 某种结果出现的概率在任何一次试验中都是固定的 即任何一次试验中成功或失败的概率保持相同 二项试验 二项分布的概念二项分布是指试验仅有两种不同性质结果的概率分布 二项分布的概率函数为 二项分布 二项分布的性质 1 二项分布的形态 二项分布是离散型分布 概率直方图是跃阶式的 当p q时 图形是对称的 当p q时 直方图呈偏态 p q与p q的偏斜方向相反 2 二项分布的平均数与标准差 如果二项分布满足p q 5 或p q 5 时 二项分布接近正态分布 这时 二项分布的变量X 即成功的次数 具有如下性质 二项分布 二项分布的应用二项分布在心理与教育研究中 主要用于解决含有机遇性质的问题 思考 例1从男生占 的学校中随机抽取 个学生 问正

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论