概率统计基础知识.ppt_第1页
概率统计基础知识.ppt_第2页
概率统计基础知识.ppt_第3页
概率统计基础知识.ppt_第4页
概率统计基础知识.ppt_第5页
已阅读5页,还剩182页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2020 3 22 1 第一部分概率统计基础知识 随机事件及其概率随机变量及其分布随机变量的数字特征数理统计的基本概念参数估计假设检验方差分析 2020 3 22 2 1 1随机事件及其概率 随机事件及其运算概率的定义及其运算条件概率全概率公式与贝叶斯公式事件的独立性 2020 3 22 3 1 1 1随机事件及其运算 随机试验 简称 试验 随机试验的特点1 可在相同条件下重复进行 2 试验可能结果不止一个 但能确定所有的可能结果 3 一次试验之前无法确定具体是哪种结果出现 随机试验可表为E 2020 3 22 4 例1 1 1随机试验例 E1 抛一枚硬币 分别用 H 和 T 表示出正面和反面 E2 将一枚硬币连抛三次 考虑正面出现的次数 E3 掷一颗骰子 考虑可能出现的点数 E4 记录某网站一分钟内受到的点击次数 E5 在一批灯泡中任取一只 测其寿命 2020 3 22 5 1 1 1随机事件及其运算 样本空间实验的所有可能结果所组成的集合称为样本空间 记为 样本点试验的每一个结果或样本空间的元素称为一个样本点 记为 基本事件由一个样本点组成的单点集 2020 3 22 6 1 1 1随机事件及其运算 随机事件试验中可能出现或可能不出现的情况叫 随机事件 简称 事件 记作A B C等任何事件均可表示为样本空间的某个子集 称事件A发生当且仅当试验的结果是A中的元素两个特殊事件 必然事件 不可能事件 2020 3 22 7 例1 1 2对于试验E2 将一枚硬币连抛三次 考虑正面出现的次数 以下随机事件 1 0 1 2 3 必然事件 A 至少出一个正面 1 2 3 而对试验E5 在一批灯泡中任取一只 测其寿命 2 x 0 x 小时 B 灯泡寿命超过1000小时 x 1000 x 小时 1 1 1随机事件及其运算 2020 3 22 8 1 1 1随机事件及其运算 事件之间的关系1 包含关系 A发生必导致B发生 记为A BA B A B且B A 2 和事件 事件A与B至少有一个发生 记作A Bn个事件A1 A2 An至少有一个发生 记作3 积事件 A与B同时发生 记作A B ABn个事件A1 A2 An同时发生 记作A1A2 An 2020 3 22 9 4 差事件 A B称为A与B的差事件 表示事件A发生而B不发生5 事件的互斥 AB 表示事件A B不能同时发生6 事件的互逆 A B 且AB 1 1 1随机事件及其运算 2020 3 22 10 1 1 1随机事件及其运算 事件的运算规律1 交换律 A B B A AB BA2 结合律 A B C A B C AB C A BC 3 分配律 A B C AC BC AB C A C B C 4 对偶 DeMorgan 律 2020 3 22 11 例1 1 3甲 乙 丙三人各向目标射击一发子弹 以A B C分别表示甲 乙 丙命中目标 试用A B C的运算关系表示下列事件 1 1 1随机事件及其运算 2020 3 22 12 1 1 2概率的定义及其运算 从直观上来看 事件A的概率是指事件A发生的可能性 古典概型与概率若某实验E满足1 有限性 样本空间 1 2 n 2 等可能性 P 1 P 2 P n 则称E为古典概型也叫等可能概型 2020 3 22 13 设事件A中所含样本点个数为N A 以N 记样本空间 中样本点总数 则有 P A 具有如下性质 1 0 P A 1 2 P 1 P 0 3 AB 则P A B P A P B 古典概型中的概率 1 1 2概率的定义及其运算 2020 3 22 14 例1 1 4甲有三个子女的家庭 设每个孩子是男是女的概率相等 则至少有一个男孩的概率是多少 解 设A 至少有一个男孩 以H表示某个孩子是男孩T是女孩 N HHH HHT HTH THH HTT TTH THT TTT N A HHH HHT HTH THH HTT TTH THT 1 1 2概率的定义及其运算 2020 3 22 15 例1 1 5 设盒中有3个白球 2个红球 现从盒中任抽2个球 求取到一红一白的概率 解 设A 取到一红一白 1 1 2概率的定义及其运算 2020 3 22 16 一般地 设盒中有N个球 其中有M个白球 现从中任抽n个球 则这n个球中恰有k个白球的概率是 1 1 2概率的定义及其运算 2020 3 22 17 例1 1 6 将3个球随机的放入3个盒子中去 问 1 每盒恰有一球的概率是多少 2 空一盒的概率是多少 解 设A 每盒恰有一球 B 空一盒 1 1 2概率的定义及其运算 2020 3 22 18 一般地 把n个球随机地分配到m个盒子中去 n m 则每盒至多有一球的概率是 某班级有n个人 n 365 问至少有两个人的生日在同一天的概率有多大 1 1 2概率的定义及其运算 2020 3 22 19 1 1 2概率的定义及其运算 概率的统计定义事件A在n次重复试验中出现nA次 则比值nA n称为事件A在n次重复试验中出现的频率 记为fn A 即 fn A nA n 频率的性质 1 0 fn A 1 2 fn 1 fn 0 3 可加性 若AB 则fn A B fn A fn B 2020 3 22 20 实践证明 当试验次数n增大时 fn A 逐渐趋向一个稳定值 可将此稳定值记作P A 作为事件A的概率历史上曾有人做过试验 试图证明抛掷匀质硬币时 出现正反面的机会均等 实验者nnHfn H DeMorgan204810610 5181Buffon404020480 5069K Pearson1200060190 5016K Pearson24000120120 5005 1 1 2概率的定义及其运算 2020 3 22 21 1 1 2概率的定义及其运算 概率的加法公式对任意两事件A B 有P AUB P A P B P AB 该公式可推广到任意n个事件A1 A2 An的情形 以及 1 互补性 P 1 P A 2 可分性 对任意两事件A B 有P B P BA P B 2020 3 22 22 例1 1 7某市有甲 乙 丙三种报纸 订每种报纸的人数分别占全体市民人数的30 其中有10 的人同时定甲 乙两种报纸 没有人同时订甲乙或乙丙报纸 求从该市任选一人 他至少订有一种报纸的概率 解 设A B C分别表示选到的人订了甲 乙 丙报 1 1 2概率的定义及其运算 2020 3 22 23 1 1 2概率的定义及其运算 几何概型设试验E的样本空间为某可度量的区域 且 中任一区域出现的可能性大小与该区域的几何度量成正比 而与该区域的位置和形状无关 则称E为几何概型的试验 且定义事件A的概率为 2020 3 22 24 例1 1 8 蒲丰 Buffon 投针问题 平面上画着一些平行线 他们之间的距离都是a 向此平面随意投一长度为L的针 试求此针与任一平行线相交的概率 解 以x表示针的中点到最近一条平行线的距离 以 表示针与平行线的夹角 如图所示 显然样本空间为 1 1 2概率的定义及其运算 2020 3 22 25 以R表示边长为a 2与 的长方形 针与平行线相交当且仅当 设在R中满足该关系的区域为G 即图中阴影部分 则所求概率为 1 1 2概率的定义及其运算 2020 3 22 26 1 1 3条件概率 思考 袋中有十只球 其中九只白球 一只红球 十人依次从袋中各取一球 不放回 问 1 第一个人取得红球的概率是多少 2 第二个人取得红球的概率是多少 3 若已知第一个人取到的是白球 则第二个人取到红球的概率是多少 4 若已知第一个人取到的是红球 则第二个人取到红球的概率又是多少 2020 3 22 27 1 1 3条件概率 条件概率的定义已知事件A发生的条件下 事件B发生的概率称为A条件下B的条件概率 记作P B A 显然 若事件A B是古典概型的样本空间 中的两个事件 其中A含有nA个样本点 AB含有nAB个样本点 则 2020 3 22 28 例1 1 9设袋中有3个白球 2个红球 现从袋中任意抽取两次 每次取一个 取后不放回 1 求两次均取到红球的概率 2 求第二次取到红球的概率 3 已知第一次取到红球 求第二次也取到红球的概率 设A 第一次取到红球 B 第二次取到红球 1 1 3条件概率 2020 3 22 29 A B A 第一次取到红球 B 第二次取到红球 1 1 3条件概率 2020 3 22 30 1 1 3条件概率 乘法公式设P A 0 则 P AB P A P B A 称为事件A B的概率乘法公式推广到三个事件的情形 P ABC P A P B A P C AB 一般地 有下列公式 P A1A2 An P A1 P A2 A1 P An A1 An 1 2020 3 22 31 例1 1 10有1张电影票需要给3个人分 每个人都想要 决定用抓阄的方式解决 问抓阄的先后对此方法的公平性是否有影响 解 设Ai为第i次抓阄时取到电影票 i 1 2 3 则 由此可见 抓阄的方式是公平的 可推广到n中抓m的情况 P m n 2020 3 22 32 1 1 4全概率公式与贝叶斯公式 完备事件组事件组A1 A2 An n可为 称为样本空间 的一个完备事件组 若满足 An A2 A1 B 2020 3 22 33 1 1 4全概率公式与贝叶斯公式 全概率公式事件组A1 A2 An为样本空间 的一个完备事件组 且P Ai 0 i 1 n 则对任何事件B 有 An A2 A1 B 2020 3 22 34 例1 1 11市场上有甲 乙 丙三家工厂生产的同一品牌产品 已知三家工厂的市场占有率分别为1 4 1 4 1 2 且三家工厂的次品率分别为2 1 3 试求市场上该品牌产品的次品率 B 2020 3 22 35 解 设A1 从甲袋放入乙袋的是白球 A2 从甲袋放入乙袋的是红球 B 从乙袋中任取一球是红球 甲 乙 例1 1 12有甲乙两个袋子 甲袋中有两个白球 1个红球 乙袋中有两个红球 一个白球 这六个球手感上不可区别 今从甲袋中任取一球放入乙袋 搅匀后再从乙袋中任取一球 问此球是红球的概率 2020 3 22 36 1 1 4全概率公式与贝叶斯公式 贝叶斯公式上例中 若已知取到一个红球 则从甲袋放入乙袋的是白球的概率是多少 事件组A1 A2 An为样本空间 的一个完备事件组 且P Ai 0 i 1 n 则对任何事件B 有 2020 3 22 37 称为贝叶斯公式 例1 1 13用血清甲胎蛋白法诊断肝癌 试验反应有阴性和阳性两种结果 当被诊断者患肝癌时 其反应为阳性的概率为0 95 当被诊断者未患肝癌时 其反应为阴性的概率为0 9 根据记录 某地人群中肝癌的患病率为0 0004 现有一人的试验反应为阳性 问此人确实患肝癌的概率 2020 3 22 38 解 设A1 患肝癌 A2 未患肝癌 B 反应为阳性 则 根据贝叶斯公式 有所求概率为 表明还需要通过综合考虑其他方面才能确诊 2020 3 22 39 1 1 5事件的独立性 两个事件独立的定义设A B是两事件 P A 0 若P B P B A P AB P A P B 则称事件A与B相互独立 即A的发生与否对B毫无影响 定理以下四件事等价 1 事件A B相互独立 2 事件A B相互独立 3 事件A B相互独立 4 事件A B相互独立 2020 3 22 40 1 1 5事件的独立性 多个事件独立的定义若三个事件A B C满足 1 P AB P A P B P AC P A P C P BC P B P C 则称事件A B C两两相互独立 2 P ABC P A P B P C 则称事件A B C相互独立 2020 3 22 41 1 1 5事件的独立性 推广 一般地 设A1 A2 An是n个事件 如果对任意k 1 k n 任意的1 i1 i2 ik n 具有等式 P Ai1Ai2 Aik P Ai1 P Ai2 P Aik 则称n个事件A1 A2 An相互独立 2020 3 22 42 1 1 5事件的独立性 事件独立性的应用1 加法公式的简化 若事件A1 A2 An相互独立 则 2 在可靠性理论上的应用 2020 3 22 43 1 2随机变量 随机变量的概念离散型随机变量连续型随机变量正态分布 2020 3 22 44 1 2 1随机变量的概念 随机变量设 是试验的样本空间 如果量X是定义在 上的一个单值实值函数即对于每一个 有一实数X X 与之对应 则称X为随机变量 随机变量常用X Y Z或 等表示 通俗地说 每一个样本点可以数量化 每次试验的结果在未结束前是个未知变量 而且取值具有随机性 随机变量的特点 1 X的全部可能取值是互斥且完备的 2 X的部分可能取值描述随机事件 2020 3 22 45 请举几个实际中随机变量的例子 例1 2 1引入适当的随机变量描述下列事件 1 将3个球随机放入三个格子中 记空格子数为X 事件A 有1个空格 X 1 B 全有球 X 0 2 进行5次试验 记试验成功次数为Y 事件C 试验成功一次 Y 1 D 试验至少成功一次 Y 1 3 掷1次硬币 观察正反面 记正面为1 反面为0 2020 3 22 46 1 2 1随机变量的概念 随机变量的分类 随机变量的分布函数设X是随机变量 对任意实数x 事件 X x 的概率P X x 称为随机变量X的分布函数 记为F x 即F x P X x 易知 对任意实数a b a b P a X b P X b P X a F b F a 2020 3 22 47 1 2 1随机变量的概念 分布函数的性质 1 单调不减性 若x1 x2 则F x1 F x2 2 归一性 对任意实数x 0 F x 1 且 4 对任意实数a b a b P a X b P X b P X a F b F a 具有 1 3 性质的实函数 必是某个随机变量的分布函数 故该三个性质是分布函数的充分必要性质 3 右连续性 对任意实数x 2020 3 22 48 当x1时 F x 1 当0 x 1时 特别 F 1 P 0 x 1 k 1 例1 2 2向 0 1 区间随机抛一质点 以X表示质点坐标 假定质点落在 0 1 区间内任一子区间内的概率与区间长成正比 求X的分布函数解 F x P X x 1 2 1随机变量的概念 2020 3 22 49 1 2 2离散型随机变量 定义若随机变量X取值x1 x2 xn 而且取这些值的概率依次为p1 p2 pn 则称X为离散型随机变量 而称P X xk pk k 1 2 为X的分布律 列 或概率分布 也可表为 Xx1x2 xK Pp1p2 pk 2020 3 22 50 1 2 2离散型随机变量 分布律的性质 1 pk 0 k 1 2 2 例1 2 3设袋中有5只球 其中有2只白3只黑 现从中任取3只球 不放回 求抽得的白球数X为k的概率 解k可取值0 1 2 2020 3 22 51 1 2 2离散型随机变量 分布函数一般地 对离散型随机变量X P X xk pk k 1 2 其分布函数为 用分布函数描述随机变量不如分布律直观 2020 3 22 52 解 例1 2 4设随机变量X具分布律如右表 试求出X的分布函数 1 2 2离散型随机变量 2020 3 22 53 两点 0 1 分布若随机变量X的取值为0 1两个值 分布律为 P X 0 q 1 p P X 1 p则称X服从 0 1 分布 两点分布 1 2 2离散型随机变量 几个常用的离散型分布 2020 3 22 54 2 贝努里 Bernoulli 概型与二项分布设将试验独立重复进行n次 每次试验中 事件A发生的概率均为p 则称这n次试验为n重贝努里试验 若以X表示n重贝努里试验事件A发生的次数 则称X服从参数为n p的二项分布 记作X B n p 其分布律为 1 2 2离散型随机变量 2020 3 22 55 解 1 由题意 X B 6 1 3 于是 X的分布律为 例1 2 5从某大学到火车站途中有6个交通岗 假设在各个交通岗是否遇到红灯相互独立 并且遇到红灯的概率都是1 3 1 设X为汽车行驶途中遇到的红灯数 求X的分布律 2 求汽车行驶途中至少遇到5次红灯的概率 2020 3 22 56 3 泊松 Poisson 分布P 若随机变量X的分布律为 1 2 2离散型随机变量 P X k k 0 1 2 0 则称X服从参数为 的泊松分布 记作X P 泊松定理设随机变量X B n p n 0 1 2 且n很大 p很小 记 np 则 即可认为X P 2020 3 22 57 泊松定理表明 泊松分布是二项分布的极限分布 当n很大 p很小时 二项分布就可近似地看成是参数 np的泊松分布 1 2 2离散型随机变量 2020 3 22 58 解设X表示400次独立射击中命中的次数 则X B 400 0 02 故P X 2 1 P X 0 P X 1 1 0 98400 400 0 02 0 98399 取 np 400 0 02 8 故近似地有 例1 2 6某人射击的命中率为0 02 他独立射击400次 试求其命中次数不少于2的概率 P X 2 1 P X 0 P X 1 1 1 8 e 8 0 996981 2020 3 22 59 解 由题意 例1 2 7设某国每对夫妇的子女数X服从参数为 的泊松分布 且知一对夫妇有不超过1个孩子的概率为3e 2 求任选一对夫妇 至少有3个孩子的概率 2020 3 22 60 1 2 3连续型随机变量 对于随机变量X 若存在 上的非负函数f x 使对任意实数x 都有 概率密度 则称X为连续型随机变量 f x 为X的概率密度函数 简称概率密度或密度函数 2020 3 22 61 密度函数的几何意义为 2020 3 22 62 1 非负性f x 0 x 2 归一性 性质 1 2 是密度函数的充要性质 1 2 3连续型随机变量 密度函数的性质 3 若x是f x 的连续点 则 2020 3 22 63 1 2 3连续型随机变量 4 对任意实数b 若X f x x 则 P X b 0 5 2020 3 22 64 1 2 3连续型随机变量 几个常用的连续型分布 1 均匀分布 若X的分布密度为 则称X在 a b 内服从均匀分布 记作X U a b 对任意实数c d a c d b 都有 2020 3 22 65 15 45 解 设A 乘客候车时间超过10分钟X 乘客于某时X分钟到达 则X U 0 60 例1 2 8长途汽车起点站于每时的10分 25分 55分发车 设乘客不知发车时间 于每小时的任意时刻随机地到达车站 求乘客候车时间超过10分钟的概率 2020 3 22 66 2 指数分布若X的分布密度为 则称X服从参数为 0的指数分布 记为 X exp 其分布函数为 1 2 3连续型随机变量 2020 3 22 67 解 例1 2 9电子元件的寿命X 年 服从参数为3的指数分布 1 求该电子元件寿命超过2年的概率 2 已知该电子元件已使用了1 5年 求它还能使用两年的概率为多少 2020 3 22 68 正态分布是实践中应用最为广泛 在理论上研究最多的分布之一 故它在概率统计中占有特别重要的地位 3 正态分布 高斯 Gauss 分布 1 2 3连续型随机变量 若随机变量X的分布密度为 其中 为实数 0 则称X服从参数为 2的正态分布 记为 X N 2 2020 3 22 69 1 2 4正态分布 正态分布的特性 1 单峰对称密度曲线关于直线x 对称 f maxf x 2 的大小直接影响概率分布 越大 曲线越平坦 越小 曲线越陡峭 2020 3 22 70 参数 0 2 1的正态分布称为标准正态分布 记作 X N 0 1 1 2 4正态分布 标准正态分布 2020 3 22 71 1 2 4正态分布 性质 1 密度函数 2 分布函数 3 x 1 x 4 若X N 2 则 一般的概率统计教科书均附有标准正态分布表供读者查阅 x 的值 2020 3 22 72 1 2 4正态分布 性质 1 密度函数 2 分布函数 3 x 1 x 4 若X N 2 则 2020 3 22 73 例1 2 10 1 Z N 0 1 0 5 0 6915 P 1 32 Z 2 43 2 43 1 32 0 9925 0 9066 2 X N 2 P 3 X 3 3 3 2 3 1 0 9973 1 2 4正态分布 上式称为3 原则 在工程应用中 通常认为P X 3 1 忽略P X 3 的值 如在质量控制中 常用标准指标值 3 作两条线 当生产过程的指标观察值落在两线之外时发出警报 表明生产出现异常 2020 3 22 74 解 设Y为使用的最初90小时内损坏的元件数 故 则Y B 3 p 其中 例1 2 11一种电子元件的使用寿命 小时 服从正态分布 100 225 某仪器上装有3个这种元件 三个元件损坏与否是相互独立的 求 使用的最初90小时内无一元件损坏的概率 1 2 4正态分布 2020 3 22 75 随机变量的数学期望与方差几个常见分布的期望与方差随机变量的协方差和相关系数大数定律中心极限定理 1 3随机变量的数字特征 2020 3 22 76 引例 设某班40名学生的概率统计成绩及得分人数如下表所示 分数4060708090100总人数人数169157240则学生的平均成绩是总分 总人数 即 数学期望 描述随机变量取值的平均特征 1 3 1随机变量的期望与方差 数学期望的定义 2020 3 22 77 1 3 1随机变量的期望与方差 数学期望的定义 若X P X xk pk k 1 2 n 则称 为随机变量X的数学期望 简称期望或均值 函数Y g X 的期望E g X 为 2020 3 22 78 1 3 1随机变量的期望与方差 数学期望的定义 为随机变量X的数学期望 若X f x x 则称 若X f x x 则Y g X 的期望 2020 3 22 79 例1 3 1掷一颗均匀的骰子 以X表示掷得的点数 求X的数学期望 1 3 1随机变量的期望与方差 例1 3 2设随机变量X服从标准正态分布 求随机变量Y aX b的数学期望 其中a 0 2020 3 22 80 解 设乘客于某时X分到达车站 候车时间为Y 则 10分25秒 例1 3 3长途汽车起点站于每时的10分 30分 55分发车 设乘客不知发车时间 于每小时的任意时刻随机地到达车站 求乘客的平均候车时间 2020 3 22 81 1 3 1随机变量的期望与方差 数学期望的性质 1 E c c c为常数 2 E cX cE X c为常数 4 若X与Y独立 则E XY E X E Y 3 E X Y E X E Y 推广 E aX b aE X b 2020 3 22 82 例1 3 4若X B n p 求E X 1 3 1随机变量的期望与方差 例1 3 5设随机变量X1 X2 Xn服从N 2 分布 求随机变量 的数学期望 2020 3 22 83 方差是衡量随机变量取值波动程度的一个数字特征 1 3 1随机变量的期望与方差 方差的定义 若E X E X2 存在 则称E X E X 2 E X 2 E X 2为随机变量X的方差 记为D X 或Var X 称为随机变量X的标准差 方差的性质 1 D c 0 2 D aX a2D X a为常数 3 若X Y独立 则D X Y D X D Y 2020 3 22 84 1 3 1随机变量的期望与方差 推广 若X Y独立 则D X Y D X D Y D aX bY c a2D X b2D Y 2020 3 22 85 求D X 1 3 1随机变量的期望与方差 例1 3 6设随机变量X的概率密度为 2020 3 22 86 1 3 2几个常见分布的期望与方差 0 1分布 EX p E X2 p DX pq 二项分布B n p 2020 3 22 87 1 3 2几个常见分布的期望与方差 二项分布B n p 2020 3 22 88 1 3 2几个常见分布的期望与方差 泊松分布X P 2020 3 22 89 1 3 2几个常见分布的期望与方差 均匀分布U a b 2020 3 22 90 1 3 2几个常见分布的期望与方差 指数分布X exp 2020 3 22 91 1 3 2几个常见分布的期望与方差 正态分布N 2 2020 3 22 92 1 3 3协方差和相关系数 协方差定义 若随机变量X和Y的期望E X E Y 存在 则称 COV X Y E X E X Y E Y 为X与Y的协方差 易见 COV X Y E XY E X E Y 当COV X Y 0时 称X与Y不相关 X与Y不相关是X与Y独立的必要条件 2020 3 22 93 1 3 3协方差和相关系数 协方差性质 1 COV X Y COV Y X 2 COV X X D X COV X c 0 3 COV aX bY abCOV X Y 其中a b为常数 4 COV X Y Z COV X Z COV Y Z 5 D X Y D X D Y 2COV X Y 2020 3 22 94 1 3 3协方差和相关系数 相关系数定义 若X Y的方差和协方差均存在 且DX 0 DY 0 则 称为X与Y的相关系数 注 若记 称为X的标准化 易知EX 0 DX 1 且 2020 3 22 95 1 3 3协方差和相关系数 相关系数性质 1 XY 1 2 XY 1 存在常数a b使P Y aX b 1 3 X与Y不相关 XY 0 矩 1 K阶原点矩Ak E Xk k 1 2 而E X k 称为X的K阶绝对原点矩 2 K阶中心矩Bk E X E X k k 1 2 而E X E X k称为X的K阶绝对中心矩 2020 3 22 96 1 3 3协方差和相关系数 相关系数性质 1 XY 1 2 XY 1 存在常数a b使P Y aX b 1 3 X与Y不相关 XY 0 矩 1 K阶原点矩Ak E Xk k 1 2 而E X k 称为X的K阶绝对原点矩 2 K阶中心矩Bk E X E X k k 1 2 而E X E X k称为X的K阶绝对中心矩 2020 3 22 97 设X1 Xn为n个随机变量 记cij cov Xi Xj i j 1 2 n 则称由cij组成的矩阵为随机变量X1 Xn的协方差矩阵C 即 1 3 3协方差和相关系数 协方差矩阵 2020 3 22 98 若随机变量X的期望和方差存在 则对任意 0 有 这就是著名的切比雪夫 Chebyshev 不等式 它有以下等价的形式 切比雪夫不等式 1 3 4大数定律 2020 3 22 99 1 3 4大数定律 2020 3 22 100 解 由切比雪夫不等式 令 1 3 4大数定律 例1 3 6已知某种股票每股价格X的平均值为1元 标准差为0 1元 求a 使股价超过1 a元或低于1 a元的概率小于10 2020 3 22 101 依概率收敛 1 3 4大数定律 设 Xn 为随机变量序列 X为随机变量 若任给 0 使得 则称 Xn 依概率收敛于X 可记为 2020 3 22 102 如 意思是 当 a 而 意思是 时 Xn落在 内的概率越来越大 当 1 3 4大数定律 2020 3 22 103 依概率收敛 1 3 4大数定律 设 Xn 为随机变量序列 X为随机变量 若任给 0 使得 则称 Xn 依概率收敛于X 可记为 2020 3 22 104 设 Xk k 1 2 为独立的随机变量序列 且有相同的数学期望 及方差 2 0 则 即若任给 0 使得 1 3 4大数定律 切比雪夫大数定律 2020 3 22 105 证明 由切比雪夫不等式 这里 故 2020 3 22 106 设进行n次独立重复试验 每次试验中事件A发生的概率为p 记fn为n次试验中事件A发生的频率 则 证明 设 第i次试验事件A发生 第i次试验事件A不发生 则 由切比雪夫大数定理 1 3 4大数定律 伯努里大数定律 2020 3 22 107 若 Xk k 1 2 为独立同分布随机变量序列 EXk k 1 2 则 推论 若 Xi i 1 2 为独立同分布随机变量序列 E X1k 则 1 3 4大数定律 辛钦大数定律 2020 3 22 108 设 Xn 为随机变量序列 X为随机变量 其对应的分布函数分别为Fn x F x 若在F x 的连续点 有 则称 Xn 依分布收敛于X 可记为 1 3 5中心极限定理 依分布收敛 2020 3 22 109 设 Xn 为独立同分布随机变量序列 若EXk DXk 2 0 k 1 2 则 Xn 满足 1 3 5中心极限定理 独立同分布中心极限定理 Levy Lindeberg 根据上述定理 当n充分大时 实际上 当n充分大时 Xi对总和的影响既均匀又微小 2020 3 22 110 解 设Xk为第k次掷出的点数 k 1 2 100 则X1 X100独立同分布 由中心极限定理 例1 3 7将一颗骰子连掷100次 则点数之和不少于500的概率是多少 1 3 5中心极限定理 2020 3 22 111 设 Xn 为独立同分布随机变量序列 若EXk DXk 2 0 k 1 2 则 Xn 满足 1 3 5中心极限定理 独立同分布中心极限定理 Levy Lindeberg 根据上述定理 当n充分大时 实际上 当n充分大时 Xi对总和的影响既均匀又微小 2020 3 22 112 设随机变量 n n 1 2 服从参数为n p 0 p 1 的二项分布 则 证明 设 第i次试验事件A发生 第i次试验事件A不发生 则 由中心极限定理 结论得证 1 3 5中心极限定理 德莫佛 拉普拉斯中心极限定理 2020 3 22 113 1 3 5中心极限定理 例1 3 8在一家保险公司里有10000个人参加寿命保险 每人每年付12元保险费 在一年内一个人死亡的概率为0 6 死亡时其家属可向保险公司领得1000元 问 1 保险公司亏本的概率有多大 2 其他条件不变 为使保险公司一年的利润不少于60000元 赔偿金至多可设为多少 2020 3 22 114 解 设X表示一年内死亡的人数 则X B n p 其中 n 10000 p 0 6 np 60 npq 59 64设Y表示保险公司一年的利润 Y 10000 12 1000X于是由中心极限定理 1 P Y 0 P 10000 12 1000X 0 1 P X 120 1 7 75 0 1 3 5中心极限定理 2020 3 22 115 P Y 60000 P 10000 12 aX 60000 P X 60000 a 0 9 2 设赔偿金为a元 则令 由中心极限定理 上式等价于 1 3 5中心极限定理 2020 3 22 116 随机样本抽样分布 1 4数理统计的基本概念 2020 3 22 117 1 总体 研究对象的全体 通常指研究对象的某项数量指标全体 组成总体的元素称为个体 从本质上讲 总体就是所研究的随机变量或随机变量的分布 1 4 1随机样本 总体与样本 2 样本 来自总体的部分个体X1 Xn如果满足 1 同分布性 Xi i 1 n与总体X同分布 2020 3 22 118 1 4 1随机样本 2 独立性 X1 Xn相互独立 则称为容量为n的简单随机样本 简称样本 而称X1 Xn的一次实现为样本观察值 记为x1 xn 简单随机样本来自于简单随机抽样试验 特点 1 每次抽样中 各个个体被抽到的机会均等 2 每次抽样前 总体成分保持不变样本容量n相对于总体容量N而言是极小的 在试验中 不放回抽样可近似认为是有放回抽样 2020 3 22 119 3 总体 样本 样本观察值的关系 总体 样本 样本观察值 理论分布 统计是从手中已有的资料 样本观察值 去推断总体的情况 总体分布 样本是联系两者的桥梁 总体分布决定了样本取值的概率规律 也就是样本取到样本观察值的规律 因而可以用样本观察值去推断总体 1 4 1随机样本 2020 3 22 120 统计量的定义抽样分布常用统计量及其分布 1 4 2抽样分布 2020 3 22 121 1 4 2抽样分布 统计量的定义 如果样本X1 Xn的函数g X1 Xn 不含未知参数 则称g X1 Xn 是总体X的一个统计量 如 2020 3 22 122 1 4 2抽样分布 三大抽样分布 统计量的分布称为抽样分布 数理统计中常用到如下三个分布 2 分布 t 分布和F 分布 1 2 分布 2020 3 22 123 2 2 分布的密度函数f x 曲线 1 4 2抽样分布 2020 3 22 124 3 临界点设X 2 n 若对于 0 1 存在 满足 则称 为 分布的临界点 1 4 2抽样分布 2020 3 22 125 实际应用中 常常将满足 的点 称为 分布的上侧临界点 1 4 2抽样分布 而将满足 的点 分布的下侧临界点 称为 2020 3 22 126 使得 对于不同的n和a 和 1 4 2抽样分布 可查 2分布表得到 4 性质 分布可加性 若X 2 n1 Y 2 n2 X与Y独立 则X Y 2 n1 n2 期望与方差 若X 2 n 则E X n D X 2n 2020 3 22 127 1 4 2抽样分布 三大抽样分布 2t 分布 1 定理 若 N 0 1 2 n 与 独立 则 t n 称为自由度为n的t 分布 2 t n 的概率密度为 2020 3 22 128 1 4 2抽样分布 3 基本性质 f t 关于t 0 纵轴 对称 f t 的极限为N 0 1 的密度函数 即 表明 当n比较大时 n 30 可用标准正态分布代替t分布 2020 3 22 129 4 临界点设T t n 若对 00 满足 P t n T t n 1 则称t n 为t n 的临界点 1 4 2抽样分布 2020 3 22 130 1 4 2抽样分布 三大抽样分布 3F 分布 1 定理 若X 2 n1 Y 2 n2 X与Y独立 则 称为第一自由度为n1 第二自由度为n2的F 分布 其概率密度为 2020 3 22 131 2 F 分布的临界点 1 4 2抽样分布 对于 00 满足 P F F 2 n1 n2 2 则称F 2 n1 n2 为F分布的上侧临界点 对于 00 满足 P F F1 2 n1 n2 1 2 则称F1 2 n1 n2 为F分布的下侧临界点 总之 使得 P F1 2 n1 n2 F F 2 n1 n2 1 2020 3 22 132 3 F 分布的性质 1 4 2抽样分布 证明 设F F n1 n2 则 2020 3 22 133 1 4 2抽样分布 常用统计量及其分布 1样本均值 证明 由于n个独立的正态随机变量的线性组合 仍然服从正态分布 2020 3 22 134 1 4 2抽样分布 常用统计量及其分布 2样本方差 定理4证明提示 2020 3 22 135 1 4 2抽样分布 常用统计量及其分布 2样本方差 2020 3 22 136 1 4 2抽样分布 常用统计量及其分布 3样本矩 2020 3 22 137 点估计估计量的评选标准区间估计正态总体参数的区间估计 1 5参数估计 参数估计问题是一类统计推断问题 指的是在处理实际问题时 采用抽样的方法 从获取的样本数据中提取有用的信息 来对总体的情况进行推断 主要指的是对分布形式已知的总体中的某些未知参数的估计问题 主要内容 2020 3 22 138 设X1 Xn是总体X的一个样本 其分布函数为F x 其中 为未知参数 为参数空间 若统计量g X1 Xn 可作为 的一个估计 则称其为 的一个估计量 记为 注 F x 也可用分布律或密度函数代替 1 5 1点估计 参数估计的概念 2020 3 22 139 若x1 xn是样本的一个观测值 由于g x1 xn 是实数域上的一个点 现用它来估计 故称这种估计为点估计 点估计的经典方法是矩估计法与极大似然估计法 1 5 1点估计 点估计 称为估计量 的一个观测值 2020 3 22 140 1 5 1点估计 矩估计法 简称 矩法 关键点 用样本矩作为总体同阶矩的估计 即 一般使用 2020 3 22 141 1 5 1点估计 例1 5 1设X1 Xn为取自总体B m p 的样本 其中m已知 0 p 1未知 求p的矩估计 例1 5 2设X1 Xn为取自总体N 2 的样本 求 2的矩估计 2020 3 22 142 1 5 1点估计 极大似然估计法 1极大似然思想有两个射手 一人的命中率为0 9 另一人的命中率为0 1 现在他们中的一个向目标射击了一发 结果命中了 估计是谁射击的 一般说 事件A发生的概率与参数 有关 取值不同 则P A 也不同 因而应记事件A发生的概率为P A 若A发生了 则认为此时的 值应是在 中使P A 达到最大的那一个 这就是极大似然思想 2020 3 22 143 1 5 1点估计 极大似然估计法 2似然函数 为该总体的似然函数 3极大似然估计 则称为 的极大似然估计 若有 使得 2020 3 22 144 1 5 1点估计 极大似然估计法 4求极大似然估计步骤 1 建立似然函数 2 做对数似然函数 3 列似然方程 若该方程有解 则其解就是 注 若概率函数中含有多个未知参数 则可解方程组 2020 3 22 145 1 5 1点估计 例1 5 3设X1 Xn为取自总体N 2 的样本 求 2的极大似然估计 2020 3 22 146 1 5 1点估计 2020 3 22 147 1 5 2估计量的评选标准 无偏性 可以证明 即 2020 3 22 148 1 5 2估计量的评选标准 有效性 例1 5 4设分别为取自总体X的容量为n1 n2的两个样本的样本均值 求证 对任意实数a 0 b 0 a b 1 统计量都是E X 的无偏估计 并求a b使所得统计量最有效 2020 3 22 149 1 5 2估计量的评选标准 2020 3 22 150 1 5 2估计量的评选标准 一致性 例1 5 5设X1 Xn为取自总体B m p 的样本 其中m已知 0 p 1未知 求p的矩估计讨论所求估计量的一致性 2020 3 22 151 1 5 3区间估计 设总体X的分布函数F x 含有未知参数 对于给定值 0 1 若由样本X1 Xn确定的两个统计量使 则称随机区间为 的置信度为1 的置信区间 注 F x 也可换成概率密度或分布律 2020 3 22 152 1 5 4正态总体参数的区间估计 单正态总体均值 的置信区间 1总体方差 2已知 2 1 的置信度为1 的置信区间为 2020 3 22 153 求正态总体参数置信区间的解题步骤 1 根据实际问题构造样本的函数 要求仅含待估参数且分布已知 2 令该函数落在由分位点确定的区间里的概率为给定的置信度1 要求区间按几何对称或概率对称 3 解不等式得随机的置信区间 4 由观测值及 值查表计算得所求置信区间 2020 3 22 154 1 5 4正态总体参数的区间估计 2总体方差 2未知 的置信度为1 的置信区间为 2020 3 22 155 1 5 4正态总体参数的区间估计 单正态总体方差 2的置信区间 假设总体均值 未知 2的置信度为1 的置信区间为 2020 3 22 156 1 5 4正态总体参数的区间估计 双正态总体均值差的置信区间 1 2的置信度为1 的置信区间为 2020 3 22 157 1 5 4正态总体参数的区间估计 双正态总体方差比的置信区间 假设总体均值 1 2未知 12 22的置信度为1 的置信区间为 2020 3 22 158 假设检验的基本概念和思想单正态总体的假设检验双正态总体均值差与方差比的假设检验 1 6假设检验 2020 3 22 159 一 两类问题1 参数假设检验 总体分布已知 参数未知 由观测值x1 xn检验假设原假设H0 0 备择假设H1 0 2 非参数假设检验 总体分布未知 由观测值x1 xn检验假设H0 F x F0 x H1 F x F0 x 1 6 1假设检验的基本概念和思想 基本概念 2020 3 22 160 以样本 X1 Xn 出发制定一个法则 一旦观测值 x1 xn 确定后 我们由这个法则就可作出判断是拒绝H0还是接受H0 这种法则称为对H0的一个检验法则 简称检验法 样本观测值的全体组成样本空间 把 分成两个互不相交的子集W和W 即 W W W W 假设当 x1 xn W时 我们就拒绝H0 当 x1 xn W 时 我们就接受H0 子集W 就称为检验的拒绝域 或临界域 二 检验法则与拒绝域 1 6 1假设检验的基本概念和思想 2020 3 22 161 三 检验的两类错误称H0真而被拒绝的错误为第一类错误或弃真错误 称H0假而被接受的错误为第二类错误或取伪错误 记 p 拒绝H0 H0真 p 接受H0 H0假 人们希望找到临界域W 使得犯两类错误的概率都很小 奈曼 皮尔逊 Neyman Pearson 提出了一个原则 在控制犯第一类错误的概率不超过指定值 的条件下 尽量使犯第二类错误 小 按这种法则做出的检验称为 显著性检验 称为显著性水平或检验水平 1 6 1假设检验的基本概念和思想 2020 3 22 162 1 根据实际问题作出假设H0与H1 2 构造统计量 在H0真时其分布已知 3 给定显著性水平 的值 参考H1 令P 拒绝H0 H0真 求出拒绝域W 很小 P 拒绝H0 H0真 是个小概率事件 在一次试验中 一般不可能发生 若发生 表明不是小概率事件 所以应拒绝H0 4 计算统计量的值 若统计量 W 则拒绝H0 否则接受H0 1 6 1假设检验的基本概念和思想 显著性检验的思想和步骤 2020 3 22 163 1 2已知的情形 U检验法 对于假设H0 0 H1 0 构造 计算U 查表 比较大小 得出结论 1 6 2单正态总体的假设检验 单总体均值的假设检验 2020 3 22 164 说明 H0 0 H1 m0称为双边HT问题 而H0 0 H1 0 或 0 则称为单边问题 求解时 只需拒绝域取对应单边即可 1 6 2单正态总体的假设检验 例1 6 1设某厂生产一种灯管 其寿命X N 2002 由以往经验知平均寿命 1500小时 现采用新工艺后 在所生产的灯管中抽取25只 测得平均寿命1675小时 问采用新工艺后 灯管寿命是否有显著提高 0 05 2020 3 22 165 解 这里 所以拒绝H0接受H1 1 6 2单正态总体的假设检验 说明 单边检验就用单边拒绝域 2020 3 22 166 2 2未知的情形 T检验法 双边检验 对于假设H0 0 H1 0 由p T t 2 n 1 得水平为 的拒绝域为 T t 2 n 1 1 6 2单正态总体的假设检验 单总体均值的假设检验 2020 3 22 167 1 6 2单正态总体的假设检验 例1 6 2用热敏电阻测温仪间接温量地热勘探井底温度 重复测量7次 测得温度 112 0113 4111 2112 0114 5112 9113 6而用某种精确办法测得温度为112 6 可看作真值 试问用热敏电阻测温仪间接测温有无系统偏差 设温度测量值X服从正态分布 取 0 05 解 H0 112 6 H1 112 6 由p T t0 025 n 1 0 0

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论