文科概率和统计基础知识_第1页
文科概率和统计基础知识_第2页
文科概率和统计基础知识_第3页
文科概率和统计基础知识_第4页
文科概率和统计基础知识_第5页
已阅读5页,还剩2页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、本文格式为Word版,下载可任意编辑 文科概率和统计基础知识 概率与统计 一、统计 1 1 三种抽样方法的对比 类别 共同点 特点 相互联系 适用范围 简 单 随 机抽样 抽样过程中每个个体被抽到的可能性相等;每次抽出个体后不再放回,即不 放回抽样. 从总体中逐个抽 取. 总 体 个 数较少. 系统抽样 将总体平均分成几部分,按预先制定的规矩在各 部分中抽取 1 个个体. 系统:在 起始部分取样时,采用简单随机抽样,其余部分等距抽。 分层:各层抽样时,采用简单随机抽样或系统抽样(层的容量大时可用系统抽样). 总 体 个 数较多. 分层抽样 将 总 体 分 成 几层,按各层个体 数之比抽取. 总

2、体由差 异 明 显 的几 部 分 组成. 2 2 常用的统计图表:一表(频率分布表);两图(频率分布直方图和茎叶图) (1) 频率分布直方图 小长方形的面积=组距频率组距=频率; 各小长方形的面积之和等于 1; 小长方形的高=频率组距,所有小长方形的高的和为1组距 【注意】直方图的纵轴(小长方形的高)一般是) 频率除以组距的商(而不是频率),横轴一般是 数据的大小,小长方形的面积表示频率 (2)茎叶图 在样本数据较少时,用茎叶图表示数据的效果较好 3 3 用样本的数字特征估计总体的数字特征 (1)众数、中位数、平均数 数字特征 样本数据 频率分布直方图 众数 出现次数最多的数据 取最高的小长方

3、形 底边中点 的横坐标 中位数 将数据 按大小依次排列,处在最中间位置的一个数据(或最中间两个数据的平均数) 把频率分布直方图划分成 左右两个面积相等的 分界限与 x 轴交点的横坐标 平均数 样本数据的 算术平均数 每个小长方形的面积乘以小长方形 底边中点的横坐标之 和 (2)平均数1 21( )nx x x xn 方差2 2 2 21 21( ) ( ) ( ) ns x x x x x xn 标准差2 2 21 21( ) ( ) ( ) ns x x x x x xn 【提醒】标准差、方差越大,数据的离散程度越大,越不稳定 4 变量间的相关关系 知识点分析 1、线性回归方程: a x b

4、 y ( x 叫做解释变量, y 叫做预报变量) 线性回归方程系数公式: ( 公式说明: 回归直线过样本的中心点 ) ( y x , ,也就是平均值点.) 2、相关系数公式 3、几个结论: (1)回归直线过样本的中心点 ) ( y x , . (2) b b 0 0 时, y 与 x 正相关,散点图呈上升趋势; b b 0 0 时, y 与 x 负相关,散点图呈下降趋势. (3)斜率 b 的含义(举例): 假如回归方程为 y =2.5 x +2, 说明 x 增加 1 个单位时, y 平均增加 2.5 个单位; 假如回归方程为 y =2.5 x +2,说明 x 增加 1 个单位时, y 平均减少

5、 2.5 个单位. (4)相关系数 r 表示变量的相关程度。 范围: 1 r ,即 1 1 r r 越 大,相关性越 强。 0 r 时, y 与 x 正相关; 0 r 时, y 与 x 负相关. (5)相关指数2R 表示模型的拟合效果。范围: 1 0 2, R 2R 越 大,拟合效果越 好, ,(这时:残差平方和越小,残差点在带状区域内的分布对比均匀,带状区域宽度越窄,拟合精度越高). 2R 表示解释变量 x 对于预报变量 y 变化的贡献率。 例如: 64 . 02 R ,说明 x 解释了 64%的 y 变化,或者说 y 的差异有 64%是由 x引起的。 (6)线性回归模型 e a bx y

6、, 其中 e 叫做 随机误差。( y 是由 x 和 e 共同确定的) 二、概率 1 1 概率的五个基本性质 (1)随机事件 A 的概率:0 ( ) P A 1 (2)必然事件的概率为 1 (3)不可能事件的概率为 0 (4)假如事件 A 与事件 B 互斥(不可能同时发生),则 ( ) ( ) ( ) P A B P A P B (5)假如事件 A 与事件 B 互为对立事件(不会同时发生,但一定有一个发生),那么( ) ( ) ( ) 1 P A B P A P B ,即 ( ) 1 ( ) P A P B 对立必互斥,互斥未必对立 2 2 古典概型 (1)特点:有限性,等可能性 (2)概率公式

7、: ( )AP A 事件 中所含的基才能件数试验的基才能件总数 3 3 几何概型 (1)特点:无限性,等可能性 (2)概率公式:( )( )( )AP A 构成事件 的区域长度 面积或体积试验的全部结果所构成的区域长度 面积或体积 三 、独立性检验 (一) 知识点分析 1 1 、 2 22 列联表:统计 被调查者的两种状态, 每种状态又分两种状况的调查结果表.对于 性别变量,其取值为男和女两种,这种变量的不同值表示个体所属的不同类别,像这类变量称为 分类变量。 2 2 、卡方统计量:为了研究事件 X 与 Y 的关系,经调查得到一张 22 列联表,如下表所示: Y 1 Y 2 合计 X 1 a

8、b a + b X 2 c d c + d 合计 a + c b + d n = a + b + c + d 独立性检验原理:也叫) 假设性检验(类似反证法原理),一般状况下, 假设分类变量 X和 Y 之间 没有关系,通过计算2K 值,然后 查表对照相应的概率 P P, 发现这种假设正确的概率 率 P P 很小,从而 推翻假设,结果得出 X 和 Y 之间 有关系的可能性为(1P),也就是X X 和 和 Y Y有关系.(表中的 k 就是2K 的观测值,即2K k ) 统计量2K (读做 卡方),它的表达式是:) )( )( )( () (22d b c a d c b abc ad nK 独立性

9、检验临界值表 P P( ( k k 2 2 k k ) ) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 k k 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 (表中的 K K 是理论值,2K 是实际观测值,2K 越 大,说明变量间越 有关系) (二) 独立性检验举例 例 例 1 1、某高校统计初步课程的教师随机调查了选该课的一些学生状况,具体数据如下表: 非统计专业 统计专业 男 13 10 女 7 20 为了检验主修统计专业是否与性别有关系,根据表中的数据,查对临界值 P P( ( k k 2 2 k k ) ) 0.10 0.05 0.025 0.010 k k 2.706 3.841 5.024 6.635 根据表中数据,得到 。所以有 的把握认为主修统计专业与性别有关系。 例 例 2 2、某电视台在一次对收看文艺节目和新闻节 目观众的抽样调查中,随机抽取了 100 名电视观 众,相关的数据如表所示: (1)由表中数据分析,收看新闻节目的观众是 否与年龄有关? (2)用分层抽样方法在收看新闻节目的观众中随机抽取 5 名,大于 40 岁的观众应当抽取几名? (3)在上述抽取的5名观众中任取2名,求恰有1名

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论