




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第一章导论概念:统计学:收集、处理、分析、解释数据井从数据中得出结论的科学。统计的分类:描述统计:研究的是数据收集,处理,汇总,图表描述,文字概括与分析等统计方法。推断统计:是研究如何利用样木数据进行推断总体特征。数据:1 .分类数据:对事物进行分类的结果数据,表现为类别,用文字来表述。例如,人口按性别 分为男、女两类2 .顺序数据对事物类别顺序的测度,数据表现为类别,用文字来表述例如,产品分为一等品、 二等品、三等品、次品等3 .数值型数据对事物的精确测度,结果表现为具体的数值。例如:身高为175cm, 190cm, 200cm参数:描述总体特征。有总体均值(口)、标准差()总体比例(T)统
2、计量:描述样本特征,样本标准差,样木比例(p)统计方法统计数据的分类按计层次按收集方法按时间状况第二章数据的搜集1 .数据来源包括直接来源(一手数据)和间接来源(二手数据)2 .抽样方式包括概率抽样与非概率抽样3 .概率抽样:也称随机抽样。按一定的概率以随机原则抽取样本,抽取样本时使每个单位都 有一定的机会被抽中。5 .抽样误差:是由抽样的随机性引起的样本结果与总体真值之间的误差。抽样误 差并不是针对某个样本的检测结果与总体真是结果的差异而言,抽样误差描述 的是所有样本可能的结果与总体真值之间的平均差异。6 .抽样误差的大小与样本量的大小和总体的变异程度有关。第三章数据的图表展示计算机实训内容
3、,要求:1 .数据筛选,自动筛选2 .高级筛选,3 .数据排序4 .分类汇总-利用数据透视表5 .对比条形图6 .环形图7 .累计频数图8 .散点图9 .雷达图等等频数分布图两种方法:工具-数据分析-直方图数值型和顺序数据 数据-数据透视表数据透视表第四章数据的概括性度量集中趋势:算数平均数:几何平均数:指n个观察值连乘积的n次方根,计算平均发展速度时复利下的 平均年利率,最常用的一种计算公式为,几何平均数二算术平均数。中位数:有限的数集,可以通过把所有观察值高低排序后找出正中间的一个作为 中位数。(平均家庭收入)(记忆的重要性)离散程度:异众比率:异众比率指的是总体中非众数次数与总体全部次数
4、之比。(了解)四分位差:(了解) 方差:var标准差:STD EV平均差相对位置的度量:标准分数:离散系数: 形状:偏态:SK>0 ,正值,正偏或者右偏,SK<0 ,负值,负偏或者左偏, 绝对值0 0.5, 1三个界线。公右偏分布,小数集中八左儡分布,大数集41峰态:K>0 ,尖峰,数据分布集中,KvO ,扁平,数据分布分散。第五章概率与概率分布L概率的分类:1.概率的古典定义,概率的统计定义,概率的主观定义。2 .期望值:在离散型随机变量X的一切可能取值的完备组中,各可能取值总与其取相对应 的概率出乘积之和,描述离散型随机变量取值的集中程度,记作E(X),或者以,其实为加权
5、 平均数。3 .二项分布的数学期望为E (X) = np方差为D (X) = npq标准差?区别二项分布的概率值与期望值。4 .当二项分布中n很大,p很小时,二项分布就变成为Poisson分布计算机计算二项分布计算时候,已知:1,目标概率 2,实验次数 3,成功次数公式:0歌黑震(目标概率产功的次数(1-目标概率泮的次数二I页分布换泊松分布,已知:1,入= np=l*2 2 ,成功的次数(揉合在一起,因为都是那种目标概率小、实验次数多的实购)入=数学期望值E(X):方差DQ() = npP119例子,P121例子5 .正态分布主要特点:钟型,离H近的概率大,离H远的概率小。标准差小,集中;标准
6、差大,分散。正态曲线的最高点在均值H,它也是分布的中位数和众数。正态分布是一个分布族,每一特定正态分布通过由值闻标准差。来区分。曲线f(x)相对于均值网称,尾端向两个方向无限延伸,目理论上永远不会 与横轴相交正态曲线下的总面积等于1。计算机计算:已知:1,正态分布(的形状)(H与。),2.临界值(右端值,即默认计算 的是改值以左部分的面积)6 .标准正态分布:期望值卜=0,(即曲线图象对称轴为Y轴),标准差。=1条件下的正态分布,记为N(0,1)。(N是正态英文的首字母)计算:由于形状已知(N(0,1),所以只需要知道临界值(右端值)7 .此段内容只供理解,不是知识。概率函数:横轴表示“统计对
7、象”,纵轴表示“概率"。故称概率函数。概率密度函数:将直方图组距缩小到很密的程度,故称概率密度函数。分布函数:分布函数F(x)在x处的函数值就表示X落在区间(-8,x上的概率。(把概率函 数的面枳转换成分布函数的纵轴值)所以:找一个的具体值的概率应该在密度函数上的值,范围区间(-8,x是在分布函数上的 值,一个范围区间(X1X2 )是分布函数上X2的值XT的值8.正态分布的3。原则:只要是正态分布,不论标准与否,(可以反过来理解)数值分布在(HP,n+o)中的概率为0.6826数值分布在(H2(j,h+2o)中的概率为0.9544数值分布在(火3。串+刈中的概率为0.9974可以认为
8、,Y的取值几乎全部集中在(氏3。串+3。)区间内,超出这个范围的可能性仅占不到0.00269 .正态分布表0 Gx)=1 0(x)10 .其他公式:?(«<x<6>0(6) 0(a)P(|X| <)=2 -111 .正态分布的标准化公式:Z=(X-n)/aN(0,l) ( EXCEL实例)样本,当n充分大时,样本均值的抽样分布近似服从均值为内方差为aA2/n的正态分布。(那么标准差呢?)理解:m为总体个数,n为抽样时每个样本的个数,可以抽出C;个样本,这些样本符合正态分布。第七章:参数估计L参数估计:根据统计量计算推断出总体低的参数,包括点估计和区间估计2 .点估计:点估计3 .区间估
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 山西体育职业学院《C语言》2023-2024学年第二学期期末试卷
- 贵阳康养职业大学《微波测量技术及仪器》2023-2024学年第二学期期末试卷
- 宁波工程学院《成本会计学》2023-2024学年第二学期期末试卷
- 吉林城市职业技术学院《传感与检测技术》2023-2024学年第二学期期末试卷
- 九江职业技术学院《云计算和大数据技术》2023-2024学年第二学期期末试卷
- 南京城市职业学院《商务决策模型》2023-2024学年第二学期期末试卷
- 2024年发电机组、内燃发电机组及旋转式变流机项目资金需求报告代可行性研究报告
- 核磁共振成像设备维护保养培训
- 学生个人规划课件
- 小学生感恩教育主题班会
- DEFORM-3D模拟控制(五):网格重划分
- 2023年江苏南京市市属国企高层次人才招聘笔试参考题库附带答案详解
- COMMERCIAL INVOICE 商业发票模板
- 耳尖放血课件完整版
- 履带式起重机
- 基于TLR4-ACE2轴研究铁死亡在幽门螺杆菌感染致病中的作用及机制
- 篮球比赛计时计分器设计
- 并购重组试题
- GB/T 23329-2009纺织品织物悬垂性的测定
- GB/T 21411.2-2009石油天然气工业井下设备人工举升用螺杆泵系统第2部分:地面驱动装置
- GB 2757-2012食品安全国家标准蒸馏酒及其配制酒
评论
0/150
提交评论