版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第一章导论概念:统计学:收集、处理、分析、解释数据井从数据中得出结论的科学。统计的分类:描述统计:研究的是数据收集,处理,汇总,图表描述,文字概括与分析等统计方法。推断统计:是研究如何利用样木数据进行推断总体特征。数据:1.分类数据:对事物进行分类的结果数据,表现为类别,用文字来表述。例如,人口按性别分为男、女两类2.顺序数据对事物类别顺序的测度,数据表现为类别,用文字来表述例如,产品分为一等品、 二等品、三等品、次品等3.数值型数据 对事物的精确测度,结果表现为具体的数值。 例如:身高为175cm, 190cm, 200cm参数:描述总体特征。有总体均值心、标准差总体比例T统计量:描述样本特
2、征,样本标准差s,样木比例p参数估计假设检验统计数据的分类第二伊数据的搜!!1.数据来源包括直接来源一手数据和间接来源二手数据2,抽样方式包括概率抽样与非概率抽样3.概率抽样:也称随机抽样。按一定的概率以随机原那么抽取样本,抽取样本时使每个单位都有一定的时机被抽中。概率抽样4.5.抽样误差:是由抽样的随机性引起的样本结果与总体真值之间的误差。抽样误按计量层次按收集方法_ 1匚1,一11 F分顺数观实类序值察验的的型的的数数数数数简箪随机分层抽样整群抽样系剜样多阶段抽祥差并不是针对某个样本的检测结果与总体真是结果的差异而言,抽样误差描述 的是所有样本可能的结果与总体真值之间的平均差异。6.抽样误
3、差的大小与样本量的大小和总体的变异程度有关。第三章 数据的图表展示计算机实训内容, 要求:1.数据筛选,自动筛选2.高级筛选,3.数据排序4.分类汇总-利用数据透视表5.比照条形图6.环形图7.累计频数图8.散点图9.雷达图频数分布图两种方法:工具-数据分析-直方图 数值型和顺序数据第四章 数据的概括性度量数据-数据透视表数据透视表数据的特征和测度: 集 中 趋 势11离散程度分布的形状1众薮中位数众比率一偏态四分位差均1值平均差一差和标准差高散系数峰度集中趋势:算数平均数:几何平均数:指n个观察值连乘积的n次方根,计算平均开展速度时复利下的平均年利率,最常用的一种计算公式为,几何平均数 v
4、算术平均数。中位数:有限的数集,可以通过把所有观察值上下排序后找出正中间的一个作为中位数。平均家庭收入记忆的重耍性离散程度:异众比率:异众比率指的是总体中非众数次数与总体全部次数之比。了解四分位差:了解方差:var标准差:STDEVtM M D 相对位置的度虽:标准分数:离散系数:形状:偏态:SK0 ,正值,正偏或者右偏,右偏分布SK0 ,尖峰,数据分布集中,左煽分布,大数集中。K0 ,扁平,数据分布分散。第五章概率与概率分布1.概率的分类:1.概率的古典定义,概率的统计定义,概率的主观定义。2.期望值:在离散型随机变量X的一切可能取值的完备组中,各可能取值xi与其取相对应的概率pi乘积之和,
5、描述离散型随机变量取值的集中程度,记作E(X),或者必其实为加权平均数。3.二项分布的数学期望为E ( X ) = np方差为D ( X ) = npq标准差?区别二项分布的概率值与期望值。4.当二项分布中n很大,p很小时,二项分布就变成为Poisson分布计算机计算二项分布计算时候,:1,目标概率2,实验次数3 ,成功次数公式:C*摞f(目标概率)成功的次数(1-目标概率)失败的次数二项分布换泊松分布,:1,入=np=1*22,成功的次数(揉合在一起,因为都是那种目标概率小、实验次数多的实验)入=数学期望值E (X)=方差D(X)=npP119例子,P121例子5.正态分布主要特点:钟型,离
6、 近的概率大,离远的概率小。标准差小,集中;标准差大,分散。正态曲线的最高点在均值 必 它也是分布的中位数和众数。正态分布是一个分布族,每一特定正态分布通过均值和标准差 b 来区分。曲线fx相对于均值 宓寸称,尾端向两个方向无限延伸,且理论上永远不会与横轴相交正态曲线下的总面积等于1。计算机计算:1,正态分布的形状与b , 2.临界值右端值,即默认计算的是改值以左局部的面积6.标准正态分布:期望值=0 ,即曲线图象对称轴为Y轴,标准差0=1条件下的正态分布,记为N0 , 1。N是正态英文的首字母计算:由于形状N0 , 1,所以只需要知道 临界值右端值7.此段内容只供理解,不是知识。概率函数:横
7、轴表示 “统计对象,纵轴表示概率。故称概率函数。概率密度函数:将直方图组距缩小到很密的程度,故称概率密度函数。分布函数:分布函数Fx在x处的函数值就表示X落在区间-8 ,x上的概率。把概率函 数的面积转换成分布函数的纵轴值所以:找一个的具体值的概率 应该在密度函数 上的值,范围区间-8 ,x是在分布函数 上的 值,一个范围区间X1X2 是分布函数上X2的值-X1的值3b 原那么:只要是正态分布,不管标准与否,可以反过来理解8.正态分布的数值分布在i- q i+ b中的概率为0.6826数值分布在1-2b,四+2 b中的概率为0.9544数值分布在(1-3 (T, (1+3 b)中的概率为0.9
8、974可以认为,Y的取值几乎全部集中在-3 b,四+3 b区间内,超出这个范围的可能性仅占不到0.00269.正态分布表即#T2x10.其他公式:P (aXb)-(b) -0(a)P(JX|(a)-11.正态分布的标准化公式:Z=X- Q/ bN0,1EXCE L实例方差为oA2/n的正态分布。样本,当n充分大时,样本均值的抽样分布近似服从均值为那么标准差呢?理解:m为总体个数,n为抽样时每个样本的个数,可以抽出C;个样本,这些样本符合正态分布。第七章:参数估计1.参数估计: 根据统计量计算推断出总体低的参数,包括点估计和区间估计2.点估计:点估计3.区间估计:条件1.均值2.标准差3.置信水平区间应包括几个标
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 发电厂生产制度
- 生产过程内控制度
- 订单生产及出货制度
- 钣金厂生产规章制度
- 电力设施生产安全制度
- 安全生产用电规章制度
- 生产部现场管理制度
- 茶叶生产管各项理制度
- 车间生产报告制度
- 精益管生产管理制度
- 环保数据监测协议2026
- 饼房(西点)厨师长年度工作总结课件
- 2025年贵阳市乌当区留置辅警笔试真题附答案解析
- 主动脉瓣置换术指南
- 2025年计算机四级网络工程师考试笔试试题(附答案)
- 病种成本核算与临床路径精细化管理
- 华为员工合同协议书
- 企业资产购置决策分析与决策表格
- 项目管理专员年底工作总结及2026年项目管理计划
- 2025年陕西公务员《申论(C卷)》试题含答案
- 管理体系不符合项整改培训试题及答案
评论
0/150
提交评论