应用统计学概念整理_第1页
应用统计学概念整理_第2页
应用统计学概念整理_第3页
应用统计学概念整理_第4页
应用统计学概念整理_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、文案大全文案大全应用统计学概念整理第一章:导论只能归类于某一类别的非数字型数据称为分类数据只能归于某一有序类别的非数字型数据称为顺序数据按数字尺度测量的观测值称为数值型数据包含所研究的全部个体的集合称为总体从总体中抽取的一部分的元素的集合称为样本用来描述总体特征的的概括性数字度量称为参数用来描述样本特征的概括性数字度量称为统计量说明事物类别的一个名称称为分类变量说明事物有序类别的一个名称称为顺序变量说明事物数字特征的一个名称称为数值型变量只能取可数值的变量称为离散型变量可以在一个或多个区间中取任何值的变量称为连续型变量第二章:数据收集从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结

2、果来推断总体特征的数据收集方法,称为抽样调查。为特定目的而专门组织的全面调查称为普查按照国家有关法律规定,自上而下地统一布置,自下而上地逐级提供基本数据的调查方式称为统计报表第三章:数据的图表展示落在某一特定类别或组中的数据个数,称为频数把各个类别及其落在其中的相应频数全部列出,并用表格形式表示出来,称为频数分布一个样本或总体中各个部分的数据与全部数据之比,称为比例将比例乘以100得到的数值,称为百分比或百分数,用%表示样本或总体中各不同类别数值之间的比值,称为比率分类数据的图示:条形图,pareto图,对比条形图,饼图将各有序类别或组的频数逐级累加起来得到的频数称为累计频数将各有序类别或组的

3、百分比逐级累加起来称为累计频率顺序数据的图示:累计频数分布图,环形图根据统计研究的需要,将原始数据按照某种标准划分成不同的组别称为数据分组分组后的数据称为分组数据把变量值作为一组称为单变量值分组将全部变量值一次划分为若干个区间,并将这一区间的变量值作为一组,称为组距分组在组距分组中,一个组的最小值称为下限,最大值称为上限一个组的上限与下限的差称为组距各组组距相等的组距分组称为等距分组各组组距不相等的组距分组称为不等距分组每一组的下限和上限之间的重点值称为组中值用矩形的宽度和高度即面积来表示频数分布的图形称为直方图由茎和叶两部分组成的,反应原始数据分布的图形称为茎叶图由一组数据的最大值、最小值、

4、中位数和两个四分位数5个特征值绘制而成的,反应原一组数据向其中心值靠拢的倾向和程度称为集中趋势测度集中趋势就是寻找数据水平的代表值或中心值不同类型的数据用不同的集中趋势测度值低层次数据的测度值适用于高层次的测量数据,但高层次数据的测度值并不适用于低层次的测量数据层次由低到高:分类-顺序-数值型一组数据中出现频数最多的变量值,称为众数一组数据排序后处于中间位置上的变量值称为中位数一组数据排序后处于中间位置上的变量值,称为中位数一组数据排序后处于25%和75%位置上的值称为四分位数一组数据相加后除以数据的个数而得到的结果,称为平均数N个变量值乘积的n次平方根,称为几何平均数数据分布的另一个重要特征

5、离中趋势反映各变量值远离其中心值的程度(离散程度)从另一个侧面说明了集中趋势测度值的代表程度不同类型的数据有不同的离散程度测度值非众数组的频数占总频数的比率,称为异众比率上四分位数与下四分位数之差,称为四分位差,也称为内距或四分间距一组数据的最大值与最小值只差称为极差,用R表示各变量值与其平均数离差绝对值的平均数,称为平均差,叶也称为平均绝对离差各变量值与其平均数离差平方的平均数称为方差方差的平方根称为标准差变量值与其平均数的离差除以标准差后的值,称为标准分数,也成为标准化值或z分数对于任意分布形态的数据,根据切比雪夫不等式,至少有1-1/k2的数据落在平均数加减k个标准差之内。其中k是大于1

6、的任意值,但不一定是整数一组数据的标准差与其相应的平均数之比,称为离散系数数据分布的不对称性称为偏态对数据分布不对称性的度量值,称为偏态系数数据分布的平峰或尖峰程度,称为峰态对数据分布峰态的度量值称为峰态系数,记做K29.29.第五章:概率与概率分布对一个或多个试验对象进行一次观察或测量的过程,称为一次试验试验的结果称为事件不能被分解为其他事件组合的基本事件,称为简单事件随机事件(randomevent):每次试验可能出现也可能不出现的事件必然事件(certainevent):每次试验一定出现的事件,用表示不可能事件(impossibleevent):每次试验一定不出现的事件,用表示一项试验所

7、有可能结果的集合称为样本空间事件A的概率是对事件A在试验中出现的可能性大小的一种度量,介于0和1之间的一个值在试验中,两个事件有一个发生时另一个就不能发生,称这两个事件为互斥事件非负性:对任意事件A,有0P(A)1规范性:必然事件的概率为1;不可能事件的概率为0。即P()二1;P()二0可加性:若A与B互斥,则P(AUB)二P(A)+P(B),推广到多个两两互斥事件A1,A2,,An,有P(A1UA2UUAn)二P(A1)+P(A2)+P(An)A发生或者B发生的事件,称为A与B的并在事件B已经发生的条件下,求事件A发生的概率,称这种概率为事件B发生条件下事件A发生的条件概率,记为一个事件的发

8、生与否并不影响另一个事件发生的概率,则称两个事件独立某次试验结果的数值型描述,称为随机变量只能取有限个或可数个值的随机变量,称为离散型随机变量可以去一个或多个区间中任何值的随机变量称为连续型随机变量离散型随机变量的概率分布:列出离散型随机变量X的所有可能取值,列出随机变量取这些值的概率,通常表格来表示离散型随机变量的数学期望:在离散型随机变量X的一切可能取值的完备组中,各可能取值xi与其取相对应的概率pi乘积之和,描述离散型随机变量取值的集中程度,计算公式为:E(Xny皱(X取无穷个值)i-i离散型随机变量的方差:随机变量X的每一个取值与期望值的离差平方和的数学期望,记为D(X),描述离散型随

9、机变量取值的分散程度,计算公式为Qg=因笑-卫3若丑是离:矽也随机变量MJWcO=Xk-西wPii=l二项分布:进行n次重复试验,出现“成功”的次数的概率分布称为二项分布,设X为n次重复试验中事件A出现的次数,X取x的概率为pX-x-Cyf任卽2丿)It刚式中充!物一去)!泊松分布:用于描述在一指定时间范围内或在一定的长度、面积、体积之内每一事件出现次数的分布IIPSS-X!(9-0Q2IE)XI给定的时间间隔、长度、面积、体积内“成功”的平均数e二2.71828x给定的时间间隔、长度、面积、体积内“成功”的次数用于描述在一指定时间范围内或在一定的长度、面积、体积之内每一事件出现次数的分布/(

10、劝024.f(x)24.f(x)dx=i用于描述在一指定时间范围内或在一定的长度、面积、体积之内每一事件出现次数的分布xx+x)第六章:抽样与抽样分布”或“”的假设检验,称为单侧检验或单尾检验备择假设的方向为“m0Ho:mm0备择假设Hn:mm0H1:mm0第I类错误(弃真错误)原假设为正确时拒绝原假设,第I类错误的概率记为被称为显著性水平2.第11类错误(取伪错误),原假设为错误时未拒绝原假设,第11类错误的概率记为(Beta)检验统计量:根据样本观测结果计算得到的,并据以对原假设和备择假设作出决策的某个样本统计量抽唇分茹拒绝局置惰水乎拒绝绻an临界值临畀值临界值12.临界值置信水平推P临界值置信水平推P样另,布拒绝Hq1给定显著性水平杳表得出相应的临界值Z耗如嵌毗2将检验统计量的值与a水平的临界值进行比较3.作出决策双侧检验:I统计量IA临界值,拒绝H。左侧检验:统计量临界值,拒绝Hq右侧检验:统计戢临界值,拒绝地14.15.能够拒绝原假设的检验统计量的所有可能取值的集合称为拒绝域16.根据给定的显著性水平确定的拒绝域的边界值,称为临界值17.P值:如果原假设为真,所得到的样本结果会像实际观测结果那么极端或更极端的概率1/2PKy18F临丄值15.能够拒绝原假设的检验统计量的所有可能取值的集合称为拒绝域16

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论