



下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
应用统计学考点:绪论(重点:统计数据的分类,参数、统计量的定义)一、统计数据的分类
1.(按计量尺度分)(1)分类数据:对事物进行分类的结果;数据表现为类别,用文字来表述;例如,人口按性别分为男、女两类。(2)顺序数据:对事物类别顺序的测度;数据表现为类别,用文字来表述;例如,产品分为一等品、二等品、三等品、次品等(3)数值型数据:对事物的精确测度;结果表现为具体的数值;例如:身高为175cm、168cm、183cm2.(按收集方法分)(1)观测的数据:通过调查或观测而收集到的数据;在没有对事物人为控制的条件下而得到的;有关社会经济现象的统计数据几乎都是观测数据(2)试验的数据:在试验中控制试验对象而收集到的数据;比如,对一种新药疗效的试验,对一种新的农作物品种的试验等;自然科学领域的数据大多数都为试验数据3.(按时间状况分)(1)截面数据:在相同或近似相同的时间点上收集的数据;描述现象在某一时刻的变化情况;比如,2002年我国各地区的国内生产总值数据(2)时间序列数据:在不同时间上收集到的数据;描述现象随时间变化的情况;比如,1996年至2002年国内生产总值数据二、参数和统计量1.参数:研究者想要了解的总体的某种特征值。所关心的参数主要有总体均值()、标准差()、总体比例()等。总体参数通常用希腊字母表示。2.统计量:根据样本数据计算出来的一个量。所关心的样本统计量有样本均值(x)、样本标准差(s)、样本比例(p)等。样本统计量通常用小写英文字母来表示三、变量:说明现象某种特征的概念。如商品销售额、受教育程度、产品的质量等级等。变量的具体表现称为变量值,即数据变量可以分为:1.分类变量:说明事物类别的一个名称;2.顺序变量:说明事物有序类别的一个名称;3.数值型变量:说明事物数字特征的一个名称(离散变量:取有限个值;连续变量:可以取无穷多个值)统计数据的搜集(重点:五方法的区别、定义)统计调查的五中方式:1.抽样调查:从总体中随机抽取一部分单位(样本)进行调查;目的是推断总体的未知数字特征;最常用的调查方式;具有经济性、时效性强、适应面广、准确性高等特点普查:为特定目的专门组织的非经常性全面调查。通常是一次性或周期性的。一般需要规定统一的标准调查时间;数据的规范化程度较高;应用范围比较狭窄
3.统计表报:统计调查方式之一。过去曾经是我国主要的数据收集方式。按照国家有关法规的规定,自上而下地统一布置、自下而上地逐级提供基本统计数据。有各种各样的类型。重点调查:从调查对象的全部单位中选择少数重点单位进行调查。调查结果不能用于推断总体典型调查:从调查对象的全部单位中选择少数典型单位进行调查。目的是描述和揭示事物的本质特征和规律。调查结果不能用于推断总体统计数据的整理(重点:不同数据类型的展示方法。记住下图即可)数据类型及图示:一、分类数据的图示:条形图(主要用于反映分类数据的频数分布)饼图(主要用于表示总体或样本中各组成部分所占的比例,对于研究结构性问题十分有用)二、顺序数据的整理及图示:顺序数据整理:(可计算的指标)累积频数:各类别频数的逐级累加累积频率:各类别频率(百分比)的逐级累加顺序数据的图示:累计频数分布图环形图:环形图中间有一个“空洞”,总体中的每一部分数据用环中的一段表示。环形图与圆形图类似,但又有区别:圆形图只能显示一个总体各部分所占的比例;环形图则可以同时绘制多个总体的数据系列,每一个总体的数据系列为一个环。
环形图可用于结构比较研究。环形图主要用于展示分类和顺序数据。三、数值型数据的整理与显示1.分组数据—直方图和折线图直方图:用矩形的宽度和高度来表示频数分布的图形,实际上是用矩形的面积来表示各组的频数分布在直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数就形成了一个矩形,即直方图直方图下的总面积等于1直方图与条形图的区别:条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)则是固定的直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或百分比,宽度则表示各组的组距,其高度与宽度均有意义直方图的各矩形通常是连续排列,条形图则是分开排列条形图主要用于展示分类数据,直方图则主要用于展示数值型数据2.分组数据—折线图
折线图也称频数多边形图是在直方图的基础上,把直方图顶部的中点(组中值)用直线连接起来,再把原来的直方图抹掉折线图的两个终点要与横轴相交,具体的做法是第一个矩形的顶部中点通过竖边中点(即该组频数一半的位置)连接到横轴,最后一个矩形顶部中点与其竖边中点连接到横轴折线图下所围成的面积与直方图的面积相等,二者所表示的频数分布是一致的未分组数据—茎叶图和箱线图茎叶图:用于显示未分组的原始数据的分布。由“茎”和“叶”两部分构成,其图形是由数字组成的。以该组数据的高位数值作树茎,低位数字作树叶。树叶上只保留一位数字。对于n(20=<n<=300)个数据,茎叶图最大行数不超过L=[10×lg(n)]茎叶图类似于横置的直方图,但又有区别:直方图可观察一组数据的分布状况,但没有给出具体的数值;茎叶图既能给出数据的分布状况,又能给出每一个原始数值,保留了原始数据的信息未分组数据—箱线图:箱线图:用于显示未分组的原始数据的分布。箱线图由一组数据的5个特征值绘制而成,它由一个箱子和两条线段组成。其绘制方法是:首先找出一组数据的5个特征值,即最大值、最小值、中位数Me和两个四分位数(下四分位数QL和上四分位数QU)连接两个四分(位)数画出箱子,再将两个极值点与箱子相连接5.时间序列数据—线图绘制线图时应注意以下几点时间一般绘在横轴,指标数据绘在纵轴图形的长宽比例要适当,其长宽比例大致为10:7一般情况下,纵轴数据下端应从“0”开始,以便于比较。数据与“0”之间的间距过大时,可以采取折断的符号将纵轴折断6.多变量数据—雷达图显示多个变量的图示方法在显示或对比各变量的数值总和时十分有用假定各变量的取值具有相同的正负号,总的绝对值与图形所围成的区域成正比可用于研究多个样本之间的相似程度统计数据的描述(重点:均值的计算,各个数值的计算特点)数据分布特征的测度数据特征的测度数据特征的测度分布的形状集中趋势离散程度众数中位数均值离散系数方差和标准差峰态四分位差异众比率偏态(一)集中趋势(位置):一组数据向其中心值靠拢的倾向和程度。测度集中趋势就是寻找数据水平的代表值或中心值。不同类型的数据用不同的集中趋势测度值。低层次数据的测度值适用于高层次的测量数据,但高层次数据的测度值并不适用于低层次的测量数据(二)离中趋势(分散程度)偏态和峰态(形状)(一)分类数据:(众数:出现次数最多的变量值。不受极端值的影响。一组数据可能没有众数或有几个众数。主要用于分类数据,也可用于顺序数据和数值型数据)顺序数据:中位数和分位数(中位数:排序后处于中间位置上的值。不受极端值的影响。主要用于顺序数据,也可用数值型数据,但不能用于分类数据。各变量值与中位数的离差绝对值之和最小。中位数位置的确定:原始数据:(n+1)/2顺序数据:n/2)(四分位数:排序后处于25%QL和75%QU位置上的值。不受极端值的影响。主要用于顺序数据,也可用于数值型数据,但不能用于分类数据)四分位数位置的确定:原始数据:QL(n+1)/4QU3(n+1)/4顺序数据:QLn/4QU3/4数值型数据:均值:集中趋势的最常用测度值。一组数据的均衡点所在。体现了数据的必然性特征。易受极端值的影响。用于数值型数据,不能用于分类数据和顺序数据。简单均值&加权均值均值的数学性质:1.各变量值与均值的离差之和等于零;2各变量值与均值的离差平方和最小调和平均数:均值的另一种表现形式。易受极端值的影响。计算公式为几何平均数:n个变量值乘积的n次方根。适
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 大数据挖掘与可视化-全面剖析
- 集成电路可靠性研究-全面剖析
- 部分冠与对话系统整合-全面剖析
- 美容师三四月份工作计划(3篇)
- 2024年上海大学附属嘉定实验学校教师招聘考试真题
- 2024年湖南株洲消防救援支队技术服务队招聘考试真题
- 酒店服务标准化与个性化平衡-全面剖析
- 桂花苗国际贸易法规比较分析-全面剖析
- 基于机器学习的病理图像识别-全面剖析
- 跨境铁路运输合作模式探究-全面剖析
- 卫星导航定位技术与应用知到智慧树章节测试课后答案2024年秋南京工业大学
- 开封市第二届职业技能大赛无人机装调检修项目技术文件(国赛项目)
- 开题报告:高等职业院校双师型教师评价指标体系构建研究
- 医疗救助政策
- 浙江省宁波市余姚市2024年中考英语模拟试题(含答案)
- 服务质量保障措施方案
- 机场能源管理
- 高速公路路基及土石方工程施工方案与技术措施
- 技能人才评价新职业考评员培训在线考试(四川省)
- AQ 1083-2011 煤矿建设安全规范 (正式版)
- 河南省开封市铁路中学2023-2024学年八年级下学期6月期末历史试题
评论
0/150
提交评论