版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、统计学知识点第一章 绪论1、今天,“统计”一词有三种含义:1. 统计工作:搜集、整理和分析统计数据的活动。2. 统计数据:统计工作的成果。3. 统计学:指导统计工作的理论。如数理统计学,社会统计学,经济统计学,应用统计学等。统计三个含义的关系十分密切:统计工作与统计数据是过程与成 果的关系;统计工作与统计学是实践与理论的关系。2、第一部统计学著作是英国人威廉配第 (16231687)的政治算 术(1690)一书。3、统计学是一门搜集、整理、显示和分析统计数据的科学,其目的 是探索数据内在的数量规律性。4、统计工作全过程一般可以划分为四个环节:统计设计、统计调查、统计整理、统计分析5统计的基本方
2、法大量观察法、 综合分析法(整理、分析) 、 归纳推断法(分析)6、统计学与其他学科的关系(一)统计学与数学的关系区别:首先,数学研究抽象的数,统计学则研究具体事物的数量; 其次,数学使用纯粹的演绎方法,而统计学则使用演绎与归纳相 结合的逻辑方法。(二)统计学与其他学科的关系 凡涉及处理实质性数据的学科都要以统计方法为工具。 可以说, 统 计学是其他学科的工具。第二章 调查与整理1、目前,数据的计量尺度由粗略 (低级)到精确 (高级)分为四个层次, 即列名尺度、顺序尺度、定距尺度和定比尺度。1列名尺度:按照事物的某种属性对其进行平行的分类。例如, 人按性别分为男、女, , 。该尺度的数据不能比
3、较大小、优 劣。2顺序尺度:对事物之间等级差或顺序差别的一种测度。例如, 考试成绩可分为优、 良、中、, 。 该尺度的数据能比较优劣, 不能进行数学运算。3定距尺度:对事物之间等级差或顺序差别较精确地定量测度。 如考试成绩的 95 分、 86 分、 , ;天气温度的50C、00C、 50C、, 。该尺度的“ 0”表示一个水平。该尺度的数据能 进行加、减运算。4定比尺度:用来表明数值中存在绝对零点状况下数量特征的描 述尺度。例如,企业利润、产品数量等。 该尺度的“0”表示“没 有”或“不存在”。该尺度的数据能进行加、减、乘、除运算。2、数据的类型1定性数据。也称品质数据,由列名尺度或顺序尺度计量
4、形成, 说明事物品质特征,通常用文字描述。2定量数据。也称数量数据,由定距尺度或定比尺度计量形成, 说明现象的数量特征,用数值表示。3、统计指标构成要素:指标名称;计量单位;计算方法;空间限制;时间限制;指标数值。4、统计指标的特点:数量性。综合性。具体性。5、标志按其表现形式不同分为数量标志和品质标志; 标志按其在总体内是否有变异分为不变标志和可变标志。6、标志与指标的区别:标志是说明单位的,指标是说明总体的。标志有不用数值表示的品质标志,而指标都是用数值表示的。7、统计指标按表现形式可分为绝对指标、相对指标和平均指标。8、总量指标按其反映的内容不同,分为总体单位总量和总体标志总量,简称为单
5、位总量(N)和标志总量(艺Xi)。9、总量指标按其计量单位不同,分为实物量指标、劳动量指标和价 值量指标。10、统计调查方式。普查、抽样调查、统计报表、重点调查和典型调 查。11、调查方案设计。调查目的:调查对象和调查单位;调查项目和调查表;调查方法;调查时间;调查组织与实施。12、分组原则:“相斥”原则;“穷尽”原则。13、分组作用:划分现象的类型;反映总体的结构;表明现象之间的依存关系。14、 确定实际组限的原则有两个:一是“同组同质原则”;二是“上组限不在内原则” 15、确定组距的原则有4个:质别原则(不同质数据分在不同组内);特征原则(准确显示同质数据的分布特征);便利原则(为后续 工
6、作提供方便);大量原则(所分的每一组都是一个小总体,因 而每组应有若干个数据 )。综合考虑这 4 个原则,确定组距为 5 件。每组起点数值的个位定为 0 或 5。第三章 数据分布特征的描述1、极差也称全距,是一组数据的最大值与最小值之差。极差计算简 单,易于理解。实践中,常用于工业产品质量的检查和控制。2统计表的形式。统计表由标题、横行、纵栏和统计数字四部分组 成。3统计表的种类。统计表按主词的分组情况可分为三种:简单表:主词不分组的统计表。分组表:主词进行简单分组的统计表。复合表:主词进行复合分组的统计表。例如第四章 概率与概率分布1. 古典定义:某一事件A发生的概率,是该事件所包含的基本事
7、件数m与基本空间中基本事件总数 n的比值。(客观存在)2. 统计定义:在相同条件下重复进行 n次试验,事件A发生m次, 随着试验次数 n 的增大,事件 A 发生的频率 m/n 围绕某一常数 p 上下波动的幅度愈来愈小,且逐步趋于稳定,则称p为事件A的概 率。 (多次试验 )3. 主观定义:人们根据经验和所掌握的有关信息,对事件发生的可能性大小给出的估计值。 (调查研究 )4、随机变量的概念。描述随机现象某一侧面的变量。5、随机变量的特点。取值的随机性;取值的规律性。6、大数定律是阐述大量随机变量的平均结果具有稳定性的一系列定 律的总称。本节只介绍两个最常用的大数定律。1. 独立同分布大数定律
8、该定律表明,当n足够大时,独立同分 布的一系列随机变量的均值接近 (依概率收敛于 )数学期望,即平 均数具有稳定性。2贝努力大数定律 该定律表明,当n足够大时,事件A发生的 频率接近于事件 A 发生的概率,即频率具有稳定性。第五章 抽样与抽样估计1 全集总体。也叫母体,简称为总体,是指所要认识对象全部单位 的集合体,它是由具有某种共同性质的许多单位组成的。2 抽样框:包括全部抽样单位的名单框架。抽样框的形式:名单抽样框:可供抽取的所有总体单位的名录 一览表,如企业名单等;区域抽样框:按地理位置将总体范围 戈U分为若干小区域,以小区域为抽样单位;时间表抽样框:把 总体的时间过程分为若干个小的时间
9、单位作为抽样单位,如对流 水线上 24 小时内生产的产品进行质量抽查时,以 10 分钟为一个 抽样单位。3、总体与抽样框的关系:一致型 包容型4、抽样调查误差包括登记性误差和代表性误差(随机误差、系统误差)5、影响抽样误差的因素1总体变异度。抽样误差与总体标准差()成正比。2样本容量。抽样误差与样本容量(n)的算术平方根成反比。3. 抽样方法。不重复抽样比重复抽样所产生的误差小。4. 抽样组织。一般说来,常用抽样组织形式的抽样误差由小到大的顺序是:类型 (分层)抽样、机械 (等距)抽样、纯随机 (简单随机 ) 抽样、整群抽样。6、抽样平均误差是指所有可能样本估计值与所要估计参数离差的平 均数。
10、7、点估计(一)估计方法也称定值估计, 即以样本指标值作为总体指标的估计 值.(二)估计量优良的标准1无偏性: 指一个优良的估计量, 其数学期望应等于被估计总体 参数的真值。2有效性:指作为优良的估计量,其方差应比较小。这样才能保 证估计量的取值能集中在被估计的总体参数附近。.一致性:指随着样本容量 n 的增大,一个好的估计量将在概 率意义下愈来愈接近于所要估计的总体参数真值。8、区间估计:就是根据样本估计量以一定可靠程度推断总体参数所 在的区间范围。9、区间估计的依据:样本信息;置信度。10、抽样设计的原则:1)保证实现抽样的随机性原则。2)保证实现最大的抽样效果原则。第六章假设检验1、假设
11、检验的特点1.采用反证法。先假设 H0是正确的,然后根据抽样理论和样本 信息,观察由此假设而导致的结果是否合理,从而判断是否接受 原假设。2依据“小概率事件在一次试验中不能发生”的原理 即一次抽样 调查的结果不是小概率事件。2、基本抽样组织:抽样组织抽样单位样本代表性产生误差原因抽样误差必要抽样数目估计置信度应用分层抽样总体单位最好层内方差最小最少最高单位差异大等距抽样总体单位较好总体方差较小较少较咼单位可排序纯随机总体单位一般总体方差一般一般一般均匀总体整群抽样单位群体较差群间方差较大较多较低总体可分群3、假设检验的程序。提出原假;选择检验统计量 ;规定显著性水平a,确定决策临界值;计算检验
12、统计值,作出决策第七章 相关与回归分析1、相关关系。当一个或几个相互联系的变量取一定的数值时,与之相对应的另一变量的值虽然不确定,但它仍按某种规律在一定的 范围内变化。变量间的这种相互关系,称为具有不确定性的相关 关系。2、可决系数与相关系数1相关系数与可决系数的联系相关系数(r)的平方等于回归模型的可决系数(r2)。2相关系数与可决系数的区别说明的内容不同: 相关系数说明变量之间线性关系的紧密程度;可决系数说明回归模型的拟合程度。取值范围不同:一1 r 1; 0 r2 1a 因变量的基础水平;b 自变量增加一个单位时,因变量平均变动的数值 .3、经检验 ,自变量对因变量影响显著时 ,就可用于
13、预测。当 xf 值在样本之内时,称为内插预测或事后预测;当 xf 值在样本之外时,称为外推预测或事前预测。4、预测误差的来源。模型本身的误差;回归系数估计值的误差;自变量取值偏离样本所造成的误差;未来时期总体回归系数发生变化所造成的误差。第八章 时间数列分析1、时间数列由两个基本要素构成:一是资料所属的时间(时序);另一个是各时间上的统计指标数值(数列)。2、分析时间数列的目的:一是研究事物的发展状况;二是分析现象 的发展趋势;三是揭示事物的演变规律;四是为了预测事物在未 来时间上的数量。3、时间数列按其指标表现形式不同分为绝对数、相对数和平均 数三种。4、间隔:时点数列中两数值的时点间距。5、相对数和平均数的共同特点是:它们都由绝对数时间数列派 生而得;它们的指标数值具有不可加性。6、编制时间数列的原则:基本原则:保证数列中各数值的可比性。7、平均发展水平和静态平均数的区别:平均数序时平均数静态平均数分析对象总体自身总体单位数值类型指标值标志值计算依据动态数列变量数列作用说明总体的动态水平。说明单位的一般水平。8平均发展水平的计算:1. 累计增长量与逐期增长量的关系:连续的逐期增减量之和等于 累计增减量。2. 定基发
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- XX区实验初级中学2026年春季学期初二班主任后进生转化帮扶方案
- 单招一类简章题目及答案
- 刘强东回应考勤制度
- 为何用考勤制度
- 乡镇卫生院请考勤制度
- 河北省保定市竞秀区2025-2026学年高三(上)期末物理试卷(含答案)
- 安徽省蚌埠市龙子湖区2025-2026学年八年级上学期期末地理试题(无答案)
- 少先队员考勤制度
- 山东事业单位考勤制度
- 工作人员学法考勤制度
- 服装导购员合同
- 车站超市经营方案
- 放弃继承权声明书(模板)
- (完整)博士生求职简历模版
- 人生规划全面指导PPT模板
- 室内装饰施工进度横道图
- 停用加气站处置方案
- 小学英语科普版单词表三至六年级词汇表-合并方便打印版-(带音标按单元顺序)(三年级至六年级全8册)1850
- DB1410-T 110-2020 地震宏观观测网建设和管理要求
- 园艺植物种子加工、贮藏与运输-园艺植物种子贮藏与运输(园艺植物种子生产)
- 《创新创业基础》教案
评论
0/150
提交评论