




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、统计学基础(第二版),第一章 统计和统计数据,一、统计学的含义,统计学是收集、处理、分析、解释数据并从数据中得出结论的科学。,第一节 统计及其应用领域,统计提供的数据分析方法可分为描述统计和推断统计两大类。,描述统计:研究数据收集、处理和描述的统计学方法。,推断统计:研究如何利用样本数据来推断总体特征的统计学方法。,二、统计的应用领域,统计方法是适用于所有学科领域的通用数据分析方法,只要有数据的地方就会用到统计方法。,企业发展战略,产品质量管理,市场研究,财务分析,经济预测,人力资源管理,产品质量管理,企业发展战略,产品质量管理,市场研究,企业发展战略,产品质量管理,财务分析,市场研究,企业发
2、展战略,产品质量管理,经济预测,财务分析,市场研究,企业发展战略,产品质量管理,人力资源管理,经济预测,财务分析,市场研究,企业发展战略,产品质量管理,统计的主要作用是帮助我们分析数据。它是一套分析数据的方法和工具,不能指望统计成为解决所有问题的灵丹妙药。,第二节 数据的类型,按照所采用的不同计量尺度,可以将统计数据分为分类数据、顺序数据、数值型数据,一、分类数据、顺序数据、数值型数据,分类数据,只能归于某一类别的非数字型数据,成为分类数据。 例如: 按照性别,人口可分为男性、女性。 按照行业属性,企业可分为医药企业、家电企业、纺织品企业等。 为便于统计处理,对于分类数据可以用数字代码来表示各
3、个类别,如用“1”表示“男性”,“0”表示“女性”。,顺序数据,只能归于某一有序类别的非数字型数据,称为顺序数据。 顺序数据也是对事物进行分类的结果,但这些类别是有顺序的,它是由顺序尺度计量形成的。 例如: 产品可以分为一等品、二等品、三等品、次等品等。 一个人对某一事物的态度可以分为非常同意、同意、保持中立、不同意、非常不同意等。 同样的,“1”可以表示“非常同意”,“2”可以表示“同意”,“3”表示“保持中立”,“4”表示“不同意”,以此类推。,数值型数据,按数字尺度测量的观察值,称为数值型数据。 数值型数据是使用自然或度量衡单位对事物进行测量的结果,其结果表现为具体的数值。,分类数据和顺
4、序数据说明的是事物的品质特征,通常是用文字来表述的,其结果均表现为类别,因而可统称为定性数据或品质数据。 数值型数据说明的是现象的数量特征,通常用数值来表现的,因而可称为定量数据或数量数据。,按照统计数据的收集方法,可以将统计数据分为观测数据和实验数据。,二、观测数据和实验数据,观测数据:通过调查或观测而收集到的数据。 实验数据:在实验中控制实验对象而收集到的数据。,按照所描述的现象与时间的关系,可以将统计数据分为截面数据和时间序列数据。,三、截面数据和时间序列数据,截面数据:在相同或近似相同的时间点上收集的数据。 时间序列数据:在不同时间上收集到的数据。,1.下面的数据中属于顺序数据的是()
5、 A.5个人的年龄分别是25,22,34,41,33 B.性别:男,女 C.上市公司所属的行业:金属,房地产,医药,机械制造 D.员工对企业某项改革措施的态度:赞成,中立,反对 2.一家研究机构从IT从业者中随机抽取500人作为样本进行调查,其中60%的人回答他们的月收入在5000元以上,50%的人回答他们的消费支付方式是用信用卡。这里的“消费支付方式”是() A.分类变量 B.顺序变量 C.数值型变量 D.离散型变量,3.下面的变量中属于顺序变量的是() A.收入 B.汽车产量 C.员工对企业某项改革措施的态度(赞成,中立,反对) D.企业类型 4.一项民意调查的目的是想确定年轻人愿意与其父
6、母讨论的话题。调查结果表明:45%的年轻人愿意与其父母讨论家庭财务状况,38%的年轻人愿意与其父母讨论有关教育的话题,15%的年轻人愿意与其父母讨论爱情问题。该调查所收集的数据是() A.分类数据 B.顺序数据 C.数值型数据 D.试验数据,第三节 数据来源,一、数据的间接来源,来源于别人调查或实验的数据,对使用者来说,这是数据的间接来源,称为二手数据或间接数据。,利用二手数据对使用者来说既经济又方便,但使用时应注意统计数据的含义、计算口径和计算方法,以避免误用或滥用。在引用二手数据时,一定要注明数据的来源,尊重他人劳动成果。,二、数据的直接来源,数据直接来源主要有两个渠道: 一是调查或观察
7、调查是取得社会经济数据的重要手段 二是实验 实验是取得自然科学数据的主要手段。,统计调查方式,常用的统计调查方式有抽样调查、普查、统计报表等。 抽样调查:从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征的数据收集方法,称为抽样调查。 普查:为特定目的而专门组织的全面调查,称为普查。 统计报表:按照国家有关法规的规定,自上而下地统一布置,自下而上地逐级提供基本统计数据的调查方式。,数据的收集方法,数据收集方法可分为询问调查、观察和实验三大类。 询问调查 包括访问调查、邮寄调查、电话调查、电脑辅助调查、座谈会、个别深访。 观察法 实验法 包括室内实验法和市场实验法,三、
8、调查方案设计,调查目的 调查所要达到的具体目标 “为什么调查” 调查对象和调查单位 调查对象:根据调查目的确定的调查研究的总体或调查范围。 调查单位:构成调查对象的每一个单位。 例如:人口普查的调查对象是具有中国国籍并在中国境内常住的人, 人口普查的调查单位是每一个人。 调查项目和调查表 调查项目通常以表格的形式来表现,称为调查表。调查表是用于登记调查数据的一种表格,一般由表头、表体和表外附加三部分。 表头:调查表的名称,用来说明调查的内容。 表体:调查表的主要部分,是调查内容的具体体现 表外附加:通常由填表人签名、填报日期、填表说明等内容组成。,四、数据质量,如何保证统计数据的质量是数据收集
9、阶段要重点解决的问题。 为保证质量,需要在数据收集、整理、分析等阶段尽可能减少误差。 误差主要有抽样误差和非抽样误差两类。 抽样误差:指在用样本数据进行推断时所产生的随机误差。 非抽样误差:指调查过程中由于调查者或被调查者的人为因素而造成的误差。,数据的质量评价标准概括为6个方面 精度 准确性 关联性 及时性 一致性 最低成本,四、数据质量,1.一个退休人员对寄居在家中的一窝燕子很感兴趣,他每天观察并记录燕子飞出飞进的时间,以及它们喂养小燕子的习惯。这种收集数据的方法称为() A.普查 B.观察 C.实验 D.询问 2.如果一个样本因人故意操纵而出现偏差,这种误差属于() A.抽样误差 B.非
10、抽样误差 C.设计误差 D.试验误差 3.为了解居民对小区物业服务的意见和看法,管理人员随机抽取了50户居民,上门通过问卷进行调查。这种数据的收集方法称为() A.访问调查 B.邮寄调查 C.座谈会 D.个别深度访问,4.为了解居民对小区物业服务的意见和看法,管理人员挑选了有代表性的5户居民,把他们召集在一起进行座谈。这种数据的收集方法称为() A.访问调查 B.邮寄调查 C.座谈会 D.个别深度访问 5.某小区两户居民因停车问题经常发生纠纷,居委会的管理人员对其中一户居民的车主进行专门座谈。这种数据的收集方法称为() A.访问调查 B.邮寄调查 C.座谈会 D.个别深度访问,总体 包含所研究
11、的全部个体(数据)的集合,一、总体与样本,个体 组成总体的每一个元素,第四节 统计中的几个基本概念,样本 从总体中抽取的一部分元素的集合,样本量 构成样本的元素数目(或称为样本容量),从总体中抽取一部分元素作为样本,目的是要根据样本提供的有关信息去推断总体的特征。 例如:从一批灯泡中随机抽取100个,这100个灯泡就构成了一个样本,然后根据这100个灯泡的平均使用寿命去推断这批灯泡的平均使用寿命。,总体根据其所包含的单位数目是否可数可以 分为有限总体和无限总体。 对于无限总体,每次抽取一个单位,并不影响下一次的抽样结果,因此每次抽取可以看作独立的。 对于有限总体,在抽取一个单位后,总体元素就会
12、减少一个,前一次的抽样结果往往会影响第二次的抽样结果,因此每次抽取是不独立的。,1.某研究部门准备在全市200万个家庭中抽取2000个家庭,推断该城市所有职工家庭的年人均收入。这项研究的总体是() A.2000个家庭 B.200万个家庭 C.2000个家庭的人均收入 D.200万个家庭的人均收入 2.某研究部门准备在全市200万个家庭中抽取2000个家庭,推断该城市所有职工家庭的年人均收入。这项研究的样本是() A.2000个家庭 B.200万个家庭 C.2000个家庭的人均收入 D.200万个家庭的人均收入,二、参数和统计量,参数 即用来描述总体特征的概括性数字度量。 总体平均数、总体标准差
13、、总体比例,统计量 即用来描述样本特征的概括性数字度量。 样本平均数、样本标准差、样本比例,变量 说明现象某种特征的概念 变量的特点就是从一次观察到下一次观察会呈现出差别或变化。 如“商品销售额”“受教育程度” “产品的质量等级”等都是变量。,三、变量,分类变量,说明事物类别的一个名称 分类变量的数值取值就是分类数据 如“性别”是个分类变量,其变量值为“男”或“女”;“行业”也是一个分类变量,其变量值可以为“零售业”“旅游业”“汽车制造业”等。,顺序变量,说明事物有序类别的一个名称 顺序变量的数值取值就是顺序数据 如 “产品等级”是个顺序变量,其变量值为“一等品”、“二等品”、“三等品”、“次
14、品”等; “受教育程度”也是一个顺序变量,其变量值可以为“小学”“初中”“高中”等; 一个人对某种事物的看法也是一个顺序变量,其变量值可以为“同意”、“保持中立”、“反对”等。,数值型变量,说明事物数字特征的一个名称 数值型变量的取值就是数值型数据 如“产品产量”、“商品销售额”、“零件尺寸”、“年龄”、“时间”等都是数值型变量。,数值型变量,根据其取值不同,可分为离散型变量和连续型变量。 离散型变量:只能取可数值的变量 (只能取有限个值,且取值都以整位数断开) 连续型变量:可以在一个或多个区间中取任何值的变量 (取值是连续不断的,如“年龄”“温度”),1.一项调查表明,在所抽取的1000个消
15、费者中,他们每月在网上购物的平均花费是200元,他们选择在网上购物的主要原因是“价格便宜”。这里的参数是() A.1000个消费者 B.所有在网上购物的消费者 C.所有在网上购物的消费者的平均花费金额 D.1000个消费者的平均花费金额 2.一项调查表明,在所抽取的1000个消费者中,他们每月在网上购物的平均花费是200元,他们选择在网上购物的主要原因是“价格便宜”。这里的统计量是() A.1000个消费者 B.所有在网上购物的消费者 C.所有在网上购物的消费者的平均花费金额 D.1000个消费者的平均花费金额,3.为了估计全国高中学生的平均身高,从20个城市选取了100所中学进行调查。在该项研究中,研究者感兴趣的参数是() A.100所中学 B.20个城市 C.全国的高中学生的平均身高 D.100所中学的高中学生的平均身高 4.为了估计全国高中学生的平均身高,从20个城市选取了100所中学进行调查。在该项研究中,研究者感兴趣的统计量是() A.100所中学 B.20个城市 C.全国的高中学生的平均身高 D.100所中学的高中学生的平均身高,5.最近发表
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 会展管理办法修订
- 体检收费管理办法
- 信息资料管理办法
- A级景区管理办法
- 从事口岸管理办法
- 事项进驻管理办法
- 前台接待管理办法
- 人事人才管理办法
- 个体医生管理办法
- 专家管理办法规定
- 片剂2片剂常用辅料
- 新建三座钢结构人行天桥监理规划
- 新版城市居住区规划设计规范
- 供应商往来对账确认函(财务文书模板)
- GB/T 778.1-2018饮用冷水水表和热水水表第1部分:计量要求和技术要求
- GB/T 6725-2017冷弯型钢通用技术要求
- 2022年泰安市文化和旅游系统事业单位招聘笔试试题及答案
- ISO9001新产品研发控制程序
- 防台风、暴雨应急预案
- 提高口服药准确服用率品管圈ppt课件
- 市政工程类建筑施工项目危险源辨识及风险管控清单
评论
0/150
提交评论