应用统计学绪论-应用统计学-课件-整理版本.ppt_第1页
应用统计学绪论-应用统计学-课件-整理版本.ppt_第2页
应用统计学绪论-应用统计学-课件-整理版本.ppt_第3页
应用统计学绪论-应用统计学-课件-整理版本.ppt_第4页
应用统计学绪论-应用统计学-课件-整理版本.ppt_第5页
已阅读5页,还剩89页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第1章导论 第1章导论 1 1什么是统计学 1 2统计数据的类型 1 3统计中的几个基本概念 1 4几种常用的统计软件 学习目标 1 理解统计学的含义2 理解统计数据与统计学的关系3 了解统计学的应用领域4 了解数据的类型5 理解统计中的几个基本概念 1 1什么是统计学 统计学与统计规律统计的应用领域历史上著名的统计学家 你想过下面的问题吗 为什么近期人们非常关注CPI 这一指数反映的是什么问题 CPI过高会产生什么问题 什么是GDDS 什么是SDDS 中国入世后为什么要加入GDDS 你想过下面的问题吗 当你买了一台电视时 被告知三年内可以免费保修 那么 厂家凭什么这样说 说多了 厂家会损失 说少了 会失去竞争力 也是损失 到底这个保修期是怎样决定的呢 在同一年级中 同样统计学的课程可能由一些不同教师讲授 教师讲课方式当然不一样 考试题目也不一定相同 那么如何比较不同班级的统计学成绩呢 你想过下面的问题吗 大学排名是一个非常敏感的问题 不同的机构得出不同的结果 各自都说自己是客观 公正和有道理的 到底如何理解这些不同的结果呢 任何公司都有一个信用问题 如果这些公司试图得到贷款时并没有不还贷的不良记录 如何根据它们的财务和商业资料来判断一个公司的信用等级呢 你想过下面的问题吗 如何通过问卷调查来得到性别 年龄 职业 收入等各种因素与公众对某项事物 比如商品或政策 的态度的关系呢 如何才能够客观地得到某个电视节目的收视率 以确定插播的广告价格是否合理呢 什么是统计学 吴喜之认为 统计学 statistics 是用以收集数据 分析数据和由数据得出结论的一组概念 原则和方法 摘自吴喜之编著 统计学 从数据到结论 P2 什么是统计学 1 数据搜集 取得数据2 数据分析 分析数据3 数据表述 图表展示数据数据解释 结果的说明 贾俊平等认为 收集 分析 表述和解释数据的科学 摘自贾俊平等主编 统计学 第二版 P1 什么是统计学 黄良文认为 统计学是关于数据搜集 整理 归纳 分析的方法论科学 摘自黄良文主编 统计学原理 P1 WhatisMeantbyStatistics Statisticsisthescienceofcollecting organizing presenting analyzing andinterpretingnumericaldatatoassistinmakingmoreeffectivedecisions CitedbyDouglasA Lind WilliamG Marchal RobertD Mason StatisticalTechniquesinBusinessandEconomics11thEdition 影印版 statistics的定义 不列颠百科全书 statistics thescienceofcollecting analyzing presenting andinterpretingdata Copyright1994 2000EncyclopaediaBritannica Inc 不列颠百科全书 统计研究的对象 统计研究的对象是大量现象总体的数量方面 统计学的研究对象是现象总体的数量特征和数量关系 通过这些数量方面反映社会经济现象的规律性 数量方面的表现形式 1 静态统计数据 2 动态统计数据 3 相关统计数据 统计研究的特点 一 数量性统计的研究对象是现象的数量方面 例如社会经济现象的规模 水平 现象间的数量关系 以及决定现象质量的数量界限 统计研究对象的数量性 是统计区别于其他社会经济调查研究活动的根本特点 统计研究的特点 二 总体性统计研究对象不是个体现象的数量方面 而是由许多个体现象构成的总体的数量方面 统计研究对象的总体性的特点是由社会经济现象的特点和统计研究的目的决定的 统计研究的特点 三 具体性统计所研究对象的数量是具体的数量 不是抽象的数量 这是统计和数学的重要区别 如果抽掉具体的内容 不是在一定时间 地点和条件下进行研究 那就不能说明任何问题 也就不成其为统计 其数据也就不是统计数据 统计研究的特点 四 变异性统计研究的对象总是处在变化之中的 这种变化不仅表现在数量上 同时也会表现在品质上 因此统计研究的对象不仅是在一定的特定阶段是静态的 同时更多地表现为动态的 这也增加了统计研究的难度 统计研究的过程 实际问题 随机性和规律性 随机性和规律性 关系密切的孪生子 人的寿命是很难预先确定的 一个吸烟 喝酒 不锻炼 而且喜好油荤食物的人可能比一个很少得病 生活习惯良好的人活得长 因此 可以说 活得长短有一定的随机性 randomness 这种随机性可能和人的经历 基因 习惯等无数不易说清的因素都有关系 随机性和规律性 随机性和规律性 但是从总体来说 我国公民的预期寿命却是非常稳定的 而且由于生活水平的提高在逐步增长 比如1996年的平均预期寿命为70 80岁 2000年为71 40岁 2005年为72 1岁 这就是规律性 一个人可能活过这个平均年龄 也可能活不到这个年龄 这是随机的 但是总体来说 预期寿命的稳定性 却说明了随机之中有规律性 这种规律就是统计规律 世界人口的平均预期寿命 从与世界人口平均预期寿命的比较看 根据联合国统计委员会的资料 2000年世界人口的平均预期寿命为66岁 发达国家和地区为76岁 发展中国家和地区为64岁 其中日本81岁 中国香港80岁 瑞士79岁 澳大利亚79岁 加拿大79岁 美国78岁 德国78岁 泰国71岁 我国人口的平均预期寿命比世界平均水平高5岁 比发展中国家和地区高7岁 但同发达国家和地区比较还有差距 约低5岁 平均预期寿命 平均预期寿命 通常表示为一个人口群体从出生起平均存活的年龄 岁 平均预期寿命是反映人类健康水平 死亡水平的综合指标 其高低主要受社会经济条件和医疗水平等因素的制约 不同社会 不同时期有很大差别 通过对看起来随机的现象进行统计分析 我们开始认识这个世界 统计思想的基础知识能够帮助把随机性归纳于可能的规律性中 统计思想从我们如何观察事物和事物本身如何真正发生两方面 帮助我们理解随机性和规律性的重要性 因此 统计可以看做是一项对随机性中的规律性的研究 随机性和规律性 随机性和规律性 然而甚至规律也表现出某种随机性 如果你再掷100次硬币 正面朝上的次数几乎不会和前100次完全一样 在第一个100次中 也许有48次硬币的正面朝上 然而在第二个100次中 也许就有53次正面朝上 这表明了统计的一个重要的本质特征 不管我们是否再进行一次或一组新的观察 大部分时候我们并不能够得到和上次观察一模一样的结果 这种偏差不仅仅发生于掷硬币时 而且发生于调查 实验和其它任何一种方式的数据收集中 如果在某次调查中 人们被问到他们如何看待当今的某一重要问题 某一比例的人会有某一特定的观点 如果对不同的人再做同样的调查 则有不同于上述比例的人支持这一观点 这两个比例之间的差异主要是由于数据本身的随机性引起的 在这种意义下来说 统计就成了对数据中的偏差问题的研究 随机性和规律性 根据作为统计基础的数学理论 我们可以确定一项调查中的某一比例有多大的随机性 以及在下一次的重复调查中 这个比例可能有多大的偏差 我们甚至可以指出 这两个比例之间的差异 是否大到了随机性本身所不能解释的地步 我们将在以后章节中引申和详细讨论这些思想 随机性和规律性 随机性和规律性 在规律性中 变化趋势时有出现 比如 随着逐渐增加的汽车安全带的使用和保险气囊的安装 发生车祸的比例正在下降 统计把单独的 随机的事件置于规律性中 并揭示其变化趋势 如果在不同时期 交通事故发生次数的 两种规律性的 差异超出了随机性本身可以解释的地步 那么变化趋势就发生了 让我们回顾一下20世纪50年代小儿麻痹症疫苗的投入使用 小儿麻痹症是一种可怕的疾病 通常能使患者 大部分是儿童 瘫痪或死亡 在这种病经过多年流行之后 一种疫苗最终被研制出来 科学家们希望该疫苗能够预防这种可怕的疾病 但是没有人清楚这种疫苗是否真能像人们期待的那样起作用 研究随机性和规律性的例子 尽管实验室和动物实验的结果很使人兴奋 然而唯一检验这种疫苗是否起作用的方法还是人体实验 因为小儿麻痹症是一种较罕见的疾病 疫苗必须试用于相当一大批孩子们的身上 所以研究者们决定在20万个孩子身上做实验 此外 研究者们还决定用另外相同数目的孩子作为对照组 对照组的孩子仅仅得到安慰剂 一种看起来像疫苗的替代品 为观察疫苗是否真的起作用 研究随机性和规律性时例子 当孩子们被注射了疫苗或安慰剂以后 研究者们开始在下一个 小儿麻痹症季节 中观察实验结果 在对照组中 有138个孩子感染了此病 这个数字当然有一定的随机性 研究者们并不能确定它意味着什么 如果另外一组的20万个孩子也被注射安慰剂 那么不一定会有同样多的孩子感染此疾病 根据随机性的大小 可能有130或140或其它数目的孩子们染上小儿麻痹症 研究随机性和规律性时例子 在被注射了疫苗的那一组中 有56个孩子患了小儿麻痹症 这个数字当然也有随机性 一个重要的问题是 56和138的差别是否超过了随机性所能解释的程度 如果是的话 那么研究者们就能够有把握说 疫苗起作用了 利用后面介绍的方法 我们可以看到 138和56的差别超出了随机性本身所能解释的范围 因此疫苗被宣布为是成功的 研究随机性和规律性时例子 从此以后 这种疫苗在许多国家根除了小儿麻痹症 全世界的健康组织所做的进一步的努力 将使不发达国家的孩子们 在不远的将来 也有可能不再遭受小儿麻痹症所带来的痛苦 在某种重要的意义上说 统计推理为发展和检验疫苗的研究者们提供了有力的支持 研究随机性和规律性时例子 概率和机会 概率 Probability 是一个取值于0和1之间的数 告诉我们某一特定的事件以多大的机会发生 下面大家将要看到的是MuseumofScience Boston US 有关正态分布和概率的介绍 概率和机会 有些概率是无法精确推断的 比如你对别人说你下一个周末去公园的概率是百分之八十 有些概率是可以知道的 比如掷骰子 只要没有人在骰子上做手脚 你得到6点的概率应该是六分之一 得到其他点的概率也是一样 这反映了掷骰子的规律性 但掷出骰子之后所得到的结果还只可能是六个数目之一 这体现了随机性 统计方法 描述统计 descriptivestatistics 内容搜集数据整理数据展示数据描述性分析目的描述数据特征找出数据的基本规律 推断统计 inferentialstatistics 内容参数估计假设检验目的对总体特征作出推断 描述统计与推断统计的关系 反映客观现象的数据 描述统计 统计数据的搜集 整理 显示和分析等 统计的应用领域 统计的应用领域 actuarialwork 精算 agriculture 农业 animalscience 动物学 anthropology 人类学 archaeology 考古学 auditing 审计学 crystallography 晶体学 demography 人口统计学 dentistry 牙医学 ecology 生态学 econometrics 经济计量学 education 教育学 electionforecastingandprojection 选举预测和策划 engineering 工程 epidemiology 流行病学 finance 金融 fisheriesresearch 水产渔业研究 gambling 赌博 genetics 遗传学 geography 地理学 geology 地质学 historicalresearch 历史研究 humangenetics 人类遗传学 统计的应用领域 hydrology 水文学 Industry 工业 linguistics 语言学 literature 文学 manpowerplanning 劳动力计划 managementscience 管理科学 marketing 市场营销学 medicaldiagnosis 医学诊断 meteorology 气象学 militaryscience 军事科学 nuclearmaterialsafeguards 核材料安全管理 ophthalmology 眼科学 pharmaceutics 制药学 physics 物理学 politicalscience 政治学 psychology 心理学 psychophysics 心理物理学 qualitycontrol 质量控制 religiousstudies 宗教研究 sociology 社会学 surveysampling 调查抽样 taxonomy 分类学 weathermodification 气象改善 历史上著名的统计学家 JacobBernoulli 伯努利 1654 1705 EdmondHalley 哈雷 1656 1742 DeMoivre 棣美佛 1667 1754 ThomasBayes 贝叶斯 1702 1761 LeonhardEuler 欧拉 1707 1783 PierreSimonLaplace 拉普拉斯 1749 1827 AdrienMarieLegendre 勒让德 1752 1833 ThomasRobertMalthus 马尔萨斯 1766 1834 ThomasRobertMalthus 马尔萨斯 PierreSimonLaplace 拉普拉斯 LeonhardEuler 欧拉 历史上著名的统计学家 FriedrichGauss 高斯 1777 1855 JohannGregorMendel 孟德尔 1822 1884 KarlPearson 皮尔森 1857 1936 RonaldAylmerFisher 费歇 1890 1962 JerzyNeyman 1894 1981 EgonSharpePearson 皮尔森 1895 1980 WilliamFeller 费勒 1906 1970 FriedrichGauss 高斯 JohannGregorMendel 孟德尔 分类数据 顺序数据 数值型数据观测数据和实验数据截面数据和时间序列数据 1 2统计数据的类型 什么是统计数据 data 对现象进行计量的结果不是指单个的数字 而是由多个数据构成的数据集不仅仅是指数字 它可以是数字的 也可以是文字的 统计数据的分类 统计数据的分类 统计数据的分类 按计量尺度分 分类数据 categoricaldata Nominal 对事物进行分类的结果数据表现为类别 用文字来表述例如 人口按性别分为男 女两类顺序数据 rankdata Ordinal 对事物类别顺序的测度数据表现为类别 用文字来表述例如 产品分为一等品 二等品 三等品 次品等数值型数据 metricdata Interval 对事物的精确测度结果表现为具体的数值例如 身高为175cm 168cm 183cm 统计数据的分类 按收集方法分 观测的数据 observationaldata 通过调查或观测而收集到的数据在没有对事物人为控制的条件下而得到的有关社会经济现象的统计数据几乎都是观测数据试验的数据 experimentaldata 在试验中控制试验对象而收集到的数据比如 对一种新药疗效的试验 对一种新的农作物品种的试验等自然科学领域的数据大多数都为试验数据 统计数据的分类 按时间状况分 截面数据 cross sectionaldata 在相同或近似相同的时间点上收集的数据描述现象在某一时刻的变化情况比如 2006年我国各地区的国内生产总值数据时间序列数据 timeseriesdata 在不同时间上收集到的数据描述现象随时间变化的情况比如 1996年至2006年国内生产总值数据 1 3统计中的几个基本概念 总体和样本总体单位和标志指标和指标体系参数和统计量变量 总体和样本 总体 population 所研究的全部元素的集合 其中的每一个元素称为个体分为有限总体和无限总体有限总体的范围能够明确确定 且元素的数目是有限的无限总体所包括的元素是无限的 不可数的样本 sample 从总体中抽取的一部分元素的集合构成样本的元素的数目称为样本容量 总体单位和标志 1 总体单位 Populationelement 总体单位 简称单位 是组成总体的各个个体 从数学角度看问题 如果说总体是集合的概念 单位测试集合的元素 总体单位可以是人 机构等实体单位 也可以是现象 活动等非实体单位 总体和总体单位的概念是相对的 随研究目的的变化而变化 总体单位和标志 2 标志 Attribute 总体各单位所具有的属性或特征成为标志 标志是反映总体各单位属性和特征的名称 总体是由单位构成的 单位又是标志的承担者 统计研究就是从登记标志开始的 并通过对标志的综合反映出总体的特征 标志是统计的基础 标志的分类 品质标志数量标志不变标志可变标志 统计指标和统计指标体系 1 指标 Indicator 简称指标 是反映统计总体数量特征的概念和数值 指标的概念 名称 是对所研究现象本质的抽象概括 是对总体数量特征的质的规定性 指标数值反应现象在具体时间 地点 条件下的规模和水平 指标按反映的数量特点分为 数量指标 人口总量 GDP总量等 绝对数 质量指标 人口密度 劳动生产率等 相对数 平均数 统计指标和统计指标体系 2 指标体系 Indicatorsystem 统计指标体系是由一系列相互联系的统计指标所组成的有机整体指标体系的分类 基本统计指标体系 社会 经济 科技等 专题指标体系 国际收支指标体系 信息化指标体系等 参数和统计量 参数 parameter 研究者想要了解的总体的某种特征值所关心的参数主要有总体均值 标准差 总体比例 等总体参数通常用希腊字母表示统计量 statistic 根据样本数据计算出来的一个量所关心的样本统计量有样本均值 x 样本标准差 s 样本比例 p 等样本统计量通常用小写英文字母来表示 统计中的几个基本概念 变量 Variable 说明现象某种特征的概念如商品销售额 受教育程度 产品的质量等级等变量的具体表现称为变量值 即数据变量可以分为分类变量 categoricalvariable 说明事物类别的一个名称顺序变量 rankvariable ordinal 说明事物有序类别的一个名称数值型变量 metricvariable interval 说明事物数字特征的一个名称离散变量 取有限个值连续变量 可以取无穷多个值 变量和数据 VariableandData 一个学校的注册在校男女生比例是固定的 为常量 constant 但是 该校任意一群学生的男女生比例就不一定和全校的比例一样了 它为变量 variable 变量和数据 VariableandData 当变量按照随机规律所取的值是数量时该变量称为定量变量或数量变量 quantitativevariable 因为是随机的 也称为随机变量 randomvariable 如身高体重 购买某商品的人数等等 象性别 观点之类的取非数量值的变量就称为定性变量或属性变量或分类变量 qualitativevariable 或categoricalvariable 这些定性变量也可以由定量变量来描述 如男女生的数目 持有某观点的人数比例等等 变量和数据 VariableandData 定性变量只有用数量来描述时 才有可能建立数学模型 并使用计算机来分析 数据中它们通常用哑元 dummyvariable 代表 比如性别用0 1代表 三种收入用0 1 2代表 或用字母代表 变量和数据 VariableandData 有了变量 何谓数据 不同机构调查所得到的北京收入万元以上市民的比例都不一样 这是变量 而这些调查产生一些数目 这些数目就是数据 data 数据是关于变量的观测值 变量和数据 VariableandData 通过数据可验证有关的理论或假定 比如通过抽样调查验证美国选民对共和党候选人的支持率是否超过50 通过抽样 可以检验某批产品是否合格等等 变量和数据 VariableandData 现实世界紧密联系的 人们想知道投资方式和经济效益之间的关系 旅客人数和经济发展之间的关系等等 不讨论变量之间的关系 就无从谈起任何有深度的应用 统计的基本概念就仅仅是摆设而已 变量之间的关系 广告投入和销售之间的关系 下表 数据ads txt 显示了某企业的广告投入和销售额之间的关系 万元 定量变量之间的关系 横坐标代表广告投入 而纵坐标代表销售收入 看得出有何种关系吗 能否从该数据回答下面问题 这两个变量是否有关系 如果有 它们的关系是否显著 这些关系是什么关系 能否用数学模型来描述 这个关系是否带有普遍性 这个关系是不是因果关系 定量变量之间的关系 关于因果关系在可控制的试验中 较容易找到因果关系 比如治疗方式和疗效的关系等但是 一般来说 变量之间有关系这个事实并不意味着一定存在明确的因果关系 定量变量之间的关系 比如 北京GDP在一年中是快速增长的 而一个刚出生的巴拿马婴儿在这一年中的体重也是快速增长的如果画出图来 它们有类似线性的关系但它们显然没有因果关系 定量变量之间的关系 只要有关系 即使不是因果关系也不妨碍人们利用这种关系来进行推断 比如利用公鸡打鸣来预报太阳升起 虽然公鸡打鸣绝对不是日出的原因 虽然打鸣发生在先 定量变量之间的关系 简单的办法 诸如画图 可以得到一些信息 但不一定能够给出满意的答案需要更多的工具和手段来进行数值分析得到更加严格和精确的解答因此 需要继续我们的课程 定量变量之间的关系 定性变量间的关系 下面是对123人进行关于某项政策调查所得结果的一个简单的三维表 它显示了人们的收入和性别对该项政策的观点 table7 txt 计算机软件所应用的数据形式 从这个数据 希望可以看出收入 性别对观点是否有影响及如何影响如果要得到更加精确的结论 就要进行进一步的分析和计算这是后面列联表分析或多项分布对数线性模型的内容 定性变量间的关系 定性和定量变量间的混和关系 有些数据不是仅有定性变量或仅有定量变量需要知道包括定性和定量两种变量的一些变量之间的关系下面数据就包含两种变量 Asthma txt数据 该数据有2个定性变量 性别 污染程度 一个定量变量 年龄 以及发生哮喘的人数我们希望知道哮喘和这三个变量之间的关系这将在Poisson对数线性模型中讨论 定性和定量变量间的混和关系 1 4几种常用的统计软件 Software 典型的统计软件SASSPSSMINITABSTATISTICAExcel 常用统计软件 Excel 它严格说来并不是统计软件 但作为数据表格软件 必然有一定统计计算功能 而且凡是有MicrosoftOffice的计算机 基本上都装有Excel 但要注意 有时在装Office时没有装数据分析的功能 那就必须装了才行 当然 画图功能是已经具备的了 对于简单分析 Excel还算方便 但随着问题的深入 Excel就不那么 傻瓜 需要使用宏命令来编程 这时就没有相应的简单选项了 多数专门一些的统计推断问题还需要其他专门的统计软件来处理 常用统计软件 SPSS 这是一个很受欢迎的统计软件 它容易操作 输出漂亮 功能齐全 价格合理 它也有自己的程序语言 但基本上已经 傻瓜化 它对于非专业统计工作者是很好的选择 SAS 这是功能非常齐全的软件 尽管价格相当不菲 许多公司 特

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论