版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
统计学—基于SPSS课程内容描述统计、推断统计、其他常用方法使用软件SPSS学分与课时3学分,1~17周,每周3课时第1章数据与统计学1.1
统计学及其应用1.2数据及其来源1.3统计学与统计软件Statistics2019-5-5学习目标统计学的含义统计学的研究内容统计的应用领域统计数据的类型获得统计数据的途径常用统计软件2019-5-5问题与思考
怎样理解统计结论吸烟对健康是有害的,吸香烟的男性减少寿命2250天不结婚的男性会减少寿命3500天,不结婚的女性会减少寿命1600天身体超重30%会使寿命减少1300天每天摄取500毫升维生素C,生命可延长6年身材高的父亲,其子女的身材也较高一项研究表明:杰出科学家做出重大贡献的最佳年龄区在25~45岁之间,其最佳峰值年龄和首次贡献的最佳成名年龄随着时代的变化而逐渐增大上课坐在前面的学生平均考试分数比坐在后面的学生高中国科学院空间环境研究预报中心的专家称,在神舟七号载人航天飞行期间,飞船遭遇空间碎片的概率在百万分之一以下1.1统计学及其应用
1.1.1什么是统计学
1.1.2统计学的应用第1章数据与统计学1.1.1什么是统计学1.1统计学其应用2019-5-5什么是统计学
(statistics)1.收集数据:取得数据2.处理数据:图表展示分析数据:利用统计方法分析数据数据解释:结果的说明得到结论:从数据分析中得出客观结论
收集、处理、分析、解释数据并从数据中得出结论的科学
2019-5-5描述性方法研究数据收集、整理和描述的统计学方法内容数据收集、处理、展示、描述性分析目的描述数据特征找出数据的基本规律·推断性方法研究如何利用样本数据来推断总体特征的统计学方法内容参数估计假设检验目的对总体特征作出推断描述统计与推断统计
(descriptivestatistics&inferentialstatistics)2019-5-5统计学研究数据统计学没有任何固定的对象,是一门独特的学问统计学研究的是来自各领域的数据,由解决其他领域内的问题而存在并兴旺发达。按萨维奇(L.J.Savage)的说法:统计学基本上是寄生的。靠研究其他领域内的工作而生存。这不是对统计学的轻视,这是因为对很多寄主来说,如果没有寄生虫就会死。对有的动物来说,如果没有寄生虫就不能消化它们的食物。因此,人类奋斗的很多领域,如果没有统计学,虽然不会死亡,但一定会变得很弱1.1.2统计学的应用1.1统计学及其应用2019-5-5统计学的应用领域【例1-1】用统计识别作者
1787—1788年,三位作者AlexanderHamilton,JohnJay和JamesMadison为了说服纽约人认可宪法,匿名发表了著名的85篇论文。这些论文中的大多数作者已经得到了识别,但是,其中的12篇论文的作者身份引起了争议通过对不同单词的频数进行统计分析,得出的结论是,JamesMadison最有可能是这12篇论文的作者。现在,对于这些存在争议的论文,认为JamesMadison是原创作者的说法占主导地位,而且几乎可以肯定这种说法是正确2019-5-5统计学的应用领域【例1-2】用简单的描述统计量得到一个重要发现
费舍(R.A.Fisher)在1952的一篇文章中举了一个例子,说明如何由基本的描述统计量的知识引出一个重要的发现。20世纪早期,哥本哈根卡尔堡实验室的施密特(J.Schmidt)发现不同地区所捕获的同种鱼类的脊椎骨和鳃线的数量有很大不同;甚至在同一海湾内不同地点所捕获的同种鱼类,也发现这样的倾向然而,鳗鱼的脊椎骨的数量变化不大。施密特从欧洲各地、冰岛、亚速尔群岛以及尼罗河等几乎分离的海域里所捕获的鳗鱼的样本中,计算发现了几乎一样的均值和标准偏差值。由此,施密特推断所有各个不同海域内的鳗鱼是由海洋中某公共场所繁殖的。后来名为“戴纳(Dana)”的科学考察船在一次远征中发现了这个场所2019-5-5统计学的应用领域【例1-3】挑战者号航天飞机失事预测
1986年1月28日清晨,载有7名宇航员的挑战者号进入发射状态。就在发射前,有冰片牢附在机壳上。几分钟后,正当电视新闻报道它已进入轨道时,航天飞机在毁灭性的爆炸声中化成碎片,机上的宇航员片骨未存推动航天飞机进入太空的两个固体燃料发动机是由Thiokol公司制造的。失事前一天晚上,Thiokol公司的经理们和国家航空航天局就如期发射还是推迟发射产生了争执。天气预报发射时的气温为310F。争执的结果采纳了Thiokol公司经理们的建:按计划发射航天飞机。因为他们觉得没有确凿证据表明低温会对固体燃料火箭推进器的性能产生影响2019-5-5统计学的应用领域
2019-5-5统计学的误用与滥用大约在一个世纪以前,政治家BenjaminDisraeli曾有一个著名的论断:“有三类谎言:谎言、糟透的谎言和统计”。他还说:“图并没有说谎,是说谎者在画图”历史学家AndrewLang说,一些人使用统计“就像喝醉酒的人使用街灯柱—支撑的功能多于照明”统计滥用不好的样本过小的样本误导性图表局部描述故意曲解2019-5-5统计学的误用与滥用统计应用上的两个极端不用或几乎不用统计简单问题复杂化在统计应用中,这两个极端都是不可取的简单的方法不一定没用,复杂的方法也不一定有用。正如有的学者所说的,最简单的模型往往是最有用的统计应该恰当地应用到它能起作用的地方。不能把统计神秘化,更不能歪曲统计,把统计作为掩盖实事的陷阱1.2数据及其来源
1.2.1变量与数据
1.2.2数据的来源第1章数据与统计学1.2.1变量与数据1.2数据及其来源2019-5-5变量与数据变量(variable)描述所观察对象某种特征的概念,其的特点是从一次观察到下一次观察可能会出现不同结果观察一个企业的销售额,这个月和上个月有所不同;观察股票市场上涨股票的家数,今天与昨天数量不一样;观察一个班学生的生活费支出,一个人和另一个人不一样;投掷一枚骰子观察其出现的点数,这次投掷的结果和下一次也不一样“企业销售额”、“上涨股票的家数”、“生活费支出”、“投掷一枚骰子出现的点数”等就是变量数据(data)变量的观测结果2019-5-5变量分类类别变量(categoricalvariable)取值为事物属性或类别以及区间值的变量,也称分类变量(classifiedvariable)或定性变量(qualitativevariable)比如,观察人的性别、公司所属的行业、用户对商品的评价时,得到的结果就不是数字,而是事物的属性此外,考虑学生月生活费支出的档次可能分为1000以下、1000—1500、1500—2000、2000以上4档,作为变量的“月生活费支出档次”这4档取值也不是普通的数值,而是数值区间,因而也称为区间值类别变量类别变量根据取值是否有序分为两种名义(nominal)值类别变量也称无序类别变量,其取值是不可以排序的顺序(ordinal)值类别变量也称有序类别变量,其取值间可以排序当类别变量只取两个值时也称为二值(binary)类别变量,例如“性别”这一变量取值为男和女。二值变量可以看成名义变量,也可以看成有序变量2019-5-5变量分类数值变量(metricvariable)取值为数字的变量,也称为定量变量(quantitativevariable)数值变量的观察结果称为数值数据(metricdata)或定量数据数值型变量根据其取值的不同,可以分为离散变量(discretevariable)和连续变量(continuousvariable)。离散型变量是只能取有限个值是变量,而且其取值可以一一列举。连续型变量是可以在一个或多个区间中取任何值的变量,它的取值是连续不断的,不能一一列举,当离散变量的取值很多时,也可以将离散变量当作连续变量来处理2019-5-5变量分类1.2.2数据的来源1.2数据及其来源2019-5-5数据的来源寻找二手数据抽取样本总体(population):包含所研究的全部个体(数据)的集合样本(sample):从总体中抽取的一部分元素的集合样本量(samplesize):构成样本的元素的数目概率抽样方法2019-5-5概率抽样
(probabilitysampling)根据一个已知的概率来抽取样本单位,也称随机抽样特点按一定的概率以随机原则抽取样本抽取样本时使每个单位都有一定的机会被抽中每个单位被抽中的概率是已知的,或是可以计算出来的当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率2019-5-5简单随机抽样
(simplerandomsampling)从总体N个单位(元素)中随机地抽取n个单位作为样本,使得总体中每一个元素都有相同的机会(概率)被抽中抽取元素的具体方法有重复抽样和不重复抽样特点简单、直观,在抽样框完整时,可直接从中抽取样本用样本统计量对目标量进行估计比较方便局限性当N很大时,不易构造抽样框抽出的单位很分散,给实施调查增加了困难没有利用其他辅助信息以提高估计的效率2019-5-5简单随机样本
(simplerandomsample)由简单随机抽样形成的样本从总体N个单位中随机地抽取n个单位作为样本,使得每一个容量为n样本都有相同的机会(概率)被抽中参数估计和假设检验所依据的主要是简单随机样本2019-5-5分层抽样
(stratifiedsampling)将总体单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本优点保证样本的结构与总体的结构比较相近,从而提高估计的精度组织实施调查方便既可以对总体参数进行估计,也可以对各层的目标量进行估计2019-5-5系统抽样
(systematicsampling)将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本单位先从数字1到k之间随机抽取一个数字r作为初始单位,以后依次取r+k,r+2k…等单位优点:操作简便,可提高估计的精度缺点:对估计量方差的估计比较困难2019-5-5整群抽样
(clustersampling)将总体中若干个单位合并为组(群),抽样时直接抽取群,然后对中选群中的所有单位全部实施调查特点抽样时只需群的抽样框,可简化工作量调查的地点相对集中,节省调查费用,方便调查的实施缺点是估计的精度较差用SPSS抽取简单随机样本软件应用2019-5-5用SPSS抽取简单随机样本2019-5-5用SPSS抽取简单随机抽样【例1—4】从一个班级50个学生的名单,采用简单随机抽样抽出10个学生组成一个随机样本抽取随机样本SPSS2019-5-5用SPSS抽取简单随机样本2019-5-5用SPSS抽取简单随机样本1.3统计学与统计软件
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 线上金融服务合规风险管理降低合同2026
- 线上线下合作门窗配件采购协议
- 2026中国供应链金融与金属期货结合模式创新报告
- 2026中国二手奢侈品鉴定认证体系构建与平台信任机制及市场教育研究报告
- 2026年幼儿园学校暴力素材
- 2026-2030中国玻璃钢门行业市场发展趋势与前景展望战略研究报告
- 2026-2030中国手工焊接行业市场发展趋势与前景展望战略研究报告
- 2026-2030中国2,2-二甲氧基-2-苯基苯乙酮(光引发剂BDK)行业市场发展趋势与前景展望战略研究报告
- 2026年幼儿园泥工蜗牛
- 2026年文体活动安保试题及答案
- DB65-T 4842-2024 旅游公路工程技术规范
- DB3303T084-2025孤独症儿童康复机构建设与管理规范
- 《商业空间设计探讨》课件
- CNAS-CL08-2006 评价和报告测试结果与规定限量符合性的要求
- 《傅里叶变换详解》课件
- 健康体检中心标准化操作手册
- JTS-131-2012水运工程测量规范
- DZ∕T0312-2018 非金属矿行业绿色矿山建设规范(正式版)
- 第三章-5空间数据的内插方法
- 路基路面压实度检测-路基路面压实度检测
- 等效声级计算表
评论
0/150
提交评论