统计学及其基本概念课件_第1页
统计学及其基本概念课件_第2页
统计学及其基本概念课件_第3页
统计学及其基本概念课件_第4页
统计学及其基本概念课件_第5页
已阅读5页,还剩68页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一章

统计学及其基本概念1本章内容一、统计学简介二、认识数据三、基本概念四、统计计算工具2统计学简介统计的涵义:统计工作、统计资料、统计学统计学的内容:描述统计学、推断统计学统计学的过去与现在:统计学中的各大著名学派、统计学的现代格局统计学在经济管理中的应用:案例1

案例2

案例3

案例43认识数据四个数据集:见excel文件中国主要宏观经济指标数据集、95世界各国基本情况数据集公司人力资源部数据集、企业流水线上的抽样数据集数据类型Ⅰ:分类数据

顺序数据

数值型数据数据类型Ⅱ:时间序列数据

截面数据

面板数据4年份国民总收入国内生产总值第一产业增加值第二产业增加值第三产业增加值人均GDP财政总收入财政总支出财政的教育支出1952679.00679.00342.90141.80194.30119.00173.94172.0711.031953824.00824.00378.00192.50253.50142.00213.24219.2119.251954859.00859.00392.00211.70255.30144.00245.17244.1119.971955910.00910.00421.00222.20266.80150.00249.27262.7319.0019561028.001028.00443.90280.70303.40165.00280.19298.5226.5319571068.001068.00430.00317.00321.00168.00303.20295.9527.9819581307.001307.00445.90483.50377.60200.00379.62400.3625.5719591439.001439.00383.80615.50439.70216.00487.12543.1733.3619601457.001457.00340.70648.20468.10218.00572.29643.6846.3419611220.001220.00441.10388.90390.00185.00356.06356.0932.9619621149.301149.30453.10359.30336.90173.00313.55294.8827.5519631233.301233.30497.50407.60328.20181.00342.25332.0529.6219641454.001454.00559.00513.50381.50208.00399.54393.7934.7819651716.101716.10651.10602.20462.80240.00473.32459.9735.8119661868.001868.00702.20709.50456.30254.00558.71537.6540.5319671773.901773.90714.20602.80456.90235.00419.36439.8436.9219681723.101723.10726.30537.30459.50222.00361.25357.8427.5019691937.901937.90736.20689.10512.60243.00526.76525.8627.0419702252.702252.70793.30912.20547.20275.00662.90649.4127.5619712426.402426.40826.301022.80577.30288.00744.73732.1733.6919722518.102518.10827.401084.20606.50292.00766.56765.8639.3819732720.902720.90907.501173.00640.40309.00809.67808.7843.45中国主要宏观经济指标数据5国家人口人口密度城市人口比重信仰宗教女性期望寿命男性期望寿命识字率人口增长率婴儿死亡率人均GDP地区类型Afghanistan2050025.0018.00Muslim44.045.029.002.80168.00205.003Argentina3390012.0086.00Catholic75.068.095.001.3025.603408.006Armenia3700126.0068.00Orthodox75.068.098.001.4027.005000.005Australia178002.3085.00Protstnt80.074.0100.001.407.3016848.001Austria800094.0058.00Catholic79.073.099.000.206.7018396.001Azerbaijan740086.0054.00Muslim75.067.098.001.4035.003000.005Bahrain600828.0083.00Muslim74.071.077.002.4025.007875.005Bangladesh125000800.0016.00Muslim53.053.035.002.40106.00202.003Barbados256605.0045.00Protstnt78.073.099.000.2020.306950.006Belarus1030050.0065.00Orthodox76.066.099.000.3019.006500.002Belgium10100329.0096.00Catholic79.073.099.000.207.2017912.001Bolivia79006.9051.00Catholic64.059.078.002.7075.00730.006Bosnia460087.0036.00Muslim78.072.086.000.7012.703098.002Botswana13592.4025.00Tribal66.060.072.002.7039.302677.004Brazil15660018.0075.00Catholic67.057.081.001.3066.002354.006Bulgaria890079.0068.00Orthodox75.069.093.00-0.2012.003831.002BurkinaFaso1000036.0015.00Animist50.047.018.002.80118.00357.004Burundi6000216.005.00Catholic50.046.050.002.30105.00208.004Cambodia1000055.0012.00Buddhist52.050.035.002.90112.00260.00395年世界各国基本情况数据6序号性别出生日期教育程度工作岗位2002考核2003考核2004考核薪水初薪工作时间工作前的经验少数民族1m07/20/62121优优良¥33,900¥16,5006410602f06/15/48121优良优¥23,400¥13,5006419803f08/18/67161优优优¥32,850¥19,500642004f11/28/65163优优良¥55,750¥19,980643605f06/01/64151优良中¥25,200¥13,950645706m01/22/64121优优优¥26,250¥15,750646917m02/03/52153优优优¥57,000¥27,0009814408m05/23/58161优合格不合格¥40,200¥18,750983609f********121优优优¥21,450¥12,00098381010f04/15/4781优良优¥21,900¥13,20098190011m02/09/55151优中良¥45,000¥21,00098138012m08/22/58151优良优¥32,100¥13,5009867013m04/26/56151优优中¥36,000¥18,75098114014f05/06/66121优优优¥21,900¥9,750980015f01/23/46151优中优¥27,900¥12,75098115016f02/13/46121优优优¥24,000¥13,50098244017f02/07/50161优优优¥30,300¥16,50098143018m01/11/6681优良优¥28,350¥12,0009826119m07/17/60151优优优¥27,750¥14,2509834120f02/26/49151优中优¥35,100¥16,800981371公司人力资源部数据7序号日期4:0010:0016:0022:00样本大小不合格品数12005.1.153.153.353.553.0581822005.1.253.453.153.153.1464432005.1.352.552.952.953.5835842005.1.453.052.853.552.48081252005.1.552.852.952.752.8780662005.1.652.952.952.952.9252672005.1.752.852.952.753.1430782005.1.852.653.453.153.3600592005.1.953.553.652.852.782211102005.1.1053.153.353.553.08148112005.1.1153.453.153.153.12066122005.1.1253.253.453.152.97038132005.1.1353.453.053.953.185019142005.1.1452.852.953.253.270911152005.1.1553.253.352.9531.1653.552.954.053.92508172005.1.1754.353.653.653.883014182005.1.1853.253.354.053.77987192005.1.1953.854.053.853.88139202005.1.2053.153.653.753.88187企业流水线上的抽样数据8基本概念总体、个体、样本、标志、指标、变量9统计计算工具Excel:统计函数、统计分析工具马克威统计分析软件(方差分析、多元统计分析等)附:认证考试说明10一、统计分析软件简介1、SAS(StatisticsAnalysisSystem);2、SPSS(StatisticalPackagefortheSocialSciences),即“社会科学统计软件包”3、Statistica4、Minitab5、马克威分析系统6、R软件统计计算工具11SAS系统全称为Statistics

Analysis

System

最早由北卡罗来纳大学的两位生物统计学研究生编制,并于1976年正式推出SAS软件早期的主要功能是统计分析,如今产品与解决方案除统计分析外,新增了数据整合、企业智能等。SAS用户遍及金融、医药卫生、生产、运输、通讯、政府和教育科研等领域。一般认为使用SAS需要编写程序,比较适合统计专业人员,而对非统计专业人员则比较困难。12SPSS公司成立于1968年,由单一统计产品开发转向为企业、教育科研及政府机构提供全面信息统计决策支持服务,擅长“数据仓库”和“数据挖掘”。SPSS最突出的特点操作界面极为友好,采用类似EXCEL表格的方式输入与管理数据,数据接口通用,能方便的从其他数据库中读入数据,是非统计专业人员的首选统计软件。13

Statistica是由美国俄克拉荷马州的StatSoft公司研制的大型专业统计图表分析软件包。Statistica的图形功能很完备,显示输出的图形细腻美观,有13个主命令,80多个子命令14MINITAB是由美国宾夕法尼亚州立大学在1972年研制的统计分析软件包,它具有易学、可靠以及功能完善的优点。是教授统计学,实施六西格玛和其他质量改进项目的理想选择。MINITAB包括统计分析模块和绘制图形模块。适用面较宽,深受跨国公司欢迎15马克威分析系统是由上海天律信息技术有限公司开发的中国第一套完全自主知识产权的大型统计分析和数据挖掘系统。马克威分析系统在技术上的特点是:将数据挖掘、统计分析、图形展示和智能报表融为一体,为用户提供完整配套的决策支持工具;在设计上充分考虑了中国用户的实际情况和使用习惯,将实用性和科学性结合在一起。16R软件R语言是统计领域广泛使用的,诞生于1980年左右的S语言的一个分支。R语言是S语言的一种实现。S语言是由AT&T贝尔实验室开发的一种用来进行数据探索、统计分析、作图的解释型语言。R是一个免费的自由软件,可以免费下载和使用的。大数据分析的有力工具17二、EXCEL主要功能一是Excel的公式与函数,二是Excel的数据分析工具。1、office2010系统(大家安装)打开excel表,点击“公式”—点击fx——12类函数,也可在横栏看到部分函数Sum演示182、数据分析工具加载步骤:打开excel—点左上角“office”按钮点击正下方“Excel选项”—“加载项”—“转到”—“分析工具库”打钩,点“确定”点“数据”菜单,找到“数据分析”,内有19种实用工具19三、SPSS软件介绍数据编辑功能图标的生成功能统计分析功能20统计工作

统计工作是为了管理或认识的需要,对社会经济现象和自然现象进行数量收集的活动。谁做?

统计局系统、企业信息化Statisticalwork21统计资料

统计资料是统计工作过程中所取得的各项数字资料以及与之相关信息的总称。统计资料是统计工作取得的能够说明所研究对象的数据。例如国内生产总值数据,说明整个国家的经济规模。这些数据经常会在报纸、杂志上出现。Statisticaldata如何查找:网站-统计年鉴、专业年鉴22统计学

统计学是在统计工作的经验积累到一定程度时自然产生的,它是收集、整理、描述分析统计数据的方法和技术,为我们的决策提供“量”方面的依据。

《不列颠百科全书》对统计学的定义为:“统计学是关于收集和分析数据的科学和艺术”。Statistics具有技巧性、技术性。23P4-5死亡率2425什么是统计学?

(statistics)1.收集数据:取得数据2.处理数据:图表展示分析数据:利用统计方法分析数据数据解释:结果的说明得到结论:从数据分析中得出客观结论

收集、处理、分析、解释数据并从数据中得出结论的科学26中华人民共和国国家统计局27国家统计局省级统计局国家统计局某省调查总队市级统计局国家统计局某市调查队县级统计局国家统计局某县调查队乡镇级统计站统计系统部层级部门设置示意图社会经济信息主体部门,统计信息具有权威性;不具有部门利益28高德地图29描述统计学

描述统计学研究如何取得反映客观现象的数据,并通过图表形式对所收集的数据进行加工处理和显示,进而通过综合、概括与分析得出反映客观现象的规律性数量特征。DescriptiveStatistics恩格尔系数2、3、4章30推断统计学

推断统计学是研究如何根据样本数据去推断总体数量特征的方法,它是在对样本数据进行描述的基础上,对统计总体的未知数量特征作出以概率形式表述的推断。5、6、7、9、12章InferentialStatistics31统计描述法

统计描述法是对由调查或实验得到的统计数据资料进行整理、归类,计算出各种能反映总体数量特征的综合指标,并加以分析研究,从而得出需要的数据资料信息,用表格、图形和统计指标数值来表示的统计方法。32统计学中的各大著名学派1.国势学派

2.政治算术学派

3.数理统计学派

4.社会统计学派33统计学的现代格局

一是以社会经济问题为主要研究对象的社会经济统计,从属于应用经济学。二是以方法和应用研究为主的数理统计。从学科的角度看,从属于数学。

学科分类:数理统计学、应用统计学34国势学派人物:【德国】康令和阿亨瓦尔贡献:提出世界公认的名词-统计学(Statistics)

评价:“有统计之名,无统计之实”的学派

35政治算术学派人物:【英国】威廉·配第和约翰·格朗特贡献:开用数量方法研究社会经济现象之先河评价:“有统计之实,无统计之名”的学派

36威廉·配第

配第著作《政治算术》中,对当时的英国、荷兰、法国之间的财富进行数量上的计算和比较。马克思称配第是“政治经济学之父,在某种程度上也可以说是“统计学的创始人”

37数理统计学派人物:【比利时】人才济济。如:凯特勒、戈赛特、费希尔、内曼、卡尔皮尔逊贡献:

(1)完成统计学和概率论结合(2)建立了丰富的数理统计理论38凯特勒比利时统计学家(1796-1874)著作《社会物理学》提出著名的“平均人”概念,认为:社会所有的人与“平均人”的差距越小,则社会矛盾就越缓和。被统计学界称为“国际统计会议之父”和“近代统计学之父”,其贡献是发现了大量现象的统计规律性和开创性地应用了许多统计方法,为数理统计学的发展奠定了基础。39卡尔·皮尔逊他设计的“直线相关系数”是最常用的相关系数,从其构思过程中,体会“对称美”;他构建的“检验”是最常用的检验方法,从其公式形式中,体会“简单美”。许多学者把卡尔·皮尔逊尊称为“统计学之父”。40社会统计学派人物:【德国】克尼斯、恩格尔和梅尔观点:统计学的研究对象是社会现象,目的在于明确社会现象的内在联系和相互之间的关系。在研究过程中,要用全面调查,也可以适量的使用抽样调查。41案例11995年9月,美国斯坦福大学经济学教授刘遵义就通过实证比较,数量分析和模糊评价等方法,预测出菲律宾、韩国、泰国、印尼和马来西亚有可能发生金融危机。

42案例22005年3月16日上证平均指数中30支股票的市盈率是21.08。东方电子集团有限公司的市盈率是17.92。这时,市盈率方面的统计信息显示:与上证指数股票的平均收入相比,东方电子集团有限公司的股票价格较低。因此,投资顾问可以得出结论:东方电子集团有限公司的现行价格低估了。银行市盈率43案例3

假设一家会计师事务所想确定客户的资产负债表中所显示的应收账款的数量是否公正地体现了实际的应收账款的数量。通常,应收账款的账目数量很大,要审查和验证每个账户既费时又费钱。怎么办?抽样调查可以解决问题!44案例4

零售付账柜台使用电子扫描仪收集数据,可供各种营销研究应用。数据挖掘的典型:啤酒与纸尿裤45TXUEnergy——智能电表:有了智能电表,供电公司能每隔15分钟就读一次用电数据,而不是过去的一月一次。这不仅仅节省了抄表的人工费用,而且由于能高频率快速采集分析用电数据(产生大数据),供电公司能根据用电高峰和低谷时段制定不同的电价,TXUEnergy就利用这种价格杠杆来平抑用电高峰和低谷的波动幅度。例如,TXUEnergy打出了这样的宣传口号:亲,晚上再洗衣服洗碗吧,晚上用电不要钱。T-Mobile移动运营商T-Mobile在多个IT系统中整合了大数据应用,对客户交易和互动数据进行综合分析,更准确地预测客户流失率。通过将社交媒体数据和CRM和计费系统中的交易数据进行综合分析,T-mobile在一个季度内将客户流失率降低了一半!USXpressUSXpress部署了一系列的运输大数据应用,采集上千种数据类型,从油耗、胎压、卡车引擎运行状况到GPS信息等,USXpress甚至从司机们抱怨该系统的博客中收集数据,并通过分析这些数据来优化车队管理、提高生产力、降低油耗,每年节省了数百万美元的运营成本。麦克拉伦一级方程式车队(Mclaren’sF1racingteam)麦克拉伦车队通过汽车传感器在赛前的场地测试中实时采集数据,结合历史数据,通过预测型分析发现赛车问题,并预先采取正确的赛车调校措施,降低事故几率并提高比赛胜率。46分类数据

分类数据是对事物进行分类的结果,数据的主要特征是采用文字、数字的代码和其他符号对事物进行简单的分类和分组。分类数据以定类尺度(nominalscale)来衡量。categoricaldata性别、民族、区域、信仰47顺序数据

即等级数据,是对事物进行分类的结果,这些分类在语义上表现出明显的等级或顺序关系,例如,学生成绩可以分为优秀、良好、中等、及格和不及格。顺序数据以定序尺度(ordinalscale)来衡量。rankdata48数值型数据

数值型数据是使用自然或度量衡单位对事物进行测量的结果,其结果表现为具体数值。数值型数据有两种衡量尺度:一是定距尺度(intervalscale)—间隔相同,加减运算二是定比尺度(ratioscale)—数值倍数,乘除运算区别:“零点”metricdata49时间序列数据

时间序列数据是在不同时间上收集到的数据,它所描述的是现象随时间而变化的情况。timeseriesdata50截面数据

截面数据是在相同或近似相同的时间点上收集的数据,它所描述的是现象在某一时刻或某一时间段的变化情况。cross-sectionaldata51面板数据

面板数据是对若干个单位在不同时间进行重复跟踪调查所形成的数据。paneldata52绝对数

绝对数是统计数据的基本表现形式,是其他指标形式形成的基础。现象的总体规模和水平一般都以绝对数形式表现,一个地区的总人口、国内生产总值、货物周转量等都是绝对数。时点数据与时期数据absolutenumber53相对数

相对数是由两个相互联系的绝对数对比得到,反映事物的相对数量。常用的相对数包括:结构相对数、动态相对数、比较相对数、计划完成相对数。relativenumber54平均数平均数反映现象总体的一般水平。如:职工的平均工资。average55变量变量(variable)总是可以用数值形式表现的,可变的数量标志和所有的统计指标都是变量。分类:自变量、因变量

离散型变量、连续型变量

确定性变量、随机变量

56离散型变量

离散型变量一般用“点数”的方法取得,数值往往是整数,不能进行进行新的分割。如职工人数、企业个数、设备台数等。discretevariable57连续型变量

连续型变量用“测量”取得,测量的仪器越精密,变量值就会越精确,如人的身高、体重;产品的长度、重量等。continuousvariable58确定性变量受确定性因素影响的变量称为确定性变量。这种影响变量值变化的因素是明显的,是可以解释的,是人为的或者受人控制的,其影响变量值的大小、方向都可以确定。certaintyvariables

59随机变量受随机性因素影响的变量称为随机变量,所谓随机因素,是指各种不确定的、偶然性的因素,这种因素对变量影响的大小和方向都是不确定的,通常是微小的。randomvariable60计算工具计算器-要求会用“统计功能”计算机-要求会用“Excel”作分析

1.公式和函数

2.数据分析工具61总体

统计总体,简称总体(Population),就是统计所要研究的事物或现象的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论