统计学课件全的知识

上传人：琴*** IP属地：广东上传时间：2022-08-27 格式：PPT 页数：387 大小：4.74MB 积分：18 举报 版权申诉

已阅读5页，还剩382页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1、1经济统计案例Mobile 2经济统计无处不在：统计实例举例1.我国每年都要编辑全国统计年鉴，包括很多方面的，经济发展和社会进步的各种指标，其中我们比较关心的有GDP、CPI、外贸进出口额、人均可支配收入等等。每年的2月底会公布前一年的国民经济和社会发展统计公报。3举例1.中华人民共和国2011年国民经济和社会发展统计公报初步核算，全年国内生产总值471564亿元，比上年增长9.2%。其中，第一产业增加值47712亿元，增长4.5%；第二产业增加值220592亿元，增长10.6%；第三产业增加值203260亿元，增长8.9%。第一产业增加值占国内生产总值的比重为10.1%，第二产业增加值比

2、重为46.8%，第三产业增加值比重为43.1%。4举例1.中华人民共和国2011年国民经济和社会发展统计公报全年居民消费价格比上年上涨5.4%，其中食品价格上涨11.8%。固定资产投资价格上涨6.6%。工业生产者出厂价格上涨6.0%。工业生产者购进价格上涨9.1%。农产品生产价格上涨16.5%。5举例1：中华人民共和国2011年国民经济和社会发展统计公报年末全国就业人员76420万人，其中城镇就业人员35914万人。全年城镇新增就业1221万人。年末城镇登记失业率为4.1%，与上年末持平。全年农民工总量为25278万人，比上年增长4.4%。其中，外出农民工15863万人，增长3.4%；本地农民

3、工9415万人，增长5.9%。年末国家外汇储备31811亿美元，比上年末增加3338亿美元。年末人民币汇率为1美元兑6.3009元人民币，比上年末升值5.1%。6举例1：中华人民共和国2011年国民经济和社会发展统计公报全年研究生教育招生56.0万人，在学研究生164.6万人，毕业生43.0万人。普通高等教育本专科招生681.5万人，在校生2308.5万人，毕业生608.2万人。各类中等职业教育招生808.9万人，在校生2196.6万人，毕业生662.7万人。全国普通高中招生850.8万人，在校生2454.8万人，毕业生787.7万人。全国初中招生1634.7万人，在校生5066.8万人，毕

4、业生1736.7万人。普通小学招生1736.8万人，在校生9926.4万人，毕业生1662.8万人。特殊教育招生6.4万人，在校生39.9万人，毕业生4.4万人。幼儿园在园幼儿3424.4万人。7举例2：人口普查，人口抽样调查我国每10年进行一次人口普查，上次是2010年，在两次人口普查期间的中间进行1%的人口抽样调查。普查涉及内容比较广泛，如人口数、流动人口、城乡构成、性别构成、年龄构成、民族、受教育程度，收入、就业等等情况。我国以2010年11月1日零时为标准时点进行了第六次全国人口普查，结果显示，全国总人口为1370536875人。其中：普查登记的大陆31个省、自治区、直辖市和现役军人

5、的人口共1339724852人。8举例2：人口普查，人口抽样调查大陆31个省、自治区、直辖市和现役军人的人口中，男性人口为686852572人，占51.27%；女性人口为652872280人，占48.73%。总人口性别比(以女性为100，男性对女性的比例)由2000年第五次全国人口普查的106.74下降为105.20。 9举例2：人口普查，人口抽样调查大陆31个省、自治区、直辖市和现役军人的人口中，0-14岁人口为222459737人，占16.60%；15-59岁人口为939616410人，占70.14%；60岁及以上人口为177648705人，占13.26%，其中65岁及以上人口为11883

6、1709人，占8.87%。大陆31个省、自治区、直辖市和现役军人的人口中，具有大学(指大专以上)文化程度的人口为119636790人；具有高中(含中专)文化程度的人口为187985979人；具有初中文化程度的人口为519656445人；具有小学文化程度的人口为358764003人 10举例3：2011年武汉地区高校毕业生就业报告去年，该市首次用“非失业率”描述大学生就业状况，涵盖“就业率+升学考研率+出国留学率”。据称，武汉地区2011届高校毕业生规模达到历史新高，为267703人，其中本科生114961人、专科生123781人、硕士生25661人、博士3300人，非失业率达89.61%。这

7、支武汉规模最大的高校毕业大军，近九成有“事”可做。11举例3：2011年武汉地区高校毕业生就业报告根据昨日发布的就业报告，武汉地区2011届本科毕业生平均月收入2983元，专科毕业生2123元，硕士研究生3872元。相比2010届，前两项分别增加了56元、119元。业内人士认为，物价上涨是导致薪资升高的原因之一。武汉市毕办主任王星介绍，在全国15个副省级城市中，武汉高校毕业生薪资水平属中上等。12举例3：2011年武汉地区高校毕业生就业报告本科各专业中，毕业半年后月收入最高的是经济学，月收入为3421元；其次是工学，月收入3353元；最低的是教育学，月收入仅2742元。行业间的贫富差距明显。

8、金融服务行业应届高校毕业生收入继续领跑，平均月收入3321元，紧随其后的是IT行业，平均月收入达3253元。而房地产行业由去年第3名跌落至第5名，月平均收入2837元。制造业收入维持在较低水平，月均2347元。13举例4.啤酒和尿布的故事全球最大的零售商沃尔玛通过分析顾客购物的数据发现，很多周末购买尿布的顾客同时也购买啤酒。经过深入观察和研究发现，美国家庭买尿布的多是爸爸。年轻的父亲们下班后要到超市买尿布，同时“顺手牵羊”带走啤酒，好在周末看棒球赛的同时过把酒瘾。后来沃尔玛就把尿布和啤酒摆放得很近，从而双双促进了尿布和啤酒的销量。这个故事工人是数据挖掘data mining的经典范例。 14举

9、例5：文学也与统计有关据统计学家（复旦大学李贤平教授）对红楼梦各回的虚词（47个虚词：之，其，或，呀，吗，可，便，就）出现的频率进行统计分析（原因是由于个人写作特点和习惯的不同，所用的虚词是不会一样的），采用聚类分析，（物以聚类，人以群分）发现前80回和后40回明显不同，出自不同的人，进一步运用判别分析，发现前80回是曹雪芹所写，后40回不是高鹗一人所写，而是曹雪芹亲友将其草稿整理而成，宝黛故事为一人所写，贾府衰败情景为另一人所写等等，这个论证在红学界轰动很大。 15统计资料表明大多数汽车事故出在中等速度的行驶中，极少的事故是出在大于150公里/小时的行驶速度上的。这是否就意味着高速行驶比较

10、安全？16答：绝不是这样。统计关系往往不能表明因果关系。由于多数人是以中等速度开车，所以多数事故是出在中等速度的行驶中。 17问：统计数字还表明，在亚利桑那州死于肺结核的人比其他州的人多。这是否就意味着亚利桑那州的气候容易生肺病？ 18 答：正好相反。亚利桑那的气候对害肺病的人有好处，所以肺病患者纷纷前来，自然这就使这个州死于肺结核的平均数升高了。 19究竟什么是统计？ 20我们在生活和工作中会接触到大量的信息和数据。我们未来会成为经济管理人员或科研工作者，有些人将成为数据的生产者，但大部分人会成为数据的使用者。你必须有能力弄懂别人向你提供的大量数据的涵义。什么样的专门手段能使你高效率地使用数

11、据？答案是“统计学”。 21统计是以数据为食物的动物统计的本业是消化数据，并产生有营养的结果。Data Statistics Information 22经济学家、教育家、人口学家原北京大学校长马寅初学者不能离开统计而研究政治家不能离开统计而施政企业家不能离开统计而执业23第一节统计与统计学统计与统计学的含义统计数据的规律与统计方法24一、统计与统计学的含义统计统计的历史统计学统计学在我国的发展情况251.统计统计作为一种社会实践活动已经有很悠久的历史。在外语中，“统计”一词与“国家”一词来源于同一词源，现在统计已经被赋予多种含义，包括：（1）统计工作（搜集）（2）统计数据（结果）（3）

12、统计学（方法、技术）262.统计的历史统计最早运用者之一是“政治算术学派”创造人威廉.配第和约翰.格朗特，首先在其著作中使用统计数字和图表等方法来分析研究社会、经济和人口现象。 273.统计学统计学已经发展成为具有多个分支学科的大家族。统计学是收集、整理、分析统计数据的方法科学，其目的是探索数据的内在规律性，以达到对客观事物的科学认识。统计数据的收集：基础统计数据的整理：加工处理，使统计数据系统化、条理化统计数据的分析：核心内容，通过统计描述、统计推断探索数据内在规律性 284.统计学在我国的发展情况统计学分两类人才培养模式：数理类（理学）、经济类（经济学）统计学的国家重点学科：人大、厦大、西

13、财统计学的博士点：人大、厦大、中南财经、西财、东财、上财等有影响力的统计学家：陈希孺（院士，统计学唯一的院士，2005年不幸去世，71岁）易丹辉、袁卫、庞皓、曾五一、邱东、钱伯海、颜日初（国民经济统计）、张尧庭、方开泰（多元统计分析）294.统计学在我国的发展情况统计期刊：统计研究、中国统计、统计与决策、数理统计与管理统计教材：黄良文：统计学，中国统计出版社2000。贾俊平等：统计学，人大出版社2004 魏建国：统计学，武汉理工出版社200630二、统计数据的规律与统计方法1.生育人口性别比：男孩：女孩=107：1002.掷硬币1/2和掷色子1/6（买彩票、足彩、体彩等等）3.统计调查：恩格

14、尔系数（食品支出占总支出的比例）、基尼系数（警戒线0.4）31二、统计数据的规律与统计方法以上例子说明，通过多次观察或试验可以得到大量的统计数据，利用统计方法是可以探索其内在的数量规律性。因为客观事物本身是必然性与偶然性的对立统一，必然性反映了事物的本质特征，偶然性反映了事物表现形式的差异。（举例学生的平均分，标准差）32第二节统计学的分科统计方法已经被应用到自然科学和社会科学的众多领域，统计学也发展成为若干分支学科组成的学科体系。从统计方法的构成：描述统计学、推断统计学从统计方法研究和应用角度来分：理论统计学、应用统计学 33一、描述统计学和推断统计学1.描述统计学（Descriptiv

15、e Statistics）研究如何取得反映客观现象的数据，并通过图表形式，对所收集的数据进行加工处理和显示，进而通过综合、概括与分析得出反映客观现象的规律性数量特征。（数据的收集、加工处理、显示以及数据分布特征的概括与分析）2.推断统计学（Inferential Statistics）研究如何根据样本数据去推断总体数量特征的方法，它是在对样本数据进行描述的基础上，对统计总体的未知数量特征作出以概率形式表述的推断。（举例说明，全校某次英语四级考试的通过率，通过抽样调查100人）（抽样估计、假设检验、回归分析）3435一、描述统计学和推断统计学描述统计和推断统计是统计方法的两个组成部分。描述统计

16、是整个统计的基础，推断统计是现代统计学的主要内容，已经成为统计学的核心内容。 36二、理论统计学和应用统计学1.理论统计学（Theoretical Statistics）指统计学的数学原理，它主要研究统计学的一般理论和统计方法的数学理论。它是统计方法的理论基础。2.应用统计学（Applied Statistics）研究如何应用统计方法去解决实际问题。如：生物统计学、卫生统计学、人口统计学、农业统计学、管理统计学、社会统计学37第三节统计学与其他学科的关系统计学与数学的关系统计学与计算机的关系统计学与其他相关学科的关系38一、统计学与数学的关系39二、统计学与计算机的关系计算机软件的开发

17、为统计的计算带来了极大的方便，可以在很快的时间内处理相关的数据。常见的统计软件有：Excel、SPSS（Statistics Package for Social Sciences）、Eviews、SAS等等。40三、统计学与其他学科的关系统计学可以帮助其他学科探索学科内在的数量规律性，但对于这种数量规律性的解释，只能由各学科的研究来完成。统计方法不是万能的，有时会造成一些错误或误会。定量分析与定性分析要相结合。要选择适当的统计工具。41第二章统计数据的描述 42第二章主要内容2.1数据的计量尺度2.2统计数据的来源2.3统计数据的整理2.4分布集中趋势的测度2.5分布离散程度的测度2.6

18、分布偏态与峰度的测度2.7统计表与统计图432.1数据的计量尺度一般情况，数据的计量尺度按由低到高、由粗略到精确可以分为四种：列名尺度顺序尺度间隔尺度比例尺度44一、列名尺度nominal scale其特点是只能对事物进行平行的分类或分组，例如：人口按性别分为男、女，按教育程度分为高中及以下、大学、研究生，按户口分城市、农村等等。企业按经济性质分：国有、集体、私营、外企。为了便于统计处理，特别是为了便于计算机识别，可以对不同类别用数字或编码表示，如：“1”表示男性，“2”表示女性（但注意：这只是代码，不能区分大小或进行任何数学运算。）45二、顺序尺度ordinal scale顺序尺度是对事

19、物之间等级差或顺序差别的一种测度，可以比较大小。不仅可以将事物分成不同的类别，而且还可以确定这些类别的优劣或顺序。例如：产品分为一等品、二等品、三等品，考试成绩分为优、良、中、及格、不及格，客户对某产品的满意程度分别很满意、比较满意、不太满意、很不满意等。顺序尺度比列名尺度精确，但它只是测度了类别之间的顺序，而未测量出类别之间的准确差值，顺序尺度的计量结果只能比较大小，不能进行加减乘除运算。 46三、间隔尺度interval scale不仅可以比较各事物的大小，而且可以计算差异的大小，即计算数量的间隔。例如：考试分数（百分制）、温度的计量。47四、比例尺度ratio scale比例尺度与间隔尺

20、度的差别很小，区别主要在于，在间隔尺度中，“0”表示某一个数值，或者叫做0水平。而在比例尺度中，“0”表示“没有”或者“无”。例如：温度0表示0摄氏度，而长度0米则表示没有或不存在。大多数情况我们使用的是比例尺度。另外，间隔尺度只做加减运算，做乘除运算没有多大意义。而比例尺度可以做加减乘除运算且都有意义。482.2 统计数据的来源直接来源间接来源49一、间接来源报纸、图书、杂志、统计年鉴、网络等渠道获得。或者从调查公司或数据库公司购买。如国泰安中国金融、经济信息数据库公司。期刊网、维普网。书上有很多 50常用的统计数据来源美国经济分析局美国人口普查局美国劳工统计局美联储经济数据库美国联邦统计世

21、界银行国际货币基金组织OECD 51二、直接来源1.普查census：普查是为某一特定目的，专门组织的一次性全面调查。这是一种摸清国情、国力的重要调查方法。我国的人口普查、工业普查、经济普查（第二、三产业）2.抽样调查：抽样调查是通过随机样本对总体数量规律性进行推断的调查研究方法。虽然准确性没有普查高，但是节省人力、物力、财力。大多数调查公司都采取这种调查方式，如收视率调查、家庭收支情况调查、客户需求调查等等。 52二、直接来源3.重点调查和典型调查重点调查是从调查对象的全部单位中选择少数重点单位进行调查，其中重点单位是指在所要调查的数量特征上占有较大比重的单位。如了解全国钢铁企业，选择宝钢

22、、鞍钢、首钢、武钢、包钢即可。典型调查是从调查对象的全部单位中选择一个或几个少数有代表性的单位进行全面深入的调查。如研究武汉市跨国公司的运营情况，选取可口可乐公司作个案分析。重点调查、典型调查具有主观性，其调查的单位不是随机抽取的，因此，调查结果不能推论总体。532.3 统计数据的整理统计分组次数分配的图示与类型54一、统计分组统计分组是统计整理的第一步，是根据统计研究的目的，将数据按照某种特征或标准分成不同的组别。分组时所依据的特征或标准成为统计分组标志：品质标志分组：按事物的性质和属性划分（列名尺度和顺序尺度的数据）数量标志分组：按事物的数量标准划分（间隔尺度和比例尺度的数据）55

23、（一）品质标志分组比较简单，如对某学校学生的性别进行调查，可将学生分为男生、女生两个组。再如对武汉市的学校进行分类，可以分为小学、中学、中专、大学四个组。 56 性别人数（人）频率（%）男 732 57.14 女 54942.86 合计 1281100.00某高校学生性别分布表（品质数列）分组次数频率注意分组的完备性57（二）数量标志分组单变量值分组：把每一变量值作为一组，这种分组方式通常只适用于离散变量而且变量值较少的情况。组距分组：将全部变量值依次划分为若干个区间，并将这一区间的变量作为一组。581.组距分组的步骤（1）确定组距class width：一般以5或10的整数倍

24、为组距（2）确定组数：组数=全距range/组距=（最大值-最小值）/组距（3）根据分组整理成频数分布表592.组距分组应注意的问题（1）每组的两个端点数值叫组限，其中每组的小值称为下限（low limit），较大值称为上限（upper limit）；连续型变量在分组时相邻组的上下限应该重合，“上限不在组内”的原则，如：115120，包括115，但是不包括120；（2）在组距分组时，如果总体中有特小的变量值，就采用下开口组“某某以下” 在组距分组时，如果总体中有特大的变量值，就采用上开口组“某某以上”（3）组距分组：等距分组、不等距分组（如年龄06岁幼儿，717少儿，1835青年，3664中年

25、，65以上老年）602.组距分组应注意的问题（4）组中值：class midpoint可以反映各组数据的一般水平，作为该组数据的一个代表值。组中值：（下限+上限）/2 对于上开口组：本组下限+邻组组距/2 对于下开口组：本组上限-邻组组距/2612.组距分组应注意的问题（5）向上累积：将各组次数和频数由变量值小的组向变量值大的组逐组累积，它表明该组上限以下的单位数是多少，占总体比重是多少向下累积：将各组次数和频数由变量值大的组向变量值小的组逐组累积，它表明该组下限以上的单位数是多少，占总体比重是多少62举例63二、次数分布的图示与类型直方图与折线图几种常见的次数曲线洛伦茨曲线与基尼系数64

26、1.直方图histogram和折线图（频数多边形）frequency polygon（多边形）直方图是用矩形的宽度和高度来表示频数分布的图形，横轴表示数据分组，纵轴表示频数或者频率。折线图则是在直方图基础上，把直方图顶部的中点（即组中值）用直线连接起来。 65直方图（ Histogram ）用于显示连续型变量的次数分布662.几种常见的次数曲线当所观察的次数越多，组距越小，而且组数越多时，所给出的折线图就会越光滑，逐渐形成一条光滑的曲线，这种曲线即次数分布曲线，反映了数据或统计量的分布规律。67（三）、次数分布的主要类型1、钟型分布(1)对称的钟型分布日产量(件)68(2)左偏分布日产量(件

27、)69(3)右偏分布日产量(件)702、型分布713、J型分布(1) 价格72型分布（）价格733.洛伦茨曲线与基尼系数洛伦茨曲线是20世纪初美国经济学家、统计学家洛伦茨根据意大利经济学家帕累托（福利经济学的代表人，提出了帕累托最优）提出收入分配公式绘制成的描述收入和财富分配性质的曲线。横轴是累积的人口百分比，纵轴是累积的收入或财富百分比。743.洛伦茨曲线与基尼系数基尼系数=A/(A+B)，如果A=0,则基尼系数=0，表示收入绝对平均。如果B=0，则基尼系数=1，表示收入绝对不平均。基尼系数在0.20.4是比较适当的，0.4是收入分配不平均的警戒线。 752.4分布集中趋势的测度统计数据经

28、过排序和分组整理后，对数据分布的类型、特点有了一个大致的了解，但是这种了解知识表面上的，还缺少代表性的数量特征值。对于统计数据分布的特征，可以从两个方面进行描述：数据分布的集中趋势（central tendency）（众数、中位数、分位数、均值、几何平均数）数据分布的离散程度（dispersion）（极差、内距、方差、标准差、离散系数）762.4分布集中趋势的测度众数中位数均值几何平均数众数、中位数、均值的比较77一、众数mode众数是一组数据中出现次数最多的变量值。从分布看，众数是具有明显集中趋势点的数值。一组数据分布的最高峰点所对应的数值即是众数。例如：鞋的码号（女士37，男士41号）

29、当然会后极大值如姚明50号的鞋子。再比如衣服的尺寸等等。计算方法：1.根据未分组数据或者单变量值分组数据计算众数 2.对于组距分组求众数781.根据未分组数据或者单变量值分组数据计算众数只需找出出现次数最多的变量值即为众数。例如：有一组数据如下：2，3，3，5，5，5，6，7，8 ，10，这其众数为5。792.对于组距分组求众数其中，L表示众数所在组的下限表示众数组次数与下一组（前一组）次数之差表示众数组次数与上一组（后一组）次数之差 i表示众数组的组距80举例：某车间50名职工日产量分组资料如下：产量职工人数向上累积50以下5550-6081360-70213470-8094380以上7

30、50合计50-81举例众数组为60-70，L=60，i=10，1=21-8=13，2=21-9=12，则82二、中位数median中位数是数据排序后（从大到小或者从小到大），位置在最中间的数值。计算：1.未分组数据 2.分组数据计算中位数 831.未分组数据计算中位数设有一组数据为X1、X2、Xn，按从小到大排序后为X(1)、X(2)、X(n)，则（当n为奇数）（当n为偶数）例如：有6位工人日生产产品件数排序：27，29，30，31，31，32则Me=（30+31）/2=30.5842.分组数据计算中位数先根据N/2确定中位数的位置，确定中位数所在的组，采用以下近似公式计算：L表示中位数所

31、在组的下限Sm-1表示中位数所在组以下各组的累积次数（以前各组的累积次数）fm表示中位数所在组的次数i表示中位数所在组的组距85举例前例中：中位数所在组50/2=25,在60-70组内，L=60，i=10，fm=21,Sm-1=13,则中位数为：86三、均值mean（算术平均数arithmetric mean)简单算术平均数加权算术平均数871.简单算术平均数如小明期中考试，语文得了100分，数学得了90分，则其平均成绩为（100+90）/2=95分882.加权算术平均数xi:次数分配中各组的组中值fi:各组的次数或者权数k：分组的组数89加权算术平均数举例903.算术平均数应注意的问题（1）

32、（2）（3）91四、几何平均数geometric mean几何平均数是n个变量值乘积的n次方根。举例：生产某种产品需要连续经过4道工序，根据经验，各道工序的合格率分别为98%、95%、92%、90%，求该产品4道工序的平均合格率。92五、众数、中位数、均值的比较三者的关系三者的特点及应用场合931.三者的关系942.三者的特点及应用场合对称分布或接近对称分布，选择均值较好。若偏态分布，选择众数或中位数较好。均值易受数据极端值的影响，对于偏态分布的数值，均值的代表性较差。众数、中位数不易受极端值的影响。事实上，在实际的应用当中，均值的使用率最高。 952.5分布离散程度的测度极差方差标准差离散系

33、数96一、极差range极差又叫全距，是数据最大值减去最小值，极差R=max-min97二、方差variance和标准差standard deviation未分组数据分组数据981.未分组数据计算方差和标准差方差标准差992.分组数据计算方差和标准差方差标准差1002.分组数据计算方差和标准差：举例1012.分组数据计算方差和标准差：举例均值方差标准差s=262.85102四、离散系数coefficient of variance上面介绍的离散程度的测度值为绝对值，其大小取决于原变量值本身水平高低，变量值越大，测度值越大；另外，采用不同计量单位计量的变量值，其离散程度的测度值也不同。而离散系数

34、则可以消除变量值水平高低、计量单位不同对离散程度测度值的影响。离散系数是标准差与均值之比：103四、离散系数举例为比较两个不同城市居民家庭收入的差异程度，现从甲市随机抽取100户，得到其平均收入为42000元，年收入的标准差是38060元，从乙市随机抽取100户，得到其平均收入是62000元，年收入的标准差是50980元，试比较这两个城市家庭年收入的差异程度。由此，乙市的家庭收入差异程度低于甲市。（不能用标准差比较，否则得出错误的结论）1042.6分布偏态与峰度的测度偏态及其测度峰度及其测度105一、偏态及其测度偏态是对分布偏斜方向及程度的测度。偏态系数（skewness）来进行测度。偏态系数

35、的计算方法很多，这里介绍常用的一种，即：离差三次方的平均数再除以标准差的三次方。 106一、偏态及其测度SK=0,对称分布SK0,正偏或者右偏SK0，尖峰K帕氏指数2034.综合指数的其他类型（1）马歇尔-埃奇沃斯指数。马歇尔（A.Marshaii）和埃奇沃斯(F.Y.Edgeworth)等人于18871890间提出。2044.综合指数的其他类型（2）理想指数：（美国）沃儿什、庇古等人19011902年先后提出，后由费希尔通过大量比较和筛选，验证了其所具有的优良性质，将其命名为“理想公式”ideal formula。拉氏指数和帕氏指数的简单几何平均，公式为: 2054.综合指数的其他类型（3

36、）鲍莱指数1901年统计学家鲍莱（Bowley）提出。拉氏指数和帕氏指数进行简单算术平均。（4）固定加权综合指数206四、加权平均指数的主要形式1.加权算术平均指数2.加权调和平均指数2071.加权算术平均指数一般以基期总值加权的算术平均指数最为常用，其公式为：2081.加权算术平均指数（举例）2091.加权算术平均指数（注意的问题）（1）当个体指数与总值权数之间存在一一对应关系时，基期加权的算术平均指数恒等于拉氏指数。 2101.加权算术平均指数（注意的问题）算术平均指数不仅可以用绝对数加权，也可以用相对数加权，而且采用相对权数在应用上具有很多优越性。以价格指数为例，其计算公式为： 2112

37、.加权调和平均指数以计算期总值加权的调和平均数最为常用，其公式为：2122.加权调和平均指数当个体指数与总值权数之间存在一一对应关系时，计算期加权的调和平均指数等于帕氏指数。2132.加权调和平均指数（举例）2144.3指数体系与因素分析指数体系及其作用总量变动的因素分析指数体系用于指数推算215一、指数体系及其作用1.广义的指数体系：泛指由若干个内容上相互关联的统计指数所结成的体系。如：市场物价指数体系（居民消费价格指数、生产者价格指数、零售价格指数等等）2. 狭义的指数体系：仅指几个指数之间在一定的经济联系基础上所结成的较为严密的数量关系式。如：销售额指数=销售量指数*销售价格指数总

38、成本指数=产量指数*单位产品成本指数总产值指数=产量指数*产品价格指数216一、指数体系及其作用3.指数体系的分析作用：（1）因素分析（分析现象的总变动中各有关因素的影响程度）（2）指数推算（根据已知的指数推算未知的指数）217二、总量变动的因素分析以两因素分析为例。考察多种商品的销售额变动及其影响因素时，如果都用拉氏公式或者帕氏公式来编制销售量指数和价格指数，他们与销售额指数之间就难以形成严密的指数体系，即： 218二、总量变动的因素分析为了建立相应的“综合指数体系”，有两种供选择的方案： 219二、总量变动的因素分析为了统一，通常采用第一种分析方法。这种指数体系的完整分析框架为：22

39、0二、总量变动的因素分析（举例）221二、总量变动的因素分析（举例）222三、指数体系用于因素分析223三、指数体系用于因素分析例2：同样多的人民币多购买5%的商品，问物价指数是多少？1/105%=95.24%例3:多购买3%的商品却可少付2%的货币，问物价指数是多少？98%/103%=95.15% 2244.4 几种常用的经济指数工业生产指数消费者价格指数和零售物价指数股票价格指数225一、工业生产指数反映一个国家或地区各种工业产品产量的综合变动程度，是衡量经济增长水平的重要指标之一。我国的编制方法：（固定加权综合指数）226一、工业生产指数国外的编制方法是：（加权平均指数）为各种工业品的

40、个体产量指数，为相应产品的基期增加值。 227二、消费者价格指数和零售物价指数 1.消费者价格指数Consumer Price Index，CPI综合反映各种消费品和生活服务价格的变动程度的重要经济指数。 2.零售物价指数Retail Price Index 3.生产者价格指数Producer Price Index228应用我国的商品零售价格指数、农副产品收购价格指数、职工生活费指数（居民消费指数）及西方的工业生产指数、消费品价格指数等等，均采用了固定权数的平均指数的编制方法。特点权数资料一经确定，可在相对较长时间内使用，能减少工作量；在不同时期内采用同样权数，可比性强，有利于指数数列的编

41、制。固定权数的平均指数229以商品零售价格指数的编制为例将全部商品划分为大类、中类、小类、品种、规格；确定各品种的代表规格品及权数w ;按照小类、中类、大类、总指数的顺序逐级计算各级指数。个别商品或类商品的价格指数步骤确定的居民消费构成固定权数，w=100230商品类别及名称代表规格品计算单位平均价格（元）权数（w）（）指数（）总指数一、食品类粮食细粮面粉大米粗粮副食品烟酒茶其他食品二、衣着类三、日用品类四、文化娱乐用品类五、书报杂志类六、药及医疗用品类七、建筑装潢材料类八、燃料类标准粳米千克千克2.403.502.523.711005135654060354511920115

42、2623115.1117.5105.3105.6105.0106.0104.8125.4126.0114.8115.2109.5110.4108.6116.4114.5105.6231三、股票价格指数股票价格指数可以衡量整个股票市场变动的基本趋势。综合指数法： p为股票价格，q为相应股票的发行量或者交易量（一般取计算期的发行量）232国外主要股价指数道琼斯股价指数标准普尔股价指数（S&P500）那斯达克（Nasdaq）指数伦敦金融时报股价指数日经指数香港恒生指数233工业股价指数；运输业股价指数；公用事业股价指数；综合股价指数；道琼斯公正市价指数其中道琼斯股价指数由5种股价指数构成： 2

43、34上海证券交易所股价指数235深证综合指数深证成分指数深证100指数深圳证券交易所常用股价指数236三、股票价格指数（举例）2374.5综合评价指数综合评价指数的基本思想构建综合评价指数的基本问题综合评价指数的编制方法238一、综合评价指数的基本思想 1.在经济管理和分析实践中，常常需要根据统计指标的实际水平对有关的经济活动或经济状况进行评价，叫做统计评价。包括：单项评价（一项指标）和综合评价（多项指标）。2.单项评价：如一国的人均GDP考察其经济实力和发展水平。多项评价：一国的经济发展水平不仅表现为人均GDP，还有产业结构、资源利用（绿色GDP）、居民的福利及生活水平。（和谐社会的评价

44、指标、人的幸福指数）239一、综合评价指数的基本思想3.综合评价方法（1）常规的综合评价方法：简易计分法（体育、歌唱比赛中的综合评分）和参数指标法（选定综合评价所要考虑的几个主要方面的指标，以特定的方式结合起来，构成一个新的评价指标）生活质量指数=（2）规范的综合评价方法依据指数分析的原理对多项指标进行综合对比，最后得出概括性的单一评价指标。称为“综合评价指数法”。240二、构建综合评价指数的基本问题 1.建立综合评价指数体系2.确定各项指标的评价标准（可以用各项指标的中等水平作为单一“标准值”，也可以确定有关的阈值，采用相应的对比方法将原始数据无量纲化，得到各项指标的个体指数）3.确定各项

45、评价指标的权重4.选择评价指标的合成方法（算术平均、几何平均）241三、综合评价指数的编制方法标准比值法功效系数法 2421.标准比值法通过对各项参评指标分别确定单一的对比标准来计算个体指数，然后将个体指数加权平均得到综合评价指数。举例361页例10.8 2432.功效系数法通过对各项参评指标分别确定阈值，并运用“功效系数”的方法计算个体指数，然后将个体指数加权平均得到综合评价指数。功效系数d的计算方法：2442.功效系数法245第五章抽样与抽样分布246主要内容5.1常用的抽样方法5.2抽样分布247重点与难点重点：常用的几种抽样方法（包括简单随机抽样、分层抽样、系统抽样、整群抽样）、

46、抽样分布定理难点：抽样分布定理的应用2485.1常用的抽样方法样本（sample）是按照一定的抽样规则从总体中抽取的一部分单位的集合。根据抽取的原则不同，抽样方法有概率抽样和非概率抽样。（本科评估专家如何抽样？）2495.1常用的抽样方法（1）概率抽样（随机抽样）：按随机原则抽取样本，随机原则（random）排除主观意愿的干扰，使总体的每个单位都有一定的概率被抽为样本单位。（比较客观）最基本的组织方式有：简单随机抽样、分层抽样、系统抽样、整群抽样。该方式有效避免了主观选择带来的倾向性误差，可以估计、推断建立在概率、数理统计的科学理论上，可以计算、控制抽样误差，能够说明估计结果的可靠程度。2

47、505.1常用的抽样方法（2）非概率抽样（非随机抽样）：从研究目的出发，根据调查者的经验或判断，从总体中有意识地抽取若干单位构成样本。如：重点调查、典型调查、配额调查、方便调查该方式可以及时了解总体大致情况，总结经验教训，进行大规模调查前的试点，但易产生倾向性误差。注意：统计上所指的抽样一般都是指概率抽样，本书所研究的抽样也都是概率抽样。 2515.1常用的抽样方法简单随机抽样分层抽样系统抽样整群抽样252一、简单随机抽样simple random sampling 在总体中抽取n个单位作为样本，要使得每一个总体单位都有相同的机会（概率）被抽中，这种抽样方式称为简单随机抽样。重复抽样（sa

48、mpling with replacement）不重复抽样（sampling without replacement）（世界杯小组抽签）（福利彩票选号）253二、分层抽样（分类抽样）stratified sampling 分层抽样是指在抽样之前先将总体的单位划分为若干层（类），然后从各个层中抽取一定数量的单位组成一个样本。例如：专家抽样：按专业进行抽样；城市职工收入调查，按行业分类；居民的消费支出调查，可按户口分类（城市、农村）或性别分类（男、女）或地区分类（31省市）。分层抽样是统计分组法与抽样原理结合，可以提高样本的代表性，样本结构更接近于总体结构。划分层之后，确定各层的抽样数目（等比例分

49、层抽样、不等比例分层抽样）254三、系统抽样（等距抽样或者机械抽样）systematic sampling 在抽样中先将总体单位按某种顺序排列，并按某种规则确定一个随机起点，然后，每隔一定的间隔抽取一个单位，直至抽取 n个单位形成一个样本。如：总体有1000个单位，要从中抽取50个样本单位，可先将总体单位依次排队，计算出抽样间隔距离1000/50=20，再从第一个至第20个单位的范围内随机确定一个抽样起点，之后每个20个单位抽取一个样本单位。比如：调查某校学生的学习成绩，可以将学生按学好排队，然后每个一定数量的学生抽取一名学生进行调查。系统抽样的最显著的特点是：提高样本单位分布的均匀性，样本

50、代表性较强。255三、系统抽样（等距抽样或者机械抽样）systematic sampling按排队标志与调查内容的关系分为：1.无关标志排队系统抽样2.有关标志排队系统抽样256三、系统抽样1.无关标志排队系统抽样排队的标志与调查内容没有直接联系。如城市居民消费和收入调查，按居民所居住的街道门牌号码排队。产品质量检查，按产品生产的时间先后顺序排队。抽样起点r可以随机确定，可以为第一个抽样距离内的任意一个总体单位。接近于简单随机抽样，抽样误差按简单随机抽样的误差公式计算。257三、系统抽样2.有关标志排队系统抽样排队标志与调查内容有密切关系。如：调查某学校学生，按学习成绩高低排队。调查居民消费

51、的情况，按收入高低排队。其抽样起点的确定不宜随机确定。（在第一个抽样距离内随机的抽取一个标志值较小或较大的单位作为抽样起点，整个样本势必出现偏低或者偏高的系统误差。）258三、系统抽样2.有关标志排队系统抽样（1）半距起点等距抽样以第一个抽样距离的一半为抽样起点（r=k/2）并每间隔k个单位抽一个单位。（只能抽取一个样本）（2）对称等距抽样在第一个抽样距离内随机确定抽样起点r（），然后以组界k,2k,3k,为对称点两两对称的抽取样本单位。如： 0 3 5 7 10 13 15 17 20259四、整群抽样cluster sampling 调查时先将总体划分成若干群，然后再以群作为调查

52、单位从中抽取部分群，进而对抽中的各个群中所包含的所有个体单位进行调查或观察。例如：研究学生体质情况，以学校为群抽样；研究农民收入情况，以自然村为群；检验产品质量，从自动生产线上每隔若干小时抽一个小时的产品作检验。整群抽样只需对各群进行编号，而不需要对各总体单位进行编号，由于样本单位较集中，便于集中力量去调查。但是整群抽样的代表性可能较差。样本代表性取决于抽中群体对全部群体的代表性。群体之间差异愈大，样本代表性愈差。2605.2 抽样分布抽样分布的概念样本均值的抽样分布样本比率的抽样分布261一、抽样分布的概念每个随机变量都有其概率分布。样本指标即样本统计量是一种随机变量，它有若干可能取值，每个

53、可能取值都有一定的可能性，从而形成它的概率分布，统计上称为抽样分布。抽样分布就是样本统计量的概率分布。样本统计量是由n个随机变量构成的样本的函数（如样本均值、样本比率），所以，抽样分布属于随机变量函数的分布。抽样推断中，统计量服从正态分布或以正态分布为渐进分布，另外还有t分布、F分布、分布。262二、样本均值的抽样分布总体方差已知时，样本均值的抽样分布总体方差未知时，样本均值的抽样分布 2631.总体方差已知时，样本均值的抽样分布定理1：设总体 ,( )是其一个随机样本，则：样本均值，转化为标准正态分布为：定理2：若总体X的均值为，方差为，（）是其一个随机样本，当样本容量n

54、充分大（n30）,则：样本均值转化为标准正态分布为：2641.总体方差已知时，样本均值的抽样分布例如：在一批供货中标明某种工具的平均使用使用寿命是50小时，标准差为3小时，现随机从中抽取60件，求它们的平均寿命在49.551小时之间的概率。解：所以2652.总体方差未知时，样本均值的抽样分布定理3：设总体，( )是其一个随机样本，样本均值为，样本标准差为s，则统计量：266三、样本比率的抽样分布比率：产品合格率、收视率、市场占有率、支持率等等，即具有某种特征的单位占全部单位的比例。定理4：对任意总体X，其总体比率为P，从中抽取容量为n的样本，样本比率为p，则当n充分大（n30），样本比

55、率转化为标准正态分布为： 267三、样本比率的抽样分布例如：某批产品的合格率为98%，从该产品中任意取100件产品，求样本合格率大于96%的概率。解答： 268第六章参数估计269主要内容6.1参数估计的一般问题6.2一个总体参数的区间估计6.3样本容量的确定270重点与难点重点：一个总体参数的区间估计（分几种情况）难点：区间估计的理解、区间估计的计算 2716.1参数估计的一般问题估计量与估计值点估计与区间估计评价估计量的标准 272一、估计量与估计值所谓参数估计（parameter estimation）就是用样本统计量去估计总体的参数。例如：用样本均值去估计总体均值，用样本方

56、差去估计总体方差，用样本比率p估计总体比率P。在参数估计中，总体参数为，用来估计总体参数的统计量的名称，称为估计量（estimator），用符号表示。用来估计总体参数时计算出来的估计量的具体数值，称为估计值。估计值因为样本不同而不同。（参数一般是固定的，但未知）。273二、点估计与区间估计点估计区间估计2741.点估计point estimation 用样本估计量来估计总体参数。点估计的方法：矩估计法、极大似然估计法。2752.区间估计interval estimation 276三、评价估计量的标准2776.2 一个总体参数的区间估计总体均值的区间估计总体比率的区间估计278一、

57、总体均值的区间估计大样本的估计方法小样本的估计方法2791.大样本下总体均值的区间估计2801.大样本下总体均值的区间估计2812.小样本下总体均值的区间估计2822.小样本下总体均值的区间估计283二、总体比率的区间估计284二、总体比率的区间估计2856.3样本容量的确定估计总体均值时样本容量的确定估计总体比率时样本容量的确定必要抽样数目的影响因素 286一、估计总体均值时样本容量的确定287二、估计总体比率时样本容量的确定 288二、估计总体比率时样本容量的确定289三、必要抽样数目的影响因素1.总体方差（越大，容量越大）2.允许误差范围（越大，容量越小）3.置信度（越大，容量越

58、大）4.抽样方法（重复抽样大于不重复抽样）5.抽样组织方式290第七章相关与回归分析王新华武汉工业学院经济与管理学院291主要内容7.1相关与回归的基本概念（相关的定义、相关关系的类型、相关与回归分析）7.2简单线性相关与回归分析（简单线性相关系数及检验、总体回归函数与样本回归函数、回归系数的估计、简单线性回归模型的检验、简单线性回归模型预测） 292重难点重点：一元回归分析（回归系数的估计、检验）、相关系数及检验难点：一元回归分析的估计（总体回归函数和样本回归函数的区别）、检验（统计学检验）2937.1相关与回归的基本概念变量间的相互关系相关系数的类型相关分析与回归分析294一、变量间

59、的相互关系函数关系：（function）当一个或若干个变量X取一定数值时，某一个变量Y有确定的值与之相对应。例如：总成本Y=单位成本p*产量X,若p保持不变，则Y=f(X)，其中X是自变量，Y是因变量。相关关系或者统计关系：（correlation）当一个或若干个变量X取一定数值时，与之相对应的另一个变量Y的值虽不确定，但却按某种规律在一定范围内变化。例如：FDI与GDP，需求量与价格、收入；失业率与通货膨胀等等。295二、相关关系的类型1.从相关系数涉及的变量数量看（1）简单相关：只有两个变量的相关关系。（2）多重相关或复相关：三个或三个以上变量的相关关系。（如：服务贸易额与货物贸易额、服务

60、业FDI、服务业增加值的相关关系；产出与资本、劳动的相关关系）296二、相关关系的类型2.从变量相关关系的表现形式看（1）线性相关（linear correlation）：变量之间相关关系的散点图中的点接近一条直线。（2）非线性相关（nonlinear correlation）：变量之间相关关系的散点图中的点接近于一条曲线。297二、相关关系的类型3.从变量相关关系变化的方向看（1）正相关（positive correlation）：两个变量趋于在同一个方向变化，即同增同减。（2）负相关（negative correlation）：两个变量趋于在相反方向变化，即当一个变量增加时，另一个变量减少

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

统计学课件全的知识

文档简介

温馨提示

最新文档

评论

统计学课件全的知识

文档简介

温馨提示

最新文档

评论

相关文档