数理统计的一些应用毕业论文_第1页
数理统计的一些应用毕业论文_第2页
数理统计的一些应用毕业论文_第3页
数理统计的一些应用毕业论文_第4页
数理统计的一些应用毕业论文_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、毕 业 论 文论文题目:数理统计的一些应用系 别 数学系 专 业 数学教育 班 级 10数教(3)班 学 号 131002139 姓 名 指导教师 2013年 6 月 5 日目录目录1一引言2二数理统计在生活中的应用2三数理统计的基本内容72.统计推断8四统计工作的重要性81.统计工作的重要性9.当前统计工作存在的问题及原因93.解决统计工作问题的对策10五运用数理统计的方法对考试成绩的分析101.编制成绩频数分布表112.算术平均数123. 离中趋势的度量124.成绩频数分布为正态的拟合度检验13.用正态分布的性质分析两个班的成绩15六结束语16七 参考文献:16八致谢17数理统计的一些应用

2、赵芳娟【摘要】:数理统计学的基本方法已成为教育评估中的重要工具。本文通过对数理统计的起源、发展、基本内容以及重要性的讲述,以一次考试成绩为例,给出了数理统计方法在教学评估中的一个应用,通过编制频数分布表、计算均值、方差、标准差、进行正太分布的拟合度检验等过程,得出了一些结论。【关键词】:数理统计,频数分布,标准差,拟合度检验一引言数理统计学是从本世纪初开始发展起来的一门学科,它是以概率论的理论为基础,根据观察得到的大量数据进行整理、分析并对所研究的随机现象的概率特征做出合理的估计和判断的数学分支。虽然数理统计学是一门比较年轻的学科,但随着概率论的产生和应用正在逐渐兴起,现已广泛的应用于工农业生

3、产及科学技术之中,成为一门理论严谨、应用广泛、发展迅速、方法独特的学科。在教育领域,考试是各级各类学校评定学业成绩,进行教育学评估,取得教学反馈信息的主要手段。因此,在世界上的许多国家都很重视对考试工作和考试方法的研究。当学生考试结束后,为了了解学生对所学知识与技能的掌握情况,发现教与学中存在的不足,使考试真正为素质教育服务,我们需要对考试成绩进行一次较为深入细致的定量分析。数理统计对教育及教学工作进行评估、定量分析起到重要的作用。本文以定西市第一中学高一(1)(2)两个班数学期末考试成绩为例,综合运用多种统计方法对成绩(数据)进行分析研究,做出决断,并分析产生的原因。二数理统计在生活中的应用

4、统计是从数据中获得信息的科学。统计与实际生活息息相关,在生活实践中有着广泛的应用。从古代的结绳记事到现在的市场调查都是统计的应用。我国设有国家统计局、地方统计局进行各种统计工作,从数据中获取信息指导我们国家的发展。统计局主要负责的工作有人民的生活、价格指数、就业人员和职工工 资、人口、国内贸易、对外经济贸易、农业、工业等统计项目。我们所得到的城乡居民家庭人均收入及恩格尔系数、农产品生产价格指数、各地区居民消费指数及商 品零售价格指数、各地区按行业分城镇私营企业和个体就业人数、人民币汇率(年平均价)等等,这些数据我们都可以从统计局的统计结果中获得。国家就是通过统 计局人员对各类数据进行统计获取信

5、息,根据信息制定下一年度的工作发展方向。 除了国家需要统计,我们的日常生活也需要统计。买股票,需要对历史的数据进行分析总结得出变化趋势;理财,需要对储蓄和消费进行合理的规划;天气预报,需 要到对卫星收集来的数据进行分析得出未来变换趋势;农作物的收成,可以对历史年份产量统计求平均数获得一般收成量近似求出;选择旅游路线,需要对多种路线 的路况、历程进行分析获得最优路线可以说统计在运用到我们生活的各个方面。作为学生,我们身边也有很多易于发现的事运用了统计。我们的总成绩、平均成绩、学籍管理、经常参加的发放调查问卷、那个食堂的饭菜好吃、哪里买东西便宜等等都运用到了统计,统计可以说无处不在。 1.平均数与

6、标准差的互补我们知道:平均数反映的是现象的集中趋势,是现象的一致性结果。而标准差是现象的离中趋势,反映了现象差异性的变化。这两个指标从不同角度描述了现实中事物的对立和统一的情形。例如:银行办理业务事项。银行提高服务质量的重点是顾客的等待时间,在工作人员(或窗口)一定的条件下提高银行的服务质量,实际上就是如何缩短顾客的等待时间(平均数)和减少顾客等待时间的差异(标准差)。在缩短顾客的等待时间上,要求银行的工作人员有熟练的业务技巧,使处理的每一笔业务尽可能地在短时间内完成,从而提高整个银行的服务质量。在这一点上,银行改变了原来由顾客填写单据而造成的不必要的时间上的浪费,也对减少顾客服务时间、减少顾

7、客重复排队和减少顾客或因不了解业务而产主的尴尬,在减少顾客等待的时间差异上来说,就需要银行在管理手段上引入更好的机制。现在银行已经采用了叫号的方法,每个顾客来到银行后,先在窗口上领一个号,然后,坐在有电视、茶水、报纸旁的座位上等待服务。这种将顾客分别站在每一个窗口等待办理业务改变为顾客都在同一等待线上等待办理业务的做法,从实现和心理两个方面,减少了顾客等待时间上的差异。首先,以前顾客来到银行后,看到每个窗口都排了很长的队,不知道选择哪个队,可能会离开或者等下次再来。也许留下来的顾客很可能因不知道前面顾客的业务量大小而选择了需要等待时间较长的队,造成排在其他队比他后来的顾客先行办理完业务。这时,

8、本来就因排队而厌烦的顾客又因“错”排了队,而使等待的时问相对较长,所形成的心理上的抱怨就会形成对银行服务质量不好。工作效率不高的印象。其次,采用叫号的方法,实际上等于每位顾客在不同的窗口都排了队,使大家的平均等待时间一致,从而减少了顾客被服务的差异,让每位顾客都在平等的地位上接受平等的服务。事实上,顾客在等待的时间上并没有改变。只是大家等待的时间不是凭运气而是更平等,即减少了差异。同样,对于工厂生产的产品在市场的占有率上,除了提高产品的质量(平均数)使产品的平均水平上一个档次外,还应该在花样品种方面(标准差)下功夫,不断增加自己产品的品种,同时也使自己的产品与其他同行业产品有一定差异。可以说,

9、形成差异产品是产品具有市场占有率的关键所在。 2在经济管理决策中的应用在进行经济管理决策之前,往往存在不确定的随机因素,从而所作的决策有一定的风险,只有正确、科学的决策才能达到以最小的成本获得最大的安全保障的总目标,才能尽可能节约成本。利用概率统计知识可以获得合理的决策,从而实现这个目标。下面以数学期望、方差等数字特征为例说明它在经济管理决策中的应用。例1 某人有一笔资金,可投入三个项目:房产x 、地产y 和商业z ,其收益和市场状态有关,若把未来市场划分为好、中、差三个等级,其发生的概率分别为p1 = 0. 2 , p2 = 0. 7 , p3 = 0. 1 ,根据市场调研的情况可知不同等级

10、状态下各种投资的年收益(万元) ,见表1 :请问:该投资者如何投资好?解:我们先考察数学期望, e(x)=110.2+30.7+(-3)0.1=4.0 , e(y)=60.2+40.7+(-1)0.1=3.9 ,e (z)=100.2+20.7+(-2)0.1 = 3.2 根据数学期望可知,投资房产的平均收益最大,可能选择房产,但投资也要考虑风险,我们再来考虑它们的方差:d(x)=(11-4)20.2+(3-4)20.7+(-3-4)20.1 = 15.4d(y)=(6-3.9)20.2+(4-3.9)20.7+(-1-3.9)20.1 = 3.29d(z)=(10-3.2)20.2+(2-3

11、.2)20.7 +(-2-3.2)20.1 = 12.96因为方差愈大,则收益的波动大,从而风险也大,所以从方差看,投资房产的风险比投资地产的风险大得多,若收益与风险综合权衡,该投资者还是应该选择投资地产为好,虽然平均收益少0.1万元,但风险要小一半以上。3 在经济损失估计中的应用随着经济建设的高速发展,火灾、车祸等各种意外事故所造成的经济损失成明显上升的趋势,从而买保险成为各单位及个人分担经济损失的一种有效方法。利用统计知识可以估计各种意外事故发生的可能性以及发生后导致的经济损失大小。下面以参数估计为例来说明它在这一方面的应用。例2 已知某仓库货物在储藏过程中,仓库货物因火灾而损失的金额服从

12、正态分布n (,2 ) ,今随机抽取8次货损资料,得到如下仓库货物损失金额表。解利用矩估计法或最大似然估计法可知:, 的矩估计量分别为: ,从而根据表2中的数据可计算出: (1000 2 + 2000 1 + 3000 4 + 5000 1)= 2625 (1000 - 2625) 2 2 + (2000 - 2625) 2 +(3000 - 2625) 2 4 + (5000 - 2625) 2 = 1101562. 5v 从而得到仓库货物损失的平均估计值为2625元,标准差的估计值为1049. 55 元。4 在求解最大经济利润问题中的应用如何获得最大利润是商界永远追求的目标,随机变量函数期

13、望的应用为此问题的解决提供了新的思路。例3 某公司经销某种原料,根据历史资料:这种原料的市场需求量x (单位:吨) 服从(300 ,500) 上的均匀分布,每售出1 吨该原料,公司可获利1. 5 千元;若积压1 吨,则公司损失0. 5 千元,问公司应该组织多少货源,可使期望的利润最大?分析:此问题的解决先是建立利润与需求量的函数,然后求利润的期望,从而得到利润关于货源的函数,最后利用求极值的方法得到答案。解:设公司组织该货源a 吨,则显然应该有300 a 500 ,又记y 为在a 吨货源的条件下的利润,则利润为需求量的函数,即y = g(x) ,由题设条件知:当x a 时,则此a 吨货源全部售

14、出,共获利1.5a ; x 2.2281 ,因此在显著性水平= 0.01 下回归方差是显著的。第三步,预测将x0=0.16 代入回归模型,则得到预测值为y0 = 28.536 + 130.60.16=49. 432 ,在显著性水平= 0.05 下,得y0的概率为0.95 的预测区间为(46.25 ,52.61) ,即有95 %的把握认为,碳的含量为0.16时,合金的强度介于(46.2552.61)之间。6 在经济保险问题中的应用目前,保险问题在我国是一个热点问题。保险公司为各企业、各单位和个人提供了各种各样的保险保障服务,人们总会预算某一业务对自己的利益有多大,会怀疑保险公司的大量赔偿是否会亏

15、本。下面以中心极限定理说明它在这一方面的应用。例5 已知在某人寿保险公司有2500个人参加保险,在一年里这些人死亡的概率为0.001 ,每人每年的头一天向保险公司交付保险费12元,死亡时家属可以从保险公司领取2000元保险金,求: (1)保险公司一年中获利不少于10000元的概率; (2) 保险公司亏本的概率。解设一年中死亡的人数为x ,死亡率为p =0.001 ,把考虑2500人在一年里是否死亡看成2500重bernoulli试验,则np=25000.001=2.5 ,np(1-p)=25000.0010.999=2.4975 ,保险公司每年收入为250012 = 30000 ,付出2000

16、 x 元,则根据中心极限定理得:(1) 所求概率为:p(30000-2000x 10000)=p(0x 2)= (-0.32)-(-1.58)=(1.58)-(0.32)= 0.9429-0.6255 = 0.3174。(2) 所求概率为:p (3000015)经上述计算可知一个保险公司亏本的概率几乎为0 ,这也是保险公司乐于开展业务的一个原因。上面只是列举了统计在实际问题中应用的几个小片段,然而,作为一门独立的学科,概率的足迹可以说已经深入到每一个领域,在实际问题中的应用随处可见。尤其随着科技飞速发展,知识产业化的今天。许多基础学科从幕后走到台前,概率的许多其他方面也正在或将要发挥它应有的作

17、用。诸如方差分析、回归分析等内容在医学,军事等领域都正在发挥它的最大作用。相信人类能够更好的“挖掘”统计的潜能,使之最大限度地为人类服务三数理统计的基本内容数理统计有许许多多的分支,内容十分丰富而广泛,但基本内容可分为两大部分:样本的采集和统计推理。. 样本的采集采集样本要根据研究的目的和要求,选择合理有效的抽样方案,科学的安排试验,最经济有效的取得数据资料,其中包括:() 抽样技术由于对随机现象进行所谓全面地观察几乎是不可能的,数理统计要对随机现象进行调查研究只能是非全面的观察,这样就要求在抽样观察中,保证样本的随机性和代表性。() 试验设计试验大致可分为三部分,第一,制定方案;第二,取得数

18、据;第三,对数据进行整理和分析。2.统计推断所谓统计推断就是由样本推断总体。例如,为了判断病人患有何种疾病,医生要从病人身上抽取一定量的血液进行化验,从化验的结果对病人患有何种疾病作出判断,等等。统计推断是数理统计的根本目的。它的基本问题也可分为两大类:统计估计和假设检验。() 统计估计,由样本观察值推断总体的分布函数、分布参数或数字特征,包括:参数估计总体的分布已知或未知,由样本观察值推断总体的参数值;非参数估计总体的分布未知,由样本观察值推断总体的分布。()假设检验由样本观察值检验关于总体分布,分布参数和数字特征等的各种统计假设,包括:参数假设已知总体的分布形式,对总体未知参数的假设。非参

19、数假设总体的分布未知,或不能用有限个参数表达的情况下,关于分布的一般性假设。例如,总体服从正太分布,两个总体同分布,等。四统计工作的重要性统计工作是一项通过搜集、汇总和计算统计数据对事物面貌和发展规律进行反映的重要工作,其对党政决策和国计民生影响巨大。目前,随着迅猛发展的经济社会和日益激化的市场竞争,统计工作不断拓展领域,其作为信息资源主体的统计数据获得了市场的依赖和需求以及领导和社会各界的关注。因此,我们只有真正把统计工作的重要性认识到位,做好统计人才的培养和统计手段的提高工作,才能够让统计的信息、咨询和监督作用最大限度地发挥出来。但随着经济结构的复杂化、利益主体的多元化,许多新情况、新问题

20、在统计工作中相继出现,使得统计信息失真的危险与日俱增,因此提高统计数据质量已成为当务之急。1.统计工作的重要性(1)统计工作的特点。从总体上看,统计具有两个明显的特点:一是数量性。其能够借助于数字某一事物在特定的时间和特定方面的数量特征,来帮助人们定量或定性分析这一事物,并正确地进行决策。二是综合性。从统计的整体信息来看,其涉及到的国民经济社会、文化、科技和人民生活的各个方面,也就是从微观到宏观的所有领域和环节。可以对不同的事物做有联系的综合性分析也可以进行横向对比,能总结过去预测未来。(2)重要性。作为统计制度,其主要包含两方面的内容:确立管理体制的运行方式、统计内容和计算方法。这取决于统计

21、的特性。当以个企业的一整套科学合理的统计工作制度建立完善起来之后,对企业而言,其作用主要有:一是对企业某一特定时间内的现状和动态的反映;二是对企业的规模和结构情况进行反映;三是对企业的生产效益、速度和效率进行反映;四是反映企业的诸多数量与质量特性;五是对该生产经营活动相关的各个方面进行反映。.当前统计工作存在的问题及原因(1)问题。一是统计数据的准确性不够。对统计工作的第一位的要求是数据的准确性。但现实中,一些单位不顾事实根据的实际情况,领导出数字,凭想象设计指标任务,进行数据虚构,出假数据或者有意瞒报数据、随意捏造数据,这些都对数据的准确性造成很大影响。二是统计数据的时效性差。因为在不同行业

22、或规模的单位或部门存在着会计核算和统计核算的差异很大,存在着很多指标的取得是很难从正常渠道获得,这些只能依靠统计人员自己关于统计制度的理解进行估算,加上统计数据是事后统计的,无法开展统计调查和分析,信息的时效性就很差了。三是统计数据的完整性欠缺。这主要是因遗漏统计调查单位、统计调查项目不完全、调查资料缺乏畅通的渠道和科学的统计方法等所导致。(2)原因分析:造成当前统计工作存在的问题的原因主要有:一是过分的行政干预。由于受各级政府目标管理任务的影响,统计数据一般都带上了很重的政治色彩。凡是涉及到本地或本单位、部门的利益或者政绩统计指标都被领导管理,大作数字文章。统计管理体制不具备抗干扰能力,统计

23、人员只得服从领导意志。二是缺乏一支高素质的统计人员队伍。统计基础不牢固,队伍不稳定,人员的业务素质不高的现象很普遍。三是统计台账不健全,填报的数据不真实。甚至有的还存在严重的虚报、瞒等现象。四是尚且不具备一个全社会支持统计工作的氛围,被调查对象不愿意提供统计信息,尤其是真实的数据信息。3.解决统计工作问题的对策(1)对现行统计管理体制进行改革。要在建立统计工作行政独立性的基础上,对现有统计机构的行政隶属关系进行改革,实行人、财、物垂直管理的统计机构管理体制,让统计机构真正为国家负责,让国家实行统一管理,为地方政府和企事业单位的强势统计服务,只有这样才能将各级政府和部门对统计数据的行政干预减少到

24、最低限度,才能有效地发挥出统计工作的整体性功能。(2)对现行的干部绩效考核机制进行完善。要按照“定性和定量”相结合的原则来制定各级领导干部工作绩效的考核、评价标准,将一套严谨、科学和规范的长效考核机制完善起来。对指标完成情况的考核的确定,要走群众路线,坚持客观、公正的评价原则,将随机抽样与群众测评有机结合,要对评价结果进行事后监督,严厉处罚那些弄虚作假和骗取名利者,杜绝那些 “数字出官”、“官出数字”等不良现象的发生。(3)要对统计制度方法进行完善。要认真甄别现行统计指标的使用价值,对那些已经过时或者没有多少使用价值的统计指标进行精简和合并,要将一些新的统计指标,如:反映经济与社会协调发展的指

25、标、全面小康社会和建设的指标和自主创新计指标增加进来。要对全面统计报表的频率适当减少,扩大抽样调查、重点调查、典型调查的覆盖面,进一步减少统计成本,不断完善国民经济核算制度,提高统计的可操作性。(4)要不断加大统计执法力度。一方面,大力开展统计有关法规的宣传活动,重点对单位和部门领导人进行宣传,另一方面,要进一步加大统计数据质量检查频率和统计执法力度,让法制与统计有机结合,以法治统计工作。五运用数理统计的方法对考试成绩的分析从两组数据(附表)中,只能看出成绩分布在60-90和60-85之间,不能看出其他信息。首先要对这些数据进行分组,编制出成绩的频数分布表。1.编制成绩频数分布表成绩频数分布表

26、就是把成绩(数据)分成若干组(小区间),编制出每个组内数据出现的频数的表格。通过求极差、确定组距i与组数r、确定分组区间、计算频数f等步骤、编制出频数分布表(表1): 表1 频数分布表 组别分组区间组中值频数 1(59.5,62.5)61122(62.5,65.5)64413(65.5,68.5)67254(68.5,71.5)70495.(71.5,74.5)736176(74.5,77.5)7613127(77.5,80.5)79928(80.5,83.5)82719(83.5,86.5)852110(86.5,89.5)88111(89.5,92.5)911合计 频数分布表将一堆杂乱无序

27、的数据排列成序,从表1中可以看出:(1)班成绩在74.5-77.5一组人数最多;(2)班成绩在71.5-74.5一组人数最多。还能看出各班分数的集中及差异大致情况。这时,我们已对分数的分布特征有了较直观的认识。要进一步发现和表示成绩的规律性,还需计算能够反映该组数据统计特征的数字-统计量。最常用的有两种:一是表现数据集中趋势的量算术平均数(平均分数);二是表现数据分散程度的量方差或标准差,有时也用变异系数。2.算术平均数 根据表中数据,经过计算,(1)班和(2)班数学的平均分数为:=75.9,=72.4 它表明,(1)班成绩集中在75.9分,二班成绩集中在72.4分.说明:(1)班学生学习数学

28、的整体水平高于(2)班。 我们也可算出两班全体学生的总平均分数:3. 离中趋势的度量(1)方差或标准差 n个数据称为这n个数据的方差。其中x是n个数据的算术平均数. 用s2来衡量一组数据波动大小, 即数据偏离平 均分数的大小. 当平均分数一定时 s 2 越大,说明这组数据波动越大,即这组数越分散或称离散程度大,反之亦然. 由于s2的单位是原数据单位的平方, 故常用方差的算术平方根:s= s2并称 s 为标准差. s 与原数据单位一致, 用 s 来刻画数据的散程度比 s 2 更 方便.我们先算出两个班成绩的方差, 再算出标准差. 因数据已分组,可用公式 其中:为估计平均数。 为第k组的组中值 为

29、第k组的实际频数 为总频数经计算,(1)班成绩的方差为,标准差;(2)班成绩的方差,标准差。从计算结果可以看出,()班学生的数学成绩比较分散,而()班学生的数学成绩就相对比较集中。(2)用两个班成绩的标准差来计算全体学生成绩的标准差由公式:式中: 为第i个班的人数 为第i个班学生成绩的标准差 为第i个班学生成绩的平均分数 为全体学生成绩的总平均分数 为全体学生人数经计算,两个班全体学生数学成绩的标准差为(3)变异系数在比较两组数据时,如果平均分数不相等,就要用变异系数来进行比较。一组数据的标准差与平均数的百分比称为改组数据的变异系数,记为。公式为:cv=计算两个班数学成绩的变异系数分别为:=,。由此可见,(1)班成绩的差异程度略高于(2)班。考试成绩的频数分布大多数是正态分布或近似正态分布,有时也出现偏态分布,这时需要对分布进行正态的转换。为了进一步对成绩进行分析,我们要检验分布是否为正态分布。4.成绩频数分布为正态的拟合度检验(1)方法介绍拟合度就是吻合度,拟合度检验是指理论曲线与实际观察曲线相吻合的程度,对于正态总体的方差进行假设检验时常用方法是检验,包括:双侧检验法和单侧检验法。()检验过程我们对(1)班成绩的频数分布进行检验。设其中为未知参数,的极大似然估计分别为。由前文资料,在成立的条件下,查标准正态分布函数值表得: 同理: 再有可算出及值(表2):

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论