版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
PAGE3PAGE11《应用统计学—基于SPSS》教案首页课程名称应用统计学课程编号总学时数总学时64理论学时32实践学时32学分数4课程类型必修课()校级公共课(√)专业课()基础课或专业基础课选修课()限选课()任选课授课年级专业班级2020级大数据工程1-5班授课方式讲授、课堂讨论、案例分析、实践课题写作考核方式(√)考试()考查教学目标及基本要求掌握应用统计学的基本概述、数据图表绘制、数据特征的统计描述、统计量和抽样分布、参数估计、假设检验、方差分析、非参数检验、相关与回归分析、多元统计分析和时间序列分析与预测等知识模块。同时,培养学生掌握基本的创新方法、具有追求创新的态度和意识,能够独立思考、分析问题,能够利用统计分析工具解决实际问题的能力;并且培养学生具有一定的统计分析能力、团队协作的精神以及适应信息化社会要求的自学能力和获取新知识、新技术的能力。该课程的考核方法为“考试”,总分100分。平时成绩占10%(根据出勤情况、课堂表现),作业完成、随堂测验30%,期末试卷占60%。教材名称应用统计学—基于SPSS作者向守超出版社西安电子科技大学出版社出版时间2023年1月参考书1.作者及书名《SPSS统计分析与应用》李金德,秦晶出版社及出版时间清华大学出版社20192.作者及书名《SPSS数据统计与分析应用》刘江涛出版社及出版时间清华大学出版社20173.作者及书名《应用统计学(第3版)》张建同,孙昌言出版社及出版时间清华大学出版社2010授课教师向守超职称教授系部信息工程学院授课学期2022~2023学年第2学期目录任务1.1走进统计学 3任务1.2数据收集 6任务1.3介绍SPSS软件 10任务2.1绘制定性数据图表 13任务2.2绘制定量数据图表 15任务3.1描述数据的中心趋势 19任务3.2描述数据的离散程度 22任务4.1了解样本与统计量的概念和关系 25任务4.2掌握常用的抽样分布 27任务5.1点估计 31任务5.2单个总体参数的区间估计 34任务5.3双总体参数的区间估计 37任务5.4样本量的确定 41任务6.1了解假设检验思想 43任务6.2单个正态总体的假设检验 46任务6.3双总体假设检验 51任务7.1掌握方差分析概述 55任务7.2实现单因素方差分析 57任务7.3实现双因素方差分析 61任务7.4实现协方差分析 64任务7.5实现重复测量方差分析 66任务8.1实现双因素方差分析 68任务8.1实现双因素方差分析 68任务8.1实现双因素方差分析 69任务8.1实现双因素方差分析 70任务8.1实现双因素方差分析 71任务1.1走进统计学章节及名称项目1认识应用统计学(任务1.1走进统计学)学时1教学目的与要求知识目标:1.统计学的概念、产生和发展、基本术语以及应用2.统计变量的类型3.数据的来源与收集方法4.SPSS统计软件的安装和使用。能力目标:1.掌握统计学涉及的基本术语2.掌握统计变量的分类3.了解统计数据的收集方法和手段4.掌握SPSS统计工具的使用教学重点与难点重点:1.统计变量的类型2.数据的来源与收集方法难点:1.数据的来源与收集方法2.SPSS统计软件的安装和使用教学方法与手段1.方法:项目制教学、案例式教学、启发式教学、实践型教学。2.教具:多媒体教室,教学做一体化教学多媒体教室,教学做一体化教学教学内容提要与时间分配内容提要辅助手段【课程导入】应用统计学是一门研究客观现象总体数量特征的方法论课程,具有数量性、综合性、应用性和实践性等特征。涵盖了现代统计的基本概念、基本理论与基本方法,为收集统计信息、应用统计方法、进行统计决策等企业应用奠定了必要的专业基础。本项目详细解读了应用统计学涉及到的基本概念,介绍收集统计数据的各种常用方法和SPSS统计分析工具使用。【任务描述】统计学是通过搜索、录入、整理、分析、描述数据等手段,以达到推断所测对象的本质,甚至预测对象未来的一门综合性科学。本任务学习了统计学基本概念,对统计学的发展过程进行了初步了解,重点理解了应用统计学中涉及到的几个重要术语和统计学里面数据类型的分类。【讲授内容】一、统计学概念1.统计(Statistics)一词经常出现在各种社会实践活动和科学研究领域中,它包括三个方面的含义:统计工作(或统计活动)、统计资料和统计学。2.统计学的基本特点主要有总体性、数量性、客观性、随机性、广泛性。3.从方法的功能来看,统计学可以分为描述统计学(Descriptivestatistics)和推断统计学(Inferentialstatistics);从方法研究的角度来看,统计学可分为理论统计学(Theoreticalstatistics)(即数理统计学,Mathematicalstatistics)和应用统计学(Appliedstatistics)。二、统计学的产生和发展从统计学产生和发展的过程来看,大致可以分为古典统计学、近代统计学和现代统计学三个时期。1.古典统计学阶段17世纪中叶到18世纪中叶是古典统计学阶段,当时主要有政治算术学派和国势学派。政治算术学派产生于17世纪中叶的英国,主要代表人物是威廉·配弟(WilliamPetty,1623~1687)。2.近代统计学阶段近代统计学阶段是18世纪末到19世纪末。该阶段的主要贡献是建立和完善了统计学的理论体系,并逐步形成了以随机现象的推断统计为主要内容的数理统计学和以传统的治经济现象描述为主要内容的社会统计学。3.现代统计学阶段从19世纪末开始,统计学进入现代统计学阶段。在这个阶段,数理统计学与社会统计学逐步融合成为统一的现代统计学。“数理统计”是统计学在第三个发展阶段所形成的所有收集和分析数据的新方法的一个综合性名词。三、统计学的基本术语1.总体与个体总体(population)是包含研究对象全体的集合,组成总体的每个元素称为个体(individual)。2.样本与样本量样本(sample)是从总体中抽取的一部分元素的集合,构成样本的元素的数目称为样本量(samplesize)。3.参数参数(parameter)是用来描述总体特征的概括性数字度量,它是人们想要了解的总体的某种特征值。4.统计量统计量(statistic)是用来描述样本特征的概括性度量。它是根据样本数据计算加工出来的一个量,由于抽样是随机的,因此统计量是样本的一个函数,它不依赖于任何的未知参数。5.标志与指标统计标志(statisticalcharacteristics)简称标志或标识,是总体单位所具有的属性或特征。标志是统计研究的起点,总体单位是标志的载体,统计研究往往从登记标志开始,进而反映总体单位的数量特征。四、统计变量的类型统计变量根据其所描述事物特征的不同,可以分为分类变量、顺序变量和数值型变量几种类型。应用度量水平是将数据分类的另一种方法。有4个普遍认可的度量水平:定类尺度、定序尺度、定距尺度和定比尺度。五、统计的广泛应用在科学研究的各个领域,如自然科学、经济学、社会学、体育、医疗卫生、环境保护等方面,都广泛使用统计学方法进行分析和推断。在下面列举的6种商务活动中,统计学有更广泛的应用,经营管理人员在作决策时通常需要应用统计方法来归纳分析各种统计资料。图1.2基于统计学的数据转换应用()板书()实物展示()投影片(√)电子教案(√)项目展示课后小结实训、作业备注任务1.2数据收集章节及名称项目1认识应用统计学(任务1.2数据收集)学时1教学目的与要求知识目标:1.统计学的概念、产生和发展、基本术语以及应用2.统计变量的类型3.数据的来源与收集方法4.SPSS统计软件的安装和使用。能力目标:1.掌握统计学涉及的基本术语2.掌握统计变量的分类3.了解统计数据的收集方法和手段4.掌握SPSS统计工具的使用教学重点与难点重点:1.统计变量的类型2.数据的来源与收集方法难点:1.数据的来源与收集方法2.SPSS统计软件的安装和使用教学方法与手段1.方法:项目制教学、案例式教学、启发式教学、实践型教学。2.教具:多媒体教室,教学做一体化教学多媒体教室,教学做一体化教学教学内容提要与时间分配内容提要辅助手段【课程导入】如何采集数据?【任务描述】收集数据是进行统计分析的前提和基础。收集数据的途径众多,可通过实验、观察、测量、调查等方法获得直接资料,也可通过文献检索、阅读等来获得间接资料。收集数据的过程中除了要注意资料的真实性和可靠性外,还要特别注意区分两类不同性质的资料。本任务主要讨论了数据的种类以及获取数据的多种调查方式,重点解读了抽样调查的知识点,调查问卷的制定和设计等内容。【讲授内容】一、数据来源从使用者的角度看,统计数据资料的来源主要有两个:一种是通过直接调查获得的原始数据,这是统计数据的直接来源,一般称为第一手或直接的统计数据;另一种是别人调查的数据,并对这些数据进行加工和汇总得到的数据,通常称为次级的或二手的或间接的统计数据。一切间接的统计数据都是从直接的、第一手数据转化而来的。1.统计调查统计调查是指根据统计研究预定的目的、要求和任务,运用科学的方法,有计划、有组织地收集统计资料的讨程。通过统计调查得到的数据,一般称为观测数据。2.实验法实验法是直接获得统计数据的又一重要来源。通过实验法得到的数据就是实验数据。二、普遍调查普遍调查简称普查,是专门组织的一次性的全面调查。如全国人口普查、能源普查、工业普查等。普查的组织方式一般有两种:一种是建立专门的普查机构,配备大量的普查人员;另一种是利用调查单位的原始记录和核算资料,发放调查表,由登记单位填报,如物资库存普查等。普查时必须注意以下几个原则。(1)规定统一的标准时点。标准时点是指对被调查对象登记时所依据的统一时点。(2)规定统一的普查期限。在普查范围内各调查单位或调查点尽可能同时进行登记。(3)规定普查的项目和指标。普查时必须按照统一规定的项目和指标进行登记,不准任意改变或增减,以免影响汇总和综合,降低资料质量。三、重点调查重点调查是专门组织的一种非全面调查,它是在总体中选择个别或部分重点单位进行调查,借以了解总体的基本情况。重点调查的特点如下:(1)重点调查适用于调查对象的标志值比较集中于某些单位的场合,这些单位的管理比较健全,统计力量比较充实,能够及时取得准确资料。(2)重点调查的目的在于了解总体现象某些方面的基本情况,而不要求全面准确地推算总体数字。(3)重点调查比实际调查的单位数量少,在满足调查目的所要求的前提下,可以比全面调查节省人力、物力和时间。四、典型调查典型调查是根据调查的目的,选择在同类对象中最具典型性的部分和个体进行调查。典型调查也是一种非全面调查。例如,选择中国某汽车企业作为国有企业改革调查分析的样板。典型调查的作用如下:(1)典型调查可用来研究新生事物。(2)典型调查可用来研究事物变化的规律。(3)典型调查可用来分析事物的不同类型,研究它们之间的差别和相互关系。(4)典型调查的资料可用来补充和验证全面统计的数字,推论和测算有关现象的总体。五、网上调查1.网上调查的主要方式1)E-mail法2)Web站点法3)Net-meeting法4)InternetPhone法5)网上观察法6)社交媒体法2.网上调查优势分析(1)及时性和共享性(2)便捷性和低成本(3)可靠性和客观性(4)更好的接触性(5)穿越时空性六、抽样调查抽样调查属于非全面调查的范畴,是按照科学的原理和计算,从若干单位组成的事物总体中,抽取部分样本单位来进行调查、观察,用得到的调查标志的数据代表总体、推断总体相应数量指标的一种统计分析方法。1.抽样调查的特点抽样调查数据之所以能用来代表和推断总体,主要是因为抽样调查本身具有其他非全面调查所不具备的特点,列举如下。2.抽样调查的应用领域抽样调查的应用领域主要在以下几个方面。3.抽样调查的误差与其他调查一样,抽样调查也会遇到调查的误差和偏误问题。在进行抽样调查时,应尽可能避免下列4种误差,以使抽样调查结果更好地反映总体特性。4.抽样调查方法的分类抽样方法按照抽取原则不同分为概率抽样方法和非概率抽样方法两类。概率抽样方法是根据已知概率抽取样本,样本抽取是随机的,主要包括有简单随机抽样、分层抽样、系统抽样、整群抽样和多阶段抽样等。非概率抽样方法是人为有意识地抽取样本,样本抽取不是随机的,例如方便抽样、判断抽样、滚雪球抽样和空间抽样等。七、制定调查方案问卷调查法也称问卷法,它是调查者以书面提出问题的方式收集资料的一种研究方去。即调查者就调查内容提出问题或编制成表格,通过各种方式分发或邮寄给有关人员,请他们填写答案,然后回收整理并进行统计和研究。为了使统计调查按照调查目的顺利进行,在组织调查之前,必须首先设计一个周密的调查方案。统计调查方案一般包括以下六个方面的内容。1.确定调查目的2.确定调查对象和调查单位3.确定调查项目4.确定调查的时间和地点5.选择调查方法6.制订调查的组织实施计划八、设计调查问卷一份完整的调香问卷应该包括标题、卷首语、正文、结束语四个部分。1.标题问卷的标题要与课题的研究目的相符合,直接点明调查的主题,使被调查者对所要回答的问题有一个大致的了解。问卷的标题要简明扼要,但又必须点明调查对象或调查主题。2.卷首语卷首语一般为给被调查者的短信,为其介绍和说明调查者的身份,调查的目的、意义、内容,篇幅宜短小,通常在300字以内,一般包括身份、调查目的与内容、对象选取和结果保密措施、致谢等。3.正文调查问卷的主要部分,也就是问题与答案部分。设计问卷正文时要先宏观后微观。具体来说,分为以下几步。第一步,确定调查目标。如:“我们要调查什么?”第二步,分解目标,确定子目标。如:“我们打算从哪几个方面来进行调查?”第三步,为各个子目标设计问题。如:“可以设计哪些问题来对子目标进行调查?”4.结束语一般是一小段话,内容是对被调查者的合作再次表示感谢以及不要漏填与复核的请求。结束语要简短明了,有的问卷也可以省略。()板书()实物展示()投影片(√)电子教案(√)项目展示课后小结实训、作业备注任务1.3介绍SPSS软件章节及名称项目1认识应用统计学(任务1.3介绍SPSS软件)学时2教学目的与要求知识目标:1.统计学的概念、产生和发展、基本术语以及应用2.统计变量的类型3.数据的来源与收集方法4.SPSS统计软件的安装和使用。能力目标:1.掌握统计学涉及的基本术语2.掌握统计变量的分类3.了解统计数据的收集方法和手段4.掌握SPSS统计工具的使用教学重点与难点重点:1.统计变量的类型2.数据的来源与收集方法难点:1.数据的来源与收集方法2.SPSS统计软件的安装和使用教学方法与手段1.方法:项目制教学、案例式教学、启发式教学、实践型教学。2.教具:多媒体教室,教学做一体化教学多媒体教室,教学做一体化教学教学内容提要与时间分配内容提要辅助手段【课程导入】问题:使用什么软件来完成数据分析?【任务描述】SPSS软件是世界上出现最早的统计分析软件,也是目前世界范围内应用最为广泛的专业统计软件之一,涉及众多领域,具有操作简便、编程方便、工具强大、针对性强等诸多优点。本任务主要介绍了SPSS软件的发展过程,SPSS软件运行多个界面窗口的介绍和SPSS软件的系统设置方法。【讲授内容】一、SPSS软件简介SPSS的英文即StatisticsPackageforSocialSciences,译为社会科学统计软件包。随着SPSS应用的不断广泛和深入,SPSS的英文变更为StatisticalProductandServiceSolutions,译为统计产品与服务解决方案。该软件是公认的世界上最早的统计分析软件,也是最优秀的统计分析软件包之一。作为统计分析工具,SPSS不仅功能强大、界面友好、交互性强,且理论严谨、内容丰富,数据管理、制表绘图、统计分析、趋势研究、文字处理等功能几乎无所不包。因而,SPSS也就成为世界上应用最广泛的专业统计软件,并不局限社会科学。SPSS包括常用的较为成熟的统计过程,提供从简单的统计描述到复杂的多因素统计分析等多种方法,比如数掘的探索性分析、列联表分析、偏相关分析、方差分析、非参数检验、回归分析、判别分析、因子分析、聚类分析、Logistic回归分析等,完全可以满足初学者的基本需要。二、SPSS软件窗口介绍SPSS软件运行过程中会出现多个界面窗口,各个界面窗口的用处及功能不同。其中,最主要的界面窗口有四个,即数据编辑窗口、结果输出窗口、脚本窗口和语法窗口。数据编辑窗口、结果输出窗口和语法窗口是最常用的。1.数据编辑窗口用户启动SPSS后看到的窗口便是数据编辑窗口,如图1.3所示。在数据编辑窗口中,用户可以进行数据的录入、编辑以及变量属性的定义和编辑等操作,该窗口是SPSS的基本界面,主要由以下几部分构成:标题栏、菜单栏、工具栏、编辑栏、变量栏、观测序号、窗口切换标签和状态栏。2.结果输出窗口启动SPSS软件后,若对数据进行某项统计分析,结果输出窗口将被自动调出。在SPSS中,大多数统计分析结果都将以表或图的形式在结果输出窗口中显示,如图1.6所示。3.语法窗口语法窗口也称语法编辑器,如图1.8所示.SPSS最大的优势在于操作的简便性,即它是菜单对话框式的操作。但是为了满足高级数据分析人员的工作需求,SPSS还提供了语法方式或程序方式对数据进行分析。该方法既是对菜单功能的一个补充,也可以使烦琐的工作得到简化,尤其适用于高级分析人员。三、SPSS软件系统设置在结束SPSS25.0的安装过程之后,首先要通过【选项】对话框设置系统的默认值和初始状态。从【编辑】菜单中选择【选项】菜单,然后打开【选项】对话框。该对话框共有12个选项卡,分别为【常规】、【语言】、【查看器】、【数据】、【货币】、【输出】、【图表】、【透视表】、【文件位置】、【脚本】、【多重插补】和【语法编辑器】。下面就几个主要的选项设置进行解读。1.常规功能设置【常规】选项卡中列出了一般性选项,在【常规】选项卡中可以设置相关的功能参数,如图1.9所示。2.查看器功能设置【查看器】选项卡提供了输出标签窗口显示时的信息、图标、字体等选项,方便用户根据需要定义输出窗口,充分展现了SPSS软件的人性化设计。【查看器】选项卡如图1.10所示。3.设置有关数据的参数打开【数据】选项卡,在此可以设置数据的各种参数,如图1.11所示。4.设置自定义数值型变量的格式【货币】选项卡用于自定义数值型变量格式,在此可以设置数值型变量输出格式的各种参数,如图1.12所示。5.设置输出的参数通过【输出】选项卡可以设定一些参数,当输出结果与要点表的时候,使变量值与变量标签一起输出,如图1.13所示。6.设置图表的参数【图表】选项卡用于设置图形输出格式,在该选项卡上可以设置图表输出时的各种参数,如图1.14所示。7.设置输出表格的参数【透视表】选项卡用于设置输出表格的格式,可以设置新的表格输出外观。SPSS25.0提供了多种形式的透视表样板,在此处选定一种透视表样板,以后生成的一切表格都将以此种格式输出。如图1.15所示。()板书()实物展示()投影片(√)电子教案(√)项目展示课后小结实训、作业备注任务2.1绘制定性数据图表章节及名称项目2绘制统计图表(任务2.1绘制定性数据图表)学时2教学目的与要求知识目标:1.1次数分布表1.2条形图1.3饼形图1.4帕累托图能力目标:掌握定性数据的整理与展示教学重点与难点重点:条形图、帕累托图难点:条形图、帕累托图教学方法与手段1.方法:项目制教学、案例式教学、启发式教学、实践型教学。2.教具:多媒体教室,教学做一体化教学多媒体教室,教学做一体化教学教学内容提要与时间分配内容提要辅助手段【课程导入】问题:【任务描述】统计学上的定性数据(qualitativedata)包括分类数据和顺序数据,它是一组表示事物性质,规定事物类别的文字描述型数据,不能将其量化,只能对其定性。本任务主要对分类数据图表的绘制进行解读,包括次数分布表、条形图、饼形图和帕累托图的绘制。【讲授内容】一、次数分布表次数分布表(frequencytable)就是按照一定的规则把一组数据划分为不同的范围或区间,然后计数出数据落入各区间的个数,这些个数就是次数(或频数),以表格形式表示的一个有规律的统计表。次数分布表也称为频数分布表,具有如下特点。1.次数(或频数)是指落在各类(组)别中的单位个数。2.把各个类别及相应的次数全部列出来就是次数分布或频数分布(frequencydistribution),以表格形式表现就是次激分布表或频数分布表。3.百分比或频率(percentage)是各组的次数占总次数的比重,又称为比例(proportion),它反映总体的结构。不同的类别可进行比较。4.累积次数(cumulativefrequencies)即将各类别的次数逐级累加起来。通常有以下两种累积方式。(1)向上累积:从数据小的观察值向数据大的观察值的累加次数,表示上限以下的次数或比重。(2)向下累积:从数据大的观察值向数据小的观察值累加次数,表示下限以上的次数或比重。二、条形图条形图(BarChart)是用条带的长短或高低来表示数据指标大小的图形,用于性质相似的间断资料的比较,具有简洁、明快的特点。可以分为3种类型,包括简单条形图,用来表达单个指标的大小;簇状条形图表示两个或多个指标的大小;堆积条形图表示每个指标条形图中某个因素的构成情况。三、饼形图饼形图(piechart)也称饼图,就是把一个圆饼面积看作100%,以圆心为顶点分割成若干扇形,以这些扇形面积占圆饼面积的百分比来表示一个数据系列中各项的大小与总额(各项总和)的比例,用于直观显示总额各个部分的构成比例情况,通常用不同颜色来区分各个扇形。按照需要,饼形图可以以二维或三维格式显示,也可以把有关扇形分离而突出显示。饼形图具有以下特点:(1)以圆形及圆内扇形的面积表示数值大小;(2)表示总体中各组成部分所占比例;(3)适用于研究结构性问题。四、帕累托图帕累托图(ParetoChart)是根据不同类别的数据其频率降序排列的,并在同一张图中画出累积百分比。帕累托图可以体现帕累托原则:数据的绝大部分存在于很少的类别中,极少剩余的数据分散在大部分类别中。这两组经常被称为“至关重要的极少数”和“微不足道的大多数”。帕累托图能区分“微不足道的大多数”和“至关重要的极少数”,从而方便人们关注重要的类别。帕累托图是进行优化和改进的有效工具,尤其是在质量检测方面。下面通过一个例子说明帕累托图的用法。()板书()实物展示()投影片(√)电子教案(√)项目展示课后小结实训、作业备注任务2.2绘制定量数据图表章节及名称项目2绘制统计图表(任务2.2绘制定量数据图表)学时2教学目的与要求知识目标:2.1茎叶图2.2定量数据的分组与制表2.3直方图2.4折线图2.5面积图2.6箱图2.7散点图2.8盘高盘低图2.9列联表2.10时间序列图能力目标:掌握定量数据的整理与展示教学重点与难点重点:1.定量数据的分组与制表2.折线图、散点图难点:1.茎叶图2.盘高盘低图、箱图3.列联表和时间序列图教学方法与手段1.方法:项目制教学、案例式教学、启发式教学、实践型教学。2.教具:多媒体教室,教学做一体化教学多媒体教室,教学做一体化教学教学内容提要与时间分配内容提要辅助手段【课程导入】问题:【任务描述】定量数据(quantitativedata)是指以数量形式存在着的属性,并因此可以对其进行测量。以物理量为例,距离、质量、时间等都是定量属性。本任务主要对定量数据图表的绘制进行解读,包括茎叶图、直方图、折线图、面积图、箱图、散点图和盘高盘低图等的绘制。【讲授内容】一、茎叶图茎叶图(stem-and-leafplot)就是将数据分成几组(称为茎),每组中数据的值(称为叶)放置在每行的右边。结果可以显示出数据是如何分布的,以及数据中心在哪里。为了制作茎叶图,可以将整数作为茎,把小数化整作为叶,例如,数值5.40,它的茎是5,叶是4;也可以将数据的十位数作为茎,个位数作为叶,例如,数值34,它的茎是3,叶是4。二、定量数据的分组与制表在整理定量数据时,通常要进行数据分组(统计分组),分组后再计算出各组中出现的次数,形成表格。根据每组中数据的多少可以分为单项式分组和组距分组两种。单项式分组又称为单变量分组,适用于离散变量且变量值比较少的情况,把每一个变量值作为一组,例如表2.4所示。1.组距分组的步骤1)计算取值范围取值范围(全距)R为最大数值与最小数值之差。2)确定组数为了清晰反映数据的整体分布特征,分组的数量不应过多,也不能过少。分组过多将无法揭示数据整体分布的主要特征,分组过少则会丢失许多重要的信息。恰当的分组既能反映各组之间的主要差异,又不致丢失重要的信息。通常分组数在5~15之间为宜。3)确定各组的组距同一组上限与下限间的绝对距离称为组距,组距d=上限-下限。设K为组数,组距d=R/K。为便于计算,组距宜取5或10的倍数。第一组的下限应低于最小变量值,最后组的上限应高于最大变量值。4)确定组限组限即各组区间的上、下限。确定各组区间的上限和下限时,应保证各组之间既不重叠,又不能遗漏任一数据,使每一个数据都属于某一确定的分组。当分组变量为整数变量时,相邻组的上、下限不应重合,当分组变量为连续型变量时,两个相邻分组的上、下限可以相同,但应指明是上限包含在内还是下限包含在内。5)根据分组整理成次数分布表将原始数据按照各自数值的大小分配到各组中,汇总成次数分布表,如表2.5所示。2.组中值的概念组中值是上下限之间的中点数值,反映各组数值一般水平的数值。组中值的计算分为闭口组组中值的计算和开口组组中值的计算。闭口组组中值的计算:闭口组组中值=(上限+下限)/2开口组组中值的计算:最高组上限=最高组下限+邻组的组距最低组下限=最低组上限-邻组的组距组中值=(上限+下限)/2三、直方图直方图(histogram)是运用连续排列的条形图面积来放映数据的,它是以各组组距为宽,以次数为高,表示次数分布状态的统计图,直方图是对于定量数据而言的。在直方图中,各矩形的面积表示各组段的频数,各矩形面积的总和为总频数,适合于表示连续型资料的频数分布。绘制正态曲线的直方图与条形图十分相似,它们的区别在于,直方图条带的长度和宽度都有具体含义,而条形图则没有。四、折线图折线图(linechart)是显示时间序列数据,反映事物发展变化规律和趋势的图。通常以时间为横轴,数据为纵轴作散点图并以折线相连,以折线的上升或下降来表示统计数量的增减变化的统计图,叫做折线统计图,简称折线图。与条形图相比,折线图不仅可以表示数量的多少,而且可以反映同一事物在不同时间里的发展变化情况。折线图分为3种类型:简单线图,由一条折线表示某个现象的变化趋势;多线线图,用多条折线表示各种现象的变化趋热;垂直线图,反映某些现象在同一时期内的差距。和条形图一样,在SPSS中可以组合绘制9种不同的线图。五、面积图面积图(areachart)又称为区域图,是指用线段下的阴影面积来强调现象变化的一种统计图。在SPSS中提供了简单面积图和堆积面积图两种类型。简单面积图(simpleareachart)用一条线来连接一系列点,每个点对应一个类别、测值或变量,在这条线下的区域为阴影状,该区域(或面积)的变化表示某一现象变动的趋势。堆积面积图(slackedareachart)则使用两条或更多的线来连接一系列点,每条线下的阴影都有所区别,用不同的面积表示多种现象变化的趋势。同样,SPSS提供了3种模式,【个案组摘要】为系统默认选项,表示个案分组模式,即根据分组变量对所有个案进行分组,然后根据分组后的个案数据创建图形;【各个变量的摘要】选项即变量分组模式,能够描述多个变量,再根据变量类型建立图形;【个案值】选项即个案模式,选中此项,将以分组变量中观测值为单位生成图形。因此,在SPSS中可以组合生成6种类型的面积图。六、箱图箱图(BoxPlot)又称为箱形图,它是一种用来描述数据分布的统计图形,可以用来表现观测数据的中位数、四分位数和极值等描述性统计量。箱图包括简单箱图和簇状箱图两种类型。在SPSS中,简单箱图用于描述某个变量的数据分布;簇状箱图用于描述某个变量关于另一个变量的数据分布。在箱图中,SPSS提供了【个案组摘要】和【单独变量的摘要】两种模式。【个案组摘要】表示个案分组模式,【单独变量的摘要】选项表示分量分组模式。七、散点图散点图(ScatterDiagram)是以点的分布情况反映变量之间相关关系的一种统计图形,可以通过点的位置、分布走向和密集程度判断观测值的高低、大小、变动趋势或变化范围。SPSS提供了5种类型的散点图,包括简单散点图、矩阵散点图、简单点图、重叠散点图、和三维散点图。与其他几种图形不同的是,在散点图中没有提供图形模式。八、盘高盘低图盘高盘低图(Hight-LowChart)又称高低图,是一种利用直线、条带或阴影来描述数据在一段时间内的变化幅度的统计图形。高低图适合于描述每小时、每天、每周等时间段内不断波动的资料,可以说明某些现象在短时间内的变化,也可以说明它们的长期变化趋势,如股票、商品价格、外汇变动等信息。SPSS提供了5种类型高低图,即简单盘高-盘低-收盘图、简单范围条形图、簇状盘高-盘低-收盘图、簇状范围条形图和差别面积图。九、列联表列联表(Crosstabs)是将数据按两个或两个以上变量交叉分组得到的次数分布表,横轴表示一类变量,纵轴表示另一类变量,值位于横纵轴的交叉处,称为单元,用于分析变量之间的相互影响和关系,定性变量和分组后的定量变量均适用。根据列联表结构类型,每横纵轴组合单元包含频率、总值的百分比、横行的百分比或列的百分比。十、时间序列图时间序列图(timeseriesdiagram)是用来反映测量指标随时间的变化趋势的统计图形。用户可以利用时间序列图动态地认识事物的本质,研究几个时间序列之间的差别,认识时间序列的周期性并预测序列未来的走势等。SPSS统计软件共提供了4种形式的时间序列图:普通序列图、自相关序列图、偏相关序列图和互相关序列图。()板书()实物展示()投影片(√)电子教案(√)项目展示课后小结实训、作业备注任务3.1描述数据的中心趋势章节及名称项目3数据特征的统计描述(任务3.1描述数据的中心趋势)学时2教学目的与要求知识目标:1.1算术平均数1.2众数1.3中位数1.4四分位数1.5几何平均数能力目标:1.熟悉数据分布的特征2.掌握数据中心趋势、离散程度的指标描述3.理解数据分布形态的描述4.掌握用软件实现数据特征的计算教学重点与难点重点:众数、中位数和四分位数难点:众数、中位数和四分位数教学方法与手段1.方法:项目制教学、案例式教学、启发式教学、实践型教学。2.教具:多媒体教室,教学做一体化教学多媒体教室,教学做一体化教学教学内容提要与时间分配内容提要辅助手段【课程导入】问题:【任务描述】中心趋势是指一组数据向某一中心值靠拢的倾向,一般要寻找能反映数据一般水平的代表值或中心值。本任务重点介绍常用的5种度量中心趋势的指标,即算术平均数、中位数、众数、四分位数和几何平均数。【讲授内容】3.1.1算术平均数算术平均值(Arithmeticmean)就是一组数据的均值(mean),记为x,它反映了某变量所有取值的中心趋势或平均水平,是社会经济统计中广泛应用的一种综合性指标,是总体数量分布的一个重要特征。由于所掌握资料的形式不同,均值分为简单均值和加权均值两种计算方法。1.简单均值。当已知总体各单位标志值且标志值未经分组时采用该形式。其计算公式如下:x=1式中:xi表示总体中的第i个样本数据;n2.加权均值。当所依据的资料是在统计分组基础上所形成的变量数列资料时,宜采用该形式。其计算公式如下:x=x1f1+式中:n表示组数,xi表示各组组中值,f3.1.2众数众数(mode)就是分布数列中最常出现(频数或频率最大)的标志值,它能明确反映数据分布的中心趋势,记为Mo。3.1.3中位数中位数(median)是指将分布数列中各单位的标志值从小到大(或从大到小)顺序排列,位于中间位置的标志值,记为Me。当数据个数n为奇数时,中位数为处于(n+l)/2位置上的数值;数据3.1.4四分位数四分位数(quartile)将所有数据由小到大排列并分成四等分,处于三个分割点位置的数值。第一分位数(Q1)是指25%的数据小于它的值和75%的数据大于它的值。第二分位数(Q2)是中位数,即50%的数据小于它的值和50%的数据大于它的值。第三分位数(Q对于四分位数的计算,学术界没有一致认同的方法,通常可根据以下规则计算四分位数。规则1如果结果是整数,则四分位数等于该整数位置的数据。例如,样本容量为n=7,则第一分位数Q_1等于第(7+1)/4=2个数据。规则2如果结果是半数(如2.5,3.5等),则四分位数等于相邻有序数据的平均数。例如,样本容量n=9,第一分位数Q_1是第(9+1)/4=2.5个数据,即原有序数中第二个和第三个数据之间的平均值。规则3如果结果既不是整数又不是半数,结果取最接近的整数,并选数据。例如,样本容量n=10,第一分位数Q_1等于(10+1)/4=2.75个数据。取2.75为3,则使用原有序数中的第三个数据。3.1.5几何平均数几何平均数(Geometricmean)是n个数值连续乘积的n次方根,记为xg。当统计资料是各时期的增长率等前后期的两两比率数据(环比)3.1.6案例分析【例3.9】某学校随机抽取50名高三学生的身高数据统计如表3.7所示。试分析该50名学生的身高中心趋势分布特征。表3.7某学校50名高三学生的身高数据统计表(单位:cm)175172163157167176176175173157163175162167173177178178175176156168175165174164158176166177174165174176154168164168162164167178168174181181163165171175第一步:建立或打开数据文件后,从数据编辑器窗口中的菜单栏选择【分析】→【描述统计】→【频率】命令,即可打开【频率】对话框,如图3.4所示。图3.4【频率】对话框第二步:在左边的列表框中选择“身高”加入到【变量】列表框中。单击对话框右上角的【统计】按钮,弹出【频率:统计】对话框,如图3.5所示。()板书()实物展示()投影片(√)电子教案(√)项目展示课后小结实训、作业备注任务3.2描述数据的离散程度章节及名称项目3数据特征的统计描述(任务3.2描述数据的离散程度)学时2教学目的与要求知识目标:2.1极差2.2平均差2.3四分位差2.4方差和标准差2.5变异系数2.6协方差和相关系数能力目标:1.熟悉数据分布的特征2.掌握数据中心趋势、离散程度的指标描述3.理解数据分布形态的描述4.掌握用软件实现数据特征的计算教学重点与难点重点:1、平均差2、方差和标准差难点:1.变异系数2.偏度和峰度教学方法与手段1.方法:项目制教学、案例式教学、启发式教学、实践型教学。2.教具:多媒体教室,教学做一体化教学多媒体教室,教学做一体化教学教学内容提要与时间分配内容提要辅助手段【课程导入】问题:【任务描述】数据的离散程度是指一组数据远离中心值的程度,常用于考察数据分布的疏密程度。要分析总体的分布规律,仅了解中心趋势指标是不够的,还需要了解数据的离散程度或差异状况。几个总体可以有相同的均值,但取值情况却可能相差很大,如图3.7所示。本任务是掌握用来表示数据离散程度特征的变异指标。变异指标主要有:极差、平均差、标准差和变异系数等。【讲授内容】3.2.1极差极差(range)是数据中最大值和最小值之差,又称“全距”,记为R。其计算公式如下:R=最大标志值-最小标志值(3-11)显然,一组数据的差异越大,其极差也越大。3.2.2平均差平均差(averagedeviation)是各数据与其均值离差绝对值的算术平均数,又称平均离差,通常记为AD表示。对于未分组数据,一般用简单平均式,其数学公式如下:AD=3.2.3四分位差四分位差(quartiledeviation)主要用于测量数据的离散趋势。四分位差也称四分位内距,是第三四分位数和第一四分位数之差,记为Q,其计算公式为:Q=Q3-【例3.13】某车间有12个工人,其日产量由小到大依次排列为10,20,22,24,25,26,27,28,30,32,34,35,求其四分位差。3.2.4方差和标准差方差(variance)和标准差(standdeviation)是应用最为广泛的变异指标。标准差是方差的算术平方根,又称均方差,其量纲与均值相同。1.总体方差与总体标准差总体方差是总体中所有数据与其均值离差平方的算术平均值,记为σ2,总体标准差记为σ,其计算公式如下σ2=1ni=1n2.样本方差与样本标准差样本方差记为记为S2,样本标准差记为SS2=1n式中,n为样本容量;xi为样本观察值;x3.2.5变异系数变异系数也叫离散系数,是将全距、平均差或者标准差与平均指标进行对比得到的相对数,表现形式为无名数,常用百分数表示。离散系数包括全距系数、平均差系数和标准差系数三种。最常用的是标准差系数,是由标准方差除以算术平均值再乘以100%,用CV表示,其计算公式如下。CV=Sx3.2.6协方差和相关系数在前面项目任务中我们学会了使用散点图测试两数值变量间的关系,在这里我们介绍测试两数值变量联系的两种数值指标:协方差和相关系数。1.协方差协方差(covariance)测试了两数值变量(X和Y)的线性联系,表示为cov(X,Y)。其计算公式如下。covX,Y=i=1n式中,xi和yi分别是X和Y中的第i2.相关系数相关系数(correlationcoefficient)测定了两数值变量间的线性相关强度,相关系数的值从完全负相关-1到完全正相关+1。完全指散点图中所有的点连成一条直线,对于两数值变量总体,用希腊字母ρ作为相关系数的符号。3.3.1偏度偏度(skewness)是描述变量取值分布形态对称性的统计量,具体反映总体次数分布的偏斜方向和程度。偏态分布有右偏分布和左偏分布,当偏度值为0时,说明数据为对称分布,这时平均数、中位数、众数三者合而为一;当偏度值大于0时,表示变量取值右偏,在直方图中有一条长尾巴拖在右边,这时平均数、中位数、众数三者分开,其算术平均数在中位数右边,众数在中位数左边;当偏度值小于0时,表示数据取值左偏,即数据的长尾巴拖在左边,这时算术平均数在中位数左边,众数在中位数右边。3.3.2峰度峰度(kurtosis)是用来描述变量取值分布形态陡缓程度的统计量,是指分布图形的尖峰程度。当数据分布与标准正态分布的陡缓程度相同时,峰度值为0,为正态峰度,如图3.15中Ⅰ线;峰度值大于0说明数据的分布比标准正态分布更陡峭,为尖顶峰度,如图3.15中Ⅱ线;峰度值小于0说明数据的分布比标准正态分布更平缓,为平顶峰度,如图3.15中Ⅲ线。()板书()实物展示()投影片(√)电子教案(√)项目展示课后小结实训、作业备注任务4.1了解样本与统计量的概念和关系章节及名称项目4统计量与抽样分布(任务4.1了解样本与统计量的概念和关系)学时2教学目的与要求知识目标:1.1随机样本1.2用SPSS进行随机抽样1.3统计量能力目标:1.理解样本与统计量的概念和关系2.掌握统计量及其分布的概念3.理解常用的四种抽样分布及其查表使用方法4.在统计软件中应用相关理论教学重点与难点重点:1.用SPSS进行随机抽样2.SPSS软件验证数据分布难点:1、正态分布2、卡方分布教学方法与手段1.方法:项目制教学、案例式教学、启发式教学、实践型教学。2.教具:多媒体教室,教学做一体化教学多媒体教室,教学做一体化教学教学内容提要与时间分配内容提要辅助手段【课程导入】问题:【任务描述】推断统计方法中最大的特点是利用抽样调查的方法对总体的数量分布特征做出科学的推断,它既能适用于各种情况的统计分析,又能以较低的成本快速获得总体的分布信息,达到事半功倍的效果,还可以利用概率论的知识计算推断的误差,也可以用抽样调查的结果来验证全面调查的结果。本任务将介绍推断统计学的基本概念和基本原理。【讲授内容】4.1.1随机样本1.总体与样本在前面项目中介绍统计基本术语时,已经提到过总体和样本的概念。在统计学中,通常将所研究对象的全体称为总体,而将构成总体的每个单元称为个体。按总体所包含的个体数,可将总体分为有限总体和无限总体两类,具体应用中一般应根据实际情况来分析,通常将在一个合理时间内不能把全部个体一一列举出的总体视为无限总体。2.简单随机抽样所谓抽样,就是从总体中抽取部分个体进行观察,每抽取一个个体就相当于一次随机试验。称满足以下条件的抽样为简单随机抽样:(1)样本X1,X2,⋯,Xn中每一分量Xi(2)样本的每个分量Xi并称该样本为总体X的一个简单随机样本,简称样本。4.1.2用SPSS进行随机抽样在实际问题中,如果所研究的对象是有限总体,该总体中的所有个体都是已知的并且是可以对它们进行编号的,如企业的员工、一批产品,或企业客户档案中的客户等,就可以使用SPSS来帮助确定所需要抽取的样本,包括选择个案和复杂抽样两种。1.选择个案在实际统计分析中,有时并不需要对所有的个案进行统计分析,而只要求对某些符合特定条件的个案进行分析,此时就需要先选出这部分个案才能进行后续分析。条件可以是一个,例如只分析女性员工的数据,条件也可以不止一个,例如分析女性的、已婚的、且为业务部门员工的数据。从样本中选择部分个案,我们是利用【数据】菜单中的【选择个案】命令来完成的。4.1.3统计量设X1,X2,⋯,Xn,为总体X的一个样本,为一连续函数,若g中不含总体的未知参数,则称为一个统计量。设x1,x2,…,xn是样本X1,X2,⋯,Xn的一组观察值,则称g(x1()板书()实物展示()投影片(√)电子教案(√)项目展示课后小结实训、作业备注任务4.2掌握常用的抽样分布章节及名称项目4统计量与抽样分布(任务4.2掌握常用的抽样分布)学时2教学目的与要求知识目标:2.1正态分布2.2卡方分布2.3t分布2.4F分布 2.5SPSS软件验证数据分布能力目标:1.理解样本与统计量的概念和关系2.掌握统计量及其分布的概念3.理解常用的四种抽样分布及其查表使用方法4.在统计软件中应用相关理论教学重点与难点重点:1.用SPSS进行随机抽样2.SPSS软件验证数据分布难点:1、正态分布2、卡方分布3、t分布4、F分布 教学方法与手段1.方法:项目制教学、案例式教学、启发式教学、实践型教学。2.教具:多媒体教室,教学做一体化教学多媒体教室,教学做一体化教学教学内容提要与时间分配内容提要辅助手段【课程导入】问题:【任务描述】当总体的分布已知时,抽样分布就是确定的,然后要求出统计量的精确分布,通常情况下是比较困难的。但如果总体是正态总体,那么问题就可以得到解决。由中心极限定理可知,在现实生活中遇到的大多数总体的分布都近似于正态分布。本任务主要介绍四个常用的连续型随机变量的概率分布:正态分布、χ^2(卡方)分布、t分布以及F分布,以及它们在统计推断中占有的特殊地位。【讲授内容】4.2.1正态分布对于一个连续型随机变量来说,概率密度函数决定了其分布,不同的概率密度函数对应着不同的随机变量。下面的定义给出了正态分布的概率密度函数。若X是一个连续型随机变量,它的概率密度函数为φx=12π则称X服从均值为μ、方差为σ2的正态分布,记为X若X~X取值在均值周围1倍标准差的范围,即[μ-σ,μ+σ]内的概率为68.26%;X取值在均值周围2倍标准差的范围,即[μ-2σ,μ+2σ]内的概率为95.44%;X取值在均值周围3倍标准差的范围,即[μ-3σ,μ+3σ]内的概率为99.73%。3σ规则在实际工作中很有用,在质量管理中,稳定生产条件下的产品质量指标被认为是正态变量,通常以这一变量的样本值是否落在[μ-3σ,μ+3σ]之内作为判断生产是否正常的一个重要标志。工业生产中用到的控制图及一些产品的质量指数都是根据3σ规则制定的。4.2.2卡方分布χ2分布(chi-squaredistribution)是由阿贝(Abbe)于1863年首先提出的,后来由海尔墨特(Hermert)若n个随机变量X1,X2,…,Xn相互独立,且服从标准正态分布N(0,1),则称随机变量χ2=X12χ2=i=1n其中自由度n是指等式右边包含的随机变量的个数。图4.16给出了不同自由度的x2(1)χ2分布的变量值始终是正的(2)χ2分布的概率密度函数图是非对称的,并且随着自由度n的增加,图形右偏程度降低,越来越接近正态分布(3)χ2分布的数学期望和方差分别为Eχ2=n(4)可加性,若χ12~χ2(与正态分布一样,χ2分布下面介绍χ2分布的上侧a设随机变量χ2服从自由度为n的χ2分布,对于给定的a(0<a<1),若有Pχ2则称χa2(n)为χ4.2.3t分布1900年左右,统计学家开始觉得标准正态分布并不总是求概率的正确分布。在1908年,威廉∙希利∙戈赛特在用笔名“student”发表的论文里提出了一个新的分布叫作t分布(t-distribution)。t分布的定义和标准正态分布、卡方分布都有关系。设随机变量X~N(0,1),Y~χ2(n),且Xt=XY/n服从自由度是n的t分布,记作t~4.2.4F分布F分布是1924年英国统计学家罗纳德∙费希尔(Ronald.A.Fisher)爵士提出,并以其姓氏的第一个字母命名的。它是两个服从卡方分布的独立随机变量各除以其自由度后的比值的抽样分布,是一种非对称分布,且位置不可互换。F分布有着广泛的应用,如在方差分析、回归方程的显著性检验中都有着重要的地位设X~χ2n1F=Xn1服从自由度为(n1,n2)的F分布,记为4.2.5SPSS软件验证数据分布本节将介绍如何通过SPSS软件求解累积概率,这里的累积概率就是累积概率分布的函数值。累积概率分布(CDF,CumulativeDistributionFunction)的概念,可以理解为在概率论中学习过的概率分布函数(PDF,ProbabilityDistributionFunction):F(a)=P{X≤a}。以卡方分布累积概率的求解为例进行说明。()板书()实物展示()投影片(√)电子教案(√)项目展示课后小结实训、作业备注任务5.1点估计章节及名称项目5参数估计(任务5.1点估计)学时1教学目的与要求知识目标:1.1参数估计的基本原理1.2点估计的方法1.3估计量的评价标准能力目标:1.理解点估计和区间估计的定义2.掌握评价点估计的标准教学重点与难点重点:点估计的方法难点:评价点估计的标准教学方法与手段1.方法:项目制教学、案例式教学、启发式教学、实践型教学。2.教具:多媒体教室,教学做一体化教学多媒体教室,教学做一体化教学教学内容提要与时间分配内容提要辅助手段【课程导入】问题:【任务描述】在统计学中,点估计(pointestimation)是指以样本数据来估计总体参数,估计结果使用一个点的数值表示“最佳估计值”,因此称为点估计。由样本数据估计总体分布所含未知参数的真实值,所得到的值,称为估计值。本任务主要介绍参数估计的基本原理,掌握参数的点估计及其评价标准。【讲授内容】5.1.1参数估计的基本原理参数估计(parameterestimation)是统计推断的一种基本形式,是用样本统计量去估计总体的未知参数。参数估计问题是利用从总体抽样得到的信息来估计总体的某些参数或者总体的某些数字特征。参数估计的两个研究方向。(1)在已知总体分布类型的前提下,由样本信息估计出总体未知参数的近似值,从而近似估计总体分布。(2)有时关心的不是总体服从具体分布,而是关注总体的某些数字特征(如均值、方差等)。5.1.2点估计的方法设θ是总体X分布中的未知参数,θ=θ(X1,X2,⋯,Xn)是用X的样本X1,X2,⋯,由以上定义可知,参数θ的点估计问题,就是寻找合适的估计量θ(1.总体比例的点估计当总体的指标具有两种或多种属性(标志)时,具有某种属性(标志)的总体单位数在总体中所占的比重就称为总体比例,总体比例记为p。总体比例的点估计,也就是使用频率来估计概率,这是估计离散型总体概率分布的常用方法。2.总体均值和方差的点估计在大多数情况下,需要估计的参数是总体的均值μ和总体方差σ2。可以有许多不同的方法来构造总体均值μ和方差σ2的估计量,这里仅介绍一种最常用,而且通常也是效果最好的估计方法所谓数字特征法,就是指用样本的相应数字特征样本均值x和样本方差S25.1.3估计量的评价标准对总体未知参数的估计,除了以上介绍的数字特征法外,还有许多其他估计方法,如极大似然估计法等。对同一未知参数,使用不同方法得到的估计量可能是不同的。于是人们自然要问,究竟采用哪一种估计量更好呢?这就涉及对估计量的评价标准问题。下面介绍评价估计量优良性的三个最常用也是最重要的标准。1.无偏性无偏性(unbiasedness)的直观意义是没有系统性误差(非随机性偏差)。虽然每个可能样本的估计值不一定恰好等于未知总体参数,但如果经过多次抽样,各个估计值的平均数等于总体参数,即参数估计量的期望值与参数真值是相等的,这种性质称为无偏性,具有无偏性的估计量称为无偏估计量。2.有效性有效性(efficiency)是指估计量的方差大小。一个估计量无偏并不能说明它非常接近待估参数,因为无偏性表示估计量是在真值周围波动的一个数值,即无偏性表示估计值与真值间的平均差异为0,近似可以用估计值作为真值的一个代表。但无偏估计量只考虑估计值的平均结果是否等于待估参数的真值,而没有考虑每个可能值及其次数分布与待估参数真值之间的大小和离散程度。3.一致性由切比雪夫数定理可知,样本均值X依概率收敛于总体均值。一般地,我们也希望总体未知参数θ的估计量θ也具有此性质,这就是“一致性”的概念。一致估计可以保证参数估计的精确程度随样本容量n的增大而提高。由此可知,要减少估计的误差,就需要有足够的样本容量。切比雪夫定理已指出,对任何总体X,样本均值X是总体均值E(X)的一致估计;同样可以证明,样本方差S()板书()实物展示()投影片(√)电子教案(√)项目展示课后小结实训、作业备注任务5.2单个总体参数的区间估计章节及名称项目5参数估计(任务5.2单个总体参数的区间估计)学时1教学目的与要求知识目标:2.1区间估计2.2总体均值的区间估计2.3SPSS实现单总体均值的区间估计2.4总体比例的区间估计2.5总体方差的区间估计能力目标:1.理解置信区间的概念2.了解衡量估计量好坏的标准3.构造总体均值和总体比例的置信区间或区间估计教学重点与难点重点:1.总体均值的区间估计2.SPSS实现单总体均值的区间估计难点:1.总体比例的区间估计2.总体方差的区间估计教学方法与手段1.方法:项目制教学、案例式教学、启发式教学、实践型教学。2.教具:多媒体教室,教学做一体化教学多媒体教室,教学做一体化教学教学内容提要与时间分配内容提要辅助手段【课程导入】问题:【任务描述】前面任务中的点估计仅给出了未知参数的一个近似值,必然存在误差,因此人们显然还需要进一步了解对未知参数所作估计的误差范围。用统计学的术语来说,就是还要了解在一定的可信度下,未知参数θ的真值的某个可能范围,这就是参数估计的区间估计问题,这样的区间即所谓的置信区间。本任务将重点讲述单个正态总体均值和方差的区间估计;总体比例的区间估计;均值和比例置信区间估计中的样本容量确定;以及利用SPSS软件上机实现的内容。【讲授内容】5.2.1区间估计设θ为总体分布的未知参数,若由样本确定的两个统计量θ1和θ2,对于给定的概率Pθ1则称随机区间(θ1,θ2)为θ的置信度为1-a的置信区间(confidenceinterval),并称因统计量θ1和θ2都是随机变量,对于从总体中抽取的不同样本,θ1和θ2的取值是各不相同的,因此(θ1,θ2)是一个随机区间。式(5-6)的含义是θ的真值落在随机区间(θ1,θ2)内的概率为1-α5.2.2总体均值的区间估计1.方差σ2置信区间表示为[2.方差σ2置信度为1-[5.2.3SPSS实现单总体均值的区间估计5.2.4总体比例的区间估计总体比例的一般表达式为[p-za5.2.5总体方差的区间估计σ2的置信度为1-a[n-1()板书()实物展示()投影片(√)电子教案(√)项目展示课后小结实训、作业备注任务5.3双总体参数的区间估计章节及名称项目5参数估计(任务5.3双总体参数的区间估计)学时1教学目的与要求知识目标:3.1双总体均值差的区间估计3.2SPSS软件实现双总体均值差的区间估计3.3双总体方差比的区间估计3.4双总体比例差的区间估计3.5单侧置信限的估计能力目标:1.理解置信区间的概念2.了解衡量估计量好坏的标准3.构造总体均值和总体比例的置信区间或区间估计教学重点与难点重点:1.双总体均值差的区间估计2.SPSS软件实现双总体均值差的区间估计难点:1.双总体方差比的区间估计2.双总体比例差的区间估计3.单侧置信限的估计教学方法与手段1.方法:项目制教学、案例式教学、启发式教学、实践型教学。2.教具:多媒体教室,教学做一体化教学多媒体教室,教学做一体化教学教学内容提要与时间分配内容提要辅助手段【课程导入】问题:【任务描述】在许多实际问题中,还需要考察两个正态总体的均值或方差是否相等的问题。例如,在产品质量管理中,就需要了解在生产工艺、材料或操作方法等改变后,产品的某些质量指标是否也发生了变化;又如,许多统计推断方法是以两个或多个正态总体的方差相同为前提条件的,在运用这些方法之前就需要判断这些正态总体是否是同方差的。这类问题既可以用区间估计的方法,也可以田假设检验的方法加以解决。本任务介绍用区间估计的方法比较两个正态总体均值和方差的问题。【讲授内容】5.3.1双总体均值差的区间估计设总体X1~N(μ1,σ12),X2~N(μ2,1.两个总体方差σ12,根据中心极限定理,当两个样本量都足够大时,则两个样本的均值差x1-x2近似服从正态分布,且Z=x1与一个正态总体均值的区间估计类似,根据式(5-17)有两个正态总体均值差μ1-μx2.方差σ12,σ22在很多实际应用中,可以假设要比较的两个总体有相同的方差,这时可以联合两个样本的信息计算出一个共同的样本方差,以给出σ2的合并估计量SSω这时,两个样本均值之差经标准化后服从自由度为(n1+nt=x1因此,两个正态总体均值差出μ1-μx13.方差σ12,σ当两个样本容量都较大(≥30)时,由中心极限定理可知,这时无论两总体服从何种分布,随机变量Z=就近似服从N(0,1),故可得μ1-x1-两个正态总体均值差的置信区间的意义是:若μ1-μ2的置信下限大于零,就能以1-α的置信度判定μ1>μ5.3.2SPSS软件实现双总体均值差的区间估计5.3.3双总体方差比的区间估计在例5.10中假定两种轿车首次故障行驶里程数的方差是相等的,这一假定是否合理,可以通过对两正态总体方差比σ1由中心极限定理可知,随机变量F于是对给定的置信度1-PF1-由式(5-23)可解得σ12/(S1方差比置信区间的意义是:若置信下限大于1,则可以在1-α的置信度下判定σ12>σ25.3.4双总体比例差的区间估计在大样本的情况下,两个总体比例之差的区间估计原理与一个总体比例的区间估计相同。两个样本比例之差近似服从正态分布,而经标准化后,则服从标准正态分布,即z=因而我们可以建立π1-π[p1-p5.3.5单侧置信限的估计设θ为总体分布的未知参数,若由样本确定的统计量θ,对于给定的概率α,满足P{θ>则称随机区间(θ,∞)为θ的置信度为1类似的,若由样本确定的统计量θ,对于给定的概率α,满足P{θ<则称随机区间(-∞,θ)为θ的置信度为()板书()实物展示()投影片(√)电子教案(√)项目展示课后小结实训、作业备注任务5.4样本量的确定章节及名称项目5参数估计(任务5.4样本量的确定)学时1教学目的与要求知识目标:4.1估计总体均值时样本量的确定4.2估计总体比例时样本量的确定能力目标:掌握确定合适的样本量的方法教学重点与难点重点:1.估计总体均值时样本量的确定2.估计总体比例时样本量的确定难点:1.估计总体均值时样本量的确定2.估计总体比例时样本量的确定教学方法与手段1.方法:项目制教学、案例式教学、启发式教学、实践型教学。2.教具:多媒体教室,教学做一体化教学多媒体教室,教学做一体化教学教学内容提要与时间分配内容提要辅助手段【课程导入】问题:【任务描述】样本量,即调查研究必要的样本数量。在进行参数估计前首先应确定一个适合的样本量。那么应该选取多大的样本量呢?如果样本量太大,则不经济;如果样本量太小,则不能保证估计的精度。关于这一问题的讨论,本任务主要介绍估计总体均值时样本量的确定,和估计总体比例时样本量的确定两个部分。【讲授内容】5.4.1估计总体均值时样本量的确定在估计总体均值μ时样本量n的确定,应注意以下三个因素:(1)所希望达到的置信水平;(2)研究者能够承受的误差范围;(3)所研究总体标准差的估计。第一个要考虑的因素是置信水平,在前面的置信区间中,我们说过评价置信区间优劣的第一个因素是置信水平,所以通常情况下,置信水平都是事先确定的。置信水平越高,样本量越大。第二个因素是可容许误差,也就是在计算样本均值或样本比例的置信区间时,减去和加上的那个值。可容许误差越小,则要求样本量越大;反之,样本量越小。第三个因素是总体标准差,一般情况下,我们并不知道总体标准差,所以要对其进行估计。综上所述,在置信水平1-α下,估计总体均值μ(总体方差已知)所需的样本量n=(za式中d是最大可容许误差,也就是置信区间的半径。5.4.2估计总体比例时样本量的确定估计总体比例时样本量的确定,与估计总体均值时样本量的确定的过程基本一致,也有三方面因素需要注意:(1)所希望达到的置信水平;(2)研究者能够承受的误差范围;(3)所研究总体比例的估计。在置信水平1-α下,估计总体比例π时,所需的样本量n=()板书()实物展示()投影片(√)电子教案(√)项目展示课后小结实训、作业备注任务6.1了解假设检验思想章节及名称项目6假设检验(任务6.1了解假设检验思想)学时1教学目的与要求知识目标:1.假设检验原理和步骤2.假设检验中的两类错误能力目标:1.掌握假设检验的统计思想2.了解置信区间与假设检验的区别3.理解假设检验的假设形式、两类错误和显著性水平教学重点与难点重点:1.假设检验原理和步骤2.假设检验中的两类错误难点:1.假设检验原理和步骤2.假设检验中的两类错误教学方法与手段1.方法:项目制教学、案例式教学、启发式教学、实践型教学。2.教具:多媒体教室,教学做一体化教学多媒体教室,教学做一体化教学教学内容提要与时间分配内容提要辅助手段【课程导入】问题:【任务描述】假设检验是通过样本来决定是否拒绝某种假设的一套理论和方法。显著性检验是假设检验中最常用的一种方法,也是一种最基本的统计推断形式,其基本原理是先对总体的特征做出某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还是接受做出推断。常用的假设检验方法有Z检验、t检验、卡方检验、F检验等。本任务重点介绍假设检验的原理和步骤,以及假设检验中常出现的两类错误。【讲授内容】6.1.1假设检验的原理和步骤假设检验(hypothesistesting),又称统计假设检验,是用来判断样本与样本、样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。假设检验的基本思想是“小概率事件”原理,其统计推断方法是带有某种概率性质的反证法。小概率思想是指小概率事件在一次试验中基本上不会发生。反证法思想是先提出检验假设,再用适当的统计方法,利用小概率原理,确定假设是否成立。假设检验中所谓“小概率事件”,并非逻辑中的绝对矛盾,而是基于人们在实践中广泛采用的原则,即小概率事件在一次试验中是几乎不发生的,但概率小到什么程度才能算作“小概率事件”,显然,“小概率事件”的概率越小,否定原假设H0就越有说服力,常记这个概率值为α(0<α<1),称为检验的显著性水平(significancelevel)。对于不同的问题,检验的显著性水平α不一定相同,一般认为,事件发生的概率小于0.1、0.05或0.01等,即“小概率事件其基本原理和步骤分述如下1.提出一个原假设假设检验中采用的是类似于“反证法”的方法,因此需要提出一个假设,该假设通常是检验者希望推翻的假设(即检验者希望推翻的结论),称为原假设(nullhypothesis),记为H02.再提出一个备择假设通常是根据检验者希望出现的结论再提出一个与原假设H0对立的假设,称为备择假设(alternativehypothesis),记为H3.构造一个检验原假设H0假设检验是根据所得到的样本数据计算某一统计量的值,来对原假设是否成立做出推断的,因此需要构造一个用以检验原假设的统计量。构造统计量的原则是:该统计量应含有待检验参数的样本信息,当原假设为真时,该统计量就服从某一确定分布。4.给定一个小概率α,称为显著性水平任何统计推断结论都不可避免地会犯错误,显著性水平a是指当原假设H0为真时,检验结果却拒绝H0的概率,即犯“弃真”错误的概率。α通常取0.05,0.01等较小的值,给定显著性水平α就控制了犯“弃真”错误的概率,不犯5.确定原假设H0拒绝H0时统计量的取值范围称为H0的拒绝域(rejectionregion),拒绝域的边界点称为临界值(criticalvalue)。拒绝域由统计量的分布、给定的水平6.根据统计量的计算结果做出检验结论若统计量的观察值落入拒绝域,就拒绝H0,接受H1;否则不能拒绝H0。本例中若Z>Za,就拒绝H0,接受H1,并称在水平a下μ与μ6.1.2假设检验中的两类错误设Z为检验原假设H0的统计量,Za为临界值,则由水平P可知,根据检验结果所做的推断可能会犯以下两类错误。第一类错误:当H0为真时拒绝H0的错误,即“弃真”错误。记犯此类错误的概率为第二类错误:当H0不真时接受H0的错误,即“取伪”错误。记犯此类错误的概率为()板书()实物展示()投影片(√)电子教案(√)项目展示课后小结实训、作业备注任务6.2单个正态总体的假设检验章节及名称项目6假设检验(任务6.2单个正态总体的假设检验)学时1教学目的与要求知识目标:2.1总体均值的假设检验 2.2总体方差的假设检验 2.3总体比例的假设检验 2.4SPSS操作单样本T检验能力目标:1.掌握一个总体和两个总体参数假设检验的方法2.在SPSS统计软件中应用相关理论教学重点与难点重点:1.总体均值的假设检验2.SPSS操作单样本T检验难点:2.总体方差的假设检验 3.总体比例的假设检验教学方法与手段1.方法:项目制教学、案例式教学、启发式教学、实践型教学。2.教具:多媒体教室,教学做一体化教学多媒体教室,教学做一体化教学教学内容提要与时间分配内容提要辅助手段【课程导入】问题:【任务描述】在掌握了假设检验的基本概念和步骤的基础上,相信大家对总体参数的假设检验已有了初步的了解。本任务将继续介绍但单个总体均值、方差和比例等参数的假设检验。【讲授内容】6.2.1总体均值的假设检验以下假设X~N(μ,σ2),X1,H下面对几种不同的情况分别进行讨论。1.总体方差σ2已知(Z检验当H0Z=X由于当σ2已知时,检验使用的是服从标准正态分布的统计量Z检验,故这类检验也称为Z(1)H当H0P{|Z|>故当
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 新老教师结对培训制度
- 员工培训等管理制度
- 消防培训实操室管理制度
- 员工培训食堂管理制度
- 病理科质量管理培训制度
- 学校培训评估制度
- 评茶师操作测试考核试卷含答案
- 堆场机械维修工诚信道德强化考核试卷含答案
- 架线维护工创新实践知识考核试卷含答案
- 鞋类设计师安全生产能力竞赛考核试卷含答案
- 网络销售的专业知识培训课件
- 2024版国开法律事务专科《劳动与社会保障法》期末考试总题库
- 湖南省永州市2025届高一上数学期末学业质量监测模拟试题含解析
- 四川省南充市2024-2025学年高一数学上学期期末考试试题含解析
- CJJT 164-2011 盾构隧道管片质量检测技术标准
- 2024届高考语文复习:二元思辨类作文
- 《数字贸易学》教学大纲、二维码试题及答案
- 大锁孙天宇小品《时间都去哪了》台词剧本完整版-一年一度喜剧大赛
- 种子室内检验技术基础知识(种子质量检测技术课件)
- 智慧金库项目需求书
- DB41T 2397-2023 机关食堂反食品浪费管理规范
评论
0/150
提交评论