张丹数据分析课标解读_第1页
张丹数据分析课标解读_第2页
张丹数据分析课标解读_第3页
张丹数据分析课标解读_第4页
张丹数据分析课标解读_第5页
已阅读5页,还剩26页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第十章 统计与概率内容分析统计与概率的内容在新课程中得到了较大重视,成为了和数与代数、图形与几何、综合与实践并列的四部分内容,而统计则成为这一部分内容的重点。统计的核心是数据分析,“数据是信息的载体,这个载体包括数,也包括言语、信号、图像,凡是能够承载事物信息的东西都构成数据,而统计学就是通过这些载体来提取信息进行分析的科学和艺术” 史宁中.数学思想概论数量与数量关系的抽象M.东北师范大学出版社.2008(6).第147页。第一节 统计与概率课程的内容主线如前所述,核心概念是理解数学课程的基本线索,标准中将数据分析观念作为了核心概念,为理解这部分内容的主线提供了重要指导。在标准中,将数据分析观

2、念解释为:“了解在现实生活中有许多问题应当先做调查研究,收集数据,通过分析做出判断,体会数据中蕴涵着信息;了解对于同样的数据可以有多种分析的方法,需要根据问题的背景选择合适的方法;通过数据分析体验随机性,一方面对于同样的事情每次收集到的数据可能不同,另一方面只要有足够的数据就可能从中发现规律。数据分析是统计的核心。”基于这些阐述,可以将统计与概率课程的内容主线确定为如下几个方面。 一、数据分析过程使学生树立数据分析的观念,最有效地方法是使他们投入到数据分析的全过程中去。在此过程中,学生将不仅仅学习一些必要的知识和方法,同时将体会数据中蕴涵着信息,提高自己运用数据分析问题、解决问题的能力。为此,

3、标准在三个阶段都提出了相应的要求,这也成为了统计内容的首要主线。在第一学段中,提出“经历简单的数据收集和整理过程”;在第二学段中,提出“经历简单的收集、整理、描述和分析数据的过程(可使用计算器)”;在第三阶段中提出“经历收集、整理、描述和分析数据的活动,了解数据处理的过程;能用计算器处理较为复杂的数据”。从这些要求中不难看出:第一,数据分析的过程可以概括为:收集数据、整理数据、描述数据和分析数据。第二,学段的要求逐步深入。从第一学段到第三学段,随着年龄的增长,学生将逐步经历更加完整的数据分析过程;在要求上第一学段、第二学段都提出了经历“简单的”过程,第三学段则去掉了这个限制。第三,从第二学段开

4、始使用计算器来处理数据,第二学段可以使用计算器来处理数据,第三学段则要求能使用计算器。下面,我们以标准的例子来进一步体会这条主线的内涵及要求。在三个学段,标准都举了对全班同学的身高进行分析的例子,并且鼓励学生把每年测量身高的数据都保留下来,根据不同学段的特点对于数据进行整理、描述和分析,提取信息,从而经历数据分析的过程。具体阐述和要求如下。案例1 三个学段中对于数据分析过程的例子第一学段(标准例19):对全班同学的身高进行调查分析。说明 学校一般每年都要测量学生的身高,这为学习统计提供了很好的数据资源,因此这个问题可以贯穿第一学段和第二学段,根据不同学段的学生特点,要求可以有所不同。希望学生把

5、每年测量身高的数据都保留下来,养成保存资料的习惯。在第一学段,主要让学生感悟可以从数据中得到一些信息。第二学段(标准例38): 对全班同学的身高的数据进行整理和分析。说明 在上面的例子中,已经引导学生对全班同学的身高的数据进行初步分析。在这个学段中,要求学生结合以前积累的身高数据,进行进一步的整理,然后进行分析。整理的目的是为了便于分析,例如,条形统计图有利于直观了解不同高度段的学生数及其差异;扇形统计图有利于直观了解不同高度段的学生占全班学生的比例及其差异;折线统计图有利于直观了解几年来学生身高变化的情况,预测未来身高变化趋势。学生还可以讨论用什么数据来代表全班同学的身高,自己的身高在全班的

6、什么位置。第三学段(标准例70): 比较自己班级与别的班级同学的身高状况。说明对于两个班级学生身高状况比较,通常可以通过平均值来判断,但有时候仅仅通过平均数是不够的,如果一个班同学之间身高差异很大,而另一个班同学之间身高差异很小,即使前一个班的平均高一些,也不能说这个班的整体状况很好。因此,在判断身高状况时,不仅要看平均值,还需要参考方差。进一步,可以引导学生逐渐深入地进行数据分析,可以要求学生把身高分段,画出频数直方图,并引导学生讨论,通过直方图是否能得到更多的信息。二、数据分析方法掌握必要的收集数据、整理数据、描述数据和分析数据的方法,无疑是统计课程内容的第二条主线。1收集数据的方法在收集

7、数据方面,所涉及的数据可能是全体的数据(总体数据),也可能是通过抽样获得的数据(抽样数据)。在第一、第二学段中,学生收集的基本都是总体数据;而在第三学段中,学生将开始学习抽样,体会抽样的必要性,通过实例了解简单随机抽样。数据的来源有两种,一种是现成的数据,一种是需要自己收集的数据。在义务教育阶段两种来源都应该让学生有所体验,特别是自己收集的数据。常用的收集数据方法包括调查、试验、测量、查阅资料等。学生应该对收集数据的方法都有比较丰富的体验。为此,标准在第一学段提出“了解调查、测量等收集数据的简单方法”;在第二学段提出“会根据实际问题设计简单的调查表,能选择适当的方法(如调查、试验、测量)收集数

8、据”“能从报纸杂志、电视等媒体中,有意识地获得一些数据信息”。2整理、描述、分析数据的方法当人们收集了一堆数据以后,这些数据往往看起来比较杂乱,这就需要来整理数据,在不损失信息的前提下,对看起来杂乱无章的数据进行必要的归纳和整理,然后把整理后的数据运用统计图表等直观地表示出来,并加以适当的分析,为人们作出决策和推断提供依据。在第一学段,学生将学习分类的方法,分类是整理数据和描述数据的开始。在此基础上,能用自己的方式(文字、图画、表格等)呈现整理数据的结果,而不学习正式的统计图表或统计量。这一点与以往不同,也是非常重要的。有研究表明,早期经验的多样化,有助于儿童建立进一步学习的经验和兴趣。在此基

9、础上“通过对数据的简单分析,体会运用数据进行表达与交流的作用,感受数据蕴涵信息”。在第二学段,学生将学习条形统计图、扇形统计图、折线统计图等常见的统计图,并且能用它们直观、有效地表示数据。第二学段还将学习一个重要的刻画数据集中趋势的统计量平均数。在第三学段,学生将了解频数和频数分布的意义,能画频数直方图。继续学习刻画数据集中趋势的统计量中位数和众数,以及刻画数据离散程度的统计量极差、方差。并且体会样本与总体关系,知道可以通过样本平均数、样本方差推断总体平均数、总体方差。需要指出的是,教学中应鼓励学生运用所学习的方法,尽可能多地从数据中提取有用的数据,并且能够根据问题的背景选择合适的方法,而不是

10、单纯地名词、计算方法等的掌握。这里不妨看一下标准中对于案例38的说明:“条形统计图有利于直观了解不同高度段的学生数及其差异;扇形统计图有利于直观了解不同高度段的学生占全班学生的比例及其差异;折线统计图有利于直观了解几年来学生身高变化的情况,预测未来身高变化趋势”,因此需要我们根据问题的背景选择合适的统计图。总之,“统计学对结果的判断标准是好坏”史宁中.数学思想概论数量与数量关系的抽象M.东北师范大学出版社.2008(6).第143页,而不是“对错”。三、数据的随机性我们知道,推断性数据分析的目的是要通过数据来推测产生这些数据的背景,称这个背景为总体。我们假定总体是未知的,我们的目的是通过样本来

11、推断总体。而在调查或者实验之前,我们不可能知道数据的具体取值。也就是说,数据可以取不同的值,并且取不同值的概率可以是不一样的,这就是数据随机性的由来。在标准中将数据随机作为了数据分析观念的内涵之一。数据的随机主要有两层涵义:一方面对于同样的事情每次收集到的数据可能会是不同的;另一方面只要有足够的数据就可能从中发现规律。举一个标准中的例子(例40):袋中装有若干个红球和白球,一方面,每次摸出的球的颜色可能是不一样的,事先无法确定;另一方面,有放回重复摸多次(摸完后将球放回袋中,摇晃均匀后再摸),从摸到的球的颜色的数据中就能发现一些规律,比如红球多还是白球多、红球和白球的比例等。再举一个案例(例2

12、2),学生记录自己在一个星期内每天上学途中所需要的时间,如果把记录时间精确到分,可能学生每天上学途中需要的时间是不一样的,可以让学生感悟数据的随机性;更进一步,让学生感悟虽然数据是随机的,但数据较多时具有某种稳定性,可以从中得到很多信息,比如,通过一个星期的调查可以知道“大概”需要多少时间。不少老师有这样的一个困惑,概率也是研究随机现象的,那么为什么又提出数据的随机性呢?实际上,统计与概率都是研究随机现象的学科。“不论怎么说,机遇(或说偶然性)无所不在,机遇伴随着人的一生(当然随人的情况而有异),这是一个无法回避的现实” 陈希孺.机会的数学M.北京:清华大学出版社,广州:暨南大学出版社,200

13、0:3。统计与概率正是从不同的角度研究如何刻画随机现象,统计侧重于从数据来刻画随机,概率侧重于建立理论模型来刻画随机这样说是否准确。鼓励学生运用数据来体会随机,更能体会随机的特点。下面是课程标准修订组组长史宁中教授的回答史宁中、张丹、赵迪“数据分析观念”的内涵及教学建议J课程教材教法,2008,(6)。“我听了一些课,老师们经常这样处理:比如对于掷一枚均匀的硬币,先得到出现正面或反面的概率是,然后让学生通过反复掷硬币去验证这个结果()。这里有两个问题。第一,一个硬币,先假定它出现正面和反面的可能性是,这是数学(或者称为概率)。这个是通过概率的定义得到的,不是依靠掷硬币验证出来的。实际上,学生做

14、了很多次实验也得不到,反而更加糊涂了。第二,运用定义的方式教学随机,不能很好的培养学生的随机观念。需要指出的是,我们赞成做实验,赞成运用统计的思想来做实验。统计是通过数据来获取一些信息,来帮助人们做出一些判断。同样是掷硬币的问题,在统计上就会这样设计实验:先让学生多次掷硬币,计算出现正面的比例(频率),然后用频率来估计一下出现正面的可能性是多大。如果这个可能性接近的话,就推断这个硬币大概是均匀的,这是统计的思想。对于先给出定义,教师往往比较习惯,而对于“逆过来”通过数据来进行推断,教师往往比较陌生。为了帮助大家理解,再阐述一下摸球的例子。同样是一个袋子里有5个球,4个白球、1个红球,如果让学生

15、通过摸来验证出现白球的可能性是、出现红球的可能性是,这不是统计。统计是这样的,告诉学生们袋子里有很多球,有白颜色的和红颜色的。让孩子们去摸,摸到一定程度的时候,学生发现摸出白球的次数比红球的次数多,由此推断袋子里白球可能比红球多。进一步的话,能推断出白球和红球的比例大概是多少。再告诉球的总数的时候,能够估计出来几个白球和几个红球,这个是统计的过程。我并不是反对前一种教法本身,而是说如果这么教,蕴含的随机思想并不强,学生也不感兴趣,都知道了概率为什么还要做实验。而后来的这种教法,学生体会到每一次摸的结果事先都不知道,但是摸多了能够帮助我们做一些判断。这样一来,学生既体会了随机,又感受到了数据中蕴

16、含着信息,我想这种类似于“猜谜”的活动学生也会很有兴趣”。实际上这种“猜谜”绝不是“瞎猜”,在标准案例40的说明中给出了这种推断背后的科学依据,也就是虽然不能保证估计得完全一致,但能保证在一定实验次数下,估计值与实际情况相差不大的可能性是很大的。在第三学段,学生开始学习抽样,体会样本和总体的关系,这实际上也是帮助学生体会数据的随机性的重要内容。同时,标准还利用案例阐述了在第二学段、第三学段的不同要求。在上面提到的摸球游戏中,在第二学段“通过摸球,学生发现每次摸出的球的颜色不确定,初步感受数据的随机性。进一步通过统计摸出红球和白球的数量,可以估计袋中是白球多还是红球多。在不确定的基础上,体会规律

17、性”。在第三学段“在第二学段的基础上,学生可以估计袋中白球数量和红球数量的比,进一步体会规律性。教师可以进一步鼓励学生思考:给出了袋中两种颜色球的总数,如何估计白球和红球各自的数量”。另外,在第三学段,标准还提出了“通过表格、折线图、趋势图等,感受随机现象的变化趋势”,并给出了案例71。案例71刻画的是变量之间的随机关系,即年份与GDP是有关系的,但这种关系是不确定的。因为描点呈现线性增长趋势,可以进一步引导学生利用直线来表示这种趋势。教学中,可以鼓励学生尝试大致画出这条直线,比如有的学生会根据直线两侧的点要基本相同来描出此直线,并由此预测未来经济发展,感悟一些随机现象的规律性。对于直线方程如

18、何求得,则不做要求。四、随机现象及简单随机事件发生的概率在这次课程标准修订中,学生在第一学段中将不再学习概率,主要理由是在基础教育阶段统计的重要性是大于概率的,发展学生的数据分析观念是这部分内容的核心。即使对于随机的学习,如前所述,标准中也提出运用数据分析来体会随机性。从第二学段开始,标准安排了概率的学习,并且根据学生年龄特点,第二学段称为“随机现象发生的可能性”,第三学段称为“事件的概率”。在概率学习中,帮助学生了解随机现象是重要的。在义务教育阶段,所涉及的随机现象都基于简单随机事件:所有可能发生的结果是有限的、每个结果发生的可能性是相同的。在第二学段,要求学生“了解简单的随机现象的实例,能

19、列出简单的随机现象中所有可能发生的结果”,并“能对一些简单的随机现象发生的可能性大小作出定性描述”。在第三学段,要求“能通过列表、画树状图等方法列出简单随机事件所有可能的结果,以及指定事件发生的所有可能结果,从而了解并获得事件的概率”;同时,知道“通过大量地重复试验,可以用频率来估计概率”。第二节 具体内容分析 “统计与概率”的主要内容有:收集、整理和描述数据,包括简单抽样、整理调查数据、绘制统计图表等;处理数据,包括计算平均数、中位数、众数、极差、方差等;从数据中提取信息并进行简单的推断;简单随机事件及其发生的概率。实际上,数据分析可以分为描述性统计分析和推断性统计分析。描述性数据分析是通过

20、集中趋势、离散程度、图形表示等对来刻画数据;而推断性统计分析是利用样本的数据去推测总体的情况。由此可见,第一、二学段学生主要学习的是描述性统计分析 虽然在标准第一学段例22、第二学段例40中,涉及了一些推断性数据分析的内容,但主要目的是使学生体会数据中蕴涵着信息,感悟数据的随机性。所以可以说,第一、二学段学生处理的基本上是总体数据。,第三学段开始接触推断性统计分析。为了使老师们对于这部分的主要内容有全面把握,下面将三个学段进行整体介绍。考虑再三,还是觉得不分第一、二学段和第三学段好。因为,与数与代数、空间与图形不一样,统计与概率的内容比较少,分开学内容都不多。而很多东西都是三个学段贯穿始终的,

21、对于老师而言也需要整体把握三个学段内容。一、抽样和简单随机抽样抽样是第三学段统计课程的一个重要内容。如前所述,推断性统计分析是利用样本的数据去推测总体的情况,在第三学段学生将对此进行初步感受。首先,学生需要在实际问题中体会抽样的必要性。进一步,如何抽样获取“好”的数据呢?所谓“好”的数据是指那些能够更加客观地反映实际背景的数据。为了获取好的数据,我们需要尽可能多地利用对于实际背景已有的了解。如果对于实际背景一无所知,那么,一定要随意抽取样本,保证每个个体被抽到的概率相同,这便是“简单随机抽样”。对于简单随机抽样,标准要求通过实例加以了解,并在下面的案例中给出了具体要求。案例2(标准例67):

22、设计调查方法。了解本年级的同学是否喜欢某电视剧。调查的结果适用于学校的全体同学吗?适用于全地区的电视观众吗?如果不适用,应当如何改进调查方法?说明 对于许多问题,不可能、有时也不必要得到与问题有关的所有数据,只要得到一部分数据(样本)就可以对于总体的情况进行估计。很显然,如果得到的样本能够客观地反映问题,则估计就会准确一些,否则估计就会差一些。因此,我们希望寻找一个好的抽取样本的方法,使得样本能够客观地反映问题。在本学段,主要学习简单随机抽样方法,这是收集数据中通用的方法,在一般情况下,我们都假定样本是通过随机的方法得到的。因为同一个年级的学生差异不大,采用简单随机抽样方法比较合适。可以在上学

23、时在学校门口随机问讯,也可以按学号随机问讯。为了分析方便,需要把问题数字化,如喜欢这部电视剧的记为1,不喜欢的记为0。对于这样的问题,问讯学生数不能少于20人,取4050人比较合适,取更多的学生当然更好,但需要花费更多的精力。由此可见,一个好的抽样方法不仅希望“精度高”还希望“花费少”。假设问讯的学生数为n,记录数据的和为m(显然,m为喜欢这部电视剧的人数),则调查结果说明,学生中喜欢这部电视剧的比例为。我们依此估计本年级的同学中喜欢这部电视剧的比例。用这个数据估计全地区的电视观众喜欢这部电视剧的比例是不合适的,因为学生、成年人、老年人喜欢的电视剧往往不同。为了对全地区的电视观众喜欢这部电视剧

24、的情况进行估计,可以采用分层抽样方法,比如依据年龄分层,需要知道各年龄段人口的比例,按照比例数分配样本数,而在各个层内则采取随机抽样;或者依据职业分层,等等。教师应该了解分层抽样,在本学段学生只需学习简单随机抽样方法。二、图形表示统计图是描述数据的重要手段,可以直观地表示数据。在第二学段学生学习的是条形统计图、折线统计图、扇形统计图(在第二学段要求会看,第三学段要求会画);在第三学段学生学习的是频数直方图。其中,条形统计图有利于直观了解不同“条”所代表的数量及其差异;扇形统计图有利于直观了解不同部分占整体的百分比及其差异;折线统计图有利于直观了解变化的情况,预测未来的趋势。频数直方图和条形统计

25、图都可以直观地表示出具体数量,它们的区别主要体现在:第一,条形图是用条形的长度表示各类别频数的多少,其宽度(表示类别)则是固定的;直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数,宽度则表示各组的组距,因此其高度与宽度均有意义。第二,频数直方图表示的是连续分组数据,直方图中的各矩形通常是连续排列;而条形统计图表示的是离散数据,各矩形通常是分开排列。第三,条形图是直观地显出具体数据,直方图是表现频数的分布情况。看下面的一个例子史宁中.数学思想概论数量与数量关系的抽象M.东北师范大学出版社.2008(6).第159页:案例3 频数分布对某一品种的树苗进行调查,随机抽取了100株,测量了

26、树木的直径。测量结果发现:最小直径大于6.5cm,最大直径小于17.5cm。于是从6.5 出发,每隔1cm做一个区间,到17.5正好11个曲线,分别用数字7,8,17表示,再记录直径在每一个区间的树木的株数,得到下列数据(第一个数表示树的直径所在的区间,第二个数表示区间中树木的株数:(7,2)(8,5)(9,8)(10,10)(11,13)(12,26)(13,12)(14,9)(15,8)(16,4)(17,3)将上面的数据制成频数直方图(如图1),这样就可以直观地看出在哪个区间的树木比较多,可以分析数据的取值规律,比如在图1中的数据呈现“中间多、两边少、基本对称”的趋势。在图1中,我们还能

27、比较清晰地判断出,有50%以上的树苗的直径是在10.5cm到12.5cm之间,这是很重要的信息,因为这个信息告诉了数据大体的取值范围。图1对于统计图的学习,提出几点需要注意的:第一,不要急于引入正规统计图的学习,在第一学段标准要求鼓励学生用自己的方式来描述数据。第二,在描述数据的过程中,使学生不断体会各种统计图的特点,能根据实际问题选择合适的统计图来描述数据。第三,鼓励学生读懂媒体中的一些统计图表。第四,鼓励学生从统计图中获取尽可能地有用信息。这个问题也是大家普遍困惑的,到底引导学生从哪些方面来“读图”呢。Curcio (1987 )把学生对数据的“读取”分为三个水平:(1)数据本身的读取(r

28、eading the data),包括用能够得到的信息来回答具体的问题,这些问题图表中有明显的答案。(2)数据之间的读取(reading between the data),包括插入和找到图表中数据的关系。这包括做比较(例如比较好、最好,最高、最小等)和对数据进行操作(例如加减乘除)。(3)超越数据本身的读取(reading beyond the data),包括通过数据来进行推断预测推理,并回答具体的问题。在实际教学中,教师已经开始重视鼓励学生尝试由信息来进行预测。但是,在教学中还存在了一些误区。比如,笔者曾经遇到过不止一次这样的案例:如图2,教师鼓励学生根据某女生出生到12岁的身高,由此去

29、预测这个学生15岁的身高(图2到图7中纵轴的身高单位为厘米)。 图2有的学生(虽然是很少数)脱离了数据去进行“预测”:“我觉得她应该能长到190厘米,因为我希望她去打篮球”。就是基于数据,学生也有五花八门的答案,有的说:“8岁到10岁长了10厘米,10岁到12岁长了24厘米,照这个趋势12到14岁要长30多厘米,我估计她到15岁要到2米了”;有的说:“8岁到10岁长了10厘米,10岁到12岁长了24厘米,12岁到14岁又会回到长10厘米,我估计她到15岁快到180厘米”;还有的说:“到12岁就不怎么长了,我估计她到15岁差不多170厘米。”面对五花八门的答案,教师也觉得都有道理,不知如何引导。

30、 这里需要注意两点。第一,预测需要基于数据。对于脱离数据进行“预测”的学生,要引导他用数据说话,虽然这个预测也有可能,但可能性不会大;第二,有时候为了更合理地预测,需要我们收集更多的数据。教师可以引导学生思考:几个学生的想法都有道理,但是要比较合理地预测,还需要我们掌握更多的信息,比如,可以收集曾经和她差不多情况的人15岁的身高来帮助预测;或者把她与当地女生平均身高进行对比,看看12岁与平均身高的对比情况,由此预测15岁与平均身高的对比情况。当然,无论哪种预测都不能肯定是正确的,但会比单纯依靠这个学生以前的情况进行预测要合理。进一步,如果条件允许的话,还可以鼓励学生实际去做。在这样的思考下,一

31、位老师做了如下的设计: 执教者 北京大学附属实验小学 李宁案例4根据统计图来进行“三次”预测第一次,教师呈现小婷(女生)出生到12岁的身高数据(如图2),鼓励学生预测她15岁的身高。和前面叙述的一样,学生基于这个数据给出了不同答案。教师没有就此结束,而是给出了小婷15岁的身高,引起学生的反思:“实际上,小婷今年已经15岁了,她的身高是168厘米”,并得到图3。图3在此基础上再鼓励学生预测小婷18岁的身高。学生发现小婷1215岁增长的幅度不大,由此推断1518岁增长的幅度也会不大。那么是这样吗?有的学生提出可以找一些和小婷情况差不多的女孩,看看她们18岁时的身高。根据学生的想法,教师呈现了如下三

32、个女生的身高(如图4,图5,图6)鼓励学生进行第二次预测。 图4 图5 图6学生发现虽然她们的身高具体数值不同,但1518岁变化趋势却比较一致,增长的幅度都不大,由此可以预测小婷到18岁很可能只比15岁时增长2厘米左右,即她18岁的身高在170厘米左右。还有的同学发现小婷的身高值与图6所表示的女生比较接近,并且比这个女生略矮一些,由此根据这个女生18岁171厘米预测小婷170厘米。进一步,有的学生提出只有这三个女生的数据是否太少了,不说明一般情况,还可以收集更多的数据。于是,教师给出了北京城市女生平均身高统计图(如图7),鼓励学生进行第三次预测.图7学生发现这组数据也有这个趋势:15到18岁的

33、身高增长的不多,由此预测小婷的身高是170厘米左右。有的学生则根据15岁时小婷的身高比平均身高多6厘米,由此估计小婷18岁时也要多6厘米,所以是169厘米左右。当然,这些预测也并不能保证一定正确。以上“三次预测”的案例是鼓励学生从数据中获取合理信息的有益尝试,在实践中我们还需要更多的案例,以及如何鼓励学生有效获取信息的策略,这也构成了需要进一步研究的问题。三、集中趋势和离散程度目前标准要求的平均数、中位数、众数,它们都是刻画一组数据集中趋势的统计量。有了这些量,不仅可以表述调查对象的集中趋势,还可以用来对不同的总体进行比较,比如可以比较同一年级不同地区学生的平均身高。对于平均数、中位数、众数的

34、学习,不仅仅要学习如何计算,而且要设计合适的情境,使学生“了解它们是数据集中趋势的描述”。教师们困惑的问题,这三个量之间到底有什么区别,什么时候该用什么统计量?其实,我们现在处理的数据,大部分是对称的数据,数据符合或者近似符合正态分布。这时候,均值(平均数)、中位数和众数是一样的(如图8)。 图8只有在数据分布偏态(不对称)的情况下,才会出现均值、中位数和众数的区别。所以说,如果是正态的话,用哪个统计量都行。如果偏态的情况特别严重的话,可以用中位数。这也就是我们常说的平均数容易受极端数据的影响。这里不妨看一下标准中的例子。案例5(标准案例68):平均数、中位数和众数 某个公司有15名工作人员,

35、他们的月工资情况如下表。计算该公司的月工资的平均数、中位数和众数,并分别解释结果的实际意义。职务经理副经理职员人数1212月工资/元50002000800 说明 平均数、中位数和众数都是刻画数据的集中趋势的方法,因为方法不同,得到的结论也可能不同。很难说哪一种方法是对的,哪一种方法是错的,我们只能说,能够更客观地反映实际背景的方法要更好一些。在这组数据中有差异较大的数据,这会导致平均数较大,因此,用中位数或众数要比用平均数更客观一些。不难计算出该公司月工资的中位数和众数均为800元。而月工资的平均数= 加权平均(可以看成是加权平均) = 5000×+2000×+800

36、15;= 1240(元)。因此,加权平均往往就是总体平均,其中的权是数据对应的比例。但是,平均数具有许多优点,与中位数和众数相比,平均数能更多地利用所有数据的信息。除此之外,在数学上还有一个原因:假设我们得到了2个数据,令为平均数,利用中学的知识就可以证明:是与这2个数据差的平方和达到最小的实数,即对任意的实数有。 具体证明过程参看标准中的案例79。“这说明了进行数据分析时经常使用平均数的理由:使误差平方和达到最小,也就是说利用平均数代表数据,可以使二次损失最小。而利用中位数代表数据,是使一次损失(误差绝对值的和)最小”史宁中、张丹、赵迪“数据分析观念”的内涵及教学建议J课程教材教法,2008

37、,(6)。而我们都知道,二次函数有着很好的数学性质,所以人们选择用平均数来进行研究,在义务教育阶段更加注重平均数的教学是有道理的。因此,标准在第二学段只安排了平均数的学习,而将中位数、众数的学习放在了第三学段。只是依赖集中趋势是不足以表述数据特征的,比如分析标准中案例68、案例69中的两组数据,这两个公司的月平均工资虽然都是1240元,但显然两个公司的工资的差异是不一样的,由此使学生“体会刻画数据离散程度的意义”。最简单的表述离散程度的量是极差,但它没有考虑中间那些数据所提供的信息。在现代统计学中,经常使用方差来刻画数据的离散程度。有了方差以后,就可以进一步分析两个公司的工资情况。四、随机事件

38、及其发生的概率1随机现象的特点及概率的古典定义概率是研究随机现象的科学。如前所述,在义务教育阶段,所涉及的随机现象都基于简单随机事件:所有可能发生的结果是有限的、每个结果发生的可能性是相同的。在第二学段,标准首先要求“具体情境中,感受简单随机现象的实例这句话好象不太通。不知标准是否修改了。”,感受其在相同的条件下重复同样的试验,其试验结果不确定,以至于在试验之前无法预料哪一个结果会出现。在此基础上,“能列出简单的随机现象中所有可能发生的结果”,这里所涉及的现象(类似于案例41)都是比较简单的,学生能够直接列出所有可能发生的结果,并且感受到每个结果发生的可能性是一样大的。进一步,能对一些简单的随

39、机现象发生的可能性大小作出定性描述,并能进行交流。在第三学段,所涉及的现象相对比较复杂,学生需要通过“列表、画树状图等方法列出简单随机事件所有可能的结果,以及指定事件发生的所有可能结果”。特别地,学生将从对可能性的定性描述,到刻画简单随机事件发生的概率,即定义事件x=k发生的概率为: 使得x=k发生的可能结果数P(x=k)= 所有可能结果数这个定义被称为概率的古典定义。看下面的例子:案例6 小明和小红在做掷硬币的游戏。任意掷一枚硬币两次,如果两次朝上的面相同,那么小明获胜;如果两次朝上的面不同,那么小红获胜。这个游戏公平吗?在计算概率的时候,学生将运用自己的方法列举所有可能出现的结果。如学生可

40、以分别用正, 反代表硬币的两个面,则可能出现的结果是: (正,正),(正,反),(反,正),(反,反)学生可以列成表: 正反正(正,正)(反,正)反(正,反)(反,反) 学生可以画出树状图: 掷第一次 掷第二次 所有可能出现的结果 正 (正,正) 正 反 (正,反) 开始 正 (反,正) 反 反 (反,反)每种结果的概率都相等,都是1/4,所以两次朝上面相同和不同的概率都是1/2。学生将得到这个游戏对双方是公平的,由此体会概率的意义和作用。这里需要强调的是,义务教育阶段概率课程更重要的目标是体会概率的意义和作用,而不仅仅是计算一些事件发生的概率。因此,不能将这部分内容处理成单纯计算的内容,而应

41、关注在实际问题中学生对概率意义的理解。至于概率的古典定义学生在具体实例中了解即可,不用一般地给出。2频率估计概率在第三学段中,标准还提出了“知道通过大量地重复试验,可以用频率来估计概率”的要求。实际上,随机现象表面看无规律可循,出现哪一个结果事先无法预料,但当我们大量重复实验时,实验的每一个结果都会呈现出其频率的稳定性。学生将在具体的实验活动中,对频率与概率之间的这种关系进行体会,知道大量重复实验时频率可作为事件发生概率的估计值。为此,可以设计下面的活动:案例7(1)每人掷一枚均匀的硬币10次,分别记录下正面朝上和反面朝上的次数; (2)将全班数据逐次进行汇总,并完成图9(用线连接各点):图9

42、 硬币正面朝上的频率统计图(3)在图9中,用彩色笔画出表示频率为1/2的直线,你发现了什么? (4)表1是历史上数学家所做的掷硬币的实验数据,这些数据支持你的发现吗?表1 历史上数学家所做的掷硬币的实验数据实验者投掷次数n正面出现次数k正面出现的频率k/n蒲丰 4 040 2 0480.506 9德 · 摩根 4 092 2 0480.500 5费勒10 000 4 9790.497 9皮尔逊12 000 6 0190.501 6皮尔逊24 00012 0120.500 5罗曼诺夫斯基80 64039 6990.492 3条件允许的话,还可以在计算器上利用随机数或计算机上模拟掷硬币的

43、实验,以提供大量的实验数据,更好地使学生体会频率与概率的关系。但需要指出的是,利用计算器或计算机模拟概率实验,应建立在学生亲身实践这些实验并获得比较丰富的直观经验的基础上。进一步,可以鼓励学生利用频率与概率的关系解释生活中的一些问题。例如,可以引导学生讨论“明天的降水概率为80%”的涵义,学生通过讨论将知道明天下雨的可能性比较大,虽然有可能明天不下雨,但带伞应是非常明智的作法。还可以根据情况向学生介绍,明天降水概率为80%意味着:在100次类似于明天的天气条件(如气温、湿度、气压)下,历史记录告诉我们,大约有80天会下雨。至于频率稳定在概率的具体数学涵义,不宜作为义务教育阶段学生学习的内容。在

44、了解了频率与概率的关系后,学生就知道了大量重复实验时频率可以作为事件发生概率的估计值,并可以利用这种方法来估计一些事件发生的概率。看下面的一个例子:案例8小明用瓶盖设计了一个游戏:任意掷出一个瓶盖,如果盖面着地则甲胜;如果盖口着地则乙胜。你认为这个游戏对甲、乙双方公平吗?做一做这个游戏。这个问题需要全班合作尽可能多地获取实验数据,并分别计算盖面着地和盖口着地的频率,以此确定这个游戏是否公平。学生在实验的过程中,将进一步体会随机现象的特点(某次实验结果的不确定性和大量实验结果的规律性)。第三节 需要处理好的几个问题统计与概率的研究对象是数据和随机现象,这与数与代数是不同的。因此,教学中就应该注重

45、这部分内容独特的思想方法和教育价值。一、把握核心概念进行教学如前所述,数据分析观念是统计与概率内容的核心概念。而由于这部分内容与实际生活有着密切的联系,因此发展学生应用意识也是重要的目标。因此,教学应紧紧围绕数据分析观念、应用意识展开。1发展学生的数据分析观念在标准中,数据分析观念包含着三层意思:第一,经历数据分析的过程,体会数据中蕴涵着信息;第二,掌握数据分析的基本方法,根据问题的背景选择合适的方法;第三,通过数据分析,感受数据的随机性。关于发展学生的数据分析观念,在第一节已经详细叙述,并且还将在下面的第二、第三、第四点涉及,这里就不赘述了。2发展学生的应用意识教学中应注重设计贴近学生生活的

46、情境,使他们经历收集数据、整理数据和分析数据的过程,逐步发展应用意识。在教师新课程实践中,已经积累了在统计教学中发展学生应用意识的教学策略,主要体现在以下几个方面。(1)设计问题情境使学生体会需要收集数据例如,可以设计学生所熟悉的“组织体育比赛”等活动。为了更好地组织比赛,需要调查全班同学最喜欢的体育活动,由此鼓励学生收集数据,运用统计图表示数据,分析数据,根据数据作出决定:“你认为你们班最好组织什么比赛”,以体会统计的必要性。在这里需要注意的是, “组织什么比赛好呢”,需要教师引导学生就“好”开展讨论,以确定“好”的标准,如组织的比赛是使尽可能多的学生喜欢,那么我们就需要“去问同学最喜欢什么

47、活动。”总之,教师需要自己善于收集和积累生活中的数据,并根据学生的特点加以有效改造,设计成学生可以学习的情境。来看下面的一个例子。案例9折线统计图的应用 执教者:北京市西城区阜成门外第一小学 刘国朝片段1:上课伊始,教师请同学们欣赏一首诗:春风吹细柳,夏日荷花红。秋季枫叶美,冬雪压青松。请同学们说一说这首诗描写的是什么情景?描写四季不同的情景还可以用什么形式?学生们谈到可以是音乐、美术。教师又请同学们欣赏了春夏秋冬的四季的景色,如下图。导入:数学知识是怎样表现四季和温度的不同的变化的呢?然后鼓励学生思考如何运用数学知识表现四季和温度的不同变化。由此引入到可以用每月平均气温来进行刻画,以体会数据

48、的作用以及数学刻画问题和其他学科的不同。片段2:在学生对折线统计图进行了初步练习和应用后,提供给北京和悉尼月平均气温的折线图,如图10。图10鼓励学生能从上图中获取两座城市每月的平均气温,以及气温的变化情况。进一步,教师鼓励学生思考:“悉尼为什么在2000年9月15日10月1日召开夏季奥运会?北京将在2008年召开夏季奥运会,请你为召开的夏季奥运会定一个时间,并说出理由。”在讨论中学生又一次感受到数据是人们做出决策的重要依据。(2)分析数据能帮助人们做什么还可以在数据整理完毕以后,有一个反思的过程,讨论这些数据能够帮助我们解决什么问题?下面提供一个案例。案例10老师组织大家调查班级同学的身高情

49、况,把数据调查出来以后,进行了分析。最后老师鼓励学生思考:看到这些身高的数据,它们能帮助我们解决什么问题。生1:我可以了解到我们班同学的身高情况。我可以知道我自己的身高在班内处于什么情况。生2:我们班有8岁的有9岁的,我今年8岁,看到9岁同学的身高就可以先预测一下我到9岁时大概多高。生3:学校可以根据我们班的身高情况确定我们课桌椅的高度。在这个案例中,数据收集完毕以后教师组织了一个讨论,除了根据身高数据分析谁高谁矮以外,这些数据能帮助人们解决什么问题。所以,有的学生想到能帮助自己预测身高,还有的同学想到桌椅高度与身高的数据有关系。尽管孩子的想法不一定完全符合实际,但可贵的是在此过程中他们再一次

50、认识到了数据的作用。(3)收集和积累统计应用的例子无论是教材中的例子也好,还是在生活中遇到的例子也好,教师应该鼓励学生积累起来并适时展示交流,学生就能体会到统计在方方面面的应用。比如,2008年北京奥运会结束了,奥运会里有哪些运用统计的例子,教师可以鼓励学生以此为情境收集数据。又如,现在商场很多地方都会设计一些摸奖游戏,有心的教师可以把它们做一些适当的改动,引进到我们的课堂教学中,这不仅仅为统计与概率的学习提供了现实的素材,还可以引导学生对生活中的一些现象树立正确的认识。还有一点是非常重要的,就是适当的做一些调研,了解学生感兴趣的素材。(4)开展一些实践活动我们必须要认识到应用意识的培养,绝不

51、能仅仅靠课堂教学,而且课堂教学由于时间和空间的限制,往往很难完整地展示统计调查全过程,所以在教学中可以适当的设计一些实践活动,将课内外结合起来。标准中在综合实践中列举的一些例子,如案例22、案例78,在教学中都可以采用。二、切忌将统计的学习处理成单纯数字计算和绘图技能 如前所述,统计的核心是数据分析,统计教学的重要目标是鼓励学生从数据中提取尽可能多的有效信息,体会数据中蕴涵着信息。为了更好地提取信息,学生需要学习一些整理、描述、分析数据的方法。对于这些的学习,应注重对其的理解及在实际问题中的应用,而不知识单纯地计算或绘图。例如,标准提出“体会平均数的作用”、“理解平均数的意义,了解它们是数据集

52、中趋势的描述”、 “体会刻画数据离散程度的意义”、“了解频数和频数分布的意义,能利用频数直方图解释数据中蕴涵的信息”等。但是在实际教学中,确实存在着注重计算、绘图而忽视运用方法提取信息、体会方法价值的。以平均数教学比例,有人做过调查,学生学习了平均数会进行计算,但当遇到真正的数据需要分析时,他们却很少想到用平均数。所以说,平均数教学关键之一是发展他们的数据分析观念,使他们想到用平均数,愿意用平均数来刻画数据。我们来看下面的一个案例,学生在学习了平均数以后,师生共同讨论了三条信息,来体会平均数的意义和价值执教者 北京大学附属实验小学 王杰。案例11体会平均数的意义1利用节约用水信息深入理解平均数

53、的意义。师:我这也有条信息,我们一起看看。(1)出示:节约用水图。师:为什么要节约用水?(根据学生回答评价学生的节能意识)那我们来看看我们国家的淡水情况。(2)出示:我国淡水资源总量为28000亿立方米,仅次于巴西、俄罗斯和加拿大,居世界第四位。师:找一名同学读一读。看到这条信息你有什么感觉?(学生可能产生疑问:水并不少,世界100多个国家,我们排第四名。)(3)我们再来看看下面这条信息。出示:我国人均水资源只有2300立方米,在世界上名列第121位,是全球人均水资源最贫乏的国家之一。师:请大家静静的读一读这条信息,你发现了什么?(这里想让学生通过名次下降或贫乏再次提起对平均数的理解。“贫乏”

54、这个词是什么意思?有那么多水,怎么用贫乏来形容我们国家了呢?)总结:言之有理,看来同学们对平均数的理解越来越深刻了,光比总量是不行的,还要看我们的人均水资源。好,那对于我们国家来说,就更应该去节约用水了。2.出示:儿童乘车免票线“长个”了的标题。师:你知道什么叫“儿童乘车免票线”吗?没错,就是这条线,我们来看看(图略)。经过市发改委与相关部门研究决定,将北京市六岁以下儿童1.1米乘车免票线提高到了1.2米。师:为什么要提高?(学生自然会想到:孩子们都长高了。)师:我们怎么去确定这个标准的呢? (学生可能会回答:我们可以调查一下。)师:调查谁?如果数据来了,有高的、有矮的,如何处理?(这里要明确

55、调查六岁儿童的身高,渗透抽样调查的想法。学生结合平均数的理解,回答调查完了可以计算平均数。)师:总结:我们同学真了不起,既能准确理解平均数的意义,又能想到可操作的办法。那我们一起看看实际是怎样做的。据统计,目前我市6岁男童身高的平均值为119.3厘米,女童身高平均值为118.7厘米。和你们想的一样,市发改委就是参照了我市6岁儿童的平均身高,才确定了免票线的高度。看来,这平均数的作用真是不小,连确定免票线的高度都可以参照它。3. 那你们能利用平均数帮我解决判断一件事情吗?出示据统计,周一至周五晚高峰时,平均每小时需要通过1号桥的车辆为1756辆,需要通过2号桥的车辆965辆(两个桥的宽度等条件差不多)。王老师回家这两条路都可以,并且驾车路程差不多你们觉得我走哪好?那我走那一定快吗?为什么?(学生建议教师走2号桥,但偶尔也不一定快)总结:同学们理解得很好,平均数可以用来作参考,但是它反映的只是一般情况,并不能反映出某种特殊情况。理解平均数有三个角度:算法理解、概念理解、统计理解。对于统计教学,概念理解和统计理解是非常重要的。在上面的案例中,第一个信息,首先提出我国为什么要节约用水,引发学生思考,然后出示我国的淡水资源情况,使学生体会我国的淡水总量很多,世界排第四位,最

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论