第2讲线性回归案例分析_第1页
第2讲线性回归案例分析_第2页
第2讲线性回归案例分析_第3页
第2讲线性回归案例分析_第4页
第2讲线性回归案例分析_第5页
已阅读5页,还剩22页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第2讲 线性回归案例分析参与本讲的嘉宾姓名单位职称、职务王尚志首都师范大学张饴慈首都师范大学张思明北大附中张质祎北大附中局一 1班:学生陈肿尧北大附中局一 1班学生主持人:各位老师大家好!欢迎大家继续参加我们模块三有关统计教 学的讨论。首先允许我来介绍一下请来的讨论的评论嘉宾, 我身边这位是非 常熟悉的首都师范大学张饴慈教授,这边是首都师范大学博士生导师 王尚志教授,欢迎两位到场参加我们的讨论。我们今天讨论的话题是统计学教学里面一个非常重要的内容。我们标准里面提出来统计学内容在模块三里面是一个很重要的,实践性很强的内容,很多老师都做了一些专门的设计,提出来怎么学好统计, 有一个很重要的思想,就

2、是要通过活动课来学。我们首先问王老师, 活动在统计学学习里面有什么价值和作用?王尚志:统计学的教学或是概率统计或是必修三的教学, 在标准上有 一个特别建议,就要希望通过案例来进行教学。 就是希望通过具体的 东西,让学生进行感悟,再逐渐上升成为对于这样一些统计、概率、 算法的认识,我觉得这一点是特别重要的。而案例教学对于统计这样 特殊的课程来说,如果再赋予活动的内容,我想就更好了。学生可以 在做问题的过程中去体会,收集数据、怎么收集数据、怎么整理数据, 怎么从数据中提取信息帮助我们说明问题这样一个过程。根据我们的实践感觉这样的课如果加进去一些活动,会使我们学生通过自己的经历更好地展示,更好地理解

3、他们要学习的内容。张饴慈:我想统计这个课,在中学讲统计课不是从定义、总体、样本、 众数,不是在这方面强调,而是希望他经历一个统计的整个过程,从 开始的收集数据一直到最后得到结论, 对结论的分析。他有这个过程 的话,对这个统计学的概念意义也能够很好的理解, 而不是抽象的从 一些定义、靠推理出发得到一些结论,跟那种还是不太一样的。王尚志:另外在统计中应该更着重体现数学中的归纳的思想, 我们要 抽象地讲总体、抽样这些 我想在中学层面上可能也很难讲得很清楚, 包括在大学层面上可能也不一定能够讲清楚, 可能更多的是现在在很 多问题上,以及从专家上面还是有一些问题。 但是从处理数据这件事 情,已经变成我们

4、必须学习和理解的一个东西。所以我想通过活动 第一能吸引学生,学生愿意做,比如流行歌的变化趋势,结婚年龄的 变化趋势,学生很感兴趣,首先问题就抓住他们,然后通过分组大家 合作,一起来收集数据,一起整理数据,一起从数据中提取信息说明 问题。我想这个过程对统计学的学习是非常重要的, 而且也是能够调 动我们学生积极性的一个非常好的一种创意。主持人:我觉得老师们都提得很清楚,这个活动的价值不仅有助于学 习数学,学习统计,理解这个内容,而且是一个过程,积累这方面经 验的过程。我想结合我这个课给老师们谈一点想法, 首先要做好这样 的活动课的核心,是要有一个核心问题,问题的产生有两种方式,一 种比较容易控制。

5、就像用用课本上现有的例子让学生实践一遍这个最容易 还有一种是老师提出具体的问题,用这种方式提出两个例子。第一个问题就是做一个人口,给学生一个实际问题。比如 2008 年中国18岁的人口,给这个人口数一个估计。王尚志:我想你要是估计2010年更好?主持人:我们要今年就这么出了,今年 18岁的人口就这么问,当年 留这个问题学生认为好象这个事情没有当做是一个统计学的认识,认为这个是找个公式算算,根据什么算?不知道,那就查书,老师没有 给,就去找问题源 最后发现上网说 老师我要真的直接查出来,我说 那也算得到结果。大家一查没有结果,没有这个结果是两种一种是中国经济年鉴上面对这个数据是收费、保密;有一个

6、测算的结果,常 规的结果只有哪年做的统计、人口普查有这个数据。学生认为没有就 说老师好像你给得条件不够,你总得给我们点什么?但是经过查了 以后,他说没有 是一个检查的结果,但是他有一些别的查出来了。比如说15亿说人口预计估计是15亿,有了这个结果 同学就觉得那 好办了,有很多同学提出一些想法,有些同学还有查平均寿命,中国 人73岁。把15亿除以73就认为是18岁人口,当然老师看了这个数 据的时候,不是表态,大家参与这个过程,要说对还是不对,有人说 这个不对?为什么不对 其实问一个技术的问题,如果 18岁人口是 15除以73再乘以15亿,就会出这样一个问题 就是一个分布积累。 我问1岁的人或者7

7、4岁的人,学生马上就找我说,老师这个不应该 是这样,应该是前面多一点后面少一点,但是不知道多多少。到这儿讨论就进了一步,知道这个分布肯定是这么下降,那怎么 办呢再放开,就是这个过程要让同学体会 结果再说大家再想办法 的时候,这个办法是隔了三天再讨论的时候又有新的办法, 最有意思 的是一个同学说,我妈妈告诉我 我们这个楼有188个人,其中有3 个人是18岁,然后就是188分之3,乘以15亿,这个结果又进了一 步。但是大家又开始争论,凭什么拿你这个楼的数据,有的同学很恶 劣或者很有意思问,你们家住哪儿?是不是一个老年公寓,18岁的人少,或者是一个青年公寓 代表性不好,大家又进一步讨论到代表 性,什

8、么叫好的代表性数据,要抽出代表性好的数据。大家再想办法,于是就有各种各样的办法,其中有的家长是劳改 局的局长,把监狱里18岁的犯人人数抽出来,这也有问题,男性、 女性犯罪率也不一样,级别每一年也是不一样的。王尚志:犯罪也不是平均分配,不均匀。主持人:但是最后有的同学说,他抽他们家乡福建省他有有一个数据,这个代表性就比较好一点。但是不管怎么说,这个讨论结果,大 家对于抽样的质量、抽样的代表性有了更深刻的认识。 这种过程一直 做下去的时候,我们把这个过程拖得比较长,但是最后大家得到一个 感觉,把这个问题解决过程中,对于样本、估计总体、对于数据的代 表性,对于一个好的抽样,对于分层抽样、还有随机抽样

9、,这些概念 都慢慢进行复习,我觉得这个过程可能对学生学习统计是很需要的过 程。王尚志:思明这个做法,我知道。他刚才讲得这个过程,老师一定会 提出一些置疑,一会儿收集这个,一会儿收集那个,这个课怎么安排? 我记得思明是这么操作这件事的,在每一课的前五分钟左右的时间讨 论这个统计问题,讨论出一点结论就打住 进入这个课的学习,既调 动了学生的学习热情,又进行了统计课的进展,我觉得一举两得,把 课上和课下结合起来,把几节课结合起来,因为都是学生参与的,所 以学生做这些问题一般比较兴奋,所以我觉得这是挺好的一个创意。主持人:因为这个问题,统计学开始不是特别明显,后面做了一个问 题,是学生反给我的一个问题

10、,我们觉得全班都可以一直做。全班同 学都有学英语的电子词典,电子词典大家就比谁得好? 一开始比价 钱,800元、1000元、500元,还有比名牌,突然学生提出一个质量 标准。其实一个好的词典有两种,一种是含得词库大,解释丰富,有原文的解释,我们就统一说你能不能告诉我们你拿的电子词典里面有 多少单词?这个问题大家就说没有什么可做的,看看说明书就行,我们有一款说明书上面标记出来 说它有40万英文单词,这是我们首先 说的,做40万的单词是可能达到一个超级大的字库,是不是真使这 样?我们提出这样的问题,大家觉得这是一个统计学的问题,我们就 拨下去,大家帮我们验证手里有的电子词典,真实的词库有多大?这个

11、问题宏观的学生能平行能提出好几个问题, 我的单词量是什 么样?国家规定高中毕业生应该达到 5000-6000,我到没到? 一个英 语专业的毕业生在二年级时应该到 8000,他怎么来测算自己?都是 这样的问题,结果我们就小组讨论,大家针对同一个问题用课题研究 的方法,大家先来一起做,说怎么解决个问题?那就要抽样,先要把 单词的分布说清楚。A打头、B打头,26个字母各自打头单词分布是 多少?同学们就提了很多办法,比如查字典,看字典的页数比,A有多厚,这是一个挺好的办法,再返回来在字典上挑最短,比如 V打头 的单词最少,按出来,VO更少,就把这个东西弄出来根据它的分布, 测算出整个词典的库容是多少?

12、最后这个库容做出来之后,发现基本上有一半的字典都是虚库 容,一般学生用的字典也就是 6-10万左右。在这个过程中,对大家 的影响就是统计学很有用,统计学的方法在这个过程大家都做了一次 实践,甚至大家提到了平行横向,比如减少测量误差,减少统计学误 差,挑字典就不能挑化工字典,医学医药字典,要挑通用字典,很多 很多这样的思想就对统计学的工作的过程有一个更深的理解。王尚志:找问题 我觉得是我们老师面临的一个挑战性问题。刚才思 明说,一个班可以选择共同的问题大家一起来做, 也有的老师允许学 生去找问题。我也给大家补充一个故事,北京市8中前几年的一个故事,一个 小女孩,她们家住一个宿舍,门口有一个老太太

13、,这个老太太生活也 很可怜,儿子不孝顺,没人养活她,所以老太太不得不在宿舍门口摆 一个摊儿,就卖杂物,特别是卖雪糕、冰淇淋、牛奶这些东西。这个 小孩非常有同情心,她很希望帮助这个老太太,但是这个老太太又希 望自食其力,这个小姑娘想我怎么帮助她?于是她就发现老太太面临 着一个主要的问题,就是每一天进货的数量是多少?我想我们都可以 明白,如果进货的数量过大而卖不出去就有可能坏掉。如果你进货量 不够,而买的人又多,你又赚不了这个钱,于是这个小孩就想用自己 学得统计学办法来解决这个问题,她用两个星期的时间每天请很多人 帮忙来记录购买各种不同饮料的情况或者冰淇淋的情况, 这就是所谓 的抽样,然后进行统计

14、,最后计算出一个结果,提出一个方案告诉老 太太,比如说牛奶要进多少?什么牌子的进多少?雪糕什么牌子进多 少?老太太很不相信这个小孩,就不愿意用她这个方案?这个小孩就 说服了她妈妈,说我做得这个是很有道理的,一定能让老太太能够增 加收入 最后小孩的妈妈找到这个老太太,说您就用她这个方案,如 果亏了我来补这个钱,后来老太太被母女俩的行为很感动, 就开始使 用小孩提出这样的一个统计方案。结果老太太比原来多赚了一些钱, 老太太非常高兴,这个同学也非常高兴。就在我们这个活动中报告了 她的结果,我想这些都是很有个性的问题。我觉得不是没有问题,我们身边有大量的统计学的问题,可供学 生选择,它们是非常有吸引力

15、的问题,又是学生力所能及能够解决的 问题。所以我们希望我们的老师可以让我们的学生从他们的身边发现 一些统计问题,或者通过小组合作的方式完成这些统计问题, 他们在 这个过程中能更好地学习统计学。张饴慈:这里我还想谈一谈,统计教学对我们高中的老师来说也是一 个挑战,现在我去听了一些课,发现老师对这些问题缺乏意识,或者 老是那几个问题,课本上的问题,书本上的问题很难举出自己的问题 例子。所以我觉得刚才王老师还有张思明老师说了,实际上有很多问 题,我想对老师来说,首先在自己上要有心观察这些问题,要有问题 意识,这是一非常重要的事。其次的活,现在在一些地方,比如北京 积累了一批的案例,拿这些案例做参考,

16、我觉得也是一个不错的方法, 另外最好能把这些题目让学生看一看, 学生有很大的积极性,学生能 够提出非常多的案例。甚至有一些案例老师都不敢做,都觉得这能不 能做,我不懂?甚至会有这样的情况,我认为这是非常好的现象,利 用别人的资源充分发挥学生,自己做一个有心人,我想这样就能把问 题越来越能找到,就能找到一些适合中学生做的案例。王尚志:因为我们在北京搞了一个数学应用知识的一个活动,这个活动应该提供了大量可以做的统计案例。 在我们报告附件里面,大家可 以发现我们学生所选择的一系列案例,我们每年都把这些问题公布出 来,学生可以选择,学生也可以发现新的问题。我想今年我们就有一 个非常好的案例,是北大附中

17、,是不是能够看一下他们所做的情况。主持人:王老师的提醒,我们也趁这个机会把北大附中开展数学建模 活动中的统计活动,我们也找了一个例子,找了两位同学,下面也请 这两位同学给我们讲一讲,他们用统计活动的方式写论文,报告论文 以及整个工作过程。下面请这两位同学出场,各位老师,我们这节课的主题是统计活 动课,在前面我们已经和两位专家讨论过统计活动课开展的意义,很多学校、很多老师都创造了一些开展统计活动课的经验。今天我们换 一个方式,我们请来北大附中的两位同学,来介绍他们通过统计活动 课来数学建模的方式,完成一个统计学习的作品,通过这样的活动来 提升自己学数学、用数学的意识。左边这位同学是北大附中高二(

18、1)班的陈肿尧同学,那位是同 班的张质祎同学,欢迎两位来现场。我也想问问你们什么时间开始做数学建模,做统计小论文的。陈肿尧:我们大概高一上半学期开始的,大概高一下半学期的时候结 束的。主持人:整个做统计活动,把这个论文做出来到结题做报告一共花了 多长时间?张质祎:大概花掉了我们半年的时间。主持人:你们两位把这个过程和你们的结果向老师们做个报告。张质祎:好的,老师们,大家好!我是来自北大附中高二( 1)班的 张质祎,坐在我旁边的是我的同班同学陈肿尧。 今天我们来简单介绍 一下我们的函数建模课程,学校为我们展开了函数建模课程,为了配 合我们同时开设的统计课程,在课程安排下来之后,很多同学也开始 去

19、思考自己的课题。在我们小组讨论中发现了这样一个现象, 就是在我们中文汉字中 不同汉字使用频率是不同的,其中有很多字是非常常见的,就像我们 经常使用的:“的、一、不、是”这样的一些字,还有一些汉字它是 非常罕见的,甚至在一本文学作品中几乎就不曾出现。 为什么会有这 样的情况呢?在我们讨论之后,发现不同使用频率的汉字都有一些不 同的特点。比如说像使用频率多的汉字,它们更容易书写,或者它们的读音更加简单,使用频率低的汉字,它们可能相对会比较复杂,而 且它们读音会比较拗口生涩。我们组员进行讨论之后希望探究这样一个问题,究竟是哪些因素 影响了一个汉字的使用频率?究竟是哪些因素决定了一个汉字的使 用频率?

20、所以我们的探究主题就是探究单字在现代汉语书籍中的使 用频率与字义个数、常用词组个数、读音难度以及书写难度的函数关 系。经过我们小组的讨论,我们发现影响汉字的使用频率有主要这样 几个因素,第一个是它的字义的个数,也就是一个汉字在字典里有多 少个意思?第二个是它常用词组的个数, 就是说一个汉字在字典当中 有多少个常用的词组。第三个是它的读音难度,读音难度包含多个方 面,在之后的建模中我们会详细地讲到。还有一个是书写难度,影响 书写难度主要因素是它的笔画。首先来看一下我们的函数设定,因为 我们可以知道,一个字的字义或者词组的个数越多, 那么它的使用频 率相对会可能更高一些,字义的个数和词组的个数与这

21、个结果是正相 关的关系,而一个字越难读越难写,那么它可能的使用频率会更低, 所以说这是负相关的关系,因而我们这样建立一个函数。对于函数中的变量,下面我想给予一个解释,首先我们定义了单 字的使用频率,这个频率是我们最终建模的一个理论计算值。第二是单字的字义个数还有常用的词组个数, 分别用字母P和R 来表示,假设它分别与最终概率成正比;另外两个变量,一个是单字 的读音难度,另外一个是单字的书写难度,分别用 S和Q来表示,这 两个难度我们希望用一个固定的算法来求出一个量化的值, 最后代入 到式子中进行一个计算开始探究,首先我们要选取样本分析数据,也就是我们题目的来 源,在选取样本的时候,我们决定采用

22、统计的方法,正好我们也在开 设统计的课程,所以我们希望能够用到统计的知识。 首先用计算机将 五本电子版书籍中的所有汉字出现频率做出了 一个统计,将频率大于千分之三的汉字归为常用字,频率小于千份之一的字归为罕用字, 而 介于之间的字归为较长用字。我们统计了这三种类型的汉字所占的一 个比重,按比重我们决定进行分层抽样的方法,因为我们知道,常用 的汉字可能在书中出现的更多,那么它对数据结果的影响会更大, 而 罕用的汉字,它出现的频率更低,相对的对数据结果的影响会相对较 小。所以说我们按照这三类汉字在书中出现的频率进行一个分层抽 样,我们选取的样本容量是100个字。下面是我们的工作流程图,首先是用在电

23、子版书籍中统计频率, 因为我们希望能够借助于计算机辅助的方式, 所以采取了电子版的书 籍,然后根据频率的大小将汉字排序分成三个频段,同时我们会将这些数据用表格的形式进行一个整理, 将它加以保留,以备后面的继续 分析数据来使用。最后我们从各频段中按照权重来取样, 组成样本容量为100的样 本字库。在选取样本的时候,因为我们考虑到中国作家不同人写作风 格会有差异,这样会对样本的代表性起到了非常大的影响。 所以我们 采取了一个折中的办法,我们考虑选取外国作品的中文译本作为样本文本。因为考虑到这样一般外国作品中文译本语言会更加普通化,更具有代表性,这样选取来的数据对最终结果的影响会更小。样本参数的统计

24、,一个汉字在我们建模当中包含了四个变量, 第 一个是字义的个数,第二个词组的个数;第三个是单字的读音难度还 有一个是单字的书写难度。我们在统计这些样本 字的参数的时时候, 同样采取了计算机辅助的办法,因为我们的数据量非常大,虽然只有 100个汉字,但是人工统计起来会非常困难,所以我们采取了计算机 程序的辅助方法,在资料的收集过程中,我们主要是依赖网上的搜索 和权威文献的查阅,我们认为这样既方便、而且准确性、可靠性会更 高一些。而在资料整理的时候,我们是将收集到的资料按字逐一整理, 这也同时运用到计算机辅助统计的办法。陈肿尧:下面我来具体介绍一下,我们探究函数确立的步骤。首先我 们先进行了变量赋

25、值,我们通过查阅字典还有计算机统计的方法, 将 每个样本中字的词组个数和字义数量分别赋值给 P和w并在字典中 记录下这些汉字的读音。我们先进行了第一次建模,是汉字书写难度 的建模,首先对样本中各字的笔画数量以及连笔字所需笔画数量进行 统计,建立了书写难度Q与这两个T和K的关系,然后解出每一个样 本当中每一个汉字Q的值。具体函数在后面会有。我们第二次进行的汉字读音难度的建模,根据不同读音组合的阅 读难易程度制定读音难度的评分标准,建立读音难度S与语音元素的 函数关系,解出样本中每一个汉字的S值。这个S值具体影响的是它 的声母、韵母以及它的读音。因为在中国很多地区,有些声母、韵母, 还有一些读音的

26、发声难度会有一些差异。最后经历了两次建模之后, 最终有一个函数建模,将各数据 P、W S、Q代入关系式中,拟合出 k1和k2两个值。这个k1和k2值的设定一会儿我会再提到。首先是汉字读音难度的建模,我们查阅数据一共分成这四组数 据,声调、声母、韵母以及常见字音个数。因为有些字是多音字,它 的声调韵母和声母会有不同的取值,在对上述变量进行权重分析以后 制定了难度数值,比如f、h这些声母,不同声母难度数值,不同韵 母难度数值以及不同读音的难度数值。张质祎:这样的数据主要是靠我们统计过程得出来的结论。陈肿尧:最终我们确定了一个字的难度值, 是它的声调难度系数之和 与声母难度之和再加上韵母难度之和除以

27、它的常见字音个数。接下来,我们对汉字书写难度进行建模,因为考虑到现实生活中 有时候人们写汉字有时候不是一笔一划,所以我们统计了这些字的笔 画数,如果用连笔字写的话需要的笔画数分别计为 K和T。由于在现 实生活中,人们多使用连笔字,所以我们加大了连笔字的影响效果, 得出了书写难度Q=Tln (K+1)。最终函数建模,首先由于考虑到字典收录的问题,我们决定降低 字义、词意的数目对最终函数的影响效果, 而增加书写难度的影响效 果。根据读音难度、书写难度,关于出现概率的正负的相关情况。刚才张质祎同学已经对它们进行了分析,这里我就不再赘述。运用待定 系数和应用平方反比率的函数进行系数拟合,具体先设定 k

28、1为1, k2为一个变量,然后进行线性回归,当然前面需要乘一个系数 入, 因为它与最终出现频率成乘一个倍数关系得出 k1值,由于入在式子 的前面可以乘到上面,最后得出K1和k2两个值。这个是我们得到的 k1和k2的值。接下来是部分数据的展示,可以看到被红色标注的汉字是与实际 误差较大,误差超过50%勺,这个误差出现的原因,下面我来解释一 下。我认为这部分字出现较大误差的原因有以下几点:第一,我国从上世纪推行了简化字,其中特别简化了特别复杂的 常用字,造成了这些常用字较古代简单了许多,造成较大的误差,比 如说“尔”,古字的笔画数比现在的字要多很多,还有“让”也是这 样的。第二,选取文章样本,考虑

29、外国名著的译本,字词依照外国人的 习惯,而且受译者水平影响较重,所以有些复杂的字或者成语中用的 字就没有出现,而且会有一些外国人的名字或者外国地名的翻译, 这 些都会比较多。第三,由于外国文章的译本目的在于普及大众, 所以对于生僻字 和字意独特的字,基本上不会再过多的使用,所以古汉语使用中的字 就没有出现。张质祎:不能够完全反映我们中国文献的一个特点。陈肿尧:第四,选取的生字样本难度及常见程度分为三个级别,最常 用字出现次数较高,生僻字出现过于较少,造成样本两级分化严重, 对于线性拟合的准确度造成了很大的误差。第五,由于没有生字的字意在汉代汉语中几乎不再沿用, 所以探 究结果与某些汉字的字义数

30、有所出入。 这一点出入并不会很大,因为 我们降低了字义数的影响效果。第六,由于我国地域广阔,各地方言影响不得不加以考虑。比如东北话的“贼、老”这些词。张质祎:而且不同地方的人发音有一些不同的习惯, 可能会影响到他 们对单字的一些使用。陈肿尧:第七,由于每个人写连笔字的方式不同,这项统计一般性不 是很强。在我们组的两个同学做的这项数据的收集, 他们的结果相差 非常大。第八,误差较大的字,多为量词、助词。相比之下名词、副词则 误差较小。比如说刚才“一”就是一个量词,这个词在书写过于简单 而使用并不是那么寻常。张质祎:像“的”既可以做助词,同时还有其他的意思,虽然它的意 思不多,但是它在一个句中是必

31、需的,所以在一个句中出现的会相对 更高。陈肿尧:最后一点,有些字为中国地名、人名的专用字,在外国名著 中,中文译本中是不会出现的,所以造成频率失真。张质祎:我们这样的一个问题,最初来源于对平常问题的发现。就是 我们在读书中突然感觉到有些字为什么使用的多?有些字它使用的 少?进而我们再探究,在探究结果出来之后,我们发现我们通过这样 一个式子对一个新的汉字,对它的使用频率做出预估。这样的话,我 们的这个式子将来就会有更多的用处。首先这个研究结果可以为以后的输入设备, 比如像中文键盘,因 为我们现在的键盘的英文排布是按照外国人的习惯, 那么如何研发一 款更适合中国人书写习惯的键盘,我们可能会需要用到

32、这样一个问 题,就是要考虑到不同的汉字,它不同的笔画结构出现在键盘中的不 同频率,这样对它进行一个重新的排布,这里就可以用到我们这样的 函数式,作为一个参考。陈肿尧:这个函数式对于读音难度的建模, 也可以为拼音输入键盘做 一些帮助。张质祎:因为我们在读音难度建模的时候也考虑到了很多有关读音方 面的影响因素,这样对于一个更适合中国人打字的拼音键盘确实有一 定的帮助。主持人:我想问你们这个课题之外的一些问题。 你们做了这些事情以 后,你们怎么去看学习、你们怎么去看学数学,你们花了很多时间做 这么一个课题,认为它对你们学习的价值在什么地方张质祎:是这样的,我觉得学校给我们开这么一个课程,给我们开一

33、个函数建模的活动,正好配合我们当时学习的统计课。 首先给了一个 在课外使用课内数学的一个机会,让我们自己去思考,如何在生活中 发现问题,并且用课内的知识来解决。因为在我们的建模过程中,大 量的用到了统计学的知识,比如抽样调查,可能还会用到一些最后的 频率统计,包括展现数据用的表格、直方图的一些数据分析。这些都 是我们在课堂中使用的一些知识、 学习到的一些知识。但是我觉得用 课堂知识解决课外的东西会让我们更有兴趣。因为我们对这个问题的 思考来源于我们生活中自己去思考的一个问题,想去解决这样的问 题,必然会用到这样的数学知识。这样会让我们饶有兴趣解决生活当 中的问题,而且又使用到了课堂上的数学知识

34、。主持人:我还想问一个问题,你们在一起做,一个人做也是做,两个 人做也是做。你们在这个过程中感到搭伴做或者说合作学习, 这样的事情对解决问题的价值和作用有什么?你们这个课题一共有几个同 学做?陈肿尧:四个同学,有没有分工?有分工。两个人负责数据收集,我们两个负责函数。张质祎:因为我学习了计算机编程,所以正好做了一些统计方面的工 作。正好我们课内也学习到一个数学程编辑语言, 我们对它的应用又加深了印象。主持人:四个人是不是各有特长,大家一起有分工合作。在这一起里 面你们有没有互相交互?是不是所有知识在做之前你们都已经会了, 知道不知道可能用到什么知识,要不要自己去学习一点东西?陈肿尧:有一些统计

35、学知识,我们在课本中没有学到。因为函数建模 活动我们非常有兴趣,我们自己还阅读一些相关书籍提升自己的知识 层面。张质祎:包括一些数据处理还有最后的函数合成, 好多知识是没有学 过的,我们在网上进行了一些查阅,也请教了老师,最后把问题这样 解决了。主持人:你们觉得像这样的学习方式,对你们学数学有什么作用?什 么地方用这种方式学比较好,或者说同学之间这么学,对你们的学习 你们觉得他们有什么样的价值?跟以前从初中上来全是老师教,你们感觉到有什么地方不一样?那些地方更好?那些地方会有问题?张质祎:首先唤起了我们对数学的一个兴趣,因为我们对实际问题中 发现自己要想思考和解决不了的问题,但是数学给我们提供

36、了这样一 个工具。让我们对课堂的数学学习更有兴趣。 第二个是我们学习了一 些基本的探究知识,因为这样的问题不是说像老师设计好的习题那 样,有已知、有求证。而这样的一个问题,它从已知条件,包括问题 都是自己我们自己提的。我们要尝试分析这些问题有多少个方面, 再 找到解答问题的过程。这样对我们的分析能力和自己进行研究的能力 确实是一个提升,确实之前我们也没有做过这样的事情。有这样的一次尝试之后,尤其对科学论文的研究方式,确实有了 一定的了解和掌握。主持人:而且我们特别感动的是,你们做这个结果的时候查了很多的 文献,你们对自己做的问题里面不太成熟的地方, 做得误差分析是非 常严谨的。比如我们有什么地

37、方做得不够,什么地方造成误差大,是 非常好的科学态度,并不是因为这个降低我们论文的价值。 而这种态度对我们特别有感染。我特别想知道你们是不是连文献都要在论文里 面标记出来。张质祎:确实是这样,而且我们在用一些纸制的论文时会在文献中标 记,电子版的文献需要用到的地方考到自己的文档里, 在操作的时候 我们还会查阅。主持人:这也是一个知识产权。在学习的过程中,课本上的东西和这个要结合张质祎:而且我们知道了在写学术论文的最后一定要注明参考文献,这也是对别人劳动成果的一个尊重。主持人:我还想问一个问题,你们参加这个活动,就光你们这些人么?年级里、班级里面还有哪些同学做了相关活动?你们能不能简单介绍 一下

38、你们知道有多少同学参加?还有哪些做得比较好的课题?张质祎:应该是有很多同学,应该是全班都参与到了这样的活动,而且年级里面也有绝大多数的同学也参与到这样的一个活动当中。主持人:了解不了解别人做了什么结果?张质祎:他们好象和我们是一样的,也是结成小组,有些同学可能讨论一些物理方面的问题。比如汽车运动、人在走路时候如何更省力, 都是来源于生活当中的思考。陈肿尧:有的同学对经济学的问题,比如黄金价格的分析。主持人:对,我也听说,黄金期货价格曲线,走势?张质祎:因为有的同学喜欢自然科学,比如像物理、化学他们喜欢用 数学知识解决这些方面的问题,还有同学可能喜欢社会科学,像经济, 还有一些同学做一些道路上的

39、交通统计, 为以后的市政规划提出一些 建议。主持人:这是方方面面。张质祎:这都是来源于自己对问题的思考。陈肿尧:有90多组同学。主持人:对 我也听说了,刚才从两位同学的介绍里我们大概了解了 开展统计的建模或者统计学习,甚至函数学习在很多方面,我们采取 了一种学生自主的学习、研究提出课题,开发研究的过程,自己得到 结论同时把它写成论文。在这个过程里,实实在在看到两位同学的介 绍里他们的成长和收获。如果大家对这些材料感兴趣,我们会在课程 附件里为大家提供这些思考。在此我们也感谢两位同学的参与, 谢谢 你们。刚才同学讲完他们学习的过程时, 我们会有一种感受。这个过程 中,这两个同学开始的时候怎么做的

40、这个工作,一步一步到最后交流, 完成了一篇非常好的论文,这个论文在北京市应用数学知识竞赛得论 文报告中获得了奖项。我也请张老师帮我们看看,学生做出这样的结 果,对他的学习有什么价值?在这个过程中, 我们也会发现论文从数 学上并不是十分严谨。您怎么来看待这个问题?张饴慈:首先这样一个活动这两个孩子做得非常好, 我们可以体会整 个过程,从这个问题的提出,怎么收集数据,怎么做一些假设,怎么 做一些处理。我觉得我们的孩子做得非常好,而且他们自己也谈到在 合作学习方面,自己学了一些感兴趣的课外知识以及自己怎么做科研 论文,怎么收集数据,怎么参考别人的文献,尊重人家的成果。我觉 得这是全方位的对他们有所提

41、高,这一点他们做得非常好。所以这里我想说这么几件事情,第一个我想说,对他们来说,一 方面对他们本身学生来说论文课题做得还是比较高,对一般的孩子来 说还可以找各种各样的课题,不见得能做得这么深。我觉得刚才说的 关注热点,所有的数据拿出来都可以得很多东西, 比如奥林匹克的奖牌数,奖牌数有人说从金牌来看中国第一, 有人说不看金牌数看总的 奖牌数。或者有的国家提出来按人均奖牌数来看, 像这样一些数据方 放这儿,但是可以从不同的角度抓不同的信息。王尚志:怎么处理这个数据?怎么从不同的角度提炼出对我们有用的 信息。张饴慈:不像刚才北大附中学生做得那么高深,但是都可以做,包括 今年的世博会可能也会有很多的数

42、据,只要用心就可以做的。主持人:今年的气温,水灾多少年来一次,对气候有什么影响。通过 数据来表现。张饴慈:还有一个问题,很多老师在担心这些影响不影响学习?影响 不影响高考?耽误不耽误时间等等问题?学生哪儿有时间来做?我 想他们做了大概半年的时间,但是充分都利用课外的时间做的, 我也 看到一些课外活动课,在课上效率不太高。比如课上花了 10到15分 钟量身高,分组,这6个人就在课上做,而这些学生在课下抽个时间 就可以做到,这个是效率问题。在活动课当中我们老师怎么组织安排, 把效率提高,我觉得都不 会影响学生的念书,对这些东西要有一个很好的安排。 有些觉得是不 是耽误时间,不愿意做,我想北大附中就

43、有这个问题,开始做一些活动,学生、家长都有担心,最后家长反应非常好,觉得他们一点都不 耽误学习,而且能力有所提高。另外,在这里面这些论文不会像真正科研论文一样尽善尽美,可能里面有不足有缺点,比如说是函数关系还是相关关系等等。像这样 一些问题,刚才北大附中这两位同学也不是做得非常非常清楚,但是我觉得这些东西相对来说是比较次要的。 我们老师也能够通过这个活 动提高自己,有的老师组织活动做父亲跟儿子身高的关系, 八个数据 做一条回归线,八个人一组,全班比如六个组就做出六条回归线,那 么八个数据是不是太少了。我们讲课的时候都可以讲,只有数据很大 的时候可以做,但是在实际活动中会出现这样的问题。 也是在老师和 同学之间对这些问题逐渐提高自己,通过这些活动以后才真正能提 高,否则光在理论上说一说可能就没有这个机会。王尚志:我想统计

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论