【《小学数学应用题自动生成研究与应用研究国内外文献综述》6200字】_第1页
【《小学数学应用题自动生成研究与应用研究国内外文献综述》6200字】_第2页
【《小学数学应用题自动生成研究与应用研究国内外文献综述》6200字】_第3页
【《小学数学应用题自动生成研究与应用研究国内外文献综述》6200字】_第4页
【《小学数学应用题自动生成研究与应用研究国内外文献综述》6200字】_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

小学数学应用题自动生成研究与应用研究国内外文献综述1.1小学数学应用题研究现状数学应用题在小学数学知识领域中广泛分布。它们不仅是小学数学示例和练习中常见的问题类型,而且是解决问题教学的重要支持。相关文献表明,在数学应用题的研究中已经取得了很多成果,主要表现在以下三个方面:(1)在应用题的元认知方面,国内学者张庆林等人对小学生表征应用题的元认知分析进行了实验研究,结果表明,学生对应用题的结构表征和句子表征的元认知监控能力较低。但是,文字表征的监控能力高于结构表示的监视能力[1]。姚飞等为了提高学生的解决问题的能力,他采取了应用题结构分析训练方法,该研究方法表明:这种训练可以显著提高小学生解决应用题的能力,并表明在中等成绩学生的学习中提升最多[2]。由此可知,加强元认知训练可以提高学生对该题目的理解和分析能力。何小亚指出,学生难以解决应用题的主要原因有四个:应用题的背景复杂、对基本术语含义的理解不足、泛化规则和认知模型检索障碍[3]。(2)关于问题表征方面,国内学者纪桂萍进行的一项研究发现,儿童在解决问题过程中的心理表征可以分为两种:形象性表征和抽象性表征[4]。这些研究表明,选择正确的问题表征类型对于解决数学应用题中的问题尤为重要。倪印东等人将解决数学应用题的困难归因于四个主要障碍:主题,数学语言,数量关系和结构特征[5]。刘四新在论文中探讨了为什么难以解决应用题的原因。他认为,学生的问题难以解决的原因首先是学生的生活经验很少,在阅读和理解单词的能力仍然缺乏;其次是方法和技能,缺乏分析问题的能力,分析题目不够透彻。这也是导致学生难以解决问题的主要因素:问题表征因素的影响[6]。外国学者Anand发现,大多数学生回答错误应用问题的主要原因不是计算困难,而是数学问题结构的错误表征[7]。学者Montague认为对于学习困难的学生来说,尽管基础知识薄弱,但最大的问题在于缺乏自己的语言解释能力和重述能力,无法在纸上画画或形象化地解决问题。对问题的其他表征加工处理策略不足且规划能力不足、无法建立目标、制定问题并解决问题[8]。Mayer学者的研究进一步表明,在句子表达中表征相关句子特别困难。他试图让解题者重述该题目的内容,但是在解释该内容时,尤其是经常省略或歪曲相关的句子,错误地表述关系特征,有时可能出现有关系语句被解释为赋值语句[9]。由此可见,在某种程度上,学生表征问题的方式决定了如何以及如何获得信息并解决问题。(3)应用题解题策略方面,张璟等人对小学生进行了解题策略训练以解决应用题,从而提高了他们的数学解决问题能力[10]。姜海红认为,小学生应具有语言、思维等能力来解决实际问题,解决应用题的关键步骤包括审题、分解、合理联想和验算[11]。国外研究者Dellarosa指出,加强对同类型应用题的训练可以增强学生分析和分类应用题的能力,相同类型的问题是两个问题的已知条件不同,但是答案的方法完全相同[12]。Sweller的研究主张讲授示例,使用已解答完整的示例问题来帮助学生建立图式,即允许学生根据示例解决相似的数学问题,从而可以帮助学生提高解决问题的能力[13]。在我们的数学教学中,示例教学不仅适合应用题的学习,而且还适用于解决其他数学问题的教学。通过上述文献的分析可以发现,元认知、问题表征和应用题解题策略为数学应用题生成提供指导方向,以此提高小学学生数学应用题的解题能力。1.2文本生成研究与应用现状自然语言生成(Naturallanguagegeneration简称NLG)作为自然语言(Naturallanguageprocessing简称NLP)的一个子方向,主要目的是构建能够“写”的软件系统的技术,即能够用汉语、英语等其他人类语言生成解释、摘要、叙述等。具体来说就是将结构化数据转换为文本,以人类语言表达。即能够根据一些关键信息及其在机器内部的表达形式,经过一个规划过程,来自动生成一段高质量的自然语言文本。Reiter等人提出一种NLG典型结构即管道模型,该模型将自然语言生成系统定义为接受非语言形式的信息作为输入,生成可读的文字表述。数据到文本的生成适用于这个定义[14]。Reiter等人从应用系统建设的角度对自然语言生成(NLG)进行了概述,描述了NLG的基本任务三个模块,分别为文档规划、微观规划和表述具现化(linguisticrealisation)。首先文档规划包含内容选择(contentdetermination)和语篇规划(discourseplanning)用以根据结构化数据选择生成的句子、并合理安排结构化数据之间的语义关系,其次微观规划要做好句子聚合(sentenceaggregation)、词汇化(lexicalization)和指代生成(referringexpressiongeneration),最后通过表述具现化生成具体的句子。后续文生成技术的研究都是在这三个模块上进行策略更新。这类数据到文本的任务在没有普及知识图谱的时期研究较为广泛,目前国内外研究学者把这些成熟的技术应用到了各个领域。Bontcheva等人提出了一种基于OWL等语义网标准编码的领域本体自动生成报告的方法,设计了一个MIAKT生成器,借助于自然语言生成技术从语义网标准编码的领域本体中自动生成医学诊断报告[15]。Alonso-Lavernia等人提出了一种与领域无关的专家系统规则自然语言解释生成方法[16]。该方法基于用过程性形式语言编写的解释规则该规则从预定义的自然语言文本片段构建解释。Cullen等设计了提出了一种实用的口语对话系统自然语言生成(NLG)的系统[17]。该系统的对象体系结构便于跨预定义的业务域和注册表以及不同语言生成短语提高了输出的灵活性。闫秋艳等人将NLG的内容规划应用到XML文档中实现了一种基于自然语言生成的XML关键字查询技术[18]。Zhang以地理信息系统数据集和自然语言生成技术为基础,解决中文寻路系统中自然语言路径描述的生成问题[19]。Gonza`lez等人设计了一个认知视觉系统(CVS),它使用自然语言文本来解释监控场景中的人类行为[20]。2010年胡玥等人提出了使用Chomsky短语文法并引入了语义单元技术和类型参量,它们共同作用能有效的对产生的句子进行语义约束使得生成的句子合理[21]。Paris等人专注于探索聚合搜索和自然语言生成之间的相似之处,从而进一步推动搜索技术更好地为用户服务[22]。随着深度学习方法在自然语言处理上取得了重大突破,研究工作者将深度神经网络应用到了文本生成这一领域,2015年Karpathy提出了训练RNN字符级语言模型,该模型为RNN提供一大块文本,并要求它为给定一系列前序字符的序列中的下一个字符的概率分布建模并生成一个字符的新文本[23]。Guo等人首次提出了一种基于深度Q网络(DQN)的序列到序列学习的新方案,它迭代地解码输出序列[24]。在每次迭代中,采用编码器-解码器长期短期记忆(LSTM)网络来根据输入序列自动创建表示DQN的内部状态的特征并为DQN制定潜在动作列表;随着GoogleBrain和YoshuaBengio两个团队的在机器翻译相关研究领域的问题中提出了seq2seq模型,该模型将一个序列作为输入映射为另外一个输出序列,根据结构化数据生成文本的任务转化为翻译任务,在编码器端输入结构化数据,在解码器端得到目标文本[25][26]。2016年Zhang等人提出了一种利用长短期记忆和卷积神经网络(CNN)进行对抗性训练以生成真实文本的通用框架,在进行训练时,不再使用对抗神经网络标准,而是匹配特征分布进行训练,通过模仿输入的文本生成真实文本[27]。此外,文本生成质量的提升是当前大多数自然语言生成研究改进的方向,确保生成文本的逻辑清晰、语义连贯,克服自然语言生成领域的通病,一直是亟待解决的难点。1.3基于规则的文本生成研究与应用现状基于规则的文本生成方法,通常需要将内容选择和表层生成看作两个独立的子任务来完成。Hallett等在2006年提出了临床电子科学框架(CLEF)项目,该项目的任务是从代表患者病史记录的数据编码模型(编年史)中依据总结的类型和长度,基于规则的方式生成不同范围的患者临床病史的文本和图形摘要[28]。Turnertt等在2008年使用决策树(decisiontree)方法提出了一种基于空间参考框架生成地理参考数据文本摘要的方法[29]。此方法中,决策树的叶子代表数据内容,决策树的节点代表着事件,文本通过决策树的叶子中生成。Black等开发了一个帮助患有CCN(ComplexCommunicationNeeds1)的孩子们创作关于他们在学校的一天的故事的工具[30]。该工具使用自然语言生成(NLG)技术,根据儿童活动的传感器数据创建故事草稿,儿童可以对其进行编辑。Tintarev等于2016年进一步完善了该系统,提出了从非结构化数据中生成故事的三种可能方法:按语音记录进行聚类、按地点进行聚类或按时间进行聚类[31]。Soto等在2005年设计了GALiWeather的应用程序,该程序描述了模糊集生成天气预报的方法,从天气预报输入数据中提取相关信息,并使用语言变量和时间参考将其编码为中间描述,最后通过事件集生成天气预报[32]。Gkatzia等提出了两种基于规则的方法,第一种方法是基于WMO规则的系统,它使用WMO推荐的准则来报告不确定性,第二种使用的规则是通过观察专家(如BBC天气记者)制作天气预报的方式[33]。对于第二种方法在语言解释上较于第一种方法更为自然。对于国内外许多领域开发的数据到文本生成系统,这些系统全部或部分采用基于人工模板或规则框架的设计思想。虽然这种方法有局限性,但是模板的建立离不开人工的特征工程或者规则干预,模板和规则需要手工编写才能生成文本。生成的内容往往存在多样性、流畅性和连贯性的问题,但基于规则和模板的方法仍然是现阶段相关应用中最主流的做法。该方法具有明显的可解释性和可控性,可以轻松保证输出文本的正确性,生成高质量的文本。推导规则的主要方式是与专家合作或者从专家生成的语料库中获取知识。因此,基于规则的方法通常适用于特定的领域,生成的文本具有良好的可读性,这是大多数行业所使用的方法。根据上述基于规则的文本自动生成过程中所涉及到的方法研究,虽然国内NLG研究历程较短,但是在前人的研究基础上快速发展,由于中文与英文的区别,目前在教育领域的文本生成研究仍存在很多难点。1.4小学数学应用题自动生成研究与应用现状国外关于小学数学应用题在文本领域的研究起步较早,近年来有许多研究学者提出数学应用题解答的各种策略。国内学者马玉慧等人在现有研究基础上基于语义句模的小学数学应用题的语意理解方法,结合小学数学应用题中题目文本相对较短,语义成分相对较少的特点,构建了小学算术应用题语义句模,以此为基础实现应用题的语义理解[34]。邓冰瑜在自动解答框架中建立题目隐含数量关系组研究小学数学应用题中的数量单位体系相关内容[35]。Chiang提出了一种通过根据符号在文本中的语义操作符号来自动解决数学应用题的神经方法[36]。尽管保持语义的问题生成是智能学习系统中颇具挑战性和趣味性的研究领域,但对数学应用题生成的研究却很少。Wang等人提出了一种基于模板的递归神经网络数学表达式构造方法来解决数学应用题,首先应用seq2seq模型来预测树形结构模板,将推断的数字作为叶节点,将未知的运算符作为内部节点,设计一个递归神经网络,用Bi-LSTM对数据量进行编码,并自下而上地推断未知的算子节点[37]。该模型能大幅提高解题准确率。王磊提出了一种基于深度Q网络(DQN)和基于序列到序列(SEQ2SEQ)集成模型的数学应用题自动求解器,大幅提高了数学应用题的求解准确率[38]。张果将应用题知识表示方式以Kintsch提出的单步应用题知识表示框架为基础提出一种新的信息框架囊括了Kintsch的知识表示框架利用自然语言处理技术和谷歌神经网络机器翻译等相关技术作为理论基础研究了初等数学应用题的知识表示、语义理解和自动推演等核心内容且在此基础上实现了自动解答系统[39]。但是由于缺乏命名实体识别的语料库和不能正确提取文本隐藏关系,应用题解自动解答稍显不足。近年来数学应用题生成策略引起了许多学者的关注,许多研究者已经提出了各种各样的方法来自动生成数学应用题以及英语语言的公式生成。最近,在数学应用题生成领域Williams等人通过新的策略生成数学应用题,这种策略从不受限制的领域中的本体生成数学应用题[40]。它建立在现有的本体谓词上,该谓词将以WebOntologyLanguage(OWL)编写的逻辑语句呈现为英语句子。另一方面,Ahmed等人提出了自动模板形成[41],Andersen等人和Singh等人提出了半自动模板来生成数学应用题[42][43]。然而,Sadigh等人提出了一种基于模板的问题分类方法,并概述了基于变异和可满足性求解的问题和解决方案生成的方法[44]。尽管他们的具体方法各不相同,但他们都遵循相似的方式:他们首先从一个样本问题形成一个模板,然后使用一个模板生成一组问题。不少其他学者提出了各种生成数学应用题的方法[45]。起初建立了一种自动应用题生成机制,其中Deane提出了自然语言生成使用框架语义[46]。Deane认为虽然自然语言处理技术适用于一般性的语言项目,但数学应用题是自然语言技术较容易处理的目标,他提出了框架语义学方法用以生成应用题,它不仅可以作为对数学应用题至关重要的类属概念结构的表示,也可以为自然语言生成提供基础。Polozov等人通过个性化设定生成的方法也建立在自然语言生成的相同架构之上,其中应用题生成逻辑还包括回答集编程(AnswerSetPrograming),以满足个性化教学和叙事要求[47]。为了激发学生参与应用问题的兴趣,Koncel-Kedziorski提出了一种主题重写的方法,如星球大战相关主题,使用应用题作为语言模板,简单地用新主题中合适的词替换名词和动词,将同一问题重写为更有趣的主题[48]。上述两个研究依赖于模板最终产生问题。这将限制生成的问题遵循一定的模式,从而扼杀了创造性。以上研究主要基于模板的系统的生成大多数是基于具有高度一致性的现有项目,相对较少的研究涉及生成新的数学应用题的问题。随着神经网络的兴起,Zhou等人提出了一种数学应用题生成(MAGNET)的神经网络模型来从给定的方程和主题生成数学应用题,其主要由主题和方程式的Encoder和数学应用题的Decoder组成,可以动态地从方程和主题词中提取信息,同时也能确保生成的应用题与给定的方程高度相关[49]。Liyanage也提出了一种LSTM的使用,该网络能够在满足语言特定的形态和句法特征的限制约束的同时生成初级数学应用题,该方法将字符嵌入、单词嵌入和词性(POS)标记嵌入的组合提供给LSTM,其中提供了对数值和单位的关注[50]。以上两种研究不再局限于基于模板的应用题生成,而是通过神经网络模型生成数学应用题,使应用题的生成不再单调。综上,从国内外学者的综合研究来看,在小学数学应用题自动生成和自动解答研究的领域中,国外学者有大量的相关研究,但是,我国对于数学应用题生成的研究文献相对较少,忽略了数学应用题生成的研究。因此,本文参照自然语言处理技术在教育领域的应用,构建了小学算术应用题的语义句模,依据语义句模进行题目生成,提高学生算术应用题的解题能力,逐步形成运用数学知识的意识,同时可以促进算术应用题教学的发展。参考文献[1]张庆林,管鹏.小学生表征应用题的元认知分析[J].心理发展与教育,1997,13(3):11-14.[2]姚飞,张大均.应用题结构分析训练对提高小学生解题能力的实验研究[D].,1999.[3]何小亚.数学应用题教学的实践与思考[J].数学通报,2000,4:23-24.[4]纪桂萍,焦书兰,何海东.小学生数学问题解决与心理表征[J].1996.[5]倪印东,庄传侠.摸清解题障碍改革应用题教学[J].山东教育,2001,28.[6]刘四新.初中生应用题解题困难分析[D].,2007.[7]AnandPG,RossSM.Usingcomputer-assistedinstructiontopersonalizearithmeticmaterialsforelementaryschoolchildren[J].Journalofeducationalpsychology,1987,79(1):72.[8]MontagueM,BosCS.Cognitiveandmetacognitivecharacteristicsofeighthgradestudents'mathematicalproblemsolving[J].Learningandindividualdifferences,1990,2(3):371-388.[9]MayerRE.Thinking,problemsolving,cognition[M].WHFreeman/TimesBooks/HenryHolt&Co,1992.[10]张璟,沃建中,林崇德.自我反思对初中生解题策略的影响[J].应用心理学,2005,11(4):302-306.[11]姜海宏.小学高年级数学应用题解题能力的培养[J].教书育人,2013,28.[12]DellarosaD.Abstractionofproblem-typeschematathroughproblemcomparison[J].1985.[13]SwellerJ.Cognitivetechnology:Someproceduresforfacilitatinglearningandproblemsolvinginmathematicsandscience[J].Journalofeducationalpsychology,1989,81(4):457.[14]ReiterE,DaleR.Buildingappliednaturallanguagegenerationsystems[J].NaturalLanguageEngineering,1997,3(1):57-87.[15]BontchevaK,WilksY.Automaticreportgenerationfromontologies:theMIAKTapproach[C]//Internationalconferenceonapplicationofnaturallanguagetoinformationsystems.Springer,Berlin,Heidelberg,2004:324-335.[16]delosÁngelesAlonso-LaverniaM,De-la-Cruz-RiveraAV,SidorovG.Generationofnaturallanguageexplanationsofrulesinanexpertsystem[C]//InternationalConferenceonIntelligentTextProcessingandComputationalLinguistic

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论