版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
一、为什么教:从课程标准到真实需求的双向锚定演讲人为什么教:从课程标准到真实需求的双向锚定01怎么教:从课堂实施到素养提升的深度融合02教什么:从概念解析到实践路径的分层设计03总结:命名实体识别的教学价值与未来展望04目录2025高中信息技术数据与计算的命名实体识别实践案例课件各位同仁、同学们:今天,我想以一线信息技术教师的视角,和大家分享一个与“数据与计算”核心素养紧密相关的实践案例——高中阶段命名实体识别(NamedEntityRecognition,NER)的教学探索。作为人工智能自然语言处理(NLP)领域的基础任务,NER不仅是“数据与计算”模块的典型应用场景,更能帮助学生从“被动接收信息”转向“主动分析数据”,在动手实践中理解技术原理,培养计算思维。接下来,我将从“为什么教”“教什么”“怎么教”三个维度展开,结合近三年带学生实践的经验,为大家呈现一个可复制、可调整的教学方案。01为什么教:从课程标准到真实需求的双向锚定1课程标准的明确指向《普通高中信息技术课程标准(2017年版2020年修订)》在“数据与计算”模块中明确要求:“学生应能通过分析典型案例,了解人工智能的主要特征,体验人工智能技术对人类社会的影响”。具体到“数据处理与分析”部分,更强调“能利用工具处理结构化与非结构化数据,提取有价值的信息”。NER作为从非结构化文本(如新闻、社交平台内容、校园公告)中提取关键实体(人名、地名、机构名、时间等)的核心技术,恰好是落实这一要求的优质载体。2学生认知的现实需求我在教学中观察到,高中生对“人工智能”的认知常停留在“人脸识别”“智能对话”等直观应用层面,对底层数据处理逻辑缺乏深入理解。例如,当学生看到“校报中某活动的时间地点被自动提取”时,往往会问:“机器是怎么‘看懂’这些文字的?”NER的实践能直接解答这类问题——它本质是让计算机学会“标记”文本中的关键信息,将无序的文本转化为结构化数据。这种“从现象到本质”的探索,能有效激发学生的技术好奇心。3社会发展的能力导向当前,无论是新闻信息筛选、用户评论分析,还是教育领域的学习行为数据挖掘,都需要对海量文本进行快速实体提取。以我校为例,每年新生入学时,学生会提交数百份“社团活动申请”,若人工提取“活动名称”“负责人”“时间”等信息,效率极低;而通过简单的NER模型,30分钟内即可完成所有申请的信息结构化。让学生掌握这一技术,本质是培养他们“用技术解决真实问题”的能力,这正是信息时代核心素养的体现。02教什么:从概念解析到实践路径的分层设计1核心概念:用“生活化类比”降低理解门槛针对高中生的知识基础,我将NER定义为“给文本中的‘关键角色’贴标签”。例如,在句子“3月15日,高二(3)班张明同学在科技节上展示了自制的智能垃圾分类装置”中,“3月15日”是时间实体(Temporal),“高二(3)班”是机构实体(Organization),“张明”是人名实体(Person),“智能垃圾分类装置”是产品实体(Product)。通过这种“贴标签”的类比,学生能快速理解NER的核心任务——从非结构化文本中识别并分类特定类型的实体。需要强调的是,NER的“实体类型”并非固定,可根据任务需求调整。例如,在分析“校园新闻”时,我们可能关注“活动名称”“主办部门”“参与人数”;在分析“学生日记”时,可能关注“情绪关键词”“事件地点”。这种灵活性正是NER的魅力所在,也为学生的个性化实践提供了空间。2技术原理:从“规则匹配”到“机器学习”的渐进式渗透考虑到高中生的数学基础(尚未系统学习概率论与深度学习),我将NER的技术路径简化为三个阶段:2技术原理:从“规则匹配”到“机器学习”的渐进式渗透2.1规则匹配(基础版)最原始的NER方法是基于预定义的规则或词典。例如,我们可以建立一个“校园人名词典”(如“李华”“王雨桐”)和“校园地点词典”(如“科技楼301”“操场主席台”),当文本中出现词典中的词汇时,自动标记为对应实体。这种方法的优点是简单易懂(学生用Excel就能制作词典),缺点是无法处理未收录的新词(如转学生的名字)或复杂表述(如“咱们班的学习委员”)。2技术原理:从“规则匹配”到“机器学习”的渐进式渗透2.2统计学习(进阶版)当学生掌握Python基础后,可以引入统计学习模型(如条件随机场CRF)。这类模型通过分析文本中的“上下文特征”(如前后词、词性)来判断实体边界。例如,“在[科技楼]举办”中,“举办”常与地点搭配,因此“科技楼”更可能是地点实体。我曾带学生用“人民日报语料库”训练CRF模型,虽然准确率仅70%左右,但学生能直观看到“数据量越大,模型越聪明”的规律。2技术原理:从“规则匹配”到“机器学习”的渐进式渗透2.3深度学习(拓展版)对于学有余力的学生,可简单介绍BERT等预训练模型的原理(如“通过大量文本学习语言规律,再针对特定任务微调”),并提供HuggingFace等平台的在线工具,让他们体验“零代码调用预训练模型”的便捷。例如,输入“2024年校运会将于10月28日在新操场举行,学生会负责组织”,模型能自动输出:时间(2024年10月28日)、地点(新操场)、机构(学生会)。这种“高门槛技术的低门槛使用”,既能激发学生的探索欲,又避免了因代码复杂导致的挫败感。3实践路径:“问题驱动—工具选择—结果验证”的闭环设计结合高中课时安排(通常2-3个课时),我将实践路径设计为“1个真实问题+2种工具选择+3步结果验证”,确保学生能在有限时间内完成从“需求分析”到“成果输出”的完整流程。3实践路径:“问题驱动—工具选择—结果验证”的闭环设计3.1问题选择:贴近学生生活的“小而美”任务我优先选择学生熟悉的场景,例如:任务1:分析校公众号近3个月的推文,提取“活动名称”“主办部门”“参与人数”,生成《校园活动统计表》;任务2:整理班级日志中的“好人好事”记录,提取“事件主角”“时间”“地点”,制作《班级温暖瞬间海报》。这些任务的好处是数据易获取(校公众号可爬取,班级日志由学生自己记录)、目标明确(输出可展示的成果),能有效调动学生的参与感。3实践路径:“问题驱动—工具选择—结果验证”的闭环设计3.2工具选择:兼顾易用性与教育性根据学生的技术水平,提供两类工具:低代码工具:如腾讯云NLP平台、百度飞桨PaddleNLP的在线API。学生只需注册账号,复制文本到输入框,即可获取实体识别结果(如图1)。这种工具适合技术基础薄弱的学生,重点培养“需求-工具匹配”的思维。代码工具:基于Python的spaCy库(英文)或LAC(百度的中文分词与实体识别工具)。例如,使用LAC的代码仅需5行:fromLACimportLAClac=LAC(mode='lac')#加载模型text='下周一下午3点,高二(5)班在图书馆二楼举办读书分享会'result=lac.run(text)#执行识别3实践路径:“问题驱动—工具选择—结果验证”的闭环设计3.2工具选择:兼顾易用性与教育性print(result)#输出:[['下周','周一','下午','3点','高二','(5)班','在','图书馆','二楼','举办','读书','分享会'],['TIME','TIME','TIME','TIME','ORG','ORG','O','LOC','LOC','O','O','O']]学生通过修改文本内容,能直观看到模型输出的变化,理解“实体标签”与“文本内容”的对应关系。3实践路径:“问题驱动—工具选择—结果验证”的闭环设计3.3结果验证:从“准确率”到“实用性”的多元评估A实践中,我要求学生从三个维度验证结果:B准确率:随机抽取10条文本,人工标注实体,计算模型正确识别的比例(如8/10则准确率80%);C漏报率:统计模型未识别的关键实体(如漏掉“读书分享会”这一活动名称);D实用性:评估结果能否直接用于后续任务(如《校园活动统计表》是否需要人工补充信息)。E通过这种评估,学生能深刻理解“技术不是万能的”,并思考改进方向(如扩充自定义词典、调整模型参数)。03怎么教:从课堂实施到素养提升的深度融合1情境导入:用“学生困惑”引发认知冲突课堂伊始,我会展示两则真实案例:案例1:校学生会整理“社团招新问卷”时,发现100份问卷中,“期望加入的社团”一栏填写混乱(如“机器人社”“机器人社团”“机社”),人工合并耗时2小时;案例2:学生小明想统计自己半年的日记中“开心事件”的发生频率,但手动标注“开心”相关的时间、地点、人物需要半天。然后提问:“如果用计算机自动提取这些关键信息,你们觉得可能吗?需要计算机‘学会’什么?”这种“用学生的问题引出技术”的方式,能快速激活他们的参与欲。2分层教学:满足不同水平学生的学习需求考虑到学生的技术基础差异,我将实践活动分为“基础层”“进阶层”“挑战层”:基础层(60%学生):使用低代码工具完成校公众号推文的实体提取,输出包含“活动名称”“时间”的统计表;进阶层(30%学生):用Python调用LAC模型,自定义“活动名称”标签(如将“读书分享会”标记为EVENT),并分析模型漏报原因;挑战层(10%学生):尝试用Excel制作简单的规则词典(如将“社”“社团”结尾的词标记为ORG),与模型结果对比,撰写《规则匹配vs机器学习效果分析报告》。这种分层设计既保证了全体学生的参与感,又为学有余力的学生提供了探索空间。例如,2023届学生小吴在挑战层中发现,规则匹配对“固定表述”(如“XX社团”)的准确率达100%,但对“口语化表述”(如“咱们的机器人小组”)完全失效;而机器学习模型虽然能识别“机器人小组”为ORG,但会误标“小组”为ORG。这种对比分析,让他深刻理解了两种技术的适用场景。3反思迁移:从“做任务”到“用思维”的升华实践结束后,我会引导学生思考三个问题:技术局限性:“为什么模型会漏标‘新转学生的名字’?如何解决?”(引出“领域适配”“数据更新”的重要性);伦理问题:“如果用NER分析学生日记中的隐私信息(如家庭矛盾),可能带来什么风险?”(培养数据安全意识);生活应用:“除了校园场景,NER还能帮助我们解决哪些生活问题?”(如旅行时自动提取攻略中的“景点”“美食”,购物时提取评论中的“产品优缺点”)。这些问题的讨论,能将“技术操作”升华为“计算思维”与“信息社会责任”的培养。例如,有学生提出:“可以用NER分析班级群聊中的‘作业求助’信息,自动汇总高频问题,帮助老师针对性讲解。”这种“技术服务于生活”的思维,正是我们希望学生形成的核心素养。04总结:命名实体识别的教学价值与未来展望总结:命名实体识别的教学价值与未来展望回顾整个实践过程,命名实体识别在高中信息技术课堂中的价值,远不止于让学生“学会一个技术”,更在于:1知识维度:串联了“数据采集—数据清洗—数据建模—数据应用”的全流程,深化了学生对“数据与计算”核心概念的理解;2能力维度:培养了“问题抽象—工具选择—结果验证”的计算思维,以及“合作探究—反思改进”的实践能力;3素养维度:让学生在真实任务中体会技术的“工具性”与“局限性”,形成“合理使用技术”的信息社会责任。4总结:命名实体识别的教学价值与未来展望作为一线教师,我也在思考未来的优化方向:例如,引入“跨学科融合”(如结合语文的“文本分析”,历史的“
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 急救护理骨科护理培训
- 护理计划制定技巧
- 护理面试面试成功全攻略
- 护理查房中的团队合作
- 急危患者血糖管理护理
- 护理人文关怀与患者满意度
- 急诊科护理体温监护与护理
- 恩施网络安全责任制度
- 户政管理责任制度
- 托管帮扶主体责任制度
- 老旧小区防火门改造方案
- 工程项目管理-东南大学成虎
- 《湖南省房屋建筑工程指标指数测算标准》
- 《干部履历表》(1999版电子版)
- 《市场营销策划学》国家课程
- 特殊幼儿、残疾幼儿随班就读工作管理制度
- AQ 1083-2011 煤矿建设安全规范 (正式版)
- 双臂操作助行器 要求和试验方法 第2部分:轮式助行器
- 智慧物流与供应链管理全套教学课件
- 公务员历史常识100题附完整答案(各地真题)
- 大学生就业指导 第5版 课件 模块一 大学生就业指导
评论
0/150
提交评论