版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
……装:………订…戈2026年哈尔滨市高考第二次模拟考试……装:………订…戈本试卷共23题,共150分,共10页。考试结束后,将本试卷和答题卡一并交回。一、阅读(72分)(一)阅读I(本题共5小题,19分)第1页(共10页)段”。那么,如何判断一个语素成词不成词呢?第一条,可以单独作为一句话来说的,比如可以回答问话的,这是词。第二条,一句话里边把所有可以单说的部分都提开,剩下来不能单说,可也不是一个词的一部分的,也是词。例如“我下午再来”这句话里边,把“我、下午、来”提开,剩下“再”是一个词,虽然它不能单说。可是如果在“比赛现在开始”这句话里边,把“比赛、现在”提开之后,又把“开”提开,说“始”是剩余下来的词,那就不对,因为“始”是“开始”这个词的一部分。上面定义里边说的“自由活动”,不但包括“来”这一类语素,也包括“再”这一类语素,但是不包括“始”这一类语素。大概说来,能单说的多数是实词,少数是虚词;大多数虚词是菲第二条划出来的,少数实词也靠这一条。(摘编自吕叔湘(汉语语法分析问题》)在语言模型中,词元是文本经过切分或字节级编码后得到的最小离散单元。它既可能是人类语言意义上的词串、单个词,也可能是词根、词缀、子词或单个字符。语言模型通过对词元序列建模,展现出一定的智能水平。在“词元”这一定名中,“词”点明其在语言场景下的根源,体现出词元与表达对象语义的密切关联:“元”传达出“基本单元”之意,与“元素”等术语中的“元”保持一致的语义脉络。“词元”一词可以将“作为语言基本语义单元”这一最初本质清晰表达出来,更贴合其在人工智能中的初始角色。随着大模型从纯文本走向多模态(图像、语音、视频等),词元的所指已经扩展。图像被切分为“图像块”并映射为嵌入序列,语音片段可以被量化编码为离散单元,这些单元在多模态模型中同样被称为词元,主要建模手段仍为序列模型。此时“词元”中的“词”在这里超越了人类语言意义上的“词”,却能暗合术语命名中普遍存在的类比思维——将非这种语义普遍存在于所有模态之中。怎么理解词元?简单来说,词元是人工智能大模型为了高效处理数据,把数据进行拆分后的“最小信息载体”,可以理解为“字/词片段/符号”等。比如“我爱中国!”,可拆分如果说互联网时代信息传输的核心度量是“流量”,那么人工智能时代,这一关键指标正变为词元——用户输入的每一个字,模型生成的每一段话、识别的每一幅图像,都在消耗词元。这看似很抽象,实际上,每一次词元消耗都对应着真实的场景交互——可能是银行智能客服作出的一笔贷款咨询,是汽车智能座舱处理的一句语音指令,或是编程助手输出的数行复杂代码。词元消耗量爆发式增长,意味着越来越多人工智能应用落地,越来越多个人用户、企业客户在使用智能工具解决问题、提高效率。词元消耗增长与应用落地强绑定的特性,使其成为衡量人工智能产业景气度的重要晴雨表。以长远视角观之,随着我国人工智能产业创新活力的不断释放,词元消耗量的增长不仅具有短期爆发力,还有长期持续性。(摘编自王云杉《漫谈词元》)段”。那么,如何判断一个语素成词不成词呢?第一条,可以单独作为一句话来说的,比如可以回答问话的,这是词。第二条,一句话里边把所有可以单说的部分都提开,剩下来不能单说,可也不是一个词的一部分的,也是词。例如“我下午再来”这句话里边,把“我、下午、来”提开,剩下“再”是一个词,虽然它不能单说。可是如果在“比赛现在开始”这句话里边,把“比赛、现在”提开之后,又把“开”提开,说“始”是剩余下来的词,那就不对,因为“始”是“开始”这个词的一部分。上面定义里边说的“自由活动”,不但包括“来”这一类语素,也包括“再”这一类语素,但是不包括“始”这一类语素。1.下列对材料相关内容的理解和分析,不正确的一项是(3分)A、分析语言片段的结构,要先把它分解成不间层级的月段,确定了这些片段的单位,才能够对语、做语法分析B.用语素比用词素做最小的语法单位要好,因为把词划分好后,才能划分词素,把词素划分好,才能划分语素。D.语素与词元都是各自体系内最小的不可再分的基本单位,但二者的功能、作用以及使用领域等方面各不相同。2.下列对材料相关内容的分析和评价,不正确的一项是(3分)A、材料一指出汉语语素划分存在一些争议,有些双音节词,如“什么”,还是难以界B.材料一认为判断一个语素是否为“词”,可以有两条标准,符合第一条的多数是实词,符合第二条的多数是虚词。C.材料二中词元的“词”由语言意义扩展到非文本模态,这种用法与“词云”类似,反映了术语命名中的类比思维。3.根据材料内容,下列说法不正确的一项是(3分)C.一个汉字或者标点都可以是一个词元。D.由声波构成的语音无法切分为词元。4.材料一使用一根绳子“切不切成两段”“掰不掰成两股”谈语素问题,请简析其作用。5.材料二和材料三都介绍“词元”,二者在表述方式和语言风格上有什么不同?请结合材料谈谈你的认识。(6分)(二)阅读Ⅱ(本题共4小题,18分)最先叩醒大地的,总是那些蛰伏在泥土里的生命。荠菜的叶子,如同大地摊开的掌心,掌纹是羽状的,细密的绒毛上缀满了破晓的霜晶。它们一丛丛依偎着、蜷缩着、舒展着、奔放着,却都恪守着各自的分寸,像遵循某种古老的乡野契约。《诗经》里那句“谁谓茶苦,其甘如荠”被风吹拂了两千多个春秋,依然能在早春的寒气中觅得知音——那是先民俯身大地时,舌尖最先辨认的、属于荒野的甘醇。当线术的冰晶尚在梦里呻吟,众早伏整缩于冻土深处,它已牟先顶破板结的肃气,将铝为状的绿意举向依旧冰冻的天空。这并非匆忙,而是与时节达成的千古默契,在最货瘩的时间里,以最丰盈的方式,迅捷完成生命庄严的传递。春秋的风掠过那地原野,《诗经·那风·谷风》里的“谁谓荼苦?其甘如荠”,将这株贴地而生的草木,揉进了华夏数千年的烟火与征途。彼时的先民从苦菜与荠菜的滋味对比中,读懂了这株野菜最朴素的温柔——生于田埂、长于溪畔,不挑水土,不矜姿态,却能在饥寒时,以一抹清甜慰藉生民。这是荠菜最初的模样,也是它跨越两千多年,始终与中(三)阅读[11(本题共5小题,20分)阅读下面的文言文,完成10—14题。材料一(节选自《公经百會》)第6页(共10页)A.
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 广西柳州市2026届高三上学期二模数学试题(解析版)
- 动力电池污水处理工程方案
- 机场施工工程风险分析与管控实施方案
- 金融保险试题及答案
- 护理护理实践中的风险评估
- 公共建筑光伏一体化发电系统BIPV设计
- 城区排水管网提质改造排水调蓄方案
- 冰上运动中心建设项目环境影响报告书
- 《构网型独立储能电站惯量支撑技术方案》
- 《既有建筑民俗空间设计任务书编制方案》
- 2026年监考员考务工作培训试题及答案新编
- 2025年中国铁路哈尔滨局集团有限公司招聘294人参考笔试题库及答案解析
- 2025年生物长沙中考真题及答案
- 牛津树分级阅读绘本课件
- 职业教育考试真题及答案
- 2026年企业出口管制合规体系建设培训课件与体系搭建
- 劳动仲裁典型案件课件
- 化学品泄漏事故应急洗消处理预案
- 2025年小学生诗词大赛题库及答案
- 员工工龄连接协议书
- 2025年新修订版《森林草原防灭火条例》全文+修订宣贯解读课件(原创)
评论
0/150
提交评论