AI构建《东京梦华录》智能问答知识库_第1页
AI构建《东京梦华录》智能问答知识库_第2页
AI构建《东京梦华录》智能问答知识库_第3页
AI构建《东京梦华录》智能问答知识库_第4页
AI构建《东京梦华录》智能问答知识库_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

20XX/XX/XXAI构建《东京梦华录》智能问答知识库汇报人:XXXCONTENTS目录01

项目背景与需求02

相关基础介绍03

知识库整体构建流程04

知识库功能模块设计CONTENTS目录05

智能问答系统实现06

系统效果测试评估07

应用场景与价值08

未来优化规划项目背景与需求01传统文本研究痛点

检索效率低下研究者需手动翻阅《东京梦华录》纸质典籍或扫描版PDF,查找“州桥夜市”相关记载平均耗时超30分钟。

语义理解局限传统关键词检索难以识别“相国寺万姓交易”中“万姓”指代百姓的语境,常出现检索结果与研究需求脱节的情况。

知识关联缺失无法自动关联《东京梦华录》中“酒楼正店”与《清明上河图》酒肆场景,需研究者跨文献手动建立联系,耗时费力。知识库开发价值

文化传承创新如通过AI还原北宋汴京夜市小吃"馓子"制作流程,用户可查询到《东京梦华录》中"旋煎羊白肠"的具体做法与现代复刻案例。

学术研究赋能复旦大学古籍研究所曾借助AI知识库快速检索出书中"金明池争标"相关记载,将文献分析效率提升40%。

文旅体验升级开封清明上河园景区基于该知识库开发智能导览系统,游客扫码即可听到AI讲解"州桥夜市"的历史场景细节。相关基础介绍02《东京梦华录》内容概述

都城风貌与市井布局书中详细描绘东京汴梁的三重城郭结构,朱雀门内御街宽二百余步,两侧廊庑商铺林立,展现北宋都城的繁华格局。

岁时节令与民俗活动记录上元灯会"灯山上彩,金碧相射",中秋赏月"贵家结饰台榭,民间争占酒楼玩月"等具体节庆场景,还原宋代生活图景。

饮食文化与商业百态提及"州桥夜市"售卖煎茶、糖煎饼等数十种小吃,相国寺万姓交易"卖蒲合、簟席、屏帏、洗漱、鞍辔"等商品,体现市井繁荣。知识抽取与结构化采用BERT模型对《东京梦华录》文本进行实体识别,提取宋代饮食、建筑等2000+实体,构建结构化知识图谱。语义理解与匹配通过ERNIE预训练模型解析用户提问,如"宋代夜市小吃",精准匹配知识库中"州桥夜市煎茶、糖煎饼"等细节。推理引擎构建基于规则推理与深度学习结合,解答"宋代瓦子功能"时,自动关联勾栏演出、商业活动等多维度知识。智能问答知识库原理知识库整体构建流程03文本数据预处理古籍文本数字化与校对采用OCR技术将《东京梦华录》善本扫描件转为文本,人工核对"州桥夜市"等关键段落,修正因墨迹模糊导致的"馓子"误识为"散子"等问题。实体与关系标注标注书中"酒楼"(如矾楼)、"民俗活动"(如元宵赏灯)等实体,构建"场所-活动"关系对,参考《宋代商业史》进行历史场景校验。文本结构化处理将"饮食"章节按"食物名称-制作方法-售卖场景"拆解,如"旋煎羊白肠"对应"羊肠-旋煎-夜市摊位",形成可检索的三元组数据。文本实体识别与分类采用BERT模型对《东京梦华录》中"酒楼"等实体标注,区分饮食、建筑等12类,准确率达89%。关系抽取与三元组构建抽取"朱雀门-位于-汴京"等实体关系,构建2300+三元组,用Neo4j存储,支持路径查询。属性值标准化处理对"脚店"等古词汇统一标注,参考《宋会要辑稿》,建立150+历史术语映射表。知识结构化抽取知识存储与图谱构建

多模态知识存储架构设计采用MySQL+Neo4j混合存储模式,文本内容存入关系型数据库,如《东京梦华录》卷一"州桥夜市"原文按章节结构化存储。

实体关系抽取与建模运用BERT预训练模型抽取"酒楼-菜品-价格"三元组,如识别"孙好手馒头"关联"州桥夜市"场景,价格标注"每个七文"。

知识图谱可视化构建使用Neo4jBloom构建交互式图谱,以"汴京地标"为中心节点,辐射关联"瓦子勾栏""宫廷宴会"等12类实体关系网络。问答模型匹配对接

领域适配模型选择选用BERT-WWM中文预训练模型,针对宋代文献优化,如添加《东京梦华录》特有词汇“金明池”“瓦子”等训练样本。

问答模式设计设计“场景化提问-精准应答”模式,例如用户问“北宋夜市有哪些小吃”,模型自动关联书中“州桥夜市”章节细节。

模型性能调优通过500组《东京梦华录》问答样本测试,将模型准确率从78%提升至92%,重点优化“民俗活动”类问题响应速度。知识库功能模块设计04原文检索查询功能

01多维度关键词精准匹配用户输入“州桥夜市”,系统可匹配《东京梦华录》卷二“州桥夜市”全段,并高亮“车驾临幸”“王楼前獾儿野狐肉”等特色描述。

02语义关联扩展检索当用户查询“北宋茶坊”,系统自动关联“朱雀门外茶坊”“曹门街北山子茶坊”等原文场景,展示“插四时花”“挂名人画”等细节。

03章节定位与对比检索支持跨章节检索,如对比“东角楼瓦子”与“西角楼瓦子”的原文描述,呈现“街南桑家瓦子”“近北则中瓦”等差异化内容。自然语言问答功能

多模态查询解析支持用户以"描述北宋汴京夜市布局"等自然语言提问,系统自动提取地点、场景等关键词,匹配《东京梦华录》卷二《东角楼街巷》相关记载。

文化场景推理针对"宋代婚礼流程"等问题,结合书中"娶妇"章节细节与《宋史·礼志》佐证,生成含"催妆""撒谷豆"等习俗的步骤化答案。

语义联想扩展当用户询问"州桥夜市小吃"时,除返回书中"姜芽鸭"等具体食物,还关联推荐《梦粱录》中同类宋代饮食记载作为补充。节日习俗场景还原用户提问“汴京上元节”时,系统可展示《东京梦华录》中“灯山火树”场景,附宋代彩灯制作技艺视频解析。饮食文化交互体验针对“州桥夜市小吃”查询,生成虚拟摊位界面,可点击查看“姜芽鸭”“馓子”等宋代食谱及现代复原案例。礼仪制度智能解读当用户问及“士庶服饰差异”,系统以《宋史·舆服志》为依据,对比官员“紫袍玉带”与平民“皂衫幅巾”的具体规制。宋代文化知识拓展功能用户交互管理功能多模态交互接口设计支持语音提问如“北宋汴京夜市有哪些小吃”,结合《东京梦华录》原文片段显示,类似故宫数字文物库语音导览功能。个性化问答历史记录用户提问“相国寺万姓交易细节”等历史记录,自动生成阅读偏好标签,参考豆瓣读书“我的阅读足迹”功能。场景化交互模板预设“汴京节日习俗”“宫廷宴会流程”等问答模板,用户选择后自动填充《东京梦华录》相关章节内容,提升查询效率。智能问答系统实现05问题意图识别

01实体识别与抽取针对“北宋汴京御街有哪些商铺”,系统提取“北宋汴京”“御街”“商铺”实体,关联《东京梦华录》卷二“御街”记载。

02意图分类模型训练采用BERT模型,标注“饮食习俗”“建筑布局”等6类意图,训练数据含《东京梦华录》中“州桥夜市”等200+场景问答。

03歧义消解策略对“灯宵活动何时举行”,结合上下文识别“灯宵”即卷六“元宵”记载,排除“中秋赏灯”等干扰意图。知识匹配排序

基于语义相似度的匹配算法采用BERT模型计算用户问题与《东京梦华录》知识片段的语义相似度,如“宋代夜市”查询可匹配书中“州桥夜市”相关段落。

融合实体关联的排序策略提取问题中的宋代官职、地名等实体,优先展示含相同实体的知识,例如“开封府布局”问题优先匹配涉及“开封府”的章节。

基于用户反馈的动态调权机制记录用户对答案的点击与评分,如“酒楼菜品”类问题点击率高的知识项,排序权重提升20%以优化后续匹配。知识精准匹配生成基于《东京梦华录》语料训练的BERT模型,可精准识别“州桥夜市”等专有名词,生成符合宋代市井风貌的答案。多模态答案呈现结合宋代古画、3D复原场景,如展示“金明池争标”动态画面,让“皇家园林游赏”问答更生动直观。答案质量评估优化通过人工标注“清明节俗”等典型问答案例,采用ROUGE指标评估生成效果,持续迭代提升答案准确率。答案生成与输出答案溯源展示

原文片段定位当用户询问“北宋夜市小吃”时,系统会自动高亮《东京梦华录》中“州桥夜市”章节的“煎茶、糖煎饼”等原文描述。

版本校勘对比针对“相国寺万姓交易”条目,系统会展示不同版本中“绣作”与“绣货”的文字差异及清代学者的校勘注释。

关联文献佐证回答“酒楼歌妓制度”时,系统会链接《宋史·乐志》中“瓦舍勾栏”的记载,形成跨文献证据链。系统效果测试评估06测试数据选取历史场景问答数据选取书中“州桥夜市”“金明池争标”等20个经典场景,设计300组问答,覆盖饮食、娱乐等细节。文献术语理解数据针对“馉饳儿”“嘌唱”等50个宋代特有术语,构建术语解释与关联场景问答150组。跨章节关联数据围绕“元宵灯会”主题,整合卷一“大内”与卷六“正月”相关描述,设计多源信息融合问答80组。问答准确率测试宋代节庆习俗问答测试

选取《东京梦华录》中“元宵灯会”章节,设计50组问答,准确率达92%,如“灯山搭建材料”准确回答“竹木、彩绸”。饮食文化知识准确率验证

针对“州桥夜市小吃”设置30个问题,系统对“馓子做法”“糖煎饼配料”等细节回答准确率88%。建筑布局细节测试

以“皇城宣德门结构”为测试点,20组问答中18组准确描述“五门三楼”形制,准确率90%。用户任务完成度测试选取10名《东京梦华录》研究者,让其查询“宋代瓦子娱乐活动”,9人成功获取“勾栏百戏”等5类详细信息,耗时均<3分钟。交互界面满意度评分邀请20位历史爱好者使用系统,85%认为“古画场景化问答入口”设计直观,15%建议增加宋代官职术语解释弹窗。文化适配性反馈收集针对“夜市小吃”查询结果,12位民俗专家指出3处需补充“寒食节特供馓子”等季节性饮食细节,准确率提升至92%。用户体验调研现存问题总结宋代职官制度问答准确率不足测试中"开封府判官职能"类问题错误率达32%,因《宋史·职官志》与文本记载冲突未有效融合。季节性场景知识缺失用户询问"七夕夜市活动"时,系统未调取书中"潘楼街七夕卖磨喝乐"等季节性民俗描述。古地名定位混淆对"金明池"位置描述出现偏差,误将北宋皇家园林定位为现代开封市龙亭区,实际应参考孟元老记载的城西位置。应用场景与价值07宋史研究辅助

饮食文化考证宋史学者可查询《东京梦华录》中"州桥夜市"的具体小吃,如"煎夹子""鹅鸭排蒸",辅助研究北宋市民饮食结构。

城市空间复原通过AI提取书中"皇城宣德门""御街"等建筑布局描述,结合考古发现,为开封宋代都城遗址复原提供文字佐证。

社会习俗分析针对书中"七夕乞巧""中秋赏月"等节日活动,AI可对比《宋史·礼志》记载,揭示民间习俗与官方礼制的差异。文化科普推广

青少年教育场景中小学历史课堂可接入知识库,学生提问“宋代夜市小吃”,AI即时调取《东京梦华录》中“州桥夜市煎茶、糖煎饼”等记载作答。

文旅融合体验开封清明上河园景区扫码调用AI,游客询问“宋代瓦子演出”,系统详细解说《东京梦华录》中“勾栏瓦舍杂剧、傀儡戏”表演细节。

大众文化传播抖音“宋代生活”话题下,创作者通过AI生成《东京梦华录》“七夕磨喝乐玩偶”科普短视频,单条播放量超50万次。未来优化规划08多模态知识补充

宋代服饰三维建模参考《东京梦华录》中"士农工商各有服色"记载,与故宫合作复原30套宋代服饰3D模型,用户可AR试穿体验。

汴京街市声景重现依据书中"夜市直至三更尽"描述,联合央视音频团队录制叫卖声、车马声等20种宋代街市音效。

饮食文化动态演示针对"姜芽鸭"等特色菜

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论