版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数字人文发展概况CONTENTS目录01
数字人文的定义与历史发展02
数字人文的技术体系与中国实践03
数字人文的人工智能转向与实践数字人文的定义与历史发展01布萨神父为托马斯著作编制索引A
Companion
to
Digital
HumanitiesSusanSchreibman,RaySiemens,JohnUnsworth,ed.,ACompaniontoDigitalHumanities,Oxford:Blackwell,20042004“数字人文”首次以今天的涵义出现在中国学界开创时期(1949-1970)联合时期(1970-1985)新发展时期(1985-1990)互联网时期(1990-)Susan作为人文计算的数字人文作为人文计算的数字人文开创时期联合时期新发展时期互联网时期1949年,意大利耶稣会学者罗伯托·布萨(RobertoBusa,S.J.)说服IBM提供技术和财务支持,以机械化创建一部庞大的圣托马斯·阿奎那(St.ThomasAquinas)作品的词条索引。1963年,弗雷德里克(Frederick)等人运用统计模型,解决了《联邦党人文集》中争执已久的12篇文章作者归属的悬案——他们从73篇已知作者的文本中统计出汉密尔顿和麦迪逊二人的功能词频分布,按贝叶斯定理计算拟合后,将这12篇文章判定给了麦迪逊。1963年,威斯比(Wisbeg)在剑桥创建了文字与语言学计算中心。1966年9月,美国学者约瑟夫·雷宾(JosephRaben)创办的《计算机与人文学科》(ComputersandtheHumanities)期刊正式发行,成为人文计算的学术阵地。
作为人文计算的数字人文开创时期联合时期新发展时期互联网时期1976年,“牛津大学文本档案馆”(OxfordTextArchive,OTA)建立。OTA致力于开发、收集、编目和保存电子文学与语言资源,以供高等教育、研究、教学及学习之用。该机构同时提供资源创建与应用指导,并参与电子语言资源标准与基础设施的建设。官方链接:https://ota.bodleian.ox.ac.uk/repository/xmlui/
“希腊语库”(ThesaurusLinguaeGraecae,TLG)项目将从荷马时代到现代的所有希腊文献数字化,对古典文学研究产生了深远影响。官方链接:1978年,脱胎于北美ICCH(InternationalConferenceonComputersandtheHumanities,计算机与人文学科国际会议)的“计算机与人文学会”(TheAssociationforComputersandtheHumanities,ACH)宣告成立,再加上人文计算课程的正式开设,标志着人文计算作为独立领域的确立和组织化发展时期的到来。作为人文计算的数字人文开创时期联合时期新发展时期互联网时期一方面,相关研究不再依靠大型计算中心,学者们可以在自己的个人电脑上独立操作多种字符文本,并通过电子邮件快速与其他学者即时通信。这一时期诞生了活跃至今的Humanist电子社群,电子社群的长期存档,使学术共同体的历史考证成为可能,亦提供了可持续的社区治理范式。
另一方面,该时期最具影响力的事件,无疑是人文计算学者们共同发起的“文本编码倡议(TextEncodingInitiative,TEI)”。TEI旨在为人文学科的电子文本建立统一的标记体系,以便在不同平台和项目间实现数据的长期保存与互操作性。自1987年以来,TEI先后发布了多个版本,其中TEIP5(2007年首次发布)基于XML架构,采用模块化设计与ODD(OneDocumentDoesitall)定制机制,为文学、语言学、历史文献等领域的数字化、检索与分析提供了权威规范,并成为人文计算研究中应用最广的文本标记标准之一。/guidelines/.作为人文计算的数字人文开创时期联合时期新发展时期互联网时期网络化多媒体开放性https://www.artsrn.ualberta.ca/orlando/about/computing/Orlando项目通过使用同一套SGML标记,让身处不同研究所的工作人员可以将有关英国女性著作的文档添加到同一个网络管理系统中,并对这些文档进行重新编辑、合并重组和检索索引等工作。Beowulf项目以数字图像处理为突破口,开启了将多模态成像与可复核证据发布相结合的贝奥武甫(Beowulf)手稿电子化工程;其后形成的ElectronicBeowulf把手稿影像、早期抄本与校勘证据整合进可检索的数字版,成为中世纪手稿学与人文计算图像处理的奠基性项目。1990年代末,弗吉尼亚大学曾围绕“人文计算是一门学科吗?”这一问题举办系列研讨会,伦敦大学威拉德·麦卡蒂以《作为跨学科的人文计算》为题探讨了人文计算得以发展的机构背景、学科性质、研究方式等,指出其本质是跨学科的,是基于数据类型或处理方式来自然划分,而非基于传统学科的应用领域来划分。作为方法共同体和方法论的数字人文2002年,威拉德·麦卡蒂和哈罗德·肖特在ALCC会议上提出了“MappingtheField”知识版图。该版图生动体现了数字人文作为方法共同体的跨学科性和跨界融合现象,展示了不同学科背景研究者在数字人文领域的交汇。(McCartyW,ShortH.“Mappingthefield.”PapergivenatanALLCmeetinginPisa,2002.Availableat:/map.)图“MappingtheField”知识版图大卫·M·贝里和安德斯·费格约德提出的“数字人文堆栈2.0”,构建了从底层的“数据与计算层”到顶层的“应用与批判层”的完整层级结构。这一模型不仅展示了技术支撑,更强调了批判性思维的重要性,勾勒出数字人文研究的全景生态。国内学者将其改进为“数字人文堆栈2.0”(图3),从基础设施、数据、分析方法到应用实践等层面勾勒出数字人文研究的生态全景。(王丽华、刘炜:《数字人文理论建构与学科建设——读<数字人文:数字时代的知识与批判>》,《数字人文研究》2021年第1期。)图数字人文堆栈2.0反思“通用方法论知识”,审视数字方法的来源与有效性。从“远读”演化为“计算批评”。通过“数据-模型-细读-理论”的循环,使算法成为批评性思考的工具,而非“黑箱”,最终回归人文研究的核心问题,凸显“人的维度”。(赵薇:《作为计算批评的数字人文),《中国文学批评》2022年第2期)图计算批评的阐释循环作为知识生产方式的数字人文数字人文却绝非简单的在传统人文学科中应用数字技术,而是一场由媒介变革驱动的学术生产革命:以计算机和网络为代表的数字媒介渗透进高等教育、学术研究和出版的知识生产体系,正在改变学术研究的问题意识、知识形态以及合法性边界。这场变革不仅更新了旧有的人文学术范式,而且以更包容的姿态融合了实证主义与阐释学两种人文传统,努力突破文科和理科之间的藩篱。因此,数字人文的兴起绝不仅是技术引入学术的结果,更是整个人文学科范式转型的一个强烈象征。这一转型的关键是由媒介变化所带来的知识形态和生产体系的变革,或可因此称之为“媒介转型”。宏观而言,这是一场以印刷术及书籍为物质基础和认识论前提而建立起的印刷知识生产体系正在向以数字技术和电子终端为物质基础和认识论前提的数字知识体系转变。在这场以网络基础设施为核心结构驱动的“媒介转型”中,数字人文作为新的知识生产方式,提供了一条“不可逆的数字知识生产路径”,极大拓宽了原有的知识生产谱系。作为知识生产方式的数字人文《数字人文:改变创新分享的游戏规则》一书曾强调,数字人文不再是用工具解决旧问题,而是展现了一种“生产性人文”(productivehumanities)的愿景——人文学者不仅是文本的解读者,更是数字平台等新工具的共同生产者(共同参与发明、设计和使用)。在这一愿景中,学者在除文本以外的更多层面,包括数据库、代码和底层计算等层面展开合作。此外,“生产性人文的目标是为环境作教育”,人文学者们在教学与研究环境中进行创造性协作,推动知识以多模态、多语境的方式生成与再组织。这一生产模式强调“协作性”与“生成性”的结合,教师、学生、程序员、图书馆员、设计师等在项目中共建知识,组成跨学科知识共创网络。作为知识生产方式的数字人文数字人文“分布式生产”特征:知识生成过程从线性闭合的学术机构转移到以平台为节点的协作网络中。与之相伴的“众包”机制,更成为推动数字人文知识生产的关键动力。
/basicinformation
数字人文的定义在数字人文的不同发展阶段和时代语境中,研究者曾尝试多种界定。作为人文计算的数字人文,曾被约翰·昂斯沃斯(JohnUnsworth)简短定义为:“一种再现实践(apracticeofrepresentation),一种建模形式(aformofmodeling),或者就像华莱士·史蒂文所说的‘模仿(mimicry)’。”“再现实践(或表征实践)”是最著名的,也是最切合数字人文本质的一种含义,受此影响,刘炜等认为数字人文是将研究对象和历史材料“映射”到虚拟世界里,并“模拟”仿真原有真实场景,由此建立起两相一致的“概念抽象和逻辑框架”。
数字人文的定义作为方法共同体的数字人文,强调的是共享的方法、技术,同时也将数字人文视作一种跨学科的协作模式。牛津英语词典将数字人文定义为:“一个学术领域,致力于将计算工具和方法应用于文学、历史和哲学等传统人文学科。”这一简明定义凸显了数字人文的工具属性。德国学者格哈德·劳尔(GerhardLauer)提出数字人文是“人文学科研究方法的补充,这一方法基于对电脑和互联网的运用,是一种更广阔意义上的‘计算’”。爱丁堡大学教授梅丽莎·特拉斯(MelissaTerras)则进一步说明数字人文更是一种以技术为手段来探索和理解人类社会的新路径,她认为:“数字人文是试图理解人类本质的计算方法,涵盖了我们过去和现在社会中的各种层面。”数字人文的定义作为知识生产方式的数字人文,强调数字人文正深刻改变人文研究的生产方式与学科范式。哈佛大学包弼德教授从研究生产全周期的视角解释数字人文,指出:“数字人文是在数字环境下促成周期研究,一个研究周期包括找到研究问题、收集数据、查找资料数据信息,整理、分析数据等环节。”在此生产过程中,计算机与人文相互塑造、互为主体,正如尼尔斯·布吕格尔(NielsBrügger)所说,“数字”与“人文”之间应是相互作用,而不应将数字人文视为一种从“数字”到“人文”的单向决定论逻辑。因此,他提出数字人文是:“人文学科(无论“人文”内涵为何)在某种程度上使用数字计算机,并因此根据人文学科的“人文”定义、研究问题与科研实践反过来形塑计算机的固有特性,以满足人文学科特定的学术需求。”换言之,数字人文研究既考察数字媒介如何影响人文学科,也关注人文学科能够如何反过来塑造我们对计算技术的理解和应用。数字人文的定义最后,作为一种方法论的数字人文,敦促数字人文超越工具阶段,人文学者应以躬身其中的操作,在“通过工具思考”的过程中引入细读检验,将关注引向知识的表征和模型的建构过程,来唤醒一种针对工具自身的反思和解释,从而发展出更全面的文化批评。牛津大学詹姆斯·卡明斯(James Cummings)认为,数字人文是一个“以自反思性眼光审视数字技术在人文学科中应用的学术领域”,事实上,作为一种思辨对象的数字人文和数字基础设施(criticalDH,criticalinfrastructure)一直就存在。数字人文的定义综上,跨学科性、生产性和自反思性是数字人文定义中的几个关键要素,不妨将数字人文界定为:媒介变革影响下产生的一个跨学科的实践领域,它以信息技术与人文学科的交叉融合及相互作用为核心特征,以建模和借助模型来推理、论证为核心方法,将数据驱动和问题驱动相结合,运用一系列数字技术处理、分析和诠释前数字时代中无从观察的现象,无法想像、难以深入的议题;同时,它还须具备高度的自反思性,通过基于个体经验的细读环节来不断地审视和检验技术应用自身,批判性地探讨数字媒介对人文学科知识生产、文化传播和学术范式的深刻影响。当然,随着人工智能等技术的不断创新发展,数字人文的内涵无疑还将持续拓展和丰富。但无论数字人文的内涵如何变化,其核心宗旨应始终如一:运用数字技术之长,回应人文学科之关切,并在此进程中不断探访技术与人文交织所孕育出的新的意义。数字人文的技术体系与中国实践02文本挖掘与统计建模技术应用范围文本挖掘涵盖信息检索、分词、情感分析等,用于发现“细读”难察的模式,如《醒世姻缘传》作者归属研究文学与历史研究案例早期文本挖掘多由计算机辅助完成,如基于语义分析的宋词情感研究、基于语料库的唐诗风格分类等,更多体现技术探索。例如金观涛团队通过词频统计等研究近代思想转型。在文学研究中,文本挖掘结合计算语言学方法,广泛用于古诗词的意象、风格、主题研究,尤其是对《全唐诗》《全宋诗》这一类成一代巨帙的文学总集的语言体式的测量。例如,刘昭麟团队以九部诗歌总集语料库,对中国古代诗歌文学发展做词汇层面的俯瞰,将逐词索引、词语搭配等信息检索功能发挥到极致。在体裁和文类研究中,学者使用分类、聚类算法模型对文学文本进行分类,通过观察分类结果与传统观点的差异,对历史观念的生成展开计算批评,如赵薇和程宁对现代汉诗节奏的研究。李友仁较早运用文本聚类方法,对明清小说、野史和正史的目录学基础展开研究。在声律和节奏研究中,大样本、人工标注与统计测量成为重要路径。诸雨辰、胡韧奋对《全唐诗》律诗拗句做统计,发现具有典型意义的拗救方式,提炼出唐诗平仄的基本原则。网络分析与可视化技术特点网络分析处理关系型数据,揭示拓扑特征,应用于社会网络与文本网络研究研究案例在数字人文研究中,许多关系型数据库以社会网络分析为方法论基础。例如中国历代人物传记资料库支持人物关系网络分析。除了依靠数据库,不少学者自建了数据集。例如陈松利用宋代官学碑记双模网络揭示思想交流的结构性鸿沟。不同于现实社会关系网络,文本网络是另一个重要研究类型。例如许超通过《左传》语料库构建人物与事件的共现网络,发现该网络的小世界性。以人物话语为焦点的网络分析中,学者可引入关系权重,在加权话语网络中细致考察叙事角色的功能,以触及人物观等核心话题。例如,廖俊凡通过《儒林外史》对话网络研究人物角色,赵薇对“《大波》三部曲”中李劼人人物体系和辛亥史观的研究。图像与视觉化是数字人文不可或缺的研究对象和手段。清华大学向帆利用中国历代人物传记资料库和家谱数据,结合可视化与三维技术,建构出家谱立体网络。
平台建设复旦大学与哈佛大学合作的中国历史地理信息系统(CHGIS)影响深远,“唐宋文学编年地图”融合GIS与作家数据
研究方向简锦松通过GIS与实地考察还原文学场景,唐宸利用天文软件考证古典文学天象描写历史地理信息化与空间人文数字人文的人工智能转向与实践03
多模态转向数字人文的“屏幕文化属性”让研究者转向跨模态数据联合分析,口述历史
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 河南学院单招试题及答案
- 中国医科大学《商务沟通》2025-2026学年期末试卷
- 黎明职业大学《管理经济学》2025-2026学年期末试卷
- 福州外语外贸学院《中药炮制学》2025-2026学年期末试卷
- 中药材购销员安全理论测试考核试卷含答案
- 扬州大学《心理统计与spss》2025-2026学年期末试卷
- 长春早期教育职业学院《电机与拖动》2025-2026学年期末试卷
- 徐州工程学院《民族学通论》2025-2026学年期末试卷
- 闽南科技学院《马克思主义政治经济学》2025-2026学年期末试卷
- 贵州音乐考编试题及答案
- 服装厂班组级安全培训试题(附答案)
- 温湿度远程监控系统(ESP32 + MQTT + 小程序)
- 2025年面向电力行业的星地融合无线通信技术研究报告
- 湖北省襄阳市第四中学2025-2026学年高三上学期英语测试(六)(含答案含听力原文无音频)
- 毛尖茶的营销方案
- 注射用亚胺培南西司他丁钠氯化钠注射液-临床用药解读
- 新质生产力:个人发展的新机遇
- 2025年江西省高考思想政治试卷真题(含标准答案)
- 露天采矿汛期安全培训课件
- 咨询费居间协议合同范本
- 《流体力学》课件(共十三章)
评论
0/150
提交评论