6月13日上午,中国社会科学院大学我院副教授、现任中国社会科学院大学数字史学研究中心主任向静受邀为山东大学我院师生开展讲座,题为“明代研究中的数据库建设:方法与案例”。讲座由我院曹金成副研究员主持。
讲座伊始,向静基于对2010—2023年国家社科基金与教育部人文社科基金中的数字人文类立项、研究历史现象以及历史问题的立项以及相关项目中的历史学科立项所作的统计,勾摹出近年来,尤其是近2—3年来历史数据库建设立项数量迅速增长与多学科参与历史数据库建设和历史问题研究的现状。向静指出,数据库建设是数字人文领域研究历史现象及问题的基础和重点。向静还就传统研究团队在数据库建设领域的“马太效应”、如何生产更有意义的历史数据以及历史学者在主导数据库建设时可能面临的各种“困境”等话题与师生们分享了自己的思考。
随后,向静向师生们介绍了“中国历代人物传记资料库(CBDB)”、“明人书信计划(MLP)”等知名数据库的数据体量、资料来源、呈现的主要信息及其构建人物关系活动网络的基本技术原理,并以柯荣住、王裕华、包弼德(Peter K. Bol)等学者的量化研究为例,说明量化研究利用数字手段概括和处理信息时较之于阐释性手段的优势以及定量研究在直接资料不足时的“代理”作用。向静还指出,“代理”有没有研究的可信度,本质上是将历史问题量化时需要考虑的层次、逻辑与方法的合理性问题。由此,向静引入数据库建设中的“元数据”概念,并结合吴滔“明代价格数据库”等案例,指出历史数据库的元数据设计应当充分吸收历史学者对于文献内部的结构、层次、关联性的理解力和想象力,使数据库最终服务于研究过程的整体与细节。
向静还结合具体案例,向师生分享了利用人力手工录入,Python、正则表达式等人设程序、机器学习与大语言模型、人工智能进行建设数据库的具体方式方法。
在互动环节,参与讲座的师生就满文数据库建设的现状及其前景,历史学、档案学等多学科共同参与的历史数据库建设及各学科的数据库建设侧重,数字人文领域定量研究与定性研究的关系,以及量化研究在处理单件史料价值较低的大批量文献方面的优长与不足等问题与向静展开交流讨论。
向静,中国社会科学院大学我院副教授,硕士生导师。北京大学历史学博士,哈佛大学访问学者。现任中国社会科学院大学数字史学研究中心主任,兼任故宫学研究中心副秘书长。目前主要从事明代政治史与地方社会史研究,主持教育部人文社科基金、北京市高等学校青年英才计划、北京市教育委员会、社科大校级文科实验室建设等课题项目。发表论文十数篇,出版译著《中华帝国方志的书写、出版与阅读:1100-1700年》(上海人民出版社2022年版)。