国际交流

当前位置: 首页 > 交流合作 > 国际交流 > 正文

大数据驱动下的文史研究—哈佛大学徐力恒博士谈人文研究新方法

作者:     来源:     发布时间:2017年03月13日 11:38     点击次数:[]

  2017年3月1日上午,马克思主义学院张淑华副教授邀请罗德学者奖学金获得者、牛津大学博士、哈佛大学博士后、哈佛大学CBDB(中国历代人物传记资料库)项目组徐力恒来院作学术讲座,讲座题为“数据驱动下的文史研究”。徐博士以哈佛大学CBDB项目为例,并旁举其他人文学科研究项目,介绍了大数据在人文学科中的应用。讲座由张淑华副教授主持,汪永平、商存慧等多位青年老师和学院的研究生积极聆听并参与了讨论。

  徐力恒博士从介绍“大数据(BIG DATA)”概念的提出与发展入手,首先对多大的数据才算大数据提出了自己的意见。他指出人文学科研究中的大数据一般是相对的,大多数情况下并不能穷尽已有实际数据。以历史研究而言,我们即使对已有史料一网打尽,但由于大量史料和记载在历史发展过程中散佚了,因此所得并非完全客观的资料。但是,我们依然可以从这些我们能穷尽的已有的数据出发去正确地推论那些散佚的文献资料,继而探究历史的本相。人文学科的大数据研究是借助已有数据库和各种分析、统计等多种综合手段的研究,它能够解决人文学科领域内一些宏观的、此前仅靠人力很难或无法完成的研究,为研究者提供了新的视角,工具和方法。

接着,徐力恒博士介绍了“中国历代人物传记资料库”(CBDB)项目,指出目前的数据库分为两大类:全文数据库,关系型数据库,而CBDB是一种关系型数据。其资料来源于中国历史上的人物传记文献,如正史,地方志,登科记考、进士题名录、交往诗等大量与人物有关的历史文献。在这种数据库中,人物的数据存在于各种实体的互动之中,因此,用户可以可以检索数据库中的所有相关信息,可以基于任何一个表格进行检索——检索的重心可以是多种多样的、可以同时设定多个检索条件,进行更复杂的检索。也正因此,研究者可以借助这种数据库讨论一些更复杂的学术问题,提升研究的深度与难度。

为帮助与会者使用该数据库,徐力恒博士现场演示了三种访问CBDB,并使用其进行研究检索的方法,还以以往研究者的研究成果为例,展示了利用该关系型数据库可以进行的四类研究——地理空间分析、社会网络分析、群体分析、统计分析及文本分析。

  讲座之后的互动环节中,不少学生和几位老师提出了对大数据引入人文研究的一些疑惑,徐力恒博士一一耐心作答。面对有学生提出这种大数据研究的局限性和可靠性问题,徐力恒指出:大数据,重要的不是数据,而是数据分析,并提出“聪明数据+大数据”的观点,启发大家思考。针对有同学提出的数据可视化的问题,徐力恒博士指出,可视化是大数据统计后的直观体现,并非你所寻求的问题的结果,也许只是一个开始,推动你进一步解释统计结果。现场听众还与徐力恒博士就大数据在人文学科中的运用和CBDB的其他问题等进行了深入的交流。

    徐力恒博士语言风趣、思路清晰,讲座过程中时不时妙语连珠,会议厅内激荡着徐博士与在座师生思维碰撞的火花。此次讲座提高了在座师生对数据的索引和使用的新认识,对利用大数据进行人文科学和社会科学研究的新认识。通过这次讲座,有些师生表示,将尝试利用徐博士介绍的方法,将大数据的研究方法引入自己的学术研究。我们欣喜地看到:此次讲座不仅拓宽了在座师生的学术研究视野,提供了学术研究的新方法和新思路,还激发了我院师生学术研究的热情,也希望更多研究者关注这种新型的研究方法。

                                 (文/张淑华 吕正祥 图/高培伟 审核/鲁卫平)

         

        

上一条:美国休斯敦大学丛小平教授《海外社会科学研究范式与方法》系列讲座
下一条:学院召开回国教师学术交流报告会