從人工到智能:AI時(shí)代的歷史與人文探索
2025年1月11日至12日,由南京大學(xué)歷史學(xué)院、南京大學(xué)數(shù)字史學(xué)研究中心數(shù)智文獻(xiàn)研究室聯(lián)合主辦的“從人工到智能:AI時(shí)代的歷史與人文探索”學(xué)術(shù)工作坊在南京成功舉行。來自中國社會(huì)科學(xué)院、華中師范大學(xué)、加州大學(xué)圣克魯茲分校、澳門理工大學(xué)等海內(nèi)外知名高校及研究機(jī)構(gòu)的30余名學(xué)者齊聚一堂,圍繞人工智能技術(shù)在歷史與人文研究中的應(yīng)用、數(shù)字史學(xué)的發(fā)展?jié)摿εc挑戰(zhàn)等議題展開深入探討。
會(huì)議開幕式由南京大學(xué)歷史學(xué)院副院長王濤教授主持,南京大學(xué)歷史學(xué)院院長張生教授致辭。張生指出,南京大學(xué)作為中國“數(shù)字人文”研究的前沿陣地,始終關(guān)注人工智能等新興技術(shù)在歷史研究中的應(yīng)用,并呼吁學(xué)術(shù)界努力探索數(shù)字史學(xué)發(fā)展的邊界與可能性。
一、大會(huì)報(bào)告:數(shù)字時(shí)代的史學(xué)建設(shè)
華中師范大學(xué)中國近代史研究所所長馬敏教授在《數(shù)字史學(xué),何以成學(xué)?》的大會(huì)報(bào)告中,系統(tǒng)梳理了數(shù)字史學(xué)的起源與發(fā)展。他強(qiáng)調(diào),數(shù)字史學(xué)是數(shù)字人文在歷史學(xué)領(lǐng)域的具體實(shí)踐,其核心在于利用計(jì)算機(jī)技術(shù)、網(wǎng)絡(luò)技術(shù)和軟件系統(tǒng)分析、生產(chǎn)與傳播歷史知識(shí),超越了傳統(tǒng)計(jì)量史學(xué)的范疇。馬敏指出,當(dāng)前歷史數(shù)據(jù)庫主要分為兩類:一是基礎(chǔ)性歷史文獻(xiàn)數(shù)據(jù)庫,如“國家清史工程數(shù)字資源總庫”“抗戰(zhàn)文獻(xiàn)數(shù)據(jù)平臺(tái)”等,通過文獻(xiàn)數(shù)字化與可檢索化提升研究效率;二是研究性量化數(shù)據(jù)庫,如“中國歷代人物傳記資料庫”(CBDB)、“中國多世代人口數(shù)據(jù)庫”(CMGPD)等,借助大樣本數(shù)據(jù)推動(dòng)歷史研究的定量化與科學(xué)化。此外,社會(huì)網(wǎng)絡(luò)分析、語境關(guān)鍵詞分析等新方法的應(yīng)用,標(biāo)志著數(shù)字史學(xué)方法論的革新。 面對(duì)生成式人工智能(如ChatGPT)的崛起,馬敏認(rèn)為,數(shù)字史學(xué)將迎來新一輪變革。如何利用大語言模型實(shí)現(xiàn)史學(xué)的“思考”與“發(fā)聲”,將是未來研究的重點(diǎn)。
中國社會(huì)科學(xué)院近代史研究所副所長金以林研究員在報(bào)告中介紹了其團(tuán)隊(duì)主持的“抗日戰(zhàn)爭與近代中日關(guān)系數(shù)據(jù)平臺(tái)”項(xiàng)目進(jìn)展。目前,該團(tuán)隊(duì)已積累近2000種近現(xiàn)代人物日記的數(shù)字化版本,計(jì)劃三年內(nèi)完成10億字日記的全文檢索,并納入年譜、書信集等文獻(xiàn),構(gòu)建大規(guī)模智能化史料庫。金以林強(qiáng)調(diào),數(shù)據(jù)建設(shè)是史學(xué)數(shù)字化的基石,但資源分配與話語權(quán)不足仍是制約發(fā)展的關(guān)鍵問題。
加州大學(xué)圣克魯茲分校歷史系教授胡明輝提出“半機(jī)械翻譯”(Cyborg Translation)概念,旨在結(jié)合機(jī)器翻譯與人工校對(duì)的優(yōu)點(diǎn),提升中文學(xué)術(shù)文獻(xiàn)的翻譯質(zhì)量。以《現(xiàn)代中國思想的興起》第四章為例,其團(tuán)隊(duì)通過分割文本、機(jī)器初譯與人工潤色的流程,實(shí)現(xiàn)了翻譯的準(zhǔn)確性與風(fēng)格統(tǒng)一。胡明輝指出,這一模式尤其適用于處理復(fù)雜術(shù)語與古典文獻(xiàn)。
南京大學(xué)數(shù)智文獻(xiàn)實(shí)驗(yàn)室助理教授金伯文展示了該校自主研發(fā)的數(shù)智文獻(xiàn)平臺(tái)。該平臺(tái)集成Qwen、DeepSeek等國產(chǎn)大語言模型,支持歷史文獻(xiàn)的快速數(shù)字化、翻譯與知識(shí)挖掘?,F(xiàn)場演示中,團(tuán)隊(duì)展示了目錄自動(dòng)解析、多語種文獻(xiàn)翻譯等功能,并預(yù)告未來將開發(fā)多模態(tài)數(shù)據(jù)分析工具,進(jìn)一步拓展平臺(tái)的智能化應(yīng)用場景。
二、專題討論:數(shù)字技術(shù)的應(yīng)用與挑戰(zhàn)
會(huì)議設(shè)置三場專題討論,聚焦人工智能工具、數(shù)據(jù)庫建設(shè)與跨學(xué)科實(shí)踐。
第一組專題報(bào)告由《廣東社會(huì)科學(xué)》主編李振武主持。南京大學(xué)歷史學(xué)院王濤在《人工智能是歷史學(xué)家的興奮劑嗎?》中指出,AI雖能加速研究,但也可能導(dǎo)致“興奮劑效應(yīng)”,即過度依賴技術(shù)而忽視基礎(chǔ)訓(xùn)練。他通過測試騰訊知識(shí)庫工具與谷歌Notebook LM發(fā)現(xiàn),現(xiàn)有工具在處理復(fù)雜歷史文本時(shí)仍存在“車轱轆話”與“幻覺問題”。澳門理工大學(xué)人文與社會(huì)科學(xué)學(xué)院馬光則探討了本地部署AI知識(shí)庫的必要性,強(qiáng)調(diào)開源模型(如LLAMA、Qwen)在處理古籍與手寫文獻(xiàn)時(shí)的潛力與局限。《歷史研究》編輯部趙懿提出,生成式AI可系統(tǒng)化整理史料,但缺乏對(duì)歷史主體情感與價(jià)值的理解,“現(xiàn)實(shí)關(guān)懷”仍是人類學(xué)者的不可替代性所在。
第二組專題報(bào)告由《澳門理工大學(xué)學(xué)報(bào)》主編陳志雄主持。金伯文展望了人工智能時(shí)代電子藏書的三大變革:數(shù)據(jù)庫標(biāo)準(zhǔn)化、文獻(xiàn)智能化與知識(shí)原子化。他提出,未來學(xué)者可通過數(shù)智文獻(xiàn)平臺(tái)構(gòu)建個(gè)性化文獻(xiàn)社區(qū),實(shí)現(xiàn)知識(shí)共享的扁平化。量化研究案例亦引人注目。華中師范大學(xué)馬克思主義學(xué)院薛勤借助縉紳錄數(shù)據(jù)庫,量化分析了清代學(xué)政的仕途流動(dòng);社科院姜濤助理研究員則聚焦國民黨軍官群體的地理與出身特征,揭示了政治變動(dòng)對(duì)人事結(jié)構(gòu)的影響。
第三組專題報(bào)告由《廣東社會(huì)科學(xué)》編輯張祥梅主持。南京大學(xué)歷史學(xué)院姚念達(dá)利用數(shù)字報(bào)刊數(shù)據(jù)庫與BERTopic工具,分析了20世紀(jì)50年代美國社會(huì)的“核恐懼”對(duì)冷戰(zhàn)政策合法性的沖擊;南京大學(xué)信息管理學(xué)院宋寧遠(yuǎn)從資源語義化角度,探討了AIGC技術(shù)在史料處理中的應(yīng)用,并呼吁以“循證”思維整合數(shù)據(jù)分析與人文研究。南京大學(xué)歷史學(xué)院李磊基于《中共組織史資料》構(gòu)建數(shù)據(jù)庫,通過數(shù)據(jù)驅(qū)動(dòng)方法系統(tǒng)揭示了1927年后中共省委組織規(guī)模的動(dòng)態(tài)演變及地域差異。
三、圓桌討論:人工智能時(shí)代的史學(xué)未來
在南京大學(xué)信息管理學(xué)院張斌主持的圓桌會(huì)議上,學(xué)者們就數(shù)字史學(xué)的學(xué)科定位、技術(shù)應(yīng)用等問題展開了熱烈討論。李振武指出,當(dāng)前大數(shù)據(jù)研究結(jié)論多與傳統(tǒng)方法雷同,需開發(fā)更契合史學(xué)需求的數(shù)據(jù)庫;馬光強(qiáng)調(diào),數(shù)字史學(xué)應(yīng)通過學(xué)科交叉挖掘新觀點(diǎn);趙懿則提醒,學(xué)者需保持主體性,避免淪為技術(shù)的附庸。南京大學(xué)歷史學(xué)院李慶認(rèn)為,AI可提升多語種史料處理效率,但技術(shù)開發(fā)需對(duì)接史學(xué)需求;《史林》編輯施恬逸預(yù)測,未來可能出現(xiàn)“個(gè)性化AI調(diào)試師”職業(yè),以解決數(shù)據(jù)庫整合與版權(quán)難題。張斌認(rèn)為,人工智能與大數(shù)據(jù)的應(yīng)用確實(shí)提升了數(shù)據(jù)收集與處理能力,但人工智能驅(qū)動(dòng)的研究不應(yīng)僅停留在數(shù)據(jù)的堆砌,而應(yīng)致力于解決更復(fù)雜、深入的問題。
本次工作坊系統(tǒng)梳理了數(shù)字史學(xué)的發(fā)展脈絡(luò),展示了人工智能在文獻(xiàn)處理、量化分析與跨學(xué)科研究中的廣闊前景。與會(huì)學(xué)者一致認(rèn)為,技術(shù)革新為歷史學(xué)注入活力,但如何在效率與深度、工具與思想之間尋求平衡,仍是數(shù)字人文領(lǐng)域亟待探索的核心命題。