尋夢新聞LINE@每日推播熱門推薦文章,趣聞不漏接❤️
「大數據」如今已滲透到人類生活的方方面面。隨著各種數據庫的大量出現,傳統文史研究也發生了變化。近年來,與「e考據」和「數字人文」相關的研究日趨增多,因此,進一步探索如何更切實地將理論、方法與研究實踐有機結合,就變得十分重要。
揚棄既有研究成果
大數據時代對傳統文史研究產生的影響,首先表現在資料上。近些年新推出的電子資源在內容上甚至有超越傳統出版物之勢,檢索的快捷性和精確度,可以令學者省卻翻檢群書、遊歷訪書之勞。在這樣的學術環境下,探討某些疑難問題可能只需簡單檢索,許多「懸案」的解決難度也相應大幅度降低。前人因資料局限而不得不大量運用的「理校」「推論」「悟證」諸方法,在大數據時代無疑要重新進行揚棄。
在學術史研究中,清人往往因所見善本不豐而大量運用「理校」法展開研究,其中有的結論或與善本相合或遭善本否定。今人既然已經能夠在研究中大量占有善本供校勘,那麼這種研究方法雖仍有學習的必要,但其實用性也難免會打些折扣。大量新材料理應引發大量新結論,一些「常識」或「定論」必然也會隨之遭到質疑甚至顛覆,這對於現有的研究自然會有相當明顯的刺激作用。近年來學界對於近代學人的成就時有爭論,原因之一就在於當時學者以一人之力所做的資料性工作,精度和效率都很容易被數據庫所超越。不少在民國時期「古史辨」中幾乎成為公認的定論,隨著出土文獻的發現而被推翻(典型的例子如對《孫子兵法》的辨偽),足見新材料在某些研究領域確實處於相當核心的地位。
通過數據庫重新打撈那些以往不被關注的文獻,這實際上仍是發現新材料,其性質與考古相似,亦可稱之為當下的「預流之學」(陳寅恪:《敦煌劫餘錄序》)。與此相關的一個問題是,在超過120億字的可檢索的古典文本,以及各種不同類型的數據庫中,還蘊藏無限問題可供發掘。而這些數據資源能否被學者使用,很大程度上取決於其所在單位購買的數據庫數量。在高校間已有明顯「數位落差」的現實條件下,學者個人的學術水準有可能受到所處文獻環境的制約,而不同文獻環境導致的信息素養的差異可能會進一步拉大這一差距。
數據庫大量湧現,學術評判標準也會發生變化。出於「功利」眼光計算,當代學者費盡周折的考據工作,很可能被下一代學者輕易解決。其原因並非人的智力、才能有別,而是文獻環境不斷變化提供的巨大方便使然。一代有一代之學術,面對不同的環境,學術范式也應隨之轉移。所以,當下正是海量文獻可供使用、可以大有作為的時代,也是考據研究缺乏亮點而趨於同質化的時代。換言之,即使是在數據仍未被充分電子化的當下,考據研究的合法性也正在受到衝擊。一般性的文獻挖掘仍然重要,但能夠解決核心學術問題的研究更為重要。
引發學術倫理討論
在電子檢索受到學界矚目的同時,一些批評尤其是對於學術倫理的討論也隨之熱門起來。電子檢索的高效快捷,令不少學者擔憂其可能引發更嚴重的學術不端。比如,有的研究者可能對相關領域了解有限,但在檢索工具的助力下仍敢匆匆上馬,輕易立說;有的研究者征引繁復,可謂博瞻,但實際上許多材料是脫離語境的「遙讀」,經不起細加辨析;有的研究者過於迷信電子文本的全面性,但卻因此而忽略了那些未被電子化的文獻;有些電子文本存在錯誤,研究者未核查原書導致誤引誤斷;等等。
對這些實際存在甚至時顯泛濫的問題,我們可以嘗試從以下幾個方面來進一步認識。首先,技術本身是中立的,上述批評很大程度上是在針對研究者個人的文史素養和治學態度,並未否定技術能夠令優秀學者如虎添翼。而擅長檢索的學者也能夠認識到文史素養的重要性,並非一味依賴電子資源。從現實情況看,電子技術確實使那些曾經看上去遙不可及的一流學者(尤其是實證型學者),變得可以企及了,這至少是正在提升學術研究的平均水準。校勘、箋註、考據中的一些前期工作,可由計算機更精準地代勞,在人機結合的研究過程中,「高明子弟,自然沉潛」。
其次,當下的電子文本絕非完美,即使是掃描版也往往不能完全忠於原書,引用之前必須與原始文獻核對,不能徑用。但這恰好說明,現在的數據庫還沒有脫去以往「工具書」的性質。前人做研究,亦會查閱類書、索引等,甚至常有轉引、代查的現象,這證明「工具」本來也不被排斥。如將數據庫理解為一種高級的「逐字索引」,則其學術價值自然彰顯。此外,紙質文獻(尤其是整理本)同樣常常有誤。古籍校勘中,也多有以「通行本」為底本的典範。事實上,核心問題不在於當下的電子文本有多少具體錯誤,而在於能否使註釋具有可回溯性和規範性。如果一味排斥征引電子文本,很可能也會使數據庫開發者缺乏將電子文本精確化的動力。