數(shù)據(jù)牢籠與批評突圍
摘要:數(shù)據(jù)邏輯在整個網(wǎng)絡(luò)文學(xué)實踐中已經(jīng)底層化和結(jié)構(gòu)化,在此基礎(chǔ)之上的批評前置了數(shù)據(jù)思維,暗含了數(shù)據(jù)的蠻力。網(wǎng)絡(luò)文學(xué)數(shù)據(jù)批評所能獲得的數(shù)據(jù)十分有限。在平臺的數(shù)據(jù)壟斷下,身處數(shù)據(jù)牢籠的批評者借助軟件進(jìn)行的研究,變成了既沒有全數(shù)據(jù)支撐,又需要借助有偏差的軟件模型,然后根據(jù)自身的統(tǒng)計素養(yǎng)來輔助操作的數(shù)據(jù)批評。數(shù)據(jù)批評在實際運用中經(jīng)常表現(xiàn)為簡單的量化分析和解讀。它存在明顯的遮蔽性,需要依賴于一定的理念和闡釋,提升人文思辨的力度,使文學(xué)批評在定性分析與定量分析的無縫銜接中不斷前進(jìn)。
關(guān)鍵詞:網(wǎng)絡(luò)文學(xué) 數(shù)據(jù) 數(shù)字人文 定量 文學(xué)研究實驗
迅疾蔓延的數(shù)智技術(shù)更新了諸多行業(yè)和領(lǐng)域,在文學(xué)研究中“數(shù)字人文”的呼聲也十分強烈。從歐美到中國,研究者面對批量增長的文學(xué)文本,困于文本細(xì)讀所涉對象的局隘和對文本價值的主觀區(qū)分,也希望通過建立數(shù)據(jù)庫、引入以計算機技術(shù)為基礎(chǔ)的數(shù)據(jù)化方法來解決這些難題,并進(jìn)行了一些初見成效的嘗試。其中最常見的方式,就是進(jìn)行文學(xué)研究實驗:先確定一些假設(shè),然后劃出一些文學(xué)文本,選用一定的數(shù)據(jù)分析工具在設(shè)定的條件下進(jìn)行操作,進(jìn)而對結(jié)果進(jìn)行分析,從而發(fā)現(xiàn)某些文學(xué)規(guī)律。這些實驗采用的都是基于計算機科學(xué)的數(shù)據(jù)化方法,效率高,結(jié)果能以圖表、詞云等直觀的形式呈現(xiàn),也偶有一些假定之外的洞見,為文學(xué)研究帶來了一縷新鮮氣息。但數(shù)據(jù)化方法中揀選的對象經(jīng)常是平臺數(shù)據(jù)淘汰機制過濾之后的文本,而且研究者無法獲得完全數(shù)據(jù)。數(shù)據(jù)分析模式的偏見和數(shù)據(jù)操縱的可能存在都使得這種文學(xué)研究實驗的可重復(fù)性不高,再次實驗的價值不大,于是實驗經(jīng)常淪落為一次性的。況且,數(shù)據(jù)化方法背后的數(shù)據(jù)主義哲學(xué)傾向會遮蔽文學(xué)文本的豐富價值,因而我們需要找出一條規(guī)避之道。
一、數(shù)據(jù)的蠻力:網(wǎng)文實踐與數(shù)據(jù)思維的內(nèi)在聯(lián)姻
作品的數(shù)據(jù)不好就心虛,幾乎是新媒介文藝批評中研究者常出現(xiàn)的情況,這是不是意味著數(shù)據(jù)已經(jīng)在潛意識中對我們的研究對象進(jìn)行了過濾?答案是肯定的。數(shù)據(jù)以一種意識形態(tài)的方式在整個網(wǎng)絡(luò)文學(xué)實踐中發(fā)揮作用,悄無聲息而又無所不在。
數(shù)據(jù)的好處是一切都可以拿來比較,直接武斷?,F(xiàn)代社會的一種趨向就是用數(shù)據(jù)量化的方式對世界和人進(jìn)行簡化處理,由此構(gòu)成了“量化”的、如解析幾何一樣的“解析社會”。“解析社會”的觀照世界方式已經(jīng)內(nèi)化到網(wǎng)絡(luò)文學(xué)故事世界的想象中。
為數(shù)眾多的網(wǎng)絡(luò)小說開頭就介紹世界設(shè)定和規(guī)則體系的做法,貌似是受游戲的直接影響,究其根源是數(shù)據(jù)邏輯的底層化和結(jié)構(gòu)化。許多作者不再用力去塑造虛構(gòu)世界中的人物,而是將人物孤立出來,拋入到需要完成各種任務(wù)的數(shù)據(jù)系統(tǒng)。人物與世界沒有互生關(guān)系,只是強制性的偶遇。刻畫人物變成了展示人物的數(shù)據(jù)畫像,顯示人物在各個屬性上的數(shù)值或等級。
不僅如此,諸多作品中主要人物的稟性氣質(zhì)也表現(xiàn)出與數(shù)據(jù)計算邏輯的一致性。網(wǎng)絡(luò)小說中主角對周圍世界進(jìn)行功利性的計算,依據(jù)自己的現(xiàn)實利益對他人價值進(jìn)行判斷,從《凡人修仙傳》就開始了,且比較普遍化。當(dāng)然這個邏輯也不能說僅存在于虛構(gòu)的小說世界里,它本身也是現(xiàn)實世界的一個輾轉(zhuǎn)映射。而近些年網(wǎng)絡(luò)文學(xué)中充斥的那種果敢狠絕、不糾結(jié),同時缺乏自省的人物形象,與簡單粗暴的數(shù)據(jù)邏輯不無關(guān)系。打不死的主角一言不合就開殺,主角“爽”了,對主角無用的人物,其生命如同草芥,只是工具性存在。這在網(wǎng)絡(luò)小說中已經(jīng)是一種比較普遍的倫理淡漠現(xiàn)象。
數(shù)據(jù)邏輯也深度植入到網(wǎng)絡(luò)閱讀中,從內(nèi)容推薦到閱讀習(xí)慣分析,都貫穿著數(shù)據(jù)計算,是被微目標(biāo)定位了的。讀者在電子閱讀平臺中經(jīng)常會看到一些“推薦”作品和作品的各種數(shù)據(jù),它們告訴你讀過這本書的人又讀了哪些書、這些書被多少人閱讀過、評分和評價如何等。甚至隨著數(shù)智技術(shù)的運用,閱讀平臺還提供了更高效的閱讀方式,比如讀者可以只看AI生成的內(nèi)容提綱。“爽文”的快樂符碼是根據(jù)讀者的閱讀習(xí)慣和喜好,通過故事情節(jié)、人物設(shè)定等方式在小說文本中安排的情緒點。我們閱讀文學(xué)時產(chǎn)生的莫名喜好,在網(wǎng)頁上停留時間的長短,以數(shù)字的方式被捕捉,進(jìn)而觸及我們潛意識中的喜好層面。這是連我們自己也不知道為何產(chǎn)生的類似于弗洛伊德所說的“本我”的層面,但數(shù)據(jù)特別是大數(shù)據(jù)打開了通往其中的通道。“數(shù)據(jù)挖掘作為數(shù)字化透鏡會放大人的行為,并且在由意識編織的行為空間背后開辟一個潛意識編織的行為空間。”數(shù)據(jù)計算深入到了人們的潛意識層面。
進(jìn)入批評視野的網(wǎng)絡(luò)文學(xué)作品,也需要有一定的數(shù)據(jù)。批評者在對作品進(jìn)行評價之前,先介紹作品在排行榜上的位置和獲得的各種榮譽,這幾乎成了一個慣例。批評者對作品的直覺判斷是排在數(shù)據(jù)判斷之后的,即網(wǎng)絡(luò)文學(xué)批評所涉的對象是先經(jīng)過了平臺淘汰機制篩選的。
平臺淘汰機制本身就是一個數(shù)據(jù)篩選機制,帶有一定程度的暴力性和排他性,“網(wǎng)絡(luò)平臺及其人工智能允許或青睞的內(nèi)容可能會迅速走紅;而它們貶低的,有時甚至是完全禁止的內(nèi)容則可能被降為冷門并因此默默無聞?!钡@里講到的數(shù)據(jù),有其特殊性。周冰將網(wǎng)絡(luò)文學(xué)的數(shù)據(jù)特性分成四層,分別是材料層的0和1、地基層的數(shù)據(jù)源、應(yīng)用層的平臺數(shù)據(jù)和界面層的數(shù)據(jù)顯示,并且認(rèn)為我們現(xiàn)在所涉及的數(shù)據(jù)分析主要是界面層的。這種劃分非常詳細(xì),而網(wǎng)絡(luò)文學(xué)的數(shù)據(jù)淘汰機制指的是地基層、應(yīng)用層和界面層的數(shù)據(jù)淘汰機制,更具體一些,指的是作品附帶的點擊率、收藏率,所在的排行榜和推薦位置等數(shù)據(jù)。網(wǎng)絡(luò)文學(xué)的淘汰過程明確地依賴于數(shù)據(jù)指標(biāo),未能展示出足夠人氣的作品往往會逐漸被隱藏或淘汰出局。
現(xiàn)有的網(wǎng)絡(luò)文學(xué)格局與平臺通過數(shù)據(jù)進(jìn)行的計算是分不開的。網(wǎng)絡(luò)文學(xué)產(chǎn)業(yè)是按照平臺的數(shù)字經(jīng)濟(jì)來組織文學(xué)生產(chǎn)的。平臺對用戶文學(xué)消費的理解和把握,比以往任何時代都要透徹。經(jīng)濟(jì)價值低的文類被視為“廢品”,市場價值高的文類則被奉為“明星產(chǎn)品”。進(jìn)入寫作平臺,就有各種秘籍來告訴寫手如何寫才能抓住讀者,讓自己的作品成為明星產(chǎn)品。帶有數(shù)據(jù)屬性的網(wǎng)絡(luò)文學(xué)最歧視的就是“無用文學(xué)”,因為這種文學(xué)是互聯(lián)網(wǎng)平臺系統(tǒng)中的累贅,無法帶來任何利益,還得為之提供數(shù)據(jù)服務(wù)。網(wǎng)文平臺制造了大量的數(shù)據(jù)生產(chǎn)規(guī)則,用以搜集用戶數(shù)據(jù),制作用戶畫像,然后再將這個包含了性別、年齡和地域的讀者畫像釋放給作者,讓他們精準(zhǔn)化生產(chǎn)。這已經(jīng)不是網(wǎng)絡(luò)文學(xué)產(chǎn)業(yè)的秘密,而幾乎成了互聯(lián)網(wǎng)文化產(chǎn)業(yè)減少失敗率的安全生產(chǎn)法則。
回顧中國網(wǎng)絡(luò)文學(xué)的發(fā)展歷程,我們可以清晰地看到,當(dāng)下網(wǎng)絡(luò)文學(xué)的繁榮是與網(wǎng)絡(luò)文學(xué)平臺的數(shù)字經(jīng)濟(jì)緊密相關(guān)的。平臺在網(wǎng)絡(luò)文學(xué)發(fā)展低潮(2002—2003年)時通過VIP收費閱讀雪中送炭。但網(wǎng)絡(luò)文學(xué)類型文主導(dǎo)的現(xiàn)狀,又何嘗不是這種支持帶來的文學(xué)等級分類?能盈利的小說被劃成上百種類型,而散文和詩歌被忽略,或者只被簡單歸為一種。這種情形是數(shù)據(jù)及其背后的市場和資本誘發(fā)的不平等后果。
可以說,數(shù)據(jù)邏輯在包括創(chuàng)作、閱讀、批評等在內(nèi)的整個網(wǎng)絡(luò)文學(xué)實踐中已經(jīng)底層化和結(jié)構(gòu)化。在數(shù)據(jù)的規(guī)訓(xùn)下,一切都顯得那么平庸,具有可比性。在平臺反復(fù)呈現(xiàn)的數(shù)據(jù)面前,我們幾乎無法保持對數(shù)據(jù)的鈍感,而總是會用數(shù)據(jù)來衡量我們的直覺判斷,以避免我們的主觀化。數(shù)據(jù)與客觀畫上了等號。批評要客觀中立,避免個人化,自然需要尊重數(shù)據(jù)。這與18世紀(jì)歐洲啟蒙運動中對統(tǒng)計學(xué)知識的推崇如出一轍。信息技術(shù)將萬物互聯(lián),讓言行數(shù)字化,試圖將一切都轉(zhuǎn)換成數(shù)字的形式進(jìn)行存儲。人工智能時代也是普遍數(shù)據(jù)化的時代。在信息技術(shù)的進(jìn)步和普及中,我們都成了數(shù)據(jù)牢籠中的囚徒。網(wǎng)絡(luò)文學(xué)批評中的價值評價和文化闡釋已經(jīng)受到了數(shù)據(jù)的強干擾。數(shù)據(jù)與算法勾連在一起,并不是完全客觀的。以內(nèi)容推薦算法為例,文學(xué)網(wǎng)站的分類通常是基于大眾和專業(yè)知識建立的靜態(tài)系統(tǒng),而標(biāo)簽則是根據(jù)具體需求動態(tài)生成的臨時區(qū)分。這兩者都是通過對作品和用戶進(jìn)行樹狀分類和標(biāo)注得到的。
網(wǎng)絡(luò)文學(xué)體量龐大,需要產(chǎn)業(yè)經(jīng)濟(jì)的支持,數(shù)據(jù)淘汰機制的存在是必需的,但我們需要警惕這一機制的局限性。文學(xué)作品經(jīng)過數(shù)據(jù)淘汰機制,就意味著已經(jīng)前置了數(shù)據(jù)思維。數(shù)據(jù)是一種可以用來比較的符號,符號就已經(jīng)是片面化了,數(shù)據(jù)則將這種片面進(jìn)一步放大。沒通過數(shù)據(jù)篩選的網(wǎng)絡(luò)文學(xué)作品,有可能是滄海遺珠,特別是網(wǎng)絡(luò)文學(xué)商業(yè)化后,被丟棄的優(yōu)秀作品可能會更多。數(shù)據(jù)淘汰機制犧牲的不僅有個人的權(quán)利,而且還包括特立獨行的創(chuàng)造力。如果說文學(xué)是為了精神層面的良好生活的話,那么我們就不能將某種存在視作理所當(dāng)然,而應(yīng)對其有足夠的反思和批判能力。僅僅滿足于用數(shù)據(jù)對既有現(xiàn)象的解釋并不能使文學(xué)向有利于人的方向發(fā)展。這是因為解釋本身是一種判斷,而注腳式的解釋既闡明了現(xiàn)象存在的原因,也為其存在的合理性提供了理由。當(dāng)解釋涉及人的現(xiàn)象時,它就會作為一種力量影響人類的發(fā)展。與不受預(yù)測影響的天氣不同,對網(wǎng)絡(luò)文學(xué)的解釋會直接影響其發(fā)展方向。
數(shù)字時代不僅是一個出現(xiàn)海量文學(xué)作品的時代,也是一個制造批評焦慮的時代。面對如此龐大的研究對象,很多學(xué)者希冀通過數(shù)字人文來彌補未能閱讀大量文本的缺憾,并從莫萊蒂(Franco Moretti)的“遠(yuǎn)讀”中找到了一些靈感。這種愿望,我們可以理解為期望借助數(shù)據(jù)化分析來達(dá)到對文學(xué)的宏觀把握。因此,網(wǎng)絡(luò)文學(xué)數(shù)據(jù)批評的出場與網(wǎng)絡(luò)文學(xué)的評價焦慮關(guān)聯(lián)在一起。網(wǎng)絡(luò)文學(xué)批評的學(xué)院派意識到了網(wǎng)絡(luò)文學(xué)的重要性,但又很難像對待傳統(tǒng)文學(xué)那樣通過批評深度介入,既有的批評大部分限于自說自話的狀態(tài)。作家作品批評只限于少數(shù)個體和作品。批評與創(chuàng)作處于割裂的狀態(tài)。
在此情況下,既然網(wǎng)絡(luò)文學(xué)有數(shù)據(jù)屬性,不如干脆引入數(shù)據(jù)批評??紤]到網(wǎng)絡(luò)文學(xué)比傳統(tǒng)文學(xué)的體量大太多,引入數(shù)據(jù)批評確實是一個很省力的方式。但數(shù)據(jù)批評所需要的數(shù)據(jù)不僅量大,而且要豐富多樣。因為我們所需要的網(wǎng)絡(luò)文學(xué)數(shù)據(jù)并非材料層作為二進(jìn)制機器語言的數(shù)據(jù),而是諸多其他層面的數(shù)據(jù)。因此,網(wǎng)絡(luò)文學(xué)數(shù)據(jù)批評面臨的最大挑戰(zhàn)是:我們需要的數(shù)據(jù)能獲取到何種程度,以及如何將這些數(shù)據(jù)有效應(yīng)用于文學(xué)批評。而要回答這些問題,則需要考察數(shù)據(jù)與互聯(lián)網(wǎng)平臺的關(guān)系。
二、數(shù)據(jù)的平臺控制與基于模型的批評
網(wǎng)絡(luò)文學(xué)的數(shù)據(jù)構(gòu)成非常廣泛,涵蓋了從文本內(nèi)容到用戶行為統(tǒng)計,再到作品的元數(shù)據(jù)等多個維度,形成了一個復(fù)雜多元的數(shù)據(jù)生態(tài)系統(tǒng)。我們可以把網(wǎng)絡(luò)文學(xué)寫作的最底層視作是數(shù)據(jù)錄入,將內(nèi)容轉(zhuǎn)換成0與1進(jìn)行存儲和表達(dá)。但網(wǎng)絡(luò)文學(xué)的數(shù)據(jù)除了錄入之外,還有按照平臺算法來生成的。關(guān)于網(wǎng)絡(luò)文學(xué)的大量數(shù)據(jù)中,只有作者和讀者輸入的那些才是錄入數(shù)據(jù),且這種數(shù)據(jù)在屏幕上并不以數(shù)據(jù)的形式來呈現(xiàn),而主要以文字來呈現(xiàn)。不僅網(wǎng)絡(luò)文學(xué),任何進(jìn)入網(wǎng)絡(luò)空間的信息都是以二進(jìn)制數(shù)據(jù)的方式存儲的。但這些信息的外在表現(xiàn)并非二進(jìn)制形式,而是以文字、圖像、聲音、影像等我們熟悉的樣式出現(xiàn)。一切皆可數(shù)據(jù)化,構(gòu)成了數(shù)字化時代。這種數(shù)據(jù)化產(chǎn)生的數(shù)據(jù)被稱為“一般數(shù)據(jù)”,一般數(shù)據(jù)“保持了它自身的運轉(zhuǎn),讓自己在云計算的裝置中生成和演化,變成了一種獨立于主體意識的存在”。一般數(shù)據(jù)是一切都被數(shù)字化后在抽象層面的數(shù)據(jù),它是包括作者、讀者、編輯等每一個用戶在數(shù)字化環(huán)境中“勞動”創(chuàng)造出來的產(chǎn)品。寫作、發(fā)布、搜索、閱讀、點贊、打賞、充值等行為都是在生產(chǎn)基礎(chǔ)性的數(shù)據(jù)原材料。而后,這些原材料在各種數(shù)字機器下被轉(zhuǎn)換成一般數(shù)據(jù)。
于網(wǎng)絡(luò)文學(xué)平臺而言,一般數(shù)據(jù)囊括了作品、網(wǎng)頁圖片、點擊、評論等所有信息。信息和數(shù)據(jù)是一體兩面的關(guān)系。信息面是一般人可以辨別的,底層數(shù)據(jù)則是極少數(shù)的專業(yè)人士才可以識別的。考慮到在數(shù)字化時代,所有的信息都以數(shù)據(jù)的方式存儲,我們完全可以說網(wǎng)絡(luò)文學(xué)的底層就是數(shù)據(jù),欣賞文學(xué)作品也是在欣賞以數(shù)據(jù)形式存儲的信息。但這種理解方式也適用于任何數(shù)字化的文學(xué)批評、網(wǎng)絡(luò)投票、視頻觀看、購物行為等差異巨大的活動。因此,網(wǎng)絡(luò)文學(xué)數(shù)據(jù)批評所需的并非這種通約化的二進(jìn)制數(shù)據(jù),而是服務(wù)于文學(xué)審美、鑒賞、批評等信息層面的、能夠被看懂的數(shù)據(jù)。簡言之,包括三個方面:作為數(shù)據(jù)源的作品、用戶點擊、評論;平臺公司后臺搭建的各種特性的數(shù)據(jù)庫;用戶可以直接看到的被顯示到界面的信息。而這三個方面具體數(shù)據(jù)背后都是一般數(shù)據(jù)。
網(wǎng)絡(luò)平臺有馬太效應(yīng),聚集的用戶越多其價值和吸引力愈大,這從經(jīng)濟(jì)學(xué)上來講屬于“積極的網(wǎng)絡(luò)效應(yīng)”。但由于平臺吸引力提高而聚集大量用戶的結(jié)果是,大量用戶的特定數(shù)據(jù)服務(wù)權(quán)壟斷在少數(shù)的供應(yīng)商那里,從而形成了巨無霸的網(wǎng)絡(luò)平臺?!斑@些網(wǎng)絡(luò)平臺日益依賴于人工智能,并在一定程度上產(chǎn)生了人類和人工智能之間的交集,其規(guī)模之大,已具有文明意義?!比斯ぶ悄艿母驹硎巧疃葘W(xué)習(xí)加算法。為了更好地控制用戶,平臺會利用各種手段和規(guī)則來挖掘用戶數(shù)據(jù)的豐富性和多樣性。就文學(xué)的數(shù)字閱讀來看,平臺在挖掘用戶數(shù)據(jù)上用盡心思:有賬戶、票夾、付費會員卡等消費數(shù)據(jù);書架、書單、閱讀時長、筆記等閱讀數(shù)據(jù);書評、本章說、點贊、轉(zhuǎn)發(fā)等互動數(shù)據(jù);經(jīng)驗值等級、任務(wù)、徽章、VIP等資格數(shù)據(jù)。而制造作品數(shù)據(jù)上的招數(shù)之多,令人眼花繚亂:字?jǐn)?shù)、總推薦、周推薦、月票、打賞、上架時間、共同閱讀的書友、短評數(shù)量等都是可見的數(shù)據(jù)信息,而且如起點中文網(wǎng)這樣的平臺還有各種誘導(dǎo)消費策略——月票排行榜非常醒目地標(biāo)出作品提升一個名次還需要的票數(shù),同時又列出當(dāng)日又有多少人已經(jīng)打賞了。平臺可見的數(shù)據(jù)之意非常露骨:你的支持和打賞贊助對作品至關(guān)重要,所以請消費。這是平臺資本的促銷手段。而平臺怎么使用這些數(shù)據(jù)勾畫出用戶畫像,怎么決定向作者展示用戶的哪些側(cè)面,其背后的數(shù)據(jù)模型和智能算法屬于行業(yè)機密之列。同樣,平臺如何根據(jù)數(shù)據(jù)來評估作品和作者的價值,除了作者自身可以看到的等級呈現(xiàn)之外,是否還有其他維度,也是一個黑箱。
互聯(lián)網(wǎng)平臺商業(yè)模式和生態(tài)中最核心的要素就是數(shù)據(jù)。數(shù)據(jù)于平臺而言,是一種資源。平臺生產(chǎn)占有數(shù)據(jù)的主要目標(biāo)在于制造經(jīng)濟(jì)價值。數(shù)據(jù)是被平臺占有的,雖然占有的合法性有待考量,但在制造和發(fā)掘用戶數(shù)據(jù)方面平臺的作用至關(guān)重要。
在數(shù)據(jù)生產(chǎn)上,永遠(yuǎn)是小平臺比不過大平臺,大平臺的馬太效應(yīng)、邊際效應(yīng)都可以讓小平臺黯然失色。所以我們比較容易看到起點這種大平臺的數(shù)據(jù),卻不太容易看到豆瓣讀書這樣的小平臺的數(shù)據(jù)。在數(shù)據(jù)所有權(quán)上,用戶的數(shù)據(jù)很少獨屬于用戶,而是被一個所謂的看不見的“后臺”所知悉。小用戶想與大平臺競爭,變得越來越難,平臺資本的力量變得無所不能,而其中的法寶就在于數(shù)據(jù)。生產(chǎn)數(shù)據(jù)、使用數(shù)據(jù)來盈利不只是免費閱讀的經(jīng)濟(jì)支柱,而且成為平臺的權(quán)力。而這些大平臺在各個方面的優(yōu)勢,又容易讓那些風(fēng)格特征迥異的、小平臺上的網(wǎng)絡(luò)文學(xué)陷入無法出頭的境況。
網(wǎng)絡(luò)空間的一般數(shù)據(jù)是被平臺占有的,因為它們被占有并能從中獲利,所以成為數(shù)字資本。數(shù)字資本是繼產(chǎn)業(yè)資本、金融資本之后“第三種起支配性作用的資本樣態(tài)”,且在三種資本中居于塔尖位置,是數(shù)字資本家能夠呼風(fēng)喚雨的底氣。這種資本屬于商業(yè)機密,是文學(xué)批評和任何文化活動都難以獲得的。數(shù)字資本意味著數(shù)據(jù)里面可能包含著一種權(quán)力關(guān)系和剝削關(guān)系,數(shù)據(jù)擁有點石成金的魔力。我們看到的只是平臺方愿意展示出來的數(shù)據(jù),外顯為文學(xué)作品、點擊量、頁面、榜單等信息。平臺方所有的權(quán)力都源于其所擁有的數(shù)據(jù)資源。故而,批評家想以文學(xué)批評的名義擁有完全數(shù)據(jù),于平臺而言就屬于搶占資本,必然會受到諸多阻撓和限制。
平臺壟斷和數(shù)據(jù)資本化導(dǎo)致網(wǎng)絡(luò)文學(xué)批評者只能獲得有限的數(shù)據(jù)。批評者雖然可以“扒”數(shù)據(jù),但因為權(quán)限和能力的局限,數(shù)據(jù)完整性會在相當(dāng)程度上受到限制。由此,批評者看到的數(shù)據(jù)本身就是“以偏概全”的。我們當(dāng)然可以設(shè)想平臺出于社會責(zé)任的考慮將數(shù)據(jù)釋放給相關(guān)部門和研究者,但同樣需要考慮平臺出于各種原因并沒有儲存全樣本數(shù)據(jù),或者出于各種考慮只釋放了部分?jǐn)?shù)據(jù)?;谶@種情形的普遍性,我們看到的網(wǎng)絡(luò)文學(xué)的數(shù)據(jù)必然是不完全數(shù)據(jù)。這點在實際的網(wǎng)絡(luò)文學(xué)數(shù)據(jù)批評實踐中已經(jīng)表現(xiàn)得十分明顯,譬如采用“一葉故事薈”來看“升級文”的吉云飛,就坦誠因選取的14部小說不及“升級文”的萬分之一、實驗條件不足,“本次實驗注定仍只是一次操練”。以萬分之一來代表“升級文”,無論如何都談不上全面客觀,也并未解決網(wǎng)絡(luò)小說閱讀量大的難題。
不僅如此,批評者本身也處在數(shù)據(jù)牢籠中,其數(shù)據(jù)痕跡也是可以被跟蹤計算的。于是,網(wǎng)絡(luò)文學(xué)數(shù)據(jù)批評變成了身處數(shù)據(jù)牢籠中的批評者依據(jù)有限數(shù)據(jù)進(jìn)行的批評,有非常大的局限性,也比較容易被平臺誘導(dǎo)。
但若我們不需要平臺的全數(shù)據(jù),只需特定的網(wǎng)絡(luò)文學(xué)文本,以數(shù)據(jù)軟件系統(tǒng)的模型來分析,是否就可以得出更為客觀的結(jié)論?這可能是文學(xué)批評者的另一種美好愿望,因為“模型偏差”是一種前提偏差、框架偏差。軟件分析的結(jié)果與其目標(biāo)設(shè)定是一致的,就是簡單化、規(guī)律化。從某種程度上來講,軟件模型的程序就已經(jīng)決定了其可能分析出來的結(jié)果。軟件分析“是通過理解和解釋另一套比文本本身更復(fù)雜的‘工具’(如編碼系統(tǒng)、決策程序、推理原則、知識表示)來理解眼前的文本的”。軟件工具是機械的、不透明的,預(yù)設(shè)了一種知識表征作為闡釋的合法基礎(chǔ)。譬如,在《基于BP神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)小說排行預(yù)測》中,我們可以看到自然科學(xué)學(xué)者在構(gòu)造用以預(yù)測網(wǎng)絡(luò)小說排行的BP人工神經(jīng)網(wǎng)絡(luò)時,預(yù)設(shè)的前提是:“相對于傳統(tǒng)小說,內(nèi)容質(zhì)量對網(wǎng)絡(luò)小說流行度影響并不顯著”。其模型設(shè)計選取的九種特征中,與小說相關(guān)的有五種(類型、評分、榮譽、字?jǐn)?shù)、評價人數(shù)),與作者相關(guān)的有四種(作品總數(shù)、等級、點擊推薦比率、日寫作效率)。這么一種模型框架已經(jīng)從規(guī)則上排除了作品內(nèi)容本身。
通過軟件模型進(jìn)行的分析,數(shù)據(jù)一般來自批評者的選擇或者爬取,而在這個過程中不當(dāng)?shù)臄?shù)據(jù)操縱很容易發(fā)生。數(shù)據(jù)重復(fù)、缺失、錯誤、不規(guī)范、不一致等情況都會發(fā)生,而分析者需要投入相當(dāng)?shù)臅r間和精力進(jìn)行數(shù)據(jù)清洗,在清洗過程中軟件操作者很容易就可以通過“校準(zhǔn)”得到自己想要的數(shù)據(jù)。不規(guī)范操作得到的數(shù)據(jù)是“臟數(shù)據(jù)”?!芭K數(shù)據(jù)”可能是出自客觀原因,也完全有可能是為了達(dá)到自己想要的目標(biāo)而進(jìn)行人為干預(yù)造成的。樣本數(shù)量和過程在相當(dāng)大程度上決定了結(jié)果。貌似客觀的分析工具,不僅已經(jīng)預(yù)設(shè)了模型偏差、算法偏見,而且在使用過程中也隨處可見人為操控的痕跡。
在平臺的數(shù)據(jù)壟斷下,身處數(shù)據(jù)牢籠的批評者借助軟件進(jìn)行的網(wǎng)絡(luò)文學(xué)研究,變成了一個既沒有全數(shù)據(jù)支撐,又需要借助有偏差的軟件模型,然后根據(jù)自身的統(tǒng)計素養(yǎng)來輔助操作的數(shù)據(jù)批評。這種到處都是漏洞的數(shù)據(jù)批評,其批評結(jié)果不僅缺乏客觀性,而且也缺乏可重復(fù)性,經(jīng)常是一次性的文學(xué)研究實驗。不過,為什么還有這么多人迷戀數(shù)據(jù)化的批評?假使數(shù)據(jù)化批評中的人工操作規(guī)范,是否就意味著這種批評的正當(dāng)性呢?這要求我們對數(shù)據(jù)批評進(jìn)行哲學(xué)思考,辨清其盲區(qū),并在此基礎(chǔ)上探索網(wǎng)絡(luò)文學(xué)批評采用數(shù)據(jù)化方法進(jìn)行突圍的原則和可能路徑。
三、道術(shù)相合:數(shù)據(jù)批評的遮蔽與去蔽
大至世界文學(xué)體系,小至網(wǎng)絡(luò)類型文學(xué)體系,都是存在等級差異的不平等體系。中心與邊緣有差別,但其相互位置又變動不居,這是文學(xué)史演變中的常見現(xiàn)象。不能窮盡文本不僅是數(shù)字時代批評家的困難,也是歷代文學(xué)批評家都要面對的狀況。這一正常的狀況,只有在對透明社會的渴慕下才會成為一個需要解決并相信能夠解決的問題。因為我們有內(nèi)在追求確定性的焦慮和對數(shù)據(jù)主義客觀透明的信仰。
數(shù)據(jù)主義是認(rèn)為一切都可以通過數(shù)據(jù)來理解和表達(dá)的哲學(xué)世界觀。它依靠大數(shù)據(jù)、全數(shù)據(jù)來揭示事物和現(xiàn)象背后的模式和規(guī)律,減少我們的認(rèn)知偏差。借助大數(shù)據(jù),智能算法意圖制造一個“全息”的認(rèn)知上的精準(zhǔn)圖像,而以此形成數(shù)據(jù)主義的新信仰。數(shù)據(jù)主義對數(shù)據(jù)重要性的強調(diào)演變成了數(shù)據(jù)至上的思潮。但假使我們從事批評可以獲得所有數(shù)據(jù),那么是否可以進(jìn)行客觀公允的數(shù)據(jù)批評呢?從具有超強算力和大數(shù)據(jù)支持的AI閱讀來看,同樣不可能。AI閱讀將所有的作品都平等地視為數(shù)據(jù),可是根據(jù)數(shù)據(jù)進(jìn)行的學(xué)習(xí),不是建立在對內(nèi)容深度理解之上的,而是根據(jù)符號相關(guān)性而非因果性進(jìn)行的淺學(xué)習(xí)。
數(shù)據(jù)主義有一些盲區(qū),它容易忽視那些不易量化的人類經(jīng)驗和社會現(xiàn)象。第一,數(shù)據(jù)揭示的是事物存在的相關(guān)的、隱秘的關(guān)系,回答“是這樣的”相關(guān)概率關(guān)系,而不是“為什么這樣”的因果關(guān)系,因果關(guān)系需要人來詮釋;第二,數(shù)據(jù)產(chǎn)生于具體的語境中,作為事物某種特色的量度,脫離語境來解讀就會產(chǎn)生誤讀,而如何保留其原生語境是個難題;第三,數(shù)據(jù)會排除情緒和情感的意向性,減少主觀偏差,但其權(quán)威性并非絕對,容易忽略偶然性的價值。
網(wǎng)絡(luò)文學(xué)研究中對數(shù)據(jù)分析模式的探索,對數(shù)據(jù)批評的呼喚,是為了減少我們對網(wǎng)絡(luò)文學(xué)的認(rèn)識偏差,是數(shù)據(jù)主義的表現(xiàn)。與數(shù)據(jù)主義存在的盲區(qū)相一致,數(shù)據(jù)化的文學(xué)批評也存在明顯的遮蔽性,主要表現(xiàn)在以下幾個方面。
一是網(wǎng)絡(luò)文學(xué)單純依據(jù)數(shù)據(jù)的詮釋會相當(dāng)貧乏。貧乏的本身源于數(shù)據(jù)認(rèn)知的碎片化,僅僅展現(xiàn)原始的相關(guān)關(guān)系,而不能詮定概念。大數(shù)據(jù)、全數(shù)據(jù)引導(dǎo)的認(rèn)知是一種疊加的產(chǎn)物,無法終結(jié),也是一種無知。因此,我們也很容易發(fā)現(xiàn),用軟件對文學(xué)作品進(jìn)行數(shù)據(jù)分析得出來的結(jié)論,幾乎是一個沒有靈魂的常識,不如定性分析和理論分析來得深入。原因在于定性分析的推論和理論都有一種整合性,這與精神具有的整合性是一致的。所以,我們可以看到即便以某一年的749部網(wǎng)絡(luò)小說為考察對象,得出來的結(jié)論也比較簡單,有些內(nèi)容就是在印證網(wǎng)絡(luò)文學(xué)方面的一些常識。
二是基于網(wǎng)絡(luò)文學(xué)作品的數(shù)據(jù)批評,經(jīng)常是抽離了平臺語境、文化語境和讀者個人體驗的通約處理,會忽視文學(xué)作品的多義性和復(fù)雜性。這是因為借以處理文學(xué)數(shù)據(jù)的分析模型本身是通過平均化、概率化的方式來處理文學(xué)的獨特性的,而喪失獨特性的文學(xué),是均質(zhì)化的文學(xué),對于文學(xué)發(fā)展不利。如果說第一次啟蒙運動中,統(tǒng)計學(xué)讓伏爾泰等人為之迷狂的話,那么目前大數(shù)據(jù)是以韓炳哲所說的第二次啟蒙運動的身份登場,而這是以放棄偶然性和獨特性為代價的。譬如,當(dāng)以“遠(yuǎn)讀”來把握“小說節(jié)奏和讀者情緒”時,是將“情緒”這種主觀感受作為“升級”(或者升級前的挫折)活動的必然搭檔來理解的。但情緒是短暫易逝和復(fù)雜多樣的,除了與“升級”同頻共振的情緒,還有很多其他情緒,越是內(nèi)涵豐富的小說越是如此。機器的“遠(yuǎn)讀”是以犧牲人文批評在“細(xì)讀”中對作品蘊藏的情感和態(tài)度的微妙捕捉為代價的。
每一時代有每一時代之文學(xué),充分說明了文學(xué)語境的重要性。但將大量的文學(xué)文本放在一起進(jìn)行數(shù)據(jù)分析的批評,放棄了文學(xué)作品之感受的語境脈絡(luò)。這種形式的網(wǎng)絡(luò)文學(xué)作品如同單個的、脫離了整個語言系統(tǒng)的語詞,而語詞符號表意的關(guān)鍵正是在于系統(tǒng)。在數(shù)據(jù)批評的通約中,作品的個性被抹殺,然后我們又據(jù)此來批評這些作品沒有個性,這是邏輯上的悖論。
三是網(wǎng)絡(luò)文學(xué)批評實踐中的對象常是經(jīng)過平臺數(shù)據(jù)篩選機制的對象,但數(shù)據(jù)自攜的“客觀性”光環(huán)導(dǎo)致平臺數(shù)據(jù)評價偏差一旦出現(xiàn),對網(wǎng)絡(luò)文學(xué)作品的傷害就很難得到糾正,且會形成一種惡性循環(huán)。專業(yè)批評者也很難在數(shù)據(jù)社會逃離數(shù)據(jù)牢籠,同樣面臨著平臺對我們閱讀潛意識的搜捕。而平臺上網(wǎng)絡(luò)文學(xué)的各種數(shù)據(jù)本身是與平臺經(jīng)濟(jì)糾纏在一起的,批評很容易就落入為資本服務(wù)的陷阱。
指出網(wǎng)絡(luò)文學(xué)數(shù)據(jù)批評的遮蔽性并不是完全否定其存在意義,關(guān)鍵在于思考我們需要什么樣的數(shù)據(jù)批評?;跀?shù)字邏輯在網(wǎng)絡(luò)文學(xué)中作為基礎(chǔ)架構(gòu)的存在,引入數(shù)據(jù)批評十分必要。數(shù)據(jù)批評的原理在于,網(wǎng)絡(luò)文學(xué)及其相關(guān)網(wǎng)絡(luò)活動作為一種數(shù)字化存在,能夠讓我們通過計算機對其底層數(shù)據(jù)的處理來獲得對作品及相關(guān)文化現(xiàn)象的理解和把握。嚴(yán)謹(jǐn)?shù)卣f,數(shù)據(jù)批評方法不是距離意義上的“遠(yuǎn)讀”,而是借助機器和數(shù)智技術(shù)的“另一種”閱讀。它是一個強大的工具,可以幫助我們理解數(shù)字時代的文學(xué)現(xiàn)象和價值。那么,我們應(yīng)該如何去除遮蔽性,借助數(shù)據(jù)批評來更新升級網(wǎng)絡(luò)文學(xué)批評?這涉及批評之道與術(shù)的關(guān)系。
傳統(tǒng)人文批評擅長處理文學(xué)的精神文化方面的價值,進(jìn)行定性分析。而數(shù)據(jù)批評擅長借助計算機技術(shù)進(jìn)行量化分析,因此數(shù)據(jù)批評可以視為一種新質(zhì)生產(chǎn)力,作為人文批評的有力補充,共同致力于提升人文之道。因為數(shù)據(jù)無法敘事,也無法產(chǎn)生意義,所以數(shù)據(jù)批評作為一種批評術(shù),它要依賴于一定的理念和闡釋,所以數(shù)據(jù)化分析之前和之后都是需要人文思辨的,需要批評者對其理論前提和批評目的進(jìn)行細(xì)致地辨析。
首先,網(wǎng)絡(luò)文學(xué)數(shù)據(jù)批評需要劃定目標(biāo),將那些傳統(tǒng)人文批評無法把握的現(xiàn)象或作品作為研究對象,在合理的理念前提下進(jìn)行,以數(shù)據(jù)研究促進(jìn)文學(xué)批評。這就需要排除那些僅僅用來印證網(wǎng)絡(luò)文學(xué)常識的數(shù)據(jù)批評。數(shù)據(jù)研究是有限度的,需要以假說為指導(dǎo),在理論概念的引導(dǎo)下進(jìn)行,這種研究并非簡化而是需要嘗試非常復(fù)雜嚴(yán)謹(jǐn)?shù)难芯磕J?。在這方面,李強的《作為數(shù)字人文思維的“網(wǎng)文算法”——以“明穿”小說為例》對數(shù)字人文的思考很有參考價值。他始終在一個具體的時代語境中去考量,從文化思潮脈絡(luò)中去理解“明穿”小說的變化,定性分析與定量分析交織進(jìn)行。但即便如此,他借助軟件對兩部群穿小說角色占比的分析,也稍有遺憾。穿越者的多寡只有比較意義,而這通過簡單閱讀就可以得出。
其次,數(shù)據(jù)批評方法的豐富多樣性需要進(jìn)一步拓展,數(shù)據(jù)操作需要規(guī)范。在人工智能高度發(fā)展的今天,數(shù)據(jù)化方法是非常多樣的:利用或建設(shè)可供公開檢索的作品數(shù)據(jù)庫進(jìn)行統(tǒng)計分析;借助不同模型的分析軟件;利用不同類別的神經(jīng)網(wǎng)絡(luò)技術(shù);數(shù)據(jù)挖掘和機器學(xué)習(xí);數(shù)據(jù)可視化和大數(shù)據(jù)分析等。每種數(shù)據(jù)化方法背后都是有模型的,模型依賴于數(shù)據(jù)的性質(zhì)、分析的目標(biāo)以及可用的技術(shù)資源。有效的數(shù)據(jù)批評不僅需要對數(shù)據(jù)本身有深入的理解,還需要對使用的模型有充分的認(rèn)識,包括它們的假設(shè)、局限性和適用性。假如數(shù)據(jù)化背后的模型存在偏差,那么數(shù)據(jù)分析就很容易出現(xiàn)根本性錯誤,而在此之上的數(shù)據(jù)批評也會謬以千里。故而,在使用數(shù)據(jù)化方法之前,我們應(yīng)該對模型本身進(jìn)行批評性思考,并深入理解其具體運用的條件。任何數(shù)據(jù)化方法在使用中都需要人對數(shù)據(jù)進(jìn)行操作,包括尋找數(shù)據(jù)、清洗數(shù)據(jù)、校準(zhǔn)數(shù)據(jù)等。這個過程涉及廣泛的人為操作,因此對操作者的數(shù)據(jù)素養(yǎng)提出了較高要求,這對人文學(xué)者而言可能是一個挑戰(zhàn)。然而,這一挑戰(zhàn)可以通過跨學(xué)科合作來克服。
最后,任何數(shù)據(jù)批評或者人文批評的主體都是人,培養(yǎng)復(fù)合型的網(wǎng)絡(luò)文學(xué)批評者至關(guān)重要。網(wǎng)絡(luò)文學(xué)數(shù)據(jù)批評的目的在于借助數(shù)據(jù)達(dá)到對網(wǎng)絡(luò)文學(xué)的精確把握,但無論是網(wǎng)絡(luò)文學(xué)還是整體意義上的文學(xué),本身就是含混、矛盾、偶然性和多樣性的匯聚。文學(xué)的內(nèi)涵和思想是由包括批評者在內(nèi)的讀者閱讀解釋出來的,是人在與文學(xué)作品的碰撞中產(chǎn)生的,沒有這種碰撞,而只是通過模型對作品進(jìn)行數(shù)據(jù)分析解讀,文學(xué)的審美價值和文化內(nèi)涵很難被捕捉到。因此,數(shù)據(jù)批評需要批評者有閱讀網(wǎng)絡(luò)文學(xué)的直接經(jīng)驗,具有一定的思辨能力。雖然專業(yè)的網(wǎng)絡(luò)文學(xué)批評者具備扎實的文學(xué)基礎(chǔ)和豐富的評論經(jīng)驗,但他們有時可能因閱讀量不足而在理解網(wǎng)絡(luò)文學(xué)的獨有特質(zhì)上有所欠缺。相比之下,網(wǎng)絡(luò)文學(xué)的廣大讀者群擁有豐厚的閱讀經(jīng)驗,但他們往往缺乏一個更開闊的文學(xué)視野和正規(guī)的批評訓(xùn)練,這限制了他們進(jìn)行深入批評的能力。從事網(wǎng)絡(luò)文學(xué)的數(shù)據(jù)批評不僅要求對網(wǎng)絡(luò)文學(xué)本身具備直觀的體驗和理解,還要求批評者擁有較強的數(shù)字人文背景——這包括對數(shù)字化文本的分析能力和對相關(guān)技術(shù)工具的熟練運用。正如網(wǎng)絡(luò)文學(xué)創(chuàng)作中出現(xiàn)了很多非文科背景的作者,網(wǎng)絡(luò)文學(xué)讀者中也可以出現(xiàn)既有媒介技術(shù)素養(yǎng),又有較高文學(xué)辨識力的批評者。培養(yǎng)年輕人,使他們在具備豐富的閱讀體驗和較高的新媒介素養(yǎng)的基礎(chǔ)上,經(jīng)過專業(yè)的訓(xùn)練,能夠?qū)?shù)據(jù)批評與人文批評融合于文學(xué)探討之中,并賦予他們必要的話語權(quán)和文學(xué)批評的使命感,這才是確保網(wǎng)絡(luò)文學(xué)持續(xù)發(fā)展的正確途徑。
結(jié)語
目前,數(shù)字人文迅猛發(fā)展但爭議不斷??鐚W(xué)科尋求網(wǎng)絡(luò)文學(xué)批評的新思路與對數(shù)據(jù)世界客觀透明的想象纏繞在一起。網(wǎng)絡(luò)文學(xué)的數(shù)據(jù)批評在實際操作中成了一種裝飾性存在,表現(xiàn)為以表格、數(shù)據(jù)、圖表等方式來豐富文章形式的淺顯分析。這種批評雖然看起來是跨學(xué)科的,但將之聚攏在一起去看,很容易發(fā)現(xiàn)其重復(fù)性和模式化。
數(shù)字邏輯在整個網(wǎng)絡(luò)文學(xué)實踐中的底層化和結(jié)構(gòu)化,使數(shù)據(jù)批評的出場成為必需。但身處數(shù)據(jù)牢籠的批評者進(jìn)行的網(wǎng)絡(luò)文學(xué)數(shù)據(jù)批評,面臨著數(shù)據(jù)的平臺控制、模型分析的偏差、數(shù)據(jù)操縱等諸多實踐上的難題。從哲學(xué)基礎(chǔ)上看,數(shù)據(jù)批評的數(shù)據(jù)主義傾向會遮蔽文學(xué)的獨特性,“數(shù)據(jù)透鏡”很容易就過濾掉了文學(xué)的審美價值和多重含義。數(shù)據(jù)批評方法的合理使用需要有理論的引導(dǎo),數(shù)據(jù)分析應(yīng)該放在人文思辨的脈絡(luò)中來推進(jìn)。單純?yōu)榱艘霐?shù)據(jù)方法而進(jìn)行數(shù)據(jù)批評,多半會淪為驗證已有結(jié)論的一次性文學(xué)研究實驗。數(shù)據(jù)批評要成為網(wǎng)絡(luò)文學(xué)批評的有力助推器,需要以數(shù)據(jù)批評之術(shù)來提升人文之道,實現(xiàn)道術(shù)相合,提升人文思辨的力度,使文學(xué)批評在定性分析與定量分析的無縫銜接中不斷前進(jìn)。
〔本文注釋內(nèi)容略〕