出版數(shù)字人: 褪去熱度 迎來新局
過去一年,出版業(yè)的數(shù)字人經(jīng)歷了由風(fēng)靡一時(shí)的火熱逐漸轉(zhuǎn)向默默無聞。如同區(qū)塊鏈、元宇宙、數(shù)字藏品等曾經(jīng)在業(yè)內(nèi)爆火的概念一樣,數(shù)字人在出版業(yè)“涼”了,可能是一段時(shí)間以來業(yè)外人士對(duì)數(shù)字人所下的論斷。
“雖然業(yè)外媒體對(duì)數(shù)字人的討論已顯著降低,但數(shù)字人熱度的所謂‘降溫’并不是壞事,反而是行業(yè)從概念炒作走向理性發(fā)展的標(biāo)志。”中華書局古聯(lián)數(shù)字產(chǎn)業(yè)研究院院長(zhǎng)王建表示。理性,就是將“概念”變實(shí),并帶來實(shí)際的發(fā)展與效益。該公司蘇東坡數(shù)字人已在很多場(chǎng)合“亮相”,如“第五屆伯鴻書香獎(jiǎng)”頒獎(jiǎng)典禮上和真人同臺(tái)主持;在央視的《中國詩詞大會(huì)》,以“歷史情景再現(xiàn)”的形式為選手出題;在眉山三蘇祠博物館的展覽中,通過短視頻講述自己的家風(fēng)故事……
蘇東坡數(shù)字人是中華書局古聯(lián)公司推出“中華先賢數(shù)字人”項(xiàng)目中的一個(gè)數(shù)字人,該項(xiàng)目通過現(xiàn)代科技手段讓歷史人物“活”起來。這也是出版業(yè)創(chuàng)造數(shù)字人的思路之一,通過數(shù)字人媒介讓名人與讀者產(chǎn)生直接互動(dòng),達(dá)到更有效的文化傳播,如中信出版集團(tuán)聯(lián)合小冰公司發(fā)布凱文·凱利數(shù)字人,中圖云創(chuàng)智能科技(北京)有限公司的馬可波羅數(shù)字人等。另一種思路則是幫助讀者閱讀、理解讀書內(nèi)容的數(shù)字人,這種數(shù)字人往往更突出圖書營銷的作用。
果麥文化開發(fā)了AI讀書小助手“麥麥”,為廣大讀者用戶推薦書單、對(duì)話導(dǎo)讀、啟發(fā)思考,提升閱讀體驗(yàn),還針對(duì)不同的知識(shí)領(lǐng)域,設(shè)計(jì)了更多經(jīng)過專屬知識(shí)庫訓(xùn)練的文化人物或?qū)<业淖x書數(shù)字人。圍繞這些讀書數(shù)字人,果麥開通了“麥麥知書”微信小程序,基于該小程序,目前已開發(fā)了近100個(gè)讀書數(shù)字人,能夠?qū)?000種精選好書進(jìn)行解讀和對(duì)話;同時(shí),通過麥麥知書小紅書賬號(hào),實(shí)現(xiàn)對(duì)所有重點(diǎn)營銷圖書同步發(fā)布數(shù)字人導(dǎo)讀營銷短視頻?!澳壳皵?shù)字人在熱度上確實(shí)不如從前,但這可能只是表面現(xiàn)象?!惫溛幕紫畔⒐偈Y凡表示。
的確,現(xiàn)在的技術(shù)圈,AI大模型、人形機(jī)器人是實(shí)力擔(dān)當(dāng),數(shù)字人作為前幾年出現(xiàn)的技術(shù)成果,勢(shì)必顯得“過時(shí)”。同時(shí),隨著數(shù)字人產(chǎn)業(yè)自身的發(fā)展,“數(shù)字人”這一概念已不僅僅局限于臺(tái)前的表演展示,而是逐漸發(fā)展成走向幕后的“操盤手”。蔣凡表示,數(shù)字人本身正在發(fā)生變化,從最初人們談?wù)撍鼤r(shí)專指卡通造型人物對(duì)好口型播報(bào)信息,到現(xiàn)在的多智能體驅(qū)動(dòng)工作流的整體營銷方案,其熱度正在傳導(dǎo)到業(yè)務(wù)場(chǎng)景最需要的地方。果麥文化的數(shù)字人在該公司的業(yè)務(wù)流程中,實(shí)際承擔(dān)的是營銷性質(zhì)的工作,主要體現(xiàn)在內(nèi)部效率的提升,包括從社交媒體抓取熱點(diǎn)話題、分析熱門事件內(nèi)容、匹配營銷圖書價(jià)值原型,到調(diào)用大模型生成推薦文案、設(shè)計(jì)分鏡頭腳本、AI生成場(chǎng)景配圖,最終剪輯成數(shù)字人出鏡的短視頻、交付給營銷團(tuán)隊(duì)用于投流推送的全流程數(shù)智化改造,將原先花費(fèi)1到2周時(shí)間完成的營銷策劃,最短情況下可縮短到幾個(gè)小時(shí)就能上線發(fā)布。
東方出版中心也敏銳捕捉到了數(shù)字人在出版營銷領(lǐng)域的獨(dú)特意義和先鋒作用。該公司的數(shù)字人“東東”和“芳芳”能結(jié)合AI工具,輔助生成形式多樣的內(nèi)容,高效、持續(xù)地傳播圖書信息,減輕編輯和營銷人員的文字負(fù)擔(dān)。
但同時(shí),數(shù)字人在實(shí)際應(yīng)用過程仍面臨很多局限性。誠如很多出版人提到的,數(shù)字人目前仍面臨技術(shù)表現(xiàn)力與文化深度需求的不匹配,語音、動(dòng)作等方面的逼真度仍有待提升等問題。四川人民出版社有限公司副總經(jīng)理、副社長(zhǎng)李真真表示:“從我們自身角度來說,出版領(lǐng)域高質(zhì)量語料庫建設(shè)的滯后,也成為現(xiàn)階段數(shù)字人效果提升的局限。”
而如今熱火朝天的AI大模型正成為解決數(shù)字人這一痛點(diǎn)的靈藥,成為突破其發(fā)展瓶頸的加速器,AI技術(shù)的廣泛介入極大提升了數(shù)字人的交互能力、內(nèi)容生成能力及智能化水平。東方出版中心正在與有關(guān)高校和研究機(jī)構(gòu)合作,探索出版大模型的開發(fā)與應(yīng)用,其中就包括對(duì)出版數(shù)字人的研究與開發(fā)。該公司融媒體中心主任丁峰表示,數(shù)字人在內(nèi)容創(chuàng)作,尤其在內(nèi)容整合領(lǐng)域,利用其強(qiáng)大的自然語言處理能力,對(duì)出版物的生產(chǎn)效率和質(zhì)量的提升有很大助益。中華書局古聯(lián)公司“中華先賢數(shù)字人”項(xiàng)目也正在搭乘AI的東風(fēng),結(jié)合AI技術(shù),開發(fā)先賢數(shù)字人智能體,計(jì)劃在2025年完成李白、蘇東坡、李清照三款數(shù)字人智能體的開發(fā),實(shí)現(xiàn)自然的語言交流、生動(dòng)的動(dòng)作表現(xiàn)和豐富的情感表達(dá),中華書局的版權(quán)內(nèi)容數(shù)據(jù)優(yōu)勢(shì)則可以最大限度地杜絕“人工智能幻覺”。
蔣凡認(rèn)為,隨著AI技術(shù)的快速演進(jìn),在現(xiàn)有文本數(shù)據(jù)中以低成本產(chǎn)出大量高質(zhì)量創(chuàng)意內(nèi)容,將成為不可阻擋的事實(shí),這是數(shù)字人技術(shù)和應(yīng)用將大行其道的物質(zhì)基礎(chǔ)。廣西師范大學(xué)出版社集團(tuán)有限公司融合發(fā)展中心總經(jīng)理韋波表示:“我們將持續(xù)關(guān)注和嘗試使用AI視頻工具,依據(jù)原始建模去生成數(shù)字人綠幕素材的路徑。一旦技術(shù)發(fā)展到能替代動(dòng)畫工具,達(dá)到人類手工制作的精美程度,那將極大地激活數(shù)字人IP內(nèi)容制作的活力和潛力。近期我國的生成式AI技術(shù)取得了令人興奮的進(jìn)步,也讓我們對(duì)這一刻的早日到來燃起了極高的期待?!?/p>
“當(dāng)技術(shù)先鋒性與文化厚重性找到平衡點(diǎn),數(shù)字人將真正成為連接千年文明與未來世界的‘時(shí)光橋梁’?!崩钫嬲嬲f。
如今出版行業(yè)數(shù)字人的發(fā)展究竟如何?出版行業(yè)的數(shù)字人面臨著哪些獨(dú)特的發(fā)展需求?該如何找到技術(shù)與文化的平衡點(diǎn)?本期,商報(bào)特邀6家成熟運(yùn)營數(shù)字人的出版單位相關(guān)負(fù)責(zé)人,請(qǐng)他們談?wù)劤霭鏄I(yè)數(shù)字人的困境與出路。
行業(yè)數(shù)字人仍有很大發(fā)展?jié)摿?/strong>
■謝清溪(河南大學(xué)出版社社長(zhǎng))
過去一年里,我社策劃了多項(xiàng)數(shù)字出版項(xiàng)目,數(shù)字人與出版的結(jié)合也有較為成功的嘗試。其中“河南故事新篇·中華源AIGC領(lǐng)航文化出?!表?xiàng)目榮獲較好的社會(huì)反響和同行認(rèn)可。我們推出數(shù)字人的初衷,是希望能夠順應(yīng)出版行業(yè)數(shù)字化轉(zhuǎn)型的趨勢(shì),探索新的內(nèi)容創(chuàng)作與傳播方式,數(shù)字人作為一種新興技術(shù)和創(chuàng)意表達(dá)形式,具有很大潛力。
具體來說,數(shù)字人形象可以根據(jù)不同內(nèi)容和受眾進(jìn)行定制,具有很強(qiáng)的可塑性和吸引力,能夠吸引年輕群體的關(guān)注。其次,數(shù)字人不受時(shí)間和空間的限制,可以隨時(shí)隨地進(jìn)行內(nèi)容傳播,比如通過社交媒體、直播等渠道進(jìn)行推廣。再者,在內(nèi)容創(chuàng)作方面,數(shù)字人可以參與到故事創(chuàng)作、互動(dòng)體驗(yàn)等環(huán)節(jié),增加內(nèi)容的趣味性和互動(dòng)性。
當(dāng)然,數(shù)字人也有自己的局限性。一方面,數(shù)字人的開發(fā)成本較高,包括技術(shù)研發(fā)、形象設(shè)計(jì)、內(nèi)容創(chuàng)作等方面都需要投入大量的資金和人力。另一方面,目前的數(shù)字人技術(shù)在情感表達(dá)和真實(shí)感方面還存在一定的不足,難以與讀者建立深度的情感連接。此外,數(shù)字人在文化內(nèi)涵的深度挖掘和傳遞上,還需要進(jìn)一步探索和提升。
在“中華源·河南故事:AIGC數(shù)字人傳承計(jì)劃”中,形象設(shè)計(jì)上,我們充分考慮了出版行業(yè)的文化屬性,賦予數(shù)字人知識(shí)淵博、優(yōu)雅知性的形象特點(diǎn),以契合出版社的品牌形象和文化內(nèi)涵。在功能設(shè)計(jì)方面,我們注重?cái)?shù)字人的內(nèi)容創(chuàng)作和傳播能力,例如為其設(shè)計(jì)了能夠進(jìn)行書籍解讀、文化知識(shí)分享等功能。同時(shí),考慮到傳播的多樣性,我們讓數(shù)字人具備多平臺(tái)適配的能力,可以在不同的社交媒體和數(shù)字平臺(tái)上進(jìn)行展示和互動(dòng)。
在實(shí)際應(yīng)用過程中,數(shù)字人主要承擔(dān)了內(nèi)容推廣、閱讀引導(dǎo)和互動(dòng)交流等工作。在內(nèi)容推廣方面,數(shù)字人通過制作精美的短視頻、直播等形式,向讀者介紹新書、好書,吸引了大量用戶的關(guān)注,有效提升了書籍的銷量和知名度。在閱讀引導(dǎo)方面,數(shù)字人可以對(duì)書籍進(jìn)行深度解讀,幫助讀者更好地理解書籍內(nèi)容,提高閱讀體驗(yàn)。在互動(dòng)交流方面,數(shù)字人能夠與讀者進(jìn)行實(shí)時(shí)互動(dòng),回答讀者的問題,收集讀者的反饋,增強(qiáng)了讀者與出版社之間的黏性。
在出版行業(yè),數(shù)字人仍然具有很大的發(fā)展?jié)摿?。我們需要更加注重?cái)?shù)字人的內(nèi)容創(chuàng)作和應(yīng)用場(chǎng)景的挖掘,提升數(shù)字人的質(zhì)量和價(jià)值,讓數(shù)字人真正為出版行業(yè)的發(fā)展服務(wù)。
目前出版行業(yè)數(shù)字人的技術(shù)應(yīng)用還處于發(fā)展階段,雖然已經(jīng)取得了一些成果,但與一些技術(shù)領(lǐng)先行業(yè)相比,還有一定差距。出版行業(yè)獨(dú)特的技術(shù)需求包括:一是更加注重?cái)?shù)字人的文化內(nèi)涵和知識(shí)儲(chǔ)備,能夠準(zhǔn)確解讀和傳播出版內(nèi)容;二是在互動(dòng)體驗(yàn)方面,開發(fā)出更加適合閱讀和學(xué)習(xí)的互動(dòng)技術(shù),如智能問答、個(gè)性化推薦等。應(yīng)用場(chǎng)景主要集中在內(nèi)容創(chuàng)作、推廣和閱讀引導(dǎo)等方面,例如數(shù)字人參與書籍創(chuàng)作、為讀者提供個(gè)性化的閱讀建議等。
我社對(duì)數(shù)字人的后續(xù)發(fā)展有明確規(guī)劃:一方面,繼續(xù)加大技術(shù)研發(fā)投入,提升數(shù)字人的智能水平和情感表達(dá)能力,使其更加真實(shí)、自然。另一方面,拓展數(shù)字人的應(yīng)用場(chǎng)景,除了現(xiàn)有的內(nèi)容推廣和閱讀引導(dǎo)外,還將在數(shù)字教育、文化旅游等領(lǐng)域進(jìn)行探索。在業(yè)務(wù)板塊上,我們會(huì)在新書推廣、數(shù)字閱讀平臺(tái)、知識(shí)付費(fèi)課程、營銷推廣等業(yè)務(wù)中繼續(xù)深度應(yīng)用數(shù)字人,充分發(fā)揮數(shù)字人的優(yōu)勢(shì),提升業(yè)務(wù)的競(jìng)爭(zhēng)力和用戶體驗(yàn)。
數(shù)字人在出版與文化傳播方面的作用是顯著且具有潛力的。它不僅是一種新的內(nèi)容呈現(xiàn)形式,更是推動(dòng)出版行業(yè)數(shù)字化轉(zhuǎn)型的重要力量。在文化傳播方面,數(shù)字人可以成為文化的傳播者和傳承者。數(shù)字人在出版行業(yè)仍有很大的發(fā)展空間。隨著技術(shù)的不斷進(jìn)步,如人工智能、虛擬現(xiàn)實(shí)等技術(shù)的融合應(yīng)用,數(shù)字人將更加智能、真實(shí)和個(gè)性化。我們需要不斷探索和創(chuàng)新,挖掘數(shù)字人在出版領(lǐng)域的更多應(yīng)用場(chǎng)景,完善其商業(yè)變現(xiàn)模式,讓數(shù)字人真正成為出版行業(yè)發(fā)展的有力助推器。
數(shù)字人會(huì)成為文明與未來的“時(shí)光橋梁”
■李真真(四川人民出版社有限公司副總經(jīng)理、副社長(zhǎng))
四川人民出版社旗下融合出版品牌“鹽道街3號(hào)書院”近兩年嘗試探索人工智能技術(shù)在出版行業(yè)的應(yīng)用,并推出了與《孔夫子的論語課》《時(shí)間的煙火:1995—2005成都城市影像記憶》等多種圖書配套的AI數(shù)字人服務(wù)以及融合出版數(shù)字人專屬形象IP“川寶熊貓”。初衷是利用先進(jìn)技術(shù)賦能出版業(yè),提高出版服務(wù)效率與質(zhì)量,推動(dòng)行業(yè)轉(zhuǎn)型升級(jí)。預(yù)期目標(biāo)是讓數(shù)字人成為出版服務(wù)的得力助手,提升傳播效果與交互性,為讀者提供更優(yōu)質(zhì)的閱讀體驗(yàn)。
數(shù)字人在出版界的應(yīng)用優(yōu)勢(shì)在于以下幾點(diǎn)。其一,通過知識(shí)點(diǎn)的拆解形成知識(shí)庫,在此基礎(chǔ)上進(jìn)行24小時(shí)交互問答,快速收集分析信息、撰寫內(nèi)容等,可不知疲倦地高效工作,降低人工客服成本。其二,通過AI語義理解將晦澀文獻(xiàn)轉(zhuǎn)化為口語化短視頻,能以多種形象和風(fēng)格呈現(xiàn),滿足不同受眾需求,提升內(nèi)容吸引力。
我社數(shù)字人應(yīng)用之一即是打造作家數(shù)字分身,例如與《阿來講杜甫成都詩》一書配套的數(shù)字人“AI阿來”。此外,注重從流量入口進(jìn)化為知識(shí)服務(wù)節(jié)點(diǎn)。例如我社推出的《孔夫子的論語課》領(lǐng)讀員“AI孔夫子”,以互動(dòng)體驗(yàn)的方式吸引小讀者“趣”讀論語,沉浸式學(xué)習(xí)國學(xué)經(jīng)典,通過數(shù)字人技術(shù)增加圖書的吸引力和互動(dòng)性。數(shù)字人技術(shù)賦能傳統(tǒng)紙書,數(shù)字人問答形式將一本書“變薄”,數(shù)字資源拓展則和讀者一起將知識(shí)“讀厚”。我社原創(chuàng)推出的“科技+本土文化元素”相結(jié)合的數(shù)字人“川寶熊貓”,在我社出版的“一本博物館”書系中化身為湖北博物館的超能導(dǎo)航員,與讀者進(jìn)行智能問答互動(dòng),回答“湖北博物館鎮(zhèn)館之寶”等博物館書系的書內(nèi)書外各類問題,并出現(xiàn)在我社《瓷器改變世界》等多種元宇宙圖書中,以及全國首場(chǎng)默默醬真·元宇宙演唱會(huì)現(xiàn)場(chǎng)。提質(zhì)增效降本的同時(shí),驅(qū)動(dòng)出版從“內(nèi)容交付”向“交互體驗(yàn)”升級(jí)。
目前來看,數(shù)字人在實(shí)際應(yīng)用過程中有兩方面的局限性,一是缺乏真正的創(chuàng)造力和情感理解,技術(shù)表現(xiàn)力與文化深度需求不匹配,難以創(chuàng)作出飽含深度情感與創(chuàng)新思想的內(nèi)容;二是技術(shù)成本高,且語音、動(dòng)作等方面的逼真度仍有待提升。從我們自身角度來說,出版領(lǐng)域高質(zhì)量語料庫建設(shè)的滯后,也成為現(xiàn)階段數(shù)字人效果提升的局限。
出版行業(yè)數(shù)字人技術(shù)應(yīng)用正處于快速發(fā)展階段,已能實(shí)現(xiàn)內(nèi)容創(chuàng)作、營銷等多環(huán)節(jié)應(yīng)用。與其他行業(yè)相比,獨(dú)特需求在于對(duì)內(nèi)容準(zhǔn)確性、專業(yè)性要求高;獨(dú)特場(chǎng)景有學(xué)術(shù)交流數(shù)字人、古籍文化傳播數(shù)字人、數(shù)字人讀書分享會(huì)等。未來可能會(huì)考慮通過數(shù)字人創(chuàng)作的優(yōu)質(zhì)內(nèi)容進(jìn)行付費(fèi)閱讀、訂閱;以數(shù)字人形象為品牌代言,與相關(guān)企業(yè)合作獲得廣告收入和贊助;圍繞數(shù)字人開發(fā)周邊產(chǎn)品,如通過數(shù)字文創(chuàng)等模式進(jìn)行數(shù)字人的商業(yè)變現(xiàn)。
隨著技術(shù)的不斷進(jìn)步,數(shù)字人在出版行業(yè)將更加普及和深入,會(huì)與人工智能、大數(shù)據(jù)等技術(shù)進(jìn)一步融合,實(shí)現(xiàn)更精準(zhǔn)的內(nèi)容創(chuàng)作和傳播。同時(shí),數(shù)字人將成為出版企業(yè)的重要資產(chǎn)和品牌形象代表,推動(dòng)出版行業(yè)向更加智能化、個(gè)性化、多元化的方向發(fā)展。出版行業(yè)的數(shù)字人發(fā)展恰似“靜水流深”——表面熱度波動(dòng)掩蓋不住底層創(chuàng)新的持續(xù)涌動(dòng)。當(dāng)技術(shù)先鋒性與文化厚重性找到平衡點(diǎn),數(shù)字人將真正成為連接千年文明與未來世界的“時(shí)光橋梁”。這個(gè)過程中,既需要技術(shù)開發(fā)者深入理解出版行業(yè)的專業(yè)壁壘,也需要出版人重構(gòu)“技術(shù)即內(nèi)容”的認(rèn)知范式。唯有如此,方能讓數(shù)字人超越工具屬性,成為新時(shí)代文化傳播的“靈韻載體”。
AI為數(shù)字人的廣泛應(yīng)用帶來利好和期待
■王 建(中華書局古聯(lián)數(shù)字產(chǎn)業(yè)研究院院長(zhǎng))
中華書局古聯(lián)公司推出“中華先賢數(shù)字人”項(xiàng)目,主要是想通過現(xiàn)代科技手段,讓歷史人物“活”起來,希望通過數(shù)字人這種形式,把古代先賢的形象生動(dòng)化、立體化,拉近他們與現(xiàn)代人的距離,希望通過數(shù)字人探索內(nèi)容行業(yè)的數(shù)字化轉(zhuǎn)型,開發(fā)更多創(chuàng)新的文化產(chǎn)品,吸引更多年輕人關(guān)注傳統(tǒng)文化,讓傳統(tǒng)文化煥發(fā)新活力。
數(shù)字人在文化傳播中的優(yōu)勢(shì)很明顯,一是生動(dòng),它能通過語音、動(dòng)作、表情和用戶互動(dòng),讓文化傳播更有趣。通過全息、AR、VR等技術(shù)和蘇東坡“面對(duì)面”交流,感覺就像他真的在你面前一樣。二是不受時(shí)間和空間限制,歷史人物可以“穿越”到現(xiàn)代,隨時(shí)隨地和你對(duì)話。三是能在社交媒體、移動(dòng)應(yīng)用等多種平臺(tái)上發(fā)布,傳播范圍更廣。四是語言上的優(yōu)勢(shì),數(shù)字人可以“秒會(huì)”任何一門外語,配合口唇驅(qū)動(dòng)算法,這使得數(shù)字人可以開發(fā)成為文化走出去的一個(gè)非常好的載體。
我們?cè)谠O(shè)計(jì)中華先賢數(shù)字人時(shí),特別注重文獻(xiàn)的依據(jù)與歷史文化的準(zhǔn)確性。比如,蘇東坡的外貌、服飾、語言風(fēng)格都要符合歷史記載,不能隨意發(fā)揮,這是我們的先賢數(shù)字人與市面上一般的數(shù)字人公司開發(fā)的數(shù)字人最大的區(qū)別之一,這也是類似于中央電視臺(tái)、人民日?qǐng)?bào)這樣的單位之所以認(rèn)可我們的先賢數(shù)字人的重要原因之一。與此同時(shí),先賢數(shù)字人在結(jié)合人工智能應(yīng)用方面,立足于中華書局的版權(quán)內(nèi)容數(shù)據(jù)優(yōu)勢(shì),使其可以最大限度地杜絕“人工智能幻覺”,從而給需要優(yōu)質(zhì)版權(quán)內(nèi)容的人群提供專業(yè)可靠的AI交互服務(wù)。
當(dāng)然,數(shù)字人也有一些局限性。比如,制作高質(zhì)量的數(shù)字人需要較高的技術(shù)水平和成本投入。另外,還原歷史人物的言行舉止、思想情感很復(fù)雜,既要符合史實(shí)又要貼近當(dāng)下,既要形似還要神似,這需要算法、算力等多方面的持續(xù)優(yōu)化。
不過,隨著近來AI技術(shù)的快速發(fā)展,數(shù)字人制作和驅(qū)動(dòng)領(lǐng)域的行業(yè)共性技術(shù)成本是在逐步降低的,自然語言處理和情感識(shí)別能力也會(huì)進(jìn)一步提升。比如,數(shù)字人可以更自然地與用戶交流,甚至能根據(jù)用戶的情緒調(diào)整自己的回應(yīng)。(下轉(zhuǎn)第7版) (上接第6版)此外,實(shí)時(shí)渲染、多模態(tài)融合等技術(shù)的發(fā)展,也會(huì)讓數(shù)字人的互動(dòng)體驗(yàn)更加沉浸和真實(shí)。這也為未來數(shù)字人更加廣泛的應(yīng)用展示了利好和期待。
目前,蘇東坡數(shù)字人已經(jīng)在很多場(chǎng)合“亮相”。他曾在“第五屆伯鴻書香獎(jiǎng)”頒獎(jiǎng)典禮上和真人同臺(tái)主持,吸引了近8萬人觀看。他還上了央視的《中國詩詞大會(huì)》,以“歷史情景再現(xiàn)”的形式為選手出題,和主持人、選手互動(dòng),觀眾反響熱烈。此外,蘇東坡數(shù)字人還在多個(gè)展覽中擔(dān)任“主角”。在眉山三蘇祠博物館的展覽中,他通過短視頻講述自己的家風(fēng)故事,吸引了眾多觀眾。我們策劃了多場(chǎng)線下的東坡主題數(shù)字藝術(shù)展,累計(jì)參觀者近10萬人次。
在出版行業(yè),我們更關(guān)注數(shù)字人的文化價(jià)值和技術(shù)實(shí)用性,而不是單純追求熱度,因?yàn)槲覀冮_展的數(shù)字人業(yè)務(wù)是“中華歷史文化名人數(shù)字人”這樣一個(gè)非常確定的細(xì)分領(lǐng)域,這個(gè)領(lǐng)域與那些需要炒作的“純虛擬數(shù)字人”不一樣,這些人物的IP是歷史事實(shí),我們只是賦予其最新的前沿科技載體,因此仔細(xì)分析就會(huì)發(fā)現(xiàn),這個(gè)細(xì)分領(lǐng)域不但沒有降溫反而在持續(xù)升溫——事實(shí)上,市場(chǎng)上效仿我們的案例越來越多了。
中華書局古聯(lián)公司將持續(xù)以“中華先賢數(shù)字人”為抓手,繼續(xù)深化“中華先賢數(shù)字工程”項(xiàng)目。第一,在數(shù)字人開發(fā)方面,我們計(jì)劃借助人工智能,在2025年完成更多中華先賢數(shù)字人的開發(fā),豐富先賢數(shù)字人IP矩陣。第二,結(jié)合AI技術(shù),開發(fā)先賢數(shù)字人智能體,我們計(jì)劃在2025年完成李白、蘇東坡、李清照三款數(shù)字人智能體的開發(fā)工作,實(shí)現(xiàn)其自然的語言交流、生動(dòng)的動(dòng)作表現(xiàn)和豐富的情感表達(dá)。在此基礎(chǔ)上,以中華書局優(yōu)質(zhì)圖書為基礎(chǔ),對(duì)傳統(tǒng)文化內(nèi)容進(jìn)行可視化、智能化、交互式開發(fā),打造人工智能閱讀空間產(chǎn)品,讓用戶與數(shù)字人AI共同探索書籍世界。此外還會(huì)結(jié)合教育場(chǎng)景,推出更多基于數(shù)字人的學(xué)習(xí)工具,讓用戶通過數(shù)字人更直觀地了解傳統(tǒng)文化。
未來,數(shù)字人有望成為文化與科技融合的典范,為文化傳承和發(fā)展注入新的動(dòng)力。隨著技術(shù)成熟和成本降低,數(shù)字人將逐漸成為日常生活的一部分,服務(wù)于更廣泛的用戶群體。
從工具理性到品牌美學(xué)的進(jìn)化之路
■韋 波(廣西師范大學(xué)出版社集團(tuán)有限公司融合發(fā)展中心總經(jīng)理)
在數(shù)字出版的漫長(zhǎng)賽道中,人機(jī)交互的邊界正在被不斷重繪。當(dāng)我們拆解數(shù)字人世界的基因圖譜,會(huì)發(fā)現(xiàn)數(shù)字人根據(jù)應(yīng)用場(chǎng)景,粗略可分為工具型數(shù)字人和品牌形象數(shù)字人,兩者恰似雙螺旋結(jié)構(gòu)相伴相生。工具型數(shù)字人典型的應(yīng)用場(chǎng)景包括數(shù)字員工、數(shù)字導(dǎo)游等,能作為與用戶的交互媒介,提供具體的服務(wù),以功能性構(gòu)建服務(wù)之基。廣西師大出版社構(gòu)建的數(shù)字人“小珂”屬于后者,是以中華傳統(tǒng)文化基因塑造品牌之魂,助力出版社品牌力構(gòu)建的社科類形象代言人。
品牌符號(hào)的三維宇宙里,品牌名、品牌標(biāo)識(shí)與品牌代言人構(gòu)成黃金三角。我們?cè)谄放屏?gòu)建過程中,投入的資源大多由上述三個(gè)載體來承載。三者中,又以品牌代言人,即人物形象,最能傳達(dá)品牌影響力,其次是品牌標(biāo)識(shí),最次是品牌名。比如我們說到Disney,這既是這家企業(yè)的品牌名也是這家企業(yè)的標(biāo)識(shí)。很多人可能一下反應(yīng)不過來這是哪家公司。但,如果說到唐老鴨、米老鼠呢?我們很快就能聯(lián)想到Disney(迪士尼)。數(shù)字時(shí)代的品牌密碼——具象化的文化圖騰比抽象符號(hào)更具穿透力,而數(shù)字人正是這個(gè)時(shí)代最富張力的文化導(dǎo)體。
以人物形象來構(gòu)建出版社的品牌力,雖然是最好的選擇,可這又使我們面臨更進(jìn)一步的復(fù)雜性,即,人是最不可控的。傳統(tǒng)真人代言的阿喀琉斯之踵,不光需要投入大量資金,而且人會(huì)衰老,可能會(huì)塌房,也可能面臨合作終止等各種風(fēng)險(xiǎn)。而品牌力的建設(shè),一旦選定載體,就不能半途而廢,否則前期投入將全部歸零。于是,基于現(xiàn)有技術(shù)基礎(chǔ),打造一個(gè)基于中華優(yōu)秀傳統(tǒng)文化的數(shù)字人IP形象,最終成為廣西師大出版社社科類品牌力構(gòu)建的選擇。這不僅是技術(shù)突圍,更是出版業(yè)在出版融合時(shí)代的文化覺醒。
數(shù)字人“小珂”是我們?yōu)樯缋锷缈迫宋陌鍓K設(shè)計(jì)的第一個(gè)數(shù)字人IP,其形象和內(nèi)容選題上以體現(xiàn)中華優(yōu)秀傳統(tǒng)文化為主基調(diào),主要負(fù)責(zé)社科人文板塊的品牌宣傳、重點(diǎn)圖書宣傳,甚至應(yīng)用在一些經(jīng)典學(xué)術(shù)類課程中充當(dāng)講師。人物呈現(xiàn)上以CG動(dòng)畫配合真實(shí)場(chǎng)景拍攝為主,與軟件驅(qū)動(dòng)的3D或真人建模工具型數(shù)字人相比,品牌類數(shù)字人IP著重體現(xiàn)場(chǎng)景呈現(xiàn)的真實(shí)性和美觀性,在互動(dòng)性方面則弱一些。數(shù)字人“小珂”的制作標(biāo)準(zhǔn),對(duì)標(biāo)現(xiàn)在新媒體上比較受歡迎的頭部數(shù)字人IP“天妤”“柳葉熙”等。在制作成本上通過與高校建立產(chǎn)學(xué)研團(tuán)隊(duì),由我社融合發(fā)展中心帶領(lǐng)高校團(tuán)隊(duì)以雙創(chuàng)的形式承擔(dān)了數(shù)字人IP內(nèi)容生產(chǎn)的主力工作,極大地降低了制作成本,同時(shí)形成了良好的社會(huì)效益。
以“小珂”為IP打造專有新媒體賬號(hào),構(gòu)建粉絲經(jīng)濟(jì)助力內(nèi)容產(chǎn)品的傳播,是未來我們重點(diǎn)考慮的IP變現(xiàn)途徑之一。首先“小珂”需打造符合品牌調(diào)性的背景履歷、性格設(shè)定、人物故事,為“粉絲”的情感寄托設(shè)定可落地的載體;其次,將依據(jù)“小珂”的人物設(shè)定,獨(dú)立打造系列故事內(nèi)容,以短視頻、精品有聲等方式呈現(xiàn),夯實(shí)其身份的物理特性和IP的個(gè)性特征,為粉絲創(chuàng)造話題;最終,我們希望達(dá)到的狀態(tài)是“小珂”這個(gè)數(shù)字人IP既可以助力出版社內(nèi)容產(chǎn)品的傳播,同時(shí)她本身也是一個(gè)產(chǎn)品,依托此IP衍生的周邊產(chǎn)品、話題、內(nèi)容創(chuàng)作等亦可作為單獨(dú)變現(xiàn)的路徑。
“小珂”的技術(shù)制作依托CG手段,在建模師的數(shù)字刻刀下,賦予IP超越現(xiàn)實(shí)的東方神韻。400萬面建模精度織就的不僅是面部的光影魔術(shù),更是數(shù)字時(shí)代的《洛神賦圖》。在“小珂”的微表情控制、情感傳達(dá)、審美價(jià)值等方面盡可能做到了極致,但這也導(dǎo)致其內(nèi)容制作工作與計(jì)算機(jī)驅(qū)動(dòng)的純3D工具型數(shù)字人相比,其制作周期比較長(zhǎng),修改的成本也較高。
隨著生成式AI技術(shù)的進(jìn)一步成熟,我們也將持續(xù)關(guān)注和嘗試使用AI視頻工具,依據(jù)原始建模去生成數(shù)字人綠幕素材的路徑。一旦技術(shù)發(fā)展到能替代動(dòng)畫工具,達(dá)到人類手工制作的精美程度,那將極大地激活數(shù)字人IP內(nèi)容制作的活力和潛力。近期我國的生成式AI技術(shù)取得了令人興奮的進(jìn)步,也讓我們對(duì)這一刻的早日到來燃起了極高的期待。
營銷環(huán)節(jié)最能發(fā)揮數(shù)字人優(yōu)勢(shì)
■蔣 凡(果麥文化首席信息官)
果麥文化打造數(shù)字人的初衷是想利用AI技術(shù)精讀書本內(nèi)容,篩選好書,以“果麥書童”數(shù)字人形象為廣大讀者用戶推薦書單、對(duì)話導(dǎo)讀、啟發(fā)思考,提升閱讀體驗(yàn),設(shè)計(jì)定位是“讀書數(shù)字人”。這一數(shù)字人的人物設(shè)定是讀懂了果麥“一生的閱讀計(jì)劃”書單里所有好書的“果麥書童”,名字叫“麥麥”。果麥還針對(duì)不同的知識(shí)領(lǐng)域,設(shè)計(jì)了更多經(jīng)過專屬知識(shí)庫訓(xùn)練的文化人物或?qū)<业淖x書數(shù)字人,比如蘇格拉底、孔子、雨果,心理學(xué)專家、教育專家……
圍繞上述讀書數(shù)字人,果麥開發(fā)了“麥麥知書”微信小程序,開通了“麥麥知書”小紅書賬號(hào),都是在以讀書人的人物形象向讀者用戶推薦好書,輔助閱讀,預(yù)期打造果麥文化“一生的閱讀計(jì)劃”會(huì)員服務(wù)體系,不僅可以在線下參與果麥書店的各種文化活動(dòng),還能在線上通過小程序、自媒體賬號(hào)與各種讀書數(shù)字人實(shí)現(xiàn)交流互動(dòng)。最終構(gòu)建以果麥圖書內(nèi)容資源為基礎(chǔ),以生成式AI技術(shù)為手段,以高質(zhì)量創(chuàng)意視頻動(dòng)畫為載體的IP文化產(chǎn)業(yè)鏈,讓出版行業(yè)在紙質(zhì)書之外找到更多商業(yè)空間,發(fā)揮更大社會(huì)影響力。
在公司的業(yè)務(wù)流程中,數(shù)字人輔助讀者閱讀實(shí)際承擔(dān)的是營銷性質(zhì)的工作,主要體現(xiàn)在內(nèi)部效率的提升,包括從社交媒體抓取熱點(diǎn)話題、分析熱門事件內(nèi)容、匹配營銷圖書價(jià)值原型,到調(diào)用大模型生成推薦文案、設(shè)計(jì)分鏡頭腳本、AI生成場(chǎng)景配圖,最終剪輯成數(shù)字人出鏡的短視頻、交付給營銷團(tuán)隊(duì)用于投流推送的全流程數(shù)智化改造。
但目前,不管是相比同屬零售領(lǐng)域的電商行業(yè),還是相比同屬文化領(lǐng)域的影視行業(yè),出版行業(yè)的數(shù)字人技術(shù)還沒有達(dá)到大規(guī)模應(yīng)用水平。相比這些行業(yè),出版行業(yè)有著圖書這種商品特性帶來的多樣性(每家出版公司有幾千甚至上萬個(gè)SKU(最小存貨單位),單個(gè)SKU銷量都不會(huì)很高,制作周期長(zhǎng),很少有爆品,可復(fù)制性不強(qiáng))和閱讀方式(沿襲千年的紙質(zhì)書閱讀體驗(yàn)很難改變,手機(jī)終端數(shù)字人交互進(jìn)一步擠占紙質(zhì)書閱讀時(shí)間)等問題,在數(shù)字人技術(shù)應(yīng)用上有著天然的局限性。
也因此,出版行業(yè)最能發(fā)揮數(shù)字人技術(shù)優(yōu)勢(shì),滿足應(yīng)用場(chǎng)景需求的就是營銷環(huán)節(jié)。在營銷環(huán)節(jié),利用數(shù)字人技術(shù)可以自動(dòng)、批量地為每本書拆解出導(dǎo)讀文案,生成數(shù)字人圖像制作營銷短視頻;可以概括每個(gè)知識(shí)領(lǐng)域的圖書,生成導(dǎo)讀書單講解,由分身數(shù)字人播報(bào);可以復(fù)刻歷史人物形象的數(shù)字人,以第一人稱視角講解歷史知識(shí)和思想觀念;可以根據(jù)圖書價(jià)值原型構(gòu)造虛擬人物,編排不同場(chǎng)景下的劇情腳本,生成系列漫畫素材,運(yùn)營相應(yīng)人物IP等等。
果麥文化2025年仍將大力發(fā)展數(shù)字人技術(shù),尤其是在果麥“一生的閱讀計(jì)劃”和新媒體圖書數(shù)智化營銷解決方案這兩個(gè)業(yè)務(wù)板塊上,繼續(xù)豐富場(chǎng)景維度、深化應(yīng)用程度,陸續(xù)推出更多數(shù)字人形象和圖像視頻內(nèi)容,提供更加成熟的商業(yè)解決方案。
隨著AI技術(shù)的快速演進(jìn),在現(xiàn)有文本數(shù)據(jù)中以低成本產(chǎn)出大量高質(zhì)量創(chuàng)意內(nèi)容,將成為不可阻擋的事實(shí),這是數(shù)字人技術(shù)和應(yīng)用將大行其道的物質(zhì)基礎(chǔ)。
在此基礎(chǔ)上,我預(yù)判未來將會(huì)出現(xiàn)聚集這些文化要素、技術(shù)要素、數(shù)據(jù)要素和人才要素的實(shí)體上的出版產(chǎn)業(yè)基地,這是經(jīng)濟(jì)發(fā)展由虛入實(shí)的必然規(guī)律。這個(gè)基地可能是這條產(chǎn)業(yè)鏈上多家企業(yè)創(chuàng)新業(yè)務(wù)的綜合載體,物理上的連接能讓這些各自有著比較優(yōu)勢(shì)的要素以更快的迭代速度和更低的溝通成本相互作用,最終產(chǎn)生新的商業(yè)模式,甚至是社會(huì)現(xiàn)象。
科技革命帶給數(shù)字人的變化將出乎意料
■丁 峰(東方出版中心融媒體中心主任)
我們通過引入數(shù)字主播,打造東方出版中心更加多元化、立體化的傳播矩陣,將圖書內(nèi)容以更加生動(dòng)、形象和高效的方式呈現(xiàn)給讀者,打破傳統(tǒng)文字傳播的局限性,提升出版內(nèi)容的傳播力和影響力。
具體來看,數(shù)字人在文化傳播中有三方面的優(yōu)勢(shì)。一是傳播的高效。尤其是在AI科技迅猛發(fā)展的今天,數(shù)字人的內(nèi)容生產(chǎn)變得較為容易,能夠快速生成和發(fā)布內(nèi)容,很大程度提升信息傳播效率。二是有一定的個(gè)性化優(yōu)勢(shì)。數(shù)字人可根據(jù)用戶偏好和行為數(shù)據(jù),不斷調(diào)整內(nèi)容設(shè)置和外觀形象,增強(qiáng)用戶參與感和體驗(yàn)感。三是表現(xiàn)形式更加豐富:結(jié)合虛擬現(xiàn)實(shí)、增強(qiáng)現(xiàn)實(shí)技術(shù),數(shù)字人可將文字、圖片、視頻等多種形式融合,尤其適合文化傳播中的復(fù)雜內(nèi)容展示。
相對(duì)于科技公司來說,東方出版中心并不具備很強(qiáng)的技術(shù)優(yōu)勢(shì)。但我們敏銳地捕捉到了數(shù)字人在出版營銷領(lǐng)域的獨(dú)特意義和先鋒作用,所以東方應(yīng)該是較早推出數(shù)字人主播的出版社之一。“東東”和“芳芳”的形象設(shè)計(jì)力求親和力與專業(yè)性兼具,既體現(xiàn)東方出版中心的文化底蘊(yùn),又符合現(xiàn)代讀者的審美偏好。在功能定位上,能結(jié)合AI工具,輔助生成形式多樣的內(nèi)容,高效、持續(xù)地傳播圖書信息,減輕編輯和營銷人員的文字負(fù)擔(dān)。在技術(shù)適配方面,我們針對(duì)不同平臺(tái)的受眾特點(diǎn),將數(shù)字主播的內(nèi)容和表現(xiàn)形式進(jìn)行了差異化設(shè)計(jì)。例如,微信公眾號(hào)短視頻以簡(jiǎn)潔直觀為主,抖音、小紅書的內(nèi)容也都會(huì)根據(jù)不同的平臺(tái)調(diào)整風(fēng)格。
目前數(shù)字人主要承擔(dān)內(nèi)容推廣與營銷方面的工作,通過短視頻、直播等形式發(fā)布圖書書訊和文化內(nèi)容,吸引了更多讀者關(guān)注。我們也在考慮與一些專業(yè)開發(fā)團(tuán)隊(duì)合作,逐漸擴(kuò)展數(shù)字人的功能和作用,承擔(dān)智能伴讀助手,為讀者提供內(nèi)容答疑、閱讀輔導(dǎo)等服務(wù),具備讀書助手、讀者客服、用戶導(dǎo)購等功能。
目前數(shù)字人技術(shù)面臨的主要挑戰(zhàn)包括數(shù)據(jù)安全、隱私保護(hù)、高成本、受眾接受度(主要是中老年讀者)等問題。未來的數(shù)字人將會(huì)更加智能化,借助大語言模型、AI視覺和情感識(shí)別技術(shù),數(shù)字人將具備更高的交互智能,能夠進(jìn)行自然對(duì)話、情感交流和個(gè)性化互動(dòng)。數(shù)字人的視覺效果會(huì)更好、更逼真,整體形象的現(xiàn)實(shí)還原度更高。通過優(yōu)化算法和硬件設(shè)備,數(shù)字人創(chuàng)建成本將大幅降低。數(shù)字人將能夠無縫運(yùn)行在不同平臺(tái)不同載體(如VR、AR、手機(jī)、PC)上,甚至實(shí)現(xiàn)跨平臺(tái)同步和數(shù)據(jù)共享。
出版行業(yè)的數(shù)字人應(yīng)用目前處于探索階段,主要集中在虛擬主播、智能推薦和個(gè)性化內(nèi)容生成等領(lǐng)域。與其他行業(yè)相比,出版行業(yè)對(duì)內(nèi)容的精準(zhǔn)性和文化深度要求較高,要具備較為強(qiáng)大的語言處理和深度學(xué)習(xí)能力。同時(shí),出版行業(yè)涉及較多的知識(shí)產(chǎn)權(quán)問題,數(shù)字人在內(nèi)容生成和分發(fā)過程中必須嚴(yán)格遵循相關(guān)法規(guī)和業(yè)內(nèi)規(guī)范。此外,出版行業(yè)的應(yīng)用場(chǎng)景涉及電子書、有聲書、在線教育等不同媒介形式。出版業(yè)的數(shù)字人應(yīng)用還有很大的潛力,有望在內(nèi)容挖掘、讀者互動(dòng)和知識(shí)傳播等方面發(fā)揮更大作用。
當(dāng)下,我們正在與相關(guān)高校和研究機(jī)構(gòu)合作,探索出版大模型的開發(fā)與應(yīng)用,其中就包括對(duì)出版數(shù)字人的研究與開發(fā)。數(shù)字人在內(nèi)容創(chuàng)作,尤其在內(nèi)容整合領(lǐng)域,利用其強(qiáng)大的自然語言處理能力,對(duì)出版物的生產(chǎn)效率和質(zhì)量的提升有很大的助益。在讀者互動(dòng)和圖書推薦方面,數(shù)字人會(huì)逐漸做到提供更智能、更精準(zhǔn)的服務(wù)。在知識(shí)傳播方面,虛擬講師和智能輔導(dǎo)系統(tǒng),可以為用戶提供更加靈活和高效的學(xué)習(xí)途徑。在營銷和品牌推廣方面,數(shù)字人的表現(xiàn)也會(huì)越來越個(gè)性化、趣味化、精準(zhǔn)化和深度化。我們將在內(nèi)容創(chuàng)作、讀者服務(wù)、知識(shí)傳播和市場(chǎng)營銷等多個(gè)業(yè)務(wù)板塊深度應(yīng)用數(shù)字人技術(shù),推動(dòng)?xùn)|方出版中心的數(shù)字化轉(zhuǎn)型和創(chuàng)新發(fā)展。
未來三到五年,數(shù)字人將在出版社的圖書營銷、品牌推廣和知識(shí)傳播方面發(fā)揮越來越重要的作用。其使用成本將會(huì)逐步降低,表現(xiàn)形式更加多樣,更加生動(dòng),更加跨界,文字、圖片、音頻、視頻乃至元宇宙等以往難以逾越的介質(zhì)邊界將會(huì)不復(fù)存在。但我相信,數(shù)字人的核心還是它的AI能力,是對(duì)優(yōu)質(zhì)內(nèi)容的解讀、重組、開發(fā)和生產(chǎn)。我相信,科技革命帶給數(shù)字人變化的奇跡會(huì)出乎我們每個(gè)人的意料。