杜甫影響力高于李白?大數(shù)據(jù)研究唐詩宋詞結論很顛覆
大數(shù)據(jù)研究唐詩宋詞 結論很顛覆
用大數(shù)據(jù)分析:唐代詩人白居易作品量第一 但影響力排十名之外宋詞名篇中收錄詞作最多的不是蘇軾、辛棄疾而是周邦彥
用大數(shù)據(jù)分析唐宋詩詞,結論可能超出你的想象——唐代詩人中作品量居第一的白居易,影響力排在十名之外;宋詞名篇中收錄詞作最多的不是蘇軾、辛棄疾而是周邦彥;綜合影響指數(shù)表明,杜甫高于李白、辛棄疾強于蘇軾……
以上新發(fā)現(xiàn),是國家社科基金重大項目“唐宋文學編年系地信息平臺建設”首席專家、四川大學文學與新聞學院講席教授王兆鵬分析所得。
唐詩是中國詩歌史上第一座高峰。唐代詩歌五萬多首,詩人三千余位,詩人和詩作都達到前所未有的量級。宋代詞人近一千五百位,詞作超兩萬一千闋。
從個體詩人來看,唐詩宋詞里誰的作品最多?王兆鵬的大數(shù)據(jù)顯示,白居易名列唐詩作品量的榜首,詩作近三千;杜甫和李白緊隨其后,都超過千首大關。宋詞中辛棄疾的詞作量位居第一,有六百余闋,其次是蘇軾、劉辰翁。宋詩的篇數(shù),則由陸游稱雄,凡九千多首,其次是劉克莊和楊萬里。
根據(jù)綜合影響指數(shù)排名,唐代詩人影響力第一的是杜甫,其次為李白、王維,而作品量居第一的白居易,影響力排在十名之外。宋代詞人作品量和影響力第一的都是辛棄疾,蘇軾和周邦彥分別居第二、第三。高居宋詩影響力榜首的是蘇軾,作品量雄居榜首的陸游緊隨其后。
提到唐詩宋詞的名家,人們習稱“李杜”“蘇辛”,似乎李優(yōu)于杜、蘇勝于辛。但綜合影響指數(shù)表明,杜甫高于李白、辛棄疾強于蘇軾。更令人意外的是,最受追捧的詞人不是蘇、辛而是周邦彥。在一百首和三百首宋詞名篇中,周邦彥各占十五首和四十首,占有率遠高于蘇、辛。
用客觀的數(shù)據(jù)去衡量、分析頗為主觀的詩詞鑒賞,是否科學、能否可行?在接受北京青年報記者專訪時,王兆鵬強調(diào),雖然數(shù)據(jù)能在一定程度上描述顯示文學史的發(fā)展面貌和進程,但也有明顯的局限性。
30年前開始研究
積累了上百萬條數(shù)據(jù)
問:《大數(shù)據(jù)里的唐宋詩詞世界》課題的初衷是什么?
答:我1992年就開始做唐宋詩詞的定量分析了。初衷是每人心目中都有自己的唐宋詩詞名篇。究竟歷史上哪些唐宋詩詞被視為名篇,我想用統(tǒng)計數(shù)據(jù)來分析衡量。
問:那您是如何利用大數(shù)據(jù)來衡量唐宋詩詞質(zhì)量的呢?這些數(shù)據(jù)是如何統(tǒng)計出來的?
答:唐宋詩詞作品的質(zhì)量,目前還沒找到有效數(shù)據(jù)來評估、衡量。我目前正在努力嘗試構建文學作品質(zhì)量的評價指標體系,以便搜集數(shù)據(jù)。這需要比較長的過程。此外,個人建立的評價指標體系,需要學界的認同和共識。
問:關于文學指標體系,學界目前的研究現(xiàn)狀怎樣?
答:大數(shù)據(jù)時代的文學數(shù)據(jù),需要分類分層建立起文學史數(shù)據(jù)的指標體系,以確保數(shù)據(jù)的信度和效度。但目前用大數(shù)據(jù)來做唐詩宋詞研究的學者不多,為學界共享的唐宋詩詞大數(shù)據(jù)也相當有限。
從1992年到現(xiàn)在,我雖然積累了一百多萬條和唐詩宋詞有關的數(shù)據(jù),但還不完備、不均衡。有的時段數(shù)據(jù)多,有的時段數(shù)據(jù)少;有的這一類數(shù)據(jù)多,那一類數(shù)據(jù)少;有的詩人數(shù)據(jù)多,有的詩人數(shù)據(jù)少。我們常感慨“書到用時方恨少”,數(shù)據(jù)更是這樣。全方位分析唐詩宋詞時,常常覺得數(shù)據(jù)不夠用。
在我看來,文學評價指標體系應該以作品為中心來建立。作家的影響力是以作品的影響力為前提。而作品評價,可分兩個維度,一是相對穩(wěn)定作品的內(nèi)在文學價值,二是動態(tài)不居作品的外在影響力。其文學價值,可考慮從內(nèi)容和形式兩個層面來評估。
作品影響力則從創(chuàng)作者、評論者、普通讀者三個層面來衡量。一是對創(chuàng)作者的影響,包括引用、化用、仿效、改編、翻譯等,體現(xiàn)出作品的典范性和吸引力;二是對評點者的評論和學者的研究,反映出作品在文學批評、學術研究層面的美譽度和關注度;三是在普通讀者中的傳閱度和知曉率。確定作品的價值、影響的基本要素和結構后,再構建計算模型,然后由計算機在相關資源庫、語料庫和網(wǎng)絡運行,挖掘提取相關數(shù)據(jù),最后計算出每篇作品的得分。
數(shù)據(jù)無法測度藝術含量
和審美價值高低
問:您在課題里提到,據(jù)統(tǒng)計,東漢到隋末近六百年,詩歌總共才五千余首,而到唐代,詩歌第一次超過萬首并直接跨越到五萬多首。唐詩比之前的八代詩增加了七倍多,詩人由六百余位增加到三千余位,詩人和詩作都達到前所未有的量級。這個數(shù)據(jù)從何而來,有參考哪些重要的文獻資料嗎?
答:數(shù)據(jù)來源于我的老朋友尚永亮教授的兩篇論文:《八代詩歌分布情形與發(fā)展態(tài)勢的定量分析》和《唐知名詩人之層級分布與代群發(fā)展的定量分析》。
問:白居易的詩數(shù)量最多,影響力卻在前十名開外,這是如何判定的?
答:用數(shù)據(jù)衡定的。我們用了多種數(shù)據(jù),對唐代詩人影響力進行排名。白居易的影響力,在現(xiàn)當代大于古代。他的綜合影響力,遠不如李白、杜甫。
問:那您通過大數(shù)據(jù)判定唐詩宋詞質(zhì)量的依據(jù)是什么?
答:目前只能用大數(shù)據(jù)衡量唐詩宋詞影響力的大小——包括對后代詞人創(chuàng)作的吸引力,在后代詞評家中的美譽度,在普通作者中的知名度等等。目前暫時還不能用數(shù)據(jù)測度唐詩宋詞藝術含量和審美價值的高低。
文學中心在北宋初
就完全移到南方
問:用大數(shù)據(jù)研究唐宋詩詞有無遇到一些學術上的困難,又是如何克服的?
答:文學研究從來沒有數(shù)據(jù)意識,困難不僅在于到哪兒去找數(shù)據(jù),更在于找什么樣的數(shù)據(jù)。究竟什么樣的數(shù)據(jù)有用有效,既需要理論的支撐,也需要在實踐中檢驗。理論上,我們不斷探求,從統(tǒng)計學、計量信息學和計量歷史學中去尋找理論和方法的啟示;實踐上,反復試驗,失敗了重來。最痛苦的是,數(shù)據(jù)庫建好了,文章也寫完了,忽然發(fā)現(xiàn)數(shù)據(jù)來源不全,只好從頭補齊數(shù)據(jù),寫好的論文又推倒重來。
問:您在大數(shù)據(jù)具體研究中還有哪些新發(fā)現(xiàn)呢?
答:數(shù)據(jù)的意義,既能確證傳統(tǒng)的結論,也會修正傳統(tǒng)的結論,更能發(fā)現(xiàn)新問題,改變傳統(tǒng)的認知。比如,中國文化地理有一個著名的結論,中國文化中心,是由北方中原逐步向南方移動,第一次南移是東晉永嘉之亂,第二次南移是唐代安史之亂,第三次南移是宋代靖康之亂。三次戰(zhàn)亂推動了文化中心的南移,靖康之亂后,文化中心就徹底移到南方。我們的大數(shù)據(jù)發(fā)現(xiàn),文學中心在北宋初就完全移到南方,南方作者的數(shù)量全面超越北方,無需等到靖康之亂后。而且,戰(zhàn)爭不是推動文化中心南移的唯一因素。
我們還發(fā)現(xiàn),宋代的文學中心,是逐步向東南沿海移動。按今天的地市級行政區(qū)劃來統(tǒng)計,宋代福建南平的作者人數(shù)最多,名列第一,福州居第二,這很讓人驚訝。與此相關的是,宋代進士人數(shù)福州第一,南平第二。可見當時南平、福州教育發(fā)達,進士多,詩詞作者也多。教育與文學是高度正相互的。
此外,我們還發(fā)現(xiàn)蘇東坡詞的創(chuàng)作高峰是在黃州,他三分之一的詞是在貶謫黃州期間寫的,他的名篇佳作一半是在黃州寫的。比如宋詞的第一名篇《念奴嬌·赤壁懷古》就是在黃州寫的。黃州成就了蘇軾詞作的輝煌。
文/本報記者 張恩杰 統(tǒng)籌/劉江華
版權聲明:凡注明“來源:中國西藏網(wǎng)”或“中國西藏網(wǎng)文”的所有作品,版權歸高原(北京)文化傳播有限公司。任何媒體轉載、摘編、引用,須注明來源中國西藏網(wǎng)和署著作者名,否則將追究相關法律責任。
- 人民網(wǎng)評:劍指假劣農(nóng)資,為春耕備耕保駕護航
- 2022年全國家庭親子閱讀主題活動在北京舉辦
- 新編現(xiàn)代京劇《李大釗》2022年公益演出啟幕
- 河北省開展省屬事業(yè)單位節(jié)水型單位創(chuàng)建工作
- 河北省耕地質(zhì)量總體屬于黃淮海區(qū)中等偏上水平
- 自4月30日起 河北省執(zhí)行人工關節(jié)集采中選結果
- 2022中國國際數(shù)字經(jīng)濟博覽會招展工作啟動
- 河北有了優(yōu)質(zhì)棉花全程綠色生產(chǎn)技術規(guī)程
- 2022年國家制造業(yè)單項冠軍省內(nèi)遴選啟動
- 河北:書寫冬奧故事 貢獻河北力量