查詞語
語言指紋是指出自同一作家之手的不同作品,往往包含許多類似的行文習慣和句式,如同作者在作品中留下“指紋”這一現(xiàn)象的概括性說法。瑞典研究人員設計出一種分析作家“語言指紋”的公式,通過分析作品中較少出現(xiàn)的單詞數(shù)與作品長度間的關系來研究作家的寫作習慣。這項研究成果發(fā)表在2009年12月10日出版的《新物理學雜志》上。
指紋概述
“母本”理論
研究人員說,一位作家的某一部作品其實只是從其“母本”中抽取的一部分。
所謂“母本”,可以大致理解為某位作家的語言習慣和詞匯量構成的“框架”。作家的每一部作品都從這一“框架”中來。
英國廣播公司(BBC)2009年12月10日援引研究負責人塞巴斯蒂安·伯恩哈德松的話報道:“你正在寫的東西就是從‘母本’這本大書中抽出的一部分。”
美國哈佛大學語言學家喬治·齊普夫于1935年發(fā)現(xiàn)一部作品中某一單詞出現(xiàn)的頻率與這一頻率高低次序之間的關系。他指出,最高頻單詞比第二高頻單詞出現(xiàn)頻率高一倍,比第三高頻單詞出現(xiàn)頻率高兩倍,以此類推。
齊普夫揭示的這一規(guī)律為后來許多語言學中的定量研究奠定了基礎。不少學者把它當作英語甚至所有語言中普遍適用的原則。
有所突破
瑞典于默奧大學研究人員在齊普夫的這一理論基礎上進一步研究指出,該理論并非放之四海皆準。一部作品中單詞出現(xiàn)的頻率高低與作家本人語言水平有關,不能一概而論。
研究人員經(jīng)過分析托馬斯·哈代、赫爾曼·梅爾維爾和戴·赫·勞倫斯三位作家的全部作品后發(fā)現(xiàn),隨著作品篇幅加長,文中出現(xiàn)生僻單詞的幾率呈現(xiàn)下降趨勢。
他們還發(fā)現(xiàn),這三位作家的“生僻單詞出現(xiàn)幾率下降曲線”各不相同。更重要的是,這種下降趨勢在每位作家的全部作品中都有所體現(xiàn)。
研究人員認為,今后在研究作者不詳?shù)淖髌窌r,可以用這種方法將其與已知的前人作品相比較,對比這種“語言指紋”的相似性。
后續(xù)研究
“母本”這一概念不僅包含某位作者掌握的詞匯,還包含他自創(chuàng)的新詞匯。不論是寫《戰(zhàn)爭與和平》這樣的名著,還是平時隨便寫寫電子郵件,人們都有可能創(chuàng)造出新詞匯。
伯恩哈德松說:“不論是從10萬字的作品還是從20萬字的作品中抽出1萬字來研究,總能得出相同的寫作習慣。你永遠需要從龐大的‘母本’中抽取素材進行寫作。這就是你的寫作風格。”
研究小組將繼續(xù)對更多使用英語和其他語言的作家展開研究。隨著他們的“語言指紋”庫不斷擴充,伯恩哈德松期望未來能夠利用這種方法鑒定出作者不詳?shù)淖髌?ldquo;身世”之謎。
指紋應用
英國倫敦大學英語研究學院教授布萊恩維克斯爵士認為,出自同一作家之手的不同作品,往往包含許多類似的行文習慣和句式,就像作者在作品中留下“指紋”一樣。因此他利用一款軟件對《愛德華三世》劇本和同時期莎士比亞其他作品進行對比研究。
這款名為“剽竊”的軟件由荷蘭馬斯特里赫特大學開發(fā),其初衷是為了檢查學生是否有抄襲行為。軟件會從已知作者的作品中“學習”三個單詞以上的短語,然后在另一作品中搜索這些短語。
研發(fā)人員在測試中發(fā)現(xiàn),由于一些日常慣用語的緣故,不同作者的作品中最多會出現(xiàn)20處相同短語。
英國《泰晤士報》12日援引維克斯的話說,軟件在識別短語時具有選擇性,它會跳過語法要求的固定搭配,而重點分析比喻用法或?qū)Π字械莫毺卣f法。
英學者利用電腦軟件破解“莎翁疑劇”身世
一部名為《愛德華三世》的英國著名歷史劇自1596年問世以來一直作者不詳。有人認為它是文藝復興時期英國劇作家威廉莎士比亞所作,因而稱它為“莎士比亞疑劇”。
英國學者利用電腦軟件分析認為,這部戲劇由莎士比亞和另一作者共同完成。
<< 二人合作
維克斯借助這款軟件對《愛德華三世》進行分析后發(fā)現(xiàn),這部劇本與1596年前的莎士比亞作品出現(xiàn)相同短語200處,但這些匹配情況只出現(xiàn)在4場,即40%的劇本中。
他說,當發(fā)現(xiàn)200處短語與莎士比亞劇作相符時,幾乎可以肯定這部劇本也出自莎士比亞之手,但是無人能說出為什么劇本其他部分里卻包含明顯不是莎士比亞風格的詩句。
他經(jīng)過進一步研究發(fā)現(xiàn),剩余部分劇本的寫作風格與當時另一位劇作家托馬斯基德相同,因為其中包含約200處與基德作品中相同的短語。他認為,這表明該劇有60%是基德所作。
基德的代表作《西班牙悲劇》被認為開創(chuàng)了英國復仇悲劇先河,對莎士比亞戲劇有重要影響。
<< 爭議不斷
近150年來,《愛德華三世》的“身世”問題一直飽受爭議。學術界直到1997年才認定莎士比亞參與其創(chuàng)作,并將它收入《莎士比亞全集》。
維克斯的最新研究成果并未使爭議結束,反而引發(fā)更多人的懷疑。
莎翁故居信托管理機構負責人斯坦利韋爾斯說:“僅憑一款電腦軟件就確定劇本作者的方法難以令人信服。沒有親自深入研究,就不能輕易得出結論。”
也有人認為莎士比亞的地位如此之高,沒有必要與別人合寫一部劇本。
但英國沃里克大學教授喬納森貝特說,與往常人們心中那個“孤獨才子”相比,這一研究成果反映了更為真實的莎士比亞。
韋爾斯也說,把莎士比亞請下神壇很好。“他不是高人一等的圣人,而是能與任何人合作的劇作家;他不是孤傲的神靈,而是我們中間一個普通人”。