能縮書會寫作,還可以評選人類作品:AI能爲文字與文學帶來什麽?
發布時間:2019-02-28 發布者:亞時中文網
《思南文學選刊》2019年1月号刊登了一份特别的文學“AI榜”。在這份AI最喜愛的作品榜單中,科幻作家陳楸帆去年發表于《小說界》雜志6月刊上的短篇小說《出神狀态》以0.998941845的系數位列第一,以0.000001的優勢險勝莫言發表于《十月》雜志2018年1月刊的《等待摩西》。
這是《思南文學選刊》與一個名叫“谷臻小簡”的AI軟件合作完成的榜單,也是目前中國文學領域發布的首份AI榜單。AI軟件在“閱讀”了2018年中20本文學雜志刊發的全部771部短篇小說後,挑選出了它最喜歡閱讀的一批作品。據軟件開發者、前《收獲》雜志編輯走走介紹,AI算法看重的是小說的優美度,即情節與情節之間的節奏變化的規律性,以及結構的流暢程度。同時,由于目前的AI程序引進了概率算法,因此它是根據雜志的最大風格來做出判斷的,也就是說,AI會在最專業的雜志中選擇出一批最專業的作品,當然這也就意味着,它也會在最通俗的雜志中選出最通俗的作品。
截至2019年1月20日,“谷臻小簡”的最愛讀物始終是莫言的《等待摩西》。然而,21日下午3點左右,參與此次評選的《小說界》和《鴨綠江》雜志的作品趕到,新增80部短篇小說。下午7點20分,情況發生了改變。AI最終選定的年度短篇是陳楸帆的《出神狀态》,《等待摩西》被擠到了第二位,位列榜單第三的是作家雍措發表于《青年文學》雜志的小說《午後陽光》。
在這份收入了60位中國作家及其小說的榜單上,既有我們熟悉的身影,比如獲得過諾貝爾文學獎的作家莫言、前段時間在“匿名作家計劃”中進入終選的青年作家葉揚(獨眼)、短篇小說《刺殺小說家》正被改編爲同名電影的熱門作家雙雪濤、科幻作家寶樹,以及在文學圈内時常被認爲小說十分“符合《收獲》調性”的張楚。當然,榜單也涵蓋了一批并沒有怎麽進入大衆讀者視野的作家。看到這份榜單呈現的結果,走走也在考慮接下來應該如何完善算法——一方面,她希望AI能夠挑選出質量上乘的作品;另一方面,她認爲不能完全用《收獲》的風格去要求AI。
《思南文學選刊》主編黃德海對于這份榜單呈現的中立結果很感興趣。他在接受界面文化(ID:Booksandfun)采訪時表示,當初決定收錄這份特别的榜單,一方面是因爲AI發展迅猛,想看看AI在文學方面能夠創造出何種可能性;另一方面則是因爲每到年末歲尾,文學圈就湧現出一堆文學排行榜——不管評選結果如何,總有人質疑評委的專業度,又或者認爲評選結果依賴的是人情——“那麽,一個相對中立的選擇标準,會是比較好玩的吧?”
《思南文學選刊》
有趣的是,作爲AI最終選定的年度短篇作品,陳楸帆的《出神狀态》裏恰好也用到了由AI軟件生成的内容。AI從衆多作品中識别出了另一個AI,“這簡直是生成整個榜單過程中最華彩的部分,”走走在接受界面文化采訪時說到。出于好奇,她在榜單結果出來後馬上打開了陳楸帆這篇小說,留意到結尾有這樣一段注釋:“帶*号楷體字部分爲AI程序通過深度學習作者風格創作而成,未經人工修改。”
她立即聯系了陳楸帆,詢問這個注釋究竟是一種噱頭,還是真的包含AI寫作内容。他當即把自己使用的AI軟件發給了走走,這個軟件是他的朋友、創新工場CTO兼人工智能工程院副院長王詠剛制作的,訓練數據包括陳楸帆既往的十幾部小說作品,以及作爲參考語料的赫胥黎、阿瑟·克拉克、威廉·吉布森、尼爾·斯蒂芬森等人的科幻小說作品。第一次看到AI程序寫出來的句子時,他覺得既像又不像自己寫的,有先鋒派的味道。制作者王詠剛特别喜歡機器寫出的“重重追逐着人類發現的觸覺,以及即将看清左右的囚籠”這一句,因爲看上去“像是得了上世紀八十年代朦胧詩派的真傳”。除了參與AI評選的《出神狀态》一文,在日前出版的新書《人生算法》裏,這個AI程序也與陳楸帆進行了互動。
“一個AI,何以從771部小說中,準确指認出另一個AI的身影?”走走在随榜單一同發布的《未知的未知——AI榜說明》一文中發問。陳楸帆則感慨說,“這簡直比科幻還科幻。”AI程序已逐漸習得了陳楸帆的寫作偏好——在使用祈使句時愛用什麽句式、描寫人物動作時喜歡用什麽樣的形容詞或者副詞等等。在掌握了關于語句的統計規律後,在寫作環節,AI程序便會從大量的語料中随機找到一些詞,并把這些詞彙按照寫作規律拼接在一起,形成句子。當陳楸帆被問到是否擔心AI程序有一天會寫出比自己更好的作品,他幽默道:“這倒不會,要是真寫出來我就躺賺了。”王詠剛也在近期上海的一場講座中提到,目前AI寫作程序仍然隻是一種“初級的機器輔助寫作”,即通過給定關鍵詞和關鍵元素在數據庫中進行檢索,找到曆史上所有涉及這個詞語的文本。這也導緻目前AI寫作有篇幅限制,而且在涉及句與句、段與段之間的關系時,AI便有點捉襟見肘了。“AI現在還是個baby,”走走說。
《人生算法》陳楸帆 著中信出版社 2019年1月
除了爲影視改編服務之外,走走發現,這個小說軟件也可以指導一部分學生進行寫作。目前她的團隊正在嘗試和上海視覺藝術學院合作,這是中國第一所開設網絡文學創意寫作本科教育的大學。學生創作的網絡小說被輸入軟件後,AI會按照理想的故事模型和情節曲線對故事進行檢測。“比方說一個W陣型,如果W的第一個彎度不夠,那就是這個人的命運不夠悲慘,那麽它上升的曲線就不夠大,故事就不夠精彩。我們也有劇本算法,目前我們針對的是電影,不是電視劇。針對電影來講,就是可以判斷哪一幕寫的比較平、哪一幕寫的比較精彩,這些都是可以調整的。”
走走2017年底從《收獲》雜志辭職,開始涉足影視版權轉化工作。她随後發現,即便是如餘華、須一瓜這種在文學圈頗有名氣的作家,在影視市場上的認知度可能還比不過網絡文學。這激發了她對網絡文學的興趣。在浏覽各大平台網絡文學的過程中,她驚歎于網絡文學動辄三百萬字、五百萬字的體量,于是想到了一個“偷懶”的辦法:開發一個能夠迅速讀取小說并且提取簡介、人物和情節的軟件,并将這樣的分析報告提供給影視開發方供其參考,以便進行迅速判斷,這便是“谷臻小簡”AI軟件的由來。
另一方面,她也很清楚AI的局限。“我們現在沒有辦法教人工智能識别語言的好壞,即便是人,我們也很難教會他們識别語言的好壞,我們無法評判是王朔的語言好,還是餘華的語言好。AI能夠識别的是節奏感、叙述的強弱、淚點笑點的分布以及整個結構是不是工整。事實上,意識流小說、多視角、平行空間等等各種文本的技巧并不适合影視改編。影視改編基本上還是線性結構爲主,頂多就是一個倒叙。因此影視改編的路線是很清晰的,所以這個AI也比較笨,是圍繞這個方向來選小說的。”
在去年的西湖IP大會上,由谷臻故事工廠聯合浙數文化東方星空數娛發布的《賣座故事曲線報告》中,AI研究和分析了過去20年間724部改編成影視的文本,通過分析小說的主題、情節、人物以及有關小說風格和設置的各種變量,探讨了影視作品暢銷的内在元素。除了根據文本中出現的人物和場景來識别主角、主角之間的強弱關聯以及主要場景,另一個對AI來說非常重要的判定因素是情節曲線。據走走介紹,情節曲線的計算是根據文本中的動詞進行統計的。“情節是沖突造成的,沖突是通過動詞呈現的。在影視作品裏,沖突是要通過演員的動作來呈現的,所以主要的東西一定是動詞和動作的權重。因此情節曲線主要是根據動作權重來計算的。”
谷臻故事工廠分析得出的人物互動關系圖
AI統計得出結論,能被改編的文學作品有強情節、幾個引人注目的人物和一個中心主題。通過分析724部作品,AI得到了六種類型的故事曲線(W型、M型、N型、倒N型、V型和倒V型),其中W型比例最高。這種類型往往首先是一個正能量故事,故事初期主角略被動,但結局一定是樂觀的,情節起伏均勻對稱,節奏感強——《琅琊榜》和《香蜜沉沉燼如霜》都屬于這一類型。
這種通過機器評定和操作的模式化指導,是否會損害文學本身?對此,做純文學出身、并認爲自己有一顆純文學之心的走走說,目前AI寫作程序主要面對的是靠故事情節取勝的網絡文學,而非純文學。她認爲,在不久的将來,AI寫作程序極有可能取代網絡寫手,自己生成符合觀衆胃口的網絡文學作品。
除了應用于影視改編外,走走希望未來可以利用這個AI軟件搭建一個薦讀平台。目前軟件的讀取速度已經達到了平均四秒鍾一本書,“我希望爲中國所有的圖書都做一個導讀版,相當于建立一個百科全書式的圖書館導讀系統,從而進行通識教育。”讀者在看過導讀版之後,可以自行判斷一本書是否有幹貨,是否要購買這本書進行深度閱讀。
當被問及這項服務和如今盛行的《羅輯思維》這類抽取幹貨的讀書産品有何不同時,她認爲,人工拆書存在一定的主觀性,受個體視野和知識格局影響較大。并且,目前的人工拆書産業鏈條建立在對于廉價勞動力的壓榨之上——通常是經過大學生之手進行拆解,然後流轉到行業大V手中。“這種行爲不尊重圖書,也不尊重作者。如果是作者自己去講解,我是認可的。但這種拆書行爲僅僅是爲了提高效率,是爲了掙錢。”走走在解釋二者的區别時說,“我們不是要代替這本書,而是提供一個進階的選擇——可以通過導讀版給讀者一個浏覽經驗,然後他們決定要把哪本書帶走、要不要繼續去了解一本書。”
附:AI榜單前十名
序号 作者 篇名 雜志 系數
1 陳楸帆 出神狀态 小說界2018.6 0.998941845
2 莫言 等待摩西 十月2018.1 0.998931
3 雍措 午後陽光 青年文學2018.2 0.998853945
4 吳祖麗 總有一些事情在摧毀我們的生活 鴨綠江 2018.11 0.998611625
5 巴隴鋒 烏蘭察布之戀 延河2018.12 0.998564063
6 淩岚 槍與玫瑰 青年作家2018.2 0.9982574
7 劉亮魚 花飄香 文學港2018.7 0.998156059
8 葉揚 預展 小說界2018.2 0.998151156
9 楊則緯 愛人 鴨綠江2018.5 0.998086753
10 盧德坤 惡童 西湖2018.2 0.997280721
相片:來源界面新聞
特别聲明:本站轉載或引用之圖文若侵犯了您的合法權益,請與本站聯系,本站将及時更正、删除。版權問題及網站合作,請通過亞時财經郵箱聯系:asiatimescn@sina.com熱門話題更多>>
國務院國資委網站3月31日發布消息,經報國務院批..[查看詳細]
2021-04-01 10:43
3月份中國制造業采購經理指數、非制造業商務活動指..[查看詳細]
2021-03-31 10:20
聯合國糧農組織公布的數據顯示,2021年2月份,..[查看詳細]
2021-03-25 15:22
3月22日,中國電子信息産業發展研究院發布的《2..[查看詳細]
2021-03-22 16:53
風電闆塊走強,節能風電拉升漲停,大金重工漲超6%..[查看詳細]
2021-03-19 10:47
3月18日,國家互聯網信息辦公室、公安部加強對語..[查看詳細]
2021-03-18 19:36
1-2月份,在以習近平同志爲核心的黨中央堅強領導..[查看詳細]
2021-03-15 14:41
3月11日,國務院總理李克強在人民大會堂三樓金色..[查看詳細]
2021-03-12 10:00
今日,核電闆塊走強,整個指數大漲4%。截至發稿,..[查看詳細]
2021-03-08 15:11
今天上午,十三屆全國人大四次會議在人民大會堂開幕..[查看詳細]
2021-03-05 15:06