人工智能的文学创作：实践与问题--理论评论--中国作家网

人工智能的文学创作：实践与问题

来源：中国社会科学报　|　余静远　　2023年03月17日11:29

在阿兰·图灵（Alan Mathison Turing，1912—1954）、马文·明斯基（Marvin Lee Minsky，1927—2016）和唐纳德·米奇（Donald Michie，1923—2007）等先驱者的推动下，人工智能产业已经开花结果，成为今天席卷全球的人工智能革命。人工智能正在对人类的核心领域形成挑战，因为它揭示了人类从事的许多工作同样可以由机器出色地完成，甚至完成得更好。在文学领域，人工智能也引发了一场大地震，最新一代的ChatGPT展示出了不弱于人类的想象力和创造力，甚至能应人类要求，以极快的速度创作出高水准的文学作品。这不禁让人想起德彪西的名言：艺术作品创造规则；规则不创造艺术作品。那么，人工智能是如何影响文学创作的？它思考和创作的密码是什么？它能与莎士比亚竞争吗？

人工智能写作的代码

通过与艺术互动，了解平凡和伟大的文学作品的区别，机器能不能学会文学创作，像我们为孩子写故事那样具有创造性，是作家和科学家一直在探索的课题。

1953年，罗尔德·达尔（Roald Dahl，1916—1990）在短篇故事集《出人意料的故事》（Tales of the Unexpected）中，讲述了一个“伟大的自动语法师”的故事。主人公阿道夫·克尼普是一个计算机天才，但一直渴望成为一名作家。然而，他的努力毫无成效。后来他有了一个灵感：语言遵循语法规则，在原则上基本上是数学的。有了这样的认识，他开始着手创造一个巨大的机器——伟大的自动语法分析器，这个机器能够在15分钟内根据在世作家的作品写出有获奖潜质的小说。有了这台机器，克尼普大获成功，并成立了一家出版公司，作为这种新的大规模生产文学作品的合法机构。他统治出版业的最后一步是收购真正的作者，并付钱让他们不再写作。故事的结尾处，叙述者透露，“在用英语出版的所有小说和故事中，有一半以上是由阿道夫·克尼普在大型自动语法仪上创作的”。

用算法生成文学作品并不新鲜。最早为计算机编写的程序之一就是为了写情书而开发的。在布莱切利公园破解了英格玛密码后，阿兰·图灵前往曼彻斯特大学，将他的想法付诸实践，制造出多用途计算机的物理版本。在他的指导下，英国皇家学会计算实验室很快就生产出了世界上第一台商业化的通用电子计算机费兰蒂·马克1号，这台计算机具有浪漫的一面，只要随机输入单词，它就能生成情书。20世纪60年代，法国一些作家和数学家一起使用算法来生成新的写作文本，这个团体自称为乌利波（Oulipo），意思是潜在文学工作室（Ouvroir de littérature potentielle），创始人之一雷蒙德·奎诺（Raymond Queneau）认为，约束是创作的重要组成部分，盲目服从每一个冲动的灵感，实际上是一种奴役，而通过对写作施加准数学约束，可以实现一种新的自由。该团体的早期项目集中在诗歌上。任何写过诗的人都知道，对诗歌的约束往往会将其推向新的表达方式。

正如乌利波运动所表明的那样，诗歌创作特别适合算法的方式。诗歌形式的约束性提供了一个模板，算法可以尝试以一种有意义的方式来填充。例如，选中俳句或十四行诗的模式后，算法的任务就是选择与模式相匹配的词，同时想出某种形式的总体一致性。如果用押韵的模式来写诗，押韵的词语数据库就非常有用。这就是20世纪80年代由未来学家雷·库兹韦尔（Ray Kurzweil）创建的控制论诗人（cybernetic poet）背后的代码原理。库兹韦尔以雪莱和T. S.艾略特等有成就的诗人的作品来训练控制论诗人。这首控制论诗人的俳句，就是根据济慈的诗歌写成的：“你打碎了我的灵魂。/永恒的汁液。/我嘴唇的精神。”还有一首融合了雪莱《西风颂》和艾略特《普鲁弗洛克的情歌》风格的诗：“秋天女士的存在。/你，从那天起，不得不关心/现在教我们彻底的渺小和创造。/然后推测？/还有这个，还有我。/还有那未曾说出的话语，那未曾读过的景象在海湾里的位置。/还有米开朗琪罗的后代。”在库兹韦尔进行的图灵测试中，控制论诗人创作的诗大多数时候都能骗过人类裁判，冒充人类写的诗。

算法不仅在创作诗歌方面表现良好，在创作小说方面也有所尝试。乌利波团队成员约翰·莱斯库尔（Jean Lescure）首先产生了将算法应用于现有文学作品的想法。这一想法为全国小说创作月（National Novel Writing Month）的编码员所实现。他们邀请新锐作家在一个月内敲出5万字来。软件开发人员和艺术家达柳斯·卡兹米（Darius Kazmi）当即决定，与其费尽心思每天写出1667个字，不如在这个月里编写出可以生成5万字小说的代码。卡兹米于2013年发布在社交平台上的这一想法，开启了一年一度的文学黑客马拉松。许多参加全国小说创作月的编码者都通过打乱现有文本来创作新的文本，如通过推特过滤《傲慢与偏见》（Pride and Prejudice）；通过科幻算法解释《白鲸》（Moby Dick）；通过代码对古斯塔夫斯·欣曼·米勒（Gustavus Hindman Miller）的《一万个梦》（Ten Thousand Dreams）进行解释和重新排序。但引起人们注意的是一部名为《探索者》（The Seeker）的作品。这部小说记录了一个算法通过阅读wikiHow上的不同文章，来了解人类如何运作的过程。该算法有一个元代码：工作、扫描、想象、重复。在工作模式下，它搜索有关人类活动的概念；在扫描模式下，它从工作期间遇到的种子概念中搜索纯文本“记忆”；然后，它使用在扫描模式中没有识别的概念来想象种子概念周围的“非视觉”。《探索者》记录了该算法在探索wikiHow数据库时从无知到理解的发现之旅。它查阅的第一个页面是“如何让一个女孩约你出去”。从这次扫描中发现了“伤害”这个词，在“想象”模式下，它产生了一个关于“伤害”的超现实翻版。这就是算法生成文学作品的最终目标：让我们了解一种新兴的意识（如果它真的出现的话），以及它与我们人类的意识有什么不同。因此，目前至少可以保守地估计，人工智能离创作伟大的文学作品还有一定距离，但在创作诗歌、畅销商业书籍方面已经相当成熟了。

人工智能写作的升级：风格和自由

上述多数例子都依赖于自上而下的编程模式：按照一套明确的规则随机填写的诗歌模板；将经典文本转化为新作品的代码；通过编程将数据转化为故事的算法。这些程序其实并不允许有太多的自由。机器学习正在改变这一点。现在，算法有可能把一个作者的整个作品拿出来，学习他们的写作方式。通过建立一个关于作者如何用词的概率图，算法可以生成某个文本的延续。这就是预测性文本的工作方式。

这种利用机器学习来创作文学作品的想法得到了一个自称为Botnik的团体的实践。这个团体由作家杰米·布鲁（Jamie Brew）和《纽约客》的前漫画编辑鲍勃·曼考夫（Bob Mankoff）于2016年创立，现在是一个开放的作家社区。该团体根据对过去对话的数学分析，将《宋飞正传》（Seinfeld）的剧本制作出了新的剧集，甚至还将七卷本的《哈利·波特》进行了改写实验。这种算法的做法是：在已存在的文本基础上，提供18个词供你选择。这给了创作者极大的自由，可以任意发挥自己的想象力。因为这种算法在创建文本时仍需人类的参与，而且它也只能在捕捉作家风格的基础上做出局部的改变，因此，它暂时还无法取代小说的人类创作者。

讲故事的算法Scheherazade-IF成立于2012年，由马克·里德尔和他在佐治亚理工学院的同事共同开发。它的目标是在可能的故事迷宫中引导出一条更连贯的路径。该算法的名字来自《一千零一夜》中的苏丹新娘谢赫拉莎德（Scheherazade），她通过夜以继日地想出新的故事来吸引和分散杀人的丈夫的注意力，从而挽救了自己的生命；IF则代表“互动小说”（interactive fiction）。另一个在生成童话方面取得成功的算法是PropperWryte。它的童话算法是根据结构主义者弗拉基米尔·普罗普（Vladimir Propp）在1928年确定的俄罗斯民间故事31种叙事原型来进行训练的。

ChatGPT创作功能和人工智能的缺陷

2022年，美国人工智能研究公司OpenAI开发了聊天机器人ChatGPT，代表着生成性人工智能的最新发展。它通过聊天（对话）的方式进行工作，即用户只需在ChatGPT界面上输入指令，可以是一个问题，一个任务，或者是随意的聊天。ChatGPT系统分析输入的指令，使用机器学习算法来生成回应，然后以文本的形式返回给用户，用户可再次输入文本，ChatGPT系统再次进行分析和回应，这个过程可一直持续到对话结束。正是基于以上这些特性，ChatGPT的出现让很多人担忧文字生产者即将被淘汰。ChatGPT能写诗，也能创作小说、剧本、随笔、评论等，虽然创作出来的作品稍显程序化，但大体上还是能满足创作规范和要求的。

近日，笔者专门请在英国高校任教的朋友帮忙测试了ChatGPT的创作功能。例一：对ChatGPT输入指令：以春、江、花、月、夜这五种事物，创作一首七言律诗。结果如下：“春风婉转吹江岸，花开盛放映月寒。夜色渐深思悠远，水流涟漪梦逍遥。”此诗虽然难以和唐代诗人张若虚的名篇《春江花月夜》相媲美，但至少在形式和韵味上体现出了唐诗的特色。例二：对ChatGPT输入指令：请写一段莎士比亚风格的独白。结果如下：“生命是如此短暂，我不知道自己还能留在这个世界上多久。也许，我应该像一只孤鸟一样，飞往远方，去寻找自己的归宿。但是，我害怕孤独，我害怕被遗弃，我害怕面对那个孤独的夜晚。啊，人生如梦，一切都是虚幻，却又那么真实。我不知道该如何面对这个世界，但我知道，我必须继续前行，即使一切都已经毁灭。”这是不是有点莎士比亚的味道？

不过，ChatGPT的创作也有缺陷，如对数据资源的依赖、创造虚假信息、有立场偏见等。而且ChatGPT人机交互的模式也决定了人是主动提问的一方，而机器只是生成答案；机器也许可以模仿人类的自然语言，却无法生成人类的自我和意识。自我和意识的概念与人类的创造力密不可分。没有自我和意识，就没有创造力。就是说，在机器变得有意识之前，它只是一种扩展人类创造力的工具。人工智能是否最终变得有意识，真正具有创造性？它的意识会和我们的意识一样吗？这些都是需要我们思考的问题。

或许，人类的命运将取决于它与有意识的机器的相互理解。但是，正如维特根斯坦所说，如果一只狮子能说话，我们可能不会理解它，这同样适用于机器。如果它们变得有意识，人类也不太可能理解。最终，将是它们的绘画、音乐、小说等创造性的产出，甚至是它们的数学，让我们有机会破解机器的密码、感受到机器的感觉。

目前，机器的所有创造力都是由人类代码发起和驱动的。除了我们让它们做的事情，没有看到机器主动地表达自己。人类用来想象和创新的创造力是人工智能永远无法触及的能力。而且，我们还需要看到，目前人类创造算法的动力，在大多数情况下不是由扩展艺术创作的愿望，而是由产业和公司的利润所推动。关于人工智能有大量的炒作，对其功能也有夸张夸大的成分。

（作者系《世界文学》编辑）