为什么人文学依然重要? ——“生成式人工智能”在当代文学创作中的应用及其不满
自OpenAI公司开发的ChatGPT正式上线以来,以其为代表的“生成式人工智能”(Generative Artificial Intelligence,GAI、GenAI)迅速在各个领域引起持续而有力的回响,文学领域也不例外。举凡文学创作、研究乃至教育教学,因此均需回应一个之前并不觉得十分严峻的问题:这场新的技术革命,给文学领域,究竟带来了怎样的冲击和影响、改变和挑战?我们又该如何因应,以恢复或重新发见文学乃至人文学的荣光,使之葆有不朽的魅力?“具体到当代文学创作领域,其究竟已产生何种影响?未来还将产生怎样的影响?我们应该如何理解这些影响?”对上述一系列问题,笔者之前曾有数文进行初步探讨,尤其是《仿生人梦见电子羊,又如何?——论ChatGPT、AIGC与当代文学创作》一文,从一个个案(一个短文本)的实际写作出发,试图比较研究目前国内外多款主流“生成式人工智能”技术、产品——大语言模型(LargeLanguageModels,简称“大模型”)在简体中文写作中的表现水平(实际为其处理、利用简体中文这一自然语言时的理解和生成能力),进而将这些机器生成的文字、内容,与优秀的人类创作进行对照分析,以期对此类创作做出较为恰切的评论与分析。不过,在个案研究之外,我们还需要全面地考察“生成式人工智能”与文学创作交叉融合的发展脉络、特点及其不足,充分考虑人工智能、“生成式人工智能”之于人类创作的特殊意义,在此基础之上,进一步从这一新的研究视角,重新认识数字时代人文学术的意义、价值。甚至更准确地来说,我们还需要从全球视野出发,系统、深入地检视当前文学创作领域运用“生成式人工智能”技术所取得的各项成就及其局限性,特别是探究其局限性是如何形成的、未来是否能够被克服等问题,以丰富我们对这种全新类型的当代文学创作、现象的理解。实际上,合理地评价其成就与不足,省思其对于我们的文学、文学研究及人文学术本身而言,究竟有何积极意义和消极意义,既是我们探索人类与人工智能共同协作、展开文学想象这一课题可能的研究途径,也将增益我们对人工智能、人工智能文学、数字人文、机器人人文、后人文主义、数字文化等相关领域的深入认识。当然这一切,首先得让我们从对“生成式人工智能”本身的理解谈起。
一、何谓“生成式人工智能”:必要的理论和技术分析
什么是人工智能?什么又是“生成式人工智能”?想要回答这两个问题,我们可以从科学、技术、艺术、历史、意识形态等不同的研究视角出发,做出可能完全不同的分析和讨论,不过,技术是其中至为重要的一个理解和分析问题的角度。从技术角度来看,人工智能(这里我们不拟讨论这一中文语汇,与其所对应的英文原语Artificial Intelligence之间是否完全一致等问题),或者更准确地说,是第一代人工智能,在很大程度上是计算机对人类智力活动的模拟,我们可以将其理解为人类思维模拟智能或类人智能。因其智能水平比较有限,常常也被看作“弱人工智能”,但及至“生成式人工智能”出现以后,不仅人工智能的运作原理、逻辑及其所依赖的超大规模参数、极其复杂的语言模型、算法等都发生了改变,而且其所表现出的惊人的文本理解、生成能力,在一定程度上也满足了我们对“强人工智能”的想象,因此人工智能本身也需要被重新加以定义、理解。
那么,究竟什么是“生成式人工智能”?它和早期的、第一代的人工智能(时常也被我们称为“传统人工智能”)有怎样的区别和联系呢?二者之间的联系,可以说是比较底层的、基础的:首先,两者的目标一致,都是让计算机能够模拟人类的智能行为,实现高度自动化的任务处理和决策,提高我们的生产效率和生活质量,增进人类福祉;其次,两者的理论和技术基础,也拥有不少相通之处。无论是传统人工智能,还是在此基础上发展出来的“生成式人工智能”,它们的科学和技术创新,都依赖于计算机科学、数学、统计学这三大学科专业的知识和技术,此外,也都需要大量的数据和强大的计算能力来进行训练和优化。但有趣的是,正是在数据利用方式这一点上,二者之间开始发生并形成了极为明显的差异:同样需要处理大量数据,传统的人工智能,不仅对编程语言(这是这一时期机器能够理解的语言)依赖性极强,而且主要依赖标注数据进行学习,从中提取数据特征,进行预测。这也就意味着,在被输入到模型之前,数据已经经过了人工的标注和分类。它的好处是较为准确、可靠,数据质量较高,但局限性在于,高度依赖人工标注的数据质量和数量,如果标注不准确,或数据量不足,模型的性能就会受到很大影响。更重要的是,基于人工标注数据和传统方法的人工智能,往往只能在已知的知识类别范围内进行判断和预测,很难创造出新的类别或者内容。
但“生成式人工智能”则与之完全不同。它不是直接学习具体的、关于数据内容的分类和标注知识,而是通过理解大规模数据背后的分布和模式,能够在一定程度上进行创新和创造。在我们可以感知的层面表现为:我们可以以人类语言、自然语言(而非机器语言、编程语言)的方式,与其进行交互,从而生成我们需要的全新的数据类别和文本内容。以大模型这一“生成式人工智能”(除了模型、算法,也需要极其强大的计算能力、硬件作为支撑)的核心技术、产品为例,其之所以能够学会并写出大量的文本数据,包括小说、新闻、学术论文各种文体、类型的文本,并不是因为它记住了每个具体的字、词、句、篇,而是理解了人类语言的结构、语法规则、词汇的使用频率和上下文关系,通过对这些数据的分布和模式的学习,不仅可以提取其中的语言文字特征进行预测,还能据此生成全新的文本内容。比如,当我们给定一个主题、题目,或者一篇文章开头时的几句话,“生成式人工智能”就可以根据它之前学习到的语言模式,快速生成一段、多段甚至一篇逻辑前后连贯、既有论点又有论证和分析的文章;它还可以模仿不同的写作风格,创作出较为新颖的故事、诗歌或对话。实际上,除了生成文字,“生成式人工智能”通过学习大量图像的分布和特征,亦可生成我们之前从未见过的新的、十分逼真的图像。至于音视频的生成等,大致也遵循了与之相同的逻辑。
更进一步来说,从技术角度来看,传统人工智能,是规则驱动的人工智能或判别式人工智能,它主要依靠预设的规则和大量的训练数据工作。其核心思想是,通过大量数据进行训练,让模型学会从数据中提取特征,然后再根据这些特征,进行分类或预测,核心技术包括决策树、支持向量机、逻辑回归等机器学习算法。而“生成式人工智能”基于生成式的语言模型维持其日常运作,它不仅能够识别和分类数据,还能创造出新的数据和文本,核心技术则包括生成对抗式网络(GANs)、变分自编码器(VAEs)和大模型(如GPT)等,这些算法、模型、架构,通过学习大量的预训练数据,能够生成与预训练数据相似但又不完全一致的甚至是全新的数据和内容。当然,二者在语言处理能力、实际应用(如“生成式人工智能”不仅可以生成文字内容、各类艺术作品,亦可帮助我们创建新的游戏角色、场景和剧情,设计游戏)、交互体验(如“生成式人工智能”的用户体验更加自然和流畅,能够理解和回答更复杂的问题,即使问题不在预设范围内,也能根据学习到的大量信息,生成合适的回答)等方面,也都有所差异,此不赘述。
因之,如果需要对“生成式人工智能”下一简洁的定义的话,我们也许可以说,它就是一种能够根据人类提示,生成文本、图像或其他信息、数据、内容的,新的人工智能技术。它的运作原理、逻辑,也可以被概括为:利用机器学习技术,在现有的大规模、多模态数据集基础上,生成新的文本、图像、视频、声音、程序代码等数据。此外,它还具备多任务、多场景的处理能力。例如,ChatGPT能够根据我们输入的提示,生成高质量的文本内容,DALL-E可以根据文本描述,生成以假乱真的图像,乃至全新风格的画作,Sora可以根据人类指令,生成颇为精美的音视频,Gemini则可通过人类的语言、语音、肢体动作等文本和听觉、视觉信息,进行深入的推理和分析,并做出相应的、较为准确的决策。凡此种种,都不禁让人们生发出这样的感慨和判断:自从“生成式人工智能”走向前台、走向公众开始(标志性的事件即为2022年11月30日ChatGPT的正式上线),一种革命性的技术真正出现了,一场新的技术革命真正开始了。
但若是从历史角度来看,我们对“生成式人工智能”的认识,可能就要变得更加复杂一些。正如关于“中国现代文学”的起源,在数十年甚至更长的研究过程中,已从单一的“五四起源说”,发展到如今的、事实上的“多重起源”叙事,目前形成的关于“生成式人工智能”的历史的书写、叙事中,同样也充满不同的思想观念、话语的竞争与交锋。仅以其起源为例,不同学者(这里主要指计算机科学家、人工智能研究的专业人士,还不包括对这一问题感兴趣的人文社科学者)从对人工智能及“生成式人工智能”的不同定义、理解出发,不仅形成了不同的、针锋相对的观点,也让它的起源成为一个“多重起源”叙事,充满了张力和冲突。这些观点,大致可以被概括为下述四种:一为“20世纪50年代说”,因当时的科学家已经开始探索如何让计算机模拟人类智能(主要包括学习、推理和解决问题等方面能力),是否可以让这些机器变成能“思考”的机器(当时称之为thinking machine),一些早期的神经网络概念和算法在这一时期开始出现,为“生成式人工智能”的发展奠定了理论基础;二为“20世纪60年代说”,以1964—1966年诞生的、由麻省理工学院计算机科学教授约瑟夫·魏岑鲍姆开发的、全球首款可进行人机对话的机器人ELIZA为代表;三为“20世纪80年代早期说”,此时人工智能研究的关键算法取得了显著进展(如概率图形模型的兴起、神经网络研究的复苏、机器学习算法的发展),乃至算法之外,计算机硬件的快速发展,带来的计算能力的大幅提升等,都推动了此后“生成式人工智能”的迅速发展;四为“21世纪第二个十年说”(日本学术界也称为“二〇年代”),2017年6月12日由谷歌公司机器翻译团队研究人员撰写的论文《注意力机制》(Attentionis All You Need)发表,其中提出的、后来鼎鼎大名的Transformer这一仅基于自注意力机制的语言模型,成为ChatGPT等目前国内外主流大模型的基础架构。毫不夸张地说,没有Transformer,就没有大模型,没有“生成式人工智能”。
总的来看,“生成式人工智能”的出现,既是一个事件,也是一个逐渐发展的过程。目前为止我们很难确定一个确切的起源时间点,也还很难就其起源问题形成共识,因其本身是在计算机科学尤其人工智能领域不断发展的基础上,经过多年的技术积累和创新逐渐形成的;而学者们不同的观点,主要也是基于自己对这一技术的不同定义,对技术发展阶段、标志性事件的不同理解,做出的具有一定主观性的判断,并没有我们想象得那么“科学”。
二、“生成式人工智能”在文学创作中的应用:史前史、历史与现实
与之相较,“生成式人工智能”在文学创作领域的发展历史,因非其主流应用、探索方向,似乎显得更加短暂,也更加明晰一些。我们甚至可以说,作为创作技术、工具的“生成式人工智能”,在文学创作领域的应用,目前尚在发展、进行之中(如果说不是刚刚开始的话),还远远没有成为历史,也不足以支撑我们对其做出深入的研究,特别是富有洞见的、历史性质的考察。但正如我们从最为当下、即时的事物、现象中,可以窥见历史的印痕、倒影、幽灵,蠡测其或显明或隐微,或蜿蜒曲折的来龙去脉,尽管“生成式人工智能”在文学创作中的实践并无漫长、辉煌的历史,这并不影响我们对其已经在全球范围内取得的进展及其不足,做出初步的描述和分析。
实际上,在“生成式人工智能”这一新的数字技术未曾发明之前,关于机器写作、自动写作,人类已有不少想象和实践。在20世纪20年代的法国发端,而后影响遍及欧洲乃至全世界的超现实主义,是这一方面最早的尝试者。他们吸收了达达主义反传统、反理性,追求随机性和偶然性的特点,虽对形式创新兴趣缺乏,且有意挣脱达达主义带来的“影响的焦虑”,甚至“反抗所有对艺术的自由创造的限制”,但仍不得不尝试一种新的形式,即“无意识地信笔成篇,笔下随意流出字串——所谓‘自动写作’(Automatic Writing)”,或称“无意识写作”。在布勒东、阿拉贡、艾吕雅等人的诗歌、散文“自动写作”以外,也产生了安德烈·马松等人的“无意识的绘画”。但无论是在文学、绘画、雕塑还是其他艺术形式的创作、创新中,他们都极为强调不可思议、偶然性、非理性、无意识、潜意识、象征和空想的重要作用。还有学者认为,他们是以心理分析学说所揭示的人类无意识作为艺术与正确知识的唯一源泉,“尝试自由联系、支离破碎的句法,不合逻辑和不合时间顺序的次序,梦幻式的或梦魇般的片段以及离奇古怪、令人震惊、似乎毫不相关的意象的并列等等手法,”“想通过惊心炫目的自我反省,有步骤地照亮那些隐秘的地方,逐渐使其它领域模糊不清,从而完全恢复我们内心的力量。”这当然是一种不同于人工智能,特别是“生成式人工智能”出现以后才有的机器写作、自动写作,可谓人类想象文学能够被自动写作的史前史。
在此基础上,受控制论和计算机科学的启发,20世纪60年代后期,意大利作家卡尔维诺也提出了关于“文学机器”的构想,希望“拥有能够构想和创作诗歌和小说的机器”。卡氏认为,“真正的文学机器,应该是一台自己能够感到需要进行无序生成的机器,”“是那个对于所有元素,那些我们通常十分珍惜,而且认为来自私密的内心世界、以往的经历、无法预料的情绪冲动、惊异、折磨和内心感悟的特性进行讨论的文学机器,”而且,“为了满足那些追求文学事实与历史、社会学、经济事实之间一致性的评论家,这台机器可以对自身的风格进行改变,并且与生产、收入、军费、决定性力量的分配等因素的各种特定统计指标的变化联系起来。那才是能够与假设的理论完全相符的文学,也就是终于成为文学”。但由于缺乏足够的技术实现手段,以及卡氏对这台“痉挛式的文学机器”中的“我”/人类作者(作品真正的负责人,即人类自身)的强调,这一构想在很长一段时期被理解为一个新奇的人类文学创作过程(如卡氏本人的创作就被理解为一台复杂的文学机器),而缺乏计算机、机器、技术的实际参与。此后,美国作家爱伦·坡(EdgarAllanPoe)“解剖了自己利用数学创作《乌鸦》的过程,以证明文学创作不是作家灵光乍现的结果,而是语言的精准计算和严密推理过程”。法国跨学科文学团体“乌力波”也试图“将数学和文学两种话语模式整合起来,把诸多数学因素移植到文学创作中,”“探索新的文学形式,”也构成了“生成式人工智能”在文学创作中进行应用的史前史的另一页。
当然,机器写作、文学机器并非始终只是一种作家、艺术家和科学家的浪漫想象。从1845年美国人约翰·克拉克(JohnClark)发明的简易的诗歌写作机器Eureka,可以生成六音步拉丁诗,即将写着拉丁文字母的木条,安装在一台由木头、铁条、齿轮和皮带制成的特定装置中,然后,随着机器把手的转动,它就能随机组成、生成超过2600万行不同的结构良好的诗句,到1951年,计算机科学领域先驱人物——年轻的英国科学家阿兰·图灵与克里斯托弗·斯特雷奇,为曼彻斯特大学世界上第一台商用计算机FerrantiMark1编写了专门的计算机程序,以此生成了全世界最早的计算机生成音乐——英国国歌《天佑女王》《黑绵羊咩咩叫》和摇摆音乐之王格兰·米勒的经典歌曲《好心情》(IntheMood),开发出世界上最早的、至今仍有无数用户在玩的计算机游戏——跳棋游戏,再到二人因不满“机器有限的自由意志”,制作出情书生成器,以此生成情书,不仅正式拉开了人工智能文学、艺术的帷幕,也表明这些之前为超现实主义、卡尔维诺等人所构想的自动写作、机器写作的理想,正在一步一步成为现实。
其后,随着计算机和互联网的高速发展,以及在此基础上产生的电子文学、网络文学、数字文学等的发展,“生成式文学”(Generative Literature)、“技术文本”(Technotexts)等概念和实践也相继涌现。但除了“生成式文学”一语,或可被用作借由“生成式人工智能”完成的文学创作,其他的概念、术语及其所指涉的文学实践中的文本性、物质性与生成性(在一定程度上也表现为交互性、游戏性)不唯相对较为简单,从根本上受制于程序开发人员/文本创作者最开始设定的人物、叙事框架和线索(亦即背后的、更深层次的、特定的词典、规则与算法,它们绝大多数都是开初就设定好的,难以自驱动、自我更新迭代),而且往往也很难被认为是一种严肃的、值得重视的文学和艺术的创新、成就。例如,20世纪80年代哥伦比亚大学计算机科学系教授迈克尔·勒博维茨等人开发的自动剧本写作程序Universe,就试图将文学创作规律程序化、结构化,将内容大纲与人物设定预先置入其写作程序之中,由机器自动生成一个包含人物、人物关系和历史事件的文学文本,当然,其主要目标是生成肥皂剧、电视连续剧剧本,甚至是“永无止境的故事”,但不幸的是,Universe从未能展示出人类电视剧作者所能达到的、精湛的程度。此外,在不少科幻小说家的笔下,计算机、程序、机器人不仅可以根据特定的主题和设定,快速生成复杂的故事情节架构,提供丰富的创意灵感,而且这些非人类、非生物,俨然如同真人、自然人一般,有其喜怒哀乐、贪嗔痴妄,令人不免惊呼“后人类社会”即将来临。从英国作家斯威夫特的《格列佛游记》,到20世纪五六十年代“美国作家费兰、科温,英国作家巴拉德、斯拉德克和法国社会学家埃斯卡皮等人”在小说中讲述机器人写作的故事,再到当代美国作家菲利普·迪克出版的反乌托邦科幻小说《仿生人会梦见电子羊吗?》,波兰作家、学者莱姆出版的《未来学大会》《机器人大师》,日裔英国作家石黑一雄的力作《克拉拉与太阳》,中国作家刘慈欣的科幻小说《诗云》等,都是这方面的代表性作品,体现出比技术实践更为前瞻、惊人的想象力。当然,也正如有研究者所指出的那样,在欧美世界内部,对科学、技术的想象也存在着一定的不平衡性,“美国人有广泛流传的科学幻想文学,它们热心地勾画着技术的乌托邦,它们喜欢构想各种狂幻出奇的概念,诸如驾驭了时间,能使人像旅客一样地漫游到各个过去时代的社会里去,”而“在德国我们始终迟迟不肯对于技术也像对于其他的文化领域那样,认可它那同等的公民权,尽管我们在技术创新上有许多成就。”
但正如上文一再想要表明的那样,技术实践既不是诗人、小说家、人文学者偶尔的、时髦的兴趣,也从未停止前进、探索的脚步,尤其是在“生成式人工智能”诞生以后,这些文学和技术想象的成就一夜之间既变得触手可及,与我们的日常生活、普通人投身审美和艺术创新之间的距离,也被缩短到前所未有的地步。2008年,全世界首部由人工智能参与创作的小说《真爱》由俄国SPb出版公司印行,据悉这本320页的小说模仿了托尔斯泰的名著《安娜·卡列尼娜》,但在措辞上却采用了日本作家村上春树的风格。以之为嚆矢,2013年,麻省理工学院数字媒体教授尼克·蒙福特的人工智能小说《世界时钟》(World Clock)公开出版,这部讲述每天每一分钟世界各地发生的1440起事件的小说,乃是作者使用165行Python代码自动生成的结果。2018年末,全球首部完全由人工智能创作的小说《1 The Road》(在路上)在美国问世,作家罗斯·古德温有意利用人工智能,模仿凯鲁亚克的同名小说的风格,将自己在旅途中用麦克风、GPS、摄像头和手提电脑搜集到的声音、画面等,作为数据提供给人工智能,由其创作了这部作品,“可惜人工智能远没有到他期望的程度,这部作品虽然成功出版,但其中的内容缺乏逻辑,根本不能构成完整的故事,所谓的AI创作更多只是个噱头而已。”但随着此后“生成式人工智能”浮出历史地表,在欧美乃至全球,以此项技术作为文学创作的辅助工具,创作更高质量文学的理想,不仅真正成为现实,更呈现出一派蓬勃发展、蒸蒸日上的气象。
一项基于亚马逊网站上由ChatGPT和人类共同创作完成(以ChatGPT作为合著者)的电子图书的最新调查、研究显示,截至2023年8月,全球范围内利用ChatGPT这一“生成式人工智能”产品、应用撰写的图书的数量已高达857种(这还不包括大量、未在该平台公开发售的作品,以及由其他的“生成式人工智能”应用,随时随刻就能写出的文学和学术作品)。但也许和我们这些文学研究者、评论者的想象、期待不同,其中最多的并不是文学创作,而是与人工智能和ChatGPT本身相关的图书(高达211种),紧随其后的,依次是职场和个人成长主题作品(154种)、探险与科幻小说(151种)、儿童读物(106种)、旅游指南(93种)、小众爱好类作品(86种),数量最少的则是历史类图书(27种)和爱情、情感类图书(29种),由此足可见出其在文学领域的成就,体现在种类、数量上,固然可圈可点,但仍集中于类型小说、通俗小说方面。除内容主题外,研究者还发现,这些人机协作而成的电子图书的语言分布,也呈现出严重失衡的状态,其中,以英语写作的作品处于绝对优势地位(637种),其次是西班牙语(63种)、葡萄牙语(39种)作品,德语、意大利语及法语作品均约占4%,其他语言作品(其中包括繁体中文、日语、俄语作品等)数量则相对较少,这既反映了在不同国家和地区“生成式人工智能”技术接入和发展的不均衡现象,也在一定程度上凸显了大模型所面临的如何真正支持多语言(特别是非通用语种)、保存语言多样性的现实困境。
不过,虽然欧美世界的科学、技术和文学、艺术创新,自现代早期以来,在全世界始终独占鳌头,但这并不意味着在“生成式人工智能”产生之前,其他国家和地区(如“全球南方”)的作家、艺术家和技术专家,从未敏感到利用计算机、程序进行自动或半自动的文学创作这一问题的重要性,或从未有过对科学、技术与文学创作融合的想象,相反,他们的努力和实验也同样值得铭记。在中国大陆,早在1984年,在上海就产生了一款能在半分钟内写出一首五言绝句的电脑程序(开发者系上海育才中学教师梁建章)。此后,猎户开发出“猎户星”免费在线写诗软件,张小红开发出“GS文章自动生成系统”(由该系统生成的作品,结集为《心诉无语——计算机诗歌》和《中国机器诗》二书,其中《中国机器诗》以CD-ROM光盘形式出版,获得国家版权局计算机软件著作权)。2013年,刘慈欣设计了一款名为“计算机诗人”的写诗软件,较其1989年开发的“电子诗人”写作软件,不仅能够匹配最新的操作系统(当时已成主流的Windows操作系统)、程序运行环境,而且诗歌写作能力更为优异,用户可在设定段落、行数、韵脚后,请软件自动生成一首新诗。事实上,在此前后问世了许许多多诗歌写作软件、散文写作软件、网络小说生成器等(其准确数量和有关情况,今天我们已经很难完全统计、掌握),最大的中文在线百科全书——百度百科,甚至为此创造了“写诗软件”等词条。
2017年由微软机器人“小冰”创作的简体中文新诗集《阳光失了玻璃窗》的出版,更让机器写作、人工智能文学成为中国文坛瞩目的(也可能是目前为止这一领域最有影响力的)大事件。这本被认为是人类历史上第一部完全由人工智能创造的现代诗集,是微软科学家、工程师让“小冰”学习了近百年间519位中国现代诗人的数万首诗歌之后进行创作的结果,这次公开出版的139首诗作,是自其所作七万余首新诗中遴选出的、较为出色的作品,但即便如此,收入此集的许多创作质量平平、不知所云。此后,“小冰”还出版过3部诗集,但并未引起更大反响。有研究者指出,这一时期的人工智能诗歌创作,“缺乏意图,没有所指和隐喻,本质上无法被人理解”,而且,“诗歌创作没有稳定而清晰的标准以致人工智能难以驾驭。”同年,科幻小说作家陈楸帆开始利用人工智能创作小说集《人生算法》(后于2019年1月由中信出版集团出版),其后,由他和人工智能共同创作完成的短篇小说《出神状态》(刊于《小说界》2018年第4期)更在《思南文学选刊》举办的“AI榜”(由一款人工智能应用,从国内20种文学期刊提供的2018年年内刊发的全部771部短篇小说中,评选2018年度短篇小说)上一举拔得头筹,以0.0001分的优势战胜“榜二”——莫言发表于《十月》2018年第1期的小说《等待摩西》。
ChatGPT等“生成式人工智能”应用出现以后,更出现了大量以简体中文形式生成的、不同风格的文学和艺术作品,许多作家,尤其青年作家、网络小说创作者,对使用这一工具辅助创作竟也不讳言,表现出一种可贵的诚实和坦率态度。比如陈楸帆自陈其在之前利用人工智能进行创作的基础上,“花费大量时间和精力探索如何与ChatGPT更好合作,每天不断地和它对话”,并尝试新的创作;学者沈阳率团队利用此一技术创作了短篇小说《机忆之地》,全部内容皆由人工智能生成;王峰团队采用“国内人工智能大语言模型+提示词工程+人工后期润色”的方式,创作出百余万言的长篇玄幻小说《天命使徒》……皆可谓是重要的、有益的人机文学共作试验。文字作品以外,有研究者还发现,在中国大陆各大视频、短视频平台上已出现众多以“AI续写”为主题的实况录制和转制作品,其中,“被续写的对象既有如《蝙蝠侠》《逆转裁判》《新世纪福音战士》这样的知名流行文化作品,也有如《红楼梦》《三国演义》以及《桃花源记》《两小儿辩日》等或是进入经典序列的文学巨著,或是见于基础教育阶段教科书的传世古文。……它们甚至已经培养出一批热衷观看这类视频的常驻观众”。
在中国香港、台湾地区,利用人工智能创作文学的试验以往相对较少,但自“生成式人工智能”技术出现以后则进入了快车道,繁体中文文学想象由是仿佛焕然一新。董启章、邹建宏、寺尾哲也、徐珮芬、刘梓洁、萧诒微等一批港台作家,不仅利用ChatGPT等域外主流大模型展开日常文学实验,先后出版了《写给Aillen的情书:真人vs.AIChatGPT互动小说计划》(电子书)、《AI小说炼成》(小说集)等著作,文学馆、社团及对此怀有强烈兴趣的作家、工程师等,还联手推出了专门的网站、文学科技装置,为普通人利用人工智能进行创作、展开自我与文学、历史探索,开启了新的可能,另外,台大等高校也陆续开设了人工智能与人文学术交叉研究课程,台湾“科技部人文社会科学研究中心”(后易名为“国科会人文及社会科学研究发展处”)“文化部”等单位先后主办多场学术会议、沙龙,聚焦于科技、人工智能与文学想象、文化创新这一主题。总之,无论是相关的创作实践,还是学术研究、教育教学,都已成为两地文学、人文学领域方兴未艾的重要发展方向。
在韩国,2011年8月25日,Parambook出版公司出版了首部由人工智能撰写的长篇小说《从今以后的世界》(지금부터의세계),讲述了从身体残疾的数学家,到数学教授、企业家、精神病学家、天体物理学家、佛教僧侣等五位主人公的故事,其中“每个人都从自己的角度探索存在的秘密”。全书由人工智能程序Birampung(韩国人工智能初创公司Dapumda和自然语言处理公司Namaesseu共同开发)在计算机科学家、作家金泰渊(김태연)的指导下撰写而成,历时7年。其创作原理是,金泰渊负责构思小说主题、人物角色与相关背景,然后让Birampung在阅读1000本小说以后开始创作(以机器学习方法、技术进行创作),最后再由金泰渊检查创作成果。金泰渊表示,“Birampung有时会拘泥于一些细节或采用太过浮夸的词句,但大致而言,不用做太多的调整与校正,可读性很高”。而在12年后,Snowfox Books出版公司更借由新一代人工智能技术,很快推出了首部由ChatGPT撰写,其他人工智能应用(如AIPapago、ShutterstockAI)翻译(由英语译成韩语)、校对及设计插图的纸质图书《寻找人生目标的45种方法》(삶의목적을찾는45가지방법),从撰写到校对仅用30小时,(35)加上印刷、出版、首次上架公开发售需要的时间,全部工作仅耗时7天,而在此之前,以韩语出版一部译著,一般需要2~3年的时间。
在日本,2016年3月21日,东京举行了“人工智能小说创作”报告会。会上,日本公立函馆未来大学计算机科学教授松原仁(现为东京大学教授),便介绍了其所负责的“我是异想天开的人工智能作家”项目成果、由人工智能创作的《当计算机写小说的那一天》(コンピュータが小説を書く日)等两篇小说的生成机制及人工智能创作前景,东京大学工学研究科副教授鸟海不二夫则报告了其所负责的“人狼智能项目”完成的《你是AITYPE-S》[汝(なんじ)はAIなりや?TYPE-S]等另外两篇作品。尽管这四篇作品背后研究、使用人工智能的方法,及其中具体创作的方法有所不同,但它们同样都是将人工智能的应用潜力由此前的棋类比赛等,扩展到文学这一更具创造力的领域的重要尝试。四篇小说,无一例外也都参加了第三届日本经济新闻社举办的“星新一微型小说奖”比赛,报告时其中的《当计算机写小说的那一天》也已顺利通过初审,但或许令人类作家稍感欣慰的是,最终它并未摘得桂冠。不过,自“生成式人工智能”问世以后,利用这一最新数字技术撰写俳句、和歌、推理小说、科幻小说等,甚至以此斩获专业文学大奖(如2024年1月,日本年轻作家九段理江的新作《东京都同情塔》获得“芥川文学奖”,作者在获奖感言中透露,小说约5%的内容纯由ChatGPT生成,并且是“原汁原味”、一字不差地使用,未经任何修改)之类新闻,已屡见于日中及全球新闻媒体,自不必缕述。
三、“生成式人工智能”在文学创作中的应用之不满
然而,正如本文起首所论,在我们为这些新的,由技术与文学交叉融合而完成的艺术试验、成就庆祝的同时,还需要进一步思考和分析它们的局限和不足,亦即本文题目中所谓的“不满”。众所周知,对于此一问题,其他研究者(包括作家、文学研究者、人文学者、计算机科学家、人工智能科学家等)此前已有不少探讨,构成了本研究重要的先行研究和对话的语境,但这些论述,和笔者所理解的“不满”仍有不同,以下将发表拙见,供大家参考。另外,为了使我们的讨论更为聚焦,以下我将观察、讨论的对象和范围,从全球、欧美地区的既有实践,转至东亚地区,尤其中国大陆作家、学者利用“生成式人工智能”进行创作(包括简体中文文学与少数民族语言文学)这一方面,并将其摆放在与文学、人文学的关系这一问题域当中,予以剖析和反思。
要言之,我所理解的“不满”,主要包括下述五个方面:
第一,对利用“生成式人工智能”辅助文学创作,或由其完全、自动生成的文学作品(显然,我们需要对此两种不同的创作形态、结果做出区分,需要新的文学理论)的质量的不满。正如我在上文及之前的研究中所指出的那样,到目前为止,人工智能,尤其“生成式人工智能”,的确可以写诗(新诗、旧诗)、写对联、写小说(从短篇到长篇),在类型小说、通俗小说、网络文学等方面皆可谓表现不俗,但其在严肃文学领域,尚未表现出足够的写作能力、水平。其实,负责任地来说,即便是其在严肃文学之外的创作,有不少仍只能算是“入门级”的作品。以韩国首部由人工智能撰写的长篇小说《从今以后的世界》为例,韩国学者吴泰浩(오태호)就指出,它尚未达到以前出版的“知名作家”小说的水平,“一是人物的性格没有得到适当的实现,二是情节的有机合理性没有得到保证,三是数学和科学的知识和信息被简单粗暴地列出,四是过度使用口语、俚语而不加修饰”。再以日本发表的短篇小说《当计算机写小说的那一天》为例,日本科幻小说作家长谷聪就认为,这篇小说固然结构合理,但仍缺乏充分发展的人物,此外,其他作家亦发表不少批评性的意见。最后,以2024年5月在上海发布的、由国产大模型创作的百万字长篇小说《天命使徒》为例,我请目前能够处理长文本(每次可处理20万字简体中文文本)、对话、问答等场景任务的Kimi大模型(中国人工智能初创公司月之暗面开发),阅读并分析这部小说的前15%,就其写作质量做出评价,然后,它旋即指出,可从结构与组织、主题与深度、人物塑造、语言运用、创意与原创性、文化与历史背景、情感与共鸣、技术应用、后期润色、社会影响等维度进行分析。接着,在我的要求下,它除了对每个维度做出简要说明,最后还得出了这样的结论:“综上所述,这部作品在结构、主题、人物塑造、语言运用等方面均表现出较高的水平,同时在创意与原创性方面展现了人工智能的独特优势。情感与共鸣以及技术应用方面也得到了很好的处理,后期润色和社会影响也显示出作品的潜力和价值。”但很显然,这些维度究竟应该被如何定义、数者彼此之间的关系为何、不同维度的重要性为何等问题,它都没有认真考虑(甚至没有考虑后两个问题),更重要的是,从对每一维度的说明,到最后的结论,这些乍看起来颇有一点学术味道的论述,本质上都是一些空话、游谈,不具有真正的学术参考价值。与此同时,我还注意到,有人类读者在阅读该作第362章《风雨前的宁静》时发现,仅仅400多字的篇幅,就出现了语义重复、指代不明、用词不准确、上下文不连贯等问题,因此表示“不知道这样的‘长篇小说’(长是确实长)有什么意义?……要论字数,把一个人一年说的话记录下来并出版,那岂止一百万字?”实际上,就连《天命使徒》的人类创作者(协作者)也不得不承认,全书“仍处于网络小说的下游水平,尽管这部小说从局部情节上看起来有一定文学性,但这些片段最终能拼接成一个完整且不冗余的故事,依然需要依靠人工”。
对这些人机协作,或完全由“生成式人工智能”生成的文学创作的质量的不满,当然反过来也坚定了我们对人类创作、对文学和人文学的信心。在这方面,莫言、余华等当代严肃文学作家也都发表过类似的看法,他们都认为人工智能纵使发达至极,也都不能取代人类创作。著名的人工智能批评者、美国当代科幻作家特德·姜甚至认为,“目前的人工智能并不真正智能,而大语言模型实际上并没有在使用语言”,所谓的“生成式人工智能”技术,也“不是用来创作艺术的工具”。与之相反,刘慈欣、王晋康等当代科幻作家则相信人工智能一定会超过人类,而且正在取代作家、编辑等工作,或是至少有被其取代的危险(我们也注意到,刘慈欣的具体观点在不同时期有所变化,在此不作专门讨论),但因为受到计算能力等因素的限制,还是给人类、人类作家留下了不少腾挪趋避的空间。简言之,一方面,人类的无能反而成为人类作家最后的屏障,另一方面,文学需要面向、探索的是更为广阔的想象空间,非是紧跟现时代热点话题、事件,单单聚焦于科技发展与人类命运、生存挑战一端。不过,就我们对这一新的类型的创作的质量的不满而言,在此还需要对三个相关问题做出辨析:首先,当人工智能尤其“生成式人工智能”被运用于文学创作时,我们一般所谓的“它写得不好”,与“它完全写错了”,应该被看作不同的两件事。具体来说,“它写得不好”,从相反的角度来说,意味着还有提升的可能;“它完全写错了”,则需要具体问题具体分析。正如尤瓦尔·赫拉利所说,绝对正确是一种幻想。其实,指望人工智能能够回答、解决人类也回答不了、解决不了的问题,也是一种不切实际的幻想。其次,由人工智能生成的文学作品的质量,在一定程度上,并不取决于人工智能,而取决于用户对指令微调(Instruction Tuning)、提示词工程(Prompt Engineering)等大模型应用技术的掌握程度,人工干预(这里主要指的是人指导、协助机器进行写作)的程度。换言之,一部名义上的人工智能文学,或人机协作作品,究竟有多少出自人工智能,又有多少出自人类之手?在没有彻底弄清楚这一问题之前,我们恐怕很难对此做出准确、有效的评估和判断,也不能就此简单地批评人工智能本身的缺陷与不足。最后,我们对人工智能文学,或人机协作作品的批评和分析,不能只满足于讨论其是否(或在多大程度上)具有原创性和独特性,或是只关注此类作品的虚构性、拟真性乃至所谓的“虚拟现实主义”美学特质,似应更多地研究由此开拓的文学和艺术表达的新的可能,或有无可能、如何由此提升机器创作文学乃至人类文学的水准等问题。更进一步来说,随着“生成式人工智能”技术的不断进化,以及未来在此基础上开发出一系列更加适合文学和艺术创作的应用、产品,相关硬件设备的不断创新并走入千家万户(如Meta公司创始人扎克伯格就认为,未来不会只有一种人工智能,手机也不再是我们的必需品,AR眼镜很可能成为新的主流工具,成为人工智能的绝佳载体;又如苹果、谷歌、微软等公司正在开发的其他可穿戴式智能设备,也为人工智能提供了新的应用场景),我们对人工智能、人工智能文学的想象与理解,可能将发生翻天覆地的变化,当然这也是我们无法预料的。
第二,在利用“生成式人工智能”创作文学作品的尝试中,利用国产大模型创作简体中文文学、汉语文学占绝对主流,少数民族文学领域颇为匮乏,使用其他的、域外的大模型等从事文学创作者,令人尤感不足。造成这一现状的原因是多种多样的。其中既有复杂的国际政经格局与科学、技术发展的不均衡性等普遍性因素,也与中国大陆的政治制度、经济水平、信息生产和再生产体系、语言文字政策、国民的“数字读写能力”等特殊性因素息息相关。但无论如何,从我们目前看到的、极其有限的利用“生成式人工智能”创作少数民族文学的尝试、试验看,其虽有一定的、属于它自己的特点(这有点像民族语网络文学在当下的发展状况,与以简体中文、汉文形式发表的网络文学多所不同,其具有相当的独特性,如前者多以诗歌为主流,后者则以小说为大宗等),但从总体上来说,其写作质量、水平似仍不能完全信任或给予过高评价。以蒙古语言文学为例,最近就有学者利用ChatGPT、文心大模型(百度公司开发)、星火大模型(科大讯飞公司开发)等创作了一些蒙古文文学作品,发现国产大模型不能生成可理解的蒙古文文本,而ChatGPT则既支持蒙古文对话、交互,也能生成蒙古文诗歌等,但从其生成结果看,“民族特有的文化特质、审美观念……是无法生成的”。这是由于,蒙古语是众所周知的低资源语言,相应的语料、数据、数据库乃至经典、辞书、重要作品的数字化均处于起步阶段,亦无相应的专业、垂直领域大模型(与之相反,阿拉伯文领域就有JAIS这一专业大模型)甚至小模型、轻量模型,基于人工智能技术、面向文学创作和研究的蒙文应用也在研发、摸索之中,因此,这方面未来肯定还有很长的路要走,这无疑也为我们提振对文学、人文学(在此具体化为蒙古语言文学)的信心,重新思考其社会价值和应用价值,提供了一个难得的、喘息的机会。
更重要的是,传统的文学、人文学的一大价值、贡献,恰在于保存、记录并发展语言、文字、文学、文化的多元化、丰富性,但人工智能,特别是“生成式人工智能”作为一种生产工具,有一致命问题是“它的训练目标和广泛应用的特性使其不断根据大多数人的使用习惯进行优化。这意味着它不可避免地会与大多数人的偏好对齐”,“假设80%的人喜欢某种风格或结果”,人工智能模型就会“逐渐调整并强化这些偏好,而剩下20%的少数人可能会发现他们的偏好被忽视,甚至从生成的内容中被排除”。人工智能科学家还指出,这其实引发了更加一个关键的问题,即在此一技术发展过程中,“是应该照顾大多数人的利益,还是少数人的利益?显然,当前的模型优化倾向于满足大多数人的需求”。而当人工智能作为工具被更多人使用时,“这一过程会进一步强化。人们在生产过程中使用这种工具,生成符合大多数人偏好的内容,而这些反馈又会被模型收集并重新训练,导致模型更加偏向大多数人的需求。最终,这个循环不断重复,使得大多数人的偏好越来越占主导地位,少数人的需求则更加边缘化”。许多具身性、地方性的知识,属于少数人的声音、记忆、文化,都有可能将在人工智能、数字化、数据化的洪流中被淹没。而这固然是计算机和人工智能科学家、工程师们需要解决、处理的棘手的技术难题之一,但对于我们文学研究者、人文学者来说,更是在今天仍要极为珍视我们的口述文化、书写文化和印刷文化遗产的理由,也是文学、人文学需要继续存在并且发扬光大的指归——正如既有的文学、艺术和人文经典,充分反映了世界的多元化、多样性,以及每一个具体的、活生生的人的独特性,我们也无法想象等待着人类的未来,是一个单调的(贫瘠的?)、均质化的、整齐划一的世界,哪怕这个世界是科学、技术高度发达的,人类生产生活高度自动化、智能化的,高度“文明”的。实际上,任何时候,我们也都需要新的、未知的、多元的、生机勃勃的文学想象与文化表达。
第三,对目前的人工智能尤其“生成式人工智能”技术本身的不满。这也至少需要从两方面来理解:一方面,我们注意到,“生成式人工智能”在目前的确也面临着各种各样的问题,从对电力、算力、高性能处理器(如CPU、GPU)和专用硬件(TPU)的严重依赖,到对人类能源和生态环境造成的巨大压力(如斯坦福人工智能研究所发布的《2023年人工智能指数报告》指出,训练GPT-3这个单一模型的过程就耗用了1.287吉瓦时电量,这大约相当于120个美国家庭1年的用电量,同时,其间产生的502吨的碳排放量,则相当于110辆美国汽车1年的排放量。换言之,“生成式人工智能”技术每发展一步,每取得一项令人瞩目的成就,可能都是以释放大量温室气体,加剧全球变暖和人类生存危机为代价),再到如何真正支持多模态交互,如何真正支持多语言交互,如何增强其可解释性、避免“算法黑箱”,如何平衡通用大模型与专业/垂直领域大模型、小模型、轻量模型开发的关系,如何处理高昂的技术开发成本与商业化、产品化(同时也意味着让每个人都能以较低的价格、便利的渠道,用得上这些产品)之间的矛盾,如何应对偏见、歧视、虚假信息等伦理和安全问题,进行监管和治理等,但在另一方面,我们也知道,对科学、技术的焦虑、不安、不满,其实是根深蒂固的人文思想传统,科学、技术与人文长期以来甚至被看作“两种文化”,但是,这些批判、质疑的声音所造成的结果,在今天和在前现代社会、工业时代大相径庭。在前现代或早期的工业时代,它的确可以在一定程度上阻碍和限制科学、技术的发展与进步,但在今天,却显得格外软弱无力(当然这并不是说这些声音本身无足轻重)。这主要是因为今天的科学和技术革新,已经深深内嵌于全球化、现代化和民主化的世界发展潮流之中,并非某一政治集团、社群(如文学知识分子、人文学者、曾经的“卢德分子”——那些因机器代替人力而失业的技术工人)或某种人文思想观念的约束(这同时是否意味着一种封闭、保守?一种必要的保守?)所能阻挡,更重要的是,数字技术本身,包括“生成式人工智能”技术,与之前的生产工具、技术最大的不同,恰在于其具有自驱动性质,能够自我进化,更新迭代,基本上不受人力干预和影响,或者更准确地来说,日益智能的机器、模型,不会受某一个人、某一团体或某篇文章、某种看法的影响,而停止365×24小时的、不间断的深度/强化学习,停止其更新迭代,停止生长出新的智能,哪怕是他们的开发者。这就像即便是OpenAI自己的科学家,也解释不了他们开发的ChatGPT,何以会突然“涌现”出显著的、远远高于传统人工智能的智能水平,也难以阻挡这一技术自身不断走向高级智能、走向与百行百业深度融合的脚步。
这个结果,虽然不是我们论证人文学重要的依据和理由,也未必是文学家、人文学者乐意见到的局面,但就科学、技术本身的发展而言(特别是当我们设想人工智能能够被我们合理地、适度地运用,而不作恶时),仍然是一项值得礼赞的成就。换言之,从技术自身的革新、更新迭代的逻辑,乃至其取得更大的实用性等角度来说,无论我们是否对其不满,它都要不断地变得更加智能、更加进步,更何况,我们还希望它能不断进步、发展,进而造福(而非遗祸)人类。实际上,人类对待技术的合理的态度也许是:既非崇拜、膜拜、仰望,亦非敌视、拒绝、排斥,而是取法乎中,将技术看作技术(与此前不同,要特别看到技术的不透明性),对其做出审慎的评估。一如刘慈欣所指出的那样,科幻小说里经常会出现人工智能征服世界、灭绝人类等主题、故事情节,“不过按照目前人工智能的发展水平,是达不到科幻小说中那种程度的”。一项刚刚在《自然》(Nature)杂志在线发表的最新研究,似乎也印证了刘氏的预测。在这一研究中,科学家们对OpenAI-o1-preview等目前技术领先的SOTA模型进行了全方位评测,结果发现其无法与人类保持一致(如其能解决非常复杂的字谜任务,却在超级简单的任务中屡屡犯错),也不会“回避”复杂任务,而是提供了完全错误的解决方案,更重要的是,大模型对提示词的“敏感性”和“稳定性”表现得极为敏感,并没有我们想象得那样可靠,也没有越来越趋近于人类预期水平,再一次呈现了“生成式人工智能”在带给我们无限的技术想象的同时,所面临的实际的、来自这一技术内部的重重困难与挑战。
第四,对人工智能神话,以及人工智能在社会生活中的霸权地位,各方面的实践(特别是担忧其将威胁人类主体性)的批评和不满。这也让我们再一次体认到,在今天这个数字时代、人工智能时代里面,人文学依然重要、有用,它不仅仅是“让人成为人”,成为一个独立、独特、完整,对自己和社会负有重要责任的(包括在决定人工智能如何塑造人类未来的发展方向中,扮演属于自己的关键角色)、大写的人,更在于由此培养出的反思和批判精神,创意和创新的灵感,对人性、人生、人类世界深沉的爱与关怀,对过美好的、有意义的生活的向往,这对我们每个人都至关重要。特别是当我们面对新的技术革命和即将到来的“技术奇点”时,也许更应该看一看《诗云》里的那个世界,那个因超级智能的想象力无限丰裕、爆炸,而形成另一种匮乏的世界。其中,人类和其他时空的文明的一切记忆,都可以被全部储存、移植于超级智能“李白”自己的大脑之中,同时,它也能创造出过去和未来的一切诗歌,直至形成一个遮天蔽日、漫无际涯的诗云,但“李白”既不能从这诗云中检索出他偶尔有兴趣一读的诗歌(李白给主人公之一的伊依,找出的写他们俩的有关诗作,已有几亿亿首之多,但这只是其中的极少一部分),无法展开真正有效的阅读,也无法对其做出鉴赏、分析、判断,因此,也就不能(或未曾)真正拥有(过)它们。这精彩的一幕幕,仿佛也向我们表明人工智能生成内容(Artificial Intelligence Generated Content,AIGC)——人工智能文学亦属其中之一——的生产、消费逻辑具有高度的同一性,这种同一性也许可以被定义为:丰富即匮乏,多即是无。最后,望云兴叹的“李白”,作为一个智人以上的、比被我们想象的“后人类”还要高级的物种,放弃了他的选择、分析、批判和审美的机会,带着无尽的挫折、怅惘和抑郁消失在了茫茫太空之中。
当然,对我来说,这个故事,不仅是如何理解人工智能和人工智能生成内容的一则寓言,而且也足以表明人文学在今天为何依然重要。因为人本身是智慧但有缺陷的,矛盾的、软弱无力的生物,是由特定的历史、社会、族群和生活习惯所塑造的千差万别的个体,因此,围绕着人所建立的文学、人文学、人文主义,同样也充满了各种歧义、差异、矛盾、冲突和偏见,饶是如此,对这些问题的理解,都需要经过人本身的思考、分析,而后做出自由、理性的选择。然而,这并不是人工智能就可以胜任愉快的。长期以来,在我们对人工智能的定义和理解中,往往存在着一种将机器“智能”等同于其有朝一日能够拥有人类的意识、情感、主观体验、自主性等的想象,但事实上,这既非人工智能发展的必需品,就目前的问题而言也并不重要,因为即便“计算机没有意识,无法感受到痛苦、爱或恐惧”一样也能够帮助我们做出决策、解决问题,实现我们的工作目标,“生成式人工智能”强大的理解和应用能力就充分地说明了这一点。易言之,假如今后的机器“智能”的发展方向,并非想要克隆、复制人类智能,而是形成另一种形式的、属于机器特有的“数字智能”,那么,人类的主体性可能就不会那么轻易被削弱、取代,我们也无须杞人忧天。这也正如《出神状态》中的主人公,在地球上最后的夜晚,去上海图书馆还书途中经验到的一幕:“你迫不及待地打开随便一页,你需要证明自己,证明自己还没有完全失去一个人类的尊严。……你读完了最后一个字,感觉满足,这些符号在你的大脑中无法激起任何有意义的反应,它们像是一只又一只黑色的鸟儿,随机地出现,彼此之间毫无关联,只是撞在一起,跌落一地羽毛。人类大脑就是这样一个复杂系统。”在小说中,“你”的阅读对象是一部名为《脑熵:一种神经认知学理论》的科学著作,但它又何尝不可指涉那些大量的、不知所云的抑或是看似文通字顺、实则平庸乏味的人工智能文学、人工智能生成内容?而小说中的“你”,又何尝不是人类世界的“李白”的化身?“你”一边触摸着科学的灵感与智慧,一边却觉得遥不可及,无法捕捉“任何有意义的反应”,有时候甚至怀疑自己的智力水平和审美能力,但却从来没有想过:也许根本不用浪费时间在这些新的、所谓的“文学”上面。
可以说,《出神状态》和《诗云》等文本,共同向我们提出了一个既实际又具有隐喻、象征意味的问题,即人类如何理解机器的边界与有限性,与人类如何理解自己的边界与有限性之间,可能构成一种复杂辩证之关系。抑有进者,站在人类立场来看,如果人类不能充分地理解、解释人工智能(之科学、之美、之恶……),那么,人工智能的意义何在?在将人工智能用作艺术创作、创新的工具时,在多大程度上是为了满足我们对科学、技术的好奇心,或是追求时髦知识的虚荣心,又在多大程度上可以避免过度注重技术的危险(将技术简单化、神秘化,就像卡尔维诺的批评者所指出的那样),真真正正实现灵魂的解放和对自我、人类主体性的更深层次的探索、建构?如果不能做到这一点,让人工智能与人类各展其长、各美其美又有何妨?我们又何须使人工智能以模仿人类大脑、建立人类智能,进而取代人类为职志?
第五,由此引发的对数字人文、数字文化研究的不满足。有心人一定已经注意到这样一个事实,即研究计算机、人工智能、机器人与文学想象关系的学者,大多来自当代文学、比较文学、文学理论和哲学等领域,而较少见到数字人文、数字文化研究者的身影。这大抵是由于我们目前流行的数字人文、数字文化等方面的研究(特别是数字人文研究),或我们对数字人文这一新领域的定义、理解的重心,主要集中于努力学会、知道怎么用哪些数字技术、方法、研究工具,从事包括文学研究在内的人文研究这一方面,我们特别希望、企图运用数据挖掘、分析及可视化等定量研究的方法、手段来展开人文研究,将其与人文研究结合起来,有所创新。这一方面的工作当然重要,但同样重要的是,从现在开始,或者说,在“生成式人工智能”这一革命性的技术出现以后,我们的研究重心还需要有所拓展,即要从人文学的视角来对一切数字技术、方法、工具进行批判性思考,仔细审视数字技术给人类(如对人类认知健康的潜在影响,对认知萎缩和思维衰退的影响等)、人类社会(如对数字劳动、数字集权、数字遗产等的研究)、人文研究带来的影响、挑战及其间存在的一系列问题(包括潜在的问题),以及“藉由人工智能反思、发现或发掘原本可能就已经存在于人文社会科学的问题”,认识人本身的有限性和“黑暗之心”,而且,真正着眼于未来(或至少是被我们宣称的“未来已来”的“未来”),重新想象人类与科学、技术之间更好的、更为多元的、富有个性化的互动的可能,让人类与非人类、非生物、地球(这才是我们共同的、真正的家园,并非语言、文字、文学、艺术等)、太空、外太空之间建立亲密而非敌对的关系(正如有学者所指出的那样,“纵观历史,人类几乎没有表现出关爱地球的能力;在过去的200年里,我们的记录尤其糟糕”),发展“批判性数字人文”(Critical Digital Humanities)研究这一数字人文分支领域,以及“人工智能人文学”(Artificial Intelligence Humanities)等新的研究领域。
当然,对上述诸种问题,要做出内行的、切中肯綮的分析,并非易事。以人工智能文学研究为例,除了需要一般意义上的文学理论、分析工具的创新(如凯瑟琳·海尔斯提出的四种人工智能文学批评、研究模式),还需要我们拥有一定的甚至大量的实操、实作经验,具备以人工智能实践为基础的研究能力,需要我们对科学、技术、人文研究知识和成果的综合理解、把握,唯其如此,我们方有可能对这种数字时代的新语言、新语法、新文学,做出有效的理解和解释。就此而言,不仅传统意义上的“束书不观,游谈不根”式的人文研究、写作之流弊,需要被我们克服,在数字时代,我们还需要克服“关机不观,游谈不根”“舍人工智能不用,游谈不根”“科学、技术与人文不能融通,游谈不根”等新的困难与挑战。一言以蔽之,数字时代的降临,并非我们想象的那样,因为信息、数据的便于获取和网络的无远弗届,就大幅降低了文学、人文学的研究门槛,让文学、人文学变得完全黯然失色,相反,它是从多个方面、方向,对我们的创作、研究工作提出了更高、更难、更多、更复杂的要求和任务,而这不是仅仅依违于中外人文经典,承继既有的人文主义观念,沿袭传统的思维和研究方式,坚持远离计算机、智能手机、互联网和包括人工智能在内的一切数字技术等,就能轻易解决的。不过,这也正是本研究何以需要回顾“生成式人工智能”在当代文学创作中应用的史前史、历史与现状,拟测其未来发展趋势,需要借此省思数字时代人文之学何以仍然重要,进而希望重新想象“人文学的想象力”,恢复或重新发见文学乃至人文学的荣光,使之葆有不朽的魅力的,一个重要且必要的缘由。