用户登录投稿

中国作家协会主管

朱国华:AI 时代的文学研究
来源:《文艺争鸣》 | 朱国华  2025年09月04日14:59

最近几年,ChatGPT、Deep Seek等聊天机器人的启用,让我们产生了如痴如醉、无法置信的超现实感和奇迹感。这些基于AI技术所开发的大语言模型依然处在难以预测未来的高速发展之中,它们不仅仅为我们带来了不停刷新的惊艳体验,并以苞括宇宙、总揽人物的巨大动能嵌入九流百工,重塑我们对社会现实与未来世界的想象。正所谓:开谈不说大模型,读尽诗书也枉然!

那么,AI(按,为行文方便,本文所提及的AI可以视为大语言模型的同义词)对文学研究的未来究竟会带来什么影响?让我们先来看看AI自己怎么说。我选用的大模型是ChatGPT。以下是它的回答:

AI的发展无疑会深刻影响未来的文学研究,可能带来以下几种情况:

文学分析方式的变革:AI在文本分析上的能力不断增强,可能会改变传统的文学研究方法,主要体现在:大规模文本分析:AI能够处理海量的文学作品,进行跨文本、跨时期、跨文化的比较研究。例如,利用AI可以分析19世纪小说中的性别表述模式,或追踪特定主题在不同文学传统中的演变;风格和语料分析:AI可以通过风格统计、文本指纹识别等手段,判断一部作品是否是某位作家所写(如破解伪托作品的问题);情感与主题分析:自然语言处理可以帮助学者识别某个作家作品中的情感模式、隐喻使用,或探测潜在的思想倾向。

传统诠释学与计算文学研究的对抗与融合:传统文学研究强调文本的细读、历史脉络、文化语境,但AI可能推动远读的研究模式,即利用算法对大量文本进行宏观分析。AI生成的统计数据可能会挑战或补充传统的文学批评,例如,它可能揭示一位作家一生作品中某些主题的潜在变化,而这些变化可能是研究者在细读中未曾注意到的。

文学创作与文学研究的边界模糊:AI能够生成文学作品,未来可能会出现越来越多的AI“作家”。这可能带来文学研究上的难题,例如:“AI生成的文本是否值得文学研究?”“AI写的小说如何被归入文学史?”“如果AI借鉴某位作家的风格,是否算抄袭?”AI辅助创作可能改变文学批评的对象,如对AI与人类共创文本的研究,或者探讨AI如何改写、翻译和解释文本。

文学研究者的角色变化:未来的文学研究者可能需要具备一定的数据素养,懂得如何使用计算工具、编写文本分析代码。可能会有更多的跨学科合作,人文学者与计算机科学家合作,形成新的研究范式。研究者可能会利用AI来辅助研究,例如:生成研究摘要、翻译古籍。通过AI模拟“作者风格”来测试某种文学理论。AI参与文本标注,帮助研究者分析文献。

文学经典的重新审视:AI可以挖掘出经典作品中被忽视的细节,例如:通过语料库分析找出经典作家未被充分讨论的主题。重新审视非主流、被忽视的文学作品,使得“文学经典的定义”更加多元化。AI还能识别和整理被历史遗忘的文本,例如对大量未被研究的手稿、书信进行分析,从而重新塑造文学史。

过度依赖AI可能导致研究者丧失对文本的直觉理解,或者被AI提供的数据误导。总结:未来的文学研究可能呈现双重趋势:数据化、自动化——文学研究将越来越多地借助AI进行大规模分析,推动计算文学研究。人文核心的回归——尽管AI能够分析文本,但文学研究依然需要人的情感理解、文化阐释、历史意识。最终,AI不会取代文学研究者,但会深刻改变研究的方式,使其更加跨学科、数据驱动、技术融合,同时也引发新的哲学与方法论问题。

乍一看这个回复,真有一种关机兴叹、金盆洗手的冲动。它不仅列举出了我瞬间想到的某些方面,还有一些我从未考虑过的那些可能趋势。当然,我没有设置特别的条件,它的视角也相对单一:它基本上是结合数字人文的角度,侧重指出利用语料库进行各种建模分析所产生的可能结果。但假如我换一些条件设定来问它,它显然会生成其他答案,这些答案未必就不具备启发意义——须知,它才是真正的经史子集无所不窥。我不知道它是否读遍天下所有出版物,但它拥有的知识数据肯定以天文数字的倍数超过我,它当然无疑会呈现许多常识或庸见,但是这些常识或庸见如果属于我不熟悉的领域,那依然会让我感到振奋和新奇。

事实上,最近几年我自己的学术写作经验让我认识到,我已经几乎无法摆脱对AI某种程度的依赖。它不知疲倦地回应我的几乎所有要求:它当然会帮我归纳克尔凯郭尔《勾引家日记》的主题,还能为我解释为什么阿拉伯人也是闪米特人,但反闪米特主义(anti-Semitism)一词的意思其实是反犹主义(而非反阿拉伯人);它告诉我米芾痴迷石头有哪些著名段子;它能替我将佶屈聱牙的周诰殷盘片段翻译成畅达清通的白话文,还会帮我耐心地逐行逐句解释维特根斯坦的哲学文本。甚至,在我才尽词穷的时候,还可以帮我去物色动感十足、光鲜照人的词藻。最后,它还会列出一些我可能没想到但说不定感兴趣的相关问题,殷勤地请示我,是否需要它继续提供解答。

我读大三的时候,在西湖边曾经遇到过一位老者。他先跟我描绘了吸烟的美妙之处,说他才抽了一口,就觉得飘然欲仙。然后说:这东西太好了,所以我就必须要防着它,离它远点。打那时开始,我就形成了一个质朴的看法:凡是好东西,必然容易上瘾,因而也必然让我们付出得不偿失的代价,因此必须要保持警醒。这其实应该是自古而今的人生智慧。说到古人对技术的防范,我们也许都听说过庄子“圃者拒机”的故事。其内容如下:“子贡南游于楚,反于晋,过汉阴,见一丈人方将为圃畦,凿隧而入井,抱瓮而出灌,搰搰然用力甚多而见功寡。子贡曰:‘有械于此,一日浸百畦,用力甚寡而见功多,夫子不欲乎?’为圃者卬而视之曰:‘奈何?’曰:‘凿木为机,后重前轻,挈水若抽,数如泆汤,其名为槔。’为圃者忿然作色而笑曰:‘吾闻之吾师,有机械者必有机事,有机事者必有机心。机心存于胸中则纯白不备;纯白不备,则神生不定;神生不定者,道之所不载也。吾非不知,羞而不为也。’子贡瞒然惭,俯而不对。”庄子在这里对技术进行了毫不含糊的质疑和批判。他的担忧在于我们本来想把机械装置视为我们解决麻烦的手段,但其结果往往是我们的心已经是机心了,我们丧失了自我主体性,反而为外物所役使,这可就带来了更大的麻烦。

无独有偶。我们可以看一下,柏拉图笔下的苏格拉底对文字书写这一当时的最新发明,是如何进行攻击的。苏格拉底说,特乌斯(Theuth)是埃及的智慧和技艺之神,是书写的发明者。他向埃及国王保证,书写将使埃及人更聪明,增强他们的记忆力。但国王认为事情正好相反,书写充其量只具备记录的功能,我们对这一外在工具的依赖,会导致内在记忆能力的退化。书写给我们带来的智慧是空洞的,因为读写的人只是机械操作,却无法真正理解或运用这些知识:“因为你的发明将在那些学会它的人的灵魂中产生遗忘。由于不再锻炼他们的记忆,他们依赖书写,这也就是从外部被陌异符号所提醒,而不是从内部也就是自己提醒自己:你发现的不是记忆的灵药,而是提醒的毒药。你给你的学生们带来的是智慧的表相,而不是智慧的实质;他们在没有教导的情况下听到了很多,看起来知道很多,而实际上大多一无所知,而且他们会很难相处,因为他们获得了智慧的表相,而不是智慧本身。”(Plato. Phaedrus. Translated by C. J. Rowe. Wiltshire, England: Aris & Phillips, 1986, p. 123.)真正的智慧应该是通过对话交流才能接近真理,而文字是死寂的符号。更不用说,依赖书写会让灵魂变得懒惰,因为人们会满足于表面的、易得的知识,而不容易激励自己在真理探索的荆棘小道上艰苦跋涉。

在柏拉图时代,建基于记忆的口传文化占据主导地位,人们通过吟唱或摹仿史诗、神话或道德规范,通过即兴演讲和自由辩论来承载社会秩序并维护知识连续性,记忆女神墨涅莫绪涅(Mnemosyne)是缪斯九女神之母,记忆是真理的守护人。因而,书写这一新兴技术对记忆的挑战,犹如今天人工智能对人类智能的挑战。饶有兴味的是,柏拉图假托苏格拉底之口对书写的指控,跟我们今天对AI之局限的认识在许多方面如出一辙:柏拉图认为冷冰冰的文字只能被阅读,无法与读者互动,正如AI能模拟语言,但不能参与生活形式,它的语言输出是伪参与,是一种语言的表面化表演;文字不能判断其读者的理解程度,并据此加以调整表达方式,同样,AI也不能理解语言的社会实践维度,它虽然可以跟提问者进行互动,但此时它是把提问者视为可预测的机制,是根据算法和数据来理解提问内容所体现的思维或情感;书写的知识是静态的,不能产生真正的智慧,只是存储和提醒,同样,AI没有内在性、时间性和意识流,不能独立思考,无法真正理解或推理,只能根据已有数据模式提供概率最优的回答,不能生成新的思想。

这样的比较,我们当然还可以继续列举。但是事情还有另一个方面。在我们前文所引用的柏拉图《斐德罗》文本,来自英国古典学者克里斯托弗·罗的英译。他在翻译希腊文“pharmakon”的时候,择取的英文词是“elixir”。德里达肯定不会同意如此翻译。“pharmakon”其实同时包含了灵药与毒药两层含义(我的译文即是如此处理),但选用了“elixir”(意指灵丹妙药)一词,就丢掉了毒药的意思了。德里达试图表明,书写既危害记忆,但同时也保存记忆。而且事实很明显,柏拉图在运用文字来批评书写的时候,却暴露了书写本身的不可替代性。换句话说,当柏拉图不得不采用书写形式来批判书写的时候,这似乎意味着他尽管认同苏格拉底的担忧,理解书写为人类带来的弊端,但毕竟在相当程度上还是认可书写本身的意义与价值。由此我们不妨有所推论:我们其实不能像圃者拒绝使用灌溉工具那样拒绝接受人类发明的技术手段,因为技术毕竟给我们带来了便利甚至福祉,而这实际上是文明进步的动力之源。同样,无论AI会对人类文明带来多大程度的毁灭性冲击,我们也无法鸵鸟主义地拒绝AI给我们的研究带来的福利。

如果我们不得不借重AI的巨大力量,让它为我们的文学研究提供服务,该如何想象人工智能与人类智能合作的可能前景呢?回答这个问题在精神实质上与其说是科学的,不如说是文学的。阿尔都塞很赞同黑格尔那句名言:“密涅瓦的猫头鹰总是在黄昏时才起飞。”他解释说:“哲学的变革总是对伟大科学发现的反响回应。因此,从根本上说,它们总是在事件发生之后才出现。”(Althusser, Louis. Lenin and Philosophy and Other Essays. Translated by Ben Brewster. Delhi: Aakar Books, 2006, p. 4.)我们其实并不知道AI的未来会发展到什么水平,也不了解未来的社会对AI接受的限度。既然历史尚未终结,而理论无法扮演现实指导者或未来算命师的角色,它谨守职分应该满足于回溯式反思,那么,我们现在能做的只是进行某些未必靠谱的推测甚至猜想。

从理想的角度来说,我们最好能够如庄子所言,做到“物物而不物于物” ,也就是能够有效地利用好AI这一重要工具,但与此同时保持自己的主体性,不被它的逻辑所左右。要做到这一点,可能首先依赖于我们具有非凡的提问能力。众所周知,提问能力是学术想象力的核心部分,它不仅是思维的起点,更是走向学术创新的根本途径。“学问”的概念本身就隐含了提问的重要性。苏格拉底的辩证法就意味着提问与回答的一连串对话过程;耶稣在12岁的时候,就能在圣殿里向拉比问出聪明的问题;屈原《天问》的激情172问,表达了他对宇宙天命和人世秩序的深刻怀疑。问题意识有可能会决定我们思考的方向、视角的选择、方法的确定甚至写作的风格。有洞见的问题,在AI提供的数据上,其实是找不到现成答案的。或者毋宁说,我们向AI发问往往是调取流行答案的一个过程。我们可以让AI帮助我们对我们所提出的问题进行学术史梳理(当然目前的大模型这个任务完成得还远谈不上令人满意,专业水平还有待提高);可以输入具有一定理解难度的文本,要求它为我们进行仔细地释读(在许多情况下,它在对某些理论文本乃至文学作品的细读方面颇具优势,能够映现出学界对此类文本研究所已达到的较高水平);甚至可以设定具体要求,指令AI为我们提供解决这一问题的可能思路(通常文从字顺、逻辑清晰、中规中矩,但观点平庸),如此等等。但所有这些,只是我们让AI为我们在浩如烟海的文献中打捞与我们的问题相关的资源或信息,或者,只是让我们了解我们的探索目标已经获得部分解决的进展度。简而言之,所有这些工作所获得的成效,对我们研究者而言,都意味着可以有所资取或摒弃的材料,因而等待我们对此有所超越。我们显然必须在问题意识的引导下,组织我们的论证架构,让AI的普泛的、碎片的、机械的和同质的知识星星变为专精的、集中的、有机的和独特的知识星丛。

但这说来容易做来难。首先,今天像ChatGPT或者Deep Seek这样的聊天机器人,尽管确实没有真正的推理能力,只能基于概率和已有知识生成答案,不能创新或自主思考,但是在许多方面已经具备了大大高于普通学者的高级智能。只要某种规则体系比较明确,它就能比大部分人运用得贴切、精准。举例来说,我们可以让Deep Seek根据拉康理论来重新解读《红楼梦》,你会发现它的批评分析严丝合缝,头头是道。同样,我们如果请ChatGPT用新批评的方法来分析李商隐的《重过圣女祠》,它的任务也会完成得相当完满。这是容易理解的:如果文本细读的程序是可以归纳的,如果理论的范式是清晰的,如果给定的文本是明确的,机器操作就非常的简单。这里文学文本就好比工厂的原料,研究方法就好比机器加工的步骤,如果材料俱足,机器没有故障没有断电,那么机器操作反而有胜出手工操作的高效和精准,正如英国早期工业化时期的纺织机战胜手工织布一样。

换个说法,这也许意味着AI的知识储备和运用规范的能力已经超越了大多数平庸的学者。胡应麟在比较李杜时有个说法:“李杜二家,其才本无优劣,但工部体裁明密,有法可寻;青莲兴会标举,非学可至。又唐人特长近体,青莲缺焉,故诗流习杜者众也。”(胡应麟《诗薮·外编卷四 唐下》,上海古籍出版社1979年版,190页)掌握法则最好的人是杜工部,他也被誉为诗圣,因为追随他的人最多。AI其实都是可能的伪诗圣,能把诗歌的平仄用典之类规则运用到极致,除了缺了点灵魂。把这种情况类推到文学研究上来,今天所面临的困境是,我们绝大部分人都不是李太白那样的天才。我们通常在做研究的时候,都是依仗得到公认的理论方法或通俗点来说学术套路来建立自己的分析视角。但当我们这样去做的时候,很可能无法超越AI提供的论点或答案。而且,我们学习和理解新知识的速度很难跟上AI。从理论上来说,任何具有创新性的研究成果一旦进入公共领域,其数据就瞬间会被AI所捕获并吸收,也就是说,其新意立刻就会作古:未来的韦伯、阿多诺或者德勒兹们刚刚炮制出新的理论观点,很快就会被AI转化成新的学术教条或运思程式,并允许用户们生成无限多的各种理论或应用文本。不仅如此,我们还可能被AI强大的、详尽的、丰富的各种论点或材料所吸引,一如笔者在篇首列举的ChatGPT提供的本文的诸多答案给我带来的体验一样;我们很难摆脱它给我们带来的巨大压力,并产生无法进行创新性思考的焦虑。这让我们非常容易产生强大的惰性,不愿艰苦地独立思考。

当然,我们可以暂时聊以告慰自己的是,我这里明显夸大了AI的能耐,其实AI目前在运用中普遍存在着幻觉,也就是大模型输出貌似合理其实虚假的内容。在认知对齐方面,也时时出现对人类意图的误判。在我们比较熟悉的专业领域里,我们会发现,它的反应往往十分业余。但我们对这些不足不必高兴太早,因为我们必须诚实地承认它发展的未来趋势。可以想象的是,AI一定会通过“检索增强生成”技术线路、增加微调和对抗性训练、引入外部工具和改进模型架构等手段来减少幻觉,强化意图对齐策略,使得AI的效能在未来得到系统性优化,尽管它永远无法克服这一它与生俱来的bug或弊端(语言模型本质上是“下一个词预测器”,训练的目标是预测哪个词最可能出现,而不是“说出最真实的东西”)。另一方面,我们用户自己也可以通过提升提示词技巧以及外部查验来核对其提供材料的真伪,从而让机器为自己在数据之海中捕捞更可信、更有价值的文献或思路。

但无论如何,无论语言模型的发展还是我们的运用,就这两者的可能性而言,一座越来越明显的分水岭将会浮出地表,我们的文学研究的历史有可能将会被划分为“前AI时代”与“AI时代”。是的,进入AI时代的人们,必须具备良好的数据素养,这也可能会让越来越多的文学研究者们改变自己的研究方法,例如转向莫莱蒂主义或数字人文。但更重要的是,未来文学研究人员队伍可能会萎缩,其结构可能会出现某种严重的失衡。我们可以想象存在着两极研究人员,一极是资质平平的大多数,他们更容易屈从于AI逻辑,容易变成循规蹈矩、缺乏灵气才情的我注六经式学究;另一极是能够驱使AI为自己服务的天才式的李白一样的人物,是六经注我式的伟大提问人,这当然也注定是罕见的极少数学术精英。就前者而言,我们不难想象中文系课堂学习或学术讨论中会出现的惨淡前景:老师在讲解什么是“反讽”,学生打开kimi,发现语言模型比老师讲得更加详尽;教授在学术大会上的主旨发言中比较(作为审美经验认识机制的)因明学概念“现量”与康德“审美直观”或梅洛-庞蒂“前概念经验”,而学生在豆包中查到相关信息后发现,该教授毫无新意。我的意思是说,我们绝大多数人并非天赋异禀的奇才,都会在知识层面输给AI。就后者而言,他更多依赖自己生活经验、社会轨迹的内在感知,依赖自己的沉浸式阅读体会与玄思妙想,依赖自己跟顶尖高手的交流互动,只有在这样的过程中,他才会产生“寂然凝虑,思接千载;悄焉动容,视通万里”的独创性神思,而此时,AI只是众多资源中的一种可以采用但也可以忽略的选择,他只会允许让AI成为自己的助手而不是其主宰。但这种想象中的文学研究大师在未来会强势存在么?

当然,任何时代都会出现天才和庸才的分野,但是在AI时代,这种分野锐化了。更明确地说,大语言模型破坏了文学研究(当然广义上来说整个人文学科也可能同样如此)的有机生态,它成为人类所有现存知识的储存者和代理人,切断了普通学者、优秀学者、高端学者、卓越学者和天才学者的金字塔式共同体链条的连续性,并以自己的高效不停地将最近获取的新知识无差别地转换成数据,由此捣毁天才赖以成长的文化生态和学术根基。我喜欢举的例子是唐诗的情况。唐诗的繁荣有赖于整个大唐帝国对诗歌的集体性迷恋,有李白、杜甫这样的一流诗人,有王维、杜牧这样的二流诗人,有刘长卿、韦应物这样的三流诗人,有曹邺、罗隐这样的四流诗人(我承认这种区分过于主观随意,不大严肃,主要是比照文学史留给他们的篇幅大小来划分其层次)等等,这是良性的差序格局和金字塔结构,每个诗人都会在其才性的引导下找到适合自己的位置。但到了AI时代,文学学者的文化生产空间还存在着如此错落有致的无穷多的可能性空间么?学者们之间的交流、借鉴、批评、共鸣等等,其重要性大大降低了,我们越来越多地面向单面的网络空间,这个空间里有无数的声音跟我们对话,这些声音看上去是人类发出,但实际上是机器自动发出的抽象的词元(token)流。这样的结果很可能是整个文学研究者的队伍大大萎缩。而皮之不存,毛将焉附?这也注定使得卓然不群的旷世英才难以涌现。

当然,也许AI时代的真正来临会带来传统天才观的失效,未来人类说不定更加推崇在搜索知识(而非经典研读)基础上加工而成的思想杂烩,人们可能更喜欢文学研究带来的快感舒适而非智慧的痛苦,可能把文学融化在电影、短剧、游戏或未来发明的任何刺激感官的文化实践中,仅把它当做甜点加以享受,而不再需要一位文学批评大师对他们指手画脚……这些,就不是我能预知的事了,且听后人分解。