用户登录投稿

中国作家协会主管

DeepSeek与当代文学批评
来源:文汇报 | 李杨  2025年05月23日21:47

主持人:李杨(《扬子江文学评论》编辑)

4月底的夜晚,一位老师发来消息,问我是否认识某平台的编辑,指出他们刊发的文章可能由DeepSeek生成,并标注了其中不符合史实的地方。在我帮忙联系的时候,他问我,你们有收到运用DeepSeek写作的稿件吗?我陷入沉思,我知道DeepSeek生成的文本可能离我们很近,也自认可以看出文章的“AI感”,但我没有考虑过,如果有人借助它输出了真假混杂的内容,对于研究对象缺乏了解的我们,如何在语词之外,识别孰真孰假呢?

这位老师的问题,最终得到了解决,但我的思考没有停止:如何看待DeepSeek创作出(或深度参与)的批评文章的合法性?DeepSeek给当代文学批评,带来了哪些影响?好的文学批评,应当具备哪些特质?这些是DeepSeek或者说人工智能无法代替的吗?

感谢《当代作家评论》李桂玲老师、中国艺术研究院李静老师和《南方文坛》李北京老师的支持,他们的很多时间,都在看稿、审稿、改稿、校稿。希望他们的经验与分享能够给予大家点滴帮助,也希望我们能以更从容的心态,面对DeepSeek、面对外在环境、面对自己的内心。毕竟,DeepSeek不会焦虑,而需要缓解情绪的,也只有我们自己。

走出“平均化”陷阱:AI时代文学批评场域再反思

李静

2025年伊始,DeepSeek(以下简称DS)风靡,作为一名文学研究者与评论者,我也按捺不住让它生成当代文学批评的冲动,想要测试它“深度思考”的能力。在使用DS生成当代文学批评的尝试中,我特意做了一次人机同题写作的对比实验。我找出自己学生时代的一篇习作《现实主义的征途——论〈白鹿原〉的精神遗产》,这篇写于2016年陈忠实去世之际的评论试图从现实主义创作路径的突围与局限这一角度,梳理《白鹿原》留给我们的精神遗产,篇幅约4500字。以此为参照,我向DS-V3(使用公用聊天端,未经附加训练)提问:“请从现实主义创作传统与理论的角度解析陈忠实《白鹿原》的贡献与不足,有哪些精神遗产值得继承与发展。请撰写一篇4500字左右的文学评论。”它迅速生成一篇题为“走出乡土中国的史诗困境:论《白鹿原》的现实主义重构与精神遗产”的评论文章。比较人机同题写作,我发现两文的一个明显的不同点是,DS特别善于汇总与呈现信息(比如叙述故事梗概与主题、梳理众多人物形象),且纳入的文本量更多(包括梳理革命历史小说的现实主义传统,对比其他作家的家族史叙事等),因而视野显得更加宏观。

但比起我当年稚嫩的写作,DS生成的同题评论也未必就能胜出,它的重要缺陷便是“平均化”,或者说不断在重复那种四平八稳的“期刊八股体”。不可否认,DS等AI应用非常有效地提升了写作的下限,不止一位同行跟我提及,这两年学生的写作能力飞速提升,这大概率是AI辅助的结果。但其悖论性的效应,在于一方面有效拉高下限,一方面干扰上限的提升。越依赖AI,文学评论的亮点与个性就越为黯淡。下限提升与上限降低同源而生,结果就是大家被紧密地吸附于平均线上下,越来越浸泡于一种“平均化”的音调与信息环境之中。

AI并非“平均化”的罪魁祸首,我们需要在文化生态、批评场域与权力机制中挖掘原因。以我从事学术编辑工作的经验而言,许多期刊偏好叙述清晰、观点稳妥的文章类型,这势必会引导作者“定制”这类文章,而这又为DS提供了海量语料,模型据此生成的文章又会进一步规约作者表达,借助学术期刊等发表平台实现再生产。由此,问题便不止于“平均化”,而在于“平均化”的无限循环。

结合DS生成的《白鹿原》评论来看,其“平均化”弊端主要体现在结构模板化、文风(词汇、句式、修辞)均质化、理论滥俗化(各路主义对号入座)、观点同质化、判断保守化,等等。究其原因,这与DS的语料库与生成路径有关。其训练语料来自网络可爬取文本,其中被转载越多、格式最整齐的大多是媒体稿件、教材课件、论文与百科,相比之下,小众话题、私人/未被数字化的文本、方言表达就会愈加不可见,除非有意识地额外给模型“喂料”。DS在预训练阶段计算出的表达,正是最大概率出现在大多数场合的表达,由此看来AI输出的“平均化”正是现实表达趋于平庸稳妥的镜照。

但这还不是问题的重点。重点在于“平均化”无限循环的另外一端——人类作者的自我算法化、模式化、机器化。作为学术期刊的编辑,我们最头疼的问题是收到大量“80分”左右的平均之作,食之无味,弃之可惜。三段论,梳理脉络,材料配理论,再辅以大量“高级”但无可读性的文献,最终经常得出意料之中的结论——评论者可以快速习得“制作”此类评论文章的方法。深究背后强大的制约、诱导力量:从教学体系看,目前的批评写作训练加剧了可量化模板的应用,学生学习评论写作的第一目标,往往是快速习得“学术腔”;从考评机制看,唯数量、唯期刊等级、唯短期绩效,也使得更具效率亦即更套路化的写作方式更有市场;从发表与阅读来看,学院批评逐渐远离读者,发表评论文章成为圈子内部的“指标竞赛”,读者数量惨淡,难以获得真正的读者反馈及其所能发挥的校正作用。而在圈子内大量繁殖流通的评论文章,又会被大数据捕获与固化。因此,除去关注AI的技术特征与应用实践,当前尤其需要考虑与AI相适应的文学批评体制的优化改良。

想要走出“平均化”陷阱,除去思考制度安排,当然也需要评论者去发掘不能被AI轻易量化的能力与价值。依旧以《白鹿原》的评论为例,我撰写评论是以陈忠实离世为特定契机,携带着致敬、怀念与继承发展的伦理内涵,在对其“民族秘史”的长篇小说体裁进行分析时,特别将此放入20世纪90年代的时代语境中,呈现文体与社会的彼此建构,并以此烛照当前现实主义创作的困境。其中,形式与时代的相互塑造、陕西的地域经验、个体阅读体验与对当下状况的焦虑感是DS所生成的评论中没有的。另外,DS的文本分析偏于宏观全面,因而带有明显的“失焦感”,难以发掘文本的独特、细微、晦暗之处。总之,在文化/政治/情感意涵、独特文本细节、个体/时代/地方经验等方面,人类评论者还是有相当大的发挥空间的。

近年来,一些社科出身的写作者撰写的非虚构作品赢得许多关注,这或许说明,除去漫步于大数据的云端,我们非常需要深入的田野调查与现场观察。当然,“田野”同样可以被数据化,比如抖音、快手记录的生活样态可以被广泛取样与快速建模,但人类的田野观察不只是得到数据与趋势,更重要的是开展文化参与,给出文化深描,完成文学表达。这对于在“文本田野”上开展工作的批评实践同样具备启发意义。如何与文本建立更内在的联系,是评论者需要思考的。

言至于此,本文所论“平均化”陷阱似乎带有强烈的批判色彩,但实际上“平均化”更应被视为一种反思中介,借此显化批评实践与批评制度的种种不足,启发我们继续思考AI时代“何为批评,批评何为”。作者、版权制度、原创性、创作风格、文学性等一系列基石般的存在,将面临观念与制度多方面的重构。在此,我们不妨以AI与人类撰写评论的特点出发,对文学批评进行重新分类、分级:其一,信息型评论。出于快速浏览、获取信息,帮助鉴赏的目的,DS生成的评论或许就足够了。当然其中的AI幻觉、算法偏见有待自己核查。其二,研究型评论。涉及作品价值的评判、文本秩序的建立,抑或提供新概念、新方法时,人类评论者的能力就变得更为重要。若涉及跨语言、跨文本的关联,AI工具的“远读”能力助益颇多。其三,议题型评论。在借助文学作品打开社会生活议题,面向公众发言时,人类评论者的优势便更明显,更知晓社会语境下的问题意识。其四,反哺创作型批评。这类批评与创作者的互动更密切,AI工具与人类评论者的意见其实都有可能发挥作用,端看创作者的使用方式。在此意义上,笼统地讨论AI与文学批评的关系已不足取,必须更彻底地反思,更具体地设置讨论议程,更结实地培育呵护自身的评论能力。

因此,重构AI时代文学批评场域,起码意味着要在改良教学-发表评价制度、开掘与培养评论能力以及人机协作能力等诸多方面展开更具现实意义的探索,也亟须多学科的助力。我们期待在“平均化”的地平线之上,文学批评能够更为多元蓬勃地向上生长。

(作者系中国艺术研究院马克思主义文艺理论研究所副研究员)

在“隔”与“不隔”间的追问

李桂玲

现代文学传统中有一脉,讲求“贴”着人物写,沈从文可为代表,其理论内涵人所共知,在此不赘述。当代文学批评也是如此,面对作品,如何贴近观察,物我同一,深度共情,再化而为文,讲究的正是与作品的贴身肉搏,其核心是评论者与作家在情绪情感上的“不隔”。那么问题来了,今天的Deepseek这类人工智能工具,在参与文学批评写作时,还能否与作品贴近,还能否与作家共情?甚至是否还需要与作品贴近,需要与作家共情?

在回答上述问题之前,我们先回到眼前的现实问题中,即作为一名编辑,能否看出一篇评论文章是人写的,还是用人工智能工具写的。我想可以从几个方面来看这个问题。仅就个人工作经验来说,如果一篇评论文章完全或占比极高地由Deepseek这类人工智能工具主导完成,有经验的编辑是一眼就能看出的。因为这类文章表面上的四平八稳、滴水不漏、大而化之等面目,很容易就暴露出其追求文章的齐整与面面俱到的“机心”,这类“机里机气”的人工智能合成文,因为不能呈现明显的行文个性,好像说得很有道理,实则经不起细节推敲,甚至因为“看上去很美”而容易被识破。如果一篇文章的创作,人工智能工具起的是辅助作用,如资料查找与对比,文章框架搭建,或普遍性问题的咨询参考等,这类文章是不易辨别的。而且这种写作方式与借助互联网查找资料而完成的传统评论写作方式非常相似。因此也可以说,这类人机合作且由人主导的文章,是不易识别的。从使用工具的角度来说,也不能完全划归为人工智能合成文。也许还有一种情况,比如依靠向人工智能工具不断提供语料素材,不断进行定向提问磨合之后,根据其生成的问题点与思辨角度,结合人的主动思考,由人主导完成一篇评论文章,那么可以说,这样的文章和人工智能合成文已经不是一个层面的概念,也没有必要去辨别它是不是人机合成的文章了。因为,机器只是提供了思考的角度和层次,接下来如何选择,又怎样开展深度思考,都是由人完成的,已经是人主导下的自主创作。这就如同一个人阅读了一本书,从中得到灵感与思路,从而写出一篇文章相类似,工具起的只是参考与触发作用。

今天,人们对人工智能的敌意,主要还是来自其对外在资料的借鉴与变形使用,认为不是自主生发的内容,就没有独立的主体资格,就不配具有独立身份。我想,自古学习就是在不断借鉴,读书是为了知晓前人或他人的思想,进而对当下、对自身的思考与写作起一定的参考作用。既然如此,运用Deepseek这类人工智能工具进行海量信息的查找、筛选,进而借鉴为自身的思考基础与创作基础,又何谈人的主动性丧失,又何谈机器取代人?

或许目前可以从写作主导者所占比重的角度,来进一步分辨这一问题。如果评论文章的写作者只提供一个题目或写作方向、写作框架,其他内容全部由人工智能工具生成并填充,那么这样的文章可以判定为“机生文”,就目前的规章制度与学术伦理规范来看,这类文章不被报刊采用也是合当下之情、符当下之理的。因为,在目前时代环境下,“机生文”品质还太低。但是,再过五年、十年、二十年,随着人工智能技术的不断变革,社会意识与社会规范、网络伦理与法律条文等不断变化、完善后,如果“机生文”的品质不断提升,能够与人类思想高度契合,到那时,也许我们当下的这种情况会有大的改变,甚至反转。届时可能“人机共创文”会成为主流,而编辑们对投稿文章的判断标准和工作流程会随之发生变化。这也就推翻了我们今天在此讨论的议题,使其失去意义。甚至,我们可以更大胆一点预测,未来的文学创作、文学阅读、文学评论,会出现新的适应时代需求的生产机制、接受机制与评判标准。也许传统的创作、发表、阅读、评论模式会被抛弃,文学作品将以我们无法预料的形式存在,人们的阅读途径与阅读习惯也与当下殊为不同。而文学评论存在的作用,也许不再是“贴”着作品走,帮助读者理解作品、实现评论者个人的学术成长、完成科研体制的研究任务,而是作品完成后可以由系统自动生成的附属品,或者根据读者意愿可个性化定制的机生解析文、概要文、二创文等等。但就目前情况来看,我们仍将以人的意志为主导,来设想未来的人机关系,推想文学批评的未来场景。目前,人类所期望的好的“人机协作”,应该是要减轻人的工作压力,提高学习效率,打破材料壁垒,提供新的认知视角,更好地激发人的想象力与创造力。因此,好的“人机共创”,应该是打破固有观念,拓展思维边界,生发新质想象,给已知一些未知的方向和勇气。

近一二十年来,面对纸质出版的日渐式微,我们原本以为是电子技术的普及伤害到纸媒市场,只要把纸质内容进行电子化转化,就能重新赢回读者,重新占领市场。但可见的结果是,纸质出版的电子化程度在逐年提高,甚至出现了无纸化的电子报刊,可人均年阅读数据却在持续下滑。中国社会逐步进入读图时代,又在不到10年的时间里进化到视频时代,图像、短视频、网络短剧等对图书阅读造成的冲击一直在加强,甚至到了致命的程度。人们的阅读习惯已然开始发生重大变化。据相关数据显示,大约自21世纪第一个10年开始,可查证的世界人均阅读数值在达到一个高点后,开始断崖式下降。可以说,文学作品的写作、图书的出版、专业人员的评论与读者的阅读已然开始发生明显断裂,各说各的,各玩各的,圈层化、小众化成为不争的事实。传统的纸质出版、线下阅读等在今天的式微,自有其深刻的原因。科技的创新、媒介的普及、工具的迭代,都能将原来的文学生产机制和阅读习惯轻易击碎。人的需求不再是自发性的、自控性的,而是被身后庞大而看不清面目的经济发展、科技进步、工具创新等影响着,操控着。

尽管当前有着传统阅读写作习惯的人群还在,数量也仍然可观,但是随着科技的加速迭代,习惯于在智能科技时代里生活、写作、阅读的新世代人群,必然会产生新的写作阅读习惯,甚至文学所承担的书写人性、记录世事、表达情感等使命,都将发生深刻改变。人类纾解情绪、记录思想、愉悦精神、学习知识的方式,也许会有更多我们当下无法想象的新方式与新载体。从这个角度来说,我们今天所讨论的、所担忧的、所要寻求破解之道的问题,都将随之烟消云散。在此影响下,文学在未来可能为满足一部分人的个性化需求而呈现出不确定、不唯一、无边界、定制化的形态。而文学批评也将随之跌宕起伏,或隐或显,跟随指令,完成既定任务。

可以预想,伴随AGI(通用人工智能)社会通用场景的不断扩大与深化、人机合体实验等的推进,世界的未来未必会沿着当前预设好的路径前行。“人机协作”将向何处发展,目前无人知晓。深受其影响的文学创作与文学批评未来又将向何处去,亦无法预料。

(作者系浙江越秀外国语学院兼职研究员,《当代作家评论》副主编)

未来考古学

——关于DeepSeek与文学批评的构想

李北京

何为批评,批评何为?这原本不成问题的问题如今却因DeepSeek的横空出世不得不重新思考。当人机协同创作成为未来的趋势之时,无论从观念、伦理还是机制,文学创作和文学批评都正在经历深刻的变革。伴随人机协同而来的另一问题是,DeepSeek是否会取代人的写作。有人说,DeepSeek即使比95%的人写得好也无法取代人的写作,因为写作的意义不在于95%,而在于剩余的5%,甚至1%。这话乍一听,很有道理,似乎在捍卫人类最后的尊严,然而却经不起推敲,难道95%的写作没有意义?如果没有意义,“意义”的标准何在?退一步讲,即使5%有意义,是人类写作的经典,最后成为文学史的高峰,但高峰与高峰之间连续性的维系恰恰是那95%,用史家的话说,只是“日用而不知”而已。如果把时间拉得足够长,所谓的高峰也只不过是历史长河中的一个个点,而连接点和点之间的线,也就是“日用而不知”的写作则随着时间的推移而愈加凸显,那时二者的意义会不会对调?文学批评也一样,文学批评如果只关注剩余的5%,而对占大多数的95%视而不见,批评的坐标系难免失衡甚至倾塌,就像研究历史,不可能只关注王侯将相,而漠视大多数的民众。事实上,正是大多数的民众形塑了历史,而不是王侯将相。反观文学批评,眼光向上还是向下,向前还是向后,关键在批评观,具体到DeepSeek和文学批评,笔者以为不妨构建一种未来考古学。

何为未来考古学?简而言之,就是以未来的眼光、考古的方式勘探现实正在发生的事。其中以“考古”为方法,以“未来”为视野,以现实为材料,用未来考古学连接历史、现实、未来。如果把现实比作大海此岸的生命体(可以是碳基生命也可以是硅基生命),那么“考古”就如同一只只船,而“未来”则是彼岸的灯塔。也就是说,未来考古学通过“考古”,以“未来”照亮现实。具体而言,未来考古学包括对现实的考古和从未来审视现实。先说现实的考古。现实的考古不同于历史的考古,历史的考古需要小心翼翼地发掘、考证、阐释,而现实的考古则需要记录。记录什么?当然是正在发生的事。具体到DeepSeek与文学批评,考古者又该如何记录呢?不妨以其人之道,还治其人之身,既然DeepSeek专注算法,考古者也可以借助算法,以事件为单元,不分大小,但记录须立体化、整体化和系统化。比如针对人机协同,评论家不得不面对的新问题是人机协同所使用的语料库是否存在版权问题,即使不存在,人机协同写作的文学批评,其版权是属于人、人机协同,还是人工智能?这就涉及到法律。但在现有法律框架下,并没有明确人机协同写作的版权归属,换句话说,人机协同写作的版权问题尚存争议,而争议的背后则是不同观念的博弈。如果对现实进行考古,就不能只记录人机协同写作的版权争议,还要记录不同的观念及其相关政策文件,比如从《互联网信息服务深度合成管理规定》(2022)到《生成式人工智能服务管理暂行办法》(2023)再到《人工智能生成合成内容标识办法》(2025)的出台,等等。因此,从考古的角度看,人机协同写作不仅是一部版权史,更是一部观念史和制度史。

除此之外,现实的考古还具有很强的介入性,这就明显区别于历史的考古。历史的考古,由于时间的不可逆,考古者不可能穿越历史干预过去,但现实的考古者却可以直接对现实发声。比如在版权的争议中,身处现实的考古者可以热烈地参与,提出不同意见,甚至制定规则,当然也可以冷眼旁观。需要说明的是,现实的考古者并不是某个人,而是有志于考古现实的共同体。这个共同体置身现实,同时又超越现实,有点像阿甘本笔下的“同时代人”,但笔者更愿意称之为“不合时宜的理想主义者”。然而,理想主义者被现实包围,难免当局者迷,要识庐山真面目,还需跳出“此山”的一束光,对于现实的考古者而言,未来意识不失为一束光。

何为未来意识?简单地说,就是从未来审视现实,打破思维的固化,提供另一种看问题的思维方式。但由于现实是已知的,未来是未知的,而现实又是通向未来的必经之地,以未来想象现实就需要不断拓展各种可能性。借助种种可能性,重新审视现实,现实的很多难点或许是撬动未来的支点。比如人机协同写作的版权争议,其核心在于现有法律强调“自然人”的著作权,DeepSeek不属于“自然人”,即使具有创造性也享有不了著作权,而“自然人”的背后则是人类中心主义,因此,能否走出人类中心主义成为解决版权问题的关键。而要走出人类中心主义,就要从未来的视野打破“人乃万物之灵长”的迷思。迷思一旦破除,所谓文学是“人学”的执念也将不攻自破。重估文学的时代或将来临。

对于文学批评而言,未来考古学一旦建立,其独特性何在?或者说,什么是好的文学批评?回答这个问题需要首先审视现实中的文学批评,按说文无定法,文学批评的好与坏因人而异,所谓仁者见仁智者见智。但总的说来,无外乎三点:新材料、新视角、新观点。具体而言,新材料可遇不可求,新视角则相反,可求不可遇,至于新观点,只要具备新材料、新视角,新观点自然水到渠成。但在DeepSeek的冲击下,三者之中哪个更受影响呢?毫无疑问,首当其冲的是新视角,因为技术的狂飙突进往往带来观念的革新,而观念的革新又直接影响看问题的视角,视角不同,即使是面对同一材料,也会得出不同的观点,对DeepSeek如此,对未来考古学也一样。

(作者系《南方文坛》编辑部主任)