回归结构主义，理解语言机器--世界文坛--中国作家网

回归结构主义，理解语言机器

来源：文汇报　|　编译/黎文　　2026年03月01日10:35

语言的本质是什么？语言与计算之间究竟是怎样的关系？人文学界是否真的理解大语言模型的运作方式及其意义？近日，纽约大学德语系副教授、数字理论实验室主任莱夫·韦瑟比（Leif Weatherby）的《语言机器：文化人工智能与剩余人文主义的终结》（明尼苏达大学出版社，2025）出版。他认为，大语言模型实现了认知与语言、计算的分离，这一现象与早期结构主义理论相呼应。他试图让大家回归结构主义这一多年前的语言学-文学理论框架，来理解今日所处的世界。

韦瑟比发明了“剩余人文主义”一词，来描述当下的人机关系，主张我们应该积极、勇敢地重新思考人与技术的关系，而不是消极地退守到一个越来越小的“剩余”领地里，坚持一种脆弱的人类本质定义。

他指出，人文学界现在分为两大阵营，质疑人工智能的一方认为人类语言的本质是“说话者意图”，或认为语言即认知而非文字，大语言模型的输出与语言的内在认知法则毫无关联。正是抱有这样的观念，所以有了“机器能完成X，但人类能做得更优或更‘真实’”的逻辑。而全面拥抱人工智能的一方则已接受了机器优于人类的前提，只关心人类如何在超级智能时代生存。

在韦瑟比看来，双方都没有真正关注技术本身，并且都预设了一个不可逾越的人机鸿沟，这种思维反而阻碍了对语言本质的深入理解。

大语言模型的整个系统基于文本运行，语言传递所依赖的声音元素不复存在，我们面对的是纯粹文本符号（token）与特定数学方法的交互。这让韦瑟比自然而然地转向索绪尔以来的结构主义。他在一篇采访中（JHI blog）做了详细介绍。

结构主义将语言视为语言符号相互关联的完整体系。这一体系具有动态性，意义由整体系统而非单一“指称”决定。也就是说，系统并非由“岩石”“母亲”等指称堆砌而成的总和。意义是由系统内部关系决定的，系统衍生出语言的指称功能及其他局部功能。

大语言模型的训练方式与之高度相似：海量文本经预处理压缩为矩阵模型，查询时便从中采样。大语言模型实现了认知与语言、计算的分离。因此，结构主义语言观与大语言模型有一个核心共通点，即语言具有本体性，其动作独立于心理学、形而上学或逻辑学的范畴。结构主义也最透彻地阐释了语言非全然属人的特质。

韦瑟比同时指出，索绪尔的语言价值论与马克思的价值理论存在平行关联。词语的价值由其在整个语言矩阵中的位置决定——即“不存在实质内容”——这恰恰与马克思对价值与价格问题的思考方式一致。

当前写作、艺术与高等教育遭遇的“危机”，其根源正是人类难以区分大语言模型与人类的文本输出。而韦瑟比却说，这充分证明我们已在最本质层面捕捉了语言，证明了语言结构与数学结构有着更深层次的契合。并且，大语言模型让人类首次以量化的方式触及文化整体的分布，必将拓展我们观察真实文化系统运作的能力，而人工智能也终将具备文化属性。

韦瑟比相信，结构主义还有许多理论潜能有待发掘，如雅各布森、巴特乃至德里达对控制论的涉猎，就很值得进一步发展，以解释当下现实：如今，数字与文字在系统层面协同运作，无需明确的概念介入即可产生交互并输出成果。

韦瑟比称自己的新著是本“理论书”而非历史研究，旨在发展一种“剥离认知的语言与图像”的混合理论，整合文学理论、认知科学和数据科学。他希望能建立一个研究所有意义生成形式的“普遍诗学”。

他认为，这是人文学科回应人工智能挑战的世代机遇——数据科学已跨入人文领域，人文学者需要正面回应，而非躲在那些过时的术语背后。一个心照不宣的现实是，人文学者在“过去一两代人之前，已退出这类问题的严肃讨论”。