回归结构主义,理解语言机器
语言的本质是什么?语言与计算之间究竟是怎样的关系?人文学界是否真的理解大语言模型的运作方式及其意义?近日,纽约大学德语系副教授、数字理论实验室主任莱夫·韦瑟比(Leif Weatherby)的《语言机器:文化人工智能与剩余人文主义的终结》(明尼苏达大学出版社,2025)出版。他认为,大语言模型实现了认知与语言、计算的分离,这一现象与早期结构主义理论相呼应。他试图让大家回归结构主义这一多年前的语言学-文学理论框架,来理解今日所处的世界。
韦瑟比发明了“剩余人文主义”一词,来描述当下的人机关系,主张我们应该积极、勇敢地重新思考人与技术的关系,而不是消极地退守到一个越来越小的“剩余”领地里,坚持一种脆弱的人类本质定义。
他指出,人文学界现在分为两大阵营,质疑人工智能的一方认为人类语言的本质是“说话者意图”,或认为语言即认知而非文字,大语言模型的输出与语言的内在认知法则毫无关联。正是抱有这样的观念,所以有了“机器能完成X,但人类能做得更优或更‘真实’”的逻辑。而全面拥抱人工智能的一方则已接受了机器优于人类的前提,只关心人类如何在超级智能时代生存。
在韦瑟比看来,双方都没有真正关注技术本身,并且都预设了一个不可逾越的人机鸿沟,这种思维反而阻碍了对语言本质的深入理解。
大语言模型的整个系统基于文本运行,语言传递所依赖的声音元素不复存在,我们面对的是纯粹文本符号(token)与特定数学方法的交互。这让韦瑟比自然而然地转向索绪尔以来的结构主义。他在一篇采访中(JHI blog)做了详细介绍。
结构主义将语言视为语言符号相互关联的完整体系。这一体系具有动态性,意义由整体系统而非单一“指称”决定。也就是说,系统并非由“岩石”“母亲”等指称堆砌而成的总和。意义是由系统内部关系决定的,系统衍生出语言的指称功能及其他局部功能。
大语言模型的训练方式与之高度相似:海量文本经预处理压缩为矩阵模型,查询时便从中采样。大语言模型实现了认知与语言、计算的分离。因此,结构主义语言观与大语言模型有一个核心共通点,即语言具有本体性,其动作独立于心理学、形而上学或逻辑学的范畴。结构主义也最透彻地阐释了语言非全然属人的特质。
韦瑟比同时指出,索绪尔的语言价值论与马克思的价值理论存在平行关联。词语的价值由其在整个语言矩阵中的位置决定——即“不存在实质内容”——这恰恰与马克思对价值与价格问题的思考方式一致。
当前写作、艺术与高等教育遭遇的“危机”,其根源正是人类难以区分大语言模型与人类的文本输出。而韦瑟比却说,这充分证明我们已在最本质层面捕捉了语言,证明了语言结构与数学结构有着更深层次的契合。并且,大语言模型让人类首次以量化的方式触及文化整体的分布,必将拓展我们观察真实文化系统运作的能力,而人工智能也终将具备文化属性。
韦瑟比相信,结构主义还有许多理论潜能有待发掘,如雅各布森、巴特乃至德里达对控制论的涉猎,就很值得进一步发展,以解释当下现实:如今,数字与文字在系统层面协同运作,无需明确的概念介入即可产生交互并输出成果。
韦瑟比称自己的新著是本“理论书”而非历史研究,旨在发展一种“剥离认知的语言与图像”的混合理论,整合文学理论、认知科学和数据科学。他希望能建立一个研究所有意义生成形式的“普遍诗学”。
他认为,这是人文学科回应人工智能挑战的世代机遇——数据科学已跨入人文领域,人文学者需要正面回应,而非躲在那些过时的术语背后。一个心照不宣的现实是,人文学者在“过去一两代人之前,已退出这类问题的严肃讨论”。


