用户登录投稿

中国作家协会主管

ChatGPT与新文科建设
来源:《中国社会科学文摘》 |  程广云  2023年10月07日09:15

从神学和经学的桎梏中解放出来,以自然科学研究范式为典范的人文社会科学研究范式,以哲学启蒙教育范式为中心的人文社会科学教育范式,可以称为“新文科1.0版”。当然,新文科的兴起不意味着旧文科的衰落,传统仍以改变了的形态继续存在。

ChatGPT对新文科建设的机遇与挑战

今天人类对于新技术的心态已经发生了新变化。当年恩格斯所称赞的马克思对科学技术进步的“衷心喜悦”已荡然无存。除了资本家或企业家因逐利动机而“乐观”其成之外,学者乃至公众大多笼罩在技术悲观论、技术恐惧论和技术末日论的心理阴影之中。

ChatGPT及其所代表的AIGC确实从根本上改变了我们的文本符号系统,使文科研究对象(领域)不仅包括人类生成的传统文本,而且包括AI生成的新文本;AI介入主体间的认知关系,在人际交往和对话中,叠加人机交往和对话,从而改变文科研究方法。这就是ChatGPT对新文科建设的机遇与挑战。正是针对这样一种情况,本文试图提出、分析、解决这样一个问题:到底是应该用现有学术规范和制度去阻挡最新技术进步,还是为技术进步而调整学术规范和制度呢?

ChatGPT与新文科学术规范建设

我们将学术规范描述为一种康德式的“直言律令”,即“应当”和“不应当”等,它有技术规范层面,也有道德规范层面。学术规范由此成为学术共同体得以维系的纽带,包括知识生产和再生产在技术层面、道德层面上的规范化。大体可以分为两类:一阶(技术)规范主要涉及成果评价,二阶(道德)规范主要涉及身份评价。二阶规范建立在一阶规范基础上。库恩将“范式”(paradigm)等同于“科学共同体”,称之为“专业基体”(disciprinary matrix),其中列举三种成分:符号概括、模型、范例。显然,这一概念存在着从自然科学移用于社会科学和人文科学的必要和可能。

在ChatGPT出现后,“创新/原创”含义发生根本改变:AI已经具备一定“创新/原创”能力。由此,人类创新/原创应该包含两层含义。(1)“创新/原创”是指一个人或n个人创造的知识成果领先于AI。我们将一定历史时期AI生成的知识成果叫作“机端知识”,将人类超出AI生成的知识成果叫作“人端知识”。人类创新/原创是指其成果的原创度/创新度高于AI水平,而非等于/低于AI水平。(2)“创新/原创”是指一个人或n个人创造的知识成果领先于其他人。这是其原有含义。

知识生产需要激励创新/原创,但是在知识生产、分配、交换、消费过程中,需要将绝大部分知识共享。共享知识可以被称为“常识”或“共识”。归根结底,打破知识垄断、共享全部知识是全人类/AI不可剥夺的权利。只是为了激励创新/原创,我们确立了保护知识产权(专利权、著作权等)的原则,分享其中的知识需要征得同意、注明来源,但这种权利也是受到限制的(譬如期限)。因此,强化现有学术规范中的引用注释原则,甚至连常识或共识引用都需要注明出处,追求“无一字无来历”的经学式或教条式效果是徒劳无益的学术形式主义。

随着ChatGPT问世,我们相信新的学术规范已经具备新的技术条件,给出新的算法。其中,笔者以为有两个基本步骤不可或缺。(1)“干货”测量。对于所测量的任意学术成果,首先测量其中的“干货”,即主要论点、支撑性论据和支撑性论证等,在确认其成立的前提下,测量其原创度/创新度(O/I),权重(w),人力、物力、财力、时间成本(C)等项指标。记为w[(O/I)/C]。(2)“水分”测量。测量其中的“水分”,即所有陈述、引用和举例等是否具有相关性,能否增强说服力和可读性等项指标。

ChatGPT与新文科学术制度建设

首先,既然基于ChatGPT的新文科学术规范突出了创新/原创的原则,那么,基于ChatGPT的新文科学术制度就必须围绕激励和保护创新/原创的原则来建设。w[(O/I)/C]是评价学术价值的根本标准。

其次,ChatGPT使得我们对于人—机知识分工有了崭新理解。按照经济合作与发展组织(OECD)曾经的分类标准,知识可以分成四类:Know—what即事实知识(“知其然”),Know—why即原理知识(“知其所以然”),Know—how即技能知识,Know—who即人际知识。前两类知识属于“编码化知识”,又称“归类知识”(“言传”型),亦即“信息”,较易于编码化(归类)和度量,人们可以通过理论学习——读书、听讲和查看数据库等(“言传”)获得;后两类以及其他各类知识属于“隐含经验类知识”,又称“沉默知识”(“意会”型),较难于编码化(归类)和度量,人们可以在实践中学习(“身教”)获得。原来我们以为,“编码化知识”可以通过人工智能加以掌握,在电脑及其网络中存储和流通;“隐含经验类知识”着重通过人类智能、人脑及其网络加以把握。人—机知识分工在于人们通过运用自身“隐含经验类知识”,使用机器存储和流通的“编码化知识”,并且力图将前者逐步转换为后者。但是我们现在发现,人工智能、电脑及其网络不仅可以掌握“编码化知识”,而且可以把握“隐含经验类知识”。这意味着,智能机器可能具有类人“心智”,可以像人一样“自由裁量”,而非机械地执行人类所设定的既定程序。因此,就像“硬指标”可以交给AI统计一样,“软指标”同样可以部分交给AI“自由裁量”。学术评价实现主体人机协同,从而可以更进一步消解学术评价中的人类主观偶然因素,确立更加公平和正义的学术制度。

基于ChatGPT的新文科特征

1. 研究对象(领域)引入AI所生成的新文本。以往文科的研究对象(领域)只是人类文本,现在叠加了AI文本,具体地说,我们面临三类文本:纯粹人类文本、纯粹AI文本、人类文本和AI文本的综合文本(综合程度不一)。这是前所未有的变革。虽然AI归根结底是人类创造的,但AI文本不等于人类文本。AI是在“学习”人类文本的基础上生成自己的新文本,不能排除某些AI文本具有一定的创新性和原创性。人类同时反向学习,每个人像学习其他人所创作的文本一样学习AI所生成的文本。

2. 研究方法引入人机交往和对话。以往文科的研究方法只是外在地运用AI作为辅助工具,现在应该更为内在地运用它,在创作文本时可以将其作为“助手”,或让AI独立从事低端文本创作(譬如写作具有特定格式和套路的文案),或让AI辅助从事高端文本创作(譬如查阅资料、初级翻译、初级写作、文字处理)。当然应该在特定场合(譬如考试)下限制人类对AI的应用(就像我们限制其他辅助工具一样),在这一问题上应该合理划界,界限以内是合法和正当的,界限以外是不合法和不正当的。

3. 改变了人类创新/原创的含义,将其定义为人类所创造的知识成果必须领先于AI。我们时代“创新”和“原创”的特有含义就是,一个人仅仅领先于其他人是不够的,还必须领先于AI。人类对于自己的创新和原创能力应该充分自信,即使AI代替人类的部分劳动、工作和行动,那也不是对人类的奴役,而是对人类的解放。排挤人类的只是人类自己,不是AI。

4. w[(O/I)/C]是评价学术价值的根本标准。我们需要确立一种科学算法,将原创度/创新度(O/I),权重(w),人力、物力、财力、时间成本(C)纳入学术成果评价指标中,避免在学术指标上的颠倒和混乱。按照我们现在学术评价体系,成本(C)不被当作分母,而被当作分子,以为投入成本(譬如项目资助)越多,成果绩效越高,这恰恰是一种颠倒;以为文字重复率与原创度或创新度(O/I)成反比关系,也是一种混淆。还有忽略了权重(w)的因素,其后果是文字垃圾成堆,加剧学术污染。

5. 学术评价主体实现人机协同。人机协同的根本是人作为学术立法者(在立法上AI当然可以作为辅助者),逐步提升AI作为学术执法者的地位和作用,降低人在作为学术执法者时的主观性和偶然性干扰。因为立法可以屏蔽特殊语境,使人在普遍语境中忘却私利,从而彰显公益。而执法则相反,AI更优。

最后应该指出的是,新文科2.0版因基于ChatGPT及其所代表的AIGC新技术而具有崭新特征,但这并不是弱化而是强化新文科1.0版的原有特征,这就是延续以自然科学研究范式为典范和以哲学启蒙教育范式为中心的人文社会科学研究和教育范式。