数智时代,我们需要什么样的语言规范?

“徐冰:引力剧场”展览海报
认识数智时代语言传播特征
语言规范问题长期成为公众关注热点,不是因为一直没有解决好,而是因为不同的时代都会面对新的问题。中华人民共和国成立初期面对的是方言分歧和共同语问题,改革开放初期面对的是新技术革命和自然语言处理问题,世纪之交面对的是外来概念和外语教学的冲击等问题。最近十几年来,互联网文化给传统的规范语言面貌带来了不小的改变,网络语言热议未退之际,数智时代的种种语言问题又接连涌现。一时间,网络语言问题、AI语言问题,以及新旧字音、词典释义等传统语言规范问题交织在一起,公众对语言问题的关注热度呈现出多点共生、交错起伏的局面。
这种形势下,值得思考的是:汉语母语者既是语言的使用者也是语言规范的维护者,如何化解语言创造力和规范性诉求之间的冲突?语言作为特殊的文化载体,既是学术研究的对象又是日常生活之必需,它的健康发展主要是语言工作者的责任还是语言使用者的义务?历史上汉语汉字随着民族的交融和书写媒介的改变发生过那么多次重大的变化,为什么人们对数智时代的语言问题产生如此大的担忧?
其实这种忧虑未必来自语言本身,更多的是文化形态的剧变在语言问题上的投射。互联网极大改变了千百年来的文化接受习惯,它使得原有远近疾徐之别的文化信息无差别地大量投放,也深刻改变了人们的语言接受习惯。一时间,家乡话和外乡话、日常话和标准语、民间话和官方话、俚俗语和文艺腔……各种传统意义上的两极对立都渐被打破。对语言规范化,似乎每个人心中都有一份自己的诉求,但每个人期待和把持的规范标准又很不相同,甚至是彼此对立的。
因此,如何看待数智时代的语言规范问题,需要从这一时代的传播特征去认识。
热议不断的网络流行语
先从网络流行语说起。古往今来每一个时代都有流行语,为什么唯独“网络流行语”得到了格外的热议?细究起来,“网言网语”还真跟历史上的流行语有着明显的不同。
人类进入互联网时代以前,很少有跨地域、跨领域、跨阶层的流行语,那时的流行语基本属于行业语或者方言土语。互联网打通了地方和领域之间的天然区隔,各种行业化、区域化乃至个人化的用语齐刷刷地展现在所有人面前,谁都是一种“扑面而来”的被动感,于是感到不适应、不接受的受众数量就前所未有地多。热衷于使用流行语的人群,跟反感、拒绝流行语的大众形成了天然的对立,网络流行语难以避免成为多数人视为另类的东西。
在这样的情形下,对网络流行语的自然筛选机制也就应运而生了。那些超越阶层、唤起更广泛时代共鸣的新说法,在互联互通网络环境中得以传播,成为时代语汇中鲜活跃动的因素;与此同时,那些小众化而有悖认知常情的新奇说法也层出不穷,始终活跃在特定群体中,持续干扰着大众的视线。这是互联网时代呈现出的与以往不同的新景观,“优胜”与“劣汰”都没有成为最主流的事实,观念与态度的冲突从未休止。
应该说,很多网络流行语以其形式的灵动、构想的新奇、触角的锐利和思维的深刻显示出独有的魅力,成为最前沿最有引领力的语言成分,也将在汉语语汇发展史上留下我们这个时代语言创造力的记录。据报道,刚刚问世的《现代汉语大词典》就收录了数十条新世纪的网络流行语。但毋庸讳言,网络上许多新兴的表达方式,或庄谐失当,或构形怪异,或趣味低俗,或裹挟恶意,不仅破坏了和谐健康的语言环境,更给“讲信修睦、亲仁善邻”的文化传统和社会氛围造成了严重的污染和损毁。
造成这种乱象的原因,首先是网络化传播方式,一改以往那种流水般的自然流布,代之以冲击力极强的“闪送”到位,对一般公众的接受能力是个很大的挑战。再者,过去的流行语不管是来自文人的创造还是公众的口头塑造,大都经过了一段时间的社会化的认同,也就是说,得到了较为广泛层次的公众认同。而网络流行语与此前的流行语不同的一个重要特点是,相当一批网络流行语起源于社会阅历并不丰富的青少年,尤其是生发于网络游戏和动漫等外来文化中,这些“热词热语”缺少社会生活的基础,因此就普遍带有一种与公众成熟意识之间的对抗性。这是不同于以往的新的特点,也是风险所在。如果说网络时代语言规范化有什么新特点的话,这种流行语的起源和传播方式是格外值得注意的。
这种特点带来的后果,一是语言习惯的冲突不可避免,二是错误意识的感染和蔓延。
语言规范需前置前移
传统的语言规范行动,倚仗权威媒体的统治性,噪音杂音压不过正统的声音,错误说法基本没有市场。自媒体时代,语言文字好像谁都可以平起平坐地发表看法,不管有没有基本的系统观点和历史文化常识,谁都可以针对一字一音提出理直气壮的质疑。这就提醒语言文字管理部门,不能再躺在旧有模式中循规蹈矩,不能总是让规范措施出现在把守的最后一关,而应主动前置前移,像中医倡导的“治未病”一样,把规范的闸口设置在最初的教育环节上。
既然规范化的语言文字是人们的共同追求,那么,合理的规范行为就应该先置于社会语言生活的前端。现代汉语已经有逾百年的历史,哪里有坑,哪里有雷,语言文字工作者心中有数。如果不善于利用现代媒介尤其是新媒体平台,以春风化雨的方式让公众接受规范的语言文字知识,错误和混乱一经形成,应对将是一件很难的事情。十年前连续举办了三年的《中国汉字听写大会》,对于社会各阶层人士熟习字形、规范写法、校准字音、了解字义,都有好处。像“冒”字的上头为什么那么写,“肺”的右半边跟“市”有什么不同,“蹚水”为什么不要写成“趟水”,“寒暄”为何不能写作“寒喧”,向公众进行了普及,同时还传播了“葳蕤”“翊赞”等好词。
地名的字音,在普通话里是应该按规范字音读,还是模仿方音的读法择选普通话里另外的字音读呢?地名“六安”要不要读如“路安”?“解州”要不要读如“亥州”?读古诗词遇到不押韵的情况,是否都需要用传说中的“叶音”方法,临时改个字音,以求谐和呢?这些问题,本来都有并不深奥的系统性学理摆在那儿,专家不出来讲,普通人不愿去查,任由奇谈怪论随处登场。这样造成的后果,不仅是知识被误解淹没,更重要的是,语言文字工作者放弃了一种应有的责任——培养公众问计于学理的习惯。移动互联时代没有沉默,没有空白,规范的缺位必然就是失范的蔓延。
语言规范不可固化语言创造
我们的文化生活被网络全覆盖已经有四分之一个世纪之久,却仍有不少人的思维停留在20世纪里,或者看见也不愿相信人正被技术牵着走。网络不仅改变了信息传递的速度,延伸和拓展了传播的渠道,也用它的方式和理念改变着我们的文化本身,悄然改变着我们的语言规范。
约10万年前,人类产生了语言,这是人类社会交际性的第一次飞跃;约5000年前,产生了文字,这是语言符号化的重大突破,实现了信息的跨时空保存;随着文学的发展、文教的昌盛,产生了文体成熟的书面语,这是规范化的语言表达形式,尤其是印刷术的推广,推动了文化传承与知识积累;到20世纪,媒体语言发展起来,人类语言进入了大众传播时代,相对于传统的文学性语言形式,它有更加标准化、高效传播信息的特点;20世纪末,网络语言兴起,这是数字时代的新兴表达,以简洁、创新、多模态融合为特色;2022年12月起,人类文化史上的全新事物——人工智能语言全面登场了,这是第一次非人类主体的语言生成,代表了技术与语言的深度融合。以生成式大语言模型(Large Language Models, LLMs)为代表的人工智能技术迅速发展,人类进入人工智能时代。
不少人文学者对此表达了忧虑,大语言模型会不会颠覆文学人数千年来一手创造的美文?会不会扼杀语言的创造力,泯灭语言的鲜活的灵魂?近两年,不少类似于“警惕人工智能对文学语言的侵蚀与固化”的话题不断见诸报端,有人说“作为文艺之基石的语言本身已经受到人工智能的侵袭,呈现出固化的倾向”,“人工智能不仅侵袭了文学语言,更产生了固化叙事语言的倾向,逐渐形成了具有某种程度的一致性的语言陈述状态”。这代表了大家对人工智能语言无序发展的担忧。从我们近两年来对人工智能语料的观察和梳理看,这也确实是已经发生的事实。如果对此不给予充分的重视,不及早行动起来,用学术的思维和技术的手段积极干预,我们的语言文化也许就会在我们这一代人的眼前悄然改变了面貌。
这难道只是一些忧天杞人的责任意识?或许是吧。我们看到更多的现实是:词典式和百科全书式的电子工具早已弃置一边,无人不在津津有味地与人工智能交流,人们更喜爱那几个会说人话的人工智能宝贝。由人工智能生成的长篇短篇,由于文从字顺,逻辑清晰,尺度合理,让使用者毫不挑剔它的语言。一时间,“语言规范”问题在人工智能生成文本到来之后似乎小了许多。更有人乐观地以为人工智能可以帮助我们推敲字句、校正文法,给我们匀出精力去经营文章的其他方面。殊不知当你越是对它陷入依赖,汉语的发展方向也许就已经失控。
语言文字不仅是文化的载体,更是文化本身。语言文化的价值不仅在于其规范,更在于它的精彩。千百年来,中国语言文化在不同的时代焕发出风格各异的光彩,都是先人智慧的创造。毋宁说,多姿多彩的华章一定程度上正是流播不畅的非网络时代的产物。每个作家发展着自己的积习,每种文体塑造着自己的风格,每个群体经营着自己的惯例。语言正是在不同的文体中实现着创造力,而文体正是人工智能的敌人。很多人说人工智能不能创造语言,那是因为它没有精准把握文体风格的能力。
语言毕竟是人的创造,语言的命运终究应该把握在人的手里。语言学家兰纳克说过:“人们能够容忍(并且常常预期)相当多的非规约性,这是语言使用的正常特征。”可见,试错和容错,是语言的生存和发展之道,如果人工智能把我们的语言工具带到了一个“无错”的境地,我们该感到庆幸还是悲哀呢?
语言规范,是一个说起来让人情绪复杂的概念。数智时代,老的语言规范问题有了新的变体,新的失范问题又层出不穷,而人工智能对人类语言带来的颠覆性的牵制,又给我们提出了更多全新的课题。不论如何,一份中华语言文化的责任感,都不允许我们顺水推舟。
(作者系中国社会科学院大学文学院教授)


