用户登录投稿

中国作家协会主管

在数字文明中点亮文学的精神灯塔 ——就“中国文学地图”相关情况访浙江省作协党组书记叶彤
来源:文艺报 | 康春华  2025年07月16日08:37

在日前举行的第三十一届北京国际图书博览会现场,中国新时代文学大数据中心研发的“中国文学地图”正式发布。本报记者就相关情况对浙江省作协党组书记叶彤进行了专访。

积极展示文学数字化前沿成果

记 者:请您介绍一下读者和观众对“中国文学地图”有哪些有趣的互动和反馈?这带来了怎样的启示?

叶 彤:在图博会现场,“中国文学地图”包括“文学西湖”数字化展项受到了许多观众的关注,大家感觉到特别震撼,非常惊喜。我们注意到不同类型观众的反应和关注点也是不同的。比如来自学术研究领域的人士,可能此前了解过我们的文化数字化案例,亲身体验“中国文学地图”依然倍感惊喜,认为这种文学的数字化应用未来有很大潜力。又如俄罗斯汉学家、圣彼得堡国立大学教授阿列克谢·罗季奥诺夫特别喜爱“中国文学地图”,详细询问了“每个点位是否都能查看详情”,得到肯定答复后称赞“真的很棒”。中科院地理资源所研究员楼惠新到现场详细了解了地图开发制作的全过程,表示“文学+地理”的应用模式可以融入地理科普,使产品内容更丰富。来自出版界的同仁大多希望学习借鉴、寻求合作,而大众游客则认为趣味互动有意思,乐在其中。大家的反应证明了“中国文学地图”在文化价值、技术应用与用户体验上的综合实力,是文化数字化“既叫好又叫座”的成功实践。

这次亮相图博会带给我们最重要的启发就是要更大胆地“走出来”,在更多优秀平台上展示文学数字化成果,与专家、同仁和观众进行交流,广泛听取各方意见,博采众长,努力把我们的文学数字化产品开发得更好,更受用户欢迎。

记 者:“中国文学地图”以标准中国地图为底图,将文学地标作为切入点,将作家、作品、文学活动等海量文学数据在中国地图上呈现,便于用户从地域视角在一屏之内纵览古今文学。“中国文学地图”这个创想最初是怎样诞生的?实施过程中有怎样的挑战?将文学有关的数据整合在一张数字地图之中,便于用户随时随地使用,对文学传播会有怎样的作用?对于建构与数字化相适应的文学发展格局有何启示?

叶 彤:这两年,在建设中国新时代文学大数据中心的过程中,浙江省作协始终按照中国作协提出的要求,在浙江省委宣传部的有力指导下,坚持高站位通盘谋划建设项目。我们对工作专班的要求是一定要有全局意识,要放眼全国乃至全世界。引用陆机《文赋》中“观古今于须臾,抚四海于一瞬”作为大数据中心的品牌理念,就是这个缘由。项目建设之初,工作专班到北京、陕西、天津、上海、江苏、内蒙古等地做了深入调研和学习,了解到了全国各地文学场馆之间存在着差异,也掌握了大家的需求。我们做了认真的研判,认为在数据库建设的基础上,通过将各地文学地标进行数字化集成的方式,由一个地标关联到作家、作品以及人文地理,由点及面地构建起中国文学的盛大图景是可行的。2024年1月,中国作协党组书记张宏森到浙江文学馆调研时提出了用数据展示“正在发生的文学”的要求,为我们指明了建设方向。由此,我们很快确定了“利用大数据进入中国文学现场,多维度展现当下中国文学全景”的建设理念,在开发过程中,除了集成文学地标,我们同时注重采集文学活动、核心文学期刊、新书出版、海外传播、文学热点事件等数据,使当下正在发生的文学动态与文学地图有效融合,从而产生了现在大家看到的活态的“中国文学地图”。

“中国文学地图”面临的最大挑战不是开发和实施,而是下一步的传播和使用。图博会结束后,“中国文学地图”受到的关注度大大提升,各界对于它的数据开源、应用落地、地标子展项开发等呼声很高。我们相信,这个产品对于提升大众对文学的关注度,增强文学场馆的公共服务能力,探讨人工智能时代文学数字化发展方向是有积极推动作用的。接下来,我们希望在中国作协的指导下,通过全国文学馆联盟和中国现代文学馆的引领,让各地、各馆都参与到内容的细化、数据的流通、子展项的开发中来,使之真正成为一张融通的、有用的、好玩的文学地图。这需要大家形成共识,协同推进。与此同时,我们也将本着“文化+科技”“文化+旅游”“文化+地理”的融合发展思路,进一步强化AI赋能,让它可以更便捷地为每一位受众服务。

为更多文学数字化产品“打样”

记 者:“中国文学地图”的数据在持续不断汇总和更新,具有鲜明的生长性。其中文学数据的筛选标准是怎样的?这与今年4月发布的《文学数据管理与应用总体要求》团体标准有怎样的关系?

叶 彤:“中国文学地图”是《文学数据管理与应用总体要求》团体标准发布后第一个严格按照这一标准执行的文学数字化产品,它给其他的产品“打了个样”。也就是说,如果全国各地的文学场馆都像“中国文学地图”一样对数据进行采集、存储、交换、分析和开发应用,那么大家各自开发的成果最后是可以无缝衔接的,数据是可以自由流动的,不会成为一个个“孤岛”。

以“文学西湖”数字化展项为例。我们把1148个地标分成了馆、景、迹三大类,然后针对“西湖”这个归类为“景”的地标开发了“文学西湖”数字化展项,采集了从古至今与西湖相关的200多位文学家的数据、11000多首古诗词以及现当代文学作品的数据,根据西湖的每一个景点相关的朝代、文学家的游线等进行了分析和归类,最后制作成可互动的应用。在此过程中,我们设定了数据条目、数据类型、互动方式等,都是可复制的。最后,这个应用使用了标准接口,它可以落地到使用同样接口的任何场馆。

在这里必须重点强调的是,“中国文学地图”上的每一个地标都可以像“文学西湖”数字化展项一样,单独拓宽为“文学+地理”“文学+旅游”的全景式数字化展项,然后挂载到一起,形成一个庞大的展示中国文学全景的动态地图,它的延展空间是巨大的,具有无限的想象空间。

《文学数据管理与应用总体要求》团体标准相当于给文学数字化铺了第一条“高速公路”。“中国文学地图”体现了标准的“全过程”要求,即“从数据采集到应用”形成闭环;展示了标准的“实操性”要求,在数据管理上明确重点文学数据采集方向和内容,规范格式、便于交互;突出了标准的“引领性”要求,能够推动文学数据应用场景落地,增强文学场馆活力。如果没有团体标准这条“高速公路”,大家有的跑国道,有的跑省道,有的跑山路,各自跑各自的,就难以形成一种标准化产品。

推动全国文学资源整合与有效利用

记 者:“中国文学地图”是基于中国新时代文学大数据中心的框架体系,秉持共建、共融、共享的发展理念研究推出的中国文学数字化产品。在创建过程中,它是如何体现标准、数据、平台、应用、安全五大体系协同推进的?未来如何实现其可持续发展?

叶 彤:中国新时代文学大数据中心的标准、数据、平台、应用、安全五大体系,是互相关联、互相依存同时又互相推进的:标准是规范,数据是基础,平台是保障,应用是目的,安全是前提。以“中国文学地图”为例,它首先是基于中国新时代文学大数据中心开发的“全国基础文学数据库”,在这个数据库中有相关的文学地标、古诗词等可以使用,我们在开发具体应用的时候,其实只要根据需求来考虑让这些数据流向何方,然后如何进行管理。所以,五大体系可以为所有数字化应用的开发和运维提供支撑,并推动全国文学资源的整合和有效使用。

“中国文学地图”和全国首个文学智能体、“馆际通”平台一样,是在中国新时代文学大数据中心上“生长”出来的成果。所有这些应用的可持续发展,均依赖于中心的可持续发展,现在中心的整体框架已经搭建好了,基础设施已基本完善,下一步准备做好以下几个方面的工作:

一是夯实基础、发挥优势。不断提升优化数据库和综合服务平台,特别是强化AI赋能,持续增强平台的服务能力和应用开发水平。充分发挥已有的平台和技术优势,在建设开发中更加聚焦“正在发生的文学”,进一步凸显中心在呈现文学现场上的作用;更加聚焦文学数据活化利用,用好用足“中国文学地图”等成果。二是理顺机制、融通数据。依托全国文学馆联盟,持续完善文学数据流入机制、数据版权保护机制、应用成果分享机制等,在现有成果的基础上实现全国文学场馆的“一键融通”,加快构建“数字共同体”。三是协同推进、合作共建。我们期望在中国作协的指导下,结合国内文学场馆的合作共建需求,在中国现代文学馆和浙江文学馆合作基础上,适时组建中国新时代文学大数据中心的分中心,逐步形成东西南北中的格局,合力推动各项建设成果在全国层面的普及应用,更好地服务全国的文学爱好者和社会公众。

众人拾柴火焰高,唯有大家都参与进来,中国新时代文学大数据中心才能越发彰显出它的价值。

多方共建,协同培育新质生产力

记 者:结合这一系列实践经验,您认为“文化+科技”“文学+人工智能”“文学+大数据”如何切实有效推动新时代文学事业在数字化浪潮中蓬勃发展?这给培育文学新质生产力带来哪些新的课题?

叶 彤:在风起云涌的数字化浪潮中,我们所做的文学数字化工作只是微小的尝试。但是,总体方向是明确的,我们的步伐也是坚定的。在数字化时代,文学如果不拥抱变化,不拥抱人工智能等新技术,很难想象它将如何满足新时代读者、观众的需求。推进中国新时代文学大数据中心建设过程中,取得了一定的成效,也形成了几方面的共识:

一是必须紧紧围绕“文学”这个核心。从元宇宙到人工智能,从AR/VR到大模型,技术手段和应用方式迭代更新很快,但是一旦偏离了文学和文字,所有应用就成了空中楼阁。所以,无论是数字体验厅的建设,还是大模型的开发,我们都立足于作家作品,立足于文学史,围绕文学本身去开发应用、设置互动,让文学成为大数据中心的“魂”。

二是必须紧紧围绕“数据”这个基础。随着大模型和人工智能的不断进化,数据的重要性越来越凸显,高质量、高纯度的文学数据尤其显现出它的独特价值,对将来的文学研究、辅助创作、语义生成等将起到至关重要的作用。两年来中心不遗余力地推进文学数据的标准编制,积极建设一系列小而美、小而精的文学数据库,并持续训练文学垂类大模型,就是为了构建起一个能支撑中心可持续发展的文学底座。

三是必须紧紧围绕“服务”这个目的。我们所有的数字化项目都强调要让数据活起来、跑起来,在开发应用的过程中要求各个系统之间数据要融通,最终都指向要让数据服务于作家、服务于受众,让文学以更直接、更便捷的方式与老百姓产生关联,从而赋能全民文学素养的提升。同时,数字化应用打破了地域限制,从而有效提高文学作品的传播效率和覆盖面,甚至可以促使中国文学作品更便捷地走向世界,促进中外文学交流。

中国新时代文学大数据中心的实践表明,“文学+科技”不是简单的技术叠加,而是通过数据要素激活文学价值、通过智能工具拓展创作边界、通过数字场景重构文化体验的深刻变革。在文学新质生产力的培育方面,它可以延伸和拓展的面非常多,尤其是在辅助创作与创意激发、智能化文学教育、文学研究批评、跨媒介文学表达和展示、文学数据产业化等领域都将带来新的课题,值得深入探讨和研究。核心在于把握三对关系:人机协同中坚守人文主体性,避免文学沦为算法的附庸;技术应用与伦理约束并重,让创新行进在正确轨道上;此外还要注意数据开放与版权保护的平衡。

记 者:您认为,在数字化浪潮中,文学界应当在哪些方面增强主动性,积极推进实施国家文化数字化战略?

叶 彤:接下来,我们还将继续秉持“共建、共融、共享”理念,在中国作协和浙江省委宣传部的指导下,以标准为基、技术为翼、内容为核,联动各级文学领域相关单位,持续推进文学数字化工作。一是构建标准化数据体系,破除“孤岛效应”。通过推广标准,推动文学资源跨平台互通,同时筛选适用性强、技术引领的核心标准,加速团体标准向国家标准、行业标准转化。二是打造智能化平台生态,赋能全链条服务。推广“馆际通”模式,实现数据所有权与使用权分离,支持跨地域资源共享,降低数字化建设成本,开发更多沉浸式体验场景。三是革新创作与传播机制,培育新质生产力。推动人机协同创作、构建IP全产业链开发体系、拓展国际传播路径等领域的创新。四是完善保障机制,夯实可持续发展基础。特别是强化技术支撑与人才培育,构建安全与伦理治理框架。在数据安全与伦理约束下,通过产学研协同培育新质生产力。唯有如此,方能在数字文明中点亮文学的精神灯塔。