用户登录投稿

中国作家协会主管

专访科幻作家陈楸帆:AIGC正在进行时
来源:中国科普作家协会(微信公众号) | 张子瑞  2023年06月25日07:55

导语

AIGC(人工智能生成内容)的创作风潮正在全球范围内蔓延,为广大创作者实现科幻想象提供了新的动力。为了深入探讨AIGC在科幻创作领域的影响,中国科幻研究中心AIGC赋能科幻影视产业研究课题组进行了一系列精彩的访谈。本期特邀中国更新代科幻作家陈楸帆作为嘉宾,他以其现实主义和新潮派的风格而闻名,被誉为“中国的威廉·吉布森”。

早在ChatGPT时代之前,陈楸帆就深度参与了多年的AI写作实践,对AIGC拥有独到的前沿视角和深刻洞察力。在本次访谈中,陈楸帆为我们带来了关于AIGC与科幻创作的精彩讨论。

AIGC创作历程

Q:您有6年人机协同的创作经历,可以说是深入体验了AI技术迭代的过程,请问您在这六年以来,使用过哪些AI技术?您对AI的使用情况发生了什么变化?

陈楸帆:我大概是在2017年开始做自己的语言模型。当时,谷歌刚发布《Attention is All You Need》这篇论文,推出了Transformer(即一种利用自注意力机制来提高模型训练速度的深度学习模型)深度学习架构。我们现在用的ChatGPT,其实是在这个架构基础上发展起来的。但那时候我们用的是2014年的CNN(Convolutional Neural Network,卷积神经网络)与LSTM(Long short-term memory,长短期记忆网络,是一种改进后的循环神经网络)这些算法模型,这是我跟王咏刚——我原来在谷歌的同事一起做的,当时他已经去了李开复创新工场AI研究院担任执行院长。他是科幻迷,也是科幻作者,听了我想跟AI共创的想法,也觉得非常有意思,就跟我一起合作,他主要来帮我去做代码方面的工程,我主要是给他一些我的语料。

我写过的文章涉及到微调的过程,这是关键的一步,因为文章的质量最终是根据人类的标准来评判的。我和王咏刚都有写作经验,在这方面我们对文学的理解比一般的纯技术工程师更深入一些。我们在这个领域做了很多工作,但文字理解并不是一项容易迁移的技能。也就是说,对于如何理解一首诗的问题,我们很难教别人像我自己一样欣赏诗歌。这实际上是人类特有的能力,这一点可以从微软小冰为什么写诗这个例子中看出来。但是小冰创作的诗往往有一种大众化、通俗易懂的,类似于汪国真的风格,这并非当代诗歌界普遍认可的风格。我认为这与在微调的过程中做决策的人的审美口味有关。

我用最终的模型生成一些写作文本。一开始,我会使用关键词、人称和简单的背景设定来指导它,它可以自动输出3-5段左右的文字。基于这个基础,我可以对其进行重新生成和编辑。我的主要工作是将这些内容融入到我自己的写作中,包括《人生算法》《恐惧机器》《出神状态》等作品,后面可能还会有几篇运用AI写作的作品。如果你读过这些作品,你会发现它们并不连贯,缺乏推理能力,人称和代词容易混淆。这是因为在那个阶段,模型规模较小,语料库也有限。实际上,我认为它的能力非常有限,它只能创作出一些带有特定风格感的段落,还不能称之为真正的写作。

在2020年,我们进行了一个更大规模的模型项目,该模型的参数量可能相当于GPT-2。我们参加了一个名为“AI科幻世界”的创新项目,这是由创新工场组织的人工智能训练营,参与者包括数百名与人工智能相关的大学生、研究生和博士生。他们组成团队进行各种项目,后来他们找到了我,邀请我加入,我觉得这非常有趣。

那时候是用所谓的大语言模型,再用科幻文类去进行微调,让它知道如何创作,让它在结构、情节、风格等方面与科幻类型更匹配。我们还开发了一些风格滤镜,例如刘慈欣风格、韩松风格等。我们也做了《共生纪》的活动,邀请了十几位科幻作家,如吴霜、王元等,也包括主流文学的小白老师参与到活动中,跟AI一起共创。后来我们还把内容放在知乎上,与网友互动和讨论,让读者猜测哪些是AI写的,哪些是人类写的。

我认为AI的进步非常快,可能相当于小学中高年级学生的写作水平,基本上一段文字里很难判断出哪部分是人写的,哪部分是机器写的,它已经达到基本通顺流畅的程度。当然可能在一些细节上还比较欠缺,在人称等方面还是会出错,但有时候也会出现令人拍案叫绝的句子。

后来2020年,我又尝试用它一起创作了一系列的短篇作品,包括《火星奥德赛》等,我会标明出哪部分是人,哪部分是机器创作的,最后给它一个署名,说这是由哪个模型创造的,这个模型背后的团队是哪个,也保留了对它背后知识产权的尊重。

从2022年开始,我就用Midjourney(AI绘画工具)、Sudowrite(AI写作工具)、GPT等AI工具。AI技术的进步非常神速。从GPT3到3.5其实是一个非常大的跨越,而ChartGPT则更加开放,让大众可以直接接触和互动。这样它的交互量很快就达到一个很高的数值,它的机器学习也进入了数据飞轮的状态。它不断地学习、再反馈,再自我强化的过程,就是RLHF(即从人类反馈中强化学习)的一种特性。

接下来我可能会经常使用AI工具,包括我下一本书的封面可能是用Midjourney(AI绘画工具)来做的,人类的设计师可能会在此基础上添加字体、做部分修改。日常里我一般会用ChatGPT帮我做例如回邮件、草拟发言、翻译、搜集资料、开展头脑风暴等工作。我觉得它可能会慢慢地变成日常工具的一部分,不会特意去强调它,但它已经融入到了我的创作中。

现在我觉得已经又到了另一个新的阶段。我们不能再像以前一样使用AI,因为它会涉及到很多问题,其一是法律方面,另一方面它倒逼我们去思考怎样提升人机协作的创造力。我们需要去从一个新的高度来思考这个问题。当它变成一个工具之后,可能慢慢地会像我们日常使用的word软件、微软电脑系统和键盘等等,不再是一种需要特地强调的存在。也有很多人会说,AI更强大之后会有一定的主体性。我觉得这一点也很值得探讨,这可能需要在后面继续展开,在相当长一段时间内这会变成一个需要反复讨论的问题。

人机协作初体验

Q:“人机协作”与“人人协作”有所不同,人与人之间有想法上的一些碰撞,能做出更好的结构上的设计,这种类型的协作是可以非常多元的。但目前AI所做的事情非常局限,只是能够辅助写作和校对,您希望AI能够更多帮助到您什么?

陈楸帆:对话式的、人与人之间的这种不同背景的交流碰撞与沟通,其实很容易产生火花。我们曾经与几位科学家、作家等一起去山里,开展几天研讨会,包括讲座等,还有一些禅修、打坐等集体活动。像这样的交流与互动是AI没有办法做到的。

我觉得AI可以在学习某位历史上的大师的所有文本之后,用大师的思维方式去与人沟通。比如说我想与阿瑟·克拉克聊一个创意,我想听听他对这个创意的一些想法,AI可以假装生成阿瑟·克拉克的思维方式,给我一些建议。这种对话的方式,会给人带来一些新的灵感。

但我觉得也有可能是我把一些材料“喂”给它之后,它把这些材料与我以往的一些写作进行交叉处理,再产生新的内容,它可以帮助我打破原来的写作惯性,产生出一些在题材、风格上都比较新的方向。它类似于文学经纪人的角色,可以帮我做规划,例如建议下一本书应该怎么写,提出建议尝试的市场方向和需要面向的读者群等等。

我觉得AI暂时还没有办法做到这些事情,因为这些事情涉及到太多外部的还未被数据化的信息,它涉及更复杂的决策。不过有很多事情它应该能做到,而且也会对作家而言比较有价值,不是单纯在辅助性写作这方面。

Q:AI能够提供更多关于科幻创作的灵感吗?

陈楸帆:我觉得它是可以的,包括我用Sudowrite(AI写作工具),它是专门为类型创作去微调的工具。它里面有很多细致的功能,比如,我要写某星球的某生物,它可以生成很多关于不同星球的不同生物的描述,包括世界观的设定、人物、技术、情节上的转折设置等等,它都可以很快地生成内容,并提供意见。它也能够在风格上提供帮助,比如输入一段你写的文字,它可以很快帮你把它变得诙谐幽默、或变得更严肃、或变得更接近某位特定作家的风格。所以我觉得这种工具还是挺强大的。

Q:您现在是否遇到了一些会限制您个人创作的技术障碍,又是怎么克服呢?

陈楸帆:我觉得倒不是技术障碍,我觉得大部分障碍可能是属于心理障碍,还有时间分配的障碍——这些可能是更大的障碍。我认为技术上不应该产生任何的障碍,不应该说没了技术我们就写不出来,相反,我认为技术越多可能反而会造成一种负担。有时候可能什么技术都没有,那就专注于自己的创作。有时候则会想着不断尝试各种技术,反而不一定能够完全把注意力集中到该去创作和表达的东西上。

Q:您在《AI未来进行式》一书中对互联网、金融、教育、医疗、军事等行业领域的AI发展情况进行了介绍和预测,至于在科幻产业方面,请问您认为AI会对科幻产业领域造成什么影响?

陈楸帆:我认为会有很大影响,比如我刚才提到,我下一本书的封面可能是用Midjourney(AI绘画工具)做的。儿童科幻作家杨鹏老师曾找我谈过,想看能否把他的小说通过AI快速地转化为漫画或绘本等。其实这是能够做到的,Controlnet(一种神经网络架构,可通过添加额外的条件来控制扩散模型,让AI出图更可控)、DragGAN(一款基于对抗网络技术的AI工具,允许用户通过几个点击和拖动来真实地修改图片)等新工具,都可以让我们高效做成这件事情。此外,还有Runway(AI创作工具,可以生成各种类型的艺术作品,包括图像、音乐、文本和视频等)等公司,可以帮我们快速地创作出风格化的影视作品,把实拍的真人场景即刻变成新海城或宫崎骏的动画风格。这种工具我觉得非常厉害,因为相当于自己就可以把所有的工作完成。创作者自身可以是编剧、摄影师、导演、特效师,甚至连配乐也可以用AI生成。原本可能需要一支专业团队才能做到的事情,现在一个人就可以用非常低的成本来实现所有效果。

未来每个人可能都有机会成为电影导演,去拍一部属于自己的大片,这一设想将有机会很快变为现实。在未来,每个人创作出来的内容也需要有相应的平台渠道去实现推广,并匹配相应的商业化机制,让它们变成一个可持续的行业。

AIGC的深度影响

Q:特德·姜在一篇文章中曾提到,“ChatGPT是一种对原件的有损压缩,不能用作原创作品,因为人的原创作品即使是拙劣的,但是伴随着无定形的不满,人能够意识到它所说的和实际想说的距离,这是重写时能够指导人的东西。而这个是人工智能生成文本时所缺乏的”。您怎么看待这个问题?

陈楸帆:那篇文章我也读过,他后面其实还写了好几篇。虽然他的观点有一定的道理,但我认为这并不是重点。因为我们人对所谓客观世界的认知实际上也是一个压缩的过程,曾有一篇论文提到“意识实质上是信息压缩的表征”的观点。我们人类通过压缩、变形和算法计算等方式,将外部世界的各种信号转化为可理解、可记忆和可交流的符号或脑电信号等。这是一个认识世界的过程,也是一个结构性的问题。并不是说人类与机器的本质性区别在于人类没有使用“信息压缩”,我们或许比机器压缩得更多,只不过当前的机器模型学习的只是语言。

在我们进行项目评议时,有一个项目需要超越语言的限制,它涉及视觉、听觉等方面,甚至可能在地球上建立一个感应层,该层可以收集不可见光谱范围之外、甚至是不同维度的信息,将其作为元数据用于训练模型。但是,这个模型应该如何定义呢?可以确定的是,这个模型肯定超越了人类中心的范畴,它涉及的数据可能是人类无法感知的,它不是所谓AI本质的局限性。所以特德·姜的说法我觉得其实不太成立,它只是一个时间的问题。

我认为AI就像一面镜子,它能够让我们更深入地思考“智能”与“理解”的本质是什么。当一个东西展现出类似于理解的行为时,是否就等同于它真正理解了呢?这是一个哲学性的问题。实际上,这个问题可以回溯到哲学家贝克莱的名言:存在即被感知。这些讨论触及到一些非常本质的话题,我觉得都非常值得思考。

Q:在乔姆斯基、斯蒂格勒等人文批判性学者看来,AI等数字技术让人类的心智与情感变得被操纵,是对人认知的愚蠢化,它不能带来真正的交流。而在许多创作者看来,AI是激发想象力和创造力的创作工具,您怎么看这两方面的不同态度?

陈楸帆:从人本主义的角度来看,这一观点当然是成立的。但我认为这不是从AI开始的,印刷术开始出现的时候,可能就存在着信息中心化的过程。再往前,比如绝地天通时代,每个人可能都有与神灵沟通、对话的能力与权力。但在绝地天通时代之后,可能这些权力都收归给神职人员了,只有一部分人拥有与神灵对话,解释、阐释他所传递的讯息的这种权力。所有的这些过程都是信息中心化、去中心化、再中心化的螺旋式的过程。

我们现在与古人相比,对世界有更深的理解了吗?还是说更远离了所谓的真实?我觉得这是一个挺有意思的话题。这里的理解不光指对外部世界的理解,还包括对自身的理解。因为人们现在的很多的认知,其实都是社会文化建构的结果,许多认知都是个体在接受教育、被社会化的过程中,被反复的告知并建立的。但这是否是每个人本应该拥有的样子呢?我觉得这些都很值得探讨。但是人文学家会觉得这是一个新的“他者”,但这个“他者”,我觉得不比其他的“他者”。假如秉持这一观点,那我们所有的以文字为承载物的媒介渠道,都会扭曲、过滤很多的东西,也会改变我们的很多价值观、理念等等。

我觉得这只是一个历史化的过程,关键是最后我们以什么为标杆。我觉得人处于不同社会形态里,它都是不同的。这当然很容易陷入一种文化相对主义的论调,但我认为,可能它只能在一个很小的范围内有效,因为这个浪潮是没有办法阻挡的。

事实上我们已经进入了一个与科技共生的时代,我们都是与人、与机器共生的身份(identity),或者说个体(entity),我们是一个复合的主体。比如我们在思考的过程中,很多时候这个过程会变成类似于“输入法”的存在,从这个角度来讲,输入法这样的技术,已经在无形中改变了人们输出语言的习惯。包括表情包,现在也非常深地嵌入到了我们的日常表达,甚至变成了一种对感知情感的数字化反映。这些实体的、抽象的理念,其实都已经远远超出我们原来所理解人类作为单一主体的幻觉,我们从来也不是单一的主体,我们体内还有那么多微生物,这些微生物可能也在影响着我们的感知、情感、思维。

所以,我觉得这些其实都是人本主义的幻觉,这个幻觉会不断被打破,人类的地位会被推向边缘。最终,我们可能只能以人类的主体去思考、去感知世界。我们肯定会挣扎,思考如何维持自身主体的中心地位。从更大的视角来看,这可能是不可避免的。

或许在我们有生之年,我们将目睹这样一个未来,人类被迫接受自己成为边缘物种的事实。有时候我还在设想,未来有一天AI可能会拥有让不同物种之间进行对话的能力,而人类却被排除在外。因为人类一直在破坏自然、破坏平衡,人类实际上是地球生态系统之外的罪犯,假如所有生物都不与人类交谈,动物和植物们自己愉快地沟通着,到那时候,人类才会意识到自己多么孤独。我认为这也是一个非常有趣的想象。

受访者简介:

科幻作家,现任中国作家协会科幻文学委员会副主任、中国科普作家协会副理事长。著有《荒潮》《人生算法》《AI未来进行式》《异化引擎》等。作品多次获得全球华语科幻星云奖、中国科幻银河奖、世界奇幻科幻翻译奖、茅盾新人奖等国内外奖项。

科幻作家,现任中国作家协会科幻文学委员会副主任、中国科普作家协会副理事长。著有《荒潮》《人生算法》《AI未来进行式》《异化引擎》等。作品多次获得全球华语科幻星云奖、中国科幻银河奖、世界奇幻科幻翻译奖、茅盾新人奖等国内外奖项。