用户登录

中国作家协会主管

香港书展首日谈网络文学和大数据:大IP靠概率

来源:澎湃新闻 | 臧继贤  2016年07月22日12:30

第27届香港书展已于7月20日开幕,作为近几年香港书展的一个传统项目,书展首日都会邀请嘉宾在“国际出版论坛”上就某个出版业的话题进行探讨。今年的论坛以网络文学和大数据挖掘作为切入点,来探讨如何重新定义阅读以及传统出版业应该如何利用大数据来寻求出路的问题。此次邀请的嘉宾是起点中文网的创始人之一、阅文集团副总裁罗立和云图科学计算股份有限公司首席数据科学家、中国人民大学商学院教授周庭锐。

在演讲中,记者发现,两位嘉宾都受过良好的传统教育,都对阅读的文字水准有一定的要求,但他们却没有用同样的眼光去要求现在的阅读市场,而是懂得在一定程度上顺应潮流。

罗立讲到他知道要是推出一本自己喜欢的书,那肯定必死无疑,因为大多数人都不会喜欢,但相反的是,一部文字很差的小说可能具有庞大的受众。他认为自己所在的阅文集团虽然同样产生文学作品,但却和传统的出版行业大大不同,“大IP不是编辑选出来的,而是用户决定的。”

而相似的是,周庭锐小时候接受过几年私塾教育,有时候扎在书堆里十几个小时都不出来,在学校里一个星期能至少读完三本书,深知主题阅读和深度阅读的重要性,但现在也不得不受到碎片化阅读的影响。他预见碎片化阅读很难创造社会精英,却认为这个世界的潮流不可阻挡,出版业也必须面对和适应这样的潮流。

他们基于自身专业领域,发表了对于阅读市场和出版行业走向的看法。

小说最可能出现大IP:因为写作的成本最低

从罗立在演讲中给出的公开数据来看,网络文学是IP产业的首要环节。“2014年到2015年,有30部电影作品是由网络文学改编而来的,创造了130亿的票房价值。而截至今年7月,由网络文学改编的电视剧已有96部、网络剧有136部、电影为42部,增长是非常迅猛的。”

文化公司为什么那么热衷于改编网络小说?而不是电影、舞台剧等等。在罗立看来,这是因为网络小说有一个其他文化产业不具备的优势。“小说是最容易写的,也就是说写作小说的成本是最低的。”

同做游戏、拍电影、做动漫比较,写作的成本最低,只需一部手机或者一台电脑,作者付出的只是劳动力和智慧。

“我以前是做漫画编辑的,当时做一部漫画,可能让画家画半年,最后发现作品不行,只能说对不起,换一部重新画。这个时候已经付出了六个月的时间成本、人力成本,而且画漫画的材料成本也不低。”

但是对于网络小说来说,作者写了一两个月,发现读者不喜欢,他可以马上不写了,给出一个结尾,或者干脆不写了,重新写一部新的作品,这样一年可以尝试六次。

“而且互联网行业没有说编辑不看重某个画家或者作者,他就没机会了,而是只要作者愿意写,他就可以写新的东西。机会成本和人工成本都是最低的。但是因为作品数量庞大,所以在整个IP行业中来说,小说是最可能出现大IP的。”

罗立认为,网络文学和传统的出版行业不一样,传统的编辑看到文不通字不顺的文章直接会仍向废纸篓,看到脸都画不正的漫画可能会直接撕掉。“但对于互联网出版来说,这些东西全部都被打破,基本上像我这样的人喜欢看的小说,如果推出市场,那么就算宣布了这部作品的死亡,因为几乎没人会喜欢。”

大IP不是编辑决定的,而是靠“概率论”

罗立在发言中几次强调虽然同样是产出文字,但自己并不是在出版行业。在他看来,网络文学的运作和传统的出版业有着很大不同。

“有人问我们有那么多好的IP, 编辑是怎么挑出来的。我的回答是:第一,我们的编辑不是专业人士;第二,教不了别人写小说;第三,也很少和作者交流写小说。但别人都说不信。”

不同于传统的文化公司需要靠非常有经验的老编辑才能培养出一个比较厉害的作者来,对于互联网公司来说,到底能不能出好的IP靠的是一个数学名词,叫做“概率论”。

“如果今年市场上有30部作品是不错的——按照我们的经验来说,当我们有一万个作者的时候,就会有一部不错的作品出来,所以今年计划出30部作品,那么我们要有30万个作者来做保证。编辑部最重要的工作就是让更多的人成为作者。当作者越多,作品越多,自然有好的作品。”

“这其中可能有各种巧合,有的人是写作有提高,有的人本来就是天才,但任何巧合都有一定的概率,只要作者够多,自然有好的作品。”

用户看重故事,而不是作者的文学修养

罗立发现,网络阅读有一个很明显的趋势是年轻化。对一个作家来说,有很好的文学修养对于长久保持创作和走上成功之路来说是很重要的,“但对于很多成功的网络作家来说,文学修养恰恰不是最重要的素质。用户最看重故事,而不是文学的素养和能力。”

“其实,编辑认为好的作品和读者认为好的作品根本就不是同一个。如果总是纠结传统意义上对好作品的定义,那最终就会错失那些会让你很成功的作品。”

“我们一直是新锐写作的受益者。2002年到2006年之间,有一件事情让起点中文网最终甩掉所有的对手:当时网络上有一本小说,写作水平就是小学生作文的程度——那时网络文学还是有些文艺倾向的,所以这本书被认为还达不到录入网络文学的要求。但有一堆这样的‘小白’作者都会支持他,觉得这样的作品很好看。当时这部作品被原来收录的网站删除后,我们却将他的作品放在主页,粉丝都过来支持他,所以三个月内我们的流量翻了一倍。”

“其实我们并不觉得他写得真的很好,但如果年轻的网络用户把阅读当作一种休闲的娱乐方式,虽然他们和普通的文学爱好者一样喜欢文字,但可能要求没那么高。”

“同时,越是年轻人越会挑战权威,当权威宣布一部作品不行,他们就会去支持。所以一定不能和用户对着干,不能给自己设定一个框架,去主观判断什么是好的、什么是坏的作品。”

罗立说,阅文集团的编辑一直在更新,资深编辑负责对作品的整体进行把握,保证不要出大的问题,而更多的事情是交给年轻编辑来做,因为他们和读者的距离是比较接近的。罗立坦言自己已是团队中的老人,“年纪大一点的编辑可以尝试去理解什么样的东西是年轻人喜欢的,但这还是臆想出来的,可年轻人却是这些内容最直接的用户。”

在罗立阐述完自己的观点后,有读者询问阅文集团的读者学历是不是文化水平低。罗立回答称,读者基本上是本科文凭以下,但不能说文化水平比较低,不然也不会来看书了。但不可否认的是读者比较单一,和中国的影视剧人群和游戏人群是相符合的。

香港城市大学出版社副社长陈家扬在听完罗立的演讲后提到,网络文学在其他的国家和地区都比较少见,在互联网行业变化莫测的情况下,阅文集团的这种商业模式在五年之后会是怎样的。罗立表示一个行业在最开始的时候肯定是有些野蛮生长,但后来慢慢会对创作的标准要求更多、更高。

出版社要面对不可避免的碎片化阅读方式

在周庭锐看来,现在出版行业面临的挑战与人们阅读习惯的改变有关。他称自己小时候受过几年传统的私塾教育,读过没有断句的古文,“句读式的阅读让人的专注力都在文字上面,将全部的内容做深刻的理解。”

“我们过去还有一个阅读习惯是将一本书从头读到尾,我以前一个星期至少读完三本书。这样系统的阅读很容易让一个人成为某个领域的专家,而形成知识结构是过去人们读书的结果。”

但现在小朋友是怎么读书的?数学很差,就买本数学的漫画;用搜索引擎进行搜索,出现的全是超链接,一个个点下去,最后都不知道自己要搜索的东西是什么。这种学习是非常碎片化的。“碎片化的学习对于某些人来说是有用的,但和创造社会精英是两码事。”周庭锐称不想批判碎片化阅读,但这却是一个事实。

在周庭锐看来,站在营销的角度,阅文集团的做法是正确的,他们的产品满足了用户的需求。但他和团队对几代人研究下来,发现碎片化阅读程度越高的一代,联想力有可能是更高的,可当需要真正专注某项具体的工作时,就会产生无力感。

“不过作为图书出版行业,必须要承认这样一个事实,出版物的受众正在发生变化。”

“10年、30年之后,读者都是碎片化阅读的产物,都具有一个发散型的大脑,要怎么应对?这个世界的潮流是很难抗拒和阻挡的。”

用大数据来找到阅读的细分市场

周庭锐认为阅文定位的用户是很精准的。阅文的用户有1亿,但也只代表了一部分受众,中国有14亿人口,相应的阅读市场也很大。香港地区就有800万人口的市场,台湾地区也号称有2000万的市场,周庭锐在这里插了一句:“但是香港阅读市场的细分更容易,因为台湾地区的读者分类呈碎片化,有些受众少到无法成规模。”

在周庭锐看来,其他出版后继者应该积极观察还没有被阅文所“侵占”的人口中,是否还有更细分的市场?“其实剩下的可能细分市场时很难让阅文的‘魔爪’伸进去的。”

出版业过去也曾用一些方法进行改变,但都不太成功。比如他在台湾的一位朋友试图将系统化的东西解构成碎片化的东西,即知识点和段落,之后放在网上的数据库里(用各种方式防止盗版,但是太难了),可以让读者随意组合他们想看的内容,印书成册,带回家慢慢看。但最后因为各种原因还是失败了。也有多媒体式的出版,类似有声书,但也没有办法为出版业带来真正的好转。还有用出版作为幌子来套利的,“以前在台湾有一本推送股市小道消息的财经周刊,写手背后多少都和券商有关,而他们写稿对股市有一定的引导作用。但从截稿到印刷出来再到上架至少要三天的时间,出版社可以第一时间知道要炒作哪只股票,可以圈很多钱。”

“而现在,如果将阅文集团的众多用户数据进行数据挖掘之后,就会产生很多关键词,这样就可以指导作者该写什么,不该写什么。”

通过“爬虫”可以从数据中知道作者的情绪,可以把读过的文章转换为渔网结构,还可以看出读者阅读的文章分几类,都在讨论什么话题,也可以知道哪些读者对某个议题感兴趣。

由于时间关系,周庭锐并未能详细阐述如何将大数据用于出版业,但举出了几个可以借鉴的例证:

一,可以利用摄像头的数据对书店进行热点分析,知道消费者喜欢哪一类图书,哪个书架有更多的人在流动。这个方法已经在一家百货公司中获得一定成效,仅稍稍挪动了一个货架的位置,营业额就获得了5%的提升。

二,在文章中放入侦测脚本,可以知道什么人在什么时间都在看什么内容。“在台湾有个自媒体公司,定位的对象是大学本科和研究生以上学历的人群,和阅文集团的受众不太一样。而通过一个实验,对四个月内用户阅读的文字内容进行数据发掘,就可以知道他们的性别、年龄和职业等信息,和真实情况相比,最差的也估计出了78%。”

三,豆瓣读书的受众可能和网络文学的受众很不一样,但豆瓣产生这样的文字和选择行为对于出版业来说有很大的指导意义。

四,不久的将来可能还会看到具有写作风格的机器人,例如具有金庸风格的写作机器人,这也可以用大数据的方式实现。