大数据如何改变出版业?

08.10.2014  12:14
  前不久刚刚落下帷幕的北京国际图书博览会上,中国知网明确提出了“大数据出版”口号。在过去,我们习惯将中国知网视为一个提供学术文献、学位论文、报纸年鉴等资源的检索、阅读和下载平台。中国知网则在近两年,逐渐为自身的定位增添了“数字出版平台”的概念。一方面,不难发现技术公司以数字出版为名开始渗入出版社的阵地和领域。另一方面,则可以看出“大数据”的理念日趋成熟,将有望改变传统出版的面貌。而“大数据如何改变出版业”也成为了一道充满启发性的问题。
  出版机构如何去整理、分析、利用他们在每一过程中遇到的海量信息并从中获利?他们如何利用这些信息更好地去认识和理解读者和客户?又该如何利用这些信息将书籍中的全部内容以更小的单位重新编目,使其变得比整本书时更容易搜索和获取呢?特此,中国出版传媒商报记者联系到多位出版机构的负责人,从出版、营销以及跨界等角度探索了大数据已经产生或即将产生的影响,希望给更多的有识之士以启发和借鉴。
   大数据如何改变出版内容?
  记者在与一些出版机构负责人交流时感触颇深,不少同道对大数据的理解尚存在偏差。数字化和数据化,是两个完全不同的概念。一个最明显的例子:比如将纸质图书扫描制成电子版,这个过程即数字化;而数据化则是将图书的文字、图片、表格等元素提取出来,作为“数据”的形式存放或应用。所以说,大数据对出版业的影响,重点在于数据化如何改变出版,而不仅是数字化如何改变出版。
  中国知网所标榜的“大数据出版”正属于后者,将自身或出版机构的内容资源碎片化、数据化,在此基础上将其加工成不可切分的知识元,形成网络化的知识元块,该公司推出的《中国知识资源总库》就是这样的产品。据了解,此次中国知网在图博会上带来“大数据出版”的服务理念,一方面是希望为出版机构优化选题、组织内容、按需投送提供基于大数据预测与分析的精准营销,并依托其基于“大数据出版”的国际营销平台,帮助客户实现海外市场的主动营销;另一方面是为下游的图书馆、信息中心的采购以及最终端的读者提供一系列的个性化服务。
  那么,大数据如何改变出版内容呢?不妨先看一个影视业的案例。
  当初,Netflix花1亿美元买下《纸牌屋》的版权,请来DavidFincher和老戏骨KevinSpacey,首次进军原创剧集就一炮而红,在美国及40多个国家成为最热门的在线剧集。在开拍之前,Netflix是否知道《纸牌屋》会火呢?Netflix在美国有2700万订阅用户,在全世界则有3300万。每天用户在Netflix上产生3000万多个行为,比如暂停、回放或者快进时都会产生一个行为,Netflix的订阅用户每天还会给出400万个评分,还会有300万次搜索请求,询问剧集播放时间和设备。它比谁都清楚观众喜欢看什么样的电影和电视。
  跟Netflix相似,一些海外的出版企业率先作出了相似的尝试。例如,美国Scholastic出版社的《The39Clues》一书,即是通过原作的在线游戏追踪最吸引人的线索和角色数据,以此为构思进行创作;又如,Coliloquy公司的模式,其出版的电子书遵从“民意”,允许读者决定人物和剧情走向,再通过数据分析调整产品内容。
  相似的,童趣出版有限公司网站与数字出版业务项目经理朱瑜曾提到,像“友盟”这种数据公司,就会帮助开发商在APP中嵌入SDK,通过运营中的数据,如需要关注哪些数据、如何获得这些数据以及如何进行数据分析给予,“这对开发者而言都是有效数据”。
  可以说,上述这种大数据改变的将是传统出版的流程和模式,商业趋势观察家肖明超的观点颇具代表性。在他看来,从数据生成来源角度,内容出版大数据可以分为专家生成的专业数据(PGC)、用户生成内容(UGC)和设备采集生成内容(DGC),这些内容可以通过信息技术进行融合后创造新的内容。出版机构则需要从作者和编者为中心,转变成以读者为中心,进行内容二次开发和多次增值。作者、编者、读者全线打通,让一本书在众包模式下不断自我更新、自我成长,比如让读者参与来更新部分内容,以完成内容版本的升级,这种协作出版模式又可以建立新的社群,并持续的演变。
  此外,随着数字出版的全部数字化流程的推进,其越来越多的数据可以被捕获到,比如选题策划、作者引入、合作创新以及学术示范等出版行为,甚至借此预先把控行业发展的脉搏,直接影响出版、发行、印务等各个环节的升级转型。
   大数据如何改变精准营销?
  在过往的报道中,我们知道数字出版对于许多出版企业的营业收入贡献率极低,不到1%。主要原因在于传统的出版内容没有有效地嵌入互联网的数据链中,形成了相互脱节的“信息孤岛”。在网络上,用户行为不断被记录、不断聚集,形成的便是大数据。出版机构不善研究甚至没有能力研究用户的行为,便显得殊为可惜。
  2013年6月,Google公布了一份名为《QuantifyingMovieMagicwithGoogleSearch》的白皮书,宣称利用其电影票房预测模型,能够提前一个月预测电影上映首周的票房收入,准确度高达94%。该白皮书发现,一部电影相关的搜索量与票房收入之间存在很强的关联性,根据搜索次数的多少可以判断票房成败,次数越多,意味着票房越成功。谷歌的票房预测模型正是以大数据分析电影的热度走势。
  那么,大数据如何改变精准营销呢?不妨再看一个影视业的案例。
  根据上述Google的电影票房预测模型,《致青春》首映日百度搜索量为14万,《小时代》上映前夕百度最高日搜索量为25万,由此大致可以判断出两部影片的票房。结果,《小时代》首映日票房7000余万元,大幅超过《致青春》首映日4000余万元的票房。
  《小时代》就是通过网络搜索、视频播放、日志评论等大数据,了解全国各地区、年龄、职业的观众群体情况,进而采取针对性营销。通过数据分析,出品方乐视影业CEO张昭得出结论,该片40%的观众将是高中生,他们是郭敬明以及杨幂等主创的忠实粉丝,是《小时代》的冲动型消费者;30%是白领,他们对《小时代》感同身受,是营销导航的重点;20%则是大学生,他们是非核心消费者,但是能够通过传播从而影响这群人;另外10%为目前观影年龄在26岁至35岁之间的人群,他们是需要扩大外延的潜在观众。基于数据分析,乐视在全国数百家影院举办针对《小时代》目标人群的零点首映嘉年华,票房达到700余万,可谓一举成功。
  除却在影视领域,将大数据使用在营销手段,这样案例就在你我身边。例如传媒和IT领域时常应用的Cookie(服务器暂存文件)技术,正是让网站服务器把少量数据储存到客户端的硬盘或内存,或是从客户端的硬盘读取数据,进而分析用户浏览过的网页、停留的时间等信息,并向用户展示他们感兴趣的相关内容,类似这种围绕用户行为的数据分析正是出版机构需要积极借鉴的。相较于此,电商企业凭借独特优势率先走在了前列,像亚马逊中国的“经常一起购买的商品、购买此商品的顾客也同时购买”、当当网的“买过本商品的还买了”、京东商城的“最佳组合”等都是这种技术应用的体现。
  有出版机构的负责人在接受采访时提到,“出版社跟随电商参加活动,或者自己独立推广,每次都不清楚实际的效果如何?这些活动和推广到底形成了多大影响”?愿望清单、浏览历史记录、购买历史记录、点击情况、打开率、下载、购买等用户行为的大数据可谓是电商的一笔财富,出版机构希望从其手中得到这些信息,但却被冠以“商业机密”遭到拒绝。这样残酷的竞争现实也将倒逼出版机构建立自己的线上渠道,以便获取相关的大数据从而优化营销手段。
  不仅如此,电商企业对大数据的重视和布局还有更为长远的规划。2013年11月,移动应用服务平台友盟宣布,阿里巴巴已完成对其收购流程。资深互联网观察人士刘兴亮认为,阿里巴巴在移动的数据仅限于淘宝手机客户端和天猫,对除购物之外的其他APP数据并不多。有了友盟,阿里可以快速开发更多应用,并抢占手机客户端分散的流量入口。随着阿里数据量的增大,可以将更多的增值服务作为一个清晰的盈利方式,促进大数据变现。
  正如商务印书馆数字出版中心主任孙述学所提到的那样,大数据的深度开发、运行保障等工作专业性很强,远非一般出版机构独力可为,需要借助技术服务公司才能完成。因此,如果有大型的出版集团意欲在这领域有所作为,收购、组建自己的技术服务公司也应是一项重要的工作。