你心中的“大数据”到底是个啥?

06.05.2015  10:56

              大数据这个称号,往往会因为其名称会蒙蔽了一部分人的双眼,认为“大数据”的重点体现在它的“大”之上,以为量大就能更直观地看到全局。然而光看到了全局还是无济于事的,为什么要这样说呢?

 

              第一,“大数据”之“大”,并非某个单一数据之大,而是全局的数据都很大。就如同腾讯,在很多人看来,QQ本身是一个免费的工具,本身是不赚钱的,而腾讯是一家“IT公司”。而在我看来,腾讯其实是一家“数据”公司,它通过本身无法增值的数据开发了各种不同的衍生产品以达到赚钱的目的,这就是为什么腾讯能崛起而MSN灭亡了。

 

              从这一点我可以做出一个大胆的推测:一开始免费,后期收费的商业模式都容易走向毁灭。你试图改变别人的消费习惯,这一点就忽略了人性,除非你是真的有更好的产品。类比之下,百度公司也是如此,但相比之下,百度公司远不如谷歌有远见,一旦网络市场的“墙”不在了,百度公司或许会受到毁灭的打击。

 

              第二,“大数据”的重点其实应该落回到“数据”这个本身上。还是那个观点,数据本身无价值,而是数据衍生出来的价值。而大数据的第二个特征是可以长期连贯地观察整体的各种行为,并寻找“周期性”规律。在这一点上,咱们的老祖宗在这个农业大国创造的一个神奇的系统就是大数据的体现,那就是“二十四节气”。这个东西的出炉,不就是为了简单地指导农业生产吗?在当今的工业社会,有个部分职能与其相似,那就是假日办。然而我们都知道,“冬天吃不到西瓜”的历史难题早已被温室种植技术打破,所以二十四节气被众人遗忘也很正常。

 

              那么我也做出一个推测:大量的所谓“周期性”规律将会被大量打破,市场的新亮点会如同地震一样,你可以预测它会到来,但你永远无法预测它什么时候到来。类比之下,工业革命到互联网革命相隔的是如此之短,柯达这种破产保护后几乎消声觅迹的公司和通用汽车这种破产保护后重获新生的公司,有人能预测得到?

 

              第三,“大数据”最神奇的特点在于其可以轻易地进行“交叉对比”来寻找“弱联系”。在“强联系”思维中,因果关系是:这个地区人口增长迅速,奶粉、尿布的需求量就会增大。而“弱联系”的思维是:这个地区尿布的需求量增大,所以啤酒、香烟的需求量增大。当然你肯定会奇怪,让我来简单理一理:新生婴儿一般需要尿布,母亲主要带孩子,尿布快用完了就得父亲去购买,顺便再买点自己的小嗜好例如烟酒,于是这种“弱联系”就成立了。而在“弱联系”的世界里,进行比对的数据就不是销量、价格这些东西了,而是一个叫“变化率”的东西。例如现今普遍能够看到的CPI、PPI,股市的K线图,牛顿力学中的“加速度”。

 

              当然我继续再做出一个推测:在“弱联系”思维的主导下,大量产品的用途会被重新定义。在此思维下,王老吉凉茶就用“怕上火”这个口号,炫迈口香糖就用“完全停不下来”这个口号,都是让口号与产品自身产生了“弱联系”,重新定义了产品用途,从而实现了成功的营销。

 

              最后,建立数据筛选的方法及寻找相似性的“弱联系”还是需要人类的智慧来完成的。就如同百度搜索会自动校正错误搜索,淘宝搜出产品可分男女一样,这种规则的界定只有人能办到。

 

              这个年代,不是你把线下的“集贸市场”复制到线上就是能成功的。市场上真正稀缺的产品已经不是“价廉”这一条就能够搞定的。如何才能真正地做到“物美”,才可能活得长远。