海量大数据郝玺龙:有没有发心,将决定你的企业是摩天大厦还是海市蜃楼

19.02.2016  15:23
1、创业是一种“参赞化育”,是创业者与世界对话、交融、协同的方式。 2、创业也是一种修行。创业者终有一天会意识到,自己最大的改变,是心智的圆熟融通。 3、只要你还在创业,就没有失败,所谓“失败”,其实是放弃了;成功的创业者,大多是些百折不挠的连续创业者。 4、“一生的果效是由心发出”。有发心,愿景和使命能成高楼大厦;没发心,就只能是海市蜃楼。 5、真正耀眼的公司,在发展初期都是非常另类的。 6、我们要从海量的数据中挖掘知识和情报。美国中情局当年就是通过对文本的量化分析、信息挖掘,成功预测勃列日涅夫上台。 7、互联网是人机协同演化的“序参量”。 8、“中文分词”问题的突破,是海量发展的技术奇点。 9、对于大数据,“DT时代”之前,海量有实无名,“DT时代”到来,海量实至名归。 10、“海量大数据重度孵化方法论”的结晶,是海量发展的新阶段。海云、知蜜、狗大夫等知名创业公司的孵化成功,证明海量重度孵化方法论是普适的,行之有效的。 海量大数据郝玺龙:有没有发心,将决定你的企业是摩天大厦还是海市蜃楼
郝玺龙 郝玺龙简介: 郝玺龙,海量创始人&董事长,海量大数据重度孵化器创始人,海量首席大数据专家,独角兽创业成长学院院长。具有丰富的技术、产品创新实践以及创业项目孵化和创业企业运营经验。同时兼任清华大数据产业联盟理事,中国大数据创新大赛评审委员会专家,中国社会媒体处理大会(SMP)常务委员。2013孵化了海云数据(HYDATA)等项目;2015年抽象出完整的《重度孵化方法论》,参与创建“独角兽创业成长学院”。 海量大数据,定位为基于大数据的情报服务商,在多年积累的具有自主知识产权的技术基础上,开发了“海量大数据情报服务平台”,为数万家客户提供高品质的情报服务。 海量大数据郝玺龙:有没有发心,将决定你的企业是摩天大厦还是海市蜃楼
以下为采访正文: 武卿:过去两年,有两个现象级热词几乎被全民讨论,一个是“创业”,一个是“大数据”。就连一向不关心创投新闻的我家父母,也会主动跟我提。作为专注于大数据领域的创业老兵和投资人,您怎么看待“创业”热? 郝玺龙:儒家讲,人的价值在于“参赞天地之化育”,在我看来,创业就是一种参赞化育,是创业者与世界对话、交融、协同的方式。从这个意义讲,创业也可看成是一种修行。修行有入世、出世之别,创业是一种特别入世的修行。 创业者要在混沌中开辟出自己的事业,都会面临一个从无到有的过程,经历的磨难不亚于唐僧去西天取经。随着创业渐入佳境,创业者终有一天会意识到,自己最大的改变不是钱变多了、事业变大了,而是心智的圆熟融通。 一句话:创业是件很酷很阳光的事情。 武卿:头一次听人这么解读创业,你是一开始就有这样的认知吗? 郝玺龙:不是,所以我说创业本身就是一种修行。在不同的阶段,创业者会有不同的认知,这个只能自己去体悟。我自己也是从一个创业小白,一步一印走过来的。最艰难的时候,也会挣扎、彷徨。重在坚持,不改初心…… 武卿:也就是你常说的“发心”。 郝玺龙:对。现在我们谈创业,绕不开愿景和使命,这些都需要“发心”。有发心,愿景和使命能成高楼大厦,没发心就只能是海市蜃楼。《圣经》里说,"一生的果效是由心发出"。佛家更是把"发心"视作成就的起点。敦煌莫高窟其实就是乐尊和尚的一个发心嘛。 创业者也是这样。你回过头看,今日所成,可能就是你起初发心的一个结果——由根到果,这是怎么强调都不过分的。没有一个好的发心,一个人的事业不可能做大做强做深,更不可能做久。 武卿:可以说,不只创业,无论做什么事都离不开发心。 郝玺龙:对。这是个先决条件,反而常常被忽略。 武卿:海量的创业之路又是怎么开始的呢?“大数据”一词在中国被热炒,也就是近几年的事儿。而贵公司在1999年成立之初,就给自己起名为“海量”,是出于什么样的考虑? 郝玺龙:海量的创业,首先还是从解决具体的应用问题开始的。我是学情报出身的,当时做海量的第一个目的,就是想创建一个类似兰德公司这样的情报分析机构(兰德公司:美国最重要的以军事为主的知名决策咨询机构),但又不能像传统的分析机构那么做。1999年中国已经进入互联网时代了,计算机的计算能力与日俱增。我就想把这些先进技术应用到情报分析里,做一家互联网时代的情报分析机构。 在情报分析里面,对文本进行量化分析是一种基本技能。例如美国的中情局,当年他们就是通过对文本的量化分析、信息挖掘,成功预测勃列日涅夫上台。“从海量的数据中挖掘知识和情报”,这是公司创立之初就定下的基调。虽然那时还没有大数据这个概念,但对数据分析应用的需求是始终存在的。 创建海量之前,我做过证券投资,从业五年颇有斩获,正是因为我使用了情报分析的方法。但用人工去搜集资料做分析,效能非常低,如果使用计算机,就可以大幅提高效率。当时我一直在琢磨这个问题。 海量大数据郝玺龙:有没有发心,将决定你的企业是摩天大厦还是海市蜃楼
武卿:琢磨怎么用机器取代人做数据分析? 郝玺龙:对,但不仅仅这样。在我看来,人与机器不是谁取代谁的关系,应该是一种协同关系,而互联网就是人机协同演化的“序参量”。 人——人本计算,从知道到洞察;机——机器计算,从知识到智能。基于确定性的逻辑模型和相对稳定的知识,机器计算大幅解放了人类重复劳动;而人本计算则形成新的认知、判断以及模式,不断促进机器的演化。所以,人与机器是一种协同演化的关系。 武卿:着手创立海量时,有没有遇到困难?据我所知,2004年,彼得•蒂尔(Peter Thiel)和乔•朗斯代尔(Joe Lonsdale)等人创办Palantir的时候,有着跟你们相近认知——人机协同做情报分析。1999年时,你们能做些什么? 郝玺龙:万事开头难,一开始就遇到了很大的困难。与英语世界的Palantir不同,海量的分析对象是中文。在当时,中文文本是根本没法做计算机分析的,那会儿业界最核心的基础技术“中文分词”还是一个世界性的难题,这个问题不解决,一切都无从谈起。 武卿:什么叫“中文分词”? 郝玺龙:举例来说,比如我们现在看杂志上的这篇文章,它是一个个汉字字符组成的,但词才是自然语言中最小的语义单位,你要做语义分析,必须得把字组成词,把“字序列”转换成“词序列”,进而生成语义,才能被计算机“理解”。 英文就没这个麻烦,每个英文单词具有特定的语义,单词之间有空格分隔,计算机通过空格很简单地就能识别出不同的单词。中文与英文看似微不足道的一点差别,在当时却是一个跨不过去的鸿沟。除此以外,中文还存在大量的歧义词,同一个词在不同的语境下,含义也不同。因为这些原因,当时的中文分词问题已被纳入世界级难题。 武卿:你们把这个问题解决了? 郝玺龙:对。 武卿:这是哪一年,当时是什么情况? 郝玺龙:1999年10月份。就像当年常见的那种“个人英雄主义”程序员一样,我和我的一个合伙人闷在我家阁楼上写程序,写了很长时间,结果真给突破了。 现在想起来也是一好玩的事儿。因为经常被朋友们问起,后来我索性把那一段往事写成一篇文章发到微博上了。 武卿:解决中文分词难题,对你们这个行业、对中文互联网的发展意味着什么? 郝玺龙:分词问题,此前近三十年都没有解决。在海量之前,大家甚至认为中文分词难题是不可解决的。海量的突破,证明这个问题并非不可解决。分词作为基础技术,是所有语言分析技术的支撑点。此外,中文分词难题的解决还意味着西方文本分析的所有算法可以直接拿过来使用了。可以说,打通分词这个关节,其它可以达到工业级别应用的算法,应运而生。 武卿:在“中文分词”上的突破算是海量的技术奇点吗?解决这个难题,当年应该是一个轰动性事件吧? 郝玺龙:在业内算是轰动的,之前被认为是解决不了的嘛。但是我们很快又意识到,它其实是一个基础的基础,并不能直接应用,所以我们又紧接着在这个“基础的基础”之上,进一步研究、开发应用层的基础,比如检索、分类、聚类、主体词提取、自动摘要等等。这些技术的完成也比较早,2003年以前就都结出果实来了,后来在各个领域得到充分应用,服务了包括全球五百强在内的数万家企业和机构。 武卿:越是基础的技术,应用范围越广,你们相当于是走了一道窄门,原始积累缓慢,但是后劲足,能够厚积薄发。现在就有一种说法,说“企业级市场”是一个很大的蓝海市场,未来的发展有可能超过“消费互联网”。这对海量也是个好消息吧,你怎么看? 郝玺龙:是蓝海市场没错,企业级市场总体来说确实很大,但是分到每家公司就不高了,更不会诞生BAT那样的寡头。海量虽然很早就瞄准了这个市场,但也是经过了很多波折,能熬过来是很艰辛的。真正被资本认同也是近几年的事儿。 其实,即便是Palantir这样的公司,在其发展早期很多投资人也是不投的。它的理念跟当时的主流投资者普遍认同的理念都是背道而驰的。现在,我们看到很多机构声称要服务小客户、小微客户。而Palantir呢,它只做大客户,从来不服务小客户,而且做只做企业级市场,是非常另类的。所以说真正耀眼的公司,在发展初期都是非常另类的。 从历史沿革来看,海量应该是中国第一家把自己的专业定为大数据服务的公司,过去我们是有大数据之实,无大数据之名,不被看懂也是意料之中的。当初在工商部门注册的时候,人家还问:“海量?你们公司的人都挺能喝的吧?” 武卿:现在算是实至名归了。“海量大数据”是怎么为企业提供服务的呢? 郝玺龙:简单说,我们的大数据服务依托于“海量大数据服务平台”。平台采集了来自全网的公开数据,并进行形式结构化处理。企业如果有具体需求,比如想知道自己的客户在哪儿、痛点是什么,行业竞争态势如何……他们只要提需求,海量在不需企业内部人员参与的情况下,就能帮他们做分析。如果企业发展遇到困境,自己又找不到症结,海量也可以根据企业提供经营和销售数据,利用大数据分析技术,为企业做全盘诊断,提供解决方案。 海量也授权合作伙伴,基于自身的客户资源以及团队拓展能力,将海量信息大数据商业应用服务与自身业务结合,将海量情报服务提供给更多的企业客户。 武卿:我可以理解成是一种“泛大数据”服务吗? 郝玺龙:对,大数据原本就该是这个模样。我知道业内有些做大数据的,大多只是选定一个应用方向,这种做法可能过个三五年就会遇到瓶颈,因为它的数据维度会很快到达边界,无法继续扩展。海量会继续把“海量大数据服务平台”这个“基础设施”做丰实,平台之上再做应用。 现在,“海量大数据平台上”的数据维度和规模之大,完全够得上真正意义的“大数据”。当然,用起来的大数据,才是有用的大数据。海量的模式是:以平台为核心,后端提供大数据服务,前端提供大数据重度孵化服务。大数据资源得到了充分使用。 值得一提的是,海量这几年的发展也得益于云计算的发展。云计算可以按需采购,不需要在硬件上过多投入,这在过去是不可想象的。所以我非常感谢云计算的发展。 武卿:说到大数据重度孵化服务,你之前也做投资,孵化与投资有什么差别?为什么决定做孵化? 郝玺龙:区别是很大的。做孵化器明显需要更多的时间和精力,这也是近年来我投入精力最多的板块。刚才我说,海量的战略核心是“海量大数据服务平台”,外加一个“投资孵化平台”。基于大数据平台可以做很多应用,但我们自己做不了,所以就要与人搭伙,投资孵化就成了自然而然的事,归根结底还是为了弥合这个产业链。 武卿:就是说别人擅长的,海量与其合作,提供服务;行业里没有的,海量就孵化创业公司,让他们来做,最终也可反哺自己。 郝玺龙:对。其实,还有一重考虑:如果不这么做,整个产业链发展就会很慢。比如我们原先跟很多咨询公司合作,发现咨询公司的决策层年龄偏大,不会充分站在用户角度思考问题,用户需求原本非常旺盛,他满足不了时,就会想办法降低用户预期。那我们干脆就去找年轻的团队干。我们来孵化。 武卿:入选海量重度孵化器的创业者需要具备哪些素质? 郝玺龙:一般来说就三条:第一,创始人的自我认知要符合预期;第二,创始人在他这个领域内要有认知、有见地;第三,能够不断地学习。 武卿:你们叫“重度孵化器”,“重”在哪里呢?现在不有个笑话嘛,放高利贷的叫众筹,办公室出租叫孵化器…… 郝玺龙:对,笑过以后我们都要想想,为什么会这样?你是要赶时髦呢,还是真正想做成一件事儿。回到一开始我们那个话题,根在发心,事在人为。 2013年我完成在“中欧”的学习,回来创办了“海量大数据重度孵化器”。基于“精益创业”理论,摸索出了一套“重度孵化方法论”,简单来说,分阶段由创业导师为创业团队提供十三个方面创业指导;由项目经理帮助制定和实施关键任务;由私董会协助做战略决策和重大融资;背靠“海量大数据服务平台”提供大数据支撑;协助挖掘早期客户;最终使创业公司出孵化器以后能够持续地做产品,获得资本市场认可。两年以来,孵化了海云、明美、搜股等二十多个项目。这肯定不是一个“租办公室”的机构的愿景吧? 武卿:这几个都是大数据应用方面的? 郝玺龙:对。我个人做天使投资的,用的也是同一套方法论,如知蜜、幸知在线、狗大夫等等,现在也都进一步获得资本认可。这充分说明这套方法论是普适的,行之有效的。 武卿:最后再问一个问题吧,现在创业的多,失败的也多,你觉得失败的创业者,有什么共同点? 郝玺龙:我不认为有“失败的创业者”,只要你还在创业,就没有失败。所谓“失败”,其实是创业者放弃了。创业是个持续的过程,不放弃哪来的失败?我去硅谷,发现硅谷的很多创业者就像走兽一样,从这儿来到那儿去,然后又换到别的地方,一会儿又从另外一个地方冒出来。这跟硅谷的生态有关系,硅谷的生态就是兼并收购非常发达。 从我个人的角度来说,我希望创业者像树,从一颗种子长成小树,然后又长成大树,终日风吹雨打,依旧傲然生长。创业不死三次那不叫创业。没经历过暴风雨,哪会处理创业那一大摊子事儿啊?你会发现很多成功的人,就是那些百折不挠的所谓连续创业者,掉几层皮后,个个脱胎换骨。 《射雕》里郭靖形容托雷用“坚忍勇决”四个字,放在创业者身上是再合适不过的。而且你终究会发现一个坚忍勇决的人,会引来一群坚忍勇决的人……当然,除了淬炼品质,精进修为,创业者还要具备洞见未来的能力,要能站在十年二十年之后的将来回望当下,把握趋势,顺势而为。看得远,你才有可能走得远。这个,我们以后可以再展开聊聊。