到底多少数据才叫“大”数据?

2016年07月07日 创业美国


如今,人们都在谈论的话题热点,无非这几个:大数据,大数据,还有大数据。你听说比大数据更高深莫测,却又被所有人挂在嘴边的词么?反正我是没听过。因为在这个信息爆炸的网络时代,大家都想尽办法用最短的时间、找到最准确的信息、获得最大的回报。为了防止淹没在无边无际的信息海洋里,大数据也就收到了前所未有的关注度。



还是不太明白大数据?举个例子吧,好比说你上山采蘑菇,大数据就可以通过帮助你分析山上的降水、土壤、温度等数据,提前预测出蘑菇生长的位置,这样你就不用漫山遍野的去瞎跑了。说完了这个例子,也就懂了,为什么大家都为之疯狂了。



到底多少数据才叫“大”数据

很多人常常会在想,到底多少数据才足够呢?我们总是觉得手里掌握的数据不够,现实情况是这样的:总有数据源源不断地在被产出。数据出现的速度,是远远超过公司分析数据速度的。有报告称,到了2020年,这个地球上每秒钟、每个人产生的数据量是1.7兆



如此多的数据在产生,就必然要求公司有能力分析这些数据,才能更加有效的了解他们的客户,提高整体经济周期,减少低效的流程,更好地满足目标受众的实际需要。数据平台公司prooV的联合创始人Toby Olshanetsky说,现在,很多大公司的管理层越来越了解到大数据对于公司决策的推动作用,它是建立竞争优势的最重要的工具。



于是,这些公司开始掷重金在提升IT硬件、软件方面,来应对大数据流入。但是,仅仅靠这些当然是不够的,还需要数据处理技术上的更新。别说普通的公司了,就是美国国土安全局、CIA、FBI等政府部门,都需要和Palantir这样的大数据公司合作。足以见得,大数据领域的门槛,还是相当高的。





大数据为何如此吸引创新公司

除了垄断性质的大数据企业,也有很多创新公司涌入了这个领域。被称为“初创公司生态系统终极数据库”的Crunchbase上的数据显示,分类在“大数据”类别下面的公司为3083那到底是什么让创新公司如此看重这个行业呢?

原因其实也很简单,就是虽然大家做的都是数据处理,但是这些数据可以应用的领域很多。这就是说,虽然在这个领域的公司多,但是各自都有其垂直领域,能够保持差异化。创新公司可以凭借各自不同的理念,找到合适的定位。



比如,估值超200亿美元,在创业公司中仅次于Uber和Airbnb的Palantir,主打的就是国防、金融等领域,其中Palantir最为人津津乐道的案例,就是协助美国政府追捕本拉登;做实时数据可视化的公司Tableau,就很受媒体人的欢迎,因为Tableau能够给他们稿子提供新颖的数据图表;专业的医疗大数据分析公司Ayasdi,它的数据分析技术曾帮助发现了乳腺癌的14个变种;有号称有最快的内存数据库MemSQL;应用机器学习技术处理大数据难题的Paxata;还有我们节目中采访到的投资者及投资机构提供替代性数据(Alternative Data)的Thinknum……





大数据就像是十几岁少年眼中的性行为

尽管这几年来,各类企业都在加大了在大数据分析方面的投入。但是与应该获得的数据相比,他们能够接触、分析的数据,只是极小的一部分。

一份来自EMC的报告显示,在数据的宇宙中只有22%的信息是可以被分析的,而实际上其中只有5%是可以被成功分析的。看到这份数据,不禁在想如果只有点数据真的被利用了,那大数据还真的可以称为“大”数据吗?不过,这也恰恰说明了大数据领域,还存在这巨大的空白。


就像美国杜克大学心理学与行为经济学教授Dan Ariely打趣说的,“大数据就像十几岁少年眼中的性行为,每个人都在谈论它,但没人真正知道怎么做。每个人都以为除了自己之外的每个人都在使用它,所以每个人都装作自己很了解它。” 看来想要真的驾驭大数据,真的不是一朝一夕的事儿!





点击

最危险的创业,这样的钱你想挣么?

儿童安全座椅,竟然可以放在裤子口袋里?!
> 当买车也能像在亚马逊上购物一样,是怎样的体验?


《创业美国》版权说明:

《创业美国》文章均为原创,媒体及微信公众号如需转载,请留言微信号。喜欢本文,欢迎点赞并分享至你们的朋友圈。


- 投稿或约访合作 - 

请发邮箱至:[email protected]

- END -



收藏 已赞