刘家明:了解“数据解析”的挑战

订户
赠阅文章
订户专享 赠阅文章

早报新添“赠阅文章”功能!凡早报VIP会员,每月可赠阅 5 篇订户专享文章。

了解更多

字体大小:


同事想买房子,心目中有靠近市区的新组屋,以及靠近商业区的公寓,在午餐时向我们征求意见,于是大家七口八舌当起军师。有的问他的财政预算,个人喜好是组屋还是公寓,自己居住还是投资出租,交通和工作地点、环境因素和租赁市场,同住的家人的考量,转售市场等等。


至于同事最后做了什么选择,等他请我们喝入伙酒时自有分晓。由于同事有这个多方面提供数据的机会,所以在决策时就较有优势了。这么一个小小的讨论,其实概括了目前唱得火红的“数据解析”的内涵,也引申出“数据解析”实行时的各种挑战。


先来了解什么才算是“大数据”。根据IBM的定义,供我们做决定用的数据一定要多(Volume)到普通单一电脑系统不能有效处理,流量要快而及时(Velocity),来源要多方面且杂(Variety)以及数据要具备“不确定性”(Veracity),符合了4V的话,就可算是进入了“大数据”的范畴了,可以进行“数据解析”了。同事在投资新房子前所征询的各方数据,基本上算是符合了“大数据”的要求。

订阅登录,以继续阅读全文!

LIKE我们的官方脸书网页以获取更多新信息