何雪芬:大数据与小市民

云故纸

根据大数据制定商业行销、市场策略,谬误只是关系着个别企业的盈亏存亡;可是若要根据大数据制定政策、治理社会,得预留加减的余地。

自从戴了小米计步手环,在手机下载应用程序,设定每天走9000步之后,我有意识地多走路。一旦达到目标,手环会自动震动。如果一天将尽,手环还没震动,我就鞭策自己多走路。应用程序也会告诉我:“你上周走了4万零724步,比68%的新加坡人还要活跃。”

我如果真以为自己是那较活跃的32%群体,那是不准确的。因为这个指数只是根据这个应用程序的使用者所收集的信息来排比,若真与总体相比较,到底我的指数会较好还是较差,我不得而知。

数字不骗人,大数据说真相,可是说的是什么真相?英国脱欧让世人大跌眼镜,因为许多机构在公投前根据大数据推演选民留欧的意愿比较强烈。然而公投的结果却和预测中的差异达3个百分点。

有关英国脱欧的数据分析,信息主要来自民意调查、博彩及社交媒体。在地域广袤的国家,受成本及操作所限,民意调查多在人口聚集的中心进行。以英国脱欧这个例子来说即伦敦,而伦敦是众所周知的支持留欧。至于博彩公司的盘口则经常被视为投票的风向标,公投前博彩公司普遍看好英国留欧。至于社交媒体则主要反映较年轻族群的意愿,一般相信,年轻人倾向于留欧。

个别的数据也许反映一定的事实,可是在收集信息的过程中,犯了两个致命的错误,以致于无法呈现准确的全息图。这也正是许多行销决策人员的经验:你必须找到合适的人问关键的问题,才能得到正确的答案。

一是众家分析忽略了这个课题不是简单的二分法,低估了选民的情绪。主张脱欧的阵营主要是不满贫富悬殊、认定移民抢走工作或对社会有威胁。有着这种强烈不满的选民,是会冒着大风雨去投票的。就如Google+当初推出之际出现的笑话——除了人心,没有什么是谷歌搜寻不到的地方——变幻莫测的人心,正是冷冰冰的数据无法触及的疆域。

另一个错误则是如《斯坦福法律评论》曾刊载的一篇文章所指出的那样,忽略了被大数据所抛弃的社会新底层。美国国务院法律顾问勒曼(Jonas Lerman)2013年曾撰文指出,今天许多大数据工具都是经过校准,专门针对“足迹遍布网络世界的人”——使用面簿、谷歌和亚马逊;拥有借记卡、信用卡、购物卡、交通卡,使用智能手机,开车时依赖车上的GPS导航系统的年轻白领。如果只是根据这样的族群所收集的大数据,“没有手机、有线电缆和电脑的蓝领工人(而且工酬是用现金结算)”,就有着被数码世代排除在外的危险。

信息技术与经济活动的结合,引发数据快速增长,得益于大数据和云计算等技术的日益成熟,人们可以根据海量的数据资源,对经济社会发展进行实时分析。大数据分析渐渐影响各种重大决策,决定人类的生活方式和机遇。商家根据数据预测未来,制定商业模式;政治家制定投票率策略、分析家研究出疾病传播方式,政府从大数据获取、整理并推断出决策。

但如果从大数据中产生结论、形成决策的方法论基础不扎实,直接运用大数据结论就可能是不可靠甚至是危险的。人们运用科学方法探究或研究问题,都会依据相关知识,根据问题进行某些假设以简化问题。一旦假设形成,或许会受偏好影响了观察、解释及判断,形成“主观愿望”。

根据大数据制定商业行销、市场策略,谬误只是关系着个别企业的盈亏存亡;可是若要根据大数据制定政策、治理社会,得预留加减的余地。

最近公布的经济合作与发展组织(OECD)成员间展开的国际成人技能评估报告,值得让人关注的是我国的世代差异及数码鸿沟。15岁至34岁的年轻人与55岁至65岁年长者,光谱的两端的语言及计算能力的两级化,一方面固然反映建国50年来教育水平的大提升,却也再次提醒人们,55岁至65岁年长者除了面对语言劣势,也面临可能因为无法透过资讯科技去获取资讯或提升职能的窘境。

另外,调查是以经合组织各国的官方语言进行。35岁以上的新加坡受访者,平均仅有近两成把英语视为母语。这个评估调查从侧面反映了,我国有一个群体仍然依赖他们所熟悉的语言及媒介取得资讯。

我国早在1992年就提出“2000年资讯科技计划”,并在2005年推出“智慧国2015计划”。在这基础上,2014年推出的“升级”的“智慧国家2025”10年计划,更进一步往智慧国的愿景迈进,建设覆盖全岛的数据收集、连接和分析基设施和操作系统,以提供更好的公共服务。除了人们已熟知的电子商务,小市民日常生活中使用的电子政务、出行的交通卡、各种优惠卡会员卡的交易记录等,都逐步编织一张偌大的大数据网。

根据大数据治理社会,数据固然是重要参考依据,要完善决策,使资源得到合理分配,必须确保少数群体未被遗忘、不被排斥。在奔向智慧岛的旅途中,除了协助不熟悉资信科技的群体接上资信快车,也有必要保留慢车道,透过科技以外的管道了解人们的期望与需求。

但都说了,人不是冷冰冰的数据,人心是会变的。当我发现智能手机自动出现信息,告诉我回家需要多长的时间,我决定把谷歌“监察”我的导航功能关闭,逐步抹去“电子足迹”。当越来越多的人决定在隐私和便利间做出取舍,大数据无法捕捉的就不光是数码社会新底层,也包括大隐于市的一群。生活中总有不可预期,当黑天鹅出现时也就推翻了之前的假设与预测。

这也正是分析大数据时须考量的:不能忽略人的因素和作用,人工智能不能完全取代人的智慧。

(作者是本报助理副总裁 (新兴业务) 兼特别项目主任)

LIKE我们的官方面簿网页以获取更多新信息

1