大数据时代:先用好现有数据富矿

2013年12月30日 10:10   来源:人民日报   史文钊

  大数据究竟能给我们带来什么?仅仅是要我们不断增加存储,不断提高带宽,不断进行数据的处理吗?当然不是,我们真正要从大数据得到的,是大数据中那些有用的知识。

  大致上讲,目前的大数据来源有两块:交易数据和关联交互数据,前者指业务系统或交易系统产生的数据库,小体量却高价值;后者则是社交网络产生的数据,大体量却低价值。对于这两大数据来源,人们基于大数据理论提出一些解决方案,如把社交网站的数据和电商平台的交易数据关联,进行精准广告投放,产生更大的价值。然而问题是,为何交易系统要共享这些数据?拥有电子商务网站、微博或即时通讯工具的那些互联网巨头,很难说愿意把自己的这些核心数据在没有重大利好前提下与人分享。同时,需要进一步思考的是,即使这些数据能够共享,该用哪一种技术才能实现较高的关联性,来挖掘出潜在的巨大价值?

  那么,作为从传统数据挖掘概念延伸而来的“大数据”,现在为何这么热?很大一部分原因,是源自管理学界和商业媒体对于大数据的推崇备至,他们认为大数据是信息技术改变商业世界的杀手级应用。有不少人沉醉于大数据的大容量、快速和多样性,却忽视了大数据真正能给用户带来的价值。我们不难发现,现在关于大数据成功案例的报道并不多见,尤其缺少那种系统性大项目的成功经验。谷歌预测系统和亚马逊精准广告投放系统,和最近斯诺登爆出的美国棱镜计划,这些可被视为大数据解决方案的“成功”案例。然而,棱镜的“成功”不是由于其技术或方法的先进,而是在于美国政府有着强大的能力来整合谷歌、脸谱网、雅虎等各大互联网服务商的信息,通过数据挖掘实现自己的应用。除此之外,很难觅得其他具有实际意义的案例。

  现在,学术界对于大数据的态度相较以前已经冷静很多,不再是一窝蜂地为其叫好。更多的人开始反思大数据的局限性,如曾利用大数据准确预测出美国总统大选结果的纳特·西尔弗,著书讨论大数据带来的究竟是信号还是噪音;也有曾力推大数据的学者认为,大数据不仅仅是海量数据的集合,更重要的是要挖掘出其背后真正的价值。近来,人们也开始反思大数据的真正含义,冷静思考大数据背后的真正价值,尝试构建各种大数据解决方案并应用于各行各业。尤其是在智慧城市建设中,更是不断探索如何盘活已有数据存量,用好大数据增量,来提升城市公共服务能力和管理决策水平。

  因此,我们需要意识到,IT技术经过这些年来的发展,已经从数据产品时代步入数据应用时代,而大数据的核心不在于其体量、速度和类型,而是如何发挥数据的价值。如果现有的数据富矿我们都不去很好的整合、分析加工和利用,何谈还有必要去挖掘新矿?

  (作者为神州数码大数据专家)

(责任编辑:张无)

精彩图片