不需要虚假的大数据“泡沫”

2015年11月26日 07:10   来源:新民晚报   易 蓉

  有了开放的大数据环境,我们的生活越来越方便,有了更精准的天气信息查询,更智能的路线导航……

  为什么我们需要开放数据?剑桥大学教授彼得默里以科学实验为例表示,人类基因组、生物、医疗环境等数据属于全人类,科研经费来自公共资金,因此其数据应被广泛获取,而且他认为“人类公共活动的正常运行需要数据支持,更佳的数据获取能提升科研新发现的概率”。数据的开放不仅具有科学价值,其经济价值和社会价值同样不可估量。

  2009年,美国开创了全球公共信息资源开放的先河,随后世界主要国家相继开展开放工作,截至今年,已有65个国家加入开放政府合作伙伴组织。今年,我国“国家公共信息资源开放与社会化服务”的相关方案开始制定,上海等一线城市也已在公共数据开放上作出努力。比如年中时,本市宣布开放上千GB容量的数据,包括城市道路交通指数、地铁运行数据、空气质量状况、气象数据、道路事故等,以支持开放数据创新应用。截至今年上半年,上海依靠市政府数据服务网,已累计开放数据集逾500项。

  然而数据造假的新闻却如当头冷水泼了下来——中国临床数据造假泛滥,国家食药监总局曝光了一批造假药企和临床试验机构。这是新药注册申请时的临床试验数据,是检验药物安全性和有效性的唯一标准,关乎病人的健康安全。数据造假的原因无外乎行业管理混乱、药企急功近利、法律规范不健全,也揭示了数据开放度不够、开放机制不健全的现状。据报道,某临床试验中竟发生受试者遗漏心电监测,机构就将1名受试者的心电图连拉3条剪成3段凑数。试想,倘若这些数据都能够“放在阳光下”,定会有人看出端倪。

  除了临床数据,之前汽车排放造假、金融公司造假、互联网公司数据造假等新闻也是接连不断。不过,总希望未来还是值得期待的,基于开放数据的挖掘将产生更多有价值的应用,老百姓也将生活在更公开透明的信息环境中。千万别在开放的“压力下”让造假变成“老鼠屎”,我们需要多多益善的有效数据,却不需要虚假的大数据“泡沫”。

(责任编辑:武晓娟)

精彩图片