数据为王时代,挑战巨头还有可能吗?

2017年07月21日 08:17   来源:新华每日电讯   周琳

  新华每日电讯报记者周琳

  这一轮人工智能浪潮已经在国内火了两年,这两年里依赖人工智能赚钱的公司多吗?其他不敢说,但会展公司肯定是赚的盆满钵满了。以“人工智能XX大会”命名的会议,几乎每个月都会出现,且零散在多个城市。一夜之间,所有公司都“AI+”了。

  得益于这样高密度的轰炸,所有和行业略有沾边的人都认识到:运算能力提升、数据和深度学习算法,是此轮人工智能红火的三大因素。但其中到底孰轻孰重,却一直争论不休。

  近日,谷歌就和CMU(卡耐基梅隆大学)开启了一项研究,测试在不优化现有算法,只增加十倍甚至百倍以上数据的前提条件下,能否继续提升图像识别的正确率。

  作为一个金主爸爸,谷歌不缺数据和运算能力。过去它与CMU合作进行图像识别研究开支非常高,占用了50个高性能GPU整整2个月的时间,更夸张的是,标记好的图像数量达到了惨绝人寰的3亿张。

  结果显示,这个系统在多项图像理解测试中的表现都创下了新高。比如识别照片中的物体,算法的识别准确率和训练所用的数据量之间有明显的正相关。虽然对象检测的结果只提高了3个百分点,但研究者表示,他们相信如果对软件进行调整,使其更适应于超大数据集,那么优势还将扩大。说白了,谷歌就是花大笔的钱证明了一件事,数据为王!

  这简直给了无数初创公司一个暴击。基于深度学习这一算法的科技竞争,依赖的就是海量数据的“喂养”,想要挑战一个巨头开始变得更加困难。无论是谷歌、Facebook还是微软,国内的BAT,都会更加明白数据的价值难以被挑战,巨头的位置也更加巩固。

  运算能力或许还可以通过重资产来增加,但海量数据实在可遇不可求。一些行业就是没有海量数据,就不能引入人工智能了吗?事实上,被称为“小数据版”的迁移学习一直是业界关注的焦点。

  迁移学习,就是先基于标签数据量大的领域,做预训练,再通过迁移当前领域可复用的特征、参数、或者是领域知识、通用知识,对目标领域进行半监督、无监督学习。

  此外,还有不少业内人士建议,可以去布局可能产生数据的公司或行业,找到大公司的数据盲点,等着被收购吧。

  本期其他新闻

  “云服务将重新定义软件生态”——近日,谷歌发布了一款新应用Hire,帮助中小企业更高效地寻找及招聘新员工。Hire瞄准当前Google Suite的用户。这些企业用户已经使用谷歌的云计算软件平台,其中包括Gmail、Calendar、Hangouts、Drive和Docs等服务。Hire则将G Suite的功能拓展至招聘领域。其实简单理解,就是使用谷歌的云计算用户,可以利用谷歌云上的新软件进行员工招聘。

  “火星表面可能有毒”——《科学报告》上的一篇论文称,由于火星表面存在名为高氯酸盐的化合物,因此火星表面可能具有杀菌性。虽然人们怀疑火星表面存在毒性已经有一段时间了,但是这项研究发现证明了火星表面对细胞有剧毒,这是由氧化剂、氧化铁、高氯酸盐和UV射线所造成的。这些发现对行星保护有重要意义,尤其是在应对由机器和人类探索对火星造成的潜在污染上。

  “数据+云计算+AI战略继续推进”——百度与微软宣布,双方已经达成了推进无人驾驶业务合作相关的协议,双方计划在全球范围内就无人驾驶加强技术研发和渗透等展开合作。作为Apollo联盟的成员,微软还将向百度在中国市场之外的全球合作伙伴提供大量的Azure云服务。

(责任编辑:邓浩)

精彩图片