像药品和设备一样,算法也应该有“说明书”

2019年01月23日 07:35   来源:南方日报   涂子沛

  “算法越智能,越能使用户被‘安排’进所谓‘信息茧房’。久而久之,用户处于信息‘自我禁锢’困境。”《人民日报》日前刊发了一篇题为《大数据社会需要考虑算法治理》的文章,再次提到“算法偏见”的话题。这让人联想到前一段时间喧嚣一时的“大数据杀熟”争议:一边是网友控诉在一些旅游票务预订平台“同一航班的机票,卖别人2500,卖我3211”,另一边是平台坚称“从来没有,也永远不会利用大数据损害消费者利益”。

  不可否认,自从有了智能手机,我们的生活越来越方便。不过手机只是一台机器,真正主导手机运行结果的却是算法——算法在手机的背后,手机看得见,算法却看不见。在搜索引擎键入关键词,出来什么结果、按照什么顺序排列,是算法决定的;在互联网平台打车、预订机票酒店,搜索商品和服务,谁能接单、出来什么价格,也是算法说了算。算法还能为你自动匹配好友、找到理想员工,甚至抓到嫌疑犯。很多时候,我们消费者在接受这些个性化服务的时候,真有如沐春风之感。

  但是,我们也在付出难以察觉的代价。越来越多的研究者发现,一些算法可能存在公平问题、涉及歧视甚至存在“不当收费”,损害了大众利益,成了少数公司谋取不当收益的工具。

  “大数据杀熟”就是其中一个争议。在人手一屏的时代,互联网公司可以通过算法实现千人千价,同一件商品,价格可以因人、因地、因时随时改变,即动态定价和加价,例如遇上下雨天、高峰期,现在打车平台都要加价,但加价的算法到底是如何运行的呢?是不是我们拒绝加价,叫车的优先级就会被算法降低,甚至被暂时排除在算法匹配的序列之外?这个还真不好说。

  事实是,今天这个数据时代,手机联接了我们,但同时手机又在割裂我们。虽然是同一部手机,但每个人输入的数据不一样,服务的结果也可能不一样。如果要直指问题的关键,那就是:我们必须知道算法运行的逻辑和决策的标准究竟是什么。

  问题是,自诞生以来,一个算法是如何设计的,它就是一个商业公司的核心机密,对所有消费者而言,算法像一个黑盒子,除了公司的高级管理人员和算法开发人员,一个公司的普通员工都无从知晓黑盒子里的秘密,更不用提消费者了。那么,我们究竟应该怎么办?算法需不需要治理?

  在我看来,把算法的开发和设计列为商业秘密,可以理解、也可以接受,但算法的逻辑和“功效”,应该是可以公开的。这就好像药品,其制药的工艺过程可以是商业秘密,但一个药的成分和功效却是应该、也必须公开的。否则消费者怎么能、又怎么敢把它吞下口呢?

  把算法比作药品,是指它和药品一样,能够解决某种特定的问题,换一个角度看,算法输入的是数据,输出的也是数据,它服务大众、完成某种功能,它也可以被视为云端这条大流水线上的一个设备,不过是虚拟设备罢了,既然是服务大众的设备,那就应该有说明书,没有说明书就用,那是乱用,和不看说明书就把药吃了,又有什么不同呢?

  考虑到算法对人类生活方方面面的重大影响,把算法比作药品或者是保健品,并不为过。在很多聚合性资讯平台上,其算法决定了读者可能会读到什么,这些读到的东西,毫无疑问会影响一个人的心理和意识甚至精神的健康。一颗药丸要进入市场,生产厂家必须对它的成分、性状、功用、服用方法以及可能产生的副作用逐一作出说明。对应到算法,它也应该有“成分、性状和功效”说明,对其输入、输出的数据,互联网公司也应该作出说明,其说明的真实性甚至还需要接受市场管理部门的审查。

  可以预计,今天及未来的城市生活,将会越来越依赖算法,算法将无处不在,算法治理是一个公平社会、效率社会必须关注的问题。传统互联网,其治理的重点常常是内容;今天和未来,我们要对算法进行合理适度的治理,需要专业的人员和机构。在前不久的新一轮政府机构改革中,包括广东在内的许多省市纷纷成立了大数据管理局。或许,在不久的将来,在大数据管理局或者市场监督管理局可以增设监督算法公平的职能和岗位。

  【作者涂子沛系大数据专家,数文明(广东)科技有限公司CEO】

(责任编辑:李焱)

精彩图片