从“透明化”到“取中”,打开算法“黑箱”共需要几步?

如果有一天,对象真的是国家发的,会发生什么?

《黑镜》里就有这么一个故事:为降低离婚率,未来社会开发了一套系统,运用算法和大数据来做婚恋配对。这套系统规定了人们的试婚对象和相处时间,不停自动匹配,直到找到最完美的对象才会停止。

这个科技寓言,似乎正在日本上演:日本政府为了应对少子化,决定斥资20亿日元引进AI婚配系统。此前,日本埼玉县的试点称得上成果卓然:两年时间里撮合成功了69对情侣,其中一半是这个AI婚配系统选出来的[1]。

纵观全世界,“AI婚配”可以算是算法接管生活的一个缩影:人们起床靠微博/Twitter吃瓜,出行靠滴滴/Uber打车,吃饭靠外卖软件选餐,上班摸鱼则有国情差别,国外在Reddit上侃大山,国内上淘宝剁手。

你想要什么,你关心什么,背后自然是靠算法运转来决定,但调配生活方方面面的算法,过去一直处于“黑箱”:它吸纳数据、分析数据,推荐的逻辑却不为人所知,还常有匪夷所思的时候。比如说,都过了七年之痒,还推荐同城单身的空姐MM;我以为我是你的尊贵会员,没想到我只是大数据杀熟的韭菜。

这一切都在悄悄改变。近期,国内互联网公司率先打破了算法的“黑箱”。美团、微博、滴滴等平台陆续公布算法规则,也在尝试对现有算法做出改进,践行“算法取中”——在效率至上的算法模型里,加入人性的考量。

那么问题来了,

1. 为什么要揭开算法的黑箱?

2. 如何才是打开算法黑箱的正确姿势?

算法困境

算法第一次成为街头巷尾的热谈,离不开2016年那场惊心动魄的“人机大战”:当人工智能AlphaGo以4:1的成绩完胜顶级围棋手李世石,AI也被外界赋予了改变世界的想象。

自那以后,国内掀起了AI创业潮,算法也被逐渐应用于更多领域,人们的生活消费、城市的安防系统、机构的效率提升都离不开算法。但在提升社会运转效率的同时,算法也带来了一些隐忧。

在消费者端,熟客高定价,新客低定价的大数据版“杀熟”,屡见不鲜。原因在于,按照效率至上原则,已经养成消费习惯的老客无须让利,但新客还在不同平台之间摇摆,补贴可以促进成交。

在企业端,一些公司不仅用算法监督员工,更激进地赋予算法决定员工去留的权利。比如电商巨头亚马逊,在招聘、用工等环节十分依赖AI算法的管理。

亚马逊会用AI摄像头和可穿戴设备记录员工的工作表现,AI会追踪员工从货架上挑选和包装物品的速度和时间,并向表现不佳的员工提出解雇通知,整个过程不需要与主管会面,有近900人因“工作效率低”直接被AI解雇。

图为亚马逊用AI系统开除员工的报道
图为亚马逊用AI系统开除员工的报道

此外,算法还引发了有关社会偏见的讨论。例如,用AI筛选简历的亚马逊被批有性别偏见;《科学》杂志研究表明,美国用一套算法帮医院确认病人是否需要额外护理,这种算法对黑人群体存在偏见。

科幻电影习惯于把AI刻画成无所不能的形象,但事实证明,算法并不是万能的:算法一味追求准确和效率,却不考虑带来的各种影响。

皮尤研究中心曾在研究报告《算法时代的利弊》中指出,算法的编写主要是为了提升效率和盈利,并没有考虑相应的社会影响,缺乏对个体的考量。人类会被算法当做是过程的“输入量”,而非有思考、有感觉的生物[2]。

解决问题的第一步,是发现问题。由于平台不公布具体算法、规则和数据,利益受损者往往还很难为自己举证。

因此,全球不断有专家学者呼吁着算法“透明化”,即公开算法规则,使其接受社会监督;科技公司们也在透明化的路上不断摸索。然而,从算法的“黑箱”走向公开并不容易。

算法透明

2018年,Facebook的“泄密门”将扎克伯格送上了听证会。在两天持续10小时的听证会上,扎克伯格解释了平台是如何追踪用户行为并推荐广告的[3],但涉嫌“操纵选举”的指控仍然存在。

Facebook CEO扎克伯格出席听证会
Facebook CEO扎克伯格出席听证会

同年5月,欧盟《一般数据保护条例》正式施行,该法规对商业平台收集用户信息予以约束,让消费者有权了解个人数据是如何被平台收集、处理和分析的。

次年,Facebook首次公布了信息流及推荐广告的算法规则,让用户了解为什么能看到这条推文或广告[4],海外巨头们纷纷开启了算法透明化的尝试。

让算法公开透明,是为了让外界了解算法的运行原理,在听取多方诉求后,才能做出改进优化。

但“透明化”的难题也随之而来。算法之所以被称为“黑箱”,是因为它由复杂的代码组成,一直在动态变化,很难被公众理解。更重要的是,商业公司将算法视为核心资产,全部公开无异于将过去的巨额投入拱手于人。如何公开,公开到什么程度,便成了一个问题。

实际上,算法“透明化”有两种途径:其一是程序代码的透明化;其二是算法原理的透明化。在实际操作中,公开算法原理比程序代码更为可行,这既能保护公司的知识产权,又容易让公众理解。

今年以来,美团、微博、滴滴在内的国内互联网公司也陆续公开了算法的运行原理。

5月,滴滴公开了司机端的抽成、以及面向司机派单的算法规则。滴滴表示,乘客为打车所付的费用中,79.1%构成了网约车司机的收入,10.9%给了乘客补贴优惠;剩下的企业经营成本(包括技术研发、线下运营等)占了6.9%,而平台的网约车业务净利润仅占3.1%。

滴滴还解释称,平台收取高抽成再补贴给司机和乘客,这种二次分配是为了激励司机“多劳多得”,方便乘客在高峰期和热点区域打车。

8月,微博公布了热搜榜单以及广告位的排序规则。微博指出,热搜词看的是综合热度,即搜索量、发博量、互动量、阅读量等数据指标。

至于热搜中的两个广告位置,分别位于第3、第6位热搜词之下。其中商业广告会展示“商”标签。广告位不参与热搜排序竞争,也不会影响其它词的热度计算。

9月,美团外卖也首次公开了骑手配送时间的算法。美团指出,用户点餐时的“预估送达时间”并非是由“最近距离除以最快速度”,而是考虑骑手实际配送中存在的各种不确定因素。这意味着即便是相同路线的订单,每天给骑手和用户参考的配送时段也有所不同。

美团在预估送达时间上设置了多重保护,既有模型预估时间、也分别考虑了城市交通、配送距离、配送环节等多个维度下的配送情况。美团会从四种方案中选择最长的时间,作为订单页面显示的“预估到达时间”,这也给了骑手更人性化的配送节奏。

从“透明化”到“取中”,打开算法“黑箱”共需要几步?

不了解会产生误读,以前消费者往往会抱怨网约车平台派车难、骑手送餐慢,在了解司机、骑手群体的配送算法后,或许能增进一些理解。

算法透明化只是第一步,如何才能对算法的局限性做出改进?

算法取中

对此,国内创造性地提出了“算法取中”的概念。这意味着要在效率至上的算法里,加入人类社会的价值观和价值取向。

今年7月,包括市场监管总局在内的七部门联合发文保障外卖送餐员权益,要以“算法取中”替代“最严算法”,明确不能以“奥运冠军的水平作为普通人的考核标准”。

“算法取中”,是指要兼顾平台效率与劳动者保护,更要在企业利润和社会责任间做平衡。不过,“算法取中”目前仍是一个模糊的概念,难以定量。

上海人工智能研究院技术总监沈灏指出,这种情况通常要设置一个适当的阈值,再针对各个业务场景做大量调研,最终形成相对可量化的方案,有理有据地对企业算法做监管[5]。

“算法取中”既需要企业自我改进,也需要政府宏观调控,两方都进行了各自的“取中”尝试。

“算法取中”的第一个试验田在外卖配送。作为劳动密集型产业,骑手的安全保障问题已经引发全社会关注。

为保障骑手安全,美团率先对算法进行了“取中”改革。

为此,美团还组织了多场骑手恳谈会。通过了解骑手诉求和专家意见,美团率先将外卖的“预估送达时间”由“时间点”调整为“时间段”。这意味着面对配送过程中的各种不确定性,骑手有更弹性的时间段应对。

除此以外,将近75%的骑手还指出影响配送时间的两大难题——商家出餐速度慢、最后几百米交付难。

通过对超时订单和客诉订单做大数据分析,美团对“出餐慢”和“交付难”的重点场景进行“补时”。

例如,根据历史数据识别出长期出餐较慢的商家,相应骑手自动获得配送延时;一些小区管理严格不让电动车进入,或者个别用户预留地址错误等,相关订单也会自动延时。平台还用系统延时和人工补时给骑手上了“双保险”。

看似只是修改了代码,但想贯彻“算法取中”对平台来说绝非易事。

在美团平台上,每天有大量骑手奔波在大街小巷,有770万活跃商户开张迎客,更有6.3亿用户在平台上消费着吃穿住行。

在这庞大的系统中,任何改动往往是“牵一发动全身”,平台既要有魄力去推动改革,又要有能力平衡系统中商家、骑手和消费者三方的利益。

目前,美团的“算法取中”已经初具成效。在新算法机制下,骑手的配送时间更弹性,用户对送餐时间多了心理预期,试点数据显示用户对骑手的差评率降低了50.7%。

今年7月,浙江推出“浙江外卖在线”的数字化外卖监管系统,该系统集合了法务、商务和政务数据,能让企业的营业执照、食品经营许可证等商家资质信息在平台流通,也能将商家和骑手的服务视频直接作为存证。

自试运行以来,“浙江外卖在线”已纠正后厨问题5044个,处理违规商家184家,处理劳动纠纷2371件。

除了外卖巨头,内容消费平台也开始尝试“算法取中”。当社交平台成为新的公共舆论场,其算法推荐机制不仅要考虑平台利益、用户兴趣,更要考虑相应的社会影响。

海外社交巨头毫无节制的算法推荐已经引起担忧。像Facebook曾在自动推荐算法中推荐极端团体,社交巨头也曾被指通过呈现或隐藏某些内容来操纵言论,这都让内容平台的“算法取中”迫在眉睫。

国内的社交媒体微博,同样承担了公共舆论场的角色。为此,在公开热搜机制之余,微博还优化了算法推荐机制,将加大正向内容的宣推力度,调控负面事件、娱乐话题等。

微博还指出,上半年热搜将“减少娱乐占比”作为主要调控目标。热搜榜单的算法中包含了严格的排水军和反垃圾机制,能保证热搜榜单的客观。

在用户反馈、企业改进和政府调控的三方合力下,算法的“黑箱”里透进了光。

尾声

从电脑时代到手机时代,平台以前所未有的速度获得用户的海量数据,再通过数据的解构进行需求的匹配,围绕着用户的衣食住行。在这个过程中,一座座互联网商业大厦崛起。

但算法分发并非是把所有决策都交给机器,更需要平台和政府不断纠偏、设计、监督。在提升社会效率的同时,科技公司也开始承担起更多的社会责任,追求“科技向善”。

放眼人类历史,社会进步本身就伴随着透明化的进程。决策更透明,商业规则更透明、算法更透明,而一个越透明的社会,越能释放出更多可能性。

全文完。感谢您的耐心阅读。

参考资料:

[1] 日本准备推行AI婚配,年轻人会为“爱情算法”买单吗?钛媒体

[2] Code-Dependent:Pros and Cons of the Algorithm Age, Pew Research Center

[3] 两天鏖战10小时,扎克伯格“受审”到底意味着什么?,每日经济新闻

[4] Facebook 首次回应信息流排序方式,还可能为高质内容付费,好奇心日报

[5] “算法取中”监管:“阈值”最终应回到劳动力市场验证,澎湃新闻

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫

相关推荐

发表回复

登录后才能评论