自动驾驶研发的背面:凯翼汽车被奇瑞抛弃 众包模式被指不靠谱


来源:21世纪经济报道   时间:2020-09-10 20:46:04


原标题:汽车业变“软”另一面|众包模式现隐忧

众包工人们是市场规模达近千亿美元的自动驾驶领域重要一环。

自动驾驶控制算法工程师,上海张江,34K。

路径规划与控制算法工程师,北京中关村,40K。

这些岗位给出的待遇条件无疑都是诱人的。

不过,从事自动驾驶研发工作并不意味着铁定月薪30K以上,另一种可能性则是月薪300元。

自动驾驶研发的背面:众包

软件定义汽车,这一概念正在汽车行业得到越来越多的认可。汽车这一原本硬件导向的产品也正在变得软硬兼备。

整车企业的“服软”却并不仅仅局限于将中控显示屏做得更巨大,也不仅限于将漂亮的软件界面放在产品目录的扉页,更是渐渐体现在整车企业的员工队伍之中。

熟练的流水线技术工人已经渐渐不再是车企员工给公众的第一印象,车企的雇员也同样可以是一名端坐在数个硕大显示屏之前的电脑极客——至少这也是特斯拉希望给公众留下的印象。

遗憾的是,始终很少有车企愿意承认,这些光鲜亮丽的极客背后却存在着一大批看不见的地下工人。他们被叫做众包工人(Crowdworker)或鼠标工人(Clickworker),他们也被称为数字化时代的被剥削阶级。

图像语义分割是他们的工作职责,大陆、博世、宝马、奔驰、谷歌是他们的甲方。

而他们的实际工作待遇则是:一台电脑、一张椅子,每天长达至少10至12小时的工作时间。工会组织、正式合同、五险一金均不存在。他们绝大多数都是来自菲律宾、委内瑞拉、肯尼亚、马来西亚等欠发达国家的廉价劳动力。

这些众包工人们虽然工资微薄到仅有40美元的月薪,但他们却是市场规模达近千亿美元的自动驾驶领域最重要的一环。

一帧图片中的物体标注

自特斯拉横空出世,将通过自主车载操作系统收集每辆汽车的行驶数据变成现实以来,海量的用户数据便开始从成千上万辆汽车终端涌入整车企业总部。而这些数据最重要的用途之一便是用来训练自动驾驶控制算法。

无论是较为基础的模式识别算法和支持向量机,还是更为流行的前馈神经网络、卷积神经网络和深度信念网络,这些专业术语背后的控制算法无论多么优秀,但在进行大规模的训练之前都犹如新生儿一样是一张白纸。

而让这张白纸变得更聪明的方法便是通过大量的训练数据集对其进行持久的训练。不过任何训练数据在应用之前都需要经过人工标注(即Labeling)。就好比是最基础的模式识别算法在学习训练过程中也必须知道某一张图片所对应的正确答案,才能自主地寻找到判断的规律。

场景简单的模式识别算法可能仅仅需要识别一个数字,其所需的人工标注自然也仅仅只是一个数字。但是对于复杂的日常行驶场景而言,需要进行人工标注的对象则复杂得多。

一个合格自动驾驶控制算法需要识别行人、车辆、建筑物、障碍物、交通标识等各种可能出现的对象,这也意味着其训练数据中也必须配有对应的标注。针对自动驾驶控制算法的训练数据集往往是通过摄像头搜集而来的行驶录像,为了确保算法质量并满足汽车行驶的安全性要求,这些训练算法专用的录像必须在每一帧图片上进行像素级的标注。

一个典型的标注过程便是对每一帧图像中出现的所有重要物体进行像素级的描边,并手动对其进行分类,而这一枯燥的工作至今未有太好的自动化解决方案。

枯燥还只是人工标注的第一大难题。其最大的困难之处在于天文数字级别的工作量。仅以最常见的30帧视频文件为例,一份总时长达10万小时的训练数据就相当于100亿张图片。考虑到对一帧图片进行仔细的人工标注通常耗费3小时,处理完整个训练数据需要一名员工工作350万年。

如何才能摆脱此种窘境?

就犹如在软件研发领域上向硅谷巨头们看齐一样,硅谷巨头们也早已给出了答案:众包(Crowdsourcing)。

劳务良方还是公关定时炸弹?

早在2005年,亚马逊便首开先河成立自己的任务分发平台MTurk,试图激励全世界范围内的自由职业者们抽出时间为其完成大量的琐碎工作。这其中包括为Yelp网站进行评论和词条的编辑与筛选,翻译电商平台上的商品产品说明以及为商家填写日常行为数据等。而完成一小份工作的酬劳则仅为象征性的10美分,这也被视为众包模式的诞生。

一帧图片中的物体标注

很快,整车企业们便意识到该模式可以为其解决自动驾驶控制算法训练数据的标注问题。

2017年自动驾驶得到了资本市场的极大关注,一时间包括谷歌Waymo、通用Cruise、百度Apollo、小马智行在内的一大批国内外自动驾驶企业得到了前所未有的关注和资本支持。自动驾驶的大爆发也带来了训练数据人工标注之类的累活开始爆炸式增长。

在巨大需求的持续刺激下,全球范围内活跃的众包平台已经达到了2000余个。其中Mighty AI、Samasource、HiveMicro、Spare5、Remotask等平台专注于自动驾驶数据的人工标注。仅在2017年当年,Mighty AI的客户名单中就突然出现了福特、丰田、本田、通用的名字,而Samasource的客户名单中也在2018年增加了大众、大陆、福特和通用。

目前通行的规则是,整车企业会将需要进行标注的海量视频上传至众包平台。平台则负责将视频切割成小段并分发给全球的众包工人们,百万余名全球的众包工人只需在平台上进行注册并完成简单的视频教程便可以开始接单。而在这一过程中,众包工人们与车企没有也不需要任何一句交流。

简单重复、低门槛自然也意味着酬劳极其微薄,即便自动驾驶企业和整车企业并不缺乏资金。大多数以人工标注为生的众包工人月薪始终维持在30至40美元,而整车企业的普通工程师月薪则均在5000美元以上。众包工人们的工资是如此之低,以至于众包平台会将同一视频片段重复分发给不同的众包工人以确保标注的冗余性和准确性。

“这让人想起工业化初期被剥削的工人阶级,(资方)以低廉的小时工资支付报酬,而现在则变成了分钟工资。”开姆尼茨(即原卡尔马克思城)大学教授帕尔斯多尔夫(Christian Papsdorf)无奈地表示。

对于在尾气门之后愈发注重企业公众形象的整车企业而言,大规模使用贫困国家的廉价劳动力无疑是个潜在的公关定时炸弹。

事实上,包括德国最大的工会组织IG Metall在内的多家工会组织都公开批评过滥用众包工人的现象——无论是出于对众包工人的同情,还是担忧未来众包工人终会抢走自己的饭碗。

面对质疑声,整车企业的回应则是没有回应。大众集团和宝马虽然都对使用众包平台不置可否,但均宣称因商业竞争原因对此拒绝发表评论。而一向以豪华、奢侈为定位的戴姆勒更是拒绝透露或承认使用过众包平台,即便戴姆勒在印度Infolks平台上大量使用众包工人早已是公开的秘密。

除了整车企业的消极应对之外,众包工人们始终缺乏社会关注的原因之一便是每一家自动驾驶企业都会避免提及控制算法背后这一听上去就落后、重复、机械的人工标注流程。而在另一方面,即便是些许蝇头小利也足以吸引大量贫穷国家的众包工人。其中最典型的代表便是经济问题严重的委内瑞拉以及其他通货膨胀严重的南美国家。支撑这些工人继续从事的原因只有一个——这些微薄的薪资是以美元或欧元等硬通货支付,而不是一点也不强势的强势玻利瓦尔。

不过,相比起在众包问题上遮遮掩掩的整车企业和自动驾驶初创企业们,零部件企业则相对淡然得多。拥有400人自动驾驶工程师团队的海拉电子就公开承认公司外包,有超过600名众包工人,其中15名来自德国,100名来自菲律宾,其余均来自Samasource平台。

特斯拉Autopilot中的物体标注特斯拉Autopilot中的物体标注

而大陆集团更是决心通过提高自动化和智能化程度彻底解决众包模式这一难题。7月28日,大陆便宣布与英伟达共同在法兰克福建立超算中心,主要目的便在于开发用于训练视频数据标注的人工智能算法。

劳务模式剧变?

众包模式在自动驾驶领域得到大量应用并不意味着该模式对于汽车产业的影响也仅局限于自动驾驶算法开发。

一个开启颇具争议众包造车模式的便是奇瑞旗下的凯翼汽车。

“汇聚大众智慧”、“互联网思维的众包”、“去中心化的大众决策为基础”、“中国汽车行业内第一家在设计上采用众包模式的车企”,2017年时凯翼汽车头顶的光环数不胜数。

虽然不到一年时间,凯翼汽车就被奇瑞彻底抛弃,其众包模式的噱头也被认定为不靠谱,但是不可否认的是,汽车企业“服软”的过程不仅是增加软件在产品价值中的比例,还需要面对软件世界中扁平化、敏捷化以及原子化这些特点的冲击。

这也体现在整车企业的人力资源管理上。曾几何时,整车企业以拥有固定规模的优质技术工人为立身之本,强大的工会组织、相对优越的薪资水平以及稳定的职业发展规划不仅是汽车产业吸引人才的招牌,也是确保技术积累留在本企业的最佳方法。

但是如今,随着软件世界的敏捷性开发、DevOps、以Jenkins和Bamboo为代表的持续集成工具这些概念逐步成为常态,曾经依托于企业提供的硬件环境和丰富技术积累的经验性岗位正在变得不那么吃香。

一位优秀的生产工程师确实需要工作经验掌握各种制造工艺,并对企业产线布局和汽车原理了然于心,但是对于一名软件工程师而言,凭借着敏捷性开发工具和虚拟化技术的普及,软件工程师仅需要关注技术本身而无需对其具体应用场景过分关注,甚至开发环境是基于Windows、Linux都无足轻重。

自动化程度的提高也意味车载软件的迭代开发和持续集成变得极其标准化。在运行环境设置完毕之后的车载软件版本迭代甚至仅需九年制义务教育水平即可胜任。简单、重复、高度标准化,这也是众包模式最为擅长的领域。

软件定义汽车,如果这一概念成真,那么软件将定义的将不仅仅是汽车本身,重新被定义的还将包括整个汽车产业的方方面面。

(作者:钱伯彦 编辑:张若思)

  版权及免责声明:凡本网所属版权作品,转载时须获得授权并注明来源“融道中国”,违者本网将保留追究其相关法律责任的权力。凡转载文章,不代表本网观点和立场。

延伸阅读

最新文章

马斯克V.S薛其坤:立足当下 对人类未来展开无限想象 马斯克V.S薛其坤:立足当下 对人类未来展开无限想象

精彩推荐

图文观赏

众安在线扭亏为盈:2020年净利5.5亿 数字生活生态驱动增长 众安在线扭亏为盈:2020年净利5.5亿 数字生活生态驱动增长

热门推荐