
北京时间11月26日早间消息,据英国《卫报》报道,谷歌聘用的一名摩洛哥裔英国外包员工在工作过程受到不公平对待。为此,谷歌被迫支付4000英镑和解此案。
这位化名艾哈迈德·拉希德(Ahmed Rashid)的员工表示,此前他在英国各大商场为谷歌进行秘密研究的过程中,经常因为自己的种族身份而被当做恐怖分子嫌疑人。而在他提出投诉后,原本获得的一份新合约也被谷歌突然取消。

谷歌当时否认不当行为,但同意向拉希德支付4000英镑和解此案。作为该和解协议的一部分,拉希特同意不谈论此案,但在看到谷歌员工在世界各地抗议该公司的各种歧视行为后,他决定披露此事。
拉希德表示,他当时负责为谷歌收集目标购物中心中的各个商店的WiFi信号强弱信息。这个名为Expedite的项目意在帮助谷歌地图用户通过WiFi数据、而非GPS信号进行室内定位。所以,拉希德和他的团队必须在目标商场内部走来走去,然后将信号记录在他们手机上的谷歌应用中。
但由于要在商店和商场不知情的情况下开展工作,并被禁止向店内员工透露自己的身份,导致他很容易遭到种族歧视。他还表示,谷歌要牺牲合同工的安全来开展这项秘密研究,而这恰恰迎合了人们对穆斯林和阿拉伯人的偏见。
他说:“我是团队中唯一一个明显有阿拉伯血统的人。我经常被保安和工作人员阻止。但我又不能告诉他们我在为谷歌工作。我很害怕去工作,因为我担心自己被逮捕。那10个月时间,我就是这么过来的,感觉很孤独。我甚至一度想过自杀,我的外表让我感觉自己就是个被遗弃的人。”
拉希德的一位白人前同事表示,谷歌本应采取更多措施保护拉希德。他说:“如果我们所有人都有身份证明就会很有帮助,因为我们都被拦下来过。但我们很多人都没碰到麻烦,因为我们是白人。谷歌应该给他提供更多帮助。”
拉希德曾经在西伦敦的Westfield商场被保安拦下,而该商场的发言人也证实他们没有参与这个项目。
拉希德表示,他曾经多次向谷歌汇报此事,希望能够获得一个工卡来避免遭到怀疑。但谷歌并未理会这项请求。当他投诉自己去年9月29日在罗姆福的Liberty购物中心被保安跟踪的经历后,一份原本已经承诺给他的新合同却被谷歌撤销。
拉希德还表示,他还在欧洲从事过跟购物中心地图绘制有关的一个项目,该项目就会事先通知商场,但也不会为其提供工卡。他也在巴黎和那不勒斯的购物中心遭到保安的盘问。
拉希德认为,谷歌未能认识到阿拉伯背景的研究员会遭到何种对待。世界各地的谷歌员工都要求该公司停止使用保密协议来强迫受害者保持沉默。作为回应,该公司也修改了性骚扰政策。拉希德则认为,该公司应该更进一步,修改跟种族歧视有关的政策。
谷歌证实其的确会定期派人收集WiFi信号。但该公司也表示,这些都是公开信息,不必寻求许可。该公司发言人说:“如果有人问及,我们会要求他们直接表明自己为谷歌工作的身份。”
相关阅读:谷歌推出新方案,图像标注速度提高三倍
谷歌AI团队近日推出了一款新型图像标注方式——“流体标注”,即采用机器学习来注释分类标签并勾勒出图片中的每个对象和背景区域。谷歌官方表示其可将标记数据集的速度提高三倍。
百度众测平台去年曾发布了5000万元的数据标注任务,而今年预计将达3亿元。面对如此大的市场需求,效率低、交付质量参差不齐的人工标注方式亟待改善。谷歌此次推出的“流体标注”如何为图像标注提速?
数据标注——机器感知世界的起点
“数据标注是人工智能产业的基础,是机器感知现实世界的起点。从某种程度上来说,没有经过标注的数据就是无用数据。”美国加州科技大学校长秦志刚教授在接受科技日报记者采访时表示,机器识别事物主要通过物体的一些特征。被识别的物体还需要通过数据标注才能让机器知道这个物体是什么。
在机器的世界里,图像与语音、视频等一样,是数据的一个种类。近年来,随着数码产品以及存储技术的迅速普及和发展,人们每天都可通过相机、可视电话、监控及医疗设备等制造大量图像。因此,现阶段图像已然成为标注产业发展的重点对象。
如果素材是一张人物图像,那么需要标注的信息往往是性别、面部朝向、人种、有无帽子眼镜等,也可以人为地将人物和背景的区域划分开来。将成千上万张经过标注的图片组成的数据集“投喂”给机器,它才能在一张全新的图像中分辨出人物在哪个区域、具有怎样的外貌特征。对于人来说“小儿科”的思考历程,机器却需要大量的标记数据集进行训练。
机器学习——缓解人工标注的压力
提到人工智能产业,人们往往联想到繁华的城市和干练的IT精英,但实际上,支撑起人工智能的数据标注产业,却是一个劳动密集型产业。百度搜索“数据标注”,会出现很多图片语音视频数据采集、标注公司。随机选择一个此类词条点进去,往往会看到“万人数据标注团队”等类似宣传语。可见人工标注是目前数据标注的主要方式。
“谷歌推出的流体标注模型主要利用人工智能学习的基础,对图像数据进行自动标注,对于标注不准确或者出现偏差的地方可以通过人工调整,从而提高标注效率。”秦志刚指出,即便该模型可借助机器学习提升标注速度,但最初还需进行人为地数据标注,为其提供初始训练数据集。事实也正是如此,为了标注图片,谷歌预先以约一千张具有分类标签和信任分数的图片训练了语意分割模型。
但该模型尚不完美,谷歌称,物体边界标记问题、界面操作速度以及类别扩展等仍需进一步研究或完善。
人工智能——致力于生活中的简单应用
虽然还有诸多难题尚待攻克,但以流体标注模型为代表的数据标注新方式无疑顺应着人工智能的大潮流。实际上,自人工智能逐渐走热以来,很多行业都想搭上这个热潮。然而,在灼热的潮流背后,掩藏着一个根本性的问题:人工智能终将走向何方?
“人工智能的本质是机器拥有‘学习’的能力,可想而知,人工智能可以极度缩短人类自身的学习时间,从而将人从大规模脑力学习活动中解放出来,去专注于更有价值的工作。”秦志刚表示,虽然人们普遍认为人工智能终将到来,但现阶段人工智能产业仍在云端。目前大多数人工智能的应用只能生存在高性能处理器的大型厂房中,就如同第一代通用计算机ENIAC一样“大而笨重”。“众所周知,随后的几十年内计算机飞速发展到小型的笔记本电脑,功能却比ENIAC更强大。人工智能也当如此”。
界面简单、功能友好、毫无相关知识基础的人都能使用并获得舒适感,这是秦志刚设想的人工智能时代。一枚小小的人工智能芯片,可以完成学习、训练、推理等一系列“思考”过程,而它的终端表现则或许只是人们生活中最为常见的简单应用。如下班回家,不需再拿出钥匙开门,智能门锁就像一位尽职的管家,会在第一时间感知你的到来,为你敞开家门。“十年之后,人工智能将会成为主流,潜移默化渗透到生活中的各种角落。别看是小事情,背后却是高密集的技术支撑。”秦志刚表示。
“愿景十分美好,但如何将人工智能落地和普及推广?这将是我们下一步亟待攻克的难题。”秦志刚说。