公众号
关注微信公众号
移动端
创头条企服版APP

你的隐私正在被硅谷窃听

7102
猎云网 2019-12-15 09:04 抢发第一评

猎云网(微信号:)】12月15日报道(编译:油人)

Ruthy Hope Slatis简直不敢相信她所听到的。她曾被波士顿郊外的一家临时机构雇用,为亚马逊转录音频文件,这是一项被亚马逊所模糊的工作。作为每小时只拿12美元薪酬的合同工,她和同事(正式名称为数据助理)需要听取随机交谈的片段,并在自己的笔记本电脑里记下听到的每个单词。亚马逊对外只会说这项工作对其绝密的语音识别产品至关重要,然而,这些语音片段中却包含着用户亲密时刻的录音。

2014年秋天,亚马逊推出了Echo智能音箱,该设备带有语音激活虚拟助手软件Alexa。亚马逊在其首个Echo广告中将Alexa视为人工智能的奇迹。在该广告中,一个幸福的家庭正在命令Alexa接收新闻更新、回答问题答案,并帮助孩子们做作业。但是,Slatis很快就开始意识到人类在这款产品背后的影响力。她记得当时自己在想:“天哪,这就是我正在做的事情。”亚马逊会捕获云中的每个语音命令,并依靠像她这样的数据助理来训练系统。一开始,Slatis认为自己所听取的片段来自有酬劳的测试人员,这些测试人员自愿用自己的语音模式来换取几美元的奖励。然而,她很快意识到这个想法是错误的。

她和她的同事正在听取的录音通常很激烈、很尴尬,而用户也会在音箱面前承认自己的秘密和恐惧。随着转录项目的发展以及Alexa的流行,录音中透露的私人信息也随之增加。其他合同工回忆说,自己听过孩子分享了他们的家庭住址和电话号码,听到一名男子试图订购性玩具,甚至听到一名晚宴客人大声地想知道亚马逊当时是否正在偷听。Slatis说:“用户往往只是开玩笑,但其实完全不知道自己正在被偷听。”她于2016年选择了辞职。

自从Slatis第一次感到毛骨悚然以来的五年中,四分之一的美国人购买了“智能音箱”设备,例如Echo、Google Home和Apple HomePod。到目前为止,亚马逊已经赢得了这场销售大战,据报道,用户已经购买了超过1亿个Alexa设备。但是如今,这些全球最大的公司之间正在展开一场新的战争,通过将麦克风内置于手机、智能手表、电视、冰箱、SUV等各种物品中,把Alexa、Siri、Google Assistant和Cortana嵌入到人们的生活中。咨询公司Juniper Research估计,到2023年,全球智能音箱的年市场规模将达到110亿美元,语音控制设备将达到约74亿个,这相当于地球上的每个人都拥有一个设备。

而现在的问题是,我们要如何处理这样的规模呢?按照科技公司的声明,这些机器并没有每时每刻创建音频文件,因为智能音箱仅在用户激活它们时才录制音频。但是,当始终在线的麦克风被引入厨房和卧室中时,它们可能会无意间捕获到用户不想共享的声音。“麦克风始终在线是一件令人忧心的事情。我们发现这些设备的用户往往会很相信公司不会对其记录的数据做任何坏事,”密歇根大学教授Florian Schaub说道,他主要研究语音命令软件背后的人类行为。“隐私的不断侵蚀正在不断发展。人们不知道如何保护自己。”

亚马逊拒绝了对此事的采访请求。一位女发言人在一封电子邮件声明中写道:“隐私是每个团队和员工设计与开发Alexa功能和Echo设备的基础。作为我们安全培训的一部分,所有Alexa员工都接受了客户数据处理方面的培训。”该公司及其竞争对手皆表示,计算机无需人工审核即可执行绝大多数语音请求。

然而,这些所谓的智能设备无疑需要依赖成千上万的低薪人群,他们需要在这些声音片段中添加注释,以便技术公司可以升级其“电子耳朵”。至此,我们最微弱的耳语竟成为科技公司最有价值的数据集之一。今年早些时候,彭博社首先报道了技术行业使用人类来审查从用户那里收集的音频(并且没有向用户披露这一事实)。这其中就包括了苹果、亚马逊和Facebook。相关高管和工程师表示,建立庞大的人类监听网络会带来问题或干扰,尽管这一直是改善其产品的明显方法。

包括Slatis在内的众多合同工都清楚地表示,普及音频监视的弊端对于那些财务风险要小得多的公司来说是显而易见的。“从来没有感觉到这样做是正确的,”一位为Alexa竞品工作的转录员说道。他与大多数合同工一样,签署了保密协议并以匿名为由发言,以免遭到报复。“他们真正在向客户销售什么?”

程序员们认为,语音命令将成为未来半个多世纪的计算技术,但是在大部分时间里,用于识别和响应口语句子的教学机器需要将音频文件逐字匹配到转录的文本,这是一个缓慢而昂贵的过程。早期的先驱者购买或建立了庞大的录音库,让人们将报纸或其他预写的材料转换成语音。这些项目的徒劳本质最终成为一个行业笑话。苹果语音团队的一位前产品经理回忆道,在90年代,苹果为愿意在他们的实验室录制语音模式的每个志愿者提供了一件T恤,上面印有“I Helped Apple Wreck a Nice Beach”(这是经典的语音识别例句)。

苹果后来成为第一家推出语音模式的大型公司,当时它在iPhone 4S中嵌入了Siri。显然至此,苹果不再需要在实验室编写脚本和累计录音了。该公司在几天之内售出了超过400万部4S,并很快开始获得无数的免费自然语音数据。在最初的几年中,该公司在很大程度上依靠外部语音软件专家使用这些数据来提高Siri的功能,但苹果在2014年左右取回了控制权。“这样的工作非常繁琐:在经过15或30分钟的聆听后,你唯一会得到的是头痛,”Siri前高级语音科学家Tao Ma谈到转录用户录音时说道。这一内部团队将大部分工作分发给欧洲的IT承包商,包括总部位于爱尔兰的GlobeTech。

在过去的几年中,苹果在收集和分析人们的声音方面变得更加激进,担心Siri的理解力和速度落后于Alexa和Google Assistant。苹果将Siri视为语音搜索引擎,因此它必须做好准备以应付无休止的用户查询,并加大对音频分析的依赖。

前承包商将这一系统描述为圣经中的巴别塔。在爱尔兰科克机场附近的Globetech办公室里,无数的合同工戴着耳机静静地坐在MacBook前,每天要转录1300个剪辑片段,每个剪辑可以是一个句子,也可以是整个对话。当合同工点击播放时,计算机在一个文本框中填充了Siri认为“听到”的字词,然后提示员工批准或更正翻译,然后重复继续。GlobeTech没有回应置评请求。

员工们使用的一个名为CrowdCollect的程序,包括用于由于各种原因而跳过录音的按钮,但他们也表示,没有特定的机制来报告或删除令人反感或不适当地的音频。而当询问经理是否可以跳过过于私人的片段时,他们被告知没有剪辑片段会太过于私人,他们必须转录听到的所有内容。由于合同工的工作通常只维持几个月,所以有关隐私问题的培训会很少。

2015年,当苹果首席执行官蒂姆·库克宣称隐私是一项“基本人权”之时,苹果的机器每周需要处理超过十亿次请求。当时,用户可以开启一项功能,保持语音助手始终在线,这样他们就不再需要按下按钮来激活语音助手。苹果在其用户协议法律条款中表示,可能会记录和分析语音数据以改善Siri,但没有任何地方提到会是人类员工在监听。一位前合同工说:“监听别人的语音,让我感到非常不舒服。”

苹果Siri部门的十位前苹果高管表示,他们没有而且仍然不会将此系统视为侵犯隐私权的行为。这些前高管说,录音不会与苹果用户ID相关联,而且他们认为用户理解公司正在处理他们的音频剪辑,所以即使是人类在处理音频剪辑又有什么关系呢?“我们并不认为这是错误的做法,”曾在Siri高级开发团队工作的John Burkey说。“这不是间谍行为。这与应用崩溃并询问是否要将报告发送给苹果的行为是相同的。”

然而,这样的行为是有区别的,因为MacOS会明确询问用户是否希望在程序崩溃后立即提交报告。这是每次出现故障时都会弹出的提示,而在Siri的情况下却变成了默认同意。许多合同工表示,尽管大多数Siri要求都是很普通的,但他们仍然会听到的色情化的语音,以及种族歧视或恐同性言论。

苹果表示,只有不到0.2%的Siri请求需要进行人类分析。前任经理将合同工的指控视为夸张。曾带领开发团队的Siri联合创始人Tom Gruber说:“实际上,我们要处理的很多都是噪音,并不是说机器打算录制某些声音,这只是某种意义上的概率问题。”

到2019年,苹果将Siri引入其无线耳机和HomePod扬声器等产品后,每月需要处理150亿条语音命令。0.2%意味着每月,人类合同工需要处理3000万条语音命令,一年下来就会是3.6亿条。Siri团队的前首席研究科学家Mike Bastian说,随机录制的风险随着用例的增加也在不断增长。他提到了Apple Watch的“抬起激活”功能,该功能在检测到佩戴者的手腕被抬起时会自动激活Siri。他说:“这就导致假阳性率很高。”

在智能音箱业务中,苹果的HomePod估计仅占美国市场的5%,亚马逊估计有70%。2011年,杰夫·贝佐斯命令一个团队向他展示早期的语音控制音乐应用,以将该软件构建为硬件产品。于是,他们制作了Echo,它的七个麦克风需要不断听着,当出现包含“唤醒词”的声音时,就会触发新的录音。与苹果一样,每个语音剪辑都会进入该公司的服务器,然后将其中的一部分路由到数百个数据助理进行审核。

贝佐斯和亚马逊设备高级副总裁David Limp很清楚这样的行为。早期Alexa产品经理说,他们做出了一些设计选择,目的是防止Echo用户对录制感到惊讶。当用户说“Alexa”时,Echo周围会出现一圈光环,仿佛助手正在重生。一支专门的“个性化团队”编写了脚本,用于回答数百个常见问题。开发人员创建了一个在线门户,用户可以在其中播放和删除他们的音频剪辑。亚马逊的一位发言人说,隐私标准从一开始就内置在Alexa中。

这样的设计赋予了亚马逊保留语音剪辑并对其进行试验的权利,远远超出了苹果对Siri的处理能力。默认情况下,该公司会无限期保留录音。亚马逊没有透露有关如何使用这些数据的细节,只是说其人类转录已证明在将Alexa转换为全球新语言并扩展其响应能力方面具有巨大优势。

2016年,亚马逊创建了Frequent Utterance Database(FUD),以帮助Alexa为常见请求添加答案。与FUD合作的前员工表示,渴望更积极挖掘数据的产品团队与负责保护用户信息的安全团队之间存在紧张关系。2017年,亚马逊推出了配备摄像头的Echo Look,该产品被称为AI造型师,可以推荐服装搭配。知情人士说,它的开发者考虑将相机编程为在用户要求Alexa讲笑话时自动开机。他们的想法是录制用户面部的视频并评估用户是否在笑。这些人说,亚马逊最终搁置了这个想法。该公司表示,Alexa目前没有使用面部识别技术。

该公司已在世界各地设立了转录“农场”。今年,它举行了多次面向海外转录员的入门招聘活动。一位花了数十年时间为科技公司开发识别系统的语音技术专家说,最近的招聘规模暗示亚马逊音频数据分析的规模令人震惊。亚马逊表示,它“认真对待客户及其录音的安全性”,并且需要全面了解区域性口音和口语化才能使Alexa走向全球。

微软在今年8月承认,它使用人类帮助审查通过语音识别技术生成的语音数据。宝马、惠普和Humana等企业正在将这一技术集成到自己的产品和服务中。包括阿里巴巴、搜索巨头百度和手机制造商小米在内的中国科技公司每个季度都在收集数百万个智能音箱的语音数据。业内分析师表示,谷歌和Facebook同样认为音频数据将极大地增强其庞大的广告业务。密歇根大学教授Schaub说,网页浏览告诉这些公司很多有关人的信息,但是录音可以使AI更加容易地估计年龄、性别、情感甚至位置和兴趣。他说:“人们通常不会意识到他们的语音命令所显示的内容。如果你经常问橄榄球,那么你很可能是NFL球迷。如果背景音中有婴儿在哭泣,那么则可以推断你有一个家庭。”

谷歌搜索向Google Assistant提供了来自数十亿种可用设备的查询,这些设备包括Android智能手机和平板电脑、Nest恒温器和Sony TV。谷歌已经雇用了海外的临时工来转录片段,以提高系统的准确性。谷歌已承诺,审阅的录音不会与任何个人信息相关联。但是今年夏天,一家谷歌承包商向比利时广播公司VRT NWS分享了1000多个用户记录。这家媒体能够根据用户所说的话找出录音中的某些人是谁,这让那些被查明的用户感到震惊。这些记录中的10%,是因为设备错误地检测到激活词,并在未经用户同意的情况下进行了录音。

一位谷歌发言人说:“自从听到这些顾虑后,我们一直致力于在增强隐私控制的同时暂停Assistant音频的人为转录。”该公司拒绝对此事置评。一位与Google Assistant有关的高级工程师最近离开了该公司,他说,如果语音助手能够更好地帮助用户,人们很有可能会忽略对监听的担忧。

在相关新闻报道不断出现之后,这些大型科技公司于今年调整了他们的虚拟助手项目。谷歌暂停了人类对Assistant音频的转录,苹果开始允许用户删除他们的Siri历史记录并选择不共享更多内容,使共享录音成为可选内容,并直接雇用了许多前承包商来增强其对人类监听的控制力。Facebook和微软在其隐私政策中添加了更明确的免责声明。亚马逊也引入了类似的披露方式,并开始允许Alexa用户选择不进行人工审核。亚马逊的Limp最近谈到人类转录小组时说:“这在业界是一件众所周知的事情。无论是在新闻界还是在客户中都广为人知,很显然这样的做法还不够好。”

一些研究人员说,智能手机处理能力的提高和一种称为联合学习的计算机建模形式可能最终会淘汰这些监听行为,因为这些机器将变得足够聪明,可以在没有合同工帮助的情况下解决问题。目前,由于没有更严格的法律或消费者的强烈反对,随着语音设备的激增,人类音频审核队伍几乎肯定会继续增长。

声明:该文章版权归原作者所有,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请在30日内与本网联系。
您阅读这篇文章花了0
转发这篇文章只需要1秒钟
喜欢这篇 3
评论一下 0
凯派尔知识产权全新业务全面上线
相关文章
评论
试试以这些内容开始评论吧
登录后发表评论
凯派尔知识产权全新业务全面上线
阿里云创新中心
×
#热门搜索#
精选双创服务
历史搜索 清空

Tel:18514777506

关注微信公众号

创头条企服版APP