我们对Alexa的愿景不仅是有用,而且要显著改善全球数百万人的生活。Alexa Trust和Alexa AI团队每天都在努力实现这一愿景。为了纪念1月28日的数据隐私日,我们与Anne Toth、Manoj Sindhwani和Prem Natarajan坐下来讨论亚马逊如何保护客户隐私,同时负责任地使用数据来改善Alexa体验。
您为什么需要收集Alexa客户数据?这些数据是如何使用的?
托斯:首先,如果不收集和处理语音交互,Alexa就无法回答问题,这似乎是显而易见的,对吧?但是,让Alexa能够准确理解和响应的是所有复杂的学习和不断的改进,这使得Alexa在每次交互中为所有客户提供更好、更智能的服务。这需要数据。一个具体的例子是理解人类语言。言语是复杂的,并因地区、方言、语境、环境和说话者个人的不同而有很大差异。这包括他们是母语者还是非母语者,以及他们是否有语言障碍。用客户数据来训练Alexa是非常重要的,因为要让Alexa工作良好,为Alexa提供动力的机器学习模型需要使用各种各样的、广泛的现实世界客户数据来训练。这就是我们如何确保在各种声学条件下,无论是在家里还是在旅途中,为每个人提供良好的服务。
多语言模式这是一个很好的例子,说明数据如何使Alexa对不同的家庭既包容又准确。美国各地成千上万的用户在他们的Alexa设备上使用多语言模式,在英语和另一种语言(如西班牙语)之间无缝切换。一些客户告诉我们,多语言模式可以帮助他们全家访问Alexa。
Sindhwani:完全正确。数据让Alexa变得聪明。用最新的数据模式训练我们的语音识别模型,使我们的团队能够提供有用、准确甚至有趣的体验。
通过录音进行训练,Alexa可以分辨出顾客问的是“奥斯汀”还是“波士顿”的天气,或者是“U2”和“YouTube”的区别。而且,当我们在2014年推出Alexa时,虽然客户并没有要求Alexa播放Lil Nas X的歌曲,但录音培训帮助Alexa快速学会了客户对Lil Nas X名字的各种发音方式,并要求播放他的音乐。
随着时间的推移,用数据训练Alexa还可以帮助Alexa准确回答有关奥运会或世界杯等每隔几年发生一次的事件的问题。可以理解的是,在冬奥会期间,客户倾向于更频繁地问Alexa关于“冰壶”的问题,如果Alexa接受了历史数据的训练,这些问题就更容易理解。同样,用语音记录快速训练Alexa也能确保在历史知识较少的热门话题上的准确性,比如COVID-19、英国脱欧或NBA冠军扬尼斯·安特托昆博。
通过不断地用客户数据训练我们的机器学习模型,Alexa对所有语言客户需求的理解在过去三年中平均提高了37%。
你的团队如何在不断创新的同时保护客户隐私?
托斯:我们谈论了很多关于隐私是如何存在于Alexa DNA中的。“关闭麦克风”按钮,物理相机快门,以及在Alexa处理请求时通知客户的灯光和音频指示灯,都是客户可以看到、听到和触摸的控制。虽然这些控制很重要,但我们认为客户不需要采取额外的步骤就应该拥有隐私。
我职业生涯的大部分时间都在处理隐私问题。隐私通常被认为是一种约束,在某种程度上,确实如此。限制当然会激发创造力,但隐私本身也成为了发明创造的机会。我们的科学和语音团队已经投资于保护隐私和负责任地使用数据的项目,不需要客户采取任何行动。
Natarajan:语音助手带来了独特的隐私挑战,因为客户无法看到或听到部分体验。当我们收集和使用客户数据时,我们会确保数据的安全并负责任地使用。例如,在训练机器学习模型时,我们使用隐私保护方法来限制我们在自然语言理解建模环境中使用的数据的数量和类型。可教人工智能和动态自我学习等先进技术使用户能够定制他们的体验,并提供持续的性能改进,而不需要对模型进行再训练。
我们还将继续投资于匿名化和合成数据生成技术,以进一步保护客户隐私。
Sindhwani:我们的科学家和工程师投资于研究和隐私增强技术,以进一步提高Alexa语音识别。与Prem所描述的工作类似,我们也在开发新技术,使用模拟现实世界的算法生成的合成数据——训练数据——来改进我们的自动语音识别模型。而且,我们已经采取措施减少对监督学习技术的依赖,通过改进隐私保护技术,如迁移学习、主动学习、联邦学习和无监督或自我学习,人工审查录音。自我学习技术完全通过隐式和显式反馈从客户互动中学习,而不需要手动标记。
你把隐私描述为一个发明的机会,你能告诉我们更多关于它是如何为客户带来生活的吗?
托斯:在隐私方面有很多创新,尤其是在Alexa组织内部。隐私保护的一个核心原则是,总是试图用更少的数据为客户提供更多的价值,在我看来,这与科学以更低的成本为我们提供更多的计算处理能力并没有什么不同。事半功倍。在隐私领域,我们称之为数据最小化。这方面的一些例子是将更多的数据处理直接转移到我们的设备上,寻找更快地去识别数据的方法,以及建立和完善保护隐私的机器学习模型。该团队正在幕后工作,通过投资于数据最小化技术(例如减少对监督学习的依赖),以更少的成本做更多的事情。
Natarajan:我们一直在探索未来实施和投资研究的新技术,特别是在可推广方面的进展人工智能方法。例如,我们正在积极利用由开源数据构建的大型预训练模型,用于少镜头和零镜头学习,以减少对客户数据的需求,以开发用于对话式AI和相关语言理解应用程序的深度学习模型。我们还在开发算法,对模型训练中使用的数据进行去识别,并使我们的模型能够强大地抵御隐私攻击。任何进步或应用程序都可以为我们的客户带来巨大的利益,并进一步保护我们每天使用的数据。
在保护隐私方面,你们是否有什么令人兴奋的进步要带给客户?
Sindhwani:我们继续投资Alexa的设备上语音处理能力。在美国,拥有兼容Echo智能音箱的客户很快就可以启用一种新的设置,允许他们的Alexa语音请求的音频在设备上进行本地处理,而无需发送到云端。录音在设备上处理后删除。为了做到这一点,我们必须制作自动语音识别模型——过去大小为许多gb,需要大量的内存,并且运行在云中的大型服务器上——效率足够高,可以在单个设备上工作。我对这样的创新感到特别兴奋,它通过减少延迟和降低带宽消耗为客户带来了切实的好处,同时为他们的数据处理提供了更多的选择。