在一个安静的房间里,有一排桌子、椅子和有线耳机,一台65英寸的显示器在长长的黑色窗帘的背景下格外显眼。高清电视屏幕分为四个象限,显示四个摄像头馈送。当工作人员忙着检查灯光和测试麦克风时,亚马逊Echo Dot已经准备好与三个被选为决赛选手的社交机器人交谈2018 Alexa大奖挑战。

Alexa大奖是一项350万美元的大学挑战赛,旨在通过语音推进对话式人工智能。来自世界各地的团队竞相建造和扩展一个社交机器人,该机器人能够就一系列流行话题与人类进行20分钟的连贯对话。

在来自世界各地的八支参赛队伍中,选出了三名决赛选手.来自布拉格的捷克工业大学和爱丁堡的赫瑞瓦特大学获得了Alexa用户平均评分最高的两名决赛选手。亚马逊从加州大学戴维斯分校(University of California, Davis)挑选了一支外卡团队作为决赛选手。

苏格兰爱丁堡的Alana - Heriot-Watt大学

一群学生和他们的指导老师围坐在一张桌子旁,桌子上放着一台Echo设备。
Alexa奖决赛团队Alana,来自苏格兰爱丁堡赫瑞瓦特大学
Alexa奖团队
Rachael Jones拍摄

赫瑞瓦特大学是一所位于苏格兰爱丁堡的公立大学。在2017年Alexa大奖挑战赛中,赫瑞瓦特团队凭借另一款名为“What's Up Bot”的社交机器人进入了决赛。今年是赫瑞瓦特比赛的第二年,2018年,赫瑞瓦特再次参加了比赛。为了给他们的新社交机器人取一个更鼓舞人心的名字,该团队选择了“Alana”,以英国数学家、计算机科学家、逻辑学家和密码学家艾伦·图灵的名字命名,图灵在理论计算机科学的发展中具有很高的影响力。

来自爱丁堡的社交机器人团队由10人组成。阿曼达·库里(Amanda Curry)是一名研究对话系统自动评估的博士生,她是三个入围团队中唯一的女性团队负责人。数学和计算机科学助理教授Ioannis Konstas的研究领域是自然语言处理,他以非官方顾问的身份加入了2018年的团队。

个性和双关语

当你问一个社交机器人,“你最喜欢的电影是哪部?”或“你多大了?”,为了得到一致的回答,团队必须针对多个主题创造不同的回答。

Curry在Alana团队中负责角色开发和排名功能,并致力于维护社交机器人的个性。Alana被编程知道她最喜欢的食物,最喜欢的颜色,最喜欢的电影或书,她喜欢和不喜欢的东西。她也被设定得相当机智。

“我们喜欢有趣的双关语,”他的团队的康斯塔斯说。“幽默是人类自然对话的重要组成部分,我们希望Alana能让用户感到舒服并发笑,这有助于保持他们的参与。听一个社交机器人说,‘我的脑袋在云端’,这很有趣。”

语言学

如果你被要求模仿一个机器人,你的脑海里很可能会蹦出一个机械单调的声音。自然发音的语言是赫瑞瓦特公司今年着手解决的问题之一。

库里说:“这是我们首次在社交机器人中加入语言编程。”“我认为,通过使用语音、语法和语义,社交机器人听起来更像人类,这真的有助于机器人和用户之间的对话更流畅。”

但推动2018年这支球队的不仅仅是正确的发音。对于库里来说,顾客的反馈是最重要的。

她说:“一开始,我们打算创建一个我们认为用户会喜欢的机器人,但很快就发现,真正决定这些社交机器人未来走向的是客户互动,他们希望它们的声音如何,以及他们希望在各种对话中讨论什么。”

“亚马逊正在投资机器学习和认知科学,我们也在投资我们的时间。但我们可以一起提高标准,我们的联合研究将给世界带来巨大改变,比预期的要快得多,”康斯塔斯补充道。

奥奎斯特-捷克技术大学,布拉格,捷克共和国

四名学生和他们的导师站在一架波西米亚钢琴旁。
Alexa奖决赛选手,来自捷克布拉格的捷克技术大学的Alquist
Alexa奖团队
Rachael Jones拍摄

布拉格的捷克技术大学是捷克共和国最大的大学之一。

2017年,捷克技术团队在Alexa Prize挑战赛中获得第二名。今年,他们带着他们的社交机器人作为三名决赛选手之一回归。该团队由六名成员组成,由捷克技术大学的人工智能博士生Jan Pichl领导,最近入选了捷克福布斯30岁以下30强。Jan Sedivy是该团队的高级学术顾问,是一位长期从事人工智能行业的专家,在IBM和谷歌等公司拥有丰富的自然语言处理经验。

该团队根据捷克作家卡雷尔·恰佩克20世纪20年代的科幻小说《r.u.r.》为他们的社交机器人选择了“奥奎斯特”这个名字,“r.u.r.”是罗森的万能机器人的首字母缩写。这部剧被认为是第一个有文献记载的机器人一词的使用。奥奎斯特是剧中的主角,他的任务是研究新的机器人,并解剖它们以正确地研究它们。

进入决赛的第二年,奥奎斯特团队开始模拟电影、戏剧和广播歌曲中的真实对话。的Alexa技能工具包(ASK),提供给每个参赛团队,允许他们修改任何文本,以实现与社交机器人中的语言的旋律。

灵感

Sedivy以一种乐观、实事求是的语气谈到了他加入人工智能领域的动机。塞迪维回忆说:“1968年的科幻电影《2001:太空漫游》(2001:A Space Odyssey)中,飞船的计算机系统HAL开始表现出越来越奇怪的行为,这导致了人与机器之间的紧张对决。”“当我15岁的时候,我看到了这部全新的宽幅电影,我不知道发生了什么。但随着年龄的增长,我意识到它真的让我着迷。”

对皮赫尔来说,这个过程更加循规蹈矩。“我小时候从来没有想过人工智能,也没有想过这个科学领域,直到我开始读本科软件工程。然后,我决定攻读人工智能硕士学位,并继续攻读人工智能博士课程。”

这种灵感的组合让奥奎斯特队第二年进入决赛,这似乎是一个很好的公式。他们的团队认为,一个成功的混合社交机器人不仅能满足梦想家的需求,还能满足科学思维。

Gunrock -加州大学戴维斯分校,美国加州戴维斯

一群学生和他们的导师站在加州大学戴维斯分校的教学楼外
Alexa奖决赛选手,Gunrock,来自美国加州大学戴维斯分校
Alexa奖团队
Rachael Jones拍摄

加州大学戴维斯分校是一所公立研究型大学,也是世界领先的跨学科研究和教学机构之一。这所大学的团队是亚马逊的外卡选手,也是今年Alexa Prize挑战赛的第三名决赛选手。这将是他们第一次参加Alexa挑战赛,该团队渴望展示他们在技术上的坚韧。

他们的社交机器人的名字“Gunrock”来自加州大学戴维斯分校的吉祥物——一只毛茸茸的蓝色马,名叫Gunrock。该大学的第一个Gunrock吉祥物可以追溯到100多年前,是一匹纯种马。

Chen Chun-Yen (Arbit)是一名计算机科学与工程专业的学生,领导着这个由加州大学戴维斯分校计算机科学助理教授Zhou Yu监督的11人团队。

的新手

于助理教授给她在加州大学戴维斯分校的部门发了一封电子邮件,以评估他们对参加Alexa奖的兴趣。这导致11名学生参加了挑战,许多人的任务是拥有一个单独的模块,比如书籍和电影,或者政治和新闻。另一些人则只专注于语言学或系统层面来创建自然语言。然后,团队就如何交织模块进行合作,最终增强《Gunrock》。

语言和延迟

Alexa挑战赛的主要目标是推动对话式人工智能和人机交互的科学发展。Gunrock开始创造一个听起来更自然的社交机器人,它将有助于从用户那里引出自然的对话行为Speechcons或语音合成标记语言(SSML)可以让Alexa更有表现力地发音。

余教授说:“当人们彼此交谈时,他们会下意识地使用不流利、自我纠正和停顿,比如在日常对话中频繁地使用‘我认为’、‘嗯’或‘呃’。”“这些语言标记有助于在聊天时吸引别人的注意力,我们希望在我们的社交机器人与用户的互动中反映这种行为。”

该团队还努力调整Gunrock在被问到问题后的反应速度。该团队打算改进的关键特性之一是延迟时间。不过,延迟也可能来自一些对我们来说似乎很简单,但对代码来说相当复杂的东西,比如语言歧义。

陈说:“很多时候,顾客想要谈论一个特定的话题,但我们的社交机器人会把它识别为其他话题。”“一个例子就是谈论企鹅。Gunrock可能把这理解为在讨论一种动物,但也可能把它理解为在讨论匹兹堡企鹅职业冰球队。因此,我们正在不断提高搜索能力,这有助于更快地检索答案。”

一个神奇的想法

谈到现代机器人,好莱坞无疑有助于激发我们的想象力。

余回忆起2013年看电影《她》时的情景由华金·菲尼克斯(Joaquin Phoenix)主演,他饰演一个孤独的作家,故事发生在不远的未来,他与一个旨在满足他所有需求的操作系统发展了一段不太可能的关系。

余说:“对我来说,这部电影真正展现了社交机器人和用户之间的理想对话。”“虽然最后非常戏剧化,但它触及了我们在创造社交机器人时所处理的一些哲学问题和社会方面。”

对于陈凯歌来说,他的动机更像漫威。

我一直受到J.A.R.V.I.S的启发,他是《钢铁侠》(Iron Man)中帮助和指导托尼·斯塔克(Tony Stark)的忠诚的人工智能管家。他不仅会回答问题,还会开玩笑,经常在托尼意识到之前就自动知道他需要什么。”

对于这个新团队来说,总体目标是创造一个能够帮助完成日常任务的社交机器人,而且还擅长自然对话。

2018年Alexa大奖的获奖者将在2018 AWS re:发明大会将于11月26日至30日在拉斯维加斯举行,选出的最佳社交机器人团队将获得50万美元的奖金。第二名和第三名的队伍将分别获得10万美元和5万美元的奖金。此外,如果获胜团队的社交机器人完成了与人类进行20分钟连贯对话的重大挑战,并获得4.0或更高的评分,那么他们所在的大学将获得100万美元的研究资助。

客户可以通过说“Alexa,让我们聊天”来参与团队创造的技能。