考虑一个典型的杯酸奶。素食,活跃和生活文化,提供15%的每日推荐剂量的钙。但是你的莉莉阿姨来访,她有腹腔。所以你想知道酸奶是在亚马逊网站上购买它之前的无谷蛋白。

通常,你需要查找的酸奶品牌,并检查标签是否被认证的无谷蛋白。但如果有一种更简单的方法吗?如果你可以搜索认证的无谷蛋白酸奶在亚马逊?或者如果你可以说,“Alexa,无谷蛋白酸奶是什么?”

现在,产品图是由一组科学家和工程师在亚马逊的消费者组织,你可以。

什么是产品图?

鑫月神盾是亚马逊的产品图团队的首席科学家。卢娜的令人难以置信的复杂的任务的团队负责将每个产品在亚马逊与具体的和抽象的概念。这将允许消费者搜索符合他们需要的最好的产品与搜索词如“野餐的东西”,“新生婴儿,最好的玩具”“中世纪的现代家具,”或“持续时间最长的手表电池。”

不用说,目录由数以百万计的项目,将属性附加到每个产品可以是一个艰巨的过程。这是一个任务,卢娜的特长。

“我们的产品图结构世界上所有的信息,因为它涉及到一切可以在亚马逊,”月亮说。“举个例子,在美国是一个伟大的歌曲在夏季烧烤。一个即时可见的温度计也是一个巨大的有项目你的烧烤聚会。如果你在亚马逊搜索夏季烧烤,你会选择流歌和买温度计,即使他们来自不同的家庭。”

通过这种方式,亚马逊的产品图将描述每个项目使用产品和non-product概念,并形成不同实体之间的联系。此外,图像将帮助客户寻找物品时使用搜索条件变化较大。

你说西红柿,我说tomahto,你说“泳衣”,我说“泳衣”,但是不管谁说什么,亚马逊将帮助消费者找到只是适合他们的项目。

建立一个产品图

产品图团队使用多种机器学习技术来获得产品相关信息从亚马逊细节页和互联网。显而易见的挑战是,在互联网上产品信息在很大程度上是结构化的。例如,并不是每一个网站或博客将汤姆·汉克斯整齐地在一个预定义的字段列表,如“演员”。

为了克服这个,产品图团队使用冷淡地监督学习技术,该算法训练识别演员从一个较小,更加结构化的数据库,更大的网络上被释放之前。然后打开IE技术应用,形成各种概念之间的关系(汤姆·汉克斯,演员,《阿甘正传》)。

亚马逊真正不同的是,我们要应用先进的机器学习技术不是因为他们很酷或激动人心的,但因为他们解决实际的客户需求。
鑫月神盾——原则科学家在亚马逊的产品图

该小组还适用于知识链接和清洁,以确保数据是可靠的。技术之一是判断的有效性取决于源的信息。例如,个人博客可以列表发布1993年的阿甘,虽然IMDb列出了电影发布日期为1994年。在这种情况下,该算法会知道使用的信息来源——IMDb更值得信任。

最终,团队图挖掘技术适用于确定有趣的隐藏的模式。这将是应用于服务的建议,如“买了还买了B”的人。例如,图可以发现,顾客买了一个有机的宠物食品也更可能感兴趣Fitbit,因为人们意识到他们的宠物的健康常常注意自己的健康。

亚马逊“真正不同的是,我们得到了应用先进的机器学习技术不是因为他们很酷或激动,而是因为他们解决实际客户需求,”月亮说。“人们不只是来亚马逊购买产品。他们访问亚马逊看到什么新的或者有趣,或发现他们可以简化和丰富他们的生活方式,和我很高兴有机会帮助他们这样做。”

鑫月神盾谈到了亚马逊的产品图在数据库知识发现(KDD) 2018年会议。事实上,一些研究和数据科学家从亚马逊提交论文,给谈判在事件。卢娜也是最近公认的杰出工程师的计算机协会(ACM)