与几年前相比,“数据科学家”可能是一个不那么新奇的工作头衔,但这并不意味着每个人都确切地了解这个角色包括什么,或者这个领域的职业是否适合他们。
大多数组织现在生成、积累和存储大量的数据;然而,他们中的许多人不知道如何充分利用他们收集到的所有信息。这就是数据科学家的用武之地。亚马逊网络服务(AWS)的数据科学家同时是创新的研究人员和熟练的故事讲述者,揭示隐藏在这些大数据集中的趋势,这可以帮助我们客户的业务转型。
Antonia Schulze是AWS机器学习(ML)解决方案实验室的数据科学家,总部位于德国柏林。我们和她聊了聊她参与过的一些项目,ML在现实世界中的样子,以及她在数据科学领域追求职业生涯的建议——不管你是否拥有该领域的传统技能。
告诉我们你在AWS的角色
我的工作包括分析大量数据,并从中获得有价值的见解,使用商业头脑和统计学以及ML技术。我通常向不熟悉机器学习的人描述它,称其为构建可以从数据中学习的系统,而无需由人类明确地编程。在AWS,我参与帮助一些最大的客户加速在他们的业务中采用ML。我们首先观察他们的愿景,并找到ML的最高价值用例。然后运行简短的试点项目(或“概念验证”),使用最新的ML模型来解决特定的问题。
对于制造业客户,机器学习可能用于改善研发或供应链功能。例如,我们已经帮助制造公司更准确地检测缺陷,并将员工花在人工检查上的时间减少了一半。在汽车行业,数据可以用来帮助提高司机和行人的安全,例如在自动驾驶汽车的开发中。数据和高级分析可以创造更先进的道路场景感知,这有助于自动驾驶汽车准确地观察周围环境,并评估任何风险。
我们在哪里可以看到AWS ML的应用?
ML如今无处不在。一个很好的日常例子就是体育运动。在美国,NFL使用AWS ML技术用于“Next Gen Stats”-一个先进的分析平台,为球迷带来令人兴奋的美式足球比赛新见解。我们的ML模型跟踪来自场上的一系列复杂数据集,以生成从最快持球者到完成传球概率的所有统计数据。与此同时,在F1中,由AWS支持的“F1 Insights”让车迷更好地了解从赛车到赛车的一切最快的司机在这项运动的历史上,车手如何尝试一个完美的起步,他们的制动性能,完成超车的概率,等等。
这些数据驱动的见解为观众提供了更有意义的信息,有助于引发对话,加深粉丝的知识,并最终使人们更接近他们最喜欢的运动。这一切都是为了创造更好的体验——在疫情期间,球迷们无法亲自观看体育赛事,这一点变得更加重要。
你有最喜欢的项目吗?
在疫情的早期阶段,我们直接与世界卫生组织合作(世卫组织)正在开展一个项目,应对关于COVID-19的错误信息和“假新闻”浪潮。世卫组织面临的挑战是需要分析的信息量,因为现在的信息量比以往任何时候都多。我们帮助世卫组织开发并将ML模型纳入其公共卫生工具,以分析和分类来自世界各地的大量与covid -19相关的内容。我们帮助开发的ML模型可以帮助世卫组织分析师评估信息的可信度,并使可信来源更容易找到和分析。这类工作属于自然语言处理(NLP)领域,是人工智能(AI)和机器学习(ML)的一个关键领域。这是一个独特的项目,因为我们必须了解如何处理全新的数据集,而所需的规模和速度没有先例。
你的工作最好的部分是什么?
我喜欢我工作的多样性。我已经在体育、医疗保健等行业的组织工作过,而且我可以灵活地在其他行业工作,比如汽车、制造、零售或任何其他行业。我们工作的多样性也意味着我们会接触到来自AWS业务各个领域的人,从高级领导到主题专家,所有人都愿意分享他们的时间和经验。我喜欢思想、个性和专业知识的多样性。例如,金融专业的人与体育行业的人工作和交流的方式不同。对我来说,和我一起工作的人——顾客和同事——是我工作中最有意思的部分。
你是怎么进入数据科学领域的?
我的职业生涯有点非传统。我没有学过数学或科学,不像我的许多同事,我没有博士学位。我一开始想从事工商管理,所以我的背景是商业和通信。然而,我很快意识到我想在一个更注重技术和数据驱动的领域工作。我在技术和媒体电信部门做过市场调研实习。这启发了我去学习更多关于机器学习和数据科学的知识。我决定回到大学,攻读大数据和商业分析的硕士学位,我喜欢这个专业,因为它非常关注客户体验。在那之后,我最初发现很难获得数据科学的职位,因为公司通常要求有数学或统计学背景。
当我看到亚马逊正在招聘商业智能数据科学方面的实习生时,我马上申请了。我通过了招聘流程,在亚马逊运营的客户体验团队找到了一份工作。这真的很有趣,但不是我想要的领域。在那里,我找到了一位在亚马逊从事数据科学工作的导师,我的经理帮助我在业务中寻找合适的机会。在他们的支持下,我找到了一位招聘经理,应聘数据科学的职位,并得到了现在的工作。
你工作中最具挑战性的部分是什么?
我们是一个非常创新的团队,所以我们经常应用新的想法、工具和流程来解决以前从未解决过的问题。对我来说,最具挑战性,但也是最有意义的部分是从头开始创建一个ML模型,特别是因为我的学术背景不是数学或统计学。我确保我不断地加深我的知识。这可能是通过在我经验较少的领域发展我的网络——比如找一个NLP专家定期同步——或者阅读大量的研究论文来帮助我更好地理解算法。
指导和支持是双向的。当有人慷慨地奉献自己的时间时,我总是想提供有价值的回报。以我的商业和通信背景,我能帮上忙的一个方法是把复杂的科学解释翻译成易于理解、用户友好的语言。这可能是将数据科学项目的结果传达给可能没有技术背景的客户,或者在亚马逊内部与整个业务部门的员工分享我们的创新消息。
你希望ML和数据科学如何发展?
我们需要更多的女性担任领导角色,让她们在公众面前,诚实和公开地面对她们面临的一些挑战。我创立了Women@的ML/AI女性全球分会亲密团体去年在亚马逊工作。对这一领域感兴趣的女性可能会遇到和我一样的问题——不知道从哪里获取信息,也不知道在没有特定资格的情况下,有哪些选择可以过渡到数据科学的角色。
该小组面向所有亚马逊员工开放。你不必是女性或在ML工作,也可以成为社区的一员。我们的大多数女性成员都不是ML角色,但正在寻求如何转变为ML角色的支持。通过小组,我们定期评估成员的需求,然后通过具体的活动、指导计划和其他解决方案来解决这些需求。对我来说,更大的多样性对AWS以及数据科学和机器学习的未来都是关键。一个多元化的团队意味着多元化的观点,这反过来只意味着有更多的机会更好地了解你的客户。
AWS致力于为来自各种背景的学生和应届毕业生提供机会,培养他们的激情,提高他们的技能。了解更多关于我们的实习项目.