力压海外巨头突破人机对话难题,阿里获DSTC7国际大赛双料冠军!
2019/01/31From阿里巴巴达摩院

近日,在国际顶尖人工智能学术竞赛——第七届对话系统技术挑战赛(DSTC7)中,阿里AI获得双料冠军,成最大赢家。

DSTC7由来自微软研究院、卡耐基梅隆大学的科学家于2013年发起,迄今已举办七届。它要求参赛的AI模型依据给定的多轮对话历史从上万个句子中选出正确的回复。阿里AI在参与的2项比赛中击败了包括麻省理工学院、约翰霍普金斯大学、IBM研究院在内的近20支国际知名大学或研究机构的参赛队伍。

基于此次比赛所提供的公开对话回复数据集DSTC7 Ubuntu,阿里AI将人机对话准确率的世界记录(Recall@10)提升至94.1%,这意味着机器与人类交流时的回复能力达到新的高度。

一直以来,人机对话系统及其背后的认知智能,是人机交互中最复杂也最重要的技术,曾被比尔盖茨形容为“人工智能皇冠上的明珠”。人类的语言表达有极强的复杂性和多变性,机器如果不能快速准确理解人类的表达就很难给出人们期待的回答。以智能客服为例,传统的智能客服往往不能真正地理解用户的意图,同时缺乏的对话历史信息的利用,会给出“牛头不对马嘴”答复的情况。

此次阿里的参赛AI模型叫做ESIM,这是阿里自主研发的一种用于解决多轮对话回复问题的原创模型,能够给对话机器人装上实时搜索并理解人类真实意图的“雷达”系统。

相比较之前的主流模型,它更简洁高效,并引入了增强版的“注意力机制”,能够对对话历史进行实时检索,自动去除多余信息的干扰,明确人类对话的核心并给出期待回复,促使人工智能的认知思维进一步接近人类。

例如当用户线上购物时,提出想要一件M号的黑色裙子,智能客服通过对库存情况的实时检索,发现并答复用户没有黑色M号的裙子。用户继续省略式发问,“那有白色的吗?”。此时传统模型训练出的AI客服很难判断用户是要问“这件裙子有白色的吗”还是“有没有白色的M号裙子”,因而很难给出准确回复。

装有ESIM对话模型的AI能够通过对用户对话上下文的检索,明确用户的核心在于尺寸而非颜色,实时给出有或没有白色M号裙子的回复。

在真实的淘宝业务场景中,阿里巴巴此次新提出的ESIM模型已将客服回复准确率记录从92.1%提升到了94.8%。

ESIM技术由阿里巴巴达摩院机器智能领域语音实验室研发,不到两年,这一模型已经成为业界的热门模型和通用标准。此次DSTC7的参赛队伍中就有6支队伍同样使用了基于ESIM的模型,此前还曾被谷歌和Facebook在论文研究中公开引用。

未来这项技术还会被应用到人机交互的各个场景:智能语音点餐机能够更准确地理解用户的真实意图,提高点单成功率;导航软件更能听懂用户的语音请求,少走冤枉路;家里的智能音箱能够更快做出反应,节省用户等待时间……

阿里巴巴达摩院机器智能领域语音实验室负责人鄢志杰表示:“未来将向全世界企业与个人开源此次打破全球人机对话纪录的ESIM模型,使全球开发者都能共享这一成果,共同推进人工智能技术的发展”,这使得ESIM有望成为全球人机对话领域最主要的模型之一。

Scan QR code
关注Ali TechnologyWechat Account