NLP论文分享专场-EMNLP+CIKM论文解读
2021/12/01

         EMNLP是计算机语言学和自然语言处理领域的顶级国际会议,由ACL-SIGDAT主办,在Google Scholar计算语言学刊物指标中排名第二。CIKM是信息检索和数据挖掘领域顶级学术会议之一。EMNLP 2021共收到投稿4834篇,有效投稿3717篇,总接收论文840篇,接受率为23.3%。就接收论文分布领域而言,NLP 应用、机器学习、机器翻译与多语言占比位列前三,信息提取、对话与交互和语义词汇热度不减。今晚我们有幸邀请到了EMNLP与CIKM收录论文的三位作者,带我们一起近距离解读达摩院机器智能技术实验室在智能对话、知识图谱领域的新突破。

1.论文标题:《A Role-Selected Sharing Network for Joint Machine-Human Chatting Handoff and Service Satisfaction Analysis》——EMNLP

嘉宾信息:阿里集团-达摩院-机器智能技术实验室-宋凯嵩

论文摘要(中文):智能对话机器人被广泛的应用于客服场景。但是只有少数的客户愿意通过对话机器人购买产品或服务,这是因为对话机器人还不能够满足来自用户的各种需求,特别是由算法产生的不满意的回复可能破坏用户体验,进而造成客户投诉甚至客户流失的后果。人机切换旨在定位任何可能存在的算法缺陷,或检测客户的负面情绪,将对话进程转交给人工客服,从而保证对话的流畅性、满意度。本文中我们提出了一种角色选择的共享网络多任务模型,同时进行两个紧密相关的任务:人机对话切换预测和服务满意度分析。相比于最好的单任务模型和相关的多任务模型,在两个对话业务数据集上取得了SOTA的结果。

2.论文标题:《AliMe MKG: A Multi-modal Knowledge Graph for Live-streaming E-commerce》——CIKM

嘉宾信息:阿里集团-达摩院-机器智能技术实验室-陈河宏

 论文摘要(中文):直播正逐渐成为电商卖货的一种流行趋势,其核心在于引导消费者在直播间完成消费。为了使消费者不需要跳出直播间就能很好的了解商品,我们提出了电商多模态知识图谱AliMe MKG,其旨在提供商品的认知画像,基于该认知画像客户可以更好的搜索和了解商品信息。在AliMe MKG的基础上,我们开发了具有商品搜索、商品展示和商品问答功能的在线直播助手--智能辅播,其支持消费者在直播间进行商品列表浏览、商品详情查看和商品信息询问。我们的系统已经在淘宝app上线,每日服务了数十万的客户。

3.论文标题:《Segment, Mask, and Predict: Augmenting Chinese Word Segmentation with Self-Supervision》——EMNLP

嘉宾信息:阿里集团-达摩院-机器智能技术实验室-米尔阿迪力江·麦麦提

论文摘要(中文):目前最先进的神经网络方法和基于预训练模型的微调方法已用于中文分词,并取得了良好的效果。然而,前人的工作着重于用固定的语料训练模型,但中间过程中生成的信息也是有价值的。此外,前人的神经网络方法的鲁棒性受到大规模标注数据的限制,因为在有标注的语料中难免会存在少量噪声。前人的关于中文分词的工作中,只有很少一部分用于处理鲁棒性问题。本文中我们提出了一种简单有效的自监督中文分词的方法。我们训练一个分词模型来生成初始的分词结果,然后用修改的掩码语言模型的预测结果来评价分词结果的质量。最后用增强的最小风险训练方法来提高分词模型的性能。实验结果表明,我们的方法在9个标准的中文分词数据集和多领域数据集上, 在单标准训练和多标准训练两种实验条件下都取得了显著的提升,并且在带噪声的数据上的鲁棒性也取得了明显提升。

 

Scan QR code
关注Ali TechnologyWechat Account