研究方向
  • 基础技术

研究词法、句法、多语言、知识表示和推理等基础技术,全面支持阿里经济体自然语言技术和应用需求,每日调用达到8000多亿次。

  • 语义计算

研究自然语言理解和语义分析等技术,应用于智能问答、文本摘要、文本复述/推理等问题。

  • 应用技术

研究情感分析、文本分类、(基于语意的)信息检索、推荐算法、文本生成、事件提取等技术,应用于电商,通讯,司法,资讯等场景。

  • 机器翻译

研究文本机器翻译技术和多模态机器翻译(语音翻译,图像翻译)等技术。支持中、英、俄、西班牙、泰、印尼等20余种语言,45余种语言方向,日均调用量超7亿次。


产品及应用
  • AliReader

    针对用户问题,依靠算法分析相关非结构化文本(文档、描述、网页等),并从文本中获取答案,在客服、资讯、培训等场景有着广泛的应用。分别上线阿里小蜜、店小蜜、云小蜜等产品,快速高效建立问答能力,减少人工预处理工作。

  • AliTranx

    通过机器翻译、跨语言检索、小语种词法分析等技术能力,解决买卖家之间的语言障碍。阿里翻译技术在多项国际比赛中夺冠,目前已广泛应用于阿里巴巴国际B2B、速卖通、Lazada跨境电商平台等场景,每日调用量达7亿多次,未来还将通过阿里云赋能合作伙伴。

  • AliNLP

    自然语言技术平台。包括全方位的NLP基础技术,如文本数据收集与处理技术,多语言的词汇、句法、语义、篇章级分析技术,文本分布式表示技术,以及情感分析、文本反垃圾、问答等垂直技术,每日服务调用6000余亿次。

    了解更多
  • 司法大脑

    结合达摩院在文本生成、知识图谱、信息提取、深度神经网络、信息检索等方向上的技术能力,全面梳理法律知识、总结证据标准、提炼审判规则、解构案件和法规,形成司法知识图谱,助力法官实时预判,提供参考裁判文书。已联合浙江省高院和浙江大学,三方协作共同打造“司法大脑”。

  • 病历质检系统

    利用NLP技术及医疗知识图谱对病历质量进行深度把关,促进病历的电子化和书写规范化,提高医疗效果、降低医疗风险,释放医务人员的人力,让他们能够专注于管理、教育与医学培训。病历质检系统可以进一步辅助推进国家健康人口数据平台的建立,协助提升我国人民的健康指数。


研究团队
司罗达摩院语言技术实验室负责人

卡内基梅隆大学博士。曾任普渡大学计算机系终身教授。曾获美国国家科学基金会成就奖、雅虎、谷歌研究奖等,发表过150余篇学术论文。先后担任ACM信息系统,ACM 交互信息系统和信息处理与管理编委会副主编。

黄非达摩院语言技术实验室研究员

卡内基梅隆大学博士。在顶级会议和期刊发表文章近30篇,曾担任ACL、NLPCC等领域主席、IJCAI资深程序委员。曾在Facebook、IBM Watson等从事NLP相关工作。现负责组建国际化翻译创新团队。

葛妮瑜达摩院语言技术实验室研究员

布朗大学计算语言学博士。研究领域包括句法、语义和语用的数学模型;在机器翻译方面,从事阿拉伯、汉、英、法、西、德、意、葡、俄等语种工作。曾任职IBM研究院,从事自然语言处理和机器翻译工作。

陈博兴达摩院语言技术实验室资深算法专家

中国科学院博士。曾是新加坡信息与通信研究所、加拿大国家研究委员会研究员。发表50多篇会议和期刊论文,曾获MT Summit 2013最佳论文奖。研究领域包括机器翻译、自然语言处理和机器学习等。

骆卫华达摩院语言技术实验室资深算法专家

曾任中科院计算所高级工程师,承担国家重大专项或自然科学基金课题十余项。现为自然语言处理-翻译平台负责人,组建并带领团队搭建阿里巴巴国际化翻译技术基础设施。

张琼达摩院语言技术实验室资深算法专家

浙江大学博士,曾在威斯康星大学麦迪逊分校做博士后研究。拥有多项专利,研究成果发表在SIGIR、AAAI、NAACL等国际会议上。曾在雅虎工作。现负责自然语言处理-信息抽取和知识发现方向。

刘晓钟达摩院语言技术实验室资深算法专家

雪城大学博士。曾任印第安纳大学布卢明顿分校信息与计算学院终身教授。研究领域包括信息检索、自然语言处理、文本挖掘、网络挖掘、人类计算等。现从事自然语言处理-文本挖掘方向的研究。

李林琳达摩院语言技术实验室高级算法专家

萨尔大学计算机博士。研究成果曾发表在ACL、EMNLP、NAACL、EACL、COLING等国际会议上。曾就职于巴黎LIMSI-CNRS研究所、微软奥斯陆、百度。现负责NLP通用和定制化平台技术的研发。


学术成果
论文
  • Jingang Wang, Junfeng Tian, Long Qiu, Sheng Li, Jun Lang, Luo Si, Man Lan. A Multi-task Learning Approach for Improving Product Title Compression with User Search Log Data. AAAI, 2018.
  • Kai Song, Yue Zhang, Min Zhang, Weihua Luo.Improved English to Russian Translation by Neural Suffix Prediction. AAAI, 2018.
  • Xinzhou Jiang, Zhenghua Li, Bo Zhang, Min Zhang, Sheng Li and Luo Si. Supervised Treebank Conversion: Data and Approaches. ACL, 2018.
  • Shaohui Kuang, Junhui Li, António Branco, Weihua Luo and Deyi Xiong. Attention Focusing for Neural Machine Translation by Bridging Source and Target Embeddings. ACL, 2018.
  • Wei Wang, ming yan and Chen Wu. Multi-Granularity Hierarchical Attention Fusion Networks for Reading Comprehension and Question Answering. ACL, 2018.
  • YaoBo Ni, Dan Ou, Shichen Liu, Xiang Li, Wenwu Ou, Luo S. Perceive Your Users in Depth: Learning Universal User Representations from Multiple E-commerce Tasks. KDD, 2018.
  • Jingjing Wang, Jie Li, Shoushan Li, Yangyang Kang, Min Zhang, Luo Si, Guodong Zhou. Aspect Sentiment Classification with both Word-level and Clause-level Attention Networks. IJCAI, 2018.
  • Lu Wang, Shoushan Li, Changlong Sun, Xiaozhong Liu, Luo Si, Min Zhang and Guodong Zhou . One vs. Many QA Matching with both Word-level and Sentence-level Attention Network. COLING, 2018.
  • Zhuoren Jiang, Yue Yin, Liangcai Gao, Yao Lu and Xiaozhong Liu. Cross-language Citation Recommendation via Hierarchical Representation Learning on Heterogeneous Graph. SIGIR, 2018.
  • Chen Wu , Ming Yan , Luo Si. Session-aware Information Embedding for E-commerce Product Recommendation(Short). ACM CIKM, 2017.
  • Shichen Liu, Fei Xiao, Wenwu Ou, Luo Si. Cascade Ranking for Operational E-commerce Search. KDD, 2017.
展开更多
竞赛
  • 2018年(WMT)机器翻译质量评测上取得6个子任务评测No.1。
  • 2018年机器翻译评测(WMT)上取得5个语向机器翻译自动评测的No.1。
  • 2018年国际语义理解评测大会上, 事件抽取、语义抽取、上下位词挖掘等三个项目均是No.1。
  • 2018年美国华盛顿大学举办的Trivia QA Web 问答场景中名列No. 1。
  • 2018年首次在斯坦福大学举办的著名SQuAD机器阅读理解评比中精确阅读超越人类。
  • 2017年中文语法错误自动诊断大赛三个level中均夺得冠军。
  • 2017年美国标准计量局信息抽取英文实体分类比赛No. 1。

扫描二维码
关注阿里技术微信公众号