你好AI丨20 篇聊天机器人领域必读论文速递!

聊天机器人(Chatbot)是经由对话或文字进行交谈的计算机程序。其能够模拟人类对话,通过图灵测试。自 1966 年以来人类从未停止过对聊天机器人的探索。现如今,苹果语音助手 Siri,微软的小冰、小娜、Rinna、Tay、Zo、Ruk kkuh,亚马逊的Echo,百度的小度机器人,京东JIMI客服机器人,网易七鱼等 Chatbot 纷纷进驻到生活的各个领域,改变着我们的生活。

历史发展脉络

1966 年,MIT 的计算机科学家 Joseph Weizenbaum 发表了 ELIZA,它可以根据人工设计的脚本与人类交流,是世界上第一个模仿人类谈话的机器人;1971 年, 斯坦福大学的 Kenneth Colby 开发出 Parry 聊天机器人,它模仿偏执狂患者,这是第一个通过图灵测试的聊天机器人;1988 年,加州大学伯克利分校的 Robert Wilensky 等人开发了名为 UNIX Consultant 的聊天机器人系统;1990 年,美国人 Hugh Loebner 设立 Loebner Prize,奖励首个与人类回复无差别的计算机程序,即聊天机器人系统;1995 年,Richard Wallace 博士开发的 ALICE 系统允许用户自定义自己的聊天机器人,被认为是 20 世纪最伟大的聊天机器人。ALICE 在 2000、2001 和 2004 年三次斩获勒布纳人工智能奖(Loebner Prize),该奖项颁发给最像人类的系统;2001 年,SmarterChild 在短信和即时信息中广泛流行,聊天机器人第一次被应用在即时通信领域;2006 年,IBM Watson 能够用自然语言回答问题;2010 年,苹果语音助手 Siri 诞生;之后,全球各大公司开始推出 Chatbots 平台或开源架构。

必读论文推荐

Dialog State Tracking: A Neural Reading Comprehension Approach

作者:Shuyang Gao, Abhishek Sethi, Sanchit Agarwal, Tagyoung Chung, Dilek Hakkani-Tur

链接:https://www.aminer.cn/pub/5de0b9f3df1a9c0c41598a75/dialog-state-tracking-a-neural-reading-comprehension-approach

对话状态追踪用于在给定所有先前对话的情况下估计当前的对话状态。机器阅读理解则侧重于构建系统,以读取文本段落并回答基于段落理解的问题。本篇论文将对话状态追踪转化为一项机器阅读理解任务,以基于上下文回答当前的对话状态是什么这一问题。传统的状态跟踪方法通常将对话状态预测为本体中所有可能的槽值在封闭集合上的分布,而本文使用简单的基于注意力的神经网络来指向对话中的槽值。

Topical-Chat: Towards Knowledge-Grounded Open-Domain Conversations

作者:Karthik Gopalakrishnan, Behnam Hedayatnia, Qinlang Chen, Anna Gottardi, Sanjeev Kwatra, Anu Venkatesh, Raefer Gabriel, Dilek Hakkani-Tür发表:Interspeech Conference

链接:https://www.aminer.cn/pub/5db92b0647c8f7664621a7e6/topical-chat-towards-knowledge-grounded-open-domain-conversations

建立可以与人类进行深层次、开放性对话的社交机器人,是人工智能领域的重大挑战之一。Amazon 团队开发的 Topical-Chat 是一个基于知识的人-人之间开放领域对话数据集(Knowledge-Grounded Open-Domain Conversations)。其中的基础知识涵盖 8 个广泛的主题,并且对话伙伴没有明确定义的角色,有助于对开放域对话式 AI 的进一步研究。本文还在 Topical-Chat 上训练了几种最新的编码器-解码器对话模型,并使用自动和人工评估以进行基准测试。

MoEL: Mixture of Empathetic Listeners

作者:Zhaojiang Lin, Andrea Madotto, Jamin Shin, Peng Xu, Pascale Fung

链接:https://www.aminer.cn/pub/5db9294b47c8f766461f2f8d/moel-mixture-of-empathetic-listeners

以往对移情对话系统的研究主要关注在特定情绪下产生的反应。但是,产生共情不仅需要具备生成情绪反应的能力,更需要理解用户的情绪并适当地予以回复。本篇论文提出全新的基于端到端(End-to-End)在对话系统中建立移情模型的方法:移情听众的混合物(MoEL)。这一模型首先捕获用户的情绪并输出情绪分布。基于此,MoEL 将结合优化后的侦听器的对某些情绪做出的反应,从而产生移情。

Ethical Challenges in Data-Driven Dialogue Systems

作者:Peter Henderson, Koustuv Sinha, Nicolas Angelard-Gontier, Nan Rosemary Ke, Genevieve Fried, Ryan Lowe, Joelle Pineau发表:In the 2018 AAAI/ACM Conference on AI, Ethics, and Society

链接:https://www.aminer.cn/pub/5a4aef9e17c44a2190f7a8b1/ethical-challenges-in-data-driven-dialogue-systems

本篇论文重点介绍对话系统研究中可能出现的道德问题,包括:数据驱动系统中的隐性偏见、对抗性示例的出现、潜在的隐私侵犯源、安全问题,强化学习系统的特殊考虑以及可复制性问题等。

MultiWOZ – A Large-Scale Multi-Domain Wizard-of-Oz Dataset for Task-Oriented Dialogue Modelling

作者:Pawel Budzianowski, Tsung-Hsien Wen, Bo-Hsiang Tseng, Iñigo Casanueva,Stefan Ultes, Osman Ramadan, Milica Gasic

链接:https://www.aminer.cn/pub/5bdc315017c44a1f58a05b9f/multiwoz-a-large-scale-multi-domain-wizard-of-oz-dataset-for-task

尽管机器学习已成为对话研究界的主要场景,但真正的突破已被可用数据的规模所阻碍。为了解决这个基本障碍,本篇论文引入了 Multi-Domain Wizard-of-Oz 数据集(MultiWOZ),这是一个跨越多个领域和主题的完全标记的人与人的书面对话数据集。它的对话数量达到了 10k,比所有先前注释的面向任务的语料库大至少一个数量级。除了是标有对话信念状态和对话行为的开源数据集之外,这项工作的贡献有两方面:首先,提供数据收集程序的详细描述以及数据结构和分析的摘要。数据收集渠道完全基于众包,无需聘请专业注释人员;其次,报告了一组信念跟踪,对话行为和回复生成的基准结果,显示了数据的可用性,并为未来的研究设定了基线。

A Survey of Available Corpora For Building Data-Driven Dialogue Systems: The Journal Version

作者:Iulian Vlad Serban, Ryan Lowe, Peter Henderson, Laurent Charlin, Joelle Pineau发表:Dialogue & Discourse

链接:https://www.aminer.cn/pub/5b3d98bd17c44a510f800274/a-survey-of-available-corpora-for-building-data-driven-dialogue-systems-the

本篇论文告诉我们目前有哪些可用于对话生成系统的开源数据集,并且分析了它们各自的重要特性,以及该如何使用他们。此外讨论了它们除了对话系统外的其他用途,以及这些数据集对应的检测方法。

The Design and Implementation of XiaoIce, an Empathetic Social Chatbot

作者:Li Zhou, Jianfeng Gao, Di Li, Heung-Yeung Shum发表:Computational Linguistics

链接:https://www.aminer.cn/pub/5c5ce50d17c44a400fc38d54/the-design-and-implementation-of-xiaoice-an-empathetic-social-chatbot

这是由微软研究员发表的关于智能语音助手小冰的论文。小冰是一个独特的人工智能伴侣,具有情感联系,满足人类对交流、感情和社会归属的需求。本篇论文在系统设计中考虑了智商和情商,将人机社交聊天作为马尔可夫决策过程(MDP)的决策,并优化了小冰的长期用户参与度和预期的每次会话对话。本篇文章详细介绍了系统架构和关键组件,包括对话管理器、核心聊天、技能和移情计算模块;并展示了小冰如何动态识别人类的感受和状态,理解用户意图,并在长时间的对话中响应用户需求。

A Network-based End-to-End Trainable Task-oriented Dialogue System

作者:Lina Maria Rojas-Barahona,Milica Gasic, Nikola Mrksic, Pei-Hao Su, Stefan Ultes, Tsung-Hsien Wen, Steve J. Young, David Vandyke

链接:https://www.aminer.cn/pub/59ae3c3a2bbe271c4c71fcd9/a-network-based-end-to-end-trainable-task-oriented-dialogue-system

让机器去和人类自然的交谈是具有挑战性的。最近的任务型对话系统需要创造几个部分并且通常这需要大量的人工干预,或者需要标注数据去解决各部分训练的问题。本篇论文提出了一种端到端的任务型对话系统(End-to-End trainable system),它采取了一种基于管道框架的新颖的收集对话数据的方法。这个方法确保轻松实现对话系统而不用过多的人工干预。

Neural Belief Tracker: Data-Driven Dialogue State Tracking

作者:Nikola Mrksic, Diarmuid Ó Séaghdha, Tsung-Hsien Wen, Blaise Thomson, Steve J. Young

链接:https://www.aminer.cn/pub/57a4e921ac44365e35c9913a/neural-belief-tracker-data-driven-dialogue-state-tracking

现代口语对话系统的核心组成部分之一是 belief tracker,它可以在对话的每一步估计用户的目标。然而,目前大多数方法难以扩展到更大、更复杂的对话领域。这是由于他们依赖:a)口语理解(Spoken Language Understanding,SLU)模型,需要大量注释的训练数据;或者 b)手工制作的词汇表,用于捕捉用户语言中的一些词语变种。本篇论文提出了一个新的 Neural Belief Tracking(NBT)框架,通过将模型建立在表征学习上以此克服了这些问题。NBT 模型对预训练的词向量进行推理,学习将它们组合成用户话语和对话上下文的分布式表示。

Towards an Automatic Turing Test: Learning to Evaluate Dialogue Responses

作者:Ryan Lowe, Michael Noseworthy, Iulian Vlad Serban, Nicolas Angelard-Gontier,Yoshua Bengio, Joelle Pineau

链接:https://www.aminer.cn/pub/59ae3c262bbe271c4c71ea58/towards-an-automatic-turing-test-learning-to-evaluate-dialogue-responses

本篇论文使用语境和真实反应来对模型生成的反应进行打分,并和人类打分的分值进行比较,从而达到一种自动进行图灵检测效果。训练出来的模型可以生成符合人类判断、能回答输入语句的对话。在给定地面实况的情况下,以往的工作都是计算生成话语和地面实况的相似性(包括字面上、语义上),本篇论文从人的理解角度出发,对生成的反应进行度量。

Adversarial Learning for Neural Dialogue Generation

作者:Jiwei Li, Will Monroe, Tianlin Shi, Alan Ritter, Dan Jurafsky

链接:https://www.aminer.cn/pub/58d82fcbd649053542fd6082/adversarial-learning-for-neural-dialogue-generation

To Plan or not to Plan? Discourse Planning in Slot-Value Informed Sequence to Sequence Models for Language Generation

作者:Neha Nayak, Dilek Hakkani-Tür, Marilyn A. Walker, Larry P. Heck发表:Interspeech Conference

链接:https://www.aminer.cn/pub/5a73cb6317c44a0b30358265/to-plan-or-not-to-plan-discourse-planning-in-slot-value-informed

Training End-to-End Dialogue Systems with the Ubuntu Dialogue Corpus

作者:Ryan Thomas Lowe, Nissan Pow, Iulian Vlad Serban, Laurent Charlin, Chia-Wei Liu, Joelle Pineau发表:Dialogue & Discourse

链接:https://www.aminer.cn/pub/58d82fecd649053542fdc665/training-end-to-end-dialogue-systems-with-the-ubuntu-dialogue-corpus

A Copy-Augmented Sequence-to-Sequence Architecture Gives Good Performance on Task-Oriented Dialogue

作者:Mihail Eric, Christopher D. Manning

链接:https://www.aminer.cn/pub/58d82fd2d649053542fd76c7/a-copy-augmented-sequence-to-sequence-architecture-gives-good-performance-on-task

Learning Symmetric Collaborative Dialogue Agents with Dynamic Knowledge Graph Embeddings

作者:He He, Anusha Balakrishnan, Mihail Eric, Percy Liang

链接:https://www.aminer.cn/pub/599c7953601a182cd263067d/learning-symmetric-collaborative-dialogue-agents-with-dynamic-knowledge-graph-embeddings

Key-Value Retrieval Networks for Task-Oriented Dialogue

作者:Mihail Eric, Lakshmi Krishnan, Francois Charette, Christopher D. Manning

链接:https://www.aminer.cn/pub/5d9edbfa47c8f7664602e485/key-value-retrieval-networks-for-task-oriented-dialogue

Learning Robust Dialog Policies in Noisy Environments

作者:Maryam Fazel-Zarandi, Shang-Wen Li, Jin Cao, Jared Casale, Peter Henderson, David Whitney, Alborz Geramifard

链接:https://www.aminer.cn/pub/5a73cbc317c44a0b3035eb5a/learning-robust-dialog-policies-in-noisy-environments

Hybrid Code Networks: practical and efficient end-to-end dialog control with supervised and reinforcement learning

作者:Jason D. Williams, Kavosh Asadi, Geoffrey Zweig

链接:https://www.aminer.cn/pub/58d82fcbd649053542fd5e67/hybrid-code-networks-practical-and-efficient-end-to-end-dialog-control-with

The Dialog State Tracking Challenge Series: A Review

作者:Jason D. Williams, Antoine Raux, Matthew Henderson发表:Dialogue & Discourse

链接:https://www.aminer.cn/pub/57a4e937ac44365e35c9cbfe/the-dialog-state-tracking-challenge-series-a-review

How NOT To Evaluate Your Dialogue System: An Empirical Study of Unsupervised Evaluation Metrics for Dialogue Response Generation

作者:Chia-Wei Liu, Ryan Lowe, Iulian Vlad Serban, Michael Noseworthy, Laurent Charlin, Joelle Pineau

链接:https://www.aminer.cn/pub/573696106e3b12023e5239eb/how-not-to-evaluate-your-dialogue-system-an-empirical-study-of-unsupervised

转自 学术头条

© 版权声明
THE END