何云超 多轮对话

29
多多多多多多多多多多多 多多多 2016.11.10

Upload: yunchao-he

Post on 22-Mar-2017

69 views

Category:

Engineering


1 download

TRANSCRIPT

Page 1: 何云超 多轮对话

多轮对话简介和基本方法何云超2016.11.10

Page 2: 何云超 多轮对话

报告内容对话系统多轮对话介绍常见方法Demo

Page 3: 何云超 多轮对话

人机交互人机交互方式

感觉系统:视觉、听觉、体感、味觉、嗅觉设备:屏幕、音响、键盘、鼠标、耳机、 MIC 、压力屏等形式:文字、图片、声音、温度、味道等

下一代交互革命语音目标:人们通过语音的方式,实现对机器的一切操作原因:符合直觉

Page 4: 何云超 多轮对话

语音交互解放双手学习成本低空间限制更少设备简单

Page 5: 何云超 多轮对话

语音交互场景输入

语音输入法、会议纪要、自动电影字幕翻译

方言转换、多语种翻译控制

语音控制设备(电视、车辆、音响、手机、游戏、台灯、…)

对话系统呼叫中心、智能客服、语音问答、聊天、语音助手

Page 6: 何云超 多轮对话

SiriCortana ( 小娜 )Google Now小冰 (微信公众号)贤儿机器僧 ( 微信公众号 )科大讯飞 灵犀百度 度秘Amazon EchoGoogle HomePepper

对话系统

Page 7: 何云超 多轮对话

对话系统分类闲聊型每条路径的分数是路径上每个时间点的分数的累加特点:机器伪装成一个人,和用户进行沟通例如:小冰、贤儿机器僧…任务型特点:万能小超人,帮助用户做具体的事情,订机票、查天气、设置提醒、邮件处理例如: Google Now 、控制类混合型特定:既能闲聊,又能完成任务例如: Siri 、 Cortana平台与设备

PC 移动端(手机、车载)家居(音响、玩具)

Page 8: 何云超 多轮对话

不完美。。。闲聊型

例如:小冰、贤儿机器僧…几番对话后就会露马脚、不再对其感兴趣

任务型例如: Google Now 、控制类支持领域不多,简单场景

Page 9: 何云超 多轮对话

如何构建对话系统闲聊型任务型

Page 10: 何云超 多轮对话

闲聊型基于检索的方法事先准备大量的回复文本,对于一个输入文本,按照一定算法,选择最适合的回文选择算法: 基于规则、分类、相似度特定:所有回文都是从固定回文集中选择,不会产生新的回复基于生成模型没有预先定义的回文集,直接生成回复文本;主要依靠机器翻译技术,将用户输入翻译为系统回复;需要大量的训练数据。腾讯聊天记录、各大电信公司短信记录、微博私信、阿里旺旺

Page 11: 何云超 多轮对话

生成模型语法错误训练时间长所需训练数据大不一致问题通用回复(嗯好、不错、不知道、无可奉告)

Page 12: 何云超 多轮对话

简单任务型机器人例如:查天气、查路线、查股票、查赛况、订机票、选情。。。特点:调用 API本质:将一个文本映射为一种 API 的调用方式, String到 API调用的映射方法:语义解析

Call API北京天气怎么样提醒我下午 2 点开会发短信给跃亭说一切都会过去

领域意图槽位

Page 13: 何云超 多轮对话

Example

Page 14: 何云超 多轮对话

简单任务型对话系统特点:单轮

一次用户输入和系统反馈,称为一个轮次,单轮表示轮次和轮次之间独立

任意两句话之间相互独立即,当前话语和前文与后文都无关

假设,执行一条指令 (call API)所需的全部信息,都包含在这一句话中没有记忆功能

Page 15: 何云超 多轮对话

实际情况用户话语之间存在关系多句话一起才能形成完整语义

[ 用户 ]: 北京天气怎么样?[ 系统 ]: 北京,晴,温度 2到 10 度[ 用户 ]: 上海呢?[ 系统 ]: 上海,下雨,温度 10到 16 度

[ 用户 ]: 爸爸去哪儿什么时候更新[ 系统 ]: 爸爸去哪儿每周五晚 22 点开播[ 用户 ]: 到时候提醒我[ 系统 ]: 已成功为您增加周五晚 22 点的提醒,内容是爸爸去哪儿开播了[ 用户 ]: 提前 10 分钟提醒[ 系统 ]: 修改为周五晚 21 点 50 分提醒吗[ 用户 ]: 确定[ 系统 ]: 已成功为您增加周五晚 21 点 50 分提醒,内容是爸爸去哪儿开播了

Page 16: 何云超 多轮对话

多轮对话目标:记录历史话语考虑话语之间的相互关系可以处理不完整语义情况

Page 17: 何云超 多轮对话

多轮对话基本流程主要模块:语音识别 ASR语义理解 SLU对话管理 DM

对话状态追踪 DST对话决策 DP

自然语言生成 NLG语音合成 TTS

Page 18: 何云超 多轮对话

语义理解语义表示 (Semantic Representation) :以什么形式表示文本的语义

分布式表示(向量)领域 -意图 -槽位表示法 (对话系统中常用)

Microsoft LUIS Example: Link.发QQ消息给小周说太阳照屁股了 (communication make_call)提醒我周五晚上10点给爸妈打电话 (reminder create_single_reminder)

Page 19: 何云超 多轮对话

对话状态 DS

记录了用户在对话中的所有历史信息

Page 20: 何云超 多轮对话

对话状态追踪记录用户历史输入,维持多个槽位上的取值

Page 21: 何云超 多轮对话

对话管理基本方法

有限状态机 FSM槽位填充

Page 22: 何云超 多轮对话

有限状态机 FSM

人为定义对话流程系统主导系统问,用户答答非所问,直接忽略仅适用于简单任务

Page 23: 何云超 多轮对话

FSM Example: OpenDial 系统

More: http://wiki.letv.cn/pages/viewpage.action?pageId=61295459

概率规则 if-else-then

用户行为 au系统行为 am用户话语 uu系统话语 um模型定义在 xml 文件中

Page 24: 何云超 多轮对话

槽位填充 SF

Frame :槽位的集合,定义了需要由用户提供什么信息

机票预订Departure_city ?Departure_date ?Destination_city ?Return_date ?对话状态:记录了哪些槽位已被填充

行为选择:下一步该做什么,填充什么槽位,还是进行何种操作

Page 25: 何云超 多轮对话

对话状态更新t+1  时刻的对话状态 st+1 ,依赖于之前时刻 t  的状态 st ,和之前时刻 t  的系统行为 at ,以及当前时刻 t+1  对应的用户行为 ot+1

Page 26: 何云超 多轮对话

槽位填充 Example

Site: http://wiki.letv.cn/pages/viewpage.action?pageId=60951745

如何进行行为选择:按顺序填充槽位加权填充Ontology

Page 27: 何云超 多轮对话

DEMO

OpenDial 订票系统

Page 28: 何云超 多轮对话

Demo

Alex对话状态追踪行为选择

Page 29: 何云超 多轮对话

谢谢

何云超 [email protected]