智能客服机器人该怎么用

编辑 | 2017年11月21日 | 2017年 | 评论已关闭 | 2382

智能机器人，无疑是当今社会最热门的话题之一，也是各行各业争相应用的技术之一，在呼叫中心领域就是智能客服机器人的应用。对的，就是你经常碰到的，能和你说话，却往往说不上几句话的家伙，比如苹果的 Siri、某某公司的自助问答机器人。在这样一个充满了神经网络算法、认知计算、自然语言处理等高科技且代表时代潮流的领域，如此多的企业竞相上线应用，不遗余力地投入，结果却不是那么美好，用户还在叫着“我要人工”。呼叫中心的智能机器人到底是哪里出了问题？怎么解决这些问题？我尝试着按照自己的认识和经验做些整理分享给大家。

一、理解智能机器人

呼叫中心智能机器人的一个主要应用场景就是智能地和客户对话，解决客户的诉求。各个呼叫中心在实际应用中，在渠道和应用业务范围上会有所差异，比如是文本还是语音，目前图片、视频形式一般还进入不了智能客服的话题范围。应用业务范围不一样，是指对话的内容是基于业务的，还是基于聊天的，还是两者兼顾的（当然，如果智能机器人的应用就是为了聊天解闷，那聊天本身也就成了一种业务）。业务范围的不一样还可以理解为解决客户诉求的程度不一样，对话的目的是简单的引导、分类客户诉求，还是回答客户咨询，抑或是要完成业务办理。

在众多呼叫中心的不同应用中，出镜频率最高的还是在线客服文本的自动应答，所以很多时候提到智能机器人，就自然联想到能自动回复用户文本的应答系统。智能机器人完成的工作，是根据一句自然语言文字描述，找到合适的答案。

随着智能语音的发展，语音形式的智能机器人也逐渐流行。如果把智能语音机器人分解一下，不难发现接收语音其实是音转字（STT），播报应答是字转音（TTS），和智能机器人没有非常直接的关联。关于智能语音的应用，另外再写，这里不多做探讨。接下来分解一下“根据自然语言文字找到答案”这个过程，帮助更好地理解智能机器人。这个过程分为两部分：

第一步是理解问题，理解用自然语言表达的文字，形成一个标准问题，关键是“能听懂”；第二步寻找答案，根据理解出来的标准问题寻找答案，其关键是“有答案”。

在这两个步骤中，智能机器人和人工有什么不同呢？在问题理解方面，智能机器人和人存在差很大的差距。对于一个用自然语言表达的问题描述，其中隐含的真正问题，和整个对话所处环境和背景、对话上下文、语音语调等因素都有关系。人具备结合自己的经验和认知，综合各种因素去理解、转化问题的能力；而机器在这方面的能力明显很弱，通俗讲就是“转不过弯”。在寻找答案方面，机器和人各有优势。机器的“记忆力”明显强于人类，人记不住很多的问题（实际上应该是记住了，但不能正常调取，也就表现为记不住了）；人的优势不仅是拥有大量的知识内容，还知道它们之间的关系，甚至还会创造答案。目前普通应用中，在机器人智能方面的努力，更多的是在第一步语义理解，

第二步相对简单些，通常的做法都是不断地完善问答库（我们通常说 FAQ，或者知识库）。机器人在创造“问-答”关联，甚至创造答案的智能偏弱，一方面技术本身更弱一些，另一方面使用者也不放心，所以现在都是人“喂”机器人。这样理解的结果就是，智能机器人的核心在于理解问题和 FAQ 库。通俗地说，就是“听懂”和“知道”。

二、智能机器人面临的难题

现在，智能机器人不管是 Siri 还是某某企业的在线客服机器人，在实实在在解决了一些问题之余，大家都有“不好”的感觉：“不能好好聊”、“鸡同鸭讲”。如果说智能机器人出了问题，那应该是前面所说的两步出了问题。

首先看看理解问题方面面临的难题，我们分两种不同的智能机器人训练方式来看：第一种是人工定义，通过关键词，或者略复杂一点的表达式实现，本质上离不开人工，或者说人工预设。智能机器人就是根据关键词、表达式去理解原文。我把它称为基于确定关键词的方式。这种方式如果发现机器人理解错了，主要通过人工修改关键词、表达式的途径优化。智能机器人理解能力的优劣主要依赖系统对表达式的支持和人工设置。以前工作经历让我有幸接触到的小 i，应该就是这种模式，在把自然语言理解（转换）成标准问题方面，确实挺灵活的。但是我觉得这种方式下，有两个问题会成为继续发展的限制，一是以人力去设置表达式，能设置的问题数量必然有限，通常的做法就是等发现客户的某种表达不能理解了，去维护关键词和表达式。二是不同问题之间是相互关联影响的，同一关键词会出现在不同的题目中，要靠人想到且想清楚 A 问题的设置对 BCDEF 问题的影响并予以解决，是非常困难的。这就是为什么经常出现把一种客户表达理解问题解决后，却出现原来能正常理解的客户表达反而被理解错了。

第二种是人/外界给机器输入海量且成对的表述和理解，机器自动根据某种算法，用需要理解的原文去和已有的“表述-理解”库去比对，产生它认为匹配度最高的理解。我把它称为基于统计学概率的方式。这种方式如果发现机器人理解错了，主要通过增加正确原材料的输入解决。很明显，这样的智能机器人理解能力的优劣主要依赖原材料数量和后台算法。现在似乎很少有这种方式在智能机器人上使用。出现这种状况的原因可能是，能用于初始化的原材料太少，智能机器人初期表现不好，就被放弃了。也可能是因为出现理解问题后要调整的是后台算法，神秘、黑盒子、更加牵一发而动全身，动不动就要厂商、专家支持，在支持投入和支持时效方面难以让实际运营满意。不过这种方式更符合自学习过程，应该是未来智能机器人的发展趋势，也是专家级人物正在潜心研究的课题。

不管是哪种方式，理解问题的难点还在于一个标准问题不是一次性提出来的，是在不断的补充问题（追问）之后，才最终形成的。比如某保险集团下有产险、寿险、养老险等各种业务条线，每个条线下都有意外险，意外险还有各种不同产品。那么客户在咨询时，要求介绍意外险，就要定位是哪个业务条线的，接着还要客户明确是哪一种产品。发现没有，这是个由多个问题组成的流程，这才是“交流”嘛。以我的一知半解，实在是觉得人工设置理解路径或者让机器自动判断学习，是件非常非常困难的事情。

再说 FAQ 库方面的难题。按照我的理解，FAQ 库的生成也有两种方式：第一种是人工录入的，一个问题一个答案，这和我们常见的 FAQ 生成过程一样。第二种是机器自动生成的，从整篇的文档中提取。更高级一些的，可以根据从不同文档中提取到知识进行交叉校验，形成自有的问答知识。很显然，第二种方式是自学习的智能，就像人的学习过程，通过外部素材获取知识，也通过外部素材更新知识。

在这方面，实际应用大都停留在第一种方式，大量的 FAQ 还是靠苦逼的知识管理人员一点一点人工拆解出来，放到系统里面，工作量可以想象。现在有一些工具，可以实现一些结构性文档自动拆解成 FAQ，先不说效果，在工作量方面其实是转移到结构性文档的制作上了。举个例子说明，比如客户问保险缴多少保费的问题，下面的表述才是完整的有唯一答案的问题：“[寿险][保险产品A][性别男][年龄 30 岁][保险期限 20 年][保额 10 万][缴费期限 5 年][缴别年缴]，缴费多少？”这个略显夸张，但实际存在，可是实际上不可能把这么详细的问题作为标准问题，因为 8 个维度交叉组合，产生的问题数量是人工所不能承受的。现在常规的做法是，去掉后面的维度，按产品找一张费率表给客户自己去看，这就在智能上打折了。当然，这类问题现在还是有比较好的解决方案的，后面会说到。

来看看 AlphaGo 和 Watson 这两个高端大气的智能机器人面临的难题。在围棋上表现惊世骇俗的 AlphaGo，运行过程中不存在理解的难题，因为它的输入是每一次落子，是确定的，借助超级计算能力找到胜率最高的落子方法（答案）。它的惊人之处，在于通过算法的优化，提高运算效率，在现有计算机的计算能力上得以制胜。与上世纪 90 年代的深蓝相比，它的出身更加优越。再看在综艺节目危险边缘中成名的 Watson，从节目介绍来看，它需要面临理解的问题，难易程度不是很清楚。有一点可以确定的是它面临海量 FAQ 库的挑战，它的知识是从数以百万计的非结构化文件中生成的（DeepQA），同时产生了海量的知识，以及对同一问题不同的表述方式。在具备了如此多的原始资料后，建立在统计学基础上的准确程度自然会高。这些分析能力，也是借助强大的硬件计算能力和算法。

从 AlphaGo 和 Watson 的表现，还可以读出一个信息，对于确定的专业领域，AlphaGo 可以说从不失手，而对于更加开放的知识问答，Watson 就不见得常胜了。相比之下，Watson 更像我们需要的客服智能机器人。

如果我们的客服智能机器人拥有超级计算机的计算能力、拥有 AlphaGo 和Watson 匹敌的算法，那么客服智能机器人也一定表现不俗。因为这样可以处理更多的数据，比较更多的可能性，在理解上和答案匹配上准确率也就越高。很残酷的现实就是，这两个途径都和普通企业无关。现在的超级计算能力应用于商业领域还需要点时间；更加高级的算法，可能还有待于脑科学的发展。

三、智能客服机器人该怎么用

前面说了智能机器人面临的难题，甚至上升到了科学技术现状的客观限制，并不是说不要搞智能机器人了。正好相反，了解的目的是为了更好地利用好智能机器人，避开我们所不能改变的点，恰当处理容易出问题的点。可以确认的是，客服智能机器人所面临的知识，还达不到海量的级别，所以不用太担心来自计算能力和算法上的客观限制。

观点1： “认怂”。当计算能力没有达到合适水平的时候，老老实实地把智能机器人圈在某个特定的知识范围内。用一个也许不太恰当的类比，许多在某个专业领域甚至某个特定工作方面应用的工业智能机器人，人家很“专”，也许误差 1 厘米就干不成活了，但人家还是“活”得挺好。

对聊天功能“认怂”。聊天涉及到的内容广度通常比业务知识要大的多，而且兼顾聊天和业务后发现很多词是两边都会用到的，这时就不得不花力气去处理以便理解准确，以免出现理解歧义。比如对于“没钱”，聊天可能是去调侃，业务可能是去办分期；对于“撞车了”，聊天时会说要注意安全，业务可能是进入报案流程。曾经，经常听到对智能机器人这样的评价，某某公司的机器人能或者不能好好聊天，很智能会说网络用语。在我看来，别人用来评价可以，你可不能当真。如果厂商在做产品介绍的时候用聊天内容给你举例，那你可能需要多问一些问题。业务是根本，聊天会几句就行了，网络用语调侃也只是锦上添花的事，避免因小失大。当然，如果你的目的就是通过天南地北的聊天以及各种新奇词句吸引流量，那么你可以去关注聊天，因为这时候聊天是正业。

对能解答的问题范围“认怂”。问题范围越广，意味着出现同词不同义的情形越多，就需要越多的维度来对这些词做进一步的限定以便准确定义。每加一层维度限定，问题数量是在成倍增加，问题维护难度增加效率下降。维护人员会经常遗漏对关联问题的评估和同步修改，经常出现意想不到的答非所问。服务范围限制越小，智能机器人的表现越好，在准确度和广度两方面做个权衡和抉择。

观点2：是对第一个观点的延伸，合理通过物理或逻辑的方式进行业务分隔，以适应不同场景的业务需要，可以进一步提高准确率。就拿 Watson 来说，也是按行业领域分开进行学习和应用的，据说在医疗行业的表现比较好。对于普通企业的区区软硬件条件来说，这种思路是可以借鉴的。以保险公司的 IVR 渠道和在线客服渠道为例，如果 IVR 渠道的目的还仅限于导航，对于“报案”这样的问题只有一个，答案是转人工；而在线客服的定位是咨询甚至引导自助报案，对于“报案”这样的问题涉及很多个，还要追问客户更多信息，由此产生大量上下文信息和关联问题。通常 IVR 渠道需要理解的客户表述可能只有 50 个问题，仅是为满足导航需要；而在线客服需要有理解的客户表述可能有 5000 个问题。如果分开的话，则理解 IVR 的客户表述变得非常简单和高效，IVR 渠道的任何修改不会影响到在线客服。

观点3：善用业务流程和系统数据，也是对第一个观点的延伸。第一个做法是将问题拆成需要理解的部分和不需要理解的部分。前面说到问保费的那个问题，如果把产品后的诸多维度，直接转到业务系统去，使用业务系统的规则和数据，提示客户选择相应的维度值，然后给出答案。则对于智能机器人来说，这个问题就简化成标准问题是产品 A 保费，答案是保费试算页面链接。至于其他信息的交互，通过页面将过程变得可控（确定），降低了理解问题的难度。客户需要的真正答案“多少保费”，也是可以通过规则计算出来的，那么日常维护的是规则，而不是具体问题和答案。

在这个例子中，“什么产品”是需要理解的，“产品保费的影响因素”可以转化成不需要理解的。

第二个做法是根据系统数据自动拼凑更加完整的问题。在能识别客户的情况下，自动获取客户的标签信息和产品信息，组合成客户的完整问题进行回答。比如已知客户是产险客户，客户说理赔怎么还没到账，则可以自动查询客户的理赔进度，而不是笼统的告诉客户理赔一般多长多长时间到账详询客服，或者傻傻地询问客户是寿险还是产险。

第三个做法是将问题放到业务流程中。客户办理某个业务，需要经过多个步骤、多个信息，如果把问题就放在某个特定步骤、信息的地方，既方便客户，又降低理解难度（甚至不用费力去理解）。例如信用卡账单，客户看到一些不常出现的支出，很有可能会有疑问，那就在这笔账边上放个小问号（“有疑问吗”），轻点一下，把相应的解释展示一下，就可以解决不少问题。初级的做法是展示通用的解释，对应 FAQ 库中的某一个问答，高级的做法是展示适合客户账户的解释，更加智能，问题解决率也更好。总之一句话，通过与业务系统的整合，提高智能回答水平。顺便提一下，客户理解的智能，是按照客户自己的特征，所描述诉求的具体情形，有针对性的给出答案或解决方案，只要实现了，就是智能，所以要实现智能客服，体现在过程，不局限于一个智能机器人，业务系统在“智能”上的可作为空间还相当大。

观点4：准备好一拨专业的知识管理人员。管理重点一方面是问题内容以及问题之间逻辑关系。对知识管理者的要求是，非常清楚有哪些业务知识，哪些由智能机器人来回答，非常清楚智能机器人资料库中知识架构以及关联关系，后者尤其重要。说不定这样的人会变成诸如知识架构师这样的角色，统领全局。知识管理人员的另一个重点是问题表述形式的研究。根据自身的业务特点，提前研究透客户对于业务问题的各种表述形式，有助于教会智能机器人如何理解客户问题，也有助于组织自身的知识结构。

观点5：传统知识库还有存在的必要。其一，前面说过智能机器人定位于解决有限的问题，所以还需要传统知识库解决全量问题。其二，如今的智能机器人没有根据文档回答问题的能力，是将知识碎片化成 FAQ 实现的，所有知识碎片化是不现实的，另外完全碎片化的知识会带来阅读困难，教授和学习也是问题。其三，智能机器人的知识内容是从传统知识库的文档形式转化而来的，不是人工就是自动，从逻辑上来说这样一个文档库是现实存在的。

观点6：如果供应商能提供丰富的行业原始资料库，那将会帮助你减少

不少前期人工准备资料的工作。

结论：正视目前智能机器人技术上的限制，保持对智能机器人合理的期望，

结合业务系统的完善，发挥有限业务范围下的智能作用，解决部分客户诉求，这

是我对于目前智能机器人的理解和态度。未来随着科学技术的发展，计算能力的

提高，算法优化升级，才会出现更理想的智能机器人

本文刊载于《客户世界》2017年11月刊；本文作者为吴海峰；作者曾就职于平安、太平、交行等企业客服中心；