通过技术创新提高呼叫中心IT服务管理水平

    |     2015年7月13日   |   行业要闻   |     0 条评论   |    657

|王宏图、王丛刚|2010-07-18

1. 前言

呼叫中心的IT服务管理一直是困扰IT管理人员的难题,难点在于呼叫中心对IT服务要求高,涉及技术门类极其复杂。以移动通信公司的10086为例,它是数以亿计的客户和企业接触的第一界面,直接代表企业形像,体现客户满意度;而服务10086的IT基础设施又极其庞杂。IT技术不仅涉及大型数据中心需要考虑的网络、主机、存储、数据库、应用软件,还涉及到普通办公环境需要考虑的桌面、终端、外设等多个层面,另外,还多出了交换、CTI、多媒体等技术门类。可以说是IT技术的“大杂烩”。移动公司不缺乏管理大型数据中心的团队和经验,但是并不能照搬到这样一个多层次、多类别的IT架构上。江苏移动呼叫中心的IT服务团队是一个勇于创新的团队,继2008年3月在全国率先推出支持大规模驻家座席的技术平台之后,在2009年又在终端和服务器的IT生命周期管理上进行了有意义的探索。

2. 初次探索

江苏移动的呼叫中心支撑着10086和12580两大类业务,3个服务中心分别位于南京和淮安两个城市,管理着近700台服务器和2500台终端。有限的几名管理员根本无法同时应付诸如此类的繁杂事务——频繁的系统安装、迁移、打补丁;大规模的应用布署、调整;此起彼伏的故障报修和系统恢复工作;还有无法预料的计算机病毒爆发和其他安全事件;常规的设备采购、资产管理也牵扯了一部分精力。为了保持移动公司的服务水平,维护企业形像,一直以来都依赖维护人员投入高度的责任感和加班加点牺牲个人时间来完成任务。改变不是一蹴而就的,IT人员不断在尝试采用不同的管理技术,改变管理方式,以期能够变被动为主动。从2006年(准确否?)起我们从多个不同的方向分别进行了探索。

2.1. 硬件还原技术

终端发生的问题是多方面的,可能是操作系统故障、应用程序故障,或者是病毒引起的异常情况。(准确否?)很多情况下修复过程很长,操作步骤很复杂,工作量之大也是不言而喻的。针对形形色色的终端故障,我们采用了一种最简单的办法——即采用还原卡技术。引入还原卡之后,无论终端出现何种复杂问题,我们都可以立即把系统盘还原到初始状态,保证座席能够在短时间内恢复正常工作。这样一来就解决了终端修复的大问题。

2.2. 面向流程的IT服务管理平台

我们引入了一套Service Desk服务管理平台,通过这套软件工具来帮助实现IT服务的自动化的流程管理。这是一个纯管理的工具,工单派发后还需要人员完成落地的过程。(准确否?)

2.3. 服务器和桌面虚拟化技术

在PC架构的系统上我们使用了VMWare来实现服务器和桌面的虚拟化;服务器虚拟化技术已经比较成熟了,能够大幅提高硬件资源的利用效率,并且可以根据需要调整资源和应用的相应配置,刀片服务器和VMWare技术的结合大大降低了系统硬件成本,同时也降低了管理的复杂度。

3. 创新提高

可以说,我们在上述方向上的探索是成功的。我们采用的各种技术手段帮助我们切实解决了一些具体的技术难题,并提升了管理的水准。但是,我们总感觉到这些技术手段是各自孤立的,它们之间的衔接存在断层,缺乏统一性,不能完全自动化。但是经过一系列的技术应用的铺垫,我们的思路渐渐清晰,而且寻找到一个合适的契机。

2008年初以来,呼叫中心多次爆发蠕虫和ARP病毒。由于是大面积爆发,IT人员经常措手不及。虽然全网部署了防病毒系统,而且执行强制打补丁的策略,但是,很快就发现在现有的环境下无法执行。

我们发现,终端虽然打过了补丁,但是由于某种故障发生以后,使用还原卡对系统进行了还原,当然新安装的补丁也被“还原”掉了。一旦爆发蠕虫病毒,这些还原过的终端很容易交叉传染——有些感染病毒的终端还原了而有些还没来得及还原,这些没有还原的终端继续传染给还原后没有打补丁的终端。如果要把还原状态设定为打补丁之后,那么每次打完补丁都需要手工更改还原卡的设置,而做到这一点几乎是不可能的。

通过对呼叫中心发现的这一系列问题的分析,我们发现,无法协同工作的单一的技术手段不仅不能达到终端安全管理的目的,反而带来了更多问题。

3.1. 基于策略执行的主动式终端安全管理体系

而结合具体情况,我们发现呼叫中心的大部分是属于固定工作环境的高度受控终端,安全策略相对比较容易制订,但难的是执行,也就是自动化的检查、修复。因为:第一,策略是需要强制执行的,执行效果需要循环评估;第二,策略是不断完善变化的,制订策略、发布策略和执行策略必须是一个整体;第三,策略的粒度范围很大,大到禁止不合格终端接入生产网络、禁止使用USB存储外设,小到禁止某个源IP访问某个目的IP(黑名单策略)、只允许某个源IP访问某个目的IP(白名单策略)。

因此,我们提出要建设基于策略的“主动式终端安全”体系,其实质不仅强调策略制定,更注重是策略自动化执行。而且注意不同策略执行技术之间协同工作。经过讨论,我们整理出如下的模型:

按照这个模型,我们考虑使用一个以策略为核心,以制定、检查和修复为基础的“三位一体”的技术架构:集中的策略制订、全面的检查与监控、自动化的修复和处理。

3.2. 融合技术架构—构建基于生命周期的终端标准化管理平台

以解决安全问题为契机,以基于策略执行的主动式终端安全模型为基础,我们找到了“终端安全、终端管理、备份恢复”这三个技术领域形成的一个合集。利用这三方面“融合技术架构”构建基于生命周期的终端标准化管理平台,帮助我们实现基于策略执行的主动式终端安全管理体系。

融合技术架构是横跨“安全”、“资产管理”、“补丁管理”、“备份恢复”、“网管”、“远程控制”等等领域的横向技术平台,那么,把一个融合技术架构放到时间序列里看就是“生命周期管理”的领域。

如下图所示:

通过呼叫中心基于生命周期的终端标准化平台的建设,利用其中相互关联的功能模块,加强了终端防护能力,提高了终端管理效率,我们简单列举几个有代表性的场景:

场景一

某一台外来终端可能感染了蠕虫病毒,此时接入呼叫中心内网,由于所有内网设备都下发了统一的策略,这台外来终端将被所有其他终端和服务器判别为非法,并被执行拒绝访问策略。

场景二

安全策略遵从模块发现部分终端存在安全漏洞,会根据策略自动启动补丁修复模块安装相应补丁,而在安装补丁前后会调用系统备份任务,便于补丁修复造成系统故障后快速恢复,所有任务完成后自动报告管理员。

场景三

呼叫中心需要对应用程序进行一次全面升级。针对不同的操作系统版本需要分别测试、打包、分发。并根据当前资产信息制订软件分发策略。这一切过程都可以在维护中心完成。

场景四

有一批新机器到货,呼叫中心管理员人员,可以利用快速部署模块采用定制镜像方式,根据不同业务需求定制多个系统镜像,自动网络分发。这样,一方面,减少新系统和应用的部署时间;另一方面,减少非正规途径德操作系统安装和配置引入的外来威胁。

场景五

当座席发生故障需要管理员帮助的时候,呼叫中心的管理员可以掌握该终端的所有资产信息、补丁安装、配置以及系统日志,便于及时分析问题,而且不用到需要帮助的计算机设备前,就可以为座席提供故障判断及解决、操作帮助等服务。

3.3. 标准化的终端管理服务

有了这样一个“三位一体”的终端和服务器管理的技术架构,我们才可以把维护的各种“工具”组合成“服务”,实现资源的最优配置。

IT服务管理是一个动态的过程,又是成本和效率和组合。我们割裂地看以上场景就很难形成连续性,从而忽视“管理”本身。可是一旦上升到财务和业务流程层面就很容易联系到ITIL——这样一个曾经被流程化、空洞化的概念。作为一个IT运营单位,我们更关注可以落地的技术,而不是空泛的流程和概念。我们在实践过程中强调把融合技术架构自觉地运用到整个终端生命周期管理的过程中,同时防止外延的扩大化。

在实践中我们发现:我们需要终端资产库,但更多是用于关联事件、关联策略和手段;我们需要服务流程,但更需要实实在在的可以把流程落地的技术。因此我们在探索、发现、选择、检验的过程中,直接跳过了各种花花绿绿的概念性介绍材料,通过测试、培训、磨合等一系列过程形成有自身特色的终端服务管理体系。而这套终端服务管理体系是有丰富内涵的,既有横向的融合技术架构,又有纵向的生命周期管理。

4. 实践效果

由于我们把目标限定于IT维护管理的一个小范围,很快就取得了预期的效果。可以从以下几个方面体现:

安全事件大大降低

随着系统上线,逐步优化使用以来,每天的终端病毒感染量逐渐下降,由原来的每天几十台下降到每天5-6台。大规模的蠕虫、ARP病毒在新的架构布署以后没有爆发过。

下一步我们计划从源头上阻止恶意威胁进入。

PC利用率大大提高

原来呼叫中心的很多PC因为病毒、硬件故障、系统安装和配置等各种原因无法使用,随着系统上线后,病毒问题减少,维护效率提高,大大提高了PC的利用率。

提高信息内容控制的级别

客服系统由于会接触到敏感的客户信息,对于信息的保护一直是管理工作的一个重大目标,新系统通过采用软件层的强制手段消除了终端的安全与信息泄漏隐患,如禁止使用USB设备,禁止访问与业务无关的网站等。

运维效率提高

系统上线前,大量重复性工作需要管理员人工完成,现在大部分可以通过调度任务,由系统自动完成,OS部署、软件分发、补丁修复、故障处理所占用管理员的工作量大大降低,运维效率提高了。

任何一项创新都离不开实事求是与客观的态度。正是由于江苏移动信息技术中心的团队强调从实际需求出发去构思,注重实际环境的测试,并在实际生产中运用了实践和培训相结合的方法,才能实现IT服务水平的提高。

责编:admin

转载请注明来源:通过技术创新提高呼叫中心IT服务管理水平

相关文章

回复 取消