ISO/IEC 20000 事件与问题管理流程的区别
1. 事件管理流程
1.1 定义与目标
事件管理是ISO/IEC 20000标准中一个关键的流程,其主要目的是尽快恢复约定的业务服务,或响应服务要求。根据ISO/IEC 20000的定义,事件是指服务的任何异常,并将导致或可能导致服务的中断或服务质量下降的事态。事件管理流程的目标是通过快速响应和处理事件,减少事件对业务运营的影响,确保服务能够尽快恢复正常。
1.2 事件管理的主要活动
事件管理的主要活动包括记录所有的事件,采用一定的流程来管理事件的影响。具体流程应定义所有事件的记录、优先次序、业务影响、分类、更新、升级、解决和正式关闭。此外,事件管理还要求将客户报告的事件或服务请求的进展情况通知客户,当不能达到服务级别时应提前警告客户,并与客户约定改进计划。
1.3 事件管理的执行流程
事件管理流程通常从服务台接收事件开始。服务台首先记录事件信息,根据事件发生的原因和所需支持的类别对事件进行分类,并结合事件的影响范围和程度定义事件的优先级和级别。若是新产生的事件,需要将其和已知的问题进行匹配,匹配成功就能根据方案解决问题,若匹配不成功,则服务台将事件转交给事件管理员进行调查和研究,提出快速解决事件的应急措施或方法。在整个事件解决过程中,服务台需要跟踪事件的进度,并对用户进行反馈,当事件解决后,服务台应向客户确认处理的效果是否满足服务级别定义的要求、客户是否满意等。# 2. 问题管理流程
2.1 定义与目标
问题管理是 ISO/IEC 20000 标准中另一个重要的流程,其目标是为最小化对业务的影响,对事件原因主动识别、分析、管理直至关闭问题。与事件管理专注于快速恢复服务不同,问题管理更侧重于找出事件发生的根本原因,从而避免类似事件的再次发生。
问题管理的定义涵盖了对事件背后潜在原因的深入探究。它不仅关注已经发生的事件,还包括对潜在问题的识别和预防。例如,在一个 IT 服务环境中,如果某个软件应用频繁出现崩溃的情况,事件管理会专注于快速重启应用以恢复服务,而问题管理则会深入分析软件崩溃的根本原因,如代码缺陷、系统兼容性问题等,并采取措施进行修复,以防止未来再次出现类似崩溃。
问题管理的目标是通过主动识别和解决根本原因,减少事件的发生频率和对业务的影响。这不仅有助于提高服务的稳定性和可靠性,还能降低因频繁事件处理而产生的成本。例如,通过有效的趋势分析,问题管理可以识别出某一硬件设备由于老化而频繁出现故障的模式,从而提前安排设备更新,避免因设备故障导致的服务中断。# 3. 事件管理与问题管理的区别
3.1 管理对象
事件管理的管理对象是具体的事件,即服务的任何异常情况,这些异常将导致或可能导致服务的中断或服务质量下降。例如,用户报告的电脑开机故障、网络连接中断、软件应用崩溃等都属于事件管理的对象。这些问题通常是已经发生且对当前服务产生直接影响的状况,需要立即处理以恢复服务的正常运行。
问题管理的管理对象则是事件背后的根本原因或潜在问题。它不仅关注已经发生的事件,还包括那些尚未显现但可能导致事件发生的潜在因素。例如,某个软件应用频繁崩溃的事件背后,可能隐藏着代码缺陷、系统兼容性问题或硬件资源不足等根本原因,这些就是问题管理需要识别和解决的对象。问题管理通过深入分析和调查,找出导致事件发生的深层次原因,从而从根本上解决问题,避免类似事件的再次发生。
3.2 处理时效性
事件管理强调快速响应和处理,其目标是尽快恢复服务以满足预定的服务级别协议(SLA)的要求。事件管理的处理时效性要求较高,通常需要在短时间内采取措施,如重启应用、修复网络连接、恢复系统等,以减少事件对业务运营的影响。例如,对于高优先级的事件,如网站宕机,事件管理流程要求在5分钟内响应,30分钟内解决。这种快速响应机制确保了服务能够迅速恢复正常,从而最大限度地降低对客户和业务的影响。
问题管理则更注重对根本原因的深入分析和长期解决方案的制定。其处理时效性相对较为灵活,因为问题管理的目标是彻底解决问题,防止类似事件的再次发生,而不是仅仅恢复当前的服务。例如,对于某个硬件设备由于老化而频繁出现故障的问题,问题管理可能需要经过一段时间的趋势分析、故障诊断和设备更新计划制定,才能从根本上解决问题。在这个过程中,问题管理可能会涉及到多个部门的协作,如技术团队、采购部门、供应商等,因此其处理时间可能会比事件管理更长。
3.3 核心目标
事件管理的核心目标是尽快恢复服务,减少事件对业务运营的影响。它关注的是事件的快速解决,以确保服务能够尽快恢复正常运行,从而满足客户的需求和业务的要求。例如,当用户报告电脑开机故障时,事件管理的首要任务是迅速采取措施,如检查硬件连接、重新启动系统等,以恢复电脑的正常运行。这种快速响应机制有助于提高客户满意度,减少因服务中断而带来的业务损失。
问题管理的核心目标是找出事件发生的根本原因,采取措施避免类似事件的再次发生。它更侧重于预防和改进,通过深入分析和调查,找出导致事件发生的深层次原因,并制定长期的解决方案。例如,对于软件应用频繁崩溃的问题,问题管理不仅会分析代码缺陷、系统兼容性问题等根本原因,还会与开发团队合作,修复代码缺陷,优化系统配置,从而从根本上解决软件崩溃的问题。此外,问题管理还会通过趋势分析和预防性措施,识别潜在问题并提前采取行动,以减少事件的发生频率和对业务的影响。
4. 总结
综上所述,事件管理解决的是事件产生的表面现象,而问题管理解决的是事件的根本原因。问题管理流程更像是事件管理流程的一种延续,是降低事件再次发生的可能性和影响的有效方法。
问题管理流程需要梳理已经记录的事件,以便寻找过往事件的实际原因或潜在原因。问题管理通过提供与相关问题有关的信息、已知错误、应急措施以及当前修补方法等来为事件管理流程提供输入帮助。
事件管理流程是问题管理流程的重要输入信息提供者,梳理已经记录的事件对决定问题管理流程的成功非常重要,因为这些输入信息可以帮助我们更好地发现问题,并找到问题的变通方法或已知错误。
问题管理对事件原因进行充分分析,直到找到事件原因的应对措施。但与此同时问题管理也能为事件管理提供一些应急处置措施。
通过对事件的原因进行准确分析,一旦定义了一个已知错误,理想的情况下,问题管理还可通过已知错误提供一个变更请求,这样就可以防止事件的再次。有时候技术和财务资源不允许修复已知错误的前提下,那么提供一个临时的变通方案以阻止事件的再次发生并降低事件的影响是一种可行的方案。
事件管理流程通常是被动执行的流程,其目的是减少服务意外中断或服务质量下降给信息技术服务带来的负面影响,以保证用户可以最快时间恢复自己的正常工作。
问题管理流程的目的是解决引起事件的根本原因以防止事件重复发生,通过找到过往的事件的根本原因,以此提出可行的变通方案或纠正措施。
事件管理解决的是事件产生的现象,而问题管理解决的是事件发生的根本原因。问题管理流程更像是事件管理流程的延续,是降低事件再次发生的可能性和影响的有效方法。
事件管理与问题管理是 ISO/IEC 20000 标准中两个紧密相关但又存在显著区别的流程。事件管理侧重于快速响应和处理具体的事件,以尽快恢复服务,减少事件对业务运营的直接影响,其管理对象是已经发生的异常情况,处理时效性要求高,核心目标是迅速恢复正常服务。问题管理则专注于深入分析事件背后的根本原因,旨在通过识别和解决潜在问题,避免类似事件的再次发生,其管理对象是事件的根本原因或潜在问题,处理时效性相对灵活,核心目标是预防和改进,从根本上提升服务的稳定性和可靠性。