gerenciamento de problemas: um estudo de caso aplicado a ... · falta de histórico sobre as falhas...

44
Gerenciamento de problemas: Um estudo de caso aplicado a PROCERGS Francisco José Paz PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO GRANDE DO SUL FACULDADE DE ADMINISTRAÇÃO, CONTABILIDADE E ECONOMIA CURSO ESPECIALIZAÇÃO EM GOVERNANÇA E ESTRATÉGIA DE TI Orientadora: Profª Edimara Mezzomo Luciano

Upload: donga

Post on 13-Nov-2018

216 views

Category:

Documents


0 download

TRANSCRIPT

Gerenciamento de problemas: Um estudo de caso aplicado a PROCERGS

Francisco José Paz

PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO GRANDE DO SULFACULDADE DE ADMINISTRAÇÃO, CONTABILIDADE E ECONOMI ACURSO ESPECIALIZAÇÃO EM GOVERNANÇA E ESTRATÉGIA DE TI

Orientadora: Profª EdimaraMezzomo Luciano

AGENDA

Introdução

Situação problemática

Justificativa

Objetivos

Método de pesquisa

Coleta e análise de dados

Resultados

Considerações Finais

INTRODUÇÃO

Gerenciamentode

Problemas

MetodologiaITIL

Necessidade deMelhoria dosProcessos

RealidadePROCERGS

Estudos comparativos

Visão GeralVisão Geral

SITUAÇÃO PROBLEMÁTICA

�Incidentes e problemas são tratados da mesma forma no sistema (ocorrências)

�Registros sem padrão definido e categorização muito desatualizada

�Falta de consistências das informações (registros X categoria)

�Falta de histórico sobre as falhas encontradas e problemas resolvidos

� Perda de agilidade na resolução das falhas

SITUAÇÃO PROBLEMÁTICA

Como utilizar as informações registradas nos incidentes para auxiliar na identificação

e tratamento diferenciado de problemas?

JUSTIFICATIVA

�Atendimento de uma necessidade operacional contemplada nas demandas do GOP

�Agilidade na resolução e diagnóstico de problemas, diminuindo o tempo entre falhas

�Eficiência e eficácia na prestação dos serviços de TI e Telecomunicações

�Estudo do Gerenciamento de Problemas, tópico ainda não tratado

OBJETIVOS

Desenvolver uma sistemática e propor melhorias na identificação e tratamento dos problemas

relacionados à TI da PROCERGS, considerando as boas práticas sugerida pelo ITIL.

Geral

� Identificar a forma como os problemas são diagnosticados e resolvidos na PROCERGS

� Confrontar o cenário atual de diagnóstico e de resolução de problemas com as melhores práticas sugeridas pelo ITIL

� Sugerir melhorias dos processos ligados a resolução de problemas na PROCERGS

OBJETIVOS

Específicos

MÉTODO DE PESQUISA

Identificação das áreas com mais volume de

ocorrências e de problemas mais

comuns

Levantamento e análise das

ocorrências das áreas selecionadas

Entrevistas: para identificar a forma

utilizada pelos técnico para resolver os

problemas

Classificação de ocorrências

identificando 5 problemas mais

freqüentes

Entrevistas com técnicos

Análise de documentos (relatórios)

Coleta de dados

Forma atual de tratamento de

problemas

ITIL

Comparação

Análise dos dados

Criar sistemática

Propor melhorias

Resultados

COLETA DE DADOS (1)

Identificação das áreas com mais volume de

ocorrências e de problemas mais

comuns

Levantamento e análise das

ocorrências das áreas selecionadas

Entrevistas: para identificar a forma

utilizada pelos técnico para resolver os

problemas

Classificação de ocorrências

identificando 5 problemas mais

freqüentes

Entrevistas com técnicos

Análise de documentos (relatórios )

Coleta de dados

COLETA DE DADOS (1)

Público alvo: líderes de equipe que atendem ocorrências

Áreas pesquisadas:Campo, Interno, Windows, Linux e Conectividade

Pergunta realizada:

Quais são os principais problemas resolvidos pela equipe no dia-a-dia?

1ª etapa Entrevistas - variáveis1ª etapa Entrevistas - variáveis

Equipes Entrevistado Problema mais frequente Perda de conectividade BRT – 10% do total de canais Perda de conectividade - outros reparos

Conectividade TEC-07

Lentidão Teclado/mouse Video CPU Impressora Softwares/Sistemas operacionais

Internas TEC-04

Problemas operacionais Softwares/Sistemas operacionais Erros Operacionais Problemas em impressoras

Campo TEC-11

Conectividade Windows TEC-12 Agentes de Backup/TNG

Restore de dados (Solicitação) Envio e recebimento de mensagens do Via-RS Problema de performace no servidor de Hospedagem Apontamento de DNS

Linux TEC-13

Lentidão de internet

1275124713411237Total de ocorrências

347340388314Conectividade

296303335250Campo

230243212236Interna

956790127Linux

73538383Windows

Médianov/06out/06set/06Equipes

Total de ocorrências por equipe dos meses de setembro, outubro e novembro de 2006.

Análise de relatóriosAnálise de relatórios

COLETA DE DADOS (1) - Resultados

COLETA DE DADOS (1)

Identificação das áreas com mais volume de

ocorrências e de problemas mais

comuns

Levantamento e análise das

ocorrências das áreas

selecionadas

Entrevistas: para identificar a forma

utilizada pelos técnico para resolver os

problemas

Classificação de ocorrências

identificando 5 problemas mais

freqüentes

Entrevistas com técnicos

Análise de documentos (relatórios)

Coleta de dados

COLETA DE DADOS (1)

Base do levantamento: Entrevistas + relatórios

�Período: meses de setembro, outubro e novembro de 2006.

�Equipes: Interna e Conectividade

�Amostra: 120 ocorrências por mês por equipe no período. Total = 720 ocorrências (42%)

�Informações desejadas:

�Primeiro momento: Problemas

�Segundo momento:solução

Análise do sistema (RTP)Análise do sistema (RTP)

COLETA DE DADOS (1) - Resultados

100%12081,1%97,33Sem comunicação10,8%13,00Instável/lentidão/ perda pacotes5,0%6,00Sem acesso3,2%3,65Outros

%MédiaReferências/ Problemas

Equipe Conectividade - ProblemaEquipe Conectividade - Problema

100%120Total21%25,00Aplicativo17%20,67Estação16%19,67Impressora15%18,33Windows9%10,33Monitor6%7,67Rede4%4,67Inventário4%4,33Internet9%9Outros

%MédiaReferências/ Problemas

Equipe Interna - ProblemaEquipe Interna - Problema

COLETA DE DADOS (1) - Resultados

100%Total

54,7%Atendida pela Brasil Telecom (BrT)

15,3%Problema aleatório / não identificado

12,3%Problema na estação / equipamentos /sistema do cliente / rede interna

7,7%Reset no modem/roteador/firewall/equipamentos10,0%Outros

MédiaSoluções para problema "sem comunicação"

Equipe Conectividade - SoluçõesEquipe Conectividade - Soluções

COLETA DE DADOS (1) - Resultados

Equipe Interna - SoluçãoEquipe Interna - Solução

27%16Reinstalação/reconfiguraçãoImpressora (59)

34%21Teclado/mouse substituido

27%17Substituição /memória/coolers/hd/outraspartes

Estação (62)61%45Reinstalação/reconfiguração

Aplicativos (74)37%20Limpeza geral/ajustes/anti-spyware/virus

Windows (54)

COLETA DE DADOS (1) - Resultados

�Em alguns casos é difícil identificar as ações tomadas para resolver o incidente(sem padrão)

�Dificuldade de levantar as informações do sistema (quantificar as ocorrências por tipo)

�Sistema não serve como base de conhecimento de problemas e soluções

�Dificuldade de gerar indicadores

Resumo da análise do sistemaResumo da análise do sistema

COLETA DE DADOS (1) - Análise

Identificação das áreas com mais volume de

ocorrências e de problemas mais

comuns

Levantamento e análise das

ocorrências das áreas selecionadas

Entrevistas: para identificar a forma

utilizada pelos técnico para resolver os

problemas

Classificação de ocorrências

identificando 5 problemas mais

freqüentes

Entrevistas com técnicos

Análise de documentos (relatórios)

Coleta de dados

COLETA DE DADOS (1)

COLETA DE DADOS (1)

2ª etapa Entrevistas - variáveis2ª etapa Entrevistas - variáveis

Conectividade: Sem comunicação

Interna: Windows, Aplicativos, Impressora e Estação

Pergunta realizada:

Qual o modelo lógico individual utilizado para identificar, diagnosticar e resolver o(s) problema(s) mais freqüente(s)?

ReinstalaçãoVerificar Spywares, virusverificar SOVerificação de hardwareTEC-06

––ReinstalaçãoBackup dos arquivosTEC-05

–Reinstalaçãoreparar SOVerificação de hardwareTEC-04

ReinstalaçãoTentativa de recuperaçãoColeta de infosMensagens de erroTEC-03

–ReinstalaçãoTeste de hardwareSoftware de verif. do SOTEC-02

–ReinstalaçãoVerif. Spywares, virusVerificar se carrega o SOTEC-01

Passo 4Passo 3Passo 2Passo 1Técnicos

Windows

COLETA DE DADOS (1) - Resultados

Padrão lógico equipe interna - exemploPadrão lógico equipe interna - exemplo

––Acionar BRTEcaminhamento paracampo ou brt ouinformatica do cliente

Passo 6

Ecaminhamento paracampo ou brt ouinformatica do cliente

–Teste nosequipamentos no cliente

Define problemaPasso 5

Identificação do problema

Ecaminhamentopara campo ou brtou informatica do cliente

Testes nosequipamentos de conectividade pontaPROCERGS

Testes nosequipamentos do clientePasso 4

Testes de conectividade com o cliente

Testes com o cliente nosequipamentos de conectividade

Verificar canal de comunicação

Verificar equipamentosde conectividade no cliente

Passo 3

Reset nosequipamentos

Verificação dos equipamentos naparte daPROCERGS

Teste nosequipamentos no cliente

Verificar equipamento de conectividade pontaPROCERGS

Passo 2

Verificar problemasem equipentos no cliente

Verificação dadimensão do problema com o cliente

Verificar informaçoesda ocoDados do chamadoPasso 1

TÉCNICO DTÉCNICO CTÉCNICO BTÉCNICO A

Sem conectividade

Padrão lógico equipe conectividadePadrão lógico equipe conectividade

COLETA DE DADOS (1) - Análise

�Menos experiente e mais rotativa;

�Possibilidades de solução e tipos de atendimentos mais variados ;

�Padrão lógico de diagnóstico e resolução de incidentes e problemas indefinido;

�Profundidade do diagnóstico se dá conforme a experiência do técnico.

Equipe internaEquipe interna

�Mais experiente e menos rotativa

�Menos variação de tipos de atendimento com maior número de possibilidades de solução

�Maior padrão de solução e diagnóstico similar entre os técnicos da equipe

�Diagnósticos profundos e detalhados

Equipe conectividadeEquipe conectividade

COLETA DE DADOS (1) - Análise

SEM COMUNICAÇÃO FRAME-RELAY

(somente Porto Alegre)

INFORMAÇÕES: Rede IP Máscara N Link Interface up/up? ACIONA BRT Canal Roteador e Porta S SLDD ? N Verifica com o cliente se cabos e equipamentos S estão ligados Modem-rout er? S Interface N up/up? N S OK Solucionou? Modem e Roteador Separados S N Testes de Ping LAN e WAN ACIONA BRT Interface UP/DOWN N Ping Wan N ? OK ? S Interface S DOWN/DOWN Testes de LDL 1 com cliente S Canalizado ? S Loop N N 2 Retorna ? ACIONA BRT 3

1 Encaminha Manutenção da Rede do cliente S Roteador da S Telnet pela WA N PROCERGS ? - verificação d e Roteador OK ? configuração, status da eth e cache de arp N N ACIONA BRT Encaminha Manu tenção do Roteador pela PROCERGS (Acerto de configuração remotamente ou troca rote- ador se problema hardware) 2 S Verifica:

- Conexão Rede/Router Encaminha Manutenção - Hubs e Switches Problem a N do Hardware: - Cabos e conexões Roteador - Placa Rede Micro - Placa Rede Micro ? - Hubs ou Switches - Interface ETH Router - Cabeamento

3 Encaminha Técnico Para conectar cabo Tem cabo entr e Roteador e o Conectando canal BRT. (RCD ou Em POP ? S Roteador ao DM. DM / RCD ? N S Verifica Conexão de Cabos ACIONA BRT Na Sala Telecom PROCERGS

RESULTADOS – Situação atual

Conclusão das entrevistasConclusão das entrevistas

Identificação do problema Testes

Ação corretiva e/ou

encaminhamento

Registro de início de atendimento

Registra o fim do atendimento e/ou

encaminha incidente

Recebimento do incidente

Modelo identificado através da análise do sistema e nas entrevistas

ANÁLISE DOS DADOS (2)

Forma atual de tratamento de

problemas

ITIL

Comparação

Análise dos dados

COMPARAÇÃO ENTRE GERENCIAMENTO DE

PROBLEMAS E A PROCERGS

Conceituando Gerenciamento de Problemas

Controle de Problemas:

Identificação do problema e sua causa raiz

Controle de Erros

Monitoração e controle dos erros até a sua resolução

����É registrado no sistema dentro do incidente em texto livre, sem possibilidade de buscar histórico automaticamente.Registro da resolução de erro

����- RDM: já existe sistema para cadastramento de RDM’s

����O erro é avaliado conforme a experiência do técnico. Avaliação do erro

����

Erros conhecidos são identificados pela experiência individual ou da equipe e são registrados nos incid entes. Não existe procedimento nem forma de armazenamento dessas informações

Identificação e registro do erro

Controle de Erros

����- Resolução e encerramento de problemas: Incidentes e problemas possuem a mesma conotação no sistema da PROCERGS, não é feito diferenciação de ambos.

����- RDM: já existe sistema para cadastramento de RDM’sRDM e Resolução e encerramento do problema

!- Falta de procedimentos e de documentações que auxiliem no aprofundamento e padronização de investigação e diagnóstico

Investigação e diagnóstico do problema

����- Não há qualquer recurso para identificação de impacto , urgência e prioridade , essa função fica a cargo da experiência dos profissionais

!- Categorização em estágio inicial (a cargo do projeto de incidentes na PROCERGS)

Classificação do problema

����

Sistema sem suporte a registro ou identificação de problemas: não existem meios de registrar informações de forma que facilite a identificação de problemas a partir de incidentes.

Identificação e registro dos problemas

SituaçãoSituação na PROCERGSAtividade (ITIL)

Controle de Problemas

Gerenciamento de Problemas

RESULTADOS (3)

Criar sistemática

Propor melhorias

Resultados

EstratégiaEstratégia

Melhorar o tratamento das informações

registradas nos incidentes

Propor um processo para tratar os problemas

+

RESULTADOS (3)

Identificação do problema Testes

Ação corretiva e/ou

encaminhamento

Registro de início de atendimento

Registra o fim do atendimento e/ou

encaminha incidente

Recebimento do incidente

Gerenciamento de Incidentes

Identificação da não conformidade

Testes Ação corretiva

Registro de início de atendimento

Encarra e/ou encaminha o

incidente

Recebimento do incidente

Classificação /CategorizaçãoRegistro de testes Registro de ações

Registro da não conformidade identificada

Gerenciamento de problemas

Fluxo existente

Proposta de inclusão no fluxo

RDM

Passo 1

Identificação do problema

Passo 2

Classificação

Passo 3

Investigação e diagnóstico

Passo 4

Descoberta da Causa Raiz

Gerenciamento de Configuração

Passo 5

Identificação e registro do erro

Passo 6

Avaliação do erro

Passo 7

Registro da resolução do erro

Equipes de segundo a

quarto nível de atendimento

Passo 8

Encerramento do erro

Controle de Problemas

Controle de Erros Gerenciamento

de Mudanças

Gerenciamento de Problemas

Gerenciamento de Incidentes

Funcionamento do processo segundo ITIL

Funcionamento do processo segundo ITIL

RESULTADOS (3)

Informações sobre

os incidentes

Informações sobre os

problemas

RDMStatus da Mudança

Informações sobre os IC´s

Ferramenta de incidentes

(RTP)

Ferramenta de Gerenciamento de Mudanças

(GMUD)

Ferramenta de Gerenciamento

de Configuração

(GCO)

Ferramenta de Gerenciamento de

Problemas

Interação entre ferramentasInteração entre ferramentas

RESULTADOS (3)

InícioIdentificada

repetição de uma não conformidade

Abertura de um registro de problema e

seleção do IC envolvido

Informações sobre os IC’s

Conferência e registro da classificação

Realização de investigação e diagnósticos

Registro dos testes

Identificada a Causa

Raiz?

Testes e Dignósticos

Registro dos testesNão

Registra resoluções

Necessita RDM?

Abertura de RDM

Aplica a resolução

Registro da resolução do erro

Avaliação do erro Identificação e registro do erro

Fim

Gerenciamento de Incidentes

Sim

Não

Informações sobre categoria

Inclusão do IC envolvido 1

1

Sim

Status da mudança

Gerenciamento de Problemas Controle de Problemas

Gerenciamento de Problemas Controle de Erros

Gerenciamento de Mudanças

Gerenciamento de Configurações

Fim

�Análise da situação atual do tratamento de problemas

�Proposta de um processo de trabalho para o Gerenciamento de Problemas

�Subsídios para criação de um projeto de Gerenciamento de Problemas

CONSIDERAÇÕES FINAISContribuições para a empresaContribuições para a empresa

�Oportunidade de unir atividade profissional com acadêmica

�Desenvolver um dos assuntos abordados durante o curso de Pós-Graduação

�Aprofundar os conhecimentos sobre o tema

CONSIDERAÇÕES FINAIS

Contribuições para o PesquisadorContribuições para o Pesquisador

�Manter um padrão de registro

�Criar base de conhecimento (procedimentos )

�Categorização adequada (atualizada)

�Link entre incidentes e problemas

�Reforçar entre as áreas a existência do Gestor de Incidentes (definir poderes)

CONSIDERAÇÕES FINAISRecomendações - IncidentesRecomendações - Incidentes

�Definição e mapeamento do processo

�Definição de responsabilidades (dono do processo + áreas responsáveis por problemas) -evitar sobreposições

�Criação/definição de ferramenta baseada no controle de problemas e de erros

� Ligação de problemas com os outros processos

�Comunicação sobre o gerenciamento de problemas

CONSIDERAÇÕES FINAISRecomendações - ProblemasRecomendações - Problemas

Gerenciamento de problemas: Um estudo de caso aplicado a PROCERGS

Francisco José Paz

Orientadora: Profª EdimaraMezzomo Luciano

PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO GRANDE DO SULFACULDADE DE ADMINISTRAÇÃO, CONTABILIDADE E ECONOMI ACURSO ESPECIALIZAÇÃO EM GOVERNANÇA E ESTRATÉGIA DE TI