[LIVE] Gestão de TI: Como organizar sua operação para atender ao SLA

Saiba quais são as melhores práticas de gestão de TI para organizar sua operação e cumprir com o SLA de atendimento da sua empresa.

Para entender as melhores práticas de gestão de TI, precisamos falar primeiro sobre o serviço de TI, que é responsável por se preocupar com a entrega de hardware, software e documentação, com o objetivo de resolver um problema ou criar novas funcionalidades para o negócio. 

Uma empresa cuja gestão não considera todo o ciclo de vida da TI corre uma série de riscos, como: baixa segurança de dados, falta de visibilidade do ambiente, dificuldade na resolução de incidentes e atrasos nas entregas. Por não existir processos mapeados ou um planejamento prévio, o esforço para solucionar problemas acaba sendo maior, impactando na entrega de SLA (Service Level Agreement).

Se você quer entender mais a fundo sobre como uma gestão eficiente pode ajudar o seu time a cumprir com o acordo de nível de serviço, continue lendo este resumo da live apresentada pelo nosso especialista em cloud computing, Ariel Carvalho. Se preferir, ao final desse resumo você também poderá conferir a gravação na íntegra.

Para começar, o que é ITSM?

ITSM – (IT Service Management, ou Gerenciamento de Serviços de TI) consiste em um processo de gestão que se preocupa em entregar soluções sempre alinhadas ao negócio, visando a governança de todo o ciclo de vida da TI e reduções de custos a longo prazo. 

Medindo a eficiência da gestão de TI

Existem KPIs (Indicadores de Desempenho) que devemos considerar na gestão da TI com base em melhores práticas e que podemos implantar com auxílio de ferramentas. Para citar alguns:

  • Disponibilidade dos sistemas e serviços
  • Prazo de entrega dos serviços
  • Indicadores de suporte e de capacidade
  • Error budget

Error budget é uma métrica mais utilizada na tomada de decisões sobre atualizações nos serviços de TI. Como o mal gerenciamento desse orçamento pode deixar seus serviços em freeze, utiliza-se error budget quando há necessidade de atualizar serviços de TI. Já quando se trata de serviços de infra, a métrica pode ser utilizada em casos mais críticos, nos quais é preciso justificar o tempo de indisponibilidade.

O gerenciamento das operações de TI e a atenção a estes KPIs impacta na entrega de SLA, uma vez que este é um fator diretamente relacionado aos requisitos do negócio.

Por que é importante que o SLA reflita os requisitos do negócio?

SLA é o acordo de nível de serviço estabelecido entre cliente e prestador, que descreve, de maneira contratual, os serviços e nível de atendimento que o contratante pode esperar receber e em quanto tempo, bem como as metas de entrega mensuráveis. O SLA deve mensurar a possibilidade dessa entrega dos serviços definidos pelo negócio, bem como o esforço que deve ser aplicado. 

Como quantificar o SLA de atendimento?

Definir o SLA por serviço prestado, previamente definido pelo negócio, por meio de documentação ou catálogo de serviços prestados junto dos respectivos SLAs.

Definir tipos de contratos, que englobam todos os serviços dentro de um mesmo SLA, discriminando apenas o nível de criticidade de cada atendimento. 

Como controlar os chamados de maneira eficiente?

Diferenciar incidentes de problemas

Incidente é uma falha em algum item de configuração dos serviços de TI prestados ou a degradação da qualidade, ou seja, incidente é algo que indica uma anormalidade nos serviços. Incidentes podem ser resolvidos com soluções de contorno. Já o problema, apesar de diferente do incidente, via de regra é gerado por um incidente. Problema é a causa desconhecida de um incidente e exige a investigação da causa raiz.

Quando falamos em incidentes, o foco deve ser resolver o sintoma o mais rápido possível e não necessariamente a causa. Já o propósito do gerenciamento de problemas é identificar, investigar e remover as causas. Sempre que uma causa raiz de incidentes não é identificada, um problema deve ser aberto.

Ciclo de gerenciamento de incidentes

O ciclo de gerenciamento de incidentes deve ser realizado da seguinte forma:

  • Identificação e registro do incidente
  • Categorização e priorização do incidente
  • Diagnóstico inicial e escalação
  • Investigação e diagnóstico
  • Resolução, recuperação e encerramento

Ciclo de gerenciamento de problemas

Já o ciclo de gerenciamento de problemas deve ser feito da seguinte maneira:

  • Detecção e registro do problema
  • Classificação e priorização do problema
  • Investigação e diagnóstico de causa raiz
  • Criação do registro de erro conhecido
  • Resolução e encerramento de problema

Catálogo de serviços e ferramentas de gerenciamento

É importante termos bem mapeado todos os serviços que a operação deve entregar com um catálogo de serviços, que deve conter as seguintes informações:

  • Qual o serviço prestado
  • Em qual categoria
  • Classificação do serviço
  • Acordo de nível de serviço

Com o catálogo definido, é importante criar procedimentos operacionais para cada tipo de serviço para categorizá-los em níveis de atendimento. O objetivo é criar uma base de conhecimento e atender o máximo de chamados no primeiro nível, diminuindo a escala. O processo de criação de procedimentos deve ser contínuo: sempre que houver a necessidade de escalar, deve ser aberta uma requisição de procedimento, garantindo que no próximo chamado deste tipo o primeiro nível já tenha base para atender.

Com tudo mapeado, é importante adotar uma ferramenta para gerenciamento e automação de chamados. Por meio da ferramenta, tanto cliente como atendente podem acompanhar o status da solicitação, bem como validar se o SLA está sendo atendido. Agora que você chegou até aqui, que tal se aprofundar no assunto e conferir os exemplos e aplicações práticas desses conhecimentos na gravação da live?

Veja também

Demand for data processing increases but the IT budget doesn’t. How to meet this demand?

Otimize a gestão do seu T.I com autonomia

O que é capacity planning? Aprenda a criar e gerar insights com o mapa de capacidade