Service Level AgreementsService Level Agreements
Bruno RausisGustavo SoaresLeonardo DefentiRafael Bianco
SLA em redes IP.
Editor: Ron SprenkelsAuthors: Ron Sprenkels, Aiko Pras
Introdução
• Suporte de diferentes níveis de Qualidade de Serviço (QoS)
• Customer Service Management: habilitar e possibilitar que clientes possam alterar a configuração de suas próprias instâncias de serviço
• Para exemplificar, veremos detalhes do Internet Protocol (IP), protocolo em que se baseiam redes como a Internet.
Conceito de SLA
• Definição:– “Um contrato explícita expectativas e obrigações que
existem em um relacionamento de negócios entre duas organizações: o provedor de serviço e o cliente.”
• Aborda aspectos legais da operação.
• SLAs são usados pelas partes envolvidas– O provedor de serviço usa o SLA para ter um registro definitivo
do que será fornecido• Também para o caso de disputas por clientes
Elementos de um típico SLA
– Descrição do serviço;– Parâmetros de desempenho esperados;– Procedimento bem elaborado para possíveis
problemas/quedas com o serviço;– procedimento de monitoramento e comunicação o nível
de serviço do cliente;– As penalidades para o caso do provedor de serviço não
atingir o nível de serviço descrito no contrato;– Ressalvas para as circunstâncias o SLA não será aplicado.
Ciclo de Vida do SLA
• Existem três fases na existência de um SLA que auxiliam na estruturação das atividaes.
Fase de Criação
Fase de Operação
Fase de Remoção
Fase de Criação
– Um SLA é fixado quando um cliente se compromete pagar pelo fornecimento de um serviço que é oferecido;
– A criação de um SLA envolve a realização de algumas atividades, como
• Estabelecer oficialmente um acordo. O provedor de serviço assina um contrato de entrega;
• Configurar os subsistemas dos serviços requeridos para acomodar essa nova subscrição de serviço.
Fase Operacional
– Nesta fase, o cliente tem acesso leitura on-line aos termos do SLA e aos parâmetros de serviço ;
– O cliente pode estabelecer mudanças nos parâmetros do contrato. Para isso, o cliente precisa de acesso com uma interface de Gerência de Serviços do Cliente (Customer Service Management);
• Observe que essas mudanças de configuração de serviço, na maioria dos casos, terá um efeito na conta do cliente.
Fase de Remoção
– Diante do fim do contrato, o SLA e todas as configurações associadas nos sistemas do serviço precisam ser removidas;
– O contrato de serviço não é renovado pelo cliente ou a atividade é terminada;
– Os subsistemas de serviço contém informações de configurações que devem ser removidos.
Caso de um SLA: O Serviço de IP
• O Modelo do Serviço de IP– Funcionalidade básica: capacidade de enviar pacotes IP para
outros clientes e receber pacotes IP de outros clientes;– O serviço é entregue pelos clientes através do Internet Service
Providers (ISP);• O ISP entrega o serviço de IP para um conjunto de clientes;• A mais básica configuração de um ISP e dois clientes:
Caso de um SLA: O Serviço de IP
– Cada cliente tem seu próprio SLA com o ISP para a entrega de um serviço de IP;
– A performance do serviço de IP é importante para o cliente. O SLA deverá conter uma especificação do mínimo aceitável de performance;
• O SLA deverá conter alguns parâmetros que alcancem um determinado limite para uma medida particular de performance.
Caso de um SLA: O Serviço de IP
– Um panorama do modelo de serviço de IP definido pela ITU-T sob recomendação da i.380:
Caso de um SLA: O Serviço de IP
– Tipos básicos de componentes:• HOST: um sistema que se comunica utilizando o protocolo
IP. A chamada entre hosts é feita através de roteadores;
• LINK: conexão ponto-a-ponto para transportar pacotes de IP entre um par de hosts.;
• SEÇÃO DE REDE: um conjunto de hosts que interconectam links;
• GETEWAY ROUTER: é denominado um roteador nas bordas da conexao, onde são enviados e recebidos pacotes para outro roteador na outra extremidade da conexao.
Caso de um SLA: O Serviço de IP
• O Modelo do Serviço de IP
– Para facilitar a definição de métricas de performance para o serviço de IP, critérios de avaliação são definidos;
– Um ponto de medida é localizado no limite entre um host e um link adjacente.
Caso de um SLA: O Serviço de IP
Tipos de Clientes
– Organizações (empresas e instituições);• Serviços com alta disponibilidade é prioridade.
– Clientes privados.• Serviço com alta disponibilidade é importante, mas
não essencial;• Procedimentos detalhados para relatar e corrigir
serviços não serão uma parte desse tipo de SLA.
Caso de um SLA: O Serviço de IP
Categorias de Informação de SLA
Um SLA entre ISPs também é chamado de “acordo de peering”. Ele especifica os termos entre os ISPs os niveis de tráfego e trânsito.
– TRAFFIC LEVELS (Níveis de Tráfego): O SLA pode descrever o tamanho do tráfico que pode ser alcançado;
– TRANSIT TRAFFIC (Tráfego de Trânsito): O SLA especifica se o tráfico de trânsito é permitido. E se é, quais as condições para que os tráfegos são?
Caso de um SLA: O Serviço de IP
– ROAMING ACCESS (Acesso Roaming): ISPs devem concordar mutuamente em aceitar outros clientes dentro de seu pool de modens. Para este trabalho, previsões devem ser feitas que permitam usuário em roaming ser autenticados a fim de ganhar acesso local.
Desempenho de um SLA de IP
• Parâmetros de Performance IP
– Identificar o que é relevante para as métricas de Performance IP utilizada nos SLAs:
• ITU-T recomendação I380: propõe uma sistemática que identifica os parâmetros requeridos pelas QoS para uso do SLA.
Desempenho de um SLA de IP
• 3 funções básicas:– Acesso– Transferência de Informação do Usuário– Desconexão
• Concentra-se na “Transferência de Informação do Usuário” que é mais relevante para redes IP.
Desempenho de um SLA de IP
• Quando um pacote IP é transmitido de uma máquina para outra, 4 resultados de transferência de pacotes básicos de IP são possíveis:
– Sucessful;– Errorred;– Spurious;– Lost.
Desempenho de um SLA de IP• Sucessful: quando um pacote IP é transmitido e
recebido em tempo (sem muito atraso), com um cabeçalho válido e com o conteúdo livre de erros
• Errorred: Quando um pacote é recebido em tempo, mas seu cabeçalho ou conteúdo contém erros
• Spurious: Quando tem um cabeçalho válido mas não foi enviado a nenhum lugar da rede
• Lost: Quando o tempo de atraso é muito alto
Desempenho de um SLA de IP
• Quando aplicado especificamente no caso de redes IP, são mais relevantes os seguintes parâmetros de performance IP:– IP Packet Transfer Delay (IPTD)– IP Packet Error Ratio (IPER)– IP Packet Lost Ratio (IPLR)– Spurious IP Packet Rate– Throughput – IP Service Availability
Desempenho de um SLA de IP
• Atraso de Transferência de Pacotes IP– IPDT: intervalo de tempo entre o primeiro bit de um
pacote enviado de um ponto de medição e o último bit recebido em outro ponto de medição.
– Determinado pelo:• Tamanho do pacote de IP• Atraso provocado pelas filas na rede• A média das velocidades de transmissão• Distância geográfica
Desempenho de um SLA de IP
• Devido ao roteamento das redes ser dinâmico, para cada pacote o nível de latência pode variar consideralmente de um pacote para outro
• Pacotes podem viajar em diferentes rotas e experimentar diferentes atrasos
• Onde é importante:– Vídeo conferência;– Áudio e telefonia IP;– Sistemas Bancários;– Internet.
Desempenho de um SLA de IP
• Necesario especificar no SLA valores de delay para:– Ida e volta de pacote– One-way
• Para conexão VoIP o atraso da via única deve ser menor que 150 ms
Desempenho de um SLA de IP
• Variação do atraso (IPDT)– JITTER: Definido como a variação de
latência de pacotes individuais em uma seqüência de pacotes transmitidos
– Onde é importante:• Aplicações com buffers pequenos;• Aplicações intolerantes a altos valores de
“JITTER”, mas que não tomam nenhuma medida ou tomam medidas restritas para compensar esse efeito
• Relação de Perda de Pacotes IP (IPLR)– Proporção dos pacotes enviados que são
recebidos tardiamente ou não são recebidos no destino
– Várias aplicações têm sensibilidades diferentes a erros nas transmissões de pacotes
• Áudio compactado• Áudio não compactado
– Onde é importante:• Transações bancárias• Jogos online
Desempenho de um SLA de IP
Desempenho de um SLA de IP
• Spurious Packet Rate– Taxa de pacotes que não foram transmitidos pelo
emissor que está indicado no cabeçalho.• Throughput
• Medida aplicada a um par de endereços de IP de uma fonte e um destino. Definido em duas variáveis:
– IPPT: indica o número de pacotes por segundo que o serviço pode agüentar
– IPOT: indica o número acumulado de octetos nesses pacotes que o serviço pode agüentar (conteúdo de 8 bytes)
Desempenho de um SLA de IP
• Availability (disponibilidade)
– Definido como o tempo disponível e proporção de perda de pacotes
– Verifica se o serviço está disponível e dessa maneira, divide o tempo em:
• Períodos de disponibilidade de serviço;• Indisponibilidade.
– Tempo sugerido para medições: 5 minutos
Aspectos de Contabilidade
• Diferentes contratos com forma distintas de cobrança
• Taxa Fixa X Cobrança por Consumo• Proposta de três categorias de cobrança:
– Flat Rate Accounting (Taxa Fixa);– Reservation Based Accounting (Planos);– Actual Usage Based Accounting (Gasto Atual).
Aspectos de Contabilidade
• Flat Rate Accounting – Esquema mais simples e atraente ao cliente. Paga-se uma
taxa mensal por conexão com tempo ilimitado.
• Reservation Based Accounting– O cliente pode escolher diferentes níveis de QoS
• Actual Usage Based Accounting– Contagem efetiva do uso dos serviços
• Número de bytes enviados e recebidos• Contagem de tempo utilizado
Verificação de SLAs TCP/IP
• Cliente- Verificar os níveis de serviço recebido
• Fornecedor- Monitorar e confirmar os níveis de serviço fornecido- Registro e prova dos níveis do serviço
Verificação de SLAs TCP/IP
• IETF (Internet Engineering Task Force)- Comunidade internacional que tem como objetivo fazer com que a internet funcione melhor, produzindo documentos de alta qualidade técnica que influenciam a forma em que as pessoas utilizam e administram a Internet.
• RFC (Request for Comments)- Documento que descreve os padrões de cada protocolo da Internet.
Verificação de SLAs TCP/IP
• Medições e Verificações
- Verificação de Atraso
- Verificação da Relação de Erro
- Verificação de Perdas de Pacotes
- Verificação da Taxa de Spurious
- Verificação de Throghput
- Verificação da Disponibilidade
Verificação de SLAs TCP/IP
• Verificação de Atraso
- Gravação do tempo atual no pacote na fonte e no destino.
- IETF one-way delay metric [RFC2679]
Somente um pacote
Stream de pacotes
- IETF round-trip delay metric [RFC2681]
Verificação de SLAs TCP/IP
• Verificação de Relação de Erro
- Erros de conteúdo ou endereçamento
- Definido entre dois endereços IP
- Definido sobre um conjunto de pacotes IP
- Sem procedimento recomendado pela IETF
Verificação de SLAs TCP/IP
• Verificação de Perdas de Pacotes
- Definido entre dois endereços IP
- Definido sobre um conjunto de pacotes IP
- IETF IP Performance Metrics [RFC2680]
- Leva-se em conta o período de tempo que o pacote esteve em
trânsito (expirado tempo limite)
- Para cada pacote enviado é determinado a perda ou não
- Relação entre total pacotes enviados e perdidos
Verificação de SLAs TCP/IP
• Verificação de Taxa de Spurious
- Definida em um único ponto de medida na rede
- Identificação de pacotes “Falsos”
- Envolve gravar informação do IP header de todos os pacotes que
passam pela rede
- Tarefa extensa, complicada e cara
- Sem procedimento recomendado pela IETF
Verificação de SLAs TCP/IP
• Verificação de Throghput
- Definido entre dois endereços IP
- Taxa de transferência de uma conexão única pode atingir entre os
dois pontos de medição
- IETF IP Performance Metric Bulk Transfer Capacity [Mathis00]
- Problema em conexões de alta capacidade (Web Server)
- Pode gerar muito tráfego extra de informação
Verificação de SLAs TCP/IP
• Verificação de Disponibilidade
- Medida derivada da Relação de Erro
- Unidirecional
- Bidirecional
- Temporal em dois sentidos
- IETF IP Performance Metrics [RFC2678]
Ferramentas e técnicasde verificação de SLA
- NeTraMet- NTOP- RMON- MIB II- MRTG
Conceitos• IETF(Internet Engineering Task Force) tem como objetivo fazer com que a
internet funcione melhor, produzindo documentos de alta qualidade técnica que influenciam a forma em que as pessoas utilizam e administram a Internet.
• RFC(Request for Comments). É um documento que descreve os padrões de cada protocolo da Internet previamente a serem considerados um padrão.
• Medição é a atividade de comparar uma quantidade com um padrão pré-definido.
Netramet• Netramet é uma implementação do RFC2720 definido pelo grupo IETF(Internet
Engineering Task Force).
• RFC2720 -> Network Traffic Flow Measurement ou Medição de fluxo de tráfego da rede
• Definição de Fluxo de acordo com a Netramet: é um fluxo de pacotes trocados entre dois hosts na rede, onde um é a fonte e o outro é o destino. Fluxos são bidirecionais no pacote.
• A operação básica do sistema é criar um grupo de regras. Onde cada regra do grupo define os critérios que determinam cada pacote ao seu fluxo.
• Qualquer informação que está disponibilizada no pacote IP, como IP fonte, IP de destino, as portas de destino e identificadores de procolos.... pode ser utilizada para a criação destas regras.
Remote Monitoring (RMON)
• É um padrão definido pela IETF para o gerenciamento de redes .
• O padrão RMON oferece uma arquitetura de gerenciamento distribuída para análise de tráfego, resolução de problemas, demonstração de tendências e gerenciamento proativo de redes de modo geral.
• O RMON pode ser usado para determinar erros e perdas dentro de um domínio broadcast.
MIB-II• O MIB II fornece informações gerais de
gerenciamento sobre um determinado equipamento gerenciado, possibilitando assim, a automatização de grande parte das tarefas de gerência.
• O grupo IETF definiu o MIB-II como sendo uma evolução do MIB, adicionando o uso do protocolo TCP/IP.
• Através das MIB II podemos obter informações como: número de pacotes transmitidos e estado da interface.
Ntop(Network top)• Ntop é uma ferramenta Open source que pode fazer vários
tipo de medições e análises nos tráfegos de IP.• O Ntop é instalado em um computador e inicia a capturação e
análise de todos os pacotes que podem ser observados por ele. Todas as atividades do Ntop podem ser feitas através de uma interface gráfica web.
• As quatro principais funções do ntop são: medição de trafego. monitoração de trafego. otimização e planejamento da rede. detecção de violação de segurança da rede.
Multi Router Traffic Grapher (MRTG)
• É uma ferramenta que pode monitorar e fazer medição de equipamentos gerenciáveis.
• Inicialmente era utilizado para monitorar apenas routers.
• MRTG monitora erros, envio e recebimento de trafego, apresentando os resultados em uma forma gráfica através da WEB.
Conclusão
• Uso de SLAs - É a maneira de mapear um problema complexo, e mensurá-lo. - Possui 3 fases: Criação, operação e remoção, sendo que a fase de
operação é a mais importante para o cliente.
• Necessidade de gerenciar estes serviços - Cliente visualiza o que usa. - Cliente possui medição do serviço. - Clareza e transparência.