introdução a gerência de redes

Introdução a Gerência de Redes

Gerência de Redes

Frederico MadeiraLPIC1, LPIC2, [email protected]

mailto:[email protected]

http://www.madeira.eng.br/

O que é gerenciamento de rede ?

“Gerenciamento de rede inclui o oferecimento, a integração e a coordenação de elementos de hardware, software e humanos, para monitorar, testar, consultar, configurar, analisar, avaliar e controlar os recursos da rede, e de elementos, para satisfazer às exigências operacionais, de desempenho e de qualidade de serviço em tempo real a um custo razoável.”

Tuncay Saydam emFrom networks and network management into service and service

management

Exemplos de sistemas de controle área de energia

Sala de Controle da Usina de Itaipu

http://andersonbukoski.blogspot.com/2009/12/foz-de-chapeco-sera-erguida-em-tempo.html

Exemplos de sistemas de controle área de energia

Exemplos de sistemas de controle na aviação

MOTIVAÇÃO

➔ O Administrador/piloto pode monitorar os diversos componentes da usina/aeronave e analisar os dados

➔ Realizar a gerência reativa➔ Fazendo ajustes em resposta a modificações

ocorridas no sistema

➔ Realizar a gerência proativa➔ Detecção de tendências ou comportamentos

anômalos➔ Execução de ações antes que ocorram

problemas de maior proporção

Exemplos de sistemas de controle

Nas redes de computadores existe alguma motivação diferente ?

MOTIVAÇÃO➔ Crescimento das redes:

➔ Número de equipamentos➔ Diversidade de tecnologias➔ Diversidade de ambientes operacionais➔ Extensão/Dispersão da rede

➔ Garantir a qualidade no serviço;➔ Clientes mais exigentes➔ Competitividade➔ Outages

➔ Novos dispositivos/protocolos/arquiteturas de rede;

➔ Virtualização➔ Computação na Nuvem

MOTIVAÇÃO

➔ Complexidade das redes modernas

➔ Migração de tecnologias legadas para redes de dados

➔ Telefonia➔ TV (Streaming / GVT / Netflix / PS3)➔ Telemetria➔ Vigilância

➔ Múltiplos fornecedores

➔ Ausência de recursos suficientes para administrar/monitorar a rede

Exemplos de sistemas de gerência de rede

Exemplos de sistemas de controle

“O administrador de rede deve monitorar, gerenciar e controlar ativamente o sistema do qual está encarregado.”

Kurose e Ross

OBJETIVOS➔ Detecção de falhas

➔ Falhas em interfaces de rede, Computadores/Servidores, Roteadores, etc

➔ Através do monitoramento de tráfego ou ainda contadores de performance

➔ Monitoração de Hospedeiro➔ Acompanhar a disponibilidade dos hosts da

rede➔ Realizar gerência proativa na ocorrência de

uma falha➔ Monitoração de Tráfego

➔ A rede pode ser otimizada➔ Gargalos resolvidos➔ Novas contratações podem ser iniciadas antes

da exaustão do recurso

OBJETIVOS

➔ Detecção de Mudanças rápidas em tablas de roteamento

➔ Quando muito frequentes, podem indicar instabilidade em um roteador mal configurado ou intermitência em links de comunicação

➔ Monitoração de SLA's (Service level Agreement)

➔ Seja garantido o nível de serviço contratado➔ Alguns indicadores: Disponibilidade, latência,

throughput, notificação de eventos/atividades planejadas

➔ É necessário que seja especificado no contrato

OBJETIVOS

➔ Detecção de Intrusos➔ Filtragem de tráfego➔ Notificação de eventos suspeitos

➔ Aumento de consumo de banda repentino➔ Aumento de pacotes TCP SYN direcionados

a um único hospedeiro➔ Conexões a portas de acesso remoto➔ Autenticações inválidas

Modelo de Gerenciamento de redes da ISO

A ISO (International Organization for Standarization) criou um modelo de gereciamento de rede mais estruturado, baseado em 5 áreas de gerenciamento:

➔ Gerencimaneto de Desempenho

➔ Gerenciamento de Falhas

➔ Gerenciamento de Configurações

➔ Gerenciamento de Contabilização

➔ Gerenciamento de Segurança

Gerenciamento de Desempenho

➔ Quantificar, medir, analisar, informar, analisar e controlar o desempenho de diferentes componentes/recursos de rede

➔ Sejam ativos de rede, links, servidores ou ainda hosts

➔ SNMP desempenha um papel fundamental neste gerenciamento

➔ Controlar as variáveis da rede para atingir o nível de desempenho especificado:

➔ Capacidade de Utilização e Quantidade de Tráfego;

➔ Vazão dos Dados e Tempo de Resposta.➔ Definição de indicadores de rede


➔ Utilizado no planejamento da rede:

➔ Dimensionamento➔ Identificação de gargalos➔ Resolução de problemas de performance➔ Relocação de recursos➔ Ampliações programadas

Gerenciamento de DesempenhoExemplos:

➔ Utilização de CPU dos servidores é considerada OK até 60%, entre 61-85% deve-se iniciar processo de upgrade, acima de 86% é considerado crítico

➔ Ocupação dos links da rede devem ser observados, ao chegar a 70%, deve-se solicitar ampliação, se links forem redundantes/load balance, um link não deve ultrapassar 40% de sua capacidade, pois em situação de falha, receberá a carga do outro link.

Gerenciamento de Falhas

➔ Registrar, detectar e reagir a condições de falha da rede

➔ Gerenciamento de falha é o tratamento imediato, já o gerenciamento de desempenho é a longo prazo

➔ Requer constante observação do funcionamento dos dispositivos de forma que se possa identificar rapidamente o problema e resolvê-lo

➔ Gerência proativa de falhas➔ Determinar e isolar o ponto de falha;➔ Reconfigurar a rede para diminuir impacto da

falha;➔ Reparar a falha e voltar à situação normal de

funcionamento


➔ Registrar, detectar e reagir a condições de falha da rede

➔ Gerenciamento de falha é o tratamento imediato, já o gerenciamento de desempenho é a longo prazo


Exemplos de eventos a serem monitorados

➔ Interfaces de rede down➔ Serviços parados em servidores➔ Links de comunicação fora➔ Taxa de erro em links de comunicação➔ Ocupação de disco acima de um dado

threshold


Meios para atingir estes objetivos

➔ Utilizar ferramentas e funções de gerenciamento rápidas e confiáveis;

➔ Utilizar redundância de rotas e equipamentos para minimizar o impacto das falhas;

➔ Utilizar uma estratégia de gerenciamento de falhas redundante.

Gerenciamento de Configuração

➔ Permite ao administrador saber quais dispositivos fazem parte da rede administrada

➔ Lidam com a instalação, inicialização, partida, modificação e registro de parâmetros de configuração ou opções de hardware e software de rede.

➔ manter um inventário atualizado e produzir relatórios baseados nesse inventário.

➔ Reconfigurar a rede em função do desempenho, expansão ou recuperação de falhas;

➔ RFC-3139 oferece uma visão geral de gerenciamento de requisitos e de configurações

Gerenciamento de ConfiguraçãoRFC 3139 - Requirements for Configuration Management of IP-based Networks

➔ Policy Based Management: define um serviço específico em todos os devices da rede, incluindo comandos para múltiplos vendors.

➔ SNMP não é aplicado a este nível de gerência➔ A rede deve ser especificada de forma abstrata em uma

uma network-wide configuration➔ Existência de tradutores da política network-wide

configuration para configurações específicas de cada vendor/device

Gerenciamento de Contabilização

➔ Permite ao administrador da rede que especifique, registre e controle o acesso de usuários e dispositivos a recursos da rede.

➔ Monitoração de quanto dos recursos estão sendo utilizados por usuários ou grupos de usuários

➔ Quotas de utilização ➔ Limitação de uso dos recursos por usuários ou

grupos de usuários

➔ Cobrança por utilização

➔ Alocação de acesso privilegiado a recursos

Gerenciamento de Segurança

➔ Controlar o acesso aos recursos da rede de acordo com alguma política definida. Controla o acesso aos recursos da rede através do uso de técnicas de autenticação e políticas de autorização.

➔ Geração, distribuição e armazenamento de chaves criptográficas e de senhas;

➔ Registro dos logs de Segurança

➔ Proteção dos recursos da rede e das informações dos usuários

Exemplo de Soluções

FUNCIONALIDADE APLICAÇÃO FABRICANTE

Gerência de desempenho Netclarity Lanquest

Gerência de faltas Spectrum's alarm managers

Aprisma

Manipulação de alarmes Trap exploder Empire technologies

Gerência de segurança Boks Securix

Gerência de bens Assetview Hp

Configuração Netbuilder 3com

Configuração Cisco works Cisco

Exemplo de Soluções

Detecção de problemas com conectividade:

➔ Traceroute➔ Ping➔ Route➔ Netstat➔ Ifconfig(linux) / ipconfig(windows)➔ Iperf (linux)➔ Iftop (linux)➔ MTR

Rede sem Gerência

Principais problemas de redes sem gerência

➔ Congestionamento➔ Má utilização de recursos➔ Recursos sobrecarregados➔ Problemas com segurança➔ Indisponibilidade➔ Outros ?

Tipos de GerênciaGerência Reativa

➔ Administrador da rede limita-se a reagir aos problemas que surgem

➔ Se utiliza de padrões e ferramentas de gerência para ser alertado de um problema

Tipos de GerênciaGerência Pró-ativa➔ Administrador da Rede procura, rotineiramente,

por informações que possam revelar com antecedência a possibilidade de um problema na rede

➔ Concentra esforços nos estudos dos avisos (warnings), que são registros da ocorrência de uma situação anormal, porém não crítica

➔ Utiliza históricos, estatísticas e o monitoramento frequente dos eventos relevantes da rede

➔ Mais difícil de ser efetuada que a reativa. Entretanto, resulta em tempos menores de parada e economia geral de operação da rede

Métricas

➔ Disponibilidade

➔ MTTR

➔ Tempo de Resposta

➔ Taxa de Erros

➔ Latência

➔ Vazão (Throughput)

➔ Utilização

MétricasDisponibilidade

“Um sistema de alta disponibilidade é um sistema informático resistente a falhas de software e energia, cujo objectivo é manter os serviços disponibilizados o máximo de tempo possível.”

(Fonte: Wikipedia)


Níveis de Alta Disponibilidade

Quanto maior a disponibilidade, maior a redundância e custo das soluções: tudo depende do tipo de serviço que se pretende disponibilizar

Quanto maior a disponibilidade, maior a redundância e custo das soluções: tudo depende do tipo de serviço que se pretende disponibilizar


Cálculo da Disponibilidade

MétricasMTTR

É o espaço de tempo (médio) que decorre entre a ocorrência da falha e a total recuperação do sistema ao seu estado operacional.

(Fonte: Wikipedia)

MétricasTempo de Resposta➔ Tempo decorrido entre a requisição de uma ação

ao sistema e a resposta completa à sua requisição

➔ Medição Complexa➔ Depende de diversas variáveis e suas interações

MétricasTaxa de Erro

➔ Relaciona a quantidade de pacotes, recebidos ou enviados por uma interface de rede, cujo conteúdo (em bits) apresenta erro em relação ao total de pacotes nessa mesma interface.

➔ Normalmente, essa taxa é medida em valores percentuais dentro do período de monitoramento.

➔ É de difícil detecção e pode ser a causadora de muitos problemas que serão detectados posteriormente

MétricasLatência

➔ Tempo que um pacote leva para ir de um ponto a outro da rede

➔ Normalmente medido em milisegundos➔ Quanto menor a latência, melhor o tempo de

resposta da rede

round-trip delay time

MétricasVazão (Throughput)

Throughput (ou taxa de transferência) é a quantidade de dados transferidos de um lugar a outro, tem como unidades básicas de medidas o Kbps, o Mbps e o Gbps. O throughput pode ser traduzido como a taxa de transferência efetiva de um sistema. A taxa de transferência efetiva de um determinado sistema (uma rede de roteadores por exemplo) pode ser menor que a taxa de entrada devido às perdas e atrasos no sistema.

(Fonte: Wikipedia)

Throughput é diferente da largura de banda nominal.

Throughput é diferente da largura de banda nominal.

MétricasUtilização➔ É a quantidade em uso de um determinado

recurso (porcentagem), em relação à sua capacidade total de atendimento

➔ Auxilia na avaliação e detecção de gargalos, uma vez que influenciam diretamente no tempo de resposta da rede e das aplicações envolvidas

➔ Monitorando-se a utilização, ao longo de um determinado período de tempo, é possível observar os intervalos de pico na utilização de um serviço ou recurso

➔ Exemplos: memória disponível, leitura/escrita em disco, processador (CPU), largura de banda da rede.

introdução a gerência de redes

Technology