introdução a gerência de redes
DESCRIPTION
Introdução a Gerência de RedesTRANSCRIPT
O que é gerenciamento de rede ?
“Gerenciamento de rede inclui o oferecimento, a integração e a coordenação de elementos de hardware, software e humanos, para monitorar, testar, consultar, configurar, analisar, avaliar e controlar os recursos da rede, e de elementos, para satisfazer às exigências operacionais, de desempenho e de qualidade de serviço em tempo real a um custo razoável.”
Tuncay Saydam emFrom networks and network management into service and service
management
Exemplos de sistemas de controle área de energia
Sala de Controle da Usina de Itaipu
Exemplos de sistemas de controle área de energia
Exemplos de sistemas de controle na aviação
MOTIVAÇÃO
➔ O Administrador/piloto pode monitorar os diversos componentes da usina/aeronave e analisar os dados
➔ Realizar a gerência reativa➔ Fazendo ajustes em resposta a modificações
ocorridas no sistema
➔ Realizar a gerência proativa➔ Detecção de tendências ou comportamentos
anômalos➔ Execução de ações antes que ocorram
problemas de maior proporção
Exemplos de sistemas de controle
Nas redes de computadores existe alguma motivação diferente ?
MOTIVAÇÃO➔ Crescimento das redes:
➔ Número de equipamentos➔ Diversidade de tecnologias➔ Diversidade de ambientes operacionais➔ Extensão/Dispersão da rede
➔ Garantir a qualidade no serviço;➔ Clientes mais exigentes➔ Competitividade➔ Outages
➔ Novos dispositivos/protocolos/arquiteturas de rede;
➔ Virtualização➔ Computação na Nuvem
MOTIVAÇÃO
➔ Complexidade das redes modernas
➔ Migração de tecnologias legadas para redes de dados
➔ Telefonia➔ TV (Streaming / GVT / Netflix / PS3)➔ Telemetria➔ Vigilância
➔ Múltiplos fornecedores
➔ Ausência de recursos suficientes para administrar/monitorar a rede
Exemplos de sistemas de gerência de rede
Exemplos de sistemas de gerência de rede
Exemplos de sistemas de controle
“O administrador de rede deve monitorar, gerenciar e controlar ativamente o sistema do qual está encarregado.”
Kurose e Ross
OBJETIVOS➔ Detecção de falhas
➔ Falhas em interfaces de rede, Computadores/Servidores, Roteadores, etc
➔ Através do monitoramento de tráfego ou ainda contadores de performance
➔ Monitoração de Hospedeiro➔ Acompanhar a disponibilidade dos hosts da
rede➔ Realizar gerência proativa na ocorrência de
uma falha➔ Monitoração de Tráfego
➔ A rede pode ser otimizada➔ Gargalos resolvidos➔ Novas contratações podem ser iniciadas antes
da exaustão do recurso
OBJETIVOS
➔ Detecção de Mudanças rápidas em tablas de roteamento
➔ Quando muito frequentes, podem indicar instabilidade em um roteador mal configurado ou intermitência em links de comunicação
➔ Monitoração de SLA's (Service level Agreement)
➔ Seja garantido o nível de serviço contratado➔ Alguns indicadores: Disponibilidade, latência,
throughput, notificação de eventos/atividades planejadas
➔ É necessário que seja especificado no contrato
OBJETIVOS
➔ Detecção de Intrusos➔ Filtragem de tráfego➔ Notificação de eventos suspeitos
➔ Aumento de consumo de banda repentino➔ Aumento de pacotes TCP SYN direcionados
a um único hospedeiro➔ Conexões a portas de acesso remoto➔ Autenticações inválidas
Modelo de Gerenciamento de redes da ISO
A ISO (International Organization for Standarization) criou um modelo de gereciamento de rede mais estruturado, baseado em 5 áreas de gerenciamento:
➔ Gerencimaneto de Desempenho
➔ Gerenciamento de Falhas
➔ Gerenciamento de Configurações
➔ Gerenciamento de Contabilização
➔ Gerenciamento de Segurança
Gerenciamento de Desempenho
➔ Quantificar, medir, analisar, informar, analisar e controlar o desempenho de diferentes componentes/recursos de rede
➔ Sejam ativos de rede, links, servidores ou ainda hosts
➔ SNMP desempenha um papel fundamental neste gerenciamento
➔ Controlar as variáveis da rede para atingir o nível de desempenho especificado:
➔ Capacidade de Utilização e Quantidade de Tráfego;
➔ Vazão dos Dados e Tempo de Resposta.➔ Definição de indicadores de rede
Gerenciamento de Desempenho
Gerenciamento de Desempenho
➔ Utilizado no planejamento da rede:
➔ Dimensionamento➔ Identificação de gargalos➔ Resolução de problemas de performance➔ Relocação de recursos➔ Ampliações programadas
Gerenciamento de DesempenhoExemplos:
➔ Utilização de CPU dos servidores é considerada OK até 60%, entre 61-85% deve-se iniciar processo de upgrade, acima de 86% é considerado crítico
➔ Ocupação dos links da rede devem ser observados, ao chegar a 70%, deve-se solicitar ampliação, se links forem redundantes/load balance, um link não deve ultrapassar 40% de sua capacidade, pois em situação de falha, receberá a carga do outro link.
Gerenciamento de Falhas
➔ Registrar, detectar e reagir a condições de falha da rede
➔ Gerenciamento de falha é o tratamento imediato, já o gerenciamento de desempenho é a longo prazo
➔ Requer constante observação do funcionamento dos dispositivos de forma que se possa identificar rapidamente o problema e resolvê-lo
➔ Gerência proativa de falhas➔ Determinar e isolar o ponto de falha;➔ Reconfigurar a rede para diminuir impacto da
falha;➔ Reparar a falha e voltar à situação normal de
funcionamento
Gerenciamento de Falhas
➔ Registrar, detectar e reagir a condições de falha da rede
➔ Gerenciamento de falha é o tratamento imediato, já o gerenciamento de desempenho é a longo prazo
Gerenciamento de Falhas
Exemplos de eventos a serem monitorados
➔ Interfaces de rede down➔ Serviços parados em servidores➔ Links de comunicação fora➔ Taxa de erro em links de comunicação➔ Ocupação de disco acima de um dado
threshold
Gerenciamento de Falhas
Meios para atingir estes objetivos
➔ Utilizar ferramentas e funções de gerenciamento rápidas e confiáveis;
➔ Utilizar redundância de rotas e equipamentos para minimizar o impacto das falhas;
➔ Utilizar uma estratégia de gerenciamento de falhas redundante.
Gerenciamento de Configuração
➔ Permite ao administrador saber quais dispositivos fazem parte da rede administrada
➔ Lidam com a instalação, inicialização, partida, modificação e registro de parâmetros de configuração ou opções de hardware e software de rede.
➔ manter um inventário atualizado e produzir relatórios baseados nesse inventário.
➔ Reconfigurar a rede em função do desempenho, expansão ou recuperação de falhas;
➔ RFC-3139 oferece uma visão geral de gerenciamento de requisitos e de configurações
Gerenciamento de ConfiguraçãoRFC 3139 - Requirements for Configuration Management of IP-based Networks
➔ Policy Based Management: define um serviço específico em todos os devices da rede, incluindo comandos para múltiplos vendors.
➔ SNMP não é aplicado a este nível de gerência➔ A rede deve ser especificada de forma abstrata em uma
uma network-wide configuration➔ Existência de tradutores da política network-wide
configuration para configurações específicas de cada vendor/device
Gerenciamento de Contabilização
➔ Permite ao administrador da rede que especifique, registre e controle o acesso de usuários e dispositivos a recursos da rede.
➔ Monitoração de quanto dos recursos estão sendo utilizados por usuários ou grupos de usuários
➔ Quotas de utilização ➔ Limitação de uso dos recursos por usuários ou
grupos de usuários
➔ Cobrança por utilização
➔ Alocação de acesso privilegiado a recursos
Gerenciamento de Segurança
➔ Controlar o acesso aos recursos da rede de acordo com alguma política definida. Controla o acesso aos recursos da rede através do uso de técnicas de autenticação e políticas de autorização.
➔ Geração, distribuição e armazenamento de chaves criptográficas e de senhas;
➔ Registro dos logs de Segurança
➔ Proteção dos recursos da rede e das informações dos usuários
Exemplo de Soluções
FUNCIONALIDADE APLICAÇÃO FABRICANTE
Gerência de desempenho Netclarity Lanquest
Gerência de faltas Spectrum's alarm managers
Aprisma
Manipulação de alarmes Trap exploder Empire technologies
Gerência de segurança Boks Securix
Gerência de bens Assetview Hp
Configuração Netbuilder 3com
Configuração Cisco works Cisco
Exemplo de Soluções
Detecção de problemas com conectividade:
➔ Traceroute➔ Ping➔ Route➔ Netstat➔ Ifconfig(linux) / ipconfig(windows)➔ Iperf (linux)➔ Iftop (linux)➔ MTR
Rede sem Gerência
Principais problemas de redes sem gerência
➔ Congestionamento➔ Má utilização de recursos➔ Recursos sobrecarregados➔ Problemas com segurança➔ Indisponibilidade➔ Outros ?
Tipos de GerênciaGerência Reativa
➔ Administrador da rede limita-se a reagir aos problemas que surgem
➔ Se utiliza de padrões e ferramentas de gerência para ser alertado de um problema
Tipos de GerênciaGerência Pró-ativa➔ Administrador da Rede procura, rotineiramente,
por informações que possam revelar com antecedência a possibilidade de um problema na rede
➔ Concentra esforços nos estudos dos avisos (warnings), que são registros da ocorrência de uma situação anormal, porém não crítica
➔ Utiliza históricos, estatísticas e o monitoramento frequente dos eventos relevantes da rede
➔ Mais difícil de ser efetuada que a reativa. Entretanto, resulta em tempos menores de parada e economia geral de operação da rede
Métricas
➔ Disponibilidade
➔ MTTR
➔ Tempo de Resposta
➔ Taxa de Erros
➔ Latência
➔ Vazão (Throughput)
➔ Utilização
MétricasDisponibilidade
“Um sistema de alta disponibilidade é um sistema informático resistente a falhas de software e energia, cujo objectivo é manter os serviços disponibilizados o máximo de tempo possível.”
(Fonte: Wikipedia)
MétricasDisponibilidade
Níveis de Alta Disponibilidade
Quanto maior a disponibilidade, maior a redundância e custo das soluções: tudo depende do tipo de serviço que se pretende disponibilizar
Quanto maior a disponibilidade, maior a redundância e custo das soluções: tudo depende do tipo de serviço que se pretende disponibilizar
MétricasDisponibilidade
Cálculo da Disponibilidade
MétricasMTTR
É o espaço de tempo (médio) que decorre entre a ocorrência da falha e a total recuperação do sistema ao seu estado operacional.
(Fonte: Wikipedia)
MétricasTempo de Resposta➔ Tempo decorrido entre a requisição de uma ação
ao sistema e a resposta completa à sua requisição
➔ Medição Complexa➔ Depende de diversas variáveis e suas interações
MétricasTaxa de Erro
➔ Relaciona a quantidade de pacotes, recebidos ou enviados por uma interface de rede, cujo conteúdo (em bits) apresenta erro em relação ao total de pacotes nessa mesma interface.
➔ Normalmente, essa taxa é medida em valores percentuais dentro do período de monitoramento.
➔ É de difícil detecção e pode ser a causadora de muitos problemas que serão detectados posteriormente
MétricasLatência
➔ Tempo que um pacote leva para ir de um ponto a outro da rede
➔ Normalmente medido em milisegundos➔ Quanto menor a latência, melhor o tempo de
resposta da rede
round-trip delay time
MétricasVazão (Throughput)
Throughput (ou taxa de transferência) é a quantidade de dados transferidos de um lugar a outro, tem como unidades básicas de medidas o Kbps, o Mbps e o Gbps. O throughput pode ser traduzido como a taxa de transferência efetiva de um sistema. A taxa de transferência efetiva de um determinado sistema (uma rede de roteadores por exemplo) pode ser menor que a taxa de entrada devido às perdas e atrasos no sistema.
(Fonte: Wikipedia)
Throughput é diferente da largura de banda nominal.
Throughput é diferente da largura de banda nominal.
MétricasUtilização➔ É a quantidade em uso de um determinado
recurso (porcentagem), em relação à sua capacidade total de atendimento
➔ Auxilia na avaliação e detecção de gargalos, uma vez que influenciam diretamente no tempo de resposta da rede e das aplicações envolvidas
➔ Monitorando-se a utilização, ao longo de um determinado período de tempo, é possível observar os intervalos de pico na utilização de um serviço ou recurso
➔ Exemplos: memória disponível, leitura/escrita em disco, processador (CPU), largura de banda da rede.