palestra zabbix no 12 geinfo (2013)

Post on 12-May-2015

5.521 Views

Category:

Technology

0 Downloads

Preview:

Click to see full reader

DESCRIPTION

Palestra de Zabbix no 12 Geinfo: Encontro de usuários de TI da USP e Unicamp, foi excelente...

TRANSCRIPT

Infraestrutura

Monitoramento da Rede

ServiçosServiços

Negócio

Você escolhe!

André (Luis Boni) Déo

Administrador de Redes no Gabinete do Reitor - Unicamp

Profissional Certificado Zabbix: Zabbix Cerified Specialist e Zabbix for Large Environments, Fundador da Comunidade Zabbix Brasil, Palestrante na Zabbix Conference 2013, Membro da Comissão Organizadora da Trilha Zabbix no Latinoware 2013.

Professor Universitário (Instituição Privada), Apaixonado por Gerencia de Redes, Membro da Comunidade OpenSource.

Mini Bio

• Monitorar problemas de forma automatizada

• Receber aviso de problema antes da ligação do usuário (ou do diretor!)

• Servidores inativos são muito caros (Impactos Diretos e Indiretos)

• Planejamento de investimentos em recursos de hardware

• Avaliação de qualidade de serviços

• Um bom sistema de gerenciamento nos torna confiantes, nosso negócio está funcionando!

Por que utilizar um NMS?

Um software Livre (e de código fonte aberto – True Open Source) com sistema de monitoramento distribuído capaz de monitorar a disponibilidade e performance de toda sua infra-estrutura de rede, além de aplicações;

Suporte a maioria dos sistemas operacionais: Linux, Solaris, HP-UX, AIX, FreeBSD, OpenBSD, NetBSD, Mac OS, Windows, entre outros;

Monitora serviços simples sem o uso de agentes:• icmpping – Verifica se o host está acessivel através do ping;• http – Verifica se a porta http (80) está respondendo;• pop – Verifica se a porta pop3 (110) está respondendo;• ftp_perf – Tempo de resposta (em ms) do serviço de FTP;

O que é o Zabbix?

Toda a lógica está do lado do servidor, os agentes são usados apenas para coleta de dados

Extremamente flexível! Triggers, Escalabilidade, Novas checagens, Telas e muito mais.

Projetado para lidar com as comunicações instáveis

Suporte total ao IPv6

Por que escolher o Zabbix?

Criado por Alexei Vladishev

Linha do tempo:1998 : Escolhas disponíveis HP OpenView, IBM, BMC: muito caros para comprar e manter

Que nome eu dou para este software?ABCDE…Zabbix!

2001 : versão 1.0alpha1 em GPL

2004 : versão 1.0

2006 : versão 1.1

História

2007 : versão 1.4

2008 : versão 1.6Zabbix 1.6.4, 500 downloads por dia, 15.000 usuários no fórum

História

Dois livros sobre a ferramenta: Um em Inglês e outro em Japonês.

História

A Compania foi estabelecida há 7 anos, o time não para de crescer

Clientes com mais de 200.000 dispositivos monitorados

4 Premium Partners (Japão, Espanha, Áustria, Brasil)

Mais de 50 Parceiros e Revendedores ao redor do mundo

ZABBIX SIA Hoje

ZABBIX SIA Hoje

Como é a receita da empresa?

Suporte ComercialDesenvolvimento PatrocinadoImplementaçõesConsultoriaTreinamento0% Licenças

Versão atual: 2.0.9 - 2.2 no forno!

Excelente Manual

Suporte do Fórum

Suporte Comercial (ZABBIX SIA - sales@zabbix.com)

Suporte Comercial no Brasil pela Unirede: http://www.zabbix.com.br

Suporte Comercial no Brasil pela Alerta Security: www.alertasecurity.com.br

Características

Envio de alertas para: E-mail, Jabber, SMS e Scripts personalizados (Agenda do Google, Gtalk, Acender Luzes, Painéis de Led, etc)

Suporte nativo ao protocolo SNMP (Todas as versões)

Interface de gerenciamento Web, de fácil utilização

Integração com banco de dados (MySQL/MariaDB, Oracle, PostgreSQL, IBM DB2 ou SQLite)

Geração de gráficos em tempo real

Características

Fácil instalação e customização

Agentes disponíveis para diversas plataformas:Linux, Solaris, HP-UX, AIX, FreeBSD, OpenBSD, SCO-OpenServer, Mac OS, Windows;

Agentes para plataformas 32 bits e 64 bits;

Integração com os Contadores de Performance do Windows:Windows 7: Mais de 15.000 itens !!

Windows Server 2008 R2 mais de 23.000 itens !!

Características

ZABBIX GUI

ZABBIX Server

ZABBIX Proxy

ZABBIX DB

DATABASE Proxy

JAVA Proxy

Componentes

Verificações de serviço:FTP, SSH, HTTP, SMTP, DNS ...

Agente Zabbix:Checagem Аtiva e PassivaJMXMonitoramento de registros, logs de eventosFácil de personalizarExecução de comando remotoExtremamente eficiente!

Outros:Plugins WMI, Nagios

Como Monitorar

SNMP v1, v2, v3:Dispositivos de redeNormalmente NET-SNMP para servidoresMonitoramento de aplicações (Oracle, Weblogic, Websphere, PostgreSQL, MySQL, Active Directory, Bind, ...)Traps SNMP

IPMI:Monitoramento de hardwareGerenciamento remoto (reboot, reset, desligamento)

Como Monitorar

Checagens Ativas:Altamente eficienteBuffer de dados coletados

Uso do Agente

Checagens Passivas:Requer polling do lado do Servidor ZabbixDesempenho adicional por causa dos pollings e da largura de banda de rede

Uso do Agente

CPU load is too high: {host:cpuload.last(0)}>5A trigger será verdadeira toda vez que a leitura mais recente da carga do processador for maior que 5.

CPU load is too high: {host:cpuload.min(300)}>2 | {host:cpuuser.min(300)}>50A trigger será verdadeira se a carga do processador for maior que 2 nos últimos cinco minutos OU a carga do processador com processos de usuário for maior que 50 nos últimos cinco minutos.

CPU load is too high: {host:cpuload.min(300)}>2 & {host2:backup.last(0)}=0A trigger será verdadeira se a carga do processador for maior que 2 nos últimos cinco minutos E a leitura mais recente do status do backup do host2 for 0. Pode ser definido o que 0, 1, 2 ... N significam.

Triggers... Hummmm....

Elas são usadas para:Evitar notificações;Definir dependências entre diferentes problemas (relacionados a redes, aplicações, qualquer coisa). Inclusive sem dependências de host!

Server está down => Switch1 está down => Switch2 está down

Servidor Web está down => MySQL não está respondendo => Sem espaço livre no /tmp

Dependências

Reação para Falha de um Servidor Web:

Aumente a etapa a cada 5 minutos• Etapa 1-3: Enviar mensagem para os Unix Admins• Etapa 3-5: Enviar mensagem para Chefe, se não ACK• Passo 6: Reinicie o Apache, se não ACK• Passo 7: Reiniciar o servidor se não ACK• Passo 10: Enviar mensagem a todos os não ACK

Escalabilidade

Recursos Prediletos:• Mapas• Gráficos• Telas

Exibição dos itens principais:• Problemas por grupos de hosts• Estatísticas do Zabbix• Lista dos últimos alertas• Informações do Web Monitoring• Auto Discovery

Visualização: Dashboard

Visualização: Dashboard

Acesso Imediato:• Qualquer período de tempo• Navegação de linha do tempo fácil• Zoom a um clique do mouse• Problemas são visualizados• Marcação de tempo de down-time

Tipos de Gráficos:• Standard (Pontos, Linhas, Cores)• Empilhado (Stacked)• Torta

Visualização: Gráficos

Visualização: Gráficos

Diferentes Blocos:• Gráficos• Mapas• Dados em texto plano• Lista de problemas• Lista dos últimos alertas

Slide Show:• Conjunto de telas• Exibidas uma após a outra

Visualização: Telas

Visualização: Telas

Objetivos:• Acompanhamento da experiência do usuário• Suporte a cenários complexos• Monitoramento de desempenho• Monitoramento de disponibilidade

Exemplo:Passo 1 – Acesso a home pagePasso 2 – Login (POST, GET)Passo3 – Executar relatórioPasso 4 - Logout

Monitoramento Web

Monitoramento Web

Objetivos:• Monitoramento de nível de negócio• Monitoramento SLA• Escalonamento de problemas• Causa raíz do problema

Estrutura de árvore baseada em:• Dependências• Localização Física• Tipo de serviço, etc

Serviços de TI

Serviços de TI

Autenticação:• Standard: Banco de dados do Zabbix• LDAP (Active Directory/ OpenLDAP, etc)• Apache (Kerberos, Unix, etc)

Permissões:• Depende do tipo de usuário• Nível de permissão por grupos

E ainda:• Notificações apenas para grupos de usuários

Gerenciamento de Usuários

Visão Gerencial

Visão Gerencial

EstratégicoEstratégico

TáticoTático

OperacionalOperacional

• Disponibilidade da rede• Disponibilidade de Servidores• Uso de CPU / Disco / Memória• Serviços de SO

• Disponibilidade de aplicações• Fluxos e integrações de dados• Redundância / Balanceamento• Processos e Transações

• Serviços ao usuário• Metas de disponibilidade• Metas de desempenho• Saúde do Ambiente

Visão Gerencial

Visão Tática

Visão Operacional

Visão Estratégica

Backbone

Operacional:● Rede● Equipamentos● Link

Tático:● Redundância dos Equipamentos● Redundância dos Links

Estratégico:● Acesso à recursos (CAPES, FAPESP, Processamento de Alto Desempenho, etc)● Acesso às bases de pesquisa (IEEE, ABNT, ISO, etc)● Disponibilidade de Artigos e Pesquisas

Visão Gerencial

Vestibular

Operacional:• Rede• Servidores

Tático:• Página• Sistema Inscrições• Sistema de Pagamentos

Estratégico:• Inscrição no Vestibular• Pagamento de Taxas• Pedidos de Isenções

Visão Gerencial

Novas checagens no agente:UserParameter=mysql.qps,mysqladmin –uroot status|cut –f9 –d”:”UserParameter=sum[*],echo “$1+$2”|bc

Exemplos: mysql.qps = 456, sum[4,5] = 9

Novo método de notificação:Apenas uma questão de escrever um Shell Script (geração de voz, chamada Skype, qualquer coisa)

Novas checagens no servidor:Apenas uma questão de escrever um Shell Script

Estendendo o Zabbix

Uso de Itens Calculados:Mailbox Exchangelast("service_state[\"IISADMIN\"]")+last("service_state[\"MSExchangeADTopology\"]")+last("service_state[\"MSExchangeIS\"]")+last("service_state[\"MSExchangeMailboxAssistants\"]")+last("service_state[\"MSExchangeMailSubmission\"]")+last("service_state[\"MSExchangeRepl\"]")+last("service_state[\"MSExchangeRPC\"]")+last("service_state[\"MSExchangeSA\"]")+last("service_state[\"MSExchangeSearch\"]")+last("service_state[\"MSExchangeServiceHost\"]")+last("service_state[\"MSExchangeThrottling\"]")+last("service_state[\"MSExchangeTransportLogSearch\"]")+last("service_state[\"W3Svc\"]")+last("service_state[\"WinRM\"]")

{Morpheus:service_state_Mailbox_Server_Role.last(0)}#0

Estendendo o Zabbix

Uso da API Zabbix (https://www.zabbix.com/documentation/2.0/api) + Ferramentas de Geração de Gráficos (www.maani.us/xml_charts):

Estendendo o Zabbix

Zabbix Extras – Adail Spinolahttp://spinola.net.br/blog/

Zabbix-Cat => Relatório de Análise de capacidade.Zabbix-SC => Relatório de custo de armazenamento do histórico dos itens.Zabbix-NS => Relatório de itens não suportados.Zabbix-IN => Correlacionador de eventos.

Estendendo o Zabbix

Geolocalização em Zabbix – Aristóteles Araújo / Leandro Alves Machadohttp://www.aristoteles.eti.br/zabbix/implementando-geolocalizacao-no-zabbix

Estendendo o Zabbix

Estendendo o Zabbix

Estendendo o Zabbix

Estendendo o Zabbix

Implementação de Árvore de serviços, utilizando HTML 5 2D – SERPRO

https://github.com/rodrigofns

Estendendo o Zabbix

WeatherMap: Mapa do backbone com porcentagem de usohttps://wiki.minet.net/wiki/monitoring/weathermap

Estendendo o Zabbix

Design Atualizado

Melhor usabilidade do Zabbix Front-end

Revisão de todas os Forms e Páginas

Zabbix 2.0

Descoberta de baixo nível (LLD – Low Level Discovery)

Descoberta automática de dispositivos de rede, sistemas de arquivos, processos, etc.

Descoberta de interfaces SNMP e contadores JMX

Um template para hosts com recursos diferentes!

Zabbix 2.0

Múltiplas interfaces de rede

Dispositivo monitorado suporta múltiplos Ips:

Um IP: monitoramento por SNMP

Noutro: Agente Zabbix

Noutro: Agente JMX

Noutro: Agente IPMI

Zabbix 2.0

Monitoramento remoto JMX

Suporte nativo de monitoramento JMX seguro

Descoberta de contadores JMX

Monitoramento de infra-estrutura Java: JBoss, WebLogic, Websphere, Tomcat

Monitoramento de Aplicações Java

Zabbix 2.0

Coleta automática de dados de inventário de hardware

Dados coletados automaticamente

Zabbix 2.0

Comandos remotos

Comandos remotos baseados em Telnet e SSH

Simplifica ações automáticas em dispositivos de rede

Comandos remotos baseados em IPMI (shutdown remoto, reboots)

Para dispositivos que não possuem Agente Zabbix ou Agente SNMP

Zabbix 2.0

O Futuro

Armazenamentos NãoSQLZabbix Suporta: MySQL, PostgreSQL, Oracle, DB2, SQLite

Problema:Máximo de 15.000 valores por segundo

Não é possível escalar!

O desempenho cai significativamente quando o tamanho de dados históricos aumentam

Zabbix 2.X

Solução:Uso de amazenamento NãoSQL para dados históricos (Cassandra, Hadoop, HBase, Hypertable, MongoDB, CouchDB, Neo4J). Terabytes de dados.

Teoricamente, o desempenho pode ser superior a 100.000 valores por segundo

Pode ser escalado horizontalmente. Mais servidores – mais performance!

API para os dados históricos, você poderá escolher qualquer engine!

Zabbix 2.X

Zabbix na nuvem

Integração com APIs de nuvens:Amazon EC2Rackspace CloudVMWare

Monitoramento

Gestão (adicionar ou remover recursos sob demanda):Carga de CPU alta => Adicionar um servidor novo na nuvemFalta de armazenamento em disco => Adicionar um novo storage em nuvem

Zabbix 2.X

Monitoramento de VMs, já disponível na versão 2.2 (beta)

Zabbix 2.X

Vms descobertas pelo LLD

http://andredeo.blogspot.com.br/2013/10/monitoramento-de-vms-com-zabbix-22.html

Agendador Global de tarefas

“Nós já temos tudo para tornar isso possível” - Alexei Vladishev

Tipo de calendário global para todo ambiente monitorado

Pode ser usado para:Agendar backups e outras tarefas periódicas

Iniciar / desligar servidores físicos e virtuais, recursos na nuvem

Execução condicional de comandos, dependendo dos problemas existentes. Exemplo: Desligue os nós do cluster à noite, apenas se a carga da CPU estiver baixa.

Zabbix 2.X

Comunidade Brasileira

Fundada em junho de 2008 por André Déo937 membros

Site:http://zabbixbrasil.org

Twitter:http://twitter.com/zabbixbr

Wiki:http://zabbixbrasil.org/wiki

Lista de discussão:http://br.groups.yahoo.com/group/zabbix-brasil/

Planet:http://planet.zabbixbrasil.org

Zabbix 2.X

Site do Zabbix:http://www.zabbix.com

Licença Zabbix:http://www.zabbix.com/licence.php

Manual do Zabbix:http://www.zabbix.com/documentation.php

Lista da Comunidade Brasileira:http://br.groups.yahoo.com/group/zabbix-brasil

Referências

Apresentações:Alexei Vladishev, Fundador do Zabbix – Open Source Data Center Conference 2009http://www.netways.de/osdc/y2009/programm/v/open_source_enterprise_monitoring_with_zabbix

Alexei Vladishev, Fundador do Zabbix – Free Software that helps, FISL 12, 2011.http://www.slideshare.net/zabbixbr/fisl12-2011

Luciano Alves, Unirede Soluções Corporativas – Monitoramento em Camadas Latinoware 2013.

Referências

E-mail Profissional:deo@reitoria.unicamp.br

E-mail Pessoal:andredeo@gmail.com

Blog:http://andredeo.blogspot.com

Twitter:@deoandre

Contatos

Dúvidas ?

top related