infraestrutura

162
INFRAESTRUTURA Capítulo 5 Crovella, M, Krishnamurthy, B. Internet Measurement: infrastructure, traffic & applications. John Wiley & Sons, 2006. 1

Upload: wan

Post on 07-Feb-2016

18 views

Category:

Documents


0 download

DESCRIPTION

Infraestrutura. Capítulo 5 Crovella, M, Krishnamurthy, B. Internet Measurement: infrastructure, traffic & applications. John Wiley & Sons, 2006. Roteiro. Propriedades Desafios Ferramentas Estado da Arte. Propriedades. Propriedades. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Infraestrutura

1

INFRAESTRUTURACapítulo 5Crovella, M, Krishnamurthy, B. Internet Measurement: infrastructure, traffic & applications. John Wiley & Sons, 2006.

Page 2: Infraestrutura

2

Roteiro Propriedades Desafios Ferramentas Estado da Arte

Page 3: Infraestrutura

3 Propriedades

Page 4: Infraestrutura

4

Propriedades Nesta seção são revistas as

propriedades importantes da infraestrutura da Internet.

Nossa abordagem será “bottom-up”: Propriedades físicas dos componentes Topologia (interconexão dos componentes) Caminhos na Internet (rotas) Interação do tráfego com a infraestrutura

física

Page 5: Infraestrutura

5

Links Visto da camada IP, o progresso de um pacote através da rede

consiste da passagem de nó para nó por uma sequência de etapas. Cada etapa pode ser considerada um link. Um link pode ser:

Um meio de transmissão ponto a ponto Sequência de conexões comutadas abaixo da camada IP Meio de difusão

Propriedades de interesse: Atraso de propagação Capacidade

Propriedades de desempenho: Atraso dos pacotes Perda de pacotes Jitter (variação do atraso)

Page 6: Infraestrutura

6

Roteadores Roteadores movem pacotes de um link

de entrada para um link de saída.

Page 7: Infraestrutura

7

Roteadores Organização interna do motor de

encaminhamento:

Estratégias para os buffers de saída: Disciplina de serviço drop-tail Gerenciamento ativo de filas

Page 8: Infraestrutura

8

Roteadores Muitas técnicas de medição de rede

dependem da obtenção de respostas dos roteadores.

Os detalhes da arquitetura interna podem afetar o tempo gasto para a geração de respostas.

Em particular, o tempo necessário para um roteador responder a uma mensagem de um protocolo como um pacote ICMP pode ser substancialmente diferente do tempo que ele leva para repassar um pacote.

Page 9: Infraestrutura

9

Roteadores Propriedades que temos interesse de

medir: Ponto de vista estático:

Endereços IP usados nas interfaces dos roteadores

Localização geográfica do roteador Tipo particular do roteador Variantes dos protocolos suportados

Ponto de vista dinâmico: Tempo necessário para responder a uma

mensagem ICMP Tempo necessário para repassar um pacote.

Page 10: Infraestrutura

10

Sem Fio As conexões sem fio normalmente são

usadas apenas como tecnologias de acesso e não fim-a-fim.

A escolha da tecnologia sem fio determina: Alcance máximo, Taxa de transferência de dados, Confiabilidade Interferência potencial Número de usuários concorrentes

Page 11: Infraestrutura

11

Tecnologias Sem Fio Família 802.x

Wi-fi Bluetooth

PAN – Personal Area Network WiMAX

Page 12: Infraestrutura

12

Medições envolvendo Comunicação Sem Fio Força do sinal Potência consumida Taxa de transferência de bits Grau de cobertura Informações relacionada com a sessão:

Duração Tempo de estabelecimento da conexão Lista das aplicações usadas Handoffs entre pontos de acesso (caso haja algum) Taxas de erros

Page 13: Infraestrutura

13

Medições Tradicionais Capacidade do link:

Em rede sem fio ela muda com o tempo devido a mobilidade do usuário, obstruções físicas, tráfego cruzado na mesma frequência, etc.

Largura de banda disponível e efetiva Identificação de links gargalo Etc.

As medições tendem a ser complicadas pela combinação de redes cabeadas e sem fio.

Page 14: Infraestrutura

14

Propriedades da Topologia A interconexão de componentes da

Internet pode ser visualizada em quatro níveis: Sistema autônomo (AS) Ponto de presença (PoP) Roteador Interface

Page 15: Infraestrutura

15

Topologia: Interconexão de ASes A interconexão de ASes forma um grafo

conhecido como grafo AS. Neste grafo os vértices são os ASes e As arestas conectam ASes que trocam

tráfego diretamente. Esta é a visão mais grosseira da

topologia da Internet.

Page 16: Infraestrutura

16

Topologia: Interconexão de PoPs Dentro de um AS, os roteadores são

frequentemente reunidos em localidades físicas identificáveis, chamadas de pontos de presença (PoPs).

Um PoP consiste de um ou mais roteadores num único local.

Um grafo neste nível (PoP) é normalmente a visão mais detalhada que um ISP disponibiliza publicamente.

Page 17: Infraestrutura

17

Topologia: Grafo de roteadores Neste grafo:

Os vértices são roteadores, e As arestas são conexões de uma etapa entre

roteadores. É importante distinguir entre uma conexão em uma

etapa de um link físico ponto a ponto. Pode-se associar a cada aresta (link) o seu atraso

de propagação e capacidade. E os vértices podem ser rotulados com sua

localização física e AS proprietário. Pode ser útil rotulá-los também com a identificação do PoP correspondente.

Page 18: Infraestrutura

18

Topologia: Grafo de interfaces Fornece a visão mais detalhada. Neste grafo:

Vértices são interfaces de roteadores e Arestas são conexões de uma etapa.

Este grafo é importante por ser diretamente medido pela ferramenta traceroute

Um grafo de roteador pode ser obtido do grafo de interfaces agrupando os vértices de interfaces associados a cada roteador.

Page 19: Infraestrutura

19

Interação do Tráfego com a Rede Certos aspectos da estrutura da rede

restringem as propriedades de tráfego: Menor atraso possível Vazão máxima possível

Page 20: Infraestrutura

20

Atraso de Pacotes O atraso experimentado por um pacote ao

passar pela rede corresponde à soma da contribuição de diversos fenômenos: Atraso de Roteamento

Atraso de processamento do pacote Atraso de enfileiramento Outros atrasos

Atraso de Transmissão onde é o tamanho do pacote e é a capacidade do link

Atraso de Propagação onde é a distância física e é a velocidade de

propagação

Page 21: Infraestrutura

21

Atraso de Pacotes O atraso de pacotes é uma métrica aditiva. Cada um dos fenômenos listados

anteriormente potencialmente ocorrem em cada etapa ao longo de um caminho.

Os atrasos por etapa são aditivos ao longo de um caminho.

Dado um conjunto de atrasos por etapa e uma matriz de roteamento , podemos expressar o conjunto de atrasos por caminho como sendo = .

Page 22: Infraestrutura

22

Perda de Pacotes Causas:

Descarte explícito por um elemento de rede, ou Descarte por erro de transmissão identificado pela verificação de

erros. A fonte mais significativa de perda de pacotes é o

congestionamento. A perda explícita de pacotes poderia ser caracterizada como

um processo de chegada de eventos de descarte. No entanto, normalmente é difícil obter informações sobre os instantes das perdas.

Portanto, as perdas são normalmente caracterizadas como uma série temporal de contagens. E a quantidade de perdas por unidade de tempo podem ser interpretadas como estimativas das taxas de perdas de pacotes.

Page 23: Infraestrutura

23

Perda de Pacotes A medida mais comum é a taxa relativa de perda de

pacotes: fração de pacotes perdidos durante um certo intervalo de tempo: / onde é o número de pacotes que entraram no elemento

de rede no período de tempo e é o número de pacotes perdidos neste mesmo intervalo de tempo.

A perda relativa de pacotes ao longo de um caminho (assumindo independência das perdas) é dada por:

Que pode ser convertida para uma relação linear usando logaritmos: Seja Então

Page 24: Infraestrutura

24

Vazão (Throughput) Taxa na qual o tráfego pode fluir através da rede. Limitada pelos limites de capacidade dos elementos

de rede e pelo congestionamento. Considerando um intervalo de tempo grande o

suficiente em relação ao tempo necessário para atravessar um caminho da rede, então a vazão do caminho durante o período pode ser estimado como , onde corresponde ao número de pacotes que atravessam o caminho sem perdas.

O recíproco da vazão é o é o intervalo de tempo médio entre chegadas de pacotes durante o intervalo .

Page 25: Infraestrutura

25

Vazão A vazão pode ser expressa também em bytes por

unidade de tempo: A vazão através de uma sequência de etapas é

determinada pelo elemento com a menor capacidade disponível.

O gargalo pode ser um sistema final ou um dos elementos internos à rede.

Limitando a restrição aos elementos internos, a vazão em um conjunto de caminhos é determinada pela capacidade por etapa por , onde a multiplicação da matriz é efetuada usando a álgebra

Page 26: Infraestrutura

26

Jitter de Pacotes É uma medida da suavidade do processo de

chegada de pacotes e pode ser expresso como a variabilidade do intervalo de tempo entre chegada de pacotes.

O jitter pode ocorrer devido à variação no tempo dos atrasos das filas nos roteadores ao longo do caminho.

Chegada de pacotes com baixo jitter são mais previsíveis e leva a um desempenho na camada de aplicação mais confiável.

Page 27: Infraestrutura

27

Jitter A caracterização do jitter requer

medições dos intervalos entre chegadas. Uma caracterização completa é dada

pelo processo entre chegadas Medidas mais econômicas e mais usadas

são os momentos da distribuição , a variância dos intervalos entre chegadas, por exemplo.

Page 28: Infraestrutura

28

Conexões Podem ser importantes medidas de taxa de perda

de pacotes, atraso de pacotes e vazão para conexões individuais, por exemplo para o TCP.

Como a taxa média de pacotes do TCP depende do tamanho da sua janela e do tempo de ida e volta (RTT), medidas de RTT de uma conexão pode ser muito valiosa.

Como há retransmissões, nem todos os bytes recebidos são repassados para a aplicação.

Chamamos de goodput à taxa na qual a aplicação recebe dados com sucesso.

Page 29: Infraestrutura

29 Desafios

Page 30: Infraestrutura

30

Desafios Simplicidade do Núcleo Camadas Escondidas Pedaços Escondidos Barreiras Administrativas

Page 31: Infraestrutura

31

Simplicidade do Núcleo Os elementos de comutação da Internet são projetados

para ser “sem estados” em relação às conexões e fluxos que passam por eles.

Este princípio de projeto permitiu aos roteadores Internet ser muito simples.

Qualquer forma de instrumentação, mesmo simples contadores por pacote ou por byte, adicionam custo e complexidade ao projeto.

Isto prejudica a observabilidade em muitos pontos da rede. Medições de atraso e perda de pacotes assim como vazão

são fornecidos apenas de forma agregada através do SNMP. Para a obtenção de medições detalhadas seria necessária uma captura de pacotes.

Page 32: Infraestrutura

32

Camadas Escondidas Abaixo da camada IP a transmissão de pacotes

pode ser implementada de formas muito diferentes. Estes detalhes estão escondidos no nível do IP. Nem

mesmo a captura de pacotes pode detectar estas diferenças.

Pacotes que passam por uma etapa do IP podem na verdade estar passando por: Um enlace sem fio com sinalização complexa e

retransmissões na camada de enlace Caminho comutado por rótulos envolvendo diversos

elementos de comutação de nível 2. Redes ópticas...

Page 33: Infraestrutura

33

Pedaços Escondidos O argumento fim-a-fim indica que certas funções

devem ser executadas apenas nos sistemas finais. No entanto, há diversos dispositivos que desviam

deste princípio: Coletivamente chamados de middleboxes: firewalls,

tradutores de endereços e proxies Razões para o uso de middleboxes:

Segurança Gerenciamento Desempenho Tradução de endereços

Page 34: Infraestrutura

34

Pedaços Escondidos Cada um destes tipos de middleboxes

impede a visibilidade de alguns componentes da rede. Firewalls bloqueiam pacotes UDP ou ICMP

usados pelo traceroute. NAT pode impedir a descoberta de sistemas

finais via ping.

Page 35: Infraestrutura

35

Barreiras Administrativas ISPs normalmente escondem os detalhes

de suas redes do público externo. Detalhes de configuração de roteadores

individuais, padrões de interconexão, e a quantidade de tráfego transportado nos links são todos considerados sensíveis à competição.

Page 36: Infraestrutura

36

Barreiras Administrativas Os ISPs bloqueiam tráfego que possa ser usado

para medir a infraestrutura: Pacotes de eco ICMP são bloqueados nos roteadores

de entrada Tentativas de estabelecer conexões SNMP são

bloqueadas. Informações fornecidas como as de topologia são

normalmente simplificadas. Portanto, pode ser difícil obter uma figura

detalhada de porções da infraestrutura da Internet simplesmente porque os ISPs procuram ativamente esconder estes detalhes.

Page 37: Infraestrutura

37 Ferramentas

Page 38: Infraestrutura

38

Ferramentas Medições Ativas:

Adicionam tráfego na rede para obter as medições desejadas

Medições Passivas: Captura de dados gerados por outros

usuários e aplicações e não pelo processo de medição

Page 39: Infraestrutura

39

Ferramentas de Medições Ativas Ping OWAMP Traceroute Medições de Largura de Banda (adiante)

Page 40: Infraestrutura

40

Ping Envia um pacote ICMP de Eco para o destino e

captura o pacote de Resposta do Eco. Útil para:

Checar a conectividade até o destino Medir o atraso de ida e volta (RTT – round trip time)

entre o transmissor e o destino. Vantagem: o destino apenas responde da sua

forma normal (não precisa estar instrumentado). Desvantagem: em caso de congestionamento,

não dá para identificar se ocorre na ida, na volta, ou em ambos.

Page 41: Infraestrutura

41

OWAMP One-Way Active Measurement Protocol Definido na RFC 4656 Necessita de relógios sincronizados ou

um método para remover o offset e skew dos relógios a partir das medições.

Elementos: Protocolo de controle Protocolo de teste Implementação de ambos os protocolos

Page 42: Infraestrutura

42

OWAMP: Resultados obtidos Métricas:

Atraso em um sentido (OWD – One Way Delay)

Pacotes perdidos em um sentido Variação do atraso em um sentido

Outros Resultados: Pacotes duplicados Reordenamento de pacotes (pacotes fora

de ordem) Número de Hops (indicação de alteração)

Page 43: Infraestrutura

43

OWAMP: Protocolo de Controle Implementado usando o TCP Utiliza a porta 861 Suporte a AA Utilizado para:

Configurar os testes Número de portas controladas no receptor (EndPoints) Agenda de envio extremamente configurável Permite alterar o tamanho dos pacotes Marcar DSCP, etc.

Inicializar a conexão, iniciar e parar os testes Receber os resultados

Possibilidade de receber resultados parciais de uma medição

Page 44: Infraestrutura

44

OWAMP: Protocolo de Teste Responsável pela execução dos testes Utiliza o UDP Utiliza portas aleatórias > 1024 para

executar os testes As sessões podem ser:

Não autenticadas (“Open”) Autenticadas, ou Criptografadas

Page 45: Infraestrutura

45

OWAMP: Arquitetura

Page 46: Infraestrutura

46

Traceroute O campo de TTL (Time To Live) do

cabeçalho do IP é decrementado de um toda vez que um pacote passa por um roteador.

Se o contador chegar a zero, o protocolo IP requer que o pacote seja descartado e seja enviada uma indicação de erro para o remetente original, através de um pacote ICMP TIME EXCEEDED. O endereço origem deste pacote é a

interface do roteador que descartou o pacote original.

Page 47: Infraestrutura

47

Traceroute Portanto, se um pacote que possui um pacote

com o TTL setado para for enviado para um determinado destino, o roteador que estiver a uma distância no caminho poderá ser identificado pelo pacote ICMP TIME EXCEEDED desde que o caminho até o destino possua mais do que etapas.

Page 48: Infraestrutura

48

Traceroute Dificuldades:

Assimetria dos caminhos de ida e de volta Caminhos instáveis e falsos enlaces

Roteador com Balanceamento de Carga Resolução de apelidos (identificação de

duas interfaces que pertencem ao mesmo roteador)

Carga da medição

Page 49: Infraestrutura

49

Assimetria dos caminhos de ida e de volta

Os nós visitados pelo traceroute são aqueles encontrados no caminho de ida (forward) da origem até o destino.

Estes não são necessariamente os mesmos nós do caminho reverso!

Page 50: Infraestrutura

50

Caminhos instáveis e falsos enlaces

Se os caminhos não forem estáveis durante o período de medição, então pacotes de teste seguirão caminhos diferentes.

Isto leva a uma inferência da existência de um caminho , ou seja um falso link entre e !

Page 51: Infraestrutura

51

Roteador com Balanceamento de Carga

Resultado: Caminhos inexistentes e falsos links.

Solução: Paris Traceroute www.paris-traceroute.net

Page 52: Infraestrutura

52

Paris Traceroute

Balanceadores de carga por fluxo usam os campos em amarelo para identificar um fluxo.

As setas vermelhas mostram os campos incrementados pelo traceroute clássico.

O Paris Traceroute usa os campos em verde para identificar os pacotes de teste.

Page 53: Infraestrutura

53

Resolução de apelidos O traceroute descobre interfaces e não

roteadores. Cada roteador possui múltiplas

interfaces. Mas, nem sempre está claro que

interfaces pertencem ao mesmo roteador.

Foram propostos diversos métodos para descobrir se duas interfaces pertencem ao mesmo roteador.

Page 54: Infraestrutura

54

Métodos para a Resolução de apelidos

Envio de pacotes de Eco ICMP para ambas as interfaces a partir do mesmo roteador. Se ambas pertencerem ao mesmo roteador,

as respostas serão enviadas a partir da mesma interface.

Casando as mensagens de Eco que possuem a mesma interface de origem pode-se inferir que os pacotes de Eco originas foram enviados do mesmo roteador.

Page 55: Infraestrutura

55

Métodos para a Resolução de apelidos Uso dos campos de identificação e TTL:

Como o campo de identificação é normalmente incrementado, dois pacotes que venham do mesmo roteador têm a tendência a ter campos com valores próximos.

Além do mais, pacotes que vierem do mesmo roteador ao chegarem a um ponto comum devem ter o mesmo valor de TTL. Portanto, se dois pacotes chegarem num ponto de

medição com valores de TTL diferentes, é uma indicação de que são originados em diferentes roteadores.

Page 56: Infraestrutura

56

Métodos para a Resolução de apelidos

Uso da opção de Registro de Rota: Os roteadores que dão suporte a esta opção

irão inserir o endereço da interface através da qual o pacote foi transmitido no cabeçalho do pacote durante o processo de encaminhamento.

Esta interface é frequentemente diferente da que aparece no pacote de resposta de Eco do ICMP.

Isto permite que as duas interfaces sejam associadas com o mesmo roteador.

Page 57: Infraestrutura

57

Métodos para a Resolução de apelidos

Adivinhação(!): Por facilidade de gerenciamento, os links

entre dois roteadores normalmente recebem endereços que diferem um do outro por apenas uma unidade: 200.0.0.1 e 200.0.0.2

Page 58: Infraestrutura

58

Carga da medição Na figura acima, o link de A a B é atravessado

três vezes. Em geral o traceroute pode impor uma carga

considerável e alguns links sobretudo para a descoberta de topologia em grande escala.

Disparando testes de uma fonte para diversas origens provoca uma carga excessiva em links próximos à origem.

Disparando testes de múltiplas fontes para o mesmo destino, tende a impor uma carga pesada nos links próximos ao destino.

Page 59: Infraestrutura

59

Carga da medição

Para otimizar o uso foram propostas algumas ideias: Rastrear as interfaces que já foram visitadas

e parar os testes quando se encontrar uma interface já visitada Assume que as rotas sejam estáveis e que haja

um único caminho de modo que formem uma árvore.

No caso de múltiplas fontes é preciso trocar informações entre as origens sobre nós anteriormente vistos.

Page 60: Infraestrutura

60

Traceroute: outros usos O traceroute pode ser usado também

para descobrir a topologia em termos de ASes.

A ideia básica é determinar a que AS pertence cada um dos roteadores ou interfaces que estão no caminho descoberto.

O mapeamento entre interfaces e ASes podem ser extraídos de registros de rotas ou a partir de tabelas BGP, mas elas devem ser usadas com cuidado.

Page 61: Infraestrutura

61

Outros Métodos Ativos Outra ferramenta útil para a medição de redes ativa é o

multicast. Dado que uma única cópia é replicada pelos roteadores ao

longo do caminho, as condições de rede experimentadas por um único pacote são refletidas nas propriedades mensuráveis das múltiplas cópias do pacote.

Pacotes enviados aproximadamente no mesmo tempo pelo mesmo caminho experimentam condições de rede semelhantes. Se dois pacotes são enviados próximos e um deles se perde, o

outro fornece informações úteis sobre as condições da rede experimentada pelo pacote perdido.

Esta mesma ideia pode ser usada para inferir o tamanho das filas em roteadores de acesso.

Page 62: Infraestrutura

62

Suporte do Sistema a Medições Ativas

Muitos métodos de medição ativa envolvem a injeção de pacotes arbitrários na rede, ou na captura de pacotes arbitrários na rede.

Acesso irrestrito às interfaces de rede levanta questões de segurança e os administradores de rede frequentemente hesitam em garantir este acesso.

Além do mais, a injeção eficiente de pacotes e a medição precisa dos instantes de partida e chegada é feito mais facilmente ao nível do kernel do SO. Por isto, foram definidos bibliotecas e interfaces de

sistema especializados para a medição ativa de redes.

Page 63: Infraestrutura

63

Medições Passivas A medição passiva consiste em capturar

tráfego que foi gerado por outros usuários e aplicações e não pelo processo de medição.

O uso mais comum da medição passiva de tráfego é entender as propriedades do próprio tráfego e, portanto, será coberto no Capítulo 6.

Nesta seção o foco é apenas em métodos passivos para a medição da infraestrutura que consiste geralmente na captura e análise do tráfego do plano de controle (roteamento).

Page 64: Infraestrutura

64

BGP Tabela de roteamento BGP provê

informação parcial sobre a topologia entre ASes.

Page 65: Infraestrutura

65

BGP Vantagens:

Grande conjunto de conexões AS-AS que se aprende apenas processando visões do BGP.

Desvantagens: Todos os caminhos formam uma estrutura

como uma árvore, com raiz no AS alvo. Mas, nenhuma conexão cruzada existente é descoberta (porque não são usadas pelo roteamento até o prefixo alvo).

Agregação de rotas e filtragem tende a esconder certas conexões entre ASes.

Page 66: Infraestrutura

66

BGP Desvantagens:

Muitos ASes (especialmente os de tier 1) possuem múltiplas conexões físicas.

Grandes ISPs fazem conexões com outros em diversas localidades por questões de eficiência e redundância. No entanto, apenas uma aresta entre os dois ASes irá aparecer no gráfico resultante.

Page 67: Infraestrutura

67

Obtenção de dados do BGP Além dos dados do routeview, é possível obter

atualizações do BGP diretamente registrando-se para recebê-las através de uma sessão com um roteador que fale BGP (vide detalhes na seção 6.3.1).

Dificuldades: Pode não ser possível obter atualizações no ponto de

interesse. A visão local obtida é necessariamente incompleta Anomalias de roteamento e ‘ruído’ podem dificultar

inferir o estado real do sistema de roteamento interdomínio.

Page 68: Infraestrutura

68

OSPF É possível obter passivamente medições de

infraestrutura dentro de um AS, capturando tráfego gerado pelo plano de controle através dos protocolos de roteamento interno (IS-IS ou OSPF).

No caso do OSPF pode-se capturar anúncios dos estados dos enlaces dentro de um domínio de roteamento. No caso do OSPF não é importante o ponto de

captura pois todas as informações são enviadas para todos através de inundação.

Page 69: Infraestrutura

69

Medições Combinadas Ao medir a infraestrutura ou descobrir

características de topologia , frequentemente é útil fundir diferentes tipos de medições, combinando medições ativas e passivas.

Uma dificuldade com medições ativas é a grande quantidade de tráfego de testes que é necessária, mesmo quando a finalidade é a de mapear um único AS. Usando dados do BGP é possível limitar os testes

apenas para os endereços que provavelmente fazem parte do AS alvo.

Page 70: Infraestrutura

70

Medições Combinadas Outro modo de melhorar os mapas de AS é

aumentar passivamente topologias obtidas através do BGP com conexões adicionais inter-AS inferidas a partir de medições ativas (traceroute).

Da mesma forma podem se usados Registros de Roteamento Internet para ampliar as topologias derivadas através do BGP.

Ao estudar a dinâmica do congestionamento, é possível correlacionar grandes conjuntos de medições de RTT com dados de topologia derivados do BGP para localizar degradações de desempenho na Internet.

Page 71: Infraestrutura

71

Medições de Largura de Banda Largura de banda ou vazão (throughput):

Quantidade de dados que pode ser transmitida por unidade de tempo.

Importância: Aplicações multimídia podem ajustar suas taxas de

transmissão Seleção do servidor com conexão adequada Estimativa do produto banda-atraso para o controle de

fluxo do TCP Redes overlay: identificação de “bons” caminhos Verificação de SLAs entre usuários e provedores de

rede

Page 72: Infraestrutura

72

Medições de Largura de Banda Geralmente é um processo ativo, no qual pacotes são

injetados na rede e o processo de medição é baseado na observação dos resultados.

Algumas vezes assume-se que: ambos os lados do caminho de medição estejam

instrumentados, enquanto que outras vezes assume-se que um dos lados esteja

instrumentado e o outro simplesmente deve responder a um pedido de eco ICMP ou algo semelhante.

Foram propostos também métodos passivos e as aplicações podem usar os seus próprios pacotes de dados como fonte de informação para a estimativa de largura de banda.

Page 73: Infraestrutura

73

Medições de Largura de Banda Link gargalo: é aquele que possui a menor

vazão durante o período de medição. Em alguns casos basta medir a largura de

banda do link gargalo. Enquanto que em outros casos deseja-se obter a largura de banda de cada um dos links.

Nos casos em que uma única etapa do IP corresponder a uma sequência de múltiplos links físicos pode ser um desafio inferir a largura de banda de cada link.

Page 74: Infraestrutura

74

Tipos de Largura de Banda Capacidade Banda disponível Capacidade de transferência em lote

(bulk)

Page 75: Infraestrutura

75

Capacidade Vazão máxima que um enlace ou

caminho pode suportar. Algumas vezes é chamada de largura de

banda ‘sem congestionamento’ A capacidade é uma propriedade de um

caminho que não muda frequentemente. Muda apenas quando a infraestrutura

subjacente (roteador e/ou velocidade dos links) muda.

Page 76: Infraestrutura

76

Banda disponível Porção da capacidade que não está em

uso durante um certo intervalo de tempo.

Também chamada de capacidade residual.

Por exemplo: Se um link possui uma capacidade de 1000

Mbps e atualmente está fluindo 600Mbps através do link, então a banda disponível é de 400Mbps.

Page 77: Infraestrutura

77

Banda Disponível A utilização média durante o período é definida

como a fração de tempo durante aquele intervalo no qual a interface está ocupada transmitindo dados.

Ou seja, se denotar a atividade instantânea do link no instante iff a interface estiver ocupada), então a utilização média do link associado é definida como

A largura de banda disponível de uma etapa com capacidade para o dado intervalo de tempo seria então:

Page 78: Infraestrutura

78

Capacidade de transferência em lotes (bulk) A banda disponível não é necessariamente o que seria

obtido por uma nova conexão fazendo uso do link ou caminho.

Muitas transferências de dados na Internet fazem uso do TCP para controle de fluxo e os algoritmos de controle do TCP interagirão com o tráfego competidor de uma maneira complexa. Por exemplo, se a banda disponível num dado caminho for de

400Mbps, uma nova conexão fluindo por aquele caminho pode fluir a 400Mbps, 500Mbps ou até 300Mbps.

Taxa que seria obtida por uma nova conexão TCP que perdure por algum tempo naquele dado caminho. Esta definição assume que a taxa da conexão está limitada

apenas pela sua janela de congestionamento e não por outros fatores.

Page 79: Infraestrutura

79

Métodos de Medição de Largura de Banda

Baseados em observar como o atraso dos pacotes são afetados pelas propriedades do enlace.

Atraso de enfileiramento Efeito depende do tamanho dos pacotes

que estão enfileirados na sua frente Base para os métodos de pares de pacotes

Atraso de transmissão Depende apenas do tamanho do próprio

pacote Base para os métodos de tamanho-atraso.

Page 80: Infraestrutura

80

Métodos de Pares de Pacotes Medição de Capacidade

Pacotes de mesmo comprimento estão sendo transmitidos da esquerda para a direita e enfileiram no link mais estreito.

A capacidade mais baixa do link estreito impõe um atraso fixo entre a borda inicial de dois pacotes sucessivos, relacionado ao comprimento fixo do pacote.

Este atraso fixo é preservado quando os pacotes deixam este link mais estreito.

Este atraso pode então ser medido e serve para inferir a largura de banda do link mais estreito.

Page 81: Infraestrutura

81

Métodos de Pares de Pacotes Para um dado par de pacotes, definimos a

diferença entre pacotes como o tempo desde que a borda inicial do primeiro pacote chega ao link e a borda inicial do segundo pacote chega ao mesmo ponto.

No caso mostrado na figura não há pacotes entremeados com os dois que formam o par de pacotes.

Neste caso, se o primeiro pacote tiver comprimento e a capacidade do link for , então: .

Page 82: Infraestrutura

82

Métodos de Pares de Pacotes Note que para que isto ocorra os pacotes de teste devem

estar enfileirados um após o outro no link mais estreito. Se a capacidade do link estreito for e o intervalo entre

pacotes na origem for , então, uma forma de tornar provável o enfileiramento no link mais estreito é enviar pacotes de teste com .

O princípio básico para estimar capacidade por este método é enviar pares de pacotes por um caminho de rede formado por links.

Então, se nenhum outro pacote estiver fluindo por nenhum dos links neste caminho, e se os pacotes de teste enfileirarem por serviço no link mais estreito, .

Page 83: Infraestrutura

83

Métodos de Pares de Pacotes Dificuldades:

É preciso garantir que os pacotes enfileirem no gargalo: a taxa de envio deve ser maior do que a capacidade do enlace gargalo

Efeito de tráfego cruzado: Pacotes individuais do par podem experimentar

diferentes atrasos de enfileiramento ao longo do caminho.

Este efeito pode ser difícil de prever. Uma variação no tráfego cruzado pode causar que um

determinado par de pacotes relatem uma estimativa de banda maior ou menor do que o valor real.

Page 84: Infraestrutura

84

Métodos de Pares de Pacotes Largura de banda disponível

Assume: Enfileiramento FIFO Fila do roteador não esvazia entre as chegadas do primeiro

e do segundo pacote de teste Assume que o enlace mais ocupado é também o mais

estreito. E que o intervalo final , que é o que pode ser medido, é o

mesmo que o intervalo estabelecido pelo link mais estreito

Page 85: Infraestrutura

85

Métodos de Pares de Pacotes Largura de banda disponível

Se estas hipóteses forem verdadeiras então a largura de banda disponível pode ser estimada como: .

Estas hipóteses impõem uma alta carga no enlace gargalo.

Page 86: Infraestrutura

86

Método de Comprimento-Atraso Na ausência de tráfego cruzado, o atraso

experimentado por um pacote que passa através de um enlace é afetado pelo comprimento do pacote e pela capacidade do enlace.

Variando o comprimento do pacote pode-se observar o efeito do atraso e inferir a capacidade do enlace.

Page 87: Infraestrutura

87

Método de Comprimento-Atraso A cada etapa, os atrasos principais experimentados por um

pacote de teste são: Atraso de enfileiramento Atraso de transmissão e Atraso de propagação.

O atraso de propagação é determinado pelo comprimento do link e a velocidade de propagação do sinal e é, portanto, independente do tamanho do pacote.

Da mesma forma, o atraso de enfileiramento é determinado pelos pacotes que estão na frente dos pacotes de teste e não é determinado pelas propriedades do pacote em si.

Apenas o atraso de transmissão é afetado pela capacidade do link e o tamanho do pacote de testes.

Page 88: Infraestrutura

88

Método de Comprimento-Atraso Portanto, se não houver tráfego cruzado, podemos

expressar o atraso de um pacote de comprimento após ter passado por etapas, como: Onde consiste nos atrasos até a etapa que não

dependem de . A última igualdade mostra que podemos capturar

todas as capacidades até a etapa i com um único termo: . O relacionamento entre e é o que pode ser medido.

Page 89: Infraestrutura

89

Método de Comprimento-Atraso A abordagem geral é enviar um certo número de pacotes

com comprimento variável , e estimar os valores de e a partir dos resultados medidos, por exemplo através de regressão linear.

Assim, a capacidade em cada etapa pode ser estimada como: , com

Implementar este método na prática requer medir o tempo de propagação dos pacotes de teste. Na ausência de instrumentação, usam-se pacotes com limites

no TTL para provocar respostas ICMP TIME EXCEEDED. Na ausência de tráfego cruzado o tempo gasto para receber

esta mensagem ICMP é capturada pelo termo dado que as respostas têm todas o mesmo tamanho.

Vantagem em Relação aos Pares de

Pacotes

Page 90: Infraestrutura

90

Problemas com o Método de Comprimento-Atraso Uma complicação considerável é a necessidade

de que os pacotes de teste passem pela rede sem enfileirar atrás de tráfego cruzado. Este problema é geralmente enfrentado enviando

muitos pacotes de teste para cada etapa que está sendo medida, e observando o menor tempo de propagação obtido para cada etapa.

Com o crescimento do comprimento do caminho, esta hipótese fica mais suspeita, dado que fica mais difícil para um pacote passar por muitas etapas sem experimentar fila em nenhuma delas.

Page 91: Infraestrutura

91

Problemas com o Método de Comprimento-Atraso Outra preocupação é que com o crescimento do

comprimento do caminho, fica mais difícil de medir a quantidade com precisão. O fato de que os pacotes possuem uma faixa

limitada de valores limita a precisão de uma estimativa de .

Com o crescimento de , as diferenças entre valores sucessivos de são cada vez menores, e pequenos erros na estimativa de se traduzem em grandes erros na estimativa de .

É, portanto, difícil usar este método para medir caminhos longos.

Page 92: Infraestrutura

92

Problemas com o Método de Comprimento-Atraso

Este método assume que o comprimento do pacote não varia ao atravessar um caminho. Isto nem sempre é verdade: os cabeçalhos

de camada 2 podem comprimentos diferentes em etapas distintas.

A extensão da imprecisão introduzida depende do tamanho do pacote: os erros serão maiores para pacotes menores.

Page 93: Infraestrutura

93

Combinação dos Métodos “Pares de Pacotes” e “Comprimento-Atraso” Uma ideia é enviar pares de pacotes de

comprimentos variáveis. Quando um par de pacotes consiste em um pacote

grande seguido por um ou mais pacotes pequenos, é mais provável que o pacote maior enfileire em um dado link.

Se o pacote maior tiver um TTL limitado ele será descartado no link a ser medido, enquanto que o demais pacotes prosseguirão até o destino levando informação sobre o atraso experimentado pelo pacote maior até o link em que foi descartado.

Page 94: Infraestrutura

94

Congestionamento autoinduzido Objetivo: Encontrar a taxa mínima dos pacotes de teste que

criam congestionamento (enfileiramento) no caminho. Usado normalmente para se obter a capacidade disponível Ideia básica:

Enviar pacotes numa taxa e notar se aparentemente estão sendo formadas filas ao longo do caminho que está sendo medido.

Assume-se que a formação da fila está ocorrendo no link gargalo. Mas, se a taxa for menor do que a capacidade disponível no link

gargalo o atraso em um sentido não deverá crescer em média. O comprimento usado do trem de pacotes determina a escala de

tempo na qual os pacotes de teste interagem com o tráfego cruzado no caminho.

Este método dá uma resposta booleana para cada taxa . Portanto, para se encontrar eficientemente a verdadeira capacidade disponível deve-se adotar uma estratégia de busca binária ou uma taxa com crescimento exponencial.

Page 95: Infraestrutura

95

Dificuldades dos Métodos de Congestionamento autoinduzido Devido à explosividade (burstiness) do tráfego possui

uma tendência em subestimar a banda disponível. Esta tendência diminui à medida que o comprimento do

trem de pacotes aumenta. O pacote de teste é, por definição, grande o bastante

para afetar o tráfego cruzado e pode, portanto, mudar a própria quantidade que está sendo medida.

Assume-se que a formação de fila ocorre em um único link. A presença de múltiplos links com aproximadamente a mesma largura de banda disponível causará uma subestimação.

Page 96: Infraestrutura

96

Dificuldades dos Métodos de Congestionamento autoinduzido

Assume-se que o tráfego cruzado varie lentamente o suficiente que a quantidade que está sendo medida esteja estável o suficiente para que o método convirja.

Finalmente, estes métodos assumem um enfileiramento FIFO em todos os roteadores, o que nem sempre é verdade na Internet atual.

Page 97: Infraestrutura

97

Medição da Capacidade de Transferência em Lote

Abre uma conexão TCP e envia tantos dados quanto o caminho possa suportar. Apesar de ser um método intrusivo, ele é

mais simples e mais robusto do que a maioria dos outros métodos de estimativa de largura de banda.

Requer cooperação das duas extremidades, requer a instalação de software (ex.: iperf).

Page 98: Infraestrutura

98

Medição da Capacidade de Transferência em Lote

Fatores que influenciam a vazão TCP e que devem ser consideradas: Tamanho da transferência: É necessária uma

transferência longa (dezenas de segundos) Natureza do tráfego cruzado: TCP x UDP;

muitas x uma conexão TCP Comprimento dos buffers nos dois lados. Variações na especificação e implementação

da variante do TCP utilizada.

Page 99: Infraestrutura

99

Desafios na Medição de Largura de Banda

Nos enlaces de alta capacidade os atrasos são tão pequenos que é muito difícil ou impossível de serem medidos com precisão.

Enlaces sem fio: muda a taxa e não entrega de acordo com FIFO.

Atrasos adicionais de dispositivos de nível 2 (ex.: switches)

Page 100: Infraestrutura

100

Medição e Estimação de Latência Além da medição de largura de banda, um segundo

problema importante é a medição ou a estimação da latência ao longo de caminhos da Internet.

Importância em: Redes de distribuição de conteúdo: fornecer objetos

Web ao cliente a partir da réplica disponível mais próxima. Redes P2P: recuperação de objetos a partir de pares

próximos. Jogos multiusuários: busca por jogadores que estejam

próximos. Seleção de servidores dinâmicos: fornecer objetos

Web ao cliente a partir do servidor mais próximo que possua uma réplica dos mesmos.

Page 101: Infraestrutura

101

Latência da Rede Uma indicador do desempenho que o

caminho de rede envolvido pode suportar.

RTT mínimo (minRTT): Interesse pois muda em escala de tempos longa, i.e., apenas com a mudança da topologia ou do roteamento.

RTT instantâneo: Varia dinamicamente de acordo com o congestionamento

Pode também ser medido em um único sentido.

Page 102: Infraestrutura

102

Estimação da Latência Se um dos lados do caminho puder ser

instrumentado, a medição da latência é direta (usando ping).

Desafios (medição de atraso sem o envio de pacotes de teste entre eles): Métodos baseados em proxy: quando nenhum

dos dois pontos terminais de um caminho pode participar do processo de medição.

Métodos de incorporação: os hosts são capazes de efetuar medições, mas não se quer medir cada caminho de interesse diretamente.

Page 103: Infraestrutura

103

Elementos Todos os métodos para estimativa da

latência contam com alguns nós fixos que agem como: intermediários (proxies) ou como pontos de referência (landmarks).

Page 104: Infraestrutura

104

Desigualdade Triangular Dados três pontos: , e e uma função que denota a

distância entre dois pontos, a desigualdade triangular requer que:

Esta propriedade se verifica para medidas de distância em espaços métricos (como o espaço Euclidiano).

Quando os pontos são nós de rede e a função distância é a latência da rede, a desigualdade triangular nem sempre se verifica: As medidas instantâneas variam muito com o tempo e é

difícil medi-las no mesmo instante de tempo. Mesmo para minRTT em alguns casos os pacotes enviados de

para podem não ser capazes de usar as rotas de para e de para . Por exemplo, por causa de políticas de roteamento inter-AS.

Page 105: Infraestrutura

105

Métodos baseados em proxy Tem como objetivo do RTT atual entre dois nós. Um método simples pode ser formulado baseado na

hipótese de roteamento pelo caminho mais curto e, portanto, na validade da desigualdade triangular. Um conjunto de proxies é selecionado. Para dois nós e , a desigualdade triangular requer que ,

seja limitado por baixo por

E limitado por cima por

Médias ponderadas de e podem ser usados como estimativas de , . Infelizmente elas são bem grosseiras dependendo da localização dos proxies.

Page 106: Infraestrutura

106

Métodos baseados em proxy IDMaps:

Faz uso de uma infraestrutura de medição especialmente instalada.

Assume a disponibilidade de proxies particulares chamados de tracers.

A latência entre os nós e é estimada como a latência entre e o tracer mais próximo dele, mais a lantência entre e o tracer mais próximo dele, mais a latência medida entre estes dois tracers.

O sistema também usa uma coleção de servidores que respondem a consultas dos clientes e retorna a estimativa da latência na rede.

A acurácia do IDMaps é limitada quando um ou os dois nós estão distantes dos tracers mais próximos.

Page 107: Infraestrutura

107

Métodos baseados em proxy King:

Aborda algumas das desvantagens do IDMaps explorando o sistema DNS

Ao invés de contar com tracers instalados especialmente para esta finalidade, ele usa o servidor DNS local de um nó como o seu proxy de medição.

Page 108: Infraestrutura

108

Métodos baseados em proxy King:

O método é baseado nas seguintes observações: Muitos nós na Internet estão próximos de seus servidores

locais DNS. É possível disparar trocas entre servidores DNS arbitrários

usando consultas DNS recursivas. Dados dois servidores de nomes em domínios diferentes (ex., dns.first.com e dns.second.com), uma consulta recursiva a dns.first.com para um nome como any.second.com irá disparar uma consulta DNS de dns.first.com para dns.second.com.

Ele mede o tempo de uma consulta recursiva do dns.first.com para any.second.com para estimar a latência entre um host no domínio first.com e um host no domínio second.com.

Page 109: Infraestrutura

109

Métodos de Incorporação A abordagem da incorporação está geralmente

focada em estimar o minRTT. Nesta abordagem, atribui-se a cada nó uma

localização em um espaço Euclidiano abstrato de alta dimensionalidade .

A localização de um nó neste espaço pode ser fixada usando um conjunto de medições para landmarks.

Apenas as landmarks precisam realizar medições de latência entre cada par delas, e não é necessário um grande número de landmarks para se obter estimativas acuradas.

Page 110: Infraestrutura

110

Métodos de Incorporação: GNP Na inicialização as landmarks efetuam

medições de latência entre todos os pares fornecendo um conjunto de medições

É atribuído então a cada landmark um vetor de coordenadas . Esta atribuição é obtida pela minimização da função objetivo: onde .

Page 111: Infraestrutura

111

Métodos de Incorporação: GNP Esta formulação resulta num problema de otimização

não linear cuja solução aproximada é obtida por métodos iterativos.

A dimensão do espaço Euclidiano () é um parâmetro ajustável.

Cada nó encontra o seu próprio vetor de coordenadas através da minimização de uma função objetivo semelhante:

O benefício deste procedimento é que, depois que cada nó tiver o seu vetor de coordenadas, a latência entre os nós e pode ser estimada sem nenhuma medição adicional por:

Page 112: Infraestrutura

112

Métodos de Incorporação: GNP Dado que a carga de medições para cada

landmark pode ser alto, As landmarks podem ser divididas em

conjuntos, onde cada alvo realiza medições apenas para um destes conjuntos.

Como dois nós podem usar conjuntos distintos, pode-se aplicar uma função de transformação para mapear cada conjunto de coordenadas locais num sistema canônico de coordenadas global.

Pode-se também eliminar as landmarks, usando os próprios nós para isto.

Page 113: Infraestrutura

113

Geolocalização Problema: Dado o endereço de rede de um host alvo, qual

é a localização geográfica deste host? É importante reconhecer que muitos métodos de

geolocalização comumente usados podem ser muito imprecisos.

Razões: O endereço que está sendo localizado não está correto Pode não ser possível realizar as medições necessárias para

realizar corretamente a geolocalização Alguns métodos contam com bases de dados que mapeiam

redes, organizações ou blocos de endereços inteiros num único local.

Usuários podem usar contramedidas para não serem localizados.

Page 114: Infraestrutura

114

Geolocalização e Privacidade Os usuários podem não querer divulgar

suas localizações Enquanto outros podem permitir a

divulgação mas restringir a precisão da mesma, além de restringir se pode ou não ser armazenada.

O GT geopriv do IETF definiu um conjunto de padrões para tratar informações de localização.

Page 115: Infraestrutura

115

Geolocalização baseada em Nome Abordagem simples:

Inspecionar os nomes DNS do host alvo, ou de hosts próximos topologicamente ao host alvo.

Este método se baseia na observação de que os operadores de rede frequentemente atribuem nomes com significado geográfico a suas interfaces.

Quando o host alvo não é um roteador, procurando o roteador que esteja próximo em termos da topologia da rede pode fornecer informações úteis.

Este método é sujeito a erros pois nem sempre os roteadores têm nomes com significado geográfico.

Page 116: Infraestrutura

116

Geolocalização baseada em Atrasos

Outra abordagem é explorar o relacionamento entre o atraso de rede medido e a distância. Medições do atraso mínimo em um dado caminho. Os caminhos medidos certamente serão mais longos do

que a distância real entre os pontos terminais. Métodos principais:

Melhor landmark Baseado em restrições

Em ambos assume-se a existência de um conjunto de landmarks com localizações geográficas conhecidas.

Representamos o atraso mínimo entre os nós e como

Page 117: Infraestrutura

117

Geolocalização: Método da Melhor Landmark

Mapeia o nó alvo à localização da landmark mais próxima.

O método inicia com a medição do atraso de rede de cada landmark para todas as demais:

Para localizar um nó alvo , são realizadas medidas de latência mínima para todas as landmarks e construído o vetor de medições correspondente

Escolhe-se a melhor landmark como sendo aquela cujo vetor de medição é mais semelhante a

Page 118: Infraestrutura

118

Método da Melhor Landmark:Limitações

A acurácia da localização inferida é limitada pela distribuição espacial das landmarks. Se não houver landmarks próximas ao alvo,

a localização inferida será inacurada.

Page 119: Infraestrutura

119

Geolocalização baseada em Restrições

Nesta abordagem são exploradas as propriedades conhecidas da propagação do sinal em uma fibra A luz se propaga a aproximadamente 2/3 da

sua velocidade no vácuo. Encontra-se uma estimativa da localização

de um host alvo através de multilateração Processo de estimar a posição usando um

número suficiente de distâncias até pontos fixos (por exemplo, usado por GPSs).

Page 120: Infraestrutura

120

Multilateração Para cada landmark

podemos usar para obter um limite superior na distância até o alvo.

Cada landmark calcula a distância geográfica restrita a um host alvo multiplicando a latência mínima medida pela velocidade da luz na fibra.

A restrição na distância geográfica calculada é dada por:

A localização do host está em algum lugar na região cinza.

Page 121: Infraestrutura

121

Banco de Dados de Localização Construção manual de uma grande base de dados

com mapeamentos entre endereços IP e suas localizações conhecidas.

Informações de localização podem ser fornecidas por administradores de rede. O DNS foi proposto como repositório para esta

informação. Bancos de dados do serviço whois inclui entradas

de localização para sistemas autônomos e blocos de endereços alocados. Estas informações podem ser imprecisas ou

desatualizadas.

Page 122: Infraestrutura

122

Inferência Dados escondidos na medições de infraestrutura

podem às vezes ser reconstruídos através de procedimentos de inferência (Tomografia de rede). Topologia da rede Atrasos internos à rede Taxas de perdas de pacotes

Tomografia da rede baseada na equação

Onde: é um conjunto de medições fim-a-fim é a matriz de roteamento e são as medições individuais de cada link

Page 123: Infraestrutura

123

Atrasos Internos e Taxas de Perdas Hipóteses para a estimativa:

Links: unidirecionais ou bidirecionais Caminhos: simétricos ou assimétricos Medições dos caminhos: ida-e-volta (RTT)

ou em um sentido (OW) Estratégia de testes: multicast ou unicast.

Hipóteses mais realistas: Links unidirecionais e caminhos

assimétricos.

Page 124: Infraestrutura

124

Soluções Em geral a equação pode:

Não ter nenhuma solução para Ter uma única solução ou Ter um número infinito de soluções.

Se for uma matriz com posto máximo, então a equação pode ser resolvida diretamente para todas as medições nos links sendo a solução dada por

Page 125: Infraestrutura

125

Inferências em todos os links É preciso fazer hipóteses adicionais. Uma estratégia geral é olhar soluções de

máxima verossimilhança: Dadas medições podemos definir a probabilidade

de uma solução particular ) como: | Onde | é a probabilidade de ver as observações dada

uma matriz de roteamento particular e um conjunto de parâmetros de link.

As hipóteses adicionais que são incluídas tomam a forma de modelos ou restrições que afetam como calculamos |

Page 126: Infraestrutura

126

Tomografia de rede:Métodos baseados em Multicast

Abordagem MINC baseada no uso de testes em multicast.

Problema de tomografia na sua forma mais simples:

Cada um dos links possui uma taxa de perdas associada

O objetivo é estimar as três taxas de perda a partir de medições de taxa de perdas realizadas apenas nos caminhos e .

Como temos três links e apenas duas medições, o problema é indeterminado (múltiplas soluções estão consistentes com os dados observados).

Na abordagem MINC, ao invés de trabalhar com taxas de perdas trabalharemos com eventos de perdas.

Page 127: Infraestrutura

127

Tomografia de rede:Métodos baseados em Multicast

A fonte dos testes (nó 0) envia pacotes multicast em em em direção aos nós terminais (nós 2 e 3).

Quando os pacotes multicast alcançam o ponto de bifurcação 1, uma cópia do pacote é enviada por cada um dos links e . Se o pacote se perder no link não chegará nem ao nó 2

nem ao nó 3. Portanto, os pacotes que não chegarem nem a 2 nem a 3 devem ter se perdido no link .

Os pacotes que forem vistos em um nó mas não no outro, devem ter se perdido no link que leva ao nó onde ele não chegou.

Repetindo este experimento diversas vezes podemos construir uma estimativa das taxas de perdas nos três links.

Page 128: Infraestrutura

128

Tomografia de rede:Métodos baseados em Unicast

Algumas redes não suportam multicast. Ao usar unicast tentaremos imitar o ‘destino

compartilhado’ dos pacotes de teste multicast. Para este fim podemos usar pares de pacotes

dado que eles tendem a sofrer as mesmas consequências de enfileiramento e perda.

Métodos unicast são mais imprecisos que os multicast, mas são mais flexíveis. Por exemplo, podem ser estendidos a medições

passivas.

Page 129: Infraestrutura

129

Tomografia de Rede:Links Congestionados Dominantes

Em alguns casos pode haver um link ao longo do caminho que seja responsável pela maioria das perdas ou atrasos, que é chamado de link congestionado dominante. Pode ser suficiente determinar se existe um link

congestionado dominante e Em caso afirmativo, identificar este link

Uma abordagem é enviar pacotes periódicos ao longo do caminho e observar a sequência de valores de atrasos. O atraso sofrido pelo pacote perdido pode ser inferido pelos

atrasos dos pacotes não perdidos. Se a maior parte dos pacotes perdidos tiver atrasos inferidos

semelhantes pode ser inferido que existe um link congestionado no caminho.

Page 130: Infraestrutura

130

Tomografia de Rede:Links Congestionados Dominantes

A identificação do link congestionado pode ser feita (assumindo que a incidência dos mesmos seja baixa) através da interseção de desempenho ruim entre caminhos diversos.

Page 131: Infraestrutura

131

Projetos Eficientes de Medição Um papel relacionado para a inferência é na

redução da carga requerida para a obtenção das medições de rede.

Realizar medições em caminhos linearmente independentes de modo que possam descrever completamente todos os caminhos.

Da mesma forma, se quisermos monitorar a falha de links podemos encontrar o número mínimo de caminhos a serem monitorados.

Estimação estatística (resultados aproximados)

Page 132: Infraestrutura

132

Outras ferramentas Identificação da Topologia:

Árvores multicast Taxa de reordenação de pacotes:

observando as propriedades de conexões TCP

Taxas de perdas de pacotes em um sentido Envio de pacotes TCP selecionados e

deduzir a quantidade de pacotes perdidos em cada direção em função das respostas do host remoto.

Page 133: Infraestrutura

133 Estado da Arte

Page 134: Infraestrutura

134

Roteiro Propriedades dos Equipamentos Propriedades das Topologias Interação do Tráfego com a Rede

Page 135: Infraestrutura

135

Propriedades dos Equipamentos: Roteadores

Através de avaliações experimentais dos roteadores de backbone mostraram que o atraso experimentado por um pacote quando passa por um roteador é muito pequeno: microssegundos: quando o pacote chega e

sai da mesma interface com pouco tráfego adicional na mesma.

Dezenas de microssegundos: quando o pacote entra e sai por interfaces distintas.

Page 136: Infraestrutura

136

Propriedades dos Equipamentos: Roteadores No entanto, se o roteador estiver bem carregado, os

atrasos de enfileiramento podem ser da ordem de dezenas de milissegundos.

Uma outra fonte de atrasos (que pode estar na faixa dos milissegundos) ocorre quando o pacote contém opções IP.

Em algumas raras ocasiões o roteador atrasa a transmissão de pacotes mesmo na ausência de tráfego esperando para ser transmitido no link de saída (isto afeta menos de 1% do tráfego). Estes atrasos são da ordem de milissegundos e Parecem ocorrer com a ativação periódica de software no

roteador.

Page 137: Infraestrutura

137

Propriedades dos Equipamentos: Roteadores É útil também entender como os roteadores produzem e

consomem tráfego por exemplo, mensagens de roteamento.

Mensagens de anúncio do estado de enlaces (LSAs) requerem da ordem de 100 microssegundos para serem processadas. Boa parte disto pode ser atribuída à cópia de dados dentro do

roteador. O tempo necessário para processar os pacotes OSPF tende a

variar linearmente com o número de LSAs contidos no pacote Enquanto que o tempo associado ao cálculo do caminho mais

curto cresce de forma quadrática em relação ao número de nós.

Page 138: Infraestrutura

138

Propriedades dos Equipamentos: Middleboxes

Caixas intermediárias tais como NATs e firewalls.

Estes dispositivos podem introduzir atrasos de um milissegundo a centenas de milissegundos para encaminhar os pacotes.

Page 139: Infraestrutura

139

Propriedades das Topologias Propriedades estáticas do Grafo de Sistemas

Autônomos: Alta variabilidade da distribuição de graus:

Grafos aleatórios tradicionais apresentam baixa variabilidade na distribuição dos graus.

Mas este não é o caso para o grafo de ASes.

𝑦=𝑎𝑥𝑘+𝜀

Page 140: Infraestrutura

140

Propriedades das Topologias Alta variabilidade da distribuição de graus:

Consequências: Esta é uma invariante importante que deve estar presente em

qualquer modelo realista de topologia de ASes. Alguns ASes são muito bem conectados, enquanto que outros são

muito pouco conectados. Papeis muito diferentes: grau do nó parece estar altamente correlacionado com o tamanho do AS.

Mecanismos de crescimento da Internet: Nós adicionais se conectam com nós existentes com uma

probabilidade proporcional ao grau do nó existente. Nós adicionais conectam a nós existentes de modo a minimizar

tanto o comprimento físico da nova conexão como o número médio de etapas para outros nós na rede

Se novos ASes surgirem com uma taxa de crescimento exponencial e cada AS também crescer exponencialmente. Se o tamanho do AS estiver correlacionado com o seu grau então obteremos distribuições de graus altamente variáveis.

Page 141: Infraestrutura

141

Propriedades das Topologias Propriedades de Mundo Pequeno:

Diz respeito ao relacionamento de duas propriedades dos grafos: diâmetro e agrupamento (clustering):

Normalmente têm um alto grau de agrupamento e pequenos diâmetros!

Grafos de ASes são grafos de mundo pequeno: Dados de Janeiro 2002 continham 12.709 ASes e

27.384 arestas. Comprimento médio do caminho é de 3,6 e o coeficiente de agrupamento é 0,46 (grafos aleatórios semelhantes apresentam um coeficiente de 0,0014).

Page 142: Infraestrutura

142

Propriedades das Topologias Relacionamentos entre ASes:

Os ASes podem ser identificados de acordo com os papeis que desempenham na rede.

O relacionamento comercial entre dois ASes pode ser classificado como:

Cliente-provedor Parceiros Trânsito mútuo Backup mútuo

Estes relacionamentos são aplicados através da escolha de que rotas são anunciadas através do BGP, e para quem elas são anunciadas.

Portanto, pode ser difícil identificar a natureza dos relacionamentos sem o acesso direto ao tráfego BGP entre os ASes de interesse.

Page 143: Infraestrutura

143

Propriedades das Topologias Propriedades estáticas dos Grafos de

Roteadores: Grafo de roteadores: grafo no qual os nós

são os roteadores e as arestas são conexões diretas (1 etapa) entre roteadores.

Obter uma visão completa do grafo de roteadores da Internet hoje é impossível. É mais fácil focar em pequenos pedaços, ou

seja, subgrafos correspondentes a um único AS ou rede.

Page 144: Infraestrutura

144

Mapa da ARPANET em 30/12/1972

Page 145: Infraestrutura

145

Mapa da Rede Abilene em 2005

Page 146: Infraestrutura

146

Mapa da Rede Ipê em Maio 2011

Page 147: Infraestrutura

147

Propriedades das Topologias Propriedades estáticas dos Grafos de

Roteadores: Alta Variabilidade na Distribuição dos Graus:

Como os grafos de ASes, medições dos grafos de roteadores mostraram que eles também apresentam uma alta variabilidade na distribuição dos graus.

Muitos nós têm graus menores do que 5 mas alguns têm graus maiores do que 100 (provavelmente em pontos de acesso na borda da rede).

Ao contrário da medição de grafos de ASes que são passivas (a partir do BGP), as medições de grafos de roteadores são ativas (com o uso do traceroute).

Page 148: Infraestrutura

148

Propriedades das Topologias Propriedades estáticas dos Grafos de

Roteadores: Alta Variabilidade na Distribuição dos

Graus: Grafo sintético respeitando as restrições

técnicas para os roteadores:

Page 149: Infraestrutura

149

Propriedades das Topologias Propriedades estáticas dos Grafos de

Roteadores: Propriedades dos Caminhos:

Como no caso dos grafos de ASes, os caminhos típicos através dos grafos de roteadores tendem a ser curtos

Medidas do número de etapas IP entre nós na Internet mostram valores médios em torno de 16, enquanto que caminhos com mais de 30 etapas são raros.

Apesar de serem curtos, as medições têm mostrado que eles são mais longos do que necessário.

Este efeito parece ser devido principalmente a políticas de peering entre ASes e roteamento interdomínio.

Page 150: Infraestrutura

150

Propriedades das Topologias Aspectos Dinâmicos da Topologia:

Também temos interesse em observar como a infraestrutura da Internet muda com o tempo.

Crescimento e mudança:

Fonte: bgp.potaroo.net

Page 151: Infraestrutura

151

Propriedades das Topologias Aspectos Dinâmicos da Topologia:

Crescimento e mudança: Observar o crescimento da Internet ao nível dos roteadores ou dos

sistemas finais é mais complicado e muito mais dinâmico. Alternativas:

Contar o número de endereços que foram alocados pelos Registros Regionais. Este seria um superdimensionamento pois é conhecido que muitos

endereços alocados não estão em uso. Contar o número de endereços anunciados pelo BGP.

Mesmo assim muitos endereços anunciados não estão em uso. Testar todos os endereços anunciados usando o ping

Mas, muitos hosts estão conectados de forma intermitente ou estão atrás de NATs ou firewalls que bloqueiam as respostas e produzem um número subestimado.

Consulta ao DNS para encontrar o conjunto de todos os endereços IP que possuem nomes DNS alocados.

Mas este seria também um valor subestimado dado que nem todos os hosts estão cadastrados no DNS.

Page 152: Infraestrutura

152

Propriedades das Topologias Aspectos Dinâmicos da Topologia:

Crescimento e mudança:

Page 153: Infraestrutura

153

Evolução do Número de Hosts do Brasil

Número de Hosts

Posição Relativa

Fonte: www.cetic.br

Page 154: Infraestrutura

154

Propriedades das Topologias Aspectos Dinâmicos da Topologia:

Estabilidade: Mudanças na topologia da rede podem resultar

da instabilidade do sistema. Os componentes da infraestrutura da rede

estão continuamente sujeitas a falhas, reinicializações e reconfigurações.

Isto provoca alterações na topologia com nós e arestas desaparecendo e depois reaparecendo.

Reflete também na instabilidade das rotas.

Page 155: Infraestrutura

155

Propriedades das Topologias Aspectos Dinâmicos da Topologia:

Estabilidade: Instabilidade no BGP:

Provocam sequências longas de atualizações. Podem causar loops de roteamento e um

crescimento no atraso e perdas de pacotes. Aparentemente afeta uma pequena parte do tráfego

da Internet. Num backbone a maioria das falhas dos links

está concentrada num pequeno subconjunto dos mesmos.

E duram menos do que 10 minutos.

Page 156: Infraestrutura

156

Propriedades das Topologias Localização Geográfica:

Page 157: Infraestrutura

157

Interação do Tráfego com a Rede Muitas propriedades importantes do tráfego são

influenciadas pelas condições da rede. Atraso dos Pacotes:

Determinísticos: Atrasos de transmissão e propagação

O atraso de transmissão é significativo apenas em links lentos. O atraso de propagação é influenciado pela distância geográfica.

Estocásticos: Atraso de encaminhamento (sobretudo de enfileiramento)

Boa parte do atraso total observado é devido a este atraso. São normalmente observados grandes picos de atraso.

Page 158: Infraestrutura

158

Interação do Tráfego com a Rede Perdas de Pacotes:

Normalmente ocorrem em rajadas (bursts) provavelmente por eventos de congestionamento persistente nos roteadores.

Medições sugerem que as taxas de perdas em caminhos ‘cabeados’ são, em geral, inferiores a 0,1%

Por outro lado, taxas de perdas em caminhos que incluem links sem fio podem ser bem altos – 2% ou mais.

Page 159: Infraestrutura

159

Interação do Tráfego com a Rede Reordenamento de Pacotes, Duplicação e Jitter:

Causas do reordenamento dos pacotes: Paralelismo em um roteador Balanceamento de carga entre múltiplos caminhos na rede Mudanças de rotas

O reordenamento dos pacotes têm um efeito importante no comportamento do TCP.

No TCP os pacotes podem chegar fora de ordem por diversos motivos: Reordenamento real dentro da rede Duplicação de pacotes dentro da rede Retransmissão pelo transmissor TCP (maior parte)

Page 160: Infraestrutura

160

Interação do Tráfego com a Rede Largura de Banda e Vazão:

Há poucos dados sobre a distribuição de larguras de banda entre caminhos na Internet.

As velocidades dos links estão crescendo firmemente e continuamente. Portanto, a medição de taxas em lotes tem

crescido em certos caminhos.

Page 161: Infraestrutura

161

Lei da Largura de Banda de Edholm

Fonte: IEEE Spectrum July 2004

10 Gb/sEthernet

Page 162: Infraestrutura

162

Interação do Tráfego com a Rede Largura de Banda e Vazão:

Em escalas de tempo menores, a vazão em caminhos individuais é uma métrica relativamente firme. Ao contrário do RTT e taxas de perdas, as taxas de

vazão do TCP variam lentamente. As taxas de vazão podem variar por um fator

menor do que três durante uma hora. Isto é importante para medições de largura de

banda disponível e indica que estas medições são úteis por pelo menos um período da ordem de horas.