fundamentos de análise estática

45
Fundamentos de Análise Estática

Upload: bao

Post on 26-Jan-2016

25 views

Category:

Documents


2 download

DESCRIPTION

Fundamentos de Análise Estática. O que é?. Análise automática feita em código sem execução. Objetivo (Para que serve?). Verificação de propriedades Entendimento de código. Foco desta aula. Objetivo (Para que serve?). Verificação de propriedades Entendimento de código. Foco desta aula. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Fundamentos de  Análise Estática

Fundamentos de Análise Estática

Page 2: Fundamentos de  Análise Estática

O que é?

• Análise automática feita em código sem execução

Page 3: Fundamentos de  Análise Estática

Objetivo (Para que serve?)

• Verificação de propriedades

• Entendimento de código Foco desta aula

Page 4: Fundamentos de  Análise Estática

Objetivo (Para que serve?)

• Verificação de propriedades

• Entendimento de código Foco desta aula

Entendimento de código pode facilitar verificação!

Page 5: Fundamentos de  Análise Estática

Várias formas (Como?)

• Sistemas de tipos

• Verificação de restrições

• Análise de dataflow Foco desta aula

Page 6: Fundamentos de  Análise Estática

Conceitos Básicos

Page 7: Fundamentos de  Análise Estática

Aproximação de soluções

• Propriedades complexas– Análise é indecidível ou alto custo

Page 8: Fundamentos de  Análise Estática

Aproximação de soluções

• Propriedades complexas– Análise é indecidível ou alto custo

Maioria das propriedades interessantes são complexas!

Page 9: Fundamentos de  Análise Estática

Aproximação de soluções

• Propriedades complexas– Análise é indecidível ou alto custo

• Abordagem: aproximar espaço de solução– super-aproximação: falso positivos– sub-aproximação: falso negativos

comum

Page 10: Fundamentos de  Análise Estática

Aproximação de soluções

• Propriedades complexas– Análise é indecidível ou alto custo

• Abordagem: aproximar espaço de solução– super-aproximação: falso positivos– sub-aproximação: falso negativos

• Prática: – Balanço entre falso positivos e negativos e

escalabilidade potencializa utilidade da análise

comum

Uma análise é conservadora quando resultado inclui necessariamente todas as soluções. Por exemplo, uma análise para encontrar erros de tipo é conservadora quando não permite escapar nenhum erro. Por outro lado, geralmente, reporta erros espúrios (i.e., alarmes falso).

Page 11: Fundamentos de  Análise Estática

Frequentemente balanço entre falso positivos, negativos, e escalabilidade é mais importante (i.e., útil) que garantias fortes de correção (0% falso negativos) e completude (0% falso positivos).

Page 12: Fundamentos de  Análise Estática

Um pouco de teoria...

Page 13: Fundamentos de  Análise Estática

Teoria dos Reticulados (Lattice)

• O que estes grafos tem em comum?– Obs. vértice denota relação de ordem

Page 14: Fundamentos de  Análise Estática

Ordem Parcial

• Ordem parcial é uma relação binária:– reflexiva, transitiva e anti-simétrica

• Conceitos associados– Upper Bound– Least Upper Bound (LUB)– Lower Bound– Greatest Lower Bound (GLB)

Page 15: Fundamentos de  Análise Estática

LUB

LUB para este subconjunto?

Page 16: Fundamentos de  Análise Estática

LUB

LUB para este subconjunto?

Page 17: Fundamentos de  Análise Estática

GLB

GLB para este subconjunto?

Page 18: Fundamentos de  Análise Estática

GLB

GLB para este subconjunto?

Page 19: Fundamentos de  Análise Estática

Top e Bottom

Bottom

Top

Page 20: Fundamentos de  Análise Estática

Lattice

• Reticulado– Ordem parcial onde qualquer subconjunto de

elementos da relação possui LUB e GLB associado

• Esta ordem parcial é um lattice?

Page 21: Fundamentos de  Análise Estática

Exemplos: Lattices

Page 22: Fundamentos de  Análise Estática

Exemplo: relação de inclusão de inteiros {0,1,2,3}

Page 23: Fundamentos de  Análise Estática

Função monotônica e Ponto Fixo

• Função f: L → L– Monotônica

• Não decresce. Conceitualmente, acumula informação

Page 24: Fundamentos de  Análise Estática

• Função f: L → L– Monotônica

• Não decresce. Conceitualmente, acumula informação

• Ponto fixo fix(f), f(fix(f)) = fix(f)

• Teorema do ponto fixo (Tarski): – Toda função monotônica f admite ponto fixo

em um reticulado L de altura finita.

Função monotônica e Ponto Fixo

Page 25: Fundamentos de  Análise Estática

Ilustração

• Iterações sucessivas de uma função– Acumula informação

(f é monotônica)– Para em ponto fixo quando

“não há mais informação para se descobrir”

Page 26: Fundamentos de  Análise Estática

Relação com nosso problema

O domínio e contra-domínio de f representam alguma informação de nosso interesse no programa. Por exemplo, definições alcançáveis em um ponto do programa. Tipicamente, f opera em uma representação abstrata do programa. Por exemplo, o control-flow graph (CFG) ou o inter. flow graph (IFG). Uma iteração de f propaga informação nesta estrututura. Por exemplo, propaga informação armazenada nos nós pelos vértices de um CFG.

Page 27: Fundamentos de  Análise Estática

Um pouco de prática...

Page 28: Fundamentos de  Análise Estática

Perspectiva

• Análise estática propaga informação usando estrutura do programa– Intra-procedural: fluxo de controle de um

método/função (CFG)– Inter-procedural: fluxo de chamadas entre

métodos/funções (IFG)

Page 29: Fundamentos de  Análise Estática

Perspectiva

• Análise estática propaga informação usando estrutura do programa– Intra-procedural: fluxo de controle de um

método/função (CFG)– Inter-procedural: fluxo de chamadas entre

métodos/funções (IFG)

Page 30: Fundamentos de  Análise Estática

CFG

Page 31: Fundamentos de  Análise Estática

Quiz

• Quais as definições de f alcançáveis no nó return f? (assuma que uma def. consiste de um nome de variável + id. do bloco básico)

Page 32: Fundamentos de  Análise Estática

Como mecanizar análise mental?

• Associado a cada nó i:– Informação acumulada: xi

• No exemplo anterior xi armazena conjunto de definições

– Função (monotônica) de transferência: Fi

Page 33: Fundamentos de  Análise Estática

Chaotic Iteration

Simplificação: na prática, Fi lê apenas conteúdo em nós vizinhos a i!

Page 34: Fundamentos de  Análise Estática

Framework

• Em geral, 4 funções descrevem uma análise intra-procedural: in, out, kill e gen

• Ilustração

in

out

genkill

Page 35: Fundamentos de  Análise Estática

Exemplo: Reachable Definitions

• in[b] = U OUT[k], for all k ∈ pred[b]

• out[b] = (IN[b] – kill[b]) + gen[b]

• kill[b] = “definições mortas em b”

• gen[b] = “novas definições (não mortas) em b”

Page 36: Fundamentos de  Análise Estática

Existem vários frameworks de análise que permitem escrever basicamente estas 4 funções e obter sua análise intra-proc. E.g., SOOT (http://www.sable.mcgill.ca/soot)

Page 37: Fundamentos de  Análise Estática

Outros Detalhes

• Generalização– May/Must– Forward/Backward

• Reachable Defintions é uma análise– May e Forward

Page 38: Fundamentos de  Análise Estática

Perspectiva

• Análise estática propaga informação usando estrutura do programa– Intra-procedural: fluxo de controle de um

método/função (CFG)– Inter-procedural: fluxo de chamadas entre

métodos/funções (IFG)

Page 39: Fundamentos de  Análise Estática

Similaridades entre Inter e Intra

• Informação se propaga em um grafo– Informação e função de transferência associada a cada nó

Grafo inclui informação de chamador e chamado

Page 40: Fundamentos de  Análise Estática

Diferenças

• Representação do grafo é diferente• Context insensitivity: alguns caminhos (de

chamadas) são explorados, mas não são possíveis!

g()

f() calls g()

returns from g() back to f() returns from g() back to h()

h() calls g()

Caixinha é um CFG

Page 41: Fundamentos de  Análise Estática

Diferenças

• Representação do grafo é diferente• Context insensitivity: alguns caminhos (de

chamadas) são explorados, mas não são possíveis!

g()

f() calls g()

returns from g() back to f() returns from g() back to h()

h() calls g()

propagada informação acumulada no contexto de chamada de h() para o retorno da chamada de g() em f()!

Page 42: Fundamentos de  Análise Estática

Inlining

• Uma tentativa é representar um CFG do programa fazendo inlining de função

• Problemas– Como tratar recursão?– Não escala (vários contextos de chamada)

Page 43: Fundamentos de  Análise Estática

Existe uma variedade de representações de interprocedural flow graphs (IFGs). Por exemplo, IFG proposto por Harrold e Soffa em “Efficient Computation of Interprocedural Definition-Use Chains”, TOPLAS 1994.

Page 44: Fundamentos de  Análise Estática

Considerações Finais

• Representação do programa pode facilitar muito a análise do programa– 3-address– SSA

O framework SOOT oferece 4 representações (formatos) do programa de entrada.

Page 45: Fundamentos de  Análise Estática

Leitura adicional

• Michael Shwartzbach’s Lecture Notes on Static Analysis: http://www.brics.dk/~mis/static.pdf