transformada de hough - computação unioeste – ciência ...adair/pid/notas aula/transformada de...
TRANSCRIPT
Transformada de Hough
Cleber PivettaGustavo MantovaniFelipe Zottis
� A Transformada de Hough foi desenvolvida por
Paul Hough em 1962 e patenteada pela IBM.
� Originalmente, foi elaborada para detectar
características analiticamente representáveis
em imagens binarizadas, assim como linhas,em imagens binarizadas, assim como linhas,
círculos e elipses.
� Tornou-se uma ferramenta de uso comum na
visão artificial para o reconhecimento destascaracterísticas.
� Definição :
� A Transformada de Hough é um método padrão
para detecção de formas que são facilmente
parametrizadas (linhas, círculos, elipses, etc.)em imagens digitalizadas.em imagens digitalizadas.
� A idéia é aplicar na imagem uma transformação tal que
todos os pontos pertencentes a uma mesma curva
sejam mapeados num único ponto de um novo espaçode parametrização da curva procurada.
� Equação de reta: ρ = x cos θ + y sin θ
� Parâmetro ρ representa a distância da reta até a origem
� θ representa o ângulo entre o eixo x e a reta entre
origem e ponto mais próximo da origem.origem e ponto mais próximo da origem.
� Para todo ponto (x, y) não nulo da imagem
original, a matriz acumuladora (espaço de
parametrização) será incrementado com a tupla
(θ , ρ), variando θ de 0 até o valor definido pelo
usuário.usuário.
� Acumulador(θ, ρ)++
� Desta forma, para cada ponto (x, y), terá uma
senóide no acumulador.
� O tamanho da senóide depende no valor de θdefinido pelo usuário.
Imagem Original 1 senóide
Imagem Original 2 senóides. O ponto de interseção
representa a reta que passa pelos 2
pontos
� Suponha que uma determinada reta é desenhada
na imagem. Isso levará a um acúmulo de pontos
no acumulador, pois cada ponto da reta “vota” no
mesmo ponto do acumulador. Se procurarmos os
pontos máximo local no acumulador,pontos máximo local no acumulador,
encontraremos as retas na imagem original.
Imagem Original Infinitos senóides que interceptam
num único ponto. O ponto deinterseção representa a reta.
Imagem Original Infinitos senóides que se acumulam em 4
pontos (os 2 pontos de acumulação nas
bordas laterais correspondem à reta
horizontal)
� O próximo passo após preencher o vetoracumulador é encontrar os pontos demáximo do acumulador.
� Estes pontos máximos do acumuladorpossivelmente representam uma reta daimagem original.imagem original.
� Para evitar que ruídos sejam confundidoscom retas pode-se determinar umlimiar(threshold) para limitar o valor dospontos máximos que serão convertidos emretas na imagem original.
� Um passo necessário no processo de aplicação
da Transformada de Hough é a detecção de
bordas e a limiarização. Foi usado o método deSobel para a realização desta tarefa.
� As bordas de uma imagem devem ser detectadas
para que a Transformada Hough possa ser
aplicada.
� O Filtro Sobel é uma operação utilizada em� O Filtro Sobel é uma operação utilizada em
processamento de imagens para detecção debordas.
� Consiste em um operador que calcula o gradiente
de intensidade da imagem em cada ponto,
mostrando a direção da maior variação de claro
para escuro.
� Identificando a presença de uma transição claro-escuro, é possível localizar as bordas da imagem.
� No presente trabalho, aplicou-se uma máscara de
tamanho 3x3 em duas variações (horizontal e
vertical).
� Depois as duas imagens são combinadas usando� Depois as duas imagens são combinadas usando
a raiz quadrada da soma dos quadrados comomostram as fórmulas a seguir:
Fórmula Matemática do Filtro Sobel onde G é o gradiente e A a imagem original:
� Após ter sido aplicada a detecção de bordas uma
operação de limiarização deve ser efetuada.
� A limiarização consiste em converter imagens em
tons de cinza para imagens binárias, por issotons de cinza para imagens binárias, por isso
essa técnica é conhecida também como
binarização.
� A forma mais simples de limiarização consiste na
bipartição do histograma, convertendo os pixels
cujo tom de cinza é maior ou igual a um certo
valor de limiar T em brancos e os demais emvalor de limiar T em brancos e os demais em
pretos.
� Na operação de limiarização, uma imagem de
entrada f(x,y) com N tons de cinza produz à saída
uma imagem g(x,y) chamada imagem limiarizada
ou binarizada, sendo:
g(x,y) = 1 se f(x,y) > T
g(x,y) = 0 se f(x,y) < T
� Onde T é um valor de nível de cinza denominado limiar.
� A qualidade de uma imagem limiarizada depende
do valor de T. Assim, é importante definir um valor
ótimo para T de forma que a imagem não sofrauma limiarização inadequada para sua aplicação.uma limiarização inadequada para sua aplicação.
1 2
34
FIMFIM