universidade estadual de campinasrepositorio.unicamp.br/jspui/bitstream/reposip/260054/1/... ·...
Post on 08-Nov-2020
0 Views
Preview:
TRANSCRIPT
APLICAÇÃO DA CODIFICAÇÃO ROI E WT PARA
COMPRESSÃO DE IMAGENS DICOM-CT
Tese de Mestrado apresentada à Faculdade de Engenharia
Elétrica e de Computação como parte dos requisitos para a
obtenção do título de Mestre em Engenharia Elétrica.
Área de concentração: Telecomunicações e Telemática.
Banca Examinadora
Prof. Dr. Yuzo Iano Decom/Feec/Unicamp
Prof. Dr. David Bianchini Feec/PUCC
Prof. Dr. Leonardo Lorenzo Bravo Roger FT/Unicamp
Campinas – SP
Março/2012
Universidade Estadual de Campinas
Faculdade de Engenharia Elétrica e de Computação
Departamento de Comunicações
Orientador: Prof. Dr. Yuzo Iano
Efraina Gladys Cutipa Arapa
ii
FICHA CATALOGRÁFICA ELABORADA PELA
BIBLIOTECA DA ÁREA DE ENGENHARIA E ARQUITETURA - BAE -
UNICAMP
C972a
Cutipa Arapa, Efraina Gladys
Aplicação da codificação ROI e WT para compressão
de imagens DICOM-CT / Efraina Gladys Cutipa Arapa. -
-Campinas, SP: [s.n.], 2012.
Orientador: Yuzo Iano.
Dissertação de Mestrado - Universidade Estadual de
Campinas, Faculdade de Engenharia Elétrica e de
Computação.
1. Processamento de imagens. 2. Compressão de
imagens . 3. Wavelet (Matemática). 4. Tomografia
computadorizada. I. Iano, Yuzo. II. Universidade
Estadual de Campinas. Faculdade de Engenharia Elétrica
e de Computação. III. Título.
Título em Inglês: Aplication of the ROI coding and WT for compression
DICOM-CT images
Palavras-chave em Inglês: Image processing , Image compression, Wavelet
mathematical, Computed tomography
Área de concentração: Telecomunicações e Telemática
Titulação: Mestre em Engenharia Elétrica
Banca examinadora: David Bianchini, Leonardo Lorenzo Bravo Roger
Data da defesa: 30-03-2012
Programa de Pós Graduação: Engenharia Elétrica
iii
iv
v
Resumo
O armazenamento e a transmissão de grande quantidade de imagens médicas
constituem um campo ativo de pesquisa. Dispositivos de imagem geram muitos dados por
paciente. Além disso, deve-se prover armazenamento de longo prazo bem como uma
transmissão eficiente. Esquemas de compressão atuais produzem taxas de compressão
elevadas e com perda de qualidade. Uma abordagem de processamento que permita uma alta
taxa de compressão e codificação de regiões de interesse ROI (Region Of Interest) com boa
qualidade é assim desejável. Neste trabalho um método de codificação ROI e WT (Wavelet
Transform) para compressão de imagem digital no formato padrão DICOM (Digital Imaging
and Communications in Medicine) é apresentado. Essas aplicações permitem extrair
informações relevantes para o armazenamento de uma imagem com um menor custo
computacional e com um erro muito pequeno quando se compara a imagem original com
aquela processada.
Palavras chave: compressão de imagens, padrão DICOM, região de interesse, transformada wavelet,
tomografia computadorizada.
vi
vii
Abstract
The storage and transmission of large amounts of medical images is an active field research. In
general, imaging devices generates large amounts of data per patient. Besides, we need to provide long-
term storage and an efficient transmission. Current compression schemes produce high compression
rates if some loss of quality is affordable. However in medicine field we cannot afford any losses in
diagnostically important regions. An approach that brings a high compression rate with a good quality
is thus necessary. In this work a method of ROI coding e WT (Wavelet Transform) for compression of
compression of digital imaging is presented. These applications allow extract relevant information from
an image archiving with a lower computational cost and with a very small error when comparing the
original and processed images.
Keywords: image compression, DICOM standard, region of interest, wavelet transform, computed
tomography.
viii
ix
A presente dissertação a dedico de coração a meus
queridos pais; Luis C. Luque e Rosa A. de Cutipa.
Aos meus irmãos; José Luis, G. Roger e E. Percy.
x
xi
Agradecimentos
O resultado da presente tese é o fruto de muito tempo de trabalho e pesquisa, o qual foi
possível graças à colaboração de muitas pessoas, às quais eu expresso minha mais sincera gratidão.
Ao DEUS por me ter ajudado e dado força para seguir adiante apesar de meus tropeços.
Aos meus queridos pais Luis e Rosa, que desde pequena me inculcaram sólidos princípios e valores
morais; a meus apreciados irmãos José Luis, G.Roger e E.Percy que apesar da distancia e de estarem
em lugares diferentes sempre me deram um apoio moral, respaldo e motivação.
Ao meu orientador, o Dr. Yuzo Iano pelos sábios conselhos, acompanhamento e compreensão no
desenvolvimento do trabalho.
A cada um de meus professores de mestrado, pessoas dignas de respeito e admiração.
Aos meus colegas de laboratório LCV, em especial ao Roger Larico.
Meus agradecimentos aos órgãos de fomento à pesquisa: CAPES (Coordenação de Aperfeiçoamento
de Pessoal de Nível Superior) e CNPq (Conselho Nacional de Desenvolvimento Científico e
Tecnológico), tanto pelo apoio financeiro quanto pelo incentivo acadêmico para a realização deste
trabalho.
Finalmente, de coração, minha gratidão a todos os meus amigos que fiz durante o mestrado e durante
minha estadia neste único e formoso país, como é o BRASIL. A cada um de vocês sempre os terei
presente na minha mente e no meu coração. Obrigada por tudo AMIGOS! ... Que vossa luz brilhe
para sempre...
“Ainda que se tenha na natureza árvores com
ramos mais altos que outros, as almas de igual
nobreza têm a mesma origem.”
E. Gladys Cutipa A.
xii
xiii
Agradecimentos
AGRADEÇO AO PROGRAMA CAPES RH-TVD DA COORDENAÇÃO DE
APERFEIÇOAMENTO DE PESSOAL DE NÍVEL SUPERIOR TANTO PELO APOIO
FINANCEIRO QUANTO PELO INCENTIVO ACADÊMICO PARA QUE ESSE TRABALHO
PUDESSE SER REALIZADO.
xiv
xv
Sumário Pag.
Lista de Figuras xix
Lista de Tabelas xxiii
Lista de Abreviaturas xxv
Lista de Símbolos xxix
CAPITULO I : INTRODUÇÃO ............................................................................................................ 33
1.1 Origem e evolução das imagens médicas 35
1.2 Objetivos 37
1.3 Organização da dissertação 38
1.4 Contribuições do trabalho 38
CAPITULO II: PROCESSAMENTO DE IMAGENS .......................................................................... 41
2.1 Imagem digital 42
2.1.1 Representação de imagem digital 44
2.2 Amostragem e quantização de uma imagem 45
2.3 Resolução espacial e profundidade da imagem 46
2.4 Armazenamento de imagem digital 48
2.5 Classes de imagem digital 51
2.5.1 Imagem digital multibanda 51
2.5.2 Imagem colorida 52
2.5.3 Imagem digitais multidimensionais 52
2.5.3.1 Imagens médicas 53
2.5.3.2 Imagens tomográficas 56
CAPITULO III: COMPRESSÃO DE IMAGENS ................................................................................ 63
3.1 Modelos de compressão de imagens 65
xvi SUMÁRIO
3.1.1 O codificador e decodificador de imagem 65
3.1.2 O codificador e decodificador de imagem 66
3.2 Medidas de compressão e critérios de fidelidade 67
3.2.1 Medidas de compressão 67
3.2.2 Critérios de fidelidade 68
3.2.2.1 Critérios objetivos 68
3.2.2.2 Critérios qualitativos 70
3.3 Métodos de compressão de imagens 70
3.3.1 Compressão de imagens sem perdas ou reversível 70
3.3.1.1 Compressão sem perdas por métodos padrões 71
3.3.1.2 Métodos específicos de compressão sem perdas 81
3.3.2 Compressão de imagens com perdas 84
3.3.2.1 Quantificação 86
3.4 Compressão de imagens médicas baseadas em DCT 90
3.5 Compressão fractal 93
CAPITULO IV: TW NA COMPRESSÃO DE IMAGENS .................................................................. 97
4.1 Antecedentes 98
4.2 Wavelet 99
4.3 Transformada wavelet 103
4.4 Aplicação no processamento de imagens biomédicas 105
4.5 Compressão de imagens utilizando WT 106
4.6 Transformada wavelet discreta (DWT) 107
4.7 Transformada rápida wavelet (RWT) 108
4.8 Transformada wavelet em duas dimensões 109
4.9 Propriedades wavelets 112
4.10 Propriedades wavelet no contexto de aplicações biomédicas 115
4.11 Aplicações à tomografia assistida por computador (CAT) 117
4.12 Seleção efetiva das características wavelets 119
4.12.1 Seleção da função wavelets 120
4.12.2 Ordem e longitude dos filtros 120
4.12.3 Número de decomposições 121
4.12.4 Complexidade computacional 121
4.13 Wavelets adequadas para a compressão 122
CAPITULO V: PADRÃO DICOM ..................................................................................................... 125
5.1 Definições 126
SUMÁRIO xvii
5.2 Aspectos relevantes de DICOM 127
5.3 Imagens DICOM 131
5.4 Definições dos objetos de informação 131
5.5 Estrutura do arquivo DICOM 135
5.5.1 Conjunto de dados 135
5.5.2 Imagens 137
5.5.2.1 Modelo de imagem (IOD composto) 137
5.5.2.2 Paciente 138
5.5.2.3 Estudo 138
5.5.2.4 Série 138
5.5.2.5 Imagem 139
5.6 Características das imagens DICOM 139
5.6.1 Codificação das imagens 139
5.7 Classes de serviço 141
5.8 Compressão de dados padrão 142
5.8.1 Compressão no padrão DICOM 142
5.8.1.1 Codificadores DICOM recomendados 142
CAPITULO VI: CODIFICAÇÃO ROI ............................................................................................ 145
6.1 Região de interesse 146
6.2 Codificação ROI 147
6.3 Geração da máscara ROI 149
6.4 Métodos de codificação ROI em imagens médicas fixas 2-D 149
6.4.1 Métodos de dimensionamento geral 149
6.4.2 Método MaxShif 150
6.4.3 Método de MSBShift (Most Significant Bit-plane Shift) 153
6.4.4 Método BbBShift (Bit-plane-by-Bit-plane Shift) 154
6.4.5 Codificação baseada em objetos com transformada wavelet adaptativa 155
6.4.5.1 Particionamento hierárquico em árvores baseado em objetos (OBSPIHT) 156
6.5 Codificação ROI em imagens médicas volumétricas 157
CAPITULO VII: RESULTADOS ....................................................................................................... 161
7.1 Banco de dados 161
7.2 Escolha dos métodos de representação em compressão de imagens 161
7.3 Codificação sub-banda 162
7.4 Decomposição multiresolução 163
7.5 Esquemas de codificação de coeficientes wavelets 163
xviii SUMÁRIO
7.6 Análises da efetividade de compressão 163
7.7 Metodologia de teste, aquisição de dados e resultados 164
CAPITULO VIII: CONCLUSÕES ..................................................................................................... 175
Trabalhos Futuros 177
Referências Bibliográficas 179
A Apêndice A: Interações em DICOM 199
A.1 Sequência de interações clientes/servidor baseada na web e no arquivo DICOM 199
A.2 Codificação de imagens DICOM 200
B Apêndice B: Geração da máscara 203
B.1 Geração da máscara ROI 203
B.2 Geração da máscara pai (PROI) da ROI 204
B.3 Aplicação do modelo de compressão da Fig.A.3 a uma imagem CT 206
B.4 Medidas objetivas e qualitativas 207
B.5 ROI com diferentes níveis de resolução 208
C Apêndice C: SPIHT 211
C.1 Algoritmo SPIHT 211
D Apêndice D: 215
D.1 Aplicações de diferentes métodos de codificação ROI em imagens médicas 215
D.2 Comparação das características das técnicas de codificação ROI 216
xix
Lista de Figuras
Fig.2.1 Diagrama de formação da imagem.
Fig.2.2 a) Imagem digital da mão de um paciente com encondroma; b) Ampliação da área de uma das
articulações; c) Valores de intensidade na região em b); d) Nível de quantificação.
Fig.2.3 Imagem monocromática de Lenna.
Fig.2.4 Ponto indicado sobre o olho da Lenna (à esquerda. Matriz de pixels em uma região de interesse
de 10x10 pixels em torno do ponto indicado (à direita).
Fig.2.5 Imagens da Lenna de 256 níveis de cinza: (a) 256 x 256 pixels, (b) 128 x 128 pixels e (c) 68 x
68 pixels.
Fig.2.6 Imagens da Lenna de 256 x 256 pixels:
a)16 níveis de cinza, b) 8 níveis de cinza, c) 2 níveis de cinza.
Fig.2.7 a) Imagem de dimensão 64x64 pixels; b) Imagem de dimensão 128x128 pixels; c) Imagem de
dimensão 256x256 pixels.
Fig.2.8 Estrutura do processamento de imagem.
Fig.2.9 Gráfico da demanda de uma imagem ao longo do tempo.
Fig.2.10 a) Uma imagem com n bytes por pixel, b) n bandas com um byte por pixel.
Fig.2.11 Modalidades de imagens médicas.
Fig.2.12 Classificação das diferentes modalidades de imagem médica com relação ao tipo de fonte de
energia utilizada para geração de imagens.
Fig.2.13 Diagrama de bloco genérico de um típico sistema de imagem médico eletrônico moderno;
Fig.2.14 a) Corte axial, b) Processo de aquisição da imagem tomográfica.
Fig.2.15 Fase de varredura ou de exploração.
Fig.2.16 Formato da imagem.
Fig.2.17 Representação da imagem através de voxels.
Fig.2.18 Valor numérico da CT.
Fig.2.19 Esquema analítico da reconstrução tomográfica.
Fig.3.1 Modelo de sistema de compressão genérico de imagem.
Fig.3.2 Etapas do codificador da imagem original.
Fig.3.3 Etapas do decodificador do arquivo para imagem.
Fig.3.4 Predição espacial usado por FELICS.
Fig.3.5 Modelo probabilístico usado em FELICS.
Fig.3.6 Compressor - Expansor (Descompressor) JPEG sem perdas.
Fig.3.7 Contexto de predição espacial usado por JPEG.
xx LISTA DE FIGURAS
Fig.3.8 Contexto de predição espacial usado por LOCO-I.
Fig.3.9 a) Abdominal original MRI (512x512x16 bits); b) Classificação fuzzy dentro de 3 conjuntos
baseado sobre a intensidade do pixel ; c)Imagem reconstruída após uma compressão reversível
preditiva dos pixels em todos os outros conjuntos TC=7,4.
Fig.3.10 a) Exploração de cima para baixo a partir do ponto P0; b) Exploração de baixo para cima a
partir de P1; c) Exploração de cima para abaixo a partir de P2.
Fig.3.11 Esquema de quantização vetorial.
Fig.3.12 Codificador sequencial básico definido no padrão JPEG.
Fig.3.13 Ordenação dos coeficientes transformados antes da codificação de Huffman.
Fig.3.14 Exemplo do sistema de função iterativa.
Fig.3.15 Primeiras 4 cópias geradas pela fotocopiadora.
Fig.3.16 Exemplos de similaridade das regiões R1 e R2.
Fig.4.1 a) Função escala de Haar; b) Função wavelet de Haar.
Fig.4.2 Função wavelet de Morlet.
Fig.4.3 a) Função escala de Meyer; b) Função wavelet de Meyer.
Fig.4.4 Banco de filtro de análises da FWT.
Fig.4.5 Banco de filtro de sínteses da FWT-1
.
Fig.4.6 Diagrama esquemático da transformada wavelet 2D.
Fig.4.7 a) Imagem original Lena; b) Imagem Lena depois da decomposição.
Fig.4.8 Wavelets como um banco de filtros. Reconstrução do filterbank discreto sem subamostragem.
Fig.4.9 Resposta da frequência multibanda do filterbank discreto associado com a wavelet Battle-
Lemarie spline cúbica.
Fig.4.10 Operadores de tomografia básica. a) A projeção tomográfica Rθf(t) é a coleção de integrais
de raios paralelos através do objeto f na direção especificada por θ e a transformada Radon é o
conjunto de todas as projeções angulares para θє[0,π]; b) O operador de retroprojeção fornece
um mapeamento reverso do domínio Radon que volta ao domínio objeto. Especificamente,
(R*p)(x) representa a média angular de toda projeção P(t,θ) originada pelo ponto x.
Fig.5.1 Esquema (entidade-relação) da definição de DICOM;
Fig.5.2 Esquema das capas de DICOM.
Fig.5.3 Relação IODs e atributos.
Fig.5.4 Modelo de informação DICOM para uma instância composta.
Fig.5.5 Exemplo de um IOD de imagem composto.
Fig.5.6 Estrutura DICOM de um conjunto de dados e de um elemento de dados.
Fig.5.7 Exemplo de mapeamento de uma imagem de CT.
Fig.5.8 Estrutura maior do modelo de informação DICOM.
Fig.6.1 Diagrama de fluxo para compressão de ROI.
Fig.6.2 Imagem onde se seleciona a região ROI e a região de fundo (Background - BG).
Fig.6.3 Diagrama de blocos da codificação ROI.
Fig.6.4 a) Compressão da imagem completa; (b) Método baseado na escala geral ROI; (c) Método
MaxShift.
LISTA DE FIGURAS xxi
Fig.6.5 A transformada wavelet inversa com um filtro wavelet 5/3 reversível. Coeficientes adicionais
que são necessários para reconstrução das amostras da imagem dentro do objeto são marcados
em verde.
Fig.6.6 Fluxograma do processo de codificação ROI MaxShift. 1) O conjunto de coeficientes
wavelets que pertencem a ROI é determinado; 2) O valor de escala (s) e a magnitude do maior
coeficiente de wavelet não na ROI, ou seja, contida no fundo, são calculados; 3) Os
coeficientes de fundo são reduzidos para baixo por s; 4) O valor de s é adicionado ao fluxo de
bits; 5) A codificação de entropia bit-plano é aplicada.
Fig.6.7 Método BbBShift com S1=4 e S2=5 (Os planos são representados pelas barras em cinza).
Fig.6.8 Transformada wavelet adaptativa unidimensional com extensão simétrica.
Fig.7.1 Esquema da metodologia utilizada.
Fig.7.2 Imagens comprimidas usando a wavelet Bior. 6.8.
Fig.7.3 Avaliação comparativa com diferentes wavelets 1.Nr.
Fig.7.4 Avaliação comparativa com diferentes wavelets Bior. 3.Nr.
Fig.7.5 Avaliação comparativa com diferentes wavelets Bior. 4.4, 5.5, 6.8.
Fig.7.6 Avaliação comparativa com diferentes wavelets Bior. 1Nr.
Fig.7.7 Avaliação comparativa com diferentes wavelets Bior 2.Nr.
Fig.7.8 Avaliação comparativa com diferentes wavelets Bior 3.Nr..
Fig.7.9 Avaliação comparativa com diferentes wavelets.
Fig. A.1 Estrutura básica e sequencia de interações entre cliente e servidor baseada na web e no arquivo
do padrão DICOM, para compressão de imagem médica e sistema visualizador DICOM em
aplicações de teleradiologia.
Fig. A.2 Passos de transformação de dados para o formato DICOM.
Fig. A.3 (a) Diagrama de compressão da imagem DICOM. (b) Diagrama de reconstrução da
imagem DICOM.
Fig. B.1 Diagrama de geração da máscara ROI.
Fig. B.2 Geração da máscara ROI para uma ROI.
Fig. B.3 Transformada wavelet inversa 9/7. Os coeficientes necessários para reconstruir X(2n) e
X(2n+1) são L(n-1) a L(n+2) e H(n-2) a H(n+2), respectivamente.
Fig. B.4 Exemplo de geração da máscara PROI da máscara ROI. (a) Relação de uma máscara PROI com
uma máscara ROI. (b) Exemplos de máscaras ROI e PROI.
Fig. B.5 Modelo de compressão da Fig.A.3 para uma imagem DICOM CT.
Fig. B.6 Medida objetiva para uma imagem DICOM CT com e sem ROI.
Fig. C.1 Exemplo de dependência pai-filho na árvore de orientação espacial.
xxiii
Lista de Tabelas
Tabela 2.1 Quadro que indica as propriedades típicas de imagens e arquivos de imagem adquirida na rotina
clínica através de vários métodos e em diferentes órgãos.
Tabela 2.2 Modalidades de imagens médicas.
Tabela 3.1 Escala dos critérios de valores.
Tabela 3.2 Preditores empregados pelo padrão JPEG sem perdas.
Tabela 4.1 Propriedades de algumas wavelets.
Tabela 5.1 Módulos de IOD, em uma imagem de CT.
Tabela 5.2 Alguns atributos do módulo paciente.
Tabela 5.3 Elemento de dados que pertencem ao módulo “pixels da imagem”.
Tabela 5.4 Implementação da sintaxe de transferência do padrão JPEG.
Tabela 7.1 Wavelets utilizadas na compressão de imagens DICOM.
Tabela 7.2 Desempenho dos algoritmos SPIHT e EZW baseado nas medidas de compressão; tamanho da
imagem TAC 512x512 (256 KB) e taxa = 0,5 bpp.
Tabela 7.3 Desempenho dos algoritmos SPIHT e EZW baseado nas medidas de erro; taxa = 0,5 bpp.
Tabela 7.4 Medidas de erro com as wavelets bi ortogonais cujos critérios de fidelidade foram às melhores.
Nível de decomposição l=9, taxas = 0,4, 0,5 e 0,6 bpp.
Tabela 7.5 Resultados com nível de decomposição l = 4, taxa = 0,5 bpp.
Tabela 7.6 Resultados com nível de decomposição l=5, taxa = 0,5 bpp.
Tabela 7.7 Medidas de erro com as wavelets selecionadas com nível de decomposição l=5, taxas 0,4, 0,6,
0,8 e 0,9 bpp.
Tabela 7.8 Medidas de erro com as wavelets selecionadas com nível de decomposição l=6, taxas 0,4, 0,6,
0,8 e 0,9 bpp.
Tabela 7.9 Medidas de erro a varias taxas de bits para um nível de decomposição wavelet l = 4.
Tabela D.1 Visão geral das técnicas de codificação ROI, apresentando as referências relacionadas.
Tabela D.2 Comparação das características das técnicas de codificação ROI. A comparação inclui o número
de coeficiente necessário para codificar a ROI e a imagem.
xxv
Lista de Abreviaturas
ACR American College of Radiology
A/D Analógico/Digital
AC Alternate Current
BbBShift Bit Plane by Bit Plane Shift
BW Biorthogonal Wavelet CT Computed Tomography
CAT Computed Axial Tomography
CR Computed Radiography
CWT Continuous Wavelet Transform
CW Coiflet Wavelets
DF Digital Fluoroscopy
2D-DWT Two Dimensional Discrete Wavelet Transform
DICOM Digital Imaging and Communications in Medicine
DIMSE DICOM Message Service Element
DWT Discrete Wavelet Transform
DW Daubechies Wavelets
DSA Digital Subtraction Angiography
DWT Discrete Wavelet Transform
DC Direct Current
EEG Electroencephalography
EBCOT Embedded Block Coding with Optimal Truncation
FMRI Functional Magnetic Resonance Image
FOV Field Of Vision
FWT Fast Wavelet Transform
FBI Federal Bureau of Information
FFT Fast Fourier Transform
FWT Fast Wavelet Transform
FPB Filtro Passa Baixas
FPA Filtro Passa Altas
FIR Finite Impulse Response
HIS Hospital Information Systems
HW Haar Wavelets
xxvi LISTA DE ABREVIATURAS
IOD Information Object Definition
IE Information Entity
ISO International Standards Organization
IOM Integrated Object Model
ICWT Inverse Continuous Wavelet Transform
IIR Infinite Impulse Response
IDWT Inverse Discrete Wavelet Transform
JPEG Joint Photographic Experts Group
JPEG200 JPEG committee in 2000
LBG Linde Buzo Gray
LJPEG Lossless JPEG
LSP List of Significant Pixels
LIP List of Insignificant Pixels
LIS List of Insignificant Sets of Pixels
MRI Magnetic Resonance Image
MA Multiresolution Analysis
MaxShift Maximum Shift
MSBShift Most Significant Bit-plane Shift
MSE Mean Square Error
MPEG-2 Moving Pictures Experts Group-2
NEMA National Electrical Manufacturers Association
OBSPIHT Object Based SPIHT
PACS Picture Archiving and Communication System
PET Positron Emission Tomography
PDI Processamento Digital de Imagens
PDS Processamento Digital de Sinais
PSNR Peak Signal to Noise Ratio
RIS Radiology Information Systems
RSNA Radiological Society of North America
ROI Region Of Interest
RC Radiografia Computadorizada
ROC Receiver Operating Characteristic
RV Representation Value
SISO Soft-Input Soft-Ouput
SOP Service Object Pair
SCP Service Class Provider
SCU Service Class User;
SPECT Single Photon Emission Computed Tomography
SPIHT Set Partitioning In Hierarchical Trees
SB-ROI Scaling Based ROI
SNR Signal to Noise Ratio
SC Service Class SADWT Shape Adaptive Discrete Wavelet Transform
LISTA DE ABREVIATURAS xxvii
TCP/IP Transmission Control Protocol / Internet Protocol
TIFF Tagged Image File Format
TWC Transformada Wavelet Contínua
TWCI Transformada Wavelet Contínua Inversa
TWD Transformada Wavelet Discreta
TWDI Transformada Wavelet Discreta Inversa
TWD-2D Transformada Wavelet Discreta Bi-Dimensional
TC Tomografia Computadorizada
TSUID Transfer Syntax Unique Identification
UID Unique Identifier
US UltraSound
VLSI Very Large Scale Integration
VM Value Multiplicity
WT Wavelet Transform
WADO Web Access to DICOM Persistent Objects
xxix
Lista de Símbolos
x, y Coordenadas espaciais da função bidimensional f(x,y)
M,N Linhas e colunas de uma matriz MxN
n Número máximo de níveis e faixa
d(x) Resolução horizontal
d(y) Resolução vertical
log2 Logaritmo de um número na base 2
Vj Espaço de escala 2j
φ(t) Função escala
ψ(t) Função wavelet
L2 (ℜ) Espaço das funções mensuráveis de Lebesgue de quadrado integrável
𝑡 Transformada de Fourier de ψ
⟨ ⟩ Produto interno de f e g
hn Coeficientes dos filtros gerados pela função φ
gn Coeficientes dos filtros gerados pela função ψ
Ck Classe das funções com derivadas contínuas até a ordem k
(Wψx) Transformada wavelet contínua de uma função x com relação a ψ
a Parâmetro de escala da função wavelet
b Parâmetro de translação da função wavelet
ℜ Conjunto dos números reais
Z Conjunto dos números inteiros
Wj Complemento ortogonal de Vj
⊕ Soma direta de conjuntos
αj Seqüência de cortes do filtro passa-baixa
H(t) Filtro passa-baixas
G(t) Filtro passa-altas
Cj Coeficientes de aproximação do nível j da TWD
dj Coeficientes de detalhe do nível j da TWD
* Operação de convolução
xxx LISTA DE SÍMBOLOS
(↑2) Operador de dizimação de ordem 2
(↓2) Operador de inserção de ordem 2
λ Limiar usado para a filtragem de sinais
σ Estimativa de ruído
xxxi
Publicações
1. CUTIPA, E. G.; IANO, Y.; ARTHUR, R.; Métodos de codificação ROI para
compressão de imagens DICOM. Revista Ensaios e Ciência. Dez.2011. (Aceito).
2. CUTIPA, E. G.; IANO, Y.; Uma proposta de uso da codificação ROI no padrão
DICOM (Digital Imaging and Communications in Medicine) . Revista C. Exatas e
Tecnologia. (Submetido).
3. CUTIPA, E.G.; IANO, Y.; THIBAULT, J.; DICOM Image Compression with ROI Coding
and Wavelet Transform. The Canadian-based Cyber Journals (Area in Health Informatics
(JSHI)). (Submetido).
Outras publicações pessoais:
1. E. Gladys Cutipa A.; Diseño de modelo óptimo para regulación de transito urbano
por simulación. Tesis publicada por la UNSAAC (Universidad Nacional de San
Antonio Abad Del Cusco). Mar. 2005.
2. E. Gladys Cutipa A.; Tres paradigmas un sólo fin: La calidad del software. Revista
del Colegio de Ingenieros del Perú, Departamental CUSCO. Ene. 2006.
3. E. Gladys Cutipa A.; El enemigo interno de los PC´s, ineludible o simplemente
eludible. Revista del Colegio de Ingenieros del Perú, Departamental CUSCO.
Agos.2007.
4. E. Gladys Cutipa A.; El mundo de base de datos Fuzzy. Revista del Colégio de
Ingenieros del Peru, Departamental CUSCO. Ene.2008.
33
Capítulo 1
Introdução
avanço vertiginoso da tecnologia digital nos últimos anos, tem provocado um
desenvolvimento explosivo nas telecomunicações. Concomitantemente, criou-se uma série de
novos serviços o que permitiu a melhoria dos já existentes. Na literatura de processamento de
sinais, uma função é chamada de sinal [1]. Os sinais, em geral, são fontes de informações. Em
particular, as imagens representadas na forma digital, são tipos de sinais cada vez mais
presentes em nosso cotidiano. Esse fato tem despertado a necessidade de processamentos
indispensáveis, tanto em imagens mais simples (entretenimento) quanto em aplicações mais
importantes (imagens biomédicas) [2].
O termo ‚sinal‛ est{ associado a um fenômeno, que pode ocorrer no tempo contínuo.
Por exemplo, no caso da fala digitalizada, o tempo é uma variável discreta [3]. É possível, por
meio de processamento de imagens que algumas informações sejam disponibilizadas para
uma determinada aplicação. Pode-se citar, por exemplo, a medicina que exige diagnósticos
precisos. Nesse caso, faz-se uso de análise de bordas e análises estatísticas com qualidade, das
informações disponíveis [4].
Os diversos tipos de sinais gerados e a variedade de métodos de obtenção dos
mesmos, muitas vezes acarretam perda da qualidade. A maioria dos sinais é afetada por
algum tipo de ruído. Por exemplo, ao adquirir uma imagem, o meio em que ela se encontra
ou o dispositivo que a captura, podem influenciar na qualidade da imagem obtida. Assim,
O
N
34 Capítulo I - INTRODUÇÃO
uma imagem de baixa qualidade pode ser gerada, com aspectos que comprometem uma boa
análise por parte do observador. Um processamento de sinais visa, de modo geral, melhorar
a qualidade de um sinal para possíveis análises. Uma das aplicações de processamento de
sinais é a compressão, com o objetivo de um armazenamento eficiente, com baixo custo
computacional. Por outro lado, o avanço da tecnologia da informação (IT) tem facilitado o
desenvolvimento de análise de imagens médicas digitais. Esse desenvolvimento
principalmente ocorre na CT (Computadorized Tomography), imagem de MRI (Magnetic
Resonance Imaging) e em diferentes processos digitais para geração de imagens radiológicas
vasculares, cardiovasculares e contrastes. Todos esses processos produzem quantidades cada
vez maiores de imagens.
Esses processos criam um problema na transmissão das imagens dentro dos
centros de saúde ou de um estabelecimento para outro, relativo à questão de armazenamento
e arquivamento. Sabe-se que, as técnicas de compressão são úteis para grandes quantidades
de dados em questão. Assim, colocar imagens em sites, torna-se prático porque se usam
algoritmos de compressão de dados. A compressão de dados, que por muito tempo foi
o domínio de um grupo relativamente pequeno de engenheiros e cientistas, é agora
onipresente.
As instituições médicas não estão à margem desse avanço e estão cada vez mais
próximas da tecnologia de informática e de redes de comunicação de dados. Como
consequência disso, introduziu-se o sistema PACS (Picture Archiving and Communication
Systems). Esse sistema abriu a possibilidade de armazenamento e transmissão de imagens
médicas geradas por equipamentos pertinentes. Dessa forma, consegue-se um acesso rápido e
eficaz das informações desejadas [5]. Uma vez que os sistemas PACS são compostos de
equipamentos de diferentes fabricantes, torna-se necessário um padrão para transferência
dessas informações. O padrão adotado mundialmente é conhecido como DICOM (Digital
Imaging and Communications in Medicine). Assim, o DICOM procura suprir as necessidades de
integração dos equipamentos médicos.
Capítulo I - INTRODUÇÃO 35
1.1 Origem e evolução das imagens médicas
Antes do desenvolvimento das imagens médicas, os médicos diagnosticavam e
tratavam sem ver o ‚interior‛ do paciente, exceto através de uma cirurgia exploratória.
No século XVIII, a medicina surge como ciência, fisiologia e fisiopatologia baseadas na
exploração física e em algumas provas analíticas rudimentares.
Raios-X
• 1895: W.Rontgen descobre os raios-X e recebe um prêmio Nobel em Física em 1901.
• 1896: primeira aplicação clínica por John Cox (Montreal).
• A radiografia convencional, inicialmente utilizava alta dosagem e período de exposição
10 min. (placa do crânio). Hoje, o tempo de exposição é de milissegundos e a dose é 50
vezes menor.
• 1970: a radiologia digital substitui a placa fotográfica pelo detector eletrônico de alta
resolução. Isso significa menos radiação para o paciente. Fácil armazenamento e
gerenciamento.
Tomografia Computadorizada (TC ou CT)
• 1917: J. Radón implanta a teoria da reconstrução tomográfica, que é aperfeiçoada mais
tarde por A. Cormack em 1963.
• 1973: o engenheiro britânico G. Hounsfield constrói a primeira equipe de CT
(Computadorized Tomography).
• 1975: inicia-se o uso clínico.
• 1979: concede-se um prêmio Nobel de Medicina e Fisiologia a Hounsfield e Cormack.
• Avanço atual: CT helicoidal, maior velocidade de aquisição e menos dose. Endoscopia e
angiografia não invasiva.
36 Capítulo I - INTRODUÇÃO
Ecografia (imagem ultrasônica)
• 1912: após o naufrágio do Titanic, L.F. Richardson faz uso de ecos ultrassônicos para
detectar objetos submergidos.
• 1942: Karl Dussik tenta detectar tumores cerebrais registrando o passo do feixe de som
através do crânio. Tenta identificar os ventrículos através da medição da atenuação do
ultrassom através do crânio, que ele chama de ‚Hiperfonografía do cérebro‛.
• 1949: publicou-se uma técnica de eco pulsado para detectar cálculos e corpos estranhos
intracorpóreos.
• 1957: o Dr. Donald inicia estudos obstétricos a partir dos ecos provenientes do crânio
fetal. Desenvolveram-se os calipers (cursores eletrônicos).
• 1977: Kratochwil combina a ultrassonografia e a laparoscopia. A técnica é estendida para
examinar fígado, vesícula biliar e pâncreas.
• 1983: Aloka introduz na indústria o primeiro equipamento de doppler a cor que permitiu
visualizar em tempo real, o fluxo de sangue. Desde então, o progresso de ultrassom tem
sido lento.
• 1994: o Dr. Gonzalo E. Diaz introduz o pós-processamento em cor para diagnóstico por
imagem que pode ser estendido a qualquer imagem.
Imagem Nuclear
• 1930: inicia-se a aplicação clínica da imagem nuclear no tratamento oncológico.
• 1950: David E. Kuhl e Edwards Roy apresentam o conceito de SPECT (Single Photon
Emission Computed Tomography).
• 1990: surge um novo tomógrafo chamado PET (Positron Emission Tomography), que opera
com base na emissão de pósitrons. Facilita criar imagens com maior precisão e obtém
melhor visualização do metabolismo do oxigênio, glicose, proteínas e ácidos graxos.
• 1998: Bruce Hasegawa (da universidade de Califórnia) chega a combinar imagens com
SPECT e CT.
Capítulo I - INTRODUÇÃO 37
Imagem de MRI (Magnetic Resonance Imaging)
• Origens em 1929: Isidor Isaac Rabi (prêmio Nobel de física 1944). Feixe de moléculas
sofre a influência de campos magnéticos, inversão da magnetização ou ressonância.
• 1946: Felix Block e Edward Purcell desenvolvem técnicas de ressonância magnética em
sólidos e líquidos. Prêmio Nobel em 1952.
• 1973: Lauterbur Paul produz uma imagem anatômica mediante gradiente espacial.
Prêmio Nobel em 2003.
• 1989: Peter Mnasfield introduz a técnica EPI, de aquisição rápida. Excelente contraste em
tecidos moles e boa resolução espacial.
Padrão DICOM
• 1983: trabalho inicial.
• 1985: o primeiro padrão ‚ACR-NEMA 1.0‛ foi lançado.
• 1990: somente dois fabricantes mostram conectividade em equipamentos comerciais.
• 1993: ISO (International Standard Organization) aprova o padrão DICOM.
• 1994: DICOM é um padrão ‚vivo‛ com novas peças e suplementos publicados
continuamente.
• Hoje: todas as empresas projetam seus equipamentos para atender o padrão DICOM.
DICOM tem sido um sucesso do ponto de vista comercial e do usuário.
1.2 Objetivos
• A incorporação de uma codificação ROI dentro das técnicas de compressão de
imagens DICOM para armazenar e compartilhar informação médica via redes de
comunicação, os PACS.
38 Capítulo I - INTRODUÇÃO
• Aplicação da WT (Wavelet Transform) na compressão de imagens DICOM que,
mediante a an{lise multiresolução faz que a WT seja uma ferramenta eficiente no
processamento de imagens.
1.3 Organização da dissertação
O presente trabalho é desenvolvido por etapas. Na primeira fase se faz uma breve
introdução. Na segunda fase, realiza-se um estudo do estado de arte de processamento de
imagens. Seguem-se informações para compressão de imagens.
Na quarta fase, se aborda o tema da transformada wavelet para compressão de imagens, base
fundamental do presente trabalho.
Na quinta fase, apresenta-se o padrão DICOM e seus aspectos relevantes.
Na sexta fase, se aborda a codificação ROI e sua aplicação em imagens médicas 2D e
volumétricas. Finalmente, se aborda a proposta, resultados e conclusões.
1.4 Contribuições do trabalho
• A incorporação da codificação ROI dentro das técnicas de compressão de imagens
DICOM.
• A aplicação da WT facilita a compressão de imagens DICOM por dar diferentes tipos
de suporte de flexibilidade, codificação de regiões de interesse, qualidade e
escalabilidade de resolução.
Comentários
• A compressão geralmente baseia-se na eliminação de redund}ncias do sinal através
do uso de alguma transformada, geralmente transformadas integrais. No presente
trabalho, se fiz uso da transformada wavelet, por se tratar de uma ferramenta muito
vers{til e de conteúdo matem{tico muito rico. Quando um sinal é analisado com a
Capítulo I - INTRODUÇÃO 39
transformada wavelet, torna-se possível saber exatamente quando começa e quando
termina um determinado evento. Esse é o principal objetivo da transformada wavelet.
• Como se sabe, o sistema de armazenamento tem como objetivo a otimização do
espaço computacional, tanto para armazenamento quanto para transmissão de
imagens. Essa é a razão pela qual o trabalho baseou-se no padrão DICOM, formato
que faz uso dos PACS para compartilhar uma informação médica através de redes de
comunicação.
• Por outro lado, no presente trabalho se fiz um estudo e an{lise das principais técnicas
de compressão de imagens médicas.
• O trabalho baseou-se no padrão DICOM porque o formato fornece soluções globais
dentro e fora do hospital. Este, facilita a integração nos sistemas de informação como:
os HIS (Hospital Information Systems), RIS (Radiology Information Systems).
41
Capítulo 2
Processamento de imagens
PDI (Processamento Digital de Imagens) é uma sub{rea do PDS (Processamento Digital
de Sinais). O PDS incorpora a execução de operações matem{ticas, com objetivo de extrair
informações que geralmente representam um fenômeno a ser estudado de forma específica.
No processamento de uma imagem são realizados muitos c{lculos de forma r{pida e segura
para que o observador ou o computador possam analisar ou possam realçar de forma precisa
essas informações.
A primeira aplicação da {rea de processamento de imagens foi na década de 20, na
tentativa de aprimorar imagens digitalizadas de um jornal para transmissão, entre Londres e
Nova Iorque. O tempo necess{rio para essa transmissão era de uma semana. O sistema
Bartlane de transmissão de imagens por cabo submarino conseguiu reduzir a transmissão
para três horas *6+. Avanços expressivos na {rea ocorrem apenas com o advento dos
computadores digitais três décadas mais tarde. Acontece uma evolução da tecnologia
computacional, com informações de multimídia e sinais bidimensionais, cada vez mais
presentes em nosso cotidiano.
O processamento de imagens surge com o objetivo de suprir as necessidades de
an{lise e compactação de informações, tornando-se assim uma ferramenta essencial no
mundo moderno, cuja demanda de processamento é relativamente crescente *7+.
Um dos principais interesses na {rea de processamento digital de imagens é a
necessidade de melhorar a qualidade da informação visual para a an{lise humana. Surgem
O
N
42 Capítulo II- PROCESSAMENTO DE IMAGENS
assim, v{rias técnicas e aperfeiçoamentos para um ganho de velocidade, precisão,
simplicidade e poder de processamento com um baixo custo computacional. São técnicas hoje
aplicadas em v{rias {reas do conhecimento humano. Tem-se, por exemplo, as {reas de
medicina, engenharia, matem{tica, entre outras.
No entanto, as imagens médicas são especiais por três razões fundamentais:
• Usam uma cor cinza devido a que a maioria das imagens é gerada por aparelhos de
técnicas monocromáticas;
• Contêm uma proporção maior que o normal, de ruído;
• Muitas vezes contêm grande quantidade de pequenos detalhes. Isso pode ser devido às
texturas nas imagens, ou a uma pequena quantidade de ruído que altera nos valores
digitais.
A qualidade da imagem após uma compressão é muito importante e deve estar dentro
de um limite toler{vel, que varia de imagem para imagem e de método para método. Assim,
a compressão torna-se mais interessante, como uma parte da an{lise qualitativa de diferentes
tipos de técnicas de compressão de imagens.
2.1 Imagem digital
As imagens são vistas como exemplos de sinais gerados em nosso cotidiano que
apresentam papéis importantes. Elas podem ser desde as mais simples, usadas para
entretenimentos, até aquelas destinadas às aplicações médicas mais avançadas [8]. Uma
imagem digital pode ser definida matematicamente como uma função bidimensional do tipo
f(x,y), onde x e y são coordenadas espaciais (no plano), ou seja, é um tipo de sinal gerado no
domínio do espaço, que representa a variação da intensidade de luz e de cor do espaço.
O valor de f em qualquer par de coordenadas (x,y) é a intensidade da imagem nesse
ponto. A imagem denominada digital é uma imagem que pode ser processada de forma
direta, podendo assim ser armazenada no computador. Uma imagem analógica necessita ser
digitalizada por meio de uma discretização no tempo (amostragem) e uma discretização em
Capítulo II – PROCESSAMENTO DE IMAGENS 43
amplitude (quantização). Isso é realizado por um conversor A/D (Analógico/Digital). A
representação de uma imagem digital é dada por uma matriz M×N composta por elementos
denominados pixels. A Fig.2.1 representa o esquema da formação da imagem.
Os pixels são os menores pontos distribuídos em linhas e colunas que uma imagem
pode obter. Cada pixel contém um valor inteiro nas direções das coordenadas x e y que
representa medidas dependentes de variáveis. Como por exemplo, o nível de quantificação
que normalmente é uma potência de 2. Cada pixel pode estar associado a um valor da escala
de cinza entre 0 e 2n - 1. Quanto maior o número de pixels em uma imagem, melhor será sua
resolução, permitindo uma melhor diferenciação entre as estruturas. Na Fig.2.2 [8] tem-se um
modelo da digitalização de uma imagem radiográfica.
Muitas vezes, a digitalização da imagem pode comprometer sua qualidade.
Atualmente, existem várias técnicas de análise de imagens, visto que as imagens carregam em
seu interior determinadas informações e também capacidade para a troca dos mesmos,
possibilitando, dessa forma, a qualidade de resolução. Por outro lado, o termo, nível cinza é
usado para referir à intensidade de imagens monocromáticas. As imagens coloridas são
formadas por uma combinação de imagens individuais 2-D.
(X,Y): nos reais Amostragem
Imagem analógica
f(x,y)
Imagem digital
Pixel f(4,4) =25’345
(0,0) Pixel f(4’24,4’33) =25’345
(0,0)
f : no real Quantificação
Pixel f(4,4)=25
(0,0)
Fig.2.1 - Diagrama de formação da imagem.
44 Capítulo II- PROCESSAMENTO DE IMAGENS
H{ dois tipos fundamentais de imagem digital:
Tipo raster: (ou bitmap), é uma coleção de bits que formam a imagem. A imagem consiste
em uma matriz de pontos individuais (ou pixels) em que cada um tem a sua própria cor.
Um bitmap pode ser monocrom{tico, em escala de cinza ou colorido. Normalmente os
pixels são formados no padrão RGB (Red,Green,Blue). Tipicamente, as imagens raster são
imagens fotogr{ficas;
Tipo vetorial: As imagens vetoriais são totalmente descritas por definições matem{ticas.
Os desenhos vetoriais são ficheiros que contêm informação das curvas bezier que formam
o desenho. Imagens desse tipo são desenhos técnicos de engenharia.
2.1.1 Representação de imagem digital
Uma imagem monocromática é uma função de intensidade de luz bidimensional,
onde x e y denotam coordenadas espaciais e o valor de f no ponto (x, y) é proporcional ao
brilho (ou nível de cinza) da imagem nesse ponto (Fig.2.3)[10]. Essa função também pode ser
vista como uma superfície no espaço (x, y, z), onde para cada ponto (x, y) plota-se na
coordenada z o valor de f(x, y).
Fig.2.2 – a) Imagem digital da mão de um paciente com encondroma ; b)Ampliação da área de
uma das articulações; c) Valores de intensidade na região em b); d) Nível de quantificação [8].
Capítulo II – PROCESSAMENTO DE IMAGENS 45
2.2 Amostragem e quantização de uma imagem
Para gerar uma imagem digital, f(x, y) deve ser digitalizada ao longo de x e y, e na
amplitude z = f(x, y). Para tanto, é feita uma amostragem (normalmente uniforme) de f(x, y)
nas direções x e y, gerando uma matriz de NxM amostras, seguida de uma quantização do
valor de f(x,y) em L níveis inteiros de cinza .
Nessa matriz, cada elemento p(x, y), x = 0, 1,..., M-1 e y = 0, 1,..., N-1, é chamado pixel
(abreviação de picture elements). Diz-se então que a imagem tem dimensão M pixels na
horizontal (eixo x) e N pixels na vertical (eixo y). O conceito de dimensão de um pixel ao longo
do eixo x, ou do eixo y, está relacionado com o espaçamento físico entre as amostras. Cada
pixel tem associado um valor Lmin ≤ p(x,y) ≤ Lmax onde, L = Lmax –Lmin + 1 e assume-se, sem
perda de generalidade que Lmin = 0.
A Fig.2.4 [10] ilustra a representação matricial da imagem da Fig.2.3 em uma região de
interesse de 10x10 pixels (à direita) em torno de um ponto indicado sobre o olho da Lenna (à
esquerda). Considera-se que o processo de digitalização envolve parâmetros de amostragem
e quantização. Uma pergunta natural é: quantas amostras NxM e níveis de cinza L são
necessários para gerar uma boa imagem digital? Isso depende fundamentalmente da
quantidade de informação contida na imagem e do grau de detalhes. Esses parâmetros nos
levam aos conceitos de resolução espacial e profundidade da imagem.
Fig.2.3 – Imagem monocromática de Lenna [54].
46 Capítulo II- PROCESSAMENTO DE IMAGENS
2.3 Resolução espacial e profundidade da imagem
Seja, uma imagem f(x, y) contida em uma região retangular de 30cm em x por 20cm
em y. Caso se obtenha amostras uniformemente espaçadas a cada 1mm em x e em y
(dimensões do pixel são 1mm x 1mm), tem-se N = 200 x M = 300 amostras, ou seja, 60000 pixels.
Diz-se então que a resolução espacial da imagem é 200x300 pixels.
O número L de níveis de quantização da função f(x, y) é normalmente uma potência
de dois (L= 256, 1024, 4096). Nesse exemplo dado, tem-se L=256. Isso significa que cada pixel
pode ter associado a um valor de cinza entre 0 e 255, que requer no máximo 8 bits para ser
armazenado na memória do computador. Diz-se então que a profundidade da imagem é de 8
bits por pixel (ou 1 byte por pixel). Pode-se então observar que se necessita de 200x300x1= 60
kbytes de memória para armazenar essa imagem.
A Fig.2.5 mostra a variação de resolução espacial. Em todos os casos, o número de
níveis de cinza permanece 256. Para manter a mesma área de display da Fig.2.5a, os pixels das
imagens de mais baixa resolução são replicados.
Fig.2.4 – Ponto indicado sobre o olho da Lenna (à esquerda. Matriz de pixels em uma região de interesse de 10x10 pixels em torno do ponto indicado (à direita) [54].
Capítulo II – PROCESSAMENTO DE IMAGENS 47
A degradação quadriculada sofrida pelas imagens é devido | perda de resolução
espacial. A Fig.2.6 mostra a variação de profundidade. Em todos os casos a resolução espacial
é a mesma da imagem da Fig.2.5a, 256x256 pixels. As figuras Fig.2.6a, 2.6b e 2.6c mostram
respectivamente uma redução de profundidade de 8 bits por pixel (L=256 níveis de cinza) para
4 bits por pixel (L=16 níveis de cinza), para 3 bits por pixel (L=8 níveis de cinza) e para 2 bits
por pixel (L=2 níveis de cinza ou imagem bin{ria).
Fig.2.6 – Imagens da Lenna de 256 x 256 pixels:
(a) 16 níveis de cinza, (b) 8 níveis de cinza, (c) 2 níveis de cinza [54].
Fig.2.5 – Imagens da Lenna de 256 níveis de cinza:
(a) 256 x 256 pixels, (b) 128 x 128 pixels e (c) 68 x 68 pixels [54].
48 Capítulo II- PROCESSAMENTO DE IMAGENS
2.4 Armazenamento de imagem digital
Um aspecto de grande interesse, é o armazenamento da imagem na memória de um
computador. Um exemplo, que apresenta essa necessidade são os milhares de exames de
diagnóstico através de imagens geradas em hospitais, que em alguns casos, podem chegar a
mais de 45 Gbytes por dia [9].
Atualmente, aumentam os processos de transmissão dessas imagens através de
redes informatizadas. Esse fato, cria necessidades de se estabelecer e conhecer formatos
padronizados de processos de transmissão de dados em sistemas de rede local ou mesmo
pela internet, com rapidez e segurança. Dessa forma, isso envolve a compactação de imagens.
Porém, ao passo que melhora a qualidade visual da imagem, o volume de dados a ser
armazenado, processado ou transmitido também aumenta. Isso proporciona o aumento do
número de bits necessário para a codificação binária da imagem. O número de bits necessário
para o armazenamento de uma imagem na memória do computador é dado pela equação
seguinte [10][11] :
bits = MxNxn (2.1)
Onde:
n = log2(M),
M é o número de linhas da imagem e
N é o número de colunas da imagem.
a) b) c)
Fig.2.7 a) Imagem de dimensão 64x64pixels; b) Imagem de dimensão
128x128pixels; c) Imagem de dimensão 256x256pixels [Lv. 04].
c) Imagem de dimensão 128dpi .
Capítulo II – PROCESSAMENTO DE IMAGENS 49
Existem dois tipos de compactação, ou seja, com perda e sem perda de informações.
Cada tipo de imagem tem suas exigências quanto ao tipo de compactação. Além disso, os
arquivos de imagens digitais devem possuir um cabeçalho que contem informações do tipo:
número de linhas, número de colunas, número de bits usados na representação da imagem,
resolução horizontal (dx), resolução vertical (dy), número de bandas da imagem, tipo de
compactação usado para guardar os dados, data e hora da aquisição, tipo de sensor que
captou a imagem, dados paramétricos dos sensores, bem como outras informações
relevantes. Não obstante, para o arquivamento de dados de imagens médicas, tais como a CT
(Computadorized Tomography), MRI (Magnetic Resonance Imaging), mamografia digital e outros,
devem-se levar em consideração certos fatores. Estes são: volume dos dados a ser
armazenados; intervalo de tempo em que os dados ficarão disponíveis online; segurança de
dados; confiabilidade de base de dados e custo. A Tabela 2.1 mostra o tamanho médio das
imagens de diferentes modalidades médicas. Esse tamanho está acima de 2MB, podendo
chegar até a 192MB.
Modalidade Órgão Tamanho da
imagem
Nº de bits por
pixel Nº de fatias
Tamanho de
arquivo
Radiografia Tórax 2,060*2,060 16 - 8MB
CT
Cérebro 512*512 16 ≈300 150 MB
Abdômen 512*512 16 ≈500 250 MB
Coração 512*512 16 126*16 frames 1 GB
MRI
Cérebro 512*512 16 ≈20*6 sets 10 a 60 MB
Abdômen 512*512 16 ≈ 30 15 MB
Abdômen 3D 512*512 16 104 50 MB
Coração 256*256 16 20*20 frames 50 MB
SPECT Corpo inteiro 256*1024 16 350 50 MB
PET
Corpo inteiro 128*128 16 350 10 MB
Coração 128*128 16 47*16 frames 24 MB
Cérebro 256*256 16 47 6 MB
US Padrão 512*512 8 50 imagens/vista 12,5 MB/vista
Doppler 512*512 (RGB)3*8 50 imagens/vista 37,5 MB/ vista
Anátomo
patologia Anátomo
patologia
Em torno de
15,000*20,000 (RGB)3*8 - 858 MB
Tabela 2.1 – Quadro que indica as propriedades típicas de imagens e arquivos de imagem adquirida
na rotina clínica através de vários métodos e em diferentes órgãos [Dados do hospital ESALUD].
50 Capítulo II- PROCESSAMENTO DE IMAGENS
A Fig.2.8 mostra a estrutura do processamento de imagem desde a captura até a
compressão da imagem. As imagens armazenadas normalmente são comprimidas de forma
que ocupem menos espaço físico nos sistemas de armazenamento. As técnicas de compressão
utilizadas não podem ter nenhum tipo de perda de informação, pois qualquer perda pode ser
prejudicial para se chegar a um diagnóstico preciso.
Por outro lado, os sistemas de armazenamento de imagem devem seguir uma
estrutura hierárquica que depende da probabilidade de demanda da imagem. Em geral, as
imagens recentemente adquiridas são consultadas com frequência nos minutos seguintes da
sua aquisição e sua frequência de consultas diminui rapidamente com o tempo.
A Fig.2.9 mostra um gráfico de demanda de visualização vs. tempo. O
armazenamento de curto prazo (local) tem as seguintes características:
Fig.2.8 – Estrutura do processamento de imagem.
Gestão
Compressão
Arquivamento
Recuperação
Comunicação
Superfície reconstruída
Iluminação
Sombreamento
Display Interpretação Medicação
Extração do caráter
Segmentação
Classificação
Captura
Digitalização
Otimização
Calibração Registro
Transformação Filtragem
Capítulo II – PROCESSAMENTO DE IMAGENS 51
Dezenas de GB;
Transferência de cerca de 50 imagens por minuto;
1-15 dias de armazenamento.
2.5 Classes de imagem digital
2.5.1 Imagem digital multibanda
Em uma imagem digital monocromática, o valor do pixel é um escalar entre 0 e L. As
imagens multibanda podem ser vistas como imagens, nas quais cada pixel tem associado um
valor vetorial (vários valores associados ao mesmo pixel).
𝑥 𝑦 𝑛 (2.2)
Onde:
n = número de bandas
Em algumas aplicações pode ser um valor negativo, mas sem perda de generalidade.
Assume-se 0 como o valor mínimo de intensidade. Em geral, pode representar
temperatura, pressão, frequência, amostradas em pontos (x, y) e com intervalos de valor
completamente diferentes. No entanto, se Li, i=1, 2,..., n for igual a 256, por exemplo, teremos
Demanda
VS
Tempo
Tempo
100%
Fig.2.9 – Gráfico da demanda de uma imagem ao longo do tempo.
52 Capítulo II- PROCESSAMENTO DE IMAGENS
uma imagem com n bytes por pixel (Fig.2.10a). No caso em que a imagem multibanda é
representada como uma sequência de imagens monocromáticas pi(x,y) = li , 0 ≤ li ≤ Li - 1 , i =
1,2,..., n. (Fig.2.10b), com Li, i =1,2,...,n for igual a 256, tem-se n bandas com profundidade
1byte por pixel (Fig.2.10b).
2.5.2 Imagem colorida
Uma imagem colorida é uma imagem multibanda, onde a cor em cada ponto (x, y) é
definida através de três fatores: lumin}ncia, matiz e saturação.
A luminância: est{ associada com o brilho da luz;
O matiz: est{ associado com o comprimento de onda dominante;
A saturação: est{ associada com o grau de pureza (ou intensidade) do matiz.
A maioria das cores visíveis pelo olho humano pode ser representada como uma combinação
de três cores prim{rias: vermelho (R), verde (G) e azul (B). Assim, uma representação comum
para uma imagem colorida utiliza três bandas R, G, e B com profundidade byte por pixel.
2.5.3 Imagens digitais multidimensionais
As imagens digitais multidimensionais são uma extensão dos conceitos de imagem
digital monocromática e multibanda para uma terceira dimensão que pode ser espaço ou
banda 1
lo. pixel
banda n lo. pixel
n
1
a) b)
Fig.2.10 – (a) Uma imagem com n bytes por pixel,
(b) n bandas com um byte por pixel [54].
Capítulo II – PROCESSAMENTO DE IMAGENS 53
tempo. Isso é o mesmo que dizer que a amostragem e a quantização podem ocorrer em x, y, z
ou x, y, t, onde z ou t representam o espaço e o tempo. Portanto, uma imagem digital 3D será
representada como uma sequência de imagens monocromáticas ou multibandas ao longo do
eixo espacial ou do eixo temporal.
2.5.3.1 Imagens médicas
As imagens médicas podem ser definidas como: ‚Todas as imagens usadas para um
diagnóstico e tratamento de pacientes na atividade médica". Nessa classe, se incluem as
imagens tais como raios-X, amostras histológicas, tomografia computadorizada CT,
ultrassom, resson}ncia magnética e até mesmo fotografias de paciente. Essas últimas são
utilizadas para fins de identificação. As modalidades das imagens médicas classificam-se em:
Anatômicas Caracteriza-se por produzir imagens
de boa resolução espacial.
Caracterizam-se por fornecer
informação sobre o funcionamento
dos diferentes sistemas de órgãos. Funcionais
Classificação:
Ecografia (ultrassom)
Ressonância magnética
(Ondas de rádio)
Endoscopia (luz)
MRI
FMRI
Radiologia (Raios X)
Radiologia convencional Radiologia digital Tomografia computadorizada
Medicina nuclear (raios gamma)
PET SPECT
O elemento básico que define os diferentes modos é o tipo de energia utilizada.
Fig.2.11 Modalidades de imagens médicas.
54 Capítulo II- PROCESSAMENTO DE IMAGENS
A Tabela 2.2 mostra as siglas e nomes de imagens médicas obtidas por meios
digitais.
Cada modalidade de imagem médica varia em número e resolução de imagens produzidas
para um estudo particular de um paciente. Isso afeta diretamente o volume de dados e as
taxas de transferência necess{rias para a transmissão de imagens. Esses par}metros têm um
efeito enorme sobre o tipo de comunicação necess{rio.
Sem dúvida, o destaque das imagens médicas é que elas usam muito espaço de
armazenamento. Assim, pode-se levar algum tempo para a transmissão quando se envia os
dados através de linhas de comunicação em locais remotos, como no caso de
teleradiologia ou em muitas outras aplicações. Os tipos de dados que podem aparecer nas
imagens médicas são variados. Podem resultar a partir de imagens est{ticas, bidimensionais
(2D) como as mamografias ou tridimensionais (3D), como, imagens em movimento, tais
como ultrassom ou MRI cardíaca.
Tabla 2.2 – Modalidades de imagens médicas.
As características típicas dos dados incluídos em imagens médicas são:
A quantidade extensa de dados: O número de imagens em um conjunto de dados de
imagens médicas pode variar de 2 ou 3 para os convencionais raios-X e até 200 ou 300
CR Radiografia computadorizada.
CT Tomografia computadorizada.
DCM Microscopia a cor digitalizada.
DEM Microscopia eletrônica digitalizada.
DF Fluoroscopia digital.
DAS Angiografia de subtração digital.
EEG Eletroencefalograma.
MRI Imagem de resson}ncia magnética.
FMRI Imagem de resson}ncia magnética funcional.
PET Tomografia de emissão de pósitron.
SPECT Tomografia computadorizada de emissão de fóton simples
US Ultrassom.
Capítulo II – PROCESSAMENTO DE IMAGENS 55
para um teste de ultrassom cardíaco. Assim, a quantidade de memória em MBytes
necess{ria aumenta consideravelmente para cada an{lise.
Dados multi-dimensionais: São imagens obtidas em diferentes períodos de tempo. Essas
imagens multibanda, são aquelas em que se armazena mais de um valor para cada um
dos eixos. Por exemplo, têm-se as imagens em cores que correspondem a um conjunto de
imagens de um mesmo objeto, mas tomadas com par}metros diferentes.
Conjunto de imagens relacionadas: Quando se armazena um conjunto de imagens, é
necess{rio um mecanismo para armazenar os dados de imagem como a relação
hier{rquica entre eles. No caso de imagens médicas em movimento, os dados pertinentes
são armazenados em vídeo.
Dados parceiros: São descritores das imagens. Por exemplo, o tamanho, a resolução, a
informação de cor, dados médicos do paciente ou de imagem.
Fig.2.12 – Classificação das diferentes modalidades de imagem médica com
relação ao tipo de fonte de energia utilizada para geração de imagens [Lv. 23].
Interno Interno e externo
Externo
Modalidades de
imagem médica
Fonte de energia
utilizada para
criação de imagem
Medicina nuclear:
SPET (Single Photon
Emission Tomography).
Medicina nuclear:
PET (Positron Emission
Tomography).
Imagem de
ressonância magnética
MRI, PMRI, FMRI.
Imagens de
fluorescência óptica.
Imagens de
impedância elétrica.
Raios–X
Mamografia
Tomografia
computadorizada
Ultrasom
Transmissão optica
56 Capítulo II- PROCESSAMENTO DE IMAGENS
2.5.3.2 Imagens tomográficas
As imagens tomogr{ficas são geradas pelos equipamentos tomogr{ficos,
(tomógrafos de raios-X, resson}ncia magnética) os quais geram imagens monocrom{ticas de
cortes (ou fatias) normalmente paralelos e uniformemente espaçados em uma região dada
3D.
Tomografia Computadorizada
A tomografia é a obtenção de imagens datalhadas de cortes axiais do corpo. Para
tanto, são utilizados feixes colimadores, muito finos de raios X, que integrados a
computadores fornecem imagens sequenciais correspondentes a fatias corporais. Isso é
mostrado na Fig.2.14(a).
Fig.2.13- Diagrama de bloco genérico de um típico
sistema de imagem médico eletrônico moderno [Lv. 23].
Exibição
Processamento
digital
Armazenamento
digital
Controle do computador
Interface homem
Conversão
digital
Formação da
imagem
Fonte de energia
Fonte eletrônica Controle
eletrônico
Detector
eletrônico
Corpo Detector de
energia
Capítulo II – PROCESSAMENTO DE IMAGENS 57
O fóton, ao atravessar o corpo, é atenuado, e a leitura do sinal do detector é
proporcional ao grau de atenuação ou a grau de penetração do fóton. A leitura pode ser:
• Por secção ( ‚slice by slice‛),
• Por volume.
Fig.2.15 - Fase de varredura ou de exploração [Pw. 1].
Fig.2.14 – a) Corte axial [Lv. 7] , b) Processo de aquisição da imagem tomográfica.
a) b)
58 Capítulo II- PROCESSAMENTO DE IMAGENS
Os detectores medem em diferentes posições, a radiação transmitida através do paciente.
𝑥 (feixe homogêneo) (2.3)
Onde:
μ: Coeficiente de atenuação linear (depende do meio e da energia).
Os elementos da matriz são chamados pixels.
O campo de visão é chamado de FOV (Field of Vision) e corresponde à região na qual
as medidas de transmissão são gravadas sobre uma matriz selecionada. Tem-se:
Tamanho pixel = campo de visão/ tamanho da matriz.
Ex: matriz 512 x 512 e FOV = 25 cm. Logo, 250 mm / 512 = 0,5 mm. Assim, cada pixel
pode ter variações de cinza entre 256(28) a 4096(212).
Fig.2.17 – Representação da imagem através de voxels [54].
Fig.2.16 – Formato da imagem [Lv. 7].
Capítulo II – PROCESSAMENTO DE IMAGENS 59
Processamento de imagem tomográfica
Os números computados para reconstrução da imagem são números inteiros.
A cada pixel é atribuído um valor numérico denominado número de TC (Eq. 2.4). Esse
número está relacionado com o coeficiente médio de atenuação μ do voxel do tecido que ele
representa.
𝑁𝑜𝑑 𝑇𝐶 𝑡 𝑤
𝑤 (2.4)
Método analítico de reconstrução tomográfica
O método analítico de reconstrução tomográfica é definido pela relação:
𝑥 ∫ 𝑥 𝑦 𝑑𝑦
(2.5)
Y’
B
X’
Pθ(X’)
Y
X
A
θ
Fig.2.19 – Esquema analítico de reconstrução tomográfica.
Onde: μt = Coeficiente linear de atenuação médio do material que compõe o voxel.
μw = Coeficiente linear de atenuação da água.
Fig.2.18 – Valor numérico do CT [Pw. 2].
Pixel
(matriz
numérica)
Nº TC
Pixel (matriz tons
de cinza)
Voxel
μ
Energia do
fóton Densidade
média
60 Capítulo II- PROCESSAMENTO DE IMAGENS
Para mostrar as diferentes trajetórias AB, se considera x’ = x cos(θ) + ysin(θ) e se reescreve na
forma de uma convolução com um conjunto de funções delta de Dirac:
𝑥 ∫ ∫ 𝑥 𝑦 𝑥 𝑠 𝑦𝑠 𝑥 𝑑𝑥𝑑𝑦
(2.6)
A equação 2.6 é conhecida como o teorema do corte central.
No caso particular, em que θ = 0, tem-se:
𝑥 ∫ ∫ 𝑥 𝑦 𝑥 𝑥 𝑑𝑥𝑑𝑦
(2.7)
Obtém-se: 𝑥 ∫ 𝑥 𝑦 𝑑𝑦
(2.8)
Fazendo-se a transformada de Fourier em ambos os lados, tem-se:
𝑢 ∫ 𝑥 𝑥𝑑𝑥 ∫ ∫ 𝑥 𝑦 𝑥
𝑑𝑦𝑑𝑥
(2.9)
A transformada de Fourier bidimensional (TF) de μ é expressa por:
𝑢 𝑣 ∫ ∫ 𝑥 𝑦 𝑥 𝑥𝑑𝑦𝑑𝑥
(2.10)
Verificando a expressão (2.8) pode-se afirmar que para o }ngulo θ = 0, tem-se:
𝑢 𝑢 (2.11)
Generalizando para qualquer }ngulo θ, tem-se:
𝑢 𝜌 (2.12)
Capítulo II – PROCESSAMENTO DE IMAGENS 61
Observações:
O teorema do corte central permite ‚construir‛ no plano de Fourier M(u,v) uma
"imagem" correspondente, a partir das transformadas das projeções P(u) fazendo-se uma
associação radial espacial de seus valores.
Uma vez construída a função M, basta fazer a TF bidimensional inversa e obtem-se
uma estimativa de μ. Deve-se levar em conta o fator de resolução não homogêneo devido |
menor amostragem nas extremidades do plano.
63
Capítulo 3
Compressão de imagens
umerosas aplicações que utilizam processamento, armazenamento ou transmissão de
imagens digitais, geram um grande número de arquivos. Devido ao tamanho da imagem
resultante, essas aplicações somente são viáveis se essas tarefas puderem ser realizadas de
forma eficiente. Exemplos:
• Televisão por cabo;
• Bases de dados de publicações acessíveis eletronicamente;
• Videoconferência, fax-simile;
• Teledeteção mediante imagens via satélite;
• Imagens médicas;
• Controle remoto de veículos;
• Visão artificial.
Por outro lado, a utilização de imagens médicas digitais está presente em nosso
cotidiano. Esse uso está em crescimento na maioria dos hospitais e clínicas do mundo. Assim,
torna-se imperativo o desenvolvimento de técnicas que viabilizem o armazenamento e a
transmissão dessas imagens em redes de computadores. As imagens médicas geram um
grande número de dados todo dia. Por isso, dentre as técnicas de processamento de imagens,
a compressão de imagem digital tem um papel fundamental no sentido de elevar o potencial
N
N
64 Capítulo III – COMPRESSÃO DE IMAGENS
de armazenamento e da transmissão dessas informações. O objetivo da compressão de uma
imagem é eliminar ou reduzir as informações redundantes e/ou desnecessárias, de acordo
com o processo sem ou com perdas. A compressão de dados é composta de duas etapas:
modelagem e codificação.
Modelagem: conjunto de regras usadas para processar os dados de entrada e determinar qual
código deve representá-los;
Codificação: conjunto de símbolos que representa a informação;
Dados: códigos que representam os valores dos pixels;
Informação: interpretação ou significado dos dados.
Em compressão de imagens, dois fatores são de extrema importância: velocidade de
processamento e a taxa de compressão. Um esquema típico de compressão sem perda para
imagens em tons de cinza obtém taxa de compressão da ordem de 50%, possibilitando reaver
a imagem original a partir da versão comprimida. Em uma imagem digital há, basicamente,
quatro tipos de redundâncias:
Redundância de codificação de tons ou cor: quando os níveis de cinza ou as cores de
uma imagem são codificados com mais símbolos de codificação do que o necessário;
Redundância interpixel: resultantes das relações geométricas ou estruturais entre os
objetos na imagem;
Redundância espectral: ocorre em imagens com mais de uma faixa espectral, quando os
valores espectrais, para a mesma posição na matriz de pixels de cada banda, são
correlacionados;
A redundância psicovisual: relacionadas ao fato do sistema visual humano não
responder com a mesma sensibilidade a todas as informações visuais.
Capítulo III – COMPRESSÃO DE IMAGENS 65
Fig.3.1 - Modelo do sistema de compressão genérico de imagem.
Codificador
de canal Codificador da
imagem Decodificador
de canal Decodificador
da imagem Canal
C O D I F I C A D O R D E C O D I F I C A D O R
f(x, y) g(x, y)
As imagens médicas apresentam como características a presença de uma alta
correlação interpixels ou espacial e uma grande quantidade de ruído que é inserido durante o
processo de aquisição.
3.1 Modelos de compressão de imagens
Como mostra a Fig.3.1 um sistema de compressão pode ser dividido em dois blocos
b{sicos: um codificador e um decodificador. A imagem de entrada, f(x, y), é alimentada no
codificador que cria um conjunto de símbolos. No caso de uma imagem, os símbolos
representam os níveis de amplitude de cada pixel da imagem. Após a transmissão através do
canal, a representação codificada é alimentada no decodificador, onde a imagem é
reconstruída e g(x, y) é gerada.
Se g(x, y) = f(x, y), o sistema é livre de erros e a compressão é sem perdas. Caso
contr{rio, a compressão é com perdas e algum nível de distorção est{ presente na imagem
reconstruída. A compressão sem perdas apresenta a vantagem de não introduzir erros. A
imagem reconstruída na compressão com perdas contem degradações em relação | original.
Tanto o codificador, quanto o decodificador são formados por dois sub-blocos relativamente
independentes, como pode ser visto na Fig.3.1 e 3.2 respectivamente.
3.1.1 O codificador e o decodificador de imagem
O codificador da imagem é responsável pela redução ou eliminação de redundâncias
de entrada. Normalmente, o codificador e o decodificador podem ser construídos de acordo
com o modelo da Fig.3.2.
66 Capítulo III – COMPRESSÃO DE IMAGENS
Redução de dados: quantização do nível de cinza, realçando-se a eliminação de ruído;
Projeção direta: convertem-se os dados a outro espaço matemático;
Quantizador: discretiza os valores contínuos do estado anterior;
Codificador: converte os dados discretos do quantizador para um código de forma ótima.
3.1.2 O codificador e o decodificador de canal
Se o canal é ruidoso, o codificador e o decodificador de canal são projetados de
maneira a reduzir o impacto de ruído, o que é feito através da inserção de redundância de
forma controlada. Como a informação codificada tem pouca redundância, sua sensibilidade
ao ruído é grande.
Imagem de
entrada
f(x,y)
Redução de
dados
Projeção
direta
Quantizador Codificador Imagem
comprimida
Pré-processamento
Codificação
Fig.3.2 – Etapas do codificador da imagem original.
Decodificador Projeção
inversa
Pós-processador
D e c o d i f i c a ç ã o
Imagem
comprimida
Imagem
decodificada
g(x,y)
Fig.3.3 – Etapas do decodificador do arquivo para imagem.
Capítulo III – COMPRESSÃO DE IMAGENS 67
Decodificador: inverte a ação do codificador original projetando os códigos quantizados aos
valores originais mais próximos (meio do passo de quantização);
Projeção inversa: inverte-se o processo de projeção original;
Pós-processador: realça o aspecto final da imagem para atenuar qualquer efeito não desejado
da compressão.
3.2 Medidas de compressão e critérios de fidelidade
3.2.1 Medidas de compressão
Dentro das medidas de compressão, existem diferentes métodos para determinar a
eficiência de um sistema de compressão. Os mais utilizados são [12][13][14]:
Longitude média por símbolo (LS)
É a relação entre o comprimento do arquivo comprimido (C), expresso em bytes e o tamanho
do arquivo sem comprimir (O) também expresso em bytes.
8 𝑠 (bits por símbolo) (3.0)
Ao trabalhar com imagens, os símbolos são pixels, obtendo-se assim a unidade bpp (bits por
pixel). Essa unidade também é chamada de taxa de bits (bit rate).
Fator ou razão de compressão (X:1)
É a relação entre o comprimento do arquivo original e o do arquivo comprimido.
𝑥
(3.1)
Tamanho comprimido relativo (TR)
É o inverso do fator de compressão, e é expresso como uma porcentagem.
𝑇
𝑥 (3.2)
68 Capítulo III – COMPRESSÃO DE IMAGENS
Compressão relativa (CR)
Define o porcentual de diminuição do tamanho do arquivo original.
𝐶
𝑇 (3.3)
Fator de mérito (p)
Determina se há compressão ou não.
(3.4)
- Se p = 100%, o arquivo original e o arquivo resultante são do mesmo tamanho em bytes e,
portanto, não há compressão.
- Se p > 100%, o arquivo resultante é maior que o arquivo original, o que significa que se tem
gerado uma expansão ao comprimir os dados.
- Se p < 100%, o arquivo resultante é menor do que o arquivo original e, portanto, se gerou
uma compressão de dados.
3.2.2 Critérios de fidelidade
Permite determinar o desempenho dos métodos de compressão ao avaliar a
similaridade entre a imagem original e a recuperada. Definem-se dois tipos de critérios de
fidelidade: objetivos e qualitativos.
3.2.2.1 Critérios objetivos
Os critérios objetivos ou quantitativos referem-se ao fato de que as perdas podem ser
expressas como uma função de imagem de entrada e saída comprimida e, posteriormente
descomprimida. Entre esses critérios estão:
Capítulo III – COMPRESSÃO DE IMAGENS 69
Erro total ou absoluto
Seja f(x, y) = I e g(x, y) =I’ de NxM tal que, I é a imagem de entrada e I’ a imagem
reconstruída.
𝑥 𝑦 ∑ ∑ 𝑥 𝑦 𝑥 𝑦
𝑦 𝑥 (3.5)
Onde: M = número de linhas
N = número de colunas
Erro quadrático médio (MSE : Mean Squared Error)
𝐸
∑ ∑ 𝑥 𝑦 𝑥 𝑦
𝑦 𝑥 (3.6)
Relação sinal ruído (SNR: Signal to Noise Ratio)
𝑁 ∑ ∑
∑ ∑
(3.7)
Taxa máxima de relação sinal ruído (PSNR : Peak Signal to Noise Ratio)
𝑁
(3.8)
Correlação cruzada (CC)
Esse parâmetro mede a dependência estatística entre duas imagens. É dada por:
𝐶𝐶 ∑ ∑
√∑ ∑ √∑ ∑
(3.9)
70 Capítulo III – COMPRESSÃO DE IMAGENS
3.2.2.2 Critérios qualitativos
Para o uso de critérios qualitativos, é necess{rio um grupo de observadores (médicos
especialistas), a fim de analisar e comparar as imagens originais com as imagens processadas
em uma ordem determinada, e emitindo opiniões individuais sobre a qualidade visual. A
qualidade da imagem resultante é determinada pelo especialista, com ajuda de um conjunto
de critérios de valores. Esses valores foram representados em uma escala variando de 0 até 5.
A tabela 3.1 mostra a escala citada.
Nível Valores Descrição
0 Não utiliz{vel Imagem de péssima qualidade.
1 Insuficiente Imagem de baixa qualidade, e não se deve analisar.
2 Marginal Imagem com degradações apreci{veis o que dificulta seu estudo.
3 Aceit{vel Imagem com pouca degradação, podendo ser analisada.
4 Bom Imagem de qualidade, sem degradações consider{veis.
5 Excelente Imagem de alta qualidade, sem degradação.
3.3 Métodos de compressão de imagens
3.3.1 Compressão de imagens sem perdas ou reversível
Os métodos de compressão reversíveis produzem uma cópia exata da imagem
original. O método explora a redund}ncia entre os pixels na codificação. Na {rea de medicina,
a natureza sem perda é de fundamental import}ncia por razões éticas. O esquema geral de
funcionamento dos métodos de compressão reversíveis ocorre em duas fases:
• Uma transformação, de modo a reduzir a correlação inter-pixels, e;
• Uma codificação entrópica (exemplo, o codificador de Huffman ou aritmético).
A transformação deve resultar em valores inteiros para o codificador funcionar. Ela
pode ser uma transformação por blocos, por bancos de filtros ou por uma transformação
preditiva.
Tabela 3.1 – Escala dos critérios de valores.
Capítulo III – COMPRESSÃO DE IMAGENS 71
3.3.1.1 Compressão sem perdas por métodos padrões
Métodos específicos para a compressão de imagens monocrom{ticas: Dentro desses
tem-se:
FELICS (Fast and Efficient Lossless Image Compression) *15+
O compressor de imagens FELICS, é um dos compressores de imagens sem perdas
de informações mais simples, r{pido e eficiente. A imagem é comprimida por meio de linhas
e é idêntico ao JPEG. Posei um codificador entrópico r{pido. O contexto de predição espacial
é mostrado na Fig.3.4. FELICS usa um modelo probabilístico especial (Fig.3.5). O contexto de
predição é usado para indicar se o intervalo de valores est{ contido entre a e b. Se L é menor
que s (a ou b) e H maior, então a probabilidade de que L ≤ s ≤ H é bastante alto e quase
uniforme. Porém, se s estiver fora do intervalo, FELICS segue uma exponencial decrescente
conforme se afasta de L e H. Para codificar a probabilidade de s quando est{ dentro do
intervalo, usa-se um codificador bin{rio. Para codificar a probabilidade fora, usa-se um
codificador de RICE.
b
a s
Fig.3.4 – Predição espacial usado por FELICS.
Fig.3.5 – Modelo probabilístico usado em FELICS [15].
72 Capítulo III – COMPRESSÃO DE IMAGENS
Codificador entrópico:
Esse tipo de codificação, refere-se ao uso de um código de comprimento vari{vel
para representar sem perda uma sequência de símbolos de um alfabeto discreto. O termo
código entrópico vem do feto de que a entropia impõe um limite mínimo para a média do
comprimento da palavra código, no caso de uma fonte sem memória. Quando se constrói um
compressor utilizando um codificador por entropia, deseja-se que este fique o mais próximo
possível da entropia. Desse modo, a medida pode ser utilizada para estimar inferiormente a
quantidade de bits por símbolo que se teria caso a informação comprimida.
A chave para se obter o m{ximo rendimento em um compressor entrópico é a
estimação exata das probabilidades dos símbolos. Se a probabilidade é baixa demais, o
código designado aumenta o comprimento. Por outro lado, o rendimento dos compressores
entrópicos depende tanto dos codificadores de comprimento vari{vel quanto dos modelos
probabilísticos usados. Na atualidade, procura-se a m{xima compressão possível, ainda que
isso implique no uso de algoritmos de alto custo computacional que permitam aproveitar o
m{ximo grau de otimização. Os codificadores entrópicos mais utilizados são, o codificador de
Huffman e o aritmético.
Codificador
A estratégia do codificador FELICS consiste em emitir os códigos que informam ao
decodificador sobre a situação de s com relação a a e b, como é mostrado no algoritmo:
1. Seja L ← mín ,a,b} e H ← Max ,a,b}
2. Seja Δ ← H – L
3. Se L ≤ s ≤ H:
a) Emitir um bit indicando IN – RANGE
b) Emitir um código bin{rio ajustado codificado S – L. O tamanho do alfabeto é Δ
4. Se não
a) Emitir um bit indicando OUT-RANGE
i. Se s < L
Capítulo III – COMPRESSÃO DE IMAGENS 73
A. Emitir um bit indicando BELOW-RANGE
B. Codificar L – s – 1 usando um codificador Rice
ii. Se não: (s > H)
A. Emitir um bit indicando ABOVE-RANGE
B. Codificar s – H- 1 usando um codificador Rice
5. Estimar o par}metro k necess{rio para a codificação de Rice
O uso de um código de Rice ou de um código bin{rio para expressar o resto do símbolo
torna possível que FELICS possa codificar imagens de qualquer profundidade de cor sem que
os algoritmos de codificação e decodificação sejam modificados.
Decodificador
A partir da mesma predição levada pelo codificador e da informação proporcionada
com os códigos, o decodificador FELICS recupera o valor original de s aplicando o algoritmo
seguinte:
1. Seja L ← mín ,a,b} e H ← Max ,a,b}
2. Seja Δ ← H – L
3. Se s est{ em IN-RANGE:
a) Ler x decodificando o código bin{rio sabendo que o tamanho do alfabeto é Δ
b) s ← L + s
4. Se não: (s est{ OUT-RANGE)
a) Ler um bit (que indica se s est{ BELOW-RANGE ou ABOVE_RANGE)
b) Se s est{ BELOW-RANGE:
i. Decodificar x usando o decodificador de Rice
ii. s ←L + s + 1
c) Se não: (s est{ ABOVE-RANGE)
i. Decodificar x usando o decodificador de Rice
ii. s ← L + s + 1
5. Calcular o par}metro k necess{rio para a codificação de Rice.
74 Capítulo III – COMPRESSÃO DE IMAGENS
• LJPEG(Lossless Joint Photographics Experts Group)*16+
Esse método baseia-se em codificação preditiva combinada com um preditor fixo
(codificação de entropia). O método de previsão transforma a imagem original em uma
imagem erro com vari}ncia reduzida usando-se um preditor.
A Fig.3.6 mostra a relação entre os codecs entrópicos e os preditores onde s denota
um ponto da imagem a comprimir, ŝ a predição realizada pelo preditor P e “e” o erro de
predição. C é o compressor entrópico específico e D o descompressor ou expansor.
Codificador JPEG
A imagem é varrida por linhas, a partir do canto superior esquerdo, gerando a
codificação de um ponto s da seguinte forma:
1. Geração de uma predição ŝ usando um dos métodos de predição (Tabela 3.2);
2. C{lculo do erro de predição e ← s - ŝ
Para fazer a predição, JPEG utiliza um máximo de 3 pixels vezinhos (Fig.3.7). Os
dados que foram codificados são indicados com um sombreado e portanto são conhecidos no
C b
A s
Fig.3.7 – Contexto de predição espacial usado por JPEG.
- C D
P
+
P
e e
Ŝ Ŝ
S
S
Fig.3.6 – Compressor - Expansor (Descompressor) JPEG sem perdas [16].
Capítulo III – COMPRESSÃO DE IMAGENS 75
processo de descompressão [17]. Os preditores são projetados de tal forma a usar os pixels
vizinhos que em geral, são correlacionados. Desse modo, usando-se uma predição linear a
partir desses pixels estima-se um valor aproximado do pixel a se codificar.
Símbolo Intervalo etiqueta
0 ŝ ← 0
1 ŝ ← a
2 ŝ ← b
3 ŝ ← c
4 ŝ ← a + b – c
5 ŝ ← a + (b -c)/2
6 ŝ ←a + (b -)/ 2
7 ŝ ← (a + b)/2
O erro de predição é calculado no passo 2 e a codificação pode ser feita usando-se as
técnicas de codificação de Huffman ou codificação aritmética. Deve-se ter em conta que o erro
e estatisticamente apresenta uma distribuição de probabilidade de Laplace.
Decodificador JPEG
A etapa de descompressão é determinada a partir da fase de compressão, de modo
que o descompressor consiste em:
1. Gerar ŝ usando o mesmo preditor usado no compressor;
2. Decodificar e utilizando o mesmo código que o compressor;
3. Calcular o pixel s ← e + ŝ
• CLIC (Context-based Lossless Image Compression)*18+
Usa v{rios contextos, para estimar probabilidade de funções densidade de valores de
erro, que são finalmente codificadas pela codificação aritmética. Os valores de erro são
calculados como a diferença entre um valor de pixel e uma predição. A função de predição
Tabela 3.2– Preditores empregados pelo padrão JPEG sem perdas.
76 Capítulo III – COMPRESSÃO DE IMAGENS
pode ser escolhida entre v{rias funções possíveis, como: (N + W)/ 2, onde N corresponde ao
valor de pixel acima do pixel atual. A probabilidade da função densidade dos valores de erros
é estimada para cada contexto, calculando-se as frequências de valores de erro. Isso
pode ser feito bit a bit pelo c{lculo da frequência de cada bit em cada contexto. O contexto
é construído a partir dos valores de erro dos pixels acima e | esquerda do pixel atual.
• LOCO-I (Low Complexity,Context-Based,Lossless Image Compression Algorithm)*19+*20+
É semelhante | FELICS, usa um codificador de Rice como codec entrópico, mas ao
contr{rio desse, o modelo probabilístico est{ baseado no contexto. Outra melhoria importante
introduzida em LOCO-I, é que o preditor espacial trata de usar a informação global da
imagem para melhorar a fase de predição e gerar uma distribuição de Laplace, mais estreita,
isto é, com menor vari}ncia. A informação global é uma fonte importante de redund}ncia
espacial j{ que nas imagens é comum se achar regiões distantes que são semelhantes em
textura ou composição. Um preditor local não pode extrair esse tipo de redund}ncia.
LOCO-I foi adotado como um padrão novo para uma compressão de baixa
complexidade (em termos de memória e CPU) e sem perda de informação de imagens
chamada JPEG-LS (JPEG-Lossless).
Codificador
A imagem é varrida por linhas iniciando-se pelo canto superior direito. O algoritmo
é o seguinte:
1. Inicialização dos contextos de predição:
a) Seja Q o contexto atual. LOCO-I considera um m{ximo de 1094 contextos diferentes;
b) Seja N*Q+ o número de ocorrências de cada contexto. Inicialmente N*Q+ ← ∀𝑄
c) Seja B*Q+ o erro de predição acumulado em cada contexto;
Inicialmente B*Q+ ← ∀𝑄
d) Seja A[Q] a soma dos valores absolutos dos erros de predição para cada contexto;
Inicialmente para A*Q+ ← ∀𝑄
Capítulo III – COMPRESSÃO DE IMAGENS 77
e) Seja C*Q+ os valores de cancelamento da ‚bias‛. A bias é um valor que acrescentado |
predição espacial faz com que sua média seja 0. Inicialmente C*Q+ ← ∀𝑄
2. Determinação do contexto de predição Q:
a) Calcular a gradiente local. Para isso são calculados 4 diferenças (Fig.3.7):
g1 ← d – a
g2 ← a - c
g3 ← c – b
g4 ← b – e
b) Calcular os gradientes de acordo com:
𝑞 ←
{
𝑠 𝑚
𝑠 𝑚
𝑠 𝑚 3 6
3 𝑠 𝑚 7 44 𝑚 𝑢𝑡𝑟 𝑎𝑠
Para i = 1, 2, 3 e
𝑞4 ← { 𝑠 𝑚 4 < 𝑠 𝑚 5 4 𝑚 𝑢𝑡𝑟 𝑎𝑠
3. C{lculo do erro de predição M(e):
a) Construir a predição inicial
�� ← {𝑚í 𝑎 𝑠 𝑚 ≥ 𝑚á𝑥 𝑎
𝑚á𝑥 𝑎 𝑠 𝑚 min 𝑎 𝑎 𝑚 𝑢𝑡𝑟 𝑎𝑠
b) Calcular o ‚bias‛
�� ← {�� 𝐶 𝑄 𝑠 𝑚
�� 𝐶 𝑄 𝑚 𝑢𝑡𝑟 𝑎𝑠
c) Calcular o erro de predição
← 𝑠 �� 𝑚 𝑑 𝛽
78 Capítulo III – COMPRESSÃO DE IMAGENS
Onde β é o número de bits por ponto. Isso faz com que o erro de predição seja
projetado a partir do intervalo *- α + 1, α - 1+ até o intervalo *- α/ 2, α/ 2 - 1+ onde α= 2β,
é o tamanho do alfabeto.
d) Embaralhar os erros de previsão negativos e positivos gerando SDPG. Isso é feito de
acordo com o seguinte mapeamento:
← { 𝑠 𝑚 ≥ 𝑚 𝑢𝑡𝑟 𝑎𝑠
Após esse mapeamento, os erros são ordenados de acordo a: 0, -1, -2, +2, ..., 2β-1
4. Codificação entrópica de M(e) no contexto Q:
a) Emite-se um código de Rice que codifica o símbolo M (e) para k = *log2 (A *Q+)+
5. Atualização do contexto Q:
a) B*Q+ ← B*Q+ + e
b) A*Q+ ← A*Q+ + |e|
c) Sim N*Q+ = RESET, então (onde 64 ≤ RESET ≤ 256):
i. A*Q+ ← A*Q+/2
ii. B*Q+ ← B*Q+/2
iii. H*Q+ ← N *Q+ + 1
d) N*Q+ ← N*Q+ + 1
e) O c{lculo do valor atualizado para o cancelamento da ‚bias‛ é mais complexo. Se o
erro de previsão inicial no contexto de Q não tem média 0, o nível de compressão cai
severamente. Isso ocorre porque as médias de distribuição de Laplace real e da
modelada não coincidem. Para evitar isso, C *Q+ armazena um valor proporcional a
B *Q+ / N *Q+ que é adicionado | previsão inicial para cancelar a ‚bias‛. Além disso,
C*Q+ é respons{vel para resolver outro problema que deriva do embaralhamento
produzido por M (e). De fato, tem-se uma tendência para atribuir um código mais
curto para o erro negativo e um mais longo ao respectivo erro positivo. O algoritmo
para atualizar C *Q+ é a seguinte *20+:
Capítulo III – COMPRESSÃO DE IMAGENS 79
i. Sim B*A+ ≤ - N*Q+, então:
A B*Q+ ← B*Q+ + N*Q+
B sim C*Q+ > - 128, então
C*Q+ ← C*Q+ – 1;
C sim B*Q+ ≤ - N*Q+, então :
B*Q+ ← N*Q+ + 1;
ii. Sem não
A B*Q+ > 0, então:
B*Q+ ← B*Q+ – N*Q+;
Sim C*Q+ < - 127, então:
- C*Q+ ← C*Q+ + 1;
Sim B*Q+ > 0, então:
- B*Q+ ← 0.
Decodificador
O decodificador é muito simétrico e recupera os símbolos s usando o seguinte algoritmo:
1. Inicialização dos contextos de previsão (v{ para a etapa 1 do compressor);
2. Determinação do contexto Q: (v{ para a etapa 2 do compressor);
3. Decodificação de M(e): usando um decodificador de Rice com k = *log2(A*Q+)+
4. Determinação de s:
a) Calcule a previsão inicial �� como no passo 3a do compressor;
b) Adicionar o ‚bias‛ sobre ��:
�� {�� 𝐶 𝑄 𝑠 𝑚 >
�� 𝐶 𝑄 𝑚 𝑢𝑡𝑟 𝑎𝑠
c b d
e a s
Fig.3.8 – Contexto de predição espacial usado por LOCO-I.
80 Capítulo III – COMPRESSÃO DE IMAGENS
c) Calcular o mapeamento inverso gerando a distribuição de Laplace original:
⟵ ( ) {
𝑠 𝑚 é 𝑚 𝑎𝑟
𝑚 𝑢𝑡𝑟 𝑎𝑠
d) Calcular o símbolo s como:
S ← (e + ŝ) mod β
5. Atualização de Q: (ir para a etapa 5 do compressor).
• CALIC (Context-based Lossless Image Compression) *21+.
Trata-se de uma técnica baseada sobre o contexto pixel do presente pixel a ser
codificado. O método é capaz de aprender dos erros cometidos nas previsões anteriores e,
dessa forma, pode melhorar a sua previsão de forma adaptativa. Os valores dos pixels são
previstos por um preditor não linear, que seleciona os pixels de previsão e a função de
previsão espacial, entre v{rias funções de previsão possíveis a partir do contexto local. O
contexto é construído da magnitude do gradiente local nas direções horizontal e vertical. A
predição é melhorada por se adicionar uma estimativa de erro ao valor predito. Essa
estimativa é o erro médio dos valores preditos prévios no presente contexto. Quatro
coeficientes são usados para o peso das magnitudes do gradiente vertical e horizontal. O
último conjunto de erros de previsão é codificado por código de Huffman ou aritmético.
• CPM (Central Prediction Method)*22+
Trata-se de uma técnica de compressão iterativa que aplica a codificação hier{rquica
de quatro bits | imagem para codificar os erros de predição. Os valores dos pixels são
previstos em duas fases. Na primeira fase, o valor de um pixel é previsto como a média dos
quatro pixels vizinhos verticais e horizontais. Na segunda metade da fase, os pixels restantes
são previstos pelos valores dos pixels nas duas direções diagonais. Um quarto dos valores de
Capítulo III – COMPRESSÃO DE IMAGENS 81
pixels permanece imprevisível e é transferido para um bloco separado, que ser{ comprimido
recursivamente pelo mesmo método de previsão.
A recursividade termina quando o tamanho do bloco de valores de pixels original é
2x2. Os níveis de bits da imagem resultante são codificados pelo esquema de codificação
hier{rquico de quatro bits. O esquema de codificação divide o plano de bits de NxN em
quatro subplanos de N/2xN/2, cada qual é codificado por um bit em um codeword de quatro
bits. Se todos os valores de pixels em um subplano são zero, então esse subplano é codificado
por um zero. Caso contr{rio, é codificado por um. O procedimento é aplicado recursivamente
a cada um dos subplanos.
• SPIHT (Set Partitioning in Hierarchical Trees) *23+
Transforma a imagem em uma representação multiresolução pela transformada
wavelet ou, no caso de compressão sem perdas, pela transformada S. Essa transformação é
semelhante | decomposição em sub-bandas, pois usa somente operações inteiras. A
transformada S verifica as colunas da imagem e calcula, para cada par sucessivo de pixels, a
média e a diferença. As médias são armazenadas na parte superior da imagem (l), e as
diferenças são armazenadas na parte inferior (h) da imagem.
O mesmo se repete para as colunas de l e h, ll, lh, hl, e hh imagens. No próximo nível, o
bloco ll é processado do mesmo modo. Após cada transformada unidimensional, as
diferenças dos pixels são substituídas pela diferença de valores de pixels transformados e os
valores de predição. Isso é conhecido como a transformada P. Os valores de predição são
calculados em função de pixels dos níveis inferiores da pir}mide e os pixels conhecidos a
partir do nível atual. A codificação aritmética conclui o processo de codificação.
3.3.1.2 Métodos específicos de compressão sem perdas
Para os métodos de codificação preditiva, é possível proceder do seguinte modo:
• Definir preditores fixos específicos adaptados tanto pelo algoritmo LMS (Least Mean
Square) *24+ adapt{vel quanto por regressão recursiva pseudo-linear *25+;
82 Capítulo III – COMPRESSÃO DE IMAGENS
• Definir para um preditor dado, um modelo estatístico do erro de previsão em diferentes
regiões da imagem (como o fundo da imagem e da {rea estudada). Assim, um codebook é
associado com cada região da imagem durante a codificação estatística.
Compressão baseado sobre regiões de interesse
Cada região da imagem pode ter mais ou menos import}ncia no processo de
diagnóstico. Por exemplo, uma fatia do cérebro pode ser dividida em duas regiões distintas: a
{rea do cérebro que é útil para estabelecer um diagnóstico médico e o fundo da imagem que
não fornece informação útil. A parte da imagem que é mais útil é chamada de ROI ou região
de interesse.
As regiões de interesse ou são definidas manualmente ou depois da segmentação. A
maior parte dos trabalhos de codificação que se baseia em região tem-se centrado no
objetivo de identificar regiões com características diferentes. Essas características poderiam
ser usadas em diferentes esquemas de codificação. Mas, isso requer que a imagem de
entrada seja segmentada para dar origem a regiões espaciais. As regiões podem diferir em
suas características de níveis de cinza ou em seus níveis de import}ncia. A divisão em regiões
ou segmentação das imagens é útil devido a duas finalidades. Essas, são:
• A segmentação pode permitir o uso de esquemas de codificação mais apropriado para as
diferentes regiões;
• A segmentação permite aplicar diferentes níveis de qualidade para diferentes regiões. Os
métodos poderiam ser idênticos, exceto por suas atribuições de bits.
Por outro lado, a compressão baseada na ROI nos permite alcançar taxas de compressão de
até 28:1 quando a taxa de compressão média para a maioria dos processos de compressão
reversível é de 3:1. A versão mais recente do JPEG2000 permite uma determinação de v{rios
ROIs de forma circular e nos permite realizar uma compressão reversível de dados contidos
dentro da ROI. As diferentes regiões a serem codificadas podem ser definidas após uma fase
de segmentação.
Capítulo III – COMPRESSÃO DE IMAGENS 83
Assim, a estratégia de codificação para cada região pode ser adaptada ao conteúdo da
informação incluída nesse tipo de região. Esse método de codificação trabalha separando a
imagem em duas partes (seu contorno e sua textura) e representa uma imagem
simbolicamente na forma de um mosaico de regiões adjacentes, com variações contínuas em
suas amplitudes de pixel interno.
As bordas das regiões representam os contornos da imagem e podem ser codificadas
por um processo reversível conhecido como o método de codificação diferencial de Freeman.
Pode-se também usar um processo com perdas, que consiste em aproximar suas fronteiras
por linhas retas, por exemplo. O sinal de lumin}ncia em cada região corresponde | textura de
cada objeto dentro da imagem. Esse sinal pode ser codificado utilizando-se diferentes
métodos com taxas de compressão dos níveis que variam de acordo com as informações
contidas nesse objeto. Para melhorar a taxa de compressão global da imagem, pode-se obter
uma codificação sem codificar a imagem de fundo (Fig.3.9).
Fig.3.9 a) Abdominal original MRI (512x512x16bit); b)Classificação fuzzy dentro de 3
conjuntos baseado sobre a intensidade do pixel; c)Imagem reconstruída após uma
compressão reversível preditiva dos pixels em todos os outros conjuntos TC=7,4 [Lv. 4].
a) b) c)
84 Capítulo III – COMPRESSÃO DE IMAGENS
A codificação preditiva ideal ou adaptativa em cada região a ser codificada pode ser
realizada de acordo com uma pesquisa específica, adaptada a qualquer tipo de formato da
região. (Fig.3.10)
Os benefícios em termos de taxa de compressão dependem em grande medida da
imagem a ser estudada. O método de codificação baseado sobre o contorno textura resulta em
melhoria de 10 a 30% nas taxas de compressão. No entanto, quando um processo de
armazenamento é necess{rio, é impossível determinar quais detalhes serão úteis no futuro
*26+.
3.3.2 Compressão de imagens com perdas
No caso da compressão irreversível, existe uma perda de informação, mas as taxas que
podem ser obtidas são pelo menos de uma ordem maior, em magnitude. No caso das
imagens médicas deseja-se disponibilizar toda a informação necess{ria ao médico, ao mesmo
tempo em que as distorções produzidas pelo método sejam eliminadas. É frequente encontrar
um número importante de algoritmos que usa a transformação da imagem para outro
domínio onde é possível representar a energia da imagem de um modo mais compacto *27+.
Do mesmo modo que os arquivos de {udio, as imagens digitais apresentam uma
grande vantagem em relação a outros tipos de dados. Na verdade, eles podem ser
modificados ligeiramente durante o processo de compressão sem afetar a qualidade
Fig.3.10 - a) Exploração de cima para baixo a partir do ponto P0;
b)Exploração de baixo para cima a partir de P1; c)Exploração de cima
para abaixo a partir de P2 [Lv. 4].
P1
P2
P0
P2
P1
P2
a) b) c)
Capítulo III – COMPRESSÃO DE IMAGENS 85
percebida pelo usu{rio, ou seja, a qualidade subjetiva da imagem codificada é ainda aceit{vel
após a recuperação *28+. As mudanças realizadas no processo de codificação podem ser
imperceptíveis na imagem recuperada se as modificações forem cuidadosamente feitas. Esse
fato torna possível a implementação de algoritmos e métodos de compressão de imagens
digitais com perdas.
A diferença entre a compressão de imagens com perdas e a compressão sem perdas
est{ na fase de quantificação *28+. Os métodos mais comuns de compressão com perdas para
imagens fixas são: JPEG com perdas (baseada na transformada discreta de cosseno) e a
compressão fractal. Para propósitos de compressão, as propriedades que deveriam satisfazer
essas transformadas são: descorrelacionar os dados e tornar pequenos os coeficientes
transformados. Um esboço típico de compressão de imagens com perdas é formado através
de três componentes relacionados:
a) O codificador da fonte;
b) O quantizador e;
c) O codificador entrópico.
A compressão é levada a cabo por meio da transformada linear para
descorrelacionar os dados na imagem, quantizar os coeficientes transformados resultantes e
codific{-los entropicamente. No codificador de fonte são usadas diferentes transformadas;
entre elas a transformada discreta de Fourier DFT (Discrete Fourier Transform), a transformada
discreta de cosseno DCT (Discrete Cosine Transform ), a transformada discreta wavelet DWT
(Discrete Wavelet Transform), entre outras.
O quantizador reduz o número de bits necess{rios para armazenar os coeficientes,
reduzindo também sua precisão. Esse é um processo com perdas e é a fonte de compressão
principal em um codificador. A quantização pode ser levada a cabo em cada coeficiente
individual, o que é conhecido como quantização escalar SQ (Scalar Quantization), ou em um
grupo de coeficientes conhecidos como quantização vetorial VQ (Vector Quantization). O
codificador entrópico comprime os valores quantizados e sem perdas. Esses codificadores
usam um modelo para determinar de um modo preciso as probabilidades de cada valor e
produzem um código apropriado de acordo com essas probabilidades.
86 Capítulo III – COMPRESSÃO DE IMAGENS
Os mais usados são: o codificador Huffman e o codificador aritmético. Por enquanto,
para aplicações que exigem uma execução r{pida, o codificador RLE (Run Length Encoding) se
manifestou ser muito efetivo. Para alcançar um fator de compressão alto, é absolutamente
necess{rio que seja projetado de um modo apropriado tanto o quantizador quanto o
codificador entrópico. Existem modelos de representação usados na compressão de imagens
radiológicas como as técnicas propostas por Lo S. e Huang K., para transformas cossenoidais
de imagens completas *29+*30+.
O uso das funções wavelets tem-se mostrado útil na compressão de várias modalidades
de imagens desde a década de 90 [31][32]. As taxas de compressão são excelentes e
concomitantemente mantém-se uma qualidade da imagem dentro de limites razoáveis tanto
objetiva quanto subjetivamente. Por isso, o uso dos esquemas de compressão wavelets
representa uma contribuição importante para o desenvolvimento de sistemas de computador
para o processamento de compressão de imagens médicas [33].
3.3.2.1 Quantização
Existem duas formas principais de quantização:
1. Quantização escalar;
2. Quantização vetorial (VQ).
Quantização escalar
A quantificação consiste em mapear elementos de um grupo para outro grupo. Em
geral, o segundo grupo possui um número finito de elementos. A quantificação escalar
permite mapear separadamente cada cor de uma imagem em um grupo menor de valores de
saída, tornando assim, o processo irreversível (com perdas). O método permite reduzir o
número de bits de cor ou níveis de cinza. Quando o alfabeto símbolo de entrada for maior que
o alfabeto de índice de quantização, h{ compressão de informação, mas também perda de
informação. Todos os símbolos dentro de um intervalo de valores são mapeados para um
nível de quantização; esse intervalo define a célula de quantização para cada índice.
Capítulo III – COMPRESSÃO DE IMAGENS 87
A operação inversa | quantização mapeia o nível de quantização para um símbolo
de saída. Tipicamente a quantização escalar mapeia um grupo infinito de entradas reais para
um grupo finito de níveis inteiros. A quantização inversa mapeia um grupo finito de níveis
inteiros para um grupo finito de saídas reais. A diferença entre o símbolo de entrada e o
símbolo de saída é o erro de quantização para cada símbolo. Um quantizador escalar é
denominado regular se as células individuais são contíguas, isto é, o span das células
ordenadas tem intervalo contínuo.
Não h{ nenhuma sobreposição entre células e o valor de saída da célula fica dentro
da célula. Quando se mapeia um símbolo do alfabeto real usando um quantizador regular
com níveis de alfabeto finito, uma das células ter{ um intervalo abaixo de -∞ e outra das
células ter{ um intervalo acima de +∞. Essas células são denominadas de células
sobrecarregadas. Todas as outras células são chamadas células granulares. Um quantizador
uniforme é um quantizador regular onde todas as células são do mesmo tamanho e o valor de
saída para cada célula granular é o ponto médio da célula. Um quantizador uniforme é
definido pelo tamanho do alfabeto, tamanho da célula ou tamanho do passo, e pelo intervalo
coberto pela célula granular.
Se a fonte X tem valores reais arbitrários, não pode ser codificado com um número
finito de bits. Um quantizador escalar Q é definido pela aproximação dada por = Q(X), a
qual toma valores sobre um grupo finito de valores [11]. A otimização do quantizador é
estudada para minimizar o número de bits necessários para se codificar . Nesse caso, o erro
quadrático médio é dado por:
𝐷 𝐸 (3.10)
O intervalo (yk-1, yk+ é chamado de caixa de quantização. Esse intervalo est{ sendo
considerado aberto "(" | esquerda e fechado | direita ‛+". Um inteiro arredondado é um
exemplo simples onde a caixa de quantização (yk-1,yk+ = (k – ½, k +½ + e tem tamanho 1 onde
xk =k para qualquer k∈Z.
88 Capítulo III – COMPRESSÃO DE IMAGENS
Quantização Vetorial
Esse tipo de quantificação seleciona um conjunto de elementos representativos das
entradas, mapeando os pontos desse conjunto no espaço para o representante mais próximo.
Os elementos representantes são selecionados implementando-se um algoritmo de
agrupamento. Esse algoritmo procura um número de pontos nos dados e seleciona um dos
pontos (pixel) do grupo para ser o representante. Por exemplo, pode-se selecionar alguma
forma de centróide do grupo. A idéia principal da quantificação vetorial é dividir o espaço
vetorial em setores, cada um dos quais ser{ representado por um único vetor que pode ser o
centróide. O conjunto de centróides vem ser a o livro código (codebook) que define os níveis da
quantificação e a cada um deles atribui-se um endereço ou rótulo.
Um aspecto muito importante de qualquer esquema de quantificação vetorial é a
obtenção do livro código (codebook). O espaço vetorial deve ser dividido em setores. Para
tanto parte-se de vetores de treinamento. Esses vetores devem representar o espaço de
interesse. O livro código é obtido usando-se um algoritmo conhecido como LBG cujo nome é
derivado dos criadores Yoseph Linde, Andrés Buzo e Robert Gray.
No algoritmo LBG parte-se de um livro código inicial Â0, onde cada vetor do espaço é
comparado com cada componente do livro código. Compõe-se uma partição de distorção
mínima P(Âm) classificando cada vetor por meio da dist}ncia mínima com os vetores do livro
código. A soma das dist}ncias é comparada com o limite de distorção. Se essa soma é maior,
volta-se a calcular uma partição nova até que a dist}ncia total seja inferior ao limite.
A recursão é mostrada a seguir:
1. Seja Â0 o livro código, xj : j = 0,1,..,n-1 os vetores de treinamento. Define-se: m = 0 e
D-1=U.
2. Dado Âm = ,yi: i=1,...,N} , onde N = número de níveis de quantização.
Achar a partição da distorção mínima Âm = ,yi: i = 1...,N} , onde yi é o i-ésimo setor. O
valor xj corresponde a yi se d(xj, yi) £ d(xj, yl) para todo l. Calcula-se a distorção média:
Capítulo III – COMPRESSÃO DE IMAGENS 89
𝐷𝑚 𝐷 (��𝑚 (��𝑚))
𝑛∑ 𝑑(𝑥 𝑦) 𝑦 ∈ 𝐴𝑚
𝑛 (3.11)
3. Âm ser{ o livro código final, onde Є é o limite de distorção, se satisfaz:
𝐷𝑚 𝐷𝑚
𝐷𝑚 ∈ (3.12)
4. Se a relação acima não for satisfeita, então se toma os centróides das {reas encontradas
como tentativas de componentes do novo livro código, denominado Â. Incrementa-se
m de um valor igual a 1 e se volta a recalcular até que o erro seja inferior ao limite de
distorção Є.
Uma parte do algoritmo compreende a obtenção do livro código inicial, que é calculado a
partir do espaço vetorial encontrando-se o seu centróide. Esse centróide ser{ o vetor inicial yi
a partir do qual obtém-se dois vetores novos yi + D e yi - D . Nesse ponto se começa a calcular
o livro código com o algoritmo LBG para dois vetores. Em seguida, se volta a fragmentar os
centróides em duas partes e se usa o algoritmo LBG para 4 vetores. Procede-se assim até se
obter o valor N que satisfaça os requisitos necess{rios. O valor de N geralmente é 64 ou 128.
Considerações
Uma quantização vetorial consiste em atribuir um código a um código específico. Isso
é feito para cada bloco ou vetor de pixels que constituem a imagem original. Usando
essa técnica, dado um bloco, a imagem é comparada a um conjunto dicionário de códigos.
Consequentemente, o código escolhido será aquele que minimiza a distância em relação ao
bloco original da imagem a ser codificada. Como resultado, a imagem pode ser armazenada
ou transmitida de forma muito simples usando-se um livro de códigos. Para reconstruir uma
imagem, o decodificador utiliza o codebook do qual tirou o código do dicionário apropriado
(Fig.3.10). Assim, o desempenho desse método depende do número de códigos contidos no
dicionário. Por outro lado, a complexidade em termos de code-search poderia aumentar
significativamente.
90 Capítulo III – COMPRESSÃO DE IMAGENS
3.4 Compressão de imagens médicas baseada em DCT (Discrete Cosine Transform)
A introdução da transformada discreta cosseno DCT em 1974 [34] contribuiu de um
modo importante ao desenvolvimento da teoria de compressão de imagens. A DCT pode ser
considerada como uma versão em tempo discreto da série de cossenos de Fourier. A DCT
está relacionada, do mesmo modo que a transformada discreta de Fourier DFT (Discrete
Fourier Transform), a uma técnica para se expressar um sinal como uma soma de componentes
espectrais. A DCT pode ser calculada por meio de um algoritmo de transformada rápida de
Fourier FFT (Fast Fourier Transform) com uma complexidade de nlog2(n) operações. Em
oposição à DFT, a DCT é uma transformada real e de uma aproximação melhor para um sinal
com um número menor de coeficientes. A DCT de um sinal discreto x(n), n = 0, 1,..., N-1 é
definida por meio de:
𝑢 √
𝐶 𝑢 ∑ 𝑥 o
𝑛
𝑛 (3.13)
Code 3
Code M
Code 0
Code 1
Índice Imagem original
Imagem reconstruída
Code 3
Code M
Code 0
Code 1
Transmissão/armazenamento
Índice
Fig.3.11 – Esquema de quantização vetorial [Lv. 4].
Capítulo III – COMPRESSÃO DE IMAGENS 91
𝐶 𝑢 {
√ 𝑢
𝑢 𝑁 (3.14)
Em [35] encontra-se a descrição das transformadas relacionadas com a DCT e suas
aplicações. Quando a DCT é considerada em duas dimensões para transformar um bloco de
tamanho N×N, a definição da mesma é dada por meio da expressão:
𝑢 𝑣
𝐶 𝑢 𝐶 𝑣 ∑ ∑ 𝑥 𝑚 o *
𝑛
+
𝑚 𝑛 o
(3.15)
𝐶 𝑣 {
√ 𝑣
𝑣 (3.16)
Nessas equações, tem-se x(n,m) e X(u, v) os blocos da entrada e os coeficientes
transformados, respectivamente. A escolha da DCT como técnica vi{vel para um
processamento de imagens digitais é baseada nas propriedades de descorrelação. A DCT
permite concentrar a energia nas frequências inferiores. Assim, essa transformada representa
de um modo eficiente a imagem, isto é, por meio de um número menor de coeficientes.
A propriedade de separabilidade da DCT 2D permite calcular a transformada de um
bloco de tamanho N×N por meio de sucessivas DCT unidimensionais de N pontos. Por meio
de algoritmos de complexidade computacional reduzida, foi possível desenvolver
arquiteturas VLSI (Very Large Scale Integration) eficientes para essa transformada. Em 1992 se
estabeleceu o padrão JPEG (Joint Photographic Experts Group), o primeiro padrão para
codificação de imagens digitais, onde os codificadores e os decodificadores são baseados em
DCT. O padrão JPEG especifica três modos para codificação com perdas: sequencial,
progressivo e hier{rquico, e um modo para codificação sem perdas.
O codificador básico que constitui o codificador sequencial em sua forma mais
simples é mostrado na Fig.3.12 O funcionamento do codificador está baseado no
processamento da imagem de um modo sequencial por blocos de 8×8 pontos.
92 Capítulo III – COMPRESSÃO DE IMAGENS
Cada bloco é processado de um modo independente em cada um dos componentes do
codificador. A DCT é a chave para a compressão da imagem já que elimina a correlação
existente entre pixels adjacentes em uma imagem, concentrando a energia do sinal em
frequências espaciais baixas. Para um bloco típico de 8×8 pixels, a maioria dos componentes
em frequência tem amplitude nula ou quase nula e dessa forma, esses coeficientes de baixa
energia não precisam ser codificados. A DCT não introduz perdas na imagem; simplesmente
a transforma para outro domínio no qual se pode efetuar a codificação de um modo mais
eficiente. Depois de transformar o bloco para o domínio da frequência, cada um dos 64
coeficientes do bloco transformado é quantizado de forma uniforme de acordo com uma
tabela de quantização de 64 elementos [36].
No decodificador, as amostras de sinal são multiplicadas pelos fatores apropriados
para se recuperar os valores originais. Depois da quantização, o bloco de coeficientes
transformados é ordenado de acordo com uma sucessão conforme indicado na Fig.3.13.
Fig.3.12 – Codificador sequencial básico definido no padrão JPEG.
DCT Quantizador
Tabela de
quantização
Codificador
entrópico
Tabela de
Huffman
Imagem codificada
Blocos de 8x8 pontos
Imagem fonte
Capítulo III – COMPRESSÃO DE IMAGENS 93
Essa ordenação d{ relev}ncia especial |s componentes não nulas de baixas
frequências sobre os coeficientes de frequências altas, facilitando a codificação de Huffman. A
Fig.3.12, mostra uma configuração denominada varredura "zig-zag", usada, por exemplo, nos
padrões MPEG2 e MPEG4. A componente de frequência nula concentra uma fração
significante da energia total da imagem e é codificada de modo diferencial. A componente na
frequência nula é denominada contínua DC (Direct Current). As demais componentes são
denominadas alternadas AC (Alternate Current). A fase de codificação entrópica EC (Entropy
Coding) alcança uma compressão melhor sem perdas codificando os coeficientes
estatisticamente.
O padrão JPEG especifica tanto os modos de codificação Huffman como a aritmética.
O codificador sequencial b{sico usa código de Huffman. No entanto, são especificados
codificadores com ambos os métodos para todos os modos de operação. A codificação
aritmética, é mais complexa que o código de Huffman, e normalmente alcança entre um 5% e
10% de melhoria na compressão.
3.5 Compressão Fractal
Compressão fractal é amplamente utilizada em imagens naturais. No entanto, a sua
utilização em imagens médicas ainda é bastante limitada *37+. As an{lises de comparação
utilizando curvas ROC (Receiver Operating Characteristic) mostram claramente que a qualidade
Fig.3.13 – Ordenação dos coeficientes transformados
antes da codificação de Huffman.
94 Capítulo III – COMPRESSÃO DE IMAGENS
da imagem reconstruída para uma mesma taxa de compressão é menor para compressões
que usam fractal do que aquela obtida usando um método baseado na DCT (e.g. JPEG) ou
uma baseada na wavelet (e.g. JPEG2000). No entanto, usando-se métodos híbridos podem-se
ter algumas vantagens na qualidade, no tempo de transmissão e na quantidade de memória
necess{ria para armazenamento *38+.
Mas, em que consiste a codificação fractal? Consiste em representar os blocos de
imagem através de coeficientes de transformações contrativas, explorando o conceito de auto-
similaridade. Assim, nesse tipo de codificação, somente são enviados e armazenados os
coeficientes dessas transformações. Entre as vantagens da compressão fractal estão a r{pida
decodificação, transmissão progressiva, boa compressão e o fato de praticamente não
necessitar de codificadores entrópicos. Apesar das características vantajosas da compressão
fractal, o tempo exaustivo de processamento é a principal barreira na implementação.
3.5.1 Métodos de compressão fractais
Método IFS (Iterated Function Systems):
Utiliza aplicações contrativas, que são funções de transformação que ao se aplicar a
uma imagem, gera outra imagem de menor peso. A ideia básica consiste em passar essa cópia
da saída novamente pela copiadora, num processo recursivo (Fig.3.14). Após várias iterações
desse processo, todas as cópias de saída parecem convergir para a mesma imagem final,
mostrada na Fig.3.15.
Imagem de entrada Imagem de saída Fotocopiadora
Fig. 3.14- Exemplo do sistema de função iterativa [Lv. 24].
Capítulo III – COMPRESSÃO DE IMAGENS 95
Essa imagem é chamada ‚atrator‛ para essa m{quina fotocopiadora específica. Logo,
a imagem inicial não afeta o atrator final. Apenas a posição e orientação das cópias
determinam como a imagem final se parecerá. Uma vez que a fotocopiadora reduz a imagem
de entrada, qualquer imagem inicial será reduzida a um ponto à medida que aumentam as
iterações.
Método PIFS (Partitions Iterated Function Systems):
Subdivide a imagem em uma partição e encontra para cada região resultante outra
parecida na imagem. Esse esquema é conhecido como funções iteradas locais ou
particionadas (transformada fractal). A ideia clave desse método é considerar uma imagem
formada por cópias de partes de si mesma. Na Fig. 3.16, as regiões R1 e R2 são similares
segundo uma transformação apropriada em ambas às imagens.
Fig. 3.16 – Exemplos de similaridade das regiões R1 e R2 [Lv. 24].
Fig. 3.15 – Primeiras 4 cópias geradas pela fotocopiadora [38].
fotocopoadora
. . . . . . .
Imagem original 1era iteração 2da iteração 3era iteração Iteração n
97
Capítulo 4
TW na compressão de imagens
transformada wavelet tem sido considerada uma técnica altamente eficiente na
compressão de imagens, tanto com perdas quanto sem perdas , com grande precisão. Esse
fato, permite seu uso em imagens médicas, processamento de sinais, visão computacional e
em outras aplicações [39][40]. As wavelets são funções definidas sobre um intervalo finito e
tem um valor médio zero. A codificação baseada em wavelet fornece melhorias substanciais
na qualidade de imagem em maiores taxas de compressão [41].
O padrão JPEG2000 define um novo esquema de codificação de imagem usando
técnicas de estado da arte de compressão baseada em tecnologia wavelet. A principal
vantagem do uso de wavelet é que suporta capacidade de transmissão progressiva útil
para telemedicina [42]. No caso de métodos de compressão tradicional para imagens DICOM,
é necessário que a imagem seja comprimida para a quantidade desejada antes da
transmissão. A eficácia e elegância da codificação de imagem embutida e baseada na wavelet
foram manifestadas por Shapiro, incorporadas na zerotree wavelet (EZW) [43].
Posteriormente, Said e Pearlman trabalham sobre a série de particionamento em
árvores hierárquicas (SPIHT) melhorando o EZW codificado. Assim, a wavelet é aplicada com
sucesso na compressão com perdas e sem perdas. O novo padrão JPEG2000 é baseado em um
esquema similar chamado codificação de bloco embutido com truncamento ideal EBCOT
(Embedded Block Coding with Optimal Truncation) [44].
A
98 Capítulo IV – TW NA COMPRESSÃO DE IMAGENS
4.1 Antecedentes
No processamento digital de imagens e sinais, as funções wavelet ajudam a resolver os
problemas. Um deles é a compressão de imagens, para facilitar a transmissão, codificação e
armazenamento. O fato de uma imagem de tamanho M linhas e N colunas possuir MxN
coeficientes wavelet, exatamente o mesmo número de pixels da imagem inicial, é utilizado
na compressão de imagens e é a base para o desenvolvimento de formatos de imagens, tais
como JPEG2000.
Em 1992, Mallat e Zhong detalham um algoritmo para reconstrução de sinais
unidimensionais e imagens a partir de seus pontos de variação de picos ou cristas.
Em 1992, Bertrand aplica a WT discreta para filtragem de perfis elétricos em sinais do
cérebro com a finalidade de melhorar a relação sinal ruído.
Em 1995, Nguyen explica a aplicabilidade de diferentes esquemas de filtragem baseados
em transformadas wavelet para comprimir imagens e eletrocardiogramas. No mesmo
ano, Stollnitz usa a wavelet Haar para compressão de imagens.
Em 2000, Xiong e Ramchandran usam um modelo da WT packet na compressão de
imagens pelo FBI (Federal Bureau of Information).
Em 2001, Larsen usa WT packet para codificar imagens em vários níveis e selecionar
as sub-bandas mais relevantes do conteúdo da informação. No mesmo ano, Perez aplica
a WT para fazer uma filtragem e eliminar o ruído em uma série de imagens médicas. Isso
é feito através da implementação de um algoritmo de cálculo que é baseado na
transformada wavelet com funções de base Haar.
Em 2004, Abrishami apresenta um método aperfeiçoado para reduzir o ruído gaussiano
(speckle) com base na WT. Para isso, transforma logaritmicamente as imagens e as
decompõe de acordo com o algoritmo de Mallat usando como wavelet mãe a função
laplaciana da gaussiana (LoG).
Capítulo IV – TW NA COMPRESSÃO DE IMAGENS 99
4.2 Wavelet
As funções wavelets, geralmente denotadas por ψ(t), são definidas como um conjunto
de funções originadas através das operações matem{ticas de translação e escalonamento da
função escala, com propriedades particulares que as tornam adequadas para servirem de
base para a decomposição de outras funções *45+. A função escala é uma função b{sica
definida em um espaço Vj, usualmente denotada por φ, tendo como funções b{sicas
associadas:
𝜑 𝑡 𝜑( 𝑡 ) (4.1)
Onde:
φ: função escala; i: deslocamento;
j: escala; t: tempo.
Para que uma função seja considerada uma wavelet, é preciso satisfazer as seguintes
condições básicas e necessárias:
1. Que ψ(t) Є L2 (R), isto é, que a função pertença ao espaço das funções do quadrado
integrável ou, o espaço das funções de energia finita, cumpra a equação (4.2):
∫ 𝑡 𝑑𝑡 <
(4.2)
2. Que sua transformada de Fourier 𝑊 satisfaça a condição de admissibilidade *46+*47+:
𝐶𝑣 ∫ 𝜓 𝑤
𝑤 𝑑𝑤 <
(4.3)
Segue da condição de admissibilidade que:
im𝑤 𝑤 (4.4)
100 Capítulo IV – TW NA COMPRESSÃO DE IMAGENS
Assim, se:
𝑊 é continua, então:
, ou seja:
∫ 𝑡 𝑑𝑡
(4.5)
Geometricamente, a condição (4.3) estabelece que o gráfico de 𝑡 deve oscilar de
modo a cancelar as áreas negativas a fim de anular a integral (4.5). Portanto, o gráfico de 𝑡
tem a forma de onda, conforme se ilustra na Fig.4.1 (b). Desde que 𝑡 esteja bem localizado
no tempo, o decaimento será muito rápido, formando uma onda de curta duração.
Atualmente, existem inúmeras funções wavelets que geralmente recebem o nome de
seus criadores. As mais conhecidas, são citadas a seguir, começando pelo exemplo mais
simples, proposto em 1909, pelo matemático Húngaro Alfred Haar (HAAR, 1910). A wavelet
de Haar mostra as grandezas que envolvem os valores, de forma não contínua. De fato,
considere-se desse modo, um caso particular da transformada wavelet discreta definida por:
𝑡 𝑡 𝑡 (4.6)
Por meio da equação (4.6), pode-se obter 𝑡 , apresentada na Fig.4.1 (b).
𝑡 , 𝑎𝑟𝑎 𝑡 < 𝑎𝑠 𝑡𝑟á𝑟
(4.7)
𝑡 {
𝑠 𝑡
𝑠
< 𝑡
𝑎𝑠 𝑡𝑟á𝑟
(4.8)
Capítulo IV – TW NA COMPRESSÃO DE IMAGENS 101
Outra função é a wavelet de Morlet, introduzida por Jean Morlet. Essa função pertence
à família das wavelets não-ortogonais. As wavelets de Morlet não possuem função escala e são
explicadas por uma gaussiana modulada (shifted), levemente ajustada. De forma que
, conforme a equação (4.9), cujo gráfico é apresentado na Fig.4.2:
𝑡 𝐶
⁄ o 5𝑡 (4.9)
Daubechies propôs um procedimento de partida para a construção das bases
ortonormais, ao invés de construir a wavelet e a função de escala através de um subespaço Vj.
Fig.4.1 – a) Função escala de Haar; b) Função wavelet de Haar.
a) b)
Fig.4.2 – Função wavelet de Morlet [92].
102 Capítulo IV – TW NA COMPRESSÃO DE IMAGENS
O procedimento parte de coeficientes apropriados e então investiga se eles correspondem a
uma base de wavelet ortonormal. Esses coeficientes representam um conjunto particular de
números gerados por filtros. Em 1987 as bases ortonormais de wavelets foram consideradas
como funções de suporte compacto contidas no intervalo [0, 2r +1].
Quanto maior o número de coeficientes, mais suave será a wavelet. A construção de
Daubechies resulta em uma coleção de coeficientes Nhn, sendo:
N = 2,3,4, ... e 0 ≤ n < 2N-1;
A seguir apresenta-se um exemplo da wavelet mais simples de Daubechies, a DauB4,
gerada a partir de quatro coeficientes [48].
√
4√
√
4√
√
4√
√
4√ (4.10)
A partir desses coeficientes pode-se construir a função escala:
𝑡 √ ∑ 𝑡 (4.11)
e calcular gn :
√
4√ √
4√ √
4√
√
4√ (4.12)
Assim, a wavelet de Daubechies é dada por:
𝑡 √ ∑ 𝑡 (4.13)
Yves Meyer, em 1980 construiu a primeira wavelet trivial diferente da wavelet de Haar,
que é continuamente diferenciável, o que limita suas aplicações [49]. Dessa forma, uma base
Capítulo IV – TW NA COMPRESSÃO DE IMAGENS 103
wavelet suave ortonormal foi criada. Primeiro, definiu-se a transformada de Fourier 𝑡 de
uma função escala φ(t) como :
𝑡
{
𝑠 𝑡
o *
𝑣 (
4 𝑡 )+ 𝑠
𝑡
4
𝑠 𝑡 > 4
(4.14)
Onde:
𝑣 𝑎 𝑎4 35 84𝑎 7 𝑎 𝑎 𝑎 ∈ (4.15)
Desse modo, a função wavelet 𝝍(t) pode ser encontrada facilmente através de 𝑡 .
𝑡
{
in
𝑣 (
𝑡 ) 𝑠
𝑤
4
𝑡
o *
𝑣 (
4 𝑤 )+ 𝑠
4
𝑤
𝑎𝑠 𝑡𝑟𝑎𝑟
(4.16)
4.3 Transformada wavelet
A transformada wavelet é um método para a localização de frequência completa de um
sinal. No entanto, os sinais mudam ao longo do tempo ou espaço. Por exemplo, um
Fig. 4.3 – a) Função escala de Meyer; b) Função wavelet de Meyer [92].
a) b)
104 Capítulo IV – TW NA COMPRESSÃO DE IMAGENS
eletrocardiograma muda de sinal sobre um marcador de tempo com relação a eventos de
pulsação. Da mesma forma, no contexto de imagens 2D e 3D, um sinal ou uma propriedade
representados pela imagem (como o fluxo de sangue) pode mudar ao longo dos pontos
amostrados no espaço. A principal vantagem da transformada wavelet é sua capacidade de
realizar a análise de multiresolução para localização de eventos em relação a todos os
componentes de frequência de dados ao longo do tempo ou espaço. Assim, a análise
wavelet é capaz de revelar aspectos de dados que outras técnicas de análise de sinal
erram, como o colapso de pontos, e descontinuidades em derivativos de maior ordem.
A teoria da transformada wavelet utiliza dois conceitos principais: escala e deslocamento.
Escala: por meio de dilatação ou compressão, fornece a capacidade de analisar um sinal
sobre janelas diferentes (períodos de amostragem) nos dados.
Deslocamento: através do atraso ou avanço, fornece a tradução do wavelet kernel sobre o
sinal todo.
Em termos gerais, a transformada wavelet de uma função f(t) é a decomposição de f(t) em um
conjunto de funções ψs, τ(t), que formam uma base e são chamadas de "wavelets". A
transformada wavelet é definida como:
𝑊 𝑠 ∫ 𝑡 𝑡 𝑑𝑡 (4.17)
As wavelets são geradas a partir do deslocamento e mudança de escala de uma mesma função
wavelet ψ(t), chamada de "wavelet mãe" e é definida como:
𝑡
√
(4.18)
Onde: S é o fator de escala e,
τ é o fator de deslocamento.
As wavelets ψs, τ(t) geradas a partir da mesma função wavelet mãe ψ(t) têm diferentes
escalas S e localizações τ, mas todas têm a mesma forma. Sempre são usados fatores de
Capítulo IV – TW NA COMPRESSÃO DE IMAGENS 105
escala S> 0. As wavelets são dilatadas quando a escala S > 1, e são contraídas quando
S<1. Assim, alterando o valor de S cobrem-se faixas de frequências deferentes. Valores
grandes do parâmetro S correspondem a frequências de faixa mais baixa, ou uma escala
muito pequena de ψs,τ(t)[50].
4.4 Aplicação no processamento de imagens biomédicas
O uso da transformada wavelet (TW) na {rea de processamento de imagens apresenta
características que se encaixam nas técnicas propostas pela TW. Elas têm sido o foco principal
de pesquisas devido | grande quantidade de informações a serem armazenadas, transmitidas
e manuseadas por parte de usu{rios de computadores *51+. Como as imagens são
representadas como sinais bidimensionais, o seu processamento por meio da transformada
wavelet não é tarefa difícil. Para isso, basta a aplicação da transformada wavelet bidimensional
na matriz que representa a imagem *52+.
A ferramenta matem{tica que faz com que a TW seja um instrumento potente na {rea
de processamento de imagens é a an{lise de multirresolução *53+. Essa an{lise permite que
uma imagem seja decomposta em v{rios níveis de resolução *54+, evidenciando seus detalhes
em cada um desses níveis *55+. É como se aplicasse um ‚zoom‛ na imagem fazendo com que
em uma an{lise de grande escala os pequenos detalhes sejam caracterizados em uma escala
menor. Ao final do processo a caracterização das formas é um conjunto de dados extraídos
em diferentes escalas.
Em outras palavras, as wavelets com o auxílio da an{lise de multiressolução
decompõem a imagem em uma combinação linear de versões transladadas da wavelet mãe em
diferentes escalas. Por exemplo, bordas que são classificadas com uma das características
mais importantes em uma imagem. Esse fato, torna o uso da TW muito útil no processamento
de imagens biomédicas *56+. Outra aplicação útil da transformada wavelet no processamento
de imagens é a compressão que se baseia na eliminação de coeficientes redundantes da
imagem no domínio wavelet *57+, visando reduzir a quantidade de dados desnecess{rios para
106 Capítulo IV – TW NA COMPRESSÃO DE IMAGENS
representar uma imagem digital. A escolha da wavelet para esse tipo de problema depende
muito do que se deseja resolver.
No caso de compressão, ao escolher uma wavelet que melhor se adapta aos dados, os
coeficientes menores do valor previamente estabelecido devem ser truncados. É também
representada por uma codificação esparsa. Dessa forma, a TW é uma excelente ferramenta no
campo de compressão de imagens. Cerca de uma década atr{s, as técnicas baseadas na
transformada wavelet, como a compressão de imagens no sistema JPEG2000, tornou-se uma
tecnologia muito apropriada *51+. O uso da TW, em compressão de imagens, visa representar
uma imagem com o menor número de bits possível. Para isso é preciso reduzir a correlação
existente entre os pixels, concentrando a maior quantidade de informação possível em um
número menor de coeficientes.
Uma imagem comprimida por meio da TW ocupa menos espaço em armazenamento,
otimizando dessa forma, o espaço. Posteriormente, a imagem processada é descompactada a
fim de se obter a imagem original ou uma aproximação da mesma [52]. A escolha, do uso da
transformada wavelet no sistema de compressão é devida à característica da TW apresentar a
capacidade de concentrar informações relevantes em um número de coeficientes menor do
que o originalmente calculado. Além disso, é também flexível com relação à duração e
posição das funções bases, permitindo uma boa representação por um número reduzido de
funções.
4.5 Compressão de imagens utilizando TW
Uma das aplicações da transformada wavelet que tem apresentado um grande sucesso
é a compressão de imagens [58][59][60][61]. Além de apresentar uma grande capacidade de
concentração de energia, a transformada wavelet possui uma forte relação com o sistema
visual humano, o que permite obter uma alta taxa de compressão (bpp) com menores níveis
visíveis de degradação. Uma das propriedades mais atrativas dessa transformada é a sua
flexibilidade com relação à duração das wavelets, o que permite que sinais com conteúdo de
Capítulo IV – TW NA COMPRESSÃO DE IMAGENS 107
frequência variado, possam ser bem representados com um número reduzido de funções.
Além disso, a utilização da transformada wavelets diminui sensivelmente o efeito de
blocagem, que é um dos principais problemas do JPEG. As wavelets mais longas podem ser
utilizadas para representar por exemplo, as regiões planas de uma imagem (baixa
frequência), enquanto que as wavelets mais estreitas são utilizadas para representar as regiões
de textura (alta frequência) [62][63].
4.6 A transformada wavelet discreta (DWT)
A equação (4.19) define a TWC:
𝑥 𝑡
∫ ∫ {(𝑊𝜓𝑥) 𝑎 }
√
(4.19)
Onde:
ψ: função wavelet
a: parâmetro de escala
b: parâmetro de translação
Depara-se com a presença de redundâncias, pois os parâmetros a e b variam
continuamente. Esse problema é contornado por meio de discretização de a e b. Esse processo
origina a transformada wavelet discreta TWD. De acordo com a literatura [64], uma
discretização típica é do tipo:
𝑎 𝑎
𝑎
Com j, k ϵ Z, a0 > 1 e b0 >0.
A wavelet discreta pode-se escrever como:
𝑡 𝑎
𝑎 𝑡 (4.20)
Desse modo, tem-se a transformada wavelet discreta direta e inversa respectivamente:
108 Capítulo IV – TW NA COMPRESSÃO DE IMAGENS
𝑊 𝑑 ⟨ 𝑡 𝑡 ⟩ ∫ 𝑡 𝑡 𝑑𝑡 (4.21)
𝑡 ∑ ∑ 𝑡 𝑑
(4.22)
Dessas equações observa-se que:
(1) A TWD é definida apenas para valores de escalas positivos (a0 > 1);
(2) O passo da translação é proporcional à escala 𝑎
;
(3) A TWD produz um conjunto finito de coeficientes wavelet 𝑊𝜓𝑥 ;
(4) O processamento é realizado sobre tempo contínuo.
4.7 Transformada wavelet rápida (FWT)
A transformada wavelet rápida FWT (Fast Wavelet Transform) é uma implementação
computacional eficiente da transformada wavelet discreta que aproveita a relação entre os
coeficientes da DWT e escalas adjacentes. As expressões associadas são da seguinte forma:
𝑊𝜓 ∑ 𝜓 𝑚 𝑊 𝑚 𝑚 (4.23)
𝑊 ∑ 𝑚 𝑊 𝑚 𝑚 (4.24)
Essas equações, também podem ser expressas mediante a operação linear de
convolução, com os coeficientes wavelet e de escalamento, revertidos no tempo, e pode
ser escrito como:
𝑊𝜓 𝜓 𝑊 𝑛 (4.25)
𝑊 𝑊 𝑛 (4.26)
Capítulo IV – TW NA COMPRESSÃO DE IMAGENS 109
Onde as convoluções são avaliadas em instantes n = 2k para k ≥ 0. A Fig.4.1 reduz
essas operações, para a forma de diagrama de blocos.
O banco de filtros da Fig.4.4 pode ser usado iterativamente para criar
estruturas multietapas que permitam calcular os coeficientes da DWT em duas ou
mais etapas sucessivas. A transformação inversa, chamada FWT-1 ou a síntese, pode ser
alcançada com a mesma metodologia dos filtros, mas dessa vez não invertidos no
tempo. Esse processo é mostrado na Fig.4.5. Como antes, se a transformação direta tem mais
de duas etapas, então a transformação inversa também às terá.
4.8 Transformada wavelet em duas dimensões
Ao se trabalhar com imagens, e se deseja aplicar uma TW, é necessário trabalhar no
espaço L2, porque as imagens são sinais bidimensionais. Considera-se então uma
aproximação separável, ou seja, separam-se as funções wavelet e de escala, como se segue [5]:
h𝝍(-n) 2 ↓
h𝝋(-n) 2 ↓
W𝝍(j,n)
W𝝋 (j,n)
W𝝋 (j,n)
Fig.4.4 – Banco de filtro de análises da FWT [Lv 12].
W𝝋 (j,n)
W𝝍(j,n) h𝝍(n) 2 ↑
h𝝋(n) 2 ↑
W𝝋 (j+1,n)
Fig.4.5– Banco de filtro de sínteses da FWT-1 [Lv. 12].
110 Capítulo IV – TW NA COMPRESSÃO DE IMAGENS
• A função de escala, 𝜑 𝑥 𝑦 ;
• E três wavelets bidimensionais, 𝐻 𝑥 𝑦 𝑉 𝑥 𝑦 𝐷 𝑥 𝑦
Cada uma delas é o produto da função de escala 𝝋 unidimensional e a
correspondente wavelet 𝝍. Excluindo-se os produtos unidimensionais que são produzidos, os
quatro produtos que permanecem são:
• Uma função de escala separável
𝜑 𝑥 𝑦 𝜑 𝑥 𝜑 𝑦 (4.27)
• E as wavelets separáveis
𝐻 𝑥 𝑦 𝑥 𝜑 𝑦 (4.28)
𝑉 𝑥 𝑦 𝜑 𝑥 𝑦 (4.29)
𝐷 𝑥 𝑦 𝑥 𝑦 (4.30)
Essas wavelets medem as mudanças da intensidade ou nível de cinza. 𝐻, mede as
variações ao longo das colunas; 𝑉 ao longo das linhas verticais e 𝐷 as variações diagonais.
Definindo-se as funções como funções separáveis, é mais fácil analisar a função 2D e
pode-se centrar na implementação de wavelet 1D e nas funções de dimensionamento. As
equações de análise e síntese são modificadas para:
𝑊 𝑚
√ ∑ ∑ 𝑥 𝑦 𝜑 𝑚 𝑛
𝑦
𝑥 𝑥 𝑦 (4.31)
𝑊𝜓 𝑚
√ ∑ ∑ 𝑥 𝑦 𝑚 𝑛
𝑥 𝑦 𝐷 𝑦
𝑥 (4.32)
𝑥 𝑦
√ 𝑁∑∑𝑊 𝑚
𝑛𝑚
𝜑 𝑚 𝑛 𝑥 𝑦
√ ∑ ∑ ∑ ∑ 𝑊𝜓
𝑚 𝑚 𝑛 𝑥 𝑦 𝑛𝑚
𝐷 𝐻 𝑉 𝐷 (4.33)
Capítulo IV – TW NA COMPRESSÃO DE IMAGENS 111
Essa é a forma geral de uma transformada wavelet 2D. Se as funções de escala e a
wavelet são separáveis, então a soma pode ser decomposta em dois estágios. O primeiro passo
é ao longo do eixo-x, e em seguida se calcula ao longo do eixo-y. Para cada eixo, pode-se
aplicar uma transformada wavelet rápida para acelerar a velocidade. O diagrama é mostrado
na Fig.4.7b. O sinal bidimensional (por exemplo correspondente a uma imagem) é dividido
em quatro bandas: LL (esquerdo-superior), HL (direito-superior), LH (esquerdo-superior)
a) b)
Fig.4.7 – a) Imagem original Lena; b) Imagem Lena depois da decomposição [10].
h[n]
g[n]
x[m,n]
along n
along n along m
along m
X1,L[m,n]
↓ ↓
V1,L[m,n]
L [m,n] X1, H1 [m,n]
h[m] ↓
g[m]
Fig.4.6 – Diagrama esquemático da transformada wavelet 2D [Lv. 12].
along m
along m
↓
↓
V1,H [m,n]
X1, H3[m,n]
h[m] ↓
g[m]
X1, H2[m,n]
112 Capítulo IV – TW NA COMPRESSÃO DE IMAGENS
e HH (direito-baixo). A banda HL indica a variação ao longo do eixo x, enquanto a
banda LH mostra a variação do eixo-y. A Fig. 4.7b, mostra a decomposição de uma
imagem. A banda LL é mais compacta. Por outro lado, no ponto de codificação, podem-se
gastar mais bits.
4.9 Propriedades wavelets
Em compressão de imagens existem algumas propriedades importantes que foram
discutidas por vários autores [109], [110], [111]. As características wavelet correspondem às
propriedades do filtro no banco de filtros. A Tabela (4.1) apresenta as propriedades de alguns
filtros.
Propriedades
Wavelets Po Longitude (A,S) Vo (A) Smax GDD
D4A 0 8,8 4 1,77 4,46
D4LA 0 8,8 4 1,77 0,46
D5A 0 10,1 5 2,1 8,05
D5LA 0 10,1 5 2,1 0,11
D6A 0 12,12 6 2,39 12,73
D6LA 0 12,12 6 2,39 0,48
D7A 0 14,14 7 2,66 18,50
D7LA 0 14,14 7 2,66 1,97
D8A 0 16,16 8 2,91 25,38
D8LA 0 16,16 8 2,91 0,50
D9A 0 18,18 9 3,16 33,45
D9LA 0 18,18 9 3,16 0,48
D10A 0 20,2 10 3,40 42,56
D10LA 0 20,2 10 3,40 0,53
B9/7 0,015 9,7 4 2,12 0
B22/14 0,011 22,14 5 3,16 0
Tabela 4.1-Propriedades de algumas wavelets.
Capítulo IV – TW NA COMPRESSÃO DE IMAGENS 113
Ortogonalidade: os filtros ortogonais conduzem a funções base wavelet ortogonais.
Portanto, o resultado da transformada wavelet é a conservação da energia. Isso implica
que o erro quadrático médio MSE (Mean Square Error) introduzido durante a quantização
dos coeficientes DWT é igual ao MSE no sinal reconstruído. Para bancos de filtros
ortogonais, os filtros de síntese são transpostos aos filtros de análises. No caso de wavelets
bi ortogonais, as funções base não são ortogonais e assim não há conservação da energia.
Para medir o desvio wavelet de ortonormalidade se faz uso do parâmetro de
ortogonalidade (Po), dado pela equação:
∫ 𝑤 𝑑𝑤
(4.34)
Onde: O(w) é a resposta em frequência ao filtro passa tudo definido por:
O(z) = H(z)H(z-1) + G(z)G(z-1) (H e G são respectivamente, as transformadas Z dos filtros
de análises passa baixas e passa altas).
Longitude dos filtros: os filtros mais longos são responsáveis pelo ruído ressonante na
imagem reconstruída a baixas taxas de bits. Na Tabela 4.1 as wavelets D8A – D10A, D8LA –
D10LA, B22/14 , têm filtros de síntese de longitude mais longos, enquanto que D4A – D6A, D4LA
– D6LA, B9/7, têm filtros de síntese mais curtos.
Ordem de desvanecimento (Vo): é uma medida da propriedade de compactação das
wavelets [112]. Corresponde ao número de zeros (k) em w = π para H(w). Um Vo de k
permite que as entradas polinomiais l,..., tk-1 sejam conservadas pelos filtros passa baixas
de análise e aniquilados pelos filtros passa altas de síntese.
∫ 𝑡 𝑡 𝑑𝑡
(4.35)
No caso de wavelets ortogonais, a função wavelet de análise é a mesma que a função
wavelet de síntese (ϕψ(t) = ψ(t)). Nas wavelets bi ortogonais, a função wavelet de análise
114 Capítulo IV – TW NA COMPRESSÃO DE IMAGENS
(ϕψ(t) é diferente da wavelet de síntese ψ(t)). Pode-se observar na Tabela 4.1 que as
wavelets mais longas têm um Vo mais alto que as wavelets mais curtas.
Regularidade: corresponde a uma forma de medir a suavidade nos sinais. Um alto grau
de regularidade indica suavidade na vizinhança do ponto onde se calcula. Uma primeira
forma de medir a regularidade consiste em verificar a existência de suas derivadas até
ordem k. A suavidade da função de escalonamento de síntese é medida pela expressão
Smax e corresponde ao número de derivadas de ϕ(t). A relação assintótica entre Smax e
Vo(p) para filtros de Daubechies é mostrada na equação (4.34). Na Tabela 4.1 se observa
que Smax é incrementada conforme se incrementa Vo.
𝑚á𝑥 75 (4.36)
Onde:
c é uma constante.
Suporte compacto: O suporte de uma função x(t), corresponde a todos os valores do
intervalo de tempo, tal que supp (x) = ,tєR : x(t) ≠ 0 }. Uma função possui suporte finito se
existem dois números {tmín, tmáx}є R, tal que:
𝑠𝑢 𝑥 𝑡𝑚í𝑛 𝑡𝑚á𝑥 (4,37)
Se o suporte é finito {tmáx - tmín} < ∞, então se denomina suporte compacto. O
suporte compacto das funções wavelets facilita a representação localizada dos
sinais por meio da TW, o qual é importante em aplicações tais como, compressão,
detecção de sinais e redução de ruído.
Capítulo IV – TW NA COMPRESSÃO DE IMAGENS 115
4.10 Propriedades wavelet no contexto de aplicações biomédicas
As principais características das wavelets na área da biomedicina são as seguintes:
Wavelets como um banco de filtros: A transformada wavelet pode ser vista como um
tipo especial de analisador de espectro. As mais simples características globais podem ser
extraídas desse tipo de sistema que são estimativas de energia em várias bandas de
frequência. Características espectrais desse tipo têm sido utilizadas para discriminação
entre vários estados fisiológicos.
Outra aplicação comum de ‚wavelet como um filterbank‛ é a redução de ruído
pelo encolhimento seletivo de coeficientes de certas frequências de bandas. Dois
exemplos são: (1) a análise do som do coração turbulento para detectar a doença arterial
coronariana [65] e; (2) a caracterização de estados de atividade electrocortical fetal [66].
Se as funções de transferência dos filtros discretos associados com um canal m
redundante de decomposição wavelet diádica são denotados por G1(w),...,Gm-1(w),
Hm(w), onde : 𝑤 𝑤 e Hm(w) são filtros passa-baixas, então é possível obter
um algoritmo de reconstrução. Se os filtros de síntese na Fig.4.8 são escolhidos de tal
forma que:
𝑚 𝑤 𝑚 𝑤 ∑ 𝑤 𝑤 𝑚 (4.38)
E se a wavelet 𝝍(x) é derivada de uma análise multiresolução, então o correspondente
filterbank pode ser implementado usando uma versão adaptada ("a trous") do algoritmo
rápido de Mallat sem sub-amostragem [67], [68]. Esse tipo de decomposição wavelet
reversível pode ser a base para uma implementação de redução de ruído e algoritmos de
melhoria de imagem.
O princípio é inserir um componente adicional de processamento, que seletivamente
modifica as componentes wavelet antes da reconstrução.
Essa abordagem tem sido adaptada para redução de ruído em imagens MRI e CT.
116 Capítulo IV – TW NA COMPRESSÃO DE IMAGENS
Wavelets como um filtro multiescala combinado: em essência, a CWT realiza uma
análise de correlação de modo que sua saída seja máxima quando o sinal de entrada se
assemelha ao modelo de análise ψs,t. Esse princípio é a base para o filtro combinado, que
é o detector ideal de um sinal determinístico na presença de ruído aditivo. Essa
propriedade tem sido explorada, por exemplo, na detecção de certos sinais ‚waveform‛ de
eletroencefalograma EEG (Electroencephalography) . No entanto, as wavelets base não são
Fig.4.9-Resposta da frequência multibanda do filterbank discreto
associado com a wavelet Battle-Lemarie spline cúbica.
Fig.4.8-Wavelets como um banco de filtros. Reconstrução
do filterbank discreto sem subamostragem.
G3(w)
G2(w)
G1(w)
Hm(w)
C1(k)
C2(k)
C3(k)
Cm(k)
f(k)
�� w
()()(w
�� w
(w)
�� w
��𝑚 w
(w)
f(k) +
Capítulo IV – TW NA COMPRESSÃO DE IMAGENS 117
bem adaptadas para representar funções cuja transformada de Fourier têm um
suporte bom de altas frequências.
Bases wavelets: o aspecto mais notável da teoria wavelet é o de construir bases
wavelets de L2. Assim, as wavelets fornecem uma representação uma a uma do sinal em
termos de seus coeficientes (transformação linear reversível). A compressão de dados,
assim como a eliminação do ruído pode ser conseguida por meio de quantização e
contração no domínio wavelet, ou descartando-se os coeficientes que sejam
insignificantes.
4.11 Aplicações à tomografia assistida por computador (CAT)
O problema da tomografia computadorizada CAT (Computed Axial Tomography) 2-D é
reconstruir um objeto 𝑥 𝑥 𝑥 𝑥 ∈ a partir dos valores medidos de suas projeções
angulares. Essas medições são descritas pela transformada Radon da imagem f que fornece
as integrais de linha de f ao longo da direção especificada pelo ângulo θ [Fig. 4.7(a)].
𝑡 ∫ 𝑡 𝑠 𝑢𝑠 𝑡𝑠 𝑢 𝑠 𝑑𝑢
(4.39)
No caso ideal em que as variáveis x, t, e θ são definidos de forma contínua, a fórmula
de inversão é fornecida pela identidade de retroprojeção filtrada (FBP) [69],[70].
𝑞 (4.40)
Isso é válido para qualquer função em L2(R2). O operador K na equação
4.40 representa a parte filtrada da fórmula, em que cada projeção é convolucionada com um
filtro q cuja transformada de Fourier é:
�� 𝑤 𝑤 (4.41)
118 Capítulo IV – TW NA COMPRESSÃO DE IMAGENS
O operador adjunto R* é a retroprojeção:
𝑥
∫ 𝑥 𝑠 𝑥 𝑠 𝑑
(4.42)
Calcula-se a média angular de toda projeção originada pelo ponto x, ou seja, os valores de
projeção (filtrados) 𝑡 𝑞 𝑡 com 𝑡 𝑥 𝑠 𝑥 𝑠 e . Ver Fig.
4.7(b). A fórmula de FBP (Filtro Passa Baixas) contínua (equação 4.38) é equivalente
ao teorema da fatia central, que afirma que a transformada de Fourier 1-D de 𝑡 é a linha
através da transformada de Fourier 2-D de f. A principal motivação da utilização de
wavelets para tomografia é o efeito de localização espacial do filtro �� 𝑤 , que é devido a
sua singularidade em w = 0. Esse efeito é atenuado pelos zeros correspondentes das
funções wavelet [71]. A mais simples aproximação para se obter uma reconstrução
wavelet de f é avaliar os coeficientes wavelets 2-D de f usando diretamente a equação 4.37. Para
a) b)
Fig.4.10-Operadores de tomografia básica. a) A projeção tomográfica 𝑅𝜃𝑓 𝑡 é a coleção de
integrais de raios paralelos através do objeto f na direção especificada por θ; a
transformada Radon é o conjunto de todas as projeções angulares para 𝜃𝜖 𝜋
b) O operador de retroprojeção fornece um mapeamento reverso do domínio Radon que
volta ao domínio objeto. Especificamente, (R*p) (x) representa a média angular de toda
projeção P(t,θ) originada pelo ponto x.
t Rθf(t)
θ
x
y
P(t, θ = π/2)
(R*p) (x1, x2)
P(t, θ)
Capítulo IV – TW NA COMPRESSÃO DE IMAGENS 119
esse fim, primeiro convoluciona-se f com a função de análise 2-D 𝜑 𝑥 𝑎
𝜑 𝑥 𝑎 e
reescreve-se a identidade FBP para esse sinal pré-filtrado.
𝜑 𝜑 𝜑
𝑞 (4.43)
Onde, no lado direito, tem-se combinado a transformada Radon da função análise 2-D
com q dentro de um filtro modificado (ângulo-dependente).
𝑞 𝑡 𝑞 𝜑 𝑡 (4.44)
Note-se que no caso wavelet, pode-se calcular o produto interno (wavelets ou
coeficientes spline) usando-se um esquema modificado FBP.
𝑎 ⟨ 𝑥 𝜑 𝑥
𝑎 ⟩
𝑞 𝑥 𝑥 (4.45)
Essa abordagem foi pela primeira vez proposta para reconstrução tomográfica de escala fixa.
4.12 Seleção efetiva das características wavelet
Uma pergunta importante quando se usa a transformada wavelet para compressão de
imagens é, como as características das wavelets associadas com o banco de filtros estão
relacionadas ao desempenho do sistema de compressão de imagens [Ts 5]. Antonini propõe
que um banco de filtros onde a wavelet de análise tem um grande número de momentos de
desvanecimento e a wavelet de síntese tem um alto grau de regularidade, trabalham bem em
compressão de imagens.
120 Capítulo IV – TW NA COMPRESSÃO DE IMAGENS
4.12.1 Seleção da função wavelet
Em aplicações de compressão de imagens, as propriedades importantes das funções
wavelets dão suporte compacto (permitem uma implementação eficiente), simetria (útil para
evitar deslocamentos ou defasagens no processamento da imagem), regularidade e grau de
suavidade (relacionado à ordem ou longitude dos filtros).
Em [106], analisam-se 4 tipos de famílias de wavelets: HW (Haar Wavelets), DW
(Daubechies Wavelets), CW (Coiflet Wavelets), e BW (Biorthogonals Wavelets). Cada família
wavelet pode ser parametrizada por um inteiro N que determina a ordem do filtro.
As wavelets bi ortogonais podem usar filtros com similar ou diferente ordem para
decomposição (Nd) e reconstrução (Nr). As Daubechies e Coiflet são famílias de wavelets de
suporte compacto. As wavelets de suporte compacto correspondem a filtros de resposta ao
impulso finita FIR (Finite Impulse Response) e, assim permitem uma implementação eficiente.
A principal desvantagem da DW e CW é a assimetria, a qual pode causar artefatos nas
bordas das sub-bandas wavelets. A DW é assimétrica enquanto a CW á quase simétrica. A
simetria nas wavelets pode ser obtida somente com a renúncia do suporte compacto, ou seja,
da ortogonalidade da wavelet (exceto a HW, a qual é ortogonal, de suporte compacto e
simétrico). Quando se deseja simetria e suporte compacto nas wavelets, deve-se relaxar a
condição de ortogonalidade e admitir funções wavelets não ortogonais, condição essa que
cumprem as wavelets bi ortogonais.
4.12.2 Ordem e longitude dos filtros
A longitude do filtro L é determinada pela ordem do filtro, mas a relação entre a
ordem do filtro e a longitude do filtro é diferente para diferentes famílias de wavelets [106]. A
longitude dos filtros é aproximadamente L = Max(2Nd, 2Nr) + 2. No entanto, a longitude
efetiva é diferente para um filtro tipo passa baixas e um passa altas usados para
decomposição e reconstrução e pode ser determinado para cada tipo de filtro. Os filtros com
uma alta ordem podem ser projetados para que tenham uma boa localização em frequência.
Capítulo IV – TW NA COMPRESSÃO DE IMAGENS 121
Filtros com baixa ordem têm uma melhor localização no tempo e conservam informação
importante nas bordas. A compressão de imagens baseada em wavelets prefere funções
suaves que podem ser obtidas usando-se filtros longos. Isso porque a complexidade do
cálculo da DWT aumenta pelo incremento da longitude dos filtros. Assim, em aplicações de
compressão de imagens deve-se encontrar um compromisso entre a longitude dos filtros,
grau de suavidade, e complexidade computacional.
4.12.3 Número de decomposições
A qualidade da imagem depende do número de decomposições (l). O número de
decomposições determina a resolução do mais baixo nível no domínio wavelet. A compressão
pode ser melhorada ignorando-se todos os coeficientes abaixo do limiar.
Por outro lado, um grande número de decomposições causa a perda da eficiência do
algoritmo de codificação. Dessa maneira, a decomposição adaptativa requer um
compromisso entre a qualidade da imagem e a complexidade computacional. O PSNR (Peak
Signal to Noise Ratio) tende a saturar para um número grande de decomposições [106]. Dessa
forma, o número ótimo de decomposições depende da ordem do filtro.
4.12.4 Complexidade computacional
A complexidade computacional da transformada wavelet para uma imagem de
tamanho NxN e que faz uso da decomposição di{dica é dada aproximadamente pela equa.
4.46 *106+:
𝐶 6𝑁 4 𝑙 3 (4.46)
Onde:
L é a longitude do filtro e,
l é o nível de decomposição wavelet.
122 Capítulo IV – TW NA COMPRESSÃO DE IMAGENS
4.13 Wavelets adequadas para a compressão
V{rios autores estudaram a adaptação de bases wavelets para compressão de imagens.
A partir da decomposição ortogonal teoricamente poder-se-ia guiar a correlação entre os
coeficientes da transformada.
A restrição de ortogonalidade conduz a graus de maior liberdade, os quais podem ser
explorados para melhorar outros critérios *72+. Em *73+, o estudo da resposta para o passo e o
impulso dos filtros conduziram | predição de bons e maus filtros. Como objetivo procurou-se
minimizar os efeitos ressonantes que frequentemente acontecem perto das bordas.
Shang aperfeiçoa o experimento numérico através de wavelets em *74+. Porém, essas
wavelets são também construídas usando-se outro critério baseado nas propriedades da
frequência dos filtros a fim de facilitar a otimização. Para evitar sobreajuste, v{rias imagens
são usadas como um grupo de teste, assim como para eliminar wavelets com generalização
pobre. Focalizando-se em um grupo de imagens, é possível ajustar a escolha da base wavelet.
Isso foi feito, por exemplo, pelo FBI para a compressão de imagens de impressões digitais
*75+. As transformadas wavelets originais são implementadas usando-se wavelets ortogonais,
quer dizer, usando-se filtros ortogonais.
Com os filtros ortogonais, a transformada wavelet pode ser vista como uma projeção
do sinal de entrada em um grupo de funções de base ortogonal *80+. Se os filtros estão
normalizados, então a transformada wavelet conserva a energia. Para um sinal de entrada x*n+
de longitude N, a propriedade de conservação da energia que é semelhante | relação de
Parseval pode ser vista como:
∑ 𝑥 ∑ 𝑤 𝐿 𝑙
𝑛 (4.47)
A propriedade de conservação da energia é conveniente para o projeto de sistemas de
compressão j{ que significa uma distorção quadr{tica que é introduzida pela quantificação
dos coeficientes. Isso corresponde | distorção quadr{tica no sinal reconstruído. Assim, a
Capítulo IV – TW NA COMPRESSÃO DE IMAGENS 123
propriedade de conservação da energia simplifica o projeto do compressor j{ que o projeto do
quantificador pode ser desenvolvido completamente no domínio da transformada.
A transformada wavelet ortogonal tem algumas inconveniências que a torna não muito
ideal para ser usada em um sistema de compressão. Uma das inconveniências pode ser vista
na equação (4.45), onde o número total de coeficientes de entrada N, não tem porque ser igual
ao número total de coeficientes da wavelet L.
Em geral, L é maior que N e a transformada wavelet aumenta o número de coeficientes.
De fato, considere-se um sinal de longitude N (par) e filtros wavelet de tamanho L (par). As
saídas dos filtros têm longitude L+N-1 *76+ e a saída após a subamostragem ter{ longitude (L
+ N) /2.
Dessa forma, o sinal original de longitude N d{ lugar a um total de L + N coeficientes
wavelets após um nível de transformação. Quando se aumenta o número de níveis de
decomposição o problema também aumenta. A expansão dos coeficientes é um problema
para os sistemas de codificação cujo objetivo é reduzir, não aumentar, a quantidade de
informação que seria codificada. Uma forma simples de eliminar a expansão de coeficientes é
usar convolução circular em vez de usar convolução linear no sinal finito de entrada x*n+.
Em resumo, as transformadas wavelets bi ortogonais tem a vantagem de poderem usar
filtros de fase linear, mas a desvantagem é que eles não conservam a energia.
125
Capítulo 5
Padrão DICOM
urante os últimos trinta anos tem havido um grande desenvolvimento da tecnologia
digital. Os computadores entraram em quase todos os aspectos de nossas vidas e tornaram-
se cada vez mais importantes em aplicações médicas. Muitos métodos de tratamento e
processamento de imagens médicas utilizados hoje, em sua maioria, dependem do
processamento em computadores. Esses são usados não só para armazenar ou exibir
imagens, mas também para gerar imagens ou modelos em 3D, partindo-se de um conjunto de
entrada de dados.
Os dados são obtidos a partir de dispositivos de imagem, por exemplo: CT,
MRI, SPECT, PET. Devido ao desenvolvimento de equipamentos de imagens médicas, é
muito importante definir um padrão para conexão e troca de informações entre aparelhos
médicos. É assim que surge DICOM (Digital Imaging and Communications in Medicine), que é o
formato padrão para transferência de imagens radiológicas e outras informações médicas
entre computadores. O sistema permite uma comunicação digital entre os equipamentos de
diagnóstico produzidos por vários fabricantes.
Por exemplo, as estações de trabalho, CT scanners, geradores de imagens MRI,
digitalizadores de filmes, arquivos compartilhados, computadores host e mainframes feitos por
v{rios fornecedores e localizado em um site ou em v{rios sites que podem ‚falar entre si‛ por
meio de DICOM através de um sistema aberto ‚open system‛ da rede.
D
126 Capítulo V – PADRÃO DICOM
Como resultado, tem-se:
• Transmissão, persistência, consulta e recuperação de objetos complexos. As imagens
médicas podem ser capturadas e transmitidas mais rapidamente;
• Execução de ações específicas. Os médicos podem fazer diagnósticos de forma mais
r{pida, e as decisões de tratamento podem ser feitas mais rapidamente;
• Qualidade e consistência na apresentação de imagens;
• Gestão de processos, diminuição dos custos ao se fazer o diagnóstico em outra
localidade.
O padrão DICOM 3.0 evolui a partir de versões 1.0 (1985) e 2.0 (1988) de um padrão
desenvolvido pelo ACR (American College of Radiology) e a NEMA (National Electrical
Manufacturers Association). A RNSA (Radiological Society of North America) começa a trabalhar
com a seção MedPacs ACR-NEMA ad hoc, em 1992. Devido | r{pida evolução das redes de
computadores e dos sistemas de comunicação, o padrão é reformulado. Adotam-se métodos
de orientação a objetos para o desenvolvimento da nova versão (PRIOR, 2001). Em 1995, o
DICOM é aceito como um padrão formal na Europa (OFFIS, 2001). Ele define, entre outras
coisas (OFFIS, 2001):
• Estrutura de dados para imagens médicas e informações relacionadas;
• Serviços relacionados | comunicação:
- Transmissão e persistência de objetos completos (como imagens);
- Consulta e recuperação de imagens em uma base de dados (PACS) e impressão.
• Formatos para armazenamento das informações;
• Qualidade e consistência da aparência da imagem (para visualização e impressão) *77+.
5.1 Definições
DICOM é o padrão mais importante e estendido comercialmente para a transferência
de imagens e informação médica entre dispositivos eletrônicos. Embora não seja um padrão
de compressão sobre imagens médicas, é imprescindível sua consideração na compressão.
Capítulo V – PADRÃO DICOM 127
DICOM permite aos usuários integrar uma equipe com dispositivos de diferentes fabricantes
para suportar um amplo intervalo de modalidades de imagens médicas evitando-se toda uma
série de problemas que poderiam se derivar de incompatibilidades entre dispositivos de
diferentes fabricantes [78].
Todos os equipamentos que estejam de acordo com o formato DICOM pode se
conectar com PACS para transportar e trocar informação com outros equipamentos,
diretamente. Esse padrão foi desenvolvido pela ACR (American College of Radiology) e NEMA
(National Electrical Manufacturers Association). A primeira dessas instituições, a ACR, tem sido
a responsável por proporcionar direção técnica e assessoramento médico ao padrão. A
NEMA tem atuado como entidade de publicação, assessoramento legal para evitar conflitos
de interesse ou possíveis violações no âmbito de trabalho do padrão.
5.2 Aspectos relevantes de DICOM
1) DICOM
• Est{ orientada a objetos usando um modelo entidade-relação;
• Cada entidade é identificada com uma classe. Cada inst}ncia é um objeto que é
definido por um conjunto de atributos.
2) Necessidade de DICOM
Armazenamento
• A imagem médica somente não faz sentido. É necess{rio ter os dados do paciente;
Os formatos de imagem TIFF (Tagged Image File Format) e JPEG (Joint Photographic
Experts Group) não cumprem as condições necess{rias;
• Um estúdio é uma unidade.
Comunicações
• Aumento do número de equipes que trabalham com imagens digitais;
• Comunicação de equipes heterogêneas entre si (modalidade - estações PACS);
128 Capítulo V – PADRÃO DICOM
• Necessidade de um protocolo comum de trabalho para todas as equipes:
- Formato comum de imagem;
- Di{logos normalizados entre equipes.
3) DICOM e cen{rios
Um profissional clínico usa sua estação de trabalho em seu escritório
• Recebe notificação da tomografia que foi realizada para um novo estudo;
• Procura estudos anteriores do mesmo paciente no arquivo;
• Os estudos são carregados para seu computador;
• Visualiza os estudos em conjunto, seleciona uma série de imagens e a imprime
sobre uma placa.
Um paciente chega ao serviço de radiologia
• O seu dado pessoal é obtido automaticamente do sistema de informação hospitalar;
• Os estudos de imagem que se necessita são introduzidos e carregados diretamente
para as equipes de aquisição apropriadas;
• Quando um paciente chega ao computador, automaticamente se sabe quais
imagens são necess{rias. Uma vez obtidas, todas as PACS / RIS é notificado o fim
da tarefa bem como a existência de novos estudos.
4) Objetivos de DICOM
• Formatar digitalmente uma imagem;
• Prover um protocolo de troca de dados;
• Prover uma estrutura de arquivos;
• Servir para imagens biomédicas e informações relacionadas com essas imagens.
Capítulo V – PADRÃO DICOM 129
Paciente IOD
Descritor de
estudo básico IOD
Vista IOD 1
1
1-n 1
Referências
Referências
Referências Descreve
1 1-n
Caixa VOI
LUT IOD
1
0-n
1
1-n
Fig.5.1 – Esquema (entidade-relação) da definição de DICOM.
Caixa de filme IOD
1
0-n
1-n Contém
Anotação IOD
Seção de filme IOD
Impressora IOD
Trabalho de
impressão IOD
1
1
0-1
1 0-n
1-n
Referências Impressões
É rastreado por
1-n
1
Referências Veja nota Referências
Referências
Resultados IOD
Interpretação
IOD
Imagem
IOD
Curva Independente
IOD
Envoltório Independente
IOD
VOI LUT IOD
Independente
Mod. LUT IOD
Independente
0-n
1
0-1
1-n
Composta por Estudo IOD Componente
de estudo IOD
1-n 1
Paciente IOD
Descritor de
estudo básico IOD
Vista IOD
1
1-n
1
1
1
Referências
1-n
Referências
Referências Descreve
0-n
0-n
0-n 0-n
1
Caixa de
sobreposição de
imagens IOD
Caixa de
imagens IOD
1-n
1-n
0-1
1-n 1-n 0-1
Referências
Referências Referências
Referências Referências
130 Capítulo V – PADRÃO DICOM
5) Capas de DICOM
6) Partes de DICOM
• Parte 1: Introdução e visão geral;
• Parte 2: Conformidade;
• Parte 3: Definições do objeto informação;
• Parte 4: Especificações de classe serviço;
• Parte 5: Estruturas de dados e codificação;
• Parte 6: Dicion{rio de dados;
• Parte 7: Interc}mbio de mensagens (operações da rede);
• Parte 8: Suporte de comunicação de rede para troca de mensagens;
• Parte 10: Armazenamento de mídia e formato arquivo para intercambio de dados;
• Parte 11: Perfis de aplicação de armazenamento de mídia;
• Parte 12: Formatos de mídia e mídia física para interc}mbio de mídia;
• Parte 14: Função display padrão de escala cinza;
• Parte 15: Segurança e perfis de gerenciamento do sistema;
OSI Sessão do Kernel
OSI Elemento de serviço de controle
de associação
Transporte OSI
OSI Sessão do Kernel
OSI Elemento de serviço de controle
de associação
Fig.5.2 – Esquema das capas de DICOM [Lv. 5].
Ambiente ponto a ponto
Ambiente de rede
DICOM - Troca de mensagens de aplicação
Aplicação de imagem médica
Padrão de camadas de rede física
(Ethernet, FDDI, etc.)
TCP
IP
DICOM
Protocolo da
camada superior
TCP/IP
DICOM
Seção/
Transporte/
Rede
(STN)
DICOM
Ligação de dados
DICOM
Físico(50-pin)
Rede OSI
LLC
Transporte OSI
OSI Sessão do Kernel
OSI Apresentação Kernel
OSI Elemento de serviço de controle
de associação
Capítulo V – PADRÃO DICOM 131
• Parte 16: Recurso de mapeamento de conteúdo;
• Parte 17: Informações explicativas;
• Parte 18: Acesso web a objetos DICOM persistentes WADO (Web Access to DICOM
Persistent Objects).
5.3 Imagens DICOM
Sob o formato do padrão DICOM não se define como as imagens são exibidas ou
anotadas. DICOM inclui estruturas de dados que são de importância para a imagem. Essas
estruturas são colocadas em um cabeçalho que contém a descrição do objeto, os dados do
paciente, nome da instituição e outras informações, como procedimentos realizados ou
relatórios. Os IODs (Information Object Definition) são tabelas de atributos que definem objetos
de informação. Os objetos de informação são modelos que são abstraídos de
versões de objetos do mundo real. Por exemplo, "paciente" é um objeto de informação
que tem "nome do paciente" e ‚número ID do paciente", entre outros atributos.
O padrão DICOM suporta diferentes tipos de imagens para diferentes aplicações
médicas assim como imagens multidimensionais (multiframe). A compressão de dados
depende amplamente de padrões de compressão tais como: JPEG (Joint Photographic Experts
Group), LJPEG (Lossless JPEG), JPEG 2000 (JPEG committee in 2000), ou MPEG-2 (Moving
Pictures Experts Group), essa última usada para uma sequência de imagem multivídeo. Por
outro lado, diferentes aplicações médicas requerem diferentes níveis de qualidade de
imagem. Por exemplo, as imagens de mamografia exigem uma resolução muito alta, assim a
compressão utilizada é principalmente lossless porque pequenos detalhes precisam ser
preservados.
5.4 Definições dos objetos de informação
O padrão DICOM especifica um número de classes de objetos de informação que
fornecem uma definição abstrata de entidades do mundo real aplicável à comunicação de
132 Capítulo V – PADRÃO DICOM
imagens médicas digitais e informação relacionada (por exemplo; relatórios estruturados,
dose de radioterapia). Cada definição de classe objeto de informação consiste de uma
descrição de sua finalidade e os atributos que a definem. Uma classe objeto de informação
não inclui os valores dos atributos que compõem a sua definição.
Existem dois tipos de classes objeto de informação: normalizado e composto.
Classe objeto de informação normalizado: é aquela que contém somente uma entidade
de informação IE (Information Entity). Por exemplo, classes de serviço SCs (Service Class)
que implementam funções de gerenciamento;
Classe objeto de informação composto: é aquela que contem duas ou mais IEs. Por
exemplo, SCs que manipulam imagens. Nesse caso, uma imagem de tomografia
computadorizada além de conter atributos da entidade "imagem", inclui atributos de
outras entidades relacionadas, tais como "paciente", "estudo" e "equipo".
A relação entre as diferentes entidades de informação (estrutura) de um IOD
composto se descreve mediante um modelo de informação, enquanto que para um IOD
normalizado não há necessidade de se estruturar. A Fig.5.3 mostra a relação entre as IODs e
os atributos IOMs (Integrated Object Model). A Fig.5.4 mostra o modelo DICOM para as
instâncias de objetos compostos. Segundo esse modelo, uma imagem particular deve conter
informação da imagem, da série, do estudo, do paciente, entre outras. A próxima imagem da
Fig.5.3 – Relação IODs e atributos.
Atributos
IOM
IOM
IOM
IOM
IOM
IOM
IOD
IOD Normalizada
IOD Composta
Seleção
Seleção
Entidade de
informação
única
Entidade de
informação
única
Entidade de
informação
única
Entidade de
informação
única
Agrupamento
Capítulo V – PADRÃO DICOM 133
mesma série deve ter a mesma informação do paciente, do estudo e da série, onde somente
mudam os dados da imagem.
O padrão DICOM define algumas características inerentes ao atributo:
• Único nome;
• Única chave tag;
• Descrição;
• Representação do valor VR (Value Representation);
• Multiplicidade do valor VM (Value Multiplicity) e tipo.
Nome: nome do atributo de forma amigável à pessoa. Por exemplo, nome do paciente;
Chave: um número para identificar o atributo;
Descrição: descrição do atributo;
Representação do valor: descreve como o atributo foi codificado. Por exemplo, se é um
caráter ou um número;
Multiplicidade do Valor: especifica o número de valores que podem ser codificados;
Tipo: especifica se o atributo é opcional ou obrigatório. Pode receber os seguintes valores:
1 (obrigatório), sempre presente com algum valor;
2 (obrigatório), sempre presente, porém pode ser vazio o campo do valor;
1C e 2C (condicional), 3 (opcional).
134 Capítulo V – PADRÃO DICOM
Fig.5.4 – Modelo de informação DICOM para uma instância composta.
Quadro de referência
1, n
0, 1
Define temporal ou
espacialmente
Imagem
0, n
Mundo real
mapeamento
de valor
0, n
Registro
0, n
Documento
encapsulado
0, n
Sinal
0, n
Documento SR
0, n
Espectroscopia
0, n
Fiduciário
0, n
Dados
brutos
0, n
Estado de
apresentação
0, n
Estudo
1
1, n
Contém
Contém
1, n
É assunto de
Série
1
Paciente
1
Equipamento
1, n 1
Crea
Quadro de referência
1, n
0, 1
Define temporal ou
espacialmente
Imagem
0, n
Mundo real
mapeamento
de valor
0, n
Registro
0, n
Documento
encapsulado
0, n
Sinal
0, n
Documento SR
0, n
Espectroscopia
0, n
Fiduciário
0, n
Dados
brutos
0, n
Estado de
apresentação
0, n
Estudo
1
1, n
Contém
Contém
1, n
É assunto de
Série
1
Paciente
1
Capítulo V – PADRÃO DICOM 135
5.5 Estrutura do arquivo DICOM
A Fig.5.5 mostra o formato do arquivo DICOM. Ele é composto de um cabeçalho
chamado de informação META do Arquivo DICOM e de um conjunto de dados (data set).
O cabeçalho é formado por um preâmbulo de 128 bytes, seguido por um prefixo DICOM de 4
bytes e informações sobre o tipo de codificação do conjunto de dados. A inclusão do
cabeçalho em um arquivo DICOM é opcional. Nessa figura, tem-se o SOP (Service Object Pair).
5.5.1 Conjunto de dados
Para o contexto de aplicações através de uma rede, um conjunto de dados é parte de
uma mensagem DICOM que carrega informações sobre os objetos de informação. Um
Paciente
Estudo
Série
Equipamento
Imagem
Bits alocados Bits armazenados Bit mais alto Número de linhas, colunas Amostras por pixel Representação do pixel Interpretação fotométrica Dados do pixel
IOD de imagem
SOP classe UID
SOP instância UID
Nome do paciente
ID Paciente
Sexo do paciente
UID do estudo
Data de estudo
Hora de estudo
ID estudo
UID Series
Tipo de modalidade
Nome da instituição
fabricante
de
Número de imagem
Tipo de imagem
SOP comum
Atributo
Módulo
Entidade de
informação
Fig.5.5 – Exemplo de um IOD de imagem composto [Lv. 22].
136 Capítulo V – PADRÃO DICOM
conjunto de dados representa uma instância de um objeto de informação. Essa é construída
com elementos de dados (atributos) ordenados. Os elementos de dados contêm os valores dos
atributos desse objeto. O conteúdo específico e a semântica dos atributos são especificados
nas definições de objetos de informação. A Fig.5.6 mostra a estrutura geral de um conjunto de
dados e a estrutura de cada elemento.
Um elemento de dados é univocamente identificado por uma etiqueta. Os elementos
dentro de um conjunto de dados devem ser classificados em ordem crescente de número da
etiqueta.
Representação do valor VR ou RV (Representation Value): é uma sequência
de caracteres de dois bytes contendo um código que define o tipo e o formato do valor ou
valores do elemento de dado.
Valor de Longitude: é um número que indica a longitude que tem o campo "valor". Esse
número pode ser um inteiro sem sinal de 16 ou 32 bits (dependendo da representação do
valor).
Valor de Campo: É o valor (ou valores) do elemento.
Fig.5.6 – Estrutura DICOM de um conjunto de dados e de um elemento de dados [77].
Elemento
dado
Elemento
dado
Elemento
dado . . .
Elemento
dado
Etiqueta
RV
Valor de longitude Valor de campo
Ordem de transmissão
Série de dados
Campo opcional – Depende da
sintaxe de transferência negociada.
Capítulo V – PADRÃO DICOM 137
5.5.2 Imagens
5.5.2.1 Modelo de imagem (IOD composto)
Uma instância de imagem DICOM possui quatro níveis distintos (IE) e estão
relacionados com os procedimentos de diagnóstico adotados pelo médico.
Nível do paciente, do estudo, da série e da imagem (NEMA, 2003c). A Fig.5.4 mostra como
os diferentes níveis estão relacionados no procedimento médico de diagnóstico.
• Um paciente possui um ou mais estudos;
• Cada estudo pode ter uma ou mais séries;
• Cada série contém no mínimo uma imagem.
A Tabela 5.1 lista os componentes que descrevem um objeto imagem de tomografia
computadorizada CT. Essas tabelas também definem se os módulos são de preenchimento
obrigatório (M), condicional (C) ou opcional (U).
IE Módulo Referencia Uso
Paciente
Paciente c.7.1.1 M
Participantes nos ensaios
clínicos c.7.1.3 U
Estudo
Estudo geral c.7.2.1 M
Estudo do paciente c.7.22 U
Estudo do ensaio clínico c.7.2.3 U
Série Série geral c.7.3.1 M
Series dos ensaios clínicos c.7.3.2 U
Quadro Referencia Quadro referência c.7.4.1 M
Equipe Equipe geral c.7.5.1 M
Imagem
Imagem geral c.7.6.1 M
Plano da imagem c.7.6.2 M
Pixel da imagem c.7.6.3 M
Contraste c.7.6.4 Necessário se métodos de
contraste são utilizados nessa
imagem.
Dispositivo c.7.6.12 U
Imagem CT c.8.2.1 M
Plano de sobreposição c.9.2 U
FOV (Field Of Vision) c.11.2 U
Comum SOP(Service
Object Pair) c.12.1 M
Tabela 5.1 – Módulos de IOD, em uma imagem de CT [78].
138 Capítulo V – PADRÃO DICOM
Cada um desses módulos é um conjunto de atributos semanticamente agrupados de
acordo com as informações da entidade a que se referem.
5.5.2.2 Paciente
Contém as informações do paciente relativo ao estudo feito. Como por exemplo, na
Tabela 5.2 se mostra alguns dos atributos do módulo "paciente", que é o primeiro módulo na
definição do objeto em dados de imagem CT.
5.5.2.3 Estudo
É o resultado da realização de um exame. O exame pode ser feito em diferentes
modalidades tais como, US, CT e MR. Todas as imagens coletadas em um exame são
colocadas no mesmo estudo. Um paciente pode ter vários estudos como resultado de outros
exames feitos.
5.5.2.4 Série
Depois do nível de estudo, todas as imagens são recolhidas. O nível de série identifica
o tipo de dispositivo que cria as imagens, data, hora da criação da série, os detalhes do tipo
de exame feito e do equipamento utilizado. Fazer uma lista dos termos usados em diferentes
dispositivos deve ser considerado cuidadosamente. Pode haver palavras que significam a
mesma coisa, aparentemente, mas são usadas de maneira diferente em diferentes
contextos. As séries sempre são uma coleção de imagens que vêm de um único dispositivo. A
forma em que as imagens são agrupadas em séries depende do uso médico que se lhe vai dar.
Nome do atributo Rótulo Tipo Descrição do atributo
Nome do paciente (0010,0010) 2 Nome completo do paciente.
ID paciente (0010,0020) 2 Nº Identificação do hospital.
ID emissor do paciente (0010,0021) 3 Identificador da pessoa que emitiu a
identificação do paciente.
Data de nascimento do paciente (0010,0030) 2 Data de nascimento do paciente.
Sexo do paciente (0010,0040) 2 Sexo do paciente.
Tabela 5.2 - Alguns atributos do módulo paciente [78].
Capítulo V – PADRÃO DICOM 139
Assim, em uma série, uma imagem de referência pode ser incluída como uma descrição da
posição espacial de fatias individuais. A Fig.5.7 mostra as diferentes reconstruções que
podem ser salvas em diferentes séries.
5.5.2.5 Imagem
O nível mais baixo do modelo de informação é o nível de imagem. Cada imagem
contém a aquisição de informação e posicionamento, assim como os próprios dados da
imagem. Dependendo do tipo de dispositivo, o nível de imagem contem dados para uma
imagem única, duas imagens (sistema de dois planos) ou uma coleção de imagens capturadas
em um curto espaço de tempo (imagens multiframe).
5.6 Características das imagens DICOM
5.6.1 Codificação das imagens
Os dados referentes aos pixels de qualquer imagem são armazenados no elemento de
dados (7FE0, 0010) utilizando-se diversas formas de codificação. A ordem de leitura dos
Fig.5.7 – Exemplo de mapeamento de uma imagem de CT [Lv. 10].
140 Capítulo V – PADRÃO DICOM
pixels dentro desse elemento depende do algoritmo de compressão utilizado. Para uma
imagem plana, sem compressão, é sequencial e corresponde a uma disposição bidimensional
da esquerda para a direita e de cima para baixo. As informações sobre as características da
imagem e da estrutura dos pixels são os elementos pertencentes ao grupo 0028. Na Tabela 5.3
alistam-se alguns dos atributos do módulo "pixels da imagem".
Com essas informações é possível interpretar os dados binários contidos no elemento
(7FE0, 0010). Por exemplo, é possível saber as dimensões da matriz imagem, se a imagem
é monocromática ou em cores, o número de bits atribuído a cada pixel, e assim por diante. A
maioria desses elementos de dados é do tipo 1. Por isso é necessário que estejam presentes em
Nome do atributo Rótulo Descrição
Amostras por pixel (0028, 0002) Número de amostras (planos) na imagem. Se a imagem é
RGB esse atributo tem um valor de 3.
Interpretação
fotométrica (0028, 0004)
Especifica como devem ser interpretados os dados da imagem.
Alguns dos valores nesse elemento são:
MONOCHROME1;
MONOCHROME2;
PALETTE COLOR;
RGB.
Filas (0028, 0010) Número de filas na imagem.
Colunas (0028, 0011) Número de colunas na imagem.
Bits alocados (0028, 0100) Número de bits alocados a cada amostra (8, 16, etc).
Bits armazenados (0028, 0101) Número de bits realmente utilizados para cada amostra.
Bit mais
significativo (0028, 0102) Bit mais significativo em uma amostra.
Representação de
pixel (0028, 0103)
Representação dos dados em cada amostra. Pode ser:
0000H = inteiro sem sinal
0001H = complemento a dois
Dados de pixels (7FE0, 0010) Imagem
Configuração
planar (0028, 0006)
Indica se a informação de cada dado pixel é enviada ‚cor por
plano‛ ou ‚cor por pixel‛.Est{ presente se a amostra por pixel é
maior que 1 .
Relação de aspecto (0028, 0034) Relação entre o tamanho vertical e o horizontal dos pixels da
imagem.
Tabela 5.3 – Elemento de dados que pertencem ao módulo “pixels da imagem” *77+.
Capítulo V – PADRÃO DICOM 141
um conjunto de dados correspondente a uma imagem. A leitura e interpretação desses
dados são de muita importância em sistemas de processamento de imagens.
5.7 Classes de serviço
Define-se um conjunto de uma ou mais classes SOP relacionada a uma função
específica que deve ser realizada através da comunicação de entidades de aplicação. As
classes de serviço mais utilizadas com imagens são:
Classe de serviço de armazenamento: determina a transmissão e o armazenamento de
imagens através da rede;
Classe de serviço de consulta: utilizado para fazer uma consulta a dados específicos.
Os serviços são de armazenamento ou do próprio DICOM DIMSE (DICOM Message
Service Element), conforme mostra a Fig.5.8.
Fig.5.8 – Estrutura maior do modelo de informação DICOM.
1
1 Definição de um
objeto informação
e
Atributos
Contem
1
n
1
Grupo de
serviços
Serviços DIMSE ou
de armazenamento
É um grupo de
1
n
1
Especificação da
classe de serviço
e
Classe SOP
1
n
1
Especifica
Define-se como
Aplica-se a
142 Capítulo V – PADRÃO DICOM
5.8 Compressão de dados padrão
O padrão DICOM desempenha um papel dominante na {rea de imagens médicas. O
principal objetivo dessa seção é mostrar como DICOM integra o uso de compressão de
imagens e, particularmente, como DICOM tem integrado abordagens gerais | compressão
fornecidas pela ISO (International Standards Organization).
5.8.1 Compressão no padrão DICOM
5.8.1.1 Codificadores DICOM recomendados
O padrão encapsula imagens comprimidas através de codificadores padronizados
dentro de sua estrutura, garantindo assim a modularidade. Uma vez que imagens
médicas estão vinculadas ao formato DICOM, a maneira pela qual elas são armazenadas e
transmitidas é suportada pelo arquivamento de imagens e sistemas de comunicação (PACS).
DICOM não suporta todas as características de codificadores padronizados. Além disso,
DICOM não especifica nem recomenda quais condições de compressão com perdas devem
ser usadas. A decisão é deixada inteiramente para usuários individuais. Os codificadores que
estão atualmente suportados no padrão DICOM são:
JPEG, conhecido como a compressão padrão e o codificador de imagens est{ticas *ISO95+.
O padrão especifica ambos os processos de codificação com perdas e sem perdas. Esse
padrão usa a transformada de cosseno discreta (DCT), que permite um ajuste da taxa
de compressão.
O padrão DICOM eventualmente apresenta quatro características principais, mostradas
na Tabela 5.4.
• A primeira corresponde ao modo baseline, aplicado a imagens com 8 bits, com
perdas e usa codificação Huffman.
• A segunda corresponde ao modo JPEG 2 e 4,conhecido como "estendido", com
perdas, aplicado a imagens de 8 e 12 bits.
Capítulo V – PADRÃO DICOM 143
• A terceira corresponde ao modo JPEG 14, sem perdas, baseado no método DPCM
com codificação Huffman.
• A quarta envolve uma previsão de uma ordem.
JPEG-LS, para a compressão sem perdas baseado no codificador LOCO.
JPEG Baseline para uma compressão com perda. Ele implementa DCT com quantização
escalar e codificação Huffman.
JPEG2000, que suporta a compressão sem perdas e com perdas através de filtros
reversíveis e irreversíveis, respectivamente. Ele também suporta codificação escalon{vel
e utiliza transformada wavelet com codificação bitplane.
MPEG-2(perfil principal no nível principal) para compressão de imagens multi-frame.
Sintaxe de transferência
UID
Processo de codificação
JPEG Descrição
1.2.840.10008.1.2.4.50 1 ‚baseline‛, com perdas.
1.2.840.10008.1.2.4.51 2 (8 bits), 4 (12 bits) ‚extended‛, com perdas.
1.2.840.10008.1.2.4.57 14 Sem perdas, não hier{rquica.
1.2.840.10008.1.2.4.70 14 (valor de seleção 1) Sem perdas, não hier{rquica, e
previsão de primeira ordem.
Tabela 5.4 – Implementação da sintaxe de transferência do padrão JPEG [Lv. 5].
145
Capítulo 6
Codificação ROI
s imagens médicas têm um grande impacto especialmente nas áreas de diagnóstico e
planejamento cirúrgico. No entanto, dispositivos de imagens continuam gerando cada vez
mais dados por paciente, muitas vezes, de 1000 imagens que correspondem a cerca de 500
MB (Megabytes).
Atualmente, esquemas de compressão produzem altas taxas de compressão se a
perda de qualidade da imagem é aceitável. No entanto, na área de medicina não se pode ter
deficiência em regiões de interesse ROI (Region of Interest) que sejam importantes para um
diagnóstico. Assim, torna-se necessária uma abordagem que produza uma alta taxa de
compressão com boa qualidade.
O processamento de imagens biomédicas é mais difícil do que o processamento de
imagens normais, porque as imagens biomédicas são muitas vezes difusas (fuzzy) e contem
ruído. Dessa forma, analisar e processar imagens biomédicas de forma rápida e com precisão
é um problema que tem sido um importante campo de pesquisa recente.
A região de interesse ROI em imagens significa as regiões importantes da
imagem. Por exemplo, as regiões de interesse em imagens médicas sempre são as regiões em
foco, como a localização de um tumor calcificado. A utilização de regiões de interesse
pode aperfeiçoar o processamento. Isso porque os dados irrelevantes não são levados em
conta.
A
146 Capítulo VI – CODIFICAÇÃO ROI
O objetivo geral é o de preservar a qualidade diagnóstica em regiões críticas,
permitindo-se codificação com perdas em outras regiões não importantes. O objetivo
principal da codificação ROI é permitir o uso de regiões de interesse múltiplos e de forma
arbitrária dentro das imagens, com pesos arbitrários descrevendo o grau de importância para
cada ROI, incluindo o fundo. Assim, essas últimas podem ser representadas por diferentes
níveis de qualidade.
6.1 Região de interesse
No cenário médico, a região de interesse (ROI) é a área de uma imagem, que é de
importância clínica / diagnóstico para o médico. Certas características específicas da imagem
como a uniformidade da textura, cor, intensidade, etc., geralmente caracterizam-se como uma
ROI. As imagens médicas são na sua maioria em escala de cinza. As escalas de cinza de uma
imagem de nível M-bit (onde M pode ser de 8, 12 ou 16 bits) podem ser representadas na
forma de planos de bits.
Identificar e extrair com precisão a ROI é muito importante antes da codificação e
compressão dos dados da imagem para uma transmissão eficiente ou para armazenamento.
Fig.6.1 – Diagrama de fluxo para compressão de ROI.
Segmentação
Bloco original
Imagem de entrada Codificação da
proposta Codificação reduzindo
a entropia do vetor
Sim ROI ou
Error >
Threshould
Codificação
reduzindo a
entropia do
vetor
Imagem prévia
- +
Capítulo VI – CODIFICAÇÃO ROI 147
Em diferentes regiões espaciais da ROI em uma imagem, é possível comprimir com diferentes
níveis de qualidade de reconstrução. Dessa forma, podem-se preservar as características
necessárias e transmitir para um diagnóstico médico.
Em imagens médicas originais, o médico seleciona regiões de interesse à mão. A
imagem é dividida em regiões de interesse e fundo. Para o fundo, usa-se uma taxa de bits
baixa. Para as ROIs, usa-se uma elevada taxa de bits. Depois da codificação
da imagem integra-se o fluxo de bits de saída para obter uma imagem comprimida.
6.2 Codificação ROI
A funcionalidade da região de interesse (ROI) é importante em aplicações médicas,
onde certas partes da imagem são de maior importância diagnóstica do que outras. Nesse
caso, essas regiões precisam ser codificadas com uma maior qualidade do que o fundo.
Durante a transmissão de imagens médicas, essas regiões são transmitidas em primeiro lugar
ou com uma prioridade maior. Nos métodos de codificação ROI baseados na transformação,
os coeficientes associados com a ROI são transferidos antes daqueles associados com o fundo.
Fig.6.2 – Imagem onde se seleciona a região
ROI e a região de fundo (Background),(Hosp.ESALUD)
Fundo
ROI
148 Capítulo VI – CODIFICAÇÃO ROI
Portanto, quando uma imagem é codificada com ênfase em ROI, é necessário
identificar os coeficientes necessários para a reconstrução da ROI. Assim, a máscara ROI é
introduzida para indicar que os coeficientes devem ser transmitidos em ordem para que o
receptor reconstrua a ROI. Geralmente, a transformada wavelets [79], [46,47], é aplicada
à imagem do lado do codificador. Os coeficientes resultantes não associados com a ROI são
deslocados para baixo (shifted down) de forma que os bits associados à ROI são colocados
em planos de bits superiores. A codificação ROI tem sido aplicada em diferentes tipos
de imagens médicas. Algumas transformações mais comuns utilizadas para a codificação de
regiões em imagens médicas são o MaxShift de JPEG2000, a série do particionamento
em árvores hierárquicas (SPIHT), a codificação do bloco integrado com truncamento
otimizado EBCOT, e a transformada wavelet inteira adaptativa AIWTs (Adaptive Integer
Wavelet Transform).
Não
Fig.6.3 - Diagrama de blocos da codificação ROI.
Codificação dos coeficientes
WT (início em n=N)
ROI é identificado?
Criação da
máscara ROI
Imagem global
Não
Sim
Codificação dos coeficientes
WT (começa em n = R - 1)
n < R
Codificação dos coeficientes
que ainda não são testados de
n=Q até n=R
Não ROI
Sim
Imagem global
Codificação no modo
codificação ROI de n=Q a n=R
n < R
Não
ROI
Sim
Capítulo VI – CODIFICAÇÃO ROI 149
6.3 Geração da máscara ROI
Quando uma imagem é codificada com ênfase em ROI, é necessário identificar os
coeficientes wavelet necessários para a reconstrução da ROI [80]. Geralmente, a
transformação wavelet, é aplicada à imagem no lado do codificador. A máscara no domínio
wavelet é um mapa que indica todos os coeficientes relacionados para a reconstrução da
ROI. As localizações correspondentes dos coeficientes na escala são calculadas a partir da
escala atual.
Um exemplo de cálculo da máscara ROI é dado a seguir [81].
Seja Rn o domínio wavelet de uma imagem e ΩϵRn a região de interesse. A função
característica XΩ(x) é definido como:
𝑥 , 𝑚 𝑥 𝑎𝑠 𝑡𝑟𝑎𝑟
(6.1)
Então a máscara ROI é gerada de acordo com:
𝑥 �� 𝑥 𝑥 𝑥 𝑥 (6.2)
Onde �� representa o operador de wavelet para a ith sub-banda, Λ é o conjunto de
índices de todas as sub-bandas e Ĩi é a operação identidade equipada com operação down-
samplig, respectivamente.
6.4 Métodos de codificação ROI em imagens médicas fixas 2-D
6.4.1 Método de dimensionamento geral
O princípio do método é escalar (shift). Calcula-se os coeficientes de forma que os bits
associados com a ROI são colocados em planos mais elevados do que os bits associados com o
fundo, conforme mostra a Fig.6.4(b).
150 Capítulo VI – CODIFICAÇÃO ROI
Durante o processo de codificação incorporado, os bits mais significativos da ROI são
colocados no fluxo de bits antes dos bits de fundo da imagem. Dependendo do valor de
escala, alguns bits dos coeficientes ROI podem ser codificados junto com os coeficientes na
ROI. Assim, a ROI será decodificada ou refinada, antes do resto da imagem. Se o fluxo de
bits é truncado, ou o processo de codificação termina antes que toda a imagem seja
codificada, a ROI será de melhor qualidade do que o resto da imagem.
O algoritmo apresenta 4 passos:
Calcula-se a transformada wavelet;
Se uma ROI é escolhida, obtém-se a máscara ROI, indicando o conjunto de
coeficientes que são necessários para a reconstrução de ROI sem perdas como se
mostra na Fig.6.4-(b);
Quantizar os coeficientes wavelet, após a quantização, armazenar os coeficientes em
magnitude e sinal;
Os coeficientes externos à ROI são escalonados para baixo por um valor de escala
especificado. A entropia codifica os coeficientes resultantes progressivamente com os
primeiros planos de bits mais significativos.
6.4.2 Método MaxShif
Na codificação ROI MaxShift, uma imagem inteira é transformada somente se os
coeficientes associados com a região de interesse são escalonados por meio de um
determinado número de bit-shift (chamados de valor escala s) dado pelo maior número dos
coeficientes de planos de bits (Fig.6.4 c).
Capítulo VI – CODIFICAÇÃO ROI 151
O valor de escala é calculado de tal forma que seja possível ter ROIs com forma
arbitrária, sem a necessidade de transmitir informação compartilhada para o decodificador.
Isso significa que, o decodificador não deve ser executar a geração de máscara ROI. O
mapeamento da ROI a partir do domínio espacial para o domínio wavelet é dependente do
uso dos filtros wavelet e é simplificado para regiões circulares e retangulares.
O codificador analisa os coeficientes quantizados e escolhe um valor de escala s tal
que o coeficiente mínimo pertencente à ROI é maior do que o coeficiente máximo do fundo
(área não ROI). Como ilustrado na Fig.6.4-(c), todos os coeficientes wavelests que não fazem
parte da ROI são escalonados para baixo por (s +D), onde D é uma constante pequena. Como
resultado, todos os coeficientes wavelets correspondentes ao fundo têm uma magnitude <1. O
decodificador, depois de receber o fluxo de bits, escalona para cima (s+D) todos os
coeficientes que têm uma magnitude <1.
A Fig.6.5 mostra um exemplo em uma dimensão da correspondente filtragem de sub-
bandas passa altas e passa baixas usando-se um filtro wavelet 5/3 reversível para reconstruir
as amostras da imagem pelas equações (6.3) e (6.4).
Fig.6.4 – (a) Compressão da imagem completa, (b) Método
baseado na escala geral ROI, (c) Método MaxShif.
152 Capítulo VI – CODIFICAÇÃO ROI
𝑥 𝑛 ⌊
4⌋ (6.3)
𝑥 𝑛 𝑛 ⌊𝑙 𝑙
⌋ (6.4)
Considere-se a transformada wavelet inversa, como se mostra na Fig.6.5.Os coeficientes
l5, h1 e h5, assim como os coeficientes dentro do objeto são necessários para reconstruir as
amostras de x4 a x9, onde xi, li e hi representam valores de uma amostra de imagem. Os
coeficientes adicionais dependem do comprimento do filtro e da decomposição wavelet. Uma
vantagem do método MaxShift, em comparação com o método de dimensionamento
geral, é que a codificação das ROIs é possível sem a necessidade de fornecimento de
informação e sem a necessidade do cálculo da máscara da ROI. A Fig.6.6 apresenta uma
ilustração do fluxograma do MaxShift. A principal desvantagem do método MaxShift é que as
ROIs com diferenciais de qualidade múltiplos não podem ser codificados.
Fig.6.5 – A transformada wavelet inversa com um filtro wavelet 5/3
reversível. Coeficientes adicionais que são necessários para reconstrução
das amostras da imagem dentro do objeto são marcados em verde.
Capítulo VI – CODIFICAÇÃO ROI 153
6.4.3 Método de MSBShift (Most Significant Bit-Plane Shift)
O método MSBShift não só suporta a codificação ROI com forma arbitrária, mas
também permite o ajuste flexível de qualidade de compressão da ROI e do fundo.
ROIs múltiplos: o novo método pode eficientemente codificar ROIs múltiplos com
prioridades diferentes em uma imagem.
Algoritmo de codificação:
• Esse método [112] remove todos os planos de bits sobrepostos entre a ROI e os
coeficientes de fundo BG (Background), e relativamente modifica o tamanho do
passo de quantização dos coeficientes. Isso reduz a qualidade da ROI final.
• Pode-se isolar certo número de planos de bits dos bits ROI nos planos de bits mais
significativos para ajustar a importância entre a ROI e o BG.
Início Determine
coeficientes
wavelets ROI
Encontrar o
valor de escala
S
Os coeficientes
pertencem ao
fundo?
Aplicar
codificação
entrópica ao
plano de bits
Fim
Escala de
coeficientes
para abaixo
por S+D
Escreva S para
o fluxo de bits
1 2 3
4 5
Fig.6.6 – Fluxograma do processo de codificação ROI MaxShift; 1) O conjunto
de coeficientes wavelets que pertencem a ROI é determinado; 2)O valor de escala (s) e a
magnitude do maior coeficiente de wavelet não na ROI, ou seja,contida no fundo, são
calculados; 3) Os coeficientes de fundo são reduzidos para baixo por s; 4) O valor de s é
adicionado ao fluxo de bits; 5) A codificação de entropia bit-plano é aplicada [Lv. 4].
154 Capítulo VI – CODIFICAÇÃO ROI
• Precisa-se somente transferir parte dos planos de bits mais significativos dos
coeficientes da ROI em vez de mudar todos os planos de bits dos coeficientes da ROI.
Complexidade e Eficiência de Codificação: posto que para o método MSBShift não é
necessário codificar formas ROI, a complexidade é menor do que no método
genérico baseado na escala. A eficiência da codificação é maior quando o mesmo valor de
escala é utilizado. Se o ponto de codificação sem perdas é atingido, a taxa de bits que é
produzida pelo método MSBShift não é maior do que no método genérico porque o
MSBShift codifica menos ou, no máximo, o mesmo número de planos de bits.
6.4.4 Método BbBShift (Bit-plane-by-Bit-plane Shift)
Ao invés de transferir todos os planos de bits de uma só vez usando o mesmo valor
escalar s como em MaxShift, em BbBShift , os deslocamentos são feitos em uma base de plano
de bits por plano de bits. Uma ilustração do método BbBShift é mostrada na Fig. 6.7. Dois
parâmetros, S1 e S2, são utilizados em BbBShift. A soma de S1 e S2 deve ser igual ao maior
número do plano de bits de qualquer coeficiente da ROI. Esse método indexa o plano de bits
superior 1, ao próximo plano de bits superior como 2, e assim por diante. O algoritmo
codificador é o seguinte:
1. Para qualquer plano de bits b de um coeficiente ROI:
Se 𝑠 , nenhuma mudança;
Se 𝑠 < 𝑠 𝑠 , transferi-lo para baixo para o plano de bits 𝑠 𝑠 .
2. Para qualquer plano de bits b de um coeficiente de BG:
Se 𝑠 , transferi-lo para baixo para o plano de bits 𝑠 ;
Se > 𝑠 , transferi-lo para baixo do plano de bits 𝑠 𝑠 .
Capítulo VI – CODIFICAÇÃO ROI 155
O esquema do decodificador é o seguinte:
1. Identificar se é um coeficiente de ROI ou um coeficiente de BG. Isso pode ser feito
analisando o bit mais significativo (MSB) do nível de plano de bits. O conjunto de ROI
associado aos planos de bits é dado por:
BROI = ,b|b ≤ s1 ou b=s1+2k, k=1,2,...,s2}
2. Se o coeficiente wavelet MSB est{ no plano de bits ∈ 𝐵 , então é um coeficiente de ROI.
Caso contr{rio, é um coeficiente de BG. Os planos de bits são, então, deslocados de volta
para seus níveis originais, invertendo-se o plano de bits do esquema deslocado no
codificador.
Esse método [113] muda os planos de bits em uma base plano de bits por plano de bits em
vez de transferi-los todos como no método MaxShift.
Codificação ROI não múltiplo; o método BbBShift não suporta codificação ROI múltiplo.
Eficiência de compressão; semelhante ao do método MaxShift.
6.4.5 Codificação baseada em objetos com transformada wavelet adaptativa
A codificação baseada em objetos requer a aplicação de uma transformada wavelet
bidimensional a uma região com forma arbitrária. Devem-se codificar eficientemente os
Fig.6.7 - Método BbBShift com S1=4 e S2 = 5 (Os
planos são representados pelas barras cinza ).
156 Capítulo VI – CODIFICAÇÃO ROI
coeficientes wavelets resultantes. Uma região bidimensional com forma arbitrária é composta
de várias linhas e colunas de longitude variada. Em uma transformada wavelet bidimensional
separável, a transformação de linhas é seguida pela transformação das colunas resultantes
dos coeficientes no lugar. A Fig.6.8 mostra um exemplo da transformada wavelet discreta
adaptativa para uma única linha de pixels, na qual as amostras são transformadas e ambas as
bordas do segmento são estendidas por uma extensão simétrica. Note que, em uma
transformada wavelet adaptativa, os pixels do objeto e de fundo nunca são misturados pela
filtragem e que o número de coeficientes resultantes é exatamente o mesmo que o número
de pixels na região.
6.4.5.1 Particionamento hierárquico em árvores baseado em objetos (OBSPIHT)
O método SPIHT (Set Partitioning In Hierarchical Trees) foi adaptado para a codificação
de regiões de forma arbitrária dentro de uma imagem de acordo com sua importância ou
relevância de diagnóstico. Essa adaptação baseada em objeto SPIHT é chamada de OBSPIHT
(Object Based SPIHT). Aplica-se a transformada wavelet de forma adaptativa somente aos pixels
pertencentes à região de interesse ao invés de se aplicar à imagem inteira. Assim, o método
OBSPIHT utiliza um esquema de codificação em cadeia para se transmitir a informação da
ROI. Finalmente, OBSPIHT codifica progressivamente somente os coeficientes wavelets
associados a essa região.
Transformar
Fundo Objeto Fundo
x0 x1 x2 x3 x4 x5 x6 x7 x8 x10 x11 x12 x9
. . x0 x5 x4 x5 x6 x7 x8 x8 x7 . x9
l2 h2 l3 h3 l4 h4
Extensão Extensão
Fig.6.8 – Transformada wavelet adaptativa
unidimensional com extensão simétrica.
Capítulo VI – CODIFICAÇÃO ROI 157
6.5 Codificação ROI em imagens médicas volumétricas
As imagens médicas volumétricas introduziram novos problemas quanto a sua
manipulação e transmissão, devido ao grande volume de dados que contêm. Assim, o uso de
um método de compressão reforçado com a codificação ROI para o diagnóstico em áreas
críticas é considerado essencial nesse caso. A codificação tridimensional (3D) de wavelet
oferece melhor desempenho em comparação aos correspondentes métodos 2D. Uma
avaliação do esquema de codificação ROI convencional em imagens volumétricas, chamado
de SADWT (Shape Adaptive Discrete Wavelet Transform) existe em [82]. Nesse algoritmo
somente amostras dentro de um objeto são transformadas [83] de acordo com a forma de
informação adicionalmente enviada para o decodificador.
O comprimento de cada segmento unidimensional a ser transformado varia
de segmento a segmento. Comparado com a ROI baseada na escala SBROI (Scale Based ROI)
poucas amostras são necessários para codificar o objeto. No entanto, a codificação
ROI flexível, tais como a codificação ROI orientada ao usuário em aplicações interativas é
difícil de se realizar. Na codificação ROI orientada ao usuário, o usuário modifica ou
especifica uma ROI no meio do processo de codificação.
Em SADWT, a transformada wavelet precisa ser feita novamente quando a ROI é
especificada/modificada. Isso causa aumento significativo do custo computacional por fazer
uso de forma eficiente dos dados que já foram transmitidos e codificados. Em imagens de CT
no cólon [84], é aplicado um modelo híbrido de compressão sem perdas na ROI, com uma
alta taxa de compressão e com compensação de movimentos. A parede do cólon é
segmentada por uma sequência de 3D e técnicas de processamento morfológico de imagem.
Uma vez que a ROI é segmentada em cada fatia, um esquema de compressão híbrido
é utilizado para codificar as imagens. A primeira fatia do volume é compactada com um
codificador sem perdas. Cada fatia é codificada por codificação de movimento
compensado, que também atua como um filtro de previsão da ROI.
Finalmente, a diferença entre o bloco ROI da imagem real e o bloco ROI da imagem prevista é
codificada por um codificador sem perdas minimizando a entropia. Uma extensão para 3D-
158 Capítulo VI – CODIFICAÇÃO ROI
SPIHT [85] que permite codificação ROI 3D em imagens volumétricas é apresentada em
[86]. Para identificar os coeficientes que afetam a ROI, uma máscara de bitmap 3D é mantida
no codificador. Essa máscara é submetida a uma transformada wavelet semelhante onde em
cada passo os coeficientes necessários para uma reconstrução perfeita da ROI no nível
atual de decomposição são identificados.
6.6 Quadros comparativos dos métodos de codificação ROI
Codificação ROI baseado em escalonamento
- Permite ROIs.
- O valor do deslocamento é registrado no cabeçalho do fluxo de código para cada ROI.
- Bom controle sobre a import}ncia entre ROI e BG.
- A codificação de ROI aumenta significativamente a complexidade e reduz a eficiência de
codificação.
- A forma da ROI é restrita (ret}ngulo e elipse). Essa restrição pode limitar a aplicação real da
codificação ROI e a eficiência da compressão.
- Requer um complexo processo de geração da m{scara ROI.
- Necessita de coeficientes adicionais para decodificar o objeto.
- Suporta codificação ROI arbitr{ria *116+.
- Aplicado a imagens de nefrostograma *114+.
Codificação ROI MaxShift (Maximum Shift)
- Alta taxa de compressão com boa qualidade na ROI.
- Usa maiores valores de escala e reduz a eficiência de compressão através da introdução de
mais planos de bits.
- A codificação ROI é possível sem o requerimento do fornecimento de informação e sem a
necessidade do c{lculo da m{scara ROI.
- Processo de decodificação simples sem necessidade da geração da m{scara ROI.
- Necessita de coeficientes adicionais para decodificar o objeto.
- Suporta codificação ROI arbitr{ria.
- Aplicado a imagens de nefrostograma *114+.
Codificação MSBShift (Most significant bit-plane shift)
- Ajuste flexível de qualidade de compressão na ROI e no BG (Background).
- Codificação de múltiplas ROIs.
- A complexidade é menor do que no método geral baseado em escala.
- A eficiência de codificação é maior.
Capítulo VI – CODIFICAÇÃO ROI 159
Codificação OBSPIHT (Object-Based Set Partitioning In Hierarchical Trees)
- Eficiência de compressão ao utilizar método baseado em regiões em comparação a SPIHT
original.
- Permite a compressão de v{rias regiões.
- O fluxo de bits pode ser truncado.
- Alta qualidade de compressão na região do tórax.
- Não precisa de coeficientes adicionais para decodificar o objeto.
- Suporta codificação ROI arbitr{ria.
- Aplicado a imagens de mamografia *122+, *124+.
Codificação baseada em objetos com formato da transformada wavelet adaptativa
- Aplicada a imagens est{ticas, onde o objeto ou objetos são fixos em forma e posição.
- Permite codificação sem precisão a qual não afeta os pixels fora do objeto.
- Os pixels do objeto e fundo não são misturados por filtragem.
Codificação BbBShift (Bitplane-by-Bitplane Shift )
- Eficiência de compressão.
- Suporta codificação arbitr{ria ROI.
- Não suporta codificação ROI múltipla.
- A operação de codificação é feita usando o algoritmo ‚baseline‛ de JPEG2000.
- Usando acesso aleatório a dados codificados, a região de interesse pode ser decodificada
progressivamente.
161
Capítulo 7
Resultados
Fig. 7.1 apresenta o esquema da sequência utilizada.
7.1 Banco de dados de imagens CT
Neste trabalho, utilizam-se imagens médicas previamente digitalizadas que foram
gentilmente fornecidas pelo Hospital ESSALUD de Cusco - Perú.
7.2 Escolha dos modelos de representação em compressão de imagens
Para esta pesquisa escolhem-se as wavelets bi ortogonais, por apresentar um
bom desempenho [105]. A Tabela 7.1 mostra as wavelets bi ortogonais utilizadas que
são denotadas como Bior Nd, Nr, onde:
Nd: representa a ordem do filtro de decomposição (an{lises) e;
Nr: representa a ordem do filtro de reconstrução (sínteses).
A
No. Wavelet bi ortogonal No. Wavelet bi ortogonal No. Wavelet bi ortogonal
1 1.1 5 3.1 9 4.4
2 1.5 6 3.5 10 5.5
3 2.4 7 3.7 11 6.8
4 2.8 8 3.9 12 -
Tabela 7.1 – Wavelets utilizadas na compressão de imagens.
DICOM.
162 Capítulo VII – RESULTADOS
7.3 Codificação sub-banda
A codificação sub-banda SBC (Sub-Band Coding) é baseada na divisão da banda de
frequências de um sinal. A codificação de cada banda é feita de acordo com sua estatística e
as especificações de compressão. Há duas componentes fundamentais na codificação sub-
banda: o sistema de filtros e a quantização usando localização de bits. O processo pode se
repetir de forma iterativa obtendo-se árvores de filtros de maior profundidade. No
decodificador se decodificam os sinais sub-bandas. Realiza-se a sobreamostragem, por meio
de filtros de sínteses e as saídas desses filtros são somadas para se obter uma imagem
reconstruída.
Decomposição multiresolução
Codificação sub-banda
Fig. 7.1 – Esquema da sequência utilizada.
Escalamento Geral
MaxShift
ROI
MSBShift
BbBShift
OBSPIHT
Banco de dados: Imagens CT
Codificação de
coeficientes Wavelet
Escolha dos modelos de representação em
compressão de imagens
Hospital ESALUD
Imagens DICOM
Qualitativos
Objetivos
Medidas de compressão
Critérios de fidelidade
Seleção efetiva da wavelet
Medidas da eficiência de compressão
Capítulo VII – RESULTADOS 163
7.4 Decomposição multiresolução
Cada imagem é decomposta em um certo número de níveis l. O número de
decomposições determina a resolução do mais baixo nível no domínio wavelet. O nível de
decomposição da wavelet pode ser calculado por meio de: l = log2N, onde N é o tamanho da
fila na imagem a se comprimir, sendo esse o máximo nível possível. Para o caso das imagens
de teste (tamanho 512×512 píxels), o valor máximo de decomposição é de l=9.
O incremento do número de níveis de decomposição l permite descorrelacionar os
dados e, portanto obter uma melhor qualidade na imagem reconstruída. No entanto, um
grande número de decomposições causa perda na eficiência do algoritmo de codificação,
devido à complexidade computacional. Além disso, o PSNR tende a saturar para um número
grande de níveis de decomposição [106].
7.5 Esquemas de codificação de coeficientes wavelets
As imagens são comprimidas utilizando-se os codificadores wavelets SPIHT e
EZW. Quando os planos de bits menos significativos são codificados com SPIHT, a
ocorrência de zerotrees é pouco provável. Nesse caso, o SPIHT é mais redundante em
enviar os planos sem codificação. Por esse motivo, às vezes SPIHT usa somente até o
segundo ou terceiro plano de bits. Dessa forma, se acelera a compressão e se reduz o
tamanho do arquivo comprimido. Além disso, a relação sinal ruído nesses planos de
bits é muito baixa e sua transmissão progressiva não melhora a qualidade visual da
reconstrução [Ts 1].
7.6 Análises da eficiência de compressão
Para determinar a eficácia dos algoritmos de compressão utilizam-se as
medidas descritas na secção 3.2, ou seja, longitude média por símbolo Ls, fator ou
164 Capítulo VII – RESULTADOS
razão de compressão X:1, compressão relativa CR, tamanho comprimido relativo TR e
fator de mérito p.
Além disso, faz-se uso dos critérios de fidelidade e medidas de erros tanto
objetivos como subjetivos, descritos na seção 3.2, ou seja, a relação sinal ruído SNR, o
erro quadrático médio MSE (Mean Square Error), a relação sinal ruído de pico PSNR e
a correlação cruzada CC.
7.7 Metodologia do teste, aquisição de dados e resultados
Utilizam-se 10 imagens CT de tamanho 512×512 (256KB). As imagens são
comprimidas por uma taxa de bits específica de 0,1 bpp até 0,9 bpp. As taxas baixas
correspondem às imagens de menor resolução que requerem um menor tempo de
processamento. O nível de decomposição wavelet se fixa de acordo com as exigências de cada
imagem. Em cada imagem faz-se uma avaliação para determinar a efetividade e eficiência do
algoritmo de compressão por meio dos critérios de avaliação. Os autores em [105],
manifestam que o nível de decomposição l = 5, é apropriado para a decomposição.
À medida que se incrementa a taxa de bits os resultados melhoram tanto na avaliação
objetiva quanto na qualitativa. Concomitantemente, o tempo de processamento aumenta.
Para valores menores que 0,4 bpp, as imagens comprimidas são consideradas não aceitáveis.
Nas Tabelas 7.2 e 7.3 mostram-se os resultados de medidas de compressão, medidas
de distorção, erros objetivos e quantitativos para uma taxa de bits de 0,5 bpp. Com base nesses
resultados considera-se em primeira instância que uma taxa de 0,5 bpp e com as wavelets Bior
2.4, 4.4, 5.5, e 6.8 se obtêm melhores resultados de compressão para imagens CT. Do mesmo
modo, nas mesmas tabelas se comparam os dois algoritmos de compressão EZW
(Embedded Zerotrees of Wavelet Transforms) e SPIHT (Set Partitioning In Hierarchical Trees),
sendo SPIHT o algoritmo de compressão de melhor desempenho.
Capítulo VII – RESULTADOS 165
Os resultados da Tabela 7.3 mostram que o algoritmo SPIHT é superior em
aproximadamente 1dB sobre o algoritmo EZW, para cada uma das imagens de teste. As
medidas de compressão e critérios de erro apresentam uma diferença pouco apreciável. Por
isso, quando se considera o critério de fidelidade qualitativa (Tab.3.1), as mudanças entre as
imagens não são percebidas. Assim, somente com uma mudança abrupta na taxa de bits (por
exemplo, de 0,4 para 0,8 bpp), é possível se encontrar as diferenças.
Quanto à medida de correlação, pode-se notar que existe uma semelhança muito
grande entre elas e somente tomando-se mais de três cifras decimais na medida se nota uma
diferença. Na Tabela 7.4, são mostradas as wavelets bi ortogonais cujos critérios de fidelidade
foram às melhores. A Fig. 7.2 mostra três imagens comprimidas usando-se a wavelet Bior 6.8
com taxas 0,4, 0,5 e 0,6 bpp.
Wavelet
bi ortogonal
Imagem
comprimida
Fator de
compressão (X:1)
Compressão
relativa (CR)
Fator de
mérito p(%)
Porcentagem
compressão (%)
SPIHT EZW SPIHT EZW SPIHT EZW SPIHT EZW SPIHT EZW
1.1 16,0 17,7 16,00:1 14,46:1 0,938 0,931 6,3 6,9 93,750 93,086
1.5 16,3 18,0 15,71:1 14,22:1 0,936 0,930 6,4 7,0 93,633 92,969
2.4 16,4 17,1 15,61:1 14,97:1 0,936 0,933 6,4 6,7 93,594 93,320
2.8 16,9 18,4 15,15:1 13,91:1 0,934 0,928 6,6 7,1 93,398 92,813
3.1 16,8 18,2 15,24:1 14,07:1 0,934 0,929 6,6 7,2 93,438 92,891
3.5 16,4 17,1 15,61:1 14,97:1 0,936 0,933 6,4 6,7 93,594 93,320
3.7 16,4 17,1 15,61:1 14,97:1 0,936 0,933 6,4 6,7 93,594 93,320
3.9 16,4 17,5 15,52:1 14,63:1 0,936 0,932 6,4 6,8 93,555 93,164
4.4 16,5 17,5 15,52:1 14,63:1 0,936 0,932 6,4 6,8 93,555 93,164
5.5 16,9 18,4 15,15:1 13,91:1 0,934 0,928 6,6 7,2 93,398 92,813
6.8 16,7 18,0 15,33:1 14,22:1 0,935 0,930 6,5 7,0 93,477 92,969
Tabela 7.2 - Desempenho dos algoritmos SPIHT e EZW baseado nas medidas
de compressão; tamanho da imagem CT 512x512 (256 KB) e taxa = 0,5 bpp.
166 Capítulo VII – RESULTADOS
Wavelet
bi ortogonal
MSE
0,4 0,5 0,6
PSNR
0,4 0,5 0,6
Correlação
0,4 0,5 0,6
2.4 2,0352 1,8261 1,6646 45,045 45,516 45,918 0,99986 0,99989 0,99991
5.5 2,0274 1,8283 1,6947 45,061 45,51 45,840 0,99986 0,99989 0,9999
4.4 1,9304 1,7243 1,5597 45,274 45,765 46,2 0,99988 0,9999 0,99992
6.8 1,9163 1,7072 1,5434 45,306 45,808 46,246 0,99988 0,9999 0,99992
Wavelet
bi ortogonal
Tamanho
imagem (KB)
MSE
SPIHT EZW
PSNR (dB)
SPIHT EZW
Correlação
SPIHT EZW
Avaliação qualitativa
SPIHT EZW
1.1 256 6,425 8,350 40,052 38,914 0,9954 0,9934 4 4
1.5 256 7,135 9,060 39,597 38,560 0,9951 0,9931 4 4
2.4 256 2,414 4,339 44,304 41,757 0,9959 0,9939 5 5
2.8 256 2,485 3,720 44,179 42,425 0,9956 0,9937 5 5
3.1 256 2,534 3,520 44,093 42,665 0,9949 0,9929 5 5
3.5 256 2,834 4,760 43,607 41,355 0,9952 0,9940 5 5
3.7 256 2,651 4,577 43,897 41,525 0,9953 0,9933 5 5
3.9 256 2,596 4,521 43,988 41,578 0,9954 0,9993 5 5
4.4 256 2,043 3,954 45,028 42,160 0,9961 0,9941 5 5
5.5 256 2,424 4,349 44,285 41,747 0,9971 0,9951 5 5
6.8 256 1,979 3,904 45,166 42,216 0,9975 0,9955 5 5
Tabela 7.3 - Desempenho dos algoritmos SPIHT e EZW baseado
nas medidas de erro; taxa = 0,5 bpp.
Tabela 7.4 – Medidas de erro com as wavelets biortogonais cujos critérios de
fidelidade foram as melhores. Nível de decomposição l=9, taxas = 0,4, 0,5, e 0,6 bpp.
Capítulo VII – RESULTADOS 167
Fazendo-se uma análise subjetiva das imagens, à primeira vista é difícil notar a
diferença entre elas. Observações exaustivas por parte de pessoal qualificado poderiam notar
as mudanças que representam cada taxa de compressão. O teste seguinte, modifica o nível de
decomposição wavelet, deixando a taxa de bits em 0,5 bpp. Comprimem-se novamente todas as
imagens variando-se os níveis de decomposição de l = 3 até l = 9.
Nesse teste, um dos objetivos foi minimizar o tempo computacional no processamento
das imagens. Os resultados confirmam uma vez mais que para compressão de imagens CT,
as melhores wavelets em termos de critérios de erro são a Bior 2,4, 5,5, 4,4 e 6,8 e o nível de
decomposição que melhor representa a imagem a um custo computacional (eq. 4.46) baixo é
l=4 e l=5. As Tabelas 7.5 e 7.6 mostram alguns resultados.
Wavelet
bi ortogonal MSE PSNR Correlação
2.4 2,6238 43,942 0,99982
5.5 2,6830 43,845 0,99981
4.4 2,4710 44,202 0,99984
6.8 2,4066 44,317 0,99985
Wavelet
bi ortogonal MSE
PSNR
dB Correlação
2.4 2,1290 44,849 0,99988
5.5 2,0560 45,001 0,99989
4.4 1,9743 45,177 0,99990
6.8 1,9655 45,196 0,99990
45,306 dB, 0,4 bpp 45,808 dB, 0,5 bp p 46,246 dB, 0,6 bpp
Fig. 7.2 – Imagens compridas usando a wavelet Bior. 6.8 [Hosp. ESALUD].
Tabela 7.5 – Resultados com nível de
decomposição l = 4, taxa = 0,5 bpp.
Tabela 7.6 – Resultados com nível de
decomposição l=5, taxa = 0,5 bpp.
168 Capítulo VII – RESULTADOS
Os testes seguintes consistem em repetir o experimento várias vezes para verificar que
os resultados obtidos acima foram realizados de uma forma correta. Os resultados dos testes
mostram que na tabela 7.5, com o nível l=4 e com uma taxa de 0,5 bpp é considerado
adequado em comparação aos resultados das tabelas 7.6, 7.7, 7.8. Cabe lembrar que todos os
resultados foram analisados com base nas medidas de compressão, nos critérios de fidelidade
e de erro para a compressão de imagens CT.
A partir das duas tabelas já anteriormente mencionadas, se selecionam novamente,
duas das wavelets bi ortogonais de melhor desempenho Bior 4,4 e Bior 6,8. A primeira é
utilizada e citada em várias publicações [107], [108], [Ts 2], [Ts 3], [Ts 4]. No padrão JPEG2000
essa wavelet é conhecida como a wavelet bi ortogonal 9/7.
As Tabelas 7.7 e 7.8, mostram alguns resultados das medidas de erro para duas
imagens diferentes com um nível fixo de decomposição l=5 e l=6 respectivamente, variando-
se a taxa de bits de 0,4 bpp até 0,9 bpp respectivamente. Nesse teste, a wavelet biortogonal 6.8
continua sendo a mais apropriada para as imagens CT.
Wavelet
Bior.
MSE
0,4 0,6 0,8 0,9
PSNR
0,4 0,6 0,8 0,9
Correlação
0,4 0,6 0,8 0,9
2.4
4.4
5.5
6.8
1,5408 1,2509 1,0902 1,0229
1,4776 1,1863 1,0320 0,9609
1,5691 1,2342 1,0862 1.0370
1,4591 1,1806 1,0261 0,9534
46,2533 47,1585 47,7556 48,0325
46,4351 47,3887 47,9937 48,3038
46,1742 47,2169 47,7717 47,9728
46,4899 47,4096 48,0186 48,3380
0,99996 0,99997 0,99998 0,99998
0,99996 0,99998 0,99998 0,99998
0,99996 0,99997 0,99998 0,99998
0,99996 0,99998 0,99998 0,99998
Wavelet
Bior.
MSE
0,4 0,6 0,8 0,9
PSNR
0,4 0,6 0,8 0,9
Correlação
0,4 0,6 0,8 0,9
2.4
4.4
5.5
6.8
2,0261 1,6360 1,3447 1,2549
1,9023 1,5083 1,2541 1,1662
1,9865 1,6481 1,3046 1,2198
1,8837 1,4872 1,2410 1,1504
45,064 45,992 46,844 47,144
45,337 46,345 47,147 47,462
45,149 45,960 46,975 47,267
45,380 46,407 47,192 47,522
0,99989 0,99993 0,99995 0 ,99995
0,99990 0,99994 0,99995 0,99996
0,99989 0,99993 0,99995 0,99996
0,99990 0,99994 0,99996 0,99996
Tabela 7.7 – Medidas de erro para as wavelets selecionadas com nível de
decomposição l=5, taxas 0,4, 0,6, 0,8 e 0,9 bpp.
Tabela 7.8 – Medidas de erro para as wavelets selecionadas com nível de
decomposição l=6, taxas 0,4, 0,6, 0,8 e 0,9 bpp.
Capítulo VII – RESULTADOS 169
A seguir mostra-se o comportamento das diferentes wavelets que são usadas na compressão,
com base nas medidas de erro PSNR e MSE, em função da taxa de bits, para algumas
imagens. Na Fig. 7.3, pode-se observar que a taxa de crescimento da PSNR, à medida que
aumenta a taxa de bits é quase constante para as 3 wavelets bi ortogonais (Bior 1.1, Bior 1.3 e
Bior 1.5). Além disso, pode-se observar que a Bior 1.1 é a de melhor desempenho.
Pode-se observar nas Tabelas 7.3 e 7.12 que as Bior 2.Nr, são mais apropriadas que as
Bior 1.Nr para a compressão de imagens CT. Na Fig. 7.4, observa-se que as Bior 3.Nr
conservam a uniformidade no crescimento da curva da PSNR, à medida que aumenta a taxa
Fig. 7.3 – Avaliação comparativa com diferentes wavelets 1.Nr.
170 Capítulo VII – RESULTADOS
de bits. A Bior 3,1 é a wavelet de pior desempenho. Os resultados mostram que as Bior 2.Nr,
continuam sendo as mais apropriadas quando comparadas com as Bior 1.Nr, Bior 3.Nr.
Fig. 7.4 – Avaliação comparativa com diferentes wavelets Bior 3.Nr.
Fig. 7.5 – Avaliação comparativa com diferentes wavelets Bior 4.4, 5.5, 6.8.
Capítulo VII – RESULTADOS 171
Por outro lado, apesar da uniformidade da resposta de PSNR das wavelets bi
ortogonais Bior 4.4, Bior 5.5 e Bior 6.8, conforme cresce a taxa de bits, observa-se que a Bior 5.5
se comporta melhor que as outras para taxas de bits pequenas, da ordem de 0,1 a 0,3
aproximadamente. Para taxas maiores a Bior 4.4 e Bior 6.8 superam o desempenho da Bior 5.5.
As Bior 5.5, 2.4, 4.4 e 6.8 correspondem às wavelets de melhor desempenho. Se a seleção for
mais rígida, então as Bior 4.4 e 6.8 superam as demais.
Para medir a qualidade da imagem comprimida por meio do critério de erro PSNR,
calcula-se o MSE, para cada uma das imagens envolvidas. A Fig. 7.6, mostra o
comportamento do MSE à medida que se incrementa a taxa de bits para as primeiras wavelets
bi ortogonais (Bior 1.1, Bior 1.3 e Bior 1.5).
Para taxas baixas de bits, a Bior 1.1, apresenta um valor do erro inferior, ou seja,
aproximadamente igual à metade daquele obtido para o restante das wavelets bi ortogonais.
Os valores do erro MSE convergem para o mesmo valor à medida que se incrementa a taxa
Fig. 7.6 – Avaliação comparativa com diferentes wavelets Bior 1.Nr.
172 Capítulo VII – RESULTADOS
de bits. Para o caso das wavelets Bior 2.Nr, o comportamento do MSE é mostrado na Fig. 7.7.
Os comportamentos são muito similares entre si, e as curvas convergem praticamente para
um mesmo valor quando a taxa de bits tende a 0,9 bpp.
Fig. 7.7 – Avaliação comparativa com diferentes wavelets Bior 2.Nr.
Fig. 7.8– Avaliação comparativa com diferentes wavelets Bior 3.Nr.
Capítulo VII – RESULTADOS 173
Na Fig. 7.8, pode-se ver o comportamento das wavelets Bior 3.Nr. A curva descreve o
erro MSE com base no incremento da taxa de bits . A Bior 3.5, apresenta o melhor
desempenho e a Bior 3.1 mostra um desempenho pobre.
Na Fig. 7.9, observam-se as curvas características do MSE para as wavelets Bior 4.4, Bior
5.5 e Bior 6.8, onde se observa que existe certo comportamento similar entre elas para todos os
valores de taxas de bits analisados. A wavelet de melhor desempenho é a bi ortogonal Bior 6.8.
A Tabela 7.9 mostra alguns valores de medidas de erro, para várias imagens
comprimidas com as wavelets bi ortogonais que são trabalhadas com diferentes taxas de bits.
Os resultados mostram que a wavelet Bior 6.8 apresenta os melhores resultados, levando-se
em conta as medidas de qualidade objetiva.
Fig. 7.9 – Avaliação comparativa com diferentes wavelets.
174 Capítulo VII – RESULTADOS
Wavelet bi ortogonal SNR MSE PSNR Correlação Taxa de bits (bpp)
1.1 2576,63013 3,332292 42,903373 0,999806 0,5
1.5 1993,87668 3,788733 42,345863 0,999749 0,5
2.4 5038,63175 2,382925 44,359699 0,999901 0,5
2.8 4992,95892 2,394034 44,3395 0,9999 0,5
3.1 2487,75056 3,391675 42,826662 0,999799 0,5
3.5 4455,88243 2,534085 44,092592 0,999888 0,5
3.7 4556,84739 2,506042 44,140921 0,99989 0,5
3.9 4552,53944 2,507173 44,138961 0,99989 0,5
4.4 5246,66739 2,335082 44,447782 0,999905 0,5
5.5 4802,97419 2,440641 44,255765 0,999896 0,5
6.8 5275,75444 2,328636 44,459787 0,999905 0,5
1.1 3306,12641 2,941918 43,444497 0,999849 0,6
1.5 2746,4915 3,228004 43,041463 0,999818 0,6
2.4 7014,51459 2,019682 45,077973 0,999929 0,6
2.8 6724,62736 2,062939 44,98594 0,999926 0,6
3.1 3831,45316 2,733002 43,764404 0,999869 0,6
3.5 6064,49055 2,172193 44,761819 0,999918 0,6
3.7 6203,52561 2,147871 44,810722 0,999919 0,6
3.9 6248,83487 2,140016 44,826634 0,99992 0,6
4.4 7449,62962 1,959764 45,208765 0,999933 0,6
5.5 7233,44281 1,988757 45,144985 0,999931 0,6
6.8 7640,49984 1,935263 45,263403 0,999935 0,6
Tabela 7.9 - Medidas de erro para várias taxas de bits para um nível de decomposição wavelet.
l=4.
175
Capítulo 8
Conclusões
1. No presente trabalho, são investigados vários métodos de codificação ROI com o
objetivo de lograr uma codificação sem perda de informação. Muitas técnicas foram
comparadas com o objetivo de buscar uma qualidade superior, mas ainda assim com
perdas.
Métodos de codificação com perdas talvez sejam aplicáveis somente em conjunto com
um codificador sem perdas para uma imagem regional residual.
Os resultados com uma codificação ROI dependem de vários fatores, incluindo o
tamanho e a forma da ROI. Além disso, para ROIs muito pequenas, o método mais
simples consiste em se utilizar codificação wavelet zerotree seguido de codificação
aritmética.
2. Quando uma compressão de imagens é baseada na codificação ROI e na WT, devem ser
considerados dois aspectos importantes:
Caso que a ROI seja definida e codificada no domínio espacial e,
Caso que a ROI seja definida e processada no domínio wavelet.
A abordagem espacial tem a vantagem de que a informação ROI corresponde à
percepção física da ROI. Essa abordagem funciona bem, quando se está interessado
apenas na informação ROI sem necessidade de se visualizar as outras partes da
imagem.
176 Capítulo VIII – CONCLUSÕES
3. O maior benefício da codificação ROI é a sua capacidade de oferecer alta qualidade de
reconstrução sobre certas regiões espaciais com altas taxas de compressão.
4. A codificação ROI pode ser incorporada dentro das técnicas de compressão, a qual
pode atingir uma transmissão progressiva. Isso permitiria que o usuário encerrasse a
transmissão de uma série de dados DICOM. Assim, uma região ROI é reconstruída com
uma boa qualidade e o tempo de transmissão pode ser grandemente reduzido.
Comentários
• Algoritmos de codificação revelam que o código incorporado com base na
transformada wavelet discreta atende aos principais requisitos para uma compressão de
imagens médicas. De fato, nesse caso conseguem-se diferentes tipos de suporte de
flexibilidade, codificação de regiões de interesse, qualidade e escalabilidade de
resolução. Além disso, decompõe-se uma imagem em um conjunto de coeficientes,
detalhes que constituem uma representação multiescala da imagem.
• Por outro lado, os métodos de compressão sem perdas, regionalmente têm o potencial
para uma aceitação médica generalizada. Isso porque os níveis de import}ncia variam,
assim como as características estatísticas e podem assim serem ajustadas para as
necessidades do radiologista.
“O importante na vida não é o sucesso, sim não,
o coragem de seguir adiante apesar dos tropeços
e que, a verdadeira sabedoria é em saber como
aumentar o bem-estar do mundo.”
E. Gladys Cutipa A.
177
Trabalho Futuro
1. Prosseguimentos a este trabalho podem incluir comparações de métodos para
múltiplas regiões ROI, simulações clínicas dos métodos de codificação em um sistema
de arquivamento, e codificação de regiões ROI com forma arbitrária. Para formas
arbitrárias, a descrição do limite real da ROI pode tornar-se significativa na contagem
de bits total.
O requisito para codificação sem perdas na ROI deve ser levado em conta na taxa de
distorção procurando-se um compromisso entre a precisão da descrição do limite, e a
sobrecarga necessária.
179
Referências Bibliogr{ficas
*1+ Gomes, J.; Velho, L.; Goldstein, S.,"Wavelets: Teoria, Software e Aplicações". São Paulo:
IMPA, 1997.
*2+ Portilla J.; Somoncelli, E. P., ‚Image Denoising Via Adjustment of Wavelet Coefficient
Magnitude Correlation‛ In: Proceedings of the IEEE Int'l Conf on Image Processing, 3,
2000, Vancouver. Proceedings... Vancouver: IEEE, 2000.p.277-280,2000.
*3+ Diniz, P. S. R.; Silva, E. A. B.; Lima, S. N., ‚Processamento Digital de Sinais: Projeto e
An{lise de Sistemas‛. Porto Alegre: Bookman, 2004.
*4+ Albuquerque, M. P.; Caner, E. S.; Melo, A. G., ‚An{lise de Imagem e Visão
Computacional‛. Rio de Janeiro: CBPF, 2004.
[5] Bertozzo, N.; Furuie, S. S., ‚Sistema de Armazenamento e Distribuição de Imagens
Médicas do PACS‛. InCor. [S.l], 2003. Disponível em:
<httt://www.avesta.com.br/anais/dados/trabalhos/274.pdf. >
*6+ Botelho, S. S. C., ‚Processamento Digital de Imagens: Conceitos B{sicos de Imagens‛.
(s.l.:s.n.),2005.Disponível em:
<http://www.ee.furg.br/~silviacb/DIP/Conceitos_Basicos.html>.
*7+ Gonzales, R. C.; Woods, R. E., ‚Digital Image Processing‛. (s.l.):Publishing Company,
1992.
180 REFERÊNCIAS BIBLIOGRÁFICAS
*8+ Albuquerque, M. P.; Caner, E. S.; Melo, A. G., ‚An{lise de Imagem e Visão
Computacional‛. Rio de Janeiro: CBPF, 2004
*9+ Alcocer,P. R. C.; Furuir, S. S.; Arie, S.; Melo, C. P. ‚A DICOM Graphic User Interface for
PC's: Towards a Hierarchical System for Dynamic Digital Angiographic Image Storage
and Visualization‛. RBE – Revista Brasileira de Engenharia. Caderno de Engenharia
Biomédica, Rio de Janeiro, v.12, p.191-201, 1996.
*10+ Gonzales, R. C.; Woods, R.E., ‚Digital Image Processing‛. Snd Ed., Prentice Hall, Upper
Saddle River, NJ, 2002.
*11+ Gonzales, R. C.; Woods, R. E., ‚Processamento de Imagens Digitais‛. São Paulo: Edgard
Blucher, 2000.
*12+ M.Ñelson, ‚The Data Compression Book‛. Redwood City, CA: MT Books, 1991.
[13] S. R. Tate, CSCI 5330.002: ‚Introduction to Data Compression.‛ Handout 2, University
of North Texas, January 1997.
[14] S. R. Tate97, CSCI 5330.002: ‚Data Compression and Information Theory.‛ Handout 3,
University of North Texas, January 1997.
*15+ Nijim Y.W., Stearns S.D., Mikhael W.B., ‚Differentiation Applied to Lossless
Compression of Medical Images‛. IEEE Trans, on Medical Imaging, vol.15, no. 4, p.555-
559, 1996.
[16] Pennebaker WB, Mitchell JL., ‚JPEG: Still Image Compression Standard‛. New York:
Van Nostrand Reinhold, 1993.
[17] V. G. Ruiz, ‚Compresión Reversible y Transmisión de Im{genes‛. Ph.D. Disertation,
Universidad de Almería, Departamento de Arquitectura de Computadores y
Electrónica, 2000.
REFERÊNCIAS BIBLIOGRÁFICAS 181
*18+ Chen Z.D., Chang R.F., Kuo W.J., ‚Adaptative Predictive Multiplicative Autoregressive
Model for Medical Image Compression‛. IEEE Trans, on Medical Imaging, vol. 18, no. 2,
p. 181-184, 1999.
*19+ Weinberger MJ, Seroussi G, Sapiro G. ‚LOCO-I: A Low Complexity,Ccontext-Based,
Lossless Image Compression Algorithm‛. In: Storer J, Cohn M, editors. Proceedings of
the IEEE Data Compression Conference.IEEE Computer Society Press, pp. 140–149. 1996.
[20] M. J. Weinberger, G. Seroussi, and G. Sapiro, ‚Loco-I: A Low Complexity, Context-
Based, Lossless Image Compression Algorithm‛. In Data Compression Conference
(DCC), pp. 140–149, 1996.
*21+ Wu X. ‚Lossless Compression of Continuous-tone Images Via Context Selection,
Quantization and Modeling‛. IEEE Transactions on Image Processing; 6(5):656–664,1997.
*22+ Huang L, Bijaoui A., ‚An Efficient Image Compression Algorithm Without Distortion‛.
Patter Recognition Letters; 12: 69 – 72, 1991.
*23+ Said A, Pearlman Wa. ‚Reversible Image Compression Via Multiresolution
Representation and Predictive Coding‛. Visual Communications and Image Processing
93, Proc SPIE ; 2094: 664 – 674, 1993.
[24] Nijim Y.W., Stearns S.D., Mikhael W.B., ‚Differentiation Applied to Lossless
Compression of Medical Images‛. IEEE Trans, on Medical Imaging, vol.15, no. 4, p.555-
559, 1996.
[25] Chen Z.D., Chang R.F., Kuo W.J., ‚Adaptative Predictive Multiplicative Autoregressive
Model for Medical Image Compression”. IEEE Trans, on Medical Imaging, vol. 18, no. 2,
p. 181-184, 1999.
*26+ Kivijarvi J., Ojala T., Kaukoranta T., Kuba a., Nyul L., Nevalainen O., ‚A Comparison of
Lossless Compression Methods for Medical Images‛. Computerized Medical Imaging and
Graphics, vol. 22, p. 323-339, August 1998.
182 REFERÊNCIAS BIBLIOGRÁFICAS
[27] J. A. Leehan and S. C. Villalobos, ‚Estudio Comparativo de Cuatro Métodos de
Compresión para Im{genes de Resonancia Magnética Nuclear‛.Departamento de
Ingeniería eléctrica, Universidad Autónoma Metropolitana-Iztapalapa Av. Purísima y
Michoacán, 1999.
[28] N. Mark, ‚The Data Compression Book‛. Segunda edición ed. IDG Books Worldwide
Inc: MIT Books, 2001.
[29] S. Lo and K. Huang, ‚Radiological Image Compression: Full-frame bit allocation
technique‛. Radiology, vol. 155, pp. 811–817, 1985.
[30] ‚Compression of radiological image with 512, 1024 and 2048 matrices‛. Radiology, vol.
161, pp. 519–525, 1986.
[31] M. Antonini, M. Barlaud, P. Mathieu, and I. Daubechies, ‚Image Coding Using Wavelet
Transform‛. IEEE Transactions and Image Compressing, vol. 1, no. 2, pp. 205–220, 1992.
[32] P. Cosman, R. Gray, and R. Olshen, ‚Evluating Quality of Compressed Medical Images:
Subjective Rating, and Diagnostic Accuracy‛. Proceedings of the IEEE, vol. 82, no. 6, pp.
919–932, 1994.
[33] E. Moyano, P. Gonz{les, L. Orozco, and A. Garrido, ‚Paralelización de un Sistema de
Compresión Basado en Wavelets para Aplicaciones Médicas‛. X Jornadas de
Paralelismo, la Manga del Mar Menor – Murcia, Septiembre 1999.
*34+ S.Shenbaga Devi and K.Vidhya.,‚Development of Medical Image Compression
Techniques‛. ICCIMA.2007.
[35] R.S. Dilmaghani, A. Ahmadian, M.Ghavami, and A. H. Aghvami, IEEE Signal Processing
Letter, 11 (10), 806, 2004.
[36] W. B. Pennebaker and J. L. Mitchel,‚JPEG-Still Image Compression Standards‛. Van
Nostrand Reinhold, 1993.
REFERÊNCIAS BIBLIOGRÁFICAS 183
[37] Ricke J., Maass P., Lopez Hanninen E., Liebin T., Amthauer H., Stroszczynski C.,
Schauer W., Boskamp T., Wolf M., ‚Wavelet versus JPEG (Joint Photographic Expert
Group) and Fractal Compression. Impact on the Detection of Low Contrast Details in
Computed Radiographs‛. Investigative Radiology, vol. 33, no. 8, p.456-463, 1998.
[38] Yuzo Iano, Fernando Silvestre da Silva, and Ana Lúcia Mendes Cruz, ‚Codificação
Fractal de Imagens‛. Revista de Telecomunicações, vol.11, no. 01, Maio 2008.
*39+ G.Strang e T.Nguyen, ‚Wavelets and Filter Banks”. Wellesley –Cambridge Press, 1996.
*40+ O.Rioul e M.Vetterli, ‚Wavelet and Signal Processing‛. IEEE Signal Processing Magazine,
vol.8, no. 4, pp. 14-38, Oct. 1991.
*41+ S.Shenbaga Devi and K.Vidhya. ‚Development of Medical Image Compression
Techniques‛ ICCIMA.2007
[42] R.S. Dilmaghani, A. Ahmadian, M.Ghavami, and A. H. Aghvami, IEEE Signal Processing
Letter, 11 (10), 806, 2004.
[43] J. Shapiro, ‚Embedded Image Coding Using Zerotrees of Wavelet Coefficients‛.
IEEETrans. Signal Processing, vol.41, pp. 3445-3463, Dec.1993.
[44] D. Taubman, ‚High Performance Scalable Image Compression with EBCOT‛. IEEE
Trans. Image Processing, vol. 9, pp. 1158-1170, July 2000.
[45] Faria, R. R. A., ‚ Wavelets e as artes multirresolucionárias‛, 1997.
Disponível em: <http://www.lsi.usp.br/~regis/wlets.html>.
[46] Daubechies, I., ‚Ten lectures on wavelets”. Philadelphia: SIAM Books, 1992.
[47] I. Daubechies, ‚Orthonormal Bases of Compactly Supported Wavelet‛. Commun. Pure
Applied Math., vol. 41, pp. 909–996, Nov. 1988.
184 REFERÊNCIAS BIBLIOGRÁFICAS
[48] Nievergelt, Y., ‚Wavelets made easy‛. Boston: Bikhäuser, 1999.
[49] Silva, A.V.; Eyng, J., ‚Wavelets e Wavelet Packets‛. In: SEMINÁRIO VISÃO
COMPUTACIONAL, 2, 2000, Florianópolis. Visão Computacional.
Florianópolis: PPGCC - INE - UFSC, 2000. Disponível em:
< http://www.inf.ufsc.br/~visao/2000/Wavelets/index.html>.
[50] I. Daubechies. ‚Ten Lectures on Wavelets‛, The Society for Industrial and Applied
Mathematics, 1992.
[51] Osborne, D.; Rogers, D.; Mazumdar, J.; Coutts, R. ;Abbot, D., ‛ An Overview of
Wavelets for Image Processing for Wireless Applications‛. Proceedings of SPIE,
Autralia v. 4935, p. 427-435, 2002.
[52] Stollnits, E. J.; Derose, T. D.; Salesin, D. H. ‚Wavelets for Computer Graphics Theory
and Applications,‛ San Francisco: Morgan Kaufmann Publishers, 1996.
[53] Daubechies, I. ‚The Wavelet Transform, Time Frequency Localization and Signal
Analysis‛. IEEE Transactions on Information Theory, New York, v.36, p.961-1005, 1990.
[54] Falcão, A. X.; Leite, N. J., ‘Fundamentos de processamento de imagem digital‛.
Campinas: Unicamp, 1998.
[55] Coifman, R. ‚Adapted Multiresolution Analysis, Computation, Signal Processing and
Operator Theory‛. In: CONGRESS OF MATHEMATICIANS, 1990, Kioto. Proceedings .
Kioto:(s.n.), pp. 879-887,1990.
[56] Albuquerque, M. P., ‚Processamento de imagens: métodos e análises‛. Rio de Janeiro:
FACET, 2001.
[57] Stollnits, E. J.; Derose, T. D.; Salesin, D. H. ‚Wavelets for Computer Graphics Theory
and Applications‛. San Francisco: Morgan Kaufmann Publishers, 1996.
REFERÊNCIAS BIBLIOGRÁFICAS 185
[58] M.Antonini, M. Barlaud, P. Mathieu e I. Daubechies, ‚Image Coding Using Wavelet
Transform‛. IEEE Trans. on Image Processing , vol. 1, no. 2, Apr.1992.
[59] A. C. Franca, ‚Um Codec para Imagens Paradas Baseado em Transformada Discreta de
Wavelets e Quantização Linear Adaptativa‛. In: Anais do XIV Simposio Brasileiro de
Telecomunicações. (Curitiva, Brazil), vol.1, p. 67-72, Jul. 1996.
[60] C.M Brislawn, J. N. Bradley e T.Hopper, ‚The FBI Compression Standart for Digitized
Fingerprint Images.‛In: Proceedings of the SPIE Conference.Applications of Digital
Image Processing XIX, pp. 2847, 1996.
[61] J.M. Shapiro, ‚Embedded Image Coding Using Zerotrees of Wavelet Coeficients‛. IEEE
Trans. Signal Processing, vol. 41, PP. 3445-3462, Dec.1993.
[62] J. S. Lim, ‚Two Dimensional Signal and Image Processing‛. Englewood Cliffs, NJ:
Prentice-Hall, 1989.
[63] A. K. Jain, ‚Fundamental of Digital Image Processing‛. Englewood Cliffs, NJ: Prentice-
Hall, 1988.
[64] Gomes, J.; Velho, L. ; Goldstein, S. ‚Wavelets: Teoria, Software e Aplicações‛.São
Paulo: IMPA, 1997.
*65+ Y.M. Akay, M. akay, W. Welkowitz, and j,Kostis, ‚Noninvasive Detection of Coronary
Artery Disease‛. IEEE Eng. In Med. And Biol. Mag., vol. 13, no. 5, pp. 761-764, 1994.
[66] M.Akay, Y. M. Akay, W. Welkowitz, and S. Lewkowicz, ‚Investigating the Effects of
Vasodilator Drugs on the Turbulent Sound Caused by Femoral Artery Stenosis Using
Short-term Fourier and Wavelet Transform Methods‛.
IEEE Trans.Biomed. Eng., vol. 41, pp. 921-928, Oct. 1994.
[67] S.Mallat and W.L. Hwang, ‚Singularity Detection and Processing with Wavelets‛.
IEEE Trans. Informat. Theory, vol.38, pp. 617-643, Feb. 1992.
186 REFERÊNCIAS BIBLIOGRÁFICAS
*68+ ‚Texture Classification and Segmentation Using Wavelet Frames‛.
IEEE Trans. Image Process., vol. 4, pp. 1549-1560. Nov. 1995.
[69] J. Radon, ‚Uber die Bestimmung von Functionen Durch ihre Integralwerte Langs
Gewisser Mannigfaltikeiten‛. Math-Phys. Kl, vol.69, pp. 262-267, 1987.
[70] D. Ludwig, ‚The Radon Transform on Euclidean Space‛. Comm. On Pure and
Appl.Mathematics, vol. 19, pp. 49-81, 1966.
[71] T. Olson and J. DeStefano, ‚Wavelet Localization of the Radon Transform‛, IEEE Trans.
Signal Process., vol. 42, pp. 2055-2067, Aug. 1994.
[72] G. Lemaur, ‚On the Choise on the Wavelet Basis Function for Image Processing‛
Master’s thesis, Université de Mons-Hainaut, Faculté des Sciences, 2003.
[73] J. D.Villasenor, B. Belzer, and J. Liao, ‚Wavelet Filter Evaluation for Image
Compression‛, IEEE Transactions on Image Processing, vol. 2, no. 2, pp. 1053–1060, 1995.
[74] Y. Shang, L. Li, and B. Wah, ‚Optimization Design of Bi orthogonal Filter Banks for
Image Compression‛, Information Sciences, vol. 132, pp. 23–51, 2001.
[75] J.Ñ. Bradley, C. M. Brislawn, and T. Hopper, ‚The FBI Wavelet/Scalar Quantization
Standar for Grayscale Finger Print Image Compression‛, In SPIE Proceedings vol 1961,
Visual Information Processing II, pp. 293–304, April 1993.
[76] M. Vetterli, ‚Wavelets, Approximation and Compression‛, IEEE Signal Procesing
Magazine, vol. 18, pp.59–73, 2001.
*77+ Digital Imaging and Communications in Medicine (DICOM), NEMA Publications,
‚DICOM Strategic Document‛, Ver. 8.0, April 2008, available at:
http://medical.nema.org/dicom/geninfo/Strategy.pdf
REFERÊNCIAS BIBLIOGRÁFICAS 187
*78+ Horri, S.; Prior, F. ET AL.,‛DICOM: An Introduction to the Standard‛.
University of Pennsylvania.
www.ipl.utmck.edu/radiology/inforad/dicom_std/dicom_PSU_intro.html
[79] C. S. Burrus, R.A. Gopinath, and H. Guo, ‚Introduction to Wavelets and the Wavelet
Transform: A Primer‛, Englewood Cliffs, NJ: Prentice-Hall,1998.
[80] Howard PG, Vitter JS. ‚Fast and Efficient Lossless Image Compression‛
In: Storer J, Cohn M, editors. IEEE Data Compression Conference, IEEE Computer Society
Press, 1993:351 – 360.
[81] C. Liu, T. Xia, and H. Li, ‚ROI and FOI Algorithms for Wavelet-Based Video
Compression‛, In Proc. 5th Pacific Rim Conf. Multimedia, Tokyo, p.p 241, Nov. 2004.
[82] I. Ueno and W. Pearlman, ‚Region of Interest Coding in Volumetric Images With
Shape-Adaptive Wavelet Transform‛, in Proc. SPIE, vol. 5022, pp. 1048–1055, May 2003.
[83] S. Li and W. Li, ‚Shape-Adaptive Discrete Wavelet Transform for Arbitrary Shaped
Visual Object Coding‛, IEEE Trans. Circuits Syst. VideoTechnol., vol. 10, pp. 725–743,
Aug. 2000.
[84] S.B. Gokturk, C. Tomasi, B. Girod, and C. Beaulieu, ‚Medical Image Compression
Based on Region of Interest, With Application to Colon CT Images‛, Iin Proc. 23rd Ann.
Int. Conf. IEEE EMBS, Istanbul, p. 2453, 2001.
*85+ Z. Xiong, X. Wu, and D.Y. Yun, ‚Progressive Coding of Medical Volumetric Data Using
Three-Dimensional Integer Wavelet Packet Transform‛, In Proc. 2nd IEEE Workshop
Multimedia Signal Processing, Redondo Beach, CA, pp. 553–558, Dec. 1998.
*86+ D. Agrafiotis, D.R. Bull, and N. Canagarajah, ‚ROI Coding of Volumetric Medical
Images With Application to Visualisation‛, In Proc. 3rd Int. Symp.Image and Signal
Processing and Analysis, Rome, p. 217, Sept. 2003.
188 REFERÊNCIAS BIBLIOGRÁFICAS
[87] Shepp L.A., Y.Vardi ‚Maximum Likelihood Reconstruction for Emission Tomography‛,
IEEE Trans.Med.Imag., vol.1(2):113-122, 1982.
[88] Tischer PE, Worley RT, Maeder AJ, Goodwin M. ‚Context-Based Lossless Image
Compression‛, The Computer Journal, 36(1): 68 – 77, 1993.
*89+ Golomb SW.,‛Run-length encodings”, IEEE Transactions on Information Theory ;IT12:399–
401, 1996.
*90+ Rice RF. ‚Some Practical Universal Noiseless Coding Techniques‛, Technical Report
JPL-79-22. Pasadena, CA: Jet Propulsion Laboratory, 1979.
[91] Wu X., Memon N.D., ‚Context-Based Adaptive Lossless Image Compression‛, IEEE
Transactions on Information Theory, vol. 23, p. 337-343, 1997.
[92] Misiti, M.; Misisti, Y.; Oppenheim, G.; Poggi, J. ‚Matlab: wavelet toolbox user's guide”.
Natick: Math Works, 1996.
[93] Charilaos and Touradj Ebrahimi.,‛The JPEG2000 Still Image Coding System: An
Overview‛, IEEE 2000.
[94] D.L. Donoho, ‚Denoising by Soft-Thresholding‛, IEEE Trans. Inform.Theory, vol.41, pp.
613-627, Mar. 1995.
[95] D.L. Donoho, ‚Threshold Selection for Wavelet Shrinkage of Noisy Data‛,
IEEE EMBS workshop on Wavelets in Med. And Biol., Baltimore, pp. 24a-24b, 1994.
[96] R.A. DeVore and B.J. Lucier, ‚Fast Wavelet Techniques for Near-Optimal Image
Processing‛, IEEE Military Commun. Conf., New York, pp.48.3.1-48.3.7, 1992.
[97] J.P. Guedon and Y.Bizais,‚Bandlimited and Haar Filtered Backprojection
Reconstructions‛, IEEE Trans. Med. Imag., vol.13, pp. 430-440, Mar. 1994.
REFERÊNCIAS BIBLIOGRÁFICAS 189
[98] J.P. Guédon and M. Unser, ‚Least Squares and Spleen Filtered Back-Projection‛, NCRR
Rep.52/92, Nat. Inst. Health, 1992.
[99] J.P. Guedon, M. Unser, and Y. Bizais, ‚Pixel Intensity Distribution Models for Filtered
Back-Projection‛, Iin Proc. IEEE Med. Imaging Conf., santa Fe, NM, 1991, vol.3, pp. 2063-
2067.
*100+ Huang, H 97 ‚Multimedia Applications in Health Care‛, IEEE Multimedia Vol. 4, n°2.,
1998.
*101+ Meyer B., Tischer P., ‚TMW a New Method for Lossless Image Compression‛,
Proceedings of International Picture Coding Symposium, Berlin, p. 217-220, 1997.
*101+ Moyano A. Encarnación, Quiles F. Francisco., ‚Técnicas de Compresión sobre Im{genes
Médicas‛, Universidad de Castilla-La Mancha.
*102+ Y.Sheng,‚The Transforms and Applications Handbook‛, CRC Press, 1996.
*103+ J.B. Weaver, X. Yansun, D. M. Healy, Jr., and L.D. Cromwell,‚Filtering Noise from
Images with Wavelet Transforms‛, Magnet. Reson. In Med., vol.21, no. 2, pp.288-295,
1991.
*104+ Y. Xu, J.B. Weaver, D.M. Healy, Jr., and J.Lu, ‚Wavelet Transform Domain Filters: A
Spatially Selective Noise Filtration Technique‛, IEEE Trans. Image Process., vol. 3, pp.
747-758, Dec.1994.
*105+ J. Azpiroz and J.F. Lerallut, ‚Selection of birthogonal filters for image compression or images
using wavelet packets‛, Dept. Ing. Elétrica, Universidade Autónoma Metropolitana-
Iztapalapa, 1999.
*106+ S.Grgic, M.Grgic, and B.Zovko-Cihlar, ‚ Performance Analysis of Image Compression
Using Wavelet‛, IEEE Transactions on Industrial Electronics, vol. 48, no.3, pp.682-695,
2001.
190 REFERÊNCIAS BIBLIOGRÁFICAS
*107+ M.Antonini, M. Barlaud, P. Mathieu, and I. Daubechies, ‚Image Coding Using Wavelet
Transform‛, IEEE Transactions and Image Compressing, vol. 1, No. 2, pp. 205-220, 1992.
*108+ A. Said and W.A. Perlman, ‚A New, Fast and Efficient Image Codec Based on Set
Partitioning in Hierarquical Trees‛, IEEE Trans Med. Imaging, vol. 6, No. 3, pp. 243-250,
1996.
[109] M. Antonini, M. Barlaud, P. Mathieu, and I. Daubechies, ‚Image Coding Using Wavelet
Transform‛, IEEE Transactions and Image Compressing, vol. 1, no. 2, pp. 205–220, 1992.
[110] J. D.Villasenor, B. Belzer, and J. Liao,‚Wavelet Filter Evaluation for Image
Compression‛, IEEE Transactions on Image Processing, vol. 2, no. 2, pp. 1053–1060, 1995.
[111] S. Grgic, M. Grgic, and B. Zovko-Cihlar,‚Performance Analysis of Image Compression
Using Wavelets‛, IEEE Transactions on Industrial Electronics, vol. 48, no. 3, pp. 682–695,
2001.
[112] Liu, L. & Fan, G. ‚A New Method for JPEG2000 Region of Interest Image Coding: Most
Significant Bitplanes Shift‛, IEEE Signal Processing, 10(2), P.35-39, 2003.
[113] Wang, Z. & Bovik, A. C. ‚Bitplane-by-Bitplane Shift (BbBShift): A suggestion for
JPEG2000 Region of Interest Coding,‛ IEEE signal Processing Letters, 9(5), p. 160-162,
2002.
[114] G. Anastassopoulos and A. Skodras, ‚JPEG2000 ROI coding in medical imaging
applications,‛ presented at 2nd IASTED Int. Conf. Visualization, Imaging and Image
Processing (VIIP2002), Malaga, Spain, Sept. 2002.
[115] ISO/IEC JTC 1/SC 29/WG 1 (ITU-T SG8), JPEG 2000 Part II Final Committee Draft, Dec.
2000.
REFERÊNCIAS BIBLIOGRÁFICAS 191
[116] ISO/IEC JTC 1/SC 29/WG 1 (ITU-T SG8), JPEG 2000 Part I Final Committee Draft Version
1.0, Mar. 2000.
[117] Z. Liu, J. Ha, Z. Xiong, Q. Wu, and K. Castleman,‚Lossy-to-lossless ROI Coding of
Chromosome Images Using Modified SPIHT and EBCOT‛, in Proc. IEEE Int. Symp.
Biomedical Imaging, Washington, DC, p. 317. Jul.2002.
[118] D. Taubman, ‚High Performance Scalable Image Compression With EBCOT‛, IEEE
Trans. Image Processing, vol. 9, pp. 1158–1170, Jul. 2000.
[119] Z. Liu, J. Ha, Z. Xiong, Q. Wu, and K. Castleman, ‚Cascaded Differential and Wavelet
Compression of Chromosome Images‛, IEEE Trans. Biomed.Eng., vol. 49, pp. 323–283,
Apr. 2002.
[120] G. Minami, Z. Xiong, A. Wang, and S. Mehrotra, ‚3-D Wavelet Coding of Video With
Arbitrary Regions of Support‛, IEEE Trans. Circuits Syst. VideoTechnol., vol. 11, pp.
1063–1068, Sept. 2001.
[121] S. Tasdoken and A. Cuhadar, ‚ROI Coding with Integer Wavelet Transforms and
Unbalanced Spatial Orientation Trees‛, presented at 25th Ann. Int. Conf. IEEE EMBS,
Mexico, Sept. 2003.
[122] M. Penedo, W.A. Pearlman, P.G. Tahoces, M. Souto, and J.J. Vidal, ‚Region-Based
Wavelet Coding Methods for Digital Mammography‛, IEEE Trans. Med. Imag., vol. 22,
pp.1288–1296, Oct. 2003.
[123] S. Li and W. Li, ‚Shape-Adaptive Discrete Wavelet Transform for Arbitrary Shaped
Visual Object Coding‛, IEEE Trans. Circuits Syst. Video Technol., vol. 10, pp. 725–743,
Aug. 2000.
[124] A. Islam and W.A. Pearlman, ‚An Embedded and Efficient Low-Complexity
Hierarchical Image Coder‛, in Proc. SPIE, vol. 3653, p. 294–305, Dec. 1999.
192 REFERÊNCIAS BIBLIOGRÁFICAS
[125] C.N. Doukas, I. Maglogiannis, and G. Kormentzas, ‚Medical Image Compression
Using Wavelet Transform on Mobile Devices with ROI Coding Support,‛ in Proc. 27th
Ann. Int. Conf. IEEE EMBS, Shanghai, China, pp. 3779–3784, Sept. 2005.
[126] R. Dilmaghani, A. Ahmadian, M. Ghavami, M. Oghabian, and H. Aghvami, ‚Multi
rate/resolution control in progressive medical image transmission for the region of
interest (ROI) using EZW‛, presented at the 25th Ann. Int. Conf. IEEE EMBS, Mexico,
Sept. 2003.
[127] S.B. Gokturk, C. Tomasi, B. Girod, and C. Beaulieu, ‚Medical Image Compression
Based on Region of Interest, with Application to Colon CT Images‛, in Proc. 23rd Ann.
Int. Conf. IEEE EMBS, Istanbul, p. 2453, 2001.
[128] A. Cziho, G. Cazuguel, B. Solaiman, and C. Roux, ‚Medical Image Compression Using
Region-of-Interest Vector Quantization‛, in Proc. 20th Ann. Int. Conf. IEEE EMBS, Hong
Kong, p. 1277, 1998.
[129] N.M. Nasrabadi and R.A. King, ‚Image Coding Using Vector Quantization: A
Review‛, IEEE Trans. Commun., vol. 36, pp. 957–971, Aug. 1988.
[130] D. Agrafiotis, D.R. Bull, and N. Canagarajah, ‚ROI Coding of Volumetric Medical
Images with Application to Visualisation‛, in Proc. 3rd Int. Symp. Image and Signal
Processing and Analysis, Rome, p. 217, Sept. 2003.
[131] D. Gibson, M. Spann, and S.I. Woolley, ‚A Wavelet-Based Region of Interest Encoder
for the Compression of Angiogram Video Sequences‛, IEEE Trans. Inform. Technol.
Biomed., vol. 8, pp. 103–113, Jun. 2004.
[132] P. Bharti, S. Grupta, R. Bhatia, ‚Comparative Analysis of Image Compression
Techniques: A Case Study on Medical Images‛, in Int. Confer. Technol. Communication
and Computing, 2009.
REFERÊNCIAS BIBLIOGRÁFICAS 193
[133] K. Dejhan, S.Yimmun, P. Suapang, K. Mongkut, ‚A Web-based DICOM-Format Image
Archive, Medical Image Compression and DICOM Viewer System for Teleradiology
Application‛, in SICE Annual Conference 2010.
Livros: 1. A concise introduction to data compression
Autor: David Salomon
London; Springer, ©2008.
Pag. 21-57, 143-198.
2. Biosignal and Biomedical Image Processing
MATLAB – Based Applications
Autor: John L. Semmlow
Switzerland; Dekker, ©2004.
Cap. VII , X e XIII.
3. Compression of Biomedical Images and Signals
Autor: Christine Cavaro-Menard
France; Lavoisier, ©2007.
Pag. 01-10, 15-39, 77-95, 101-111, 129-150, 155-181, 187-207.
4. Compression of Biomedical Images and Signals
Autor: Christine Cavaro-Menard
©ISTE Ltd, 2008.
Pag. 01-39, 50-72, 155-173.
5. Digital Imaging and Communications in Medicine (DICOM)
A Practical Introduction and Survical Guide
Autor: Oleg S. Pianykh
Berlin; Springer, ©2008.
Pag. 5-42, 46-47, 63-98, 222-244, 275-292.
194 REFERÊNCIAS BIBLIOGRÁFICAS
6. Data Compression
Autor: David Salomon
London; Springer, ©2007.
Pag. 17-41, 263-417, 532-639.
7. Digital Image Processing for Medical Applications
Autor: Geoff Dougherty
Cambridge, ©2009.
Pag. 03-44, 115-119, 231-242, 309-335.
8. Fundamentals of Wavelets
Theory, Algorithms, and Applications
Autor: Jaideva C. Goswami , Andrew K. chan
New Jersey; Wiley, ©2011.
Pag. 71-77, 94-112, 114-145, 147-207,
9. Handbook of Medical Imaging
Volume 3. Display and PACS
Autor: Yongmin Kim and Steven C. Horii
Washington; SPIE, ©2000.
Pag. 221-270, 335-400, 467-494.
10. Introduction to Biomedical Imaging
Autor: Andrew Webb
New Jersey; Wiley, ©2003.
Pag. 34- 50, 157-213, 220-236.
11. Insight into Images
Principles and Practice for Segmentation,
Registration, and Image Analysis
Autor: Terry S. Yoo
Canada; Wellesey, ©2004.
Pag. 3-44, 119 – 128, 237 – 295, 307 – 337, 351 – 375.
REFERÊNCIAS BIBLIOGRÁFICAS 195
12. Image Processing, Analysis, and Machine Vision
Autor: Milan Sonka, Vaclav Hlavac and Roger Boyle
Thomson, ©2008.
Pag. 11-30, 65-79, 694-714.
13. JPEG2000 Standard for Image Compression
Concepts, Algorithms and VLSI Architectures
Autor: Tinku Acharya, Ping-Sing Tsai
New Jersey; Wiley, ©2005.
Pag. 1-103, 137-201.
14. Medical Imaging Systems Technology
Autor: Cornelius T. Leondes
© 2005.
Pag. 161-296.
15. PACS and Imaging Informatics
Basic Principles and Applications
Autor: H.K.Huang, D.Sc., FRCR (Hon.)
New Jersey; Wiley, ©2004.
Pag.03-150,153-306, 485-566.
16. Still Image and Video Compression with MATLAB®
Autor: K.S. Thyagarajan
New Jersey; Wliley , ©2011.
Pag. 37-59, 99-129, 133-155, 199-233, 259-296.
17. The JPEG200 Suite
Autor(es): Peter Schelkens, Athanassios Skodras, Touradj Ebrahimi
Wiley,© 2009.
Pag. 49-66, 71-100, 280-351.
196 REFERÊNCIAS BIBLIOGRÁFICAS
18. The Image Processing - Handbook
Autor: John C. Russ
©2007.
Pag. 174-191, 397-436, 629-663.
19. Visualization In Medicine
Theory, algorithms, and applications
The Morgan Kaufmann Series in Computer Graphics
Autor: Bernhard Preim, Dirk Bartz
Elsevier Inc., ©2007.
Pag.03-22,25-63, 65-77,83-116.
20. Wavelet Image and Video Compression
Autor: Pankaj N. Topiwala
©1998.
Pag. 43-57, 61-77, 123-146, 157-168, 237-250, 253-267.
21. Wavelets and their Applications
Autor(es): Georges Oppenheim and Jean-Michel Poggi
©ISTE Ltd, 2007.
Pag. 1-27, 37-60, 63-88, 225-233, 235-276, 297-314.
22. DICOM Cookbook
Autor: Philips
©1997
23. Medical Image Analysis
Autor: Atam P. Dhawan
New Yersey; © Wiley 2011
24. Introducción al Mundo Fractal
Autor: Ewaldo Hott y Pablo Gutierrez
© 2004
REFERÊNCIAS BIBLIOGRÁFICAS 197
Teses
1. V.G. Ruiz, ‚Compresión reversible y transmission de im{genes,‛ Ph.D. Tesis,
Universidad de Almería, Departamento de Arquitectura de Computadores e Electrónica,
2000.
2. S. Rout, ‚Orthogonal vs. biortogonal wavelets for image compression,‛ Master’s thesis,
Faculty of the Virginia Polytechnic Institute and State University (Virginia Tech), August
2003.
3. G. Lemaur, ‚On the choise on the wavelet basis function for image processing,‛ Master’s
thesis, Université de Mons-Hainaut, Faculté des Sciences, 2003.
4. K. A. Kotteri, ‚Optimal, multiplierless implementations of the discrete wavelet transform
for image compression applications,‛ Master’s thesis, Virginia Polytechnic Institute and
State University, 2004.
5. E. Chiu, ‚Lossy compression of medical ultrasound images using space-frequency
segmentation,‛ Master’s thesis, Simon Fraser University, 2001.
Páginas Webs
1. www.im.med.up.pt/sinal_imagem/sinal_imagem.html
2. www.pt.scribd.com/prfonseca/d/19193510-Reconstrucao-de-imagens-3D
199
Equipes não
DICOM
Aquisição
imagem
Codificador DICOM
e/ou compressão
Decodificador DICOM e
descompressão
Processamento de imagem
• Aprimoramento de contraste
local.
• Técnicas de interpolação
adaptativa.
• Cinema loop
Servidor DICOM
• Sistema database imagem
Equipes
DICOM
Servidor
web
Espectador DICOM
Ligar (Plug-in)
Navegador web
Cliente A
Espectador DICOM
Ligar (Plug-in)
Navegador web
Cliente B
Espectador DICOM
Ligar (Plug-in)
Navegador web
Cliente C
Apêndices
Apêndice A: Interações em DICOM
A.1 Sequência de interações clientes/servidor baseado na web e no arquivo
DICOM
Fig. A.1 – Estrutura básica e sequencia de interações entre cliente e servidor
baseado na web e no arquivo do padrão DICOM, para compressão de imagem
médica e sistema visualizador DICOM em aplicações de teleradiologia [133].
5 3 4
Extração do
dado texto
2
Fig. A.2 - Passos de transformação de dados para o formato DICOM [133].
Dado
texto
Elemento Dado
Dado
bruto
Dado adicional (se
for necessário)
Dado
texto
Arquivo
DICOM Elemento
Dado
Integração
do elemento
dado
Codificador
Análise do
dado de
entrada
1
Extração do
dado texto
2
3 4 5
200 APÊNDICE A: INTERAÇÕES EM DICOM
A.2 Codificação de imagens DICOM
As imagens DICOM primeiro são decompostas usando-se um filtro wavelet. Os
coeficientes wavelets são codificados usando-se ROI e SPIHT. O algoritmo inicia na sub-banda
‚coarsest‛ da sub-banda piramidal. SPIHT captura a informação do plano de bits de todos os
coeficientes da DWT que são organizados em três subconjuntos:
1) Lista de pixels significativos LSP (List of Significant Pixels);
2)Lista de pixels insignificantes LIP (List of Insignificant Pixels);
3)Lista de série de pixels insignificantes LIS (List of Insignificant Sets of Pixels).
LSP constitui as coordenadas de todos os coeficientes que são significantes. LIS contem as
raízes do conjunto insignificante de coeficientes. Finalmente, LIP contem uma lista de todos
os coeficientes que não pertencem a LIS ou LSP e são insignificantes. Durante a codificação
esses subconjuntos são examinados e etiquetados como significativos se alguns dos
coeficientes têm uma magnitude maior que o limiar (threshold) dado. O codificador de mapa
significante é seguido por um passo de refinamento, no qual a representação dos coeficientes
significantes é refinada. O algoritmo SPIHT envia a representação binária do valor inteiro dos
coeficientes da wavelet.
Fig. A.3 – (a) Diagrama de compressão da imagem DICOM.
(b) Diagrama de reconstrução da imagem DICOM.
Imagem
DICOM
comprimida
Dado
imagem
Fluxo de bits
(Bit Stream)
Transformada
wavelet discreta
Codificação
ROI
Codificador
SPIHT
Criar vsROI, vsBG
Modificação do
TSUID Cabeçalho
DICOM
(a)
Imagem
DICOM
comprimida
Fluxo de bits
(Bit Stream)
Cabeçalho
DICOM
Decodificador
SPIHT
Decodificador
ROI
Transformada
wavelet discreta
inversa
Dado
imagem
(b)
CODIFICADOR
DECODIFICADOR
APÊNDICE A: INTERAÇÕES EM DICOM 201
Codificador para um arquivo imagem DICOM :
DJEncoderRegistration : : registerCodecs ( ) ; // registrar JPEG codecs
DcmFileFormat fileformat;
If (fileformat.loadFile (‚test.dcm‛) . good ( ))
{
DcmDataset * dataset = fileformat.getDataset ( );
DcmItem *metaInfo = fileformat.getMetaInfo ( ) ;
DJ RPLossless params; // parametros codecs,
// Isso faz com que a versão JPEG para um conjunto de dados a ser criado seja sem perda
>chooseRepresentation (EXS_JPEGProcess14SV1TransferSyntax, ¶ms);
// verifica sim tudo correu bem
If (dataset-
>canWriteXfer (EXS-JPEGProcess14SV1TransferSyntax))
{
// forçar os UIDs do cabeçalho para voltar a ser gerado quando se armazena o arquivo
// uma vez que os UIDs do conjunto de dados pode ter mudado
delete metaInfo -> remove (DCM_MediaStorageSOPClassUID);
delete metaInfo -> remove (DCM_MediaStorageSOPInstanceUID);
// armazenar no formato JPEG sem perda
Fileformat. saveFile (‚test-jpeg.dcm‛),
EXS_JPEGProcess14V1TransferSyntax);
}
}
DJEncoderRegistration : : cleanup( ) ;
Decodificador para um arquivo imagem DICOM :
DJDecoderRegistetration : : registerCodecs ( ) ; // registrar o codecs JPEG
DcmFileFormat fileformat;
If (fileformat . loadFile (‚test_jpeg.dcm‛) . good())
{
202 APÊNDICE A: INTERAÇÕES EM DICOM
DcmDataset * dataset = fileformat.getDataset ();
// descompactar o conjunto de dados comprimido
Dataset ->chooseRepresentation (EXS_LittleEndianExplicit, NULL);
// verifica sim todo correu bem
If (dataset ->canWriteXfer (EXS_LittleEndianExplicit))
{
Fileformat.saveFile (‚test_decompressed.dcm‛,
EXS_LittleEndianExplicit);
}
}
DJDecoderRegistration : : cleanup ();
203
Apêndice B: Geração da máscara
B.1 Geração da máscara ROI
Quando uma imagem é codificada com a ROI, é necessário identificar os coeficientes
wavelets necessários para a reconstrução da ROI. Assim, a máscara ROI é introduzida para
indicar qual coeficiente wavelet deve ser transmitido para que o receptor possa reconstruir a
ROI [114].
ROI
Fig. B.2 – Geração da máscara ROI para uma ROI.
Resultado
... 11011... Geração da
máscara
Codificação
ROI
Algoritmo de
compressão
Máscara de
tamanho LL
Máscara de
tamanho LL
Parâmetros da
ROI
Parâmetros de
escalonamento
Fig. B.1 – Diagrama de geração da máscara ROI.
204 APÊNDICE B: GERAÇÃO DA MÁSCARA
A geração da máscara ROI é feita por filas e colunas em cada nível de decomposição.
O processo se repete até que a árvore da wavelet inteira seja processada, como se mostra na
Fig. B.2. Os coeficientes wavelets que são requeridos para reconstruir um pixel são
selecionados dependentes da longitude wavelet.
Por exemplo, seja a amostra denotada como X(n) e as amostras de sub-bandas de
baixas e altas frequências denotadas por L(n) e H(n), respectivamente. Para um filtro wavelet
9/7, os coeficientes necessários para reconstruir X(2n) são L(n-1), L(n), L(n+1), H(n-2), H(n-1),
H(n), e H(n+1). Para reconstruir X(2n+1), necessita-se de L(n-1), L(n), L(n+1), L(n+2), H(n-2),
H(n-1), H(n), H(n+1), e H(n+2) [115][116], como se mostra na Fig. B.3.
B.2 Geração da máscara pai (PROI) da ROI
O algoritmo de codificação ROI examina se cada nó é necessário para que o
decodificador reconstrua a ROI. Ele testa se é um coeficiente ROI, antes de testar se é
significante (node test). Se o nó não é um coeficiente ROI, seu teste de nó é pulado e realiza-se
o próximo. Logo, o codificador examina se o descendente de cada nó é significante
(descendant test). Não obstante, a informação acerca dos descendentes se é ou não significante
não é necessária para que o decodificador reconstrua a ROI. Sabe-se que, um descendente de
um nó sem a árvore de orientação espacial não é um coeficiente ROI. Não obstante, uma nova
máscara de PROI é necessária. Essa indica os nós, cujos descendentes são coeficientes ROI. A
Fig. B.3 – Transformada wavelet inversa 9/7. Os coeficientes necessários para
reconstruir X(2n) e X(2n+1) são L(n-1) a L(n+2) e H(n-2) a H(n+2), respectivamente.
APÊNDICE B: GERAÇÃO DA MÁSCARA 205
máscara PROI é um plano de bits indicando que os nós têm um último e único descendente
necessário para a reconstrução da ROI. A relação entre a máscara ROI e a máscara PROI é
definida como:
PROI (i,j) = ROI(OffS1(i,j)) V ROI (OffS2(i,j)) V ROI(OffS3(i,j)) V ROI(OffS4(i,j)) (B.1)
Onde PROI (i,j) e ROI(i,j) representam o valor binário da máscara PROI e a máscara ROI no
nó (i,j), respectivamente. OffSk(i,j) representa o K-ésimo offspring do nó (i,j), e V denota a
operação lógica binária OR.
(a)
Fig. B.4 – Exemplo da geração da máscara PROI da máscara ROI. (a) Relação de
uma máscara PROI com uma máscara ROI. (b) Exemplos de máscaras ROI e PROI.
206 APÊNDICE B: GERAÇÃO DA MÁSCARA
B.3 Aplicação do modelo de compressão da Fig.A.3 a uma imagem CT.
Fig. B.5 – Modelo de compressão da Fig.A.3 para uma imagem DICOM CT.
Conversão a
DICOM.pgm
1011001010
1011001010
1011001010
CT-Crâneo.pgm
Modificação do
TSUID Cabeçalho
DICOM
Fluxo de bits
(Bit Stream)
CT-Crâneo.dcm CT-Crâneo-ROI.pgm
Codificador da
Fig.A.3
Imagem
comprimida
CT- Crâneo-ROI .jp2
Imagem
DICOM
Transmissão
Receptor
(Receiver)
Cabeçalho
DICOM
Conversão a
DICOM.pgm
(MATLAB)
Decodificador
da Fig.A.3
CT-Crâneo-ROI-rec.dcm CT-Crâneo-ROI-rec.pgm
Fluxo de bits
(Bit Stream)
Saída da imagem
DICOM
APÊNDICE B: GERAÇÃO DA MÁSCARA 207
B.4 Medidas objetivas e qualitativas
A avaliação das imagens reconstruídas foi baseada nas medidas de compressão e
critérios de fidelidade da sec.3.2. Na Fig. B.6 mostra-se a relação entre o PSNR e a taxa de bits
tanto para uma imagem com ROI quanto para uma sem ROI. As imagens são comprimidas e
descomprimidas em 0.08 bpp até 4.0 bpp (128:1, 64:1, 32:1, 16:1, 8:1, 4:1, 2:1 taxas de
compressão) em 1/128, 1/64 e 1/32 níveis de quantização (Fig. B.6).
A superioridade da codificação ROI, em diferentes níveis de quantização ocorre tanto
objetiva quanto qualitativamente. Em um nível de quantização 1/128 tem-se uma razão de
compressão de 16:1. Qualitativamente, a imagem está na escala de nível 4 e objetivamente se
ganha 20,31 dB. Em um nível de quantização 1/64 com a mesma razão de compressão,
qualitativamente a imagem fica na escala 4, e objetivamente se ganha 9,31 dB. Em um nível
de quantização 1/32 com a mesma razão de compressão, qualitativamente a imagem cai para
Fig. B.6 – Medida objetiva para uma imagem DICOM CT com ROI e sem ROI.
208 APÊNDICE B: GERAÇÃO DA MÁSCARA
um nível 4. O resultado mostra objetivamente que, a aplicação da codificação ROI baseada
sobre uma técnica DWT apresenta bons resultados na compressão de imagens DICOM
quanto se compara com uma codificação sem uso da ROI.
B.5 ROI com diferentes níveis de resolução
Quanto existe a possibilidade de se ter uma série arbitrária de coeficientes wavelet, é
possível ter também diferentes ROIs em diferentes níveis de resolução. Isso pode ser usado
para se prover algumas características adicionais. Se, para uma instância, a ROI selecionada é
menor que a imagem, então não haverá nenhuma informação recebida para o fundo nas fases
inicias da transmissão da imagem. Mas, caso se deseje obter alguma informação do fundo
numa fase precoce, é possível incluir todos os coeficientes do nível de resolução mais baixo
na máscara ROI.
Isso significa que, a versão de baixa resolução da imagem pode ser transmitida junto
com toda a informação pertencente à ROI seguida envia-se o restante da informação
pertencente ao fundo. Outra possibilidade é ter um único ROI presente em alguns níveis de
resolução. Isso significa que, a ROI poderia ser transmitida em certo nível de resolução e em
seguida envia-se a informação pertencente à imagem inteira.
Função para se definir a ROI
cvSetImageROI( IplImage* img, CvRect rect )
// ‚img‛ a imagem de origem e ‚rect‛ é a área dentro da imagem origem. Função para
redefinir a região de interesse:
cvResetImageROI( IplImage* img )
------
// Cortar um objeto e armazenar a nova imagem
1. /* Imagem de entrada */
2. IplImage *img1 = cvLoadImage("linfoma.jpg", 1);
APÊNDICE B: GERAÇÃO DA MÁSCARA 209
3. /* Define a região de interesse dentro da imagems */
4. cvSetImageROI(img1, cvRect(10, 15, 150, 250));
5.
6. /* Crear imagem de destino
7. cvGetSize volta a largura e a altura da ROI */
8. IplImage *img2 = cvCreateImage(cvGetSize(img1),
9. img1->depth,
10. img1->nChannels);
11.
12. /* cópia sub-imagem */
13. cvCopy(img1, img2, NULL);
14.
15. /* Redefine a região de interesse */
16. cvResetImageROI(img1);
211
Apêndice C: SPIHT
C.1 SPIHT
A seguinte série de coordenadas é usada para apresentar o método SPIHT:
O (i,j): conjunto de coordenadas de todos os filhos do nó (i,j).
D (i,j): conjunto de coordenadas de todos os descendentes do nó (i,j).
H: conjunto de coordenadas das raízes das arvores (nodos no mas alto nível
piramidal).
L(i,j) = D(i,j) – O(i,j).
Para as várias instâncias, exceto nos níveis da pirâmide maior e menor, tem-se:
O (i,j) = {(2i, 2j), (2i, 2j+1), (2i+1, 2j), (2i+1, 2j+1)} (C.1)
As regras do conjunto partição são as seguintes:
1) A partição inicial é formada com o conjunto ,(i,j)} e D(i,j), para todo (i,j)є H.
2) Se D(i,j) é significante , então ele é dividido em L(i,j) adicional aos quatro conjuntos de
elementos simples com (k,l) є O(i,j).
*
Fig. C.1 – Exemplo de dependência pai-filho na
árvore de orientação espacial.
212 APÊNDICE C: SPIHT
3) Se L(i,j) é significante , então é dividido dentro de quatro conjuntos D(i,j), com (k,l) є
O(i,j).
Algoritmo SPIHT
1) Initialization (Inicializar):
n=floor (log2 (max(i,j),|ci,j|}));
Lista LSP vazio
Lista LIP com coordenadas (i,j) H
LIS igual que a LIP com a exceção de quem não tem descendência, com etiqueta A.
2) Sorting Pass (Passo de classificação)
2.1) Para cada entrada (i,j) na LIP fazer:
2.1.1) Enviar saída Sn(i,j);
2.1.2) Se Sn(i,j)=1 então
Mover (i,j) para a LSP e a saída é o sinal de ci,j;
2.2) Para cada entrada (i,j) na LIS fazer:
2.2.1) Se a entrada é do tipo A, então
Saída Sn(D(i,j));
Se Sn(D(i,j)) = 1 então
* Para cada (k,1) є O(i,j) fazer:
Saída Sn(k,l);
Se Sn(k,l) = 1 então adicionar (k,l) para a LSP e a saída é o sinal ck,l;
Se Sn(k,l) = 0 então adicionar (k,l) para o final da LIP;
* Se L(i,j)≠ então mover (i,j) para o final de LIS, como uma etiqueta tipo B,
e ir ao passo 2.2.2; caso contrário remover a entrada (i,j) da LIS;
2.2.2) Se a entrada é do tipo B, então
Saída Sn(L(i,j));
Se Sn(L(i,j)) = 1 então
* Adicionar cada (k,l)є O(i,j) para o final da LIS com etiqueta tipo A;
* Remove (i,j) da LIS.
APÊNDICE C: SPIHT 213
3) Refinement Pass (Passo de refinamento)
Para cada entrada (i,j) na LSP, | exceção os incluídos no último passo de classificação,
enviar saída ao n-ésimo bit significante de |ci,j|;
4) Threshold update (Passo de atualização)
Decrementar n em 1 e ir ao passo 2). Para n>=0.
215
Apêndice D:
D.1 – Aplicações de diferentes métodos de codificação ROI em imagens médicas
Métodos de
codificação ROI Referência
Categoria da
imagem médica
Aplicado ao tipo
de imagem Comentários
ROI baseada em
escalonamento [114][115]
Imagens ainda
em 2D Nefrostograma
Parte de JPEG2000. A imagem
pode ser a mesma em caso de fluxo
de bits truncado.
MaxShift [114][116] Imagens ainda
em 2D Nefrostograma
Processo de decodificação simples
sem a necessidade de se gerar uma
máscara ROI.
Codificação ROI
lossy-to-lossless
[117][118]
[119][120]
Imagens ainda
em 2D
Imagens de
cromossomos
Sem perda de compressão de
imagem fornecida. A ROI pode ser
pré-determinada.
OB-SPIHT,
OB-SPECK
[122][123]
[124]
Imagens ainda
em 2D Mamografia
O fluxo de bits pode ser truncado.
Provê alta qualidade de compressão
na região mamária.
EZW baseada na
ROI [125][126]
Imagens ainda
em 2D
Mamaografia,
Exames de TC do
joelho
A ROI é progressivamente
decodificada no receptor.
Codificação
híbrida [127]
Imagens
volumétricas Colon TC A ROI pode ser pré-determinada.
ROI-VQ [128][129] Imagens ainda
em 2D
Imagens de
endocopia
Obtém-se bom desempenho
taxa/distorção com boa preservação
da qualidade ROI.
3D-SPIHT
estendido [130]
Imagens
volumétricas MRI da cabeça
Similar ao método de
escalonamento, sendo simples e
eficiente.
3D-SPIHT
estendido [131]
Sequencia de
vídeos médicos
Sequência de
vídeos para
angiografia
Codificação ROI eficiente em
sequência de vídeos médicos.
Tabela D.1 – Visão geral das técnicas de codificação ROI,
apresentando as referências relacionadas.
216 APÊNDICE D
D.2 Comparação das características das técnicas de codificação ROI
Coeficientes
adicionais
para
decodificar o
objeto
Informação
incorporada na
codificação
Codificação
ROI arbitraria
Decodificação
exata do objeto
Resultados
correspondentes:
(PSNR em dB) (bits
por pixeis)
Método de
escalonamento
geral
Requerido Requerido Suportada - 44,91 (0,08 bpp)
MaxShift Requerido - Suportada - 44,90 (0,08 bpp)
Codificação
ROI lossy-
lossless
- Requerido - Possível 44,4 (0,08bpp)
RB-IWT - - Suportada - 35 (0,8 bpp)
OB-SPIHT,
OB-SPECK - - Suportada - 54,2 (0,8 bpp)
EZW baseado
na ROI Requerido - Suportada - N/A
Codificação
híbrida - Requerido - Possível 32,0 (0,52 bpp)
ROI-VQ Requerido - - Possível 31,58 (0,03 bpp)
Estendido 3D-
SPIHT - - - - 38,78 (0,52 bpp)
Tabela D.2 – Comparação das características das técnicas de codificação ROI. A
comparação inclui o número de coeficiente necessário para codificar a ROI e a imagem.
top related