universidade estadual de campinasrepositorio.unicamp.br/jspui/bitstream/reposip/260054/1/... ·...

APLICAÇÃO DA CODIFICAÇÃO ROI E WT PARA

COMPRESSÃO DE IMAGENS DICOM-CT

Tese de Mestrado apresentada à Faculdade de Engenharia

Elétrica e de Computação como parte dos requisitos para a

obtenção do título de Mestre em Engenharia Elétrica.

Área de concentração: Telecomunicações e Telemática.

Banca Examinadora

Prof. Dr. Yuzo Iano Decom/Feec/Unicamp

Prof. Dr. David Bianchini Feec/PUCC

Prof. Dr. Leonardo Lorenzo Bravo Roger FT/Unicamp

Campinas – SP

Março/2012

Universidade Estadual de Campinas

Faculdade de Engenharia Elétrica e de Computação

Departamento de Comunicações

Orientador: Prof. Dr. Yuzo Iano

Efraina Gladys Cutipa Arapa

ii

FICHA CATALOGRÁFICA ELABORADA PELA

BIBLIOTECA DA ÁREA DE ENGENHARIA E ARQUITETURA - BAE -

UNICAMP

C972a

Cutipa Arapa, Efraina Gladys

Aplicação da codificação ROI e WT para compressão

de imagens DICOM-CT / Efraina Gladys Cutipa Arapa. -

-Campinas, SP: [s.n.], 2012.

Orientador: Yuzo Iano.

Dissertação de Mestrado - Universidade Estadual de

Campinas, Faculdade de Engenharia Elétrica e de

Computação.

1. Processamento de imagens. 2. Compressão de

imagens . 3. Wavelet (Matemática). 4. Tomografia

computadorizada. I. Iano, Yuzo. II. Universidade

Estadual de Campinas. Faculdade de Engenharia Elétrica

e de Computação. III. Título.

Título em Inglês: Aplication of the ROI coding and WT for compression

DICOM-CT images

Palavras-chave em Inglês: Image processing , Image compression, Wavelet

mathematical, Computed tomography

Área de concentração: Telecomunicações e Telemática

Titulação: Mestre em Engenharia Elétrica

Banca examinadora: David Bianchini, Leonardo Lorenzo Bravo Roger

Data da defesa: 30-03-2012

Programa de Pós Graduação: Engenharia Elétrica

v

Resumo

O armazenamento e a transmissão de grande quantidade de imagens médicas

constituem um campo ativo de pesquisa. Dispositivos de imagem geram muitos dados por

paciente. Além disso, deve-se prover armazenamento de longo prazo bem como uma

transmissão eficiente. Esquemas de compressão atuais produzem taxas de compressão

elevadas e com perda de qualidade. Uma abordagem de processamento que permita uma alta

taxa de compressão e codificação de regiões de interesse ROI (Region Of Interest) com boa

qualidade é assim desejável. Neste trabalho um método de codificação ROI e WT (Wavelet

Transform) para compressão de imagem digital no formato padrão DICOM (Digital Imaging

and Communications in Medicine) é apresentado. Essas aplicações permitem extrair

informações relevantes para o armazenamento de uma imagem com um menor custo

computacional e com um erro muito pequeno quando se compara a imagem original com

aquela processada.

Palavras chave: compressão de imagens, padrão DICOM, região de interesse, transformada wavelet,

tomografia computadorizada.

vii

Abstract

The storage and transmission of large amounts of medical images is an active field research. In

general, imaging devices generates large amounts of data per patient. Besides, we need to provide long-

term storage and an efficient transmission. Current compression schemes produce high compression

rates if some loss of quality is affordable. However in medicine field we cannot afford any losses in

diagnostically important regions. An approach that brings a high compression rate with a good quality

is thus necessary. In this work a method of ROI coding e WT (Wavelet Transform) for compression of

compression of digital imaging is presented. These applications allow extract relevant information from

an image archiving with a lower computational cost and with a very small error when comparing the

original and processed images.

Keywords: image compression, DICOM standard, region of interest, wavelet transform, computed

tomography.

ix

A presente dissertação a dedico de coração a meus

queridos pais; Luis C. Luque e Rosa A. de Cutipa.

Aos meus irmãos; José Luis, G. Roger e E. Percy.

xi

Agradecimentos

O resultado da presente tese é o fruto de muito tempo de trabalho e pesquisa, o qual foi

possível graças à colaboração de muitas pessoas, às quais eu expresso minha mais sincera gratidão.

Ao DEUS por me ter ajudado e dado força para seguir adiante apesar de meus tropeços.

Aos meus queridos pais Luis e Rosa, que desde pequena me inculcaram sólidos princípios e valores

morais; a meus apreciados irmãos José Luis, G.Roger e E.Percy que apesar da distancia e de estarem

em lugares diferentes sempre me deram um apoio moral, respaldo e motivação.

Ao meu orientador, o Dr. Yuzo Iano pelos sábios conselhos, acompanhamento e compreensão no

desenvolvimento do trabalho.

A cada um de meus professores de mestrado, pessoas dignas de respeito e admiração.

Aos meus colegas de laboratório LCV, em especial ao Roger Larico.

Meus agradecimentos aos órgãos de fomento à pesquisa: CAPES (Coordenação de Aperfeiçoamento

de Pessoal de Nível Superior) e CNPq (Conselho Nacional de Desenvolvimento Científico e

Tecnológico), tanto pelo apoio financeiro quanto pelo incentivo acadêmico para a realização deste

trabalho.

Finalmente, de coração, minha gratidão a todos os meus amigos que fiz durante o mestrado e durante

minha estadia neste único e formoso país, como é o BRASIL. A cada um de vocês sempre os terei

presente na minha mente e no meu coração. Obrigada por tudo AMIGOS! ... Que vossa luz brilhe

para sempre...

“Ainda que se tenha na natureza árvores com

ramos mais altos que outros, as almas de igual

nobreza têm a mesma origem.”

E. Gladys Cutipa A.

xiii

Agradecimentos

AGRADEÇO AO PROGRAMA CAPES RH-TVD DA COORDENAÇÃO DE

APERFEIÇOAMENTO DE PESSOAL DE NÍVEL SUPERIOR TANTO PELO APOIO

FINANCEIRO QUANTO PELO INCENTIVO ACADÊMICO PARA QUE ESSE TRABALHO

PUDESSE SER REALIZADO.

http://www.google.com.br/url?sa=t&source=web&cd=1&ved=0CCAQFjAA&url=http%3A%2F%2Fwww.capes.gov.br%2F&rct=j&q=Capes&ei=iHKCTaH6J4Kftwea1unYBA&usg=AFQjCNE53tJXdfzL-F2NVAkYmT3LPEomsA&cad=rja

http://www.google.com.br/url?sa=t&source=web&cd=1&ved=0CCAQFjAA&url=http%3A%2F%2Fwww.capes.gov.br%2F&rct=j&q=Capes&ei=iHKCTaH6J4Kftwea1unYBA&usg=AFQjCNE53tJXdfzL-F2NVAkYmT3LPEomsA&cad=rja

xv

Sumário Pag.

Lista de Figuras xix

Lista de Tabelas xxiii

Lista de Abreviaturas xxv

Lista de Símbolos xxix

CAPITULO I : INTRODUÇÃO ............................................................................................................ 33

1.1 Origem e evolução das imagens médicas 35

1.2 Objetivos 37

1.3 Organização da dissertação 38

1.4 Contribuições do trabalho 38

CAPITULO II: PROCESSAMENTO DE IMAGENS .......................................................................... 41

2.1 Imagem digital 42

2.1.1 Representação de imagem digital 44

2.2 Amostragem e quantização de uma imagem 45

2.3 Resolução espacial e profundidade da imagem 46

2.4 Armazenamento de imagem digital 48

2.5 Classes de imagem digital 51

2.5.1 Imagem digital multibanda 51

2.5.2 Imagem colorida 52

2.5.3 Imagem digitais multidimensionais 52

2.5.3.1 Imagens médicas 53

2.5.3.2 Imagens tomográficas 56

CAPITULO III: COMPRESSÃO DE IMAGENS ................................................................................ 63

3.1 Modelos de compressão de imagens 65

xvi SUMÁRIO

3.1.1 O codificador e decodificador de imagem 65

3.1.2 O codificador e decodificador de imagem 66

3.2 Medidas de compressão e critérios de fidelidade 67

3.2.1 Medidas de compressão 67

3.2.2 Critérios de fidelidade 68

3.2.2.1 Critérios objetivos 68

3.2.2.2 Critérios qualitativos 70

3.3 Métodos de compressão de imagens 70

3.3.1 Compressão de imagens sem perdas ou reversível 70

3.3.1.1 Compressão sem perdas por métodos padrões 71

3.3.1.2 Métodos específicos de compressão sem perdas 81

3.3.2 Compressão de imagens com perdas 84

3.3.2.1 Quantificação 86

3.4 Compressão de imagens médicas baseadas em DCT 90

3.5 Compressão fractal 93

CAPITULO IV: TW NA COMPRESSÃO DE IMAGENS .................................................................. 97

4.1 Antecedentes 98

4.2 Wavelet 99

4.3 Transformada wavelet 103

4.4 Aplicação no processamento de imagens biomédicas 105

4.5 Compressão de imagens utilizando WT 106

4.6 Transformada wavelet discreta (DWT) 107

4.7 Transformada rápida wavelet (RWT) 108

4.8 Transformada wavelet em duas dimensões 109

4.9 Propriedades wavelets 112

4.10 Propriedades wavelet no contexto de aplicações biomédicas 115

4.11 Aplicações à tomografia assistida por computador (CAT) 117

4.12 Seleção efetiva das características wavelets 119

4.12.1 Seleção da função wavelets 120

4.12.2 Ordem e longitude dos filtros 120

4.12.3 Número de decomposições 121

4.12.4 Complexidade computacional 121

4.13 Wavelets adequadas para a compressão 122

CAPITULO V: PADRÃO DICOM ..................................................................................................... 125

5.1 Definições 126

SUMÁRIO xvii

5.2 Aspectos relevantes de DICOM 127

5.3 Imagens DICOM 131

5.4 Definições dos objetos de informação 131

5.5 Estrutura do arquivo DICOM 135

5.5.1 Conjunto de dados 135

5.5.2 Imagens 137

5.5.2.1 Modelo de imagem (IOD composto) 137

5.5.2.2 Paciente 138

5.5.2.3 Estudo 138

5.5.2.4 Série 138

5.5.2.5 Imagem 139

5.6 Características das imagens DICOM 139

5.6.1 Codificação das imagens 139

5.7 Classes de serviço 141

5.8 Compressão de dados padrão 142

5.8.1 Compressão no padrão DICOM 142

5.8.1.1 Codificadores DICOM recomendados 142

CAPITULO VI: CODIFICAÇÃO ROI ............................................................................................ 145

6.1 Região de interesse 146

6.2 Codificação ROI 147

6.3 Geração da máscara ROI 149

6.4 Métodos de codificação ROI em imagens médicas fixas 2-D 149

6.4.1 Métodos de dimensionamento geral 149

6.4.2 Método MaxShif 150

6.4.3 Método de MSBShift (Most Significant Bit-plane Shift) 153

6.4.4 Método BbBShift (Bit-plane-by-Bit-plane Shift) 154

6.4.5 Codificação baseada em objetos com transformada wavelet adaptativa 155

6.4.5.1 Particionamento hierárquico em árvores baseado em objetos (OBSPIHT) 156

6.5 Codificação ROI em imagens médicas volumétricas 157

CAPITULO VII: RESULTADOS ....................................................................................................... 161

7.1 Banco de dados 161

7.2 Escolha dos métodos de representação em compressão de imagens 161

7.3 Codificação sub-banda 162

7.4 Decomposição multiresolução 163

7.5 Esquemas de codificação de coeficientes wavelets 163

xviii SUMÁRIO

7.6 Análises da efetividade de compressão 163

7.7 Metodologia de teste, aquisição de dados e resultados 164

CAPITULO VIII: CONCLUSÕES ..................................................................................................... 175

Trabalhos Futuros 177

Referências Bibliográficas 179

A Apêndice A: Interações em DICOM 199

A.1 Sequência de interações clientes/servidor baseada na web e no arquivo DICOM 199

A.2 Codificação de imagens DICOM 200

B Apêndice B: Geração da máscara 203

B.1 Geração da máscara ROI 203

B.2 Geração da máscara pai (PROI) da ROI 204

B.3 Aplicação do modelo de compressão da Fig.A.3 a uma imagem CT 206

B.4 Medidas objetivas e qualitativas 207

B.5 ROI com diferentes níveis de resolução 208

C Apêndice C: SPIHT 211

C.1 Algoritmo SPIHT 211

D Apêndice D: 215

D.1 Aplicações de diferentes métodos de codificação ROI em imagens médicas 215

D.2 Comparação das características das técnicas de codificação ROI 216

xix

Lista de Figuras

Fig.2.1 Diagrama de formação da imagem.

Fig.2.2 a) Imagem digital da mão de um paciente com encondroma; b) Ampliação da área de uma das

articulações; c) Valores de intensidade na região em b); d) Nível de quantificação.

Fig.2.3 Imagem monocromática de Lenna.

Fig.2.4 Ponto indicado sobre o olho da Lenna (à esquerda. Matriz de pixels em uma região de interesse

de 10x10 pixels em torno do ponto indicado (à direita).

Fig.2.5 Imagens da Lenna de 256 níveis de cinza: (a) 256 x 256 pixels, (b) 128 x 128 pixels e (c) 68 x

68 pixels.

Fig.2.6 Imagens da Lenna de 256 x 256 pixels:

a)16 níveis de cinza, b) 8 níveis de cinza, c) 2 níveis de cinza.

Fig.2.7 a) Imagem de dimensão 64x64 pixels; b) Imagem de dimensão 128x128 pixels; c) Imagem de

dimensão 256x256 pixels.

Fig.2.8 Estrutura do processamento de imagem.

Fig.2.9 Gráfico da demanda de uma imagem ao longo do tempo.

Fig.2.10 a) Uma imagem com n bytes por pixel, b) n bandas com um byte por pixel.

Fig.2.11 Modalidades de imagens médicas.

Fig.2.12 Classificação das diferentes modalidades de imagem médica com relação ao tipo de fonte de

energia utilizada para geração de imagens.

Fig.2.13 Diagrama de bloco genérico de um típico sistema de imagem médico eletrônico moderno;

Fig.2.14 a) Corte axial, b) Processo de aquisição da imagem tomográfica.

Fig.2.15 Fase de varredura ou de exploração.

Fig.2.16 Formato da imagem.

Fig.2.17 Representação da imagem através de voxels.

Fig.2.18 Valor numérico da CT.

Fig.2.19 Esquema analítico da reconstrução tomográfica.

Fig.3.1 Modelo de sistema de compressão genérico de imagem.

Fig.3.2 Etapas do codificador da imagem original.

Fig.3.3 Etapas do decodificador do arquivo para imagem.

Fig.3.4 Predição espacial usado por FELICS.

Fig.3.5 Modelo probabilístico usado em FELICS.

Fig.3.6 Compressor - Expansor (Descompressor) JPEG sem perdas.

Fig.3.7 Contexto de predição espacial usado por JPEG.

xx LISTA DE FIGURAS

Fig.3.8 Contexto de predição espacial usado por LOCO-I.

Fig.3.9 a) Abdominal original MRI (512x512x16 bits); b) Classificação fuzzy dentro de 3 conjuntos

baseado sobre a intensidade do pixel ; c)Imagem reconstruída após uma compressão reversível

preditiva dos pixels em todos os outros conjuntos TC=7,4.

Fig.3.10 a) Exploração de cima para baixo a partir do ponto P0; b) Exploração de baixo para cima a

partir de P1; c) Exploração de cima para abaixo a partir de P2.

Fig.3.11 Esquema de quantização vetorial.

Fig.3.12 Codificador sequencial básico definido no padrão JPEG.

Fig.3.13 Ordenação dos coeficientes transformados antes da codificação de Huffman.

Fig.3.14 Exemplo do sistema de função iterativa.

Fig.3.15 Primeiras 4 cópias geradas pela fotocopiadora.

Fig.3.16 Exemplos de similaridade das regiões R1 e R2.

Fig.4.1 a) Função escala de Haar; b) Função wavelet de Haar.

Fig.4.2 Função wavelet de Morlet.

Fig.4.3 a) Função escala de Meyer; b) Função wavelet de Meyer.

Fig.4.4 Banco de filtro de análises da FWT.

Fig.4.5 Banco de filtro de sínteses da FWT-1

.

Fig.4.6 Diagrama esquemático da transformada wavelet 2D.

Fig.4.7 a) Imagem original Lena; b) Imagem Lena depois da decomposição.

Fig.4.8 Wavelets como um banco de filtros. Reconstrução do filterbank discreto sem subamostragem.

Fig.4.9 Resposta da frequência multibanda do filterbank discreto associado com a wavelet Battle-

Lemarie spline cúbica.

Fig.4.10 Operadores de tomografia básica. a) A projeção tomográfica Rθf(t) é a coleção de integrais

de raios paralelos através do objeto f na direção especificada por θ e a transformada Radon é o

conjunto de todas as projeções angulares para θє[0,π]; b) O operador de retroprojeção fornece

um mapeamento reverso do domínio Radon que volta ao domínio objeto. Especificamente,

(R*p)(x) representa a média angular de toda projeção P(t,θ) originada pelo ponto x.

Fig.5.1 Esquema (entidade-relação) da definição de DICOM;

Fig.5.2 Esquema das capas de DICOM.

Fig.5.3 Relação IODs e atributos.

Fig.5.4 Modelo de informação DICOM para uma instância composta.

Fig.5.5 Exemplo de um IOD de imagem composto.

Fig.5.6 Estrutura DICOM de um conjunto de dados e de um elemento de dados.

Fig.5.7 Exemplo de mapeamento de uma imagem de CT.

Fig.5.8 Estrutura maior do modelo de informação DICOM.

Fig.6.1 Diagrama de fluxo para compressão de ROI.

Fig.6.2 Imagem onde se seleciona a região ROI e a região de fundo (Background - BG).

Fig.6.3 Diagrama de blocos da codificação ROI.

Fig.6.4 a) Compressão da imagem completa; (b) Método baseado na escala geral ROI; (c) Método

MaxShift.

LISTA DE FIGURAS xxi

Fig.6.5 A transformada wavelet inversa com um filtro wavelet 5/3 reversível. Coeficientes adicionais

que são necessários para reconstrução das amostras da imagem dentro do objeto são marcados

em verde.

Fig.6.6 Fluxograma do processo de codificação ROI MaxShift. 1) O conjunto de coeficientes

wavelets que pertencem a ROI é determinado; 2) O valor de escala (s) e a magnitude do maior

coeficiente de wavelet não na ROI, ou seja, contida no fundo, são calculados; 3) Os

coeficientes de fundo são reduzidos para baixo por s; 4) O valor de s é adicionado ao fluxo de

bits; 5) A codificação de entropia bit-plano é aplicada.

Fig.6.7 Método BbBShift com S1=4 e S2=5 (Os planos são representados pelas barras em cinza).

Fig.6.8 Transformada wavelet adaptativa unidimensional com extensão simétrica.

Fig.7.1 Esquema da metodologia utilizada.

Fig.7.2 Imagens comprimidas usando a wavelet Bior. 6.8.

Fig.7.3 Avaliação comparativa com diferentes wavelets 1.Nr.

Fig.7.4 Avaliação comparativa com diferentes wavelets Bior. 3.Nr.

Fig.7.5 Avaliação comparativa com diferentes wavelets Bior. 4.4, 5.5, 6.8.

Fig.7.6 Avaliação comparativa com diferentes wavelets Bior. 1Nr.

Fig.7.7 Avaliação comparativa com diferentes wavelets Bior 2.Nr.

Fig.7.8 Avaliação comparativa com diferentes wavelets Bior 3.Nr..

Fig.7.9 Avaliação comparativa com diferentes wavelets.

Fig. A.1 Estrutura básica e sequencia de interações entre cliente e servidor baseada na web e no arquivo

do padrão DICOM, para compressão de imagem médica e sistema visualizador DICOM em

aplicações de teleradiologia.

Fig. A.2 Passos de transformação de dados para o formato DICOM.

Fig. A.3 (a) Diagrama de compressão da imagem DICOM. (b) Diagrama de reconstrução da

imagem DICOM.

Fig. B.1 Diagrama de geração da máscara ROI.

Fig. B.2 Geração da máscara ROI para uma ROI.

Fig. B.3 Transformada wavelet inversa 9/7. Os coeficientes necessários para reconstruir X(2n) e

X(2n+1) são L(n-1) a L(n+2) e H(n-2) a H(n+2), respectivamente.

Fig. B.4 Exemplo de geração da máscara PROI da máscara ROI. (a) Relação de uma máscara PROI com

uma máscara ROI. (b) Exemplos de máscaras ROI e PROI.

Fig. B.5 Modelo de compressão da Fig.A.3 para uma imagem DICOM CT.

Fig. B.6 Medida objetiva para uma imagem DICOM CT com e sem ROI.

Fig. C.1 Exemplo de dependência pai-filho na árvore de orientação espacial.

xxiii

Lista de Tabelas

Tabela 2.1 Quadro que indica as propriedades típicas de imagens e arquivos de imagem adquirida na rotina

clínica através de vários métodos e em diferentes órgãos.

Tabela 2.2 Modalidades de imagens médicas.

Tabela 3.1 Escala dos critérios de valores.

Tabela 3.2 Preditores empregados pelo padrão JPEG sem perdas.

Tabela 4.1 Propriedades de algumas wavelets.

Tabela 5.1 Módulos de IOD, em uma imagem de CT.

Tabela 5.2 Alguns atributos do módulo paciente.

Tabela 5.3 Elemento de dados que pertencem ao módulo “pixels da imagem”.

Tabela 5.4 Implementação da sintaxe de transferência do padrão JPEG.

Tabela 7.1 Wavelets utilizadas na compressão de imagens DICOM.

Tabela 7.2 Desempenho dos algoritmos SPIHT e EZW baseado nas medidas de compressão; tamanho da

imagem TAC 512x512 (256 KB) e taxa = 0,5 bpp.

Tabela 7.3 Desempenho dos algoritmos SPIHT e EZW baseado nas medidas de erro; taxa = 0,5 bpp.

Tabela 7.4 Medidas de erro com as wavelets bi ortogonais cujos critérios de fidelidade foram às melhores.

Nível de decomposição l=9, taxas = 0,4, 0,5 e 0,6 bpp.

Tabela 7.5 Resultados com nível de decomposição l = 4, taxa = 0,5 bpp.

Tabela 7.6 Resultados com nível de decomposição l=5, taxa = 0,5 bpp.

Tabela 7.7 Medidas de erro com as wavelets selecionadas com nível de decomposição l=5, taxas 0,4, 0,6,

0,8 e 0,9 bpp.

Tabela 7.8 Medidas de erro com as wavelets selecionadas com nível de decomposição l=6, taxas 0,4, 0,6,

0,8 e 0,9 bpp.

Tabela 7.9 Medidas de erro a varias taxas de bits para um nível de decomposição wavelet l = 4.

Tabela D.1 Visão geral das técnicas de codificação ROI, apresentando as referências relacionadas.

Tabela D.2 Comparação das características das técnicas de codificação ROI. A comparação inclui o número

de coeficiente necessário para codificar a ROI e a imagem.

xxv

Lista de Abreviaturas

ACR American College of Radiology

A/D Analógico/Digital

AC Alternate Current

BbBShift Bit Plane by Bit Plane Shift

BW Biorthogonal Wavelet CT Computed Tomography

CAT Computed Axial Tomography

CR Computed Radiography

CWT Continuous Wavelet Transform

CW Coiflet Wavelets

DF Digital Fluoroscopy

2D-DWT Two Dimensional Discrete Wavelet Transform

DICOM Digital Imaging and Communications in Medicine

DIMSE DICOM Message Service Element

DWT Discrete Wavelet Transform

DW Daubechies Wavelets

DSA Digital Subtraction Angiography

DWT Discrete Wavelet Transform

DC Direct Current

EEG Electroencephalography

EBCOT Embedded Block Coding with Optimal Truncation

FMRI Functional Magnetic Resonance Image

FOV Field Of Vision

FWT Fast Wavelet Transform

FBI Federal Bureau of Information

FFT Fast Fourier Transform

FWT Fast Wavelet Transform

FPB Filtro Passa Baixas

FPA Filtro Passa Altas

FIR Finite Impulse Response

HIS Hospital Information Systems

HW Haar Wavelets

http://pt.wikipedia.org/w/index.php?title=Digital_Fluoroscopy&action=edit&redlink=1

xxvi LISTA DE ABREVIATURAS

IOD Information Object Definition

IE Information Entity

ISO International Standards Organization

IOM Integrated Object Model

ICWT Inverse Continuous Wavelet Transform

IIR Infinite Impulse Response

IDWT Inverse Discrete Wavelet Transform

JPEG Joint Photographic Experts Group

JPEG200 JPEG committee in 2000

LBG Linde Buzo Gray

LJPEG Lossless JPEG

LSP List of Significant Pixels

LIP List of Insignificant Pixels

LIS List of Insignificant Sets of Pixels

MRI Magnetic Resonance Image

MA Multiresolution Analysis

MaxShift Maximum Shift

MSBShift Most Significant Bit-plane Shift

MSE Mean Square Error

MPEG-2 Moving Pictures Experts Group-2

NEMA National Electrical Manufacturers Association

OBSPIHT Object Based SPIHT

PACS Picture Archiving and Communication System

PET Positron Emission Tomography

PDI Processamento Digital de Imagens

PDS Processamento Digital de Sinais

PSNR Peak Signal to Noise Ratio

RIS Radiology Information Systems

RSNA Radiological Society of North America

ROI Region Of Interest

RC Radiografia Computadorizada

ROC Receiver Operating Characteristic

RV Representation Value

SISO Soft-Input Soft-Ouput

SOP Service Object Pair

SCP Service Class Provider

SCU Service Class User;

SPECT Single Photon Emission Computed Tomography

SPIHT Set Partitioning In Hierarchical Trees

SB-ROI Scaling Based ROI

SNR Signal to Noise Ratio

SC Service Class SADWT Shape Adaptive Discrete Wavelet Transform

LISTA DE ABREVIATURAS xxvii

TCP/IP Transmission Control Protocol / Internet Protocol

TIFF Tagged Image File Format

TWC Transformada Wavelet Contínua

TWCI Transformada Wavelet Contínua Inversa

TWD Transformada Wavelet Discreta

TWDI Transformada Wavelet Discreta Inversa

TWD-2D Transformada Wavelet Discreta Bi-Dimensional

TC Tomografia Computadorizada

TSUID Transfer Syntax Unique Identification

UID Unique Identifier

US UltraSound

VLSI Very Large Scale Integration

VM Value Multiplicity

WT Wavelet Transform

WADO Web Access to DICOM Persistent Objects

xxix

Lista de Símbolos

x, y Coordenadas espaciais da função bidimensional f(x,y)

M,N Linhas e colunas de uma matriz MxN

n Número máximo de níveis e faixa

d(x) Resolução horizontal

d(y) Resolução vertical

log2 Logaritmo de um número na base 2

Vj Espaço de escala 2j

φ(t) Função escala

ψ(t) Função wavelet

L2 (ℜ) Espaço das funções mensuráveis de Lebesgue de quadrado integrável

𝑡 Transformada de Fourier de ψ

⟨ ⟩ Produto interno de f e g

hn Coeficientes dos filtros gerados pela função φ

gn Coeficientes dos filtros gerados pela função ψ

Ck Classe das funções com derivadas contínuas até a ordem k

(Wψx) Transformada wavelet contínua de uma função x com relação a ψ

a Parâmetro de escala da função wavelet

b Parâmetro de translação da função wavelet

ℜ Conjunto dos números reais

Z Conjunto dos números inteiros

Wj Complemento ortogonal de Vj

⊕ Soma direta de conjuntos

αj Seqüência de cortes do filtro passa-baixa

H(t) Filtro passa-baixas

G(t) Filtro passa-altas

Cj Coeficientes de aproximação do nível j da TWD

dj Coeficientes de detalhe do nível j da TWD

* Operação de convolução

xxx LISTA DE SÍMBOLOS

(↑2) Operador de dizimação de ordem 2

(↓2) Operador de inserção de ordem 2

λ Limiar usado para a filtragem de sinais

σ Estimativa de ruído

xxxi

Publicações

1. CUTIPA, E. G.; IANO, Y.; ARTHUR, R.; Métodos de codificação ROI para

compressão de imagens DICOM. Revista Ensaios e Ciência. Dez.2011. (Aceito).

2. CUTIPA, E. G.; IANO, Y.; Uma proposta de uso da codificação ROI no padrão

DICOM (Digital Imaging and Communications in Medicine) . Revista C. Exatas e

Tecnologia. (Submetido).

3. CUTIPA, E.G.; IANO, Y.; THIBAULT, J.; DICOM Image Compression with ROI Coding

and Wavelet Transform. The Canadian-based Cyber Journals (Area in Health Informatics

(JSHI)). (Submetido).

Outras publicações pessoais:

1. E. Gladys Cutipa A.; Diseño de modelo óptimo para regulación de transito urbano

por simulación. Tesis publicada por la UNSAAC (Universidad Nacional de San

Antonio Abad Del Cusco). Mar. 2005.

2. E. Gladys Cutipa A.; Tres paradigmas un sólo fin: La calidad del software. Revista

del Colegio de Ingenieros del Perú, Departamental CUSCO. Ene. 2006.

3. E. Gladys Cutipa A.; El enemigo interno de los PC´s, ineludible o simplemente

eludible. Revista del Colegio de Ingenieros del Perú, Departamental CUSCO.

Agos.2007.

4. E. Gladys Cutipa A.; El mundo de base de datos Fuzzy. Revista del Colégio de

Ingenieros del Peru, Departamental CUSCO. Ene.2008.

33

Capítulo 1

Introdução

avanço vertiginoso da tecnologia digital nos últimos anos, tem provocado um

desenvolvimento explosivo nas telecomunicações. Concomitantemente, criou-se uma série de

novos serviços o que permitiu a melhoria dos já existentes. Na literatura de processamento de

sinais, uma função é chamada de sinal [1]. Os sinais, em geral, são fontes de informações. Em

particular, as imagens representadas na forma digital, são tipos de sinais cada vez mais

presentes em nosso cotidiano. Esse fato tem despertado a necessidade de processamentos

indispensáveis, tanto em imagens mais simples (entretenimento) quanto em aplicações mais

importantes (imagens biomédicas) [2].

O termo ‚sinal‛ est{ associado a um fenômeno, que pode ocorrer no tempo contínuo.

Por exemplo, no caso da fala digitalizada, o tempo é uma variável discreta [3]. É possível, por

meio de processamento de imagens que algumas informações sejam disponibilizadas para

uma determinada aplicação. Pode-se citar, por exemplo, a medicina que exige diagnósticos

precisos. Nesse caso, faz-se uso de análise de bordas e análises estatísticas com qualidade, das

informações disponíveis [4].

Os diversos tipos de sinais gerados e a variedade de métodos de obtenção dos

mesmos, muitas vezes acarretam perda da qualidade. A maioria dos sinais é afetada por

algum tipo de ruído. Por exemplo, ao adquirir uma imagem, o meio em que ela se encontra

ou o dispositivo que a captura, podem influenciar na qualidade da imagem obtida. Assim,

O

N

34 Capítulo I - INTRODUÇÃO

uma imagem de baixa qualidade pode ser gerada, com aspectos que comprometem uma boa

análise por parte do observador. Um processamento de sinais visa, de modo geral, melhorar

a qualidade de um sinal para possíveis análises. Uma das aplicações de processamento de

sinais é a compressão, com o objetivo de um armazenamento eficiente, com baixo custo

computacional. Por outro lado, o avanço da tecnologia da informação (IT) tem facilitado o

desenvolvimento de análise de imagens médicas digitais. Esse desenvolvimento

principalmente ocorre na CT (Computadorized Tomography), imagem de MRI (Magnetic

Resonance Imaging) e em diferentes processos digitais para geração de imagens radiológicas

vasculares, cardiovasculares e contrastes. Todos esses processos produzem quantidades cada

vez maiores de imagens.

Esses processos criam um problema na transmissão das imagens dentro dos

centros de saúde ou de um estabelecimento para outro, relativo à questão de armazenamento

e arquivamento. Sabe-se que, as técnicas de compressão são úteis para grandes quantidades

de dados em questão. Assim, colocar imagens em sites, torna-se prático porque se usam

algoritmos de compressão de dados. A compressão de dados, que por muito tempo foi

o domínio de um grupo relativamente pequeno de engenheiros e cientistas, é agora

onipresente.

As instituições médicas não estão à margem desse avanço e estão cada vez mais

próximas da tecnologia de informática e de redes de comunicação de dados. Como

consequência disso, introduziu-se o sistema PACS (Picture Archiving and Communication

Systems). Esse sistema abriu a possibilidade de armazenamento e transmissão de imagens

médicas geradas por equipamentos pertinentes. Dessa forma, consegue-se um acesso rápido e

eficaz das informações desejadas [5]. Uma vez que os sistemas PACS são compostos de

equipamentos de diferentes fabricantes, torna-se necessário um padrão para transferência

dessas informações. O padrão adotado mundialmente é conhecido como DICOM (Digital

Imaging and Communications in Medicine). Assim, o DICOM procura suprir as necessidades de

integração dos equipamentos médicos.

Capítulo I - INTRODUÇÃO 35

1.1 Origem e evolução das imagens médicas

Antes do desenvolvimento das imagens médicas, os médicos diagnosticavam e

tratavam sem ver o ‚interior‛ do paciente, exceto através de uma cirurgia exploratória.

No século XVIII, a medicina surge como ciência, fisiologia e fisiopatologia baseadas na

exploração física e em algumas provas analíticas rudimentares.

Raios-X

• 1895: W.Rontgen descobre os raios-X e recebe um prêmio Nobel em Física em 1901.

• 1896: primeira aplicação clínica por John Cox (Montreal).

• A radiografia convencional, inicialmente utilizava alta dosagem e período de exposição

10 min. (placa do crânio). Hoje, o tempo de exposição é de milissegundos e a dose é 50

vezes menor.

• 1970: a radiologia digital substitui a placa fotográfica pelo detector eletrônico de alta

resolução. Isso significa menos radiação para o paciente. Fácil armazenamento e

gerenciamento.

Tomografia Computadorizada (TC ou CT)

• 1917: J. Radón implanta a teoria da reconstrução tomográfica, que é aperfeiçoada mais

tarde por A. Cormack em 1963.

• 1973: o engenheiro britânico G. Hounsfield constrói a primeira equipe de CT

(Computadorized Tomography).

• 1975: inicia-se o uso clínico.

• 1979: concede-se um prêmio Nobel de Medicina e Fisiologia a Hounsfield e Cormack.

• Avanço atual: CT helicoidal, maior velocidade de aquisição e menos dose. Endoscopia e

angiografia não invasiva.


Ecografia (imagem ultrasônica)

• 1912: após o naufrágio do Titanic, L.F. Richardson faz uso de ecos ultrassônicos para

detectar objetos submergidos.

• 1942: Karl Dussik tenta detectar tumores cerebrais registrando o passo do feixe de som

através do crânio. Tenta identificar os ventrículos através da medição da atenuação do

ultrassom através do crânio, que ele chama de ‚Hiperfonografía do cérebro‛.

• 1949: publicou-se uma técnica de eco pulsado para detectar cálculos e corpos estranhos

intracorpóreos.

• 1957: o Dr. Donald inicia estudos obstétricos a partir dos ecos provenientes do crânio

fetal. Desenvolveram-se os calipers (cursores eletrônicos).

• 1977: Kratochwil combina a ultrassonografia e a laparoscopia. A técnica é estendida para

examinar fígado, vesícula biliar e pâncreas.

• 1983: Aloka introduz na indústria o primeiro equipamento de doppler a cor que permitiu

visualizar em tempo real, o fluxo de sangue. Desde então, o progresso de ultrassom tem

sido lento.

• 1994: o Dr. Gonzalo E. Diaz introduz o pós-processamento em cor para diagnóstico por

imagem que pode ser estendido a qualquer imagem.

Imagem Nuclear

• 1930: inicia-se a aplicação clínica da imagem nuclear no tratamento oncológico.

• 1950: David E. Kuhl e Edwards Roy apresentam o conceito de SPECT (Single Photon

Emission Computed Tomography).

• 1990: surge um novo tomógrafo chamado PET (Positron Emission Tomography), que opera

com base na emissão de pósitrons. Facilita criar imagens com maior precisão e obtém

melhor visualização do metabolismo do oxigênio, glicose, proteínas e ácidos graxos.

• 1998: Bruce Hasegawa (da universidade de Califórnia) chega a combinar imagens com

SPECT e CT.


Imagem de MRI (Magnetic Resonance Imaging)

• Origens em 1929: Isidor Isaac Rabi (prêmio Nobel de física 1944). Feixe de moléculas

sofre a influência de campos magnéticos, inversão da magnetização ou ressonância.

• 1946: Felix Block e Edward Purcell desenvolvem técnicas de ressonância magnética em

sólidos e líquidos. Prêmio Nobel em 1952.

• 1973: Lauterbur Paul produz uma imagem anatômica mediante gradiente espacial.

Prêmio Nobel em 2003.

• 1989: Peter Mnasfield introduz a técnica EPI, de aquisição rápida. Excelente contraste em

tecidos moles e boa resolução espacial.

Padrão DICOM

• 1983: trabalho inicial.

• 1985: o primeiro padrão ‚ACR-NEMA 1.0‛ foi lançado.

• 1990: somente dois fabricantes mostram conectividade em equipamentos comerciais.

• 1993: ISO (International Standard Organization) aprova o padrão DICOM.

• 1994: DICOM é um padrão ‚vivo‛ com novas peças e suplementos publicados

continuamente.

• Hoje: todas as empresas projetam seus equipamentos para atender o padrão DICOM.

DICOM tem sido um sucesso do ponto de vista comercial e do usuário.

1.2 Objetivos

• A incorporação de uma codificação ROI dentro das técnicas de compressão de

imagens DICOM para armazenar e compartilhar informação médica via redes de

comunicação, os PACS.


• Aplicação da WT (Wavelet Transform) na compressão de imagens DICOM que,

mediante a an{lise multiresolução faz que a WT seja uma ferramenta eficiente no

processamento de imagens.

1.3 Organização da dissertação

O presente trabalho é desenvolvido por etapas. Na primeira fase se faz uma breve

introdução. Na segunda fase, realiza-se um estudo do estado de arte de processamento de

imagens. Seguem-se informações para compressão de imagens.

Na quarta fase, se aborda o tema da transformada wavelet para compressão de imagens, base

fundamental do presente trabalho.

Na quinta fase, apresenta-se o padrão DICOM e seus aspectos relevantes.

Na sexta fase, se aborda a codificação ROI e sua aplicação em imagens médicas 2D e

volumétricas. Finalmente, se aborda a proposta, resultados e conclusões.

1.4 Contribuições do trabalho

• A incorporação da codificação ROI dentro das técnicas de compressão de imagens

DICOM.

• A aplicação da WT facilita a compressão de imagens DICOM por dar diferentes tipos

de suporte de flexibilidade, codificação de regiões de interesse, qualidade e

escalabilidade de resolução.

Comentários

• A compressão geralmente baseia-se na eliminação de redund}ncias do sinal através

do uso de alguma transformada, geralmente transformadas integrais. No presente

trabalho, se fiz uso da transformada wavelet, por se tratar de uma ferramenta muito

vers{til e de conteúdo matem{tico muito rico. Quando um sinal é analisado com a


transformada wavelet, torna-se possível saber exatamente quando começa e quando

termina um determinado evento. Esse é o principal objetivo da transformada wavelet.

• Como se sabe, o sistema de armazenamento tem como objetivo a otimização do

espaço computacional, tanto para armazenamento quanto para transmissão de

imagens. Essa é a razão pela qual o trabalho baseou-se no padrão DICOM, formato

que faz uso dos PACS para compartilhar uma informação médica através de redes de

comunicação.

• Por outro lado, no presente trabalho se fiz um estudo e an{lise das principais técnicas

de compressão de imagens médicas.

• O trabalho baseou-se no padrão DICOM porque o formato fornece soluções globais

dentro e fora do hospital. Este, facilita a integração nos sistemas de informação como:

os HIS (Hospital Information Systems), RIS (Radiology Information Systems).

41

Capítulo 2

Processamento de imagens

PDI (Processamento Digital de Imagens) é uma sub{rea do PDS (Processamento Digital

de Sinais). O PDS incorpora a execução de operações matem{ticas, com objetivo de extrair

informações que geralmente representam um fenômeno a ser estudado de forma específica.

No processamento de uma imagem são realizados muitos c{lculos de forma r{pida e segura

para que o observador ou o computador possam analisar ou possam realçar de forma precisa

essas informações.

A primeira aplicação da {rea de processamento de imagens foi na década de 20, na

tentativa de aprimorar imagens digitalizadas de um jornal para transmissão, entre Londres e

Nova Iorque. O tempo necess{rio para essa transmissão era de uma semana. O sistema

Bartlane de transmissão de imagens por cabo submarino conseguiu reduzir a transmissão

para três horas *6+. Avanços expressivos na {rea ocorrem apenas com o advento dos

computadores digitais três décadas mais tarde. Acontece uma evolução da tecnologia

computacional, com informações de multimídia e sinais bidimensionais, cada vez mais

presentes em nosso cotidiano.

O processamento de imagens surge com o objetivo de suprir as necessidades de

an{lise e compactação de informações, tornando-se assim uma ferramenta essencial no

mundo moderno, cuja demanda de processamento é relativamente crescente *7+.

Um dos principais interesses na {rea de processamento digital de imagens é a

necessidade de melhorar a qualidade da informação visual para a an{lise humana. Surgem

O

N

42 Capítulo II- PROCESSAMENTO DE IMAGENS

assim, v{rias técnicas e aperfeiçoamentos para um ganho de velocidade, precisão,

simplicidade e poder de processamento com um baixo custo computacional. São técnicas hoje

aplicadas em v{rias {reas do conhecimento humano. Tem-se, por exemplo, as {reas de

medicina, engenharia, matem{tica, entre outras.

No entanto, as imagens médicas são especiais por três razões fundamentais:

• Usam uma cor cinza devido a que a maioria das imagens é gerada por aparelhos de

técnicas monocromáticas;

• Contêm uma proporção maior que o normal, de ruído;

• Muitas vezes contêm grande quantidade de pequenos detalhes. Isso pode ser devido às

texturas nas imagens, ou a uma pequena quantidade de ruído que altera nos valores

digitais.

A qualidade da imagem após uma compressão é muito importante e deve estar dentro

de um limite toler{vel, que varia de imagem para imagem e de método para método. Assim,

a compressão torna-se mais interessante, como uma parte da an{lise qualitativa de diferentes

tipos de técnicas de compressão de imagens.

2.1 Imagem digital

As imagens são vistas como exemplos de sinais gerados em nosso cotidiano que

apresentam papéis importantes. Elas podem ser desde as mais simples, usadas para

entretenimentos, até aquelas destinadas às aplicações médicas mais avançadas [8]. Uma

imagem digital pode ser definida matematicamente como uma função bidimensional do tipo

f(x,y), onde x e y são coordenadas espaciais (no plano), ou seja, é um tipo de sinal gerado no

domínio do espaço, que representa a variação da intensidade de luz e de cor do espaço.

O valor de f em qualquer par de coordenadas (x,y) é a intensidade da imagem nesse

ponto. A imagem denominada digital é uma imagem que pode ser processada de forma

direta, podendo assim ser armazenada no computador. Uma imagem analógica necessita ser

digitalizada por meio de uma discretização no tempo (amostragem) e uma discretização em

Capítulo II – PROCESSAMENTO DE IMAGENS 43

amplitude (quantização). Isso é realizado por um conversor A/D (Analógico/Digital). A

representação de uma imagem digital é dada por uma matriz M×N composta por elementos

denominados pixels. A Fig.2.1 representa o esquema da formação da imagem.

Os pixels são os menores pontos distribuídos em linhas e colunas que uma imagem

pode obter. Cada pixel contém um valor inteiro nas direções das coordenadas x e y que

representa medidas dependentes de variáveis. Como por exemplo, o nível de quantificação

que normalmente é uma potência de 2. Cada pixel pode estar associado a um valor da escala

de cinza entre 0 e 2n - 1. Quanto maior o número de pixels em uma imagem, melhor será sua

resolução, permitindo uma melhor diferenciação entre as estruturas. Na Fig.2.2 [8] tem-se um

modelo da digitalização de uma imagem radiográfica.

Muitas vezes, a digitalização da imagem pode comprometer sua qualidade.

Atualmente, existem várias técnicas de análise de imagens, visto que as imagens carregam em

seu interior determinadas informações e também capacidade para a troca dos mesmos,

possibilitando, dessa forma, a qualidade de resolução. Por outro lado, o termo, nível cinza é

usado para referir à intensidade de imagens monocromáticas. As imagens coloridas são

formadas por uma combinação de imagens individuais 2-D.

(X,Y): nos reais Amostragem

Imagem analógica

f(x,y)

Imagem digital

Pixel f(4,4) =25’345

(0,0) Pixel f(4’24,4’33) =25’345

(0,0)

f : no real Quantificação

Pixel f(4,4)=25

(0,0)

Fig.2.1 - Diagrama de formação da imagem.


H{ dois tipos fundamentais de imagem digital:

Tipo raster: (ou bitmap), é uma coleção de bits que formam a imagem. A imagem consiste

em uma matriz de pontos individuais (ou pixels) em que cada um tem a sua própria cor.

Um bitmap pode ser monocrom{tico, em escala de cinza ou colorido. Normalmente os

pixels são formados no padrão RGB (Red,Green,Blue). Tipicamente, as imagens raster são

imagens fotogr{ficas;

Tipo vetorial: As imagens vetoriais são totalmente descritas por definições matem{ticas.

Os desenhos vetoriais são ficheiros que contêm informação das curvas bezier que formam

o desenho. Imagens desse tipo são desenhos técnicos de engenharia.

2.1.1 Representação de imagem digital

Uma imagem monocromática é uma função de intensidade de luz bidimensional,

onde x e y denotam coordenadas espaciais e o valor de f no ponto (x, y) é proporcional ao

brilho (ou nível de cinza) da imagem nesse ponto (Fig.2.3)[10]. Essa função também pode ser

vista como uma superfície no espaço (x, y, z), onde para cada ponto (x, y) plota-se na

coordenada z o valor de f(x, y).

Fig.2.2 – a) Imagem digital da mão de um paciente com encondroma ; b)Ampliação da área de

uma das articulações; c) Valores de intensidade na região em b); d) Nível de quantificação [8].


2.2 Amostragem e quantização de uma imagem

Para gerar uma imagem digital, f(x, y) deve ser digitalizada ao longo de x e y, e na

amplitude z = f(x, y). Para tanto, é feita uma amostragem (normalmente uniforme) de f(x, y)

nas direções x e y, gerando uma matriz de NxM amostras, seguida de uma quantização do

valor de f(x,y) em L níveis inteiros de cinza .

Nessa matriz, cada elemento p(x, y), x = 0, 1,..., M-1 e y = 0, 1,..., N-1, é chamado pixel

(abreviação de picture elements). Diz-se então que a imagem tem dimensão M pixels na

horizontal (eixo x) e N pixels na vertical (eixo y). O conceito de dimensão de um pixel ao longo

do eixo x, ou do eixo y, está relacionado com o espaçamento físico entre as amostras. Cada

pixel tem associado um valor Lmin ≤ p(x,y) ≤ Lmax onde, L = Lmax –Lmin + 1 e assume-se, sem

perda de generalidade que Lmin = 0.

A Fig.2.4 [10] ilustra a representação matricial da imagem da Fig.2.3 em uma região de

interesse de 10x10 pixels (à direita) em torno de um ponto indicado sobre o olho da Lenna (à

esquerda). Considera-se que o processo de digitalização envolve parâmetros de amostragem

e quantização. Uma pergunta natural é: quantas amostras NxM e níveis de cinza L são

necessários para gerar uma boa imagem digital? Isso depende fundamentalmente da

quantidade de informação contida na imagem e do grau de detalhes. Esses parâmetros nos

levam aos conceitos de resolução espacial e profundidade da imagem.

Fig.2.3 – Imagem monocromática de Lenna [54].


2.3 Resolução espacial e profundidade da imagem

Seja, uma imagem f(x, y) contida em uma região retangular de 30cm em x por 20cm

em y. Caso se obtenha amostras uniformemente espaçadas a cada 1mm em x e em y

(dimensões do pixel são 1mm x 1mm), tem-se N = 200 x M = 300 amostras, ou seja, 60000 pixels.

Diz-se então que a resolução espacial da imagem é 200x300 pixels.

O número L de níveis de quantização da função f(x, y) é normalmente uma potência

de dois (L= 256, 1024, 4096). Nesse exemplo dado, tem-se L=256. Isso significa que cada pixel

pode ter associado a um valor de cinza entre 0 e 255, que requer no máximo 8 bits para ser

armazenado na memória do computador. Diz-se então que a profundidade da imagem é de 8

bits por pixel (ou 1 byte por pixel). Pode-se então observar que se necessita de 200x300x1= 60

kbytes de memória para armazenar essa imagem.

A Fig.2.5 mostra a variação de resolução espacial. Em todos os casos, o número de

níveis de cinza permanece 256. Para manter a mesma área de display da Fig.2.5a, os pixels das

imagens de mais baixa resolução são replicados.

Fig.2.4 – Ponto indicado sobre o olho da Lenna (à esquerda. Matriz de pixels em uma região de interesse de 10x10 pixels em torno do ponto indicado (à direita) [54].


A degradação quadriculada sofrida pelas imagens é devido | perda de resolução

espacial. A Fig.2.6 mostra a variação de profundidade. Em todos os casos a resolução espacial

é a mesma da imagem da Fig.2.5a, 256x256 pixels. As figuras Fig.2.6a, 2.6b e 2.6c mostram

respectivamente uma redução de profundidade de 8 bits por pixel (L=256 níveis de cinza) para

4 bits por pixel (L=16 níveis de cinza), para 3 bits por pixel (L=8 níveis de cinza) e para 2 bits

por pixel (L=2 níveis de cinza ou imagem bin{ria).

Fig.2.6 – Imagens da Lenna de 256 x 256 pixels:

(a) 16 níveis de cinza, (b) 8 níveis de cinza, (c) 2 níveis de cinza [54].

Fig.2.5 – Imagens da Lenna de 256 níveis de cinza:

(a) 256 x 256 pixels, (b) 128 x 128 pixels e (c) 68 x 68 pixels [54].


2.4 Armazenamento de imagem digital

Um aspecto de grande interesse, é o armazenamento da imagem na memória de um

computador. Um exemplo, que apresenta essa necessidade são os milhares de exames de

diagnóstico através de imagens geradas em hospitais, que em alguns casos, podem chegar a

mais de 45 Gbytes por dia [9].

Atualmente, aumentam os processos de transmissão dessas imagens através de

redes informatizadas. Esse fato, cria necessidades de se estabelecer e conhecer formatos

padronizados de processos de transmissão de dados em sistemas de rede local ou mesmo

pela internet, com rapidez e segurança. Dessa forma, isso envolve a compactação de imagens.

Porém, ao passo que melhora a qualidade visual da imagem, o volume de dados a ser

armazenado, processado ou transmitido também aumenta. Isso proporciona o aumento do

número de bits necessário para a codificação binária da imagem. O número de bits necessário

para o armazenamento de uma imagem na memória do computador é dado pela equação

seguinte [10][11] :

bits = MxNxn (2.1)

Onde:

n = log2(M),

M é o número de linhas da imagem e

N é o número de colunas da imagem.

a) b) c)

Fig.2.7 a) Imagem de dimensão 64x64pixels; b) Imagem de dimensão

128x128pixels; c) Imagem de dimensão 256x256pixels [Lv. 04].

c) Imagem de dimensão 128dpi .


Existem dois tipos de compactação, ou seja, com perda e sem perda de informações.

Cada tipo de imagem tem suas exigências quanto ao tipo de compactação. Além disso, os

arquivos de imagens digitais devem possuir um cabeçalho que contem informações do tipo:

número de linhas, número de colunas, número de bits usados na representação da imagem,

resolução horizontal (dx), resolução vertical (dy), número de bandas da imagem, tipo de

compactação usado para guardar os dados, data e hora da aquisição, tipo de sensor que

captou a imagem, dados paramétricos dos sensores, bem como outras informações

relevantes. Não obstante, para o arquivamento de dados de imagens médicas, tais como a CT

(Computadorized Tomography), MRI (Magnetic Resonance Imaging), mamografia digital e outros,

devem-se levar em consideração certos fatores. Estes são: volume dos dados a ser

armazenados; intervalo de tempo em que os dados ficarão disponíveis online; segurança de

dados; confiabilidade de base de dados e custo. A Tabela 2.1 mostra o tamanho médio das

imagens de diferentes modalidades médicas. Esse tamanho está acima de 2MB, podendo

chegar até a 192MB.

Modalidade Órgão Tamanho da

imagem

Nº de bits por

pixel Nº de fatias

Tamanho de

arquivo

Radiografia Tórax 2,060*2,060 16 - 8MB

CT

Cérebro 512*512 16 ≈300 150 MB

Abdômen 512*512 16 ≈500 250 MB

Coração 512*512 16 126*16 frames 1 GB

MRI

Cérebro 512*512 16 ≈20*6 sets 10 a 60 MB

Abdômen 512*512 16 ≈ 30 15 MB

Abdômen 3D 512*512 16 104 50 MB

Coração 256*256 16 20*20 frames 50 MB

SPECT Corpo inteiro 256*1024 16 350 50 MB

PET

Corpo inteiro 128*128 16 350 10 MB

Coração 128*128 16 47*16 frames 24 MB

Cérebro 256*256 16 47 6 MB

US Padrão 512*512 8 50 imagens/vista 12,5 MB/vista

Doppler 512*512 (RGB)3*8 50 imagens/vista 37,5 MB/ vista

Anátomo

patologia Anátomo

patologia

Em torno de

15,000*20,000 (RGB)3*8 - 858 MB

Tabela 2.1 – Quadro que indica as propriedades típicas de imagens e arquivos de imagem adquirida

na rotina clínica através de vários métodos e em diferentes órgãos [Dados do hospital ESALUD].


A Fig.2.8 mostra a estrutura do processamento de imagem desde a captura até a

compressão da imagem. As imagens armazenadas normalmente são comprimidas de forma

que ocupem menos espaço físico nos sistemas de armazenamento. As técnicas de compressão

utilizadas não podem ter nenhum tipo de perda de informação, pois qualquer perda pode ser

prejudicial para se chegar a um diagnóstico preciso.

Por outro lado, os sistemas de armazenamento de imagem devem seguir uma

estrutura hierárquica que depende da probabilidade de demanda da imagem. Em geral, as

imagens recentemente adquiridas são consultadas com frequência nos minutos seguintes da

sua aquisição e sua frequência de consultas diminui rapidamente com o tempo.

A Fig.2.9 mostra um gráfico de demanda de visualização vs. tempo. O

armazenamento de curto prazo (local) tem as seguintes características:

Fig.2.8 – Estrutura do processamento de imagem.

Gestão

Compressão

Arquivamento

Recuperação

Comunicação

Superfície reconstruída

Iluminação

Sombreamento

Display Interpretação Medicação

Extração do caráter

Segmentação

Classificação

Captura

Digitalização

Otimização

Calibração Registro

Transformação Filtragem


Dezenas de GB;

Transferência de cerca de 50 imagens por minuto;

1-15 dias de armazenamento.

2.5 Classes de imagem digital

2.5.1 Imagem digital multibanda

Em uma imagem digital monocromática, o valor do pixel é um escalar entre 0 e L. As

imagens multibanda podem ser vistas como imagens, nas quais cada pixel tem associado um

valor vetorial (vários valores associados ao mesmo pixel).

𝑥 𝑦 𝑛 (2.2)

Onde:

n = número de bandas

Em algumas aplicações pode ser um valor negativo, mas sem perda de generalidade.

Assume-se 0 como o valor mínimo de intensidade. Em geral, pode representar

temperatura, pressão, frequência, amostradas em pontos (x, y) e com intervalos de valor

completamente diferentes. No entanto, se Li, i=1, 2,..., n for igual a 256, por exemplo, teremos

Demanda

VS

Tempo

Tempo

100%

Fig.2.9 – Gráfico da demanda de uma imagem ao longo do tempo.


uma imagem com n bytes por pixel (Fig.2.10a). No caso em que a imagem multibanda é

representada como uma sequência de imagens monocromáticas pi(x,y) = li , 0 ≤ li ≤ Li - 1 , i =

1,2,..., n. (Fig.2.10b), com Li, i =1,2,...,n for igual a 256, tem-se n bandas com profundidade

1byte por pixel (Fig.2.10b).

2.5.2 Imagem colorida

Uma imagem colorida é uma imagem multibanda, onde a cor em cada ponto (x, y) é

definida através de três fatores: lumin}ncia, matiz e saturação.

A luminância: est{ associada com o brilho da luz;

O matiz: est{ associado com o comprimento de onda dominante;

A saturação: est{ associada com o grau de pureza (ou intensidade) do matiz.

A maioria das cores visíveis pelo olho humano pode ser representada como uma combinação

de três cores prim{rias: vermelho (R), verde (G) e azul (B). Assim, uma representação comum

para uma imagem colorida utiliza três bandas R, G, e B com profundidade byte por pixel.

2.5.3 Imagens digitais multidimensionais

As imagens digitais multidimensionais são uma extensão dos conceitos de imagem

digital monocromática e multibanda para uma terceira dimensão que pode ser espaço ou

banda 1

lo. pixel

banda n lo. pixel

n

1

a) b)

Fig.2.10 – (a) Uma imagem com n bytes por pixel,

(b) n bandas com um byte por pixel [54].


tempo. Isso é o mesmo que dizer que a amostragem e a quantização podem ocorrer em x, y, z

ou x, y, t, onde z ou t representam o espaço e o tempo. Portanto, uma imagem digital 3D será

representada como uma sequência de imagens monocromáticas ou multibandas ao longo do

eixo espacial ou do eixo temporal.

2.5.3.1 Imagens médicas

As imagens médicas podem ser definidas como: ‚Todas as imagens usadas para um

diagnóstico e tratamento de pacientes na atividade médica". Nessa classe, se incluem as

imagens tais como raios-X, amostras histológicas, tomografia computadorizada CT,

ultrassom, resson}ncia magnética e até mesmo fotografias de paciente. Essas últimas são

utilizadas para fins de identificação. As modalidades das imagens médicas classificam-se em:

Anatômicas Caracteriza-se por produzir imagens

de boa resolução espacial.

Caracterizam-se por fornecer

informação sobre o funcionamento

dos diferentes sistemas de órgãos. Funcionais

Classificação:

Ecografia (ultrassom)

Ressonância magnética

(Ondas de rádio)

Endoscopia (luz)

MRI

FMRI

Radiologia (Raios X)

Radiologia convencional Radiologia digital Tomografia computadorizada

Medicina nuclear (raios gamma)

PET SPECT

O elemento básico que define os diferentes modos é o tipo de energia utilizada.

Fig.2.11 Modalidades de imagens médicas.


A Tabela 2.2 mostra as siglas e nomes de imagens médicas obtidas por meios

digitais.

Cada modalidade de imagem médica varia em número e resolução de imagens produzidas

para um estudo particular de um paciente. Isso afeta diretamente o volume de dados e as

taxas de transferência necess{rias para a transmissão de imagens. Esses par}metros têm um

efeito enorme sobre o tipo de comunicação necess{rio.

Sem dúvida, o destaque das imagens médicas é que elas usam muito espaço de

armazenamento. Assim, pode-se levar algum tempo para a transmissão quando se envia os

dados através de linhas de comunicação em locais remotos, como no caso de

teleradiologia ou em muitas outras aplicações. Os tipos de dados que podem aparecer nas

imagens médicas são variados. Podem resultar a partir de imagens est{ticas, bidimensionais

(2D) como as mamografias ou tridimensionais (3D), como, imagens em movimento, tais

como ultrassom ou MRI cardíaca.

Tabla 2.2 – Modalidades de imagens médicas.

As características típicas dos dados incluídos em imagens médicas são:

A quantidade extensa de dados: O número de imagens em um conjunto de dados de

imagens médicas pode variar de 2 ou 3 para os convencionais raios-X e até 200 ou 300

CR Radiografia computadorizada.

CT Tomografia computadorizada.

DCM Microscopia a cor digitalizada.

DEM Microscopia eletrônica digitalizada.

DF Fluoroscopia digital.

DAS Angiografia de subtração digital.

EEG Eletroencefalograma.

MRI Imagem de resson}ncia magnética.

FMRI Imagem de resson}ncia magnética funcional.

PET Tomografia de emissão de pósitron.

SPECT Tomografia computadorizada de emissão de fóton simples

US Ultrassom.


para um teste de ultrassom cardíaco. Assim, a quantidade de memória em MBytes

necess{ria aumenta consideravelmente para cada an{lise.

Dados multi-dimensionais: São imagens obtidas em diferentes períodos de tempo. Essas

imagens multibanda, são aquelas em que se armazena mais de um valor para cada um

dos eixos. Por exemplo, têm-se as imagens em cores que correspondem a um conjunto de

imagens de um mesmo objeto, mas tomadas com par}metros diferentes.

Conjunto de imagens relacionadas: Quando se armazena um conjunto de imagens, é

necess{rio um mecanismo para armazenar os dados de imagem como a relação

hier{rquica entre eles. No caso de imagens médicas em movimento, os dados pertinentes

são armazenados em vídeo.

Dados parceiros: São descritores das imagens. Por exemplo, o tamanho, a resolução, a

informação de cor, dados médicos do paciente ou de imagem.

Fig.2.12 – Classificação das diferentes modalidades de imagem médica com

relação ao tipo de fonte de energia utilizada para geração de imagens [Lv. 23].

Interno Interno e externo

Externo

Modalidades de

imagem médica

Fonte de energia

utilizada para

criação de imagem

Medicina nuclear:

SPET (Single Photon

Emission Tomography).

Medicina nuclear:

PET (Positron Emission

Tomography).

Imagem de

ressonância magnética

MRI, PMRI, FMRI.

Imagens de

fluorescência óptica.

Imagens de

impedância elétrica.

Raios–X

Mamografia

Tomografia

computadorizada

Ultrasom

Transmissão optica


2.5.3.2 Imagens tomográficas

As imagens tomogr{ficas são geradas pelos equipamentos tomogr{ficos,

(tomógrafos de raios-X, resson}ncia magnética) os quais geram imagens monocrom{ticas de

cortes (ou fatias) normalmente paralelos e uniformemente espaçados em uma região dada

3D.

Tomografia Computadorizada

A tomografia é a obtenção de imagens datalhadas de cortes axiais do corpo. Para

tanto, são utilizados feixes colimadores, muito finos de raios X, que integrados a

computadores fornecem imagens sequenciais correspondentes a fatias corporais. Isso é

mostrado na Fig.2.14(a).

Fig.2.13- Diagrama de bloco genérico de um típico

sistema de imagem médico eletrônico moderno [Lv. 23].

Exibição

Processamento

digital

Armazenamento

digital

Controle do computador

Interface homem

Conversão

digital

Formação da

imagem

Fonte de energia

Fonte eletrônica Controle

eletrônico

Detector

eletrônico

Corpo Detector de

energia


O fóton, ao atravessar o corpo, é atenuado, e a leitura do sinal do detector é

proporcional ao grau de atenuação ou a grau de penetração do fóton. A leitura pode ser:

• Por secção ( ‚slice by slice‛),

• Por volume.

Fig.2.15 - Fase de varredura ou de exploração [Pw. 1].

Fig.2.14 – a) Corte axial [Lv. 7] , b) Processo de aquisição da imagem tomográfica.

a) b)


Os detectores medem em diferentes posições, a radiação transmitida através do paciente.

𝑥 (feixe homogêneo) (2.3)

Onde:

μ: Coeficiente de atenuação linear (depende do meio e da energia).

Os elementos da matriz são chamados pixels.

O campo de visão é chamado de FOV (Field of Vision) e corresponde à região na qual

as medidas de transmissão são gravadas sobre uma matriz selecionada. Tem-se:

Tamanho pixel = campo de visão/ tamanho da matriz.

Ex: matriz 512 x 512 e FOV = 25 cm. Logo, 250 mm / 512 = 0,5 mm. Assim, cada pixel

pode ter variações de cinza entre 256(28) a 4096(212).

Fig.2.17 – Representação da imagem através de voxels [54].

Fig.2.16 – Formato da imagem [Lv. 7].


Processamento de imagem tomográfica

Os números computados para reconstrução da imagem são números inteiros.

A cada pixel é atribuído um valor numérico denominado número de TC (Eq. 2.4). Esse

número está relacionado com o coeficiente médio de atenuação μ do voxel do tecido que ele

representa.

𝑁𝑜𝑑 𝑇𝐶 𝑡 𝑤

𝑤 (2.4)

Método analítico de reconstrução tomográfica

O método analítico de reconstrução tomográfica é definido pela relação:

𝑥 ∫ 𝑥 𝑦 𝑑𝑦

(2.5)

Y’

B

X’

Pθ(X’)

Y

X

A

θ

Fig.2.19 – Esquema analítico de reconstrução tomográfica.

Onde: μt = Coeficiente linear de atenuação médio do material que compõe o voxel.

μw = Coeficiente linear de atenuação da água.

Fig.2.18 – Valor numérico do CT [Pw. 2].

Pixel

(matriz

numérica)

Nº TC

Pixel (matriz tons

de cinza)

Voxel

μ

Energia do

fóton Densidade

média


Para mostrar as diferentes trajetórias AB, se considera x’ = x cos(θ) + ysin(θ) e se reescreve na

forma de uma convolução com um conjunto de funções delta de Dirac:

𝑥 ∫ ∫ 𝑥 𝑦 𝑥 𝑠 𝑦𝑠 𝑥 𝑑𝑥𝑑𝑦

(2.6)

A equação 2.6 é conhecida como o teorema do corte central.

No caso particular, em que θ = 0, tem-se:

𝑥 ∫ ∫ 𝑥 𝑦 𝑥 𝑥 𝑑𝑥𝑑𝑦

(2.7)

Obtém-se: 𝑥 ∫ 𝑥 𝑦 𝑑𝑦

(2.8)

Fazendo-se a transformada de Fourier em ambos os lados, tem-se:

𝑢 ∫ 𝑥 𝑥𝑑𝑥 ∫ ∫ 𝑥 𝑦 𝑥

𝑑𝑦𝑑𝑥

(2.9)

A transformada de Fourier bidimensional (TF) de μ é expressa por:

𝑢 𝑣 ∫ ∫ 𝑥 𝑦 𝑥 𝑥𝑑𝑦𝑑𝑥

(2.10)

Verificando a expressão (2.8) pode-se afirmar que para o }ngulo θ = 0, tem-se:

𝑢 𝑢 (2.11)

Generalizando para qualquer }ngulo θ, tem-se:

𝑢 𝜌 (2.12)


Observações:

O teorema do corte central permite ‚construir‛ no plano de Fourier M(u,v) uma

"imagem" correspondente, a partir das transformadas das projeções P(u) fazendo-se uma

associação radial espacial de seus valores.

Uma vez construída a função M, basta fazer a TF bidimensional inversa e obtem-se

uma estimativa de μ. Deve-se levar em conta o fator de resolução não homogêneo devido |

menor amostragem nas extremidades do plano.

63

Capítulo 3

Compressão de imagens

umerosas aplicações que utilizam processamento, armazenamento ou transmissão de

imagens digitais, geram um grande número de arquivos. Devido ao tamanho da imagem

resultante, essas aplicações somente são viáveis se essas tarefas puderem ser realizadas de

forma eficiente. Exemplos:

• Televisão por cabo;

• Bases de dados de publicações acessíveis eletronicamente;

• Videoconferência, fax-simile;

• Teledeteção mediante imagens via satélite;

• Imagens médicas;

• Controle remoto de veículos;

• Visão artificial.

Por outro lado, a utilização de imagens médicas digitais está presente em nosso

cotidiano. Esse uso está em crescimento na maioria dos hospitais e clínicas do mundo. Assim,

torna-se imperativo o desenvolvimento de técnicas que viabilizem o armazenamento e a

transmissão dessas imagens em redes de computadores. As imagens médicas geram um

grande número de dados todo dia. Por isso, dentre as técnicas de processamento de imagens,

a compressão de imagem digital tem um papel fundamental no sentido de elevar o potencial

N

N

64 Capítulo III – COMPRESSÃO DE IMAGENS

de armazenamento e da transmissão dessas informações. O objetivo da compressão de uma

imagem é eliminar ou reduzir as informações redundantes e/ou desnecessárias, de acordo

com o processo sem ou com perdas. A compressão de dados é composta de duas etapas:

modelagem e codificação.

Modelagem: conjunto de regras usadas para processar os dados de entrada e determinar qual

código deve representá-los;

Codificação: conjunto de símbolos que representa a informação;

Dados: códigos que representam os valores dos pixels;

Informação: interpretação ou significado dos dados.

Em compressão de imagens, dois fatores são de extrema importância: velocidade de

processamento e a taxa de compressão. Um esquema típico de compressão sem perda para

imagens em tons de cinza obtém taxa de compressão da ordem de 50%, possibilitando reaver

a imagem original a partir da versão comprimida. Em uma imagem digital há, basicamente,

quatro tipos de redundâncias:

Redundância de codificação de tons ou cor: quando os níveis de cinza ou as cores de

uma imagem são codificados com mais símbolos de codificação do que o necessário;

Redundância interpixel: resultantes das relações geométricas ou estruturais entre os

objetos na imagem;

Redundância espectral: ocorre em imagens com mais de uma faixa espectral, quando os

valores espectrais, para a mesma posição na matriz de pixels de cada banda, são

correlacionados;

A redundância psicovisual: relacionadas ao fato do sistema visual humano não

responder com a mesma sensibilidade a todas as informações visuais.

Capítulo III – COMPRESSÃO DE IMAGENS 65

Fig.3.1 - Modelo do sistema de compressão genérico de imagem.

Codificador

de canal Codificador da

imagem Decodificador

de canal Decodificador

da imagem Canal

C O D I F I C A D O R D E C O D I F I C A D O R

f(x, y) g(x, y)

As imagens médicas apresentam como características a presença de uma alta

correlação interpixels ou espacial e uma grande quantidade de ruído que é inserido durante o

processo de aquisição.

3.1 Modelos de compressão de imagens

Como mostra a Fig.3.1 um sistema de compressão pode ser dividido em dois blocos

b{sicos: um codificador e um decodificador. A imagem de entrada, f(x, y), é alimentada no

codificador que cria um conjunto de símbolos. No caso de uma imagem, os símbolos

representam os níveis de amplitude de cada pixel da imagem. Após a transmissão através do

canal, a representação codificada é alimentada no decodificador, onde a imagem é

reconstruída e g(x, y) é gerada.

Se g(x, y) = f(x, y), o sistema é livre de erros e a compressão é sem perdas. Caso

contr{rio, a compressão é com perdas e algum nível de distorção est{ presente na imagem

reconstruída. A compressão sem perdas apresenta a vantagem de não introduzir erros. A

imagem reconstruída na compressão com perdas contem degradações em relação | original.

Tanto o codificador, quanto o decodificador são formados por dois sub-blocos relativamente

independentes, como pode ser visto na Fig.3.1 e 3.2 respectivamente.

3.1.1 O codificador e o decodificador de imagem

O codificador da imagem é responsável pela redução ou eliminação de redundâncias

de entrada. Normalmente, o codificador e o decodificador podem ser construídos de acordo

com o modelo da Fig.3.2.


Redução de dados: quantização do nível de cinza, realçando-se a eliminação de ruído;

Projeção direta: convertem-se os dados a outro espaço matemático;

Quantizador: discretiza os valores contínuos do estado anterior;

Codificador: converte os dados discretos do quantizador para um código de forma ótima.

3.1.2 O codificador e o decodificador de canal

Se o canal é ruidoso, o codificador e o decodificador de canal são projetados de

maneira a reduzir o impacto de ruído, o que é feito através da inserção de redundância de

forma controlada. Como a informação codificada tem pouca redundância, sua sensibilidade

ao ruído é grande.

Imagem de

entrada

f(x,y)

Redução de

dados

Projeção

direta

Quantizador Codificador Imagem

comprimida

Pré-processamento

Codificação

Fig.3.2 – Etapas do codificador da imagem original.

Decodificador Projeção

inversa

Pós-processador

D e c o d i f i c a ç ã o

Imagem

comprimida

Imagem

decodificada

g(x,y)

Fig.3.3 – Etapas do decodificador do arquivo para imagem.


Decodificador: inverte a ação do codificador original projetando os códigos quantizados aos

valores originais mais próximos (meio do passo de quantização);

Projeção inversa: inverte-se o processo de projeção original;

Pós-processador: realça o aspecto final da imagem para atenuar qualquer efeito não desejado

da compressão.

3.2 Medidas de compressão e critérios de fidelidade

3.2.1 Medidas de compressão

Dentro das medidas de compressão, existem diferentes métodos para determinar a

eficiência de um sistema de compressão. Os mais utilizados são [12][13][14]:

Longitude média por símbolo (LS)

É a relação entre o comprimento do arquivo comprimido (C), expresso em bytes e o tamanho

do arquivo sem comprimir (O) também expresso em bytes.

8 𝑠 (bits por símbolo) (3.0)

Ao trabalhar com imagens, os símbolos são pixels, obtendo-se assim a unidade bpp (bits por

pixel). Essa unidade também é chamada de taxa de bits (bit rate).

Fator ou razão de compressão (X:1)

É a relação entre o comprimento do arquivo original e o do arquivo comprimido.

𝑥

(3.1)

Tamanho comprimido relativo (TR)

É o inverso do fator de compressão, e é expresso como uma porcentagem.

𝑇

𝑥 (3.2)


Compressão relativa (CR)

Define o porcentual de diminuição do tamanho do arquivo original.

𝐶

𝑇 (3.3)

Fator de mérito (p)

Determina se há compressão ou não.

(3.4)

- Se p = 100%, o arquivo original e o arquivo resultante são do mesmo tamanho em bytes e,

portanto, não há compressão.

- Se p > 100%, o arquivo resultante é maior que o arquivo original, o que significa que se tem

gerado uma expansão ao comprimir os dados.

- Se p < 100%, o arquivo resultante é menor do que o arquivo original e, portanto, se gerou

uma compressão de dados.

3.2.2 Critérios de fidelidade

Permite determinar o desempenho dos métodos de compressão ao avaliar a

similaridade entre a imagem original e a recuperada. Definem-se dois tipos de critérios de

fidelidade: objetivos e qualitativos.

3.2.2.1 Critérios objetivos

Os critérios objetivos ou quantitativos referem-se ao fato de que as perdas podem ser

expressas como uma função de imagem de entrada e saída comprimida e, posteriormente

descomprimida. Entre esses critérios estão:


Erro total ou absoluto

Seja f(x, y) = I e g(x, y) =I’ de NxM tal que, I é a imagem de entrada e I’ a imagem

reconstruída.

𝑥 𝑦 ∑ ∑ 𝑥 𝑦 𝑥 𝑦

𝑦 𝑥 (3.5)

Onde: M = número de linhas

N = número de colunas

Erro quadrático médio (MSE : Mean Squared Error)

𝐸

∑ ∑ 𝑥 𝑦 𝑥 𝑦

𝑦 𝑥 (3.6)

Relação sinal ruído (SNR: Signal to Noise Ratio)

𝑁 ∑ ∑

∑ ∑

(3.7)

Taxa máxima de relação sinal ruído (PSNR : Peak Signal to Noise Ratio)

𝑁

(3.8)

Correlação cruzada (CC)

Esse parâmetro mede a dependência estatística entre duas imagens. É dada por:

𝐶𝐶 ∑ ∑

√∑ ∑ √∑ ∑

(3.9)


3.2.2.2 Critérios qualitativos

Para o uso de critérios qualitativos, é necess{rio um grupo de observadores (médicos

especialistas), a fim de analisar e comparar as imagens originais com as imagens processadas

em uma ordem determinada, e emitindo opiniões individuais sobre a qualidade visual. A

qualidade da imagem resultante é determinada pelo especialista, com ajuda de um conjunto

de critérios de valores. Esses valores foram representados em uma escala variando de 0 até 5.

A tabela 3.1 mostra a escala citada.

Nível Valores Descrição

0 Não utiliz{vel Imagem de péssima qualidade.

1 Insuficiente Imagem de baixa qualidade, e não se deve analisar.

2 Marginal Imagem com degradações apreci{veis o que dificulta seu estudo.

3 Aceit{vel Imagem com pouca degradação, podendo ser analisada.

4 Bom Imagem de qualidade, sem degradações consider{veis.

5 Excelente Imagem de alta qualidade, sem degradação.

3.3 Métodos de compressão de imagens

3.3.1 Compressão de imagens sem perdas ou reversível

Os métodos de compressão reversíveis produzem uma cópia exata da imagem

original. O método explora a redund}ncia entre os pixels na codificação. Na {rea de medicina,

a natureza sem perda é de fundamental import}ncia por razões éticas. O esquema geral de

funcionamento dos métodos de compressão reversíveis ocorre em duas fases:

• Uma transformação, de modo a reduzir a correlação inter-pixels, e;

• Uma codificação entrópica (exemplo, o codificador de Huffman ou aritmético).

A transformação deve resultar em valores inteiros para o codificador funcionar. Ela

pode ser uma transformação por blocos, por bancos de filtros ou por uma transformação

preditiva.

Tabela 3.1 – Escala dos critérios de valores.


3.3.1.1 Compressão sem perdas por métodos padrões

Métodos específicos para a compressão de imagens monocrom{ticas: Dentro desses

tem-se:

FELICS (Fast and Efficient Lossless Image Compression) *15+

O compressor de imagens FELICS, é um dos compressores de imagens sem perdas

de informações mais simples, r{pido e eficiente. A imagem é comprimida por meio de linhas

e é idêntico ao JPEG. Posei um codificador entrópico r{pido. O contexto de predição espacial

é mostrado na Fig.3.4. FELICS usa um modelo probabilístico especial (Fig.3.5). O contexto de

predição é usado para indicar se o intervalo de valores est{ contido entre a e b. Se L é menor

que s (a ou b) e H maior, então a probabilidade de que L ≤ s ≤ H é bastante alto e quase

uniforme. Porém, se s estiver fora do intervalo, FELICS segue uma exponencial decrescente

conforme se afasta de L e H. Para codificar a probabilidade de s quando est{ dentro do

intervalo, usa-se um codificador bin{rio. Para codificar a probabilidade fora, usa-se um

codificador de RICE.

b

a s

Fig.3.4 – Predição espacial usado por FELICS.

Fig.3.5 – Modelo probabilístico usado em FELICS [15].


Codificador entrópico:

Esse tipo de codificação, refere-se ao uso de um código de comprimento vari{vel

para representar sem perda uma sequência de símbolos de um alfabeto discreto. O termo

código entrópico vem do feto de que a entropia impõe um limite mínimo para a média do

comprimento da palavra código, no caso de uma fonte sem memória. Quando se constrói um

compressor utilizando um codificador por entropia, deseja-se que este fique o mais próximo

possível da entropia. Desse modo, a medida pode ser utilizada para estimar inferiormente a

quantidade de bits por símbolo que se teria caso a informação comprimida.

A chave para se obter o m{ximo rendimento em um compressor entrópico é a

estimação exata das probabilidades dos símbolos. Se a probabilidade é baixa demais, o

código designado aumenta o comprimento. Por outro lado, o rendimento dos compressores

entrópicos depende tanto dos codificadores de comprimento vari{vel quanto dos modelos

probabilísticos usados. Na atualidade, procura-se a m{xima compressão possível, ainda que

isso implique no uso de algoritmos de alto custo computacional que permitam aproveitar o

m{ximo grau de otimização. Os codificadores entrópicos mais utilizados são, o codificador de

Huffman e o aritmético.

Codificador

A estratégia do codificador FELICS consiste em emitir os códigos que informam ao

decodificador sobre a situação de s com relação a a e b, como é mostrado no algoritmo:

1. Seja L ← mín ,a,b} e H ← Max ,a,b}

2. Seja Δ ← H – L

3. Se L ≤ s ≤ H:

a) Emitir um bit indicando IN – RANGE

b) Emitir um código bin{rio ajustado codificado S – L. O tamanho do alfabeto é Δ

4. Se não

a) Emitir um bit indicando OUT-RANGE

i. Se s < L


A. Emitir um bit indicando BELOW-RANGE

B. Codificar L – s – 1 usando um codificador Rice

ii. Se não: (s > H)

A. Emitir um bit indicando ABOVE-RANGE

B. Codificar s – H- 1 usando um codificador Rice

5. Estimar o par}metro k necess{rio para a codificação de Rice

O uso de um código de Rice ou de um código bin{rio para expressar o resto do símbolo

torna possível que FELICS possa codificar imagens de qualquer profundidade de cor sem que

os algoritmos de codificação e decodificação sejam modificados.

Decodificador

A partir da mesma predição levada pelo codificador e da informação proporcionada

com os códigos, o decodificador FELICS recupera o valor original de s aplicando o algoritmo

seguinte:

1. Seja L ← mín ,a,b} e H ← Max ,a,b}

2. Seja Δ ← H – L

3. Se s est{ em IN-RANGE:

a) Ler x decodificando o código bin{rio sabendo que o tamanho do alfabeto é Δ

b) s ← L + s

4. Se não: (s est{ OUT-RANGE)

a) Ler um bit (que indica se s est{ BELOW-RANGE ou ABOVE_RANGE)

b) Se s est{ BELOW-RANGE:

i. Decodificar x usando o decodificador de Rice

ii. s ←L + s + 1

c) Se não: (s est{ ABOVE-RANGE)

i. Decodificar x usando o decodificador de Rice

ii. s ← L + s + 1

5. Calcular o par}metro k necess{rio para a codificação de Rice.


• LJPEG(Lossless Joint Photographics Experts Group)*16+

Esse método baseia-se em codificação preditiva combinada com um preditor fixo

(codificação de entropia). O método de previsão transforma a imagem original em uma

imagem erro com vari}ncia reduzida usando-se um preditor.

A Fig.3.6 mostra a relação entre os codecs entrópicos e os preditores onde s denota

um ponto da imagem a comprimir, ŝ a predição realizada pelo preditor P e “e” o erro de

predição. C é o compressor entrópico específico e D o descompressor ou expansor.

Codificador JPEG

A imagem é varrida por linhas, a partir do canto superior esquerdo, gerando a

codificação de um ponto s da seguinte forma:

1. Geração de uma predição ŝ usando um dos métodos de predição (Tabela 3.2);

2. C{lculo do erro de predição e ← s - ŝ

Para fazer a predição, JPEG utiliza um máximo de 3 pixels vezinhos (Fig.3.7). Os

dados que foram codificados são indicados com um sombreado e portanto são conhecidos no

C b

A s

Fig.3.7 – Contexto de predição espacial usado por JPEG.

- C D

P

+

P

e e

Ŝ Ŝ

S

S

Fig.3.6 – Compressor - Expansor (Descompressor) JPEG sem perdas [16].


processo de descompressão [17]. Os preditores são projetados de tal forma a usar os pixels

vizinhos que em geral, são correlacionados. Desse modo, usando-se uma predição linear a

partir desses pixels estima-se um valor aproximado do pixel a se codificar.

Símbolo Intervalo etiqueta

0 ŝ ← 0

1 ŝ ← a

2 ŝ ← b

3 ŝ ← c

4 ŝ ← a + b – c

5 ŝ ← a + (b -c)/2

6 ŝ ←a + (b -)/ 2

7 ŝ ← (a + b)/2

O erro de predição é calculado no passo 2 e a codificação pode ser feita usando-se as

técnicas de codificação de Huffman ou codificação aritmética. Deve-se ter em conta que o erro

e estatisticamente apresenta uma distribuição de probabilidade de Laplace.

Decodificador JPEG

A etapa de descompressão é determinada a partir da fase de compressão, de modo

que o descompressor consiste em:

1. Gerar ŝ usando o mesmo preditor usado no compressor;

2. Decodificar e utilizando o mesmo código que o compressor;

3. Calcular o pixel s ← e + ŝ

• CLIC (Context-based Lossless Image Compression)*18+

Usa v{rios contextos, para estimar probabilidade de funções densidade de valores de

erro, que são finalmente codificadas pela codificação aritmética. Os valores de erro são

calculados como a diferença entre um valor de pixel e uma predição. A função de predição

Tabela 3.2– Preditores empregados pelo padrão JPEG sem perdas.


pode ser escolhida entre v{rias funções possíveis, como: (N + W)/ 2, onde N corresponde ao

valor de pixel acima do pixel atual. A probabilidade da função densidade dos valores de erros

é estimada para cada contexto, calculando-se as frequências de valores de erro. Isso

pode ser feito bit a bit pelo c{lculo da frequência de cada bit em cada contexto. O contexto

é construído a partir dos valores de erro dos pixels acima e | esquerda do pixel atual.

• LOCO-I (Low Complexity,Context-Based,Lossless Image Compression Algorithm)*19+*20+

É semelhante | FELICS, usa um codificador de Rice como codec entrópico, mas ao

contr{rio desse, o modelo probabilístico est{ baseado no contexto. Outra melhoria importante

introduzida em LOCO-I, é que o preditor espacial trata de usar a informação global da

imagem para melhorar a fase de predição e gerar uma distribuição de Laplace, mais estreita,

isto é, com menor vari}ncia. A informação global é uma fonte importante de redund}ncia

espacial j{ que nas imagens é comum se achar regiões distantes que são semelhantes em

textura ou composição. Um preditor local não pode extrair esse tipo de redund}ncia.

LOCO-I foi adotado como um padrão novo para uma compressão de baixa

complexidade (em termos de memória e CPU) e sem perda de informação de imagens

chamada JPEG-LS (JPEG-Lossless).

Codificador

A imagem é varrida por linhas iniciando-se pelo canto superior direito. O algoritmo

é o seguinte:

1. Inicialização dos contextos de predição:

a) Seja Q o contexto atual. LOCO-I considera um m{ximo de 1094 contextos diferentes;

b) Seja N*Q+ o número de ocorrências de cada contexto. Inicialmente N*Q+ ← ∀𝑄

c) Seja B*Q+ o erro de predição acumulado em cada contexto;

Inicialmente B*Q+ ← ∀𝑄

d) Seja A[Q] a soma dos valores absolutos dos erros de predição para cada contexto;

Inicialmente para A*Q+ ← ∀𝑄


e) Seja C*Q+ os valores de cancelamento da ‚bias‛. A bias é um valor que acrescentado |

predição espacial faz com que sua média seja 0. Inicialmente C*Q+ ← ∀𝑄

2. Determinação do contexto de predição Q:

a) Calcular a gradiente local. Para isso são calculados 4 diferenças (Fig.3.7):

g1 ← d – a

g2 ← a - c

g3 ← c – b

g4 ← b – e

b) Calcular os gradientes de acordo com:

𝑞 ←

{

𝑠 𝑚

𝑠 𝑚

𝑠 𝑚 3 6

3 𝑠 𝑚 7 44 𝑚 𝑢𝑡𝑟 𝑎𝑠

Para i = 1, 2, 3 e

𝑞4 ← { 𝑠 𝑚 4 < 𝑠 𝑚 5 4 𝑚 𝑢𝑡𝑟 𝑎𝑠

3. C{lculo do erro de predição M(e):

a) Construir a predição inicial

�� ← {𝑚í 𝑎 𝑠 𝑚 ≥ 𝑚á𝑥 𝑎

𝑚á𝑥 𝑎 𝑠 𝑚 min 𝑎 𝑎 𝑚 𝑢𝑡𝑟 𝑎𝑠

b) Calcular o ‚bias‛

�� ← {�� 𝐶 𝑄 𝑠 𝑚

�� 𝐶 𝑄 𝑚 𝑢𝑡𝑟 𝑎𝑠

c) Calcular o erro de predição

← 𝑠 �� 𝑚 𝑑 𝛽


Onde β é o número de bits por ponto. Isso faz com que o erro de predição seja

projetado a partir do intervalo *- α + 1, α - 1+ até o intervalo *- α/ 2, α/ 2 - 1+ onde α= 2β,

é o tamanho do alfabeto.

d) Embaralhar os erros de previsão negativos e positivos gerando SDPG. Isso é feito de

acordo com o seguinte mapeamento:

← { 𝑠 𝑚 ≥ 𝑚 𝑢𝑡𝑟 𝑎𝑠

Após esse mapeamento, os erros são ordenados de acordo a: 0, -1, -2, +2, ..., 2β-1

4. Codificação entrópica de M(e) no contexto Q:

a) Emite-se um código de Rice que codifica o símbolo M (e) para k = *log2 (A *Q+)+

5. Atualização do contexto Q:

a) B*Q+ ← B*Q+ + e

b) A*Q+ ← A*Q+ + |e|

c) Sim N*Q+ = RESET, então (onde 64 ≤ RESET ≤ 256):

i. A*Q+ ← A*Q+/2

ii. B*Q+ ← B*Q+/2

iii. H*Q+ ← N *Q+ + 1

d) N*Q+ ← N*Q+ + 1

e) O c{lculo do valor atualizado para o cancelamento da ‚bias‛ é mais complexo. Se o

erro de previsão inicial no contexto de Q não tem média 0, o nível de compressão cai

severamente. Isso ocorre porque as médias de distribuição de Laplace real e da

modelada não coincidem. Para evitar isso, C *Q+ armazena um valor proporcional a

B *Q+ / N *Q+ que é adicionado | previsão inicial para cancelar a ‚bias‛. Além disso,

C*Q+ é respons{vel para resolver outro problema que deriva do embaralhamento

produzido por M (e). De fato, tem-se uma tendência para atribuir um código mais

curto para o erro negativo e um mais longo ao respectivo erro positivo. O algoritmo

para atualizar C *Q+ é a seguinte *20+:


i. Sim B*A+ ≤ - N*Q+, então:

A B*Q+ ← B*Q+ + N*Q+

B sim C*Q+ > - 128, então

C*Q+ ← C*Q+ – 1;

C sim B*Q+ ≤ - N*Q+, então :

B*Q+ ← N*Q+ + 1;

ii. Sem não

A B*Q+ > 0, então:

B*Q+ ← B*Q+ – N*Q+;

Sim C*Q+ < - 127, então:

- C*Q+ ← C*Q+ + 1;

Sim B*Q+ > 0, então:

- B*Q+ ← 0.

Decodificador

O decodificador é muito simétrico e recupera os símbolos s usando o seguinte algoritmo:

1. Inicialização dos contextos de previsão (v{ para a etapa 1 do compressor);

2. Determinação do contexto Q: (v{ para a etapa 2 do compressor);

3. Decodificação de M(e): usando um decodificador de Rice com k = *log2(A*Q+)+

4. Determinação de s:

a) Calcule a previsão inicial �� como no passo 3a do compressor;

b) Adicionar o ‚bias‛ sobre ��:

�� {�� 𝐶 𝑄 𝑠 𝑚 >

�� 𝐶 𝑄 𝑚 𝑢𝑡𝑟 𝑎𝑠

c b d

e a s

Fig.3.8 – Contexto de predição espacial usado por LOCO-I.


c) Calcular o mapeamento inverso gerando a distribuição de Laplace original:

⟵ ( ) {

𝑠 𝑚 é 𝑚 𝑎𝑟

𝑚 𝑢𝑡𝑟 𝑎𝑠

d) Calcular o símbolo s como:

S ← (e + ŝ) mod β

5. Atualização de Q: (ir para a etapa 5 do compressor).

• CALIC (Context-based Lossless Image Compression) *21+.

Trata-se de uma técnica baseada sobre o contexto pixel do presente pixel a ser

codificado. O método é capaz de aprender dos erros cometidos nas previsões anteriores e,

dessa forma, pode melhorar a sua previsão de forma adaptativa. Os valores dos pixels são

previstos por um preditor não linear, que seleciona os pixels de previsão e a função de

previsão espacial, entre v{rias funções de previsão possíveis a partir do contexto local. O

contexto é construído da magnitude do gradiente local nas direções horizontal e vertical. A

predição é melhorada por se adicionar uma estimativa de erro ao valor predito. Essa

estimativa é o erro médio dos valores preditos prévios no presente contexto. Quatro

coeficientes são usados para o peso das magnitudes do gradiente vertical e horizontal. O

último conjunto de erros de previsão é codificado por código de Huffman ou aritmético.

• CPM (Central Prediction Method)*22+

Trata-se de uma técnica de compressão iterativa que aplica a codificação hier{rquica

de quatro bits | imagem para codificar os erros de predição. Os valores dos pixels são

previstos em duas fases. Na primeira fase, o valor de um pixel é previsto como a média dos

quatro pixels vizinhos verticais e horizontais. Na segunda metade da fase, os pixels restantes

são previstos pelos valores dos pixels nas duas direções diagonais. Um quarto dos valores de


pixels permanece imprevisível e é transferido para um bloco separado, que ser{ comprimido

recursivamente pelo mesmo método de previsão.

A recursividade termina quando o tamanho do bloco de valores de pixels original é

2x2. Os níveis de bits da imagem resultante são codificados pelo esquema de codificação

hier{rquico de quatro bits. O esquema de codificação divide o plano de bits de NxN em

quatro subplanos de N/2xN/2, cada qual é codificado por um bit em um codeword de quatro

bits. Se todos os valores de pixels em um subplano são zero, então esse subplano é codificado

por um zero. Caso contr{rio, é codificado por um. O procedimento é aplicado recursivamente

a cada um dos subplanos.

• SPIHT (Set Partitioning in Hierarchical Trees) *23+

Transforma a imagem em uma representação multiresolução pela transformada

wavelet ou, no caso de compressão sem perdas, pela transformada S. Essa transformação é

semelhante | decomposição em sub-bandas, pois usa somente operações inteiras. A

transformada S verifica as colunas da imagem e calcula, para cada par sucessivo de pixels, a

média e a diferença. As médias são armazenadas na parte superior da imagem (l), e as

diferenças são armazenadas na parte inferior (h) da imagem.

O mesmo se repete para as colunas de l e h, ll, lh, hl, e hh imagens. No próximo nível, o

bloco ll é processado do mesmo modo. Após cada transformada unidimensional, as

diferenças dos pixels são substituídas pela diferença de valores de pixels transformados e os

valores de predição. Isso é conhecido como a transformada P. Os valores de predição são

calculados em função de pixels dos níveis inferiores da pir}mide e os pixels conhecidos a

partir do nível atual. A codificação aritmética conclui o processo de codificação.

3.3.1.2 Métodos específicos de compressão sem perdas

Para os métodos de codificação preditiva, é possível proceder do seguinte modo:

• Definir preditores fixos específicos adaptados tanto pelo algoritmo LMS (Least Mean

Square) *24+ adapt{vel quanto por regressão recursiva pseudo-linear *25+;


• Definir para um preditor dado, um modelo estatístico do erro de previsão em diferentes

regiões da imagem (como o fundo da imagem e da {rea estudada). Assim, um codebook é

associado com cada região da imagem durante a codificação estatística.

Compressão baseado sobre regiões de interesse

Cada região da imagem pode ter mais ou menos import}ncia no processo de

diagnóstico. Por exemplo, uma fatia do cérebro pode ser dividida em duas regiões distintas: a

{rea do cérebro que é útil para estabelecer um diagnóstico médico e o fundo da imagem que

não fornece informação útil. A parte da imagem que é mais útil é chamada de ROI ou região

de interesse.

As regiões de interesse ou são definidas manualmente ou depois da segmentação. A

maior parte dos trabalhos de codificação que se baseia em região tem-se centrado no

objetivo de identificar regiões com características diferentes. Essas características poderiam

ser usadas em diferentes esquemas de codificação. Mas, isso requer que a imagem de

entrada seja segmentada para dar origem a regiões espaciais. As regiões podem diferir em

suas características de níveis de cinza ou em seus níveis de import}ncia. A divisão em regiões

ou segmentação das imagens é útil devido a duas finalidades. Essas, são:

• A segmentação pode permitir o uso de esquemas de codificação mais apropriado para as

diferentes regiões;

• A segmentação permite aplicar diferentes níveis de qualidade para diferentes regiões. Os

métodos poderiam ser idênticos, exceto por suas atribuições de bits.

Por outro lado, a compressão baseada na ROI nos permite alcançar taxas de compressão de

até 28:1 quando a taxa de compressão média para a maioria dos processos de compressão

reversível é de 3:1. A versão mais recente do JPEG2000 permite uma determinação de v{rios

ROIs de forma circular e nos permite realizar uma compressão reversível de dados contidos

dentro da ROI. As diferentes regiões a serem codificadas podem ser definidas após uma fase

de segmentação.


Assim, a estratégia de codificação para cada região pode ser adaptada ao conteúdo da

informação incluída nesse tipo de região. Esse método de codificação trabalha separando a

imagem em duas partes (seu contorno e sua textura) e representa uma imagem

simbolicamente na forma de um mosaico de regiões adjacentes, com variações contínuas em

suas amplitudes de pixel interno.

As bordas das regiões representam os contornos da imagem e podem ser codificadas

por um processo reversível conhecido como o método de codificação diferencial de Freeman.

Pode-se também usar um processo com perdas, que consiste em aproximar suas fronteiras

por linhas retas, por exemplo. O sinal de lumin}ncia em cada região corresponde | textura de

cada objeto dentro da imagem. Esse sinal pode ser codificado utilizando-se diferentes

métodos com taxas de compressão dos níveis que variam de acordo com as informações

contidas nesse objeto. Para melhorar a taxa de compressão global da imagem, pode-se obter

uma codificação sem codificar a imagem de fundo (Fig.3.9).

Fig.3.9 a) Abdominal original MRI (512x512x16bit); b)Classificação fuzzy dentro de 3

conjuntos baseado sobre a intensidade do pixel; c)Imagem reconstruída após uma

compressão reversível preditiva dos pixels em todos os outros conjuntos TC=7,4 [Lv. 4].

a) b) c)


A codificação preditiva ideal ou adaptativa em cada região a ser codificada pode ser

realizada de acordo com uma pesquisa específica, adaptada a qualquer tipo de formato da

região. (Fig.3.10)

Os benefícios em termos de taxa de compressão dependem em grande medida da

imagem a ser estudada. O método de codificação baseado sobre o contorno textura resulta em

melhoria de 10 a 30% nas taxas de compressão. No entanto, quando um processo de

armazenamento é necess{rio, é impossível determinar quais detalhes serão úteis no futuro

*26+.

3.3.2 Compressão de imagens com perdas

No caso da compressão irreversível, existe uma perda de informação, mas as taxas que

podem ser obtidas são pelo menos de uma ordem maior, em magnitude. No caso das

imagens médicas deseja-se disponibilizar toda a informação necess{ria ao médico, ao mesmo

tempo em que as distorções produzidas pelo método sejam eliminadas. É frequente encontrar

um número importante de algoritmos que usa a transformação da imagem para outro

domínio onde é possível representar a energia da imagem de um modo mais compacto *27+.

Do mesmo modo que os arquivos de {udio, as imagens digitais apresentam uma

grande vantagem em relação a outros tipos de dados. Na verdade, eles podem ser

modificados ligeiramente durante o processo de compressão sem afetar a qualidade

Fig.3.10 - a) Exploração de cima para baixo a partir do ponto P0;

b)Exploração de baixo para cima a partir de P1; c)Exploração de cima

para abaixo a partir de P2 [Lv. 4].

P1

P2

P0

P2

P1

P2

a) b) c)


percebida pelo usu{rio, ou seja, a qualidade subjetiva da imagem codificada é ainda aceit{vel

após a recuperação *28+. As mudanças realizadas no processo de codificação podem ser

imperceptíveis na imagem recuperada se as modificações forem cuidadosamente feitas. Esse

fato torna possível a implementação de algoritmos e métodos de compressão de imagens

digitais com perdas.

A diferença entre a compressão de imagens com perdas e a compressão sem perdas

est{ na fase de quantificação *28+. Os métodos mais comuns de compressão com perdas para

imagens fixas são: JPEG com perdas (baseada na transformada discreta de cosseno) e a

compressão fractal. Para propósitos de compressão, as propriedades que deveriam satisfazer

essas transformadas são: descorrelacionar os dados e tornar pequenos os coeficientes

transformados. Um esboço típico de compressão de imagens com perdas é formado através

de três componentes relacionados:

a) O codificador da fonte;

b) O quantizador e;

c) O codificador entrópico.

A compressão é levada a cabo por meio da transformada linear para

descorrelacionar os dados na imagem, quantizar os coeficientes transformados resultantes e

codific{-los entropicamente. No codificador de fonte são usadas diferentes transformadas;

entre elas a transformada discreta de Fourier DFT (Discrete Fourier Transform), a transformada

discreta de cosseno DCT (Discrete Cosine Transform ), a transformada discreta wavelet DWT

(Discrete Wavelet Transform), entre outras.

O quantizador reduz o número de bits necess{rios para armazenar os coeficientes,

reduzindo também sua precisão. Esse é um processo com perdas e é a fonte de compressão

principal em um codificador. A quantização pode ser levada a cabo em cada coeficiente

individual, o que é conhecido como quantização escalar SQ (Scalar Quantization), ou em um

grupo de coeficientes conhecidos como quantização vetorial VQ (Vector Quantization). O

codificador entrópico comprime os valores quantizados e sem perdas. Esses codificadores

usam um modelo para determinar de um modo preciso as probabilidades de cada valor e

produzem um código apropriado de acordo com essas probabilidades.


Os mais usados são: o codificador Huffman e o codificador aritmético. Por enquanto,

para aplicações que exigem uma execução r{pida, o codificador RLE (Run Length Encoding) se

manifestou ser muito efetivo. Para alcançar um fator de compressão alto, é absolutamente

necess{rio que seja projetado de um modo apropriado tanto o quantizador quanto o

codificador entrópico. Existem modelos de representação usados na compressão de imagens

radiológicas como as técnicas propostas por Lo S. e Huang K., para transformas cossenoidais

de imagens completas *29+*30+.

O uso das funções wavelets tem-se mostrado útil na compressão de várias modalidades

de imagens desde a década de 90 [31][32]. As taxas de compressão são excelentes e

concomitantemente mantém-se uma qualidade da imagem dentro de limites razoáveis tanto

objetiva quanto subjetivamente. Por isso, o uso dos esquemas de compressão wavelets

representa uma contribuição importante para o desenvolvimento de sistemas de computador

para o processamento de compressão de imagens médicas [33].

3.3.2.1 Quantização

Existem duas formas principais de quantização:

1. Quantização escalar;

2. Quantização vetorial (VQ).

Quantização escalar

A quantificação consiste em mapear elementos de um grupo para outro grupo. Em

geral, o segundo grupo possui um número finito de elementos. A quantificação escalar

permite mapear separadamente cada cor de uma imagem em um grupo menor de valores de

saída, tornando assim, o processo irreversível (com perdas). O método permite reduzir o

número de bits de cor ou níveis de cinza. Quando o alfabeto símbolo de entrada for maior que

o alfabeto de índice de quantização, h{ compressão de informação, mas também perda de

informação. Todos os símbolos dentro de um intervalo de valores são mapeados para um

nível de quantização; esse intervalo define a célula de quantização para cada índice.


A operação inversa | quantização mapeia o nível de quantização para um símbolo

de saída. Tipicamente a quantização escalar mapeia um grupo infinito de entradas reais para

um grupo finito de níveis inteiros. A quantização inversa mapeia um grupo finito de níveis

inteiros para um grupo finito de saídas reais. A diferença entre o símbolo de entrada e o

símbolo de saída é o erro de quantização para cada símbolo. Um quantizador escalar é

denominado regular se as células individuais são contíguas, isto é, o span das células

ordenadas tem intervalo contínuo.

Não h{ nenhuma sobreposição entre células e o valor de saída da célula fica dentro

da célula. Quando se mapeia um símbolo do alfabeto real usando um quantizador regular

com níveis de alfabeto finito, uma das células ter{ um intervalo abaixo de -∞ e outra das

células ter{ um intervalo acima de +∞. Essas células são denominadas de células

sobrecarregadas. Todas as outras células são chamadas células granulares. Um quantizador

uniforme é um quantizador regular onde todas as células são do mesmo tamanho e o valor de

saída para cada célula granular é o ponto médio da célula. Um quantizador uniforme é

definido pelo tamanho do alfabeto, tamanho da célula ou tamanho do passo, e pelo intervalo

coberto pela célula granular.

Se a fonte X tem valores reais arbitrários, não pode ser codificado com um número

finito de bits. Um quantizador escalar Q é definido pela aproximação dada por = Q(X), a

qual toma valores sobre um grupo finito de valores [11]. A otimização do quantizador é

estudada para minimizar o número de bits necessários para se codificar . Nesse caso, o erro

quadrático médio é dado por:

𝐷 𝐸 (3.10)

O intervalo (yk-1, yk+ é chamado de caixa de quantização. Esse intervalo est{ sendo

considerado aberto "(" | esquerda e fechado | direita ‛+". Um inteiro arredondado é um

exemplo simples onde a caixa de quantização (yk-1,yk+ = (k – ½, k +½ + e tem tamanho 1 onde

xk =k para qualquer k∈Z.


Quantização Vetorial

Esse tipo de quantificação seleciona um conjunto de elementos representativos das

entradas, mapeando os pontos desse conjunto no espaço para o representante mais próximo.

Os elementos representantes são selecionados implementando-se um algoritmo de

agrupamento. Esse algoritmo procura um número de pontos nos dados e seleciona um dos

pontos (pixel) do grupo para ser o representante. Por exemplo, pode-se selecionar alguma

forma de centróide do grupo. A idéia principal da quantificação vetorial é dividir o espaço

vetorial em setores, cada um dos quais ser{ representado por um único vetor que pode ser o

centróide. O conjunto de centróides vem ser a o livro código (codebook) que define os níveis da

quantificação e a cada um deles atribui-se um endereço ou rótulo.

Um aspecto muito importante de qualquer esquema de quantificação vetorial é a

obtenção do livro código (codebook). O espaço vetorial deve ser dividido em setores. Para

tanto parte-se de vetores de treinamento. Esses vetores devem representar o espaço de

interesse. O livro código é obtido usando-se um algoritmo conhecido como LBG cujo nome é

derivado dos criadores Yoseph Linde, Andrés Buzo e Robert Gray.

No algoritmo LBG parte-se de um livro código inicial Â0, onde cada vetor do espaço é

comparado com cada componente do livro código. Compõe-se uma partição de distorção

mínima P(Âm) classificando cada vetor por meio da dist}ncia mínima com os vetores do livro

código. A soma das dist}ncias é comparada com o limite de distorção. Se essa soma é maior,

volta-se a calcular uma partição nova até que a dist}ncia total seja inferior ao limite.

A recursão é mostrada a seguir:

1. Seja Â0 o livro código, xj : j = 0,1,..,n-1 os vetores de treinamento. Define-se: m = 0 e

D-1=U.

2. Dado Âm = ,yi: i=1,...,N} , onde N = número de níveis de quantização.

Achar a partição da distorção mínima Âm = ,yi: i = 1...,N} , onde yi é o i-ésimo setor. O

valor xj corresponde a yi se d(xj, yi) £ d(xj, yl) para todo l. Calcula-se a distorção média:


𝐷𝑚 𝐷 (��𝑚 (��𝑚))

𝑛∑ 𝑑(𝑥 𝑦) 𝑦 ∈ 𝐴𝑚

𝑛 (3.11)

3. Âm ser{ o livro código final, onde Є é o limite de distorção, se satisfaz:

𝐷𝑚 𝐷𝑚

𝐷𝑚 ∈ (3.12)

4. Se a relação acima não for satisfeita, então se toma os centróides das {reas encontradas

como tentativas de componentes do novo livro código, denominado Â. Incrementa-se

m de um valor igual a 1 e se volta a recalcular até que o erro seja inferior ao limite de

distorção Є.

Uma parte do algoritmo compreende a obtenção do livro código inicial, que é calculado a

partir do espaço vetorial encontrando-se o seu centróide. Esse centróide ser{ o vetor inicial yi

a partir do qual obtém-se dois vetores novos yi + D e yi - D . Nesse ponto se começa a calcular

o livro código com o algoritmo LBG para dois vetores. Em seguida, se volta a fragmentar os

centróides em duas partes e se usa o algoritmo LBG para 4 vetores. Procede-se assim até se

obter o valor N que satisfaça os requisitos necess{rios. O valor de N geralmente é 64 ou 128.

Considerações

Uma quantização vetorial consiste em atribuir um código a um código específico. Isso

é feito para cada bloco ou vetor de pixels que constituem a imagem original. Usando

essa técnica, dado um bloco, a imagem é comparada a um conjunto dicionário de códigos.

Consequentemente, o código escolhido será aquele que minimiza a distância em relação ao

bloco original da imagem a ser codificada. Como resultado, a imagem pode ser armazenada

ou transmitida de forma muito simples usando-se um livro de códigos. Para reconstruir uma

imagem, o decodificador utiliza o codebook do qual tirou o código do dicionário apropriado

(Fig.3.10). Assim, o desempenho desse método depende do número de códigos contidos no

dicionário. Por outro lado, a complexidade em termos de code-search poderia aumentar

significativamente.


3.4 Compressão de imagens médicas baseada em DCT (Discrete Cosine Transform)

A introdução da transformada discreta cosseno DCT em 1974 [34] contribuiu de um

modo importante ao desenvolvimento da teoria de compressão de imagens. A DCT pode ser

considerada como uma versão em tempo discreto da série de cossenos de Fourier. A DCT

está relacionada, do mesmo modo que a transformada discreta de Fourier DFT (Discrete

Fourier Transform), a uma técnica para se expressar um sinal como uma soma de componentes

espectrais. A DCT pode ser calculada por meio de um algoritmo de transformada rápida de

Fourier FFT (Fast Fourier Transform) com uma complexidade de nlog2(n) operações. Em

oposição à DFT, a DCT é uma transformada real e de uma aproximação melhor para um sinal

com um número menor de coeficientes. A DCT de um sinal discreto x(n), n = 0, 1,..., N-1 é

definida por meio de:

𝑢 √

𝐶 𝑢 ∑ 𝑥 o

𝑛

𝑛 (3.13)

Code 3

Code M

Code 0

Code 1

Índice Imagem original

Imagem reconstruída

Code 3

Code M

Code 0

Code 1

Transmissão/armazenamento

Índice

Fig.3.11 – Esquema de quantização vetorial [Lv. 4].


𝐶 𝑢 {

√ 𝑢

𝑢 𝑁 (3.14)

Em [35] encontra-se a descrição das transformadas relacionadas com a DCT e suas

aplicações. Quando a DCT é considerada em duas dimensões para transformar um bloco de

tamanho N×N, a definição da mesma é dada por meio da expressão:

𝑢 𝑣

𝐶 𝑢 𝐶 𝑣 ∑ ∑ 𝑥 𝑚 o *

𝑛

+

𝑚 𝑛 o

(3.15)

𝐶 𝑣 {

√ 𝑣

𝑣 (3.16)

Nessas equações, tem-se x(n,m) e X(u, v) os blocos da entrada e os coeficientes

transformados, respectivamente. A escolha da DCT como técnica vi{vel para um

processamento de imagens digitais é baseada nas propriedades de descorrelação. A DCT

permite concentrar a energia nas frequências inferiores. Assim, essa transformada representa

de um modo eficiente a imagem, isto é, por meio de um número menor de coeficientes.

A propriedade de separabilidade da DCT 2D permite calcular a transformada de um

bloco de tamanho N×N por meio de sucessivas DCT unidimensionais de N pontos. Por meio

de algoritmos de complexidade computacional reduzida, foi possível desenvolver

arquiteturas VLSI (Very Large Scale Integration) eficientes para essa transformada. Em 1992 se

estabeleceu o padrão JPEG (Joint Photographic Experts Group), o primeiro padrão para

codificação de imagens digitais, onde os codificadores e os decodificadores são baseados em

DCT. O padrão JPEG especifica três modos para codificação com perdas: sequencial,

progressivo e hier{rquico, e um modo para codificação sem perdas.

O codificador básico que constitui o codificador sequencial em sua forma mais

simples é mostrado na Fig.3.12 O funcionamento do codificador está baseado no

processamento da imagem de um modo sequencial por blocos de 8×8 pontos.


Cada bloco é processado de um modo independente em cada um dos componentes do

codificador. A DCT é a chave para a compressão da imagem já que elimina a correlação

existente entre pixels adjacentes em uma imagem, concentrando a energia do sinal em

frequências espaciais baixas. Para um bloco típico de 8×8 pixels, a maioria dos componentes

em frequência tem amplitude nula ou quase nula e dessa forma, esses coeficientes de baixa

energia não precisam ser codificados. A DCT não introduz perdas na imagem; simplesmente

a transforma para outro domínio no qual se pode efetuar a codificação de um modo mais

eficiente. Depois de transformar o bloco para o domínio da frequência, cada um dos 64

coeficientes do bloco transformado é quantizado de forma uniforme de acordo com uma

tabela de quantização de 64 elementos [36].

No decodificador, as amostras de sinal são multiplicadas pelos fatores apropriados

para se recuperar os valores originais. Depois da quantização, o bloco de coeficientes

transformados é ordenado de acordo com uma sucessão conforme indicado na Fig.3.13.

Fig.3.12 – Codificador sequencial básico definido no padrão JPEG.

DCT Quantizador

Tabela de

quantização

Codificador

entrópico

Tabela de

Huffman

Imagem codificada

Blocos de 8x8 pontos

Imagem fonte


Essa ordenação d{ relev}ncia especial |s componentes não nulas de baixas

frequências sobre os coeficientes de frequências altas, facilitando a codificação de Huffman. A

Fig.3.12, mostra uma configuração denominada varredura "zig-zag", usada, por exemplo, nos

padrões MPEG2 e MPEG4. A componente de frequência nula concentra uma fração

significante da energia total da imagem e é codificada de modo diferencial. A componente na

frequência nula é denominada contínua DC (Direct Current). As demais componentes são

denominadas alternadas AC (Alternate Current). A fase de codificação entrópica EC (Entropy

Coding) alcança uma compressão melhor sem perdas codificando os coeficientes

estatisticamente.

O padrão JPEG especifica tanto os modos de codificação Huffman como a aritmética.

O codificador sequencial b{sico usa código de Huffman. No entanto, são especificados

codificadores com ambos os métodos para todos os modos de operação. A codificação

aritmética, é mais complexa que o código de Huffman, e normalmente alcança entre um 5% e

10% de melhoria na compressão.

3.5 Compressão Fractal

Compressão fractal é amplamente utilizada em imagens naturais. No entanto, a sua

utilização em imagens médicas ainda é bastante limitada *37+. As an{lises de comparação

utilizando curvas ROC (Receiver Operating Characteristic) mostram claramente que a qualidade

Fig.3.13 – Ordenação dos coeficientes transformados

antes da codificação de Huffman.


da imagem reconstruída para uma mesma taxa de compressão é menor para compressões

que usam fractal do que aquela obtida usando um método baseado na DCT (e.g. JPEG) ou

uma baseada na wavelet (e.g. JPEG2000). No entanto, usando-se métodos híbridos podem-se

ter algumas vantagens na qualidade, no tempo de transmissão e na quantidade de memória

necess{ria para armazenamento *38+.

Mas, em que consiste a codificação fractal? Consiste em representar os blocos de

imagem através de coeficientes de transformações contrativas, explorando o conceito de auto-

similaridade. Assim, nesse tipo de codificação, somente são enviados e armazenados os

coeficientes dessas transformações. Entre as vantagens da compressão fractal estão a r{pida

decodificação, transmissão progressiva, boa compressão e o fato de praticamente não

necessitar de codificadores entrópicos. Apesar das características vantajosas da compressão

fractal, o tempo exaustivo de processamento é a principal barreira na implementação.

3.5.1 Métodos de compressão fractais

Método IFS (Iterated Function Systems):

Utiliza aplicações contrativas, que são funções de transformação que ao se aplicar a

uma imagem, gera outra imagem de menor peso. A ideia básica consiste em passar essa cópia

da saída novamente pela copiadora, num processo recursivo (Fig.3.14). Após várias iterações

desse processo, todas as cópias de saída parecem convergir para a mesma imagem final,

mostrada na Fig.3.15.

Imagem de entrada Imagem de saída Fotocopiadora

Fig. 3.14- Exemplo do sistema de função iterativa [Lv. 24].


Essa imagem é chamada ‚atrator‛ para essa m{quina fotocopiadora específica. Logo,

a imagem inicial não afeta o atrator final. Apenas a posição e orientação das cópias

determinam como a imagem final se parecerá. Uma vez que a fotocopiadora reduz a imagem

de entrada, qualquer imagem inicial será reduzida a um ponto à medida que aumentam as

iterações.

Método PIFS (Partitions Iterated Function Systems):

Subdivide a imagem em uma partição e encontra para cada região resultante outra

parecida na imagem. Esse esquema é conhecido como funções iteradas locais ou

particionadas (transformada fractal). A ideia clave desse método é considerar uma imagem

formada por cópias de partes de si mesma. Na Fig. 3.16, as regiões R1 e R2 são similares

segundo uma transformação apropriada em ambas às imagens.

Fig. 3.16 – Exemplos de similaridade das regiões R1 e R2 [Lv. 24].

Fig. 3.15 – Primeiras 4 cópias geradas pela fotocopiadora [38].

fotocopoadora

. . . . . . .

Imagem original 1era iteração 2da iteração 3era iteração Iteração n

97

Capítulo 4

TW na compressão de imagens

transformada wavelet tem sido considerada uma técnica altamente eficiente na

compressão de imagens, tanto com perdas quanto sem perdas , com grande precisão. Esse

fato, permite seu uso em imagens médicas, processamento de sinais, visão computacional e

em outras aplicações [39][40]. As wavelets são funções definidas sobre um intervalo finito e

tem um valor médio zero. A codificação baseada em wavelet fornece melhorias substanciais

na qualidade de imagem em maiores taxas de compressão [41].

O padrão JPEG2000 define um novo esquema de codificação de imagem usando

técnicas de estado da arte de compressão baseada em tecnologia wavelet. A principal

vantagem do uso de wavelet é que suporta capacidade de transmissão progressiva útil

para telemedicina [42]. No caso de métodos de compressão tradicional para imagens DICOM,

é necessário que a imagem seja comprimida para a quantidade desejada antes da

transmissão. A eficácia e elegância da codificação de imagem embutida e baseada na wavelet

foram manifestadas por Shapiro, incorporadas na zerotree wavelet (EZW) [43].

Posteriormente, Said e Pearlman trabalham sobre a série de particionamento em

árvores hierárquicas (SPIHT) melhorando o EZW codificado. Assim, a wavelet é aplicada com

sucesso na compressão com perdas e sem perdas. O novo padrão JPEG2000 é baseado em um

esquema similar chamado codificação de bloco embutido com truncamento ideal EBCOT

(Embedded Block Coding with Optimal Truncation) [44].

A

98 Capítulo IV – TW NA COMPRESSÃO DE IMAGENS

4.1 Antecedentes

No processamento digital de imagens e sinais, as funções wavelet ajudam a resolver os

problemas. Um deles é a compressão de imagens, para facilitar a transmissão, codificação e

armazenamento. O fato de uma imagem de tamanho M linhas e N colunas possuir MxN

coeficientes wavelet, exatamente o mesmo número de pixels da imagem inicial, é utilizado

na compressão de imagens e é a base para o desenvolvimento de formatos de imagens, tais

como JPEG2000.

Em 1992, Mallat e Zhong detalham um algoritmo para reconstrução de sinais

unidimensionais e imagens a partir de seus pontos de variação de picos ou cristas.

Em 1992, Bertrand aplica a WT discreta para filtragem de perfis elétricos em sinais do

cérebro com a finalidade de melhorar a relação sinal ruído.

Em 1995, Nguyen explica a aplicabilidade de diferentes esquemas de filtragem baseados

em transformadas wavelet para comprimir imagens e eletrocardiogramas. No mesmo

ano, Stollnitz usa a wavelet Haar para compressão de imagens.

Em 2000, Xiong e Ramchandran usam um modelo da WT packet na compressão de

imagens pelo FBI (Federal Bureau of Information).

Em 2001, Larsen usa WT packet para codificar imagens em vários níveis e selecionar

as sub-bandas mais relevantes do conteúdo da informação. No mesmo ano, Perez aplica

a WT para fazer uma filtragem e eliminar o ruído em uma série de imagens médicas. Isso

é feito através da implementação de um algoritmo de cálculo que é baseado na

transformada wavelet com funções de base Haar.

Em 2004, Abrishami apresenta um método aperfeiçoado para reduzir o ruído gaussiano

(speckle) com base na WT. Para isso, transforma logaritmicamente as imagens e as

decompõe de acordo com o algoritmo de Mallat usando como wavelet mãe a função

laplaciana da gaussiana (LoG).

Capítulo IV – TW NA COMPRESSÃO DE IMAGENS 99

4.2 Wavelet

As funções wavelets, geralmente denotadas por ψ(t), são definidas como um conjunto

de funções originadas através das operações matem{ticas de translação e escalonamento da

função escala, com propriedades particulares que as tornam adequadas para servirem de

base para a decomposição de outras funções *45+. A função escala é uma função b{sica

definida em um espaço Vj, usualmente denotada por φ, tendo como funções b{sicas

associadas:

𝜑 𝑡 𝜑( 𝑡 ) (4.1)

Onde:

φ: função escala; i: deslocamento;

j: escala; t: tempo.

Para que uma função seja considerada uma wavelet, é preciso satisfazer as seguintes

condições básicas e necessárias:

1. Que ψ(t) Є L2 (R), isto é, que a função pertença ao espaço das funções do quadrado

integrável ou, o espaço das funções de energia finita, cumpra a equação (4.2):

∫ 𝑡 𝑑𝑡 <

(4.2)

2. Que sua transformada de Fourier 𝑊 satisfaça a condição de admissibilidade *46+*47+:

𝐶𝑣 ∫ 𝜓 𝑤

𝑤 𝑑𝑤 <

(4.3)

Segue da condição de admissibilidade que:

im𝑤 𝑤 (4.4)


Assim, se:

𝑊 é continua, então:

, ou seja:

∫ 𝑡 𝑑𝑡

(4.5)

Geometricamente, a condição (4.3) estabelece que o gráfico de 𝑡 deve oscilar de

modo a cancelar as áreas negativas a fim de anular a integral (4.5). Portanto, o gráfico de 𝑡

tem a forma de onda, conforme se ilustra na Fig.4.1 (b). Desde que 𝑡 esteja bem localizado

no tempo, o decaimento será muito rápido, formando uma onda de curta duração.

Atualmente, existem inúmeras funções wavelets que geralmente recebem o nome de

seus criadores. As mais conhecidas, são citadas a seguir, começando pelo exemplo mais

simples, proposto em 1909, pelo matemático Húngaro Alfred Haar (HAAR, 1910). A wavelet

de Haar mostra as grandezas que envolvem os valores, de forma não contínua. De fato,

considere-se desse modo, um caso particular da transformada wavelet discreta definida por:

𝑡 𝑡 𝑡 (4.6)

Por meio da equação (4.6), pode-se obter 𝑡 , apresentada na Fig.4.1 (b).

𝑡 , 𝑎𝑟𝑎 𝑡 < 𝑎𝑠 𝑡𝑟á𝑟

(4.7)

𝑡 {

𝑠 𝑡

𝑠

< 𝑡

𝑎𝑠 𝑡𝑟á𝑟

(4.8)


Outra função é a wavelet de Morlet, introduzida por Jean Morlet. Essa função pertence

à família das wavelets não-ortogonais. As wavelets de Morlet não possuem função escala e são

explicadas por uma gaussiana modulada (shifted), levemente ajustada. De forma que

, conforme a equação (4.9), cujo gráfico é apresentado na Fig.4.2:

𝑡 𝐶

⁄ o 5𝑡 (4.9)

Daubechies propôs um procedimento de partida para a construção das bases

ortonormais, ao invés de construir a wavelet e a função de escala através de um subespaço Vj.

Fig.4.1 – a) Função escala de Haar; b) Função wavelet de Haar.

a) b)

Fig.4.2 – Função wavelet de Morlet [92].


O procedimento parte de coeficientes apropriados e então investiga se eles correspondem a

uma base de wavelet ortonormal. Esses coeficientes representam um conjunto particular de

números gerados por filtros. Em 1987 as bases ortonormais de wavelets foram consideradas

como funções de suporte compacto contidas no intervalo [0, 2r +1].

Quanto maior o número de coeficientes, mais suave será a wavelet. A construção de

Daubechies resulta em uma coleção de coeficientes Nhn, sendo:

N = 2,3,4, ... e 0 ≤ n < 2N-1;

A seguir apresenta-se um exemplo da wavelet mais simples de Daubechies, a DauB4,

gerada a partir de quatro coeficientes [48].

√

4√

√

4√

√

4√

√

4√ (4.10)

A partir desses coeficientes pode-se construir a função escala:

𝑡 √ ∑ 𝑡 (4.11)

e calcular gn :

√

4√ √

4√ √

4√

√

4√ (4.12)

Assim, a wavelet de Daubechies é dada por:

𝑡 √ ∑ 𝑡 (4.13)

Yves Meyer, em 1980 construiu a primeira wavelet trivial diferente da wavelet de Haar,

que é continuamente diferenciável, o que limita suas aplicações [49]. Dessa forma, uma base


wavelet suave ortonormal foi criada. Primeiro, definiu-se a transformada de Fourier 𝑡 de

uma função escala φ(t) como :

𝑡

{

𝑠 𝑡

o *

𝑣 (

4 𝑡 )+ 𝑠

𝑡

4

𝑠 𝑡 > 4

(4.14)

Onde:

𝑣 𝑎 𝑎4 35 84𝑎 7 𝑎 𝑎 𝑎 ∈ (4.15)

Desse modo, a função wavelet 𝝍(t) pode ser encontrada facilmente através de 𝑡 .

𝑡

{

in

𝑣 (

𝑡 ) 𝑠

𝑤

4

𝑡

o *

𝑣 (

4 𝑤 )+ 𝑠

4

𝑤

𝑎𝑠 𝑡𝑟𝑎𝑟

(4.16)

4.3 Transformada wavelet

A transformada wavelet é um método para a localização de frequência completa de um

sinal. No entanto, os sinais mudam ao longo do tempo ou espaço. Por exemplo, um

Fig. 4.3 – a) Função escala de Meyer; b) Função wavelet de Meyer [92].

a) b)


eletrocardiograma muda de sinal sobre um marcador de tempo com relação a eventos de

pulsação. Da mesma forma, no contexto de imagens 2D e 3D, um sinal ou uma propriedade

representados pela imagem (como o fluxo de sangue) pode mudar ao longo dos pontos

amostrados no espaço. A principal vantagem da transformada wavelet é sua capacidade de

realizar a análise de multiresolução para localização de eventos em relação a todos os

componentes de frequência de dados ao longo do tempo ou espaço. Assim, a análise

wavelet é capaz de revelar aspectos de dados que outras técnicas de análise de sinal

erram, como o colapso de pontos, e descontinuidades em derivativos de maior ordem.

A teoria da transformada wavelet utiliza dois conceitos principais: escala e deslocamento.

Escala: por meio de dilatação ou compressão, fornece a capacidade de analisar um sinal

sobre janelas diferentes (períodos de amostragem) nos dados.

Deslocamento: através do atraso ou avanço, fornece a tradução do wavelet kernel sobre o

sinal todo.

Em termos gerais, a transformada wavelet de uma função f(t) é a decomposição de f(t) em um

conjunto de funções ψs, τ(t), que formam uma base e são chamadas de "wavelets". A

transformada wavelet é definida como:

𝑊 𝑠 ∫ 𝑡 𝑡 𝑑𝑡 (4.17)

As wavelets são geradas a partir do deslocamento e mudança de escala de uma mesma função

wavelet ψ(t), chamada de "wavelet mãe" e é definida como:

𝑡

√

(4.18)

Onde: S é o fator de escala e,

τ é o fator de deslocamento.

As wavelets ψs, τ(t) geradas a partir da mesma função wavelet mãe ψ(t) têm diferentes

escalas S e localizações τ, mas todas têm a mesma forma. Sempre são usados fatores de


escala S> 0. As wavelets são dilatadas quando a escala S > 1, e são contraídas quando

S<1. Assim, alterando o valor de S cobrem-se faixas de frequências deferentes. Valores

grandes do parâmetro S correspondem a frequências de faixa mais baixa, ou uma escala

muito pequena de ψs,τ(t)[50].

4.4 Aplicação no processamento de imagens biomédicas

O uso da transformada wavelet (TW) na {rea de processamento de imagens apresenta

características que se encaixam nas técnicas propostas pela TW. Elas têm sido o foco principal

de pesquisas devido | grande quantidade de informações a serem armazenadas, transmitidas

e manuseadas por parte de usu{rios de computadores *51+. Como as imagens são

representadas como sinais bidimensionais, o seu processamento por meio da transformada

wavelet não é tarefa difícil. Para isso, basta a aplicação da transformada wavelet bidimensional

na matriz que representa a imagem *52+.

A ferramenta matem{tica que faz com que a TW seja um instrumento potente na {rea

de processamento de imagens é a an{lise de multirresolução *53+. Essa an{lise permite que

uma imagem seja decomposta em v{rios níveis de resolução *54+, evidenciando seus detalhes

em cada um desses níveis *55+. É como se aplicasse um ‚zoom‛ na imagem fazendo com que

em uma an{lise de grande escala os pequenos detalhes sejam caracterizados em uma escala

menor. Ao final do processo a caracterização das formas é um conjunto de dados extraídos

em diferentes escalas.

Em outras palavras, as wavelets com o auxílio da an{lise de multiressolução

decompõem a imagem em uma combinação linear de versões transladadas da wavelet mãe em

diferentes escalas. Por exemplo, bordas que são classificadas com uma das características

mais importantes em uma imagem. Esse fato, torna o uso da TW muito útil no processamento

de imagens biomédicas *56+. Outra aplicação útil da transformada wavelet no processamento

de imagens é a compressão que se baseia na eliminação de coeficientes redundantes da

imagem no domínio wavelet *57+, visando reduzir a quantidade de dados desnecess{rios para


representar uma imagem digital. A escolha da wavelet para esse tipo de problema depende

muito do que se deseja resolver.

No caso de compressão, ao escolher uma wavelet que melhor se adapta aos dados, os

coeficientes menores do valor previamente estabelecido devem ser truncados. É também

representada por uma codificação esparsa. Dessa forma, a TW é uma excelente ferramenta no

campo de compressão de imagens. Cerca de uma década atr{s, as técnicas baseadas na

transformada wavelet, como a compressão de imagens no sistema JPEG2000, tornou-se uma

tecnologia muito apropriada *51+. O uso da TW, em compressão de imagens, visa representar

uma imagem com o menor número de bits possível. Para isso é preciso reduzir a correlação

existente entre os pixels, concentrando a maior quantidade de informação possível em um

número menor de coeficientes.

Uma imagem comprimida por meio da TW ocupa menos espaço em armazenamento,

otimizando dessa forma, o espaço. Posteriormente, a imagem processada é descompactada a

fim de se obter a imagem original ou uma aproximação da mesma [52]. A escolha, do uso da

transformada wavelet no sistema de compressão é devida à característica da TW apresentar a

capacidade de concentrar informações relevantes em um número de coeficientes menor do

que o originalmente calculado. Além disso, é também flexível com relação à duração e

posição das funções bases, permitindo uma boa representação por um número reduzido de

funções.

4.5 Compressão de imagens utilizando TW

Uma das aplicações da transformada wavelet que tem apresentado um grande sucesso

é a compressão de imagens [58][59][60][61]. Além de apresentar uma grande capacidade de

concentração de energia, a transformada wavelet possui uma forte relação com o sistema

visual humano, o que permite obter uma alta taxa de compressão (bpp) com menores níveis

visíveis de degradação. Uma das propriedades mais atrativas dessa transformada é a sua

flexibilidade com relação à duração das wavelets, o que permite que sinais com conteúdo de


frequência variado, possam ser bem representados com um número reduzido de funções.

Além disso, a utilização da transformada wavelets diminui sensivelmente o efeito de

blocagem, que é um dos principais problemas do JPEG. As wavelets mais longas podem ser

utilizadas para representar por exemplo, as regiões planas de uma imagem (baixa

frequência), enquanto que as wavelets mais estreitas são utilizadas para representar as regiões

de textura (alta frequência) [62][63].

4.6 A transformada wavelet discreta (DWT)

A equação (4.19) define a TWC:

𝑥 𝑡

∫ ∫ {(𝑊𝜓𝑥) 𝑎 }

√

(4.19)

Onde:

ψ: função wavelet

a: parâmetro de escala

b: parâmetro de translação

Depara-se com a presença de redundâncias, pois os parâmetros a e b variam

continuamente. Esse problema é contornado por meio de discretização de a e b. Esse processo

origina a transformada wavelet discreta TWD. De acordo com a literatura [64], uma

discretização típica é do tipo:

𝑎 𝑎

𝑎

Com j, k ϵ Z, a0 > 1 e b0 >0.

A wavelet discreta pode-se escrever como:

𝑡 𝑎

𝑎 𝑡 (4.20)

Desse modo, tem-se a transformada wavelet discreta direta e inversa respectivamente:


𝑊 𝑑 ⟨ 𝑡 𝑡 ⟩ ∫ 𝑡 𝑡 𝑑𝑡 (4.21)

𝑡 ∑ ∑ 𝑡 𝑑

(4.22)

Dessas equações observa-se que:

(1) A TWD é definida apenas para valores de escalas positivos (a0 > 1);

(2) O passo da translação é proporcional à escala 𝑎

;

(3) A TWD produz um conjunto finito de coeficientes wavelet 𝑊𝜓𝑥 ;

(4) O processamento é realizado sobre tempo contínuo.

4.7 Transformada wavelet rápida (FWT)

A transformada wavelet rápida FWT (Fast Wavelet Transform) é uma implementação

computacional eficiente da transformada wavelet discreta que aproveita a relação entre os

coeficientes da DWT e escalas adjacentes. As expressões associadas são da seguinte forma:

𝑊𝜓 ∑ 𝜓 𝑚 𝑊 𝑚 𝑚 (4.23)

𝑊 ∑ 𝑚 𝑊 𝑚 𝑚 (4.24)

Essas equações, também podem ser expressas mediante a operação linear de

convolução, com os coeficientes wavelet e de escalamento, revertidos no tempo, e pode

ser escrito como:

𝑊𝜓 𝜓 𝑊 𝑛 (4.25)

𝑊 𝑊 𝑛 (4.26)


Onde as convoluções são avaliadas em instantes n = 2k para k ≥ 0. A Fig.4.1 reduz

essas operações, para a forma de diagrama de blocos.

O banco de filtros da Fig.4.4 pode ser usado iterativamente para criar

estruturas multietapas que permitam calcular os coeficientes da DWT em duas ou

mais etapas sucessivas. A transformação inversa, chamada FWT-1 ou a síntese, pode ser

alcançada com a mesma metodologia dos filtros, mas dessa vez não invertidos no

tempo. Esse processo é mostrado na Fig.4.5. Como antes, se a transformação direta tem mais

de duas etapas, então a transformação inversa também às terá.

4.8 Transformada wavelet em duas dimensões

Ao se trabalhar com imagens, e se deseja aplicar uma TW, é necessário trabalhar no

espaço L2, porque as imagens são sinais bidimensionais. Considera-se então uma

aproximação separável, ou seja, separam-se as funções wavelet e de escala, como se segue [5]:

h𝝍(-n) 2 ↓

h𝝋(-n) 2 ↓

W𝝍(j,n)

W𝝋 (j,n)

W𝝋 (j,n)

Fig.4.4 – Banco de filtro de análises da FWT [Lv 12].

W𝝋 (j,n)

W𝝍(j,n) h𝝍(n) 2 ↑

h𝝋(n) 2 ↑

W𝝋 (j+1,n)

Fig.4.5– Banco de filtro de sínteses da FWT-1 [Lv. 12].


• A função de escala, 𝜑 𝑥 𝑦 ;

• E três wavelets bidimensionais, 𝐻 𝑥 𝑦 𝑉 𝑥 𝑦 𝐷 𝑥 𝑦

Cada uma delas é o produto da função de escala 𝝋 unidimensional e a

correspondente wavelet 𝝍. Excluindo-se os produtos unidimensionais que são produzidos, os

quatro produtos que permanecem são:

• Uma função de escala separável

𝜑 𝑥 𝑦 𝜑 𝑥 𝜑 𝑦 (4.27)

• E as wavelets separáveis

𝐻 𝑥 𝑦 𝑥 𝜑 𝑦 (4.28)

𝑉 𝑥 𝑦 𝜑 𝑥 𝑦 (4.29)

𝐷 𝑥 𝑦 𝑥 𝑦 (4.30)

Essas wavelets medem as mudanças da intensidade ou nível de cinza. 𝐻, mede as

variações ao longo das colunas; 𝑉 ao longo das linhas verticais e 𝐷 as variações diagonais.

Definindo-se as funções como funções separáveis, é mais fácil analisar a função 2D e

pode-se centrar na implementação de wavelet 1D e nas funções de dimensionamento. As

equações de análise e síntese são modificadas para:

𝑊 𝑚

√ ∑ ∑ 𝑥 𝑦 𝜑 𝑚 𝑛

𝑦

𝑥 𝑥 𝑦 (4.31)

𝑊𝜓 𝑚

√ ∑ ∑ 𝑥 𝑦 𝑚 𝑛

𝑥 𝑦 𝐷 𝑦

𝑥 (4.32)

𝑥 𝑦

√ 𝑁∑∑𝑊 𝑚

𝑛𝑚

𝜑 𝑚 𝑛 𝑥 𝑦

√ ∑ ∑ ∑ ∑ 𝑊𝜓

𝑚 𝑚 𝑛 𝑥 𝑦 𝑛𝑚

𝐷 𝐻 𝑉 𝐷 (4.33)


Essa é a forma geral de uma transformada wavelet 2D. Se as funções de escala e a

wavelet são separáveis, então a soma pode ser decomposta em dois estágios. O primeiro passo

é ao longo do eixo-x, e em seguida se calcula ao longo do eixo-y. Para cada eixo, pode-se

aplicar uma transformada wavelet rápida para acelerar a velocidade. O diagrama é mostrado

na Fig.4.7b. O sinal bidimensional (por exemplo correspondente a uma imagem) é dividido

em quatro bandas: LL (esquerdo-superior), HL (direito-superior), LH (esquerdo-superior)

a) b)

Fig.4.7 – a) Imagem original Lena; b) Imagem Lena depois da decomposição [10].

h[n]

g[n]

x[m,n]

along n

along n along m

along m

X1,L[m,n]

↓ ↓

V1,L[m,n]

L [m,n] X1, H1 [m,n]

h[m] ↓

g[m]

Fig.4.6 – Diagrama esquemático da transformada wavelet 2D [Lv. 12].

along m

along m

↓

↓

V1,H [m,n]

X1, H3[m,n]

h[m] ↓

g[m]

X1, H2[m,n]


e HH (direito-baixo). A banda HL indica a variação ao longo do eixo x, enquanto a

banda LH mostra a variação do eixo-y. A Fig. 4.7b, mostra a decomposição de uma

imagem. A banda LL é mais compacta. Por outro lado, no ponto de codificação, podem-se

gastar mais bits.

4.9 Propriedades wavelets

Em compressão de imagens existem algumas propriedades importantes que foram

discutidas por vários autores [109], [110], [111]. As características wavelet correspondem às

propriedades do filtro no banco de filtros. A Tabela (4.1) apresenta as propriedades de alguns

filtros.

Propriedades

Wavelets Po Longitude (A,S) Vo (A) Smax GDD

D4A 0 8,8 4 1,77 4,46

D4LA 0 8,8 4 1,77 0,46

D5A 0 10,1 5 2,1 8,05

D5LA 0 10,1 5 2,1 0,11

D6A 0 12,12 6 2,39 12,73

D6LA 0 12,12 6 2,39 0,48

D7A 0 14,14 7 2,66 18,50

D7LA 0 14,14 7 2,66 1,97

D8A 0 16,16 8 2,91 25,38

D8LA 0 16,16 8 2,91 0,50

D9A 0 18,18 9 3,16 33,45

D9LA 0 18,18 9 3,16 0,48

D10A 0 20,2 10 3,40 42,56

D10LA 0 20,2 10 3,40 0,53

B9/7 0,015 9,7 4 2,12 0

B22/14 0,011 22,14 5 3,16 0

Tabela 4.1-Propriedades de algumas wavelets.


Ortogonalidade: os filtros ortogonais conduzem a funções base wavelet ortogonais.

Portanto, o resultado da transformada wavelet é a conservação da energia. Isso implica

que o erro quadrático médio MSE (Mean Square Error) introduzido durante a quantização

dos coeficientes DWT é igual ao MSE no sinal reconstruído. Para bancos de filtros

ortogonais, os filtros de síntese são transpostos aos filtros de análises. No caso de wavelets

bi ortogonais, as funções base não são ortogonais e assim não há conservação da energia.

Para medir o desvio wavelet de ortonormalidade se faz uso do parâmetro de

ortogonalidade (Po), dado pela equação:

∫ 𝑤 𝑑𝑤

(4.34)

Onde: O(w) é a resposta em frequência ao filtro passa tudo definido por:

O(z) = H(z)H(z-1) + G(z)G(z-1) (H e G são respectivamente, as transformadas Z dos filtros

de análises passa baixas e passa altas).

Longitude dos filtros: os filtros mais longos são responsáveis pelo ruído ressonante na

imagem reconstruída a baixas taxas de bits. Na Tabela 4.1 as wavelets D8A – D10A, D8LA –

D10LA, B22/14 , têm filtros de síntese de longitude mais longos, enquanto que D4A – D6A, D4LA

– D6LA, B9/7, têm filtros de síntese mais curtos.

Ordem de desvanecimento (Vo): é uma medida da propriedade de compactação das

wavelets [112]. Corresponde ao número de zeros (k) em w = π para H(w). Um Vo de k

permite que as entradas polinomiais l,..., tk-1 sejam conservadas pelos filtros passa baixas

de análise e aniquilados pelos filtros passa altas de síntese.

∫ 𝑡 𝑡 𝑑𝑡

(4.35)

No caso de wavelets ortogonais, a função wavelet de análise é a mesma que a função

wavelet de síntese (ϕψ(t) = ψ(t)). Nas wavelets bi ortogonais, a função wavelet de análise


(ϕψ(t) é diferente da wavelet de síntese ψ(t)). Pode-se observar na Tabela 4.1 que as

wavelets mais longas têm um Vo mais alto que as wavelets mais curtas.

Regularidade: corresponde a uma forma de medir a suavidade nos sinais. Um alto grau

de regularidade indica suavidade na vizinhança do ponto onde se calcula. Uma primeira

forma de medir a regularidade consiste em verificar a existência de suas derivadas até

ordem k. A suavidade da função de escalonamento de síntese é medida pela expressão

Smax e corresponde ao número de derivadas de ϕ(t). A relação assintótica entre Smax e

Vo(p) para filtros de Daubechies é mostrada na equação (4.34). Na Tabela 4.1 se observa

que Smax é incrementada conforme se incrementa Vo.

𝑚á𝑥 75 (4.36)

Onde:

c é uma constante.

Suporte compacto: O suporte de uma função x(t), corresponde a todos os valores do

intervalo de tempo, tal que supp (x) = ,tєR : x(t) ≠ 0 }. Uma função possui suporte finito se

existem dois números {tmín, tmáx}є R, tal que:

𝑠𝑢 𝑥 𝑡𝑚í𝑛 𝑡𝑚á𝑥 (4,37)

Se o suporte é finito {tmáx - tmín} < ∞, então se denomina suporte compacto. O

suporte compacto das funções wavelets facilita a representação localizada dos

sinais por meio da TW, o qual é importante em aplicações tais como, compressão,

detecção de sinais e redução de ruído.


4.10 Propriedades wavelet no contexto de aplicações biomédicas

As principais características das wavelets na área da biomedicina são as seguintes:

Wavelets como um banco de filtros: A transformada wavelet pode ser vista como um

tipo especial de analisador de espectro. As mais simples características globais podem ser

extraídas desse tipo de sistema que são estimativas de energia em várias bandas de

frequência. Características espectrais desse tipo têm sido utilizadas para discriminação

entre vários estados fisiológicos.

Outra aplicação comum de ‚wavelet como um filterbank‛ é a redução de ruído

pelo encolhimento seletivo de coeficientes de certas frequências de bandas. Dois

exemplos são: (1) a análise do som do coração turbulento para detectar a doença arterial

coronariana [65] e; (2) a caracterização de estados de atividade electrocortical fetal [66].

Se as funções de transferência dos filtros discretos associados com um canal m

redundante de decomposição wavelet diádica são denotados por G1(w),...,Gm-1(w),

Hm(w), onde : 𝑤 𝑤 e Hm(w) são filtros passa-baixas, então é possível obter

um algoritmo de reconstrução. Se os filtros de síntese na Fig.4.8 são escolhidos de tal

forma que:

𝑚 𝑤 𝑚 𝑤 ∑ 𝑤 𝑤 𝑚 (4.38)

E se a wavelet 𝝍(x) é derivada de uma análise multiresolução, então o correspondente

filterbank pode ser implementado usando uma versão adaptada ("a trous") do algoritmo

rápido de Mallat sem sub-amostragem [67], [68]. Esse tipo de decomposição wavelet

reversível pode ser a base para uma implementação de redução de ruído e algoritmos de

melhoria de imagem.

O princípio é inserir um componente adicional de processamento, que seletivamente

modifica as componentes wavelet antes da reconstrução.

Essa abordagem tem sido adaptada para redução de ruído em imagens MRI e CT.


Wavelets como um filtro multiescala combinado: em essência, a CWT realiza uma

análise de correlação de modo que sua saída seja máxima quando o sinal de entrada se

assemelha ao modelo de análise ψs,t. Esse princípio é a base para o filtro combinado, que

é o detector ideal de um sinal determinístico na presença de ruído aditivo. Essa

propriedade tem sido explorada, por exemplo, na detecção de certos sinais ‚waveform‛ de

eletroencefalograma EEG (Electroencephalography) . No entanto, as wavelets base não são

Fig.4.9-Resposta da frequência multibanda do filterbank discreto

associado com a wavelet Battle-Lemarie spline cúbica.

Fig.4.8-Wavelets como um banco de filtros. Reconstrução

do filterbank discreto sem subamostragem.

G3(w)

G2(w)

G1(w)

Hm(w)

C1(k)

C2(k)

C3(k)

Cm(k)

f(k)

�� w

()()(w

�� w

(w)

�� w

��𝑚 w

(w)

f(k) +


bem adaptadas para representar funções cuja transformada de Fourier têm um

suporte bom de altas frequências.

Bases wavelets: o aspecto mais notável da teoria wavelet é o de construir bases

wavelets de L2. Assim, as wavelets fornecem uma representação uma a uma do sinal em

termos de seus coeficientes (transformação linear reversível). A compressão de dados,

assim como a eliminação do ruído pode ser conseguida por meio de quantização e

contração no domínio wavelet, ou descartando-se os coeficientes que sejam

insignificantes.

4.11 Aplicações à tomografia assistida por computador (CAT)

O problema da tomografia computadorizada CAT (Computed Axial Tomography) 2-D é

reconstruir um objeto 𝑥 𝑥 𝑥 𝑥 ∈ a partir dos valores medidos de suas projeções

angulares. Essas medições são descritas pela transformada Radon da imagem f que fornece

as integrais de linha de f ao longo da direção especificada pelo ângulo θ [Fig. 4.7(a)].

𝑡 ∫ 𝑡 𝑠 𝑢𝑠 𝑡𝑠 𝑢 𝑠 𝑑𝑢

(4.39)

No caso ideal em que as variáveis x, t, e θ são definidos de forma contínua, a fórmula

de inversão é fornecida pela identidade de retroprojeção filtrada (FBP) [69],[70].

𝑞 (4.40)

Isso é válido para qualquer função em L2(R2). O operador K na equação

4.40 representa a parte filtrada da fórmula, em que cada projeção é convolucionada com um

filtro q cuja transformada de Fourier é:

�� 𝑤 𝑤 (4.41)


O operador adjunto R* é a retroprojeção:

𝑥

∫ 𝑥 𝑠 𝑥 𝑠 𝑑

(4.42)

Calcula-se a média angular de toda projeção originada pelo ponto x, ou seja, os valores de

projeção (filtrados) 𝑡 𝑞 𝑡 com 𝑡 𝑥 𝑠 𝑥 𝑠 e . Ver Fig.

4.7(b). A fórmula de FBP (Filtro Passa Baixas) contínua (equação 4.38) é equivalente

ao teorema da fatia central, que afirma que a transformada de Fourier 1-D de 𝑡 é a linha

através da transformada de Fourier 2-D de f. A principal motivação da utilização de

wavelets para tomografia é o efeito de localização espacial do filtro �� 𝑤 , que é devido a

sua singularidade em w = 0. Esse efeito é atenuado pelos zeros correspondentes das

funções wavelet [71]. A mais simples aproximação para se obter uma reconstrução

wavelet de f é avaliar os coeficientes wavelets 2-D de f usando diretamente a equação 4.37. Para

a) b)

Fig.4.10-Operadores de tomografia básica. a) A projeção tomográfica 𝑅𝜃𝑓 𝑡 é a coleção de

integrais de raios paralelos através do objeto f na direção especificada por θ; a

transformada Radon é o conjunto de todas as projeções angulares para 𝜃𝜖 𝜋

b) O operador de retroprojeção fornece um mapeamento reverso do domínio Radon que

volta ao domínio objeto. Especificamente, (R*p) (x) representa a média angular de toda

projeção P(t,θ) originada pelo ponto x.

t Rθf(t)

θ

x

y

P(t, θ = π/2)

(R*p) (x1, x2)

P(t, θ)


esse fim, primeiro convoluciona-se f com a função de análise 2-D 𝜑 𝑥 𝑎

𝜑 𝑥 𝑎 e

reescreve-se a identidade FBP para esse sinal pré-filtrado.

𝜑 𝜑 𝜑

𝑞 (4.43)

Onde, no lado direito, tem-se combinado a transformada Radon da função análise 2-D

com q dentro de um filtro modificado (ângulo-dependente).

𝑞 𝑡 𝑞 𝜑 𝑡 (4.44)

Note-se que no caso wavelet, pode-se calcular o produto interno (wavelets ou

coeficientes spline) usando-se um esquema modificado FBP.

𝑎 ⟨ 𝑥 𝜑 𝑥

𝑎 ⟩

𝑞 𝑥 𝑥 (4.45)

Essa abordagem foi pela primeira vez proposta para reconstrução tomográfica de escala fixa.

4.12 Seleção efetiva das características wavelet

Uma pergunta importante quando se usa a transformada wavelet para compressão de

imagens é, como as características das wavelets associadas com o banco de filtros estão

relacionadas ao desempenho do sistema de compressão de imagens [Ts 5]. Antonini propõe

que um banco de filtros onde a wavelet de análise tem um grande número de momentos de

desvanecimento e a wavelet de síntese tem um alto grau de regularidade, trabalham bem em

compressão de imagens.


4.12.1 Seleção da função wavelet

Em aplicações de compressão de imagens, as propriedades importantes das funções

wavelets dão suporte compacto (permitem uma implementação eficiente), simetria (útil para

evitar deslocamentos ou defasagens no processamento da imagem), regularidade e grau de

suavidade (relacionado à ordem ou longitude dos filtros).

Em [106], analisam-se 4 tipos de famílias de wavelets: HW (Haar Wavelets), DW

(Daubechies Wavelets), CW (Coiflet Wavelets), e BW (Biorthogonals Wavelets). Cada família

wavelet pode ser parametrizada por um inteiro N que determina a ordem do filtro.

As wavelets bi ortogonais podem usar filtros com similar ou diferente ordem para

decomposição (Nd) e reconstrução (Nr). As Daubechies e Coiflet são famílias de wavelets de

suporte compacto. As wavelets de suporte compacto correspondem a filtros de resposta ao

impulso finita FIR (Finite Impulse Response) e, assim permitem uma implementação eficiente.

A principal desvantagem da DW e CW é a assimetria, a qual pode causar artefatos nas

bordas das sub-bandas wavelets. A DW é assimétrica enquanto a CW á quase simétrica. A

simetria nas wavelets pode ser obtida somente com a renúncia do suporte compacto, ou seja,

da ortogonalidade da wavelet (exceto a HW, a qual é ortogonal, de suporte compacto e

simétrico). Quando se deseja simetria e suporte compacto nas wavelets, deve-se relaxar a

condição de ortogonalidade e admitir funções wavelets não ortogonais, condição essa que

cumprem as wavelets bi ortogonais.

4.12.2 Ordem e longitude dos filtros

A longitude do filtro L é determinada pela ordem do filtro, mas a relação entre a

ordem do filtro e a longitude do filtro é diferente para diferentes famílias de wavelets [106]. A

longitude dos filtros é aproximadamente L = Max(2Nd, 2Nr) + 2. No entanto, a longitude

efetiva é diferente para um filtro tipo passa baixas e um passa altas usados para

decomposição e reconstrução e pode ser determinado para cada tipo de filtro. Os filtros com

uma alta ordem podem ser projetados para que tenham uma boa localização em frequência.


Filtros com baixa ordem têm uma melhor localização no tempo e conservam informação

importante nas bordas. A compressão de imagens baseada em wavelets prefere funções

suaves que podem ser obtidas usando-se filtros longos. Isso porque a complexidade do

cálculo da DWT aumenta pelo incremento da longitude dos filtros. Assim, em aplicações de

compressão de imagens deve-se encontrar um compromisso entre a longitude dos filtros,

grau de suavidade, e complexidade computacional.

4.12.3 Número de decomposições

A qualidade da imagem depende do número de decomposições (l). O número de

decomposições determina a resolução do mais baixo nível no domínio wavelet. A compressão

pode ser melhorada ignorando-se todos os coeficientes abaixo do limiar.

Por outro lado, um grande número de decomposições causa a perda da eficiência do

algoritmo de codificação. Dessa maneira, a decomposição adaptativa requer um

compromisso entre a qualidade da imagem e a complexidade computacional. O PSNR (Peak

Signal to Noise Ratio) tende a saturar para um número grande de decomposições [106]. Dessa

forma, o número ótimo de decomposições depende da ordem do filtro.

4.12.4 Complexidade computacional

A complexidade computacional da transformada wavelet para uma imagem de

tamanho NxN e que faz uso da decomposição di{dica é dada aproximadamente pela equa.

4.46 *106+:

𝐶 6𝑁 4 𝑙 3 (4.46)

Onde:

L é a longitude do filtro e,

l é o nível de decomposição wavelet.


4.13 Wavelets adequadas para a compressão

V{rios autores estudaram a adaptação de bases wavelets para compressão de imagens.

A partir da decomposição ortogonal teoricamente poder-se-ia guiar a correlação entre os

coeficientes da transformada.

A restrição de ortogonalidade conduz a graus de maior liberdade, os quais podem ser

explorados para melhorar outros critérios *72+. Em *73+, o estudo da resposta para o passo e o

impulso dos filtros conduziram | predição de bons e maus filtros. Como objetivo procurou-se

minimizar os efeitos ressonantes que frequentemente acontecem perto das bordas.

Shang aperfeiçoa o experimento numérico através de wavelets em *74+. Porém, essas

wavelets são também construídas usando-se outro critério baseado nas propriedades da

frequência dos filtros a fim de facilitar a otimização. Para evitar sobreajuste, v{rias imagens

são usadas como um grupo de teste, assim como para eliminar wavelets com generalização

pobre. Focalizando-se em um grupo de imagens, é possível ajustar a escolha da base wavelet.

Isso foi feito, por exemplo, pelo FBI para a compressão de imagens de impressões digitais

*75+. As transformadas wavelets originais são implementadas usando-se wavelets ortogonais,

quer dizer, usando-se filtros ortogonais.

Com os filtros ortogonais, a transformada wavelet pode ser vista como uma projeção

do sinal de entrada em um grupo de funções de base ortogonal *80+. Se os filtros estão

normalizados, então a transformada wavelet conserva a energia. Para um sinal de entrada x*n+

de longitude N, a propriedade de conservação da energia que é semelhante | relação de

Parseval pode ser vista como:

∑ 𝑥 ∑ 𝑤 𝐿 𝑙

𝑛 (4.47)

A propriedade de conservação da energia é conveniente para o projeto de sistemas de

compressão j{ que significa uma distorção quadr{tica que é introduzida pela quantificação

dos coeficientes. Isso corresponde | distorção quadr{tica no sinal reconstruído. Assim, a


propriedade de conservação da energia simplifica o projeto do compressor j{ que o projeto do

quantificador pode ser desenvolvido completamente no domínio da transformada.

A transformada wavelet ortogonal tem algumas inconveniências que a torna não muito

ideal para ser usada em um sistema de compressão. Uma das inconveniências pode ser vista

na equação (4.45), onde o número total de coeficientes de entrada N, não tem porque ser igual

ao número total de coeficientes da wavelet L.

Em geral, L é maior que N e a transformada wavelet aumenta o número de coeficientes.

De fato, considere-se um sinal de longitude N (par) e filtros wavelet de tamanho L (par). As

saídas dos filtros têm longitude L+N-1 *76+ e a saída após a subamostragem ter{ longitude (L

+ N) /2.

Dessa forma, o sinal original de longitude N d{ lugar a um total de L + N coeficientes

wavelets após um nível de transformação. Quando se aumenta o número de níveis de

decomposição o problema também aumenta. A expansão dos coeficientes é um problema

para os sistemas de codificação cujo objetivo é reduzir, não aumentar, a quantidade de

informação que seria codificada. Uma forma simples de eliminar a expansão de coeficientes é

usar convolução circular em vez de usar convolução linear no sinal finito de entrada x*n+.

Em resumo, as transformadas wavelets bi ortogonais tem a vantagem de poderem usar

filtros de fase linear, mas a desvantagem é que eles não conservam a energia.

125

Capítulo 5

Padrão DICOM

urante os últimos trinta anos tem havido um grande desenvolvimento da tecnologia

digital. Os computadores entraram em quase todos os aspectos de nossas vidas e tornaram-

se cada vez mais importantes em aplicações médicas. Muitos métodos de tratamento e

processamento de imagens médicas utilizados hoje, em sua maioria, dependem do

processamento em computadores. Esses são usados não só para armazenar ou exibir

imagens, mas também para gerar imagens ou modelos em 3D, partindo-se de um conjunto de

entrada de dados.

Os dados são obtidos a partir de dispositivos de imagem, por exemplo: CT,

MRI, SPECT, PET. Devido ao desenvolvimento de equipamentos de imagens médicas, é

muito importante definir um padrão para conexão e troca de informações entre aparelhos

médicos. É assim que surge DICOM (Digital Imaging and Communications in Medicine), que é o

formato padrão para transferência de imagens radiológicas e outras informações médicas

entre computadores. O sistema permite uma comunicação digital entre os equipamentos de

diagnóstico produzidos por vários fabricantes.

Por exemplo, as estações de trabalho, CT scanners, geradores de imagens MRI,

digitalizadores de filmes, arquivos compartilhados, computadores host e mainframes feitos por

v{rios fornecedores e localizado em um site ou em v{rios sites que podem ‚falar entre si‛ por

meio de DICOM através de um sistema aberto ‚open system‛ da rede.

D

126 Capítulo V – PADRÃO DICOM

Como resultado, tem-se:

• Transmissão, persistência, consulta e recuperação de objetos complexos. As imagens

médicas podem ser capturadas e transmitidas mais rapidamente;

• Execução de ações específicas. Os médicos podem fazer diagnósticos de forma mais

r{pida, e as decisões de tratamento podem ser feitas mais rapidamente;

• Qualidade e consistência na apresentação de imagens;

• Gestão de processos, diminuição dos custos ao se fazer o diagnóstico em outra

localidade.

O padrão DICOM 3.0 evolui a partir de versões 1.0 (1985) e 2.0 (1988) de um padrão

desenvolvido pelo ACR (American College of Radiology) e a NEMA (National Electrical

Manufacturers Association). A RNSA (Radiological Society of North America) começa a trabalhar

com a seção MedPacs ACR-NEMA ad hoc, em 1992. Devido | r{pida evolução das redes de

computadores e dos sistemas de comunicação, o padrão é reformulado. Adotam-se métodos

de orientação a objetos para o desenvolvimento da nova versão (PRIOR, 2001). Em 1995, o

DICOM é aceito como um padrão formal na Europa (OFFIS, 2001). Ele define, entre outras

coisas (OFFIS, 2001):

• Estrutura de dados para imagens médicas e informações relacionadas;

• Serviços relacionados | comunicação:

- Transmissão e persistência de objetos completos (como imagens);

- Consulta e recuperação de imagens em uma base de dados (PACS) e impressão.

• Formatos para armazenamento das informações;

• Qualidade e consistência da aparência da imagem (para visualização e impressão) *77+.

5.1 Definições

DICOM é o padrão mais importante e estendido comercialmente para a transferência

de imagens e informação médica entre dispositivos eletrônicos. Embora não seja um padrão

de compressão sobre imagens médicas, é imprescindível sua consideração na compressão.

Capítulo V – PADRÃO DICOM 127

DICOM permite aos usuários integrar uma equipe com dispositivos de diferentes fabricantes

para suportar um amplo intervalo de modalidades de imagens médicas evitando-se toda uma

série de problemas que poderiam se derivar de incompatibilidades entre dispositivos de

diferentes fabricantes [78].

Todos os equipamentos que estejam de acordo com o formato DICOM pode se

conectar com PACS para transportar e trocar informação com outros equipamentos,

diretamente. Esse padrão foi desenvolvido pela ACR (American College of Radiology) e NEMA

(National Electrical Manufacturers Association). A primeira dessas instituições, a ACR, tem sido

a responsável por proporcionar direção técnica e assessoramento médico ao padrão. A

NEMA tem atuado como entidade de publicação, assessoramento legal para evitar conflitos

de interesse ou possíveis violações no âmbito de trabalho do padrão.

5.2 Aspectos relevantes de DICOM

1) DICOM

• Est{ orientada a objetos usando um modelo entidade-relação;

• Cada entidade é identificada com uma classe. Cada inst}ncia é um objeto que é

definido por um conjunto de atributos.

2) Necessidade de DICOM

Armazenamento

• A imagem médica somente não faz sentido. É necess{rio ter os dados do paciente;

Os formatos de imagem TIFF (Tagged Image File Format) e JPEG (Joint Photographic

Experts Group) não cumprem as condições necess{rias;

• Um estúdio é uma unidade.

Comunicações

• Aumento do número de equipes que trabalham com imagens digitais;

• Comunicação de equipes heterogêneas entre si (modalidade - estações PACS);


• Necessidade de um protocolo comum de trabalho para todas as equipes:

- Formato comum de imagem;

- Di{logos normalizados entre equipes.

3) DICOM e cen{rios

Um profissional clínico usa sua estação de trabalho em seu escritório

• Recebe notificação da tomografia que foi realizada para um novo estudo;

• Procura estudos anteriores do mesmo paciente no arquivo;

• Os estudos são carregados para seu computador;

• Visualiza os estudos em conjunto, seleciona uma série de imagens e a imprime

sobre uma placa.

Um paciente chega ao serviço de radiologia

• O seu dado pessoal é obtido automaticamente do sistema de informação hospitalar;

• Os estudos de imagem que se necessita são introduzidos e carregados diretamente

para as equipes de aquisição apropriadas;

• Quando um paciente chega ao computador, automaticamente se sabe quais

imagens são necess{rias. Uma vez obtidas, todas as PACS / RIS é notificado o fim

da tarefa bem como a existência de novos estudos.

4) Objetivos de DICOM

• Formatar digitalmente uma imagem;

• Prover um protocolo de troca de dados;

• Prover uma estrutura de arquivos;

• Servir para imagens biomédicas e informações relacionadas com essas imagens.


Paciente IOD

Descritor de

estudo básico IOD

Vista IOD 1

1

1-n 1

Referências

Referências

Referências Descreve

1 1-n

Caixa VOI

LUT IOD

1

0-n

1

1-n

Fig.5.1 – Esquema (entidade-relação) da definição de DICOM.

Caixa de filme IOD

1

0-n

1-n Contém

Anotação IOD

Seção de filme IOD

Impressora IOD

Trabalho de

impressão IOD

1

1

0-1

1 0-n

1-n

Referências Impressões

É rastreado por

1-n

1

Referências Veja nota Referências

Referências

Resultados IOD

Interpretação

IOD

Imagem

IOD

Curva Independente

IOD

Envoltório Independente

IOD

VOI LUT IOD

Independente

Mod. LUT IOD

Independente

0-n

1

0-1

1-n

Composta por Estudo IOD Componente

de estudo IOD

1-n 1

Paciente IOD

Descritor de

estudo básico IOD

Vista IOD

1

1-n

1

1

1

Referências

1-n

Referências

Referências Descreve

0-n

0-n

0-n 0-n

1

Caixa de

sobreposição de

imagens IOD

Caixa de

imagens IOD

1-n

1-n

0-1

1-n 1-n 0-1

Referências

Referências Referências

Referências Referências


5) Capas de DICOM

6) Partes de DICOM

• Parte 1: Introdução e visão geral;

• Parte 2: Conformidade;

• Parte 3: Definições do objeto informação;

• Parte 4: Especificações de classe serviço;

• Parte 5: Estruturas de dados e codificação;

• Parte 6: Dicion{rio de dados;

• Parte 7: Interc}mbio de mensagens (operações da rede);

• Parte 8: Suporte de comunicação de rede para troca de mensagens;

• Parte 10: Armazenamento de mídia e formato arquivo para intercambio de dados;

• Parte 11: Perfis de aplicação de armazenamento de mídia;

• Parte 12: Formatos de mídia e mídia física para interc}mbio de mídia;

• Parte 14: Função display padrão de escala cinza;

• Parte 15: Segurança e perfis de gerenciamento do sistema;

OSI Sessão do Kernel

OSI Elemento de serviço de controle

de associação

Transporte OSI



de associação

Fig.5.2 – Esquema das capas de DICOM [Lv. 5].

Ambiente ponto a ponto

Ambiente de rede

DICOM - Troca de mensagens de aplicação

Aplicação de imagem médica

Padrão de camadas de rede física

(Ethernet, FDDI, etc.)

TCP

IP

DICOM

Protocolo da

camada superior

TCP/IP

DICOM

Seção/

Transporte/

Rede

(STN)

DICOM

Ligação de dados

DICOM

Físico(50-pin)

Rede OSI

LLC

Transporte OSI


OSI Apresentação Kernel


de associação


• Parte 16: Recurso de mapeamento de conteúdo;

• Parte 17: Informações explicativas;

• Parte 18: Acesso web a objetos DICOM persistentes WADO (Web Access to DICOM

Persistent Objects).

5.3 Imagens DICOM

Sob o formato do padrão DICOM não se define como as imagens são exibidas ou

anotadas. DICOM inclui estruturas de dados que são de importância para a imagem. Essas

estruturas são colocadas em um cabeçalho que contém a descrição do objeto, os dados do

paciente, nome da instituição e outras informações, como procedimentos realizados ou

relatórios. Os IODs (Information Object Definition) são tabelas de atributos que definem objetos

de informação. Os objetos de informação são modelos que são abstraídos de

versões de objetos do mundo real. Por exemplo, "paciente" é um objeto de informação

que tem "nome do paciente" e ‚número ID do paciente", entre outros atributos.

O padrão DICOM suporta diferentes tipos de imagens para diferentes aplicações

médicas assim como imagens multidimensionais (multiframe). A compressão de dados

depende amplamente de padrões de compressão tais como: JPEG (Joint Photographic Experts

Group), LJPEG (Lossless JPEG), JPEG 2000 (JPEG committee in 2000), ou MPEG-2 (Moving

Pictures Experts Group), essa última usada para uma sequência de imagem multivídeo. Por

outro lado, diferentes aplicações médicas requerem diferentes níveis de qualidade de

imagem. Por exemplo, as imagens de mamografia exigem uma resolução muito alta, assim a

compressão utilizada é principalmente lossless porque pequenos detalhes precisam ser

preservados.

5.4 Definições dos objetos de informação

O padrão DICOM especifica um número de classes de objetos de informação que

fornecem uma definição abstrata de entidades do mundo real aplicável à comunicação de


imagens médicas digitais e informação relacionada (por exemplo; relatórios estruturados,

dose de radioterapia). Cada definição de classe objeto de informação consiste de uma

descrição de sua finalidade e os atributos que a definem. Uma classe objeto de informação

não inclui os valores dos atributos que compõem a sua definição.

Existem dois tipos de classes objeto de informação: normalizado e composto.

Classe objeto de informação normalizado: é aquela que contém somente uma entidade

de informação IE (Information Entity). Por exemplo, classes de serviço SCs (Service Class)

que implementam funções de gerenciamento;

Classe objeto de informação composto: é aquela que contem duas ou mais IEs. Por

exemplo, SCs que manipulam imagens. Nesse caso, uma imagem de tomografia

computadorizada além de conter atributos da entidade "imagem", inclui atributos de

outras entidades relacionadas, tais como "paciente", "estudo" e "equipo".

A relação entre as diferentes entidades de informação (estrutura) de um IOD

composto se descreve mediante um modelo de informação, enquanto que para um IOD

normalizado não há necessidade de se estruturar. A Fig.5.3 mostra a relação entre as IODs e

os atributos IOMs (Integrated Object Model). A Fig.5.4 mostra o modelo DICOM para as

instâncias de objetos compostos. Segundo esse modelo, uma imagem particular deve conter

informação da imagem, da série, do estudo, do paciente, entre outras. A próxima imagem da

Fig.5.3 – Relação IODs e atributos.

Atributos

IOM

IOM

IOM

IOM

IOM

IOM

IOD

IOD Normalizada

IOD Composta

Seleção

Seleção

Entidade de

informação

única

Entidade de

informação

única

Entidade de

informação

única

Entidade de

informação

única

Agrupamento


mesma série deve ter a mesma informação do paciente, do estudo e da série, onde somente

mudam os dados da imagem.

O padrão DICOM define algumas características inerentes ao atributo:

• Único nome;

• Única chave tag;

• Descrição;

• Representação do valor VR (Value Representation);

• Multiplicidade do valor VM (Value Multiplicity) e tipo.

Nome: nome do atributo de forma amigável à pessoa. Por exemplo, nome do paciente;

Chave: um número para identificar o atributo;

Descrição: descrição do atributo;

Representação do valor: descreve como o atributo foi codificado. Por exemplo, se é um

caráter ou um número;

Multiplicidade do Valor: especifica o número de valores que podem ser codificados;

Tipo: especifica se o atributo é opcional ou obrigatório. Pode receber os seguintes valores:

1 (obrigatório), sempre presente com algum valor;

2 (obrigatório), sempre presente, porém pode ser vazio o campo do valor;

1C e 2C (condicional), 3 (opcional).


Fig.5.4 – Modelo de informação DICOM para uma instância composta.

Quadro de referência

1, n

0, 1

Define temporal ou

espacialmente

Imagem

0, n

Mundo real

mapeamento

de valor

0, n

Registro

0, n

Documento

encapsulado

0, n

Sinal

0, n

Documento SR

0, n

Espectroscopia

0, n

Fiduciário

0, n

Dados

brutos

0, n

Estado de

apresentação

0, n

Estudo

1

1, n

Contém

Contém

1, n

É assunto de

Série

1

Paciente

1

Equipamento

1, n 1

Crea

Quadro de referência

1, n

0, 1

Define temporal ou

espacialmente

Imagem

0, n

Mundo real

mapeamento

de valor

0, n

Registro

0, n

Documento

encapsulado

0, n

Sinal

0, n

Documento SR

0, n

Espectroscopia

0, n

Fiduciário

0, n

Dados

brutos

0, n

Estado de

apresentação

0, n

Estudo

1

1, n

Contém

Contém

1, n

É assunto de

Série

1

Paciente

1


5.5 Estrutura do arquivo DICOM

A Fig.5.5 mostra o formato do arquivo DICOM. Ele é composto de um cabeçalho

chamado de informação META do Arquivo DICOM e de um conjunto de dados (data set).

O cabeçalho é formado por um preâmbulo de 128 bytes, seguido por um prefixo DICOM de 4

bytes e informações sobre o tipo de codificação do conjunto de dados. A inclusão do

cabeçalho em um arquivo DICOM é opcional. Nessa figura, tem-se o SOP (Service Object Pair).

5.5.1 Conjunto de dados

Para o contexto de aplicações através de uma rede, um conjunto de dados é parte de

uma mensagem DICOM que carrega informações sobre os objetos de informação. Um

Paciente

Estudo

Série

Equipamento

Imagem

Bits alocados Bits armazenados Bit mais alto Número de linhas, colunas Amostras por pixel Representação do pixel Interpretação fotométrica Dados do pixel

IOD de imagem

SOP classe UID

SOP instância UID

Nome do paciente

ID Paciente

Sexo do paciente

UID do estudo

Data de estudo

Hora de estudo

ID estudo

UID Series

Tipo de modalidade

Nome da instituição

fabricante

de

Número de imagem

Tipo de imagem

SOP comum

Atributo

Módulo

Entidade de

informação

Fig.5.5 – Exemplo de um IOD de imagem composto [Lv. 22].


conjunto de dados representa uma instância de um objeto de informação. Essa é construída

com elementos de dados (atributos) ordenados. Os elementos de dados contêm os valores dos

atributos desse objeto. O conteúdo específico e a semântica dos atributos são especificados

nas definições de objetos de informação. A Fig.5.6 mostra a estrutura geral de um conjunto de

dados e a estrutura de cada elemento.

Um elemento de dados é univocamente identificado por uma etiqueta. Os elementos

dentro de um conjunto de dados devem ser classificados em ordem crescente de número da

etiqueta.

Representação do valor VR ou RV (Representation Value): é uma sequência

de caracteres de dois bytes contendo um código que define o tipo e o formato do valor ou

valores do elemento de dado.

Valor de Longitude: é um número que indica a longitude que tem o campo "valor". Esse

número pode ser um inteiro sem sinal de 16 ou 32 bits (dependendo da representação do

valor).

Valor de Campo: É o valor (ou valores) do elemento.

Fig.5.6 – Estrutura DICOM de um conjunto de dados e de um elemento de dados [77].

Elemento

dado

Elemento

dado

Elemento

dado . . .

Elemento

dado

Etiqueta

RV

Valor de longitude Valor de campo

Ordem de transmissão

Série de dados

Campo opcional – Depende da

sintaxe de transferência negociada.


5.5.2 Imagens

5.5.2.1 Modelo de imagem (IOD composto)

Uma instância de imagem DICOM possui quatro níveis distintos (IE) e estão

relacionados com os procedimentos de diagnóstico adotados pelo médico.

Nível do paciente, do estudo, da série e da imagem (NEMA, 2003c). A Fig.5.4 mostra como

os diferentes níveis estão relacionados no procedimento médico de diagnóstico.

• Um paciente possui um ou mais estudos;

• Cada estudo pode ter uma ou mais séries;

• Cada série contém no mínimo uma imagem.

A Tabela 5.1 lista os componentes que descrevem um objeto imagem de tomografia

computadorizada CT. Essas tabelas também definem se os módulos são de preenchimento

obrigatório (M), condicional (C) ou opcional (U).

IE Módulo Referencia Uso

Paciente

Paciente c.7.1.1 M

Participantes nos ensaios

clínicos c.7.1.3 U

Estudo

Estudo geral c.7.2.1 M

Estudo do paciente c.7.22 U

Estudo do ensaio clínico c.7.2.3 U

Série Série geral c.7.3.1 M

Series dos ensaios clínicos c.7.3.2 U

Quadro Referencia Quadro referência c.7.4.1 M

Equipe Equipe geral c.7.5.1 M

Imagem

Imagem geral c.7.6.1 M

Plano da imagem c.7.6.2 M

Pixel da imagem c.7.6.3 M

Contraste c.7.6.4 Necessário se métodos de

contraste são utilizados nessa

imagem.

Dispositivo c.7.6.12 U

Imagem CT c.8.2.1 M

Plano de sobreposição c.9.2 U

FOV (Field Of Vision) c.11.2 U

Comum SOP(Service

Object Pair) c.12.1 M

Tabela 5.1 – Módulos de IOD, em uma imagem de CT [78].


Cada um desses módulos é um conjunto de atributos semanticamente agrupados de

acordo com as informações da entidade a que se referem.

5.5.2.2 Paciente

Contém as informações do paciente relativo ao estudo feito. Como por exemplo, na

Tabela 5.2 se mostra alguns dos atributos do módulo "paciente", que é o primeiro módulo na

definição do objeto em dados de imagem CT.

5.5.2.3 Estudo

É o resultado da realização de um exame. O exame pode ser feito em diferentes

modalidades tais como, US, CT e MR. Todas as imagens coletadas em um exame são

colocadas no mesmo estudo. Um paciente pode ter vários estudos como resultado de outros

exames feitos.

5.5.2.4 Série

Depois do nível de estudo, todas as imagens são recolhidas. O nível de série identifica

o tipo de dispositivo que cria as imagens, data, hora da criação da série, os detalhes do tipo

de exame feito e do equipamento utilizado. Fazer uma lista dos termos usados em diferentes

dispositivos deve ser considerado cuidadosamente. Pode haver palavras que significam a

mesma coisa, aparentemente, mas são usadas de maneira diferente em diferentes

contextos. As séries sempre são uma coleção de imagens que vêm de um único dispositivo. A

forma em que as imagens são agrupadas em séries depende do uso médico que se lhe vai dar.

Nome do atributo Rótulo Tipo Descrição do atributo

Nome do paciente (0010,0010) 2 Nome completo do paciente.

ID paciente (0010,0020) 2 Nº Identificação do hospital.

ID emissor do paciente (0010,0021) 3 Identificador da pessoa que emitiu a

identificação do paciente.

Data de nascimento do paciente (0010,0030) 2 Data de nascimento do paciente.

Sexo do paciente (0010,0040) 2 Sexo do paciente.

Tabela 5.2 - Alguns atributos do módulo paciente [78].


Assim, em uma série, uma imagem de referência pode ser incluída como uma descrição da

posição espacial de fatias individuais. A Fig.5.7 mostra as diferentes reconstruções que

podem ser salvas em diferentes séries.

5.5.2.5 Imagem

O nível mais baixo do modelo de informação é o nível de imagem. Cada imagem

contém a aquisição de informação e posicionamento, assim como os próprios dados da

imagem. Dependendo do tipo de dispositivo, o nível de imagem contem dados para uma

imagem única, duas imagens (sistema de dois planos) ou uma coleção de imagens capturadas

em um curto espaço de tempo (imagens multiframe).

5.6 Características das imagens DICOM

5.6.1 Codificação das imagens

Os dados referentes aos pixels de qualquer imagem são armazenados no elemento de

dados (7FE0, 0010) utilizando-se diversas formas de codificação. A ordem de leitura dos

Fig.5.7 – Exemplo de mapeamento de uma imagem de CT [Lv. 10].


pixels dentro desse elemento depende do algoritmo de compressão utilizado. Para uma

imagem plana, sem compressão, é sequencial e corresponde a uma disposição bidimensional

da esquerda para a direita e de cima para baixo. As informações sobre as características da

imagem e da estrutura dos pixels são os elementos pertencentes ao grupo 0028. Na Tabela 5.3

alistam-se alguns dos atributos do módulo "pixels da imagem".

Com essas informações é possível interpretar os dados binários contidos no elemento

(7FE0, 0010). Por exemplo, é possível saber as dimensões da matriz imagem, se a imagem

é monocromática ou em cores, o número de bits atribuído a cada pixel, e assim por diante. A

maioria desses elementos de dados é do tipo 1. Por isso é necessário que estejam presentes em

Nome do atributo Rótulo Descrição

Amostras por pixel (0028, 0002) Número de amostras (planos) na imagem. Se a imagem é

RGB esse atributo tem um valor de 3.

Interpretação

fotométrica (0028, 0004)

Especifica como devem ser interpretados os dados da imagem.

Alguns dos valores nesse elemento são:

MONOCHROME1;

MONOCHROME2;

PALETTE COLOR;

RGB.

Filas (0028, 0010) Número de filas na imagem.

Colunas (0028, 0011) Número de colunas na imagem.

Bits alocados (0028, 0100) Número de bits alocados a cada amostra (8, 16, etc).

Bits armazenados (0028, 0101) Número de bits realmente utilizados para cada amostra.

Bit mais

significativo (0028, 0102) Bit mais significativo em uma amostra.

Representação de

pixel (0028, 0103)

Representação dos dados em cada amostra. Pode ser:

0000H = inteiro sem sinal

0001H = complemento a dois

Dados de pixels (7FE0, 0010) Imagem

Configuração

planar (0028, 0006)

Indica se a informação de cada dado pixel é enviada ‚cor por

plano‛ ou ‚cor por pixel‛.Est{ presente se a amostra por pixel é

maior que 1 .

Relação de aspecto (0028, 0034) Relação entre o tamanho vertical e o horizontal dos pixels da

imagem.

Tabela 5.3 – Elemento de dados que pertencem ao módulo “pixels da imagem” *77+.


um conjunto de dados correspondente a uma imagem. A leitura e interpretação desses

dados são de muita importância em sistemas de processamento de imagens.

5.7 Classes de serviço

Define-se um conjunto de uma ou mais classes SOP relacionada a uma função

específica que deve ser realizada através da comunicação de entidades de aplicação. As

classes de serviço mais utilizadas com imagens são:

Classe de serviço de armazenamento: determina a transmissão e o armazenamento de

imagens através da rede;

Classe de serviço de consulta: utilizado para fazer uma consulta a dados específicos.

Os serviços são de armazenamento ou do próprio DICOM DIMSE (DICOM Message

Service Element), conforme mostra a Fig.5.8.

Fig.5.8 – Estrutura maior do modelo de informação DICOM.

1

1 Definição de um

objeto informação

e

Atributos

Contem

1

n

1

Grupo de

serviços

Serviços DIMSE ou

de armazenamento

É um grupo de

1

n

1

Especificação da

classe de serviço

e

Classe SOP

1

n

1

Especifica

Define-se como

Aplica-se a


5.8 Compressão de dados padrão

O padrão DICOM desempenha um papel dominante na {rea de imagens médicas. O

principal objetivo dessa seção é mostrar como DICOM integra o uso de compressão de

imagens e, particularmente, como DICOM tem integrado abordagens gerais | compressão

fornecidas pela ISO (International Standards Organization).

5.8.1 Compressão no padrão DICOM

5.8.1.1 Codificadores DICOM recomendados

O padrão encapsula imagens comprimidas através de codificadores padronizados

dentro de sua estrutura, garantindo assim a modularidade. Uma vez que imagens

médicas estão vinculadas ao formato DICOM, a maneira pela qual elas são armazenadas e

transmitidas é suportada pelo arquivamento de imagens e sistemas de comunicação (PACS).

DICOM não suporta todas as características de codificadores padronizados. Além disso,

DICOM não especifica nem recomenda quais condições de compressão com perdas devem

ser usadas. A decisão é deixada inteiramente para usuários individuais. Os codificadores que

estão atualmente suportados no padrão DICOM são:

JPEG, conhecido como a compressão padrão e o codificador de imagens est{ticas *ISO95+.

O padrão especifica ambos os processos de codificação com perdas e sem perdas. Esse

padrão usa a transformada de cosseno discreta (DCT), que permite um ajuste da taxa

de compressão.

O padrão DICOM eventualmente apresenta quatro características principais, mostradas

na Tabela 5.4.

• A primeira corresponde ao modo baseline, aplicado a imagens com 8 bits, com

perdas e usa codificação Huffman.

• A segunda corresponde ao modo JPEG 2 e 4,conhecido como "estendido", com

perdas, aplicado a imagens de 8 e 12 bits.


• A terceira corresponde ao modo JPEG 14, sem perdas, baseado no método DPCM

com codificação Huffman.

• A quarta envolve uma previsão de uma ordem.

JPEG-LS, para a compressão sem perdas baseado no codificador LOCO.

JPEG Baseline para uma compressão com perda. Ele implementa DCT com quantização

escalar e codificação Huffman.

JPEG2000, que suporta a compressão sem perdas e com perdas através de filtros

reversíveis e irreversíveis, respectivamente. Ele também suporta codificação escalon{vel

e utiliza transformada wavelet com codificação bitplane.

MPEG-2(perfil principal no nível principal) para compressão de imagens multi-frame.

Sintaxe de transferência

UID

Processo de codificação

JPEG Descrição

1.2.840.10008.1.2.4.50 1 ‚baseline‛, com perdas.

1.2.840.10008.1.2.4.51 2 (8 bits), 4 (12 bits) ‚extended‛, com perdas.

1.2.840.10008.1.2.4.57 14 Sem perdas, não hier{rquica.

1.2.840.10008.1.2.4.70 14 (valor de seleção 1) Sem perdas, não hier{rquica, e

previsão de primeira ordem.

Tabela 5.4 – Implementação da sintaxe de transferência do padrão JPEG [Lv. 5].

145

Capítulo 6

Codificação ROI

s imagens médicas têm um grande impacto especialmente nas áreas de diagnóstico e

planejamento cirúrgico. No entanto, dispositivos de imagens continuam gerando cada vez

mais dados por paciente, muitas vezes, de 1000 imagens que correspondem a cerca de 500

MB (Megabytes).

Atualmente, esquemas de compressão produzem altas taxas de compressão se a

perda de qualidade da imagem é aceitável. No entanto, na área de medicina não se pode ter

deficiência em regiões de interesse ROI (Region of Interest) que sejam importantes para um

diagnóstico. Assim, torna-se necessária uma abordagem que produza uma alta taxa de

compressão com boa qualidade.

O processamento de imagens biomédicas é mais difícil do que o processamento de

imagens normais, porque as imagens biomédicas são muitas vezes difusas (fuzzy) e contem

ruído. Dessa forma, analisar e processar imagens biomédicas de forma rápida e com precisão

é um problema que tem sido um importante campo de pesquisa recente.

A região de interesse ROI em imagens significa as regiões importantes da

imagem. Por exemplo, as regiões de interesse em imagens médicas sempre são as regiões em

foco, como a localização de um tumor calcificado. A utilização de regiões de interesse

pode aperfeiçoar o processamento. Isso porque os dados irrelevantes não são levados em

conta.

A

146 Capítulo VI – CODIFICAÇÃO ROI

O objetivo geral é o de preservar a qualidade diagnóstica em regiões críticas,

permitindo-se codificação com perdas em outras regiões não importantes. O objetivo

principal da codificação ROI é permitir o uso de regiões de interesse múltiplos e de forma

arbitrária dentro das imagens, com pesos arbitrários descrevendo o grau de importância para

cada ROI, incluindo o fundo. Assim, essas últimas podem ser representadas por diferentes

níveis de qualidade.

6.1 Região de interesse

No cenário médico, a região de interesse (ROI) é a área de uma imagem, que é de

importância clínica / diagnóstico para o médico. Certas características específicas da imagem

como a uniformidade da textura, cor, intensidade, etc., geralmente caracterizam-se como uma

ROI. As imagens médicas são na sua maioria em escala de cinza. As escalas de cinza de uma

imagem de nível M-bit (onde M pode ser de 8, 12 ou 16 bits) podem ser representadas na

forma de planos de bits.

Identificar e extrair com precisão a ROI é muito importante antes da codificação e

compressão dos dados da imagem para uma transmissão eficiente ou para armazenamento.

Fig.6.1 – Diagrama de fluxo para compressão de ROI.

Segmentação

Bloco original

Imagem de entrada Codificação da

proposta Codificação reduzindo

a entropia do vetor

Sim ROI ou

Error >

Threshould

Codificação

reduzindo a

entropia do

vetor

Imagem prévia

- +

Capítulo VI – CODIFICAÇÃO ROI 147

Em diferentes regiões espaciais da ROI em uma imagem, é possível comprimir com diferentes

níveis de qualidade de reconstrução. Dessa forma, podem-se preservar as características

necessárias e transmitir para um diagnóstico médico.

Em imagens médicas originais, o médico seleciona regiões de interesse à mão. A

imagem é dividida em regiões de interesse e fundo. Para o fundo, usa-se uma taxa de bits

baixa. Para as ROIs, usa-se uma elevada taxa de bits. Depois da codificação

da imagem integra-se o fluxo de bits de saída para obter uma imagem comprimida.

6.2 Codificação ROI

A funcionalidade da região de interesse (ROI) é importante em aplicações médicas,

onde certas partes da imagem são de maior importância diagnóstica do que outras. Nesse

caso, essas regiões precisam ser codificadas com uma maior qualidade do que o fundo.

Durante a transmissão de imagens médicas, essas regiões são transmitidas em primeiro lugar

ou com uma prioridade maior. Nos métodos de codificação ROI baseados na transformação,

os coeficientes associados com a ROI são transferidos antes daqueles associados com o fundo.

Fig.6.2 – Imagem onde se seleciona a região

ROI e a região de fundo (Background),(Hosp.ESALUD)

Fundo

ROI


Portanto, quando uma imagem é codificada com ênfase em ROI, é necessário

identificar os coeficientes necessários para a reconstrução da ROI. Assim, a máscara ROI é

introduzida para indicar que os coeficientes devem ser transmitidos em ordem para que o

receptor reconstrua a ROI. Geralmente, a transformada wavelets [79], [46,47], é aplicada

à imagem do lado do codificador. Os coeficientes resultantes não associados com a ROI são

deslocados para baixo (shifted down) de forma que os bits associados à ROI são colocados

em planos de bits superiores. A codificação ROI tem sido aplicada em diferentes tipos

de imagens médicas. Algumas transformações mais comuns utilizadas para a codificação de

regiões em imagens médicas são o MaxShift de JPEG2000, a série do particionamento

em árvores hierárquicas (SPIHT), a codificação do bloco integrado com truncamento

otimizado EBCOT, e a transformada wavelet inteira adaptativa AIWTs (Adaptive Integer

Wavelet Transform).

Não

Fig.6.3 - Diagrama de blocos da codificação ROI.

Codificação dos coeficientes

WT (início em n=N)

ROI é identificado?

Criação da

máscara ROI

Imagem global

Não

Sim


WT (começa em n = R - 1)

n < R


que ainda não são testados de

n=Q até n=R

Não ROI

Sim

Imagem global

Codificação no modo

codificação ROI de n=Q a n=R

n < R

Não

ROI

Sim


6.3 Geração da máscara ROI

Quando uma imagem é codificada com ênfase em ROI, é necessário identificar os

coeficientes wavelet necessários para a reconstrução da ROI [80]. Geralmente, a

transformação wavelet, é aplicada à imagem no lado do codificador. A máscara no domínio

wavelet é um mapa que indica todos os coeficientes relacionados para a reconstrução da

ROI. As localizações correspondentes dos coeficientes na escala são calculadas a partir da

escala atual.

Um exemplo de cálculo da máscara ROI é dado a seguir [81].

Seja Rn o domínio wavelet de uma imagem e ΩϵRn a região de interesse. A função

característica XΩ(x) é definido como:

𝑥 , 𝑚 𝑥 𝑎𝑠 𝑡𝑟𝑎𝑟

(6.1)

Então a máscara ROI é gerada de acordo com:

𝑥 �� 𝑥 𝑥 𝑥 𝑥 (6.2)

Onde �� representa o operador de wavelet para a ith sub-banda, Λ é o conjunto de

índices de todas as sub-bandas e Ĩi é a operação identidade equipada com operação down-

samplig, respectivamente.

6.4 Métodos de codificação ROI em imagens médicas fixas 2-D

6.4.1 Método de dimensionamento geral

O princípio do método é escalar (shift). Calcula-se os coeficientes de forma que os bits

associados com a ROI são colocados em planos mais elevados do que os bits associados com o

fundo, conforme mostra a Fig.6.4(b).


Durante o processo de codificação incorporado, os bits mais significativos da ROI são

colocados no fluxo de bits antes dos bits de fundo da imagem. Dependendo do valor de

escala, alguns bits dos coeficientes ROI podem ser codificados junto com os coeficientes na

ROI. Assim, a ROI será decodificada ou refinada, antes do resto da imagem. Se o fluxo de

bits é truncado, ou o processo de codificação termina antes que toda a imagem seja

codificada, a ROI será de melhor qualidade do que o resto da imagem.

O algoritmo apresenta 4 passos:

Calcula-se a transformada wavelet;

Se uma ROI é escolhida, obtém-se a máscara ROI, indicando o conjunto de

coeficientes que são necessários para a reconstrução de ROI sem perdas como se

mostra na Fig.6.4-(b);

Quantizar os coeficientes wavelet, após a quantização, armazenar os coeficientes em

magnitude e sinal;

Os coeficientes externos à ROI são escalonados para baixo por um valor de escala

especificado. A entropia codifica os coeficientes resultantes progressivamente com os

primeiros planos de bits mais significativos.

6.4.2 Método MaxShif

Na codificação ROI MaxShift, uma imagem inteira é transformada somente se os

coeficientes associados com a região de interesse são escalonados por meio de um

determinado número de bit-shift (chamados de valor escala s) dado pelo maior número dos

coeficientes de planos de bits (Fig.6.4 c).


O valor de escala é calculado de tal forma que seja possível ter ROIs com forma

arbitrária, sem a necessidade de transmitir informação compartilhada para o decodificador.

Isso significa que, o decodificador não deve ser executar a geração de máscara ROI. O

mapeamento da ROI a partir do domínio espacial para o domínio wavelet é dependente do

uso dos filtros wavelet e é simplificado para regiões circulares e retangulares.

O codificador analisa os coeficientes quantizados e escolhe um valor de escala s tal

que o coeficiente mínimo pertencente à ROI é maior do que o coeficiente máximo do fundo

(área não ROI). Como ilustrado na Fig.6.4-(c), todos os coeficientes wavelests que não fazem

parte da ROI são escalonados para baixo por (s +D), onde D é uma constante pequena. Como

resultado, todos os coeficientes wavelets correspondentes ao fundo têm uma magnitude <1. O

decodificador, depois de receber o fluxo de bits, escalona para cima (s+D) todos os

coeficientes que têm uma magnitude <1.

A Fig.6.5 mostra um exemplo em uma dimensão da correspondente filtragem de sub-

bandas passa altas e passa baixas usando-se um filtro wavelet 5/3 reversível para reconstruir

as amostras da imagem pelas equações (6.3) e (6.4).

Fig.6.4 – (a) Compressão da imagem completa, (b) Método

baseado na escala geral ROI, (c) Método MaxShif.


𝑥 𝑛 ⌊

4⌋ (6.3)

𝑥 𝑛 𝑛 ⌊𝑙 𝑙

⌋ (6.4)

Considere-se a transformada wavelet inversa, como se mostra na Fig.6.5.Os coeficientes

l5, h1 e h5, assim como os coeficientes dentro do objeto são necessários para reconstruir as

amostras de x4 a x9, onde xi, li e hi representam valores de uma amostra de imagem. Os

coeficientes adicionais dependem do comprimento do filtro e da decomposição wavelet. Uma

vantagem do método MaxShift, em comparação com o método de dimensionamento

geral, é que a codificação das ROIs é possível sem a necessidade de fornecimento de

informação e sem a necessidade do cálculo da máscara da ROI. A Fig.6.6 apresenta uma

ilustração do fluxograma do MaxShift. A principal desvantagem do método MaxShift é que as

ROIs com diferenciais de qualidade múltiplos não podem ser codificados.

Fig.6.5 – A transformada wavelet inversa com um filtro wavelet 5/3

reversível. Coeficientes adicionais que são necessários para reconstrução

das amostras da imagem dentro do objeto são marcados em verde.


6.4.3 Método de MSBShift (Most Significant Bit-Plane Shift)

O método MSBShift não só suporta a codificação ROI com forma arbitrária, mas

também permite o ajuste flexível de qualidade de compressão da ROI e do fundo.

ROIs múltiplos: o novo método pode eficientemente codificar ROIs múltiplos com

prioridades diferentes em uma imagem.

Algoritmo de codificação:

• Esse método [112] remove todos os planos de bits sobrepostos entre a ROI e os

coeficientes de fundo BG (Background), e relativamente modifica o tamanho do

passo de quantização dos coeficientes. Isso reduz a qualidade da ROI final.

• Pode-se isolar certo número de planos de bits dos bits ROI nos planos de bits mais

significativos para ajustar a importância entre a ROI e o BG.

Início Determine

coeficientes

wavelets ROI

Encontrar o

valor de escala

S

Os coeficientes

pertencem ao

fundo?

Aplicar

codificação

entrópica ao

plano de bits

Fim

Escala de

coeficientes

para abaixo

por S+D

Escreva S para

o fluxo de bits

1 2 3

4 5

Fig.6.6 – Fluxograma do processo de codificação ROI MaxShift; 1) O conjunto

de coeficientes wavelets que pertencem a ROI é determinado; 2)O valor de escala (s) e a

magnitude do maior coeficiente de wavelet não na ROI, ou seja,contida no fundo, são

calculados; 3) Os coeficientes de fundo são reduzidos para baixo por s; 4) O valor de s é

adicionado ao fluxo de bits; 5) A codificação de entropia bit-plano é aplicada [Lv. 4].


• Precisa-se somente transferir parte dos planos de bits mais significativos dos

coeficientes da ROI em vez de mudar todos os planos de bits dos coeficientes da ROI.

Complexidade e Eficiência de Codificação: posto que para o método MSBShift não é

necessário codificar formas ROI, a complexidade é menor do que no método

genérico baseado na escala. A eficiência da codificação é maior quando o mesmo valor de

escala é utilizado. Se o ponto de codificação sem perdas é atingido, a taxa de bits que é

produzida pelo método MSBShift não é maior do que no método genérico porque o

MSBShift codifica menos ou, no máximo, o mesmo número de planos de bits.

6.4.4 Método BbBShift (Bit-plane-by-Bit-plane Shift)

Ao invés de transferir todos os planos de bits de uma só vez usando o mesmo valor

escalar s como em MaxShift, em BbBShift , os deslocamentos são feitos em uma base de plano

de bits por plano de bits. Uma ilustração do método BbBShift é mostrada na Fig. 6.7. Dois

parâmetros, S1 e S2, são utilizados em BbBShift. A soma de S1 e S2 deve ser igual ao maior

número do plano de bits de qualquer coeficiente da ROI. Esse método indexa o plano de bits

superior 1, ao próximo plano de bits superior como 2, e assim por diante. O algoritmo

codificador é o seguinte:

1. Para qualquer plano de bits b de um coeficiente ROI:

Se 𝑠 , nenhuma mudança;

Se 𝑠 < 𝑠 𝑠 , transferi-lo para baixo para o plano de bits 𝑠 𝑠 .

2. Para qualquer plano de bits b de um coeficiente de BG:

Se 𝑠 , transferi-lo para baixo para o plano de bits 𝑠 ;

Se > 𝑠 , transferi-lo para baixo do plano de bits 𝑠 𝑠 .


O esquema do decodificador é o seguinte:

1. Identificar se é um coeficiente de ROI ou um coeficiente de BG. Isso pode ser feito

analisando o bit mais significativo (MSB) do nível de plano de bits. O conjunto de ROI

associado aos planos de bits é dado por:

BROI = ,b|b ≤ s1 ou b=s1+2k, k=1,2,...,s2}

2. Se o coeficiente wavelet MSB est{ no plano de bits ∈ 𝐵 , então é um coeficiente de ROI.

Caso contr{rio, é um coeficiente de BG. Os planos de bits são, então, deslocados de volta

para seus níveis originais, invertendo-se o plano de bits do esquema deslocado no

codificador.

Esse método [113] muda os planos de bits em uma base plano de bits por plano de bits em

vez de transferi-los todos como no método MaxShift.

Codificação ROI não múltiplo; o método BbBShift não suporta codificação ROI múltiplo.

Eficiência de compressão; semelhante ao do método MaxShift.

6.4.5 Codificação baseada em objetos com transformada wavelet adaptativa

A codificação baseada em objetos requer a aplicação de uma transformada wavelet

bidimensional a uma região com forma arbitrária. Devem-se codificar eficientemente os

Fig.6.7 - Método BbBShift com S1=4 e S2 = 5 (Os

planos são representados pelas barras cinza ).


coeficientes wavelets resultantes. Uma região bidimensional com forma arbitrária é composta

de várias linhas e colunas de longitude variada. Em uma transformada wavelet bidimensional

separável, a transformação de linhas é seguida pela transformação das colunas resultantes

dos coeficientes no lugar. A Fig.6.8 mostra um exemplo da transformada wavelet discreta

adaptativa para uma única linha de pixels, na qual as amostras são transformadas e ambas as

bordas do segmento são estendidas por uma extensão simétrica. Note que, em uma

transformada wavelet adaptativa, os pixels do objeto e de fundo nunca são misturados pela

filtragem e que o número de coeficientes resultantes é exatamente o mesmo que o número

de pixels na região.

6.4.5.1 Particionamento hierárquico em árvores baseado em objetos (OBSPIHT)

O método SPIHT (Set Partitioning In Hierarchical Trees) foi adaptado para a codificação

de regiões de forma arbitrária dentro de uma imagem de acordo com sua importância ou

relevância de diagnóstico. Essa adaptação baseada em objeto SPIHT é chamada de OBSPIHT

(Object Based SPIHT). Aplica-se a transformada wavelet de forma adaptativa somente aos pixels

pertencentes à região de interesse ao invés de se aplicar à imagem inteira. Assim, o método

OBSPIHT utiliza um esquema de codificação em cadeia para se transmitir a informação da

ROI. Finalmente, OBSPIHT codifica progressivamente somente os coeficientes wavelets

associados a essa região.

Transformar

Fundo Objeto Fundo

x0 x1 x2 x3 x4 x5 x6 x7 x8 x10 x11 x12 x9

. . x0 x5 x4 x5 x6 x7 x8 x8 x7 . x9

l2 h2 l3 h3 l4 h4

Extensão Extensão

Fig.6.8 – Transformada wavelet adaptativa

unidimensional com extensão simétrica.


6.5 Codificação ROI em imagens médicas volumétricas

As imagens médicas volumétricas introduziram novos problemas quanto a sua

manipulação e transmissão, devido ao grande volume de dados que contêm. Assim, o uso de

um método de compressão reforçado com a codificação ROI para o diagnóstico em áreas

críticas é considerado essencial nesse caso. A codificação tridimensional (3D) de wavelet

oferece melhor desempenho em comparação aos correspondentes métodos 2D. Uma

avaliação do esquema de codificação ROI convencional em imagens volumétricas, chamado

de SADWT (Shape Adaptive Discrete Wavelet Transform) existe em [82]. Nesse algoritmo

somente amostras dentro de um objeto são transformadas [83] de acordo com a forma de

informação adicionalmente enviada para o decodificador.

O comprimento de cada segmento unidimensional a ser transformado varia

de segmento a segmento. Comparado com a ROI baseada na escala SBROI (Scale Based ROI)

poucas amostras são necessários para codificar o objeto. No entanto, a codificação

ROI flexível, tais como a codificação ROI orientada ao usuário em aplicações interativas é

difícil de se realizar. Na codificação ROI orientada ao usuário, o usuário modifica ou

especifica uma ROI no meio do processo de codificação.

Em SADWT, a transformada wavelet precisa ser feita novamente quando a ROI é

especificada/modificada. Isso causa aumento significativo do custo computacional por fazer

uso de forma eficiente dos dados que já foram transmitidos e codificados. Em imagens de CT

no cólon [84], é aplicado um modelo híbrido de compressão sem perdas na ROI, com uma

alta taxa de compressão e com compensação de movimentos. A parede do cólon é

segmentada por uma sequência de 3D e técnicas de processamento morfológico de imagem.

Uma vez que a ROI é segmentada em cada fatia, um esquema de compressão híbrido

é utilizado para codificar as imagens. A primeira fatia do volume é compactada com um

codificador sem perdas. Cada fatia é codificada por codificação de movimento

compensado, que também atua como um filtro de previsão da ROI.

Finalmente, a diferença entre o bloco ROI da imagem real e o bloco ROI da imagem prevista é

codificada por um codificador sem perdas minimizando a entropia. Uma extensão para 3D-


SPIHT [85] que permite codificação ROI 3D em imagens volumétricas é apresentada em

[86]. Para identificar os coeficientes que afetam a ROI, uma máscara de bitmap 3D é mantida

no codificador. Essa máscara é submetida a uma transformada wavelet semelhante onde em

cada passo os coeficientes necessários para uma reconstrução perfeita da ROI no nível

atual de decomposição são identificados.

6.6 Quadros comparativos dos métodos de codificação ROI

Codificação ROI baseado em escalonamento

- Permite ROIs.

- O valor do deslocamento é registrado no cabeçalho do fluxo de código para cada ROI.

- Bom controle sobre a import}ncia entre ROI e BG.

- A codificação de ROI aumenta significativamente a complexidade e reduz a eficiência de

codificação.

- A forma da ROI é restrita (ret}ngulo e elipse). Essa restrição pode limitar a aplicação real da

codificação ROI e a eficiência da compressão.

- Requer um complexo processo de geração da m{scara ROI.

- Necessita de coeficientes adicionais para decodificar o objeto.

- Suporta codificação ROI arbitr{ria *116+.

- Aplicado a imagens de nefrostograma *114+.

Codificação ROI MaxShift (Maximum Shift)

- Alta taxa de compressão com boa qualidade na ROI.

- Usa maiores valores de escala e reduz a eficiência de compressão através da introdução de

mais planos de bits.

- A codificação ROI é possível sem o requerimento do fornecimento de informação e sem a

necessidade do c{lculo da m{scara ROI.

- Processo de decodificação simples sem necessidade da geração da m{scara ROI.

- Necessita de coeficientes adicionais para decodificar o objeto.

- Suporta codificação ROI arbitr{ria.

- Aplicado a imagens de nefrostograma *114+.

Codificação MSBShift (Most significant bit-plane shift)

- Ajuste flexível de qualidade de compressão na ROI e no BG (Background).

- Codificação de múltiplas ROIs.

- A complexidade é menor do que no método geral baseado em escala.

- A eficiência de codificação é maior.


Codificação OBSPIHT (Object-Based Set Partitioning In Hierarchical Trees)

- Eficiência de compressão ao utilizar método baseado em regiões em comparação a SPIHT

original.

- Permite a compressão de v{rias regiões.

- O fluxo de bits pode ser truncado.

- Alta qualidade de compressão na região do tórax.

- Não precisa de coeficientes adicionais para decodificar o objeto.

- Suporta codificação ROI arbitr{ria.

- Aplicado a imagens de mamografia *122+, *124+.

Codificação baseada em objetos com formato da transformada wavelet adaptativa

- Aplicada a imagens est{ticas, onde o objeto ou objetos são fixos em forma e posição.

- Permite codificação sem precisão a qual não afeta os pixels fora do objeto.

- Os pixels do objeto e fundo não são misturados por filtragem.

Codificação BbBShift (Bitplane-by-Bitplane Shift )

- Eficiência de compressão.

- Suporta codificação arbitr{ria ROI.

- Não suporta codificação ROI múltipla.

- A operação de codificação é feita usando o algoritmo ‚baseline‛ de JPEG2000.

- Usando acesso aleatório a dados codificados, a região de interesse pode ser decodificada

progressivamente.

161

Capítulo 7

Resultados

Fig. 7.1 apresenta o esquema da sequência utilizada.

7.1 Banco de dados de imagens CT

Neste trabalho, utilizam-se imagens médicas previamente digitalizadas que foram

gentilmente fornecidas pelo Hospital ESSALUD de Cusco - Perú.

7.2 Escolha dos modelos de representação em compressão de imagens

Para esta pesquisa escolhem-se as wavelets bi ortogonais, por apresentar um

bom desempenho [105]. A Tabela 7.1 mostra as wavelets bi ortogonais utilizadas que

são denotadas como Bior Nd, Nr, onde:

Nd: representa a ordem do filtro de decomposição (an{lises) e;

Nr: representa a ordem do filtro de reconstrução (sínteses).

A

No. Wavelet bi ortogonal No. Wavelet bi ortogonal No. Wavelet bi ortogonal

1 1.1 5 3.1 9 4.4

2 1.5 6 3.5 10 5.5

3 2.4 7 3.7 11 6.8

4 2.8 8 3.9 12 -

Tabela 7.1 – Wavelets utilizadas na compressão de imagens.

DICOM.

162 Capítulo VII – RESULTADOS

7.3 Codificação sub-banda

A codificação sub-banda SBC (Sub-Band Coding) é baseada na divisão da banda de

frequências de um sinal. A codificação de cada banda é feita de acordo com sua estatística e

as especificações de compressão. Há duas componentes fundamentais na codificação sub-

banda: o sistema de filtros e a quantização usando localização de bits. O processo pode se

repetir de forma iterativa obtendo-se árvores de filtros de maior profundidade. No

decodificador se decodificam os sinais sub-bandas. Realiza-se a sobreamostragem, por meio

de filtros de sínteses e as saídas desses filtros são somadas para se obter uma imagem

reconstruída.

Decomposição multiresolução

Codificação sub-banda

Fig. 7.1 – Esquema da sequência utilizada.

Escalamento Geral

MaxShift

ROI

MSBShift

BbBShift

OBSPIHT

Banco de dados: Imagens CT

Codificação de

coeficientes Wavelet

Escolha dos modelos de representação em

compressão de imagens

Hospital ESALUD

Imagens DICOM

Qualitativos

Objetivos

Medidas de compressão

Critérios de fidelidade

Seleção efetiva da wavelet

Medidas da eficiência de compressão

Capítulo VII – RESULTADOS 163

7.4 Decomposição multiresolução

Cada imagem é decomposta em um certo número de níveis l. O número de

decomposições determina a resolução do mais baixo nível no domínio wavelet. O nível de

decomposição da wavelet pode ser calculado por meio de: l = log2N, onde N é o tamanho da

fila na imagem a se comprimir, sendo esse o máximo nível possível. Para o caso das imagens

de teste (tamanho 512×512 píxels), o valor máximo de decomposição é de l=9.

O incremento do número de níveis de decomposição l permite descorrelacionar os

dados e, portanto obter uma melhor qualidade na imagem reconstruída. No entanto, um

grande número de decomposições causa perda na eficiência do algoritmo de codificação,

devido à complexidade computacional. Além disso, o PSNR tende a saturar para um número

grande de níveis de decomposição [106].

7.5 Esquemas de codificação de coeficientes wavelets

As imagens são comprimidas utilizando-se os codificadores wavelets SPIHT e

EZW. Quando os planos de bits menos significativos são codificados com SPIHT, a

ocorrência de zerotrees é pouco provável. Nesse caso, o SPIHT é mais redundante em

enviar os planos sem codificação. Por esse motivo, às vezes SPIHT usa somente até o

segundo ou terceiro plano de bits. Dessa forma, se acelera a compressão e se reduz o

tamanho do arquivo comprimido. Além disso, a relação sinal ruído nesses planos de

bits é muito baixa e sua transmissão progressiva não melhora a qualidade visual da

reconstrução [Ts 1].

7.6 Análises da eficiência de compressão

Para determinar a eficácia dos algoritmos de compressão utilizam-se as

medidas descritas na secção 3.2, ou seja, longitude média por símbolo Ls, fator ou


razão de compressão X:1, compressão relativa CR, tamanho comprimido relativo TR e

fator de mérito p.

Além disso, faz-se uso dos critérios de fidelidade e medidas de erros tanto

objetivos como subjetivos, descritos na seção 3.2, ou seja, a relação sinal ruído SNR, o

erro quadrático médio MSE (Mean Square Error), a relação sinal ruído de pico PSNR e

a correlação cruzada CC.

7.7 Metodologia do teste, aquisição de dados e resultados

Utilizam-se 10 imagens CT de tamanho 512×512 (256KB). As imagens são

comprimidas por uma taxa de bits específica de 0,1 bpp até 0,9 bpp. As taxas baixas

correspondem às imagens de menor resolução que requerem um menor tempo de

processamento. O nível de decomposição wavelet se fixa de acordo com as exigências de cada

imagem. Em cada imagem faz-se uma avaliação para determinar a efetividade e eficiência do

algoritmo de compressão por meio dos critérios de avaliação. Os autores em [105],

manifestam que o nível de decomposição l = 5, é apropriado para a decomposição.

À medida que se incrementa a taxa de bits os resultados melhoram tanto na avaliação

objetiva quanto na qualitativa. Concomitantemente, o tempo de processamento aumenta.

Para valores menores que 0,4 bpp, as imagens comprimidas são consideradas não aceitáveis.

Nas Tabelas 7.2 e 7.3 mostram-se os resultados de medidas de compressão, medidas

de distorção, erros objetivos e quantitativos para uma taxa de bits de 0,5 bpp. Com base nesses

resultados considera-se em primeira instância que uma taxa de 0,5 bpp e com as wavelets Bior

2.4, 4.4, 5.5, e 6.8 se obtêm melhores resultados de compressão para imagens CT. Do mesmo

modo, nas mesmas tabelas se comparam os dois algoritmos de compressão EZW

(Embedded Zerotrees of Wavelet Transforms) e SPIHT (Set Partitioning In Hierarchical Trees),

sendo SPIHT o algoritmo de compressão de melhor desempenho.


Os resultados da Tabela 7.3 mostram que o algoritmo SPIHT é superior em

aproximadamente 1dB sobre o algoritmo EZW, para cada uma das imagens de teste. As

medidas de compressão e critérios de erro apresentam uma diferença pouco apreciável. Por

isso, quando se considera o critério de fidelidade qualitativa (Tab.3.1), as mudanças entre as

imagens não são percebidas. Assim, somente com uma mudança abrupta na taxa de bits (por

exemplo, de 0,4 para 0,8 bpp), é possível se encontrar as diferenças.

Quanto à medida de correlação, pode-se notar que existe uma semelhança muito

grande entre elas e somente tomando-se mais de três cifras decimais na medida se nota uma

diferença. Na Tabela 7.4, são mostradas as wavelets bi ortogonais cujos critérios de fidelidade

foram às melhores. A Fig. 7.2 mostra três imagens comprimidas usando-se a wavelet Bior 6.8

com taxas 0,4, 0,5 e 0,6 bpp.

Wavelet

bi ortogonal

Imagem

comprimida

Fator de

compressão (X:1)

Compressão

relativa (CR)

Fator de

mérito p(%)

Porcentagem

compressão (%)

SPIHT EZW SPIHT EZW SPIHT EZW SPIHT EZW SPIHT EZW

1.1 16,0 17,7 16,00:1 14,46:1 0,938 0,931 6,3 6,9 93,750 93,086

1.5 16,3 18,0 15,71:1 14,22:1 0,936 0,930 6,4 7,0 93,633 92,969

2.4 16,4 17,1 15,61:1 14,97:1 0,936 0,933 6,4 6,7 93,594 93,320

2.8 16,9 18,4 15,15:1 13,91:1 0,934 0,928 6,6 7,1 93,398 92,813

3.1 16,8 18,2 15,24:1 14,07:1 0,934 0,929 6,6 7,2 93,438 92,891

3.5 16,4 17,1 15,61:1 14,97:1 0,936 0,933 6,4 6,7 93,594 93,320

3.7 16,4 17,1 15,61:1 14,97:1 0,936 0,933 6,4 6,7 93,594 93,320

3.9 16,4 17,5 15,52:1 14,63:1 0,936 0,932 6,4 6,8 93,555 93,164

4.4 16,5 17,5 15,52:1 14,63:1 0,936 0,932 6,4 6,8 93,555 93,164

5.5 16,9 18,4 15,15:1 13,91:1 0,934 0,928 6,6 7,2 93,398 92,813

6.8 16,7 18,0 15,33:1 14,22:1 0,935 0,930 6,5 7,0 93,477 92,969

Tabela 7.2 - Desempenho dos algoritmos SPIHT e EZW baseado nas medidas

de compressão; tamanho da imagem CT 512x512 (256 KB) e taxa = 0,5 bpp.


Wavelet

bi ortogonal

MSE

0,4 0,5 0,6

PSNR

0,4 0,5 0,6

Correlação

0,4 0,5 0,6

2.4 2,0352 1,8261 1,6646 45,045 45,516 45,918 0,99986 0,99989 0,99991

5.5 2,0274 1,8283 1,6947 45,061 45,51 45,840 0,99986 0,99989 0,9999

4.4 1,9304 1,7243 1,5597 45,274 45,765 46,2 0,99988 0,9999 0,99992

6.8 1,9163 1,7072 1,5434 45,306 45,808 46,246 0,99988 0,9999 0,99992

Wavelet

bi ortogonal

Tamanho

imagem (KB)

MSE

SPIHT EZW

PSNR (dB)

SPIHT EZW

Correlação

SPIHT EZW

Avaliação qualitativa

SPIHT EZW

1.1 256 6,425 8,350 40,052 38,914 0,9954 0,9934 4 4

1.5 256 7,135 9,060 39,597 38,560 0,9951 0,9931 4 4

2.4 256 2,414 4,339 44,304 41,757 0,9959 0,9939 5 5

2.8 256 2,485 3,720 44,179 42,425 0,9956 0,9937 5 5

3.1 256 2,534 3,520 44,093 42,665 0,9949 0,9929 5 5

3.5 256 2,834 4,760 43,607 41,355 0,9952 0,9940 5 5

3.7 256 2,651 4,577 43,897 41,525 0,9953 0,9933 5 5

3.9 256 2,596 4,521 43,988 41,578 0,9954 0,9993 5 5

4.4 256 2,043 3,954 45,028 42,160 0,9961 0,9941 5 5

5.5 256 2,424 4,349 44,285 41,747 0,9971 0,9951 5 5

6.8 256 1,979 3,904 45,166 42,216 0,9975 0,9955 5 5

Tabela 7.3 - Desempenho dos algoritmos SPIHT e EZW baseado

nas medidas de erro; taxa = 0,5 bpp.

Tabela 7.4 – Medidas de erro com as wavelets biortogonais cujos critérios de

fidelidade foram as melhores. Nível de decomposição l=9, taxas = 0,4, 0,5, e 0,6 bpp.


Fazendo-se uma análise subjetiva das imagens, à primeira vista é difícil notar a

diferença entre elas. Observações exaustivas por parte de pessoal qualificado poderiam notar

as mudanças que representam cada taxa de compressão. O teste seguinte, modifica o nível de

decomposição wavelet, deixando a taxa de bits em 0,5 bpp. Comprimem-se novamente todas as

imagens variando-se os níveis de decomposição de l = 3 até l = 9.

Nesse teste, um dos objetivos foi minimizar o tempo computacional no processamento

das imagens. Os resultados confirmam uma vez mais que para compressão de imagens CT,

as melhores wavelets em termos de critérios de erro são a Bior 2,4, 5,5, 4,4 e 6,8 e o nível de

decomposição que melhor representa a imagem a um custo computacional (eq. 4.46) baixo é

l=4 e l=5. As Tabelas 7.5 e 7.6 mostram alguns resultados.

Wavelet

bi ortogonal MSE PSNR Correlação

2.4 2,6238 43,942 0,99982

5.5 2,6830 43,845 0,99981

4.4 2,4710 44,202 0,99984

6.8 2,4066 44,317 0,99985

Wavelet

bi ortogonal MSE

PSNR

dB Correlação

2.4 2,1290 44,849 0,99988

5.5 2,0560 45,001 0,99989

4.4 1,9743 45,177 0,99990

6.8 1,9655 45,196 0,99990

45,306 dB, 0,4 bpp 45,808 dB, 0,5 bp p 46,246 dB, 0,6 bpp

Fig. 7.2 – Imagens compridas usando a wavelet Bior. 6.8 [Hosp. ESALUD].

Tabela 7.5 – Resultados com nível de

decomposição l = 4, taxa = 0,5 bpp.

Tabela 7.6 – Resultados com nível de

decomposição l=5, taxa = 0,5 bpp.


Os testes seguintes consistem em repetir o experimento várias vezes para verificar que

os resultados obtidos acima foram realizados de uma forma correta. Os resultados dos testes

mostram que na tabela 7.5, com o nível l=4 e com uma taxa de 0,5 bpp é considerado

adequado em comparação aos resultados das tabelas 7.6, 7.7, 7.8. Cabe lembrar que todos os

resultados foram analisados com base nas medidas de compressão, nos critérios de fidelidade

e de erro para a compressão de imagens CT.

A partir das duas tabelas já anteriormente mencionadas, se selecionam novamente,

duas das wavelets bi ortogonais de melhor desempenho Bior 4,4 e Bior 6,8. A primeira é

utilizada e citada em várias publicações [107], [108], [Ts 2], [Ts 3], [Ts 4]. No padrão JPEG2000

essa wavelet é conhecida como a wavelet bi ortogonal 9/7.

As Tabelas 7.7 e 7.8, mostram alguns resultados das medidas de erro para duas

imagens diferentes com um nível fixo de decomposição l=5 e l=6 respectivamente, variando-

se a taxa de bits de 0,4 bpp até 0,9 bpp respectivamente. Nesse teste, a wavelet biortogonal 6.8

continua sendo a mais apropriada para as imagens CT.

Wavelet

Bior.

MSE

0,4 0,6 0,8 0,9

PSNR

0,4 0,6 0,8 0,9

Correlação

0,4 0,6 0,8 0,9

2.4

4.4

5.5

6.8

1,5408 1,2509 1,0902 1,0229

1,4776 1,1863 1,0320 0,9609

1,5691 1,2342 1,0862 1.0370

1,4591 1,1806 1,0261 0,9534

46,2533 47,1585 47,7556 48,0325

46,4351 47,3887 47,9937 48,3038

46,1742 47,2169 47,7717 47,9728

46,4899 47,4096 48,0186 48,3380

0,99996 0,99997 0,99998 0,99998

0,99996 0,99998 0,99998 0,99998

0,99996 0,99997 0,99998 0,99998

0,99996 0,99998 0,99998 0,99998

Wavelet

Bior.

MSE

0,4 0,6 0,8 0,9

PSNR

0,4 0,6 0,8 0,9

Correlação

0,4 0,6 0,8 0,9

2.4

4.4

5.5

6.8

2,0261 1,6360 1,3447 1,2549

1,9023 1,5083 1,2541 1,1662

1,9865 1,6481 1,3046 1,2198

1,8837 1,4872 1,2410 1,1504

45,064 45,992 46,844 47,144

45,337 46,345 47,147 47,462

45,149 45,960 46,975 47,267

45,380 46,407 47,192 47,522

0,99989 0,99993 0,99995 0 ,99995

0,99990 0,99994 0,99995 0,99996

0,99989 0,99993 0,99995 0,99996

0,99990 0,99994 0,99996 0,99996

Tabela 7.7 – Medidas de erro para as wavelets selecionadas com nível de

decomposição l=5, taxas 0,4, 0,6, 0,8 e 0,9 bpp.

Tabela 7.8 – Medidas de erro para as wavelets selecionadas com nível de

decomposição l=6, taxas 0,4, 0,6, 0,8 e 0,9 bpp.


A seguir mostra-se o comportamento das diferentes wavelets que são usadas na compressão,

com base nas medidas de erro PSNR e MSE, em função da taxa de bits, para algumas

imagens. Na Fig. 7.3, pode-se observar que a taxa de crescimento da PSNR, à medida que

aumenta a taxa de bits é quase constante para as 3 wavelets bi ortogonais (Bior 1.1, Bior 1.3 e

Bior 1.5). Além disso, pode-se observar que a Bior 1.1 é a de melhor desempenho.

Pode-se observar nas Tabelas 7.3 e 7.12 que as Bior 2.Nr, são mais apropriadas que as

Bior 1.Nr para a compressão de imagens CT. Na Fig. 7.4, observa-se que as Bior 3.Nr

conservam a uniformidade no crescimento da curva da PSNR, à medida que aumenta a taxa

Fig. 7.3 – Avaliação comparativa com diferentes wavelets 1.Nr.


de bits. A Bior 3,1 é a wavelet de pior desempenho. Os resultados mostram que as Bior 2.Nr,

continuam sendo as mais apropriadas quando comparadas com as Bior 1.Nr, Bior 3.Nr.

Fig. 7.4 – Avaliação comparativa com diferentes wavelets Bior 3.Nr.

Fig. 7.5 – Avaliação comparativa com diferentes wavelets Bior 4.4, 5.5, 6.8.


Por outro lado, apesar da uniformidade da resposta de PSNR das wavelets bi

ortogonais Bior 4.4, Bior 5.5 e Bior 6.8, conforme cresce a taxa de bits, observa-se que a Bior 5.5

se comporta melhor que as outras para taxas de bits pequenas, da ordem de 0,1 a 0,3

aproximadamente. Para taxas maiores a Bior 4.4 e Bior 6.8 superam o desempenho da Bior 5.5.

As Bior 5.5, 2.4, 4.4 e 6.8 correspondem às wavelets de melhor desempenho. Se a seleção for

mais rígida, então as Bior 4.4 e 6.8 superam as demais.

Para medir a qualidade da imagem comprimida por meio do critério de erro PSNR,

calcula-se o MSE, para cada uma das imagens envolvidas. A Fig. 7.6, mostra o

comportamento do MSE à medida que se incrementa a taxa de bits para as primeiras wavelets

bi ortogonais (Bior 1.1, Bior 1.3 e Bior 1.5).

Para taxas baixas de bits, a Bior 1.1, apresenta um valor do erro inferior, ou seja,

aproximadamente igual à metade daquele obtido para o restante das wavelets bi ortogonais.

Os valores do erro MSE convergem para o mesmo valor à medida que se incrementa a taxa



de bits. Para o caso das wavelets Bior 2.Nr, o comportamento do MSE é mostrado na Fig. 7.7.

Os comportamentos são muito similares entre si, e as curvas convergem praticamente para

um mesmo valor quando a taxa de bits tende a 0,9 bpp.


Fig. 7.8– Avaliação comparativa com diferentes wavelets Bior 3.Nr.


Na Fig. 7.8, pode-se ver o comportamento das wavelets Bior 3.Nr. A curva descreve o

erro MSE com base no incremento da taxa de bits . A Bior 3.5, apresenta o melhor

desempenho e a Bior 3.1 mostra um desempenho pobre.

Na Fig. 7.9, observam-se as curvas características do MSE para as wavelets Bior 4.4, Bior

5.5 e Bior 6.8, onde se observa que existe certo comportamento similar entre elas para todos os

valores de taxas de bits analisados. A wavelet de melhor desempenho é a bi ortogonal Bior 6.8.

A Tabela 7.9 mostra alguns valores de medidas de erro, para várias imagens

comprimidas com as wavelets bi ortogonais que são trabalhadas com diferentes taxas de bits.

Os resultados mostram que a wavelet Bior 6.8 apresenta os melhores resultados, levando-se

em conta as medidas de qualidade objetiva.

Fig. 7.9 – Avaliação comparativa com diferentes wavelets.


Wavelet bi ortogonal SNR MSE PSNR Correlação Taxa de bits (bpp)

1.1 2576,63013 3,332292 42,903373 0,999806 0,5

1.5 1993,87668 3,788733 42,345863 0,999749 0,5

2.4 5038,63175 2,382925 44,359699 0,999901 0,5

2.8 4992,95892 2,394034 44,3395 0,9999 0,5

3.1 2487,75056 3,391675 42,826662 0,999799 0,5

3.5 4455,88243 2,534085 44,092592 0,999888 0,5

3.7 4556,84739 2,506042 44,140921 0,99989 0,5

3.9 4552,53944 2,507173 44,138961 0,99989 0,5

4.4 5246,66739 2,335082 44,447782 0,999905 0,5

5.5 4802,97419 2,440641 44,255765 0,999896 0,5

6.8 5275,75444 2,328636 44,459787 0,999905 0,5

1.1 3306,12641 2,941918 43,444497 0,999849 0,6

1.5 2746,4915 3,228004 43,041463 0,999818 0,6

2.4 7014,51459 2,019682 45,077973 0,999929 0,6

2.8 6724,62736 2,062939 44,98594 0,999926 0,6

3.1 3831,45316 2,733002 43,764404 0,999869 0,6

3.5 6064,49055 2,172193 44,761819 0,999918 0,6

3.7 6203,52561 2,147871 44,810722 0,999919 0,6

3.9 6248,83487 2,140016 44,826634 0,99992 0,6

4.4 7449,62962 1,959764 45,208765 0,999933 0,6

5.5 7233,44281 1,988757 45,144985 0,999931 0,6

6.8 7640,49984 1,935263 45,263403 0,999935 0,6

Tabela 7.9 - Medidas de erro para várias taxas de bits para um nível de decomposição wavelet.

l=4.

175

Capítulo 8

Conclusões

1. No presente trabalho, são investigados vários métodos de codificação ROI com o

objetivo de lograr uma codificação sem perda de informação. Muitas técnicas foram

comparadas com o objetivo de buscar uma qualidade superior, mas ainda assim com

perdas.

Métodos de codificação com perdas talvez sejam aplicáveis somente em conjunto com

um codificador sem perdas para uma imagem regional residual.

Os resultados com uma codificação ROI dependem de vários fatores, incluindo o

tamanho e a forma da ROI. Além disso, para ROIs muito pequenas, o método mais

simples consiste em se utilizar codificação wavelet zerotree seguido de codificação

aritmética.

2. Quando uma compressão de imagens é baseada na codificação ROI e na WT, devem ser

considerados dois aspectos importantes:

Caso que a ROI seja definida e codificada no domínio espacial e,

Caso que a ROI seja definida e processada no domínio wavelet.

A abordagem espacial tem a vantagem de que a informação ROI corresponde à

percepção física da ROI. Essa abordagem funciona bem, quando se está interessado

apenas na informação ROI sem necessidade de se visualizar as outras partes da

imagem.

176 Capítulo VIII – CONCLUSÕES

3. O maior benefício da codificação ROI é a sua capacidade de oferecer alta qualidade de

reconstrução sobre certas regiões espaciais com altas taxas de compressão.

4. A codificação ROI pode ser incorporada dentro das técnicas de compressão, a qual

pode atingir uma transmissão progressiva. Isso permitiria que o usuário encerrasse a

transmissão de uma série de dados DICOM. Assim, uma região ROI é reconstruída com

uma boa qualidade e o tempo de transmissão pode ser grandemente reduzido.

Comentários

• Algoritmos de codificação revelam que o código incorporado com base na

transformada wavelet discreta atende aos principais requisitos para uma compressão de

imagens médicas. De fato, nesse caso conseguem-se diferentes tipos de suporte de

flexibilidade, codificação de regiões de interesse, qualidade e escalabilidade de

resolução. Além disso, decompõe-se uma imagem em um conjunto de coeficientes,

detalhes que constituem uma representação multiescala da imagem.

• Por outro lado, os métodos de compressão sem perdas, regionalmente têm o potencial

para uma aceitação médica generalizada. Isso porque os níveis de import}ncia variam,

assim como as características estatísticas e podem assim serem ajustadas para as

necessidades do radiologista.

“O importante na vida não é o sucesso, sim não,

o coragem de seguir adiante apesar dos tropeços

e que, a verdadeira sabedoria é em saber como

aumentar o bem-estar do mundo.”

E. Gladys Cutipa A.

177

Trabalho Futuro

1. Prosseguimentos a este trabalho podem incluir comparações de métodos para

múltiplas regiões ROI, simulações clínicas dos métodos de codificação em um sistema

de arquivamento, e codificação de regiões ROI com forma arbitrária. Para formas

arbitrárias, a descrição do limite real da ROI pode tornar-se significativa na contagem

de bits total.

O requisito para codificação sem perdas na ROI deve ser levado em conta na taxa de

distorção procurando-se um compromisso entre a precisão da descrição do limite, e a

sobrecarga necessária.

179

Referências Bibliogr{ficas

*1+ Gomes, J.; Velho, L.; Goldstein, S.,"Wavelets: Teoria, Software e Aplicações". São Paulo:

IMPA, 1997.

*2+ Portilla J.; Somoncelli, E. P., ‚Image Denoising Via Adjustment of Wavelet Coefficient

Magnitude Correlation‛ In: Proceedings of the IEEE Int'l Conf on Image Processing, 3,

2000, Vancouver. Proceedings... Vancouver: IEEE, 2000.p.277-280,2000.

*3+ Diniz, P. S. R.; Silva, E. A. B.; Lima, S. N., ‚Processamento Digital de Sinais: Projeto e

An{lise de Sistemas‛. Porto Alegre: Bookman, 2004.

*4+ Albuquerque, M. P.; Caner, E. S.; Melo, A. G., ‚An{lise de Imagem e Visão

Computacional‛. Rio de Janeiro: CBPF, 2004.

[5] Bertozzo, N.; Furuie, S. S., ‚Sistema de Armazenamento e Distribuição de Imagens

Médicas do PACS‛. InCor. [S.l], 2003. Disponível em:

<httt://www.avesta.com.br/anais/dados/trabalhos/274.pdf. >

*6+ Botelho, S. S. C., ‚Processamento Digital de Imagens: Conceitos B{sicos de Imagens‛.

(s.l.:s.n.),2005.Disponível em:

<http://www.ee.furg.br/~silviacb/DIP/Conceitos_Basicos.html>.

*7+ Gonzales, R. C.; Woods, R. E., ‚Digital Image Processing‛. (s.l.):Publishing Company,

1992.

http://www.avesta.com.br/anais/dados/trabalhos/274.pdf

180 REFERÊNCIAS BIBLIOGRÁFICAS

*8+ Albuquerque, M. P.; Caner, E. S.; Melo, A. G., ‚An{lise de Imagem e Visão

Computacional‛. Rio de Janeiro: CBPF, 2004

*9+ Alcocer,P. R. C.; Furuir, S. S.; Arie, S.; Melo, C. P. ‚A DICOM Graphic User Interface for

PC's: Towards a Hierarchical System for Dynamic Digital Angiographic Image Storage

and Visualization‛. RBE – Revista Brasileira de Engenharia. Caderno de Engenharia

Biomédica, Rio de Janeiro, v.12, p.191-201, 1996.

*10+ Gonzales, R. C.; Woods, R.E., ‚Digital Image Processing‛. Snd Ed., Prentice Hall, Upper

Saddle River, NJ, 2002.

*11+ Gonzales, R. C.; Woods, R. E., ‚Processamento de Imagens Digitais‛. São Paulo: Edgard

Blucher, 2000.

*12+ M.Ñelson, ‚The Data Compression Book‛. Redwood City, CA: MT Books, 1991.

[13] S. R. Tate, CSCI 5330.002: ‚Introduction to Data Compression.‛ Handout 2, University

of North Texas, January 1997.

[14] S. R. Tate97, CSCI 5330.002: ‚Data Compression and Information Theory.‛ Handout 3,

University of North Texas, January 1997.

*15+ Nijim Y.W., Stearns S.D., Mikhael W.B., ‚Differentiation Applied to Lossless

Compression of Medical Images‛. IEEE Trans, on Medical Imaging, vol.15, no. 4, p.555-

559, 1996.

[16] Pennebaker WB, Mitchell JL., ‚JPEG: Still Image Compression Standard‛. New York:

Van Nostrand Reinhold, 1993.

[17] V. G. Ruiz, ‚Compresión Reversible y Transmisión de Im{genes‛. Ph.D. Disertation,

Universidad de Almería, Departamento de Arquitectura de Computadores y

Electrónica, 2000.

REFERÊNCIAS BIBLIOGRÁFICAS 181

*18+ Chen Z.D., Chang R.F., Kuo W.J., ‚Adaptative Predictive Multiplicative Autoregressive

Model for Medical Image Compression‛. IEEE Trans, on Medical Imaging, vol. 18, no. 2,

p. 181-184, 1999.

*19+ Weinberger MJ, Seroussi G, Sapiro G. ‚LOCO-I: A Low Complexity,Ccontext-Based,

Lossless Image Compression Algorithm‛. In: Storer J, Cohn M, editors. Proceedings of

the IEEE Data Compression Conference.IEEE Computer Society Press, pp. 140–149. 1996.

[20] M. J. Weinberger, G. Seroussi, and G. Sapiro, ‚Loco-I: A Low Complexity, Context-

Based, Lossless Image Compression Algorithm‛. In Data Compression Conference

(DCC), pp. 140–149, 1996.

*21+ Wu X. ‚Lossless Compression of Continuous-tone Images Via Context Selection,

Quantization and Modeling‛. IEEE Transactions on Image Processing; 6(5):656–664,1997.

*22+ Huang L, Bijaoui A., ‚An Efficient Image Compression Algorithm Without Distortion‛.

Patter Recognition Letters; 12: 69 – 72, 1991.

*23+ Said A, Pearlman Wa. ‚Reversible Image Compression Via Multiresolution

Representation and Predictive Coding‛. Visual Communications and Image Processing

93, Proc SPIE ; 2094: 664 – 674, 1993.

[24] Nijim Y.W., Stearns S.D., Mikhael W.B., ‚Differentiation Applied to Lossless

Compression of Medical Images‛. IEEE Trans, on Medical Imaging, vol.15, no. 4, p.555-

559, 1996.

[25] Chen Z.D., Chang R.F., Kuo W.J., ‚Adaptative Predictive Multiplicative Autoregressive

Model for Medical Image Compression”. IEEE Trans, on Medical Imaging, vol. 18, no. 2,

p. 181-184, 1999.

*26+ Kivijarvi J., Ojala T., Kaukoranta T., Kuba a., Nyul L., Nevalainen O., ‚A Comparison of

Lossless Compression Methods for Medical Images‛. Computerized Medical Imaging and

Graphics, vol. 22, p. 323-339, August 1998.


[27] J. A. Leehan and S. C. Villalobos, ‚Estudio Comparativo de Cuatro Métodos de

Compresión para Im{genes de Resonancia Magnética Nuclear‛.Departamento de

Ingeniería eléctrica, Universidad Autónoma Metropolitana-Iztapalapa Av. Purísima y

Michoacán, 1999.

[28] N. Mark, ‚The Data Compression Book‛. Segunda edición ed. IDG Books Worldwide

Inc: MIT Books, 2001.

[29] S. Lo and K. Huang, ‚Radiological Image Compression: Full-frame bit allocation

technique‛. Radiology, vol. 155, pp. 811–817, 1985.

[30] ‚Compression of radiological image with 512, 1024 and 2048 matrices‛. Radiology, vol.

161, pp. 519–525, 1986.

[31] M. Antonini, M. Barlaud, P. Mathieu, and I. Daubechies, ‚Image Coding Using Wavelet

Transform‛. IEEE Transactions and Image Compressing, vol. 1, no. 2, pp. 205–220, 1992.

[32] P. Cosman, R. Gray, and R. Olshen, ‚Evluating Quality of Compressed Medical Images:

Subjective Rating, and Diagnostic Accuracy‛. Proceedings of the IEEE, vol. 82, no. 6, pp.

919–932, 1994.

[33] E. Moyano, P. Gonz{les, L. Orozco, and A. Garrido, ‚Paralelización de un Sistema de

Compresión Basado en Wavelets para Aplicaciones Médicas‛. X Jornadas de

Paralelismo, la Manga del Mar Menor – Murcia, Septiembre 1999.

*34+ S.Shenbaga Devi and K.Vidhya.,‚Development of Medical Image Compression

Techniques‛. ICCIMA.2007.

[35] R.S. Dilmaghani, A. Ahmadian, M.Ghavami, and A. H. Aghvami, IEEE Signal Processing

Letter, 11 (10), 806, 2004.

[36] W. B. Pennebaker and J. L. Mitchel,‚JPEG-Still Image Compression Standards‛. Van

Nostrand Reinhold, 1993.


[37] Ricke J., Maass P., Lopez Hanninen E., Liebin T., Amthauer H., Stroszczynski C.,

Schauer W., Boskamp T., Wolf M., ‚Wavelet versus JPEG (Joint Photographic Expert

Group) and Fractal Compression. Impact on the Detection of Low Contrast Details in

Computed Radiographs‛. Investigative Radiology, vol. 33, no. 8, p.456-463, 1998.

[38] Yuzo Iano, Fernando Silvestre da Silva, and Ana Lúcia Mendes Cruz, ‚Codificação

Fractal de Imagens‛. Revista de Telecomunicações, vol.11, no. 01, Maio 2008.

*39+ G.Strang e T.Nguyen, ‚Wavelets and Filter Banks”. Wellesley –Cambridge Press, 1996.

*40+ O.Rioul e M.Vetterli, ‚Wavelet and Signal Processing‛. IEEE Signal Processing Magazine,

vol.8, no. 4, pp. 14-38, Oct. 1991.

*41+ S.Shenbaga Devi and K.Vidhya. ‚Development of Medical Image Compression

Techniques‛ ICCIMA.2007

[42] R.S. Dilmaghani, A. Ahmadian, M.Ghavami, and A. H. Aghvami, IEEE Signal Processing

Letter, 11 (10), 806, 2004.

[43] J. Shapiro, ‚Embedded Image Coding Using Zerotrees of Wavelet Coefficients‛.

IEEETrans. Signal Processing, vol.41, pp. 3445-3463, Dec.1993.

[44] D. Taubman, ‚High Performance Scalable Image Compression with EBCOT‛. IEEE

Trans. Image Processing, vol. 9, pp. 1158-1170, July 2000.

[45] Faria, R. R. A., ‚ Wavelets e as artes multirresolucionárias‛, 1997.

Disponível em: <http://www.lsi.usp.br/~regis/wlets.html>.

[46] Daubechies, I., ‚Ten lectures on wavelets”. Philadelphia: SIAM Books, 1992.

[47] I. Daubechies, ‚Orthonormal Bases of Compactly Supported Wavelet‛. Commun. Pure

Applied Math., vol. 41, pp. 909–996, Nov. 1988.


[48] Nievergelt, Y., ‚Wavelets made easy‛. Boston: Bikhäuser, 1999.

[49] Silva, A.V.; Eyng, J., ‚Wavelets e Wavelet Packets‛. In: SEMINÁRIO VISÃO

COMPUTACIONAL, 2, 2000, Florianópolis. Visão Computacional.

Florianópolis: PPGCC - INE - UFSC, 2000. Disponível em:

< http://www.inf.ufsc.br/~visao/2000/Wavelets/index.html>.

[50] I. Daubechies. ‚Ten Lectures on Wavelets‛, The Society for Industrial and Applied

Mathematics, 1992.

[51] Osborne, D.; Rogers, D.; Mazumdar, J.; Coutts, R. ;Abbot, D., ‛ An Overview of

Wavelets for Image Processing for Wireless Applications‛. Proceedings of SPIE,

Autralia v. 4935, p. 427-435, 2002.

[52] Stollnits, E. J.; Derose, T. D.; Salesin, D. H. ‚Wavelets for Computer Graphics Theory

and Applications,‛ San Francisco: Morgan Kaufmann Publishers, 1996.

[53] Daubechies, I. ‚The Wavelet Transform, Time Frequency Localization and Signal

Analysis‛. IEEE Transactions on Information Theory, New York, v.36, p.961-1005, 1990.

[54] Falcão, A. X.; Leite, N. J., ‘Fundamentos de processamento de imagem digital‛.

Campinas: Unicamp, 1998.

[55] Coifman, R. ‚Adapted Multiresolution Analysis, Computation, Signal Processing and

Operator Theory‛. In: CONGRESS OF MATHEMATICIANS, 1990, Kioto. Proceedings .

Kioto:(s.n.), pp. 879-887,1990.

[56] Albuquerque, M. P., ‚Processamento de imagens: métodos e análises‛. Rio de Janeiro:

FACET, 2001.

[57] Stollnits, E. J.; Derose, T. D.; Salesin, D. H. ‚Wavelets for Computer Graphics Theory

and Applications‛. San Francisco: Morgan Kaufmann Publishers, 1996.

http://www.inf.ufsc.br/~visao/2000/Wavelets/index.html


[58] M.Antonini, M. Barlaud, P. Mathieu e I. Daubechies, ‚Image Coding Using Wavelet

Transform‛. IEEE Trans. on Image Processing , vol. 1, no. 2, Apr.1992.

[59] A. C. Franca, ‚Um Codec para Imagens Paradas Baseado em Transformada Discreta de

Wavelets e Quantização Linear Adaptativa‛. In: Anais do XIV Simposio Brasileiro de

Telecomunicações. (Curitiva, Brazil), vol.1, p. 67-72, Jul. 1996.

[60] C.M Brislawn, J. N. Bradley e T.Hopper, ‚The FBI Compression Standart for Digitized

Fingerprint Images.‛In: Proceedings of the SPIE Conference.Applications of Digital

Image Processing XIX, pp. 2847, 1996.

[61] J.M. Shapiro, ‚Embedded Image Coding Using Zerotrees of Wavelet Coeficients‛. IEEE

Trans. Signal Processing, vol. 41, PP. 3445-3462, Dec.1993.

[62] J. S. Lim, ‚Two Dimensional Signal and Image Processing‛. Englewood Cliffs, NJ:

Prentice-Hall, 1989.

[63] A. K. Jain, ‚Fundamental of Digital Image Processing‛. Englewood Cliffs, NJ: Prentice-

Hall, 1988.

[64] Gomes, J.; Velho, L. ; Goldstein, S. ‚Wavelets: Teoria, Software e Aplicações‛.São

Paulo: IMPA, 1997.

*65+ Y.M. Akay, M. akay, W. Welkowitz, and j,Kostis, ‚Noninvasive Detection of Coronary

Artery Disease‛. IEEE Eng. In Med. And Biol. Mag., vol. 13, no. 5, pp. 761-764, 1994.

[66] M.Akay, Y. M. Akay, W. Welkowitz, and S. Lewkowicz, ‚Investigating the Effects of

Vasodilator Drugs on the Turbulent Sound Caused by Femoral Artery Stenosis Using

Short-term Fourier and Wavelet Transform Methods‛.

IEEE Trans.Biomed. Eng., vol. 41, pp. 921-928, Oct. 1994.

[67] S.Mallat and W.L. Hwang, ‚Singularity Detection and Processing with Wavelets‛.

IEEE Trans. Informat. Theory, vol.38, pp. 617-643, Feb. 1992.


*68+ ‚Texture Classification and Segmentation Using Wavelet Frames‛.

IEEE Trans. Image Process., vol. 4, pp. 1549-1560. Nov. 1995.

[69] J. Radon, ‚Uber die Bestimmung von Functionen Durch ihre Integralwerte Langs

Gewisser Mannigfaltikeiten‛. Math-Phys. Kl, vol.69, pp. 262-267, 1987.

[70] D. Ludwig, ‚The Radon Transform on Euclidean Space‛. Comm. On Pure and

Appl.Mathematics, vol. 19, pp. 49-81, 1966.

[71] T. Olson and J. DeStefano, ‚Wavelet Localization of the Radon Transform‛, IEEE Trans.

Signal Process., vol. 42, pp. 2055-2067, Aug. 1994.

[72] G. Lemaur, ‚On the Choise on the Wavelet Basis Function for Image Processing‛

Master’s thesis, Université de Mons-Hainaut, Faculté des Sciences, 2003.

[73] J. D.Villasenor, B. Belzer, and J. Liao, ‚Wavelet Filter Evaluation for Image

Compression‛, IEEE Transactions on Image Processing, vol. 2, no. 2, pp. 1053–1060, 1995.

[74] Y. Shang, L. Li, and B. Wah, ‚Optimization Design of Bi orthogonal Filter Banks for

Image Compression‛, Information Sciences, vol. 132, pp. 23–51, 2001.

[75] J.Ñ. Bradley, C. M. Brislawn, and T. Hopper, ‚The FBI Wavelet/Scalar Quantization

Standar for Grayscale Finger Print Image Compression‛, In SPIE Proceedings vol 1961,

Visual Information Processing II, pp. 293–304, April 1993.

[76] M. Vetterli, ‚Wavelets, Approximation and Compression‛, IEEE Signal Procesing

Magazine, vol. 18, pp.59–73, 2001.

*77+ Digital Imaging and Communications in Medicine (DICOM), NEMA Publications,

‚DICOM Strategic Document‛, Ver. 8.0, April 2008, available at:

http://medical.nema.org/dicom/geninfo/Strategy.pdf

http://medical.nema.org/dicom/geninfo/Strategy.pdf


*78+ Horri, S.; Prior, F. ET AL.,‛DICOM: An Introduction to the Standard‛.

University of Pennsylvania.

www.ipl.utmck.edu/radiology/inforad/dicom_std/dicom_PSU_intro.html

[79] C. S. Burrus, R.A. Gopinath, and H. Guo, ‚Introduction to Wavelets and the Wavelet

Transform: A Primer‛, Englewood Cliffs, NJ: Prentice-Hall,1998.

[80] Howard PG, Vitter JS. ‚Fast and Efficient Lossless Image Compression‛

In: Storer J, Cohn M, editors. IEEE Data Compression Conference, IEEE Computer Society

Press, 1993:351 – 360.

[81] C. Liu, T. Xia, and H. Li, ‚ROI and FOI Algorithms for Wavelet-Based Video

Compression‛, In Proc. 5th Pacific Rim Conf. Multimedia, Tokyo, p.p 241, Nov. 2004.

[82] I. Ueno and W. Pearlman, ‚Region of Interest Coding in Volumetric Images With

Shape-Adaptive Wavelet Transform‛, in Proc. SPIE, vol. 5022, pp. 1048–1055, May 2003.

[83] S. Li and W. Li, ‚Shape-Adaptive Discrete Wavelet Transform for Arbitrary Shaped

Visual Object Coding‛, IEEE Trans. Circuits Syst. VideoTechnol., vol. 10, pp. 725–743,

Aug. 2000.

[84] S.B. Gokturk, C. Tomasi, B. Girod, and C. Beaulieu, ‚Medical Image Compression

Based on Region of Interest, With Application to Colon CT Images‛, Iin Proc. 23rd Ann.

Int. Conf. IEEE EMBS, Istanbul, p. 2453, 2001.

*85+ Z. Xiong, X. Wu, and D.Y. Yun, ‚Progressive Coding of Medical Volumetric Data Using

Three-Dimensional Integer Wavelet Packet Transform‛, In Proc. 2nd IEEE Workshop

Multimedia Signal Processing, Redondo Beach, CA, pp. 553–558, Dec. 1998.

*86+ D. Agrafiotis, D.R. Bull, and N. Canagarajah, ‚ROI Coding of Volumetric Medical

Images With Application to Visualisation‛, In Proc. 3rd Int. Symp.Image and Signal

Processing and Analysis, Rome, p. 217, Sept. 2003.

http://www.ipl.utmck.edu/radiology/inforad/dicom_std/dicom_PSU_intro.html


[87] Shepp L.A., Y.Vardi ‚Maximum Likelihood Reconstruction for Emission Tomography‛,

IEEE Trans.Med.Imag., vol.1(2):113-122, 1982.

[88] Tischer PE, Worley RT, Maeder AJ, Goodwin M. ‚Context-Based Lossless Image

Compression‛, The Computer Journal, 36(1): 68 – 77, 1993.

*89+ Golomb SW.,‛Run-length encodings”, IEEE Transactions on Information Theory ;IT12:399–

401, 1996.

*90+ Rice RF. ‚Some Practical Universal Noiseless Coding Techniques‛, Technical Report

JPL-79-22. Pasadena, CA: Jet Propulsion Laboratory, 1979.

[91] Wu X., Memon N.D., ‚Context-Based Adaptive Lossless Image Compression‛, IEEE

Transactions on Information Theory, vol. 23, p. 337-343, 1997.

[92] Misiti, M.; Misisti, Y.; Oppenheim, G.; Poggi, J. ‚Matlab: wavelet toolbox user's guide”.

Natick: Math Works, 1996.

[93] Charilaos and Touradj Ebrahimi.,‛The JPEG2000 Still Image Coding System: An

Overview‛, IEEE 2000.

[94] D.L. Donoho, ‚Denoising by Soft-Thresholding‛, IEEE Trans. Inform.Theory, vol.41, pp.

613-627, Mar. 1995.

[95] D.L. Donoho, ‚Threshold Selection for Wavelet Shrinkage of Noisy Data‛,

IEEE EMBS workshop on Wavelets in Med. And Biol., Baltimore, pp. 24a-24b, 1994.

[96] R.A. DeVore and B.J. Lucier, ‚Fast Wavelet Techniques for Near-Optimal Image

Processing‛, IEEE Military Commun. Conf., New York, pp.48.3.1-48.3.7, 1992.

[97] J.P. Guedon and Y.Bizais,‚Bandlimited and Haar Filtered Backprojection

Reconstructions‛, IEEE Trans. Med. Imag., vol.13, pp. 430-440, Mar. 1994.


[98] J.P. Guédon and M. Unser, ‚Least Squares and Spleen Filtered Back-Projection‛, NCRR

Rep.52/92, Nat. Inst. Health, 1992.

[99] J.P. Guedon, M. Unser, and Y. Bizais, ‚Pixel Intensity Distribution Models for Filtered

Back-Projection‛, Iin Proc. IEEE Med. Imaging Conf., santa Fe, NM, 1991, vol.3, pp. 2063-

2067.

*100+ Huang, H 97 ‚Multimedia Applications in Health Care‛, IEEE Multimedia Vol. 4, n°2.,

1998.

*101+ Meyer B., Tischer P., ‚TMW a New Method for Lossless Image Compression‛,

Proceedings of International Picture Coding Symposium, Berlin, p. 217-220, 1997.

*101+ Moyano A. Encarnación, Quiles F. Francisco., ‚Técnicas de Compresión sobre Im{genes

Médicas‛, Universidad de Castilla-La Mancha.

*102+ Y.Sheng,‚The Transforms and Applications Handbook‛, CRC Press, 1996.

*103+ J.B. Weaver, X. Yansun, D. M. Healy, Jr., and L.D. Cromwell,‚Filtering Noise from

Images with Wavelet Transforms‛, Magnet. Reson. In Med., vol.21, no. 2, pp.288-295,

1991.

*104+ Y. Xu, J.B. Weaver, D.M. Healy, Jr., and J.Lu, ‚Wavelet Transform Domain Filters: A

Spatially Selective Noise Filtration Technique‛, IEEE Trans. Image Process., vol. 3, pp.

747-758, Dec.1994.

*105+ J. Azpiroz and J.F. Lerallut, ‚Selection of birthogonal filters for image compression or images

using wavelet packets‛, Dept. Ing. Elétrica, Universidade Autónoma Metropolitana-

Iztapalapa, 1999.

*106+ S.Grgic, M.Grgic, and B.Zovko-Cihlar, ‚ Performance Analysis of Image Compression

Using Wavelet‛, IEEE Transactions on Industrial Electronics, vol. 48, no.3, pp.682-695,

2001.


*107+ M.Antonini, M. Barlaud, P. Mathieu, and I. Daubechies, ‚Image Coding Using Wavelet

Transform‛, IEEE Transactions and Image Compressing, vol. 1, No. 2, pp. 205-220, 1992.

*108+ A. Said and W.A. Perlman, ‚A New, Fast and Efficient Image Codec Based on Set

Partitioning in Hierarquical Trees‛, IEEE Trans Med. Imaging, vol. 6, No. 3, pp. 243-250,

1996.

[109] M. Antonini, M. Barlaud, P. Mathieu, and I. Daubechies, ‚Image Coding Using Wavelet

Transform‛, IEEE Transactions and Image Compressing, vol. 1, no. 2, pp. 205–220, 1992.

[110] J. D.Villasenor, B. Belzer, and J. Liao,‚Wavelet Filter Evaluation for Image

Compression‛, IEEE Transactions on Image Processing, vol. 2, no. 2, pp. 1053–1060, 1995.

[111] S. Grgic, M. Grgic, and B. Zovko-Cihlar,‚Performance Analysis of Image Compression

Using Wavelets‛, IEEE Transactions on Industrial Electronics, vol. 48, no. 3, pp. 682–695,

2001.

[112] Liu, L. & Fan, G. ‚A New Method for JPEG2000 Region of Interest Image Coding: Most

Significant Bitplanes Shift‛, IEEE Signal Processing, 10(2), P.35-39, 2003.

[113] Wang, Z. & Bovik, A. C. ‚Bitplane-by-Bitplane Shift (BbBShift): A suggestion for

JPEG2000 Region of Interest Coding,‛ IEEE signal Processing Letters, 9(5), p. 160-162,

2002.

[114] G. Anastassopoulos and A. Skodras, ‚JPEG2000 ROI coding in medical imaging

applications,‛ presented at 2nd IASTED Int. Conf. Visualization, Imaging and Image

Processing (VIIP2002), Malaga, Spain, Sept. 2002.

[115] ISO/IEC JTC 1/SC 29/WG 1 (ITU-T SG8), JPEG 2000 Part II Final Committee Draft, Dec.

2000.


[116] ISO/IEC JTC 1/SC 29/WG 1 (ITU-T SG8), JPEG 2000 Part I Final Committee Draft Version

1.0, Mar. 2000.

[117] Z. Liu, J. Ha, Z. Xiong, Q. Wu, and K. Castleman,‚Lossy-to-lossless ROI Coding of

Chromosome Images Using Modified SPIHT and EBCOT‛, in Proc. IEEE Int. Symp.

Biomedical Imaging, Washington, DC, p. 317. Jul.2002.

[118] D. Taubman, ‚High Performance Scalable Image Compression With EBCOT‛, IEEE

Trans. Image Processing, vol. 9, pp. 1158–1170, Jul. 2000.

[119] Z. Liu, J. Ha, Z. Xiong, Q. Wu, and K. Castleman, ‚Cascaded Differential and Wavelet

Compression of Chromosome Images‛, IEEE Trans. Biomed.Eng., vol. 49, pp. 323–283,

Apr. 2002.

[120] G. Minami, Z. Xiong, A. Wang, and S. Mehrotra, ‚3-D Wavelet Coding of Video With

Arbitrary Regions of Support‛, IEEE Trans. Circuits Syst. VideoTechnol., vol. 11, pp.

1063–1068, Sept. 2001.

[121] S. Tasdoken and A. Cuhadar, ‚ROI Coding with Integer Wavelet Transforms and

Unbalanced Spatial Orientation Trees‛, presented at 25th Ann. Int. Conf. IEEE EMBS,

Mexico, Sept. 2003.

[122] M. Penedo, W.A. Pearlman, P.G. Tahoces, M. Souto, and J.J. Vidal, ‚Region-Based

Wavelet Coding Methods for Digital Mammography‛, IEEE Trans. Med. Imag., vol. 22,

pp.1288–1296, Oct. 2003.

[123] S. Li and W. Li, ‚Shape-Adaptive Discrete Wavelet Transform for Arbitrary Shaped

Visual Object Coding‛, IEEE Trans. Circuits Syst. Video Technol., vol. 10, pp. 725–743,

Aug. 2000.

[124] A. Islam and W.A. Pearlman, ‚An Embedded and Efficient Low-Complexity

Hierarchical Image Coder‛, in Proc. SPIE, vol. 3653, p. 294–305, Dec. 1999.


[125] C.N. Doukas, I. Maglogiannis, and G. Kormentzas, ‚Medical Image Compression

Using Wavelet Transform on Mobile Devices with ROI Coding Support,‛ in Proc. 27th

Ann. Int. Conf. IEEE EMBS, Shanghai, China, pp. 3779–3784, Sept. 2005.

[126] R. Dilmaghani, A. Ahmadian, M. Ghavami, M. Oghabian, and H. Aghvami, ‚Multi

rate/resolution control in progressive medical image transmission for the region of

interest (ROI) using EZW‛, presented at the 25th Ann. Int. Conf. IEEE EMBS, Mexico,

Sept. 2003.

[127] S.B. Gokturk, C. Tomasi, B. Girod, and C. Beaulieu, ‚Medical Image Compression

Based on Region of Interest, with Application to Colon CT Images‛, in Proc. 23rd Ann.

Int. Conf. IEEE EMBS, Istanbul, p. 2453, 2001.

[128] A. Cziho, G. Cazuguel, B. Solaiman, and C. Roux, ‚Medical Image Compression Using

Region-of-Interest Vector Quantization‛, in Proc. 20th Ann. Int. Conf. IEEE EMBS, Hong

Kong, p. 1277, 1998.

[129] N.M. Nasrabadi and R.A. King, ‚Image Coding Using Vector Quantization: A

Review‛, IEEE Trans. Commun., vol. 36, pp. 957–971, Aug. 1988.

[130] D. Agrafiotis, D.R. Bull, and N. Canagarajah, ‚ROI Coding of Volumetric Medical

Images with Application to Visualisation‛, in Proc. 3rd Int. Symp. Image and Signal

Processing and Analysis, Rome, p. 217, Sept. 2003.

[131] D. Gibson, M. Spann, and S.I. Woolley, ‚A Wavelet-Based Region of Interest Encoder

for the Compression of Angiogram Video Sequences‛, IEEE Trans. Inform. Technol.

Biomed., vol. 8, pp. 103–113, Jun. 2004.

[132] P. Bharti, S. Grupta, R. Bhatia, ‚Comparative Analysis of Image Compression

Techniques: A Case Study on Medical Images‛, in Int. Confer. Technol. Communication

and Computing, 2009.


[133] K. Dejhan, S.Yimmun, P. Suapang, K. Mongkut, ‚A Web-based DICOM-Format Image

Archive, Medical Image Compression and DICOM Viewer System for Teleradiology

Application‛, in SICE Annual Conference 2010.

Livros: 1. A concise introduction to data compression

Autor: David Salomon

London; Springer, ©2008.

Pag. 21-57, 143-198.

2. Biosignal and Biomedical Image Processing

MATLAB – Based Applications

Autor: John L. Semmlow

Switzerland; Dekker, ©2004.

Cap. VII , X e XIII.

3. Compression of Biomedical Images and Signals

Autor: Christine Cavaro-Menard

France; Lavoisier, ©2007.

Pag. 01-10, 15-39, 77-95, 101-111, 129-150, 155-181, 187-207.

4. Compression of Biomedical Images and Signals

Autor: Christine Cavaro-Menard

©ISTE Ltd, 2008.

Pag. 01-39, 50-72, 155-173.

5. Digital Imaging and Communications in Medicine (DICOM)

A Practical Introduction and Survical Guide

Autor: Oleg S. Pianykh

Berlin; Springer, ©2008.

Pag. 5-42, 46-47, 63-98, 222-244, 275-292.


6. Data Compression

Autor: David Salomon

London; Springer, ©2007.

Pag. 17-41, 263-417, 532-639.

7. Digital Image Processing for Medical Applications

Autor: Geoff Dougherty

Cambridge, ©2009.

Pag. 03-44, 115-119, 231-242, 309-335.

8. Fundamentals of Wavelets

Theory, Algorithms, and Applications

Autor: Jaideva C. Goswami , Andrew K. chan

New Jersey; Wiley, ©2011.

Pag. 71-77, 94-112, 114-145, 147-207,

9. Handbook of Medical Imaging

Volume 3. Display and PACS

Autor: Yongmin Kim and Steven C. Horii

Washington; SPIE, ©2000.

Pag. 221-270, 335-400, 467-494.

10. Introduction to Biomedical Imaging

Autor: Andrew Webb


Pag. 34- 50, 157-213, 220-236.

11. Insight into Images

Principles and Practice for Segmentation,

Registration, and Image Analysis

Autor: Terry S. Yoo

Canada; Wellesey, ©2004.

Pag. 3-44, 119 – 128, 237 – 295, 307 – 337, 351 – 375.


12. Image Processing, Analysis, and Machine Vision

Autor: Milan Sonka, Vaclav Hlavac and Roger Boyle

Thomson, ©2008.

Pag. 11-30, 65-79, 694-714.

13. JPEG2000 Standard for Image Compression

Concepts, Algorithms and VLSI Architectures

Autor: Tinku Acharya, Ping-Sing Tsai


Pag. 1-103, 137-201.

14. Medical Imaging Systems Technology

Autor: Cornelius T. Leondes

© 2005.

Pag. 161-296.

15. PACS and Imaging Informatics

Basic Principles and Applications

Autor: H.K.Huang, D.Sc., FRCR (Hon.)


Pag.03-150,153-306, 485-566.

16. Still Image and Video Compression with MATLAB®

Autor: K.S. Thyagarajan

New Jersey; Wliley , ©2011.

Pag. 37-59, 99-129, 133-155, 199-233, 259-296.

17. The JPEG200 Suite

Autor(es): Peter Schelkens, Athanassios Skodras, Touradj Ebrahimi

Wiley,© 2009.

Pag. 49-66, 71-100, 280-351.


18. The Image Processing - Handbook

Autor: John C. Russ

©2007.

Pag. 174-191, 397-436, 629-663.

19. Visualization In Medicine

Theory, algorithms, and applications

The Morgan Kaufmann Series in Computer Graphics

Autor: Bernhard Preim, Dirk Bartz

Elsevier Inc., ©2007.

Pag.03-22,25-63, 65-77,83-116.

20. Wavelet Image and Video Compression

Autor: Pankaj N. Topiwala

©1998.

Pag. 43-57, 61-77, 123-146, 157-168, 237-250, 253-267.

21. Wavelets and their Applications

Autor(es): Georges Oppenheim and Jean-Michel Poggi

©ISTE Ltd, 2007.

Pag. 1-27, 37-60, 63-88, 225-233, 235-276, 297-314.

22. DICOM Cookbook

Autor: Philips

©1997

23. Medical Image Analysis

Autor: Atam P. Dhawan

New Yersey; © Wiley 2011

24. Introducción al Mundo Fractal

Autor: Ewaldo Hott y Pablo Gutierrez

© 2004


Teses

1. V.G. Ruiz, ‚Compresión reversible y transmission de im{genes,‛ Ph.D. Tesis,

Universidad de Almería, Departamento de Arquitectura de Computadores e Electrónica,

2000.

2. S. Rout, ‚Orthogonal vs. biortogonal wavelets for image compression,‛ Master’s thesis,

Faculty of the Virginia Polytechnic Institute and State University (Virginia Tech), August

2003.

3. G. Lemaur, ‚On the choise on the wavelet basis function for image processing,‛ Master’s

thesis, Université de Mons-Hainaut, Faculté des Sciences, 2003.

4. K. A. Kotteri, ‚Optimal, multiplierless implementations of the discrete wavelet transform

for image compression applications,‛ Master’s thesis, Virginia Polytechnic Institute and

State University, 2004.

5. E. Chiu, ‚Lossy compression of medical ultrasound images using space-frequency

segmentation,‛ Master’s thesis, Simon Fraser University, 2001.

Páginas Webs

1. www.im.med.up.pt/sinal_imagem/sinal_imagem.html

2. www.pt.scribd.com/prfonseca/d/19193510-Reconstrucao-de-imagens-3D

199

Equipes não

DICOM

Aquisição

imagem

Codificador DICOM

e/ou compressão

Decodificador DICOM e

descompressão

Processamento de imagem

• Aprimoramento de contraste

local.

• Técnicas de interpolação

adaptativa.

• Cinema loop

Servidor DICOM

• Sistema database imagem

Equipes

DICOM

Servidor

web

Espectador DICOM

Ligar (Plug-in)

Navegador web

Cliente A

Espectador DICOM

Ligar (Plug-in)

Navegador web

Cliente B

Espectador DICOM

Ligar (Plug-in)

Navegador web

Cliente C

Apêndices

Apêndice A: Interações em DICOM

A.1 Sequência de interações clientes/servidor baseado na web e no arquivo

DICOM

Fig. A.1 – Estrutura básica e sequencia de interações entre cliente e servidor

baseado na web e no arquivo do padrão DICOM, para compressão de imagem

médica e sistema visualizador DICOM em aplicações de teleradiologia [133].

5 3 4

Extração do

dado texto

2

Fig. A.2 - Passos de transformação de dados para o formato DICOM [133].

Dado

texto

Elemento Dado

Dado

bruto

Dado adicional (se

for necessário)

Dado

texto

Arquivo

DICOM Elemento

Dado

Integração

do elemento

dado

Codificador

Análise do

dado de

entrada

1

Extração do

dado texto

2

3 4 5

200 APÊNDICE A: INTERAÇÕES EM DICOM

A.2 Codificação de imagens DICOM

As imagens DICOM primeiro são decompostas usando-se um filtro wavelet. Os

coeficientes wavelets são codificados usando-se ROI e SPIHT. O algoritmo inicia na sub-banda

‚coarsest‛ da sub-banda piramidal. SPIHT captura a informação do plano de bits de todos os

coeficientes da DWT que são organizados em três subconjuntos:

1) Lista de pixels significativos LSP (List of Significant Pixels);

2)Lista de pixels insignificantes LIP (List of Insignificant Pixels);

3)Lista de série de pixels insignificantes LIS (List of Insignificant Sets of Pixels).

LSP constitui as coordenadas de todos os coeficientes que são significantes. LIS contem as

raízes do conjunto insignificante de coeficientes. Finalmente, LIP contem uma lista de todos

os coeficientes que não pertencem a LIS ou LSP e são insignificantes. Durante a codificação

esses subconjuntos são examinados e etiquetados como significativos se alguns dos

coeficientes têm uma magnitude maior que o limiar (threshold) dado. O codificador de mapa

significante é seguido por um passo de refinamento, no qual a representação dos coeficientes

significantes é refinada. O algoritmo SPIHT envia a representação binária do valor inteiro dos

coeficientes da wavelet.

Fig. A.3 – (a) Diagrama de compressão da imagem DICOM.

(b) Diagrama de reconstrução da imagem DICOM.

Imagem

DICOM

comprimida

Dado

imagem

Fluxo de bits

(Bit Stream)

Transformada

wavelet discreta

Codificação

ROI

Codificador

SPIHT

Criar vsROI, vsBG

Modificação do

TSUID Cabeçalho

DICOM

(a)

Imagem

DICOM

comprimida

Fluxo de bits

(Bit Stream)

Cabeçalho

DICOM

Decodificador

SPIHT

Decodificador

ROI

Transformada

wavelet discreta

inversa

Dado

imagem

(b)

CODIFICADOR

DECODIFICADOR

APÊNDICE A: INTERAÇÕES EM DICOM 201

Codificador para um arquivo imagem DICOM :

DJEncoderRegistration : : registerCodecs ( ) ; // registrar JPEG codecs

DcmFileFormat fileformat;

If (fileformat.loadFile (‚test.dcm‛) . good ( ))

{

DcmDataset * dataset = fileformat.getDataset ( );

DcmItem *metaInfo = fileformat.getMetaInfo ( ) ;

DJ RPLossless params; // parametros codecs,

// Isso faz com que a versão JPEG para um conjunto de dados a ser criado seja sem perda

>chooseRepresentation (EXS_JPEGProcess14SV1TransferSyntax, &params);

// verifica sim tudo correu bem

If (dataset-

>canWriteXfer (EXS-JPEGProcess14SV1TransferSyntax))

{

// forçar os UIDs do cabeçalho para voltar a ser gerado quando se armazena o arquivo

// uma vez que os UIDs do conjunto de dados pode ter mudado

delete metaInfo -> remove (DCM_MediaStorageSOPClassUID);

delete metaInfo -> remove (DCM_MediaStorageSOPInstanceUID);

// armazenar no formato JPEG sem perda

Fileformat. saveFile (‚test-jpeg.dcm‛),

EXS_JPEGProcess14V1TransferSyntax);

}

}

DJEncoderRegistration : : cleanup( ) ;

Decodificador para um arquivo imagem DICOM :

DJDecoderRegistetration : : registerCodecs ( ) ; // registrar o codecs JPEG

DcmFileFormat fileformat;

If (fileformat . loadFile (‚test_jpeg.dcm‛) . good())

{

202 APÊNDICE A: INTERAÇÕES EM DICOM

DcmDataset * dataset = fileformat.getDataset ();

// descompactar o conjunto de dados comprimido

Dataset ->chooseRepresentation (EXS_LittleEndianExplicit, NULL);

// verifica sim todo correu bem

If (dataset ->canWriteXfer (EXS_LittleEndianExplicit))

{

Fileformat.saveFile (‚test_decompressed.dcm‛,

EXS_LittleEndianExplicit);

}

}

DJDecoderRegistration : : cleanup ();

203

Apêndice B: Geração da máscara

B.1 Geração da máscara ROI

Quando uma imagem é codificada com a ROI, é necessário identificar os coeficientes

wavelets necessários para a reconstrução da ROI. Assim, a máscara ROI é introduzida para

indicar qual coeficiente wavelet deve ser transmitido para que o receptor possa reconstruir a

ROI [114].

ROI

Fig. B.2 – Geração da máscara ROI para uma ROI.

Resultado

... 11011... Geração da

máscara

Codificação

ROI

Algoritmo de

compressão

Máscara de

tamanho LL

Máscara de

tamanho LL

Parâmetros da

ROI

Parâmetros de

escalonamento

Fig. B.1 – Diagrama de geração da máscara ROI.

204 APÊNDICE B: GERAÇÃO DA MÁSCARA

A geração da máscara ROI é feita por filas e colunas em cada nível de decomposição.

O processo se repete até que a árvore da wavelet inteira seja processada, como se mostra na

Fig. B.2. Os coeficientes wavelets que são requeridos para reconstruir um pixel são

selecionados dependentes da longitude wavelet.

Por exemplo, seja a amostra denotada como X(n) e as amostras de sub-bandas de

baixas e altas frequências denotadas por L(n) e H(n), respectivamente. Para um filtro wavelet

9/7, os coeficientes necessários para reconstruir X(2n) são L(n-1), L(n), L(n+1), H(n-2), H(n-1),

H(n), e H(n+1). Para reconstruir X(2n+1), necessita-se de L(n-1), L(n), L(n+1), L(n+2), H(n-2),

H(n-1), H(n), H(n+1), e H(n+2) [115][116], como se mostra na Fig. B.3.

B.2 Geração da máscara pai (PROI) da ROI

O algoritmo de codificação ROI examina se cada nó é necessário para que o

decodificador reconstrua a ROI. Ele testa se é um coeficiente ROI, antes de testar se é

significante (node test). Se o nó não é um coeficiente ROI, seu teste de nó é pulado e realiza-se

o próximo. Logo, o codificador examina se o descendente de cada nó é significante

(descendant test). Não obstante, a informação acerca dos descendentes se é ou não significante

não é necessária para que o decodificador reconstrua a ROI. Sabe-se que, um descendente de

um nó sem a árvore de orientação espacial não é um coeficiente ROI. Não obstante, uma nova

máscara de PROI é necessária. Essa indica os nós, cujos descendentes são coeficientes ROI. A

Fig. B.3 – Transformada wavelet inversa 9/7. Os coeficientes necessários para

reconstruir X(2n) e X(2n+1) são L(n-1) a L(n+2) e H(n-2) a H(n+2), respectivamente.

APÊNDICE B: GERAÇÃO DA MÁSCARA 205

máscara PROI é um plano de bits indicando que os nós têm um último e único descendente

necessário para a reconstrução da ROI. A relação entre a máscara ROI e a máscara PROI é

definida como:

PROI (i,j) = ROI(OffS1(i,j)) V ROI (OffS2(i,j)) V ROI(OffS3(i,j)) V ROI(OffS4(i,j)) (B.1)

Onde PROI (i,j) e ROI(i,j) representam o valor binário da máscara PROI e a máscara ROI no

nó (i,j), respectivamente. OffSk(i,j) representa o K-ésimo offspring do nó (i,j), e V denota a

operação lógica binária OR.

(a)

Fig. B.4 – Exemplo da geração da máscara PROI da máscara ROI. (a) Relação de

uma máscara PROI com uma máscara ROI. (b) Exemplos de máscaras ROI e PROI.


B.3 Aplicação do modelo de compressão da Fig.A.3 a uma imagem CT.

Fig. B.5 – Modelo de compressão da Fig.A.3 para uma imagem DICOM CT.

Conversão a

DICOM.pgm

1011001010

1011001010

1011001010

CT-Crâneo.pgm

Modificação do

TSUID Cabeçalho

DICOM

Fluxo de bits

(Bit Stream)

CT-Crâneo.dcm CT-Crâneo-ROI.pgm

Codificador da

Fig.A.3

Imagem

comprimida

CT- Crâneo-ROI .jp2

Imagem

DICOM

Transmissão

Receptor

(Receiver)

Cabeçalho

DICOM

Conversão a

DICOM.pgm

(MATLAB)

Decodificador

da Fig.A.3

CT-Crâneo-ROI-rec.dcm CT-Crâneo-ROI-rec.pgm

Fluxo de bits

(Bit Stream)

Saída da imagem

DICOM


B.4 Medidas objetivas e qualitativas

A avaliação das imagens reconstruídas foi baseada nas medidas de compressão e

critérios de fidelidade da sec.3.2. Na Fig. B.6 mostra-se a relação entre o PSNR e a taxa de bits

tanto para uma imagem com ROI quanto para uma sem ROI. As imagens são comprimidas e

descomprimidas em 0.08 bpp até 4.0 bpp (128:1, 64:1, 32:1, 16:1, 8:1, 4:1, 2:1 taxas de

compressão) em 1/128, 1/64 e 1/32 níveis de quantização (Fig. B.6).

A superioridade da codificação ROI, em diferentes níveis de quantização ocorre tanto

objetiva quanto qualitativamente. Em um nível de quantização 1/128 tem-se uma razão de

compressão de 16:1. Qualitativamente, a imagem está na escala de nível 4 e objetivamente se

ganha 20,31 dB. Em um nível de quantização 1/64 com a mesma razão de compressão,

qualitativamente a imagem fica na escala 4, e objetivamente se ganha 9,31 dB. Em um nível

de quantização 1/32 com a mesma razão de compressão, qualitativamente a imagem cai para

Fig. B.6 – Medida objetiva para uma imagem DICOM CT com ROI e sem ROI.


um nível 4. O resultado mostra objetivamente que, a aplicação da codificação ROI baseada

sobre uma técnica DWT apresenta bons resultados na compressão de imagens DICOM

quanto se compara com uma codificação sem uso da ROI.

B.5 ROI com diferentes níveis de resolução

Quanto existe a possibilidade de se ter uma série arbitrária de coeficientes wavelet, é

possível ter também diferentes ROIs em diferentes níveis de resolução. Isso pode ser usado

para se prover algumas características adicionais. Se, para uma instância, a ROI selecionada é

menor que a imagem, então não haverá nenhuma informação recebida para o fundo nas fases

inicias da transmissão da imagem. Mas, caso se deseje obter alguma informação do fundo

numa fase precoce, é possível incluir todos os coeficientes do nível de resolução mais baixo

na máscara ROI.

Isso significa que, a versão de baixa resolução da imagem pode ser transmitida junto

com toda a informação pertencente à ROI seguida envia-se o restante da informação

pertencente ao fundo. Outra possibilidade é ter um único ROI presente em alguns níveis de

resolução. Isso significa que, a ROI poderia ser transmitida em certo nível de resolução e em

seguida envia-se a informação pertencente à imagem inteira.

Função para se definir a ROI

cvSetImageROI( IplImage* img, CvRect rect )

// ‚img‛ a imagem de origem e ‚rect‛ é a área dentro da imagem origem. Função para

redefinir a região de interesse:

cvResetImageROI( IplImage* img )

------

// Cortar um objeto e armazenar a nova imagem

1. /* Imagem de entrada */

2. IplImage *img1 = cvLoadImage("linfoma.jpg", 1);


3. /* Define a região de interesse dentro da imagems */

4. cvSetImageROI(img1, cvRect(10, 15, 150, 250));

5.

6. /* Crear imagem de destino

7. cvGetSize volta a largura e a altura da ROI */

8. IplImage *img2 = cvCreateImage(cvGetSize(img1),

9. img1->depth,

10. img1->nChannels);

11.

12. /* cópia sub-imagem */

13. cvCopy(img1, img2, NULL);

14.

15. /* Redefine a região de interesse */

16. cvResetImageROI(img1);

211

Apêndice C: SPIHT

C.1 SPIHT

A seguinte série de coordenadas é usada para apresentar o método SPIHT:

O (i,j): conjunto de coordenadas de todos os filhos do nó (i,j).

D (i,j): conjunto de coordenadas de todos os descendentes do nó (i,j).

H: conjunto de coordenadas das raízes das arvores (nodos no mas alto nível

piramidal).

L(i,j) = D(i,j) – O(i,j).

Para as várias instâncias, exceto nos níveis da pirâmide maior e menor, tem-se:

O (i,j) = {(2i, 2j), (2i, 2j+1), (2i+1, 2j), (2i+1, 2j+1)} (C.1)

As regras do conjunto partição são as seguintes:

1) A partição inicial é formada com o conjunto ,(i,j)} e D(i,j), para todo (i,j)є H.

2) Se D(i,j) é significante , então ele é dividido em L(i,j) adicional aos quatro conjuntos de

elementos simples com (k,l) є O(i,j).

*

Fig. C.1 – Exemplo de dependência pai-filho na

árvore de orientação espacial.

212 APÊNDICE C: SPIHT

3) Se L(i,j) é significante , então é dividido dentro de quatro conjuntos D(i,j), com (k,l) є

O(i,j).

Algoritmo SPIHT

1) Initialization (Inicializar):

n=floor (log2 (max(i,j),|ci,j|}));

Lista LSP vazio

Lista LIP com coordenadas (i,j) H

LIS igual que a LIP com a exceção de quem não tem descendência, com etiqueta A.

2) Sorting Pass (Passo de classificação)

2.1) Para cada entrada (i,j) na LIP fazer:

2.1.1) Enviar saída Sn(i,j);

2.1.2) Se Sn(i,j)=1 então

Mover (i,j) para a LSP e a saída é o sinal de ci,j;

2.2) Para cada entrada (i,j) na LIS fazer:

2.2.1) Se a entrada é do tipo A, então

Saída Sn(D(i,j));

Se Sn(D(i,j)) = 1 então

* Para cada (k,1) є O(i,j) fazer:

Saída Sn(k,l);

Se Sn(k,l) = 1 então adicionar (k,l) para a LSP e a saída é o sinal ck,l;

Se Sn(k,l) = 0 então adicionar (k,l) para o final da LIP;

* Se L(i,j)≠ então mover (i,j) para o final de LIS, como uma etiqueta tipo B,

e ir ao passo 2.2.2; caso contrário remover a entrada (i,j) da LIS;

2.2.2) Se a entrada é do tipo B, então

Saída Sn(L(i,j));

Se Sn(L(i,j)) = 1 então

* Adicionar cada (k,l)є O(i,j) para o final da LIS com etiqueta tipo A;

* Remove (i,j) da LIS.

APÊNDICE C: SPIHT 213

3) Refinement Pass (Passo de refinamento)

Para cada entrada (i,j) na LSP, | exceção os incluídos no último passo de classificação,

enviar saída ao n-ésimo bit significante de |ci,j|;

4) Threshold update (Passo de atualização)

Decrementar n em 1 e ir ao passo 2). Para n>=0.

215

Apêndice D:

D.1 – Aplicações de diferentes métodos de codificação ROI em imagens médicas

Métodos de

codificação ROI Referência

Categoria da

imagem médica

Aplicado ao tipo

de imagem Comentários

ROI baseada em

escalonamento [114][115]

Imagens ainda

em 2D Nefrostograma

Parte de JPEG2000. A imagem

pode ser a mesma em caso de fluxo

de bits truncado.

MaxShift [114][116] Imagens ainda

em 2D Nefrostograma

Processo de decodificação simples

sem a necessidade de se gerar uma

máscara ROI.

Codificação ROI

lossy-to-lossless

[117][118]

[119][120]

Imagens ainda

em 2D

Imagens de

cromossomos

Sem perda de compressão de

imagem fornecida. A ROI pode ser

pré-determinada.

OB-SPIHT,

OB-SPECK

[122][123]

[124]

Imagens ainda

em 2D Mamografia

O fluxo de bits pode ser truncado.

Provê alta qualidade de compressão

na região mamária.

EZW baseada na

ROI [125][126]

Imagens ainda

em 2D

Mamaografia,

Exames de TC do

joelho

A ROI é progressivamente

decodificada no receptor.

Codificação

híbrida [127]

Imagens

volumétricas Colon TC A ROI pode ser pré-determinada.

ROI-VQ [128][129] Imagens ainda

em 2D

Imagens de

endocopia

Obtém-se bom desempenho

taxa/distorção com boa preservação

da qualidade ROI.

3D-SPIHT

estendido [130]

Imagens

volumétricas MRI da cabeça

Similar ao método de

escalonamento, sendo simples e

eficiente.

3D-SPIHT

estendido [131]

Sequencia de

vídeos médicos

Sequência de

vídeos para

angiografia

Codificação ROI eficiente em

sequência de vídeos médicos.

Tabela D.1 – Visão geral das técnicas de codificação ROI,

apresentando as referências relacionadas.

216 APÊNDICE D

D.2 Comparação das características das técnicas de codificação ROI

Coeficientes

adicionais

para

decodificar o

objeto

Informação

incorporada na

codificação

Codificação

ROI arbitraria

Decodificação

exata do objeto

Resultados

correspondentes:

(PSNR em dB) (bits

por pixeis)

Método de

escalonamento

geral

Requerido Requerido Suportada - 44,91 (0,08 bpp)

MaxShift Requerido - Suportada - 44,90 (0,08 bpp)

Codificação

ROI lossy-

lossless

- Requerido - Possível 44,4 (0,08bpp)

RB-IWT - - Suportada - 35 (0,8 bpp)

OB-SPIHT,

OB-SPECK - - Suportada - 54,2 (0,8 bpp)

EZW baseado

na ROI Requerido - Suportada - N/A

Codificação

híbrida - Requerido - Possível 32,0 (0,52 bpp)

ROI-VQ Requerido - - Possível 31,58 (0,03 bpp)

Estendido 3D-

SPIHT - - - - 38,78 (0,52 bpp)

Tabela D.2 – Comparação das características das técnicas de codificação ROI. A

comparação inclui o número de coeficiente necessário para codificar a ROI e a imagem.

universidade estadual de campinasrepositorio.unicamp.br/jspui/bitstream/reposip/260054/1/... ·...

Documents