compressão de imagens baseada em quantização vetorial e ... · de quantizac¸a˜o vetorial (qv)...

2
XXXV SIMP ´ OSIO BRASILEIRO DE TELECOMUNICAC ¸ ˜ OES E PROCESSAMENTO DE SINAIS - SBrT2017, 3-6 DE SETEMBRO DE 2017, S ˜ AO PEDRO, SP Compress˜ ao de Imagens Baseada em Quantizac ¸˜ ao Vetorial e Transformada Discreta do Cosseno Fellipe Andr´ e Lucena de Oliveira e Waslon Terllizzie Ara´ ujo Lopes Resumo— Este artigo discute a utilizac ¸˜ ao das ecnicas de Quantizac ¸˜ ao Vetorial (QV) e da Transformada Discreta do Cosseno (DCT) na compress˜ ao de imagens, visando avaliar o desempenho da combinac ¸˜ ao destas t´ ecnicas. Os resultados de simulac ¸˜ ao da quantizac ¸˜ ao vetorial dos coeficientes da DCT mostram que a utilizac ¸˜ ao conjunta das t´ ecnicas produz, em edia, menor distorc ¸˜ ao do que aquela oriunda da aplicac ¸˜ ao da QV no dom´ ınio espacial, para a maior parte das taxas de codificac ¸˜ ao avaliadas. Palavras-Chave— Quantizac ¸˜ ao Vetorial, Transformada Discre- ta do Cosseno, Compress˜ ao de Imagens. Abstract— This paper discusses the use of Vector Quantization (QV) and Discrete Cosine Transform (DCT) in image compres- sion, in order to evaluate the performance of the combination of these techniques. Simulation results concerning the quantization of the DCT coefficients show that the joint use of the techniques leads, in average, to a smaller distortion when compared to the use of QV in the spatial domain, for most part of the considered coding rates. Keywords— Vector Quantization, Discrete Cosine Transform, Image Compression. I. I NTRODUC ¸˜ AO A codificac ¸˜ ao e a transmiss˜ ao eficiente de sinais ´ e impor- tante em diversas aplicac ¸˜ oes, tais como comunicac ¸˜ oes m´ oveis, imagens de sat´ elite, imagens m´ edicas, v´ ıdeo conferˆ encia e comunicac ¸˜ oes multim´ ıdia. Muitos destes sistemas apresentam restric ¸˜ oes de largura de banda e/ou de mem´ oria, o que exige que os sinais passem por um processo de compress˜ ao, no intuito de adequ´ a-los aos requisitos de transmiss˜ ao e ar- mazenamento. Dentro deste contexto est˜ ao inclusas as t´ ecnicas de Quantizac ¸˜ ao Vetorial (QV) e Transformada Discreta do Cosseno (DCT) [1], que possuem o objetivo comum de reduzir a quantidade de bits necess´ arios para a representac ¸˜ ao dos sinais. Neste trabalho investiga-se se a quantizac ¸˜ ao vetorial dos coeficientes da transformada produz melhores resultados do que a quantizac ¸˜ ao vetorial no dom´ ınio espacial, considerando uma mesma taxa de codificac ¸˜ ao. Para isto, s˜ ao avaliadas e comparadas as distorc ¸˜ oes produzidas por cada tipo de compress˜ ao, atrav´ es de duas medidas objetivas de distorc ¸˜ ao: Relac ¸˜ ao Sinal-Ru´ ıdo de Pico (PSNR – Peak Signal-to-Noise Ratio) e Similaridade Estrutural (SSIM – Structural Similari- ty) [2]. Fellipe Andr´ e Lucena de Oliveira e Waslon Terllizzie Ara´ ujo Lopes¸ Departamento de Engenharia El´ etrica, Universidade Federal da Para´ ıba, Jo˜ ao Pessoa-PB, Brasil. E-mails: [email protected], [email protected]. Este trabalho foi financiado pelo PIBIC/CNPq. II. QUANTIZAC ¸˜ AO VETORIAL O processo de quantizac ¸˜ ao vetorial de um sinal consiste em codificar blocos de amostras (i.e., vetores), em vez de amostras individuais [3]. De forma geral, sobre um vetor aleat´ orio x = {x 0 ,x 1 , ··· ,x k-1 } k-dimensional atua o operador de codificac ¸˜ ao Q(·), que associa a x um vetor de reconstruc ¸˜ ao y = {y 0 ,y 1 , ··· ,y k-1 } que se encontra em um conjunto finito de N vetores discretos, chamado de dicion´ ario (codebook), em que N ´ e o n´ umero de n´ ıveis do dicion´ ario. Matematicamente, pode-se representar a quantizac ¸˜ ao vetorial como y = Q(x). (1) O vetor y ´ e escolhido no dicion´ ario e associado a x de tal maneira que a distorc ¸˜ ao d(x, y) introduzida pela quantizac ¸˜ ao seja m´ ınima. Um exemplo de medida de distorc ¸˜ ao entre vetores ´ e a distˆ ancia euclidiana, tendo sido esta a medida utilizada nos experimentos abordados por este trabalho. Desta forma, em um sistema de comunicac ¸˜ oes baseado em quantizac ¸˜ ao vetorial, o sinal a ser transmitido ´ e codificado pelo emissor atrav´ es dos ´ ındices dos vetores que introduzem as menores distorc ¸˜ oes. O receptor, que possui uma c´ opia do dicion´ ario, decodifica ent˜ ao o que foi transmitido e reconstr´ oi o sinal, obtendo no final um sinal quantizado. Esta forma de codificac ¸˜ ao permite uma consider´ avel economia de bits, visto que v´ arios pixels s˜ ao representados por um ´ unico n´ umero, que assume valores entre 0 e N - 1. III. TRANSFORMADA DISCRETA DO COSSENO Para obter a DCT de uma imagem faz-se, usualmente, uma divis˜ ao desta em blocos de N × N pixels e aplica-se uma transformac ¸˜ ao dada por F (k,j )= N-1 m=0 N-1 n=0 f (m, n) cos (2m + 1)2N cos (2n + 1)2N (2) em que f (m, n) ´ e a intensidade do pixel na posic ¸˜ ao (m, n) do bloco e F (k,j ) ´ e o valor do coeficiente da matriz transformada na posic ¸˜ ao (k,j ) [4]. O resultado desta transformac ¸˜ ao ´ e uma matriz de coeficientes representativos de frequˆ encias espaciais. Uma das propriedades da DCT ´ e que o bloco transformado apresenta maiores amplitudes nos coeficientes iniciais, o que torna poss´ ıvel o descarte (substituic ¸˜ ao por 0) dos coeficientes restantes, os quais carregam menos informac ¸˜ ao e tem valores que tendem a ser pr´ oximos de 0. ´ E esta propriedade que permite o uso da DCT para fins de compress˜ ao de imagens, 1

Upload: phunghanh

Post on 15-Dec-2018

213 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Compressão de Imagens Baseada em Quantização Vetorial e ... · de Quantizac¸a˜o Vetorial (QV) e Transformada Discreta do Cosseno (DCT) [1], ... Neste trabalho investiga-se se

XXXV SIMPOSIO BRASILEIRO DE TELECOMUNICACOES E PROCESSAMENTO DE SINAIS - SBrT2017, 3-6 DE SETEMBRO DE 2017, SAO PEDRO, SP

Compressao de Imagens Baseada em Quantizacao

Vetorial e Transformada Discreta do CossenoFellipe Andre Lucena de Oliveira e Waslon Terllizzie Araujo Lopes

Resumo— Este artigo discute a utilizacao das tecnicas deQuantizacao Vetorial (QV) e da Transformada Discreta doCosseno (DCT) na compressao de imagens, visando avaliaro desempenho da combinacao destas tecnicas. Os resultadosde simulacao da quantizacao vetorial dos coeficientes da DCTmostram que a utilizacao conjunta das tecnicas produz, emmedia, menor distorcao do que aquela oriunda da aplicacaoda QV no domınio espacial, para a maior parte das taxas decodificacao avaliadas.

Palavras-Chave— Quantizacao Vetorial, Transformada Discre-ta do Cosseno, Compressao de Imagens.

Abstract— This paper discusses the use of Vector Quantization(QV) and Discrete Cosine Transform (DCT) in image compres-sion, in order to evaluate the performance of the combination ofthese techniques. Simulation results concerning the quantizationof the DCT coefficients show that the joint use of the techniquesleads, in average, to a smaller distortion when compared to theuse of QV in the spatial domain, for most part of the consideredcoding rates.

Keywords— Vector Quantization, Discrete Cosine Transform,Image Compression.

I. INTRODUCAO

A codificacao e a transmissao eficiente de sinais e impor-

tante em diversas aplicacoes, tais como comunicacoes moveis,

imagens de satelite, imagens medicas, vıdeo conferencia e

comunicacoes multimıdia. Muitos destes sistemas apresentam

restricoes de largura de banda e/ou de memoria, o que exige

que os sinais passem por um processo de compressao, no

intuito de adequa-los aos requisitos de transmissao e ar-

mazenamento. Dentro deste contexto estao inclusas as tecnicas

de Quantizacao Vetorial (QV) e Transformada Discreta do

Cosseno (DCT) [1], que possuem o objetivo comum de reduzir

a quantidade de bits necessarios para a representacao dos

sinais.

Neste trabalho investiga-se se a quantizacao vetorial dos

coeficientes da transformada produz melhores resultados do

que a quantizacao vetorial no domınio espacial, considerando

uma mesma taxa de codificacao. Para isto, sao avaliadas

e comparadas as distorcoes produzidas por cada tipo de

compressao, atraves de duas medidas objetivas de distorcao:

Relacao Sinal-Ruıdo de Pico (PSNR – Peak Signal-to-Noise

Ratio) e Similaridade Estrutural (SSIM – Structural Similari-

ty) [2].

Fellipe Andre Lucena de Oliveira e Waslon Terllizzie AraujoLopes¸ Departamento de Engenharia Eletrica, Universidade Federal daParaıba, Joao Pessoa-PB, Brasil. E-mails: [email protected],[email protected]. Este trabalho foi financiado pelo PIBIC/CNPq.

II. QUANTIZACAO VETORIAL

O processo de quantizacao vetorial de um sinal consiste em

codificar blocos de amostras (i.e., vetores), em vez de amostras

individuais [3]. De forma geral, sobre um vetor aleatorio

x = {x0, x1, · · · , xk−1} k-dimensional atua o operador de

codificacao Q(·), que associa a x um vetor de reconstrucao

y = {y0, y1, · · · , yk−1} que se encontra em um conjunto finito

de N vetores discretos, chamado de dicionario (codebook), em

que N e o numero de nıveis do dicionario. Matematicamente,

pode-se representar a quantizacao vetorial como

y = Q(x). (1)

O vetor y e escolhido no dicionario e associado a x de tal

maneira que a distorcao d(x,y) introduzida pela quantizacao

seja mınima. Um exemplo de medida de distorcao entre

vetores e a distancia euclidiana, tendo sido esta a medida

utilizada nos experimentos abordados por este trabalho.

Desta forma, em um sistema de comunicacoes baseado em

quantizacao vetorial, o sinal a ser transmitido e codificado

pelo emissor atraves dos ındices dos vetores que introduzem

as menores distorcoes. O receptor, que possui uma copia do

dicionario, decodifica entao o que foi transmitido e reconstroi

o sinal, obtendo no final um sinal quantizado. Esta forma de

codificacao permite uma consideravel economia de bits, visto

que varios pixels sao representados por um unico numero, que

assume valores entre 0 e N − 1.

III. TRANSFORMADA DISCRETA DO COSSENO

Para obter a DCT de uma imagem faz-se, usualmente, uma

divisao desta em blocos de N × N pixels e aplica-se uma

transformacao dada por

F (k, j) =N−1∑

m=0

N−1∑

n=0

f(m,n) cos

[

(2m+ 1)kπ

2N

]

cos

[

(2n+ 1)jπ

2N

]

(2)

em que f(m,n) e a intensidade do pixel na posicao (m,n) do

bloco e F (k, j) e o valor do coeficiente da matriz transformada

na posicao (k, j) [4]. O resultado desta transformacao e uma

matriz de coeficientes representativos de frequencias espaciais.

Uma das propriedades da DCT e que o bloco transformado

apresenta maiores amplitudes nos coeficientes iniciais, o que

torna possıvel o descarte (substituicao por 0) dos coeficientes

restantes, os quais carregam menos informacao e tem valores

que tendem a ser proximos de 0. E esta propriedade que

permite o uso da DCT para fins de compressao de imagens,

1

Page 2: Compressão de Imagens Baseada em Quantização Vetorial e ... · de Quantizac¸a˜o Vetorial (QV) e Transformada Discreta do Cosseno (DCT) [1], ... Neste trabalho investiga-se se

XXXV SIMPOSIO BRASILEIRO DE TELECOMUNICACOES E PROCESSAMENTO DE SINAIS - SBrT2017, 3-6 DE SETEMBRO DE 2017, SAO PEDRO, SP

pois os coeficientes descartados nao precisam ser armazenados

ou transmitidos.

IV. RESULTADOS

Foram escritos programas em Linguagem C para implemen-

tar os algoritmos de QV e DCT, de acordo com o fluxograma

apresentado na Figura 1, em que QV−1 e DCT−1 indicam

as operacoes inversas da quantizacao vetorial e transformada

discreta do cosseno, respectivamente. O processo e iniciado

com a aplicacao da DCT, que transforma a matriz de pixels

da imagem em uma matriz de blocos 8 × 8 de frequencias

espaciais; em seguida, de cada bloco sao descartados 44

coeficientes, seguindo a ordem inversa da leitura zig-zag;

Finalmente, os 20 coeficientes que restam em cada bloco sao

quantizados vetorialmente. Os passos seguintes sao feitos pelo

receptor, no qual os ındices dos vetores sao decodificados e

e montada a matriz dos blocos de frequencias espaciais. Em

seguida e aplicada a DCT−1 para obter a imagem quantizada.

Fig. 1. Etapas da compressao, codificacao e decodificacao.

Como os primeiros coeficientes dos blocos transformados

pela DCT tem maior influencia na qualidade final da imagem,

optou-se por utilizar dicionarios maiores e dimensoes dos

quantizadores menores para eles. A escolha do numero de

nıveis do dicionario de cada grupo de coeficientes foi feita

de maneira a obter taxas de codificacao finais iguais aquelas

obtidas com as compressoes que utilizaram apenas QV no

domınio espacial, para permitir uma comparacao justa entre

imagens comprimidas por QV e as imagens submetidas a

QV+DCT atraves das medidas de distorcao.

Na Tabela I podem ser observados os valores de PSNR e

SSIM obtidos para a compressao da imagem Lena (256×256,

8 bpp) considerando varias taxas de codificacao para ambos

os tipos de compressao.

TABELA I

VALORES DE PSNR E SSIM OBTIDOS PARA IMAGEM LENA.

R (bpp)QV QV+DCT

PSNR (dB) SSIM PSNR (dB) SSIM

0,3125 25,55 0,70 26,41 0,79

0,3750 26,25 0,74 27,52 0,84

0,4375 26,88 0,78 28,71 0,89

0,5000 27,33 0,80 28,92 0,88

0,5625 27,85 0,82 29,58 0,90

0,6250 29,94 0,90 30,24 0,92

A qualidade subjetiva da imagem tambem foi melhorada.

Isto pode ser visualizado na Figura 2 que apresenta duas

imagens Lena quantizadas a uma taxa de 0,4375 bpp. Nesta

taxa foi obtida a maior diferenca de qualidade entre os dois

esquemas de compressao considerando os valores de PSNR e

SSIM.

(a) QV. (b) QV+DCT.

Fig. 2. Imagem Lena quantizada a taxa de 0,4375 bpp.

Na imagem Lena o uso da QV+DCT apresentou melhor

desempenho em todas as taxas de codificacao testadas. Porem,

em testes feitos com um conjunto maior de imagens (Airplane,

Boat, Frog, Godhill e Mandrill), verificou-se que essa van-

tagem nem sempre ocorre para as taxas mais altas. A Tabela II

apresenta o comportamento medio dos ganhos obtidos com o

uso da QV+DCT comparada a QV para os experimentos feitos

com Lena e essas imagens adicionais. Especificamente, houve

uma perda de 0,09 dB na PSNR para a taxa de 0,6250 bpp.

TABELA II

GANHOS MEDIOS DE PSNR E SSIM.

R(bpp) PSNR (dB) SSIM

0,3125 0,37 0,04

0,3750 0,56 0,06

0,4375 1,03 0,09

0,5000 0,52 0,04

0,5625 0,36 0,03

0,6250 -0,09 0,01

V. CONCLUSOES

Em se tratando da codificacao de imagens digitais, este

trabalho mostrou que a combinacao da quantizacao vetorial

com a transformada discreta do cosseno apresenta melhor de-

sempenho quando comparada a utilizacao da QV no domınio

espacial. Como trabalhos futuros os autores pretendem anal-

isar o desempenho da transformada wavelet no processo de

codificacao de imagens.

REFERENCIAS

[1] N. M. Nasrabadi and R. A. King, “Image coding using vector quantiza-tion: A review,” IEEE Transactions on Communications, vol. 36, no. 8,pp. 957–971, August 1988.

[2] Z. Wang, A. C. Bovic, H. R. Sheikh, and E. P. Simoncelli, “Imagequality assesment: From error visibility to structural similarity,” IEEE

Transactions On Image Processing, vol. 13, no. 4, pp. 600–612, April2004.

[3] W. T. A. Lopes, “Diversidade em modulacao aplicada a transmissao deimagens em canais com desvanecimento,” Tese de Doutorado, Universi-dade Federal de Campina Grande, Campina Grande, PB, Brasil, Junho2003.

[4] B. P. Lathi, Modern Digital and Analog Communication Systems, 3rd ed.,A. S. Sedra and M. R. Lightner, Eds. New York, USA: Oxford UniversityPress, 1998.

2