uma ferramenta de auditoria para algoritmos de rearranjo...

24
Introdu¸c˜ ao Constru¸c˜ ao da Ferramenta Aplica¸c˜ ao da Ferramenta Considera¸c˜ oes Finais Uma Ferramenta de Auditoria para Algoritmos de Rearranjo de Genomas Aluno: Gustavo Rodrigues Galv˜ ao Orientador: Zanoni Dias Instituto de Computa¸c˜ ao, UNICAMP 20 de Dezembro de 2012 G. R. Galv˜ ao e Z. Dias Defesa de Disserta¸c˜ ao de Mestrado 1 / 24

Upload: phamphuc

Post on 09-Dec-2018

215 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Uma Ferramenta de Auditoria para Algoritmos de Rearranjo ...zanoni/orientacoes/mestrado/gustavo/slidesTese.pdf · dist^ancia de rearranjo entre eles, que igual ao tamanho da menor

IntroducaoConstrucao da Ferramenta

Aplicacao da FerramentaConsideracoes Finais

Uma Ferramenta de Auditoria paraAlgoritmos de Rearranjo de Genomas

Aluno: Gustavo Rodrigues GalvaoOrientador: Zanoni Dias

Instituto de Computacao, UNICAMP

20 de Dezembro de 2012

G. R. Galvao e Z. Dias Defesa de Dissertacao de Mestrado 1 / 24

Page 2: Uma Ferramenta de Auditoria para Algoritmos de Rearranjo ...zanoni/orientacoes/mestrado/gustavo/slidesTese.pdf · dist^ancia de rearranjo entre eles, que igual ao tamanho da menor

IntroducaoConstrucao da Ferramenta

Aplicacao da FerramentaConsideracoes Finais

Agenda

1 Introducao

2 Construcao da Ferramenta

3 Aplicacao da Ferramenta

4 Consideracoes Finais

G. R. Galvao e Z. Dias Defesa de Dissertacao de Mestrado 2 / 24

Page 3: Uma Ferramenta de Auditoria para Algoritmos de Rearranjo ...zanoni/orientacoes/mestrado/gustavo/slidesTese.pdf · dist^ancia de rearranjo entre eles, que igual ao tamanho da menor

IntroducaoConstrucao da Ferramenta

Aplicacao da FerramentaConsideracoes Finais

Conceitos BasicosVariacoes do Problema da OrdenacaoMotivacao e Objetivos

DNA, Gene, Cromossomo e Genoma

Fonte: http://www.genome.gov/glossary/resources/dna_deoxyribonucleic_acid_lg.jpg

G. R. Galvao e Z. Dias Defesa de Dissertacao de Mestrado 3 / 24

Page 4: Uma Ferramenta de Auditoria para Algoritmos de Rearranjo ...zanoni/orientacoes/mestrado/gustavo/slidesTese.pdf · dist^ancia de rearranjo entre eles, que igual ao tamanho da menor

IntroducaoConstrucao da Ferramenta

Aplicacao da FerramentaConsideracoes Finais

Conceitos BasicosVariacoes do Problema da OrdenacaoMotivacao e Objetivos

Evolucao de Genomas

Imprecisao no processo de replicacao do DNA.

Mutacoes locais: remocoes, substituicoes e insercoes.Mutacoes globais: eventos de rearranjo.

Eventos de rearranjo conservativos.

Reversao.Transposicao.

Eventos de rearranjo nao conservativos.

Remocao.Duplicacao.

G. R. Galvao e Z. Dias Defesa de Dissertacao de Mestrado 4 / 24

Page 5: Uma Ferramenta de Auditoria para Algoritmos de Rearranjo ...zanoni/orientacoes/mestrado/gustavo/slidesTese.pdf · dist^ancia de rearranjo entre eles, que igual ao tamanho da menor

IntroducaoConstrucao da Ferramenta

Aplicacao da FerramentaConsideracoes Finais

Conceitos BasicosVariacoes do Problema da OrdenacaoMotivacao e Objetivos

Rearranjo de Genomas

Problema Motivador

Estimar a distancia evolutiva entre especies.

Proposta de Solucao

Dados dois genomas relativos a duas especies, calcula-se adistancia de rearranjo entre eles, que igual ao tamanho da menorsequencia de eventos de rearranjo que transforma um genoma nooutro. Utiliza-se, entao, a distancia de rearranjo como estimativapara a distancia evolutiva entre as especies.

G. R. Galvao e Z. Dias Defesa de Dissertacao de Mestrado 5 / 24

Page 6: Uma Ferramenta de Auditoria para Algoritmos de Rearranjo ...zanoni/orientacoes/mestrado/gustavo/slidesTese.pdf · dist^ancia de rearranjo entre eles, que igual ao tamanho da menor

IntroducaoConstrucao da Ferramenta

Aplicacao da FerramentaConsideracoes Finais

Conceitos BasicosVariacoes do Problema da OrdenacaoMotivacao e Objetivos

Modelando Genomas

Premissas quanto aos genomas.

Genoma unicromossomal.Mesmo conjunto de genes.Sem repeticao de genes.

Representacao classica: permutacoes de numeros inteiros.

π = (π1 π2 . . . πn), 1 ≤ |πi | ≤ n e |πi | 6= |πj | ↔ i 6= j .

Cada elemento πi possui um sinal, + ou −, que indica aorientacao do gene que ele representa.

O sinal e omitido caso nao exista informacao sobre aorientacao.

G. R. Galvao e Z. Dias Defesa de Dissertacao de Mestrado 6 / 24

Page 7: Uma Ferramenta de Auditoria para Algoritmos de Rearranjo ...zanoni/orientacoes/mestrado/gustavo/slidesTese.pdf · dist^ancia de rearranjo entre eles, que igual ao tamanho da menor

IntroducaoConstrucao da Ferramenta

Aplicacao da FerramentaConsideracoes Finais

Conceitos BasicosVariacoes do Problema da OrdenacaoMotivacao e Objetivos

Modelando Eventos de Rearranjo

Reversao

A reversao ρ(i , j), 1 ≤ i < j ≤ n, aplicada na permutacao sem sinal

(π1 π2 . . . πi−1 πi πi+1 . . . πj−1 πj πj+1 . . . πn)

a transforma na permutacao sem sinal

(π1 π2 . . . πi−1 πj πj−1 . . . πi+1 πi πj+1 . . . πn).

Caso a permutacao original tivesse sinal, entao a reversao atransformaria na permutacao com sinal

(π1 π2 . . . πi−1 −πj −πj−1 . . . −πi+1 −πi πj+1 . . . πn).

G. R. Galvao e Z. Dias Defesa de Dissertacao de Mestrado 7 / 24

Page 8: Uma Ferramenta de Auditoria para Algoritmos de Rearranjo ...zanoni/orientacoes/mestrado/gustavo/slidesTese.pdf · dist^ancia de rearranjo entre eles, que igual ao tamanho da menor

IntroducaoConstrucao da Ferramenta

Aplicacao da FerramentaConsideracoes Finais

Conceitos BasicosVariacoes do Problema da OrdenacaoMotivacao e Objetivos

Modelando Eventos de Rearranjo

Transposicao

A transposicao t(i , j , k), 1 ≤ i < j < k ≤ n + 1, aplicada napermutacao (com ou sem sinal)

(π1 . . . πi−1 πi . . . πj−1 πj . . . πk−1 πk . . . πn)

a transforma na permutacao (com ou sem sinal)

(π1 . . . πi−1 πj . . . πk−1 πi . . . πj−1 πk . . . πn).

G. R. Galvao e Z. Dias Defesa de Dissertacao de Mestrado 8 / 24

Page 9: Uma Ferramenta de Auditoria para Algoritmos de Rearranjo ...zanoni/orientacoes/mestrado/gustavo/slidesTese.pdf · dist^ancia de rearranjo entre eles, que igual ao tamanho da menor

IntroducaoConstrucao da Ferramenta

Aplicacao da FerramentaConsideracoes Finais

Conceitos BasicosVariacoes do Problema da OrdenacaoMotivacao e Objetivos

Distancia de Rearranjo Entre Permutacoes

Modelo de Rearranjo

Conjunto de eventos de rearranjo permitidos para transformar umapermutacao em outra.

Distancia de Rearranjo

A distancia de rearranjo entre duas permutacoes π e σ e igual aotamanho da menor sequencia de eventos de rearranjo pertencentesa um determinado modelo de rearranjo que transforma π em σ (ouσ em π).

G. R. Galvao e Z. Dias Defesa de Dissertacao de Mestrado 9 / 24

Page 10: Uma Ferramenta de Auditoria para Algoritmos de Rearranjo ...zanoni/orientacoes/mestrado/gustavo/slidesTese.pdf · dist^ancia de rearranjo entre eles, que igual ao tamanho da menor

IntroducaoConstrucao da Ferramenta

Aplicacao da FerramentaConsideracoes Finais

Conceitos BasicosVariacoes do Problema da OrdenacaoMotivacao e Objetivos

Problema da Ordenacao

Permutacao identidade: ι = (1 2 . . . n).

Ordenar uma permutacao significa transforma-la em ι.

Problema da Ordenacao: encontrar menor sequencia deeventos de rearranjo que ordena uma permutacao.

Transformar a permutacao π na permutacao σ e equivalente atransformar a permutacao σ−1 ◦ π em ι.

Distancia de rearranjo de uma permutacao.Reducao ao Problema da Ordenacao.

Algoritmos de Rearranjo de Genomas.

G. R. Galvao e Z. Dias Defesa de Dissertacao de Mestrado 10 / 24

Page 11: Uma Ferramenta de Auditoria para Algoritmos de Rearranjo ...zanoni/orientacoes/mestrado/gustavo/slidesTese.pdf · dist^ancia de rearranjo entre eles, que igual ao tamanho da menor

IntroducaoConstrucao da Ferramenta

Aplicacao da FerramentaConsideracoes Finais

Conceitos BasicosVariacoes do Problema da OrdenacaoMotivacao e Objetivos

Estado da Arte de Algumas Variacoes

Modelo de Rearranjo NP-Difıcil Melhor Solucao Teorica

Reversao com Sinal Nao Algoritmo exato O(n32

√log n)

Reversao Sim Algoritmo 1.375-aproximadoTransposicao Sim Algoritmo 1.375-aproximadoReversao de Prefixo Sim Algoritmo 2-aproximadoTransposicao de Prefixo ? Algoritmo 2-aproximadoReversao Curta ? Algoritmo 2-aproximadoReversao com Sinal e Transposicao ? Algoritmo 2-aproximado

G. R. Galvao e Z. Dias Defesa de Dissertacao de Mestrado 11 / 24

Page 12: Uma Ferramenta de Auditoria para Algoritmos de Rearranjo ...zanoni/orientacoes/mestrado/gustavo/slidesTese.pdf · dist^ancia de rearranjo entre eles, que igual ao tamanho da menor

IntroducaoConstrucao da Ferramenta

Aplicacao da FerramentaConsideracoes Finais

Conceitos BasicosVariacoes do Problema da OrdenacaoMotivacao e Objetivos

Uma Ferramenta para Avaliacao de Algoritmos

Dificuldade do Problema da Ordenacao.

Algoritmos aproximados.Heurısticas.

Construcao de uma ferramenta para avaliacao de algoritmos.

Apoio a comparacao.Apoio a validacao.

Aplicacao da ferramenta.

Avaliacao da justeza do fator de aproximacao.

G. R. Galvao e Z. Dias Defesa de Dissertacao de Mestrado 12 / 24

Page 13: Uma Ferramenta de Auditoria para Algoritmos de Rearranjo ...zanoni/orientacoes/mestrado/gustavo/slidesTese.pdf · dist^ancia de rearranjo entre eles, que igual ao tamanho da menor

IntroducaoConstrucao da Ferramenta

Aplicacao da FerramentaConsideracoes Finais

PanoramaAlgoritmo Para Calcular as Distancias de RearranjoCalculo das Distancias de RearranjoGRAAu: Genome Rearrangement Algorithm Auditor

Panorama

Auditoria de um algoritmo de rearranjo de genomas.

Etapas da construcao da ferramenta.

Definicao do algoritmo para calcular distancias de rearranjo.Calculo das distancias de rearranjo.Desenvolvimento da ferramenta (GRAAu).

G. R. Galvao e Z. Dias Defesa de Dissertacao de Mestrado 13 / 24

Page 14: Uma Ferramenta de Auditoria para Algoritmos de Rearranjo ...zanoni/orientacoes/mestrado/gustavo/slidesTese.pdf · dist^ancia de rearranjo entre eles, que igual ao tamanho da menor

IntroducaoConstrucao da Ferramenta

Aplicacao da FerramentaConsideracoes Finais

PanoramaAlgoritmo Para Calcular as Distancias de RearranjoCalculo das Distancias de RearranjoGRAAu: Genome Rearrangement Algorithm Auditor

Visao Geral

Algoritmo de busca em largura.

Diminuicao do uso de memoria.

Representacao de permutacoes como inteiros.

Diminuicao do tempo de execucao.

Paralelizacao.

G. R. Galvao e Z. Dias Defesa de Dissertacao de Mestrado 14 / 24

Page 15: Uma Ferramenta de Auditoria para Algoritmos de Rearranjo ...zanoni/orientacoes/mestrado/gustavo/slidesTese.pdf · dist^ancia de rearranjo entre eles, que igual ao tamanho da menor

IntroducaoConstrucao da Ferramenta

Aplicacao da FerramentaConsideracoes Finais

PanoramaAlgoritmo Para Calcular as Distancias de RearranjoCalculo das Distancias de RearranjoGRAAu: Genome Rearrangement Algorithm Auditor

Implementacao

Algoritmo implementado em C.

Utilizacao da biblioteca pthreads.

Implementacao de duas versoes.

Versao de 32 bits.Versao de 64 bits.

Eficiencia no uso de memoria.

12x melhor do que o algoritmo de Dias e Meidanis1.7x melhor do que o algoritmo de Walter, Dias e Meidanis2.

Ganho de desempenho com a paralelizacao.

1Z. Dias and J. Meidanis. Sorting by prefix transpositions. In Proceedings of the SPIRE’2002, volume 2476 of

LNCS, pages 65–76, Lisbon, Portugal, 2002. Springer-Verlag.2

M. E. M. T. Walter, Z. Dias, and J. Meidanis. A new approach for approximating the transposition distance.In Proceedings of the SPIRE’2000, pages 199–208, Washington, DC, USA, 2000. IEEE Computer Society.

G. R. Galvao e Z. Dias Defesa de Dissertacao de Mestrado 15 / 24

Page 16: Uma Ferramenta de Auditoria para Algoritmos de Rearranjo ...zanoni/orientacoes/mestrado/gustavo/slidesTese.pdf · dist^ancia de rearranjo entre eles, que igual ao tamanho da menor

IntroducaoConstrucao da Ferramenta

Aplicacao da FerramentaConsideracoes Finais

PanoramaAlgoritmo Para Calcular as Distancias de RearranjoCalculo das Distancias de RearranjoGRAAu: Genome Rearrangement Algorithm Auditor

Visao Geral

Foram considerados 11 modelos de rearranjo.

Permutacao sem sinal → n ≤ 13Permutacao com sinal → n ≤ 10

Distribuicao das distancias de rearranjo.

Validacao de conjecturas a respeito do diametro.Proposicao de duas novas medidas.

Base de dados de distancias de rearranjo.

Escrutınio publico.Extracao de informacoes.

G. R. Galvao e Z. Dias Defesa de Dissertacao de Mestrado 16 / 24

Page 17: Uma Ferramenta de Auditoria para Algoritmos de Rearranjo ...zanoni/orientacoes/mestrado/gustavo/slidesTese.pdf · dist^ancia de rearranjo entre eles, que igual ao tamanho da menor

IntroducaoConstrucao da Ferramenta

Aplicacao da FerramentaConsideracoes Finais

PanoramaAlgoritmo Para Calcular as Distancias de RearranjoCalculo das Distancias de RearranjoGRAAu: Genome Rearrangement Algorithm Auditor

Visao Geral

Implementacao em Java.

Arquitetura cliente-servidor.Utilizacao de web services.

Estatısticas produzidas.

Diametro.Distancia media.Razao media.Razao maxima.Igualdade.

Permutacoes que apresentaram a razao maxima.

G. R. Galvao e Z. Dias Defesa de Dissertacao de Mestrado 17 / 24

Page 18: Uma Ferramenta de Auditoria para Algoritmos de Rearranjo ...zanoni/orientacoes/mestrado/gustavo/slidesTese.pdf · dist^ancia de rearranjo entre eles, que igual ao tamanho da menor

IntroducaoConstrucao da Ferramenta

Aplicacao da FerramentaConsideracoes Finais

Algoritmos de Rearranjo de GenomasAuditoria dos Algoritmos de Rearranjo de Genomas

Visao Geral

16 algoritmos aproximados implementados.

Modelo de Rearranjo Qtde Melhor Aprox.Reversao 2 NaoTransposicao 3 NaoReversao de Prefixo 3 SimReversao de Prefixo com Sinal 3 SimReversao Curta 3 SimTransposicao de Prefixo 2 Sim

12 algoritmos propostos na literatura e 4 propostos por nos.

G. R. Galvao e Z. Dias Defesa de Dissertacao de Mestrado 18 / 24

Page 19: Uma Ferramenta de Auditoria para Algoritmos de Rearranjo ...zanoni/orientacoes/mestrado/gustavo/slidesTese.pdf · dist^ancia de rearranjo entre eles, que igual ao tamanho da menor

IntroducaoConstrucao da Ferramenta

Aplicacao da FerramentaConsideracoes Finais

Algoritmos de Rearranjo de GenomasAuditoria dos Algoritmos de Rearranjo de Genomas

Contribuicoes

Revisao de alguns resultados da literatura.

Resultados experimentais de Walter, Dias e Meidanis3.Algoritmo 3-aproximado de Benoıt-Gagne e Hamel4.

Demonstracao de fatores de aproximacao.

Fator 2 para o algoritmo de Cohen e Blum5.Fator 3 para heurıstica de Guyer, Heath e Vergara6.

3M. E. M. T. Walter, Z. Dias, and J. Meidanis. A new approach for approximating the transposition distance.

In Proceedings of the SPIRE’2000, pages 199–208, Washington, DC, USA, 2000. IEEE Computer Society.4

M. Benoıt-Gagne and S. Hamel. A new and faster method of sorting by transpositions. In Proceedings of theCPM’2007, volume 4580 of LNCS, pages 131–141, London, Ontario, Canada, 2007. Springer-Verlag.

5D. S. Cohen and M. Blum. On the problem of sorting burnt pancakes. Discrete Applied Mathematics,

61(2):105–120, 1995.6

S. A. Guyer, L. S. Heath, and J. P. C. Vergara. Subsequence and run heuristics for sorting by transpositions.Technical Report TR-97-20, Virginia Polytechnic Institute & State University, 1997.

G. R. Galvao e Z. Dias Defesa de Dissertacao de Mestrado 19 / 24

Page 20: Uma Ferramenta de Auditoria para Algoritmos de Rearranjo ...zanoni/orientacoes/mestrado/gustavo/slidesTese.pdf · dist^ancia de rearranjo entre eles, que igual ao tamanho da menor

IntroducaoConstrucao da Ferramenta

Aplicacao da FerramentaConsideracoes Finais

Algoritmos de Rearranjo de GenomasAuditoria dos Algoritmos de Rearranjo de Genomas

Visao Geral

Algoritmos implementados em Java e auditados com oGRAAu.

Aplicacoes para as estatısticas produzidas.

Comparacao.Avaliacao da justeza do fator de aproximacao.

G. R. Galvao e Z. Dias Defesa de Dissertacao de Mestrado 20 / 24

Page 21: Uma Ferramenta de Auditoria para Algoritmos de Rearranjo ...zanoni/orientacoes/mestrado/gustavo/slidesTese.pdf · dist^ancia de rearranjo entre eles, que igual ao tamanho da menor

IntroducaoConstrucao da Ferramenta

Aplicacao da FerramentaConsideracoes Finais

Algoritmos de Rearranjo de GenomasAuditoria dos Algoritmos de Rearranjo de Genomas

Contribuicoes

Justeza do fator de aproximacao.

Mostramos que o fator de aproximacao de 7 algoritmos e justo.Conjecturamos que o fator de outros 6 e justo.

Contraposicao de duas hipoteses levantadas na literatura.

Hipotese de Benoıt-Gagne e Hamel7.Hipotese de Fischer e Ginzinger8.

7M. Benoıt-Gagne and S. Hamel. A new and faster method of sorting by transpositions. In Proceedings of the

CPM’2007, volume 4580 of LNCS, pages 131–141, London, Ontario, Canada, 2007. Springer-Verlag.8

J. Fischer and S. W. Ginzinger. A 2-approximation algorithm for sorting by prefix reversals. In Proceedings ofthe ESA’2005, volume 3669 of LNCS, pages 415–425, Mallorca, Spain, 2005. Springer-Verlag.

G. R. Galvao e Z. Dias Defesa de Dissertacao de Mestrado 21 / 24

Page 22: Uma Ferramenta de Auditoria para Algoritmos de Rearranjo ...zanoni/orientacoes/mestrado/gustavo/slidesTese.pdf · dist^ancia de rearranjo entre eles, que igual ao tamanho da menor

IntroducaoConstrucao da Ferramenta

Aplicacao da FerramentaConsideracoes Finais

ConclusaoPublicacoesTrabalhos Futuros

Conclusao

Sumario.

Construcao da ferramenta.Aplicacao da ferramenta.

Crıticas.

Expectativas.

G. R. Galvao e Z. Dias Defesa de Dissertacao de Mestrado 22 / 24

Page 23: Uma Ferramenta de Auditoria para Algoritmos de Rearranjo ...zanoni/orientacoes/mestrado/gustavo/slidesTese.pdf · dist^ancia de rearranjo entre eles, que igual ao tamanho da menor

IntroducaoConstrucao da Ferramenta

Aplicacao da FerramentaConsideracoes Finais

ConclusaoPublicacoesTrabalhos Futuros

Publicacoes

Foram 8 publicacoes ao todo.

1 resumo estendido no ACM-SAC 2011.1 resumo estendido e 2 artigos completos no BSB 2011.2 artigos completos no BICoB 2012.1 resumo estentido e 1 artigo completo no BSB 2012.

Artigos para periodicos.

G. R. Galvao e Z. Dias Defesa de Dissertacao de Mestrado 23 / 24

Page 24: Uma Ferramenta de Auditoria para Algoritmos de Rearranjo ...zanoni/orientacoes/mestrado/gustavo/slidesTese.pdf · dist^ancia de rearranjo entre eles, que igual ao tamanho da menor

IntroducaoConstrucao da Ferramenta

Aplicacao da FerramentaConsideracoes Finais

ConclusaoPublicacoesTrabalhos Futuros

Trabalhos Futuros

Manutencao do GRAAu.

Estudar mais profundamente as medidas que propusemos.

Validar conjecturas a respeito da justeza do fator deaproximacao dos algoritmos.

Desenvolver algoritmos aproximados melhores.

G. R. Galvao e Z. Dias Defesa de Dissertacao de Mestrado 24 / 24