rearranjo de genomas: uma coletânea de artigos zanoni dias orientador: joão meidanis

33
Rearranjo de Genomas: Uma Coletânea de Artigos Zanoni Dias Orientador: João Meidanis

Upload: internet

Post on 16-Apr-2015

106 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Rearranjo de Genomas: Uma Coletânea de Artigos Zanoni Dias Orientador: João Meidanis

Rearranjo de Genomas:Uma Coletânea de Artigos

Zanoni Dias

Orientador:João Meidanis

Page 2: Rearranjo de Genomas: Uma Coletânea de Artigos Zanoni Dias Orientador: João Meidanis

Roteiro

• Introdução

• A Coletânea de Artigos– Parte I: Primeiros Trabalhos– Parte II: Contribuições Originais

• Conclusões

• Apêndice

Page 3: Rearranjo de Genomas: Uma Coletânea de Artigos Zanoni Dias Orientador: João Meidanis

Introdução

Exemplo de problema de distância de rearranjo

envolvendo os eventos de reversão e transposição:

8 5 2 7 4 1 9 3 6

8 7 4 5 2 1 9 3 6

1 2 5 4 7 8 9 3 6

1 2 5 4 3 6 7 8 9

1 2 3 4 5 6 7 8 9

Page 4: Rearranjo de Genomas: Uma Coletânea de Artigos Zanoni Dias Orientador: João Meidanis

Introdução

• Reversões:– Com Orientações dos Genes Desconhecidas:

• Caprara (1999) provou que esta versão do problema é NP-Completo.

• Berman, Hannenhalli e Karpinski (2002): algoritmo de aproximação com fator 1.375.

– Com Orientações dos Genes Conhecidas:• Hannenhalli e Pevzner (1999): primeiro

algoritmo polinomial – O(n4).

Page 5: Rearranjo de Genomas: Uma Coletânea de Artigos Zanoni Dias Orientador: João Meidanis

Introdução

• Transposições:– Bafna e Pevzner (1995): algoritmo de

aproximação com fator 1.5 – O(n2).– Abordagens alternativas:

• Christie (1998): fator 1.5 – O(n4).• Walter, Dias e Meidanis (2000): fator 2.25 – O(n2).

– Problema permanece em aberto.

Page 6: Rearranjo de Genomas: Uma Coletânea de Artigos Zanoni Dias Orientador: João Meidanis

A Coletânea de ArtigosParte I: Primeiros Trabalhos

• Reversal distance of signed circular chromosomes

• Transposition distance between a permutation and its reverse

• Reversal and transposition distance of linear chromosomes

• A lower bound on the reversal and transposition diameter

Page 7: Rearranjo de Genomas: Uma Coletânea de Artigos Zanoni Dias Orientador: João Meidanis

A Coletânea de ArtigosParte II: Contribuições Originais

• An alternative algebraic formalism for genome rearrangements

• The genome distance problem by fusion, fission, and transposition is easy

• The genome rearrangement distance problem with arbitrary weights

• Sorting by prefix transpositions

Page 8: Rearranjo de Genomas: Uma Coletânea de Artigos Zanoni Dias Orientador: João Meidanis

Reversal Distance ofSigned Circular Chromosomes

• Determinamos a distância de reversão de dois genomas circulares quando se conhece as orientações dos genes.

• Primeiro algoritmo polinomial para o problema, baseado no algoritmo quadrático proposto por Kaplan, Shamir e Tarjan (1997) para o problema da distância de reversão de genomas lineares.

• Calculamos o diâmetro de reversão tanto para genomas lineares quanto para circulares.

Page 9: Rearranjo de Genomas: Uma Coletânea de Artigos Zanoni Dias Orientador: João Meidanis

Reversal Distance ofSigned Circular Chromosomes

• Corrigimos uma conjectura sobre o diâmetro de reversão para cromossomos lineares apresentada por Kececioglu e Sankoff (1994).

• Resultados apresentados em Brasília, no XXIV Seminário Integrado de Software e Hardware (SEMISH'97), em agosto de 1997.

• Este trabalho foi expandido e depositado como relatório técnico no Instituto de Computação da Unicamp sob o número IC-00-23, em dezembro de 2000.

Page 10: Rearranjo de Genomas: Uma Coletânea de Artigos Zanoni Dias Orientador: João Meidanis

Transposition Distance Betweena Permutation and its Reverse

• Resolvemos o problema proposto por Bafna e Pevzner (1995): determinar o menor número de transposições necessárias para transformar uma permutação qualquer na sua inversa

• Seja n o número de genes de Provamos que:– dn / 2 + 1, para n 3.

• Este é um dos raros casos em que se conhece o valor exato da distância de transposição.

Page 11: Rearranjo de Genomas: Uma Coletânea de Artigos Zanoni Dias Orientador: João Meidanis

Transposition Distance Betweena Permutation and its Reverse

• Conjecturamos que este seja o valor do diâmetro de transposição (D(n)), ou seja, o maior valor de distância de transposição para duas permutações com n genes.

• Artigo apresentado no IV South American Workshop on String Processing (WSP'97), realizado na cidade de Valparaíso, Chile, em novembro de 1997.

Page 12: Rearranjo de Genomas: Uma Coletânea de Artigos Zanoni Dias Orientador: João Meidanis

Reversal and TranspositionDistance of Linear Chromosomes

• Algoritmos de aproximação para o problema da distância de reversão e transposição:– Com Orientações dos Genes Desconhecidas:

• Algoritmo com fator de aproximação 3.• Sempre podemos remover um breakpoint.

– Com Orientações dos Genes Conhecidas:• Algoritmo com fator de aproximação 2.• Sempre podemos criar um ciclo.

Page 13: Rearranjo de Genomas: Uma Coletânea de Artigos Zanoni Dias Orientador: João Meidanis

Reversal and TranspositionDistance of Linear Chromosomes

• Estabelecemos um limite inferior para o diâmetro de reversão e transposição para cromossomos quando conhecemos as orientações dos genes.

• Conjecturamos que este seja o valor exato do diâmetro de reversão e transposição.

• Artigo apresentado no String Processing and Information Retrieval (SPIRE'98), realizado em Santa Cruz de la Sierra, Bolívia, em setembro de 1998.

Page 14: Rearranjo de Genomas: Uma Coletânea de Artigos Zanoni Dias Orientador: João Meidanis

A Lower Bound on the Reversaland Transposition Diameter

• Calculamos a distância de reversão e transposição da permutação = (-1 -2 ... -(n-1) -n) em relação a permutação identidade n = (+1 +2 ... +(n-1) +n):– Dnn / 2 + 2, para n 3.

• Limite inferior não trivial para o diâmetro de reversão e transposição para genomas lineares.

• Este trabalho é uma extensão de alguns resultados apresentados no artigo anterior.

Page 15: Rearranjo de Genomas: Uma Coletânea de Artigos Zanoni Dias Orientador: João Meidanis

A Lower Bound on the Reversaland Transposition Diameter

• A versão apresentada na tese corresponde ao relatório técnico IC-00-16 de outubro de 2000.

• Um resumo deste trabalho será publicado num dos mais importantes periódicos internacionais, o Journal of Computational Biology (volume 9, ano 5, novembro de 2002).

Page 16: Rearranjo de Genomas: Uma Coletânea de Artigos Zanoni Dias Orientador: João Meidanis

An Alternative Algebraic Formalismfor Genome Rearrangements

• Relacionamos a teoria de rearranjo de genomas com teoria de grupos de permutações de uma forma nova.

• Motivação: muitos argumentos em rearranjo de genomas são baseados em figuras, ou em enumeração exaustiva de todos os casos, evidenciando a falta de um formalismo algébrico adequado.

Page 17: Rearranjo de Genomas: Uma Coletânea de Artigos Zanoni Dias Orientador: João Meidanis

An Alternative Algebraic Formalismfor Genome Rearrangements

• Definições algébricas de conceitos como:– Genoma– Breakpoint– Ciclo bom– Componente boa

• Operações de rearranjo estudadas:– Reversão– Transposição– Reversão + Transposição– Block Interchange

Page 18: Rearranjo de Genomas: Uma Coletânea de Artigos Zanoni Dias Orientador: João Meidanis

An Alternative Algebraic Formalismfor Genome Rearrangements

• Artigo apresentado no Gene Order Dynamics, Comparative Maps and Multigene Families (DCAF'2000), realizado na cidade de Le Chantecler, no Canadá, em setembro de 2000.

• Este trabalho integra também o livro Comparative Genomics: Empirical and Analyitical Approaches to Gene Order Dynamics, Map Alignment and Evolution of Gene Families lançado em novembro do mesmo ano.

Page 19: Rearranjo de Genomas: Uma Coletânea de Artigos Zanoni Dias Orientador: João Meidanis

The Genome Distance Problem byFusion, Fission, and Transposition is Easy

• Algoritmo polinomial que determina uma série de fusões, fissões e transposições, de peso mínimo, que transforma um genoma circular em outro.

• Neste problema, fusões e fissões tem peso 1, enquanto que uma transposição recebe peso 2.

• Algoritmo baseado em resultados clássicos da teoria de Grupos de Permutações.

Page 20: Rearranjo de Genomas: Uma Coletânea de Artigos Zanoni Dias Orientador: João Meidanis

The Genome Distance Problem byFusion, Fission, and Transposition is Easy

• Este é o primeiro resultado polinomial para um problema de rearranjo de genomas envolvendo o evento de transposição.

• Sempre existe uma fusão ou uma fissão que aumenta em uma unidade o número de ciclos, ou uma transposição que cria dois novos ciclos.

• A distância de rearranjo neste caso é igual ao tamanho dos genomas menos o número de ciclos.

Page 21: Rearranjo de Genomas: Uma Coletânea de Artigos Zanoni Dias Orientador: João Meidanis

The Genome Distance Problem byFusion, Fission, and Transposition is Easy• Algoritmo quadrático que determina uma série de

eventos que transforma uma genoma no outro.

• A versão apresentada na tese corresponde ao relatório técnico IC-01-07 de julho de 2001.

• Este trabalho, com pequenas alterações, foi apresentado no String Processing and Information Retrieval (SPIRE'2001), realizado na Laguna de San Rafael, no Chile, em novembro de 2001.

Page 22: Rearranjo de Genomas: Uma Coletânea de Artigos Zanoni Dias Orientador: João Meidanis

The Genome Rearrangement Distance Problem with Arbitrary Weights

• Extensão do artigo sobre distância de fusão, fissão e transposição apresentado no SPIRE'2001.

• Agora, fusões e fissões tem peso 1, enquanto que uma transposição recebe peso arbitrário .

• Quando faz parte da entrada, provamos que o problema é pelo menos tão difícil quanto o problema da distância de transposição, que ainda permanece em aberto.

Page 23: Rearranjo de Genomas: Uma Coletânea de Artigos Zanoni Dias Orientador: João Meidanis

The Genome Rearrangement Distance Problem with Arbitrary Weights

• Estudamos também uma variação importante deste problema: a distância sintênica ( = 0).

• Mostramos um algoritmo polinomial para o problema da distância sintênica com distinção de genes, quando apenas eventos de fusões e fissões são permitidos.

• Provamos ainda que o problema similar de distância sintênica sem distinção de genes éNP-Difícil.

Page 24: Rearranjo de Genomas: Uma Coletânea de Artigos Zanoni Dias Orientador: João Meidanis

The Genome Rearrangement Distance Problem with Arbitrary Weights

• Estes resultados estão reunidos no relatório técnico IC-02-01 de março de 2002.

• Pretendemos submeter nos próximos meses este trabalho a uma conferência internacional da área de Biologia Computacional.

Page 25: Rearranjo de Genomas: Uma Coletânea de Artigos Zanoni Dias Orientador: João Meidanis

Sorting by Prefix Transpositions

• Introduzimos um novo evento de Rearranjo de Genomas que denominamos de Transposição de Prefixos.

• Esta operação move o bloco formado pelos primeiros genes de um genoma linear para qualquer outra posição do genoma.

• Algoritmos com fatores de aproximação 2 e 3.

Page 26: Rearranjo de Genomas: Uma Coletânea de Artigos Zanoni Dias Orientador: João Meidanis

Sorting by Prefix Transpositions

• Estabelecemos uma conjectura sobre o diâmetro de transposição de prefixos:– D(n) = n -n / 4

• Exibimos resultados de vários testes computacionais que sustentam esta hipótese.

• Algoritmo que decide quando uma permutação, pode ser ordenada usando apenas o número de transposições de prefixos indicada pela lower bound de breakpoints.

Page 27: Rearranjo de Genomas: Uma Coletânea de Artigos Zanoni Dias Orientador: João Meidanis

Sorting by Prefix Transpositions

• Trabalho apresentado no String Processing and Information Retrieval (SPIRE'2002), realizado em Lisboa, Portugal, em setembro de 2002.

• Este artigo foi um dos seis trabalhos do SPIRE'2002 selecionados para publicação numa edição especial do Journal of Discrete Algorithms que deve ser lançada até o fim do ano.

Page 28: Rearranjo de Genomas: Uma Coletânea de Artigos Zanoni Dias Orientador: João Meidanis

Conclusões

• Um novo formalismo algébrico:– As diferenças entre dois genomas e são

representadas pela fórmula -1.– Número de breakpoints e ciclos.– Definimos os eventos de reversão, transposição,

transposição com reversão e block interchange.

• Resultados envolvendo o evento de transposição:– Distância de Transposição: novo limite inferior para o

valor do diâmetro.

Page 29: Rearranjo de Genomas: Uma Coletânea de Artigos Zanoni Dias Orientador: João Meidanis

Conclusões

– Distância de Transposição e Reversão: algoritmos de aproximação e limite inferior para o valor do diâmetro.

– Distância de Fusão, Fissão e Transposição: vários resultados para o problema quando as fusões e fissões tem peso 1 e as transposições tem peso 0

– Distância de Transposição de Prefixos: algoritmos de aproximação, conjectura sobre o diâmetro, algoritmo que verifica se uma permutação pode ser ordenada apenas usando transposições de prefixos que sempre removem dois breakpoints.

Page 30: Rearranjo de Genomas: Uma Coletânea de Artigos Zanoni Dias Orientador: João Meidanis

Apêndice

• Permutation Info:– Visualizador de Diagramas de Ciclos – Número de breakpoints b()– Número de ciclos c()– Número de ciclos ímpares codd()– Lower bound de ciclos ímpares– Upper bound baseada no algoritmo de aproximação

1.5 proposto por Bafna e Pevzner.

Page 31: Rearranjo de Genomas: Uma Coletânea de Artigos Zanoni Dias Orientador: João Meidanis
Page 32: Rearranjo de Genomas: Uma Coletânea de Artigos Zanoni Dias Orientador: João Meidanis

Apêndice

• Programas para o evento de transposição:– Distância Exata:

• Algoritmo Branch and Bound• Variação do algoritmo de Bellman para o cálculo do

diâmetro de transposição– Heurísticas:

• Algoritmo Guloso• Testes

www.ic.unicamp.br/~zanoni/tese

Page 33: Rearranjo de Genomas: Uma Coletânea de Artigos Zanoni Dias Orientador: João Meidanis

Rearranjo de Genomas:Uma Coletânea de Artigos

Zanoni Dias

Orientador:João Meidanis