um algoritmo eficiente para o crescimento de redes sobre o grafo...

56
Introdução Redes Genéticas Probabilísticas Estimação de PGNs O software de estimação e crescimento de redes Algoritmo proposto para crescimento de redes Resultados e conclusões Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo de um sistema de regulação gênica Leandro de Araújo Lima Orientador: Junior Barrera Departamento de Ciência da Computação Instituto de Matemática e Estatística Universidade de São Paulo São Paulo, 10 de agosto de 2009 [email protected] Um algoritmo eficiente para o crescimento de redes sobre o g

Upload: trannhi

Post on 09-Nov-2018

213 views

Category:

Documents


0 download

TRANSCRIPT

IntroduçãoRedes Genéticas Probabilísticas

Estimação de PGNsO software de estimação e crescimento de redes

Algoritmo proposto para crescimento de redesResultados e conclusões

Um algoritmo eficiente para o crescimento de redessobre o grafo probabilístico completo de um

sistema de regulação gênica

Leandro de Araújo LimaOrientador: Junior Barrera

Departamento de Ciência da ComputaçãoInstituto de Matemática e Estatística

Universidade de São Paulo

São Paulo, 10 de agosto de 2009

[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado

IntroduçãoRedes Genéticas Probabilísticas

Estimação de PGNsO software de estimação e crescimento de redes

Algoritmo proposto para crescimento de redesResultados e conclusões

CONTEÚDO

1 INTRODUÇÃO

2 REDES GENÉTICAS PROBABILÍSTICAS

3 ESTIMAÇÃO DE PGNS

4 O SOFTWARE DE ESTIMAÇÃO E CRESCIMENTO DE REDES

5 ALGORITMO PROPOSTO PARA CRESCIMENTO DE REDES

6 RESULTADOS E CONCLUSÕES

[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado

IntroduçãoRedes Genéticas Probabilísticas

Estimação de PGNsO software de estimação e crescimento de redes

Algoritmo proposto para crescimento de redesResultados e conclusões

MotivaçãoFundamentos Biológicos

INTRODUÇÃOMOTIVAÇÃO

COMPUTACIONAL

Estimar o mais corretamente possível as relações deativação/inibição entre genes através de métodos estatísticos ecomputacionais.

BIOLÓGICA

Usar esses resultados para entender a dinâmica defuncionamento das redes de regulação gênica.

[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado

IntroduçãoRedes Genéticas Probabilísticas

Estimação de PGNsO software de estimação e crescimento de redes

Algoritmo proposto para crescimento de redesResultados e conclusões

MotivaçãoFundamentos Biológicos

REDE DE REGULAÇÃO GÊNICA

[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado

IntroduçãoRedes Genéticas Probabilísticas

Estimação de PGNsO software de estimação e crescimento de redes

Algoritmo proposto para crescimento de redesResultados e conclusões

MotivaçãoFundamentos Biológicos

TECNOLOGIA DE MICROARRAY

[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado

IntroduçãoRedes Genéticas Probabilísticas

Estimação de PGNsO software de estimação e crescimento de redes

Algoritmo proposto para crescimento de redesResultados e conclusões

REDES GENÉTICAS PROBABILÍSTICAS

CARACTERIZAÇÃO

São um tipo de Sistema Dinâmico Discreto (discreto em tempoe com escala de valores finita), definidos por:

Variáveis de estadoVetor de estadosUma função para cada variável de estadoVetor de funções, chamado função de transição do sistema

[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado

IntroduçãoRedes Genéticas Probabilísticas

Estimação de PGNsO software de estimação e crescimento de redes

Algoritmo proposto para crescimento de redesResultados e conclusões

REDES GENÉTICAS PROBABILÍSTICAS

CARACTERIZAÇÃO

Seja R a escala de valores (R = {−1,0,1}, em nosso caso).A função de transição φ de uma rede de N variáveis (genes), ememória m, é uma função de RmN em RN . Ou seja, a funçãode transição φ mapeia os m estados préviosx(t − 1), x(t − 2), ..., x(t −m) no estado x(t).Um sistema Dinâmico Discreto é dado por

x(t) = φ[x(t − 1), x(t − 2), ..., x(t −m)],

para todo tempo t ≥ 0.

[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado

IntroduçãoRedes Genéticas Probabilísticas

Estimação de PGNsO software de estimação e crescimento de redes

Algoritmo proposto para crescimento de redesResultados e conclusões

REDES GENÉTICAS PROBABILÍSTICAS

CARACTERIZAÇÃO

Quando a função de transição é uma função estocástica, osistema dinâmico é um processo estocástico.Seja a seqüência X0,X1,X2, ..., assumindo valores em RN , comrealizações denotadas, respectivamente, porx(0), x(1), x(2), .... Uma seqüência de dados aleatórios (Xt )

∞t=0

é chamada uma cadeia de Markov se, para cada t ≥ 1,

P[Xt = x(t)|X0 = x(0), ...,Xt−1 = x(t − 1)] =P[Xt = x(t)|Xt−1 = x(t − 1)]

[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado

IntroduçãoRedes Genéticas Probabilísticas

Estimação de PGNsO software de estimação e crescimento de redes

Algoritmo proposto para crescimento de redesResultados e conclusões

REDES GENÉTICAS PROBABILÍSTICAS

CARACTERIZAÇÃO DAS CADEIAS DE MARKOV

Matriz de transição πY |X de probabilidades condicionaisentre estados – cujos elementos são denotados py |x

Vetor aleatório π0 representando o estado inicial.

A função de transição estocástica φ no tempo t ,para todo t ≥ 1, é dada por

φ[x ] = φ[x(t − 1)] = y ,

onde y é uma realização do vetor aleatório Y comdistribuição p•|x .

[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado

IntroduçãoRedes Genéticas Probabilísticas

Estimação de PGNsO software de estimação e crescimento de redes

Algoritmo proposto para crescimento de redesResultados e conclusões

REDES GENÉTICAS PROBABILÍSTICAS

PROPRIEDADES

Uma Rede Genética Probabilística é uma cadeia de Markov(πY |X , π0), tal que:

I πY |X é homogênea, ou seja, py |x é independente de t ;

II py |x > 0 para todos os estados x ∈ RmN , y ∈ RN ;

[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado

IntroduçãoRedes Genéticas Probabilísticas

Estimação de PGNsO software de estimação e crescimento de redes

Algoritmo proposto para crescimento de redesResultados e conclusões

REDES GENÉTICAS PROBABILÍSTICAS

PROPRIEDADES

III πY |X é condicionalmente independente, ou seja, paratodos os estados x ∈ RmN , y ∈ RN ,

py |x =N∏

i=1

p(yi |x);

IV πY |X é quase determinística, i.e., para toda seqüência deestados x ∈ RmN , existe um estado y ∈ RN tal quepy |x ≈ 1;

[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado

IntroduçãoRedes Genéticas Probabilísticas

Estimação de PGNsO software de estimação e crescimento de redes

Algoritmo proposto para crescimento de redesResultados e conclusões

Coeficiente de DeterminaçãoInformação mútua médiaCrescimento de redes

ESTIMAÇÃO DE PGNS

Desejamos estimar o nível de dependência entre os genespara saber quais são os melhores preditores ou alvos dealguns genes de interesse.

[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado

IntroduçãoRedes Genéticas Probabilísticas

Estimação de PGNsO software de estimação e crescimento de redes

Algoritmo proposto para crescimento de redesResultados e conclusões

Coeficiente de DeterminaçãoInformação mútua médiaCrescimento de redes

COEFICIENTE DE DETERMINAÇÃO

DEFINIÇÃO

O Coeficiente de Determinação θ1,2,...,n de um gene alvo xt porum determinado conjunto de genes preditores x1, x2, ..., xnpode ser definido como

θ1,2,...,n =ε0 − ε1,2,...,n

ε0= 1−

ε1,2,...,n

ε0, 0 ≤ θ1,2,...,n ≤ 1, onde:

I ε0 é o erro cometido ao estimar o alvo xt pelo seu valor médio,isto é, sem observação de outras variáveis. θ0 é o maior – pior –erro de estimação do alvo, pois não são usadas outrasinformações além do valor dele mesmo nas amostras.

II ε1,2,...,n é o erro cometido ao estimar o alvo xt a partir dos genespreditores x1, x2, ..., xn.

[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado

IntroduçãoRedes Genéticas Probabilísticas

Estimação de PGNsO software de estimação e crescimento de redes

Algoritmo proposto para crescimento de redesResultados e conclusões

Coeficiente de DeterminaçãoInformação mútua médiaCrescimento de redes

ENTROPIA

DEFINIÇÃO

A entropia H(X ) de uma variável aleatória X é a medida desua distribuição pi , dada por

H(x) = −n∑

i=1

pi log pi .

[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado

IntroduçãoRedes Genéticas Probabilísticas

Estimação de PGNsO software de estimação e crescimento de redes

Algoritmo proposto para crescimento de redesResultados e conclusões

Coeficiente de DeterminaçãoInformação mútua médiaCrescimento de redes

ENTROPIA

PROPRIEDADES

I) Todas as distribuições formadas por permutações de pitêm a mesma entropia;

II) Concentrar a massa de probabilidade de uma distribuiçãoimplica em diminuir sua entropia.

[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado

IntroduçãoRedes Genéticas Probabilísticas

Estimação de PGNsO software de estimação e crescimento de redes

Algoritmo proposto para crescimento de redesResultados e conclusões

Coeficiente de DeterminaçãoInformação mútua médiaCrescimento de redes

INFORMAÇÃO MÚTUA

INFORMAÇÃO MÚTUA

A informação mútua entre duas variáveis aleatórias X e Y é amedida definida por

I(X ,Y ) = H(Y )− H(Y |X ).

Isso mede a concentração da massa de probabilidade de P(Y )em P(Y |X ) pela observação de X . A esperança de I(X ,Y ) édada por

E [I(X ,Y )] = H(Y )− E [H(Y |X )].

A variável aleatória Y será o valor do gene yi [t + 1] a serpredito e a variável aleatória X dada será o vetor de genes x [t ].

[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado

IntroduçãoRedes Genéticas Probabilísticas

Estimação de PGNsO software de estimação e crescimento de redes

Algoritmo proposto para crescimento de redesResultados e conclusões

Coeficiente de DeterminaçãoInformação mútua médiaCrescimento de redes

CRESCIMENTO DE REDES

DEFINIÇÕES - FORÇA DE CONEXÃO

Definimos a força de um grupo X de genes para o grupoY = {Y1,Y2, ...,Ym} de genes alvos como

σx(Y) = Ψ[σx(Y1), σx(Y2), ..., σx(Ym)],

onde Ψ é uma função como por exemplo soma, máximo oumínimo.

[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado

IntroduçãoRedes Genéticas Probabilísticas

Estimação de PGNsO software de estimação e crescimento de redes

Algoritmo proposto para crescimento de redesResultados e conclusões

Coeficiente de DeterminaçãoInformação mútua médiaCrescimento de redes

MODELO DE E.R. DOUGHERTY E R.F. HASHIMOTO

DEFINIÇÕES

Força da semente S para um gene Y :

σde,S(Y ) = σS(Y )(todos os preditores estão em S)

Força de um gene Y para a semente S:

σpara,S(Y ) = σ{Y}∪S(S)(todos os co-preditores estão em S)

[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado

IntroduçãoRedes Genéticas Probabilísticas

Estimação de PGNsO software de estimação e crescimento de redes

Algoritmo proposto para crescimento de redesResultados e conclusões

Coeficiente de DeterminaçãoInformação mútua médiaCrescimento de redes

MODELO DE E.R. DOUGHERTY E R.F. HASHIMOTO

FORÇA DA SEMENTE S PARA UM GENE Y

[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado

IntroduçãoRedes Genéticas Probabilísticas

Estimação de PGNsO software de estimação e crescimento de redes

Algoritmo proposto para crescimento de redesResultados e conclusões

Coeficiente de DeterminaçãoInformação mútua médiaCrescimento de redes

MODELO DE E.R. DOUGHERTY E R.F. HASHIMOTO

FORÇA DE UM GENE Y PARA A SEMENTE S

[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado

IntroduçãoRedes Genéticas Probabilísticas

Estimação de PGNsO software de estimação e crescimento de redes

Algoritmo proposto para crescimento de redesResultados e conclusões

Coeficiente de DeterminaçãoInformação mútua médiaCrescimento de redes

MODELO DE E.R. DOUGHERTY E R.F. HASHIMOTO

ALGORITMO

G← SEnquanto card(G) ≤ N

Y ← arg maxY⊂U−G

Ξ[σde,G(Y), σpara,G(Y)]

G← G ∪ {Y}

[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado

IntroduçãoRedes Genéticas Probabilísticas

Estimação de PGNsO software de estimação e crescimento de redes

Algoritmo proposto para crescimento de redesResultados e conclusões

Coeficiente de DeterminaçãoInformação mútua médiaCrescimento de redes

MODELO DE E.R. DOUGHERTY E N.W. TREPODE

DEFINIÇÕES

Força da semente S para um gene Y :

σde,S(Y ) = σS(Y ) = maxs⊂S,card(s)≤p

θS(Y )

(pelo menos um co-preditor deve estar na semente, maspode ser que todos estejam)

Força de um gene Y para a semente S:

σpara,S(Y) = maxY∈y,Y /∈S,X∈S,card(y)≤p

θy(X )

(podem haver co-preditores fora da rede e pode ser quetodos estejam)

[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado

IntroduçãoRedes Genéticas Probabilísticas

Estimação de PGNsO software de estimação e crescimento de redes

Algoritmo proposto para crescimento de redesResultados e conclusões

Coeficiente de DeterminaçãoInformação mútua médiaCrescimento de redes

MODELO DE E.R. DOUGHERTY E N.W. TREPODE

FORÇA DE UM GENE Y PARA A SEMENTE S

[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado

IntroduçãoRedes Genéticas Probabilísticas

Estimação de PGNsO software de estimação e crescimento de redes

Algoritmo proposto para crescimento de redesResultados e conclusões

Coeficiente de DeterminaçãoInformação mútua médiaCrescimento de redes

MODELO DE E.R. DOUGHERTY E N.W. TREPODE

FORÇA DA SEMENTE S PARA UM GENE Y

[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado

IntroduçãoRedes Genéticas Probabilísticas

Estimação de PGNsO software de estimação e crescimento de redes

Algoritmo proposto para crescimento de redesResultados e conclusões

Coeficiente de DeterminaçãoInformação mútua médiaCrescimento de redes

MODELO DE E.R. DOUGHERTY E N.W. TREPODE

ALGORITMO

Duas condições de parada:1 card(S) ≥ N ou

2

∑y∈yi,y /∈S σS(y)∑

y∈yi,y /∈S 1< thde e σpara,S(Yi) < thpara.

onde thde e thpara são os limiares para os valores médios depredição (CoD ou inf. mútua) de e para a rede.

[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado

IntroduçãoRedes Genéticas Probabilísticas

Estimação de PGNsO software de estimação e crescimento de redes

Algoritmo proposto para crescimento de redesResultados e conclusões

CONTRIBUIÇÕES PARA O SOFTWARE DE ESTIMAÇÃO E

CRESCIMENTO DE REDES

ETAPAS DO SOFTWARE

Estimação de dependênciasEliminação de redundâncias (top-down e bottom-up)Ordenação dos arquivosCrescimento de redes

[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado

IntroduçãoRedes Genéticas Probabilísticas

Estimação de PGNsO software de estimação e crescimento de redes

Algoritmo proposto para crescimento de redesResultados e conclusões

CONTRIBUIÇÕES PARA O SOFTWARE DE ESTIMAÇÃO E

CRESCIMENTO DE REDES

LIMITAÇÕES E MELHORIAS

Economia de espaço em discoCálculo de informação mútua médiaParalelização do cálculo de dependências

[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado

IntroduçãoRedes Genéticas Probabilísticas

Estimação de PGNsO software de estimação e crescimento de redes

Algoritmo proposto para crescimento de redesResultados e conclusões

Avanços em relação aos algoritmos anteriores

AVANÇOS EM RELAÇÃO AOS ALGORITMOS ANTERIORES

Diminuição do espaço de busca a cada iteraçãoGrau de confiança determinado por camadasCritério para adicionar genes à rede

[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado

IntroduçãoRedes Genéticas Probabilísticas

Estimação de PGNsO software de estimação e crescimento de redes

Algoritmo proposto para crescimento de redesResultados e conclusões

Avanços em relação aos algoritmos anteriores

DIMINUIÇÃO DO ESPAÇO DE BUSCA A CADA ITERAÇÃO

ALGORITMOS ANTERIORES - PASSO 0

A

B1

B2

B3 B4

C7

C8C9

C1

C2

C3

C4C6

C5

D1

D2

D3

D4

D7

D5

D6

[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado

IntroduçãoRedes Genéticas Probabilísticas

Estimação de PGNsO software de estimação e crescimento de redes

Algoritmo proposto para crescimento de redesResultados e conclusões

Avanços em relação aos algoritmos anteriores

DIMINUIÇÃO DO ESPAÇO DE BUSCA A CADA ITERAÇÃO

ALGORITMOS ANTERIORES - PASSO 1

A

B1

B2

B3 B4

C7

C8C9

C1

C2

C3

C4C6

C5

D1

D2

D3

D4

D7

D5

D6

[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado

IntroduçãoRedes Genéticas Probabilísticas

Estimação de PGNsO software de estimação e crescimento de redes

Algoritmo proposto para crescimento de redesResultados e conclusões

Avanços em relação aos algoritmos anteriores

DIMINUIÇÃO DO ESPAÇO DE BUSCA A CADA ITERAÇÃO

ALGORITMOS ANTERIORES - PASSO 2

A

B1

B2

B3 B4

C7

C8C9

C1

C2

C3

C4C6

C5

D1

D2

D3

D4

D7

D5

D6

[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado

IntroduçãoRedes Genéticas Probabilísticas

Estimação de PGNsO software de estimação e crescimento de redes

Algoritmo proposto para crescimento de redesResultados e conclusões

Avanços em relação aos algoritmos anteriores

DIMINUIÇÃO DO ESPAÇO DE BUSCA A CADA ITERAÇÃO

ALGORITMO PROPOSTO - PASSO 0

A

B1

B2

B3 B4

C7

C8C9

C1

C2

C3

C4C6

C5

D1

D2

D3

D4

D7

D5

D6

[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado

IntroduçãoRedes Genéticas Probabilísticas

Estimação de PGNsO software de estimação e crescimento de redes

Algoritmo proposto para crescimento de redesResultados e conclusões

Avanços em relação aos algoritmos anteriores

DIMINUIÇÃO DO ESPAÇO DE BUSCA A CADA ITERAÇÃO

ALGORITMO PROPOSTO - PASSO 1

A

B1

B2

B3 B4

C7

C8C9

C1

C2

C3

C4C6

C5

D1

D2

D3

D4

D7

D5

D6

[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado

IntroduçãoRedes Genéticas Probabilísticas

Estimação de PGNsO software de estimação e crescimento de redes

Algoritmo proposto para crescimento de redesResultados e conclusões

Avanços em relação aos algoritmos anteriores

DIMINUIÇÃO DO ESPAÇO DE BUSCA A CADA ITERAÇÃO

ALGORITMO PROPOSTO - PASSO 2

A

B1

B2

B3 B4

C7

C8C9

C1

C2

C3

C4C6

C5

D1

D2

D3

D4

D7

D5

D6

[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado

IntroduçãoRedes Genéticas Probabilísticas

Estimação de PGNsO software de estimação e crescimento de redes

Algoritmo proposto para crescimento de redesResultados e conclusões

Avanços em relação aos algoritmos anteriores

DIMINUIÇÃO DO ESPAÇO DE BUSCA A CADA ITERAÇÃO

CÁLCULO DE DEPENDÊNCIAS COM ALGORITMOS ANTERIORES

n × Cn,p = n × n!(n−p)! p! ,

onde n é a quantidade total de genes e p é a quantidade depreditores usados em cada predição.

[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado

IntroduçãoRedes Genéticas Probabilísticas

Estimação de PGNsO software de estimação e crescimento de redes

Algoritmo proposto para crescimento de redesResultados e conclusões

Avanços em relação aos algoritmos anteriores

DIMINUIÇÃO DO ESPAÇO DE BUSCA A CADA ITERAÇÃO

CÁLCULO DE DEPENDÊNCIAS COM ALGORITMO PROPOSTO -DEFINIÇÕES

k : quantidade de camadasLi : conj. de genes da camada iGi : conj. de genes já adicionados à rede até o passo i (ou

seja, Gi =i−1⋃j=0

Lj )

[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado

IntroduçãoRedes Genéticas Probabilísticas

Estimação de PGNsO software de estimação e crescimento de redes

Algoritmo proposto para crescimento de redesResultados e conclusões

Avanços em relação aos algoritmos anteriores

DIMINUIÇÃO DO ESPAÇO DE BUSCA A CADA ITERAÇÃO

[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado

IntroduçãoRedes Genéticas Probabilísticas

Estimação de PGNsO software de estimação e crescimento de redes

Algoritmo proposto para crescimento de redesResultados e conclusões

Avanços em relação aos algoritmos anteriores

DIMINUIÇÃO DO ESPAÇO DE BUSCA A CADA ITERAÇÃO

[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado

IntroduçãoRedes Genéticas Probabilísticas

Estimação de PGNsO software de estimação e crescimento de redes

Algoritmo proposto para crescimento de redesResultados e conclusões

Avanços em relação aos algoritmos anteriores

DIMINUIÇÃO DO ESPAÇO DE BUSCA A CADA ITERAÇÃO

[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado

IntroduçãoRedes Genéticas Probabilísticas

Estimação de PGNsO software de estimação e crescimento de redes

Algoritmo proposto para crescimento de redesResultados e conclusões

Avanços em relação aos algoritmos anteriores

DIMINUIÇÃO DO ESPAÇO DE BUSCA A CADA ITERAÇÃO

[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado

IntroduçãoRedes Genéticas Probabilísticas

Estimação de PGNsO software de estimação e crescimento de redes

Algoritmo proposto para crescimento de redesResultados e conclusões

Avanços em relação aos algoritmos anteriores

DIMINUIÇÃO DO ESPAÇO DE BUSCA A CADA ITERAÇÃO

[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado

IntroduçãoRedes Genéticas Probabilísticas

Estimação de PGNsO software de estimação e crescimento de redes

Algoritmo proposto para crescimento de redesResultados e conclusões

Avanços em relação aos algoritmos anteriores

DIMINUIÇÃO DO ESPAÇO DE BUSCA A CADA ITERAÇÃO

[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado

IntroduçãoRedes Genéticas Probabilísticas

Estimação de PGNsO software de estimação e crescimento de redes

Algoritmo proposto para crescimento de redesResultados e conclusões

Avanços em relação aos algoritmos anteriores

DIMINUIÇÃO DO ESPAÇO DE BUSCA A CADA ITERAÇÃO

[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado

IntroduçãoRedes Genéticas Probabilísticas

Estimação de PGNsO software de estimação e crescimento de redes

Algoritmo proposto para crescimento de redesResultados e conclusões

Avanços em relação aos algoritmos anteriores

DIMINUIÇÃO DO ESPAÇO DE BUSCA A CADA ITERAÇÃO

CÁLCULO DE DEPENDÊNCIAS COM ALGORITMO PROPOSTO

k−1∑i=0

p∑

j=1

(Li

j

)[n − (|Gi |+ |Li |)]

︸ ︷︷ ︸sementes como preditores

+ |Li |(

n − |Gi |p

)︸ ︷︷ ︸

sementes como alvos

[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado

IntroduçãoRedes Genéticas Probabilísticas

Estimação de PGNsO software de estimação e crescimento de redes

Algoritmo proposto para crescimento de redesResultados e conclusões

Avanços em relação aos algoritmos anteriores

GRAU DE CONFIANÇA DETERMINADO POR CAMADAS

A

B1

B2

B3 B4

C7

C8C9

C1

C2

C3

C4C6

C5

D1

D2

D3

D4

D7

D5

D6

Layer 0

Layer 2

Layer 1

[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado

IntroduçãoRedes Genéticas Probabilísticas

Estimação de PGNsO software de estimação e crescimento de redes

Algoritmo proposto para crescimento de redesResultados e conclusões

Avanços em relação aos algoritmos anteriores

CRITÉRIO PARA ADICIONAR GENES À REDE

X0

X1

1.0

X3

0.8

X2

0.7

X4

1.0

0.5

0.8

0.9 0.2

[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado

IntroduçãoRedes Genéticas Probabilísticas

Estimação de PGNsO software de estimação e crescimento de redes

Algoritmo proposto para crescimento de redesResultados e conclusões

Avanços em relação aos algoritmos anteriores

ALGORITMO

Entrada: S,U, k , thde, thparaSaída: Conjunto L de camadas de genes e conjunto E das

arestas entre as camadasL← ∅;E ← ∅;i ← 0;Li ← S;

[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado

IntroduçãoRedes Genéticas Probabilísticas

Estimação de PGNsO software de estimação e crescimento de redes

Algoritmo proposto para crescimento de redesResultados e conclusões

Avanços em relação aos algoritmos anteriores

ALGORITMO (CONTINUAÇÃO)

enquanto Li 6= ∅ e i < k faça

Li+1 ← arg maxY∈U−L

[max

σde,para≥thde,para[σde,Li (Y ), σpara,Li (Y )]

];

Ei+1 ← {(li li+1) : li ∈ Li , li+1 ∈ Li+1};E ← E ∪ {Ei+1};L← L ∪ {Li+1};i ← i + 1;

fim

[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado

IntroduçãoRedes Genéticas Probabilísticas

Estimação de PGNsO software de estimação e crescimento de redes

Algoritmo proposto para crescimento de redesResultados e conclusões

DADOS DOS EXPERIMENTOS DA MALÁRIA

Duração do estágio do parasita no sangue humano: ∼ 48hAmostras: 48, feitas de hora em horaTotal de genes: 6532Grupos estudados: glicólise (10 genes) e apicoplasto (27genes)

[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado

IntroduçãoRedes Genéticas Probabilísticas

Estimação de PGNsO software de estimação e crescimento de redes

Algoritmo proposto para crescimento de redesResultados e conclusões

RESULTADOS

GLICÓLISE - 10 MELHORES PARES OU INDIVIDUAIS

Layer 0 oPFF72413 N132_136

Ks488_1

1.0

I13056_1 M11919_1 N132_40

oPFF72419

1.0

M48835_1

1.0

I1689_2

M43799_2

1.0

J2896_1J53_48

C237

1.0

Km548_1

1.0

N158_6

1.01.0

oPFF72425

J183_4

1.0 1.0

C465

1.0

Layer 1E2926_1

1.0

F30473_2

1.0

N132_147

1.0 1.01.0

N181_15

1.0 1.0

I14812_1

1.01.0

[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado

IntroduçãoRedes Genéticas Probabilísticas

Estimação de PGNsO software de estimação e crescimento de redes

Algoritmo proposto para crescimento de redesResultados e conclusões

RESULTADOS

GLICÓLISE - 20 MELHORES PARES OU INDIVIDUAIS

Layer 0 oPFF72413 N132_136

F17473_1

1.0

Ks488_1

1.0

F13784_1

1.0

I13056_1

oPFF72419

1.0

M11919_1N132_40

1.0

M48835_1

1.0

I1689_2

oPFN0250

1.0

M43799_2

1.0

oPFI17685

1.0

J2896_1

1.0

J53_48

C237

1.0

Km548_1

1.0

N158_6

1.01.0

oPFI17722

1.0

oPFF72425

J183_4

1.0 1.0

C465

1.0

Layer 1N170_4

1.0

I12861_2i

1.0

E2926_1

1.0

F24461_1

1.0

F30473_2

1.0

I5511_2

1.0

N132_147

1.0 1.01.0

D17715_80

1.0

N181_15

1.01.0

M58072_1

1.0

I14812_1

1.01.0

oPFD66961

1.0

oPFL0115

1.0

oPFL0131

1.0

[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado

IntroduçãoRedes Genéticas Probabilísticas

Estimação de PGNsO software de estimação e crescimento de redes

Algoritmo proposto para crescimento de redesResultados e conclusões

RESULTADOS

APICOPLASTO - APARECIMENTO DE GENES ATRATORES

Layer 0

Prps11

J183_4

1.01.01.01.0

N155_35

1.0

Prps12

1.0

1.0

1.01.0 1.0

Prps3

1.0

Prpl6

1.0PClp

1.0

Prpl141.0

Layer 1

B537

1.0

F960_5

1.0Ks44_10

1.0

F960_4 1.0

I14812_1

1.0

D23156_33

1.0

I16487_3

1.0

A8109_21

1.0

N158_4

1.01.01.0

[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado

IntroduçãoRedes Genéticas Probabilísticas

Estimação de PGNsO software de estimação e crescimento de redes

Algoritmo proposto para crescimento de redesResultados e conclusões

RESULTADOS

RECUPERAÇÃO DE 6 GENES DA GLICÓLISE NA 3A CAMADA

Layer 0

I13056_1 oPFF724191.0

Layer 1

N170_4

1.0

B484

1.0

Ks26_5

1.0

Layer 2

B424

1.0

F19110_2

1.0

F35197_1

1.0

F64252_1

1.0

oPFN0252

1.0

E3038_1

1.0

M36754_1

1.01.0

F46584_1

1.0

N161_2

1.0

A1411_1

1.0

D56950_2

1.0

E7861_3

1.0

N131_27

1.0

N150_75

1.0

N181_18

1.0

oPFL0142

1.0

oPFBLOB0178

1.0

J53_48

1.0

M34107_3

1.0

N128_4

1.0

N138_90

1.0

D49176_46

1.0

oPFD66958

1.0

M48835_1

1.0

F44947_3

1.0

I9302_5

1.01.01.0

J151_11

1.0

J151_6

1.0

L3_25

1.0

I14975_1

1.0

oPFBLOB0103

1.0

oPFI17659

1.0

Ks783_2

1.0

E12445_1

1.0

E15509_11

1.0 F16133_1

1.0

F41817_11.0

F70835_1

1.0

M12812_7

1.0

E20147_1

1.0

F4565_1

1.0

1.0

J206_2

1.0

M2511_2

1.01.0

N181_15

1.0

1.01.01.01.01.01.01.01.01.0

1.0

1.01.01.01.0

1.0

1.01.01.01.01.01.01.01.0

1.01.01.01.01.0

Z_5_60

1.0

Z_5_80

1.0

C474

1.0

D49176_35

1.0

Ks545_1

1.01.0

M21368_3

1.0

Ks83_16

1.0

E7279_3

1.0

F31971_1

1.0

I3638_1

1.0

I4719_2

1.0

I4719_6

1.0

L1_96

1.0

M35930_3

1.0

Kn12486_2

1.01.0

oPFL0013

1.0

E28350_2

1.0

F25239_3

1.01.0

Ks136_3

1.0

M6483_1

1.0

M38941_10

1.01.0

M57341_2

1.0

C60

1.0

F8027_3

1.0

N133_7

1.0

oPFN02761.0

N132_40

1.0

N143_16

1.0

F54854_2

1.0

oPFF72453

1.0

oPFI17716

1.0

C465

1.0

I9876_1

1.0

Ks3088_1

1.0

Ks370_11

1.0F28964_1

1.0

[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado

IntroduçãoRedes Genéticas Probabilísticas

Estimação de PGNsO software de estimação e crescimento de redes

Algoritmo proposto para crescimento de redesResultados e conclusões

CONCLUSÕES

O algoritmo agrega bons genes candidatos, ao escolhergenes com força (para ou a partir da rede) alta, e não umasoma delasO algoritmo recupera a rede fazendo menos cálculos,porque não precisa verificar novamente as camadaspassadasAs camadas permitem diferenciarmos o grau de confiançade grupos de genes

[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado

IntroduçãoRedes Genéticas Probabilísticas

Estimação de PGNsO software de estimação e crescimento de redes

Algoritmo proposto para crescimento de redesResultados e conclusões

Este trabalho recebeu apoio financeiro da CAPES –Coordenação de Aperfeiçoamento de Pessoal de NívelSuperior

[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado

IntroduçãoRedes Genéticas Probabilísticas

Estimação de PGNsO software de estimação e crescimento de redes

Algoritmo proposto para crescimento de redesResultados e conclusões

Perguntas?

[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado