um algoritmo eficiente para o crescimento de redes sobre o grafo...
TRANSCRIPT
IntroduçãoRedes Genéticas Probabilísticas
Estimação de PGNsO software de estimação e crescimento de redes
Algoritmo proposto para crescimento de redesResultados e conclusões
Um algoritmo eficiente para o crescimento de redessobre o grafo probabilístico completo de um
sistema de regulação gênica
Leandro de Araújo LimaOrientador: Junior Barrera
Departamento de Ciência da ComputaçãoInstituto de Matemática e Estatística
Universidade de São Paulo
São Paulo, 10 de agosto de 2009
[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado
IntroduçãoRedes Genéticas Probabilísticas
Estimação de PGNsO software de estimação e crescimento de redes
Algoritmo proposto para crescimento de redesResultados e conclusões
CONTEÚDO
1 INTRODUÇÃO
2 REDES GENÉTICAS PROBABILÍSTICAS
3 ESTIMAÇÃO DE PGNS
4 O SOFTWARE DE ESTIMAÇÃO E CRESCIMENTO DE REDES
5 ALGORITMO PROPOSTO PARA CRESCIMENTO DE REDES
6 RESULTADOS E CONCLUSÕES
[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado
IntroduçãoRedes Genéticas Probabilísticas
Estimação de PGNsO software de estimação e crescimento de redes
Algoritmo proposto para crescimento de redesResultados e conclusões
MotivaçãoFundamentos Biológicos
INTRODUÇÃOMOTIVAÇÃO
COMPUTACIONAL
Estimar o mais corretamente possível as relações deativação/inibição entre genes através de métodos estatísticos ecomputacionais.
BIOLÓGICA
Usar esses resultados para entender a dinâmica defuncionamento das redes de regulação gênica.
[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado
IntroduçãoRedes Genéticas Probabilísticas
Estimação de PGNsO software de estimação e crescimento de redes
Algoritmo proposto para crescimento de redesResultados e conclusões
MotivaçãoFundamentos Biológicos
REDE DE REGULAÇÃO GÊNICA
[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado
IntroduçãoRedes Genéticas Probabilísticas
Estimação de PGNsO software de estimação e crescimento de redes
Algoritmo proposto para crescimento de redesResultados e conclusões
MotivaçãoFundamentos Biológicos
TECNOLOGIA DE MICROARRAY
[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado
IntroduçãoRedes Genéticas Probabilísticas
Estimação de PGNsO software de estimação e crescimento de redes
Algoritmo proposto para crescimento de redesResultados e conclusões
REDES GENÉTICAS PROBABILÍSTICAS
CARACTERIZAÇÃO
São um tipo de Sistema Dinâmico Discreto (discreto em tempoe com escala de valores finita), definidos por:
Variáveis de estadoVetor de estadosUma função para cada variável de estadoVetor de funções, chamado função de transição do sistema
[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado
IntroduçãoRedes Genéticas Probabilísticas
Estimação de PGNsO software de estimação e crescimento de redes
Algoritmo proposto para crescimento de redesResultados e conclusões
REDES GENÉTICAS PROBABILÍSTICAS
CARACTERIZAÇÃO
Seja R a escala de valores (R = {−1,0,1}, em nosso caso).A função de transição φ de uma rede de N variáveis (genes), ememória m, é uma função de RmN em RN . Ou seja, a funçãode transição φ mapeia os m estados préviosx(t − 1), x(t − 2), ..., x(t −m) no estado x(t).Um sistema Dinâmico Discreto é dado por
x(t) = φ[x(t − 1), x(t − 2), ..., x(t −m)],
para todo tempo t ≥ 0.
[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado
IntroduçãoRedes Genéticas Probabilísticas
Estimação de PGNsO software de estimação e crescimento de redes
Algoritmo proposto para crescimento de redesResultados e conclusões
REDES GENÉTICAS PROBABILÍSTICAS
CARACTERIZAÇÃO
Quando a função de transição é uma função estocástica, osistema dinâmico é um processo estocástico.Seja a seqüência X0,X1,X2, ..., assumindo valores em RN , comrealizações denotadas, respectivamente, porx(0), x(1), x(2), .... Uma seqüência de dados aleatórios (Xt )
∞t=0
é chamada uma cadeia de Markov se, para cada t ≥ 1,
P[Xt = x(t)|X0 = x(0), ...,Xt−1 = x(t − 1)] =P[Xt = x(t)|Xt−1 = x(t − 1)]
[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado
IntroduçãoRedes Genéticas Probabilísticas
Estimação de PGNsO software de estimação e crescimento de redes
Algoritmo proposto para crescimento de redesResultados e conclusões
REDES GENÉTICAS PROBABILÍSTICAS
CARACTERIZAÇÃO DAS CADEIAS DE MARKOV
Matriz de transição πY |X de probabilidades condicionaisentre estados – cujos elementos são denotados py |x
Vetor aleatório π0 representando o estado inicial.
A função de transição estocástica φ no tempo t ,para todo t ≥ 1, é dada por
φ[x ] = φ[x(t − 1)] = y ,
onde y é uma realização do vetor aleatório Y comdistribuição p•|x .
[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado
IntroduçãoRedes Genéticas Probabilísticas
Estimação de PGNsO software de estimação e crescimento de redes
Algoritmo proposto para crescimento de redesResultados e conclusões
REDES GENÉTICAS PROBABILÍSTICAS
PROPRIEDADES
Uma Rede Genética Probabilística é uma cadeia de Markov(πY |X , π0), tal que:
I πY |X é homogênea, ou seja, py |x é independente de t ;
II py |x > 0 para todos os estados x ∈ RmN , y ∈ RN ;
[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado
IntroduçãoRedes Genéticas Probabilísticas
Estimação de PGNsO software de estimação e crescimento de redes
Algoritmo proposto para crescimento de redesResultados e conclusões
REDES GENÉTICAS PROBABILÍSTICAS
PROPRIEDADES
III πY |X é condicionalmente independente, ou seja, paratodos os estados x ∈ RmN , y ∈ RN ,
py |x =N∏
i=1
p(yi |x);
IV πY |X é quase determinística, i.e., para toda seqüência deestados x ∈ RmN , existe um estado y ∈ RN tal quepy |x ≈ 1;
[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado
IntroduçãoRedes Genéticas Probabilísticas
Estimação de PGNsO software de estimação e crescimento de redes
Algoritmo proposto para crescimento de redesResultados e conclusões
Coeficiente de DeterminaçãoInformação mútua médiaCrescimento de redes
ESTIMAÇÃO DE PGNS
Desejamos estimar o nível de dependência entre os genespara saber quais são os melhores preditores ou alvos dealguns genes de interesse.
[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado
IntroduçãoRedes Genéticas Probabilísticas
Estimação de PGNsO software de estimação e crescimento de redes
Algoritmo proposto para crescimento de redesResultados e conclusões
Coeficiente de DeterminaçãoInformação mútua médiaCrescimento de redes
COEFICIENTE DE DETERMINAÇÃO
DEFINIÇÃO
O Coeficiente de Determinação θ1,2,...,n de um gene alvo xt porum determinado conjunto de genes preditores x1, x2, ..., xnpode ser definido como
θ1,2,...,n =ε0 − ε1,2,...,n
ε0= 1−
ε1,2,...,n
ε0, 0 ≤ θ1,2,...,n ≤ 1, onde:
I ε0 é o erro cometido ao estimar o alvo xt pelo seu valor médio,isto é, sem observação de outras variáveis. θ0 é o maior – pior –erro de estimação do alvo, pois não são usadas outrasinformações além do valor dele mesmo nas amostras.
II ε1,2,...,n é o erro cometido ao estimar o alvo xt a partir dos genespreditores x1, x2, ..., xn.
[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado
IntroduçãoRedes Genéticas Probabilísticas
Estimação de PGNsO software de estimação e crescimento de redes
Algoritmo proposto para crescimento de redesResultados e conclusões
Coeficiente de DeterminaçãoInformação mútua médiaCrescimento de redes
ENTROPIA
DEFINIÇÃO
A entropia H(X ) de uma variável aleatória X é a medida desua distribuição pi , dada por
H(x) = −n∑
i=1
pi log pi .
[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado
IntroduçãoRedes Genéticas Probabilísticas
Estimação de PGNsO software de estimação e crescimento de redes
Algoritmo proposto para crescimento de redesResultados e conclusões
Coeficiente de DeterminaçãoInformação mútua médiaCrescimento de redes
ENTROPIA
PROPRIEDADES
I) Todas as distribuições formadas por permutações de pitêm a mesma entropia;
II) Concentrar a massa de probabilidade de uma distribuiçãoimplica em diminuir sua entropia.
[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado
IntroduçãoRedes Genéticas Probabilísticas
Estimação de PGNsO software de estimação e crescimento de redes
Algoritmo proposto para crescimento de redesResultados e conclusões
Coeficiente de DeterminaçãoInformação mútua médiaCrescimento de redes
INFORMAÇÃO MÚTUA
INFORMAÇÃO MÚTUA
A informação mútua entre duas variáveis aleatórias X e Y é amedida definida por
I(X ,Y ) = H(Y )− H(Y |X ).
Isso mede a concentração da massa de probabilidade de P(Y )em P(Y |X ) pela observação de X . A esperança de I(X ,Y ) édada por
E [I(X ,Y )] = H(Y )− E [H(Y |X )].
A variável aleatória Y será o valor do gene yi [t + 1] a serpredito e a variável aleatória X dada será o vetor de genes x [t ].
[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado
IntroduçãoRedes Genéticas Probabilísticas
Estimação de PGNsO software de estimação e crescimento de redes
Algoritmo proposto para crescimento de redesResultados e conclusões
Coeficiente de DeterminaçãoInformação mútua médiaCrescimento de redes
CRESCIMENTO DE REDES
DEFINIÇÕES - FORÇA DE CONEXÃO
Definimos a força de um grupo X de genes para o grupoY = {Y1,Y2, ...,Ym} de genes alvos como
σx(Y) = Ψ[σx(Y1), σx(Y2), ..., σx(Ym)],
onde Ψ é uma função como por exemplo soma, máximo oumínimo.
[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado
IntroduçãoRedes Genéticas Probabilísticas
Estimação de PGNsO software de estimação e crescimento de redes
Algoritmo proposto para crescimento de redesResultados e conclusões
Coeficiente de DeterminaçãoInformação mútua médiaCrescimento de redes
MODELO DE E.R. DOUGHERTY E R.F. HASHIMOTO
DEFINIÇÕES
Força da semente S para um gene Y :
σde,S(Y ) = σS(Y )(todos os preditores estão em S)
Força de um gene Y para a semente S:
σpara,S(Y ) = σ{Y}∪S(S)(todos os co-preditores estão em S)
[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado
IntroduçãoRedes Genéticas Probabilísticas
Estimação de PGNsO software de estimação e crescimento de redes
Algoritmo proposto para crescimento de redesResultados e conclusões
Coeficiente de DeterminaçãoInformação mútua médiaCrescimento de redes
MODELO DE E.R. DOUGHERTY E R.F. HASHIMOTO
FORÇA DA SEMENTE S PARA UM GENE Y
[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado
IntroduçãoRedes Genéticas Probabilísticas
Estimação de PGNsO software de estimação e crescimento de redes
Algoritmo proposto para crescimento de redesResultados e conclusões
Coeficiente de DeterminaçãoInformação mútua médiaCrescimento de redes
MODELO DE E.R. DOUGHERTY E R.F. HASHIMOTO
FORÇA DE UM GENE Y PARA A SEMENTE S
[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado
IntroduçãoRedes Genéticas Probabilísticas
Estimação de PGNsO software de estimação e crescimento de redes
Algoritmo proposto para crescimento de redesResultados e conclusões
Coeficiente de DeterminaçãoInformação mútua médiaCrescimento de redes
MODELO DE E.R. DOUGHERTY E R.F. HASHIMOTO
ALGORITMO
G← SEnquanto card(G) ≤ N
Y ← arg maxY⊂U−G
Ξ[σde,G(Y), σpara,G(Y)]
G← G ∪ {Y}
[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado
IntroduçãoRedes Genéticas Probabilísticas
Estimação de PGNsO software de estimação e crescimento de redes
Algoritmo proposto para crescimento de redesResultados e conclusões
Coeficiente de DeterminaçãoInformação mútua médiaCrescimento de redes
MODELO DE E.R. DOUGHERTY E N.W. TREPODE
DEFINIÇÕES
Força da semente S para um gene Y :
σde,S(Y ) = σS(Y ) = maxs⊂S,card(s)≤p
θS(Y )
(pelo menos um co-preditor deve estar na semente, maspode ser que todos estejam)
Força de um gene Y para a semente S:
σpara,S(Y) = maxY∈y,Y /∈S,X∈S,card(y)≤p
θy(X )
(podem haver co-preditores fora da rede e pode ser quetodos estejam)
[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado
IntroduçãoRedes Genéticas Probabilísticas
Estimação de PGNsO software de estimação e crescimento de redes
Algoritmo proposto para crescimento de redesResultados e conclusões
Coeficiente de DeterminaçãoInformação mútua médiaCrescimento de redes
MODELO DE E.R. DOUGHERTY E N.W. TREPODE
FORÇA DE UM GENE Y PARA A SEMENTE S
[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado
IntroduçãoRedes Genéticas Probabilísticas
Estimação de PGNsO software de estimação e crescimento de redes
Algoritmo proposto para crescimento de redesResultados e conclusões
Coeficiente de DeterminaçãoInformação mútua médiaCrescimento de redes
MODELO DE E.R. DOUGHERTY E N.W. TREPODE
FORÇA DA SEMENTE S PARA UM GENE Y
[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado
IntroduçãoRedes Genéticas Probabilísticas
Estimação de PGNsO software de estimação e crescimento de redes
Algoritmo proposto para crescimento de redesResultados e conclusões
Coeficiente de DeterminaçãoInformação mútua médiaCrescimento de redes
MODELO DE E.R. DOUGHERTY E N.W. TREPODE
ALGORITMO
Duas condições de parada:1 card(S) ≥ N ou
2
∑y∈yi,y /∈S σS(y)∑
y∈yi,y /∈S 1< thde e σpara,S(Yi) < thpara.
onde thde e thpara são os limiares para os valores médios depredição (CoD ou inf. mútua) de e para a rede.
[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado
IntroduçãoRedes Genéticas Probabilísticas
Estimação de PGNsO software de estimação e crescimento de redes
Algoritmo proposto para crescimento de redesResultados e conclusões
CONTRIBUIÇÕES PARA O SOFTWARE DE ESTIMAÇÃO E
CRESCIMENTO DE REDES
ETAPAS DO SOFTWARE
Estimação de dependênciasEliminação de redundâncias (top-down e bottom-up)Ordenação dos arquivosCrescimento de redes
[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado
IntroduçãoRedes Genéticas Probabilísticas
Estimação de PGNsO software de estimação e crescimento de redes
Algoritmo proposto para crescimento de redesResultados e conclusões
CONTRIBUIÇÕES PARA O SOFTWARE DE ESTIMAÇÃO E
CRESCIMENTO DE REDES
LIMITAÇÕES E MELHORIAS
Economia de espaço em discoCálculo de informação mútua médiaParalelização do cálculo de dependências
[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado
IntroduçãoRedes Genéticas Probabilísticas
Estimação de PGNsO software de estimação e crescimento de redes
Algoritmo proposto para crescimento de redesResultados e conclusões
Avanços em relação aos algoritmos anteriores
AVANÇOS EM RELAÇÃO AOS ALGORITMOS ANTERIORES
Diminuição do espaço de busca a cada iteraçãoGrau de confiança determinado por camadasCritério para adicionar genes à rede
[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado
IntroduçãoRedes Genéticas Probabilísticas
Estimação de PGNsO software de estimação e crescimento de redes
Algoritmo proposto para crescimento de redesResultados e conclusões
Avanços em relação aos algoritmos anteriores
DIMINUIÇÃO DO ESPAÇO DE BUSCA A CADA ITERAÇÃO
ALGORITMOS ANTERIORES - PASSO 0
A
B1
B2
B3 B4
C7
C8C9
C1
C2
C3
C4C6
C5
D1
D2
D3
D4
D7
D5
D6
[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado
IntroduçãoRedes Genéticas Probabilísticas
Estimação de PGNsO software de estimação e crescimento de redes
Algoritmo proposto para crescimento de redesResultados e conclusões
Avanços em relação aos algoritmos anteriores
DIMINUIÇÃO DO ESPAÇO DE BUSCA A CADA ITERAÇÃO
ALGORITMOS ANTERIORES - PASSO 1
A
B1
B2
B3 B4
C7
C8C9
C1
C2
C3
C4C6
C5
D1
D2
D3
D4
D7
D5
D6
[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado
IntroduçãoRedes Genéticas Probabilísticas
Estimação de PGNsO software de estimação e crescimento de redes
Algoritmo proposto para crescimento de redesResultados e conclusões
Avanços em relação aos algoritmos anteriores
DIMINUIÇÃO DO ESPAÇO DE BUSCA A CADA ITERAÇÃO
ALGORITMOS ANTERIORES - PASSO 2
A
B1
B2
B3 B4
C7
C8C9
C1
C2
C3
C4C6
C5
D1
D2
D3
D4
D7
D5
D6
[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado
IntroduçãoRedes Genéticas Probabilísticas
Estimação de PGNsO software de estimação e crescimento de redes
Algoritmo proposto para crescimento de redesResultados e conclusões
Avanços em relação aos algoritmos anteriores
DIMINUIÇÃO DO ESPAÇO DE BUSCA A CADA ITERAÇÃO
ALGORITMO PROPOSTO - PASSO 0
A
B1
B2
B3 B4
C7
C8C9
C1
C2
C3
C4C6
C5
D1
D2
D3
D4
D7
D5
D6
[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado
IntroduçãoRedes Genéticas Probabilísticas
Estimação de PGNsO software de estimação e crescimento de redes
Algoritmo proposto para crescimento de redesResultados e conclusões
Avanços em relação aos algoritmos anteriores
DIMINUIÇÃO DO ESPAÇO DE BUSCA A CADA ITERAÇÃO
ALGORITMO PROPOSTO - PASSO 1
A
B1
B2
B3 B4
C7
C8C9
C1
C2
C3
C4C6
C5
D1
D2
D3
D4
D7
D5
D6
[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado
IntroduçãoRedes Genéticas Probabilísticas
Estimação de PGNsO software de estimação e crescimento de redes
Algoritmo proposto para crescimento de redesResultados e conclusões
Avanços em relação aos algoritmos anteriores
DIMINUIÇÃO DO ESPAÇO DE BUSCA A CADA ITERAÇÃO
ALGORITMO PROPOSTO - PASSO 2
A
B1
B2
B3 B4
C7
C8C9
C1
C2
C3
C4C6
C5
D1
D2
D3
D4
D7
D5
D6
[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado
IntroduçãoRedes Genéticas Probabilísticas
Estimação de PGNsO software de estimação e crescimento de redes
Algoritmo proposto para crescimento de redesResultados e conclusões
Avanços em relação aos algoritmos anteriores
DIMINUIÇÃO DO ESPAÇO DE BUSCA A CADA ITERAÇÃO
CÁLCULO DE DEPENDÊNCIAS COM ALGORITMOS ANTERIORES
n × Cn,p = n × n!(n−p)! p! ,
onde n é a quantidade total de genes e p é a quantidade depreditores usados em cada predição.
[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado
IntroduçãoRedes Genéticas Probabilísticas
Estimação de PGNsO software de estimação e crescimento de redes
Algoritmo proposto para crescimento de redesResultados e conclusões
Avanços em relação aos algoritmos anteriores
DIMINUIÇÃO DO ESPAÇO DE BUSCA A CADA ITERAÇÃO
CÁLCULO DE DEPENDÊNCIAS COM ALGORITMO PROPOSTO -DEFINIÇÕES
k : quantidade de camadasLi : conj. de genes da camada iGi : conj. de genes já adicionados à rede até o passo i (ou
seja, Gi =i−1⋃j=0
Lj )
[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado
IntroduçãoRedes Genéticas Probabilísticas
Estimação de PGNsO software de estimação e crescimento de redes
Algoritmo proposto para crescimento de redesResultados e conclusões
Avanços em relação aos algoritmos anteriores
DIMINUIÇÃO DO ESPAÇO DE BUSCA A CADA ITERAÇÃO
[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado
IntroduçãoRedes Genéticas Probabilísticas
Estimação de PGNsO software de estimação e crescimento de redes
Algoritmo proposto para crescimento de redesResultados e conclusões
Avanços em relação aos algoritmos anteriores
DIMINUIÇÃO DO ESPAÇO DE BUSCA A CADA ITERAÇÃO
[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado
IntroduçãoRedes Genéticas Probabilísticas
Estimação de PGNsO software de estimação e crescimento de redes
Algoritmo proposto para crescimento de redesResultados e conclusões
Avanços em relação aos algoritmos anteriores
DIMINUIÇÃO DO ESPAÇO DE BUSCA A CADA ITERAÇÃO
[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado
IntroduçãoRedes Genéticas Probabilísticas
Estimação de PGNsO software de estimação e crescimento de redes
Algoritmo proposto para crescimento de redesResultados e conclusões
Avanços em relação aos algoritmos anteriores
DIMINUIÇÃO DO ESPAÇO DE BUSCA A CADA ITERAÇÃO
[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado
IntroduçãoRedes Genéticas Probabilísticas
Estimação de PGNsO software de estimação e crescimento de redes
Algoritmo proposto para crescimento de redesResultados e conclusões
Avanços em relação aos algoritmos anteriores
DIMINUIÇÃO DO ESPAÇO DE BUSCA A CADA ITERAÇÃO
[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado
IntroduçãoRedes Genéticas Probabilísticas
Estimação de PGNsO software de estimação e crescimento de redes
Algoritmo proposto para crescimento de redesResultados e conclusões
Avanços em relação aos algoritmos anteriores
DIMINUIÇÃO DO ESPAÇO DE BUSCA A CADA ITERAÇÃO
[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado
IntroduçãoRedes Genéticas Probabilísticas
Estimação de PGNsO software de estimação e crescimento de redes
Algoritmo proposto para crescimento de redesResultados e conclusões
Avanços em relação aos algoritmos anteriores
DIMINUIÇÃO DO ESPAÇO DE BUSCA A CADA ITERAÇÃO
[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado
IntroduçãoRedes Genéticas Probabilísticas
Estimação de PGNsO software de estimação e crescimento de redes
Algoritmo proposto para crescimento de redesResultados e conclusões
Avanços em relação aos algoritmos anteriores
DIMINUIÇÃO DO ESPAÇO DE BUSCA A CADA ITERAÇÃO
CÁLCULO DE DEPENDÊNCIAS COM ALGORITMO PROPOSTO
k−1∑i=0
p∑
j=1
(Li
j
)[n − (|Gi |+ |Li |)]
︸ ︷︷ ︸sementes como preditores
+ |Li |(
n − |Gi |p
)︸ ︷︷ ︸
sementes como alvos
[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado
IntroduçãoRedes Genéticas Probabilísticas
Estimação de PGNsO software de estimação e crescimento de redes
Algoritmo proposto para crescimento de redesResultados e conclusões
Avanços em relação aos algoritmos anteriores
GRAU DE CONFIANÇA DETERMINADO POR CAMADAS
A
B1
B2
B3 B4
C7
C8C9
C1
C2
C3
C4C6
C5
D1
D2
D3
D4
D7
D5
D6
Layer 0
Layer 2
Layer 1
[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado
IntroduçãoRedes Genéticas Probabilísticas
Estimação de PGNsO software de estimação e crescimento de redes
Algoritmo proposto para crescimento de redesResultados e conclusões
Avanços em relação aos algoritmos anteriores
CRITÉRIO PARA ADICIONAR GENES À REDE
X0
X1
1.0
X3
0.8
X2
0.7
X4
1.0
0.5
0.8
0.9 0.2
[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado
IntroduçãoRedes Genéticas Probabilísticas
Estimação de PGNsO software de estimação e crescimento de redes
Algoritmo proposto para crescimento de redesResultados e conclusões
Avanços em relação aos algoritmos anteriores
ALGORITMO
Entrada: S,U, k , thde, thparaSaída: Conjunto L de camadas de genes e conjunto E das
arestas entre as camadasL← ∅;E ← ∅;i ← 0;Li ← S;
[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado
IntroduçãoRedes Genéticas Probabilísticas
Estimação de PGNsO software de estimação e crescimento de redes
Algoritmo proposto para crescimento de redesResultados e conclusões
Avanços em relação aos algoritmos anteriores
ALGORITMO (CONTINUAÇÃO)
enquanto Li 6= ∅ e i < k faça
Li+1 ← arg maxY∈U−L
[max
σde,para≥thde,para[σde,Li (Y ), σpara,Li (Y )]
];
Ei+1 ← {(li li+1) : li ∈ Li , li+1 ∈ Li+1};E ← E ∪ {Ei+1};L← L ∪ {Li+1};i ← i + 1;
fim
[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado
IntroduçãoRedes Genéticas Probabilísticas
Estimação de PGNsO software de estimação e crescimento de redes
Algoritmo proposto para crescimento de redesResultados e conclusões
DADOS DOS EXPERIMENTOS DA MALÁRIA
Duração do estágio do parasita no sangue humano: ∼ 48hAmostras: 48, feitas de hora em horaTotal de genes: 6532Grupos estudados: glicólise (10 genes) e apicoplasto (27genes)
[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado
IntroduçãoRedes Genéticas Probabilísticas
Estimação de PGNsO software de estimação e crescimento de redes
Algoritmo proposto para crescimento de redesResultados e conclusões
RESULTADOS
GLICÓLISE - 10 MELHORES PARES OU INDIVIDUAIS
Layer 0 oPFF72413 N132_136
Ks488_1
1.0
I13056_1 M11919_1 N132_40
oPFF72419
1.0
M48835_1
1.0
I1689_2
M43799_2
1.0
J2896_1J53_48
C237
1.0
Km548_1
1.0
N158_6
1.01.0
oPFF72425
J183_4
1.0 1.0
C465
1.0
Layer 1E2926_1
1.0
F30473_2
1.0
N132_147
1.0 1.01.0
N181_15
1.0 1.0
I14812_1
1.01.0
[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado
IntroduçãoRedes Genéticas Probabilísticas
Estimação de PGNsO software de estimação e crescimento de redes
Algoritmo proposto para crescimento de redesResultados e conclusões
RESULTADOS
GLICÓLISE - 20 MELHORES PARES OU INDIVIDUAIS
Layer 0 oPFF72413 N132_136
F17473_1
1.0
Ks488_1
1.0
F13784_1
1.0
I13056_1
oPFF72419
1.0
M11919_1N132_40
1.0
M48835_1
1.0
I1689_2
oPFN0250
1.0
M43799_2
1.0
oPFI17685
1.0
J2896_1
1.0
J53_48
C237
1.0
Km548_1
1.0
N158_6
1.01.0
oPFI17722
1.0
oPFF72425
J183_4
1.0 1.0
C465
1.0
Layer 1N170_4
1.0
I12861_2i
1.0
E2926_1
1.0
F24461_1
1.0
F30473_2
1.0
I5511_2
1.0
N132_147
1.0 1.01.0
D17715_80
1.0
N181_15
1.01.0
M58072_1
1.0
I14812_1
1.01.0
oPFD66961
1.0
oPFL0115
1.0
oPFL0131
1.0
[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado
IntroduçãoRedes Genéticas Probabilísticas
Estimação de PGNsO software de estimação e crescimento de redes
Algoritmo proposto para crescimento de redesResultados e conclusões
RESULTADOS
APICOPLASTO - APARECIMENTO DE GENES ATRATORES
Layer 0
Prps11
J183_4
1.01.01.01.0
N155_35
1.0
Prps12
1.0
1.0
1.01.0 1.0
Prps3
1.0
Prpl6
1.0PClp
1.0
Prpl141.0
Layer 1
B537
1.0
F960_5
1.0Ks44_10
1.0
F960_4 1.0
I14812_1
1.0
D23156_33
1.0
I16487_3
1.0
A8109_21
1.0
N158_4
1.01.01.0
[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado
IntroduçãoRedes Genéticas Probabilísticas
Estimação de PGNsO software de estimação e crescimento de redes
Algoritmo proposto para crescimento de redesResultados e conclusões
RESULTADOS
RECUPERAÇÃO DE 6 GENES DA GLICÓLISE NA 3A CAMADA
Layer 0
I13056_1 oPFF724191.0
Layer 1
N170_4
1.0
B484
1.0
Ks26_5
1.0
Layer 2
B424
1.0
F19110_2
1.0
F35197_1
1.0
F64252_1
1.0
oPFN0252
1.0
E3038_1
1.0
M36754_1
1.01.0
F46584_1
1.0
N161_2
1.0
A1411_1
1.0
D56950_2
1.0
E7861_3
1.0
N131_27
1.0
N150_75
1.0
N181_18
1.0
oPFL0142
1.0
oPFBLOB0178
1.0
J53_48
1.0
M34107_3
1.0
N128_4
1.0
N138_90
1.0
D49176_46
1.0
oPFD66958
1.0
M48835_1
1.0
F44947_3
1.0
I9302_5
1.01.01.0
J151_11
1.0
J151_6
1.0
L3_25
1.0
I14975_1
1.0
oPFBLOB0103
1.0
oPFI17659
1.0
Ks783_2
1.0
E12445_1
1.0
E15509_11
1.0 F16133_1
1.0
F41817_11.0
F70835_1
1.0
M12812_7
1.0
E20147_1
1.0
F4565_1
1.0
1.0
J206_2
1.0
M2511_2
1.01.0
N181_15
1.0
1.01.01.01.01.01.01.01.01.0
1.0
1.01.01.01.0
1.0
1.01.01.01.01.01.01.01.0
1.01.01.01.01.0
Z_5_60
1.0
Z_5_80
1.0
C474
1.0
D49176_35
1.0
Ks545_1
1.01.0
M21368_3
1.0
Ks83_16
1.0
E7279_3
1.0
F31971_1
1.0
I3638_1
1.0
I4719_2
1.0
I4719_6
1.0
L1_96
1.0
M35930_3
1.0
Kn12486_2
1.01.0
oPFL0013
1.0
E28350_2
1.0
F25239_3
1.01.0
Ks136_3
1.0
M6483_1
1.0
M38941_10
1.01.0
M57341_2
1.0
C60
1.0
F8027_3
1.0
N133_7
1.0
oPFN02761.0
N132_40
1.0
N143_16
1.0
F54854_2
1.0
oPFF72453
1.0
oPFI17716
1.0
C465
1.0
I9876_1
1.0
Ks3088_1
1.0
Ks370_11
1.0F28964_1
1.0
[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado
IntroduçãoRedes Genéticas Probabilísticas
Estimação de PGNsO software de estimação e crescimento de redes
Algoritmo proposto para crescimento de redesResultados e conclusões
CONCLUSÕES
O algoritmo agrega bons genes candidatos, ao escolhergenes com força (para ou a partir da rede) alta, e não umasoma delasO algoritmo recupera a rede fazendo menos cálculos,porque não precisa verificar novamente as camadaspassadasAs camadas permitem diferenciarmos o grau de confiançade grupos de genes
[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado
IntroduçãoRedes Genéticas Probabilísticas
Estimação de PGNsO software de estimação e crescimento de redes
Algoritmo proposto para crescimento de redesResultados e conclusões
Este trabalho recebeu apoio financeiro da CAPES –Coordenação de Aperfeiçoamento de Pessoal de NívelSuperior
[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado
IntroduçãoRedes Genéticas Probabilísticas
Estimação de PGNsO software de estimação e crescimento de redes
Algoritmo proposto para crescimento de redesResultados e conclusões
Perguntas?
[email protected] Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado