computação neural artificial

42
COMPUTAÇÃO NEURAL EM SISTEMAS DE DNA Renato Marques de Oliveira Francisco Dalton Barreto de Oliveira Beatriz Caroline Nishi Prof. Dr. Hermógenes David de Oliveira (Tutor) Universidade Federal do Ceará Departamento de Bioquímica e Biologia Molecular Bacharelado em Biotecnologia Tópicos em Biotecnologia IV

Upload: renato-marques

Post on 19-Dec-2015

48 views

Category:

Documents


0 download

DESCRIPTION

apresentação original feita para uma cadeira do curso de Biotecnologia da UFC sobre implementações de redes neurais em circuitos bioquímicos artificiais.

TRANSCRIPT

COMPUTAÇÃO NEURAL EM SISTEMAS DE DNA

Renato Marques de OliveiraFrancisco Dalton Barreto de OliveiraBeatriz Caroline NishiProf. Dr. Hermógenes David de Oliveira (Tutor)

Universidade Federal do CearáDepartamento de Bioquímica e Biologia Molecular

Bacharelado em BiotecnologiaTópicos em Biotecnologia IV

Sumário

1. Apresentação1. Bioinformática e Biologia Computacional2. Introdução - Novos recursos da informática na Biologia3. Sistemas de DNA4. Origami de DNA / DNA-Spiders / DNA-Walkers

2. Elementos teóricos1. Cascatas de deslocamento de fitas de DNA2. O modelo gangorra3. O modelo “Linear threshold gate”4. Redes Neurais5. Implementação de neurônios artificiais

3. Métodos Gerais4. Aplicações Sugeridas

1. Combate à diabetes2. Sugestão dos estudantes

3

Bioinformática e Biologia Computacional Genômica Transcriptômica Proteômica Biologia estrutural Sistemas de expressão Filogenética Engenharia molecular e bioquímica Nanorrobótica Sistemas de DNA

INTRODUÇÃO

Em se falando de Biotecnologia, pode – se admitir 2 classificações

Biotecnologia Clássica: sistemas biológicos (desde biomoléculas a organismos) que possuam alguma propriedade de interesse ao homem.

Biotecnologia “Moderna”: relacionada à velocidade de processamento da informação genética, que vem progredindo junto com os avanços tecnológicos.

Nanobiotecnologia;

Bioinformática; Biologia Computacional.

Nanobiotecnologia: > manipulação de átomos e moléculas biológicas através de nanomáquinas e

nanopartículas,

> produção controlada de materiais em escala nanométrica.

Bioinformática: armazenamento e processamento de informações

> coleção, comparação, recuperação e análise de banco de dados biológicos em larga escala.

> montagem de bancos de dados de informações genéticas.

Biologia Computacional: >algoritmos computacionais

> Construção de modelos que simulem o comportamento de novas moléculas e processos

biológicos

Biologia computacional + Bioinformática

Utilização de sequência e estrutura de uma proteína já catalogada, num banco de dados

Desenvolver algoritmos computacionais para, a partir da sequência primária, prever a estrutura tridimensional e a possível função de novas proteínas.

Conforme interesse (genômica, transcriptômica, proteômica, biomedicina, etc) algumas ferramentas são amplamente utilizadas para se criar tanto um banco de dados quanto árvores filogenéticas de genes e proteínas.

BLAST & Clustal

BLAST (Basic Local Alignment Search Tool)

Algoritmos para comparar informações de sequências biológicas primárias (sequências de aminoácidos de diferentes proteínas ou nucleotídeos de diferentes sequências de DNA).

Consulta com um banco de dados de seqüências para se comparar com sequencias conhecidas. Comparação de sequências para se calcular o mínimo de alterações nucleotídicas necessárias para determinar a interconversão entre as isoformas de uma proteína putativa

Identificar bibliotecas de seqüências que se assemelham àquela consultada ou acima de um certo grau de semelhança.

blastP(sequências de aminoácidos num banco de dados de sequências proteicas); blastX (sequência nucleotídica traduzida em todas as formas de leitura, num banco de dados de proteínas); tblastX (sequência de nucleotídios possíveis num banco de dados proteicos), dentre outros.

Sequências que produziram alinhamentos significativos codificadores da α – amilase em bactérias com BLAST

Stam M R et al. Protein Engineering, Design and Selection 2006;19:555-562

CLUSTAL

• Além de alinhamento, pode –se construir árvores filogenéticas de uma determinada sequência, transcrito ou proteína.

• ClustalW/Clustal X: "Clustal Clássico.• ClustalX : Interface de gráfico do Usuário (GUI)• ClustalW: Interface de linha de comando. Com eles, pode – se

alinhar proteínas, RNA e DNA.

• Clustal Omega: Última versão do Clustal;• Rápido e escalável(pode alinhar milhares de sequências em horas)• Maior precisão devido ao modelo de alinhamento HMM. • Linha de comando só funciona on – line e atualmente, só alinha

sequências proteicas.

Árvore Filogenética da Aox (Oxidase Alternativa) em plantas . 1 – gene Aox1. 2: gene AOx2

Árvore filogenética da Superóxido dismutase portadora de Mn (Mn – SOD) em algumas cianobactérias

Regelsberger G et al. J. Biol. Chem. 2002;277:43615-43622

12

Sistemas de DNA

Taylor, S., Stojanovic, M. (2007) Is There a Future for DNA-Based Molecular Devices in Diabetes Management? J Diabetes Sci Technol. 1(3): 440–444.

“A reação mais imediata (e bastante razoável) a essa proposta é a de que tal dispositivo molecular seja melhor discutido no contexto de um romance de ficção científica, mesmo ao nível de demonstração em tubos de ensaio. Simplesmente, um comportamento molecular dessa complexidade, utilizando componentes não naturais, não foi demonstrado anteriormente.”

13

Sistemas de DNA

Qian, L., Winfree, E. (2011) A simple DNA gate motif for synthesizing large-scale circuits. Journal of The Royal Society Interface. Published online before print. doi:10.1098/rsif.2010.0729

“Propõe-se os portões lógicos e os catalisadores baseados em RNA e DNA como componentes de propósito geral para a síntese de circuitos químicos com aplicações em terapia médica, nanotecnologia e controle acoplado de reações químicas. O progresso nesta direção dependerá de certos avanços, como o desenvolvimento de interfaces de entrada/saída entre circuitos de DNA e moléculas relevantes para a biomedicina, nanomáquinas de DNA e as químicas gerais.”

14

Origami de DNASolução com mais

de 200 oligonucleotídeos como sequências

- staple

Aquecimento da solução a 95ºC

Lento Resfriamento

Anelamento das sequências

15

Origami de DNA

https://www.elitenetzwerk.bayern.de/uploads/tx_templavoila/1_01.gif

16

Nano-spiders

Yong, E. (2010) Enter the nano-spiders – independent walking robots made of DNA. Disponível em http://blogs.discovermagazine.com/notrocketscience/2010/05/12/enter-the-nano-spiders-%E2%80%93-independent-walking-robots-made-of-dna/. Acessado em 11/10/2011.

Lund, K., Manzo, A., Dabby, N., Michelotty, N., Johnson-Buck, A., Nangreave, J., Taylor, S., Pei, R., Stojanovic, M., Walter, N., Winfree, E., Yan, H. (2010) Molecular robots guided by prescriptive landscapes. Nature 465: 206-210

17

DNA-Walkers

David Yu Zhang. (2010) Dynamic DNA Strand Displacement Circuits (Doctoral Dissertation). Retrieved from

http://www.dna.caltech.edu/DNAresearch_publications.html

18

Cascatas de deslocamento de fitas de DNA Predictabilidade da termodinâmica do

pareamento (modelo de Watson—Crick) .

David Yu Chang e Erik Winfree

19

Cascatas de deslocamento de fitas de DNA

20

Pesquisa recente sobre computação em redes neurais

21

Cascatas de deslocamento de fitas de DNA

Fita simples em random coil

Fita hibridizada

Domínio de ligação

Domínio complementar

Subdomínio

22

e - constantes de hibridização de e a seus respectivos complementos.

e - constantes de dissociação de e a seus respectivos complementos.

- taxa com que a junção das fitas cruza o domínio de ligação

calculadas a partir das outras constantes, que são calculadas a partir da sequência de nts.A partir disso pode-se criar um modelo bimolecular com cinética de segunda ordem.

A cinética de produção de Y possui 50% de precisão quando as concentrações de e S estão abaixo de .

23

24

25

Uma molécula sinal interage com uma molécula “gate”

através do domínio de apoio (T).

A molécula sinal se liga à molécula “gate” através do seu domínio de reconhecimento

(S5), deslocando a molécula de saída (output).

A molécula de saída é expulsa do domínio de reconhecimento e é liberada em solução.

26

Uma molécula de saída pode se tornar uma molécula sinal para um gate diferente, por

exemplo, um gate de limiar (threshold gate).

A nova molécula sinal interage com o gate de limiar através do domínio de ligação S5,

deslocando o sinal resíduo (waste).

Os produtos dessa interação não são detectados na reação com as fitas reporter,

caracterizando a não ultrapassagem do limiar.

27

S6T S6

S5

T* S6*

29

O modelo gangorra (seesaw model)

5 6

21

− .510

10

𝑤2,5

𝐺5 : 5,6

10×h𝑇 2,5 : 5

0 ,5×

𝑤2,4fuel

10×

6

𝑅𝑒𝑝6

1.5×

−1.5F

Qian L , Winfree E J. R. Soc. Interface doi:10.1098/rsif.2010.0729

LL Qian et al. Nature doi:10.1038/nature10262

30

5

21

− .510

10

6

5

21

− .55

5

6

5

Abstract diagrams for seesaw gate circuits.

Qian L , Winfree E J. R. Soc. Interface doi:10.1098/rsif.2010.0729

©2011 by The Royal Society

Circuit diagrams and input/output behaviour of boolean logic gates.

Qian L , Winfree E J. R. Soc. Interface doi:10.1098/rsif.2010.0729

©2011 by The Royal Society

0–0.4x being OFF and 0.6–1x being ON

Circuit diagrams and input/output behaviour of boolean logic gates.

Qian L , Winfree E J. R. Soc. Interface doi:10.1098/rsif.2010.0729

©2011 by The Royal Society

0−0.3x being OFF and 0.7−1x being ON

34

Linear Threshold Gates

Modelo simples para a atividade responsória dos neurônios

Imita o mecanismo matemático de disparo dos neurônios

Úteis na construção de circuitos multicamadas

Exponencialmente mais compactos que circuitos AND-OR-NOT

Ajudam na compreensão de computações cerebrais

35

Linear Threshold Gates

𝑦={ 1 , if  ∑𝑖=1

𝑛

𝑤 𝑖𝑥𝑖≥ h𝑡

¿0 ,de   outra   forma

36

Implementação de neurônios artificiais

Métodos Gerais

37

• Depende sensívelmente da energia de ligação dos domínios de apoio

Cálculo da

cinética Bimolecul

ar

• Tampão TE (Sigma-Aldrich) – Tris-HCl 10 mM pH 8 1mM EDTA-Na2 [+ 62.5 M MgCl2 para experimentos]

• Armazenamento: 4° C• Experimentação: 25 ± 5° C

Meio reacional

• Oligonucleotídios encomendados da Integrated DNA Technologies (IDT), purificados via HPLC

• Concentrações determinadas por Ab 260 nm• Complexos foram purificados posteriormente

via ND PAGE

Purificação dos

reagentes

Resultados e Discussão

38

• Dependência da constante de hibridização do DNA () na sequência do domínio de apoio

• O deslocamento da junção (branch migration) é modelado como uma taxa de fenômeno único, sem passos intermediários

Aspectos não

compreen-didos

• Constantes de velocidade ajustadas utilizando a função ‘fminunc’ do Matlab®

• Resultados experimentais de Toehold Exchange mostraram boa concordância com as constantes ajustadas pelo modelo bimolecular.

• Espera-se viabilizar o sistema para diferentes faixas de osmolaridade

Ajuste dos

Parâmetros

• Aplicação em faixas maiores de temperatura• Aplicação dos conceitos biofísicos para RNA e outros análogos de ácidos nucleicos sintéticos

Aplicabili-dade do modelo

Taylor S, Stojanovic M. (2007) Is There a Future for DNA-Based Molecular Devices in Diabetes Management? J Diabetes Sci Technol

39

Nanorrobôs de DNA no controle da diabetes

40

Sugestão dos estudantes para uma aplicação

41

Sugestão dos estudantes para uma aplicação

42

Referências Bibliográficas Lund, K., Manzo, A., Dabby, N., Michelotty, N., Johnson-Buck, A., Nangreave, J., Taylor, S., Pei, R., Stojanovic, M., Walter, N., Winfree, E., Yan, H. (2010) Molecular robots guided by prescriptive landscapes. Nature 465: 206-210

McCulloch, W., Pitts, W. (1943) A logical calculus of the ideas immanent in nervous activity. Bulleting of Mathematical Biophysics. 5: 115-133

Qian, L., Winfree, E., Bruck, J. (2011) Neural network computation with DNA strand displacement cascades. Nature. 475: 368-372.

Qian, L., Winfree, E. (2011) A simple DNA gate motif for synthesizing large-scale circuits. Journal of The Royal Society Interface. Published online before print. doi:10.1098/rsif.2010.0729

Regelsberger, G., Atzenhofer, W., Rüker, F., Peschek, G., Jakopitsch, C., Paumann, M., Furtmüller, P., Obinger, C. (2002) Biochemical Characterization of a Membrane-bound Manganese-containing Superoxide Dismutase from the CyanobacteriumAnabaena PCC 7120. The Journal Of Biological Chemistry. 277: 43615-43622.

Taylor, S., Stojanovic, M. (2007) Is There a Future for DNA-Based Molecular Devices in Diabetes Management? Journal of Diabetes Science and Technology. 1 (3): 440–444.

Yong, E. (2010) Enter the nano-spiders – independent walking robots made of DNA. Disponível em http://blogs.discovermagazine.com/notrocketscience/2010/05/12/enter-the-nano-spiders-%E2%80%93-independent-walking-robots-made-of-dna/. Acessado em 11/10/2011.

Zadeh, J.N., Steenberg, C.D., Bois, J.S., Wolfe, B.R., Pierce, M.B., Khan, A.R., Dirks, R.M., Pierce, N.A. (2011) NUPACK: Analysis and design of nucleic acid systems. Journal of Computational Chemistry. 32 (1): 170-173

Zhang, D.Y., Winfree, E. (2009) Control of DNA Strand Displacement Kinetics Using Toehold Exchange. Journal of The American Chemical Society. 131 (47): 17303-17314.

Zhang, D.Y. (2010) Dynamic DNA Strand Displacement Circuits (Doctoral Dissertation). Retrieved from http://www.dna.caltech.edu/DNAresearch_publications.html