goran neshich embrapa _ foco: dados conhecimento
TRANSCRIPT
http://www.cbi.cnpia.embrapa.br Goran Neshich
EMBRAPA _ Foco: Dados Conhecimento
http://www.cbi.cnpia.embrapa.br Goran Neshich
Bioinformática na EMBRAPA
Seqüenciamento
Genoma completoEstrutura Proteica
Fluxograma – descrição completa do projeto GENOMA
Alvos para açção dos fármacos, agrotóxicos, inseticidas, fungicidas etc.
#1
#2
#4
#3
Produto
In silico testesTestes no campo
http://www.cbi.cnpia.embrapa.br Goran Neshich
•Anotação Gênica•Comparação degenomas
•Descritores de Estrutura
•Descritores de Função
•Proteoma•Redes de expressão de genes
Sequence
Blast
Lexical
Structure
STING
Sintactic
Function
SMS
Semantic
Role
MicroarrayImage
Analysing
Pragmatic
http://www.cbi.cnpia.embrapa.br Goran Neshich
Bioinformática na EMBRAPA
Seqüenciamento e Anotação das seqüências(unidades descentralizadasda EMBRAPA)
Análise das Estruturas das proteínas e seus complexos com DNA e Ligantes (Cenargen &
NBI/CNPTIA)
Funcionalidade das proteínas e seus complexos(NBI – CNPTIA)
Fluxograma – descrição completa do projeto GENOMA
Alvos identificados nasestruturas protéicas e ligantes detectados como modificadores da função(NBI – CNPTIA)
Função
EstruturaSeqüências
http://www.cbi.cnpia.embrapa.br Goran Neshich
Bioinformática na EMBRAPA
Desktops Server 2Anotação das seqüências
Seqüências Server 3
Usuários Lab 12, 2,3,7
Sistema de transfer.
Usuários Lab 4
Usuários Lab 2 Usuários Lab 7Usuários Lab 3
Seqüências
Fluxograma – sugestão baseada na competência atual
Função
Seqüência
Estrutura
http://www.cbi.cnpia.embrapa.br Goran Neshich
Bioinformática na EMBRAPA
Desktops Server 2Anotação das seqüências
Seqüências Server 3
Usuários Lab 12, 2,3,7
Sistema de transfer.
Seqüenciamento, junSeqüenciamento, junçãção e anotao e anotaçãção das seqüênciaso das seqüências
Os laboratórios de pesquisa das unidades descentralizadas do sistema Embrapa contribuem com arquivos contendo as seqüências e suas anotações
As seqüências são juntadas para criar o genoma completo
As sequências são anotadas de acordo com sua similaridade com outras sequências já existentes em BDs
Todos os dados permanecem com descritores originais, para busca fácil e identificação
As atualizações são refletidas para todos os participantes
O sistema exige o controle de acessos e segurança.
Usuários Lab 4
Usuários Lab 2 Usuários Lab 7Usuários Lab 3
Seqüências
http://www.cbi.cnpia.embrapa.br Goran Neshich
Bioinformática na EMBRAPA
Desktops Server 2Geração das vacinas
Inibidores comespecificidade alterada
Server 3
Usuários Lab 12, 2,3,7
Sistema de transfer.
HTS: Modelagem das estruturas, identificação dos alvos para fármacosHTS: Modelagem das estruturas, identificação dos alvos para fármacos
Os laboratórios de pesquisa das unidades descentralizadas do sistema Embrapa RECEBEM DE VOLTA a informação indicando a parte mais pragmática do processo que começou com a revelação da seqüência
Os descritores de estrutura e função são elaborados e atribuídos ao arquivo contendo a seqüência (gênica ou proteica)
Uma lista de “matching” entre um certo local na superfície de qualquer proteína, identificado como um alvo, e BDs dos ligantes, será apresentado.
Esta lista poderá então servir como base para a pesquisa cuja finalidade será identificar modificadores de função com rigor da verificação experimental.
Usuários Lab 4
Usuários Lab 2 Usuários Lab 7Usuários Lab 3
Controle de expressãogênica
http://www.cbi.cnpia.embrapa.br Goran Neshich
Usar as ferramentas existentes (Java Protein Dossier de STING Millennium Suite) para gerar descritores de estrutura e função de proteínas;
Seleção de alvos para desenvolvimento de drogas a partir de seqüências genômicas geradas por grupos participantes e/ou outros, adaptando para este processo as ferramentas existentes (Modeller e/ou Dragon) para modelagem da estrutura proteica automática
Objetivos específicos do grupo daObjetivos específicos do grupo daBioInformática Estrutural EMBRAPA/CNPTIA:BioInformática Estrutural EMBRAPA/CNPTIA:
Aplicações de BioInformática com alta demanda por CPU’s em era pós-genoma
http://www.cbi.cnpia.embrapa.br Goran Neshich
As interações macromoleculares acontecem através das suas superfícies – formando as interfaces.
Nós pretendemos mapear em detalhes todos os parâmetros físico-químicos pertinentes nestas interfaces e que definem o reconhecimento entre o alvo na proteína e seu ligante.
Objetivos específicos do grupo daObjetivos específicos do grupo daBioInformática Estrutural EMBRAPA/CNPTIA:BioInformática Estrutural EMBRAPA/CNPTIA:
Sting Millennium Suite (SMS) e Java Protein Dossier (PD)- BD dos alvos
http://www.cbi.cnpia.embrapa.br Goran Neshich
Sting Millennium Suite (SMS) e Java Protein Dossier (PD)- BD dos alvos
SMS e Java Protein Dossier são ferramentas afinadas para a visualização e mapeamento das interações na interface!
“Interface Forming Residues (IFR)” definidos pelo SMS e seu JPD, possuem uma extensa lista de parâmetros físico-químicos necessários para a análise de reconhecimento entre macromoléculas
Objetivos específicos do grupo daObjetivos específicos do grupo daBioInformática Estrutural EMBRAPA/CNPTIA:BioInformática Estrutural EMBRAPA/CNPTIA:
http://www.cbi.cnpia.embrapa.br Goran Neshich
Descritores da estruturaAnotação
Genomas de sequenciamento
Genoma estrutural
Interações: Proteínas / ligantes (Matching DB)
Estudos dos mutantese sua dinâmica Docking
BD das estruturas
Estrutura-Função
Livro da vida
Busca por novos moduladores de função
Descoberta de novos Fármacos (Drug Discovery)
SMS e Java Protein Dossier – Banco de dados dos alvos para fármacos
Objetivos específicos do grupo daObjetivos específicos do grupo daBioInformática Estrutural EMBRAPA/CNPTIA:BioInformática Estrutural EMBRAPA/CNPTIA:
http://www.cbi.cnpia.embrapa.br Goran Neshich
O Objetivo final: complementar o caminho dos projetos Genoma…
BD dos pequenosreagentes
Impressão Digital(Fingerprint)
Estruturas nos arquivos locais
Impressão Digital(Fingerprint)
Sequências do genoma completo
Modelagem por homologia
Interações: Proteínas / ligantes (Matching DB)
Estudos dos mutantese sua dinâmica Docking
Proteína-informação 2-D do seu sítio ativo
(para comparação)
Casamento entre mapas 2Ddo contorno das superfícies
Ligando-informação2-D da sua superfície
(para comparação)
http://www.cbi.cnpia.embrapa.br Goran Neshich
Busca por novos moduladores de função
Cartola de enzimas
encaixe
Cartola de moduladores de função (e.g. inibidores)
encaixe encaixe
Casamento perfeito
Casamento perfeito
Casamento perfeito
Casamento entre impressões digitais de proteínas e moduladores de função
http://www.cbi.cnpia.embrapa.br Goran Neshich
Contatos na interface mapeados na sequênciaProdutos específicos do NBI_Embrapa/CNPTIA
http://www.cbi.cnpia.embrapa.br Goran Neshich
JPD com mapeamento de potencial eletrostático, hidrofobicidade e curvatura
http://www.cbi.cnpia.embrapa.br Goran Neshich
http://www.cbi.cnpia.embrapa.br Goran Neshich
Serviços Web Tecnologia GRID
Serviços GRID
Otimização do uso dos computadores disponíveis no sistema Embrapa Tecnologia GRID (Grade computacional)
http://www.cbi.cnpia.embrapa.br Goran Neshich
Desafio de instalação de Grade Computacional na Embrapa
Busca por novos fármacos In silico
ampladisseminação
Clientes com desktopArmazém
dos arquivos
Acesso online aos recursos computacionais descentralizados
http://www.cbi.cnpia.embrapa.br Goran Neshich
~3000 PCs e dezenas de estações de trabalho do sistema EMBRAPA: ociosos?
HD HPSS
HD HD
External Networks
Rede ExternaRede Externa
RedeExterna
Recursos Locais Recursos Locais
Recursos LocaisRecursos LocaisCPU’s ocisosos
CPU’sociosos
Campinas Brasília
Otimização de uso dos recursos computacionais EXISTENTES para criação eficaz dos produtos para agropecuária da nova geração
http://www.cbi.cnpia.embrapa.br Goran Neshich
Motivação para estabelecer a Grade Computacional no sistema Embrapa
• Objetivo: providenciar a interface de Grid portal através da qual os biólogos moleculares podem disparar e gerenciar os processos e dados
Aplicação
Planejamento
Execução
Serviços deCatalogação
Serviços de Informação
Segurança
Monitoramento
Gerenciamento
Serviço confiávelde transferência
Recursos Computacionais
Recusros dearmazenamento
http://www.cbi.cnpia.embrapa.br Goran Neshich
Unidade #2
Unidade #3
Unidade #1
Conexões de rede dedicadas
ou compartilhadas
Brasília
Centros de computação
descetralizadosdo sistema Embrapa
CampinasCNPTIA
Outros parceiros
Modelo hierárquico de unidades descentralizadas
http://www.cbi.cnpia.embrapa.br Goran Neshich
Grades Computacionais baseadas em conhecimento
AtributosSemântica
Conhecimento
Informação
Dados
Serviços de Entrada
Gerenciamento Serviços de Acesso
(Acesso baseado em modelo)
(Sistema de gerenciamento de dados)
Repositório deInformação
Querybaseado emAtributo
Query baseado em Propriedades
Query / BrowseBaseado emConhecimento
Repositório deconhecimento para as Regras
RelaçãoEntreConceitos
CamposContainersFichários
Armazém(Replicações,IDs Permanentes)