mev: multiexperiment viewer universidade federal de pernambuco – ufpe centro de informática –...
TRANSCRIPT
MeV: MultiExperiment Viewer
Universidade Federal de Pernambuco – UFPE Centro de Informática –
CIn
Eduardo Gade Gusmão – egg
Professor: Ivan Gesteira – igcf
Automação Inteligente – if705
IF705 - UFPE - CIn MeV: MultiExperiment Viewer Eduardo Gade Gusmão
Tópicos
TM4 Software Suite
Descrição da Ferramenta MeV
Funcionalidades do MeV
Exemplo Prático
Conclusão e Referências
TIGR
IF705 - UFPE - CIn MeV: MultiExperiment Viewer Eduardo Gade Gusmão
Exemplo Prático
Download da Ferramenta
Entrar no site: http://www.tm4.org/mev.html
Baixar a ferramenta MeV
IF705 - UFPE - CIn MeV: MultiExperiment Viewer Eduardo Gade Gusmão
TIGR
The Institute for Genomic Research é um instituto de pesquisa fundado em 1992 por Craig Venter em RockVille, Maryland, Estados unidos.
IF705 - UFPE - CIn MeV: MultiExperiment Viewer Eduardo Gade Gusmão
TIGR
Sequenciou o Haemophilus Influenzae
Human Genome Project
GLIMMER, MUMmer
Associação com o Science Foundation e o FBI
J. Craig Venter Institute
Sem fins lucrativos
IF705 - UFPE - CIn MeV: MultiExperiment Viewer Eduardo Gade Gusmão
TM4 Software Suite
“A ‘TM4 Suite’ é um conjunto de softwares desenvolvidos para a análise de dados de microarray. Os usuários são capazes de capturar, tratar e analisar os dados obtidos nos experimentos.”
Representa uma coleção de ferramentas abrangente, extensível, open source e livremente disponível.
IF705 - UFPE - CIn MeV: MultiExperiment Viewer Eduardo Gade Gusmão
TM4 Software Suite
Softwares Componentes:
Microarray Data Manager (MADAM)
TIGR Spotfinder
Microarray Data Analysis System (MIDAS)
MultiExperiment Viewer (MeV)
IF705 - UFPE - CIn MeV: MultiExperiment Viewer Eduardo Gade Gusmão
TM4 Software Suite
Image Analysis
Raw Gene Expression Data
Normalized Data with Gene Annotation
Interpretation of Analysis Results
.tiff Image File
Gene Annotation
ScannerPrinter
Normalization / Filtering
Expression Analysis
Data Entry / Management
Database
AGED
Database
Others…
Database
MAD
IF705 - UFPE - CIn MeV: MultiExperiment Viewer Eduardo Gade Gusmão
TM4 Software Suite - MADAM
IF705 - UFPE - CIn MeV: MultiExperiment Viewer Eduardo Gade Gusmão
TM4 Software Suite - MADAM
Conjunto de ferramentas usado para upload, download e exibição de dados de microarray a partir de um sistema de gerenciamento de banco de dados (MySql).
Dados no “formato” MIAME
Interface para o MySql
IF705 - UFPE - CIn MeV: MultiExperiment Viewer Eduardo Gade Gusmão
TM4 Software Suite - Spotfinder
IF705 - UFPE - CIn MeV: MultiExperiment Viewer Eduardo Gade Gusmão
TM4 Software Suite - Spotfinder
Programa capaz de processar e realizar análises de arquivos de imagens geradas em experimentos com microarray.
Entrada: imagens .TIFF geradas pelo scanner
Saída: pode ser exportada no formato .MEV
Algoritmo rápido para identificar spots
IF705 - UFPE - CIn MeV: MultiExperiment Viewer Eduardo Gade Gusmão
TM4 Software Suite - MIDAS
IF705 - UFPE - CIn MeV: MultiExperiment Viewer Eduardo Gade Gusmão
TM4 Software Suite - MIDAS
Aplicação que permite ao usuário normalizar e realizar outras análises estatísticas com os dados brutos, dando a eles um acabamento para serem interpretados na ferramenta MeV.
Normalização e Filtragem dos Dados
Geração de um report automático
IF705 - UFPE - CIn MeV: MultiExperiment Viewer Eduardo Gade Gusmão
Descrição da Ferramenta MeV
IF705 - UFPE - CIn MeV: MultiExperiment Viewer Eduardo Gade Gusmão
Descrição da Ferramenta MeV
Aplicação que permite ao usuário visualizar imagens processadas de microarray e identificar genes e padrões de interesse.
Clusterização, ajuste dos dados e estatísticas
Flexibilidade
Comparar Imagens (múltipla visualização)
IF705 - UFPE - CIn MeV: MultiExperiment Viewer Eduardo Gade Gusmão
Funcionalidades do MeV
Ajustando os Dados
Clusterização
Análises Estatísticas
Classificação
Redução dos Dados
Carregando Dados (formatos)
Funcionalidades abordadas:
Visualização
Outros
Meta Analysis
IF705 - UFPE - CIn MeV: MultiExperiment Viewer Eduardo Gade Gusmão
Funcionalidades do MeV
IF705 - UFPE - CIn MeV: MultiExperiment Viewer Eduardo Gade Gusmão
Funcionalidades do MeV
1 - Carregando Dados (formatos)
MultiExperiment Viewer Format (.mev)
TIGR ArrayViewer Format (.tav)
Dados já devem estar normalizados
Várias Análises podem ser carregadas ao mesmo tempo
TDMS (Tab Delimited, Multiple Sample) file format (.txt)
Affymetrix file format (.txt)
IF705 - UFPE - CIn MeV: MultiExperiment Viewer Eduardo Gade Gusmão
Exemplo Prático
1 - Carregando Dados (formatos)
Entrar no public: www.cin.ufpe.br/~egg/Entrada/mev
Carregar o arquivo “armstrong-2002-v1_database.txt”
IF705 - UFPE - CIn MeV: MultiExperiment Viewer Eduardo Gade Gusmão
Funcionalidades do MeV
2 - Ajustando os Dados
2.1 – Transformações de Dados
– Normalize Gene/Rows: Transforma os valores usando a seguinte formula:Valor = [(Valor) – Media(Linha)] / Desvio Padrão – Divide Gene/Rows by RMS: Divide os valores pela “Root Mean Square”, que corresponde à raiz quadrada de [Σ(xi)^2/(n-1)]
– Divide Gene/Rows by SD: Divide os valores pelo desvio padrão da linha.
– Mean Center Gene/Rows: Substitui o valor por: [Valor – Média da linha]
– Median Center Gene/Rows: Substitui o valor por: [Valor – Mediana da linha]
IF705 - UFPE - CIn MeV: MultiExperiment Viewer Eduardo Gade Gusmão
Funcionalidades do MeV
2 - Ajustando os Dados
2.1 – Transformações de Dados
– Digitalize Gene/Rows: Cria intervalos discretos para os valores das expressões na linha.
– Sample/Column Adjustments: Todas as operações até agora podem ser realizadas também para as colunas.
– Log2 / Unlog2 Transformations: Respectivamente, transforma todos os valores em log2 e desfaz a operação.
– Log10 to Log2 / Log2 to Log10: Realiza a conversão entre as bases especificadas.
IF705 - UFPE - CIn MeV: MultiExperiment Viewer Eduardo Gade Gusmão
Funcionalidades do MeV
2 - Ajustando os Dados
2.2 – Filtros de Dados
– Low Intensity Cutoff Filter: Remove da análise os genes cujo valor da expressão estão abaixo de um certo limiar estabelecido. Esse filtro está disponível para single-color array e two color array.
– Percentage Cutoffs Filter: Remove da análise os genes cujo valor da expressão estão abaixo da percentagem estabelecida.
– Variance Cutoff Filter: Remove da análise os genes cuja variância não é significativa. O número de genes cortados pode ser estabelecido pela percentagem, pelo valor bruto ou por um limiar de variância.
IF705 - UFPE - CIn MeV: MultiExperiment Viewer Eduardo Gade Gusmão
Funcionalidades do MeV
2 - Ajustando os Dados
2.2 – Filtros de Dados
– Detection Filter (Affymetrix with detection call): Ignora os genes que não estão marcados como “presentes” em um número suficientes de amostras.
– Bioconductor Detection Call Noise Filter: Filtra os genes para o qual o nível de porcentagem de “absent call” através das amostras está acima do nível definido pelo usuário.
– GenePix Flag Filter: Remove da análise todos os genes para o qual o número de amostras com “flags” negativas está acima da porcentagem definida pelo usuário.
IF705 - UFPE - CIn MeV: MultiExperiment Viewer Eduardo Gade Gusmão
Exemplo Prático
2 - Ajustando os Dados
Realizar os seguintes ajustes de dados:
– Low Intensity Cutoff Filter
– Variance Cutoff Filter
IF705 - UFPE - CIn MeV: MultiExperiment Viewer Eduardo Gade Gusmão
Funcionalidades do MeV
3 - Clusterização
HCL Support Trees
Self Organizing Tree Algorithm
Hierarchical Clustering
Tree EASE
K-Means / Medians Clustering
KMC Support
Figure of Merit
Cluster Affinity Search
QT Cluster
Self Organizing Map
IF705 - UFPE - CIn MeV: MultiExperiment Viewer Eduardo Gade Gusmão
Funcionalidades do MeV
3 - Clusterização
Hierarchical Clustering
IF705 - UFPE - CIn MeV: MultiExperiment Viewer Eduardo Gade Gusmão
Funcionalidades do MeV
3 - Clusterização
K- means / medians clustering
IF705 - UFPE - CIn MeV: MultiExperiment Viewer Eduardo Gade Gusmão
Funcionalidades do MeV
3 - Clusterização
Figure of Merit
IF705 - UFPE - CIn MeV: MultiExperiment Viewer Eduardo Gade Gusmão
Exemplo Prático
3 - Clusterização
Realizar as seguintes Clusterizações:
– Hierarchical Clustering
– k-Means/Medians Clustering
IF705 - UFPE - CIn MeV: MultiExperiment Viewer Eduardo Gade Gusmão
Funcionalidades do MeV
4 - Análises Estatísticas
BRIDGE
Nonparametric Tests
Pavlids Template Matching
t Tests
Bayesian Estimation on Temporal Regulation
Significance Analysis for Microarrays
Two-Factor ANOVA
Rank Products
One-Way ANOVA
IF705 - UFPE - CIn MeV: MultiExperiment Viewer Eduardo Gade Gusmão
Funcionalidades do MeV
4 - Análises Estatísticas
Significance Analysis for Microarrays
SAM pode ser usado para caracterizar genes significantes baseado na sua expressão diferencial entre conjuntos de amostras. Ele é eficaz quando existe uma hipótese a-priori dizendo que alguns genes terão níveis de expressão médios diferentes entre diferentes conjuntos de amostras.
Familywise Discovery Rate (FDR)
Permite ao usuário estabelecer um limiar de significância
IF705 - UFPE - CIn MeV: MultiExperiment Viewer Eduardo Gade Gusmão
Funcionalidades do MeV
4 - Análises Estatísticas
Significance Analysis for Microarrays
2 – Two-class Unpaired: Como no paired, porém não existe o pareamento entre os dois grupos.
1 – Two-class paired: As amostras são categorizadas em dois grupos e existe um pareamento um-a-um entre os membros dos dois grupos.
3 – Multi-class: o usuário especifica o número de grupos (>2).
4 – Censored survival: As amostras são associadas com outros atributos externos à análise de expressão.
5 – One-class: O usuário especifica um valor a ser testado para cada expressão média do gene.
IF705 - UFPE - CIn MeV: MultiExperiment Viewer Eduardo Gade Gusmão
Funcionalidades do MeV
4 - Análises Estatísticas
Significance Analysis for Microarrays
IF705 - UFPE - CIn MeV: MultiExperiment Viewer Eduardo Gade Gusmão
Exemplo Prático
4 - Análises Estatísticas
Realizar o Significance Analysis for Microarrays (SAM)
IF705 - UFPE - CIn MeV: MultiExperiment Viewer Eduardo Gade Gusmão
Funcionalidades do MeV
5 - Classificação
k-Nearest Neighbors Classification
Discriminant Analysis Classifier
Support Vector Machines Uncorrelated Shrunken Centroid Classification
IF705 - UFPE - CIn MeV: MultiExperiment Viewer Eduardo Gade Gusmão
Funcionalidades do MeV
5 - Classificação
k-Nearest Neighbors Classification
KNN é um esquema de classificação supervisionado. Um subconjunto dos dados originais (o conjunto de treinamento) é usado como entrada para classificar os dados restantes. O usuário especifica o número de classes desejada e o conjunto de treinamento deverá conter exemplos de cada uma dessas classes.
IF705 - UFPE - CIn MeV: MultiExperiment Viewer Eduardo Gade Gusmão
Funcionalidades do MeV
5 - Classificação
k-Nearest Neighbors Classification
IF705 - UFPE - CIn MeV: MultiExperiment Viewer Eduardo Gade Gusmão
Exemplo Prático
5 - Classificação
Realizar o k-Nearest Neighbors Classification
IF705 - UFPE - CIn MeV: MultiExperiment Viewer Eduardo Gade Gusmão
Funcionalidades do MeV
6 - Redução dos Dados
Correspondence Analysis
Expression Terrain Map
Relevance Networks
Principal Component Analysis
IF705 - UFPE - CIn MeV: MultiExperiment Viewer Eduardo Gade Gusmão
Funcionalidades do MeV
6 - Redução dos Dados
Principal Component Analysis
PCA é usado para atribuir a variabilidade dos dados para um conjunto reduzido de variáveis chamadas componentes principais. Para cada componente principal é atribuída uma fração da variabilidade total, e esses componentes são ordenados em ordem decrescente de variabilidade.
Visualização 3D
IF705 - UFPE - CIn MeV: MultiExperiment Viewer Eduardo Gade Gusmão
Funcionalidades do MeV
6 - Redução dos Dados
Principal Component Analysis
IF705 - UFPE - CIn MeV: MultiExperiment Viewer Eduardo Gade Gusmão
Exemplo Prático
6 - Redução dos Dados
Realizar o Principal Component Analysis (PCA)
IF705 - UFPE - CIn MeV: MultiExperiment Viewer Eduardo Gade Gusmão
Funcionalidades do MeV
7 - Meta Analysis
Gene Set Enrichment Analysis
EASE Cluster Analysis
IF705 - UFPE - CIn MeV: MultiExperiment Viewer Eduardo Gade Gusmão
Funcionalidades do MeV
7 - Meta Analysis
EASE Cluster Analysis
- Interpretação biológica dos dados
- Gene Ontology, KEGG pathways
IF705 - UFPE - CIn MeV: MultiExperiment Viewer Eduardo Gade Gusmão
Funcionalidades do MeV
7 - Meta Analysis
EASE Cluster Analysis
IF705 - UFPE - CIn MeV: MultiExperiment Viewer Eduardo Gade Gusmão
Exemplo Prático
7 - Meta Analysis
Realizar o EASE Cluster Analysis
IF705 - UFPE - CIn MeV: MultiExperiment Viewer Eduardo Gade Gusmão
Funcionalidades do MeV
8 - Visualização
Linear Expression Map
Gene Distance Matrix
IF705 - UFPE - CIn MeV: MultiExperiment Viewer Eduardo Gade Gusmão
Funcionalidades do MeV
9 - Outros
Literature Mining
Gene Shaving
Bayesian Network
IF705 - UFPE - CIn MeV: MultiExperiment Viewer Eduardo Gade Gusmão
Conclusão
Foi apresentada uma ferramenta para análise dos dados de expressão gênica obtidos através de experimentos de microarray.
A ferramenta mostrada participa do ciclo final de um conjuno de vários softwares destinados a realizar um experimento completo de análise de expressão gênica.
Também foram mostrados as diversas operações possíveis na ferramenta seguindo uma ordem lógica de análise dos dados.
IF705 - UFPE - CIn MeV: MultiExperiment Viewer Eduardo Gade Gusmão
Referências
TIGR – www.tigr.org
TM4 – www.tm4.org
Site da Disciplina – www.cin.ufpe.br/~igcf
MeV QuickStart Guide
MeV Manual