MeV: MultiExperiment Viewer
Universidade Federal de Pernambuco – UFPE
Centro de Informática – CIn
Automação Inteligente – if705
Eduardo Gade Gusmão – egg
Professor: Ivan Gesteira – igcf
Tópicos
TIGR
TM4 Software Suite
Descrição da Ferramenta MeV
Funcionalidades do MeV
Exemplo Prático
Conclusão e Referências
IF705 - UFPE - CIn
MeV: MultiExperiment Viewer
Eduardo Gade Gusmão
Exemplo Prático
Download da Ferramenta
Entrar no site: http://www.tm4.org/mev.html
Baixar a ferramenta MeV
IF705 - UFPE - CIn
MeV: MultiExperiment Viewer
Eduardo Gade Gusmão
TIGR
The Institute for Genomic Research é um instituto
de pesquisa fundado em 1992 por Craig Venter em
RockVille, Maryland, Estados unidos.
IF705 - UFPE - CIn
MeV: MultiExperiment Viewer
Eduardo Gade Gusmão
TIGR
Sem fins lucrativos
Sequenciou o Haemophilus Influenzae
Human Genome Project
GLIMMER, MUMmer
Associação com o Science Foundation e o FBI
J. Craig Venter Institute
IF705 - UFPE - CIn
MeV: MultiExperiment Viewer
Eduardo Gade Gusmão
TM4 Software Suite
“A ‘TM4 Suite’ é um conjunto de softwares
desenvolvidos para a análise de dados de
microarray. Os usuários são capazes de
capturar, tratar e analisar os dados obtidos
nos experimentos.”
Representa uma coleção de ferramentas
abrangente, extensível, open source e
livremente disponível.
IF705 - UFPE - CIn
MeV: MultiExperiment Viewer
Eduardo Gade Gusmão
TM4 Software Suite
Softwares Componentes:
Microarray Data Manager (MADAM)
TIGR Spotfinder
Microarray Data Analysis System (MIDAS)
MultiExperiment Viewer (MeV)
IF705 - UFPE - CIn
MeV: MultiExperiment Viewer
Eduardo Gade Gusmão
TM4 Software Suite
Printer
Scanner
Image Analysis
.tiff Image File
Gene Annotation
Raw Gene Expression
Data
Normalization /
Filtering
Normalized Data with
Gene Annotation
AGED
Others…
MAD
Database
Expression
Analysis
Database
Database
Data Entry / Management
IF705 - UFPE - CIn
MeV: MultiExperiment Viewer
Interpretation of
Analysis Results
Eduardo Gade Gusmão
TM4 Software Suite - MADAM
IF705 - UFPE - CIn
MeV: MultiExperiment Viewer
Eduardo Gade Gusmão
TM4 Software Suite - MADAM
Conjunto de ferramentas usado para upload,
download e exibição de dados de microarray
a partir de um sistema de gerenciamento de
banco de dados (MySql).
Dados no “formato” MIAME
Interface para o MySql
IF705 - UFPE - CIn
MeV: MultiExperiment Viewer
Eduardo Gade Gusmão
TM4 Software Suite - Spotfinder
IF705 - UFPE - CIn
MeV: MultiExperiment Viewer
Eduardo Gade Gusmão
TM4 Software Suite - Spotfinder
Programa capaz de processar e realizar
análises de arquivos de imagens geradas em
experimentos com microarray.
Algoritmo rápido para identificar spots
Entrada: imagens .TIFF geradas pelo scanner
Saída: pode ser exportada no formato .MEV
IF705 - UFPE - CIn
MeV: MultiExperiment Viewer
Eduardo Gade Gusmão
TM4 Software Suite - MIDAS
IF705 - UFPE - CIn
MeV: MultiExperiment Viewer
Eduardo Gade Gusmão
TM4 Software Suite - MIDAS
Aplicação que permite ao usuário normalizar
e realizar outras análises estatísticas com os
dados brutos, dando a eles um acabamento
para serem interpretados na ferramenta MeV.
Normalização e Filtragem dos Dados
Geração de um report automático
IF705 - UFPE - CIn
MeV: MultiExperiment Viewer
Eduardo Gade Gusmão
Descrição da Ferramenta MeV
IF705 - UFPE - CIn
MeV: MultiExperiment Viewer
Eduardo Gade Gusmão
Descrição da Ferramenta MeV
Aplicação que permite ao usuário visualizar
imagens processadas de microarray e
identificar genes e padrões de interesse.
Comparar Imagens (múltipla visualização)
Clusterização, ajuste dos dados e estatísticas
Flexibilidade
IF705 - UFPE - CIn
MeV: MultiExperiment Viewer
Eduardo Gade Gusmão
Funcionalidades do MeV
Funcionalidades abordadas:
Carregando Dados (formatos)
Ajustando os Dados
Redução dos Dados
Clusterização
Meta Analysis
Análises Estatísticas
Visualização
Classificação
Outros
IF705 - UFPE - CIn
MeV: MultiExperiment Viewer
Eduardo Gade Gusmão
Funcionalidades do MeV
IF705 - UFPE - CIn
MeV: MultiExperiment Viewer
Eduardo Gade Gusmão
Funcionalidades do MeV
1 - Carregando Dados (formatos)
Dados já devem estar normalizados
Várias Análises podem ser carregadas ao mesmo tempo
MultiExperiment Viewer Format (.mev)
TIGR ArrayViewer Format (.tav)
TDMS (Tab Delimited, Multiple Sample) file format (.txt)
Affymetrix file format (.txt)
IF705 - UFPE - CIn
MeV: MultiExperiment Viewer
Eduardo Gade Gusmão
Exemplo Prático
1 - Carregando Dados (formatos)
Entrar no public: www.cin.ufpe.br/~egg/Entrada/mev
Carregar o arquivo “armstrong-2002-v1_database.txt”
IF705 - UFPE - CIn
MeV: MultiExperiment Viewer
Eduardo Gade Gusmão
Funcionalidades do MeV
2 - Ajustando os Dados
2.1 – Transformações de Dados
– Normalize Gene/Rows: Transforma os valores usando a seguinte formula:
Valor = [(Valor) – Media(Linha)] / Desvio Padrão
– Divide Gene/Rows by RMS: Divide os valores pela “Root Mean Square”,
que corresponde à raiz quadrada de [Σ(xi)^2/(n-1)]
– Divide Gene/Rows by SD: Divide os valores pelo desvio padrão da linha.
– Mean Center Gene/Rows: Substitui o valor por: [Valor – Média da linha]
– Median Center Gene/Rows: Substitui o valor por: [Valor – Mediana da linha]
IF705 - UFPE - CIn
MeV: MultiExperiment Viewer
Eduardo Gade Gusmão
Funcionalidades do MeV
2 - Ajustando os Dados
2.1 – Transformações de Dados
– Digitalize Gene/Rows: Cria intervalos discretos para os valores das
expressões na linha.
– Sample/Column Adjustments: Todas as operações até agora podem ser
realizadas também para as colunas.
– Log2 / Unlog2 Transformations: Respectivamente, transforma todos os
valores em log2 e desfaz a operação.
– Log10 to Log2 / Log2 to Log10: Realiza a conversão entre as bases
especificadas.
IF705 - UFPE - CIn
MeV: MultiExperiment Viewer
Eduardo Gade Gusmão
Funcionalidades do MeV
2 - Ajustando os Dados
2.2 – Filtros de Dados
– Low Intensity Cutoff Filter: Remove da análise os genes cujo valor da
expressão estão abaixo de um certo limiar estabelecido. Esse filtro está
disponível para single-color array e two color array.
– Percentage Cutoffs Filter: Remove da análise os genes cujo valor da
expressão estão abaixo da percentagem estabelecida.
– Variance Cutoff Filter: Remove da análise os genes cuja variância não é
significativa. O número de genes cortados pode ser estabelecido pela
percentagem, pelo valor bruto ou por um limiar de variância.
IF705 - UFPE - CIn
MeV: MultiExperiment Viewer
Eduardo Gade Gusmão
Funcionalidades do MeV
2 - Ajustando os Dados
2.2 – Filtros de Dados
– Detection Filter (Affymetrix with detection call): Ignora os genes que não estão
marcados como “presentes” em um número suficientes de amostras.
– Bioconductor Detection Call Noise Filter: Filtra os genes para o qual o nível de
porcentagem de “absent call” através das amostras está acima do nível definido
pelo usuário.
– GenePix Flag Filter: Remove da análise todos os genes para o qual o número
de amostras com “flags” negativas está acima da porcentagem definida pelo
usuário.
IF705 - UFPE - CIn
MeV: MultiExperiment Viewer
Eduardo Gade Gusmão
Exemplo Prático
2 - Ajustando os Dados
Realizar os seguintes ajustes de dados:
– Low Intensity Cutoff Filter
– Variance Cutoff Filter
IF705 - UFPE - CIn
MeV: MultiExperiment Viewer
Eduardo Gade Gusmão
Funcionalidades do MeV
3 - Clusterização
Hierarchical Clustering
Cluster Affinity Search
Tree EASE
Figure of Merit
HCL Support Trees
QT Cluster
Self Organizing Tree Algorithm
Self Organizing Map
K-Means / Medians Clustering
KMC Support
IF705 - UFPE - CIn
MeV: MultiExperiment Viewer
Eduardo Gade Gusmão
Funcionalidades do MeV
3 - Clusterização
Hierarchical Clustering
IF705 - UFPE - CIn
MeV: MultiExperiment Viewer
Eduardo Gade Gusmão
Funcionalidades do MeV
3 - Clusterização
K- means / medians clustering
IF705 - UFPE - CIn
MeV: MultiExperiment Viewer
Eduardo Gade Gusmão
Funcionalidades do MeV
3 - Clusterização
Figure of Merit
IF705 - UFPE - CIn
MeV: MultiExperiment Viewer
Eduardo Gade Gusmão
Exemplo Prático
3 - Clusterização
Realizar as seguintes Clusterizações:
– Hierarchical Clustering
– k-Means/Medians Clustering
IF705 - UFPE - CIn
MeV: MultiExperiment Viewer
Eduardo Gade Gusmão
Funcionalidades do MeV
4 - Análises Estatísticas
Pavlids Template Matching
One-Way ANOVA
t Tests
Two-Factor ANOVA
BRIDGE
Rank Products
Nonparametric Tests
Bayesian Estimation on Temporal Regulation
Significance Analysis for Microarrays
IF705 - UFPE - CIn
MeV: MultiExperiment Viewer
Eduardo Gade Gusmão
Funcionalidades do MeV
4 - Análises Estatísticas
Significance Analysis for Microarrays
SAM pode ser usado para caracterizar genes significantes baseado na sua
expressão diferencial entre conjuntos de amostras. Ele é eficaz quando
existe uma hipótese a-priori dizendo que alguns genes terão níveis de
expressão médios diferentes entre diferentes conjuntos de amostras.
Familywise Discovery Rate (FDR)
Permite ao usuário estabelecer um limiar de significância
IF705 - UFPE - CIn
MeV: MultiExperiment Viewer
Eduardo Gade Gusmão
Funcionalidades do MeV
4 - Análises Estatísticas
Significance Analysis for Microarrays
1 – Two-class paired: As amostras são categorizadas em dois grupos e existe um
pareamento um-a-um entre os membros dos dois grupos.
2 – Two-class Unpaired: Como no paired, porém não existe o pareamento entre
os dois grupos.
3 – Multi-class: o usuário especifica o número de grupos (>2).
4 – Censored survival: As amostras são associadas com outros atributos
externos à análise de expressão.
5 – One-class: O usuário especifica um valor a ser testado para cada expressão
média do gene.
IF705 - UFPE - CIn
MeV: MultiExperiment Viewer
Eduardo Gade Gusmão
Funcionalidades do MeV
4 - Análises Estatísticas
Significance Analysis for Microarrays
IF705 - UFPE - CIn
MeV: MultiExperiment Viewer
Eduardo Gade Gusmão
Exemplo Prático
4 - Análises Estatísticas
Realizar o Significance Analysis for Microarrays (SAM)
IF705 - UFPE - CIn
MeV: MultiExperiment Viewer
Eduardo Gade Gusmão
Funcionalidades do MeV
5 - Classificação
Support Vector Machines
Uncorrelated Shrunken Centroid Classification
k-Nearest Neighbors Classification
Discriminant Analysis Classifier
IF705 - UFPE - CIn
MeV: MultiExperiment Viewer
Eduardo Gade Gusmão
Funcionalidades do MeV
5 - Classificação
k-Nearest Neighbors Classification
KNN é um esquema de classificação supervisionado. Um subconjunto
dos dados originais (o conjunto de treinamento) é usado como entrada
para classificar os dados restantes. O usuário especifica o número de
classes desejada e o conjunto de treinamento deverá conter exemplos de
cada uma dessas classes.
IF705 - UFPE - CIn
MeV: MultiExperiment Viewer
Eduardo Gade Gusmão
Funcionalidades do MeV
5 - Classificação
k-Nearest Neighbors Classification
IF705 - UFPE - CIn
MeV: MultiExperiment Viewer
Eduardo Gade Gusmão
Exemplo Prático
5 - Classificação
Realizar o k-Nearest Neighbors Classification
IF705 - UFPE - CIn
MeV: MultiExperiment Viewer
Eduardo Gade Gusmão
Funcionalidades do MeV
6 - Redução dos Dados
Relevance Networks
Principal Component Analysis
Correspondence Analysis
Expression Terrain Map
IF705 - UFPE - CIn
MeV: MultiExperiment Viewer
Eduardo Gade Gusmão
Funcionalidades do MeV
6 - Redução dos Dados
Principal Component Analysis
PCA é usado para atribuir a variabilidade dos dados para um conjunto
reduzido de variáveis chamadas componentes principais. Para cada
componente principal é atribuída uma fração da variabilidade total, e
esses componentes são ordenados em ordem decrescente de
variabilidade.
Visualização 3D
IF705 - UFPE - CIn
MeV: MultiExperiment Viewer
Eduardo Gade Gusmão
Funcionalidades do MeV
6 - Redução dos Dados
Principal Component Analysis
IF705 - UFPE - CIn
MeV: MultiExperiment Viewer
Eduardo Gade Gusmão
Exemplo Prático
6 - Redução dos Dados
Realizar o Principal Component Analysis (PCA)
IF705 - UFPE - CIn
MeV: MultiExperiment Viewer
Eduardo Gade Gusmão
Funcionalidades do MeV
7 - Meta Analysis
Gene Set Enrichment Analysis
EASE Cluster Analysis
IF705 - UFPE - CIn
MeV: MultiExperiment Viewer
Eduardo Gade Gusmão
Funcionalidades do MeV
7 - Meta Analysis
EASE Cluster Analysis
- Interpretação biológica dos dados
- Gene Ontology, KEGG pathways
IF705 - UFPE - CIn
MeV: MultiExperiment Viewer
Eduardo Gade Gusmão
Funcionalidades do MeV
7 - Meta Analysis
EASE Cluster Analysis
IF705 - UFPE - CIn
MeV: MultiExperiment Viewer
Eduardo Gade Gusmão
Exemplo Prático
7 - Meta Analysis
Realizar o EASE Cluster Analysis
IF705 - UFPE - CIn
MeV: MultiExperiment Viewer
Eduardo Gade Gusmão
Funcionalidades do MeV
8 - Visualização
Linear Expression Map
Gene Distance Matrix
IF705 - UFPE - CIn
MeV: MultiExperiment Viewer
Eduardo Gade Gusmão
Funcionalidades do MeV
9 - Outros
Gene Shaving
Bayesian Network
Literature Mining
IF705 - UFPE - CIn
MeV: MultiExperiment Viewer
Eduardo Gade Gusmão
Conclusão
Foi apresentada uma ferramenta para análise dos dados de
expressão gênica obtidos através de experimentos de microarray.
A ferramenta mostrada participa do ciclo final de um conjuno de
vários softwares destinados a realizar um experimento completo
de análise de expressão gênica.
Também foram mostrados as diversas operações possíveis na
ferramenta seguindo uma ordem lógica de análise dos dados.
IF705 - UFPE - CIn
MeV: MultiExperiment Viewer
Eduardo Gade Gusmão
Referências
TIGR – www.tigr.org
TM4 – www.tm4.org
Site da Disciplina – www.cin.ufpe.br/~igcf
MeV QuickStart Guide
MeV Manual
IF705 - UFPE - CIn
MeV: MultiExperiment Viewer
Eduardo Gade Gusmão
Download

Database - Centro de Informática da UFPE