UNIVERSIDADE FEDERAL DE OURO PRETO
INSTITUTO DE CIÊNCIAS EXATAS E BIOLÓGICAS
DEPARTAMENTO DE CIÊNCIAS BIOLÓGICAS
PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIAS BIOLÓGICAS
miRNAs em Schistosoma mansoni: biogênese,
predição, validação e alvos potenciais
AUTOR: Msc. MATHEUS DE SOUZA GOMES
ORIENTADORA: PROFa. Dra. RENATA GUERRA DE SÁ COTA
CO-ORIENTADOR: PROF. PhD. CHARLES SPILLANE
________________________________________________________________________________
miRNAs em Schistosoma mansoni: biogênese,
predição, validação e alvos potenciais
________________________________________________________________________________
Tese submetida ao programa de Pós-Graduação Núcleo
de Pesquisa em Ciências Biológicas da Universidade
Federal de Ouro Preto como parte integrante dos
requisitos para obtenção do título de doutor em Ciências
Biológicas, área de concentração Biologia Molecular.
Autor: Msc. Matheus de Souza Gomes
Orientador: Profa. Dra. Renata Guerra de Sá Cota
Universidade Federal de Ouro Preto – Ouro Preto, Brasil
Co-orientador: Prof. PhD. Charles Spillane
National University of Ireland - Galway, Irlanda
Ouro Preto - Fevereiro de 2012
G631
Gomes, Matheus de Souza.
miRNAs em Schistosoma mansoni [manuscrito] : biogênese, predi
ção , validação e alvos potenciais / Matheus de Souza Gomes. - 2012.
XIV, 201 f. il.
Orientadora: Profa. Dra. Renata Guerra de Sá Cota.
Orientador: Charles Spillane.
Tese (Doutorado) - Universidade Federal de Ouro Preto.Instituto de
Ciências Exatas e Biológicas. Núcleo de Pesquisas Biológicas em Ciên
cias Biológicas.
Área de concentração: Biologia molecular.
1.Schistosoma mansoni - Teses. I. Universidade Federal de Ouro Preto.
II. Título.
CDU: 57(43.2)
Catalogação: [email protected]
CDU: 616.993.161
Este trabalho foi desenvolvido no Laboratório de Bioquímica e Biologia Molecular
NUPEB/UFOP e Genetics and Biotechnolgy Lab, Centre for Chromosome Biology, National
University of Ireland – Galway, Irlanda, com apoio financeiro da Coordenação de
Aperfeiçoamento de Pessoal de Nível Superior (CAPES) (Doutorado Sanduíche – Processo
1495-10-0) e Fundação de Amparo à Pesquisa do Estado de Minas Gerais (FAPEMIG)
(CBB2935/09).
Dedico esta tese aos meus pais, exemplos de
vida, Luiz e Rosânia, aos meus irmãos, Marcos,
Júlia e Daniela e a todos meus familiares.
Dedico também ao amor de minha vida, minha
esposa Carolina por me incentivar estando
sempre ao meu lado. Agradeço a todos pelo
apoio incondicional.
Agradecimentos
A Deus;
Aos meus pais, Luiz e Rosânia, por serem meus exemplos de vida, humildade e persistência,
sempre mostrando o caminho certo a trilhar e fazendo o bem;
À minhas queridas irmãs, Daniela e Júlia, pelo apoio e amor incondicionais, sempre
mostrando um ombro amigo para me acolher.
Ao meu irmão Marcos pela grande amizade, amor, companheirismo e, sobretudo, por me
ajudar e incentivar nos momentos mais difíceis.
Aos demais familiares, pelo carinho, preocupação e por me apoiarem sempre;
Ao meu amor Carol, minha esposa, pela dedicação, compreensão, auxílio e, sobretudo, por
ter paciência e sabedoria, contribuindo imensuravelmente para realização deste trabalho;
A minha companheirinha, Sophia “Tica”, sempre alegre e disponível para momentos de lazer
e distração.
À família da Carol, seus pais e sua irmã Clarissa pelo incentivo e em especial Dona Lili pela
paciência e acolhimento, sendo importantes para finalização deste trabalho;
À Prof.a Dr.a Renata Guerra de Sá Cota, pelos ensinamentos práticos e teóricos, pelo exemplo
de dedicação, profissionalismo e sobretudo por contribuir em minha formação como
pesquisador e professor.
Ao professor Dr. Elio Hideo Babá, pelo exemplo de pesquisador e professor. Pelos
ensinamentos na pesquisa e na vida. Por sempre se mostrar disposto a ajudar mesmo nos
momentos mais difíceis.
Aos professores Elísio, Leandro, Lucinha, Daniela e Karen pelo convívio agradável e
aprendizado científico transmitido.
Aos amigos da equipe do Laboratório de Bioquímica e Biologia Molecular (LBBM) da
UFOP que passaram e se fazem presentes, muito obrigado. Em especial a Roberta que me
auxiliou diretamente no trabalho.
Ao Ezequiel pelo auxílio no trabalho e pelas boas risadas;
A professora Liana Janotti, por gentilmente fornecer junto ao moluscário os parasitos para a
realização deste trabalho.
Ao moluscário do CPqRR em especial a Delza, Dilce e Sueleny pela disponibilização dos
parasitos.
A todos do Laboratório de Imunoparasitologia da UFOP pelo grande suporte e auxílio
científico, em especial ao professor Luis Carlos Crocco por sempre se mostrar disponível
para ajudar.
A todos os professores do NUPEB, pela receptividade em seus Laboratórios;
A todos os amigos dos laboratórios do NUPEB pela saudável convivência contribuindo para
a realização deste trabalho;
À Cida, secretária prestativa, atenciosa e alegre, sempre pronta para ajudar;
Às seguintes instituições que colaboraram com recursos financeiros para a realização deste
trabalho: CNPq e FAPEMIG. Em especial a agência CAPES pelo provimento da bolsa de
estudos no Brasil e a bolsa-sanduíche na Universidade Nacional da Irlanda – Galway
(Processo no 1495-10-0).
À todos do laboratório de Genética e Biotecnologia da Universidade Nacional da Irlanda –
Galway que contribuíram imensamente para meu aprendizado como cientista.
Em especial ao Mohan Kumar Muniyappa pelas discussões e auxílio científico, a Duygu
Selcuklu pelos ensinamentos transmitidos, ao Mark Donoghue pelas dicas de Bioinformática
e Elyze Ema pela troca de experiências.
Ao Professor Charles Spillane por me receber em seu laboratório, na Universidade Nacional
da Irlanda, disponibilizando todos os recursos possíveis para meu aprendizado e crescimento
como cientista.
E por todos aqueles que participaram direta ou indiretamente na realização deste trabalho.
“Todas as verdades são fáceis de
entender, uma vez descobertas. O
difícil é descobrí–las”.
Galileo Galilei (1564-1642)
SUMÁRIO
RESUMO ........................................................................................................................... I
ABSTRACT ....................................................................................................................... III
LISTA DE ABREVIATURAS, SIGLAS E SÍMBOLOS .............................................. V
LISTA DE FIGURAS ....................................................................................................... VIII
LISTA DE TABELAS ...................................................................................................... XVI
I. INTRODUÇÃO ................................................................................................................1
I.1 Esquistossomose ...............................................................................................................2
I.1.1 Histórico ........................................................................................................................2
I.1.2 Distribuição geográfica..................................................................................................3
I.1.2.1 Mundo .........................................................................................................................3
I.1.2.2 Brasil ...........................................................................................................................4
1.2 O ciclo biológico de S. mansoni ......................................................................................5
I.3 Genômica e Transcriptômica de S. mansoni ....................................................................8
I.4 Regulação da expressão gênica em S. mansoni ................................................................ 9
I.5 microRNAs .................................................................................................................... 12
I.5.1 Histórico e Origem ..................................................................................................... 12
I.5.2 Estratégias de Predição e Validação de miRNAs ....................................................... 15
I.5.3 Estratégias de Predição de Alvos de miRNAs............................................................ 17
II. OBJETIVOS................................................................................................................. 19
II.1 Geral ............................................................................................................................. 20
II. 2 Específicos .................................................................................................................. 20
III. Via de silenciamento gênico mediada por miRNAs em S. mansoni ....................... 21
III.1 Justificativa ................................................................................................................. 22
III.2 Materiais e Métodos .................................................................................................... 23
III.2.1 Validação in silico.................................................................................................... 23
III.2.1.1 Análise e localização da via de miRNA no genoma de S. mansoni ..................... 23
III.2.1.2 Alinhamento múltiplo de sequências e Análise filogenética ................................ 23
III.2.1.3 Análise de resíduos hidrofóbicos (Hydrophobic Cluster Analysis - HCA) .......... 24
III.2.1.4 Predição da estrutura secundária ........................................................................... 24
III.2.1.5 Predição da estrutura terciárias ............................................................................. 24
III.2.2 Validação experimental ........................................................................................... 25
III.2.2.1 Parasitos ................................................................................................................ 25
III.2.2.2 Análise da expressão gênica por qRT-PCR .......................................................... 27
III.2.2.2.1 Extração do RNA total ....................................................................................... 27
III.2.2.2.2 Oligonucleotídeos iniciadores (Primers)............................................................ 28
III.2.2.2.3 RT-PCR.............................................................................................................. 28
III.2.2.2.4 Reação da PCR quantitativa em Tempo Real (qRT-PCR) ................................ 28
III.2.2.2.5 Avaliação da curva de eficiência dos iniciadores .............................................. 29
III.2.2.2.6 Verificação da qualidade dos amplicons............................................................ 30
III.2.2.2.7 Curva de dissociação dos amplicons.................................................................. 31
III.2.2.3 Validação dos iniciadores (Seqüenciamento) ....................................................... 32
III.2.2.3.1 Purificação do produto de PCR convencional ................................................... 32
III.2.2.3.2 Freeze Squeze .................................................................................................... 32
III.2.2.3.3 Clonagem ........................................................................................................... 33
III.2.2.3.3.1 Reação de Ligação .......................................................................................... 33
III.2.2.3.3.2 Preparo de células competentes ...................................................................... 33
III.2.2.3.3.3 Transformação Bacteriana .............................................................................. 33
III.2.2.3.3.4 PCR de Colônia............................................................................................... 34
III.2.2.3.3.5 Minipreparação ............................................................................................... 34
III.2.2.3.3.6 Sequenciamento .............................................................................................. 34
III.2.2.4 Análise Estatística ................................................................................................. 35
III.3 Resultados e Discussão ............................................................................................... 36
III.3.1 Análise in silico – Via de silenciamento gênico mediada por miRNAs .................. 36
III.3.1.1 Anotação e localização no genoma de S. mansoni ............................................... 36
III.3.1.1 Exportinas 1, 5 e T ................................................................................................ 40
III.3.1.2 Partner de Dicer e Drosha (RNAseIIIs) ................................................................ 42
III.3.1.3 FMR1 (Fragile-X mental retardation 1) ................................................................ 48
III.3.1.4 Tudor-SN (Tudor staphylococcal nuclease) ......................................................... 51
III.3.2 Análise da expressão gênica .................................................................................... 57
III.3.3 Regulação pós-transcicional em S. mansoni ............................................................ 60
IV. Predição computacional de miRNAs em S. mansoni............................................... 63
IV.1 Justificativa ................................................................................................................. 64
IV.2 Materiais e Métodos ................................................................................................... 66
IV.2.1 Banco de dados de sequências de miRNAs e de S. mansoni ................................... 66
IV.2.2 Identificação de miRNAs maduros e seus precursores (pré-miRNAs) ................... 66
IV.2.3 Identificação de miRNAs conservados .................................................................... 67
IV.2.4 Identificação de miRNAs não conservados ............................................................. 70
IV.2.5 Análise comparativa dos miRNAs identificados em S. mansoni ............................ 70
IV.2.6 Identificação de clusteres de miRNAs ..................................................................... 71
IV.2.7 Conservação e Distribuição Filogenética dos miRNAs de S. mansoni ................... 71
IV.2.8 Análises estatísticas e plotagem de gráficos ............................................................ 72
IV.3 Resultados e Discussão ............................................................................................... 73
IV.3.1 Identificação de miRNAs no genoma de S. mansoni .............................................. 73
IV.3.2 Identificação e Caracterização dos miRNAs maduros ............................................ 76
IV.3.3 Caracterização dos pré-miRNAs de S. mansoni ...................................................... 82
IV.3.4 Distribuição dos genes de miRNAs no genoma de S. mansoni ............................... 89
IV.3.5 Análise dos miRNAs conservados........................................................................... 93
IV.3.5.1 mir-190 de S. mansoni .......................................................................................... 94
IV.3.5.2 miRNA-8 de S. mansoni ....................................................................................... 96
IV.3.5.3 mir-10 de S. mansoni ............................................................................................ 98
IV.3.6 Duplicações dos miRNAs 71 e 2 em S. mansoni................................................... 100
IV.3.7 Clusteres mir-71/2 e mir-71b/2 .............................................................................. 103
V. Cluster Protostômio-específico mir-71/2 .................................................................. 106
V.1 Justificativa ................................................................................................................ 107
V.2 Materiais e Métodos ................................................................................................... 109
V.2.1 Identificação dos miRNAs e regiões genômicas..................................................... 109
V.2.2 Predição computacional dos genes de miRNAs clusterizados................................ 109
V.2.3 Análise Comparativa dos miRNAs clusterizados em mir71/2................................ 111
V.2.4 Conservação evolutiva e Distribuição Filogenética dos miRNAs clustetrizados em
mir71/2 .............................................................................................................................. 111
V.2.5 Implementação e plotagem dos gráficos ................................................................. 112
V.3 Resultados e Discussão .............................................................................................. 113
V.3.1 Predição do cluster mir-71/2 ................................................................................... 113
V.3.2 Cluster mir-71/2 Protostômio específico ................................................................ 113
V.3.3 Duplicação do cluster mir-71/2 ............................................................................... 120
V.3.4 Caracterização dos pré-miRNAs ............................................................................. 120
V.3.5 Análise Filogenética e Comparativa dos novos miRNAs ....................................... 125
V.3.6 Conservação dos miRNAs maduros do cluster mir-71/2 ........................................ 129
VI. miRNAs: novos controladores da expressão gênica em S. mansoni? .................. 133
VI.1 Justificativa ............................................................................................................... 134
VI.2 Materiais e Métodos ................................................................................................. 136
VI.2.1 Análise in silico ..................................................................................................... 136
VI.2.1.1 Predição computacional dos alvos de miRNAs no genoma de S. mansoni ........ 136
VI.2.1.2 3’UTR dos mRNAs ............................................................................................ 136
VI.2.1.3 mRNAs alvos ...................................................................................................... 136
VI.2.1.4 Caracterização e Categorização dos RNAm alvos ............................................. 137
VI.2.1.5 Predição de 3'UTR alvo homólogas ................................................................... 137
VI.2.2 Análise in vitro ...................................................................................................... 138
VI.2.2.1 Obtenção dos Parasitos ....................................................................................... 138
VI.2.2.2 Extração de RNA total ........................................................................................ 139
VI.2.2.2.1 miRNAs ........................................................................................................... 139
VI.2.2.2.2 Alvos ................................................................................................................ 140
VI.2.2.3 Obtenção da primeira fita de DNA (cDNA) ....................................................... 141
VI.2.2.3.1 miRNAs ........................................................................................................... 141
VI.2.2.3.2 Alvos ................................................................................................................ 141
VI.2.2.4 Oligonucleotídeos iniciadores ............................................................................ 141
VI.2.2.4.1 miRNAs ........................................................................................................... 142
VI.2.2.4.2 Alvos ................................................................................................................ 142
VI.2.2.5 qRT-PCR ............................................................................................................ 143
VI.2.2.5.1 miRNA............................................................................................................. 143
VI.2.2.5.2 Alvos ................................................................................................................ 143
VI.2.2.5.2.1 Curva de eficiência dos iniciadores .............................................................. 144
VI.2.2.5.2.2 Curva de dissociação dos amplicons ............................................................ 145
VI.2.2.6 Análise estatística ............................................................................................... 146
VI.3 Resultados e Discussão ............................................................................................. 147
VI.3.1 Predição dos alvos de miRNAs ............................................................................. 147
VI.3.2 Ontologia gênica e participação em vias metabólicas ........................................... 152
VI.3.3 Expressão gênica dos miRNAs conservados e não conservados........................... 155
VI.3.3.1 miRNAs sexo-específicos ................................................................................... 159
VI.3.4 Alvos evolutivamente conservados ....................................................................... 162
VI.3.5 Expressão gênica de alvos conservados de S. mansoni ......................................... 165
VI.3.5.1 Smp_066900 inexina (sma-mir-125a) ................................................................ 165
VI.3.5.2 Smp_177060 sinoviolina (sma-mir-124-3p)....................................................... 166
VI.3.6 Controle da expressão gênica ao nível pós-transcricional em S. mansoni ............ 168
VII. CONCLUSÕES ...................................................................................................... 171
VIII. REFERÊNCIAS BIBLIOGRÁFICAS ................................................................ 173
ANEXOS .......................................................................................................................... 200
Resumo
Os miRNAs constituem uma classe extensa de pequenos RNAs não codificadores de
proteínas possuindo, em sua forma madura, de 20 a 24 nucleotídeos, cuja função principal é regular a
expressão gênica. Seus precursores, denominados pré-miRNAs, têm como característica principal a
formação de estruturas secundárias estáveis em forma de grampos (hairpins) possuindo um tamanho
variável de 70 a 120 nucleotídeos. Os resultados publicados na última década sugerem que o
silenciamento gênico mediado pelos miRNAs é um processo evolutivamente conservado e envolve,
em um primeiro momento, a interação entre o miRNA e o respectivo RNA mensageiro alvo,
promovendo sua clivagem ou repressão de sua tradução. Apesar de o Schistosoma mansoni ser um
organismo com genoma conhecido, pouco se conhece sobre o repertório de miRNAs presentes neste
parasito. Resultados anteriores do nosso laboratório demonstraram que genes centrais da biogênese de
miRNAs são mais expressos em cercárias e esquistossômulos jovens quando comparados a vermes
adultos, levando a hipótese de que os mecanismos de adaptação do parasito ao hospedeiro mamífero,
imediatamente pós-infecção, podem envolver a participação de miRNAs. Para investigar este
hipótese, foram utilizados neste trabalho abordagens computacionais e experimentais para identificar
miRNAs em S. mansoni, bem como determinar suas características estruturais e padrão de expressão,
correlacionando em paralelo com o perfil de expressão de 13 genes envolvidos em sua biogênese. Os
resultados obtidos sugerem que os genes envolvidos na biogênese de miRNAs são conservados e
apresentam um perfil de expressão gênica diferencial durante a transição cercária-esquistossômulos
jovens. Foram identificados neste trabalho 35 miRNAs conservados, 32 não conservados e mais de
300 prováveis RNA mensageiros alvos no genoma de S. mansoni. Dentre os miRNAs identificados
foram caracterizados duplicações gênicas, clusteres (mir-71/2) e miRNAs sexo-específicos. As
análises da expressão gênica dos miRNAs conservados e não conservados evidenciaram padrões de
expressão gênero-específicos (sma-miR-61, sma-miR-125a e sma-miR-124-3p) e estágio-específicos
(sma-mir-new10-5p, sma-miR-125a). Observou-se também uma correlação positiva entre a alta
expressão de miRNAs no parasito e baixa expressão de alvos específicos. Estes dados sugerem que a
regulação do proteoma do parasito, principalmente nas fases de cercária e esquistossômulos,
provavelmente é mediada por regulação pós-transcricional mediada por miRNAs viabilizando a
instalação efetiva do parasito no hospedeiro mamífero. Este conjunto de resultados abre perspectiva
para avaliação do perfil de expressão em esporocistos demonstrando que transcritos produzidos nesta
fase do ciclo biológico do S. mansoni podem ser silenciados e posteriormente traduzidos em cercárias
ou esquistossômulos.
Palavras-chave: miRNAs, mRNA alvo, Schistosoma mansoni, expressão gênica, regulação póstranscricional.
I
Abstract
MicroRNAs (miRNAs) are an abundant class of small non-protein-coding RNAs that function
as negative gene regulators. These molecules in their mature form are generally 20–24 nucleotides.
Their precursors, pre-miRNAs, form a stable stem-loop secondary structure (hairpins) with a variable
length (70 to 120 nucleotides). Over the last decade, researchers have been suggesting that the gene
silencing mediated by miRNAs is an evolutionarily conserved process and involves the interaction
between the miRNA and its target mRNA, promoting its cleavage or repression of protein translation.
Although Schistosoma mansoni genome is known, few studies have been done on repertoire of
miRNAs and their machinery. Previous results from our laboratory demonstrated that the central
genes of Mirna biogenesis is over expressed in cercariae and schistosomula when compared to adult
worms, leading to the hypothesis that mechanisms involving participation of miRNAs may help the
parasite adaptation, immediately post-infection in mammalian host. To investigate this hypothesis, we
performed computational and experimental approaches to identify miRNAs in S. mansoni and to
determine their structural features and expression pattern, correlating with the expression profile of 13
genes involved in their biogenesis. These results suggested that genes involved in biogenesis of
miRNAs are conserved and showed na over expression profile during the transition from cercariae to
young schistosomula. We identified 35 conserved miRNAs, 32 not conserved miRNAs and more than
300 putative targets in the S. mansoni genome. The identified miRNAs were characterized and
displayed gene duplication, clusteres (miR-71/2) and sex-specific miRNAs. The analysis of gene
expression of conserved and not conserved miRNAs showed gender-specific miRNAs (sma-miR-61,
sma-miR-125a and sma-miR-124-3p) and stage-specific miRNAs (sma-mir-new10-5p and sma-mir125a). There was also a positive correlation between high expression of miRNAs in parasite and low
expression of their specific targets. These data suggested that the regulation of the parasite proteome,
especially in the stages cercaria and schistosomula, is probably mediated by miRNA postranscriptional regulation, enabling the effective installation of the parasite in the mammalian host.
This set of results also opens a perspective to evaluate the expression profile in sporocysts
demonstrating that mRNAs produced in this stage are silenced and later translated in cercariae or
schistosomula.
Keywords: miRNAs, mRNA target, Schistosoma mansoni, gene expression, pos- transcriptional
regulation.
II
LISTA DE ABREVIATURAS, SIGLAS E SÍMBOLOS
µg
µL
µM
a.C
AMFE
BAC
...............................................
...............................................
...............................................
...............................................
...............................................
...............................................
BLAST
...............................................
BSA
CaCl2
cDNA
CNPq
...............................................
...............................................
...............................................
...............................................
DNA
dNTP
...............................................
...............................................
EDTA
EMT
...............................................
...............................................
EST
FAPEMIG
...............................................
...............................................
FAPESP
...............................................
Gb
GC
GeneDB
GO
...............................................
...............................................
...............................................
...............................................
HCA
...............................................
IPTG
Kb
KEGG
...............................................
...............................................
...............................................
KO
LB
Mb
MFE
MFEE
...............................................
...............................................
...............................................
...............................................
...............................................
MFEI
mg
MgCl2
...............................................
...............................................
...............................................
Micrograma
Microlitro
Micro Molar
"antes de Cristo" (Ante Christum)
Energia mínima livre ajustada
Bacterial artificial chromosome
(Cromossomo Artificial de Bactérias)
Basic Local Alignment Search Tool
Ferramenta de busca de Alinhamento
Local
Albumina sérica bovina
Cloreto de cálcio
DNA complementar
Conselho Nacional de Desenvolvimento
Científico e Tecnológico
Ácido desorribonucleico
Deoxinucleotídeo trifosfato (N= A, C, G
ou T)
Ácido etilenodiaminotetracético
Esquistossômulos mecanicamente
transformados
Etiquetas de seqüências expressas
Fundação de Amparo a Pesquisa de
Minas Gerais
Fundação de Amparo à Pesquisa do
Estado de São Paulo
Giga bases
Guanina citosina
Gene Data Bank (Banco de dados Gene)
Gene Ontology
Ontologia Gênica
Hydrophobic Cluster Analysis
Análise de clusteres hidrofóbicos
Isopropil-β-D- tiogalactosidio
Kilo bases
Kyoto Encyclopedia of Genes and
Genomes
Enciclopédia Kyoto de Genes e Genomas
KEEG orthology
Meio de cultura Luria Bertani
Mega bases
Energia livre mínima
Energia mínima livre do conjunto
termodinâmico
Índice de energia mínima livre
Miligramas
Cloreto de Magnésio
III
MgSO4
miRBase
miRNAs
mL
mRNA
NaCl
NaOAc
NaOH
NCBI
...............................................
...............................................
...............................................
...............................................
...............................................
...............................................
...............................................
...............................................
...............................................
ncRNAs
nm
nt
PB
PCR
PERL
...............................................
...............................................
...............................................
...............................................
...............................................
...............................................
PFAM
...............................................
pH
pré-miRNAs
pri-miRNAs
qRT-PCR
...............................................
...............................................
...............................................
...............................................
RefSeq
RISC
...............................................
...............................................
RNA
RT-PCR
...............................................
...............................................
SDS
stRNAs
...............................................
...............................................
TIGR
...............................................
Tris
UCSC
UTR
...............................................
...............................................
...............................................
WHO
...............................................
Sulfato de magnésio
Banco de dados de miRNAs
microRNAs
Mililitros
RNA mensageiro
Cloreto de Sódio
Acetato de sódio
Hidróxido de sódio
National Center for Biotechnology
Information
Centro Nacional para Informações
Biotecnológicas
RNAs não codificadores de proteínas
Nanômetros
Nucleotídeos
Pares de Bases
Reação em Cadeia da Polimerase
Practical Extraction and Report Language
Linguagem Prática de Extração e Geração
de Relatório
Protein families database
Banco de dados de Fmílias de Proteínas
Potencial hidrogeniônico
Precursores de miRNAs
miRNAs primários
Reação Polimerásica em Cadeia
quantitativa
Sequências de Referência
RNA-induced silence complex
(Complexo de silenciamento gênico
mediado por RNA)
Ácido ribonucléico
Transcriptase Reversa – Reação
Polimerásica em Cadeia
Sodio Dodecil Sulfato
small temporal RNAs (Pequeno RNA
temporal )
Institute for Genomic Research (Instituto
de Pesquisas Genômicas)
Tris-hidroximetilaminometano
University of California, Santa Cruz
Untranslated Region (Região não
traduzida)
World Health Organization –
Organização Mundial de Saúde
IV
LISTA DE FIGURAS
Figura 1: Esquistossomose e sua distribuição mundial (WHO, 2010) – modificado.
Figura 2: Distribuição da esquistossomose mansônica de acordo com a prevalência da
doença no Brasil – Adaptado de (Coura, 2004).
Figura 3: Ciclo de vida do S. mansoni. Dentro do seu hospedeiro vertebrado, as formas
larvais (esquistossômulo,A) dão origem a parasitos sexualmente maduros (verme adulto,B),
os quais se acasalam e produzem ovos (C) que são liberados para o meio aquático. Os ovos
eclodem e liberam os miracídios (D), que penetram nos caramujos, dando origem a
numerosos esporocistos (E). Os esporocistos geram cercárias (F) que saem do caramujo e são
liberadas na água, as quais são as formas infectantes para o hospedeiro vertebrado
(Verjovski-Almeida et al., 2003).
Figura 4: Expressão gênica estágio-específico em S. mansoni. A figura representa os genes
altamente expressos estágios-específicos baseados nos projetos transcriptoma do parasito
(Han et al., 2009).
Figura 5: Mecanismo de silenciamento gênico mediada por miRNAs. Figura 5: O
mecanismo de silenciamento gênico mediada por miRNAs ocorre em dois passos distintos:
um nuclear (a, b, c) e outro citoplasmático, sendo finalizada quando uma das fitas do duplex
encontra mi-RISC e seu respectivo mRNA alvo (d, e, f). (Adaptado de (Naqvi et al., 2009).
Figura 6: Preparação de esquistossômulos de 24 horas. Os esquistossômulos foram
cultivados por 24 horas em estufa de CO2 5% a 37ºC em meio 169 analisados em lupa de
aumento.
Figura 7: Análise em gel de agarose/formaldeído a 1%. O RNA total foi obtido utilizando
o kit SV40 a partir de vermes adultos (1), cercárias (2), esquistossômulos de 3,5 horas (3);
esquistossômulos de 24 horas (4); esquistossômulos de 48 horas(5); esquistossômulos de 72
horas (6); esquistossômulos de 5 dias (7) e esquistossômulos de 7 dias (8).
Figura 8: Plot de amplificação referente à curva de eficiência do α tubulina utilizando
diluição seriada de 4x de cDNA de cercária. Em X está demonstrado o valor dos ciclos de
PCR e em Y os valor de ∆Rn.
Figura 9: Curva padrão referente ao gene α tubulina utilizando diluição seriada de 4x de
cDNA. Em X estão demonstrados os valores de Log da concentração de cDNA e em Y os
valores de CT correspondes a cada diluição. A direita do gráfico os valores de slope e de
coeficiente de linearidade estão representados.
V
Figura 10: Curva de dissociação referente ao amplicon de SmTudor-SN. No eixo x está
representado a temperatura de dissociação do amplicon gerado pela reação de PCR e no eixo Y
a derivada do valor de emissão de fluorescência.
Figura 11: Distribuição evolutiva das proteínas XPO5, XPO1 e XPOt. Árvore
filogenética consenso baseada na sequências de resíduos de aminoácidos das proteínas XPO5
, XPO1 e XPOT. Para árvore consenso e confiabilidade dos ramos formados foram utilizados
testes de bootstrap com 2000 réplicas e mínimo de 50% para cada ramo confiável. A árvore
mostrou 3 clados distintos (separado por colchetes) sendo um para cada conjunto de proteínas
ortólogas. As proteínas evidenciadas em caixa cinza representam as proteínas identificadas
neste trabalho. A construção da árvore e a análise do “bootstrap” foram realizadas no
programa MEGA 4.0.
Figura 12: Conservação evolutiva dos domínios de XPO5, XPO1 e XPOt. As proteínas
ortólogas XPO5, XPO1 e XPOt encontradas nos organismos D. melanogaster, C. elegans e
H. sapiens e aquelas identificadas no parasito S. mansoni foram comparadas quanto a
disposição e presença de domínios conservados na estrutura primária. A descrição de cada
domínio foi representada na estrutura por um polígono indicado no rodapé da Figura
juntamente com os números PFAM. O tamanho de cada proteína está indicado no final de
cada sequência e os valores comparativos de cada domínio estão indicados a direita de cada
sequência.
Figura 13: Distribuição evolutiva das proteínas partner-Drosha e partner-Dicer. A
árvore filogenética consenso foi baseada na sequências de resíduos de aminoácidos das
proteínas partner-Drosha e partner-Dicer. Para árvore consenso e confiabilidade dos ramos
formados foram utilizados testes de bootstrap com 2000 réplicas e mínimo de 50% para cada
ramo confiável. A árvore mostrou 2 clados distintos (caixas cinza) sendo um para cada
conjunto de proteínas ortólogas. As proteínas evidenciadas em negrito representam as
proteínas identificadas neste trabalho. A construção da árvore e a análise do “bootstrap”
foram realizadas no programa MEGA 4.0.
Figura 14: Conservação evolutiva dos domínios de partner-Drosha e partner-Dicer. As
proteínas ortólogas partner-Drosha e partner-Dicer encontradas nos organismos D.
melanogaster, C. elegans e H. sapiens e aquelas identificadas no parasito S. mansoni foram
comparadas quanto a disposição e presença de domínios conservados na estrutura primária.
Cada domínio esta representado por uma caixa cinza entre o inicio e o termino dos resíduos
de aminoácidos da proteína. O tamanho de cada proteína está indicado no final de cada
sequência e os valores comparativos de cada domínio estão indicados a direita de cada
sequência.
Figura 15: Conservação evolutiva dos domínios de FMR1. As proteínas ortólogas FMR1
encontradas nos organismos D. melanogaster e aquelas identificadas no parasito S. mansoni
foram comparadas quanto a disposição e presença de domínios conservados na estrutura
primária. Cada domínio está representado por uma caixa cinza entre o inicio e o termino dos
resíduos de aminoácidos da proteína. O tamanho de cada proteína está indicado no final de
cada sequência e os valores comparativos de cada domínio estão indicados a direita de cada
sequência.
VI
Figura 16: Distribuição evolutiva das proteínas FMR1. A árvore filogenética consenso foi
baseada na sequências de resíduos de aminoácidos de proteínas ortólogas FMR1. Para árvore
consenso e confiabilidade dos ramos formados foram utilizados testes de bootstrap com 2000
réplicas e mínimo de 50% para cada ramo confiável. A árvore mostrou clados distintos
(representados por colchetes) sendo um para cada grupo de proteínas ortólogas. As proteínas
evidenciadas em caixas representam as proteínas identificadas neste trabalho. A construção
da árvore e a análise do “bootstrap” foram realizadas no programa MEGA 4.0.
Figura 17: Estruturas secundárias e resíduos hidrofóbicos das proteínas contendo
domínio SN. As proteínas termonuclease (Staphylococcal Nuclease -2SNS) e SmTudor-SN
foram representadas na forma 2D evidenciando a estrutura secundária e os resíduos
hidrofóbicos de cada porção da proteína. As estruturas secundárias foram preditas pelo
programa PredictProtein e representadas por retângulos verticais azuis as α hélices e pelos
retângulos verticais vermelhos as folhas beta. Os domínios SN foram indicados em cada
estrutura por um traço contínuo preto mostrando em suas extremidades o resíduo de
aminoácido inicial e final. Os residuos de aminoácidos foram representados pelas letras
referentes exceto prolina, glicina, serina e treonina que foram representados por ★,◆,▣ e □,
respectivamente. Os sítios catalíticos presentes na proteína 2SNS, descritos por, Ponting
(1997) foram mostrados por setas (D21, F34, D40, E43, K84, Y85 and R87). A sequência β1β2-β3-α1-β4-β5-α2-α3 foram mostradas no gráfico representando a sequência de estruturas
secundárias caracteristica de domínios SN. As estruturas secundárias foram preditas
utilizando o programa PredictProtein.
Figura 18: Estruturas tridimensionais dos domínios conservados SN em SmTudor-SN e
Staphylococcal Nuclease (2SNS). A ilustraçao em forma de desenho foi obtida atavés da
modelagem baseada em homologia no banco de dados repositório Swiss-Model. O programa
Pymol foi utilizado para exposição dos domínios SN obtidos das proteínas SmTudor-SN e
Staphylococcal Nuclease. As estruturas α hélices foram representadas pelas cores vermelho,
amarelo e azul claro e as folhas beta representadas por setas azuis e verdes.
Figura 19: Distribuição evolutiva das proteínas Tudor-SN. A árvore filogenética consenso
foi baseada na sequências de resíduos de aminoácidos de proteínas ortólogas Tudor-SN
encontradas em três diferentes reinos: Fungi, Plantae e Metazoa. Para árvore consenso e
confiabilidade dos ramos formados foram utilizados testes de bootstrap com 2000 réplicas e
mínimo de 50% para cada ramo confiável. A árvore mostrou clados distintos (representados
por colchetes) sendo um para cada reino. As proteínas evidenciadas em caixas representam as
proteínas identificadas neste trabalho. A construção da árvore e a análise do “bootstrap”
foram realizadas no programa MEGA 4.0.
Figura 20: Expressão relativa dos gene (A) SmDrosha1/2 e (B) SmExportina5.1/2 no
desenvolvimento de S. mansoni. A expressão destes genes foi avaliada nos estágios de
cercárias, esquistossômulos mecanicamente transformados (EMT-3,5 horas, EMT-24 horas,
EMT-48 horas, EMT-72 horas, EMT-5 dias, EMT-7 dias) e vermes adultos. Como
normalizador (gene constitutivo) foi utilizado o gene da α-tubulina e a expressão gênica
relativa foi determinada pelo método do 2-ΔCt. A análise estatística foi realizada utilizando o
teste de Tukey com P<0,05 no programa GraphPad Prism. As diferenças estatísticas entre os
estágios foram determinadas pelos sinais: * diferente de cercária, ** diferente de EMT-3,5
VII
horas, *** diferente de EMT-24 horas, # diferente de EMT-48 horas, ## diferente de EMT-72
horas, ### diferente de EMT-5 dias, & diferente de EMT-7 dias.
Figura 21: Expressão relativa dos gene (A) SmPartner-Dicer e (B) SmPartner-Drosha no
desenvolvimento de S. mansoni. A expressão destes genes foi avaliada nos estágios de
cercárias, esquistossômulos mecanicamente transformados (EMT-3,5 horas, EMT-24, EMT48 horas, EMT-72 horas, EMT-5 dias, EMT-7 dias) e vermes adultos. Como normalizador
(gene constitutivo) foi utilizado o gene da α-tubulina e a expressão gênica relativa foi
determinada pelo método do 2-ΔCt. A análise estatística foi realizada utilizando o teste de
Tukey com P<0,05 no programa GraphPad Prism. As diferenças estatísticas entre os estágios
foram determinadas pelos sinais: * diferente de cercária, ** diferente de EMT-3,5 horas, ***
diferente de EMT-24 horas, # diferente de EMT-48 horas, ## diferente de EMT-72 horas, ###
diferente de EMT-5 dias, & diferente de EMT-7 dias.
Figura 22: Expressão relativa dos gene (A) SmTudor-SN e (B) SmFmr1.1 no
desenvolvimento de S. mansoni. A expressão destes genes foi avaliada nos estágios de
cercárias, esquistossômulos mecanicamente transformados (EMT-3,5 horas, EMT-24 horas,
EMT-48 horas, EMT-72 horas, EMT-5 dias, EMT-7 dias) e vermes adultos. Como
normalizador (gene constitutivo) foi utilizado o gene da α-tubulina e a expressão gênica
relativa foi determinada pelo método do 2-ΔCt. A análise estatística foi realizada utilizando o
teste de Tukey com P<0,05 no programa GraphPad Prism. As diferenças estatísticas entre os
estágios foram determinadas pelos sinais: * diferente de cercária, ** diferente de EMT-3,5
horas, *** diferente de EMT-24 horas, # diferente de EMT-48 horas, ## diferente de EMT-72
horas, ### diferente de EMT-5 dias, & diferente de EMT-7 dias.
Figura 23: Mecanismo proposto da via de silenciamento gênico mediada por miRNAs
no parasito S. mansoni. A via de miRNA envolve grupos de proteínas nucleares e
citosólicas. As proteínas nucleares têm a função de expressar e processar o miRNA primário
e posteriormente exportá-lo para o citoplasma. No citoplasma, proteínas processam os
precursores de miRNA transformando-os em moléculas ativas aptas a atuarem no processo de
regulação da expressão gênica.
Figura 24: Fluxograma da abordagem computacional para identificação de miRNAs
conservados e não conservados em S. mansoni
Figura 25: miRNAs maduros em S. mansoni. A frequência de cada nucleotídeo presente
nos miRNAs maduros de S. mansoni estão indicados pelos logos U (uracila), A (adenina),C
(citosina), G (Guanina). As posições são indicadas pelos números no eixo x e o tamanho de
cada logo indica a relativa freqüência de cada nucleotídeo naquela posição específica.
Figura 26: Conservação de sma-mir-8 no grupo Bilateria. A alta fidelidade nos
alinhamentos entre os precursores sma-mir-8 e seus respectivos ortólogos de Ecdysozoa e
Lophotrochozoa foram analisadas utilizando Clustal 2.0 e RNAalifold. As formas maduras
dos miRNAs são mostradas nas caixas cinza. Os respectivos grupos taxonômicos foram
agrupados em colchetes.
VIII
Figura 27: Características estruturais e termodinâmicas de pré-miRNAs. Os valores
utilizados (A) MFE, (B) AMFE, (C) MFEI e (D) Conteúdo de GC foram baseados nos prémiRNAs depositados no banco de dados miRBase provenientes de diferentes grupos de
espécies como Animais, Bilateria, Deuterostômios, Ecdysozoa, Lophotrochozoa, S.
japonicum assim como dos pré-miRNAs identificados neste trabalho. As caixas representam
50% dos dados analisados. A extremidade mais baixa do e Box plot é o primeiro quartil ou 25
% e a extremidade mais alta representa o terceiro quartil ou 75 %. A linha horizontal dentro
da caixa representa a mediana e os valores maiores que 1,5 vezes a mediana são os “outliers”.
Figura 28: Características estruturais e termodinâmicas de pré-miRNAs. Os valores
utilizados (A) MFEE, (B) Diversidade do conjunto termodinâmico, (C) Freqüência da
estrutura de energia mínima livre no conjunto termodinâmico e (D) Tamanho foram baseados
nos pré-miRNAs depositados no banco de dados miRBase provenientes de diferentes grupos
de espécies como Animais, Bilateria, Deuterostômios, Ecdysozoa, Lophotrochozoa, S.
japonicum assim como dos pré-miRNAs identificados neste trabalho. As caixas representam
50% dos dados analisados. A extremidade mais baixa do e Box plot é o primeiro quartil ou 25
% e a extremidade mais alta representa o terceiro quartil ou 75 %. A linha horizontal dentro
da caixa representa a mediana e os valores maiores que 1,5 vezes a mediana são os “outliers”.
Figura 29: Distribuição dos preditos miRNAs nos cromossomos scaffolds de S. mansoni.
A localização relativa de cada pré-miRNAs nos cromossomos de S. mansoni (versão 5.0)
mostrou a presença destes em 7 cromossomos autossômicos e um cromossomo sexual (W).
As linhas pretas representam os pré-miRNAs em suas respectivas posições. As setas indicam
a presença dos dois clusteres encontrados em S. mansoni: sma-mir-71/2 e sma-mir71b/2.
Figura 30: Distribuição filogenética dos miRNAs em genomas animais. Os miRNAs
conservados encontrados em S. mansoni foram comparados com seus respectivos ortólogos
em espécies de animais. “X” indica a presença do miRNA em ao menos uma espécie dentro
do clado. Os quadros acima apresentam os nomes de cada família de miRNA. A filogenia
simplificada foi baseada em Jones e Blaxter, 2005 (Jones and Blaxter, 2005).
Figura 31: Análise estrutural comparativa entre sma-mir-190 e sja-mir-190. (A) O
alinhamento global das estruturas secundárias dos precursores sma-mir-190 e sja-mir-190
foram realizados utilizando os programas ClustalX 2.0 e RNAalifold. Os miRNAs maduros
mir-190-3p e mir-190-5p foram mostrados no alinhamento dentro de caixas tracejadas. (B) O
dobramento consenso das estruturas secundárias dos precursores sja-mir-190 e sma-mir-190
foi realizado utilizando RNAalifold. Os miRNAs maduros foram representados em uma caixa
amarela.
Figura 32: Distribuição evolutiva do miRNA sma-mir-8 no grupo Bilateria (a) As
relações filogenéticas foram referidas entre os precursores sma-mir-8 e seus homólogos. A
árvore filogenética foi gerada utilizando o método Neighbor-Joining, e o modelo Kimura-2parâmetros, ambos executados no programa MEGA 4.0. Os clados distintos apresentaram os
grupos Deuterostômios (miR-429, miR-200 e mir-141 genes) e o grupo Ecdysozoa
/Lophotrochozoa (mir-8 gene). Somente os “bootstrap” acima de 30 foram considerados para
2000 réplicas analisadas.
IX
Figura 33: Conservação do miRNA sma-mir-10 no grupo Bilateria (a) As relações
filogenéticas foram referidas entre os precursores sma-mir-10 e seus ortólogos. A árvore
filogenética foi gerada utilizando o método Neighbor-Joining, e o modelo Kimura-2parâmetros, ambos executados no programa MEGA 4.0. Os clados distintos apresentaram os
grupos Deuterostômios, Ecdysozoa e Lophotrochozoa. Somente os “bootstraps” acima de 30
foram considerados para 2000 réplicas analisadas. (b) A alta fidelidade nos alinhamentos
entre os precursores sma-mir-10 e seus respectivos ortólogos de Ecdysozoa e Lophotrochozoa
foram realizadas usando Clustal 2.0 e RNAalifold. As formas maduras dos miRNAs são
mostradas nas caixas cinza.
Figura 34: Conservação do miRNA dos genes sma-mir-71 e sma-mir-71b no grupo
Bilateria. (a) As relações filogenéticas foram referidas entre os precursores da família mir71. A árvore filogenética foi gerada utilizando o método Neighbor-Joining, e o modelo
Kimura-2-parâmetros, ambos executados no programa MEGA 4.0. Os clados distintos
apresentaram os grupos Deuterostômios (Cephalochordata, Echinodermata e Hemichordata),
Ecdysozoa e Lophotrochozoa. Somente os “bootstraps” acima de 30 foram considerados para
2000 réplicas analisadas. (b) A alta fidelidade nos alinhamentos entre os precursores smamir-71, sma-mir-71b e seus respectivos ortólogos de Ecdysozoa e Lophotrochozoa foram
realizadas usando Clustal 2.0 e RNAalifold. As formas maduras dos miRNAs são mostradas
nas caixas cinza.
Figura 35: Clusteres de miRNAs no genoma de S. mansoni. As estruturas secundárias dos
clusteres sma-mir-71/2 e sma-mir-71b/2 foram realizadas por RNAfold (Hofacker, 2009). A
posição nos cromossomos, tamanho e direção da fita são mostradas nas caixas cinza abaixo
da figura.
Figura 36:Árvore evolutiva e representação dos genes mir-71, mir-2 e mir-13. A árvore
representa um esquema dos genes de miRNAs mir-71, mir-2 e mir-13 na escala evolutiva. A
disposição destes genes em diversas espécies é representada por barras horizontais com seta
indicando a presença do gene. A legenda mostra as formas dispostas na figura e suas
denominações. A disposição dos ramos da árvore foi extraída de Hashimoto-Gotoh, 2009.
Figura 37: Análise conservativa das estruturas dos genes cbr-mir-2 e cel-mir-2. A
estrutura secundária dos genes é mostrada pelos sinais, “(“, “)”, “.”, acima do alinhamento
global. A estrutura do miRNA maduro conservada é mostrada pelo retângulo pontilhado
preto. A região seed do miRNA maduro é mostrada na parte inferior da figura.
Figura 38: Estruturas secundárias dos precursores de miRNAs Protostômios-específicos
mir-71, mir-2, mir-13. O programa RNAFold do pacote Vienna foi utilizado para elucidação
da estrutura secundária. Os miRNAs maduros são evidenciados por uma caixa cinza.
Figura 39: Distribuição dos valores relacionados às características (A) Conteúdo de GC
e (B) MFE dos novos precursores de miRNAs. Os valores utilizados na confecção dos
gráficos foram baseados em precursores de miRNAs depositados no banco de dados
miRBase. Os nomes dos novos miRNA estão representados em cada gráfico do grupo de
miRNA correspondente. As caixas representam 50% dos dados analisados. A extremidade
mais baixa representa o primeiro quartil ou 25 % dos dados e a extremidade mais alta
X
representa o terceiro quartil ou 75 % dos dados. A linha horizontal dentro da caixa representa
a mediana e os valores maiores que 1,5 vezes a mediana são os “outliers”.
Figura 40: Distribuição evolutiva dos novos mir-13 no grupo Protostômios. As relações
filogenéticas foram referidas entre os novos precursores de mir-13 e seus homólogos. A
árvore filogenética foi gerada utilizando como método Neighbor-Joining, como modelo
Kimura-2-parâmetros e executada no programa MEGA 4.0. Os clados distintos apresentaram
os grupos mir-13a e mir-13/13b. Somente “bootstrap” acima de 30 foram considerados para
2000 réplicas analisadas.
Figura 41: Conservação dos novos mir-13 no grupo Protostômios O alinhamento múltiplo
de sequência entre os precursores de mir-13 e seus respectivos ortólogos de Ecdysozoa e
Lophotrochozoa foram realizadas usando ClustalX 2.0 e RNAalifold. As formas maduras dos
miRNAs são mostradas nas caixas cinza.
Figura 42: Conservação dos novos mir-71 no grupo Protostômios (a) As relações
filogenéticas foram referidas entre os novos mir-71 e seus ortólogos. A árvore filogenética foi
gerada utilizando como método Neighbor-Joining, como modelo Kimura-2-parâmetros e
executada no programa MEGA 4.0. Os clados distintos apresentaram os grupos
Deuterostômios, Ecdysozoa e Lophotrochozoa. Somente “bootstraps” acima de 30 foram
considerados para 2000 réplicas analisadas (b) O alinhamento múltiplo de sequência entre os
precursores de mir-71 e seus respectivos ortólogos de Ecdysozoans e Lophotrochozoans
foram realizadas usando ClustalX 2.0 e RNAalifold. As formas maduras dos miRNAs são
mostradas nas caixas cinza.
Figura 43: miRNAs maduros da família mir-2. Representação Weblogo das sequências
maduras dos miRNAs mir-2 e as sequências maduras dos novos miRNAs identificados. A
caixa cinza corresponde a região seed dos miRNAs maduros entre os nucleotídeos 2 e 8.
Figura 44: miRNAs maduros da família mir-13. Representação Weblogo das sequências
maduras dos miRNAs mir-13 e as sequências maduras dos novos miRNAs identificados. A
caixa cinza corresponde a região seed dos miRNAs maduros entre os nucleotídeos 2 e 8.
Figura 45: miRNAs maduros da família mir-71. Representação Weblogo das sequências
maduras dos miRNAs mir-71 e as sequências maduras dos novos miRNAs identificados. A
caixa cinza corresponde a região seed dos miRNAs maduros entre os nucleotídeos 2 e 8.
Figura 46: RNA total obtido a partir de formas evolutivas do S. mansoni. O RNA total
foi obtido utilizando o kit SV40 a partir de verme adulto (1) e cercária (2)
Figura 47: Plot de amplificação referente à curva de eficiência do gene α tubulina. Em X
está demonstrado o valor dos ciclos de PCR e em Y os valor de ∆Rn. Foi utilizado cDNA de
cercária e uma diluição seriada de 4 vezes.
Figura 48: Curva padrão referente ao gene α tubulina. Em X estão demonstrados os
valores de Log da concentração de cDNA e em Y os valores de CT correspondes a cada
XI
diluição. Os valores de slope e de coeficiente de linearidade estão representados a direita do
gráfico. Foi utilizado cDNA de cercária e uma diluição seriada de 4 vezes.
Figura 49: Representação dos termos “GO” associados aos alvos de miRNAs em S.
mansoni. Os termos GO foram contados por contagem única representando um total de 127
termos ancestrais GO-Slim.
Figura 50: Expressão gênica dos miRNAs, conservados e não conservados, identificados
no genoma de S. mansoni. Os genes (a) sma-mir-124-3p, (b) sma-mir-8-3p, (c) sma-mir-363p, (d) sma-mir-61, (e) sma-mir-125a, (f) sma-mir-190-5p, (g) sma-mir-3479-3pe
(conservados) e (h) sma-mir-new10-5p (não conservado) foram avaliados quanto a expressão
gênica por qRT-PCR nas fases de cercária, esquistossômulo de 3,5 horas e 24 horas e vermes
adultos fêmeas e machos. Como normalizador (gene constitutivo) foi utilizado o gene da U6
e a expressão gênica relativa foi determinada pelo método do 2-ΔCt. A análise estatística foi
realizada utilizando o teste de Tukey com p<0,05 no programa GraphPad Prism. As
diferenças estatísticas entre os estágios foram determinadas pelos sinais: * diferente de
cercária, ** diferente de EMT-3,5 horas, *** diferente de EMT-24 horas, # diferente de
vermes fêmea.
Figura 51: Expressão gênica relativa dos genes alvos Sinoviolina e Inexina. As
expressões relativas dos genes sinoviolina e inexina foram analisadas utilizando Real Time
PCR nas fases cercária e vermes adultos. Como normalizador (gene constitutivo) foi utilizado
o gene da α-tubulina e a expressão gênica relativa foi determinada pelo método do 2-ΔCt. A
análise estatística foi realizada utilizando o teste de Tukey com P<0,05 no programa
GraphPad Prism. As diferenças estatísticas entre os estágios foram determinadas pelos sinais:
* diferente de cercária.
Figura 52: Controle da expressão gênica em S. mansoni. A contribuição dos mecanismos
pós-transcricionais, como silenciamento gênico mediado por miRNAs, tem sido mais efetiva
no controle da expressão gênica em estágios larvais do parasito S. mansoni. Os retângulos
vermelhos tracejados representam as relativas expressões dos genes da via de miRNAs e de
seus efetores.
XII
LISTA DE TABELAS
Tabela 1: Hospedeiros intermediários e região de maior endemicidade dos parasitos do
gênero Schistosoma.
Tabela 2- Meio 169 com seus componentes e concentração.
Tabela 3: Sequência de primers forward e reverse referente aos genes avaliados, tamanho
do amplicon gerado, eficiência e R2 dos primers utilizados avaliado através de uma
curva de eficiência.
Tabela 4: Expansão dos genes envolvidos na via de silenciamento gênico mediada por
miRNAs no genoma de S. mansoni.
Tabela 5: Comparação entre o repertório de miRNAs identificados neste trabalho e os
identificados por Simões, 2011.
Tabela 6: miRNAs maduros em S. mansoni.
Tabela 7: Comparação das características dos pré-miRNAs de Lophotrochozoa e S.
mansoni.
Tabela 8: Pré-miRNAs de S. mansoni e suas características estruturais e
termodinâmicas.
Tabela 9: Localização dos preditos pré-miRNAs no genoma e nos cromossomos
scaffolds de S. mansoni.
Tabela 10: Sequências preditas dos miRNAs maduros, miRNA mir-2, mir-13 e mir-71,
seus respectivos ortólogos no miRBase e suas predições pelos programas MapMi e
Mirortho.
Tabela 11: Características estruturais e termodinâmicas dos novos precursores
Protostômios-específicos.
Tabela 12: Número de acesso das sequências e oligonucleotídeos iniciadores referentes
aos miRNAs avaliados.
Tabela 13: Número de acesso das sequências e oligonucleotídeos iniciadores referentes
aos alvos de miRNAs.
Tabela 14: Número de prováveis RNA mensageiros alvos dos miRNAs maduros
identificados no genoma de S. mansoni.
XIII
Tabela 15: Ontologia gênica de miRNA em S. mansoni.
Tabela 16: Associação entre os miRNAs identificados em S. mansoni, alvos preditos no
genoma e alguns identificadores.
Tabela 17: Alvos preditos em S. mansoni e S. japonicum usando conservação evolutiva
do pareamento miRNA/3`UTR.
.
XIV
INTRODUÇÃO
CAPÍTULO I
INTRODUÇÃO
1
INTRODUÇÃO
I.1 Esquistossomose
I.1.1 Histórico
Embora descoberta em 1851 pelo patologista alemão Theodore Bilharz, o qual
confirmou a presença do verme conhecido atualmente como Schistosoma hematobium nas
veias mesentéricas de um camponês egípcio autopsiado, ovos de Schistosoma foram
encontrados em múmias egípcias datadas de 3500 a.C. Apesar da síndrome de Katayama ter
sido descrita por Fuji em 1847, quatro anos antes da descoberta de Bilharz, ela somente foi
identificada como a forma aguda de infecção pelo S. japonicum tempos depois(Fuji, 1847).
Em 1902, Manson encontrou ovos com espícula lateral em pacientes das Antilhas, admitindo
a existência de uma nova espécie de Schistosoma, a qual foi classificada como S. mansoni
por Sambon em 1907 (Manson, 1902; Sambon, 1907). Esta mesma espécie teve sua presença
confirmada no Brasil, através da descrição de quatro casos, registrados pelo médico e
pesquisador Manuel Augusto Pirajá da Silva, 1908, no artigo intitulado “Contribuição para o
estudo da Schistosomíase na Bahia”(Pirajá da Silva, 1908; Passos, 1998).
A palavra Schistosoma é derivada do grego que significa literalmente “corpo
fragmentado”, referindo-se a anatomia dióica da maioria das espécies. Existem seis espécies
dentro do gênero Schistosoma que infectam seres humanos: S. mansoni, S. hematobium, S.
japonicum, S. intercalatum, S. mekongi e S. malayensis; entretanto, somente uma delas, S.
mansoni, existe no Brasil.
Em 1914, os moluscos do gênero Oncomelamia foram apontados como hospedeiros
intermediários de S. japonicum; em 1915, Leiper identificou Bulinus e Biomphalaria, na
África, como hospedeiros intermediários de S. hematobium e S. mansoni, respectivamente
(Coura, 2004). A tabela 1 mostra os hospedeiros intermediários e a região de maior
endemicidade do parasito. Das dez espécies e subespécies do gênero Biomphalaria descritas
apenas três são hospedeiros naturais do parasito (B. glabrata, B. tenagophila, B. straminea) e
duas (B. amazonica, B. peregrina) consideradas hospedeiros potenciais por terem sido
somente infectados experimentalmente (Paraense, 1966; Paraense, 1981).
2
INTRODUÇÃO
Tabela 1: Hospedeiros intermediários e região de maior endemicidade dos parasitos do
gênero Schistosoma.
Parasito Schistosoma
S. mansoni
Hospedeiro
intermediário
Biomphalaria
S. mekongi
S. intercalatum
S. japonicum
S. haematobium
Tricula
Bulinus
Oncomelania
Bulinus
Região de endemicidade
África, Oriente Médio, Caribe e Sul
da Ásia
Ásia
África
Ásia
África e Oriente Médio
I.1.2 Distribuição geográfica
I.1.2.1 Mundo
A esquistossomose ou barriga d’água é uma doença crônico-debilitante causada por
parasitos platelmintos do gênero Schistosoma. De acordo com a Organização Mundial de
Saúde, a esquistossomíase é uma doença milenar que atualmente tem afetado mais de 207
milhões de indivíduos distribuídos em 76 países nos continentes africano, asiático e
americano (Figura 1)(WHO, 2010). No entanto, o número de países onde existe a transmissão
da esquistossomose tem diminuído nos últimos anos devido à utilização de intervenções
públicas no controle da doença. A esquistossomose é mais prevalente no continente africano
onde vivem aproximadamente 90% dos indivíduos infectados. Entre estes, 10% apresentam a
forma severa da doença e aproximadamente 50% (em torno de 100 milhões de indivíduos)
exibem manifestações clínicas da doença, constituindo um sério problema de saúde pública.
Também vale destacar que, anualmente, ocorrem de 250 a 300 mil mortes em decorrência
desta parasitose estimando-se que 500 a 600 milhões de pessoas estão em risco de
contaminação (WHO, 2010).
3
INTRODUÇÃO
Figura 1: Esquistossomose e sua distribuição mundial (WHO, 2010) – modificado.
I.1.2.2 Brasil
No Brasil, acredita-se que a esquistossomose mansônica tenha sido introduzida
através do tráfico negreiro, tendo como porta de entrada o estado da Bahia. O fluxo
migratório que se seguiu em virtude da colonização do país, aliado a não realização de
inquéritos coproscópicos por quase meio século no Brasil, contribuíram de maneira
significativa, para a disseminação do parasito no país. Além disso, a exploração inadequada
de recursos hídricos, a distribuição ampla dos hospedeiros intermediários, a longevidade da
doença e a falta de educação em saúde também foram somatórios para esta propagação da
esquistossomose (Coura, 2004).
Considera-se como área endêmica no Brasil a região que compreende o estado do
Maranhão até o Espírito Santo, incluindo Minas Gerais. Observam-se também focos isolados
no Distrito Federal e nos estados do Pará, Piauí, Goiás, Rio de Janeiro, São Paulo, Paraná,
Santa Catarina e Rio Grande do Sul (Figura 2) (Coura, 2004).
4
INTRODUÇÃO
Figura 2: Distribuição da esquistossomose mansônica de acordo com a prevalência da
doença no Brasil – Adaptado de (Coura, 2004).
1.2 O ciclo biológico de S. mansoni
O parasito S. mansoni pertence à família Schistosomatidae, classe Trematoda,
subclasse Digenea e gênero Schistosoma. Este gênero se difere dos outros da mesma
subclasse por apresentar sexos separados (Rey, 2001). O ciclo de vida deste parasito, descrito
por Leiper em 1915, é do tipo heteroxênico envolvendo uma passagem por um hospedeiro
invertebrado, representado por moluscos do gênero Biomphalaria e um hospedeiro definitivo,
representado pela espécie humana, conforme Figura 3 (Verjovski-Almeida et al., 2003).
Uma vez na água, e sob os estímulos de luz e temperatura apropriadas, os ovos
eclodem liberando a forma larval infectante denominada miracídio. Neste estágio, a larva
miracídio, nada ativamente até encontrar o hospedeiro invertebrado, caramujo do gênero
Biomphalaria, penetrando em seu tecido mole. Imediatamente após penetrar na hemocele do
caramujo, o miracídio sofre metamorfose, transformando se em esporocisto-mãe. Neste
estágio o parasito necessita de grande aporte de alimento, mas, como ainda não possui tubo
5
INTRODUÇÃO
digestivo, adquire seus nutrientes por difusão ou transporte ativo. Os esporocistos mãe
desenvolvem-se por multiplicação assexuada gerando numerosos esporocistos-filhos ou
esporocistos secundários que irão migrar para o hepatopâncreas do caramujo onde
continuarão dando origem à terceira geração de larvas, denominadas cercárias. Atingida a
maturidade, estas migram através da hemocele do caramujo para a cavidade do manto,
abandonando o caramujo e migrando para a água doce. A cercária possui órgão anterior ou
ventosa oral, segmento do corpo e cauda bifurcada para propulsão. Esta última região da
cercária, no seu processo de penetração no hospedeiro definitivo, é eliminada. não se
alimentando no meio externo possuindo vida curta. Nesta fase a principal fonte de energia
para a larva são os estoques de carboidratos principalmente glicogênio (Wilson and Barnes,
1979).
O homem infecta-se por contato com água que contenha cercária. A cercária de
Schistosoma deve ultrapassar uma importante barreira mecânica oferecida pela pele do
mamífero. Para este fim, a larva infectante é equipada com dois pares de células glandulares,
situadas em posição anterior à ventosa ventral e três pares posteriores a ela. O conteúdo
destas glândulas é secretado através de ductos que se abrem na porção anterior da larva. O
conjunto posterior de glândulas secreta principalmente muco para auxiliar na aderência à pele
(Dorsey et al., 2002).
Após a infecção, ocorrem algumas alterações estruturais no parasito em decorrência
da mudança de ambiente. Além da perda da cauda o parasito modifica o tipo de respiração
(aeróbica para anaeróbica), altera o glicocálix e se metamorfeia atingindo o estágio de
esquistossômulo. Os esquistossômulos permanecem nos tecidos da apiderme e derme por 2 a
3 dia. Por volta do quarto dia, se os esquistossômulos não forem destruídos pelo sistema
imune do hospedeiroos eles penetram nos vasos sanguíneos sendo carregados passivelmente
em direção aos pulmões e coração. Por volta do sétimo e nono dia após a infecção eles
atingem o pulmão (Clegg, 1965). A partir do oitavo dia o verme passa por diversos órgãos e
já podem ser localizado no sistema porta intra-hepático, onde se alimentam do sangue do
hospedeiro definitivo, iniciam a divisão celular crescendo e amadurecendo até o final da
terceira-quarta semana (REY, 2001). Decorridas aproximadamente quatro semanas, os
vermes se acasalam e começam o processo de oviposição (Cunha, 1970; Roberts, 2000).
A partir deste momento, a resposta do hospedeiro mamífero à produção de ovos pelas
fêmeas dá origem a patogenia da esquistossomose. A simples presença dos vermes adultos no
sistema porta-hepático não oferece risco à saúde humana devido ao fato dos parasitas não se
multiplicarem neste habitat. Entretanto, a produção de aproximadamente 300 ovos/dia/fêmea
6
INTRODUÇÃO
e a conseqüente liberação de antígenos solúveis pelo ovo no tecido hepático, induz o
aparecimento de uma intensa reação inflamatória em torno do ovo, a qual posteriormente, por
um processo de fibrose dará origem ao granuloma. Hipertensão portal, esplenomegalia e
ascite são ao longo prazo, características marcantes da infecção pelo S. mansoni (Caldas et
al., 2008).
A Figura 3 ilustra as macroestruturas formadas nos 3 diferentes habitats do parasito,
hospedeiro definitivo, hospedeiro intermediário e ambiente aquático enfatizando os aspectos
macromorfológicos distintos de cada estágio.
Figura 3: Ciclo de vida do S. mansoni. Dentro do seu hospedeiro vertebrado, as formas
larvais (esquistossômulo,A) dão origem a parasitos sexualmente maduros (verme adulto,B),
os quais se acasalam e produzem ovos (C) que são liberados para o meio aquático. Os ovos
eclodem e liberam os miracídios (D), que penetram nos caramujos, dando origem a
numerosos esporocistos (E). Os esporocistos geram cercárias (F) que saem do caramujo e
7
INTRODUÇÃO
são liberadas na água, as quais são as formas infectantes para o hospedeiro vertebrado
(Verjovski-Almeida et al., 2003).
I.3 Genômica e Transcriptômica de S. mansoni
Os primeiros estudos envolvendo o genoma de S. mansoni foram realizados por
Simpson em 1982. Ele estimou o tamanho do genoma haplóide do parasito em
aproximadamente 2.7 × 108 pares de bases e a porcentagem de sequências repetitivas no
genoma em aproximadamente 40% do total (Simpson et al., 1982). Somando esforços para o
entendimento do genoma do parasito, Le Paslier construiu uma biblioteca de fragmentos
genômicos em vetores BAC para a elucidação de sequências genômicas e aplicação de
técnicas de hibridização (Le Paslier et al., 2000).
Até o final de 2003 nenhum projeto em larga escala envolvendo análise do genoma ou
transcriptoma tinham sido executados para Platelmintos e menos de 20.000 etiquetas de
sequências expressas (ESTs), representando genes do parasito S. mansoni, tinham sido
obtidas (Franco et al., 1995; Franco et al., 1997; Rabelo et al., 1997; Franco et al., 2000). No
entanto, no final de 2003, um projeto em larga escala liderado pelas agências FAPESP e
CNPq permitiram a obtenção de 200.000 sequências que foram agrupadas em 30.000 contigs
(conjuntos não redundantes de sequências expressas) e tornadas públicas através do projeto
“S. mansoni EST Genome” (Verjovski-Almeida et al., 2003). Foram estimados 14000 genes
neste conjunto de dados apresentando diversos padrões de expressão nas diferentes fases do
parasito (Verjovski-Almeida et al., 2003). Em 2009, o Wellcome Trust Sanger Institute e o
TIGR finalizaram a montagem do genoma do S. mansoni sem seu completo fechamento.
Estes
dados
estão
disponíveis
no
website
do
banco
de
dados
GeneDB
(http://www.genedb.org) e no NCBI (http://www.ncbi.nih.gov) (Berriman et al., 2009).
O genoma do S. mansoni compreende 363 mega bases, distribuídos em oito pares de
cromossomos, sendo sete pares autossômicos e um par sexual. O sexo heterogamético no
parasito é a fêmea (ZW), enquanto o macho é homogamético (ZZ) (Short and Menzel, 1960;
Short et al., 1979; Berriman et al., 2009). Foram estimados 11890 genes, com um tamanho
médio de 4,7 kb, apresentando regiões intrônicas de tamanho bastante variável. As análises
de genômica comparada em larga escala sugerem que este arranjo gênico é específico de S.
mansoni. A discrepância nos tamanhos dos íntrons ainda é pouco entendida, mas sugere um
controle transcricional distinto. Vale à pena ressaltar que, este conjunto de 11890 genes
representa o repertório gênico de seis estágios de vida do parasito. Desta maneira, sua análise
8
INTRODUÇÃO
não se restringe a apenas um estágio de vida refletindo toda complexidade do parasito
(Berriman et al., 2009).
Outra característica do genoma de S. mansoni é o grande número de elementos
repetitivos que somam aproximadamente 40 %. Apesar de até o momento não ser conhecida
o impacto desses elementos na biologia do parasito, este percentual tem dificultado o
fechamento do genoma gerando fragmentação em scaffolds. Este percentual está bem
próximo do encontrado no genoma de seres humanos onde se estima que mais de dois terços
do genoma sejam elementos repetitivos (de Koning et al., 2011). Atualmente, o genoma de S.
mansoni está fragmentado em 885 scaffolds depositados no genoma versão 5.0 do GeneDB.
Esta nova versão do banco de dados disponibiliza uma classificação funcional dos transcritos
preditos e sequenciados pelo Gene Ontology (GO). Esta representação gênica confirma a
presença de genes associados e/ou homólogos a eucariotos e processos específicos dos
metazoários, como diferenciação eixo anterior-posterior, dorso-ventral, epitélio, processo
neural, mobilidade, diferenciação sexual, maturação, longevidade, parasitismo, evasão imune
e resposta ao estresse.
Atualmente, com a disponibilidade de quase 200.000 ESTs, aliado ao projeto genoma
do S. mansoni, em fase final de conclusão, o Schistosoma integra-se à categoria dos
organismos com os quais se podem utilizar técnicas modernas para, por exemplo, identificar
genes estágios-específicos, avaliação global dos efeitos causados por drogas sobre o
metabolismo do parasita, entre outros (Oliveira et al., 2008; Berriman et al., 2009). Neste
contexto, surge a possibilidade do estudo dos transcritos nas diferentes fases de ovos,
cercária, miracídio, esquistossômulos, esporocistos e vermes adultos, permitindo a
identificação de genes estágios-específicos bem como as vias de regulação da transcrição
envolvidas durante o ciclo biológico deste parasito.
I.4 Regulação da expressão gênica em S. mansoni
A regulação da expressão gênica em eucariotos compreende processos envolvidos
com a síntese e degradação dos RNAs mensageiros direcionando e modulando os caminhos
da informação contida no DNA até o produto gênico final. Os processos de controle da
expressão gênica ocorrem principalmente ao nível transcricional e pós-transcricional. Os
principais mecanismos de controle transcricional estão relacionados com a estrutura da
cromatina. Processos como modificação de histonas (acetilação, metilação e deacetilação) e
metilação de DNA desempenham um papel essencial no empacotamento de cromatina e
9
INTRODUÇÃO
consequentemente no controle da expressão gênica ao nível transcricional (Berger, 2007).
Processos pós-transcricionais envolvem principalmente interações proteína-RNA e RNARNA desencadeando um arraste na expressão do gene ou sua degradação. Estes processos
pós-transcricionais podem envolver adição de cauda poli-A, adição de 5`CAP, splicing,
edição do transcrito primário e silenciamento gênico por pequenos RNAs (Keene, 2007).
O S. mansoni apresenta um ciclo biológico bastante peculiar, no qual diversas
alterações bioquímicas e morfológicas ocorrem no parasito para que ele complete um ciclo
biológico. Acredita-se que estas mudanças são adaptações evolutivas desenvolvidas pelo
parasito para sobrevivência em distintos ambientes, como na água e interior dos hospedeiros.
sendo possível apenas devido a expressão de um conjunto de genes coordenadamente, em
cada estágio, a fim de permitir a adaptação do parasito aos seus ambientes. Trabalhos
recentes têm mostrado que o perfil de transcritos e a atividade transcricional no parasito S.
mansoni modificam significantemente entre seus diferentes estágios (Fitzpatrick et al., 2009).
Uma das formas viáveis e de mais fácil alcance para estudar o padrão de expressão gênica é o
estudo do transcriptoma. Este tem propiciado a descoberta de novos genes, elaboração de
modelos gênicos, desenho de sondas de microarranjos, clonagem de genes de interesse e
outras informações pertinentes para o entendimento da biologia da célula (Brindley and
Pearce, 2007; Wilson et al., 2007). Plataformas de microarranjos e SAGE (Serial analysis of
gene expression) vêm sendo utilizadas extensivamente para analisar o transcriptoma do
parasito evidenciando padrões de expressão de genes estágio-específico (DeMarco et al.,
2006; Ojopi et al., 2007; Parker-Manuel et al., 2011). A expressão transitória de genes é
totalmente dependente das funções e atividades realizadas pelo organismo em determinado
estágio de vida. Por exemplo, genes envolvidos com o remodelamento corporal e formação
de tegumento externo se mostraram altamente expressos em esquistossômulos (ParkerManuel et al., 2011).
De maneira particular, o período de transformação de cercária em esquistossômulo,
deve ser ressaltado devido à grande mudança no perfil de expressão gênica representado
nesta fase. Durante esse período, ocorrem várias mudanças morfológicas e bioquímicas como
perda da cauda, secreção do conteúdo da glândula acetabular, duplicação da bicamada
lipídica da superfície, perda do glicocálix, mudança do núcleo heterocromático para
eucromático, intolerância à água e às proteínas da via do complemento do sistema imune e
redução no catabolismo do piruvato (Ramalho-Pinto et al., 1974; Blanton et al., 1987). Sabese que a diferenciação na composição de proteínas específicas entre esses dois estágios está
10
INTRODUÇÃO
relacionada a alterações na regulação da expressão gênica (Han et al., 2009). A figura 4
resume a distribuição dos genes estágios-específicos em S. mansoni.
Figura 4: Expressão gênica estágio-específico em S. mansoni. A figura representa os genes
altamente expressos estágios-específicos baseados nos projetos transcriptoma do parasito
(Han et al., 2009).
Em conjunto, a expressão de diferetes repertórios gênicos em distintas fases do
parasito sugerem que os mecanismos de regulação da expressão gênica estão presentes em S.
mansoni. Neste contexto, na última década, o mecanismo de silenciamento gênico mediado
pelo decaimento de RNA mensageiros tem recebido muita atenção, uma vez que este foi
demonstrado sua participação em processos de regulação da expressão gênica ao nível póstranscricional (Bartel, 2009). Os mecanismos de silenciamento gênico mediado por pequenos
RNAs, que tem como principal exemplo os miRNAs, tem mostrado estreita correlação com
controle de genes envolvidos no desenvolvimento de organismos, manutenção da integridade
de genoma e diversos processos celulares (Bartel, 2009). Esta característica tem sido
11
INTRODUÇÃO
empregada na tecnologia de RNA interferente desvendando soluções para genética reversa,
genômica funcional, terapia gênica, desenvolvimento de animais modelo, estudos do
comportamento, validação de alvos para novas drogas e o combate a patógenos (Denli and
Hannon, 2003; Baum and Craig, 2004).
I.5 microRNAs
I.5.1 Histórico e Origem
Os microRNAs foram descobertos em 1993 por Victor Ambros, Rosalind Lee e
Rhonda Feinbaum durante um estudo sobre a participação do gene lin-14 no desenvolvimento
do nematódea Caenorhabditis elegans que levou a descoberta de que este gene era regulado
por um pequeno RNA, transcrito como um precursor com 61 nucleotídeos a partir do gene
lin-4. Este estudo também evidenciou que esta pequena molécula de RNA continha
sequências parcialmente complementares à região 3´UTR do mRNA lin-14 e que esta
complementaridade era suficiente e necessária para inibir a tradução do mRNA lin-14. (Lee
et al., 1993). Esta descoberta permitiu a caracterização de um novo mecanismo de regulação
da expressão gênica liderado por pequenos miRNAs maduros de aproximadamente 22
nucleotídeos. Entretanto, somente em 2000, foi descoberto um segundo miRNA, let-7, que
reprimia a tradução de lin-41, lin-14, lin28, lin42 e daf12 atuando durante os estágios de
desenvolvimento larval do C. elegans (Reinhart et al., 2000). Devido ao papel de ambos
miRNAs no controle do desenvolvimento, foram também denominados de pequenos RNAs
temporais, ou small temporal RNAs (stRNAs)(Ambros, 2000).
Nos últimos anos, o principal papel dos miRNAs tem sido correlacionado com o
controle do crescimento celular. Diversos estudos tem mostrado o envolvimento dos miRNAs
com o câncer atuando como supressores de tumor ou como oncogenes sendo chamados de
oncomirs (Esquela-Kerscher and Slack, 2006; Kozaki et al., 2008; Schmittgen, 2008; Wong
et al., 2008). Alguns miRNAs, considerados ongênicos, se apresentam altamente expressos
em células malignas estimulando a proliferação celular ou inibindo a ação de genes
supressores tumorais. Outros apresentam baixa expressão em tumores malignos
provavelmente atuando como supressores tumorais de oncogenes. Como exemplos temos os
genes mir-15 e mir-16 que atuam como supressores de tumores induzindo a apoptose e
evitando a proliferação celular (Esquela-Kerscher and Slack, 2006). Os miRNAs presentes no
12
INTRODUÇÃO
cluster mir-17-92 atuam como oncogenes modulando a formação de tumor por influência na
tradução do gene E2F1 (Hayashita et al., 2005).
O modelo atual para a biogênese de miRNAs propõe duas etapas: uma intranuclear e
uma citoplasmática e encontra-se esquematizada na Figura 5. Na etapa intranuclear os
miRNAs podem ser transcritos individualmente por uma RNA polimerase (II principalmente
e ocasionalmente III) ou a partir de blocos de sequências genômicas denominadas clusteres
(Zhang et al., 2009b). Estes miRNAs se formam a partir de um produto primário complexo,
com várias características peculiares, tornando-os reconhecíveis pela maquinaria no meio
intranuclear. Geralmente, os pri-miRNAs são processados liberando um intermediário com
estrutura secundária em forma de grampo com aproximadamente 60-70 nt, denominado prémiRNA (precursor de miRNA). Esta clivagem é realizada por um micro complexo liderado
pela enzima RNase III Drosha, que cliva ambas as fitas do pri-miRNA em sítios próximos à
base da estrutura em forma de grampo, gerando um pré-miRNA (Lee et al., 2003).
A seguir, o pré-miRNA é transportado de forma ativa, com gasto de GTP, do núcleo
para o citoplasma, pelo complexo Ran-GTP/Exportina-5. Para tal transporte, têm sido
relatadas duas proteínas responsáveis: XPO-5 e XPO-1 (Castanotto et al., 2009; Bussing et
al., 2010). A direção deste transporte, geralmente, é unidirecional, sempre do núcleo para o
citoplasma. Recentemente, foi sugerida a participação da proteína XPO-1 no transporte
também de miRNAs em D. melanogaster e C. elegans, no sentido inverso, do citoplasma
para o núcleo (Castanotto et al., 2009; Bussing et al., 2010). O pré-miRNA, após o transporte
para o citoplasma, é processado pela enzima Dicer, juntamente com uma proteína ligante de
RNA fita dupla, que em D. melanogaster é chamada Loquacious e R2D2, e em C. elegans,
R3D1 (Saito et al., 2005). De acordo com este modelo, a especificidade da primeira clivagem
determina a posição correta da segunda clivagem do pré-miRNA, definindo assim, ambas as
extremidades do miRNA (Lee et al., 2003).
Estes processos de clivagem executados por proteínas da classe RNAse III são
facilitados por proteínas acessórias. A atuação destas proteínas acontece conjuntamente com
a proteína RNAseIII Drosha, para clivagem nuclear, e RNAseIII Dicer, para clivagem
citoplasmática (Han et al., 2006; Winter et al., 2009). Estudos anteriores têm demonstrado a
participação essencial destas proteínas auxiliares na biogênese dos miRNAs nas células
(Denli et al., 2004; Leuschner et al., 2005; Saito et al., 2005). Ambas as proteínas, partnerDrosha e partner-Dicer, invariavelmente, possuem um domínio conservado com função e
característica de ligação em pequenos RNAs. Após esta clivagem, o miRNA maduro é
apresentado para o complexo de silenciamento mediado por RNA, denominado mi-RISC.
13
INTRODUÇÃO
Inicialmente, os miRNAs foram encontrados em associação com um complexo
ribonucleoprotéico denominado miRNP (miRNA ribonuclein complex), que em humanos
inclui a proteína Ago1, a helicase GEMIN3 e GEMIN4 e em D. melanogaster inclui a Ago1,
Fmr1, Tudor-SN e VIG (Mourelatos et al., 2002; Meister and Tuschl, 2004). Desta forma, foi
sugerido que o complexo miRNP corresponde ao RISC, que direciona a clivagem de mRNAs
no mecanismo de silenciamento de RNA por meio do decapeamento e retirada da cauda de
poli-A.
Uma vez incorporado ao RISC, o miRNA vai direcionar a clivagem específica de
mRNAs complementares ou reprimir sua tradução em corpos citoplasmáticos chamados
corpos P (Meister and Tuschl, 2004; Naqvi et al., 2009) (Figura 5). miRNAs em animais,
geralmente, atuam como repressores da tradução de determinados genes por pareamento não
perfeito na região 3`UTR, embora, outros estudos tem mostrado sítios funcionais em regiões
codificadoras e/ou regiões 5`UTR (Lai, 2002; Lytle et al., 2007).
Vale a pena ressaltar que, recentemente, foi descrita uma via alternativa de
processamento de miRNA à partir de regiões intrônicas. Este miRNAs, denominados
mirtrons, são processados diretamente a pré-miRNAs pela maquinaria de splicing evitando a
primeira passagem pelo complexo enzimático comandado pela proteína RNAseIII Drosha
(Westholm and Lai, 2011). Posteriormente o processamento do miRNA de origem intrônica
segue a mesma via descrita acima e ilustrada pela Figura 5.
Figura 5: Mecanismo de silenciamento gênico mediada por miRNAs. O mecanismo de
silenciamento gênico mediada por miRNA ocorre em dois passos distintos: um nuclear (a, b,
c) e outro citoplasmático, sendo finalizada quando uma das fitas do duplex encontra mi-RISC
e seu respectivo mRNA alvo (d, e, f). (Adaptado de (Naqvi et al., 2009).
14
INTRODUÇÃO
I.5.2 Estratégias de Predição e Validação de miRNAs
A descoberta dos miRNAs, seja por estratégias computacionais ou experimentais, não
tem sido considerada uma tarefa fácil trazendo vários problemas associados. Os problemas
dirigidos à predição e validação dos miRNAs, a partir de sequências genômicas e/ou
transcriptômicas, tem como exemplos: a presença de RNA não codificadores de proteínas
com características semelhantes aos miRNAs, posição e orientação não conservada dos
miRNAs no genoma, tamanho pequeno das sequências maduras e precursoras, baixa
expressão relativa em alguns organismos ou estágios de vida, presença de miRNAs estágio ou
espécie específicos, entre outros. Devido a este grande número de fatores, a construção de
metodologias robustas e específicas (às vezes organismo-específico) se torna necessária,
tanto para predição e validação dos miRNAs quanto para seus alvos.
O número de genes que codificam miRNAs inicialmente foram subestimados em
menos de 1% do número total de genes (Lim et al., 2003). Em trabalhos posteriores, este
número cresceu exponencialmente tornando esta classe de RNA uma das maiores classes de
moléculas regulatórias em animais (Berezikov et al., 2005). Atualmente, C. elegans e D.
melanogaster, possuem mais de 200 genes que codificam miRNAs, enquanto seres humanos
possuem aproximadamente 1500 genes (miRBase versão 18.0 – outubro 2011).
A busca e identificação de miRNAs baseados em abordagens experimentais tem sido
um desafio para comunidade científica (Huttenhofer and Vogel, 2006). As técnicas mais
comuns utilizadas para identificação de sequências de DNA ou RNA são limitadas para este
tipo de molécula (Winter and Diederichs, 2011). A clonagem direta, usualmente, não detecta
miRNAs com um nível de expressão muito baixo ou miRNAs que são expressos apenas em
determinado estágio ou tipo celular (Li et al., 2010a). O sequenciamento de nova geração é
capaz de detectar sequências com expressão relativamente baixa, mas requer uma exaustiva
análise para distinguir tais moléculas, de outros RNAs não codificadores com tamanho
semelhante (Friedlander et al., 2008). Tais estratégias têm sido suplementadas com análises
in silico permitindo uma predição mais eficaz e passível de posterior validação (Li et al.,
2010a). Estratégias computacionais, criadas para predição de miRNAs, baseiam-se em
características específicas destas moléculas, já que os métodos convencionais de busca são
ineficazes para tal predição (Wang et al., 2005; Mendes et al., 2009). As abordagens
utilizadas para identificação de miRNAs em animais e vegetais são diferentes devido as
características dos miRNAs serem distintas nos dois reinos (Zhang et al., 2006b). Assim,
critérios de anotação geral de miRNAs tem sido utilizados inspirando diversos programas de
15
INTRODUÇÃO
predição de miRNAs baseados na utilização de filtros (específicos de características dos
miRNAs), aprendizado de máquinas, homologia ou ab initio. Os métodos baseados em filtros
circundam um número diverso de características aplicadas para moléculas de miRNAs
diferenciando-as de outros tipos de moléculas no genoma. Dentre estas características, as
denominadas estruturais e termodinâmicas, são as mais utilizadas para tal predição. Exemplos
destas características são: conteúdo de GC na sequência do pré-miRNA, energia mínima livre
da estrutura secundária do precursor de miRNA, localização da molécula precursora no
genoma, conservação evolutiva da região madura, etc. Entre os programas que utilizam estas
características para predição estão miRScan, MIRSCANII, MIRSEEKER, entre outros (Lai et
al., 2003; Lim et al., 2003). Outra abordagem, bastante empregada para identificação de
miRNAs, é o treinamento de aprendizado de máquina. Este método utiliza informações de
grupos de sequências provindas de miRNAs reais e de grupos de sequências genômicas
randômicas não composta por miRNAs utilizadas para o treinamento das máquinas no
reconhecimento destas classes distintas. Assim, os candidatos a miRNAs são comparados aos
grupos de sequências e uma probabilidade é aplicada classificando-os entre miRNA real ou
miRNA não real. Exemplos de aprendizado de máquina utilizados são: MiRFinder, MiPred,
MIRCOS, dentre outros (Huang et al., 2007; Jiang et al., 2007; Sheng et al., 2007).
A identificação computacional, no entanto, não é suficiente para a caracterização da
molécula de miRNA como um produto biologicamente ativo nos seres vivos. Com isso,
estratégias utilizam uma combinação de métodos computacionais e métodos experimentais no
intuito de identificar e validar esta classe de RNAs (Berezikov et al., 2006). Estas estratégias
possuem duas abordagens principais: predição de prováveis miRNAs utilizando análise
computacional com posterior validação experimental e clonagem/sequenciamento com
posterior localização no genoma avaliando as características estruturais e termodinâmicas das
sequências. Estas duas abordagens aumentam o número de sequências de miRNAs
consideradas reais nos bancos de dados diminuindo os falsos positivos. Estas estratégias tem
sido utilizadas, por exemplo, pelo programa PalGrade que identificou milhares de prováveis
sequências referentes a miRNAs conservados e não conservados (Bentwich et al., 2005).
Posteriormente, estas foram testadas por microarranjos e os sinais positivos foram clonados e
sequenciados para identificação dos miRNAs reais. Este método aumentou o número de
miRNAs reais identificados em humanos (Bentwich et al., 2005). Neste mesmo contexto,
outro método bastante utilizado tem sido o miRDeep. Este método parte de sequências
provindas do sequenciamento de RNA com posterior utilização de filtros baseados em
16
INTRODUÇÃO
características conservadas de miRNAs reais para validação das moléculas (Friedlander et al.,
2008).
I.5.3 Estratégias de Predição de Alvos de miRNAs
A identificação computacional de alvos de miRNAs e a validação de suas interações,
constituem etapas fundamentais na descoberta das funções celulares dos miRNAs. A medida
da função do miRNA é baseada estritamente nos alvos no qual ele silencia, ou seja, aqueles
potencialmente afetados na expressão gênica diretamente. O silenciamento gênico mediado
por miRNAs tem sido descrito baseado na clivagem do mRNA alvo ou na repressão de sua
tradução em proteína (Bartel, 2009). O primeiro ocorre preferencialmente em plantas e o
segundo preferencialmente em animais (Eulalio et al., 2008; Voinnet, 2009), correlacionado
algumas vezes, com o seqüestro e transferência da maquinaria de silenciamento gênico
mediada por miRNAs para compartimentos sub-celulares denominados corpos P (Liu et al.,
2005).
O silenciamento gênico mediado por miRNAs em animais tem focado diretamente no
pareamento desta molécula com regiões 3`UTRs dos alvos. No entanto, estudos recentes tem
dado atenção também para regiões codificadoras de proteínas e regiões 5`UTRs (Lytle et al.,
2007). O pareamento realizado pelo par miRNA/mRNA (3`UTR) em animais não ocorre de
forma perfeita, ou seja, existem considerações como despareamento entre nucleotídeos e
pareamentos não Watson e Crick como G:U (Lewis et al., 2003). O pareamento miRNA/alvo
tem sido considerado mais próximo do real quando a região 5` do miRNA maduro, entre os
nucleotídeos 2 e 8 (região seed), obtêm uma complementaridade perfeita (100%) com a
região 3`UTR do gene alvo (Lewis et al., 2005). Estudos experimentais têm reforçado a
necessidade da presença destes sítios complementares na região seed denominando-os de
sítios alvos canônicos. Existem também outros sítios não canônicos que possuem certa
complementaridade com a região 3` do miRNA, sendo estes chamados de sítios
compensatórios não canônicos (Sethupathy et al., 2006b; Grimson et al., 2007).
O emprego de diferentes algoritmos computacionais tem sido utilizado para predição
e identificação de miRNAs e seus prováveis alvos em diversos organismos (Jones-Rhoades
and Bartel, 2004; Wang and El Naqa, 2008). Estes métodos tem se baseado em características
específicas envolvendo o processo de interação entre o par miRNA/alvo. Exemplos destas
características são: conteúdo de nucleotídeos da região seed, estabilidade termodinâmica do
par miRNA/mRNA, conservação evolutiva do sítios de interação e presença de sítios
17
INTRODUÇÃO
múltiplos na mesma sequência 3’UTR (Grimson et al., 2007; Kertesz et al., 2007). Vários
métodos têm sido desenvolvidos baseados nestas características. Devido à possibilidade de
especificidade destas características programas exclusivos para espécies e determinadas
situações tem sido desenvolvidos. O programa TargetScan foi um dos primeiros programas a
se basear na complementaridade da região seed e na conservação do pareamento
miRNA/mRNA para predição de alvos de miRNAs. A estratégia inicial, deste programa,
utilizou sequências 3`UTRs de genes de mamíferos para predição de alvos mais confiáveis
em H. sapiens. Atualmente, novas versões específicas deste mesmo algoritmo tem sido
apresentadas como TargetScanHuman 5.2 (humanos), TargetScanMouse (camundongos),
TargetScanFly (D. melanogaster) e TargetScanWorm (C. elegans). Cada um destes
programas prediz alvos conservados de determinadas espécies baseados em informações de
um grupo de organismo próximo evolutivamente. Existem outros programas que permitem a
predição dos alvos de miRNAs com uma flexibilidade maior. Por exemplo, os programas
miRAnda
(http://www.microrna.org/microrna/home.do),
RNAhybrid
(http://bibiserv.techfak.uni-bielefeld.de/rnahybrid/) e rna22 tem sido utilizados para predição
de alvos de miRNA (Enright et al., 2003; Kruger and Rehmsmeier, 2006). O programa
miRANDA, tem sido um dos programas de predição mais utilizados ultimamente. Como
principal característica, este programa busca complementaridades significativas no
pareamento do par miRNA/mRNA principalmente na região 5` seed do miRNA maduro
(Enright et al., 2003). O programa RNAhybrid explora a termodinâmica do par
miRNA/mRNA buscando energia mínima livre de pareamento significantes ou estáveis
(Kruger and Rehmsmeier, 2006). Além destes programas, muitos outros algoritmos, alguns
disponibilizados na web, têm combinado a predição gênica de alvos com outras informações
como expressão gênica em diferentes tecidos e organismos, anotação funcional do gene e vias
metabólicas (KEGG) e alguns bancos de dados (Ensembl, Swiss-Prot, UCSC) (Nam et al.,
2008; Hausser et al., 2009; Roubelakis et al., 2009; Xiao et al., 2009). Estas ferramentas
ampliam as informações relevantes sobre o silenciamento gênico mediado por miRNAs e
seus prováveis efeitos biológicos nas células.
18
OBJETIVOS
CAPÍTULO II
Objetivos
19
OBJETIVOS
II.1 Geral
Identificar e analisar a participação da via de silenciamento gênico mediada por
miRNAs no desenvolvimento do parasito S. mansoni utilizando abordagens computacionais e
experimentais validando miRNAs, seus alvos e os genes envolvidos na sua biogênese.
II. 2 Específicos
 Buscar e caracterizar, através de uma análise in silico, genes envolvidos na via de
silenciamento gênico mediada por miRNAs utilizando dados de genoma e
transcriptoma do parasito S. mansoni;
 Desenvolver um algoritmo otimizado para busca e caracterização de miRNAs e seus
precursores (conservados e não conservados) utilizando dados de genoma e
transcriptoma de S. mansoni;
 Desenvolver um algoritmo otimizado para busca e caracterização do cluster mir-71/2
(conservado em S. mansoni) nos genomas de espécies de Protostômios;
 Analisar a expressão dos genes envolvidos na biogênese de miRNAs em diferentes
fases de desenvolvimento de S. mansoni avaliando a participação de mecanismos póstranscricionais no parasito;
 Predição e validação de alvos de miRNAs no genoma de S. mansoni;
 Analisar a expressão dos miRNAs maduros sma-mir-125a e sma-mir-124-3p
(conservados) e seus prováveis alvos conservados (inexina e sinoviolina) em
diferentes fases de desenvolvimento de S. mansoni avaliando a participação de
mecanismos pós-transcricionais no parasito.
20
Via de silenciamento gênico mediada por miRNAs em S. mansoni
Capítulo III
Via de silenciamento gênico mediada por miRNAs
em S. mansoni
21
Via de silenciamento gênico mediada por miRNAs em S. mansoni
III.1 Justificativa
A via de silenciamento gênico mediada por miRNAs tem sido descrita em diversos
organismos modelos como D. melanogaster, C. elegans e H. sapiens (Ambros, 2003; Lee et
al., 2004; Azuma-Mukai et al., 2008). Vários estudos têm mostrado a conservação desta
maquinaria, desde organismos inferiores até organismos multicelulares como seres humanos
(Murphy et al., 2008; Lee et al., 2010). No entanto, a descoberta da participação desta via em
novas funções do organismo tem expandido sua complexidade, assim como o número de
genes envolvidos nela. Membros desta via como Argonauta e Dicer têm sido relatados em
espécies do gênero Schistosoma incluindo S. mansoni e S. japonicum (Krautz-Peterson and
Skelly, 2008; Gomes et al., 2009; Luo et al., 2010). Uma análise preliminar dos genes
envolvidos na via de biogênese de miRNAs em S. mansoni foi publicada por nosso grupo de
trabalho, em 2009, mostrando uma expressão diferencial dos genes centrais da via,
SmArgonauta e SmDicer, em diferentes etapas do ciclo de vida do parasito (Gomes et al.,
2009). Visto a importância destes genes na regulação da expressão gênica, influenciando
diversos mecanismos celulares, tornou-se necessário um estudo mais detalhado dos genes
desta maquinaria no parasito S. mansoni, abordando os seguintes temas: identificação
computacional e distribuição cromossômica dos genes da maquinaria; conservação
filogenética, análise dos domínios conservados e predição de estruturas secundárias e
terciárias das proteínas preditas da via; e análise da expressão gênica dos seus transcritos em
diversas fases de desenvolvimento do parasito S. mansoni.
22
Via de silenciamento gênico mediada por miRNAs em S. mansoni
III.2 Materiais e Métodos
III.2.1 Validação in silico
III.2.1.1 Análise e localização da via de miRNA no genoma de S. mansoni
As sequências das prováveis proteínas envolvidos na via de miRNA em S. mansoni
foram preditas utilizando a ferramenta Blastp disponibilizada no banco de dados de S.
mansoni (GeneDB http://www.genedb.org/genedb/smansoni/)(Berriman et al., 2009). Como
sequências de busca foram utilizadas sequências de aminoácidos das proteínas envolvidas na
via de miRNA em organismos modelos como D. melanogaster. C. elegans e H. sapiens.
Prováveis genes ortólogos foram recuperados do banco de dados do NCBI (National Center
for Biotechnology Information - http://www.ncbi.nlm.nih.gov/) e utilizados posteriormente
para análises comparativas de sequência. As sequências dos genes foram localizadas no
genoma do parasito utilizando informações provenientes dos arquivos de anotação disponível
no banco de dados do parasito e um script escrito em PERL para busca das posições dos
resíduos de nucleotídeos no genoma.
III.2.1.2 Alinhamento múltiplo de sequências e Análise filogenética
As sequências preditas de aminoácidos das prováveis proteínas envolvidas na via de
miRNAs em S. mansoni foram submetidas a busca por famílias de domínios e motivos
conservados utilizando o banco de dados de família de proteínas PFAM versão 25.0 (Protein
family database - http://pfam.sanger.ac.uk/)(Finn et al., 2010). Estas sequências foram
também submetidas à análise comparativa com suas prováveis proteínas ortólogas. Foi
utilizado como programa para obtenção dos alinhamentos múltiplos de sequência o programa
ClustalX 2.0 realizado com parâmetros default(Larkin et al., 2007).
As análises filogenéticas comparativas foram empregadas utilizando as sequências das
proteínas preditas de S. mansoni e os possíveis ortólogos de referência (RefSeq) encontrados
em outras espécies e conduzidos utilizando o programa MEGA 4(Tamura et al., 2007). As
árvores filogenéticas foram inferidas utilizando o método Neighbor-Joining (NJ) (Saitou and
Nei, 1987) e calculada com o modelo de substituição JTT. A distância entre os ramos
horizontais, separando duas seqüências foram proporcionais a divergência entre as
seqüências. A árvore filogenética consenso foi montada utilizando a análise de teste de
23
Via de silenciamento gênico mediada por miRNAs em S. mansoni
bootstrap com 2000 réplicas representando a história evolutiva do clado analisado. A
porcentagem de réplicas das árvores filogenéticas foi realizada pelo teste de bootstrap
apresentando no final apenas a árvore consenso. Todas as posições contendo espaços ou
dados perdidos de sequências foram eliminadas do conjunto de dados. A árvore foi desenhada
com os tamanhos dos ramos nas mesmas unidades daquelas distâncias utilizadas para inferir a
árvore filogenética.
III.2.1.3 Análise de resíduos hidrofóbicos (Hydrophobic Cluster Analysis - HCA)
A análise dos resíduos de aminoácidos hidrofóbicos foi realizada para proteínas
contendo domínio SN (Staphlococcal nuclease) utilizando o programa HCA (Hydrophobic
Cluster Analysis) alocado no servidor Mobyle (http://mobyle.rpbs.univ-paris-diderot.fr/cgibin/portal.py?form=HCA). HCA é um método baseado no uso de um gráfico bidimensional
para identificação de regiões globulares e não globulares em proteínas contendo regiões de α
hélice e/ou folhas beta permitindo a análise de estruturas altamente dissimilares.
III.2.1.4 Predição da estrutura secundária
A predição da estrutura secundária das proteínas foram realizadas para proteínas
contendo domínio SN utilizando o programa PredictProtein (http://www.predictprotein.org).
As posições dos aminoácidos contidos nas estruturas α hélice, folhas beta e loops foram
mapeadas nas sequências pelo mesmo programa (Rost and Liu, 2003; Rost et al., 2004).
III.2.1.5 Predição da estrutura terciária
A predição da estrutura terciária de proteínas foi inferida usando um modelo de
cálculo teórico SWISS-MODEL para modelagem homóloga (Arnold et al., 2006).
Inicialmente a estrutura primária das proteínas identificadas foram buscadas no banco de
dados repositório SWISS-MODEL que contem mais de 3 milhões de modelos de proteínas
provenientes do banco de dados UniProt(Kiefer et al., 2009). Foi feito um alinhamento entre
uma sequência modelo depositada no SWISS-MODEL e a sequência de interesse. Após a
comparação, as posições dos átomos do modelo foram medidas. Os modelos foram, assim,
ponderados por sua similaridade com a seqüência alvo, enquanto as posições divergentes
foram excluídas. O melhor modelo depositado no repositório foi selecionado através de um
24
Via de silenciamento gênico mediada por miRNAs em S. mansoni
esquema de pontuação, baseada em diversas características da estrutura 3D como: energia da
estrutura, impedimento estérico entre os átomos e interações favoráveis entre resíduos de
aminoácidos na estrutura como formação da ligação de hidrogênio entre outras. A
reconstrução das cadeias laterais da sequência foi baseada nas posições ponderadas dos
resíduos correspondente no modelo (Kiefer et al., 2009). A visualização das estruturas foi
obtida utilizando o programa PyMOL (http://www.pymol.org)(Delano, 2002).
III.2.2 Validação experimental
III.2.2.1 Parasitos
Neste trabalho foram utilizados parasitos da espécie S. mansoni linhagem LE, em
diferentes etapas do ciclo. Vermes adultos e cercárias, foram cedidos pelo Moluscário do
CPqRR/FIOCRUZ (Centro de Pesquisa René Rachou, Fundação Oswaldo Cruz) em Belo
Horizonte/MG.
Os vermes adultos foram obtidos a partir da perfusão do sistema porta-hepático de
camundongos da linhagem Swiss Webster infectados com aproximadamente 100 cercárias por
via subcutânea após 50 dias, conforme descrito por Smithers e Terry (1965) (Smithers and
Terry, 1965; Basch, 1981). Após a coleta, os vermes adultos foram armazenados em tubo de
1,5 ml a -80ºC para posterior utilização.
As cercárias foram obtidas após 27 a 31 dias de infecção do hospedeiro intermediário
Biomphalaria glabrata com miracídeos. Posteriormente a cercária, foi separada do
sobrenadante e das impurezas contidas no meio e armazenada em tubos de 1,5 ml a -80ºC
para posterior utilização.
Os esquistossômulos mecanicamente transformados foram obtidos através da forma
larval cercária. Inicialmente, as cercárias frescas após banho de gelo (2 horas) e separação das
impurezas por sedimentação, foram transferidas para tubos falcons de 15 mL. Cada tubo foi
separado com aproximadamente 200.000 cercárias e 5 mL de RPMI 1640 (INVITROGEN).
Após a ruptura mecânica da cauda e do corpo cercariano todo volume foi adicionado a um
novo
recipiente
e
adicionado
RPMI suplementado
com
10%
de
penicilina
/
estreptomicina100 mg/mL. O recipiente foi cuidadosamente incubado em estufa de CO2 5% a
37C por 3 horas e meia para inversão metabólica e transformação do fase de cercária em
esquistossômulos (Harrop and Wilson, 1993). Posteriormente o corpo cercariano foi separado
25
Via de silenciamento gênico mediada por miRNAs em S. mansoni
da cauda em fluxo laminar por sedimentação eliminando a cada 60 segundos o sobrenadante
de meio de cultura contendo caudas. Após verificado a presença apenas de corpo cercariano o
material foi dividido em vários frascos de 1,5 mL. O corpo cercariano neste estágio já pode
ser considerado esquistossomulo já que dispendeu tempo necessário ma estufa para inversão
metabólica. Os esquistossomulos referentes a cada estagio de incubação, aproximadamente
800 esquistossômulo por mL, foi realizado em meio 169 (Tabela 2) suplementado com 10%
de soro fetal bovino (Gibco) e 1% penicilina / estreptomicina100 mg/mL por poço(Basch,
1981).
Tabela 2- Meio 169 com seus componentes e concentração.
Componentes
Concentração
Hidrolisado de lactoalbumina
0,1%
Glicose
0,1%
Hipoxantina
5 X 10-7M
Triiodotironina (T3)
2 X10-7M
Serotonina
1 X 10-6M
Hidrocortisona
1 X 10-6M
Meio Mínimo Vitamina
0,5%
Meio Schneider
5%
HEPES
20 mM
RPMI
q.s.p. 500 mL
Os esquistossômulos mecanicamente transformados foram cultivados durante 3,5
horas, 24 horas, 48 horas, 72 horas, 5 dias e 7 dias (EMT-3,5 horas, EMT-24 horas, EMT-48
horas, EMT-72 horas, EMT-5 dias, EMT-7 dias). A Figura 6 ilustra uma preparação com 24
horas de cultivo in vitro.
Figura 6: Preparação de esquistossômulos de 24 horas. Os esquistossômulos foram
cultivados por 24 horas em estufa de CO2 5% a 37ºC em meio 169.
26
Via de silenciamento gênico mediada por miRNAs em S. mansoni
III.2.2.2 Análise da expressão gênica por qRT-PCR
III.2.2.2.1 Extração do RNA total
Cerca de 50-100 mg de vermes adultos, 100.000-200.000 cercárias, 100.000-200.000
esquistossômulos de 3,5 horas, 24 horas, 48 horas, 72 horas, 5 dias e 7 dias foram utilizados
para extração de RNA total utilizando o kit RNA total (SV total RNA Isolation System PromegaTM) seguindo o protocolo do fabricante.
A amostra biológica foi homogeneizada em 1 mL de TRIzol® Reagent (InvitrogenTM)
com auxílio de um homogeneizador tipo politron. Posteriormente, o homogeneizado foi
transferido para tubos eppendorf de 1,5 mL e incubado por 5 minutos à temperatura ambiente
para permitir a completa dissociação dos complexos de nucleoproteínas. A seguir foram
adicionados 0,2 mL de clorofórmio (Sigma - St. Louis, MO, USA) para cada 1,0mL de
TRIzol. A mistura foi homogeneizada vigorosamente com auxílio de um vórtex.
Posteriormente, as amostras foram centrifugadas por 12 minutos a 12.000g a temperatura
ambiente. A fase aquosa foi transferida para um novo tubo seguido da adição de volume
equivalente de etanol 95% v/v (preparado com água livre de RNAses) e homogeneizado
suavemente por inversão o tubo, por três vezes, para a precipitação do RNA. A seguir o RNA
total foi purificado com o kit SVRNA System conforme instrução do boletim técnico. A
qualidade das preparações foi avaliada em gel de agarose/formaldeído, como mostra a Figura
7. A pureza e quantificação dos RNAs foram determinadas utilizando o aparelho NanoDrop
(GE) avaliando as relações entre os comprimentos de onda 260nm/280nm e 260nm/230nm
indicativos de pureza do amostra.
27
Via de silenciamento gênico mediada por miRNAs em S. mansoni
Figura 7: Análise em gel de agarose/formaldeído a 1%.O RNA total foi obtido utilizando
o kit SV40 a partir de vermes adultos (1), cercárias (2), esquistossômulos de 3,5 horas (3);
esquistossômulos de 24 horas (4); esquistossômulos de 48 horas(5); esquistossômulos de 72
horas (6); esquistossômulos de 5 dias (7) e esquistossômulos de 7 dias (8).
III.2.2.2.2 Oligonucleotídeos iniciadores (Primers)
Os oligonucleotídeos iniciadores específicos para os genes em estudo foram
idealizados utilizando o programa Gene Runner. Estes foram baseados nas sequências de
cDNA depositadas no bancos de dados GeneDB.
III.2.2.2.3 RT-PCR
A primeira fita do cDNA foi sintetizada utilizando 1 g de RNA total extraído e o Kit
High Capacity RT-PCR System (Applied Biosystems), seguindo as recomendações dadas
pelo fabricante. Brevemente, pipetou-se em um mesmo tubo eppendorf de 1,5ml, 2 µL de
tampão da reação, 2µL de primers randômicos, 10 mM de dNTPs, 1,0 µL de Transcriptase
reversa Multiscribe, 1 µL de inibidor de RNAse e água livre de nuclease para um volume
final de 10 L. Adicionou-se a esta mistura 10 µL de RNA total, volume correspondente a 1
µg de RNA extraído. Cuidadosamente, homogeneizou-se o tubo pipetando para cima e para
baixo 2 vezes para completa mistura do RNA total na mistura. Posteriormente, o tubo
contendo a mistura de reagentes e o RNA total foi incubado em termociclador (Thermo
Hybaid Px2) seguindo o seguinte programa: 10 minutos a 25º C, 120 minutos a 37º C para
produção da primeira fita de DNA (cDNA), 85C por 5 minutos para inativação da enzima
RNAseH e por fim 4ºC. A amostra de cDNA foi estocada a -20C até o momento do uso.
No intuito de obter o cDNA fita dupla, amplificações foram realizadas utilizando 2L
do cDNA como molde, combinados com os mesmos reagentes e etapas de reação descritos
no item de DNA genômico, com exceção dos primers por sua especificidade e temperatura de
anelamento.
III.2.2.2.4 PCR quantitativa em Tempo Real (qRT-PCR)
Para análise da expressão dos genes em estudo foi utilizada a técnica de PCR
quantitativa em tempo real. As reações foram realizadas utilizando o kit Platinum SYBR
green qPCR SuperMix-UDG ROX (Applied Biosystems), utilizando 2μL dos iniciadores na
28
Via de silenciamento gênico mediada por miRNAs em S. mansoni
concentração de 300 nM, 5μL de SYBR Green, 3μL de cDNA diluído 5x com água livre de
DNAse, somando um volume final de 10 μL de reação. Os ensaios foram realizados em
triplicata técnica e biológica para todos os genes da via de silenciamento gênico mediada por
miRNAs em S. mansoni, com o constitutivo α-tubulina presente na mesma placa que os genes
avaliados. Os valores de baseline e threshold utilizados foram ajustados para 3-15 ciclos
referente à baseline e de 0,1 para threshold. As análises foram feitas utilizando o método do
∆Ct sendo os resultados expressos na fórmula 2-∆Ct = 2-(Ct Gene alvo - Ct α tubulina). Em relação à
expressão, os valores obtidos foram multiplicados por 100 para melhor visualização dos
dados no gráfico. A reação de qRT-PCR foi conduzida conforme programação contida no
aparelho ABI 7300 Applied Biosystems.
III.2.2.2.5 Avaliação da curva de eficiência dos iniciadores
Para avaliar a eficiência de amplificação dos iniciadores utilizados, foram construídas
curvas utilizando 5 diluições seriadas de 1:4 vezes de uma amostra de cDNA de cercária. O
ensaio foi realizado em triplicata e a concentração dos iniciadores foi de 300 nM. Os valores
foram plotados em um gráfico onde o eixo X apresentava o Log das concentrações de cDNA
e o eixo Y, o valor de CT para cada diluição. Os primers foram considerados adequados para
avaliar expressão gênica pelo sistema SYBR™ Green, quando apresentavam eficiência de
reação acima de 95% e abaixo de 105% que é determinado pelo slope da curva, aplicado na
seguinte formula: Eficiência = [10(-1/slope) - 1] x 100. Os valores de baseline e threshold para
os primers utilizados foram ajustados para 3-15 ciclos referentes à baseline e de 0,1 para
threshold. Segue abaixo como exemplo, os plot de amplificação e a curva de eficiência
referente ao gene α Tubulina. As eficiências de reação dos primers utilizados, bem como,
seus respectivos coeficientes de linearidade estão demonstradas na Tabela 3.
29
Via de silenciamento gênico mediada por miRNAs em S. mansoni
Figura 8: Plot de amplificação referente à curva de eficiência do α tubulina utilizando
diluição seriada de 4x de cDNA de cercária. Em X está demonstrado o valor dos ciclos de
PCR e em Y os valor de ∆Rn.
Figura 9: Curva padrão referente ao gene α tubulina utilizando diluição seriada de 4x de
cDNA. Em X estão demonstrados os valores de Log da concentração de cDNA e em Y os
valores de CT correspondes a cada diluição. A direita do gráfico os valores de slope e de
coeficiente de linearidade estão representados.
III.2.2.2.6 Verificação da qualidade dos amplicons
Os produtos amplificados na PCR foram analisados em gel de agarose a 1,2%(90 volts
– 75 minutos), juntamente com o padrão de peso molecular 100pb DNA Ladder (Invitrogen)
a fim de confirmar presença de uma banda única com peso molecular esperado para os
amplificados dos respectivos primers.
30
Via de silenciamento gênico mediada por miRNAs em S. mansoni
Tabela 3: Sequência de primers forward e reverse referente aos genes avaliados,
tamanho do amplicon gerado, eficiência e R2 dos primers utilizados avaliado através de
uma curva de eficiência.
Gene
SmDrosha1/2
SmFmr1.1
SmPartner-Drosha
SmPartner-Dicer
SmExportina-5.1/2
SmTudor-SN
SmAlfaT
Primers
F 5’GGGACATTGGCTTGCTTTC3’
R 5’TTGACCTGTTACAGATTGACG3’
F 5’AATGGCTGACTTCTCCTCTG3’
R 5’ACTAATGCGTTTGTTGGG3’
F 5’GATGTTAGTGGTGGTGTTGG3’
R 5’CCTGGCACTTCTTCAACTAG3’
F 5’GTGGTGGTAGCGTGGAAAG3’
R 5’AGAGATTTGCGATTGTGC3’
F 5’CGTCCCTTTATCCGTCAG3’
R 5’CCATCTTGCACCAGTTCTC3’
F 5’ACTTTCGTCGGGAGCATC3’
R 5’CAACACAATGAGCAAGACC3’
F 5’GCAGGATACACAGCAAACTC3’
R 5’TGGTTCTGGGTTCACATC3’
Tamanho
do amplicon (bp)
107
Slope
R2
-3,23
Eficiência do
primer (%)
1,042
0,99918
70
-3,36
0,986
0,99288
101
-3,36
0,984
0,99329
104
-3,43
0,957
0,99265
80
-3,27
1,022
0,99907
79
-3,38
0,977
0,98315
87
-3,39
0,972
0,99982
III.2.2.2.7 Curva de dissociação dos amplicons
Foi realizada a curva de dissociação dos amplicons para observar a presença de
possíveis amplificações inespecíficas. Ao final dos 40 ciclos da qRT-PCR a temperatura é
elevada gradualmente de 60ºC á 95ºC, mantendo-se por 15s em cada temperatura, durante o
qual é feito a leitura da emissão de fluorescência. Na medida em que os amplicons
desnaturam em temperaturas específicas dependentes do tamanho e número de bases CGAT,
o sinal fluorescente emitido pelo SYBR™ Green é reduzido. O gráfico resultante permite
verificar se há um ou mais produtos de PCR presentes em cada reação devido a diferenças de
temperatura de dissociação. Na Figura 10 está exemplificado uma curva de dissociação
referente ao gene SmTudor-SN.
Figura 10: Curva de dissociação referente ao amplicon de SmTudor-SN. No eixo x está
representado a temperatura de dissociação do amplicon gerado pela reação de PCR e no eixo
Y a derivada do valor de emissão de fluorescência.
31
Via de silenciamento gênico mediada por miRNAs em S. mansoni
III.2.2.3 Validação dos iniciadores (Sequenciamento)
Para avaliar se os iniciadores utilizados (Tabela 3) amplificavam produtos específicos
foi realizado PCR convencional utilizando Platinum Taq. A reação de amplificação adotou o
seguinte programa: 95ºC por 5 minutos, seguido de 40 ciclos de 95°C por 30 segundos,
temperatura de anelamento de cada primer por 30 segundos e 72°C por 30 segundos seguido
por um passo adicional após os ciclos de 5 minutos a 72°C. Para isso, foi utilizado 2 µL da 1ª
fita de cDNA de cercária diluída 1:5, 1 µL dos iniciadores forward e reverse de cada gene (1
µM) para um volume final de 25 µL da mistura de PCR. A seguir os produtos obtidos foram
analisados em gel de agarose a 2 % e comparados com os gerados pela qRT-PCR. A seguir os
produtos amplificados foram clonados em pGEM-T easy para posterior seqüenciamento.
III.2.2.3.1 Purificação do produto de PCR convencional
O produto obtido na reação de PCR convencional foi transferido para um novo tubo
tipo eppendorf e adicionado 1/10 do volume inicial de acetato de sódio 3M pH 7,0 (10µL) e
2,5 do volume (250µL) de etanol absoluto. Posteriormente esta mistura foi incubada a -20ºC
por 30 minutos e em seguida, centrifugada a 10000 x g por 5 minutos. O precipitado foi
lavado com etanol 70% e seco. O DNA foi suspenso em 50 µL de água milli-Q estéril.
III.2.2.3.2 Freeze Squeze
De acordo com a metodologia descrita por Tautz e Renz (1983) as bandas de
interesse, contendo os fragmentos de DNA, foram cortadas do gel de agarose, com auxílio de
um estilete. Em seguida, foram transferidas para um becker contendo 10 mL de uma solução
composta de NaOAc 300 mM/EDTA 1 mM pH 7,0 e incubada no escuro, sob agitação lenta
por 30 min. Posteriormente, as bandas foram transferidas para um tubo contendo um lã de
vidro e mantidas a -80ºC por 30 minutos. O DNA livre da agarose foi obtido por
centrifugação a 12000 x g por 15 minutos e recuperado a -20ºC pela precipitação com 1/10 de
acetato de sódio 3M pH 7,0 e 2,5 volume de etanol absoluto. Após a lavagem com etanol
70% e seco, o DNA foi suspenso em 50 µL de água milli-Q estéril.
32
Via de silenciamento gênico mediada por miRNAs em S. mansoni
III.2.2.3.3 Clonagem
III.2.2.3.3.1 Reação de Ligação
As amostras purificadas foram ligadas ao vetor plasmidial pGEM-T easy (Promega)
utilizando 5 µL de tampão, 3 µL do produto de PCR, 1 µL de vetor pGEM-T easy e 1 µL de
DNA ligase. A reação foi incubada no termociclador a 4ºC por 16 horas para efetuar a
ligação.
III.2.2.3.3.2 Preparo de células competentes
Uma colônia de células de Escherichia coli DH5α foi inoculadas inicialmente em 5
mL de meio LB (bacto-triptona 10g/L; extrato de levedura 5g/L; NaCl 5g/L; pH=7,5) em um
tubo tipo Falcon de 15 mL e incubadas a 37ºC por 16 horas sob agitação de 200 rpm. Após a
incubação, 250µL do pré-inóculo foram transferidos para um tubo tipo Falcon de 50 mL e o
volume completado para 25 mL com meio SOB (bacto-triptona 2g/L; extrato de levedura
5g/L; NaCl 0,58; KCl 0,2g/L; pH=7,5) suplementado com 250µL de MgSO4 1M e 250µL de
MgCl2 1M. A cultura foi incubada por duas horas a 37ºC sob agitação (200 rpm) até que a
concentração de células atingisse uma densidade ótica (600nm) entre 0,4 e 0,6. A seguir, as
células foram incubadas em banho de gelo por 30 minutos e recuperadas por centrifugação a
3000 x g durante 10 minutos a 4ºC. O sobrenadante foi descartado e o precipitado
ressuspenso com auxílio de um pipetador automático em 10 mL de tampão Pipes (60 mM de
CaCl2, 10mM de Pipes e 15% de glicerol P.A) para a lavagem das células. As bactérias
foram novamente centrifugadas a 2000 x g durante 10 minutos a 4ºC. A lavagem foi repetida
duas vezes nas mesmas condições. Após as lavagens, as células foram incubadas por 30
minutos em banho de gelo e em seguida centrifugadas a 2000 x g por 10 minutos a 4ºC.
Depois da centrifugação, o sobrenadante foi descartado e o precipitado ressuspenso em 1,2
mL de tampão Pipes. As células competentes foram então aliquotadas e armazenadas a -80ºC
até o momento do uso.
III.2.2.3.3.3 Transformação Bacteriana
33
Via de silenciamento gênico mediada por miRNAs em S. mansoni
Foram adicionados 5µL do produto da reação de ligação em uma alíquota de célula
competente (100µL). Essa mistura foi incubada em banho de gelo durante 30 minutos,
submetida a choque térmico à 42ºC por 90 segundos e retornada ao banho de gelo em seguida
por 2 minutos. Esta foi transferida para um tubo tipo Eppendorf contendo 950µL de meio
SOB e incubada durante 90 minutos a uma temperatura de 37ºC sob agitação constante (200
rpm). Após esse período, a suspensão bacteriana foi centrifugada a 3000 x g por 5 minutos e
o precipitado transferido para placas de Petri com meio LB-ágar contendo ampicilina
(100µg/mL), X-Gal (20µg/mL) e IPTG. A presença de X-Gal permitiu a seleção dos clones
recombinantes. As placas contendo as células transformadas foram incubadas durante 16
horas a 37ºC em estufa.
III.2.2.3.3.4 PCR de Colônia
As colônias recombinantes foram transferidas para 1,5 mL de caldo LB/ampicilina
durante 14 horas e submetidas à amplificação por PCR para confirmação da presença do
inserto de interesse na colônia. Para realização da PCR de colônia 2µL de cada colônia foi
retirada e utilizada como molde de DNA. O mesmo programa da PCR convencional anterior
foi utilizado incluindo os primers para extensão do amplicon.
III.2.2.3.3.5 Minipreparação
Uma alíquota de 20µL da cultura das células transformadas foi colocada em 5 mL de
meio LB/ampicilina (100µg/mL) e incubadas durante 16 horas a 37ºC sob agitação constante
(200 rpm). O método de extração utilizado foi o da lise alcalina descrito por Maniatis e cols.,
1989.
III.2.2.3.3.6 Sequenciamento
As reações de sequenciamento foram realizadas utilizando o kit Big-Dye Terminator
(Applied Biosystems), de acordo com as instruções do fabricante e as reações analisadas no
seqüenciador automático de DNA, ABI 3100 Genetic Analyzer (Applied Biosystems). Os
plasmídeos foram seqüenciados, nas direções “direta” e “reversa”.
O resultado do sequenciamento, em formato fasta, foi inicialmente utilizado para
retirada das sequencias dos vetores nas extremidades, processo chamado de trimagem. Após a
34
Via de silenciamento gênico mediada por miRNAs em S. mansoni
trimagem, cada sequência foi submetida a ferramenta blastn contra o banco de dados
GeneDB e a ferramenta blast2 contra a sequencia utilizada para o desenho dos primers.
III.2.2.4 Análise Estatística
A expressão relativa nos estágios do parasito foi comparada utilizando a análise da
variância por ONE-WAY (Teste de Tukey ou T-Student). Foi considerado estatisticamente
significante p<0.05. A análise estatística foi feita utilizando o programa GraphPad Prism 5.
35
Via de silenciamento gênico mediada por miRNAs em S. mansoni
III.3 Resultados e Discussão
III.3.1 Análise in silico – Via de silenciamento gênico mediada por miRNAs
III.3.1.1 Anotação e localização no genoma de S. mansoni
Neste trabalho, as proteínas envolvidos na via de silenciamento gênico mediada por
miRNA foram identificadas e recuperadas a partir do banco de dados do parasito S. mansoni,
GeneDB (www.genedb.org). Foi utilizado como ferramenta Blastp, disponibilizado no
próprio banco de dados, e como sequências de busca (“queries”) proteínas da via de
miRNAs, provenientes dos organismos modelos C. elegans e D. melanogaster e H. sapiens,
onde a via está bem descrita. As prováveis ortólogas encontradas em S. mansoni foram
nomeados pelas primeiras letras do nome da espécie, Sm (S. mansoni), seguido pelo nome ou
função da proteína ortóloga encontrada nos organismos homólogos. Um número fez parte do
nome utilizado quando a proteína apresentou parálogas ou splicing alternativo. A busca dos
genes (relativos as proteinas da via) nos cromossomos scaffolds do genoma do parasito foi
realizada baseada nos dados dos arquivos GFF disponibilizados no GeneDB utilizando um
script Perl.
A tabela 4 mostra 13 genes e 18 transcritos relacionados aos constituintes da
maquinaria de silenciamento gênico mediada por miRNA em S. mansoni. Todos os genes
foram identificados nas sequências genômicas, exceto SmTudor-SN. Pode-se observar que
cada gene está localizado em um determinado cromossomo scaffold sendo o cromossomo 1
contemplado com o número maior de genes desta via: SmFMR1.2, SmExportin5.1,
SmExportin5.2, SmExportin1.1 e SmExportin1.2. A maioria dos genes da via de miRNA em
S. mansoni foi encontrado alocado em cromossomos autossômicos. Apenas os genes
SmFMR1.3 e SmFMR1.4 foram encontrados no cromossomo sexual W. Nos cromossomos
autossômico 6 e sexual Z não foram encontrados nenhum gene desta via.
A critério de comparação, foram realizadas análises semelhantes utilizando o
programa MapView (NCBI (http://www.ncbi.nlm.nih.gov/projects/mapview/). Assim foi
possível a comparação do cariótipo de genes-referência (RefSeq genes) provenientes da via de
silenciamento mediada por miRNA do genoma humano com os genes de S. mansoni. Os
resultados sugerem que, assim como em S. mansoni, o gene que codifica a proteína FMR1 em
humanos (NP_001172004.1), também está presente em um cromossomo sexual, neste caso,
cromossomo X na posição Xq27.3. A distribuição semelhante destes genes, tanto em seres
36
Via de silenciamento gênico mediada por miRNAs em S. mansoni
humanos quanto em S. mansoni, pode estar relacionada com a conservação de suas prováveis
funções nos animais. O gene que codifica a proteína Dicer-1 em humanos foi encontrado no
cromossomo 14 enquanto os genes que codificam proteínas Argonautas foram localizados
tanto no cromossomo 1 (AGO1, AGO3 e AGO4) quanto no cromossomo 8 (AGO2). A
distribuição dos genes desta via no genoma não apresentou um padrão de localização
cromossômica, tanto em eucariotos inferiores, como S. mansoni, quanto em superiores, como
H. sapiens.
Alguns genes identificados no genoma de S. mansoni apresentaram splicing
alternativo como os genes SmExportin5.1, SmExportin5.2, SmExportin1.1, SmExportin1.2,
SmDrosha1, SmDrosha2, SmAgo3 e SmAgo4. Resultados semelhantes foram descritos em
humanos e D. melanogaster, entre outros (Park et al., 2007; Potenza et al., 2010). Um caso
particular foi observado para os genes preditos para os membros da família Argonautas de
proteínas de S. mansoni: SmAgo2, 3 e 4. Os genes SmAgo3 e 4 apresentaram splicing
alternativo localizados no cromossomo scaffold SC_0250, enquanto SmAgo2, foi localizado
em outra parte do genoma, próximo de SmAgo3/4 em uma distância inferior a 50 kb,
sugerindo uma duplicação gênica ocorrida durante o processo evolutivo. Tem sido sugerido
em H. sapiens que os genes que codificam os membros da família Argonauta de proteínas
(AGO1, AGO3 e AGO4) são provenientes de duplicações gênicas ocorridas durante o
processo evolutivo(Murphy et al., 2008). Além disso, a distribuição filogenética das proteínas
preditas, SmAgo2 , SmAgo3 e SmAgo4, mostrou maior proximidade evolutiva entre si
quando comparadas à proteína SmAgo1 (Gomes et al., 2009), reforçando a hipótese de que
eventos de duplicação gênica e splicing alternativo são os responsáveis pela diversidade de
funções e maior especificidade em relação aos seus alvos efetores dos membros da família
Argonauta de proteínas em S. mansoni.
37
Via de silenciamento gênico mediada por miRNAs em S. mansoni
Tabela 4: Expansão dos genes envolvidos na via de silenciamento gênico mediada por miRNAs no genoma de S. mansoni.
Gene da via de
miRNA
Cromossomo
Scaffold
GeneDB ID
Início do
gene (nt)
Final do
gene (nt)
Tamanho do
gene (nt)
Orientação
no genoma
NCBI ID (Gene)
NCBI ID
(Proteína)
SmDrosha1
SmDrosha2
SmPartner-Drosha
Chr_5
Chr_5
Chr_4
Smp_142510.1
Smp_142510.2
Smp_087220
1170439
1170439
19342536
1217340
1217340
19366177
46901
46901
23641
minus
minus
minus
XM_002575079.1
XM_002575078.1
XM_002569862.1
XP_002575125.1
XP_002575124.1
XP_002569908.1
SmExportin5.1
Chr_1
Smp_152800.1
31710506
31739365
28859
minus
XM_002576959.1
XP_002577005.1
SmExportin5.2
Chr_1
Smp_152800.2
31710506
31739365
28859
minus
XM_002576960.1
XP_002577006.1
SmExportin1.1
Chr_1
Smp_124820.1
32483304
32494702
11398
minus
XM_002571911.1
XP_002571957.1
SmExportin1.2
SmDicer
SmPartner-Dicer
SmTudor-SN
SmTudor-SN
(Truncada)
SmTudor-SN
(Truncada)
SmFMR1.1
SmFMR1.2
SmFMR1.3
SmFMR1.4
Chr_1
SC_0235
Chr_3
EST
Chr_3.unplaced.
SC_0220
Chr_3.unplaced.
SC_0220
Chr_2
Chr_1
Chr_W
Chr_W
Smp_124820.2
Smp_169750
Smp_023670
Sm01663
32483304
69833
21672299
-
32494702
122456
21674717
-
11398
52623
2418
-
minus
plus
minus
-
XM_002571912.1
XM_002579762.1
XM_002573758.1
-
Smp_166110
28613
29939
1326
plus
31932
10290518
1643175
31443272
31443272
38254
10298192
1674852
31450845
31450845
6322
7674
31677
7573
7573
SmAgo1
Chr_7
Smp_081570
Smp_099630
Smp_016050
Smp_058170.1
Smp_058170.2
Smp_198380
(Smp_140010)
5784524
5808166
SmAgo2
SC_0250
Smp_179320
11056
SmAgo3
SC_0250
Smp_102690.2
SmAgo4
SC_0250
Smp_102690.3
Descrição NCBI
Tamanho
(aminoácidos)
1531
1577
732
XP_002571958.1
XP_002579808.1
XP_002573804.1
-
ribonuclease III
ribonuclease III
hypothetical protein
chromosome region maintenance
protein 5/exportin
chromosome region maintenance
protein 5/exportin
chromosome region maintenance
protein 1/exportin
chromosome region maintenance
protein 1/exportin
dicer-1
tar rna binding protein (trbp)
-
XM_002569803.1
XP_002569849.1
ebna2 binding protein P100
378
plus
minus
plus
minus
minus
XM_002569802.1
XM_002580727.1
XM_002573025.1
XM_002577062.1
XM_002577061.1
XP_002569848.1
XP_002580773.1
XP_002573071.1
XP_002577108.1
XP_002577107.1
520
598
777
728
827
23642
minus
XM_002574704.1
XP_002574750.1
17561
6505
plus
XM_002581032.1
XP_002581078.1
52745
64433
11688
plus
XM_002581034.1
XP_002581080.1
52745
64433
11688
plus
XM_002581033.1
XP_002581079.1
ebna2 binding protein P100
fragile X related 1 frx1
fragile X related 2 frx2
hypothetical protein
hypothetical protein
eukaryotic translation initiation
factor 2c
eukaryotic translation initiation
factor 2c
eukaryotic translation initiation
factor 2c
eukaryotic translation initiation
factor 2c
38
1286
1021
1051
918
2174
356
1023
876
955
854
924
Via de silenciamento gênico mediada por miRNAs em S. mansoni
Os tamanhos das proteínas preditas envolvidas no silenciamento gênico mediado por
miRNA em S. mansoni corroboram com os tamanhos das proteínas ortólogas em organismos
modelos como D. melanogaster e C. elegans (Tabela 1). É importante evidenciar a presença,
não apenas de proteínas provindas de organismos representantes do clado Protostômios, mas
também de organismos do clado Deuterostômios, ampliando a importância da conservação
destas proteínas preditas em todo reino animal. Por exemplo, as proteínas preditas
SmDrosha1 e SmDrosha2 possuem tamanho (resíduos de aminoácidos) de 1531 e 1577,
respectivamente. A proteína ortóloga encontrada em D. melanogaster (NP_477436.1)
apresentou 1327 resíduos de aminoácidos, enquanto em C. elegans (NP_001122460.1) e
humanos (NP_037367.3) 1374 e 1083 resíduos de aminoácidos, respectivamente. As
proteínas preditas SmExportin5.1 e SmExportina5.2 apresentaram tamanhos de 1286 e 1021,
respectivamente, enquanto as ortólogas encontradas encontrada em humanos (NP_065801.1)
e em D. melanogaster (NP_608339) apresentaram 1204 e 1241, respectivamente. A
consistência entre os tamanhos das proteínas ortólogas considerando organismos distantes
evolutivamente é mais um indicio da conservação desta via e sua importância biológica em
diferentes espécies de animais.
Em 2009, nosso grupo publicou um trabalho mostrando a distribuição filogenética e
conservação de domínios protéicos em duas classes de proteínas centrais da via de
silenciamento gênico mediada por miRNAs no parasito S. mansoni: RNAse III (Dicer e
Drosha) e Argonautas (Gomes et al., 2009). Outros estudos também têm mostrado a presença
destas proteínas no gênero Schistosoma (Krautz-Peterson and Skelly, 2008; Chen et al., 2010;
Luo et al., 2010). Uma expressão gênica diferencial dos genes Dicer e Argonautas, foi
mostrada por nosso grupo de trabalho e por Kraus-Peterson (2008), em diferentes fases de S.
mansoni (cercária, vermes adultos, esquistossômulos e ovos). Desta forma tornou-se
necessário investigar detalhadamente as outras proteínas envolvidas na via a fim de entender
melhor a maquinaria de silenciamento gênico mediada por miRNAs. Assim, foram realizadas
neste trabalho análises filogenéticas e de domínios conservados das proteínas preditas
SmExportina5.1,
SmExportina5.2,
SmPartner-Dicer,
SmPartner-Drosha,
SmFmr1.1,
SmFmr1.2, SmFmr1.3, SmFmr1.4 e SmTudor-SN evidenciando a importância destas no
parasito. Posteriormente, a proteína SmTudor-SN foi submetida a uma análise de estrutura
terciária e secundária a fim de observar detalhes estruturais correlacionados com proteínas
referências com estrutura elucidada previamente.
39
Via de silenciamento gênico mediada por miRNAs em S. mansoni
III.3.1.1 Exportinas 1, 5 e T
Neste trabalho, foram preditos três genes e cinco transcritos codificadores de
membros da família de proteínas Exportinas (XPO5, XPO1 e XPOT) no genoma do parasito
S. mansoni (SmExportin5.1, SmExportin5.2, SmExportin1.1, SmExportin1.2 e SmExportinT)
(Tabela 4). Tipicamente, o transporte de precursores de miRNAs tem sido executado pela
proteína XPO-5 com gasto de GTP. Recentemente, foi sugerida também a participação da
proteína XPO-1 no transporte de miRNAs no sentido inverso, do citoplasma para o núcleo
(Castanotto et al., 2009; Bussing et al., 2010). Esta evidência foi corroborada em C. elegans,
onde foi demonstrado que a depleção da proteína CRM1, homóloga a XPO-1, foi
acompanhada de uma grande variação na concentração de miRNAs na célula. Apesar da
função exata dos miRNAs maduros dentro do núcleo ainda ser pouco conhecida, XPO-1 foi
co-precipitada com proteínas nucleares, assim como Argonautas, sugerindo a participação de
miRNAs no remodelamento de cromatina intranuclear (Castanotto et al., 2009).
Homólogos de XPO-5, XPO-1 e XPO-t têm sido reportadas em fungos, plantas e
animais. Uma exceção entre os animais tem sido relatada em organismos Protostômios como
nematóides e artrópodes que perderam durante a evolução uma das três Exportinas (XPO-5
ou XPO-1). Murphy (2008) sugeriu uma especialização das proteínas Exportinas nos
organismos Protostômios em virtude da perda evolutiva de uma delas, a fim de manter os
processos normais de exportação e importação de RNAs dentro das células.
S. mansoni se enquadra no clado de espécies Protostômios, específicamente próximo
de espécies Lophotrochozoans. No entanto, foram identificadas no genoma do parasito
Protostômios não apenas duas Exportinas, como sugerido por Murphy (2008) mas as três
proteínas da classe Exportina: XPO-5 (SmExportin5.1 e SmExportin5.2), XPO-1
(SmExportin1.1 e SmExportin1.2) e XPO-t (SmExportinT). Pela primeira vez tem sido
descrito a identificação destas três proteínas XPOs no clado de Protostômios sugerindo uma
maior complexidade da via de transporte de RNA não codificadores, incluindo os miRNAs,
no parasito S. mansoni.
A fim de enfatizar a conservação destas proteínas preditas identificadas em S.
mansoni, foram realizados uma análise filogenética e um estudo de domínios conservados. A
análise filogenética foi empregada usando proteínas ortólogas previamente identificadas em
espécies de Protostômios e Deuterostômios e as anotadas neste trabalho. A análise revelou
uma distribuição em três diferentes grandes grupos, um para cada Exportina: XPO-5, XPO-1
e XPO-t (Figura 11). As prováveis proteínas de S. mansoni se agruparam com as respectivas
40
Via de silenciamento gênico mediada por miRNAs em S. mansoni
ortólogas próximas de proteínas de Ecdysozoans e Lophotrochozoans como D. melanogaster,
C. elegans e S. japonicum. Proteínas que se enquadraram nos grupos XPO-t e XPO-1 se
mostraram mais próximas evolutivamente quando comparadas com as respectivas parálogas
XPO-5 (Figura 11). Estes resultados corroboram com Murphy (2008) que demonstrou maior
proximidade entre as proteínas ortólogas XPO-t e XPO-1 de animais quando comparadas
suas parálogas XPO-5(Murphy et al., 2008).
Figura 11: Distribuição evolutiva das proteínas XPO5, XPO1 e XPOt. Árvore
filogenética consenso baseada na sequências de resíduos de aminoácidos das proteínas XPO5
, XPO1 e XPOT. Para árvore consenso e confiabilidade dos ramos formados foram utilizados
testes de bootstrap com 2000 réplicas e mínimo de 50% para cada ramo confiável. A árvore
mostrou 3 clados distintos (separado por colchetes) sendo um para cada conjunto de proteínas
41
Via de silenciamento gênico mediada por miRNAs em S. mansoni
ortólogas. As proteínas evidenciadas em caixa cinza representam as proteínas identificadas
neste trabalho. A construção da árvore e a análise do “bootstrap” foram realizadas no
programa MEGA 4.0.
A similaridade das Exportinas identificadas em S. mansoni comparadas com suas
ortólogas foi também analisada ao nível de conservação de domínios conservados. As
proteínas tiveram alto grau de similaridade (XPO5 de S. mansoni e D. melanogaster 8,9e-11 e
1,5e-11, respectivamente) quando comparadas com o domínio conservado consenso XPO1
(PFAM 08389) (Figure 12). Os maiores valores de similaridade com o domínio consenso
foram encontrados nas proteínas ortólogas XPO-1. Estes domínios consensos, presentes no
banco de dados de famílias de proteínas, PFAM, tem sido considerados representativos,
gerando informações valiosas não apenas quanto a posição específica de determinado
aminoácido dentro do domínio conservado, mas também com relação aos seus resíduos
vizinhos. Neste sentido, a presença do domínio conservado e seus resíduos de aminoácidos
em posições definidas na proteína foram considerados relevantes para a determinação da
conservação das proteínas analisadas.
Observou-se valores muito significativos em relação ao domínio conservado XPO1,
para as proteínas preditas SmExportina1.1 (1,8e-40) e SmExportina1.2 (3,6e-38). O mesmo foi
encontrado para ortólogas XPO-1 de D. melanogaster, C. elegans e H. sapiens, com valores
menores que e-38(Figura 12). Além disso, as disposições dos domínios conservados, das
representantes XPO-1 (IBN_N, XPO1 e CRM1_C), XPO-5 (XPO1) e XPO-t (XPO1),
revelaram alto grau de similaridade entre as proteínas de S. mansoni identificadas e suas
ortólogas em C. elegans, D. melanogaster e H. sapiens (Figura 12).
III.3.1.2 Partner de Dicer e Drosha (RNAseIIIs)
A busca de prováveis proteínas, partner-Drosha e partner-Dicer, no genoma de S.
mansoni foi capaz de identificar uma representante cada, Smpartner-Drosha e SmpartnerDicer. As proteínas partners ou auxiliares de Dicer e Drosha tem sido reportadas como
facilitadoras do processo de clivagem dos pri-miRNAs, no núcleo, ou dos pré-miRNAs, no
citoplasma (Denli et al., 2004; Leuschner et al., 2005; Saito et al., 2005). Em vertebrados e
Protostômios Artrópodes tem sido encontrada uma representante partner-Drosha e duas
parálogas de partner-Dicer, PACT (Protein activator of the interferon-induced protein kinase
– Proteína ativadora de proteína quinase dependente de interferon) e TRBP (TAR RNAbinding protein – Proteína TAR ligante de RNA) em Vertebrados e R2D2 e Loquacious em
42
Via de silenciamento gênico mediada por miRNAs em S. mansoni
Artrópodes. No entanto, o Protostômio Ecdysozoan C. elegans apresentou apenas uma
proteína partner-Dicer, denominada RDE-4, e uma partner-Drosha.
Figura 12: Conservação evolutiva dos domínios de XPO5, XPO1 e XPOt. As proteínas
ortólogas XPO5, XPO1 e XPOt encontradas nos organismos D. melanogaster, C. elegans e
43
Via de silenciamento gênico mediada por miRNAs em S. mansoni
H. sapiens e aquelas identificadas no parasito S. mansoni foram comparadas quanto a
disposição e presença de domínios conservados na estrutura primária. A descrição de cada
domínio, foi representada na estrutura por um polígono indicado no rodapé da Figura
juntamente com os números PFAM. O tamanho de cada proteína está indicado no final de
cada sequência e os valores comparativos de cada domínio estão indicados a direita de cada
sequência.
Para avaliar a conservação das proteínas preditas (Tabela 4) de S. mansoni, foram
realizados estudos filogenéticos e análise de domínios conservados utilizando proteínas de
representantes de espécies de Deuterostômios e Protostômios. A distribuição filogenética
destas proteínas revelou uma provável ancestralidade comum entre elas, resultado de uma
provável duplicação gênica (Figura 13). Eventos de duplicação gênica tem sido reportada em
outras proteínas da via de silenciamento gênico mediada por miRNAs como as proteínas
Argonautas, Dicer e FMR1. Além disso, no parasito S. mansoni tem sido também relatado
eventos de duplicação gênica durante o processo evolutivo (Lee et al., 2004; Berriman et al.,
2009; DeMarco et al., 2010).
A árvore filogenética foi realizada utilizando o programa MEGA 4 e como matriz e
modelo, Neighbor joining e JTT. Ficou evidente na figura 13 a presença de dois clados
distintos, sendo um composto por ortólogas e parálogas de partner-Dicer, e outro composto
por ortólogas de partner-Drosha. Tanto a proteína predita SmPartner-Drosha quanto a
proteína predita SmPartner-Dicer se agruparam em seus respectivos clados próximos a
ortólogas de espécies de Protostômios, como D. melanogaster, C. elegans e S. japonicum. A
proteína predita SmPartner-Dicer agrupou-se entre os clados das parálogas de auxiliares de
Dicer encontradas em Protostômios Artrópodes (Loquacious e R2D2). Estas duas proteínas,
Loquacious e R2D2, auxiliares de Dicer-1 e Dicer-2, respectivamente, estão envolvidas em
processos totalmente distintos, compondo complexos ribonucleoproteicos diferentes. As
funções destes complexos têm sido caracterizadas mostrando distintas funções nos
organismos em que os encontra. Por exemplo, mutações realizadas em proteínas do complexo
liderado por Dicer-1 alteram diretamente o processamento de miRNAs, enquanto no
complexo liderado por Dicer-2, o pequeno RNA afetado é o siRNA (Lee et al., 2004;
Jaskiewicz and Filipowicz, 2008).
44
Via de silenciamento gênico mediada por miRNAs em S. mansoni
Figura 13: Distribuição evolutiva das proteínas partner-Drosha e partner-Dicer. A
árvore filogenética consenso foi baseada na sequências de resíduos de aminoácidos das
proteínas partner-Drosha e partner-Dicer. Para árvore consenso e confiabilidade dos ramos
formados foram utilizados testes de bootstrap com 2000 réplicas e mínimo de 30% para cada
ramo confiável. A árvore mostrou 2 clados distintos (caixas cinza) sendo um para cada
conjunto de proteínas ortólogas. As proteínas evidenciadas em negrito representam as
proteínas identificadas neste trabalho. A construção da árvore e a análise do “bootstrap”
foram realizadas no programa MEGA 4.0.
Os domínios conservados destas proteínas também foram identificados e comparados
com as proteínas ortólogas. Ambas as proteínas, partner-Drosha e partner-Dicer,
invariavelmente, apresentaram um domínio conservado DSRM (Domínio de ligação ao RNA
dupla) com provável função e característica de ligação em pequenos RNAs. Este domínio de
45
Via de silenciamento gênico mediada por miRNAs em S. mansoni
ligação de RNA tem sido caracterizado no banco de dados de domínios conservados PFAM
como PF00035 apresentando em sua sequência consenso aproximadamente 65-68 resíduos de
aminoácidos. A presença do domínio conservado DSRM, em ambas as proteínas partners em
S. mansoni (SmPartner-Drosha e SmPartner-Dicer), corroborou com as análises feitas em
suas proteínas ortólogas. As proteínas partner-Dicer em D. melanogaster, C. elegans e H.
sapiens, apresentaram dois domínios DSRM, completos e/ou incompletos, distribuídos em
toda sua estrutura (Figura 14). Esta mesma estrutura foi encontrada para a proteína predita de
S. mansoni SmPartner-Dicer. As proteínas SmPartner-Drosha e suas ortólogas em D.
melanogaster e C. elegans, apresentaram apenas um domínio DSRM. Já a representante em
H. sapiens apresentou dois domínios DSRM.
O tamanho das estruturas primárias destas proteínas variou em uma faixa similar. As
proteínas partner-Dicer apresentaram tamanhos entre 311 e 465 enquanto as proteínas
partner-Drosha apresentaram tamanhos entre 570 e 790 resíduos de aminoácidos.
46
Via de silenciamento gênico mediada por miRNAs em S. mansoni
Figura 14: Conservação evolutiva dos domínios de partner-Drosha e partner-Dicer. As
proteínas ortólogas partner-Drosha e partner-Dicer encontradas nos organismos D.
melanogaster, C. elegans e H. sapiens e aquelas identificadas no parasito S. mansoni foram
comparadas quanto a disposição e presença de domínios conservados na estrutura primária.
Cada domínio esta representado por uma caixa cinza entre o início e o término dos resíduos
de aminoácidos da proteína. O tamanho de cada proteína está indicado no final de cada
sequência e os valores comparativos de cada domínio estão indicados a direita de cada
sequência.
47
Via de silenciamento gênico mediada por miRNAs em S. mansoni
III.3.1.3 FMR1 (Fragile-X mental retardation 1)
Neste trabalho, foram identificadas no genoma de S. mansoni, quatro proteínas da
família FMRP: SmFMR1.1, SmFMR1.2, SmFMR1.3 e SmFMR1.4. FMRP tem sido
encontrada em neurônios e na fenda sináptica associada à polirribossomos e também
participando em mecanismos de silenciamento gênico mediada por miRNAs (Bassell and
Warren, 2008). O número de componentes da família FMRP varia entre espécies de
Deuterostômios e Protostômios. Em humanos, esta família é formada por três proteínas:
FMRP, FXR1P e FXR2P (Cheever and Ceman, 2009). No entanto, em D. melanogaster tem
sido mostrada a presença de apenas uma proteína ortóloga, dFXR (ou dFMR1 ou
dFMRP)(Morales et al., 2002). Tanto as parálogas de FMRP de humanos como a proteína de
D. melanogaster estão envolvidas no silenciamento gênico mediado por miRNAs interagindo
física e funcionalmente com a maquinaria de miRNAs (Morales et al., 2002; Jin et al., 2004;
Cheever and Ceman, 2009). Em S. mansoni duas das quatro proteínas preditas foram
mapeadas em cromossomos sexuais corroborando com dados de espécies de Deuterostômios
que mostra pelo menos uma ortóloga FMRP em cromossomos sexuais. Por exemplo, em
humanos o gene que codifica a proteína FMRP tem sido encontrado no cromossomo sexual X
(Hoogeveen et al., 2002). No entanto, as parálogas FXR1P e FXR2P são encontradas em
cromossomos autossômicos agindo de forma semelhante, mas não compensando totalmente a
deficiência da proteína FMRP (Hoogeveen et al., 2002).
As proteínas preditas, SmFMR1.1, SmFMR1.2, SmFMR1.3 e SmFMR1.4,
apresentaram alta similaridade com proteínas FMRP de organismos ortólogos, com domínios
conservados característicos da família (Figura 15). Esta família em humanos tem mostrado a
presença principal de dois domínios de interação com ribonucleoproteínas: domínio KH
(hnRNP-K) e RGG Box (domínio rico em arginina-glicina-glicina)(Bassell and Warren,
2008). Alguns exemplos de proteínas ortólogas de FMRP têm mostrado como domínio
característico e desempenhador de sua função, o domínio KH1. Por exemplo, a proteína
dFMR1 de D. melanogaster apresenta dois domínios KH1 originados por duplicação e tem
sido relatada seus envolvimento com o controle da atividade neuronal. Também foi
observado que a expressão inibida do gene DFmr1 em diferentes células, desencadeia
fenótipos distintos, sugerindo a participação desta proteína em diversos alvos e mecanismos
intracelulares (Morales et al., 2002).
Análises comparativas entre dFMR1 e as quatro proteínas preditas neste trabalho
revelaram a presença dos 2 domínios KH1 geminados. A presença destes domínios foi
48
Via de silenciamento gênico mediada por miRNAs em S. mansoni
observada comparando a estrutura primária das proteínas preditas com o banco de dados de
domínios conservados PFAM (Figura 15). Os valores de similaridade de cada domínio KH1
nas sequências foram mostrados na Figura 15. A presença destes domínios característicos é
um indicativo da conservação da função destas proteínas em S. mansoni mesmo atuando em
um sistema nervoso primitivo. O sistema nervoso do parasito é formado por dois gânglios
nervosos, que estão ligados a dois cordões nervosos ventrais e longitudinais, que são ligados
por comissuras transversais que percorrem toda a região ventral até a parte posterior do
verme (Collins et al., 2011). Estudo de imunofluorescência tem mostrado a presença de
diversas estruturas neuronais distribuídas por toda estrutura corporal do parasito envolvidas
em funções essenciais do organismo como controle da secreção das glândulas acetabulares
durante a penetração no hospedeiro definitivo (Cousin and Dorsey, 1991; Collins et al.,
2011). A confirmação da presença destes genes no genoma do parasito abre perspectivas para
o estudo e o controle efetivo da infecção de S. mansoni, já que estes genes desempenham
funções essenciais para sua sobrevivência do organismo.
Figura 15: Conservação evolutiva dos domínios de FMR1. As proteínas ortólogas FMR1
encontradas nos organismos D. melanogaster e aquelas identificadas no parasito S. mansoni
foram comparadas quanto a disposição e presença de domínios conservados na estrutura
primária. Cada domínio está representado por uma caixa cinza entre o início e o término dos
resíduos de aminoácidos da proteína. O tamanho de cada proteína está indicado no final de
cada sequência e os valores comparativos de cada domínio estão indicados a direita de cada
sequência.
49
Via de silenciamento gênico mediada por miRNAs em S. mansoni
No intuito de observar a distribuição filogenética das proteínas identificadas
SmFMR1.1, SmFMR1.2, SmFMR1.3 e SmFMR1.4 com suas ortólogas de Protostômios e
Deuterostômios foi realizada uma análise filogenética utilizando como matriz Neigbornjoining e como modelo JTT. A distribuição filogenética das proteínas se mostrou bem
semelhante à distribuição das proteínas ortólogas de S. japonicum devido sua proximidade
evolutiva (Figura 16). Duas das proteínas identificadas, SmFMR1.1 e SmFMR1.2,
permaneceram em um clado entre organismos Deuterostômios e organismos Protostômios
Ecdysozoans. Elas se agruparam juntamente com proteínas preditas provenientes de
organismos Lophotrochozoans como A. california (Molusco) e S. japonicum (Platelminto).
As proteínas SmFMR1.3 e SmFMR1.4 agruparam em outro clado, juntamente com as
proteínas ortólogas de S. japonicum, CAX83129.1 e CAX83129.1 (Figura 16). A distribuição
das proteínas ortólogas de FMRP, na Figura 16, corroborou com a distribuição da árvore da
vida onde as espécies animais se separam em dois grandes superfilos Deuterostômios
(blastóporo se transformando em anus) e os Protostômios (blastóporo transformando em
boca).
Figura 16: Distribuição evolutiva das proteínas FMR1. A árvore filogenética consenso foi
baseada na sequências de resíduos de aminoácidos de proteínas ortólogas FMR1. Para árvore
consenso e confiabilidade dos ramos formados foram utilizados testes de bootstrap com 2000
réplicas e mínimo de 50% para cada ramo confiável. A árvore mostrou clados distintos
(representados por colchetes) sendo um para cada grupo de proteínas ortólogas. As proteínas
50
Via de silenciamento gênico mediada por miRNAs em S. mansoni
evidenciadas em caixas representam as proteínas identificadas neste trabalho. A construção
da árvore e a análise do “bootstrap” foram realizadas no programa MEGA 4.0.
III.3.1.4 Tudor-SN (Tudor staphylococcal nuclease)
A busca por proteínas preditas ortólogas Tudor-SN no genoma de S. mansoni
revelaram a presença de dois transcritos e duas proteínas, provavelmente truncadas no
genoma. As regiões no genoma preditas para este gene provavelmente estão com um erro de
anotação levando ao truncamento das sequências protéicas Smp_166110 e Smp_081570.
Consequentemente o tamanho das sequências de aminoácidos codificadas por estes genes
estão com tamanhos e estruturas subestimadas. Uma alternativa para encontrar a sequência
correta foi buscar, no banco de dados de sequências (ESTs) do parasito, sequências que
cobriam uma maior parte do gene Tudor-SN. Este gene e seu produto protéico foram obtidos
através de uma etiqueta de sequência expressa (EST) obtida nos dados de transcriptoma do
parasito (EST-Sm01663) (Tabela 4). A sequência EST encontrada, Sm01663, mostrou
codificar um produto protéico maior com estrutura semelhante aos genes ortólogos. Além
disso, a proteína predita contém tamanho semelhante às proteínas Tudor-SN ortólogas
sugerindo uma melhor predição para provável proteína.
A proteína Tudor-SN, também chamada de p100, SND1 ou TDRD11, tem sido
identificada em diversos organismos, desde seres unicelulares como leveduras até
multicelulares como humanos(Callebaut and Mornon, 1997; Howard-Till and Yao, 2007; Li
et al., 2008; Zheng et al., 2009). A proteína Tudor-SN tem apresentado como característica
estrutural predominante, a presença de dois domínios conservados: domínio Tudor e domínio
SN. Tem sido mostrado, em relação à disposição destes domínios na proteína, a presença
seqüencial de domínios SN (in tandem) na parte N-terminal da proteína e um domínio Tudor
na porção C-terminal (Callebaut et al., 1997; Li et al., 2008). O domínio SN (staphylococcal
nuclease-like) tem como característica principal a função nucleásica hidrolisando fitas duplas
de RNA (Callebaut et al., 1997; Li et al., 2008). Em geral, as proteínas Tudor-SN são
estruturadas com quatro repetições do domínio SN in tandem, um domínio Tudor na parte Cterminal seguido por um domínio SN incompleto no fim da proteína. A mesma disposição de
domínios tem sido observada na proteína predita SmTudor-SN (Figura 17). O domínio SN é
homólogo de um domínio SN contido em uma proteína chamada thermonuclease-SN de
Staphylococcus aureus. Esta proteína apresentou tamanho de 149 resíduos de aminoácidos
contendo o domínio SN como parte quase integral de sua estrutura.
51
Via de silenciamento gênico mediada por miRNAs em S. mansoni
Utilizando modelagem 2D de resíduos hidrofóbicos, predição da estrutura secundária
e modelagem 3D das proteínas foi possível o estudo da proteína predita SmTudor-SN. Esta
estratégia tem sido utilizada para proteínas com estruturas primárias dissimilares mas
estruturas secundárias semelhantes (Callebaut et al., 1997). Esta mesma estratégia foi
utilizada para a caracterização da proteína SmTudor-SN em S. mansoni já que esta apresenta
estrutura primária relativamente dissimilar. A proteína termonuclease-SN de S. aureus foi
comparada com a proteína predita SmTudor-SN a fim de observar, ao nível secundário de
estrutura, suas semelhanças. A Figura 17 apresenta uma modelagem 2D de resíduos
hidrofóbicos e uma predição das estruturas secundárias das proteínas termonuclease e
SmTudor-SN (Figura 17). A presença de um padrão de estrutura secundária característica dos
domínios SN tem sido mostrada em trabalhos anteriores (Callebaut et al., 1997; Zheng et al.,
2009). A proteína termonuclease mostrou um padrão característico de estruturas secundárias
de nucleases β1-β2-β3-α1-β4-β5-α2-α3 (Figura 17). O mesmo perfil de estrutura secundária
foi mostrado nos domínios SN (1), SN (2), SN (3) e SN (4) da proteína predita SmTudor-SN
corroborando com os resultados de termonuclease-SN (Figura 17). Estes domínios
apresentaram resíduos Asp / Asp importantes no processo de catálise e ligação em fitas de
ácidos nucléicos. O domínio SN (5) predito apresentou-se incompleto em SmTudor-SN,
assim como ocorre em proteínas Tudor-SN ortólogas como em D. melanogaster, não
apresentando os resíduos funcionais para catálise não participando diretamente no sítio ativo
da enzima. O padrão de estrutura secundária β1-β2-β3-α1-β4-β5-α2-α3, tem importantíssimo
papel na interação do domínio SN com os oligonucleotídeos assim como na execução da
função da proteína. Estes resultados corroboram com resultados anteriores que demonstraram
a conservação da estrutura secundária e dos resíduos hidrofóbicos de proteínas Tudor-SN em
humanos, D. melanogaster e Takifugu Rubripes (Callebaut et al., 1997; Zheng et al., 2009)
Como pode ser observado na Figura 18 os domínios SN da proteína SmTudor-SN
apresentaram grandes similaridades ao nível estrutural com o domínio SN da proteína 2SNS.
Apesar da baixa identidade ao nível de aminoácidos entre estas duas proteínas, é notável a
semelhança estrutural. Isto pode ser explicado pela manutenção da propriedade dos
aminoácidos nas estruturas primárias. Pode se notar na estrutura tridimensional a presença de
estruturas secundárias, α hélices e folhas betas, como preditas anteriormente na Figura 17. A
estrutura terciária de cada domínio confirmou a presença da sequência característica das
estruturas, β1-β2-β3-α1-β4-β5-α2-α3, responsável pela função de ligação a fita dupla de RNA
e atividade catalítica (Figura 18).
.
52
Via de silenciamento gênico mediada por miRNAs em S. mansoni
Figura 17: Estruturas secundárias e resíduos hidrofóbicos das proteínas contendo domínio SN. As proteínas termonuclease
(Staphylococcal Nuclease -2SNS) e SmTudor-SN foram representadas na forma 2D evidenciando a estrutura secundária e os resíduos
53
Via de silenciamento gênico mediada por miRNAs em S. mansoni
hidrofóbicos de cada porção da proteína. As estruturas secundárias foram preditas pelo programa PredictProtein e representadas por retângulos
verticais azuis as α hélices e pelos retângulos verticais vermelhos as folhas beta. Os domínios SN foram indicados em cada estrutura por um
traço contínuo preto mostrando em suas extremidades o resíduo de aminoácido inicial e final. Os residuos de aminoácidos foram representados
pelas letras referentes exceto prolina, glicina, serina e treonina que foram representados por ★,◆,▣ e □, respectivamente. Os sítios catalíticos
presentes na proteína 2SNS, descritos por, Ponting (1997) foram mostrados por setas (D21, F34, D40, E43, K84, Y85 and R87). A sequência β1β2-β3-α1-β4-β5-α2-α3 foram mostradas no gráfico representando a sequência de estruturas secundárias caracteristica de domínios SN. As
estruturas secundárias foram preditas utilizando o programa PredictProtein.
54
Via de silenciamento gênico mediada por miRNAs em S. mansoni
Figura 18: Estruturas tridimensionais dos domínios conservados SN em SmTudor-SN e Staphylococcal Nuclease (2SNS). A ilustraçao em
forma de desenho foi obtida atavés da modelagem baseada em homologia no banco de dados repositório Swiss-Model. O programa Pymol foi
utilizado para exposição dos domínios SN obtidos das proteínas SmTudor-SN e Staphylococcal Nuclease. As estruturas α hélices foram
representadas pelas cores vermelho, amarelo e azul claro e as folhas beta representadas por setas azuis e verdes.
55
Via de silenciamento gênico mediada por miRNAs em S. mansoni
As proteínas Tudor-SN símile são encontradas em diversos organismos pertencentes a
reinos distantes como Plantae, Metazoa e Fungi revelando uma distribuição taxonômica
ampla desta proteína (Howard-Till and Yao, 2007; Yang et al., 2007; Li et al., 2008; Zheng et
al., 2009). Neste trabalho, foi realizada uma análise filogenética empregando como matriz
Neigborn-joining e modelo JTT para construção da história evolutiva da proteína predita
SmTudor-SN e suas ortólogas. A distribuição filogenética de SmTudor-SN corroborou com a
distribuição da árvore da vida com separação de Filos e Superfilos. A proteína SmTudor-SN
agrupou juntamente com as proteínas pertencentes a espécies do Superfilo Protostômios,
próximo de artrópodes e nematóides (Figura 19).
A conservação da proteína SmTudor-SN de S. mansoni ao nível estrutural, corrobora
com a hipótese de que a via de silenciamento gênico mediada por miRNA é conservada no
parasito e que também pode participar de outros processos celulares importantes, como por
exemplo, no processamento do RNA.
Figura 19: Distribuição evolutiva das proteínas Tudor-SN. A árvore filogenética consenso
foi baseada na sequências de resíduos de aminoácidos de proteínas ortólogas Tudor-SN
encontradas em três diferentes reinos: Fungi, Plantae e Metazoa. Para árvore consenso e
confiabilidade dos ramos formados foram utilizados testes de bootstrap com 2000 réplicas e
mínimo de 50% para cada ramo confiável. A árvore mostrou clados distintos (representados
por colchetes) sendo um para cada reino. As proteínas evidenciadas em caixas representam as
proteínas identificadas neste trabalho. A construção da árvore e a análise do “bootstrap”
foram realizadas no programa MEGA 4.0.
56
Via de silenciamento gênico mediada por miRNAs em S. mansoni
III.3.2 Análise da expressão gênica
Para avaliar a expressão relativa dos genes envolvidos no silenciamento gênico
mediado por miRNA (SmDrosha1/2, SmPartner-Drosha, SmPartner-Dicer, SmFmr1.1,
SmTudor-SN e SmExportin-5.1/2) foi utilizada a técnica de qRT-PCR e as seguintes fases do
parasito: cercária, esquistossômulos mecanicamente transformados de 3,5 horas (EMT-3,5), 1
dia (EMT-24), 2 dias (EMT-48), 3 dias (EMT-72), 5 dias (EMT-5d), 7 dias (EMT-7d) e
vermes adultos. Os transcritos foram avaliados neste estudo e os dados foram normalizados
utilizando o gene endógeno α tubulina em todos os estágios estudados. As figuras 20, 21 e 22
mostram o padrão de expressão gênica dos constituintes da via de miRNAs em diferentes
estágios do parasito. Todos os genes analisados foram expressos nos estágios analisados,
entretanto, observou-se que a quantidade relativa de mRNA destes genes nos estágios de
cercária e esquistossômulos recém transformados (EMT-3,5 e EMT-24) mostraram expressão
2 vezes maior em relação aos outros estágios (p<0.05) (Figura 20, 21 e 22).
Analisando individualmente a quantidade relativa de mRNA dos genes que codificam
proteínas do complexo RISC, foi possível verificar que SmFmr1.1 é o mais abundante. O
gene SmFmr1.1 foi encontrado regulado com expressão mais elevada nos estágio de cercária,
EMT-3.5h, EMT-24h e EMT-5d. No caso específico do estágio de vida cercária, o transcrito
deste gene apresentou de 2 a 15 vezes mais expressão do que os outros genes. Isto sugere que
este gene pode estar envolvidos com outras funções além do silenciamento gênico mediado
por miRNAs. Em D. melanogaster tem sido encontrado apenas uma representante homóloga
da proteína FMRP encontrada em mamíferos chamada DFmr1. Tem sido relatado, em D.
melanogaster, que o envolvimento desta proteína não está apenas relacionado com atividades
de silenciamento mediada por miRNAs mas também controle neuronal. Diferentes células
neuronais com a expressão inibida do gene DFmr1 apresentaram diferentes fenótipos
sugerindo a participação desta proteína em diversos alvos e mecanismos (Morales et al.,
2002). Estudos anteriores, em células animais, têm relatado a participação deste gene, em
altas concentrações, no controle da tradução de alguns genes alvos (Mazroui et al., 2002).
Assim como SmFmr1.1, os transcritos de SmDrosha1/2 e SmExportin5.1/2 mostraram
expressões elevadas em cercária e EMT-3,5. O transcrito SmTudor-SN apresentou uma alta
expressão em cercária evidenciando a tendência de uma maior expressão dos transcritos da
via de miRNAs neste estágio. SmPartner-Drosha e SmPartner-Dicer demonstraram a mesma
tendência de alta expressão em cercárias e esquistossômulos jovens com um decréscimo
significativo em EMT-5d (Figura 20, 21 e 22).
57
Via de silenciamento gênico mediada por miRNAs em S. mansoni
Estudos anteriores tem demonstrado a expressão gênica de alguns componentes da
maquinaria de silenciamento gênico mediada por miRNAs no gênero Schistosoma (KrautzPeterson and Skelly, 2008; Gomes et al., 2009; Chen et al., 2010; Luo et al., 2010). KrautzPeterson (2008) demonstrou a expressão do gene SmDicer em diversas fases do parasito S.
mansoni. Ele demonstrou uma expressão elevada nas fases de ovos e esquistossômulos
quando comparada com vermes adultos. A mesma conclusão foi observada por nosso grupo
em 2009, em relação ao transcrito do gene SmDicer na qual foi observada uma expressão
mais elevada na fase de ovos e esquistossômulos quando comparada com outras fases
(Gomes et al., 2009). Isto pode estar associado à diferenciação gênica que o parasito sofre nas
primeiras horas pós-infecção levando a um controle da expressão gênica mais acentuada nas
fases de esquistossômulos. Além disso, a expressão gênica dos transcritos de SmAgo2/3/4 nas
diferentes fases do parasito apresentou semelhante perfil de expressão (Gomes et al., 2009).
No parasito S. japonicum tem sido também descrito um perfil diferencial nas
expressões de genes centrais da via de miRNAs como Argonauta e Dicer (Chen et al., 2010;
Luo et al., 2010). Chen, 2010 mostrou que a expressão dos genes Argonautas, tanto ao nível
de mRNA (Real Time PCR) quanto ao nível protéico (Western Blotting), foi mais abundante
em ovos quando comparada com outros estágios corroborando com dados de S. mansoni.
Além disso, houve uma expressão diferencial em vermes adultos fêmea e macho (Chen et al.,
2010).
A hipótese levantada é que existe uma correlação positiva entre a abundância de
mRNA envolvidos na biogênese de miRNAs e a quantidade de miRNAs nos estágios de
transição cercária-esquistossômulos.
Figura 20: Expressão relativa dos genes (A) SmDrosha1/2 e (B) SmExportina5.1/2 no
desenvolvimento de S. mansoni. A expressão destes genes foi avaliada nos estágios de
cercárias, esquistossômulos mecanicamente transformados (EMT-3,5 horas, EMT-24 horas,
58
Via de silenciamento gênico mediada por miRNAs em S. mansoni
EMT-48 horas, EMT-72 horas, EMT-5 dias, EMT-7 dias) e vermes adultos. Como
normalizador (gene constitutivo) foi utilizado o gene da α-tubulina e a expressão gênica
relativa foi determinada pelo método do 2-ΔCt. A análise estatística foi realizada utilizando o
teste de Tukey com P<0,05 no programa GraphPad Prism. As diferenças estatísticas entre os
estágios foram determinadas pelos sinais: * diferente de cercária, ** diferente de EMT-3,5
horas, *** diferente de EMT-24 horas, # diferente de EMT-48 horas, ## diferente de EMT-72
horas, ### diferente de EMT-5 dias, & diferente de EMT-7 dias.
Figura 21: Expressão relativa dos genes (A) SmPartner-Dicer e (B) SmPartner-Drosha
no desenvolvimento de S. mansoni. A expressão destes genes foi avaliada nos estágios de
cercárias, esquistossômulos mecanicamente transformados (EMT-3,5 horas, EMT-24, EMT48 horas, EMT-72 horas, EMT-5 dias, EMT-7 dias) e vermes adultos. Como normalizador
(gene constitutivo) foi utilizado o gene da α-tubulina e a expressão gênica relativa foi
determinada pelo método do 2-ΔCt. A análise estatística foi realizada utilizando o teste de
Tukey com P<0,05 no programa GraphPad Prism. As diferenças estatísticas entre os estágios
foram determinadas pelos sinais: * diferente de cercária, ** diferente de EMT-3,5 horas, ***
diferente de EMT-24 horas, # diferente de EMT-48 horas, ## diferente de EMT-72 horas, ###
diferente de EMT-5 dias, & diferente de EMT-7 dias.
Figura 22: Expressão relativa dos genes (A) SmTudor-SN e (B) SmFmr1.1 no
desenvolvimento de S. mansoni. A expressão destes genes foi avaliada nos estágios de
cercárias, esquistossômulos mecanicamente transformados (EMT-3,5 horas, EMT-24 horas,
EMT-48 horas, EMT-72 horas, EMT-5 dias, EMT-7 dias) e vermes adultos. Como
59
Via de silenciamento gênico mediada por miRNAs em S. mansoni
normalizador (gene constitutivo) foi utilizado o gene da α-tubulina e a expressão gênica
relativa foi determinada pelo método do 2-ΔCt. A análise estatística foi realizada utilizando o
teste de Tukey com P<0,05 no programa GraphPad Prism. As diferenças estatísticas entre os
estágios foram determinadas pelos sinais: * diferente de cercária, ** diferente de EMT-3,5
horas, *** diferente de EMT-24 horas, # diferente de EMT-48 horas, ## diferente de EMT-72
horas, ### diferente de EMT-5 dias, & diferente de EMT-7 dias.
Os resultados obtidos até o momento sugerem que os genes envolvidos no
silenciamento gênico mediado por miRNA são mais abundantes em cercárias e
esquistossômulos jovens (Figuras 20, 21 e 22). Considerando que a cercária é a forma
infectante do hospedeiro mamífero e que a sobrevivência do parasito envolve adaptações
devido a troca de ambiente, diferentes temperaturas, concentração de glicose e passando de
um ambiente com alto nível de oxigênio (meio aquático) para um rico em gás carbônico
(plasma sanguíneo), sugere-se que a via de processamento de miRNAs provavelmente
desempenha um papel importantíssimo nesta transição e adaptação. Após a perda da calda, a
cercária passa por momentos de instabilidade dentro do hospedeiro definitivo onde sofre uma
série de eventos a fim de adquirir novas características para sua sobrevivência. Uma
característica desta fase de transição é a capacidade do organismo sobreviver sem uma
transcrição real de mRNAs e uma tradução real de proteínas, o que levantou a hipótese da
participação de processos pós-transcricionais regulando genes nesta fase (Wilson and Barnes,
1979; Blanton and Licate, 1992). Baseado nesta hipótese e nos resultados encontrados neste
trabalho, pode ser sugerido uma possível participação efetiva de miRNAs no silenciamento
gênico durante transição cercária para esquistossômulos jovens.
Uma perspectiva deste trabalho é a realização de Western Blot para as proteínas da via
de miRNAs preditas no parasito a fim de obter informações mais exatas da participação desta
via no silenciamento gênico mediado por miRNAs nos diferentes estágios do parasito.
III.3.3 Regulação pós-transcicional em S. mansoni
Baseado nas funções destas proteínas e suas prováveis posições nos compartimentos
celulares, núcleo e citoplasma, sugere-se um mecanismo de participação desta via no parasito
S. mansoni. A via de miRNA, em S. mansoni, possui três proteínas preditas presentes no
núcleo: SmDrosha1, SmDrosha2 e SmPartner-Drosha. Elas tem como funções o
reconhecimento dos miRNAs primários, transcritos a partir do genoma, e o processamento
em precursores de miRNAs para posterior transporte núcleo-citoplasma. Esta função de
transporte núcleo-citoplasma é desempenhada por proteínas presentes na membrana nuclear
60
Via de silenciamento gênico mediada por miRNAs em S. mansoni
como XPO-1 e XPO-5. As proteínas identificadas em S. mansoni com a função de transporte
núcleo-citoplasma foram SmExportina5.1 e SmExportina5.2 e para o caminho inverso
citoplasma-núcleo SmExportina1.1 e SmExportina1.2. No citoplasma os precursores de
miRNAs são reconhecidos por um complexo semelhante ao complexo nuclear
SmDrosha/SmPartner-Drosha, denominado SmDicer/SmPartner-Dicer. Ambos os processos
são formados por uma RNAseIII e uma proteína ligante de RNA auxiliar com funções
similares de clivagem de fita dupla de RNA. Após a segunda clivagem, o miRNAs maduro é
liberado e então reconhecido pelo complexo de silenciamento gênico mediado por miRNAs
denominado RISC. Em S. mansoni foram preditas as seguintes proteínas constituintes deste
processo: SmAgo1, SmAgo2, SmAgo3, SmAgo4, SmFmr1.1, SmFmr1.2, SmFmr1.3,
SmFmr1.4 e SmTudor-SN. As proteínas necessárias para formação de RISC e os miRNAs
maduros compõe este complexo ribonucleomultiproteico.
A Figura 23 ilustra como seria a atuação conjunta destes 13 genes e 18 transcritos na
biogênese de miRNAs, evidenciando que o parasito tem todos os genes essenciais para fazer
uma regulação da expressão gênica ao nível pós-transcricional. A grande questão é: qual a
vantagem para o parasita transcrever normalmente um gene, mas não traduzido-lo? Seria
importante
para
o
estabelecimento
do
parasitismo?
Para
a
diferenciação
e/ou
desenvolvimento do parasito? O fato dos genes envolvidos na formação do complexo RISC
serem diferencialmente expressos levanta a hipótese de que essa via tem um papel importante
no silenciamento gênico em cercárias, entretanto o repertório de miRNA em S. mansoni é
pouco conhecido. Estas evidências nos motivaram a explorar os dados genômicos e
transcriptômicos para identificar miRNAs em S. mansoni. Finalmente, parte dos resultados
apresentados neste capitulo serviram para a elaboração do manuscrito intitulado
Evolutionarily conserved and developmentally-regulated expression of miRNA biogenesis
and RISC complex components in Schistosoma mansoni., em revisão no periódico Gene
(Anexo 2).
61
Via de silenciamento gênico mediada por miRNAs em S. mansoni
Figura 23: Mecanismo proposto da via de silenciamento gênico mediada por miRNAs
no parasito S. mansoni. A via de miRNA envolve grupos de proteínas nucleares e
citosólicas. As proteínas nucleares tem a função de expressar e processar o miRNA primário
e posteriormente exportá-lo para o citoplasma. No citoplasma, proteínas processam os
precursores de miRNA transformando-os em moléculas ativas aptas a atuarem no processo de
regulação da expressão gênica.
62
Predição Computacional de miRNAs em S. mansoni
Capítulo IV
Predição computacional de miRNAs em S. mansoni
63
Predição Computacional de miRNAs em S. mansoni
IV.1 Justificativa
Diferentes estratégias têm sido empregadas para identificação de miRNAs, maduros e
seus precursores, em diversas espécies de fungos, plantas e animais (Hammond, 2006; Huang
et al., 2010). A identificação de miRNAs, conservados e não conservados, tem sido realizada
utilizando estratégias experimentais e computacionais (Hammond, 2006; Huang et al., 2010).
A detecção destas moléculas utilizando estratégia experimental (baseada em clonagem
molecular, sequenciamento e expressão) pode ser tecnicamente um desafio, particularmente
devido à transcrição dos miRNAs serem restritas a determinadas condições ou tipos celulares
(Li et al., 2010a). Cobrindo esta deficiência, as abordagens computacionais vêm auxiliando as
abordagens experimentais na identificação de novos miRNAs. Uma das vantagens das
estratégias in silico tem sido a utilização de sequências do genoma e/ou transcriptoma para
identificação de novos miRNAs evitando a perda de miRNAs reais expressos apenas em
tecidos ou estágios específicos ou em quantidades muito inferiores ao mínimo detectável pela
metodologia. No entanto, a identificação dos miRNAs possuem limitações como
incapacidade de utilização de ferramentas convencionais de alinhamento de sequências e
complexidade na obtenção dos algoritmos empregados. Nos últimos anos, vários miRNAs,
identificados computacionalmente, têm sido validados empregando métodos experimentais.
A elaboração de ferramentas mais específicas para predição de miRNAs, direcionando a
identificação de por exemplo, miRNAs espécie-específicos, tem favorecido a sensibilidade
dos métodos, aumentando as chances de se obter moléculas biologicamente reais.
O estudo e caracterização de miRNAs no gênero Schistosoma tem sido empregados
com sucesso (Xue et al., 2008; Copeland et al., 2009; Huang et al., 2009; Hao et al., 2010;
Wang et al., 2010). Copeland (2009) baseado em homologia de sequências identificou e
caracterizou diferentes classes de ncRNAs, incluindo, miRNAs. O número de miRNAs
conservados encontrados em S. mansoni foi notavelmente baixo sugerindo um estilo de
parasitismo específico. Simões (2011) utilizando abordagem computacional, bibliotecas de
RNA e Northern blot identificou prováveis miRNAs em S. mansoni sendo a maioria espécieespecífico. No entanto, um estudo mais detalhado do repertório de miRNAs conservados e
não conservados em S. mansoni tem sido considerado necessário.
Neste trabalho, foi utilizada uma abordagem computacional robusta para
identificação, caracterização e mapeamento de miRNAs no genoma e transcriptoma de S.
mansoni, avaliando tanto os miRNAs conservados quanto os não conservados. Esta estratégia
64
Predição Computacional de miRNAs em S. mansoni
vem suprir as necessidades de obtenção e caracterização de novos miRNAs conservados e
não conservados envolvidos na regulação da expressão gênica no parasito.
65
Predição Computacional de miRNAs em S. mansoni
IV.2 Materiais e Métodos
IV.2.1 Banco de dados de sequências de miRNAs e de S. mansoni
As sequências do genoma e transcriptoma de S. mansoni foram recuperadas a partir
do banco de dados GeneDB (http://www.genedb.org) (Berriman et al., 2009). A partir da
nova versão do genoma, v5.0, foram recuperados em formato fasta 885 sequências scaffolds
(Berriman et al., 2009). Cada sequência, representando um scaffold, foi separada em formato
fasta distinto facilitando a recuperação de trechos específicos. Estas sequências foram
armazenadas em formato fasta para utilização em análises posteriores.
Os miRNAs, 17341 formas maduras e 15172 precursores, foram recuperados a partir
do banco de dados de miRNAs (Welcome Trust Sanger Institute’s miRBase,
http://microrna.sanger.ac.uk - release 16.0)(Griffiths-Jones, 2010; Kozomara and GriffithsJones, 2011). A separação das sequências de miRNAs, precursoras e maduras, representando
clados específicos dentro da árvore filogenética da vida, foi realizada utilizando miRBase
Browser e um script escrito em PERL. Este script selecionou dentre os miRNAs depositados
no banco de dados, aqueles que pertenciam a cada grupo específico, ou espécie determinada.
Assim, foi separado em vários arquivos multi-fasta, sequências de miRNAs maduros e
precursores referentes às espécies do clado: Animais, Deuterostômios, Protostômios,
Ecdysozoa, Lophotrochozoa e Schistosoma.
IV.2.2 Identificação de miRNAs maduros e seus precursores (pré-miRNAs)
Para identificação e busca de prováveis miRNAs maduros e seus precursores no
parasito S. mansoni foi desenvolvido um algoritmo integrado e otimizado almejando miRNAs
conservados e não conservados, partindo de sequências depositadas em bancos de dados de
genoma e transcriptoma de S. mansoni. Primeiramente, foram obtidas as sequências do
genoma e transcriptoma com potencial formação de estruturas de grampo ou com alta
similaridade com estruturas secundárias de pré-miRNAs de animais. Para esta etapa, os
programas blastn e Einverted (ferramenta EMBOSS) foram empregados. Os parâmetros
utilizados para o programa Einverted foram maxrepeat 95 nucleotídeos e “score threshold”
coletando sequências entre 60 e 100 nucleotídeos, faixa de tamanho correspondente a maioria
dos pré-miRNAs conhecidos até o momento. Para execução do Blastn foram utilizadas 11796
sequências de busca representando os pré-miRNAs de todas as espécies de animais
66
Predição Computacional de miRNAs em S. mansoni
depositadas no banco de dados de miRNAs miRBase. Os parâmetros utilizados foram e-value
menor que 0,001 tamanho mínimo de pareamento 25 nucleotídeos por sequência e 80% de
identidade na região reconhecida como similar. As sequências produtos foram recuperadas
dos bancos de dados de S. mansoni considerando o número de nucleotídeos a jusante e a
montante da sequência de busca inicial. Para execução deste procedimento o programa blastn
foi instalado em plataforma Linux e executado juntamente com um script desenvolvido em
PERL para recuperação das sequências. Desta forma, foi possível obter a partir dos dois
bancos, aproximadamente um milhão e trezentas mil (1300000) sequências com formato
provável de grampo (“hairpin”). A Figura 24 ilustra todo o procedimento executado para
identificação de precursores e formas maduras de miRNAs conservados e não conservados.
IV.2.3 Identificação de miRNAs conservados
Para aumentar a eficácia e acurácia da predição dos pré-miRNAs (pré-miRNAs) e suas
formas maduras, as 1300000 sequências, foram empregadas em uma série de filtros. O intuito
destes filtros foi eliminar sequências indesejáveis e permitir a permanência daquelas
correspondentes aos prováveis miRNAs. Estes filtros foram selecionados baseados em
características conservadas de precursores reais de miRNAs e características de regiões
conhecidas que não tinham potencial para formação de pré-miRNAs. Cada etapa eliminou
sequências que não enquadravam nas características de pré-miRNAs e manteve aquelas
sequências com características compatíveis. O primeiro filtro analisado utilizou a propriedade
de dobramento da estrutura secundária dos pré-miRNAs para eliminar sequências que não
correspondiam a prováveis moléculas de pré-miRNAs. Essa propriedade foi analisada
utilizando valores da energia livre mínima (MFE) das moléculas após o dobramento obtido a
partir do programa RNAfold utilizando os parâmetros "-p -d2 -noLP" (Hofacker, 2009) . O
valor de energia livre mínima, -20 kcal/mol, em geral, é considerada a energia necessária para
que uma molécula de pré-miRNAs sejam estáveis e possam gerar miRNAs maduros em
etapas subseqüentes. Desta forma, aquelas sequências com valores menores que -20 kcal/mol,
mais estáveis, foram separadas e analisadas em relação ao seu conteúdo de guanina e citosina
(GC).
67
Predição Computacional de miRNAs em S. mansoni
Figura 24: Fluxograma da abordagem computacional para identificação de miRNAs
conservados e não conservados em S. mansoni
O algoritmo criado aceitou como sequências positivas aquelas com conteúdo de GC
entre 30% e 65%, valores apropriados para pré-miRNAs em animais (Zhou et al., 2009). No
próximo filtro foi utilizado 13278 miRNAs maduros provenientes de organismos do reino
Animal, depositados no miRBase, e comparados utilizando Blastn com as sequências
precursoras remanescentes do passo anterior. Foi admitido como similaridade mínima
68
Predição Computacional de miRNAs em S. mansoni
àquelas sequências que mostraram um mínimo de 85% de identidade em relação ao conteúdo
de nucleotídeos total do miRNA maduro e 100% com a região semente (“seed region”) do
mesmo. Além disso, as sequências foram descartadas as sequências no qual os miRNAs
maduros correspondentes foram encontrados nos loops das estruturas secundárias evitando
falsos positivos. As sequências remanescentes neste passo foram verificadas quanto sua
identidade em relação aos prováveis RNAs não codificadores de proteínas preditos por
Copeland (2009) no parasito S. mansoni. Estão incluídos nesta biblioteca de sequências de
RNAs não codificadores moléculas tais como: RNA ribossomais (5S, 18S, 5.8S e 28S),
provável 7SK, provável MRP, RNase P, siRNAs, componentes dos spliceossoma snRNAs
(U1, U2, U4, U4atac, U5, U6, U6atac, U11, U12), SRP, RNA transportadores e snoRNA. Foi
usado o blastn para verificação de similaridade entre as sequências. O parâmetro utilizado
para eliminação de sequências foi e-value menor que 0,0001, alinhamento mínimo entre o par
de sequências de 40 nucleotídeos e 95% de identidade entre as sequências.
No passo seguinte, foram eliminadas as sequências com alta similaridade com predita
região codificadora de proteína. Foi utilizada para esta identificação o programa blastn com
valores similares aos mostrados acima e sequências query de busca mRNAs provenientes de
predições gênicas contidas no banco de dados GeneDB. A próxima etapa eliminou as
sequências com alta identidade com regiões de elementos repetitivos, assim como
transposons, retrotransposons, repetições simples, repetições in tandem e outras. Foi utilizado
RepeatMasker, alocado no site (http://www.repeatmasker.org/), para eliminação das
sequências com alta similaridade com sequências repetitivas presentes no genoma de S.
mansoni (Chen, 2004). Utilizamos como ferramenta de busca, a ferramenta “search engine”,
e como auxiliar, “cross_match”, que apesar de ser mais lenta para o processamento das
sequências, frequentemente responde mais sensivelmente as buscas no banco de dados. As
três etapas anteriores foram estritamente importantes devido ao fato que tanto as moléculas
de RNAs não codificadoras de proteínas quanto às moléculas de elementos repetitivos e
mRNAs
possuírem
estruturas
secundarias
estáveis
e
muitas
vezes
semelhantes
estruturalmente aos pré-miRNAs.
Finalmente, após a eliminação destas sequências, a ferramenta Mipred foi empregada
com o intuito de classificar as estruturas de miRNAs. Esta ferramenta utiliza tecnologia de
aprendizado de maquina vetorizado e “random Forest” baseado em características específicas
das moléculas de miRNAs reais, miRNAs não reais e pseudo miRNAs (Jiang et al., 2007).
Esta ferramenta tem como função distinguir entre estas três classes, onde se enquadra as
sequências não treinadas. As sequências remanescentes do ultimo passo foram então
69
Predição Computacional de miRNAs em S. mansoni
alimentadas no programa MiPred para classificação. Foram mantidas como sequências
positivas ou seja, preditos pré-miRNAs, apenas aquelas estruturas que classificadas como
miRNAs reais.
IV.2.4 Identificação de miRNAs não conservados
Para identificação de moléculas precursoras e maduras de miRNAs não conservados a
estratégia utilizada foi bem semelhante à estratégia de identificação de miRNAs conservados
supracitada. O algoritmo acima foi modificado em três pontos distintos. O primeiro ponto
alterado foi a manutenção apenas das estruturas secundárias encontradas concomitantemente
nos bancos de dados, genômico e transcriptômico de S. mansoni. O outro ponto modificado
foi executado no início do procedimento, no qual o procedimento de comparação das
prováveis sequências de pré-miRNAs obtidas do transcriptoma e genoma de S. mansoni com
o banco de dados de miRNAs maduros de animais do miRBase foi retirado. Foi preciso
retirar este passo, pois apenas as sequências não conservadas deveriam ser mantidas no grupo
de possíveis sequências. O terceiro e último ponto modificado foi a inclusão no final do
procedimento de um programa para busca de sequências de miRNAs maduros em estruturas
secundarias de pré-miRNAs. O programa empregado foi MatureBayes web tool
disponibilizado no site (http://mirna.imbb.forth.gr/MatureBayes.html)(Gkirtzou et al., 2010).
IV.2.5 Análise comparativa dos miRNAs identificados em S. mansoni
Análises adicionais foram realizadas utilizando as sequências preditas conservadas e
não conservadas de pré-miRNAs encontradas no genoma de S. mansoni. As características
destas sequências foram comparadas com um conjunto de pré-miRNAs encontrados em
outros grupos de organismos. Utilizando informações provindas do miRBase Browser as
sequências foram divididas em 6 grupos distintos: Animais, Deuterostômios, Protostômios,
Ecdysozoa, Lophotrochozoa e Schistosoma. Estas análises envolveram o estudo de vários
parâmetros relacionados com a estrutura secundária e primária dos pré-miRNAs, dentre eles:
energia mínima livre (MFE), tamanho do precursor, energia mínima livre ajustada (AMFE),
índice de energia mínima livre (MFEI), conteúdo de GC (GC), energia mínima livre do
conjunto termodinâmico (MFEE), diversidade do conjunto termodinâmico e freqüência da
estrutura de energia mínima livre no conjunto termodinâmico. O parâmetro AMFE foi
medido utilizando o MFE encontrado para 100 nucleotídeos em tamanho. O parâmetro
70
Predição Computacional de miRNAs em S. mansoni
AMFE foi calculado seguindo a seguinte formula: MFEI = [(AMFE) × 100] / (G% + C%)]
(Zhang et al., 2006a). As medidas de diversidade do conjunto termodinâmico, freqüência da
estrutura de energia mínima livre no conjunto termodinâmico e MFE foram obtidas usando
RNAfold. O conteúdo de GC e tamanho da sequência foram calculados utilizando scripts
escritos em PERL e aplicados para todas as estruturas em questão.
IV.2.6 Identificação de clusteres de miRNAs
A busca de clusteres de miRNAs foi otimizada utilizando informação obtida através
da posição de cada miRNA identificado no genoma de S. mansoni. Os miRNAs encontrados
em uma distância menor que dez mil nucleotídeos a jusante ou a montante dependendo da
direção na fita de DNA foram considerados ligados em um cluster de miRNA. Cada trecho de
sequência foi recuperado do genoma de S. mansoni versão 5.1 utilizando informações do
primeiro e ultimo nucleotídeo do cluster. A estrutura secundaria de cada cluster foi obtida
utilizando a ferramenta RNAfold (Hofacker, 2009).
IV.2.7 Conservação e Distribuição Filogenética dos miRNAs de S. mansoni
As sequências de pré-miRNAs conservados assim como seus respectivos miRNAs
homólogos foram submetidos ao alinhamento múltiplo de sequência utilizando as ferramentas
ClustalX 2.0 e RNAalifold (Thompson et al., 2002). Foram usados os seguintes parâmetros
de alinhamento para a ferramenta ClustalX 2.0: abertura de espaço (“gap opening”) 22,50;
extensão do espaço (“gap extension”) 0,83(Takane et al., 2010). As sequências de miRNAs
maduros
conservados
de
S.
mansoni
foram
submetidos
ao
Weblogo
2.8.2
(http://weblogo.berkeley.edu/logo.cgi) juntamente com seus respectivos homólogos gerando
“logos” de nucleotídeos representativos de cada específica posição do miRNA
maduro(Crooks et al., 2004).
A distribuição filogenética dos pré-miRNAs de S. mansoni e seus homólogos foi
realizada utilizando o método Neighbor joining aplicando o modelo Kimura dois parâmetros
(“Kimura-two parameters”) para estimar a divergência entre as sequências(Saitou and Nei,
1987). Tanto o método quanto o modelo foram aplicados utilizando a ferramenta MEGA
4(Tamura et al., 2007). A confiabilidade estatística de cada ramo na árvore gerada foi
avaliada utilizando “bootstrap” com 2000 réplicas. Os valores de “bootstrap” maiores que 30
foram mantidos entre os nós de cada ramo. Para melhor visualização nós indicamos o
71
Predição Computacional de miRNAs em S. mansoni
agrupamento de sequências baseados na filogenia da arvore evolutiva consenso. As
abreviações para cada organismo nas árvores filogenéticas são mostradas a seguir: aae (Aedes
aegypti), aga (Anopheles gambiae), age (Ateles geoffroyi), ame (Apis mellifera), api
(Acyrthosiphon pisum), bfl (Branchiostoma floridae), bma (Brugia malayi), bmo (Bombyx
mori), bta (Bos taurus), cbr (Caenorhabditis briggsae), cel (Caenorhabditis elegans), cfa
(Canis
familiaris),
cin
(Ciona
intestinalis),
cqu
(Culex
quinquefasciatus),
crm
(Caenorhabditis remanei), csa (Ciona savignyi), cte (Capitella teleta), dan (Drosophila
ananassae), der (Drosophila erecta), dgr (Drosophila grimshawi), dme (Drosophila
melanogaster), dmo (Drosophila mojavensis), dpe (Drosophila persimilis), dps (Drosophila
pseudoobscura), dpu (Daphnia pulex), dre (Danio rerio), dse (Drosophila sechellia), dsi
(Drosophila simulans), dvi (Drosophila virilis), dwi (Drosophila willistoni), dya (Drosophila
yakuba), eca (Equus caballus), fru (Fugu rubripes), gga (Gallus gallus), ggo (Gorilla
gorilla), hsa (Homo sapiens), isc (Ixodes scapularis), lgi (Lottia gigantea), lmi (Locusta
migratoria), mdo (Monodelphis domestica), mml (Macaca mulatta), mmu (Mus musculus),
mne (Macaca nemestrina), nlo (Nasonia longicornis), nvi (Nasonia vitripennis), oan
(Ornithorhynchus anatinus), ppa (Pan paniscus), ppc (Pristionchus pacificus), ppy (Pongo
pygmaeus), ptr (Pan troglodytes), rno (Rattus norvegicus), sja (Schistosoma japonicum), sko
(Saccoglossus kowalevskii), sla (Saguinus labiatus), sma (Schistosoma mansoni), sme
(Schmidtea mediterranea), spu (Strongylocentrotus purpuratus), ssc (Sus scrofa), tca
(Tribolium castaneum), tgu (Taeniopygia guttata), tni (Tetraodon nigroviridis), xla (Xenopus
laevis), xtr (Xenopus tropicalis).
IV.2.8 Análises estatísticas e plotagem de gráficos
A análise estatística e plotagem dos gráficos boxplots foram executadas utilizando o
programa R 2.12.1 (1 (“The R Project for Statistical Computing” - http://www.r-project.org/).
O conjunto de dados utilizados para cada característica dos miRNAs foram obtidas utilizando
PERL scripts e o programa RNAfold (Vienna package)(Hofacker, 2009).
72
Predição Computacional de miRNAs em S. mansoni
IV.3 Resultados e Discussão
IV.3.1 Identificação de miRNAs no genoma de S. mansoni
Inicialmente, as sequências do genoma e do transcriptoma de S. mansoni foram
recuperadas do banco de dados GeneDB e armazenadas em formato fasta para posterior
análise. As sequências do genoma de S. mansoni tem sido sequenciadas por iniciativas do
TIGR (The Institute for Genomic Research) em associação com o Wellcome Trust Sanger
Institute e armazenadas no banco de dados GeneDB. Em 2009, Berriman et al, publicaram
um conjuntos de dados do genoma de S. mansoni abrindo novas possibilidades para
exploração do parasito (Berriman et al., 2009). As sequências do transcriptoma foram
sequenciadas a partir de iniciativas de sequenciamento de agências brasileiras (FAPESP e
FAPEMIG) e atualmente tem sido depositadas em arquivos de contigs de ESTs também no
banco de dados GeneDB (Verjovski-Almeida et al., 2003; Oliveira, 2007). O genoma de S.
mansoni tem sido periodicamente atualizado no GeneDB, com novas versões de cobertura,
devido ao não fechamento e não sobreposição de todas suas extremidades. A versão 4.0 do
genoma continha 19022 scaffolds contemplando 8 vezes a cobertura do genoma. A última
versão 5.0, diminuiu esta quantidade de scaffolds para 885 originando informações mais
robustas para a pesquisa de sequências de DNA como por exemplo mapeamento provável das
sequências nos cromossomos do parasito. A diminuição em número de scaffolds é relativa a
montagem mais precisa das sequências do genoma do parasito. As sequências de ESTs
utilizadas foram compostas por contigs provenientes de bibliotecas de cDNA de todas as
fases do parasito S. mansoni. Neste trabalho, foram utilizadas para as análises
aproximadamente 30000 contigs do banco de dados de ESTs e 885 cromossomos scaffolds da
versão 5.0 do genoma do parasito S. mansoni (GeneDB).
Para identificação de miRNAs, maduros e precursores, no genoma e transcriptoma de
S. mansoni, uma abordagem computacional integrada foi desenvolvida neste trabalho. Os
miRNAs preditos foram agrupados em conservados e não conservados (incluindo novos
miRNAs). Para identificação destes dois grupos, inicialmente, as sequências provindas do
genoma e o transcriptoma do parasito foram examinadas a fim de se obter e recuperar apenas
sequências com potencial de formação de estruturas secundárias semelhantes à estrutura de
pré-miRNAs (hairpins). Estudos anteriores tem mostrado a importância desta estrutura
secundária característica para a formação dos pré-miRNAs e para o reconhecimento das
proteínas da maquinaria de silenciamento gênico mediada por miRNAs nas células (Bentwich
73
Predição Computacional de miRNAs em S. mansoni
et al., 2005; Huang et al., 2007; Jiang et al., 2007). Uma das ferramentas utilizadas para
identificação de miRNAs, MiRFinder, tem empregado a estrutura secundária, em forma de
hairpin, como um dos critérios mais importantes para predição de miRNAs (Huang et al.,
2007). Bentwich (2005) identificou miRNAs conservados e não conservados no genoma de
H. sapiens considerando como um dos principais critérios e pré-requisitos para formação de
uma molécula de pré-miRNAs, a estrutura em forma de hairpin. Para a obtenção de possíveis
sequências com potencial para formação de estruturas em forma de grampos foram utilizados
(a) einverted EMBOSS (para identificar repetições invertidas) e (b) a ferramenta blastn (para
identificar estruturas semelhantes a pré-miRNAs depositados no banco de dados de miRNA
miRBase). Estas duas etapas permitiram a obtenção e separação de um milhão e trezentas mil
sequências com potencial formação de grampos. Estas sequências foram então, empregadas
no pipeline de predição de miRNAs conservados e não conservados no genoma do parasito S.
mansoni.
O pipeline para predição de miRNAs conservados se baseou em diversos filtros e
parâmetros eliminando falsos positivos e aumentando a acurácia da predição. Os filtros
utilizados foram baseados em características de conhecidos miRNAs (precursores e maduros)
como por exemplo, energia mínima livre, conteúdo de GC, posição no genoma, posição do
miRNA maduro na sequência precursora grampos, entre outras (Figura 24). Trabalhos
anteriores tem mostrado quão importante tem sido a utilização destas características para
elucidação e predição de miRNAs conservados e não conservados em um genoma. A busca
baseada em características de miRNAs maduros e precursores tem sido executada com
sucesso em grupos de sequências em diferentes espécies, desde protistas até Metazoa e
Plantae (Puzey and Kramer, 2009; Zhang et al., 2009c; Li et al., 2010b).
Baseado nestas características, neste trabalho foi possível identificar 26 preditos prémiRNAs conservados e 35 formas maduras de miRNAs conservados. O pipeline para
predição de miRNAs não conservados identificou 16 sequências de precursores e 32
sequências maduras de miRNAs (Figura 24). Este número de miRNAs identificados
corrobora com o número de miRNAs depositados no miRBase referentes ao organismo
próximo evolutivamente S. japonicum (55 pré-miRNAs depositados no miRNAs 16.0)(Xue et
al., 2008; Copeland et al., 2009; Huang et al., 2009; Hao et al., 2010; Wang et al., 2010). Este
repertório de miRNAs, referentes a espécie S. japonicum, se mostrou em grande parte
representado por miRNAs espécie-específicos. Nossos resultados corroboram com os
apresentados para S. japonicum mostrando a maioria dos miRNAs identificados sendo
espécie-específicos. Copeland (2009) sugeriu que o baixo número de miRNAs conservados
74
Predição Computacional de miRNAs em S. mansoni
em S. mansoni provavelmente pode ser devido ao estilo de parasitismo específico da espécie
(Copeland et al., 2009). Os miRNAs espécie-específicos encontrados neste trabalho, também
podem estar associados a este estilo específico de parasitismo de S. mansoni levando a
ausência de homologia com ortólogos.
Os dados de miRNAs (conservados e não conservados) identificados neste trabalho
foram comparados com os resultados gerados por Simões et al, 2011 (Tabela 5). Eles
utilizaram três estratégias para identificação e validação dos miRNAs em S. mansoni:
abordagem computacional, bibliotecas de RNA e Northern blot . A primeira estratégia foi
elaborada baseada em homologia com miRNAs depositados no banco de dados miRBase.
Utilizando esta estratégia, Foram identificados 15 prováveis miRNAs (maduros e
precursores) no genoma de S. mansoni, dentre os quais, 3 foram identificados neste trabalho.
Este número reduzido de sobreposição de resultados pode ser explicado pelo algoritmo
diferenciado utilizado nos dois trabalhos. Eles também apresentaram um algoritmo utilizando
todo conteúdo depositado no miRBase (versão 13.0), incluindo miRNAs de plantas, vírus e
animais, enquanto nesse trabalho foram utilizados apenas miRNAs provenientes de espécies
de animais depositados no miRBAse versão 16.0. Estudos anteriores têm mostrado diferenças
entre os miRNAs identificados em diferentes reinos, principalmente em relação à sua
biogênese, forma de repressão do alvo e padrão de conservação, sugerindo uma origem
evolutiva independente das moléculas (Axtell, 2008; Lee et al., 2010).
Tem sido mostrado que a conservação evolutiva dos miRNAs está inteiramente
correlacionada com a sequência madura destas moléculas (Okamura et al., 2008; de Wit et
al., 2009). Dentro da sequência do miRNA maduro, a região 5`, chamada de região seed
(semente) (entre os nucleotídeos 2 e 8 ou 2 e 9) se destaca como a mais conservada durante a
evolução importante no reconhecimento de seus alvos (Lewis et al., 2005). Esta característica
é apoiada pela função destes miRNAs no pareamento de regiões 3` UTRs de RNAs
mensageiros alvo silenciando e/ou reprimindo a expressão daquele gene específico. Tem sido
descrito que a conservação dos alvos e atuação do miRNA maduro como molécula
controladora da expressão gênica é dependente principalmente do pareamento da região seed
do miRNA maduro com seu respectivo alvo (Kim et al., 2006). Considerando isto, o
algoritmo deste trabalho excluiu todas as sequências com despareamento, principalmente na
região seed do miRNA maduro, aumentando a especificidade e a sensibilidade do método
utilizado.
75
Predição Computacional de miRNAs em S. mansoni
Tabela 5: Comparação entre o repertório de miRNAs identificados neste trabalho e os
identificados por Simões, 2011.
Gomes et al
Nome
Sequênia
RNA biblioteca
sma-mir-71
sma-mir-125a
sma-bantam
sma-let-7
sma-mir-212
sma-mir-124-3p
sma-mir-281
UGAAAGACGAUGGUAGUGAGA
UCCCUGAGACCCUUUGAUUGCC
UGAGAUCGCGAUUAAAGCUGGU
GGAGGUAGUUCGUUGUGUGGU
UAACAGUCUACAGUCAUGGAU
UAAGGCACGCGGUGAAUGUCA
UGUCAUGGAGUUGCUCUCUAUA
+ (sma-mir-33)
+ (sma-miR-96)
-
Simoes et al, 2011
Northern blot
+ (miR-71)
+ (miR-125)
+ (Bantam)
-
Abordagem
computacional
+ (SMan60)
+ (SMan36)
+ (SMan281)
Todos miRNAs identificados neste trabalho obtiveram estrutura secundária estável,
ou seja, com energia livre mínima menor que -20 kcal/mol. Além disso, todos os miRNAs
maduros apresentaram um precursor com cobertura de 100% em alguma parte do genoma de
S. mansoni, sem exceções. A conservação de características estruturais e termodinâmicas de
miRNAs tem sido mostrada em diferentes espécies do reino animal (Zhou et al., 2009). Zhou
(2009) comparou os miRNAs identificados em Equus caballus com miRNAs identificados
em animais, mostrando um padrão de conservação das característica dos miRNAs. A
identificação e predição de estruturas de miRNAs no genoma deve ser realizada analisando
detalhadamente as características e os padrões de reconhecimento destas moléculas em
determinado grupo de sequência. A escolha de características apropriadas para predição dos
prováveis miRNAs permite o discernimento entre moléculas falso positivas e positivas no
genoma dos organismos.
IV.3.2 Identificação e Caracterização dos miRNAs maduros
A identificação dos miRNAs maduros nas sequências de seus respectivos prémiRNAs tem sido considerado importantíssimo para definição da sua função no organismo
(Winter et al., 2009). As formas maduras dos miRNAs podem ser processados a partir das
extremidade 3` ou 5` dos pré-miRNAs (miRBase). Vários estudos, que avaliam a expressão
de miRNAs maduros em amostras biológicas, tem mostrado que tanto a forma 3` quanto à
forma 5` podem ter atividade biológica no organismo (miRBase). No entanto, sugere-se
ocorrer uma predominância na expressão de uma das extremidades do pré-miRNAs, 3` ou 5`,
dependendo da situação em que a célula se encontra(Burroughs et al., 2011; Warf et al.,
2011). Além da relativa predominância de uma das extremidades expressas, a variação na
sequência do miRNA maduro pode produzir sequências diferentes provindas do mesmo pré-
76
Predição Computacional de miRNAs em S. mansoni
miRNA, chamadas isomiRs (Burroughs et al., 2011). Nossos resultados indicam que entre os
pré-miRNAs identificados, 35 foram processados a partir da extremidade 3` e 32 da
extremidade 5` (Tabela 6). Estes resultados demonstram a variação de possibilidades de
expressão, entre as extremidade 3`ou 5`, corroborando com dados de outras espécies.
Tem sido mostrado que os miRNAs maduros possuem aproximadamente 22
nucleotídeos em sua extensão, variando em média de 20 a 25 nucleotídeos (Kim and Nam,
2006; Sharbati-Tehrani et al., 2008). Os miRNAs maduros identificados neste trabalho
apresentaram em média 21,9 nucleotídeos variando de 20 a 25 nucleotídeos em extensão,
corroborando com dados de espécies de animais. A tabela 6 mostra, além do tamanho de cada
miRNA identificado a estrutura primária. Esta estrutura possui características singulares
como a presença da porção conservada seed, como citado anteriormente. Como pode ser
observado cada miRNA possui uma região seed característica (Tabela 6).
Estudos tem demonstrado a presença predominante do nucleotídeo uracila na primeira
posição da extremidade 5` dos miRNAs maduros. Tem sido relatado a importância desta
característica para o reconhecimento dos miRNAs maduros pelo RISC (Zhang et al., 2006a;
Mi et al., 2008). Neste trabalho, mais da metade dos miRNAs maduros encontrados no
parasito (54%) apresentaram o nucleotídeo uracila na primeira posição (Tabela 6; Figura 25).
Os resultados também indicaram alguns padrões interessantes como: freqüência de
nucleotídeos em cada posição e presença discrepantes de alguns nucleotídeos em certas
posições (Figura 25).
77
Predição Computacional de miRNAs em S. mansoni
Tabela 6: miRNAs maduros em S. mansoni.
miRNA
3` ou 5` Tamanho Sequência madura (5` a 3`) Região “Seed”
sma-bantam
3'
22
UGAGAUCGCGAUUAAAGCUGGU
Acesso da família
miRNA homólogo
MIPF0000153; bantam
sja-bantam
sma-let-7
5'
21
GGAGGUAGUUCGUUGUGUGGU
MIPF0000002; let-7
sja-let-7
sma-mir-10-3p
3'
23
AAAUUCGAGUCUAUAAGGAAAAA
MIPF0000033; mir-10
sja-miR-10-3p
sma-mir-10-5p
5'
22
AACCCUGUAGACCCGAGUUUGG
MIPF0000033; mir-10
sja-miR-10-5p
sma-mir-124-3p
3'
21
UAAGGCACGCGGUGAAUGUCA
MIPF0000021; mir-124
sja-miR-124-3p
sma-mir-124-5p
5'
25
CCAUUUUCCGCGAUUGCCUUGAUGA
MIPF0000021; mir-124
sja-miR-124-5p
sma-mir-125a
5'
22
UCCCUGAGACCCUUUGAUUGCC
MIPF0000733; mir-125_2
sja-miR-125a
sma-mir-190-3p
3'
20
CAGUGACCAGACAUAUCCCU
MIPF0000076; mir-190
sja-miR-190-3p
sma-mir-190-5p
5'
23
UGAUAUGUAUGGGUUACUUGGUG
MIPF0000076; mir-190
sja-miR-190-5p
sma-mir-212
3'
21
UAACAGUCUACAGUCAUGGAU
MIPF0000065; mir-132
dre-miR-212
sma-mir-2162-3p
3'
21
UAUUAUGCAACGUUUCACUCU
N/A
sja-miR-2162-3p
sma-mir-250
3'
22
CCUUCAGUUGACUCAUGAUCUC
MIPF0000283; mir-250
crm-miR-250*
sma-mir-281
3'
22
UGUCAUGGAGUUGCUCUCUAUA
MIPF0000087; mir-46
cte-miR-281
sma-mir-2a-3p
3'
22
UCACAGCCAGUAUUGAUGAACG
MIPF0000049; mir-2
sja-miR-2a-3p
sma-mir-2a-5p
5'
22
CAGUCAAUAUUGGCUGAAGGCA
MIPF0000049; mir-2
sja-miR-2a-5p
sma-mir-2b-3p
3'
24
UAUCACAGCCCUGCUUGGGACACA
MIPF0000049; mir-2
sja-miR-2b-3p
sma-mir-2b-5p
5'
22
CGUCUCAAGGGACUGUGAAACA
MIPF0000049; mir-2
sja-miR-2b-5p
sma-mir-2c-3p
3'
22
UAUCACAGCCGUGCUUAAGGGC
MIPF0000049; mir-2
sja-miR-2c-3p
sma-mir-2c-5p
5'
22
UCCCUUGUUCGACUGUGAUGUG
MIPF0000049; mir-2
sja-miR-2c-5p
sma-mir-2d-3p
3'
22
UAUCACAGUCCUGCUUAGGUGA
MIPF0000049; mir-2
sja-miR-2d-3p
sma-mir-2e-3p
3'
21
UAUCACAGUCCAAGCUUUGGU
MIPF0000049; mir-2
sja-miR-2e-3p
sma-mir-2e-5p
5'
21
UACCAACUUUGACUGAGUUAU
MIPF0000049; mir-2
sja-miR-2e-5p
sma-mir-3011
5'
22
UUGAUUUUAGGGAAUUAUUUAC
N/A
hma-miR-3011
sma-mir-31-5p
5'
23
UGGCAAGAUUAUGGCGAAGCUGA
MIPF0000064; mir-31
sja-miR-31-5p
sma-mir-3479-3p
3'
22
UAUUGCACUAACCUUCGCCUUG
N/A
sja-miR-3479-3p
sma-mir-3492
5'
21
AUCCGUGCUGAGAUUUCGUCA
N/A
sja-miR-3492
78
Predição Computacional de miRNAs em S. mansoni
sma-mir-36-3p
3'
23
CCACCGGGUAGACAUUCAUUCGC
N/A
sja-miR-36-3p
sma-mir-61
3'
22
UGACUAGAAAGUGCACUCACUU
N/A
sja-miR-61
sma-mir-71
5’
21
UGAAAGACGAUGGUAGUGAGA
MIPF0000278; mir-71
sja-miR-71
sma-mir-71b-3p
3’
21
CCUCAUACUGAGUCUUUCCCG
MIPF0000278; mir-71
sja-miR-71b-3p
sma-mir-71b-5p
5’
23
UGAAAGACUUGAGUAGUGAGACG
MIPF0000278; mir-71
sja-miR-71b-5p
sma-mir-8-3p
3’
23
UAAUACUGUUAGGUAAAGAUGCC
MIPF0000019; mir-8
sja-miR-8-3p
sma-mir-8-5p
5’
21
CAUCUUACUAACAGUAUUUGA
MIPF0000019; mir-8
sja-miR-8-5p
sma-mir-92ª
5’
22
GAUUGCACUAGUCACGGCUUUU
MIPF0000013; mir-25
cte-miR-92ª
sma-mir-9c
3’
22
UCUUUGGUAUUCAAUCUGAAGA
MIPF0000014; mir-9
aae-miR-9c-5p
sma-mir-new_1-3p
3’
22
GAAGCUUCGCAAUUAAACCAUC
N/A
N/A
sma-mir-new_1-5p
5'
22
CUAAGCUGGAAGGUUUAAUCGC
N/A
N/A
sma-mir-new_2-3p
3'
22
AGUGUUUCCAAGUUUUCCAUGG
N/A
N/A
sma-mir-new_2-5p
5'
22
UGGAAAACCUGUGAAAGUACUG
N/A
N/A
sma-mir-new_3-3p
3'
22
GAUUUUCUUCCUGAUGCUUCUG
N/A
N/A
sma-mir-new_3-5p
5'
22
AUAUUUCAGAUAUUGAUUUUCU
N/A
N/A
sma-mir-new_4-3p
3'
22
UCGCUUUACCCAUAUCUGCUAG
N/A
N/A
sma-mir-new_4-5p
5'
22
UGCAGGUAAAGUAAUGCUUGUU
N/A
N/A
sma-mir-new_5-3p
3'
22
AUAAUUUCAAUCUCUGAGAUUA
N/A
N/A
sma-mir-new_5-5p
5'
22
UCCAAAGUUUCGUCCAGCAAAC
N/A
N/A
sma-mir-new_6-3p
3'
22
UCAAUCUCCACAAUCUCAUACU
N/A
N/A
sma-mir-new_6-5p
5'
22
CUCAGUAUGUGGUUGUGGAGGU
N/A
N/A
sma-mir-new_7-3p
3'
22
CAGCUUAGAGAAUAACACUCCA
N/A
N/A
sma-mir-new_7-5p
5'
22
CAGAGUUUUAUUCUUUGAUCUG
N/A
N/A
sma-mir-new_8-3p
3'
22
UCAUACUGAUUCAGUAUGACUA
N/A
N/A
sma-mir-new_8-5p
5'
22
AAACAUAAUCAGUGUAAACCUG
N/A
N/A
sma-mir-new_9-3p
3'
22
AACAGCAGUAAGAUGUUUUCCU
N/A
N/A
sma-mir-new_9-5p
5'
22
AGGGAAACGUCGUACUGUUGUA
N/A
N/A
sma-mir-new_10-3p
3'
22
AAUUCGUCAGUUUUUGGUAAUA
N/A
N/A
79
Predição Computacional de miRNAs em S. mansoni
sma-mir-new_10-5p
5'
22
UUAUUUCCAAAACCUUGACGGA
N/A
N/A
sma-mir-new_11-3p
3'
22
AAUUCAUCUGAAGCUGUUACAC
N/A
N/A
sma-mir-new_11-5p
5'
22
UGAAACAGCAUUCAGAAUGAUG
N/A
N/A
sma-mir-new_12-3p
3'
22
UUUGUUAUUGUGUUGAGCAUAU
N/A
N/A
sma-mir-new_12-5p
5'
22
AUCACAGCUCACACACAAUUAA
N/A
N/A
sma-mir-new_13-3p
3'
22
UUUUCUAUGAUGGUCUAGCUUC
N/A
N/A
sma-mir-new_13-5p
5'
22
AGCUAGACUACCAUGGAAAACU
N/A
N/A
sma-mir-new_14-3p
3'
22
AAAAACUUUCGCACCAGAUAUG
N/A
N/A
sma-mir-new_14-5p
5'
22
UUCAUUGUCUGCGAUGAAAAAC
N/A
N/A
sma-mir-new_15-3p
3'
22
UUCCAGGUUUCCAAUGGUGACC
N/A
N/A
sma-mir-new_15-5p
5'
22
UGUUAAACCAUCAUUGUAAACU
N/A
N/A
sma-mir-new_16-3p
3'
22
AUUACAAGCGAUCACUUUUAUA
N/A
N/A
sma-mir-new_16-5p
5'
22
UGAACGUUCAUUUUAUGAACAU
N/A
N/A
N/A – não aplicável
80
Predição Computacional de miRNAs em S. mansoni
Figura 25: miRNAs maduros em S. mansoni. A frequência de cada nucleotídeo (Figura
Weblogo) presente nos miRNAs maduros de S. mansoni estão indicados pelos logos U
(uracila), A (adenina),C (citosina), G (Guanina). As posições são indicadas pelos números no
eixo x e o tamanho de cada logo indica a relativa freqüência de cada nucleotídeo naquela
posição específica.
Assim como os genes que codificam proteínas, os miRNAs também realizam
duplicações ou contrações gênicas. Entre as formas maduras dos miRNAs conservados
identificados neste trabalho, 29 foram agrupados em 16 diferentes famílias no miRBase.
Estas análises foram baseadas no conteúdo de nucleotídeos da sequência madura do miRNA
principalmente relativo a sua região seed (Tabela 6). O número de miRNAs encontrados em
cada família de miRNAs presentes em S. mansoni variou de 1 a 9 membros. O maior número
de membros por família foi encontrado na família mir-2. Essa variação tem sido também
encontrada em outras espécies de animais como C. elegans. No organismo nematódeo C.
elegans a família let-7 é representada por 4 miRNAs maduros compartilhando os mesmos
nucleotídeos da região seed (Lim et al., 2003; Abbott et al., 2005). Tem sido relatado o
envolvimento dos miRNAs desta família no controle da expressão gênica e no tempo de
desenvolvimento do organismo, provavelmente silenciando alvos semelhantes devido a
presença de conteúdos semelhantes na região seed (Abbott et al., 2005; Roush and Slack,
2008).
Todos miRNAs conservados identificados neste trabalho mostraram 100% de
identidade na região seed e no máximo 3 nucleotídeos de diferença em todo miRNA maduro
em comparação com a estrutura de seu respectivo ortólogo. Como pode ser observado na
tabela 6 todos miRNAs apresentaram um ortólogo correspondente em que a busca foi
baseada. Os miRNAs maduros tem sido agrupados em famílias baseados em sua região seed
determinando o grupo de genes que esta família irá provavelmente silenciar. A manutenção
desta região conservada tem sido importante durante a evolução para manutenção dos alvos
81
Predição Computacional de miRNAs em S. mansoni
silenciados. Friedman, 2009 demonstrou a conservação dos alvos de miRNAs em espécies de
mamíferos evidenciando a importância da conservação dos miRNAs maduros e seus
respectivos alvos (Friedman et al., 2009). Neste trabalho, entre os miRNAs maduros
conservados, 29 mostraram altos níveis de identidade em comparação com miRNAs
representantes de S. japonicum. Alguns deles mostraram 100% de identidade considerando
toda estrutura do miRNA maduro. Por exemplo, o miRNA sma-mir-8-3p apresentou o
mesmo conteúdo de nucleotídeos na sua sequência quando comparado com o miRNA sjamir-8-3p de S. japonicum(Figura 26).
Figura 26: Conservação de sma-mir-8 no grupo Bilateria. A alta fidelidade nos
alinhamentos entre os precursores sma-mir-8 e seus respectivos ortólogos de Ecdysozoa e
Lophotrochozoa foram analisadas utilizando Clustal 2.0 e RNAalifold. As formas maduras
dos miRNAs são mostradas nas caixas cinza. Os respectivos grupos taxonômicos foram
agrupados em colchetes. Os símbolos .)( estão relacionados a conservação dos nucleotídeos
na estrutura secundária. Os parênteses indicam a presença do nucleotídeo na mesma direção
na estrutura secundária.
IV.3.3 Caracterização dos pré-miRNAs de S. mansoni
O tamanho das moléculas de miRNA maduro e a baixa conservação em nível de
nucleotídeos dos pré-miRNAs restringem a busca de miRNAs utilizando apenas métodos
convencionais de alinhamento de sequências (Wang et al., 2005). No entanto, algumas
características das sequências precursoras de miRNAs, como energia mínima da estrutura
secundária, energia livre ajustada, conteúdo de GC e outras, tendem a seguir padrões sendo
82
Predição Computacional de miRNAs em S. mansoni
parâmetros utilizados para identificação e caracterização destas moléculas (Xue et al., 2005).
Neste trabalho, foi possível a identificação e predição de um total de 42 pré-miRNAs no
genoma de S. mansoni. Dentre estes, 26 foram preditos como conservados e 16 como não
conservados. Como exposto anteriormente, a forma mais precisa para o estudo dos prémiRNAs é a observação e análise de suas características estruturais e termodinâmicas (Jiang
et al., 2007; Artzi et al., 2008; Zhang et al., 2009c). Estudos anteriores tem mostrado que
estas características podem fornecer informações suficientes e importantíssimas no que tange
a identificação destas moléculas. Zhou (2009) identificou, no genoma de E. caballus, preditos
pré-miRNAs baseado em características estruturais e termodinâmicas. Estas características
foram comparadas com as características dos miRNAs de espécies de animais depositados no
miRBase.
Neste trabalho, as características relativas às moléculas de pré-miRNAs de S. mansoni
como, tamanho, energia mínima livre (MFE), energia mínima livre ajustada (AMFE), índice
de energia mínima livre (MFEI), conteúdo de GC (GC), energia mínima livre do conjunto
termodinâmico (MFEE), diversidade do conjunto termodinâmico e freqüência da estrutura de
energia mínima livre no conjunto termodinâmico foram utilizadas para realização de uma
comparação com características provenientes de 400 pré-miRNAs encontrados em espécies
do grupo Lophotrochozoa (Tabela 7). Para todas as características estudadas nenhuma
diferença estatística foi encontrada entre os dois grupos analisados, com p-value > 0.05
(Tabela 7).
Como podem ser observados na tabela 8 os tamanhos dos pré-miRNAs encontrados
em S. mansoni variaram de 66 até 121 nucleotídeos, com média de 87 nucleotídeos por
sequência. Já os precursores de espécies Lophotrochozoa apresentaram tamanhos variando de
57 até 153 nucleotídeos, com uma média de 90 nucleotídeos por sequência. Estes valores
comparados entre si não apresentaram diferença estatística. Valores similares em relação ao
tamanho das estruturas de pré-miRNAs foram encontrados em pré-miRNAs de animais
(Zhou et al., 2009). Outra característica importante analisada foi a energia mínima livre de
Gibbs que cada estrutura secundária do miRNA pode adquirir. A conservação termodinâmica
de sequências de pré-miRNAs tem sido mostrada em outros estudos. Ni (2010) demonstrou a
existência de uma grande correlação entre os parâmetros estruturais termodinâmicos de prémiRNAs e a conservação das sequências em diferentes genomas de animais.
83
Predição Computacional de miRNAs em S. mansoni
Tabela 7: Comparação das características dos pré-miRNAs de Lophotrochozoa e S.
mansoni.
Pre-miRNAs S. mansoni
Média
G (%)
A (%)
C (%)
U (%)
GC (%)
AU (%)
Conteúdo UA
Conteúdo GC
Tamanho (nt)
MFE (kcal/mol)
AMFE (kcal/mol)
MFEI
MFEE(kcal/mol)
Freqüência (%)
Diversidade
21.38
27.77
19.20
31.66
40.58
59.42
1.18
1.15
87.21
-32.06
-37.01
-0.92
-31.11
17.62
5.70
Desvio
Padrão
3.49
4.40
3.99
4.83
5.89
5.89
0.30
0.28
10.94
5.26
5.90
0.16
5.39
12.21
2.99
Mediana
21.46
27.91
18.42
32.13
41.06
58.94
1.11
1.12
88.50
-31.35
-36.93
-0.91
-30.30
14.23
5.18
Pre-miRNAs
Lophotrochozoa
Média Desvio Mediana
Padrão
21.31
5.05
21.08
26.91
5.69
26.98
19.19
5.09
18.81
32.58
5.60
32.67
40.49
8.96
40.00
59.49
8.94
60.00
1.26
0.32
1.21
1.15
0.29
1.12
90.29
14.57
91.00
-31.27
7.20
-30.95
-35.07
7.95
-34.83
-0.89
0.22
-0.86
-29.92
7.77
-29.70
15.16
14.38
10.13
7.30
5.66
5.92
p-value
0.93
0.34
0.99
0.30
0.95
0.96
0.12
0.98
0.18
0.49
0.12
0.29
0.33
0.29
0.07
Os precursores identificados em nosso estudo tiveram a capacidade de dobrar e gerar
estruturas secundárias estáveis. Estas estruturas se mostraram como o modelo canônico de
miRNAs com duas hastes em forma de duplex e uma volta ou loops na outra extremidade da
sequência (“stem-loop structures”). As características termodinâmicas das estruturas
secundárias destas moléculas também se mostraram dentro de valores padrões de prémiRNAs. Como pode ser observada na tabela 7, a característica MFE para as sequências de S.
mansoni apresentaram média de -32 kcal por mol. O mesmo parâmetro para o grupo de prémiRNAs de Lophotrochozoa demonstrou similar valor, -31.27 kcal/mol. Estes parâmetros
comparados não obtiveram diferença estatística demonstrando a similaridade entre os grupos
analisados. Assim como MFE, outros parâmetros termodinâmicos e estruturais como
conteúdo de GC, também não apresentaram diferença estatística comparando os grupos. Em
geral, estes resultados demonstraram que as características dos pré-miRNAs são conservadas
e bastante similares entre os grupos estudados.
Cada característica dos pré-miRNAs, acima supracitada, foi também analisada e
comparada com valores das características de pré-miRNAs de outros grupos de espécies.
Foram incluídos nas análises grupos de sequências provenientes de, 77 espécies de Animais,
74 espécies de Bilatérias, 30 espécies de Ecdysozoans, 37 espécies de Deuterostômios, 7
espécies Lophotrochozoans incluindo S. japonicum. Os gráficos gerados mostraram a
84
Predição Computacional de miRNAs em S. mansoni
distribuição de cada característica analisada nos diversos grupos de sequências. Ni (2010)
mostrou a distribuição de valores associados a características de pré-miRNAs em 3 grupos de
sequências provenientes de humanos, camundongos e galinha. Foi identificado uma
correlação entre as características dos pré-miRNAs e a conservação destas sequências.
Neste trabalho, ficou evidente a conservação das características dos pré-miRNAs
identificados em S. mansoni em comparação com pré-miRNAs em espécies de
Lophotrochozoa (Figuras 27 e 28). Como pode ser visto nas figuras 27 e 28, existe um padrão
de conservação das características estruturais e termodinâmicas dos pré-miRNAs analisados
nestes dois grupos de sequência.
Figura 27: Características estruturais e termodinâmicas de pré-miRNAs. Os valores
utilizados (A) MFE, (B) AMFE, (C) MFEI e (D) Conteúdo de GC foram baseados nos prémiRNAs depositados no banco de dados miRBase provenientes de diferentes grupos de
espécies como Animais, Bilateria, Deuterostômios, Ecdysozoa, Lophotrochozoa, S.
japonicum assim como dos pré-miRNAs identificados neste trabalho. As caixas representam
50% dos dados analisados. A extremidade mais baixa do e Box plot é o primeiro quartil ou 25
% e a extremidade mais alta representa o terceiro quartil ou 75 %. A linha horizontal dentro
da caixa representa a mediana e os valores maiores que 1,5 vezes a mediana são os “outliers”.
85
Predição Computacional de miRNAs em S. mansoni
Figura 28: Características estruturais e termodinâmicas de pré-miRNAs. Os valores
utilizados (A) MFEE, (B) Diversidade do conjunto termodinâmico, (C) Freqüência da
estrutura de energia mínima livre no conjunto termodinâmico e (D) Tamanho foram baseados
nos pré-miRNAs depositados no banco de dados miRBase provenientes de diferentes grupos
de espécies como Animais, Bilateria, Deuterostômios, Ecdysozoa, Lophotrochozoa, S.
japonicum assim como dos pré-miRNAs identificados neste trabalho. As caixas representam
50% dos dados analisados. A extremidade mais baixa do e Box plot é o primeiro quartil ou 25
% e a extremidade mais alta representa o terceiro quartil ou 75 %. A linha horizontal dentro
da caixa representa a mediana e os valores maiores que 1,5 vezes a mediana são os “outliers”.
As características de cada um dos pré-miRNAs identificados no genoma de S.
mansoni foram importantes para predição. A tabela 8 mostra os valores de cada característica
destes miRNAs. Os pré-miRNAs conservados foram encontrados apenas nas sequências
genômicas de S. mansoni enquanto os não conservados foram encontrados em ambos os
bancos de dados, genoma e ESTs (Tabela 8). A presença de miRNAs em ESTs tem sido
evidenciada em bibliotecas de cDNA de vários organismos como verificada em humanos (Li
et al., 2006).
86
Predição Computacional de miRNAs em S. mansoni
Tabela 8: Pré-miRNAs de S. mansoni e suas características estruturais e termodinâmicas.
miRNA
Conteúdo de GC (%)
Tamanho
MFE
AMFE
(nt)
kcal/mol
kcal/mol
MFEI
MFEE
Frequência
Diversidade
kcal/mol
(%)
(%)
EST
sma-bantam
42,25
71
-26,40
-37,18
-0,88
-26,40
37,57
2,64
N/A
sma-let-7
42,70
89
-34,30
-38,54
-0,90
-27,50
1,21
10,72
N/A
sma-mir-10
41,77
79
-27,80
-35,19
-0,84
-27,60
29,74
4,84
N/A
sma-mir-124
37,63
93
-28,30
-30,43
-0,81
-28,10
5,80
7,77
N/A
sma-mir-125a
43,90
82
-30,90
-37,68
-0,86
-30,20
31,96
2,30
N/A
sma-mir-190
40,50
121
-44,80
-37,02
-0,91
-44,70
4,46
5,01
N/A
sma-mir-212
34,48
87
-21,50
-24,71
-0,72
-20,50
7,10
6,21
N/A
sma-mir-2162
44,74
76
-34,90
-45,92
-1,03
-34,30
9,12
4,72
N/A
sma-mir-250
36,00
100
-44,40
-44,40
-1,23
-44,40
20,54
2,83
N/A
sma-mir-281
34,69
98
-36,60
-37,35
-1,08
-34,40
9,43
15,87
N/A
sma-mir-2a
46,15
78
-39,00
-50,00
-1,08
-39,00
50,78
1,77
N/A
sma-mir-2b
54,43
79
-35,20
-44,56
-0,82
-35,00
31,80
3,74
N/A
sma-mir-2c
48,00
75
-27,62
-36,83
-0,77
-27,62
33,73
3,13
N/A
sma-mir-2d
37,50
88
-30,80
-35,00
-0,93
-30,80
17,43
5,26
N/A
sma-mir-2e
39,76
83
-25,00
-30,12
-0,76
-24,40
18,86
9,30
N/A
sma-mir-3011
33,67
98
-38,50
-39,29
-1,17
-37,70
13,64
4,09
N/A
sma-mir-31
42,17
83
-33,30
-40,12
-0,95
-32,40
11,34
7,36
N/A
sma-mir-3479
38,16
76
-28,80
-37,89
-0,99
-28,19
8,67
5,92
N/A
sma-mir-3492
48,35
91
-27,00
-29,67
-0,61
-26,70
23,79
3,77
N/A
sma-mir-36
44,68
94
-37,45
-39,84
-0,89
-37,25
3,26
5,85
N/A
sma-mir-61
43,88
98
-29,90
-30,51
-0,70
-28,16
6,56
10,83
N/A
87
Predição Computacional de miRNAs em S. mansoni
sma-mir-71
51,25
80
-34,50
-43,13
-0,84
-34,50
41,47
1,94
N/A
sma-mir-71b
53,26
92
-31,40
-34,13
-0,64
-25,14
5,00
11,21
N/A
sma-mir-8
34,21
76
-25,70
-33,82
-0,99
-25,70
18,69
5,04
N/A
sma-mir-92a
43,66
71
-25,00
-35,21
-0,81
-25,00
28,79
3,17
N/A
sma-mir-9c
31,31
99
-30,20
-30,51
-0,97
-29,67
8,28
6,21
N/A
sma-mir-new_1
40,82
98
-36,4
-37,14
-0,91
-30,4
12,36
5,44
Sm24375
sma-mir-new_2
41,30
92
-37,50
-40,76
-0,99
-37,2
14,83
5,81
Sm01360
sma-mir-new_3
34,34
99
-28,90
-29,19
-0,85
-25,4
3,05
9,67
Sm02419
sma-mir-new_4
43,30
97
-32,89
-33,91
-0,78
-32,89
5,83
6,08
Sm04679
sma-mir-new_5
30,30
99
-32,30
-32,63
-1,08
-32,3
39,36
3,03
Sm05165
sma-mir-new_6
36,67
90
-35
-38,89
-1,06
-34,4
16,07
7,87
Sm12132
sma-mir-new_7
32,10
81
-28,60
-35,31
-1,10
-28,6
20,58
3,34
Sm01328
sma-mir-new_8
44,44
81
-31,3
-38,64
-0,87
-31,3
21,03
2,77
Sm20488
sma-mir-new_9
45,45
66
-32,6
-49,39
-1,09
-31,64
30,25
2,51
Sm21666
sma-mir-new_10
35,44
79
-27,6
-34,94
-0,99
-27,5
22,31
5,1
Sm22883
sma-mir-new_11
40,28
72
-28,2
-39,17
-0,97
-25,95
8,59
6,92
Sm29317
sma-mir-new_12
41,94
93
-26,3
-28,28
-0,67
-26,11
11,12
9,63
Sm25456
sma-mir-new_13
37,50
80
-41,60
-52,00
-1,39
-39,9
27,78
3,82
Sm05979
sma-mir-new_14
43,00
100
-36,50
-36,50
-0,85
-36,5
5,74
5,94
Sm08219
sma-mir-new_15
38,20
89
-29,4
-33,03
-0,86
-29,2
11,66
5,65
Sm18604
sma-mir-new_16
30,00
90
-32,1
-35,67
-1,19
-32,1
10,44
4,27
Sm25070
MFE: Energia mínima livre
AMFE: Energia mínima livre ajustada
MFEI: Índice de energia mínima livre
MFEE: Energia mínima livre do conjunto.
88
Predição Computacional de miRNAs em S. mansoni
IV.3.4 Distribuição dos genes de miRNAs no genoma de S. mansoni
Tem sido mostrado a presença de miRNAs em 3 regiões distintas do genoma:
intergênicas, intrônicas e regiões não traduzidas (UTRs) (Lagos-Quintana et al., 2003; Kim
and Nam, 2006; Li et al., 2007; Cai et al., 2011). Lagos-Quintana (2003) identificou novos
miRNAs em humanos e camundongos localizados nas 3 regiões. Além disso, foi
demonstrado que a região com maior número de miRNAs foi a região intergênica com mais
de 50% dos genes. Cai (2011) demonstrou a presença de miRNAs nestas três regiões em S.
japonicum. Foi identificado um número maior de miRNAs nas regiões intergênicas, seguido
pelas regiões intragênicas e por último as UTRs. Os pré-miRNAs preditos neste trabalho,
foram buscados e localizados no genoma de S. mansoni nas três regiões supracitadas (Tabela
9). A ausência de pré-miRNAs em regiões codificadoras de proteínas no genoma do parasito
se deve ao fato dos filtros do pipeline excluírem as regiões codificadoras de proteínas nas
análises. Neste trabalho dentre os 42 pré-miRNAs identificados no genoma de S. mansoni 30
foram encontrados em regiões intergênicas, 11 em regiões intrônicas e um em região 3`UTR
(Tabela 9). Como todas as regiões que codificavam prováveis proteínas foram excluídas das
análises os dados não refletem a presença destes miRNAs nestas regiões. A presença de
miRNAs em regiões intrônicas tem sido demonstrada em trabalhos anteriores como o mir190 na região intrônica do gene talin. A presença deste gene, mir-190, nesta região intrônica
do gene talin tem sido demonstrada ser conservada desde coanoflagelados, protistas aquáticos
como Monosiga brevicollis, até os seres humanos (Campo-Paysaa et al., 2011). Todos os prémiRNAs identificados não apresentaram mais de uma posição no genoma como mostrado na
tabela 9. A orientação da fita correspondente a cada precursor não seguiu um padrão, sendo
26 pré-miRNAs dirigidos pela fita positiva do DNA e 18 pela fita negativa (Tabela 9).
89
Predição Computacional de miRNAs em S. mansoni
Tabela 9: Localização dos preditos pré-miRNAs no genoma e nos cromossomos scaffolds de S. mansoni.
miRNA
Cromossomo Scaffold
Genoma -
Genoma
Fita
Início
- Fim
Orientação
Região gênica
sma-bantam
Schisto_mansoni.SC_0137
369443
369513
(+)
Intergênica
sma-let-7
Schisto_mansoni.Chr_7
5118783
5118871
(+)
Intergênica
sma-mir-10
Schisto_mansoni.Chr_4
19959268
19959346
(-)
Intergênica
sma-mir-124
Schisto_mansoni.Chr_6
18429525
18429617
(-)
Intergênica
sma-mir-125a
Schisto_mansoni.Chr_1
38691263
38691344
(-)
Intergênica
sma-mir-190
Schisto_mansoni.Chr_1
34471102
34471222
(+)
Intrônica- Smp_037860
sma-mir-212
Schisto_mansoni.Chr_2
29111488
29111574
(-)
Intrônica- Smp_143490
sma-mir-2162
Schisto_mansoni.SC_0049
36185
36260
(+)
Intergênica
sma-mir-250
Schisto_mansoni.SC_0125
24702
24801
(+)
Intergênica
sma-mir-281
Schisto_mansoni.Chr_4
27195935
27196032
(-)
Intergênica
sma-mir-2a
Schisto_mansoni.Chr_W
22875749
22875826
(+)
Intergênica
sma-mir-2b
Schisto_mansoni.Chr_W
22875844
22875922
(+)
Intergênica
sma-mir-2c
Schisto_mansoni.Chr_5
1982423
1982497
(-)
Intergênica
sma-mir-2d
Schisto_mansoni.Chr_5
1982526
1982613
(-)
Intergênica
sma-mir-2e
Schisto_mansoni.Chr_W
22875945
22876027
(+)
Intergênica
sma-mir-3011
Schisto_mansoni.SC_0250
146496
146593
(-)
Intrônica- Smp_146450
sma-mir-31
Schisto_mansoni.Chr_6
1777481
1777563
(-)
Intergênica
sma-mir-3479
Schisto_mansoni.Chr_4. unplaced.SC_0032
1561284
1561359
(-)
Intrônica- Smp_148850
sma-mir-3492
Schisto_mansoni.Chr_W
8158491
8158581
(+)
Intrônica- Smp_126330
sma-mir-36
Schisto_mansoni.Chr_1
57476968
57477061
(-)
Intergênica
90
Predição Computacional de miRNAs em S. mansoni
sma-mir-61
Schisto_mansoni.Chr_2
25390606
25390703
(+)
Intergênica
sma-mir-71
Schisto_mansoni.Chr_W
22875655
22875734
(+)
Intergênica
sma-mir-71b
Schisto_mansoni.Chr_5
1982759
1982850
(-)
Intergênica
sma-mir-8
Schisto_mansoni.Chr_1
10044867
10044942
(-)
Intergênica
sma-mir-92a
Schisto_mansoni.Chr_3
22956805
22956875
(-)
Intergênica
sma-mir-9c
Schisto_mansoni.Chr_2
21913217
21913315
(+)
Intergênica
sma-mir-new_1
Schisto_mansoni.Chr_3
24540256
24540353
(+)
Intrônica- Smp_132570
sma-mir-new_2
Schisto_mansoni.Chr_6
4070791
4070882
(+)
Intergênica
sma-mir-new_3
Schisto_mansoni.Chr_3
13891083
13891181
(+)
Intergênica
sma-mir-new_4
Schisto_mansoni.Chr_2. unplaced.SC_0120
6469
6565
(-)
Intergênica
sma-mir-new_5
Schisto_mansoni.Chr_W
24055623
24055721
(+)
Intergênica
sma-mir-new_6
Schisto_mansoni.Chr_7. unplaced.SC_0100
956192
956281
(-)
Intrônica- Smp_144770
sma-mir-new_7
Schisto_mansoni.Chr_7
789769
789849
(+)
3'UTR- Smp_097370
sma-mir-new_8
Schisto_mansoni.Chr_5
2556921
2557001
(-)
Intrônica- Smp_153410
sma-mir-new_9
Schisto_mansoni.Chr_W
36376729
36376794
(+)
Intrônica- Smp_135850
sma-mir-new_10
Schisto_mansoni.Chr_2
8470212
8470290
(+)
Intergênica
sma-mir-new_11
Schisto_mansoni.Chr_2
28915165
28915236
(+)
Intrônica- Smp_143550
sma-mir-new_12
Schisto_mansoni.Chr_W
3892016
3892108
(+)
Intergênica
sma-mir-new_13
Schisto_mansoni.SC_0041
1513726
1513805
(+)
Intergênica
sma-mir-new_14
Schisto_mansoni.Chr_W
54858104
54858203
(-)
Intrônica- Smp_136490
sma-mir-new_15
Schisto_mansoni.Chr_W
30576111
30576199
(-)
Intergênica
sma-mir-new_16
Schisto_mansoni.Chr_W
35229680
35229768
(+)
Intergênica
91
Predição Computacional de miRNAs em S. mansoni
Em termos de distribuição cromossômica, os pré-miRNAs identificados foram
distribuídos em todos os 7 cromossomos autossômicos do parasito e no cromossomo sexual
W. A ausência de miRNAs no cromossomo sexual Z corrobora com resultados encontrados
em outras espécies como por exemplo em seres humano. Diversos trabalhos têm mostrado
ausência desta classe de molécula no cromossomo sexual Y (Mishima et al., 2008; Kozomara
and Griffiths-Jones, 2011). Neste caso, vale ressaltar que em seres humanos, o gênero
homogamético é a fêmea, XX, e no caso do parasito S. mansoni é o macho, ZZ. Sendo assim,
os miRNAs expressos no cromossomo sexual W, presentes apenas em fêmeas do parasito,
serão considerados gênero específico. Isto não ocorre em seres humanos, pois tanto o macho
quanto a fêmea possuem cromossomo X. Esta informação é importantíssima para o estudo da
relação entre os miRNAs sexo específicos preditos no parasito fêmea e seus respectivos
alvos. A Figura 29 mostra a posição de cada miRNA nos cromossomos scaffolds de S.
mansoni na versão 5.0 do genoma. Alguns miRNAs foram localizados em scaffolds não
mapeados com um cromossomo específico e assim não indicados na figura 29. O
cromossomo que mostrou maior número de miRNAs, ou seja, maior densidade
cromossômica em relação aos miRNAs, foi o cromossomo W (Figura 29). Estes resultados
corroboram com o repertório de miRNAs encontrado em humanos (miRBase v 16.0) que
mostra a presença de mais de 9% do total dos miRNAs presentes no cromossomo X. Estudos
recentes tem mostrado esta mesma tendência (maior densidade de miRNAs no cromossomo
X) em 8 diferentes espécies de mamíferos (Guo et al., 2009; Song et al., 2009). Foi também
demonstrado, em humanos, que estes miRNAs, alocados no cromossomo X, tem uma alta
transcrição na gametogênese sugerindo uma importante função dos miRNAs ligados ao
cromossomo X nesta situação (Song et al., 2009).
92
Predição Computacional de miRNAs em S. mansoni
Figura 29: Distribuição dos preditos miRNAs nos cromossomos scaffolds de S. mansoni.
A localização relativa de cada pré-miRNAs nos cromossomos de S. mansoni (versão 5.0)
mostrou a presença destes em 7 cromossomos autossômicos e um cromossomo sexual (W).
As linhas pretas representam os pré-miRNAs em suas respectivas posições. As setas indicam
a presença dos dois clusteres encontrados em S. mansoni: sma-mir-71/2 e sma-mir71b/2.
IV.3.5 Análise dos miRNAs conservados
Neste trabalho foram identificados 26 pré-miRNAs conservados sendo 19 destes
pertencentes a alguma família conhecida de miRNA (Figura 30). A figura 30 mostra a
distribuição destes miRNAs em diferentes grupos taxonômicos. Todos os miRNAs
representados mostraram conservação em espécies de Deuterostômios e Protostômios
incluindo S. mansoni. O miRNA let-7 se mostrou conservado e presente em todos os clados
estudados de Deuterostômios e Protostômios. O miRNA mir-124 tem sido encontrado
altamente conservado nas espécies de Animais. Essa conservação, ao nível de nucleotídeos
do miRNA maduro, apresentou identidade próxima de 100% comparando sequências de
Superfilos distintos como seres humanos e S. mansoni. Esta semelhança não reflete apenas
nos genes alvos que estas moléculas irão almejar, mas também sua regulação, estabilidade e
93
Predição Computacional de miRNAs em S. mansoni
tempo de meia vida no organismo. No entanto, os mecanismos que controlam estas
características tem sido pouco entendidas (Winter et al., 2009).
Figura 30: Distribuição filogenética dos miRNAs em genomas animais. Os miRNAs
conservados encontrados em S. mansoni foram comparados com seus respectivos ortólogos
em espécies de animais. “X” indica a presença do miRNA em ao menos uma espécie dentro
do clado. Os quadros acima apresentam os nomes de cada família de miRNA. A filogenia
simplificada foi baseada em Jones e Blaxter, 2005 (Jones and Blaxter, 2005).
Sempere (2010) demonstrou que a distribuição taxonômica dos miRNAs tem estado
estreitamente correlacionada com a distribuição taxonômica dos animais. As análises
filogenéticas e de alinhamentos das sequências da família mir-8, mir-10 e mir-71 nos grupos
Lophotrochozoa, Ecdysozoa e Deuterostômios mostraram em geral que as respectivas
sequências de miRNAs encontradas em S. mansoni agruparam de acordo com a distribuição
taxonômica dos animais. Além disso, um dos miRNAs encontrados em regiões intrônicas,
sma-mir-190, mostrou distribuição conservada em relação a espécies Bilateria dentro do gene
talin.
IV.3.5.1 mir-190 de S. mansoni
O mir-190 tem sido encontrado em regiões intrônicas do gene talin em diversas
espécies tais como H. sapiens, Lottia gigantea, B. floridae, Nematostella vectensis e
Monosiga brevicollis. A estrutura gênica do gene talin juntamente com o mir-190 tem
94
Predição Computacional de miRNAs em S. mansoni
mostrado alta conservação em organismos distantes filogeneticamente como coanoflagelata,
Monosiga brevicollis e seres humanos.
Campo-Paysaa (2011) mostrou que mir-190 é um miRNA específico de espécies
Bilatérias por não ser encontrado em organismos fora do clado, embora talin seja parte do
repertório de genes destes organismos. Neste trabalho, análises no genoma do parasito
revelaram que sma-mir-190 está localizado dentro do predito gene talin entre os éxons 7 e 8.
Esta distribuição entre éxons do gene talin não tem uma conservação característica. Por
exemplo, em camundongos o miR-190 está posicionado no íntron 51, entre os éxons, 50 e 51,
enquanto em D. melanogaster o miRNA está posicionado no íntron 12, entre os éxons 11 e
12 (mirBase) (Debrand et al., 2009). Assim como em S. mansoni, o representante ortólogo
sja-mir-190, encontrado em S. japonicum, foi localizado em um íntron do predito gene talin
(Sjp_0006570.1). O precursor sma-mir-190 mostrou 90% de identidade, ao nível de
nucleotídeos, quando comparado com o precursor sja-mir-190,. Entretanto, as partes maduras
de ambos mostraram 100% de identidade (Figura 31a). As estruturas secundárias de sma-mir190 e sja-mir-190 mostraram grandes semelhanças como pode ser confirmado pela estrutura
secundária consenso na figura 31b.
Figura 31: Análise estrutural comparativa entre sma-mir-190 e sja-mir-190. (A) O
alinhamento global das estruturas secundárias dos precursores sma-mir-190 e sja-mir-190
foram realizados utilizando os programas ClustalX 2.0 e RNAalifold. Os miRNAs maduros
mir-190-3p e mir-190-5p foram mostrados no alinhamento dentro de caixas tracejadas. (B) O
95
Predição Computacional de miRNAs em S. mansoni
dobramento consenso das estruturas secundárias dos precursores sja-mir-190 e sma-mir-190
foi realizado utilizando RNAalifold. Os miRNAs maduros foram representados em uma caixa
amarela.
IV.3.5.2 miRNA-8 de S. mansoni
A versão do miRBase 16.0 indica que a família mir-8 tem sido composta por 4
membros de miRNAs: mir-8, mir-200, mir-141 e mir-429. Neste estudo, os ortólogos do gene
mir-8 foram encontrados somente em espécies de Protostômios (Lophotrochozoans e
Ecdysozoans) incluindo S. mansoni. Por outro lado os pré-miRNAs, mir-429, mir-200 e mir141 foram encontrados apenas em espécies do Superfilos Deuterostômios (Figura 26). Estes
resultados corroboram com Sempere (2010) que demonstrou que o microRNA mir-8 tem sido
considerado um gene presente apenas em organismos do grupo Protostômios, ou seja,
Protostômios-específicos. Neste mesmo trabalho, Sempere mostrou que os microRNAs, mir141 e mir-200, podem ser considerados Deuterostômios-específicos, sendo encontrados
apenas no Superfilo Deuterostômios. Os miRNAs da família mir-8 tem sido encontrados em
formas de clusteres em organismos dentro do grupo Cordata (Campo-Paysaa et al., 2011).
Esta informação tem sido considerada mais relevante para os miRNAs da família mir-8
encontrados em Deuterostômios e não em Protostômios. O sma-mir-8 foi encontrado fora de
um cluster no genoma de S. mansoni, corroborando com ortólogos proveniente de organismos
Protostômios. Este gene foi encontrado dentro do grupo de organismos pertencentes ao grupo
dos Platelmintos corroborando com a distribuição taxonômica das espécies (Figura 32)
96
Predição Computacional de miRNAs em S. mansoni
Figura 32: Distribuição evolutiva do miRNA sma-mir-8 no grupo Bilateria (a) As
relações filogenéticas foram referidas entre os precursores sma-mir-8 e seus homólogos. A
árvore filogenética foi gerada utilizando o método Neighbor-Joining, e o modelo Kimura-2parâmetros, ambos executados no programa MEGA 4.0. Os clados distintos apresentaram os
grupos Deuterostômios (miR-429, miR-200 and mir-141 genes) e o grupo Ecdysozoa
/Lophotrochozoa (mir-8 gene). Somente os “bootstrap” acima de 30 foram considerados para
2000 réplicas analisadas.
O alinhamento múltiplo de sequência dos pré-miRNAs mir-8confirmou a conservação
entre espécies de Lophotrochozoa e Ecdysozoa. Além disso, foram identificados nucleotídeos
97
Predição Computacional de miRNAs em S. mansoni
conservados entre as formas maduras de miRNAs presentes nos precursores mir-8 (formas
mir-8-5p e mir-8-3p) principalmente na região “seed” (Figura 26).
IV.3.5.3 mir-10 de S. mansoni
Os membros da família mir-10 tem sido encontrados em todas as espécies de animais
depositadas no banco de dados de miRNAs miRBase. Neste trabalho, o estudo filogenético
desta família de miRNAs, mostrou que sma-mir-10, agrupou juntamente com pré-miRNAs
provenientes de espécies do grupo Lophotrochozoa. Esta distribuição corrobora com a
distribuição taxonômica das espécies no qual o parasito S. mansoni se enquadra. O gene sjamir-10 foi encontrado juntamente com sma-mir-8 entre os grupos de espécies Ecdysozoans e
Deuterostômios (Figura 33). Na maioria das espécies pertencentes ao grupo Bilateria, mir-10
tem sido encontrado em um cluster juntamente com genes HOX. No caso específico dos seres
humanos, dois genes da família mir-10 tem sido encontrados próximos a 4 genes HOX
(Lemons and McGinnis, 2006; Campo-Paysaa et al., 2011). Em S. mansoni, o gene mir-10 foi
encontrado 70kb a jusante do gene SmHOX4 (Smp_166140), um dos 4 genes HOX
encontrados no genoma do parasito, corroborando com os dados anteriores de H. sapiens. O
número reduzido de genes HOX no parasito, quando comparado com outras espécies
pertencentes ao grupo Lophotrochozoa, está diretamente correlacionado com a arquitetura
axial simplificada do parasito (Pierce et al., 2005; Berriman et al., 2009). Utilizando
alinhamento múltiplo de sequência entre representantes de espécies do clado Lophotrochozoa
e Ecdysozoa foi possível observar uma alta conservação de sma-mir-10 e seus ortólogos,
principalmente na região seed de sma-mir-10-5p e sma-mir-10-3p (Figura 33b).
Específicamente, sma-mir-10-5p e sja-mir-10-5p apresentaram 100% de identidade ao nível
de nucleotídeos (Figura 33b). A conservação da seqüência de nucleotídeos do miRNA
maduro reflete a importância destas pequenas moléculas para o funcionamento celular
correto.
98
Predição Computacional de miRNAs em S. mansoni
A
99
Predição Computacional de miRNAs em S. mansoni
B
Figura 33: Conservação do miRNA sma-mir-10 no grupo Bilateria (a) As relações
filogenéticas foram referidas entre os precursores sma-mir-10 e seus ortólogos. A árvore
filogenética foi gerada utilizando o método Neighbor-Joining, e o modelo Kimura-2parâmetros, ambos executados no programa MEGA 4.0. Os clados distintos apresentaram os
grupos Deuterostômios, Ecdysozoa e Lophotrochozoa. Somente os “bootstraps” acima de 30
foram considerados para 2000 replicas analisadas. (b) A alta fidelidade nos alinhamentos
entre os precursores sma-mir-10 e seus respectivos ortólogos de Ecdysozoa e Lophotrochozoa
foram realizadas usando Clustal 2.0 e RNAalifold. As formas maduras dos miRNAs são
mostradas nas caixas cinza.
IV.3.6 Duplicações dos miRNAs 71 e 2 em S. mansoni
Eventos de duplicação gênica têm sido encontrados em diversas espécies e com
diferentes grupos de sequências. A ocorrência de duplicações em genes de miRNAs tem sido
reportada em vários trabalhos em diversas espécies (Tanzer and Stadler, 2004; Hertel et al.,
2006; Maher et al., 2006). As duplicações gênicas em miRNAs tem sido divididas em duas
classes e facilmente distinguidas. A primeira classe reporta genes de miRNAs que sofreram
uma duplicação gênica local “in tandem”, ou seja, resultando em parálogos provavelmente
co-localizados no mesmo transcrito. Estes genes provavelmente mantêm uma disposição
cromossômica constante durante a evolução permitindo estar fisicamente ligados (in linkage).
A segunda classe reporta genes que sofreram duplicações não locais dentro do mesmo
genoma resultando em parálogos encontrados em diferentes cromossomos. Neste caso, a
conservação evolutiva tem sido menos pronunciada. Esta duplicação pode ocorrer também
100
Predição Computacional de miRNAs em S. mansoni
por um bloco de sequências no genoma como acontece em duplicações gênicas envolvendo
um cluster completo de miRNAs (Hertel et al., 2006).
Neste trabalho, foram encontrados duplicatas gênicas dos representantes das famílias
mir-2 e mir71. Uma análise pontual de cada família revela os dois tipos de duplicações
ocorrendo em S. mansoni, tanto a local quanto a não local. Espécies relativamente próximas
evolutivamente dentro do grupo Protostômios apresentam diferentes disposições destes genes
no genoma. Um exemplo comparativo é o caso destes genes em C. elegans. O nematódeo C.
elegans apresenta estas duas famílias gênicas ligadas em um cluster, mas com a composição
de apenas um miRNA de cada família, cel-miR-2 e cel-miR-71. Quando comparado com C.
elegans, S. mansoni demonstrou a presença de duplicações gênicas. Tanto os miRNAs
provenientes da família mir-2 quanto mir-71 apresentaram duplicações gênicas não locais,
apresentando parálogos distantes no genoma, em diferentes cromossomos. No entanto,
apenas os representantes da família mir-2 em S. mansoni apresentaram também duplicações
locais como pode ser observado nas posições e localização cromossômica destes genes
(Tabela 9).
Os miRNAs da família mir-2 foram encontrados em quase todas as espécies de
Protostômios (Lophotrochozoans e Ecdysozoans). O número de cópias destes genes e a
similaridade entre eles variam de espécie para espécie. Em S. mansoni os representantes da
família mir-2 foram sma-mir-2a, sma-mir-2b, sma-mir-2c, sma-mir-2d e sma-mir-2e. Os
miRNAs maduros sma-mir-2b-3p, sma-mir-2c-3p, sma-mir-2d-3p e sma-mir-2b-3p
apresentaram um alto grau de similaridade principalmente na região seed, com 100% de
identidade.
A análise filogenética dos miRNAs da família mir-71 mostrou uma distribuição dos
genes parálogos e ortólogos na escala evolutiva (Figura 34). Um dos representantes desta
família, identificado em S. mansoni, sma-mir-71, apresentou alto grau de conservação quando
comparado com os miRNAs dos Platelmintos, S. mediterranea (sme-mir-71c) e S. japonicum
(sja-mir-71) demonstrando distribuição taxonômica semelhante a distribuição das espécies
(Figura 34). Da mesma família de sma-mir-71, o miRNA sma-mir-71b, agrupou no mesmo
clado do ortólogo encontrado em S. japonicum, sja-mir-71b, mas entre os clados de espécies
pertencentes aos grupos Ecdysozoa e Deuterostômios (Figura 34a).
Tanto S. mediterranea quanto S. japonicum (ambos Platelmintos) mostraram
duplicações gênicas semelhantes a S. mansoni nas duas famílias de miRNAs (mir-71 e mir2). S. mediterranea apresentou 4 estruturas de cluster mir-71/2 e S. japonicum apresentou 2
estruturas como S. mansoni. Os miRNAs sma-mir-71 e sma-mir71b apresentaram alta
101
Predição Computacional de miRNAs em S. mansoni
similaridade quando comparado com seus ortólogos em Ecdysozoans e Lophotrochozoans
(Figura 34b). As partes mais conservadas nas sequências dos precursores foram as regiões
seed dos miRNAs maduros corroborando com alinhamentos de outras famílias de miRNAs
como mir-10. A gênese da duplicação dos miRNAs da família mir-71 sugere que esta
duplicação pode ter sido gerada antes da divergência das espécies de Platelmintos na
evolução. Esta hipótese será testada no capítulo V.
A
102
Predição Computacional de miRNAs em S. mansoni
B
Figura 34: Conservação do miRNA dos genes sma-mir-71 e sma-mir-71b no grupo
Bilateria. (a) As relações filogenéticas foram referidas entre os precursores da família mir71. A árvore filogenética foi gerada utilizando o método Neighbor-Joining, e o modelo
Kimura-2-parâmetros, ambos executados no programa MEGA 4.0. Os clados distintos
apresentaram os grupos Deuterostômios (Cephalochordata, Echinodermata e Hemichordata),
Ecdysozoa e Lophotrochozoa. Somente os “bootstraps” acima de 30 foram considerados para
2000 replicas analisadas. (b) A alta fidelidade nos alinhamentos entre os precursores smamir-71, sma-mir-71b e seus respectivos ortólogos de Ecdysozoa e Lophotrochozoa foram
realizadas usando Clustal 2.0 e RNAalifold. As formas maduras dos miRNAs são mostradas
nas caixas cinza.
IV.3.7 Clusteres mir-71/2 e mir-71b/2
Os clusteres de miRNAs tem sido encontrados em camundongos, humanos e muitas
outras espécies (Tanzer and Stadler, 2004; Noguer-Dance et al., 2010). Os pré-miRNAs são
considerados agrupados no mesmo cluster se eles estiverem distantes um do outro menos que
10 mil pares de base (miRBase). Seguindo este critério, sete pré-miRNAs foram identificados
como parte de dois clusteres no genoma de S. mansoni. O primeiro cluster foi encontrado
contendo quatro pré-miRNAs: sma-mir-71, sma-mir-2a, sma-mir-2b e sma-mir-2e; e o
segundo contendo 3 pré-miRNAs sma-mir-71b, sma-mir-2c e sma-mir-2d (Figura 35).
Ambos os clusteres contem pelo menos um membro da família mir-71 e um membro da
família mir-2, corroborando com dados do mesmo cluster em espécies de Ecdysozoa e
103
Predição Computacional de miRNAs em S. mansoni
Lophotrochozoa. A mesma organização e distribuição dos ortólogos nos clusteres foram
encontradas no parasito S. japonicum (Huang et al., 2010; Wang et al., 2010).
A distribuição destes clusteres nos cromossomos do parasito S. mansoni mostrou a
presença do cluster sma-71/2 no cromossomo sexual W e cluster parálogo, sma-mir-71b/2,
foi encontrado no cromossomo autossômico 5. O cromossomo sexual W está presente apenas
em fêmeas da espécie de S. mansoni sugerindo a presença de um cluster de miRNAs gênero
específico neste parasito (Figura 35). A presença de miRNAs gênero-específico em relação a
posição no genoma não tinha sido relatada anteriormente. Tem sido reportado e considerado
miRNAs gênero específicos aqueles com alta expressão em um gênero, macho ou fêmea
(Mishima et al., 2008). Mishima (2008) utilizando biblioteca de pequenos RNAs apresentou
diferentes perfis de expressão de miRNAs em testículos e ovários de camundongos. No
mesmo trabalho, foram mostrados aproximadamente 45 miRNAs distintamente expressos em
ovário e 35 em testículos, evidenciando a presença de miRNAs gênero-específicos. A
expressão de miRNAs específicos em determinado gênero sugere uma provável participação,
destas moléculas, no desenvolvimento sexual do organismo (Mishima et al., 2008).
Figura 35: Clusteres de miRNAs no genoma de S. mansoni. As estruturas secundárias dos
clusteres sma-mir-71/2 e sma-mir-71b/2 foram realizadas por RNAfold (Hofacker, 2009). A
posição nos cromossomos, tamanho e direção da fita são mostradas nas caixas cinza abaixo
da figura.
Visto a importância biológica destas moléculas no controle da expressão gênica
envolvendo seus potenciais alvos, assim como a diversidade de arranjos destas moléculas nos
104
Predição Computacional de miRNAs em S. mansoni
organismos, os próximos capítulos enfatizarão 3 pontos: a validação dos miRNAs
conservados e não conservados em S. mansoni; a predição e a validação de seus potenciais
genes alvos no genoma do parasito; e a análise da conservação evolutiva do cluster mir-71/2
em espécies de animais.
Todos os resultados do trabalho mostrado acima fazem parte do manuscrito
recentemente publicado na Revista Genomics: “Genome-wide identification of novel
microRNAs and their target genes in the human parasite Schistosoma mansoni” (Anexo 2)
(de Souza Gomes et al., 2011).
105
Cluster Protostômio-específico mir-71/2
Capítulo V
Cluster Protostômio-específico mir-71/2
106
Cluster Protostômio-específico mir-71/2
V.1 Justificativa
O desenvolvimento de ferramentas computacionais específicas para predição de
miRNAs no genoma de diversas espécies tem sido realizado com sucesso. Os miRNAs tem
sido encontrados formando clusteres em muitas espécies sendo estes processados através de
um único transcrito (Saini et al., 2008). Em geral, miRNAs são considerados agrupados em
forma de cluster quando estes se encontram menos de 10 kb distantes um do outro (Saini et
al., 2007; Huang et al., 2011). No entanto, a distância correta para considerar miRNAs
compondo um cluster é desconhecida, sendo permitidas distâncias um pouco maiores ou um
pouco menores. Marco (2010) demonstrou que 50% dos miRNAs identificados em T.
castelam se agrupam no genoma em uma distância inferior a 27 kb. Para esta classe de
miRNAs tem sido sugerido uma co-evolução e uma provável ação conjunta nos genes alvos
aumentando seu impacto no controle da expressão gênica (Altuvia et al., 2005; Chhabra et al.,
2010).
Diversas funções, relacionadas com o controle da expressão gênica, tem sido
correlacionadas às moléculas de miRNAs. Um potencial alvo de estudo tem sido os miRNAs
alocados em clusteres. Neste trabalho, foi desenvolvida uma ferramenta de busca, predição e
análise de miRNAs alocados no cluster mir-71/2. Estas duas famílias de miRNAs, mir-2 e
mir-71, tem mostrado características importantes e essenciais em diversos organismos. Os
miRNAs da família mir-2 de D. melanogaster tem sido correlacionados a supressão da
apoptose durante a embriogênese almejando o silenciamento de genes pró-apoptóticos, como
K-box Notch da via Notch (Altuvia et al., 2005). O outro gene do cluster mir-71/2, mir-71,
tem mostrado envolvimento na regulação de genes relacionados aos processos de
longevidade, resistência ao estresse e danos ao DNA (de Lencastre et al., 2010). Têm sido
mostrados a expressão de cel-mir-71 em estágios jovens do nematódeo e um decréscimo
acentuado na fase de adultos atuando como modulador negativo da expressão de proteínas
envolvidas com o ponto de checagem no ciclo celular como CDC-25.1 e PDK-1 (de
Lencastre et al., 2010).
Neste trabalho, o cluster mir-71/2 foi predito exclusivamente em genomas de
organismos Protostômios sugerindo que este cluster mir-71/2 é Protostômio-específico. A
ausência do cluster mir-71/2 em organismos de Deuterostômios e a presença em Protostômios
merece ser investigada pois têm um potencial grande de estudo permitindo o desenho de
107
Cluster Protostômio-específico mir-71/2
novas estratégias no combate de doenças causadas por Protostômios como nematóides e
trematódeos.
108
Cluster Protostômio-específico mir-71/2
V.2 Materiais e Métodos
V.2.1 Identificação dos miRNAs e regiões genômicas
Os precursores de miRNAs, referentes ao cluster mir-71/2, assim como suas estruturas
maduras, foram obtidas no banco de dados miRBase (Welcome Trust Sanger Institute’s
miRBase, http://microrna.sanger.ac.uk - release 17.0, maio de 2011). Para isso, foram
utilizados a ferramenta miRBase Web Browser e as sequências disponibilizadas em formato
fasta do próprio banco de dados. As prováveis posições dos miRNAs presentes nos clusteres
foram apuradas empregando a ferramenta blastn (em parâmetros “default”) versus bancos de
dados de genoma disponíveis de espécies do reino Animália. Os novos miRNAs identificados
foram determinados a partir dos dados genômicos das seguintes espécies: Ixodes scapularis
(VectorBase, http://www.vectorbase.org, IscalW1), Daphia pulex (Colbourne et al., 2011),
Acyrthosiphon pisum (Human Genome Sequencing Center at the Baylor College of Medicine
- http://www.hgsc.bcm.tmc.edu/) (The International Aphid Genomics Consortium, 2010),
Anopheles gambiae (VectorBase, http://www.vectorbase.org, AgamP3.5), Rhodnius prolixus
(VectorBase, http://www.vectorbase.org, RproC1, SuperContig.feb11), Pediculus humanus
(VectorBase, http://www.vectorbase.org, PhumU1), Culex quinquefasciatus (VectorBase,
http://www.vectorbase.org,
CpipJ1),
C.
briggsae
(WormBase
database,
http://www.wormbase.org/), S. mansoni (GeneDB, www.genedb.org) e S. japonicum
(GeneDB, www.genedb.org). Os fragmentos de DNA genômico contendo os genes de
miRNAs foram recuperados flanqueados, em cada lado, por 10000 nucleotídeos. Em geral, a
distância de 10000 nucleotídeos, entre um miRNA e outro, tem sido considerada aceitável
para considerá-los pertencentes ao mesmo cluster de miRNA. A atual versão do banco de
dados de miRNA (miRBase – versão 17.0) tem considerado os miRNAs agrupados em
clusteres aqueles encontrados no genoma em uma distância máxima de 10000 nucleotídeos,
seja em fitas na mesma orientação ou orientações contrárias. Após a obtenção dos fragmentos
genômicos de 10000 nt estes foram estocados no formato fasta para posterior análise.
V.2.2 Predição computacional dos genes de miRNAs clusterizados
Uma abordagem computacional, integrada com vários passos, foi utilizada para
identificação de genes de miRNAs clusterizados. Esta busca foi realizada empregando
109
Cluster Protostômio-específico mir-71/2
fragmentos genômicos específicos de espécies de animais tanto Protostômios quanto
Deuterostômios. Brevemente, as sequências com potencial formação de estruturas similares a
grampos (hairpin) foram identificadas usando o programa Einverted, do pacote EMBOSS, e a
ferramenta BLASTn. Os parâmetros empregados para ferramenta Einverted foram: pontuação
mínima (minimum score threshold) 20, penalidade de espaços (gap penalty) 4, pontuação de
pareamento (match score) 2, pontuação de despareamento (mismatch score) -2 e permissão
para extensão do fragmento repetitivo (maximum extent of repeats) 110. Tal estratégia foi
capaz de obter sequências com tamanhos entre 50 e 110 nucleotídeos. Além disso, foi
realizado BLASTn usando sequências de precursores de miRNAs para busca de possíveis
sequências que se comportam na forma secundária, como grampos. Os parâmetros utilizados
pela ferramenta BLASTn foram e-value menor que 0,001, tamanho mínimo de pareamento
entre as sequências no alinhamento local 25 nucleotídeos e no mínimo 80% de identidade
entre as sequências. As sequências positivas foram recuperadas das respectivas sequências
genômicas considerando o número de nucleotídeos da sequência do miRNA precursor
correspondente tanto a jusante quanto a montante. Foi também considerado a presença de
sequências nas orientações da extremidade 5` para 3` quanto da extremidade 3` para 5`. As
sequências recuperadas, com estruturas parecidas com grampos (“hairpin”) foram
armazenadas em um arquivo tipo fasta e empregadas nas análises subsequentes.
As sequências com prováveis estruturas de grampos foram, inicialmente, avaliadas
quanto ao dobramento de sua estrutura secundária levando em consideração principalmente a
energia livre mínima da molécula de RNA. Este procedimento foi realizado com o auxílio da
ferramenta RNAfold proveniente do pacote de Vienna RNA Package(Hofacker, 2009). Os
parâmetros aplicados para esta etapa foram energia livre mínima da estrutura secundária de
RNA dobrada -20kcal/mol e opções "-p -d2 -noLP"(Hofacker, 2009). O valor de energia, -20
kcal/mol, em geral, tem sido considerado necessário para que uma molécula de precursor de
miRNA seja estável propiciando a geração de miRNAs maduros. As estruturas positivas na
etapa anterior foram filtradas em relação ao conteúdo de guanina e citosina (GC) na
molécula. Foram mantidas as sequências com conteúdo de GC entre 30% e 65%.
Posteriormente, os miRNAs maduros depositados no miRBase foram comparados com as
sequências obtidas. Foi considerado um pareamento válido, entre as sequências obtidas
(estrutura provável do precursor de miRNAs) e os miRNAs maduros depositados no
miRBase, aqueles, no qual, o alinhamento gerado, gerou um duplex híbrido com no máximo
6 despareamentos de base (mismatches) no total e apenas 1 despareamento na região seed
(entre os nucleotídeos 2 e 8 da sequência do miRNA maduro). Com o intuito de manter
110
Cluster Protostômio-específico mir-71/2
apenas as estruturas de RNA relacionadas com os miRNAs, as sequências com alta
similaridade com os RNA não codificadores, rRNA, snRNA, SL RNA, SRP, tRNAs e RNase
P, foram removidas. Foi utilizado Rfam MicroRNA Registry(version 3.0) para conduzir este
procedimento. Após a execução destes filtros os miRNAs, tanto na forma madura, quanto na
forma precursora, foram armazenados em arquivo multifasta para posterior análise.
V.2.3 Análise Comparativa dos miRNAs clusterizados em mir71/2
Um conjunto de parâmetros foi selecionado e empregado para comparar
características de conhecidos miRNAs depositados no miRBase versão 17.0 presentes no
cluster mir-71/2 e aqueles preditos neste trabalho. Foram recuperados as sequências maduras
e precursoras de cada miRNA conhecido e separados em diferentes arquivos fasta. As
seguintes características foram utilizadas para comparação: energia mínima livre ajustada
(AMFE), índice de energia mínima livre (MFEI), conteúdo de GC (GC), energia mínima livre
do conjunto termodinâmico (MFEE), diversidade do conjunto termodinâmico e freqüência da
estrutura de energia mínima livre no conjunto termodinâmico. O parâmetro AMFE foi
medido utilizando o MFE encontrado para 100 nucleotídeos em tamanho. O parâmetro
AMFE foi calculado seguindo a seguinte formula: MFEI = [(AMFE) × 100] / (G% +
C%)](Zhang et al., 2006a). As medidas de diversidade do conjunto termodinâmico,
freqüência da estrutura de energia mínima livre no conjunto termodinâmico e MFE foram
obtidas usando RNAfold. Estas características foram agrupadas e analisadas na forma de
gráficos e tabelas.
V.2.4 Conservação evolutiva e Distribuição Filogenética dos miRNAs clusterizados em
mir71/2
As sequências de nucleotídeos dos precursores de miRNAs (pré-miRNAs),
depositadas no miRBase e identificadas neste trabalho, foram alinhadas utilizando o
programa ClustalX 2.0(Thompson et al., 2002; Larkin et al., 2007). Os parâmetros de
alinhamento utilizados foram: abertura de espaços entre os alinhamentos de sequências 22.50
(“gap opening”) e extensão de espaços entre os pedaços de sequências alinhadas 0,83 (“gap
extension”). Em seguida, os programas RNAfold e RNAalifold, provenientes do pacote
Vienna RNA, foram empregados para verificação da estrutura secundária dos preditos
precursores de miRNAs e para verificação da correlação entre o alinhamento múltiplo de
111
Cluster Protostômio-específico mir-71/2
sequência dos precursores de miRNAs e a estrutura secundaria predita para cada um
deles(Hofacker, 2009). As sequências maduras dos miRNAs foram comparadas utilizando
WebLogo 2.8.2 (http://weblogo.berkeley.edu/logo.cgi) (Crooks et al., 2004). Foi considerada
no desenho do gráfico a contribuição de cada nucleotídeo para cada posição na estrutura
primaria dos miRNAs maduros. Alem disso realizou-se uma análise filogenética dos
precursores de miRNAs preditos e seus homólogos. Esta foi realizada utilizando o método
Neighbor-joining aplicando como modelo Kimura dois parâmetros (“Kimura-two
parameters”) para estimar a divergência entre as sequências(Saitou and Nei, 1987). Tanto o
método quanto o modelo foram aplicados utilizando a ferramenta MEGA 4 (Tamura et al.,
2007). A confiabilidade estatística de cada ramo na árvore gerada foi avaliada utilizando
“bootstrap” com 2000 réplicas. Os valores de “bootstrap” maiores que 30 foram mantidos
entre os nós de cada ramo. Para melhor visualização nós indicamos o agrupamento de
sequências baseados na filogenia da árvore evolutiva consenso. As abreviações para cada
organismo nas árvores filogenéticas são mostradas a seguir: ame (Apis mellifera), api
(Acyrthosiphon pisum), bfl (Branchiostoma floridae), bma (Brugia malayi), bmo (Bombyx
mori), cbr (Caenorhabditis briggsae), cel (Caenorhabditis elegans), cqu (Culex
quinquefasciatus), crm (Caenorhabditis remanei), cte (Capitella teleta), dan (Drosophila
ananassae), der (Drosophila erecta), dgr (Drosophila grimshawi), dme (Drosophila
melanogaster), dmo (Drosophila mojavensis), dpe (Drosophila persimilis), dps (Drosophila
pseudoobscura), dpu (Daphnia pulex), dre (Danio rerio), dse (Drosophila sechellia), dsi
(Drosophila simulans), dvi (Drosophila virilis), dwi (Drosophila willistoni), dya (Drosophila
yakuba), isc (Ixodes scapularis), lgi (Lottia gigantea), lmi (Locusta migratoria), nlo (Nasonia
longicornis), nvi (Nasonia vitripennis), sja (Schistosoma japonicum), sko (Saccoglossus
kowalevskii), sla (Saguinus labiatus), sma (Schistosoma mansoni), sme (Schmidtea
mediterranea), spu (Strongylocentrotus purpuratus) e tca (Tribolium castaneum).
V.2.5 Implementação e plotagem dos gráficos
A instalação, implementação e execução das ferramentas computacionais, bem como
dos scripts, foram realizadas na Plataforma GNU Linux (Ubuntu). A linguagem de
programação utilizada para escrita dos script foi PERL, que se comportou mais simples para
o trabalho com arquivos texto de genoma. A plotagem dos gráficos boxplots foi executada
utilizando o programa R 2.12.1 (“The R Project for Statistical Computing” - http://www.rproject.org/).
112
Cluster Protostômio-específico mir-71/2
V.3 Resultados e Discussão
V.3.1 Predição do cluster mir-71/2
Neste trabalho, uma ferramenta computacional integrada foi desenvolvida para
predição e identificação de miRNAs alocados no cluster miR71/2. Esta ferramenta foi
aplicada em diferentes genomas de espécies de Protostômios e Deuterostômios, considerando
miRNAs no mesmo cluster distantes até 10 kb um do outro. O cluster de miRNA mir71/2 tem
sido composto pelos miRNAs da família miR-2 (miRBase MIPF0000049) e os miRNAs da
família mir-71 (miRBase MIPF0000278). A família mir-2 possui como membros mir-2 e
mir-13, os quais têm sido considerados na mesma família devido à alta similaridade de
sequência principalmente na região seed. Marco (2010) tem mostrado a presença deste cluster
de
miRNAs
em
espécies
de
insetos
(Protostômios
Artrópodes)
e
alguns
de
invertebrados(Marco et al., 2010). Este cluster tem sido mostrado também em organismos do
clado Lophotrochozoa Platelmintos como S. mansoni, S. japonicum, S. mediterranea e
Echinococcus granulosus (Palakodeti et al., 2006; Huang et al., 2009; Hao et al., 2010;
Cucher et al., 2011; de Souza Gomes et al., 2011). Nosso grupo de trabalho identificou a
presença deste cluster em S. mansoni utilizado o algoritmo mostrado no capítulo IV (Figura
35). No entanto, o algoritmo apresentado neste capítulo é específico de regiões contendo o
cluster mir-71/2 e foi capaz de predizer além dos miRNAs identificados anteriormente no
Capítulo IV, um novo miRNA, sma-mir-2f, compondo o cluster sma-mir-71/2a/2e/2f (Figura
35).
A identificação de miRNAs do cluster mir-71/2 foi esgotada utilizando as últimas
versões dos genomas de espécies de Lophotrochozoans e Ecdysozoans. Em alguns casos as
sequências não representavam o genoma completamente fechado, como é o caso de S.
mansoni. Assim, uma análise deve ser realizada ao final do fechamento completo do genoma,
para evitar a subestimação do número de miRNAs compondo o cluster mir-71/2.
V.3.2 Cluster mir-71/2 Protostômio específico
No intuito de investigar a co-evolução e a presença do cluster mir-71/2 apenas em
espécies Protostômios, (avaliando todo Reino Animália incluindo Protostômios e
Deuterostômios) sequências genômicas nas vizinhanças dos genes das famílias de miRNAs,
mir-2 e mir-71, foram recuperadas dos bancos de dados das espécies I. scapularis, D. pulex,
113
Cluster Protostômio-específico mir-71/2
A. pisum, A. gambiae, R. prolixus, P. humanus, C. quinquefasciatus, C. briggsae, S. mansoni,
S. japonicum, B. floridae, S. kowalevskii, S. purpuratus, A. aegypti, D. melanogaster, C.
elegans, C. briggasae, L. gigantea, C. teleta e S. mediterranea. A presença ou ausência do
cluster foi determinada observando a disposição das sequências dos miRNAs, miR-2, mir-13
e mir-71 na sequência genômica. Foi considerado como cluster mir-71/2 conservado todo
trecho de sequência genômica contendo no mínimo um membro da família mir-2 e um
membro da família mir-71, em uma distância inferior a 10 kb. Os resultados mostraram a
presença do cluster mir-71/2 apenas em espécies de Protostômios (Ecdysozoans e
Lophotrochozoans) (Figura 36). Foram identificados 28 novos precursores de miRNAs e 28
novos miRNAs maduros, sendo todos não depositados no banco de dados de miRNA,
miRBase, versão 17.0 (miRBase – http://www.mirbase.org). Nesta versão do miRBase,
aproximadamente 180 miRNAs tem sido depositados como representantes da família mir-2
ou da família mir-71. O número de novos miRNAs encontrados, neste trabalho, representa
mais do que 15 % do total de genes destas famílias sendo um número consideravelmente
expressivo para novas predições de miRNAs. Os novos miRNAs preditos foram nomeados de
acordo com o respectivo ortólogo (Tabela 10). Foram preditos vinte miR-2 e quatro mir71dentro do clado Lophotrochozoa e Ecdysozoa e quatro mir-13 dentro do clado Ecdysozoa.
Em geral, os novos miRNAs identificados mostraram alta conservação ao nível de
nucleotídeos quando comparados com seus ortólogos.
Os resultados encontrados neste trabalho, foram comparados com os dados obtidos
utilizando a ferramenta MapMi (http://www.ebi.ac.uk/enright-srv/MapMi/). A comparação
foi possível utilizando genomas utilizados pelos dois algoritmos concomitantemente, sendo a
espécie R. prolixus excluída desta análise. Dentre os 23 miRNAs identificados por este
algoritmo, apenas 15 miRNAs foram co-identificados pelo programa MapMi. As análises de
comparação utilizaram os dados pré-computados fornecidos pelo algoritmo MapMi com
parâmetros default. Como pode ser observado o algoritmo utilizado neste trabalho foi mais
eficiente para identificação de miRNAs presentes específicamente no cluster mir-71/2 quando
comparado com o programa MapMi. A especificidade do algoritmo para predição de genes
compondo este cluster é uma vantagem do uso deste algoritmo já que o programa MapMi
prediz não apenas pré-miRNA provenientes do cluster miR-71/2, mas todos os miRNAs
prováveis presentes no genoma estudado.
Esta mesma análise comparativa foi realizada utilizando o programa disponível
miROrtho (http://cegg.unige.ch/mirortho/browse). Foi também possível apenas a comparação
das sequências genômicas provenientes das espécies utilizadas em ambos os algoritmos como
114
Cluster Protostômio-específico mir-71/2
A. gambiae, P. humanus e D. pulex. Entre dez miRNAs identificados nestas espécies apenas
3 foram identificados utilizando miROrtho.
Os miRNAs identificados exclusivamente neste trabalho foram: rho-mir-2a-2, rhomir-2a-1, rho-mir-2b-1, rho-mir-2a-3, sja-mir-2f, sma-mir-2f, dpu-mir-2b-1, rho-mir-71, iscmir-13a, dpu-mir-13b, api-mir-13b e phu-mir-13b. Estes resultados sugerem que a utilização
de ferramentas mais específicas para busca de miRNAs pode ser uma alternativa mais
adequada para identificação de novos e conservados miRNAs compondo clusteres de miRNA
em espécies de animais.
A distribuição dos miRNAs alocados no cluster 71/2 na escala evolutiva foi também
avaliada neste trabalho. A figura 36 apresenta o momento no qual o cluster mir-71/2
provavelmente surgiu na evolução das espécies. Este momento tem sido proposto ser logo
após a explosão Cambriana com o aparecimento dos primeiros Eumetazoans, associado ao
fato dos miRNAs, deste cluster, estarem ausentes em Cnidarians, Parazoans ou espécies de
outros Reinos como Plantae ou Fungi (Figura 36).
Estes resultados levantam a hipótese que o cluster mir-71/2 é Prototômio-específico.
Esta hipótese é corroborada pois nas espécies B. floridae, S. purpuratus e S. kowalevskii o
membro da família de miRNAs mir-2 (mir-2 ou mir-13) não foi localizado nem próximo do
miRNA mir-71, compondo o cluster, nem em qualquer outra parte do genoma (Figura 36).
Novos miRNAs das famílias mir-2 e mir-71 foram preditos nos genomas das espécies
Ecdysozoans e Lophotrochozoans. A representação por setas na figura 36 mostra a presença
do miRNA no cluster mir-71/2. O único gênero dentro deste clado que não apresentou esta
estrutura de cluster foi o gênero Drosophila. Este gênero tem apresentado diferentes clusteres
como mir2/2 e mir-2/13 sem a presença de mir-71 (miRBase). Os resultados deste trabalho
corroboram com os resultados obtidos por Marco (2010) que sugerem a fragmentação deste
cluster no gênero Drosophila com a perda do mir-71 durante a evolução.
O miRNA mir-71 foi encontrado em espécies de Deuterostômios Echinodermatas,
Hemichordatas, e Cephalochordatas mas não encontrado em Deuterostômios Vertebratas e
Urochordatas (Figura 36). Foi observado que os Deuterostômios Vertebratas e Urochordatas
não apresentaram nenhum dos representantes do cluster mir-71/2 no genoma. A ausência ou
presença do cluster ou apenas de um dos membros do cluster no genoma pode ter um impacto
direto nos genes alvos e conseqüentemente no controle da expressão gênica no organismo.
Como observado na figura 36, a perda deste cluster durante a evolução pode ter implicado em
uma mudança no repertório de genes regulados pelos miRNAs nos organismos.
115
Cluster Protostômio-específico mir-71/2
Tabela 10: Sequências preditas dos miRNAs maduros, miRNA mir-2, mir-13 and mir-71, seus respectivos ortólogos no miRBase e suas
predições pelos programas MapMi e Mirortho.
miRNA
mir-2
aga-mir-2
rho-mir-2a-2
rho-mir-2a-1
rho-mir-2b-1
rho-mir-2a-3
phu-mir-2c
phu-mir-2
phu-mir-2a-2
phu-mir-2a-1
cqu-mir-2c
cqu-mir-2b
sja-mir-2f
sma-mir-2f
sma-mir-2d
sma-mir-2c
sma-mir-2a
sma-mir-2b
sma-mir-2e
cbr-mir-2
dpu-mir-2b-1
mir-71
rho-mir-71
sma-mir-71b
aga-mir-71
phu-mir-71
mir-13
isc-mir-13a
dpu-mir-13b
api-mir-13b
phu-mir-13b
miRNA maduro
Região Seed
Tamanho
Ortólogo miRBase
(SSearch)
UAUCACAGCCAGCUUUGAAGAGC
UAUCACAGCCAGCUUUGAUGAGC
UAUCACAGCCACUUUGAUGAGC
UAUCACAGCCAUUUUUGACGAGU
UAUCACAGCCAGCUUUGAUGGGC
UAUCACAGCCAGCUUUGAUGAGC
UAUCACAGCCAGCUUUGAUGAGCG
UAUCACAGCCAGCUUUGAUGAGUG
UAUCACAGCCACUUUGAUGACC
UAUCACAGCCAGCUUUGAUGAGC
UAUCACAGCCAGCUUUGAUGAGCU
UCACAGCCAAUAUUGAUACC
UCACAGCCAAUAUUGAUACC
UAUCACAGUCCUGCUUAGGUGA
UAUCACAGCCGUGCUUAAGGGC
UCACAGCCAGUAUUGAUGAACG
UAUCACAGCCCUGCUUGGGACACA
UAUCACAGUCCAAGCUUUGGU
UAUCACAGCCAGCUUUGAUGUGC
UAUCACAGCCAGCUUUGACGAGC
23
23
22
23
23
23
24
24
22
23
24
20
20
22
22
22
24
21
23
23
cqu-mir-2
bma-mir-2a
dan-mir-2a-1
aae-mir-2b
dpu-mir-2a
tca-mir-2c
ame-mir-2-1
dwi-mir-2a-1
dps-mir-2a-1
aae-mir-2c
aae-mir-2b
sja-mir-2a
egr-mir-2c
sja-mir-2d
sja-mir-2c
sja-mir-2a
sja-mir-2b
sja-mir-2e
crm-mir-2
dme-mir-2b-1
Predito
Predito
Predito
Predito
Predito
Predito
Predito
Predito
Predito
Predito
Predito
Predito
-
Predito
Predito
Predito
-
UGAAAGACAUGGGUAGUGAGAUG
UGAAAGACUUGAGUAGUGAGACG
AGAAAGACAUGGGUAGUGAGAUA
UGAAAGACAUGGGUAGUGAGAUG
23
23
23
23
nvi-mir-71
sja-mir-71b
cqu-mir-71
bmo-mir-71
Predito
Predito
Predito
-
UAUCACAGCCAUCUUUGAUGACC
UAUCACAGCCAUUCUAGAUGCGC
UAUCACAGCCGUUUUUGACAAUU
UAUCACAGCCAUAUUUGACAAGU
23
23
23
23
ngi-mir-13a
ame-mir-13b
ame-mir-13b
nvi-mir-13b
-
-
116
Identificação
MapMi
Identificação
Mirortho
Cluster Protostômio-específico mir-71/2
Os miR-71 foram encontrados em regiões intergênicas dos Deuterostômios B.
floridae, S. purpuratus e S. kowalevskii. Este resultado corrobora com a posição destes
miRNAs em espécies de Protostômios que apresentaram, em geral, este miRNA localizado
em regiões intergênicas. Entretanto em B. floridae o bfl-miR-71 forma cluster com o miRNA
“bfl-mir-4890” é espécie-específico (Figura 36). A presença de um miRNA espécieespecífico próximo de mir-71, compondo um cluster, tem sido encontrado também em
espécies de Prototômios como em C. teleta e S. mediterranea (Figura 36).
Uma exceção, neste trabalho, foi a predição de um cluster com tamanho superior a
10kb. O miRNA cbr-mir-2, predito no genoma de C. brigassea, foi encontrado em uma
distância de 11 Kb do miRNA cbr-mir-71. No entanto, este miRNA foi considerado nas
análises deste trabalho devido sua alta conservação ao nível de nucleotídeos quando
comparado com o miRNA cel-mir-2, identificado no genoma de C. elegans (mirBase) (Figura
37). As sequências maduras do novo miRNA predito e do ortólogo cel-mir-2, apresentaram
100% de identidade ao nível de nucleotídeos (Figura 37). Esta identidade mostra a
conservação destas estruturas de clusteres, evidenciando uma conservação não apenas ao
nível de genoma, mas também ao nível dos potenciais alvos destes miRNAs, influenciando a
dinâmica biológica nas células dos respectivos organismos.
117
Cluster Protostômio-específico mir-71/2
118
Cluster Protostômio-específico mir-71/2
Figura 36:Árvore evolutiva e representação dos genes mir-71, mir-2 e mir-13. A árvore representa um esquema dos genes de miRNAs mir71, mir-2 e mir-13 na escala evolutiva. A disposição destes genes em diversas espécies é representada por barras horizontais com seta indicando
a presença do gene. A legenda mostra as formas dispostas na figura e suas denominações. A disposição dos ramos da árvore foi extraída de
Hashimoto-Gotoh, 2009.
Figura 37: Análise conservativa das estruturas dos genes cbr-mir-2 e cel-mir-2. A estrutura secundária dos genes é mostrada pelos sinais,
“(“, “)”, “.”, acima do alinhamento global. A estrutura do miRNA maduro conservada é mostrada pelo retângulo pontilhado preto. A região seed
do miRNA maduro é mostrada na parte inferior da figura.
119
Cluster Protostômio-específico mir-71/2
V.3.3 Duplicação do cluster mir-71/2
O número de clusteres, mir-71/2, encontrados em espécies Lophotrochozoans, foi
diferente do encontrado em espécies Ecdysozoans. Este cluster foi encontrado duplicado e
com alto nível de identidade nos Platelmintos (Lophotrochozoans) S. mansoni, S. japonicum
e S. mediterranea (Huang et al., 2009; de Souza Gomes et al., 2011). Por outro lado, a
predição dos alvos de mir-71 e mir-2 sugerem que os miRNAs parálogos distribuídos no
genoma de Platelmintos podem promover o silenciamento de diferentes alvos implicando em
uma regulação bem específica. Um exemplo, ocorre com os genes sma-mir-71 e sma-mir-71b
em S. mansoni. Os resultados dos alvos destes genes gerados neste trabalho (Capítulo VI)
mostram como o repertório de alvos regulados por miRNAs parálogos podem ser diferentes.
O cluster sma-mir-71/2, localizado no cromossomo W, sugere uma regulação gênica sexo
específica uma vez que este cluster está presente apenas em um cromossomo presente apenas
em fêmea regulando provavelmente genes alvos envolvidos com a diferenciação sexual,
maturação sexual e oviposição (Figura 35). Do ponto de vista biológico, estes miRNAs sexoespecíficoss, futuramente, podem servir como ferramentas importantes para o entendimento
da patologia da esquistossomose no hospedeiro definitivo.
V.3.4 Caracterização dos pré-miRNAs
Neste trabalho, utilizando a ferramenta RNAfold, foi realizada a caracterização da
estrutura secundária dos novos precursores de miRNAs, com a finalidade de observar cada
dobramento, evitando falsos positivos (Figura 38). Todos os 28 precursores de miRNAs
apresentaram uma estrutura secundária semelhante aos respectivos ortólogos. As estruturas
em formato de grampos (hairpin) foram observadas em todos os miRNAs preditos. Estas
estruturas são características de precursores de miRNAs uma vez que todos os miRNAs
validados possuem este tipo de estrutura. Além disso, a posição dos miRNAs maduros na
sequência precursora também corroborou com o posicionamento dos ortólogos, ou na parte
3p ou 5p do precursor(Figura 38). As estruturas secundárias de cada predito (pré-miR-71,
pré-miR-13 e pré-miR-2) mostraram, além de uma estrutura conservada, uma alta
estabilidade representada pela energia mínima livre (MFE) grande e negativa (Tabela 11).
120
Cluster Protostômio-específico mir-71/2
Figura 38: Estruturas secundárias dos precursores de miRNAs Protostômios-específicos
mir-71, mir-2, mir-13. O programa RNAFold do pacote Vienna foi utilizado para elucidação
da provável estrutura secundária. Os miRNAs maduros são evidenciados por uma caixa
cinza.
121
Cluster Protostômio-específico mir-71/2
Tabela 11: Características estruturais e termodinâmicas dos novos precursores Protostômio-específicos.
mirNA
G
(%)
A
(%)
C
(%)
U
(%)
Conteúdo
AU
Taxa
UA
Taxa
GC
Conteúdo
GC
Tamanho
MFE
(kcal/mol)
AMFE
(kcal/mol)
MFEI
MFEE
(kcal/mol)
Frequencia
(%)
Diversidade
mir-2
aga-mir-2
24,77
21,10
23,85
30,28
51,38
1,43
1,04
48,62
109
-51,96
-47,67
-0,98
-48
1,05%
12,97
rho-mir-2a-2
22,43
28,97
18,69
29,91
58,88
1,03
1,20
41,12
107
-48,4
-45,23
-1,10
-48,4
2,16%
6,19
rho-mir-2a-1
23,40
26,60
15,96
34,04
60,64
1,28
1,47
39,36
94
-42,4
-45,11
-1,15
-42,4
23,65%
2,25
rho-mir-2b-1
18,39
27,59
20,69
33,33
60,92
1,21
0,89
39,08
87
-38,89
-44,70
-1,14
-38,89
6,45%
6
rho-mir-2a-3
21,05
27,37
21,05
30,53
57,89
1,12
1,00
42,11
95
-33
-34,74
-0,83
-32,35
2,38%
15,44
phu-mir-2c
17,78
34,44
15,56
32,22
66,67
0,94
1,14
33,33
90
-31,62
-35,13
-1,05
-31,62
54,63%
1,38
phu-mir-2
28,36
23,88
22,39
25,37
49,25
1,06
1,27
50,75
67
-30,2
-45,07
-0,89
-30,2
51,94%
2,42
phu-mir-2a-2
20,91
20,91
17,27
40,91
61,82
1,96
1,21
38,18
110
-37,6
-34,18
-0,90
-35
2,93%
10,98
phu-mir-2a-1
26,14
25,00
19,32
29,55
54,55
1,18
1,35
45,45
88
-40,1
-45,57
-1,00
-40,1
22,16%
7
cqu-mir-2c
21,21
25,25
25,25
28,28
53,54
1,12
0,84
46,46
99
-36,43
-36,80
-0,79
-36,43
35,96%
2,29
cqu-mir-2b
24,47
25,53
22,34
27,66
53,19
1,08
1,10
46,81
94
-36,1
-38,40
-0,82
-33,07
1,67%
13,77
sja-mir-2f
27,36
20,75
19,81
32,08
52,83
1,55
1,38
47,17
106
-42,6
-40,19
-0,85
-43,6
1,55%
8,04
sma-mir-2f
25,89
25,00
20,54
28,57
53,57
1,14
1,26
46,43
112
-41,8
-37,32
-0,80
-40,7
6,03%
9,92
sma-mir-2d
20,00
27,62
19,05
33,33
60,95
1,21
1,05
39,05
105
-41
-39,05
-1,00
-41
24,04%
4,96
sma-mir-2c
23,66
23,66
23,66
29,03
52,69
1,23
1,00
47,31
93
-34,22
-36,80
-0,78
-34,22
20,00%
5,15
sma-mir-2a
25,93
24,69
20,99
28,40
53,09
1,15
1,24
46,91
81,00
-39,4
-48,64
-1,04
-39,40
50,64%
1,77
sma-mir-2b
25,88
22,35
28,24
23,53
45,88
1,05
0,92
54,12
85,00
-41,7
-49,06
-0,91
-41,50
37,87%
3,44
sma-mir-2e
16,67
23,61
20,83
38,89
62,50
1,65
0,80
37,50
72,00
-25
-34,72
-0,93
-24,40
53,04%
2,03
cbr-mir-2
24,11
24,11
18,75
33,04
57,14
1,37
1,29
42,86
112
-39,01
-34,83
-0,81
-37,8
2,13%
14,49
dpu-mir-2b-1
26,13
27,03
24,32
22,52
49,55
0,83
1,07
50,45
111
-41,8
-37,66
-0,75
-40,8
12,90%
5,77
mir-71
rho-mir-71
25,64
24,36
21,79
28,21
52,56
1,16
1,18
47,44
78
-44,46
-57,00
-1,20
-44,46
33,01%
2,89
sma-mir-71b
24,11
16,07
28,57
31,25
47,32
1,94
0,84
52,68
112
-35
-31,25
-0,59
-28,74
1,87%
13,25
aga-mir-71
28,18
21,82
20,00
30,00
51,82
1,38
1,41
48,18
110
-48
-43,64
-0,91
-40,91
3,59%
17,64
phu-mir-71
20,83
22,92
17,71
38,54
61,46
1,68
1,18
38,54
96
-38,46
-40,06
-1,04
-35,31
6,77%
7,91
mir-13
isc-mir-13a
22,22
22,22
27,78
27,78
50,00
1,25
0,80
50,00
90
-36,3
-40,33
-0,81
-36,3
40,41%
3,1
dpu-mir-13
27,50
18,75
23,75
30,00
48,75
1,60
1,16
51,25
80
-38,3
-47,88
-0,93
-38,3
38,53%
2,02
api-mir-13b
23,53
27,06
16,47
32,94
60,00
1,22
1,43
40,00
85
-29,7
-34,94
-0,87
-29,24
7,30%
8,9
phu-mir-13b
19,75
24,69
18,52
37,04
61,73
1,50
1,07
38,27
81
-27,5
-33,95
-0,89
-26,9
13,12%
6,5
MFE: Energia mínima livre; AMFE: Energia mínima livre Ajustada; MFEI: Índice de Energia mínima livre; MFEE: Energia mínima livre do conjunto
122
Cluster Protostômio-específico mir-71/2
A versão 17.0 do mirBAse tem depositado 146 pré-miRNAs pertencentes a família
mir-2, sendo 96 mir-2 e 50 mir-13. A família mir-71, representada apenas por mir-71, possui
27 precursores depositados no miRBase. Uma análise comparativa das características dos
miRNAs depositados no miRBase e dos miRNAs identificados neste trabalho, mostrou uma
alta correlação ao nível termodinâmico e estrutural, utilizando as seguintes características:
conteúdo de GC, conteúdo de AU, porcentagem de A, C, G e U, razão UA, razão GC, MFE,
MFEE, AMFE, MFEI, diversidade do conjunto termodinâmico e frequência do conjunto
termodinâmico. Os valores obtidos para cada característica do predito miRNA foram
demonstrados na tabela 11.
A distribuição dos valores de todas as características dos novos miRNAs identificados
foram incluídos nos gráficos obtidos a partir dos valores de conhecidos miRNAs depositados
no miRBase (Figuras 39 e Anexo 1). Em geral, a distribuição dos valores referentes às
características dos novos precursores de miRNA mostrou-se semelhante a distribuição dos
miRNAs conhecidos. A maioria foi encontrada entre o primeiro e terceiro quartil dos
gráficos, ou seja, próximo da mediana dos dados conhecidos. Por exemplo, o conteúdo de GC
dos precursores de miRNA preditos mostrou entre 35% e 55%, corroborando com os valores
encontrados em conhecidos miRNAs deste cluster. Além disso, a energia mínima livre destas
moléculas mostrou valores muito similares aos valores de miRNAs conhecidos. Valores
abaixo de -20 ou -25 kcal/mol tem sido considerados adequados para predição de estruturas
secundárias de miRNAs. Estes valores geram moléculas mais estáveis aumentando a
probabilidade de se predizer miRNAs reais. Os valores das estruturas secundárias referentes
aos novos miRNAs se mostraram bem estáveis, com valores entre -20 kcal/mol e -50
kcal/mol. A tabela 11 mostra todos os valores individuais. Como observado as características
do miRNAs identificados se mostraram bem semelhantes comparadas aos ortólogos,
confirmando a conservação do gene ao nível estrutural e termodinâmico e mantendo sua
provável função no organismo.
123
Cluster Protostômio-específico mir-71/2
A
B
Figura 39: Distribuição dos valores relacionados às características (A) Conteúdo de GC
e (B) MFE dos novos precursores de miRNAs. Os valores utilizados na confecção dos
gráficos foram baseados em precursores de miRNAs depositados no banco de dados
miRBase. Os nomes dos novos miRNA estão representados em cada gráfico do grupo de
miRNA correspondente. As caixas representam 50% dos dados analisados. A extremidade
mais baixa representa o primeiro quartil ou 25 % dos dados e a extremidade mais alta
124
Cluster Protostômio-específico mir-71/2
representa o terceiro quartil ou 75 % dos dados. A linha horizontal dentro da caixa representa
a mediana e os valores maiores que 1,5 vezes a mediana são os “outliers”.
V.3.5 Análise Filogenética e Comparativa dos novos miRNAs
Neste trabalho, foram realizadas análises filogenéticas dos membros do cluster mir71/2, mir-13 e mir-71, no intuito de observar e confirmar a distribuição evolutiva dos novos
miRNAs identificados e seus ortólogos. As análises foram realizadas utilizando tanto os
miRNAs conhecidos quanto os novos. Como matriz e modelo de distribuição filogenética
foram utilizados matriz Neighbor-joining e o modelo Kimmura-2-parâmetros. Empregando
este método, os miRNAs mir-13 se mostraram distribuídos em dois clados principais: mir13/mir-13b e mir-13a. Os novos miRNAs agruparam nos clados dos respectivos ortólogos
como mostra a Figura 40. Por exemplo, o novo miRNA isc-mir-13a, predito a partir do
genoma da espécie I. scapularis, agrupou juntamente com os conhecidos ortólogos miR-13a
de espécies de Artrópodes. Já os miRNAs api-mir-13b, phu-mir-13b e dpu-mir-13b
agruparam-se no outro clado mir-13/mir-13b juntamente com genes mir-13 e mir-13b
provenientes de espécies de Protostômios (Figura 40).
As análises comparativas dos novos genes preditos mir-13 foram realizadas utilizando
ClustalX 2.0, com parâmetros modificados, e RNAalifold para verificar a conservação da
estrutura secundária no alinhamento global (Figura 41). O alinhamento múltiplo de sequência
mostrou grande conservação dos miRNAs identificados com seus ortólogos principalmente
na região onde se encontra o miRNA maduro (Figura 41). A região seed do miRNA maduro
apresentou 100% de identidade comparando todos miRNAs. Esta característica conservativa
do miRNA maduro aponta uma importância essencial desta molécula para a atuação no
controle da expressão gênica, já que os alvos são dependentes do pareamento principalmente
da região seed do miRNA maduro.
125
Cluster Protostômio-específico mir-71/2
Figura 40: Distribuição evolutiva dos novos mir-13 no grupo Protostômios. As relações
filogenéticas foram referidas entre os novos precursores de mir-13 e seus homólogos. A
árvore filogenética foi gerada utilizando como método Neighbor-Joining, como modelo
Kimura-2-parâmetros e executada no programa MEGA 4.0. Os clados distintos apresentaram
os grupos mir-13a e mir-13/13b. Somente “bootstrap” acima de 30 foram considerados para
2000 réplicas analisadas.
126
Cluster Protostômio-específico mir-71/2
Figura 41: Conservação dos novos mir-13 no grupo Protostômios O alinhamento múltiplo
de sequência entre os precursores de mir-13 e seus respectivos ortólogos de Ecdysozoa e
Lophotrochozoa foram realizadas usando ClustalX 2.0 e RNAalifold. As formas maduras dos
miRNAs são mostradas nas caixas cinza.
A análise filogenética e comparativa dos novos precursores de miRNA, aga-mir-71,
phu-mir-71, sma-mir-71b e rho-mir-71 foram realizadas utilizando os mesmos programas e
parâmetros citados acima para os mir-13. A figura 42 mostra a conservação dos miRNAs
mir-71 incluindo os identificados neste trabalho. A região relacionada ao miRNA maduro se
mostrou altamente conservada apresentando no alinhamento global 100% de identidade na
região seed. A análise filogenética dos representantes desta família de miRNA mostrou os
preditos miRNAs phu-mir-71, rho-mir-71 e aga-mir-71 agrupados no clado Ecdysozoa
juntamente como os respectivos ortólogos. Corroborando com os resultados anteriores
(capitulo IV) o miRNA sma-mir-71b agrupou juntamente com o ortólogo sja-mir71b
formando um clado Platelminto específico.
127
Cluster Protostômio-específico mir-71/2
A
B
Figura 42: Conservação dos novos mir-71 no grupo Protostômios (a) As relações
filogenéticas foram referidas entre os novos mir-71 e seus ortólogos. A árvore filogenética foi
128
Cluster Protostômio-específico mir-71/2
gerada utilizando como método Neighbor-Joining, como modelo Kimura-2-parâmetros e
executada no programa MEGA 4.0. Os clados distintos apresentaram os grupos
Deuterostômios, Ecdysozoa e Lophotrochozoa. Somente “bootstraps” acima de 30 foram
considerados para 2000 replicas analisadas (b) O alinhamento múltiplo de sequência entre os
precursores de mir-71 e seus respectivos ortólogos de Ecdysozoans e Lophotrochozoans
foram realizadas usando ClustalX 2.0 e RNAalifold. As formas maduras dos miRNAs são
mostradas nas caixas cinza.
V.3.6 Conservação dos miRNAs maduros do cluster mir-71/2
As sequências dos novos miRNAs maduros, miR-2, miR-71 and miR-13,
identificadas neste trabalho, foram obtidas baseadas nas posições dos respectivos ortólogos
nas sequências precursoras. Além disso, as sequências maduros dos miRNAs ortólogos
referentes a cada família de miRNAs foram recuperadas, a fim de compará-las com o
conjunto de maduros identificados neste trabalho. As sequências dos miRNAs ,mir-13 e mir2, apresentaram alta similaridade ao nível de nucleotídeos justificando o agrupamento de
ambos na mesma família. No entanto, as sequências maduras e precursoras destes genes
apresentaram particularidades permitindo a separação destas sequências nas respectivas
subfamílias mir-2 e mir-13. A figura 43 e 44 mostra a distribuição dos nucleotídeos
provenientes dos conhecidos miRNAs maduros mir-2 e mir-13 obtidos do respectivo
precursor de miRNA. A representação Weblogo mostra a freqüência de cada nucleotídeo (U,
A, C ou G) para cada específica posição na sequência madura do miRNA. Os nucleotídeos
representados com letras maiores mostram uma maior contribuição para aquela determinada
posição na sequência madura. Por outro lado, tamanhos menores representam menor
contribuição na posição específica. A presença específica de um determinado nucleotídeo na
sequência madura do miRNA, principalmente entre os nucleotídeos 2 e 8, esta diretamente
relacionada com o conjunto de RNAs mensageiros almejados por aquela molécula mostrando
assim a importância da caracterização desta região.
129
Cluster Protostômio-específico mir-71/2
Figura 43: miRNAs maduros da família mir-2. Representação Weblogo das sequências
maduras dos miRNAs mir-2 e as sequências maduras dos novos miRNAs identificados. A
caixa cinza corresponde a região seed dos miRNAs maduros entre os nucleotídeos 2 e 8.
Figura 44: miRNAs maduros da família mir-13. Representação Weblogo das sequências
maduras dos miRNAs mir-13 e as sequências maduras dos novos miRNAs identificados. A
caixa cinza corresponde a região seed dos miRNAs maduros entre os nucleotídeos 2 e 8.
Os miRNAs maduros mir-2 mostraram como sequência consenso (no programa
weblogo), entre os nucleotídeos 2 e 8, a sequência “AUCACAG”. Esta região tem sido
considerada como uma das regiões principais para o pareamento e reconhecimento do gene
alvo (Grimson et al., 2007). Todos os miRNAs mir-2 identificados neste trabalho mostraram
esta sequência conservada exceto sma-miR-2f, sja-mir-2f e sma-mir-2a. Estes miRNAs
apresentaram G como o segundo nucleotídeo ao invés de A, ocasionando em uma possível
mudança no perfil de alvos e conseqüentemente no papel biológico desempenhado no
organismo.
130
Cluster Protostômio-específico mir-71/2
A comparação entre os Weblogos dos genes mir-2 e mir-13 mostrou diferentes
frequências dos nucleotídeos em cada posição específica do miRNA maduro (Figura 43 e 44).
A sequência consenso dos genes miR-13, entre as posições 1 e 8, mostrou uma contribuição
máxima dos nucleotídeos “UAUCACAG”. Corroborando com a região consenso dos mir-13
conhecidos, os novos miRNAs mir-13 apresentaram 100% de identidade em relação a estes
nucleotídeos nestas mesmas posições. O nucleotídeo com maior contribuição na posição 12,
em mir-2 e mir-13, apresentou diferença. No caso de sequências maduras de mir-2 o
nucleotídeo G apresentou maior contribuição, não sendo 100%. No entanto, a mesma posição
em mir-13 foi representada por uma maior contribuição do nucleotídeo U. Corroborando com
estas análises os novos miRNAs mir 13 apresentaram U na 12ª posição. No entanto, os novos
mir-2 apresentaram preferencialmente G nesta posição, principalmente os miRNAs
provenientes do clado Ecdysozoa (Figura 44).
Foram identificados neste trabalho quatro mir-71, sendo três provenientes de espécies
Ecdysozoans e um de Lophotrochozoans. A figura 45 mostra a distribuição dos nucleotídeos
na sequência madura dos miRNAs mir-71. A representação Weblogo destas sequências
mostrou uma contribuição majoritária de “GAAAGAC”, entre os nucleotídeos 2 e 8, e de G,
G e A nas posições 18, 20 e 21, respectivamente. Corroborando com estes dados as
sequências de miRNAs mir-71 identificadas, neste trabalho, apresentaram os mesmos
nucleotídeos nestas posições específicas mostrando um alto grau de conservação relativo a
sequências maduras destas moléculas.
Figura 45: miRNAs maduros da família mir-71. Representação Weblogo das sequências
maduras dos miRNAs mir-71 e as sequências maduras dos novos miRNAs identificados. A
caixa cinza corresponde a região seed dos miRNAs maduros entre os nucleotídeos 2 e 8.
Os resultados deste trabalho sugerem a presença do cluster de miRNA mir-71/2,
possivelmente controlado pelo mesmo promotor, apenas em espécies de Protostômios,
caracterizando-o como um cluster Protostômio-específico. A descoberta destes miRNAs,
131
Cluster Protostômio-específico mir-71/2
ausentes em mamíferos, pode trazer benefícios no diagnóstico e controle de doenças causadas
por espécies de Ecdysozoans e Lophotrochozoans. Estes resultados em sua totalidade estão
em fase de conclusão para envio para revista Journal of Molecular Evolution com o título
“Computational identification and evolution of microRNA gene cluster mir-71/2 in
Protostomes” (Anexo 2).
132
miRNAs: novos controladores da expressão gênica em S. mansoni?
Capítulo VI
miRNAs: novos controladores da expressão gênica
em S. mansoni?
133
miRNAs: novos controladores da expressão gênica em S. mansoni?
VI.1 Justificativa
Os miRNAs são reguladores pós-transcricionais que se ligam de forma complementar
a RNA mensageiros nas células, usualmente, resultando no silenciamento gênico por
repressão da tradução ou degradação dos alvos. A descoberta de novas formas de interação
entre os miRNAs e seus alvos tem aumentado a cada dia, sugerindo que estas conexões foram
instrumentos fundamentais para o aumento da complexidade dos organismos durante a
evolução (Berezikov, 2011). O número de alvos de miRNAs por genoma é desconhecido.
Tem sido sugerido que os genes silenciados por miRNAs ultrapassam 60% em humanos,
tamanha a importância destas moléculas para as células (Friedman et al., 2009). Programas de
predição de alvos de miRNAs tem usado várias estratégias baseadas em características
específicas das moléculas miRNA e mRNA ou do pareamento miRNA/mRNA. Exemplos
destas características são pareamento da região seed, termodinâmica do par miRNA/mRNA e
análise evolutiva da região 3’UTR do mRNA alvo (Lindow, 2011). No entanto, o ajuste dos
parâmetros e a escolha correta dos programas utilizados têm sido necessário para a obtenção
de resultados mais confiáveis (Watanabe et al., 2007).
Recentemente, diversos autores tem se dedicado à validação tanto das moléculas de
miRNAs quanto de seus prováveis alvos. A validação tem permitido uma elucidação melhor
dos processos em que os miRNAs e seus alvos participam na célula efetivamente. Por
exemplo, em células cancerígenas, tem sido mostrado importância do regulamento dos
miRNAs afetando a expressão de alguns alvos pró-oncogênicos (Farazi et al., 2011).
Avançando o estudo computacional de miRNAs a validação dos miRNAs tem sido utilizadas
utilizando Real Time, Northern Blot e sequenciamento. A técnica de Real Time tem sido
bastante utilizada para identificação de miRNAs em diversos organismos já que pequenas
quantidades de RNA são utilizadas para a medida de sua expressão. Exemplos de utilização
desta técnica tem sido mostrada em camundongos, humanos, S. japonicum e outros (Zhang et
al., 2009a; Cai et al., 2011; Chen et al., 2011).
Assim como em outras espécies, os miRNAs no genoma de S. mansoni
provavelmente desempenham papéis importantes e indispensáveis no desenvolvimento e
diferenciação do parasito. Com o objetivo de entender a função biológica dos miRNAs
identificados computacionalmente no genoma do parasito (capítulo IV) foi realizado a
validação dos miRNAs maduros identificados e de seus prováveis alvos. Os miRNAs
mostraram expressos em vários estágios de parasito, principalmente, em cercária e
esquistossômulos, evidenciando miRNAs estágios-específicos e gênero-específicos. A busca
134
miRNAs: novos controladores da expressão gênica em S. mansoni?
de alvos conservados visou aumentar a estringência da análise em detrimento do número
elevado de genes alvos, propiciando uma avaliação mais confiável do provável papel
biológico que determinado miRNA tem exercido nas células do parasito. A avaliação da coexpressão dos miRNA e seu provável alvo também foi realizada utilizando Real Time. Ficou
evidenciado uma provável correlação positiva da expressão dos miRNAs sma-mir-125a e
sma-mir124-3p e de seus genes alvos sinoviolina e inexina. Estes fatos permitem mensurar a
grande importância que os miRNAs exercem no organismo dirigindo ou bloqueando
processos essenciais na célula.
135
miRNAs: novos controladores da expressão gênica em S. mansoni?
VI.2 Materiais e Métodos
VI.2.1 Análise in silico
VI.2.1.1 Predição computacional dos alvos de miRNAs no genoma de S. mansoni
A predição computacional dos genes alvos no genoma do parasito foi realizada
utilizando o par de sequências miRNAs maduros, identificados neste trabalho (Capítulo IV),
e as 3`UTRs (Regiões da extremidade 3’ da fita de RNA mensageiro não traduzidas em
proteína) preditas referentes aos respectivos RNAs mensageiros alvos de S. mansoni.
VI.2.1.2 3’UTR dos mRNAs
A recuperação das sequências 3’UTRs dos RNAs mensageiros de S. mansoni foi
realizada utilizando informações posicionais do códon de parada do mRNA e da região não
traduzida da molécula de RNA. Estas informações foram extraídas do arquivo de texto de
anotação do genoma, GFF e GFF3, depositado no banco de dados GeneDB
(www.genedb.org). As sequências de 3’UTRs encontradas na fita negativa do DNA foram
invertidas, a fim de se obter a fita correspondente ao pareamento correto com o miRNA
maduro. Esta etapa foi realizada utilizando a ferramenta EMBOSS “seqret”. Esta ferramenta
foi aplicada em linha de comando na plataforma Linux após a instalação do pacote EMBOSS.
As sequências foram separadas em um banco de dados de 3’UTRs em formato multi-fasta
para posterior análise.
VI.2.1.3 mRNAs alvos
Para identificação dos RNAm alvos no genoma de S. mansoni o programa miRANDA
foi utilizado com condições e parâmetros ajustados. Estes parâmetros foram ajustados
baseados em identificações de alvos de miRNAs em diversas espécies como seres humanos e
peixe zebra (John et al., 2004; Chen et al., 2005). Os valores referentes aos parâmetros foram:
penalidade de abertura de espaço (“gap opening penalty”) −8, penalidade sobre expansão de
espaço (“gap extension penalty”) −2, pontuação mínima aceitável entre o par miRNA maduro
e 3`UTR 120, energia livre máxima entre o par miRNA maduro e 3’UTR −15 kcal/mol,
escala utilizada para medida da pontuação de complementaridade entre o par miRNA e
136
miRNAs: novos controladores da expressão gênica em S. mansoni?
3`UTR 3 e contagem a partir de 5′ final com demanda estrita na região semente do miRNA
maduro (“seed region”) com 100% de pareamento entre o par (entre nucleotídeos 2 e 9).
Estes parâmetros foram aplicados todos em linha de comando na plataforma Linux após a
instalação do programa miRANDA na mesma plataforma. Os resultados positivos foram
recuperados do arquivo final utilizando um script escrito em Perl.
VI.2.1.4 Caracterização e Categorização dos RNAm alvos
Os termos de ontologia gênica (“Gene Ontology Terms”) para as proteínas preditas
foram obtidos a partir do banco de dados de S. mansoni (GeneDB). Os termos referentes aos
alvos foram separados e utilizados para a categorização. Utilizou-se para esta categorização
apenas os alvos com um delta G inferior a -20 kcal/mol quando comprados com seus
respectivos miRNAs e contendo 100% de complementaridade na região seed do miRNA. O
método de classificação de ontologia gênica utilizado foi a ferramenta “GO CateGOrizer”
disponível no site (http://www.animalgenome.org/bioinfo/tools/countgo/). Esta ferramenta
utiliza como método “GO Slim” para agrupar e contar as diferentes Classes de ontologia
gênica (“GO Class”) dos alvos preditos.
Os dados das proteínas preditas de S. mansoni relacionados a importantes informações
funcionais foram obtidas na Enciclopédia Kyoto de Genes e Genomas (Kyoto Encyclopedia
of Genes and Genomes – KEGG).
VI.2.1.5 Predição de 3'UTR alvo homólogas
Os alvos identificados em S. mansoni foram utilizados para busca de alvos homólogos
em S. japonicum. Os alvos dos miRNAs conservados buscados em S. japonicum foram
aqueles relacionados aos miRNAs intergênicos sma-mir-124-3p, sma-mir-8-3p, sma-mir-363p, sma-mir-61 e sma-mir-125a e os miRNAs intrônicos sma-mir-190 e sma-mir-3479-3p.
Inicialmente, foi realizada uma busca por regiões similares no genoma de S. japonicum
utilizando como sequência query a região 3`UTRs obtidas anteriormente para identificação
dos mRNAs alvos em S. mansoni. Estas sequências 3`UTRs, com sinal positivo para alvo de
miRNAs em S. mansoni, foram comparadas utilizando a ferramenta megablastn com os
seguintes parâmetros modificados: -W 10 (“Word size” – tamanho da palavra buscada), –r 5
(“Match score” – Pontuação pelo pareamento correto), –q -4 (“Mismatch score” – pontuação
pelo pareamento incorreto), –G 8 (“Gap Penalty” – penalidade por espaços na sequência
137
miRNAs: novos controladores da expressão gênica em S. mansoni?
alinhada) e -E 6 (“Gap Penalty” – penalidade por extensão dos espaços na sequência
alinhada). Estes parâmetros foram utilizados a fim de se obter um alinhamento local próximo
do requerido para sequências homólogas. Para confirmar o alinhamento local realizado, as
sequências genômicas de S. japonicum referentes a cada 3`UTR foram recuperadas do banco
de dados do parasito. Estas sequências foram utilizadas para comparação com as prováveis
proteínas preditas próximas, a jusante ou a montante da sequência, dependendo de sua
orientação na fita de DNA, a fim de se verificar a veracidade da predição da posição da
região 3`UTR homóloga. A busca pela provável proteína homóloga em S. japonicum,
relacionada com a 3`UTR positiva no teste anterior, foi realizada utilizando como query a
proteína predita homóloga de S. mansoni correspondente. A sequência de aminoácido desta
proteína foi comparada utilizando blastp com o banco de dados de proteínas preditas de S.
japonicum. As proteínas homólogas de S. japonicum foram recuperadas, assim como suas
respectivas posições, e comparadas com as posições das 3`UTRs positivas identificadas no
genoma de S. japonicum. Considerou-se apenas as 3`UTRs que possuíam a mesma sequência,
ou seja, 100% de identidade em relação a região de pareamento do miRNA correspondente e
complementar a região seed do miRNA. Estas regiões foram então separadas em um arquivo
de dados fasta para posterior comparação e identificação dos alvos utilizando os miRNAs
homólogos. Os critérios para busca de alvos utilizando 3`UTRs homólogas e miRNAs
homólogos de S. japonicum foram as mesmas utilizadas para a busca de alvos em S. mansoni,
utilizando o programa miRANDA com parâmetros ajustados, exceto a energia livre de
pareamento que foi alterada para -18 kcal/mol.
VI.2.2 Análise in vitro
VI.2.2.1 Obtenção dos Parasitos
Neste trabalho, inicialmente os parasitos, cercária e vermes adultos foram obtidos no
Institute of Molecular Medicine, Trinity College Health Sciences Centre, St. James Hospital
(Dr. Padraig Fallon). Para realização das análises foram utilizados parasitos da espécie S.
mansoni linhagem LE, em diferentes etapas do ciclo provenientes do Moluscário do
CPqRR/FIOCRUZ (Centro de Pesquisa René Rachou, Fundação Oswaldo Cruz)(Dr. Liana K.
Jannotti-Passos) em Belo Horizonte/MG.
Os vermes adultos foram obtidos a partir da perfusão do sistema porta-hepático de
camundongos da linhagem Swiss Webster infectados com aproximadamente 100 cercárias
138
miRNAs: novos controladores da expressão gênica em S. mansoni?
por via subcutânea após 50 dias, conforme descrito por Smithers e Terry (1965) (Smithers
and Terry, 1965). Após a coleta, os vermes adultos foram separados em meio RPMI com
auxílio de pincéis estéreis e posteriormente armazenados em tubo eppendorfs de 1,5 ml a 80ºC até utilização.
As cercárias foram obtidas após 27 a 31 dias de infecção do hospedeiro intermediário
Biomphalaria glabrata com miracídeos. Posteriormente a cercária, foi separada do
sobrenadante e das impurezas contidas no meio e armazenada em tubos de 1,5 ml a -80ºC
para posterior utilização.
Os esquistossômulos mecanicamente transformados foram obtidos através da forma
larval cercária. Inicialmente as cercárias frescas, após banho de gelo (2 horas) e separação das
impurezas, foram transferidas para tubos falcons de 15 mL, com aproximadamente 200.000
cercárias por tubo, contendo 5 mL de RPMI 1640 (INVITROGEN). Após a separação
mecânica entre a cauda e o corpo cercariano foi adicionado RPMI suplementado com 10% de
penicilina / estreptomicina100 mg/mL, e incubado em estufa de CO2 5% a 37C por 3 horas e
meia (Harrop and Wilson, 1993). O cultivo dos esquistossômulos foi realizado em meio 169
suplementado com 10% de soro fetal bovino (Gibco) e 1% penicilina / estreptomicina100
mg/mL por poço. Os vermes foram cultivados durante 3,5 e 24 horas.
VI.2.2.2 Extração de RNA total
VI.2.2.2.1 miRNAs
Aproximadamente 50 mg de vermes adultos machos e fêmeas, cercárias e
esquistossômulos recém-transformados 3,5 e 24 horas foram utilizados para extração de RNA
total enriquecido com pequenos RNAs utilizando o kit miRNeasy (Qiagen) seguindo o
protocolo do fabricante.
Brevemente, as amostras biológicas foram homogeneizadas em 700 μl QIAzol Lysis
Reagent com auxílio de um homogeneizador tipo politron. Posteriormente, o homogeneizado
foi transferido para tubos eppendorf de 1,5 mL e incubado por cinco minutos à temperatura
ambiente para permitir a completa dissociação dos complexos de nucleoproteínas. A seguir
foram adicionados 140 μl de clorofórmio (Sigma - St. Louis, MO, USA) para cada amostra.
A mistura foi homogeneizada vigorosamente com auxílio de um vórtex. Em seguida, as
amostras foram centrifugadas por 12 minutos a 12.000g a 4ºC. A fase aquosa foi transferida
139
miRNAs: novos controladores da expressão gênica em S. mansoni?
para um novo tubo seguido da adição de 1,5 vezes o volume equivalente de etanol 100% e
homogeneizado suavemente por inversão o tubo, por três vezes, para a precipitação do RNA.
A seguir o RNA total foi purificado conforme instrução do boletim técnico do fabricante. A
padronização da metodologia foi avaliada em gel de agarose/formaldeído 1,2%. A pureza e
quantificação dos RNAs foram determinadas utilizando o aparelho NanoDrop (GE) avaliando
as relações entre os comprimentos de onda 260/280 e 260/230 indicativos de pureza das
amostras.
VI.2.2.2.2 Alvos
Cerca de 100 mg de verme adulto casal e cercária foram utilizados para extração de
RNA total utilizando o kit RNA total (SV total RNA Isolation System - PromegaTM) seguindo
o protocolo do fabricante.
A amostra biológica foi homogeneizada em 1 mL de TRIzol® Reagent (InvitrogenTM)
com auxílio de um homogeneizador tipo politron. Posteriormente, o homogeneizado foi
transferido para tubos eppendorf de 1,5 mL e incubado por cinco minutos à temperatura
ambiente para permitir a completa dissociação dos complexos de nucleoproteínas. A seguir
foram adicionados 0,2 mL de clorofórmio (Sigma - St. Louis, MO, USA) para cada 1,0 mL
de TRIzol. A mistura foi homogeneizada vigorosamente com auxílio de um vórtex. Em
seguida, as amostras foram centrifugadas por 10 minutos a 12.000g a 4ºC. A fase aquosa foi
transferida para um novo tubo seguido da adição de volume equivalente de etanol 95% v/v
(preparado com água livre de RNAses) e homogeneizado suavemente por inversão o tubo,
por três vezes, para a precipitação do RNA. A seguir o RNA total foi purificado com o kit
SVRNA System conforme instrução do boletim técnico do fabricante. A padronização da
metodologia foi avaliada em gel de agarose/formaldeído, como mostra a Figura 46. A pureza
e quantificação dos RNAs foram determinadas utilizando o aparelho NanoDrop (GE)
avaliando as relações entre os comprimentos de onda 260/280 e 260/230 indicativos de
pureza do amostra.
140
miRNAs: novos controladores da expressão gênica em S. mansoni?
Figura 46: RNA total obtido a partir de formas evolutivas do S. mansoni. O RNA total
foi obtido utilizando o kit SV40 a partir de verme adulto (1) e cercária (2)
VI.2.2.3 Obtenção da primeira fita de DNA (cDNA)
VI.2.2.3.1 miRNAs
A primeira fita do cDNA foi sintetizada utilizando 1µg de RNA total extraído e o Kit
miScript Reverse Transcription (Qiagen), seguindo as recomendações dadas pelo fabricante.
Brevemente, para cada 1µg de RNA total enriquecido com pequenos RNAs, foram
utilizados 4 μL miScript RT Buffer 5x, 1μL de transcriptase reversa (miScript Reverse
Transcriptase Mix) e água livre de RNAse para um volume final de 20 μL. A mistura foi
incubada a 35°C por 60 minutos, seguidos de 5 minutos a 95°C, com auxílio de um
termociclador (Biocycler, version 3.2). As amostras foram estocadas a -20°C até o momento
do uso.
VI.2.2.3.2 Alvos
A primeira fita do cDNA foi sintetizada utilizando 1µg de RNA total extraído e o Kit
High Capacity RT-PCR System (Applied Biosystems), seguindo as recomendações dadas
pelo fabricante.
Para cada 1µg de RNA total, foram utilizados 2 μL de iniciadores randômicos (10x
RT Random primer), 0,8 μL de dNTPs [25x dNTP Mix (100mM)], 1μL de transcriptase
reversa (Multi Scribeä Reverse Transcriptase) e água livre de RNAse para um volume final
de 10 μL. A mistura foi incubada a 25°C por 10 minutos, seguidos de 120 minutos a 37°C e
85° por 5 minutos, com auxílio de um termociclador (Biocycler, version 3.2). A amostra ficou
estocada a -20°C até o momento do uso.
VI.2.2.4 Oligonucleotídeos iniciadores
141
miRNAs: novos controladores da expressão gênica em S. mansoni?
VI.2.2.4.1 miRNAs
Os oligonucleotídeos iniciadores específicos para os miRNAs em estudo foram
baseados nas sequências maduras dos miRNAs identificados neste trabalho (Tabela 12). Estes
primers foram utilizados para posterior PCR em tempo real.
Tabela 12: Número de acesso das sequências e oligonucleotídeos iniciadores referentes
aos miRNAs avaliados.
miRNAs maduros
Tamanho (nt)
Sequência Madura - Primer (5`a 3`)
21
TAAGGCACGCGGTGAATGTCA
sma-mir-124-3p
22
TCCCTGAGACCCTTTGATTGCC
sma-mir-125a
23
TGATATGTATGGGTTACTTGGTG
sma-mir-190-5p
22
TATTGCACTAACCTTCGCCTTG
sma-mir-3479-3p
23
CCACCGGGTAGACATTCATTCGC
sma-mir-36-3p
22
TGACTAGAAAGTGCACTCACTT
sma-mir-61
23
TAATACTGTTAGGTAAAGATGCC
sma-mir-8-3p
22
TTATTTCCAAAACCTTGACGGA
sma-mir-new_10-5p
20
ACGATACAGAGAAGATTAGC
sma-u6
VI.2.2.4.2 Alvos
Os oligonucleotídeos iniciadores específicos para os genes em estudo, foram baseados
nas
sequências
de
mRNA
depositadas
no
banco
de
dados
GeneDB
(http://www.genedb.org/Homepage/Smansoni) e idealizados pelo programa Gene Runner
(Version 3.05), conforme a Tabela 13. Para evitar a amplificação de DNA genômico, o par de
primers de cada gene foi desenhado entre regiões intrônicas. A tabela 2 mostra os primers
com suas respectivas sequências de nucleotídeos.
Tabela 13: Número de acesso das sequências e oligonucleotídeos iniciadores referentes
aos alvos de miRNAs.
Gene
Tamanho (nt)
Sequência - Primer (5`a 3`)
Smp_177060
132
F CTTGGTTATCAGTGTGTGGAGC
132
R GAGCTTCTGCGACTACTACTGC
142
F TTGGGATCGTACATAAATGC
142
R AAACCAGTGAGACCCATTG
87
F GCAGGATACACAGCAAACTC
87
R TGGTTCTGGGTTCACATC
Smp_066900
Alfa-tubulina
142
miRNAs: novos controladores da expressão gênica em S. mansoni?
VI.2.2.5 qRT-PCR
VI.2.2.5.1 miRNA
Para análise da expressão dos miRNAs em estudo foi utilizada a técnica de PCR em
tempo real. As reações foram realizadas pelo kit SYBR Green detection (miScript Primer
Assay – Qiagen) em placas de 96 poços (MicroAmp® Optical 96 Well Reaction Plate –
Applied Biosystems) e seladas com adesivo óptico (MicroAmp® Optical Adhesive Film –
Applied Biosystems) ao final do procedimento. Foram pipetados 2 μL dos iniciadores (na
concentração de 2,5 μM) em triplicata, 2 μL de cDNA diluído 10 vezes, 1 μL de 10x miScript
Universal Primer e 5 μL de 2x QuantiTect SYBR Green PCR Master Mix, totalizando um
volume de reação em cada poço de 10 μL. Os ensaios foram realizados em triplicata
biológica para todos os miRNAs avaliados, com o controle endógeno presente em todas as
placas (u6). Os valores de baseline (ciclos iniciais em que há pequenas alterações na
fluorescência) foram ajustados para 3-15 ciclos. O threshold, desvio padrão médio do repórter
normalizado (Rn) para os ciclos iniciais da PCR multiplicado por um fator ajustável, foi
ajustado à região associada ao crescimento exponencial do produto da PCR e, portanto,
fixado em 0,02 para todas as amostras, uma vez que se comparou o mesmo miRNA em
diferentes estágios. O Rn refere-se à relação entre a intensidade de fluorescência emitida pelo
corante repórter pela intensidade de fluorescência emitida pelo corante da referência passiva
(ROX).
As análises foram feitas pelo método de quantificação relativa da expressão gênica
(ΔCT), que permite quantificar diferenças no nível de expressão de um alvo específico entre
as diferentes amostras. Os níveis dos miRNAs alvos foram normalizados pelos níveis do
controle endógeno. Os resultados foram alcançados por uma fórmula aritmética que considera
a quantidade do alvo, normalizado (2-∆CT). A reação de qRT-PCR foi conduzida conforme
seguinte programação: 15 min a 95 °C, seguido por 40 ciclos de 94 °C por 15 s, 55 °C por 30
s e 70 °C por 30 s.
VI.2.2.5.2 Alvos
Para análise da expressão dos genes em estudo foi utilizada a técnica de PCR em
tempo real. As reações foram realizadas pelo kit SYBR® Green PCR Master Mix (Applied
Biosystems) em placas de 96 poços (MicroAmp® Optical 96 Well Reaction Plate – Applied
143
miRNAs: novos controladores da expressão gênica em S. mansoni?
Biosystems) e seladas com adesivo óptico (MicroAmpä Optical Adhesive Film – Applied
Biosystems) ao final do procedimento. Foram pipetados 3 μL dos iniciadores (na
concentração de 2,5 μM) em triplicata e 7 μL de um mix de reação contendo 2 μL de cDNA
diluído 5 vezes (com água livre de DNAse) e 5 μL de SYBR ® Green Master Mix, totalizando
um volume de reação em cada poço de 10 μL. Os ensaios foram realizados em triplicata
biológica para todos os genes avaliados, com o controle endógeno presente em todas as
placas. Os valores de baseline (ciclos iniciais em que há pequenas alterações na
fluorescência) foram ajustados para 3-15 ciclos. O threshold, desvio padrão médio do
repórter normalizado (Rn) para os ciclos iniciais da PCR multiplicado por um fator ajustável,
foi ajustado à região associada ao crescimento exponencial do produto da PCR e, portanto,
fixado em 0,2 para todas as amostras, uma vez que se comparou o mesmo gene em diferentes
grupos. O Rn refere-se à relação entre a intensidade de fluorescência emitida pelo corante
repórter pela intensidade de fluorescência emitida pelo corante da referência passiva (ROX).
As análises foram feitas pelo método de quantificação relativa da expressão gênica
(ΔCT), que permite quantificar diferenças no nível de expressão de um alvo específico entre
as diferentes amostras. Os níveis dos genes alvos foram normalizados pelos níveis do
controle endógeno. Os resultados foram alcançados por uma fórmula aritmética que considera
a quantidade do alvo, normalizado (2-∆CT).
A reação de qRT-PCR foi conduzida conforme programação contida no aparelho ABI
7300 Applied Biosystems.
VI.2.2.5.2.1 Curva de eficiência dos iniciadores
Para determinar as eficiências relativas da amplificação dos alvos e do controle
endógeno foram construídas curvas padrões para cada amplicon a partir de uma mesma
amostra (Figura 47 e 48). O ensaio foi realizado em triplicata e a concentração dos
iniciadores foi de 2,5 μM.
A curva padrão foi representada por um gráfico de regressão linear semi-log do valor
de CT (eixo Y) em comparação ao log da quantidade inicial do ácido nucléico (eixo X). Foi
utilizado o cDNA de cercária em cinco diluições seriadas de quatro vezes.
O slope da curva padrão foi usado para estimar a eficiência de amplificação. Uma
reação 100% eficiente produzirá um aumento de dez vezes no amplicon da PCR a cada 3,32
ciclos durante a fase exponencial de amplificação (log2 10 = 3, 3219), ou seja, o amplicon
dobra em quantidade durante a fase geométrica. O cálculo da estimativa da eficiência (E) foi
144
miRNAs: novos controladores da expressão gênica em S. mansoni?
calculado pela fórmula: E= (10-1/slope – 1) x 100. Os iniciadores foram considerados
apropriados para avaliar a expressão gênica pelo sistema SYBR® Green quando apresentaram
eficiência de reação acima de 80% e abaixo de 120%. Os valores de baseline foram ajustados
para 3-15 ciclos e o threshold fixado em 0,1 para todas as amostras.
Figura 47: Plot de amplificação referente à curva de eficiência do gene α tubulina. Em X
está demonstrado o valor dos ciclos de PCR e em Y os valor de ∆Rn. Foi utilizado cDNA de
cercária e uma diluição seriada de 4 vezes.
Figura 48: Curva padrão referente ao gene α tubulina. Em X estão demonstrados os
valores de Log da concentração de cDNA e em Y os valores de CT correspondes a cada
diluição. Os valores de slope e de coeficiente de linearidade estão representados a direita do
gráfico. Foi utilizado cDNA de cercária e uma diluição seriada de 4 vezes.
VI.2.2.5.2.2 Curva de dissociação dos amplicons
Foi realizada a análise da curva de dissociação dos amplicons para identificar a
formação de produtos inespecíficos no final de cada corrida, possivelmente gerados a partir
de excesso de iniciadores ou falha no desenho dos mesmos.
145
miRNAs: novos controladores da expressão gênica em S. mansoni?
Ao final dos 40 ciclos da qRT-PCR, a temperatura foi elevada gradualmente de 60 à
95ºC, mantendo-se por 15 segundos em cada grau Celsius. Na medida em que os amplicons
desnaturaram, o sinal fluorescente emitido pelo SYBR® Green foi reduzido e a temperatura
em que metade do produto da PCR estava dissociada medida. O gráfico resultante permitiu
verificar se houve um ou mais produtos de PCR presentes em cada reação devido a diferenças
de temperatura de melting (Tm), específicas e dependentes do tamanho do fragmento e do
conteúdo de GC (%GC). O Tm desejado foi acima de 80°C.
VI.2.2.6 Análise estatística
A expressão relativa dos microRNAs e seus alvos nos diversos estágios analisados foi
comparada pela análise da variância (ANOVA) por ONE-WAY (Teste de Tukey) e o teste T
de Student, quando adequado. Foi considerado estatisticamente significante amostras com p <
0,05. A análise estatística foi realizada pelo programa PRISMA (GraphPad Prism 5).
146
miRNAs: novos controladores da expressão gênica em S. mansoni?
VI.3 Resultados e Discussão
VI.3.1 Predição dos alvos de miRNAs
Utilizando o banco de dados de S. mansoni foi possível a recuperação das regiões
3’UTRs a partir dos genes preditos depositados no GeneDB. Até o momento apenas 6261
genes apresentam 3 UTRs mapeadas nos arquivos de genoma de S. mansoni. A subestimação
do número de genes com 3`UTRs preditas se deve ao fato de nem todos possuírem anotação
nas bases de dados do genoma (GeneDB) presentes nos arquivos GFF ou GFF3. Utilizando a
ferramenta de predição de alvos de miRNAs miRANDA foi possível a predição 389 alvos
dentro dos 6261 genes analisados. Os parâmetros foram ajustados para manter 100% de
complementaridade entre a região seed (2-8 nt) do miRNA maduro (extremidade 5`) e a parte
da 3`UTR do gene alvo aumentando a especificidade da predição. Os mesmos parâmetros
utilizados pelo programa miRANDA foram estabelecidos em humanos e peixe zebra (John et
al., 2004; Chen et al., 2005). A tabela 14 mostra os miRNAs preditos de S. mansoni e seus
prováveis alvos no genoma do parasito. Dos 67 miRNAs maduros preditos no genoma de S.
mansoni, 50 apresentaram pelo menos um provável gene alvo no banco de 3’UTRs do
parasito (Tabela 14). Alguns miRNAs não apresentaram genes alvos preditos no genoma
devido à estringência utilizada neste trabalho, com parâmetros de score mínimo 80 e delta G
máximo de -20 kcal/mol. Assim, o método de predição do alvo visou descartar os falso
positivos no conjunto total. O maior número de alvos preditos, 200 no total, foi identificado
para o conjunto de miRNAs presentes nos 2 clusteres encontrados no parasito, sma-mir-71/2
e sma-mir-71b/2 (12 diferentes formas maduras de miRNAs). Isto representa mais do que
50% de todos os alvos identificados nesta análise. O número grande de alvos destes miRNAs
sugere uma participação importante destes genes na regulação da expressão gênica no
parasito. Outros organismos também tem mostrado números relevantes de genes preditos
regulados por miRNAs da família mir-71 e mir-2 como C. elegans e D. melanogaster. Os
programas
de
predição
TargetScanWorm
(http://www.targetscan.org/worm_12/)
e
TargetScanFly (http://www.targetscan.org/fly/) mostram esta tendência elevada em relação
ao número de alvos preditos para mir-2 e mir-71. Em C. elegans a predição de alvos para os
miRNAs cel-mir-71 e cel-mir-2 tem gerado mais de 500 predições, enquanto em D.
melanogaster para os genes dme-mir-2 quase 300 alvos foram preditos. A critério de
comparação, no caso do gene miRNA let-7 os programas TargetScanWorm e TargetScanFly
tem predito 65 e 38 alvos, respectivamente. Em S. mansoni o gene ortólogo sma-mir-let-7
147
miRNAs: novos controladores da expressão gênica em S. mansoni?
teve como alvos preditos apenas 9 mRNAs (Tabela 14). Isto enfatiza a importância destes
miRNAs não apenas no controle da regulação gênica no parasito S. mansoni, mas em outros
organismos em geral. Entre os 67 miRNAs identificados, o miRNA sma-mir-71 obteve o
maior número de alvos preditos isoladamente (Tabela 14). Para este miRNA foram preditos
42 genes alvos (Tabela 14).
Algumas sequências de 3`UTRs apresentaram mais de um sítio de ligação para
diferentes miRNAs, como por exemplo a região 3`UTR do gene Smp_184330 (“hypothetical
gene”) identificada como alvo dos miRNAs, sma-mir-71b-3p e sma-mir-31-5p. Por outro
lado, alguns miRNAs apresentaram vários sítios dentro da mesma 3`UTR como por exemplo,
o miRNA sma-mir-2b-5p que apresentou 2 sítios na 3`UTR do gene Smp_110400.3. Tem
sido mostrado que a mesma região 3`UTR pode ter mais de um sítio de miRNAs
(TargetScan). A predição de mais de um sítio de complementaridade do miRNA na região
3`UTR tem sido considerado um indício positivo para e efetiva atuação do miRNA em seu
gene alvo (Lewis et al., 2005).
Entre os genes de miRNAs duplicados, sma-mir-71 e sma-mir-71b foram observados
repertórios de alvos similares, sendo 22 alvos iguais e 20 diferentes (Tabela 14) (de Souza
Gomes et al., 2011). Estes dados consistem com a alta similaridade entre as duas sequências
maduras dos miRNAs principalmente na região seed. No entanto, não apenas a região seed do
miRNA maduro influencia na interação entre as moléculas miRNA/mRNA, mas também os
nucleotídeos vizinhos, gerando um dupléx estável ou instável. Alguns alvos se mostraram
específicos de sma-mir-71 e outros de sma-mir-71b. Vale ressaltar que os alvos do miRNA
alocado no cromossomo W, sma-mir-71, são regulados apenas em fêmeas sugerindo uma
provável função fêmea específica. Dentre os genes alvos de sma-mir-71 preditos neste
trabalho, 5 destacam-se apresentando alta homologia com HSP40 DNAj de H. sapiens
(Smp_078800, Smp_049600.1, Smp_049600.2, Smp_049600.3 e Smp_049600.4). Trabalhos
anteriores têm mostrado que o gene DNAj está associado com receptores esteroidais
responsáveis por promover mudanças em sua conformação em sinal a presença de hormônio
esteróide. Em mamíferos (específicamente camundongos fêmeas) a deleção desta proteína
DNAj (DjA -/-) promove o crescimento e fertilidade normal do organismo. Por outro lado,
machos de camundongo, com esta mesma deleção, sofrem severos defeitos na
espermatogênese e são inteiramente inférteis (Cintron and Toft, 2006).
O miRNA sma-mir-71 provavelmente atua em vermes fêmeas reprimindo sua
maturação sexual. As fêmeas de S. mansoni são imaturas e requerem a presença do verme
macho para adquirir maturidade sexual. As fêmeas sem contato com vermes machos serão
148
miRNAs: novos controladores da expressão gênica em S. mansoni?
sexualmente imaturas não atingindo a maturidade sexual (Erasmus, 1973). O miRNA smamir-71 tem como prováveis alvos os genes homólogos de DNAj, podendo assim, ter sua
possível função relacionada com a repressão gênica em momentos de não contato da fêmea
com o macho, apresentando um impacto significante na maturação sexual de fêmeas de S.
mansoni
149
miRNAs: novos controladores da expressão gênica em S. mansoni?
Tabela 14: Número de prováveis RNA mensageiros alvos dos miRNAs maduros identificados no genoma de S. mansoni.
miRNA
sma-bantam
sma-let-7
sma-mir-10-3p
sma-mir-10-5p
sma-mir-124-3p
sma-mir-124-5p
sma-mir-125a
sma-mir-190-3p
sma-mir-190-5p
sma-mir-212
sma-mir-2162-3p
sma-mir-250
sma-mir-281
sma-mir-2a-3p
sma-mir-2a-5p
sma-mir-2b-3p
sma-mir-2b-5p
sma-mir-2c-3p
sma-mir-2c-5p
sma-mir-2d-3p
sma-mir-2e-3p
sma-mir-2e-5p
sma-mir-3011
sma-mir-31-5p
sma-mir-3479-3p
sma-mir-3492
Região “Seed” (2-8nt)
GAGAUCG
GAGGUAG
AAUUCGA
ACCCUGU
AAGGCAC
CAUUUUC
CCCUGAG
AGUGACC
GAUAUGU
AACAGUC
AUUAUGC
CUUCAGU
GUCAUGG
CACAGCC
AGUCAAU
AUCACAG
GUCUCAA
AUCACAG
CCCUUGU
AUCACAG
AUCACAG
ACCAACU
UGAUUUU
GGCAAGA
AUUGCAC
UCCGUGC
No de alvos
4
9
0
4
16
6
5
2
10
6
0
1
1
22
10
29
6
21
5
24
16
3
2
15
0
6
sma-mir-36-3p
sma-mir-61
sma-mir-71
sma-mir-71b-3p
sma-mir-71b-5p
sma-mir-8-3p
sma-mir-8-5p
CACCGGG
GACUAGA
GAAAGAC
CUCAUAC
GAAAGAC
AAUACUG
AUCUUAC
7
4
42
1
22
2
2
Alvo mais provável – miRanda*
Ribonucleoprotein (hnrnp), putative (Smp_179270.2)
Lar interacting protein (lip)-related protein (Smp_149910)
N/A
Hypothetical protein (Smp_177580)
Ferritin, putative (Smp_047660)
Dihydropyridine-sensitive l-type calcium channel, putative (Smp_124530)
Expressed protein (Smp_114220)
Expressed protein (Smp_062620.1)
Multiple pdz domain protein, putative (Smp_154490)
Expressed protein (Smp_084620)
N/A
Ap endonuclease, putative (Smp_167500)
TGF-beta signal transducer Smad2, putative (Smp_085910)
Serine palmitoyltransferase 1 (Smp_028080)
Expressed protein (Smp_080370.1)
Tropomyosin, putative (Smp_031770.15)
Expressed protein (Smp_041050.2)
Kinase (Smp_086690)
Camp-regulated phosphoprotein, putative (Smp_090150.1)
Cytoplasmic dynein light chain, putative (Smp_051400)
Expressed protein (Smp_127690)
Expressed protein (Smp_006840)
Camp-regulated phosphoprotein, putative (Smp_090150.1)
Hypothetical protein (Smp_110270)
N/A
Chmp1 (chromatin modifying protein) (charged multivesicular body protein), putative
(Smp_055880.1)
Topbp1, putative (Smp_133990.1)
Transducin-like enhancer protein 1 (Smp_150080)
Multidrug resistance protein 1, 2, 3 (p glycoprotein 1, 2, 3), putative (Smp_137080)
Hypothetical protein (Smp_184330)
Expressed protein (Smp_006840)
Snare protein ykt6, putative (Smp_047450)
Oxysterol binding protein 9, putative (Smp_174070)
150
miRNAs: novos controladores da expressão gênica em S. mansoni?
sma-mir-92ª
sma-mir-9c
sma-mir-new_1-3p
sma-mir-new_1-5p
sma-mir-new_2-3p
sma-mir-new_2-5p
sma-mir-new_3-3p
sma-mir-new_3-5p
sma-mir-new_4-3p
sma-mir-new_4-5p
sma-mir-new_5-3p
sma-mir-new_5-5p
sma-mir-new_6-3p
sma-mir-new_6-5p
sma-mir-new_7-3p
sma-mir-new_7-5p
sma-mir-new_8-3p
sma-mir-new_8-5p
sma-mir-new_9-3p
sma-mir-new_9-5p
sma-mir-new_10-3p
sma-mir-new_10-5p
sma-mir-new_11-3p
sma-mir-new_11-5p
sma-mir-new_12-3p
sma-mir-new_12-5p
sma-mir-new_13-3p
sma-mir-new_13-5p
sma-mir-new_14-3p
sma-mir-new_14-5p
sma-mir-new_15-3p
sma-mir-new_15-5p
sma-mir-new_16-3p
sma-mir-new_16-5p
AUUGCAC
CUUUGGU
AAGCUUC
UAAGCUG
GUGUUUC
GGAAAAC
AUUUUCU
UAUUUCA
CGCUUUA
GCAGGUA
UAAUUUC
CCAAAGU
CAAUCUC
UCAGUAU
AGCUUAG
AGAGUUU
CAUACUG
AACAUAA
ACAGCAG
GGGAAAC
AUUCGUC
UAUUUCC
AUUCAUC
GAAACAG
UUGUUAU
UCACAGC
UUUCUAU
GCUAGAC
AAAACUU
UCAUUGU
UCCAGGU
GUUAAAC
UUACAAG
GAACGUU
0
0
1
0
0
4
1
0
0
2
0
4
3
16
3
8
7
0
1
5
2
2
1
2
0
0
2
9
0
0
13
0
0
0
N/A
N/A
Conserved hypothetical protein (Smp_164860)
N/A
N/A
Monocarboxylate transporter, putative (Smp_150340)
Actin-related protein 2, arp2 (Smp_101290.1)
N/A
N/A
Rac-alpha serine/threonine-protein kinase (Smp_073930.2)
N/A
Hypothetical protein (Smp_006960)
SWI/SNF complex-related (Smp_152650)
Protein C10orf118 (CTCL tumor antigen HD-CL-01/L14-2), putative (Smp_034940.3)
Fructose-1,6-bisphosphatase-related (Smp_097370)
Fructose-1,6-bisphosphatase-related (Smp_097370)
Expressed protein (Smp_015530.1)
N/A
Expressed protein (Smp_121440)
Ectonucleotidepyrophosphatase/phosphodiesterase,putative (Smp_153340.1)
Snf7-related (Smp_010090)
Hypothetical protein (Smp_178030)
Mevalonate 5 pyrophosphate decarboxylase (Smp_172660)
Sodium-dependent phosphate transporter, putative (Smp_171630)
N/A
N/A
Solute carrier family 35 member d1, putative (Smp_178490)
Monocarboxylate transporter, putative (Smp_150340)
N/A
N/A
Expressed protein (Smp_177040)
N/A
N/A
N/A
 Regiões 3’UTR com maior pontuação utilizando o software miRAnda.
151
miRNAs: novos controladores da expressão gênica em S. mansoni?
VI.3.2 Ontologia gênica e participação em vias metabólicas
A estratégia de ontologia gênica foi necessária para observar os processos
metabólicos que os alvos de miRNAs atuam. Vários algoritmos tem sido criados associando
alvos de miRNAs com dados de ontologia gênica (Lall et al., 2006; Sethupathy et al., 2006a;
Cui et al., 2007; Megraw et al., 2007). Neste trabalho, a ontologia gênica dos alvos
relacionados com os miRNAs identificados em S. mansoni foi avaliada. Para identificação de
quais associações (processos biológicos, funções moleculares ou componentes celulares)
estariam relacionados aos alvos identificados em S. mansoni, os termos de ontologia gênica
(“GO terms”) de cada sequência foram recuperados no banco de dados do parasito
(GeneDB). Estes termos foram categorizados utilizando a ferramenta GO CateGOrizer
(http://www.animalgenome.org/bioinfo/ tools/countgo/) com o modelo “GO Slim”.
Os termos relacionados com atividade catalítica e metabolismo foram representados
em quase 20% dos termos de ontologia gênica dos alvos analisados. A maioria das funções
clássicas, relacionadas aos genes alvos de miRNAs, foi encontrada neste trabalho (Tabela
15)(Figura 49). Isto mostra que os processos em S. mansoni mantiveram-se consevados
corroborando com outras espécies.
Tabela 15: Ontologia gênica de miRNA em S. mansoni.
Classe GO
Definição (termos GO)
GO:0003824
Função Molecular
catalytic activity
Contagem de
“GO terms”
Porcentagem
89
10,60%
GO:0005488
binding
53
6,31%
GO:0016787
hydrolase activity
36
4,29%
GO:0016740
transferase activity
26
3,10%
GO:0005215
transporter activity
19
2,26%
GO:0003676
nucleic acid binding
11
1,31%
GO:0005515
protein binding
10
1,19%
GO:0004871
signal transducer activity
8
0,95%
GO:0005216
ion channel activity
7
0,83%
GO:0000166
nucleotide binding
7
0,83%
GO:0008233
peptidase activity
6
0,71%
GO:0004672
protein kinase activity
6
0,71%
GO:0016301
kinase activity
6
0,71%
GO:0003677
DNA binding
6
0,71%
GO:0004872
receptor activity
6
0,71%
GO:0030234
enzyme regulator activity
6
0,71%
GO:0030528
transcription regulator activity
5
0,60%
GO:0003723
RNA binding
3
0,36%
152
miRNAs: novos controladores da expressão gênica em S. mansoni?
GO:0004518
nuclease activity
3
0,36%
GO:0005198
structural molecule activity
3
0,36%
GO:0003774
motor activity
2
0,24%
GO:0004721
phosphoprotein phosphatase activity
2
0,24%
GO:0008092
cytoskeletal protein binding
2
0,24%
GO:0008289
lipid binding
2
0,24%
GO:0030246
carbohydrate binding
2
0,24%
GO:0005102
receptor binding
1
0,12%
GO:0003682
chromatin binding
1
0,12%
GO:0045182
translation regulator activity
1
0,12%
GO:0003700
transcription factor activity
1
0,12%
GO:0008135
translation factor activity, nucleic acid binding
1
0,12%
GO:0003779
actin binding
1
0,12%
GO:0005509
calcium ion binding
1
0,12%
Processos Biológicos
GO:0008152
metabolism
79
9,40%
GO:0006139
32
3,81%
GO:0009058
nucleobase, nucleoside, nucleotide and nucleic
acid
metabolism
biosynthesis
30
3,57%
GO:0006810
transport
23
2,74%
GO:0019538
protein metabolism
19
2,26%
GO:0016043
cell organization and biogenesis
15
1,79%
GO:0005975
carbohydrate metabolism
10
1,19%
GO:0006259
DNA metabolism
9
1,07%
GO:0006811
ion transport
9
1,07%
GO:0007165
signal transduction
8
0,95%
GO:0007154
cell communication
8
0,95%
GO:0006350
transcription
8
0,95%
GO:0006996
organelle organization and biogenesis
8
0,95%
GO:0009056
catabolism
8
0,95%
GO:0006464
protein modification
7
0,83%
GO:0006412
protein biosynthesis
6
0,71%
GO:0006629
lipid metabolism
6
0,71%
GO:0015031
protein transport
4
0,48%
GO:0006519
amino acid and derivative metabolism
4
0,48%
GO:0016032
viral life cycle
4
0,48%
GO:0007010
cytoskeleton organization and biogenesis
4
0,48%
GO:0006950
response to stress
4
0,48%
GO:0007049
cell cycle
4
0,48%
GO:0000003
reproduction
3
0,36%
GO:0006091
generation of precursor metabolites and energy
3
0,36%
GO:0030154
cell differentiation
2
0,24%
GO:0007275
development
2
0,24%
GO:0019725
cell homeostasis
2
0,24%
GO:0016265
death
1
0,12%
GO:0009653
morphogenesis
1
0,12%
GO:0008283
cell proliferation
1
0,12%
153
miRNAs: novos controladores da expressão gênica em S. mansoni?
GO:0008219
cell death
1
0,12%
Componentes Celulares
GO:0005623
cell
61
7,26%
GO:0005622
intracellular
46
5,48%
GO:0005737
cytoplasm
23
2,74%
GO:0005634
nucleus
10
1,19%
GO:0005856
cytoskeleton
5
0,60%
GO:0005886
plasma membrane
4
0,48%
GO:0005654
nucleoplasm
4
0,48%
GO:0005739
mitochondrion
3
0,36%
GO:0005694
chromosome
3
0,36%
GO:0005840
ribosome
2
0,24%
GO:0005783
endoplasmic reticulum
2
0,24%
GO:0016023
cytoplasmic membrane-bound vesicle
2
0,24%
GO:0005829
cytosol
2
0,24%
GO:0005576
extracellular region
2
0,24%
GO:0005764
lysosome
2
0,24%
GO:0005773
vacuole
2
0,24%
GO:0005768
endosome
2
0,24%
GO:0005794
Golgi apparatus
2
0,24%
GO:0005929
cilium
1
0,12%
GO:0005615
extracellular space
1
0,12%
GO:0005635
nuclear membrane
1
0,12%
GO:0030312
external encapsulating structure
1
0,12%
GO:0005618
cell wall
1
0,12%
TOTAL
840
100,00%
Figura 49: Representação dos termos “GO” associados aos alvos de miRNAs em S.
mansoni. Os termos GO foram contados por contagem única representando um total de 127
termos ancestrais GO-Slim.
154
miRNAs: novos controladores da expressão gênica em S. mansoni?
A associação dos miRNAs, seus alvos e as vias metabólicas tem sido utilizadas em
alguns programas para predição de miRNAs (Gaidatzis et al., 2007; Maragkakis et al., 2009;
Papadopoulos et al., 2009). As correlações entre miRNAs e rotas bioquímicas tem o intuito
de avaliar e anotar funcionalmente determinado miRNA, gerando especulações de atuação
deste gene em determinada situação. Assim, neste trabalho, os miRNAs identificados e seus
alvos preditos foram associados as vias metabólicas utilizando a Enciclopédia de genes
KEGG. Os termos de cada gene do parasito foram recuperados do ftp da Enciclopédia KEGG
e comparados com o repertório de genes alvos de miRNAs do parasito. A termo smm01100
referente a via metabólica foi representado 14 vezes nos alvos de miRNAs, sendo um valor
acima da média no geral (Tabela 16).
VI.3.3 Expressão gênica dos miRNAs de S. mansoni
Dos 67 miRNAs identificados computacionalmente (Capítulo IV), 17 foram testados
utilizando a técnica de qRT-PCR. No entanto, apenas os miRNAs maduros sma-mir-124-3p,
sma-mir-125a, sma-mir-190-5p, sma-mir-3479-3p, sma-mir-36-3p, sma-mir-61 e sma-mir-83p (conservados) e sma-mir-new10-5p (não conservado) foram analisados devido a
reprodutibilidade dos dados testados. Estes miRNAs foram avaliados no ciclo de S. mansoni,
nas seguintes fases do parasito: cercária, esquistossômulos mecanicamente transformados de
3,5 horas (EMT-3,5) e 24 horas (EMT-24), vermes adultos fêmeas e machos. Estudos
anteriores tem mostrado a expressão de vários miRNAs no gênero Schistosoma (Xue et al.,
2008; Copeland et al., 2009; Huang et al., 2009; Hao et al., 2010; Wang et al., 2010; Cai et
al., 2011; Simoes et al., 2011). Neste trabalho, em geral, foi observado uma tendência de
expressão mais elevada nos estágios de cercária e esquistossômulo quando comparados com
vermes adultos, fêmea e macho (Figura 50).
155
miRNAs: novos controladores da expressão gênica em S. mansoni?
Tabela 16: Associaçào entre os miRNAs identificados em S. mansoni, alvos preditos no genoma e alguns identificadores.
miRNA
Identificação do alvo
sma-mir-71
sma-mir-new_10-3p
sma-mir-2d-3p
sma-mir-2e-3p
sma-mir-2a-3p
Smp_005670 rab11, putative
Smp_010090 snf7-related
Smp_011660.2 protein kinase
Smp_020450 expressed protein
Smp_023360.1 histidyl-tRNA
synthetase, putative
Smp_023360.2 histidyl-tRNA
synthetase, putative
Smp_028080 serine
palmitoyltransferase 1
Smp_034120 synaptosomal associated
protein, putative
Smp_036400.1 NADH-ubiquinone
oxidoreductase ashi subunit, putative
Smp_044440 alcohol dehydrogenase,
putative
sma-mir-2a-3p
sma-mir-2a-3p
sma-mir-2a-5p
sma-mir-new_2-5p
sma-mir-2c-3p
sma-mir-8-3p
sma-mir-124-3p
sma-mir-71
sma-mir-new_9-5p
sma-mir-3492
sma-mir-71b-5p
Smp_047450 snare protein ykt6,
putative
Smp_047660 ferritin, putative
Smp_049600.4 DNAj (hsp40) homolog,
subfamily C, member, putative
Smp_055870 expressed protein
Smp_055880.1 chmp1 (chromatin
modifying protein) (charged
multivesicular body protein), putative
Smp_059360 pre-mRNA processing
Identificação Identificação
UniProt
enzimática
C4PYN8
C4PZQ2
C4Q0A0
C4Q2J2
C4Q3H7
NA
NA
2.7.11.17
NA
6.1.1.21
Identificação do
Grupo de
ortólogos
K07904
K12198
K04515
K14011
K01892
C4Q3H6
6.1.1.21
K01892
smm00970
C4Q4U4
2.3.1.50
K00654
smm00600, smm01100
C4Q6J5
NA
K08508
smm04130
C4Q706
1.6.5.3
1.6.99.3
1.1.1.1
1.1.1.284
K03964
smm00190, smm01100
K00121
C4QA15
NA
K08516
smm00010, smm00071,
smm00350, smm00830,
smm00980, smm00982,
smm01100
smm04130
C4QA32
C4QAK6
1.16.3.1
NA
K00522
K09523
smm00860
smm04141
Q26586
C4QCA0
NA
NA
K08515
K12197
smm04130
smm04144
C4QDD1
NA
K12817
smm03040
C4Q967
156
Identificação da Via KEEG
smm04144
smm04144
smm04310
smm04141
smm00970
miRNAs: novos controladores da expressão gênica em S. mansoni?
sma-mir-71b-5p
sma-mir-71
sma-mir-2d-3p
sma-mir-new_7-5p
sma-mir-new_7-3p
sma-mir-2a-3p
sma-mir-10-5p
sma-mir-3492
sma-mir-2a-5p
sma-mir-new_15-3p
sma-mir-71
sma-mir-2b-5p
sma-mir-71b-5p
sma-mir-71
sma-mir-2a-3p
sma-mir-71
factor, putative
Smp_064190 ocrl type II inositol 5phosphatase, putative
Smp_064190 ocrl type II inositol 5phosphatase, putative
Smp_077230 expressed protein
Smp_097370 fructose-1,6bisphosphatase-related
Smp_097370 fructose-1,6bisphosphatase-related
Smp_105910 CREB-binding protein 1
(SmCBP1)
Smp_106930.2 heat shock protein 70,
putative
Smp_120320.1 spliceosome-associated
protein, putative
Smp_120320.1 spliceosome-associated
protein, putative
Smp_125650 inositol polyphosphate
multikinase, putative
Smp_126260 protein phosphatase-2b,
putative
Smp_133390 restin-like
Smp_137080 multidrug resistance
protein 1, 2, 3 (p glycoprotein 1, 2, 3),
putative
Smp_137080 multidrug resistance
protein 1, 2, 3 (p glycoprotein 1, 2, 3),
putative
Smp_141630.1 splicing factor 3b,
subunit 1-related
Smp_151420 phospholipase D
C1LZH8
3.1.3.36
K01099
C1LZH8
3.1.3.36
K01099
C4QI45
C4QN25
NA
3.1.3.11
K08495
K03841
C4QN25
3.1.3.11
K03841
C4QQ60
2.3.1.48
K04498
C4QQH4
NA
K03283
C4QU54
NA
K12825
smm00562, smm01100,
smm04070
smm00562, smm01100,
smm04070
smm04130
smm00010, smm00030,
smm00051, smm01100
smm00010, smm00030,
smm00051, smm01100
smm04310, smm04330,
smm04350, smm04630
smm03040, smm04141,
smm04144
smm03040
C4QU54
NA
K12825
smm03040
C4PYS1
2.7.1.151
K00328
smm00562
C4PZ44
3.1.3.16
K04348
smm04310, smm04650
C4Q2S0
C4Q4P8
NA
NA
K05293
K05658
smm00563, smm01100
smm02010
C4Q4P8
NA
K05658
smm02010
C4Q6X8
NA
K12828
smm03040
C4QC25
3.1.4.4
K01115
smm00564, smm00565,
smm01100, smm04144
157
miRNAs: novos controladores da expressão gênica em S. mansoni?
sma-mir-124-5p
Smp_159670 synaptojanin, putative
C4QFY3
3.1.3.36
K01099
sma-mir-36-3p
sma-mir-250
sma-mir-2e-3p
Smp_167500 ap endonuclease, putative
Smp_167500 ap endonuclease, putative
Smp_167690 ubiquitin-protein ligase,
putative
Smp_169430 partition defective
complex protein
Smp_172660 mevalonate 5
pyrophosphate decarboxylase
Smp_177040 expressed protein
Smp_177080 alpha-1,3mannosyltransferase
Smp_177080 alpha-1,3mannosyltransferase
C4QJQ7
C4QJQ7
C4QJU1
4.2.99.18
4.2.99.18
6.3.2.19
K10772
K10772
K10592
smm00562, smm01100,
smm04070
smm03410
smm03410
smm04120
C4QKM7
NA
K04237
smm04080, smm04144
C4QLX1
4.1.1.33
K01597
smm00900, smm01100
C4QNK8
C4QNL8
2.4.1.2.4.1.2.4.1.132
2.4.1.2.4.1.132
K07542
K03843
smm00563, smm01100
smm00510, smm01100
K03843
smm00510, smm01100
sma-mir-190-5p
sma-mir-new_11-3p
sma-mir-new_15-3p
sma-mir-71b-5p
sma-mir-71
C4QNL8
158
miRNAs: novos controladores da expressão gênica em S. mansoni?
A utilização de outras formas de análise da expressão gênica de miRNAs tem sido
utilizada no gênero Schistosoma (Hao et al., 2010; Wang et al., 2010; Cai et al., 2011;
Simoes et al., 2011). Em S. japonicum, sequenciamento de nova geração tem sido usado para
avaliação da expressão gênica de miRNAs em diferentes fases do ciclo do parasito (Hao et
al., 2010; Wang et al., 2010; Cai et al., 2011). Um estudo comparativo, realizado em S.
japonicum, mostrou que as principais metodologias utilizadas para expressão de miRNAs
(sequenciamento de nova geração, Northern blot e qRT-PCR) apresentaram valores bem
similares em relação ao nível de miRNAs (Cai et al., 2011). Assim, neste trabalho, a técnica
de qRT-PCR foi escolhida para identificação de miRNAs maduros em diferentes fases de S.
mansoni devido sua alta sensibilidade utilizando baixas quantidades de RNA.
Específicamente a expressão do miRNA sma-mir-12a5 mostrou-se ser estágioespecífico. A figura 50 mostrou uma expressão deste gene exclusivamente nas fases de
vermes adultos (fêmea e macho) e não expressão em cercária e esquistossômulos de 3,5 horas
e 24 horas (Figura 50). Simões (2011) utilizando Northern blot, mostrou que o gene sma-mir125a altamente expresso em vermes adultos quando comparado com esquistossômulos de 7
dias corroborando com os resultados apresentados neste trabalho (Figura 50). O mesmo foi
encontrado para o gene sja-mir-125, ortólogo de sma-mir-125a, que apresentou maior
expressão na fase de vermes adultos em relação a esquistossômulos. Huang (2009) também
sequenciou outros miRNAs utilizando sequenciamento de nova geração nas fases de
esquistossômulos e vermes adultos no parasito S. japonicum. Outro gene avaliado, sja-mir124, demonstrou uma expressão maior em esquistossômulos comparada com vermes adultos
(Huang et al., 2009). A mesma tendência de expressão foi observada no ortólogo sma-mir124-3p, que apresentou uma expressão quase 10 vezes maior em esquistossômulos de 3,5
horas e 24 horas comparada com os estágios de vermes adultos, fêmeas e machos (Figura 50).
VI.3.3.1 miRNAs sexo-específicos
A expressão sexo-específica de alguns miRNAs tem sido mostrada em diversos
organismos como mamíferos e também S. japonicum (Zhang et al., 2007; Mishima et al.,
2008; Cai et al., 2011). Em mamíferos tem sido mostrado que a expressão gênica regulada de
alguns miRNAs está totalmente correlacionada com a maturação sexual do indivíduo (Zhang
et al., 2007; Mishima et al., 2008). Mishima (2008) demonstrou em camundongos que
aproximadamente 80% dos miRNAs altamente expressos em células do sistema reprodutor
masculino tem sido localizados no cromossomo X. Cai (2011) mostrou uma tendência na
159
miRNAs: novos controladores da expressão gênica em S. mansoni?
expressão gênica de alguns miRNAs nas diferentes fases de S. japonicum: vermes adultos
fêmeas e machos. Foi mostrado que os miRNAs maduros sja-miR-7-5p, sja-miR-61, sja-miR219-5p, sja-miR-125a, sja-miR-125b, sja-miR-124-3p e sja-miR-1 apresentaram uma
dominância na expressão em vermes adultos macho, enquanto os miRNAs maduros sjabantam, sja-miR-71b-5p, sja-miR-3479-5p e sja-Novel-23-5p apresentaram dominância em
parasitos fêmea (Cai et al., 2011).
Neste trabalho, a expressão dos miRNAs maduros também foi avaliada em sexos
específicos. Foi observado a mesma tendência de expressão em relação aos miRNAs
avaliados sma-miR-61, sma-miR-125a e sma-miR-124-3p corroborando com os resultados
apresentados por Cai, 2011. Estes genes mostraram um aumento de 3 vezes na expressão em
vermes adultos machos em relação as fêmeas. A mesma tendência foi observada para as
expressões gênicas dos ortólogos sja-miR-61, sja-miR-125a e sja-miR-124-3p corroborando
com os resultados anteriores (Cai et al., 2011). O miRNA com a maior diferença observada
entre as expressões foi o miRNA sma-mir-61 (Figura 50). O mesmo foi demonstrado por Cai
(2011) que mostrou expressão 3 vezes maior de sja-mir-61em vermes machos comparado
com vermes fêmeas.
Assim, o estudo da expressão gênica de miRNAs, em diferentes fases do parasito,
abre perspectivas para a investigação da influência destes genes em seus alvos, sugerindo que
estas moléculas podem alterar, não apenas pontualmente o funcionamento celular, mas
também a homeostase do organismo como um todo. Além disso, a descoberta de genes
expressos gênero-específicos podem auxiliar no estudo das interações parasito-parasito e
parasito-hospedeiro sugerindo uma potente ferramenta para busca de novos medicamentos e
formas de diagnóstico mais precisas.
160
miRNAs: novos controladores da expressão gênica em S. mansoni?
Figura 50: Expressão gênica dos miRNAs, conservados e não conservados, identificados
no genoma de S. mansoni. Os genes (a) sma-mir-124-3p, (b) sma-mir-8-3p, (c) sma-mir-363p, (d) sma-mir-61, (e) sma-mir-125a, (f) sma-mir-190-5p, (g) sma-mir-3479-3pe
(conservados) e (h) sma-mir-new10-5p (não conservado) foram avaliados quanto a expressão
gênica por qRT-PCR nas fases de cercária, esquistossômulo de 3,5 horas e 24 horas e vermes
adultos fêmeas e machos. Como normalizador (gene constitutivo) foi utilizado o gene da U6
e a expressão gênica relativa foi determinada pelo método do 2-ΔCt. A análise estatística foi
161
miRNAs: novos controladores da expressão gênica em S. mansoni?
realizada utilizando o teste de Tukey com p<0,05 no programa GraphPad Prism. As
diferenças estatísticas entre os estágios foram determinadas pelos sinais: * diferente de
cercária, ** diferente de EMT-3,5 horas, *** diferente de EMT-24 horas, # diferente de
vermes fêmea.
VI.3.4 Alvos evolutivamente conservados
Neste trabalho a busca por alvos conservados foi realizada para os miRNAs validados
sma-mir-124-3p, sma-mir-125a, sma-mir-190-5p, sma-mir-3479-3p, sma-mir-36-3p, smamir-61, sma-mir-8-3p e sma-mir-new10-5p. Esta iniciativa teve a finalidade de obter
informações biológicas relevantes perante a flutuação na expressão gênica dos miRNAs. A
estratégia de busca de alvos evolutivamente conservados (região 3`UTR) tende a aumentar a
acurácia do método sendo realizada por alguns programas de predição de alvos de miRNAs.
O programa TargetScan tem usado como critério a presença de 3`UTRs evolutivamente
conservadas e complementares a extremidade 5` dos miRNAs (principalmente a região seed e
seus nucleotídeos vizinhos), O posicionamento dos nucleotídeos vizinhos tem influência na
formação de um pareamento mais ou menos preciso originando pareamentos dos tipos: 7merm8, 7mer-1A e 8 mer. Estes 3 tipos estão relacionados com os pareamentos envolvendo os
miRNAs e suas respectivas 3`UTR. Os pareamentos 7mer-m8 apresentam 100% de
complementaridade no sítio de ligação da região 5’ seed do miRNA (2-8 nucleotídeos) e a
região 3`UTR do gene alvo. Os pareamentos 7mer-1A apresentam 100% de
complementaridade no sítio de ligação da região 5’ seed (2-7 nucleotídeos) sendo o primeiro
nucleotídeo “U” do miRNA e a região 3`UTR do gene alvo. Os pareamentos 8mer
apresentam 100% de complementaridade no sítio de ligação da região 5’ seed (2-8
nucleotídeos) sendo o primeiro nucleotídeo “U” do miRNA e a região 3`UTR do gene alvo.
A comparação dos possíveis alvos evolutivamente conservados presentes em S.
mansoni e S. japonicum, foi realizada aumentando a flexibilidade da predição (delta G menor
ou igual a -18kcal/mol). Este procedimento aumentou o número de alvos para 904 mantendo
os pares miRNA (seed)/3`UTR com 100% de complementaridade. Esta estratégia não levou
em consideração a possibilidade 7mer-1A que apresenta menor pontuação de pareamento,
sendo menos estringente que os critérios 8mer e 7mer-m8. Assim, neste trabalho,
mantiveram-se apenas as opções 8mer e 7mer-m8. Estas estratégias aumentaram a
especificidade da predição dos alvos de miRNAs buscando um significado biológico mais
preciso para estas moléculas.
162
miRNAs: novos controladores da expressão gênica em S. mansoni?
Os alvos que apresentaram similaridade entre as espécies S. mansoni e S. japonicum
foram selecionados para análise. Para tal procedimento, as regiões 3`UTRs dos
correspondentes genes alvos de miRNA de S. mansoni foram comparadas com o banco de
dados genômico de S. japonicum. Vale enfatizar que as sequências 3’UTRs foram
averiguadas quanto a localização no genoma em comparação com a posição do respectivo
gene ortólogo em S. japonicum. Isto foi necessário já que o genoma do parasito S. japonicum
não apresenta anotação quanto à localização das regiões 3`UTRs dos genes preditos. Foram
separados para as análises os alvos dos miRNAs validados sma-mir-124-3p, sma-mir-125a,
sma-mir-190-5p, sma-mir-3479-3p, sma-mir-36-3p, sma-mir-61, sma-mir-8-3p e sma-mirnew10-5p. Após a recuperação das 3`UTRs do genoma de S. japonicum estas foram
analisadas quanto a presença dos sítios de pareamento do par miRNA/3`UTR. Somente as
sequências com 100% de identidade entre a 3`UTR e a região seed foram aceitas. A tabela 17
apresenta os prováveis genes alvos com a possível região de regulação em ambos parasitos, S.
mansoni e S. japonicum. Os prováveis miRNAs sma-mir-3479-3p e sma-mir-new10-5p não
apresentaram alvos conservados com parâmetros suficientemente confiáveis.
163
miRNAs: novos controladores da expressão gênica em S. mansoni?
Tabela 17: Alvos preditos em S. mansoni e S. japonicum usando conservação evolutiva do pareamento miRNA/3`UTR.
miRNA
S. mansoni
Gene Alvo em
S. mansoni
sma-mir-124-3p
Smp_177060 synoviolin,
putative
Smp_173970 DEAD box
ATP-dependent RNA
helicase, putative
Smp_153830 neurobeachin,
putative
sma-mir-36-3p
sma-mir-190-5p
Posição do sítio de
pareamento na
3`UTR
160..179
miRNA
S. japonicum
Gene Alvo em
S. japonicum
Supercontig
sja-mir-124-3p
SJC S000485
1..20
sja-mir-36-3p
Sjp_0051390 Protein TRC8
homolog, putative
Sjp_0036950 me31B
adenosinetriphosphatase, putative
14..36
sja-mir-190-5p
Sjp_0003260 Protein
neurobeachin (Protein rugose) (Akinase anchor protein 550) (AKAP
550) (dAKAP550), putative
Sjp_0103760 Innexin unc-9
(Uncoordinated protein 9),
putative
Sjp_0114730 Zinc finger protein
544, putative
Sjp_0076950 Programmed cell
death protein 4 (Nuclear antigen
H731-like) (Neoplastic
transformation inhibitor protein)
(Protein 197/15a), putative
Sjp_0076950 Programmed cell
death protein 4 (Nuclear antigen
H731-like) (Neoplastic
transformation inhibitor protein)
(Protein 197/15a), putative
Sjp_0076950 Programmed cell
death protein 4 (Nuclear antigen
H731-like) (Neoplastic
transformation inhibitor protein)
(Protein 197/15a), putative
Sjp_0022300 gro; groucho;
groucho, putative
Sjp_0039700 AN1-type zinc
finger protein 6 (Zinc finger A20
domain-containing protein 3),
putative
sma-mir-125a
Smp_066900 innexin,
putative
147..168
sja-mir-125a
sma-mir-124-3p
Smp_074040 zinc finger
protein, putative
Smp_072110.1 programmed
cell death, putative
201..223
sja-mir-124-3p
16..41
sja-mir-36-3p
sma-mir-36-3p
Smp_072110.2 programmed
cell death, putative
16..41
sja-mir-36-3p
sma-mir-36-3p
Smp_072110.3 programmed
cell death, putative
16..41
sja-mir-36-3p
sma-mir-61
Smp_150080 transducin-like
enhancer protein 1
Smp_072720 zinc finger
protein, putative
194..217
sja-mir-61
165..189
sja-mir-8-3p
sma-mir-36-3p
sma-mir-8-3p
164
Posição
do gene
genoma
144682 159998
14172 15501
Posição da
3`UTR no
genoma
159999 –
160190
15502 –
15643
Fita
SJC S000008
50657 138729
138730139134
+
SJC S004154
4603 29614
22203 –
22371(-)
-
SJC S008397
21 - 1038
1039-1872
+
SJC S001294
115588 122697
115433 115580
+
SJC S001295
115589 122697
115434 115580
+
SJC S001296
115590 122697
115435 115580
+
SJC S000123
255322 286413
170352 –
173918 ()
281177 –
281490
169601170351 (-)
+
SJC S000262
SJC S000300
+
+
-
miRNAs: novos controladores da expressão gênica em S. mansoni?
VI.3.5 Expressão gênica de alvos conservados de S. mansoni
Neste trabalho, as expressões dos genes alvos inexina e sinoviolina em cercária e
vermes adultos foram correlacionadas com as expressões de seus respectivos controladores
miRNAs maduros. As figuras 51 mostram as expressões dos alvos nos estágios cercária e
vermes adultos. A expressão alta de um miRNA em um determinado estágio sugere uma
provável controle negativo de seu gene alvo. Ambos os miRNAs, sma-mir-124-3p e sma-mir125a, mostraram possível atuação em seus respectivos genes alvos, sendo o miRNA sma-mir125a mais acentuado. A alta expressão de sma-mir-125a em vermes machos e fêmeas
provavelmente resultou em uma regulação negativa do alvo inexina neste estágio
apresentando uma baixa expressão em vermes adultos.
Figura 51: Expressão gênica relativa dos genes alvos Sinoviolina e Inexina. As
expressões relativas dos genes sinoviolina e inexina foram analisadas utilizando Real Time
PCR nas fases cercária e vermes adultos. Como normalizador (gene constitutivo) foi utilizado
o gene da α-tubulina e a expressão gênica relativa foi determinada pelo método do 2-ΔCt. A
análise estatística foi realizada utilizando o teste de Tukey com P<0,05 no programa
GraphPad Prism. As diferenças estatísticas entre os estágios foram determinadas pelos sinais:
* diferente de cercária.
VI.3.5.1 Smp_066900 inexina (sma-mir-125a)
Inexinas são proteínas pertencentes ao grupo de canais especializados, chamados
junções tipo GAP, que permitem a comunicação célula-célula nos metazoários. Em
vertebrados esta função tem sido desempenhada por uma família de genes chamada
conexinas, e em invertebrados uma grupo de proteínas ortólogas chamadas inexinas (Phelan,
2005; Von Stetina and Orr-Weaver, 2011). Em S. mansoni tem sido descritas vários
165
miRNAs: novos controladores da expressão gênica em S. mansoni?
homólogos do gene inexina de invertebrados sendo uma das quais o gene Smp_066900. Neste
trabalho, o gene inexina Smp_066900 mostrou em sua região 3`UTR sítios de ligação para o
miRNA maduro sma-mir-125a. Além disso, este sitio de ligação foi consistentemente
conservado na região 3`UTR do gene inexina ortólogo encontrado no genoma de S.
japonicum aumentando a confiabilidade da predição. Foi mostrado também que a expressão
do miRNA sma-mir-125a foi elevada principalmente em vermes adultos sendo quase nula em
cercárias e esquistossômulos (diferença de mais de 20 vezes) (Figura 50). Parker-Manuel
(2011) mostrou a presença de 3 transcritos expressos de inexinas após a infecção do parasito
definitivo na fase de esquistossômulo de 3 dias. Este resultado enfatizou a importância das
interações célula-célula em estágios posteriores a infecção no hospedeiro definitivo (ParkerManuel et al., 2011). A baixa expressão do gene sma-mir-125a verificada nos estágios de
cercária e esquistossômulo corroboram com as conclusões obtidas anteriormente, sugerindo
que baixa expressão deste miRNA provavelmente está correlacionada com a alta expressão
do seu alvo direto inexina principalmente em estágios como cercária e esquistossômulos
fomentando sua ativa importância nestas fases pré e pós infecção.
Em C. elegans tem sido mostrado que as inexinas, específicamente, INX-14 and INX22, são requeridas em linhagens germinais de fêmeas, com a finalidade de manter os oócitos
na fase de meiótica prófase I na ausência de esperma (Whitten and Miller, 2007). Além disso,
estudos anteriores em D. melanogaster têm mostrado que as inexinas promovem a
interconexão de células do ovário e células somáticas sendo responsáveis pela comunicação
na oogênese (Bohrmann and Zimmermann, 2008). Análise de microarranjos de tecidos micro
dissecados de vermes fêmeas em S. japonicum tem mostrado alta expressão de inexinas em
células vitelínicas, demonstrando sua importância para esta etapa de fecundação (Gobert et
al., 2009a). Neste trabalho, foi observado que o miRNA sma-mir-125a está mais expresso em
vermes machos comparado com fêmeas. Este dado corrobora com a importância do gene
inexina nos vermes fêmeas, exigindo assim, uma baixa expressão de seu repressor direto
sma-mir-125a. Assim, a diferença na expressão gênica deste miRNA, nos diferentes sexos do
parasito, refletirá no repertório final de genes alvos que estes controlam, influenciando por
exemplo a maturação sexual gênero-específica.
VI.3.5.2 Smp_177060 sinoviolina (sma-mir-124-3p)
Sinoviolina, também conhecida como HRD1, é uma E3 ligase da via de ubiquina
proteassoma localizada no retículo endoplasmático com participação no sistema de
166
miRNAs: novos controladores da expressão gênica em S. mansoni?
degradação associado ao retículo (Tsuchimochi et al., 2005; Hasegawa et al., 2010). Estudos
anteriores têm mostrado sua participação em diversos processos celulares como
embriogênese, hipóxia, e apoptose (Yagishita et al., 2005; Yamasaki et al., 2007; Wouters
and Koritzinsky, 2008). Yagishita (2005) mostrou que a ausência deste gene nas fases
embrionárias interrompe o desenvolvimento embrionário em ratos. Tsuchimochi (2005)
mostrou que esta proteína tem a função de manter uma homeostase celular modulando a
resposta a apoptose e eliminando proteínas com conformações incorretas. Em C. elegans, tem
sido demonstrado, a participação deste gene impedindo a formação de proteínas mutantes
como a lin-12. Tem sido descrito que esta proteína está envolvida na maturação vulval do
nematódeo (Choi et al., 2010).
Neste trabalho, o gene que codifica a proteína sinoviolina (Smp_177060) foi
identificado como alvo do miRNA sma-mir-124-3p. Foi mostrado que este miRNA está mais
expresso em cercária com um discreto decréscimo em esquistossômulo e um acentuado
decréscimo em vermes adultos. Tem sido demonstrado que o desenvolvimento embrionário
de S. mansoni ocorre inicialmente no sistema reprodutivo da fêmea, ou seja, inicia-se o
processo de embriogênese do parasito antes dos ovos serem liberados na corrente sanguínea
(Jurberg et al., 2009). Devido ao fato deste mRNA alvo, sinoviolina, participar de processos
envolvidos com embriogênese, maturação sexual e resposta a hipóxia espera-se uma baixa
expressão deste gene em cercárias e alta expressão, principalmente, em vermes adultos. Esta
afirmação corrobora com resultados encontrados neste trabalho, onde uma elevada expressão
do miRNA modulador negativo, sma-mir-124-3p, aponta para uma provável redução da
expressão de sinoviolina em cercária. No entanto não foi visualizado uma diminuição
significativa da expressão do mRNA na Figura 51, necessitando de uma análise em mais
estágios e uma análise da expressão ao nível protéico. A diminuição da expressão do miRNA
sma-mir-124-3p, em esquistossômulos, pode estar relacionada com uma provável atuação de
sinoviolina em processos de manutenção da homeostase celular desestabilizada pela hipóxia
acometida pelo parasito nesta fase. Uma drástica diminuição da expressão do miRNA em
vermes adultos, sustenta a hipótese de uma provável atuação do alvo sinoviolina neste estágio
permitindo-o participar em processos essenciais de maturação sexual e embriogênese no
parasito.
167
miRNAs: novos controladores da expressão gênica em S. mansoni?
VI.3.6 Controle da expressão gênica ao nível pós-transcricional em S. mansoni
A figura 52 resume os principais resultados obtidos neste trabalho. A expressão dos
miRNAs e dos genes da maquinaria de silenciamento gênico mediada por miRNAs mostrouse significantemente maior em estágios de cercária e esquistossômulo jovens quando
comparados com vermes adultos.
Trabalhos recentes têm mostrado que o perfil de transcritos e a atividade
transcricional no parasito S. mansoni modificam significantemente em diferentes estágios
(Fitzpatrick et al., 2009). Entre o estágio de vida livre cercária e o estágio intra-hospedeiro
definitivo (vermes adultos) existem muitas mudanças morfológicas e de composição celular
refletidas pela modificação da expressão gênica (Gobert et al., 2009b). No estágio de
cercária, o nível transcricional tem se mostrado mais baixo quando comparado com os outros
estágios, ou seja, poucos genes são unicamente transcritos ou poucos são enriquecidos nesta
fase. No entanto, neste estágio, genes envolvidos com a função mitocondrial produzindo
energia para a procura do hospedeiro definitivo e aqueles envolvidos na migração do verme
na fase de esquistossômulos têm mostrado uma expressão mais relevante (Parker-Manuel et
al., 2011). Muitas proteínas e mRNAs de cercária tem sido transcritos e traduzidos em fases
embrionárias de esporocisto-mãe evitando um gasto de energia excedente (Parker-Manuel et
al., 2011). Este fato pode ser confirmado pela grande correlação entre transcritos das duas
fases em níveis quantitativos como mostrado em espécies do gênero Schistosoma (Gobert et
al., 2009b). Na fase de transformação, cercária/esquistossômulos, a baixa transcrição de novo
de genes ocorre para propiciar uma simples rediferenciação de células e tecidos existentes e
não para uma embriogênese propriamente dita (Parker-Manuel et al., 2011). Para tal
processo, Blanton e Licate (1992), sugeriram uma regulação pós-transcricional nesta fase de
transição evitando uma expressão real de proteínas provenientes dos mRNAs (Blanton and
Licate, 1992).
168
miRNAs: novos controladores da expressão gênica em S. mansoni?
Figura 52: Controle da expressão gênica em S. mansoni. A contribuição dos mecanismos
pós-transcricionais, como silenciamento gênico mediado por miRNAs, tem sido mais efetiva
no controle da expressão gênica em estágios larvais do parasito S. mansoni. Os retângulos
vermelhos tracejados representam as relativas expressões dos genes da via de miRNAs e de
seus efetores.
Por outro lado mecanismos de controle transcricional tem sido também encontrados
em S. mansoni auxiliando no controle da expressão gênica no parasito. Os principais
mecanismos de controle transcricional estão relacionados com a estrutura da cromatina.
Processos como modificação de histonas (acetilação, metilação e deacetilação) e metilação de
DNA desempenham um papel essencial no empacotamento de cromatina e consequentemente
no controle da expressão gênica a nível transcricional (Berger, 2007). Recentemente, vários
mecanismos de controle transcricional têm sido mostrados ativos em vermes adultos de S.
mansoni, estágio no qual tem apresentado maior atividade metabólica e altos níveis de
divisão celular (principalmente em fêmeas para produção de ovos)(Pierce et al., 2011). Tais
moléculas, ativas em vermes adultos, têm sido usadas para o estudo de alvos de drogas para o
controle da parasitose visto sua importância vital no controle transcricional de genes do
parasito (Pierce et al., 2011).
A tendência de expressão elevada de moléculas envolvidas no controle pós
transcricional nos estágios larvais de S. mansoni corroboram com a expressão tardia de
alguns transcritos, gerados em esporocistos, e expressos em estágios posteriores como
cercária e esquistossômulos. Assim, baseados em dados deste trabalhos, sugere-se que os
mecanismos de regulação da expressão gênica ao nível pós transcricional, relacionados como
169
miRNAs: novos controladores da expressão gênica em S. mansoni?
os miRNAs, tem estado mais ativos em estágios larvais do parasito, como cercária e
esquistossômulos, enquanto as vias de regulação ao nível transcricional estão mais ativas em
vermes adultos.
O entendimento dos processos de controle da expressão gênica ao nível transcricional
e pós-transcricional, no desenvolvimento e diferenciação do parasito, são essenciais para o
avanço do conhecimento de sua biologia e o discernimento de seu modo de evolução dentre
os seres eucariotos possibilitando o desenvolvimento de novas drogas, vacinas e o controle da
parasitose.
Parte dos resultados obtidos neste trabalho fazem parte do manuscrito recentemente
publicado na Revista Genomics: “Genome-wide identification of novel microRNAs and their
target genes in the human parasite Schistosoma mansoni”. A outra parte, envolvendo a
expressão dos miRNAs e seus prováveis alvos, está em fase de escrita, e brevemente será
submetido.
170
Conclusões
CAPÍTULO VII
Conclusões
171
Conclusões
Os principais resultados deste trabalho permitiram as seguintes conclusões:
- 13 genes e 18 transcritos fazem parte da maquinaria de biogênese de microRNA no parasito
S. mansoni;
- As proteínas preditas SmExportin5.1, SmExportin5.2, SmExportin1.1, SmExportin1.2,
SmDrosha1, SmDrosha2, SmAgo1, SmPartner-Dicer, SmPartner-Drosha, SmFmr1.1,
SmFmr1.2, SmFmr1.3, SmFmr1.4 e SmTudor-SN mostraram-se evolutivamente conservadas
com padrões característicos de domínios conservados em suas estruturas primárias;
- Os genes SmExportin5.1, SmExportin5.2, SmExportin1.1, SmExportin1.2, SmDrosha1,
SmDrosha2,
SmAgo1,
SmPartner-Dicer,
SmPartner-Drosha,
SmFmr1.1,
SmFmr1.2,
SmFmr1.3, SmFmr1.4 e SmTudor-SN mostraram-se diferencialmente expressos nos estágios
de esquistossômulos mecanicamente transformados de 3,5 horas, 24 horas, 72 horas, 5 dias, 7
dias, cercárias e vermes adulto;
- 67 novos miRNAs, 32 não conservados e 35 conservados foram identificados em S.
mansoni;
- Os miRNAs conservados apresentaram duplicações gênicas, formações de clusteres (mir71/2) e presença de miRNAs sexo-específicoss;
- 389 genes alvos foram preditos para os 67 miRNAs maduros;
- Alguns miRNAs mostraram expressão gênica estágio-específica sendo o sma-mir125a
expresso apenas em vermes adultos, sma-new10-5p em cercárias e sma-mir-124 e sma-mir-36
-3p em cercárias e em esquistossômulos jovens;
- Alguns miRNAs mostram expressão sexo-específica como sma-mir-125a, sma-mir-61 e
sma-mir-124.
- Uma correlação positiva foi encontrada entre alta expressão de miRNA e baixa expressão
do alvo, exemplificados pela regulação do gene da inexina (Smp_066900 inexina) pelo smamir-125a e do gene da sinoviolina (Smp_177060) por sma-mir-124-3p;
- Os níveis de expressão gênica, tanto dos miRNAs quanto dos genes envolvidos na
maquinaria de silenciamento mediada por miRNAs, foram elevados em cercárias e
esquistossômulos jovens comparados a vermes adultos;
Em conjunto, os resultados obtidos sugerem que a regulação pós-transcricional
mediada por miRNAs regula o proteoma do parasito, principalmente nas fases cercária e
esquistossômulos, contribuindo para sua efetiva instalação no hospedeiro mamífero.
172
Referências Bibliográficas
CAPÍTULO VIII
REFERÊNCIAS BIBLIOGRÁFICAS
173
Referências Bibliográficas
VIII. REFERÊNCIAS BIBLIOGRÁFICAS
Abbott, A.L., Alvarez-Saavedra, E., Miska, E.A., Lau, N.C., Bartel, D.P., Horvitz, H.R. and
Ambros, V. The let-7 MicroRNA family members mir-48, mir-84, and mir-241
function together to regulate developmental timing in Caenorhabditis elegans. Dev
Cell 9 (2005), pp. 403-14.
Altuvia, Y., Landgraf, P., Lithwick, G., Elefant, N., Pfeffer, S., Aravin, A., Brownstein, M.J.,
Tuschl, T. and Margalit, H. Clustering and conservation patterns of human
microRNAs. Nucleic Acids Res 33 (2005), pp. 2697-706.
Ambros, V. Control of developmental timing in Caenorhabditis elegans. Curr Opin Genet
Dev 10 (2000), pp. 428-33.
Ambros, V. MicroRNA pathways in flies and worms: growth, death, fat, stress, and timing.
Cell 113 (2003), pp. 673-6.
Arnold, K., Bordoli, L., Kopp, J. and Schwede, T. The SWISS-MODEL workspace: a webbased environment for protein structure homology modelling. Bioinformatics 22
(2006), pp. 195-201.
Artzi, S., Kiezun, A. and Shomron, N. miRNAminer: a tool for homologous microRNA gene
search. BMC Bioinformatics 9 (2008), p. 39.
Axtell, M.J. Evolution of microRNAs and their targets: are all microRNAs biologically
relevant? Biochim Biophys Acta 1779 (2008), pp. 725-34.
Azuma-Mukai, A., Oguri, H., Mituyama, T., Qian, Z.R., Asai, K., Siomi, H. and Siomi, M.C.
Characterization of endogenous human Argonautes and their miRNA partners in RNA
silencing. Proc Natl Acad Sci U S A 105 (2008), pp. 7964-9.
Bartel, D.P. MicroRNAs: target recognition and regulatory functions. Cell 136 (2009), pp.
215-33.
Basch, P.F. Cultivation of Schistosoma mansoni in vitro. I. Establishment of cultures from
cercariae and development until pairing. J Parasitol 67 (1981), pp. 179-85.
Bassell, G.J. and Warren, S.T. Fragile X syndrome: loss of local mRNA regulation alters
synaptic development and function. Neuron 60 (2008), pp. 201-14.
Baum, B. and Craig, G. RNAi in a postmodern, postgenomic era. Oncogene 23 (2004), pp.
8336-9.
Bentwich, I., Avniel, A., Karov, Y., Aharonov, R., Gilad, S., Barad, O., Barzilai, A., Einat,
P., Einav, U., Meiri, E., Sharon, E., Spector, Y. and Bentwich, Z. Identification of
174
Referências Bibliográficas
hundreds of conserved and nonconserved human microRNAs. Nat Genet 37 (2005),
pp. 766-70.
Berezikov, E. Evolution of microRNA diversity and regulation in animals. Nat Rev Genet 12
(2011), pp. 846-60.
Berezikov, E., Cuppen, E. and Plasterk, R.H. Approaches to microRNA discovery. Nat Genet
38 Suppl (2006), pp. S2-7.
Berezikov, E., Guryev, V., van de Belt, J., Wienholds, E., Plasterk, R.H. and Cuppen, E.
Phylogenetic shadowing and computational identification of human microRNA genes.
Cell 120 (2005), pp. 21-4.
Berger, S.L. The complex language of chromatin regulation during transcription. Nature 447
(2007), pp. 407-12.
Berriman, M., Haas, B.J., LoVerde, P.T., Wilson, R.A., Dillon, G.P., Cerqueira, G.C.,
Mashiyama, S.T., Al-Lazikani, B., Andrade, L.F., Ashton, P.D., Aslett, M.A.,
Bartholomeu, D.C., Blandin, G., Caffrey, C.R., Coghlan, A., Coulson, R., Day, T.A.,
Delcher, A., DeMarco, R., Djikeng, A., Eyre, T., Gamble, J.A., Ghedin, E., Gu, Y.,
Hertz-Fowler, C., Hirai, H., Hirai, Y., Houston, R., Ivens, A., Johnston, D.A.,
Lacerda, D., Macedo, C.D., McVeigh, P., Ning, Z., Oliveira, G., Overington, J.P.,
Parkhill, J., Pertea, M., Pierce, R.J., Protasio, A.V., Quail, M.A., Rajandream, M.A.,
Rogers, J., Sajid, M., Salzberg, S.L., Stanke, M., Tivey, A.R., White, O., Williams,
D.L., Wortman, J., Wu, W., Zamanian, M., Zerlotini, A., Fraser-Liggett, C.M.,
Barrell, B.G. and El-Sayed, N.M. The genome of the blood fluke Schistosoma
mansoni. Nature 460 (2009), pp. 352-8.
Blanton, R., Loula, E.C. and Parker, J. Two heat-induced proteins are associated with
transformation of Schistosoma mansoni cercariae to schistosomula. Proc Natl Acad
Sci U S A 84 (1987), pp. 9011-4.
Blanton, R.E. and Licate, L.S. Developmental regulation of protein synthesis in schistosomes.
Mol Biochem Parasitol 51 (1992), pp. 201-8.
Bohrmann, J. and Zimmermann, J. Gap junctions in the ovary of Drosophila melanogaster:
localization of innexins 1, 2, 3 and 4 and evidence for intercellular communication via
innexin-2 containing channels. BMC Dev Biol 8 (2008), p. 111.
Brindley, P.J. and Pearce, E.J. Genetic manipulation of schistosomes. Int J Parasitol 37
(2007), pp. 465-73.
Burroughs, A.M., Kawano, M., Ando, Y., Daub, C.O. and Hayashizaki, Y. pre-miRNA
profiles obtained through application of locked nucleic acids and deep sequencing
175
Referências Bibliográficas
reveals
complex 5'/3' arm variation including concomitant cleavage and
polyuridylation patterns. Nucleic Acids Res (2011).
Bussing, I., Yang, J.S., Lai, E.C. and Grosshans, H. The nuclear export receptor XPO-1
supports primary miRNA processing in C. elegans and Drosophila. EMBO J 29
(2010), pp. 1830-9.
Cai, P., Hou, N., Piao, X., Liu, S., Liu, H., Yang, F., Wang, J., Jin, Q., Wang, H. and Chen,
Q. Profiles of small non-coding RNAs in Schistosoma japonicum during
development. PLoS Negl Trop Dis 5 (2011), p. e1256.
Caldas, I.R., Campi-Azevedo, A.C., Oliveira, L.F., Silveira, A.M., Oliveira, R.C. and
Gazzinelli, G. Human schistosomiasis mansoni: immune responses during acute and
chronic phases of the infection. Acta Trop 108 (2008), pp. 109-17.
Callebaut, I., Labesse, G., Durand, P., Poupon, A., Canard, L., Chomilier, J., Henrissat, B.
and Mornon, J.P. Deciphering protein sequence information through hydrophobic
cluster analysis (HCA): current status and perspectives. Cell Mol Life Sci 53 (1997),
pp. 621-45.
Callebaut, I. and Mornon, J.P. The human EBNA-2 coactivator p100: multidomain
organization and relationship to the staphylococcal nuclease fold and to the tudor
protein involved in Drosophila melanogaster development. Biochem J 321 ( Pt 1)
(1997), pp. 125-32.
Campo-Paysaa, F., Semon, M., Cameron, R.A., Peterson, K.J. and Schubert, M. microRNA
complements in deuterostomes: origin and evolution of microRNAs. Evol Dev 13
(2011), pp. 15-27.
Castanotto, D., Lingeman, R., Riggs, A.D. and Rossi, J.J. CRM1 mediates nuclearcytoplasmic shuttling of mature microRNAs. Proc Natl Acad Sci U S A 106 (2009),
pp. 21655-9.
Cheever, A. and Ceman, S. Translation regulation of mRNAs by the fragile X family of
proteins through the microRNA pathway. RNA Biol 6 (2009), pp. 175-8.
Chen, C., Tan, R., Wong, L., Fekete, R. and Halsey, J. Quantitation of microRNAs by realtime RT-qPCR. Methods Mol Biol 687 (2011), pp. 113-34.
Chen, J., Yang, Y., Guo, S., Peng, J., Liu, Z., Li, J., Lin, J. and Cheng, G. Molecular cloning
and expression profiles of Argonaute proteins in Schistosoma japonicum. Parasitol
Res 107 (2010), pp. 889-99.
Chen, N. Using RepeatMasker to identify repetitive elements in genomic sequences. Curr
Protoc Bioinformatics Chapter 4 (2004), p. Unit 4 10.
176
Referências Bibliográficas
Chen, P.Y., Manninga, H., Slanchev, K., Chien, M., Russo, J.J., Ju, J., Sheridan, R., John, B.,
Marks, D.S., Gaidatzis, D., Sander, C., Zavolan, M. and Tuschl, T. The
developmental miRNA profiles of zebrafish as determined by small RNA cloning.
Genes Dev 19 (2005), pp. 1288-93.
Chhabra, R., Dubey, R. and Saini, N. Cooperative and individualistic functions of the
microRNAs in the miR-23a~27a~24-2 cluster and its implication in human diseases.
Mol Cancer 9 (2010), p. 232.
Choi, M.S., Yoo, A.S. and Greenwald, I. sel-11 and cdc-42, two negative modulators of LIN12/Notch activity in C. elegans. PLoS One 5 (2010), p. e11885.
Cintron, N.S. and Toft, D. Defining the requirements for Hsp40 and Hsp70 in the Hsp90
chaperone pathway. J Biol Chem 281 (2006), pp. 26235-44.
Clegg, J.A. In Vitro Cultivation of Schistosoma Mansoni. Exp Parasitol 16 (1965), pp. 13347.
Colbourne, J.K., Pfrender, M.E., Gilbert, D., Thomas, W.K., Tucker, A., Oakley, T.H.,
Tokishita, S., Aerts, A., Arnold, G.J., Basu, M.K., Bauer, D.J., Caceres, C.E., Carmel,
L., Casola, C., Choi, J.H., Detter, J.C., Dong, Q., Dusheyko, S., Eads, B.D., Frohlich,
T., Geiler-Samerotte, K.A., Gerlach, D., Hatcher, P., Jogdeo, S., Krijgsveld, J.,
Kriventseva, E.V., Kultz, D., Laforsch, C., Lindquist, E., Lopez, J., Manak, J.R.,
Muller, J., Pangilinan, J., Patwardhan, R.P., Pitluck, S., Pritham, E.J., Rechtsteiner,
A., Rho, M., Rogozin, I.B., Sakarya, O., Salamov, A., Schaack, S., Shapiro, H., Shiga,
Y., Skalitzky, C., Smith, Z., Souvorov, A., Sung, W., Tang, Z., Tsuchiya, D., Tu, H.,
Vos, H., Wang, M., Wolf, Y.I., Yamagata, H., Yamada, T., Ye, Y., Shaw, J.R.,
Andrews, J., Crease, T.J., Tang, H., Lucas, S.M., Robertson, H.M., Bork, P., Koonin,
E.V., Zdobnov, E.M., Grigoriev, I.V., Lynch, M. and Boore, J.L. The ecoresponsive
genome of Daphnia pulex. Science 331 (2011), pp. 555-61.
Collins, J.J., 3rd, King, R.S., Cogswell, A., Williams, D.L. and Newmark, P.A. An atlas for
Schistosoma mansoni organs and life-cycle stages using cell type-specific markers
and confocal microscopy. PLoS Negl Trop Dis 5 (2011), p. e1009.
Copeland, C.S., Marz, M., Rose, D., Hertel, J., Brindley, P.J., Santana, C.B., Kehr, S.,
Attolini, C.S. and Stadler, P.F. Homology-based annotation of non-coding RNAs in
the genomes of Schistosoma mansoni and Schistosoma japonicum. BMC Genomics
10 (2009), p. 464.
Coura, J.R.A., R. S. Epidemiological and control aspects of schistosomiasis in Brazilian
endemic areas. Mem Inst Oswaldo Cruz 99 (2004), pp. 13-9.
177
Referências Bibliográficas
Cousin, C.E. and Dorsey, C.H. Nervous system of Schistosoma mansoni cercaria:
organization and fine structure. Parasitol Res 77 (1991), pp. 132-41.
Crooks, G.E., Hon, G., Chandonia, J.M. and Brenner, S.E. WebLogo: a sequence logo
generator. Genome Res 14 (2004), pp. 1188-90.
Cui, Q., Yu, Z., Pan, Y., Purisima, E.O. and Wang, E. MicroRNAs preferentially target the
genes with high transcriptional regulation complexity. Biochem Biophys Res Commun
352 (2007), pp. 733-8.
Cunha, A.S. Esquistossomose mansoni. USP (1970), pp. 13-39.
de Koning, A.P., Gu, W., Castoe, T.A., Batzer, M.A. and Pollock, D.D. Repetitive elements
may comprise over two-thirds of the human genome. PLoS Genet 7 (2011), p.
e1002384.
de Lencastre, A., Pincus, Z., Zhou, K., Kato, M., Lee, S.S. and Slack, F.J. MicroRNAs both
promote and antagonize longevity in C. elegans. Curr Biol 20 (2010), pp. 2159-68.
de Souza Gomes, M., Muniyappa, M.K., Carvalho, S.G., Guerra-Sa, R. and Spillane, C.
Genome-wide identification of novel microRNAs and their target genes in the human
parasite Schistosoma mansoni. Genomics (2011).
de Wit, E., Linsen, S.E., Cuppen, E. and Berezikov, E. Repertoire and evolution of miRNA
genes in four divergent nematode species. Genome Res 19 (2009), pp. 2064-74.
Debrand, E., El Jai, Y., Spence, L., Bate, N., Praekelt, U., Pritchard, C.A., Monkley, S.J. and
Critchley, D.R. Talin 2 is a large and complex gene encoding multiple transcripts and
protein isoforms. FEBS J 276 (2009), pp. 1610-28.
Delano, W.L. The PyMOL Molecular Graphics System. CiteULike - (2002).
DeMarco, R., Mathieson, W., Manuel, S.J., Dillon, G.P., Curwen, R.S., Ashton, P.D., Ivens,
A.C., Berriman, M., Verjovski-Almeida, S. and Wilson, R.A. Protein variation in
blood-dwelling schistosome worms generated by differential splicing of micro-exon
gene transcripts. Genome Res 20 (2010), pp. 1112-21.
DeMarco, R., Oliveira, K.C., Venancio, T.M. and Verjovski-Almeida, S. Gender biased
differential alternative splicing patterns of the transcriptional cofactor CA150 gene in
Schistosoma mansoni. Mol Biochem Parasitol 150 (2006), pp. 123-31.
Denli, A.M. and Hannon, G.J. RNAi: an ever-growing puzzle. Trends Biochem Sci 28 (2003),
pp. 196-201.
Denli, A.M., Tops, B.B., Plasterk, R.H., Ketting, R.F. and Hannon, G.J. Processing of
primary microRNAs by the Microprocessor complex. Nature 432 (2004), pp. 231-5.
178
Referências Bibliográficas
Dorsey, C.H., Cousin, C.E., Lewis, F.A. and Stirewalt, M.A. Ultrastructure of the
Schistosoma mansoni cercaria. Micron 33 (2002), pp. 279-323.
Enright, A.J., John, B., Gaul, U., Tuschl, T., Sander, C. and Marks, D.S. MicroRNA targets
in Drosophila. Genome Biol 5 (2003), p. R1.
Erasmus, D.A. A comparative study of the reproductive system of mature, immature and
"unisexual" female Schistosoma mansoni. Parasitology 67 (1973), pp. 165-83.
Esquela-Kerscher, A. and Slack, F.J. Oncomirs - microRNAs with a role in cancer. Nat Rev
Cancer 6 (2006), pp. 259-69.
Eulalio, A., Huntzinger, E. and Izaurralde, E. Getting to the root of miRNA-mediated gene
silencing. Cell 132 (2008), pp. 9-14.
Farazi, T.A., Spitzer, J.I., Morozov, P. and Tuschl, T. miRNAs in human cancer. J Pathol
223 (2011), pp. 102-15.
Finn, R.D., Mistry, J., Tate, J., Coggill, P., Heger, A., Pollington, J.E., Gavin, O.L.,
Gunasekaran, P., Ceric, G., Forslund, K., Holm, L., Sonnhammer, E.L., Eddy, S.R.
and Bateman, A. The Pfam protein families database. Nucleic Acids Res 38 (2010),
pp. D211-22.
Fitzpatrick, J.M., Peak, E., Perally, S., Chalmers, I.W., Barrett, J., Yoshino, T.P., Ivens, A.C.
and Hoffmann, K.F. Anti-schistosomal intervention targets identified by lifecycle
transcriptomic analyses. PLoS Negl Trop Dis 3 (2009), p. e543.
Franco, G.R., Adams, M.D., Soares, M.B., Simpson, A.J., Venter, J.C. and Pena, S.D.
Identification of new Schistosoma mansoni genes by the EST strategy using a
directional cDNA library. Gene 152 (1995), pp. 141-7.
Franco, G.R., Rabelo, E.M., Azevedo, V., Pena, H.B., Ortega, J.M., Santos, T.M., Meira,
W.S., Rodrigues, N.A., Dias, C.M., Harrop, R., Wilson, A., Saber, M., Abdel-Hamid,
H., Faria, M.S., Margutti, M.E., Parra, J.C. and Pena, S.D. Evaluation of cDNA
libraries from different developmental stages of Schistosoma mansoni for production
of expressed sequence tags (ESTs). DNA Res 4 (1997), pp. 231-40.
Franco, G.R., Valadao, A.F., Azevedo, V. and Rabelo, E.M. The Schistosoma gene discovery
program: state of the art. Int J Parasitol 30 (2000), pp. 453-63.
Friedlander, M.R., Chen, W., Adamidi, C., Maaskola, J., Einspanier, R., Knespel, S. and
Rajewsky, N. Discovering microRNAs from deep sequencing data using miRDeep.
Nat Biotechnol 26 (2008), pp. 407-15.
Friedman, R.C., Farh, K.K., Burge, C.B. and Bartel, D.P. Most mammalian mRNAs are
conserved targets of microRNAs. Genome Res 19 (2009), pp. 92-105.
179
Referências Bibliográficas
Fuji, I. Katayama disease. Katayamaki: Chugai Iji Shimpo 691 (1847), pp. 55-56
Gaidatzis, D., van Nimwegen, E., Hausser, J. and Zavolan, M. Inference of miRNA targets
using evolutionary conservation and pathway analysis. BMC Bioinformatics 8 (2007),
p. 69.
Gkirtzou, K., Tsamardinos, I., Tsakalides, P. and Poirazi, P. MatureBayes: a probabilistic
algorithm for identifying the mature miRNA within novel precursors. PLoS One 5
(2010), p. e11843.
Gobert, G.N., McManus, D.P., Nawaratna, S., Moertel, L., Mulvenna, J. and Jones, M.K.
Tissue specific profiling of females of Schistosoma japonicum by integrated laser
microdissection microscopy and microarray analysis. PLoS Negl Trop Dis 3 (2009a),
p. e469.
Gobert, G.N., Moertel, L., Brindley, P.J. and McManus, D.P. Developmental gene expression
profiles of the human pathogen Schistosoma japonicum. BMC Genomics 10 (2009b),
p. 128.
Gomes, M.S., Cabral, F.J., Jannotti-Passos, L.K., Carvalho, O., Rodrigues, V., Baba, E.H.
and Sa, R.G. Preliminary analysis of miRNA pathway in Schistosoma mansoni.
Parasitol Int 58 (2009), pp. 61-8.
Griffiths-Jones, S. miRBase: microRNA sequences and annotation. Curr Protoc
Bioinformatics Chapter 12 (2010), pp. Unit 12 9 1-10.
Grimson, A., Farh, K.K., Johnston, W.K., Garrett-Engele, P., Lim, L.P. and Bartel, D.P.
MicroRNA targeting specificity in mammals: determinants beyond seed pairing. Mol
Cell 27 (2007), pp. 91-105.
Guo, X., Su, B., Zhou, Z. and Sha, J. Rapid evolution of mammalian X-linked testis
microRNAs. BMC Genomics 10 (2009), p. 97.
Hammond, S.M. microRNA detection comes of age. Nat Methods 3 (2006), pp. 12-3.
Han, J., Lee, Y., Yeom, K.H., Nam, J.W., Heo, I., Rhee, J.K., Sohn, S.Y., Cho, Y., Zhang,
B.T. and Kim, V.N. Molecular basis for the recognition of primary microRNAs by the
Drosha-DGCR8 complex. Cell 125 (2006), pp. 887-901.
Han, Z.G., Brindley, P.J., Wang, S.Y. and Chen, Z. Schistosoma genomics: new perspectives
on schistosome biology and host-parasite interaction. Annu Rev Genomics Hum Genet
10 (2009), pp. 211-40.
Hao, L., Cai, P., Jiang, N., Wang, H. and Chen, Q. Identification and characterization of
microRNAs and endogenous siRNAs in Schistosoma japonicum. BMC Genomics 11
(2010), p. 55.
180
Referências Bibliográficas
Harrop, R. and Wilson, R.A. Protein synthesis and release by cultured schistosomula of
Schistosoma mansoni. Parasitology 107 ( Pt 3) (1993), pp. 265-74.
Hasegawa, D., Fujii, R., Yagishita, N., Matsumoto, N., Aratani, S., Izumi, T., Azakami, K.,
Nakazawa, M., Fujita, H., Sato, T., Araya, N., Koike, J., Tadokoro, M., Suzuki, N.,
Nagata, K., Senoo, H., Friedman, S.L., Nishioka, K., Yamano, Y., Itoh, F. and
Nakajima, T. E3 ubiquitin ligase synoviolin is involved in liver fibrogenesis. PLoS
One 5 (2010), p. e13590.
Hausser, J., Berninger, P., Rodak, C., Jantscher, Y., Wirth, S. and Zavolan, M. MirZ: an
integrated microRNA expression atlas and target prediction resource. Nucleic Acids
Res 37 (2009), pp. W266-72.
Hayashita, Y., Osada, H., Tatematsu, Y., Yamada, H., Yanagisawa, K., Tomida, S., Yatabe,
Y., Kawahara, K., Sekido, Y. and Takahashi, T. A polycistronic microRNA cluster,
miR-17-92, is overexpressed in human lung cancers and enhances cell proliferation.
Cancer Res 65 (2005), pp. 9628-32.
Hertel, J., Lindemeyer, M., Missal, K., Fried, C., Tanzer, A., Flamm, C., Hofacker, I.L. and
Stadler, P.F. The expansion of the metazoan microRNA repertoire. BMC Genomics 7
(2006), p. 25.
Hofacker, I.L. RNA secondary structure analysis using the Vienna RNA package. Curr
Protoc Bioinformatics Chapter 12 (2009), p. Unit12 2.
Hoogeveen, A.T., Willemsen, R. and Oostra, B.A. Fragile X syndrome, the Fragile X related
proteins, and animal models. Microsc Res Tech 57 (2002), pp. 148-55.
Howard-Till, R.A. and Yao, M.C. Tudor nuclease genes and programmed DNA
rearrangements in Tetrahymena thermophila. Eukaryot Cell 6 (2007), pp. 1795-804.
Huang, J., Hao, P., Chen, H., Hu, W., Yan, Q., Liu, F. and Han, Z.G. Genome-wide
identification of Schistosoma japonicum microRNAs using a deep-sequencing
approach. PLoS One 4 (2009), p. e8206.
Huang, T.H., Fan, B., Rothschild, M.F., Hu, Z.L., Li, K. and Zhao, S.H. MiRFinder: an
improved approach and software implementation for genome-wide fast microRNA
precursor scans. BMC Bioinformatics 8 (2007), p. 341.
Huang, Y., Shen, X.J., Zou, Q., Huang, J.S. and Tang, S.M. Genomic analysis of silkworm
microRNA promoters and clusters. Mol Biol (Mosk) 45 (2011), pp. 225-30.
Huang, Y., Zou, Q., Wang, S.P., Tang, S.M., Zhang, G.Z. and Shen, X.J. The discovery
approaches and detection methods of microRNAs. Mol Biol Rep (2010).
181
Referências Bibliográficas
Huttenhofer, A. and Vogel, J. Experimental approaches to identify non-coding RNAs.
Nucleic Acids Res 34 (2006), pp. 635-46.
Jaskiewicz, L. and Filipowicz, W. Role of Dicer in posttranscriptional RNA silencing. Curr
Top Microbiol Immunol 320 (2008), pp. 77-97.
Jiang, P., Wu, H., Wang, W., Ma, W., Sun, X. and Lu, Z. MiPred: classification of real and
pseudo microRNA precursors using random forest prediction model with combined
features. Nucleic Acids Res 35 (2007), pp. W339-44.
Jin, P., Zarnescu, D.C., Ceman, S., Nakamoto, M., Mowrey, J., Jongens, T.A., Nelson, D.L.,
Moses, K. and Warren, S.T. Biochemical and genetic interaction between the fragile
X mental retardation protein and the microRNA pathway. Nat Neurosci 7 (2004), pp.
113-7.
John, B., Enright, A.J., Aravin, A., Tuschl, T., Sander, C. and Marks, D.S. Human
MicroRNA targets. PLoS Biol 2 (2004), p. e363.
Jones-Rhoades, M.W. and Bartel, D.P. Computational identification of plant microRNAs and
their targets, including a stress-induced miRNA. Mol Cell 14 (2004), pp. 787-99.
Jones, M. and Blaxter, M. Evolutionary biology: animal roots and shoots. Nature 434 (2005),
pp. 1076-7.
Jurberg, A.D., Goncalves, T., Costa, T.A., de Mattos, A.C., Pascarelli, B.M., de Manso, P.P.,
Ribeiro-Alves, M., Pelajo-Machado, M., Peralta, J.M., Coelho, P.M. and Lenzi, H.L.
The embryonic development of Schistosoma mansoni eggs: proposal for a new
staging system. Dev Genes Evol 219 (2009), pp. 219-34.
Keene, J.D. RNA regulons: coordination of post-transcriptional events. Nat Rev Genet 8
(2007), pp. 533-43.
Kertesz, M., Iovino, N., Unnerstall, U., Gaul, U. and Segal, E. The role of site accessibility in
microRNA target recognition. Nat Genet 39 (2007), pp. 1278-84.
Kiefer, F., Arnold, K., Kunzli, M., Bordoli, L. and Schwede, T. The SWISS-MODEL
Repository and associated resources. Nucleic Acids Res 37 (2009), pp. D387-92.
Kim, S.K., Nam, J.W., Rhee, J.K., Lee, W.J. and Zhang, B.T. miTarget: microRNA target
gene prediction using a support vector machine. BMC Bioinformatics 7 (2006), p.
411.
Kim, V.N. and Nam, J.W. Genomics of microRNA. Trends Genet 22 (2006), pp. 165-73.
Kozaki, K., Imoto, I., Mogi, S., Omura, K. and Inazawa, J. Exploration of tumor-suppressive
microRNAs silenced by DNA hypermethylation in oral cancer. Cancer Res 68 (2008),
pp. 2094-105.
182
Referências Bibliográficas
Kozomara, A. and Griffiths-Jones, S. miRBase: integrating microRNA annotation and deepsequencing data. Nucleic Acids Res 39 (2011), pp. D152-7.
Krautz-Peterson, G. and Skelly, P.J. Schistosoma mansoni: the dicer gene and its expression.
Exp Parasitol 118 (2008), pp. 122-8.
Kruger, J. and Rehmsmeier, M. RNAhybrid: microRNA target prediction easy, fast and
flexible. Nucleic Acids Res 34 (2006), pp. W451-4.
Lagos-Quintana, M., Rauhut, R., Meyer, J., Borkhardt, A. and Tuschl, T. New microRNAs
from mouse and human. RNA 9 (2003), pp. 175-9.
Lai, E.C. Micro RNAs are complementary to 3' UTR sequence motifs that mediate negative
post-transcriptional regulation. Nat Genet 30 (2002), pp. 363-4.
Lai, E.C., Tomancak, P., Williams, R.W. and Rubin, G.M. Computational identification of
Drosophila microRNA genes. Genome Biol 4 (2003), p. R42.
Lall, S., Grun, D., Krek, A., Chen, K., Wang, Y.L., Dewey, C.N., Sood, P., Colombo, T.,
Bray, N., Macmenamin, P., Kao, H.L., Gunsalus, K.C., Pachter, L., Piano, F. and
Rajewsky, N. A genome-wide map of conserved microRNA targets in C. elegans.
Curr Biol 16 (2006), pp. 460-71.
Larkin, M.A., Blackshields, G., Brown, N.P., Chenna, R., McGettigan, P.A., McWilliam, H.,
Valentin, F., Wallace, I.M., Wilm, A., Lopez, R., Thompson, J.D., Gibson, T.J. and
Higgins, D.G. Clustal W and Clustal X version 2.0. Bioinformatics 23 (2007), pp.
2947-8.
Le Paslier, M.C., Pierce, R.J., Merlin, F., Hirai, H., Wu, W., Williams, D.L., Johnston, D.,
LoVerde, P.T. and Le Paslier, D. Construction and characterization of a Schistosoma
mansoni bacterial artificial chromosome library. Genomics 65 (2000), pp. 87-94.
Lee, H.C., Li, L., Gu, W., Xue, Z., Crosthwaite, S.K., Pertsemlidis, A., Lewis, Z.A., Freitag,
M., Selker, E.U., Mello, C.C. and Liu, Y. Diverse pathways generate microRNA-like
RNAs and Dicer-independent small interfering RNAs in fungi. Mol Cell 38 (2010),
pp. 803-14.
Lee, R.C., Feinbaum, R.L. and Ambros, V. The C. elegans heterochronic gene lin-4 encodes
small RNAs with antisense complementarity to lin-14. Cell 75 (1993), pp. 843-54.
Lee, Y., Ahn, C., Han, J., Choi, H., Kim, J., Yim, J., Lee, J., Provost, P., Radmark, O., Kim,
S. and Kim, V.N. The nuclear RNase III Drosha initiates microRNA processing.
Nature 425 (2003), pp. 415-9.
183
Referências Bibliográficas
Lee, Y.S., Nakahara, K., Pham, J.W., Kim, K., He, Z., Sontheimer, E.J. and Carthew, R.W.
Distinct roles for Drosophila Dicer-1 and Dicer-2 in the siRNA/miRNA silencing
pathways. Cell 117 (2004), pp. 69-81.
Lemons, D. and McGinnis, W. Genomic evolution of Hox gene clusters. Science 313 (2006),
pp. 1918-22.
Leuschner, P.J., Obernosterer, G. and Martinez, J. MicroRNAs: Loquacious speaks out. Curr
Biol 15 (2005), pp. R603-5.
Lewis, B.P., Burge, C.B. and Bartel, D.P. Conserved seed pairing, often flanked by
adenosines, indicates that thousands of human genes are microRNA targets. Cell 120
(2005), pp. 15-20.
Lewis, B.P., Shih, I.H., Jones-Rhoades, M.W., Bartel, D.P. and Burge, C.B. Prediction of
mammalian microRNA targets. Cell 115 (2003), pp. 787-98.
Li, C.L., Yang, W.Z., Chen, Y.P. and Yuan, H.S. Structural and functional insights into
human Tudor-SN, a key component linking RNA interference and editing. Nucleic
Acids Res 36 (2008), pp. 3579-89.
Li, L., Xu, J., Yang, D., Tan, X. and Wang, H. Computational approaches for microRNA
studies: a review. Mamm Genome 21 (2010a), pp. 1-12.
Li, S.C., Chan, W.C., Hu, L.Y., Lai, C.H., Hsu, C.N. and Lin, W.C. Identification of
homologous microRNAs in 56 animal genomes. Genomics 96 (2010b), pp. 1-9.
Li, S.C., Pan, C.Y. and Lin, W.C. Bioinformatic discovery of microRNA precursors from
human ESTs and introns. BMC Genomics 7 (2006), pp. -.
Li, S.C., Tang, P. and Lin, W.C. Intronic microRNA: discovery and biological implications.
DNA Cell Biol 26 (2007), pp. 195-207.
Lim, L.P., Lau, N.C., Weinstein, E.G., Abdelhakim, A., Yekta, S., Rhoades, M.W., Burge,
C.B. and Bartel, D.P. The microRNAs of Caenorhabditis elegans. Genes Dev 17
(2003), pp. 991-1008.
Lindow, M. Prediction of targets for microRNAs. Methods Mol Biol 703 (2011), pp. 311-7.
Liu, J., Valencia-Sanchez, M.A., Hannon, G.J. and Parker, R. MicroRNA-dependent
localization of targeted mRNAs to mammalian P-bodies. Nat Cell Biol 7 (2005), pp.
719-23.
Luo, R., Xue, X., Wang, Z., Sun, J., Zou, Y. and Pan, W. Analysis and characterization of the
genes encoding the Dicer and Argonaute proteins of Schistosoma japonicum. Parasit
Vectors 3 (2010), p. 90.
184
Referências Bibliográficas
Lytle, J.R., Yario, T.A. and Steitz, J.A. Target mRNAs are repressed as efficiently by
microRNA-binding sites in the 5' UTR as in the 3' UTR. Proc Natl Acad Sci U S A
104 (2007), pp. 9667-72.
Maher, C., Stein, L. and Ware, D. Evolution of Arabidopsis microRNA families through
duplication events. Genome Res 16 (2006), pp. 510-9.
Manson, P. Report of a case of bilharzia from West Indies. Brit Med J 2 (1902), pp. 18941995.
Maragkakis, M., Reczko, M., Simossis, V.A., Alexiou, P., Papadopoulos, G.L., Dalamagas,
T., Giannopoulos, G., Goumas, G., Koukis, E., Kourtis, K., Vergoulis, T., Koziris, N.,
Sellis, T., Tsanakas, P. and Hatzigeorgiou, A.G. DIANA-microT web server:
elucidating microRNA functions through target prediction. Nucleic Acids Res 37
(2009), pp. W273-6.
Marco, A., Hui, J.H., Ronshaugen, M. and Griffiths-Jones, S. Functional shifts in insect
microRNA evolution. Genome Biol Evol 2 (2010), pp. 686-96.
Mazroui, R., Huot, M.E., Tremblay, S., Filion, C., Labelle, Y. and Khandjian, E.W. Trapping
of messenger RNA by Fragile X Mental Retardation protein into cytoplasmic granules
induces translation repression. Human Molecular Genetics 11 (2002), pp. 3007-17.
Megraw, M., Sethupathy, P., Corda, B. and Hatzigeorgiou, A.G. miRGen: a database for the
study of animal microRNA genomic organization and function. Nucleic Acids Res 35
(2007), pp. D149-55.
Meister, G. and Tuschl, T. Mechanisms of gene silencing by double-stranded RNA. Nature
431 (2004), pp. 343-9.
Mendes, N.D., Freitas, A.T. and Sagot, M.F. Current tools for the identification of miRNA
genes and their targets. Nucleic Acids Res 37 (2009), pp. 2419-33.
Mi, S.J., Cai, T., Hu, Y.G., Chen, Y., Hodges, E., Ni, F.R., Wu, L., Li, S., Zhou, H., Long,
C.Z., Chen, S., Hannon, G.J. and Qi, Y.J. Sorting of small RNAs into Arabidopsis
argonaute complexes is directed by the 5 ' terminal nucleotide. Cell 133 (2008), pp.
116-127.
Mishima, T., Takizawa, T., Luo, S.S., Ishibashi, O., Kawahigashi, Y., Mizuguchi, Y.,
Ishikawa, T., Mori, M., Kanda, T. and Goto, T. MicroRNA (miRNA) cloning analysis
reveals sex differences in miRNA expression profiles between adult mouse testis and
ovary. Reproduction 136 (2008), pp. 811-22.
185
Referências Bibliográficas
Morales, J., Hiesinger, P.R., Schroeder, A.J., Kume, K., Verstreken, P., Jackson, F.R.,
Nelson, D.L. and Hassan, B.A. Drosophila fragile X protein, DFXR, regulates
neuronal morphology and function in the brain. Neuron 34 (2002), pp. 961-72.
Mourelatos, Z., Dostie, J., Paushkin, S., Sharma, A., Charroux, B., Abel, L., Rappsilber, J.,
Mann, M. and Dreyfuss, G. miRNPs: a novel class of ribonucleoproteins containing
numerous microRNAs. Genes Dev 16 (2002), pp. 720-8.
Murphy, D., Dancis, B. and Brown, J.R. The evolution of core proteins involved in
microRNA biogenesis. BMC Evol Biol 8 (2008), p. 92.
Nam, S., Kim, B., Shin, S. and Lee, S. miRGator: an integrated system for functional
annotation of microRNAs. Nucleic Acids Res 36 (2008), pp. D159-64.
Naqvi, A.R., Islam, M.N., Choudhury, N.R. and Haq, Q.M. The fascinating world of RNA
interference. Int J Biol Sci 5 (2009), pp. 97-117.
Noguer-Dance, M., Abu-Amero, S., Al-Khtib, M., Lefevre, A., Coullin, P., Moore, G.E. and
Cavaille, J. The primate-specific microRNA gene cluster (C19MC) is imprinted in the
placenta. Human Molecular Genetics 19 (2010), pp. 3566-3582.
Ojopi, E.P., Oliveira, P.S., Nunes, D.N., Paquola, A., DeMarco, R., Gregorio, S.P., Aires,
K.A., Menck, C.F., Leite, L.C., Verjovski-Almeida, S. and Dias-Neto, E. A
quantitative view of the transcriptome of Schistosoma mansoni adult-worms using
SAGE. BMC Genomics 8 (2007), p. 186.
Okamura, K., Phillips, M.D., Tyler, D.M., Duan, H., Chou, Y.T. and Lai, E.C. The regulatory
activity of microRNA* species has substantial influence on microRNA and 3' UTR
evolution. Nat Struct Mol Biol 15 (2008), pp. 354-63.
Oliveira, G. The Schistosoma mansoni transcriptome: an update. Exp Parasitol 117 (2007),
pp. 229-35.
Oliveira, G., Franco, G. and Verjovski-Almeida, S. The Brazilian contribution to the study of
the Schistosoma mansoni transcriptome. Acta Trop 108 (2008), pp. 179-82.
Papadopoulos, G.L., Alexiou, P., Maragkakis, M., Reczko, M. and Hatzigeorgiou, A.G.
DIANA-mirPath: Integrating human and mouse microRNAs in pathways.
Bioinformatics 25 (2009), pp. 1991-3.
Paraense, W.L. "Biomphalaria Amazonica" and "B. cousini", two new species of neotropical
planorbid molluscs. Rev Bras Biol 26 (1966), pp. 115-26.
Paraense, W.L. Biomphalaria occidentalis sp. n. from South America (Mollusca
Basommatophora Pulmonata). Mem Inst Oswaldo Cruz 76 (1981), pp. 199-211.
186
Referências Bibliográficas
Park, J.K., Liu, X., Strauss, T.J., McKearin, D.M. and Liu, Q. The miRNA pathway
intrinsically controls self-renewal of Drosophila germline stem cells. Curr Biol 17
(2007), pp. 533-8.
Parker-Manuel, S.J., Ivens, A.C., Dillon, G.P. and Wilson, R.A. Gene expression patterns in
larval Schistosoma mansoni associated with infection of the mammalian host. PLoS
Negl Trop Dis 5 (2011), p. e1274.
Passos, A.D.C. Controle da esquistossomose: diretrizes técnicas. (1998).
Phelan, P. Innexins: members of an evolutionarily conserved family of gap-junction proteins.
Biochim Biophys Acta 1711 (2005), pp. 225-45.
Pierce, R.J., Dubois-Abdesselem, F., Caby, S., Trolet, J., Lancelot, J., Oger, F., Bertheaume,
N. and Roger, E. Chromatin regulation in schistosomes and histone modifying
enzymes as drug targets. Mem Inst Oswaldo Cruz 106 (2011), pp. 794-801.
Pierce, R.J., Wu, W., Hirai, H., Ivens, A., Murphy, L.D., Noel, C., Johnston, D.A.,
Artiguenave, F., Adams, M., Cornette, J., Viscogliosi, E., Capron, M. and Balavoine,
G. Evidence for a dispersed Hox gene cluster in the platyhelminth parasite
Schistosoma mansoni. Mol Biol Evol 22 (2005), pp. 2491-503.
Pirajá da Silva, M.A. Contribuição para o estudo da schistosomiase na Bahia. Brazil-méd 22
(1908), pp. 281-283.
Potenza, N., Papa, U., Scaruffi, P., Mosca, N., Tonini, G.P. and Russo, A. A novel splice
variant of the human dicer gene is expressed in neuroblastoma cells. FEBS Lett 584
(2010), pp. 3452-7.
Puzey, J.R. and Kramer, E.M. Identification of conserved Aquilegia coerulea microRNAs
and their targets. Gene 448 (2009), pp. 46-56.
Rabelo, E.M., Franco, G.R., Azevedo, V.A., Pena, H.B., Santos, T.M., Meira, W.S.,
Rodrigues, N.A., Ortega, J.M. and Pena, S.D. Update of the gene discovery program
in Schistosoma mansoni with the expressed sequence tag approach. Mem Inst
Oswaldo Cruz 92 (1997), pp. 625-9.
Ramalho-Pinto, F.J., Gazzinelli, G., Howells, R.E., Mota-Santos, T.A., Figueiredo, E.A. and
Pellegrino, J. Schistosoma mansoni: defined system for stepwise transformation of
cercaria to schistosomule in vitro. Exp Parasitol 36 (1974), pp. 360-72.
Reinhart, B.J., Slack, F.J., Basson, M., Pasquinelli, A.E., Bettinger, J.C., Rougvie, A.E.,
Horvitz, H.R. and Ruvkun, G. The 21-nucleotide let-7 RNA regulates developmental
timing in Caenorhabditis elegans. Nature 403 (2000), pp. 901-6.
187
Referências Bibliográficas
Rey, L. Parasitologia: parasitos e doenças parasitárias do homem nas Américas e na África.
Guanabara 1 (2001), p. 856.
Roberts, L.S.J., J. Foundations of parasitology. Science (2000).
Rost, B. and Liu, J. The PredictProtein server. Nucleic Acids Res 31 (2003), pp. 3300-4.
Rost, B., Yachdav, G. and Liu, J. The PredictProtein server. Nucleic Acids Res 32 (2004), pp.
W321-6.
Roubelakis, M.G., Zotos, P., Papachristoudis, G., Michalopoulos, I., Pappa, K.I., Anagnou,
N.P. and Kossida, S. Human microRNA target analysis and gene ontology clustering
by GOmir, a novel stand-alone application. BMC Bioinformatics 10 Suppl 6 (2009),
p. S20.
Roush, S. and Slack, F.J. The let-7 family of microRNAs. Trends Cell Biol 18 (2008), pp.
505-16.
Saini, H.K., Enright, A.J. and Griffiths-Jones, S. Annotation of mammalian primary
microRNAs. BMC Genomics 9 (2008), p. 564.
Saini, H.K., Griffiths-Jones, S. and Enright, A.J. Genomic analysis of human microRNA
transcripts. Proc Natl Acad Sci U S A 104 (2007), pp. 17719-24.
Saito, K., Ishizuka, A., Siomi, H. and Siomi, M.C. Processing of pre-microRNAs by the
Dicer-1-Loquacious complex in Drosophila cells. PLoS Biol 3 (2005), p. e235.
Saitou, N. and Nei, M. The neighbor-joining method: a new method for reconstructing
phylogenetic trees. Mol Biol Evol 4 (1987), pp. 406-25.
Sambon, L.W. Remarks on Schistosoma mansoni. Am J Trop Med Hyg 10 (1907), pp. 303304.
Schmittgen, T.D. Regulation of microRNA processing in development, differentiation and
cancer. J Cell Mol Med 12 (2008), pp. 1811-9.
Sethupathy, P., Corda, B. and Hatzigeorgiou, A.G. TarBase: A comprehensive database of
experimentally supported animal microRNA targets. RNA 12 (2006a), pp. 192-7.
Sethupathy, P., Megraw, M. and Hatzigeorgiou, A.G. A guide through present computational
approaches for the identification of mammalian microRNA targets. Nat Methods 3
(2006b), pp. 881-6.
Sharbati-Tehrani, S., Kutz-Lohroff, B., Bergbauer, R., Scholven, J. and Einspanier, R. miRQ: a novel quantitative RT-PCR approach for the expression profiling of small RNA
molecules such as miRNAs in a complex sample. BMC Mol Biol 9 (2008), p. 34.
Sheng, Y., Engstrom, P.G. and Lenhard, B. Mammalian microRNA prediction through a
support vector machine model of sequence and structure. PLoS One 2 (2007), p. e946.
188
Referências Bibliográficas
Short, R.B. and Menzel, M.Y. Chromosomes of nine species of schistosomes. J Parasitol 46
(1960), pp. 273-87.
Short, R.B., Menzel, M.Y. and Pathak, S. Somatic chromosomes of Schistosoma mansoni. J
Parasitol 65 (1979), pp. 471-3.
Simoes, M.C., Lee, J., Djikeng, A., Cerqueira, G.C., Zerlotini, A., da Silva-Pereira, R.A.,
Dalby, A.R., LoVerde, P., El-Sayed, N.M. and Oliveira, G. Identification of
Schistosoma mansoni microRNAs. BMC Genomics 12 (2011), p. 47.
Simpson, A.J., Sher, A. and McCutchan, T.F. The genome of Schistosoma mansoni: isolation
of DNA, its size, bases and repetitive sequences. Mol Biochem Parasitol 6 (1982), pp.
125-37.
Smithers, S.R. and Terry, R.J. The infection of laboratory hosts with cercariae of
Schistosoma mansoni and the recovery of the adult worms. Parasitology 55 (1965),
pp. 695-700.
Song, R., Ro, S., Michaels, J.D., Park, C., McCarrey, J.R. and Yan, W. Many X-linked
microRNAs escape meiotic sex chromosome inactivation. Nature Genetics 41 (2009),
pp. 488-493.
Takane, K., Fujishima, K., Watanabe, Y., Sato, A., Saito, N., Tomita, M. and Kanai, A.
Computational prediction and experimental validation of evolutionarily conserved
microRNA target genes in bilaterian animals. BMC Genomics 11 (2010), p. 101.
Tamura, K., Dudley, J., Nei, M. and Kumar, S. MEGA4: Molecular Evolutionary Genetics
Analysis (MEGA) software version 4.0. Mol Biol Evol 24 (2007), pp. 1596-9.
Tanzer, A. and Stadler, P.F. Molecular evolution of a microRNA cluster. J Mol Biol 339
(2004), pp. 327-35.
Thompson, J.D., Gibson, T.J. and Higgins, D.G. Multiple sequence alignment using
ClustalW and ClustalX. Curr Protoc Bioinformatics Chapter 2 (2002), p. Unit 2 3.
Tsuchimochi, K., Yagishita, N., Yamasaki, S., Amano, T., Kato, Y., Kawahara, K., Aratani,
S., Fujita, H., Ji, F., Sugiura, A., Izumi, T., Sugamiya, A., Maruyama, I., Fukamizu,
A., Komiya, S., Nishioka, K. and Nakajima, T. Identification of a crucial site for
synoviolin expression. Mol Cell Biol 25 (2005), pp. 7344-56.
Verjovski-Almeida, S., DeMarco, R., Martins, E.A., Guimaraes, P.E., Ojopi, E.P., Paquola,
A.C., Piazza, J.P., Nishiyama, M.Y., Jr., Kitajima, J.P., Adamson, R.E., Ashton, P.D.,
Bonaldo, M.F., Coulson, P.S., Dillon, G.P., Farias, L.P., Gregorio, S.P., Ho, P.L.,
Leite, R.A., Malaquias, L.C., Marques, R.C., Miyasato, P.A., Nascimento, A.L.,
Ohlweiler, F.P., Reis, E.M., Ribeiro, M.A., Sa, R.G., Stukart, G.C., Soares, M.B.,
189
Referências Bibliográficas
Gargioni, C., Kawano, T., Rodrigues, V., Madeira, A.M., Wilson, R.A., Menck, C.F.,
Setubal, J.C., Leite, L.C. and Dias-Neto, E. Transcriptome analysis of the acoelomate
human parasite Schistosoma mansoni. Nat Genet 35 (2003), pp. 148-57.
Voinnet, O. Origin, biogenesis, and activity of plant microRNAs. Cell 136 (2009), pp. 66987.
Von Stetina, J.R. and Orr-Weaver, T.L. Developmental control of oocyte maturation and egg
activation in metazoan models. Cold Spring Harb Perspect Biol 3 (2011), p. a005553.
Wang, X. and El Naqa, I.M. Prediction of both conserved and nonconserved microRNA
targets in animals. Bioinformatics 24 (2008), pp. 325-32.
Wang, X., Zhang, J., Li, F., Gu, J., He, T., Zhang, X. and Li, Y. MicroRNA identification
based on sequence and structure alignment. Bioinformatics 21 (2005), pp. 3610-4.
Wang, Z., Xue, X., Sun, J., Luo, R., Xu, X., Jiang, Y., Zhang, Q. and Pan, W. An "in-depth"
description of the small non-coding RNA population of Schistosoma japonicum
schistosomulum. PLoS Negl Trop Dis 4 (2010), p. e596.
Warf, M.B., Johnson, W.E. and Bass, B.L. Improved annotation of C. elegans microRNAs by
deep sequencing reveals structures associated with processing by Drosha and Dicer.
RNA 17 (2011), pp. 563-77.
Watanabe, Y., Tomita, M. and Kanai, A. Computational methods for microRNA target
prediction. Methods Enzymol 427 (2007), pp. 65-86.
Westholm, J.O. and Lai, E.C. Mirtrons: microRNA biogenesis via splicing. Biochimie 93
(2011), pp. 1897-904.
Whitten, S.J. and Miller, M.A. The role of gap junctions in Caenorhabditis elegans oocyte
maturation and fertilization. Dev Biol 301 (2007), pp. 432-46.
WHO Working to overcome the global impact of neglected tropical diseases. (2010).
Wilson, R.A., Ashton, P.D., Braschi, S., Dillon, G.P., Berriman, M. and Ivens, A. 'Oming in
on schistosomes: prospects and limitations for post-genomics. Trends Parasitol 23
(2007), pp. 14-20.
Wilson, R.A. and Barnes, P.E. Synthesis of macromolecules by the epithelial surfaces of
Schistosoma mansoni: an autoradiographic study. Parasitology 78 (1979), pp. 295310.
Winter, J. and Diederichs, S. MicroRNA Northern blotting, precursor cloning, and Ago2improved RNA interference. Methods Mol Biol 676 (2011), pp. 85-100.
190
Referências Bibliográficas
Winter, J., Jung, S., Keller, S., Gregory, R.I. and Diederichs, S. Many roads to maturity:
microRNA biogenesis pathways and their regulation. Nat Cell Biol 11 (2009), pp.
228-34.
Wong, T.S., Liu, X.B., Wong, B.Y., Ng, R.W., Yuen, A.P. and Wei, W.I. Mature miR-184 as
Potential Oncogenic microRNA of Squamous Cell Carcinoma of Tongue. Clin
Cancer Res 14 (2008), pp. 2588-92.
Wouters, B.G. and Koritzinsky, M. Hypoxia signalling through mTOR and the unfolded
protein response in cancer. Nat Rev Cancer 8 (2008), pp. 851-64.
Xiao, F., Zuo, Z., Cai, G., Kang, S., Gao, X. and Li, T. miRecords: an integrated resource for
microRNA-target interactions. Nucleic Acids Res 37 (2009), pp. D105-10.
Xue, C., Li, F., He, T., Liu, G.P., Li, Y. and Zhang, X. Classification of real and pseudo
microRNA precursors using local structure-sequence features and support vector
machine. BMC Bioinformatics 6 (2005), p. 310.
Xue, X., Sun, J., Zhang, Q., Wang, Z., Huang, Y. and Pan, W. Identification and
characterization of novel microRNAs from Schistosoma japonicum. PLoS One 3
(2008), p. e4034.
Yagishita, N., Ohneda, K., Amano, T., Yamasaki, S., Sugiura, A., Tsuchimochi, K., Shin, H.,
Kawahara, K., Ohneda, O., Ohta, T., Tanaka, S., Yamamoto, M., Maruyama, I.,
Nishioka, K., Fukamizu, A. and Nakajima, T. Essential role of synoviolin in
embryogenesis. J Biol Chem 280 (2005), pp. 7909-16.
Yamasaki, S., Yagishita, N., Nishioka, K. and Nakajima, T. The roles of synoviolin in
crosstalk between endoplasmic reticulum stress-induced apoptosis and p53 pathway.
Cell Cycle 6 (2007), pp. 1319-23.
Yang, J., Valineva, T., Hong, J., Bu, T., Yao, Z., Jensen, O.N., Frilander, M.J. and
Silvennoinen, O. Transcriptional co-activator protein p100 interacts with snRNP
proteins and facilitates the assembly of the spliceosome. Nucleic Acids Res 35 (2007),
pp. 4485-94.
Zhang, B., Pan, X., Cannon, C.H., Cobb, G.P. and Anderson, T.A. Conservation and
divergence of plant microRNA genes. Plant J 46 (2006a), pp. 243-59.
Zhang, B., Pan, X., Wang, Q., Cobb, G.P. and Anderson, T.A. Computational identification
of microRNAs and their targets. Comput Biol Chem 30 (2006b), pp. 395-407.
Zhang, Q., He, X.J., Liu, Y.J., Ma, L.P. and Pan, X.Y. [Profiling of microRNAs in mouse
brain with real-time PCR array]. Beijing Da Xue Xue Bao 41 (2009a), pp. 152-7.
191
Referências Bibliográficas
Zhang, R., Peng, Y., Wang, W. and Su, B. Rapid evolution of an X-linked microRNA cluster
in primates. Genome Res 17 (2007), pp. 612-7.
Zhang, Y., Zhang, R. and Su, B. Diversity and evolution of MicroRNA gene clusters. Sci
China C Life Sci 52 (2009b), pp. 261-6.
Zhang, Y.Q., Chen, D.L., Tian, H.F., Zhang, B.H. and Wen, J.F. Genome-wide
computational identification of microRNAs and their targets in the deep-branching
eukaryote Giardia lamblia. Comput Biol Chem 33 (2009c), pp. 391-6.
Zheng, J., Lu, J., Liu, H., Li, J. and Chen, K. Sequence and structural analysis of 4SNc-Tudor
domain protein from Takifugu Rubripes. Bioinformation 4 (2009), pp. 127-31.
Zhou, M., Wang, Q., Sun, J., Li, X., Xu, L., Yang, H., Shi, H., Ning, S., Chen, L., Li, Y., He,
T. and Zheng, Y. In silico detection and characteristics of novel microRNA genes in
the Equus caballus genome using an integrated ab initio and comparative genomic
approach. Genomics 94 (2009), pp. 125-31.
192
Anexo
Anexo
A
B
193
Anexo
C
D
194
Anexo
E
F
195
Anexo
G
H
196
Anexo
I
J
197
Anexo
L
M
198
Anexo
N
Figura 1: Distribuição dos valores relacionados às características (A) Conteúdo de A e
(B) AMFE, (C) Conteúdo de AU, (D) Conteúdo de C, (E) Diversidade do Conjunto, (F)
Frequência do MFE no conjunto termodinâmico, (G) Conteúdo de G, (H) Taxa de GC,
(I) Tamanho, (J) MFE no conjunto termodinâmico, (L) MFEI, (M) Conteúdo de U e (N)
Taxa de AU dos novos precursores de miRNAs. Os valores utilizados na confecção dos
gráficos foram baseados em precursores de miRNAs depositados no banco de dados
miRBase. Os nomes dos novos miRNA estão representados em cada gráfico do grupo de
miRNA correspondente. As caixas representam 50% dos dados analisados. A extremidade
mais baixa representa o primeiro quartil ou 25 % dos dados e a extremidade mais alta
representa o terceiro quartil ou 75 % dos dados. A linha horizontal dentro da caixa representa
a mediana e os valores maiores que 1,5 vezes a mediana são os “outliers”.
199
Anexo
Anexo 2
Produção científica gerada durante o doutorado
Artigos publicados
1.
de Souza Gomes, Matheus ; Muniyappa, Mohan Kumar ; Carvalho, Sávio Gonçalves
; Guerra-SÃ , Renata ; Spillane, Charles . Genome-wide identification of novel microRNAs
and their target genes in the human parasite Schistosoma mansoni. Genomics (San Diego,
Calif.), v. 98, p. 96-111, 2011.
2.
Pereira, Roberta Verciano ; Cabral, Fernanda J. ; Gomes, Matheus S. ; Baba, Elio H.
; Jannotti-Passos, Liana K. ; Carvalho, Omar ; Rodrigues, Vanderlei ; Afonso, Robson JosÃ
CÃ ssia Franco ; Castro-Borges, William ; Guerra-SÃ , Renata . Molecular characterization
of SUMO E2 conjugation enzyme: differential expression profile in Schistosoma mansoni.
Parasitology Research (1987. Print), v. 109, p. 1537-1546, 2011.
3.
Botelho-Machado, Carla ; Cabral, F. J. ; Soares, C. S. ; Moreira, E. B. C. ; Morais, E.
R. ; Magalhães, L. G. ; Gomes, M. S. ; Guerra-Sá, R. ; Rosa, J. C. ; Ruller, R. ; Ward, R. J. ;
RODRIGUES, V. . Characterization and mRNA expression analysis of PI31, an endogenous
proteasome inhibitor from Schistosoma mansoni. Parasitology Research (1987. Print), v. 107,
p. 1163-1171, 2010.
4.
Gomes, Matheus S. ; Cabral, Fernanda J. ; Jannotti-Passos, Liana K. ; Carvalho,
Omar ; Rodrigues, Vanderlei ; Baba, Elio H. ; Sá, Renata G. . Preliminary analysis of miRNA
pathway in Schistosoma mansoni. Parasitology International, v. 58, p. 61-68, 2009.
5.
Magalhães, Lizandra Guidi ; Castro-Borges, William ; Souza Gomes, Matheus ;
Guerra-Sá, Renata ; Rodrigues, Vanderlei . Molecular cloning, sequencing, and expression
analysis of presenilin cDNA from Schistosoma mansoni. Parasitology Research, v. 106, p. 713, 2009.
6.
Paula, Fabiana M. ; Castro-Borges, William ; Júnior, Olavo S. Pereira ; Souza
Gomes, Matheus ; Ueta, Marlene T. ; Rodrigues, Vanderlei . The ubiquitin proteasome
system in Strongyloididae. Biochemical evidence for developmentally regulated proteolysis
in Strongyloides venezuelensis. Parasitology Research, v. 105, p. 567-576, 2009.
7.
VALENTIM, C. L. L. ; GOMES, M.S. ; Jeremias, W. J. ; Cunha, J. C. ; Oliveira, G.
C. ; Botelho, A. C. C. ; Pimenta, P. F. P. ; Janotti-Passos, L. K. ; Guerra-Sá, R. ; Babá, E. H. .
200
Anexo
Physical Localization of the Retrotransposons Boudicca and Perere 03 in Schistosoma
mansoni. The Journal of Parasitology, v. 94, p. 993, 2008.
Artigos submetidos
Matheus de Souza Gomes, Daniel Menezes Souza, Roenick Proveti Olmo, Liana K.
Jannotti-Passos, Elio Hideo Babá, William Castro-Borges, Renata Guerra-Sá. “Evolutionarily
conserved and developmentally-regulated expression of miRNA biogenesis and RISC
complex components in Schistosoma mansoni”. Revista Gene – Julho 2011.
Artigos em preparação
Matheus de Souza Gomes, Mohan Kumar Muniyappa, Mark T. A. Donoghue, Roberta
Verciano Pereira, Charles Spillane and Renata Guerra-Sá “Computational identification and
evolution of microRNA gene cluster mir-71/2 in Protostomes”. Revista Journal of Molecular
Evolution – Previsão de submissão Janeiro 2012.
201
Download

Tese - RI UFOP