TESE DE DOUTORADO
DESCOBERTA E ANÁLISE DA VARIABILIDADE
INTERESPECÍFICA
DE PEQUENOS RNAS VIA SEQUENCIAMENTO DE NOVA
GERAÇÃO EM EUCALYPTUS
Marília de Castro Rodrigues Pappas
Brasília - DF
Março, 2013
i
UNIVERSIDADE DE BRASÍLIA
Instituto de Ciências Biológicas
Departamento de Biologia Celular
DESCOBERTA E ANÁLISE DA VARIABILIDADE
INTERESPECÍFICA
DE PEQUENOS RNAS VIA SEQUENCIAMENTO DE NOVA
GERAÇÃO EM EUCALYPTUS
Orientador: Dario Grattapaglia
Tese apresentada ao Departamento de Biologia
Celular
do
Instituto
de
Biologia,
da
Universidade de Brasília, como requisito
parcial para obtenção do grau de Doutor em
Ciências Biológicas, Área de Concentração:
Biologia Molecular
BRASILIA – DF
Março, 2013
ii
TERMO DE APROVAÇÃO
Tese apresentada ao Departamento de Biologia Celular da Universidade de Brasília,
como requisito parcial para obtenção de grau de Doutor em Ciências Biológicas, área de
concentração Biologia Molecular. Tese defendida e aprovada em 08/03/2013 por:
Dr. Dario Grattapaglia - Orientador
Embrapa Recursos Genéticos e Biotecnologia
Dr. Rogério Margis
Universidade Federal do Rio Grande do Sul
Dra. Simone da Graça Ribeiro
Embrapa Recursos Genéticos e Biotecnologia
Dra. Ildinete Silva Pereira
Universidade de Brasília
Dr. Júlio Carlyle M. Rodrigues
Embrapa Recursos Genéticos e Biotecnologia
iii
Dedico este trabalho aos meus grandes amores, Nicolas e Georgios.
Plagiando o meu orientador, colega de trabalho e amigo Dario Grattapaglia, Nicolas
é a maior experiência genética já realizada por mim e pelo Georgios. Esse trabalho não é
nada perto dele mas é, sem dúvida, por ele. Como ele diz, “o livro da mamãe” ficou pronto.
iv
AGRADECIMENTOS
Agradeço a minha mãe, que desde sempre me apoiou, deu força e incentivo não
importando o que eu resolvesse fazer.
Ao meu pequeno príncipe Nicolas que teve paciência de aguentar a mãe
trabalhando muito e sem tempo para ele, especialmente nas suas férias de verão de 2013.
À minha família que me ajudou a ter mais tranquilidade para trabalhar enquanto
eles entretinham o Nicolas, especialmente, tio Sílvio e tia Simone e os primos André e
Bernardo, vovó Suely, Iaiá Nancy e o papai sempre presente.
Ao meu “co-orientador” informal, conselheiro e, acima de tudo, parceiro de todas
as horas, Georgios. Sem ele, essa tese não seria possível. Sem palavras para agradecer tanta
dedicação.
Ao meu orientador, Dario Grattapaglia, pelo apoio e confiança incondicionais de
sempre.
A Simone Ribeiro, cuja ajuda foi inestimável na implementação do northern blot e,
entre uma hibridização e outra, acabou se tornando mais que uma colaboradora, uma amiga
querida.
Ao Dr Scott Poethig, que gentilmente cedeu seus protocolos para o northern blot,
compartilhou dados e foi sempre tão acessível.
A Alessandra Reis que foi a responsável pelo sequenciamento Illumina na Fasteris.
E ao Laurent pela gentileza e disponibilidade.
Aos colegas do laboratório de Genética Vegetal da Embrapa Recursos Genéticos e
Biotecnologia pela convivência, apoio e momentos de descontração. Especialmente, à
Neide e ao Marcão, sempre disponíveis e dispostos a resolver qualquer problema e ajudar
em tudo.
Aos colegas do LPPIII da Embrapa Recursos Genéticos e Biotecnologia pela
convivência e apoio, em especial, à Lígia por me socorrer quando precisei.
v
Introdução .............................................................................................................................. 5
O gênero Eucalyptus .......................................................................................................... 5
Pequenos RNAs ................................................................................................................. 8
Motivação .......................................................................................................................... 9
Objetivos e Metas ................................................................................................................ 11
Capítulo I ............................................................................................................................. 12
Revisão Bibliográfica .......................................................................................................... 13
Pequenos RNAs não codificadores .................................................................................. 13
Pequenos RNAs em plantas ............................................................................................. 15
Descoberta de miRNAs em plantas .............................................................................. 19
MiRNA em arbóreas .................................................................................................... 21
Metodologia ......................................................................................................................... 24
Material Biológico ........................................................................................................... 24
Extração de RNA ............................................................................................................. 27
Processamento dos dados de sequenciamento ................................................................. 27
Validação experimental ................................................................................................... 28
Resultados e discussão ........................................................................................................ 30
Sequenciamento de pequenos RNAs ............................................................................... 30
Análise geral de sequências.......................................................................................... 30
Sequências mais abundantes ........................................................................................ 35
A abundância da sequência não implica classificação como miRNA ......................... 41
Análise comparativa da abundância ............................................................................. 48
Mapeamento contra o genoma de referência ................................................................... 49
Famílias conservadas de miRNAs ................................................................................... 52
Compatibilidade estrutural ............................................................................................... 55
Predição de alvos de regulação por miRNAs .................................................................. 58
Validação experimental - Northern blot .......................................................................... 60
Validação experimental – microarranjo ........................................................................... 65
Dados consolidados de sequenciamento .......................................................................... 71
vi
Conservação com Eugenia uniflora ................................................................................. 74
Conclusões ........................................................................................................................... 76
Capítulo II ............................................................................................................................ 79
Introdução ............................................................................................................................ 80
Revisão bibliográfica ........................................................................................................... 81
Origem dos RNAs em fase .............................................................................................. 81
Rede de regulação dos RNAs em fase ............................................................................. 83
Os RNAs em fase e genes de resistência a doenças ........................................................ 86
Metodologia ......................................................................................................................... 89
Sequenciamento ............................................................................................................... 89
Mapeamento e identificação de siRNAs em fase ............................................................ 89
Predição de Alvos ............................................................................................................ 89
Resultados............................................................................................................................ 90
Conclusões ......................................................................................................................... 101
Perspectivas futuras ........................................................................................................... 103
Anexo I .............................................................................................................................. 107
Anexo II ............................................................................................................................. 116
Bibliografia ........................................................................................................................ 121
vii
RESUMO
Há pouco mais de uma década foi descrita a função de mais uma classe de
elementos regulatórios chamados de micro RNAs – miRNAs. Inicialmente descritos como
reguladores pós transcricionais envolvidos no processo desenvolvimento, estes já tiveram
papel validado em uma ampla gama de processos como germinação, determinação de
morfologia e respostas a estresse biótico e abiótico. A descrição desta classe de reguladores
em Eucalyptus contribui com o conhecimento científico deste importante e vasto gênero
inserindo mais um relevante elemento na anotação do recente genoma de referência de
Eucalyptus grandis.
Para a identificação em escala genômica de miRNAs em Eucalyptus, foi realizado
um sequenciamento de pequenos RNAs em larga escala em amostras de folha e xilema em
desenvolvimento nas duas principais espécies plantadas do gênero – E. grandis e E.
globulus. Com o objetivo de otimizar o processo de descoberta de locos de pequenos
RNAs, as amostras de folha e xilema de E. grandis usadas no sequenciamento foram da
mesma árvore BRASUZ1, usada no sequenciamento do genoma de referência de
Eucalyptus. O sequenciamento permitiu, além da descoberta de pequenos RNAs, uma
análise da variabilidade interespecífica pelo mapeamento das sequências de ambas as
espécies contra o genoma de E. grandis.
A caracterização in silico das sequências obtidas com o sequenciamento obedeceu a
uma sequência de passos iniciada pela busca, por similaridade de sequência, visando a
identificação de sequências de miRNAs de famílias conservadas em outras espécies e já
descritas anteriormente. Em seguida, a identificação de potenciais novos miRNAs
obedeceu a uma sequência de critérios já descritos. As sequências de pequenos RNAs
foram mapeadas fisicamente no genoma identificando assim os potenciais locos dos genes
MIR e permitindo a validação in silico pela análise da estrutura secundária compatível com
os parâmetros de precursores, satisfazendo a primeira premissa para a validação de um
novo miRNA.
1
Os números totais obtidos mostram claramente a cautela que deve existir na análise
de dados de sequenciamento de pequenos RNAs. Dentre os grandes números obtidos, parte
é representada por contaminantes como RNA ribossômico e de cloroplasto. Dentre os
pequenos RNAs regulatórios, diferentes classes e subclasses estão representadas e os
critérios para declarar uma sequência de pequeno RNA como um miRNA devem ser
cuidadosamente observados.
A validação experimental das sequências de potenciais novos miRNAs foi,
inicialmente, realizada via northern blot de algumas das sequências mais expressas em
cada uma das amostras sequenciadas. Uma validação em larga escala foi realizada
utilizando um microarranjo contendo milhares das sequências putativas de miRNAs
descobertas no sequenciamento. Além da análise interespecífica, foram utilizadas amostras
de tecidos distintos – folha, xilema, ovário e plântulas – visando uma análise da
variabilidade de expressão entre tecidos.
A predição de alvos para os candidatos a novos miRNAs foi realizada in silico
buscando por sequências que apresentem complementariedade às sequências dos miRNAs
utilizando o banco de transcritos de Eucalyptus disponível publicamente no site que
hospeda os genomas sequenciados pelo JGI (phytozome.net).
A análise dos dados de sequenciamento em larga escala revelou aspectos
interessantes do repertório de pequenos RNAs. Sequências de 21 nucleotídeos altamente
expressas nas amostras sequenciadas foram caracterizadas como pequenos RNAs
interferentes (siRNAs) secundários, ou trans-acting siRNAs (tasi-RNAs), sintetizados em
fase a partir da clivagem de transcritos alvo por miRNAs. A identificação de alvos desses
tasiRNAs revelou um mecanismo conservado de regulação da expressão de genes
envolvidos na defesa contra patógenos, notadamente, os da família caracterizada pelos
domínios protéicos NBS-LRR (NB-ARC – leucine rich repeat), e de genes da família PPR
(pentatricopeptide repeat).
2
ABSTRACT
A decade ago function of another class of regulatory elements called micro RNAs –
miRNAs – was elucidated. Initially described as post-transcriptional regulators involved in
development, these elements had been proved to regulate a wide range of processes such as
germination, morphology and responses to biotic and abiotic stress. The description of
miRNAs in Eucalyptus contributes to scientific knowledge of this important and vast genre
inserting another important element in the annotation of Eucalyptus grandis reference
genome.
For genome wide identification of Eucalyptus miRNAs, large scale sequencing was
performed in leaves and developing xylem in the two most planted species for cellulose
production - E. grandis and E. globulus. In order to optimize the discovery process of
small RNAs loci, samples of E. grandis leaf and xylem used were from the same tree
BRASUZ1, used for the reference genome. Interspecific analysis was conducted based on
mapping of the sequences from both species against the genome of E. grandis.
In silico characterization started by searching for sequence similarity against
miRBase conserved miRNAs. The identification of potential new miRNA sequence
followed the criteria already described. Sequences of small RNAs derived from large-scale
sequencing were mapped against the genome thereby identifying potential MIR loci and
enabling validation by in silico analysis of secondary structure compatible with miRNA
precursor parameters satisfying the first premise for the validation of a new miRNA.
Total number of sequences obtained clearly shows that caution must exist in small
RNA sequencing data analysis. Great part of sequences is represented by contaminants
such as ribosomal and chloroplast RNA. Among the small regulatory RNAs, different
classes and subclasses are represented and the criteria for declaring a sequence of small
RNA as a miRNA should be carefully observed.
Experimental validation of potentially new miRNA sequences was first performed
via northern blot of some of the more expressed sequences in each of the samples. A largescale validation was then performed using a microarray containing thousands of sequences
3
of putative miRNAs discovered in sequencing. Besides interspecific analysis, samples
from different tissues - leaf, xylem, ovary and seedlings – were used to evaluate tissue
variability.
Target prediction for putative new miRNAs was performed in silico. A search for
complementary sequences to the miRNAs was performed using Eucalyptus transcript
database publicly available on the website that hosts the genomes sequenced at JGI
(phytozome.net).
Data analysis from large scale sequencing revealed interesting aspects of small
RNAs repertoire. Highly expressed 21 nucleotide sequences were characterized as small
interfering RNAs (siRNAs), or trans-acting siRNAs (tasi-RNAs), synthesized in phase
from cleavage of transcripts targeted by miRNAs. Identification of targets for these
tasiRNAs revealed a conserved mechanism regulating the expression of genes involved in
defense against pathogens, especially those from the family characterized by NBS-LRR
protein domains (NB-ARC - leucine rich repeat) and PPR gene family (pentatricopeptide
repeat).
4
INTRODUÇÃO
O GÊNERO EUCALYPTUS
Reconhecida como a oitava maior família das angiospermas, a família Myrtaceae
possui distribuição, predominantemente, no Hemisfério Sul (Grattapaglia, Vaillancour et
al., 2012). Suas árvores ou arbustos apresentam grande diversidade na região tropical,
especialmente na América do Sul, Austrália e Ásia tropical, com ocorrências na África e na
Europa. A família é comumente encontrada em muitos dos hot spots de biodiversidade do
mundo, como o sudoeste da Austrália, o Cerrado e a mata Atlântica no Brasil, onde até 90
espécies de Myrtaceae podem ser encontradas por hectare – muitas destas ainda não
descritas (Govaerts, Sobral et al., 2008). Um grande número de espécies da família tem
importância ecológica e econômica. Os óleos essenciais são um produto economicamente
importante, extraído das folhas de espécies de Eucalyptus por destilação a vapor.
Melaleuca alternifolia tem uma elevada concentração de um agente ativo antimicrobiano e
antiinflamatório. Além de vários óleos perfumados, como o de Corymbia citriodora e
componentes mentolados do eucalipto. Algumas espécies de Myrtaceae são frutíferas
como goiaba, Psidium guajava, que é provavelmente a fruta mais cultivada. Pitanga
(Eugenia uniflora), jabuticaba (Myrciaria cauliflora) e jambo (Syzygium malaccense) são
outros exemplos de frutas regionais importantes (Wilson, 2011). Muitas espécies são
reconhecidas como uma fonte valiosa de madeira, especialmente aquelas do gênero
Eucalyptus.
O gênero Eucalyptus é nativo da Austrália e ocorre desde regiões de alta
pluviosidade a semi-áridas, desde o nível do mar a grandes altitudes e tem ampla
distribuição geográfica com predominância no hemisfério sul (Ladiges, Udovicic et al.,
2003). São árvores perenes de vida longa que constituem o gênero florestal mais plantado
no mundo (Ladiges, Udovicic et al., 2003), excedendo 20 milhões de hectares na última
avaliação oficial da FAO (Fao, 2007). O Brasil ocupa o primeiro lugar como produtor e
exportador de polpa de celulose no mercado internacional. Em 2007, 50% de toda a polpa
de celulose de fibra curta negociada no mundo era derivada de Eucalyptus e espera-se que,
5
até 2.020, atinja 60% desse total O eucalipto é, portanto, uma cultura florestal de grande
impacto econômico e social. É um gênero chave na produção de polpa de celulose, energia
na forma de carvão e fonte de madeira sólida para construção e movelaria com
produtividade e qualidade crescente. É interessante destacar que, no Brasil, produtos de
base florestal são, majoritariamente, provenientes de florestas plantadas. Papel e celulose
tem 100% de sua produção derivada de florestas plantadas e carvão, 68% (Silvicultura,
2003), o que constitui importante papel de floresta de substituição preservando florestas de
espécies nativas.
As espécies de Eucalyptus tem hábito predominantemente alógamo (Moran, J et al.,
1989; Gaiotto, Bramucci et al., 1997) e apresentam, em geral, forte depressão por seleção
contra endogamia (Potts e Savva, 1988). Hibridização interespecífica é observada em
populações naturais (Pryor e Johnson, 1971; Griffin, Burgess et al., 1988) e esta
característica é explorada com sucesso no melhoramento genético em países tropicais onde
se aproveita a variação genética natural para crescimento, adaptação e propriedades da
madeira entre espécies para consolidar caracteres complementares em clones híbridos
(Assis, 2000).
O gênero Eucalyptus possui mais de 700 espécies descritas, a maioria pertencente
ao subgênero Symphyomyrtus. Grande parte das espécies plantadas comercialmente
pertence a três seções deste subgênero como Eucalyptus grandis e E. urophylla (seção
Latoangulatae), E. globulus (seção Maidenaria) e E. camaldulensis (seção Exsertaria)
(Grattapaglia e Kirst, 2008). E. globulus é uma espécie de climas temperados e se distingue
das demais espécies, mais comumente usadas em ambiente tropicais, por sua excelente
qualidade da madeira em termos de densidade e qualidade de fibras representando uma
importante fonte de variação genética atualmente explorada em híbridos interespecíficos.
A espécie é reconhecida por possuir a melhor combinação de propriedades químicas e
físicas para produção de papel e celulose dentre as espécies comercialmente plantadas de
Eucalyptus (Grattapaglia, 2004). Contudo, sua origem em regiões de clima temperado faz
com que tenha crescimento lento e pouca adaptabilidade em regiões tropicais. Nestes
ambientes e em regiões subtropicais, E. grandis é a espécie mais adotada, o que fez desta a
espécie florestal mais amplamente plantada em nível mundial. A possibilidade de
6
hibridização entre espécies dentro do gênero permite a introgressão de alelos para
caracteres de interesse a partir de diferentes espécies para E. grandis. Notadamente,
experimentos de hibridização com E. globulus em programas de melhoramento florestal
em regiões tropicais tem gerado híbridos com excelente combinação de adaptabilidade e
qualidade superior da madeira (Grattapaglia, 2004).
7
PEQUENOS RNAS
A existência de RNAs não codificadores, ou que não codificam proteínas, além de
RNA transportador e RNAs ribossômicos, é conhecida há, aproximadamente, duas décadas
(Lee, Feinbaum et al., 1993). A sua existência e importância não eram reconhecidas,
provavelmente, por não se enquadrarem no fluxo do Dogma Central da Biologia.
Entretanto, desde a sua descoberta, abriu-se uma nova e fascinante fronteira nas pesquisas
biológicas pelo estabelecimento de sua participação fundamental nos processos de
regulação dos componentes do Dogma Central. Regiões do genoma consideradas inativas
ou sem função, o então chamado “DNA lixo”, na verdade, mostraram ser locais de
atividade considerável de pequenos RNAs.
A regulação via pequenos RNAs (small RNAs – sRNAs) adiciona mais um
componente ao vasto repertório celular de mecanismos de regulação da expressão gênica.
À medida que novos sRNAs são caracterizados, avança o entendimento dos mecanismos
que governam a expressão gênica e da atuação destes elementos regulatórios e seus alvos
em diversos processos biológicos. Apesar de uma fração destes elementos apresentarem
alta conservação desde plantas terrestres primitivas, a alta taxa evolutiva observada faz
com que grande parte do repertório regulatório de pequenos RNAs seja espécie ou
linhagem específica.
Estudos iniciais em A. thaliana, utilizando tecnologias de sequenciamento em
massa, revelaram que o componente de pequenos RNAs do genoma e seu papel regulatório
é maior e mais complexo do que previamente relatado (Wang, Reyes et al., 2004).
Portanto, a identificação e caracterização de novos pequenos RNAs, incluindo micro
RNAs (miRNAs) e pequenos RNAs interferentes (siRNAs), para diferentes espécies é o
primeiro passo para a compreensão destes mecanismos de regulação da expressão gênica.
8
MOTIVAÇÃO
Após o desenvolvimento de vários projetos de investigação da porção funcional de
genomas e da redução de custo do sequenciamento, milhares de sequências gênicas das
mais diversas espécies já foram descritas e estão disponíveis em bancos públicos. O que se
observa é que grande parte das sequências gênicas de espécies filogeneticamente próximas
é conservada, especialmente, aquelas relacionadas a funções fisiológicas básicas, como
desenvolvimento.
No gênero Eucalyptus, particularmente, a experiência gerada no âmbito do Projeto
Genolyptus (Grattapaglia, 2004) com o sequenciamento de ESTs (Expressed Sequence
Tags) e fragmentos de genes de cerca de seis espécies distintas mostra altíssima
conservação entre sequências codificadoras. A alta similaridade observada nas sequências
gênicas das enzimas envolvidas na via de lignificação, por exemplo, no banco de dados de
sequências expressas do projeto Genolyptus, bem como em bases de ESTs de diferentes
espécies florestais e mesmo de Arabidopsis, corrobora esta observação. Acredita-se,
portanto, que boa parte da ampla variação fenotípica intra e interespecífica observada no
gênero seja decorrente, principalmente, de regulação da expressão gênica mais do que
polimorfismos em sequências codificadoras e, portanto, em sequências protéicas,
reforçando a relevância do estudo destas moléculas.
A descrição de miRNAs do gênero Eucalyptus é uma contribuição para o
conhecimento científico na área desses componentes regulatórios do gênero e de grande
relevância para análises comparativas com outras espécies florestais e plantas modelo
como Arabidopsis thaliana e Populus trichocarpa. Além disso, espera-se que novas
sequências, potencialmente específicas do gênero Eucalyptus, sejam descritas. Os
conhecimentos assim gerados poderão, futuramente, servir às mais diversas áreas onde a
composição química e qualidade da madeira se fazem relevantes: indústrias de papel e
celulose, produção de carvão vegetal, como fonte de energia renovável, na construção
civil, indústria moveleira e na potencial utilização de lignina e celulose como biomassa
para produção de etanol (Lynd, Laser et al., 2008).
9
Além disso, com o recente sequenciamento do genoma de referência de Eucalyptus
grandis, a identificação e mapeamento de pequenos RNAs, especialmente miRNAs,
contribui com a anotação do genoma caracterizando esses pequenos elementos regulatórios
de papel fundamental para a homeostase genômica, desenvolvimento, adaptação a
variações ambientais e defesa contra patógenos.
O foco central desta tese envolve, portanto, uma análise ampla do genoma
contribuindo para o conhecimento científico de novos elementos regulatórios
identificando, em larga escala, pequenos RNAs, especialmente micro RNAs, em espécies
plantadas do gênero Eucalyptus.
10
OBJETIVOS E METAS
O objetivo geral deste trabalho foi realizar uma análise genômica ampla para a
identificação e caracterização de pequenos RNAs nas duas principais espécies plantadas do
gênero Eucalyptus e realizar a anotação de miRNAs no genoma de Eucalyptus grandis.
Para tanto, foram executadas diferentes etapas experimentais, listadas a seguir:
 Anotação de genes de miRNAs no genoma de E. grandis
 Descoberta experimental de pequenos RNAs de E. grandis e E.
globulus via sequenciamento em larga escala
 Análise da variabilidade interespecífica da expressão de miRNAs
entre as duas principais espécies comercialmente plantadas de
Eucalyptus
 Descoberta computacional de potenciais novos miRNAs de
Eucalyptus por análise da estrutura secundária dos precursores a
partir da sequência flanqueante no genoma
 Desenvolvimento de um microarranjo para validação experimental
em larga escala de miRNAs em Eucalyptus
 Identificação in silico de mRNAs alvo de regulação pelos miRNAs
identificados
11
CAPÍTULO I
Descoberta e análise da variabilidade inter -específica de pequenos
RNAs por sequenciamento em larga escala em Eucalyptus sp.
12
REVISÃO BIBLIOGRÁFICA
PEQUENOS RNAS NÃO CODIFICADORES
Em 1990, Jorgensen e colaboradores (Napoli, Lemieux et al., 1990) procederam a
introdução de um gene homólogo de Chalcona sintetase (CHS) em petúnia, visando
aumentar a expressão desta enzima limitante na produção de antocianinas, compostos
flavonóides responsáveis em grande parte pela coloração de flores. Com a superexpressão
do gene, a expectativa era que a coloração das flores se tornasse mais intensa. No entanto,
o efeito foi justamente o oposto, com uma dramática redução (de até 50 vezes) na
expressão do mRNA de CHS, em alguns casos resultando em flores brancas,
completamente sem pigmentação. Apesar de não poder precisar o mecanismo molecular,
os autores sugeriram o envolvimento da metilação de DNA como um fator no
silenciamento da expressão gênica. O mesmo comportamento foi observado no fungo
Neurospora crassa quando foi realizada a transformação por plasmídeos com construções
para dois genes endógenos envolvidos na síntese de carotenóides. Os fenótipos albinos
resultantes indicavam a supressão da expressão gênica por sequências homólogas, sendo
este fenômeno denominado “quelling” (Romano e Macino, 1992).
Nesses casos, ocorreu o silenciamento gênico induzido por transgenes, fenômeno
que na época não tinha as suas bases moleculares compreendidas. O trabalho pioneiro de
Fire e Mello, que lhes rendeu o prêmio Nobel em 2006, mostrou que a injeção de RNA fita
dupla em indivíduos de C. elegans induzia uma potente inibição nos níveis do mRNA
endógeno correspondente, o que não acontecia quando fitas simples, tanto a senso quanto a
anti-senso, eram injetadas (Fire, Xu et al., 1998). Este fenômeno foi denominado de
interferência por RNA (RNAi) e impulsionou as pesquisas para caracterização funcional de
pequenos RNAs silenciadores endógenos.
Ambros e colaboradores descreveram o primeiro micro RNA em Caenorhabditis
elegans (Lee, Feinbaum et al., 1993) que, contudo, só foi reconhecido como uma classe de
regulador de expressão gênica uma década mais tarde (Zhang, Pan et al., 2005).
Demonstrou-se que o loco que controla o tempo de desenvolvimento larval em C. elegans,
13
lin-4, não codificava uma proteína, mas sim produzia um par de pequenos RNAs. Um
deles com cerca de 22 nucleotídeos e outro maior com cerca de 61 nucleotídeos que,
acreditava-se, seria o precursor do menor. Notaram, ainda, que esses pequenos RNAs
apresentavam complementariedade a múltiplas posições na sequência 3´UTR (untranslated
region ou região não-traduzida) do gene lin-14, região anteriormente proposta como
mediadora da repressão de lin-14 pelo produto do gene lin-4. A investigação deste
mecanismo de regulação mostrou que a redução nos níveis da proteína lin-14 produzidos
não era acompanhada por uma redução no nível do RNA mensageiro (mRNA) transcrito.
Todas essas informações corroboram o modelo onde o RNA lin-4 se liga à região 3´UTR
do mRNA de lin-14 reprimindo a sua tradução, como parte dos mecanismos que iniciam a
transição do primeiro para o segundo estágio larval (Bartel, 2004). Desde então, o RNA
lin-4 é reconhecido como o primeiro membro da classe de pequenos RNA regulatórios
denominados micro RNAs – miRNAs.
Pequenos RNAs dirigem silenciamento gênico transcricional e pós-transcricional e,
assim, modulam os transcritomas eucarióticos e, consequentemente, as proteínas traduzidas
a partir destes (Jones-Rhoades, Bartel et al., 2006; Mallory e Vaucheret, 2006;
Rajagopalan, Vaucheret et al., 2006). A edição da revista Nature Genetics de junho de
2006 foi inteiramente dedicada aos miRNAs, tratando o tema como uma “Micro revolução
na Biologia”. A repercussão acerca do tema chegou à imprensa popular, sendo tema de
capa da revista The Economist, que anunciou pequenos RNAs como o “Big Bang da
Biologia” (Matranga e Zamore, 2007).
Desde então, esta classe de moléculas vem sendo estudada com o objetivo de se
compreender sua participação na regulação da expressão gênica em diversas espécies
animais e vegetais. Estas moléculas atuam regulando negativamente a expressão de seus
RNAs mensageiros alvo por diferentes mecanismos, seja em nível transcricional, por
metilação de DNA e, consequente, alteração da cromatina, ou pós-transcricional, pela
degradação do mRNA alvo ou repressão de sua tradução (Voinnet, 2009). Além da
contribuição para diversos aspectos da Biologia básica, pequenos RNAs silenciadores vêm
sendo utilizados como novas ferramentas genéticas para a biotecnologia e melhoramento
genético de espécies vegetais (Frizzi e Huang, 2010; Osakabe, Kajita et al., 2011).
14
Em humanos, a literatura relacionada a miRNAs é vastíssima e destaca-se,
especialmente, o papel de miRNAs na pluripotência de células tronco (Anokye-Danso,
Snitow et al.; Pfaff, Moritz et al.), no desenvolvimento de diversos tipos de câncer (Kunej,
Godnic et al., 2012; Nikitina, Urazova et al., 2012), de doenças auto-imunes como lúpus
eritromatoso (Amarilyo e La Cava, 2012) e cardiovasculares (D'alessandra, Pompilio et al.,
2012; Papageorgiou, Tousoulis et al., 2012). Após a observação que miRNAs são
secretados, podem ser translocados e apresentam alta estabilidade conferida por
microvesículas (Zhu, Xia et al., 2012), miRNAs passaram a ser sugeridos como
marcadores circulantes para diagnóstico de doenças como câncer e doenças
cardiovasculares (Corsini, Bronte et al., 2012; Wan, Wang et al., 2012; Zen e Zhang,
2012).
PEQUENOS RNAS EM PLANTAS
Em plantas, os pequenos RNAs silenciadores compreendem os micro RNAs
(Bartel, 2004) e várias classes de pequenos RNAs interferentes (siRNAs) (Rajagopalan,
Vaucheret et al., 2006). Ambos são pequenos RNAs não codificadores, de 20 a 24
nucleotídeos, responsáveis por silenciamento de alvos, sejam RNA ou DNA, por
complementariedade de sequência. A distinção entre estas duas classes é fundamental para
o melhor entendimento de sua função biológica e identificação de novos elementos em
espécies ainda inexploradas neste sentido. Essencialmente, estas diferem na sua biogênese
e nos componentes efetores recrutados para sua atividade (Axtell, Westholm et al., 2011;
Axtell, 2013).
MiRNAs são componentes regulatórios endógenos transcritos por RNA polimerase
II na forma de um precursor primário (pri-miRNA) fita simples poliadenilada e com uma
estrutura secundária em alça (foldback) característica com pareamento parcial. O
processamento do pri-miRNA dá origem a um precursor intermediário (pre-miRNA) em
stem loop, que é clivado por um endonuclease Dicer like 1 (DCL1) dando origem ao
duplex miRNA-miRNA* (Voinnet, 2009; Axtell, 2013). O miRNA maduro, fita simples, é
15
integrado a um complexo protéico de silenciamento induzido por RNA (RISC – RNA
induced silencing complex), ligando-se a uma proteína da família argonauta (usualmente
AGO1, mas também AGO 2 ou 7) e será responsável pelo direcionamento deste ao ácido
RNA mensageiro alvo por complementariedade de sequência (Voinnet, 2009; Axtell,
2013).
SiRNAs podem ter origem endógena, transcritos a partir de regiões repetitivas
(inverted repeats), elementos transponíveis e transcrição bidirecional, ou exógena, a partir
de transgenes ou RNA viral (Tang, 2010; Axtell, 2013). Os siRNAs são processados a
partir de precursores de RNA fita dupla, totalmente complementares (Carthew e
Sontheimer, 2009) e clivados por uma endonuclease Dicer like (DCL) DCL2 ou 3 (Axtell,
2013). O direcionamento do siRNA maduro ao ácido nucléico alvo se dá pela ligação a
uma proteína AGO4 (Axtell, 2013).
MiRNAs de animais e plantas apresentam alguns pontos distintos na sua biogênese
e nas enzimas envolvidas no processamento de seus precursores (Ambros, Lee et al., 2003;
Bartel e Chen, 2004; Cuperus, Fahlgren et al., 2011). Destaca-se o fato de, em plantas,
existir complementariedade quase perfeita (com poucos erros de pareamento – 1 a 3,
normalmente) entre o miRNA e seu mRNA alvo que, usualmente, apresenta um único sítio
de ligação (Baumberger e Baulcombe, 2005; Cuperus, Carbonell et al., 2010). Em animais,
os mRNAs alvo, em geral, possuem múltiplos sítios de ligação ao miRNA com
complementariedade parcial (Carthew e Sontheimer, 2009). A implicação funcional dessas
características é que, em plantas, o principal, embora não único, mecanismo de regulação
por miRNAs é a degradação dos alvos (Addo-Quaye, Eshoo et al., 2008; Mallory,
Elmayan et al., 2008) e, em animais, é a repressão da tradução e desestabilização do
transcrito (Carthew e Sontheimer, 2009; Voinnet, 2009). A complementariedade parcial
entre o miRNA e o mRNA alvo observada em metazoários, supostamente, colabora para o
grande número de alvos para um miRNA observados nestas espécies, ao contrário do que
ocorre em plantas.
A regulação por miRNAs pode, também, ocorrer em nível transcricional,
silenciando um loco alvo no genoma por metilação. Esse mecanismo foi, inicialmente,
16
descrito no musgo Physcomitrella patens e, até então, não se sabia se era um mecanismo
conservado em plantas (Voinnet, 2009; Khraiwesh, Arif et al., 2010). Contudo, a
descrição, em arroz, de uma subclasse de miRNAs de 24 nucleotídeos mediando a
metilação de DNA nos seus locos alvo em trans sugere que este seja uma via de regulação
gênica conservada e de origem antiga (Wu, Zhou et al., 2010). Assim como siRNAs,
miRNAs de 24 nucleotídeos são processados por DCL3 e associados a AGO4. Contudo,
além de origens distintas, siRNAs de 24 nucleotídeos são conhecidos por silenciar alvos
por metilação de alvos em cis ou locos muito similares, ao contrário, de miRNAs (Wu,
Zhou et al., 2010). O mecanismo de metilação de DNA dirigida por RNA (RNA directed
DNA methylation – RdDm) foi, inicialmente, associado exclusivamente a siRNAs com
função de silenciamento de transposons e manutenção de estabilidade do genoma. RdDm é
uma marca epigenética dinâmica responsável pelo silenciamento transcricional de locos
alvo com papel relevante também em imprinting e regulação gênica durante
desenvolvimento e resposta a estresse abiótico (Chinnusamy e Zhu, 2009).
A plasticidade da regulação da expressão via miRNAs vai além da simples redução
da expressão dos níveis de tradução de uma proteína. Esses pequenos RNAs podem
atenuar flutuações do mRNA alvo e influenciar variações temporais (Voinnet, 2009).
Mecanismos de regulação por feedback parecem ser comuns na manutenção de miRNAs
(Baulcombe, 2004). Isto pode permitir um mecanismo fino de regulação da expressão dos
genes alvo e, consequentemente, também das proteínas codificadas pelos genes alvo
(Schwab, Palatnik et al., 2005).
A clivagem de mRNAs alvo por miRNAs parece ser um mecanismo típico de
processos que necessitem regulação permanente como na embriogênese e no
desenvolvimento de meristemas. Por outro lado, a repressão da tradução de um transcrito
alvo seria um mecanismo de maior flexibilidade que permite aumentar ou diminuir a
expressão de um determinado gene, por exemplo, em resposta a estresses, voltando à
condição padrão após o estímulo. Além disso, estes mecanismos não são, necessariamente,
mutuamente exclusivos e podem dar maior versatilidade aos circuitos regulados por
miRNAs (Voinnet, 2009).
17
Vários trabalhos mostram a importância de miRNAs em processos tão
fundamentais como crescimento, desenvolvimento, florescimento e resposta a estresse
biótico e abiótico (Bartel, 2004; Lu, Sun et al., 2005; Sunkar, Girke et al., 2005; Ko, J.H.,
Prassinos, C. et al., 2006; Chen, 2009). Em Arabidopsis, grande parte dos genes alvo de
miRNAs conhecidos codificam proteínas com papel descrito, ou sugerido, no controle do
desenvolvimento. O papel crucial da regulação por miRNAs no desenvolvimento já foi
claramente comprovado em animais e plantas (Kidner e Martienssen, 2005; Chen, 2009;
2012). A observação, em mutantes com síntese de miRNA alterada, mostra anormalidades
no padrão e morfologia de folhas e flores, no desenvolvimento do sistema vascular, na
separação de órgãos, redução da fertilidade e perda do meristema apical (Axtell e Bartel,
2005; Zhang, Zou et al., 2010; Arif, Fattash et al., 2012; Varkonyi-Gasic, Lough et al.,
2012).
O impacto da regulação gênica por miRNAs no desenvolvimento pode ser
exemplificada pela participação do miR156 na determinação da transição de fase
vegetativa e da floração. MiR156 silencia fatores de transcrição SPL (squamosa promoter
binding protein like) que são responsáveis pela manutenção das características fenotípicas
juvenis em plantas. MiR156 é abundante em plântulas e sua expressão diminui conforme a
planta atinge a fase adulta, enquanto miR172 exibe um padrão exatamente oposto (Wu e
Poethig, 2006; Wu, Park et al., 2009; Zhang, Zou et al., 2010; Wang, Park et al., 2011).
SPL9 e, possivelmente SPL10, ativam miR172 responsável pela determinação de
características adultas ao reprimir seus alvos (Wu, Park et al., 2009). A super-expressão de
miR156 causa o prolongamento da expressão de caracteres juvenis e floração
extremamente tardia (Schwab, Palatnik et al., 2005; Wu e Poethig, 2006; Wang, Schwab et
al., 2008).
Apesar de a expressão de miRNAs ser tempo e tecido dependente, estes podem ser
translocados e atuar em células diferentes da sua origem (Voinnet, 2005b; Dunoyer, Schott
et al., 2010; Molnar, Melnyk et al., 2010). Este mecanismo foi também observado para
siRNAs que podem ser translocados a maiores distâncias que miRNAs e formar um
gradiente de silenciamento importante, por exemplo, para determinação de polaridade de
folhas (Chitwood, Nogueira et al., 2009; Schwab, Maizel et al., 2009). Apesar de,
18
inicialmente, se acreditar que miRNAs não pudessem ser translocados entre células,
estudos recentes mostram que estes podem atuar como sinais intercelulares em plantas
(Gursanscky, Searle et al., 2011).
DESCOBERTA DE MIRNAS EM PLANTAS
Apesar de locos de genes MIR estarem presentes nos genomas de plantas, animais e
vírus, as suas sequências não são conservadas entre estes, evocando a possibilidade de que
miRNAs surgiram em dois eventos evolutivamente distintos, provavelmente, a partir de
uma via ancestral de RNA interferente (Matranga e Zamore, 2007; Tarver, Donoghue et
al., 2010). Sugere-se que miRNAs tenham evoluído independentemente em eucariotos
como uma exaptação da maquinaria de biossíntese comum (Tarver, Donoghue et al.,
2010). Contudo, dentro dos reinos, vários miRNAs parecem ter uma origem comum como
se pode inferir pela conservação entre miRNAs de Arabidopsis, arroz e até mesmo de
algumas briófitas (Kidner e Martienssen, 2005). Dentre as famílias de miRNAs já descritas
em plantas, 21 parecem ser universais em angiospermas (Axtell e Bowman, 2008). Sete
destas são altamente conservadas sendo encontradas até em plantas terrestres primitivas
como Selaginella e Physcomitrella (Axtell, Snyder et al., 2007). A descoberta de miRNAs
na alga unicelular Chlamydomonas reinhardtii sugere ainda que a origem de miRNAs em
plantas remonte à origem dos eucariotos fotossintéticos (Matranga e Zamore, 2007).
A extensão da conservação de genes MIR e seus transcritos alvo parece ser mantida
em parte, contudo, não exclui algumas variantes entre espécies. Há exemplos de famílias
de miRNAs conservados como miR159 e miR396 que regulam fatores de transcrição MYB
e GRF (growth-regulating factor), respectivamente, mas tiveram alvos não relacionados
validados com grande impacto no desenvolvimento em grupos taxonômicos restritos
(Axtell, 2013).
Por outro lado, sugere-se que a maior parte das famílias de genes MIR não seja
conservada, sejam únicas dentro de uma espécie ou entre espécies relacionadas (Cuperus,
Fahlgren et al., 2011; Jones-Rhoades, 2012; Axtell, 2013). MiRNAs linhagem ou espécieespecíficos já foram descritos, por exemplo, em Arabidopsis, arroz, Populus,
19
Physcomitrella patens, Pinus taeda, Medicago truncatula, trigo e sorgo (Arazi, TalmorNeiman et al., 2005; Lu, Tej et al., 2005; Lu, Sun et al., 2005; Sunkar, Girke et al., 2005;
Rajagopalan, Vaucheret et al., 2006; Fahlgren, Howell et al., 2007; Jin, Li et al., 2008;
Morin, Aksay et al., 2008; Wang, Chen et al., 2011; Wei, Yan et al., 2011; Zhang, Zheng
et al., 2011). Sugere-se que a taxa de surgimento e desaparecimento de genes de miRNAs
não conservados seja alta, facilitada pelo tamanho e simples arquitetura dos genes MIR, e
que estes estejam relacionados à regulação de processos sob alta pressão seletiva como
relacionados à defesa contra patógenos e isolamento reprodutivo (Rajagopalan, Vaucheret
et al., 2006; Tang, 2010; Jones-Rhoades, 2012). Não é raro que novos miRNAs não
tenham alvos identificados ou talvez reconheçam o alvo por um mecanismo ainda não
elucidado, o que não permite a compreensão de sua função biológica. Considera-se que os
miRNAs mais recentes tenham distribuição filogenética restrita e que sejam
evolutivamente mais sujeitos a alterações (Jones-Rhoades, 2012). O seu processamento, a
partir do precursor é heterogêneo, são expressos em menor quantidade e codificados por
locos únicos. Sugere-se que possam ser (Jones-Rhoades, 2012) transientes e não funcionais
(Fahlgren, Montgomery et al., 2006; Fahlgren, Howell et al., 2007; Fahlgren, Jogdeo et al.,
2010; Cuperus, Fahlgren et al., 2011).
A utilização de sequenciamento em larga escala, especialmente na plataforma
Illumina, permitiu uma amostragem mais ampla de miRNAs em várias espécies (Morin,
Aksay et al., 2008; Ding, Zhang et al., 2009; Martinez, Forment et al., 2011; Schreiber, Shi
et al., 2011; Song, Liu et al., 2011; Wang, Chen et al., 2011; Wei, Yan et al., 2011;
Lertpanyasampatha, Gao et al., 2012; Wang, Huang et al., 2012), levando à descoberta de
novos genes, até então desconhecidos (Breakfield, Corcoran et al., 2011). Inicialmente, a
descoberta de miRNAs por clonagem e sequenciamento Sanger levou à descoberta dos
miRNAs mais abundantemente expressos que, em sua maioria, compõem as famílias de
miRNAs conservados. A obtenção de sequências com tecnologias de larga escala permitiu
a detecção de sequências raras, expressas em menor quantidade e ainda aquelas específicas
de um tecido, estágio ou condição, predominantemente, de origem mais recente (Voinnet,
2009). Nos últimos anos, a aplicação crescente de tecnologias de sequenciamento em larga
escala tem se provado extremamente útil na descoberta e caracterização de pequenos
20
RNAs nas mais diversas condições como, por exemplo, estresse biótico e abiótico,
desenvolvimento de sementes e de flor (Kulcheski, De Oliveira et al., 2011; Song, Liu et
al., 2011; Wang, Chen et al., 2011; Wang, Huang et al., 2012). E em diversas espécies
como soja, pepino, cevada, trigo, sorgo, cedro chinês, maçã e pêssego (Kulcheski, De
Oliveira et al., 2011; Martinez, Forment et al., 2011; Schreiber, Shi et al., 2011; Yao e
Sun, 2011; Zhang, Zheng et al., 2011; Wan, Wang et al., 2012; Xia, Zhu et al., 2012;
Zhou, Song et al., 2012; Zhu, Xia et al., 2012).
Uma abordagem alternativa para a identificação de novos genes MIR para espécies
com o genoma conhecido é a estratégia in silico (Allmer e Yousef, 2012). Mesmo com
extensiva cobertura de sequenciamento, alguns genes MIR não são identificados devido a
baixos níveis de expressão ou padrões particulares de expressão em tecidos ou estágio de
desenvolvimento. Assim, metodologias experimentais não são capazes de identificar todo o
repertório de pequenos RNAs expressos em uma mesma amostra. A disponibilidade de
sequências completas de genomas abre a possibilidade de se utilizar de uma varredura
ampla buscando regiões com estrutura secundária compatíveis com precursores de
miRNAs (Thakur, Wanchana et al., 2011; Xuan, Guo et al., 2011; Tempel e Tahi, 2012).
MIRNA EM ARBÓREAS
Espécies arbóreas têm como principais diferenciais a formação de madeira, o
tamanho e a característica perene que determina a necessidade de lidar com variações
extremas de clima, de estresse biótico e abiótico, aspectos, sabidamente, controlados por
miRNAs (Khraiwesh, Zhu et al., 2011; Kruszka, Pieczynski et al., 2012). A compreensão
dos mecanismos relacionados a respostas a estresse se torna imprescindível, especialmente,
em um momento de grandes alterações climáticas e do potencial risco de aumento da
suscetibilidade a patógenos. Assim como grande parte dos estudos de função de miRNAs
em plantas, vários experimentos com miRNAs em árvores foram desenvolvidos
relacionados com desenvolvimento e condições de estresse (Osakabe, Kajita et al., 2011;
Sun, Shi et al., 2011).
21
Atualmente, dentre as espécies de plantas representadas no banco de dados público
de micro RNAs, miRBase (versão 19, agosto de 2012) (Kozomara e Griffiths-Jones, 2011),
são poucos os exemplos de espécies arbóreas. Além de maçã (Xia, Zhu et al., 2012) e
Citrus (Song, Fang et al., 2009; Song, Wang et al., 2010; Song, Yu et al., 2012),
representados neste banco, foram realizados experimentos de descoberta in silico e por
sequenciamento em pêssego, potencial modelo para a família Rosaceae (Eldem, Celikkol
Akcay et al., 2012; Zhang, Bai et al., 2012).
Entre os representantes de espécies florestais no miRBase estão Hevea brasiliensis
(28 miRNAs maduros) (Gebelin, Argout et al., 2012), Acacia mangium e A. auriculiformis
(3 e 7 miRNAs, respectivamente) (Wong, Cannon et al., 2011; Ong e Wickneswari, 2012),
as coníferas Pinus taeda (38 miRNAs) (Lu, Sun et al., 2007), Pinus densata (31 miRNAs)
(Wan, Zhang et al., 2012) e Picea abies (41 miRNAs) (Yakovlev, Fossdal et al., 2010). A
espécie florestal mais bem representada é a espécie modelo para árvores Populus
trichocarpa, que teve seu genoma completo publicado em 2006 (Tuskan, Difazio et al.,
2006), com cerca de 370 sequências de miRNAs maduros. A descoberta de miRNAs foi,
recentemente, relatada pela primeira vez em uma espécie da família Myrtaceae, Eugenia
uniflora, com a identificação de 25 miRNAs conservados e 17 novos (Guzman, Almerao et
al., 2012).
Alguns processos biológicos já tiveram a regulação por miRNAs confirmada
experimentalmente. A regulação da transição de fase vegetativa, por exemplo, é regulada
por miR156 e seus alvos da família SPL, anteriormente mostrada em Arabidopsis (Wu e
Poethig, 2006), mostrou-se ser um mecanismo regulatório extensamente conservado, desde
plantas herbáceas anuais a perenes, após ser identificado em híbridos de Populus (Wang,
Park et al., 2011).
Experimentos com mutações de ganho de função em A. thaliana envolvendo genes
de fatores de transcrição HD-Zip classe III (homeo domain leucine-zipper) mostraram que
estes são importantes na formação do meristema e diferenciação do câmbio e que sua
expressão é regulada por miRNAs. A partir destas informações, a expressão do gene
PtaHB1, homólogo a um HD-Zip de A. thaliana, e a expressão do miRNA Pta-miR166,
22
foram descritas como sendo inversamente correlacionadas, associadas ao desenvolvimento
de xilema secundário – madeira – e reguladas ao longo do desenvolvimento da planta e das
estações do ano em um híbrido de Populus tremula x Populus Alba (Ko, J.H., Prassinos, C.
et al., 2006). Também em Populus, o uso de miRNA artificial e mutações no sítio de
ligação ao miR166 de ortólogos de HD-Zip classe III mostraram lignificação anormal (Du,
Miura et al., 2011), anormalidades no crescimento primário e secundário, na formação de
câmbio e reversão da polaridade do tecido vascular (floema interior ao xilema)
(Robischon, Du et al., 2011).
Com o objetivo de buscar expressão diferencial em xilema secundário (madeira) de
Acacia mangium, foi realizado sequenciamento em larga escala de pequenos RNAs de
árvores com conteúdo de lignina contrastantes onde 12 famílias de miRNAs conservados e
82 candidatos foram identificados (Ong e Wickneswari, 2012).
A identificação de pequenos RNAs em coníferas sugere que angiospermas e
gimnospermas possuam mecanismos distintos de biossíntese. Ao contrário de
angiospermas, a classe predominante de pequenos RNAs em gimnospermas é a de 21
bases. Gimnospermas não possuem a enzima DCL3, envolvida no processamento de
siRNAs de 24 nt. Em contrapartida, foi identificada uma nova isoforma dessa enzima. A
relação entre siRNAs de 24 bases e silenciamento transcricional por metilação pode estar
relacionada com silenciamento de sequências redundantes, de grandes famílias gênicas, de
regiões duplicadas do genoma em angiospermas e a baixa expressão desta classe em
gimnospermas sugere um potencial mecanismo para a evolução dos seus grandes genomas
(Ahuja e Neale, 2005).
Pela relevância, já demonstrada, da participação de miRNAs na regulação da
expressão gênica e com o sequenciamento do genoma de referência de Eucalyptus grandis,
este trabalho se propõe a identificar miRNAs novos e conservados de Eucalyptus, recurso
ainda inexistente para o gênero, colaborando com a anotação do referido genoma e para o
conhecimento científico deste vasto gênero.
23
METODOLOGIA
MATERIAL BIOLÓGICO
As amostras utilizadas no experimento de sequenciamento em larga escala de
pequenos RNAs foram de árvores adultas. Xilema em desenvolvimento e folhas de E.
grandis (árvore BRASUZ 1, cujo genoma foi sequenciado para geração da referência) e
xilema em desenvolvimento de E. globulus indivíduos A2 e C3. As amostras utilizadas na
validação por northern blot incluem folhas e xilema em desenvolvimento de árvores
adultas coletadas na coleção de espécies de Eucalyptus do horto da Universidade Católica
de Brasília (E.grandis, E. dunnii, E. urophylla) (Figura 1) e mudas de oito meses de idade
das demais espécies do gênero Eucalyptus. Para estudos de conservação entre diferentes
taxa da família Myrtaceae foram utilizadas amostras de dezoito espécies sendo oito delas,
espécies do gênero Eucalyptus:
1. Eucalyptus grandis
2. Eucalyptus botryoides
3. Eucalyptus brassiana
4. Eucalyptus dunnii
5. Eucalyptus globulus
6. Eucalyptus pellita
7. Eucalyptus resinifera
8. Eucalyptus urophylla
9. E. urophylla X E.grandis (híbrido)
Espécies de outros gêneros incluíram:
1. Corymbia citriodora
2. Melaleuca lateritia
3. Campomanesia pubescens (gabiroba)
4. Syzygium malaccense (jambo roxo)
24
5. Syzygium cumini (jamelão)
6. Eugenia uniflora (pitanga)
7. Eugenia calycina (pitanga do cerrado)
8. Psidium guajava (goiaba)
9. Psidium sp. (araçá)
10. Eugenia dysenterica (cagaita)
Amostras de Glycine max (soja), Oryza sativa (arroz), Pinus taeda e Solanum
lycopersicum (tomate) foram usadas como grupos externos. Folhas completamente
desenvolvidas foram utilizadas para minimizar a variação de expressão de pequenos
RNAs.
As amostras utilizadas na validação via microarranjo foram:
 E. grandis BRASUZ1
folha e xilema em desenvolvimento de árvore adulta
 E. globulus
xilema em desenvolvimento e ovário de árvore adulta
 E. grandis e E. globulus
pool de tecidos de 10 plântulas de 30 dias de idade
25
Figura 1: Árvores de Eucalyptus que forneceram amostras de tecido de folha e xilema em
desenvolvimento para a execução da validação de pequenos RNAs via northern blot: (A) E.
dunnii; (B) E. urophylla e (C) E. grandis – BRASUZ1
26
EXTRAÇÃO DE RNA
A metodologia utilizada para extração de RNA seguiu o protocolo para extração de
RNA de Pinus baseado no método de CTAB (Cetyl Trimethyl Ammonium Bromide)
(Chang, Puryear et al., 1993) com adaptações. Como a precipitação com cloreto de lítio,
incluída no protocolo, favorece a precipitação de RNAs de maior peso molecular,
especialmente RNAs mensageiros, e grande parte dos pequenos RNAs são perdidos nesse
processo e, por isso, essa etapa foi excluída da metodologia.
Esse material foi tratado de formas distintas de acordo com a metodologia a ser
seguida. No caso do sequenciamento em larga escala, a seleção da fração de pequenos
RNAs foi realizada pela empresa Fasteris (Suíça), que realizou o sequenciamento em
plataforma Illumina GA II. Basicamente, a fração de pequenos RNAs é isolada a partir do
RNA total por eluição, a partir de gel de acrilamida desnaturante. Estas moléculas são
ligadas a adaptadores 3´ e 5´ para a síntese de cDNA.
No caso de northern blot, o material extraído, sem tratamento com DNAse, foi
aplicado em gel desnaturante de acrilamida 15%, sem separação prévia de frações.
PROCESSAMENTO DOS DADOS DE SEQUENCIAMENTO
Um
protocolo
computacional
foi
desenvolvido
especificamente
para
o
processamento dos dados de sequenciamento em larga escala. A etapa de préprocessamento filtra as sequências por análise da qualidade, e executa a remoção da
sequência de adaptadores e checagem de contaminantes. As sequências que passam por
esta etapa são, então, agrupadas de acordo com o número de bases, quantificadas e usadas
para criar um grupo de sequências não redundantes. O programa BWA (Li e Durbin, 2009)
foi utilizado para mapear estas sequências contra o genoma de E. grandis (Phytozome
v8.0, disponível em phytozome.net).
A identificação de sequências de miRNAs conservados foi realizada usando
PatMan (Prufer, Stenzel et al., 2008) para busca por similaridade contra o miRBase, versão
27
19 (Griffiths-Jones, Saini et al., 2008), permitindo até três bases não coincidentes
(mismatches) para a validação de uma sequência como nova isoforma.
A busca por mRNAs alvo dos miRNAs foi realizada com o programa psRNATarget
(Dai e Zhao, 2011) que utilizou o banco de transcritos de E. grandis (phytozome 8.0). A
anotação funcional prévia desses transcritos permitiu a inferência de quais as classes de
genes e quais vias metabólicas estão sendo reguladas pelos potenciais miRNAs
identificados. A análise da anotação destes genes alvo, assim como os domínios
apresentados por estes, foram obtidos utilizando a ferramenta BioMart do Phytozome.
VALIDAÇÃO EXPERIMENTAL
A validação experimental foi, inicialmente, realizada por northern blot como
descrito anteriormente (Wu e Poethig, 2006). Para cada amostra, 30 microgramas de ácido
nucleico total (DNA mais RNA), quantificados por espectrofotometria em Nanodrop
(ThermoScientific), foram usados para eletroforese em gel desnaturante de acrilamida 15%
(uréia 8 M) e transferidos para membrana Hybond N+. As sondas utilizadas são
oligonucleotídeos de DNA com a sequência do complemento reverso das sequências
completas dos miRNAs – equivalente ao miRNA*. As sondas foram marcadas com gama
32P ATP e a hibridização realizada a 40°C em tampão de hibridização ULTRAhyb-oligo
(Ambion). As membranas foram lavadas duas vezes em SSC 2X e SDS 0.5% por 30
minutos a 40°C e expostas por, pelo menos, 24 horas.
Uma validação em larga escala de miRNAs foi feita por meio de um experimento
baseado no desenvolvimento e construção de um microarranjo customizado contratado
junto à empresa LC Sciences (USA). Foi utilizado um chip de 30 mil sondas incluindo
controles internos. Todas as sequências de miRNAs maduros de Arabidopsis thaliana do
banco miRBase (versão 18 – novembro de 2011) foram inseridas como sondas no arranjo
para análise de conservação, além de 9.344 sequências obtidas a partir do sequenciamento
de Eucalyptus e de candidatos preditos de novo in silico, provenientes de outro trabalho
(dados não publicados). Sete amostras foram usadas no experimento: xilema e duas
amostras de folha (com morfologia juvenil e adulta) de E. grandis BRASUZ1 – todas as
28
amostras coletadas de uma mesma árvore simultaneamente; xilema e ovário de E.
globulus; e um pool de tecidos de 10 plântulas de 30 dias de idade de E. grandis e um
outro pool de igual constituição porém de E. globulus.
A normalização dos dados de cada ponto no arranjo foi realizada incluindo
controles internos inseridos pela empresa, as triplicatas técnicas de cada sequência e pela
subtração do background da fluorescência.
29
RESULTADOS E DISCUSSÃO
SEQUENCIAMENTO DE PEQUENOS RNAS
ANÁLISE GERAL DE SEQUÊNCIAS
A identificação e caracterização de miRNAs em Eucalyptus foi realizada com o
objetivo de dar suporte à anotação do genoma de E. grandis. O sequenciamento em larga
escala de pequenos RNAs (smRNA-Seq) foi usado como ferramenta para a descoberta de
miRNAs. A partir do grande número de dados gerados no sequenciamento, procedeu-se a
identificação e caracterização dos miRNAs. Após o pré-processamento, as sequências
únicas de pequenos RNAs foram usadas para uma avaliação de sequência de critérios antes
de declarar uma sequência como miRNA. Esses critérios incluem o mapeamento no
genoma e a predição da estrutura secundária a partir da sequência genômica flanqueante
utilizando o programa miRDeep (Friedlander, Mackowiak et al., 2011). A predição de
transcritos alvo, utilizando o programa psRNAtarget (Dai e Zhao, 2011). E, finalmente, a
validação experimental via northern blot e, em larga escala, via microarranjo.
O smRNA-Seq foi realizado utilizando a plataforma Illumina GA II. As quatro
bibliotecas utilizadas são provenientes de E. grandis (folha e xilema) e E. globulus
(xilema) conforme descrito na metodologia. Cada uma das quatro amostras seguiu o
protocolo padrão de construção de bibliotecas indicado pelo fabricante, com adaptadores
únicos ligados a cada uma como códigos de barra. A corrida foi realizada com todas as
bibliotecas em uma canaleta (lane) de uma célula de sequenciamento (flowcell) utilizando
os kits Illumina para sequenciamento single-end com 36 bases por leitura. No total, foram
obtidas 6.104.498 leituras (reads) que constituíram o ponto de partida para uma análise
computacional com diversas etapas de processamento.
Os dados brutos de sequenciamento foram pré-processados de forma a excluir
sequências com baixa qualidade, sequências sem adaptadores e sequências de RNA
ribossômico (rRNA), transportador (tRNA) e de cloroplasto – e realizar a contagem de
sequências únicas, descartando a redundância (Tabela 1). A identificação de sequências de
30
rRNA, tRNA e RNA de cloroplasto mostrou que estas correspondem, em média, a cerca de
1,8% das sequências únicas obtidas para cada amostra.
Tabela 1: Contagens e porcentagens de sequências geradas e analisadas no experimento de
sequenciamento em larga escala com a plataforma Illumina GAII. São apresentados os números
totais de sequências geradas, o número de sequências descartadas por não apresentarem sequências
de adaptadores, o número total de sequências submetidas à análise, o número de sequências únicas,
o número de sequências únicas após a remoção de sequências de rRNA, tRNA e RNA de
cloroplasto (contaminantes) e o número de sequências únicas mapeadas no genoma.
Amostra
E. grandis
folha
E. grandis
xilema
E. globulus A2
E. globulus gloC3
Total
Total de sequências
geradas
1.484.867
(100%)
1.766.355
(100%)
1.737.872
(100%)
1.115.404
(100%)
6.104.498
(100%)
Sequências sem
adaptadores
34.652
(2,3%)
70.813
(4,0%)
34.066
(2,0%)
21.774
(1,9%)
161.305
(2,6%)
Número total de
sequências
submetidas à análise
1.450.215
(97,7%)
1.695.542
(96%)
1.703.806
(98,0%)
1.093.630
(98,1%)
5.943.193
(97,4%)
Número de
sequências únicas
283.375
(19,1%)
402.158
(22,8%)
789.762
(45,4%)
505.663
(45,3%)
1.980.958
(32,5%)
Número de
sequências após
remoção de
contaminantes
265.579
(17,9%)
377.958
(21,4%)
754.898
(43,4%)
476.080
(42,7%)
1.874.515
(30,7%)
Após o pré-processamento, as sequências foram divididas em categorias de
tamanho. Como esperado, a distribuição das sequências apresenta dois picos em 21 e 24
bases em todas as amostras. Destaca-se o fato de que, na análise comparativa, a fração de
31
24 bases apresenta-se maior em todas as quatro amostras (Figura 2), chegando a ser 3,75
vezes maior que a categoria de 21 bases na amostra de xilema da árvore BRASUZ1 de E.
grandis. Pequenos RNAs de 24 bases são, predominantemente, siRNAs envolvidos em
metilação de DNA dirigida por RNA em locos complementares do genoma, resultando em
silenciamento gênico e de transposons (Voinnet, 2009). Este é um padrão comum em
angiospermas, que apresentam maior abundância de pequenos RNAs de 24 nucleotídeos.
Curiosamente, gimnospermas, ao contrário, não apresentam essa classe de pequenos
RNAs. A ausência da enzima DCL3 (Dicer like 3), responsável pelo processamento de
pequenos RNAs de 24 nucleotídeos, explicaria a ausência desses elementos no grupo
(Dolgosheina, Morin et al., 2008; Morin, Aksay et al., 2008).
Porcentagem de sequências
60%
50%
40%
BR1-folha
30%
BR1-xilema
20%
gloA2
gloC3
10%
0%
19
20
21
22
23
24
25
26
Tamanho (nt)
Figura 2: Distribuição da porcentagem de sequências, em diferentes classes de tamanho em
nucleotídeos (nt), nas quatro amostras sequenciadas: xilema de E. grandis BRASUZ1
(BR_xilema), folhas de E. grandis BRASUZ1 (BR_folhas), xilema de E. globulus A2 (glo_A2) e
xilema de E. globulus C3 (glo_C3).
32
Em termos de contagem do número total de sequências entre as classes de tamanho,
verifica-se que a fração de 21 bases contem representantes com alta redundância, o que
pode ser um indicativo de maior nível de expressão. É possível observar que, dentre as
sequências de 21 bases, várias apresentam menos de dez leituras (reads) repetidas no
sequenciamento enquanto algumas poucas sequências se destacam muito em relação à
quantidade, passando de 50.000 leituras repetidas. Já as sequências de 24 bases, embora
apresentem, praticamente, todas as sequências com menos de 100 repetições, mostram um
marcante destaque na diversidade de grupos com sequências distintas.
Este padrão pode ser melhor observado no gráfico de perfil de agrupamento de
sequências (cluster profile), onde os grupos de sequências únicas são ordenados pela sua
redundância (Figura 3). Nesta figura, observa-se que, para todas as amostras, a classe de 24
nt é a que apresenta a maior diversidade de sequência, o que é uma característica comum
em plantas, onde o repertório de pequenos RNAs é dominado por uma vasta diversidade
destes siRNAs (Voinnet, 2009). Em termos de número de leituras por sequência,
consistentemente observa-se que algumas sequências de 21 nt possuem níveis de
redundância muito superiores a vasta maioria das outras classes, um indicativo de que está
sendo detectada a intensidade de expressão inerente ao seu papel biológico. Nas amostras
de xilema, também se observa que algumas classes de sRNAs, principalmente de 22 nt,
apresentam alguns grupos com mais de 1.000 leituras, e sua identidade e implicação
funcional serão descritos adiante.
O número de sequências únicas de todas as quatro amostras totalizou 1.857.986. Os
números por classe de tamanho podem ser observados na Tabela 2 onde se destaca, mais
uma vez, a diversidade de sequências de 24 nucleotídeos.
Tabela 2: Número total de sequências únicas por classe de tamanho consolidando os dados de todas
as amostras sequenciadas.
Tamanho
(bases)
20
21
22
23
24
Número de
sequências
45.411
169.661
94.027
125.499
1.230.102
33
Figura 3: Gráfico do perfil de agrupamento (cluster profile) de sequências com classificação dos
grupos pelo número de sequências. O número de grupos de sequências únicas (eixo x) e o número
de sequências no grupo (eixo y) são plotados separadamente por classe por tamanho (nt).
Distribuição por amostras: E. grandis BRASUZ1-folhas (BR1-folha), E. grandis BRASUZ1xilema (BR1- xilema), xilema de E. globulus A2 (gloA2) e xilema de E. globulus C3 (gloC3)
34
SEQUÊNCIAS MAIS ABUNDANTES
A análise das sequências de 21 bases mais abundantes em busca de potenciais
novos miRNAs revelou aspectos interessantes. Foram identificados, como esperado,
vários miRNAs conservados como miR159, miR160, miR166, miR172 e miR396. Parece
consenso na literatura que os miRNAs mais expressos são os conservados, envolvidos em
funções básicas como crescimento e desenvolvimento (Rajagopalan, Vaucheret et al.,
2006; Cuperus, Fahlgren et al., 2011).
A análise comparativa das sequências de 21 nucleotídeos mostrou que o miR159 é
a sequência de sRNA mais expressa. Na amostra de folha de E. grandis BRASUZ1, o
euc_miR159a representa 40% do total de sequências únicas (Figura 4A). Em xilema de E.
grandis BRASUZ1 e de E. globulus C3 (Figura 4B e D), miR159a também foi a
sequência mais expressa com 10,5% e 18,2% do total, respectivamente. Em E. globulus
A2, embora o miRNA mais expresso seja miR172, miR159 é o segundo mais expresso
com cerca de 7% (Figura 4C).
A sequência do euc_miR159a de Eucalyptus apresenta 100% de identidade com
os ortólogos de Arabidopsis thaliana, Glycine max e Populus trichocarpa (Figura 5A).
Em destaque no alinhamento, a primeira base, na extremidade 5´, de todos os miR159,
sendo uma uracila, condição tida como preferencial para a ligação do miRNA à proteína
argonauta 1 (AGO1) do complexo de silenciamento (Mi, Cai et al., 2008; Montgomery,
Howell et al., 2008).
Em A. thaliana, foi observada alta expressão de miR159 em folhas e a expressão
não foi detectada em caule (Park, Li et al., 2002). Ao contrário, em árvores de um ano de
idade de Populus trichocarpa, miR159 foi altamente expresso em xilema em
desenvolvimento e pouco em folha (Lu, Sun et al., 2005). Estudos com mutantes de
miR159, em A. thaliana, sugerem que a falta regulação de genes de fatores de transcrição
MYB por miR159 diminua a proliferação celular (Alonso-Peral, Li et al., 2010).
A predição de alvos para este miRNA em Eucalyptus, utilizando o programa
psRNAtarget e o banco de dados de transcritos de E. grandis disponível no Phytozome
(versão 9.0), resultou em 10 transcritos preditos (Tabela 3). Dentre estes, estão dois
35
transcritos com domínio MYB – Eucgr.G03183.1 e Eucgr.E01581.1, seguindo a
nomenclatura gênica encontrada no banco Phytozome. Uma busca por transcritos
similares usando o BLAST (Altschul, Madden et al., 1997) contra o banco não
redundante de nucleotídeos do NCBI, mostrou similaridade com um transcrito predito
como MYB de Vitis vinifera (XM_002275810.2). O alinhamento par a par desses
transcritos mostra a conservação do sítio de ligação do miR159 que, por sua vez, é fora
do domínio MYB (Figura 5B). Proteínas MYB são conhecidas como uma das principais
classes de fatores de transcrição envolvidas nas vias relacionadas com a formação da
madeira (Zhong, Richardson et al., 2007). A família R2R3 de fatores MYB tem papel
central no controle do metabolismo, especialmente, a síntese de classes específicas de
fenilpropanóides como flavonóides (Stracke, Ishihara et al., 2007), antocianinas (Deluc,
Barrieu et al., 2006) e ligninas (Patzlaff, Mcinnis et al., 2003; Bedon, Grima-Pettenati et
al., 2007). Os resultados de sequenciamento em Eucalyptus apontam para um sistema
altamente regulado entre miR159 e fatores de transcrição MYB. Apesar de não ser
possível precisar exatamente se os membros regulados são os mesmos descritos nos
estudos supracitados, abre-se uma perspectiva para a inserção dos miRNAs no controle
da via biossintética de lignina. A confirmação experimental desses alvos requer
experimentos que confirmem a clivagem do mRNA como por PCR-RACE ou
sequenciamento
de
36
degradoma.
Figura 4: Distribuição de frequência das 15 sequências de pequenos RNAs de 21 nucleotídeos mais abundantes nos dados do sequenciamento, por
amostra: (A) folhas de BRASUZ1 (BR1_folha); (B) xilema de BRASUZ1 (BR1xilema); (C) xilema de E. globulus A2 (glo_A2) e (D) xilema de E.
globulus (glo_C3). MiRNAs conservados são indicados e as demais sequências identificadas pelo código temporário euc__, não tem ortólogos
identificados no miRBase.
37
Figura 5: Conservação das sequências de miR159. (A) Alinhamento do euc_miR159a (euc_sRNA_292109) com os ortólogos de Arabidopsis
thaliana (ath), Glycine max (gma) e Populus trichocarpa (ptc). Em destaque, a primeira base na extremidade 5´ (uracila). (B) Conservação do sítio
de ligação de miR159 em um transcrito de Eucalyptus grandis com domínio MYB-like, predito como alvo pelo programa psRNAtarget, e em um
transcrito
de
fator
de
transcrição
38
GAMYB-like
Vitis
vinifera.
Tabela 3: Transcritos preditos como alvos de euc_miR159a pelo programa psRNATarget. Nome do transcrito segundo o banco Phytozome, E
value (expectation value), modo de inibição predita (clivagem ou bloqueio da tradução), código, nome e descrição do domínio protéico segundo o
banco Pfam.
Nome do transcrito E value
Inibição
ID PFAM
Domínio Protéico
Descrição PFAM
Eucgr.B03766.1
3.0
Clivagem
-
-
-
Eucgr.C02627.1
2.5
Tradução
PF00931
PF00560
PF01582
Domínio NB-ARC
LRR(leucine-rich repeat)
Domínio TIR
apoptose
ligação a proteína
resposta imune inata
Eucgr.E01581.1
2.5
Clivagem
PF00249
Domínio de ligação a DNA Myb-like
Domínio de ligação a DNA
Myb-like
Eucgr.F01065.1
2.5
Clivagem
-
-
-
Eucgr.F01202.1
3.0
Clivagem
-
-
-
Eucgr.F03131.1
3.0
Tradução
PF02990
Proteína 70 endomembrana
integral de membrana
Eucgr.G03183.1
3.0
Clivagem
PF00249
Domínio de ligação a DNA Myb-like
Domínio de ligação a DNA Myblike
39
Nome do transcrito E value
Inibição
ID PFAM
Domínio Protéico
Descrição PFAM
Eucgr.H04493.1
2.5
Clivagem
PF00501
Enzima ligante de AMP
atividade catalítica
Eucgr.J00789.1
2.5
Clivagem
PF02535
transportador ZIP Zinc
transporte de íons metálicos
40
O único caso em que o miR159a não foi a espécie mais abundante ocorreu na
amostra de xilema de E. globulus A2 onde miR172g foi o pequeno RNA de 21 bases com
maior contagem (9%) (Figura 4C). O miR172 está envolvido na transição de fase
vegetativa e na determinação da identidade de órgãos florais, funções conservadas em
mono e dicotiledôneas (Zhu e Helliwell, 2011). Foi mostrado em A. thaliana, Zea mays e,
posteriormente, em árvores – Populus, Acacia e Eucalyptus globulus – que a atividade
sequencial de miR156 e miR172 controlam a transição de fase vegetativa (Wang, Park et
al., 2011). MiR172 também regula o gene AP2 (apetala2) que determina a formação de
sépalas e pétalas em flores. A superexpressão de miR172 em A. thaliana causa um
fenótipo acentuado de florescimento precoce e flores anormais incluindo a ausência de
pétalas, mimetizando o que acontece em mutantes nulos para AP2 (Aukerman e Sakai,
2003).
Dentre as sequências mais expressas algumas são comuns a mais de uma amostra,
como miR166 que tem papel reconhecido na formação de madeira desenvolvimento de
meristema lateral e apical, assim como no desenvolvimento vascular e florescimento (Ko,
J H, Prassinos, C et al., 2006; Jung e Park, 2007; Du, Miura et al., 2011; Robischon, Du
et al., 2011; Zhu, Hu et al., 2011); e miR396, relacionado com divisão celular e
desenvolvimento foliar (Wang, Gu et al., 2011; Mecchia, Debernardi et al., 2012).
A ABUNDÂNCIA DA SEQUÊNCIA NÃO IMPLICA CLASSIFICAÇÃO COMO MIRNA
Como pode ser observado na Figura 4, diversos novos pequenos RNAs
identificados entre as sequências mais abundantes não possuíam ortólogos depositados no
banco miRBase. Alguns destes foram testados experimentalmente, através de northern
blot, para confirmar sua expressão e tamanho de 21 bases. Confirmou-se a expressão e o
tamanho dos sRNAs euc_sRNA_149582, euc_sRNA_75850, euc_sRNA_438131,
euc_sRNA_33215 e euc_sRNA_372867 (Figura 6). Para dar suporte a hipótese de que
estes sejam novos miRNAs utilizou-se o genoma de referência de E. grandis para extrair
uma região de aproximadamente 100 bases flanqueando a região genômica onde foram
mapeadas estas sequências. Contudo, a predição da estrutura secundária destas não
41
resultou em uma conformação compatível com precursores de miRNAs (Figura 7), com a
sequência do miRNA maduro presente no braço de um stem loop (Meyers, Axtell et al.,
2008).
Um exemplo desses pequenos RNAs com alta expressão é o pequeno RNA
euc_sRNA_438131, não conservado em outras espécies, que tem como alvos preditos um
fator de transcrição da família GRAS e transcritos envolvidos com resistência a doenças
contendo os domínios protéicos TIR-NBS-LRR (Tabela 4). Euc_sRNA_9757 tem como
alvos preditos transcritos com domínio KH de ligação a RNA e euc_sRNA_372867 tem
um
único
alvo
predito,
com
o
42
mesmo
domínio
KH.
Figura 6: Northern blot de pequenos RNAs de Eucalyptus destacados pela alta contagem nos dados de sequenciamento. para E. dunnii 140 – folha,
E. dunnii 140 – xilema, E. dunnii 178 – folha, E. dunnii 178 – xilema, E. urophylla 99 – folha, E. urophylla 99 – xilema, E. urophylla 122 –
folha,
E.
urophylla
122
–
xilema,
E.
grandis
BRASUZ1
43
a
–
folha
e
E.
grandis
BRASUZ1
b
–
folha.
Figura 7: Exemplos de estruturas secundárias preditas para pequenos RNAs de 21 bases com alta contagem no sequenciamento, mapeadas no
genoma mas sem estrutura compatível com precursores de miRNAs. As sequências dos pequenos RNAs euc_sRNA_33215, euc_sRNA_372867 e
euc_sRNA_149582
estão
destacadas
44
em
amarelo.
Tabela 4: Transcritos preditos como alvos do pequeno RNA de Eucalyptus euc_sRNA_438131. Nome do transcrito, número do cromossomo onde
se encontra o loco correspondente, E value (expectation value), modo de inibição predita (clivagem ou bloqueio da tradução), código do domínio
protéico no PFAM e sua descrição.
Nome do gene
Cromossomo
Eucgr.B00380
scaffold_2
Eucgr.B00685
Eucgr.D02129
E value
Inibição
ID PFAM
Descrição PFAM
3.0
Tradução
PF00069
Domínio proteína kinase
scaffold_2
3.0
Clivagem
PF00560
LRR (Leucine Rich Repeat)
scaffold_4
2.0
Clivagem
PF00320
GATA zinc finger
45
Nome do gene
Cromossomo
Eucgr.E01049
scaffold_5
Eucgr.E03125
Eucgr.E03126
Eucgr.E03335
Inibição
ID PFAM
Descrição PFAM
3.5
Clivagem
PF00010
Domínio de ligação a DNA hélice-loop-hélice
scaffold_5
3.5
Clivagem
PF00560
Leucine Rich Repeat
PF00931
Domínio NB-ARC
scaffold_5
3.5
Clivagem
PF00560
LRR (Leucine Rich Repeat)
PF01582
Domínio TIR
PF00931
Domínio NB-ARC
PF00560
LRR (Leucine Rich Repeat)
scaffold_5
E value
3.5
Clivagem
46
Nome do gene
Cromossomo
Eucgr.E03840
scaffold_5
Eucgr.G02940
E value
Inibição
ID PFAM
Descrição PFAM
3.0
Tradução
PF00069
Domínio proteína kinase
scaffold_7
2.5
Clivagem
PF03514
Fator de transcrição – família GRAS
Eucgr.K00971
scaffold_11
2.0
Clivagem
PF00023
Repetição Ankyrin
PF01453
Lectina ligante de D-mannose
Eucgr.K01839
scaffold_11
3.0
Clivagem
PF00069
Domínio proteína kinase
47
ANÁLISE COMPARATIVA DA ABUNDÂNCIA
Diferenças quantitativas na abundância de miRNAs podem ser observadas pela
comparação par a par do número de sequências contrastando intra especificamente
(xilema de E. globulus A2 e C3), inter especificamente (xilema de E. grandis e E.
globulus) e entre tecidos do mesmo indivíduo (xilema e folhas de E. grandis). Os
resultados revelaram que os repertórios de pequenos RNAs mais similares são, como
esperado, das amostras intra-específicas derivadas do mesmo tecido – xilema de duas
árvores de E. globulus – e os mais diversos, entre tecidos distintos – folha e xilema – do
mesmo indivíduo (Figura 8). A análise da expressão diferencial entre tecidos mostra que
cerca de 36% dos miRNAs conservados observados em cada tecido são mutuamente
exclusivos e aqueles presentes em ambas as amostras variam em quantidade em até duas
vezes (p-value<=0.05). Estes resultados corroboram os dados da literatura que citam a
ocorrência de expressão diferencial de miRNAs entre espécies, tecido e tempo de
desenvolvimento (Morin, Aksay et al., 2008; Wang, Liu et al., 2011; Wei, Yan et al.,
2011; Chen, 2012).
Apesar da indicação de expressão diferencial, o presente experimento não foi
especificamente desenhado para tal propósito, pela falta de réplicas amostrais adequadas.
Para análise comparativa dos dados seria necessário haver réplicas técnicas e as amostras
deveriam ser de mesma idade, coletadas em um mesmo ambiente de modo a minimizar as
variáveis influenciando a expressão de pequenos RNAs. Embora não possamos usar os
dados de sequenciamento quantitativamente, os resultados da análise par a par é
consistente com o padrão de expressão esperado. Abre-se assim a possibilidade para um
estudo futuro dos sRNA diferencialmente expressos.
48
Figura 8: Comparação par a par do número de sequências (escala log) entre amostras de: (A)
xilema de duas árvores de E. globulus (gloA2 e gloC3); (B) entre xilema de E. globulus (gloA2) e
de E. grandis BRASUZ1; (C) entre tecidos (folha e xilema) de E. grandis BRASUZ1.
MAPEAMENTO CONTRA O GENOMA DE REFERÊNCIA
As 1.857.986 sequências únicas de pequenos RNAs foram mapeadas no genoma
de referência (Phytozome versão 9.0) utilizando o programa BWA (Li e Durbin, 2009).
Os resultados do mapeamento revelaram uma variação no número de sequências
mapeadas por amostra entre 67,2% a 87,3% (Tabela 5).
Tabela 5: Resultados do mapeamento de sequências únicas de pequenos RNAs no genoma de E.
grandis usando o programa BWA por amostra analisada.
Amostra
BR1- folha
BR1- xilema
E. globulus A2
E. globulus C3
Total de seq.
265.579
377.958
754.898
476.080
Sequências
mapeadas
231.893
(87,3%)
327.580
(86,7%)
507.430
(67,2%)
321.403
(67,5%)
49
As amostras de E. grandis BRASUZ apresentam maior número (em média 20%
maior) de sequências mapeando contra o próprio genoma em comparação a ambas as
amostras de E. globulus. Este resultado indica a existência de variabilidade
interespecífica na fração de pequenos RNAs do genoma, consistente com a variabilidade
de conteúdo genômico total entre as duas espécies. Ainda assim, a proporção de
sequências mapeadas de E. globulus contra o genoma de E. grandis mostra a forte
conservação de pequenos RNAs no gênero.
Os dados consolidados de mapeamento das sequências de todas as classes de
tamanhos (19 a 26 bases) revelam a tendência de mapeamento de pequenos RNAs em
regiões repetitivas (Tabela 6). Pela natureza dos pequenos RNAs não codificadores de 24
nucleotídeos, que silenciam, predominantemente, transposons e regiões repetitivas
(Voinnet, 2009), espera-se que estes mapeiem, mais frequentemente, em regiões
repetitivas que as demais classes. Um exemplo do mapeamento em regiões repetitivas por
classe de tamanho pode ser observado na Figura 9 que ilustra a amostra de xilema E.
grandis BRASUZ1. Pode ser observado, contudo, que o mapeamento em regiões
repetitivas é consistentemente maior para todas as classes de tamanho. O mesmo
comportamento foi observado para as outras amostras.
Tabela 6: Dados de mapeamento de sequências de pequenos RNAs, por amostra, em regiões não
repetitivas e repetitivas.
E. grandis BR1 - E. grandis BR1 folha
xilema
E. globulus
A2
E. globulus
C3
Sequências mapeadas
231.893
(100%)
327.580
(100%)
507.430
(100%)
321.403
(100%)
Mapeadas em regiões
não repetitivas
69.376
(29,9%)
133.262
(40,7%)
181.046
(35,7%)
112.914
(35,1%)
Mapeadas em
regiões repetitivas
162.517
(70,1%)
194.318
(59,3%)
326.384
(64,3%)
208.489
(64,9%)
50
140000
Número de sequências
120000
100000
80000
regiões repetitivas
60000
regiões não repetitivas
40000
20000
0
19
20
21
22
23
24
25
26
Tamanho (nt)
Figura 9: Número de sequências mapeadas, por classe de tamanho em nucleotídeos (nt), em
regiões repetitivas e não repetitivas da amostra de xilema de E. grandis BRASUZ1.
Analisando os dados de mapeamento, por amostra, das sequências de 21 e 24
nucleotídeos, isoladamente, nota-se que o grande número de sequências de 24
nucleotídeos representadas nos dados de sequenciamento se confirma no mapeamento,
mostrando que, de fato, essa é a classe mais diversa de pequenos RNAs (Tabela 7).
Tabela 7: Resultados do mapeamento de sequências únicas de pequenos RNAs de 21 e 24
nucleotídeos, por amostra, contra o genoma de E. grandis usando o programa BWA.
Amostra
BR1- folha
BR1- xilema
E. globulus A2
E. globulus C3
21 nt
24.942
(9,3%)
23.419
(6,2%)
47.805
(6,3%)
37.391
(7,8%)
24 nt
163.798
(61,4%)
237.389
(62,8%)
346.968
(45,9%)
200.457
(42,1%)
51
FAMÍLIAS CONSERVADAS DE MIRNAS
Uma das primeiras tarefas em relação à anotação funcional dos genes de miRNAs
é a busca por ortólogos de miRNAs conservados em outras espécies. Além de uma
validação quanto à anotação do gene, também podem ser inferidas as suas funções,
potencialmente, conservadas.
Foi realizada uma busca por miRNAs conservados, por similaridade, com todas as
sequências únicas de pequenos RNAs de 20 a 22 bases de todas as amostras do
sequenciamento, totalizando 379.085, usando o programa PatMan (Prufer, Stenzel et al.,
2008). A busca foi realizada contra todas as sequências de miRNAs maduros do banco
miRBase (versão 19 – agosto de 2012). Um total de 470 miRNAs de 21 nucleotídeos (nt)
e 69 miRNAs de 22 nt de Eucalyptus apresentaram similaridade com uma sequência
ortóloga no miRBase, permitindo até três diferenças de bases no alinhamento (Tabela 8
52
Tabela 8). Os miRNAs de 21 nt conservados com total identidade em relação ao
miRBase totalizam 95 isoformas pertencentes a 25 famílias de miRNAs (Tabela 9)
(dados completos no Anexo I). Relaxando a estringência do alinhamento, foram
observadas 35 famílias de genes MIR com até uma base de diferença e, com três
diferenças, 74 famílias. Ressaltando que as sequências que não apresentam 100% de
identidade, ou seja, com 1 a 3 diferenças de bases, representam variação espécieespecífica nas famílias conservadas. Dentre os miRNAs de 22 nt, os 16 com 100% de
identidade correspondem a 11 famílias de miRNAs e os 23 com uma base distinta, a 15
famílias. Sequências de miRNAs de 22 nucleotídeos não são comuns ou abundantes
como as de 21 bases mas são reconhecidas como uma importante subclasse de miRNAs.
53
Tabela 8: Número de sequências de pequenos RNAs de 21 e 22 nucleotídeos (nt) de Eucalyptus
com identidade e similaridade com isoformas de miRNAs do banco miRBase (versão 19) com 0 a
3 bases de diferença.
Número de sequências
Diferenças(nt)
0
1
2
3
Total
21 nt
95
115
111
149
470
22 nt
16
23
30
69
Dentre as famílias de miRNAs conservadas que tiveram isoformas com 100% de
identidade detectadas nos dados de sequenciamento de Eucalyptus, diversas tem um
número relevante de relatos indicando a sua função, como esperado para miRNAs
conservados em processos básicos como desenvolvimento, morfologia, reprodução e
imunidade. Por exemplo, o miR164 está envolvido na determinação da morfologia de
folhas (Nikovics, Blein et al., 2006), o miR319 é crítico para o crescimento de pétalas e
desenvolvimento (Nag, King et al., 2009), e os miR160 e miR398 estão relacionados com
imunidade (Zhang, Zou et al., 2010; Zhu, Ding et al., 2011).
54
Tabela 9: Famílias de miRNAs conservados com isoformas com identidade de 100% confirmada
nos dados de sequenciamento em larga escala de Eucalyptus com base em busca por similaridade
contra o miRBase.
Famílias de miRNAs de 21 nt identificadas no smRNA-Seq de Eucalyptus
miR156
miR164
miR171
miR393
miR399
miR157
miR166
miR172
miR395
miR477
miR159
miR167
miR2111
miR396
miR479
miR160
miR168
miR319
miR397
miR535
miR162
miR169
miR390
miR398
miR858
COMPATIBILIDADE ESTRUTURAL
Dados da literatura até hoje indicam a existência de algumas centenas de genes de
miRNAs em genomas de plantas. Isso implica que a grande maioria das sequências
obtidas em experimentos de smRNA-Seq não correspondem a miRNAs, mas sim outras
classes de pequenos RNAs. Para a correta caracterização destes elementos, foram
observados diversos critérios estabelecidos (Meyers, Axtell et al., 2008). O primeiro
critério é a presença da sequência do miRNA maduro no braço de uma estrutura em stem
loop do precursor, de onde deve ser excisado pela enzima DCL1. Neste aspecto, a
disponibilidade do genoma completo de E. grandis BRASUZ1 ofereceu as condições
ideais para que se realizasse uma busca computacional ampla para verificar a aderência
de cada uma das sequências aos critérios de estrutura secundária do precursor. Em
espécies onde esse recurso não está disponível, a predição da estrutura secundária de
precursores depende de sequências de RNAs expressos (como por exemplo, ESTs –
expressed sequence tags) que, nem sempre, são adequadas e disponíveis para a tarefa.
55
A predição de miRNAs de novo, a partir de dados de sequenciamento, foi
realizada pelo pacote de programas miRDeep (Friedlander, Mackowiak et al., 2011). Em
termos gerais, o programa usa um modelo probabilístico da biogênese de miRNAs para
anotar a compatibilidade da posição e frequência do pequeno RNA sequenciado com a
estrutura secundária do precursor. A partir do mapeamento das sequências do smRNASeq no genoma, a sequência é estendida para incluir cerca de 100 bases flanqueando o
início e o final da região mapeada e utilizada na predição da estrutura secundária do
potencial precursor utilizando o programa RNAFold (Hofacker, 2003). A compatibilidade
da estrutura com um precursor de miRNA e a estabilidade energética são avaliadas.
A partir de um total de 1.405.134 sequências únicas de 21 nucleotídeos mapeadas
no genoma de E. grandis, 178 tiveram estrutura secundária compatível com precursores
primários de miRNAs. Interessante destacar que, diante do grande número de sequências
mapeadas no genoma, apenas uma minoria apresenta a estrutura secundária compatível
(1,3%). O número de estruturas compatíveis preditas por amostra de sequenciamento se
mostrou bastante consistente entre as amostras de xilema de E. globulus – 74 e 73 para E.
globulus A2 e C3, respectivamente. Na amostra de folha de E. grandis foram
identificadas 82 sequências e na de xilema, 55 sequências com estrutura compatível.
Destas, apenas 11 mapeiam em pseudo-moléculas (scaffolds) distintos dos 11 scaffolds
equivalentes aos cromossomos de Eucalyptus. Alguns exemplos de sequências que
atenderam às premissas necessárias para um precursor de miRNA e mapeadas no scaffold
3 são mostrados na Figura 10.
Usualmente, quando se realiza um experimento de smRNA-Seq para descoberta
de miRNAs, existe a tendência de se buscar a identificação dentre as sequências mais
abundantes no sequenciamento. Foi realizada uma inspeção visual das estruturas
secundárias preditas para as 140 sequências com maior contagem no sequenciamento da
amostra de folha de E. grandis e, apenas, 3,5 % destas são compatíveis com precursores
de miRNAs. Destaca-se assim o fato que miRNAs representaram apenas uma pequena
parte dos pequenos RNAs abundantes de 21 nt identificados no experimento e, portanto,
reforça
a
necessidade
da
criteriosa
caracterização
56
de
novos
miRNAs.
Figura 10: Exemplos da estrutura secundária de precursores de miRNAs preditos pelo programa RNAfold a partir de sequências mapeadas no
scaffold 3 do genoma de Eucalyptus grandis mais 130 bases da região flanqueante. Destacado em verde, a sequência do miRNA maduro.
57
PREDIÇÃO DE ALVOS DE REGULAÇÃO POR MIRNAS
Uma característica distintiva de miRNAs é a ligação a mRNAs alvo para exercer a
sua função regulatória. Foi realizada uma busca em larga escala de alvos para todas as
leituras de 21 e 22 nt oriundas do experimento de smRNA-Seq utilizando o programa
psRNATarget (Dai e Zhao, 2011).
Por se tratar de uma predição computacional, optou-se por focalizar na análise
qualitativa das classes funcionais dos alvos. A Tabela 10 mostra que uma vasta gama de
processos biológicos está representada pelos transcritos preditos como alvo. Dentre as
famílias mais abundantemente representadas estão, entre outros, transportadores de íons,
fatores de transcrição de SBP (squamosa binding protein), proteínas da família com
repetição pentatricopetídeo (PPR), sequências com função de genes de resistência à
patógenos da superfamília NBS-LRR (NB-ARC, leucine rich repeat) incluindo a família
TIR-NBS-LRR (Toll Interleukin-like domain, NB-ARC e Leucine Rich Repeats). Os
transcritos preditos como alvo para miRNAs conservados também mostram conservação
entre espécies, como já havia sido relatado para Populus trichocarpa (Tuskan, Difazio et
al., 2006).
Além dos alvos preditos comumente encontrados, confirmando a conservação
também dos alvos de miRNAs, alguns novos incluem transcritos de interesse para a
formação da madeira como celulose sintetases e citocromo P450 envolvidos no
metabolismo de uma série de substratos que podem ser divididos, de maneira geral, em
vias biossintéticas e de detoxificação. Citocromos P450 são catalisadores importantes nas
vias de biossíntese de fenilpropanóides, como antocianinas, hormônios como a giberelina,
ácidos graxos, compostos de defesa como isoflavonóides e terpenos e polímeros estruturais
como ligninas (Schuler e Werck-Reichhart, 2003).
58
Tabela 10: Exemplos de domínios protéicos presentes em transcritos alvo preditos, pelo programa
psRNATarget, para miRNAs de Eucalyptus.
Cromossomo
Início (base)
Fim (base)
Nome do gene
ID Pfam
Descrição PFAM
scaffold_2
5066982
5068746
Eucgr.B00373
PF00249
scaffold_3
38728066
38731008
Eucgr.C02141
PF01582
Domínio TIR
scaffold_3
54096878
54099701
Eucgr.C02857
PF07649
Domínio C1-like
Domínio de ligação
a DNA MYB-like
Domínio de ligação
scaffold_3
54096878
54099701
Eucgr.C02857
PF00130
a ésteres de
Forbol/diacilglicerol
(Domínio C1)
scaffold_3
54096878
54099701
Eucgr.C02857
PF00628
PHD-finger
scaffold_3
77900131
77904149
Eucgr.C04268
PF01582
Domínio TIR
scaffold_3
77900131
77904149
Eucgr.C04268
PF00931
Domínio NB-ARC
scaffold_3
77900131
77904149
Eucgr.C04268
PF00560
scaffold_8
72355247
72364511
Eucgr.H05056
PF03470
Leucine Rich
59
Repeat
Domínio XS zinc
finger
VALIDAÇÃO EXPERIMENTAL - NORTHERN BLOT
Uma confirmação da expressão observada nos dados de sequenciamento foi
realizada por outra metodologia. Essa validação experimental, inicialmente, em pequena
escala para poucos pequenos RNAs por meio de northern blot que, além de permitir a
validação de sua expressão, possibilita uma avaliação do nível de expressão em diferentes
amostras, embora sem um dado quantitativo absoluto ter sido atribuído a estes.
A validação foi realizada, a princípio, em amostras de três espécies de Eucalyptus:
E. dunnii, E. urophylla e E. grandis – todas espécies do subgênero Symphyomyrtus, sendo
a primeira, da seção Maidenaria e as outras duas da seção Latoangulatae. Foram incluídas
amostras de RNA total de xilema e folhas completamente desenvolvidas. Foram utilizadas
duas árvores de E. dunnii (140 e 178), duas árvores de E. urophylla (99 e 122) e dois
clones da árvore E. grandis BRASUZ1, todos coletados no horto da Universidade Católica
de Brasília (Figura 1).
Com exceção de BRASUZ1, com duas amostras de RNA total de folha, os demais
indivíduos tiveram amostras de RNA total de folha e xilema incluídas no experimento
(Figura 11). Essa amostragem permitiu a observação de expressão diferencial, entre
tecidos, de alguns miRNAs como, por exemplo, o miR156, onde a expressão somente foi
observada em amostras de folha. No caso dos novos sRNAs de Eucalyptus, foi possível
observar
maior
expressão
em
amostras
de
folha
para
euc_sRNA_149582,
euc_sRNA_75850 e euc_sRNA_33215. Ainda foi possível observar que, apesar da baixa
expressão de euc_sRNA_438131 em todas as amostras, observou-se sua expressão
diferencial entre tecidos com tendência de maior expressão em folhas.
60
Figura 11: Resultados da validação experimental dos sRNAs e miRNAs descobertos em Eucalyptus
por meio de Northern blot nas amostras de RNA de: E. dunnii árvore 140 – folha, E. dunnii árvore
140 – xilema, E. dunnii árvore 178 – folha, E. dunnii árvore 178 – xilema, E. urophylla árvore
99 – folha, E. urophylla árvore 99 – xilema, E. urophylla árvore 122 – folha, E. urophylla árvore
122 – xilema, E. grandis BRASUZ1 réplica A – folha e E. grandis BRASUZ1 réplica B – folha. Os
miRNAs conservados miR156, miR160 e miR172 foram usados como controles positivos. O
pequeno RNA nuclear snRNA U6 foi usado como controle de carregamento.
Com o objetivo de testar a extensão da conservação dos sRNAs que apresentaram
resultado positivo na validação por northern blot, foi usada uma amostra de RNA total de
61
folha de E. grandis – BRASUZ1, como controle positivo, e amostras de mais duas espécies
da família Myrtaceae. Corymbia citriodora, uma espécie florestal, anteriormente
classificada como sendo do gênero Eucalyptus e Eugenia uniflora (pitanga), árvore
frutífera nativa da América do sul. Na qualidade de grupo externo, membros de famílias
filogeneticamente não relacionadas foram também utilizados no experimento: Glycine max
(soja), Oryza sativa (arroz), Pinus taeda e Solanum lycopersicum (tomate) (Figura 12A).
Destaca-se que a expressão dos sRNAs euc_sRNA_149582 e euc_sRNA_75850 parece ser
específica da família Myrtaceae, e ausente em todos os membros não relacionados
cobrindo uma ampla diversidade filogenética, incluindo mono e dicotiledôneas além de
uma gimnosperma.
Interessante observar que a expressão dos candidatos euc_sRNA_438131,
euc_sRNA_332215 e euc_sRNA_372867 ocorreu, exclusivamente, nas amostras de
Eucalyptus, o que poderia ser um indicativo de siRNAs exclusivos do gênero, já que sua
expressão já havia sido confirmada também em E. dunnii e E. urophylla. Vale destacar que
estes três candidatos estavam entre os 15 mais expressos em todas as quatro amostras
sequenciadas.
A exclusividade de expressão tanto na família quanto, principalmente, no gênero
sugere a presença de sRNAs de origem evolutiva recente, posterior a separação das
diferentes unidades taxonômicas testadas. Para testar tal hipótese, o experimento de
validação incluiu mais seis amostras de diferentes espécies de Eucalyptus – E. botryoides,
E. brassiana, E. globulus, E. pellita, E. resinifera – e um híbrido E. urophylla X E.
grandis, além de outras oito espécies da família Myrtaceae: Psidium sp. (araçá), Psidium
guajava (goiaba), Syzygium cumini (jamelão), Melaleuca lateritia (melaleuca), Eugenia
calycina (pitanga do cerrado), Eugenia dysenterica (cagaita), Campomanesia pubescens
(gabiroba) e Syzygium malaccense (jambo roxo) (Figura 12B). Em cada uma das
membranas, foram hibridizados miRNAs conservados como controles positivos além do
pequeno RNA nuclear U6 como controle de carregamento do gel. Os sRNAs que tiveram a
expressão confirmada nas três espécies de Myrtaceae citadas anteriormente foram testados
e tiveram a expressão confirmada em todas as espécies indicando a descoberta de
sequências, aparentemente, específicas da família. Destaca-se ainda a maior expressão do
62
euc_sRNA_75850 nas espécies de Eucalyptus quando comparada com as demais espécies
da família.
Figura 12: Resultados da validação experimental dos sRNAs descobertos em Eucalyptus por meio
de Northern blot em amostras de RNA de folha de: (A) E. grandis – BRASUZ1, Corymbia
citriodora, Eugenia uniflora, Glycine max, Oryza sativa, Pinus taeda e Solanum lycopersicum; (B)
Eucalyptus botryoides, E. brassiana, E. globulus, E. pellita, E. resinifera, E. urograndis (E.
urophylla x E. grandis), Psidium sp. (araçá), Psidium guajava (goiaba), Syzygium cumini
(jamelão), Melaleuca lateritia (melaleuca), Eugenia calycina (pitanga do cerrado), Eugenia
dysenterica (cagaita), Campomanesia pubescens (gabiroba) e Syzygium malaccense (jambo roxo).
O miRNA conservado miR319 foi usado como controle positivo e o pequeno RNA nuclear snRNA
U6 foi usado como controle de carregamento.
63
Vale destacar que o miR159a (Figura 11), é uma nova isoforma da família miR159
observada em Eucalyptus, com uma base distinta das isoformas miR159a, b e c de Populus
trichocarpa e miR159a de Glycine max e Arabidopsis thaliana (Figura 13). As isoformas
de P. trichocarpa tem a sequência do miRNA maduro idênticas, como observado no
alinhamento. Há alguns exemplos de famílias de miRNA quando as diferenças entre
isoformas estão apenas na sequência do precursor e a sequência do miRNA maduro é
conservada. Embora com menor intensidade, foi observado sinal de hibridização em
espécies filogeneticamente distantes pertencentes a outras famílias (Figura 14),
possivelmente resultante de hibridização cruzada, uma vez que só uma base é distinta das
demais isoformas descritas de miR159. Os resultados indicaram ainda haver uma tendência
de maior expressão do miR159 nas amostras de folha de árvores de Eucalyptus adultas em
relação ao xilema (Figura 11).
Figura 13: Alinhamento múltiplo das sequências de miR159a de G. max (gma), P. trichocarpa
(ptc) e A. thaliana (ath) com a nova isoforma identificada em Eucalyptus (euc_sRNA_171981).
64
Figura 14: Resultados da validação experimental dos miR159a de Eucalyptus por meio de
Northern blot em amostras de RNA de folha de: (A) E. grandis – BRASUZ1, Corymbia citriodora,
Eugenia uniflora, Glycine max, Oryza sativa, Pinus taeda e Solanum lycopersicum; (B) Eucalyptus
botryoides, E. brassiana, E. globulus,E. pellita, E. resinifera, E. urograndis (urophylla x grandis),
araçá, goiaba, jamelão, melaleuca, pitanga do cerrado, cagaita, gabiroba e jambo roxo.
VALIDAÇÃO EXPERIMENTAL – MICROARRANJO
Visando ampliar a validação de expressão de pequenos RNAs, optou-se por adotar
a tecnologia de microarranjo, que pode avaliar, simultaneamente, milhares de candidatos.
Em particular, utilizou-se a tecnologia µParaflo® de biochips microfluídicos que permite
uma identificação direta e específica de miRNAs, com grande sensibilidade (LC
Sciences™) (Zhou, Zhu et al., 2012).
O microarranjo foi construído utilizando diversos candidatos oriundos do
experimento de smRNA-Seq, principalmente sequências de 21 nt que apareceram com
mais de uma contagem em diversas amostras. Além disso, foi incluída uma amostragem de
sequências de 22 e 24 nt com alta contagem de leituras e sequências preditas com
compatibilidade estrutural preditas pelo programa miRDeep (pág. 51). No total, 9.443
sondas distintas foram incluídas no microarranjo cada uma em triplicata, para fornecer
65
robustez estatística na análise de sinal. Além disso, foram incluídas 269 sondas com todos
miRNA descritos para A. thaliana na versão 18 do miRBase.
O principal objetivo deste experimento é a validação da expressão de pequenos
RNAs em uma escala significativamente maior que a possível pela técnica de northern
blot. Isto permite uma melhor mineração entre o grande número de candidatos do smRNASeq como um dos pré-requisitos para a anotação de genes de miRNAs (Meyers, Axtell et
al., 2008).
Para ampliar o potencial de detecção, foram incluídas amostras de outros tecidos,
com programa de expressão significativamente distinto das utilizadas para o smRNA-Seq
(folha e xilema). Três amostras da árvore E. grandis BRASUZ1 foram utilizadas. Duas
amostras de folha em estágios de desenvolvimento distintos, coletadas de um mesmo galho
de árvore adulta foram usadas com o objetivo de observar se haveria variação no repertório
de pequenos RNAs expressos ou se estas funcionariam como réplicas biológicas. Amostra
de xilema foi coletada simultaneamente da mesma árvore. Amostras de xilema e ovário de
árvore adulta de E. globulus foram também utilizados. Ovário foi utilizado por ser um
órgão com expressão distinta daqueles tecidos usados no experimento de descoberta com o
objetivo de observar a extensão dos pequenos RNAs expressos em tecidos diversos. Pool
de 10 plântulas de 30 dias de idade de E. grandis e E. globulus foram também incluídos no
experimento com o intuito de maximizar os tecidos amostrados em uma fase especialmente
ativa de crescimento e desenvolvimento. O desenho do experimento não permite uma
análise de expressão diferencial entre as amostras por falta de réplicas biológicas.
Sumarizando, o foco do experimento de microarranjo é qualitativo e a expectativa é
acumular mais indícios sobre pequenos RNAs que estejam sendo expressos nas condições
testadas e ter uma estimativa mais completa do universo de miRNAs no genoma de E.
grandis.
Com os resultados brutos dos microarranjos foram realizadas análises estatísticas
para verificar se a intensidade de hibridização era acima do background para todas as três
repetições da sonda em pelo menos uma das sete amostras analisadas nos sete
microarranjos. São gerados p-valores para cada sonda e só foram consideradas aquelas
66
com p<0.01. A normalização dos dados de intensidade foi realizada usando método
LOWESS (locally weighted scatterplot smoothing) (Cleveland e Devlin, 1988; Bolstad,
Irizarry et al., 2003) nos dados subtraídos do background. Os números dos resultados
positivos do experimento por amostra, de um total de 9.443 sondas para Eucalyptus e 269
para Arabidopsis thaliana, são mostrados na Tabela 11. A amostra de folha de E. grandis
foi a que mostrou maior número de sondas com sinal significativo de expressão.
O menor número de sondas positivas observadas foi de 440 para a amostra de
ovário de E. globulus e é consistente com o esperado uma vez que a descoberta não foi
realizada neste tecido (mas em folhas e xilema) e, ainda, possivelmente por se tratar de um
tecido com padrão muito específico de expressão.
Dentre todas as sondas, uma média de 6,5% dos novos candidatos a pequenos
RNAs foram validados. Deve ser ressaltado que esta porcentagem refere-se ao número
total de sondas utilizadas o que representa um universo de descoberta e validação de
diversas classes de pequenos RNAs e não especificamente da classe dos miRNAs. Uma
média de 12% das sondas de miRNAs de A. thaliana foram consideradas como positivas
nas amostras de Eucalyptus e reforça a tese de que, embora haja uma extensa conservação
de miRNAs entre plantas mesmo pouco relacionadas filogeneticamente, parte dos miRNAs
expressos é linhagem ou espécie específica (Cuperus, Fahlgren et al., 2011; JonesRhoades, 2012; Axtell, 2013).
Os microarranjos foram também utilizados para validar a descoberta computacional
de novos genes MIR no genoma de E. grandis. Estes candidatos possuem estrutura
secundária compatível com precursores de miRNA e exibem leituras no experimento de
smRNA-Seq. Para um total de 178 sondas derivadas desta predição pelo programa
miRDeep, 14 tiveram sinal significativo identificado no microarranjo em, pelo menos, uma
das amostras (p<=0,01). A busca por mRNAs alvo destes pelo programa psRNATarget,
revelou que todas possuem alvos preditos, que incluem exemplos de fatores de transcrição
das famílias MYB e GRAS, hidrolases, metiltransferases e oxidoredutases. Somando-se ao
fato de não possuírem homólogos identificados no miRBase, ter indicação de expressão
67
(smRNA-Seq e microarranjos) e estrutura secundária, estes se destacam como fortes
candidatos a novos genes MIR em Eucalyptus.
Tabela 11: Números absolutos de sondas de Eucalyptus e Arabidopsis com expressão validada no
experimento de microarranjo para cada uma das sete amostras: ovário de E. globulus (GL_OV);
plântula de E. globulus (GL_PL); xilema de E. globulus (GL_XY); folha juvenil de E. grandis –
BRASUZ1 (GR_L1); folha adulta de E. grandis – BRASUZ1 (GR_L2); plântula de E. grandis
(GR_PL); e xilema de E. grandis (GR_XY).O número total de sonda utilizadas no experimento foi
de 9.443 para Eucalyptus e 269 para Arabidopsis thaliana.
Número de sondas com expressão positiva
Amostra
Eucalyptus
Arabidopsis
GL_OV
440
19
GL_PL
516
27
GL_XY
555
25
GR_L1
786
43
GR_L2
797
45
GR_PL
546
33
GR_XY
641
33
Procurou-se verificar como as diferentes amostras compartilhavam as sequências
expressas de acordo com os resultados do microarranjo. Diagramas de Venn foram
construídos para explorar a expressão das sequências testadas para diversas combinações
de amostras. Primeiramente, a análise de sequências comuns às quatro amostras de E.
grandis, duas amostras de folha (em estágios de desenvolvimento distintos, denominadas
juvenil e adulta), xilema e plântula (Figura 15A). Foram identificadas 61 e 46 sequências
exclusivamente nas amostras de folha, juvenil e adulta, respectivamente, e 97 em comum
entre estas. As quatro amostras apresentaram 449 sequências em comum, 48 exclusivas de
68
xilema e 10 de plântula. A comparação entre as amostras de folha e xilema de E. grandis
mostram 554 sequências comuns (Figura 15B).
A comparação entre os três tecidos de E. globulus mostra 387 sequências comuns,
104 exclusivas de xilema, 50 de plântula e 15 de ovário (Figura 15C). A comparação entre
as amostras de plântulas revelou que as duas espécies tem 447 sequências expressas em
comum, 92 exclusivamente expressas em E. grandis e 59 em E. globulus (Figura 15D).
Esta análise reforça também a tese de que grande parte do repertório de miRNAs é
comum a diferentes tecidos e espécies por estarem relacionados a regulação de vias
comuns associadas a processos como desenvolvimento e manutenção da homeostase do
genoma. A menor parte deste repertório é espécie, tecido e estágio específica. As
alterações específicas de cada tecido, tipo celular e as adaptações a condições específicas
como uma fase de desenvolvimento ou resposta a estresse seriam controladas por essa
fração de pequenos RNAs. A observação das sequências mutuamente exclusivas nas duas
amostras de folhas coletadas simultaneamente em um mesmo galho de uma mesma árvore
de BRASUZ1 mas em estágios de desenvolvimento distintos demonstra um exemplo de
expressão estágio específica.
69
Figura 15: Compartilhamento da ocorrência de sequências validadas de pequenos RNAs no
experimento de microarranjo entre: (A) as quatro amostras de E. grandis – duas réplicas
independentes de folha (GR_L1 e GR_L2), xilema (GR_XY) e plântula (GR_PL); (B) amostras de
folha (GR_L1 e GR_L2) e xilema (GR_XY) de E. grandis; (C) as três amostras de E. globulus –
xilema (GL_XY), plântula (GL_PL) e ovário (GL_OV); (D) duas amostras de plântula – E. grandis
(GR_PL) e E. globulus (GL_PL).
70
DADOS CONSOLIDADOS DE SEQUENCIAMENTO
Os resultados consolidados de todas as etapas experimentais executadas,
destacando os números de sequências geradas no experimento de sequenciamento, e os
quantitativos resultantes das diversas etapas subsequentes de mapeamento, análise de
conservação, predição de estrutura secundária do precursor pela sequência genômica
flanqueante, predição de transcritos alvo e, finalmente, validação via microarranjo foram
sumarizados em um fluxograma (Figura 16). Esta análise consolidada demonstra
claramente a dimensão de dados que podem ser obtidos via sequenciamento em larga
escala e, principalmente, a crucial importância de se executar análises subsequentes
rigorosas destes dados para se aproximar de resultados numéricos finais provavelmente
mais próximos da realidade biológica do repertório de miRNA de uma espécie. De um
total de 1.857.986 sequências únicas de 21 nucleotídeos, 1.405.134 (75,63%) mapearam no
genoma. Destas, 470 (0,025%) tem algum ortólogo no miRBase com até 3 bases de
diferença, sendo 95 destes conservados sem diferenças de base.
Dentre as sequências mapeadas candidatas a miRNAs, 178 (0,96%) tiveram
estrutura secundária compatível com um precursor de miRNA (dados completos no Anexo
II). Deste total, 82 foram identificadas na amostra de folha de E. grandis BRASUZ1, 55 na
amostra de xilema de E. grandis BRASUZ1, 74 e 73 nas amostras de xilema de E.
globulus A2 e C3, respectivamente. Dentre estes, 40 são isoformas de miRNAs
conservados. Do total de 178 sequências, 163 tiveram, pelo menos, um alvo predito pelo
psRNAtarget. O número total de transcritos preditos como alvo somou 690. Finalmente, 14
sequências foram validadas no microarranjo com intensidade de sinal significativamente
maior em relação à média (p<=0,1) e correspondem ao número de miRNAs identificados
preenchendo aos quatro requisitos determinados para a anotação de um novo miRNA
(Meyers, Axtell et al., 2008).
Na montagem do genoma de Populus trichocarpa, modelo de espécies florestais,
foi identificado computacionalmente, um número bastante próximo dos 178 preditos em
Eucalyptus. Em Populus, foram identificados 169 genes de miRNAs representando 21
famílias (Tuskan, Difazio et al., 2006).
71
Vale ressaltar que, no caso de E. grandis, a análise foi consideravelmente
beneficiada pela disponibilidade da sequência de referência do genoma e pelo fato dos
dados do sequenciamento de pequenos RNAs terem sido gerados a partir da mesma árvore
que forneceu o genoma de referência. Além disso, a disponibilidade de um grande banco
de transcritos desta mesma árvore, de outras árvores e de diversos tecidos também
contribuiu, sobremaneira, para a identificação positiva de potenciais alvos.
72
Sequências únicas de 21 nt
1.857.986
Sequências únicas de mapeadas no genoma
1.405.134
Sequências de miRNAs conservados
MiRNAs candidatos com estrutura secundária
do precursor (miRDeep - RNAfold)
com ortólogos no miRBase
178
(até 3 mismatches)
470
MiRNAs candidatos com alvo identificado
163
Sequências de miRNAs conservados
com ortólogos no miRBase
MiRNAs candidatos validados no
(0 mismatches)
microarranjo
95
14
Figura 16: Fluxograma geral do experimento de descoberta de miRNA em Eucalyptus, destacando
as contagens de sequências geradas inicialmente pelo sequenciamento de pequenos RNAs e os
resultados quantitativos de cada etapa de análise, incluindo o mapeamento, análise de conservação,
predição de estrutura e alvos e validação experimental por microarranjo.
73
CONSERVAÇÃO COM EUGENIA UNIFLORA
Recentemente, o sequenciamento da fração de pequenos RNAs de Eugenia uniflora
(pitanga) gerou a primeira publicação com descoberta em larga escala de miRNAs para
uma espécie da família Myrtaceae (Guzman, Almerao et al., 2012). Estes dados publicados
permitiram uma análise comparativa dos dados de sequenciamento de Eucalyptus e
Eugenia para avaliar a extensão da conservação de pequenos RNAs entre esses dois
gêneros da família Myrtaceae. Vale destacar, entretanto, que o sequenciamento de
Eucalyptus foi realizado em plataforma Illumina GAII enquanto os dados de Eugenia
foram gerados em plataforma Illumina HiSeq2000, o que significa uma quantidade maior
de dados gerados para a segunda espécie. Para efeito comparativo, o número de sequências
únicas de Eucalyptus totalizou 1.857.986 e o de Eugenia uniflora foi pouco mais que o
dobro, 4.010.705.
A análise das sequências de Eugenia uniflora, disponíveis no banco de dados GEO
(Gene Expression Omnibus) hospedado no site do NCBI, mostrou que, do total de
sequências únicas, 1.392.334 (34,7%) mapearam, com até duas diferenças de bases, no
genoma de E. grandis. A observação do total de sequências mapeadas por tamanho, em
nucleotídeos, das principais classes de pequenos RNAs mostra maior conservação de
sequências de 21 nucleotídeos e menor conservação de sequências de 24 bases (Tabela 12).
A mesma tendência pode ser observada considerando as sequências comuns entre as duas
espécies por classe de tamanho. A porcentagem de sequências comuns de 21 nucleotídeos
é 10 vezes maior considerando 100% de identidade e cerca de 7 vezes maior considerando
isoformas com até uma base distinta.
Os dados revelam assim um elevado nível de conservação, especialmente, da fração
de 21 nucleotídeos em grande parte, provavelmente, explicada pela pressão de seleção,
principalmente para genes MIR conservados. O nível de conservação deve ser ainda maior
por se tratar de espécies próximas, pertencentes a uma mesma família. Com isso, espera-se
que, além dos miRNAs amplamente conservados em plantas, outros sejam conservados
dentro da família Myrtaceae como foi anteriormente observado na análise de northern blot
para algumas sequências de pequenos RNAs de 21 nucleotídeos (euc_sRNA_149582 e
74
euc_sRNA_75850), considerando também outras classes como siRNAs (Figura 12 –
Validação experimental – northern blot).
Sugere-se que a menor conservação de siRNAs ocorra por sofrerem menor pressão
seletiva para conservação de suas sequências que miRNAs, mostrando maior capacidade
de adaptação. Este fenômeno provavelmente decorre do fato de siRNAs apresentarem mais
comumente alvos relacionados, muitas vezes silenciando o próprio loco de origem,
atuando em cis, muitos relacionados com sistemas como os de defesa, que requerem alta
plasticidade e adaptabilidade, o que, em última instância, resulta em uma elevada taxa
evolutiva.
Por outro lado, miRNAs, normalmente, silenciam alvos não relacionados e estão
muito envolvidos em processos básicos como desenvolvimento e morfologia. Uma vez que
o silenciamento depende da complementariedade a alvos heterólogos, estes pequenos
RNAs estão mais sujeitos a pressão seletiva, mantendo, assim, maior conservação de
sequências (Carthew e Sontheimer, 2009). A observação de uma maior conservação de
pequenos RNAs de 22 nt (em sua maioria miRNAs), além dos sRNAs de 21 nt, entre taxa
distintos, em comparação aos de 24 nt corrobora essa hipótese (Tabela 13).
Tabela 12: Número total de sequências únicas de Eugenia uniflora e de sequências de mapeadas no
genoma de E. grandis por classe de tamanho em bases.
Número de bases
Total de sequências únicas
Número de sequências mapeadas
21
572.311
352.691 (61,6%)
22
282.335
121.025 (42,9%)
24
2.436.699
514.683 (21,1%)
75
Tabela 13: Número de sequências únicas por classe de tamanho, em nucleotídeos (nt), de
Eucalyptus e Eugenia e número de sequências comuns entre ambos os taxa com 100% de
identidade e com diferença de uma base.
21nt
22nt
24nt
Eucalyptus
169.661
94.027
1.230.102
Eugenia
572.311
282.335
2.436.699
Comum - 0 diferença
7.018 (4,1%)
4.742 (5,0%)
5.231 (0,4%)
Comum - 1 diferença
19.790 (11,7%)
11.398 (12,1%)
21.089 (1,7%)
CONCLUSÕES
O uso de tecnologias de sequenciamento em larga escala impulsionou a
identificação de miRNAs conservados e a descoberta de miRNAs linhagem específicos
que, possivelmente, seriam de difícil detecção via metodologias de clonagem e
sequenciamento Sanger por serem expressos em menor quantidade. Como essas
tecnologias se tornam cada vez mais acessíveis, tornou-se possível também a identificação
de miRNAs expressos apenas em tecidos ou condições específicas. Contudo, a obtenção de
milhares de sequências de pequenos RNAs por sequenciamento em larga escala gerou um
desafio adicional considerável para uma correta classificação de miRNAs, outros pequenos
RNAs e transcritos espúrios, parte derivados de degradação de outros RNAs (Kozomara e
Griffiths-Jones, 2011).
Os números totais de sequências obtidas mostraram ainda a cautela e rigor analítico
necessários para uma análise robusta de dados de sequenciamento de pequenos RNAs.
Dentre os números obtidos, grande parte é representada por contaminantes como RNA
ribossômico e de cloroplasto. Dentre os pequenos RNAs regulatórios, diferentes classes e
subclasses estão representadas e os critérios para declarar uma sequência de pequeno RNA
como efetivamente sendo um miRNA devem ser cuidadosamente observados.
76
A identificação de miRNAs conservados é facilitada pela busca por similaridade.
Contudo, a busca por novos candidatos deve ser especialmente criteriosa. Os filtros usados
com esse intuito seguiram os critérios recomendados por especialistas (Meyers, Axtell et
al., 2008) para a identificação de miRNAs: 1) mapeamento no genoma, 2) estrutura
secundária do precursor, 3) alvos preditos, 4) validação experimental via microarranjo.
A busca por miRNAs conservados mostrou 95 isoformas absolutamente
conservadas (sem nenhuma diferença de base) pertencente a vinte e cinco famílias.
Incluindo novas isoformas com até três diferenças de bases, um total de 470 isoformas em
74 famílias foram identificadas. Para efeito de comparação, os dados de miRNA no
miRBase de A. thaliana, que é a espécie modelo com sequência genômica amplamente
anotada e onde a maior parte dos experimentos de descoberta e validação de miRNAs foi
realizada, apresenta 338 sequências de miRNAs maduros em mais de 100 famílias.
Os potenciais novos miRNAs de Eucalyptus somam 178 sequências mapeadas no
genoma e com estrutura secundária compatível. Destes, 163 tiveram alvos preditos e 14
foram validados no microarranjo e possuem alvos preditos, sendo potencialmente novos
genes MIR de Eucalyptus.
A abordagem de descoberta e análise descrita neste trabalho se beneficiou
consideravelmente da disponibilidade do genoma de referência de E. grandis e de tecido
derivado da mesma árvore que forneceu o genoma de referência. Além da utilização desta
amostra de E. grandis, foram estudadas duas árvores de E. globulus em vista da grande
importância econômica desta espécie. A escolha por xilema como o tecido referência para
a descoberta destes RNAs foi fundamentada no fato deste ser o tecido responsável pela
formação da madeira, o principal produto do gênero Eucalyptus e alvo de interesse de
manipulação via tecnologias de DNA recombinante. A análise de mapeamento das
sequências de ambas as espécies confirmou a existência de variabilidade interespecífica de
sequências de pequenos RNAs. Embora sejam espécies próximas, pertencentes ao mesmo
gênero, o repertório de pequenos RNAs expressos apresentou sequências, aparentemente,
espécie específicas e, portanto, de origem recente.
77
Uma análise de genômica comparativa de pequenos RNAs com a espécie Eugenia
uniflora, pertencente à mesma família Myrtaceae, corrobora a alta conservação entre
espécies relacionadas. Os dados mostram que a maior parte dos pequenos RNAs
conservados
refere-se
aos
de 21
nucleotídeos. Acredita-se que estes sejam,
majoritariamente, miRNAs que, por suas características de atuação, sofrem maior pressão
seletiva para a manutenção de suas sequências que as demais classes de pequenos RNAs o
que explicaria assim a elevada conservação.
A descoberta de miRNAs novos e conservados em Eucalyptus contribui com a
anotação do genoma de E. grandis adicionando informações sobre pequenos RNAs
regulatórios e abrindo perspectivas de estudos experimentais pontuais para a elucidação de
suas funções biológicas e do participação no controle da variação quantitativa em fenótipos
de interesse industrial e adaptabilidade a estresses bióticos e abióticos. Adicionalmente,
este foi o primeiro experimento para a criação de um microarranjo customizado de
pequenos RNAs do gênero Eucalyptus. Esta ferramenta abre a perspectiva de realização de
análises coletivas de pequenos RNAs em Eucalyptus e espécies relacionadas, abrindo as
portas para investigação detalhada de seu papel funcional.
78
CAPÍTULO II
Identificação de pequenos RNAs em fase no genoma
de Eucalyptus grandis
79
INTRODUÇÃO
Desde a recente descoberta da participação de pequenos RNAs não codificadores
como elementos regulatórios, várias classes de sRNAs foram descritas. Diferentes
classificações já foram propostas baseando-se na origem e em mecanismos de atuação. Na
verdade, como bem colocado por Michael Axtell em sua recente revisão sobre
classificação de pequenos RNAs em plantas, qualquer classificação sobre pequenos RNAs
é uma construção intelectual que não reflete perfeitamente a realidade (Axtell, 2013). De
maneira geral, miRNAs e siRNAs são consideradas as duas maiores e principais classes de
pequenos RNAs em plantas. MiRNAs e siRNAs são, usualmente, considerados classes de
pequenos RNAs não codificadores independentes, com mecanismos regulatórios e origens
distintas.
A regulação pós-transcricional mediada por miRNAs, usualmente, ocorre, em
última instância, por redução dos níveis da proteína traduzida pelo RNA mensageiro alvo,
de forma que, quando o miRNA está ativo, o mRNA mensageiro alvo é silenciado.
Contudo, estes elementos se mostram versáteis, podem participar de vias auto-regulatórias
e são capazes de mecanismos mais sutis de regulação (Voinnet, 2009). Além disso,
recentemente, foi mostrado que a biossíntese de siRNAs pode ser dependente da atuação
de miRNAs (Yoshikawa, Peragine et al., 2005; Talmor-Neiman, Stav et al., 2006; Howell,
Fahlgren et al., 2007).
Recentemente, foi demonstrada a convergência entre as duas principais classes de
pequenos RNAs em plantas pela observação da dependência da síntese de uma classe de
siRNAs secundários induzida por miRNAs, em um mecanismo designado transitividade
(transitivity), onde miRNAs desencadeiam a biossíntese de trans-acting siRNAs
(tasiRNAs) ou RNAs em fase (phased RNAs) (Peragine, Yoshikawa et al., 2004;
Yoshikawa, Peragine et al., 2005).
Este é mais um exemplo de quão ampla e complexa pode ser a rede de regulação da
expressão gênica. Mecanismos e elementos, inicialmente, considerados paralelos e
independentes são, na realidade, interdependentes e complementares, muitas vezes
80
apresentam pontos de redundância e podem fornecer indícios da história evolutiva de
famílias gênicas.
A identificação desses novos elementos de regulação da expressão gênica
representa mais um avanço na compreensão da atuação destes elementos e pode fornecer
valiosas informações sobre a conservação e evolução desse mecanismo.
Neste capítulo o trabalho de descoberta e caracterização de miRNA em Eucalyptus
foi expandido para a identificação de pequenos RNAs produzidos em fase no genoma de
Eucalyptus grandis. A disponibilidade de dados de sequenciamento em larga escala de
pequenos RNAs e da sequência de referência
do genoma do mesmo indivíduo de
Eucalyptus grandis permitiu o desenvolvimento desse tipo de estudo que envolve a
identificação in silico de agrupamentos (clusters) de sequências e siRNA em fase no
genoma.
REVISÃO BIBLIOGRÁFICA
ORIGEM DOS RNAS EM FASE
O mecanismo designado transitividade (transitivity), isto é, quando miRNAs
desencadeiam a biossíntese de trans-acting siRNAs (tasiRNAs) ou phased RNAs
(phasiRNAs), foi recentemente elucidado (Peragine, Yoshikawa et al., 2004). Este não é
um mecanismo padrão para todos os transcritos alvo de miRNAs, porém, alguns poucos
mRNAs, designados transcritos TAS, são processados em fase para a produção de vários
siRNAs secundários de 21 nt. SiRNAs secundários são aqueles cuja síntese depende de um
outro pequeno RNA, usualmente um miRNA, atuando anteriormente para desencadear sua
produção, dependente de RNA polimerase 6 dependente de RNA (RDR6).
A biossíntese de RNAs em fase envolve: 1) a clivagem de um mRNA alvo (TAS)
por um sRNA inicial, usualmente um miRNA; 2) a estabilização do mRNA clivado por
SGS3 (supressor of gene silencing); 3) a síntese de RNA fita dupla, a partir do fragmento
3´ do mRNA alvo, pela RDR6; 4) este RNA fita dupla é processado em fase pela enzima
81
DCL4 em siRNAs de 21 nucleotídeos (Allen, Xie et al., 2005) (Figura 17). Os tasiRNAs
assim sintetizados silenciam genes alvo guiando proteínas argonautas (AGO) associadas a
ele, como no mecanismo de silenciamento por miRNAs ou siRNAs. A incorporação dos
tasiRNAs no complexo efetor AGO, também obedece à mesma regra observada para
miRNAs, onde sequências com 5´uridina se associam, preferencialmente, à AGO1 (Mi,
Cai et al., 2008). A maquinaria envolvida na geração destes tasiRNAs é, então, distinta
daquela envolvida na síntese de outros siRNAs e miRNAs e, consistentemente, dependente
de RDR6, SGS3 e DCL4 (Peragine, Yoshikawa et al., 2004; Yoshikawa, Peragine et al.,
2005; Talmor-Neiman, Stav et al., 2006; Howell, Fahlgren et al., 2007; Cuperus, Carbonell
et al., 2010).
Sumarizando, miRNAs desencadeiam uma reação em cascata produzindo fitas
duplas de RNAs, a partir de alguns transcritos específicos, e a clivagem destas em blocos
consecutivos de 21 nucleotídeos dá origem aos siRNAs secundários, os tasiRNAs. Esta é
uma subclasse onde, em teoria, o siRNA teria como alvo um transcrito não relacionado
(em trans) criando uma complexa rede de regulação (Axtell, 2013).
Este mecanismo gera, muitas vezes, múltiplos siRNAs quase idênticos que tem
como alvo um mesmo transcrito reforçando a intensidade de silenciamento e, ao mesmo
tempo, garantindo a especificidade ao transcrito alvo (Zhai, Jeong et al., 2011).
82
Figura 17: Representação esquemática da biossíntese de siRNAs secundários em fase a partir do
processamento de um mRNA alvo de um miRNA (x) de 22 nt e do silenciamento em cis e em trans
de genes alvo de siRNAs em fase.
REDE DE REGULAÇÃO DOS RNAS EM FASE
Este mecanismo foi, originalmente, descrito em Arabidopsis thaliana. Quatro
famílias de transcritos TAS foram descritas e validadas nesta espécie. TAS1, TAS2 e
TAS4 são processados a partir de um único sítio de clivagem por um miRNA enquanto
TAS3, a partir da clivagem em dois sítios do transcrito gerador (Allen e Howell, 2010).
TAS1 e TAS2 são alvos de miR173 e seus tasiRNAs tem como alvo transcritos de
proteínas com repetição pentatricopetídeo (PPR) (Allen, Xie et al., 2005; Yoshikawa,
Peragine et al., 2005; Montgomery, Yoo et al., 2008). Proteínas com essa repetição
degenerada de 35 aminoácidos foram identificadas em um pequeno número de genes em
genomas de eucariotos. No entanto em plantas, esta família sofreu grande expansão. A alta
variabilidade observada em ortólogos desta família sugere que uma ativa dinâmica
83
evolutiva de seus membros com alta taxa de aparecimento/desaparecimento (birth and
death), assim como ocorre em outras famílias gênicas expandidas, como os genes análogos
de resistência, os Resistance Gene Analogs (Geddy e Brown, 2007). Apesar da função dos
membros da família PPR não estar definida sugeriu-se que os tasiRNAs atuariam como
elementos regulatórios tamponantes para contrabalançar a sua rápida expansão (Howell,
Fahlgren et al., 2007).
O miR828 regula o gene MYB113 e também o transcrito TAS4, cujos tasiRNAs
também regulam MYB113 e outros membros desta família de fatores de transcrição
(Rajagopalan, Vaucheret et al., 2006). TAS4 está relacionado com regulação da biossíntese
de flavonóides, antocianinas e fenilpropanóides, e, possivelmente, com senescência foliar
(Allen, Xie et al., 2005; Hsieh, Lin et al., 2009; Luo, Mittal et al., 2011).
TAS3 é alvo de miR390 e o processamento de tasiRNAs a partir deste transcrito
obedece a um mecanismo distinto, onde dois sítios de ligação ao miRNA flanqueiam os
tasiRNAs, contudo, somente o sítio 3´ tem indícios de clivagem. Todos os TAS3
identificados geram, pelo menos, um tasiRNA maduro que silencia um dos fatores de
resposta à auxina, ARF-2, ARF-3 ou ARF-4 (Allen, Xie et al., 2005; Williams, Carles et
al., 2005; Axtell, Jan et al., 2006; Luo, Mittal et al., 2011) que influenciam a transição de
fase vegetativa (da fase juvenil para adulta), crescimento lateral de raiz e morfologia e
polaridade de folha (Peragine, Yoshikawa et al., 2004; Fahlgren, Montgomery et al.,
2006).
As características que determinam se um mRNA alvo será processado para a síntese
de tasiRNAs não está bem elucidada. Entretanto, o tamanho do miRNA inicial parece ser
um dos pré-requisitos básicos para o desencadeamento de síntese de siRNAs secundários
em fase. MiRNAs de 22 nucleotídeos, ao invés do tamanho padrão de 21 bases, com uma
assimetria no duplex miRNA-miRNA*, decorrente da diferença de tamanho entre estes,
seriam necessários para a biossíntese dos tasiRNAs. É proposto que a conformação
assumida pelo complexo AGO1-miRNA de 22 nt seja distinta daquela assumida pelo
complexo AGO1-miRNA de 21 nt. Esta conformação promoveria, além da clivagem do
mRNA alvo, o recrutamento das proteínas envolvidas na biossíntese de tasiRNAs – RDR6
84
e SGS3 (Manavella, Koenig et al., 2012). A exceção a esse padrão é o miR390 que, com
21 nt, se liga à AGO7 e cliva TAS4 gerando tasiRNAs. Entretanto, destaca-se o fato de,
neste caso, o mecanismo ser diferenciado, com dois sítios de ligação do miRNA no
transcrito alvo (Axtell, Jan et al., 2006; Montgomery, Howell et al., 2008).
Apesar de, em geral, o miRNA gerador possuir 22 nt os tasiRNAs possuem um
tamanho padrão de 21 bases o que, aparentemente, é crítico para sua funcionalidade, apesar
de algum desvio na fase de síntese dos vários tasiRNAs ter sido observado (Howell,
Fahlgren et al., 2007).
Embora poucos tasiRNAs tenham sido identificados em plantas desde a descoberta
destes em A. thaliana (Allen, Xie et al., 2005), este parece ser um mecanismo de origem
remota. A identificação de TAS3 e miR390 na briófita Physcomitrella patens indica um
mecanismo altamente conservado de biossíntese de tasiRNAs em plantas (Axtell, Jan et
al., 2006; Talmor-Neiman, Stav et al., 2006; Howell, Fahlgren et al., 2007). MiR472 e os
tasiRNAs secundários gerados por ele são conservados em Populus e em outras espécies
cultivadas (Allen e Howell, 2010). A conservação de siRNAs secundários em
angiospermas, mesmo em linhagens pouco relacionadas (Axtell, Jan et al., 2006; TalmorNeiman, Stav et al., 2006), confirma estes elementos como uma classe robusta de
pequenos RNAs regulatórios (Axtell, 2013). O par TAS3-miR390, altamente conservado,
foi também identificado por análise in silico em V. vinifera. Contudo, os alvos de
regulação pelos tasiRNAs de V. vinifera compreendem, além de genes envolvidos em
desenvolvimento como proteínas envolvidas com senescência e fatores de resposta a
auxina (ARFs – Auxin Response Factors), como previamente descrito em A. thaliana
(Allen, Xie et al., 2005), outros genes envolvidos em vias bioquímicas básicas – como
transportadores de cálcio, enzimas envolvidas no metabolismo de celulose e ácidos graxos
– e em genes de defesa em resposta à patógenos (Zhang, Li et al., 2012). A identificação
de novos tasiRNAs específicos de Vitis vinifera, Oryza sativa e Brachipodium indicam
também a existência de siRNAs secundários de origem mais recente (Shivaprasad, Chen et
al., 2012).
85
Além da conservação observada, a grande variedade de alvos de regulação por
tasiRNAs, envolvidos em diferentes processos biológicos, sugere que estes elementos
regulatórios tenham papel fundamental no desenvolvimento de plantas (Zhang, Li et al.,
2012). Por exemplo, foi relatado que os tasiRNAs podem se movimentar entre células e,
dessa forma, estabelecer gradientes de silenciamento que são necessários para a
determinação da polaridade da folha por TAS3 (Chitwood, Nogueira et al., 2009; Schwab,
Maizel et al., 2009).
OS RNAS EM FASE E GENES DE RESISTÊNCIA A DOENÇAS
Transcritos TAS, como no caso de Arabidopsis thaliana, são mRNAs não
codificadores. Entretanto, existem exemplos de transcritos codificadores de proteína
gerando tasiRNAs. Entre estes estão membros da família de genes de resistência a doenças
com a tríade de domínios protéicos TIR-NBS-LRR (Toll-Interleukin receptor – nucleotide
binding site – leucine rich repeat), transcritos de proteínas F-box, envolvidas na
sinalização por auxina, transcritos de transportadores cátion/hidrogênio e da família de
proteínas PPR (Howell, Fahlgren et al., 2007).
A identificação de tasiRNAs gerados a partir de genes de defesa e resistência a
patógenos, particularmente genes da família NBS-LRR, também parece ser um mecanismo
conservado já identificado em Medicago truncatula, batata e tomate (Zhai, Jeong et al.,
2011; Shivaprasad, Chen et al., 2012). Em M. truncatula, 79 dos 112 locos identificados
como phasi locos, ou geradores de transcritos TAS, são de genes NBS-LRR (Zhai, Jeong
et al., 2011). Em tomate, 58 dos 186 genes NBS-LRR tem sítios de ligação ao miR482, o
agente desencadeador principal da produção de tasiRNAs em genes de resistência (Bonnet,
He et al., 2010).
A família miR482 tem como alvo genes NBS-LRR. Esta família é incomum pela
presença predominante de miRNAs de 22 nt e pelo grande número de isoformas,
totalizando 31 em espécies distintas. A família pode ainda ser expandida para incluir
miR472 e miR2118. A família miR2118 apresenta o mesmo padrão de variação de
86
sequência e, acredita-se, que a superfamília miR482/miR2118 tenha o potencial de regular
a expressão de vários genes NBS-LRR e atuem como reguladores fundamentais da
resistência a doenças em tomate (Shivaprasad, Chen et al., 2012). Uma outra observação é
que a maior parte das 31 isoformas de mir482 é espécie específica, sendo provável que
estas tenham origem bastante recente (Shivaprasad, Chen et al., 2012).
Plantas apresentam um vastíssimo número de genes de receptores relacionados com
imunidade inata. A expressão destes, embora ofereça proteção contra patógenos invasores,
têm um alto custo para a planta pelo grande número de genes e o potencial de desencadear
morte celular. Sugere-se, então, que mecanismos de silenciamento pós-transcricionais
tenham co-evoluído para balancear o alto custo gerado pela expansão e diversificação
dessas famílias de genes (Howell, Fahlgren et al., 2007; Li, Pignatta et al., 2012). Uma vez
que bactérias e vírus possuem efetores para suprimir o silenciamento por miRNAs e
siRNAs (Li e Ding, 2006; Navarro, Jay et al., 2008), propõe-se que este mecanismo, além
de favorecer a expansão do patógeno, contribua para o aumento da expressão de genes de
resistência, criando um balanço entre resistência e susceptibilidade. Por tudo isso, sugerese que miRNAs que atuam em genes de resistência sejam responsáveis por uma regulação
fina da expressão destes ao longo da co-evolução de patógeno e hospedeiro (Li, Pignatta et
al., 2012).
A participação de silenciamento de RNA na expressão de genes de defesa abre um
novo capítulo na interação entre patógeno e hospedeiro com mecanismos de defesa e
contra-defesa. Em infecção por vírus e, em alguns casos, também por bactérias o
silenciamento por RNA (RNAi) seria o primeiro mecanismo de defesa da planta. Os
patógenos também possuem um arsenal para suplantar a defesa celular como no caso dos
supressores virais (Voinnet, 2005a). O sistema coordenado por miR482 seria um exemplo
de contra contra-defesa (Shivaprasad, Chen et al., 2012). Um potencial novo sistema de
defesa seria a existência de genes NBS-LRR truncados que funcionariam como
sequestradores de miR482/miR2118, funcionando como “imitadores de alvo” (target
mimics), proporcionando mais um nível de regulação fina da supressão de genes de defesa
(Meyers, Kozik et al., 2003).
87
Especula-se que a grande variação de sequência e níveis de expressão observados
na superfamília miR482/miR2118 mostrem o balanço de custo e benefício em diferentes
plantas dependendo do ambiente e de outros mecanismos de defesa (Shivaprasad, Chen et
al., 2012) que, em conjunto, constituem uma vasta e complexa rede.
Uma descoberta surpreendente foi a de que, em soja, SGS3, elemento fundamental
da biossíntese de tasiRNAs, é também alvo de miR2118 (Zhai, Jeong et al., 2011). O que,
provavelmente, resultaria em um efeito tamponante da produção de tasiRNAs a partir de
genes NBS-LRR.
PPR e ARF são regulados, independentemente, por siRNAs secundários e alguns
miRNAs e, por isso, sugere-se que tasiRNAs reforcem ou coordenem a ação de outros
siRNAs ou miRNAs (Shivaprasad, Chen et al., 2012). Este tipo de grande rede de
regulação envolvendo tasiRNAs, aparentemente, não está presente em Arabidopsis
thaliana (Zhai, Jeong et al., 2011).
Embora, por definição, tasiRNAs tenham como alvo transcritos não relacionados
(trans), exemplos, como os citados anteriormente com genes de defesa NBS-LRR (Zhai,
Jeong et al., 2011; Shivaprasad, Chen et al., 2012) e fatores de transcrição MYB,
corroboram a existência de tasiRNAs com ação de silenciamento em cis.
A biossíntese de tasiRNAs parece ser um sistema eficaz de supressão em plantas,
seja pelo estabelecimento de um gradiente de silenciamento, como no caso de ARFs, ou
por regulação de grandes famílias gênicas, como no caso de PPR e NBS-LRR. Este pode
ser um mecanismo de controle e amplificação de pequenos RNAs enquanto transforma um
sinal de silenciamento célula específico (miRNA) em um sinal que se propaga criando um
gradiente entre células (Allen e Howell, 2010).
A identificação in silico de tasiRNAs a partir do genoma é uma ferramenta
poderosa (Chen, Li et al., 2007; Howell, Fahlgren et al., 2007; Zhai, Jeong et al., 2011)
uma vez que este é o único mecanismo conhecido de síntese de pequenos RNAs em fase
(Axtell, 2013). Um dos critérios usados na predição in silico de grupos de siRNAs em fase
é a identificação de, pelo menos, três siRNAs em 100 nucleotídeos (Johnson, Kasprzewska
et al., 2009). A disponibilidade de dados de sequenciamento em larga escala de pequenos
88
RNAs e de sequências de genomas de referência favorece o desenvolvimento desse tipo de
estudo.
METODOLOGIA
SEQUENCIAMENTO
Os dados de sequenciamento de pequenos RNAs de folha e xilema de E. grandis,
árvore BRASUZ1, e xilema de E. globulus, árvores A2 e C3, descrito no capítulo I foram
utilizados na identificação de tasiRNAs.
MAPEAMENTO E IDENTIFICAÇÃO DE SIRNAS EM FASE
As sequências de pequenos RNAs de 21 bases foram mapeadas contra o genoma de
referência de E. grandis (árvore BRASUZ 1) para identificação dos locos de siRNAs em
fase. Para tanto, foi utilizado um algoritmo desenvolvido para identificar grupos de
pequenos RNAs de 21 bases em fase conforme descrito anteriormente (Chen, Li et al.,
2007).
PREDIÇÃO DE ALVOS
A predição de mRNAs alvo de siRNAs em fase foi realizada, como descrito no
capítulo I, utilizando o programa psRNATarget contra o banco de transcritos de E. grandis
do Phytozome. A função potencial desses tasiRNAs foi inferida pelos domínios protéicos
presentes nos transcritos, identificados por meio da ferramenta BioMart (Phytozome).
89
RESULTADOS
O sequenciamento de pequenos RNAs foi realizado multiplexando quatro amostras
para a corrida em uma linha (lane) do sequenciador Illumina GA II. As sequências foram
então mapeadas contra o genoma referência de E. grandis, conforme descrito no capítulo 1,
e as leituras de 21 nucleotídeos foram usadas na busca por tasiRNAs. Foi utilizado um
algoritmo desenvolvido para a identificação de pequenos RNAs em fase sem informação
prévia de sítios de clivagem de miRNAs (Chen, Li et al., 2007).
Foram identificados 173 agrupamentos de pequenos RNAs, considerando aqueles
que se sobrepõem em uma mesma região genômica com fases de síntese distintas e em
ambas as fitas. A partir destes agrupamentos, procedeu-se uma filtragem para identificar os
grupos presentes dentro de regiões gênicas resultando em um total de 13 locos.
Interessantemente, alguns dos pequenos RNAs de 21 nt que estão entre os mais abundantes
nos dados de sequenciamento são justamente oriundos destes 13 locos.
Entre os 13 transcritos preditos como produtores de sRNAs em fase, três não tem
função predita. São, potencialmente, não codificadores e se comportariam como transcritos
TAS, inicialmente descritos em A. thaliana (Allen, Xie et al., 2005; Williams, Carles et al.,
2005; Yoshikawa, Peragine et al., 2005). Um deles é um fator de transcrição da família
MYB, outro um fator de transcrição X1-like e sete são relacionados com resistência a
doenças (Tabela 14). A predominância de locos de genes NBS-LRR (domínios NB-ARC e
repetição leucine rich) de resistência a doenças entre os preditos como produtores de
siRNAs em fase recapitula o que foi anteriormente observado em Medicago truncatula e
tomate (Zhai, Jeong et al., 2011; Shivaprasad, Chen et al., 2012).
Em quatro desses transcritos, foi possível identificar sítios de ligação a pequenos
RNAs de 22 nt descobertos na amostragem de sequenciamento, sugerindo que estes seriam
os miRNAs desencadeadores da síntese de siRNAs em fase. Todos esses quatro genes são
relacionados com imunidade inata e resistência a patógenos – Eucgr.C04268,
Eucgr.G00363, Eucgr.G00368 e Eucgr.H03699 segundo nomenclatura do Phytozome
(Tabela 14). Entretanto, nenhum desses candidatos a miRNAs de 22 nt tem um ortólogo no
90
miRBase e podem ser, potencialmente, linhagem-específicos e, portanto, de origem
recente, acompanhando a dinâmica natureza evolutiva da família de genes NBS-LRR.
Tabela 14: Anotação dos genes de E. grandis preditos como produtores de siRNAs secundários em
fase. Nome do gene segundo o Phytozome, código (ID PFAM), nome do domínio protéico e
descrição segundo PFAM e Panther.
Nome do gene
ID PFAM
Domínio protéico
Descrição PFAM
Descrição Panther
Eucgr.A01539
Eucgr.B00373
PF00249
domínio de ligação a domínio de ligação
relacionado a MYB
DNA Myb-like
a DNA Myb-like
Eucgr.B02765
domínio homólogo a
receptor
Toll/interleukin-1
(TIR)
domínio homólogo a
receptor
Toll/interleukin-1
(TIR)
resposta imune
inata
-
resposta imune
inata
-
domínio C1
proteína com
atividade de
dissulfeto redutase
-
PF01582
domínio homólogo a
receptor
Toll/interleukin-1
(TIR)
resposta imune
inata
-
PF00931
domínio NB-ARC
apoptose
proteína de
resistência
a doença
Eucgr.C04268
PF01582
domínio homólogo a
receptor
Toll/interleukin-1
(TIR)
resposta imune
inata
proteína de
resistência
a doença
Eucgr.G00363
PF00931
domínio NB-ARC
apoptose
Eucgr.G00368
PF00931
domínio NB-ARC
apoptose
PF01582
domínio homólogo a
receptor
Toll/interleukin-1
(TIR)
resposta imune
inata
Eucgr.C02141
PF01582
Eucgr.C02142
PF01582
Eucgr.C02857
PF07649
Eucgr.C03843
Eucgr.C04268
Eucgr.G00368
91
proteína de
resistência
a doença
proteína de
resistência
a doença
proteína de
resistência
a doença
Nome do gene
ID PFAM
Domínio protéico
Descrição PFAM
-
-
PF00931
domínio NB-ARC
apoptose
Eucgr.H03699
PF01582
domínio homólogo a
receptor
Toll/interleukin-1
(TIR)
resposta imune
inata
Eucgr.H03699
PF00560
repetição leucinerich (LRR)
ligação a proteína
Eucgr.H05056
PF03470
domínio XS zinc
finger
domínio XS zinc
finger
Eucgr.H05056
PF03470
domínio XS zinc
finger
domínio XS zinc
finger
Eucgr.G01952
Eucgr.H03699
Descrição Panther
proteína com
repetição leucine
rich / F-BOX
proteína com
repetição leucine
rich
proteína com
repetição leucine
rich
proteína com
repetição leucine
rich
relacionado a
ribonuclease P
subunidade P38
fator de transcrição
X1-like
Vale destacar que alguns transcritos alvos de candidatos a miRNAs de 22 bases são
também alvos de siRNAs em fase (como o euc_sRNA_33215) sugerindo uma regulação
integrada da expressão gênica por tasiRNAs e miRNAs como observado anteriormente
(Howell, Fahlgren et al., 2007; Shivaprasad, Chen et al., 2012).
Um
dos
potenciais
transcritos
TAS
preditos,
sem
anotação
funcional
(Eucgr.B02765), e não conservado em outras espécies, produz cerca de 20 sRNAs de 21 nt
em fase identificados em todas as amostras do sequenciamento (Figura 18). O mais
abundante desses (euc_sRNA_4546), tem, nos dados de sequenciamento, de 323 contagens
em xilema de E. globulus A2 a 2.674 em folha de E. grandis (Figura 19). Quatro alvos
foram preditos para esse siRNA secundário: um fator de liberação da tradução
(Eucgr.F03826), uma transferase (Eucgr.A02205), um transcrito com o domínio LRR
(leucine rich repeat) e, o mais intrigante, o mesmo transcrito TAS que origina os siRNAs
secundários (Tabela 15). Este é mais um exemplo de um mecanismo de auto-regulação já
observado em Arabidopsis e em Medicago truncatula (Allen, Xie et al., 2005; Zhai, Jeong
et al., 2011). Este silenciamento por siRNAs secundários atuando em cis funcionaria como
um mecanismo de retroregulação da biossíntese dos siRNAs em fase abrindo uma nova
vertente de atuação destes pequenos RNAs silenciadores. Por isso, foi sugerido que os
92
então chamados tasiRNAs que, por definição atuariam em trans, fossem denominados
phasiRNAs (siRNAs em fase) (Zhai, Jeong et al., 2011) (Figura 20).
Tabela 15: Transcritos preditos como alvo do siRNA secundário euc_sRNA_4546, derivado de
Eucgr.B02765, pelo programa psRNATarget com a descrição dos domínios protéicos identificados
segundo PFAM.
Nome do
transcrito
ID PFAM
Domínio protéico
Descrição PFAM
Eucgr.A02205.1
PF02458
família transferase
atividade de transferase,
transferindo grupos acyl exceto
amino-acyl
Eucgr.B02765.1
Eucgr.C00993.1
PF08263
Eucgr.C00993.1
PF00560
Eucgr.F03826.1
PF00472
repetição leucine-rich
(LRR)
repetição leucine-rich
(LRR)
domínio RF-1
domínio repetição leucine-rich Nterminal
ligação a proteína
atividade de fator de liberação da
tradução
Figura 18: Visualização do mapeamento de pequenos RNAs de 21 nucleotídeos de folha de E.
grandis BRASUZ1 em fase na região do gene Eucgr.B02765 do genoma referência de E. grandis.
Em destaque (amarelo), os siRNAs mais abundantes no sequenciamento. Abaixo de cada siRNA, o
número
de
sequências
obtidas
93
no
sequenciamento.
Figura 19: Mapeamento nas fitas senso (+) e antisenso (-) do genoma referência de E. grandis, na região do gene Eucgr.B02765, de pequenos RNAs
de 21 nucleotídeos em fase oriundos do sequenciamento de quatro amostras: xilema (xylem) e folha (leaves) de E. grandis BRASUZ1 e xilema de E.
globulus A2 e C3. Em destaque, os siRNAs mais abundantes no sequenciamento para cada uma das amostras. Abaixo de cada siRNA, o número de
sequências obtidas no sequenciamento. O ponto inicial do phasi RNA euc_sRNA_4546 foi marcado com linha vertical vermelha.
94
Figura 20: Representação esquemática da síntese de phasiRNAs e o silenciamento dirigido por
estes em cis e em trans.
Outros exemplos de siRNAs em fase atuando em cis foram observados nos dados
de Eucalyptus. O transcrito Eucgr.A01539, sem anotação funcional e específico para
Eucalyptus de acordo com o Phytozome, possui um phasiRNA (euc_sRNA_30468) com
256 contagens na amostra de xilema de E. grandis atuando em cis no próprio transcrito
primário. Interessante destacar que este phasiRNA não foi detectado em E. globulus C3 e
nas demais amostras foi observado um número baixo de cópias – na amostra de xilema de
E. globulus A2 (2 contagens) e folha de E. grandis (10 contagens).
95
Um fator de transcrição da família MYB (Eucgr.B00373) produz um siRNA em
fase (euc_sRNA_766295) que tem como alvo o mesmo transcrito primário. Resultado
similar foi observado em Populus trichocarpa (Tuskan, Difazio et al., 2006). Em
Arabidopsis thaliana, outro mecanismo de auto-regulação foi relatado envolvendo TAS4 e
um grupo de fatores de transcrição MYB (PAP1, PAP2 e MYB113) que regulam a via de
biossíntese de antocianina (Luo, Mittal et al., 2011). Além do transcrito primário, dois
outros alvos são preditos para o RNA em fase euc_sRNA_766295 (Tabela 16).
Tabela 16: Transcritos preditos como alvo do siRNA secundário euc_sRNA_766295, derivado de
Eucgr.B00373, pelo programa psRNATarget com a descrição dos domínios protéicos identificados
segundo PFAM.
Nome do transcrito
ID
PFAM
Domínio protéico
Descrição PFAM
Eucgr.B00373.1
PF00249
domínio de ligação a DNA Myb-like
domínio de ligação a
DNA
Myb-like
Eucgr.B03556.1
PF00076
motivo de reconhecimento de RNA,
RNP-1
ligação a ácido nucleico
Eucgr.B03556.1
PF04059
motivo 2 de reconhecimento de RNA
motivo 2 de
reconhecimento
de RNA
Eucgr.D00848.1
PF01657
Domíniro sem função conhecida
(DUF)
Domínio sem função
conhecida DUF26
Eucgr.D00848.1
PF07714
tirosina kinase
fosforilação de proteína
Outros transcritos preditos como transcritos TAS são codificadores de proteínas.
Um deles (Eucgr.C02141) codifica um gene de resistência com o domínio TIR
(Toll/Interleukin I like). O mais abundante entre os siRNAs secundários derivados desse
transcrito (euc_sRNA_33215) tem alta contagem nas amostras de xilema de E. globulus
C3 e A2 (1.949 e 1.530, respectivamente) e folha de E. grandis (2.840) e, curiosamente,
tem baixa contagem na amostra de xilema E. grandis (132). A análise de Northern blot do
96
siRNA secundário euc_sRNA_33215 em três espécies de Eucalyptus (E. dunnii, E.
urophylla and E. grandis) mostra conservação no gênero mas, interessantemente, este
parece não ser conservado em outras espécies de plantas e nem mesmo em duas espécies
da família Myrtaceae testadas, Corymbia citriodora e Eugenia uniflora (Figura 21).
Curiosamente, a expressão deste siRNA secundário parece ser, consistentemente, mais alta
em folha do que em xilema das árvores adultas amostradas. Vários alvos foram preditos
para este phasiRNA (Tabela 17). Dois são, supostamente, genes de resistência a doenças,
envolvidos em imunidade inata, apoptose e com atividade de receptor transmembrana
(Eucgr.E03126 and Eucgr.E03335).
Figura 21: Northern blot do siRNA secundário euc_sRNA_33215. Em cada painel, da esquerda
para a direita: (A) E. dunnii 140 – folha, E. dunnii 140 – xilema, E. dunnii 178 – folha, E. dunnii
178 – xilema, E. urophylla 99 – folha, E. urophylla 99 – xilema, E. urophylla 122 – folha, E.
urophylla 122 – xilema, E. grandis BRASUZ1 a – folha e E. grandis BRASUZ1 b – folha; (B)
Amostras de folha de E. grandis – BRASUZ1, Corymbia citriodora, Eugenia uniflora, Glycine
max, Oryza sativa, Pinus taeda e Solanum lycopersicum. A hibridização do pequeno RNA nuclear
snRNA U6 foi usada como controle de carregamento do gel.
97
Tabela 17: Transcritos preditos como alvo do siRNA secundário euc_sRNA_33215, derivado de
Eucgr.C02141, pelo programa psRNATarget com a descrição dos domínios protéicos identificados
segundo PFAM.
Nome do transcrito
ID PFAM
Domínio protéico
Descrição PFAM
Eucgr.B00380.1
PF00069
PF00433
domínio proteína kinase
domínio proteína kinase C terminal
fosforilação de proteína
Eucgr.B01155.1
PF01738
família hidrolase dienelactona
atividade de hidrolase
Eucgr.D01467.1
-
-
-
Eucgr.E01901.1
PF02535
transportador ZIP zinc
transporte de íons
metálicos
Eucgr.E01907.1
PF02535
transportador ZIP zinc
transporte de íons
metálicos
Eucgr.E03125.1
PF00931
PF00560
domínio NB-ARC
repetição leucine-rich (LRR)
apoptose
ligação a proteína
Eucgr.E03126.1
PF00931
PF00560
PF01582
domínio NB-ARC
repetição leucine-rich (LRR)
domínio homólogo a receptor
Toll/interleukin-1 (TIR)
apoptose
ligação a proteína
resposta imune inata
Eucgr.E03335.1
PF00931
PF01582
domínio NB-ARC
domínio homólogo a receptor
Toll/interleukin-1 (TIR)
apoptose
resposta imune inata
Eucgr.G02940.1
PF03514
fator de transcrição família GRAS
fator de transcrição
família GRAS
Eucgr.G03276.1
PF00561
conformação alfa/beta hidrolase
conformação alfa/beta
hidrolase
98
Nome do transcrito
ID PFAM
Domínio protéico
Descrição PFAM
Eucgr.G03406.1
PF03171
superfamília oxigenase 2-oxoglutarato
(2OG) e Fe(II)-dependente
atividade oxidoredutase
Eucgr.J01892.1
PF00628
PF05641
Domínio PHD (Plant Homeo Domain)
Domínio Agenet
ligação a proteína
ligação a RNA
Eucgr.K01839.1
PF00069
PF01453
domínio proteína kinase
lectina ligante de D-mannose
fosforilação de
proteínaligação a
açúcar
O siRNA secundário acima descrito seria assim um exemplo de um mecanismo de
amplificação de silenciamento a partir de um sRNA inicial, que tem como alvo um gene de
resistência, produzindo siRNAs secundários em fase atuando em outros genes de
resistência. Esses dados corroboram a hipótese anteriormente proposta de que siRNAs
secundários produzidos em fase a partir de um gene de resistência e tendo como alvo
outros genes de resistência representam um novo nível de defesa contra o ataque de
patógenos (Zhai, Jeong et al., 2011; Shivaprasad, Chen et al., 2012). O patógeno silencia a
primeira linha de defesa representada pelo sRNA inicial do hospedeiro, potencialmente um
miRNA. Isto desencadearia a supressão do silenciamento, via siRNAs secundários, dos
genes envolvidos no segundo nível de defesa dessa complexa rede, aumentando , assim, a
expressão desses genes em última instância. Isto seria um processo que foi chamado de
mecanismo de contra contra-defesa (Zhai, Jeong et al., 2011). Em plantas infectadas de
tomate, a supressão do silenciamento pode aumentar em duas a três vezes a expressão de
determinados mRNAs de NBS-LRR. Contudo, como dezenas de mRNAs desses genes de
resistência são alvos do miR482, que desencadeia a síntese de grande parte dos phasiRNA,
o efeito em rede seria de um aumento da ordem de centenas de vezes (Shivaprasad, Chen
et al., 2012). Este siRNA secundário descoberto em Eucalyptus pode ser mais um exemplo
de um sistema de amplificação do sinal de silenciamento que parece ser típico em famílias
99
gênicas que sofreram grande expansão como NBS-LRR e PPR (Howell, Fahlgren et al.,
2007; Shivaprasad, Chen et al., 2012) (Figura 22).
Figura 22: Representação esquemática da síntese de phasiRNAs e da amplificação do sinal de
silenciamento dirigido a grandes famílias gênicas.
100
CONCLUSÕES
A busca, in silico, por siRNAs produzidos em fase em regiões gênicas resultou na
identificação de 13 transcritos. Uma busca por siRNAs em fase no genoma de Populus
trichocarpa resultou em números similares, com 12 locos altamente significativos, quatro
desses mapeando em genes NBS-LRR (Tuskan, Difazio et al., 2006).
Vários siRNAs secundários, gerados a partir desses transcritos, apresentam alta
contagem nos dados de sequenciamento. Algumas das sequências mais abundantes de 21
nt observadas no sequenciamento foram identificadas como siRNAs em fase como
euc_sRNA_4546, euc_sRNA_766295 e euc_sRNA_33215. Este dado é importante no
reconhecimento de que dados de sequenciamento em larga escala revelam diversas
espécies de pequenos RNAs que agem em paralelo. Vale ressaltar que uma dissecção
estrutural detalhada é necessária para a correta classificação das famílias de pequenos
RNAs. A abundância não é um critério que possa ser diagnóstico de verdadeiros miRNAs,
como demonstrado nos dados de sequenciamento de Eucalyptus que apontam uma grande
amostragem de siRNAs de 21 nt entre as sequências mais abundantes.
A identificação do sRNA desencadeador em apenas quatro dos 13 transcritos
preditos como produtores de siRNAs não invalida a predição destes transcritos que tem, no
número de sRNAs de 21 nt mapeados, evidência suficiente para a declaração de um loco
TAS. Existem exemplos na literatura onde nenhum dos sRNAs primários foi identificado
nos transcritos primários (Howell, Fahlgren et al., 2007).
A premissa inicial, quando da descoberta deste mecanismo, de que os siRNAs
secundários produzidos em fase atuariam silenciando transcritos em trans mostrou-se
incompleta. Este pode ser o padrão predominante mas não são raros os exemplos de
atuação em cis, desencadeando uma cascata de auto-regulação de transcritos por siRNAs.
Talvez a nomenclatura possa ser revista, em função disso, renomeando definitivamente os
siRNAs secundários produzidos em fase como phasiRNAs. Uma parte dos phasiRNAs
seria, de fato, tasiRNAs.
101
Interessantemente, em Eucalyptus foram encontradas todas as variantes de
phasiRNAs reportadas na literatura para outras espécies. A identificação do mecanismo de
síntese de siRNAs secundários em fase no gênero Eucalyptus corrobora a conservação
deste sistema de silenciamento. A participação deste relevante mecanismo na manutenção
do equilíbrio da expressão de genes que sofreram rápida expansão, de forma a manter a
relação custo benefício da preservação um grande número de genes, parece ser mantida,
especialmente, no caso de genes de resistência NBS-LRR.
Os resultados desta análise de siRNA em fase em Eucalyptus ressaltam novamente
a importância da compreensão de mais essa via de silenciamento e da revelação de
indicativos de que os vários mecanismos de regulação já descritos se integram de alguma
forma. Como acontece em alguns transcritos regulados simultaneamente por miRNAs e
phasiRNAs. Isto, mais uma vez, reafirma a complexidade da regulação da expressão
gênica que envolve diversos níveis e elementos de silenciamento.
102
PERSPECTIVAS FUTURAS
A elucidação crescente dos diversos níveis da regulação da expressão gênica e a
consequente compreensão da complexidade da rede formada por todos os elementos
regulatórios demonstra as razões pelas quais a busca de genes ou polimorfismos que,
individualmente, possam explicar grande parte da variação fenotípica observada em uma
característica complexa raramente tem sucesso.
Apesar do avanço representado pelo desenvolvimento de seleção assistida por
marcadores (MAS – marker assisted selection), os alelos assim identificados representam
apenas uma pequena parte da porção herdável dos fenótipos complexos. Uma parte
significativa da origem destes caracteres permanece não elucidada, o que é a definição do
conceito de missing heritability. Sugere-se que a determinação destes fenótipos complexos
seja multifatorial e fatores como interação entre genes (epistasia), entre genes e ambiente e
mudanças epigenéticas como o silenciamento transcricional por metilação de DNA, em
parte controladas por miRNAs, possam contribuir para a determinação destes (Marian,
2012).
A recente descoberta de RNAs regulatórios adiciona um componente fundamental
da regulação da expressão gênica. Por ser muito recente, a classificação destes elementos
ainda é discutível e, provavelmente, será ainda revisitada. Assim como a nomenclatura
atribuída aos novos sRNAs descobertos dentro de cada uma das classes e subclasses.
Esse trabalho representa um primeiro passo de descoberta em escala genômica
ampla de elementos regulatórios no gênero Eucalyptus. Constitui ainda a identificação de
elementos e mecanismos conservados e caracterização dos que são linhagem específicos.
A identificação de pequenos RNAs, incluindo miRNAs e siRNAs, em Eucalyptus
abre a perspectiva para investigações pontuais de alguns desses elementos regulatórios na
determinação de fenótipos de interesse. A inversão no padrão de intensidade da expressão
dos miRNAs miR156 e miR172 na transição de fase vegetativa é um exemplo do que será
mais detalhadamente estudado. A transição de fase vegetativa em E. grandis não é
marcada por diferenças morfológicas claras como acontece em outras espécies, por
103
exemplo, E. globulus. A identificação do ponto de transição é uma característica de
interesse para estudos de fisiologia e genética. A transição para a fase adulta em
Eucalyptus tipicamente resulta na perda de totipotência celular e consequente
impossibilidade de propagação vegetativa via estaquia e cultura de tecidos. No
melhoramento, a possibilidade de acelerar a mudança da fase vegetativa para a fase adulta
e consequente florescimento em prazo mais curto permite acelerar as gerações de
recombinação e seleção recorrente.
A descoberta de mecanismos conservados como a amplificação do silenciamento
em famílias de genes de resistência e a auto-regulação por phasiRNAs RNAs descritos
neste trabalho, abre perspectivas interessantes de integrar este conhecimento em estudos da
interação patógeno-hospedeiro, investigação da herança e busca de fontes de resistência.
Os dados gerados em Eucalyptus poderão contribuir ainda para a elucidação da dinâmica
desses elementos em espécies perenes em geral, bem como o entendimento da evolução
destes e da co-evolução com grandes famílias gênicas.
A validação experimental da funcionalidade de cada um desses siRNAs secundários
em fase constitui o próximo passo passível de alcance com a conclusão do sequenciamento
do degradoma de Eucalyptus grandis, em andamento, que poderá confirmar o ponto de
clivagem dos transcritos alvo inferidos in silico.
Várias aplicações das vias de silenciamento endógenas para repressão de
determinados genes vem sendo desenvolvidas como a utilização de pequenos RNAs
artificiais (Ossowski, Schwab et al., 2008) e sequestradores de miRNAs, mímicos de
mRNAs alvo em plantas (Chen, Jiang et al., 2012). Esta tecnologia representa mais um
caminho potencial para a manipulação de características complexas quando não houver
variabilidade nativa na espécie alvo. Recentemente, por exemplo, um estudo conduzido
pela empresa DuPont mostrou que é possível o uso de tasiRNAs artificiais cooptando
transcritos TAS em Arabidopsis para silenciar a expressão de novos genes alvo.
Substituindo tasiRNAs de TAS1c com sequências do gene FAD2 (Fatty Acid Desaturation
2), a atividade deste gene foi reduzida a níveis observados para alelo nulo (De La Luz
Gutierrez-Nava, Aukerman et al., 2008).
104
Em uma esfera mais ampla, pretende-se conduzir estudos epigenômicos que sejam,
posteriormente, integrados aos dados mapeados de pequenos RNAs, uma vez que, parte
desses RNAs é responsável pelo direcionamento de metilação DNA (metilação de DNA
dependente de RNA).
Parece cada vez mais ser um consenso que o componente herdável da variação
fenotípica vai além da sequência de DNA (Mosher e Melnyk, 2010). A variação
epigenética também contribuiria fortemente para controle de fenótipos complexos e,
portanto, para a evolução de mudanças fenotípicas relacionadas à adaptabilidade. Um
estudo recente em linhagens epigenéticas recombinantes quase isogênicas (epiRILs) de
Arabidopsis thaliana, onde as linhagens quase isogênicas se diferenciavam quase
exclusivamente nos epialelos, mostrou variação epigenética herdável significativa em
vários caracteres ecologicamente importantes e na plasticidade fenotípica em resposta a
seca e condições nutricionais. Esta observação sugere que evolução a curto prazo , ou seja,
plasticidade fenotípica, baseada exclusivamente em variação epigenética é um mecanismo
importante (Zhang, Fischer et al., 2013). Em espécies perenes com ciclos de vida da ordem
de centenas de anos é bem provável que seus genomas tenham evoluído para se adaptar a
mudanças climáticas expressivas por meio de mecanismos de plasticidade possivelmente
envolvendo um importante componente de variação epigenética. Espécies de Eucalyptus
representam um excelente modelo de espécie perene para estudos deste tipo tendo em vista
a possibilidade de estudar os mesmos genótipos clonados e plantados em diferentes
ambientes.
Um recente exemplo que mostra o impacto do controle epigenético sobre caracteres
de interesse econômico é a regulação do amadurecimento do fruto de tomate por metilação.
Foi mostrado que o processo de amadurecimento é acompanhado por uma extensa
reprogramação do epigenoma. Cerca de 1% do genoma de 900 megabases do tomate é
substancialmente alterada no processo, incluindo promotores de genes anteriormente
descritos como pontos da chave do desencadeamento do amadurecimento (Zhong, Fei et
al., 2013).
105
Outros estudos também mostram os efeitos de epialelos em diferentes aspectos.
Existe a sugestão de que o vigor híbrido observado em híbridos dos acessos C24 e
Landsberg erecta de Arabidopsis thaliana seja decorrente da diminuição dos pequenos
RNAs de 24 nt que mostram correlação com metilação de DNA e nível de expressão de
genes (Groszmann, Greaves, Albertyn et al., 2011). Resultados de experimentos de
vernalização sugerem a participação do controle epigenético em diversos aspectos do
desenvolvimento de plantas, especialmente, o florescimento (Groszmann, Greaves, Albert
et al., 2011). Novamente, a base molecular da heterose funcional em Eucalyptus, ou seja, a
combinação de características favoráveis observada em híbridos interespecíficos ainda é
obscura. Sua elucidação provavelmente passará pelo estudo dos componentes de
epigenética
e
da
interação
entre
epialelos
106
das
diferentes
espécies.
ANEXO I
Anotação das sequências de Eucalyptus ortólogas a miRNAs conservados depositados no miRBase. Código da sequência
(ID), sequência, sequência de miRNA e espécie com maior similaridade no miRBase, número de bases distintas da sequência
ortóloga do miRBase (mismatches) e extensão da similaridade em bases.
ID
EUC_3918
EUC_2944
EUC_3854
EUC_8565
EUC_2420
EUC_4102
EUC_9197
EUC_2941
EUC_4474
EUC_5149
EUC_4521
EUC_3796
EUC_3814
EUC_3815
EUC_3009
EUC_3352
EUC_4589
EUC_7780
EUC_8901
EUC_7342
EUC_3863
EUC_3861
EUC_8398
EUC_4413
EUC_3007
Sequência
TATGTTTTCCTTATTAACCAA
TTGCAGAAGAGAATGGGACCT
GCCTGCTCCTGCATTTCTTGT
TGAAGGTGTTGAACGAGGTG
TTAGATTAGACGGACAAATATC
TGATTTGAAATTTTTTGTGAT
TTCTTGAAGATATCCATTTA
CGGACTTAATTGCAGACTTGA
CTCCCCAGCCAGTGCGAGGCC
TTGAATGCACCACAAGCTTGT
CCCTGAACCCTTAATCCCTAA
TGTCAGACAATAGTTTTTTCT
TGCTGCTAGAGCTATGAGTGC
GTTGCCAACGTAGAGAAGCCC
ATTGTTTTTTGAAGAGTTCGC
TTGGGTCAAAGCATTTAATCG
CAAGGGATCAGATGCACTGGG
GGAATGGTGTCTGGCTCGAG
TGCATGCACTTAGAATTTCA
CAGTGTCTTCAATTCCCTCA
TTGGACAAGGATTCTGTTGGA
TTGGATAGATTAAGAAGGAAG
CGCCTTCTTTCGCAGCTTCG
CGAGCCTCGCCCAGCTGCTGA
TTAACTGTTTTATGTCATTGA
miRBase
miR156a
miR156d
miR156d
miR156f-3p
miR156f-3p
miR156k
miR157d-3p
miR159a
miR159a
miR159a
miR159a
miR159a
miR159a
miR159a
miR159a
miR159a-5p
miR159a.1
miR159h-3p
miR159h-3p
miR159h-3p
miR160a
miR160a
miR160a
miR160f-5p
miR160f-5p
Espécie
Brassica napus
Glycine max
Glycine max
Oryza sativa
Oryza sativa
Glycine max
Arabidopsis lyrata
Arabidopsis thaliana
Arabidopsis thaliana
Arabidopsis thaliana
Arabidopsis thaliana
Arabidopsis thaliana
Arabidopsis thaliana
Arabidopsis thaliana
Arabidopsis thaliana
Glycine max
Oryza sativa
Zea mays
Zea mays
Zea mays
Arabidopsis thaliana
Arabidopsis thaliana
Arabidopsis thaliana
Oryza sativa
Oryza sativa
107
mismatches
0
0
0
2
2
0
0
0
2
2
2
2
1
2
1
3
1
1
1
3
1
0
0
0
0
Extensão da similaridade
21
21
21
20
22
21
20
21
21
21
21
21
21
21
21
21
21
20
20
20
21
21
20
21
21
EUC_7079
EUC_7074
EUC_7076
EUC_4060
EUC_7068
EUC_7198
EUC_7196
EUC_3686
EUC_7201
EUC_7078
EUC_4109
EUC_7197
EUC_4055
EUC_3816
EUC_3008
EUC_4424
EUC_5303
EUC_7875
EUC_7876
EUC_3237
EUC_7877
EUC_7225
EUC_7224
EUC_6554
EUC_6555
EUC_6552
EUC_6553
EUC_7152
EUC_8881
EUC_9033
EUC_9034
EUC_9035
EUC_7643
EUC_7436
EUC_7437
TTCCCATCTTTTCTTGTTGG
CCTTGACATCCATATTGAAC
AACAAATATGAACCTATGAC
ACCGAGCCCACGTGTCCTCTT
TTTGCTTGATTGTCACCAGA
TTGAAAAGCCAGTGGCGCGA
CACATCTTCCTCAACGATTG
CCAATGTCTCTCTCCATATTT
ATCATTGTGAAGCAGAATTC
TTTCTTGTTGGATTATACAA
CAATGTCATTAACTAGTTTTG
CGGGTGACGGAGAATTAGGG
TGGGATTTTACCTACCAACAT
AGTTGCCAAAGTAGAGAAGCC
AATTCTCGATGCCTGCTGCGA
ACTCCCACTTGGACAAACTAC
TAGTTAAGCGGTGTAAGGAAT
TCAGAGATCTTGGAAGGGAA
ACAAGTGGAGAAGTTAGTTG
GTGCGTCATAAATTATCCTCA
TTCGAGAGAAGTCATCAAGA
TACAATCTAAATCCCTTAAC
CCCCGACTGTCCCTGTTAAT
GTCATCGAGAAGAATCATTG
AGATGGAGGAAACTCACTTA
CTTGAGGTTCTTGAGATTGG
TGGTTCAAGTTGATAGGTCT
TCGAGCTTGGAGCCACCCTC
TCTACTTGAATTCATGCAAT
TTAGATGAGAAGACGAGACA
AATGAGGAAGGAAGCTAGAA
GATGAGGAATGAAGCTAGAA
AGAAGAATGATCGTTCGTTT
TTGGAAGATCTACATTGTGA
GAGGCCGGAGGCGGGGTCTT
miR162a
miR162a
miR162a
miR162a
miR162a
miR162a
miR162a
miR162a
miR162a
miR162a
miR162a
miR162a
miR162a
miR164a
miR164a
miR166a
miR166a
miR166a
miR166a
miR166a
miR166a
miR166a
miR166a
miR166a
miR166a
miR166a
miR166a
miR166a
miR166a
miR166a
miR166a
miR166a
miR166a
miR166a
miR166a
Arabidopsis thaliana
Arabidopsis thaliana
Arabidopsis thaliana
Arabidopsis thaliana
Arabidopsis thaliana
Arabidopsis thaliana
Arabidopsis thaliana
Arabidopsis thaliana
Arabidopsis thaliana
Arabidopsis thaliana
Arabidopsis thaliana
Arabidopsis thaliana
Arabidopsis thaliana
Arabidopsis thaliana
Arabidopsis thaliana
Arabidopsis thaliana
Arabidopsis thaliana
Arabidopsis thaliana
Arabidopsis thaliana
Arabidopsis thaliana
Arabidopsis thaliana
Arabidopsis thaliana
Arabidopsis thaliana
Arabidopsis thaliana
Arabidopsis thaliana
Arabidopsis thaliana
Arabidopsis thaliana
Arabidopsis thaliana
Arabidopsis thaliana
Arabidopsis thaliana
Arabidopsis thaliana
Arabidopsis thaliana
Arabidopsis thaliana
Arabidopsis thaliana
Arabidopsis thaliana
108
1
1
1
1
1
1
1
0
1
1
1
1
1
0
0
0
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
20
20
20
21
20
20
20
21
20
20
21
20
21
21
21
21
21
20
20
21
20
20
20
20
20
20
20
20
20
20
20
20
20
20
20
EUC_7649
EUC_7154
EUC_7439
EUC_8506
EUC_6445
EUC_8867
EUC_8882
EUC_8883
EUC_4492
EUC_3351
EUC_4423
EUC_3347
EUC_8027
EUC_7700
EUC_7644
EUC_4833
EUC_7878
EUC_7879
EUC_3672
EUC_7153
EUC_7438
EUC_3825
EUC_3550
EUC_6587
EUC_6586
EUC_6589
EUC_6588
EUC_2405
EUC_3547
EUC_2531
EUC_3549
EUC_3967
EUC_2409
EUC_3777
EUC_4103
CAACGTGTCGGAATTCTCTA
AATTGCACACTCCACACGAG
GGAGTGGAAGCCTCTGACAA
TTCTCGTCCTCCCCCGTCCC
AGCTTGGCTTGGTTCTGATA
ATCCTTCCCATTTCTCATTT
TTCTTGAATCAGATAAAGGC
TTCTCCAACGAGAGTTCCTT
GATGGTGTATGTGCATTGGTT
TACTTATGATCCACGTCATCG
CATTGGCAAGGGATTAGCAAG
CTAATTTATCATATGCTTTAT
TCCAGGGGACTTTGAAGGTA
GTCTGTTGAAGAGACTTGAC
AGAAGAATGATCGCTCGTTT
TGCAGGATGATGGATGGCAGA
CCTCTTGTTTGCTGTTGGCA
TGCGAGGAGGATTTGTCCAA
GTTTTGCCGGGAAATTGTGAG
TACAGTCTACTGGATCTCCA
TGACCTACTCAGAGACCTTG
CCGATTCTTCAATGTCCGTCG
TTGATGGTTCATGTTTTCTCG
TTCGTATCCAGACGTGACGA
CTCTCACCAAACGACCCATG
TAAAAGGCACCTTCCTCGAG
TAATCCAAATTTCACCTTAA
AAAAAGAACTGAGATCCATGAC
CTTGTGAGTTCGCCAATAGAA
AGTTCTATTAAGTCCTTGCATG
GCATGATTTGGTTCAGTTGAT
TCTGGAGTCTTTCTTTGGGCA
ATTCCCAAACAACCCGACTCGC
CGAGCACCATGAGAGATCGAG
AGAGCTCAAGTTACCAATAAG
miR166a
miR166a-5p
miR166a-5p
miR166c-5p
miR166d-5p
miR166d-5p
miR166d-5p
miR166d-5p
miR166d-5p
miR166e
miR166e
miR166f
miR166g-5p
miR166h-3p
miR166h-3p
miR166h-3p
miR166h-3p
miR166h-3p
miR166h-3p
miR166h-3p
miR166h-3p
miR166j-5p
miR167a
miR167a
miR167a
miR167a
miR167a
miR167a
miR167a
miR167a
miR167a
miR167a
miR167a
miR167a
miR167c
Arabidopsis thaliana
Oryza sativa
Oryza sativa
Oryza sativa
Oryza sativa
Oryza sativa
Oryza sativa
Oryza sativa
Oryza sativa
Brachypodium distachyon
Brachypodium distachyon
Brassica napus
Zea mays
Glycine max
Glycine max
Glycine max
Glycine max
Glycine max
Glycine max
Glycine max
Glycine max
Oryza sativa
Malus domestica
Citrus clementine
Citrus clementine
Malus domestica
Malus domestica
Brassica napus
Citrus clementine
Citrus clementine
Citrus clementine
Malus domestica
Citrus clementine
Arabidopsis thaliana
Vitis vinifera
109
1
1
3
1
1
1
1
1
0
1
0
0
1
2
1
1
1
1
0
1
1
2
2
0
1
1
2
1
1
1
1
1
0
2
1
20
20
20
20
21
20
20
20
21
21
21
21
20
20
20
21
20
20
21
20
20
21
21
20
20
20
20
22
21
22
21
21
22
21
21
EUC_8888
EUC_8889
EUC_8886
EUC_8887
EUC_2677
EUC_8897
EUC_8895
EUC_8894
EUC_8892
EUC_8891
EUC_8890
EUC_8896
EUC_2580
EUC_8893
EUC_6487
EUC_6484
EUC_6485
EUC_4510
EUC_6502
EUC_4511
EUC_8577
EUC_3966
EUC_4491
EUC_8952
EUC_8953
EUC_4489
EUC_8094
EUC_4081
EUC_6537
EUC_7743
EUC_2557
EUC_8559
EUC_8099
EUC_6538
EUC_9389
CAGAAAGGGTGAGTGTGGAA
AGGAGAAGCAAAGTGAAGCC
TCATCTAACGGAGGCGAAGA
AAAGGGTGAGTGTGGAAGTG
CTTCTCTTTTTTCATTTTTCC
GTCCTTTCCAATCAAAAACT
AAATTGACTGGAGCTTGAAA
CCGTAATTCATTGTTTTCTC
CCGAAAGGAGAAACAAATTA
CAAGCGAGTTTCTTCTGTCG
AGAAGGAGAAGCAAAGTGAA
TATTGAAGAGTTAAAGTTGA
TGCCAATTCAGTCCTTTCCGG
CTTCCACAGAACATAAATCA
CAAGTTGCTTAGCAGTCATG
ATAGATGGAATCTTTGCTGG
TGAGAGTTCATGTCTTTTGG
TTCGCAGGCCCTCATCTATGA
AGTCAGTCACTGAGGGCTAA
GTAGGTTACAAGTTCCTCCAA
CTATTAAGTCCTTGCATGAA
TTGCTGACCACTTCGCACGAA
TTTTGATCAAATCATGCATCT
GGAGTTGCTCCTCATCATCC
AATGTGTCGGACAATAATTG
TAATTTTTTTAAGGATAGAAA
CGGGGAATTGTAAGTGGCAG
ATATGTCGTTTCGTTAGAAAC
GAAGAACCGATAACCAAGAA
TCGGACAGCTGTGTGAAAGG
TCAGTACGGATGGGATGTCGGG
GCATCAACAGTCTATCATCA
CTTGGATGTGGTAGCCGTTT
TTGATTGTCCTTGATCTATC
GGCAAGTTGTCTTTGGCTAA
miR167d
miR167d
miR167d
miR167d
miR167d
miR167d
miR167d
miR167d
miR167d
miR167d
miR167d
miR167d
miR167d
miR167d
miR167d
miR167d
miR167d
miR167d
miR167d-3p
miR167d-3p
miR167f-3p
miR167f-3p
miR168a
miR168a
miR168a
miR168a-3p
miR169a
miR169b
miR169b
miR169b
miR169b
miR169n
miR169n
miR169r-3p
miR169r-3p
Arabidopsis thaliana
Arabidopsis thaliana
Arabidopsis thaliana
Arabidopsis thaliana
Arabidopsis thaliana
Arabidopsis thaliana
Arabidopsis thaliana
Arabidopsis thaliana
Arabidopsis thaliana
Arabidopsis thaliana
Arabidopsis thaliana
Arabidopsis thaliana
Arabidopsis thaliana
Arabidopsis thaliana
Arabidopsis thaliana
Arabidopsis thaliana
Arabidopsis thaliana
Arabidopsis thaliana
Arabidopsis lyrata
Arabidopsis lyrata
Populus trichocarpa
Populus trichocarpa
Arabidopsis thaliana
Arabidopsis thaliana
Arabidopsis thaliana
Populus trichocarpa
Arabidopsis thaliana
Arabidopsis thaliana
Arabidopsis thaliana
Arabidopsis thaliana
Malus domestica
Oryza sativa
Oryza sativa
Zea mays
Zea mays
110
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
0
3
2
1
2
0
1
1
0
0
0
1
0
1
1
2
3
2
20
20
20
20
22
20
20
20
20
20
20
20
22
20
21
21
21
21
21
21
20
21
21
20
20
21
20
21
20
20
22
20
20
20
20
EUC_3884
EUC_8547
EUC_4078
EUC_8680
EUC_3817
EUC_8737
EUC_2989
EUC_4100
EUC_3371
EUC_8679
EUC_3862
EUC_6195
EUC_5094
EUC_7895
EUC_7667
EUC_7551
EUC_3858
EUC_5210
EUC_8051
EUC_5211
EUC_8415
EUC_5208
EUC_9300
EUC_3859
EUC_5417
EUC_3819
EUC_8068
EUC_2538
EUC_4074
EUC_5466
EUC_7835
EUC_9165
EUC_8059
EUC_7141
EUC_3775
TCTCATTGTTCTCGATGACGT
TCATTGTAGATGATTTTGGC
CGAGCCTCGCCCAGCTGTTGG
GCACTTCTCCTTTCTGTTCA
TGTTGCCAAAGTAGAGAAGCC
CAAGTCTCCACAATCCACTT
GTTTCCTCATTAGTCAACTTC
TTCTTACAATGTCCACGGCTT
CTTCCTCGAGTTCATCCTTGT
GTCAAATAAGAGCCTGAAAT
TCATATATCAGACTCTATTGG
CAACCTTGCAAAATCCGTCCA
AGATCCACTTAGGTTATTATT
CTGATCCTTCTTGTACATAT
CTTCGGTGGAGAAGTCAAAA
CTCATGTCTCTACAGCAATT
TCCGACGTCGAGGTAGAGTGT
AATTGTAGGTAAGAAGTATAT
CAATGATCCTTCCGAAGGTT
CCACCGTCTTAGTACAACTAG
TCGACGTATCTGTAGAATTT
AGTGTTTCAATCCCCATGCTC
GCTCAGGAGGGATAGCGCC
AACAAAGTCAGACTTCAAGTA
TGGCGGCCAGCAGACCTTGTA
TGGGTGTCGTCCGAGCAGTTT
TGTAGGCTACGAATTGAGAC
GGCATGGGTGGTATTTGCAAGA
ATTTGAAATTTTTTGTGATAC
GACCCCTTGCCGAATCTGGCG
CATCAACAACAAACTTGCTG
TTGAGATTGGATTGGGCTAC
ACATCCGTCAAAGCTAGAAG
AGAAGAAACTGCTCGGAAAA
CTACTCCGCCTCCCAAGAATT
miR169r-3p
miR171
miR171b
miR171b
miR171b
miR171b
miR171c
miR171h-5p
miR171h-5p
miR171i
miR172a
miR172a
miR172a
miR172b
miR172c
miR172c
miR172c
miR172d
miR172d
miR172d
miR172d-5p
miR172e
miR172e
miR172g-3p
miR172g-3p
miR172g-3p
miR1862e
miR2089-5p
miR2111a
miR2118b
miR2623
miR319a
miR319a
miR319a
miR319a
Zea mays
Citrus trifoliata
Oryza sativa
Arabidopsis thaliana
Oryza sativa
Arabidopsis thaliana
Aquilegia caerulea
Populus trichocarpa
Populus trichocarpa
Cucumis melo
Arabidopsis thaliana
Arabidopsis thaliana
Arabidopsis thaliana
Nicotiana tabacum
Arabidopsis thaliana
Oryza sativa
Arabidopsis thaliana
Theobroma cacao
Vitis vinifera
Glycine max
Zea mays
Arabidopsis thaliana
Arabidopsis thaliana
Populus trichocarpa
Populus trichocarpa
Populus trichocarpa
Oryza sativa
Medicago truncatula
Populus trichocarpa
Oryza sativa
Medicago truncatula
Arabidopsis thaliana
Arabidopsis thaliana
Arabidopsis thaliana
Arabidopsis thaliana
111
3
0
0
2
1
2
2
1
1
1
0
1
1
0
2
0
2
0
1
2
2
0
3
0
0
1
2
3
0
3
3
1
1
1
3
21
20
21
20
21
20
21
21
21
20
21
21
21
20
20
20
21
21
20
21
20
21
20
21
21
21
20
22
21
21
20
20
20
20
21
EUC_8873
EUC_7550
EUC_8557
EUC_8280
EUC_8558
EUC_2417
EUC_7665
EUC_2370
EUC_8774
EUC_7309
EUC_3843
EUC_2449
EUC_3905
EUC_3952
EUC_9299
EUC_7647
EUC_8150
EUC_7670
EUC_7559
EUC_5045
EUC_3614
EUC_7560
EUC_7144
EUC_4587
EUC_8098
EUC_7145
EUC_7143
EUC_8728
EUC_4076
EUC_7557
EUC_7561
EUC_3919
EUC_3894
EUC_3965
EUC_3963
GCATGGCGTAGATCTCTTCG
ATTGCCTTATTCTTGTTCTC
CTGCAAGCATAGAGAGTTGG
CTCAACTGGTCATGCATTCT
CTGCAAGTTTTGAGAGTTGT
ATCCACATCATCGAGAAGACTG
AAAACTCGTTCACATCAAAA
TCCAATGGCTCTCTCCATATTT
TTTCTGATTTTTGTGCTTGG
TATCATACAGTGCCATTTCG
GAGAAAGAGTTGATTCGTCAA
AAGCATAAACCAATTTCGTTCT
TGTGTGTGTGTGTATATATAT
TCATGCTCTTTCCAAGAATCT
TATTGGCAAATCAACTCTT
GAGAAGAATGATCGATTGTT
TTTGCTGGAACTGATGGAAG
AAAGTCTGGATGTTATAATT
AGCATGCTTCTTTTTCAACG
GGCTCTCATCACCATAGGTGA
ATCTAGTGGATGGTGTTCTGA
ATAGTGAACAAGGAATGAAG
CCATATTTAGCCTTGGACGG
TTCGGCTTTTTAGTAAACATG
ATCAGGTCTCCAAGGTGAAC
CCTTTGTGGGTTCTAGGTTA
CAAAGGGCAGGGACGTAGTC
TCGGACCAAGCTTCATTCCC
CATCGGGCAATTTTGTTAGGT
GTTGGTTCTGCATCCGTAGA
AAGTCAAGGATAGTGAACAA
ATAGCTTGTGGGCCATAATTA
TTTTTTTTCAGCGCCCGCAAT
GTTTTAAAGTCAAATCGATCT
CCAGATTCAACGGGGTTGACA
miR319b-5p
miR319c
miR319c
miR319c
miR319g
miR3627-5p
miR3627-5p
miR3630-3p
miR3631b-3p
miR3633a-3p
miR393a
miR393a
miR393a-3p
miR393b-3p
miR393d
miR393d
miR394a
miR395a
miR395a
miR395a
miR395a
miR395a
miR395a
miR395a
miR395a
miR395a
miR395a
miR395a
miR395b
miR395d-5p
miR395d-5p
miR395d-5p
miR395d-5p
miR395d-5p
miR395d-5p
Arabidopsis lyrata
Arabidopsis thaliana
Arabidopsis thaliana
Arabidopsis thaliana
Glycine max
Vitis vinifera
Vitis vinifera
Helianthus annuus
Vitis vinifera
Vitis vinifera
Arabidopsis thaliana
Arabidopsis thaliana
Populus trichocarpa
Zea mays
Malus domestica
Malus domestica
Vitis vinifera
Medicago truncatula
Arabidopsis thaliana
Medicago truncatula
Arabidopsis thaliana
Arabidopsis thaliana
Arabidopsis thaliana
Arabidopsis thaliana
Medicago truncatula
Arabidopsis thaliana
Arabidopsis thaliana
Arabidopsis thaliana
Oryza sativa
Arabidopsis lyrata
Arabidopsis lyrata
Arabidopsis lyrata
Arabidopsis lyrata
Arabidopsis lyrata
Arabidopsis lyrata
112
2
0
0
0
0
3
1
3
3
2
0
0
1
2
1
2
1
1
1
0
2
1
1
0
0
1
1
1
0
3
2
3
3
2
3
20
20
20
20
20
22
20
22
20
20
21
22
21
21
20
20
20
20
20
21
21
20
20
21
20
20
20
20
21
20
20
21
21
21
21
EUC_4111
EUC_7558
EUC_4460
EUC_3481
EUC_3910
EUC_9340
EUC_7125
EUC_6466
EUC_9347
EUC_8561
EUC_8339
EUC_7123
EUC_5456
EUC_8057
EUC_5434
EUC_7474
EUC_4070
EUC_4464
EUC_6152
EUC_3893
EUC_3885
EUC_3926
EUC_4098
EUC_8735
EUC_3704
EUC_7411
EUC_3845
EUC_6406
EUC_4901
EUC_3709
EUC_8868
EUC_3969
EUC_8611
EUC_5441
EUC_7795
CTTAATTCCTTCCTCAGCATT
TGCCAAAGTCATCTTCAATC
CAAGTTTGAGCTCAACAAGAT
GATTAGAAATAATTTGCTCAA
CGATCGCATTTCTATGATTGA
TTCCCACAGCTTTCTTGAGC
TAATCCGTTGCCTACAAAAT
CATTGTGTGTCCCATCATCA
TTCAAGCTAGCTGTGGGAAG
TGAAAGGGATAATGGTAGAA
TCGTTTAAAGGGAAGAGGGC
TAAGAGAGAATTGAAGAGAC
GAGGCTGCAGAACCTGGGGTG
ATCGGACCAGGCTTCATTCC
AACCTCGTCATCTCGGAGAAT
CAAACTGACTACCAAGATGA
GTTGTTGGGTCGGCAATCGTG
GCGAGGCCCAGGTGGCACCGC
TGCCTTGCCATCCATATTGAA
GTCACATGGGTACAAGTTTGG
CTGTTGGAGCTGATGTCACGC
CATGAATTCTATATGTGCATG
CCCAGATCTGGGCGAGGGCTC
CCCCAATTTTTTTCTTACGA
TCAATAGCCAAAGGAAGCACT
CCAATTTCGTTCTCTGGTCA
GAATCCATCTTCTATAGTCAT
TACAGTTCCACAAGTGTCTT
GTTCCCATAATCAGTTTGGGA
GGTGGTGAGGTTGACAAAGAG
TCTTTAATTCTGTTTAGCAA
TATCTAGCCTTTCCAAAACTC
TTTCTACGACTGGAGGACTT
GTTGGGCCAAGGTCGAGGCCC
GCTCTTGAGGTAATGGGTTT
miR395d-5p
miR395f
miR396a
miR396a
miR396a
miR396b-3p
miR396b-3p
miR396c
miR396c-3p
miR396e
miR396g-3p
miR396j
miR397a
miR397a
miR397a
miR398a
miR399a-5p
miR399d
miR399e
miR399e
miR399e
miR399g
miR399g-5p
miR408
miR408-5p
miR4234
miR4414b
miR447b-3p
miR447b-3p
miR472b
miR477a
miR477a
miR477g-3p
miR482
miR482
Arabidopsis lyrata
Oryza sativa
Arabidopsis thaliana
Hevea brasiliensis
Arabidopsis thaliana
Arabidopsis lyrata
Glycine max
Cynara cardunculus
Oryza sativa
Glycine max
Zea mays
Glycine max
Arabidopsis thaliana
Arabidopsis thaliana
Brassica napus
Arabidopsis thaliana
Zea mays
Cucumis melo
Theobroma cacao
Theobroma cacao
Theobroma cacao
Cucumis melo
Zea mays
Arabidopsis thaliana
Oryza sativa
Arabidopsis lyrata
Medicago truncatula
Vitis vinifera
Vitis vinifera
Populus trichocarpa
Nicotiana tabacum
Nicotiana tabacum
Physcomitrella patens
Vitis vinifera
Vitis vinifera
113
3
0
0
2
0
0
1
1
3
1
0
3
1
0
2
2
3
0
0
1
0
2
3
1
2
3
1
3
2
3
2
3
2
1
3
21
20
21
21
21
20
20
21
20
20
20
20
21
20
21
20
21
21
21
21
21
21
21
20
21
20
21
21
21
21
20
21
20
21
20
EUC_3707
EUC_3026
EUC_4105
EUC_5447
EUC_3708
EUC_2401
EUC_5168
EUC_7348
EUC_5467
EUC_2616
EUC_2617
EUC_5517
EUC_3703
EUC_4347
EUC_8647
EUC_2388
EUC_4008
EUC_2570
EUC_2321
EUC_7349
EUC_8054
EUC_7311
EUC_7272
EUC_2380
EUC_7276
EUC_7277
EUC_7275
EUC_2434
EUC_5454
EUC_5518
EUC_5516
EUC_7278
EUC_5455
EUC_5448
EUC_7274
TCAATAGCCAAAAGAAGCCCT
GACTAGTTGAAGTAATGAGCC
GTATGACATGTCACTTATCTT
GTTGGTTGGCTTCTCTACAAT
TCAATAGCCAAACGAAGCCCT
GTCCGTACCAGTTATGAGTTGA
CGTGTTCTTGGGGACGTCGAT
AAGGCTATAGACTCGTTGAA
TCACGCACATGAGGAGACTGA
TATGCAGCATCATCAAGATTC
AGAAGTACAAGATGAGATTTT
TCCCAAGGCCGCCCATTCCGA
CAGTCCGATTCCCGGGTGGAT
ACAGGTAAAAACCCATTTTTA
CCGGCAAGTCATCCTTGGCT
ACTGATGATCATCGTCCGAGAA
TGGAAAGCATGATCCAACCAT
CCAAGCTCAGCCTCTCGATGG
TCGAACATCTCCAAGAAAGCAG
TTCCGGTTCATCCCGCATCG
CTCGGCGGACATGAACAGAC
ATCCTTGTTCTTGACGATAT
CCCGTCGCGTATTTAAGTCG
ATGCTTTCGCAGTTGTTCGTCT
GAGTCACTATTGAAGGCATG
GCAGCCCACAATATTGATCA
GAAGATGACCTTAGCAAGAG
TCTCCTAAGCTCTTTCAAAGAA
GGATGGGATGTCGGGAGAATG
TGGGCGGTCATGTTGGGACCA
AGTTGTCTTTCCCATACCTCC
TGACGATCATGTGAAGGAGA
AGTACGGATGGGATGTCGGGA
CGAAATGCTAGACTGTTTGGT
TTCTCTCTTCAAGTCCATGA
miR482
miR482
miR482
miR482
miR482
miR482a
miR482a-3p
miR482a-3p
miR482a-3p
miR482a-3p
miR482a-3p
miR482a-3p
miR482a-3p
miR482a-3p
miR482a-5p
miR482b
miR482b
miR482b
miR482b-3p
miR482c
miR482c
miR482c
miR482e
miR482e
miR482e
miR482e
miR482e
miR482e
miR482e
miR482e
miR482e
miR482e
miR482e
miR482e
miR482e
Gossypium raimondii
Gossypium raimondii
Gossypium raimondii
Gossypium raimondii
Gossypium raimondii
Pinus taeda
Glycine max
Glycine max
Malus domestica
Glycine max
Glycine max
Glycine max
Glycine max
Malus domestica
Glycine max
Gossypium hirsutum
Gossypium hirsutum
Solanum tuberosum
Nicotiana tabacum
Pinus taeda
Solanum tuberosum
Solanum tuberosum
Solanum tuberosum
Solanum tuberosum
Solanum tuberosum
Solanum tuberosum
Solanum tuberosum
Solanum tuberosum
Solanum tuberosum
Solanum tuberosum
Solanum tuberosum
Solanum tuberosum
Solanum tuberosum
Solanum tuberosum
Solanum tuberosum
114
3
2
3
3
3
3
2
2
2
3
2
3
2
2
3
3
3
3
3
2
3
3
3
2
3
3
3
3
3
3
3
1
3
2
3
21
21
21
21
21
22
21
20
21
22
22
21
21
21
20
22
21
22
22
20
20
20
20
22
20
20
20
22
21
21
21
20
21
21
20
EUC_7540
EUC_2470
EUC_8053
EUC_2469
EUC_5453
EUC_7340
EUC_2455
EUC_2294
EUC_6982
EUC_2433
EUC_2435
EUC_7273
EUC_6981
EUC_6452
EUC_6691
EUC_6768
EUC_6738
EUC_6729
EUC_6753
EUC_8267
EUC_5588
EUC_3864
EUC_2940
EUC_8013
EUC_8669
EUC_8650
EUC_3800
EUC_6524
EUC_6570
EUC_4228
EUC_3687
EUC_3803
EUC_5481
CTTGAAGCGCAAATTCTCCG
AGATCACGCTGGCAGCTTCATC
AAGAGCTTCGCCATATCCTT
TCTTGCCAATACCACCCATGCC
CTTCAAGTAATGATGACGAGT
TCAACTTCAACTCTTCAATT
AGAACTTGTTTAACTTGCATAT
ATGATAAAATGTCCGATCTAGT
TTGCCAGCCGTCTTCAAAAT
TATCTCTTTGATGGTTGGAGCT
CATCTCCTAAGCTCTTTCAAAG
TGCATCCCTTCCAAAAGTCG
CTTACGCAAAAGATCTGCTC
TCAAGAATAAATCCAGCCGT
TGAATTCATCTCCGGCATAT
CCATCAGAACTCCGAAGTTA
AAAGAAGAGGCCGGCAAGGT
CGGAGCAACAACTGATCGAA
CTCCCGAAACAAAGCTTATC
TAAAAAAGAGAGAGGTGATA
CGACTTCGATACTGATGAGTT
ATCATTCCATTCAATCAACTA
TCAGCACTAGGGTCCCCAATG
AAAGGGATAATGGTAGAAAG
CAGGCATGCCTTCAAGAGAG
TTAAGAATGTTTTGACGGAA
CCTCGGTTTGATTTGATTCAT
GAGGCTCAAAAGTTGTTCGG
CGAGCTCCCCACGATGTTAG
ATTTTGGGATGAACAAAATAG
TCCAATGTCTCTCTCCCTATT
GATCCGAAGACAACTCCTTGA
TCAACTTCTTGCAATCCAAAT
miR482e
miR482e
miR482e
miR482e
miR482e
miR482e
miR482e
miR482e
miR482e
miR482e
miR482e
miR482e
miR482e
miR5248
miR5261
miR5261
miR5261
miR5261
miR5261
miR5261
miR5261
miR530a
miR535a
miR5565g-3p
miR6214
miR6478
miR827
miR858
miR858
miR858a
miR858b
miR858b
miR858b
Solanum tuberosum
Solanum tuberosum
Solanum tuberosum
Solanum tuberosum
Solanum tuberosum
Solanum tuberosum
Solanum tuberosum
Solanum tuberosum
Solanum tuberosum
Solanum tuberosum
Solanum tuberosum
Solanum tuberosum
Solanum tuberosum
Medicago truncatula
Medicago truncatula
Medicago truncatula
Medicago truncatula
Medicago truncatula
Medicago truncatula
Medicago truncatula
Medicago truncatula
Citrus sinensis
Physcomitrella patens
Sorghum bicolor
Hordeum vulgare
Populus trichocarpa
Malus domestica
Malus domestica
Malus domestica
Arabidopsis thaliana
Arabidopsis thaliana
Arabidopsis thaliana
Arabidopsis thaliana
115
2
3
2
3
3
3
2
3
2
3
3
3
1
3
3
3
2
3
3
1
3
1
0
3
2
0
1
0
1
1
0
0
2
20
22
20
22
21
20
22
22
20
22
22
20
20
21
20
20
20
20
20
20
21
21
21
20
20
20
21
20
20
21
21
21
21
ANEXO II
Anotação das sequências de pequenos RNAs de Eucalyptus mapeadas pelo pacote
de programas miRDeep2 no genoma de referência de Eucalyptus grandis com estrutura
secundária predita a partir da sequência genômica flanqueante pelo programa RNAfold.
Cromossomo onde a sequência foi mapeada, coordenada da posição da sequência no
cromossomo (início e fim), fita senso (+) ou antisenso (-) e sequência obtida no smRNASeq.
Cromossomo
Início
Fim
Fita
Sequência
scaffold_1
5317735
5317802
-
GTTCAGTTTCTTATGATTCAGCTTGAC
scaffold_1
29793496 29793572
+
AGGTGTCATACTAAATCTGACTATTT
scaffold_1
8964013
8964065
+
TGGATATTTCAACACTTGTTGATC
scaffold_1
26041774 26041837
+
CCTTATTGTTTTAAAGCGTGGTAC
scaffold_1
11695211 11695302
-
ATACATAAGCTCAAACCAACTGGG
scaffold_1
11978313 11978358
-
CGGGTGGGCGGTTCCCGGC
scaffold_2
37526275 37526348
-
CAATTTACATGAACTCTTGATTTTGGTAG
scaffold_2
8901361
8901433
-
ACTTGTTTGGCTAGCGGGTCGGTGCAAAT
scaffold_2
30644960 30645028
+
AAGTTTTCATCATTGAAGCTCAATAG
scaffold_2
45657154 45657208
+
CAATTTCATGGTTTTATATGAGATGG
scaffold_2
43664039 43664107
-
GCCATAAATATAAAAGCAACATTGA
scaffold_2
26919578 26919653
-
ACGTTGGCCTATGAGATTGTTGGA
scaffold_2
5713770
5713832
+
CTTGAAGAATGGTTGCCAAACACC
scaffold_2
6397973
6398027
-
GGTTCAGTTCTCGGGTAGATTCAT
scaffold_2
36162697 36162757
+
TCATATTTGATTCATAACCTGTCG
scaffold_2
36163955 36164015
+
TCATATTTGATCCATCACTTGTTG
scaffold_2
60516084 60516140
+
TGCTTTGTGCTTTCAGCATTTTTA
scaffold_2
46674871 46674940
-
TTGACCAGCCATCAGCGAGGCTCG
scaffold_2
50779484 50779539
+
TATCAACTCTCAACCAGTTTTTT
scaffold_2
50114530 50114593
-
CTAATCCTCAGGTTGTGGATTAT
scaffold_2
44579347 44579420
+
AACTGCTGATCGTCCTTAGCT
scaffold_2
50114529 50114594
-
ATCCTCAGGTTGTGGATTATC
scaffold_2
21568113 21568173
+
AAATGAATATGTAGCAAGATG
scaffold_2
50757583 50757638
-
TGGAGCGGCTGTCTTCACTTT
scaffold_2
44568478 44568549
-
CTGCTGATCGTTCTTAGCTGA
scaffold_2
42520479 42520565
+
TTTCCACGACTTTTTTCCTT
scaffold_2
44181267 44181328
-
CGACGGTGAACGAATGGTT
scaffold_2
46900630 46900715
+
CACTATAAGAGCTAGCCAT
116
scaffold_2
15501504 15501553
-
GGGCTTACACCTACTCACA
scaffold_3
17384720 17384773
-
AGGGCGGTGCTAAGCTATGACCAATTG
scaffold_3
59392853 59392910
-
AACTCCTATTTCGATGTGTCTTCTAT
scaffold_3
59725906 59725963
-
GACTCCTATTTCGATGTGTCTTCTAT
scaffold_3
46124276 46124348
-
TTGACTACAATAGTTGTGAGGAGC
scaffold_3
56270845 56270898
+
AAATATTTTCTGGTGTTTGGATTG
scaffold_3
32477079 32477159
+
ACCGTTACGAATTGCTTGAAACCG
scaffold_3
77857061 77857120
-
TTTCATGGGTTTTTCGTGGAATG
scaffold_3
33774400 33774485
-
GCTCATTTCTCTTTCCGTCAAGC
scaffold_3
63101314 63101367
+
CACCAGATTCGGTGAGCTCGCG
scaffold_3
62002495 62002571
+
TTCTGGTAAATCACTGATCCGA
scaffold_3
26337656 26337740
+
GTGAAACCTATAAAGAACCTGG
scaffold_3
16901740 16901830
-
AGCAAGGGGCCTAACGCCCTCG
scaffold_3
9674215
9674291
-
AGGTCGATTCAATGAACCATGT
scaffold_3
3925073
3925143
-
GTACGTAACTGAAAATATTTT
scaffold_3
4901554
4901642
-
TACTTCTTACCTACAATTCTG
scaffold_3
63013301 63013377
+
GGGCAGTGACTTATCAGAAAA
scaffold_3
75497983 75498049
+
TCCACGCATCAATGTATTGGG
scaffold_3
22949943 22950026
+
AGCCACGGCGAGGCTCGGCCT
scaffold_3
75497983 75498048
+
CTCCACGCATCAATGTATTGG
scaffold_3
37351603 37351650
-
CTTTTGTCCTCTCCAATGAA
scaffold_3
1676342
1676426
-
CGATTTTCTTCGAGCCACT
scaffold_4
40072989 40073068
-
GAATCGACTGGTTTGGTTCGGTTCTT
scaffold_4
2856070
2856121
+
GCGTTTTGTCAGTGATCACAAAAGA
scaffold_4
1945023
1945103
-
CTCACAAGTGTGTATTTTGTATTTT
scaffold_4
10342362 10342428
+
TATAAGGGGGTAGTAATGGTTCTTG
scaffold_4
32822189 32822255
+
GGGTCTATTCTCCAAACTCCAGTTG
scaffold_4
15167020 15167088
+
CCCATTTCAGTCATCAACTAGTGT
scaffold_4
4346107
4346174
+
TCAACAATGTATATCAAGCATATT
scaffold_4
32900065 32900125
+
TCTATTTTTTGTTTGTTCACTA
scaffold_4
35712130 35712215
-
AGCATGGTGGTAAAGGCATCT
scaffold_4
10840520 10840594
-
CTGGTAAACCAGGGTCTTGT
scaffold_4
23961816 23961893
+
GAGCAAGGTACTAACTTGG
scaffold_5
2852183
2852250
+
GTTCCATGTCCATTGGCATGGCTGTTAC
scaffold_5
17245094 17245186
-
TTCGGTTCCGAGTTACTTCTCTGGA
scaffold_5
2855160
2855226
+
TACTTAAAGAGGAAAGCTACTTGT
scaffold_5
18557831 18557881
-
TATGCTTTATTATACATAAAGAA
scaffold_5
6693118
6693185
-
CTATGAACTCTTGATTTTGGTAG
scaffold_5
8969774
8969845
+
TCTCTCCCTCAAAGACTTCCGA
scaffold_5
6697174
6697239
-
GTGTAGGGCTGTCATGGGATAG
scaffold_5
57892783 57892850
-
GCCCGTTTGGTTCAATTTTGG
117
scaffold_5
8969774
8969845
+
GGAGGTCTTTGAGGTGAGTCC
scaffold_5
1765810
1765855
-
TTCTGTGATTATTTTTCGTA
scaffold_6
49705890 49705951
-
CAATTATGTGCTGGCTGTTTGATCTGT
scaffold_6
36752308 36752365
+
ACCTCATATAATAGTGTTATCTTTTT
scaffold_6
34632585 34632665
+
TCCCATCAGTTTGGTCGATCATGTC
scaffold_6
35263408 35263498
+
CTGGTTAGGCTGGGCGAGGCTCGAC
scaffold_6
52395801 52395858
+
GTCTATGGTCGCAAAGGCCAGATTT
scaffold_6
32988777 32988835
-
CTCCGATTTGGGTTCATCTCTATA
scaffold_6
34888415 34888474
+
TACTCATCCGTACTTTAATCTTA
scaffold_6
41845398 41845449
+
ATTGTTATCAAACGGGTTTCTTT
scaffold_6
49869821 49869904
-
GCTCAGGACAATGCCCATTAC
scaffold_6
46457329 46457419
-
TCGCGGCCAGGGCTCCAGATC
scaffold_6
44575129 44575214
+
CATGGTATTTTGTTACCTCCG
scaffold_7
50327614 50327699
-
CCCCGAGAATGTGTAAGCGTGGTTATTT
scaffold_7
21948032 21948097
-
TCGAGAGTATCGGAGAGTATCGAAC
scaffold_7
6629417
6629499
+
CCAGCACTGCCAATTGCTGGAGGTA
scaffold_7
52336538 52336606
-
CACTTATTTTCAGATATACATTCA
scaffold_7
19481917 19481972
+
CCAATTTTTCTATTCAAATGTTCT
scaffold_7
40119641 40119697
-
ATGATCAACGGCTGTGATGGACTC
scaffold_7
25658926 25659002
+
GCCACCACGTCAGCGATTTTCAAC
scaffold_7
35709030 35709106
-
TTTAATATTGCTTTTATCATTCAA
scaffold_7
7116505
7116568
+
ATTTGAGTAACCGAACCTTTCTC
scaffold_7
13245381 13245458
+
AGGTCGATTCAATAGAACCATGT
scaffold_7
6542066
6542138
-
AGAATTTGGTGGAGCTGGAGAC
scaffold_7
33275771 33275832
+
TAGCAACTGTGCTAGGGACCGT
scaffold_7
44038972 44039057
-
TGTTTATGTTTAAAAATTGTTA
scaffold_7
27629283 27629350
+
GCCCATTTGGTTCAACTTTGG
scaffold_7
18424906 18424950
+
TGATATGCCACGGAAGAATAG
scaffold_7
33275052 33275123
+
GCTGGTTGGGCAGCTAAGGAG
scaffold_7
35441197 35441255
+
ACTTCTGACGGACGTGGGAAA
scaffold_7
35441198 35441255
+
CTTCTGACGGACGTGGGAAAG
scaffold_7
18342016 18342088
-
GACGATAGTTCATGCACGAAT
scaffold_7
41617841 41617898
+
GGTTTGGTTTCAAGATTAATT
scaffold_7
23809792 23809871
-
AAGTCCTTAGTCAGAGGTG
scaffold_8
31126504 31126554
+
GTCGTTGTCAGTGTTGTCGTCTTCG
scaffold_8
31133935 31134009
+
GTAATTCAACATGTTATTGTCATTG
scaffold_8
49196511 49196574
+
GTTTCGAAATTGAAATGGCTTGCC
scaffold_8
38204273 38204339
+
TTGACGTTGTTCAATGCTATAAAA
scaffold_8
17410401 17410490
-
CCCCATGGGGTCTCAATCAATCTC
scaffold_8
8730809
8730857
-
AATAGAGTTGATCCTCGGTCTTA
scaffold_8
69574908 69574983
+
GCATTCGGCCGAATGCTAAAAGC
118
scaffold_8
7443115
7443186
+
AGATCACGCTGGCAGCTTCATC
scaffold_8
1973507
1973571
+
TCCTACTTAGCCGCCCAATCAA
scaffold_8
5335410
5335487
-
CCCTTGCAAGTTTATCCGGTG
scaffold_8
36363532 36363612
+
ATGTCAAGCTTAAAATCAAAT
scaffold_8
32371749 32371829
+
ATCTCAAGCTCAAAATCAAAT
scaffold_8
53906658 53906740
-
TGCTGCAAGTACTCAATGCCC
scaffold_8
19256241 19256320
-
AATGCATGAATCAGGTCCATG
scaffold_8
59285796 59285842
+
TGGGTCCGCATGACCTCAGG
scaffold_9
28910581 28910654
+
TCTTTGTTTCTTTCGTTTGGTTGTTG
scaffold_9
8685865
8685936
-
CTTGCATCAAATCAGCAGTGGTCTTC
scaffold_9
20015643 20015724
-
TCCTTGCTTCTCCCTCATGCAAAGC
scaffold_9
19201822 19201892
-
AATCCCGAGAGACATTCAATAAAT
scaffold_9
23230509 23230566
+
CATGAAATAGAGTGGAACGAGCCC
scaffold_9
+
ACCTTGGGCTTTTAGCCTTCTAAA
scaffold_9
38159437 38159505
+
GCAAAGACTTCTTCAATAAATGC
scaffold_9
28998996 28999082
+
CCGTCTCTTCCTGCGACAAGATG
scaffold_9
19977754 19977836
-
TGGCTTCTCCCTCACGCAAAGC
scaffold_9
578357
+
CAATGTCGTCCTTGATCTTGA
scaffold_9
23843047 23843109
-
TCAAGAATTTGACTTTCAAAG
scaffold_9
26196287 26196368
+
TACTCCAGGCTACTTTCAATA
scaffold_9
22353844 22353900
+
TGCCGGATCGTACGAAGTTAG
scaffold_9
28988680 28988747
+
TGCCATCCTTCTACGACATGA
scaffold_9
33470517 33470600
-
TGTCGTTTTTTTGCAGTCAAA
-
CAGAGGCACCGAATTAGAAT
scaffold_9
891672
578415
364030
891747
364074
scaffold_10
24405493 24405580
-
TGGGTCGGTCCTTGATCCTGGAATTCC
scaffold_10
28846438 28846508
+
CCAATATTAAACAAGTTTCTATTCTTT
scaffold_10
10953566 10953659
+
TTCACAATATTCCTCTCTTTTCTCC
scaffold_10
17647583 17647649
+
CGCGCTCGCCGATCTGGTGAGTCTC
scaffold_10
10795415 10795496
+
AGGAACGTGAAACTTACTTGAATC
scaffold_10
19921359 19921442
-
AATCAAATCCTAAAACTTTTCAAA
scaffold_10
19349778 19349829
-
GTCACTAGGCCTCGACCTTGG
scaffold_10
12142684 12142773
+
TTTTAAGGTCTTGCTAAGGAC
scaffold_11
29739765 29739832
+
GTAGGATATGGTGAGGTCACAAAGTTG
scaffold_11
19890922 19890989
+
TTGACTTATTCCAAATTCCAAAGTTG
scaffold_11
40625339 40625414
-
CGGGTTAGTCGGAACCATTGATCA
scaffold_11
40625339 40625416
-
ACCGGGTTAGTCGGAACCATTGAT
scaffold_11
40625335 40625416
-
ATGGTTGTGATTGACTCGGTCCAT
scaffold_11
42245591 42245653
-
CGAGAAAGTTGAAAGCCCAAGGCA
scaffold_11
23723532 23723619
-
TCTTCTCTTCCACAATGTTGAA
scaffold_11
17541956 17542042
-
TCTTCTCTTCCGCAATGTTCAA
scaffold_11
43275663 43275749
+
TCTTCCATTTTCCCTCCTCTT
119
scaffold_11
42264074 42264150
+
GATCATGCTGGTTGCTTCAAC
scaffold_11
42711502 42711549
-
TGAGGTCACGCAGACCTCAGG
120
BIBLIOGRAFIA
Addo-Quaye, C., T. W. Eshoo, et al. Endogenous siRNA and miRNA targets identified by
sequencing of the Arabidopsis degradome. Curr Biol, v.18, n.10, May 20, p.758-62. 2008.
Ahuja, M. R. e D. B. Neale. Evolution of Genome Size in Conifers. . Silvae Genetica, v.54,
n.3, p.126-137. 2005.
Allen, E. e M. D. Howell. miRNAs in the biogenesis of trans-acting siRNAs in higher
plants. Semin Cell Dev Biol, v.21, n.8, Oct, p.798-804. 2010.
Allen, E., Z. Xie, et al. microRNA-directed phasing during trans-acting siRNA biogenesis
in plants. Cell, v.121, n.2, Apr 22, p.207-21. 2005.
Allmer, J. e M. Yousef. Computational methods for ab initio detection of microRNAs.
Front Genet, v.3, p.209. 2012.
Alonso-Peral, M. M., J. Li, et al. The microRNA159-regulated GAMYB-like genes inhibit
growth and promote programmed cell death in Arabidopsis. Plant Physiol, v.154, n.2, Oct,
p.757-71. 2010.
Altschul, S. F., T. L. Madden, et al. Gapped BLAST and PSI-BLAST: a new generation of
protein database search programs. Nucleic Acids Res, v.25, n.17, Sep 1, p.3389-402. 1997.
Amarilyo, G. e A. La Cava. miRNA in systemic lupus erythematosus. Clin Immunol,
v.144, n.1, Jul, p.26-31. 2012.
Ambros, V., R. C. Lee, et al. MicroRNAs and other tiny endogenous RNAs in C. elegans.
Curr Biol, v.13, n.10, May 13, p.807-18. 2003.
Anokye-Danso, F., M. Snitow, et al. How microRNAs facilitate reprogramming to
pluripotency. J Cell Sci, Oct 17.
121
Arazi, T., M. Talmor-Neiman, et al. Cloning and characterization of micro-RNAs from
moss. Plant Journal, v.43, n.6, p.837-848. 2005.
Arif, M. A., I. Fattash, et al. DICER-LIKE3 activity in Physcomitrella patens DICERLIKE4 mutants causes severe developmental dysfunction and sterility. Mol Plant, v.5, n.6,
Nov, p.1281-94. 2012.
Assis, T. F. D. Production and use of Eucalyptus hybrids for industrial purposes.
Proceedings of the QFRI/CRC Workshop on Hybrid Breeding and Genetics of Forest
Trees. Brisbane, Australia: Department of Primary Industries, 2000. 63–74 p.
Aukerman, M. J. e H. Sakai. Regulation of flowering time and floral organ identity by a
MicroRNA and its APETALA2-like target genes. Plant Cell, v.15, n.11, Nov, p.2730-41.
2003.
Axtell, M. J. Classification and Comparison of Small RNAs from Plants. Annu Rev Plant
Biol, Jan 16. 2013.
Axtell, M. J. e D. P. Bartel. Antiquity of MicroRNAs and Their Targets in Land Plants.
Plant Cell, v.17, n.6, p.1658-1673. 2005.
Axtell, M. J. e J. L. Bowman. Evolution of plant microRNAs and their targets. Trends Plant
Sci, v.13, n.7, Jul, p.343-9. 2008.
Axtell, M. J., C. Jan, et al. A two-hit trigger for siRNA biogenesis in plants. Cell, v.127,
n.3, Nov 3, p.565-77. 2006.
Axtell, M. J., J. A. Snyder, et al. Common functions for diverse small RNAs of land plants.
Plant Cell, v.19, n.6, p.1750-1769. 2007.
Axtell, M. J., J. O. Westholm, et al. Vive la difference: biogenesis and evolution of
microRNAs in plants and animals. Genome Biol, v.12, n.4, p.221. 2011.
Bartel, D. P. MicroRNAs: genomics, biogenesis, mechanism, and function. Cell, v.116, n.2,
p.281-297. 2004.
122
Bartel, D. P. e C. Z. Chen. Micromanagers of gene expression: the potentially widespread
influence of metazoan microRNAs. Nature Reviews Genetics, v.5, n.5, p.396-400. 2004.
Baulcombe, D. RNA silencing in plants. Nature, v.431, n.7006, Sep 16, p.356-363. 2004.
Baumberger, N. e D. C. Baulcombe. Arabidopsis ARGONAUTE1 is an RNA Slicer that
selectively recruits microRNAs and short interfering RNAs. Proc Natl Acad Sci U S A,
v.102, n.33, Aug 16, p.11928-33. 2005.
Bedon, F., J. Grima-Pettenati, et al. Conifer R2R3-MYB transcription factors: sequence
analyses and gene expression in wood-forming tissues of white spruce (Picea glauca). BMC
Plant Biol, v.7, p.17. 2007.
Bolstad, B. M., R. A. Irizarry, et al. A comparison of normalization methods for high
density oligonucleotide array data based on variance and bias. Bioinformatics, v.19, n.2,
Jan 22, p.185-93. 2003.
Bonnet, E., Y. He, et al. TAPIR, a web server for the prediction of plant microRNA targets,
including target mimics. Bioinformatics, v.26, n.12, Jun 15, p.1566-8. 2010.
Breakfield, N. W., D. L. Corcoran, et al. High-resolution experimental and computational
profiling of tissue-specific known and novel miRNAs in Arabidopsis. Genome Res, v.22,
n.1, Jan, p.163-76. 2011.
Carthew, R. W. e E. J. Sontheimer. Origins and Mechanisms of miRNAs and siRNAs. Cell,
v.136, n.4, Feb 20, p.642-55. 2009.
Chang, S., J. Puryear, et al. A Simple and Efficient Method for Isolating RNA from Pine
Trees. Plant Molecular Biology Reporter, v.11, n.2, p.113-116. 1993.
Chen, H., S. Jiang, et al. Improving panicle exsertion of rice cytoplasmic male sterile line
by combination of artificial microRNA and artificial target mimic. Plant Biotechnol J, Nov
17. 2012.
123
Chen, H. M., Y. H. Li, et al. Bioinformatic prediction and experimental validation of a
microRNA-directed tandem trans-acting siRNA cascade in Arabidopsis. Proc Natl Acad
Sci U S A, v.104, n.9, Feb 27, p.3318-23. 2007.
Chen, X. Small RNAs and their roles in plant development. Annu Rev Cell Dev Biol, v.25,
p.21-44. 2009.
______. Small RNAs in development - insights from plants. Curr Opin Genet Dev, v.22,
n.4, Aug, p.361-7. 2012.
Chinnusamy, V. e J. K. Zhu. RNA-directed DNA methylation and demethylation in plants.
Sci China C Life Sci, v.52, n.4, Apr, p.331-43. 2009.
Chitwood, D. H., F. T. Nogueira, et al. Pattern formation via small RNA mobility. Genes
Dev, v.23, n.5, Mar 1, p.549-54. 2009.
Cleveland, W. S. e S. J. Devlin. Locally-Weighted Regression: An Approach to Regression
Analysis by Local Fitting. . Journal of the American Statistical Association v.83, n.403,
p.596–610. 1988.
Corsini, L. R., G. Bronte, et al. The role of microRNAs in cancer: diagnostic and
prognostic biomarkers and targets of therapies. Expert Opin Ther Targets, v.16 Suppl 2,
Apr, p.S103-9. 2012.
Cuperus, J. T., A. Carbonell, et al. Unique functionality of 22-nt miRNAs in triggering
RDR6-dependent siRNA biogenesis from target transcripts in Arabidopsis. Nat Struct Mol
Biol, v.17, n.8, 2010, p.997-1003. 2010.
Cuperus, J. T., N. Fahlgren, et al. Evolution and functional diversification of MIRNA
genes. Plant Cell, v.23, n.2, Feb, p.431-42. 2011.
D'alessandra, Y., G. Pompilio, et al. MicroRNAs and myocardial infarction. Curr Opin
Cardiol, v.27, n.3, May, p.228-35. 2012.
Dai, X. e P. X. Zhao. psRNATarget: a plant small RNA target analysis server. Nucleic
Acids Res, v.39, n.Web Server issue, Jul, p.W155-9. 2011.
124
De La Luz Gutierrez-Nava, M., M. J. Aukerman, et al. Artificial trans-acting siRNAs
confer consistent and effective gene silencing. Plant Physiol, v.147, n.2, Jun, p.543-51.
2008.
Deluc, L., F. Barrieu, et al. Characterization of a grapevine R2R3-MYB transcription factor
that regulates the phenylpropanoid pathway. Plant Physiol, v.140, n.2, Feb, p.499-511.
2006.
Ding, D., L. Zhang, et al. Differential expression of miRNAs in response to salt stress in
maize roots. Ann Bot, v.103, n.1, Jan, p.29-38. 2009.
Dolgosheina, E. V., R. D. Morin, et al. Conifers have a unique small RNA silencing
signature. RNA, v.14, n.8, Aug, p.1508-15. 2008.
Du, J., E. Miura, et al. The Populus Class III HD ZIP transcription factor POPCORONA
affects cell differentiation during secondary growth of woody stems. PLoS One, v.6, n.2,
p.e17458. 2011.
Dunoyer, P., G. Schott, et al. Small RNA duplexes function as mobile silencing signals
between plant cells. Science, v.328, n.5980, May 14, p.912-6. 2010.
Eldem, V., U. Celikkol Akcay, et al. Genome-wide identification of miRNAs responsive to
drought in peach (Prunus persica) by high-throughput deep sequencing. PLoS One, v.7,
n.12, p.e50298. 2012.
Fahlgren, N., M. D. Howell, et al. High-throughput sequencing of Arabidopsis
microRNAs: evidence for frequent birth and death of MIRNA genes. PLoS ONE, v.2, n.2,
p.e219. 2007.
Fahlgren, N., S. Jogdeo, et al. MicroRNA gene evolution in Arabidopsis lyrata and
Arabidopsis thaliana. Plant Cell, v.22, n.4, Apr, p.1074-89. 2010.
Fahlgren, N., T. A. Montgomery, et al. Regulation of AUXIN RESPONSE FACTOR3 by
TAS3 ta-siRNA affects developmental timing and patterning in Arabidopsis. Curr Biol,
v.16, n.9, May 9, p.939-44. 2006.
125
Fao. GLOBAL WOOD AND WOOD PRODUCTS FLOW. FAO. Shangai. 2007
Fire, A., S. Xu, et al. Potent and specific genetic interference by double-stranded RNA in
Caenorhabditis elegans. Nature, v.391, n.6669, Feb 19, p.806-11. 1998.
Friedlander, M. R., S. D. Mackowiak, et al. miRDeep2 accurately identifies known and
hundreds of novel microRNA genes in seven animal clades. Nucleic Acids Res, v.40, n.1,
Jan, p.37-52. 2011.
Frizzi, A. e S. Huang. Tapping RNA silencing pathways for plant biotechnology. Plant
Biotechnol J, v.8, n.6, Aug, p.655-77. 2010.
Gaiotto, F. A., M. Bramucci, et al. Estimation of outcrossing rate in a breeding population
of Eucalyptus urophylla s.t. Blake with dominant RAPD and AFLP markers. . Theoretical
and Applied Genetics v.95, p.842–849. 1997.
Gebelin, V., X. Argout, et al. Identification of novel microRNAs in Hevea brasiliensis and
computational prediction of their targets. BMC Plant Biol, v.12, p.18. 2012.
Geddy, R. e G. G. Brown. Genes encoding pentatricopeptide repeat (PPR) proteins are not
conserved in location in plant genomes and may be subject to diversifying selection. BMC
Genomics, v.8, p.130. 2007.
Govaerts, R., M. Sobral, et al. World checklist of Myrtaceae. Kew: Kew Publishing, Royal
Botanic Gardens. 2008
Grattapaglia, D. Integrating genomics into Eucalyptus breeding. Genetics and Molecular
Research, v. 3, n.3, p.369-379. 2004.
Grattapaglia, D. e M. Kirst. Eucalyptus applied genomics: from gene sequences to breeding
tools. New Phytologist, v.179, n.4, p.911-929. 2008.
Grattapaglia, D., R. E. Vaillancour, et al. Progress in Myrtaceae genetics and genomics:
Eucalyptus as the pivotal genus. Tree Genetics & Genomes, v.8, n.3, p.463-508. 2012.
126
Griffin, A. R., I. P. Burgess, et al. Patterns of natural and manipulated hybridisation in the
genus Eucalyptus L‟Herit: a review. Australian Journal of Botany, v.36, p.41–66. 1988.
Griffiths-Jones, S., H. K. Saini, et al. miRBase: tools for microRNA genomics. Nucleic
Acids Res, v.36, n.Database issue, Jan, p.D154-8. 2008.
Groszmann, M., I. K. Greaves, et al. Epigenetics in plants-vernalisation and hybrid vigour.
Biochim Biophys Acta, v.1809, n.8, Aug, p.427-37. 2011.
______. Changes in 24-nt siRNA levels in Arabidopsis hybrids suggest an epigenetic
contribution to hybrid vigor. Proc Natl Acad Sci U S A, v.108, n.6, Feb 8, p.2617-22. 2011.
Gursanscky, N. R., I. R. Searle, et al. Mobile microRNAs hit the target. Traffic, v.12, n.11,
Nov, p.1475-82. 2011.
Guzman, F., M. P. Almerao, et al. Identification of microRNAs from Eugenia uniflora by
high-throughput sequencing and bioinformatics analysis. PLoS One, v.7, n.11, p.e49811.
2012.
Hofacker, I. L. Vienna RNA secondary structure server. Nucleic Acids Res, v.31, n.13, Jul
1, p.3429-31. 2003.
Howell, M. D., N. Fahlgren, et al. Genome-wide analysis of the RNA-DEPENDENT RNA
POLYMERASE6/DICER-LIKE4 pathway in Arabidopsis reveals dependency on miRNAand tasiRNA-directed targeting. Plant Cell, v.19, n.3, Mar, p.926-42. 2007.
Hsieh, L. C., S. I. Lin, et al. Uncovering small RNA-mediated responses to phosphate
deficiency in Arabidopsis by deep sequencing. Plant Physiol, v.151, n.4, Dec, p.2120-32.
2009.
Jin, W., N. Li, et al. Identification and verification of microRNA in wheat (Triticum
aestivum). Journal of Plant Research, v.121, p.351-355. 2008.
Johnson, C., A. Kasprzewska, et al. Clusters and superclusters of phased small RNAs in the
developing inflorescence of rice. Genome Res, v.19, n.8, Aug, p.1429-40. 2009.
127
Jones-Rhoades, M. W. Conservation and divergence in plant microRNAs. Plant Mol Biol,
v.80, n.1, Sep, p.3-16. 2012.
Jones-Rhoades, M. W., D. P. Bartel, et al. MicroRNAS and their regulatory roles in plants.
Annu Rev Plant Biol, v.57, p.19-53. 2006.
Jung, J. H. e C. M. Park. MIR166/165 genes exhibit dynamic expression patterns in
regulating shoot apical meristem and floral development in Arabidopsis. Planta, v.225, n.6,
May, p.1327-38. 2007.
Khraiwesh, B., M. A. Arif, et al. Transcriptional control of gene expression by microRNAs.
Cell, v.140, n.1, Jan 8, p.111-22. 2010.
Khraiwesh, B., J. K. Zhu, et al. Role of miRNAs and siRNAs in biotic and abiotic stress
responses of plants. Biochim Biophys Acta, v.1819, n.2, Feb, p.137-48. 2011.
Kidner, C. A. e R. A. Martienssen. The developmental role of microRNA in plants. Curr
Opin Plant Biol, v.8, n.1, p.38-44. 2005.
Ko, J. H., C. Prassinos, et al. Developmental and seasonal expression of PtaHB1, a Populus
gene encoding a class III HD-Zip protein, is closely associated with secondary growth and
inversely correlated with the level of microRNA (miR166). New Phytol, v.169, n.3, p.46978. 2006.
______. Developmental and seasonal expression of PtaHB1, a Populus gene encoding a
class III HD-Zip protein, is closely associated with secondary growth and inversely
correlated with the level of microRNA (miR166). New Phytologist, v.169, n.3, p.469-478.
2006.
Kozomara, A. e S. Griffiths-Jones. miRBase: integrating microRNA annotation and deepsequencing data. Nucleic Acids Res, v.39, n.Database issue, Jan, p.D152-7. 2011.
Kruszka, K., M. Pieczynski, et al. Role of microRNAs and other sRNAs of plants in their
changing environments. J Plant Physiol, v.169, n.16, Nov 1, p.1664-72. 2012.
128
Kulcheski, F. R., L. F. De Oliveira, et al. Identification of novel soybean microRNAs
involved in abiotic and biotic stresses. BMC Genomics, v.12, p.307. 2011.
Kunej, T., I. Godnic, et al. Cross talk between microRNA and coding cancer genes. Cancer
J, v.18, n.3, May-Jun, p.223-31. 2012.
Ladiges, P. Y., F. Udovicic, et al. Australian biogeographical connections and the
phylogeny of large genera in the plant family Myrtaceae. Journal of Biogeography, v.30,
n.7, Jul, p.989-998. 2003.
Lee, R. C., R. L. Feinbaum, et al. The C. elegans heterochronic gene lin-4 encodes small
RNAs with antisense complementarity to lin-14. Cell, v.75, n.5, p.843-854. 1993.
Lertpanyasampatha, M., L. Gao, et al. Genome-wide analysis of microRNAs in rubber tree
(Hevea brasiliensis L.) using high-throughput sequencing. Planta, v.236, n.2, Aug, p.43745. 2012.
Li, F. e S. W. Ding. Virus counterdefense: diverse strategies for evading the RNA-silencing
immunity. Annu Rev Microbiol, v.60, p.503-31. 2006.
Li, F., D. Pignatta, et al. MicroRNA regulation of plant innate immune receptors. Proc Natl
Acad Sci U S A, v.109, n.5, Jan 31, p.1790-5. 2012.
Li, H. e R. Durbin. Fast and accurate short read alignment with Burrows-Wheeler
transform. Bioinformatics, v.25, n.14, Jul 15, p.1754-60. 2009.
Lu, C., S. S. Tej, et al. Elucidation of the small RNA component of the transcriptome.
Science, v.309, n.5740, p.1567-1569. 2005.
Lu, S., Y. H. Sun, et al. MicroRNAs in loblolly pine (Pinus taeda L.) and their association
with fusiform rust gall development. Plant J, v.51, n.6, Sep, p.1077-98. 2007.
______. Novel and mechanical stress-responsive MicroRNAs in Populus trichocarpa that
are absent from Arabidopsis. Plant Cell, v.17, n.8, p.2186-2203. 2005.
129
Luo, Q. J., A. Mittal, et al. An autoregulatory feedback loop involving PAP1 and TAS4 in
response to sugars in Arabidopsis. Plant Mol Biol, v.80, n.1, Sep, p.117-29. 2011.
Lynd, L. R., M. S. Laser, et al. How biotech can transform biofuels. Nature Biotechnology,
v.26, n.2, p.169-172. 2008.
Mallory, A. C., T. Elmayan, et al. MicroRNA maturation and action--the expanding roles
of ARGONAUTEs. Curr Opin Plant Biol, v.11, n.5, Oct, p.560-6. 2008.
Mallory, A. C. e H. Vaucheret. Functions of microRNAs and related small RNAs in plants.
Nature Genetics, v.38, p. Suppl:S31-36. 2006.
Manavella, P. A., D. Koenig, et al. Plant secondary siRNA production determined by
microRNA-duplex structure. Proc Natl Acad Sci U S A, v.109, n.7, Feb 14, p.2461-6. 2012.
Marian, A. J. Elements of 'missing heritability'. Curr Opin Cardiol, v.27, n.3, May, p.197201. 2012.
Martinez, G., J. Forment, et al. High-throughput sequencing, characterization and detection
of new and conserved cucumber miRNAs. PLoS One, v.6, n.5, p.e19523. 2011.
Matranga, C. e P. D. Zamore. Small silencing RNAs. Current Biology, v.17, n.18, p.789793. 2007.
Mecchia, M. A., J. M. Debernardi, et al. MicroRNA miR396 and RDR6 synergistically
regulate leaf development. Mech Dev, Aug 4. 2012.
Meyers, B. C., M. J. Axtell, et al. Criteria for annotation of plant MicroRNAs. Plant Cell,
v.20, n.12, Dec, p.3186-90. 2008.
Meyers, B. C., A. Kozik, et al. Genome-wide analysis of NBS-LRR-encoding genes in
Arabidopsis. Plant Cell, v.15, n.4, Apr, p.809-34. 2003.
Mi, S., T. Cai, et al. Sorting of small RNAs into Arabidopsis argonaute complexes is
directed by the 5' terminal nucleotide. Cell, v.133, n.1, Apr 4, p.116-27. 2008.
130
Molnar, A., C. W. Melnyk, et al. Small silencing RNAs in plants are mobile and direct
epigenetic modification in recipient cells. Science, v.328, n.5980, May 14, p.872-5. 2010.
Montgomery, T. A., M. D. Howell, et al. Specificity of ARGONAUTE7-miR390
interaction and dual functionality in TAS3 trans-acting siRNA formation. Cell, v.133, n.1,
Apr 4, p.128-41. 2008.
Montgomery, T. A., S. J. Yoo, et al. AGO1-miR173 complex initiates phased siRNA
formation in plants. Proc Natl Acad Sci U S A, v.105, n.51, Dec 23, p.20055-62. 2008.
Moran, G., C. B. J, et al. Reduction in levels of inbreeding in a seed orchard of Eucalyptus
regnans F. Muell, compared with natural populations. Silvae Genetica v.38, p.32–36. 1989.
Morin, R. D., G. Aksay, et al. Comparative analysis of the small RNA transcriptomes of
Pinus contorta and Oryza sativa. Genome Res, v.18, n.4, Apr, p.571-84. 2008.
Mosher, R. A. e C. W. Melnyk. siRNAs and DNA methylation: seedy epigenetics. Trends
Plant Sci, v.15, n.4, Apr, p.204-10. 2010.
Nag, A., S. King, et al. miR319a targeting of TCP4 is critical for petal growth and
development in Arabidopsis. Proc Natl Acad Sci U S A, v.106, n.52, Dec 29, p.22534-9.
2009.
Napoli, C., C. Lemieux, et al. Introduction of a Chimeric Chalcone Synthase Gene into
Petunia Results in Reversible Co-Suppression of Homologous Genes in trans. Plant Cell,
v.2, n.4, Apr, p.279-289. 1990.
Navarro, L., F. Jay, et al. Suppression of the microRNA pathway by bacterial effector
proteins. Science, v.321, n.5891, Aug 15, p.964-7. 2008.
Nikitina, E. G., L. N. Urazova, et al. MicroRNAs and human cancer. Exp Oncol, v.34, n.1,
p.2-8. 2012.
Nikovics, K., T. Blein, et al. The balance between the MIR164A and CUC2 genes controls
leaf margin serration in Arabidopsis. Plant Cell, v.18, n.11, Nov, p.2929-45. 2006.
131
Ong, S. S. e R. Wickneswari. Expression profile of small RNAs in Acacia mangium
secondary xylem tissue with contrasting lignin content - potential regulatory sequences in
monolignol biosynthetic pathway. BMC Genomics, v.12 Suppl 3, Nov 30, p.S13. 2012.
Osakabe, Y., S. Kajita, et al. Genetic engineering of woody plants: current and future
targets in a stressful environment. Physiol Plant, v.142, n.2, Jun, p.105-17. 2011.
Ossowski, S., R. Schwab, et al. Gene silencing in plants using artificial microRNAs and
other small RNAs. Plant J, v.53, n.4, Feb, p.674-90. 2008.
Papageorgiou, N., D. Tousoulis, et al. The role of microRNAs in cardiovascular disease.
Curr Med Chem, v.19, n.16, p.2605-10. 2012.
Park, W., J. Li, et al. CARPEL FACTORY, a Dicer homolog, and HEN1, a novel protein,
act in microRNA metabolism in Arabidopsis thaliana. Curr Biol, v.12, n.17, Sep 3, p.148495. 2002.
Patzlaff, A., S. Mcinnis, et al. Characterisation of a pine MYB that regulates lignification.
Plant J, v.36, n.6, Dec, p.743-54. 2003.
Peragine, A., M. Yoshikawa, et al. SGS3 and SGS2/SDE1/RDR6 are required for juvenile
development and the production of trans-acting siRNAs in Arabidopsis. Genes Dev, v.18,
n.19, Oct 1, p.2368-79. 2004.
Pfaff, N., T. Moritz, et al. miRNAs involved in the generation, maintenance, and
differentiation of pluripotent cells. J Mol Med (Berl), v.90, n.7, Jul, p.747-52.
Potts, B. M. e M. Savva, Eds. Self-incompatibility in Eucalyptus. Pollination „88.
Melbourne: University of Melbourne, p.165–170, Pollination „88ed. 1988.
Prufer, K., U. Stenzel, et al. PatMaN: rapid alignment of short sequences to large databases.
Bioinformatics, v.24, n.13, Jul 1, p.1530-1. 2008.
Pryor, L. D. e L. A. S. Johnson. A classification of the eucalypts. Australia: Australian
National University Press. 1971
132
Rajagopalan, R., H. Vaucheret, et al. A diverse and evolutionarily fluid set of microRNAs
in Arabidopsis thaliana. Genes and Development, v.20, p.3407-3425. 2006.
Rivals, E., C. Bruyere, et al. Formation of the Arabidopsis pentatricopeptide repeat family.
Plant Physiol, v.141, n.3, Jul, p.825-39. 2006.
Robischon, M., J. Du, et al. The Populus class III HD ZIP, popREVOLUTA, influences
cambium initiation and patterning of woody stems. Plant Physiol, v.155, n.3, Mar, p.121425. 2011.
Romano, N. e G. Macino. Quelling: transient inactivation of gene expression in Neurospora
crassa by transformation with homologous sequences. Mol Microbiol, v.6, n.22, Nov,
p.3343-53. 1992.
Schreiber, A. W., B. J. Shi, et al. Discovery of barley miRNAs through deep sequencing of
short reads. BMC Genomics, v.12, p.129. 2011.
Schuler, M. A. e D. Werck-Reichhart. Functional genomics of P450s. Annu Rev Plant Biol,
v.54, p.629-67. 2003.
Schwab, R., A. Maizel, et al. Endogenous TasiRNAs mediate non-cell autonomous effects
on gene regulation in Arabidopsis thaliana. PLoS One, v.4, n.6, p.e5980. 2009.
Schwab, R., J. F. Palatnik, et al. Specific effects of microRNAs on the plant transcriptome.
Development Cell, v.8, n.4, p.517-527. 2005.
Shivaprasad, P. V., H. M. Chen, et al. A microRNA superfamily regulates nucleotide
binding site-leucine-rich repeats and other mRNAs. Plant Cell, v.24, n.3, Mar, p.859-74.
2012.
Silvicultura, S. B. D. Fatos e Números do Brasil Florestal. Sociedade Brasileira de
Silvicultura. 2003
Song, C., J. Fang, et al. Identification and characterization of 27 conserved microRNAs in
citrus. Planta, v.230, n.4, Sep, p.671-85. 2009.
133
Song, C., C. Wang, et al. Deep sequencing discovery of novel and conserved microRNAs
in trifoliate orange (Citrus trifoliata). BMC Genomics, v.11, p.431. 2010.
Song, C., M. Yu, et al. Validation and characterization of Citrus sinensis microRNAs and
their target genes. BMC Res Notes, v.5, p.235. 2012.
Song, Q. X., Y. F. Liu, et al. Identification of miRNAs and their target genes in developing
soybean seeds by deep sequencing. BMC Plant Biol, v.11, p.5. 2011.
Stracke, R., H. Ishihara, et al. Differential regulation of closely related R2R3-MYB
transcription factors controls flavonol accumulation in different parts of the Arabidopsis
thaliana seedling. Plant J, v.50, n.4, May, p.660-77. 2007.
Sun, Y. H., R. Shi, et al. MicroRNAs in trees. Plant Mol Biol, v.80, n.1, Sep, p.37-53.
2011.
Sunkar, R., T. Girke, et al. Cloning and Characterization of MicroRNAs from Rice. Plant
Cell, v.17, n.5, p.1397-1411. 2005.
Talmor-Neiman, M., R. Stav, et al. Identification of trans-acting siRNAs in moss and an
RNA-dependent RNA polymerase required for their biogenesis. Plant J, v.48, n.4, Nov,
p.511-21. 2006.
Tang, G. Plant microRNAs: an insight into their gene structures and evolution. Semin Cell
Dev Biol, v.21, n.8, Oct, p.782-9. 2010.
Tarver, J. E., P. C. Donoghue, et al. Is evolutionary history repeatedly rewritten in light of
new fossil discoveries? Proc Biol Sci, v.278, n.1705, Feb 22, p.599-604. 2010.
Tempel, S. e F. Tahi. A fast ab-initio method for predicting miRNA precursors in genomes.
Nucleic Acids Res, v.40, n.11, Jun, p.e80. 2012.
Thakur, V., S. Wanchana, et al. Characterization of statistical features for plant microRNA
prediction. BMC Genomics, v.12, p.108. 2011.
134
Tuskan, G. A., S. Difazio, et al. The genome of black cottonwood, Populus trichocarpa
(Torr. & Gray). Science, v.313, n.5793, Sep 15, p.1596-604. 2006.
Varkonyi-Gasic, E., R. H. Lough, et al. Kiwifruit floral gene APETALA2 is alternatively
spliced and accumulates in aberrant indeterminate flowers in the absence of miR172. Plant
Mol Biol, v.78, n.4-5, Mar, p.417-29. 2012.
Voinnet, O. Induction and suppression of RNA silencing: insights from viral infections. Nat
Rev Genet, v.6, n.3, Mar, p.206-20. 2005a.
______. Non-cell autonomous RNA silencing. FEBS Lett, v.579, n.26, Oct 31, p.5858-71.
2005b.
______. Origin, biogenesis and activity of plant microRNAs. Cell, v.136, n.4, Feb 20,
p.669-87. 2009.
Wan, L. C., F. Wang, et al. Identification and characterization of small non-coding RNAs
from Chinese fir by high throughput sequencing. BMC Plant Biol, v.12, p.146. 2012.
Wan, L. C., H. Zhang, et al. Transcriptome-wide identification and characterization of
miRNAs from Pinus densata. BMC Genomics, v.13, p.132. 2012.
Wang, J. W., M. Y. Park, et al. miRNA control of vegetative phase change in trees. PLoS
Genet, v.7, n.2, Feb, p.e1002012. 2011.
Wang, J. W., R. Schwab, et al. Dual effects of miR156-targeted SPL genes and
CYP78A5/KLUH on plastochron length and organ size in Arabidopsis thaliana. Plant Cell,
v.20, n.5, May, p.1231-43. 2008.
Wang, L., X. Gu, et al. miR396-targeted AtGRF transcription factors are required for
coordination of cell division and differentiation during leaf development in Arabidopsis. J
Exp Bot, v.62, n.2, Jan, p.761-73. 2011.
Wang, L., H. Liu, et al. Identification and characterization of maize microRNAs involved
in the very early stage of seed germination. BMC Genomics, v.12, p.154. 2011.
135
Wang, T., L. Chen, et al. Identification of drought-responsive microRNAs in Medicago
truncatula by genome-wide high-throughput sequencing. BMC Genomics, v.12, p.367.
2011.
Wang, X. J., J. L. Reyes, et al. Prediction and identification of Arabidopsis thaliana
microRNAs and their mRNA targets. Genome Biol, v.5, n.9, p.R65. 2004.
Wang, Z. J., J. Q. Huang, et al. Discovery and profiling of novel and conserved
microRNAs during flower development in Carya cathayensis via deep sequencing. Planta,
v.236, n.2, Aug, p.613-21. 2012.
Wei, L. Q., L. F. Yan, et al. Deep sequencing on genome-wide scale reveals the unique
composition and expression patterns of microRNAs in developing pollen of Oryza sativa.
Genome Biol, v.12, n.6, p.R53. 2011.
Williams, L., C. C. Carles, et al. A database analysis method identifies an endogenous
trans-acting short-interfering RNA that targets the Arabidopsis ARF2, ARF3, and ARF4
genes. Proc Natl Acad Sci U S A, v.102, n.27, Jul 5, p.9703-8. 2005.
Wilson, P. G. Myrtaceae. In: K. Kubitzki (Ed.). The Families and Genera of Vascular
Plants Springer, v.X: Sapindales, Cucurbitales, Myrtaceae, 2011. Myrtaceae, p.212-271
Wong, M. M., C. H. Cannon, et al. Identification of lignin genes and regulatory sequences
involved in secondary cell wall formation in Acacia auriculiformis and Acacia mangium
via de novo transcriptome sequencing. BMC Genomics, v.12, p.342. 2011.
Wu, G., M. Y. Park, et al. The sequential action of miR156 and miR172 regulates
developmental timing in Arabidopsis. Cell, v.138, n.4, Aug 21, p.750-9. 2009.
Wu, G. e R. S. Poethig. Temporal regulation of shoot development in Arabidopsis thaliana
by miR156 and its target SPL3. Development, v.133, n.18, Sep, p.3539-47. 2006.
Wu, L., H. Zhou, et al. DNA methylation mediated by a microRNA pathway. Mol Cell,
v.38, n.3, May 14, p.465-75. 2010.
136
Xia, R., H. Zhu, et al. Apple miRNAs and tasiRNAs with novel regulatory networks.
Genome Biol, v.13, n.6, p.R47. 2012.
Xuan, P., M. Guo, et al. PlantMiRNAPred: efficient classification of real and pseudo plant
pre-miRNAs. Bioinformatics, v.27, n.10, May 15, p.1368-76. 2011.
Yakovlev, I. A., C. G. Fossdal, et al. MicroRNAs, the epigenetic memory and climatic
adaptation in Norway spruce. New Phytol, v.187, n.4, Sep, p.1154-69. 2010.
Yao, Y. e Q. Sun. Exploration of small non coding RNAs in wheat (Triticum aestivum L.).
Plant Mol Biol, v.80, n.1, Sep, p.67-73. 2011.
Yoshikawa, M., A. Peragine, et al. A pathway for the biogenesis of trans-acting siRNAs in
Arabidopsis. Genes Dev, v.19, n.18, Sep 15, p.2164-75. 2005.
Zen, K. e C. Y. Zhang. Circulating microRNAs: a novel class of biomarkers to diagnose
and monitor human cancers. Med Res Rev, v.32, n.2, Mar, p.326-48. 2012.
Zhai, J., D. H. Jeong, et al. MicroRNAs as master regulators of the plant NB-LRR defense
gene family via the production of phased, trans-acting siRNAs. Genes Dev, v.25, n.23, Dec
1, p.2540-53. 2011.
Zhang, B., X. Pan, et al. Plant microRNA: a small regulatory molecule with big impact.
Developmental Biology, v.289, n.1, p.3-16. 2005.
Zhang, C., G. Li, et al. Identification of trans-acting siRNAs and their regulatory cascades
in grapevine. Bioinformatics, v.28, n.20, Oct 15, p.2561-8. 2012.
Zhang, L., Y. Zheng, et al. Identification and temporal expression analysis of conserved
and novel microRNAs in Sorghum. Genomics, v.98, n.6, Dec, p.460-8. 2011.
Zhang, X., Z. Zou, et al. Over-expression of sly-miR156a in tomato results in multiple
vegetative and reproductive trait alterations and partial phenocopy of the sft mutant. FEBS
Lett, v.585, n.2, Jan 21, p.435-9. 2010.
137
Zhang, Y., Y. Bai, et al. Bioinformatics prediction of miRNAs in the Prunus persica
genome with validation of their precise sequences by miR-RACE. J Plant Physiol, v.170,
n.1, Jan 1, p.80-92. 2012.
Zhang, Y. Y., M. Fischer, et al. Epigenetic variation creates potential for evolution of plant
phenotypic plasticity. New Phytol, v.197, n.1, Jan, p.314-22. 2013.
Zhong, R., E. A. Richardson, et al. The MYB46 transcription factor is a direct target of
SND1 and regulates secondary wall biosynthesis in Arabidopsis. Plant Cell, v.19, n.9, Sep,
p.2776-92. 2007.
Zhong, S., Z. Fei, et al. Single-base resolution methylomes of tomato fruit development
reveal epigenome modifications associated with ripening. Nat Biotechnol, v.31, n.2, Jan 27,
p.154-9. 2013.
Zhou, X., Q. Zhu, et al. MicroRNA profiling using microParaflo microfluidic array
technology. Methods Mol Biol, v.822, p.153-82. 2012.
Zhou, Z. S., J. B. Song, et al. Genome-wide identification of Brassica napus microRNAs
and their targets in response to cadmium. J Exp Bot, v.63, n.12, Jul, p.4597-613. 2012.
Zhu, C., Y. Ding, et al. MiR398 and plant stress responses. Physiol Plant, v.143, n.1, Sep,
p.1-9. 2011.
Zhu, H., F. Hu, et al. Arabidopsis Argonaute10 specifically sequesters miR166/165 to
regulate shoot apical meristem development. Cell, v.145, n.2, Apr 15, p.242-56. 2011.
Zhu, H., R. Xia, et al. Unique expression, processing regulation, and regulatory network of
peach (Prunus persica) miRNAs. BMC Plant Biol, v.12, p.149. 2012.
Zhu, Q. H. e C. A. Helliwell. Regulation of flowering time and floral patterning by
miR172. J Exp Bot, v.62, n.2, Jan, p.487-95. 2011.
138
Download

1 INTRODUÇÃO - Universidade de Brasília