Ministério da Saúde FIOCRUZ Fundação Oswaldo Cruz INSTITUTO OSWALDO CRUZ Pós-Graduação em Biologia Computacional e de Sistemas Sandro Leonardo Martins Sperandei ESTRATÉGIAS DE INTEGRAÇÃO DE DADOS EM EXPERIMENTOS DE MICROARRANJOS DE MRNA E DE MIRNA Tese apresentada ao Instituto Oswaldo Cruz como parte dos requisitos para obtenção do título de Doutor em Ciências na área de Biologia Computacional e de Sistemas. Orientadores: Dr. Wilson Savino Dr. Milton Ozório Moraes RIO DE JANEIRO 2013 Ficha Catalográfica ii Ministério da Saúde FIOCRUZ Fundação Oswaldo Cruz INSTITUTO OSWALDO CRUZ Pós-Graduação em Biologia Computacional e de Sistemas Sandro Leonardo Martins Sperandei ESTRATÉGIAS DE INTEGRAÇÃO DE DADOS EM EXPERIMENTOS DE MICROARRANJOS DE MRNA E DE MIRNA Orientadores: Prof. Dr. Wilson Savino Prof. Dr. Milton Ozório Moraes Aprovada em: 13/05/2013 EXAMINADORES: Prof. Dr. Alberto Martín Rivera Dávila – Presidente Prof. Dr. Flavio Fonseca Nobre Prof. Dr. Christian Macagnan Probst Rio de Janeiro, 13 de maio de 2013. iii Dedicatória Este trabalho é dedicado, como sempre, aos meus maiores patrocinadores e apoiadores: meus pais! Espero que sirva como uma pequena retribuição por todo seu esforço ao longo de tantos anos... Também dedico às pessoas que tanto tem me feito mudar e crescer: Julianne Frenkiel, meu amor, e Luíza Frenkiel, meu bebê. Meu mundo só faz sentido com vocês! Para Apollo, meu maior amigo, que se foi cedo demais... iv Agradecimentos Quebrando o protocolo, não iniciarei os agradecimentos com meus orientadores. Acho que eles entenderão se eu começar pela pessoa mais importante para a realização deste trabalho. Marcelo Ribeiro Alves, obrigado por todo apoio desde sempre! Cada vez tenho mais certeza que, de fato, o mundo seria melhor com mais pessoas como você. Jamais poderei retribuir todo a ajuda ao longo de tantos anos. Agora, sim! Gostaria de agradecer imensamente aos meus dois grandes orientadores, Dr. Wilson Savino e Dr. Milton Ozorio Moraes. Acima de tudo, agradeço a oportunidade que me deram e por terem me permitido seguir pelo caminho da minha forma pouco usual. Tantas vezes lhes dei motivos para me darem puxões de orelha e, surpreendentemente, exatamente nestes momentos foi que encontrei mais compreensão e até elogios que nem acho que merecia... A trajetória dos dois e o carinho que todos seus alunos demonstram por vocês fala mais alto que qualquer agradecimento meu, mas junto minha voz à deles, mesmo assim! Agradeço à Dra. Eliane Corrêa-de-Santana, não só pelos dados do experimento de mioblastos humanos que compõem parte deste trabalho (que eu jamais seria capaz de coletar), mas também pelos momentos em que dividimos todos as nossas reclamações na sala de pós-doc (onde eu estava de intrometido que sou). Dra. Leandrinha Lacerda, obrigado também pelos dados de células epiteliais (que eu tampouco seria capaz de obter). Mas obrigado mesmo pelo companheirismo ao longo de anos e anos! Obrigado pelas risadas divididas nas caronas, que serviram para aliviar a alma nos momentos mais difíceis. Obrigado a todos os pesquisadores e milhares de alunos do LPT. Não sei bem porquê, mas sempre fui tão bem recebido (nas poucas vezes em que aparecia)... Sid, lindona! Você também merece um agradecimento todo especial! Sempre sorridente e prestativa, resolvendo meus problemas sempre deixados para a última hora... Que você e seu pequeno recebam de volta muito mais! v Fora do mundo acadêmico, tenho que agradecer aos heróis que permanecem perto de mim, me aturando por tanto tempo, participando de viagens, momentos incríveis e grandes “roubadas”. Prof. Marcelo Vieira e Roberta Vieira, os chatinhos que eu adoro! Obrigado por sempre estarem por perto! Prof. Bruno de Andrade e Renatinha Araújo, nossa amizade é fogo! Literalmente! Prof. Marcelo Cabral, meu irmão escolhido, de quem nada preciso falar! Profa. ariAnne Reis, que do outro lado do mundo, permanece mais perto do que muitos. Obrigado a todos vocês por me ajudarem a manter a pouca sanidade que me resta... O maior agradecimento de todos, de novo, tem que ir para as minhas meninas, os amores da minha vida... Vocês são minha maior razão para seguir em frente. Nunca vou conseguir explicar o quanto amo as duas e quanto vocês são importantes para mim... vi “And more, much more than this I did it my way” Paul Anka vii Lista de Figuras Figura 1.1. Formação das fibras musculares estriadas. As células precursoras originam diferentes populações de mioblastos (a, b e c). Alguns mioblastos (a) se alinham e fundem-se formando os miotubos primários, que apresentam núcleos na região central e, iniciam a síntese de miofibrilas que ocupam a região periférica no sarcoplasma do miotubo. Os miotubos primários fornecem o suporte para a subseqüente formação dos miotubos secundários, a partir de outra população de mioblastos (c). Posteriormente ocorre a separação dos miotubos primários e secundários e a diferenciação em fibras primárias e secundárias. Os núcleos das fibras migram para a região periférica da fibra e as miofibrilas passam a ocupar todo o sarcoplasma. Alguns mioblastos (b), denominados de células satélites, não se fundem e permanecem quiescentes entre a membrana plasmática da fibra e a lâmina basal. Extraído de Silva e Carvalho(4). ........................................................................................................................ 4 Figura 1.2. Modelo simplificado da migração da migração do timócito, mostrando a entrada das células precursoras, a migração e a saída do timócito maduro. Extraído de Savino e Dardenne(19). ............................................................................................................................... 6 Figura 1.3. Esquema geral de construção de um experimento de microarranjo de cDNA. As amostras extraídas de células de condições distintas são marcadas diferentemente, combinadas e hibridizadas com um arranjo contendo sondas de DNA impressas em sua superfície. Após a leitura da lâmina em um escâner confocal, é gerada uma imagem com o grau de hibridização (fluorescência) de cada amostra em cada sonda. ....................................... 7 Figura 1.4. Exemplo de imagem gerada a partir de um experimento de microarranjo de cDNA já colorida.......................................................................................................................................... 9 Figura 1.5. Processo de segmentação por morfologia matemática e localização dos spots em microarranjos. A figura apresenta a imagem original do arranjo (a) e três diferentes métodos de segmentação por morfologia matemática (b, c e d). Adaptado de Angulo e Serra(29). ....... 10 Figura 1.6. Exemplo de erro sistemático em experimento de microarranjo. Uma vez que espera-se que a maioria dos genes não apresente expressão diferencial entre as condições, a linha média da nuvem de pontos (em vermelho) deveria se localizar sobre o zero (linha preta). A imagem mostra uma dominância sistemática em favor de uma das condições. .................... 12 Figura 3.1. Esquema ilustrativo da técnica de dye-swap. ........................................................... 22 Figura 3.2. Representação esquemática dos experimentos de microarranjos ........................... 23 Figura 3.3. Desenho experimental da análise de microarranjos no modelo de células epiteliais tímicas de camundongos. Cada seta indica uma hibridização. Setas em sentidos opostos na mesma comparação indicam experimento em dye-swap. ......................................................... 24 Figura 3.4. Substituição do nome das amostras pelos fatores representados no processo de modelagem. Os efeitos estimados em cada comparação estão representados sobre a s setas.25 Figura 3.5. Fluxograma da análise de enriquecimento de mRNAs para detecção de miRNAs com potencial expressão diferenciada. .............................................................................................. 30 Figura 4.1. Imagem representativa do resultado bruto de um experimento, identificando os controles de hibridização. O eixo “M” apresenta a razão entre as condições, enquanto o eixo “A” representa a média do sinal nas duas condições. Valores em escala log2. .......................... 33 Figura 4.2. Densidade da intensidade dos sinais obtidos das lâminas de microarranjo antes (esquerda) e após (direita) a etapa de normalização entre arranjos, ou escalonamento, pelo método quantile. Cada linha verde ou vermelha representa a distribuição de intensidades dos viii canais R e G de uma lâmina, independente da condição experimental, ou grupo experimental. ..................................................................................................................................................... 34 Figura 4.3. Relação dos 50 processos biológicos sobrerepresentados na comparação do perfil de expressão gênica de mRNAs entre células musculares diferenciadas (miotubos) e nãodiferenciadas (mioblastos) com menor p-valor. A barra escura representa o número de genes esperados por chance e a barra clara (por trás da escura) indica o número de genes diferencialmente expressos observados em cada processo biológico enriquecido. O valor ao final da barra indica o p-valor pelo teste hipergeométrico. ....................................................... 36 Figura 4.4. Processos biológicos destacados na comparação entre células musculares diferenciadas (miotubo) e células musculares indiferenciadas (mioblastos). ............................ 37 Figura 4.5. Vias de expressão gênicas sobrerepresentadas na comparação entre células musculares diferenciadas (miotubos) e não-diferenciadas (mioblastos). A barra escura representa o número de genes esperados por chance e a barra clara (por trás da escura) indica o número de genes diferencialmente expressos observados. O valor ao final da barra indica o p-valor pelo teste hipergeométrico. ........................................................................................... 37 Figura 4.6. Distribuição das intensidades dos sinais das lâminas de miRNA antes (esquerda) e após (direita) a etapa de pré-processamento. ............................................................................ 38 Figura 4.7. Rede de integrações miRNA-alvos para o hsa-miR-29b. Na figura da esquerda estão representados todos os genes observados como DE no experimento de microarranjo e que são alvos preditos do hsa-miR-29b segundo o miRBase Targets Release Version v5 para H. sapiens. Na direita, representados apenas os genes DE associados a processos biológicos de interesse (fig. 5.4). A escala de cores dos nós indica os valores de log fold-change (base 2) da expressão desses genes entre as condições miotubo e mioblastos, enquanto o tamanho desses nós é inversamente proporcional ao p-valor ou razão de falsa descoberta (FDR) dessa expressão diferencial.................................................................................................................................... 40 Figura 4.8. Processos biológicos enriquecidos para o efeito da linhagem. A barra escura representa o número de genes esperados ao acaso, enquanto a barra clara representa o número de genes observados. O valor ao final da barra é o p-valor do teste hipergeométrico.42 Figura 4.9. Processos biológicos enriquecidos associados ao contato com o timócito. A barra escura representa o número de genes esperados ao acaso, enquanto a barra clara representa o número de genes observados. O valor ao final da barra é o p-valor do teste hipergeométrico. ..................................................................................................................................................... 43 Figura 4.10. Vias metabólicas enriquecidas pelo efeito do contato com o timócito. ................. 44 Figura 4.11. Processos biológicos enriquecidos na interação entre linhagem e timócito. A barra escura representa o número de genes esperados ao acaso, enquanto a barra clara representa o número de genes observados. O valor ao final da barra é o p-valor do teste hipergeométrico. ..................................................................................................................................................... 44 Figura 4.12. Rede de interações miRNA-mRNA, com os miRNAs preditos a partir da lista de mRNAs subexpressos no efeito Linhagem. A escala de cores dos nós indica os valores de log fold-change (base 2) entre a expressão desses genes entre células epiteliais tímicas corticais e medulares, enquanto o tamanho desses nós é inversamente proporcional ao p-valor ou razão de falsa descoberta (FDR) dessa expressão diferencial. ............................................................. 47 Figura 4.13. Interação entre o mmu-miR-196a e os seus alvos subexpressos no experimento de mRNA. A escala de cores dos nós indica os valores de log fold-change (base 2) entre a expressão desses genes entre células epiteliais tímicas corticais e medulares, enquanto o ix tamanho desses nós é inversamente proporcional ao p-valor ou razão de falsa descoberta (FDR) dessa expressão diferencial............................................................................................... 48 Figura 4.14. miRNAs sobrexpressos enriquecidos no efeito da linhagem e selecionados para confirmação por RT-PCR. A barra preta indica o número de alvos esperado para cada miRNA, enquanto a barra cinza indica o número de alvos diferencialmente expressos no experimento de mRNA. O valor ao final da barra representa o p-valor obtido pelo teste hipergeométrico. . 49 Figura 4.15. miRNAs subexpressos enriquecidos no efeito da linhagem e selecionados para confirmação por RT-PCR. A barra preta indica o número de alvos esperado para cada miRNA, enquanto a barra cinza indica o número de alvos diferencialmente expressos no experimento de mRNA. O valor ao final da barra representa o p-valor obtido pelo teste hipergeométrico. . 50 Figura 4.16. miRNAs subexpressos enriquecidos no efeito do contato com o timócito. Abaixo, miRNAs sobrexpressos. Acima, miRNAs subexpressos. Os cinco primeiros miRNAs de cada conjunto foram selecionados para confirmação por RT-PCR. .................................................... 51 Figura 4.17. miRNAs subexpressos enriquecidos na interação linhagem x timócito e selecionados para confirmação por RT-PCR. Abaixo, miRNAs sobrexpressos. Os quatro primeiros sobrexpressos e os três primeiros subexpressos foram selecionados para confirmação por RT-PCR. ............................................................................................................ 52 Figura 4.18. miRNAs selecionados no experimento com mioblastos com expressão confirmada por RT-PCR. * - p<0,05; ** - p<0,01. “0d” – células CHQ não-diferenciadas. “7d” – células CHQ após sete dias de diferenciação. ................................................................................................. 55 Figura 4.19. miRNAs selecionados no experimento com células epiteliais com expressão confirmada por RT-PCR. “a” indica efeito de linhagem significativo; “b” indica efeito de contato com o timócito significativo; “ab” indica efeito significativo de interação entre linhagem e timócito. ...................................................................................................................................... 57 Figura 4.20. (Continuação) miRNAs selecionados no experimento com células epiteliais com expressão confirmada por RT-PCR. “a” indica efeito de linhagem significativo; “b” indica efeito de contato com o timócito significativo; “ab” indica efeito significativo de interação entre linhagem e timócito. ................................................................................................................... 58 x Lista de Tabelas Tabela 4.1. miRNAs sobrerepresentados obtidos pelo processo de enriquecimento de miRNAs para seus alvos preditos segundo o miRBase Targets Release Version v5 para H. sapiens diferencialmente expressos no experimento de microarranjo. “Total” indica o total de alvos preditos para o miRNA. “Esp” e “Obs” são, respectivamente, os números esperado e observado de alvos preditos dentro da lista de genes DE. O p-valor apresentado foi obtido pelo teste hipergeométrico................................................................................................................. 39 Tabela 4.2. Número de genes diferencialmente expressos. Genes sobrexpressos: significativamente maior na primeira condição. Genes subexpressos: significativamente menores na primeira condição. .................................................................................................. 41 Tabela 4.3. Número de miRNAs diferencialmente expressos. miRNAs sobrexpressos: significativamente maior na primeira condição. miRNAs subexpressos: significativamente menores na primeira condição. .................................................................................................. 45 Tabela 4.4. Número de miRNAs apontados como possíveis diferencialmente expressos pelo processo de enriquecimento e grau de sobreposição em relação à lista de miRNAs obtida por microarranjos. ............................................................................................................................. 45 Tabela 4.5. Listas dos miRNAs selecionados para validação de expressão por RT-PCR em tempo real por expressão diferenciada no experimento de microarranjos de miRNA (Lâmina), por meio da análise de enriquecimento ou pelos dois métodos simultaneamente. Os miRNAs iniciados pelas letras “hsa” são provenientes do experimento com mioblastos, enquanto aqueles iniciados por “mmu” são provenientes dos experimentos com células epiteliais. ....... 53 xi Sumário DEDICATÓRIA ...................................................................................................................................... IV AGRADECIMENTOS ............................................................................................................................... V LISTA DE FIGURAS .............................................................................................................................. VIII LISTA DE TABELAS .................................................................................................................................XI SUMÁRIO .............................................................................................................................................XII RESUMO ................................................................................................................................................ 1 ABSTRACT .............................................................................................................................................. 2 1. INTRODUÇÃO ................................................................................................................................ 3 1.1. 1.2. 1.3. 1.4. 1.5. 1.6. 2. OBJETIVOS ................................................................................................................................... 19 2.1. 2.2. 3. DIFERENCIAÇÃO DE MIOBLASTOS HUMANOS......................................................................................... 3 O MICROAMBIENTE TÍMICO ............................................................................................................... 5 MICROARRANJOS DE CDNA ............................................................................................................... 6 INTEGRAÇÃO DE DADOS .................................................................................................................. 13 MICRORNAS ................................................................................................................................ 15 PREDIÇÃO DE EXPRESSÃO DE MIRNAS ............................................................................................... 17 GERAL ......................................................................................................................................... 19 ESPECÍFICOS .................................................................................................................................. 19 MATERIAIS E MÉTODOS............................................................................................................... 20 3.1. AMOSTRAS ................................................................................................................................... 20 3.1.1. Diferenciação de Mioblastos Humanos ............................................................................ 20 3.1.2. Células Epiteliais Tímicas .................................................................................................. 21 3.2. DESENHO EXPERIMENTAL DE MICROARRANJOS .................................................................................... 21 3.3. ANÁLISE ESTATÍSTICA DE MICROARRANJOS ......................................................................................... 26 3.3.1. Pré-Processamento e Detecção de Genes Diferencialmente Expressos ........................... 26 3.3.2. Análise de Enriquecimento ............................................................................................... 27 3.4. PREDIÇÃO E SELEÇÃO DE MIRNAS CANDIDATOS .................................................................................. 28 3.5. CONFIRMAÇÃO POR RT-PCR EM TEMPO REAL .................................................................................... 31 4. RESULTADOS E DISCUSSÃO.......................................................................................................... 32 4.1. DIFERENCIAÇÃO DE MIOBLASTOS HUMANOS....................................................................................... 32 4.1.1. Microarranjos de mRNA ................................................................................................... 32 4.1.2. Microarranjos de miRNA .................................................................................................. 38 4.1.3. Seleção de miRNAs Candidatos ........................................................................................ 39 4.2. CÉLULAS EPITELIAIS TÍMICAS ............................................................................................................ 41 4.2.1. Microarranjos de mRNA ................................................................................................... 41 4.2.2. Microarranjos de miRNA .................................................................................................. 45 4.2.3. Seleção de miRNAs Candidatos ........................................................................................ 45 4.3. COMPROVAÇÃO DE MIRNAS-CANDIDATOS POR RT-PCR EM TEMPO REAL ............................................... 52 5. CONCLUSÃO ................................................................................................................................ 61 6. REFERÊNCIAS ............................................................................................................................... 62 7. ANEXO 1 ...................................................................................................................................... 70 xii LISTA DE GENES DIFERENCIALMENTE EXPRESSOS ................................................................................ 70 NO MODELO DE MIOBLASTOS HUMANOS. .......................................................................................... 70 8. ANEXO 2 ...................................................................................................................................... 79 LISTA COMPLETA DE PROCESSOS BIOLÓGICOS E VIAS DE REGULAÇÃO GÊNICA DIFERENCIALMENTE EXPRESSAS NO MODELO DE MIOBLASTOS HUMANOS ......................................................................... 79 9. ANEXO 3 ...................................................................................................................................... 83 10. ANEXO 4 .................................................................................................................................. 98 11. ANEXO 5 ................................................................................................................................ 101 xiii Resumo OBJETIVO: Explorar as possibilidades analíticas de determinação da expressão diferencial gênica, e de seu controle via miRNAs, a partir de dados de expressão global, via microarranjos de DNA, e de experimentos comprovatórios, via RT-PCR em tempo real, em modelo humano de diferenciação muscular in vitro, de mioblastos a miotubos, e modelo murino in vitro/ex vivo de apresentação tímica de antígenos via timócitos às células epiteliais corticais e/ou medulares. MÉTODOS: Inicialmente, foram realizados experimentos de microarranjo de mRNA e miRNA em amostras de mioblastos humanos e de células epiteliais tímicas de camundongo. Após análise dos experimentos, em busca de mRNAs e miRNAs diferencialmente expressos (DE), foram realizadas análises de enriquecimento dos mRNAs em busca dos processos biológicos e vias de regulação gênica sobrerepresentados. A seguir, procedeu-se a análise de enriquecimento em busca de miRNAs-candidatos à expressão diferenciada a partir dos resultados dos experimentos de mRNA. Foi realizada uma seleção de miRNAs-candidatos apontados pelos experimentos de microarranjos de miRNA e do enriquecimento de miRNAs a partir dos microarranjos de mRNA e estes foram submetidos à comprovação de expressão por RT-PCR em tempo real. O número de miRNAs confirmados nas duas listas foi comparado. RESULTADOS: no experimento comparando células musculares diferenciadas (miotubos) e nãodiferenciadas (mioblastos), foram encontrados 2029 mRNAs DE e 29 miRNAs DE. Nos experimentos com células epiteliais de timo de camundongo, obtivemos 3026 mRNAs DE no efeito da linhagem (cTEC x mTEC), 70 mRNAs DE no efeito do contato TEC x timócito, e 128 mRNAs DE como resultado da interação entre os efeitos da linhagem e do contato com o timócito. Em relação aos miRNAs, foram encontrados 30 miRNAs DE como efeito da linhagem, três miRNAs DE como efeito do contato com o timócito e dois miRNAs DE como efeito da interação. Um total de 104 miRNAs foram selecionados para a comprovação, sendo 51 confirmados. A comparação demonstrou que os miRNAs selecionados a partir das lâminas de miRNA apresentam maior probabilidade de serem confirmados. CONCLUSÃO: Apesar da seleção de miRNAs a partir do enriquecimento de mRNAs DE não ser tão poderosa quanto aquela realizada a partir das lâminas de miRNA, esta mostra um potencial interessante de agregar informação, apresentado a vantagem de não possuir nenhum custo adicional. 1 Abstract PURPOSE: To explore the analytical possibilities of gene differential expression determination, and their control via miRNAs, from global expression data, via cDNA microarrays and verification experiments, via real time RT-PCR, in a human model of muscle in vitro differentiation of myoblasts to myotubes and murine model in vitro / ex vivo antigen presentation via cortical and/or medullar thymic epithelial cells to thymocytes. METHODS: Initially, microarray experiments of mRNA and miRNA were performed in samples of human myoblasts and thymic epithelial cells of mice. After analysis of experiments looking for mRNAs and miRNAs differentially expressed (DE), enrichment analyses of mRNAs were performed looking for biological processes and gene regulation pathways overrepresented. Then we proceeded to the another enrichment analysis, to select candidate miRNAs for differential expression from the results of the mRNA experiments. We performed a selection of candidate miRNAs pointed by miRNA microarray experiments and enrichment of the mRNA microarray and these were subjected to confirmation of expression by real time RT-PCR. The number of confirmed miRNAs was compared in the two lists. RESULTS: In experiment comparing differentiated (myotubes) and undifferentiated (myoblasts) muscle cells, we found 2029 mRNAs and 29 miRNAs DE. In experiments with thymic epithelial cells of mice, we obtained 3026 DE mRNAs related to the lineage effect (CTEC vs. MTEC), 70 DE mRNAs related to the effect on thymocyte contact, and 128 mRNAs as a result of the interaction between the effects of lineage and thymocyte contact. Regarding miRNAs, 30 DE miRNAs were found to be related to lineage effect, three DE miRNAs in the effect of contact with the thymocyte and two DE miRNAs in the interaction of the effects. A total of 104 miRNAs were selected for verification, with 51 confirmed. The comparison showed that miRNAs selected from the miRNA microarray experiments are most likely to be confirmed. CONCLUSION: Although the selection of miRNAs from the enrichment of DE mRNAs was not as powerful as that made from the miRNA microarrays, the former shows an interesting potential of aggregating information, since it has the advantage of no additional cost. 2 1. Introdução Para investigar a possível contribuição do uso da estratégia de enriquecimento de miRNAs à partir da informação de mRNA-alvos, disponível em bancos de dados, e da expressão desses mRNA-alvos observada por experimento de microarranjos de cDNA, sobre a expressão global observada de miRNAs, também por experimento de microarranjos de cDNA, foram utilizadas informações de expressão global de mRNA e de miRNA em dois modelos biológicos distintos. O primeiro deles, diferenciação muscular em humanos, é um modelo em linhagem muscular com grande modulação de expressão gênica esperada entre as condições, mioblastos, células indiferenciadas, e miotubos, células diferenciadas in vitro. No segundo modelo, epitelial tímico murino, esperam-se também grandes modulações de expressão entre as linhagens celulares de fenótipos corticais e medulares, assim como modulações mais sutis na modulação de expressão desses fenótipos induzidas pelo contato com timócitos ex vivo. Ao fim, a confirmação da expressão de alvos gênicos selecionados foi avaliada por meio de ensaios de RT-PCR em tempo real. 1.1. Diferenciação de Mioblastos Humanos O músculo esquelético de mamíferos adultos é composto por um conjunto de células musculares diferenciadas, fibras musculares, e um conjunto de célulassatélites, células progenitoras ainda não-diferenciadas(1,2). Quando estimuladas, como após um trauma muscular, estas células satélites são ativadas, se proliferam e se diferenciam em mioblastos, passando a se fusionar e se ligar às células musculares maduras no seu entorno(1,3). Esse processo é ilustrado na Figura 1.1, extraída de Silva e Carvalho(4). A capacidade de proliferação e diferenciação das células-satélites as colocam como uma interessante possibilidade na terapia de distrofias musculares(5,6) e já foi demonstrada em modelos animais(7,8), mas não tem obtido o mesmo resultado em humanos, provavelmente devido a fatores como a baixa capacidade proliferativa, a alta taxa de morte e a indução de resposta imune no hospedeiro causada por este tipo de célula(5). 3 Figura 1.1. Formação das fibras musculares estriadas. As células precursoras originam diferentes populações de mioblastos (a, b e c). Alguns mioblastos (a) se alinham e fundem-se formando os miotubos primários, que apresentam núcleos na região central e, iniciam a síntese de miofibrilas que ocupam a região periférica no sarcoplasma do miotubo. Os miotubos primários fornecem o suporte para a subseqüente formação dos miotubos secundários, a partir de outra população de mioblastos (c). Posteriormente ocorre a separação dos miotubos primários e secundários e a diferenciação em fibras primárias e secundárias. Os núcleos das fibras migram para a região periférica da fibra e as miofibrilas passam a ocupar todo o sarcoplasma. Alguns mioblastos (b), denominados de células satélites, não se fundem e permanecem quiescentes entre a membrana plasmática da fibra e a lâmina basal. Extraído de Silva e Carvalho(4). Um conhecimento ampliado da biologia deste processo de proliferação e diferenciação celular pode otimizar a eficácia da terapia de transplante de precursores miogênicos e um dos pontos importantes deste conhecimento é o controle pós-transcricional promovido pelos miRNAs. Diversos trabalhos têm demonstrado a ação de miRNAs no controle de diferenciação de células musculares(9–11). O miR-206, por exemplo, é descrito como desempenhando papel na estimulação da diferenciação de mioblastos cultivados de camundongos e o seu nocaute impede a diferenciação destes mioblastos(12–14). Também os miRNAs miR-1 e miR-133 se mostraram diferencialmente expressos em camundongos, com o primeiro induzindo a diferenciação e o segundo induzindo a proliferação celular(13). O miR-181 mostrouse muito expresso durante a fase final do processo de diferenciação(15), enquanto o miR-27 se mostrou associado à regulação do equilíbrio entre proliferação e diferenciação(16). Também mRNAs associados à codificação de proteínas de matriz extracelular, envolvidas em inúmeros processos de proliferação e diferenciação celular(17), são influenciados pela ação de miRNAs(18). 4 Assim, observa-se que o conhecimento sobre a expressão de diferentes miRNAs em modelo de diferenciação de mioblastos humanos apresenta grande importância, especialmente para a terapia de distrofias musculares. 1.2. O Microambiente Tímico O timo é um órgão linfóide responsável por um complexo processo de diferenciação dos precursores de células T, os timócitos(19). Este processo envolve a expressão sequencial de proteínas de membrana, assim como o rearranjo dos genes que codificam o receptor de célula T, com seu produto final interagindo com as proteínas do complexo principal de histocompatibilidade, expressas pelas células do microambiente tímico(19–21). Constituído como uma rede tridimensional com tipos celulares distintos, o microambiente tímico tem no epitélio tímico o seu maior componente com a capacidade única de determinar a geração de um repertório de células T diverso e funcional(21–23). As células do epitélio tímico podem ser separadas em células epiteliais tímicas corticais (cTEC) e células epiteliais tímicas medulares (mTEC), cada uma reconhecida através de anticorpos monoclonais específicos(23). O precursor de células T entra no timo através de vasos venosos, na junção córtico-medular, desenvolvendo um intrincado percurso (Figura 1.2), passando pela região cortical e medular, até voltar à circulação venosa já como timócito maduro(19,21). Durante essa migração, o contato do timócito com as células do microambiente tímico, especialmente com as células epiteliais, leva a célula precursora à maturação com um de dois fenótipos: CD4 +CD8- ou CD4CD8+(19,21,22). No entanto, a função de cada tipo celular no processo de diferenciação das células T após sua entrada no timo e o efeito que a interação com o timócito acarreta em cada tipo de célula epitelial são praticamente desconhecidos. 5 Figura 1.2. Modelo simplificado da migração da migração do timócito, mostrando a entrada das células precursoras, a migração e a saída do timócito maduro. Extraído de Savino e Dardenne(19). 1.3. Microarranjos de cDNA O uso de microarranjos de cDNA na análise de expressão gênica de larga escala remonta à década de 1990(24) e permite a comparação dos níveis de expressão de milhares de genes simultaneamente em dois ou mais fenótipos distintos no mesmo experimento(25). Ao contrário de técnicas de sequenciamento, um microarranjo fornece a quantificação relativa da expressão dos genes, resultando sempre da comparação entre duas condições de interesse ou entre uma condição de interesse e uma condição controle. Uma desvantagem do microarranjo está na necessidade de desenvolvimento prévio de bibliotecas de cDNA ou oligonucleotídeos sintéticos, para serem usados como sondas na confecção dos arranjos(26). Tal necessidade impede a descoberta de novos miRNAs ou a exploração em organismos com o genoma não mapeado. Entretanto, o custo de experimentos de microarranjo vem diminuindo ano após ano, possibilitando um aumento no tamanho das amostras e maior poder estatístico(26). Adicionalmente, alguns autores(27,28) sugerem que os resultados de microarranjos são tão ou mais confiáveis que os de técnicas de sequenciamento, o que parece ser reflexo de problemas nas etapas de preparação desta última técnica(27). 6 Figura 1.3. Esquema geral de construção de um experimento de microarranjo de cDNA. As amostras extraídas de células de condições distintas são marcadas diferentemente, combinadas e hibridizadas com um arranjo contendo sondas de DNA impressas em sua superfície. Após a leitura da lâmina em um escâner confocal, é gerada uma imagem com o grau de hibridização (fluorescência) de cada amostra em cada sonda. Um experimento de microarranjo (Figura 1.3) inicia-se a partir da preparação independente da lâmina, onde são fixadas as sondas, e das amostras de RNA extraídas das células com as condições de interesse. Em uma lâmina de vidro, dezenas de milhares de sondas são fixadas em um arranjo matricial conhecido, de modo que cada ponto (spot) contenha sondas referentes a um, e apenas um, gene de interesse. Este processo é automatizado e exige grande precisão, de forma a otimizar o número de sondas por experimento. As sondas são sequências genéticas de fita simples referentes aos genes. Paralelamente, amostras de RNA total são extraídas de tecidos contendo uma condição de interesse. Esse RNA passa por um processo de transcrição reversa, passando a cDNA, de modo que possa se hibridizar com as sondas presentes na lâmina de microarranjo. Esta amostra é marcada de maneira específica em relação à condição. Os marcadores mais comuns são a cyanina-3 (Cy3) e a cyanina-5 (Cy5) e, em geral, a primeira é utilizada para a condição controle, embora não haja obrigatoriedade nessa associação e ela não tenha impacto na análise dos resultados. 7 Uma segunda amostra, proveniente de uma condição com característica diferente, é também preparada de maneira similar, mas marcada com o outro marcador, de forma que o marcador passa a identificar cada condição. As duas amostras são combinadas e a lâmina contendo as sondas é exposta a esta solução para hibridização. O microarranjo é um experimento de hibridização competitiva(29), onde as fitas de cDNA das duas amostras vão competir pelas sondas que sejam complementares a elas. Havendo complementaridade, as sequências marcadas são fixadas à lâmina por meio das sondas. Após a hibridização e lavagem, somente as sequências hibridizadas se mantêm fixas. A lâmina é, então, lida em um escâner confocal a laser que bombardeia a superfície com luz e lê a intensidade de cada marcador na superfície. A leitura é feita de forma independente para cada marcador, de acordo com o comprimento de onda da luz emitida. O resultado é uma imagem da lâmina independente para cada condição experimental, contendo a intensidade de luz em cada ponto, em diferentes tons de cinza, dependendo da quantidade de hibridização daquela amostra em cada ponto. As duas imagens são combinadas digitalmente e coloridas, sendo associada à Cy3 a cor verde e à Cy5 a cor vermelha. Assim, pontos contendo sondas de um gene com expressão relativa predominante na condição marcada com Cy3 irão aparecer com predominância da cor verde e a intensidade da cor indica o nível de expressão. De forma inversa, pontos com predominância da condição Cy5 aparecerão na cor vermelha. Naqueles pontos onde haja equilíbrio entre as condições, a cor amarela será predominante e a cor preta identifica as sondas sem hibridização em nenhuma das amostras. A Figura 1.4 mostra um exemplo de imagem resultante do processo. 8 Figura 1.4. Exemplo de imagem gerada a partir de um experimento de microarranjo de cDNA já colorida. A imagem é, então, submetida a um processo de segmentação matemática para identificação dos spots (Figura 1.5) e quantificação da intensidade do sinal gerado (foreground). Este sinal está diretamente relacionado ao nível de expressão do gene representado pela sonda presente no spot. O processo de segmentação também permite a quantificação do ruído de fundo (background) gerado pelo efeito da irradiação do escâner sobre a própria lâmina de vidro. Esta informação é fundamental para a correção do sinal de cada ponto na etapa de pré-processamento dos dados. 9 Figura 1.5. Processo de segmentação por morfologia matemática e localização dos spots em microarranjos. A figura apresenta a imagem original do arranjo (a) e três diferentes métodos de segmentação por morfologia matemática (b, c e d). Adaptado de Angulo e Serra(30). Quantificado o sinal em cada spot, inicia-se o pré-processamento dos dados. A primeira etapa do pré-processamento consiste na filtragem dos spots de baixa qualidade. Embora o termo “qualidade” em microarranjo tenha um significado bastante amplo, consideraremos aqui duas variáveis principais que apresentam importante impacto no resultado do experimento: a uniformidade do spot e a relação sinal-ruído (signal-to-noise ratio). A uniformidade do spot está associada à distribuição dos pixels em sua superfície e pode ser afetada por problemas durante a impressão da lâmina. Está uniformidade é fundamental para facilitar o processo de análise da imagem e aumentar a acurácia da medida(31). A relação sinal-ruído diz respeito a razão entre o sinal de hibridização detectado no spot (foreground) e o ruído de fundo (background) obtido nas áreas ao redor do spot. A relação sinal-ruído 10 é usualmente calculada de duas formas diferentes. Na primeira, a diferença entre o sinal de hibridização e o ruído de fundo é dividido pelo desvio-padrão do ruído de fundo. Na segunda, a mediana do sinal de hibridização é dividido pela mediana do ruído de fundo(32). Baixos valores para a relação sinal-ruído indicam spots de baixa qualidade que devem ser excluídos da análise(33). Após esta etapa do pré-processamento, com a retirada dos spots de baixa qualidade, o nível de expressão será expresso como uma razão do sinal obtido em cada condição. Na verdade, o valor utilizado será o logaritmo desta razão, de modo a obtermos uma distribuição de intensidades simétrica e aproximadamente Normal. Métodos de transformação adicionais devem ser aplicados aos dados como forma de corrigir erros sistemáticos característicos de experimentos de microarranjo. Como exemplo, é sabido que o escâner pode apresentar sensibilidade diferenciada para cada um dos marcadores utilizados, ocasionando um viés artificial de dominância de uma condição em relação à outra(34) (Figura 1.6). Esse efeito também pode surgir por diferença na incorporação dos marcadores às amostras(35– 37). O método de transformação a ser aplicado irá depender das características dos dados(38–40). Após todas estas etapas, inicia-se a análise estatística dos resultados obtidos. Embora a redução do custo de cada experimento tenha proporcionado um relativo aumento no tamanho das amostras nos últimos dez anos (de uma a três amostras para uma ou duas dezenas), os experimentos de microarranjos ainda têm a peculiar característica de apresentarem um número de variáveis investigadas (genes) muito superior ao número de amostras disponíveis(41). 11 Figura 1.6. Exemplo de erro sistemático em experimento de microarranjo. Uma vez que espera-se que a maioria dos genes não apresente expressão diferencial entre as condições, a linha média da nuvem de pontos (em vermelho) deveria se localizar sobre o zero (linha preta). A imagem mostra uma dominância sistemática em favor de uma das condições. Esta característica coloca uma grande limitação dos métodos estatísticos tradicionais e novas abordagens, mais poderosas, são necessárias. Neste sentido, a principal abordagem que tem sido utilizada é a Bayesiana Empírica (Empirical Bayes), na qual a informação contida na lâmina, proveniente de todos ou de parte dos genes, é utilizada na inferência de cada gene individualmente. Sperandei(42) comparou a abordagem clássica com uma forma de inferência Bayesiana e mostrou a superioridade da última, especialmente quando o número de amostras disponíveis era limitado. Outros autores(43–45) demonstraram resultados semelhantes. Por último, mas não menos importante, cabe lembrar que a grande vantagem do experimento de microarranjo, que é a possibilidade de análise simultânea de milhares de genes em diferentes condições, não vem sem um preço. A técnica de microarranjos deve ser utilizada como uma técnica de screening, sendo necessária a utilização posterior de métodos mais sensíveis para a comprovação dos seus resultados. Uma das técnicas utilizadas com esse propósito é a técnica de RT-PCR em tempo real. No entanto, a análise por microarranjo deve ainda ser sensível o suficiente para não permitir a perda de informação, descartando um gene 12 importante, e específica o suficiente para reduzir o desperdício de se testar uma grande quantidade de falso-positivos em experimentos de comprovação. Encontrar o equilíbrio entre estas duas características é a parte mais difícil da análise. 1.4. Integração de Dados Com a solução para a análise estatística dos dados de microarranjos oferecida pelos métodos de inferência Bayesiana, o atual desafio da técnica é a interpretação dos resultados obtidos, extraindo informação de qualidade sobre as condições experimentais analisadas em quantidade compatível com a quantidade de resultados gerados. A complexidade da regulação gênica dificulta a extração de informação a partir da lista simples de genes diferencialmente expressos que é resultado de um experimento de microarranjos(46). Um mesmo gene pode atuar em diferentes processos biológicos e vias metabólicas, de modo que a ação que ele está efetivamente desempenhando dependerá da sua interação com outros genes. De forma inversa, um processo biológico é resultado da ação simultânea ou encadeada de diversos genes, onde a ausência de expressão de um gene individual pode não indicar o estado real deste processo. Ao se deparar com uma longa lista, contendo algumas centenas, ou até alguns milhares, de genes diferencialmente expressos, o pesquisador terá grande dificuldade de interpretar cada gene individualmente e perderá, por certo, o papel das relações entre eles. A partir da associação dos genes a todos os processos biológicos nos quais ele toma parte, por exemplo, é possível tentar obter, de uma lista de genes diferencialmente expressos oriunda de um experimento de microarranjo, os processos biológicos possivelmente alterados na comparação entre as condições. De forma geral, quanto maior o número de genes diferencialmente expressos associados a um mesmo processo biológico, possivelmente, maior será a importância daquele processo nas condições analisadas(46). Esta abordagem funcional dos resultados de um microarranjo é conhecida como análise de enriquecimento (gene set enrichment analysis) e se baseia na sobrerepresentação de classes funcionais genéticas levando em conta a lista de genes diferencialmente expressos observada(46,47). 13 Para este processo, bases de dados sobre informação genética como o banco de ontologia genética (Gene Ontology – GO)(48) e a base KEGG (Kyoto Encyclopedia of Genes and Genomes)(49) são fundamentais, pois é de onde são retiradas as informações sobre as relações entre os genes e os processos biológicos dos quais tomam parte, as vias de regulação gênica em que atuam, suas funções moleculares, etc. A partir das relações funcionais dos genes, a busca será por processos biológicos sobrerepresentados na lista de resultados. Por exemplo, se um processo biológico está associado a, digamos, 10% dos genes do genoma humano, espera-se que, na lista de genes diferencialmente expressos em um microarranjo, cerca de 10% da lista esteja também associada a este processo. Quando o número de genes presentes na lista de diferencialmente expressos associados a um processo é significativamente maior do que aquele esperado por chance, consideramos este processo sobrerepresentado e dizemos que o processo está enriquecido na comparação entre as condições consideradas. O princípio básico por trás da técnica de integração de dados está no fato de que nenhum processo biológico ocorre pela ação isolada de um único gene, mas sim de um conjunto de genes atuando de forma combinada. De modo semelhante, nenhum gene atua em um processo biológico apenas, mas em vários. A análise conjunta de todos os genes pode proporcionar uma visão mais clara do que está ocorrendo em um organismo em uma determinada condição ou instante. A determinação de quando o número de genes associados é superior ao esperado é realizada a partir do teste hipergeométrico, representado na Equação 1.1, onde N é o número total de genes no genoma, K é o número de genes associados a um processo particular de interesse no genoma completo, n é o número de genes na lista de genes diferencialmente expressos e x é o número de genes da lista associados ao processo de interesse. O binômio a b indica o número de combinações possíveis de a elementos em grupos de b elementos. Equação 1.1: K N K x n x P X x | N , K , n N n 14 Um ponto importante a ressaltar é que o teste hipergeométrico acima leva em conta tanto os genes sobrexpressos quanto os subexpressos, indicando alteração no processo como um todo. Adicionalmente, ele é aplicado de forma unilateral, ou seja, apenas os processos sobrerepresentados serão considerados, mas não aqueles sub-representados. O motivo disso é que nem todos os processos biológicos e vias metabólicas estarão representados na lista de genes diferencialmente expressos. 1.5. MicroRNAs A descoberta dos miRNAs abriu um mundo de novas possibilidades para a análise de expressão de larga escala. A antiga estrada única que ia de um gene até a proteína, passando pelo mRNA, possui agora múltiplas vias secundárias e transversais. Os miRNAs, embora não sejam codificantes para proteínas, podem causar profundo impacto na expressão destas, através da repressão póstranscricional dos mRNAs. Desconhecidos até há pouco mais de uma década, a busca pela compreensão dos mecanismos de ação destas pequenas sequências de nucleotídeos tem crescido ano após ano. MicroRNAs (miRNAs) são pequenos RNAs com comprimento aproximado entre 20 e 25 nucleotídeos(50). Apresentam a característica de não serem codificantes para proteínas e atuarem de forma bastante singular, na regulação póstranscricional da expressão gênica. A expressão incorreta de miRNAs é capaz de mimetizar fenótipos de perda de função dos mRNAs-alvos(51) e os miRNAs já foram relacionados à ocorrência de diversos processos biológicos e patogênicos, como diabetes(52) e câncer(53). Conhecidos desde o início da década de 1990, apenas há menos de dez anos é que se tornaram foco de atenção maior na biologia molecular. Inicialmente, apenas dois miRNAs estavam descritos na literatura (lin-4 e let-7) e acreditava-se que eram exemplos únicos específicos de C. elegans, único organismo para o qual haviam sido descritos(51). Esta posição mudou apenas em 2001, quando três grupos de pesquisadores(54–56) descreveram, independentemente, cerca de 100 novos miRNAs, sendo alguns conservados em organismos filogeneticamente distantes como moscas e humanos. Atualmente, mais de 10.000 miRNAs estão descritos, e destes, mais de 600 descritos em mamíferos, com um grande número ainda 15 esperado como resultado da utilização de técnicas cada vez mais avançadas de biologia molecular e bioinformática. Não obstante o grande desenvolvimento que tem sido observado no conhecimento dos miRNAs, ainda restam importantes e desafiadoras tarefas a serem completadas. Embora seja certo que os miRNAs atuem na repressão de seus mRNAs-alvo(57), há relatos de sua atuação na ativação de alvos(58). Há também um grande debate sobre a forma de sua atuação na regulação pós-transcricional da célula. O entendimento inicial era de que eles agiriam em animais através do bloqueio da tradução do mRNA, enquanto em plantas a ação seria através da degradação do mRNA(51). No entanto, evidências mais recentes têm demonstrado, especialmente em animais, que ambas as formas podem ocorrer num mesmo organismo(59). Por exemplo, o miRNA lin-4 pode inibir a ação de seus alvos lin-14 e lin-28 sem provocar alteração na abundância destes mRNAs na célula(60). Porém, o resultado esperado é a associação inversa entre a abundância de miRNAs e de seus mRNAs-alvos(61). Complicando ainda mais, o mRNA-alvo pode agir inibindo a transcrição do miRNA, gerando um processo de biofeedback negativo(51), ou seja, a abundância do mRNA-alvo atua reprimindo a maturação do miRNA, impedindo que este bloqueie a expressão do mRNA-alvo. Além de toda a dificuldade apresentada na relação entre cada miRNA e cada alvo, os miRNAs ainda reservam uma peculiaridade que adiciona enorme grau de complexidade para a sua análise. Diferente do usual, a paridade das bases nitrogenadas entre um miRNA e seu alvo não precisa ser perfeita para que sua função seja desempenhada(60). Existem pelo menos três locais principais nas extremidades do miRNA onde o pareamento com o mRNA-alvo deve ser perfeito, chamadas de regiões sementes, independentemente do pareamento do resto da sequência(62,63). Desta forma, um miRNA pode ter ação sobre um número grande de alvos e um mRNA-alvo pode sofrer a ação de diferentes miRNAs, proporcionando grande flexibilidade na ação sobre o organismo. Porém, esta flexibilidade põe grande dificuldade na definição de alvos para os miRNAs, assim como no estudo do efeito da expressão de um miRNA sobre seu alvo, pois a função de um miRNA pode estar sendo desempenhada por outro que aja sobre o mesmo alvo. Alguns autores defendem que o grau de pareamento miRNA–mRNA é determinante na ação do miRNA(51). Assim, quando o pareamento se dá exclusiva 16 ou quase exclusivamente na região semente, o miRNA atuaria no bloqueio da tradução do mRNA. Por outro lado, quando a complementaridade é perfeita ou quase perfeita, a ligação do miRNA culminaria na degradação do mRNA-alvo. No entanto, existem evidências de que esta relação não é universal(59), sendo possível que mesmo o pareamento perfeito não resulte na degradação do mRNA, sugerindo que o principal mecanismo de ação seja o bloqueio da tradução, independente do grau de complementaridade. Este bloqueio pode ocorrer tanto antes como após o início da tradução(59). 1.6. Predição de Expressão de miRNAs A análise funcional de miRNAs oferece desafio maior, quando comparada à análise dos mRNAs, pois o efeito dos miRNAs se dá de forma indireta, como visto, a partir de sua ação sobre os mRNAs. Adicionalmente, uma vez que um miRNA pode ter diversos mRNAs como alvo e um mRNA pode sofrer a ação de um grande número de miRNAs, a simples análise dos resultados de expressão em um experimento de miRNA acaba gerando mais dúvidas do que informação. Por outro lado, mesmo a análise de experimentos simultâneos de miRNA e mRNA pode ser insuficiente para extrair toda a riqueza de informação disponível, uma vez que diferenças temporais na expressão dos genes podem ainda ocultar processos importantes. Assim, torna-se necessária, além da análise dos dois tipos de expressão, a utilização combinada de técnicas estatísticas aplicadas diretamente aos resultados e de técnicas de bioinformática para o enriquecimento da análise. Outra utilização da bioinformática é a inferência sobre miRNAs a partir dos resultados de mRNAs. Experimentos de análise de expressão de larga escala, como os microarranjos, são experimentos de varredura global, que apresentam uma alta taxa de falsos-positivos. Posteriormente à sua realização, os resultados precisam ser comprovados por técnicas mais sensíveis, como a RT-PCR em tempo real. No entanto, seriam os miRNAs apontados por um microarranjo os únicos candidatos a uma expressão diferenciada? A abordagem que foi avaliada neste trabalho se baseia na utilização da análise de enriquecimento para predição de miRNAs diferencialmente expressos que não foram localizados nos experimentos de microarranjos de miRNA e que podem ser apontados a partir dos resultados dos arranjos de mRNA. Desta forma, seria possível obter informação sobre o comportamento dos miRNAs apenas realizando experimentos de mRNA ou 17 acrescentar informação aos experimentos de miRNA realizados. Embora esta abordagem já tenha sido utilizada com outros fins, até o momento, não se tem conhecimento de investigações sobre a quantidade de informação que pode ser obtida por uma ou outra abordagem. Este procedimento de predição seguiu, em linhas gerais, a mesma ideia central da análise de enriquecimento. Entretanto, ao invés de listar, para cada mRNA diferencialmente expresso encontrado, por exemplo, os processos biológicos ou vias de regulação gênicas associadas, foram definidos quais miRNAs que apresentavam aquele mRNA em especial descrito como alvo. Um miRNA que apresenta uma proporção de seus alvos alterados maior do que o esperado ao acaso seria assim, possivelmente, um miRNA que teria também seu nível de expressão alterado e no sentido oposto do mRNA. 18 2. Objetivos 2.1. Geral Explorar as possibilidades analíticas de determinação da expressão diferencial gênica, e de seu controle via miRNAs, a partir de dados de expressão global, via microarranjos de DNA, e de experimentos comprovatórios, via RT-PCR em tempo real, em modelo humano de diferenciação muscular in vitro, de mioblastos a miotubos, e modelo murino in vitro/ex vivo de apresentação tímica de antígenos via timócitos às células epiteliais corticais e/ou medulares. 2.2. Específicos Comparar o perfil de expressão gênica (miRNA e mRNA) de células corticais e medulares do epitélio tímico de camundongos, expostas ou não ao contato com timócitos; Comparar o perfil de expressão gênica (miRNA e mRNA) entre mioblastos humanos diferenciados e indiferenciados; Comparar a capacidade da integração de detectar miRNAs diferencialmente expressos nos modelos testados; Investigar a quantidade de informação que pode ser acrescentada aos resultados das lâminas de miRNA pelo procedimento de integração de dados. 19 3. Materiais e Métodos Foram selecionados dois modelos biológicos bastante distintos para a aplicação das abordagens aqui utilizadas. O objetivo desta diversidade é proporcionar uma maior extrapolação dos resultados obtidos, de modo que eles possam ser aplicados a diferentes modelos biológicos. Assim, utilizamos linhagens humanas de mioblastos diferenciados in vitro (miotubos) e não-diferenciados e células murinas tímicas de linhagem corticais e medulares. Temos aqui modelos biológicos em diferentes espécies (Homo sapiens e Mus musculus), com alteração de expressão entre condições variando entre grandes magnitudes (ex. entre miotubos e mioblastos), médias magnitudes (ex. entre células tímicas corticais e medulares) e pequenas magnitudes (ex. entre células tímicas expostas e não expostas ao contato com timócitos). 3.1. Amostras 3.1.1. Diferenciação de Mioblastos Humanos Foram utilizados cultivos de linhagens de mioblastos humanos, CHQ, primariamente isolados por Edom et al.(64) do músculo quadríceps normal. A origem das células foi determinada a partir de células satélites de tecido muscular esquelético, além do fato de poderem se diferenciar in vitro formando fibras musculares (miotubos). Trabalhos conjuntos com nosso laboratório(65–67) determinaram a possibilidade de utilização destas células como precursores miogênicos, sendo capazes de formar fibras musculares após transplante em camundongos. Também o fenótipo destas células foi recentemente determinado em nosso Laboratório, em termos de expressão de marcadores de mioblastos e de expressão de receptores de matriz extracelular, assim como de expressão de cmet(66), tratando-se uma preparação de células-tronco humanas tecido-específicas, e cujas características morfofuncionais básicas estão bem estabelecidas. Culturas de células CHQ diferenciadas (miotubos), foram obtidas após o cultivo de precursores de mioblastos humanos (cultura de células CHQ indiferenciadas) com meio DMEM sem SBF após 7 dias de cultivo. Tais preparações foram utilizadas para a detecção da expressão de RNAs mensageiros (mRNA) e miRNAs, antes e depois da diferenciação de mioblastos humanos em miotubos. 20 A extração de mRNAs e dos miRNAs foi feita com kit “mirVana TM miRNA Isolation” (Ambion), e a qualidade das amostras foi analisada através do 2100 Bioanalyzer (Agilent) utilizando dois chips: RNA nano chip e Small RNA chip. 3.1.2. Células Epiteliais Tímicas Utilizamos as seguintes linhagens de células epiteliais tímicas (TEC) murinas: 1.4C18, com fenótipo de TEC cortical, e 3.10, com fenótipo de TEC medular, originalmente geradas por Mizuochi et al.(68). Estas células apresentam marcadores típicos de córtex e medula, respectivamente, incluindo expressão diferencial de citoqueratinas, conforme visto em nosso próprio Laboratório(69). Além disso, foi evidenciado que ambas são capazes de interagir com linfócitos(70), mas apenas as células medulares estariam relacionadas com a diferenciação de células CD4 simples positivas antígeno-específicas(68). Vale dizer ainda, que estas células medulares expressam constitutivamente o gene Aire(71), principal responsável pela transcrição promíscua de antígenos no timo, a qual está relacionada com o controle de geração de timócitos com potencial auto-reativo. Por conseguinte, as linhagens acima descritas podem ser consideradas como representativas de TEC corticais e medulares do timo de camundongos, conforme revisado pelos autores que as produziram(72). Ambas as linhagens foram cultivadas com RPMI 1640 (Mediatech, Herndon, VA) acrescido de 10% de soro bovino fetal (Cultilab, Campinas, SP) a 37° C e em atmosfera com 5% de CO2. O RNA das duas linhagens foi extraído utilizando o kit “mirVana miRNA Isolation” (Ambion) e as amostras foram analisadas utilizando o 2100 Bioanalyzer (Agilent) para comprovação da qualidade, utilizando os chips do tipo RNA Nano Chip e Small RNA Chip. 3.2. Desenho Experimental de Microarranjos Nos experimentos de microarranjos de mRNA foram utilizadas lâminas Agilent 4 x 44k, contendo quatro arranjos de 44 mil pontos cada. Dentre as 44 mil sondas de cada um dos quatro arranjos, encontramos replicatas técnicas de sondas referentes a genes e também controles de hibridização. Estas duas características são de grande importância para assegurar a qualidade do resultado do experimento, pois as 21 replicatas técnicas garantem que a expressão de um determinado gene não seja tão afetada por ruídos que podem ocorrer durante o experimento, como problemas localizados de hibridização. Por outro lado, os controles de hibridização são sequências que não apresentam qualquer relação com o genoma avaliado e que são incorporadas às amostras de modo a observar a qualidade do processo de hibridização. Os controles negativos permitem uma melhor avaliação do ruído de fundo da lâmina (background), associado à hibridização não-específica, enquanto os controles positivos permitem avaliar a qualidade da hibridização ao longo do espectro de intensidade de sinal e em diferentes razões de expressão. Cada arranjo das lâminas do experimento de mRNA foi hibridizado com a combinação dois-a-dois dos tipos celulares descritos (mioblastos não diferenciados, miotubos, cTEC, mTEC, cTEC+Ty, mTEC+Ty). Os desenhos experimentais foram equilibrados, utilizando a estratégia de dye-swapping para contrabalançar o efeito de incorporação do marcador nas amostras, pois esta nem sempre se dá de maneira uniforme(35–37,73), além de a sensibilidade do scanner a cada marcador não ser sempre a mesma(34). Uma ilustração desta estratégia pode ser vista na Figura 3.1, para melhor entendimento. De forma simples, em cada lâmina, cada amostra recebe um ou outro marcador, de maneira alternada. Foram realizadas seis comparações, com três replicatas biológicas em dye-swap. Figura 3.1. Esquema ilustrativo da técnica de dye-swap. Os experimentos de miRNA foram realizados em lâminas Agilent MicroRNA Microarrays, cada uma contendo oito arranjos idênticos com 740 sequências de miRNA. Nos experimentos de miRNA, as lâminas utilizadas eram monocromáticas e cada um dos oito arranjos de cada lâmina recebeu amostra de uma condição. Assim, foram hibridizadas três replicatas biológicas de cada condição e uma 22 replicata adicional de cada, contendo o pool das três anteriores, num total de quatro amostras por condição. Tanto para os experimentos de mRNA, quanto para os experimentos de miRNA, foi utilizada uma abordagem de modelagem linear dos efeitos dos fatores. Assim, iniciando pela comparação de mioblastos humanos, a expressão observada em cada spot é dada pela combinação linear da média da expressão desse spot entre as diferentes condições (efeito médio) mais o (in)decremento de expressão atribuído à condição de referência (mioblasto) ou à condição “diferenciado” (efeito da diferenciação), de acordo com a equação abaixo log 2 yij 0 1Dif eij Equação 3.1: , onde log2(yij) é o valor normalizado, log-transformado, da expressão do gene i na condição j, para j igual a 0 ou 1, respectivamente para as condições de referência (mioblasto) e “diferenciado” (miotubo), β0 é o intercepto da função linear, β1 é o coeficiente angular da função linear, e eij é o erro aleatório de log2(Yij). Esquematicamente, o experimento pode ser representado como na Figura 3.2, onde cada retângulo representa uma amostra e cada seta representa uma lâmina. A orientação da seta representa o marcador da amostra. As setas em sentidos opostos ilustram o efeito da abordagem em dye-swap. CHQ x CHQ Dif CHQ CHQ Dif CHQ Dif x CHQ Figura 3.2. Representação esquemática dos experimentos de microarranjos Com este desenho em mente, podemos representar o experimento, de forma matemática, com a Equação 3.2 e Equação 3.3. Equação 3.2: CHQ xCHQDif 0 0 1Dif 1Dif Equação 3.3: CHQDif xCHQ 0 1Dif 0 1Dif As equações acima apresentam resultados de módulo igual, embora os sinais sejam diferentes, resultado do uso da técnica de dye-swap. A diferença no sinal não tem implicação para a avaliação do efeito e é corrigida durante o processo de análise. 23 Para os experimentos de miRNA, o mesmo padrão acima foi seguido, conforme dito anteriormente. Uma diferença fundamental é que os experimentos de miRNA foram realizados utilizando lâminas monocromáticas. Assim, cada condição foi hibridizada em um arranjo independente e a comparação entre condições foi feita utilizando o modelo de comparação indireta, que tende a reduzir o poder estatístico devido ao aumento da variabilidade(73). O desenho dos experimentos de microarranjos de mRNA e miRNA do modelo de células epiteliais tímicas se deu de forma bastante similar àquela utilizada nos experimentos de mioblastos humanos. A maior diferença, além da óbvia utilização de genomas diferentes, está no desenho experimental. O modelo utilizando células epiteliais tímicas é mais complexo, pois envolve dois fatores principais (Linhagem e Contato com timócito) e a possível interação entre esses. Cada uma das comparações analisadas fornece informação para um ou mais fatores. O desenho experimental pode ser visto na Figura 3.3. mTEC x mTEC+Ty mTEC mTEC+Ty cTEC x mTEC mTEC+Ty x cTEC+Ty mTEC x cTEC cTEC+Ty x mTEC+Ty mTEC+Ty x mTEC cTEC x cTEC+Ty cTEC cTEC+Ty cTEC+Ty x cTEC Figura 3.3. Desenho experimental da análise de microarranjos no modelo de células epiteliais tímicas de camundongos. Cada seta indica uma hibridização. Setas em sentidos opostos na mesma comparação indicam experimento em dye-swap. Novamente, tanto para os experimentos de mRNA, quanto para os experimentos de miRNA, foi utilizada uma abordagem de modelagem linear. Diferente do modelo de reta empregado na comparação de mioblastos humanos (ver Equação 3.1), temos agora um modelo dado por um hiperplano de dimensão igual a 3, onde a expressão observada em cada spot é dada pela combinação linear da média da expressão desse spot entre as diferentes condições (efeito médio) mais o (in)decremento de expressão atribuído ao efeito da linhagem, mais o (in)decremento de expressão atribuído ao efeito do contato com o linfócito, mais o (in)decremento 24 de expressão atribuído à interação dos efeitos principais linhagem e contato com o linfócito, de acordo com a equação abaixo: log 2 yijk 0 1a j 2bk 3ab jk eijk Equação 3.4: , onde, à semelhança da Equação 3.1, log2(yijk) é o valor normalizado, logtransformado, da expressão do gene i na condição jk, para j igual a 0 ou 1, respectivamente para as condições de referência (mTEC) e cTEC, para o efeito da linhagem a, e k igual a 0 ou 1, respectivamente para a ausência ou presença de contato da célula epitelial tímica com o linfócito, para o efeito do contato com o timócito b. β0 é o intercepto da função linear, dada pela expressão média de mTEC sem contato com o timócito, β1 é o coeficiente angular da dimensão do efeito a, β2 é o coeficiente angular da dimensão do efeito b, e β3 é o coeficiente angular da dimensão do efeito de interação entre os efeitos principais a e b, enquanto eijk é o erro aleatório de log2(yijk). Para facilitar a compreensão, na Figura 3.4 substituímos os nomes indicativos da origem das amostras pelo seu significado no processo de modelagem linear (Equação 3.4), partindo da utilização das amostras mTEC como amostras de referência. Fator b β0 + β2b β0 + β1a β0 + β1a + β2b+ β3ab Fator a Interação β0 Fator b + Interação Figura 3.4. Substituição do nome das amostras pelos fatores representados no processo de modelagem. Os efeitos estimados em cada comparação estão representados sobre a s setas. Aqui, a análise pela modelagem linear dos efeitos traz a vantagem do aumento do tamanho das amostras ao estimar cada efeito principal, possibilitando maior poder estatístico na detecção de mRNAs ou miRNAs diferencialmente 25 expressos (DE). Fica claro, pois, que as diferentes hibridizações representadas na figura 4.4 equivalem, com menor rigor matemático para maior simplicidade, às equações a seguir: Equação 3.5: cTEC x mTEC 0 1a 0 1a Equação 3.6: mTEC Ty x mTEC 0 2b 0 2b Equação 3.7: cTEC Ty x cTEC 0 1a 2b 3ab 0 1a 2b 3ab Equação 3.8: cTEC Ty x mTEC Ty 0 1a 2b 3ab 0 2b 1a 3ab , ou de sinal contrário para as hibridizações correspondentes em dye-swap. Novamente, o mesmo desenho experimental foi seguido para os experimentos de miRNA com células epiteliais tímicas, ainda que também estas sejam monocromáticas, assim como na comparação de mioblastos. 3.3. Análise Estatística de Microarranjos 3.3.1. Pré-Processamento e Detecção de Genes Diferencialmente Expressos Toda a etapa de análise estatística, desde o pré-processamento até a análise de enriquecimento, foi realizada utilizando o programa R(74), versão 2.15.2. Na etapa de pré-processamento e análise estatística foram utilizados ainda os pacotes “Agi4x44PreProcess”(75), “hgug4112a.db”(76), “mgug4122a.db”(77) e “limma”(78). O primeiro é um pacote de funções de pré-processamento típicas para laminas da Agilent de 4 x 44 k sondas, que permite, entre outros, a eliminação de sondas correspondentes à controles de hibridização, o resumo das intensidades de sondas replicadas nos arranjos pela média aritmética dessas, a análise de qualidade dos arranjos por meio de estatísticas e gráficos. Os dois seguintes dizem respeito às anotações sobre o genoma humano e murinho à partir da identificação das sondas Agilent impressas nos respectivos arranjos. O quarto pacote de funções contem funções específicas para análise de dados de microarranjos via modelos lineares. A análise dos experimentos de microarranjo foi iniciada pela filtragem do sinal obtido pelo escaneamento das lâminas. Foram considerados a uniformidade dos poços, saturação do sinal e relação sinal-ruído, de modo a selecionar apenas as sondas com boa qualidade de sinal. Após a análise exploratória das sondas 26 selecionadas, optou-se por não fazer a correção do sinal de background(79), a normalização dentro de cada arranjo pelo método global lowess (locally estimated weighted sum of squares)(80), e entre os arranjos, pelo método quantile(81). O método lowess ajusta curvas de regressão linear locais, utilizando uma janela móvel, para corrigir erros aditivos ou multiplicativos que possam estar presentes no sinal. Estes erros podem surgir por defeitos locais no arranjo ocasionados por partículas em suspensão, por exemplo, ou por problemas de incorporação dos marcadores pelas amostras, entre outros fatores. Para uma revisão sobre métodos de normalização e seus impactos nos resultados de um experimento de microarranjo, ver Sperandei(42). Uma vez que em cada arranjo existia mais de uma sonda (poço) para cada gene, o passo seguinte foi a união do sinal das sondas replicadas para um mesmo gene, através da média aritmética do sinal entre réplicas. Para a comparação das condições, foi utilizado o teste t modificado proposto inicialmente por Loennstedt e Speed(82) e aprimorado posteriormente(83,84). Este teste utiliza uma abordagem Bayesiana empírica (empirical Bayes) para combinar a informação obtida de outros genes na inferência feita para cada gene, corrigindo a variância dos genes e aumentando sua capacidade de detecção de genes diferencialmente expressos. Devido ao grande número de genes analisados simultaneamente, foi feita uma correção para testes múltiplos em cada comparação, através do controle da taxa de falsa descoberta (false discovery rate - FDR)(85), menos conservadora que as técnicas de correção do erro total (family wise error) e, por isso, mais poderosa. Foram considerados diferencialmente expressos aqueles mRNAs ou miRNAs que apresentaram FDR igual ou inferior a 0,05. Esta abordagem é similar, qualitativamente, a dizer que o gene era considerado diferencialmente expresso quando o p-valor corrigido era menor ou igual a 0,05. 3.3.2. Análise de Enriquecimento Após a determinação dos mRNAs diferencialmente expressos, foi realizada a análise de enriquecimento de ontologias, mais especificamente de processos biológicos e vias de regulação gênicas, a fim de reconhecer processos e vias sobrerepresentados na lista de mRNAs diferencialmente expressos em relação aos genes observados nas lâminas, usando para esse fim as bibliotecas de anotação 27 relacionando os identificadores das sondas aos identificadores Entrez, e esses aos processos biológicos descritos no The Gene Ontology database(48) (GO, disponível em http://www.geneontology.org/) e às vias de regulação gênicas descritas no Kyoto Encyclopedia of Genes and Genomes(49) (KEGG, disponível em www.genome.jp/kegg/). Nesta etapa, utilizamos o teste hipergeométrico para determinar os processos biológicos e vias de regulação gênicas mais representados na lista de genes diferencialmente expressos encontrada em cada efeito(46). Os pacotes “GOstats”(47), “annaffy”(86), “genefilter”(87) e “Category”(88), além do próprio “limma”(78) também foram incluídos nesta etapa. Esses trazem as funções de manipulação e anotação necessárias ao processamento dos dados. Inicialmente, é feita uma busca no banco relacional no formato SQLite contido no pacote de anotação da lâmina para os processos biológicos associados a cada mRNA. Posteriormente, é determinada a probabilidade de sobrerepresentação ou enriquecimento, ao acaso, do total de vezes que um dado processo surgiu associado aos mRNAs diferencialmente expressos (geneset) levando em consideração o total de vezes que esse mesmo processo estava associado a todos os genes observados no arranjo (universo). Sempre que o p-valor é menor que 0,01, este processo é considerado como “enriquecido”. Por isso, essa análise é também comumente referida como Geneset Enrichment Analysis (GSEA)(47). O p-valor mais baixo para esta etapa se deve ao fato de que aqui não será realizada correção para testes múltiplos. 3.4. Predição e Seleção de miRNAs Candidatos Seguindo a ideia descrita na seção “Predição de Expressão de miRNAs”, a análise de enriquecimento, similar à apresentada no item “Análise de Enriquecimento” para processos biológicos no conjunto de genes diferencialmente expressos em cada efeito de interesse, foi também utilizada na predição dos miRNAs que apresentariam, possivelmente, uma alteração de expressão. A partir da lista de mRNAs DE obtida para cada efeito ajustado à partir dos experimentos de microarranjo, para cada miRNA foi importada do miRBase Targets Release Version v5 (disponível em http://www.ebi.ac.uk/enright-srv/microcosm/cgibin/targets/v5/download.pl), para os organismos H. sapiens e M. musculus, e geradas a partir do algoritmo miRAnda(89). Após mapeamento de ambos os 28 identificadores dos mRNAs observados nos experimentos de microarranjo e os identificadores dos alvos de regulação por miRNAs do banco miRBAse para o identificador Entrez, via pacotes de anotação, e usando como geneset a lista de mRNAs DE em cada efeito de interesse ajustado, realizamos análises de enriquecimentos de miRNAs que, segundo o banco miRBase, tinham como alvo de regulação os mRNAs DE sobre ou subexpressos, em análises independentes, levando em consideração a informação de regulação de todos os miRNAs com todos os mRNAs observados nas lâminas de microarranjo. A partir dessa análise de enriquecimento, realizada através do pacote CORNA(90), foi determinada a probabilidade de que, ao acaso, uma tal quantidade de alvos para um miRNA estivesse presente na lista de mRNAs diferencialmente expressos considerando-se a informação de regulação de todos os miRNAs com todos os mRNAs observados nas lâminas de microarranjo. Um miRNA foi considerado como potencialmente diferencialmente expresso sempre que essa probabilidade era inferior a 0,05. Cabe salientar aqui que a opção pela utilização da informação de predição de regulação miRNA-mRNA do banco miRBase Targets Release Version v5 nessa etapa, e não de outro banco de predição de regulação miRNA-mRNA, ou ainda da interseção da informação de dois ou mais bancos de predição de regulação miRNA-mRNA, se deu pela maior sensibilidade de predição desse, e consequentemente pela maior interseção do universo de busca, dado pela lista de todos os mRNAs observados nas lâminas de microarranjo, com a lista de alvos de regulação por miRNAs presentes nesse banco. Assumimos pois, que a baixa especificidade esperada da utilização desse banco, ou de bancos individuais de predição de regulação miRNAmRNA, qualquer que fosse esse, se dá de forma aleatória para os diferentes miRNAs e, portanto, não interferiria na seleção efetuada. A análise foi realizada de forma independente para mRNAs sobrexpressos na busca de miRNA enriquecidos potencialmente subexpressos, e vice versa, resultando em listas de miRNAs preditos como subexpressos (regulando mRNAs DE sobrexpressos) e miRNAs preditos subexpressos (regulando mRNAs DE subexpressos). Esta divisão foi feita com base na ação de bloqueio póstranscricional dos miRNAs, geralmente aceita(57). Desta forma, foram criadas duas listas de miRNAs preditos para cada efeito avaliado. 29 Devido ao excessivo número de miRNAs diferencialmente expressos encontrado, tanto por meio dos arranjos de miRNA, quanto pela análise de enriquecimento, se tornou economicamente necessária a seleção de um subgrupo de miRNAs para serem submetidos à confirmação de expressão por RT-PCR em tempo real. Esta seleção foi realizada por dois especialistas, um em cada experimento, com base no conhecimento sobre o funcionamento dos sistemas e nos processos biológicos e vias metabólicas associados aos mRNAs e miRNAs. O fluxograma desta análise está representada na Figura 3.5. Lista de mRNAs Subexpressos Lista de miRNAs Sobrexpressos Enriquecimento (pacote CORNA) miRNAs Enriquecidos Sobrexpressos Seleção de Candidatos Seleção de Candidatos Lista de Candidatos para Confirmação Confirmação por RT-PCR em tempo real Figura 3.5. Fluxograma da análise de enriquecimento de mRNAs para detecção de miRNAs com potencial expressão diferenciada. Embora este procedimento de seleção de subgrupos para confirmação por RT-PCR em tempo real possa representar uma limitação metodológica na análise 30 dos resultados obtidos pelas duas formas de seleção, ele foi necessário para viabilizar o experimento. 3.5. Confirmação por RT-PCR em Tempo Real A expressão dos microRNAs foi observada através de RT-PCR em tempo real utilizando placas de PCR array customizadas (SABiosciencie, Qiagen), contendo 96 poços ocupados, de acordo com o experimento, por microRNAs de interesse e pequenos RNAs controles. A síntese do DNA complementar (cDNA) e a amplificação por PCR foi feita utilizando o kit RT2 miRNA First Strand e RT2 SYBR Green qPCR Master Mix (SABioscience, Qiagen), que contém todos os reagentes para a reação de transcriptase reversa, de acordo com as instruções dos fabricantes. O aparelho utilizado foi o StepONE Plus (Applied Biosystems) para as reações de amplificação em tempo real. 31 4. Resultados e Discussão 4.1. Diferenciação de Mioblastos Humanos 4.1.1. Microarranjos de mRNA Inicialmente, torna-se necessária a análise da qualidade do processo de hibridização realizado. A Figura 4.1 mostra um exemplo representativo do resultado de hibridização obtido. Como pode ser observado, os controles positivos apresentam expressão diferenciada, enquanto os negativos encontram-se localizados próximos ao extremo esquerdo do eixo de intensidades (eixo A), pois estes controles são, na verdade, pontos sem DNA e sua expressão é resultado, apenas, do sinal de background da lâmina. Cabe destacar ainda os spots marcados como “darkcorner” e “brightcorner”, que são controles de intensidade do sinal, sem variação no nível de expressão diferencial. Assim, a posição esperada para estes controle é próxima ao valor zero do eixo M, mas afastados entre eles no eixo A. 32 Figura 4.1. Imagem representativa do resultado bruto de um experimento, identificando os controles de hibridização. O eixo “M” apresenta a razão entre as condições, enquanto o eixo “A” representa a média do sinal nas duas condições. Valores em escala log2. A partir dos dados brutos gerados pelos experimentos de microarranjos de mRNA, foi iniciada a etapa de pré-processamento dos dados. Esta etapa incluiu a filtragem e normalização dos dados, visando a retirada dos spots incluídos como controle de qualidade na lâmina de microarranjo, os spots de baixa qualidade (baixa relação sinal-ruído) e correção de ruídos inerentes ao experimento (e.g., sensibilidade diferenciada do scanner ao marcador, que pode ser vista como curvaturas na Figura 4.1 acima). O resultado final global desta etapa pode ser visto na Figura 4.2. A etapa de pré-processamento é fundamental para a qualidade dos resultados obtidos em experimentos de microarranjos, de modo a controlar as fontes de variabilidade presentes em um experimento de microarranjo, como efeitos de 33 saturação, flutuações na quantidade de sonda, hibridação não específica e outras, que dão origem a erros de medida(38,81,91). Figura 4.2. Densidade da intensidade dos sinais obtidos das lâminas de microarranjo antes (esquerda) e após (direita) a etapa de normalização entre arranjos, ou escalonamento, pelo método quantile. Cada linha verde ou vermelha representa a distribuição de intensidades dos canais R e G de uma lâmina, independente da condição experimental, ou grupo experimental. Uma vez que o esperado em um experimento de microarranjos é que a maioria absoluta dos genes não apresente expressão diferenciada, ao analisarmos a expressão em conjunto de todos os genes, espera-se que sua distribuição seja semelhante, independentemente da condição analisada (Figura 4.2). O que podemos notar na imagem da esquerda é que, mesmo após a etapa de normalização dentro de cada arranjo, nesse caso obtida após a normalização global lowess(92), existe ainda uma variação entre lâminas, relacionada às características do experimento (quantidade de marcador incorporado às amostras, hibridização não específica, etc). Após a etapa de normalização entre arranjos (imagem da direita), nesse caso obtida pelo método quantile(93), observamos uma excelente concordância ente as distribuições globais das intensidades normalizadas e 34 escalonadas de todos os arranjos do experimento, permitindo assim a comparação entre arranjos de diferentes condições experimentais de interesse. Passada a etapa de pré-processamento, e atestada a boa qualidade dos dados gerados, foi dado início à análise estatística dos dados de expressão nas condições de interesse. Foram observados, na comparação entre células musculares diferenciadas (miotubos) e não-diferenciadas (mioblastos), um total de 2029 genes diferencialmente expressos, sendo 948 genes subexpressos e 1081 genes sobrexpressos em miotubos. A lista completa dos genes diferencialmente expressos nesta comparação se encontra no Anexo 1. Entre estes genes encontramos alguns altamente modulados, como actinina alfa 2 (log 2 foldchange=5,84; p<0,001), já descrita como fundamental no processo de diferenciação do mioblasto(94). Também o gene para a titina, a maior proteína humana e com expressão restrita ao músculo estriado(95) mostrou elevada expressão nos nossos resultados (log2 fold-change=5,54; p<0,001). Entre os genes diferencialmente expressos encontramos diversos membros da família das lamininas e da família das integrinas, famílias já descritas como importantes na regulação do processo de diferenciação de mioblastos(66,96). A análise destes resultados do ponto de vista biológico é tarefa árdua, devido à sua grande quantidade e não é o foco principal deste trabalho. De posse da lista de genes diferencialmente expressos, procedeu-se a análise de enriquecimento funcional, observando a possível sobrerepresentação de processos biológicos e vias de regulação gênicas no conjunto de genes selecionados. Foram observados 106 processos biológicos sobrerepresentados (a Figura 4.3 apresenta os 50 com menor p-valor e o Anexo 2 apresenta a lista completa). Foi selecionado um subgrupo de processos associados à diferenciação de mioblastos, entre eles os processos cell adhesion, cell-matrix adhesion, signaling, regulation of cell adhesion e integrin-mediated signaling pathway (Figura 4.4). Já em relação às vias de regulação gênicas, foram observadas 12 vias sobrerepresentadas, apresentadas na Figura 4.5. 35 Figura 4.3. Relação dos 50 processos biológicos sobrerepresentados na comparação do perfil de expressão gênica de mRNAs entre células musculares diferenciadas (miotubos) e não-diferenciadas (mioblastos) com menor p-valor. A barra escura representa o número de genes esperados por chance e a barra clara (por trás da escura) indica o número de genes diferencialmente expressos observados em cada processo biológico enriquecido. O valor ao final da barra indica o p-valor pelo teste hipergeométrico. 36 Figura 4.4. Processos biológicos destacados na comparação entre células musculares diferenciadas (miotubo) e células musculares indiferenciadas (mioblastos). Figura 4.5. Vias de expressão gênicas sobrerepresentadas na comparação entre células musculares diferenciadas (miotubos) e não-diferenciadas (mioblastos). A barra escura representa o número de genes esperados por chance e a barra clara (por trás da escura) indica o número de genes diferencialmente expressos observados. O valor ao final da barra indica o p-valor pelo teste hipergeométrico. 37 4.1.2. Microarranjos de miRNA O mesmo efeito do pré-processamento observado nas lâminas de mRNA também pode ser observado nos experimentos de miRNA, garantindo a boa qualidade dos resultados obtidos. Este sucesso fica demonstrado na Figura 4.6 onde, a exemplo do ocorrido nos experimentos de mRNA, o processo de normalização foi capaz de corrigir distorções entre as lâminas. Figura 4.6. Distribuição das intensidades dos sinais das lâminas de miRNA antes (esquerda) e após (direita) a etapa de pré-processamento. É importante lembrar que, neste caso, as lâminas foram monocromáticas. Assim, cada linha representa um arranjo independente. Foram observados 11 miRNAs sobrexpressos neste experimento e 18 miRNAs subexpressos em miotubos. Entre estes, destacam-se os hsa-miR-206, hsa-miR-1 e hsa-miR-133b como miRNAs com alta diferença de expressão no processo de diferenciação (log fold change > 4). Estes três miRNAs já foram 38 descritos como relacionados ao processo de diferenciação de mioblastos, sendo denominados de MyoMirs(12–14,97–99). 4.1.3. Seleção de miRNAs Candidatos A partir dos mRNAs diferencialmente expressos, utilizando a abordagem de enriquecimento de miRNAs em relação aos alvos preditos, segundo o miRBase Targets Release Version v5 para H. sapiens, foi possível apontar um grande número de miRNAs que, a julgar pelo comportamento do conjunto dos seus alvos preditos, poderiam apresentar modulação de expressão durante a diferenciação de mioblastos. Embora alguns destes miRNAs já tivessem aparecido nos experimentos de microarranjo, outros não apresentaram expressão diferencial, o que pode ter ocorrido por limitações técnicas do primeiro experimento (reduzido poder estatístico, por exemplo) ou por motivos biológicos (observação da redução na abundância do mRNA-alvo, mas não mais na do miRNA, por exemplo). Através do processo de enriquecimento de miRNAs para seus alvos preditos diferencialmente expressos foram apontados 52 miRNAs candidatos, sendo 24 sobrexpressos e 28 subexpressos. A lista completa dos miRNAs apontados como sobrerepresentados são mostrados na Tabela 4.1. Tabela 4.1. miRNAs sobrerepresentados obtidos pelo processo de enriquecimento de miRNAs para seus alvos preditos segundo o miRBase Targets Release Version v5 para H. sapiens diferencialmente expressos no experimento de microarranjo. “Total” indica o total de alvos preditos para o miRNA. “Esp” e “Obs” são, respectivamente, os números esperado e observado de alvos preditos dentro da lista de genes DE. O p-valor apresentado foi obtido pelo teste hipergeométrico. Sobrexpressos miRNA Total Esp hsa-miR-877 425 49 hsa-miR-124 517 60 hsa-miR-197 225 26 hsa-miR-521 280 32 hsa-miR-339-3p 311 36 hsa-miR-629 425 49 hsa-miR-511 242 28 hsa-miR-602 296 34 hsa-miR-604 268 31 hsa-miR-376c 306 35 hsa-miR-93 551 64 hsa-miR-375 269 31 hsa-miR-328 261 30 hsa-miR-129-5p 270 31 hsa-miR-512-5p 263 30 Obs 69 81 40 46 50 65 40 47 43 48 80 43 41 42 41 p 0,002 0,002 0,003 0,008 0,009 0,010 0,011 0,013 0,015 0,016 0,016 0,016 0,024 0,026 0,026 miRNA hsa-miR-499-5p hsa-miR-29b hsa-miR-29c hsa-miR-196ª hsa-miR-369-3p hsa-miR-590-5p hsa-miR-891ª hsa-miR-628-5p hsa-miR-187 hsa-miR-433 hsa-miR-299-5p hsa-miR-629 hsa-miR-582-5p hsa-miR-338-5p hsa-miR-208b Subexpressos Total Esp 251 25 329 33 617 61 509 50 258 26 328 32 316 31 293 29 459 45 251 25 252 25 428 42 263 26 330 33 254 25 Obs 43 51 84 69 39 46 44 41 60 36 36 56 37 44 35 p 0,000 0,001 0,001 0,004 0,004 0,009 0,012 0,014 0,014 0,014 0,015 0,017 0,017 0,024 0,026 39 hsa-miR-886-5p hsa-miR-28-5p hsa-miR-423-3p hsa-miR-525-3p hsa-miR-127-5p hsa-miR-615-5p hsa-miR-647 hsa-miR-518a-3p hsa-miR-363 296 306 314 339 255 324 287 388 478 34 35 36 39 29 37 33 45 55 45 46 47 50 39 48 43 56 67 0,031 0,035 0,035 0,039 0,039 0,039 0,042 0,043 0,049 hsa-miR-876-5p hsa-miR-137 hsa-miR-519c-3p hsa-miR-10ª hsa-miR-135ª hsa-miR-496 hsa-miR-376b hsa-miR-374ª hsa-miR-147b hsa-miR-218 hsa-miR-607 hsa-miR-586 hsa-miR-549 264 291 371 461 525 224 286 349 305 254 220 238 282 26 29 37 46 52 22 28 35 30 25 22 24 28 36 39 48 58 65 31 38 45 40 34 30 32 37 0,028 0,030 0,030 0,031 0,031 0,033 0,035 0,037 0,038 0,041 0,043 0,044 0,044 Após o processo de seleção de candidatos, os miRNAs sobrerepresentados e seus alvos preditos foram graficamente representados na forma de redes de interações miRNA-alvos. Exemplos de redes de interações miRNA-alvos podem ser observadas na Figura 4.7, representando diferentes redes de interações para o miRNA hsa-miR-29b. Na figura da esquerda, estão representados todos os alvos diferencialmente expressos no experimento de microarranjo para o miRNA, enquanto na figura da direita, foram mantidos apenas aqueles associados aos processos de interesse biológico para a comparação em questão. Figura 4.7. Rede de integrações miRNA-alvos para o hsa-miR-29b. Na figura da esquerda estão representados todos os genes observados como DE no experimento de microarranjo e que são alvos preditos do hsa-miR-29b segundo o miRBase Targets Release Version v5 para H. sapiens. Na direita, representados apenas os genes DE associados a processos biológicos de interesse (fig. 5.4). A escala de cores dos nós indica os valores de log fold-change (base 2) da expressão desses genes entre as condições miotubo e mioblastos, enquanto o tamanho desses nós é inversamente proporcional ao pvalor ou razão de falsa descoberta (FDR) dessa expressão diferencial. Entre os 27 miRNAs selecionados para confirmação por RT-PCR em tempo real, 16 estavam presentes na lista de miRNAs DE dos experimentos de 40 microarranjos, nove são oriundos da lista de miRNAs sobrerepresentados, um estava presente nas duas listas e outro se mostrou enriquecido como miRNA sobrexpresso e subexpresso. 4.2. Células Epiteliais Tímicas 4.2.1. Microarranjos de mRNA Assim como no experimento de diferenciação de mioblastos humanos, o experimento com células epiteliais tímicas mostrou excelente qualidade, com os pequenos ruídos inerentes à técnica sendo satisfatoriamente corrigidos na etapa de pré-processamento dos dados de microarranjos. Em resumo, foram observados 3224 genes DE nos três efeitos de interesse, ou seja, efeito da linhagem, efeito do contato com timócitos e interação entre os dois efeitos primários, utilizando linhagens de células epiteliais tímicas murinas (1.4C18, com fenótipo de TEC cortical, e 3.10, com fenótipo de TEC medular). A Tabela 4.2 apresenta os números de genes de acordo com os efeitos de interesse. A lista completa dos genes diferencialmente expressos no arranjo pode ser observada no Anexo 3 e Anexo 4. Tabela 4.2. Número de genes diferencialmente expressos. Genes sobrexpressos: significativamente maior na primeira condição. Genes subexpressos: significativamente menores na primeira condição. Efeito Linhagem Timócito Interação Linhagem x Timócito Significado Efeito de cTEC em relação a mTEC Efeito do contato com timócito Interação do efeito de cTEC com o efeito do timócito Sobrexpressos 1701 66 103 Subexpressos 1325 4 25 Conforme esperado, o efeito da linhagem foi o que gerou um maior número de genes diferencialmente expressos. No total, de 21 processos biológicos se mostraram sobrerepresentados no conjunto de genes diferencialmente expressos observados (Figura 4.8). Isso indica que, para estes processos biológicos, havia uma proporção maior de genes no conjunto de genes diferencialmente expressos do que o esperado ao acaso quando consideramos a proporção de genes pertencentes a estes processos no conjunto de genes presente no arranjo. Dentre os processos 41 enriquecidos, destacamos a adesão celular (cell adhesion) e a morfogênese de estrutura anatômica (anatomical structure morphogenesis). Figura 4.8. Processos biológicos enriquecidos para o efeito da linhagem. A barra escura representa o número de genes esperados ao acaso, enquanto a barra clara representa o número de genes observados. O valor ao final da barra é o p-valor do teste hipergeométrico. Em relação às vias de regulação gênicas, obtidas da base de dados KEGG, apenas uma via se mostrou enriquecida (metabolic pathways). O efeito global do contato das células epiteliais tímicas com timócitos observado foi o de aumento no nível de expressão dos genes modulados (Anexo 4). A análise de enriquecimento apontou alteração de 39 processos biológicos (Figura 4.9). Aqui, é interessante notar que, apesar de apresentar uma quantidade relativamente menor de genes modulados em consequência do efeito da linhagem, estes genes estão mais concentrados em torno dos mesmos processos biológicos, o que é evidenciado pelo maior número de processos enriquecidos. Foram ainda observadas seis vias de regulação gênicas enriquecidas, apresentadas na Figura 4.10, donde destacamos o enriquecimento da via de regulação gênica relativa ao processamento e apresentação de antígenos (antigen processing and presentation). 42 Figura 4.9. Processos biológicos enriquecidos associados ao contato com o timócito. A barra escura representa o número de genes esperados ao acaso, enquanto a barra clara representa o número de genes observados. O valor ao final da barra é o p-valor do teste hipergeométrico. 43 Figura 4.10. Vias de regulação gênica enriquecidas pelo efeito do contato com o timócito. A interação entre os efeitos da linhagem e do contato com o timócito apresentou genes diferencialmente expressos concentrados em um número menor de processos biológicos e vias de regulação gênicas. Foram observados 15 processos biológicos enriquecidos (Figura 4.11) e apenas duas vias de regulação gênicas, a via de lúpus eritematoso sistêmico (systemic lupus erythematosus) e de leishmaniose (leishmaniasis). Figura 4.11. Processos biológicos enriquecidos na interação entre linhagem e timócito. A barra escura representa o número de genes esperados ao acaso, enquanto a barra clara representa o número de genes observados. O valor ao final da barra é o p-valor do teste hipergeométrico. 44 4.2.2. Microarranjos de miRNA Assim como no experimento de diferenciação de mioblastos humanos, o experimento de microarranjos de miRNA com células epiteliais tímicas demonstrou excelente qualidade, como evidenciado pelos dados obtidos após a etapa de préprocessamento. O número de miRNAs diferencialmente expressos para cada efeito encontrase descrito na Tabela 4.3. A lista completa dos miRNAs diferencialmente expressos no arranjo encontra-se no Anexo 5. Tabela 4.3. Número de miRNAs diferencialmente expressos. miRNAs sobrexpressos: significativamente maior na primeira condição. miRNAs subexpressos: significativamente menores na primeira condição. Efeito Linhagem Timócito Interação Significado Efeito de cTEC em relação a mTEC Efeito do contato com o timócito Efeito da interação entre cTEC e o contato com o timócito Sobrexpressos 15 2 0 Subexpressos 15 1 2 4.2.3. Seleção de miRNAs Candidatos Através do processo de enriquecimento de miRNAs para seus alvos preditos, segundo o miRBase Targets Release Version v5 para M. musculus, diferencialmente expressos foram apontados 332 miRNAs (Tabela 4.4), dos quais 68 tinham alvos envolvidos com os processos biológicos destacados. Ainda na Tabela 4.4, encontramos o grau de sobreposição entre os miRNAs encontrados nos experimentos de microarranjos e aqueles apontados pelo processo de enriquecimento a partir das listas de mRNAs diferencialmente expressos. Tabela 4.4. Número de miRNAs apontados como possíveis diferencialmente expressos pelo processo de enriquecimento e grau de sobreposição em relação à lista de miRNAs obtida por microarranjos. Os micros apontados como “Ambos” não são contados nas categorias “Lâmina” ou “Predito”. Efeito Linhagem Timócito Interação Lâmina 14 3 2 miRNAs DE Predito Ambos 217 19 19 0 16 0 miRNAs Selecionados Lâmina Predito Ambos 9 49 19 0 10 0 0 7 0 A Figura 4.12 representa a rede de interação entre os mRNAs subexpressos na comparação das linhagens e os miRNAs preditos pelo processo de enriquecimento de miRNAs para seus alvos preditos diferencialmente expressos. 45 Devido ao grande número de mRNAs encontrados nesta comparação, como esperado, tivemos também um grande número de miRNAs preditos, de modo que a visualização da imagem por completo se torna pouco informativa. Uma simplificação da Figura 4.12, isolando apenas o miRNA mmu-miR-196a, é apresentada na Figura 4.13, onde vemos o mmu-miR-196a, predito por enriquecimento a partir da lista de mRNAs significativamente sobrexpressos, e seus alvos preditos segundo o miRBase Targets Release Version v5 para M. musculus. Uma vez que tantos alvos para um mesmo miRNA tenham sido observados com expressão elevada, espera-se que a expressão deste miRNA esteja reduzida, ainda que tenhamos uma alta razão de falsos positivos As Figuras Figura 4.14 e Figura 4.15 apresentam a lista completa dos miRNAs enriquecidos a partir da lista de mRNAs significativamente subexpressos e sobrexpressos, respectivamente, segundo o miRBase Targets Release Version v5 para M. musculus, associados ao efeito da linhagem. . 46 Figura 4.12. Rede de interações miRNA-mRNA, com os miRNAs preditos a partir da lista de mRNAs subexpressos no efeito Linhagem. A escala de cores dos nós indica os valores de log fold-change (base 2) entre a expressão desses genes entre células epiteliais tímicas corticais e medulares, enquanto o tamanho desses nós é inversamente proporcional ao p-valor ou razão de falsa descoberta (FDR) dessa expressão diferencial. 47 Figura 4.13. Interação entre o mmu-miR-196a e os seus alvos subexpressos no experimento de mRNA. A escala de cores dos nós indica os valores de log fold-change (base 2) entre a expressão desses genes entre células epiteliais tímicas corticais e medulares, enquanto o tamanho desses nós é inversamente proporcional ao p-valor ou razão de falsa descoberta (FDR) dessa expressão diferencial. 48 Figura 4.14. miRNAs sobrexpressos enriquecidos no efeito da linhagem e selecionados para confirmação por RT-PCR. A barra preta indica o número de alvos esperado para cada miRNA, enquanto a barra cinza indica o número de alvos diferencialmente expressos no experimento de mRNA. O valor ao final da barra representa o p-valor obtido pelo teste hipergeométrico. 49 Figura 4.15. miRNAs subexpressos enriquecidos no efeito da linhagem e selecionados para confirmação por RT-PCR. A barra preta indica o número de alvos esperado para cada miRNA, enquanto a barra cinza indica o número de alvos diferencialmente expressos no experimento de mRNA. O valor ao final da barra representa o p-valor obtido pelo teste hipergeométrico. 50 De modo semelhante, a Figura 4.16 mostra todos os miRNA enriquecidos em relação ao efeito do contato com o timócito. A figura seguinte (Figura 4.17) apresenta a mesma informação para a interação entre linhagem e timócito. Figura 4.16. miRNAs subexpressos enriquecidos no efeito do contato com o timócito. Abaixo, miRNAs sobrexpressos. Acima, miRNAs subexpressos. Os cinco primeiros miRNAs de cada conjunto foram selecionados para confirmação por RT-PCR. 51 Figura 4.17. miRNAs subexpressos enriquecidos na interação linhagem x timócito e selecionados para confirmação por RT-PCR. Abaixo, miRNAs sobrexpressos. Os quatro primeiros sobrexpressos e os três primeiros subexpressos foram selecionados para confirmação por RT-PCR. 4.3. Comprovação de miRNAs-Candidatos por RT-PCR em Tempo Real Foram selecionados 27 miRNAs do experimento de diferenciação de mioblastos humanos e 77 miRNAs dos experimentos com células epiteliais tímicas murinas para comprovação de expressão por RT-PCR em tempo real. A aparente discrepância em relação ao somatório das listas apresentadas anteriormente se dá porque alguns miRNAs aparecem em mais de um efeito ou aparecem no enriquecimento duas vezes (sobrexpresso e subexpresso). Do total de 104 miRNAs candidatos, 26 foram selecionados a partir dos resultados das lâminas de microarranjo de miRNA, 58 foram selecionados a partir do enriquecimento dos resultados dos microarranjos de mRNA e 20 foram selecionados em comum nas duas estratégias. A Tabela 4.5 apresenta a lista dos miRNA candidatos à comprovação, identificando a estratégia pela qual ele foi selecionado (Lâmina, Integração, Ambos). Todos os miRNAs iniciados por “hsa” são oriundos do 52 experimentos com mioblastos humanos e aqueles iniciados por “mmu” são provenientes dos experimentos com células epiteliais tímicas. Tabela 4.5. Listas dos miRNAs selecionados para validação de expressão por RT-PCR em tempo real por expressão diferenciada no experimento de microarranjos de miRNA (Lâmina), por meio da análise de enriquecimento ou pelos dois métodos simultaneamente. Os miRNAs iniciados pelas letras “hsa” são provenientes do experimento com mioblastos, enquanto aqueles iniciados por “mmu” são provenientes dos experimentos com células epiteliais. Lâmina Enriquecimento Ambos hsa-miR-1 hsa-miR-124 hsa-miR-29b hsa-miR-133ª hsa-miR-196a mmu-let-7d hsa-miR-133b hsa-miR-29c mmu-let-7i hsa-miR-155 hsa-miR-499-5p mmu-miR-107 hsa-miR-15ª hsa-miR-521 mmu-miR-10ª hsa-miR-15b hsa-miR-525-3p mmu-miR-139-5p hsa-miR-199a-3p hsa-miR-602 mmu-miR-148b hsa-miR-206 hsa-miR-629 mmu-miR-193 hsa-miR-210 hsa-miR-877 mmu-miR-221 hsa-miR-221 mmu-miR-222 hsa-miR-27ª hsa-miR-891a mmu-let-7ª hsa-miR-29ª mmu-let-7g mmu-miR-27b hsa-miR-362-5p mmu-miR-101a mmu-miR-301ª hsa-miR-455-3p mmu-miR-129-3p mmu-miR-30ª hsa-miR-532-5p mmu-miR-142-3p mmu-miR-30b hsa-miR-660 mmu-miR-143 mmu-miR-324-5p mmu-miR-103 mmu-miR-148a mmu-miR-335-5p mmu-miR-130a mmu-miR-181a mmu-miR-350 mmu-miR-183 mmu-miR-18a mmu-miR-9 mmu-miR-202-3p mmu-miR-191 mmu-miR-96 mmu-miR-365 mmu-miR-196a mmu-miR-467b mmu-miR-19b mmu-miR-669a mmu-miR-200b mmu-miR-697 mmu-miR-203 mmu-miR-878-3p mmu-miR-206 mmu-miR-9* mmu-miR-208b mmu-miR-23b mmu-miR-20a mmu-miR-20b mmu-miR-218 mmu-miR-220 mmu-miR-24 mmu-miR-25 mmu-miR-27a mmu-miR-295 mmu-miR-302a mmu-miR-31 mmu-miR-32 mmu-miR-322 53 mmu-miR-323-3p mmu-miR-33 mmu-miR-341 mmu-miR-34b-5p mmu-miR-411 mmu-miR-449c mmu-miR-455 mmu-miR-463 mmu-miR-464 mmu-miR-466f-3p mmu-miR-568 mmu-miR-654-3p mmu-miR-675-5p mmu-miR-683 mmu-miR-684 mmu-miR-694 mmu-miR-715 mmu-miR-761 mmu-miR-802 mmu-miR-92b A Figura 4.18 apresenta os resultados do experimento de confirmação de expressão por RT-PCR em tempo real para os miRNAs candidatos selecionados no experimento de mioblastos humanos. Observamos que 15 dos 16 miRNAs selecionados a partir dos resultados dos microarranjos de miRNA (Lâmina) foram confirmados, enquanto apenas quatro dos dez candidatos que haviam sido preditos (enriquecimento) se confirmaram. O hsa-miR-629, que havia sido predito tanto como sobrexpresso, quanto como subexpresso mostrou-se, afinal, como subexpresso. O hsa-miR-29b, que havia sido indicado para confirmação pelos dois processos (lâmina e enriquecimento) não foi confirmado por PCR. 54 Figura 4.18. miRNAs selecionados no experimento com mioblastos com expressão confirmada por RTPCR. * - p<0,05; ** - p<0,01. “0d” – células CHQ não-diferenciadas. “7d” – células CHQ após sete dias de diferenciação. 55 É importante ressaltar nestes resultados que todos os miRNAs confirmados foram confirmados na direção correta de expressão, ou seja, miRNAs sobrexpressos na lâmina ou no enriquecimento se mostraram sobrexpressos também no experimento de PCR, exceto para o hsa-miR-521, que havia sido predito como subexpressos e se mostrou sobrexpresso no experimento de PCR e vice-versa. Esse fato reforça a qualidade dos resultados obtidos. O miRNA hsa-miR-629 que foi apontado como sobrexpresso e subexpresso pelo enriquecimento, só se confirmou como subexpresso. Outro resultado que nos chama atenção é que o hsa-miR-29b, que havia sido apontado por ambos os métodos, não se confirmou no PCR. Tal fato pode estar relacionado a ele ter sido apontado em direções diferentes por cada método (sobrexpresso no enriquecimento, subexpresso na lâmina), sendo um possível falso-positivo. Por sua vez, as Figura 4.19 e Figura 4.20 apresentam os resultados por RTPCR em tempo real para os efeitos de interesse do experimento com células epiteliais tímicas murinas. A interpretação destes resultados não é tão direta quanto a da Figura 4.18, já que, por questões práticas, todos os efeitos foram observados para todos os miRNAs candidatos à comprovação no experimento de RT-PCR em tempo real, independente do(s) efeito(s) que havia(m) originado a seleção desses miRNAs. Dezesseis das 58 confirmações de miRNAs sugeridas exclusivamente pelo processo de enriquecimento se mostraram verdadeiras nos experimentos de RTPCR em tempo real, enquanto dois dos dez sugeridos pelas lâminas de miRNA se confirmaram. Em relação aos miRNAs sugeridos pelas duas estratégias, dez dos 19 se confirmaram. Ao juntarmos os resultados dos dois experimentos (mioblastos e células epiteliais), observamos uma associação entre o processo de seleção de miRNAscandidatos e a confirmação destes 2 11,89; p 0,004 . Entretanto, dois pontos devem ser considerados. O primeiro é que existe um claro viés nos resultados em relação ao experimento realizado. A “força” de predição das lâminas de miRNA está mais presente no experimento com mioblastos do que no experimento de células epiteliais, por exemplo. Uma análise mais aprofundada deste e de outros vieses se faz necessária no futuro. 56 Figura 4.19. miRNAs selecionados no experimento com células epiteliais com expressão confirmada por RT-PCR. “a” indica efeito de linhagem significativo; “b” indica efeito de contato com o timócito significativo; “ab” indica efeito significativo de interação entre linhagem e timócito. 57 Figura 4.20. (Continuação) miRNAs selecionados no experimento com células epiteliais com expressão confirmada por RT-PCR. “a” indica efeito de linhagem significativo; “b” indica efeito de contato com o timócito significativo; “ab” indica efeito significativo de interação entre linhagem e timócito. Por outro lado, é interessante observar que a estratégia de seleção de candidatos a partir dos dados já disponíveis nos arranjos de mRNA foi capaz de acrescentar informação aos experimentos, sendo que parte desta informação não foi obtida nem mesmo com os arranjos de miRNA. Adicionalmente, o método é sem custo adicional, uma vez que já se tenha os resultado de mRNA. A principal limitação deste trabalho pode, mesmo, ser parcial ou totalmente solucionada a partir da utilização exclusiva da seleção por enriquecimento. Ao dispensar a realização de microarranjos de miRNA, o pesquisador pode concentrar seus recursos na confirmação de mais candidatos. 58 Diversos trabalhos têm surgido com o objetivo de estudar as relações entre os miRNAs e seus mRNAs-alvos(100–102). A maioria tem focado na identificação de alvos para os miRNAs, uma vez que um miRNA pode agir sobre diversos mRNAs e um mRNA pode ser alvo para vários miRNAs. O nosso conhecimento sobre estas relações, armazenado em bancos como o miRBase(103), por exemplo, advém deste esforço. Com a formação dos bancos de dados sobre miRNAs, iniciou-se a busca pelas relações miRNA-mRNA de interesse biológico para processos específicos. Diversas ferramentas tem sido desenvolvidas, no campo da bioinformática, para tentar extrair informação a respeito função dos miRNAs sobre o organismo. Uma abordagem que tem se tornado bastante comum é estabelecer as possíveis ações de um determinado miRNA sobre o organismo a partir do enriquecimento dos seus alvos(104). De forma simples, a ideia é que se um miRNA atua sobre um determinado grupo de genes e estes genes, em conjunto, atuam sobre um determinado processo biológico, então o miRNA em questão tem, provavelmente, ação sobre este processo biológico. O algoritmo miR2Gene(100), de forma similar, mas mais complexa, parte de um gene, ou grupo de genes de interesse, estabelece o conjunto de miRNAs descritos como relacionados a este(s) gene(s) e, a partir dai, realiza o enriquecimento dos alvos destes miRNAs, estabelecendo as conexões e possíveis ações sobre o organismo. Embora estas abordagens sejam interessantes, o limitado número de experimentos de microarranjos com miRNA disponíveis(105,106) indica que é necessário o desenvolvimento de estratégias que nos possibilitem obter informações sobre os miRNAs a partir dos abundantes dados de microarranjos de mRNA já depositados em repositórios públicos. Com este objetivo, Stempor, Cauchi e Wilson(106) desenvolveram dois métodos de predição da expressão de miRNAs a partir dos resultados de microarranjos de mRNA. O pressuposto central é de que, uma vez que a ação dos miRNAs sobre seus alvos se dá pela repressão destes, miRNAs sobrexpressos podem ser esperados de mRNAs subexpressos. Esta abordagem é similar à nossa, tendo sido o único trabalho com este objetivo que encontramos, diferindo nos métodos utilizados. Enquanto o método 59 destes autores se baseia em uma função de escalonamento e um modelo linear, nós utilizamos a análise de enriquecimento, de modo similar ao utilizado para o enriquecimento dos processos biológicos e vias de regulação. Infelizmente, a comparação direta dos resultados não é possível, uma vez que estes autores não realizaram a confirmação de expressão nos seus resultados. 60 5. Conclusão Nossos trabalho demonstrou que o experimento de microarranjo de miRNA ainda é o que apresenta maior sensibilidade na detecção de miRNAs realmente diferencialmente expressos. Entretanto, a estratégia de seleção a partir da análise de enriquecimento dos resultados dos arranjos de mRNA foi capaz de acrescentar informação importante aos resultados, sem custo adicional. Ainda mais, se utilizada em conjunto com os arranjos de miRNA, esta estratégia parece aumentar o poder de seleção, sem nenhum custo. Sugerimos que novas análises do método sejam realizadas, tentando contornar a necessidade de limitação na lista de genes submetidos à comprovação, para que possamos observar o real poder da estratégia de seleção, uma vez que apenas parte dos miRNAs selecionados foram submetidos à validação. 61 6. Referências 1. Zammit PS, Beauchamp JR. The skeletal muscle satellite cell: stem cell or son of stem cell? Differentiation; research in biological diversity. 2001 Oct;68(45):193–204. 2. Foschini RMSA, Ramalho FS, Bicas HEA. Células satélites musculares. Arquivos Brasileiros de Oftalmologia. 2004 Aug;67(4):681–867. 3. Morgan JE, Partridge TA. Muscle satellite cells. The international journal of biochemistry & cell biology. 2003 Aug;35(8):1151–6. 4. Silva MDP, Carvalho RF. Mecanismos celulares e moleculares que controlam o desenvolvimento e o crescimento muscular. Revista Brasileira de Zootecnia. 2007 Jul;36:21–31. 5. Mouly V, Aamiri A, Bigot A, Cooper RN, Di Donna S, Furling D, et al. The mitotic clock in skeletal muscle regeneration, disease and cell mediated gene therapy. Acta physiologica Scandinavica. 2005 May;184(1):3–15. 6. Skuk D, Goulet M, Roy B, Tremblay JP. Efficacy of myoblast transplantation in nonhuman primates following simple intramuscular cell injections: toward defining strategies applicable to humans. Experimental neurology. 2002 May;175(1):112–26. 7. Irintchev A, Zeschnigk M, Starzinski-Powitz A, Wernig A. Expression pattern of M-cadherin in normal, denervated, and regenerating mouse muscles. Developmental dynamics : an official publication of the American Association of Anatomists. 1994 Apr;199(4):326–37. 8. Morgan JE, Coulton GR, Partridge TA. Muscle precursor cells invade and repopulate freeze-killed muscles. Journal of muscle research and cell motility. 1987 Oct;8(5):386–96. 9. Williams AE. Functional aspects of animal microRNAs. Cellular and molecular life sciences : CMLS. 2008 Feb;65(4):545–62. 10. Eisenberg I, Alexander MS, Kunkel LM. miRNAS in normal and diseased skeletal muscle. Journal of cellular and molecular medicine. 2009 Jan;13(1):2– 11. 11. Van Rooij E, Liu N, Olson EN. MicroRNAs flex their muscles. Trends in genetics : TIG. 2008 Apr;24(4):159–66. 12. Kim HK, Lee YS, Sivaprasad U, Malhotra A, Dutta A. Muscle-specific microRNA miR-206 promotes muscle differentiation. The Journal of cell biology. 2006 Aug 28;174(5):677–87. 13. Rao PK, Kumar RM, Farkhondeh M, Baskerville S, Lodish HF. Myogenic factors that regulate expression of muscle-specific microRNAs. Proceedings of 62 the National Academy of Sciences of the United States of America. 2006 Jun 6;103(23):8721–6. 14. Liu N, Williams AH, Maxeiner JM, Bezprozvannaya S, Shelton JM, Richardson JA, et al. microRNA-206 promotes skeletal muscle regeneration and delays progression of Duchenne muscular dystrophy in mice. The Journal of clinical investigation. 2012 Jun 1;122(6):2054–65. 15. Naguibneva I, Ameyar-Zazoua M, Polesskaya A, Ait-Si-Ali S, Groisman R, Souidi M, et al. The microRNA miR-181 targets the homeobox protein Hox-A11 during mammalian myoblast differentiation. Nature cell biology. 2006 Mar;8(3):278–84. 16. Crist CG, Montarras D, Pallafacchina G, Rocancourt D, Cumano A, Conway SJ, et al. Muscle stem cell behavior is modified by microRNA-27 regulation of Pax3 expression. Proceedings of the National Academy of Sciences of the United States of America. 2009 Aug 11;106(32):13383–7. 17. Berrier AL, Yamada KM. Cell-matrix adhesion. Journal of cellular physiology. 2007 Dec;213(3):565–73. 18. Cao X, Pfaff SL, Gage FH. A functional study of miR-124 in the developing neural tube. Genes & development. 2007 Mar 1;21(5):531–6. 19. Savino W, Dardenne M. Neuroendocrine control of thymus physiology. Endocrine reviews. 2000 Aug;21(4):412–43. 20. Zúñiga-Pflücker JC, Lenardo MJ. Regulation of thymocyte development from immature progenitors. Current opinion in immunology. 1996 Apr;8(2):215–24. 21. Zúñiga-Pflücker JC. T-cell development made simple. Nature reviews. Immunology. 2004 Jan;4(1):67–72. 22. Anderson G, Moore NC, Owen JJ, Jenkinson EJ. Cellular interactions in thymocyte development. Annual review of immunology. 1996 Jan;14:73–99. 23. Pearse G. Normal structure, function and histology of the thymus. Toxicologic pathology. 2006 Jan;34(5):504–14. 24. Schena M, Shalon D, Heller R, Chai A, Brown PO, Davis RW. Parallel human genome analysis: microarray-based expression monitoring of 1000 genes. Proceedings of the National Academy of Sciences of the United States of America. 1996 Oct 1;93(20):10614–9. 25. Schena M, Shalon D, Davis RW, Brown PO. Quantitative monitoring of gene expression patterns with a complementary DNA microarray. Science (New York, N.Y.). 1995 Oct 20;270(5235):467–70. 26. Malone JH, Oliver B. Microarrays, deep sequencing and the true measure of the transcriptome. BMC biology. 2011 Jan;9:34. 63 27. Willenbrock H, Salomon J, Søkilde R, Barken KB, Hansen TN, Nielsen FC, et al. Quantitative miRNA expression analysis: comparing microarrays with nextgeneration sequencing. RNA (New York, N.Y.). 2009 Nov;15(11):2028–34. 28. Git A, Dvinge H, Salmon-Divon M, Osborne M, Kutter C, Hadfield J, et al. Systematic comparison of microarray profiling, real-time PCR, and nextgeneration sequencing technologies for measuring differential microRNA expression. RNA (New York, N.Y.). 2010 May;16(5):991–1006. 29. Wayland M. A Practical Approach to Microarray Data Analysis. Berrar DP, Dubitzky W, Granzow M, editors. Briefings in Functional Genomics and Proteomics. Boston, MA: Kluwer Academic Publishers; 2003 Jan 1;2(1):82–4. 30. Angulo J, Serra J. Automatic analysis of DNA microarray images using mathematical morphology. Bioinformatics (Oxford, England). 2003 Mar 22;19(5):553–62. 31. Zhou J, Thompson DK. Advances in Agronomy Volume 82. Advances in Agronomy. Elsevier; 2004;82:183–270. 32. He Z, Zhou J. Empirical evaluation of a new method for calculating signal-tonoise ratio for microarray data analysis. Applied and environmental microbiology. 2008 May;74(10):2957–66. 33. Venet D, Detours V, Bersini H. A measure of the signal-to-noise ratio of microarray samples and studies using gene correlations. PloS one. 2012 Jan;7(12):e51013. 34. Dudoit S, Yang YH, Callow MJ, Speed TP. Statistical Methods for Identifying Differentially Expressed Genes in Replicated cDNA Microarray Experiments. Statistica Sinica. 2002;12:111–39. 35. Ewens W, Grant G, Gail M, Krickeberg K, Samet J, Tsiatis A, et al. Statisical Methods in Bioinformatics: An Introduction. New York: Springer; 2005. p. -. 36. Matson R. Microarray Methods and Protocols. Boca Raton: CRC Press; 2009. p. -. 37. Kauffmann A, Huber W. Microarray data quality control improves the detection of differentially expressed genes. Genomics. 2010 Mar 1;95(3):138–42. 38. Quackenbush J. Microarray data normalization and transformation. Nature genetics. 2002 Dec;32 Suppl:496–501. 39. Schmidt MT, Handschuh L, Zyprych J, Szabelska A, Olejnik-Schmidt AK, Siatkowski I, et al. Impact of DNA microarray data transformation on gene expression analysis - comparison of two normalization methods. Acta biochimica Polonica. 2011 Jan;58(4):573–80. 40. Sperandei S, Ribeiro-Alves M, Monteiro AB, Nobre FF. Testes Estatísticos Aplicados a Microarranjos de DNA : Impacto dos Métodos de Transformação. 64 XX Congresso Brasileiro de Engenharia Biomédica. São Pedro, SP; 2006. p. 1–4. 41. Kendziorski CM, Newton MA, Lan H, Gould MN. On parametric empirical Bayes methods for comparing multiple groups using replicated gene expression profiles. Statistics in medicine. 2003 Dec 30;22(24):3899–914. 42. Sperandei S. Testes T de Student e Bayesianos Aplicados a Microarranjos: Impacto dos Métodos de Transformação e do Tamanho Da Amostra. Universidade Federal do Rio de Janeiro; 2007. p. -. 43. Baldi P, Long AD. A Bayesian framework for the analysis of microarray expression data: regularized t -test and statistical inferences of gene changes. Bioinformatics. 2001 Jun 1;17(6):509–19. 44. Efron B, Tibshirani R. Empirical bayes methods and false discovery rates for microarrays. Genetic epidemiology. 2002 Jun;23(1):70–86. 45. Pan W. A comparative review of statistical methods for discovering differentially expressed genes in replicated microarray experiments. Bioinformatics (Oxford, England). 2002 Apr;18(4):546–54. 46. Alexa A, Rahnenführer J, Lengauer T. Improved scoring of functional groups from gene expression data by decorrelating GO graph structure. Bioinformatics (Oxford, England). 2006 Jul 1;22(13):1600–7. 47. Falcon S, Gentleman R. Using GOstats to test gene lists for GO term association. Bioinformatics (Oxford, England). 2007 Jan 15;23(2):257–8. 48. Harris MA, Clark J, Ireland A, Lomax J, Ashburner M, Foulger R, et al. The Gene Ontology (GO) database and informatics resource. Nucleic acids research. 2004 Jan 1;32(Database issue):D258–61. 49. Kanehisa M, Goto S, Kawashima S, Okuno Y, Hattori M. The KEGG resource for deciphering the genome. Nucleic acids research. 2004 Jan 1;32(Database issue):D277–80. 50. Taft RJ, Pang KC, Mercer TR, Dinger M, Mattick JS. Non-coding RNAs: regulators of disease. J Pathol. 2010. p. 126–39. 51. Carthew RW, Sontheimer EJ. Origins and Mechanisms of miRNAs and siRNAs. Cell. 2009 Feb 20;136(4):642–55. 52. Hennessy E, O’Driscoll L. Molecular medicine of microRNAs: structure, function and implications for diabetes. Expert.Rev Mol.Med. 2008. p. e24–. 53. Medina PP, Slack FJ. microRNAs and cancer: an overview. Cell cycle (Georgetown, Tex.). 2008 Aug 15;7(16):2485–92. 65 54. Lagos-Quintana M, Rauhut R, Lendeckel W, Tuschl T. Identification of novel genes coding for small expressed RNAs. Science (New York, N.Y.). 2001 Oct 26;294(5543):853–8. 55. Lau NC, Lim LP, Weinstein EG, Bartel DP. An abundant class of tiny RNAs with probable regulatory roles in Caenorhabditis elegans. Science (New York, N.Y.). 2001 Oct 26;294(5543):858–62. 56. Lee RC, Ambros V. An extensive class of small RNAs in Caenorhabditis elegans. Science (New York, N.Y.). 2001 Oct 26;294(5543):862–4. 57. Filipowicz W, Jaskiewicz L, Kolb FA, Pillai RS. Post-transcriptional gene silencing by siRNAs and miRNAs. Current opinion in structural biology. 2005 Jun;15(3):331–41. 58. Krispies R. Genetics. Small RNAs Reveal an Activating Side. Science (New York, N.Y.). 2006. p. 741–2. 59. Brodersen P, Sakvarelidze-Achard L, Bruun-Rasmussen M, Dunoyer P, Yamamoto YY, Sieburth L, et al. Widespread translational inhibition by plant miRNAs and siRNAs. Science (New York, N.Y.). 2008 May 30;320(5880):1185–90. 60. Huntzinger E, Izaurralde E. Gene silencing by microRNAs: contributions of translational repression and mRNA decay. Nature reviews. Genetics. 2011 Feb;12(2):99–110. 61. Lee YS, Dutta A. MicroRNAs: small but potent oncogenes or tumor suppressors. Current opinion in investigational drugs (London, England : 2000). 2006 Jun;7(6):560–4. 62. Parker JS, Roe SM, Barford D. Molecular mechanism of target RNA transcript recognition by Argonaute-guide complexes. Cold Spring Harbor symposia on quantitative biology. 2006 Jan;71:45–50. 63. Elton TS, Martin MM, Sansom SE, Belevych AE, Györke S, Terentyev D. miRNAs got rhythm. Life sciences. 2011 Mar 28;88(9-10):373–83. 64. Edom F, Mouly V, Barbet JP, Fiszman MY, Butler-Browne GS. Clones of human satellite cells can express in vitro both fast and slow myosin heavy chains. Developmental biology. 1994 Jul;164(1):219–29. 65. Silva-Barbosa SD, Butler-Browne GS, Di Santo JP, Mouly V. Comparative analysis of genetically engineered immunodeficient mouse strains as recipients for human myoblast transplantation. Cell transplantation. 2005 Jan;14(7):457– 67. 66. Silva-Barbosa SD, Butler-Browne GS, De Mello W, Riederer I, Di Santo JP, Savino W, et al. Human myoblast engraftment is improved in laminin-enriched microenvironment. Transplantation. 2008 Feb 27;85(4):566–75. 66 67. Riederer I, Negroni E, Bigot A, Bencze M, Di Santo J, Aamiri A, et al. Heat shock treatment increases engraftment of transplanted human myoblasts into immunodeficient mice. Transplantation proceedings. 2008 Mar;40(2):624–30. 68. Mizuochi T, Kasai M, Kokuho T, Kakiuchi T, Hirokawa K. Medullary but not cortical thymic epithelial cells present soluble antigens to helper T cells. The Journal of experimental medicine. 1992 Jun 1;175(6):1601–5. 69. Werneck CC, Cruz MS, Silva LC, Villa-Verde DM, Savino W, Mourão PA. Is there a glycosaminoglycan-related heterogeneity of the thymic epithelium? Journal of cellular physiology. 2000 Oct;185(1):68–79. 70. Nihei OK, Fonseca PC, Rubim NM, Bonavita AG, Lyra JSPO, Neves-dosSantos S, et al. Modulatory effects of cAMP and PKC activation on gap junctional intercellular communication among thymic epithelial cells. BMC cell biology. 2010 Jan;11:3. 71. Macedo C, Evangelista AF, Magalhães DA, Fornari TA, Linhares LL, Junta CM, et al. Evidence for a network transcriptional control of promiscuous gene expression in medullary thymic epithelial cells. Molecular immunology. 2009 Oct;46(16):3240–4. 72. Kasai M, Mizuochi T. Derivation, culture, and characterization of thymic epithelial cell lines. Methods in molecular biology (Clifton, N.J.). 2007 Jan;380:107–23. 73. Yang YH, Speed T. Design issues for cDNA microarray experiments. Nature reviews. Genetics. 2002 Aug;3(8):579–88. 74. R Core Team. R: A language and environment for statistical computing. Vienna, Austria: R Foundation for Statistical Computing; 2012. 75. Lopez-Romero P, Gonzalez MA, Callejas S, Dopazo A, Irizarry RA, LópezRomero P, et al. Processing of Agilent microRNA array data. BMC research notes. 2010 Jan;3:18. 76. Carlson M. hgug4112a.db: Agilent “Human Genome, Whole” annotation data (chip hgug4112a) [Internet]. 2012 [cited 2013 Mar 21]. Available from: http://www.bioconductor.org/packages/release/data/annotation/manuals/hgug4 112a.db/man/hgug4112a.db.pdf 77. Carlson M. Agilent “Mouse Genome, Whole” annotation data (chip mgug4122a) assembled using data from public repositories [Internet]. 2012 [cited 2013 Mar 22]. Available from: http://www.bioconductor.org/packages/2.12/data/annotation/manuals/mgug412 2a.db/man/mgug4122a.db.pdf 78. Smyth GK. Limma: linear models for microarray data. In: Gentleman, R.; Carey, V.; Huber, W.; Irizarry, R.; Dudoit S, editor. Bioinformatics and Computational Biology Solutions using R and Bioconductor. New York: Springer; 2005. p. 397–420. 67 79. Zahurak M, Parmigiani G, Yu W, Scharpf RB, Berman D, Schaeffer E, et al. Pre-processing Agilent microarray data. BMC bioinformatics. 2007 Jan;8:142. 80. Yang YH, Dudoit S, Luu P, Lin DM, Peng V, Ngai J, et al. Normalization for cDNA microarray data: a robust composite method addressing single and multiple slide systematic variation. Nucleic acids research. 2002 Feb 15;30(4):e15. 81. Yang YH, Thorne NP. Normalization for two-color cDNA microarray data. Goldstein DR, editor. IMS Lecture Notes; 2003;403–18. 82. Loennstedt I, Speed TP. Replicated microarray data. Statistica Sinica. 2002;12:31–46. 83. McCarthy DJ, Smyth GK. Testing significance relative to a fold-change threshold is a TREAT. Bioinformatics (Oxford, England). 2009 Mar 15;25(6):765–71. 84. Smyth GK. Linear models and empirical bayes methods for assessing differential expression in microarray experiments. Statistical applications in genetics and molecular biology. 2004 Jan;3(1):Article3. 85. Benjamini Y, Hochberg Y. Controlling the false discovery rate: a practical and powerful approach to multiple testing. Journal of the Royal Statistical Society Series B Methodological. JSTOR; 1995;57(1):289–300. 86. Smith CA. Annotation tools for Affymetrix biological metadata [Internet]. 2013 [cited 2013 Mar 22]. Available from: http://www.bioconductor.org/packages/2.11/bioc/manuals/annaffy/man/annaffy. pdf 87. Gentleman R, Carey V, Huber W, Hahne F. genefilter: methods for filtering genes from microarray experiments [Internet]. 2013 [cited 2013 Mar 22]. Available from: http://www.bioconductor.org/packages/release/bioc/manuals/genefilter/man/ge nefilter.pdf 88. Gentleman R, Falcon S, Sarkar D. Category Analysis [Internet]. 2013 [cited 2013 Mar 22]. Available from: http://www.bioconductor.org/packages/release/bioc/manuals/Category/man/Cat egory.pdf 89. Enright AJ, John B, Gaul U, Tuschl T, Sander C, Marks DS. MicroRNA targets in Drosophila. Genome Biol. 2003. p. R1–. 90. Wu X, Watson M. CORNA: testing gene lists for regulation by microRNAs. Bioinformatics (Oxford, England). 2009 Mar 15;25(6):832–3. 91. Knudsen S. A biologist’s guide to analysis of DNA microarray data. New York: Wiley-Interscience; 2002. p. -. 68 92. Cleveland WS. Robust Locally Weighted Regression and Smoothing Scatterplots. Journal of the American Statistical Association. 1979 Dec;74(368):829. 93. Bolstad BM, Irizarry RA, Astrand M, Speed TP. A comparison of normalization methods for high density oligonucleotide array data based on variance and bias. Bioinformatics (Oxford, England). 2003 Jan 22;19(2):185–93. 94. Galliano MF, Huet C, Frygelius J, Polgren A, Wewer UM, Engvall E. Binding of ADAM12, a marker of skeletal muscle regeneration, to the muscle-specific actin-binding protein, alpha -actinin-2, is required for myoblast fusion. The Journal of biological chemistry. 2000 May 5;275(18):13933–9. 95. Labeit S, Gautel M, Lakey A, Trinick J. Towards a molecular understanding of titin. The EMBO journal. 1992 May;11(5):1711–6. 96. Sorokin LM, Maley MA, Moch H, Von der Mark H, Von der Mark K, Cadalbert L, et al. Laminin alpha4 and integrin alpha6 are upregulated in regenerating dy/dy skeletal muscle: comparative expression of laminin and integrin isoforms in muscles regenerating after crush injury. Experimental cell research. 2000 May 1;256(2):500–14. 97. Li D, He B, Zhang H, Shan S-F, Liang Q, Yuan W-J, et al. The inhibitory effect of miRNA-1 on ET-1 gene expression. FEBS letters. 2012 Apr 5;586(7):1014– 21. 98. Koning M, Werker PMN, Van der Schaft DWJ, Bank RA, Harmsen MC. MicroRNA-1 and microRNA-206 improve differentiation potential of human satellite cells: a novel approach for tissue engineering of skeletal muscle. Tissue engineering. Part A. 2012 May;18(9-10):889–98. 99. Koutsoulidou A, Mastroyiannopoulos NP, Furling D, Uney JB, Phylactou LA. Expression of miR-1, miR-133a, miR-133b and miR-206 increases during development of human skeletal muscle. BMC developmental biology. 2011 Jan;11:34. 100. Qiu C, Wang J, Cui Q. miR2Gene: pattern discovery of single gene, multiple genes, and pathways by enrichment analysis of their microRNA regulators. BMC systems biology. 2011 Dec 14;5 Suppl 2:S9. 101. Nam S, Kim B, Shin S, Lee S. miRGator: an integrated system for functional annotation of microRNAs. Nucleic acids research. 2008 Jan;36(Database issue):D159–64. 102. Nam S, Li M, Choi K, Balch C, Kim S, Nephew KP. MicroRNA and mRNA integrated analysis (MMIA): a web tool for examining biological functions of microRNA expression. Nucleic acids research. 2009 Jul;37(Web Server issue):W356–62. 69 103. Griffiths-Jones S, Saini HK, Van Dongen S, Enright AJ, Griffiths Jones S, Dongen S, et al. miRBase: tools for microRNA genomics. Nucleic Acids Res. 2008 Jan;36(Database issue):D154–D158. 104. Steinfeld I, Navon R, Ach R, Yakhini Z. miRNA target enrichment analysis reveals directly active miRNAs in health and disease. Nucleic acids research. 2013 Feb 1;41(3):e45. 105. Sah S, McCall MN, Eveleigh D, Wilson M, Irizarry RA. Performance evaluation of commercial miRNA expression array platforms. BMC research notes. 2010. p. 80–. 106. Stempor PA, Cauchi M, Wilson P. MMpred: functional miRNA--mRNA interaction analyses by miRNA expression prediction. BMC genomics. 2012 Jan;13(1):620. 7. Anexo 1 Lista de genes diferencialmente expressos no modelo de mioblastos humanos. 70 Genes Sobrexpressos A2M ABCA1 ABCA3 ABCG1 ABI3BP ABL2 ABLIM3 ABRA ABTB2 ACOT11 ACSL1 ACTA1 ACTC1 ACTN2 ACTN3 ACTRT1 ACVR1 ACVR1C ACYP2 ADAMTS14 ADAMTS9 ADCK3 ADPRM ADRB2 AFAP1L1 AFAP1L2 AGAP1 AGPAT5 AGPAT9 AGPHD1 AGT AHCYL2 AHNAK2 AIF1L AIRE AK1 AKAP1 AKAP13 AKAP6 AKAP9 AKR1C1 AKR1C3 ALDH3A1 ALDH3A2 ALPK3 AMPD1 ANGPTL1 ANK1 ANK2 ANK3 ANKRD10 ANKRD10-IT1 ANKRD2 ANKS1A ANO2 AOC3 APOBEC2 APOC1 APOE APOL3 APOL5 AQP3 AQP5 ARHGAP12 ARHGAP6 ARHGAP9 ARHGEF3 ARHGEF37 ARHGEF6 ARHGEF7 ARMC9 ARMCX1 ARPP21 ASAH1 ASB2 ASB5 ASPRV1 ATF3 ATP1A1 ATP1A2 ATP1A3 ATP1A4 ATP1B3 ATP1B4 ATP2A1 ATP2A2 ATP6V1C1 AXIN2 BAG2 BBC3 BBS9 BCAS1 BCL2L11 BCL6 BEST3 BEX2 BHMT2 BIN1 BMF BRF1 BRMS1L BTG1 BTG2 BVES C10orf118 C12orf42 C19orf47 C1orf105 C1orf167 C1orf88 C2 C20orf166 C20orf166-AS1 C21orf88 C2CD3 C4orf17 C7orf41 CACNA1S CACNA2D1 CACNB1 CACNG1 CACNG6 CALM1 CAND2 CANX CAPN6 CARNS1 CASP3 CASP9 CASQ2 CASS4 CAV3 CBFA2T3 CCDC109B CCDC141 CCDC3 CCDC48 CCDC90B CCNG1 CCNG2 CCNO CCNY CD34 CD36 CD4 CDC37L1 CDC42 CDC42SE1 CDK18 CDKN1A CDKN1C CDKN2B CELSR1 CEP68 CERS6 CH25H CHCHD10 CHD7 CHI3L1 CHIT1 CHPT1 CHRD CHRNA1 CHRNB1 CHRND CHRNG CKB CKM CKMT2 CLCN4 CLCN5 CLCN6 CLDN5 CLEC2B CLSTN2 CMKLR1 CNIH3 COBL COG2 COL14A1 COL16A1 COL19A1 COL20A1 COL21A1 COL3A1 COL5A3 COQ10A CORO6 CORO7 COX6A2 COX7A1 CPEB2 CPEB4 CREBRF CRIP1 CRIP2 CRYAB CRYM CSDA CSRP3 CTDSPL CTNNA1 CTSH CXCL2 CYB5R1 CYBRD1 CYP1B1 CYP2J2 CYYR1 DAG1 DBNDD1 DCAF5 DCAF8 DCP2 DDIT3 DDIT4L DEPTOR DERL3 DESI2 DGKD DIO2 DLG2 DLGAP1 DLL1 DMBT1 DMD DMKN DMPK DNAJA4 DNAJB9 71 DNAJC12 DNAJC3-AS1 DNALI1 DNHD1 DNMT3L DOCK11 DOCK9 DOK3 DTNA DTWD2 DUSP13 DUSP22 DUSP26 DUSP4 DUSP5 DUSP6 DYRK1A DYRK2 EAF2 ECM2 EEF1A2 EFNA1 EGLN3 EGR2 ENO3 ENOX1 ENPP4 EPB41L5 EPDR1 EPT1 ERBB3 ERC2 EXOC6 EXOG F13A1 FABP3 FAM117A FAM134B FAM174B FAM178A FAM189A2 FAM196A FAM20A FAM212B FAM213A FAM214A FAM218A FAM222A FAM49A FAM65B FAM71F1 FAM83H FAM90A1 FBXL22 FBXO16 FBXO2 FBXO30 FBXO32 FBXW10 FBXW7 FDPS FEM1A FGF13 FGF9 FGFBP2 FHIT FHOD3 FILIP1 FITM1 FLCN FLRT2 FLVCR2 FMNL1 FNDC5 FOLR1 FOLR3 FOSB FOXO1 FOXO4 FRAS1 FRMD4B FRMPD1 FRY FXR1 FXYD1 FXYD6 FZD9 GAB2 GABARAPL1 GADD45A GADD45G GALNTL1 GAS5 GATM GDF15 GDPD5 GEM GLRX GMPR GNAZ GNPTAB GPC2 GPD1L GPM6B GPNMB GPR123 GPR56 GPRC5C GRASP GRIP2 GSTM3 GTDC1 GYG2 HEATR8 HENMT1 HERPUD1 HES1 HES2 HEY1 HEYL HFE2 HHAT HINT3 HIP1 HIPK3 HIST2H2BE HMGCS1 HN1 HRASLS2 HRC HRK HSD11B1 HSD17B2 HSD17B7 HSPA5 HSPB2 HSPB3 HSPB8 HSPH1 IDS IFFO1 IFIT2 IGSF22 IL34 INPP4B INPPL1 IQCD ITGA1 ITGA6 ITGA7 ITGB1BP2 ITGB6 ITGB8 ITM2C ITPKB JAG2 JAM2 JAM3 JPH2 JUNB KANK1 KBTBD10 KBTBD5 KCNE1L KCNH2 KCNIP3 KCNJ12 KCNJ2 KCNJ2-AS1 KCTD12 KIAA0284 KIAA0754 KIAA1549 KIF1B KIF26B KIF5B KISS1 KLF15 KLF5 KLF9 KLHDC2 KLHL2 KLHL21 KLHL24 KLHL3 KLRG1 KREMEN1 KRT80 LACC1 LAD1 LAMA2 LAMA4 LAMA5 LAMB3 LBX1 LDB3 LDHD LHFPL2 LIMCH1 LIMS3 LINC00087 LINC00115 LINC00478 LMBRD2 LMO2 LMOD3 LNX1 LOC100128822 LOC100289058 LOC100289230 LOC100422737 LOC100505616 LOC100506388 LOC100506965 LOC100507008 LOC151009 LOC283454 LOC344595 LOC344887 LOC390705 LOC441461 LOC643733 LOH12CR1 LPAR6 LPCAT3 LPHN3 LRFN4 LRP4 LRRC39 LRRC56 72 LRRC8B LRRFIP1 LRRN1 LURAP1L LYNX1 MACF1 MACROD1 MAL MAMDC2 MTTP MUM1L1 MUSK MUSTN1 MXRA5 MYBPC2 MYBPH MYCL1 MYH2 NKAIN1 NKAIN4 NKX3-2 NOTCH3 NOXA1 NPC2 NPNT NPPA NPVF PGA3 PGAM2 PGBD5 PGM5 PGPEP1 PHTF1 PHYH PID1 PIK3C2B MANBA MAP6D1 MAPK10 MAPRE3 MATR3 MAZ MBP MCC MCF2L MCU ME1 MEF2C MEGF10 METTL7A METTL8 MFSD2A MGC21881 MGC23284 MGC39372 MIB1 MIR22HG MLLT3 MMP15 MOB1B MOCS2 MOGAT3 MORC4 MOSPD1 MPI MPP6 MRAS MRPS6 MSI2 MSRA MTERFD3 MTHFR MTSS1L MYH3 MYH6 MYH7 MYH8 MYL1 MYL2 MYL3 MYL4 MYL6B MYLIP MYLPF MYO18A MYO18B MYO5B MYOG MYOM1 MYOM2 MYOM3 MYOZ2 N4BP2L1 N4BP2L2 N4BP3 NANOS1 NAT8L NBEA NCAM1 NCOA1 NCOA7 NDRG2 NEB NECAB3 NEU1 NEURL NEURL2 NEXN NFIB NFKBIB NR3C2 NR4A1 NR4A2 NR4A3 NRAP NTNG2 NUDT14 NUDT9 NUPL1 OBSCN OLFML2A OLFML2B OMA1 ONECUT2 OSBPL6 OSGIN2 OSR2 OSTM1 OTUD1 P2RX6P PACS2 PACSIN1 PALM2 PARM1 PARP9 PBXIP1 PC PCBD1 PCBP1-AS1 PCDH7 PCDHB10 PCSK9 PDE2A PDE4DIP PDLIM3 PDLIM5 PDZRN3 PIK3IP1 PIPOX PIR PKDCC PKHD1 PLA2G16 PLA2G3 PLA2G4C PLCE1 PLEKHA4 PLEKHG5 PLSCR4 PLXDC1 PLXDC2 PLXNA1 PLXNB1 PMP22 PNMA3 PNMAL1 PNMT PNPLA7 PPAP2A PPAPDC3 PPARGC1A PPARGC1B PPM1E PPM1K PPP1R12B PPP1R1A PPP1R3F PPP2R3B PRDX6 PREPL PRKAB2 PRKAG3 PRKAR1A PRKG1 PRKY PROX1 PRR5 PRUNE2 PSAP PSEN2 PTDSS2 PTGDS PTGER2 PTGES3LAARSD1 PTGS1 PTK6 PTPRR PVALB PYGL QKI QPRT RAB15 RAB7L1 RAB9B RAI2 RAPGEF1 RARRES2 RARRES3 RASD1 RASGEF1A RASL10A RASSF2 RASSF3 RASSF4 RBFOX1 RBM18 RBP1 RCBTB2 RCL1 RCSD1 RDH5 REEP1 RELL1 RFTN2 RGS16 RGS2 RIMS3 RIPK4 RMND5A RNF121 73 RNF217 RRAGD RSL1D1 RTN2 RTP1 RYR1 SCAMP2 SCD SCG2 SCN4A SCRIB SCUBE2 SDF2L1 SEMA3E SEMA6A SEMA6B SEMA6C SEPP1 SEPT4 SEPW1 SERPINB9 SERPINF1 SESN1 SETBP1 SETD7 SFRP4 SFTA1P SGCG SGIP1 SH3BGR SHD SHF SHISA2 SHISA4 SHROOM2 SIRT2 SLC12A2 SLC12A7 SLC12A8 SLC13A3 SLC16A2 SLC16A4 SLC17A5 SLC19A2 SLC22A15 SLC24A2 SLC25A23 SLC26A7 SLC29A1 SLC2A11 SLC2A5 SLC30A1 SLC40A1 SLC43A2 SLC44A3 SLC46A3 SLC47A2 SLC4A11 SLC4A2 SLC7A7 SLCO3A1 SLN SMAD3 SMPX SMYD1 SNCA SNED1 SNHG15 SNPH SNRPN SNTB1 SNURF SNX18 SOD3 SOHLH2 SORBS1 SOX8 SPACA3 SPATS2L SPG20 SPIN2B SPTB SPTBN1 SREBF1 SRPK3 SRSF8 SSPN ST6GAL1 ST8SIA5 STAB2 STAC3 STARD13-AS2 STARD4 STMN2 STRADB SULF2 SUMF2 SVIL SYNGR2 SYNPO2 SYNPO2L TACC2 TAL2 TAS1R1 TBC1D8 TBX15 TCAP TCEAL1 TEAD4 TEX2 TFCP2 TFF2 TFF3 TGFB3 TGIF1 THBD THEMIS2 THSD1 TLCD1 TM7SF2 TMCC2 TMCC3 TMEM132A TMEM135 TMEM158 TMEM169 TMEM182 TMEM192 TMEM205 TMEM25 TMEM38A TMEM38B TMEM51 TMEM64 TMEM86A TMOD1 TMTC1 TNIK TNNC1 TNNC2 TNNI1 TNNI2 TNNT1 TNNT2 TNNT3 TOB1-AS1 TOM1L1 TP53INP1 TP53INP2 TP63 TPCN1 TPD52L1 TPM1 TPM3 TPPP3 TRAF4 TRIB1 TRIM36 TRIM54 TRIM63 TSACC TSPAN33 TSPAN7 TSPAN9 TTLL7 TTN TUBA8 TUBB2B TXLNB TXNDC16 UBE2W UBE3D UCP2 ULK3 UNC45B USP18 USP53 USP54 VASH2 VDR VGLL2 VMA21 VSTM4 VWA5A WNT10A WWTR1 XG XIRP1 XIRP2 YIPF7 YPEL2 ZBTB20 ZBTB47 ZDHHC11 ZDHHC21 ZDHHC8 ZEB2 ZFAND6 ZFP106 ZHX2 ZNF138 ZNF238 ZNF286A ZNF302 ZNF331 ZNF423 ZNF462 ZNF480 ZNF555 ZNF556 ZNF561 ZNF57 ZNF589 ZNF608 ZNF614 ZNF622 ZNRF1 ZZEF1 74 Genes Subexpressos ABRACL ACAN ACTB ACTG1 ACTG1P4 ACTG2 ACTR2 ADAM9 ADAMTS1 ADAMTS6 ADAMTSL3 ADRA2C AFAP1 AHNAK AK4 ALCAM ALOX5AP ALPL ANKFY1 ANKRD13A ANLN ANO4 ANP32A ANP32E ANPEP ANXA1 ANXA11 ANXA2 ANXA2P1 ANXA2P3 ANXA8L2 AP2M1 APCDD1 APLN APOBEC3B APOBEC3D APOLD1 APPL2 ARHGAP11A ARHGDIA ARHGDIB ARID3A ARID5B ARL6IP1 ARNTL2 ARPC5 ARSI ARSJ ASF1B ASPH ASPM ASTN2 ATAD2 ATAD5 ATL3 ATOH8 ATP10A ATP2B4 ATP8B1 ATP8B3 AURKA AURKB AXL BCL7C BDKRB1 BEND5 BIRC2 BIRC5 BLID BLM BNIP3 BNIP3L BORA BRCA1 BRCA2 BRIP1 BTBD11 BUB1 BUB1B C10orf116 C11orf82 C11orf87 C12orf75 C18orf54 C19orf33 C1orf112 C21orf58 C2orf88 C4orf21 C4orf22 C5orf30 C5orf46 CA12 CALM2 CAP1 CAPN2 CAPSL CARHSP1 CASC5 CASP2 CAV1 CAV2 CBR3 CCBE1 CCDC150 CCDC34 CCDC85B CCDC85C CCDC99 CCIN CCNA2 CCNB1 CCNB2 CCND1 CCNF CCNJL CD248 CD274 CD44 CDC20 CDC25A CDC25C CDC42EP3 CDC45 CDC6 CDCA2 CDCA3 CDCA5 CDCA7 CDCA8 CDH11 CDH2 CDH4 CDH6 CDK1 CDK2 CDK6 CDKN3 CDT1 CENPA CENPE CENPF CENPH CENPI CENPK CENPM CENPN CENPO CENPW CEP128 CEP135 CEP152 CEP41 CEP55 CGB CHAF1A CHAF1B CHEK1 CHN1 CHSY3 CHTF18 CIT CITED2 CKAP2L CKAP4 CKS1B CKS2 CLCF1 CLIC1 CLIC3 CLSPN CNN2 CNRIP1 CNTN1 COL12A1 COL13A1 COL27A1 COL6A2 COL8A1 CORO1C COTL1 CPA4 CPT1A CREB5 CRIM1 CRLF1 CSPG4 CSRP1 CTDSP1 CTGF CTNNAL1 CTPS1 CTSC CXCL12 CYB5R2 CYBA DBF4B DCBLD2 DDAH1 DDX60L DEPDC1 DEPDC1B DHFR DHRS2 DIAPH3 DKK1 DLC1 DLGAP5 DRAP1 DTL DTYMK DUSP2 E2F1 E2F2 EBF3 ECSCR ECT2 EDARADD EDN1 EHD4 ELL2 ELN ELTD1 EME1 EMP1 ENAH ENC1 ENG ENO1 ENO2 75 ENPP1 EPB41L4B EPHA2 ERCC2 ERCC6L ERLIN1 ERRFI1 ESCO2 ESPL1 ETS1 EXO1 EXOSC9 EXTL1 EYA2 EZH2 EZR FAM101B FAM110A FAM111A FAM111B FAM176A FAM176C FAM19A5 FAM26F FAM54A FAM57A FAM64A FAM83D FANCA FANCD2 FANCG FANCI FANCM FBN1 FBN2 FBXO5 FER1L4 FERMT1 FGF1 FGF5 FGFR3 FHL2 FKBP11 FLNA FLNB FMN2 FN1 FOXD1 FOXM1 FOXP1 FPR1 FRMD4A FRMD6 FSCN1 FSTL1 FXYD5 FZD1 GAL GALNT6 GALNTL2 GAPDH GAPDHP62 GAS2L3 GBP1 GBP3 GCNT1 GINS1 GINS2 GINS4 GJA1 GJC1 GLIPR1 GLT25D2 GLTP GMNN GNAI2 GNPNAT1 GPD2 GPER GPR1 GREM1 GREM2 GSG2 GTSE1 H2AFX H2AFZ HAPLN1 HAS1 HAS2 HAUS8 HELLS HHIP HHIPL2 HIC1 HILPDA HIST1H1A HIST1H1B HIST1H2AB HIST1H2AG HIST1H2AJ HIST1H2AL HIST1H2AM HIST1H2BD HIST1H3B HIST1H3D HIST1H3F HIST1H3G HIST1H3H HIST1H4B HIST1H4C HIST1H4D HIST1H4E HIST1H4L HIST2H2AB HIST2H2AC HIST3H2BB HJURP HK2 HMGA2 HMGB1 HMGN2 HMGN2P46 HMMR HN1L HNRNPA3 HNRNPD HNRNPU HOXA9 HOXB3 HOXB5 HPRT1 HRCT1 HSPA2 HSPB7 HYI HYLS1 ICK ID1 ID2 IGFBP3 IKBIP IL11 IL4R IL7R INCENP INHBA INHBB ITGAV ITGB1 KATNAL1 KCNN4 KIAA0101 KIAA1524 KIAA1549L KIAA1609 KIF11 KIF14 KIF15 KIF18A KIF20A KIF20B KIF22 KIF23 KIF2C KIF4A KIFC1 KNTC1 KPNA2 KRAS KRT18 KRT18P55 KRT19 KRT33A KRT34 KRT7 KRT83 KRT86 KRTAP1-1 KRTAP1-5 KRTAP2-3 LAG3 LASP1 LBR LCE1A LCE1C LDHA LEPREL1 LGALS1 LHB LINC00260 LINC00619 LINC00672 LMNB1 LMNB2 LOC100130417 LOC100505633 LOC148709 LOC202025 LOC254057 LOC284441 LOC338620 LOC388242 LOC440288 LOC644936 LOC729420 LOC730101 LOX LOXL1 LOXL2 LOXL3 LRR1 LRRC59 LRRC8C LUZP2 LY6K MAD2L1 MARCH4 MARCKS MB21D1 MBNL1 MCM10 MCM3 MCM4 MCM5 MEGF6 MEI1 MELK MET METRNL MEX3A 76 MGAT5B MICAL2 MICALCL MIR137HG MIR155HG MIR210HG MIS18BP1 MKI67 MMS22L MND1 MPP3 MPP4 MRC2 MSI1 MSN MTMR11 MUC5AC MXRA8 MYB MYBL1 MYBL2 MYF5 MYL6 MYLK MYOCD MZT2B NCAPD2 NCAPG NCAPG2 NCAPH NCEH1 NDC80 NDE1 NECAP2 NEDD9 NEIL3 NEK2 NEK7 NET1 NETO2 NEURL1B NFE2L3 NLGN1 NME4 NMU NPFF NPR3 NPTX1 NR2F2-AS1 NREP NRG1 NRGN NRIP3 NRM NRP2 NT5E NUDT1 NUF2 NUP205 NUP50 NUSAP1 ODF2 OIP5 OPCML ORC6 OVOS2 OXTR P4HA1 PAPD7 PAPSS2 PARPBP PAWR PBK PCDH9 PCNA PDE1C PDGFC PDK1 PFKFB4 PFKP PGAM1 PGAM1P5 PGF PGK1 PGM2 PHF19 PKMYT1 PKP3 PLAUR PLD5 PLEK2 PLIN2 PLK1 PLK4 PLOD1 PLOD2 PLOD3 PLXND1 PNP POC1A PODXL POLD1 POLD3 POLQ POTEKP PPAP2B PPAPDC1A PPP1R13L PRC1 PRELID2 PRIM1 PRKCA PRPS2 PRR11 PRR16 PRRX2 PSG3 PSG4 PSIP1 PSMC3IP PSRC1 PTBP1 PTMA PTN PTPRJ PTRF PTTG1 PTTG2 PTTG3P PTX3 PUS7 PXDN PXMP2 QSOX1 RAB11FIP4 RAB3A RAB3B RAC2 RACGAP1 RACGAP1P RAD18 RAD51 RAD51AP1 RAD54B RAD54L RAI14 RANBP1 RANGAP1 RBL1 RCAN3 RCN3 RECK RECQL4 REEP4 RFC5 RFWD3 RGS7 RHBDL2 RHOC RMI1 RMI2 RNASEH2A RNF125 ROBO4 RPL13P5 RPL39L RPS6KA4 RRM1 RRM2 S100A10 SAMD1 SAMD11 SAPCD2 SCARA3 SCUBE3 SDR42E1 SEMA7A SERPINB7 SERPINE1 SERTAD4 SGOL1 SGOL2 SH3BGRL3 SH3BP4 SH3D21 SH3RF1 SHCBP1 SIGLEC15 SIPA1L1 SIRPA SKA1 SKA2 SKA3 SLC16A3 SLC19A1 SLC1A1 SLC2A4RG SLC35F2 SLC38A4 SLC8A1 SMAD9 SMAGP SMARCD1 SMC2 SMC4 SMS SMURF2 SOCS2 SP100 SPA17 SPAG4 SPAG5 SPATA4 SPC24 SPC25 SPINK1 SPOCD1 SRGN SRSF9 SSTR1 STAMBPL1 STIL STMN1 STPG1 SUSD3 SYT15 TACC3 TAF9B TAGLN TAGLN2 77 TAX1BP3 TBXA2R TCF19 TCF7 TFPI2 TGFBI TGM2 THBS2 THSD4 TICRR TIMELESS TK1 TLN1 TMOD3 TMSB10 TMSB15A TMSB15B TMSB4XP8 TNC TNFRSF10D TOP2A TOR4A TPGS2 TPI1 TPI1P2 TPM1 TPM3 TPM4 TPX2 TRAIP TRIM59 TRIM6 TRIOBP TRIP13 TRMT5 TROAP TSPAN4 TTK TUBA1B TUBB TUBB3 TWF1 TWIST1 TYMS UAP1 UBE2C UBE2S UGDH VANGL1 VASN VASP VCAN VEGFA VEGFC VEPH1 VIM WDHD1 WDR1 WDR54 WDR76 WHSC1 WNT5A WNT7B WWC1 XRCC2 YWHAH YWHAQ ZAK ZNF185 ZNF395 ZNF536 ZWINT 78 8. Anexo 2 Lista completa de processos biológicos e vias de regulação gênica diferencialmente expressas no modelo de mioblastos humanos Legendas: GOBPID: número de identificação do processo biológico no banco de ontology genética (gene ontology). P: p-valor obtido no teste hipergeométrico utilizado para análise de enriquecimento. EC: número de genes esperado ao acaso na lista de genes DE que estivessem associados ao processo biológico analisado. OC: número de genes de fato observados na lista de genes DE que estavam associados ao processo biológico analisado. Termo: nome do processo biológico (em inglês). 79 GOBPID 0000279 0048285 0051301 0007275 0022402 0007010 0007067 0007059 0060537 0010927 0006936 0045214 0000278 0016043 0003015 0055002 0048513 0030154 0042692 0007017 0007517 0007126 0030049 0070252 0051321 0007519 0007155 0008015 0033043 0007076 0007160 0003008 0006323 0006941 0000075 0030029 0002026 0003009 0051325 0003007 0006937 0051303 0048646 0051239 0048514 P 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 EC 34 31 37 252 61 45 20 9 15 4 10 2 34 253 8 2 128 133 14 23 9 9 1 1 9 8 53 19 21 1 11 97 11 1 10 27 2 2 13 7 4 2 36 80 25 OC 95 87 97 369 126 100 59 34 45 20 34 12 70 335 28 12 188 193 36 49 26 26 9 9 26 25 89 43 45 9 28 142 29 8 26 51 9 9 30 20 15 9 61 116 47 Termo M phase organelle fission cell division multicellular organismal development cell cycle process cytoskeleton organization mitosis chromosome segregation muscle tissue development cellular component assembly involved in morphogenesis muscle contraction sarcomere organization mitotic cell cycle cellular component organization heart process striated muscle cell development organ development cell differentiation muscle cell differentiation microtubule-based process muscle organ development meiosis muscle filament sliding actin-mediated cell contraction meiotic cell cycle skeletal muscle tissue development cell adhesion blood circulation regulation of organelle organization mitotic chromosome condensation cell-matrix adhesion system process DNA packaging striated muscle contraction cell cycle checkpoint actin filament-based process regulation of the force of heart contraction skeletal muscle contraction interphase heart morphogenesis regulation of muscle contraction establishment of chromosome localization anatomical structure formation involved in morphogenesis regulation of multicellular organismal process blood vessel morphogenesis 80 0060429 0050879 0060415 0030240 0006260 0051653 0006928 0030048 0001568 0006942 0040001 0032886 0008283 0048738 0000079 0032879 0050793 0031109 0000070 0000724 0048856 0007051 0006950 0023052 0031032 0043462 0007088 0000080 0007052 0048015 0034508 0051983 0031110 0030155 0051674 0001501 0042221 0045446 0055010 0007399 0016477 0051494 0032507 0048747 0048523 0035239 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 21 2 3 1 26 1 54 3 3 3 1 5 101 6 6 55 60 1 3 2 67 3 156 325 2 2 6 2 2 6 1 1 3 12 39 33 118 2 2 91 36 6 5 5 160 12 41 10 11 5 47 7 83 11 12 10 6 14 137 16 17 82 88 5 10 9 95 11 196 377 7 7 15 8 8 16 5 5 9 24 59 52 151 8 8 120 56 14 13 13 196 24 epithelium development multicellular organismal movement muscle tissue morphogenesis skeletal muscle thin filament assembly DNA replication spindle localization cellular component movement actin filament-based movement blood vessel development regulation of striated muscle contraction establishment of mitotic spindle localization regulation of microtubule-based process cell proliferation cardiac muscle tissue development regulation of cyclin-dependent protein kinase activity regulation of localization regulation of developmental process microtubule polymerization or depolymerization mitotic sister chromatid segregation double-strand break repair via homologous recombination anatomical structure development spindle organization response to stress signaling actomyosin structure organization regulation of ATPase activity regulation of mitosis G1 phase of mitotic cell cycle mitotic spindle organization phosphoinositide-mediated signaling centromere complex assembly regulation of chromosome segregation regulation of microtubule polymerization or depolymerization regulation of cell adhesion localization of cell skeletal system development response to chemical stimulus endothelial cell differentiation ventricular cardiac muscle tissue morphogenesis nervous system development cell migration negative regulation of cytoskeleton organization maintenance of protein location in cell muscle fiber development negative regulation of cellular process tube morphogenesis 81 0007263 0071174 0008016 0060048 0007229 0042325 0045185 0051383 0055003 0050873 0051174 0007165 0008608 0055006 0007346 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 1 1 5 3 6 44 1 1 1 2 46 242 1 1 10 6 6 13 9 14 65 4 4 4 7 67 284 5 5 20 nitric oxide mediated signal transduction mitotic cell cycle spindle checkpoint regulation of heart contraction cardiac muscle contraction integrin-mediated signaling pathway regulation of phosphorylation maintenance of protein location kinetochore organization cardiac myofibril assembly brown fat cell differentiation regulation of phosphorus metabolic process signal transduction attachment of spindle microtubules to kinetochore cardiac cell development regulation of mitotic cell cycle 82 9. Anexo 3 Lista de genes diferencialmente expressos no modelo de células epiteliais tímicas associados ao efeito da linhagem 83 Genes Sobrexpressos 0610007L01Rik 0610009B22Rik 0610010K14Rik 0610011F06Rik 0610030E20Rik 1110002N22Rik 1110021J02Rik 1110021L09Rik 1110031I02Rik 1200011I18Rik 1200014J11Rik 1300001I01Rik 1300010F03Rik 1500001M20Rik 1500011H22Rik 1600014C23Rik 1700001F09Rik 1700007K13Rik 1700016M24Rik 1700040I03Rik 1700049E17Rik1 1700125H20Rik 1810008I18Rik 1810012P15Rik 1810043G02Rik 1810049H13Rik 2010012O05Rik 2200002D01Rik 2210010C17Rik 2210021J22Rik 2210416O15Rik 2310002J15Rik 2310003H01Rik 2310007B03Rik 2310008H09Rik 2310033P09Rik 2310035K24Rik 2310035P21Rik 2310039H08Rik 2310068C19Rik 2310079F23Rik 2410003K15Rik 2410015M20Rik 2410018M08Rik 2610001J05Rik 2610002J23Rik 2610020H08Rik 2610034B18Rik 2610036A22Rik 2610044O15Rik 2610203C20Rik 2610305D13Rik 2610306M01Rik 2610507B11Rik 2610528J11Rik 2810002N01Rik 2810047C21Rik1 2810403D21Rik 2810422O20Rik 2810429I04Rik 2810453I06Rik 2900005J15Rik 2900064F13Rik 2900092E17Rik 3010026O09Rik 3100003M19Rik 3110035C09Rik 3110056O03Rik 3110062M04Rik 3110073H01Rik 3830403N18Rik 3830417A13Rik 4632415L05Rik 4833408A19Rik 4833442J19Rik 4930414L22Rik 4930420K17Rik 4930437M23Rik 4930452B06Rik 4930477O03Rik 4930503L19Rik 4930547N16Rik 4930556M19Rik 4932438A13Rik 4932439E07Rik 4933402N22Rik 4933403F05Rik 4933424B01Rik 4933427D14Rik 4933439C10Rik 4933439F18Rik 5031425E22Rik 5330421C15Rik 5730409L17Rik 5730419I09Rik 5730455P16Rik 5730494M16Rik 5730521K06Rik 5930416I19Rik 6030419C18Rik 6330409N04Rik 6330416G13Rik 8430410A17Rik 8430419L09Rik 8430427H17Rik 9230112J17Rik 9330182L06Rik 9530029O12Rik 9630023C09Rik 9930012K11Rik 9930023K05Rik 9930111J21Rik2 A030009H04Rik A230051G13Rik A330040F15Rik A330076H08Rik A430057L12Rik A430093F15Rik A430108G06Rik A530040E14Rik A630031M23Rik A730011L01Rik Aars2 Aarsd1 Abcb1b Abcb4 Abcb6 Abcg2 Abhd11 Abhd14b Abhd2 Abhd6 Abi3 Abr Acaa1a Acaa1b Acad9 Acadvl Acbd4 Accs Acer3 Acn9 Aco2 Acox2 Acox3 Actr6 Acvr1b Acy3 Adat2 Adck2 Adck4 Ado AF067063 Aff4 Afp Aftph Agbl3 Agtrap Agxt2l2 Ahcyl2 Ahi1 AI428936 AI462493 AI467606 AI597468 Aire Ak1 Akap6 Akap7 Akap9 Akr1b10 Akr1b3 Akr1c12 Aldh3a2 Aldh3b1 Aldh5a1 Aldoa Aldoart2 Aldoc Alg12 Alg13 Alg5 Alg8 Alkbh2 Alkbh3 Alkbh5 Alkbh6 Alkbh7 Als2cl Amacr Amigo1 Ang4 Angptl2 Ankib1 Ankrd37 Ano9 Anxa2 Ap2a2 Ap2b1 Apbb3 Apc Apcdd1 Apeh Aplf Apln Apobec1 Apool Appl1 Aqp1 Aqp11 Aqp5 Arf3 Arhgap12 Arhgap18 Arhgap24 Arhgap27 Arhgap8 Arhgef19 Arhgef4 Arid2 Arl6ip4 Armcx5 Arrdc4 Artn Arxes2 Asb8 Ascc2 Asph Atad5 Atg16l2 84 Athl1 Atox1 Atp10a Atp11b Atp13a2 Atp5g1 Atp5h Atp6v0a1 Atp6v0e2 Atp6v1f Atp6v1g1 Atpaf2 Atpbd4 Atrip AU020206 Auh Aurkb Avl9 Avpi1 AW146020 Azi1 B130006D01Rik B130024G19Rik B130040O20Rik B230118H07Rik B230208H11Rik B3galt1 B3gat3 B3gnt1 B3gntl1 B630005N14Rik B9d1 B9d2 Baiap2 Bbs7 BC017158 BC017643 BC030336 BC030867 BC031353 BC046331 BC048355 BC061212 BC061237 Bcam Bcap31 Dcaf11 Bckdha Bcl2l11 Bcl2l2 Bcl3 Bcl6 Bcl7c Bcorl1 Bend4 Bet1 Bet1l Bfsp2 Bhlhb9 Bicd1 Bid Bin1 Bin3 Birc5 Blvrb Bmp7 Bmyc Bnip3 Bod1 Bola3 Bpgm Braf Brcc3 Bre Brpf1 Btbd19 Btc Btd C030006K11Rik C030048B08Rik C130022K22Rik C1d C1galt1 C230052I12Rik C230094B09Rik C3 C530014P21Rik C920008N22Rik Cables2 Cadm1 Cadm4 Cald1 Calr4 Dtd1 Canx Capn5 Capn7 Capsl Caskin2 Casp4 Cbr2 Cbx4 Cbx5 Cbx7 Cby1 Ccdc104 Ccdc107 Ccdc123 Ccdc126 Ccdc138 Ccdc17 Ccdc32 Ccdc34 Ccdc47 Ccdc55 Ccdc56 Ccdc77 Ccdc90b Ccdc91 Ccdc93 Ccdc96 Ccna2 Ccne1 Ccng1 Ccz1 Cd109 Cd274 Cd320 Cd9 Cd99l2 Cdc14a Cdca3 Cdh13 Cdh2 Cdh20 Cdk14 Cdk2ap2 Cdk5rap3 Cdkn1b Cdkn3 Epdr1 Cebpb Cecr5 Celf5 Cep290 Ces1g Cftr Cga Cgrrf1 Chchd10 Chchd3 Chchd4 Chchd6 Chd1l Chmp2a Chpt1 Chrac1 Chtf18 Cib1 Cic Cirbp Cisd1 Ckap4 Ckmt1 Cldn6 Cldn7 Cldn9 Clint1 Clpb Cltc Cmc1 Cnbp Cnksr3 Cnot10 Cnot4 Cnot8 Cnp Cntfr Cntrob Cog1 Cog6 Col12a1 Col18a1 Col1a2 Col2a1 Col8a1 Commd1 Fbxo42 Copg Copg2 Cops2 Cops6 Coq4 Coq7 Cox7a1 Cp Cpeb3 Cpeb4 Cpt2 Creg1 Crem Crot Cryl1 Csad Csf1r Cst3 Cstf3 Cuta Cutc Cx3cl1 Cyb561 Cyb561d2 Cyb5rl Cyc1 Cyhr1 Cyth1 D10Jhu81e D11Wsu99e D130076A03Rik D2Wsu81e D3Bwg0562e D3Ertd751e D5Ertd579e D630032N06Rik D730039F16Rik D7Ertd715e D930048N14Rik Dab2 Dact2 Dagla Daglb Dak Dalrd3 Dbf4 Gla 85 Dcaf7 Dclk1 Dcp1b Dcp2 Dctpp1 Dcxr Ddrgk1 Ddt Ddx26b Ddx47 Ddx50 Ddx56 Deb1 Dedd2 Defb41 Dennd2d Dera Derl1 Dfna5 Dgat2 Dhrs11 Dhrs13 Dhrs7b Dhx33 Dhx34 Dhx40 Dhx57 Dlg3 Dmd Dmpk Dnajc15 Dnajc18 Dnajc3 Dnm1 Dnmbp Dock8 Dok1 Dok7 Dpm1 Dppa5a Dpy19l3 Dpy30 Dr1 Drg1 Dsn1 Gstm2 Gstm3 Dtwd1 Dtx2 Dtx4 Dusp11 Dusp2 Dut Dync2li1 Dynll2 E130308A19Rik E130314M14Rik E2f2 E2f5 E2f8 E330009J07Rik Ebag9 Ebf1 Echdc3 Eci1 Ect2 Edem1 Eefsec Efna3 Efr3a Egfl7 Ehbp1 Eid1 Eif1 Eif2ak2 Elac1 Elac2 Elavl4 Ell3 Elmo3 Elmod3 Emc10 Emc2 Emc3 Eme1 Emg1 Eml1 Emp1 Endog Enho Entpd6 Eogt Htra2 Iars2 Ephb4 Ephx1 Eps8 Erbb2 Ergic2 Erlec1 Ero1l Espn Etohi1 Evi2a Evi5l Evpl Ewsr1 Exoc7 Exosc4 Exosc5 Exosc8 Exosc9 Ext2 F2r Fahd2a Fam115a Fam136a Fam164c Fam165b Fam173b Fam175a Fam195a Fam195b Fam203a Fam3a Fam54a Fam59a Fam65c Fam69b Fam82b Fam86 Fancb Fancd2 Fanci Fancl Fas Fbln2 Fbxl14 Fbxo17 Izumo4 Jagn1 Fbxw11 Fdxr Fgf1 Fgf7 Fgfbp3 Fgfr1op2 Fh1 Figf Fkbp11 Fkbp1b Fkbp9 Flrt3 Fndc4 Foxa2 Foxf1 Foxk1 Foxm1 Foxred2 Frat1 Frk Fst Fut11 Fxc1 Fxn G6pc3 Gabarapl1 Gale Galk2 Galnt12 Galt Gatad1 Gatc Gcat Gcc2 Gclc Gcnt3 Gde1 Gdf15 Gdnf Gdpd1 Gdpd5 Gemin8 Gfer Ggct Ggh Lgals12 Lgals3bp Glcci1 Glo1 Glod4 Glt28d2 Gm10021 Gm10941 Gm13152 Gm13212 Gm14325 Gm2788 Gm3002 Gm428 Gm5168 Gm5458 Gm5480 Gm5622 Gm5662 Gm5800 Gm6460 Gm6710 Gm8090 Gm88 Gmcl1 Gnal Gnptab Golph3 Gorab Gosr2 Gpatch8 Gpc3 Gpc4 Gpd1l Gpi1 Gpr108 Gpr180 Gpr85 Gprc5a Gramd4 Grasp Grhpr Gsg2 Gsta1 Gsta2 Gsta4 Gstm1 Maf1 Mafb 86 Gsto2 Gtf3c6 Gtpbp10 Gucy1b2 Gusb Gyg H2-DMb1 H2-M3 H2afv H3f3b H47 Haghl Haus1 Hdac10 Hdac11 Hdac5 Hdgfrp2 Hdhd3 Heg1 Helz Herc3 Herc6 Hexim2 Hfe Hibadh Hilpda Hip1 Hipk2 Hist1h3d Hist2h3c1 Hivep2 Hk2 Hltf Hnrnpf Hoxa4 Hoxa9 Hoxb3 Hoxc9 Hps3 Hs6st2 Hsd3b7 Hsp90b1 Hspb8 Htra1 Mgat5 Mgst1 Mia3 Ica1 Ict1 Id2 Id4 Ifi204 Ifi205 Ifitm2 Ifitm3 Ifitm7 Ifrd2 Ift122 Ift20 Ift57 Ift74 Igbp1 Igf1 Igf2r Igfbp3 Igh-VJ558 Il11ra1 Ildr1 Immp1l Impa1 Impa2 Impad1 Impdh1 Ing4 Ino80b Ino80c Inpp5k Ipo8 Ipp Iqce Iqcg Irf3 Iscu Isoc1 Isy1 Isyna1 Itfg2 Itk Itpkc Itpr1 Ivd Mrps17 Mrps24 Mrps26 Jmjd6 Jmjd7 Jmjd8 Josd2 Kbtbd2 Kcna4 Kcnk5 Kctd2 Kdelr2 Kdm3a Khk Khnyn Kif3a Kifap3 Kifc3 Klf4 Klhdc10 Klhdc5 Klhl22 Klhl25 Klk10 Klk6 Klk8 Klra10 Klra21 Klra6 Klra8 Klra9 Klrc2 Klrc3 Kptn Krba1 Kremen1 Krit1 Krt16 Krtcap3 L3mbtl3 l7Rn6 Lancl2 Laptm4b Larp1b Lat2 Ldha Leng9 Ndufab1 Ndufaf3 Ndufaf4 Lgr4 Lhpp Lig3 Lima1 Lin28b Lipa Lipt2 Llgl2 Lman1l Lmbrd2 Lmnb2 Lmo1 Lnx1 LOC625240 Loh12cr1 Lphn3 Lpin2 Lrdd Lrpap1 Lrrc26 Lrrc45 Lrrc56 Lrrcc1 Lsm10 Lsm11 Lsm3 Lsmd1 Ltbp2 Ltbp3 Ltbr Ltc4s Luc7l2 Ly6c1 Ly6g6d Lypd3 Lyrm5 Lysmd2 Lysmd4 Lztfl1 M6pr Macrod1 Macrod2 Mad2l1 Mad2l2 Nt5c Nt5c3 Nt5m Maged1 Magohb Magt1 Mal Mal2 Mall Man1a Man2a2 Man2b2 Manea Mansc1 Map2k4 Map3k14 Map3k4 Map3k5 Map3k8 Mapk1ip1 Mapk7 March8 Mat2b Mavs Mb21d2 Mbd2 Mblac1 Mbnl1 Mcm9 Mdh1 Mdh2 Mdp1 Mea1 Mecom Med11 Med16 Med21 Med24 Med7 Med9 Meis2 Metrn Mettl15 Mettl16 Mettl2 Mfn1 Mfsd3 Parp16 Parva Pax1 87 Micall2 Miip Mios Mipep Mitf Mkks Mkln1 Mkrn2 Mlec Mlh3 Mlx Mns1 Mogs Mon1a Mosc2 Mpg Mphosph10 Mppe1 Mpped2 Mr1 Mri1 Mrm1 Mrpl10 Mrpl12 Mrpl16 Mrpl17 Mrpl18 Mrpl19 Mrpl2 Mrpl22 Mrpl23 Mrpl27 Mrpl33 Mrpl35 Mrpl38 Mrpl42 Mrpl43 Mrpl50 Mrpl51 Mrpl52 Mrpl53 Mrpl54 Mrps12 Mrps28 Mrps35 Msh2 Msh5 Msi2 Msl1 Msl3 Mst1 Mtap Mtap6 Mtap7 Mtfr1 Mtif2 Mtmr1 Mtmr3 Mtrf1 Mut Mycbp Myd88 Myh14 Mylpf Mzf1 N4bp3 N6amt2 Naa10 Naa38 Naaa Nadkd1 Nadsyn1 Naglu Nap1l3 Nap1l4 Narf Nat9 Nbr1 Ncapd2 Ncor1 Ncrna00086 Ndrg3 Ndufa4 Ndufa5 Ndufa6 Ndufa9 Ndufb10 Ndufb2 Ndufb5 Ndufc1 Ndufc2 Ndufv2 Ndufv3 Necap1 Nedd9 Nefh Nek4 Nfatc1 Nfatc2ip Nfatc4 Nfic Nfkbie Nfs1 Nfu1 Nfyb Nhlrc3 Nhp2 Nipal2 Nipal3 Nipal4 Nipsnap1 Nme3 Nme4 Nomo1 Notch3 Noxo1 Npc1 Nphp1 Nphp3 Npn2 Nprl3 Nr2c1 Nr2f2 Nrbf2 Nrcam Nrf1 Nrm Nrp1 Nsf Ntf5 Nudcd3 Nudt13 Nudt14 Nudt16l1 Nudt19 Nudt7 Nudt8 Nudt9 Nup205 Nup210 Nup50 Nus1 Nxf3 Nxpe4 Nxt1 Oaf Oas1a Oasl1 Oaz1 Ocel1 Ocrl Odf2 Ogg1 Oip5 Olfr1065 Oraov1 Orc3 Oscp1 Osmr Ost4 Ott Oxa1l Oxsm P2ry2 P4ha1 Padi1 Padi4 Paf1 Palmd Pank2 Pappa Paqr7 Pbk Pccb Pcdh18 Pced1a Pcgf1 Pck2 Pctp Pcyox1 Pcyt1b Pde2a Pde4b Pdgfb Pdhb Pdk1 Pdk3 Pdlim2 Pds5b Pdxk Pdzd11 Pdzrn3 Peg12 Pelp1 Pex10 Pex13 Pex2 Pex3 Pex7 Pfdn5 Pfkfb4 Pfkl Pfkm Pgap2 Pgk1 Pgm2 Pgm2l1 Pgpep1 Phb Phb2 Phc1 Phf11 Phlda2 Pick1 Pigf 88 Pigg Pigs Pigw Pih1d2 Pik3r1 Pir Plau Plb1 Plbd2 Plcd1 Plcd3 Plekha8 Plekhg6 Plekhm1 Plk1s1 Pls1 Plxna2 Plxna3 Pmpcb Pms2 Pnkp Pnpo Pnpt1 Pofut2 Pold3 Poldip2 Pole4 Polm Polr1a Polr2e Polr3a Polrmt Pon3 Pot1a Ppapdc2 Ppargc1a Ppbp Ppfibp1 Ppfibp2 Ppil4 Ppip5k1 Ppp1r9a Ppp2r2c Ppp3cb Ppp3cc Ppp5c Ppp6r2 Pptc7 Prcp Preb Prepl Prickle1 Prkcd Prkg2 Prkrir Prom2 Prorsd1 Prpf31 Prpf40b Prps2 Prr15l Prr3 Prrc1 Prss16 Psenen Psmc3ip Psmd10 Psme1 Psme2 Pstk Ptcd3 Ptgds Ptgs1 Pthlh Ptp4a3 Ptpn13 Ptpn2 Ptpre Ptprk Ptrh2 Purb Pyroxd1 Qpctl Rab12 Rab27b Rab28 Rab2b Rab32 Rab34 Rab9 Rabl5 Rac1 Rad18 Rad50 Rad51c Rad51l3 Rad52 Raf1 Ramp3 Rap1gap2 Rap2a Rapgef6 Rars2 Rasgef1b Rasl11b Rassf6 Rassf8 Rbak Rbck1 Rbks Rbm28 Rbmx Rccd1 Rdbp Rdm1 Rel Relb Retsat Rfxank Rfxap Rgma Rgs10 Rgs12 Rgs17 Rhbdd2 Rhbdd3 Rhobtb2 Rilpl2 Rin2 Rln3 Rmnd5a Rnaseh2b Rnasek Rnf103 Rnf121 Rnf128 Rnf130 Rnf138 Rnf141 Rnf145 Rnf152 Rnf170 Rnf187 Rnf213 Rnf215 Rnf216 Rnf31 Rnf32 Rnft1 Rnmtl1 Rpa3 Rpain Rpl14 Rpl19 Rpn1 Rprd1a Rps6ka6 Rps6kb1 Rpusd3 Rragb Rsad1 Rtn2 Samd14 Samd5 Samd8 Samd9l Sardh Scap Scara3 Scd1 Sco1 Scrib Scx Sdhaf1 Sdr39u1 Sec14l2 Sec22a Sec22c Sec24a Sec61a1 Secisbp2l Selm Sema3a Sema3c Sema3d Serbp1 Sergef Serinc3 Serpina3g Serpinb6b Serpinf1 Sertad3 Setd5 Sgce Sgol1 Sh2d1b1 Sh3kbp1 Shfm1 Shprh Shq1 Siah1b Sigirr Sik1 Ska2 Skap2 Skil Skp1a Slc10a3 Slc16a13 Slc1a5 Slc22a18 Slc22a21 Slc22a5 Slc23a3 Slc25a10 Slc25a13 Slc25a26 Slc25a39 Slc25a40 Slc26a2 Slc2a8 Slc30a4 Slc35b2 Slc35b4 Slc37a3 Slc38a1 Slc39a11 Slc39a14 Slc43a2 Slc44a1 89 Slc46a1 Slc50a1 Slc52a2 Slc7a4 Slc7a7 Slc9a3r2 Slc9a6 Slco3a1 Slco4a1 Slfn10-ps Slk Slpi Smarcb1 Smarcd2 Smg6 Smo Smox Smpd3 Sms Sned1 Snrnp25 Snrnp27 Snrpb2 Snrpg Snta1 Snx12 Socs3 Sod2 Sorbs3 Spa17 Spag4 Spag5 Sparc Spata13 Spata24 Spata25 Spcs2 Speer6-ps1 Spg20 Sphk2 Spin4 Spn Spnb2 Spns2 Spns3 Spp1 Spr Spred1 Sqrdl Sra1 Srebf1 Srgap3 Srsf10 Srxn1 Ssbp1 Ssbp4 Ssr4 Ssx2ip Ssxb1 Ssxb2 Ssxb3 St3gal5 St7 Stag1 Stambpl1 Stat1 Stk10 Stk30 Stra13 Strada Stx8 Styk1 Suclg1 Suclg2 Supt6h Suz12 Svip Syn3 Syngr1 Syngr2 Synj2 Syt13 Szrd1 Tab3 Taco1 Taf10 Tanc2 Taok1 Tasp1 Tax1bp1 Taz Tbc1d9b Tbcb Tbcc Tbrg4 Tcea2 Tceanc Tcp11l1 Tcstv1 Tctn2 Tesk2 Tex264 Tex9 Tfb1m Tfpi Tgfa Tgoln2 Tha1 Thap3 Thbs2 Thpo Thra Thumpd2 Thumpd3 Timm22 Tinf2 Tjp3 Tk1 Tlcd1 Tm7sf3 Tm9sf1 Tma7 Tmc6 Tmcc1 Tmed4 Tmem101 Tmem106b Tmem106c Tmem107 Tmem109 Tmem126b Tmem147 Tmem168 Tmem17 Tmem173 Tmem174 Tmem176a Tmem176b Tmem181a Tmem184a Tmem20 Tmem214 Tmem216 Tmem229b Tmem231 Tmem41b Tmem48 Tmem53 Tmie Tmpo Tnfaip2 Tnfrsf1a Tnfrsf1b Tnip1 Tnnt2 Tnrc6b Tnrc6c Tns1 Tonsl Top1mt Tpi1 Tprg Tprkb Tra2a Traf1 Trak1 Trappc1 Trappc9 Trex1 Trib2 Trim11 Trim13 Trim39 Trim41 Trim54 Trim68 Trnt1 Trpm4 Trpv4 Tsen2 Tsen54 Tspan1 Tspan6 Tspan7 Tst Tsta3 Ttc23 Ttc39b Ttll5 Tubb2b Tubb3 Tubd1 Tubg1 Tubg2 Tufm Tusc1 Tusc2 Txnip Txnrd3 Ube2b Ube2h Ube2o Ube3a Ubl3 Ubl4 Ublcp1 Ubn2 Ubxn2b Uchl1 Uckl1 Uevld Uhrf1bp1l Unc13d Ung Upk3bl Uqcr10 Uqcr11 Uqcrc2 Urgcp Usp31 Usp34 Usp46 Usp48 Utp6 Vamp2 Vamp5 Vamp7 Vars2 Vcpip1 Vdac1 90 Vdr Vegfa Vgll4 Vill Vkorc1 Vmac Vmp1 Vps25 Vps28 Vps53 Vps54 Vrk3 Vwa1 Wbp11 Wbscr27 Wdpcp Wdr31 Wdr35 Wdr54 Wdr78 Wdr85 Wdr90 Wdr92 Whrn Wipf2 Xbp1 Xlr Xpc Xrcc1 Xylt2 Ydjc Yeats2 Yif1a Yipf6 Ythdf3 Zbtb32 Zbtb8b Zc3hav1 Zc3hav1l Zcchc11 Zdhhc21 Zeb1 Zfand1 Zfand4 Zfml Zfp12 Zfp212 Zfp248 Zfp280c Zfp287 Zfp3 Zfp324 Zfp354a Zfp385a Zfp397 Zfp398 Zfp41 Zfp420 Zfp444 Zfp473 Zfp551 Zfp593 Zfp607 Zfp637 Zfp639 Zfp652 Zfp672 Zfp688 Zfp692 Zfp715 Zfp772 Zfp773 Zfp799 Zfp800 Zfp862 Zfp865 Zfp945 Zfp954 Zfyve19 Zfyve27 Zgpat Zhx1 Zhx3 Zmat3 Znf41-ps Znhit3 Znrf2 Zranb1 Zscan29 Zswim1 Zswim6 NA 91 Genes Subexpressos 0610007N19Rik 0610012G03Rik 0610031J06Rik 1110018G07Rik 1110034B05Rik 1110038B12Rik 1110046J04Rik 1110057K04Rik 1190003J15Rik 1300014I06Rik 1500011B03Rik 1500012F01Rik 1600014C10Rik 1700009N14Rik 1700016G22Rik 1700019E19Rik 1700072H12Rik 1700073E17Rik 1700094D03Rik 1810013L24Rik 2010111I01Rik 2010204K13Rik 2210016F16Rik 2310036O22Rik 2310058N22Rik 2310061C15Rik 2400003C14Rik 2610005L07Rik 2610018G03Rik 2610039C10Rik 2700094K13Rik 2810021B07Rik 2810021J22Rik 2810403A07Rik 2810417H13Rik 2900009J20Rik 2900093K20Rik 3110009E18Rik 3110045C21Rik 3110082D06Rik 3230401D17Rik 4732465J04Rik 4921517L17Rik 4930402H24Rik 4930432K21Rik 4930471M09Rik 4930474A20Rik 4930486L24Rik 4930579C12Rik 4930581F22Rik 4933406P04Rik 4933433P14Rik 5730508B09Rik 5830415F09Rik 5830418K08Rik 6330403L08Rik 6330509M05Rik 6330512M04Rik 6330578E17Rik 6430548M08Rik 6530406A20Rik 8430410K20Rik 9130004C02Rik 9130008F23Rik 9330154J02Rik 9430081H08Rik 9530076L18 A130023I24Rik A530054K11Rik A530098C11Rik A930004D18Rik AA986860 Aars Abcc5 Abcg4 Abl2 Ablim1 Acap2 Acer2 Acot13 Acsbg1 Adam10 Adam12 Adam1a Adam9 Adamts15 Adamts5 Adap1 Adar Adcy9 Adipor1 Adra1b Adrb2 Afap1 Aga Agap1 Agfg2 Agrn AI118078 AI413194 AI842136 Aida Aimp1 AK010878 Akap12 Akap2 Alcam Alg14 Als2 Amfr Amotl2 Anapc10 Anapc2 Ank Ank2 Anp32e Anxa9 Ap1g1 Ap3m2 Apbb2 Aph1b Aplp1 Aplp2 Apobr Araf Arcn1 Arfrp1 Arglu1 Arhgap1 Arhgap29 Arhgap31 Arhgap32 Arhgdib Arhgdig Arhgef18 Arhgef40 Arhgef7 Arid3a Arid5a Arih1 Arl6ip6 Armc6 Armc9 Armcx3 Arpc2 Arpc3 Arpp19 Asah1 Ass1 Atg10 Atg16l1 Atp6ap2 Atp6v0b Atp6v1a Atp6v1b2 Atpif1 Atxn1l Atxn7l1 Atxn7l3b B230120H23Rik B230219D22Rik B330016D10Rik B3gnt9-ps B4galt7 B930003M22Rik Baalc Bace1 BC023202 BC051665 BC065397 BC067068 Bcar1 Bend6 Bglap-rs1 Bhlhe41 Bicd2 Birc3 Blzf1 Bmp4 Bmpr2 Brd3 Brms1l Brox Brwd1 Bzw1 C030027H14Rik C1galt1c1 C230081A13Rik Calm1 Camk2d Camsap3 Capn2 Car13 Card14 Carhsp1 Cask Casp14 Casp3 Casp6 Casq2 Cast Cbfb Cbl Cbll1 Ccdc109b Ccdc124 Ccdc130 Ccdc22 Ccdc82 Ccl25 Ccl6 Cd24a Cd44 Cd63 Cdc37 Cdc37l1 Cdc42ep3 Cdc42ep5 Cdh11 Cdh3 Cdh5 Cdk16 Cdk20 Cdk4 Cdk7 Celf1 Celf2 Cep170 Cep57 Cfl1 92 Cfl2 Cflar Cfp Chadl Chaf1b Cherp Chmp1a Chmp5 Chn1 Chn2 Chodl Chordc1 Chst7 Cib2 Ciita Cirh1a Ckb Clca3 Clcn5 Cldn25 Clec4d Clic4 Clip4 Clk3 Clu Cmip Cmtm3 Cndp2 Cnih4 Cnn2 Cnn3 Cnnm3 Cnot7 Cog2 Col4a3bp Col5a1 Col7a1 Commd4 Comt Cops5 Cops8 Coq10b Coro2a Cotl1 Cox16 Cox4i1 Cox5a Cox7a2 Cpe Cplx2 Cpne4 Cpne8 Cpox Creb3l2 Crhr2 Crim1 Crlf1 Cryab Csde1 Csf2 Csl Csnk2a2 Cspg5 Csrnp1 Cstf2t Cth Ctla2a Ctla2b Ctnnbip1 Ctsd Ctsl Cttnbp2nl Ctxn1 Cul4b Cul7 Cwc15 Cwc22 Cyb5b Cyb5r4 Cyld Cyp20a1 Cyr61 D130009I18Rik D16Ertd472e D16H22S680E D630045M09Rik D930015E06Rik D930017F01 Dapk2 Dapp1 Dbn1 Dbr1 Dcaf6 Dctn6 Dcun1d5 Ddah2 Ddhd1 Ddx17 Ddx28 Defb11 Dennd5b Dgcr14 Dgka Dgkh Dgkk Dhcr24 Dhps Dlg1 Dlx1 Dmrta2 Dnlz Dnm2 Dnmt3b Dock11 Dok2 Dopey2 Dpm2 Dpp3 Dpp8 Dpysl3 Dsg2 Dsp Dst Duoxa1 Dusp14 Dync1i2 Dync1li2 Dync2h1 Dynll1 Dynlt1f Dynlt3 Dzip3 E030011O05Rik E2f6 E430025E21Rik Ebp Echdc2 Eda Edc3 Edn1 Eef1a1 Eepd1 Efemp1 Efna1 Efnb1 Efnb2 Egfr Eid2 Eif1ad Eif1ax Eif2c3 Eif4a2 Eif4e Eif5b Eif6 Elavl1 Ell Emx2 Endod1 Eomes Epb4.1l4a Epha1 Epha4 Ephb2 Ephb3 Ept1 Erh Erlin2 Ero1lb Esyt2 Etl4 Ets2 Evc2 Evl Exoc3 Exoc8 Exosc2 Eya2 Ezr F11r F3 F730043M19Rik Fads3 Faf2 Faim3 Fam107b Fam108a Fam110b Fam120b Fam129c Fam132a Fam132b Fam168b Fam177a Fam178a Fam189b Fam192a Fam19a2 Fam20a Fam20c Fam32a Fam38a Fam49b Fam63a Fam76b Farsa Fastkd3 Fbxo22 Fbxo38 Fbxw7 Fcf1 Fdft1 Fdps Fem1b Fermt2 Fez2 Fgfbp1 Fhdc1 Fhl1 Fhl2 Fhod1 Fjx1 Flot2 Fmnl2 Fn1 Fnbp1l Foxc1 Foxd1 Foxg1 Foxn3 93 Foxo1 Frmd4a Frmd6 Fscn1 Ftsjd1 Fundc1 Fuom Fzd2 Gabpa Gabpb1 Gadd45b Gadd45g Gal Galnt10 Galnt13 Galnt4 Gapvd1 Gas5 Gata6 Gatad2a Gba2 Gcfc1 Gckr Gcnt2 Gdi2 Gen1 Gfod1 Gimap6 Gimap9 Gins3 Gja4 Glce Glipr2 Glt25d1 Glul Gm10627 Gm10825 Gm129 Gm1966 Gm6787 Gmds Gmeb1 Gmfb Gmip Gna14 Gnai1 Gnai3 Gnao1 Gng5 Gpr137b Gpr64 Gpr77 Gprc5b Gprc5c Gpsm1 Gpt2 Gpx1 Gpx8 Grhl1 Gsn Gspt1 Gstcd Gstk1 Gvin1 Hax1 Hbp1 Hdac6 Hdlbp Hecw2 Hexb Hhex Higd2a Hmgcr Hmgcs1 Hmgn1 Hmgn3 Hn1l Hnrnpa3 Hnrnph3 Hook3 Hoxb6 Hs1bp3 Hsbp1 Hsd11b1 Hsd17b7 Hsp90aa1 Hspa13 Hspa2 Hspb11 Hspbap1 Hspe1 Htr1d Hunk Ick Id3 Idh1 Ifi27l1 Ifrd1 Igf2bp1 Igf2bp3 Igfbp7 Igsf11 Igsf3 Ikzf2 Il18r1 Il1b Il20rb Inhba Inhbb Inpp4b Ints12 Ip6k2 Ippk Irf1 Irs1 Isl1 Itgav Itgb1 Itgb6 Jag1 Jag2 Jdp2 Jub Jun Kalrn Kansl3 Kbtbd4 Kcnb1 Kcnj4 Kcnn4 Kctd1 Kdelr3 Khdrbs2 Kif5a Kif5c Kin Kirrel Klf6 Klf7 Klhdc2 Klhdc4 Klhl18 Klhl23 Klhl26 Klhl36 Klhl38 Krt17 Krt19 Krt7 Krt78 Krtap3-2 Krtap4-6 Krtap5-1 Lamb1 Lamp1 Lamp2 Lancl3 Large Lass6 Lce1c Lce1e Lce1g Lce1h Lce1i Lce1j Ldhb Ldlr Lef1 Lemd1 Lenep Leo1 Leprel4 Leprot Lgals8 Lgmn Lhfp Lhfpl2 Lhfpl4 Lhx2 Lhx6 Lipg Litaf Lman2 Lnp Lpar1 Lpar2 Lpcat1 Lphn1 Lpp Lrch4 Lrfn4 Lrig3 Lrrc8a Lrrfip1 Lsm6 Ltv1 Luzp1 Lyn Lypd6b Magi3 Maml2 Maoa Map1lc3a Map1lc3b Map2k1 Map4k4 Mapkap1 Mapkapk2 Mark2 Mars Masp1 Max Mboat1 Mboat2 Mcam Mcf2l Mcm3 Mcm4 Mcts1 Me1 Med10 Med28 Med6 Mest Metap1 Mfap3l Mff Mfhas1 Mfsd6 Mgea5 94 Mgll Mid1ip1 Mid2 Mitd1 Mki67ip Mlc1 Mmadhc Mmd Mme Mmp10 Mnat1 Mob4 Morf4l1 Mphosph6 Mpv17 Mras Mre11a Mrgprb2 Mrpl39 Mrps6 Msra Msrb3 Mtap2 Mtch2 Mthfs Mtrr Mtss1 Mtx3 Muc16 Mvd Myh9 Myl12b Myo1b Myo9b Nabp1 Nat8l Nbl1 Ncam1 Nck1 Ncs1 Nde1 Ndufa1 Ndufb11 Necab2 Nek6 Neo1 Neurl1a Nexn Nfat5 Nfe2l3 Nfia Nfil3 Ngf Ngfrap1 Nhlrc1 Nif3l1 Ninj2 Nip7 Nkain1 Nkain4 Nkap Nkrf Nmi Nmnat3 Nnmt Nox4 Npc2 Npnt Npr2 Nptn Nradd Nras Nrg1 Nsdhl Nsl1 Nt5e Ntpcr Nuak2 Nudt17 Nudt21 Nup160 Nup214 Nup35 Nup93 Nutf2 Oaz2 Odz3 Odz4 Olfm1 Olfm2 Olfr1036 Olfr1170 Olfr139 Opa1 Orc6 Osbpl11 Osgepl1 Osgin1 Otud5 Otud7b P2ry12 P2ry14 P4ha2 Pa2g4 Pacsin3 Pak1 Pan2 Panx1 Paqr5 Pard6g Parp6 Pbx4 Pcdh17 Pcdhb14 Pcdhb16 Pcdhb17 Pcdhb20 Pcdhb21 Pcdhb22 Pcdhb5 Pcdhb6 Pcdhb7 Pdcl3 Pde4dip Pde6d Pdgfd Pdk4 Pdlim1 Pdlim5 Pdlim7 Pdpn Pdxdc1 Pea15a Penk Pet2 Pex11c Pex16 Pfkfb3 Pgbd5 Pgrmc1 Phf16 Phf20 Phlpp2 Phyhd1 Pick1 Pik3c2a Pik3cb Pip4k2a Pip4k2c Pip5k1a Pitrm1 Pitx1 Pkn2 Pknox1 Pkp1 Pkp2 Pkp4 Pla2g12a Plat Plcl1 Plekhb2 Plekhg4 Plin2 Plod2 Plp2 Plscr1 Plscr2 Pmepa1 Pmpca Pnpla6 Podnl1 Poglut1 Polb Polr2m Pon2 Pou6f1 Pparg Ppic Ppm1f Ppp1r14c Ppp1r2 Ppp1r2-ps3 Ppp1r3f Ppp2r5b Ppp2r5e Ppp6c Praf2 Prdx2 Prh1 Prim2 Prkaca Prkcdbp Prkd3 Prl2a1 Prl2c3 Prl2c5 Prl3d1 Prl3d2 Prl7a1 Prl7a2 Pros1 Prpf3 Prps1l3 Prrc2b Prss23 Prune2 Psma3 Psma6 Psmb7 Psmc1 Psmd14 Psmd2 Psmd7 Pstpip1 Ptbp2 Ptdss1 Ptges3 Ptp4a1 Ptpn1 Ptpn21 Ptpn22 Ptprf Ptprk Ptprm Ptprz1 Pvrl3 Pxdn Pyhin1 Qk R3hdm2 95 Rab10 Rab11a Rab15 Rab19 Rab21 Rab22a Rab23 Rab31 Rab3ip Rab6b Rabggtb Rac3 Rad9 Radil Rala Ralb Ralgps2 Ranbp1 Ranbp10 Ranbp17 Rap1a Rap1b Rap1gds1 Rasal2 Rassf1 Rb1cc1 Rbm10 Rbm17 Rbm18 Rbm3 Rbm4 Rbm4b Rbms3 Rbx1 Rdh11 Rexo2 Rfwd2 Rfwd3 Rgl3 Rhbdd1 Rhoa Rhob Rhoc Rhoq Rhou Rilpl1 Rin3 Ripk1 Rit1 Rmi1 Rnaset2b Rnd3 Rnf113a1 Rnf113a2 Rnf166 Rnf7 Rp2h Rpl13 Rpl34 Rpl35a Rpl39 Rpl4 Rpl7 Rpl7a Rraga Rragc Rras Rras2 Rsl1d1 Rtn4r Rusc2 S100a16 S100a6 S1pr2 Sall2 Sarnp Sars Sc4mol Sc5d Scly Scnm1-ps Scyl2 Sdc2 Sdc3 Sdccag8 Sec22b Sema7a Senp8 Sep15 Sephs1 Sept2 Sept5 Sept6 Serinc5 Serp2 Serpinb1a Serpinb1b Serpinb1c Serpinb2 Serpinb5 Serpinb6a Serpinb6c Serpinb6d Serpinb8 Serpinb9 Serpinb9e Serpine1 Set Setd3 Sf3b1 Sfmbt2 Sgcb Sgk1 Sgms2 Sgpp2 Sgsm1 Sh3bp5l Sh3d19 Sh3glb1 Sh3rf1 Sh3tc2 Sidt2 Siglecg Sin3b Sipa1l2 Sirt5 Six1 Skap1 Slc20a1 Slc22a23 Slc25a25 Slc25a29 Slc25a5 Slc35e1 Slc38a2 Slc38a7 Slc39a13 Slc4a4 Slc5a4b Slc6a4 Slc6a8 Slc7a6 Slc9a2 Slc9a7 Slco2a1 Smad1 Smad5 Smagp Smc6 Smek1 Smndc1 Smurf1 Snai2 Snap29 Snap91 Snhg1 Snhg5 Snn Snrpe Snupn Snx19 Snx25 Son Sorbs2 Sorcs2 Sort1 Sost Sox11 Sox13 Sox9 Sp8 Spats2l Spcs3 Spef1 Spin1 Spire1 Spopl Sprr2h Spsb4 Srcin1 Srd5a1 Srek1ip1 Ssbp3 Ssr1 St14 St6galnac6 St7l Stag2 Stau2 Stbd1 Stk17b Stk4 Stx3 Stx6 Sugp1 Sugt1 Sulf1 Sulf2 Suox Surf1 Surf2 Surf4 Surf6 Susd4 Suv39h1 Syncrip Synpr Syt12 Tacc1 Taf1d Taf5l Taf9 Taf9b Tanc1 Tbc1d9 Tbrg1 Tbx1 Tbx15 Tbx18 Tceb1 Tcf7l1 Tcirg1 Tecr Tfe3 Tg Tgfb2 Tgfbi Tgif2 Tgm2 Thap2 96 Tiam1 Timm17b Tipin Tk2 Tlr3 Tmem123 Tmem130 Tmem14a Tmem158 Tmem161a Tmem2 Tmem245 Tmem38a Tmem51 Tmem66 Tnfrsf18 Tnfrsf21 Tnfrsf25 Tnnc1 Tom1 Tomm20 Tomm70a Tor1aip2 Tpbg Tpm1 Tpm2 Tpm3 Tpm4 Traf2 Traf5 Trdmt1 Trim3 Trim39 Trim59 Trip12 Trip13 Trip4 Trmt1 Trmt10a Trnp1 Tsc22d3 Tsc22d4 Tshz1 Tshz3 Tsn Tspan15 Tspan9 Ttc13 Ttc9 Ttyh3 Tuba1a Tubb2a Tubgcp3 Tuft1 Twist1 Txk Txndc9 Txnl4a U05342 Uba1 Ubash3b Ubc Ube2a Ube2cbp Ube2d3 Ube2i Ube2l3 Ube2q2 Ube2r2 Ube2v2 Ube2w Ube4a Ubxn7 Uck2 Ucn2 Ucp1 Ugcg Uhrf2 Unc13b Upf3b Urm1 Usp3 Usp37 Usp38 Usp54 Usp9x Ust Uxt Vac14 Vash1 Vash2 Vav3 Vcam1 Vcp Vcpip1 Vegfc Vgll3 Vim Vps11 Vps26b Vps37a Vps4a Vps4b Vsig10 Vwce Wars2 Wasf2 Wbp5 Wdr1 Wdr37 Wdr4 Wdr44 Wdr45 Wdr5 Wdr53 Wdr75 Wfs1 Whsc1 Wipf1 Wisp1 Wls Wnt10a Wnt4 Wwc2 Wwp2 Xiap Yap1 Ybx1 Yif1b Yjefn3 Ypel1 Yy1 Zbtb1 Zbtb33 Zc3h18 Zcwpw1 Zdhhc15 Zdhhc2 Zdhhc7 Zdhhc8 Zeb2 Zfand3 Zfand5 Zfhx3 Zfp125 Zfp131 Zfp142 Zfp182 Zfp259 Zfp276 Zfp317 Zfp358 Zfp367 Zfp386 Zfp451 Zfp462 Zfp503 Zfp532 Zfp609 Zfp612 Zfp617 Zfp781 Zfp809 Zfp821 Zfp866 Zfp868 Zfp955a Zfpm1 Zmynd8 Znhit6 Znrf1 Zrsr2 Zwint Zyx Zzz3 97 10. Anexo 4 Lista de genes diferencialmente expressos associados aos efeitos de contato com o timócito e de interação linhagem x timócito 98 Efeito do Contato com o Timócito 1810026B05Rik 9130008F23Rik Aif1 Arhgdib Arid4a Arl5c C1qc Ccr9 Cd3d Cd52 Cd74 Cd8b1 Col4a1 Coro1a Crip1 Ctss Cytip Dusp6 Eif3a Fam110c Gcnt2 H2-Aa H2-Ab1 Hcls1 Heatr5a Hist1h2af Hist1h2ai Hist1h2ak Hist3h2a Hmga2 Hyou1 Ifi27l2a Igh-VJ558 Igk Kdm2a Lcp1 Ltb Ly6d Ly86 Lyz1 Lyz2 Myo1g Ncf4 Olfr1419 Pim3 Plac8 Plbd1 Psmb8 Ptprc Rab14 S100a9 Scrib Sepp1 Snhg5 Spry2 Srgn Stambpl1 Susd3 Tcrb-J Tex10 Thy1 Trib1 Uba6 Zfp91 Zfp955b Zfr Adam1a Egr1 Nfil3 Ssbp2 Os últimos qutro genes (em destaque) são subexpressos. Os restantes são sobrexpressos. 99 Efeito da Interação Linhagem x Timócito 1110046J04Rik 1810011O10Rik 1810026B05Rik 1810035L17Rik 2310035P21Rik 2810013P06Rik 2900052L18Rik 3010026O09Rik 4930431P19Rik 4932439E07Rik 5830408C22Rik 8030431J09Rik 9330151L19Rik A330040F15Rik A930033H14Rik Agap1 Anxa2 Apool Arid4a Arrdc3 Asb13 Atp6v0a1 Atp6v0e B130040O20Rik B230303O12Rik Bsdc1 C1qc C230096K16Rik C530043K16Rik Cav2 Ccdc55 Cd52 Cd74 Cenpk Cep78 Coq5 Coro1a Crip1 Ctss Dido1 Dusp6 E030011O05Rik Eif2ak3 Fam82b Fos Gdap5 Gigyf2 Gm4532 Gm9975 Gsta2 H2-Ab1 H3f3b Hist1h2ac Hist1h2br Ifi27l2a Igfbp3 Igk Ipp Jagn1 Kremen1 Lysmd4 Lyz1 Lyz2 Maoa Mia3 Mt1 Nfkbiz Nfu1 Nfx1 Nr2c1 Ocrl Parl Pim1 Plbd1 Polb Polr3a Polr3g Pyroxd1 Rab14 Rad50 Rdh14 S100a9 Sepp1 Sik1 Slc43a2 Stat1 Tanc2 Tcrb-J Them4 Tmem216 Trib1 Trpc1 Tslp Txnip Ubxn2b Uevld Vcpip1 Vmp1 Yeats2 Zfp397 Zfp787 Zfp846 Zfyve27 A530098C11Rik Arih1 Armc7 Atxn2 Ccnj Cpne5 D930017J03Rik Ddhd1 Gadd45b Il20rb Irf1 Mapt Mmrn2 Nfkbia Pex11c Rps15a Slc38a2 Snx5 Tcf7l2 Tmem110 Ube2i Ubr3 Wwc2 Zmynd17 Zzz3 Os genes em destaque são subexpressos. 100 11. Anexo 5 Lista de miRNAs diferencialmente expressos no modelo de células epiteliais tímicas. 101 Efeito da Linhagem logFC 0,80 0,54 0,51 0,46 0,43 0,43 0,41 0,39 0,39 0,38 0,36 0,34 0,34 0,33 0,27 -0,17 -0,20 -0,28 -0,30 -0,37 -0,38 -0,41 -0,42 -0,42 -0,48 -0,57 -0,59 -0,59 -0,66 -0,74 AveExp r 7,71 7,59 8,42 6,70 6,95 6,88 8,92 11,29 7,37 8,68 7,48 9,65 6,81 7,84 9,65 6,57 6,51 6,49 10,85 9,83 10,11 7,50 10,80 7,68 11,11 8,99 8,89 9,63 7,86 8,74 miRNA mghv-miR-M1-7-3p mmu-miR-471 mmu-miR-671-3p logFC 0,52 0,31 -1,61 Efeito do Contato com o Timócito AveExpr t P.Value adj.P.Val B odds odds.Prob 6,84 8,33 0,00000 0,00001 9,32 11111,0 1,00 6,68 5,60 0,00001 0,00499 3,61 37,1 0,97 8,13 -12,07 0,00000 0,00000 15,25 4212571,9 1,00 miRNA mghv-miR-M1-7-3p mmu-miR-471 Efeito da Interação Linhagem x Timócito logFC AveExpr t P.Value adj.P.Val B -0,67 6,85 -5,82 0,00001 0,00431 3,81 -0,69 6,76 -6,50 0,00000 0,00164 5,18 miRNA mmu-miR-202-3p mmu-miR-365 mmu-miR-301a mmu-miR-878-3p mmu-miR-697 mmu-miR-139-5p mmu-miR-30b mmu-miR-96 mmu-miR-324-5p mmu-miR-107 mmu-miR-148b mmu-miR-183 mmu-miR-193 mmu-miR-10a mmu-miR-103 mmu-miR-9 mmu-miR-9* mmu-miR-335-5p mmu-miR-130a mmu-miR-30a mmu-miR-221 mmu-miR-467b mmu-let-7i mmu-miR-669a mmu-let-7d mmu-miR-27b mmu-miR-222 mmu-miR-23b mmu-miR-466a-3p mmu-miR-350 t P.Value 6,49 0,00000 5,94 0,00000 6,35 0,00000 8,31 0,00000 5,41 0,00001 9,66 0,00000 5,58 0,00001 6,56 0,00000 5,38 0,00002 7,58 0,00000 5,67 0,00001 5,80 0,00001 6,50 0,00000 6,32 0,00000 5,61 0,00001 -6,10 0,00000 -5,60 0,00001 -8,06 0,00000 -5,39 0,00002 -5,55 0,00001 -5,51 0,00001 -5,83 0,00001 -6,63 0,00000 -7,89 0,00000 -5,79 0,00001 -9,10 0,00000 -6,71 0,00000 -9,91 0,00000 -6,44 0,00000 -8,82 0,00000 adj.P.Va l 0,00008 0,00022 0,00010 0,00000 0,00060 0,00000 0,00043 0,00007 0,00063 0,00001 0,00038 0,00028 0,00008 0,00010 0,00042 0,00015 0,00042 0,00001 0,00063 0,00045 0,00049 0,00028 0,00006 0,00001 0,00028 0,00000 0,00005 0,00000 0,00008 0,00000 B odds 5,69 297,0 4,38 80,0 5,36 212,9 9,80 18021,5 3,10 22,1 12,52 272397,1 3,51 33,4 5,86 350,8 3,01 20,4 8,21 3682,2 3,71 41,0 4,05 57,2 5,73 309,0 5,30 199,7 3,57 35,6 4,78 118,6 3,56 35,2 9,25 10431,4 3,04 20,8 3,44 31,0 3,33 28,0 4,11 60,6 6,03 416,2 8,89 7252,6 4,03 56,2 11,42 91153,5 6,23 506,9 12,99 438200,1 5,58 264,0 10,84 51217,3 odds.Pro b 1,00 0,99 1,00 1,00 0,96 1,00 0,97 1,00 0,95 1,00 0,98 0,98 1,00 1,00 0,97 0,99 0,97 1,00 0,95 0,97 0,97 0,98 1,00 1,00 0,98 1,00 1,00 1,00 1,00 1,00 odds odds.Prob 45,1 0,98 176,9 0,99 102