UNIVERSIDADE DE SÃO PAULO INSTITUTO DE QUÍMICA PROGRAMA DE PÓS-GRADUAÇÃO EM BIOQUÍMICA ANÁLISE DA EXPRESSÃO DE RNAs INTRÔNICOS NÃO-CODIFICADORES EM CARCINOMAS DE CÉLULA RENAL GLAUBER COSTA BRITO Orientador: Prof. Dr. Eduardo Moraes Rego Reis Tese de Doutoramento apresentada ao Departamento de Bioquímica da Universidade de São Paulo São Paulo Data do Depósito na SPG: 08/10/2007 2 GLAUBER COSTA BRITO ANÁLISE DA EXPRESSÃO DE RNAs INTRÔNICOS NÃO-CODIFICADORES EM CARCINOMAS DE CÉLULA RENAL Tese apresentada ao Instituto de Química da Universidade de São Paulo para obtenção do Título de Doutor em Bioquímica. Orientador: Prof. Dr. Eduardo Moraes Rego Reis São Paulo 2007 3 Glauber Costa Brito Análise da expressão de RNAs intrônicos não-codificadores em carcinomas de célula renal Dissertação apresentada ao Instituto de Química da Universidade de São Paulo para obtenção do Título de Doutor em Bioquímica Aprovado em: ____________ Banca Examinadora Prof. Dr. _____________________________________________________ Instituição: ___________________________________________________ Assinatura: ___________________________________________________ Prof. Dr. _____________________________________________________ Instituição: __________________________________________________ Assinatura: ___________________________________________________ Prof. Dr. _____________________________________________________ Instituição: __________________________________________________ Assinatura: ___________________________________________________ Prof. Dr. _____________________________________________________ Instituição: __________________________________________________ Assinatura: ___________________________________________________ Prof. Dr. _____________________________________________________ Instituição: __________________________________________________ Assinatura: ___________________________________________________ 4 A Eurico Gracindo de Brito (in memoriam) e Lindaura da Costa de Brito, que sempre batalharam pela minha educação. Essa tese é fruto dessa batalha. 5 AGRADECIMENTOS Ao meu orientador, Prof. Dr. Eduardo Reis, pela paciência na orientação e tirocínio lógicodedutivo, indispensáveis para indicar, muito acertadamente, a incoerência de muitas das minhas idéias. Obrigado por mostrar que "uma câmera na mão e uma idéia na cabeça" só funciona bem com o Glauber do cinema. Ao Prof. Dr. Sergio Verjovski, pela dedicação ao projeto dessa tese e pela estrutura de laboratório, ambiente científico e condições de trabalho incomuns num país como o nosso. Poder usufruir disso foi um privilégio. À Universidade de São Paulo, pela minha formação acadêmica nesses quase 15 anos e, por extensão, ao Departamento de Bioquímica do IQ/USP. A Renato, Denise, Adriana e Camile pelos momentos agradáveis de bandejão, e também, claro, pelo auxílio técnico. A Fabrício, à época funcionário do Instituto Ludwig, por ter me ensinado as técnicas de análise de metilação. Ao Prof. Dr. André Vettore, à época pesquisador do Instituto Ludwig, pela colaboração nas análises de metilação. A Ana Paula Lopes Vidal, indispensável na minha relação com a Fapesp e na organização burocrática do laboratório. A Tarik, pelas discussões científicas e culturais, por compartilhar idéias e opiniões. A Ângela, pela colaboração com dados de pacientes, amostras e RNAs. A Mílton, Apuã e Abimael, pelas dicas de Perl e Unix. A Thiago, pelas opiniões científicas, quase sempre discordantes das minhas. A Jeferson, pelos papos de cafezinho e ajuda no laboratório. Aos demais colegas de laboratório, especialmente a Ana Cláudia, Kátia, Renato, Denise, Ana Paula, Tarik, Jeferson, Felipe, Camila, Hélder, Yuri, Giulliana, Lauren, Rodrigo e Ricardo, por terem tornado o ambiente de trabalho mais leve e divertido. A Rosane, a quem não dediquei o tempo merecido, em função do tempo dedicado a essa tese. A Tatiana, grande amiga. Ao apoio financeiro da FAPESP e CNPq. 6 “E não me esquecer, ao começar o trabalho, de me preparar para errar. Não esquecer que o erro muitas vezes havia se tornado o meu caminho. Todas as vezes em que não dava certo o que eu pensava ou sentia - é que se fazia enfim uma brecha, e, se antes eu tivesse tido coragem já teria entrado por ela. Mas eu sempre tivera medo de delírio e erro. Meu erro, no entanto, devia ser o caminho de uma verdade: pois só quando erro é que saio do que conheço e do que entendo. Se a “verdade” fosse aquilo que posso entender - terminaria sendo apenas uma verdade pequena, do meu tamanho. A verdade tem que estar exatamente no que não poderei jamais compreender.” Clarice Lispector, A paixão segundo G.H. 7 RESUMO Brito, G. C. Análise da expressão de RNAs intrônicos não-codificadores em carcinomas de célula renal. 2007. 126 p.. Tese (Doutorado) - Programa de Pós-Graduação em Bioquímica. Instituto de Química, Universidade de São Paulo, São Paulo. O carcinoma de célula renal (CCR) subtipo célula clara é o câncer mais letal e prevalente do sistema urinário. A transformação maligna no CCR está possivelmente associada à mudanças no perfil de expressão de oncogenes e genes supressores de tumor, e acredita-se que estas alterações sejam críticas para o desenvolvimento do fenótipo maligno. Para identificar novos genes e vias moleculares associadas à transformação maligna no CCR célula clara, foram analisados perfis de expressão gênica de amostras pareadas de tumor e tecido não tumoral adjacente de 6 pacientes. Foi utilizada uma plataforma de microarrays de cDNA contendo 2.292 sondas mapeando éxons de genes codificadores e 822 sondas de RNAs não-codificadores mapeando em regiões intrônicas. A transcrição intrônica foi detectada em todos os tecidos normais e neoplásicos. Utilizando uma combinação de dois testes estatísticos e uma validação por leave-one-out, foi selecionado um subconjunto de 64 transcritos com expressão significativamente alterada em CCR célula clara em relação ao tecido não tumoral adjacente, estando a maior parte (86%) com expressão diminuída em CCR. Entre os transcritos com expressão diminuída, 49 mapearam em regiões não-traduzidas ou éxons de genes codificadores e 6 mapearam em regiões intrônicas de genes codificadores conhecidos. Os níveis de expressão diminuída de SIN3B, TRIP3, SYNJ2BP e NDE1 (p < 0,02), e de transcritos intrônicos derivados dos loci de SND1 e ACTN4 (p < 0,05), foram confirmados em CCR célula clara por Real-time RT-PCR. Um subconjunto de 25 transcritos se mostrou alterado em 6 amostras adicionais de CCR não−célula clara, indicando alterações transcricionais comuns em CCR independentemente do subtipo histológico ou do estado de diferenciação do tumor. Além disso, foi analisado o perfil de metilação dos genes com expressão diminuída em tumor SIN3B, TRIP3, SYNJ2BP e GPX3. Nossos resultados indicam um novo conjunto de candidatos a gene supressor de tumor, que 8 podem desempenhar um papel importante na transformação maligna de células renais normais. Palavras-chave: carcinoma de célula renal, RNA não codificante, transcrição intrônica, microarrays de cDNA, supressor de tumor. 9 ABSTRACT Brito, G. C. Expression analysis of intronic noncoding RNAs in renal cell carcinomas. 2007. 126 p.. Thesis (Doctoral) - Graduate Program in Biochemistry. Instituto de Química, Universidade de São Paulo, São Paulo. The clear cell subtype of renal cell carcinoma (RCC) is the most lethal and prevalent cancer of the urinary system. The carcinogenesis in RCC is thought to be associated with changes in the expression of several genes, and this alteration in gene expression is believed to be critical to the development of the malignant phenotype. To investigate new genes and molecular pathways associated with malignant transformation in clear cell RCC, gene expression profiles of matched samples of tumor and adjacent non-neoplastic tissue obtained from 6 patients were analysed. A custom-built cDNA microarray platform was used, comprising 2,292 probes that map to exons of genes and 822 probes for noncoding RNAs mapping to intronic regions. Intronic transcription was detected in all normal and neoplastic renal tissues. A subset of 64 transcripts with levels significantly deregulated in clear cell RCC relative to the matched non-tumor tissue, mostly (86%) downregulated in CCR, was identified by a combination of two statistical tests and leave-one-out patient cross-validation. Among the down-regulated transcripts, 49 mapped to untranslated or coding exons and 6 were intronic relative to known exons of protein-coding genes. Lower levels of expression of SIN3B, TRIP3, SYNJ2BP and NDE1 (p < 0.02), and of intronic transcripts derived from SND1 and ACTN4 loci (p < 0.05), were confirmed in clear cell RCC by Real-time RT-PCR. A subset of 25 transcripts was deregulated in additional 6 non-clear cell RCC samples, pointing to common transcriptional alterations in RCC irrespective of the histological subtype or differentiation state of the tumor. In addition, the methylation profile of SIN3B, TRIP3, SYNJ2BP, and GPX3 was analyzed. Our results indicate a novel set of tumor suppressor gene candidates, including noncoding intronic RNAs, which may play a significant role in malignant transformations of normal renal cells. Keywords: Renal Cell Carcinoma, noncoding RNA, intronic transcription, cDNA microarray, tumor suppressor. 10 LISTA DE ABREVIATURAS bp Pares de bases CCR Carcinoma de Célula Renal CAGE Cap Analysis Gene Expression CGAP Cancer Genome Anatomy Project ChIP Imunoprecipitação da cromatina CT Cycle Threshold ENCODE The Encyclopedia of DNA Elements EST Expressed Sequence Tag FDR False Discovery Rate GEO Gene Expression Omnibus GO Gene Ontology HCGP Human Cancer Genome Project kb Quilobase miRNA Micro RNA MPSS Massively Parallel Signature Sequencing mRNA RNA mensageiro MSP-PCR Methylation-Specific PCR ncRNA RNA não-codificador para proteínas nt Nucleotídeos OMIM Online Mendelian Inheritance in Man ORF Open Reading Frame PCR Reação em Cadeia da Polimerase qPCR PCR quantitativo RACE Rapid Amplification of cDNA Ends RefSeq Reference Sequence RT-PCR Transcrição Reversa − Reação em Cadeia da Polimerase SAGE Serial Analysis of Gene Expression SAM Significance Analysis of Microarrays 11 LISTA DE FIGURAS Página Figura 1 – Esquema da determinação do status de metilação de ilhas CpG utilizando as técnicas de BSP e MSP Figura 2 – Desenho esquemático das hibridizações realizadas 26 Figura 3 – Imagem representativa das hibridizações de CCR com microarray enriquecido em RNAs não-codificadores Figura 4 – Normalização dos dados de expressão 39 38 40 Figura 5 – Dependência entre a intensidade média e o desvio-padrão das réplicas Figura 6 – Matriz de correlação das medidas de intensidade 41 Figura 7 – Expressão de transcritos codificadores para proteínas, e ncRNAs intrônicos e intergênicos em tecido renal. Figura 8 – Perfil de expressão de CCR célula clara 49 50 Figura 9 – Perfil de expressão de CCR independente do subtipo histológico 54 Figura 10 – Locus genômico de TACC1 e SLC2A1 55 Figura 11 – Genes diferencialmente expressos em um maior número de amostras pareadas tendem a estar diminuídos em CCR Figura 12 – Avaliação dos genes alterados em CCR segundo a marcação com Cy3 ou Cy5 Figura 13 – Genes alterados em CCR em diversos estudos 57 Figura 14 – Expressão por Real-Time PCR de candidatos a marcadores de CCR Figura 15 – Região genômica do cromossomo 16 contendo os loci de MYH11 e NDE1 Figura 16 – Verificação do tratamento com bissulfito Figura 17 – Perfil de metilação de sítios CpG de genes sub-expressos em CCR Figura 18 - Gráfico de saída do programa SAM 47 59 61 62 63 65 66 AnexoII 12 LISTA DE TABELAS Página Tabela 1 – Estudos publicados em CCR utilizando Microarrays 22 Tabela 2 – Dados clínico-patológicos dos pacientes 35 Tabela 3 – Primers usados para PCR em tempo real 43 Tabela 4 – Primers usados em BSP 45 Tabela 5 – Relação dos 83 transcritos diferencialmente expressos em CCR 51 13 ÍNDICE 1. INTRODUÇÃO .................................................................................................. 15 1.1 1.2 1.3 1.4 1.5 1.6 1.7 2. O Carcinoma de Célula Renal (CCR) ............................................................ 15 Genética do CCR ............................................................................................ 16 Características Clínicas do CCR .................................................................... 18 Identificação de marcadores moleculares em CCR ........................................ 20 Metilação e Câncer ......................................................................................... 24 RNAs intrônicos não-codificadores................................................................ 27 Papel dos RNAs não-codificadores no câncer................................................ 31 OBJETIVOS ....................................................................................................... 33 2.1 2.2 3. Objetivos Gerais ............................................................................................. 33 Objetivos Específicos ..................................................................................... 33 MATERIAIS E MÉTODOS............................................................................... 34 3.1 3.2 3.3 3.4 3.5 3.6 3.7 4. Amostras de pacientes .................................................................................... 34 Extração de RNA e marcação de alvos fluorescentes.....................................36 Hibridização de alvos fluorescentes com microarrays enriquecidos em ncRNAs intrônicos ................................................................................... 37 Filtragem e normalização dos dados de expressão gênica ............................. 39 Identificação de transcritos diferencialmente expressos em CCR.................. 41 PCR em Tempo Real ...................................................................................... 42 Análise de Metilação ...................................................................................... 44 RESULTADOS .................................................................................................. 47 4.1 4.2 4.3 4.5 5. Avaliação da qualidade das hibridizações realizadas ..................................... 47 Expressão de RNAs intrônicos em CCR ........................................................ 48 Identificação de genes diferencialmente expressos ........................................ 49 Análise do padrão de metilação de genes com expressão diminuída em CCR ......................................................................................... 65 DISCUSSÃO ...................................................................................................... 69 5.1 5.2 5.3 5.4 5.5 Desenho experimental utilizado para identificação de transcritos diferencialmente expressos em CCR .............................................................. 69 Comparação dos genes identificados com outros estudos de CCR ................ 70 Expressão de RNAs não-codificadores em CCR ........................................... 71 Análises de metilação ..................................................................................... 73 Genes diferencialmente expressos em CCR ................................................... 74 6. CONCLUSÕES .................................................................................................. 81 7. REFERÊNCIAS ................................................................................................. 82 ANEXO I − Curriculum Vitae ANEXO II − Abordagens estatísticas utilizadas para seleção de genes diferencialmente expressos 14 ANEXO III − Artigo submetido para publicação 15 1. INTRODUÇÃO 1.1 O Carcinoma de Célula Renal (CCR) O Carcinoma de Célula Renal (CCR) é o tipo de câncer mais comum entre aqueles que surgem no rim de indivíduos adultos, representando 3% de todos os cânceres no mundo (Kopper et al. 2006). Trata-se de uma doença histopatologicamente heterogênea, sendo que a maior parte dos casos (70-80% dos CCRs) é do tipo histológico célula clara, 15-20% são CCR subtipo papilar, 4-5% CCR subtipo cromófobo, < 1% carcinoma do ducto coletor de Bellini e <1% carcinoma medular renal (Eble et al. 2004). Os CCRs podem ser classificados em subtipos específicos usando o sistema de classificação histopatológica da OMS (Organização Mundial de Saúde). Esta classificação é um preditor importante de comportamento clínico (Yin-Goen et al. 2006). Cada subtipo de tumor renal no sistema da OMS é definido por critérios patológicos específicos, que enfatizam o padrão de crescimento, morfologia nuclear e características morfológicas e citoplasmáticas (Amin et al. 2002). Algumas características adicionais do tumor (Grau nuclear Fuhrman e estadiamento) e variáveis clínicas, incluindo trombocitose peri-operatória, também são correntemente usadas como fatores prognósticos para prever a evolução da doença (O'Keefe et al. 2002). Os diferentes tipos de CCRs podem ser normalmente distinguidos por características histológicas e anatômicas. Tipicamente os CCRs célula clara são caracterizados por uma massa infiltrante solitária com padrões de crescimento sólido, alveolar ou acinar e contendo células de tumor “claras” associadas a anastomose de vasos sangüíneos. O aspecto “claro” dessas células na microscopia óptica está associado à presença de lipídeos no citoplasma. Já os tumores CCR papilares são descritos como 16 uma massa circunscrita com cápsula fibrosa, contendo células neoplásicas num padrão de crescimento papilar, imersas em áreas de necrose. Os CCRs cromófobos apresentam padrão de crescimento alveolar, com células tumorais contendo núcleos irregulares, halos perinucleares e citoplasma eosinofílico claro ou granular. Apesar dos critérios microscópicos evidentes, os tumores CCR freqüentemente apresentam mais de um componente, fazendo com que muitas vezes a identificação do subtipo histológico seja difícil e subjetiva. Por exemplo, tumores epiteliais de qualquer tipo podem apresentar padrões de crescimento sólido, alveolar ou papilar, conter células neoplásicas com citoplasma claro ou granular, ou apresentar a variante histológica sarcomatóide, a qual embora não faça parte formalmente do sistema de gradação nuclear (grau Fuhrman), apresenta um prognóstico bastante negativo, com muitos pacientes morrendo em menos de 12 meses. A variante sarcomatóide é definida pelo elevado pleomorfismo de suas células, que apresentam grau variável de células epiteliais claras ou granulares que caracterizam o CCR (Cangiano et al. 1999). 1.2 Genética do CCR A maioria dos casos de CCR é esporádica, sendo os principais fatores de risco a obesidade, o tabagismo e a exposição ocupacional a fatores carcinogênicos. Embora correspondam a menos de 3% do total de casos. o número absoluto de casos de síndromes de CCR hereditárias não é desprezível, e apresentam implicações clínicas importantes. Deve-se suspeitar de uma síndrome herdada quando o CCR é bilateral e/ou multifocal, ou surge em tenra idade. O diagnóstico pode ser confirmado pela análise dos principais genes de predisposição (VHL, MET, FH, BHD) (Kopper et al. 2006). O principal CCR célula clara de origem hereditária está associado à doença de von HippelLindau (VHL), uma síndrome dominante autossômica de suscetibilidade a tumor (Inoue 17 et al. 2007). Esta doença é causada pela perda de função por mutação em células embrionárias do gene supressor de tumor VHL no cromossomo 3p25. Além disso, a perda de função de VHL é a alteração genética mais comum em CCR célula clara esporádico. Mutações em VHL promovem hipervascularização tumoral; a proteína VHL atua na ubiquitinização e degradação de HIF1A (fator 1 alfa induzível por hipoxia), o regulador positivo primário de angiogênese (Na et al. 2003). Raramente o CCR célula clara surge em outras condições hereditárias, sendo uma exceção a síndrome de translocação constitucional do cromossomo 3, mapeada em vários sítios de quebra distintos do locus de VHL (Van Erp et al. 2003). Os subtipos histológicos de tumor renal estão associados a lesões citogenéticas distintas, sugerindo a importância da classificação tumoral a partir de marcadores moleculares e o potencial papel do diagnóstico molecular no tratamento clínico. Várias abordagens citogenéticas e moleculares têm sido utilizadas para identificar as alterações genéticas subjacentes ao CCR (Furge et al. 2004). Análise de cariótipo, perda de heterozigosidade e hibridização genômica comparativa são técnicas que têm contribuído para estabelecer correlações entre alterações cromossômicas e subtipos histológicos, resultando num modelo de subclassificação molecular para este câncer (Furge et al. 2004). Os CCRs célula clara tem sido caracterizados por apresentarem deleção do cromossomo 3p ou ganho de 5q combinados com deleções de dois ou mais cromossomos 6q, 8p, 9p ou 14q; o CCR papilar é caracterizado por um ganho de dois ou mais cromossomos 3q, 7, 8, 12, 16, 17 ou 20 e nenhuma perda de 3p; finalmente, o CCR cromófobo é caracterizado pela perda de dois ou mais cromossomos 1, 2, 6, 10, 13 ou 17. Além disso, evidências sugerem que um ganho do cromossomo 5q em tumores célula clara pode significar um prognóstico mais favorável, enquanto que uma perda de 14q pode resultar num prognóstico menos favorável (Furge et al. 2004). 18 1.3 Características Clínicas do CCR Um terço dos pacientes diagnosticados com CCR apresenta ou apresentará lesões metastáticas durante o curso da doença (Flanigan et al. 2003). O CCR metastático é atualmente um dos tumores malignos mais resistentes ao tratamento. A quimioterapia citotóxica clássica apresenta pouca atividade antitumoral contra o CCR (Motzer et al. 2000), sendo que o CCR célula clara apresenta a mais alta taxa de invasão local, metástase e mortalidade dentre os tumores renais em adultos (Moch et al. 2000; Adjei et al. 2003) . Os carcinomas papilares e cromófobos são relativamente indolentes, mas podem metastatizar ou se transformar em malignidades sarcomatóides de grau elevado. Além disso, o CCR papilar apresenta uma taxa mais elevada de multifocalidade e associação com doença renal em estágio final em comparação com os outros subtipos de CCR (Amin et al. 2002). A nefrectomia radical é a terapia padrão para o CCR localizado, que pode ser curado por cirurgia. No entanto, 25-40% dos casos apresentam crescimento extra-renal ou metástase (Amin et al. 2002), e um terço das lesões aparentemente localizadas desenvolve metástase no período pós-operatório (Gieseg et al. 2002). Para o CCR célula clara em estágio avançado, a terapia sistêmica de primeira linha envolve interleucina-2 (IL-2) e interferon-alfa (IFN-α). No entanto, a maioria dos tumores subtipo célula clara não apresenta resposta satisfatória à imunoterapia (Atkins et al. 2004), que em geral tampouco apresenta bons resultados em subtipos de CCR com histologia diferente de célula clara (Motzer et al. 2000). As taxas de resposta objetiva com IFN-α variam de 10% a 15% em estudos de Fase III, com aumento de sobrevida mediana de apenas 3-7 meses em comparação à terapia equivalente com placebo (Fossa 2000). Assim, o 19 prognóstico para pacientes com CCR avançado é extremamente ruim e a sobrevida mediana é de aproximadamente 10 meses (Motzer et al. 2000). Alguns avanços na elucidação dos mecanismos moleculares subjacentes à progressão do CCR, tem levado à identificação de alvos promissores para o tratamento deste tumor e uma mudança no padrão de desenvolvimento de novos fármacos de uma abordagem por seleção aleatória para uma mais mecanística e racional (Sosman et al. 2007). Inibidores da tirosina quinase, como sorafenib e sunitinib, já foram aprovados para o tratamento de CCR avançado (Sosman et al. 2007). Outros agentes, como bevacizumab, um anticorpo direcionado contra o fator de crescimento vascular endotelial (VEGF) A, também apresentou atividade clínica promissora (Sosman et al. 2007). Os benefícios desses agentes foram reconhecidos devido a elevadas taxas de resposta objetiva (sunitinib), aumento significativo de sobrevida sem doença (sunitinib, sorafenib e bevacizumab) ou melhora significativa de sobrevida sem progressão de doença (temsirolimus) (Sosman et al. 2007). No entanto, a resposta do CCR em estágio avançado à terapia sistêmica com essas novas drogas ainda é insuficente para aumentar significativamente a sobrevida de pacientes após 5 anos, que correspondem a menos de 10% dos casos (Motzer et al. 2000). Uma revisão da literatura não identificou nenhum marcador capaz de individualmente diagnosticar ou prognosticar com eficácia o surgimento ou evolução deste câncer (Ficarra et al. 2002). Assim, a identificação de genes diferencialmente expressos entre tecido normal e tumoral, o foco do presente trabalho, pode contribuir para o desenvolvimento de novos marcadores tumorais capazes de diagnosticar prematuramente o CCR e conseqüentemente aumentar a chance de sobrevida ou cura dos pacientes. Uma outra aplicação da identificação de genes diferencialmente expressos em tumores renais é fornecer subsídios para o desenvolvimento de 20 ferramentas anti-neoplásicas que tenham como alvo estes genes ou as vias de regulação em que estes estão envolvidos. Por exemplo, pode-se desenvolver anticorpos terapêuticos como aqueles descritos contra o receptor de fator de crescimento epidérmico, os quais apresentaram atividade in vitro contra o carcinoma de célula renal (Michael et al. 2003). 1.4 Identificação de marcadores moleculares em CCR Os métodos clássicos de análise de expressão gênica, como northern blot e RT- PCR, se limitam a avaliação de um número limitado de genes e amostras. Por outro lado, os microarrays de DNA são ferramentas poderosas porque podem quantificar o nível de expressão de milhares de transcritos de uma única vez. Os chamados chips de DNA são matrizes sólidas (tipicamente lâminas de vidro) contendo milhares de elementos arranjados com alta densidade, sendo cada elemento (chamados de “sondas”) constituido por moléculas de DNA identicas. Nos experimentos de expressão gênica, os microarrays são hibridizados contra cDNA ou cRNA derivados de mRNA das amostras biológicas que se pretende estudar (chamados “alvos”), tipicamente marcados com uma molecula fluorescente. A quantidade de alvos fluorescentes hibridizados por complementaridade com as sondas representadas nos microarrays fornecem uma medida relativa da expressão gênica (Quackenbush 2002). Há fortes evidências recentes de que o perfil de expressão gênica global possa revelar subtipos clínicos com base na heterogeneidade subjacente dos mecanismos neoplásicos do CCR (Takahashi et al. 2001; Young et al. 2001; Skubitz et al. 2002). Assim, o uso clínico do perfil de transcrição pode resultar em diagnósticos mais exatos e objetivos, bem como melhores prognósticos de doença ou de resposta a tratamento. 21 Utilizando microarrays de DNA, é possível comparar simultaneamente os níveis de expressão relativa de vários milhares de genes em diferentes tipos celulares. Considerando que dos 20.000 - 25.000 genes humanos, segundo recente estimativa do IHGSC (International Human Genome Sequencing Consortium) (2004), menos da metade desses tem sua função compreendida, sendo que a análise em larga escala da expressão pode revelar genes co-regulados pertencentes a uma mesma via eventualmente implicada na patologia do CCR. Deve-se ressaltar ainda que menos de 3% dos genes identificados foram caracterizados em doença renal, sugerindo a necessidade de técnicas de genômica funcional nesta área de pesquisa (Kurella et al. 2001). Nesse sentido, o uso de microarrays de DNA tem se constituído uma importante abordagem na identificação de genes diferencialmente expressos e de eventos moleculares envolvidos no CCR, particularmente a subclasse histológica célula clara. Vários grupos avaliaram se a expressão gênica poderia complementar o exame histopatológico para classificação de tumores renais (Boer et al. 2001; Young et al. 2001; Gieseg et al. 2002; Skubitz et al. 2002; Higgins et al. 2003; Takahashi et al. 2003; Yamazaki et al. 2003; Furge et al. 2004; Schuetz et al. 2005; Sultmann et al. 2005; Yao et al. 2005; Rohan et al. 2006), auxiliar na classificação prognóstica (Motzer et al. 1999; Takahashi et al. 2001; Twine et al. 2003; Vasselli et al. 2003; Kosari et al. 2005) ou identificar expressão diferencial entre tecido tumoral e tecido não-tumoral adjacente (Moch et al. 1999; Boer et al. 2001; Takahashi et al. 2001; Young et al. 2001; Gieseg et al. 2002; Skubitz et al. 2002; Higgins et al. 2003; Hirota et al. 2006). Um resumo dos trabalhos realizados em CCR, indicando as amostras analisadas e a plataforma utilizada em cada um deles é apresentado na Tabela 1. 22 Tabela 1 - Estudos publicados em CCR utilizando microarrays. ESTUDO AMOSTRAS PLATAFORMA OBSERVAÇÕES Yang et al., 2006 9-CC-CCR, 4 P-CCR, 2 CM-CCR, 1 ONC 65 CC-CCR, 13 P-CCR, 9 CM-CCR cDNA (21.632 clones) cDNA (4.200 clones) Classificação diagnóstica Yao et al., 2005 29 CC-CCR, 3 CM-CCR, 1 TW Affymetrix U95A (10.000 genes) Yao et al., 2005 29 CC-CCR, 3 CM-CCR, 1 TW Affymetrix U95A (10.000 genes) Schuetz et al., 2005 13 CC-CCR, 5 P-CCR, 4 CM-CCR, 3 ONC, 6 AML Furge et al., 2004 60 CC-CCR, 5 P-CCR, 16 CM-CCR, pareado Affymetrix HGFocus (8.700 genes) cDNA (23.000 clones) Liou et al., 2004 Pool de CC-CCR e de linhagens celulares de CCR 28 convencionais (CCCCR), 4 P-CCR, 3 CMCCR, 2 ONC, 1 AML 39 CC-CCR, 8 P-CCR, 5 CM-CCR, 6 G-CCR, 5 SCCR, 2 ONC, 3 CU, 5 TW, rim não-neoplásico. 18 CC-CCR, 9 pareados Affymetrix Hugene FL (5.600 genes) cDNA (23.000 clones) Copland et al., 2003 CCR localizado ou metastático, linhagens celulares de CCR Affymetrix U95A (10.000 genes) Yamazaki et al., 2003 10 CC-CCR, 2 P-CCR, 3 CM-CCR Affymetrix U95A (10.000 genes) Vasselli et al., 2003 Young et al., 2001; Young et al., 2003 Skubitz e Skubitz, 2002 58 CCR estágio IV, 8 pareados 4 CC-CCR, 3 P-CCR, 2 CM-CCR, 1 ONC, pareado cDNA (64.000 clones) cDNA (7.000 clones) 8 CC-CCR, 11 amostras normais e 8 tumorais, 256 outros tecidos 9 CC-CCR, 2 CM-CCR, 1 CU, 1 AM, 8 amostras pareadas 29 CC-CCR, pareado Affymetrix U95 (63.000 sondas) Sultmann et al., 2005 Higgins e al., 2003 Takahashi et al., 2003b Lenburg et al, 2003 Gieseg et al., 2002 Takahashi et al., 2001 Boer et al., 2001 37 tumores renais, pareado cDNA (23.000 clones) Affymetrix U133A/B (45.000 sondas) Affymetrix Hugene FL (5.600) cDNA (22.000 clones) cDNA (31.500 clones) Classificação diagnóstica; classificação prognóstica; correlação com citogenética Classificação diagnóstica; identificação de marcadores imunohistoquímicos Classificação diagnóstica; identificação de marcadores imunohistoquímicos Classificação diagnóstica; identificação de marcadores imunohistoquímicos Classificação diagnóstica, inferência de anormalidades citogenéticas Discriminação de CCR de rim não-neoplásico Classificação diagnóstica; identificação de marcadores imunohistoquímicos Classificação diagnóstica; classificação prognóstica; identificação de marcadores imunohistoquímicos Discriminação entre CCR e rim não-neoplásico; comparação com perfis de expressão de outros estudos Identificação de TGF-β aberrante como envolvido na carcinogênese e progressão do CCR Classificação diagnóstica; identificação de marcadores imunohistoquímicos Classificação prognóstica Classificação diagnóstica; identificação de marcadores imunohistoquímicos Padrão de expressão para diferenciar CCR de rim nãoneoplásico e de outros tecidos Classificação diagnóstica; discriminação entre CCR de rim não-neoplásico Classificação prognóstica Classificação diagnóstica; correlação com estágio do tumor CC-CCR: Carcinoma de célula renal (CCR) subtipo célula clara; P-CCR: CCR subtipo papilar; CM-CCR: CCR subtipo cromófobo; G-CCR: CCR granular; S-CCR: CCR subtipo sarcomatóide; ONC: 23 Oncocitoma; AML: Angiomiolipoma; CU: carcinoma urotelial; TW: tumor de Wilms; AM: adenoma metanéfrico. Tabela baseada em Yin-Goen et al., 2006. Boer et al. estudaram 32 CCRs primários e 5 metastáticos utilizando um chip de cDNA com 31.500 seqüências (21.875 transcritos distintos), das quais aproximadamente 30% representavam genes conhecidos, enquanto que o restante eram ESTs que não mapeavam em genes conhecidos (Boer et al. 2001). Nesse estudo, foram identificados 1.738 genes diferencialmente expressos entre tecido tumoral e normal adjacente. Muitos dos genes identificados com expresão aumentada em CCR estavam envolvidos em adesão celular e metabolismo de ácido nucléico. Por outro lado, genes que codificam proteínas de transporte e proteínas envolvidas em transporte de elétrons estavam com expressão diminuída. Em um estudo subseqüente, o mesmo grupo estudou um conjunto mais amplo de 112 CCRs, onde foram identificados 32 genes marcadores capazes de discriminar entre os carcinomas célula clara, papilar e cromófobo. Nesse estudo foi possível correlacionar as alterações de expressão gênica com anormalidades cariotípicas, presença de metástases e progressão do tumor (Sultmann et al. 2005). Outros investigadores exploraram a função geral de grupos de genes com expressão alterada e encontraram resultados semelhantes. Liou et al., utilizando microarrays de oligonucleotídeo Affymetrix, estudaram seis amostras de CCR célula clara em comparação a tecidos normais adjacentes (Liou et al. 2004). Estes investigadores observaram que genes de adesão celular tendiam a apresentar expressão aumentada, enquanto que os genes de transporte estavam diminuídos. Gieseg et al. estudaram oito rins normais em comparação a nove CCRs célula clara, dois carcinomas cromófobos, um carcinoma urotelial e um adenoma metanéfrico. Eles identificaram que o CCR célula clara apresenta expressão relativamente elevada de genes envolvidos em transdução de sinal, organização de matriz celular e adesão (Gieseg et al. 2002). Um estudo utilizando um array de 60.000 elementos comparou amostras de CCR célula 24 clara com rim norma, identificando 151 genes e 115 ESTs com nível de expressão em CCR quatro vezes maior do que no rim normal e 35 genes e 19 ESTs 10 vezes menos expressos em CCR em comparação ao rim normal (Skubitz et al. 2002). Jones e colaboradores compararam amostras de rim normal com CCR célula clara identificando como diferencialmente expressos em tumores genes que codificam especificamente para proteínas secretadas e receptores de superfície celular (Jones et al. 2005). O racional desta abordagem foi que proteínas secretadas representam potenciais candidatos a diagnóstico sérico, enquanto que os receptores poderiam ser potenciais alvos terapêuticos (Jones et al. 2005). Lenburg et al. utilizaram um chip Affymetrix com 45.000 seqüências para estudar 18 amostras de CCR, identificando por meio desta abordagem 1.234 genes diferencialmente expressos entre tecido tumoral e normal. A análise mostrou que os genes com expressão alterada em tumores estavam associados a hipoxia, angiogênese, fator de necrose de tumor, apoptose, interferon, resistência a medicamento e metástase (Lenburg et al. 2003). Embora esses trabalhos tenham revelado diversos genes e vias metabólicas associadas a malignidade dos tumors renais, o conhecimento gerado a partir de análises globais de expressão gênica não se traduziu até o momento no desenvolvimento de novas abordagens mais efetivas para o diagnóstico, prognóstico ou tratamento do CCR. 1.5 Metilação e Câncer No genoma de mamíferos, a metilação do DNA é escassa e ocorre apenas em bases de citosina localizadas a 5’ de uma guanosina num dinucleotídeo CpG e resulta da atividade de uma família de enzimas DNA metiltransferases (DNMT 1, 3a ou 3b) que catalisam a adição de um grupo metila da S-adenosilmetionina (SAM) para o carbono 5 25 da citosina em dinucleotídeos CpG (Bird 2002). Este dinucleotídeo está subrepresentado no genoma, porém regiões curtas de até 4 kb, conhecidas como ilhas CpG, são ricas em conteúdo CpG (Bird 2002; Takai et al. 2002). Em eucariotos superiores, a maior parte das ilhas CpG se localiza na vizinhança de regiões promotoras, próximas ao início de transcrição. Cerca de metade dos genes de mamíferos apresentam ilhas CpG nas regiões promotoras, que geralmente encontram-se não-metiladas em células normais. A hipermetilação de ilhas CpG em promotores é a alteração epigenética mais bem caracterizada em neoplasias e é encontrada em virtualmente todos os tipos de câncer, estando associada ao silenciamento transcricional inadequado de genes (Jones et al. 1999; Baylin et al. 2000). O silenciamento da expressão gênica causado por hipermetilação da região promotora é tão comum em tumores quanto a inativação clássica de genes supressores de tumor por meio de mutação. De fato, quase 50% dos genes que causam formas hereditárias de câncer quando mutados em células germinativas, apresentam também silenciamento mediado por metilação em várias formas esporádicas de câncer (Jones et al. 2007). Existem vários métodos para detecção de alterações do padrão de metilação em ilhas CpG, sendo que a maioria dessas técnicas utiliza tratamento com bissulfito de sódio para detecção do estado de metilação do DNA (Grunau et al. 2001). O bissulfito de sódio induz a conversão de citosina não-metilada em uracila, a qual é convertida a timina em uma reação de PCR subsequente. A citosina metilada, 5-metilcitosina, é resistente ao tratamento com bissulfito e desse modo é amplificada no PCR como citosina. O status de metilação da região de interesse pode ser determinada através de seqüenciamento de DNA tratado com bissulfito. Para executá-lo, é necessário antes 26 amplificar uma determinada região da ilha CpG utilizando primers complementares ao DNA convertido por bissulfito (BSP −Bisulfite-Specific PCR) (Jeronimo et al. 2001). Alternativamente, o status de metilação de uma determinada região pode ser avaliado através da amplificação por PCR do DNA tratado com bissulfito utilizando pares de primers que discriminam citosinas metiladas e não-metiladas (MSP − Methylation-Specific PCR). Um esquema das técnicas de BSP e MSP é apresentado na Figura 1 a seguir. Figura 1 – Esquema da determinação do status de metilação de ilhas CpG utilizando as técnicas de BSP e MSP. Na análise de BSP (Bissulfite-Specific PCR), apenas o DNA tratado com bissulfito é amplificado, já que o par de primers diferencia citosina não convertida em uracila (U) da citosina convertida em U. Na análise por MSP (Methylation-Specific PCR), são utilizados dois pares de primers, um deles específico para citosina metilada, e o outro par, específico para citosina não-metilada. A obteção de produto indica o estado de metilação do DNA na região dos primers utilizados. Existe na literatura uma lista crescente de genes metilados em CCR, incluindo VHL, p16INK4A, APC, GSTP, DAPK, CDH1I, RASSFA1, DAL-1/4.1B, γcatenina, SPINT2 e HOXB13 (Breault et al. 2005; Morris et al. 2005; Okuda et al. 2006; Yamada et al. 2006). No entanto, a maioria desses genes supressores de tumor apresenta uma freqüência relativamente baixa de metilação em CCR. Diferente de outros 27 carcinomas, as freqüências de metilação anormal da maioria dos genes supressores de tumor clássicos, como VHL, p16, APC, GSTP, ARF, DAPK, CHFR, MLH1 e CDH1 são menores que 30% em CCR (Herman et al. 1994; Sanz-Casla et al. 2003; Dulaimi et al. 2004; Okuda et al. 2006) sugerindo que esses genes não são provavelmente os alvos principais para silenciamento por metilação nesse câncer. Assim, são necessários mais estudos para identificar potenciais biomarcadores epigenéticos com um perfil de metilação mais robusto para uso em diagnóstico ou prognóstico de CCR. Neste trabalho foi investigado o padrão de metilação de genes com expressão diminuída em CCR com o objetivo de avaliar a frequência de alterações epigenéticas do tipo hipermetilação da região promotora em tumores renais. 1.6 RNAs intrônicos não-codificadores A transcrição de RNA é a primeira etapa na transferência de informações codificadas num genoma a fim de produzir as características fenotípicas de um organismo. Até recentemente, o esforço de caracterização da atividade transcricional nas células foram desenvolvidos no sentido de caracterizar a abundância e/ou variações na sequência (polimorfismos, splicing alternativo) de transcritos codificadores para proteínas. Estudos recentes têm demonstrado que a maior parte do genoma humano é transcrito na forma de RNAs, embora apenas uma pequena fração (2 a 5% do total) corresponda a regiões exônicas de genes codificadores para proteína (Shoemaker et al. 2001; Kapranov et al. 2002; Bertone et al. 2004; Cheng et al. 2005). Esses estudos são principalmente baseados na utilização de tiling arrays genômicos, onde sondas são colocadas em intervalos regulares ao longo de todo o genoma ou de uma região de interesse, independente de anotação ou evidência anterior de transcrição (Shoemaker et 28 al. 2001; Kapranov et al. 2002; Bertone et al. 2004). Utilizando tilling arrays cobrindo a seqüência genômica dos cromossomos 21 e 22, foi possível observar um número de regiões transcricionalmente ativas entre 2 a 10 vezes maior do que o esperado para regiões exônicas dos genes humanos conhecidos (Kapranov et al. 2002; Rinn et al. 2003; Kampa et al. 2004). Um estudo recente realizado por nosso grupo, analisando o conjunto de seqüências expressas no Genebank, identificou que 74% dos genes humanos apresentam evidência de transcrição intrônica (Nakaya et al. 2007). Um oligoarray com 44 mil elementos contendo sondas para um conjunto de transcritos intrônicos selecionados aleatoriamente foi hibridizado com 3 tecidos humanos diferentes e revelou que esses transcritos são expressos com orientação senso ou antisenso em frações equivalentes (Nakaya et al. 2007). Interessantemente, os ncRNAs intrônicos mais abundantes mapeiam em genes codificandores para proteína que têm função relacionada com a regulação da transcrição (Nakaya et al. 2007). A análise dos dados identificou ainda conjutos de ncRNAs totalmente ou parcialmente intrônicos com expressão tecidoespecífica, alguns dos quais apresentam padrão de expressão correlacionado (diretamente ou inversamente) com o do transcrito codificante para proteína correspondente (Nakaya et al. 2007). Mais recentemente, o projeto ENCODE se propôs catalogar todos os elementos funcionais do genoma humano utilizando vários métodos de análise em larga-escala, começando por coletar e analisar dados em 1% do genoma (~ 300 Mb) na fase piloto do projeto. Um aspecto importante do projeto ENCODE é que estão sendo utilizadas técnicas diferentes para se abordar a mesma questão, combinando microarrays de DNA e técnicas de seqüenciamento com análises computacionais. Os primeiros resultados 29 obtidos nesse estudo colaborativo confirmam as observações anteriores de que uma parte muito maior do que se acreditava do DNA genômico é transcrita na forma de RNAs não-codificadores para proteínas (ncRNAs) (Birney et al. 2007). Embora ainda seja desconhecida a função da maior parte dos ncRNAs, estudos em outros organismos têm demonstrado que em mamíferos o número de RNAs não-codificadores é substancialmente maior que em eucariotos inferiores, especialmente quando se considera que o número de genes codificadores para proteínas não diverge significativamente entre espécies muito distantes em termos evolutivos. Essa observação tem sido utilizada como argumento para explicar o aumento da complexidade dos eucariotos superiores a partir da expansão do número de ncRNAs nesses organismos, que constituiriam uma camada adicional de elementos controladores da expressão gênica (Mattick 2003; Mattick 2004). Alguns ncRNAs podem produzir silenciamento transcricional através da regulação da estrutura da cromatina. O exemplo mais clássico dessa regulação em eucariotos é a inativação transcricional do segundo cromossomo X em fêmeas (compensação de dose). Isto envolve um ncRNA muito grande, conhecido como Xinactive-specific transcript (Xist). A transcrição de Xist no cromossomo X é crucial para manutenção do estado inativo, porém seu mecanismo exato não é bem esclarecido (Goodrich et al. 2006). Recentemente, foi mostrado que ncRNAs curtos, além de ter por alvo a estrutura de cromatina, onde atuam para silenciar a expressão gênica, eles também direcionam a degradação de RNA e bloqueiam a tradução. Os ncRNAs envolvidos apresentam tipicamente 21-28 nucleotídeos de comprimento, e são coletivamente conhecidos como microRNAs (miRNAs) e RNAs curtos de interferência (siRNAs), cujo funcionamento se dá por meio de seqüências homólogas em genes alvos (Almeida et al. 2005). O silencimento mediado por RNA foi inicialmente caracterizado 30 em Arabidopsis thaliana, e mais recentemente foi também identificado em células humanas, mostrando que este mecanismo de controle de transcrição é conservado (Almeida et al. 2005). No caso dos siRNAs, a transcrição é bloqueada quando eles, como parte integrante de um grande complexo protéico, são direcionados para seqüências homólogas em genes. Isto resulta no recrutamento de fatores, como a DNA metiltransferase e a histona metiltransferase que metilam DNA e histonas, respectivamente, resultando no silenciamento da transcrição a partir de regiões-alvo do genoma. Os siRNAs podem portanto direcionar a regulação gene-específica de modificações da cromatina, e assim controlar a transcrição (Almeida et al. 2005). Análises informáticas dos bancos de dados de seqüências expressas (Yelin et al. 2003) e experimentos de tiling arrays (Kapranov et al. 2005) revelaram que uma fração significativa dos RNAs transcritos no genoma humano formam pares senso-antisenso. A maioria desses transcritos antisenso é codificada em cis, ou seja, são transcritos a partir da fita oposta do mesmo loci genômico a partir de seus pares senso. Resultados semelhantes foram observados a partir da análise do transcriptoma de camundongo, sugerindo que a transcrição de pares senso-antisenso tenha uma função biológica relevante e que por isso tenha sido mantida ao longo da evolução (Kiyosawa et al. 2003; Katayama et al. 2005; Siddiqui et al. 2005). A regulação por transcritos antisenso parece estar envolvida em muitos aspectos da regulação gênica, incluindo regulação da tradução, imprinting genômico, interferência de RNA, splicing alternativo, inativação do cromossomo X, edição de RNA e silenciamento da heterocromatina (revisados em (Lavorgna et al. 2004)), além de estados patológicos como câncer (Lavorgna et al. 2004; Reis et al. 2004) ou doenças neurológicas (Korostishevsky et al. 2004; Korneev et al. 2005). Estudos recentes têm 31 sugerido que a regulação antisenso é provavelmente um mecanismo de regulação gênica bastante comum em humanos, podendo atuar de modo positivo ou negativo (Chen et al. 2005; Chen et al. 2005). No entanto, os aspectos funcionais dessa regulação não estão bem estabelecidos, de modo que a identificação de pares senso-antisenso regulados em diferentes contextos pode lançar luz sobre os mecanismos subjacentes a esses processos. 1.7 Papel dos RNAs não-codificadores no câncer O câncer tem sido considerado há quase três décadas como uma doença resultante de mutações que afetam a expressão ou a estrutura de ongenes e/ou genes supressores de tumor codificadores de proteína. No entanto, com a identificação de genes que produzem RNAs sem uma ORF significativa, tornou-se evidente que a complexidade do câncer não poderia mais ser abordada exclusivamente através da porção do genoma que codifica para proteínas. Dessa mudança de paradigma, resultou a percepção de que transcritos não-codificadores poderiam auxiliar no diagnóstico e prognóstico do câncer. Por exemplo, as alterações no nível de expressão dos microRNAs (miRNAs) - pequenos RNAs não-codificadores de 20-22 nucleotídeos envolvidos em processos biológicos importantes, incluindo desenvolvimento, diferenciação, apoptose e proliferação - foram identificadas inicialmente em leucemia linfocítica crônica de célula B (Calin et al. 2002). O mecanismo de ação de microRNAs no silenciamento da expressão gênica já é bastante conhecido atualmente, e envolve a regulação transcricional e/ou pós-transcricional de mRNAs-alvo dependente de pareamento entre o miRNA e o mRNA–alvo e ativação de sistemas enzimáticos específicos (Bartel 2004). Alterações nos níveis de miRNAs foram posteriormente detectadas por vários grupos em diferentes tipos de tumores humanos (Calin et al. 2004; 32 Iorio et al. 2005; Lu et al. 2005; Volinia et al. 2006). O potencial uso de microRNAs na clínica é evidenciado pelo trabalho de Lu e colaboradores, que utilizaram o perfil de expressão de miRNAs para classificar corretamente 12 de 17 carcinomas maldiferenciados, enquanto que um método baseado em apenas mRNAs classificou corretamente somente um desses carcinomas (Lu et al. 2005). Utilizando um microarray de DNA inovador, enriquecido em fragmentos de seqüências expressas em íntrons de genes conhecidos e em regiões intergênicas, nosso grupo mostrou pela primeria vez que ncRNAs intrônicos longos, sem splicing, apresentam transcrição ubíqua no tecido prostático humano, e que os níveis de expressão de um subconjunto desses ncRNAs intrônicos se correlacionam com o grau de malignidade de tumores de próstata (Reis et al. 2004). Mais recentemente, nosso grupo também mostrou que ncRNAs intrônicos regulados por andrógeno podem modular, provavelmente agindo em cis, a abundância ou o padrão de uso de éxon em uma linhagem celular de tumor próstata em cultura (Louro et al. 2007). Uma característica comum a todos os trabalhos de análise da expressão gênica em CCR baseados em microarrays de DNA é que as plataformas utilizadas estavam enriquecidas em sondas para transcritos codificadores de proteínas. Neste estudo, pretendemos extender a caracterização da expressão de ncRNAs intrônicos a amostras de CCR de modo a avaliar um possível papel dessa classe de transcritos nos processos de transformação maligna de tumores renais. Além de contribuir para o entendimento das bases moleculares do CCR, esse estudo também pretende colaborar para a identificação de novos marcadores tumorais, incluindo ncRNAs intrônicos, com potencial aplicação no diagnóstico e/ou tratamento da doença. 33 2. OBJETIVOS 2.1 Objetivos Gerais • Analisar perfis de expressão gênica em amostras clínicas de tecido renal para determinar o padrão de expressão de RNAs intrônicos não-codificadores. • Identificar novos candidatos a marcadores moleculares para diagnóstico ou alvos para tratamento de CCR. 2.2 • Objetivos Específicos Obter perfis de expressão gênica de uma coleção de amostras de carcinoma de célula renal e tecido não-tumoral adjacente utilizando microarrays de DNA contendo sondas para RNAs não-codificadores intrônicos e transcritos codificadores para proteína. • Identificar genes diferencialmente expressos entre o tecido tumoral e não-tumoral adjacente em amostras de CCR subtipo histológico célula clara. • Validar a expressão de transcritos com expressão alterada em CCR por metodologia independente (RT-PCR quantitativo). • Avaliar o padrão de metilação da região promotora de genes com expressão diminuída em CCR. 34 3. MATERIAIS E MÉTODOS 3.1 Amostras de pacientes Foram analisados perfis de expressão gênica de 24 amostras pareadas de tumor e tecido não-tumoral adjacente de 12 pacientes com CCR submetidos a nefrectomia radical no Instituto Nacional de Câncer − INCA (Rio de Janeiro, Brasil). Nos experimentos de validação por qRT-PCR, foram analisadas 10 amostras adicionais de tecido tumoral/não-tumoral adjacente pareadas, obtidas de 5 pacientes com CCR. As amostras de tecido fresco foram obtidas de pacientes submetidos a nefrectomia radical, sendo congeladas em nitrogênio líquido até cerca de 15 minutos após a ressecção cirúrgica e mantidas nessa condição até o processamento para extração do RNA. Todos os pacientes assinaram termo de consentimento informado autorizando a utilização das amostras para este projeto de pesquisa, também aprovado pelo Comitê de Ética do INCA. Posteriormente, todas os fragmentos de tecido foram revisados e classificados por um mesmo patologista de acordo com a “WHO Histological Classification of Tumors of the Kidney” (Eble et al. 2004) e diagnosticadas como CCR célula clara (10 amostras de tumor), CCR papilar (4 amostras de tumor), CCR cromófobo (1 amostra), 1 CCR célula clara com extensa diferenciação sarcomatóide e 1 CCR com origem não determinada. O grau Fuhrman das amostras variou de II a IV. A maior parte dos tumores apresentou evidência de necrose (76%) e tamanho maior que 5 cm (82%). O estado clínico da doença se mostrou heterogêneo entre os pacientes: seis apresentaram metástase, três apresentaram doença localmente avançada e quatro apresentaram tumores localizados. A análise de seções coradas de tecido utilizando 35 hematoxilina/eosina (HE) mostrou que o estroma estava pouco desenvolvido entre todas as amostras analisadas. Os fragmentos de tecido não-tumoral adjacente foram analisados por HE para verificar a ausência de células neoplásicas. Os dados anatomopatológicos das amostras de tumor analisadas estão apresentados na Tabela 2. Tabela 2 – Dados clínico-patológicos dos pacientes cujas amostras foram utilizadas nas análises de microarray, metilação e qRT-PCR. Paciente n° Grau Subtipo Nuclear Histológico Fuhrman 3 IV célula clara Dimensões do Tumor Primário (cm) 6x7x4 5 II/IV célula clara 8x8x5 Sim pT2N1M1 6 metastático 9 II célula clara 8x6 Sim pT3aN0Mx 54 localmente avançado 12 II célula clara 4x3x2 Não pT1aN0Mx n.a.* localizado 15 IV célula clara 10 x 10 x 8 Sim T3N2Mx n.a. n.a. 24 IV célula clara 15 x 11 x 7 Sim pT3aN0Mx 16 metastático 26 II célula clara 7x6x5 Não T3aNXM0 58 localizado 28 III célula clara 5x3x3 Sim pT1bN0Mx 20 localizado 31 II célula clara 8x6 Sim pT3bN2M1 40 metastático 32 II célula clara 13 x 8 Não pT3aN0Mx 17 localmente avançado 27 III cromófobo 7x6x3 Não pT2N0Mx 68 localizado 4 III/IV papilar 16 x 11 x 8 Sim pT3aN0Mx n.a. n.a. 14 IV papilar 8x7x6 Sim pT3bN0M0 58 localmente avançado 16 III papilar 16 x 12 Sim pT3aN2Mx n.a. n.a. 19 III papilar 8x7 Sim pT3aN0Mx 49 n.a. 23 IV sarcomatóide 9 x 7 (célula clara) Sim pT3bN0Mx n.a. metastático 22 II CCR nãoclassificado Sim pT3aN0Mx 7 metastático n.a.: informação não disponível. 15 x 10 x 9 Evidência Estádio de Clínico Necrose Acompanhamento Estadio da (mêses) Doença Sim pT3bN0M1 21 metastático 36 3.2 Extração de RNA e marcação de alvos fluorescentes Para isolamento do RNA total, cerca de 200 mg de tecido das amostras congeladas foram pulverizados em um almofariz contendo nitrogênio líquido, ressuspendidos no reagente TRIZOL (Invitrogen), seguido por extração com clorofórmio e precipitação com álcool de acordo com as instruções do fabricante. Alíquotas de RNA total extraído de cada amostra foram separadas em gel de agarose para avaliação da integridade do RNA, medida pela observação de bandas intactas correspondentes às subunidades 28S e 18S do RNA ribossomal. A quantidade de RNA nas frações foi estimada pela leitura da absorbância a 260 nm. O grau de pureza das prepações de RNA em relação a contaminantes protéicos foi avaliada pela leitura e cálculo da razão 260/280 nm. Foi definido como critério de qualidade que todas as amostras utilizadas nas análises de microarray deveriam apresentar razão 260/280 > 1,8 e, por inspeção visual, as bandas 28S e 18S deveriam apresentar razão igual ou superior a 1. A marcação fluorescente das amostras de RNA para obtenção de alvos para hibridização foi realizada através de reação de transcrição reversa, com a utilização de primers randômicos e oligo-dT, além de análogos fluorescentes de dCTP, utilizando o kit CyScribe first-strand cDNA labeling kit (GE Healthcare), de acordo com o protocolo do fabricante. Esta marcação foi realizada com o uso da química Cy3 ou Cy5 de modo a obter duas populações diferentes de cDNAs marcados, o que permitiu realizar comparações diretas, na mesma lâmina, entre as duas amostras em estudo (RNA de tecido tumoral ou não-tumoral adjacente do mesmo paciente). Em cada marcação foram utilizados 10 μg de RNA total. Os cDNAs marcados foram purificados utilizando placas de filtro (Millipore), transferidos para cubetas de quartzo e quantificados medindo-se a 37 absorbância da solução a 550 nm (Cy3) ou 650 nm (Cy5). Antes da hibridização, os alvos de cDNA marcados com Cy3 ou Cy5 foram combinados e evaporados num speedvac a 30ºC. Imediatamente antes da hibridização com os microarrays, os alvos de cDNA foram ressuspensos num volume total de 300 µl de solução de hibridização (Microarray hybridization Buffer v.2 – Amersham Biosciences) em formamida 50% e incubados a 92ºC por 2 minutos para desnaturação do cDNA. 3.3 Hibridização de alvos fluorescentes com microarrays enriquecidos em ncRNAs intrônicos As sondas de cDNA depositadas no microarray foram selecionadas a partir de uma coleção de 1 milhão de clones de ESTs gerados durante o Human Cancer Genome Project, uma iniciativa de seqüenciamento em larga escala de ESTs que utilizou bibliotecas de cDNA geradas a partir de mRNA com poli(A) derivado de 20 tipos diferentes de tumores (Dias-Neto et al. 2000; Camargo et al. 2001). Após análise bioinformática do conjunto de ESTs relacionadas com câncer, nosso grupo observou que quase 30% das seqüências transcritas mapeavam em regiões intrônicas ou nãoanotadas do genoma humano (Reis et al. 2004). Com base na evidência de transcrição em pelo menos 2 bibliotecas de cDNA diferentes, um subconjunto de aproximadamente 4.000 sondas de cDNA foi selecionado em nosso grupo para amplificação e deposição em lâminas de vidro Tipo 7 STAR utilizando o robô Generation III Microarray Spotter (GE Healthcare, Piscataway, NJ, EUA), como descrito em Reis et al. 2004. As sondas selecionadas incluíam 2.292 ESTs representando exons codificadores para proteínas já relacionados com câncer identificados a partir de buscas nos bancos de dados Entrez, OMIM e CGAP, com funções relacionadas a apoptose, carcinogênese, metástase, 38 metabolismo e progressão do câncer. Foi incluído no microarray um conjunto de clones sem similaridade com genes conhecidos amostrados aleatoriamente, dos quais 822 foram posteriormente mapeados em regiões intrônicas de genes codificadores, e 241 em regiões intergênicas do genoma. O tamanho médio das sondas de cDNA depositadas é de 600 pb. A incubação das lâminas de microarray com os alvos marcados e todas as etapas de lavagem foram realizadas em um processador automático de lâminas (ASP − GE HealthCare) a 42oC por 16 horas. Em cada hibridização foram comparadas amostras de RNA de tumor e tecido não-tumoral adjacente (margem livre de tumor) do mesmo paciente marcadas com Cy5 ou Cy3, respectivamente. Todas as hibridizações foram feitas em duplicata, sendo que na réplica foi feita a troca do fluoróforo entre o RNA de tumor e tecido normal adjacente (dye-swap), a fim de controlar possíveis artefatos resultantes da incorporação preferencial de um dos análogos fluorescentes de dCTP no resultado dos experimentos (Figura 2). Como cada microarray contem duas réplicas para cada sonda foram geradas 4 réplicas das medidas de intensidade de transcrito, para cada amostra analisada. Figura 2 – Desenho esquemático das hibridizações realizadas. Amostras de tumor (TUMOR) e de tecido não-tumoral adjacente (NORMAL) provenientes de cada paciente foram marcadas com fluoróforos distintos (Cy 3 ou Cy5) e hibridizadas na mesma lâmina (Réplica A). Foi realizada também uma segunda hibridização em outra lâmina (Réplica B) onde os fluoróforos foram invertidos (“dye-swap”). Cada lâmina possui 2 cópias de todos os cDNAs depositados (“spots”). Portanto, no total foram obtidas 4 réplicas técnicas da expressão de cada gene, para cada tecido tumoral e não-tumoral analisado. 39 3.4 Filtragem e normalização dos dados de expressão gênica Após a hibridização, as imagens do array foram obtidas usando o Generation III Array Scanner (Molecular Dynamics) e visualizadas com o programa ImageQuant (Molecular Dynamics). Um exemplo de imagem obtida é apresentado na Figura 3. Figura 3 – Imagem representativa das hibridizações de CCR com microarray enriquecido em RNAs não-codificadores. Lâmina do paciente P9, típica de uma hibridização de tecido tumoral de rim (marcado com Cy3) contra tecido normal adjacente (marcado com Cy5). Na figura é apresentado apenas o lado direito da lâmina. As intensidades de fluorescência de Cy3 e Cy5 de cada sonda no array foram extraídas usando o software ArrayVision (Imaging Research Inc.). Para cada lâmina, as intensidades de Cy3 e Cy5, subtraídas do ruído (background), foram normalizadas para remover efeitos dependentes do canal, assim como a incorporação diferencial de 40 fluoróforos pela transcriptase revesa (Quackenbush 2002) usando o algoritmo LOWESS escrito em R (http://www.r-project.org/). A correção por LOWESS utiliza uma função de regressão ponderada dentro de cada intervalo pré-definido a partir da abscissa do gráfico da razão versus intensidade, R x I , onde R = log2(Cy5 / Cy3), e I = 0,5 * log2(Cy5 * Cy3), de modo a detectar desvios sistemáticos e corrigí-los usando aquela função de regressão (Quackenbush 2002) (Figura 4). Figura 4 - Normalização dos dados de expressão. A) O gráfico R-I (R = log2(Cy5/Cy3) e I = 0,5*log2 (Cy5*Cy3)) apresenta o logaritmo (base 2) da razão (Cy5/Cy3) para cada gene no chip como uma função do produto das intensidades (I), revelando assim efeitos sistemáticos dependentes da intensidade. B) O uso de LOWESS para corrigir a variação sistemática observada no painel A): LOWESS calcula uma função (linha vermelha, painel A) que melhor descreve os dados apresentados no gráfico e ajusta os mesmos para razão local média igual a 1 (igual a zero na escala logarítmica) com base naquela função. As intensidades normalizadas por LOWESS foram então processadas no software ArrayStat (Imaging Research Inc.) para detecção e eliminação de valores espúrios de baixa qualidade, utilizando um modêlo de distribuição de erro estimado a partir de todas as réplicas de todas as sondas analisadas (Figura 5). Primeiro, o programa centraliza os dados de intensidade das 4 réplicas de cada sonda. Em seguida, 41 foram eliminadas as sondas com menos de 3 entre 4 réplicas com menos de 3 desvios absolutos da mediana (MADs), sendo calculada a média das sondas restantes. Para cada amostra, foi calculada a média trimada excluindo os valores 20% menores e os 20% maiores. Média esta que em seguida foi usada para normalizar os dados entre os experimentos e torná-los comparáveis (Spotfire Decision Site, Spotfire Inc.). Figura 5 – Dependência entre a intensidade média e o desvio-padrão das réplicas. A linha azul indica a função de regressão dos dados plotados entre a intensidade média (eixo X, “Mean”) e o desvio-padrão das réplicas (eixo Y, “Standard Deviation”). Para cada faixa de intensidade, o programa ArrayStat exclui como “outliers” as réplicas que apresentam valor maior que 3 desvios absolutos da mediana (MAD). 3.5 Identificação de transcritos diferencialmente expressos em CCR A fim de garantir maior confiabilidade aos resultados obtidos, foram utilizados dois programas estatísticos com a finalidade de identificar transcritos diferencialmente expressos entre as amotras de tumor e de tecido normal, Significance Analysis of Microarrays (SAM) (Tusher et al. 2001) e teste-Z (Nadon et al. 2002). Cada um desses programas foi executado com base nos mesmos dados de expressão, sendo os resultados comparados entre si a fim de identificar e selecionar para análises subsequentes apenas 42 os transcritos identificados em ambas as análises. Acreditamos que este procedimento é bastante estringente pois considera como válidos apenas os resultados que satisfizeram dois critérios baseados em métodos diferentes de estimativa estatística, o que diminui a probabilidade de falso-positivos (erro Tipo I). No anexo I é apresentada uma descrição detalhada de cada uma das abordagens estatísticas utilizadas para seleção de transcritos diferencialmente expressos em CCR. 3.6 PCR em Tempo Real Os níveis de expressão dos selecionados foram medidos em amostras de CCR e tecido não-tumoral adjacente por RT-PCR quantitativo. Para evitar contaminação com DNA genômico, alíquotas de RNA total (2 μg) foram tratadas com 1 unidade de DNAse RQ1 sem RNAse (Promega) por 30 minutos a 37ºC num volume de 15μl na presença de 20 unidades de inibidor de ribonuclease RNasin (Promega). Para os transcritos exônicos, foram usados 2 μg de RNA total para gerar cDNA em reações de 20 μl contendo 1 unidade de Superscript III (Invitrogen) e primers oligo-dT. Para os transcritos intrônicos, o RNA total tratado com DNAse (~600 ng), obtido com o kit de purificação RNAeasy (Qiagen), foi linearmente amplificado para produzir RNA complementar (cRNA) (Adams et al. 2000; Wang et al. 2000). Em torno de 600 ng de cRNA foram subseqüentemente usados como "template" em reações de transcrição reversa usando como iniciadores primers de 9 oligonucleotídeos aleatórios. Para quantificação relativa da abundância dos transcritos exônicos e intrônicos nas amostras de tumor e tecido não-tunoral adjacente foram utilizados 2,5 μl do cDNA obtido por transcrição reversa como "template" em reações de PCR em tempo real (20 μl de volume total) num equipamento GeneAmp 5700 (Applied Biosystems) usando o 43 kit SYBR Green PCR e seguindo as instruções do fabricante (Applied Biosystems). Para cada amostra, como controle negativo foi feita uma reação paralela sem adição de transcriptase reversa para verificar a ausência de contaminação genômica. Os primers usados no PCR em tempo real estão apresentados na Tabela 3. Tabela 3- Primers usados para PCR em tempo real. Locus gênico Mapeamento em Éxon/íntron SND1 íntron F: CTTCGTAATTCGTGCCTTATCAGA R: GGAGTGAATAGGAAAGCAAGCAA HDAC5 íntron F: GCCTGTGCTTCCTGTTTGC R: TCTCCCACCAGCCTGTCACT ACTN4 íntron F: AGGAGTCAGGGACTGACCTCTGT R: CATGCTGCGGGACACACA NIBP íntron F: TGATTGGTCTGTGCTGTCTTTCA R: GCCTTCACATCACAGCTCAGAA SYNJ2BP éxon F: TGGATCCA GCTATTTGGTTTGA R: CCAAGTATGTAACCAACAATAGAAGAAGTAG SIN3B éxon F: CTCGATCTCGTTGAGCAAGCT R: AGGCTGTGAACTTCAAGCAGAAC TRIP3 éxon F: AATAGTGATGAGGAAGAAGACAGAGTTTC R: ACCATCAACTGCCTGAGGTGT MYH11 éxon F: GACCTGGTCAGCTCCAAGGAT R: GCTGCGTCTTCATCTCCTCC NDE1 éxon F: CAGCAAGAACAGAGATGGCG R: GACCTGGTTGTT GATTTGGACA Seqüência F: seqüência direta; R: seqüência reversa. Para a quantificação relativa dos transcritos nas várias amostras, os níveis de cada transcrito detectado por PCR quantitativo em tempo real foram normalizados tomando como referência o nível do gene estrutural β-tubulina, e representado como variação usando o método ΔCt (Pfaffl 2001). Para cada par de amostras pareadas, os níveis de transcrito na amostra de tumor foram expressos na amostra de tumor como 44 variação relativa ao valor no tecido não-tumoral adjacente, o qual foi considerado como sendo igual à unidade. 3.7 Análise de Metilação O programa MethPrimer (Amin et al. 2002) foi utilizado para identificar as ilhas CpG em trechos de 1.000 nucleotídeos flanqueando cada lado do sítio de início de transcrição dos genes selecionados (parâmetros: extensão da janela ≥ 200 nt, %GC ≥ 55, CpG obervado/CpG esperado ≥ 0,65), e para desenhar primers para amplificação por PCR de ilhas CpG identificadas usando DNA modificado por bissulfito. Os critérios para seleção dos primers utilizados para amplificação e seqüenciamento das ilhas CpG identificadas dos genes foram basicamente os mesmos critérios utilizados para seleção de primers num PCR convencional: evitar formação de self-annealing e complementaridade entre os primers forward e reverse, conteúdo GC e temperatura de desnaturação (Tm). O programa leva em consideração que no caso de uma seqüência tratada com bissulfito, todas as citosinas não-metiladas são transformadas em uracilas, que por sua vez são transformadas em timina na reação de PCR. Em virtude desse tratamento, que resulta no aumento do número de timinas, o programa restringe o número de repetições consecutivas de bases “T” a no máximo oito, enquanto que para os outros nucleotídeos o padrão é cinco. Além disso, como a modificação por bissulfito nem sempre é completa, é importante a amplificação seletiva apenas de seqüência totalmente tratada. Para tanto, é necessário desenhar os primers a partir de uma região com número suficiente de citosinas não-CpG na seqüência original não-tratada. 45 Os primers usados para amplificação de fragmentos de DNA modificado por bissulfito estão apresentados na Tabela 4. Tabela 4 - Primers usados em BSP Temperatura de Anelamento (°C) Tamanho do amplicon (pb) SIN3B (1A) F: GAAAGTAGGTAGAGAAGTTAGGTAAA R: ATACTCTTTAAAAAACTCTTCTAAAAACCT 55 284 NDE1 51 212 SIN3B (1B) F: AATTATTAATTATGATATTAATTTTAAGGA R: AAATCCAAAAAATAAATTCCCC 55 331 SIN3B (2) F: GGGGAATTTATTTTTTGGATTT R: AAATACTACCCATTTCCATTTTTATTAC 57 507 SYNJ2BP F: TTATTTTATGTTTGGTTTTGGGAAT R: ACCCTCTAATAAAATTAATCTCTTCCTC 65 287 TRIP3 F: TTTTGTTAAGAATAAGTAGATGAGATGG R: TTAAACTTCTCCAAACAAATCAC 55 500 51 441 Gene GPX3 Seqüência F: GTAGAGTAGTAGTTAATGGGAGG R: AACAAAAAAACTTTTCAACC F: TGTTTAGATTTGTTTATGTTATTGT R: CCTAAAAATTACCCATCTAAC F: seqüência direta; R: seqüência reversa. O perfil de metilação das regiões promotoras preditas dos genes selecionados como sub-expressos em CCR (SIN3B, NDE1, SYNJ2BP, GPX3 e TRIP3) foi avaliado em amostras pareadas (tecido tumoral e não-tumoral adjacente) de 4 pacientes com CCR (P9, P15, P27 e P32). O DNA foi isolado e submetido a tratamento com bissulfito basicamente como descrito em (Jeronimo et al. 2001). Este tratamento converte as citosinas não-metiladas em uracila, que é então convertida em timidina durante a etapa de PCR subseqüente, resultando em diferenças entre DNA metilado e não-metilado, que são por conseguinte analizados por seqüenciamento dideoxi. Inicialmente, 2 μg de DNA genômico foram desnaturados em 500 μL de solução bissulfito (1,4 ml NaOH 3 M + 500 μL hidroquinona 1 M + 5 mL bissulfito 3 M) por 3 horas a 70°C. Em seguida, o 46 DNA modificado por bissulfito foi purificado usando Wizard™ DNA Cleanup System (Promega) seguido por precipitação em etanol. O PCR foi realizaod em 25 μL de volume total contendo 2 μL de DNA modificado por bissulfito, 2,5 μL de tampão PCR, 2,0 μL de deoxinucleotídeo trifosfatos 2,5 mM, 0,5 μL de cada solução 20 μM de cada primer e 0,2 μL Platinum® Taq DNA Polymerase (Invitrogen). O PCR foi realizado em 40 ciclos como segue: 95°C por 1 minuto, 95°C por 30 segundos, anelamento a 52-65°C por 45 segundos, 68°C por 45 segundos e uma extensão final a 68°C por 1 minuto. Para cada amostra testada, o DNA não-tratado foi testado em paralelo como controle negativo no ensaio. Os produtos de PCR foram separados em gel de agarose 1%, corado com brometo de etídio e visualizado sob luz UV. Os produtos de PCR foram purificados e seqüenciados pelo método dideoxi usando um seqüenciador ABI Prism 3700 DNA de modo direto (GPX3) ou após clonagem no vetor de seqüenciamento pGEM T-Easy (Promega) (SIN3B, NDE1, SYNJ2BP, TRIP3). Foram gerados cinco a doze leituras (reads) para cada produto gênico seqüenciado, para cada amostra. Caso não fosse detectada evidência de metilação de CpG nas primeiras duas amostras tumorais analisadas, o gene foi considerado como não regulado por metilação e nenhum seqüenciamento adicional foi realizado. 47 4. RESULTADOS 4.1 Avaliação da qualidade das hibridizações realizadas A precisão das medidas de expressão é dada por altos coeficientes de correlação entre as réplicas técnicas no mesmo slide (intra-slide) ou numa hibridização diferente (inter-slide) após a normalização. A correlação média das réplicas intra-slide das 24 amostras hibridizadas foi de 0,98 + 0,03 e a média das correlações inter-slides foi de 0,82 + 0,12. Vale notar que foi também observada alta correlação média entre medidas de amostras diferentes, o que indica que os níveis de expressão da maior parte dos transcritos são relativamente constantes entre as amostras (correlação média de 0,79 + 0,12). A Figura 6 mostra os valores individuais de correlação entre as amostras. Podese observar que a maior parte das correlações com valores menores que 0,7 (células hachuradas em vermelho) foram melhoradas após a normalização por LOWESS. Figura 6 – Matriz de correlação das medidas de intensidade. A matriz apresenta o coeficiente de correlação de Pearson entre cada par de amostras utilizando os respectivos dados de intensidade. Foram considerados apenas os spots que apresentaram intensidade maior que o sinal do background. Em azul, as correlações maiores que 0,7, e em vermelho, aquelas menores que 0,7. São mostrados os valores antes da normalização (triângulo inferior) e após a normalização (triângulo superior). 48 As altas correlações médias observadas após normalização inter-slide foram independentes do estado patológico do tecido (tumor ou tecido normal adjacente), sendo a correlação média inter-slide das amostras igual a 0,84 + 0,06 e 0,84 + 0,05 para amostras de tumor e de tecido não-tumoral adjacente, respectivamente. Os valores de correlação observados são altos, especialmente para uma plataforma de cDNA espotado, e indicando uma elevada reprodutibilidade das medidas de expressão geradas. Essa análise indicou que os dados de expressão gênica de tecidos tumorais e não-tumorais dos 12 pacientes hibridizados apresentavam qualidade adequada para a as análises subsequentes. 4.2 Expressão de RNAs intrônicos em CCR A expressão dos ncRNAs representados no microarray foi avaliada nas 24 amostras isoladas de tumor ou tecido renal não-tumoral adjacente de 12 pacientes com CCR. Para serem consideradas expressas numa dada amostra, a intensidade da sonda tinha que exceder um limiar definido pela intensidade média mais três desvios-padrões de um conjunto de spots contendo DNA de planta, sem similaridade com sequências humanas, utilizados como controles de hibridização inespecífica nos experimentos (controles negativos de hibridização). Foi observado que uma fração comparável de transcritos intrônicos, intergênicos e exônicos são detectados nas amostras de rim com neoplasia ou não-tumorais, sendo que quase 80% das sondas em cada classe de transcritos (intrônicos, intergênicos e exônicos) estão expressas em pelo menos 5 amostras, independente da histologia da amostra analisada (tumor ou tecido não-tumoral adjacente) (Figura 7). 49 Figura 7 - Expressão de transcritos codificadores para proteínas, e ncRNAs intrônicos e intergênicos em tecido renal. As lâminas de microarray foram hibrizadas com 24 amostras pareadas de tumor e tecido não-tumoral adjacente. Para ser considerada como expressa, cada sonda teria que apresentar intensidade pelo menos 3 desvios absolutos da mediana acima do sinal mediano de ruído dos controles negativos. A percentagem de sondas expressas em cada uma das 3 classes de transcritos (exônicos, intrônicos ou intergênicos) se refere ao número mínimo de amostras de tumor ou tecido não-tumoral adjacente em que a expressão foi observada. O número total de sondas em cada classe é mostrado entre parênteses. Em seguida, foram avaliados os valores de intensidade média nas três classes de transcritos exônicos, intrônicos e intergênicos, expressos em pelo menos a metade das amostras, os quais apresentaram valores de intensidade média de 5,7, 4,7 e 3,2, respectivamente. Portanto, observamos uma intensidade média menor dos transcritos não-codificadores, sugerindo uma menor abundância desses transcritos no tecido renal em comparação aos transcritos codificadores para proteínas. 4.3 Identificação de genes diferencialmente expressos Para identificar genes alterados no subtipo histológico mais prevalente de CCR, o perfil de expressão de 6 amostras de CCR célula clara foi comparado de forma pareada com o de 6 amostras não-tumorais adjacentes. A fim de reduzir o número de falso-positivos (erro tipo I), foram utilizadas duas abordagens estatísticas independentes 50 (teste Z e o SAM). A intersecção de 181 transcritos diferencialmente expressos identificados por SAM (FDR < 10%) com uma lista de 227 transcritos identificados por teste Z (p < 0,001) resultou num conjunto de 83 transcritos identificados em ambas análises, incluindo 8 seqüências que mapeiam em regiões intrônicas (Figura 8 e Tabela 5). Figura 8 - Perfil de expressão de CCR célula clara. Heat map dos níveis de expressão de 83 genes (linhas) que apresentaram níveis de expressão significativamente alterado (p < 0,001 e FDR < 10%) entre 12 amostras pareadas de tumor (T) e tecido não-tumoral adjacente (N) de 6 pacientes com CCR célula clara (colunas). Para cada transcrito, os valores de expressão relativa são apresentados como log2(T/N): vermelho indica expressão maior em tumor; azul, expressão maior em tecido não-tumoral adjacente. Os trancritos intrônicos são indicados por setas e são referidos pelo nome do gene no qual eles mapeiam. 51 Tabela 5 - Relação dos 83 transcritos diferencialmente expressos em CCR. Probe accession Locus Gênico Mapeamento Log2 em (T/N) Éxon/Íntron Anotação Validação por LOO Alterado em CCR nãocélula clara AW83703 GPX3 Exônico -3,7 Glutathione peroxidase 3 6/6 não AW88343 PRKAG1 Exônico -2,8 AMPK-gamma1 5/6 sim AW60339 YEATS4 Exônico -2,5 Glioma amplified sequence 41 5/6 sim AW36502 CSNK1G2 Exônico -2,5 Casein kinase 1, gamma 2 6/6 sim AW93599 FUS Exônico -2,5 Fusion t(12;16) in malignant liposarcoma) 6/6 sim BF751544 ICT1 Exônico -2,5 Immature colon carcinoma transcript 1 5/6 sim AW84274 SIN3B Exônico -2,4 SIN3 homolog B, transcription regulator (yeast) 6/6 sim CK327135 SYNJ2BP Exônico -2,4 Synaptojanin 2 binding protein 5/6 sim BF087349 MAP3K7IP1 Exônico -2,4 Mitogen-activated protein kinase kinase kinase 7 interacting protein 1 5/6 sim BF368747 SLC2A1 Intrônico -2,4 Solute carrier family,member 1 6/6 sim BF922962 CTSB Exônico -2,3 Cathepsin B 5/6 sim BE762727 FVT1 Exônico -2,3 Follicular variant translocation gene 5/6 sim BG876687 MYH11/NDE1 Exônico -2,3 Myosin heavy chain, smooth muscle isoform / NUDE1 6/6 sim AW17599 FLJ34165 Exônico -2,3 CDNA FLJ34165 fis, clone FCBBF3014770 5/6 sim BF890754 UQCRH Exônico -2,2 Ubiquinol cytochrome c reductase hinge protein 5/6 sim AW75312 P2RY1 Exônico -2,2 Purinoceptor P2Y1 5/6 sim BF857797 C10orf104 Exônico -2,1 Chromosome 10 open reading frame 104 6/6 sim AW83674 EPAS1 Exônico -2,1 Endothelial PAS domain protein 1 6/6 sim AW37394 CAPNS1 Exônico -2,0 Calpain, small subunit 1 6/6 sim BF378949 RAB27A Exônico -2,0 RAB27A 5/6 sim BE697369 C16orf34 Exônico -2,0 Chromosome 16 open reading frame 34 6/6 sim AW36443 LDLRAD3 Exônico -2,0 Hypothetical protein LOC143458 6/6 sim AW88467 MTMR9 Exônico -2,0 Myotubularin related protein 9 5/6 sim AW86249 KIAA0984 Exônico -2,0 Hypothetical protein LOC23329 5/6 não BF892704 GSN Exônico -1,9 Gelsolin 6/6 sim BF831599 VRK2 Exônico -1,9 Vaccinia related kinase 2 5/6 não BF089987 SND1 Intrônico -1,8 Staphylococcal nuclease and tudor domain containing 1 6/6 não BF155287 SRF Exônico -1,7 Serum response factor 5/6 não 6 9 5 7 8 8 1 8 7 3 5 5 1 52 BF882783 ACTN4 Intrônico -1,7 Actinin alpha 4 5/6 não BF898656 TRIP3 Exônico -1,6 Thyroid hormone receptor interactor 3 6/6 sim BQ349967 PRDX3 Exônico -1,6 Peroxiredoxin 3 6/6 não BF736784 SFPQ Exônico -1,6 Splicing factor proline/glutaminerich 5/6 não AW81977 RAB4A Exônico -1,6 Ras associated protein Rab4 5/6 não AW36926 ERCC5 Exônico -1,5 Excision repair, group 5 6/6 não BF891123 TFEC Exônico -1,5 Transcription factor EC 6/6 não BE836304 NR4A3 Exônico -1,5 Nuclear receptor subfamily 4, group A, member 3 6/6 não BF333281 NIBP Intrônico -1,4 NIK and IKK binding protein 5/6 não AW88317 CASP7 Exônico -1,3 Caspase 7 5/6 sim BE816027 TFDP2 Exônico -1,3 Transcription factor DP2 5/6 não BF365294 TACC1 Intrônico -1,3 Transforming, acidic coiled-coil containing protein 1 6/6 não BF751539 FOXK2 Exônico -1,2 Forkhead box K2 5/6 não BE153247 MBD2 Exônico -1,2 Methyl CpG binding domain protein 2 5/6 não BF990000 ENPP1 Exônico -1,2 Ectonucleotide pyrophosphatase/phosphodiesteras e1 5/6 não BE720500 S100A2 Exônico -1,1 S100 calcium binding protein A2 5/6 não BF946916 CHEK1 Exônico -1,0 Cell cycle checkpoint kinase 5/6 não BF856925 WDR23 Exônico -1,0 WD repeat domain 23 5/6 não AW36106 PICALM Exônico -1,0 Phosphatidylinositol binding clathrin assembly protein 5/6 não AW85997 FLJ39067 Exônico -1,0 CDNA FLJ39067 fis, clone NT2RP7014910 5/6 não BQ366120 PRCC Exônico -1,0 Renal cell carcinoma, papillary 1 5/6 não BE697269 SH3PX3 Exônico -0,9 Hypothetical protein MGC32065 5/6 não BF922401 EPB41 Exônico -0,9 Erythrocyte membrane protein band 4,1 5/6 não AW93942 MAP2K3 Exônico -0,9 Mitogen-activated protein kinase kinase 3 4/6 não 0 5 5 4 9 1 BQ314686 MSH3 Exônico -0,9 MutS homolog 3 5/6 não BF946928 DEPDC5 Exônico -0,9 DEP domain containing 5 5/6 não BG010306 HDAC5 Intrônico -0,9 Histone deacetylase 5 5/6 não BF994346 NDC80 Exônico -0,8 Kinetochore complex component (S. cerevisiae) 4/6 não BF360792 RAB25 Intrônico -0,8 Ras associated protein RAB25 4/6 não 4/6 não Minichromosome maintenance protein 2 3/6 não BF082556 Intergênico -0,7 BQ338721 MCM2 Exônico -0,6 BF092089 TCF3 Exônico -0,6 Transcription factor 3 4/6 não BE163794 ZBED4 Exônico -0,5 Zinc finger BED domain containing 4 3/6 não AW74871 ZNF447 Exônico -0,4 Hypothetical protein FLJ12895 5/6 não BE697330 SAT2 Exônico -0,4 Spermidine/spermine N1acetyltransferase 2 4/6 não AW83704 IL11RA Exônico -0,4 Interleukin 11 receptor alpha 4/6 não 4 3 53 BF087474 GAA Exônico 0,1 Lysosomal alpha glucosidase 3/6 não AW85212 AK055564 Exônico 0,1 AK055565 3/6 não BE935243 MDM2 Exônico 0,1 Transformed 3T3 cell double minute 2 2/6 não AW79606 TP53I3 Exônico 0,1 p53 induced gene 3 2/6 não BG005977 MLLT7 Exônico 0,1 Myeloid/lymphoid, translocated to 7 3/6 não BE070310 SDC2 Exônico 0,1 Syndecan 2 2/6 não BF810617 ADORA2A Exônico 0,1 Adenosine A2 receptor 2/6 não BF871631 FOXK1 Exônico 0,1 Forkhead box K1 3/6 não BF957566 TMF1 Exônico 0,1 TATA element modulatory factor 1 2/6 não BF949348 TCF2 Exônico 0,3 Transcription factor 2 2/6 não BE837647 POFUT2 Exônico 0,3 Protein O-fucosyltransferase 2 5/6 não BF987726 H2AFY Intrônico 0,3 H2A histone family member Y 5/6 não BE702107 MAP4 Exônico 0,6 Microtubule associated protein 4 5/6 não AW88061 RBMX Exônico 0,7 RNA binding motif protein, Xlinked 5/6 não BF997724 PAPPA/AY623011 Exônico 0,7 Pregnancy associated plasma protein A / DIPLA1-antisense mRNA 5/6 não BF328211 AK091566 Exônico 1,1 AK091566 5/6 não AW90112 ARNTL Exônico 1,1 Aryl hydrocarbon receptor nuclear translocator-like 5/6 não AW37737 POLL Exônico 1,1 DNA polymerase lambda 5/6 não AW38394 CD68 Exônico 1,7 CD68 antigen 6/6 não 5 6 4 7 0 7 Para limitar a contribuição individual das amostras analisadas para a identificação de genes diferencialmente expressos em CCR célula clara, realizamos uma análise de leave-one-out, que consiste na retirada de um paciente do conjunto analisado e a subseqüente reanálise dos pacientes remanescentes em cada ciclo, obtendo-se assim um conjunto de genes diferencialmente expressos para cada ciclo de leave-one-out. Por fim, é obtida uma freqüência com que cada gene é identificado no conjunto dos ciclos. Assim, observamos que 64 dos 83 transcritos (77%), inicialmente identificados como diferencialmente expressos por teste Z e SAM, estavam também presentes em pelo 5 dos 6 ciclos possíveis de leave-one-out. Em seguida, foi avaliado se os transcritos identificados como diferencialmente expressos em CCR célula clara estavam também alterados em outros estados ou 54 subtipos histológicos de CCR. Para isso, analisamos os perfís de expressão de um conjunto adicional de 12 amostras pareadas de pacientes com CCR, incluindo quatro amostras de CCR papilar, uma amostra de CCR célula clara, mas com extenso componente sarcomatóide e uma amostra de CCR de origem não-classificada (ver Tabela 2). Esta nova análise resultou em um conjunto de 104 transcritos com níveis significativamente alterados utilizando SAM (FDR = 5%) em tumor em comparação ao tecido não-tumoral adjacente. A análise de leave-one-out das amostras de CCR nãocélula clara identificou 84 transcritos presentes em pelo menos 5 de 6 ciclos de leaveone-out. O cruzamento desta lista de 84 transcritos com a lista de 64 transcritos obtida após leave-one-out das amostras de CCR célula clara resultou na identificação de 25 transcritos alterados em amostras de CCR independente do estado de diferenciação ou subtipo histológico (Tabela 5, Figura 9). Figura 9 - Perfil de expressão de CCR independente do subtipo histológico. Heat map dos níveis de expressão de 25 genes (linhas) comuns resultantes do cruzamento do conjunto de 64 genes obtidos por leave-one-out em CCR célula clara e o conjunto de 84 genes obtidos por leave-one-out em CCR não-célula clara. Para cada transcrito, os valores de expressão relativa são apresentados como log2(T/N): vermelho indica expressão maior em tumor; azul, expressão maior em tecido não-tumoral adjacente. Os trancritos intrônicos são indicados por setas e são referidos pelo nome do gene no qual eles mapeiam. 55 A significância da sobreposição destas duas listas de genes foi avaliada por 1 milhão de amostragens aleatórias com reposição, resultando numa alta significância estatística (p < 10-6), indicando que a sobreposição dos 25 genes não foi ao acaso. Entre os 25 transcritos identificados, observamos transcritos mapeando em regiões intrônicas dos genes SLC2A1 ou TACC1 (Figura 10). Figura 10 – Locus genômico de TACC1 e SLC2A1. A; Região genômica do cromossomo 1 contendo o locus de SLC2A1. A seta vermelha indica a seqüência depositada no microarray que corresponde a um fragmento do transcrito de SLC2A1. B; Região genômica do cromossomo 8 contendo o locus de TACC1. A seta vermelha indica o fragmento depositado no chip do transcrito de TACC1. Observe que em A o transcrito depositado no chip é unspliced, enquanto que em B temos um transcrito spliced. A B 56 Nenhum dos RNAs intrônicos identificados com expressão alterada em CCR apresenta potencial codificante, segundo análise realizada utilizando o programa ESTScan (Iseli et al. 1999). Para investigar se os RNAs intrônicos são transcritos primários não processados que poderiam gerar RNAs pequenos regulatórios já descritos, a seqüência dos RNAs intrônicos alterados em CCR foi comparada com a de 346 snoRNAs (Lestrade et al. 2006) e 383 microRNAs (Griffiths-Jones et al. 2006) documentados na literatura. Não foi observada similaridade entre os ncRNAs intrônicos e as sequências de snoRNAs e microRNAs conhecidos, o que não significa que os ncRNAs intrônicos não possam representar precursores de pequenos RNAs regulatórios ainda não descritos. Durante as análises, chamou-nos atenção a predominância de genes diminuídos em tumor em comparação ao número de genes aumentados relativamente ao tecido nãotumoral adjacente (Figuras 8 e 9). Assim, levantamos a hipótese de que o efeito observado poderia ser decorrente de uma maior degradação do RNA mensageiro nas amostras de tumor relativamente ao tecido não-tumoral adjacente. Nesse caso, esperaria-se observar uma maior fração de genes aparentemente diminuídos no tumor quando as amostras pareadas tumor/tecido não-tumoral adjacente fossem analisadas individualmente. Para tanto, consideramos como diferencialmente expresso todo gene cujo log2(T/N) fosse diferente de 0 (zero), onde T = expressão média normalizada do 57 gene no tecido tumoral e N = expressão média normalizada do gene no tecido nãotumoral adjacente. Em seguida, computamos a fração resultante do número de genes com expressão aumentada sobre o número de genes com expressão diminuída para cada par de amostras de um mesmo paciente. Na Figura 11 estão plotadas a fração entre o número de genes com expressão aumentada/diminuída em função do número mínimo de amostras em que um dado gene foi identificado como diferencialmente expresso. Essa análise sugere que, nas amostras de tumor, o maior número de genes diminuídos em relação aos genes aumentados não é efeito de nenhuma amostra em particular, já que esse efeito aumenta à medida que aumenta o número mínimo de amostras consideradas, ou seja, esse efeito não parece depender de nenhuma amostra específica (Figura12). 58 Figura 11 – Genes diferencialmente expressos em um maior número de amostras pareadas tendem a estar diminuídos em CCR. O gráfico apresenta a razão entre o número de genes aumentados e diminuídos em tumor relativamente ao tecido não-tumoral adjacente em função do número mínimo de amostras em que a expressão diferencial do gene é observada. Foi considerado como diferencialmente expresso todo gene cujo log2(T/N) fosse diferente de 0 (zero), onde T = expressão média normalizada do gene no tecido tumoral e N = expressão média normalizada do gene no tecido não-tumoral adjacente. Levantamos em seguida uma outra hipótese, a de que, eventualmente, o maior número de genes com expressão diminuída em tumor poderia se dever a artefatos durante a marcação dos alvos fluorescentes de cDNA. Por exemplo, a existência de incorporação preferencial de um dos fluoróforos nas amostras de tecido não-tumoral adjacente poderia resultar, apesar da normalização por LOWESS e do desenho experimental baseado em dye-swap, numa aparente predominância de expressão diminuída em amostras de tumor. A marcação desigual do RNA poderia ser resultante tanto da quantidade de fluoróforo incorporado na molécula quanto do efeito da emissão desigual de fluorescência dos corantes Cy3 e Cy5, visto que a intensidade de emissão de fluorescência de Cy3 é maior que a de Cy5. Para descartar essa possibilidade de 59 marcação desigual, refizemos as análises da Figura 11 utilizando os dados de cada réplica separadamente, ou seja, de modo que as amostras de tumor dessa vez fossem analisadas de acordo com o fluoróforo com que a mesma foi marcada (tumor-Cy5/nãotumor-Cy3 e tumor-Cy3/não-tumor-Cy5). Caso houvesse algum efeito do fluoróforo não corrigido pelo normalização LOWESS, poderíamos esperar que quando as amostras de tumor fossem marcadas com Cy3, observaríamos uma predominância de genes aumentados em tumor relativamente ao tecido não-tumoral adjacente, já que esse fluoróforo emite com maior intensidade. Ao contrário, quando as amostras de tumor fossem marcadas com Cy5, haveria predominância de genes diminuídos em tumor. No entanto, o resultado dessa nova análise confirmou que independentemente do fluoróforo utilizado, observa-se uma tendência de maior número de genes diminuídos em tumor à medida que se aumenta a estringência das análises (Figura 12), sugerindo que o maior número de genes diminuídos em relação aos aumentados em tumor não é decorrente de um artefato da técnica. 60 Figura 12 – Avaliação dos genes alterados em CCR segundo a marcação com Cy3 ou Cy5. O gráfico apresenta a razão entre o número de genes aumentados e diminuídos em tumor relativamente ao tecido não-tumoral adjacente em função do número mínimo de amostras. Foi considerado como diferencialmente expresso todo gene cujo log2(T/N) fosse diferente de 0 (zero), onde T = expressão média normalizada do gene no tecido tumoral e N = expressão média normalizada do gene no tecido não-tumoral adjacente. Fizemos ainda uma outra análise comparando estudos publicados de microarray com amostras de CCR. Para isso, foram utilizados dados publicados de Lenburg et al. (Lenburg et al. 2003), onde são comparados genes diferencialmente expressos identificados em comum em pelo menos três estudos com CCR utilizando microarrays (Figura 13). De 113 genes identificados como diferencialmente expressos em pelo menos três trabalhos, 82 apresentaram expressão diminuída em CCR (73% dos genes diferencialmente expressos). Esta observação está de acordo com nossos resultados, ao mostrar a tendência de identificação de um maior número de genes diminuídos em tumor comparativamente ao tecido não-tumoral adjacente. 61 4.4 Validação por RT-PCR em tempo real Inicialmente, foram selecionados cinco transcritos codificadores (SIN3B, TRIP3, SYNJ2BP, SDC-2 e MYH11) para validação por RT-PCR em tempo real da expressão diferencial em CCR detectada nos experimentos de microarray. Estes experimentos confirmaram que os transcritos exônicos de TRIP3 (p < 0,01), SYNJ2BP (p < 0,01) e SIN3B (p < 0,02), apresentaram níveis significamente reduzidos em amostras de CCR em comparação ao tecido não-tumoral adjacente (Figura 14, painéis A, B e C, respectivamente), enquanto aqueles de MYH11 apresentaram níveis aumentados em tumor (p < 0,02) (Figura 14, painel D). A amplificação de SDC-2 não resultou numa banda única de RT-PCR, não sendo portanto confirmada sua expressão aumentada nas análises de microarray. 62 Figura 13 – Genes com expressão alterada em CCR identificados em estudos de expressão gênica em larga-escala. A figura mostra genes identificados como diferencialmente expressos em pelo menos três estudos com microarrays analisando amostras de CCR. Nas colunas estão os estudos, e nas linhas, os genes comuns diferencialmente expressos. Foram identificados 31 genes aumentados em tumor contra 82 genes diminuídos. Os estudos analisados foram Gieseg et al., 2002; Young et al., 2001; Higgins et al., 2003; Takahashi et al., 2001; Boer et al., 2001 e Lenburg et al, 2003. Figura adaptada de Lenburg et al. (2003). Giesig Young HIggins Takahashi Boer Lenburg Giesig IGFBP3 HIBCH ASS FLJ12541 SERPINA5 CLDN10 MAL SELENBP1 VEGF PECI FBP1 FLJ10761 FLJ20920 GPD1 MT1H FLJ20315 SUCLG1 TAP1 GATM FTCD SORD SFXN2 ANGPTL4 TIMP1 Hs.21103 DKFZP586B1621 ALDOB SIPL LOX NP KL LOC92840 PLOD2 GGH GLYAT MGC2827 MT1L GCHFR CALB1 Hs.18612 KNG FLJ14957 DPEP1 SLC27A2 KCNJ15 ALDH8A1 VWF Hs.27092 CXCR4 PDZK1 HPD APOE PCK2 HGD TACSTD2 RGS5 SEMA3B LRP2 HSD11B2 C3 DDC CTSH GPC3 IF EGF SULT1C1 SLC13A3 ATP6V1B1 PCK1 CSPG2 GPX3 C1QB S100A2 GBP2 ADH6 INHBB SLC22A3 LGALS9 GRB14 LST1 MT1G FOLR1 EGLN3 FGF1 Hs.238927 ALDH6A1 CAV1 FABP1 RGS1 hS.381097 PLG SFRP1 APOC1 PAH ALDH4A1 PCCA PIPOX Young HIggins CA2 ACADSB FLJ12783 TNFAIP6 ARHGDIB FN1 PVALB HLA-DQB1 VIM KIAA1949 FCGR3A GABARAPL1 TGFA BPHL ANXA1 PTR4 Gene com expressão aumentada em tumor Gene com expressão diminuída em tumor Gene ausente Takahashi Boer Lenburg 63 Figura 14 – Expressão por Real-Time PCR de candidatos a marcadores de CCR. Os níveis relativos de transcritos exônicos (A−D; TRIP3, SYNJ2BP, SIN3B, MYH11, e NDE1) e intrônicos (E; ACTN4 e SND1) selecionados em amostras de tumor em comparação ao tecido não-tumoral adjacente do mesmo paciente foram determinados por RT-PCR em tempo real. As diferenças significativas são marcadas com um asterisco. A; TRIP3 (p < 0,01); B; SYNJ2BP (p < 0,01); C; SIN3B (p < 0,02); D; MYH11 (p < 0,02), NDE1 (p < 0,02); E; ACTN4 (p < 0,05), SND1 (p < 0,05). Para cada gene, os ensaios foram realizados em triplicata. São mostrados os valores médios com as respectivas barras de erro. Para cada gene testado, foi usado o gene housekeeping TUB-B como referência para normalização. Embora significativo, o aumento dos níveis transcricionais de MYH11 em CCR analisado por RT-PCR em tempo real não concordou com os resultados de microarray, que mostraram uma expressão diminuída de MYH11 em tumor relativamente ao tecido não-tumoral adjacente. 64 Uma análise mais detalhada do locus de MYH11 revelou a presença de um outro gene, NDE1, que se sobrepõe à extremidade 3' de MYH11 (Figura 15). Figura 15 – Região genômica do cromossomo 16 contendo os loci de MYH11 e NDE1. A caixa vermelha indica a seqüência depositada (GenBank Acession: BG876687) no chip e que foi anotada como um fragmento do transcrito de MYH11. Note que uma extremidade da sonda de cDNA é ao mesmo tempo complementar a um éxon 5’ de MYH11 e ao éxon 3’ de NDE1. A orientação oposta dos transcritos de MYH11 e NDE1 é representada pelas cabeças de setas em azul, que estão nas regiões intrônicas dos dois genes. Além disso, foi observado que a sonda de cDNA dupla-fita depositada no microarray (Genbank accession: BG876687) é complementar ao éxon 3’ exon do transcrito NDE1 e a um éxon mais 5’ de MYH11. Como o protocolo de marcação favorece alvos próximos à extremidade 3' de transcritos poli(A)+ devido a utilização de primers oligo dT, levantamos a hipótese de que o sinal medido pelo microarray foi na verdade derivado de mensagens originadas do gene NDE1. Para testar essa hipótese, foram realizados experimentos de RT-PCR em tempo real para medir os níveis de NDE1 em amostras de tumor e de tecido não-tumoral adjacente. Os resultados mostraram que dos 8 pares avaliados de amostras pareadas, NDE1 estava significativamente sub-expresso (p < 0,02) em 3 amostras de RCC em comparação ao tecido não-tumoral adjacente (Figura 14, painel D, pacientes P3, P27 e P32). Em duas 65 amostras adicionais, NDE1 apresentou uma tendência, embora não-significativa, de estar com expressão reduzida em CCR (Figura 14, painel D, pacientes P5 e P26). Quatro transcritos intrônicos não-codificadores mapeando em regiões intrônicas de genes codificadores, SND1, ACTN4, HDAC5 e NIBP, foram selecionados para experimentos de RT-PCR em tempo real; a sub-expressão de RNAs intrônicos foi confirmada para transcritos mapeando íntrons de SND1 e ACTN4 (Figura 14, painel E). Não foi possível obter a amplificação de produtos de PCR correspondentes aos transcritos intrônicos HDAC5 e NIBP utilizando os primers disponíveis, e a diferença de expressão desses transcritos não foi confirmada. 4.5 Análise do padrão de metilação de genes com expressão diminuída em CCR Cinco genes identificados como sub-expressos em CCR (GPX3, NDE1, SYNJ2BP, TRIP3 e SIN3B) foram selecionados para avaliação do perfil de metilação de ilhas CpG localizadas em regiões promotoras dos respectivos genes em amostras pareadas de tumor e tecido não-tumoral adjacente de pacientes com CCR. Foram analisadas para identificação das ilhas CpG seqüências cobrindo até 2 Kb à montante do início de transcrição do gene, acrescida do respectivo primeiro éxon e primeiro/segundo íntrons. Como algumas ilhas CpG eram longas, foi necessário desenhar mais de um par de primers para essas ilhas. 66 A eficiência do tratamento por bissulfito foi avaliada utilizando primers complementares à seqüência convertida por bissulfito de uma região genômica contendo uma ilha CpG do gene CDKN2A, cuja expressão é sabidamente regulada por metilação da região promotora em linhagens de tecido DLD1 (carcinoma de cólon) e H1299 (câncer de pulmão) (Figura 16). Figura 16 - Verificação do tratamento com bissulfito e análise do perfil de metilação para região regulatória do gene CDKN2A. Reações de PCR utilizando primers MSP do gene CDKN2A. L : marcador de peso molecular (100 pb). U: primer complementar a DNA nãometilado, M: primer complementar a DNA metilado. 32T, 32N, 9N, 9T, 15N, 15T, 27N, 27T correspondem a amostras de CCR (T) e tecido não-tumoral adjacente (N). Linhagens onde o gene CDKN2A é sabidamente metilado (Controles positivos de metilação): DLD1, H1299. Controle negativo de tratamento com bissulfito: MCF7. Linhagens onde o gene CDKN2A é sabidamente não-metilado (controle negativo de metilação): 37L, HT1376, 18C. Esse experimento mostra que, embora não haja metilação nos sítios interrogados pelos primers nas amostras de CCR, o tratamento com bissulfito foi eficiente, pois foram amplificadas bandas com tamanho compatível utilizando primers complementares à seqüência de DNA convertido. 9N 9T 15N 15T 27N 27T 32N U L M U M U M U M U M U M U M 32T HT 18C 37L 1376 MCF7 DLD1 H1299 U M L U M U M U M U M U M U M 150 bp Neste ensaio, foram realizadas reações de PCR utilizando separadamente primers específicos para formas metiladas ou não-metiladas dos genes (MethylationSpecific PCR – MSP). Embora não tenha sido verificada a existência de metilação na ilha CpG testada do gene CDKN2A em amostras de CCR, a observação de uma banda com o tamanho esperado em DNA de linhagens sabidamente metiladas e tratadas em paralelo, confirmou que o tratamento com bissulfito nas amostras foi eficiente. 67 Foi observado que SIN3B possui evidência de metilação, em CpGs localizadas numa região compreendendo um trecho à montante do início de transcrição até o segundo íntron do gene (Figura 17). Figura 17 - Perfil de metilação de sítios CpG de genes sub-expressos em CCR. Os produtos de PCR obtidos a partir de DNA genômico tratado com bissulfito e utilizando primers flanqueando regiões em torno do início de transcrição (TSS) de genes sub-expresssos em CCR (SIN3B, SYNJ2BP, GPX3 e TRIP3). Para cada amostra seqüenciada, os quadrados pretos representam CpGs onde foi observada metilação em pelo menos 20% dos clones seqüenciados. Os quadrados cinza representam CpGs não-metilados (menos de 20% dos clones seqüenciados). Os quadrados brancos representam sítios CpGs onde não houve seqüenciamento de qualidade. Para cada gene analisado, os CpGs foram seqüencialmente numerados da esquerda para direita. No entanto, não foi observada nenhuma correlação entre o perfil de metilação dos CpGs e o padrão histológico do tecido (tecido tumoral ou tecido não-tumoral adjacente) nos 4 pares de amostras avaliadas. Não foi observada metilação em ilhas localizadas na região promotora de GPX3, SYNJ2BP e TRIP3 (Figura 17). Este resultado indica que a metilação do promotor não é um fator importante na regulação 68 negativa dos genes GPX3, SYNJ2BP, TRIP3 e SIN3B em amostras de CCR. A ausência de metilação observada para GPX3 sugere que o mecanismo de regulação negativa deste gene em CCR seja distinto do que ocorre em adenocarcinomas de próstata, onde a diminuição da expressão está associada ao aumento da metilação da região promotora de GPX3 (Lodygin et al. 2005). O seqüenciamento de DNA tratado com bissulfito apresenta desafios inerentes à transformação de longos trechos de DNA em homopolímeros de poli-T ou poli-A. O DNA convertido freqüentemente contém regiões de baixa complexidade que dificultam o desenho de primers específicos e compatíveis com as condições utilizadas nas reações de amplificação, o que limita a obtenção de produtos de amplificação específicos e/ou em quantidade suficiente para o sequenciamento direto e/ou a clonagem em vetor para posterior seqüenciamento. Como exemplo dessas limitações, embora tenhamos obtido produto de amplificação usando os primers para NDE-1, não conseguimos seqüenciá-lo diretamente com nenhum dos dois primers disponíveis. 69 5. DISCUSSÃO 5.1 Desenho experimental utilizado para identificação de transcritos diferencialmente expressos em CCR A abordagem utilizada neste trabalho, ou seja, a hibridização de amostras pareadas de tecido tumoral e tecido normal adjacente na mesma lâmina (experimentos com 2 canais) e posterior utilização de razões relativas de expressão gênica, é um desenho experimental que garante uma precisão e acurácia maior nas medidas de expressão em relação a estratégias baseadas na hibridização individual de cada amostra (experimentos com 1 canal) (Yang et al. 2002; Peixoto et al. 2006). A necessidade de medidas acuradas de expressão gênica é tanto maior quanto menor for o número de réplicas biológicas e técnicas disponíveis. Um estudo recente avaliou o número de amostras necessário para que haja poder de análise estatística na identificação de genes diferencialmente expressos, a partir de dados de diversos trabalhos de expressão gênica disponívei na literatura (Allison et al. 2006). Esse estudo demonstrou que para desenhos experimentais onde dois grupos de amostras são avaliados para comparação de classe (expressão diferencial), 5 amostras biológicas por grupo são geralmente suficentes para identificação de genes diferencialmente expressos com significado biológico, não restrito às amostras utilizadas na análise (Allison et al. 2006). Isto se aplica unicamente a casos de comparação de classe (expressão diferencial), mas não a predição de classe (classificação). Neste trabalho, identificamos um conjunto de 83 genes com expressão significativamente alterada em CCR tipo célula clara utilizando 12 amostras pareadas de 6 pacientes. Desse conjunto, um sub-conjunto de 25 genes também se mostrou diferencialmente expresso em 6 outros pacientes com CCR nãocélula clara. Em função do desenho experimental empregado, acreditamos que os 70 resultados obtidos, além de possuírem significância estatística, sugerem que os genes identificados possuam relevância biológica e poderão contribuir para o entendimento das bases moleculares do CCR. Durante nossas análises, chamou-nos atenção a predominância de genes diminuídos em tumor em comparação ao número de genes aumentados relativamente ao tecido não-tumoral adjacente. Em princípio, isso poderia ser uma conseqüência de uma maior degradação do RNA nas amostras de tumor devido à necrose intensa que acomete esses tecidos. Contudo, a avaliação da qualidade dos RNAs utilizados nas hibridizações não indicou diferença na qualidade dos RNAs provenientes de tecido tumoral ou margens cirúrgicas livres de tumor. Além disso, uma análise individual das amostras pareadas revelou que a proporção de genes com expressão aumentada e diminuída em tumores é comparável, e que o maior número de genes com expressão diminuída em tumores só se torna evidente quando o conjunto das amostras é analisado. Esse resultado indica que uma pior qualidade do RNA não deve ser um fator preponderante para explicar a diminuição da expressão de genes nos tumores, o que é reforçado com outros artigos já publicados mostrando a mesma tendência (Lenburg et al. 2003). 5.2 Comparação dos genes identificados com outros estudos de CCR Embora todos os microarrays de DNA se baseiem na hibridização de ácidos nucléicos, as variações técnicas diferem amplamente entre as plataformas (Draghici et al. 2006). Entre as diferenças, destacam-se o comprimento das sondas, o método de deposição do DNA na lâmina, protocolos de marcação e hibridização, etc. Cada uma dessas abordagens exige considerações em termos da quantidade de RNA necessário, aquisição de dados e técnicas de transformação e normalização de dados, e que resultam 71 freqüentemente em baixa reprodutibilidade das plataformas. (Draghici et al. 2006). Essa é uma questão importante porque, dada uma hipótese biológica avaliada em duas plataformas diferentes, cumpre saber se há diferenças específicas entre as plataformas de modo a interferir nos resultados, mascarando assim a resposta biológica subjacente. Nesse sentido, observamos nessa tese uma baixa sobreposição da nossa lista de genes diferencialmente expressos com a lista de outros trabalhos publicados com CCR utilizando metodologia de microarrays. Por exemplo, GPX3 e S100A2 foram também descritos com expressão diminuída entre CCR em dois trabalhos publicados (Boer et al. 2001; Takahashi et al. 2001). Não encontramos sobreposição com nenhuma lista de genes de alguns trabalhos publicados ((Jones et al. 2005), (Young et al. 2001), (Higgins et al. 2003), (Skubitz et al. 2002)). Acreditamos que esta baixa sobreposição se explica principalmente por i) número limitado de genes codificadores para proteína representados em nossa plataforma e que podem ser mapeados nas plataformas utilizadas nos outros estudos já realizados em CCR, ii) a presença de diferentes regiões dos transcritos, que interrogam diferentes isoformas do mesmo gene e iii) a heterogeneidade na atribuição de identificadores para as sondas nas diferentes plataformas. 5.3 Expressão de RNAs não-codificadores em CCR Neste trabalho observamos a expressão ubíqua de ncRNAs intrônicos e intergênicos em amostras de tecido tumoral renal, assim como em margens livres de neoplasia. Também observamos que em média, a abundância dos ncRNA é menor que a de transcritos codificadores para proteínas. Estes resultados estão de acordo com resultados obtidos anteriormente por nosso grupo durante a análise de tumores de 72 próstata utilizando essa mesma plataforma de microarrays (Reis et al. 2004). A expressão em menor nível de ncRNAs já foi também descrita em outros trabalhos da literatura (Kampa et al. 2004; Sasaki et al. 2007). No trabalho anterior com tumores de próstata foram utilizados primers oligo-dT na síntese de cDNA a partir de mRNA, diferentemente do presente trabalho, que além de oligo-dT tambem utilizou primers randômicos para gerar cDNA a partir de RNA total. A estratégia de utilização combinada de oligo-dT e primers randômicos teve como intenção garantir a marcação de alvos que não necessariamente possuissem uma cauda de poliA, além de obter uma marcação mais eficiente de regiões 5’ de transcritos longos. A quantidade limitada de RNA disponível para os experimentos não permitiu que fosse feito tratamento com DNAse. Embora essa contribuição não deva ser significativa, visto que a transcriptase reversa utiliza preferencialmente RNA no seu processo de síntese de cDNA, essa limitação do desenho experimental pode resultar em que uma pequena fração do sinal detectado nos microarrays seja proveniente de contaminação residual com DNA genômico. De todo modo, a eventual contaminação com DNA genômico não afetaria a identificação de genes diferencialmente expressos entre tumor e tecido não-tumoral adjacente, já que isso ocorreria aleatoriamente nas amostras tumorais e não-tumorais e em pequena quantidade. O trabalho de nosso grupo em tumores de próstata mostrou que uma considerável porção de RNAs com nível de expressão correlacionados ao grau de agressividade de tumores de próstata são RNAs transcritos em regiões intrônicas, apontando para uma possível relevância biológica dessas mensagens em doenças complexas como o câncer (Reis et al., 2004). Uma fração desses transcritos intrônicos mostrou pertencer a uma nova classe de RNAs longos, sem splicing, sem potencial codificante, e expressa com orientação antisenso a genes codificantes para proteína já 73 conhecidos, sugerindo que transcritos intrônicos antisenso possam estar envolvidos no processo de oncogênese. Uma hipótese plausível para apoiar uma função biológica é que os transcritos intrônicos agiriam em cis, tendo como alvo sua mensagem senso intrônica complementar (no pré-mRNA). A formação de pares antisenso-senso intrônicos poderiam assim desempenhar um papel regulatório em alguma etapa do processamento dos transcritos codificantes para proteína correspondentes (Reis et al., 2005). Essa hipótese é apoiada por resultados recentes mostrando o efeito de ncRNAs intrônicos induzidos por andrógeno sobre a estabilidade ou o padrão de splicing do mRNA correspondente (Louro et al., 2007). A observação de que ncRNAs intrônicos são ubíquamente expressos em tecido renal permite extender para tecidos renais as observações feitas em tecido prostático, abrindo novas perspectivas para o estudo dos mecanismos de regulação gênica envolvidos com a transformação maligna no CCR. 5.4 Análises de metilação A inibição funcional de genes supressores de tumor pode ocorrer via mutações pontuais, deleções alélicas, deleções homozigóticas ou por metilação anormal da região promotora. A metilação de dinucleotídeos CpG na região promotora de genes supressores de tumor, resultando em inibição transcricional, é um mecanismo importante de inativação desses genes. A freqüência de inativação por metilação de novo varia entre genes e entre cânceres. Assim, o espectro de genes freqüentemente inativados por metilação difere entre os tipos de cânceres, de modo que certos tumores podem apresentar padrões específicos de metilação (Esteller et al. 2001). Atualmente, existe pouca informação sobre a freqüência e padrão de metilação em tumores renais em comparação a outros cânceres (Morris et al. 2003). Além disso, a caracterização dos 74 perfís de metilação de genes supressores de tumor pode revelar mecanismos de carcinogênese, sendo que a definição de padrões de metilação tumor-específicos abre a possibilidade de desenvolvimento de novos testes diagnósticos. Assim, uma conseqüência natural da análise de genes com expressão diminuída é a análise de alterações de metilação em ilhas CpGs. Dentre os genes selecionados para análise de metilação, SIN3B foi o único no qual observamos CpGs metiladas, mas que no entanto não apresentou correlação entre os níveis de metilação e o status histológico, ou seja, entre tumor ou tecido não-tumoral adjacente e, por extensão, nenhuma correlação com a expressão diferencial. A presença de metilação em amostras de tecido não-tumoral adjacente sugere que o uso de SIN3B como marcador epigenético em CCR para identificação prematura de tumores não é uma boa abordagem para o desenvolvimento de novas ferramentas diagnósticas nessa neoplasia. O perfil de metilação das regiões promotoras foi também avaliada nos genes NDE1, SYNJ2BP, GPX3 e TRIP3, mas nenhum deles apresentou metilação. Curiosamente, está descrito na literatura que a hipermetilação de GPX3 causa o silenciamento deste gene em tumores de próstata (Lodygin et al. 2005). Embora tenhamos utilizado a mesma metodologia de avaliação de metilação e primers complementares as mesmas regiões descritas por Lodygin et al., não observamos metilação de GPX3 em CCR, o que indica que o silenciamento deste gene pode ocorrer através de mecanismos distintos em diferentes neoplasias. 5.5 Transcritos diferencialmente expressos em CCR Com relação à confiabilidade, a tecnologia de microarray apresenta aproximadamente 90% dos genes identificados como “significativos” sendo confirmados por uma técnica alternativa, como o RT-PCR quantitativo (Larkin et al. 75 2005). Além disso, Lenburg et al. comparando CCR com tecido normal adjacente, observaram que, dos 37 genes também identificados como diferencialmente expressos em três ou mais dos cinco estudos anteriores analisados, 33 deles (89%) confirmaram a expressão diferencial (Lenburg et al. 2003). Neste trabalho, conseguimos uma taxa de validação de 100%, ou seja, todos os genes selecionados e amplificados tiveram sua expressão diferencial confirmada por PCR em tempo real em amostras, na maioria, independentes. A seguir, discutimos o papel na biologia celular de alguns genes identificados como diferencialmente expressos em CCR. CASP7 A ativação de caspase é um evento importante na geração de alterações bioquímicas associadas a morte celular (Twiddy et al. 2006), sendo que a caspase-7 é uma caspase de importância central nesse processo (Korfali et al. 2004). A ativação da caspase-7 foi relatada em células T e B em apoptose (Marsden et al. 2002). Fibroblastos embriônicos de camundongo, células T ou B de murinos e hepatócitos deficientes em caspase-7, no entanto, apresentam apenas uma leve vantagem de sobrevivência quando tratados com indutores de apoptose (Lakhani et al. 2006), sugerindo uma variabilidade na resposta de caspase-7 na propagação de morte celular. Neste trabalho, foi observada uma diminuição da expressão do mRNA de caspase-7 em tumores de CCR, sugerindo uma atividade supressora de tumor para este gene, reforçando a idéia de um gene próapoptótico. EPAS1 HIF é um fator de transcrição heterodimérico consistindo de uma subunidade beta constitutivamente expressa e uma subunidade alfa regulada. HIF-2α, codificado pelo gene EPAS1, apresenta alta similaridade de seqüência com HIF-1α, um fator de 76 transcrição com função na resposta transcricional a hipoxia (Korfali et al. 2004). HIF não é apenas suficiente, como também necessário para formação do CCR (Iliopoulos 2006). De acordo com nossas análises, EPAS1 é sub-expresso em CCR, sugerindo uma complexidade adicional nesta via durante a carcinogênese do CCR. Intrônico de SND1 A família de fatores de transcrição STAT (Signal transducer and activator of transcription) converte sinais extracelulares de citocina em respostas biológicas através da modulação da transcrição gênica (Levy et al. 2002). A ativação constitutiva de proteínas STAT e a sinalização STAT anormal já foram observadas em tumores sólidos, tumores hematopoiéticos não-leucêmicos e leucemias (Levy et al. 2002). Yang et al. identificaram a proteína p100, codificada por SND1, como uma proteína que interage com STAT6, aumentando a ativação transcricional mediada por STAT6 (Yang et al. 2002). Neste sentido, observamos um transcrito alterado no íntron de SND1, sugerindo um envolvimento da via STAT na carcinogênese do CCR. A proteína p100 também interage com outros fatores de transcrição como TFIIE, c-Myb e STAT5 (Levy et al. 2002). CHEK1 Os chekpoints de dano ao DNA são ativados a fim de bloquear células e promover a sobrevivência sob condições genotóxicas, sendo que alguns estudos têm se dedicado ao uso de uma quinase codificada por CHEK1 como alvo de intervenção terapêutica (Gao et al. 2006). CHEK1 é também uma quinase essencial para preservar a estabilidade do genoma. Estudos recentes (Syljuasen et al. 2005) propuseram que CHEK1 é necessário durante a fase S normal para evitar início anormal da replicação do DNA, protegendo-o assim contra quebra. Neste sentido, as células tumorais 77 freqüentemente são deficientes no chekpoint G1 devido a perda de função de p53 (estimada em 50–70% de todos os cânceres) e assim deve depender da quinase de chekpoint CHEK1 para induzir bloqueio nas fases S e G2 a fim de sobreviver (Huang et al. 2006). Todos esses estudos sugerem que CHEK1 atua como um importante gene supressor de tumor em câncer, sendo que isto foi confirmado em nossas análises onde identificamos CHEK1 sub-expresso em CCR. Intrônico de TACC1 As proteínas TACC (Transforming acidic coiled-coil) são proteínas associadas a centrossomo e microtúbulo, sendo essenciais para a função de fuso mitótico. A desregulação desses genes é considerada importante no desenvolvimento e progressão de mieloma múltiplo, câncer de mama e câncer gástrico, sendo que Lauffart et al., utilizando dados de SAGE, conseguiram mostrar que 78,5% dos tumores de ovário não apresentam expressão considerável de TACC1 e/ou TACC3 (Lauffart et al. 2005). TACC1 mapeia em 8p11, uma região amplificada e rearranjada em câncer de mama (Still et al. 1999). Devilard et al mostraram que TACC1 apresenta níveis muito mais elevados de expressão em carcinoma de próstata humana do que em amostras de tecido prostático normal, tanto em nível de mRNA quanto de proteína (Devilard et al. 2006). Intrônico de SLC2A1 SLC2A1I (ou GLUT1) codifica para uma proteína que participa da detecção de glicose pela célula (Richardson et al. 2007). Como a membrana plasmática é impermeável a moléculas polares, a captura de glicose necessita do uso de proteínas carreadoras associadas a membrana, como a proteína codificada por SLC2A1I. Os transportadores de glicose (GLUTs) facilitam a translocação de glicose através da membrana, garantindo assim um suprimento contínuo de glicose para maioria dos 78 tecidos, sendo atualmente aceito que o aumento da captura de glicose por células malignas está associada ao aumento da expressão de GLUTs (Suganuma et al. 2007). A super-expressão de SLC2A1I foi descrita em câncer de fígado, pâncreas, rim (CCR célula clara), pulmão, mama, estômago, cabeça e pescoço e de tireóide (Suganuma et al. 2007). Como o intrônico mapeando SLC2A1I foi identificado como diminuído em tumor em nossas análises, nós postulamos que este transcrito intrônico poderia ter o papel de diminuir o nível transcricional de SLC2A1I em células normais, sendo que o aumento da transcrição de SLC2A1I observado em vários tumores seria paralelo à diminuição correspondente do transcrito intrônico, como de fato observamos. Intrônico de NIBP NIBP atua como um facilitador (enhancer) da ativação de NF-κB mediada por citocina. A função oncogência de NF-κB em cânceres sólidos já foi descrita anteriormente em câncer de mama, cólon, ovário, tireóide e pâncreas (Rayet et al. 1999). Oya et al. descreveram a atividade aumentada de NF-κB em CCR, a qual está relacionada com a capacidade de invasão tumoral (Oya et al. 2003). Nossos achados sugerem que a diminuição de expressão do transcrito intrônico de NIBP pode estar envolvida na via de NF-κB e pode assim estar atuando como um ator importante na biologia de CCR. Além disso, estudos in vitro preliminares também sugerem que NIBP pode ser um regulador da expressão do gene Bcl-xL, assim como da diferenciação neuronal, sendo identificado como uma nova proteína ligante de NIK e IKKβ que é expressa principalmente em cérebro, músculo, coração e rim (Hu et al. 2005). Uma observação extremamente interessante foi a identificação de uma possível regulação negativa entre os genes NDE1/MYH1 em CCR a partir da formação de um par senso-antisenso. Esses dois genes apresentam sobreposição conservada em vários 79 genomas de mamíferos, como camundongo, chimpanzé e cão, além de galinha e moscade-frutas, sugerindo que eles formam um par regulatório funcional. De fato, existem estudos com murinos sugerindo que a expressão de um parálogo de MYH11, que codifica para uma cadeia pesada da miosina, e que é regulado pelas mensagens antisenso transcritas na fita minus do gene (Luther et al. 2005). Em conclusão, os transcritos codificadores e não-codificadores identificados nesta tese representam um conjunto interessante para exploração futura, cujas vias de regulação podem ser úteis como objeto de estudo para diagnóstico e tratamento de CCR, assim como em estudos da biologia molecular dessa classe de tumores. Como discutimos inicialmente, embora o uso da metilação de SIN3B como marcador precoce em CCR possa ser dificultado pela ausência observada de metilação diferencial entre o tumor e o tecido não tumoral adjacente, a lista apresentada de genes com expressão diminuída representa ainda potenciais alvos de estudos adicionais de metilação, já que estes genes podem ter tido sua expressão diminuída através de um mecanismo envolvendo metilação da região promotora. Como existe evidência acumulada de que a metilação é freqüente e pode ocorrer no início do processo de formação tumoral (Cairns 2007), a detecção de metilação diferencial entre tumor e o tecido normal adjacente pode ser assim de especial interesse em tumores que se tornam clinicamente evidentes apenas num estágio avançado, como é o caso do CCR, o qual é difícil de diagnosticar num estágio inicial devido à ausência de sintomas clínicos evidentes. De fato, quando o CCR se torna clinicamente sintomático, em torno de 30% dos pacientes já apresentam metástases (Engwegen et al. 2007). Nesse sentido, vale ainda notar que se o CCR for detectado e tratado na sua fase inicial, enquanto o tumor estiver restrito ao rim, os pacientes apresentam uma boa sobrevida (95% em 5 anos). Porém, quando os pacientes 80 se apresentam com doença avançada, eles apresentam sobrevida de apenas 18% em dois anos (Linehan et al. 2004). Como discutido na introdução desta tese, a identificação de alvos promissores para o tratamento do CCR é importante para uma mudança no padrão de desenvolvimento de novos fármacos de uma abordagem por seleção aleatória para uma mais mecanística e racional. Assim, nossos resultados contribuem, por meio dos genes identificados como diferencialmente expressos, para identificação de potenciais vias regulatórias envolvidas com a biologia do CCR e, por conseqüência, de potenciais alvos terapêuticos merecedores de estudos mais aprofundados, com vistas ao desenvolvimento de ferramentas de tratamento mais seguras e eficazes. 81 6. CONCLUSÕES 1) A análise dos níveis de expressão de amostras de carcinoma de célula renal e seu tecido não-tumoral adjacente, revelou, além de transcritos codificadores, uma fração de transcritos não-codificadores com expressão diferencial. 2) Há uma expressão ubíqua de transcritos não-codificadores nunca antes descrita em CCR. 3) Transcritos não-codificadores não diferem essencialmente dos transcritos codificadores em termos de amplitude de expressão, ou seja, a distribuição da atividade transcricional desses transcritos não difere significativamente daquela dos transcritos codificadores. 4) Foram identificados 55 transcritos com expressão significativamente diminuída em CCR célula clara em relação ao tecido não tumoral adjacente, apontando para novos genes e vias com possível papel supressor de tumor em CCR. 5) Entre os genes com expressão diminuída em CCR selecionados para análise de metilação, apenas um deles (SIN3B) mostrou evidência de metilação na região promotora. d No entanto, não foi observada metilação diferencial entre as amostras de CCR e as amostras de tecido não-tumoral adjacente. Esses resultados sugerem que outros mecanismos regulatórios devem ser preponderantes na regulação dos transcritos identificados com expressão diminuida em CCR. 6) Em conjunto, os resultados apontam para um possível papel de transcritos nãocodificadores em processos biológicos relacionados a oncogênese e/ou progressão de CCR. 82 7. REFERÊNCIAS (2004). "Finishing the euchromatic sequence of the human genome." Nature 431(7011): 931-45. Adams, M. D., S. E. Celniker, et al. (2000). "The genome sequence of Drosophila melanogaster." Science 287(5461): 2185-2195. Adjei, A. A., G. A. Croghan, et al. (2003). "A Phase I trial of the farnesyl protein transferase inhibitor R115777 in combination with gemcitabine and cisplatin in patients with advanced cancer." Clin Cancer Res 9(7): 2520-6. Allison, D. B., X. Cui, et al. (2006). "Microarray data analysis: from disarray to consolidation and consensus." Nat Rev Genet 7(1): 55-65. Almeida, R. and R. C. Allshire (2005). "RNA silencing and genome regulation." Trends Cell Biol 15(5): 251-8. Amin, M. B., M. B. Amin, et al. (2002). "Prognostic impact of histologic subtyping of adult renal epithelial neoplasms: an experience of 405 cases." Am J Surg Pathol 26(3): 281-91. Atkins, M. B., M. Regan, et al. (2004). "Update on the role of interleukin 2 and other cytokines in the treatment of patients with stage IV renal carcinoma." Clin Cancer Res 10(18 Pt 2): 6342S-6S. Bartel, D. P. (2004). "MicroRNAs: genomics, biogenesis, mechanism, and function." Cell 116(2): 281-97. Baylin, S. B. and J. G. Herman (2000). "DNA hypermethylation in tumorigenesis: epigenetics joins genetics." Trends Genet 16(4): 168-74. Bertone, P., V. Stolc, et al. (2004). "Global identification of human transcribed sequences with genome tiling arrays." Science 306(5705): 2242-2246. Bird, A. (2002). "DNA methylation patterns and epigenetic memory." Genes Dev 16(1): 6-21. Birney, E., J. A. Stamatoyannopoulos, et al. (2007). "Identification and analysis of functional elements in 1% of the human genome by the ENCODE pilot project." Nature 447(7146): 799-816. Boer, J. M., W. K. Huber, et al. (2001). "Identification and classification of differentially expressed genes in renal cell carcinoma by expression profiling on a global human 31,500-element cDNA array." Genome Res 11(11): 1861-70. Breault, J. E., H. Shiina, et al. (2005). "Methylation of the gamma-catenin gene is associated with poor prognosis of renal cell carcinoma." Clin Cancer Res 11(2 Pt 1): 557-64. Cairns, P. (2007). "Gene methylation and early detection of genitourinary cancer: the road ahead." Nat Rev Cancer 7(7): 531-43. Calin, G. A., C. D. Dumitru, et al. (2002). "Frequent deletions and down-regulation of micro- RNA genes miR15 and miR16 at 13q14 in chronic lymphocytic leukemia." Proc Natl Acad Sci U S A 99(24): 15524-9. 83 Calin, G. A., C. Sevignani, et al. (2004). "Human microRNA genes are frequently located at fragile sites and genomic regions involved in cancers." Proc. Natl. Acad. Sci. USA 101(9): 2999-3004. Camargo, A. A., H. P. Samaia, et al. (2001). "The contribution of 700,000 ORF sequence tags to the definition of the human transcriptome." Proc Natl Acad Sci U S A 98(21): 12103-8. Cangiano, T., J. Liao, et al. (1999). "Sarcomatoid renal cell carcinoma: biologic behavior, prognosis, and response to combined surgical resection and immunotherapy." J Clin Oncol 17(2): 523-8. Chen, J., M. Sun, et al. (2005). "Genome-wide analysis of coordinate expression and evolution of human cis-encoded sense-antisense transcripts." Trends Genet 21(6): 326-9. Chen, J., M. Sun, et al. (2005). "Human antisense genes have unusually short introns: evidence for selection for rapid transcription." Trends Genet 21(4): 203-7. Cheng, J., P. Kapranov, et al. (2005). "Transcriptional maps of 10 human chromosomes at 5-nucleotide resolution." Science 308(5725): 1149-54. Comander, J., S. Natarajan, et al. (2004). "Improving the statistical detection of regulated genes from microarray data using intensity-based variance estimation." BMC Genomics 5(1): 17. Devilard, E., F. Bladou, et al. (2006). "FGFR1 and WT1 are markers of human prostate cancer progression." BMC Cancer 6: 272. Dias-Neto, E., R. G. Correa, et al. (2000). "Shotgun sequencing of the human transcriptome with ORF expressed sequence tags." Proc. Natl. Acad. Sci. USA 97(7): 3491-3496. Draghici, S., P. Khatri, et al. (2006). "Reliability and reproducibility issues in DNA microarray measurements." Trends Genet 22(2): 101-9. Dulaimi, E., I. Ibanez de Caceres, et al. (2004). "Promoter hypermethylation profile of kidney cancer." Clin Cancer Res 10(12 Pt 1): 3972-9. Eble, J. N., World Health Organization., et al. (2004). Pathology and genetics of tumours of the urinary system and male genital organs. Lyon Oxford, IARC Press ; Oxford University Press (distributor. Engwegen, J. Y., N. Mehra, et al. (2007). "Validation of SELDI-TOF MS serum protein profiles for renal cell carcinoma in new populations." Lab Invest 87(2): 161-72. Esteller, M., P. G. Corn, et al. (2001). "A gene hypermethylation profile of human cancer." Cancer Res 61(8): 3225-9. Ficarra, V., R. Righetti, et al. (2002). "Prognostic factors in patients with renal cell carcinoma: retrospective analysis of 675 cases." Eur Urol 41(2): 190-8. Flanigan, R. C., S. C. Campbell, et al. (2003). "Metastatic renal cell carcinoma." Curr Treat Options Oncol 4(5): 385-90. Fossa, S. D. (2000). "Interferon in metastatic renal cell carcinoma." Semin Oncol 27(2): 187-93. 84 Furge, K. A., K. A. Lucas, et al. (2004). "Robust classification of renal cell carcinoma based on gene expression data and predicted cytogenetic profiles." Cancer Res 64(12): 4117-21. Gao, Q., J. Zhou, et al. (2006). "Selective targeting of checkpoint kinase 1 in tumor cells with a novel potent oncolytic adenovirus." Mol Ther 13(5): 928-37. Gieseg, M. A., T. Cody, et al. (2002). "Expression profiling of human renal carcinomas with functional taxonomic analysis." BMC Bioinformatics 3: 26. Goodrich, J. A. and J. F. Kugel (2006). "Non-coding-RNA regulators of RNA polymerase II transcription." Nat Rev Mol Cell Biol 7(8): 612-6. Griffiths-Jones, S., R. J. Grocock, et al. (2006). "miRBase: microRNA sequences, targets and gene nomenclature." Nucleic Acids Res 34(Database issue): D140-4. Grunau, C., S. J. Clark, et al. (2001). "Bisulfite genomic sequencing: systematic investigation of critical experimental parameters." Nucleic Acids Res 29(13): E65-5. Herman, J. G., F. Latif, et al. (1994). "Silencing of the VHL tumor-suppressor gene by DNA methylation in renal carcinoma." Proc Natl Acad Sci U S A 91(21): 97004. Higgins, J. P., R. Shinghal, et al. (2003). "Gene expression patterns in renal cell carcinoma assessed by complementary DNA microarray." Am J Pathol 162(3): 925-32. Hirota, E., L. Yan, et al. (2006). "Genome-wide gene expression profiles of clear cell renal cell carcinoma: identification of molecular targets for treatment of renal cell carcinoma." Int J Oncol 29(4): 799-827. Hu, W. H., J. S. Pendergast, et al. (2005). "NIBP, a novel NIK and IKK(beta)-binding protein that enhances NF-(kappa)B activation." J Biol Chem 280(32): 29233-41. Huang, S., R. M. Garbaccio, et al. (2006). "Development of 6-substituted indolylquinolinones as potent Chek1 kinase inhibitors." Bioorg Med Chem Lett 16(22): 5907-12. Iliopoulos, O. (2006). "Molecular biology of renal cell cancer and the identification of therapeutic targets." J Clin Oncol 24(35): 5593-600. Inoue, H., N. Nonomura, et al. (2007). "Somatic mutations of the von Hippel-Lindau disease gene in renal carcinomas occurring in patients with long-term dialysis." Nephrol Dial Transplant 22(7): 2052-5. Iorio, M. V., M. Ferracin, et al. (2005). "MicroRNA gene expression deregulation in human breast cancer." Cancer Res 65(16): 7065-70. Iseli, C., C. V. Jongeneel, et al. (1999). "ESTScan: a program for detecting, evaluating, and reconstructing potential coding regions in EST sequences." Proc. Int. Conf. Intell. Syst. Mol. Biol.: 138-148. Jeronimo, C., H. Usadel, et al. (2001). "Quantitation of GSTP1 methylation in nonneoplastic prostatic tissue and organ-confined prostate adenocarcinoma." J Natl Cancer Inst 93(22): 1747-52. 85 Jones, J., H. Otu, et al. (2005). "Gene signatures of progression and metastasis in renal cell cancer." Clin Cancer Res 11(16): 5730-9. Jones, P. A. and S. B. Baylin (2007). "The epigenomics of cancer." Cell 128(4): 683-92. Jones, P. A. and P. W. Laird (1999). "Cancer epigenetics comes of age." Nat Genet 21(2): 163-7. Kampa, D., J. Cheng, et al. (2004). "Novel RNAs Identified From an In-Depth Analysis of the Transcriptome of Human Chromosomes 21 and 22." Genome Res. 14(3): 331-342. Kapranov, P., S. E. Cawley, et al. (2002). "Large-scale transcriptional activity in chromosomes 21 and 22." Science 296(5569): 916-919. Kapranov, P., J. Drenkow, et al. (2005). "Examples of the complex architecture of the human transcriptome revealed by RACE and high-density tiling arrays." Genome Res 15(7): 987-97. Katayama, S., Y. Tomaru, et al. (2005). "Antisense transcription in the mammalian transcriptome." Science 309(5740): 1564-6. Kiyosawa, H., I. Yamanaka, et al. (2003). "Antisense transcripts with FANTOM2 clone set and their implications for gene regulation." Genome Res. 13(6B): 1324-1334. Kopper, L. and J. Timar (2006). "Genomics of renal cell cancer-- does it provide breakthrough?" Pathol Oncol Res 12(1): 5-11. Korfali, N., S. Ruchaud, et al. (2004). "Caspase-7 gene disruption reveals an involvement of the enzyme during the early stages of apoptosis." J Biol Chem 279(2): 1030-9. Korneev, S. and M. O'Shea (2005). "Natural antisense RNAs in the nervous system." Rev Neurosci 16(3): 213-22. Korostishevsky, M., M. Kaganovich, et al. (2004). "Is the G72/G30 locus associated with schizophrenia? single nucleotide polymorphisms, haplotypes, and gene expression analysis." Biol Psychiatry 56(3): 169-76. Kosari, F., A. S. Parker, et al. (2005). "Clear cell renal cell carcinoma: gene expression analyses identify a potential signature for tumor aggressiveness." Clin Cancer Res 11(14): 5128-39. Kurella, M., L. L. Hsiao, et al. (2001). "DNA microarray analysis of complex biologic processes." J Am Soc Nephrol 12(5): 1072-8. Lakhani, S. A., A. Masud, et al. (2006). "Caspases 3 and 7: key mediators of mitochondrial events of apoptosis." Science 311(5762): 847-51. Larkin, J. E., B. C. Frank, et al. (2005). "Independence and reproducibility across microarray platforms." Nat Methods 2(5): 337-44. Lauffart, B., M. M. Vaughan, et al. (2005). "Aberrations of TACC1 and TACC3 are associated with ovarian cancer." BMC Womens Health 5: 8. Lavorgna, G., D. Dahary, et al. (2004). "In search of antisense." Trends Biochem Sci 29(2): 88-94. 86 Lenburg, M. E., L. S. Liou, et al. (2003). "Previously unidentified changes in renal cell carcinoma gene expression identified by parametric analysis of microarray data." BMC Cancer 3: 31. Lestrade, L. and M. J. Weber (2006). "snoRNA-LBME-db, a comprehensive database of human H/ACA and C/D box snoRNAs." Nucleic Acids Res 34(Database issue): D158-62. Levy, D. E. and J. E. Darnell, Jr. (2002). "Stats: transcriptional control and biological impact." Nat Rev Mol Cell Biol 3(9): 651-62. Linehan, W. M. and B. Zbar (2004). "Focus on kidney cancer." Cancer Cell 6(3): 223-8. Liou, L. S., T. Shi, et al. (2004). "Microarray gene expression profiling and analysis in renal cell carcinoma." BMC Urol 4: 9. Lodygin, D., A. Epanchintsev, et al. (2005). "Functional epigenomics identifies genes frequently silenced in prostate cancer." Cancer Res 65(10): 4218-27. Louro, R., H. I. Nakaya, et al. (2007). "Androgen responsive intronic non-coding RNAs." BMC Biol 5(1): 4. Lu, J., G. Getz, et al. (2005). "MicroRNA expression profiles classify human cancers." Nature 435(7043): 834-8. Luther, H. P., H. Bartsch, et al. (2005). "Regulation of naturally occurring antisense RNA of myosin heavy chain (MyHC) in neonatal cardiomyocytes." J Cell Biochem 94(4): 848-55. Marsden, V. S., L. O'Connor, et al. (2002). "Apoptosis initiated by Bcl-2-regulated caspase activation independently of the cytochrome c/Apaf-1/caspase-9 apoptosome." Nature 419(6907): 634-7. Mattick, J. S. (2003). "Challenging the dogma: the hidden layer of non-protein-coding RNAs in complex organisms." Bioessays 25(10): 930-9. Mattick, J. S. (2004). "RNA regulation: a new genetics?" Nat Rev Genet 5(4): 316-23. Michael, A. and H. S. Pandha (2003). "Renal-cell carcinoma: tumour markers, T-cell epitopes, and potential for new therapies." Lancet Oncol 4(4): 215-23. Moch, H., T. Gasser, et al. (2000). "Prognostic utility of the recently recommended histologic classification and revised TNM staging system of renal cell carcinoma: a Swiss experience with 588 tumors." Cancer 89(3): 604-14. Moch, H., P. Schraml, et al. (1999). "High-throughput tissue microarray analysis to evaluate genes uncovered by cDNA microarray screening in renal cell carcinoma." Am J Pathol 154(4): 981-6. Morris, M. R., D. Gentle, et al. (2005). "Tumor suppressor activity and epigenetic inactivation of hepatocyte growth factor activator inhibitor type 2/SPINT2 in papillary and clear cell renal cell carcinoma." Cancer Res 65(11): 4598-606. Morris, M. R., L. B. Hesson, et al. (2003). "Multigene methylation analysis of Wilms' tumour and adult renal cell carcinoma." Oncogene 22(43): 6794-801. Motzer, R. J., M. Mazumdar, et al. (1999). "Survival and prognostic stratification of 670 patients with advanced renal cell carcinoma." J Clin Oncol 17(8): 2530-40. 87 Motzer, R. J. and P. Russo (2000). "Systemic therapy for renal cell carcinoma." J Urol 163(2): 408-17. Na, X., G. Wu, et al. (2003). "Overproduction of vascular endothelial growth factor related to von Hippel-Lindau tumor suppressor gene mutations and hypoxiainducible factor-1 alpha expression in renal cell carcinomas." J Urol 170(2 Pt 1): 588-92. Nadon, R. and J. Shoemaker (2002). "Statistical issues with microarrays: processing and analysis." Trends Genet 18(5): 265-71. Nakaya, H. I., P. P. Amaral, et al. (2007). "Genome mapping and expression analyses of human intronic noncoding RNAs reveal tissue-specific patterns and enrichment in genes related to regulation of transcription." Genome Biol 8(3): R43. Novoradovskaya, N., M. L. Whitfield, et al. (2004). "Universal Reference RNA as a standard for microarray experiments." BMC Genomics 5(1): 20. O'Keefe, S. C., F. F. Marshall, et al. (2002). "Thrombocytosis is associated with a significant increase in the cancer specific death rate after radical nephrectomy." J Urol 168(4 Pt 1): 1378-80. Okuda, H., M. Toyota, et al. (2006). "Epigenetic inactivation of the candidate tumor suppressor gene HOXB13 in human renal cell carcinoma." Oncogene 25(12): 1733-42. Oya, M., A. Takayanagi, et al. (2003). "Increased nuclear factor-kappa B activation is related to the tumor development of renal cell carcinoma." Carcinogenesis 24(3): 377-84. Peixoto, B. R., R. Z. Vencio, et al. (2006). "Evaluation of reference-based two-color methods for measurement of gene expression ratios using spotted cDNA microarrays." BMC Genomics 7: 35. Pfaffl, M. W. (2001). "A new mathematical model for relative quantification in realtime RT-PCR." Nucleic Acids Res 29(9): e45. Quackenbush, J. (2002). "Microarray data normalization and transformation." Nat Genet 32 Suppl: 496-501. Rayet, B. and C. Gelinas (1999). "Aberrant rel/nfkb genes and activity in human cancer." Oncogene 18(49): 6938-47. Reis, E. M., H. I. Nakaya, et al. (2004). "Antisense intronic non-coding RNA levels correlate to the degree of tumor differentiation in prostate cancer." Oncogene 23(39): 6684-6692. Richardson, C. C., K. Hussain, et al. (2007). "Low levels of glucose transporters and K+ATP channels in human pancreatic beta cells early in development." Diabetologia 50(5): 1000-5. Rinn, J. L., G. Euskirchen, et al. (2003). "The transcriptional activity of human Chromosome 22." Genes Dev. 17(4): 529-540. Rohan, S., J. J. Tu, et al. (2006). "Gene expression profiling separates chromophobe renal cell carcinoma from oncocytoma and identifies vesicular transport and cell junction proteins as differentially expressed genes." Clin Cancer Res 12(23): 6937-45. 88 Saito, M., I. Szakall, et al. (2004). "Mouse striatal transcriptome analysis: effects of oral self-administration of alcohol." Alcohol 32(3): 223-41. Sanz-Casla, M. T., M. L. Maestro, et al. (2003). "Loss of heterozygosity and methylation of p16 in renal cell carcinoma." Urol Res 31(3): 159-62. Sasaki, Y. T., M. Sano, et al. (2007). "Identification and characterization of human noncoding RNAs with tissue-specific expression." Biochem Biophys Res Commun 357(4): 991-6. Schuetz, A. N., Q. Yin-Goen, et al. (2005). "Molecular classification of renal tumors by gene expression profiling." J Mol Diagn 7(2): 206-18. Shoemaker, D. D., E. E. Schadt, et al. (2001). "Experimental annotation of the human genome using microarray technology." Nature 409(6822): 922-927. Siddiqui, A. S., J. Khattra, et al. (2005). "A mouse atlas of gene expression: large-scale digital gene-expression profiles from precisely defined developing C57BL/6J mouse tissues and cells." Proc Natl Acad Sci U S A 102(51): 18485-90. Skubitz, K. M. and A. P. Skubitz (2002). "Differential gene expression in renal-cell cancer." J Lab Clin Med 140(1): 52-64. Sosman, J. A., I. Puzanov, et al. (2007). "Opportunities and obstacles to combination targeted therapy in renal cell cancer." Clin Cancer Res 13(2 Pt 2): 764s-769s. Still, I. H., M. Hamilton, et al. (1999). "Cloning of TACC1, an embryonically expressed, potentially transforming coiled coil containing gene, from the 8p11 breast cancer amplicon." Oncogene 18(27): 4032-8. Suganuma, N., F. Segade, et al. (2007). "Differential expression of facilitative glucose transporters in normal and tumour kidney tissues." BJU Int 99(5): 1143-9. Sultmann, H., A. von Heydebreck, et al. (2005). "Gene expression in kidney cancer is associated with cytogenetic abnormalities, metastasis formation, and patient survival." Clin Cancer Res 11(2 Pt 1): 646-55. Syljuasen, R. G., C. S. Sorensen, et al. (2005). "Inhibition of human Chk1 causes increased initiation of DNA replication, phosphorylation of ATR targets, and DNA breakage." Mol Cell Biol 25(9): 3553-62. Takahashi, M., D. R. Rhodes, et al. (2001). "Gene expression profiling of clear cell renal cell carcinoma: gene identification and prognostic classification." Proc Natl Acad Sci U S A 98(17): 9754-9. Takahashi, M., X. J. Yang, et al. (2003). "Molecular subclassification of kidney tumors and the discovery of new diagnostic markers." Oncogene 22(43): 6810-8. Takai, D. and P. A. Jones (2002). "Comprehensive analysis of CpG islands in human chromosomes 21 and 22." Proc Natl Acad Sci U S A 99(6): 3740-5. Tusher, V. G., R. Tibshirani, et al. (2001). "Significance analysis of microarrays applied to the ionizing radiation response." Proc. Natl. Acad. Sci. USA 98(9): 51165121. Twiddy, D., G. M. Cohen, et al. (2006). "Caspase-7 is directly activated by the approximately 700-kDa apoptosome complex and is released as a stable XIAPcaspase-7 approximately 200-kDa complex." J Biol Chem 281(7): 3876-88. 89 Twine, N. C., J. A. Stover, et al. (2003). "Disease-associated expression profiles in peripheral blood mononuclear cells from patients with advanced renal cell carcinoma." Cancer Res 63(18): 6069-75. Van Erp, F., C. Van Ravenswaaij, et al. (2003). "Chromosome 3 translocations and the risk to develop renal cell cancer: a Dutch intergroup study." Genet Couns 14(2): 149-54. Vasselli, J. R., J. H. Shih, et al. (2003). "Predicting survival in patients with metastatic kidney cancer by gene-expression profiling in the primary tumor." Proc Natl Acad Sci U S A 100(12): 6958-63. Volinia, S., G. A. Calin, et al. (2006). "A microRNA expression signature of human solid tumors defines cancer gene targets." Proc Natl Acad Sci U S A 103(7): 2257-61. Wang, E., L. D. Miller, et al. (2000). "High-fidelity mRNA amplification for gene profiling." Nat Biotechnol 18(4): 457-9. Yamada, D., S. Kikuchi, et al. (2006). "Promoter hypermethylation of the potential tumor suppressor DAL-1/4.1B gene in renal clear cell carcinoma." Int J Cancer 118(4): 916-23. Yamazaki, K., M. Sakamoto, et al. (2003). "Overexpression of KIT in chromophobe renal cell carcinoma." Oncogene 22(6): 847-52. Yang, J., S. Aittomaki, et al. (2002). "Identification of p100 as a coactivator for STAT6 that bridges STAT6 with RNA polymerase II." Embo J 21(18): 4950-8. Yang, Y. H. and T. Speed (2002). "Design issues for cDNA microarray experiments." Nat Rev Genet 3(8): 579-88. Yao, M., H. Tabuchi, et al. (2005). "Gene expression analysis of renal carcinoma: adipose differentiation-related protein as a potential diagnostic and prognostic biomarker for clear-cell renal carcinoma." J Pathol 205(3): 377-87. Yelin, R., D. Dahary, et al. (2003). "Widespread occurrence of antisense transcription in the human genome." Nat. Biotechnol. 21(4): 379-386. Yin-Goen, Q., J. Dale, et al. (2006). "Advances in molecular classification of renal neoplasms." Histol Histopathol 21(3): 325-39. Young, A. N., M. B. Amin, et al. (2001). "Expression profiling of renal epithelial neoplasms: a method for tumor classification and discovery of diagnostic molecular markers." Am J Pathol 158(5): 1639-51. 90 ANEXO I − Curriculum Vitae GLAUBER COSTA BRITO E-mail: [email protected] Data de nascimento: 29 de novembro de 1968 – Local: Nanuque-MG E-mail: [email protected] TITULAÇÃO: Doutorado em Ciências Departamente de Bioquímica Universidade de São Paulo 2002 Mestrado em Biotecnologia Departamente de Bioquímica Universidade de São Paulo 2000 - 2002 Graduação em Farmácia-bioquímica Faculdade de Ciências Farmacêuticas Universidade de São Paulo 1993 - 1999 EXPERIÊNCIA EM ENSINO: Monitor do Programa de Aperfeiçoamento de Ensino (PAE) da Universidade de São Paulo na disciplina QBQ 214 - Bioquímica: Metabolismo e Biologia Molecular sob supervisão do Prof. Dr. Mario José Politi no 2º semestre de 2005. Monitor do Programa de Aperfeiçoamento de Ensino (PAE) da Universidade de São Paulo na disciplina QBQ 214 - Bioquímica: Metabolismo e Biologia Molecular sob supervisão do Prof. Dr. Mario José Politi no 2º semestre de 2004. Professor do curso "DNA: Técnicas e Aplicações" realizado durante a XXXII Reunião Anual da Sociedade Brasileira de Bioquímica (SBBq) em maio de 2003 em Caxambu/MG sob supervisão do Prof. Dr. Bayardo Torres. Professor do curso "DNA: Técnicas e Aplicações" realizado durante a XXXI Reunião Anual da Sociedade Brasileira de Bioquímica (SBBq) em maio de 2002 em Caxambu/MG sob supervisão do Prof. Dr. Bayardo Torres. Professor do curso de verão "Tecnologia do DNA" realizado na Universidade de São Paulo em janeiro de 2002 sob supervisão do Prof. Dr. Bayardo Torres. TRABALHOS EM CONGRESSOS: Trabalho em evento nacional: 91 1. Brito, G. C.; Fachel, A; Campos, F. S. ; Barcinski, M. A.; Verjovski, S; E. M. Reis. Identification of Novel Candidate Markers of Renal Cell Carcinoma by cDNA Microarrays Analysis. 51o Congresso Brasileiro de Genética, 2005, Águas de Lindóia, SP, Brasil. 2. Brito, G. C. ; E. M. Reis ; Fachel, A; Verjovski, S. Differential Gene Expression of Renal Cell Carcinoma Using cDNA Microarrays. In: 50o Congresso Brasileiro de Genética, 2004, Florianópolis, Brasil. p. 48-48. 3. E. M. Reis ;Brito, G. C.; Verjovski, S.. Antisense Intronic Non-coding RNA Levels Correlate to the Degree of Tumor Differentiation in Prostate Cancer. In: 50o Congresso Brasileiro de Genética, 2004, Florianópolis, Brasil. p. 53-53. 4. Brito, G. C. ; E. M. Reis ; Verjovski-Almeida, S. Gene Expression Profiling of Renal Cell Carcinoma by Using cDNA Microarrays. In: XXXII Encontro Anual da Sociedade Brasileira de Bioquímica, SBBq, 2003, Caxambu, Brasil. p. 12-12. 5. Torres, B.B.; Brito, G. C.. A Molecular Biology Course for Biology Teachers. In: XXXI Encontro Anual da Sociedade Brasileira de Bioquímica, SBBq, 2002, Caxambu, Brasil. p. 118118. Trabalho em evento internacional: 1. Brito, G.C. ; Fachel, A.A. ; Campos, F.S. ; Barcinski, M.A. ; Verjovski-Almeida, S.; Reis, E.M. Novel molecular markers of renal cell carcinoma identified by gene expression analysis using cDNA microarrays In: In: Keystone Symposia: Emerging Genomic Biomarkers: Impact on Drug Discovery and Clinical Practice, 2006, Victoria, Canadá. CURSOS: Genomes, Browsers and Databases: Tools for Automated Data Integration Across Multiple Genomes. Curso internacional realizado no “14th Annual Meeting of the International Society for Computational Biology” em 6-10 de agosto de 2006. Fortaleza, Ceará. Acessing the Human Genome Sequence. The Wellcome Trust / Cold Spring Harbor Joint Course. Curso internacional realizado no Instituto Ludwig em 7-9 de fevereiro de 2006. São Paulo, SP. PUBLICAÇÕES CiENTÍFICAS: Reis EM, Nakaya HI, Louro R, Canavez FC, Flatschart AV, Almeida GT, Egidio CM, Paquola AC, Machado AA, Festa F, Yamamoto D, Alvarenga R, da Silva CC, Brito G.C, Simon SD, Moreira-Filho CA, Leite KR, Camara-Lopes LH, Campos FS, Gimba E, Vignal GM, El-Dorry H, Sogayar MC, Barcinski MA, da Silva AM, Verjovski-Almeida S. Antisense intronic noncoding RNA levels correlate to the degree of tumor differentiation in prostate cancer. Oncogene. 2004, 23(39):6684-92. Brito G.C., Fachel A.A., Vettore A.L., Campos F.C., Barcinski M.A., Verjovski-Almeida S. and Reis E.M. Identification of coding and noncoding RNAs down-regulated in renal cell carcinoma. (versão revisada re-submetida para revista Molecular Carcinogenesis em agosto/2007). 92 ANEXO II − Descrição das abordagens estatísticas utilizadas para seleção de genes diferencialmente expressos Significance Analysis of Microarrays (SAM) A abordagem estística Significance Analysis of Microarrays (SAM) descrita em (Tusher et al. 2001) está implementada como um add-in do Excel ou um programa standalone no ambiente R. Trata-se de uma abordagem baseada na variação aleatória dos dados, ou seja, considerando que a razão sinal/ruído (signal-to-noise ratio) geralmente diminui com a diminuição do sinal, há casos em que, mesmo para um dado nível de expressão, as variações - isto é, a variância do sinal - são gene-específicas e independem do intervalo de intensidade ao qual pertencem. Para administrar essas variações específicas, o programa define uma estatística baseada na diferença relativa d(i): d (i ) = x A (i ) − xB (i ) s (i ) + s0 onde x A (i ) e x B (i ) são os níveis médios de expressão do gene (i ) nas condições A e B, respectivamente; s (i ) é o desvio-padrão de todas as réplicas das condições A e B. A fim de comparar os valores de d (i ) entre todos os genes e poder compará-los entre si, a distribuição de d (i ) deve ser independente do nível de expressão do gene. Para garantir que a variância de d (i ) seja independente da expressão do gene, já que existe uma relação entre nível de expressão e variância, o programa adiciona uma pequena constante positiva s0 ao denominador da equação acima. O coeficiente de variação de 93 d (i ) é calculado como uma função de s (i ) nas janelas ao longo dos dados. O valor de s0 é escolhido pelo programa de modo a minimizar o coeficiente de variação de d (i ) . Quando é construído o gráfico de d (i ) versus s (i ) a partir de amostras diferentes (por exemplo, A e B) e amostras idênticas (por exemplo, A e A ou B e B), há no primeiro caso uma dispersão maior dos dados, ou seja, a variância de d (i ) é maior, resultado da expressão diferencial dos genes mais a variância técnica, a qual pode ser avaliada comparando-a com a dispersão de d (i ) no gráfico obtido a partir de amostras idênticas, as quais apresentam, em tese, apenas variância técnica. A fim de simular essa situação, o programa realiza permutações entre os dados de expressão das 2 classes sendo comparadas (A e B) gerando novos conjuntos de dados aleatórios misturando as 2 classes e calculando a diferença relativa d p (i ) entre esses conjuntos. Para identificar diferenças significativas na expressão dos genes, os mesmos são ordenados segundo a magnitude de d (i ) . Para cada permutação, os genes são igualmente ordenados segundo as diferenças relativas d p (i ) . A diferença relativa esperada, d E (i ) , é definida como sendo a média entre as permutações, d E (i ) = ∑ p d p (i ) / p , onde p é o número de permutações. A fim de identificar diferenças potencialmente significativas, o programa utiliza o gráfico da diferença relativa observada d (i ) versus a diferença relativa esperada d E (i ) . Genes que apresentam um deslocamento (Δ) acentuado da linha que define d (i ) = d E (i ) , istoé, que apresentam uma diferença relativa observada maior do que a esperada a partir da permutação aleatória dos dados, são candidatos a expressão diferencial entre as condições testadas. O valor de Δ é pré-estabelecido pelo usuário e 94 irá definir o limiar a partir do qual o programa considerará uma diferença como significativa (Figura 18). Figura 18 – Gráfico de saída do programa SAM mostrando a diferença relativa observada d (i ) (eixo Y no gráfico) versus a diferença relativa esperada d E (i ) (eixo X no gráfico). A linha azul indica a região onde d (i) = d E (i ) . A linha preta tracejada delimita a região a partir da qual qualquer ponto dista um valor maior que Δ da linha azul. No caso, Δ = 1,82614. Em vermelho e verde, os genes com expressão diferencial significativa. Significant: 208 Delta 1.82614 SAM Plot Median # false significant: 12.41454 Fold Change 40 30 Observed 20 10 0 -10 -8 -6 -4 -2 0 2 4 6 8 10 -10 -20 Expected Para calcular o número de falso-positivos, a faixa de corte é definida a partir do menor d (i ) entre os genes considerados significativamente induzidos e o d (i ) menos negativo entre os genes considerados significativamente reprimidos. O número de falsopositivos é calculado em cada permutação considerando o número de genes que ultrapassaram aquela faixa de corte, e finalmente é calculada uma média do número de falso-positivos entre todas as permutações. 95 O programa calcula ainda um q-valor, que é a menor taxa de falso-positivo em que o gene é considerado significativo. O q-valor mede quão significativo é um gene: à medida que | d (i ) | aumenta, o q-valor correspondente diminui. Teste Z (ArrayStat) Em princípio, qualquer análise estatística para identificar genes diferencialmente expressos depende da medida de variância dos genes nas amostras a fim de determinar se a diferença de expressão observada entre 2 condições se deve a um evento aleatório ou reflete de fato um fenômeno biológico. Genes com alta variância na razão de expressão entre condições (por exemplo, entre tumor e normal) apresentam baixa probabilidade de estarem verdadeiramente diferencialmente expressos. Esta idéia pode ser expressa matematicamente como um teste estatístico em que o numerador contém uma estimativa do tamanho do efeito (razão tumor/normal, por exemplo) e o denominador inclui o valor da variância. O ponto crítico é a escolha do numerador e denominador do teste estatístico a fim de fazer melhor uso dos dados disponíveis. O teste t de Student, por exemplo, é calculado segundo: t= M avg σM N Onde Mavg é o logratio (ou razão) médio, σM é o desvio-padrão das réplicas e N o número de réplicas. Assim, quanto maior o valor de t, mais significativa é a diferença de expressão entre as condições. Considerando esta expressão, fica evidente que um valor de t alto pode ser o resultado ou de um Mavg alto ou de um σM baixo. Como a 96 variância da população é tomada como sendo a própria variância das réplicas, este tipo de teste pode apresentar resultados pouco satisfatórios quando aplicado a um pequeno número de réplicas (p. ex., N = 4) porque, devido ao acaso, as réplicas podem ocasionalmente ser muito semelhantes, produzindo um σM baixo e conseqüentemente um t elevado, resultando num falso-positivo. Para superar este inconveniente, alguns métodos buscam obter uma medida mais precisa da variância de cada gene a partir da estimativa da variância de todos os genes medidos no microarray. Essa estratégia é empregada na implementação do teste Z disponível no programa ArrayStat (Imaging Research Inc.) e baseia-se em uma propriedade já conhecida dos dados de microarray: a dependência da variância em relação à média da intensidade dos spots, ou seja, quanto menor a intensidade do sinal, maior a variância do mesmo (Nadon et al. 2002). Resumidamente, dado um spot com intensidade média X, é possível estimar a sua variância Y interpolando com a função de regressão do gráfico intensidade média versus variância, de modo que todos os spots com intensidade dentro de um determinado intervalo passam a ter variância correspondente à interpolação daquela função (Figura 5). Estas estimativas do desvio-padrão são mais confiáveis do que o erro medido a partir das poucas réplicas de cada gene na lâmina, e podem ser utilizadas para calcular diretamente a estatística Z, usando a mesma fórmula da estatística t, mas que apresenta uma distribuição diferente. Como o teste Z do ArrayStat faz uma estimativa da variância da população a partir de todos os spots do array com mesma intensidade, isto permite que se utilize menos réplicas, 4 ou 6 por exemplo, em vez das 30, no mínimo, que o teste Z padrão preconiza. Por essa razão, o teste Z tem sido utilizado com o objetivo de identificar genes diferencialmente expressos em análises de microarray (Comander et al. 2004; Novoradovskaya et al. 2004; Saito et al. 2004). 97 ANEXO III − Artigo submetido para publicação Molecular Carcinogenesis Identification of protein-coding and intronic noncoding RNAs downregulated in clear cell renal carcinoma r Fo Journal: Manuscript ID: Wiley - Manuscript type: Complete List of Authors: MC-07-0156 Research Article Pe Date Submitted by the Author: Molecular Carcinogenesis 09-Aug-2007 er Brito, Glauber; Universidade de São Paulo, Bioquímica Fachel, Angela; Universidade de São Paulo, Bioquímica Vettore, André; Universidade Federal de São Paulo, Campus Diadema Vignal, Giselle; Instituto Nacional de Câncer, Hospital do Câncer Gimba, Etel; Instituto Nacional de Câncer, Hospital do Câncer Campos, Franz; Instituto Nacional de Câncer, Hospital do Câncer Barcinski, Marcello; Instituto Nacional de Câncer, Hospital do Câncer Verjovski-Almeida, Sergio; Universidade de São Paulo, Bioquímica Reis, Eduardo; Universidade de São Paulo, Bioquímica vi Re Keywords: renal cell carcinoma, noncoding RNA, intronic transcription, tumor suppressor, cDNA microarray ew John Wiley & Sons Page 1 of 29 1 Identification of protein-coding and intronic noncoding RNAs down-regulated in clear cell renal carcinoma Glauber Costa Britoa, Ângela A. Fachela, Andre Luiz Vettorec, Giselle M Vignalb, Etel R. P. Gimbab, Franz S. Camposb, Marcello A. Barcinskib, Sergio Verjovski-Almeidaa and Eduardo a M. Reisa* ee rP Fo Departamento de Bioquímica, Instituto de Química, Universidade de São Paulo, SP, Brasil; b Hospital do Câncer, Instituto Nacional de Câncer/MS, RJ, Brasil; c Universidade Federal de São Paulo, São Paulo, SP, Brasil. *Corresponding author: iew ev rR 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 Molecular Carcinogenesis Dr. Eduardo M. Reis E-mail: [email protected] Tel. +55-11-3091-2173 Fax: +55-11-3091-2186 John Wiley & Sons Molecular Carcinogenesis 2 Abstract The clear cell subtype of renal cell carcinoma (RCC) is the most lethal and prevalent cancer of the urinary system. To investigate the molecular changes associated with malignant transformation in clear cell RCC, the gene expression profiles of matched samples of tumor and adjacent non-neoplastic tissue were obtained from 6 patients. A custom-built cDNA microarray platform was used, comprising 2,292 probes that map to exons of genes and 822 probes for noncoding RNAs mapping to intronic regions. Intronic transcription was detected in all normal rP Fo and neoplastic renal tissues. A subset of 55 transcripts was significantly down-regulated in clear cell RCC relative to the matched non-tumor tissue as determined by a combination of two statistical tests and leave-one-out patient cross-validation. Among the down-regulated transcripts, 49 mapped to untranslated or coding exons and 6 were intronic relative to known ee exons of protein-coding genes. Lower levels of expression of SIN3B, TRIP3, SYNJ2BP and rR NDE1 (p < 0.02), and of intronic transcripts derived from SND1 and ACTN4 loci (p < 0.05), were confirmed in clear cell RCC by Real-time RT-PCR. A subset of 25 transcripts was ev deregulated in additional 6 non-clear cell RCC samples, pointing to common transcriptional alterations in RCC irrespective of the histological subtype or differentiation state of the tumor. iew 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 Page 2 of 29 Our results indicate a novel set of tumor suppressor gene candidates, including noncoding intronic RNAs, which may play a significant role in malignant transformations of normal renal cells. Keywords: clear cell Renal Cell Carcinoma, noncoding RNA, intronic transcription, cDNA microarray, tumor suppressor. Running title: Intronic transcription in renal cell carcinoma John Wiley & Sons Page 3 of 29 3 INTRODUCTION Renal cell carcinoma (RCC) is the most common cancer in the adult kidney, representing 3% of all malignancies worldwide [1]. RCC is a heterogeneous disease, displaying various distinct histological patterns, genetic alterations and clinical and biological behaviors. RCCs are usually classified according to their histological characteristics into clear cell RCC, papillary RCC (15–20%), chromophobe RCC (4–5%), carcinoma of the collecting ducts of Bellini (<1%) and renal medullary carcinoma (<1%) [2]. Clear cell RCC is the most predominant form rP Fo of renal neoplastic disease, accounting for 70-80% of all RCC cases [3]. Several studies based on gene expression profiling have been conducted with the aim of identifying the molecular alterations associated with malignant transformation of renal tissue; ee they have all focused on array platforms containing probes for protein-coding genes [4-7]. These efforts have contributed greatly to delineating the changes in gene expression in renal rR cancer and identifying molecular targets for prognosis and treatment. Despite these major advances, understanding of the molecular mechanisms underlying renal carcinogenesis has ev remained limited because of the complex and multifactorial nature of the disease. iew 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 Molecular Carcinogenesis Our group showed for the first time that long intronic noncoding RNAs mapping to introns of protein-coding genes are ubiquitously transcribed in human prostate tissues, and that the expression levels of a subset of these noncoding RNAs correlate with the degree of malignancy of prostate tumors [8]. More recently, we showed that intronic RNAs may regulate the abundance or the pattern of exon usage in cultured prostate cancer cells [9]. These results are in line with a growing body of evidence in the literature indicating that noncoding RNAs play an important role in regulating gene expression in eukaryotes [10-12] and a change in their expression may play a role in malignancy [13]. John Wiley & Sons Molecular Carcinogenesis 4 The possible correlation between changes in expression of noncoding RNAs and renal cancer has not been studied. In this work, we have analyzed the expression profiles of matched samples of RCC and non-malignant renal tissue using a microarray enriched in cancer-related genes and noncoding intronic RNAs. We found that intronic transcription is ubiquitous in renal tissue. Moreover, we identified an expression signature comprising both exonic and intronic transcripts that are predominantly down-regulated in the most prevalent histological subtypes of RCC. These provide novel insights into the general molecular mechanisms associated with malignant transformations in renal tissue, and indicate potential new targets for diagnosis and treatment of RCC. MATERIALS AND METHODS rR Tissue samples ee rP Fo A total of 24 matched samples of tumor and adjacent non-malignant tissue were obtained from ev 12 RCC patients submitted to radical nephrectomy at the Instituto Nacional de Câncer − INCA iew 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 Page 4 of 29 (Rio de Janeiro, Brasil) and were used in microarray experiments. Ten additional matched tumor/non-tumor tissue samples from 5 RCC patients were used in quantitative RT-PCR validation experiments. Fresh tissue samples were obtained from the patients, with informed consent, and fragments were frozen within 15-20 min after surgery and stored in liquid nitrogen until use. Tissue sections from each RCC sample were reviewed and classified by a pathologist according to the WHO histological classification of tumors of the kidney [2] as clear cell RCC (10 samples), papillary RCC (4 samples), chromophobe RCC (1 sample), 1 clear cell RCC with extensive sarcomatoid differentiation, and 1 RCC with unclassified origin. The Fuhrman grade of the samples ranged from II to IV. Most tumor samples showed evidence of necrosis (76%) John Wiley & Sons Page 5 of 29 5 and were larger than 5 cm (82%). The clinical status of the disease was heterogeneous across the patients: six showed metastasis, three showed locally advanced disease, four showed localized tumors. Information regarding the evolution of the disease was not available for four patients. Analysis of hematoxylin/eosin (HE) stained tissue sections showed that the stromal component was poorly developed across all samples analyzed. Tumor tissue fragments subsequently processed for RNA isolation should contain at least 80% neoplastic cells, as determined by HE staining of tissue sections. Histologically normal adjacent renal tissue fragments were collected from the same patients and examined by HE staining to check that no rP Fo neoplastic cells were present. Anatomopathological data from the tumor samples are given in Table 1. RNA isolation and target labeling rR ee Total RNA was isolated from the tissue samples (approximately 200 mg) with Trizol reagent ev (Invitrogen), quantified by UV spectrophotometry (Nanodrop ND1000) and analyzed for integrity by inspection of the 18S/28S ribosomal RNA ratios after separation by gel iew 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 Molecular Carcinogenesis electrophoresis. For each patient, aliquots containing 20 µg total RNA from tumor or adjacent non-tumor tissue were labeled in parallel with either Cy3- or Cy5-derivatized deoxyribonucleotides (CyScribe first-strand cDNA labeling kit; GE Healthcare) using a mixture of oligo-dT and 9-mer random oligonucleotides as primers. We used both oligo-dT and 9-mer random primers to minimize the 3’ bias of the labeled targets, thus optimizing the detection of noncoding intronic transcripts eventually represented in the arrays by 5’ sequence clones (see below). John Wiley & Sons Molecular Carcinogenesis 6 Microarray experiments The cDNA probes spotted on the microarray were selected from the over 1 million EST clone collections generated during the Human Cancer Genome Project, a large-scale EST sequencing project that used cDNA libraries generated from poly(A) mRNA derived from over 20 different types of human tumors [14,15]. The construction of the custom-spotted cDNA microarray has been described elsewhere [8], along with its use for obtaining and comparing gene expression profiles from a collection of prostate tumor samples. Following an informatics analysis of the rP Fo cancer EST dataset, we found that nearly 30% of the transcribed sequences mapped to intronic or to non-annotated regions of the human genome. On the basis of several criteria, which included evidence of transcription from at least two different cDNA libraries, we selected a subset of approximately 4,000 cDNA clones for microarray spotting [8]. These comprised ee 2,292 cancer-related genes compiled from the Entrez, OMIM and CGAP databases, covering rR apoptosis, tumorigenesis, metastasis, cancer metabolism and cancer progression. An additional set of randomly-sampled no-match clones was included in the microarray, of which 822 were ev putative intronic transcript fragments and 241 were fragments from unannotated genomic regions. The average size of the cDNA probes spotted was 600 bp. Fluorescently-labeled iew 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 Page 6 of 29 cDNA targets derived from tumor and non-tumor tissues from each patient were combined and hybridized to microarrays with an automated slide processor (GE Healthcare), using the protocols recommended by the manufacturer. Each sample was hybridized to two separate microarrays, each containing two replicate spots for each probe. Thus, 4 replicate measurements were generated for each probed transcript from each sample, which allowed outliers to be excluded and expression measurements to be averaged. For each patient, a replicate hybridization was performed with dye-swap of labeled targets. Raw and normalized microarray intensities were deposited in the Gene Expression Omnibus database (GEO − http://www.ncbi.nlm.nih.gov/geo/) under accession number GSE7367. John Wiley & Sons Page 7 of 29 7 Microarray analysis After hybridization, array images were acquired using a GenerationIII Array Scanner (GE Healthcare) and visualized with the ImageQuant program (Molecular Dynamics). Cy3 and Cy5 fluorescence intensities from each probe in the array were extracted using ArrayVision software (Imaging Research Inc.). For each slide, the raw Cy3 and Cy5 intensities were normalized to each other using a Locally Weighted Scatter plot Smoother (Lowess) algorithm rP Fo [16] written in R (http://www.r-project.org/) and filtered by ArrayStat software (Imaging Research Inc.) to detect and eliminate low-quality outliers. For each sample, the trimmed mean excluding the 20% lowest and the 20% highest values was calculated and was used to ee normalize the data across the experiments [16] to make them comparable (Spotfire Decision Site, Spotfire Inc.). Further details of microarray experiments and analyses are provided as rR supplementary information. The accuracy of the expression measurements is demonstrated by the high correlation coefficients between technical replicates in the same (intra-slide) or a ev different (inter-slide) hybridization. The average correlation coefficient for the intra-slide iew 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 Molecular Carcinogenesis replicates was 0.978 + 0.026 and for the inter-slide replicates 0.824 + 0.116. Notably, a high average correlation was also observed across measurements from different samples, which indicates that the expression levels of most transcripts interrogated by the 4k microarray are relatively invariable across the samples tested (average correlation 0.785 + 0.115). Statistical Analysis Two-class paired Significance Analysis of Microarrays (SAM) [17] and a paired Z-test [18], implemented in the ArrayStat analysis suite (Imaging Research Inc.), were used to identify John Wiley & Sons Molecular Carcinogenesis 8 transcripts differentially expressed in RCC and adjacent non-tumor tissue. Lists of genes shown by each approach (SAM or Z-test) to be differentially expressed were combined and only those found in both lists were considered for further analysis. The robustness of the RCC gene expression signature was evaluated by sample leave-one-out cross-validation [19]. Essentially, one sample is removed and a new set of significantly altered genes is determined using the remaining samples. This procedure was repeated for each of the matched tumor/adjacent nontumor tissue samples and the frequency with which each gene from the RCC signature appeared in the various “leave-one-out” datasets at the chosen significance cutoff (Z-test: p < rP Fo 0.001; SAM: FDR < 10%) was annotated. Real-Time RT-PCR rR ee The expression levels of selected transcripts were measured in RCC and matched non-tumor RNA samples using quantitative real-time RT-PCR essentially as described [9]. To avoid ev contamination with genomic DNA, all RNA samples were treated with 1 unit RQ1 RNAse-free DNAse (Promega) for 30 min at 37ºC in a 15 µl volume in the presence of 20 units RNasin iew 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 Page 8 of 29 ribonuclease inhibitor (Promega). For exonic transcripts, 2 µg total RNA were used to generate cDNA in 20 µl reactions containing 1 unit Superscript III (Invitrogen) and oligo-dT primers. For intronic transcripts, DNAse-treated total RNA (~600 ng) obtained with an RNAeasy purification kit (Qiagen) was linearly amplified to produce complementary RNA (cRNA) [20]. The cRNA was subsequently used as template in reverse transcription reactions primed by random 9-mer oligonucleotides. A 2.5 µl sample of reverse-transcribed cDNA was used as template in real-time PCR reactions (20 µl total volume) on a GeneAmp 5700 (Applied Biosystems) using the SYBR Green PCR kit as described in the manufacturer’s instructions John Wiley & Sons Page 9 of 29 9 (Applied Biosystems). For each sample, a reaction using the template from a mock reverse transcription (no enzyme added) was performed as a negative control to check for the absence of genomic contamination. The primers used for real-time PCR are shown as Supplementary Table 1. For quantitative results, the level of each transcript detected by real-time quantitative PCR was normalized to the level of -tubulin and represented as fold change using the Ct method [21]. For each pair of matched patient samples, transcript levels in the tumor sample were expressed as relative fold changes with respect to the value of the target transcript in the non-tumor adjacent tissue, which was set at unity. RESULTS ee rP Fo Expression of intronic RNAs in RCC rR To assess the expression of intronic noncoding RNAs (ncRNAs) in the kidney, we interrogated 24 RNA samples isolated from tumor or adjacent non-tumor renal tissue from 12 RCC patients ev with various histological subtypes, using custom-built microarrays. The tumor samples showed iew 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 Molecular Carcinogenesis poorly developed stromal components and the fragments processed for RNA isolation were enriched (> 80%) in renal epithelial cells. These arrays contain probes mapping to transcribed regions located in intronic segments of known genes (822 probes), to intergenic regions of the genome (241 probes), or to coding or untranslated exons of protein–coding genes (2,292 probes). To be considered “expressed” in a given sample, the probe intensities had to exceed a threshold defined by the average intensity plus three standard deviations of a set of plantderived negative control probes deposited in the arrays. We found that comparable fractions of intronic, intergenic and exonic transcripts were expressed in kidney, both in tumor and in adjacent non-tumor tissue samples (Figure 1); thus, nearly 80% of the probes in each class John Wiley & Sons Molecular Carcinogenesis 10 (intronic, intergenic and exonic) were expressed in at least 5 samples, irrespective of the histology of the sample (tumor or adjacent non-tumor tissue) (Figure 1). This result shows that intronic and intergenic RNAs are ubiquitously transcribed in kidney tissues. It also reveals that the bulk of the intronic transcription occurs equally in tumor and non-neoplastic tissues, indicating that these messages are likely to have roles in non-pathological cellular states. Gene expression signatures of clear cell RCC rP Fo To identify genes altered in the most prevalent histological type of RCC, we compared the expression profiles from 6 clear cell RCC samples with those from 6 patient-matched adjacent non-tumor tissue samples. To reduce the number of false positives (type I errors), we combined ee two independent statistical approaches (Z-test and SAM, see Methods for details) to identify rR transcripts differentially expressed in RCC tumors. The intersection of 181 differentiallyexpressed transcripts identified by SAM (FDR < 10%) with a list of 227 transcripts identified ev by the Z-test (p < 0.001) comprised a set of 83 transcripts identified in both analyses, including 8 sequences that map to intronic regions (Table 2). To limit the contribution of individual iew 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 Page 10 of 29 samples to identifying a clear cell RCC gene expression signature, we performed a leave-oneout cross-validation procedure [19]. We found that 64 of the 83 transcripts (77%) identified as differentially expressed in clear cell RCC by both Z-test and SAM were present in at least 5 out of the 6 leave-one-out data sets (Figure 2). Most of the selected transcripts (55 out of 64) were down-regulated in tumors relative to matched adjacent non-malignant tissue (Table 2). Notably, 7 sequences mapped to introns of known genes among the 64-gene set, being 6 of them downregulated in RCC. All these intronic RNAs except one are unspliced sequences, the exception mapping to TACC1 (Genbank accession BF365294). None of the intronic RNAs downregulated in RCC has coding potential as determined by ESTScan analysis [22]. To investigate John Wiley & Sons Page 11 of 29 11 whether these 6 intronic RNAs down-regulated in RCC are unprocessed primary transcripts that could generate known small regulatory RNAs, we compared their sequences with those of 346 snoRNAs [23] and 383 microRNAs [24]; no similarity was found. Next, we asked whether some of the transcripts identified in the clear cell RCC gene expression signature were also down-regulated in other differentiation states or histological subtypes of RCC. To that end, we analyzed the expression profiles of an additional set of 12 matched tumor and adjacent non-tumor tissue samples from 6 RCC patients, including four rP Fo samples of papillary RCC, one RCC sample with clear cell origin but exhibiting an extensive sarcomatoid component, and one RCC sample of unclassified origin (see Table 1). This latter analysis resulted in a set of 104 transcripts with significantly altered levels (FDR = 5%) in tumor compared to matched adjacent non-tumor tissues. Cross-validation analysis of the non- ee clear cell RCC gene signature (see Methods for details) pointed to 84 transcripts present in at rR least 5 out of the 6 leave-one-out datasets. By cross-referencing the 64-gene identified in the clear cell RCC signature with the 84-gene non-clear cell RCC signature, we found 25 ev transcripts that were altered in RCC tumor samples irrespective of their differentiation state or histological subtype (Table 2 and Supplementary Figure 1). The overlap between the iew 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 Molecular Carcinogenesis expression signatures of clear cell and non-clear cell RCC was evaluated by randomly sampling each dataset 1 million times and calculating the frequency at which an overlap of 25 or more genes was found; this showed high statistical significance (p < 1 x10-6). The expression profiles of these 25 transcripts, which included two transcripts mapping to intronic regions of SLC2A1 or TACC1, were very similar across all RCC subtypes (Supplementary Figure 1). Validation of novel markers of clear cell RCC by real-time RT-PCR Five protein-coding transcripts (SIN3B, TRIP3, SYNJ2BP, SDC-2 and MYH11) deregulated in clear cell RCC were selected for validation by real-time RT-PCR. These experiments John Wiley & Sons Molecular Carcinogenesis 12 confirmed that the levels of exonic transcripts from TRIP3 (p < 0.01), SYNJ2BP (p < 0.01) and SIN3B (p < 0.02) were significantly reduced in clear cell RCC compared to matched adjacent non-tumor tissues (Figure 3A, B, and C, respectively), while those from MYH11 showed increased levels in clear cell RCC (p < 0.02) (Figure 3D). Deregulation of these four transcripts was confirmed in one non-clear cell (subtype chromophobe) RCC sample (Figure 3A−D, patient P27). Amplification of SDC-2 did not result in a single PCR band and overexpression of this gene in RCC was not confirmed. The independent validation of selected transcripts in 5 additional clear cell samples by qRT-PCR corroborates the notion that the gene expression rP Fo signature identified is consistent across clear cell RCC samples. Although significant, the increase of MYH11 transcript levels in clear cell RCC tumors detected by quantitative real-time RT-PCR (Figure 3D) was not in agreement with the ee microarray results, which showed reduced expression of MYH11 in tumor relative to adjacent rR non-tumor tissue (Table 2 and Figure 2). A more detailed analysis of the genomic region encompassing the MYH11 locus revealed the presence of another gene, NDE1, which overlaps ev the 3’ end of MYH11. In addition, we noted that the double-stranded cDNA probe deposited in the microarray (Genbank accession: BG876687) is complementary both to the 3’ exon of the iew 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 Page 12 of 29 NDE1 transcript and to the 5’- most exon of MYH11. As the labeling protocol favors the labeling of targets near the 3’ end of poly(A)+ transcripts, we inferred that the signals measured in the microarrays were mainly derived from messages originating from NDE1. To test this hypothesis, we carried out real-time RT-PCR experiments to measure the levels of NDE1 transcripts in tumor and non-tumor samples. The results showed that out of the 8 pairs of matched samples tested, NDE1 was significantly down-regulated (p < 0.02) in 3 RCC samples compared to adjacent normal tissues (Figure 3D, patients P3, P27 and P32). In two additional samples, NDE1 showed a tendency (although not significant) to be reduced in RCC (Figure 3D, patients P5 and P26). John Wiley & Sons Page 13 of 29 13 Four noncoding intronic transcripts mapping to intronic regions of protein-coding genes, SND1 (regulation of transcription), ACTN4 (regulation of apoptosis and of progression through cell cycle), HDAC5 (regulation of transcription and of progression through cell cycle) and NIBP (enhancer of NF-kappa-B activation) were selected for real time RT-PCR experiments; down-regulation of intronic RNAs was confirmed for transcripts mapping to introns of SND1 and ACTN4 loci in RCC tumors relative to adjacent non-tumor tissues (Figure 3E). rP Fo Methylation analysis of promoter regions of genes downregulated in RCC Recent studies have demonstrated that the silencing of tumor suppressor genes by ee hypermethylation of promoter CpG islands is common to many types of malignancy [25,26]. rR Five genes that our analysis showed to be down-regulated in RCC tumors (GPX3, NDE1, SYNJ2BP, TRIP3 and SIN3B) were tested in 8 matched samples (tumor and adjacent non-tumor ev tissue) from 4 RCC patients (P9, P15, P27, and P32) (see Supplementary Information for details) to investigate the methylation status of CpG islands in their promoter regions. Only iew 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 Molecular Carcinogenesis SIN3B showed evidence of methylation, which encompassed CpGs extending from a region upstream from the transcription start site through the second intron of the gene (see Supplementary Figure S2). However, no correlation between the methylation pattern of the CpGs and the histological status of the tissue (tumor, adjacent non-tumor) was observed in the 4 pairs of tumor and matched non-tumor samples tested. This result indicates that promoter methylation is not a key factor in the down-regulation of these genes in RCC. DISCUSSION John Wiley & Sons Molecular Carcinogenesis 14 In this study, we analyzed gene expression profiles of 12 matched samples of tumor and nonneoplastic epithelium from RCC patients using a custom-built cDNA microarray enriched in intronic noncoding RNA probes. Using stringent statistical criteria, we identified 64 transcripts differentially expressed in tumors and matched non-tumor tissue samples from 6 patients with clear cell RCC. The list of genes significantly deregulated in clear cell RCC samples relative to matched non-tumor tissue was cross-referenced to the list of transcripts deregulated in an additional set of 6 non-clear cell RCC, and 25 genes proved to be common to both sets, with a significant overlap (p < 1x10-6). The aim of this specific analysis was to identify transcripts that rP Fo are deregulated in all RCC irrespective of the differentiation state or histological subtype of the primary tumor. The histological subtypes represent genetically and phenotypically dissimilar entities. Nevertheless, our observation that some gene expression changes are common to ee different RCC subtypes, and significantly correlated to the neoplastic phenotype, suggests that these transcriptional alterations may play a role in the process of malignant transformation in rR the kidney. Further experiments will be required to clarify these aspects. ev The list of protein-coding genes found here to be downregulated in clear cell RCC was manually cross-referenced with lists of protein-coding genes that previous microarray- iew 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 Page 14 of 29 based gene expression studies had shown to be altered in RCC [4,5,27-29]. GPX3, S100A2, CTSB and EPB41 are known to be down-regulated in RCC [4,27]. Some genes detected in the present study showed an expression pattern in RCC that was opposite to previous reports (SLC2A1, up-regulated in [4,27]; CD68, CAPNS1, GSN and ERCC5, up-regulated in [4]). We found no overlap between the genes identified here with those described in [5,28,29]. Thus, while some genes have been detected in large-scale gene expression studies comparing tumor and non-neoplastic renal tissues, most of the protein-coding genes that this work has shown to be down-regulated in RCC have not been documented previously, making them novel tumor suppressor candidates for this neoplasia. The expression levels of TRIP3, SIN3B, SYNJ2BP and John Wiley & Sons Page 15 of 29 15 NDE1 were confirmed by real time RT-PCR to be down-regulated in RCC. Retinoic acid (RA) modulates growth and induces differentiation and apoptosis in neuroblastoma cells in vitro; the increased expression of TRIP3 in RA−treated cells [30] is in line with a possible tumor suppressor role for this gene in RCC, as suggested here. SIN3B encodes a protein involved in transcriptional inhibition through binding to histone deacetylases [31]. SYNJ2BP participates in the activin signaling pathway [32] and has not previously been associated with cancer. The NDE1 gene product is part of a centrosome-located protein complex, the disruption of which leads to abnormal cell division [33]. rP Fo The genomic coordinates of NDE1 overlap with those of MYH11 and the products of both loci form a naturally-transcribed sense/antisense transcript pair. Interestingly, we verified that MYH11 is up-regulated in RCC. MYH11 was previously shown to be up-regulated in RCC ee cell lines relative to RCC tissues [6], and in acute myeloid leukemia [34]. In contrast, it is rR reportedly down-regulated in metastases relative to primary solid tumors in various tissue types [35], indicating complex expression of this gene during malignant cell transformation. The ev inverse expression patterns of NDE1 and MYH11 in RCC suggests that they may form a functional regulatory pair. NDE1 and MYH11 show sequence and mapping conservation in iew 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 Molecular Carcinogenesis several vertebrate genomes (chimpanzee, mouse, chicken). Moreover, there is evidence indicating that mouse MYH6, a paralog of human MYH11, is regulated by a naturallytranscribed antisense RNA [36]. These results warrant further investigation of the relevance of these findings to the malignant transformation associated with RCC. Recent work in the literature indicates that a large fraction of the human genome is transcribed in the form of noncoding RNAs [12,37,38]. Several lines of investigation suggest that these ncRNAs are not biological noise, but rather parts of yet-uncharacterized regulatory networks that may modulate gene expression in higher eukaryotes (see [10,13,39] for reviews). John Wiley & Sons Molecular Carcinogenesis 16 So far, only a few reports in the literature have related altered expression of certain ncRNAs to cancer [40-42]. Here we show that intronic ncRNAs are ubiquitously transcribed in tumor and adjacent non-tumor kidney tissue, extending our previous observations in prostate [8] and head and neck [43] tissues. A comparable fraction of intronic RNAs were detected in tumor and nontumor kidney samples, indicating that intronic transcription is not a characteristic of neoplastic renal tissues but rather part of the transcriptional output of normal kidney cells. Notably, we found that a subset of these intronic ncRNAs expressed in kidney was significantly downregulated in RCC and may therefore have a role in renal carcinogenesis. Among these are rP Fo transcripts mapping to intronic segments of ACTN4, HDAC5, SND1, SLC2A1, NIBP and TACC1. Down-regulation of intronic transcripts mapping to the ACTN4 and SND1 loci in RCC was further confirmed by quantitative real time RT-PCR. ee None of the six intronic RNAs that were downregulated in RCC have protein coding rR potential, as determined by ESTScan analysis [22]. It has been proposed that these intronic ncRNAs may act as cis-regulatory factors, modulating the stability and/or the processing of the ev corresponding protein-coding transcript [9,39]. Our group has provided experimental evidence that intronic RNAs transcribed in antisense orientation may act in cis to modulate the iew 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 Page 16 of 29 abundance or the processing of the corresponding protein-coding mRNA in androgen-treated prostate cancer cells [9]. This cis-acting effect would occur by Watson-Crick base-pairing between the antisense intronic RNA and the corresponding premature messenger RNA. An independent group has recently shown that expression of an intronic antisense RNA (Saf gene) transcribed from the first intron of the FAS gene causes an alternative exon of the proteincoding sense FAS transcript to be retained [44]. In fact, all the genomic loci that the present work has shown to harbor intronic transcripts with significantly reduced expression in RCC are also sources of protein-coding genes that have previously been associated with, or to have functions that may be related to, cancer. Thus, increased expression of actinin-4, the protein John Wiley & Sons Page 17 of 29 17 product of ACTN4, has been shown to induce cell motility and specifically to promote lymph node metastasis in colorectal cancer [45]. Down-regulation of HDAC5 has been documented in patients with colorectal cancer [46,47] and acute myeloid leukemia [48]. SND1 encodes a Stat6-interacting protein that enhances Stat6-mediated transcriptional activation and gene expression [49]. Constitutive activation of STAT proteins and aberrant STAT signaling has been found in solid and hematological tumors [50]. In this context, down-regulation of intronic SND1 may indicate the involvement of the STAT pathway in RCC carcinogenesis. Overexpression of SLC2A1 has been associated to the increase in glucose uptake observed in rP Fo clear cell RCC [51]. Down-regulation of an intronic transcript mapping to the SLC2A1 locus raises the possibility that this intronic message may negatively regulate the transcriptional level of protein-coding SLC2A1. On the basis of the results described above, it is conceivable that the ee intronic transcripts shown here to be deregulated in RCC may modulate the level or the processing of their protein-coding counterparts in a similar manner. rR In conclusion, we have described a set of protein-coding and intronic ncRNAs that ev are down-regulated in RCC and constitute a valuable resource for identifying novel tumor suppressor candidates. Although additional studies with larger sets of samples will be required iew 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 Molecular Carcinogenesis to produce high-resolution mapping of global transcriptional alterations in intronic noncoding RNAs in renal neoplastic tissues, the results presented in this report indicate that changes in some of these transcripts are very homogeneous and reproducible across clear cell RCC samples, warranting further investigation to determine their role in renal cell carcinogenesis. Further characterization of these transcripts may shed light into yet-unappreciated molecular mechanisms involved in tumorigenesis and progression of RCC, and may also contribute to the development of novel biomarkers and therapeutic targets for the disease. John Wiley & Sons Molecular Carcinogenesis 18 ACKNOWLEDGMENTS The authors thank Dr. Paulo Antônio Faria from the Instituto Nacional de Câncer (INCA) for additional revision of the anatomopathological data. This work was supported by a grant from Fundação de Amparo a Pesquisa do Estado de São Paulo, FAPESP to SVA and EMR and by fellowships from FAPESP and Conselho Nacional de Desenvolvimento Científico e Tecnológico, CNPq, Brasil. REFERENCES rP Fo 1. Kopper L, Timar J. Genomics of renal cell cancer-- does it provide breakthrough? Pathol Oncol Res 2006;12(1):5-11. 2. WHO Classification of Tumours: Pathology and Genetics of Tumours of the Urinary System and Male Genital Organs. Eble JN, Sauter G, Epstein JI, Sesterhenn IA, editors: WHO Press; 2004. 359 p. 3. Reuter VE, Presti JC, Jr. Contemporary approach to the classification of renal epithelial tumors. Semin Oncol 2000;27(2):124-137. 4. Boer JM, Huber WK, Sultmann H et al. Identification and classification of differentially expressed genes in renal cell carcinoma by expression profiling on a global human 31,500-element cDNA array. Genome Res 2001;11(11):1861-1870. 5. Skubitz KM, Skubitz AP. Differential gene expression in renal-cell cancer. J Lab Clin Med 2002;140(1):52-64. 6. Liou LS, Shi T, Duan ZH et al. Microarray gene expression profiling and analysis in renal cell carcinoma. BMC Urol 2004;4:9. 7. Hirota E, Yan L, Tsunoda T et al. Genome-wide gene expression profiles of clear cell renal cell carcinoma: identification of molecular targets for treatment of renal cell carcinoma. Int J Oncol 2006;29(4):799-827. 8. Reis EM, Nakaya HI, Louro R et al. Antisense intronic non-coding RNA levels correlate to the degree of tumor differentiation in prostate cancer. Oncogene 2004;23(39):6684-6692. 9. Louro R, Nakaya HI, Amaral PP et al. Androgen responsive intronic non-coding RNAs. BMC Biol 2007;5(1):4. iew ev rR ee 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 Page 18 of 29 John Wiley & Sons Page 19 of 29 19 10. Mattick JS. RNA regulation: a new genetics? Nat Rev Genet 2004;5(4):316-323. 11. Prasanth KV, Spector DL. Eukaryotic regulatory RNAs: an answer to the 'genome complexity' conundrum. Genes Dev 2007;21(1):11-42. 12. Nakaya HI, Amaral PP, Louro R et al. Genome mapping and expression analyses of human intronic noncoding RNAs reveal tissue-specific patterns and enrichment in genes related to regulation of transcription. Genome Biol 2007;8(3):R43. 13. Willingham AT, Gingeras TR. TUF Love for "Junk" DNA. Cell 2006;125(7):12151220. 14. Dias-Neto E, Correa RG, Verjovski-Almeida S et al. Shotgun sequencing of the human transcriptome with ORF expressed sequence tags. Proc Natl Acad Sci USA 2000;97(7):3491-3496. 15. Camargo AA, Samaia HP, Dias-Neto E et al. The contribution of 700,000 ORF sequence tags to the definition of the human transcriptome. Proc Natl Acad Sci USA 2001;98(21):12103-12108. 16. Quackenbush J. Microarray data normalization and transformation. Nat Genet 2002;32 Suppl:496-501. 17. Tusher VG, Tibshirani R, Chu G. Significance analysis of microarrays applied to the ionizing radiation response. Proc Natl Acad Sci USA 2001;98(9):5116-5121. 18. Nadon R, Shi P, Skandalis A et al. Statistical inference methods for gene expression arrays. Microarrays: Optical Technologies and Informatics. Proceedings of SPIE 2001;4266:46-55. 19. van 't Veer LJ, Dai H, van de Vijver MJ et al. Gene expression profiling predicts clinical outcome of breast cancer. Nature 2002;415(6871):530-536. 20. Wang E, Miller LD, Ohnmacht GA, Liu ET, Marincola FM. High-fidelity mRNA amplification for gene profiling. Nat Biotechnol 2000;18(4):457-459. 21. Pfaffl MW. A new mathematical model for relative quantification in real-time RT-PCR. Nucleic Acids Res 2001;29(9):e45. 22. Iseli C, Jongeneel CV, Bucher P. ESTScan: a program for detecting, evaluating, and reconstructing potential coding regions in EST sequences. Proc Int Conf Intell Syst Mol Biol 1999:138-148. 23. Lestrade L, Weber MJ. snoRNA-LBME-db, a comprehensive database of human H/ACA and C/D box snoRNAs. Nucleic Acids Res 2006;34(Database issue):D158-162. 24. Griffiths-Jones S, Grocock RJ, van Dongen S, Bateman A, Enright AJ. miRBase: microRNA sequences, targets and gene nomenclature. Nucleic Acids Res 2006;34(Database issue):D140-144. iew ev rR ee rP Fo 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 Molecular Carcinogenesis John Wiley & Sons Molecular Carcinogenesis 20 25. Costello JF, Fruhwald MC, Smiraglia DJ et al. Aberrant CpG-island methylation has non-random and tumour-type-specific patterns. Nat Genet 2000;24(2):132-138. 26. Esteller M, Corn PG, Baylin SB, Herman JG. A gene hypermethylation profile of human cancer. Cancer Res 2001;61(8):3225-3229. 27. Takahashi M, Rhodes DR, Furge KA et al. Gene expression profiling of clear cell renal cell carcinoma: gene identification and prognostic classification. Proc Natl Acad Sci U S A 2001;98(17):9754-9759. 28. Jones J, Otu H, Spentzos D et al. Gene signatures of progression and metastasis in renal cell cancer. Clin Cancer Res 2005;11(16):5730-5739. 29. Skubitz KM, Zimmerman W, Kammerer R, Pambuccian S, Skubitz AP. Differential gene expression identifies subgroups of renal cell carcinoma. J Lab Clin Med 2006;147(5):250-267. 30. Lovat PE, Annicchiarico-Petruzzelli M, Corazzari M et al. Differential effects of retinoic acid isomers on the expression of nuclear receptor co-regulators in neuroblastoma. FEBS Lett 1999;445(2-3):415-419. 31. Romm E, Nielsen JA, Kim JG, Hudson LD. Myt1 family recruits histone deacetylase to regulate neural transcription. J Neurochem 2005;93(6):1444-1453. 32. Tsuchida K, Nakatani M, Matsuzaki T et al. Novel factors in regulation of activin signaling. Mol Cell Endocrinol 2004;225(1-2):1-8. 33. Hirohashi Y, Wang Q, Liu Q et al. p78/MCRS1 forms a complex with centrosomal protein Nde1 and is essential for cell viability. Oncogene 2006;25(35):4937-4946. 34. Gutierrez NC, Lopez-Perez R, Hernandez JM et al. Gene expression profile reveals deregulation of genes with relevant functions in the different subclasses of acute myeloid leukemia. Leukemia 2005;19(3):402-409. 35. Ramaswamy S, Ross KN, Lander ES, Golub TR. A molecular signature of metastasis in primary solid tumors. Nat Genet 2003;33(1):49-54. 36. Luther HP, Bartsch H, Morano I, Podlowski S, Baumann G. Regulation of naturally occurring antisense RNA of myosin heavy chain (MyHC) in neonatal cardiomyocytes. J Cell Biochem 2005;94(4):848-855. 37. Kampa D, Cheng J, Kapranov P et al. Novel RNAs Identified From an In-Depth Analysis of the Transcriptome of Human Chromosomes 21 and 22. Genome Res 2004;14(3):331-342. 38. Bertone P, Stolc V, Royce TE et al. Global identification of human transcribed sequences with genome tiling arrays. Science 2004;306(5705):2242-2246. 39. Reis EM, Louro R, Nakaya HI, Verjovski-Almeida S. As antisense RNA gets intronic. Omics 2005;9(1):2-12. iew ev rR ee rP Fo 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 Page 20 of 29 John Wiley & Sons Page 21 of 29 21 40. Ji P, Diederichs S, Wang W et al. MALAT-1, a novel noncoding RNA, and thymosin beta4 predict metastasis and survival in early-stage non-small cell lung cancer. Oncogene 2003;22(39):8031-8041. 41. Angeloni D, ter Elst A, Wei MH et al. Analysis of a new homozygous deletion in the tumor suppressor region at 3p12.3 reveals two novel intronic noncoding RNA genes. Genes Chromosomes Cancer 2006;45(7):676-691. 42. Wang XS, Zhang Z, Wang HC et al. Rapid identification of UCA1 as a very sensitive and specific unique marker for human bladder carcinoma. Clin Cancer Res 2006;12(16):4851-4858. 43. Reis EM, Ojopi EP, Alberto FL et al. Large-scale transcriptome analyses reveal new genetic marker candidates of head, neck, and thyroid cancer. Cancer Res 2005;65(5):1693-1699. 44. Yan MD, Hong CC, Lai GM, Cheng AL, Lin YW, Chuang SE. Identification and characterization of a novel gene Saf transcribed from the opposite strand of Fas. Hum Mol Genet 2005;14(11):1465-1474. 45. Honda K, Yamada T, Hayashida Y et al. Actinin-4 increases cell motility and promotes lymph node metastasis of colorectal cancer. Gastroenterology 2005;128(1):51-62. 46. Ozdag H, Teschendorff AE, Ahmed AA et al. Differential expression of selected histone modifier genes in human solid cancers. BMC Genomics 2006;7:90. 47. Scanlan MJ, Welt S, Gordon CM et al. Cancer-related serological recognition of human colon cancer: identification of potential diagnostic and immunotherapeutic targets. Cancer Res 2002;62(14):4041-4047. 48. Bradbury CA, Khanim FL, Hayden R et al. Histone deacetylases in acute myeloid leukaemia show a distinctive pattern of expression that changes selectively in response to deacetylase inhibitors. Leukemia 2005;19(10):1751-1759. 49. Yang J, Aittomaki S, Pesu M et al. Identification of p100 as a coactivator for STAT6 that bridges STAT6 with RNA polymerase II. Embo J 2002;21(18):4950-4958. 50. Benekli M, Baer MR, Baumann H, Wetzler M. Signal transducer and activator of transcription proteins in leukemias. Blood 2003;101(8):2940-2954. 51. Suganuma N, Segade F, Matsuzu K, Bowden DW. Differential expression of facilitative glucose transporters in normal and tumour kidney tissues. BJU Int 2007;99(5):11431149. iew ev rR ee rP Fo 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 Molecular Carcinogenesis John Wiley & Sons Molecular Carcinogenesis 22 FIGURE LEGENDS Figure 1. Expression of intronic noncoding RNAs in renal tissue. Microarray slides were hybridized to 24 matched samples of tumor or adjacent non-tumor tissue and positive probes were identified (see Methods for details). To be considered "expressed", a probe should have an intensity signal at least 3 standard deviations above the average signal of a set of plant-derived negative control probes deposited in the arrays. The percentage of expressed probes from each of the 3 different probe categories (exonic, intronic and intergenic) (Y axis) refers to the rP Fo minimum number of tumor or adjacent non-tumor renal tissue samples in which their expression was observed (X axis). The total number of probes in each category is shown in parenthesis. ee Figure 2. Molecular signature of clear cell RCC. Heat map with the expression levels of 64 rR genes (rows) with transcript levels significantly altered (p < 0.001 and FDR < 10% in at least 5 out of 6 leave-one-out cross-validation datasets, see Methods for details) among 12 paired ev samples of tumor (T) and adjacent non-tumor (N) renal tissue from 6 patients with clear cell RCC (columns). For each transcript, the relative expression values are given as log2 ratios iew 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 Page 22 of 29 (T/N): red indicates higher expression in tumor tissue; blue, higher expression in non-tumor tissue. Intronic transcripts are indicated by arrows and each is named after the corresponding protein-coding gene mapping in the same genomic locus. Figure 3. Expression of candidate markers of RCC. Relative levels of selected exonic (A−D) and intronic (E) transcripts in tumor tissue samples compared to matched adjacent non-tumor renal tissue from the same patient were determined by real-time RT-PCR. Genes significantly altered in tumors relative to matched adjacent non-tumor samples below the p-value threshold (within parenthesis) are marked with an asterisk: TRIP3 (p < 0.01) (A); SYNJ2BP (p < 0.01) John Wiley & Sons Page 23 of 29 23 (B); SIN3B (p < 0.02) (C); MYH11 and NDE1 (p < 0.02) (D); ACTN4 and SND1 (p < 0.05) (E). For each gene, assays were performed in triplicate. Mean values with error bars are shown. For each gene tested, the house-keeping gene TUBB was used as the reference for normalization across patient samples. iew ev rR ee rP Fo 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 Molecular Carcinogenesis John Wiley & Sons Molecular Carcinogenesis r Fo er Pe 168x115mm (600 x 600 DPI) ew vi Re 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 John Wiley & Sons Page 24 of 29 Page 25 of 29 r Fo er Pe ew vi Re 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 Molecular Carcinogenesis 88x183mm (600 x 600 DPI) John Wiley & Sons Molecular Carcinogenesis r Fo er Pe vi Re 213x191mm (600 x 600 DPI) ew 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 John Wiley & Sons Page 26 of 29 Page 27 of 29 Table 1. Clinicopathological data from renal cell carcinoma tissue samples. Histological subtype Primary tumor size (cm) Evidence of necrosis Pathological staging 3 IV clear cell 6x7x4 Yes pT3bN0M1 21 metastatic 5 II/IV clear cell 8x8x5 Yes pT2N1M1 6 metastatic 9 II clear cell 8x6 Yes pT3aN0Mx 54 Locally advanced 12 II clear cell 4x3x2 No pT1aN0Mx n.a. Localized 15 IV clear cell 10x10x8 Yes T3N2Mx n.a. n.a. 24 IV clear cell 15x11x7 Yes pT3aN0Mx 16 metastatic 26 II clear cell 7x6x5 No T3aNXM0 58 Localized 28 III clear cell 5x3x3 Yes pT1bN0Mx 20 Localized 31 II clear cell 8x6 Yes pT3bN2M1 40 metastatic 32 II clear cell 13x8 No pT3aN0Mx 17 Locally advanced 27 III chromophobe 7x6x3 No pT2N0Mx 68 Localized 4 III/IV papillary 16x11x8 Yes pT3aN0Mx n.a. 14 IV papillary ee 8x7x6 Yes pT3bN0M0 58 16 III papillary 16X12 Yes pT3aN2Mx n.a. n.a. 19 III papillary 8X7 Yes pT3aN0Mx 49 n.a. 23 IV sarcomatoid 9x7 Yes pT3bN0Mx n.a. metastatic 15x10x9 Yes iew Patient n° 7 metastatic (clear cell) 22 II unclassified ev rR Fuhrman nuclear Grade rP Fo 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 Molecular Carcinogenesis John Wiley & Sons pT3aN0Mx Follow-up (months) Disease status n.a. Locally advanced Molecular Carcinogenesis 1 Table 2. The 83-gene set found to be differentially expressed in clear cell renal cell carcinoma. Probe accession Gene locus Exon/intron mapping Log2 T/N Annotation Leave-one-out crossvalidation Altered in non-clear cell RCC AW837036 GPX3 Exonic -3.7 Glutathione peroxidase 3 6/6 no AW883439 PRKAG1 Exonic -2.8 AMPK-gamma1 5/6 yes AW603395 YEATS4 Exonic -2.5 Glioma amplified sequence 41 5/6 yes AW365027 CSNK1G2 Exonic -2.5 Casein kinase 1, gamma 2 6/6 yes AW935998 FUS Exonic -2.5 Fusion t(12;16) in malignant liposarcoma) 6/6 yes BF751544 ICT1 Exonic -2.5 Immature colon carcinoma transcript 1 5/6 yes AW842748 SIN3B Exonic -2.4 SIN3 homolog B, transcription regulator (yeast) 6/6 yes CK327135 SYNJ2BP Exonic -2.4 Synaptojanin 2 binding protein 5/6 yes BF087349 MAP3K7IP1 Exonic -2.4 Mitogen-activated protein kinase kinase kinase 7 interacting protein 1 5/6 yes BF368747 SLC2A1 BF922962 CTSB rP Fo Intronic -2.4 Solute carrier family,member 1 6/6 yes Exonic -2.3 Cathepsin B 5/6 yes BE762727 FVT1 Exonic -2.3 Follicular variant translocation gene 5/6 yes BG876687 MYH11/NDE1 Exonic -2.3 Myosin heavy chain, smooth muscle isoform / NUDE1 6/6 yes AW175991 FLJ34165 Exonic -2.3 CDNA FLJ34165 fis, clone FCBBF3014770 5/6 yes BF890754 UQCRH Exonic -2.2 Ubiquinol cytochrome c reductase hinge protein 5/6 yes AW753128 P2RY1 Exonic -2.2 Purinoceptor P2Y1 5/6 yes C10orf104 Exonic -2.1 EPAS1 Exonic -2.1 AW373943 CAPNS1 Exonic -2.0 BF378949 RAB27A Exonic -2.0 Chromosome 10 open reading frame 104 6/6 yes Endothelial PAS domain protein 1 6/6 yes Calpain, small subunit 1 6/6 yes RAB27A 5/6 yes ev BF857797 AW836747 rR ee BE697369 C16orf34 Exonic -2.0 Chromosome 16 open reading frame 34 6/6 yes AW364435 LDLRAD3 Exonic -2.0 Hypothetical protein LOC143458 6/6 yes AW884675 MTMR9 Exonic -2.0 Myotubularin related protein 9 5/6 no AW862491 KIAA0984 Exonic -2.0 Hypothetical protein LOC23329 5/6 yes BF892704 GSN Exonic -1.9 Gelsolin 6/6 yes BF831599 VRK2 Exonic -1.9 Vaccinia related kinase 2 5/6 no BF089987 SND1 Intronic -1.8 Staphylococcal nuclease and tudor domain containing 1 6/6 no BF155287 SRF Exonic -1.7 Serum response factor 5/6 no BF882783 ACTN4 Intronic -1.7 Actinin alpha 4 5/6 no iew 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 Page 28 of 29 BF898656 TRIP3 Exonic -1.6 Thyroid hormone receptor interactor 3 6/6 yes BQ349967 PRDX3 Exonic -1.6 Peroxiredoxin 3 6/6 no BF736784 SFPQ Exonic -1.6 Splicing factor proline/glutamine-rich 5/6 no AW819770 RAB4A Exonic -1.6 Ras associated protein Rab4 5/6 no AW369265 ERCC5 Exonic -1.5 Excision repair, group 5 6/6 no BF891123 TFEC Exonic -1.5 Transcription factor EC 6/6 no BE836304 NR4A3 Exonic -1.5 Nuclear receptor subfamily 4, group A, member 3 6/6 no BF333281 NIBP Intronic -1.4 NIK and IKK binding protein 5/6 no AW883175 CASP7 Exonic -1.3 Caspase 7 5/6 no BE816027 TFDP2 Exonic -1.3 Transcription factor DP2 5/6 no John Wiley & Sons Page 29 of 29 2 BF365294 TACC1 Intronic -1.3 Transforming, acidic coiled-coil containing protein 1 6/6 yes BF751539 FOXK2 Exonic -1.2 Forkhead box K2 5/6 no BE153247 MBD2 Exonic -1.2 Methyl CpG binding domain protein 2 5/6 no BF990000 ENPP1 Exonic -1.2 Ectonucleotide pyrophosphatase/phosphodiesterase 1 5/6 no BE720500 S100A2 Exonic -1.1 S100 calcium binding protein A2 5/6 no BF946916 CHEK1 Exonic -1.0 Cell cycle checkpoint kinase 5/6 no BF856925 WDR23 Exonic -1.0 WD repeat domain 23 5/6 no AW361064 PICALM Exonic -1.0 Phosphatidylinositol binding clathrin assembly protein 5/6 no AW859979 FLJ39067 Exonic -1.0 CDNA FLJ39067 fis, clone NT2RP7014910 5/6 no BQ366120 PRCC Exonic -1.0 Renal cell carcinoma, papillary 1 5/6 no BE697269 SH3PX3 Exonic -0.9 Hypothetical protein MGC32065 5/6 no BF922401 EPB41 Exonic -0.9 Erythrocyte membrane protein band 4.1 5/6 no AW939421 MAP2K3 BQ314686 MSH3 BF946928 DEPDC5 BG010306 HDAC5 BF994346 NDC80 BF360792 RAB25 BF082556 Exonic -0.9 Mitogen-activated protein kinase kinase 3 4/6 no Exonic -0.9 MutS homolog 3 5/6 no rP Fo Exonic -0.9 DEP domain containing 5 5/6 no Intronic -0.9 Histone deacetylase 5 5/6 no Exonic -0.8 Kinetochore complex component (S. cerevisiae) 4/6 no Intronic -0.8 Ras associated protein RAB25 4/6 no Intergenic -0.7 MCM2 Exonic BF092089 TCF3 Exonic BE163794 ZBED4 Exonic AW748714 ZNF447 BE697330 SAT2 AW837043 BF087474 -0.6 4/6 no Minichromosome maintenance protein 2 3/6 no -0.6 Transcription factor 3 4/6 no -0.5 Zinc finger BED domain containing 4 3/6 no Exonic -0.4 Hypothetical protein FLJ12895 5/6 no Exonic -0.4 Spermidine/spermine N1-acetyltransferase 2 4/6 no IL11RA Exonic -0.4 GAA Exonic 0.1 rR BQ338721 ee AW852125 AK055564 Exonic 0.1 AK055565 BE935243 MDM2 Exonic 0.1 Transformed 3T3 cell double minute 2 AW796066 TP53I3 Exonic 0.1 p53 induced gene 3 2/6 no BG005977 MLLT7 Exonic 0.1 Myeloid/lymphoid, translocated to 7 3/6 no BE070310 SDC2 Exonic 0.1 Syndecan 2 2/6 no BF810617 ADORA2A Exonic 0.1 Adenosine A2 receptor 2/6 no BF871631 FOXK1 Exonic 0.1 Forkhead box K1 3/6 no BF957566 TMF1 Exonic 0.1 TATA element modulatory factor 1 2/6 no BF949348 TCF2 Exonic 0.3 Transcription factor 2 2/6 no BE837647 POFUT2 Exonic 0.3 Protein O-fucosyltransferase 2 5/6 no BF987726 H2AFY Intronic 0.3 H2A histone family member Y 5/6 no BE702107 MAP4 Exonic 0.6 Microtubule associated protein 4 5/6 no AW880614 RBMX Exonic 0.7 RNA binding motif protein, X-linked 5/6 no BF997724 PAPPA/AY623011 Exonic 0.7 Pregnancy associated plasma protein A / DIPLA1-antisense mRNA 5/6 no BF328211 AK091566 Exonic 1.1 AK091566 5/6 no AW901127 ARNTL Exonic 1.1 Aryl hydrocarbon receptor nuclear translocator-like 5/6 no AW377370 POLL Exonic 1.1 DNA polymerase lambda 5/6 no AW383947 CD68 Exonic 1.7 CD68 antigen 6/6 no Interleukin 11 receptor alpha 4/6 no Lysosomal alpha glucosidase 3/6 no 3/6 no 2/6 no iew ev 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 Molecular Carcinogenesis John Wiley & Sons