I Universidade Camilo Castelo Branco Instituto de Engenharia Biomédica FABRICIO LUIZ SILVEIRA DISCRIMINAÇÃO DE TECIDOS DISPLASICOS E NEOPLASICOS DE TECIDO NORMAL EM PELE in vivo ATRAVÉS DA ESPECTROSCOPIA RAMAN E ESTATÍSTICA MULTIVARIADA. DISCRIMINATION OF DYSPLASIA AND NEOPLASM FROM NORMAL SKIN TISSUE in vivo THROUGH RAMAN SPECTROSCOPY AND STATISTICAL MULTIVARIATE. São José dos Campos, SP 2014 II Fabricio Luiz Silveira DISCRIMINAÇÃO DE TECIDOS DISPLÁSICOS E NEOPLÁSICOS DE TECIDO NORMAL EM PELE in vivo ATRAVÉS DA ESPECTROSCOPIA RAMAN E ESTATÍSTICA MULTIVARIADA. Orientador: Prof. Dr. Marcos Tadeu Tavares Pacheco Tese de doutorado defendida no Programa de Pós-Graduação em Engenharia Biomédica da Universidade Camilo Castelo Branco, como complementação dos créditos necessários para obtenção do título de Doutor em Engenharia Biomédica. São José dos Campos, SP 2014 III IV V DEDICATÓRIA Dedico esta conquista a meus pais, Landulfo e Maria Helena, e irmãos, de modo especial ao Junior, por sempre me apoiarem e me incentivarem nos meus projetos. Dedico também à minha noiva, Ana Paula, e agradeço por sua paciência e cumplicidade em tudo. VI AGRADECIMENTOS Agradeço primeiramente a Deus, pois se esta minha consquitas pessoal não fosse de seus planos, nada disto aconteceria. E de maneira especial a Nossa Senhora por sempre me acolher em meus momentos de alegrias e aflições. Aos meus pais, Landulfo e Maria Helena, pelos alicerces de companheirismo, amor, e conhecimento transmitido através de suas vidas e, pelo incentivo e confiança que sempre me deram. Aos meus irmãos, Luciano, Fábio e de modo especial ao Junior, pelo grande incentivo, companheirismo e dedicação uns para com os outros. Agradeço a minha noiva, Ana Paula, por sempre me apoiar e por saber que posso sempre contar com ela. Agradeço ao Prof. Dr Renato Amaro Zângaro, Pró-Reitor de Pós-Graduação e Pesquisa da Unicastelo, e ao Prof. Dr. Antonio G. J. Balbin Villaverde, coordenador do Doutorado em Engenharia Biomédica pela oportunidade a mim dada e a todos os professores que lecionaram durante a minha carreira acadêmica. De modo especial agradeço ao meu orientador, Prof. Dr Marcos Tadeu T. Pacheco, pela paciência, exemplo profissional e pelos ensinamentos, que me permitiram cumprir mais uma etapa na minha carreia acadêmica. Agradeço também a secretária e amiga Nídia, ao amigo Leandro por sempre estarem disposto a me ajudar, e aos amigos do Instituto de Engenharia Biomédica da Unicastelo, Henrique, Felipe, Milene, Viviane e tantos outros que passam pelo Instituto. Agradeço a FAPESP (Fundação de Amparo à Pesquisa do Estado de São Paulo) pela concessão da bolsa de doutorado (Processo n. 2010/11111-0) e pelo apoio financeiro ao projeto (Processos n. 2009/01788-5 e 2012/20666). VII EPÍGRAFE “É muito melhor lançar-se em busca de conquistas grandiosas, mesmo expondo-se ao fracasso, do que alinhar-se com os pobres de espírito, que nem gozam muito nem sofrem muito, porque vivem numa penumbra cinzenta, onde não conhecem nem vitória, nem derrota.” (Theodore Roosevelt) VIII DISCRIMINAÇÃO DE TECIDOS DISPLASICOS E NEOPLASICOS DE TECIDO NORMAL EM PELE in vivo ATRAVÉS DA ESPECTROSCOPIA RAMAN E ESTATÍSTICA MULTIVARIADA. RESUMO A espectroscopia Raman vem sendo empregada na discriminação de tecido neoplásicos (cânceres de pele não melanoma), tecidos displásicos e tecidos não neoplásicos (normais) in vitro e in vivo. Este estudo propõe a utilização da espectroscopia Raman no infravermelho próximo para a discriminação in vivo entre os cânceres de pele humana não melanoma (carcinoma basocelular - CBC, carcinoma espinocelular - CEC), displasias (queratose actínica - KER) de lesões benignas e tecidos normais. Os espectros foram obtidos in situ em lesões suspeitas, pré-procedimento cirúrgico para biópsia excisional. Os espectros Raman de pele normal foram obtidos em regiões adjacentes, diagnosticado clinicamente como tecido normal. Os tecidos lesionados foram retirados e submetidos a exame histopatológico. Os espectros Raman foram coletados utilizando um sistema Raman portátil no infravermelho próximo, conectado a uma Probe (cateter a fibra óptica). Foram desenvolvidos modelos de discriminação entre os diferentes grupos histopatológicos baseados na Análise de Componentes Principais (PCA/DA), e como critério de discriminação, as distâncias Euclideana, Quadrática e Mahalanobis; também foi utilizada a análise discriminante baseado em Partial Least Squares (PLS/DA). Os vetores espectrais de PCA e PLS mostraram algumas características espectrais dos componentes bioquímicos da pele, como lipídios (PC2 e VL2) e proteínas (PC4 e VL3). Os algoritmos baseados em PCA e PLS, empregando seis variáveis, mostraram que podem discriminar os espectros de câncer de pele não melanoma e displasias (CBC, CEC e queratose actínica), dos espectros de pele normal e benigno (tecido benigno e normal), com uma precisão de 82,8% e 91,9%, respectivamente, apesar das pequenas diferenças espectrais entre tecidos neoplásicos e não neoplásicos. IX Palavras-chave: Espectroscopia Raman no Infravermelho Próximo, Pele, in vivo, Diagnóstico, Análise Discriminante, Análise de Componentes Principais, Partial Least Squares. X DISCRIMINATION OF DYSPLASIA AND NEOPLASM FROM NORMAL SKIN TISSUE in vivo THROUGH RAMAN SPECTROSCOPY AND STATISTICAL MULTIVARIATE. ABSTRACT Raman spectroscopy has been used in the discrimination of neoplastic tissue (nonmelanoma skin cancers), and dysplastic tissue from normal (not neoplastic tissues) in vitro and in vivo. This study proposes the use of near-infrared Raman spectroscopy for in vivo discrimination between human skin cancer non-melanoma (basal cell carcinoma - BCC, squamous cell carcinoma - CPB), dysplasias (actinic keratosis KER) from benign lesions and normal tissues. The spectra were obtained in situ in suspicious lesions, pre-surgical procedure for excisional biopsy. The Raman spectra of normal skin were obtained from adjacent regions clinically diagnosed as normal tissue. The injured tissues were removed and subjected to histopathological examination. The Raman spectra were collected using a portable near infrared Raman system, connected to a Probe (catheter optical fiber). Models of discrimination between different histopathological groups were developed based on Principal Component Analysis (PCA/DA), and as a discrimination criterion, Euclidean, quadratic and Mahalanobis distances; discriminant analysis based on Partial Least Squares (PLS/DA) was also used. The spectral vectors PCA and PLS showed some spectral characteristics of the biochemical components of the skin, such as lipids (PC2 and VL2) and proteins (PC4 and VL3). The algorithms based on PCA and PLS, using six variables, showed that they can discriminate the spectra of non-melanoma skin cancer and dysplasia (BCC, SCC and actinic keratosis) spectra of normal and benign (benign and normal tissue) skin with an accuracy of 82.8% and 91.9%, respectively. Keywords: Near Infrared Raman Spectroscopy, Skin, in vivo, Diagnosis, Discriminant Analysis, Principal Component Analysis, Partial Least Squares. XI LISTA DE FIGURAS Figura 1: Camadas da pele. ..................................................................................... 22 Figura 2: Figura representativa das camadas da epiderme. .................................... 23 Figura 3: Camadas da epiderme. Mibração celular para a superfície da epiderme. 24 Figura 4: Espectro eletromagnético com o espectro de luz visível espandido. ........ 29 Figura 5: Esquema representativo para diferenciar os tipos de espalhamento. E0, estado fundamental - E1, estado virtual excitado - νi, frequência inicial do fóton incidente - νf, frequência final do fóton espalhado. .................................................... 40 Figura 6: Sistema de Espectroscopia Raman Dispersiva. ........................................ 41 Figura 7: Tabela de Contingência (matriz de confusão). .......................................... 49 Figura 8: Momento da coleta dos espectros Raman no paciente............................. 52 Figura 11: Gráfico dos seis primeiros vetores variantes de PCA e PLS (PCs e VLs, respectivamente) para o conjunto de dados dos espectros Raman. ......................... 61 Figura 12: Gráfico das médias das intensidades e desvio-padrão dos seis primeiros scores PCs utilizados nos modelos discriminnates. * Indica os pares de PC com diferenças estatisticamente significantes (p <0,05, ANOVA). ................................... 63 XII LISTA DE TABELAS Tabela 1: Descrição das amostras, incluindo número de pacientes, lesões e espectros utilizados na análise de discriminação. ..................................................... 53 Tabela 2: Resultados da discriminação: classificação correta por grupo; e precisão global dos diferentes arranjos dos grupos histopatológicos. ..................................... 65 XIII LISTA DE ABREVIATURAS E SIGLAS CBC: Carcinoma Basocelular CEC: Carcinoma Espinocelular KER: Queratose actinica NT: Não Tumor DNA: Ácido Desoxirribonucleico RNA: Ácido Ribonucleico FDA: Food and Drug Administration (Orgão federal americano que controla alimentos, suplementos alimentares, medicamentos (humano e animal), cosméticos e entre outros. INCA: Instituto Nacional do Câncer WHO: World Health Organization (Organização Mundial da Saúde) OMS: Organização Mundial da Saúde PCA: Análise de Componentes Principais (Principal Components Analisys) PC: Componentes Principais SVD: Decomposição do Valor Singular PCA/DA: Análise de Componentes Principais/Análise Discriminante PLS/DA: Mínimos Quadrados Parciais/ Análise Discriminante XIV SUMÁRIO 1. INTRODUÇÃO ...................................................................................................... 16 1.1. Objetivo geral ................................................................................................. 20 1.2. Objetivos específicos ..................................................................................... 20 2. REVISÃO BIBLIOGRÁFICA .................................................................................. 21 2.1. A Pele............................................................................................................. 21 2.1.1. Estrutura e fisiologia .................................................................................... 21 2.1.2. Epiderme ..................................................................................................... 22 2.1.2.1. Sistema queratinocítico ............................................................................ 23 2.1.2.2. Camada basal .......................................................................................... 25 2.1.2.3 Camada espinhosa ................................................................................... 25 2.1.2.4. Camada granulosa ................................................................................... 26 2.1.2.5. Camada córnea ........................................................................................ 26 2.1.3. Melanócitos ................................................................................................. 26 2.1.4. Derme ......................................................................................................... 27 2.1.5. Hipoderme................................................................................................... 27 2.2. Radiação Solar............................................................................................... 28 2.2.1 Radiação Solar Ultravioleta (UV) ................................................................. 29 2.2.1.1. Radiação Ultravioleta A (UVA) ................................................................. 29 2.2.1.2 Radiação Ultravioleta B (UVB) .................................................................. 30 2.2.1.3 Radiação Ultravioleta C (UVC) .................................................................. 30 2.3. Câncer............................................................................................................ 31 2.4. Carcinogenese ............................................................................................... 32 2.5. Câncer de pele ............................................................................................... 35 2.5.1. Ceratose actínica ........................................................................................ 36 2.5.2. Carcinoma basocelular................................................................................ 37 2.5.3. Carcinoma espinocelular ............................................................................. 38 2.6. Espectroscopia Raman .................................................................................. 38 2.7. Estatística multivariada - Análise multivariada ............................................... 41 2.7.1. Análise de agrupamento ............................................................................. 42 2.7.2. Análise de Componentes Principais ............................................................ 44 2.7.3. Medidas de distância................................................................................... 45 XV 2.7.6. Análise de variância (ANOVA) .................................................................... 47 2.7.7. Regressão por Mínimos Quadrados Parciais (PLS).................................... 47 2.8.7. Tabela de Contingência (matriz de confusão) ............................................. 48 3. MATERIAIS E MÉTODOS..................................................................................... 51 3.1. Coleta dos espectros ..................................................................................... 51 3.1.1. Critério de inclusão e exclusão ................................................................... 51 3.1.2. Preparação e aquisição dos espectros ....................................................... 51 3.2. Equipamento Raman e processamento dos espectros .................................. 53 3.2. Modelos espectrais para análise discriminante .............................................. 54 4. RESULTADOS ...................................................................................................... 57 5. DISCUSSÃO ......................................................................................................... 66 6. CONCLUSÃO........................................................................................................ 72 REFERÊNCIAS BIBLIOGRÁFICAS .......................................................................... 73 ANEXO A - Aprovação do Comitê de Ética em Pesquisa ........................................ 81 16 1. INTRODUÇÃO Durante séculos, o câncer foi amplamente considerado como uma doença dos países desenvolvidos. Porém, a cerca de quatro décadas, a situação mudou, e a maioria das mortes globais por câncer foram observadas nos países em desenvolvimento, especialmente aqueles com poucos recursos. Assim, nas últimas décadas, o câncer ganhou uma dimensão maior, tornando-se um problema de saúde pública em todo o mundo. A Organização Mundial de Saúde (OMS) estima uma incidência de 27 milhões de casos de câncer para o ano de 2030 (FERLAY et al., 2010; INCA, 2012). A falta de dados estatísticos, causada pela negligência nos registros e a falta de comunicação entre os órgãos responsáveis pela coleta dos registros, torna mais difícil às estimativas para o câncer de pele não melanoma, mas a expectativa é de uma incidência atual de 2 a 3 milhões de cânceres de pele não melanoma em todo o mundo (WHO, 2012). No Brasil, as estatísticas de câncer, para 2014, segundo o Instituto Nacional de Câncer (INCA), indicaram 576 mil novos casos de câncer, deste total, já o câncer de pele não melanoma terá uma incidência em 182 mil novos casos (INCA, 2014). Estes dados estatísticos desempenham um papel importante para o desenvolvimento e a implantação de políticas de saúde pública, e a tomada de decisões sobre programas preventivos e detecção de doenças em estágios precoce (HANLON et al., 2000; INCA, 2014; PARKIN et al., 2001). Por conta desta crescente taxa de incidência de câncer, o desafio da medicina moderna é desenvolver técnicas que investiguem as alterações morfológicas e bioquímicas, promovendo assim informações importantes para o diagnóstico precoce in situ, de maneira não invasiva, não destrutiva e em tempo real em fluidos ou tecidos biológicos (HANLON et al., 2000). As técnicas de espectroscopia vibracional, em particular, a espectroscopia Raman, tem o potencial de se estudar a evolução de tecidos doentes e tem sido utilizadas em vários estudos para o diagnóstico in vitro e in vivo de tecidos biológicos, como próstata, gástrico, mama, entre outros (HAKA et al., 2006; HUANG et al., 2010; KENDALL et al., 2011; MAGEE et al., 2009; MOTZ et al., 2006; STONE et al., 2007). Tecidos normais e anormais têm diferenças na constituição bioquímica e morfológica, que são causados principalmente por diferenças no metabolismo ou 17 mudanças nas estruturas e funções celulares, principalmente relacionados à proteínas, lipídios e ácidos nucleicos, diferenças estas que poderiam ser usadas para a discriminação entre os tecidos (DE JONG et al., 2006; HANLON et al., 2000; LYNG et al., 2007; STONE et al., 2007). Essas alterações nestes tecidos podem ser prontamente detectadas pela espectroscopia Raman, técnica a qual tem sido considerada como uma ferramenta promissora para discriminar alterações dos tecidos benignos e malignos em diferentes patologias (HANLON et al., 2000). A utilização da espectroscopia com excitação no infravermelho próximo tem uma vantagem importante, a diminuição da autofluorescência da amostra em tecidos biológicos (SMITH; DENT, 2005). Sistemas de espectroscopia Raman com cateteres a fibra óptica proporcionam a coleta dos espectros Raman com uma maior autonomia e liberdade para a análise em fluidos e em tecidos in vitro e in vivo (HAKA et al., 2006; HANLON et al., 2000; MOTZ et al., 2006; ZHAO et al., 2008). Sistemas de espectroscopia Raman automatizados foram recentemente propostos para uma avaliação in vivo dos tecidos biológicos de maneira rápida, com tempos menores do que 1 s (MOTZ et al., 2006; ZHAO et al., 2008). A espectroscopia Raman vem sendo utilizada para avaliar diferenças na composição molecular de estrutura nas camadas da pele in vivo (CHRIT et al., 2005; GREVE; ANDERSEN; NIELSEN, 2008). Darvin et al. (2005) realizaram um estudo para determinação da quantidade de carotenoides na pele in vivo, utilizando a espectroscopia Raman ressonante em 514 nm. Mais recentemente, Calin et al. (2013) realizaram uma revisão da literatura, para determinar qual técnica óptica, entre a tomografia óptica de coerência, espectroscopia de fluorescência, espectroscopia de refletância, espectroscopia Raman e microscopia confocal, proporciona um melhor diagnóstico para o câncer de pele. Nesta revisão, a espectroscopia Raman mostrou ter melhores resultados de diagnóstico, tanto para carcinomas como para melanoma, com sensibilidades e especificidades acima de 90% e 50%, respectivamente. Estudos mostram a utilização da espectroscopia Raman para discriminação de lesões de pele não melanoma em comparação com tecidos de pele normal (CHOI et al., 2005; FENDEL; SCHRADER, 1998; GNIADECKA et al., 2004; GNIADECKA et al., 1997a; GNIADECKA et al., 1997b; LIEBER et al., 2008a; LIEBER et al., 2008b; NIJSSEN et al., 2002; NUNES et al., 2003). Alguns estudos utilizam algoritmos com base em métodos estatísticos para a discriminação de lesões em tecidos de pele in 18 vitro e in vivo a partir de tecidos normais (BODANESE et al., 2012; BODANESE et al., 2010; CHOI et al., 2005; GNIADECKA et al., 2004; GNIADECKA et al., 1997b; LIEBER et al., 2008a; NIJSSEN et al., 2002; SIGURDSSON et al., 2004). Os métodos estatísticos, como a Análise de Componentes Principais (PCA - Principal Components Analysis), que é uma técnica de redução de dados, podem ser utilizados para um grupo de espectros com características selecionadas de acordo com diferenças na patologia do tecido, através de uma adequada técnica de discriminação (tal como Análise Discriminante Linear - LDA utilizando as distâncias Euclidiana, Quadrática ou Mahalanobis) aplicada aos componentes principais mais relevantes (HANLON et al., 2000). Modelos de diagnóstico utilizando estatística multivariada, como PCA foram aplicadas visando o diagnóstico de câncer com alta sensibilidade e especificidade (BODANESE et al., 2012; BODANESE et al., 2010; GNIADECKA et al., 2004; NUNES et al., 2003; SIGURDSSON et al., 2004), além de modelos espectrais que detectam alterações bioquímicas que ocorrem nos tecidos biológicos (DURAIPANDIAN et al., 2013; HU et al., 2013; HUTCHINGS et al., 2010; KOLJENOVIĆ et al., 2004; LUO et al., 2013; MALINI et al., 2006). A espectroscopia Raman tem sido empregada a fim de discriminar lesões de pele não melanoma quando comparado com tecidos normais in vitro (BODANESE et al., 2012; BODANESE et al., 2010; CHOI et al.,2005; FENDEL; SCHRADER, 1998; GNIADECKA et al., 2004; GNIADECKA et al., 1997a; GNIADECKA et al., 1997b; LARRAONA-PUY et al., 2009; LIEBER et al., 2008a; NIJSSEN et al., 2002; SIGURDSSON et al., 2004) e in vivo (CHRIT et al., 2005; HUANG et al., 2004; HUANG et al., 2001; LIEBER et al., 2008b; LUI et al., 2012; PHILIPSEN et al., 2013; ZHAO et al., 2008). Uma das primeiras tentativas para a obtenção de um espectro Raman de pele in vivo, para diagnóstico clínico, foi realizada por Huang et al. (2001), na qual um espectro Raman de boa qualidade foi obtido com tempo de um segundo, com o uso de um espectrógrafo de dispersão, uma câmera CCD (charge coupled device) e um cateter a fibra (Probe). Lieber et al. (2008b) desenvolveram um sistema Raman confocal portátil com uma Probe, para o estudo clínico de câncer de pele não melanoma (CBC e CEC), comparado ao tecido normal, em 19 pacientes, na qual foi obtida uma sensibilidade de 100% e uma especificidade de 91%, utilizando um algoritmo de classificação baseado em Sparse Multinomial Logistic Regression (SMLR) Zhao et al. (2008) demonstraram um sistema integrado de espectroscopia Raman em tempo real para avaliação e caracterização da pele humana in vivo, onde 19 o tempo completo para coleta dos dados e processamento do espectro pode ser da ordem de 100 ms. Lui et al. (2012) realizaram um estudo in vivo, com um espectrômetro Raman de 785 nm, associado a uma Probe, para o diagnóstico de câncer de pele, com um tempo de aquisição de um segundo, equipamento este, tal como descrito em Huang et al. (2001). O estudo realizado por Lui et al. (2012) para a discriminação dos tecidos de pele, foi realizado através de dois modelos discriminantes diferentes, Análise de Componentes Principais (PCA - Principal Components Analysis) e nos Mínimos Quadrados Parciais (PLS - Partial Least Squares), em 518 amostras de 453 pacientes. As amostras de tecidos incluem lesões benignas e malignas, tais como melanomas, carcinomas basocelulares, carcinomas espinocelulares, queratose actínica, queratose seborreica, e nevos, os resultados apresentam uma alta sensibilidade e especificidade. Alguns estudos utilizam algoritmos, baseados em métodos estatísticos para a discriminação de lesões em tecidos da pele a partir da pele normal, tanto in vitro como in vivo (BODANESE et al., 2012; BODANESE et al., 2010; CHOI et al., 2005; GNIADECKA et al., 2004; GNIADECKA et al, 1997a; HUANG et al., 2001; LIEBER et al., 2008a; LIEBER et al., 2008b; NIJSSEN et al., 2002; SIGURDSSON et al., 2004). Os métodos estatísticos incluindo a estatística multivariada PCA, que é uma técnica de redução de dados, podem ser utilizados para um grupo de espectros com características selecionadas, de acordo com as diferenças na patologia, por meio de uma função de discriminação adequada, como a distâncias Euclidiana, Quadrática ou de Mahalanobis, aplicada aos componentes principais mais relevantes (HANLON et al., 2000). Modelos de discriminanação utilizando PCA (PCA/DA - Principal Components Analysis/Discriminant Analysis) foram aplicados, com o objetivo de diagnóstico de câncer com uma alta sensibilidade e especificidade (BODANESE et al., 2012; BODANESE et al., 2010; GNIADECKA et al., 1997b; HU et al., 2013; HUTCHINGS et al., 2010; KOLJENOVIĆ et al., 2004; LUO et al., 2013; MALINI et al., 2006), correlacionando as alterações espectrais, alterações bioquímicas e biológicas nos tecidos com os coeficientes dos componentes principais (BODANESE et al., 2012; BODANESE et al., 2010). PLS é outra técnica multivariada empregada para redução de dados, e que tem sido utilizada para fins de classificação e discriminação, em diversos estudos em tecidos biológicos e fluidos (EVERS et al., 2012; HUANG et al., 2004; LI et al., 2012; LLOYD et al., 2013). Discriminação por PLS (PLS/DA - Partial Least Squares/Discriminant Analysis) poderia ser utilizado 20 com sucesso onde a variabilidade "intra grupos" é maior do que a "inter grupos" (BARKER; RAYENS, 2003). PLS/DA tem sido usada para discriminar neoplasias primárias e secundárias, a partir de tumores benignos, em linfonodos em cabeça e pescoço, com uma maior taxa de sucesso quando comparado ao PCA/DA (LLOYD et al., 2013). 1.1. Objetivo geral O objetivo do presente trabalho é apresentar os resultados de diferentes modelos estatísticos discriminantes, para o diagnóstico de neoplasias de pele [câncer de pele não melanoma (carcinoma basocelular - CBC, carcinoma espinocelular - CEC)], displasia (queratose actínica - KER) e de tecidos não alterados (normal e benigno NT) em pele humana in vivo, utilizando as estatísticas multivariadas, PCA e PLS. Este trabalho foi realizado utilizando espectros Raman de pele in vivo obtidos de pacientes que passariam por procedimento de biópsia excisional já prevista. 1.2. Objetivos específicos • 1 - Mostrar os resultados estatísticos dos modelos discriminantes PCA/DA e PLS/DA • 2 - Comparar os modelos estatísticos PCA e PLS para a discriminação de tecido normal das neoplasias de pele in vivo. • 3 - Indicar qual dos modelos discriminantes obteve o melhor resultado para a discriminação entre tecido normal e as neoplasias. 21 2. REVISÃO BIBLIOGRÁFICA 2.1. A Pele A pele do homem, que corresponde a cerca de 15% do peso corporal, é um órgão que reveste e delimita o organismo, protegendo-o e interagindo com o meio exterior. Caracteristicamente dinâmica, a pele apresenta alterações constantes, sendo dotada de grande capacidade renovadora e de reparação, e com certo grau de impermeabilidade. Tem como função maior e vital a conservação da homeostasia (termorregulação, controle hemodinâmico e excreção de metabólitos). Desempenha ainda, função sensorial, através dos elementos do sistema nervoso situado na derme, e função de defesa contra agressões físicas, químicas e biológicas, para qual se destacam, pela sua importância, a queratinização, o manto lipídico e seu sistema imunológico (AZULAY; AZULAY, 2004; ZAIDI; LANIGAN, 2010). No início do século XX, o patologista Rudolph Virchow compreendeu a pele como sendo uma cobertura e uma barreira protetora para os órgãos viscerais internos, e também como uma barreira passiva contra a perda de fluídos e lesão mecânica. Durante as cinco últimas décadas, os inúmeros projetos científicos têm mostrado a pele como um órgão altamente complexo, na qual suas interações celulares e moleculares precisamente reguladas controlam respostas cruciais ao nosso organismo (AZULAY; AZULAY, 2004). 2.1.1. Estrutura e fisiologia A pele é composta basicamente por três camadas interdependentes: a epiderme, a mais externa, a derme, a intermediária, e a hipoderme, a mais profunda (Figura 1). A transição entre a epiderme e a derme é denominada junção dermoepidérmica ou zona da membrana basal (AZULAY; AZULAY, 2004; KUMAR; ABBAS; FAUSTO, 2005; ZAIDI; LANIGAN, 2010). 22 Figura 1: Camadas da pele) Fonte: Santos (2013) 2.1.2. Epiderme A epiderme, basicamente, é um tecido epitelial estratificado queratinizado, com variações estruturais e funcionais significativas na dependência do seu sítio anatômico, cuja espessura apresenta variações desde 0,04 mm na área das pálpebras até 1,6 mm na região palmo-plantares. É constituída por: sistema queratinocítico, composto por células epiteliais denominadas queratinócitos (ceratinócitos), responsáveis pelo corpo da epiderme e de seus anexos (pelos, unhas e glândulas); sistema melânico, formando pelos melanócitos; células de Langerhans, com função imunológicas; células de Merkel, integradas ao sistema nervoso e células dendríticas que fazem parte do sistema imunológico. A derme desempenha uma influência reguladora sobre a morfogênese e diferenciação epidérmica, sendo fundamental para a determinação de sua espessura, arquitetura, tipo de diferenciação e padrão dos seus anexos (AZULAY, AZULAY, 2004; SAMPAIO, RIVITTI, 2001; ZAIDI; LANIGAN, 2010). A epiderme é constituída de um epitélio pavimentoso estratificado, estruturado em 4 ou 5 camadas de células, dependendo da região do corpo (Figura 2): (ANVISA, 2014) • camada basal - a mais profunda e em contato com a derme, formada de células pouco diferenciadas e de forma cúbica, que se multiplicam incessantemente; • camada espinhosa - constituída de células mais achatadas, queratinizadas, que estabelecem contato estreito umas com as outras através de desmossomas; 23 • camada granulosa - contendo células achatadas, ricas em queratina e fibras de colágeno, e contendo lisossomos ricos em enzimas; • camada lúcida - presentes na pele glabra (região do corpo sujeitas a maior atrito e têm uma camada mais grossa, como palmas das mãos e pés), ela apresenta células achatadas, de aspecto hialino, contendo enzimas autodigestivas, responsáveis pela destruição de suas organelas citoplásmicas e seus núcleo; • camada córnea - formada de células muito achatadas, cujo citoplasma contém quantidades importantes de queratina. Figura 2: Figura representativa das camadas da epiderme Fonte: Tavares (2013) 2.1.2.1. Sistema queratinocítico Responsável por pelo mesmo 80% das células epidérmicas, é caracterizado pela disposição lado a lado de suas células e por sua constante renovação. O alto índice de multiplicação celular dos queratinócitos da sua camada mais profunda, a camada basal, fornece as células, que, a seguir, vão gradativamente se modificando (por diferenciação) e migrando para a superfície, formando a camada espinhosa. Essas células, após passarem por um rápido estágio em que se apresentam com o citoplasma mais basofílico e granuloso, a camada granulosa, transformam-se subitamente em células anucleadas, corneócitos, sendo então eliminadas para o 24 meio ambiente na camada mais externa da epiderme, a camada córnea (AZULAY; AZULAY, 2004; ZAIDI; LANIGAN, 2010). Figura 3: Camadas da epiderme. Mibração celular para a superfície da epiderme. Fonte: Tavares (2013). O citoesqueleto de todas as células eucarióticas é composto por uma complexa rede de proteínas estruturais com diferentes diâmetros de espessura, incluindo microfilamentos de actina (6 nm), os filamanetos intermediários (10 nm) e os microtúbulos (25 nm). No queratinócito e demais células epiteliais, os filamentos intermediários ou tonofilamentos são compostos por queratina; eles se dispõem em torno do núcleo e vão se conectando até alcançarem as placas desmossômicas e nelas inserir-se, ajudando a compor o citoesqueleto dessas células (AZULAY, AZULAY, 2004). Além da função estrutural, os queratinócitos participam ativamente dos processos inflamatórios e imunológicos, seja como célula alvo (por exemplo, psoríase), seja como secretores de citosinas, neuropeptídios e outros medicamentos. O queratinócito é capaz de produzir substâncias com ação autócrinas (agem sobre si mesmas), parácrinas (ação sobre as células vizinhas) e, em situações especiais, endócrinas (ação à distância) (AZULAY, AZULAY, 2004). 25 2.1.2.2. Camada basal A camada basal é uma camada celular mais profunda da epiderme, tem participação vital na formação e manutenção da junção dermoepidérmica. Na pele normal, ela é composta por uma única fileira de queratinócitos justapostos, a maioria com capacidade de multiplicação, as células germinativas, que apresentam morfologia colunar, citoplasma basófilo e núcleo grande e oval. A população dessas células é heterogênea; um pequeno percentual é composto de células-tronco caracterizadas por uma velocidade baixa de mitose durante toda a vida, gerando clones de queratinócitos denominadas células de amplificação transitória, que se dividem muito mais rapidamente, mas são programadas para um número limitado de mitoses. A mitose das células de amplificação transitória dá origem à células com características diferentes: uma nova célula de amplificação transitória, que permanece na camada basal e outra, denominada pós-mitótica ou diferenciada, que perde a capacidade de mitose e inicia o processo de diferenciação queratinocítica e de migração em direção até a superfície. A renovação completa, desde a divisão da célula basal até a eliminação das lâminas córneas, faz-se em 52 a 72 dias, assim distribuídos: o tempo de duração da divisão celular é de aproximadamente 19 dias, o trânsito através da camada espinhosa dura de 26 a 42 dias e o trânsito através do estrato córneo é de 19 dias (AZULAY, AZULAY, 2004; ZAIDI, LANIGAN, 2010). 2.1.2.3 Camada espinhosa Ao deixarem a camada basal rumo à superfície, os queratinócitos sofrem contínuas e importantes modificações morfológicas, moleculares e histoquímicas, passando a ser poligonais, de citoplasma acidófilo e rico em desmossomos, sendo denominadas células espinhosas ou células de Malpighi. Essas células são numerosas e dispostas em várias fileiras, cujo número varia na dependência da localização anatômica e dos fatores endógenos (por exemplo, hormônios, vascularização, etc) e exógenos (por exemplo, ultravioleta, trauma, etc). Ao progredirem na sua migração, as células espinhosas vão se achatando e tornando-se cada vez mais acidófilas. Embora os desmossomos estejam presentes em toda a epiderme, é na camada espinhosa que se mostram mais numerosos (AZULAY; AZULAY, 2004). 26 2.1.2.4. Camada granulosa Ao deixarem a camada espinhosa em direção à superfície, as células formarão algumas fileiras em que se apresentarão repletas de grânulos basófilos de queratohialina no citoplasma, constituindo a camada granulosa. Essa camada caracteriza-se por grande atividade metabólica, objetivando a síntese dos elementos necessários ao processo final de cornificação, que resultará no súbito surgimento da camada córnea. Esses elementos são armazenados, em grande quantidade, na sua forma pré-ativada, tanto no interior de organelas como livremente. Os grânulos de ceratohialina são constituídos por pró-filagrina, filamentos de ceratina e loricrina. Os granulos lamelares, morfologicamente semelhantes aos lipossomos, contendo no seu interior glicoproteínas, ácidos graxos, fofolipídios, glicosilceramidas e colesterol, são inicialmente vistos nas células das porções superiores da camada espinhosa, mas é na camada granulosa que se apresentam em grande número. Esses componentes químicos se depositarão na forma de bainha dupla em torno de cada célula, originando uma grande barreira lipídica à passagem de água e substâncias polares da epiderme, formando assim uma relativa barreira lipídica da pele (AZULAY; AZULAY, 2004). 2.1.2.5. Camada córnea Sendo a camada mais externa da epiderme, constitui o verdadeiro limite entre o indivíduo e o meio ambiente. As células são acidófilas e extremamente planas, sendo as células mais largas do organismo, o que permitirá a sua descamação e a mobilidade da região sem provocar dano à integridade do tecido (AZULAY; AZULAY, 2004). 2.1.3. Melanócitos Os melanócitos são células dendríticas derivadas da crista neural e produtores do pigmento intrínseco da pele, a melanina, sendo esta responsável pela absorção e difusão das radiações ultravioletas. São vistos predominantemente na camada basal, na proporção de 1 melanócito para 10 queratinócitos basais (AZULAY; AZULAY, 2004). 27 2.1.4. Derme A derme é uma camada de tecido conjuntivo, composta por um sistema integrado de estruturas fibrosas, filamentosas e amorfas, na qual são acomodados vasos, nervos e anexos epidérmicos. Fibroblastos, histiócitos, células dendríticas e mastócitos são suas células residentes, enquanto linfócitos, plasmócitos e outros elementos celulares do sangue são encontrados em número variável e de forma transitória. Sua interação com a epiderme é fundamental para manutenção dos dois tecidos: ambos colaboram na formação da junção dermoepidérmica e dos anexos epidérmicos, assim como no processo de reparação da pele. A camada da derme é constituída basicamente por colágeno, fibras elásticas e as substâncias proteoglicanas e glicosaminoglicanas. O colágeno é distribuído amplamente pelos tecidos conjuntivos da derme, e provê resistência e elasticidade ao tecido. As fibras elásticas estão presentes em quase todos os órgãos em proporções variáveis. Na pele, essas fibras formam uma rede que se estende da junção dermoepidérmica ao tecido conectivo da hipoderme. Estas fibras formam uma trama com funções de ancoragem e de oposição às forças de distensão e compressão. São sintetizadas por diversos tipos de células, na pele essas são sintetizadas pelos queratinócitos e pelos fibroblastos. A substância fundamental é formada por proteoglicanas, que tem a capacidade de ligação a múltiplos componentes do meio extracelular, e promove a aderência entre diversas estruturas, como células, fibras, fatores de crescimentos, água e etc, desempenhando papel fundamental na organização e viabilidade dos tecidos (AZULAY; AZULAY, 2004; ZAIDI; LANIGAN, 2010). 2.1.5. Hipoderme É a camada mais profunda da pele, constituída de lóbulos de lipócitos delimitados por septos de colágenos com vasos sanguíneos, linfáticos e nervos (AZULAY; AZULAY, 2004). 28 2.2. Radiação Solar O Sol é nossa fonte de luz e vida, é dele que provém energia para muitos processos biológicos, tanto para a natureza quanto para os seres humanos que na Terra habitam, processos esses fundamentais sem os quais seria impossível a vida. A radiação emitida pelo Sol, chega à superfície terrestre sob vários comprimentos de onda, ou seja, várias regiões do espectro eletromagnético, são elas: a faixa do ultravioleta de 100 nm a 400 nm, do visível entre 400 nm a 700 nm, e a do infravermelho que vai de 800 nm a 3.000 nm. Cerca de 9% da radiação ultravioleta (UV) proveniente do Sol é fundamentalmente necessário para processos biológicos saudáveis nos seres humanos, se forem feitas exposições ao Sol de modo moderadas, ou seja, sem exageros. Porém a exposição excessiva tanto a curto e em longo prazo podem trazer efeitos ao organismo humano, efeitos esses que podem ser observados e sentidos imediatamente após a exposição solar, como uma vermelhidão na pele; efeitos agudos e crônicos, que serão detectados futuramente, onde estes são causados pelo acúmulo da exposição solar durante a vida do indivíduo. Um desses danos, causado pela exposição contínua e acumulativa da radiação ultravioleta solar é o câncer de pele. O grupo dos cânceres de pele que tem como fator predominante para sua incidência à radiação ultravioleta é composto por três tipos, são eles: carcinoma basocelular, carcinoma espinocelular e o melanoma (ROUESSAC; ROUESSAC, 2007; SILVA, 2007). Dos tipos de radiação emitidos pelo Sol a radiação visível é a mais conhecida, mas outras faixas são também muito importantes como a do infravermelho e a ultravioleta, afetando diretamente o equilíbrio dos ecossistemas e a vida na Terra. A luz visível está na faixa do espectro eletromagnético com comprimentos de onda que vão de 400 nm até 700 nm (Figura 4). Cerca de 44% da energia solar se concentra nesta faixa, principalmente na região do verde (em torno de 500 nm). A radiação na faixa do infravermelho é definida por comprimentos de onda de 800 a 3.000 nm, e pode penetrar profundamente na pele, até atingir órgãos internos, podendo ser sentida em forma de calor (CRUZ, 2014; SILVA, 2007). 29 Figura 4: Espectro eletromagnético com o espectro de luz visível expandido. Fonte: Ronan (2014) A radiação ultravioleta representa menos de 9% do total emitido pelo sol (entre 100 nm e 400 nm), mesmo em quantidades pequenas ela afeta sistemas biológicos (plantas e animais), tendo importância fundamental na saúde, no conforto e na qualidade de vida das pessoas. A atmosfera, mais especificamente a camada de ozônio é responsável pela absorção de parte dos raios ultravioleta provenientes do Sol, sendo esses raios invisíveis aos olhos humanos (CRUZ, 2014). 2.2.1 Radiação Solar Ultravioleta (UV) A radiação ultravioleta é uma parte da radiação solar referente ao comprimento de onda de 100 nm a 400 nm, sendo não perceptível aos olhos humanos. A radiação ultravioleta é uma onda eletromagnética composta de três faixas: ultravioleta C (UVC) de 100 a 280 nm; ultravioleta B (UVB) de 280 a 320 nm; e ultravioleta A (UVA) de 320 a 400 nm (CRUZ, 2014; SILVA, 2007). 2.2.1.1. Radiação Ultravioleta A (UVA) A Radiação Ultravioleta A (UVA) tem o seu comprimento de onda próximo à região do visível, corresponde a região entre 320 nm a 400 nm, atravessa facilmente a atmosfera e a camada de ozônio. As raios UVA representam cerca de 95% da radiação ultravioleta que atinge a superfície da Terra, e atinge a pele com a mesma 30 intensidade em qualquer horário do dia e época do ano, seja em meses de inverno ou de verão (CRUZ, 2014). A Radiação UVA apesar de causar efeitos semelhantes aos da UVB, não o faz uniformemente ao longo de seu espectro e, por esse motivo, foi dividida em duas regiões: UVA-1, compreendendo a faixa de 340 nm a 400 nm; e a UVA-2 entre 320 e 340 nm. A região do UVA-1, devido sua maior capacidade de penetração, reage com oxigênio molecular, produzindo espécies reativas capazes de induzir reações inflamatórias na pele e no DNA, do que derivam aumento da pigmentação, fotossensibilização, e predisposição ao câncer cutâneo (BEZERRA, 2007; CECATTO, 2014; CRUZ, 2014). 2.2.1.2 Radiação Ultravioleta B (UVB) A Radiação Ultravioleta B (UVB) com comprimento de onda entre 290 nm e 320 nm, têm uma menor capacidade de atravessar grandes distâncias na atmosfera e é parcialmente filtrada na camada de ozônio. De toda a radiação ultravioleta que atinge a superfície da Terra, cerca de 5 % é UVB, é mais intensa durante o verão, especialmente entre às 10h e 16h. A Radiação UVB é mais eficiente em produzir danos diretos ao DNA, fotoimunossupresão, eritema, espessamento da camada da córnea e melanogênese, sendo, por isso, considerada a maior fator etiológico das três formas de câncer cutâneo (BEZERRA, 2007; CRUZ, 2014). 2.2.1.3 Radiação Ultravioleta C (UVC) A Radiação Ultravioleta C (UVC) com seu comprimento de onda ente 100 nm e 280 nm não ultrapassa a atmosfera, é completamente absorvida pela camada de ozônio, não chegando à superfície terrestre. A Radiação UVC é basicamente germicida, pelo fato de ser absorvida pelas proteínas e aminoácidos, mais contém um pico de absorção da molécula de DNA (260 nm) e só não causa maior prejuízo à pele pelo fato de ter curta penetração (BEZERRA, 2007; CRUZ, 2014). 31 2.3. Câncer É importante relembrar que câncer é o nome dado a um conjunto de mais de 100 tipos diferentes de doenças que têm em comum o crescimento desordenado de células anormais com potencial invasivo. Além disso, sua origem se dá por condições multifatoriais. Esses fatores causais podem agir em conjunto ou em sequência para iniciar ou promover o câncer (carcinogênese) (BODANESE, 2008). De acordo com estimativas mundiais do projeto Globocan 2012, da Agência Internacional para Pesquisa em Câncer (IARC, do inglês International Agency for Research on Cancer), da Organização Mundial da Saúde (OMS), houve 14,1 milhões de casos novos de câncer e um total de 8,2 milhões de mortes por câncer, em todo o mundo, em 2012. A carga do câncer continuará aumentando nos países em desenvolvimento e crescerá ainda mais em países desenvolvidos se medidas preventivas não forem amplamente aplicadas (BRAY et al., 2012; INCA, 2014; JEMAL et al., 2011). Em 2030, a carga global será de 21,4 milhões de casos novos de câncer e 13,2 milhões de mortes por câncer, em consequência do crescimento e do envelhecimento da população, bem como da redução na mortalidade infantil e nas mortes por doenças infecciosas em países em desenvolvimento (BRAY et al., 2012; INCA, 2014). No Brasil, a estimativa para o ano de 2014 (INCA, 2014), que será válida também para o ano de 2015, aponta para a ocorrência de aproximadamente 576 mil casos novos de câncer, incluindo os casos de pele não melanoma, reforçando a magnitude do problema do câncer no país. O câncer de pele do tipo não melanoma (182 mil casos novos) será o mais incidente na população brasileira, seguido pelos tumores de próstata (69 mil), mama feminina (57 mil), cólon e reto (33 mil), pulmão (27 mil), estômago (20 mil) e colo do útero (15 mil). O desenvolvimento da maioria dos cânceres requer múltiplas etapas que ocorrem ao longo de muitos anos. Assim, alguns tipos de câncer podem ser evitados pela eliminação da exposição aos fatores determinantes. Se o potencial de malignidade for detectado antes de as células tornarem-se malignas, ou numa fase inicial da doença, tem-se uma condição mais favorável para seu tratamento e, consequentemente, para sua cura (INCA, 2014). 32 2.4. Carcinogenese A palavra carcinogênese é derivada da língua grega, na qual karkinos significa câncer e genesis significa produção ou origem, portanto é o termo utilizado para produção de carcinoma. Já carcinogenicidade se refere ao poder, habilidade ou tendência para produzir câncer. A principal meta do estudo da carcinogênese é, sem dúvida alguma, a prevenção do câncer (SILVA, 2000). A primeira observação de que a produção de tumor maligno era influenciado por substâncias exógenas foi feita por Percival Pott, médico inglês, em 1775, quando relacionou o câncer de bolsa escrotal dos limpadores de chaminé ao contato frequente com a fuligem. Devido a suas observações foram introduzidas, a partir dessa época, medidas preventivas, como proteção contra fuligem, mudança de arquitetura das casas e proibição de utilizar crianças para essa atividade. Após o desenvolvimento pela primeira vez de câncer experimental em coelho, com o uso alcatrão de carvão sobre a pele do animai, por Yamagiwa & Ichikawa, em 1915, vários agentes foram descritos como carcinogênicos para o homem: arsênico (1888), luz solar (1875), alcatrão (1876), raio X (1902) e radiação ultravioleta (1906). Essas descrições levaram à tentativa de proteção contra carcinoma ocupacional provocado por outras substâncias industriais e agentes físicos (SHEAR, 1937; SILVA, 2000). O câncer pode ser considerado como um evento molecular, acidente embriológico, predisposição genética, deficiência imunológica, desafio epidemiológico; no entanto, é um processo multifatorial, que envolve uma interação complexa de fatores endógenos e exógenos, a maior parte deles ainda por elucidar. Por estudos experimentais, já se sabe que a carcinogênese química não é um fenômeno espécie-específico, sendo necessárias estruturas moleculares específicas e ocorre em estágios bem separados, de iniciação ou indução, promoção e progressão. Existem vários carcinógenos ambientais prejudiciais ao homem, que podem ser parciais ou completos, como é a radiação ultravioleta B (SILVA, 2000). As diversas etapas da carcinogênese foram primeiramente descritas por Rous e Friedewald (1944). O estágio inicial, chamado de indução ou iniciação, ocorre por um efeito carcinogênico inicial, quando há alteração do DNA, RNA ou proteínas específicas. Vários agentes podem atuar nessa fase, sendo chamados de indutores. O estágio seguinte é o de promoção, com alterações da dinâmica da divisão celular ou do meio intracelular, provocada pelos promotores. A partir daí pode haver 33 progressão ou mesmo regressão do tumor quando já instalado (AZULAY; AZULAY, 2004; SILVA, 2000). A indução é um fenômeno irreversível, pois há interação e incorporação de fragmentos da molécula do carcinógeno ao DNA, ao RNA ou às proteínas específicas. A expressão do genoma da célula se modifica e essa alteração é então transmitida da célula-mãe para célula-filha, ocorrendo, portanto, reprodução celular com genoma alterado. (SILVA, 2000). Os fatores considerados etiológicos e/ou precipitantes dos cânceres cutâneos são vários, como predisposição genética; radiação ultravioleta; radiação não ultravioleta, como raios-X e radiação gama; fatores hormonais; imunossupressão; agentes químicos e drogas citotóxicas; traumatismos; papilomavírus; queimaduras crônicas, cicatrizes, úlceras, fístulas, osteomielite crônica, albinismo (AZULAY; AZULAY, 2004; SILVA, 2000). Há ainda algumas lesões consideradas como pré-cancerosas, como a ceratose actínica, com sua variante, o corno cutâneo, leucoplasia, doença de Bowen, e eritroplasia de Queyrat. A ceratose seborréica e o ceratoacantoma são também considerados como pré-cancerosos por alguns autores, mas se realmente o forem, a frequência de transformação maligna é muito pequena (ALLEN, 2010; SILVA, 2000; SPENCER et al., 1995) A predisposição genética como fator etiológico pode ser verificada pela maior incidência de câncer cutâneo em indivíduos de pele clara, que têm dificuldade de bronzeamento, ou seja, aqueles que queimam, mas não bronzeiam. Além disso, as doenças hereditárias comprovadamente levam ao câncer cutâneo precoce, como é o caso do xeroderma pigmentoso, doença genética autossômica recessiva rara, na qual o paciente tem uma maior sensibilidade à radiação ultravioleta e a alguns químicos, além de alteração do mecanismo de reparo do DNA. Com exposições mínimas ao sol, surgem sardas, queimaduras, ceratoses actínicas múltiplas, CBC, CEC e melanomas, além de apresentarem fotofobia, entrópio, ectrópio, ceratites e carcinoma no olho, pela alteração das áreas expostas. Cinquenta por cento dos pacientes já mostram alterações cutâneas antes de um ano de idade e câncer aos oito. Há um fenótipo de xeroderma pigmentoso típico com reparo normal do DNA, mostrando, portanto, que não só esse fenômeno interfere na gênese dessa doença (SILVA, 2000). 34 Os agentes físicos, como o calor, provocam carcinoma nas pernas, como é o caso de indivíduos que ficam muito próximos de brasas acesas. A luz solar provoca câncer na pele exposta. A maior exposição ocorre quanto maior a altitude e menor a latitude, havendo uma correlação inversa entre o grau de pigmentação e a habilidade de bronzeamento. A radiação ultravioleta é mais prejudicial em regiões de clima seco e ensolarado e o fotoenvelhecimento sempre precede o câncer. O efeito do sol é cumulativo, o da ultravioleta é maior quando aplicada em frações, e é proporcional à dose acumulada (SILVA, 2000). A fotocarcinogênese é uma das manifestações de processo fotobiológico, provocando respostas locais e sistêmicas, que podem ser diretas ou indiretas. A radiação UVB, de comprimento de onda de 290 a 320nm, tem ação fotocarcinogênica direta, levando a CBC e CEC, atuando como indutora e promotora potente em camundongo, levando à alteração estrutural no DNA humano, tanto in vitro quanto in vivo. Provoca alterações mutagênicas, através de dímeros de timina, que leva a formação de tumores. Para essas mutações existem mecanismos de proteção com reparo do DNA, pela excisão do defeito, reparo na pós-replicação e fotoreativação. O tumor surge quando há ausência ou deficiência nesse reparo (SILVA, 2000). Não se tem certeza ainda se a radiação UVA, de comprimento de onda que vai de 320 a 400nm, tem ação fotocarcinogênica direta. É indutora em animais, no homem e in vitro, talvez atue também como promotora. Seu mecanismo ocorre através da formação de dímeros de pirimidina, que é a principal lesão do DNA, com quebra de cadeias simples, crosslinks de proteína do DNA, além de reações oxidativas com formação de radicais livres (SILVA, 2000). Indiretamente, tanto a radiação UVA quanto a UVB tem ação local e sistêmica no sistema imune, por efeito imunossupressor, e, em geral, os tumores induzidos por essas radiações são altamente antigênicos. Como efeito sistêmico induzem células supressoras tumor-específicas e, como local na pele, diminuem o número de células de Langerhans, com inatividade das remanescentes. Com isso, há alteração da função de apresentação do antígeno, bloqueio da ativação da função celular efetora, levando a um bloqueio da resposta imune. Como através desse mecanismo há prevenção da rejeição do tumor, ocorre então crescimento do mesmo (SILVA, 2000). 35 Em relação aos fotoprotetores (protetores solares), que são extremamente benéficos, é preciso ressaltar que a proteção apenas contra a radiação UVB reduz a queimadura imediata, aumentando o tempo de permanência no sol e a exposição à radiação UVA, aumentando também a incidência de câncer cutâneo. A exposição à radiação UVA alternada com exposição a ambas, como ocorre com indivíduos que ora usam fotoprotetor apenas para radiação UVB e ora fotoprotetor para ambas, aumenta o dano das exposições combinadas, que têm ação indutora. Ao se utilizar a fotoproteção somente depois da queimadura, o que acontece com bastante frequência, pois é comum os pacientes só se lembrarem do protetor solar após uma primeira e intensa exposição ao sol, aumentando o risco do indivíduo adquirir um carcinoma cutâneo. Os fotoprotetores podem, nesse caso, já com a pele mais sensível, alterar o ambiente, tanto inter quanto intracelular, atuando assim como carcinógenos promotores, e, por essas razões, o FDA (Food and Drug Administration) questiona atualmente a eficácia e estuda uma regulamentação para a utilização dos fotoprotetores (SILVA, 2000). A fotocarcinogênese é um processo extremamente complexo, e os vários efeitos da radiação ultravioleta ainda por elucidar, principalmente para o CBC, pois não existe um modelo eficiente, como ocorre com o CEC, que pode ser provocado em várias espécies de animais, podendo-se dessa maneira estudar a importância de outros fatores associados, tanto locais quanto sistêmicos. A carcinogênese é, sem sombra de dúvida, processo multifatorial induzido e modulado por inúmeros fatores endógenos e exógenos, muitos ainda a descobrir e confirmar, sendo seu estudo da maior importância para a prevenção do câncer. Ainda há muito a pesquisar e elucidar sobre seus estágios bastante complexos, estando a Ciência apenas no início dessa investigação. 2.5. Câncer de pele O câncer de pele tem distribuição universal e costuma apresentar-se sob três formas principais: o melanoma, o carcinoma basocelular (CBC) e o carcinoma espinocelular (CEC) ou epidermoide. Os carcinomas basocelular e carcinoma espinocelular são também conhecidos como câncer de pele não melanoma, tipo mais frequentes de câncer de pele, e também é o câncer de pele mais frequente na população de pele clara. A exposição excessiva ao sol é o principal fator de risco para o surgimento dos 36 cânceres de pele melanoma e não melanoma. O CEC ocorre quase exclusivamente em áreas expostas continuamente à radiação solar, enquanto o CBC pode ocorrer em áreas do corpo expostas à radiação solar de forma intermitente. Para o melanoma, a presença de numerosos nevos cutâneos aumenta o risco (INCA, 2014). A incidência dos cânceres de pele não melanoma aumenta com a idade, em especial a incidência do CEC. O CBC é mais frequente que o CEC, e ambos são mais frequentes nos homens do que nas mulheres. No Brasil, o câncer de pele não melanoma é o tumor mais incidente em ambos os sexos (INCA, 2014). O câncer de pele melanoma é menos frequente do que os outros tumores de pele. Também é mais frequente em populações de pele clara e expostas à radiação solar. Indivíduos de pele escura possuem menor risco de apresentá-lo. Seu prognóstico é bom para os tumores localizados, enquanto, para melanomas metastáticos, já fica comprometido (INCA, 2014). Os cânceres de pele não melanoma são de bom prognóstico, com altas taxas de cura se tratados de forma precoce e adequada. Contudo, situações nas quais há demora no diagnóstico podem acarretar ulcerações na pele e deformidades físicas graves (INCA, 2014). Ações de prevenção primária, como a proteção individual contra a luz solar, são altamente efetivas e de custo relativamente baixo, para a prevenção do câncer de pele, inclusive dos melanomas. A educação em saúde para a população e a promoção de ambientes que propiciem a proteção contra as radiações solares, principalmente nos ambientes de trabalho e lazer, também são efetivas para a coletividade. É recomendável que o indivíduo sob risco procure um dermatologista ao primeiro sinal de surgimento de novas manchas ou sinais na pele, ou modificações na cor, tamanho e bordas de lesões antigas, permitindo identificar possíveis cânceres precocemente (INCA, 2014). 2.5.1. Ceratose actínica Antes do desenvolvimento da malignidade se manifestar na epiderme, uma série de alterações displásicas ocorre progressivamente, um fenômeno análogo à atipia que precede o carcinoma de células escamosas da cérvice uterina. Como esta displasia é geralmente o resultado de exposições crônicas à luz solar e está associada ao 37 crescimento excessivo de queratina, estas lesões são chamadas ceratoses actínicas. Como seria de esperar, elas ocorrem com incidência particularmente alta em indivíduos de pigmentação clara. Exposições à radiação ionizante, hidrocarbonetos, arsenicais podem induzir lesões similares. A ceratose actínica é considerada como uma lesão pré-cancerosa (AZULAY; AZULAY, 2004; KUMAR; ABBAS; FAUSTO, 2005). As ceratoses actínica são geralemente menores que 1 cm de diâmetro; e as áreas mais comuns para o aparecimento desta lesão, são as regiões da pele comumentes expostas ao sol (face, braço, dorso das mãos) (AZULAY; AZULAY, 2004; KUMAR; ABBAS; FAUSTO, 2005). 2.5.2. Carcinoma basocelular Os carcinomas basocelulares são tumores comuns, constituído por células morfologicamente semelhantes às células basais da epiderme, de crescimento lento, com poder de invasão local, porém restritiva, que raramente metastatizam, é portando a neoplasia maligna de melhor prognóstico. Têm uma tendência a ocorrer em locais de exposição crônica ao sol e em pessoas de pele clara. Como no carcinoma de células escamosas (carcinoma espinocelular) a incidência do carcinoma basocelular eleva-se nitidamente com a imunossupressão e nos pacientes com defeitos herdados no reparo do DNA (KUMAR; ABBAS; FAUSTO, 2005; BODANESE, 2008). O padrão-ouro do tratamento do CBC baseia-se na ressecção cirúrgica completa da lesão. A taxa de cura está diretamente relacionada ao estadio da doença e o tipo de tratamento empregado (BODANESE, 2008). Atualmente, a confirmação dos tumores é realizada através de exames histopatológicos. Esta técnica avalia o grau de diferenciação celular do tecido neoformado e suas características citológicas, morfológicas e estruturais. A histopatologia fornece informações muito valiosas na orientação da abordagem terapêutica do câncer e possui resultaods confiáveis. No entanto esta técnica possui algumas desvantagens e limitações, pois a biópsia convencional envolve remoção do tecido, necessidade de preparação das amostras e depende da interpretação dos patologistas (BODANESE, 2008). 38 A aplicabilidade da espectrocopia Raman consistirá em auxiliar o exame histopatológico, principalmente em situações em que a biópsia não é efetiva, por exemplo, em múltiplas lesões ou em tumores incipientes (ainda sem manifestação clínica). Também poderá ser utilizada na detecção dos limites do tumor em tempo real, evitando excisões amplas demais ou com margens comprometidas (BODANESE, 2008). 2.5.3. Carcinoma espinocelular O carcinoma espinocelular (CEC), ou carcinoma de células escamosas, é uma neoplasia maligna, com capacidade de invasão local e de metastizar, é o segundo tumor mais comum decorrente de exposição solar em pessoas idosas, excedido somente pelo carcinoma basocelular. Esta neoplasia tem maior incidência em homens que em mulheres, exceto pelas lesões nos membros inferiores. A causa exógena mais comum com maior fator que provoca e ocasiona a manifestação do CEC é a exposição à luz solar (radiação UV), com subsequente dano ao DNA. Indivíduos que estão imunossuprimidos como resultado de quimioterapia ou de transplante de órgãos, ou pacientes que tenham xeroderma pigmentoso, estão em elevado risco para o desenvolvimento da neoplasia (AZULAY; AZULAY, 2004; KUMAR; ABBAS; FAUSTO, 2005). 2.6. Espectroscopia Raman A técnica de espectroscopia Raman é uma das técnicas ópticas que despontam na literatura como ferramenta de análise das componentes moleculares de diferentes materiais. Por ser de natureza vibracional, apresenta como característica espectro de emissão com bandas bem estreitas em posições correspondentes às vibrações das ligações das moléculas presentes na amostra. Pode ser considerada como uma “impressão digital” da molécula, fornecendo informação que nenhuma outra técnica óptica é capaz de fornecer (HANLON et al., 2000; SILVEIRA JR. et al., 2002). É chamado de Espectroscopia Raman o método utilizado para análise da estrutura química de compostos inorgânicos ou grupos funcionais de substâncias orgânicas utilizando radiação eletromagnética. E esta foi descoberta em 1928, pelo físico indiano Chandrasekhara Venkata Raman, e em 1930 ganhou o Prêmio Nobel por este feito. Mas foi somente com o advento do laser, em 1960, que a técnica teve 39 impulso e começou a ser largamente utilizada na identificação e caracterização de materiais (SILVEIRA JR. et al., 2001; SILVEIRA, 2008). As técnicas espectroscópicas vêm sendo aplicadas a uma larga escala de amostras sólidas, liquidas e em alguns gases, dentre materiais orgânicos e inorgânicos. Esta técnica espectroscópica fornece informações importantes sobre a estrutura das moléculas e sobre a interação com moléculas vizinhas, podendo de este modo ser utilizada na identificação de moléculas presentes em um composto, e assim fornecer uma análise qualitativa e quantitativa de sua composição (NOGUEIRA et al., 2005). Estas informações das moléculas são obtidas a partir da interpretação das bandas e picos dos espectros de absorção e/ou emissão dos átomos e/ou moléculas da matéria a ser analisada (MICHELE, 1999). O efeito Raman que ocorre na Espectroscopia Raman é fundamentado basicamente na troca de energia entre a luz (radiação eletromagnética) incidente e a matéria incidida. eletromagnética, Quando esta uma radiação molécula pode ser é irradiada absorvida por ou uma radiação espalhada. Este espalhamento pode ser da mesma frequência da radiação incidida, o que chamamos de espalhamento elástico (espalhamento Rayleigh), ou quando a radiação espalhada sofre uma mudança na frequência em relação à frequência incidida, para este denominamos espalhamento inelástico (espalhamento Raman), conforme visto na Figura 5 (SILVERA JR., 2001). Do ponto de vista dos níveis de energia da Física Quântica, o efeito Raman pode ser descrito como uma transição da molécula do seu estado fundamental (E0) para um estado vibracional excitado (E1) (Figura 5), No regresso ao estado fundamental, um quantum vibracional de energia pode permanecer associado à molécula, de onde resulta um decréscimo da frequência da radiação emitida. Se esta molécula já estiver em um nível vibracional excitado do estado eletrônico fundamental, pode ceder um quantum de energia vibracional, baixando a um nível inferior, enquanto aumenta a frequência da radiação emitida (SILVEIRA JR., 2001). Dentro do espalhamento inelástico, podem-se encontrar dois processos distintos: Stokes e Anti-Stokes (Figura 5). No Stokes, o fóton ao incidir sobre a molécula em nível fundamental (E0), faz com que a molécula ganhe energia passando a um estado que chamamos de excitado (E1). Com isso, o fóton espalhado contém energia menor que a incidente (frequência espalhada menor que a frequência incidente). No caso do Anti-Stokes, o fóton incidente interage com a 40 molécula que está em um estado vibracional excitada, e devido a instabilidade do estado excitado, estimula a molécula a voltar ao estado fundamental, liberando energia. Como resultado tem-se um fóton espalhado com energia maior que a incidente (frequência espalhada maior que a frequência incidente) (GUIMARÃES, 2004; SILVEIRA JR., 2001). Figura 5: Esquema representativo para diferenciar os tipos de espalhamento. E0, estado fundamental - E1, estado virtual excitado - νi, frequência inicial do fóton incidente - νf, frequência final do fóton espalhado. A quantidade e a qualidade das informações que podem ser extraídas de um espectro dependem de alguns fatores: características da fonte de radiação utilizada para excitar as amostras, dentre estes fatores destacam-se a potência e o comprimento de onda do laser; a forma de coleta do sinal proveniente da amostra após a interação, como tempo de aquisição; resolução temporal ou espectral do instrumento de dispersão (espectrógrafo) utilizado, e do tipo e sensibilidade do detector do sinal, além das propriedades físicas e coeficiente de espalhamento da amostra em análise (AFSETH; WOLD; SEGTNAN, 2006). 41 Figura 6: Sistema de Espectroscopia Raman Dispersiva. O sistema típico para análise molecular por Espectroscopia Raman Dispersiva é composto por: • Fonte de radiação monocromática, principalmente os laseres; • Cabos de fibra óptica; • Probe, formado por filtros para remoção do espalhamento elástico ou radiação de excitação do sinal retroespalhado; • Espectrógrafo acoplado a um detector CCD, a fim de produzir pontos discretos (pixels) das informações da imagem espectral obtida; • Computador com placa de conversão A/D, para armazenar os dados obtidos; 2.7. Estatística multivariada - Análise multivariada A análise multivariada consiste em um conjunto de métodos que podem ser utilizados quando várias medições são feitas em cada indivíduo ou objeto de uma ou mais amostras. As medidas são referidas como variáveis e os indivíduos ou objetos como unidades (unidades investigadas, unidades de amostragem, ou unidades experimentais) ou observações. Na prática, conjuntos de dados multivariados são comuns, embora eles não sejam sempre analisados como tal. Mas o uso exclusivo dos procedimentos univariados com estes dados não é mais justificável, dada a disponibilidade de técnicas de análise multivariada e o poder da computação de baixo custo para realizá-los (RENCHER, 2002) 42 A demanda crescente no volume de variáveis nos processos implica em novas técnicas para organização e interpretação de dados assim como para a interpretação dos resultados que podem ser agrupados em cada tipo de aplicação. Nesse contexto, a Análise Multivariada dispõe de uma diversidade de técnicas que favorecem o entendimento de muitos fenômenos (ALVES; BELDERRAIN; SCARPEL, 2007). As técnicas existentes podem ser de diversas naturezas e devem ser utilizadas de acordo com o interesse da pesquisa. Dados qualitativos ou quantitativos podem restringir a aplicação de algumas delas. Assim, a escolha da técnica é justificada basicamente pelo que se pretende investigar através de um conjunto de dados (ALVES; BELDERRAIN; SCARPEL, 2007). Contudo, a especificação de uma determinada técnica não implica em desutilizar a combinação de uma segunda técnica para atingir melhores resultados. Uma análise conjunta, quando bem estruturada, pode revelar melhores respostas para a análise (ALVES; BELDERRAIN; SCARPEL, 2007; RENCHER, 2002). As técnicas de Análise de Agrupamentos, são consideradas técnicas de interdependência por analisar simultaneamente todas as variáveis, requer a inclusão de diferentes tipos de dados para sua análise, e é restrita à dados contínuos (ALVES; BELDERRAIN; SCARPEL, 2007). 2.7.1. Análise de agrupamento A análise de agrupamento, em sua aplicação, engloba uma variedade de técnicas e algoritmos, sendo que o objetivo é encontrar e separar objetos em grupos similares. Essa técnica pode ser observada, por exemplo, se tiver vários produtos em uma determinada prateleira de um supermercado, e distribuir esses produtos, na prateleira, segundo suas características, de um mesmo composto, ou o mesmo princípio ativo, por exemplo. Aí está-se a praticar análise de agrupamento. Agora, se esses produtos estiverem espalhados por toda a prateleira, significa que se terá mais de uma característica, e, para que se possa uni-los por características comuns, será muito trabalhoso, exigindo conceitos mais sofisticados de semelhança, e procedimentos mais científicos para juntá-los. É em relação a esse procedimento multidimensional que se trabalha (VICINI, 2005). 43 A análise de agrupamentos estuda todo um conjunto de relações interdependentes. Ela não faz distinção entre variáveis dependentes e independentes (VICINI, 2005). A análise de agrupamento constitui uma metodologia numérica multivariada, com o objetivo de propor uma estrutura classificatória, ou de reconhecimento da existência de grupos, objetivando, mais especificamente, dividir o conjunto de observações em um número de grupos homogêneos, segundo algum critério de homogeneidade. Muitas vezes, nessa técnica, são feitas afirmativas empíricas, que nem sempre têm respaldo teórico. Muitas técnicas são propostas, mas não há, ainda, uma teoria generalizada e amplamente aceita. Devido a isso, devem-se utilizar vários métodos e comparar os resultados, para que a análise dos dados seja realizada pela técnica mais adequada (VICINI, 2005). A análise de agrupamento é um método simples, calçada nos cálculos de distância, no entanto, não requer conhecimento estatístico para a sua aplicação, como é o caso quando se aplica análise de variância, de regressão, ou fatorial (VICINI, 2005). Genericamente, a análise de agrupamento compreende cinco etapas (ALBUQUERQUE, 2005): 1. A seleção de indivíduos ou de uma amostra de indivíduos a serem agrupados; 2. A definição de um conjunto de variáveis a partir das quais serão obtidas informações necessárias ao agrupamento dos indivíduos; 3. A definição de uma medida de semelhança ou distância entre os indivíduos; 4. A escolha de um algoritmo de classificação; 5. Por último, a validação dos resultados encontrados. A medida de distância de uma maneira geral pode ser definida como medida de similaridade (relações entre os pontos da base de dados) e dissimilaridade (relações baseadas nas diferenças entre os pontos). Entre estas distâncias temos a distância Euclidiana e a distância de Mahalanobis (ALBUQUERQUE et al., 2006; CLESIO, 2014). 44 2.7.2. Análise de Componentes Principais A Análise de Componentes Principais (PCA - Principal Components Analisys) é uma técnica da estatística multivariada que consiste em transformar um conjunto de variáveis originais em outro conjunto de variáveis de mesma dimensão denominadas de componentes principais (PC), associada à ideia de redução de massa de dados, com menor perda possível da informação. Foi originalmente descrita por Karl Pearson em 1901 e posteriormente aplicada por Harold Hotelling 1933, em diversas áreas da ciência, porém o uso desta estatística multivariada só foi acentuado quando houve disponibilidade de recursos na área computacional (PAIVA et al., 2010). Quando aplicamos um algoritmo de PCA em um conjunto de variáveis, como por exemplo, espectros no infravermelho, o conjunto original destas variáveis é substituído por um novo conjunto de variáveis denominado de Componentes Principais (PCs). A principal característica deste novo conjunto é a ortogonalidade, porém o mesmo é facilmente reconstruído a partir da combinação linear das variáveis originais (espectros). Como vantagem, o novo conjunto de variáveis (PCs), geralmente concentra a maior parte da informação (variância) em poucas variáveis, diminuindo assim a dimensionalidade dos dados, sem perda significativa da informação do espectro. A maioria dos aplicativos disponíveis utilizam a técnica de decomposição em valores singulares (singular value decomposition -SVD) para obter os PCs, sendo neste caso o primeiro componente principal (PC1) definido na direção (eixo) de maior variância do conjunto de variáveis originais. De forma decrescente em termos de variação são definidos os demais componentes principais, porém estas serão sempre ortogonais a PC1 e entre si. Por exemplo, um sistema que seja reduzido a 3 PCs (PC1, PC2 e PC3) se assemelha ao sistema cartesiano de coordenadas, em que todos os eixos são linearmente independentes, isto é, ortogonais entre si (SABIN; FERRÃO; FURTADO, 2004). Os componentes principais apresentam propriedades importantes: cada componente principal é uma combinação linear de todas as variáveis originais; são independentes entre si e; estimados com o propósito de reter, em ordem de estimação, o máximo de informação, em termos da variação total contida nos dados. Procura-se redistribuir a variação observada nos eixos originais de forma a se obter um conjunto de eixos ortogonais não correlacionados. Esta técnica pode ser utilizada para geração de índices e agrupamento de indivíduos. A análise agrupa os 45 indivíduos de acordo com sua variação, isto é, os indivíduos são agrupados segundo suas variâncias, ou seja, segundo seu comportamento dentro da população, representado pela variação do conjunto de características que define o indivíduo, ou seja, a técnica agrupa os indivíduos de uma população segundo a variação de suas características (PAIVA et al., 2010). A correlação entre as variáveis e as informações obtidas por análises univariadas pode ser incompleta, principalmente quando há correlação entre as variáveis. Nesses casos, é de grande interesse o uso de análise multivariada, pois essa análise combina as informações múltiplas provenientes da unidade experimental. Quando o número de características é elevado, muitas delas podem contribuir pouco para a discriminação dos indivíduos avaliados. Essa situação aumenta o trabalho de caracterização, mas não melhora a precisão, além de tornar mais complexa a análise e interpretação dos dados. Assim, podem-se eliminar aquelas características redundantes e de difícil mensuração, o que reduziria o tempo e os custos de experimentos (PAIVA et al., 2010). 2.7.3. Medidas de distância Para agrupar indivíduos é necessária a definição de uma medida de similaridade ou dissimilaridade. Com base nessa medida os indivíduos similares são agrupados e os demais são colocados em grupos separados (ALBUQUERQUE, 2005). Existem dois tipos de medidas de semelhança: medidas de similaridade (quanto maior o valor, maior a semelhança entre os objetos) e medidas de dissimilaridade (quanto maior o valor, menor a semelhança entre os objetos) (ALBUQUERQUE, 2005). As medidas de dissimilaridade têm papel central nos algoritmos de agrupamentos. Através delas são definidos critérios para avaliar se dois pontos estão próximos, e, portanto, podem fazer parte de um mesmo grupo, ou não (ALBUQUERQUE, 2005). Existem várias medidas que podem ser utilizadas como medidas de distâncias ou dissimilaridade entre elementos de uma matriz de dados, dentre as medidas, temos: distâncias euclidiana, euclidiana quadrada e euclidiana padronizada, distância de Minkowski e a distância Mahalanobis (ALBUQUERQUE, 2005; VICINI, 2005). 46 As distâncias mais utilizadas em análise de agrupamento são (ALBUQUERQUE, 2005; VICINI, 2005): Distância Euclidiana: a distância entre dois casos (i e j) é a raiz quadrada do somatório dos quadrados das diferenças entre valores de i e j para todas as variáveis (ν = 1, 2, ..., n). Onde: xiν - representa a característica do indivíduo i; xjν - representa a característica do individuo j; n - é o número de parcelas na amostra; ν - é o número indivíduo na amostra. Distância Euclidiana quadrada: é a distância entre dois casos (i e j) e definida como o somatório dos quadrados das diferenças entre os valores de i e j para todas as variáveis (v = 1, 2, ..., n). Onde: xiν - representa a característica do indivíduo i; xjν - representa a característica do individuo j; n - número de parcelas na amostra; ν - número indivíduo na amostra. Distância de Mahalanobis: também chamada distância generalizada, ao contrário das apresentadas anteriormente, considera a matriz de covariância para o cálculo das distâncias. A distância de Mahalanobis é utilizada para a quantificação das distâncias entre duas populações, quando existe grau de dependência entre as variáveis, dada 47 pela similaridade entre as unidades amostrais (tratamentos, indivíduos, populações), com relação a um conjunto de características correlacionadas. Onde: xi - é o vetor de médias do i’ésimo grupo; xj - é o vetor de médias do j’ésimo grupo; ∑ é a estimativa combinada da matriz da covariância/variância dentro dos grupos. 2.7.6. Análise de variância (ANOVA) A análise de variância (ANOVA - Analise of Variance) é um teste estatístico amplamente difundido entre os analistas, e visa fundamentalmente verificar se existe uma diferença significativa entre as médias e se os fatores exercem influência em alguma variável dependente (MATEMÁTICA, 2013; VICINI, 2005). A principal aplicação da ANOVA é a comparação de médias oriundas de grupos diferentes, também chamados tratamentos, como por exemplo, médias históricas de questões de satisfação, empresas que operam simultaneamente com diferentes rendimentos, entre muitas outras aplicações. Existem dois métodos para calcular-se a variância: dentro de grupos (MQG) e a variância das médias (MQR). Em uma ANOVA, calcula-se esses dois componentes de variância. Se a variância calculada usando a média (MQR) for maior do que a calculada (MQG) usando os dados pertencentes a cada grupo individual, isso pode indicar que existe uma diferença significativa entre os grupos. 2.7.7. Regressão por Mínimos Quadrados Parciais (PLS) O método de Regressão por Mínimos Quadrados Parciais (PLS - Partial least squares) é considerado o método de discriminação/calibração multivariado mais utilizado para a construção de modelos de discriminação a partir de dados de primeira ordem (MAZUR, 2012). 48 De maneira semelhante ao PCA, o PLS decompõe as matrizes de dados X e Y de forma que cada componente principal do modelo busque a máxima covariância entre X e Y, passando a ser chamada de variável latente (VL) (MAZUR, 2012). Este método apresenta as vantagens de utilizar um maior número de informações obtidas de cada amostra, diminuindo o valor do erro de análise e permitindo determinações simultâneas até mesmo na presença de espécies interferentes, o que faz dele um método mais robusto em relação a outros métodos matemáticos empregados atualmente (MAZUR, 2012). 2.8.7. Tabela de Contingência (matriz de confusão) Quando são desenvolvidos novos sistemas, métodos ou testes que envolvem a detecção, diagnóstico ou previsão de resultados, é importante validar seus resultados de forma a quantificar seu poder discriminativo e identificar um procedimento ou método como bom ou não para determinada análise. No entanto, devemos levar em conta que a simples quantificação de acertos num grupo de teste não necessariamente reflete o quão eficiente um sistema é, pois essa quantificação dependerá fundamentalmente da qualidade e distribuição dos dados neste grupo de teste (MARTINEZ; LOUZADA-NETO; PEREIRA, 2003). Para validar estes testes, outros métodos foram criados a fim de desconsiderar eventuais desbalanceamentos nos grupos de teste. Com isso, criouse a chamada tabela de contingência (ou matriz de confusão). Seu funcionamento é simples: consideramos valores positivos que o sistema julgou positivos como verdadeiros positivos (acerto), valores positivos que o sistema julgou negativos como falso negativo (erro), valores negativos que o sistema julgou como negativos como verdadeiros negativos (acerto), e valores negativos que o sistema julgou positivos como falso positivo (erro) (SOUZA, 2014). 49 Figura 7: Tabela de Contingência (matriz de confusão). Fonte Souza (2014) Sensibilidade (S) = Proporção de indivíduos com a doença que são identificados corretamente pelo teste. Indica o quão bom é um teste em identificar a doença em questão. (proporção de indivíduos verdadeiramente positivos [tanto no padrão ouro quanto no teste em avaliação] entre os doentes). Indica a capacidade de um teste detectar corretamente as pessoas com a doença/condição. Especificidade (E) = Proporção de indivíduos sem a doença que são identificados corretamente pelo teste. Indica o quão bom é um teste em identificar indivíduo sem doença em questão. (proporção de indivíduos verdadeiramente negativos ou normais [tanto no padrão ouro quanto no teste em avaliação] entre os não doentes) Indica a capacidade de um teste excluir corretamente as pessoas sem a doença/condição. Verdadeiro positivo (VP): o teste é positivo e o indivíduo tem a doença. (indivíduos com a doença tanto no teste padrão ouro quanto no teste em avaliação) 50 Falso positivo (FP): o teste é positivo e o indivíduo não tem a doença. (indivíduos não doentes no teste padrão ouro, mas que são considerados doentes no teste em avaliação) Verdadeiro negativo (VN): o teste é negativo e o indivíduo não apresenta a doença. (indivíduos sem a doença tanto no teste padrão ouro quanto no teste em avaliação) Falso negativo (FN): o teste é negativo e o indivíduo tem a doença. (indivíduos doentes no teste padrão ouro, mas que são considerados negativos ou normais no teste em avaliação) (WALDMAN; ROSA, 2014). Um bom teste possui um alto valor para a sensibilidade e para a especificidade, pois ele identificará corretamente aqueles que têm a doença e aqueles que não têm. 51 3. MATERIAIS E MÉTODOS 3.1. Coleta dos espectros O protocolo utilizado neste estudo foi aprovado pelo Comitê de Ética em Pesquisa (Protocolo 2815-3035/09 CAAE 281189), seguindo diretrizes brasileiras para o uso de seres humanos. 3.1.1. Critério de inclusão e exclusão Os pacientes foram selecionados em um pré-exame clínico e agendado para biópsia excisional, para retirada das lesões cutâneas. Os pacientes tinham média de idade de 61 anos, 15 pacientes eram homens e 10 eram mulheres, todos provenientes da região Sul do Brasil. O fototipo da pele típico entre os pacientes voluntários deste trabalho variou entre 1 e 2. Os exames pré-clinicos, a coleta dos espectros Raman dos tecidos suspeitos de carcinoma e a biópsia excisional foram realizados no Hospital Regional do Oeste em Chapecó/SC, supervisionados pelo médico dermatologista resposnsável. 3.1.2. Preparação e aquisição dos espectros Antes da coleta dos espectros, as lesões de pele suspeitas foram higienizadas com soro fisiológico, assim como a pele adjacente à lesão. Os espectros da lesão foram tomados em cinco pontos: um no centro e quatro nas bordas internas das lesões. Os espectros de tecido normal foram coledos em um local diagnosticado clinicamente como tecido normal, próximo a região da lesão. As lesões suspeitas avaliadas eram localizadas principalmente nas costas, ombro, tórax, rosto, nariz e antebraço. A Figura 8 mostra o momento da coleta dos espectros Raman no paciente. Após a coleta dos espectros, os pacientes foram submetidos à biópsia excisional. As amostras retiradas foram fixadas em formol, e enviadas para exame histopatológico no Instituto de Patologia Oeste em Chapecó/SC, para o diagnóstico da lesão. Regiões normais não foram retiradas para exame histopatológico. O exame histopatológico revelou as seguintes lesões: carcinoma basocelular - CBC; 52 carcinoma espinocelular - CEC, queratose actínica - KER e lesões benignas (nevus e dermatite). Para este trabalho foi considerado um total de 250 espectros de tecido normal, 14 espectros de tecido benigno (BEN), 133 espectros de carcinoma basocelular (CBC), 30 espectros de carcinoma espinocelular (CEC) e 57 espectros de queratose actínica (KER), conforme apresentado na Tabela 1. Dezesseis espectros de lesões apresentaram uma relação sinal-ruído baixa (provavelmente devido a artefato de movimentação da Probe durante a coleta dos espectros) e foram retiradas do estudo. Os espectros foram separados em três grupos: os tecidos de pele normal e lesões benignas (não tumor - NT), tumores não melanoma (CBC e CEC) e displasias (KER). Nas lesões cutâneas mais extensas foram coletados espectros em dois sítios da lesão, com 5 espectros cada sítio (um espectro no centro do sítio e quatro nas bordas internas), consequentemente na região adjacente com tecido normal também foram coletados em dois sítios, com 5 espectros cada sítio, aumentando assim o número de espectros. Figura 8: Momento da coleta dos espectros Raman no paciente. 53 Tabela 1: Descrição das amostras, incluindo número de pacientes, lesões e espectros utilizados na análise de discriminação. BEN CBC CEC KER Total Número de pacientes 1 14 4 6 25 Número de lesões# 3 28 7 11 49 Número de espectros 14 133 30 57 234 Número total de espectros de tecidos normais§ 250 # Nota: Uma lesão grande foi escaneada em dois sítios, resultando em 10 espectros para esta § lesão. O número de sítios escaneados nos tecidos normais foi o mesmo que o número utilizado nas lesões. 3.2. Equipamento Raman e processamento dos espectros Para a coleta de espectros Raman foi utilizado um sistema Raman portátil no infravermelho próximo (sistema P-1 Raman, Lambda Solutions, Inc. MA, EUA), com excitação em 830 nm, potência do laser ajustável de até 350 mW, e com uma resolução espectral de 2 cm-1 na faixa de 200 - 1800 cm-1. O espectrômetro (espectrógrafo com grade de dispersão de 1200 linhas/mm) foi conectado a uma Probe (sonda a fibra óptica) (Vector probe, Lambda Solutions, Inc. MA, USA), com 3 metros de comprimento e um conjunto de filtros passa banda e rejeita banda. Na extremidade distal da Probe, foi conectada uma ponteira para manter uma distância focal de 10 mm entre a ponta da Probe e o tecido. A detecção do sinal luminoso espalhado pela amostra foi efetuada por uma câmera CCD “back thinned, deep depletion” de 1340X100 pixels refrigerada por elemento termoelétrico (Peltier), atingindo uma temperatura de trabalho de -75°C. Os espectros Raman foram coletados com tempos de 20 s (10 aquisições de 2 s) para todos os sítios de lesões. Para a coleta dos espectros in vivo, a potência do laser foi ajustada para 200 mW, o spot do laser com a ponteira era de 170 µm. Este nível de potência não mostrou sinais de queimadura na pele, tampouco queixas de dor pelos pacientes, quando se consideram os fototipos de pele avaliados no estudo (1 a 3). 54 A calibração do espectrômetro Raman (correção da resposta do comprimento de onda pelo deslocamento Raman) foi verificada durante a pré-coleta de dados. O deslocamaneto Raman foi verificado utilizando as bandas mais intensas do naftaleno e a correção da resposta de calibração foi obtida usando uma lâmpada de filamento de tungstênio (Oriel Instruments, CT, EUA, modelo 63358) com espectro rastreado pelo NIST (National Institite of Standards and Technology). A fluorescência de background foi removida após a coleta dos dados, de modo offline, através de uma subtração de uma função polinomial de 5a ordem, na faixa de 400 - 1800 cm-1, através de uma rotina desenvolvida no Matlab® (The Mathworks Inc., MA, EUA, versão 5.2). Após a calibração e a remoção do background, os espectros foram submetidos a uma filtragem "média móvel", utilizando cinco pontos adjacentes, e normalizados pela variação normal padrão (SNV - Standard Normal Variate) (BARNES; DHANOA; LISTER, 1989). 3.2. Modelos espectrais para análise discriminante Para os modelos discriminantes foram considerados um total de 250 espectros de tecido normal, 14 espectros de tecido benigno (BEN), 133 espectros de carcinoma basocelular (CBC), 30 espectros de carcinoma espinocelular (CEC) e 57 espectros de queratose actínica (KER), conforme apresentado na Tabela 1. As ferramentas estatisticas utilizdas no projeto necessitam de um grupo treino, por isso os espectros de cada lesão foram separados de acordo com os resultados da avaliação histopatológica. Utilizando os espectros Raman dos tecidos da pele in vivo, e os resultados histopatológicos, desenvolvemos modelos de discriminação: com base na Análise de Componentes Principais (PCA/DA - Principal Components Analysis / Discriminant Analysis) e como funções de discriminação a distancias Euclidiana, Quadrática e Mahalanobis; e com base nos Mínimos Quadrados Parciais (PLS/DA - Partial Least Squares / Discriminant Analysis), a fim de classificar os sítios de tecido da pele, de acordo com a presença ou ausência de lesões. Para identificar quais componentes principais resultariam na melhor classificação, foi empregada a análise de variância ANOVA, com nível de significância menor que 5% (ANOVA - teste Tukey-Kramer, p < 0,05), assim 55 encontramos quais os scores PCs com os menores níveis de significância para discriminar os grupos histopatológicos (BODANESE et al., 2012; BODANESE et al., 2010). Em seguida, utilizaram-se as funções discriminantes com base nas distâncias Euclidiana, Quadrática e a de Mahalanobis, para discriminar uma amostra de um grupo. O outro modelo discriminante, PLS/DA, utilizou o mesmo número de variáveis latentes (VLs) dos números de scores PCs. Para ambos os modelos PCA/DA e PLS/DA, um método de validação cruzada foi utilizado e foi baseado em uma abordagem espectral por leave-one-out, onde o modelo é desenvolvido com um espectro de n-1, e o espectro left-out foi testado para verificar a qual classe o espectro pertencia. Isso foi repetido n vezes (para cada espectro left-out). A precisão total foi calculada para cada grupo histopatológico. Os diferentes modelos foram utilizados para discriminar as lesões dos tecidos normais adjacentes nos grupos histopatológicos, da seguinte forma: • Agrupamento 1: discriminação das lesões separadamente - NT X CBC X CEC X KER; • Agrupamento 2: discriminação das neoplasias agrupadas - NT X (CBC + CEC) X KER; • Agrupamento 3: discriminação da neoplasia e displasia pré-maligna correspondente agrupadas - NT X CBC X (CEC + KER); • Agrupamento 4: discriminação das neoplasias e displasias agrupadas - NT X (CBC + CEC + KER). Para a rotina de validação cruzada, usamos cada espectro individualmente, porém o diagnóstico foi dado em relação à lesão; onde adotamos o seguinte critério para o diagnóstico Raman: dos cinco espectros medidos, se três ou mais foram classificados corretamente pelo respectivo modelo espectral comparada ao exame histopatológico, a lesão foi discriminada corretamente para este mesmo grupo. Caso contrário, a lesão foi discriminada para o maior número de espectros classificados. Os modelos de discriminação desenvolvidos neste trabalho (PCA/DA e PLS/DA) serão avaliados e validados através da precisão geral. Para a discriminação de tecido normal de tecido maligno (CBC, CEC e KER), no caso o agrupamento 4, será feita a avaliação para a validação através da tabela de 56 contigência, utilizando os valores de sensibilidade e especificidade. O modelo discriminante ideal deve fornecer a resposta correta, ou seja, um resultado positivo nos indivíduos com a doença e um resultado negativo nos indivíduos sem a doença. 57 4. RESULTADOS O resultado histopatológico mostrou a presença de algumas lesões benignas (nevo e dematite), por conta da sua não malignidade mostrada no exame histopatologico, e do objetivo deste estudo que é de discriminar tecido normal de tecido malígno, os espectros das lesões benignas foram agrupados com os espectros de tecido normal. A histopatologia das lesões mostrou que todas as lesões eram in situ. A Tabela 1 apresenta o número de pacientes, lesões e de espectro utilizados em cada grupo histopatológico. A Figura 9 mostra as médias e o desvio padrão dos espectros Raman de NT, CBC, CEC, e KER na região de 400 - 1800 cm-1. Os espectros de pele apresentam picos característicos de proteínas (colágeno, elastina, actina), lipídios (fosfolipídios, ácidos graxos) e os ácidos nucleicos (HANLON et al., 2000; MOVASAGHI; REHMAN; REHMAN, 2007; SILVEIRA JR et al., 2012). O espectro dos diferentes tipos de tecidos, normais, benignos e patológicos, mostraram perfis espectrais muito semelhantes entre si, mas algumas regiões do espectro têm características diferentes, tais como picos na região de 800 – 1000 cm-1, e entre 1200 e 1300 cm-1, devido a constituições bioquímicas diferentes, decorrentes do processo neoplásico. 58 0.016 Intensidade (un. arb.) Média KER Média KER Média CEC Média CEC Média CBC Média CBC Média NT Média NT 0.012 0.008 0.004 0.000 -0.004 400 600 800 1000 1200 1400 1600 1800 -1 Deslocamento Raman (cm ) 0,016 Intensidade (un. arb.) Média KER Média KER Média CEC Média CEC Média CBC Média CBC Média NT Média NT 0,012 0,008 0,004 0,000 -0,004 400 600 800 1000 1200 1400 1600 1800 -1 Deslocamento Raman (cm ) Figura 9: Média normalizada e o desvio padrão (em cinza) dos espectros Raman de tecidos de normal e benigno (NT), carcinoma basocelular (CBC), carcinoma espinocelular (CEC) e queratose actínica (KER). Para verificar a diferença espectral entre os espectros dos tecidos analisados, foi feita a subtração do espectro médio da displasia e das neoplasias do espectro médio do tecido normal e benigno, o respectivo resultado é mostrado na Figura 10. 59 0.012 Intensidade (um. arb.) KER - NT CEC - NT CBC- NT média NT 0.008 0.004 0.000 -0.004 400 600 800 1000 1200 1400 1600 1800 -1 Deslocamento Raman (cm ) KER - NT CEC - NT CBC- NT média NT Intensidade (um. arb.) 0,012 0,008 0,004 0,000 -0,004 400 600 800 1000 1200 1400 1600 1800 Deslocamento Raman (cm-1) Figura 10: Espectro da subtração dos espectros das lesões do tecido normal. Através da Figura 10, onde é mostrado a subtração da média dos espectro da displasia e das neoplasias da média do espectro de tecido normal e benigno, podemos notar a diferença espectral entre o tecido BCC e CEC, na região entre 800 e 1000 cm-1, região está principalmente de bandas de proteína , e na região de 1450 60 cm-1 e em 1660 cm-1, região rica em lipídio (SILVEIRA JR et al., 2012). Podemos verificar também uma diferença do tecido de KER em relação a CBC e CEC na banda de 1660 cm-1. A fim de propor um método para discriminar tecidos de pele, usando espectros Raman in vivo, foram desenvolvidos modelos discriminantes com base em PCA e PLS, utilizando seis scores PC (PCA) e seis variáveis latentes VL (PLS), conforme definido pela análise ANOVA, com maior capacidade para discriminação (PCs com baixo nível de significância entre os grupos). Estes vetores espectrais de PCA e PLS podem ser correlacionados com os bioquímicos presentes nos tecidos, e então, estes vetores espectrais podem ser utilizados para verificar e correlacionar as alterações que ocorrem no tecido, após as alterações na bioquímica destes tecidos, causados pela carcinogênese da neoplasia (BODANESE et al., 2012). Para obtenção da discriminação dos grupos histopatológicos, os modelos discriminantes, PCA/DA e PLS/DA, foram desenvolvidos de modo “offline”, utilizando todos os dados espectrais dos tecidos analisados: NT, CBC, CEC e KER. Para a discriminação entre os tecidos, as lesões benignas foram agrupadas como não tumor, devido à sua característica histológica (nevo melanocítico intradérmico e dermatite). CEC e CBC foram avaliadas em dois grupos separados, e também compondo um único grupo, grupo compreendendo tumores não melanoma. Queratose actínica foi colocada em um grupo separado, porque é uma displasia prémaligna, mas também, foi analisada em conjunto com CEC, por ser considerada como uma displasia precursora de CEC (ALLEN, 2010; SPENCER et al., 1995). A Figura 11 mostra os primeiros seis vetores espectrais, PC para PCA e VL para PLS, extraídos do conjunto de dados dos espectros. Para o modelo de PCA, os primeiros seis PCs apresentaram mais de 98% da variância para o conjunto de dados. 61 -0,12 -0,15 PC1 -0,08 -0,10 -0,04 -0,05 0,00 0,00 0,04 0,05 0,08 400 600 800 1000 1200 1400 1600 1800 -0,04 Colágeno I 0,10 400 600 800 1000 1200 1400 800 1000 1200 1600 1800 0,60 PC2 -0,02 VL2 0,32 -0,01 0,04 0,01 -0,24 0,02 -0,52 0,04 -0,80 400 0,02 Intensidade (un. arb.) VL1 600 800 1000 1200 1400 1600 1800 400 4,50 PC3 0,01 3,00 0,01 1,50 0,00 0,00 -0,01 -1,50 -0,01 400 600 1400 1600 1800 400 600 800 1000 1200 1400 1600 1800 800 1000 1200 1400 1600 1800 800 1000 1200 1400 1600 1800 VL3 Colágeno III -3,00 600 800 1000 1200 1400 1600 1800 0,01 400 600 800 1000 1200 1400 1600 1800 800 1000 1200 1400 1600 1800 10,00 PC4 0,00 6,00 0,00 2,00 0,00 -2,00 -0,01 VL4 -6,00 -0,01 400 600 800 1000 1200 1400 1600 1800 0,00 -10,00 400 600 400 600 17,40 PC5 VL5 0,00 11,60 0,00 5,80 0,00 0,00 0,00 -5,80 -0,01 400 600 800 1000 1200 1400 1600 1800 Trioleína -11,60 400 600 800 1000 1200 1400 1600 1800 800 1000 1200 61,0 0,00 VL6 PC6 0,00 45,5 0,00 30,0 0,00 14,5 -1,0 0,00 0,00 400 600 800 1000 1200 1400 1600 1800 -16,5 400 600 1400 1600 1800 400 600 Deslocamento Raman (cm-1) Figura 11: Gráfico dos seis primeiros vetores variantes de PCA e PLS (PCs e VLs, respectivamente) para o conjunto de dados dos espectros Raman. O número de variáveis de PCA e PLS para serem incluídas no modelo discriminante foram definidas pela utilização da análise ANOVA, a fim de verificar quais teriam melhor diferenciação entre os tecidos de pele (Figura 12). O teste ANOVA (teste Tukey-Kramer, p < 0,05) mostrou que os PCs de 1 a 6 (PC1 a PC6) apresentaram significância para a discriminação intergrupos (ANOVA, p <0,05). PC1 e PC2 apresentaram diferenças estatísticas significantes entre NT e CBC (p <0,001), NT e CEC (p < 0,05 para o PC1 e p < 0,001 para PC2) e NT e KER (p<0,001), onde 62 este PC pode ser utilizado para discriminar tecidos normais de neoplásicos e displasias. O vetor espectral PC1 apresenta caracteristicas espectrais gerais da pele. O vetor PC2 (Figura 11) apresentou características espectrais, principalmente, de lipídios (região em 1250 – 1300 cm-1 e em torno de 1450 cm-1) e proteínas (em 1000 cm-1 e 1450 cm-1), indicando que estes compostos estavam presentes em tumores não melanoma e queratose actínica, em quantidades diferentes que nos tecidos benigno e normal. O PC3 mostrou diferença significante entre NT e CBC (p < 0,001), e entre NT and KER (p < 0,05 ). Este vetor, PC3, tem informação espectral relacionada com proteínas, com uma banda em 878 – 940 cm-1, atribuída a prolina e hidroxiprolina de uma matriz de colágeno, e picos em 1248 e 1271 cm-1 atribuído a amida III, das proteínas (SILVEIRA JR. et al., 2012; SPENCER et al., 1995) O PC4 apresentou a maior significância entre os tecidos, NT e CBC (p < 0,001), NT e CEC (p < 0,001), NT e KER (p <0,001), CBC e CEC (p <0,001) e CBC e KER (p < 0,001), monstrando que este score (PC4) poderia ser utilizado para discriminação intergrupos. O vetor PC4 possui características espectrais particulares na região 1200-1400 cm-1 semelhante aos vetores encontrados em outros estudos com capacidades de discriminação destes mesmos tecidos (BODANESE et al., 2012; BODANESE et al., 2010). 63 Intensidade (un. arb.) * * -0.04 * -0.04 -0.05 -0.05 -0.12 Intensidade (un. arb.) 0.20 PC1 média média NT CBC * * -0.07 -0.02 0.03 média NT média CBC * -0.04 média NT 0.07 * * 0.02 -0.03 -0.08 média média média média NT CBC CEC KER média média média CBC CEC KER PC5 * 0.10 * 0.04 -0.02 0.16 PC3 * 0.04 média média média NT CBC CEC média média CEC KER Intensidade (un. arb.) Intensidade (un. arb.) 0.12 * -0.08 0.08 * * 0.16 * PC2 PC4 0.12 -0.12 média média CEC KER Intensidade (un. arb.) Intensidade (un. arb.) -0.04 0.09 PC6 média KER * * * * 0.02 -0.05 -0.12 média média média NT CBC CEC média KER Figura 12: Gráfico das médias das intensidades e desvio-padrão dos seis primeiros scores PCs utilizados nos modelos discriminnates. * Indica os pares de PC com diferenças estatisticamente significantes (p <0,05, ANOVA). Para o modelo discriminante PCA/DA foi utilizando a função classify.m ®(The MathWorks, Inc., MA, EUA), e para o modelo PLS/DA foi utilizado a função pls.m® (Cleiton A. Nunes, UFLA, MG, Brasil), ambas utilizadas no software Matlab (The MathWorks, Inc., MA, EUA), com os seis primeiros scores (PCA/DA) e as seis primeiras variáveis latentes (PLS/DA) em ambos os modelos. Para o modelo PCA/DA, utilizamos três funções para discriminação dos grupos: distâncias Euclidiana, Quadráticas e de Mahalanobis, utilizando as amostras agrupadas da seguinte forma: 64 • Agrupamento 1: discriminação das lesões separadamente - NT X CBC X CEC X KER; • Agrupamento 2: discriminação das neoplasias agrupadas - NT X (CBC + CEC) X KER; • Agrupamento 3: discriminação da neoplasia e displasia pré-maligna correspondente agrupadas - NT X CBC X (CEC + KER); • Agrupamento 4: discriminação das neoplasias e displasias agrupadas - NT X (CBC + CEC + KER). O número correto de classificações para cada combinação de grupo histopatológico, para cada modelo, e a sensibilidade e especificidade correspondentes, são apresentados na Tabela 2. Para os modelos de discriminação utilizados, o melhor índice de classificação foi encontrado quando todas as lesões estavam agrupadas em um único grupo (agrupamento 4), dando uma precisão total de 91,9% para o modelo PLS/DA; neste arranjo de grupos foi possível uma sensibilidade e especificidade de 90,9% e 93,2%, respectivamente. Ainda para este mesmo agrupamento, o segundo melhor índice de classificação foi o modelo PCA/DA utilizando a distância quadrática, com 82,8% de precisão geral, e com uma sensibilidade e especificidade de 83,3% e 82,2%, respectivamente. Em seguida, com uma precisão geral de 81,8%, o modelo PCA/DA utilizando a distância euclidiana, com uma sensibilidade e especificidade de 78,7% e 86,8%, respectivamente. 65 Tabela 2: Resultados da discriminação: classificação correta por grupo; e precisão global dos diferentes arranjos dos grupos histopatológicos. Agrupamento 1 PCA/DA- Euclidiana Tipos de tecidos NT NT∆ (n = 53) CBC (n = 28) PCA/DA-Quadrática † CBC CEC KER Indef . NT 46 3 0 0 4 6 12 4 2 4 CEC (n = 7) 0 1 3 2 KER (n = 11) 2 0 1 7 Precisão geral CBC CEC KER 45 4 0 6 12 4 1 0 1 1 2 0 68.7% Agrupamento 2 † NT 0 4 2 4 3 2 1 7 PLS/DA † CBC CEC KER Indef . NT 43 7 0 2 1 3 21 0 1 3 1 0 1 1 2 1 1 0 0 10 67.7% PCA/DA-Euclidiana Tipos de tecidos PCA/DA-Mahalanobis Indef. CBC CEC KER Indef 532 0 0 0 0 10 17 0 0 1 3 1 4 0 1 1 0 3 1 0 7 0 75.8% PCA/DA-Quadrática † 78.6% PCA/DA-Mahalanobis PLS/DA NT CBC + CEC KER Indef. NT CBC + CEC KER Indef. NT CBC + CEC KER Indef. NT CBC + CEC KER Indef. NT (n = 53) 47 3 0 3 42 4 0 7 40 7 3 3 51 2 0 0 CBC + CEC (n = 35) 5 20 6 4 3 21 4 7 4 25 4 2 9 24 0 2 KER (n = 11) 2 2 7 0 1 0 10 0 1 1 9 0 2 3 6 0 ∆ Precisão geral Agrupamento 3 Tipos de tecidos 74.7% 73.7% 74.7% 82.7% PCA/DA-Euclidiana PCA/DA-Quadrática PCA/DA-Mahalanobis PLS/DA NT CBC CEC + KER Indef. NT CBC CEC + KER Indef. NT CBC CEC + KER Indef. NT CBC CEC + KER Indef. NT (n = 53) 46 4 0 3 46 4 0 3 44 6 1 2 53 0 0 0 CBC (n = 28) 6 15 1 6 4 15 1 8 4 17 3 4 9 16 0 3 CEC + KER (n = 18) 2 2 12 2 2 2 12 2 1 3 14 0 3 3 10 2 ∆ Precisão geral 73.7% Agrupamento 4 73.7% PCA/DA Euclidiana Tipos de tecidos ∆ NT (n = 53) CBC + CEC + KER (n = 46) Precisão geral PCA/DA Quadrática 80.6% PCA/DA Mahalanobis PLS/DA NT CBC + CEC + KER NT CBC + CEC + KER NT CBC + CEC + KER NT CBC + CEC + KER 48 5 45 8 36 17 50 3 13 33 9 37 5 41 5 41 81.8% ∆ 75.8% 82.8% 77.8% † 91.9% Nota: Número de sitios normais (n = 50) somado ao número de lesões benignas (n = 3). Indef: significa grupo indefinido, onde o algoritmo de discriminação não foi capaz de discriminar um grupo. 66 5. DISCUSSÃO Os pacientes que participaram deste projeto eram provenientes da região Sul do Brasil, onde vive um maior número de imigrantes e descendentes da Europa (principalmente Alemanha), e nestes, é encontrado uma alta incidência de câncer de pele, cerca de 6.100 casos de cânceres de pele não melanoma estimados em 2012 (INCA, 2012). Neste trabalho, os espectros Raman de pele in vivo foram obtidos no local da lesão e os espectros de tecidos normais nas regiões circunjacentes à lesão, com a utilização de uma Probe. Os modelos para discriminação das displasias e neoplasias foram realizados com base na análise multivariada PCA e PLS, e realizadas de modo “offline”. Com o comprimento de onda e potência do laser utilizados neste trabalho (infravermelho próximo e baixa potência), não foi relatado queixas de queimadura e dores entre os pacientes. Todas as lesões foram retiradas após as irradiações a laser, e não foi obervado nenhum possível efeito colateral causado pela bioestimulação do laser. Para testar os modelos de discriminação entre os tecidos, fizemos os agrupamentos das lesões de pele conforme suas caracterisitcas histológicas. As lesões benignas, devido à suas características histológicas (nevo melanocítico intradérmico e dermatite) apresentadas no exame histopatológico, foram agrupadas com o tecido normal, formando o grupo não tumor - NT. A displasia queratose actínica foi analisada separadamente, por se tratar de uma anomalia provocada durante o desenvolvimento e/ou proliferação da pele, mas a queratose actinica também foi analisada em conjunto com o carcinoma espinocelular, em um agrupamento CEC + KER, porque segundo a literatura, esta é considerada uma lesão pré-maligna precursora de CEC (ALLEN, 2010; SPENCER et al., 1995). Por conta de sua malignidade, as neoplasias CEC e CBC foram agrupadas em um único grupo, compreendo os carcinomas não melanoma. Porém as neoplasias CEC e CBC também foram analisadas em grupos separados, a fim de verificar se o modelo discriminante teria a capacidade de diferenciar as neoplasias. Os modelos discriminantes também foram testados para tentar discriminar os tecidos em um agrupamento contendo apenas dois grupos, o grupo dos não tumores e o grupo com tumor não melanoma. 67 Em trabalhos anteriores realizados por nosso grupo de pesquisa (BODANESE et al., 2012; BODANESE et al., 2010; SILVEIRA JR. et al., 2012), modelos discriminantes entre CBC e tecidos normais foram realizados in vitro, utilizando fragmentos de biópsia. As características espectrais de CBC e de tecidos normais foram suficientemente diferentes a fim de permitir a discriminação das lesões de CBC utilizando PCA e modelo espectral, com base nas diferenças bioquímicas do tecido, e com uma precisão maior que 90% em ambos os trabalhos. No presente trabalho, as diferenças nas características espectrais do tecido de não tumor em comparação com tumores não melanoma, não foram tão intensas. No entanto, foi possível a discriminação de lesões da pele usando os seis primeiros scores dos componentes principais (modelo PCA/DA) e as seis primeiras variáveis latentes (modelo PLS/DA). A melhor discriminação foi possível de ser obtida no modelo PLS/DA no agrupamento 4 da Tabela 2, onde a displasia e as neoplasias foram agrupadas (tumores não melanoma), comparado com tecido não tumoral (NT). O modelo de discriminação utilizando PLS pode classificar corretamente aproximadamente 91,9% das amostras. O modelo PLS/DA mostrou melhor desempenho quando comparado ao modelo PCA/DA em todos os agrupamentos de lesões, versus tecido não tumores, com uma precisão para a discriminação que varia de 78,6 % a 82,7%. Métodos multivariados, tais como PCA e PLS, aplicados aos espectros Raman, têm sido usados para a discriminação de tecidos patológicos e não patológicos, com elevada sensibilidade e especificidade, tanto in vitro como in vivo (BODANESE et al., 2012; BODANESE et al., 2010; CHRIT et al., 2005; DURAIPANDIAN et al., 2013; GNIADECKA et al., 2004; HU et al., 2013; HUANG et al., 2010; LIEBER et al., 2008b; LUI et al., 2012; LUO et al., 2013; MALINI et al., 2006; MOTZ et al., 2006; NOGUEIRA et al., 2005; PHILIPSEN et al., 2013; SIGURDSSON et al., 2004). Uma vantagem destes modelos estatísticos multivariados é que nenhum conhecimento sobre a constituição da amostra é necessário para desenvolver um modelo discriminante da mesma. PCA é uma técnica reconhecida por revelar diferenças nas características espectrais de diferentes grupos histopatológicos com base na variância espectral total entre os grupos (BARKER; RAYENS, 2003). Malini et al. (2006), por exemplo, mostraram que uma sensibilidade e especificidade de 100% pode ser alcançada em um modelo discriminante, utilizando PCA e a distância de Mahalanobis para um diagnóstico 68 bucal (inflamação, pré-malignas e malignas do tecido normal). Duraipandian et al. (2013) compararam o desempenho de um modelo de PCA-LDA para o diagnóstico de pré-câncer cervical in vivo por colposcopia, obtendo uma exatidão de cerca de 84%. Hu et al. (2013) diagnosticaram tecidos normais, benignos e malignos de mama baseados em PCA e support vector machine-recursive feature elimination (SVM-RFE), com uma sensibilidade e especificidade de mais de 91%. Luo et al. (2013) utilizaram PCA-LDA e a técnica naive Bayesian classifier (NBC) para detecção de lesões pré-malignas e malignas em tecidos gástricos, com sensibilidade e especificidade maior que 93%. PCA tem mostrado ser um bom algoritmo para discriminar lesões de pele. Gniadecka et al. (2004) alcançaram uma sensibilidade e uma especificidade de 85% e 99%, respectivamente, para o diagnóstico de melanoma. Sigurdsson et al. (2004) obtiveram uma classificação de mais de 80% para a detecção de CBC, melanoma maligno, nevus pigmentado, queratose seborreica e pele normal in vitro. Choi et al. (2005) mostraram haver diferenças espectrais em biópsias de pele normal e CBC, através de espectroscopia Raman confocal, e conseguiram um nível de confiança de 95%. Bonadese et al. (2010) realizaram a diferenciação de fragmentos de tecido normais e de CBC, com uma sensibilidade e uma especificidade de 96% e 92%. Bonadese et al. (2012) discriminaram espectralmente, CBC e MEL de tecido normal a partir de fragmentos de pele in vitro, com sensibilidade, especificidade e uma precisão de 99,1% , 93,3 % e 92,4%, respectivamente. Modelo em PLS foi aplicado por Lui et al. (2012) para discriminar câncer de pele e queratoses actínicas de lesões benignas da pele. Em nossos resultados, as diferenças espectrais entre os tecidos não tumorais, pré- malignos e lesões cutâneas malignas, não foram tão evidentes. Todas as lesões apresentavam diagnóstico histopatológico de lesões in situ, sendo localizado na epiderme (camada basal e espinhosa). A pele humana tem sua espessura variando dependendo do local do corpo, a epiderme, um tecido epitelial estratificado queratinizado, tem uma espessura variando de 0,04 mm nas pálpebras a 1,6 mm na palma da mão e dos pés; a derme (tecido conjuntivo - estroma fibroelástico) tem uma espessura que varia de 0,3 mm nas pálpebras e 3,0 a 4,0 mm na região das costas (SAMPAIO; RIVITTI, 2001). A absorção e o coeficiente de espalhamento da radiação no infravermelho próximo (750nm) na pele são estimados em 0,01 mm-1 e 1,5 mm-1, respectivamente, a profundidade de penetração do laser 69 no infravermelho na pele é estimado de 4 a 5 mm (JACQUES; POGUE, 2008). Como as lesões de pele foram classificadas histologicamente como in situ, com isso poderia haver uma contribuição espectral proveniente das camadas mais profundas da derme normal, devido à utilização de um espectrômetro Raman, com uma excitação de infravermelho próximo. Em geral, as lesões localizadas na pele, se desenvolvem in situ, com exceção do melanoma altamente invasivo. Melhores resultados podem ser obtidos com o a utilização de um sistema Raman confocal (CHOI et al., 2005) ou uma Probe confocal (CHRIT et al., 2005; DURAIPANDIAN et al., 2013; LIEBER et al., 2008a), em que se pode controlar a profundidade de foco e limitar a camada medida pelo sistema óptico. Greve, Andersen e Nielsen (2008) verificaram que os sinais em espectro de pele por FT-Raman são predominantemente proveniente das camadas mais profundas da pele, e algumas das diferenças espectrais poderiam ser reflexo da diferença de espessura da pele. Chrit et al. (2005) descobriram que características Raman relacionadas com proteínas e lipídios variavam, dependendo da localização anatômica e do tipo de pele do paciente, e estas variações seriam resultados de alterações nos componentes do estrato córneo, como um fator de hidratação natural, lipídios e água. Assim, melhores resultados seriam atingidos com utilização de uma Probe confocal. No entanto, em nosso modelo de discriminação espectral, não foi utilizando uma Probe confocal, porém, conseguimos mostrar resultados de discriminação de tecido neoplásico de tecidno normal comparável ao trabalho de Lui et al. (2012). Mesmo não expressivas as diferenças espectrais entre CBC, CEC e KER, quando comparado ao NT, foi possível verificar diferenças nas bandas Raman referentes a presença de proteína e lipídio de acordo com a literatura (BODANESE et al., 2010; CHOI et al., 2005; GNIADECKA et al., 2004; LARRAONA-PUY et al., 2009; LIEBER et al., 2008b; NIJSSEN et al., 2002; SPENCER et al., 1995). As variáveis espectrais que mostram as variações estimadas pelos modelos PCA e PLS (PCs e VLs, respectivamente), revelaram características espectrais de alguns componentes bioquímicos principais do tecido de pele, como colágeno, elastina, actina, e ácido oléico (trioleina), como demonstrado em trabalho anterior por Bodanese et al. (2012). A característica espectral apresentada no PC4, particularmente o perfil “N” na região de 1200 - 1350 cm-1 e de prolina/hidroxiprolina nas bandas de 850 - 950 cm-1, foram observados em nossos trabalhos anteriores de 70 pele in vitro semelhante à PC2 (invertida) nos trabalhos de Bodanese et al. (2010) e semelhante ao PC3 em outro trabalho de Bodanese et al. (2012). No presente estudo, estas características espectrais foram responsáveis pela discriminação dos tecidos normais e malignos, e têm sido atribuídas a diferenças de proteínas e lipídios nos tecidos normais e BCC. Visando a avaliação de tecidos de pele para o diagnóstico do câncer, por meio da espectroscopia Raman in vivo, Huang et al. (2001) desenvolveram um sistema de espectroscopia Raman no infravermelho próximo para as medições da pele humana em tempo real, de forma não invasiva, com uma boa relação sinal ruído, com um tempo de coleta do espectro em menos de 1 s. Lui et al. (2012) avaliaram um grande número de pacientes (518), submetidos a diagnóstico do câncer de pele (avaliação clínica ou biópsias), utilizando o instrumento apresentado por Huang et al. (2001). Neste estudo, o algoritmo de diagnóstico “offline”, para a discriminação de câncer de pele e queratoses actínicas de lesões benignas foi baseado em PCA, com uma análise discriminante generalizada (PCA-GDA), e também foi aplicada aos espectros uma análise de discriminação com base em partial least-squares (PLS). O algoritmo PLS indicou uma curva ROC (receiver operating characteristic) de 0,896 (com uma sensibilidade de 90% e uma especificidade de 66%). Segundo esses autores, os resultados da espectroscopia Raman deveriam, portanto, ser vistos como um meio para auxiliar na avaliação de suspeitas de lesões de pele, em vez de ser um método final e definitivo para o diagnóstico da lesão (LUI et al., 2012). No presente estudo, a melhor discriminação foi alcançada para o agrupamento 4, discriminação do tecido normal e benigno (NT) das neoplasias e displasias agrupadas (CBC + CEC + KER), sendo capaz a diferenciação entre tecidos neoplásicos de tecido normal, utilizando o modelo PLS/DA. Nossos resultaodos se mostraram análogos com os resultados apresentados pela literatura para resultados de análise in vivo (CHOI et al., 2005; LIEBER et al., 2008b; LUI et al., 2012), e mesmo não utilizando um sistema de espectroscopia confocal, os resultados se mostraram animadores. Portanto, a espectroscopia Raman poderia ser utilizada para discriminar lesões de pele, em que as diferenças na bioquímica dos tecidos podem ser vistas por meio de métodos de decomposição espectral baseado em variações espectrais. Para o PCA, funções discriminantes como as distâncias Eucliana, Quadrática e de Mahalanobis, poderiam trazer a classificação dos grupos 71 histopatológicos com uma boa precisão. Considerando as baixas diferenças espectrais entre tecidos normais, displasias e neoplasias malignas, que são na sua maior parte, devido à elevada profundidade de penetração do laser em 830 nm, o uso de uma Probe confocal (CHRIT et al., 2005; DURAIPANDIAN et al., 2013; LIEBER et al., 2008a), poderia trazer um melhor controle da profundidade de penetração do laser, fazendo com que a radiação que fora espalhada pelo tecido e coletada pelo equipamento de espectroscopia Raman seja respectivamente da camada da pele que está analizando, aumentando assim a precisão e melhorando a capacidade de diagnóstico da técnica Raman. A espectroscpia Raman mostrou ser uma ótima ferramenta para discriminação de lesões de pele, podendo tornando-se uma valiosa ferramenta para o auxílio ao dermatologista em um diagóstico precose de câncer de pele. 72 6. CONCLUSÃO Neste trabalho, as suspeitas de lesões de pele humana in vivo foram avaliadas por meio de espectroscopia Raman, pré-biópisia excisional, e modelos de diagnóstico “offline” foram desenvolvidos, com base em PCA e PLS, a fim de discriminar tecidos não tumorais de tecidos malignos (carcinoma basocelular e carcinoma espinocelular), e pré-malignas (queratose actinica). A maior precisão obtida foi de 91,9% pelo modelo PLS/DA, com uma sensibilidade de 90,9% e uma especificidade de 93,2%, para a discriminação de lesões não melanoma e prémaligno (CBC, CEC e KER) de lesão benigna e tecido normal (NT). O modelo PCA/DA apresentou precisão alta, cerca de 82,8% para o mesmo agrupamento histopatológico. Os resultados de especificadade se mostraram maior que os resultados de sensibilidade, mostrando que os modelos discrimnates estudados conseguem excluir os pacientes que não possuem a neoplasia. Vetores de variância espectral de PCA e PLS revelaram informações úteis quanto as diferenças bioquímicas entre os tecidos relacionados com a neoplasia. O modelo PLS/DA apresentou uma viabilidade para um algoritmo de discriminação in vivo e um diagnóstico em tempo real. A profundidade de penetração do laser no infravermelho é um ponto chave para aumentar a precisão do modelo, e deve ser levada em consideração para análise e diagnóstico de câncer em pele em trabalhos futuros. 73 REFERÊNCIAS BIBLIOGRÁFICAS AFSETH, N.K.; WOLD, J.P.; SEGTNAN, V.H. The potential of Raman spectroscopy for characterisation of the fatty acid unsaturation of salmon. Anal. Chim. Acta. 572(1):85-92, 2006. ALBUQUERQUE, M.A. Estabilidade em Análise de Agrupamento. 2005. 62p. Dissertação (Mestrado em Biometria) - Universidade Federal Rural de Pernambuco, Pernanbuco. ALBUQUERQUE, M.A.; FERREIRA, R.L.C; SILVA, J.A.A. et al. Stability in cluster analysis: study of case in forest science. Rev. Árvore. 30(2):257-265, 2006. ALLEN, H.B. Dermatology Terminology. Londor, New York: Springer Drexel Dordrecht Heidelberg, 2010. 197p. ALVES, L.B.; BELDERRAIN, M.C.N.; SCARPEL, R.A. Tratamento Multivariado de Dados por Análise de Correspondência e Análise de Agrupamentos. Anais do 13o Encontro de Iniciação Científica e Pós-Graduação do ITA – XIII ENCITA. São José dos Campos, SP: Instituto Tecnológico de Aeronáutica 2007. ANVISA. Toxicologia Aplicada. Gerência Geral de Toxicologia (2014). Disponível em: http://ltc.nutes.ufrj.br/toxicologia/mII.pele.htm Acesso em 10 abr 2014. AZULAY, R.D.; AZULAY, D.R. Dermatologia, 3 ed. Rio de Janeiro: Guanabara Koogan, 2004, 664p. BARKER, M.; RAYENS W. Partial least squares for discrimination. J. Chemometr. 17(3):166-173, 2003. BARNES, R J.; DHANOA, M.S.; LISTER, S.J. Standard normal variate transformation and De-trending of near-infrared diffuse reflectance spectra. Appl. Spectrosc. 43(5):772-777, 1989. BEZERRA, S.M.F.M.C. Efeitos da Radiação Solar Crônica e Prolongada Sobre o Sistema Imunológico de Pescadores do Recife. 2007. 133p. Tese (Doutorado em Ciências) - Faculdade de Medicina, Universidade de São Paulo, São Paulo, 2007. BODANESE, B. Espectrocopia Raman Dispersiva No Diagnóstico De Carcinomas Basocelulares. 2008. 69p. Dissertação (Mestrado em Engenharia Biomédica). Instituto de Pesquisa e Desenvolvimento, Universidade do Vale do Paraíba, São José dos Campos. BODANESE, B.; SILVEIRA, F.L.; ZANGARO, R.A. et al. Discrimination of basal cell carcinoma and melanoma from normal skin biopsies in vitro through Raman spectroscopy and principal component analysis. Photomed. Laser Surg. 30(7):381387, 2012. 74 BODANESE, B.; SILVEIRA JR., L.; ALBERTINI, R. et al. Differentiating normal and basal cell carcinoma human skin tissues in vitro using dispersive Raman spectroscopy: a comparison between principal components analysis and simplified biochemical models. Photomed. Laser Surg. 28(1):S119-127, 2010. BRAY, F.; JEMAL, A.; GREY, N. et al. Global cancer transitions according to the Human Development Index (2008-2030): a population-based study. Lancet Oncol. 13(8):790-801, 2012. CALIN, M.A.; PARASCA, S.V.; SAVASTRU, R. et al. Optical techniques for the noninvasive diagnosis of skin cancer. J. Cancer Res. Clin. Oncol. 139(7):10831104, 2013. CECATTO, J.R. Capítulo 4 - O Sol. Disponível em: http://www.das.inpe.br/ciaa/cd/HTML/sol/O_SOL Acesso em: 04 abr 2014. CHOI, J.; CHOO, J.; CHUNG, H. et al. Direct observation of spectral differences between normal and basal cell carcinoma (BCC) tissues using confocal Raman microscopy. Biopolymers. 77(5):264-272, 2005. CHRIT, L.; HADJUR, C.; MOREL, S. et al. In vivo chemical investigation of human skin using a confocal Raman fiber optic microprobe. J. Biomed. Opt. 10(4):44007, 2005. CLESIO, F. Mineração de Dados - Distância Euclidiana. Disponível em: https://mineracaodedados.wordpress.com/tag/distancia-euclidiana/ Acesso em: 16 jun 2014. CRUZ, L.C.D. Câncer de pele causado pela radiação ultravioleta solar. 2009. 40p. Monografia (Licenciatura em Física) - Universidade Estatual de Mato Grosso do Sul, Dourados. DARVIN, M. E.; GERSONDE, I.; MEINKE, M. et al. Non-invasive in vivo determination of the carotenoids beta-carotene and lycopene concentrations in the human skin using the Raman spectroscopic method. J. Phys. D: Appl. Phys. 38:2696, 2005. DE JONG, B.W.; SCHUT, T.C.; MAQUELIN, K. et al. Discrimination between nontumor bladder tissue and tumor by Raman spectroscopy. Anal. Chem. 78(22):7761-7769, 2006. DURAIPANDIAN, S.; ZHENG, W.; NG, J. et al. Near-infrared-excited confocal Raman spectroscopy advances in vivo diagnosis of cervical precancer. J. Biomed. Opt. 18(6):067007, 2013. EVERS, D.J.; NACHABE, R.; KLOMP, H. et al. Diffuse reflectance spectroscopy: a new guidance tool for improvement of biopsy procedures in lung malignancies. Clin. Lung. Cancer. 13(6):424-431, 2012. FENDEL, S.; SCHRADER, B. Investigation of skin and skin lesions by NIR-FTRaman spectroscopy. Fresenius J. Anal. Chem. 360(5):609-613, 1998. 75 FERLAY, J.; SHIN, H.R.; BRAY, F. et al. Estimates of worldwide burden of cancer in 2008: GLOBOCAN 2008. Int. J. Cancer. 127(12):2893-2917, 2010. GNIADECKA, M.; PHILIPSEN, P.A.; SIGURDSSON, S. et al. Melanoma diagnosis by Raman spectroscopy and neural networks: structure alterations in proteins and lipids in intact cancer tissue. J. Invest. Dermatol. 122(2):443-449, 2004. GNIADECKA, M.; WULF, H.C.; MORTENSEN, N.N. et al. Diagnosis of Basal Cell Carcinoma by Raman Spectroscopy. J. Raman Spectrosc. 28:125-129, 1997a. GNIADECKA, M.; WULF, H.C.; NIELSEN, O.F. et al. Distinctive molecular abnormalities in benign and malignant skin lesions: studies by Raman spectroscopy. Photochem. Photobiol. 66(4):418-423, 1997b. GREVE, T.M.; ANDERSEN, K.B.; NIELSEN, O.F. ATR-FTIR, FT-NIR and near-FTRaman spectroscopic studies of molecular composition in human skin in vivo and pig ear skin in vitro. Spectroscopy. 22(6):437-457, 2008. GUIMARÃES, A.E. Utilização de Espectroscopia Raman no infravermelho próximo (NIRS) para detecção e quantificação de efedrina em urina. 2004. 62p. Dissertação (Mestrado em Engenharia Biomédica) - Instituto de Pesquisa e Desenvolvimento, Universidade do Vale do Paraíba. São José dos Campos HAKA, A.S.; VOLYNSKAYA, Z.; GARDECKI, J.A. et al. In vivo margin assessment during partial mastectomy breast surgery using raman spectroscopy. Cancer Res. 66(6):3317-3322, 2006. HANLON, E.B.; MANOHARAN, R.; KOO, T.W. et al. Prospects for in vivo Raman spectroscopy. Phys. Med. Biol. 45(2):R1-59, 2000. HU, C.; WANG, J.; ZHENG, C. et al. Raman spectra exploring breast tissues: comparison of principal component analysis and support vector machine-recursive feature elimination. Med. Phys. 40(6):063501, 2013. HUANG, Z.; LUI, H.; CHEN, X.K. et al. Raman spectroscopy of in vivo cutaneous melanin. J. Biomed. Opt. 9(6):1198-1205, 2004. HUANG, Z.; TEH, S.K.; ZHENG, W. et al. In vivo detection of epithelial neoplasia in the stomach using image-guided Raman endoscopy. Biosens. Bioelectron. 26(2):383-389, 2010. HUANG, Z.; ZENG, H.; HAMZAVI, I. et al. Rapid near-infrared Raman spectroscopy system for real-time in vivo skin measurements. Opt. Lett. 26(22):1782-1784, 2001. HUTCHINGS, J.; KENDALL, C.; SHEPHERD, N. et al. Evaluation of linear discriminant analysis for automated Raman histological mapping of esophageal highgrade dysplasia. J. Biomed. Opt. 15(6):066015, 2010. 76 INCA. Estimativa 2014 - Incidência de Câncer no Brasil. 2014. Insituto Nacional de Câncer. Disponível em: http://www.inca.gov.br/estimativa/2014/index.asp?ID=1 Acesso em 04 fev 2014. INCA. Estimativa/2012 - Incidência de Câncer no Brasil: Instituto Nacional de Câncer - INCA. Rio de Janeiro, Brasil: Ministério da Saúde. 2012-2011. JACQUES, S.L.; POGUE, B.W. Tutorial on diffuse light transport. J. Biomed. Opt. 13(4):041302, 2008. JEMAL, A.; BRAY, F.; CENTER, M.M. et al. Global cancer statistics. CA-Cancer J. Clin. 61(2):69-90, 2011. KENDALL, C.; HUTCHINGS, J.; BARR, H. et al. Exploiting the diagnostic potential of biomolecular fingerprinting with vibrational spectroscopy. Faraday Discuss. 149:279-290; discussion 333-256, 2011. KOLJENOVIĆ, S.; BAKKER SCHUT, T.C.; VAN MEERBEECK, J.P. et al. Raman microspectroscopic mapping studies of human bronchial tissue. J. Biomed. Opt. 9(6):1187-1197, 2004. KUMAR, V.; ABBAS, A.K.; FAUSTO, N. A Pele. In: (Ed.). Patologia - Bases patológicas das Doenças. 7 ed. Rio de Janeiro: Elsevier, 2005. p.1283 - 1329. LARRAONA-PUY, M.; GHITA, A.; ZOLADEK, A. et al. Development of Raman microspectroscopy for automated detection and imaging of basal cell carcinoma. J. Biomed. Opt. 14(5):054031, 2009. LI, X.; YANG, T.; LI, S. Discrimination of serum Raman spectroscopy between normal and colorectal cancer using selected parameters and regression-discriminant analysis. Appl. Opt. 51(21):5038-5043, 2012. LIEBER, C.A.; MAJUMDER, S.K.; BILLHEIMER, D. et al. Raman microspectroscopy for skin cancer detection in vitro. J. Biomed. Opt. 13(2):9, 2008a. LIEBER, C.A.; MAJUMDER, S.K.; ELLIS, D.L. et al. In vivo nonmelanoma skin cancer diagnosis using Raman microspectroscopy. Lasers Surg. Med. 40(7):461-467, 2008b. LLOYD, G.R.; ORR, L.E.; CHRISTIE-BROWN, J. et al. Discrimination between benign, primary and secondary malignancies in lymph nodes from the head and neck utilising Raman spectroscopy and multivariate analysis. Analyst. 138(14):3900-3908, 2013. LUI, H.; ZHAO, J.; MCLEAN, D. et al. Real-time Raman spectroscopy for in vivo skin cancer diagnosis. Cancer Res. 72(10):2491-2500, 2012. LUO, S.; CHEN, C.; MAO, H. et al. Discrimination of premalignant lesions and cancer tissues from normal gastric tissues using Raman spectroscopy. J. Biomed. Opt. 18(6):067004, 2013. 77 LYNG, F.M.; FAOLÁION, E.O.; CONROY, J. et al. Vibrational spectroscopy for cervical cancer pathology, from biochemical analysis to diagnostic tool. Exp. Mol. Pathol. 82(2):121-129, 2007. MAGEE, N.D.; VILLAUMIE, J.S.; MARPLE, E.T. et al. Ex vivo diagnosis of lung cancer using a Raman miniprobe. J. Phys. Chem. B. 113(23):8137-8141, 2009. MALINI, R.; VENKATAKRISHNA, K.; KURIEN, J. et al. Discrimination of normal, inflammatory, premalignant, and malignant oral tissue: a Raman spectroscopy study. Biopolymers. 81(3):179-193, 2006. MARTINEZ, E.Z.; LOUZADA-NETO, F.; PEREIRA, B.B. A Curva ROC para Testes Diagnósticos. Caderno Saúde Coletiva. 11(1):7-31, 2003. MATEMÁTICA, Estatistica - Análise de Variância (ANOVA). Só Matemática - o seu portal matemático. Disponível em: http://www.somatematica.com.br/estatistica.php. Acesso em 26 nov 2013 MAZUR, L. Aplicação de metodologia por NIR para determinação de metilxantinas presentes na erva-mate (llex paraguariensis). 2012. 80p. Dissertação (Mestrado em Engenharia de Alimentos) - Universidade Federal do Paraná. Curitiba. MICHELE, J. Molecular Spectrocopy. New Jersey: Oebtuce Gakk, 1999. MOTZ, J.T.; FITZMAURICE, M.; MILLER, A. et al. In vivo Raman spectral pathology of human atherosclerosis and vulnerable plaque. J. Biomed. Opt. 11(2):021003, 2006. MOVASAGHI, Z.; REHMAN, S.; REHMAN, I.U. Raman Spectroscopy of Biological Tissues. Appl. Spectrosc. Rev. 42(5):493-541, 2007. NIJSSEN, A.; BAKKER SCHUT, T.C.; HEULE, F. et al. Discriminating basal cell carcinoma from its surrounding tissue by Raman spectroscopy. J. Invest. Dermatol. 119(1):64-69, 2002. NOGUEIRA, G.V.; SILVEIRA, L.; MARTIN, A.A. et al. Raman spectroscopy study of atherosclerosis in human carotid artery. J. Biomed. Opt. 10(3):031117, 2005. NUNES, L.O.; MARTIN, A.A.; SILVEIRA JR., L. et al. FT-Raman spectroscopy study for skin cancer diagnosis. Spectroscopy. 17:597-602, 2003. PAIVA, A.L.C. TEIXEIRA, R.B.; YAMAKI, M. et al. Análise de componentes principais em características de produção de aves de postura. Rev. Bras. Zootecn. 39(2):285288, 2010. PARKIN, D.M.; BRAY, F.; FERLAY, J. et al. Estimating the world cancer burden: Globocan 2000. Int. J. Cancer. 94(2):153-156, 2001. 78 PHILIPSEN, P.A.; KNUDSEN, L.; GNIADECKA, M. et al. Diagnosis of malignant melanoma and basal cell carcinoma by in vivo NIR-FT Raman spectroscopy is independent of skin pigmentation. Photochem. Photobiol. Sci. 12(5):770-776, 2013. RENCHER, A.C. Methods of multivariate analysis. New York, USA: John Wiley & Sons, 2002, 727p. RONAN, P. File: EM spectrum.svg Wikimedia Commons. Disponível em: http://commons.wikimedia.org/wiki/File:EM_spectrum.svg. Acesso em: 16 mai 2014. ROUESSAC, F.; ROUESSAC, A. Chemical Analysis: Modern Instrumentation Methods and Techniques. England: John Wiley & Sons 2007. ROUS, P; FRIEDEWALD, W.F. The effect of chemical carcinogens on virus-induced rabbit papillomas. J. Exp. Med. 79(5):511-538, 1944. SABIN, J.G.; FERRÃO, M.F.; FURTADO, J.C. Análise multivariada aplicada na identificação de fármacos antidepressivos. Parte II: Análise por componentes principais (PCA) e o método de classificação SIMCA. Rev. Bras. Ciênc. Farm. 40(3):387-396, 2004. SAMPAIO, S.A.P.; RIVITTI, E.A. Dermatologia. 2ed. São Paulo: Artes Médicas, 2001, 1156p. SANTOS, S. Turma VII C e M - Pele. Disponível em: http://cemvii.blogspot.com.br/2010/11/pele.html. Acesso em: 09 out 2013. SHEAR, M.J. Studies in Carcinogenesis: IV. Development of Liver Tumors in Pure Strain Mice following the Injection of 2-Amino-5-Azotoluene. Am. J. Cancer. 29:269284, 1937. SIGURDSSON, S.; PHILIPSEN, P.A.; HANSEN, L.K. et al. Detection of skin cancer by classification of Raman spectra. IEEE Trans. Biomed. Eng. 51(10):1784-1793, 2004. SILVA, A.C. Meio Ambiente e Saúde Humana: Variabilidade Temporal Da Radiação Ultravioleta e Epidemiologia do Câncer. 2007. 112p. Dissertação (Mestrado em Geografia) - Faculdade de Ciências e Tecnologia, Universidade Estadual Paulista, Presidente Prudente. SILVA, M.R.E. Carcinogenese no Câncer de Pele. Dermatologia Atual. 6(2):5, 2000. SILVEIRA JR., L. Correlação entre a técnica de Espectroscopia Raman e a análise histopatológica das placas ateromatosas em artéria coronária humana. 2001. 109p. Tese (Doutorado em Ciências). Faculdade de Medicina, Universidade de São Paulo, São Paulo 79 SILVEIRA JR., L.; ZÂNGARO, R.A., PACHECO, M.T.T. et al. Near-Infrared Raman Spectroscopy for in vitro Human Coronary Artery Tissue Identification. II CONGRESSO LATINOAMERICANO DE INGENIERÍA BIOMÉDICA. Havana, Cuba 2001. SILVEIRA JR., L.; SATHAIAH, S.; ZANGARO, R. A. et al. Correlation between nearinfrared Raman spectroscopy and the histopathological analysis of atherosclerosis in human coronary arteries. Lasers Surg. Med. 30(4):290-297, 2002. SILVEIRA, F.L. Determinação da Concentração de Gorduras Saturadas e Insaturadas em Alimentos Comerciais por Espectroscopia Raman Dispersiva. 2008. 71p. Dissertação (Mestrado em Engenharia Biomédica) - Instituto de Pesquisa e Desenvolvimento, Universidade do Vale do Paraíba, São José dos Campos SILVEIRA, L.; SILVEIRA, F.L.; BODANESE, B. et al. Discriminating model for diagnosis of basal cell carcinoma and melanoma in vitro based on the Raman spectra of selected biochemicals. J. Biomed. Opt. 17(7):077003, 2012. SMITH, E.; DENT, G. Modern Raman Spectroscopy: A Practical Approach. West Sussex, England: John Wiley & Sons, 2005. 224p. SOUZA, C. Análise de Poder Discriminativo Através de Curvas ROC. Disponível em: http://crsouza.blogspot.com.br/2009/07/analise-de-poder-discriminativo-atraves.html. Acesso em 05 mar 2014. SPENCER, J.M.; KAHN, S.M.; JIANG, W. et al. Activated ras genes occur in human actinic keratoses, premalignant precursors to squamous cell carcinomas. Arch. Dermatol. 131(7):796-800, 1995. STONE, N.; HART PRIETO, M.C.; CROW, P. et al. The use of Raman spectroscopy to provide an estimation of the gross biochemistry associated with urological pathologies. Anal. Bioanal. Chem. 387(5):1657-1668, 2007. TAVARES, R.C. Peelings Faciais. Disponível em: http://maquel.com.br/blog/tag/acne-skin/page/2/ Acesso em: 22 set 2013. VICINI, L. Análise multivariada da teoria à prática. 2005. 215p. Monografia (Especialização). Universidade Federal de Santa Maria, Santa Maria WALDMAN, E.A.; ROSA, T.E.C. Validade de Instrumentos de Diagnósticos. Departamento de Epidemiologia da Faculdade de Saúde Pública da Universidade de São Paulo. 2014. WHO, W.H.O. Skin cancers. Ultraviolet Programme: World Health Organization 2012. radiation and the INTERSUN ZAIDI, Z.; LANIGAN, S.W. Dermatology in Clinical Practice. New York: Springer Dordrecht Heidelberg, 2010. 80 ZHAO, J.; LUI, H.; MCLEAN, D.I. et al. Integrated real-time Raman system for clinical in vivo skin analysis. Skin Res. Technol. 14(4):484-492, 2008. 81 ANEXO A Aprovação do Comitê de Ética em Pesquisa