UNIVERSIDADE PAULISTA – UNIP CLASSIFICADOR PARACONSISTENTE DE ATRIBUTOS DE IMAGENS MAMOGRAFICAS APLICADO NO PROCESSO DE DIAGNÓSTICO DO CÂNCER DE MAMA ASSISTIDO POR COMPUTADOR Tese apresentada ao Programa de PósGraduação em Engenharia de Produção da Universidade Paulista – UNIP para a obtenção do título de Engenharia de Produção. FÁBIO VIEIRA DO AMARAL SÃO PAULO 2013 Doutor em 2 UNIVERSIDADE PAULISTA – UNIP CLASSIFICADOR PARACONSISTENTE DE ATRIBUTOS DE IMAGENS MAMOGRAFICAS APLICADO NO PROCESSO DE DIAGNÓSTICO DO CÂNCER DE MAMA ASSISTIDO POR COMPUTADOR FÁBIO VIEIRA DO AMARAL Tese apresentada ao Programa de PósGraduação em Engenharia de Produção da Universidade Paulista – UNIP para a obtenção do título de Doutor em Engenharia de Produção. Área de Concentração: Sistemas de Operação Gestão de Linha de Pesquisa: Métodos Quantitativos em Engenharia de Produção Orientador: Prof. Dr. Jair Minoro Abe SÃO PAULO 2013 3 Amaral, Fábio Vieira do. Classificador Paraconsistente de atributos de imagens mamograficas aplicado no processo de diagnóstico do câncer de mama assistido por computador. / Fábio Vieira do Amaral. – São Paulo, 2013 205 f. color Tese (Doutorado) – Apresentada ao Programa de Pós Graduação em Engenharia de Produção da Universidade Paulista – UNIP, São Paulo, 2013. Área de Concentração: Gestão de Sistemas de Operação “Orientador: Prof. Dr. Jair Minoro Abe” 1. Lógica Paraconsistente Anotada Evidencial ERedes Neurais Artificiais Paraconsistentes, 3. Câncer de mama, 4. Classificador de atributos de imagens, 5. Auxílio ao diagnóstico. 4 FÁBIO VIEIRA DO AMARAL CLASSIFICADOR PARACONSISTENTE DE ATRIBUTOS DE IMAGENS MAMOGRAFICAS APLICADO NO PROCESSO DE DIAGNÓSTICO DO CÂNCER DE MAMA ASSISTIDO POR COMPUTADOR Tese apresentada ao Programa de PósGraduação em Engenharia de Produção da Universidade Paulista – UNIP para a obtenção do título de Doutor em Engenharia de Produção. . Aprovado em: BANCA EXAMINADORA ___________________________________________ Prof.Dr. Mário Mollo Neto Universidade Paulista - UNIP ____/____/_____ ___________________________________________ ____/____/_____ Prof. Dr. Rafael do Espírito-Santo Instituto Israelita de Pesquisa e Ensino Albert Einsten ___________________________________________ Prof.Dr. João Inácio da Silva Filho Universidade Santa Cecília - UNISANTA ____/____/_____ ___________________________________________ Prof. Dr. Fábio Romeu de Carvalho Universidade Paulista - UNIP ____/____/_____ ___________________________________________ Prof. Dr. Jair Minoro Abe (Orientador) Universidade Paulista – UNIP ____/____/_____ 5 AGRADECIMENTOS Ao Prof. Dr. Jair Minoro Abe, meu orientador, pela paciência e confiança, mas principalmente, por sua sabedoria nos momentos de desânimo frente às dificuldades envolvidas no trato com as pessoas. Sua visão de orientador me ensinou que todos devem ter a chance de se tornar um pesquisador, mesmo tendo a certeza de que para muitos nunca irá ocorrer de fato. Ao Prof. Dr. Marcelo Nogueira, se não fosse por sua insistência, este doutorado jamais teria se iniciado. Ao Prof. MSc. Fábio Luís Pereira, meu colega de profissão, um desbravador para o nosso grupo de pesquisa no quesito Rede Neural Artificial Paraconsistente. Ao Prof. Dr. Rafael do Espírito-Santo, mais do que um amigo, um coorientador presente. Ao Prof. MSc. Hélio Corrêa de Araújo, meu ex-aluno que se transformou em pesquisador, professor e amigo. Sua ajuda nos momentos de falta de inspiração foi crucial. Ao meu ex-aluno de graduação e pós-graduação Álvaro André Colombero Prado, por sua ajuda na revisão deste trabalho. Ao meu ex-aluno de graduação e pós-graduação Renato Hildebrando Parreira, que junto com o Hélio Corrêa de Araújo passamos madrugadas testando o software. Aos Professores Doutores João Inácio da Silva Filho e Mário Mollo Neto, cujas observações sobre o trabalho foram essenciais e extremamente produtivas. Aos meus familiares, pela compreensão e carinho com que acolheram minha dedicação à pesquisa e, consequentemente, ausência. 6 RESUMO Neste trabalho foi desenvolvido um Classificador Paraconsistente para o auxílio ao diagnóstico do câncer de mama, a partir da classificação de atributos de imagens mamográficas. A arquitetura da Rede Neural Artificial Paraconsistente utilizada é dividida em três fases: na primeira fase, há as Células Neurais Artificiais Paraconsistentes de aprendizado (CNAPa´s); na segunda fase, há as Células Neurais Artificiais Paraconsistentes de Conexão lógica simples (CNAPCls´s) e na terceira fase, há as Células Neurais Arificiais Paraconsistentes de decisão (CNAPd´s). O sistema implementa oito conjuntos de atributos mamográficos, onde para cada atributo de imagem foi criada uma rede neural, com a tomada de decisão a partir dos resultados finais do processamento de cada conjunto de atributos. Para mitigar os efeitos dos diagnósticos formados por falsos positivos e verdadeiros positivos desenvolveu-se um algoritmo para calibração do valor de corte entre os casos benignos e malignos. A fim de analisar o desempenho do Classificador os resultados foram comparados com os resultados dos seguintes classificadores: Multi-Layer Perceptron(MLP), um classificador de duplo estágio (ART2LDA), fundamentado na Adaptive Resonance Theory (ART) e um classificador implementado segundo técnicas de otimização não linear e combinatória, associadas á capacidade de classificação das Funções de Bases Radiais (RBF-Simulated Annealing). Para realização das simulações são utilizadas duas bases de dados distintas. A primeira para classificação de calcificações composta por 143 amostras divididas em 64 casos benignos e 79 casos malignos representados por fatores de forma e a segunda para classificação de massas mamográficas e tumores composta por 57 regiões de interesse divididas em 37 malignas e 20 benignas representadas por fatores de forma, transição de bordas e medidas de textura. Os desempenhos dos classificadores em discriminar casos benignos e malignos são comparados em termos da área sob curva Receiver Operating Characteristic (Az). Quanto maior o valor de Az, melhor é o desempenho do classificador. Os experimentos com calcificações mostram: Classificador Paraconsistente (Az = 0,986), Classificador MLP (Az = 0,70), Classificador ART2LDA (Az = 0,696) e Classificador RBF-Simulated Annealing (Az = 0,94). Para os experimentos com massas mamográficas e tumores mostram: Conjunto 1, Classificador Paraconsistente (Az = 0,939), Classificador MLP (Az = 0,994), 7 Classificador ART2LDA (Az = 0,901) e Classificador RBF-Simulated Annealing (Az = 0,912). Conjunto 2, Classificador Paraconsistente (Az = 0,935), Classificador MLP (Az = 0,994), Classificador ART2LDA (Az = 0,890) e Classificador RBF-Simulated Annealing (Az = 0,924). Conjunto 3, Classificador Paraconsistente (Az = 0,875), Classificador MLP (Az = 0,970), Classificador ART2LDA (Az = 0,850) e Classificador RBF-Simulated Annealing (Az = 0,996). Conjunto 4, Classificador Paraconsistente (Az = 0,500), Classificador MLP (Az = 0,887), Classificador ART2LDA (Az = 0,767) e Classificador RBF-Simulated Annealing (Az = 0,907). Conjunto 5, Classificador Paraconsistente (Az = 0,929), Classificador MLP (Az = 0,987), Classificador ART2LDA (Az = 0,884) e Classificador RBF-Simulated Annealing (Az = 0,998). Conjunto 6, Classificador Paraconsistente (Az = 0,939), Classificador MLP (Az = 0,982), Classificador ART2LDA (Az = 0,885) e Classificador RBF-Simulated Annealing (Az = 0,999). No caso do Classificador Paraconsistente houve o oitavo experimento composto pelo total de atributos de imagens relativos às massas mamográficas e tumores (Az = 0,939). No caso particular do Classificar RBF-Simulated Annealing o experimento com todos os atributos de imagens se mostrou inviável graças à complexidade do seu algoritmo, onde o tempo de processamento tende ao infinito para um número maior de elementos. Para os experimentos o Classificador Paraconsistente utilizou 20% das amostras para treinamento da rede neural, contra o total de amostras disponíveis menos uma para os demais classificadores. Os resultados demonstram as qualidades do Classificador Paraconsistente ao utilizar um número reduzido de amostras para treinamento da rede neural e pelo seu baixo tempo de processamento. O classificador proposto pode ser classificação como um Computer-Aided Diagnosis (CAD). Palavras-chave: Computer-Aided Diagnosis, Câncer de mama, Paraconsistente Anotada Evidencial E, Rede Neural Artificial Paraconsitente Lógica 8 ABSTRACT In this work, a Paraconsistent Classifier for the diagnosis of breast cancer based on the attributes of mamographic images was developed. The architecture of the Paraconsistent Artificial Neural Network used is divided into three phases: the first one with Paraconsistent Artificial Learning Neural Cells (CNAPa's), the second with Paraconsistent Artificial Simple Logic Connection Neural Cells (CNAPCls's ) and in the third stage, with Arificial Paraconsistent decision Neural Cells (CNAPd's). The system implements eight sets of mammographic attributes, where for each picture attribute, a neural network with decision making from the final results of processing each set of attributes was created. In order to mitigate the effects of false positives diagnoses and true positives, an algorithm was developed to calibrate the cutoff between benign and malignant cases. In order to analyze the performance of the Paraconsistent classifier, the results will be compared with the results of the following classifiers: Multi-Layer Perceptron (MLP), a dual stage classifier (ART2LDA) based on Adaptive Resonance Theory (ART) and a classifier implemented with nonlinear optimization techniques and combinatorics, associated with the classification capabilities of Radial basis Functions - (RBF-Simulated Annealing).To perform the simulations, two different databases were used. The first one, to classify calcifications, is composed of 143 samples divided into 64 benign cases and 79 malignant cases represented by form. The second is intended for mammographic masses and tumors classification, and is composed by 57 regions of interest divided into 37 malignant and 20 benign cases, represented by form factors, transition edges and texture measures. The performances of the classifiers in discriminating benign and malignant cases are compared in terms of area under the Receiver Operating Characteristic Curve (Az). The higher the value of Az, the better the performance of the classifier.The experiments with calcifications show: Paraconsistent Classifier (Az = 0.986), MLP classifier (Az = 0.70), ART2LDA Classifier (Az = 0.696) and RBF Classifier - Simulated Annealing (Az = 0.94). For experiments with mammographic masses and tumors show: Set 1, Paraconsistent Classifier (Az = 0.939), MLP classifier (Az = 0.994), ART2LDA Classifier (Az = 0.901) and RBF Classifier - Simulated Annealing (Az = 0.912). Set 2, Paraconsistent Classifier (Az = 9 0.935), MLP classifier (Az = 0.994), ART2LDA Classifier (Az = 0.890) and RBF Classifier - Simulated Annealing (Az = 0.924). Set 3, Paraconsistent Classifier (Az = 0.875), MLP classifier (Az = 0.970), ART2LDA Classifier (Az = 0.850) and RBF Classifier - Simulated Annealing (Az = 0.996). Set 4, Paraconsistent Classifier (Az = 0.500), MLP classifier (Az = 0.887), ART2LDA Classifier (Az = 0.767) and RBF Classifier - Simulated Annealing (Az = 0.907). Set 5, Paraconsistent Classifier (Az = 0.929), MLP classifier (Az = 0.987), ART2LDA Classifier (Az = 0.884) and RBF Classifier - Simulated Annealing (Az = 0.998). Set 6, Paraconsistent Classifier (Az = 0.939), MLP classifier (Az = 0.982), ART2LDA Classifier (Az = 0.885) and RBF Classifier - Simulated Annealing (Az = 0.999). In the case of the Paraconsistent Classifier, the eighth experiment was composed of the total image attributes relating to mammographic masses and tumors (Az = 0.939). In the particular case of the RBFSort Simulated Annealing experiment with all the image attributes, it was proved its unfeasibility, due to the complexity of their algorithm, where the processing time tends to infinity for a larger number of elements. For the experiments, the Paraconsistent classifier used 20% of the samples for the neural network training, against the total number of samples available minus one for the other classifiers. The results demonstrate the qualities of Paraconsistent classifier when using a small number of samples for training the neural network and its low processing time. The proposed classifier can be rated as a Computer-Aided Diagnosis system (CAD). . Keywords: Attributes of Images Classifier, Breast cancer, Computer-Aided Diagnosis, Paraconsistent Annotated Evidential Logic E, Paraconsitent Artificial Neural Network Mammography 10 LISTA DE ILUSTRAÇÕES Figura 1: Componentes de uma unidade de raios-X exclusiva para mamografia. (BASSETT, 2000) ................................................................................................ 37 Figura 2 : Bordas fixas versus móveis. (BASSETT, 2000) ................................... 39 Figura 3: Exame de mamografia sendo realizado(BASSETT, 2000). ................... 41 Figura 4: Variação da quantidade de tecido fibroglandular nas mamas em função da idade. (PASQUALETTE, 1998) ....................................................................... 42 Figura 5 : Sequencia de mamografias mostrando aspectos diferentes de acordo com a faixa etária. (PASQUALETTE, 1998) ......................................................... 42 Figura 6: Massas – forma e contorno. (BASSETT, 2000) ..................................... 46 Figura 7: Calcificações – configuração e distribuição. (BASSETT, 2000) ............. 48 Figura 8: Condições de visão. Os espaços do negatoscópio adéquam-se ao tamanho dos filmes mamográficos. Na disposição mostrada, o novo exame foi colocado na coluna de baixo, com um exame dois anos mais antigo diretamente acima para comparação. A luz extrínseca é coberta no negatoscópio usando-se painéis deslizantes. Uma lente de magnificação portátil e uma luz brilhante estão disponíveis e são usadas regularmente. (BASSETT, 2000) ................................. 49 Figura 9: As incidências mediolateral oblíqua (A) e CC (B) são colocadas costas com costas sobre o negatoscópio para emitir avaliação da simetria bilateral das mamas. (BASSETT, 2000) ................................................................................... 49 Figura 10: Exemplos de formas dos contornos das massa benignas: (a) e (b).Exemplos de formas dos contornos de tumores malignos: (c) e (d) (HILLARY, RANGAYYAN, & DESAUTELS, 2003) (ESPÍRITO-SANTO, 2004). ..................... 58 Figura 11: a) Uma mamografia típica; b) segmentação; c) densidade FD (x,y); d) a f) contrastes (FC(x,y)), FKC(x,y) e FE(x,y)); g) e h) estruturas detectadas (ESPÍRITO-SANTO, 2004)................................................................................... 59 Figura 12: Na esquerda, uma mamografia exibindo calcificações malignas. Na direita, contornos nas calcificações feitos pelo Radiologista (SHEN, RANGAYYAN, & DESAUTELS, Detection and classification of mammographic calcifications, 1993) (ESPÍRITO-SANTO, 2004)................................................................................... 60 Figura 13: Na esquerda, uma mamografia exibindo calcificações benignas. Na direita, contornos nas calcificações feitos pelo Radiologista (SHEN, RANGAYYAN, & DESAUTELS, Detection and classification of mammographic calcifications, 1993) (ESPÍRITO-SANTO, 2004)................................................................................... 60 11 Figura 14: Na esquerda, uma mamografia exibindo um tumor maligno (espiculada). Na direita, tumor identificado pelo Radiologista (contorno) (GULIATO, Detection of Breast Tumor Boundaries Using Iso-Intensity Contours and Dynamic Thresholding, 1996).................................................................................................................... 62 Figura 15: Representação do reticulado das anotações pelo diagrama de Hasse (ABE, 2008) ......................................................................................................... 72 Figura 16: Reticulado com graus de certeza e incerteza (ABE J. M., 2011) ......... 73 Figura 17: Estados extremos e não-extremos (ABE J. M., 2011) ......................... 76 Figura 18: Diagrama com os graus de incerteza e de certeza, com valores ajustáveis de controle limite indicados nos eixos. Obeservem-se também as regiões consideradas (ABE J. M., 2011). .......................................................................... 76 Figura 19 : Sistema básico de Análise Paraconsistente (ABE, 2008). .................. 77 Figura 20: Reticulado representado por um QUPC (ABE, 2008). ......................... 78 Figura 21: Representação dos Graus de Certeza e de Incerteza (ABE, 2008). .... 79 Figura 22 : Divisão do QUPC em 12 regiões (ABE, 2008). .................................. 80 Figura 23: Diagrama do Para-Analizador (ABE, 2008). ........................................ 83 Figura 24: Neurônio Biológico (BARRETO, 2008) ................................................ 86 Figura 25: Sentido de propagação dos impulsos nervosos (BARRETO, 2008) .... 87 Figura 26: Balanço energético realizado no corpo celular (BARRETO, 2008). ..... 87 Figura 27: Neurônio Biológico em funcionamento (BARRETO, 2008). ................. 88 Figura 28: Neurônio Artificial M-P (McCulloch-Pitts) (BARRETO, 2008)............... 89 Figura 29: Representação dos dendritos, M-P (McCulloch-Pitts) (BARRETO, 2008) ............................................................................................................................. 90 Figura 30: Representação das sinapses, M-P (McCulloch-Pitts) (BARRETO, 2008).................................................................................................................... 90 Figura 31: Representação do corpo celular, M-P (McCulloch-Pitts) (BARRETO, 2008).................................................................................................................... 91 Figura 32 : Representação do corpo celular, M-P (McCulloch-Pitts) (BARRETO, 2008).................................................................................................................... 91 Figura 33 : Análise Geométrica, M-P (McCulloch-Pitts) (BARRETO, 2008) ......... 92 Figura 34: Análise Geométrica (Eq. 1), M-P (McCulloch-Pitts) (BARRETO, 2008).................................................................................................................... 92 12 Figura 35: Análise Geométrica (Eq. 2), M-P (McCulloch-Pitts) (BARRETO, 2008).................................................................................................................... 93 Figura 36 : Análise Geométrica (separação de classes), M-P (McCulloch-Pitts) (BARRETO, 2008) ............................................................................................... 93 Figura 37: Esquema básico de Rede Neural Artificial clássica. Entradas: são sinais de entradas; Pesos: balanceiam os dados de entrada de acordo com sua relevância; Neurônios intermediários: realizam os cálculos do processamento; Neurônios de saída: preparam os dados processados para a saída. Saídas: são os valores resultantes do processamento (LOPES, 2009). ....................................... 96 Figura 38: Para-Analisador Simplificado (DA SILVA FILHO & ABE, 1999). .......... 97 Figura 39 : Célula Artificiai Paraconsistentes Básica (DA SILVA FILHO & ABE, 1999).................................................................................................................. 100 Figura 40: Família de Células Neurais Artificiais Paraconsistentes CNAP’s (DA SILVA FILHO & ABE, 1999). .............................................................................. 101 Figura 41: Desenvolvimento da Rede Neural Artificial Paraconsistente (DA SILVA FILHO & ABE, 1999) .......................................................................................... 105 Figura 42: Fluxograma da Célula Artificial Paraconsistente Básica (DA SILVA FILHO & ABE, 1999) .......................................................................................... 106 Figura 43: Representação gráfica da relação entre verdadeiros positivos (VP), falsos positivos (FP), falsos negativos (FN) e verdadeiros negativos (VN). (BASSETT, 2000) .............................................................................................. 116 Figura 44: Curva ROC representativa para mamografia. (BASSETT, 2000) ...... 120 Figura 45 : Modelo esquemático utilizado no entendimento da curva ROC. As duas Gaussianas representam as distribuições de densidade de probabilidade do grau de confiança que um radiologista tem ao fazer um diagnóstico positivo. A reta vertical traçada nas Gaussianas e um possível “limiar de confiança” que separa diagnósticos positivos dos positivos (SOUZA, 2009)(ESPÍRITO-SANTO, 2004).................................................................................................................. 125 Figura 46: Curvas ROC típicas que podem resultar a partir da análise de mamografias. P11 e P21 são postos particulares de operação respectivamente das curvas ROC1 e ROC2(ESPÍRITO-SANTO, 2004). ............................................. 128 Figura 47: Acer Aspire 5738-6294 (Fonte: Acer Inc.) ......................................... 151 Figura 48: Modelo de Processo de Negócio Macro do Classificador Paraconsistente (construído pelo autor). ...................................................................................... 153 Figura 49: Processo Geral de Classificação do Classificador Paraconsistente (construído pelo autor). ...................................................................................... 156 13 Figura 50: Região bem definida entre Benignos e Malignos (construído pelo autor). ........................................................................................................................... 157 Figura 51: Linha de Balizamento do Classificador (construído pelo autor). ........ 159 Figura 52: Resultado apresentado como 75% para Benigno e valores de balizamento (construído pelo autor). .................................................................. 159 Figura 53: Cadastro de Amostras – Série 6 (Massas Mamográficas e Tumores) (construído pelo autor). ...................................................................................... 161 Figura 54: Treinamento da Série 6 (Massas Mamográficas e Tumores) para amostras Benignas (construído pelo autor). ....................................................... 162 Figura 55: Padrão Aprendido – Série 6 (Massas Mamográficas e Tumores) (construído pelo autor). ...................................................................................... 162 Figura 56: Balizamento de uma amostra Benigna - Série 6 (Massas Mamográficas e Tumores) (construído pelo autor). ................................................................... 163 Figura 57: Resultado Maligno de uma classificação bem sucedida (construído pelo autor). ................................................................................................................ 164 Figura 58: Arquitetura – Classificador Paraconsistente (construído pelo autor). 167 Figura 59: Arquitetura da RNAP (construído pelo autor). ................................... 168 Figura 60: Diagrama de Sequência - Cadastro de Amostras (construído pelo autor). ........................................................................................................................... 169 Figura 61: Diagrama de Sequência - Treinamento da RNAP (construído pelo autor). ........................................................................................................................... 170 Figura 62: Diagrama de Sequência - Classificação da RNAP (construído pelo autor). ........................................................................................................................... 171 Figura 63: Modelo Entidade Relacionamento – RNAP (construído pelo autor). . 173 14 LISTA DE TABELAS Tabela 1: Apresenta os estados lógicos extremos e símbolos com os respectivos valores de Graus de Evidência Favorável e Desfavorável (ABE J. M., 2011) ....... 77 Tabela 2: Estados Lógicos Não-Extremos (ABE J. M., 2011). .............................. 81 Tabela 3: Qualidade do diagnóstico em relação à área da curva ROC (SOUZA P. R., 2009) ............................................................................................................ 176 Tabela 4: : Área sob a curva ROC para o teste 1 (construído pelo autor). ......... 177 Tabela 5: Área sob a curva ROC para o teste 2 (construído pelo autor). ........... 179 Tabela 6: Área sob a curva ROC para o teste 3(construído pelo autor). ............ 180 15 LISTA DE QUADROS Quadro 1: Causas de Falso Negativo (PASQUALETTE, 1998). ........................... 45 Quadro 2: Auditória Mamográfica Essencial ou Básica; Dados Brutos e Deduzidos Minimante Desejados. (BASSETT, 2000) .......................................................... 112 Quadro 3: Auditória Mamográfica Mais Completa; Dados Brutos a Serem Coletados. (BASSETT, 2000) ............................................................................ 113 Quadro 4: Auditória Médica mais Completa: Dados Derivados a Serem Calculados. (BASSETT, 2000) .............................................................................................. 114 Quadro 5: Análise dos dados de auditória médica: metas desejáveis. (BASSETT, 2000).................................................................................................................. 121 16 LISTA DE GRÁFICOS Gráfico 1: Resultado do teste com atributos de forma para calcificação (construído pelo autor). ......................................................................................................... 177 Gráfico 2: Resultado do teste com todos os atributos de imagens para massas mamográficas e tumores (construído pelo autor). .............................................. 178 Gráfico 3: Resultado do teste com atributos de imagens para massas mamográficas e tumores, conjunto C1 (construído pelo autor).................................................. 179 Gráfico 4: Resultado do teste com atributos de imagens para massas mamográficas e tumores, conjunto C2 (construído pelo autor).................................................. 180 Gráfico 5: Resultado do teste com atributos de imagens para massas mamográficas e tumores, conjunto C3 (construído pelo autor).................................................. 181 Gráfico 6: Resultado do teste com atributos de imagens para massas mamográficas e tumores, conjunto C5 (construído pelo autor).................................................. 182 Gráfico 7: Resultado do teste com atributos de imagens para massas mamográficas e tumores, conjunto C5 (construído pelo autor).................................................. 183 Gráfico 8: Resultado do teste com atributos de imagens para massas mamográficas e tumores, conjunto C6 (construído pelo autor).................................................. 184 17 LISTA DE ABREVIATURAS E SIGLAS ACR American College of Radiology ACS American Cancer Society ART2 Adaptive Resonance Theory (Teoria da Ressonância Adaptativa), uma evolução das redes ART e ART1 ART2LDA Adaptive Resonance Theory and Linear Discriminats Analyzer (Teoria da Ressonância Adaptativa e Analisador de Discriminação Linear) ART-EMAP Adaptive Resonance Theory with Enhanced Self Organized Mapping (Teoria da Ressonância Adaptativa com Mapeamento Autorganizável Reforçado) ARTMAP Adaptive Resonance Theory with Self Organized Mapping (Teoria da Ressonância Adaptativa com Mapeamento Autorganizável) ARTMAP-IC Adaptive Resonance Theory with Enhanced Self Organized Mapping and Inconsistent Cases Mapping (Teoria da Ressonância Adaptativa com Mapeamento Autorganizável e Casos Incosistentes) BCDDP Breast Cancer Detection Demonstration Project BI-RADS Breast Imaging Reporting and Data System CAD Computer-Aided Diagnosis (Diagnóstico Auxiliado por Computador) CAPb Célula Artificial Paraconsistente Básica CNAPb Célula Neural Artificial Paraconsistente Básica IC Incidência Craniocaudal CLS Curvilinear Structures CRACON Centro de Referência de Alta Complexidade em Oncologia EA Evolutionary Algorithms (Algoritmos Evolutivos) EANN Evolutionary Artificial Neural Network (Rede Neural Artificial Evolutiva) 18 EEB Equação Estrutural Básica FN Frações de falsos negativos FP Frações de falsos positivos GA Genetic Algorithmic (Algoritmo Genético) HIP Health Insurance Plan LDA Linear Discriminat Analysis (Analisador de Discriminação Linear) MLO Mediolateral Oblíqua MLP Multi-Layer Perceptron (Rede Neural de múltiplas camada com reto alimentação) MQSA Mammography Quality Standards Act NCI National Cancer Institute PCA Principal Component Analysis RBF Radial Base Functions (Funções de Bases Radias) ROC Receiver Operating Characteristic (Gráfico da Característica de Operação). ROIs Regiões de interesse RNAP Rede Neural Artificial Paraconsistente RNA Rede Neural Artificial SEER The Surveillance, Epidemiology, and End Results SUS Sistema Único de Saúde VN Frações de verdadeiros negativos VP Frações de verdadeiros positivos 19 LISTA DE SÍMBOLOS Ac: Medida do gradiente para a Acutance C: Fator de forma para a compactação F: Estado Lógico Extremo Falso f: Fator de forma para a descrição de Fourier Fcc: Fator de forma para concavidade fracionária Fn (n = 1, 2, ... 12): medida de textura Gce: Grau de certeza Gin: Grau de incerteza I: Estado Lógico Indefinido m: Fator de forma para o momento QF T: Estado Lógico Não-Extremo Quase-Falso tendendo ao Inconsistente QF Estado Lógico Não-Extremo Quase-Falso tendendo ao Paracompleto QV T: Estado Lógico Não-Extremo Quase-Verdadeiro tendendo ao Inconsistente QV Estado Lógico Não-Extremo Quase-Verdadeiro tendendo ao Paracompleto SI: Índice de forma espiculada T: Estado Lógico Extremo Inconsistente TF: Estado Lógico Não-Extremo Inconsistente tendendo ao Falso TV: Estado Lógico Não-Extremo Inconsistente tendendo ao Verdadeiro V: Estado Lógico Extremo Verdadeiro Vcfa: Valor de controle de falsidade 20 Vcic: Valor de controle de inconsistência Vcpa: Valor de controle de paracompleteza Vcve: Valor de controle de veracidade : Estado Lógico Extremo Paracompleto V: Estado Lógico Não-Extremo Paracompleto tendendo ao Verdadeiro F: Estado Lógico Não-Extremo Paracompleto tendendo ao Falso : Evidência Desfavorável : Evidência Favorável 21 SUMÁRIO CAPÍTULO 1 - INTRODUÇÃO --------------------------------------------------------------------- 23 1.1 Origem do Trabalho------------------------------------------------------------------------------------- 23 1.2 Apresentação --------------------------------------------------------------------------------------------- 24 1.3 Objetivos -------------------------------------------------------------------------------------------------- 29 1.4 Justificativa ----------------------------------------------------------------------------------------------- 30 1.5 Procedimentos Metodológicos ------------------------------------------------------------------------ 31 1.6 Escopo do Trabalho ------------------------------------------------------------------------------------- 31 1.7 Estrutura do Trabalho ----------------------------------------------------------------------------------- 32 CAPÍTULO 2 - REVISÃO BIBLIOGRÁFICA ---------------------------------------------------- 33 2.1 Mamografia ----------------------------------------------------------------------------------------------- 33 2.2 CAD (Compter-Aided Diagnosis) -------------------------------------------------------------------- 54 2.3 Lógica Paraconsistente --------------------------------------------------------------------------------- 67 2.4 Lógica Paraconsistente Anotada Evidencial E --------------------------------------------------- 68 2.5 Redes Neurais Artificiais Paraconsistentes --------------------------------------------------------- 85 2.6 Medidas de Qualidade no Diagnóstico ------------------------------------------------------------ 111 2.7 Estado da Arte ------------------------------------------------------------------------------------------ 129 CAPÍTULO 3 – MATERIAIS E MÉTODO ----------------------------------------------------- 150 3.1 Recursos específicos aplicados ao desenvolvimento ------------------------------------------- 150 CAPÍTULO 4 – Testes Comparativos ---------------------------------------------------------- 174 4.1 Conjuntos de Atributos Mamográficos utilizados nos testes ---------------------------------- 174 4.2 Caracterização dos atributos de imagens ---------------------------------------------------------- 175 4.3 Métodos de treinamento e teste dos classificadores -------------------------------------------- 175 4.4 Testes Comparativos ---------------------------------------------------------------------------------- 176 4.5 Testes utilizando a base de dados BD1 ------------------------------------------------------------ 177 22 4.6 Testes utilizando a base de dados BD2 ------------------------------------------------------------ 178 CAPÍTULO 5 – AVALIAÇÃO DOS RESULTADOS ----------------------------------------- 185 CAPÍTULO 6 – CONCLUSÕES ----------------------------------------------------------------- 187 REFERÊNCIAS BIBLIOGRÁFICAS ------------------------------------------------------------ 189 APÊNDICE A - BASE DE DADOS 1: CALCIFICAÇÕES --------------------------------- 199 APÊNDICE B - BASE DE DADOS 2: MASSAS MAMOGRÁFICAS E TUMORES 202 23 CAPÍTULO 1 - INTRODUÇÃO 1.1 Origem do Trabalho A base para o desenvolvimento deste trabalho é a revisitação da tese de doutorado (ESPÍRITO-SANTO, 2004), de onde foram extraídos os dados utilizados nas simulações e os estudos de casos com classificadores de populações para efeito de comparação de resultados na temática diagnóstico do câncer de mama. Em (ESPÍRITO-SANTO, 2004), foi desenvolvido um discriminador de classes implementado segundo técnicas de otimização não linear e combinatória, associadas à capacidade de classificação das Funções de Bases Radiais (RBF’s). Comparou-se o desempenho do classificador com diversas abordagens de classificação, utilizando como estudo de caso calcificações e massas mamográficas (benignas ou malignas): o Multi-Layer Perceptron (MLP), um classificador de duplo estágio (ART2LDA), fundamentado na Teoria da Ressonância Adaptativa - Adaptive Resonance Theory (ART) e Discriminação Linear (LDA) - que aceitam treinamentos supervisionados e não supervisionados. Os classificadores foram treinados com uma base de dados constituída de 143 calcificações (79 malignas e 64 benignas), descritas em termos de fatores de forma. Os classificadores também foram treinados com uma base de dados contendo 57 regiões de interesse (37 malignas e 20 benignas) que descrevem as complexidades das massas e tumores a partir de fatores de forma, transição de bordas e medidas de textura. Adotou-se a metodologia leave-one-out nos treinamentos. Os desempenhos dos classificadores em discriminar casos benignos e malignos foram comparados em termos da área sob curva ROC (Receiver Operating Characteristic) (Az). Quanto maior o valor de Az, melhor é o desempenho do classificador. Os experimentos com calcificações mostram que o melhor resultado é o obtido com o RBF-Simulated Annealing (Az = 0,97), pois o valor de Az encontrado tem maior magnitude que os valores computados para os classificadores MLP (Az = 0,70) e ART2LDA (Az = 0,71). Nos experimentos com massas e tumores, os desempenhos dependem da dimensão dos casos exemplos empregados nos treinamentos dos classificadores. O melhor desempenho observado em casos exemplos de três 24 dimensões é o do MLP (Az = 0,994), pois o valor de Az desse classificador é maior que os valores de Az obtidos com o RBF-Simulated Annealing (Az = 0,912) e o ART2LDA (Az = 0,901). Com casos exemplos de oito dimensões o RBF-Simulated Annealing. (Az = 0,999) teve melhor desempenho que o MLP (Az = 0.982) e o ART2LDA (Az = 0.885). 1.2 Apresentação O câncer da mama é o tipo de câncer que mais acomete as mulheres em todo o mundo, tanto em países em desenvolvimento quanto em países desenvolvidos. Cerca de 1,4 milhão de casos novos dessa neoplasia foi esperado para o ano de 2008, em todo o mundo, o que representa 23% de todos os tipos de câncer. (INCA, 2011 (A)). O aumento, mesmo em áreas de tradicional baixa incidência, em grande parte está relacionado com as mudanças nos hábitos de vida e no perfil epidemiológico da população. Vários países desenvolvidos têm conseguido, apesar desse aumento na incidência, reduzir a sua mortalidade, através de um diagnóstico precoce e de um tratamento mais eficaz (PAULINELLI, 2003). A sua incidência é maior na América do Norte e no Norte da Europa; intermediária no restante da Europa e na América do Sul, e menor na Ásia e nos países menos desenvolvidos (PAULINELLI, 2003). A incidência padronizada pela população mundial, ajustada por idade, chega a 127 e 128/100.000 mulheres em algumas regiões do norte dos EUA e no Havaí, ao passo que na China e na África a incidência é de apenas 17 e 21/100.000, respectivamente (PAULINELLI, 2003). Em 2012, o câncer de mama liderou as ocorrências de câncer em todos os países da Europa. Há uma variação de três vezes (49-148 por 100 mil) com um claro padrão geográfico. Altas taxas de incidência foram estimadas em países da Europa Ocidental, na Bélgica (147), França (137) e Holanda (131); no Norte da Europa, especialmente no Reino Unido (129) e nos países nórdicos, Dinamarca (143), Islândia (131) e Finlândia (121). As taxas de incidência em países do Leste Europeu foram a Ucrânia (54) e Moldávia (53). As taxas de mortalidade mais altas no Norte (por exemplo, Bélgica (29), Dinamarca (28)) e no Sul (por exemplo, Sérvia (31), Macedónia 25 (36)) (FERLAY, 2013). Para Brasil, houve 52.680 casos novos de câncer de mama, com um risco estimado de 52 casos a cada 100 mil mulheres (INCA, 2011 (A)). A idade continua sendo o principal fator de risco para o câncer de mama. As taxas de incidência aumentam rapidamente até os 50 anos e, posteriormente, esse aumento ocorre de forma mais lenta. Outros fatores de risco já estão bem estabelecidos, como, por exemplo, aqueles relacionados à vida reprodutiva da mulher (menarca precoce, nuliparidade, idade da primeira gestação acima dos 30 anos, anticoncepcionais orais, menopausa tardia e terapia de reposição hormonal), histórico familiar de câncer de mama e alta densidade do tecido mamário, isto é, razão elevada entre o tecido glandular e o tecido adiposo da mama. Além desses fatores, a exposição à radiação ionizante, mesmo em baixas doses, também é considerada um fator de risco, particularmente durante a puberdade, segundo mostram alguns estudos (INCA, 2011 (A)). Apesar de ser considerado um câncer de prognóstico relativamente bom se diagnosticado e tratado oportunamente, as taxas de mortalidade por câncer de mama continuam elevadas no Brasil, muito provavelmente porque a doença ainda é diagnosticada em estágio avançado. A sobrevida média após cinco anos na população de países desenvolvidos tem apresentado um discreto aumento, cerca de 85%. Entretanto, nos países em desenvolvimento, a sobrevida fica em torno de 60%. (INCA, 2011 (A)). Mulheres com câncer de mama em estágio inicial que recebem tratamento no Brasil podem ter a mesma sobrevida de pacientes tratadas nos Estados Unidos, revelou um estudo feito na Faculdade de Medicina da Universidade Estadual Paulista (UNESP), de Botucatu. O estudo, iniciado em 2011, levantou dados de pacientes diagnosticadas entre 1998 e 2001, para que pudessem ser observadas as taxas de sobrevida após 10 anos do início do tratamento (BRASIL, 2013). Apesar da igualdade de chances na expectativa de vida entre as pacientes dos dois países, a falta do diagnóstico precoce faz com que a mortalidade brasileira permaneça ainda muito superior à norte-americana, explica o autor da pesquisa, René Aloísio da Costa Vieira, mastologista do Hospital do Câncer de Barretos (BRASIL, 2013). O médico usou dados de cerca de 47 mil pacientes dos Estados Unidos, obtidos no programa The Surveillance, Epidemiology, and End Results (SEER), que 26 representa 28% da população do país. Ele comparou com informações de 834 pacientes do Hospital do Câncer de Barretos (SP), considerado Centro de Referência de Alta Complexidade em Oncologia (Cracon), que atende basicamente pelo Sistema Único de Saúde (SUS) e existe há 50 anos (BRASIL, 2013). O levantamento mostrou que 50,1% das mulheres diagnosticadas com câncer de mama nos Estados Unidos encontravam-se no estágio inicial da doença, com tumores menores do que dois centímetros e ainda não palpáveis. No Brasil, porém, os diagnósticos nesse estágio precoce ocorreram em apenas 10% dos casos. O médico esclarece que é muito importante que a doença seja descoberta exatamente nesse ponto, de forma precoce, uma vez que as chances de cura a partir de um tratamento nesse estágio chegam a 90% (BRASIL, 2013). A detecção do câncer de mama em estágio mais avançado foi observada, a partir do levantamento, em 45,8% das pacientes brasileiras e em somente 8,4% das norteamericanas. Nesse nível mais adiantado da doença, a taxa de sobrevida após 10 anos cai para apenas 17% dos casos. “No Brasil, demora-se mais para chegar ao médico e o tamanho do tumor é maior” (BRASIL, 2013). No mundo, os países desenvolvidos como os Estados Unidos têm uma relação de 19 mortes por câncer de mama para cada 100 pacientes diagnosticadas com a doença. Na América do Sul, essa proporção sobe para 29,8 mortes. No continente africano, a situação é ainda pior, pois para cada 100 mulheres com a doença, 60 morrem (BRASIL, 2013). A mamografia é a melhor ferramenta disponível para a detecção precoce do câncer de mama. Pode revelar evidências de anormalidades, como massas e calcificações, sinais sutis, como assimetria bilateral e distorção da arquitetura. O rastreamento mamográfico demonstrou ser eficaz na redução das taxas de mortalidade por câncer de mama: programas de rastreio têm reduzido as taxas de mortalidade entre 30-70% (RANGARAJ, FABIO, & DESAUTELS, 2007). Pelos padrões norte-americano e europeu, as mulheres entre 40 e 49 anos fazem o exame anualmente e, entre 50 e 69 anos, fazem a cada dois anos. A Sociedade Brasileira de Mastologia recomenda uma regularidade ainda maior, mulheres entre 40 e 69 anos de idade devem submeter-se ao exame uma vez por ano. Para que o diagnóstico precoce dos tumores de mama se torne uma realidade no país, o sistema 27 de saúde precisaria investir nos mamógrafos. “Precisaria melhorar a rede de mamografia” (INCA, 2011 (A)). Mamografias são difíceis de interpretar, especialmente no contexto de rastreio. A sensibilidade da mamografia é afetada pela qualidade de imagem e nível de conhecimento do radiologista. Outro fator que afeta o desempenho de um radiologista é o elevado volume de processos analisados em um programa de triagem. A falta de radiologistas especialistas para analisar as mamografias em áreas remotas ou rurais é também um motivo de preocupação. A má interpretação dos sinais de câncer de mama foi responsável por 52% dos erros. Tecnologia de diagnóstico auxiliado por computador (CAD) pode melhorar o desempenho dos radiologistas, aumentando a sensibilidade às taxas comparáveis aos obtidos por dupla leitura. O foco das pesquisas está voltado para o desenvolvimento de imagens digitais e sistemas de análise de imagem que possam detectar as características mamográficas, classificá-las e fornecer alertas visuais aos radiologistas (RANGARAJ, FABIO, & DESAUTELS, 2007). A revisão bibliográfica realizada neste trabalho apresenta uma realidade em que o erro de diagnóstico pode estar em qualquer etapa do processo, nos equipamentos, graças à falta de manutenção adequada, nos técnicos e nos médicos, graças à falta de treinamento e rigor na utilização dos protocolos, na hesitação em se reconvocar uma paciente para a realização de um novo exame no caso de dúvida e na falta de controles de auditagem em que falhas possam ser identificadas, corrigidas ou penalizadas de forma adequada. Em (CADY & CHUNG, 2005) discutiu-se a validade dos programas de rastreio mamográfico, com destaque para a redução da mortalidade conseguida por vários programas de triagem na Suécia, Holanda, Reino Unido, Finlândia, Itália e EUA. As desvantagens da triagem também são discutidas, isto é, a maior incidência de biópsias desnecessárias, o custo e a qualidade da interpretação das mamografias contra a experiência dos radiologistas, e os efeitos psicológicos dos erros, tal como a ansiedade causada por um resultado falso-positivo e a garantia indevida fornecida por um teste falso-negativo. Os benefícios do rastreio superam os inconvenientes, e a prática do rastreamento mamográfico deve ser incentivada e expandida (CADY & CHUNG, 2005). 28 Levando-se em consideração que apenas 30% dos casos indicados para biópsia são confirmados (RANGAYYAN, MUDIGONDA, & DESAUTELS, 2000); (ESPÍRITOSANTO, 2004) a utilização de métodos capazes de aumentar a distinção entre massas benignas e tumores malignos, sem reduzir a sensibilidade da mamografia em detectar câncer de mama são de fundamental importância. Tais métodos funcionariam como ferramentas de apoio à decisão que os radiologistas empregariam na análise das mamografias. Fazendo uma associação entre necessidade e empregabilidade, o diagnóstico auxiliado por computador pode ser definido como um diagnóstico feito por um médico que utiliza o resultado de análises quantitativas automatizadas de imagens como uma segunda opinião para a tomada de decisões diagnosticadas. A finalidade do CAD (Computer-Aided Diagnosis) é melhorar a acurácia do diagnóstico, assim como a consistência de interpretação da imagem, mediante o uso da resposta do computador como referência. A resposta do computador pode ser útil, uma vez que o diagnóstico do especialista é baseado em avaliação subjetiva, estando sujeito a variações intra e interpessoais, e a perda de informação devido à baixa qualidade da imagem, sobreposição de estruturas, fadiga visual ou distração. Além disso, uma dupla leitura (por dois especialistas) pode aumentar a sensibilidade do diagnóstico. A proposta do CAD é funcionar como um segundo especialista (RODRIGO, IÁLIS, & FÁTIMA, 2011). Dentro desse cenário, um sistema de CAD apresenta-se sob dois aspectos distintos: A representação dos aspectos morfológicos, de um mamograma em termos de parâmetros métricos: fatores de forma, definição de borda e texturas. Classificação dos atributos em malignos e benignos. Um mamograma exibe uma variedade de texturas correspondendo a parênquimas, gorduras, tecidos normais, tecidos anormais, calcificações e massas (TÚLIO & RANGAYYAN, 2003); (RANGAYYAN, SHEN, & DESAUTELS, 1993). Em mamografia, massas benignas e malignas apresentam texturas diferentes (HILLARY, RANGAYYAN, & DESAUTELS, 2003). A análise das texturas pode ser usada para concluir se o material (massa) analisado é benigno ou maligno (ESPÍRITO-SANTO, 2004). 29 Outras abordagens capazes de identificar ocorrências malignas são medidas de transição de borda (TÚLIO & RANGAYYAN, 2003) e os fatores de forma. As medidas de transição de borda caracterizam a mudança de intensidade da borda da massa. Os fatores de forma descrevem ocorrências associadas com a forma das massas ou das calcificações (RANGAYYAN, SHEN, & DESAUTELS, 1993). Os fatores de formas usados para descrever as complexidades das calcificações são: compactação (C), descrição de Fourier (f) e momento (m). Já os fatores de forma normalmente empregados na caracterização das massas são: compactação (C), descrição de Fourier (f), concavidade fracionária (Fc) e Índice de forma espiculada (SI) (ESPÍRITOSANTO, 2004). A classificação de texturas em malignos e benignos é feita a partir de implementações computacionais, tais como as Redes Neurais Artificiais de classificação de atributos de imagens. Fazendo uso dessas informações, as Redes Neurais Artificiais são capazes de detectar a ocorrência de patologias (câncer de mama) (ESPÍRITO-SANTO, 2004). Isso mostra a importância dos classificadores de atributos de imagens no desenvolvimento de um sistema CAD. A partir de uma população de atributos de imagens (fatores de forma, texturas e transição de borda, por exemplo), o classificador pode fazer a exata classificação, selecionando elementos com características comuns e agrupando-os em sub-populações distintas (ESPÍRITO-SANTO, 2004). 1.3 Objetivos 1.3.1 Objetivo Geral O objetivo deste trabalho é o desenvolvimento de um Classificador Paraconsistente aplicável no processo de diagnóstico do câncer de mama, permitindo o emprego da dupla leitura (especialista + software) e no processo de melhoria continua dos profissionais envolvidos no processo de diagnóstico. 30 1.3.2 Objetivo Complementar Oferecer ao usuário do Classificador Paraconsistente uma interface capaz de gerar laudos mamográficos e informações relativas a qualidade dos laudos gerados de forma individualizada. 1.3.3 Objetivos Específicos Implementar o principal componente da ferramenta CAD, ou seja, uma Rede Neural Artificial Paraconsistente adequada à aprendizagem, armazenagem e classificação de padrões obtidos a partir de atributos de imagens mamográficas. Ao receber dados extraídos de uma mamografia, a rede deverá ser capaz de classificar suas características e sugerir sua tendência de acometimento de câncer de mama. Melhorar a especificidade do resultado através da utilização de um algoritmo que permita reduzir a faixa de indefinição entre os valores benignos e malignos. Comparar os resultados obtidos pelo Classificador Paraconsistente com os resultados alcançados por outros classificadores, que utilizam técnicas tradicionais de classificação. Indicar o melhor conjunto de atributos de imagens associado à rede neural artificial paraconsistente. 1.4 Justificativa Ao se tratar o diagnóstico de câncer de mama como um processo de produção de diagnósticos, a chance de erro fica evidente em toda a cadeia produtiva. Na primeira etapa de produção, as condições gerais do equipamento e a capacidade técnica do 31 operador podem comprometer a qualidade da imagem mamografia. Na segunda etapa, a capacitação do médico e o não cumprimento do protocolo de diagnostico pode afetar o laudo. Com a evolução tecnológica e o emprego do computador nas mais diversas atividades, o software CAD surge como ferramenta adicional ao diagnóstico do câncer de mama. Assim como na mamografia, críticas ao seu emprego surgem em abundância. A revisão bibliográfica aponta para uma taxa de detecção baixa para distorções arquitetônicas, aumenta para massas e atinge quase 100% para microcalcificações. CAD pode ajudar os leitores a diminuir erros de detecção de cânceres, nomeadamente, as que se manifestam como microcalcificações. No entanto, a taxa de falsos positivos é muito alta. Este trabalho se justifica por apresentar uma proposta de auxílio ao diagnóstico do câncer de mama, permitindo o emprego da dupla leitura (especialista + software) e por permitir a incorporação de um processo de melhoria contínua dos médicos radiologistas e técnicos envolvidos no processo de diagnóstico. 1.5 Procedimentos Metodológicos De acordo com os objetivos anteriormente descritos, este trabalho caracterizase como pesquisa aplicada, iniciando-se por pesquisa bibliográfica, identificação de alternativas de implementação e realização de uma série de experimentos práticos, para alcançar à solução pretendida. O desenvolvimento prático serve para validar as pesquisas bibliográficas. 1.6 Escopo do Trabalho O trabalho não contemplará a extração de atributos de imagens diretamente das imagens mamografias. A ferramenta CAD proposta utilizará redes neurais artificiais paraconsistentes para a classificação dos atributos de imagens. 32 O CAD não terá acesso direto a laudos mamográficos de pacientes e para as simulações utilizará duas bases de dados formadas por atributos de imagens que tiveram sua tipificação, em casos benignos e malignos confirmados por biópsia. O CAD fornecerá base estatística aos técnicos e médicos envolvidos no processo de diagnóstico, a fim que possam avaliar seus desempenhos. 1.7 Estrutura do Trabalho O capítulo I aborda a origem e o desenvolvimento do projeto. O capítulo II aborda os conceitos necessários ao desenvolvimento do classificador paraconsistente: Mamografia, CAD, Lógica Paraconsistente, Lógica Paraconsistente Anotada Evidencial E, Redes Neurais Artificiais Paraconsistentes, Medidas de Qualidade no Diagnóstico e Estudo da Arte. O capítulo III descreve o processo de construção do classificador paraconsistente. O capítulo IV apresenta os testes comparativos entre o classificador paraconsistente e os classificadores estudados em (ESPÍRITO-SANTO, 2004). O capítulo V avalia os resultados. No capítulo VI são feitas as considerações finais, nos quais são expostas as conclusões e sugestões para futuros trabalhos. Os apêndices reúnem material de apoio, sendo que o apêndice A corresponde a Base de Dados 1, utilizada para Calcificações, e o apêndice B corresponde a Base de Dados 2, utilizada para Massas Mamográficas e Tumores. 33 CAPÍTULO 2 - REVISÃO BIBLIOGRÁFICA 2.1 Mamografia Dentre as várias modalidades utilizáveis no rastreamento por imagem da mama, a mamografia por raios X tem provado ser mais eficaz para a investigação do câncer de mama. Embora o conceito do uso da mamografia como ferramenta de rastreamento tenha sido aventado por muitos de seus pioneiros, Gershon-Cohen, em 1958, foi o primeiro a realmente investigar seu uso com esta finalidade. Ele concluiu que mamografias periódicos de mulheres acima dos 40 anos mostraram-se benéficos na redução da mortalidade. No entanto, como seus estudos não incluem controles, seu trabalho foi largamente ignorado (BASSETT, 2000). No intuito de determinar a eficácia da mamografia de rastreamento, foram realizados vários estudos clínicos prospectivos de larga escala. O primeiro deles foi conduzido de 1963 a 1967 sob os auspícios do Health Insurance Plan (HIP) de Nova Iorque. Organizado por Philip Strax, Louis Venet e Sam Shapiro, o propósito do estudo era determinar se o rastreamento mamográfico e o exame clínico periódico poderiam diminuir a mortalidade por câncer de mama. As mulheres no estudo eram igualmente divididas entre o grupo de controle e o grupo de estudo. Ás do grupo de estudo revelaram que, comparadas ao grupo de controle, as mulheres rastreadas tiveram uma diminuição de 30% na mortalidade global; uma diminuição de 50% na mortalidade foi observada nas mulheres que entraram no estudo aos 50 anos ou mais. Embora a mortalidade tenha sido reduzida em 23% entre as mulheres rastreadas que estavam abaixo dos 50 anos, este número perdeu o significado em função do número inadequado de mulheres neste grupo etário (BASSETT, 2000) (PASQUALETTE, 1998) . Com relação ao benefício de rastrear mulheres entre 40 e 49 anos, uma redução em sua mortalidade por câncer de mama comparada com a do grupo de controle na mesma variação de idade foi encontrada em cinco entre oito avaliações aleatórias. A redução da mortalidade na avaliação de Edinburgh foi de 22%, na do HIP, 23%, na de Kopparkerg, Suécia, 49%, na de Malmo, Suécia, 49% e 40% em 10 anos na de Gothenburg, Suécia. O vigor do benefício na avaliação de Gothenburg deveu- 34 se a sua significância estatística e o fato que 30% das mulheres que morreram de câncer de mama entre aquelas às quais foi oferecido o rastreamento, efetivamente o tinham recusado, embora tenham sido ainda assim computadas como rastreadas (BASSETT, 2000). O sucesso do estudo HIP resultou no Breast Cancer Detection Demonstration Project (BCDDP), co-patrocinado pelo National Cancer Institute (NCI) e pela American Cancer Society (ACS). Este programa, encarregado de demonstrar a utilidade da mamografia anual em mulheres entre os 35 e os 74 anos, na comunidade, começou em 1974 e durou 5 anos. Embora a falta de um grupo de controle impedisse conclusões definitivas, os dados coletados refletiram os avanços na momografia desde o estudo HIP. A mamografia detectou 91% de todos os cânceres encontrados no curso do estudo. Destes casos, a mamografia dos cânceres para os quais o exame físico foi negativo detectou 42% (comparados aos 33% do HIP), enquanto que o exame físico dos cânceres para os quais o mamografia foi negativo, detectou somente 9% (comparados a 4% no estudo HIP). Um terço dos cânceres do estudo BCDDP eram não infiltrantes ou infiltrantes com menos de 1 cm, enquanto que nenhum dos cânceres do estudo do HIP tinha menos de 1 cm. Além disso, estes pequenos cânceres foram detectados em mulheres de todas as idades (BASSETT, 2000) (PASQUALETTE, 1998). Estudos nos Estados Unidos e na Europa mostram claramente o valor da mamografia de rastreamento nas mulheres assintomáticas. Sensíveis aos resultados destes estudos, vários grupos médicos estabeleceram linhas de conduta para o rastreamento. Em 1976, o American College of Radiology (ACR) tornou-se o primeiro grupo a adotar essas linhas de conduta. O ACR recomenda que as mamografias sejam realizadas com 1 ou 2 anos de intervalo para mulheres abaixo dos 50 anos e anualmente para mulheres com 50 anos. Em 1977, o NCI e o ACS recomendaram que mulheres de 39 anos ou menos registradas no BCDDP sejam rastreadas somente se tiverem história pessoal ou familiar de câncer de mama (BASSETT, 2000) (PASQUALETTE, 1998). Em 1989, o ACS, o NCI e nove outras organizações se uniram no intuito de uniformizar as linhas de conduta: o rastreamento deveria começar aos 40 anos com um mamografia a cada 1-2 anos até os 50 anos, quando passariam a ser feitos anualmente. As diferenças importantes das linhas de conduta anteriores foram o 35 mamografia basal e o grande apoio ao rastreamento de mulheres entre os 40 e os 49 anos (BASSETT, 2000) (PASQUALETTE, 1998). A subutilização generalizada do rastreamento mamográfico nos Estados Unidos, inicialmente observado em 1955, era ainda presente em 1987, quando estudos revelaram que apenas 15% a 20% das mulheres americanas acima dos 50 anos já fizeram um mamografia. Isso leva a tentar identificar as barreiras ao rastreamento mamográfico. Em 1985, um estudo com 257 mulheres de Michigan revelou que somente 19% das mulheres entre 35 e 49 anos e 25% da mulheres de 50 anos ou mais já realizaram um mamografia, e que somente 34% estavam cientes dos parâmetros recomendados para as mulheres com 50 anos ou mais. O estudo também indicou que 48% da mulheres planejaram realizar mamografias baseadas somente na recomendação de seus médicos, ressaltando a importância da atitude dos médicos na utilização do rastreamento mamográfico. Um estudo revelou que a razão primária pela qual os médicos não recomendam o rastreamento mamográfico foi o risco perceptível de radiação. Outro estudo de atitudes dos médicos revelou que alguns ignoravam os benefícios clínicos da mamografia de rastreamento, e que 72% citaram o alto custo contra o baixo proveito como a maior razão para não recomendar a mamografia para suas pacientes (BASSETT, 2000). Os esforços para reverter essa subutilização generalizada do rastreamento mamográfico incluíram a educação de médicos e pacientes com respeito ao procedimento e sua utilidade em detectar precocemente o câncer da mama e o encontro de meios para reduzir os custos do exame. Com relação à sua segurança, médicos e pacientes foram informados que o desenvolvimento tecnologico reduziu o risco de exposição á radiação, com mamografias de baixa dose, ao ponto deste ser desprezível (BASSETT, 2000). O alto custo da mamografia de rastreamento tem sido um persistente problema. Em 1986, um levantamento de 58 estabelecimentos em Los Angeles revelou que o custo médio de um mamografia era $125 (Cento e vinte e cinco dólares). Para reduzir este custo, os radiologistas começaram a diferenciar entre mamografias de diagnóstico e de rastreamento. As de diagnóstico envolvem um exame mais caro e completo de uma paciente sintomática, com incidências adicionais obtidas de acordo com os sintomas e sinais clínicos, enquanto que o exame de rastreamento é limitado às pacientes assintomáticas e é menos dispendioso, necessitando apenas duas 36 incidências de cada mama. Um crescente número de serviços agora oferece mamografias de rastreamento de baixo custo. Outro recurso para a redução de custos é o uso de unidades móveis para rastreamento mamográfico, desenvolvido e implementado com sucesso primeiramente por Philip Strax no final dos anos 60 (BASSETT, 2000). O resultado desses esforços foi o aumento do uso do rastreamento e diagnóstico mamográficos ao ponto de, em 1993, aproximadamente 74% de todas as mulheres de 40 anos ou mais haviam feito pelo menos uma mamografia (BASSETT, 2000). A utilidade da mamografia é altamente dependente do uso apropriado do equipamento específico para mamografia e da habilidade diagnóstica de quem interpreta o exame (BASSETT, 2000). 2.1.1 No Brasil O controle do câncer de mama é uma prioridade da política de saúde brasileira e foi incluído como uma das metas do Pacto pela Saúde (2006), cujo objetivo é o fortalecimento, a integração e a incorporação do Sistema Único de Saúde, através de estratégias de corresponsabilização dos gestores federais, estaduais e municipais (INCA, 2007). Desde 2004, quando foi divulgado o Controle do Câncer de Mama: Documento de Consenso (INCA, 2004), as ações governamentais têm se orientado para oferecer à população o acesso a procedimentos de detecção precoce dessa doença em quantidade e qualidade adequadas. O Projeto Piloto de Garantia de Qualidade de Mamografia, iniciado em 2006, é uma dessas ações e assume importância estratégica para a organização bem sucedida do rastreamento populacional do câncer de mama. 2.1.2 Equipamento Radiológico A qualidade da imagem mamográfica depende do equipamento de mamografia, do sistema receptor de imagem e do processamento do filme. Pela lei, toda mamografia deveria ser feita em equipamentos exclusivos para esse fim. Uma unidade exclusiva de mamografia é um sistema de raios X projetado especificamente 37 para radiografia de mama (BASSETT, 2000). A figura 1 ilustra os componentes de uma unidade de raio X. Figura 1: Componentes de uma unidade de raios-X exclusiva para mamografia (BASSETT, 2000). 2.1.3 Qualidade da imagem clínica A imagem clínica é o teste final da efetividade de um programa de qualidade em um serviço de mamografia. A qualidade da imagem mamográfica é um combinado de contraste, resolução, nitidez e ruído. Cada componente da unidade de raios X afeta significativamente a qualidade global da imagem. Por exemplo, a qualidade do posicionamento da mama e as incidências que podem ser obtidas são afetadas pelo desenho e pela capacidade de rotação do braço em C e pela forma e flexibilidade do dispositivo de compressão. A qualidade da imagem também depende do sistema receptor de imagem e do processamento do filme (BASSETT, 2000). O contraste da imagem é a diferença na densidade ópitica entre diferentes regiões da imagem mamográfica e depende do contraste do objeto e do contraste do receptor de imagem. O contraste do objeto está relacionado à atenuação do feixe de raios X na medida em que ele passa através da mama. Os componentes da unidade 38 exclusiva que afetam o contraste do objeto incluem a composição do dispositivo de suporte da mama, a composição do rodo do filme e a grade. O constraste do receptor de imagem depende das características do tipo específico de combinação tela intensificadora-filme que é usado, a química de processamento e o tempo que o filme permanece no revelador (BASSETT, 2000). A resolução da imagem, a nitidez e o ruído também são afetados pela unidade de raios X, pelo receptor de imagem e pelo processamento. A resolução espacial da imagem é a capacidade de registrar pequenos objetos muito próximos bem como os separados, uma característica medida em unidades de pares de linhas por milímetro. A nitidez da imagem é a precisão do limite ou contorno de uma estrutura. A resolução e a nitidez são afetadas pelo tamanho do foco, pela distância fonte-imagem, pelo mecanismo de compressão e pelo receptor de imagem. A granulação da radiografia, às vezes chamada ruído, inclui a granulação quântica, a granulação pela tela intensificadora e a granulação do filme. A principal causa de granulação radiográfica é o ruído quântico, que é causado pela flutuação estatística do número de fótons de raios X usados para fazer a imagem. Deste modo, o ruído excessivo pode resultar de exposição inadequada das porções glanulares da mama, de super-processamento do filme ou de uma combinação filme-tela intensificadora muito rápida (BASSETT, 2000). 2.1.4 Anatomia e mobilidade da mama A mama se estende, superiormente, desde a segunda até a sexta constela, inferior; lateralmente, da linha axilar média até o externo, medialmente. A base da mama repousa quase totalmente sobre o músculo peitoral e uma porção significativa do tecido mamário se estende para a axila. Este último segmento da mama, o prolongamento axilar, pode abrigar um carcinoma de mama e deveria ser visualizado durante a mamografia de rastreamento. É importante radiografar o máximo de tecido mamário possível para exames de rastreamento. A mediolateral oblíqua (MLO), que inclui o músculo peitoral e o prolongamento axilar, é a incidência primária para rastreamento, porque pode incluir a maior quantidade de tecido mamário em uma única imagem. No entanto, o tecido medial pode ser excluído em uma MLO apropriadamente realizada. A incidência craniocaudal (CC) quando apropriadamente 39 realizada, pode visualizar todo o tecido medial. Portanto, as incidências-padrão para rastreamento, a MLO e a CC são complementares (BASSETT, 2000). O princípio do tecido móvel versus tecido fixo é usado no posicionamento da mama para maximizar a quantidade de tecido que pode ser visualizada. As regiões lateral e inferior da mama são bordas móveis, enquanto as regiões medial e superior são fixas (Figura 2) (BASSETT, 2000). Figura 2: Bordas fixas versus móveis (BASSETT, 2000). . 2.1.5 Compressão da Mama A compressão apropriada da mama é o principal fator na obtenção de mamografias de alta qualidade. A compressão adequadamente aplicada é um dos fatores mais negligenciados, mas também dos mais importantes que afetam a qualidade da imagem em mamografia. Um objetivo primário da compressão é reduzir a espessura da mama; desta forma, ela é mais uniformemente penetrada pelo feixe de raios X desde a região subcutânea até a parede torácica. Isto é mais bem obtido com um dispositivo rígido de compressão com um ângulo de 90 graus entre as superfícies posterior e inferior. Um dispositivo de compressão com uma borda posterior arredondada ou levemente inclinada não irá comprimir uniformemente o tecido mamário profundo ou prendê-lo firmemente no lugar durante as exposições. Além disso, um contorno reto ao invés de arredondado ao longo da superfície posterior do dispositivo de compressão é recomendado, porque a compressão do tecido 40 mamário deveria ser uniforme ao longo da borda posterior do filme de mamografia, que é reto e não curvo. À medida que a força de compressão é aplicada, a placa de compressão deveria permanecer paralela ao plano do receptor de imagem. Isto é particularmente importante com faixas menos penetrantes de raios X de baixa energia (25-30 kV) que são usados em mamografia de filme-tela intensificadora. A compressão uniforme é menos crítica com a xeromamografia, que usa um feixe de raios X de alta energia (40-50 kV) e um receptor de imagem com uma amplitude maior de resposta de radiação (BASSETT, 2000); (PASQUALETTE, 1998). Há outras razões importantes pelas quais a compressão apropriada é essencial para a mamografia. A compressão reduz a distância objeto-receptor de imagem para uma melhor resolução e separa estruturas dentro da mama, reduzindo a possibilidade de perder uma lesão coberta por outros tecidos ou interpretando erroneamente a superposição de tecidos normais como uma anormalidade. A compressão apropriada resulta em densidade mais uniforme ao reduzir a mama a uma estrutura mais bidimensional, facilitando a distinção entre estruturas benignas mais compressíveis e menos densas, como o tecido assimétrico normal, ou cistos, de lesões menos compressíveis e mais densas, como as malignas. Pela redução da espessura da mama, a compressão apropriada reduz a dose necessária para uma exposição adequada e melhora o contraste ao diminuir a radiação dispersa. Além disso, a compressão apropriada imobiliza a mama, diminuindo a possibilidade de perda de nitidez por movimento (Figura 3) (BASSETT, 2000). 41 Figura 3: Exame de mamografia sendo realizado (BASSETT, 2000). 2.1.6 Análise da Mamografia Com a progressão da idade, as mamas femininas apresentam, na sua maioria, uma substituição lenta e gradual do tecido fibroglandular por tecido gorduroso (Figura 4) (PASQUALETTE, 1998). 42 Adulto jovem Climatério Mamas com predomínio do tecido fibroglandular Mama adiposa Figura 4: Variação da quantidade de tecido fibroglandular nas mamas em função da idade (PASQUALETTE, 1998). Do final da adolescência até o final da fase adulto jovem (35 anos), a maioria das mamas apresentam-se mais densas. Na fase de pré-menopausa, já ocorre a substituição adiposa que se completa no climatério, onde a mama apresenta-se na maioria das vezes, transparente com mínimos elementos glandulares (Figura 5) (PASQUALETTE, 1998). Figura 5 : Sequência de mamografias mostrando aspectos diferentes de acordo com a faixa etária (PASQUALETTE, 1998). Fatores que podem alterar as características da mamografia. Idade Paridade Ciclo Menstrual 43 2.1.7 Hormônios Exógenos e outras Substâncias Perda de Peso Cirurgias Anteriores Indicações para mamografia Existem dois tipos de exames mamograficos: Mamografia de Rastreamento e Mamografia Diagnóstica (INCA, 2007). 2.1.7.1 Mamografia de Rastreamento O Documento de Consenso (INCA, 2004), recomenda as seguintes ações para rastreamento em mulheres assintomáticas: Exame clínico das mamas a partir dos 40 anos. Mamografia para mulheres entre 50 e 69 anos, com intervalo máximo de dois anos entre os exames. Exame clínico das mamas e mamografia anual, a partir dos 35 anos, para mulheres do grupo de risco. 2.1.7.2 Mamografia Diagnóstica Realizada em mulheres com sinais ou sintomas de câncer de mama. Os sintomas mais frequentes de câncer de mama são (INCA, 2007): Nódulo - um nódulo palpável geralmente é descoberto pela própria paciente, que chega ao médico com muita ansiedade e medo. Se o nódulo for um novo achado no autoexame das mamas ou no exame clínico, a mamografia deve ser realizada, independente da data do exame anterior. Se o nódulo palpável não tiver expressão na mamografia, a complementação com a ultrassonografia é obrigatória. Se um nódulo lobulado ou regular for identificado na mamografia, o exame deve ser complementado com a ultrassonografia para identificar se o nódulo é sólido ou cístico, diferença fundamental para 44 determinar a conduta a ser estabelecida. Convém lembrar que a mamografia em pacientes jovens (abaixo de 30 anos) normalmente não apresenta nenhum benefício diagnóstico, em virtude da alta densidade das mamas e pela baixa incidência de câncer (menos de 0,1%) na faixa etária, a ultrassonografia é o exame de escolha para a primeira avaliação de nódulos nesses casos (INCA, 2007). Espessamento - representa uma região mais endurecida na palpação, sem que seja possível delimitar um nódulo. A indicação de mamografia segue os mesmos parâmetros descritos para o nódulo (INCA, 2007). Controle radiológico de lesão provavelmente benigna (Categoria 3) - o controle radiológico deve ser realizado de 6 em 6 meses no primeiro e anualmente nos 2 anos seguintes. Radiologicamente, uma lesão é considerada benigna quando permanece estável num período de 3 anos. Qualquer modificação no aspecto radiológico, seja na forma, tamanho, densidade ou número (no caso de microcalcificações), em qualquer fase do controle, representa indicação para histopatológico (INCA, 2007). 2.1.8 Achados mamográficos Existem várias maneiras de classificar os achados mamográficos. Optamos pela classificação dos achados, relacionando-os com malignidade, em sinais primários, secundários e indiretos (PASQUALETTE, 1998). Sinais primários incluem massas bem ou mal definidas e microcalcificações. Sinais secundários incluem espessamento ou retração da pele e aumento dos linfonodos axilares. Sinais indiretos incluem distorção da arquitetura, assimetria de densidade e aumento de ducto único (PASQUALETTE, 1998). A capacidade da mamografia em revelar achados depende de fatores relacionados com a qualidade do processamento e equipamento, fatores técnicos, como posicionamento e treinamento do mamografista, e fatores inerentes a características do tecido mamário, como a maior ou menor presença de tecido 45 fibroglandular na mama, impedindo que haja uma quantidade suficiente de tecido gorduroso que passa a oferecer o contraste desejado para o aparecimento da lesão em estudo (PASQUALETTE, 1998). Assim sendo, em mamas muito densas do ponto de vista radiológico, como aquelas encontradas nas mulheres jovens nulíparas, gestantes ou lactantes e em mamas com alterações fibrocísticas severas, mesmo uma massa grande pode ser obscurecida por um parênquima denso subjacente. O (Quadro 1) relaciona as causas de falso negativo da mamografia (PASQUALETTE, 1998). Quadro 1: Causas de Falso Negativo (PASQUALETTE, 1998). 1. Erro de posicionamento não atingindo a região de interesse. 2. Obscurecimento da massa pelo tecido mamário adjacente (densidade elevada). 3. Qualidade da imagem ruim. 4. Erros de interpretação. 5. Câncer de mama com características indescritíveis do tecido mamário normal 2.1.8.1 Sinais Primários – Massas Um nódulo é uma lesão que ocupa espaço, vista em duas projeções diferentes. Se uma massa em potencial é vista em somente uma projeção, deveria ser chamada de densidade até que sua tridimensionalidade seja confirmada. A descrição de um nódulo deve incluir seu tamanho, forma (redonda, oval, lobulada ou irregular), características de contorno (circunscrita, microlobulada, obscurecida, indistinta ou espiculada) (BASSETT, 2000). Podemos estudar as massas como bem ou mal definidas (PASQUALETTE, 1998). Massas bem definidas são, na maioria das vezes, lesões benignas, sendo porém imperativo que se faça uma avaliação prévia no sentido de diferenciá-las de lesões malignas (PASQUALETTE, 1998). 46 Massas mal definidas são aquelas que apresentam irregularidades marcantes das bordas ou margens da lesão. Geralmente bastante irregulares, estas massas estão intimamente associadas ao carcinoma, sendo vista a mamografia com margens algodoadas, serrilhadas ou espiculadas, que anatomopatologicamente representam o caráter cada vez mais infiltrativo do tumor maligno (Figura 6) (PASQUALETTE, 1998). Figura 6: Massas – forma e contorno (BASSETT, 2000). 2.1.8.2 Sinais Primários – Microcalcificações Microcalcificações associadas ao carcinoma podem ocorrer na presença de uma massa palpável ou de forma independente, quando é tido como um dos sinais mamográficos mais precoces de câncer mamário. Calcificações malignas são tipicamente numerosas e variam em tamanho e forma e tendem a ser ramificadas e filiformes e pleomórficas. Muitas vezes intraductais, são oriundas de células necróticas tumorais que se depositaram no ducto, podendo também ocorrer no lúmen de pequenas glândulas malignas, como o resultado de um processo secretório ativo (PASQUALETTE, 1998). 47 Quando o achado são calcificações sua descrição morfológica e distribuição podem representar calcificações benignas ou malignas. Calcificações benignas são aquelas com aparência vascular, grosseira (ou pipoca), de centro lucente ou de sedimento. Quase todas os casos não necessitam outro seguimento além da mamografia de rotina. No entanto, se as calcificações não têm estes aspectos tipicamente benignos, pode ser necessária uma avaliação posterior. Por exemplo, calcificações vasculares iniciais podem ainda não ter assumido sua forma fina típica, paralela (BASSETT, 2000). Calcificações de preocupação intermediárias são amorfas na aparência e frequentemente necessitam de seguimento especial e não de rotina. Elas são de aparência tipicamente indistinta e irregular. As calcificações mais preocupantes são as pleomorfas, as quais estão entre 0,2 e 0,3 mm de tamanho, irregulares e mais densas que as calcificações amorfas, e as que são finas, lineares e ramificadas, indicando sua presença nos pequenos ductos terminais e usualmente associadas à malignidade. As duas últimas categorias de calcificações frequentemente necessitam de biópsia para excluir malignidade. A distribuição das calcificações pode também se útil para determinar a conduta posterior com a paciente. Uma disposição agrupada ou linear é inquietante, mesmo na presença de calcificações que podem ser somente de característica intermediária ou que parecem benignas. Uma disposição linear de calcificações puntiformes pode dar a indicação de biópsia. Na medida em que a disposição se torna menos focal e assume uma distribuição segmentar, regional ou difusa, a suspeita sobre sua natureza maligna diminui. No entanto, calcificações com maior grau de suspeição, como as que são finas, lineares e ramificadas, deveriam sempre ser biopsiadas, mesmo se difusamente distribuídas. Em geral, dever-se-ia atuar nas calcificações adjacentes com características benignas venha a tentar dissuadir a recomendação de biópsia (BASSETT, 2000). Estudos clínicos revelam que a predição de valores positivos, isto é, o percentual de casos de câncer de mama identificados em mamografias e confirmados por biópsia é no máximo 30% (RANGAYYAN, MUDIGONDA, & DESAUTELS, 2000). A figura 7 ilustra a elementos representativos de calcificações. 48 Figura 7: Calcificações – configuração e distribuição (BASSETT, 2000). 2.1.8.3 Sinais Secundários São geralmente provenientes de lesões avançadas de mama, e sua presença quando relacionada á malignidade representa um pior prognóstico (PASQUALETTE, 1998). Espessamentos e retração da pele. Retração do complexo areolopapilar. Aumento dos linfonodos da axila. 2.1.8.4 Sinais Indiretos São sinais mais fracos de câncer e compreendem a dilatação de ducto único, distorção localizada de arquitetura, assimetria de densidade e o aparecimento de uma neodensidade (PASQUALETTE, 1998). 49 2.1.9 Leitura da Mamografia É de fundamental importância que a sala de leitura seja totalmente dedicada para este fim, com luz somente do negatoscópio, e que o médico tenha a seu alcance uma lupa, uma régua maleável e lápis de cera (lápis da china ou similar) para que se possa mensurar e marcar as áreas observadas. Além do negatoscópio, deve existir próximo uma fonte de luz quente que possa ser utilizada rapidamente, o que é fundamental para perfeita visualização da pele e celular subcutâneo (Figura 8 e Figura 9). Figura 8: Condições de visão. Os espaços do negatoscópio adéquam-se ao tamanho dos filmes mamográficos (BASSETT, 2000). Figura 9: As incidências mediolateral oblíqua (A) e CC (B) são colocadas costas com costas sobre o negatoscópio para emitir avaliação da simetria bilateral das mamas (BASSETT, 2000). 50 Sequencia formal de passos: Passo 1: Avaliação dos dados do paciente Os dados obtidos da anamnese do paciente devem ser avaliados antes de iniciar a leitura da mamografia. Objetivo é imaginar em função daqueles dados que tipo de mamografia se espera encontrar. Exemplo: mama densa ou totalmente lipossubstituída, se existe alteração de arquitetura em função de cirurgias, etc. É sempre interessante avaliar o possível risco para câncer que a paciente apresenta antes da leitura. Passo 2: A qualidade do exame Existem algumas perguntas que devem ser feitas quando ao se observar a mamografia: A qualidade e a técnica da mamografia são adequadas? O exame deve ser repetido? Todo o tecido mamário foi visibilizado ou é necessário alguma complementação adicional? Existe alguma lesão de pele ou cicatriz que não foi marcada através de artefato metálico? O exame clínico revelou algum achado? onde? Jamais se deve hesitar em reconvocar um paciente para uma complementação adicional. Este procedimento nunca deve ser visto como insegurança do médico e sim como zelo e boa prática, pois pode significar a diferença entre um bom ou mau prognóstico para a paciente. Passo 3: A identificação do exame Com a finalidade de evitar transtornos desnecessários, a verificação da identificação da mamografia cruzada com os dados de identificação da folha de anamnese é extremamente útil. Este passo deve estar muito definido e ser de amplo conhecimento de todos que manipulam o exame. 51 Passo 4: A avaliação do padrão mamográfico do paciente Deve-se avaliar qual o padrão mamográfico daquela mamografia correlacionando-o com aquele que foi imaginado no passo 1. A mama é densa ou lipossubstituída? A involução é parcial ou não? Houve diferença entre a correlação? Existe alguma explicação para as diferenças? Pode-se interpretá-las dentro dos padrões de normalidade? Passo 5: Avaliação da simetria As mamas devem ser checadas em função de sua simetria. A distribuição do tecido tende a ser mais ou menos simétrico e os quadrantes superiores externos apresentam mais quantidade de tecido, portanto, geralmente, são os últimos a involuirem. Passo 6: Avaliação da periferia A pele e o tecido celular subcutâneo devem ser inteiramente observados no intuito de detectar alterações de espessamento da pele e outros. A luz quente é a indicada para esta análise. É praticamente muito difícil a presença de carcinomas nesta área, porém a análise cuidadosa do tecido subcutâneo pode revelar reações desmoplásticas ou linfoedemas de pele que, ás vezes, podem ser a chave do diagnóstico. A margem posterior do parênquima mamário jamais pode ser negligenciada, uma vez que é sitio de vários sinais mamográficos importantes. Um dos mais importantes sinais observados é o sinal de tenda que consiste numa retração da borda superior do parênquima podendo aparecer em apenas uma incidência, denunciando lesão carcinomatosa profunda. Passo 7: Avaliação do complexo areolopapilar A comparação específica dos mamilos e das regiões subareolares é de grande importância para determinar a origem de possíveis inversões e proeminência ductal maior que a usual. Deve-se utilizar luz quente para observar a simetria existente. 52 Passo 8: Análise das trabéculas mamárias Deve-se observar cada centímetro quadrado da mamografia com o propósito de detectar distorção do padrão trabecular normal. Qualquer alteração deve ser sempre que possível, identificada e explicada. Passo 9: À procura de calcificações Deve-se neste passo utilizar sempre lentes de aumento com campo largo (diâmetro maior de 8 cm). Deve-se contar as microcalcificações, observando seus detalhes conforme descrito no item 2.1.6.2. Relacione suas densidades e sempre que necessário não se deve hesitar em solicitar magnificações para melhor avaliá-las. Passo 10: O estudo da axila e vascularização As regiões axilares de ambas as mamas não devem ser ignoradas. O tamanho e as características dos linfonodos devem ser identificados, determinado-se se estão dentro dos limites da normalidade. Geralmente procura-se observar a topografia e as características da vascularização mamária, mesmo sabendo da fraca relação deste achado com o carcinoma. Passo 11: Recapitulação É uma boa prática, após se estudar todas os aspectos de ambas as mamas, rever toda a análise, retornando a uma área determinada de anormalidade com o intuito de obter mais detalhes de outros achados menos óbvios. Passo 12: A comparação com mamografias anteriores Por fim, com todos os detalhes desta análise relacionados, a comparação entre as mamografias define ou identifica, muitas vezes, diagnósticos que até então não foram feitos. A comparação feita no final do processo de análise cria uma grande oportunidade para diagnósticos muito precoces. 53 2.1.10 Auditoria Médica: Base Estatística da Análise dos Resultados Clínicos A auditoria médica da mamografia pode ser definida em termos gerais como uma avaliação retrospectiva da adequação e da exatidão da interpretação da imagem mamográfica (BASSETT, 2000). A auditagem médica de uma prática mamográfica tem vários benefícios. Avalia a capacidade da mamografia em detectar cânceres muito pequenos na taxa esperada, um dos mais importantes parâmetros de sucesso de qualquer prática mamográfica. Os radiologistas recebem retorno individualizado com relação a seus desempenhos. Isto proporciona segurança em relação ao resultados estarem dentro das expectativas ou, caso contrário, identifica a necessidade de treinamento adicional em habilidades interpretativas para o mamografista ou habilidade técnicas para o técnico. As auditorias longitudinais podem detectar as causas de erros falso negativos, permitindo a identificação e correção de falhas técnicas e interpretativas. Quando os dados de auditagem são revistos e elaborados adequadamente, passam a ser uma fonte poderosa de instrução para o mamografista. Os resultados da auditagem dentro das expectativas também podem ser usados para melhorar a adesão tanto dos médicos de referência quanto das pacientes em relação às normas da mamografia de rastreamento, bem como indicam níveis aceitáveis de desempenho para os contribuintes terceirizados e para as agências governamentais. Os dados individuais de auditoria podem ser úteis para uma defesa médico-legal. Como parte de um programa de administração de risco, auditorias oportunas de mamografias anormais proporcionam um excelente acompanhamento das pacientes. Os dados da auditoria como o número de casos de rastreamento encaminhados para avaliação adicional são importantes para o cálculo dos custos por paciente rastreada (BASSETT, 2000). Nos EUA, outra razão obrigatória para realizar uma auditoria de mamografia é a lei federal, de 1992, onde o Congresso americano aprovou o Mammography Quality Standards Act (MQSA). Esta legislação regula a prática de mamografia. A Subparte 3 Seção 354f21A chama a atenção para padrões que requerem a instituição e a manutenção de um programa de segurança de qualidade e controle de qualidade no serviço adequado e apropriado para assegurar a confiabilidade, a clareza e a interpretação correta de mamografias (BASSETT, 2000). 54 2.2 CAD (Computer-Aided Diagnosis) Diagnóstico auxiliado por computador pode ser definido como um diagnóstico feito por um médico que utiliza o resultado de análises quantitativas automatizadas de imagens como uma “segunda opinião” para a tomada de decisões diagnósticas (DOI, 2007). É importante ressaltar que o computador é utilizado somente como uma ferramenta para obtenção de informação adicional, sendo o diagnóstico final sempre feito pelo especialista, o que diferencia claramente o conceito básico de CAD do conceito de “diagnóstico automatizado”, que foi um conceito proposto e estudado nas décadas de 60 e 70 (DOI, 2007). A finalidade do CAD é melhorar a acurácia do diagnóstico, assim como a consistência da interpretação da imagem, mediante o uso da resposta do computador como referência. A resposta do computador pode ser útil, uma vez que o diagnóstico do especialista é baseado em avaliação subjetiva, estando sujeito a variações intra e interpessoais, bem como perda de informação devido à baixa qualidade da imagem, sobreposição de estruturas, fadiga visual ou distração. Além disso, foi demonstrado que uma dupla leitura (por dois especialistas) pode aumentar a sensibilidade do diagnóstico (THURFJELL, LERNEVALL, & TAUBE, 1994). A proposta do CAD é funcionar como um segundo especialista. Basicamente, existem dois tipos de aplicações de sistemas CAD. Um é o auxílio à detecção de lesões, a partir da localização de padrões anormais através da varredura da imagem pelo computador e o outro é o auxílio ao diagnóstico, através da quantificação de características da imagem e sua classificação como correspondendo a padrões normais ou anormais (RODRIGO, IÁLIS, & FÁTIMA, 2011). 2.2.1 Auxílio ao diagnóstico A detecção automatizada de lesões envolve a localização pelo computador de regiões contendo padrões suspeitos, porém com a classificação da lesão sendo feita exclusivamente pelo especialista. Sistemas para auxílio à detecção têm sido desenvolvidos, principalmente, para imagens radiológicas de tórax e de mama (RODRIGO, IÁLIS, & FÁTIMA, 2011). 55 2.2.2 Conhecimentos envolvidos Em geral, os sistemas CAD utilizam-se de técnicas provenientes de duas áreas do conhecimento, visando a extração e quantificação de atributos de uma imagem em formato digital: (RODRIGO, IÁLIS, & FÁTIMA, 2011) 1. Processamento de Imagens: envolve o processamento de imagem para realce, segmentação e extração de atributos. 2. Reconhecimento de Padrões: inclui métodos para seleção de atributos, estatística e reconhecimento de padrões. Utilizam-se técnicas de processamento de imagens para realce e segmentação das lesões, conforme o tipo do exame. Por exemplo, utilizam-se propriedades de descontinuidade dos níveis de cinza, detecção de contorno, bordas ou segmentação para separação de regiões que apresentem determinada característica. Após o realce e segmentação, segue o processamento envolvendo a quantificação de atributos da imagem, como, tamanho, contraste e forma dos seus objetos constituintes. A descrição dos atributos da imagem relaciona as características reconhecidas subjetivamente pelos especialistas. De um modo geral, os atributos são quantificados a partir de propriedades métricas, topológicas e de textura dos objetos. Após a extração e quantificação dos atributos, utiliza-se o reconhecimento de padrões para distinção entre padrões normais e anormais. Esta área do conhecimento abrange técnicas de distribuições de probabilidade de classe, técnicas de análise de discriminante, métodos estatísticos e redes neurais (RODRIGO, IÁLIS, & FÁTIMA, 2011). Portanto, o desenvolvimento de uma ferramenta CAD depende do conjunto de atributos de imagens adotado. Se o CAD tratar de extração de valores a partir de atributos de imagens será necessário aplicar as fórmulas matemáticas referentes ao atributo para sua implementação; Se o CAD tratar de decisão a partir de valores extraídos dos atributos de imagem será necessário conhecer os atributos de imagens. Os Apêndices A e B contêm os atributos de imagens com seus respectivos valores utilizados por este trabalho durante o processo de simulação de diagnóstico. 56 Os itens a seguir descrevem os principais atributos de imagem utilizados. 2.2.3 Atributos de imagens digitais Com a digitalização, as mamografias passam a ser representadas pela função I(x, y) intensidade da imagem. Tal função é um mapeamento de pixels, cujos valores são explicitados, conhecendo-se as posições x e y. Na digitalização de mamografias são especificados alguns parâmetros: (ESPÍRITO-SANTO, 2004) A resolução da imagem digital em pixel. Exemplo: 640x480, 1024x1024, 2000x2000, 4000x4000, etc. A quantização dos pixels, isto é, a quantidade de bytes associada a um pixel, o que corresponde aos níveis de cinza que podem ser exibidos por um pixel. Valores típicos de quantização são: 1 byte (256 níveis) e 2 bytes (65536), etc. A partir de mamografias digitalizadas é possível a segmentação computadorizada destas objetivando identificar massa, nódulos, calcificações, etc. A segmentação de imagens consiste na aplicação de detectores de transição de bordas, filtros adaptativos e redutores morfológicos. Após a segmentação, realizam-se os seguintes procedimentos: (ESPÍRITO-SANTO, 2004) Determinam-se fatores morfológicos (compactação - C, descrição de Fourier f concavidade Fracionária – Fcc e Índice de forma espiculada-SI), empregandose o algoritmo de crescimento de regiões com muli-tolerância (RANGAYYAN, SHEN, & DESAUTELS, 1993); (ESPÍRITO-SANTO, 2004). Calculam-se as informações de texturas (correlação-F1, energia-F2, entropiaF3, inverso da diferença do momento-F4, soma das entropias-F5, por exemplo) (MUDIGONDA,2000); (ESPÍRITO-SANTO, 2004). 57 Determinam-se os valores dos parâmetros fundamentados no cálculo do gradiente na fronteira da massa (acutance-Ac) (RANGAYYAN,1997); (ESPÍRITO-SANTO, 2004). A detecção computadorizada de massas benignas, tumores malignos e calcificações (malignas e benignas) em mamografias não é feita simplesmente empregando-se Redes Neurais especializadas em reconhecer padrões. No reconhecimento de padrões existentes em imagens digitalizadas (por exemplo, mamografias), feito por redes neurais, formas são identificadas a partir da detecção de bordas do padrão (segmentação de imagens), ou seja, localização da fronteira entre o fundo da imagem (background) e a forma do padrão. Nesta abordagem de reconhecimento, quanto mais definida for à fronteira entre o padrão e o background da imagem, melhor é, na imagem, a individualização (detecção) da borda; (HAYKIN,1999); (ESPÍRITO-SANTO, 2004). Em mamografias, a maioria das massas benignas, bem como as calcificações benignas, tem aspecto bem definido e possui fronteira (bordas) com elevado grau de nitidez. As formas das calcificações benignas podem ser circular e oval (FIGURA 6). Os contornos das massas benignas, além das formas circular e oval, podem também apresentar a forma macrolobular, como visto na FIGURA 10. É nítida a transição da margem (borda) da parte interna do tecido denso da massa para a parte externa, que é menos densa. Massas e calcificações malignas, contudo, aparentam contrastes nebulosos e fronteira pouco nítida. Os contornos das calcificações malignas apresentam forma lobular (FIGURA 6), e os tumores malignos possuem formas microlobular (microlobulated) ou espiculada, (FIGURA 10). Nos tumores malignos, a transição do tecido interno (mais denso) para a parte externa não é bem definida ou nítida (HILLARY, RANGAYYAN, & DESAUTELS, 2003) (ESPÍRITO-SANTO, 2004). Entretanto, certas massas benignas tais como fibroadenomas podem apresentar bordas não muito destacadas na mamografia a convexidade e concavidade da forma das massas; observa-se que a maioria das massas benignas apresenta formas convexas. Poucas são côncavas ou espiculadas. Contudo, tumores malignos podem apresentar formas com segmentos tanto côncavos quanto convexos além da forma tentacular predominante (RANGAYYAN, MUDIGONDA, & DESAUTELS, 2000) (ESPÍRITO-SANTO, 2004). Além disso, massas benignas, comparadas com tumores malignos são mais 58 homogêneas em termos de densidade de distribuição. Figura 10: Exemplos de formas dos contornos das massa benignas: (a) e (b).Exemplos de formas dos contornos de tumores malignos: (c) e (d) (HILLARY, RANGAYYAN, & DESAUTELS, 2003) (ESPÍRITOSANTO, 2004). Diante destes fatos, se uma Rede Neural fosse treinada para reconhecer padrões de massas e calcificações malignas e benignas, ela seria, dependendo da implementação da rede, eficiente no reconhecimento das massas benignas, mas com pouca eficiência na detecção de tumores malignos, podendo ainda não perceber (na mamografia) ocorrências como fibroadenomas. Portanto, as Redes Neurais treinadas somente para reconhecer padrões não são ferramentas recomendáveis para o apoio ao diagnóstico de câncer, pois elas são deficientes no que mais interessa aos radiologistas, ou seja, identificar a presença do câncer (ESPÍRITO-SANTO, 2004). Já que o simples reconhecimento de padrões tem pouca ou nenhuma aplicação em mamografia, os fatores de formas, a detecção da nitidez da borda da massa e as medidas de texturas são a resposta CAD para a extração de atributos diagnosticáveis de mamografias (ESPÍRITO-SANTO, 2004). 2.2.3.1 Fatores de forma que descrevem as calcificações Este item mostra alguns exemplos de mamografias e descreve matematicamente os fatores de forma empregados na descrição das calcificações. 59 A figura 11 mostra uma mamografia original e a obtida após a segmentação, contraste e identificação de atributos (ESPÍRITO-SANTO, 2004). Figura 11: a) Uma mamografia típica; b) segmentação; c) densidade FD (x,y); d) a f) contrastes (FC(x,y)), FKC(x,y) e FE(x,y)); g) e h) estruturas detectadas (ESPÍRITO-SANTO, 2004). 60 As Figuras 12 e 13 mostram um conjunto de imagens mamografias que exibem calcificações malignas e benignas (ESPÍRITO-SANTO, 2004). Figura 12: Na esquerda, uma mamografia exibindo calcificações malignas. Na direita, contornos nas calcificações feitos pelo Radiologista (SHEN, RANGAYYAN, & DESAUTELS, 1993) (ESPÍRITOSANTO, 2004) Figura 13: Na esquerda, uma mamografia exibindo calcificações benignas. Na direita, contornos nas calcificações feitos pelo Radiologista (SHEN, RANGAYYAN, & DESAUTELS, 1993) (ESPÍRITOSANTO, 2004) 61 2.2.3.2 Fatores de forma usados na representação de calcificações Os parâmetros que descrevem as calcificações identificadas em uma mamografia são (RANGAYYAN, SHEN, & DESAUTELS, 1993) (ESPÍRITO-SANTO, 2004): 1. Momento (m): 1 1 4 2 1 1 N 1 N 4 2 m . ( z m ) ( z m ) i i 1 1 m1 N N i 1 i 1 (1) Em que zi, para i = 1, 2.., N, é a distância entre o contorno de um conjunto ordenado de pixel e o seu centróide e m1 é o valor médio de zi. 2. Descrição de Fourier (f): N 2 NFD( k ) k f 1 k N 1 2 N 2 (2) NFD( k ) N k 1 2 Em que, 0; k 0 NFD(k ) A(k ) / A(1); k 1,2,...N / 2 1 A(k N ) / A(1); k 1,2,... N / 2 1 1 A(n) N N 1 ze i 0 i j 2 n i N ; n 0,1,..., N 1 62 3. Fator de compactação (C): p2 C A C 1 ou 4A p2 (3) Em que p é o perímetro e A é a área da região contornada. 2.2.3.3 Fatores de forma usados na caracterização de massas mamográficas A figura 14 mostra uma imagem de um tumor original e a identificação do tumor feita manualmente na mamografia, por um radiologista (ESPÍRITO-SANTO, 2004). Figura 14: Na esquerda, uma mamografia exibindo um tumor maligno (espiculado). Na direita, tumor identificado pelo Radiologista (contorno) (GULIATO, 1996). Na representação da forma das massas (tumores) existentes em uma mamografia podem ser empregados, entre outros, a descrição de Fourier e os seguintes parâmetros (BRUCE & ADHAMI, 1999); (ESPÍRITO-SANTO, 2004): 63 4. Distância radial (d): d (i ) ( x(i ) xo ) 2 ( y (i ) yo ) 2 (4) 5. Fator de compactação (C): C p2 A (5) 6. Desvio padrão da distância radial (): 1 N 1 N 2 ( d (i ) d m ) , em que d m d (i ) N i 1 N i 1 (6) 7. Índice de rugosidade da fronteira do tumor (R): N L j L L R ( j ) d (i ) d (i j ) , em que R R( j ) i j , em que N j 1 (7) Em que R(j) é o índice de rugosidade do j-ésimo segmento do contorno do tumor. L = número de pontos da fronteira do segmento N = número de pontos da fronteira toda 64 8. Índice de forma espiculada (SI): N SI (1 i 1 cos i ) S i (8) N S i 1 i Em que Si é o comprimento dos segmentos do contorno do tumor e é o ângulo entre os segmentos. 2.2.3.4 Informações de texturas usadas na caracterização de massas e tumores As complexidades das texturas de massas mamográficas benignas e tumores malignos podem ser descritos a partir dos seguintes parâmetros (RANGAYYAN, MUDIGONDA, & DESAUTELS, 2000); (ESPÍRITO-SANTO, 2004). 9. Entropia: Medida da falta de uniformidade ou na imagem ou na região de interesse (ROI) ou no aglomerado de pixels. Entropia N N i 1 j 1 ( P (i, j ) P (i, j ) ) log( ) R R (9) Onde, P(i, j) é a distribuição de probabilidade de ocorrência de um par de níveis de cinza (i, j), separados por uma distância d, e R é o total de pares de pixels na região de interesse ou no aglomerado de pixels. 10. Segundo momento: Medida de homogeneidade: 65 N N Segundo Momento ( i 1 j 1 P (i, j ) 2 ) , R (10) 11. Diferença de momento: Medida de contraste: N 1 Diferença de Momento n 2 n 0 P (i, j ) ) , R (11) P(i, j ) , i j, R.(1 j ) 2 (12) i j n ( 12. Inverso da diferença do momento: Medida da homogeneidade local: N N Inverso da diferença do momento i 1 j 1 13. Correlação: medida da dependência linear do brilho: N N Correlação i 1 j 1 [ijP (i, j ) / R] x y x y , (13) em que e são, respectivamente, a média e o desvio padrão na direção x (y). 66 2.2.3.5 Informações fundamentadas no gradiente, usadas na descrição de massas e tumores As massas mamográficas e os tumores podem também ser descritos a partir de parâmetros que dependem do cálculo do gradiente. Um destes parâmetros é a acutance: medida da variação dos níveis de cinza através da massa ou na fronteira da ROI (RANGAYYAN,1997); (ESPÍRITO-SANTO, 2004). 14. Ac (acutance) Ac 1 1 N d max N 1 d j 0 2 ( j) , nj (14) Em que d ( j) nj i 1 f (i ) b(i ) 2i d(i) é a soma das diferenças entre pixels ao longo da normal interna (f(i)) e externa (b(i)) à ROI. O parâmetro nj é o número de par de pixels ao longo da normal usada para calcular a diferença ente os j-ésimos pixels da fronteira da massa ou da ROI. nj está sujeito a um valor máximo cuja especificação depende da concavidade da forma da (RANGAYYAN,1997); (ESPÍRITO-SANTO, 2004) . massa 67 2.3 Lógica Paraconsistente Os precursores da Lógica Paraconsistente foram o lógico polonês J. Lukasiewicz e o filósofo russo N.A. Vasilév. Simultaneamente, por volta de 1910, embora de maneira independente, eles ventilaram a possibilidade de uma Lógica Paraconsistente que restringiria o princípio da contradição, quando formulado da seguinte forma: dadas duas proposições contraditórias, isto é, uma das quais é a negação da outra, então uma das proposições é falsa. Vasilév chegou mesmo a articular determinada Lógica Paraconsistente, que ele batizou de imaginária, modificando a silogística aristotélica. Nenhum deles tinha, na época, uma visão ampla da Lógica Clássica, tal como hoje a encaramos; eles a tratavam mais ou menos do prisma de Aristóteles, de conformidade com as tendências então dominantes na época (ABE, 2011). O primeiro lógico a estruturar um cálculo proposicional paraconsistente foi o polonês S. Jaskowski, discípulo de Lukasiewicz. Em 1948 ele publicou suas idéias sobre lógica e contradição, mostrando como se poderia construir um cálculo sentencial paraconsistente, possuindo motivação conveniente. O sistema de Jaskowski, nomeado por ele de lógica discursiva, desenvolveu-se posteriormente (a partir de 1968) em virtude das obras de autores como J. Kotas, L. Furmanowski, L. Dubikajtis, N.C.A. da Costa e C. Pinter. Assim, chegou-se a edificar uma verdadeira lógica discursiva, englobando um cálculo de predicados de primeira ordem e uma lógica de ordem superior (há, inclusive, teorias discursivas de conjuntos, intrinsecamente ligadas à teoria de atributos, baseada no cálculo S5 de Lewis). Também, independentemente dos trabalhos apresentados em Da Costa em 1954, o lógico D. Nelson sugeriu em 1959 uma lógica paraconsistente como uma versão de seu sistema conhecido como lógicas construtivas com negação forte (ABE, 2011). 68 2.4 Lógica Paraconsistente Anotada Evidencial E A Lógica Paraconsistente Anotada Evidencial E possui uma linguagem E e as proposições atômicas são do tipo p(, ) onde p é uma proposição e , [0, 1] (intervalo real unitário fechado). Intuitivamente, indica o grau de evidência favorável de p e o grau de evidência desfavorável de p. A leitura dos valores , depende das aplicações consideradas e podem sofrer mudanças: com efeito pode ser o grau de evidência favorável e poder ser o grau de evidência desfavorável expressa pela proposição p; também, pode indicar a probabilidade expressa por p de ocorrer e a improbabilidade expressa por p de ocorrer. Uma proposição atômica p(, ) da lógica E pode intuitivamente ser lida como: creio em p com o grau de evidência favorável de p () e o grau de evidência desfavorável de p () (ABE, 2011). Desse modo, têm-se algumas leituras interessantes: p(1.0,0.0) pode ser lida como uma proposição verdadeira (evidência favorável total e evidência desfavorável nula). p(0.0,1.0) pode ser lida como uma proposição falsa (evidência favorável nula e evidência desfavorável total). p(1.0,1.0) pode ser lida como uma proposição inconsistente (evidência favorável total e evidência desfavorável total). p(0.0,0.0) pode ser lida como uma proposição paracompleta (evidência favorável nula e evidência desfavorável nula). p(0.5,0.5) pode ser lida como uma proposição indefinida (evidência favorável igual à evidência desfavorável de 0.5). O conceito de paracompleteza é o dual da de inconsistência (ABE, 2011). 69 Exemplo: (LOPES, 2009) Seja a proposição p “O paciente está com câncer de mama”: p(1.0,0.0) pode ser lida como: O paciente está com câncer de mama com evidência favorável total e evidência desfavorável nula. Intuitivamente, trata-se de uma proposição verdadeira. p(0.0,1.0) pode ser lida como: O paciente está com câncer de mama com evidência favorável nula e evidência desfavorável total. Intuitivamente, trata-se de uma proposição falsa. p(1.0,1.0) pode ser lida como: O paciente está com câncer de mama com evidência favorável total e evidência desfavorável total. Intuitivamente, trata-se de uma proposição contraditória. p(0.0,0.0) pode ser lida como: O paciente está com câncer de mama com evidência favorável nula e evidência desfavorável nula. Intuitivamente, trata-se de uma proposição paracompleta. p(0.5,0.5) pode ser lida como: O paciente está com câncer de mama com evidência favorável igual à evidência desfavorável de 0.5. Intuitivamente, temos aí uma indefinição. 2.4.1 Conectivo da Negação Uma propriedade interessante que a lógica E apresenta é conceito de negar uma proposição. Por exemplo, a proposição p(1.0, 0.0) do Exemplo 1, “O paciente está com câncer de mama com evidência favorável total e evidência desfavorável nula”. Na análise de sua negação o leitor imediatamente percebe que, em termo da lógica E, é equivalente a dizer “O paciente está com câncer de mama com evidência favorável nula e evidência desfavorável total”, ou seja, a negação da proposição p(1.0, 70 0.0) pode ser expressa por meio de uma operação na constante de anotação associada. Em termos técnicos, tem-se que p(1.0, 0.0) p(1.0, 0.0) p(0.0, 1.0). Se p denotar a proposição “Pedrinho está acometido de pneumonia com 80% de evidência favorável e 40% de evidência desfavorável”, qual é a negação de p(0.8, 0.4)? Prosseguindo com o exemplo anterior, é fácil perceber que sua negação equivale a dizer a proposição “Pedrinho está acometido de pneumonia com 40% de evidência favorável e 80% de evidência desfavorável”, ou seja, a evidência favorável de p(0.8, 0.4) passa a ser a evidência desfavorável de p(0.8, 0.4) e a evidência desfavorável de p(0.8, 0.4) passa a ser a evidência favorável de p(0.8, 0.4). Em termos técnicos, tem-se que p(0.8, 0.4) p(0.8, 0.4) p(0.4, 0.8). Generalizando-se através dos exemplos acima, é fácil perceber também que p(, ) equivale a p(, ), que, por sua vez, equivale a p(, ). A negação de p(, ) é a mesma proposição p com graus de evidência invertidos; o grau de evidência favorável de p(, ) é a evidência desfavorável de p(, ) e o grau de evidência desfavorável de p(, ) constitui o grau de evidência favorável de p(, ). Há um operador natural definido sobre que desempenha o papel da negação do conectivo da lógica anotada: : , (, ) = (, ). Isso denuncia uma importante propriedade na lógica E: podem ser consideradas equivalentes as proposições p(, ) e p(, ), ou seja, em outra terminologia, p(, ) p(, ). Qual é a negação de p(0.5, 0.5)? Intuitivamente é a própria proposição p(0.5, 0.5), ou seja, p(0.5, 0.5) p(0.5, 0.5). Agora supuser que p(0.5, 0.5) seja verdadeira, tem-se a situação: p(0.5, 0.5) verdadeira e p(0.5, 0.5) também verdadeira. Ora, a lógica em questão admite intuitivamente contradições verdadeiras. Coisa semelhante acontece se p (0.5, 0.5) for falsa. Há p(0.5, 0.5) falsa e p(0.5, 0.5) também falsa, ou seja, E é também paracompleta. Daí, E é não-alética. De modo geral, tem-se p(, ) p(, ). O fato de a negação lógica ser “absorvida” na anotação, faz com que a lógica E tenha propriedades de fundamental importância na hora de implementações físicas, bem como propriedades de extrema fecundidade em programação e em implementações físicas (ABE, 2011). 71 2.4.2 Conectivos da Conjunção, Disjunção e Implicação Dadas às proposições p(, ) e q(, ) podemos formar a conjunção, disjunção e a implicação entre elas: p(, ) q(, ) – leia-se a conjunção de p(, ) e q(, ) p(, ) q(, ) – leia-se a disjunção de p(, ) e q(, ) p(, ) q(, ) – leia-se a implicação de q(, ) por p(, ) O conectivo da bi-implicação introduz-se de modo habitual: p(, ) q(, ) = p(, ) q(, ) q(, ) p(, ) – leia-se p(, ) equivale a q(, ) 2.4.3 Reticulado Terminologias específicas. O par (, ) denomina-se constante de anotação. Tal par é um elemento de [0,1] X 0,1] que é indicado por [0,1]. Mune-se esse conjunto de uma relação de ordem assim definida (ABE, 2011): (1, 1) (2, 2) 1 2 e 2 1. Propriedades: 1. , , (, ) (, ) (reflexividade) 2. 1, 1, 2, 2 , (1, 1) (2, 2) e (2, 2) (1, 1), implicam (1, 1) = (2, 2) (antissimetria). 3. 1, 1, 2, 2, 3, 3 , (1, 1) (2, 2) e (2, 2) (3, 3), implicam (1, 1) (3, 3) (transitividade) 4. 1, 1, 2, 2 , existe o supremo de {(1, 1), (2, 2)} indicado por (1, 1) (2, 2) = (Máx{1, 2}, Mín{1, 2}) 72 5. 1, 1, 2, 2 , existe o ínfimo de {(1, 1), (2, 2)} indicado por (1, 1) (2, 2) = (Mín{1, 2}, Máx{1, 2}) 6. , , (0, 1) ≤ (, ) (1, 0) O quadrado unitário [0,1] X [0,1] com a relação de ordem constitui um reticulado que é simbolizado por <, > ou simplesmente por (ABE, 2011). 2.4.4 Graus de Certeza e de Incerteza Para se obter melhor representação é comum utilizar um reticulado que em cada vértice aloca-se um símbolo e, por sua vez, pode ser considerado como estado lógico. Esse mesmo estado lógico é identificado por meio de dois valores de anotação representados pelo par (, ) onde indica Grau de Evidência Favorável e Grau de Evidência Desfavorável em relação à proposição, como demonstrado nas Figuras 15 e 16. Figura 15: Representação do reticulado das anotações pelo diagrama de Hasse (ABE, 2008). 73 Figura 16: Reticulado com graus de certeza e incerteza (ABE, 2011). No reticulado notam-se quatro pontos que nortearão as perquirições neste trabalho. Denominam-se pontos cardeais. Tais são elas: A (1.0, 0.0) estado verdadeiro B (0.0, 1.0) estado falso C (1.0, 1.0) estado inconsistente D (0.0, 0.0) estado paracompleto Embasados nos pontos cardeais, e pelo uso das propriedades dos números reais, cuidadosamente constrói-se uma estrutura matemática com o fito de materializar as ideias de como se quer manipular mecanicamente o conceito de incerteza, contradição e de paracompleteza, entre outros. Tal mecanismo englobará, os estados de verdadeiro e falso tratados dentro do escopo da lógica clássica, com todas as suas consequências (ABE, 2011). 74 Para tanto, iremos introduzir diversos conceitos que julgados “intuitivos” para a finalidade acima esboçada. Segmento perfeitamente definido AB: + -1 = 0; 0 , 1 Segmento perfeitamente indefinido DC: - = 0; 0 , 1 As constantes de anotação (,) que incidem no segmento perfeitamente indefinido, possuem a relação - = 0, ou seja, = . A evidência favorável é idêntica à evidência desfavorável, mostrando que a proposição p(,) expressa uma indefinição. Ela varia continuamente desde a inconsistência (1,1) até o paracompleto (0,0). Já as constantes de anotação (, ), que incidem no segmento perfeitamente definido possuem a relação + -1 = 0, ou seja = 1 - , ou ainda = 1 - . Logo no primeiro caso, a evidência favorável é o complemento booleano da evidência desfavorável e, no segundo, a evidência desfavorável é o complemento booleano da evidência favorável, mostrando que as evidências, favorável e desfavorável ‘comportam-se’ como no caso clássico. Elas variam continuamente desde a falsidade (0,1) até a veracidade (1,0) (ABE, 2011). Introduziu-se o conceito de grau a partir das aplicações: Gic:[0, 1][0, 1] [0, 1], Gpa:[0, 1][0, 1] [-1, 0], Gve:[0, 1][0, 1] [0, 1], Gfa:[0, 1][0, 1] [-1, 0] definidas por: Grau de Inconsistência: Gic(,) = + -1, desde que + -1 0 Grau de Paracompleteza: Gpa(,) = + -1, desde que + -1 0 Grau de Veracidade: Gve(,) = - , desde que - 0 Grau de Falsidade: Gfa(,) = - , desde que - 0 Vê-se que o Grau de Inconsistente “mede” o quão uma anotação (,) “distancia” do segmento perfeitamente indefinido e quão se “aproxima” do estado “inconsistente” e o Grau de Paracompleteza “mede” o quão uma anotação (,) “distancia” do segmento perfeitamente indefinido e quão se “aproxima” do estado paracompleto. 75 Chama-se Grau de Incerteza Gin(,) de uma anotação (,) a qualquer um dos graus de inconsistência ou de paracompleteza. Por exemplo, o grau de Incerteza é máximo no estado inconsistente, ou seja, Gic (1,1) = 1. Chama-se Grau de Certeza Gce(,) de uma anotação (,) a qualquer um dos graus de verdade ou de falsidade. Por exemplo, o grau de verdade da anotação (½, ¼) é ¼, ou seja, Gve (½,¼) = ½ – ¼= ¼. 2.4.5 Estados de Decisão: Extremos e Não-extremos Segundo os conceitos do item 2.4.4, pode-se trabalhar com “faixas” de verdade, ao invés de a “verdade” ser um conceito ‘hirto’, ‘inflexível’. Talvez melhor dizer que a verdade é uma faixa de certeza com respeito a certa proposição. Para determinarem tais faixas, são introduzidos os seguintes conceitos: Quatro valores limites extremos: Vcve = C1 = Valor de controle de veracidade; ½ Vcve 1 Vcfa = C2 = Valor de controle de falsidade; -1 Vcfa -½ Vcic = C3 = Valor de controle de inconsistência; ½ Vcic 1 Vcpa = C4 = Valor de controle de paracompleteza; -1 Vcpa -½ Tais valores nortearão uma proposição considerada, por exemplo, “verdadeira” para a tomada de decisão positivamente, e assim por diante. As Figuras 17 e 18 ajudarão a introduzir conceitos suplementares. 76 Figura 17: Estados extremos e não-extremos (ABE, 2011). Figura 18: Diagrama com os graus de incerteza e de certeza, com valores ajustáveis de controle limite indicados nos eixos. Observem-se também as regiões consideradas (ABE, 2011). 77 Tabela 1: Apresenta os estados lógicos extremos e símbolos com os respectivos valores de Graus de Evidência Favorável e Desfavorável (ABE, 2011). Estados Extremos Símbolo Graus de Evidência () Verdadeiro V (1,0) Falso F (0,1) Inconsistente T (1,1) Paracompleto (0,0) Os Graus de Evidência Favorável e de Evidência Desfavorável são utilizados como informações de entrada do sistema de Análise Paraconsistente e, como resultado de saída, obtêm os estados lógicos representados nos vértices do reticulado, demonstrado na Figura 19. Figura 19: Sistema básico de Análise Paraconsistente (ABE, 2008). Nos sistemas de Análise Paraconsistente, os Graus de Evidências Favorável e Desfavorável podem ser concebidos como conhecimento. Ao passo que se obtêm novas evidências, diminuem-se as contradições e há melhores condições de o sistema chegar a uma conclusão mais acertada (ABE, 2008) . A análise paraconsistente dos Graus de Evidência é realizada por meio da representação do reticulado em um QUPC (Quadrado Unitário no Plano Cartesiano)(Figura 20), em que “[...] os valores do Grau de Evidência favorável ficam 78 expostos no eixo x, e os valores do Grau de Evidência desfavorável ficam expostos no eixo y” (ABE, 2008). λ B = (0,1) C = (1,1) D = (0,0) A = (1,0) Figura 20: Reticulado representado por um QUPC (ABE, 2008). No QUPC é possível calcular o Grau de Incerteza (Gin) utilizando a seguinte equação: Gin = + λ - 1. Tal grau pode variar de -1 a +1, sendo que seu valor equivale a distância do ponto de intersecção entre os Graus de Evidências Favorável e Desfavorável à reta que liga o ponto A=(1,0) verdadeiro ao ponto B=(0,1) Falso. O valor -1 que se dá no ponto D=(0,0) indica que há uma contradição máxima negativa e o valor +1 que acontece no ponto C=(1,1) aponta para uma contradição máxima positiva, ou seja, os valores de entradas são informações contraditórias. Em sistemas de análise paraconsistente, quanto mais a intersecção entre os Graus de Evidência estiver próxima do segmento de reta BA menor é a qualidade de contraditoriedade no que diz respeito às informações de entrada. Os valores dos Graus de Incerteza são incluídos verticalmente no reticulado associado à Lógica Paraconsistente Anotada Evidencial Ecompondo o eixo denominado de eixo dos Graus de Incerteza (FIGURA 18). Por outro lado, também é possível calcular o Grau de Certeza (Gce) através da equação: Gce = - λ. Esse grau também pode variar de –1 a +1, e seu valor 79 corresponde à distância do ponto de intersecção entre os Graus de Evidência à reta que liga o ponto D=(0,0), Paracompleto, ao ponto C=(1,1), Inconsistente. Seguindo-se esse raciocínio, o valor –1, que acontece no ponto B=(0,1), indica que há uma certeza máxima na negação da proposição e o valor +1, que acontece no ponto A=(1,0), indica que há uma certeza máxima na afirmação da proposição. Os valores dos Graus de Certeza são alocados horizontalmente no reticulado associado à LPA, constituindo o eixo denominado eixo dos Graus de Certeza, demonstrado pela figura 21 juntamente com o Grau de Incerteza: Figura 21: Representação dos Graus de Certeza e de Incerteza (ABE, 2008). De acordo com ABE (2008), dado que os valores dos Graus de Evidência variam entre 0 e 1, é possível obter como saída os valores dos Graus de Incerteza e de Certeza e identificar se há contradição, chegando-se a uma conclusão da seguinte forma: Caso exista um alto grau de contradição significa que ainda não existe certeza quanto à decisão a ser tomada e é necessário buscar novas evidências. Existindo baixo grau de contradição e alto Grau de Certeza, pode-se formular a conclusão. 80 Como explicado por ABE (2008), uma forma de determinar as ações que o sistema vai tomar após a análise paraconsistente é discretizar o reticulado criando regiões delimitadas internas equivalentes aos estados lógicos de saída. Figura 22 : Divisão do QUPC em 12 regiões (ABE, 2008). Na FIGURA 22, o reticulado está repartido em 12 regiões, correspondendo a 12 estados lógicos de saída, com os seus respectivos símbolos. O formato dessas regiões podem ser variados através de ajuste de controles limites feitos externamente, possibilitando a otimização do sistema de análise paraconsistente, conforme a Tabela 2: Estados Lógicos Não-Extremos . . 81 Tabela 2: Estados Lógicos Não-Extremos (ABE, 2011). Estados Lógicos Não-Extremos Quase-Verdadeiro tendendo ao Inconsistente QVT Quase-Verdadeiro tendendo ao Paracompleto QV Quase-Falso tendendo ao Inconsistente QFT Quase-Falso tendendo ao Paracompleto QF Quase-Inconsistente tendendo ao Verdadeiro QTV Quase-Inconsistente tendendo ao Falso QTF Quase-Paracompleto tendendo ao Verdadeiro QV Quase-Paracompleto tendendo ao Falso QF Caracterização dos estados: Estado Verdadeiro: Gin(, ) = - = Gve(, ) ½ e ½e ½ Estado Falso: Gin(, ) = - = Gfa(, ) -½ e ½e ½ Estado Inconsistente: Gce(, ) = + - 1 = Gct(, ) ½ e ½e ½ Estado Paracompleto: Gce(, ) = + - 1 = Gpa(, ) -½ e ½e ½ Símbolo 82 Estado Quase-Verdadeiro tendendo ao Inconsistente: Gin(, ) = - = Gve(, ) ½ e ½e Gce(, ) = + - 1 = Gct(, ) 0 Estado Quase-Verdadeiro tendendo ao Paracompleto: Gin(, ) = - = Gve(, ) ½ e ½e Gce(, ) = + - 1 = Gpa(, ) 0 Estado Quase-Falso tendendo ao Inconsistente: Gin(, ) = - = Gfa(, ) -½ e ½e Gce(, ) = + - 1 = Gct(, ) 0 Estado Quase-Falso tendendo ao Paracompleto: Gin(, ) = - = Gfa(, ) -½ e ½e Gce(, ) = + - 1 = Gct(, ) 0 Estado Quase-Inconsistente tendendo ao Verdadeiro: Gce(, ) = + - 1 = Gct(, ) ½ e ½e Gin(, ) = - = Gve(, ) 0 Estado Quase-Inconsistente Falso tendendo ao Falso: Gce(, ) = + - 1 = Gct(, ) ½ e ½e Gin(, ) = - = Gfa(, ) 0 83 Estado Quase-Paracompleto tendendo ao Verdadeiro: Gce(, ) = + - 1 = Gpa(, ) -½ e ½e Gin(, ) = - = Gve(, ) 0 Estado Quase-Paracompleto tendendo ao Falso: Gin(, ) = + - 1 = Gpa(, ) -½ e ½e Gce(, ) = - = Gfa(, ) 0 Na discretização do reticulado somente um estado lógico estará ativo no final de cada análise, isto é, o Sistema Paraconsistente pode formular conclusão e tomar uma decisão baseado em uma palavra binária de 12 dígitos, sendo apto a trabalhar em sistemas de controles híbridos. E é esse processo de discretização que facilita a descrição de todo o reticulado, originando-se um algoritmo que foi denominado de “Para-Analisador”, indicado na FIGURA 23. Figura 23: Diagrama do Para-Analizador (ABE, 2008). Com esse algoritmo, facilita-se a elaboração de circuitos eletrônicos de controladores que funcionam conforme a Lógica Paraconsistente, bem como, simuladores e controladores na forma de programação, utilizando qualquer linguagem de computação. 84 Do ponto de vista conceitual, o algoritmo Para-Analisador efetua a tradução da análise paraconsistente, utilizando o tratamento dos valores dos Graus de Evidência que resultam nos valores dos Graus de Certeza e Incerteza. Além da saída analógica, representando os Graus de Incerteza e de Certeza, o algoritmo traz uma palavra binária de 12 dígitos em que um único dígito ativo representa o estado lógico resultante da análise, conforme verifica-se os estados da Tabela 1 e da Tabela 2: Estados Lógicos Não-Extremos . . A Lógica Paraconsistente Anotada Evidencial Ejuntamente com o Algoritmo Para-Analisador podem ser utilizados em diversas áreas do conhecimento que demandam tratamento de conhecimentos incertos, como agentes de decisão em Redes de Inteligência Artificial, o que leva à abordagem das RNAP’s. 85 2.5 Redes Neurais Artificiais Paraconsistentes 2.5. 1 Introdução As raízes de todo trabalho em redes neurais giram em torno de estudos neurobiológicos. As pesquisas relacionadas à Inteligência Artificial buscam incessantemente modelar o comportamento do cérebro humano, isto porque a obtenção de um modelo matemático que determinasse o entendimento completo do seu funcionamento daria condições para que todo o processamento de sinais cerebrais pudessem ser reproduzidos por alguma máquina (ABE, 2008). O sistema nervoso juntamente com o sistema endócrino proporciona muitas das funções de controle do corpo. O sistema nervoso, de que o cérebro faz parte, controla as reações rápidas do corpo, como uma contração muscular. Partes do corpo que têm as funções controladas pelo sistema nervoso têm tempo de resposta relativamente rápido. O sistema endócrino, por outro lado, controla muitas funções do metabolismo do corpo e sua atuação é mais lenta. Existem dois tipos principais de células no cérebro, os neurônios e a glia. É comum atribuir aos neurônios as principais funções cerebrais já que as funções da glia ainda são uma incógnita. 2.5.2 Neurônio Biológico O neurônio é célula especial formada por: dendritos, sinapses, corpo celular e axônio (FIGURA 24) (BARRETO, 2008). I. Dendritos Ramificações correspondentes aos informação (sinais elétricos, escala mV). canais de entrada de 86 II. Axônio Canal de saída do neurônio, ou seja, caminho de propagação dos impulsos nervosos em direção a outros neurônios ou músculos. III. Sinapse Pontos de contato entre neurônios onde há passagem de neurotransmissores do axônio de um neurônio para os dendritos de outro neurônio. IV. Corpo celular Local onde é realizado o balanço energético da célula nervosa (soma das contribuições de energia). Cabe aos neurônios a condução dos impulsos nervosos, ou seja, é uma célula especializada em enviar e receber sinais através do corpo humano (BARRETO, 2008). Figura 24: Neurônio Biológico (BARRETO, 2008) O fluxo de informação ocorre sempre a partir dos dendritos, passando pelo corpo celular e axônio, até o próximo neurônio (FIGURA 24). O axônio emite um impulso elétrico (potencial de ação) apenas se o balanço energético realizado no corpo celular for maior que certo limiar. Neste caso, diz-se que o neurônio disparou ou está ativado (FIGURA 25) (BARRETO, 2008). 87 Figura 25: Sentido de propagação dos impulsos nervosos (BARRETO, 2008) Figura 26: Balanço energético realizado no corpo celular (BARRETO, 2008). A FIGURA 26 apresenta a reação cerebral ao um evento criado pelo corpo. Uma pessoa pisa em um prego, gerando um estimulo que deve ser respondido pelo cérebro. A informação é, então, codificada na frequência dos impulsos. A chegada desses impulsos nos terminais do axônio provoca a liberação de transmissores na 88 fenda sináptica (FIGURA 27) e daí para outro neurônio, diretamente para o músculo ou até para órgãos sensoriais (BARRETO, 2008). Figura 27: Neurônio Biológico em funcionamento (BARRETO, 2008). Foi baseado no estudo do comportamento do cérebro que McCulloch e Pitts (McCulloch, 1943) foram os primeiros a desenvolver um modelo matemático para um simples neurônio. Neste modelo, os neurônios são combinados de forma a produzir qualquer saída que possa ser representada como uma combinação de funções lógicas. O fluxo de informações através de um neurônio é modelado com o uso de uma função degrau (“limiar”) como função de ativação, ou seja, se a entrada do neurônio for maior que o “limiar” ele dispara. Este modelo têm sido vastamente aplicado em diversos trabalhos na área de Redes Neurais Artificiais. O neurônio de McCulloch e Pitts é conhecido como M-P (McCulloch-Pitts) (FIGURA 28) (BARRETO, 2008). 89 Figura 28: Neurônio Artificial M-P (McCulloch-Pitts) (BARRETO, 2008). 2.5.3 Modelo matemático de um neurônio Na construção do neurônio M-P se está interessado em modelar aspectos ligados ao processamento da informação em um neurônio biológico. Entende-se por processamento da informação os caminhos e etapas pelas quais passam os potenciais de ação que trafegam de (BARRETO, 2008): i. um neurônio a outro neurônio, ii. receptores sensoriais a um neurônio, ou iii. de um neurônio a um atuador (e.g. músculo). Assim, devem-se desenvolver modelos matemáticos que representem os dendritos (FIGURA 29), as sinapses (FIGURA 30), o corpo celular (FIGURA 31) e o axônio (FIGURA 32) (BARRETO, 2008). 90 Figura 29: Representação dos dendritos, M-P (McCulloch-Pitts) (BARRETO, 2008). Figura 30: Representação das sinapses, M-P (McCulloch-Pitts) (BARRETO, 2008). 91 Figura 31: Representação do corpo celular, M-P (McCulloch-Pitts) (BARRETO, 2008). Figura 32 : Representação do corpo celular, M-P (McCulloch-Pitts) (BARRETO, 2008). Fazendo uma análise geométrica do neurônio artificial temos FIGURA 33 92 Figura 33 : Análise Geométrica, M-P (McCulloch-Pitts) (BARRETO, 2008) A Eq. (15) define um plano em (x1, x2, u). u>0 u<0 Figura 34: Análise Geométrica (Eq. 1), M-P (McCulloch-Pitts) (BARRETO, 2008) O tracejado (FIGURA 34) indica onde o plano está abaixo do plano (x1, x2). Para fins de classificação basta trabalhar no plano (x1, x2). Isto equivale a fazer u = 0 na equação do plano, ou seja: u = w1x1 + w2x2 - θ = 0 (16) 93 Assim, a equação da reta no plano (x1, x2) é dada por: x2 = -(w1/w2)x1 + θ/w2 (17) A Eq. (17) define a seguinte reta em (x1,x2) (FIGURA 35) Figura 35: Análise Geométrica (Eq. 2), M-P (McCulloch-Pitts) (BARRETO, 2008). Assim, um neurônio pode ser usado para separar com eficiência duas classes que estejam livremente separadas uma da outra (FIGURA 36). Figura 36 : Análise Geométrica (separação de classes), M-P (McCulloch-Pitts) (BARRETO, 2008). Após uma análise, a seguinte questão pode ser levantada: Como fazer com que o neurônio M-P (Perceptron) determine de forma automática os valores dos pesos e do limiar para um problema específico? Como aprender sozinho, do modo que ocorre nos neurônios biológicos? 94 Para que o neurônio M-P seja capaz de aprender sozinho a resolver um problema de classificação é necessário dotá-lo de uma regra de aprendizagem. Uma regra de aprendizagem nada mais é do que uma equação que altera os valores dos pesos e do limiar em função dos erros cometidos durante a execução da tarefa de classificação. O neurônio M-P: é um modelo simplificado do neurônio real. possui p variáveis de entrada: x1, x2,..., xp possui p pesos sinápticos: w1, w2,..., wp possui uma variável de ativação: θ possui uma variável de ativação: u u = w1x1 + w2x2 + .... + wpxp - θ possui uma variável de saída: y y = sinal(u) = +1 (se u > 0) ou -1 (se u ≤ 0) O neurônio MP nada mais é do que uma chave ON/OFF. As condições que definem a ativação (y=1) ou não (y=0 ou -1) do neurônio depende dos valores dos pesos e do limiar. Assim, pode ser utilizado em problemas de reconhecimento de padrões que envolvam duas categorias (binários). A Rede Percepton Simples, proposta por Frank Rosenblatt em 1958, é considerada o primeiro algoritmo de redes neurais artificiais. Perceptron Simples = Neurônio de MP + Regra de Aprendizagem A regra de aprendizagem é o mecanismo que torna a rede Perceptron Simples um dispositivo inteligente 95 2.5.4 Redes Neurais Artificiais As teorias das redes neurais artificiais são paradigmas computacionais baseados em modelos matemáticos que, a despeito das tradicionais computações, possuem uma estrutura e operação que, grosso modo, tentam imitar o funcionamento do neurônio biológico humano e, assim, simular de algum modo como o cérebro humano funciona frente a determinadas situações (LOPES, 2009). Tais redes também são conhecidas como sistemas conexionistas, sistemas distribuídos ou sistemas adaptativos, pois são compostos por uma série de elementos de processamento interconectados que operam em paralelo (LOPES, 2009). As redes neurais artificiais clássicas carecem de controle centralizado em sentido clássico, portanto, todos os elementos de processamento interconectados mudam ou se adaptam simultaneamente com o fluxo de informação e regras adaptativas (LOPES, 2009). Um dos objetivos originais das redes neurais artificiais é entender e modelar as características funcionais e propriedades computacionais do cérebro quando executa processos cognitivos tais como percepção sensorial, categorização de conceitos, associação de conceitos e aprendizado. Entretanto, um grande esforço está direcionado nas aplicações que envolvem reconhecimento e classificação de padrões, compressão de dados e otimização de processos (LOPES, 2009). Uma rede neural artificial genérica pode ser definida como um sistema computacional consistindo de um conjunto de elementos de processamento altamente interconectados, denominados neurônios artificiais, o qual processa uma informação como resposta a um estímulo externo. Um neurônio artificial é uma representação simplificada que emula a integração de sinais e dispara no limiar comportamento dos neurônios biológicos por meio de equações matemáticas (LOPES, 2009). Como em sua contraparte biológica, neurônios artificiais são limitados conjuntamente por conexões que determinam o fluxo de informações entre os neurônios. Estímulos são transmitidos de um processamento a outro, via sinapses ou interconexões, que podem ser excitatórios ou inibitivos. Se a entrada a um neurônio é excitatória, é mais provável que este neurônio transmita um sinal excitatório aos outros 96 neurônios a ele conectados. Uma entrada inibitória provavelmente se propagará como sinal inibitório (ABE, 2008). Redes neurais artificiais dispõem-se tipicamente em camadas. Cada camada constitui um arranjo de elementos processadores ou neurônios. Informações fluem através de cada elemento da forma entrada-saída. Cada elemento recebe um sinal de entrada, manipula-o e encaminha um sinal de saída a outros elementos conectados na camada adjacente (FIGURA 37) (LOPES, 2009). Figura 37: Esquema básico de Rede Neural Artificial clássica. Entradas: são sinais de entradas; Pesos: balanceiam os dados de entrada de acordo com sua relevância; Neurônios intermediários: realizam os cálculos do processamento; Neurônios de saída: preparam os dados processados para a saída. Saídas: são os valores resultantes do processamento (LOPES, 2009). As redes neurais artificiais possuem um comportamento diferenciado em relação à programação convencional. Conseguem resolver problemas que não possuem solução algorítmica ou a solução disponível é complexa para ser obtida. São indicadas para enfrentar problemas que são caracterizados pela predição e reconhecimento de padrões (ABE, 2008). 97 2.5.5 Redes Neurais Artificias Paraconsistentes Relacionando a RNA com a Lógica Paraconsistente Anotada Evidencial E, “em uma definição mais geral, uma RNAP (Rede Neural Artificial Paraconsistente) é uma estrutura de características conexionista composta de uma extensa rede de componentes fundamentados na Lógica Paraconsistente Anotada – LPA” (DA SILVA FILHO & ABE, 1999). Dessa forma: Na análise paraconsistente, o objetivo principal é saber com que medida ou com que Grau de Certeza Gce podemos afirmar que uma proposição é Falsa ou Verdadeira. É considerado como resultado da análise apenas o valor do grau de Certeza Gce. O valor do Grau de Incerteza Gin é um indicativo que informa a medida da inconsistência. Se houver um baixo valor de certeza ou muita inconsistência o resultado é uma indefinição (DA SILVA FILHO & ABE, 1999). Para a finalidade de aplicações LPA2v em neurocomputação, vamos utilizar o algoritmo para fazer análise paraconsistente sem discretizar o reticulado; portanto, quando a análise resultar em valores fora dos limites estipulados pelos valores de controle, a conclusão na saída é de uma indefinição (DA SILVA FILHO & ABE, 1999). Com estas considerações vamos apresentar o algoritmo Para-analisador simplificado (Figura 38): Figura 38: Para-Analisador Simplificado (DA SILVA FILHO & ABE, 1999). 98 1. Valores limites de comparação: Vcve = C1 = Valor de controle de veracidade; 0 Vcve 1 Vcfa = C2 = Valor de controle de falsidade; -1 Vcfa 0 Vcic = C3 = Valor de controle de inconsistência; 0 Vcic 1 Vcpa = C4 = Valor de controle de paracompleteza; -1 Vcpa 0 2. Valores de entrada: μ1 Grau de Evidência Favorável μ2 Grau de Evidência Desfavorável 3. O grau de Certeza calculado: Gce = μ1 – μ2 4. O grau de Incerteza calculado: Gin = μ1 + μ2 - 1 5. Estados lógicos resultantes da saída: Se Gce = C1 então S1 = V Se Gce = C2 então S1 = F Se Gin = C3 então S1 = T Se Gin = C4 então S1 = Senão S1 = I = Indefinição Gce = S2a Gin = S2b Este algoritmo simplificado facilita a elaboração da Célula Artificial Paraconsistente Básica CAPb, fundamental para implementação das Redes Neurais Artificiais Paraconsistentes RNAP’s (DA SILVA FILHO & ABE, 1999). 99 O algoritmo demonstra que, na obtenção de subsídios para tomada de decisão na análise paraconsistente, são necessárias apenas duas equações como ferramentas principais. O processamento de sinais com as duas equações permite saber com que medida ou Grau de Certeza podemos afirmar que uma proposição é verdadeira (DA SILVA FILHO & ABE, 1999). Como já foi dito: É considerado como resultado da análise apenas o valor do grau de Certeza Gce. O valor do grau de Incerteza Gin é um indicativo que informa a medida da inconsistência. Se houver um baixo valor de certeza ou muita inconsistência o resultado é uma indefinição. Estas duas afirmações ficam claras quando verificamos no algoritmo ParaAnalisador Simplificado que na análise paraconsistente, ao término do equacionamento das informações obtidas pelos valores dos Graus de Certeza e de Incerteza Gce e Gin, se houver um baixo valor de certeza ou um alto grau de contradição que, obviamente representa muita inconsistência, o resultado da análise é uma indefinição (DA SILVA FILHO & ABE, 1999). Toda a referência na análise paraconsistente é feita pela comparação entre os valores limites ajustados externamente. São os valores limites que determinam se o resultado é uma indefinição I, ou não (DA SILVA FILHO & ABE, 1999). Uma análise mais sutil do processo que envolve as equações da Lógica Paraconsistente Anotada leva à conclusão que os resultados, com o algoritmo ParaAnalisador no tratamento de sinais de informações, obtidos de situações reais que podem chegar com incertezas, mostram forte semelhança com os modos de processamento conhecidos no funcionamento do cérebro humano. A decisão tomada a partir de informações adquiridas pelos sentidos é um processo mental biológico próprio do ser humano (DA SILVA FILHO & ABE, 1999). Com base nas funções análogas da análise paraconsistente e do cérebro, foi criada uma Célula Artificial Paraconsistente básica CAPb (FIGURA 39) (DA SILVA FILHO & ABE, 1999). 100 A primeira entrada da CAPb é o grau de evidência favorável (ou grau de crença favorável, ou μ) à proposição analisada. A segunda entrada da CAPb é o grau de evidência desfavorável (ou grau de crença desfavorável, ou ). A saída da CAPb é a resultante calculada (ou μr) pelos graus de certeza (Gce) e de incerteza (Gin) com base nos valores de entrada (μ,). Figura 39 : Célula Artificial Paraconsistente Básica (DA SILVA FILHO & ABE, 1999). A CAPb é a Célula-Matter que originou a família de Células Neurais Artificiais Paraconsistentes. A partir dela foram criadas oito tipos de células todas funcionando com a Equação Estrutural Básica (EEB) (FIGURA 40). 101 Figura 40: Família de Células Neurais Artificiais Paraconsistentes CNAP’s (DA SILVA FILHO & ABE, 1999). A primeira característica da CAPb é a normalização das saídas. Define-se então a saída μr somente em função das entradas, chegando-se ao resultado da Equação Estrutural Básica (EEB). Outra característica é a tolerância. Os fatores de tolerância servem para simplificar o funcionamento da CAPb, pois não são em todos os níveis da RNAP que 102 se utiliza o reticulado completo. Em alguns níveis da RNAP são necessárias apenas as respostas Verdadeira (V), Falsa (F) e Indefinida (I). No caso de indefinição, é necessário informar se a indefinição existe por insuficiência de informações, ou por alta incerteza. Define-se então: Grau de Indefinição Verifica-se pela EEB que, quando os graus de certeza e de incerteza utilizados como entradas para a análise paraconsistente forem de valores iguais, o grau de certeza resultante na saída μr será igual a 0.5. Fator de Tolerância Na análise paraconsistente, se entre os dois sinais de entrada houver um alto grau de inconsistência representado por um alto valor do grau de Incerteza (Gin), não se pode tirar nenhuma conclusão a respeito da proposição analisada. Na CAPb, todas as vezes que o Grau de Incerteza ultrapassar os valores limites de incerteza previamente ajustados, conclui-se que o estado lógico resultante de saída é Inconsistente ou Indeterminado, portanto, a saída terá como valor o grau de certeza de indefinição que é igual a 0.5. Para facilitar a implementação dos algoritmos que vão apresentar as CNAP’s em Neurocomputação, vamos utilizar para fazer a comparação com o Grau de Incerteza Gin,um valor único ao qual denominamos de fator de tolerância a incerteza Ftinc. Ftinc é um valor ajustado externamente e sua finalidade é determinar os limites de contradição suportáveis entre os dois sinais aplicados nas entradas da célula. Seguindo as propostas de uma RNAP o Ftinc deve ser ajustado entre valores contidos no intervalo real fechado [0,1], portatno: 0 ≤ Ftinc ≤ 1. A partir do valor de Ftinc estabelecido externamente são obtidos dois valores limites de incerteza. 103 Vcic = Valor de controle de Inconsistência Vcpa = Valor de controle de Paracompleteza Gin = μ1 + μ2 – 1 Vcic = (1 + Ftinc) / 2 Vcpa = (1 - Ftinc) / 2 Estes dois valores entrarão no algoritmo representativo da CNAP para a comparação e elaboração da conclusão na saída da célula. A decisão sobre o sinal de saída, representado pelo valor de Grau de Certeza resultante μr relacionado à análise do valor de incerteza, è tomado à partir das condições. se ІGinІ < Vcpa e ІGinІ > Vcic então μr senão (μ1 - μ2 + 1) / 2 μr 0.5 Na família de CNAP o fator de tolerância à incerteza é utilizado apenas na Célula de Conexão Analítica (CNAPca). Outro fator é o de tolerância à decisão (Ftd) Valores limites de falsidade e verdade VLf = (1 - Ftd ) / 2 e VLv = (1 + Ftd) / 2 μr = (μ1 - μ2 + 1) / 2 104 se μr ≥ VLv então S1 1 (Verdadeiro) senão se μr ≤ VLf então S1 senão S1 0 (Falso) 0.5 (Indefinido) Considerações: Ftd = 0 corresponde: VLv = 0.5 e VLf = 0.5 Isto significa que para qualquer valor de Grau de Certeza resultante μr acima de 0.5 a célula decide-se pela conclusão de estado lógico “verdadeiro” e para qualquer valor do Grau de Certeza abaixo de 0.5 a decisão é o estado lógico “falso” Ftd = 1 corresponde: VLv = 1 e VLf = 0 Isto significa que uma conclusão só será obtida se o Grau de Certeza resultante μr, calculado pela EEB, estiver no seu valor máximo igual a 1, ou no seu valor mínimo igual a 0. Caso contrário, isto é, o resultado de μr não chegar a estes extremos, a célula se acha incapacitada para emitir uma conclusão; ou seja a saída será 0.5 (Indefinição) Os autores (DA SILVA FILHO & ABE, 1999) explicam que para chegar aos sistemas neurais artificiais paraconsistentes de raciocínio lógico é necessário uma série de concepções indicadas na FIGURA 41: 105 Figura 41: Desenvolvimento da Rede Neural Artificial Paraconsistente (DA SILVA FILHO & ABE, 1999). O ponto de partida são as CNAP’s (Células Neurais Artificiais Paraconsistentes), quando conectadas, formam-se UNAP’s (Unidades Neurais Artificiais Paraconsistentes) (PEREIRA, 2011). 106 A FIGURA 42 é uma demonstração do fluxograma com o bloco de análise paraconsistente representativo de uma Célula Neural Artificial Paraconsistente básica que apresenta características de análise da Lógica Paraconsistente Anotada Evidencial E. Figura 42: Fluxograma da Célula Artificial Paraconsistente Básica (DA SILVA FILHO & ABE, 1999) 107 2.5.6 Célula Neural Artificial Paraconsistente (CNAP) A partir da CAPb abordada anteriormente, são estabelecidos os critérios e fundamentos que possibilitam a implementação das CNAP’s, envolvendo alguns conceitos básicos para a construção de algoritmos representativos de cada célula componente da família de Células Neurais Artificiais Paraconsistentes (DA SILVA FILHO & ABE, 1999) (PEREIRA, 2011). Na família CNAP’s, todas as células estão alicerçadas em Lógica Paraconsistente Anotada Evidencial E, mas cada uma possui uma função diferente e é representada por um algoritmo que permite sua programação em linguagem de programação, tendo-se as seguintes classificações de células segundo respectivas funções (FIGURA 40) (DA SILVA FILHO & ABE, 1999) (PEREIRA, 2011): Célula Neural Artificial Paraconsistente de Conexão analítica (CNAPCa): faz a análise analógica dos sinais e conecta todas as células componentes da rede. Célula Neural Artificial Paraconsistente de Conexão lógica simples (CNAPCIs): faz a análise lógica dos sinais utilizando conectivos lógico tais como os de maximização e minimização. Célula Neural Artificial Paraconsistente de Conexão lógica seletiva (CNAPCIse): faz a análise lógica dos sinais utilizando conectivos lógicos, tais como os de maximização e minimização, ao mesmo tempo que seleciona qual das suas duas saídas deve ficar ativa, visto que possui duas entradas e duas saídas distintas. Célula Neural Artificial Paraconsistente de passagem (CNAPp): direciona o fluxo de informações para determinada região da rede. Célula Neural Artificial Paraconsistente de complementação (CNAPco): faz a complementação do valor em relação à unidade para qualquer sinal aplicado em sua entrada. Célula Neural Artificial Paraconsistente de decisão (CNAPd): faz a análise paraconsistente e determina uma decisão baseada nos resultados gerados por tal análise, considerando que essa decisão é representada por um estado lógico que pode ser Verdadeiro, Falso ou Indefinido. 108 Célula Neural Artificial Paraconsistente de aprendizagem (CNAPa): aprende e desaprende padrões aplicados com frequência em sua entrada. Célula Neural Artificial Paraconsistente de memorização (CNAPm): guarda padrões aprendidos pela CNAPa em um processo de funcionamento de aprendizagem/memorização. Cada uma das CNAP’s viabiliza uma resposta funcional diferente e, quando interligadas, constituem Unidades Neurais Artificiais Paraconsistentes UNAP’s com funções mais específicas na rede. 2.5.7 Unidade Neural Artificial Paraconsistente (UNAP) As UNAP’s são reunidas de modo a formar sistemas com funções determinadas no processamento dos sinais (DA SILVA FILHO & ABE, 1999) (PEREIRA, 2011): O resultado deste processo é a obtenção de pequenos módulos ou ilhas de tratamento de sinais que, de forma emergente, vão habilitar a construção de Redes Neurais Artificiais Paraconsistentes com características de funcionamento que são próprias do cérebro como, capacidade de aprendizagem, desaprendizagem, plasticidade, robustez e tolerância a falhas (DA SILVA FILHO & ABE, 1999) (PEREIRA, 2011). Segundo os autores (DA SILVA FILHO & ABE, 1999), o tratamento de sinais fundamentado em Lógica Paraconsistente Anotada Evidencial E possui procedimentos matemáticos simples e passíveis de aplicações práticas e diretas, porque todos os componentes da RNAP são compostos por células. Assim, na implementação da RNAP, as células são descritas por algoritmos que facilitam implementações de projetos em linguagem convencional de programação: [...] estes componentes são projetados para que elaborem as funções que vão modelar comportamentos semelhantes aos apresentados pelo cérebro, quando em suas atividades mentais. As várias conexões entre os componentes vão dando forma a determinados blocos que, em conjunto, fazem processamento de sinais com funções bem definidas e, por fim, chegam a estrutura geral a qual denominamos de Rede Neural Artificial Paraconsistente RNAP (DA SILVA FILHO & ABE, 1999) (PEREIRA, 2011). 109 Silva Filho e Abe (1999) apresentam dez configurações de UNAP's, mas esclarecem que "[...] devido às diversidades de tipos das Células Neurais Artificiais paraconsistentes e facilidades de conexões, outras Unidades com funções diferentes das apresentadas podem ser facilmente implementadas" (DA SILVA FILHO & ABE, 1999). Nesse sentido, "as diversas configurações das UNAP's vão formando blocos com características de funcionamento próprias que denominamos de Sistemas Neurais Artificiais Paraconsistentes" (DA SILVA FILHO & ABE, 1999). 2.5.8 Sistema Neural Artificial Paraconsistente (SNAP) Os SNAP's correspondem a grupos de UNAP's interligadas para tratamento, análise e direcionamento de sinais, sendo parte da RNAP. Os SNAP's podem ser divididos em dois tipos: Sistema Neural Artificial Paraconsistente de aprendizado condicionado (SNAPac) e Sistema Neural Artificial Paraconsistente de tratamento de contradições (SNAPtc), dentre os quais interessa neste trabalho o primeiro. No SNAPac "[...] As células são condicionadas a apresentarem certos padrões na saída obtidos através de repetitividade de coincidências" (DA SILVA FILHO & ABE, 1999): Quando um axônio de uma célula A está próximo o suficiente para excitar uma célula B, e, repetitivamente ou persistentemente, toma parte no disparo desta, algum processo de crescimento ou mudança metabólica acontece em uma ou ambas as células, tal que a eficiência de A, como uma célula capaz de disparar B, é aumentada (DA SILVA FILHO & ABE, 1999) (PEREIRA, 2011). Viabiliza-se a elaboração de associações entre partes da rede, referentes a proposições distintas, mas com alguma(s) semelhança(s) em suas informações que podem ser significativas se for observado o processamento paralelo ou conexionista. Isso porque as RNAP's correspondem à interligação entre vários SNAP's, permitindose o tratamento de sinais de maneira paralela e distribuída, o que deve ser observado quando da elaboração da arquitetura da RNAP. 110 2.5.9 Arquitetura de RNAP Na arquitetura de uma RNAP é necessário ter em vista que: [...] algumas Unidades Neurais Artificiais Paraconsistentes UNAP's vão funcionar como componentes periféricos, cujo procedimento é direcionar sinais para controlar fluxo de dados no processamento. Outras Unidades são interligadas compondo Sistemas Neurais Artificiais Paraconsistentes SNAP's de processamento internos que vão manipular dados fazendo análises, aprendendo, associando e memorizando padrões (DA SILVA FILHO & ABE, 1999) (PEREIRA, 2011). A arquitetura pode ser composta de três tipos de módulos (DA SILVA FILHO & ABE, 1999), os quais são dispostos paralelamente: Módulo de aprendizagem primária e memorização de padrões: tem as funções de reconhecer, aprender e criar uma célula de memorização para o padrão aprendido . Módulo de direcionamento de sinais para efetuação da análise: constituído por unidades neurais com o objetivo de comparar e direcionar o fluxo de sinais em dada parte da rede. Módulo de análise e aquisição de conhecimento: analisa os valores dos sinais, bem como identificam similaridades nos padrões adquirindo-se, dessa forma, conhecimento. Tais módulos podem ser conectados por um sistema de raciocínio lógico paraconsistente, que tratam dos processos de inferências. No entanto, não há aprofundamento desse tipo de sistema no presente trabalho porque o tipo aqui utilizado é de aprendizado supervisionado. 111 2.6 Medidas de Qualidade no Diagnóstico 2.6. 1 Os dados: o que deve ser coletado? O que deve ser calculado? Há uma variedade de dados que podem ser coletados, refletindo a natureza e a qualidade da prática de mamografia. Para decidir quais os dados mais essenciais, deve-se considerar três principais questões que medem diretamente o desempenho de um mamografista: (BASSETT, 2000) I. A prática atinge a meta primária de um programa efetivo de rastreamento? Isto é, há uma grande porcentagem de cânceres sendo detectados na população rastreada? Qual é a taxa de detecção e sensibilidade para o câncer assintomático? II. Outros parâmetros importantes estão refletindo o sucesso equivalente do rastreamento e do diagnóstico, demonstrado em outros programas de rastreamento? Isto é, as taxas de requisição de avaliação adicional por imagem encontra-se dentro de uma variação aceitável? Qual é a taxa de reconvocação e qual é o valor preditivo positivo (VP+)? III. Uma grande porcentagem de cânceres com prognóstico favorável está sendo encontrada? Isto é, a maioria dos cânceres mamograficamente detectados são pequenos e confinados à mama? Quais são as porcentagens encontradas de cânceres mínimos e nódulo-negativos? O (Quadro 2) lista os dados essenciais brutos e deduzidos necessários para responder as questões levantadas com exceção para sensibilidade. 112 Quadro 2: Auditória Mamográfica Essencial ou Básica; Dados Brutos e Deduzidos Minimante Desejados (BASSETT, 2000). A. Dados Brutos 1. Dados do período de auditoria e número total de exames neste período. 2. Número de exames de rastreamento; número de exames de diagnóstico. 3. Número de recomendações para avaliação posterior por imagem (reconvocação) (ACR BIRADS Categoria 0 = “Necessita Avaliação Posterior”). 4. Número de indicações de biópsia ou consulta cirúrgica (ACR BI-RADS Categorias 4 e 5 = “Achados Suspeitos” e “Altamente Sugestivo de Malignidade”). 5. Resultados de biópsias: maligno ou benigno (guarde dados separados para casos de AAF ou biópsia incisional). 6. Estadiamento do tumor: tipo histológico (in situ [ductal] ou invasivo [ductal ou lobular]), grau, dimensão e situação de linfonodos. B. Dados deduzidos (Calculados a partir dos dados brutos) 1. Verdadeiros positivos 2. Falsos positivos = três subdefinições: FP1, FP2, FP3 3. Valor preditivo positivo a. Em caso de serviço de rastreamento / diagnóstico 1. Baseado em exame de rastreamento anormal (VP+1) 2. Baseado em indicação para biópsia ou consulta cirúrgica (VP+2). 3. Baseado em resultado de biópsia (VP+3 ou Taxa de Biópsia Positiva). b. Em caso de serviço de rastreamento exclusivo, pode-se definir somente de uma forma. 1. Baseado em exame de rastreamento anormal (VP+1). 4. Taxa de detecção de câncer para casos assintomáticos (rastreamento verdadeiro). 5. Porcentagem de cânceres mínimos encontrados. 6. Taxa de reconvocação. Devem-se manter estatísticas de auditoria separadas para pacientes assintomáticas e sintomáticas. Câncer mínimo: invasivo ≤ 1 cm ou câncer ductal in situ Os dados adicionais (Quadro 3) são postos como parte da lista mais completa dos dados brutos, embora possam acrescentar tempo considerável e complexidade 113 ao processo de auditagem. Uma comparação interessante são as taxas de câncer prevalente versus incidente (cânceres prevalentes são aqueles encontrados na primeira mamografia; cânceres incidentes são aqueles detectados em mamografias subsequentes), como valor preditivo de vários achados mamográficos e de significância em vários fatores de risco (BASSETT, 2000). Quadro 3: Auditória Mamográfica Mais Completa; Dados Brutos a Serem Coletados (BASSETT, 2000). 1. Dados do período de auditoria e número total de exames neste período (usualmente período de 6 a 12 meses). 2. Fatores de risco a. Idade da paciente na época do exame b. História de câncer de mama: pessoal ou familiar (especialmente câncer pré-menopausa em parente de primeiro grau – mãe, irmã ou filha) c. Terapia de reposição hormonal d. Carcionoma lobular in situ ou atipia previamente comprovados por biópsia. 3. Número e tipo de mamografias: rastreamento (assintomática) ou diagnóstica (sinais ou sintomas mamários clínicos de possível anormalidade ou mamografia de rastreamento anormal) 4. Primeiro exame ou estudo de acompanhamento (repetido). 5. Interpretação e indicação mamográfica ( tentar concordar com o ACR Lexicon) a. Avaliação posterior por imagem (reconvocação) [ACR BI-RADS Categoria 0 = “Necessita Avaliação Posterior”]. b. Acompanhamento de rotina [ACR BI-RADS Categorias 1 e 2 = “Negativo” e “Achados Benignos”). c. Acompanhamento precoce [ACR BI-RADS Categoria 3 = “Acompanhamento a Curto Prazo”. d. Biópsia ou consulta cirúrgica (ACR BI-RADS Categorias 4 e 5 = “Achados Suspeitos” e “Altamente Sugestivo de Malignidade”) 6. Resultados de biópsia: benigno ou maligno (manter dados separados para casos de AAF ou biópsia incisional). 7. Dados de câncer. a. Achados mamográficos: massas, calcificações, sinais indiretos de malignidade, não há sinais mamográficos de malignidade b. Tumor palpável ou não-palpável c. Estadiamento do tumor (patológico): tipo histológico, grau, dimensão e estado de linfonodos. Embora não necessários para o cálculo dos dados essenciais deduzidos listados no Quadro 2, os dados brutos adicionais no Quadro 3 são ainda vantajosos porque proporcionam informações sobre certas variáveis que podem causar 114 importante flutuação nos resultados de auditoria. Por exemplo, se uma grande proporção de exames mamográficos foi realizada em pacientes rastreadas pela primeira vez (aquelas com cânceres prevalentes), a taxa de cânceres detectados deveria ser muito mais alta do que em uma população que foi rastreada previamente (cânceres incidentes). Desta forma, o conhecimento da proporção das mamografias de rastreamento iniciais para as mamografias de rastreamento de acompanhamento pode afetar consideravelmente os resultados da auditoria (BASSETT, 2000). Como ocorre com os dados brutos, os dados essenciais deduzidos podem ser suplementados com dados deduzidos adicionais de grande valor (Quadro 4) (BASSETT, 2000). Quadro 4: Auditória Médica mais Completa: Dados Derivados a Serem Calculados (BASSETT, 2000). 1. Verdadeiros positivos, falsos positivos (três subdefinições: FP 1, FP2, FP3), verdadeiros negativos, falsos negativos. 2. Sensibilidade. 3. Valor preditivo positivo. a. Baseado em exame de rastreamento anormal (VPP1). b. Baseado em indicação para biópsia ou consulta cirúrgica (VPP2). c. Baseado em resultados de biópsia (VPP3). 4. Especificidade. 5. Taxa de detecção de câncer. a. Taxa de detecção de câncer para casos assintomáticos (rastreamento verdadeiro). b. Prevalente versus incidente. c. Total. d. Taxas dentro de grupos etários variados. 6. Porcentagem de cânceres mínimos encontrados. 7. Taxa de reconvocação. Embora esses dados adicionais sejam altamente desejáveis, o tempo dispendido limita o processo e falta de acessibilidade de certos dados brutos, especialmente os falsos negativos, podendo impedir que sejam calculados. 115 Com base nos estudos de auditagem na literatura, para calcular qualquer um dos dados deduzidos no Quadro 2 ou Quadro 3, cada exame mamográfico deve ser catalogado em quatro grupos, de acordo com as seguintes definições: (BASSETT, 2000) I. Verdadeiro positivo (VP): Câncer diagnosticado dentro de um ano após a recomendação de biópsia baseada em mamografia anormal (consenso). II. Verdadeiro negativo (VN): Ausência de diagnóstico conhecido de câncer dentro de um ano após uma mamografia normal (consenso). III. Falsos negativos (FN): Diagnóstico de câncer dentro de uma ano após uma mamografia normal. IV. Falsos positivos (FP): Três diferentes definições estão na literatura: a. Ausência de câncer identificado, diagnosticado após um ano de uma mamografia de rastreamento anormal (isto é, uma mamografia para a qual foi recomendada avaliação posterior por imagem ou biópsia) (FP1). b. Ausência de câncer identificado, diagnosticado dentro de um ano após recomendação de biópsia ou consulta cirúrgica baseadas em uma mamografia anormal (FP2). c. Doença benigna encontrada em biópsia dentro de um ano após recomendação de biópsia ou consulta cirúrgica baseadas em mamografia anormal (FP3). Outra forma de conceituar a relação entre estes quatro grupos é expressa graficamente na FIGURA 43. 116 Figura 43: Representação gráfica da relação entre verdadeiros positivos (VP), falsos positivos (FP), falsos negativos (FN) e verdadeiros negativos (VN) (BASSETT, 2000). As mulheres rastreadas para câncer de mama com mamografia foram postas no grupo principal (positivo); se o teste indicou uma suspeita de câncer de mama, ou no grupo final (negativo); se o teste foi normal. Cada grupo foi então subdivido baseado em quais pacientes subsequentemente tiveram diagnóstico de câncer de mama (coluna da esquerda) ou não (colunas da direita). Existem então quatro combinações possíveis: (BASSETT, 2000) I. Se tanto o teste quanto a biópsia foram positivos para câncer, é denominado um verdadeiro positivo (VP). II. Se ambos são negativos para câncer de mama ou se o teste é negativo e não há evidência clínica de câncer de mama na ausência de biópsia, trata-se de um verdadeiro negativo (VN). III. Se o teste é positivo e a biópsia é negativa ou não há evidência clínica de câncer de mama dentro de um ano, é um falso positivo (FP). IV. Ao contrário, se o teste é negativo e a biópsia positiva, trata-se de falso negativo (FN). A partir destas definições e dos dados brutos é possível calcular os seguintes dados reduzidos: 117 I. Sensibilidade Definida como a probabilidade de detectar um câncer quando ele existe ou, alternativamente, como a porcentagem de todas as pacientes com câncer de mama dentro de um ano após o rastreamento, corretamente diagnosticadas como suspeitas na mamografia. Sensibilidade = VP / (VP + FN) (18) Valor Preditivo Positivo: Podem ser aplicadas três definições: 1) VP+1 (rastreamento anormal): a porcentagem de todos os exames de rastreamento anormais (isto é, aqueles para os quais foram recomendados biópsia, avaliação posterior por imagem ou exame de acompanhamento de intervalo curto) que resultem em diagnóstico de câncer. VPP+1 = VP / número de exames de rastreamento anormais ou VP / (VP + FP1) (19) 2) VPP2 (biópsia recomendada): a porcentagem de todos os casos onde houve indicação de biópsia ou consulta cirúrgica em consequência de rastreamento que resultou em diagnóstico de câncer. VPP+2 = VP / número de casos onde houve indicação de biópsia após exames de rastreamento anormais ou VP / (VP + FP2) (20) 3) VPP+3 (biópsia realizada): a porcentagem de todas as biópsias realmente feitas em decorrência de rastreamento, as quais resultaram em diagnóstico de câncer. Isto é também conhecido como rendimento de malignidade de biópsia ou a taxa positiva de biópsia. 118 VPP+3 = VP / número de biópsias ou VPP+3 = VP / (VP + FP3) (21) É importante saber qual a definição de VPP+ que está sendo usada para interpretar e comparar com precisão os dados de auditagem. Para clínicas que realizam só mamografias de rastreamento, somente o VPP+1 é importante na avaliação de seus dados. Para clínicas que fazem tanto a mamografia de rastreamento quanto a de diagnóstico, todas as três definições de VP+ podem ser aplicadas. II. Especificidade Definida como a probabilidade de um laudo normal de mamografia quando não existe câncer ou, alternativamente, como a porcentagem de todas as pacientes sem evidência de câncer de mama dentro de um ano após o rastreamento, corretamente identificado como normal à época de sua realização. Especificidade = VN / (FN + VN) (22) Existe alguma variação no âmbito da especificidade, dependendo da aplicação de definição de falsos positivo, mas as variações são pequenas em decorrência do pequeno número de falsos positivo e do grande número de verdadeiros negativos apresentados em auditorias. 119 Taxa Global de Detecção de Câncer: É definida como o número global de cânceres detectados por 1000 pacientes examinadas através de mamografia. Este número deve estar disponível em todas as auditagens básicas. É de grande valor a taxa de detecção de câncer em pacientes assintomáticas, na medida em que este grupo rastreamento. representa Assim, todas a verdadeira população as mamografias devem de ser separadas por rastreamento ou diagnóstico, de forma que a taxa de detecção de câncer no grupo assintomático possa ser calculada. 2.6.2 Analisando os dados: o que realmente os dados quantitativos informam? O real valor de calcular os dados na seção anterior reside no fato de permitir uma medida quantitativa dos principais achados descritos anteriormente como reflexo da qualidade do desempenho de um mamografista: porcentagem de todos os cânceres achados mamograficamente, porcentagem de pacientes reconvocados para posterior avaliação e biópsia, e porcentagem de cânceres pequenos com linfonodos negativos detectados por rastreamento. Usando-se a sensibilidade (se mensurável), taxa de detecção de câncer, VPP, taxa de reconvocação, tamanho do tumor e positividade dos linfonodos, pode-se obter ótimos benefícios mesmo de uma auditagem básica (BASSETT, 2000). A relação entre estes dados pode ser mais bem conceituada usando-se uma curva ROC (Receiver Operating Characteristic) em mamografia, como é mostrado na FIGURA 44 (BASSETT, 2000). 120 Figura 44: Curva ROC representativa para mamografia (BASSETT, 2000). A curva ROC para qualquer mamografista individualmente pode ser gerada avaliando-se suas habilidades interpretativas na previsão da probabilidade de malignidade em um grupo misto de casos mamográficos positiva e negativa com resultados comprovados (BASSETT, 2000). O mamografista registra seu desempenho como uma série de pontos gráficos baseados em suas respostas a tal avaliação, com cada ponto representando que a probabilidade observada pelo mamografista assinala contra os achados reais. As séries resultantes de pontos assinalados definem a curva ROC individual. Cada curva ROC do mamografista será levemente diferente, mas deverá estar sempre acima da linha diagnonal (FIGURA 44), englobando a curva desde a esquerda inferior até a direita superior, representando o desempenho. Aqueles com habilidade interpretativa mais aguçada irão gerar uma curva ROC cujo arco se delineia mais alto, acima daquela linha (mostrando uma alta porcentagem de interpretações de verdadeiro 121 positivo e verdadeiro negativo); aqueles com menos habilidade irão gerar uma curva correndo próxima á linha (BASSETT, 2000). 2.6. 3 Benefícios adicionais: A auditoria como um instrumento de ensino A auditoria de grupo é um importante instrumento de ensino porque proporciona poder estatístico, que por sua vez dá ensejo a comparação com as taxas gerais esperadas em outras auditorias de grupo (Quadro 5) (BASSETT, 2000). Quadro 5: Análise dos dados de auditória médica: metas desejáveis (BASSETT, 2000). VP+ baseado em exame de rastreamento anormal (VP+1) 5% - 10% VP+ quando há indicação de biópsia (cirúrgica, AAF ou incisional (VP+ 2) 25% - 40% Achado de tumores – estágio 0 ou 1 > 50% Achado de tumores – câncer mínimo > 30% Positividade de linfonodo < 25% Achado de cânceres / 1000 casos 2 – 10 Achado de cânceres prevalentes / 1000 exames de primeira vez 6 – 10 Achado de cânceres incidentes / 1000 exames de acompanhamento 2–4 Taxa de reconvocação ≤ 10% Sensibilidade (se mensurável) > 85% Especificidade (se mensurável) > 90% Somente casos de rastreamento. Cânceres mínimos: câncer invasivo ≤ 1 cm ou câncer ductal in situ 2.6.4 Considerações Médico-Legais Estatutos que protegem a revelação de registros em revisões pareados, gerados por um comitê estruturado de revisões pareadas no ambiente hospitalar. No entanto, não existe virtualmente nenhum estatuto para proteger das revelações de todas as outras informações geradas no hospital sob os auspícios de atividades organizadas de revisão de qualidade ou informação de revisão de qualidade obtidas no ambulatório. Assim, é recomendado que auditorias completas de mamografia sejam 122 mantidas inicialmente como auditorias internas. Os médicos que interpretam não devem divulgar os dados da auditoria sem conhecimento da legislação vigente (BASSETT, 2000). A instituição de uma ação legal por erro profissional médico tem a intenção de buscar restituição para a paciente que acredite que o médico acusado não se tenha conduzido de maneira razoável com respeito aos cuidados profissionais que deveriam ter sido prestados. No campo das imagens da mama, os deveres do médico são variáveis, dependendo do tipo de prática oferecida pelo serviço em que a assistência foi prestada. Emergem tanto uma abordagem médica orientada para doenças, quanto um serviço orientado para a saúde pública. 2.6.5 Curva ROC (Receiver Operating Characteristic) A curvas ROC facilita o entendimento entre a relação da sensibilidade e a especificidade de um teste diagnóstico quantitativo ao longo de valores contínuos de ponto de corte (SOUZA, 2009). Para construir uma curva ROC traça-se um plano cartesiano composto de eixos unitários. Nesse plano são representados os pares FP (frações de falso positivo) e TP (frações de verdadeiro positivo). FP representa a fração de pacientes sem câncer de mama que foram incorretamente diagnosticados como positivos, isto é, são os falsos positivos. TP, por sua vez, está relacionada com a fração de pacientes com câncer de mama que foram corretamente diagnosticados como positivos, ou seja, são os verdadeiros positivos (ESPÍRITO-SANTO, 2004). Os pares ordenados (FP, TP) descrevem o desempenho dos sistemas de diagnóstico (classificadores de atributos de mamografias) de uma maneira mais significativa do que os simples indicadores do percentual (desvio absoluto, desvio relativo, desvio erro quadrático) de acerto dos classificadores em relação ao valor real. Contudo, a descrição do desempenho de classificadores feita a partir dos pares ordenados (FP, TP) não é uma maneira inteiramente adequada de se descrever o desempenho de um sistema de diagnóstico (ESPÍRITO-SANTO, 2004), pois dois aspectos inerentes ao diagnóstico feito podem variar independentemente, quais 123 sejam: A capacidade dos classificadores em distinguir os pacientes saudáveis dos portadores da doença; Quais as frações de FP e TP a serem empregadas em aplicações clínicas quando existe disponível uma particular capacidade de discriminação. A referida capacidade de discriminação do sistema de diagnóstico de câncer depende do nível de separação, ou da superposição, das distribuições de probabilidades das evidências dos vários estados de verdade. Assim, cada estado de verdade é representado por uma distribuição de probabilidade. A menos que a capacidade de discriminação seja perfeita, pelo menos alguns diagnósticos devem ser feitos fundamentados em evidências concretizadas a partir de mais de um estado de verdade (ESPÍRITO-SANTO, 2004). O observador pode, face à evidência disponível, adotar um limar de confiança para selecionar o diagnóstico mais apropriado. Diferentemente da capacidade de discriminação, o limiar de confiança utilizado por um observador dependerá das estimativas de probabilidade que o mesmo emprega em aplicações médicas e dos julgamentos feitos considerando as consequências dos vários tipos de decisões corretas e incorretas. A distinção entre capacidade de discriminação e critério de decisão é mais aparente quando um diagnóstico, feito a partir de duas distribuições sobrepostas, implica na seleção de um limiar capaz de detectar (separar) casos anormais. A mesma distinção é necessária em testes que devem ser interpretados de maneira subjetiva em que uma particular impressão de confiança, também subjetiva, considera o fato dos resultados dos testes serem originários de mais de um estado de verdade (representados por distribuições distintas). Nessa situação, uma decisão é tomada somente após a comparação de cada impressão com um limiar de confiança interno (ESPÍRITO-SANTO, 2004). Para uma capacidade de discriminação fixa, por exemplo, um conjunto de populações não linearmente separáveis, representadas por distribuições de probabilidades que se sobrepõem, define-se os termos sensibilidade e especificidade (ESPÍRITO-SANTO, 2004). Sensibilidade representa as frações de verdadeiros 124 positivos, isto é, sensibilidade = TP. Especificidade, por sua vez, relaciona-se com a fração de falsos positivos (FP) da seguinte maneira: FP = 1 – TN = 1 – especificidade, em que TN é a fração de verdadeiros negativos. A sensibilidade e a especificidade de um sistema de diagnóstico, mantido constante a capacidade de discriminação, dependerá de um determinado limiar de confiança que um observador emprega para decidir a partir de diferentes estados de verdade representados. A FIGURA 45, esquematicamente, a situação considerada. No diagrama da figura, o eixo horizontal representa a confiança que um radiologista tem que uma dada mamografia é de um paciente positivo, ou seja, a mamografia de um portador da enfermidade (câncer de mama). Analogamente, o mesmo eixo pode representar a confiança que o mesmo radiologista tem que a mamografia é de um paciente negativo para o câncer (ESPÍRITO-SANTO, 2004). As duas distribuições Gaussianas dispostas na figura representam respectivamente as Funções de Distribuição de Densidade de Probabilidade (FDDP) da confiança de que a mamografia é de um paciente positivo para o câncer (Gaussiana da direita) e de um paciente negativo para o câncer (Gaussiana da esquerda). O limiar de confiança está representado pela reta vertical que divide o eixo horizontal em duas partes (ESPÍRITO-SANTO, 2004). A sobreposição das Gaussianas indica que pelo menos algum grau de confiança intermediário de um diagnóstico positivo (diagnosticar câncer um paciente que realmente é portador da doença) pode ser originário de um paciente portador do câncer (paciente positivo) ou de um paciente negativo para o câncer (Figura 45) (ESPÍRITO-SANTO, 2004). 125 Figura 45 : Modelo esquemático utilizado no entendimento da curva ROC. As duas Gaussianas representam as distribuições de densidade de probabilidade do grau de confiança que um radiologista tem ao fazer um diagnóstico positivo. A reta vertical traçada nas Gaussianas e um possível “limiar de confiança” que separa diagnósticos positivos dos negativos (SOUZA, 2009)(ESPÍRITO-SANTO, 2004). A Gaussiana que representa os diagnósticos positivos está posicionada mais à direita, em relação à Gaussiana dos diagnósticos negativos, porque é interessante que o radiologista tenha maior confiança em diagnosticar casos positivos (ESPÍRITOSANTO, 2004). De acordo com o modelo de decisão de diagnóstico ora considerado, um radiologista escolhe entre um diagnóstico positivo e um negativo a partir da comparação do seu grau de confiança em diagnosticar câncer com o limiar de confiança. Este limiar de confiança é especificado em função da experiência do radiologista em diagnosticar câncer de mama. Sendo assim, uma imagem é interpretada como sendo de um paciente “positivo” se o grau de confiança do radiologista excede o limiar de confiança (ESPÍRITO-SANTO, 2004). No gráfico da FIGURA 46, a fração de verdadeiro positivo (TP) é, no gráfico, representada pela área sob a Gaussiana mais à direita (curva que representa a distribuição de densidade de probabilidade dos pacientes com câncer), calculada a partir do limiar de confiança. De modo equivalente, a fração de falso positivo (FP) corresponde à área da Gaussiana mais à esquerda (curva que representa a distribuição de densidade de probabilidade dos pacientes sem câncer), calculada também a partir do limiar de confiança (ESPÍRITO-SANTO, 2004). 126 Mudanças no limiar de confiança (movimento para direita ou para esquerda), implica em variações no par ordenado (TP, FP) ou na relação que existe entre a sensibilidade e a especificidade. Um movimento do limiar de confiança mais para a direita, o que implica em aumentar o grau de confiança do radiologista em diagnosticar positivos, diminui a área sob a Gaussiana dos positivos e conseqüentemente o valor de TP. O mesmo movimento reduz a área sob a Gaussiana dos negativos à direita do limiar de confiança. Como a área dessa região corresponde ao valor de FP, observase também, uma redução de FP. Inversamente, um movimento do limiar de confiança mais para a esquerda aumenta, por motivos idênticos, as áreas sob as Gaussianas, elevando os valores de TP e FP (ESPÍRITO-SANTO, 2004). Essas observações implicam que o par ordenado (TP, FP) varia diretamente com os movimentos do limiar de confiança ao passo que a sensibilidade e a especificidade variam de maneira inversa. Por exemplo, se em um sistema de diagnóstico um paciente negativo para o câncer (diagnosticado por biópsia) for diagnosticado como sendo positivo, porque o limiar de confiança utilizado foi o mais à esquerda, então a sensibilidade do sistema aumentará porque mais pacientes verdadeiros positivos serão corretamente diagnosticados. A especificidade (FP = 1 especificidade), contudo irá diminuir, pois mais pacientes verdadeiros negativos serão diagnosticados incorretamente como positivos, o que justifica o aumento de FP (FIGURA 46) (ESPÍRITO-SANTO, 2004). Se o limiar de confiança é alterado em experimentos repetidos, então uma variedade de pares ordenados (TP, FP) ou (sensibilidade, especificidade) é gerada, podendo ser disposta em um plano cartesiano de eixos unitários. Se a variação do “limiar de confiança é continua”, uma curva suave é obtida. Essencialmente, isto constitui uma curva ROC. Cada ROC indica a relação entre TP e FP ou entre sensibilidade e especificidade disponíveis no sistema de diagnóstico. Essa curva descreve a capacidade de discriminação do sistema (ESPÍRITO-SANTO, 2004). Um limiar de confiança arbitrário utilizado por um observador em uma decisão particular determina o ponto de operação, uma combinação de TP e FP (ou sensibilidade e especificidade) que é indicada na curva ROC do sistema de diagnóstico. Por convenção, uma típica curva ROC é traçada exibindo TP (sensibilidade) como função de FP (1 - especificidade) (ESPÍRITO-SANTO, 2004). ROC’s típicas são mostradas na Figura 45. A ROC posicionada mais à 127 esquerda, ROC2, possui uma maior capacidade de discriminação do que a curva ROC1, pois, considerando valores distintos de TP (no gráfico, TP1 e TP2) nas duas curvas, observa-se que as correspondentes frações de falso positivo na curva ROC2 (FP21 e FP22) são menores que as frações de falso positivo da curva ROC1 (FP11 e FP12) (ESPÍRITO-SANTO, 2004). Isto implica que, para um mesmo diagnóstico (por exemplo, detecção de câncer de mama em mamografias), as decisões tomadas pelo radiologista a partir da curva ROC2 apresentam um maior grau de confiança (quando comparada com a curva ROC1), pois, naquela curva, a um alto valor de TP (alta sensibilidade) está associado um baixo valor (relativamente aos valores da ROC1) de FP (alta especificidade) (ESPÍRITO-SANTO, 2004). Em aplicações médicas, dedicadas ao diagnóstico de câncer, é desejável que na ROC, e conseqüentemente no sistema de diagnóstico, que os pontos de operação tenham alta sensibilidade (altos valores de TP) e alta especificidade (baixos valores de FP) correspondente. Isto é interessante pois, face à sobreposição dos diversos estados de verdade, que um diagnostico positivo (TP) seja menos influenciado pelas frações de falso positivo (FP). O gráfico da próxima figura mostra ainda, a titulo de ilustração e reforço do entendimento do significado da curva ROC em sistemas de diagnóstico de câncer, uma ROC retilínea em que para qualquer ponto de operação TP é igual a FP. Nessa ROC ou sistema de diagnóstico que ela representa, a probabilidade de um radiologista diagnosticar um caso como positivo é exatamente igual à probabilidade de diagnosticar o mesmo caso como negativo (Figura 46) (ESPÍRITO-SANTO, 2004). 128 Figura 46: Curvas ROC típicas que podem resultar a partir da análise de mamografias. P11 e P21 são postos particulares de operação respectivamente das curvas ROC1 e ROC2(ESPÍRITO-SANTO, 2004). 129 2.7 Estado da Arte Neste tópico serão feitos relatos, com indicações de referências, do que existe no meio científico relevante ao tema abordado neste trabalho. Conforme mencionado anteriormente, Computer-Aided Diagnosis (CAD) é um sistema computacional que pode ser empregado no apoio ao diagnóstico de câncer de mama feito por radiologista. Geralmente, um sistema CAD manifesta-se sob dois aspectos distintos, mais comunicáveis entre si: obtenção dos fatores de forma, texturas e bordas a partir de mamografias e classificação dessas informações em malignos e benignos (ESPÍRITO-SANTO, 2004). O emprego de um sistema CAD tem por objetivo a redução, nas mamografias analisadas, da taxa de ocorrência dos falsos-negativos e a elevação dos valores das predições positivas para as ocorrências de lesões anormais. Percebe-se a partir daí que o emprego de sistemas CAD na avaliação de mamografias pode reduzir a quantidade de pacientes a serem submetidos ao exame de biópsia (ESPÍRITOSANTO, 2004). Em um sistema CAD, o diagnóstico de câncer de mama é feito a partir da extração de certos atributos de imagens médicas (mamografias) e posterior discriminação desses atributos (features) em tumores e calcificações malignos ou massas e calcificações benignas. Tal discriminação ou separação de classes é feita utilizando-se implementações computacionais de classificadores de populações. A tarefa dos classificadores é discriminar uma população, agrupando elementos semelhantes em sub-populações com características afins. O foco do trabalho é o desenvolvimento de um classificador paraconsistente capaz de auxiliar no diagnóstico do câncer de mama, através da quantificação de características da imagem e sua classificação como correspondendo a padrões normais ou anormais. • Análise de atributos de mamografias (fatores de forma, texturas e bordas); • Classificadores de atributos em malignos e benignos. 130 2.7.1 Benefícios potenciais da tecnologia CAD Técnicas de CAD podem oferecer uma alternativa econômica para dupla-leitura como um meio de reduzir os erros. Um sistema CAD poderia atuar como um segundo leitor. O que pode levar o radiologista a rever áreas consideradas suspeitas em uma mamografia, considerando a opinião de um algorítmo especializado de computador (RANGARAJ, FABIO, & DESAUTELS, 2007). Uma sessão típica CAD funciona da seguinte forma: 1. O radiologista realiza a primeira leitura da mamografia, registrando todas as áreas questionáveis ou suspeitas. Opcionalmente, o radiologista pode melhorar digitalmente a imagem mamográfica, a fim de prestar mais atenção aos detalhes sutis que poderiam sugerir a presença de lesões. 2. O sistema CAD digitaliza a mamografia, para detectar características suspeitas. 3. O radiologista analisa as instruções dadas pelo sistema CAD para verificar se alguma área suspeita foi deixada desmarcada na primeira leitura. 4. Algorítmos CAD também podem ser usados para estimar a probabilidade de uma determinada lesão ser benigna ou maligna, tal como uma estimativa revista pelo radiologista. Estudos têm demonstrado que os sistemas CAD podem melhorar a sensibilidade de um radiologista, sem um aumento substancial da taxa de reconvocação de pacientes (ASTLEY & GILBERT, 2004). Ciatto et al. (2003) comparam mamografias convencionais e leitura CAD em um teste de proficiência nacional de mamografia na Itália. Os autores concluíram que o desempenho de leitura única com CAD é semelhante ao da dupla leitura. Foram utilizadas 89 mamografias de rastreamento negativos, para um grupo de 19 radiologistas. Como resultado: dupla leitura (sensibilidade de 46,1% e taxa de reconvocação de 26,1%) e dupla leitura com CAD (sensibilidade de 42,1% e taxa de reconvocação de 23,9%). 131 Freer e Ulissey (2001) realizaram um estudo prospectivo do efeito CAD na triagem, onde 12.860 mamografias foram interpretadas com a ajuda de um sistema de CAD ao longo de um período de 12 meses. Observou-se que o número de cânceres detectados aumentou 19,5%, que a proporção de doenças malignas em fase inicial detectadas aumentou de 73% para 78%. A taxa de reconvocação aumentou de 6,5% para 7,7%, e o valor preditivo positivo da biópsia permaneceu inalterado em 38%. O estudo levou à conclusão de que a utilização de uma ferramenta CAD pode melhorar a detecção de tumores em fase inicial, sem efeito adverso sobre a taxa de reconvocação ou do valor preditivo positivo da biópsia. Burhenne et al. (2000) estudaram o desempenho de um sistema CAD comercial na detecção de massas e calcificações em mamografia, obtendo-se uma sensibilidade de 75% para a detecção de massas e distorção arquitetural, um falso-positivo por imagem. Para o estudo, utilizaram 1083 mamografias (406 com calcificações, 677 com massas ou distorção arquitetural) e 20 radiologistas. Evans et al. (2002) estudaram a capacidade de um sistema CAD comercial para marcar o carcinoma lobular invasivo da mama: a ferramenta CAD detectou 86 de 94 lesões (sensibilidade de 91%), também foram detectados 17 de 20 casos de distorção arquitetural (sensibilidade de 85%). Para o estudo utilizaram 90 mamografias (94 lesões de carcinoma lobular invasivo). Birdwell et al. (2001) estudaram o desempenho de uma ferramenta CAD comercial na marcação de cânceres que foram negligenciados pelos radiologistas: o software detectou cinco dos seis casos de distorção arquitetural, e 77% das lesões anteriormente não atendidas, em 2,9 falsos-positivos por imagem. Para o estudo, utilizaram 110 casos de cânceres detectados anteriormente, onde um grupo de radiologistas recomendou a reconvocação dos pacientes. Baker et al. (2003), estudaram a sensibilidade de duas ferramentas CAD comerciais falharem na detecção de distorção arquitetural: menos de 50% dos 45 casos de distorção arquitetural apresentados foram detectados (com uma sensibilidade 132 baseada na imagem 38% menor, ou 30 de 80 imagens, em 0,7 falso-positivo por imagem). Broeders et al. (1993) sugeriram que melhorias na detecção de distorção arquitetural poderiam levar a uma efetiva evolução no prognóstico de pacientes com câncer de mama. 2.7.2 Tecnicas empregadas em CAD O desenvolvimento de novas ferramentas CAD voltadas para câncer de mama é um campo de pesquisa atual, em particular no que diz respeito à detecção de anormalidades sutis na mamografia (RANGARAJ, FABIO, & DESAUTELS, 2007). Sistemas comerciais CAD alcançaram um grau satisfatório de eficácia na detecção de massas e calcificações. No entanto, certas áreas de pesquisa voltadas para o desenvolvimento de ferramentas CAD voltadas para câncer de mama ainda exigem atenção (RANGARAJ, FABIO, & DESAUTELS, 2007). Um número relativamente pequeno de pesquisadores (em comparação com o número de pesquisadores que realizaram trabalhos relacionados com massas e calcificações) tem concentrado sua atenção sobre o problema de detectar distorção arquitetural, na ausência de uma massa central. A maioria dos esforços publicados é direcionado para uma categoria mais geral de anomalias, tais como lesões espiculadas, que englobam algumas das possíveis aparições de distorção arquitetural. Outras linhas de pesquisa que requerem mais atenção incluem a análise de assimetria bilateral, estruturas curvilíneas (CLS) e densidade da mama como um preditor do risco de câncer de mama. Em um contexto mais amplo, as áreas de interesse relacionadas com CAD de câncer de mama incluem o desenvolvimento de sistemas para reconvocação baseados em conteúdo de mamografias, atlas indexados e sistemas de mineração de dados. Sistemas de mamografia digital de campo total, embora ainda em fase de avaliação, poderiam facilitar a aplicação rotineira das técnicas acima mencionadas (RANGARAJ, FABIO, & DESAUTELS, 2007). 133 2.7.2.1 Melhoria da Imagem As características de diagnóstico em mamografia, tais como massas e calcificações, podem ser pequenas e ter baixo contraste relativamente aos tecidos circundantes da mama. Esses atributos podem tornar os recursos de diagnóstico difíceis de detectar. Técnicas de realce de contraste podem melhorar a capacidade de um radiologista perceber características de diagnósticos sutis, levando a um diagnóstico precoce, mais exato do câncer da mama (RANGARAJ, FABIO, & DESAUTELS, 2007). Melhorias no contraste podem melhorar a qualidade de uma mamografia, tal como indicado por Ram (1982) , que indicaram, ainda, que a aplicação de técnicas de aumento de contraste numa situação clínica pode reduzir a dose de radiação em cerca de 50%. O aprimoramento de imagens mamográficas poderia melhorar a precisão da detecção de sinais precoces de câncer de mama. Laine et al. (1994) apresentaram um método para o realce de contraste não-linear com base na representação de multi-resolução, com uso de pequenas ondulações diádicas. Gordon e Rangayyan (1984) foram os primeiros a relatar o uso de processamento de imagem baseada em vizinhança adaptativa para melhorar o contraste da imagem mamográfica. Rangayyan e Nguyen (2003) definiram um método baseado em tolerância para o cultivo de regiões de primeiro plano, que poderiam ter formas arbitrárias em vez de formas quadradas. Dhawan et al. (1986) investigaram os benefícios de várias funções de transferência de contraste em um algoritmo de quadrados adaptativos por vizinhança para o realce de contraste. As funções de transferência de contraste foram avaliadas como ln (1+3C ), 1-exp (-3C ), √C , e tanh(3C ), onde C é o contraste original. Eles descobriram que, enquanto a função de contraste adequado foi importante para trazer as características de interesse em mamografias, foi difícil selecionar esse tipo de função. 134 Dhawan e Le Royer (1988) propuseram uma função de realce de contraste ajustável para melhorar as características mamográficas. Rangayyan et al. (1997) e (2002) estudaram o desempenho de seu algorítmo ANCE em aumentar a sensibilidade do diagnóstico de câncer de mama por meio da análise ROC e dos testes de McNemar (RANGAYYAN, 2005). Um conjunto de 78 mamografias de 21 casos difíceis (14 malignos e sete benignos) e outro conjunto de 222 mamografias de 28 pacientes com câncer e seis casos de controle benignos foram digitalizadas com uma resolução de cerca de 4096 × 2048 × 10 bits pixels e, subsequentemente, transformados com o algorítmo ANCE. Os filmes originais, bem como as imagens não transformadas e as transformadas em correspondentes digitais, foram apresentados a seis radiologistas experientes para uma análise ROC, e a três radiologistas para a análise da progressão do câncer. Observou-se que o desempenho dos radiologistas melhorou com o processamento ANCE, no que diz respeito à imagem analógica e à leitura da imagem digital, em termos da área sob a curva ROC. Observou-se também que a sensibilidade do diagnóstico foi melhorada pelo algoritmo ANCE. Testes de simetria McNemar indicaram que a confiança no diagnóstico de casos de progressão de câncer foi melhorada pela técnica ANCE com um elevado nível de significância estatística ( p = 0 , 0 0 0 1 - 0,005), com nenhum efeito significativo sobre o diagnóstico de casos de controle benignos ( p = 0,08 -,1). 2.7.2.2 Segmentação de mamografias e análise de densidade da mama Foi observado que o aumento da densidade da mama está geralmente associado a um maior risco de desenvolvimento de câncer (BOYD, 1995) e (URSIN, 2005). Muitos pesquisadores têm estudado métodos computacionais para a avaliação do risco de desenvolvimento de câncer de mama por meio de análise automatizada da densidade da mama. Byng et al. (BYNG, 1996) calcularam a assimetria de histogramas de 24 × 24 (3,12 x 3,12 milímetros) seções de mamografias. Uma assimetria média foi calculada para cada imagem pela média sobre todas as medidas das imagens seccionadas. Mamografias de seios com maior densidade fibroglandular foram observadas como tendo histogramas com maior densidade, resultando em 135 assimetria negativa. Por outro lado, as mamografias de seios gordos tendem a ter assimetria positiva. A dimensão fractal da imagem de mama também foi calculada: a imagem foi interpretada como um mapa de relevo e a dimensão fractal foi calculada usando o método de contagem de caixa. A assimetria e as medidas de dimensões fractais foram dimensionadas para serem úteis em predizer o risco de desenvolvimento de câncer de mama. Caulkin et al. (1998) observaram que o câncer da mama ocorre mais frequentemente nos quadrantes superiores e exteriores da mama, e que a maioria dos cânceres são associada com glândulas, em vez de tecidos adiposos. Portanto, a detecção de diferentes estruturas anatômicas no seio (por exemplo, o tecido adiposo, o disco fibroglandular e o músculo peitoral), pode facilitar a análise do risco de desenvolvimento de câncer da mama, bem como a detecção precoce de câncer da mama. No entanto, a maioria das técnicas propostas para CAD de câncer da mama analisa toda a mamografia, sem ter em conta a observação de que os sinais de câncer de mama podem ter diferentes aparências em regiões diferentes. Com base nestas observações, alguns pesquisadores propuseram métodos para o segmento e também para modelar mamografias em termos de regiões anatômicas. Karssemeijer (1998) usou a transformada de Hough para identificar o músculo peitoral como uma borda em linha reta na mamografia. Ferrari et al. (2004) propuseram dois métodos para a identificação do músculo peitoral em mamografias. O primeiro método é uma variante do método de Karssemeijer, que utiliza a transformada de Hough e filtragem aplicada às células do acumulador. No entanto, a hipótese de uma linha reta para a representação do músculo peitoral nem sempre é válida, e pode impor limitações em fases subsequentes da análise de imagens. O segundo método proposto por Ferrari et al. (2004) , com base na filtragem direcional utilizando ondulações Gabor, supera esta limitação. 136 2.7.2.3 Detecção e classificação de microcalcificações Calcificações em mamografias aparecem como regiões relativamente brilhantes, devido ao maior coeficiente de atenuação de raios-X (ou densidade) do cálcio, em comparação com o tecido normal da mama. Apresentar calcificações no interior das massas densas ou sobrepostas por tecidos densos no processo de realização de mamografias pode apresentar diferenças de nível de cinza baixo ou contraste com relação ao seu fundo local. Calcificações malignas tendem a ser numerosas, em agrupamentos pequenos, variando em tamanho, formato, ângulo, com forma irregular e ramificações (FERRARI, 2004) e (SICKLES, 1986). Por outro lado, calcificações associadas a doenças benignas são geralmente maiores e mais arredondadas, em menor número, mais distribuídas e mais homogêneas em tamanho e forma. A detecção e classificação de microcalcificações têm sido extensivamente estudadas, com diversos autores relatando sobre várias abordagens com sucesso para esta tarefa. A pesquisa realizada por Cheng et al. (2003) enumera cerca de 200 referências sobre a detecção auxiliada por computador e classificação de microcalcificações, incluindo métodos para a melhoria visual de microcalcificações, segmentação, detecção, análise de malignidade, e as estratégias para a avaliação de algoritmos de detecção . Shen et al. (1993), propuseram um método para a detecção e classificação de calcificações mamográficas. O método começa com uma região de multi-tolerância para a detecção das regiões de potencial de calcificação e de extração de contornos. Recursos de forma baseados em momento, descritores de Fourier, e compactação são então extraídos. Finalmente, uma rede neural é utilizada para a classificação dos vetores característicos, a fim de distinguir entre calcificações malignas e benignas. As taxas de classificação corretas para calcificações benignas e malignas foram de 94% e 87%, respectivamente (RANGAYYAN, SHEN, & DESAUTELS, 1993). Em um trabalho relacionado (SHEN, RANGAYYAN, & DESAUTELS, 1994) sobre estudos de recursos de forma e uma análise mais abrangente de classificação de calcificações, a precisão da classificação de 100% foi obtida para calcificações benignas e malignas, com um banco de dados contendo 143 calcificações comprovadas por biópsia (79 malignos e 64 benignos). Apêndice A. 137 Strickland (1996) desenvolveu um método de duas etapas baseado em transformações de ondas para a detecção e a segmentação de microcalcificações. Nesse método, a detecção de calcificações é realizada no domínio das ondas. Os locais detectados são reforçados no domínio de ondulações, antes do cálculo da transformada inversa da onda. O aparecimento de microcalcificações é aumentado por este processo, um processo de limiar suficiente para segmentar as calcificações. A base de dados de teste consistiu de 40 mamografias, e uma sensibilidade de 91% em três falsos-positivos por imagem. El-Naqa et al (2002) usaram máquinas de vetores de suporte para detectar agrupamentos de microcalcificações. O algoritmo foi testado com 76 mamografias, contendo 1120 microcalcificações. A sensibilidade de 94% foi relatada, com um falso positivo por imagem. Yu et al. (2006) utilizaram um filtro de ondulações para a detecção de microcalcificações, e um modelo de campo aleatório de Markov para obter características de textura da vizinhança de cada calcificação detectada. As características aleatórias de textura de campo baseadas em Markov, juntamente com três características de textura auxiliares (o valor médio do pixel, a variação de nível de cinza e uma medida de densidade de borda) foram usadas para rejeitar falsospositivos. O método foi avaliado utilizando 20 mamografias contendo 25 áreas de microcalcificações agrupadas. A sensibilidade de 92% foi obtida, com 0,75 falsopositivo por imagem. Soltanian-Zadeh et al. (2004) comparam quatro grupos de características de acordo com o seu poder de discriminação na separação de microcalcificações nas categorias benignos e malignos. As microcalcificações foram segmentadas utilizando um método automatizado, e vários recursos foram extraídos. Cada recurso pertencia a uma das seguintes categorias: características baseadas em multi-ondulações, recursos baseados em ondulações, características de textura de Haralick (1979) e características de forma. Dentro de cada grupo, um procedimento de recurso de seleção baseado em algoritmos genéticos foi utilizado para identificar os recursos mais adequados para uso com um k-esquema de classificação do vizinho mais 138 próximo. O desempenho da classificação de cada grupo de características foi então determinado utilizando análise ROC. A área sob a curva ROC varia entre 0,84-0,89, e observou-se que as características de multi-ondulações proporcionaram o melhor desempenho, seguido pelas características de forma. 2.7.2.4 Detecção e classificação de massas Tumores de mama e massas aparecem geralmente na forma de regiões densas na mamografia. Uma massa benigna típica tem um limite redondo, liso e bem circunscrito e, por outro lado, um tumor maligno geralmente tem um limite espiculado, áspero, e desfocado (M.J., 1997), (ESPÍRITO SANTO R. , 2004) e (American College of Radiology (ACR), 1998). No entanto, não existem casos atípicos de massas benignas macrolobulada ou espiculadas, bem como tumores malignos ou microlobulados bem circunscrito. Diversas técnicas têm sido desenvolvidas para a detecção e classificação de tumores, em mamografias. Os sistemas comerciais disponíveis incorporam algumas destas técnicas. Kegelmeyer et al. (1994) propuseram um método para a detecção de lesões espiculadas que empregava quatro medidas de textura de Laws (1980) e um novo recurso sensível a padrões. O banco de dados de teste consistiu de 85 casos, com 49 casos normais e 36 casos positivos; um total de 330 mamografias foram utilizadas, com 68 lesões. A sensibilidade de 97% foi alcançada com 0,28 falso-positivo por imagem. Rangayyan et al. (2000) introduziram dois novos fatores de forma, índice de forma espiculada (SI) e concavidade fracionária (Fcc), e aplicaram-nos para a classificação de massas mamográficas manualmente segmentadas. A utilização combinada do índice espiculado, concavidade fracionada e compactação (C) rendeu uma precisão da classificação benigna versus maligna de 81,5%. Apêndice B. Rangayyan et al. (1997) propuseram o uso de fatores de forma e borda acutance (AC) para a classificação de massas manualmente segmentadas como benigno ou maligno, e espiculadas ou circunscritas. Uma exatidão de classificação de 95% foi 139 obtida com um banco de dados de 54 imagens mamográficas, incluindo 16 circunscritas benignas, sete circunscritas malignas, 12 espiculadas benignas e 19 massas espiculadas malignas. Apêndice B Guliato et al. (2003) elaboraram dois métodos para a segmentação das massas utilizando conjuntos fuzzy. O primeiro método determina o limite de uma massa crescente por região, depois de uma etapa de pré-processamento, valorização baseada em conjunto difuso, o método produziu limites do tumor que foram consistentes com contornos desenhados manualmente. O segundo método incorpora a teoria dos conjuntos Fuzzy na região onde o procedimento esta sendo realizado, produzindo uma segmentação difusa das massas. Os autores observaram que o grau de heterogeneidade ao entorno do limite de massa correlacionado com a natureza benigna ou maligna do tumor, porque para os tumores malignos são esperadas margens mal definidas. Usando uma medida da não homogeneidade da segmentação distorcida na região de fronteira, os autores obtiveram uma classificação de sensibilidade benigna ou maligna de 80% com uma especificidade de 90%. Guliato et al.(2003) também desenvolveram um método para a combinação de vários resultados de segmentação em um único resultado, o uso de operadores de fusão difusa. Foram observadas as regiões segmentadas resultantes mais consistentes com as regiões correspondentes segmentadas por um radiologista do que os resultados individuais de segmentação. 2.7.2.5 Análise de estruturas curvilíneas A presença de estruturas curvilíneas (CLS) é um fator importante na detecção de anormalidades na mamografia. A mama contém muitas estruturas que são reconhecidas como CLS, tais como dutos de leite, vasos sanguíneos, ligamentos, tecido do parênquima e as bordas do músculo peitoral. Algumas lesões são caracterizadas pela presença de certos tipos de CLS, como espículas, na imagem mamográfica (por exemplo, massas espiculadas e distorções arquiteturais), ou pela disposição assimétrica de textura na imagem da mama. Por outro lado, algumas lesões, como massas circunscritas, podem ser obscurecidas por CLS sobrepostas; a aparência alterada resultante pode levar a erros de diagnóstico. Portanto, a 140 capacidade para detectar e classificar o CLS poderia melhorar o desempenho de algoritmos de CAD. Evans et al. (2002) elaboraram um método para caracterização estatística de CLS normais em mamografia. CLS foram detectadas automaticamente e seis fatores de forma foram calculados a partir de cada CLS. Uma Análise de Componentes Principais (PCA) foi realizada, e as duas dimensões principais foram modeladas utilizando um modelo de mistura de Gauss. Wai et al. (2004), propuseram um método para a segmentação de CLS, baseado em modelos físicos de CLS na mama. Foram realizados experimentos qualitativos, e os autores relataram que o seu método produziu respostas bem localizadas que são imunes à presença de ruído. 2.7.2.6 Análise de assimetria bilateral Um dos sinais utilizados por radiologistas para detectar a presença de câncer da mama é a assimetria bilateral, onde as mamas esquerda e direita diferem uma da outra na aparência global nas mamografias correspondentes. Em BI-RADS (American College of Radiology (ACR), 1998) definiu-se que a assimetria indica a presença de maior volume ou densidade do tecido mamário, sem uma massa distinta, ou condutos mais proeminentes, de uma mama em comparação com a área correspondente, do outro seio. Miller e Astley (1994) propuseram uma técnica para a detecção de assimetria bilateral, que compreendeu um procedimento baseado no de textura para a segmentação do tecido glandular semi-automatizada, e as medidas de forma, para a detecção de ocorrência de assimetria. Uma precisão de 86,7% foi registrada em um conjunto de dados de teste de 30 pares de mamografias. Em outro estudo, Miller e Astley (Miller, 1994) apresentaram um método para a detecção de assimetria bilateral com base em medidas de forma, topologia e distribuição de brilho no disco fibroglandular. O método foi testado em 104 pares de mamografias, e uma exatidão de classificação de 74% foi obtida. 141 Lau e Bischof (1991) desenvolveram um método para a detecção de tumores da mama, utilizando uma definição de assimetria que engloba medidas de brilho, rugosidade e de direcionamento. O método foi avaliado utilizando 10 pares de mamografias com assimetria, que foi o fator significativo para o diagnóstico do radiologista. Uma sensibilidade de 92% foi obtida com 4,9 falsos-positivos por mamografia. 2.7.2.7 Detecção de Distorção Arquitetural Distorção da arquitetura é uma das anormalidades mais comumente perdidas na mamografia. Distorção arquitetural é definida como a distorção da arquitetura normal, sem massa visível definida, incluindo espículas que irradiam de uma retração ou distorção de um ponto focal na borda do parênquima (American College of Radiology (ACR), 1998). A definição inespecífica de distorção arquitetural e sua natureza sutil tornaram o desenvolvimento de técnicas de processamento de imagem para a detecção em desafio. Sampat et al. (2005) empregaram filtragem no domínio de transformação de Radon, para melhorar a mamografia, seguido pela utilização de filtros espiculados radiais para detectar lesões espiculadas. O algoritmo foi testado em 45 casos com massas espiculadas, e 45 casos com a presença de distorção arquitetural. Uma sensibilidade de 80% foi obtida com 14 falsos-positivos por imagem na detecção da distorção de arquitetural, e 91% com 12 falsos-positivos por imagem na detecção de massas espiculadas.O uso da dimensão fractal para caracterizar a presença de distorção de arquitetura em regiões de interesse (ROIs) mamograficas tem sido explorado. Guo et al. (2005) estudaram a caracterização de distorção arquitetural, utilizando a dimensão de Hausdorff, e uma máquina classificadora vetorial para distinguir as ROIs mamográficas, exibindo a distorção de arquitetura e aqueles com padrões normais de mamografia. Um conjunto de 40 ROIs foi selecionado a partir do banco de dados MIAS (SUCKLING, 1994) (19 ROIs com distorção arquitetural e 21 ROIs com padrões de tecido normal). Os autores relataram uma precisão de classificação de 72,5%. 142 Tourassi et al. (2006) estudaram a utilização da dimensão fractal para diferenciar padrões normais e distorção arquitetural em ROIs mamográficas. O conjunto de dados utilizado na pesquisa continha 112 ROIs com padrões de distorção arquitetural e 1388 ROIs exibindo padrões de tecido normal. O resultado a partir da utilização da curva ROC foi A z = 0 , 8 9 . Os autores relatam também que foi observada a dimensão fractal média de ROIs exibindo a distorção arquitetural menor do que a de ROIs com os padrões normais, e que a diferença observada foi estatisticamente significativa sob uma amostra independente, bicaudal t-teste. Ayres e Rangayyan (2003) e (Ayres F.J., 2005) estudaram a caracterização de distorção arquitetural em ROIs mamográficas, usando retratos de fase. Um retrato de fase é uma exposição dos possíveis percursos, no plano de fase, do estado de um sistema dinâmico. Rao e Jain (1992) propuseram o uso de retratos de fase em análise de textura orientadan: os padrões geométricos nos retratos de fase dos sistemas lineares de primeira ordem, as equações diferenciais podem ser associadas com os padrões encontrados em uma imagem que apresenta textura orientada. Uma base de dados de 106 ROIs extraídos da base de dados Mini-MIAS foi utilizada no trabalho de Ayres e Rangayyan (2005), que contém 17 casos de distorção arquitetural, 45 normais, dois ROIs com calcificações malignas, e 44 massas (oito espiculadas malignas, quatro circunscritas malignas, 11 espiculadas benignas, e 19 massas circunscritas benignas). Uma sensibilidade de 76,5% e uma especificidade de 76,4% foram obtidas, com uma área sob a curva ROC de A z = 0 , 7 7 . 2.7.2.8 Atlas indexado, mineração de dados e recuperação baseada em conteúdo O advento dos programas de rastreio mamográfico tem gerado uma série de dados, tais como relatórios de pacientes e imagens mamográficas, armazenados em vários bancos de dados em centros de saúde e universidades ao redor do mundo. Tal riqueza de dados pode ser explorada através do uso de tecnologias de informação de gestão, beneficiando pesquisadores, profissionais clínicos, estudantes, pacientes, 143 empresas envolvidas na pesquisa e desenvolvimento relacionados com sistemas CAD e outros participantes em um esforço para reduzir a mortalidade por câncer de mama. O dicionário Merriam-Webster define dados como "informação factual (como medidas ou estatísticas), utilizado como base para o raciocínio, discussão ou cálculo", e informações como "o conhecimento obtido a partir de pesquisa, estudo ou instrução". Os dados representam uma entidade sem sentido que são transformados em informações através do processo de análise e atribuição de significado. É necessário desenvolver as ferramentas computacionais adequadas a fim de obter informações úteis a partir das vastas quantidades de dados presentes nas bases de dados de mamografia e associados. Pode-se discutir sobre a forma mais eficiente de recuperação e análise de informações, observando como os mecanismos de busca ajudam a dominar a complexidade e quantidade de dados disponíveis na Internet. No entanto, é necessário ajustar as ferramentas de busca de informação sobre a natureza da informação a ser recuperada. Alto et al. (2005) estudaram a adequação de medidas objetivas de forma, nitidez de borda e textura para recuperar mamografias com massas com características semelhantes. A medida de precisão de recuperação foi determinada a ser de 91% quando se utilizam os três recursos mais eficazes pesquisados pelos autores, concavidade fracionada, a nitidez e soma entrópica (medida de textura definida por Haralick (1979). 2.7.2.9 Atributos e classificação Durante a leitura de uma mamografia o radiologista pode, por exemplo, notar aspectos dimensionais (altura, largura e profundidade), forma, textura, borda, etc; pode traduzir esses aspectos em valores específicos e, de uma maneira sistemática, concluir, a partir dessas informações, que o câncer está presente ou não no material examinado. Em CAD, o diagnóstico desse tipo de patologia é feito em duas etapas. Inicialmente, recursos computacionais são empregados para extrair certas características (atributos) das imagens médicas. Os atributos são traduzidos em 144 fatores de forma (SHEN, RANGAYYAN, & DESAUTELS, 1993), texturas (HARALICK, SHANMUGAM, & DINSTEIN, 1973), (RANGAYYAN, MUDIGONDA, & DESAUTELS, 2000) e definição de borda (RANGAYYAN R. M., 1997) (TÚLIO & RANGAYYAN, 2003). A partir daí, certas ferramentas específicas, também de natureza computacional, são utilizadas na identificação da presença do câncer. Uma dessas ferramentas é o classificador de características (features classifiers) (ESPÍRITOSANTO, 2004). Neste tópico são apresentadas algumas referências dedicadas ao estudo dos aspectos morfológicos, texturas, definição de borda e classificação de atributos. Bruce e Adhami, em (1999), utilizam a transformada de ondulação na extração de forma de massas contidas em mamografias. O estudo envolve 60 mamografias segmentadas manualmente por radiologistas. Na determinação das formas são usadas as técnicas fundamentadas em resoluções simples e múltiplas. As formas são classificadas em circular, nodular ou tentacular, usando o Linear Discriminant Analysis (LDA). A precisão das classificações usando resolução simples e múltiplas assumem um valor de 83%. Usando somente resolução simples, a precisão diminui para 72%. Chan (1995) explora a utilização de informações de texturas (atributo de mamografias digitalizadas) na classificação de massas e tecidos normais de mamas. São utilizadas 168 regiões de interesse (ROI) com massas mamográficas e 504 ROI’s contendo tecidos normais, massa benignas ou malignas. As informações de textura, calculadas a partir das regiões são: correlação, entropia, energia, inércia, diferença inversa de momento, soma dos momentos médios, soma das entropias e diferenças das entropias. Os valores de área sob a curva Receiver Operating Characteristics (ROC) (WOODS & BOWYER, 1997) encontrados são 0,84 e 0,82, respectivamente, para o treino e teste com o conjunto de dados. Polakowski (1997) examina o desenvolvimento de modelos típicos de visão computacional para detectar massas mamográficas a partir do cálculo do tamanho, da circularidade, do contraste e dos atributos de textura;. Utilizou uma base de dados constituída de 53 casos benignos e 36 casos malignos. Massas malignas são identificadas com uma precisão de 92%, com uma razão de falsos-positivos de 1,8 por imagem. 145 Rangayyan (2000) faz a descrição da morfologia de massas mamográficas e tumores a partir da fração de concavidade e convexidade, Índice de forma espiculada (forma tentacular), fator de compactação e informações de texturas (correlação, diferença de momentos, entropia, inverso da diferença de momentos e segundo momento). Neste trabalho são empregadas 54 imagens mamográficas contendo massas e tumores (28 casos benignos e 26 casos malignos). A classificação das massas e dos tumores é feita via Rede Neural Feedforward - MLP. A melhor proporção de classificação entre casos malignos e benignos encontrada tem valor 82,1%, com uma área sob a ROC igual a 0,85. Túlio (2003) estudou a classificação de massas mamográficas em malignas e benignas a partir dos seguintes atributos de imagem: fatores de forma (compactação - C, descrição de Fourier -f, concavidade fracionária - Fcc e Índice de forma espiculada - SI), texturas (14 medições de texturas: correlação, entropia, energia, inércia, diferença inversa de momento, soma dos momentos médios, soma das entropias, diferenças das entropias, etc.) e definição de borda (acutance - Ac). Os atributos são extraídos de 57 mamografias a partir das técnicas de dilatação e erosão dos contornos das massas. São realizadas simulações (treinamento e teste da rede de classificação) com diversas combinações dos atributos de imagem e observada a influência das combinações na classificação das massas. As combinações utilizadas são: fatores de formas entre si, fatores de forma e texturas, fatores de forma e acutance; texturas, fatores de forma e acutance. A classificação dos atributos é feita em um perceptron e em uma MLP. A precisão das classificações é comparada em termos da área Az sob a ROC. Treinamentos com fatores de forma e textura proporcionam valores de Az de até 0,99. É observado, contudo, que somente combinações de atributos que incluem ao menos um fator de forma, independente da topologia da rede de classificação empregada, produzem elevados valores de Az. A descrição das complexidades de calcificações em mamografias a partir dos fatores de forma: Descrição de Fourier (f), Momento (m) e Fator de compactação (C) é estudada por Shen e Rangayyan (1993). As calcificações são classificadas em malignas e benignas utilizando uma Rede Neural do tipo multlayer perceptron (MLP). No treinamento da rede (MLP) é utilizado o procedimento leave-one-out. Empregando uma base de dados constituída de 64 calcificações benignas e 79 malignas (confirmadas por biópsia), encontra-se nos experimentos uma taxa de detecção de calcificações de 81% (casos benignos) e 146 853% (casos malignos) e uma taxa de classificações corretas de 94% (casos benignos) e 87% (casos malignos). 2.7.2.10 Classificação feita a partir de Redes Neurais feedforward (MLP) Em CAD, um típico classificador de atributos de imagens é a MLP. Aqui, serão apresentados alguns trabalhos em que essa abordagem é empregada em aplicações médicas dedicadas ao diagnóstico do câncer de mama (ESPÍRITO-SANTO, 2004). Yuzen (1993) treinou uma MLP de três camadas para interpretar atributos mamográficos extraídos por radiologistas. No treinamento da MLP seram utilizadas 43 imagens clínicas bem distribuídas em termos de casos malignos e benignos. O desempenho da MLP foi avaliado empregando-se a ROC. A área calculada sob a ROC tem valor 0,95. Kupinsk e Anastasi (1999) realizaram experimentos com a classificação de dados sintéticos (os pesquisadores não utilizaram imagens médicas). A classificação dos dados foi feita com uma MLP e com algoritmos evolutivos. Os desempenhos das duas abordagens foram analisados e comparados em uma curva ROC. 2.7.2.11 Classificadores de múltiplos estágios (a família ART) Pesquisando os classificadores com mais de um estágio (Redes Neurais de classificação), encontramos Redes Neurais cujas arquiteturas são constituídas de dois estágios. No trabalho publicado por Carpenter e Markuzon (1998), por exemplo, a família dos classificadores de duplo estágio ARTMAP é empregada em treinamentos supervisionados (HAYKIN S. , 1999), reconhecimento e predição de casos clínicos. Nesse trabalho é feito um estudo sobre a aplicabilidade dos ARTMAP na resolução de problemas relacionados com a predição feita a partir de base de dados médicos. Um desses problemas é a inconsistência de casos, isto é, vetores de entrada idênticos correspondendo a diferentes resultados à saída da rede de classificação. Os resultados obtidos com a família ARTMAP são, nesse trabalho, comparados com outras abordagens, quais sejam: regressão logística (HOWELL, 1992), modelo ADAP (uma espécie de perceptron) (SMITH, 1962), KNN (DUDA & HART, 1973), algoritmo não supervisionado CLASSIT (GENNARI, 1989), classificadores baseados em 147 exemplos IB1, IB2 e IB3 (AHA & ALBERT, 1998) e árvore de decisão C4 (QUINLAN, 1986). A base de dados utilizada nos estudos é constituída de um conjunto de casos de Diabetes, adquiridos junto aos pesquisadores (SMITH J. W., 1988), um conjunto de mamografias originárias da Universidade de Winconsin, um conjunto de dados do Hospital do Coração de Vancouver e dados médicos fornecidos pelo Medcare Cholecystectomy. Também encontramos na literatura, estudos (treinamentos, testes e classificação) feitos com a rede ART2LDA (HADJIIK, 1999). Essa abordagem combina os modelos de treinamento não supervisionado (primeiro estágio - rede ART2) e supervisionado (segundo estágio – LDA). Tal estudo encontra justificativas em dois aspectos fundamentalmente significativos nas implementações de classificadores de populações. Um dos aspectos são as limitações dos classificadores mono-estágios em lidar com populações não linearmente separáveis (é o caso dos Discriminantes Lineares ou LDA). O outro é a baixa capacidade de generalização desses classificadores quando poucos casos são disponíveis para o treinamento da rede (implementações MLP, por exemplo). O estudo utiliza 348 mamografias contendo 169 massas benignas e 179 tumores malignos (confirmados por biópsia). A visibilidade das massas ou dos tumores é feita por um radiologista que atribui notas entre 1 e 10 às mamografias analisadas. Uma nota 1 atribuída, significa que a massa tem uma aparência muito próxima de massas benignas. A curva ROC é empregada para avaliar a precisão das classificações feitas. A área sob a ROC (Az) calculada para a rede ART2LDA tem valor 0,81, enquanto que os valores de Az calculados para as redes LDA e MLP são, respectivamente, 0,80 e 0,78. 2.7.2.12 Algoritmos evolutivos (EA’s) Yao (1999) estuda os EA’s ou Algoritmos Evolutivos. Nesse estudo, EA’s são elementos pertencentes a uma classe especial de algoritmos que são desenvolvidos a partir dos fundamentos e princípios da evolução natural. Eles incluem estratégia evolutiva (ES) (SCHWEFEL, 1981) programação evolutiva (EP) e algoritmos genéticos. Uma importante característica de todos os EA’s é a estratégia aplicada em populações. Indivíduos pertencentes a uma população competem e trocam informações uns com os outros, objetivando a realização de certas tarefas. 148 2.7.2.13 Classificação feita a partir da rede RBF Funções de Base Radial (RBF) podem aproximar de maneira arbitrária qualquer função contínua de várias variáveis em um domínio compacto, contanto que um número suficiente de funções radiais seja conhecido (HAYKIN S. , 1999). Em outras palavras, toda função de várias variáveis pode ser representada em um espaço em que os geradores são funções radiais, ou seja, as funções de várias variáveis são, nesse espaço, representadas a partir da combinação linear de funções radiais (geradores ou bases do espaço). Funções, quando assim representadas, permitem a configuração de uma rede com camada de entrada, camada de saída e pontos de conexão, ou seja: a rede RBF. Haykin (1999) apresenta toda a descrição matemática das RBF como classificadores de populações. Também nessa referência são considerados aspectos relativos à teoria de regularização de redes RBF e formas de treinamento. 2.7.2.14 Otimização Combinatória A resolução de problemas de otimização, sem a interferência desfavorável dos mínimos locais, não é uma exclusividade dos algoritmos evolutivos. Em nossa pesquisa bibliográfica encontramos uma outra abordagem que resolve problemas de otimização, encontrando sempre a solução ótima (ou mínimo absoluto ou máximo absoluto). Estamos falando do algoritmo Simulated Annealing. Tal algoritmo tem seus fundamentos na otimização combinatória. Encontramos na referência bibliográfica (HAYKIN S. , 1999) os fundamentos dessa abordagem, modelagem matemática e sinalização para a possibilidade de a mesma poder ser empregada no treinamento de Redes Neurais RBF. Em (WILLIAM, 1992) encontramos um algoritmo do método Simulate Annealing (ESPÍRITO-SANTO, 2004). Em (SOUZA S. J., 2001) o algoritmo Simulated Annealing é empregado no treinamento de uma rede RBF a ser utilizada na recuperação de padrões de sinais de telecomunicações. Nos estudos feitos em (WILSON, 1991), a presente abordagem é 149 utilizada no treinamento de uma Rede Neural cujo objetivo é encontrar o ponto ótimo de conectividade da rede para um número constante de entradas que apresentam pesos (ligações sináptica) fixos. Nesse trabalho, a rede é treinada de uma maneira diferente da usual, isto é: em lugar de procurar pelos pesos sinápticos ótimos para pontos de conectividade fixos, pesquisa-se os pontos de conectividade ótima com pesos fixos. 150 CAPÍTULO 3 – MATERIAIS E MÉTODO Os recursos utilizados se fundamentam na utilização de métodos e ferramentas necessários ao cumprimentos das fases do ciclo de desenvolvimento de um software. 3.1 Recursos específicos aplicados ao desenvolvimento 3.1.1 Hardware Por se tratar de um projeto de construção de software1 sem vínculos com outros dispositivos, o hardware utilizado se limita ao computador onde o processo de modelagem, codificação, armazenamento dos dados e testes serão realizados. Computador portátil, modelo Acer Aspire 5738-6294 (FIGURA 47). Processador Intel Core 2 Duo T6600, 2.2 GHz, 800 MHz FSB. Memória RAM de 3GB, DDR 3 1033 MHz. Disco Rígido de 320 GB SATA 5400 rpm. Drive Optico DVD Super Multi DL drive. Tela de 15.6” polegadas Widescreen (WXGA) com tecnologia CrystalBrite Full HD. 3 GB de Memória RAM. Placa de Vídeo NVIDIA, com memória de vídeo de 128 MB dedicada. Áudio com sistema de som com alto-falantes integrados. Teclado em Português com tecla ç (Padrão ABNT2) com Teclado numérico. 1 Apontador (Mouse) TouchPad eletrostático. Fax/Modem de alta velocidade de 56Kbps (RJ-11). Placa de Rede 10/100 Mbps Ethernet LAN (RJ-45). Conexão sem fio (WIFI) 802. 11b/g Wireless LAN. O software é a parte lógica, o conjunto de instruções e dados processados pelos circuitos eletrônicos do hardware. 151 Câmera de Vídeo, Webcam de 2.0 Megapixels integrada com microfone embutido. Entradas e Saídas: 04 x Portas USB 2.0, 01 x Saída VGA para Monitores (15 pinos), 01 x Saída TV-Out (S-video) para Televisores, 01 x RJ-11 (modem), 01x RJ-45 (rede), 01 x HDMI, 01 x Entrada FireWire i LINK IEEE-1394 (4 pinos), 01 x Entrada de Microfone Externo, 01 x Saída para Fone de Ouvido ou Alto Falantes Externos, 01 x Entrada de Energia (AC-IN). Portas de Expansão, Suporte para Express Card Leitor de Cartão de Memória; 5-em-1 com suporte para Secure Digital cards MultiMedia cards, Memory Stick, Memory Stick Pro xD Picture Dimensões de 38,0 cm (Largura) x 25,7 cm (Profundidade) x 2,6 cm (Altura). Peso de 2,9 Kg. Alimentação, fonte bivolt (100 / 240 V). Bateria com células de íons de lítion recarregável. Figura 47: Acer Aspire 5738-6294 (Fonte: Acer Inc.) 3.1.2 Sistema Operacional No computador utilizado estão instalados as versões Windows 7.0 Ultimate e Windows XP com Service Pack 3 ambos da empresa Microsoft e as distribuições 152 Debian 6.0 e Ubuntu 12.10 do Linux. O ambiente formado pela plataforma Microsoft adota como premissa o pagamento pela utilização do software, enquanto que a plataforma Linux adota como premissa o software livre2. Opções de desenvolvimento: 1. Sistema Operacional Linux, Linguagem de Programação Java (Ferramenta de desenvolvimento - Eclipse) e Banco de Dados MySQL ou Oracle. 2. Sistema Operacional Windows XP ou Windows 7, Linguagem de programação Object Pascal (Ferramenta de desenvolvimento - Delphi RAD Studio XE2) e Banco de Dados Oracle ou Access. Pela produtividade e facilidade de implementação da ferramenta Delphi RAD Studio XE2 optei pela segunda opção. A única premissa que resolvi adotar foi manter a compatibilidade entre o Windows XP e Windows 7. Para a versão do protótipo também optei pelo Access. 3.1.3 Ferramenta para modelagem de banco de dado A ferramenta CA Erwin Model Navigator versão 7.3, permite o desenvolvimento do modelo do banco de dados lógico e físico gerando os scripts necessários à construção das estruturas de bancos de dados. 3.1.4 Ferramenta para modelagem de negócio A ferramenta Bizagi Modeler versão 2.4.0.8 permite o desenvolvimento do modelo de negócio da aplicação gerando modelos de fácil entendimento. 2 Software Livre é o conceito de se disponibilizar um software para uso, com acesso ao seu código fonte para consulta ou alteração, mediante autorização do seu proprietário. 153 3.1.5 Ferramenta para modelagem UML3 A ferramenta astah versão 6.0.1 permite o desenvolvimento da modelagem dos diagramas presentes na Linguagem de Modelagem Unificada (UML). 3.1.6 Ferramenta para dados estáticos IBM SPSS Statistics permite o gerenciamento de dados e cálculos estatísticos. 3.1.7 Metodologia aplicada ao desenvolvimento Para o desenvolvimento do classificador, utilizou-se de pesquisa bibliografia e de pesquisa de laboratório, uma vez que se trata de verificar o desempenho e cumprimento dos objetivos estabelecidos por meio de controle das variáveis que servem de parâmetro para o seu desenvolvimento. O objetivo da pesquisa de laboratório é a própria aplicação desenvolvida, dentro da qual somente os itens que não correspondem às variáveis-parâmetros devem ser observados e não serão controlados, mas sim verificados. 3.1.8 Modelagem de Negócio A partir do levantamento dos requisitos definiu-se que o software seria formado por dois módulos principais, subdivididos em outros cinco módulos (figura 48): Figura 48: Modelo de Processo de Negócio Macro do Classificador Paraconsistente (construído pelo autor). 3 UML (Unified Modeling Language), linguagem visual utilizada para modelar sottwares baseados no paradigma de orientação a objetos 154 RNAP Descrição O processo RNAP será responsável por definir a forma como os atributos de imagens mamográficas serão classificados pela Rede Neural Artificial Paraconsistente e pela qualidade das classificações geradas. Calcificação Descrição O subprocesso Calcificação será divido em cadastramento de amostras, treinamento da Rede Neural Artificial Paraconsistente e Classificação de novas amostras que deverão ser comparadas ao padrão aprendido pela RNAP. Massas Mamográficas e Tumores Descrição O subprocesso Massas Mamográficas será divido em cadastramento de amostras, treinamento da Rede Neural Artificial Paraconsistente e Classificação de novas amostras que deverão ser comparadas ao padrão aprendido pela RNAP. Análise de Desempenho Descrição O subprocesso Análise de Desempenho terá como função monitorar a qualidade e o desempenho das classificações realizadas. Exame Descrição O processo Exame será subdivido em Laudo e Auditoria Laudo Descrição O subprocesso Laudo deverá receber os dados pessoais da paciente, os dados de identificação da unidade radiológica, o número do exame, os dados de Anamnese, descrição de achados radiológicos, classificação radiológica, recomendações de procedimentos, os dados do técnico e do médico envolvido no processo de realização do exame de mamografia. Este módulo também de ser capaz de interagir com o módulo RNAP para que o software possa classificar possíveis anormalidades, tais 155 como: calcificações, massas mamográficas e tumores. O médico após a coleta de dados poderá gerar o laudo com as recomendações que julgar necessárias. Auditoria Descrição O subprocesso Auditoria será responsável por monitorar o desempenho dos laudos gerados. A FIGURA 49 representa o processo geral de classificação do Classificador. 156 Figura 49: Processo Geral de Classificação do Classificador Paraconsistente (construído pelo autor). O processo descrito pela FIGURA 49 será semelhante aos processos de 157 classificação para calcificações, massas mamográficas e tumores. A diferença está na quantidade de atributos de imagens utilizados e no valor de alguns atributos de textura que são maiores que o intervalo compreendido entre zero e um. Para o caso dos atributos de textura maiores que um se adotou como estratégia a implementação de um método capaz de realizar a normalização de todos os elementos correspondentes a esse atributo, ou seja, dividir todos os atributos pelo maior deles, dessa forma todos os elementos serão redimensionados a faixa compreendida por zero e um. Uma inovação no processo de decisão foi à implementação de um método capaz de balizar os valores resultantes das classificações (FIGURA 56). O classificador passara a se equalizar de tal forma que as novas classificações serão mais confiáveis. Analisando os valores resultantes das classificações foi notado que os valores Benignos na grande maioria são maiores que os valores Malignos. Nesses casos, o resultado esta determinado (FIGURA 50). BENIGNOS Linha de Corte Central MALIGNOS Figura 50: Região bem definida entre Benignos e Malignos (construído pelo autor). Porém nas situações que os valores Malignos ou Benignos atravessam a linha de corte, o resultado mais acertado seria Indefinido. O algoritmo de Balanceamento proposto indica uma tendência de o valor resultante da classificação ser Maligno ou Benigno, dando uma orientação ao médico radiologista de um provável resultado (FIGURA 51). 158 Passo 1: Classificação no modo Balanceamento de pelo menos dois conjuntos de amostras Benignos. Passo 2: Classificação no modo Balanceamento de pelo menos dois conjuntos de amostras Malignas. Passo 3: Identificação do Menor valor resultante Benigno. Passo 4: Identificação do Maior valor resultante Maligno. Passo 5: Tira-se a média aritmética entre os dos valores resultantes, o resultado será o novo valor de corte. Como existe uma distância relevante entre o valor médio obtido e os valores resultantes Benignos e Malignos. Passo 6: Repete-se o processo novamente na busca de dois novos valores de corte. Tira-se a média aritmética entre o maior Maligno e o Valor de Corte obtido no Passo 5, resultando em um valor de corte intermediário superior. Tira-se a média aritmética entre o menor Benigno e o Valor de Corte obtido no Passo 5, resultando em um valor de corte intermediário inferior. O resultado a partir de agora, será: 1. Entre o Maior Maligno e o Valor de Corte Superior, 75% para Benigno. 2. Entre o Menor Benigno e o Valor de Corte Inferior, 75% para Maligno. 3. Entre o Valor de Corte Superior e o Valor de Corte, tendendo a Benigno. 4. Entre o Valor de Corte Inferior e o Valor de Corte, tendendo a Maligno. 159 Linha de Corte Superior Linha de Corte Central Linha de Corte Inferior Figura 51: Linha de Balizamento do Classificador (construído pelo autor). A utilização do método de balizamento (FIGURA 52) pelo processo de classificação reduz a região de conflito, melhorando o acerto de Benignos e Malignos. Como será visto no capítulo 4. Figura 52: Resultado apresentado como 75% para Benigno e valores de balizamento (construído pelo autor). O processo Geral de Classificação foi subdivido em três subprocessos: Cadastro de Amostras, Treinamento da RNAP e Classificação de uma nova amostra. 160 Para efeito de implementação os 20 atributos de imagens (Capítulo 2) presentes na Base de Dados 1 (Apêndice A) e na Base de Dados 2 (Apêndice B) foram subdivididos em conjuntos: I. Calcificação (m, C, f) II. Série 1 (Ac, C, f, Fcc, Si, F1, F2, F3, F4, F5, F6, F7, F8, F9, F10, F11, F12) III. Série 2 (C, Fcc, Si) IV. Série 3 (C, f, Fcc, Si) V. Série 4 (Ac, C, f, Fcc, Si) VI. Série 5 (F1, F2, F3, F4, F5, F6, F7, F8, F9, F10, F11, F12) VII. Série 6 (Ac, C, Fcc, Si, F3, F5) VIII. Série 7 (Ac, C, Fcc, Si, F1, F2, F4) Neste ponto do trabalho é necessário um esclarecimento. A opção de se dividir os conjuntos de atributos em séries se deve a dificuldade do classificador RBFSimulated Annealing desenvolvido no doutorado que deu origem a esse trabalho em treinar a sua rede, o tempo exigido é elevado e a utilização de muitas dimensões (atributos de imagens) para treinamento praticamente inviabiliza o processamento (ESPÍRITO SANTO R. , 2004). A Série 1, não pode ser implementada no classificador RBF-Simulated Annealing, portanto, no capítulo 4, não será possível comparar o desempenho do Classificador Paraconsistente com os classificadores testados no trabalho anterior. A simplicidade dos algoritmos desenvolvidos pelas RNAP permitiu que o atributos de imagens da Série 1 fossem implementados com sucesso, como descrito no capítulo 4. Subprocesso: Cadastro de Amostras A função deste módulo é armazenar um conjunto de amostras que serão utilizadas como base para o treinamento da RNAP, onde será definido um novo conjunto de amostras resultantes do treinamento. As amostras resultantes conterão o padrão 161 aprendido pela rede. A FIGURA 53 representa o cadastramento de amostras da Série 6 (Massas Mamográficas e Tumores) Figura 53: Cadastro de Amostras – Série 6 (Massas Mamográficas e Tumores) (construído pelo autor). Subprocesso: Treinamento da RNAP A função deste módulo é definir um comportamento padrão que possa ser utilizado como comparação com novas amostras. O treinamento da rede pode ser realizado a partir de um conjunto de amostras Benignas, Malignas ou Benignas e Malignas. A figura 9 apresenta um conjunto de amostras Benignas da Série 6 que passaram pelo treinamento. A FIGURA 54 apresenta o padrão aprendido, para a Série. Para cada atributo de imagem haverá um treinamento particular. Para três atributos de imagens, serão três células de aprendizagem para cada conjunto de amostras. Para doze atributos de imagens, serão 12 células neurais de aprendizagem para cada conjunto de amostras (FIGURA 55). 162 Figura 54: Treinamento da Série 6 (Massas Mamográficas e Tumores) para amostras Benignas (construído pelo autor). Figura 55: Padrão Aprendido – Série 6 (Massas Mamográficas e Tumores) (construído pelo autor). 163 Subprocesso: Classificação A função deste módulo além de obter um valor resultante do processamento da rede capaz de determinar se uma nova amostra é Benigna ou Maligna deve exibir a qualidade ou confiabilidade da classificação através do cálculo da Sensibilidade, Especificidade, Valor Preditivo Positivo, Valor Preditivo Negativo, Razão de Verossimilhança Positivo, Razão de Verossimilhança Negativo e Acurácia. Além das quantidades de Verdadeiros Positivos, Falsos Positivos, Verdadeiros Negativos e Falsos Negativos. A FIGURA 56 apresenta a classificação para Balizamento da amostra da Base de Dados 2 (Apêndice B). Figura 56: Balizamento de uma amostra Benigna - Série 6 (Massas Mamográficas e Tumores) (construído pelo autor). 164 A FIGURA 57 apresenta a classificação para Análise da amostra 57 da Base de Dados 2 (Apêndice B). Figura 57: Resultado Maligno de uma classificação bem sucedida (construído pelo autor). 3.1.9 Desenvolvimento Para o desenvolvimento do classificador foi utilizada orientação a objetos associada a dois padrões de projeto, o MVC (Model-View-Controller) e o DAO (Data Access Object). 3.1.10 Orientação a Objetos O termo “orientação a objetos” significa que o software será organizado como uma coleção de objetos distintos, que incorporam estrutura de dados e comportamento. Um sistema orientado a objetos possui pelo menos quatro características: identidade, classificação, herança e polimorfismo (RUMBAUGH & BLAHA, 2006). Identidade: os dados são quantizados em entidades distintas e distinguíveis, chamadas objetos. Dois objetos são distintos mesmo que todos os seus valores de atributos sejam idênticos. 165 Classificação: os objetos com a mesma estrutura de dados (atributos) e comportamento (operações) são agrupados em uma classe. Uma classe é uma abstração que descreve propriedades importantes para uma aplicação e ignora as demais. Herança: é o comportamento de atributos e operações entre classes com base em um relacionamento hierárquico. Polimorfismo: a mesma operação pode se comportar de forma diferente para diferentes classes. 3.1.11 Padrões de Projeto Todo projeto de desenvolvimento é de alguma maneira, novo, na medida em que se quer desenvolver um novo sistema, seja porque ainda não existe um sistema para resolver o problema que está sendo tratado, seja porque há aspectos indesejáveis nos sistemas existentes. Isso não quer dizer que o projeto tenha que ser desenvolvido a partir do zero. Muito pelo contrário. A reutilização é um aspecto fundamental no desenvolvimento de software. Muitos sistemas previamente desenvolvidos são similares ao sistema em desenvolvimento e há muito conhecimento que pode ser reaplicado para solucionar questões recorrentes no projeto de software. Os padrões (patterns) visam capturar esse conhecimento, procurando torná-lo mais geral e amplamente aplicável, desvinculando-o das especificidades de um determinado projeto ou sistema. Um padrão é uma solução testada e aprovada para um problema geral (GAMMA, 2000). Um padrão já foi cuidadosamente considerado por outras pessoas e aplicado diversas vezes na solução de problemas anteriores de mesma natureza. Assim, tende a ser uma solução de qualidade, com maiores chances de estar correto e estável do que uma solução nova, específica, ainda não testada (BLAHA; RUMBAUGH, 2006). 3.1.12 MVC (Model-View-Controller) Padrão de arquitetura que considera três papéis relacionados à interação homem-computador, ou seja, indica como deve ser a organização global do sistema (FOWLER, 2003 (A)). 166 Model ou modelo: se refere aos objetos que representam alguma informação sobre o negócio, ou seja, as classes do domínio da aplicação. View ou visão: se refere à entrada e a exibição de informações na interface de usuário (IU). Controller ou controle: correspondem as classes que conectam o modelo à visão. Este pega a entrada do usuário, envia uma requisição para a camada de lógica de negócio, receber sua resposta e solicita que a visão se atualize. O padrão indica que as classes do modelo não devem conhecer as classes da visão. Isso diminui o acoplamento entre estes componentes resultando em uma maior independência das camadas, como resultado é possível se trocar a IU, de modo gráfico para texto, de ambiente desktop para web, etc., sem afetar as classes modelo. De maneira análoga, as classes da IU não devem implementar regras de negócio. As classes de controle representam o mecanismo de interligação entre as classes da IU e as classes do modelo. São responsáveis pelo encapsulamento dos objetos garantindo um baixo acoplamento. Essa característica permite modificações nas classes participantes de forma independente. De forma particular a classe de controle contém tipicamente informações de sequenciamento das operações. Essas classes não devem executar tarefas que pertençam às classes visão e modelo (FOWLER, 2003 (A)). 3.1.13 DAO (Data Access Object) O padrão DAO define uma interface de operações de persistência, incluindo métodos para criar, recuperar, alterar, excluir e diversos tipos de consulta, relativa a uma particular entidade persistente, agrupando o código relacionado à persistência daquela entidade (BAUER, 2007). Oferece uma interface comum de acesso a dados escondendo as características específicas, o que permite se definir uma interface que pode ser construída para cada nova fonte de dados, viabilizando a substituição de uma implementação por outra (BAUER, 2007). 167 3.1.14 Arquitetura utilizada no Classificador Paraconsistente A proposta do Classificador Paraconsistente é poder ser utilizado de forma real, pelos médicos envolvidos no processo de diagnóstico do câncer de mama a partir de mamografias. Para tanto, o classificador deve estar disponível nas mais variadas plataformas. A arquitetura definida para o protótipo do classificador caminha nesta direção, pois permite que se criem novas IU, sem a necessidade de alteração da parte crucial do classificador. O armazenamento dos dados também pode ser migrado para outros bancos de dados sem a necessidade de grandes alterações no classificador. As camadas de banco de dados e IU, não afetam a estrutura principal do classificador. A FIGURA 58 representa a arquitetura do Classificador Paraconsistente que utiliza os padrões de projetos, MVC e DAO associados. Figura 58: Arquitetura – Classificador Paraconsistente (construído pelo autor). 168 3.1.15 Arquitetura RNAP A FIGURA 59 representa a arquitetura da RNAP empregada no Classificador Paraconsistente. Para cada atributo de imagem o processo se repetirá. No caso particular da Série I que contém 17 atributos de imagens ou dimensões, haverá uma RNAP para cada atributo, onde cada RNAP ao seu final apresentará um valor resultante. A decisão final será tomada a partir dos 17 valores resultantes. Figura 59: Arquitetura da RNAP (construído pelo autor). 169 3.1.16 Diagrama de Sequência – RNAP A FIGURA 60 representa a sequência de eventos do processo de cadastramento das amostras que servirão de base para o aprendizado da RNAP. Para efeito ilustrativo tomei como base o processo formado pelos atributos de forma: momento (m), compactação (C) e descrição de fourier (f) para a classificação de calcificações em benignas ou malignas Figura 60: Diagrama de Sequência - Cadastro de Amostras (construído pelo autor). 170 A FIGURA 61 representa a sequência de eventos do processo de treinamento da RNAP. Figura 61: Diagrama de Sequência - Treinamento da RNAP (construído pelo autor). A FIGURA 62 representa a sequência de eventos do processo de classificação da RNAP. 171 Figura 62: Diagrama de Sequência - Classificação da RNAP (construído pelo autor). 3.1.16.1 Modelo Entidade Relacionamento – RNAP No processo de classificação dos atributos de imagens os dados são armazenados em tabelas de banco de dados, representadas pelo Modelo Entidade 172 Relacionamento da FIGURA 63. Para o caso particular das calcificações são utilizadas cinco tabelas: CALCIFICACAO_01 para o cadastro de amostras, CALCIFICACAO_PADRAO_APRENDIDO_02 para o cadastro das amostras com o padrão aprendido, TIPO_03 para se definir se a amostra é Benigna ou Maligna, PREVISAO_BIOPSIA_08 para se definir se o resultado esperado é Benigno, Maligno ou Indefinido, TIPO_CLASSIFICACAO_07 para se definir se a classificação é de Balizamento ou Análise e a tabela AUDITORIA_SAIDA_CLASSIFICACAO_09 que armazena o resultado da classificação e as medidas de qualidade de cada classificação. Para os casos de massas mamográficas e tumores são utilizadas sete tabelas: MASSA_05 para o cadastro de amostras, MASSA_PADRAO_APRENDIDO_06 para o cadastro das amostras com padrão aprendido, para se definir se a amostra é Benigna ou Maligna, PREVISAO_BIOPSIA_08 para se definir se o resultado esperado é Benigno, Maligno ou Indefinido, TIPO_CLASSIFICACAO_07 para se definir se a classificação é de Balizamento ou Análise, SERIE_04 para se definir qual das sete séries disponíveis será classificada AUDITORIA_SAIDA_CLASSIFICACAO_09 que e armazena classificação e as medidas de qualidade de cada classificação. a o tabela resultado da 173 Figura 63: Modelo Entidade Relacionamento – RNAP (construído pelo autor). 174 CAPÍTULO 4 – Testes Comparativos O estudo comparativo entre o Classificador Paraconsistente e os estudos desenvolvidos em (ESPÍRITO SANTO R. , 2004) vão levar em consideração os conjuntos de atributos mamográficos utilizados nos testes originais, com algumas exceções. 1. No trabalho original não foi possível utilizar todos os atributos mamográficos disponíveis para massas mamográficas e tumores. Para o Classificador Paraconsistente não houve problema, portanto, para este teste só haverá resultados do Classificador Paraconsistente. 2. Os classificadores utilizados anteriormente necessitavam de uma quantidade de amostras para treinamento maior que o número de amostras necessárias para o treinamento com o Classificador Paraconsisnte, portanto, o Classificador Paraconsistente utilizará um número menor de amostras para treinamento. 4.1 Conjuntos de Atributos Mamográficos utilizados nos testes Para a base de dados BD1 não houve necessidade de se criar conjuntos de atributos, portanto, foram utilizados os atributos (m, C e f) com todas as 143 ocorrências. Para o conjunto de dados BD2 houve a necessidade de se criar conjuntos de atributos: Apenas para o Classificador Paraconsistente utilizou-se um conjunto com os 17 atributos de imagens. Conjunto C1: Três fatores de forma (C, Fcc e SI); Conjunto C2: Quatro fatores de forma (C, Fcc, Si e,f); Conjunto C3: Quatro fatores de forma (C, Fcc Si, FF) e a Acutance (Ac); 175 Conjunto C4: Doze informações de textura (F1-F5, contraste-F6, energia-F7, soma das variâncias-F8, diferença das variâncias-F9, diferença da entropiasF10, segundo momento-F11, máxima correlação-F12); Conjunto C5: Três fatores de forma (C, Fcc e SI), Acutance (Ac) e duas medidas de textura (F3 e F5). Conjunto C6: Três fatores de forma (C, Fcc e SI), Acutance (Ac) e três medidas de textura (F1, F2 e F4). 4.2 Caracterização dos atributos de imagens Os atributos existentes nas mamografias são os elementos empregados na caracterização das calcificações, das massas mamográficas e dos tumores. Neste trabalho, a complexidade das calcificações (se são benignas ou malignas) é estudada a partir do cálculo dos fatores de forma m. f e c. A definição e os modelos matemáticos de recorrência destes fatores são examinados no capítulo 2. As massas mamográficas e os tumores são identificados e discriminados (em benignas e malignas) determinando-se os valores de C, f, Fcc, SI (fatores de forma), Ac (parâmetro que depende do cálculo do gradiente) e algumas medidas de texturas (F1-F5 e F6-F12). As definições e os modelos dos parâmetros que caracterizam as massas mamográficas e os tumores podem ser encontrados no capítulo 2. 4.3 Métodos de treinamento e teste dos classificadores Para os classificadores estudados anteriormente (ESPÍRITO SANTO R. , 2004) os treinados e testes com as bases de dados descritas anteriormente, considerandose os subconjuntos de dados em que elas possam ser particionadas (quando for o caso) e as diferentes topologias das redes. Para percebermos a capacidade de generalização dos classificadores, isto é, a precisão em diagnosticar (classificar) casos não previstos nos treinamentos, foram adotados nas simulações o 176 procedimento leave-one-out (também conhecido com método round-robin). Neste procedimento, todos os casos da base de dados, exceto um, são utilizados no treinamento da rede do classificador. O único caso deixado de fora do treinamento (leave-one-out) é empregado no teste do classificador. 4.4 Testes Comparativos Para quantificar a qualidade dos testes utilizou-se a curva ROC (Capítulo 2). A exatidão de um teste diagnóstico é proporcional à área sob esta curva ROC (AUC), isto é, ela será tanto maior quanto mais a curva se aproximar do canto superior esquerdo do diagrama. Em virtude disso, a curva terá uma exatidão maior quanto maior for a sua área. O valor da área igual a 1 representa um teste perfeito; a área igual a 0,5 representa um valor sem importância (Tabela 3) (SOUZA P. R., 2009). Tabela 3: Qualidade do diagnóstico em relação à área da curva ROC (SOUZA P. R., 2009) Área (AUC) Qualidade de Diagnóstico 0,9 a 1,0 Excelente 0,8 a 0,9 Bom 0,7 a 0,8 Regular 0,6 a 0,7 Ruim 0,5 a 0,6 Insignificante Para o entendimento do gráfico, da curva ROC, quanto maior a sensibilidade maior a ocorrência de acertos de casos malignos e quanto maior a especificidade maior a ocorrência de acertos de casos benignos. 177 4.5 Testes utilizando a base de dados BD1 Para o teste com atributos de forma para a classificação de calcificações foram utilizadas 21 amostras para o treinamento da RNAP e 122 para classificação. Base de dados utilizada BD 1 (Apêndice A). O gráfico 1 esboça a exatidão do teste 1. Gráfico 1: Resultado do teste com atributos de forma para calcificação (construído pelo autor). Tabela 4 : Área sob a curva ROC para o teste 1 (construído pelo autor). Asymptotic 95% Confidence Interval Area ,986 Std. Errora ,017 Asymptotic Sig.b ,000 Lower Bound ,000 Upper Bound 1,000 178 Levando-se em consideração que a área sob a curva ROC foi de 0,986 o teste segundo a tabela 3 pode ser considerado excelente. 4.6 Testes utilizando a base de dados BD2 Para todos os cojuntos (C1 a C6) e para a série composta por todos os atributos de imagens foram utilizadas para treinamento da RNAP 21 amostras e outras 36 foram utilizadas para classificação. Base de dados utilizada BD 2 (Apêndice B). 4.6.1 Teste com todos os atributos de imagens mamográficas para massas e tumores O gráfico 2 esboça a exatidão do teste 2. Gráfico 2: Resultado do teste com todos os atributos de imagens para massas mamográficas e tumores (construído pelo autor). 179 Tabela 5: Área sob a curva ROC para o teste 2 (construído pelo autor). Asymptotic 95% Confidence Interval Area ,938 Std. Errora Asymptotic Sig.b ,037 ,000 Lower Bound Upper Bound ,844 1,000 Levando-se em consideração que a área sob a curva ROC foi de 0,938 e que em boa parte do teste a sensibilidade se manteve igual a 1,0 o teste segundo a tabela 3 pode ser considerado excelente. 4.6.2 Teste com os atributos de imagens do conjunto C1 O gráfico 3 esboça a exatidão do teste 3. Gráfico 3: Resultado do teste com atributos de imagens para massas mamográficas e tumores, conjunto C1 (construído pelo autor). 180 Tabela 6: Área sob a curva ROC para o teste 3 (construído pelo autor). Asymptotic 95% Confidence Interval Area ,939 Std. Errora Asymptotic Sig.b ,092 ,175 Lower Bound Upper Bound ,000 1,000 Levando-se em consideração que a área sob a curva ROC foi de 0,939 e que a sensibilidade foi aumentando progressivamente até quase 1,0 o teste segundo a tabela 3 pode ser considerado excelente. 4.6.3 Teste com os atributos de imagens do conjunto C2 O gráfico 4 esboça a exatidão do teste 4. Gráfico 4: Resultado do teste com atributos de imagens para massas mamográficas e tumores, conjunto C2 (construído pelo autor). 181 Tabela 6: Área sob a curva ROC para o teste 4(construído pelo autor). Asymptotic 95% Confidence Interval Area ,935 Std. Errora ,081 Asymptotic Sig.b ,068 Lower Bound Upper Bound ,000 1,000 Levando-se em consideração que a área sob a curva ROC foi de 0,935 e que apesar da sensibilidade ter demorado a atingir um ponto de equilíbrio próximo a 1,0 segundo a tabela 3 o teste pode ser considerado excelente. 4.6.4 Teste com os atributos de imagens do conjunto C3 O gráfico 5 esboça a exatidão do teste 5. Gráfico 5: Resultado do teste com atributos de imagens para massas mamográficas e tumores, conjunto C3 (construído pelo autor). Tabela 7: Área sob a curva ROC para o teste 5 (construído pelo autor). Asymptotic 95% Confidence Interval Area ,875 Std. Errora ,135 Asymptotic Sig.b ,245 Lower Bound ,000 Upper Bound 1,000 182 Levando-se em consideração que a área sob a curva ROC foi de 0,875 e que a sensibilidade foi aumentando progressivamente até quase 1,0 o teste segundo a tabela 3 pode ser considerado bom. 4.6.5 Teste com os atributos de imagens do conjunto C4 O gráfico 6 esboça a exatidão do teste 6. Gráfico 6: Resultado do teste com atributos de imagens para massas mamográficas e tumores, conjunto C5 (construído pelo autor). Tabela 8: Área sob a curva ROC para o teste 6(construído pelo autor). Asymptotic 95% Confidence Interval Area ,500 Std. Errora ,143 Asymptotic Sig.b 1,000 Lower Bound ,219 Upper Bound ,781 183 Levando-se em consideração que a área sob a curva ROC foi de 0,500 e que a sensibilidade é igual a especificidade o teste segundo a tabela 3 pode ser considerado insignificante. 4.6.6 Teste com os atributos de imagens do conjunto C5 O gráfico 7 esboça a exatidão do teste 7. Gráfico 7: Resultado do teste com atributos de imagens para massas mamográficas e tumores, conjunto C5 (construído pelo autor). Tabela 9: Área sob a curva ROC para o teste 7(construído pelo autor). Asymptotic 95% Confidence Interval Area ,929 Std. Errora ,094 Asymptotic Sig.b ,007 Lower Bound ,000 Upper Bound 1,000 Levando-se em consideração que a área sob a curva ROC foi de 0,929 e que apesar da sensibilidade ter demorado a atingir um ponto de equilíbrio próximo a 1,0 segundo a tabela 3 o teste pode ser considerado excelente. 184 4.6.7 Teste com os atributos de imagens do conjunto C6 O gráfico 8 esboça a exatidão do teste 8. Gráfico 8: Resultado do teste com atributos de imagens para massas mamográficas e tumores, conjunto C6 (construído pelo autor). Tabela 9: Área sob a curva ROC para o teste 8(construído pelo autor). Asymptotic 95% Confidence Interval Area ,939 Std. Errora ,092 Asymptotic Sig.b Lower Bound ,175 ,000 Upper Bound 1,000 Levando-se em consideração que a área sob a curva ROC foi de 0,939 segundo a tabela 3 o teste pode ser considerado excelente. 185 CAPÍTULO 5 – AVALIAÇÃO DOS RESULTADOS Neste capítulo serão examinados os resultados encontrados nas simulações (treinamentos e testes) com MLP, ART2LDA, RBF - Simulated Annealing e Classificador Paraconsistente. O objetivo deste capítulo é, pois, verificar (estudar) a habilidade de cada um dos classificadores em reconhecer atributos mamográficos benignos e malignos. As bases de dados empregadas nas simulações são, conforme mencionado no capítulo 4, BD1 e BD2. BD1 é constituída de calcificações, representada por 143 fatores de forma (m, c e f), contendo 64 casos benignos e 79 casos malignos. BD2 contém múltiplos atributos mamográficos (C, FC, FF, SI, Ac e F1-F12), particionados em 6 grupos de treinamento e testes, isto é: C1: Três fatores de forma - C, Fc e SI; C2: Quatro fatores de forma - C, Fc Si e FF; C3: Quatro fatores de forma e a Acutance - C, Fc Si, FF, Ac; C4: Doze informações de textura F1-F12; C5: Três fatores de forma, Acutance e duas medidas de textura - C, Fc, SI, Ac, F3 e F5; C6: Três fatores de forma, Acutance e três medidas de textura - C, Fc, SI, Ac, F1, F2 e F4. Para o Classificador Paraconsistente houve o 8° teste composto por todos os atributos de massas mamográficas e tumores. 5.1 Resultados dos experimentos com BD1 Os resultados das áreas das curvas ROC dos classificadores MLP, ART2LDA e RBF-Simulated Annealing foram extraídos de (ESPÍRITO SANTO R. , 2004). A tabela 10 apresenta os resultados dos testes de classificação de calcificações utilizando fatores de forma. 186 Tabela 10: Resultados obtidos nos testes de classificação de calcificações Classificadores MLP ART2LDA RBF- Classificador Simulated Paraconsistente Annealing Az 0,70 0,696 0,986 0,94 5.2 Resultados dos experimentos com BD2 As simulações com a base de dados BD2 permitiram não só a observação do desempenho dos classificadores em classificar os casos exemplos (fatores de forma, definição de borda e indicações de textura) em benignos ou malignos, mas também selecionar dentre os diversos conjuntos de dados (C1 a C6) em que BD2 foi particionada, qual os mais recomendados para o diagnóstico de câncer de mama. Os experimentos com BD2 podem ser resumidos da seguinte maneira: Tabela 11: Resultados obtidos nos testes de classificação de massas mamográficas e tumores Conjunto de dados Az(LDA) Az(ART2LDA) C1 C2 C3 C4 C5 C6 0,854 0,842 0,800 0,672 0,832 0,834 0,901 0,89 0,850 0,767 0,884 0,885 Az (MLP) 0,994 0,994 0,970 0,887 0,987 0,982 Az (RBF-SIMULATED ANNEALING) 0,912 0,924 0,996 0,907 0,998 0,999 Az (Classificador Paraconsistente) 0,939 0,935 0,875 0,500 0,929 0,939 Para o conjunto formado por todos os atributos de imagens apenas o Classificador Paraconsistente realizou o teste, Az = 0,938 187 CAPÍTULO 6 – CONCLUSÕES O Classificador Paraconsistente apresenta uma arquitetura mais simples que a arquitetura dos classificadores estudada por (ESPÍRITO SANTO R. , 2004). No caso da classificação de massas mamografias e tumores para que o classificador proposto por (ESPÍRITO SANTO R. , 2004) consegui-se realizar o processamento da rede neural, houve a necessidade de divisão dos atributos mamográficos em conjuntos. No caso do Classificador Paraconsistente foi possível utilizar todos os atributos de imagens sem problema. O número de amostras utilizadas para treinamento da rede também precisou ser elevada para o classificador RBF-Simulated Annealing por isso a escolha do método leave-one-out, ou seja, treinar todas as amostras com exceção de uma. A amostra de sobra será utilizada para classificação. No caso do Classificador Paraconsistente foi um teste inicial com 7 elementos de amostra para treinamento, depois 14 elementos de amostra para treinamento e depois com 21 elementos de amostra para treinamento. De 7 para 14 amostras utilizadas para treinamento houve uma evolução considerável em relação ao acerto das amostras utilizadas para classificação. No caso de 14 para 21 amostras utilizadas para treinamento houve uma evolução pequena em relação ao acerto das amostras utilizadas para classificação. Em termos estatísticos a Lógica Paraconsistente Evidencial E sofre críticas quanto ao número de amostras utilizadas. Para os testes com o Classificador Paraconsistente esse quesito também foi levado em consideração. Os resultados demonstram que apesar do número de amostras reduzido os resultados foram expressivos. Para os testes envolvendo calcificações o Classificador Paraconsistente foi o melhor com uma Az = 0,986 quase atingindo os 100% de acerto para a base de dados em estudo. Para os testes envolvendo massas mamográficas para o conjunto de todos os atributos o único classificador a conseguir resultados foi o Classificador Paraconsistente. Para os conjuntos de atributos de C1, o Classificador Paraconsintente ficou com o segundo melhor resultado. 188 Para os conjuntos de atributos de C2, o Classificador Paraconsintente ficou com o segundo melhor resultado. Para os conjuntos de atributos de C3, o Classificador Paraconsintente ficou com o terceiro melhor resultado. Para os conjuntos de atributos de C4, o Classificador Paraconsintente ficou com o pior resultado. Para os conjuntos de atributos de C5, o Classificador Paraconsintente ficou com o terceiro melhor resultado. Para os conjuntos de atributos de C6, o Classificador Paraconsintente ficou com o terceiro melhor resultado. Ao que tudo indica os atributos de textura influenciam de forma negativa a desempenho do Classificador Paraconsistente. A utilização do Classificador Paraconsistente pode melhorar o seu desempenho graças ao ajuste do valor de corte entre valores Benignos e Malignos propiciados pelo algoritmo de Balanceamento. Tudo indica que o Classificador Paraconsistente pode ser utilizado como uma ferramenta CAD aplicável no diagnóstico do câncer de mama. A sua capacidade de detectar calcificações se mostrou muito superior a dos demais classificadores e a capacidade de detectar massas mamográficas e tumores se mostrou próxima ao melhor desempenho dos outros classificadores. Um número de amostras para testes poderão das a oportunidade do Classificador Paraconsistente encontrar melhores limites de decisão, portanto, atingir um melhor desempenho. 189 REFERÊNCIAS BIBLIOGRÁFICAS ABE, J. M. (2004). Paraconsistent Artificial Neural Networks: an Introduction, Knowledge-Based Intelligent Information and Engineering Systems. Springer. ABE, J. M. (2010). Paraconsistent Artificial Neural Networks and EEG Analisis, Lecture Notes in Computer Science . Springer. ABE, J. M. (2010). Redes Neurais Artificiais Paraconsistentes e Análise de Distúrbio de Aprendizagem., (pp. tese apresentada à Faculdade de Medicina da Universidade de São Paulo para a obtenção do título de Professor LivreDocente junto ao Departamento de Patologia Disciplina de Informática Médica). ABE, J. M. (2011). Applications of Paraconsistent Artificial Neural Networks in EEG, Lecture Notes in Computer Science. ABE, J. M. (2011). Lógica Anotada Evidencial Et. Santos - SP: COMUNICAR. ABE, J. M., & NAKAMATSU, k. (2012). Paraconsistent Artificial Neural Networks and Applications, capítulo de livro, “The Handbook on Reasoning-Based Intelligent Systems”. ABE, J. M., & NAKAMATSU, k. (2012). Paraconsistent Artificial Neural Networks and Pattern Recognition: Speech Production Recognition and Cephalometric Analysis, capítulo 12 do livro, “Intelligent Systems for Image Processing and Pattern Recognition”. ABE, J. M., DA SILVA FILHO, J. I., & TORRES, G. L. (2008). Inteligência Artificial com Redes de Análises Paraconsistentes: Teoria e Aplicações. Rio de Janeiro: LTC. ABE, J. M., LOPES, H. F., & ANGHINAH, R. (2009). Paraconsistent Artificial Neural Network and Alzheimer Disease: A Preliminary Study, Dementia & Neuropsychologia. ABE, J. M., LOPES, H. F., & ANGHINAH, R. (2011). Paraconsistent artificial neural networks and EEG analysis, International Journal of Reasoning-Based Intelligent Systems. ABE, J. M., LOPES, H. F., & NAKAMATSU, K. (2012). Paraconsistent Artificial Neural Networks and Delta, Theta, Alpha, and Gamma Bands Detection, capítulo 11 do livro “Intelligent Systems for Image Processing and Pattern Recognition”. Springer. ABE, J. M., ORTEGA, M. N., MÁRIO, & M., D. S. (2005). Paraconsistent Artificial Neural Network: an Application in Cephalometric Analysis. Springer. ABE, J. M., PRADO, J. C., & NAKAMATSU, K. (2006). Paraconsistent Artificial Neural Network: Applicability in Computer Analysis of Speech Productions. Springer. ABE, J., LOPES, H. F., & NAKAMATSU, K. (2008). Improving EEG Analysis by Using Paraconsistent Artificial Neural Networks, Knowledge-Based Intelligent Information and Engineering Systems Lecture Notes in Computer Science. Berlin: Springer. AHA, D. W., & ALBERT, M. (1998). Instance-Based Algorithms. Machine Learning, vol. 6, 323-336. ALTO, H., RANGAYYAN, R. M., & DESAUTELS, J. E. (2005). Content-based retrieval and analysis of mammographic masses. Journal of Electronic Imaging, Volume 14, Issue 2, 1-17. 190 American College of Radiology (ACR). (1998). Illustrated Breast Imaging Reporting and Data System (BI-RADS) (third ed.). Reston, VA: American College of Radiology. ARRUDA, A. I. (1980). A survey of Paraconsistent Logic. Mathematical Logic in Latin America, Proceedings of the IV Latin American Symposium on Mathematical Logic Studies in Logic and the foundations of mathematic, 99, 1- 41. ASTLEY, S. M., & GILBERT, F. J. (2004). Computer-aided detection in mammography ( Review ). Clinical Radiology Volume 59, Issue 5, 390-399. AYRES, F. J., & RANGAYYAN, R. M. (2003). Characterization of architectural distortion in mammograms. Proceedings of the 25th Annual International Conference of the IEEE Engineering in Medicine and Biology Society (CDROM), (pp. 886–889). Cancún, Mexico. AYRES, F. J., & RANGAYYAN, R. M. (2004). Detection of architectural distortion in mammograms using phase portraits. Proceedings of SPIE Medical Imaging 2004: Image Processing, vol. 5370, 587–597. AYRES, F. J., & RANGAYYAN, R. M. (2005). Characterization of architectural distortion in mammograms. IEEE Engineering in Medicine and Biology Magazine, Volume 24, Issue 1, 59-67. AYRES, F. J., & RANGAYYAN, R. M. (2005). Characterization of architectural distortion in mammograms. IEEE Engineering in Medicine and Biology Magazine, Volume 24, Issue 1, 59-67. AYRES, F. J., & RANGAYYAN, R. M. (2005). Detection of architectural distortion in mammograms via analysis of phase portraits and curvilinear structures. Third European Medical and Biological Engineering Conference, IFMBE European Conference on Biomedical Engineering (CD-ROM), (pp. 1873, six pages on CDROM). Prague, Czech Republic. AZEVEDO MARQUES, P. M. (19 de junho de 2001). DIAGNÓSTICO AUXILIADO POR COMPUTADOR NA RADIOLOGIA. Radiol Bras, pp. 285-293. BAKER, J. A. (2003). Computer-aided detection (CAD) in screening mammography: Sensitivity of commercial CAD systems for detecting architectural distortion. American Journal of Roentgenology, Volume 181, 1083-1088. BALLEYGUIER, C. e. (2005). Comprendre et utiliser le CAD (Aide informatisée au diagnostic) en mammographie. Éditions Françaises de Radiologie, 29-35. BANKMAN, I. N. (1997). Segmentation Algorithms for Detecting Microcalcifications in Mammograms. IEEE Transactions on Information Technology in Biomedicine, Volume 1, Issue 2, 141-149. BARRETO, G. (2008). Redes Neurais Artificiais: Uma Introdução Prática. Fortaleza, Ceará, Brasil. BARRETO, J. M. (2002). Indrodução às Redes Neurais Artificiais - Laboratório de Conexionismo e Ciências Cognitivas: Universidade Federal de Santa Catarina - Departamento de Informática e de Estatística. Florianópolis, Santa Catarina, Brasil. BASSETT, L. W. (2000). Doenças da Mama: Diagnóstico e Tratamento. Rio de Janeiro: Editora RevinteR Ltda. BAUER, C. K. (2007). Java persistence with hibernate. Manning. BIRD, R. E., WALLACE, T. W., & YANKASKAS, B. C. (1992). Analysis of cancers missed at screening mammography. Radiology, Volume 184, Issue 3, 613-617. 191 BIRDWELL, R. L. (2001). Mammographic characteristics of 115 missed cancers later detected with screening mammography and the potential utility of computeraided detection. Radiology, Volume 219, Issue 1, 192-202. BOYD, N. F. (1995). Quantitative classification of mammographic densities and breast cancer risk: Results from the Canadian National Breast Screening Study. Journal of the National Cancer Institute, Volume 87, Issue 9, 670-675. BRASIL, A. (22 de 04 de 2013). EBC. Fonte: EBC: http://http://www.ebc.com.br/print/33541 BRASIL, L. M. (2008). Informática em Saúde. Brasília: Editora Universa. BROEDERS, M. J. (1993). Use of previous screening mammograms to identify features indicating cases that would have a possible gain in prognosis following earlier detection. European Journal of Radiology, 39, 1770–1775. BRUCE, L. M., & ADHAMI, R. R. (1999). Classifying Mommographic Mass Shapes Using the Wavelet Transform Modulus-Maxima Method. IEEE Transaction on Medical Imaging, Vol. 18, No. 12. BRUNO, B. e. (2009). CAD in questions/answers Review of the literature. European Journal of Radiology, 24-33. BURHENNE, L. J. (2000). Potential contribution of computer-aided detection to the sensitivity of screening mammography. Radiology, 215, 554–562. BUSCHMANN, F. e. (1996). Pattern-Oriented Software Architecture: A System of Patters V.1. Wiley . BYNG, J. W. (1996). Automated analysis of mammographic densities. Physics in Medicine and Biology, Volume 41, Issue 5, 909-923. CADY, B., & CHUNG, M. (2005). Mammographic screening: No longer controversial. American Journal of Clinical Oncology: Cancer Clinical Trials Volume 28, 1-4. CALAS, M. J. (Set/Out de 2011). Evaluation of morphometric parameters calculated from breast lesion contours at ultrasonography in the distinction among BIRADS categories. Radiol Bras, pp. 289–296. CARPENTER, G. A., & MARKUSON, N. (1998). ARTMAP-IC and Medical diagnosis: Instance Counting and Inconsistent Cases. Neural Networks 11, 323 - 336. CARVALHO, F. R., & ABE, J. M. (2011). Tomadas de Decisão com Ferramentas da Lógica Paraconstistente Anotada. São Paulo: Editora Edgard Blucher Ltda. CAULKIN, S. e. (1998). Sites of occurrence of malignancies in mammograms. Proceedings of the Fourth International Workshop on Digital Mammography, (pp. 279–282). Nijmegen, The Netherlands. CHAN, H. P. (1995). Computer-aided Classification of Mammographic Masses and Normal Tissue: Linear Discriminant Analysis in Texture Feature Space. Phys. Med. Biol., vol. 40, no. 5, 857–876. CHENG, H. D. (2003). Computer-aided detection and classification of microcalcifications in mammograms: A survey. Pattern Recognition, Volume 36, Issue 12, 2967-2991. CIATTO, S. A. (2003). Comparison of standard reading and computer aided detection (CAD) on a national proficiency test of screening mammography. European Journal of Radiology Volume 45, Issue 2, 135-138. CONCEIÇÃO, M. M. (2006). Modelo de análise de variáveis craniométricas através das Redes Neurais Artificiais Paraconsistentes. Acesso em 05 de 11 de 2010, disponível em Faculdade de Medicina da Universidade de São Paulo: http://www.teses.usp.br/teses/disponiveis/5/5160/tde-06112006-130001/ptbr.php 192 CORINNE, B. e. (2005). Computer-aided detection (CAD) in mammography: Does it help the junior or the senior radiologist? European Journal of Radiology 54, 9096. COSTA, N. C. (1980). Ensaios sobre os fundamentos da logica. São Paulo: Hucitec. Fonte: , , Hucitec, 1980. COUTO, J. E. (2009). Abordagem Não-Paramétrica para Cálculo do Tamanho da Amostra com Base em Questionários ou Escalas de Avaliação na Área de Saúde. Tese apresentada à Faculdade de Medicina da Universidade de São Paulo para a obtenção do título de doutor em Ciência. São Paulo, São Paulo, Brasil. DA COSTA, N. C. (1999). Lógica Paraconsistente Aplicada. São Paulo: Atlas. DA COSTA, N. C. (1999). Lógica Paraconsitente Aplicada. São Paulo: Atlas. DA SILVA FILHO, J. .., TORRES, G. L., & ABE, J. M. (2010). Uncertainty Treatment Using Paraconsistent Logic - Introducing Paraconsistent Artificial Neural Networks. Holanda. DA SILVA FILHO, J. I., & ABE, J. M. (1999). Fundamentos das redes neurais artificiais paraconsistentes. São Paulo: Arte & Ciência. DA SILVA FILHO, J. I., & ABE, J. M. (1999). Fundamentos das Redes Neurais Artificiais Paraconsistentes. São Paulo: Arte & Ciência. DA SILVA FILHO, J. I., & ABE, J. M. (2001). Fundamentos das Redes Neurais Paraconsistentes – Destacando Aplicações em Neurocomputação. Arte & Ciência. DA SILVA FILHO, J. I., ABE, J. M., & TOREES, G. L. (2008). Inteligência Artificial com as Redes de Análises Paraconsistentes: Teorias e Aplicações. Rio de Janeiro: LTC. DA SILVA FILHO, J. I., TORRES, G. L., & ABE, J. M. (2010). Uncertainty Treatment Using Paraconsistent Logic - Introducing Paraconsistent Artificial Neural Networks. Holanda. DHAWAN, A. P., & LE ROYER, E. (1988). Mammographic feature enhancement by computerized image processing. Computer Methods and Programs in Biomedicine, Volume 27, Issue 1, 23-35. DHAWAN, A. P., BUELLONI, G., & GORDON, R. (1986). ENHANCEMENT OF MAMMOGRAPHIC FEATURES BY OPTIMAL ADAPTIVE NEIGHBORHOOD IMAGE PROCESSING. IEEE Transactions on Medical Imaging, Volume MI-5, Issue 1, 8-15. DOI, K. (2007). Computer-aided diagnosis in medical imaging: Historical review, current status and fatures potencial. Computerized Medical Imaging and Graphics, 198-211. DOS SANTOS, J. M. (2008). DIAGNÓSTICO ASSISTIDO POR COMPUTADOR EM MAMOGRAFIA. Dissertação apresentada à Universidade de Aveiro para cumprimento dos requisitos necessários à obtenção do grau de Mestre em Engenharia Biomédica. Universidade de Aveiro. Aveiro, Portugal. DROMAINA, C. e. (2013). Computed-aided diagnosis (CAD) in the detection of breast cancer. European Journal of Radiology, 417-423. DUDA, R. O., & HART, P. E. (1973). Pattern Classification and Scene Analysis. New York: Wiley. El-NAQA, I. e. (2002). A support vector machine approach for detection of microcalcifications. IEEE Transactions on Medical Imaging, Volume 21, Issue 12, 1552-1563. 193 ESPÍRITO SANTO, R. (2004). Discriminação de Classes Fundamentada em Técnicas de Otimização Não Linear e Combinatória Associadas a Funções de Base Radiais:Um estudo de Caso em Mamografia. Tese de doutorado apresentada à Escola Politécnica da Universidade de São Paulo. São Paulo. ESPÍRITO SANTO, R., LOPES, R. D., & RANGAYYAN, R. M. (2009). Classification of Breast Masses in Mammograms Using Radial Basis Functions and Simulated Annealing. INTERNATIONAL JOURNAL OF Cognitive Informatics and Natural Intelligence, 27-38. EVANS, C., YATES, K., & BRADY, M. (2002). Statistical characterization of normal curvilinear structures in mammograms. H.-O. Peitgen (Ed.), Proceedings of the Sixth International Workshop on Digital Mammography (IWDM 2002) (pp. 285– 291). Bremen, Germany: Springer. EVANS, W. P. (2002). Invasive lobular carcinoma of the breast: Mammographic characteristics and computer-aided detection. Radiology, Volume 225, 182189. FEIG, S. A., GALKIN, B. M., & MUIR, H. D. (1987). Evaluation of breast microcalcifications by means of optically magnified tissue specimen radiographs. Recent results in cancer research. Fortschritte der Krebsforschung. Progres dans les recherches sur le cancer, Volume 105, 111123. FERLAY, J. e. (2013). Cancer incidence and mortality patterns in Europe: Estimates for 40 countries in 2012. European Journal of Cancer, 1374-1403. FERRARA, L. F. (2004). Um Estudo da Rede Neural Artificial Paraconsistente RNAP em Um Processo de Reconhecimento de Caracteres. Minas Gerais: UFU Universidade Federal de Uberlândia. FERRARI, R. J. (2004). Automatic Identification of the Pectoral Muscle in Mammograms. IEEE Transactions on Medical Imaging, Volume 23, Issue 2, 232-245. FERRARI, R. J. (2004). Segmentation of the fibro-glandular disc in mammograms using Gaussian mixture modelling. Medical and Biological Engineering and Computing, Volume 42, Issue 3, 378-387. FOWLER, M. (2003 (A)). Patterns of Enterprise Application Architecture. AddisonWesley. FOWLER, M. (2003). UML Essencial: Um breve guia para a linguagem padrão. Bookman. FREER, T. W., & ULISSEY, M. J. (2001). Screening mammography with computeraided detection: Prospective study of 12,860 patients in a community breast center. Radiology, 781-786. GAMMA, E. e. (2000). Padrões de Projeto: Soluções Reutilizáveis de Software Orientado a Objetos. Porto Alegre: Bookman. GENNARI, J. H. (1989). Model of incremental concept formation. Artificial Intelligence, vol. 40., 11-60. GLAUBER, M. P. (s.d.). Arquitetura Para um Sistema de Diagnóstico Auxiliado por Computador. GONZALEZ, R. C., & WOODS, R. E. (2010). Processamento Digital de Imagens 3 ed. São Paulo: Pearson Prentice Hall. GORDON, R., & RANGAYYAN, R. M. (1984). FEATURE ENHANCEMENT OF FILM MAMMOGRAMS USING FIXED AND ADAPTIVE NEIGHBORHOODS. Applied Optics, Volume 23, Issue 4, 560-564. 194 GULIATO, D. e. (1996). Detection of Breast Tumor Boundaries Using Iso-Intensity Contours and Dynamic Thresholding. São Paulo, São Paulo, Brasil: LSI. EPUSP. GULIATO, D. e. (1998). Segmentation of Breast Tumors in Mammograms by Fuzzy Region Growing. 20th Annual International Conference of the IEEE Engineering in Medicine and Biology Society, (pp. 1002-1004). Hong Kong. GULIATO, D. e. (2003). Fuzzy fusion operators to combine results of complementary medical image segmentation techniques. Journal of Electronic Imaging, Volume 12, Issue 3, 379-389. GULIATO, D. e. (2003). Segmentation of breast tumors in mammograms using fuzzy sets. Journal of Electronic Imaging, Volume 12, Issue 3, 369-378. GUO, Q., SHAO, J., & RUIZ, V. (2005). Investigation of support vector machine for the detection of architectural distortion in mammographic images. Journal of Physics: Conference Series, Volume 15, Issue 1, 88-94. HADJIIK, L. e. (1999). Classification of Malignant and Benign Masses Based on Hybrid ART2LDA Approach. IEEE Transactions on Medical Imaging, vol. 18, no. 12, 1178-1193. HARALICK, R. M. (1979). STATISTICAL AND STRUCTURAL APPROACHES TO TEXTURE. Proc IEEE, Volume 67, Issue 5, 786-804. HARALICK, R. M., SHANMUGAM, K., & DINSTEIN, I. (1973). Textural features for image classification. IEEE Transactions on Systems, Man, and Cybernetics, vol. SMC-3, no. 6, 610-621. HAYKIN, S. (1999). Neural Network A Comprehensive Foundation. Upper Saddle River, NJ: Pretince Hall. HAYKIN, S. (2001). Redes Neurais: Principios e Prática. Porto Alegre: Bookman. HILLARY, A., RANGAYYAN, R. M., & DESAUTELS, J. E. (2003). "An indexed atlas of digital mammograms", in H-O. International Workshop on Digital Mammography, Springer-Verlag (pp. 309-311). Bremen, Germany: Proceeding of the IWDM 2002: 6th. HOMER, M. J. (1997). Mammographic Interpretation: A Practical Approach (second ed.). New York: McGraw-Hill. HOWELL, S. C. (1992). Statistical Methods for Psychology. Belmont, CA: Duxbury Press. INCA. (2004). Controle do Câncer de Mama: Documento de Consenso. Rio de Janeiro. INCA. (2007). Mamografia: da prática ao controle. Rio de Janeiro: Cooredenação de Ensino e Divulgação Cientiíca (CEDC). INCA. (2011 (A)). MINISTÉRIO DA SAÚDE- INSTITUTO NACIONAL DE CÂNCER JOSÉ ALENCAR GOMES DA SILVA (INCA) - Estimativa 2012 : incidência de câncer no Brasil. Rio de Janeiro. INCA, I. N. (2011 (B)). Orientações para elaboração de laudo no sistema de informação do controle do câncer de mama. Rio de Janeiro: Coodenação de Educação (CEDC). JANKEES, V. D. (2007). Um Sistema Para Diagnóstico Auxiliado por Computador Voltado Para Imagens Mamográficas: Desempenho da Busca Baseada em Conteúdo na Recuperação de Achados. VII Workshop de Informática Médica WIM 2007, (pp. 194-203). KARSSEMEIJER, N. (1998). Automated classification of parenchymal patterns in mammograms. Physics in Medicine and Biology, Volume 43, Issue 2, 365-378. 195 KEGELMEYER, J. W. (1994). Computer-aided mammographic screening for spiculated lesions. Radiology, Volume 191, Issue 2, 331-337. KUPINSKI, M. A., & ANASTASIO, M. A. (1999). Multiobjective Genetic Optimization of Diagnostic Classifiers with Implication for Generating Receiver Operating Characteristic Curves. IEEE Transactions on Medical Imaging, vol. 18. no. 8, 675-685. LAINE, A. F. (1994). Mammographic feature enhancement by multiscale analysis. IEEE Transactions on Medical Imaging, Volume 13, Issue 4, 725-740. LAU, T. K., & BISCHOF, W. F. (1991). Automated detection of breast tumors using the asymmetry approach. Computers and Biomedical Research, Volume 24, Issue 3, 273-295. LAURIA, A. (2009). GPCALMA: Implementation in Italian hospitals of a computer aided detection system for breast lesions by mammography examination. Science Direct, 58-72. LAWS, K. I. (1980). Rapid texture identification. Proceedings of SPIE:Image Processing for Missile Guidance, vol. 238, 376–380. LEMES, M. C., & VENSON, N. (02 de nov de 2009). Acesso em 20 de dez de 2010, disponível em www.inf.ufsc.br/~barreto/trabaluno/TC_Nerio_Mauricio.pdf LOPES, H. e. (2011). Improved Application of Paraconsistent Artificial Neural Networks in Diagnosis of Alzheimer's Disease, American Journal of Neuroscience. LOPES, H. F. (2009). Aplicação de redes neurais artificiais paraconsistentes como método de auxílio no diagnóstico da doença de Alzheimer: Dissertação aprentada à Faculdade de Medicina da Universidade de São Paulo para a obtenção do título de Mestre em Ciências. São Paulo, São Paulo, Brasil. LOPES, H. F., & ABE, J. M. (2011). Aplicação de Redes Neurais Artificiais Paraconsistentes como método de auxílio à análise de sinais de eletroencefalograma, capítulo de livro, Ed. J.M.Abe, Aspectos de Lógica e Teoria da Ciência, Instituto de Estudos Avançados da USP. LOPES, H. F., ABE, J. M., & ANGHINAH, R. (2009). Application of Paraconsistent Artificial Neural Networks as a Method of Aid in the Diagnosis of Alzheimer Disease, Journal of Medical Systems. Springer-Netherlands. MÁRIO, M. e. (2010). Paraconsistent Artificial Neural Network as Auxiliary in Cephalometric Diagnosis, Artificial Organs, Wiley Interscience. MCCULLOGH, W. S., & PITTS, W. (1943). A logical calculus of the ideas immanent in nervous activity. Bulletin of Mathematical Biophysics, volume 5, 115 - 133. MICHAEL, J. C., JEFFREY, H., & STEVEN, W. W. (2006). Computer-Aided Detection and Diagnosis of Breast Cancer. Elsevier, 351-355. MILLER, P., & ASTLEY, S. (1993). Detection of breast asymmetry using anatomical features. Biomedical Image Processing and Biomedical Visualization, vol. 1905 of Proceedings of SPIESPIE, 433–442. MILLER, P., & ASTLEY, S. (1994). Automated detection of breast asymmetry using anatomical features. State of the Art in Digital Mammographic Image Analysis, vol. 9 of Series in Machine Perception and Artificial IntelligenceWorld Scientific, 247–261. MUDIGONDA, N. R. (2000). Gradient and Texture Analysis for the Classification of Mammographic Masses. IEEE Transactions on Medical Imagins Vol. 19 No 10, 1032-1042. 196 MUDIGONDA, N. R., & DESAUTEL, J. E. (2001). Detection of breast masses in mammograms by density slicing and texture flow-field analysis. IEEE Transactions on Medical Imaging, v. 20, no. 12, 1215-1227. NAGLAA, M. A., & WALEED, A. Y. (2013). Microcalcification detection with and without CAD system (LIBCAD): A comparative study. The Egyptian Journal of Radiology andNuclear Medicine. NETTO, A. A., & TAVARES, W. R. (2006). Introdução à Engenharia de Produção. Florianópolis: Visual Books Editora Ltda. NUNES, F. L. (1997). Esquema de Diagnóstico Auxiliado por Computador para Detecção de Agrumentos de Microcalcificações por Processamento de Imagens Mamográficas: Dissertação apresentada à Escola de Engenharia de São Carlos, da Universidade de São Paulo. São Carlos, São Paulo. PAROCÍNIO, A. C. (2010). Computer-aided diagnosis (CAD) performances evaluation to different mammographic image groups. Revista Brasileira de Física Médica, 67-70. PASQUALETTE, H. A. (1998). Mamografia Atual. Rio de Janeiro: Editora RevinterR Ltda. PAULINELLI, R. R. (2003). Breast cancer in Goiás, in Brazil and in the World: current incidence and mortality rates. Revista Brasileira de Saúde Materno Infantil vol.3 no.1 Recife Jan./Mar., 17-24. PEREIRA, F. L. (2011). RECONHECIMENTO DE CARACTERES NUMÉRICOS MANUSCRITOS UTILIZANDO REDES NEURAIS ARTIFICIAIS PARACONSISTENTES. Dissertação apresentada ao Programa de PósGraduação em Engenharia de Produção da Universidade Paulista – UNIP para a obtenção do título de Mestre em. São Paulo, Brasil. POLAKOWSKI, W. E. (1997). Computer-aided breast cancer detection and diagnosis of masses using difference of Gaussians and derivative-based feature saliency. IEEE Trans. Med. Imag., vol. 16, no 6, 811–819. PRINCIPE, J. C., EULIANO, N. R., & LEVEBVRE, W. C. (2000). Neural and Adaptive Systems: Fundamentals through Simulations. John Wiley and Sons. QUINLAN, J. R. (1986). The Effect of Noise on Concept Leaning. Machine Learning: One Artificial Intelligence Approach, vol. II., 149-166. RAM, G. (1982). Optimization of ionizing radiation usage in medical imaging by means of image enhancement techniques. Medical Physics, Volume 9, Issue 5, 733737. RANGARAJ, M. R., & THANH, M. N. (2005). Pattern classification of breast masses via fractal analysis of their contours. International Congress Series 1281 (pp. 1041-1046). Elsevier. RANGARAJ, M. R., FABIO, J. A., & DESAUTELS, J. E. (2007). A review of computeraided diagnosis of breast cancer: Toward the detection of subtle signs. Journal of the Franklin Institute, 312-348. RANGAYYAN, R. M. (1997). Improvement of sensitivity of breast cancer diagnosis with adaptive neighborhood contrast enhancement of mammograms. IEEE Transactions on Information Technology in Biomedicine, Volume 1, Issue 3, 161-170. RANGAYYAN, R. M. (1997). Improvement of sensitivity of breast cancer diagnosis with adaptive neighborhood contrast enhancement of mammograms. IEEE 197 Transactions on Information Technology in Biomedicine, Volume 1, Issue 3, 161-170. RANGAYYAN, R. M. (1997). Measures of Acutance and Shape for Classification of Breast Tumors. IEEE Transactions on Medical Imaging, vol. 16, no. 6, 799-810. RANGAYYAN, R. M. (2002). Image-Processing Techniques for Tumor Detection. R.N. Strickland, 213–242. RANGAYYAN, R. M. (2005). Biomedical Image Analysis. CRC Press. RANGAYYAN, R. M., & NGUYEN, H. N. (2003). PIXEL-INDEPENDENT IMAGE PROCESSING TECHNIQUES FOR NOISE REMOVAL AND FEATURE ENHANCEMENT. IEEE Pacific Rim Conference on Communications, Computers and Signal Processing. Victoria, BC, Can. RANGAYYAN, R. M., MUDIGONDA, N. R., & DESAUTELS, J. E. (2000). Boundary Modeling and Shape Analysis Methods for Classification of Mammographic Masses. Medical & Biological Enginnering & Computing, vol. 38, 487-496. RANGAYYAN, R. M., SHEN, L., & DESAUTELS, J. E. (1993). Detection and Classification of Mammographic Calcifications. International Journal of Pattern Recognition and Artificial Intelligence Vol. 7 No. 6, 1403-1416. RAO, A. R., & JAIN, R. C. (1992). Computerized flow field analysis: oriented texture fields. IEEE Trans. Pattern Anal. Mach. Intell., 14, 693–709. RODRIGO, M. S., IÁLIS, C. P., & FÁTIMA, N. S. (2011). Técnicas de Processamento de Imagens em Diagnóstico. Piaui. RUMBAUGH, J., & BLAHA, M. (2006). Modelagem e Projetos Baseados em Objetos com UML 2. Rio de Janeiro: Elsevier. SAHA, P. K. (2001). Breast tissue density quantification via digitized mammograms. IEEE Transactions on Medical Imaging, Volume 20, Issue 8, 792-803. SAMPAT, M. P. (2005). Evidence based detection of spiculated masses and architectural distortion. Proceedings of SPIE Medical Imaging 2005: Image Processing, vol. 5747, 26–37. SANTOS, C. R. (x de 2004). Análise de assinaturas manuscritas baseada nos princípios de grafoscopia. Dissertação de Mestrado, Pontifícia Universidade Católica do Paraná, Curitiba. SCHWEFEL, H. P. (1981). Numerical Optimization of Computer Models. Chichester. New York: Wiley. SHEN, L., & RANGAYYAN, R. M. (1997). A Segmentation-Based Lossless Image Coding Method for High-Resolution Medical Image Compression. IEEE Transactions on Medical Imaging, Vol. 16 No. 3, 301-307. SHEN, L., RANGAYYAN, R. M., & DESAUTELS, J. E. (1993). Detection and classification of mammographic calcifications. Int. J. Pattern Recogn. Artif. Intell., 7, 1403–1416. SHEN, L., RANGAYYAN, R. M., & DESAUTELS, J. E. (1994). Application of shape analysis to mammographic calcifications, Volume 13, Issue 2. IEEE Transactions on Medical Imaging, Volume 13, Issue 2, 263-274. SICKLES, E. A. (1986). Breast calcifications: Mammographic evaluation. Radiology, Volume 160, Issue 2, 289-293. SMITH, J. W. (1962). ADAP II, an Adaptive Routine for the LARC computer. Navy Management Office (Available through the Logistics Management Institute Library). SMITH, J. W. (1988). Using the ADAP learning Algorithm to forecast the Onset of Diabetes Mellitus. Computer Application and Medical Care, 261-265. 198 SOCIETY, A. C. (16 de 04 de 2013). American Cancer Society. Fonte: http://www.cancer.org/ SOLTANIAN, Z. H., RAFIEE, R. F., & SIAMAK, P. N. (2004). Comparison of multiwavelet, wavelet, Haralick, and shape features for microcalcification classification in mammograms. Pattern Recognition, Volume 37, Issue 10, 1973-1986. SOUZA, P. R. (2009). Métodos de apoio a decisão médica para análise em Diabetes Mellitus Gestacional utilizando a probabilidade pragmática na lógica paraconsistente anotada de dois valores para melhor precisão de resposta. Tese de doutorado - Universidade de São Paulo. São Paulo, São Paulo. SOUZA, S. J. (2001). Equalização Adaptativa Usando RBFS e Resfriamento Simulado. Dissertação de Mestrado. Universidade Federal da Bahia. Salvador, Bahia. SOUZA, S., & ABE, J. M. (2011). Aspectos das Redes Neurais Artificiais Paraconsistentes, capítulo de livro, Ed. J.M. Abe, Aspectos de Lógica e Teoria da Ciência, Instituto de Estudos Avançados da USP. STRICKLAND, R. N., & HAHN, H. (1996). Wavelet transforms for detecting microcalcifications in mammograms. IEEE Transactions on Medical Imaging, Volume 15, Issue 2, 218-229. SUCKLING, J. e. (1994). The Mammographic Image Analysis Society Digital Mammogram Database. Digital Mammography: Proceedings of the 2nd International Workshop on Digital Mammography (pp. 375–378). York, UK: Elsevier. SUN, Y. e. (2006). A new approach for breast skin-line estimation in mammograms. Pattern Analysis and Applications, Volume 9, Issue 1, 34-47. TANG, J. e. (2009). Digital image processing and pattern recognition techniques for the detection of cancer. Pattern Recognition, 1015-1016. THURFJELL, E. L., LERNEVALL, K. A., & TAUBE, A. A. (1994). Benefit of independent double reading in a population-based mammography screening program. Radiology, 241-244. TORRES, C. R. (2010). A Sensing System for an Autonomous Mobile Robot Based on the Paraconsistent Artificial Neural Network Lecture Notes in Computer Science. Springer. TOURASSI, G. D., DELONG, D. M., & FLOYD, J. C. (2006). A study on the computerized fractal analysis of architectural distortion in screening mammograms. Physics in Medicine and Biology, Volume 51, Issue 5, 12991312. TÚLIO, A. C., & RANGAYYAN, R. M. (2003). Classification of Tumors and Masses in Mammograms Using Neural Networks With Shape and Texture Features. IEEE Engineering in Medicine and Biology Society, (p. paper no. 6.7.2.4 (pp) CDROM Proc. 25th). Cancun, Mexico. URSIN, G. e. (2005). Greatly increased occurrence of breast cancers in areas of mammographically dense tissue. Breast Cancer Res., 7, R605–R608. VAN DIJCK, J. A., & al., e. (1993). The current detectability of breast cancer in a mammographic screening program: A review of the previous mammograms of interval and screen-detected cancers. Cancer, Volume 72, Issue 6, 1933-1938. WAI, L. C., MELLOR, M., & BRANDY, M. (2004). A multi-resolution CLS detection algorithm form mammographic image analysis. Lecture Notes in Computer 199 Science, Proceedings of Medical Image Computing and Computer-Assisted Intervention (MICCAI 2004) (pp. 865-872). Berlin, Germany: Springer. WILLIAM, H. P. (1992). Numerical Recipes in C: The Art of Scientific Computing. Cambridge: Cambridge University Press. WILSON, S. S. (1991). Teaching Network Connectivity Using Simulated Annealing on a Massively Parallel Processor. IEEE, vol. 79, no. 4, 559-566. WOODS, K., & BOWYER, K. W. (1997). Generating ROC Curves for Artificial Neural Network. IEEE Transaction on Medical Imaging, vol. 16, no. 3, 329-337. WU, Y. e. (1993). Artificial Neural Network in Mammography: Application to Decision Making in the Diagnosis of Breast Cancer. Radiology, vol 187, 81-87. YAO, X. (1999). Evolving Artificial Neural Networks. IEEE. Vol. 87, no, 9, 1423 – 1447. YU, S. N., LI, K. Y., & HUANG, Y. K. (2006). Detection of microcalcifications in digital mammograms using wavelet filter and Markov random field model. Computerized Medical Imaging and Graphics, Volume 30, Issue 3, 163-173. APÊNDICE A - BASE DE DADOS 1: CALCIFICAÇÕES Esta base de dados foi adquirida junto ao Department of Radiological Sciences and Diagnosis Imaging Foothills Hospital, localizado em Calgary, Alberta, Canadá (RANGAYYAN, SHEN, & DESAUTELS, Detection and Classification of Mammographic Calcifications, 1993) (ESPÍRITO-SANTO, 2004). Tal base de dados 200 foi levantada por Fabio J. Ayres, sob orientação do Prof. Dr. Rangaraj M. Rangayyan. Ela é constituída de 64 casos benignos e 79 casos malignos, confirmados por biópsia. Nas mamografias, as calcificações são identificadas manualmente por um radiologista especializado em mamografia. A partir das identificações feitas, são determinados os fatores de forma m, C e f (Capítulo 2). A TABELA A.1 mostra todos os 143 fatores de forma de BD1. TABELA A.1: BD1: Fatores de forma empregados nas simulações Casos m C f tipo Casos M C f tipo 1 0,04096 0,18416 0,198364 benigno 65 0,06866 0,24634 0,374814 maligno 2 0,04234 0,19632 0,215465 benigno 66 0,05019 0,25424 0,494472 maligno 3 0,01549 0,16084 0,130271 benigno 67 0,09953 0,28293 0,527956 maligno 4 0,03515 0,15849 0,172552 benigno 68 0,06450 0,25184 0,394444 maligno 5 0,04675 0,16504 0,137583 benigno 69 0,06682 0,22104 0,489363 maligno 6 0,06355 0,14954 0,136385 benigno 70 0,06374 0,22838 0,273843 maligno 7 0,04031 0,16086 0,127311 benigno 71 0,08880 0,40905 0,658988 maligno 8 0,03867 0,15156 0,124106 benigno 72 0,07773 0,3161 9 0,06058 0,14217 0,108983 benigno 73 0,07575 0,26848 0,362725 maligno 10 0,04708 0,1251 benigno 74 0,05717 0,21342 0,398715 maligno 11 0,03597 0,13453 0,13718 benigno 75 0,07610 0,45843 0,802567 maligno 12 0,05385 0,09149 0,154167 benigno 76 0,06786 0,25793 0,457942 maligno 13 0,04390 0,23572 0,258022 benigno 77 0,06819 0,25568 0,569686 maligno 14 0,05643 0,17461 0,162136 benigno 78 0,07448 0,32747 0,640461 maligno 15 0,04427 0,15819 0,142461 benigno 79 0,07922 0,31024 0,426094 maligno 16 0,04311 0,17437 0,164287 benigno 80 0,07520 0,30685 0,524189 maligno 17 0,03833 0,16786 0,128534 benigno 81 0,06140 0,46175 0,803819 maligno 18 0,04092 0,14148 0,107933 benigno 82 0,09272 0,18715 0,387449 maligno 19 0,05251 0,2058 0,234947 benigno 83 0,07942 0,36375 0,708555 maligno 20 0,06545 0,1275 0,122221 benigno 84 0,06195 0,30362 0,481059 maligno 21 0,07223 0,03544 0,142631 benigno 85 0,04967 0,18341 0,377594 maligno 0,108983 0,582339 maligno 201 22 0,07223 0,03544 0,142631 benigno 86 0,09178 0,33346 0,713152 maligno 23 0,05257 0,17214 0,144563 benigno 87 0,08714 0,2718 24 0,06906 0,11288 0,128534 benigno 88 0,05288 0,27072 0,479716 maligno 25 0,04518 0,12128 0,127311 benigno 89 0,09785 0,3283 26 0,05549 0,05892 0,0751998 benigno 90 0,08960 0,30193 0,51403 27 0,04358 0,09899 0,0803637 benigno 91 0,06063 0,43893 0,781863 maligno 28 0,04305 0,16232 0,154167 benigno 92 0,07335 0,28325 0,615273 maligno 29 0,00550 0,04841 0,0567275 benigno 93 0,06447 0,41891 0,699738 maligno 30 0,02769 0,19582 0,194649 benigno 94 0,07002 0,26502 0,525704 maligno 31 0,02969 0,22321 0,267417 benigno 95 0,09320 0,29402 0,60478 32 0,01679 0,16795 0,147731 benigno 96 0,08479 0,35174 0,664051 maligno 33 0,02931 0,17228 0,135322 benigno 97 0,08191 0,26668 0,526776 maligno 34 0,01460 0,1579 0,140226 benigno 98 0,05077 0,25717 0,520285 maligno 35 0,02388 0,15012 0,133431 benigno 99 0,03752 0,33995 0,529277 maligno 36 0,01154 0,16876 0,148891 benigno 100 0,07635 0,26015 0,59539 37 0,01854 0,15284 0,112112 benigno 101 0,07263 0,18234 0,282881 maligno 38 0,02624 0,18199 0,144819 benigno 102 0,05540 0,18806 0,337646 maligno 39 0,02015 0,16777 0,1387 benigno 103 0,09204 0,29652 0,613266 maligno 40 0,02612 0,21361 0,186685 benigno 104 0,05417 0,21798 0,356505 maligno 41 0,01417 0,12588 0,108875 benigno 105 0,11757 0,39556 0,784372 maligno 42 0,01775 0,15234 0,137411 benigno 106 0,10160 0,32763 0,497906 maligno 43 0,02325 0,14474 0,124008 benigno 107 0,05284 0,27785 0,477972 maligno 44 0,02049 0,12988 0,101459 benigno 108 0,04112 0,3103 45 0,01969 0,15464 0,149185 benigno 109 0,09112 0,43095 0,788424 maligno 46 0,01897 0,15368 0,121755 benigno 110 0,09190 0,32441 0,629324 maligno 47 0,01473 0,14009 0,101356 benigno 111 0,08936 0,36887 0,712074 maligno 48 0,02194 0,14988 0,118978 benigno 112 0,06157 0,3182 49 0,01954 0,15878 0,14136 benigno 113 0,10463 0,34571 0,542254 maligno 50 0,01512 0,14085 0,13089 benigno 114 0,07822 0,21787 0,268576 maligno 51 0,03310 0,16011 0,189109 benigno 115 0,08414 0,24565 0,287006 maligno 52 0,04047 0,14876 0,10351 benigno 116 0,05734 0,20604 0,384258 maligno 53 0,06545 0,1275 benigno 117 0,05597 0,22654 0,349779 maligno 0,122221 0,565093 maligno 0,619472 maligno maligno maligno maligno 0,517037 maligno 0,642912 maligno 202 54 0,04917 0,17923 0,229208 benigno 118 0,09583 0,26325 0,294623 maligno 55 0,02607 0,22333 0,246503 benigno 119 0,08892 0,35021 0,62142 56 0,01773 0,13774 0,1083 benigno 120 0,07262 0,23577 0,480153 maligno 57 0,04484 0,13698 0,101632 benigno 121 0,07545 0,24159 0,371515 maligno 58 0,02310 0,13898 0,101882 benigno 122 0,07267 0,1752 59 0,02386 0,13042 0,119589 benigno 123 0,09455 0,24039 0,548398 maligno 60 0,05769 0,1421 0,157428 benigno 124 0,09047 0,24537 0,521919 maligno 61 0,03548 0,14317 0,105323 benigno 125 0,07766 0,28424 0,613786 maligno 63 0,03650 0,22576 0,22545 benigno 126 0,06897 0,21765 0,229482 maligno 63 0,05912 0,13634 0,160714 benigno 127 0,04047 0,16316 0,284713 maligno 64 0,03835 0,13121 0,100938 benigno 128 0,05017 0,18483 0,397343 maligno 129 0,05933 0,21893 0,442728 maligno 130 0,05741 0,27106 0,496517 maligno 131 0,06618 0,18987 0,417271 maligno 132 0,04236 0,18765 0,284021 maligno 133 0,04339 0,1954 134 0,05842 0,27747 0,472476 maligno 135 0,04004 0,19457 0,392121 maligno 136 0,04581 0,21724 0,402662 maligno 137 0,06989 0,2444 138 0,06087 0,24613 0,468223 maligno 139 0,06480 0,2868 140 0,05651 0,16859 0,292382 maligno 141 0,05773 0,19772 0,364201 maligno 142 0,05249 0,20164 0,421523 maligno 143 0,08957 0,22843 0,493069 maligno maligno 0,347503 maligno 0,413398 maligno 0,532489 maligno 0,458332 maligno APÊNDICE B - BASE DE DADOS 2: MASSAS MAMOGRÁFICAS E TUMORES Esta base de dados foi adquirida junto ao Departments of Electrical & Computer Engineering and Radiology, University of Calgary, Calgary, AB, Canada. Ela é constituída de 37 informações associadas a massas benignas, quais sejam: fatores de forma (C, f, Fcc, SI), atributos fundamentado no cálculo do gradiente 203 (Ac) e doze informações de textura (F1-F5 e F6-F12: correlação-F1, energia-F2, entropia-F3, inverso da diferença do momento-F4, soma das entropias-F5 contrasteF6, energia-F7, soma das variâncias-F8, diferença das variâncias-F9, diferença da entropias-F10, segundo momento-F11, máxima correlação-F12) e 20 valores dos mesmos tipos de informações relacionados com tumores malignos. Esses dados resultam de análises de massas e tumores feitas em mamografias digitalizadas, em que (regiões de interesse) ROI’s são manualmente identificadas e desenhadas nas mamografias por um radiologista experiente em mamografia. BD2 é utilizada para treinar os classificadores a diagnosticar massas mamográficas em massas benignas ou tumores malignos. A TABELA B.1 mostra os atributos mamográficos de BD2. (TÚLIO & RANGAYYAN, 2003) (ESPÍRITO-SANTO, 2004) TABELA B.1: BD2: Atributos mamográficos de base de dados Gradiente Fatores de forma Informações de textura Casos Tipo 1 benigno 0,058802 0,16466 0,865093 0,0345 0,049462 0,9993 0,0024 9,1295 0,632 7,9067 2 benigno 0,054776 0,19226 0,846597 0,0938 0,039058 0,9997 0,0016 9,6468 0,6313 8,4168 3 benigno 0,070948 0,10898 0,879779 0 0,041676 0,9986 0,0013 10,0885 0,4716 8,1107 4 benigno 0,062454 5 benigno 6 Ac C f Fcc SI F1 F2 0,1211 0,869856 0,074 0,032753 0,9984 0,0044 F3 F4 F5 8,1829 0,675 7,1488 9,5937 0,4086 7,3615 benigno 0,083916 0,17251 0,816295 0,2228 0,085936 0,9963 0,0009 10,5013 0,3574 7,9634 7 benigno 0,050226 0,13471 0,872252 0 0,066605 0,9994 0,0017 9,7674 0,5408 8,1258 8 benigno 0,057986 0,15690 0,867302 0 0,048622 0,9982 0,0014 9,9445 0,4683 7,9783 9 benigno 0,078047 0,17317 0,851622 0,0981 0,091689 0,9983 0,001 10,3904 0,4315 8,238 10 benigno 0,079582 0,51228 0,661407 0,2011 0,164396 0,9987 0,0022 9,2136 0,5788 7,7177 11 benigno 0,057418 0,22722 0,808194 0,1956 0,07985 0,999 0,0039 8,4148 0,685 7,4157 12 benigno 0,056188 0,14644 0,83834 0,1284 0,070328 0,9989 0,0015 9,7685 0,5277 8,0642 13 benigno 0,046536 0,19375 0,795405 0,2552 0,126376 0,9982 0,0116 6,9722 0,7759 6,3973 14 benigno 0,039012 0,11799 0,882518 0,0633 8,7598 0,7665 8,107 15 benigno 0,051197 0,10720 0,859699 0 0,042299 0,9992 0,0012 10,2315 0,4833 8,334 16 benigno 0,043041 0,15612 0,852226 0,0504 0,123487 0,9981 0,0025 9,1747 0,5354 7,5113 17 benigno 0,084688 0,15762 0,816726 0,064 0,103867 0,9979 0,0008 10,743 0,3757 8,3012 18 benigno 0,062779 0,11911 0,869421 0,0282 0,065358 0,9979 0,0014 9,8473 0,4711 7,8811 19 benigno 0,084887 0,25809 0,764226 0,237 0,184672 0,9978 0,0012 10,211 0,4217 8,0455 20 benigno 0,06884 0,19985 0,801223 0,1713 0,118254 0,998 0,0016 9,7506 0,4881 7,8488 21 benigno 0,049892 0,14621 0,846664 0,1499 8,9949 0,5957 7,6086 22 benigno 0,072441 0,13158 0,861257 0,0523 0,042846 0,9981 0,0012 10,0059 0,4495 7,9367 23 benigno 0,083694 0,17475 0,833779 0,1957 0,094885 0,9985 0,0009 10,4268 0,423 8,222 24 benigno 0,079899 0,15006 0,865271 0,0174 0,054651 0,9991 0,003 8,7607 0,6356 7,5504 35 benigno 0,063495 0,14131 0,878758 0,0296 0,045588 0,9994 0,005 8,0946 0,7467 7,3583 26 benigno 0,063265 0,13414 0,847582 0,0331 0,108722 0,995 0,0142 6,5296 0,7569 5,8654 0,06777 0,29388 0,851075 0 0,084442 0,9938 0,0017 0,02417 0,9999 0,0046 0,06458 0,9989 0,0029 204 27 benigno 0,053039 0,26767 0,79546 0,1485 0,090306 0,9977 0,0098 7,0829 0,7515 6,3937 28 benigno 0,063957 0,14717 0,848996 0,0609 0,057561 0,9988 0,0061 7,7593 0,7358 6,9917 29 benigno 0,065486 0,11556 0,870986 0 0,052385 0,9979 0,0082 7,3238 0,7292 6,5347 30 benigno 0,050505 0,18184 0,808135 0,2041 0,070202 0,9993 0,0053 31 benigno 32 8,063 0,7367 7,3071 0,852 0,2216 0,041324 0,9984 0,0065 7,621 0,7287 6,8284 benigno 0,045235 0,13585 0,834726 0,0912 0,089393 0,993 0,0155 6,4082 0,7566 5,7263 33 benigno 0,054391 0,25971 0,799724 0,2361 0,100384 0,999 0,0069 7,7454 0,7424 7,0102 34 benigno 0,057084 0,18131 0,80204 0,1726 0,121827 0,9991 0,0054 7,9537 0,7323 7,1773 35 benigno 0,062587 0,13784 0,849697 0,0406 0,070685 0,9995 0,0042 8,2692 0,7266 7,4681 36 benigno 0,035734 0,15788 0,828636 0,0992 0,066898 0,9997 0,0045 8,3942 0,7391 7,6378 37 benigno 0,051619 0,28325 0,757578 0,3129 0,154595 0,9994 0,0024 9,0801 0,6565 7,9496 38 maligno 0,045867 0,84090 0,552336 0,4704 0,730239 0,997 0,0023 9,2039 0,5196 7,4562 39 maligno 0,050803 0,83001 0,508834 0,5714 0,73467 0,9983 0,0016 9,7664 0,475 7,8607 40 maligno 0,078773 0,28192 0,758083 0,3933 0,274553 0,9984 0,0032 8,7723 0,6112 7,4204 41 maligno 0,074136 0,62330 0,646991 0,4209 0,5708 0,9946 0,0009 10,6751 0,3088 7,8873 42 maligno 0,088168 0,54652 0,630877 0,3676 0,489224 0,998 0,0009 10,407 0,4053 8,1496 43 maligno 0,033181 0,87478 0,521895 0,4405 0,742903 0,9978 0,0018 9,5034 0,5228 7,7602 44 maligno 0,026781 0,89290 0,469998 0,4099 0,727682 0,9993 0,0016 9,7583 0,555 8,1964 45 maligno 0,011961 0,98609 0,300401 0,4767 0,614686 0,9998 0,0027 9,1189 0,7243 8,2876 46 maligno 0,013923 0,95742 0,398604 0,4548 0,800991 0,9984 0,0039 8,6699 0,7409 7,8934 47 maligno 0,044267 0,61171 0,631205 0,4969 0,42632 0,9957 0,0022 9,304 0,5828 7,8401 48 maligno 0,021324 0,97808 0,363479 0,4649 0,73763 0,9993 0,0044 8,5321 0,6809 7,5299 48 maligno 0,048666 0,91602 0,445087 0,4318 0,85323 0,9978 0,001 10,3315 0,4147 8,109 50 maligno 0,041031 0,86640 0,484025 0,4159 0,774961 0,999 0,0014 9,8655 0,5011 8,0479 51 maligno 0,040491 0,75538 0,596097 0,4991 0,443559 0,9988 0,0034 8,7429 0,6268 7,4929 52 maligno 0,023732 0,93923 0,403834 0,4685 0,625335 0,9996 0,002 9,4296 0,6303 8,2019 53 maligno 0,050744 0,23344 0,79421 0,2881 0,083718 0,9996 0,0042 8,5489 0,7136 7,6905 54 maligno 0,029082 0,80806 0,576959 0,5025 0,586549 0,9995 0,0027 8,9137 0,6833 7,9115 55 maligno 0,063548 0,43683 0,692689 0,4373 0,149298 0,9992 0,0015 9,7848 0,5502 8,1837 56 maligno 0,073398 0,28817 0,770726 0,2851 0,120387 0,9986 0,0016 9,9894 0,504 8,1051 57 maligno 0,86445 0,9992 0,0012 10,1433 0,5009 8,3344 Casos Tipo 1 benigno 2 0,05887 0,15056 0,02909 0,92974 0,430635 0,5029 F6 Informações de textura F9 F10 F7 F8 F11 F12 1,3131 0,0024 3927,2751 0,878 1,3989 1 1,0417 benigno 1,3406 0,0016 9010,6531 0,8997 1,4114 1 1,0035 3 benigno 3,8008 0,0013 5519,9843 2,1433 2,2504 0,9999 1,0125 4 benigno 0,9974 0,0044 1280,4557 0,7071 1,1458 0,9999 1,016 5 benigno 5,3283 0,0017 1702,9965 2,7142 2,5164 0,9991 1,0179 6 benigno 8,0803 0,0009 4319,5527 4,0031 2,8093 0,9995 1,0083 7 benigno 2,4565 0,0017 7773,8277 1,4946 1,9087 0,9999 1,0076 8 benigno 3,7114 0,0014 4061,4512 2,0421 2,2467 0,9998 1,0132 205 9 benigno 4,9532 0,001 5930,5347 2,6766 2,4512 0,9999 1,0097 10 benigno 1,97 0,0022 3003,2565 1,2594 1,7253 0,9999 1,004 11 benigno 0,9522 0,0039 1922,4414 0,688 1,0921 0,9999 1,0026 12 benigno 2,6111 0,0015 4760,4113 1,5552 1,9614 0,9999 1,0039 13 benigno 0,5145 0,0116 584,5843 0,4234 0,4622 0,9998 1,0068 14 benigno 0,736 0,0046 13132,3727 0,6277 0,5864 1 1,0328 15 benigno 3,38 0,0012 8311,1799 1,8952 2,1732 0,9999 1,0101 16 benigno 2,4822 0,0025 2663,5504 1,4915 1,9214 0,9998 1,0182 17 benigno 7,3285 0,0008 6854,9099 3,7574 2,7351 0,9998 1,0293 18 benigno 3,7728 0,0014 3620,6606 2,1143 2,2495 0,9998 1,0583 19 benigno 5,057 0,0012 4623,3262 2,6593 2,472 0,9998 1,0053 20 benigno 3,4094 0,0016 3472,8531 1,9488 2,1733 0,9998 1,0107 21 benigno 1,6698 0,0029 3107,985 1,0686 1,6055 0,9999 1,0546 22 benigno 4,2949 0,0012 4609,8783 2,3405 2,35 0,9998 1,0084 23 benigno 5,1399 0,0009 6626,3881 2,7292 2,4837 0,9998 1,0045 24 benigno 1,3001 0,003 2815,3389 0,8768 1,385 0,9999 1,0173 25 benigno 0,6618 0,005 2054,551 0,5275 0,6987 1 1,0892 26 benigno 0,5834 0,0142 230,6965 0,4663 0,602 0,9992 1,0339 27 benigno 0,6046 0,0098 521,7172 0,4795 0,6403 0,9997 1,007 28 benigno 0,6811 0,0061 1164,8447 0,5294 0,7575 0,9999 1,0049 29 benigno 0,7057 0,0082 658,0703 0,5422 0,7991 0,9997 1,0169 30 benigno 0,6746 0,0053 1819,7928 0,5246 0,7498 0,9999 1,0277 31 benigno 0,7062 0,0065 855,5464 0,5418 0,8006 0,9999 1,0302 32 benigno 0,6161 0,0155 176,0775 0,4971 0,6162 0,999 1,0435 33 benigno 0,6466 0,0069 1317,6549 0,5068 0,7077 0,9999 1,0065 34 benigno 0,6927 0,0054 1485,3408 0,535 0,7789 0,9999 1,0132 35 benigno 0,7299 0,0042 2743,6832 0,5609 0,824 1 1,0052 36 benigno 0,7057 0,0045 4390,9154 0,5582 0,748 1 1,0038 37 benigno 1,1605 0,0024 4065,2222 0,8106 1,2697 1 1,0052 38 maligno 3,0131 0,0023 2022,9845 1,858 2,0209 0,9997 1,0924 39 maligno 3,4897 0,0016 4132,3909 1,923 2,2017 0,9998 1,0936 40 maligno 1,6085 0,0032 1981,2758 1,0717 1,5483 0,9999 1,0078 41 maligno 11,6399 0,0009 4313,8446 5,5039 3,0614 0,999 1,0505 42 maligno 5,7103 0,0009 5801,9487 2,9559 2,5619 0,9998 1,014 43 maligno 3,2257 0,0018 2973,4419 2,0899 2,0042 0,9998 1,021 44 maligno 2,1933 0,0016 6109,2819 1,3436 1,8282 1 1,014 45 maligno 0,7687 0,0027 8037,6411 0,5936 0,8526 1 1,0176 46 maligno 3,6374 0,0039 4663,4038 3,4219 0,7946 1 1,0486 47 maligno 9,1215 0,0022 4203,0124 8,076 1,7868 0,9999 1,0793 48 maligno 0,9606 0,0044 2728,9807 0,6867 1,1078 0,9999 1,0343 49 maligno 5,2416 0,001 4741,1939 2,7179 2,5024 0,9998 1,0085 50 maligno 3,0491 0,0014 5905,5467 1,7494 2,0942 0,9999 1,0093 51 maligno 1,3569 0,0034 2346,3182 0,9009 1,4277 0,9999 1,0071 206 52 maligno 1,3179 0,002 6634,9846 0,8771 1,4048 1 1,0122 53 maligno 0,7907 0,0042 4023,0391 0,5953 0,9089 1 1,0046 54 maligno 0,9598 0,0027 4168,7715 0,6915 1,1016 1 1,0128 55 maligno 2,2132 0,0015 5596,5702 1,3388 1,8412 0,9999 1,0069 56 maligno 3,7743 0,0016 5501,6325 2,3625 2,178 0,9999 1,0325 57 maligno 3,0165 0,0012 7632,4635 1,7243 2,0848 0,9999 1,0222