UNIVERSIDADE PAULISTA – UNIP
CLASSIFICADOR PARACONSISTENTE DE
ATRIBUTOS DE IMAGENS MAMOGRAFICAS
APLICADO NO PROCESSO DE DIAGNÓSTICO
DO CÂNCER DE MAMA ASSISTIDO POR
COMPUTADOR
Tese apresentada ao Programa de PósGraduação em Engenharia de Produção
da Universidade Paulista – UNIP para a
obtenção
do
título
de
Engenharia de Produção.
FÁBIO VIEIRA DO AMARAL
SÃO PAULO
2013
Doutor
em
2
UNIVERSIDADE PAULISTA – UNIP
CLASSIFICADOR PARACONSISTENTE DE
ATRIBUTOS DE IMAGENS MAMOGRAFICAS APLICADO
NO PROCESSO DE DIAGNÓSTICO DO CÂNCER DE MAMA
ASSISTIDO POR COMPUTADOR
FÁBIO VIEIRA DO AMARAL
Tese apresentada ao Programa de PósGraduação em Engenharia de Produção
da Universidade Paulista – UNIP para a
obtenção do título de Doutor em
Engenharia de Produção.
Área de Concentração:
Sistemas de Operação
Gestão
de
Linha de Pesquisa: Métodos Quantitativos
em Engenharia de Produção
Orientador: Prof. Dr. Jair Minoro Abe
SÃO PAULO
2013
3
Amaral, Fábio Vieira do.
Classificador Paraconsistente de atributos de imagens
mamograficas aplicado no processo de diagnóstico do câncer de mama
assistido por computador. / Fábio Vieira do Amaral. – São Paulo, 2013
205 f. color
Tese (Doutorado) – Apresentada ao Programa de Pós Graduação
em Engenharia de Produção da Universidade Paulista – UNIP, São
Paulo, 2013.
Área de Concentração: Gestão de Sistemas de Operação
“Orientador: Prof. Dr. Jair Minoro Abe”
1.
Lógica Paraconsistente Anotada Evidencial ERedes Neurais
Artificiais Paraconsistentes, 3. Câncer de mama, 4. Classificador de
atributos de imagens, 5. Auxílio ao diagnóstico.
4
FÁBIO VIEIRA DO AMARAL
CLASSIFICADOR PARACONSISTENTE DE
ATRIBUTOS DE IMAGENS MAMOGRAFICAS APLICADO
NO PROCESSO DE DIAGNÓSTICO DO CÂNCER DE MAMA
ASSISTIDO POR COMPUTADOR
Tese apresentada ao Programa de PósGraduação em Engenharia de Produção
da Universidade Paulista – UNIP para a
obtenção do título de Doutor em
Engenharia de Produção.
.
Aprovado em:
BANCA EXAMINADORA
___________________________________________
Prof.Dr. Mário Mollo Neto
Universidade Paulista - UNIP
____/____/_____
___________________________________________
____/____/_____
Prof. Dr. Rafael do Espírito-Santo
Instituto Israelita de Pesquisa e Ensino Albert Einsten
___________________________________________
Prof.Dr. João Inácio da Silva Filho
Universidade Santa Cecília - UNISANTA
____/____/_____
___________________________________________
Prof. Dr. Fábio Romeu de Carvalho
Universidade Paulista - UNIP
____/____/_____
___________________________________________
Prof. Dr. Jair Minoro Abe (Orientador)
Universidade Paulista – UNIP
____/____/_____
5
AGRADECIMENTOS
Ao Prof. Dr. Jair Minoro Abe, meu orientador, pela paciência e confiança, mas
principalmente, por sua sabedoria nos momentos de desânimo frente às dificuldades
envolvidas no trato com as pessoas. Sua visão de orientador me ensinou que todos
devem ter a chance de se tornar um pesquisador, mesmo tendo a certeza de que para
muitos nunca irá ocorrer de fato.
Ao Prof. Dr. Marcelo Nogueira, se não fosse por sua insistência, este doutorado jamais
teria se iniciado.
Ao Prof. MSc. Fábio Luís Pereira, meu colega de profissão, um desbravador para o
nosso grupo de pesquisa no quesito Rede Neural Artificial Paraconsistente.
Ao Prof. Dr. Rafael do Espírito-Santo, mais do que um amigo, um coorientador
presente.
Ao Prof. MSc. Hélio Corrêa de Araújo, meu ex-aluno que se transformou em
pesquisador, professor e amigo. Sua ajuda nos momentos de falta de inspiração foi
crucial.
Ao meu ex-aluno de graduação e pós-graduação Álvaro André Colombero Prado, por
sua ajuda na revisão deste trabalho.
Ao meu ex-aluno de graduação e pós-graduação Renato Hildebrando Parreira, que
junto com o Hélio Corrêa de Araújo passamos madrugadas testando o software.
Aos Professores Doutores João Inácio da Silva Filho e Mário Mollo Neto, cujas
observações sobre o trabalho foram essenciais e extremamente produtivas.
Aos meus familiares, pela compreensão e carinho com que acolheram minha
dedicação à pesquisa e, consequentemente, ausência.
6
RESUMO
Neste trabalho foi desenvolvido um Classificador Paraconsistente para o auxílio ao
diagnóstico do câncer de mama, a partir da classificação de atributos de imagens
mamográficas. A arquitetura da Rede Neural Artificial Paraconsistente utilizada é
dividida em três fases: na primeira fase, há as Células Neurais Artificiais
Paraconsistentes de aprendizado (CNAPa´s); na segunda fase, há as Células Neurais
Artificiais Paraconsistentes de Conexão lógica simples (CNAPCls´s) e na terceira fase,
há as Células Neurais Arificiais Paraconsistentes de decisão (CNAPd´s). O sistema
implementa oito conjuntos de atributos mamográficos, onde para cada atributo de
imagem foi criada uma rede neural, com a tomada de decisão a partir dos resultados
finais do processamento de cada conjunto de atributos. Para mitigar os efeitos dos
diagnósticos formados por falsos positivos e verdadeiros positivos desenvolveu-se um
algoritmo para calibração do valor de corte entre os casos benignos e malignos. A fim
de analisar o desempenho do Classificador os resultados foram comparados com os
resultados
dos
seguintes
classificadores:
Multi-Layer
Perceptron(MLP),
um
classificador de duplo estágio (ART2LDA), fundamentado na Adaptive Resonance
Theory (ART) e um classificador implementado segundo técnicas de otimização não
linear e combinatória, associadas á capacidade de classificação das Funções de
Bases Radiais (RBF-Simulated Annealing). Para realização das simulações são
utilizadas duas bases de dados distintas. A primeira para classificação de calcificações
composta por 143 amostras divididas em 64 casos benignos e 79 casos malignos
representados por fatores de forma e a segunda para classificação de massas
mamográficas e tumores composta por 57 regiões de interesse divididas em 37
malignas e 20 benignas representadas por fatores de forma, transição de bordas e
medidas de textura. Os desempenhos dos classificadores em discriminar casos
benignos e malignos são comparados em termos da área sob curva Receiver
Operating Characteristic (Az). Quanto maior o valor de Az, melhor é o desempenho
do classificador.
Os experimentos com calcificações mostram: Classificador
Paraconsistente (Az = 0,986), Classificador MLP (Az = 0,70), Classificador ART2LDA
(Az = 0,696) e Classificador RBF-Simulated Annealing (Az = 0,94). Para os
experimentos com massas mamográficas e tumores mostram: Conjunto 1,
Classificador Paraconsistente (Az = 0,939), Classificador MLP (Az = 0,994),
7
Classificador ART2LDA (Az = 0,901) e Classificador RBF-Simulated Annealing (Az =
0,912). Conjunto 2, Classificador Paraconsistente (Az = 0,935), Classificador MLP (Az
= 0,994), Classificador ART2LDA (Az = 0,890) e Classificador RBF-Simulated
Annealing (Az = 0,924). Conjunto 3, Classificador Paraconsistente (Az = 0,875),
Classificador MLP (Az = 0,970), Classificador ART2LDA (Az = 0,850) e Classificador
RBF-Simulated Annealing (Az = 0,996). Conjunto 4, Classificador Paraconsistente (Az
= 0,500), Classificador MLP (Az = 0,887), Classificador ART2LDA (Az = 0,767) e
Classificador RBF-Simulated Annealing (Az = 0,907). Conjunto 5, Classificador
Paraconsistente (Az = 0,929), Classificador MLP (Az = 0,987), Classificador ART2LDA
(Az = 0,884) e Classificador RBF-Simulated Annealing (Az = 0,998). Conjunto 6,
Classificador Paraconsistente (Az = 0,939), Classificador MLP (Az = 0,982),
Classificador ART2LDA (Az = 0,885) e Classificador RBF-Simulated Annealing (Az =
0,999).
No caso do Classificador Paraconsistente houve o oitavo experimento
composto pelo total de atributos de imagens relativos às massas mamográficas e
tumores (Az = 0,939). No caso particular do Classificar RBF-Simulated Annealing o
experimento com todos os atributos de imagens se mostrou inviável graças à
complexidade do seu algoritmo, onde o tempo de processamento tende ao infinito
para um número maior de elementos. Para os experimentos o Classificador
Paraconsistente utilizou 20% das amostras para treinamento da rede neural, contra o
total de amostras disponíveis menos uma para os demais classificadores. Os
resultados demonstram as qualidades do Classificador Paraconsistente ao utilizar um
número reduzido de amostras para treinamento da rede neural e pelo seu baixo tempo
de processamento. O classificador proposto pode ser classificação como um
Computer-Aided Diagnosis (CAD).
Palavras-chave:
Computer-Aided
Diagnosis,
Câncer
de
mama,
Paraconsistente Anotada Evidencial E, Rede Neural Artificial Paraconsitente
Lógica
8
ABSTRACT
In this work, a Paraconsistent Classifier for the diagnosis of breast cancer based on
the attributes of mamographic images was developed. The architecture of the
Paraconsistent Artificial Neural Network used is divided into three phases: the first one
with Paraconsistent Artificial Learning Neural Cells (CNAPa's), the second with
Paraconsistent Artificial Simple Logic Connection Neural Cells (CNAPCls's ) and in the
third stage, with Arificial Paraconsistent decision Neural Cells (CNAPd's). The system
implements eight sets of mammographic attributes, where for each picture attribute, a
neural network with decision making from the final results of processing each set of
attributes was created. In order to mitigate the effects of false positives diagnoses and
true positives, an algorithm was developed to calibrate the cutoff between benign and
malignant cases. In order to analyze the performance of the Paraconsistent classifier,
the results will be compared with the results of the following classifiers: Multi-Layer
Perceptron (MLP), a dual stage classifier (ART2LDA) based on Adaptive Resonance
Theory (ART) and a classifier implemented with nonlinear optimization techniques and
combinatorics, associated with the classification capabilities of Radial basis Functions
- (RBF-Simulated Annealing).To perform the simulations, two different databases were
used. The first one, to classify calcifications, is composed of 143 samples divided into
64 benign cases and 79 malignant cases represented by form. The second is intended
for mammographic masses and tumors classification, and is composed by 57 regions
of interest divided into 37 malignant and 20 benign cases, represented by form factors,
transition edges and texture measures. The performances of the classifiers in
discriminating benign and malignant cases are compared in terms of area under the
Receiver Operating Characteristic Curve (Az). The higher the value of Az, the better
the performance of the classifier.The experiments with calcifications show:
Paraconsistent Classifier (Az = 0.986), MLP classifier (Az = 0.70), ART2LDA Classifier
(Az = 0.696) and RBF Classifier - Simulated Annealing (Az = 0.94). For experiments
with mammographic masses and tumors show: Set 1, Paraconsistent Classifier (Az =
0.939), MLP classifier (Az = 0.994), ART2LDA Classifier (Az = 0.901) and RBF
Classifier - Simulated Annealing (Az = 0.912). Set 2, Paraconsistent Classifier (Az =
9
0.935), MLP classifier (Az = 0.994), ART2LDA Classifier (Az = 0.890) and RBF
Classifier - Simulated Annealing (Az = 0.924). Set 3, Paraconsistent Classifier (Az =
0.875), MLP classifier (Az = 0.970), ART2LDA Classifier (Az = 0.850) and RBF
Classifier - Simulated Annealing (Az = 0.996). Set 4, Paraconsistent Classifier (Az =
0.500), MLP classifier (Az = 0.887), ART2LDA Classifier (Az = 0.767) and RBF
Classifier - Simulated Annealing (Az = 0.907). Set 5, Paraconsistent Classifier (Az =
0.929), MLP classifier (Az = 0.987), ART2LDA Classifier (Az = 0.884) and RBF
Classifier - Simulated Annealing (Az = 0.998). Set 6, Paraconsistent Classifier (Az =
0.939), MLP classifier (Az = 0.982), ART2LDA Classifier (Az = 0.885) and RBF
Classifier - Simulated Annealing (Az = 0.999). In the case of the Paraconsistent
Classifier, the eighth experiment was composed of the total image attributes relating
to mammographic masses and tumors (Az = 0.939). In the particular case of the RBFSort Simulated Annealing experiment with all the image attributes, it was proved its
unfeasibility, due to the complexity of their algorithm, where the processing time tends
to infinity for a larger number of elements. For the experiments, the Paraconsistent
classifier used 20% of the samples for the neural network training, against the total
number of samples available minus one for the other classifiers. The results
demonstrate the qualities of Paraconsistent classifier when using a small number of
samples for training the neural network and its low processing time. The proposed
classifier can be rated as a Computer-Aided Diagnosis system (CAD).
.
Keywords: Attributes of Images Classifier, Breast cancer, Computer-Aided Diagnosis,
Paraconsistent Annotated Evidential Logic E, Paraconsitent Artificial Neural Network
Mammography
10
LISTA DE ILUSTRAÇÕES
Figura 1: Componentes de uma unidade de raios-X exclusiva para mamografia.
(BASSETT, 2000) ................................................................................................ 37
Figura 2 : Bordas fixas versus móveis. (BASSETT, 2000) ................................... 39
Figura 3: Exame de mamografia sendo realizado(BASSETT, 2000). ................... 41
Figura 4: Variação da quantidade de tecido fibroglandular nas mamas em função
da idade. (PASQUALETTE, 1998) ....................................................................... 42
Figura 5 : Sequencia de mamografias mostrando aspectos diferentes de acordo
com a faixa etária. (PASQUALETTE, 1998) ......................................................... 42
Figura 6: Massas – forma e contorno. (BASSETT, 2000) ..................................... 46
Figura 7: Calcificações – configuração e distribuição. (BASSETT, 2000) ............. 48
Figura 8: Condições de visão. Os espaços do negatoscópio adéquam-se ao
tamanho dos filmes mamográficos. Na disposição mostrada, o novo exame foi
colocado na coluna de baixo, com um exame dois anos mais antigo diretamente
acima para comparação. A luz extrínseca é coberta no negatoscópio usando-se
painéis deslizantes. Uma lente de magnificação portátil e uma luz brilhante estão
disponíveis e são usadas regularmente. (BASSETT, 2000) ................................. 49
Figura 9: As incidências mediolateral oblíqua (A) e CC (B) são colocadas costas
com costas sobre o negatoscópio para emitir avaliação da simetria bilateral das
mamas. (BASSETT, 2000) ................................................................................... 49
Figura 10: Exemplos de formas dos contornos das massa benignas: (a) e
(b).Exemplos de formas dos contornos de tumores malignos: (c) e (d) (HILLARY,
RANGAYYAN, & DESAUTELS, 2003) (ESPÍRITO-SANTO, 2004). ..................... 58
Figura 11: a) Uma mamografia típica; b) segmentação; c) densidade FD (x,y); d) a
f) contrastes (FC(x,y)), FKC(x,y) e FE(x,y)); g) e h) estruturas detectadas
(ESPÍRITO-SANTO, 2004)................................................................................... 59
Figura 12: Na esquerda, uma mamografia exibindo calcificações malignas. Na
direita, contornos nas calcificações feitos pelo Radiologista (SHEN, RANGAYYAN,
& DESAUTELS, Detection and classification of mammographic calcifications, 1993)
(ESPÍRITO-SANTO, 2004)................................................................................... 60
Figura 13: Na esquerda, uma mamografia exibindo calcificações benignas. Na
direita, contornos nas calcificações feitos pelo Radiologista (SHEN, RANGAYYAN,
& DESAUTELS, Detection and classification of mammographic calcifications, 1993)
(ESPÍRITO-SANTO, 2004)................................................................................... 60
11
Figura 14: Na esquerda, uma mamografia exibindo um tumor maligno (espiculada).
Na direita, tumor identificado pelo Radiologista (contorno) (GULIATO, Detection of
Breast Tumor Boundaries Using Iso-Intensity Contours and Dynamic Thresholding,
1996).................................................................................................................... 62
Figura 15: Representação do reticulado  das anotações pelo diagrama de Hasse
(ABE, 2008) ......................................................................................................... 72
Figura 16: Reticulado com graus de certeza e incerteza (ABE J. M., 2011) ......... 73
Figura 17: Estados extremos e não-extremos (ABE J. M., 2011) ......................... 76
Figura 18: Diagrama com os graus de incerteza e de certeza, com valores
ajustáveis de controle limite indicados nos eixos. Obeservem-se também as regiões
consideradas (ABE J. M., 2011). .......................................................................... 76
Figura 19 : Sistema básico de Análise Paraconsistente (ABE, 2008). .................. 77
Figura 20: Reticulado representado por um QUPC (ABE, 2008). ......................... 78
Figura 21: Representação dos Graus de Certeza e de Incerteza (ABE, 2008). .... 79
Figura 22 : Divisão do QUPC em 12 regiões (ABE, 2008). .................................. 80
Figura 23: Diagrama do Para-Analizador (ABE, 2008). ........................................ 83
Figura 24: Neurônio Biológico (BARRETO, 2008) ................................................ 86
Figura 25: Sentido de propagação dos impulsos nervosos (BARRETO, 2008) .... 87
Figura 26: Balanço energético realizado no corpo celular (BARRETO, 2008). ..... 87
Figura 27: Neurônio Biológico em funcionamento (BARRETO, 2008). ................. 88
Figura 28: Neurônio Artificial M-P (McCulloch-Pitts) (BARRETO, 2008)............... 89
Figura 29: Representação dos dendritos, M-P (McCulloch-Pitts) (BARRETO, 2008)
............................................................................................................................. 90
Figura 30: Representação das sinapses, M-P (McCulloch-Pitts) (BARRETO,
2008).................................................................................................................... 90
Figura 31: Representação do corpo celular, M-P (McCulloch-Pitts) (BARRETO,
2008).................................................................................................................... 91
Figura 32 : Representação do corpo celular, M-P (McCulloch-Pitts) (BARRETO,
2008).................................................................................................................... 91
Figura 33 : Análise Geométrica, M-P (McCulloch-Pitts) (BARRETO, 2008) ......... 92
Figura 34: Análise Geométrica (Eq. 1), M-P (McCulloch-Pitts) (BARRETO,
2008).................................................................................................................... 92
12
Figura 35: Análise Geométrica (Eq. 2), M-P (McCulloch-Pitts) (BARRETO,
2008).................................................................................................................... 93
Figura 36 : Análise Geométrica (separação de classes), M-P (McCulloch-Pitts)
(BARRETO, 2008) ............................................................................................... 93
Figura 37: Esquema básico de Rede Neural Artificial clássica. Entradas: são sinais
de entradas; Pesos: balanceiam os dados de entrada de acordo com sua
relevância; Neurônios intermediários: realizam os cálculos do processamento;
Neurônios de saída: preparam os dados processados para a saída. Saídas: são os
valores resultantes do processamento (LOPES, 2009). ....................................... 96
Figura 38: Para-Analisador Simplificado (DA SILVA FILHO & ABE, 1999). .......... 97
Figura 39 : Célula Artificiai Paraconsistentes Básica (DA SILVA FILHO & ABE,
1999).................................................................................................................. 100
Figura 40: Família de Células Neurais Artificiais Paraconsistentes CNAP’s (DA
SILVA FILHO & ABE, 1999). .............................................................................. 101
Figura 41: Desenvolvimento da Rede Neural Artificial Paraconsistente (DA SILVA
FILHO & ABE, 1999) .......................................................................................... 105
Figura 42: Fluxograma da Célula Artificial Paraconsistente Básica (DA SILVA
FILHO & ABE, 1999) .......................................................................................... 106
Figura 43: Representação gráfica da relação entre verdadeiros positivos (VP),
falsos positivos (FP), falsos negativos (FN) e verdadeiros negativos (VN).
(BASSETT, 2000) .............................................................................................. 116
Figura 44: Curva ROC representativa para mamografia. (BASSETT, 2000) ...... 120
Figura 45 : Modelo esquemático utilizado no entendimento da curva ROC. As duas
Gaussianas representam as distribuições de densidade de probabilidade do grau
de confiança que um radiologista tem ao fazer um diagnóstico positivo. A reta
vertical traçada nas Gaussianas e um possível “limiar de confiança” que separa
diagnósticos positivos dos positivos (SOUZA, 2009)(ESPÍRITO-SANTO,
2004).................................................................................................................. 125
Figura 46: Curvas ROC típicas que podem resultar a partir da análise de
mamografias. P11 e P21 são postos particulares de operação respectivamente das
curvas ROC1 e ROC2(ESPÍRITO-SANTO, 2004). ............................................. 128
Figura 47: Acer Aspire 5738-6294 (Fonte: Acer Inc.) ......................................... 151
Figura 48: Modelo de Processo de Negócio Macro do Classificador Paraconsistente
(construído pelo autor). ...................................................................................... 153
Figura 49: Processo Geral de Classificação do Classificador Paraconsistente
(construído pelo autor). ...................................................................................... 156
13
Figura 50: Região bem definida entre Benignos e Malignos (construído pelo autor).
........................................................................................................................... 157
Figura 51: Linha de Balizamento do Classificador (construído pelo autor). ........ 159
Figura 52: Resultado apresentado como 75% para Benigno e valores de
balizamento (construído pelo autor). .................................................................. 159
Figura 53: Cadastro de Amostras – Série 6 (Massas Mamográficas e Tumores)
(construído pelo autor). ...................................................................................... 161
Figura 54: Treinamento da Série 6 (Massas Mamográficas e Tumores) para
amostras Benignas (construído pelo autor). ....................................................... 162
Figura 55: Padrão Aprendido – Série 6 (Massas Mamográficas e Tumores)
(construído pelo autor). ...................................................................................... 162
Figura 56: Balizamento de uma amostra Benigna - Série 6 (Massas Mamográficas
e Tumores) (construído pelo autor). ................................................................... 163
Figura 57: Resultado Maligno de uma classificação bem sucedida (construído pelo
autor). ................................................................................................................ 164
Figura 58: Arquitetura – Classificador Paraconsistente (construído pelo autor). 167
Figura 59: Arquitetura da RNAP (construído pelo autor). ................................... 168
Figura 60: Diagrama de Sequência - Cadastro de Amostras (construído pelo autor).
........................................................................................................................... 169
Figura 61: Diagrama de Sequência - Treinamento da RNAP (construído pelo autor).
........................................................................................................................... 170
Figura 62: Diagrama de Sequência - Classificação da RNAP (construído pelo autor).
........................................................................................................................... 171
Figura 63: Modelo Entidade Relacionamento – RNAP (construído pelo autor). . 173
14
LISTA DE TABELAS
Tabela 1: Apresenta os estados lógicos extremos e símbolos com os respectivos
valores de Graus de Evidência Favorável e Desfavorável (ABE J. M., 2011) ....... 77
Tabela 2: Estados Lógicos Não-Extremos (ABE J. M., 2011). .............................. 81
Tabela 3: Qualidade do diagnóstico em relação à área da curva ROC (SOUZA P.
R., 2009) ............................................................................................................ 176
Tabela 4: : Área sob a curva ROC para o teste 1 (construído pelo autor). ......... 177
Tabela 5: Área sob a curva ROC para o teste 2 (construído pelo autor). ........... 179
Tabela 6: Área sob a curva ROC para o teste 3(construído pelo autor). ............ 180
15
LISTA DE QUADROS
Quadro 1: Causas de Falso Negativo (PASQUALETTE, 1998). ........................... 45
Quadro 2: Auditória Mamográfica Essencial ou Básica; Dados Brutos e Deduzidos
Minimante Desejados. (BASSETT, 2000) .......................................................... 112
Quadro 3: Auditória Mamográfica Mais Completa; Dados Brutos a Serem
Coletados. (BASSETT, 2000) ............................................................................ 113
Quadro 4: Auditória Médica mais Completa: Dados Derivados a Serem Calculados.
(BASSETT, 2000) .............................................................................................. 114
Quadro 5: Análise dos dados de auditória médica: metas desejáveis. (BASSETT,
2000).................................................................................................................. 121
16
LISTA DE GRÁFICOS
Gráfico 1: Resultado do teste com atributos de forma para calcificação (construído
pelo autor). ......................................................................................................... 177
Gráfico 2: Resultado do teste com todos os atributos de imagens para massas
mamográficas e tumores (construído pelo autor). .............................................. 178
Gráfico 3: Resultado do teste com atributos de imagens para massas mamográficas
e tumores, conjunto C1 (construído pelo autor).................................................. 179
Gráfico 4: Resultado do teste com atributos de imagens para massas mamográficas
e tumores, conjunto C2 (construído pelo autor).................................................. 180
Gráfico 5: Resultado do teste com atributos de imagens para massas mamográficas
e tumores, conjunto C3 (construído pelo autor).................................................. 181
Gráfico 6: Resultado do teste com atributos de imagens para massas mamográficas
e tumores, conjunto C5 (construído pelo autor).................................................. 182
Gráfico 7: Resultado do teste com atributos de imagens para massas mamográficas
e tumores, conjunto C5 (construído pelo autor).................................................. 183
Gráfico 8: Resultado do teste com atributos de imagens para massas mamográficas
e tumores, conjunto C6 (construído pelo autor).................................................. 184
17
LISTA DE ABREVIATURAS E SIGLAS
ACR
American College of Radiology
ACS
American Cancer Society
ART2
Adaptive Resonance Theory (Teoria da Ressonância Adaptativa), uma
evolução das redes ART e ART1
ART2LDA
Adaptive Resonance Theory and Linear Discriminats Analyzer (Teoria
da Ressonância Adaptativa e Analisador de Discriminação Linear)
ART-EMAP Adaptive Resonance Theory with Enhanced Self Organized Mapping
(Teoria da Ressonância Adaptativa com Mapeamento Autorganizável
Reforçado)
ARTMAP
Adaptive Resonance Theory with Self Organized Mapping (Teoria da
Ressonância Adaptativa com Mapeamento Autorganizável)
ARTMAP-IC Adaptive Resonance Theory with Enhanced Self Organized Mapping and
Inconsistent Cases Mapping (Teoria da Ressonância Adaptativa com
Mapeamento Autorganizável e Casos Incosistentes)
BCDDP
Breast Cancer Detection Demonstration Project
BI-RADS
Breast Imaging Reporting and Data System
CAD
Computer-Aided Diagnosis (Diagnóstico Auxiliado por Computador)
CAPb
Célula Artificial Paraconsistente Básica
CNAPb
Célula Neural Artificial Paraconsistente Básica
IC
Incidência Craniocaudal
CLS
Curvilinear Structures
CRACON
Centro de Referência de Alta Complexidade em Oncologia
EA
Evolutionary Algorithms (Algoritmos Evolutivos)
EANN
Evolutionary Artificial Neural Network (Rede Neural Artificial Evolutiva)
18
EEB
Equação Estrutural Básica
FN
Frações de falsos negativos
FP
Frações de falsos positivos
GA
Genetic Algorithmic (Algoritmo Genético)
HIP
Health Insurance Plan
LDA
Linear Discriminat Analysis (Analisador de Discriminação Linear)
MLO
Mediolateral Oblíqua
MLP
Multi-Layer Perceptron (Rede Neural de múltiplas camada com reto
alimentação)
MQSA
Mammography Quality Standards Act
NCI
National Cancer Institute
PCA
Principal Component Analysis
RBF
Radial Base Functions (Funções de Bases Radias)
ROC
Receiver Operating Characteristic (Gráfico da Característica de
Operação).
ROIs
Regiões de interesse
RNAP
Rede Neural Artificial Paraconsistente
RNA
Rede Neural Artificial
SEER
The Surveillance, Epidemiology, and End Results
SUS
Sistema Único de Saúde
VN
Frações de verdadeiros negativos
VP
Frações de verdadeiros positivos
19
LISTA DE SÍMBOLOS
Ac: Medida do gradiente para a Acutance
C: Fator de forma para a compactação
F: Estado Lógico Extremo Falso
f: Fator de forma para a descrição de Fourier
Fcc: Fator de forma para concavidade fracionária
Fn (n = 1, 2, ... 12): medida de textura
Gce: Grau de certeza
Gin: Grau de incerteza
I: Estado Lógico Indefinido
m: Fator de forma para o momento
QF T: Estado Lógico Não-Extremo Quase-Falso tendendo ao Inconsistente
QF Estado Lógico Não-Extremo Quase-Falso tendendo ao Paracompleto
QV T: Estado Lógico Não-Extremo Quase-Verdadeiro tendendo ao Inconsistente
QV Estado Lógico Não-Extremo Quase-Verdadeiro tendendo ao Paracompleto
SI: Índice de forma espiculada
T: Estado
Lógico Extremo Inconsistente
TF: Estado Lógico Não-Extremo Inconsistente tendendo ao Falso
TV: Estado Lógico Não-Extremo Inconsistente tendendo ao Verdadeiro
V: Estado Lógico Extremo Verdadeiro
Vcfa: Valor de controle de falsidade
20
Vcic: Valor de controle de inconsistência
Vcpa: Valor de controle de paracompleteza
Vcve: Valor de controle de veracidade
: Estado Lógico Extremo Paracompleto
V: Estado Lógico Não-Extremo Paracompleto tendendo ao Verdadeiro
F: Estado Lógico Não-Extremo Paracompleto tendendo ao Falso
: Evidência Desfavorável
: Evidência Favorável
21
SUMÁRIO
CAPÍTULO 1 - INTRODUÇÃO --------------------------------------------------------------------- 23
1.1 Origem do Trabalho------------------------------------------------------------------------------------- 23
1.2 Apresentação --------------------------------------------------------------------------------------------- 24
1.3 Objetivos -------------------------------------------------------------------------------------------------- 29
1.4 Justificativa ----------------------------------------------------------------------------------------------- 30
1.5 Procedimentos Metodológicos ------------------------------------------------------------------------ 31
1.6 Escopo do Trabalho ------------------------------------------------------------------------------------- 31
1.7 Estrutura do Trabalho ----------------------------------------------------------------------------------- 32
CAPÍTULO 2 - REVISÃO BIBLIOGRÁFICA ---------------------------------------------------- 33
2.1 Mamografia ----------------------------------------------------------------------------------------------- 33
2.2 CAD (Compter-Aided Diagnosis) -------------------------------------------------------------------- 54
2.3 Lógica Paraconsistente --------------------------------------------------------------------------------- 67
2.4 Lógica Paraconsistente Anotada Evidencial E --------------------------------------------------- 68
2.5 Redes Neurais Artificiais Paraconsistentes --------------------------------------------------------- 85
2.6 Medidas de Qualidade no Diagnóstico ------------------------------------------------------------ 111
2.7 Estado da Arte ------------------------------------------------------------------------------------------ 129
CAPÍTULO 3 – MATERIAIS E MÉTODO ----------------------------------------------------- 150
3.1 Recursos específicos aplicados ao desenvolvimento ------------------------------------------- 150
CAPÍTULO 4 – Testes Comparativos ---------------------------------------------------------- 174
4.1 Conjuntos de Atributos Mamográficos utilizados nos testes ---------------------------------- 174
4.2 Caracterização dos atributos de imagens ---------------------------------------------------------- 175
4.3 Métodos de treinamento e teste dos classificadores -------------------------------------------- 175
4.4 Testes Comparativos ---------------------------------------------------------------------------------- 176
4.5 Testes utilizando a base de dados BD1 ------------------------------------------------------------ 177
22
4.6 Testes utilizando a base de dados BD2 ------------------------------------------------------------ 178
CAPÍTULO 5 – AVALIAÇÃO DOS RESULTADOS ----------------------------------------- 185
CAPÍTULO 6 – CONCLUSÕES ----------------------------------------------------------------- 187
REFERÊNCIAS BIBLIOGRÁFICAS ------------------------------------------------------------ 189
APÊNDICE A - BASE DE DADOS 1: CALCIFICAÇÕES --------------------------------- 199
APÊNDICE B - BASE DE DADOS 2: MASSAS MAMOGRÁFICAS E TUMORES 202
23
CAPÍTULO 1 - INTRODUÇÃO
1.1 Origem do Trabalho
A base para o desenvolvimento deste trabalho é a revisitação da tese de
doutorado (ESPÍRITO-SANTO, 2004), de onde foram extraídos os dados utilizados
nas simulações e os estudos de casos com classificadores de populações para efeito
de comparação de resultados na temática diagnóstico do câncer de mama.
Em (ESPÍRITO-SANTO, 2004), foi desenvolvido um discriminador de classes
implementado segundo técnicas de otimização não linear e combinatória, associadas
à capacidade de classificação das Funções de Bases Radiais (RBF’s). Comparou-se
o desempenho do classificador com diversas abordagens de classificação, utilizando
como estudo de caso calcificações e massas mamográficas (benignas ou malignas):
o Multi-Layer Perceptron (MLP), um classificador de duplo estágio (ART2LDA),
fundamentado na Teoria da Ressonância Adaptativa - Adaptive Resonance Theory
(ART) e Discriminação Linear (LDA) - que aceitam treinamentos supervisionados e
não supervisionados. Os classificadores foram treinados com uma base de dados
constituída de 143 calcificações (79 malignas e 64 benignas), descritas em termos de
fatores de forma. Os classificadores também foram treinados com uma base de dados
contendo 57 regiões de interesse (37 malignas e 20 benignas) que descrevem as
complexidades das massas e tumores a partir de fatores de forma, transição de bordas
e medidas de textura. Adotou-se a metodologia leave-one-out nos treinamentos.
Os desempenhos dos classificadores em discriminar casos benignos e malignos
foram comparados em termos da área sob curva ROC (Receiver Operating
Characteristic) (Az). Quanto maior o valor de Az, melhor é o desempenho do
classificador. Os experimentos com calcificações mostram que o melhor resultado é o
obtido com o RBF-Simulated Annealing (Az = 0,97), pois o valor de Az encontrado tem
maior magnitude que os valores computados para os classificadores MLP (Az = 0,70)
e ART2LDA (Az = 0,71). Nos experimentos com massas e tumores, os desempenhos
dependem da dimensão dos casos exemplos empregados nos treinamentos dos
classificadores. O melhor desempenho observado em casos exemplos de três
24
dimensões é o do MLP (Az = 0,994), pois o valor de Az desse classificador é maior
que os valores de Az obtidos com o RBF-Simulated Annealing (Az = 0,912) e o
ART2LDA (Az = 0,901). Com casos exemplos de oito dimensões o RBF-Simulated
Annealing. (Az = 0,999) teve melhor desempenho que o MLP (Az = 0.982) e o
ART2LDA (Az = 0.885).
1.2 Apresentação
O câncer da mama é o tipo de câncer que mais acomete as mulheres em todo o
mundo, tanto em países em desenvolvimento quanto em países desenvolvidos. Cerca
de 1,4 milhão de casos novos dessa neoplasia foi esperado para o ano de 2008, em
todo o mundo, o que representa 23% de todos os tipos de câncer. (INCA, 2011 (A)).
O aumento, mesmo em áreas de tradicional baixa incidência, em grande parte está
relacionado com as mudanças nos hábitos de vida e no perfil epidemiológico da
população. Vários países desenvolvidos têm conseguido, apesar desse aumento na
incidência, reduzir a sua mortalidade, através de um diagnóstico precoce e de um
tratamento mais eficaz (PAULINELLI, 2003).
A sua incidência é maior na América do Norte e no Norte da Europa; intermediária
no restante da Europa e na América do Sul, e menor na Ásia e nos países menos
desenvolvidos (PAULINELLI, 2003).
A incidência padronizada pela população mundial, ajustada por idade, chega a
127 e 128/100.000 mulheres em algumas regiões do norte dos EUA e no Havaí, ao
passo que na China e na África a incidência é de apenas 17 e 21/100.000,
respectivamente (PAULINELLI, 2003).
Em 2012, o câncer de mama liderou as ocorrências de câncer em todos os países
da Europa. Há uma variação de três vezes (49-148 por 100 mil) com um claro padrão
geográfico. Altas taxas de incidência foram estimadas em países da Europa Ocidental,
na Bélgica (147), França (137) e Holanda (131); no Norte da Europa, especialmente
no Reino Unido (129) e nos países nórdicos, Dinamarca (143), Islândia (131) e
Finlândia (121). As taxas de incidência em países do Leste Europeu foram a Ucrânia
(54) e Moldávia (53). As taxas de mortalidade mais altas no Norte (por exemplo,
Bélgica (29), Dinamarca (28)) e no Sul (por exemplo, Sérvia (31), Macedónia
25
(36)) (FERLAY, 2013). Para Brasil, houve 52.680 casos novos de câncer de mama,
com um risco estimado de 52 casos a cada 100 mil mulheres (INCA, 2011 (A)).
A idade continua sendo o principal fator de risco para o câncer de mama. As taxas
de incidência aumentam rapidamente até os 50 anos e, posteriormente, esse aumento
ocorre de forma mais lenta. Outros fatores de risco já estão bem estabelecidos, como,
por exemplo, aqueles relacionados à vida reprodutiva da mulher (menarca precoce,
nuliparidade, idade da primeira gestação acima dos 30 anos, anticoncepcionais orais,
menopausa tardia e terapia de reposição hormonal), histórico familiar de câncer de
mama e alta densidade do tecido mamário, isto é, razão elevada entre o tecido
glandular e o tecido adiposo da mama. Além desses fatores, a exposição à radiação
ionizante, mesmo em baixas doses, também é considerada um fator de risco,
particularmente durante a puberdade, segundo mostram alguns estudos (INCA, 2011
(A)).
Apesar de ser considerado um câncer de prognóstico relativamente bom se
diagnosticado e tratado oportunamente, as taxas de mortalidade por câncer de mama
continuam elevadas no Brasil, muito provavelmente porque a doença ainda é
diagnosticada em estágio avançado. A sobrevida média após cinco anos na população
de países desenvolvidos tem apresentado um discreto aumento, cerca de 85%.
Entretanto, nos países em desenvolvimento, a sobrevida fica em torno de 60%. (INCA,
2011 (A)).
Mulheres com câncer de mama em estágio inicial que recebem tratamento no
Brasil podem ter a mesma sobrevida de pacientes tratadas nos Estados Unidos,
revelou um estudo feito na Faculdade de Medicina da Universidade Estadual Paulista
(UNESP), de Botucatu. O estudo, iniciado em 2011, levantou dados de pacientes
diagnosticadas entre 1998 e 2001, para que pudessem ser observadas as taxas de
sobrevida após 10 anos do início do tratamento (BRASIL, 2013).
Apesar da igualdade de chances na expectativa de vida entre as pacientes dos
dois países, a falta do diagnóstico precoce faz com que a mortalidade brasileira
permaneça ainda muito superior à norte-americana, explica o autor da pesquisa, René
Aloísio da Costa Vieira, mastologista do Hospital do Câncer de Barretos (BRASIL,
2013).
O médico usou dados de cerca de 47 mil pacientes dos Estados Unidos, obtidos
no programa The Surveillance, Epidemiology, and End Results (SEER), que
26
representa 28% da população do país. Ele comparou com informações de 834
pacientes do Hospital do Câncer de Barretos (SP), considerado Centro de Referência
de Alta Complexidade em Oncologia (Cracon), que atende basicamente pelo Sistema
Único de Saúde (SUS) e existe há 50 anos (BRASIL, 2013).
O levantamento mostrou que 50,1% das mulheres diagnosticadas com câncer de
mama nos Estados Unidos encontravam-se no estágio inicial da doença, com tumores
menores do que dois centímetros e ainda não palpáveis. No Brasil, porém, os
diagnósticos nesse estágio precoce ocorreram em apenas 10% dos casos. O médico
esclarece que é muito importante que a doença seja descoberta exatamente nesse
ponto, de forma precoce, uma vez que as chances de cura a partir de um tratamento
nesse estágio chegam a 90% (BRASIL, 2013).
A detecção do câncer de mama em estágio mais avançado foi observada, a partir
do levantamento, em 45,8% das pacientes brasileiras e em somente 8,4% das norteamericanas. Nesse nível mais adiantado da doença, a taxa de sobrevida após 10 anos
cai para apenas 17% dos casos.
“No Brasil, demora-se mais para chegar ao médico e o tamanho do tumor é maior”
(BRASIL, 2013).
No mundo, os países desenvolvidos como os Estados Unidos têm uma relação
de 19 mortes por câncer de mama para cada 100 pacientes diagnosticadas com a
doença. Na América do Sul, essa proporção sobe para 29,8 mortes. No continente
africano, a situação é ainda pior, pois para cada 100 mulheres com a doença, 60
morrem (BRASIL, 2013).
A mamografia é a melhor ferramenta disponível para a detecção precoce do
câncer de mama. Pode revelar evidências de anormalidades, como massas e
calcificações, sinais sutis, como assimetria bilateral e distorção da arquitetura. O
rastreamento mamográfico demonstrou ser eficaz na redução das taxas de
mortalidade por câncer de mama: programas de rastreio têm reduzido as taxas de
mortalidade entre 30-70% (RANGARAJ, FABIO, & DESAUTELS, 2007).
Pelos padrões norte-americano e europeu, as mulheres entre 40 e 49 anos fazem
o exame anualmente e, entre 50 e 69 anos, fazem a cada dois anos. A Sociedade
Brasileira de Mastologia recomenda uma regularidade ainda maior, mulheres entre 40
e 69 anos de idade devem submeter-se ao exame uma vez por ano. Para que o
diagnóstico precoce dos tumores de mama se torne uma realidade no país, o sistema
27
de saúde precisaria investir nos mamógrafos. “Precisaria melhorar a rede de
mamografia” (INCA, 2011 (A)).
Mamografias são difíceis de interpretar, especialmente no contexto de rastreio. A
sensibilidade da mamografia é afetada pela qualidade de imagem e nível de
conhecimento do radiologista. Outro fator que afeta o desempenho de um radiologista
é o elevado volume de processos analisados em um programa de triagem. A falta de
radiologistas especialistas para analisar as mamografias em áreas remotas ou rurais
é também um motivo de preocupação. A má interpretação dos sinais de câncer de
mama foi responsável por 52% dos erros.
Tecnologia de diagnóstico auxiliado por computador (CAD) pode melhorar o
desempenho dos radiologistas, aumentando a sensibilidade às taxas comparáveis aos
obtidos por dupla leitura. O foco das pesquisas está voltado para o desenvolvimento
de imagens digitais e sistemas de análise de imagem que possam detectar as
características
mamográficas,
classificá-las
e
fornecer
alertas
visuais
aos
radiologistas (RANGARAJ, FABIO, & DESAUTELS, 2007).
A revisão bibliográfica realizada neste trabalho apresenta uma realidade em que
o erro de diagnóstico pode estar em qualquer etapa do processo, nos equipamentos,
graças à falta de manutenção adequada, nos técnicos e nos médicos, graças à falta
de treinamento e rigor na utilização dos protocolos, na hesitação em se reconvocar
uma paciente para a realização de um novo exame no caso de dúvida e na falta de
controles de auditagem em que falhas possam ser identificadas, corrigidas ou
penalizadas de forma adequada.
Em (CADY & CHUNG, 2005) discutiu-se a validade dos programas de rastreio
mamográfico, com destaque para a redução da mortalidade conseguida por vários
programas de triagem na Suécia, Holanda, Reino Unido, Finlândia, Itália e EUA. As
desvantagens da triagem também são discutidas, isto é, a maior incidência de biópsias
desnecessárias, o custo e a qualidade da interpretação das mamografias contra a
experiência dos radiologistas, e os efeitos psicológicos dos erros, tal como a
ansiedade causada por um resultado falso-positivo e a garantia indevida fornecida por
um teste falso-negativo. Os benefícios do rastreio superam os inconvenientes, e a
prática do rastreamento mamográfico deve ser incentivada e expandida (CADY &
CHUNG, 2005).
28
Levando-se em consideração que apenas 30% dos casos indicados para biópsia
são confirmados (RANGAYYAN, MUDIGONDA, & DESAUTELS, 2000); (ESPÍRITOSANTO, 2004) a utilização de métodos capazes de aumentar a distinção entre massas
benignas e tumores malignos, sem reduzir a sensibilidade da mamografia em detectar
câncer de mama são de fundamental importância. Tais métodos funcionariam como
ferramentas de apoio à decisão que os radiologistas empregariam na análise das
mamografias.
Fazendo uma associação entre necessidade e empregabilidade, o diagnóstico
auxiliado por computador pode ser definido como um diagnóstico feito por um médico
que utiliza o resultado de análises quantitativas automatizadas de imagens como uma
segunda opinião para a tomada de decisões diagnosticadas. A finalidade do CAD
(Computer-Aided Diagnosis) é melhorar a acurácia do diagnóstico, assim como a
consistência de interpretação da imagem, mediante o uso da resposta do computador
como referência. A resposta do computador pode ser útil, uma vez que o diagnóstico
do especialista é baseado em avaliação subjetiva, estando sujeito a variações intra e
interpessoais, e a perda de informação devido à baixa qualidade da imagem,
sobreposição de estruturas, fadiga visual ou distração. Além disso, uma dupla leitura
(por dois especialistas) pode aumentar a sensibilidade do diagnóstico. A proposta do
CAD é funcionar como um segundo especialista (RODRIGO, IÁLIS, & FÁTIMA, 2011).
Dentro desse cenário, um sistema de CAD apresenta-se sob dois aspectos
distintos:

A representação dos aspectos morfológicos, de um mamograma em termos de
parâmetros métricos: fatores de forma, definição de borda e texturas.

Classificação dos atributos em malignos e benignos.
Um mamograma exibe uma variedade de texturas correspondendo a
parênquimas, gorduras, tecidos normais, tecidos anormais, calcificações e massas
(TÚLIO & RANGAYYAN, 2003); (RANGAYYAN, SHEN, & DESAUTELS, 1993). Em
mamografia, massas benignas e malignas apresentam texturas diferentes (HILLARY,
RANGAYYAN, & DESAUTELS, 2003). A análise das texturas pode ser usada para
concluir se o material (massa) analisado é benigno ou maligno (ESPÍRITO-SANTO,
2004).
29
Outras abordagens capazes de identificar ocorrências malignas são medidas de
transição de borda (TÚLIO & RANGAYYAN, 2003) e os fatores de forma. As medidas
de transição de borda caracterizam a mudança de intensidade da borda da massa.
Os fatores de forma descrevem ocorrências associadas com a forma das massas ou
das calcificações (RANGAYYAN, SHEN, & DESAUTELS, 1993). Os fatores de formas
usados para descrever as complexidades das calcificações são: compactação (C),
descrição de Fourier (f) e momento (m). Já os fatores de forma normalmente
empregados na caracterização das massas são: compactação (C), descrição de
Fourier (f), concavidade fracionária (Fc) e Índice de forma espiculada (SI) (ESPÍRITOSANTO, 2004).
A classificação de texturas em malignos e benignos é feita a partir de
implementações computacionais, tais como as Redes Neurais Artificiais de
classificação de atributos de imagens. Fazendo uso dessas informações, as Redes
Neurais Artificiais são capazes de detectar a ocorrência de patologias (câncer de
mama) (ESPÍRITO-SANTO, 2004). Isso mostra a importância dos classificadores de
atributos de imagens no desenvolvimento de um sistema CAD. A partir de uma
população de atributos de imagens (fatores de forma, texturas e transição de borda,
por exemplo), o classificador pode fazer a exata classificação, selecionando
elementos com características comuns e agrupando-os em sub-populações distintas
(ESPÍRITO-SANTO, 2004).
1.3 Objetivos
1.3.1
Objetivo Geral
O objetivo deste trabalho é o desenvolvimento de um Classificador
Paraconsistente aplicável no processo de diagnóstico do câncer de mama, permitindo
o emprego da dupla leitura (especialista + software) e no processo de melhoria
continua dos profissionais envolvidos no processo de diagnóstico.
30
1.3.2
Objetivo Complementar
Oferecer ao usuário do Classificador Paraconsistente uma interface capaz de
gerar laudos mamográficos e informações relativas a qualidade dos laudos gerados
de forma individualizada.
1.3.3
Objetivos Específicos

Implementar o principal componente da ferramenta CAD, ou seja, uma
Rede Neural Artificial Paraconsistente adequada à aprendizagem,
armazenagem e classificação de padrões obtidos a partir de atributos de
imagens mamográficas.

Ao receber dados extraídos de uma mamografia, a rede deverá ser
capaz de classificar suas características e sugerir sua tendência de
acometimento de câncer de mama.

Melhorar a especificidade do resultado através da utilização de um
algoritmo que permita reduzir a faixa de indefinição entre os valores
benignos e malignos.

Comparar os resultados obtidos pelo Classificador Paraconsistente com
os resultados alcançados por outros classificadores, que utilizam
técnicas tradicionais de classificação.

Indicar o melhor conjunto de atributos de imagens associado à rede
neural artificial paraconsistente.
1.4 Justificativa
Ao se tratar o diagnóstico de câncer de mama como um processo de produção de
diagnósticos, a chance de erro fica evidente em toda a cadeia produtiva. Na primeira
etapa de produção, as condições gerais do equipamento e a capacidade técnica do
31
operador podem comprometer a qualidade da imagem mamografia. Na segunda
etapa, a capacitação do médico e o não cumprimento do protocolo de diagnostico
pode afetar o laudo.
Com a evolução tecnológica e o emprego do computador nas mais diversas
atividades, o software CAD surge como ferramenta adicional ao diagnóstico do câncer
de mama. Assim como na mamografia, críticas ao seu emprego surgem em
abundância. A revisão bibliográfica aponta para uma taxa de detecção baixa para
distorções arquitetônicas, aumenta para massas e atinge quase 100% para
microcalcificações. CAD pode ajudar os leitores a diminuir erros de detecção de
cânceres, nomeadamente, as que se manifestam como microcalcificações. No
entanto, a taxa de falsos positivos é muito alta.
Este trabalho se justifica por apresentar uma proposta de auxílio ao diagnóstico
do câncer de mama, permitindo o emprego da dupla leitura (especialista + software)
e por permitir a incorporação de um processo de melhoria contínua dos médicos
radiologistas e técnicos envolvidos no processo de diagnóstico.
1.5 Procedimentos Metodológicos
De acordo com os objetivos anteriormente descritos, este trabalho caracterizase como pesquisa aplicada, iniciando-se por pesquisa bibliográfica, identificação de
alternativas de implementação e realização de uma série de experimentos práticos,
para alcançar à solução pretendida. O desenvolvimento prático serve para validar as
pesquisas bibliográficas.
1.6 Escopo do Trabalho
O trabalho não contemplará a extração de atributos de imagens diretamente das
imagens mamografias.
A ferramenta CAD proposta utilizará redes neurais artificiais paraconsistentes
para a classificação dos atributos de imagens.
32
O CAD não terá acesso direto a laudos mamográficos de pacientes e para as
simulações utilizará duas bases de dados formadas por atributos de imagens que
tiveram sua tipificação, em casos benignos e malignos confirmados por biópsia.
O CAD fornecerá base estatística aos técnicos e médicos envolvidos no processo
de diagnóstico, a fim que possam avaliar seus desempenhos.
1.7 Estrutura do Trabalho
O capítulo I aborda a origem e o desenvolvimento do projeto. O capítulo II
aborda
os
conceitos
necessários
ao
desenvolvimento
do
classificador
paraconsistente: Mamografia, CAD, Lógica Paraconsistente, Lógica Paraconsistente
Anotada Evidencial E, Redes Neurais Artificiais Paraconsistentes, Medidas de
Qualidade no Diagnóstico e Estudo da Arte. O capítulo III descreve o processo de
construção do classificador paraconsistente. O capítulo IV apresenta os testes
comparativos entre o classificador paraconsistente e os classificadores estudados em
(ESPÍRITO-SANTO, 2004). O capítulo V avalia os resultados. No capítulo VI são feitas
as considerações finais, nos quais são expostas as conclusões e sugestões para
futuros trabalhos.
Os apêndices reúnem material de apoio, sendo que o apêndice A corresponde
a Base de Dados 1, utilizada para Calcificações, e o apêndice B corresponde a Base
de Dados 2, utilizada para Massas Mamográficas e Tumores.
33
CAPÍTULO 2 - REVISÃO BIBLIOGRÁFICA
2.1 Mamografia
Dentre as várias modalidades utilizáveis no rastreamento por imagem da
mama, a mamografia por raios X tem provado ser mais eficaz para a investigação do
câncer de mama. Embora o conceito do uso da mamografia como ferramenta de
rastreamento tenha sido aventado por muitos de seus pioneiros, Gershon-Cohen, em
1958, foi o primeiro a realmente investigar seu uso com esta finalidade. Ele concluiu
que mamografias periódicos de mulheres acima dos 40 anos mostraram-se benéficos
na redução da mortalidade. No entanto, como seus estudos não incluem controles,
seu trabalho foi largamente ignorado (BASSETT, 2000).
No intuito de determinar a eficácia da mamografia de rastreamento, foram
realizados vários estudos clínicos prospectivos de larga escala. O primeiro deles foi
conduzido de 1963 a 1967 sob os auspícios do Health Insurance Plan (HIP) de Nova
Iorque. Organizado por Philip Strax, Louis Venet e Sam Shapiro, o propósito do estudo
era determinar se o rastreamento mamográfico e o exame clínico periódico poderiam
diminuir a mortalidade por câncer de mama. As mulheres no estudo eram igualmente
divididas entre o grupo de controle e o grupo de estudo. Ás do grupo de estudo
revelaram que, comparadas ao grupo de controle, as mulheres rastreadas tiveram
uma diminuição de 30% na mortalidade global; uma diminuição de 50% na
mortalidade foi observada nas mulheres que entraram no estudo aos 50 anos ou mais.
Embora a mortalidade tenha sido reduzida em 23% entre as mulheres rastreadas que
estavam abaixo dos 50 anos, este número perdeu o significado em função do número
inadequado de mulheres neste grupo etário (BASSETT, 2000) (PASQUALETTE,
1998) .
Com relação ao benefício de rastrear mulheres entre 40 e 49 anos, uma
redução em sua mortalidade por câncer de mama comparada com a do grupo de
controle na mesma variação de idade foi encontrada em cinco entre oito avaliações
aleatórias. A redução da mortalidade na avaliação de Edinburgh foi de 22%, na do HIP,
23%, na de Kopparkerg, Suécia, 49%, na de Malmo, Suécia, 49% e 40% em 10 anos
na de Gothenburg, Suécia. O vigor do benefício na avaliação de Gothenburg deveu-
34
se a sua significância estatística e o fato que 30% das mulheres que morreram de
câncer de mama entre aquelas às quais foi oferecido o rastreamento, efetivamente o
tinham recusado, embora tenham sido ainda assim computadas como rastreadas
(BASSETT, 2000).
O sucesso do estudo HIP resultou no Breast Cancer Detection Demonstration
Project (BCDDP), co-patrocinado pelo National Cancer Institute (NCI) e pela American
Cancer Society (ACS). Este programa, encarregado de demonstrar a utilidade da
mamografia anual em mulheres entre os 35 e os 74 anos, na comunidade, começou
em 1974 e durou 5 anos. Embora a falta de um grupo de controle impedisse
conclusões definitivas, os dados coletados refletiram os avanços na momografia
desde o estudo HIP. A mamografia detectou 91% de todos os cânceres encontrados
no curso do estudo. Destes casos, a mamografia dos cânceres para os quais o exame
físico foi negativo detectou 42% (comparados aos 33% do HIP), enquanto que o
exame físico dos cânceres para os quais o mamografia foi negativo, detectou somente
9% (comparados a 4% no estudo HIP). Um terço dos cânceres do estudo BCDDP
eram não infiltrantes ou infiltrantes com menos de 1 cm, enquanto que nenhum dos
cânceres do estudo do HIP tinha menos de 1 cm. Além disso, estes pequenos
cânceres foram detectados em mulheres de todas as idades (BASSETT, 2000)
(PASQUALETTE, 1998).
Estudos nos Estados Unidos e na Europa mostram claramente o valor da
mamografia de rastreamento nas mulheres assintomáticas. Sensíveis aos resultados
destes estudos, vários grupos médicos estabeleceram linhas de conduta para o
rastreamento. Em 1976, o American College of Radiology (ACR) tornou-se o primeiro
grupo a adotar essas linhas de conduta. O ACR recomenda que as mamografias
sejam realizadas com 1 ou 2 anos de intervalo para mulheres abaixo dos 50 anos e
anualmente para mulheres com 50 anos. Em 1977, o NCI e o ACS recomendaram que
mulheres de 39 anos ou menos registradas no BCDDP sejam rastreadas somente se
tiverem história pessoal ou familiar de câncer de mama (BASSETT, 2000)
(PASQUALETTE, 1998).
Em 1989, o ACS, o NCI e nove outras organizações se uniram no intuito de
uniformizar as linhas de conduta: o rastreamento deveria começar aos 40 anos com
um mamografia a cada 1-2 anos até os 50 anos, quando passariam a ser feitos
anualmente. As diferenças importantes das linhas de conduta anteriores foram o
35
mamografia basal e o grande apoio ao rastreamento de mulheres entre os 40 e os 49
anos (BASSETT, 2000) (PASQUALETTE, 1998).
A subutilização generalizada do rastreamento mamográfico nos Estados Unidos,
inicialmente observado em 1955, era ainda presente em 1987, quando estudos
revelaram que apenas 15% a 20% das mulheres americanas acima dos 50 anos já
fizeram um mamografia. Isso leva a tentar identificar as barreiras ao rastreamento
mamográfico. Em 1985, um estudo com 257 mulheres de Michigan revelou que
somente 19% das mulheres entre 35 e 49 anos e 25% da mulheres de 50 anos ou
mais já realizaram um mamografia, e que somente 34% estavam cientes dos
parâmetros recomendados para as mulheres com 50 anos ou mais. O estudo também
indicou que 48% da mulheres planejaram realizar mamografias baseadas somente na
recomendação de seus médicos, ressaltando a importância da atitude dos médicos
na utilização do rastreamento mamográfico. Um estudo revelou que a razão primária
pela qual os médicos não recomendam o rastreamento mamográfico foi o risco
perceptível de radiação. Outro estudo de atitudes dos médicos revelou que alguns
ignoravam os benefícios clínicos da mamografia de rastreamento, e que 72% citaram
o alto custo contra o baixo proveito como a maior razão para não recomendar a
mamografia para suas pacientes (BASSETT, 2000).
Os esforços para reverter essa subutilização generalizada do rastreamento
mamográfico incluíram a educação de médicos e pacientes com respeito ao
procedimento e sua utilidade em detectar precocemente o câncer da mama e o
encontro de meios para reduzir os custos do exame. Com relação à sua segurança,
médicos e pacientes foram informados que o desenvolvimento tecnologico reduziu o
risco de exposição á radiação, com mamografias de baixa dose, ao ponto deste ser
desprezível (BASSETT, 2000).
O alto custo da mamografia de rastreamento tem sido um persistente problema.
Em 1986, um levantamento de 58 estabelecimentos em Los Angeles revelou que o
custo médio de um mamografia era $125 (Cento e vinte e cinco dólares). Para reduzir
este custo, os radiologistas começaram a diferenciar entre mamografias de
diagnóstico e de rastreamento. As de diagnóstico envolvem um exame mais caro e
completo de uma paciente sintomática, com incidências adicionais obtidas de acordo
com os sintomas e sinais clínicos, enquanto que o exame de rastreamento é limitado
às pacientes assintomáticas e é menos dispendioso, necessitando apenas duas
36
incidências de cada mama. Um crescente número de serviços agora oferece
mamografias de rastreamento de baixo custo. Outro recurso para a redução de custos
é o uso de unidades móveis para rastreamento mamográfico, desenvolvido e
implementado com sucesso primeiramente por Philip Strax no final dos anos 60
(BASSETT, 2000).
O resultado desses esforços foi o aumento do uso do rastreamento e diagnóstico
mamográficos ao ponto de, em 1993, aproximadamente 74% de todas as mulheres
de 40 anos ou mais haviam feito pelo menos uma mamografia (BASSETT, 2000).
A utilidade da mamografia é altamente dependente do uso apropriado do
equipamento específico para mamografia e da habilidade diagnóstica de quem
interpreta o exame (BASSETT, 2000).
2.1.1
No Brasil
O controle do câncer de mama é uma prioridade da política de saúde brasileira
e foi incluído como uma das metas do Pacto pela Saúde (2006), cujo objetivo é o
fortalecimento, a integração e a incorporação do Sistema Único de Saúde, através de
estratégias de corresponsabilização dos gestores federais, estaduais e municipais
(INCA, 2007).
Desde 2004, quando foi divulgado o Controle do Câncer de Mama: Documento
de Consenso (INCA, 2004), as ações governamentais têm se orientado para oferecer
à população o acesso a procedimentos de detecção precoce dessa doença em
quantidade e qualidade adequadas. O Projeto Piloto de Garantia de Qualidade de
Mamografia, iniciado em 2006, é uma dessas ações e assume importância estratégica
para a organização bem sucedida do rastreamento populacional do câncer de mama.
2.1.2
Equipamento Radiológico
A qualidade da imagem mamográfica depende do equipamento de mamografia,
do sistema receptor de imagem e do processamento do filme. Pela lei, toda
mamografia deveria ser feita em equipamentos exclusivos para esse fim. Uma
unidade exclusiva de mamografia é um sistema de raios X projetado especificamente
37
para radiografia de mama (BASSETT, 2000). A figura 1 ilustra os componentes de
uma unidade de raio X.
Figura 1: Componentes de uma unidade de raios-X exclusiva para mamografia (BASSETT, 2000).
2.1.3
Qualidade da imagem clínica
A imagem clínica é o teste final da efetividade de um programa de qualidade em
um serviço de mamografia. A qualidade da imagem mamográfica é um combinado de
contraste, resolução, nitidez e ruído. Cada componente da unidade de raios X afeta
significativamente a qualidade global da imagem. Por exemplo, a qualidade do
posicionamento da mama e as incidências que podem ser obtidas são afetadas pelo
desenho e pela capacidade de rotação do braço em C e pela forma e flexibilidade do
dispositivo de compressão. A qualidade da imagem também depende do sistema
receptor de imagem e do processamento do filme (BASSETT, 2000).
O contraste da imagem é a diferença na densidade ópitica entre diferentes
regiões da imagem mamográfica e depende do contraste do objeto e do contraste do
receptor de imagem. O contraste do objeto está relacionado à atenuação do feixe de
raios X na medida em que ele passa através da mama. Os componentes da unidade
38
exclusiva que afetam o contraste do objeto incluem a composição do dispositivo de
suporte da mama, a composição do rodo do filme e a grade. O constraste do receptor
de imagem depende das características do tipo específico de combinação tela
intensificadora-filme que é usado, a química de processamento e o tempo que o filme
permanece no revelador (BASSETT, 2000).
A resolução da imagem, a nitidez e o ruído também são afetados pela unidade
de raios X, pelo receptor de imagem e pelo processamento. A resolução espacial da
imagem é a capacidade de registrar pequenos objetos muito próximos bem como os
separados, uma característica medida em unidades de pares de linhas por milímetro.
A nitidez da imagem é a precisão do limite ou contorno de uma estrutura. A resolução
e a nitidez são afetadas pelo tamanho do foco, pela distância fonte-imagem, pelo
mecanismo de compressão e pelo receptor de imagem. A granulação da radiografia,
às vezes chamada ruído, inclui a granulação quântica, a granulação pela tela
intensificadora e a granulação do filme. A principal causa de granulação radiográfica
é o ruído quântico, que é causado pela flutuação estatística do número de fótons de
raios X usados para fazer a imagem. Deste modo, o ruído excessivo pode resultar de
exposição inadequada das porções glanulares da mama, de super-processamento do
filme ou de uma combinação filme-tela intensificadora muito rápida (BASSETT, 2000).
2.1.4 Anatomia e mobilidade da mama
A mama se estende, superiormente, desde a segunda até a sexta constela,
inferior; lateralmente, da linha axilar média até o externo, medialmente. A base da
mama repousa quase totalmente sobre o músculo peitoral e uma porção significativa
do tecido mamário se estende para a axila. Este último segmento da mama, o
prolongamento axilar, pode abrigar um carcinoma de mama e deveria ser visualizado
durante a mamografia de rastreamento. É importante radiografar o máximo de tecido
mamário possível para exames de rastreamento. A mediolateral oblíqua (MLO), que
inclui o músculo peitoral e o prolongamento axilar, é a incidência primária para
rastreamento, porque pode incluir a maior quantidade de tecido mamário em uma
única imagem. No entanto, o tecido medial pode ser excluído em uma MLO
apropriadamente realizada. A incidência craniocaudal (CC) quando apropriadamente
39
realizada, pode visualizar todo o tecido medial. Portanto, as incidências-padrão para
rastreamento, a MLO e a CC são complementares (BASSETT, 2000).
O princípio do tecido móvel versus tecido fixo é usado no posicionamento da
mama para maximizar a quantidade de tecido que pode ser visualizada. As regiões
lateral e inferior da mama são bordas móveis, enquanto as regiões medial e superior
são fixas (Figura 2) (BASSETT, 2000).
Figura 2: Bordas fixas versus móveis (BASSETT, 2000).
.
2.1.5
Compressão da Mama
A compressão apropriada da mama é o principal fator na obtenção de
mamografias de alta qualidade. A compressão adequadamente aplicada é um dos
fatores mais negligenciados, mas também dos mais importantes que afetam a
qualidade da imagem em mamografia. Um objetivo primário da compressão é reduzir
a espessura da mama; desta forma, ela é mais uniformemente penetrada pelo feixe
de raios X desde a região subcutânea até a parede torácica. Isto é mais bem obtido
com um dispositivo rígido de compressão com um ângulo de 90 graus entre as
superfícies posterior e inferior. Um dispositivo de compressão com uma borda
posterior arredondada ou levemente inclinada não irá comprimir uniformemente o
tecido mamário profundo ou prendê-lo firmemente no lugar durante as exposições.
Além disso, um contorno reto ao invés de arredondado ao longo da superfície posterior
do dispositivo de compressão é recomendado, porque a compressão do tecido
40
mamário deveria ser uniforme ao longo da borda posterior do filme de mamografia,
que é reto e não curvo. À medida que a força de compressão é aplicada, a placa de
compressão deveria permanecer paralela ao plano do receptor de imagem. Isto é
particularmente importante com faixas menos penetrantes de raios X de baixa energia
(25-30 kV) que são usados em mamografia de filme-tela intensificadora. A compressão
uniforme é menos crítica com a xeromamografia, que usa um feixe de raios X de alta
energia (40-50 kV) e um receptor de imagem com uma amplitude maior de resposta
de radiação (BASSETT, 2000); (PASQUALETTE, 1998).
Há outras razões importantes pelas quais a compressão apropriada é essencial
para a mamografia. A compressão reduz a distância objeto-receptor de imagem para
uma melhor resolução e separa estruturas dentro da mama, reduzindo a possibilidade
de perder uma lesão coberta por outros tecidos ou interpretando erroneamente a
superposição de tecidos normais como uma anormalidade. A compressão apropriada
resulta em densidade mais uniforme ao reduzir a mama a uma estrutura mais
bidimensional, facilitando a distinção entre estruturas benignas mais compressíveis e
menos densas, como o tecido assimétrico normal, ou cistos, de lesões menos
compressíveis e mais densas, como as malignas. Pela redução da espessura da
mama, a compressão apropriada reduz a dose necessária para uma exposição
adequada e melhora o contraste ao diminuir a radiação dispersa. Além disso, a
compressão apropriada imobiliza a mama, diminuindo a possibilidade de perda de
nitidez por movimento (Figura 3) (BASSETT, 2000).
41
Figura 3: Exame de mamografia sendo realizado (BASSETT, 2000).
2.1.6
Análise da Mamografia
Com a progressão da idade, as mamas femininas apresentam, na sua maioria,
uma substituição lenta e gradual do tecido fibroglandular por tecido gorduroso (Figura
4) (PASQUALETTE, 1998).
42
Adulto jovem
Climatério
Mamas com predomínio do tecido fibroglandular
Mama adiposa
Figura 4: Variação da quantidade de tecido fibroglandular nas mamas em função da idade
(PASQUALETTE, 1998).
Do final da adolescência até o final da fase adulto jovem (35 anos), a maioria
das mamas apresentam-se mais densas. Na fase de pré-menopausa, já ocorre a
substituição adiposa que se completa no climatério, onde a mama apresenta-se na
maioria das vezes, transparente com mínimos elementos glandulares (Figura 5)
(PASQUALETTE, 1998).
Figura 5 : Sequência de mamografias mostrando aspectos diferentes de acordo com a faixa etária
(PASQUALETTE, 1998).
Fatores que podem alterar as características da mamografia.

Idade

Paridade

Ciclo Menstrual
43
2.1.7

Hormônios Exógenos e outras Substâncias

Perda de Peso

Cirurgias Anteriores
Indicações para mamografia
Existem dois tipos de exames mamograficos: Mamografia de Rastreamento e
Mamografia Diagnóstica (INCA, 2007).
2.1.7.1 Mamografia de Rastreamento
O Documento de Consenso (INCA, 2004), recomenda as seguintes ações para
rastreamento em mulheres assintomáticas:

Exame clínico das mamas a partir dos 40 anos.

Mamografia para mulheres entre 50 e 69 anos, com intervalo máximo de dois
anos entre os exames.

Exame clínico das mamas e mamografia anual, a partir dos 35 anos, para
mulheres do grupo de risco.
2.1.7.2 Mamografia Diagnóstica
Realizada em mulheres com sinais ou sintomas de câncer de mama. Os
sintomas mais frequentes de câncer de mama são (INCA, 2007):
Nódulo - um nódulo palpável geralmente é descoberto pela própria
paciente, que chega ao médico com muita ansiedade e medo. Se o nódulo for
um novo achado no autoexame das mamas ou no exame clínico, a mamografia
deve ser realizada, independente da data do exame anterior. Se o nódulo
palpável não tiver expressão na mamografia, a complementação com a
ultrassonografia é obrigatória. Se um nódulo lobulado ou regular for identificado
na mamografia, o exame deve ser complementado com a ultrassonografia para
identificar se o nódulo é sólido ou cístico, diferença fundamental para
44
determinar a conduta a ser estabelecida. Convém lembrar que a mamografia
em pacientes jovens (abaixo de 30 anos) normalmente não apresenta nenhum
benefício diagnóstico, em virtude da alta densidade das mamas e pela baixa
incidência de câncer (menos de 0,1%) na faixa etária, a ultrassonografia é o
exame de escolha para a primeira avaliação de nódulos nesses casos (INCA,
2007).
Espessamento - representa uma região mais endurecida na palpação,
sem que seja possível delimitar um nódulo. A indicação de mamografia segue
os mesmos parâmetros descritos para o nódulo (INCA, 2007).
Controle radiológico de lesão provavelmente benigna (Categoria 3)
- o controle radiológico deve ser realizado de 6 em 6 meses no primeiro e
anualmente nos 2 anos seguintes. Radiologicamente, uma lesão é considerada
benigna quando permanece estável num período de 3 anos. Qualquer
modificação no aspecto radiológico, seja na forma, tamanho, densidade ou
número (no caso de microcalcificações), em qualquer fase do controle,
representa indicação para histopatológico (INCA, 2007).
2.1.8
Achados mamográficos
Existem várias maneiras de classificar os achados mamográficos. Optamos
pela classificação dos achados, relacionando-os com malignidade, em sinais
primários, secundários e indiretos (PASQUALETTE, 1998).
Sinais primários incluem massas bem ou mal definidas e microcalcificações.
Sinais secundários incluem espessamento ou retração da pele e aumento dos
linfonodos axilares. Sinais indiretos incluem distorção da arquitetura, assimetria de
densidade e aumento de ducto único (PASQUALETTE, 1998).
A capacidade da mamografia em revelar achados depende de fatores
relacionados com a qualidade do processamento e equipamento, fatores técnicos,
como posicionamento e treinamento do mamografista, e fatores inerentes a
características do tecido mamário, como a maior ou menor presença de tecido
45
fibroglandular na mama, impedindo que haja uma quantidade suficiente de tecido
gorduroso que passa a oferecer o contraste desejado para o aparecimento da lesão
em estudo (PASQUALETTE, 1998).
Assim sendo, em mamas muito densas do ponto de vista radiológico, como
aquelas encontradas nas mulheres jovens nulíparas, gestantes ou lactantes e em
mamas com alterações fibrocísticas severas, mesmo uma massa grande pode ser
obscurecida por um parênquima denso subjacente. O (Quadro 1) relaciona as causas
de falso negativo da mamografia (PASQUALETTE, 1998).
Quadro 1: Causas de Falso Negativo (PASQUALETTE, 1998).
1. Erro de posicionamento não atingindo a região de interesse.
2. Obscurecimento da massa pelo tecido mamário adjacente
(densidade elevada).
3. Qualidade da imagem ruim.
4. Erros de interpretação.
5. Câncer de mama com características indescritíveis do tecido
mamário normal
2.1.8.1 Sinais Primários – Massas
Um nódulo é uma lesão que ocupa espaço, vista em duas projeções diferentes.
Se uma massa em potencial é vista em somente uma projeção, deveria ser chamada
de densidade até que sua tridimensionalidade seja confirmada. A descrição de um
nódulo deve incluir seu tamanho, forma (redonda, oval, lobulada ou irregular),
características de contorno (circunscrita, microlobulada, obscurecida, indistinta ou
espiculada) (BASSETT, 2000).
Podemos estudar as massas como bem ou mal definidas (PASQUALETTE,
1998).
Massas bem definidas são, na maioria das vezes, lesões benignas, sendo
porém imperativo que se faça uma avaliação prévia no sentido de diferenciá-las de
lesões malignas (PASQUALETTE, 1998).
46
Massas mal definidas são aquelas que apresentam irregularidades marcantes
das bordas ou margens da lesão. Geralmente bastante irregulares, estas massas
estão intimamente associadas ao carcinoma, sendo vista a mamografia com margens
algodoadas, serrilhadas ou espiculadas, que anatomopatologicamente representam o
caráter cada vez mais infiltrativo do tumor maligno (Figura 6) (PASQUALETTE, 1998).
Figura 6: Massas – forma e contorno (BASSETT, 2000).
2.1.8.2 Sinais Primários – Microcalcificações
Microcalcificações associadas ao carcinoma podem ocorrer na presença de
uma massa palpável ou de forma independente, quando é tido como um dos sinais
mamográficos mais precoces de câncer mamário. Calcificações malignas são
tipicamente numerosas e variam em tamanho e forma e tendem a ser ramificadas e
filiformes e pleomórficas. Muitas vezes intraductais, são oriundas de células necróticas
tumorais que se depositaram no ducto, podendo também ocorrer no lúmen de
pequenas glândulas malignas, como o resultado de um processo secretório ativo
(PASQUALETTE, 1998).
47
Quando o achado são calcificações sua descrição morfológica e distribuição
podem representar calcificações benignas ou malignas. Calcificações benignas são
aquelas com aparência vascular, grosseira (ou pipoca), de centro lucente ou de
sedimento. Quase todas os casos não necessitam outro seguimento além da
mamografia de rotina. No entanto, se as calcificações não têm estes aspectos
tipicamente benignos, pode ser necessária uma avaliação posterior. Por exemplo,
calcificações vasculares iniciais podem ainda não ter assumido sua forma fina típica,
paralela (BASSETT, 2000).
Calcificações de preocupação intermediárias são amorfas na aparência e
frequentemente necessitam de seguimento especial e não de rotina. Elas são de
aparência tipicamente indistinta e irregular. As calcificações mais preocupantes são
as pleomorfas, as quais estão entre 0,2 e 0,3 mm de tamanho, irregulares e mais
densas que as calcificações amorfas, e as que são finas, lineares e ramificadas,
indicando sua presença nos pequenos ductos terminais e usualmente associadas à
malignidade. As duas últimas categorias de calcificações frequentemente necessitam
de biópsia para excluir malignidade. A distribuição das calcificações pode também se
útil para determinar a conduta posterior com a paciente. Uma disposição agrupada ou
linear é inquietante, mesmo na presença de calcificações que podem ser somente de
característica intermediária ou que parecem benignas. Uma disposição linear de
calcificações puntiformes pode dar a indicação de biópsia. Na medida em que a
disposição se torna menos focal e assume uma distribuição segmentar, regional ou
difusa, a suspeita sobre sua natureza maligna diminui. No entanto, calcificações com
maior grau de suspeição, como as que são finas, lineares e ramificadas, deveriam
sempre ser biopsiadas, mesmo se difusamente distribuídas. Em geral, dever-se-ia
atuar nas calcificações adjacentes com características benignas venha a tentar
dissuadir a recomendação de biópsia (BASSETT, 2000).
Estudos clínicos revelam que a predição de valores positivos, isto é, o
percentual de casos de câncer de mama identificados em mamografias e confirmados
por biópsia é no máximo 30% (RANGAYYAN, MUDIGONDA, & DESAUTELS, 2000).
A figura 7 ilustra a elementos representativos de calcificações.
48
Figura 7: Calcificações – configuração e distribuição (BASSETT, 2000).
2.1.8.3 Sinais Secundários
São geralmente provenientes de lesões avançadas de mama, e sua presença
quando relacionada á malignidade representa um pior prognóstico (PASQUALETTE,
1998).

Espessamentos e retração da pele.

Retração do complexo areolopapilar.

Aumento dos linfonodos da axila.
2.1.8.4 Sinais Indiretos
São sinais mais fracos de câncer e compreendem a dilatação de ducto único,
distorção localizada de arquitetura, assimetria de densidade e o aparecimento de uma
neodensidade (PASQUALETTE, 1998).
49
2.1.9 Leitura da Mamografia
É de fundamental importância que a sala de leitura seja totalmente dedicada
para este fim, com luz somente do negatoscópio, e que o médico tenha a seu alcance
uma lupa, uma régua maleável e lápis de cera (lápis da china ou similar) para que se
possa mensurar e marcar as áreas observadas. Além do negatoscópio, deve existir
próximo uma fonte de luz quente que possa ser utilizada rapidamente, o que é
fundamental para perfeita visualização da pele e celular subcutâneo (Figura 8 e Figura
9).
Figura 8: Condições de visão. Os espaços do negatoscópio adéquam-se ao tamanho dos filmes
mamográficos (BASSETT, 2000).
Figura 9: As incidências mediolateral oblíqua (A) e CC (B) são colocadas costas com costas sobre o
negatoscópio para emitir avaliação da simetria bilateral das mamas (BASSETT, 2000).
50
Sequencia formal de passos:
Passo 1: Avaliação dos dados do paciente
Os dados obtidos da anamnese do paciente devem ser avaliados antes de
iniciar a leitura da mamografia. Objetivo é imaginar em função daqueles dados
que tipo de mamografia se espera encontrar. Exemplo: mama densa ou
totalmente lipossubstituída, se existe alteração de arquitetura em função de
cirurgias, etc.
É sempre interessante avaliar o possível risco para câncer que a paciente
apresenta antes da leitura.
Passo 2: A qualidade do exame
Existem algumas perguntas que devem ser feitas quando ao se observar a
mamografia:

A qualidade e a técnica da mamografia são adequadas?

O exame deve ser repetido?

Todo o tecido mamário foi visibilizado ou é necessário alguma
complementação adicional?

Existe alguma lesão de pele ou cicatriz que não foi marcada através
de artefato metálico?

O exame clínico revelou algum achado? onde?
Jamais se deve hesitar em reconvocar um paciente para uma complementação
adicional. Este procedimento nunca deve ser visto como insegurança do médico e sim
como zelo e boa prática, pois pode significar a diferença entre um bom ou mau
prognóstico para a paciente.
Passo 3: A identificação do exame
Com a finalidade de evitar transtornos desnecessários, a verificação da
identificação da mamografia cruzada com os dados de identificação da folha de
anamnese é extremamente útil. Este passo deve estar muito definido e ser de
amplo conhecimento de todos que manipulam o exame.
51
Passo 4: A avaliação do padrão mamográfico do paciente
Deve-se
avaliar
qual
o
padrão
mamográfico
daquela
mamografia
correlacionando-o com aquele que foi imaginado no passo 1.
A mama é densa ou lipossubstituída? A involução é parcial ou não? Houve
diferença entre a correlação? Existe alguma explicação para as diferenças?
Pode-se interpretá-las dentro dos padrões de normalidade?
Passo 5: Avaliação da simetria
As mamas devem ser checadas em função de sua simetria. A distribuição do
tecido tende a ser mais ou menos simétrico e os quadrantes superiores
externos apresentam mais quantidade de tecido, portanto, geralmente, são os
últimos a involuirem.
Passo 6: Avaliação da periferia
A pele e o tecido celular subcutâneo devem ser inteiramente observados no
intuito de detectar alterações de espessamento da pele e outros. A luz quente
é a indicada para esta análise. É praticamente muito difícil a presença de
carcinomas nesta área, porém a análise cuidadosa do tecido subcutâneo pode
revelar reações desmoplásticas ou linfoedemas de pele que, ás vezes, podem
ser a chave do diagnóstico.
A margem posterior do parênquima mamário jamais pode ser negligenciada,
uma vez que é sitio de vários sinais mamográficos importantes. Um dos mais
importantes sinais observados é o sinal de tenda que consiste numa retração
da borda superior do parênquima podendo aparecer em apenas uma
incidência, denunciando lesão carcinomatosa profunda.
Passo 7: Avaliação do complexo areolopapilar
A comparação específica dos mamilos e das regiões subareolares é de grande
importância para determinar a origem de possíveis inversões e proeminência
ductal maior que a usual.
Deve-se utilizar luz quente para observar a simetria existente.
52
Passo 8: Análise das trabéculas mamárias
Deve-se observar cada centímetro quadrado da mamografia com o propósito
de detectar distorção do padrão trabecular normal. Qualquer alteração deve ser
sempre que possível, identificada e explicada.
Passo 9: À procura de calcificações
Deve-se neste passo utilizar sempre lentes de aumento com campo largo
(diâmetro maior de 8 cm). Deve-se contar as microcalcificações, observando
seus detalhes conforme descrito no item 2.1.6.2. Relacione suas densidades e
sempre que necessário não se deve hesitar em solicitar magnificações para
melhor avaliá-las.
Passo 10: O estudo da axila e vascularização
As regiões axilares de ambas as mamas não devem ser ignoradas.
O tamanho e as características dos linfonodos devem ser identificados,
determinado-se se estão dentro dos limites da normalidade.
Geralmente procura-se observar a topografia e as características da
vascularização mamária, mesmo sabendo da fraca relação deste achado com
o carcinoma.
Passo 11: Recapitulação
É uma boa prática, após se estudar todas os aspectos de ambas as mamas,
rever toda a análise, retornando a uma área determinada de anormalidade com
o intuito de obter mais detalhes de outros achados menos óbvios.
Passo 12: A comparação com mamografias anteriores
Por fim, com todos os detalhes desta análise relacionados, a comparação entre
as mamografias define ou identifica, muitas vezes, diagnósticos que até então
não foram feitos. A comparação feita no final do processo de análise cria uma
grande oportunidade para diagnósticos muito precoces.
53
2.1.10 Auditoria Médica: Base Estatística da Análise dos Resultados Clínicos
A auditoria médica da mamografia pode ser definida em termos gerais como uma
avaliação retrospectiva da adequação e da exatidão da interpretação da imagem
mamográfica (BASSETT, 2000).
A auditagem médica de uma prática mamográfica tem vários benefícios. Avalia
a capacidade da mamografia em detectar cânceres muito pequenos na taxa esperada,
um dos mais importantes parâmetros de sucesso de qualquer prática mamográfica.
Os radiologistas recebem retorno individualizado com relação a seus desempenhos.
Isto proporciona segurança em relação ao resultados estarem dentro das
expectativas ou, caso contrário, identifica a necessidade de treinamento adicional em
habilidades interpretativas para o mamografista ou habilidade técnicas para o técnico.
As auditorias longitudinais podem detectar as causas de erros falso negativos,
permitindo a identificação e correção de falhas técnicas e interpretativas. Quando os
dados de auditagem são revistos e elaborados adequadamente, passam a ser uma
fonte poderosa de instrução para o mamografista. Os resultados da auditagem dentro
das expectativas também podem ser usados para melhorar a adesão tanto dos
médicos de referência quanto das pacientes em relação às normas da mamografia de
rastreamento, bem como indicam níveis aceitáveis de desempenho para os
contribuintes terceirizados e para as agências governamentais. Os dados individuais
de auditoria podem ser úteis para uma defesa médico-legal. Como parte de um
programa de administração de risco, auditorias oportunas de mamografias anormais
proporcionam um excelente acompanhamento das pacientes. Os dados da auditoria
como o número de casos de rastreamento encaminhados para avaliação adicional são
importantes para o cálculo dos custos por paciente rastreada (BASSETT, 2000).
Nos EUA, outra razão obrigatória para realizar uma auditoria de mamografia é a
lei federal, de 1992, onde o Congresso americano aprovou o Mammography Quality
Standards Act (MQSA). Esta legislação regula a prática de mamografia. A Subparte 3
Seção 354f21A chama a atenção para padrões que requerem a instituição e a
manutenção de um programa de segurança de qualidade e controle de qualidade no
serviço adequado e apropriado para assegurar a confiabilidade, a clareza e a
interpretação correta de mamografias (BASSETT, 2000).
54
2.2 CAD (Computer-Aided Diagnosis)
Diagnóstico auxiliado por computador pode ser definido como um diagnóstico
feito por um médico que utiliza o resultado de análises quantitativas automatizadas de
imagens como uma “segunda opinião” para a tomada de decisões diagnósticas (DOI,
2007). É importante ressaltar que o computador é utilizado somente como uma
ferramenta para obtenção de informação adicional, sendo o diagnóstico final sempre
feito pelo especialista, o que diferencia claramente o conceito básico de CAD do
conceito de “diagnóstico automatizado”, que foi um conceito proposto e estudado nas
décadas de 60 e 70 (DOI, 2007). A finalidade do CAD é melhorar a acurácia do
diagnóstico, assim como a consistência da interpretação da imagem, mediante o uso
da resposta do computador como referência. A resposta do computador pode ser útil,
uma vez que o diagnóstico do especialista é baseado em avaliação subjetiva, estando
sujeito a variações intra e interpessoais, bem como perda de informação devido à
baixa qualidade da imagem, sobreposição de estruturas, fadiga visual ou distração.
Além disso, foi demonstrado que uma dupla leitura (por dois especialistas) pode
aumentar a sensibilidade do diagnóstico (THURFJELL, LERNEVALL, & TAUBE,
1994). A proposta do CAD é funcionar como um segundo especialista. Basicamente,
existem dois tipos de aplicações de sistemas CAD. Um é o auxílio à detecção de
lesões, a partir da localização de padrões anormais através da varredura da imagem
pelo computador e o outro é o auxílio ao diagnóstico, através da quantificação de
características da imagem e sua classificação como correspondendo a padrões
normais ou anormais (RODRIGO, IÁLIS, & FÁTIMA, 2011).
2.2.1
Auxílio ao diagnóstico
A detecção automatizada de lesões envolve a localização pelo computador de
regiões contendo padrões suspeitos, porém com a classificação da lesão sendo feita
exclusivamente pelo especialista. Sistemas para auxílio à detecção têm sido
desenvolvidos, principalmente, para imagens radiológicas de tórax e de mama
(RODRIGO, IÁLIS, & FÁTIMA, 2011).
55
2.2.2
Conhecimentos envolvidos
Em geral, os sistemas CAD utilizam-se de técnicas provenientes de duas áreas do
conhecimento, visando a extração e quantificação de atributos de uma imagem em
formato digital: (RODRIGO, IÁLIS, & FÁTIMA, 2011)
1. Processamento de Imagens: envolve o processamento de imagem para realce,
segmentação e extração de atributos.
2. Reconhecimento de Padrões: inclui métodos para seleção de atributos,
estatística e reconhecimento de padrões.
Utilizam-se técnicas de processamento de imagens para realce e segmentação
das lesões, conforme o tipo do exame. Por exemplo, utilizam-se propriedades de
descontinuidade dos níveis de cinza, detecção de contorno, bordas ou segmentação
para separação de regiões que apresentem determinada característica. Após o realce
e segmentação, segue o processamento envolvendo a quantificação de atributos da
imagem, como, tamanho, contraste e forma dos seus objetos constituintes. A
descrição dos atributos da imagem relaciona as características reconhecidas
subjetivamente pelos especialistas. De um modo geral, os atributos são quantificados
a partir de propriedades métricas, topológicas e de textura dos objetos. Após a
extração e quantificação dos atributos, utiliza-se o reconhecimento de padrões para
distinção entre padrões normais e anormais. Esta área do conhecimento abrange
técnicas de distribuições de probabilidade de classe, técnicas de análise de
discriminante, métodos estatísticos e redes neurais (RODRIGO, IÁLIS, & FÁTIMA,
2011).
Portanto, o desenvolvimento de uma ferramenta CAD depende do conjunto de
atributos de imagens adotado. Se o CAD tratar de extração de valores a partir de
atributos de imagens será necessário aplicar as fórmulas matemáticas referentes ao
atributo para sua implementação; Se o CAD tratar de decisão a partir de valores
extraídos dos atributos de imagem será necessário conhecer os atributos de imagens.
Os Apêndices A e B contêm os atributos de imagens com seus respectivos valores
utilizados por este trabalho durante o processo de simulação de diagnóstico.
56
Os itens a seguir descrevem os principais atributos de imagem utilizados.
2.2.3
Atributos de imagens digitais
Com a digitalização, as mamografias passam a ser representadas pela função I(x,
y) intensidade da imagem. Tal função é um mapeamento de pixels, cujos valores são
explicitados, conhecendo-se as posições x e y. Na digitalização de mamografias são
especificados alguns parâmetros: (ESPÍRITO-SANTO, 2004)

A resolução da imagem digital em pixel. Exemplo: 640x480, 1024x1024,
2000x2000, 4000x4000, etc.

A quantização dos pixels, isto é, a quantidade de bytes associada a um pixel, o
que corresponde aos níveis de cinza que podem ser exibidos por um pixel.
Valores típicos de quantização são: 1 byte (256 níveis) e 2 bytes (65536), etc.
A partir de mamografias digitalizadas é possível a segmentação computadorizada
destas objetivando identificar massa, nódulos, calcificações, etc. A segmentação de
imagens consiste na aplicação de detectores de transição de bordas, filtros
adaptativos e redutores morfológicos. Após a segmentação, realizam-se os seguintes
procedimentos: (ESPÍRITO-SANTO, 2004)

Determinam-se fatores morfológicos (compactação - C, descrição de Fourier f concavidade Fracionária – Fcc e Índice de forma espiculada-SI), empregandose o algoritmo de crescimento de regiões com muli-tolerância (RANGAYYAN,
SHEN, & DESAUTELS, 1993); (ESPÍRITO-SANTO, 2004).

Calculam-se as informações de texturas (correlação-F1, energia-F2, entropiaF3, inverso da diferença do momento-F4, soma das entropias-F5, por exemplo)
(MUDIGONDA,2000); (ESPÍRITO-SANTO, 2004).
57

Determinam-se os valores dos parâmetros fundamentados no cálculo do
gradiente na fronteira da
massa
(acutance-Ac)
(RANGAYYAN,1997);
(ESPÍRITO-SANTO, 2004).
A detecção computadorizada de massas benignas, tumores malignos e
calcificações (malignas e benignas) em mamografias não é feita simplesmente
empregando-se Redes Neurais especializadas em reconhecer padrões. No
reconhecimento de padrões existentes em imagens digitalizadas (por exemplo,
mamografias), feito por redes neurais, formas são identificadas a partir da detecção
de bordas do padrão (segmentação de imagens), ou seja, localização da fronteira
entre o fundo da imagem (background) e a forma do padrão. Nesta abordagem de
reconhecimento, quanto mais definida for à fronteira entre o padrão e o background
da imagem, melhor é, na imagem, a individualização (detecção) da borda;
(HAYKIN,1999); (ESPÍRITO-SANTO, 2004). Em mamografias, a maioria das massas
benignas, bem como as calcificações benignas, tem aspecto bem definido e possui
fronteira (bordas) com elevado grau de nitidez. As formas das calcificações benignas
podem ser circular e oval (FIGURA 6). Os contornos das massas benignas, além das
formas circular e oval, podem também apresentar a forma macrolobular, como visto
na FIGURA 10. É nítida a transição da margem (borda) da parte interna do tecido
denso da massa para a parte externa, que é menos densa. Massas e calcificações
malignas, contudo, aparentam contrastes nebulosos e fronteira pouco nítida. Os
contornos das calcificações malignas apresentam forma lobular (FIGURA 6), e os
tumores malignos possuem formas microlobular (microlobulated) ou espiculada,
(FIGURA 10). Nos tumores malignos, a transição do tecido interno (mais denso) para
a parte externa não é bem definida ou nítida (HILLARY, RANGAYYAN, &
DESAUTELS, 2003) (ESPÍRITO-SANTO, 2004). Entretanto, certas massas benignas
tais como fibroadenomas podem apresentar bordas não muito destacadas na
mamografia a convexidade e concavidade da forma das massas; observa-se que a
maioria das massas benignas apresenta formas convexas. Poucas são côncavas ou
espiculadas. Contudo, tumores malignos podem apresentar formas com segmentos
tanto côncavos quanto convexos além da forma tentacular predominante
(RANGAYYAN, MUDIGONDA, & DESAUTELS, 2000) (ESPÍRITO-SANTO, 2004).
Além disso, massas benignas, comparadas com tumores malignos são mais
58
homogêneas em termos de densidade de distribuição.
Figura 10: Exemplos de formas dos contornos das massa benignas: (a) e (b).Exemplos de formas dos
contornos de tumores malignos: (c) e (d) (HILLARY, RANGAYYAN, & DESAUTELS, 2003) (ESPÍRITOSANTO, 2004).
Diante destes fatos, se uma Rede Neural fosse treinada para reconhecer
padrões de massas e calcificações malignas e benignas, ela seria, dependendo da
implementação da rede, eficiente no reconhecimento das massas benignas, mas com
pouca eficiência na detecção de tumores malignos, podendo ainda não perceber (na
mamografia) ocorrências como fibroadenomas. Portanto, as Redes Neurais treinadas
somente para reconhecer padrões não são ferramentas recomendáveis para o apoio
ao diagnóstico de câncer, pois elas são deficientes no que mais interessa aos
radiologistas, ou seja, identificar a presença do câncer (ESPÍRITO-SANTO, 2004).
Já que o simples reconhecimento de padrões tem pouca ou nenhuma aplicação em
mamografia, os fatores de formas, a detecção da nitidez da borda da massa e as
medidas de texturas são a resposta CAD para a extração de atributos diagnosticáveis
de mamografias (ESPÍRITO-SANTO, 2004).
2.2.3.1 Fatores de forma que descrevem as calcificações
Este
item
mostra
alguns
exemplos
de
mamografias
e
descreve
matematicamente os fatores de forma empregados na descrição das calcificações.
59
A figura 11 mostra uma mamografia original e a obtida após a segmentação, contraste
e identificação de atributos (ESPÍRITO-SANTO, 2004).
Figura 11: a) Uma mamografia típica; b) segmentação; c) densidade FD (x,y); d) a f) contrastes
(FC(x,y)), FKC(x,y) e FE(x,y)); g) e h) estruturas detectadas (ESPÍRITO-SANTO, 2004).
60
As Figuras 12 e 13 mostram um conjunto de imagens mamografias que exibem
calcificações malignas e benignas (ESPÍRITO-SANTO, 2004).
Figura 12: Na esquerda, uma mamografia exibindo calcificações malignas. Na direita, contornos nas
calcificações feitos pelo Radiologista (SHEN, RANGAYYAN, & DESAUTELS, 1993) (ESPÍRITOSANTO, 2004)
Figura 13: Na esquerda, uma mamografia exibindo calcificações benignas. Na direita, contornos nas
calcificações feitos pelo Radiologista (SHEN, RANGAYYAN, & DESAUTELS, 1993) (ESPÍRITOSANTO, 2004)
61
2.2.3.2 Fatores de forma usados na representação de calcificações
Os parâmetros que descrevem as calcificações identificadas em uma
mamografia são (RANGAYYAN, SHEN, & DESAUTELS, 1993) (ESPÍRITO-SANTO,
2004):
1. Momento (m):
1
1


4
2
1 1  N
1  N
4
2 
m
.
(
z

m
)

(
z

m
)
 i
 i
1
1

 
m1  N 
N 
 i 1

 i 1
 


(1)
Em que zi, para i = 1, 2.., N, é a distância entre o contorno de um
conjunto ordenado de pixel e o seu centróide e m1 é o valor médio
de zi.
2. Descrição de Fourier (f):
N
2
NFD( k )
k

f 1
k 
N
1
2
N
2

(2)
NFD( k )
N
k 
1
2
Em que,
0; k  0

NFD(k )   A(k ) / A(1); k  1,2,...N / 2  1
 A(k  N ) / A(1); k  1,2,...  N / 2  1

1
A(n) 
N
N 1
ze
i 0
i
 j 2 n
i
N
; n  0,1,..., N  1
62
3. Fator de compactação (C):
p2
C 
A
C  1
ou
4A
p2
(3)
Em que p é o perímetro e A é a área da região contornada.
2.2.3.3 Fatores de forma usados na caracterização de massas mamográficas
A figura 14 mostra uma imagem de um tumor original e a identificação do tumor
feita manualmente na mamografia, por um radiologista (ESPÍRITO-SANTO, 2004).
Figura 14: Na esquerda, uma mamografia exibindo um tumor maligno (espiculado). Na direita, tumor
identificado pelo Radiologista (contorno) (GULIATO, 1996).
Na representação da forma das massas (tumores) existentes em uma
mamografia podem ser empregados, entre outros, a descrição de Fourier e os
seguintes parâmetros (BRUCE & ADHAMI, 1999); (ESPÍRITO-SANTO, 2004):
63
4. Distância radial (d):
d (i ) 
( x(i )  xo ) 2  ( y (i )  yo ) 2
(4)
5. Fator de compactação (C):
C 
p2
A
(5)
6. Desvio padrão da distância radial ():
 
1 N
1 N
2
 ( d (i )  d m ) , em que d m 
 d (i )
N i 1
N i 1
(6)
7. Índice de rugosidade da fronteira do tumor (R):
N
L j
L L
R ( j )   d (i )  d (i  j ) , em que R 
 R( j )
i j
, em que
N j 1
(7)
Em que R(j) é o índice de rugosidade do j-ésimo segmento do
contorno do tumor.
L = número de pontos da fronteira do segmento
N = número de pontos da fronteira toda
64
8. Índice de forma espiculada (SI):
N
SI 
 (1 
i 1
cos i ) S i
(8)
N
S
i 1
i
Em que Si é o comprimento dos segmentos do contorno do tumor
e  é o ângulo entre os segmentos.
2.2.3.4 Informações de texturas usadas na caracterização de massas e
tumores
As complexidades das texturas de massas mamográficas benignas e tumores
malignos podem ser descritos a partir dos seguintes parâmetros (RANGAYYAN,
MUDIGONDA, & DESAUTELS, 2000); (ESPÍRITO-SANTO, 2004).
9. Entropia:
Medida da falta de uniformidade ou na imagem ou na região de interesse
(ROI) ou no aglomerado de pixels.
Entropia 
N
N

i 1 j 1
(
P (i, j )
P (i, j )
) log(
)
R
R
(9)
Onde, P(i, j) é a distribuição de probabilidade de ocorrência
de um par de níveis de cinza (i, j), separados por uma
distância d, e R é o total de pares de pixels na região de
interesse ou no aglomerado de pixels.
10. Segundo momento:
Medida de homogeneidade:
65
N
N
Segundo Momento   (
i 1 j 1
P (i, j ) 2
) ,
R
(10)
11. Diferença de momento:
Medida de contraste:
N 1
Diferença
de
Momento   n 2
n 0
P (i, j )
) ,
R
(11)
P(i, j )
, i  j,
R.(1  j ) 2
(12)

i  j n
(
12. Inverso da diferença do momento:
Medida da homogeneidade local:
N
N
Inverso da diferença do momento  
i 1 j 1
13. Correlação: medida da dependência linear do brilho:
N
N
Correlação  
i 1 j 1
[ijP (i, j ) / R]   x  y
 x y
,
(13)
em que
 e  são, respectivamente, a média e o desvio padrão na
direção x (y).
66
2.2.3.5 Informações fundamentadas no gradiente, usadas na descrição de
massas e tumores
As massas mamográficas e os tumores podem também ser descritos a partir
de parâmetros que dependem do cálculo do gradiente. Um destes parâmetros é a
acutance: medida da variação dos níveis de cinza através da massa ou na fronteira
da ROI (RANGAYYAN,1997); (ESPÍRITO-SANTO, 2004).
14. Ac (acutance)
Ac 
1
1
N
d max
N 1

d
j 0
2
( j)
,
nj
(14)
Em que
d ( j) 
nj

i 1
f (i )  b(i )
2i
d(i) é a soma das diferenças entre pixels ao longo da normal
interna (f(i)) e externa (b(i)) à ROI. O parâmetro nj é o número
de par de pixels ao longo da normal usada para calcular a
diferença ente os j-ésimos pixels da fronteira da massa ou da
ROI. nj está sujeito a um valor máximo cuja especificação
depende
da
concavidade
da
forma
da
(RANGAYYAN,1997); (ESPÍRITO-SANTO, 2004) .
massa
67
2.3 Lógica Paraconsistente
Os precursores da Lógica Paraconsistente foram o lógico polonês J. Lukasiewicz
e o filósofo russo N.A. Vasilév. Simultaneamente, por volta de 1910, embora de
maneira independente, eles ventilaram a possibilidade de uma Lógica Paraconsistente
que restringiria o princípio da contradição, quando formulado da seguinte forma: dadas
duas proposições contraditórias, isto é, uma das quais é a negação da outra, então
uma das proposições é falsa. Vasilév chegou mesmo a articular determinada Lógica
Paraconsistente, que ele batizou de imaginária, modificando a silogística aristotélica.
Nenhum deles tinha, na época, uma visão ampla da Lógica Clássica, tal como hoje a
encaramos; eles a tratavam mais ou menos do prisma de Aristóteles, de conformidade
com as tendências então dominantes na época (ABE, 2011).
O primeiro lógico a estruturar um cálculo proposicional paraconsistente foi o
polonês S. Jaskowski, discípulo de Lukasiewicz. Em 1948 ele publicou suas idéias
sobre lógica e contradição, mostrando como se poderia construir um cálculo
sentencial paraconsistente, possuindo motivação conveniente. O sistema de
Jaskowski, nomeado por ele de lógica discursiva, desenvolveu-se posteriormente (a
partir de 1968) em virtude das obras de autores como J. Kotas, L. Furmanowski, L.
Dubikajtis, N.C.A. da Costa e C. Pinter. Assim, chegou-se a edificar uma verdadeira
lógica discursiva, englobando um cálculo de predicados de primeira ordem e uma
lógica de ordem superior (há, inclusive, teorias discursivas de conjuntos,
intrinsecamente ligadas à teoria de atributos, baseada no cálculo S5 de Lewis).
Também, independentemente dos trabalhos apresentados em Da Costa em 1954, o
lógico D. Nelson sugeriu em 1959 uma lógica paraconsistente como uma versão de
seu sistema conhecido como lógicas construtivas com negação forte (ABE, 2011).
68
2.4 Lógica Paraconsistente Anotada Evidencial E
A Lógica Paraconsistente Anotada Evidencial E possui uma linguagem E e as
proposições atômicas são do tipo p(, ) onde p é uma proposição e ,   [0, 1]
(intervalo real unitário fechado). Intuitivamente,  indica o grau de evidência favorável
de p e  o grau de evidência desfavorável de p. A leitura dos valores ,  depende das
aplicações consideradas e podem sofrer mudanças: com efeito  pode ser o grau de
evidência favorável e  poder ser o grau de evidência desfavorável expressa pela
proposição p; também,  pode indicar a probabilidade expressa por p de ocorrer e  a
improbabilidade expressa por p de ocorrer. Uma proposição atômica p(, ) da lógica
E pode intuitivamente ser lida como: creio em p com o grau de evidência favorável
de p () e o grau de evidência desfavorável de p () (ABE, 2011).
Desse modo, têm-se algumas leituras interessantes:
 p(1.0,0.0) pode ser lida como uma proposição verdadeira (evidência
favorável total e evidência desfavorável nula).
 p(0.0,1.0) pode ser lida como uma proposição falsa (evidência favorável
nula e evidência desfavorável total).
 p(1.0,1.0) pode ser lida como uma proposição inconsistente (evidência
favorável total e evidência desfavorável total).
 p(0.0,0.0) pode ser lida como uma proposição paracompleta (evidência
favorável nula e evidência desfavorável nula).
 p(0.5,0.5) pode ser lida como uma proposição indefinida (evidência
favorável igual à evidência desfavorável de 0.5).
O conceito de paracompleteza é o dual da de inconsistência (ABE, 2011).
69
Exemplo: (LOPES, 2009)
Seja a proposição p  “O paciente está com câncer de mama”:
 p(1.0,0.0) pode ser lida como: O paciente está com câncer de mama com
evidência favorável total e evidência desfavorável nula. Intuitivamente,
trata-se de uma proposição verdadeira.
 p(0.0,1.0) pode ser lida como: O paciente está com câncer de mama com
evidência favorável nula e evidência desfavorável total. Intuitivamente,
trata-se de uma proposição falsa.
 p(1.0,1.0) pode ser lida como: O paciente está com câncer de mama com
evidência favorável total e evidência desfavorável total. Intuitivamente,
trata-se de uma proposição contraditória.
 p(0.0,0.0) pode ser lida como: O paciente está com câncer de mama com
evidência favorável nula e evidência desfavorável nula. Intuitivamente,
trata-se de uma proposição paracompleta.
 p(0.5,0.5) pode ser lida como: O paciente está com câncer de mama com
evidência favorável igual à evidência desfavorável de 0.5. Intuitivamente,
temos aí uma indefinição.
2.4.1 Conectivo da Negação
Uma propriedade interessante que a lógica E apresenta é conceito de negar
uma proposição. Por exemplo, a proposição p(1.0, 0.0) do Exemplo 1, “O paciente está
com câncer de mama com evidência favorável total e evidência desfavorável nula”.
Na análise de sua negação o leitor imediatamente percebe que, em termo da lógica
E, é equivalente a dizer “O paciente está com câncer de mama com evidência
favorável nula e evidência desfavorável total”, ou seja, a negação da proposição p(1.0,
70
0.0) pode
ser expressa por meio de uma operação na constante de anotação associada.
Em termos técnicos, tem-se que p(1.0, 0.0)  p(1.0, 0.0)  p(0.0, 1.0). Se p denotar a
proposição “Pedrinho está acometido de pneumonia com 80% de evidência favorável
e 40% de evidência desfavorável”, qual é a negação de p(0.8, 0.4)? Prosseguindo com o
exemplo anterior, é fácil perceber que sua negação equivale a dizer a proposição
“Pedrinho está acometido de pneumonia com 40% de evidência favorável e 80% de
evidência desfavorável”, ou seja, a evidência favorável de p(0.8,
0.4)
passa a ser a
evidência desfavorável de p(0.8, 0.4) e a evidência desfavorável de p(0.8, 0.4) passa a ser
a evidência favorável de p(0.8, 0.4). Em termos técnicos, tem-se que p(0.8, 0.4)  p(0.8,
0.4)
 p(0.4, 0.8).
Generalizando-se através dos exemplos acima, é fácil perceber também que
p(, ) equivale a p(, ), que, por sua vez, equivale a p(, ). A negação de p(, ) é a
mesma proposição p com graus de evidência invertidos; o grau de evidência favorável
de p(, ) é a evidência desfavorável de p(, ) e o grau de evidência desfavorável de
p(,
)
constitui o grau de evidência favorável de p(, ). Há um operador natural
definido sobre  que desempenha o papel da negação do conectivo da lógica anotada:
:   , (, ) = (, ). Isso denuncia uma importante propriedade na lógica
E: podem ser consideradas equivalentes as proposições p(, ) e p(, ), ou seja, em
outra terminologia, p(, )  p(, ).
Qual é a negação de p(0.5, 0.5)? Intuitivamente é a própria proposição p(0.5, 0.5), ou
seja, p(0.5,
0.5)
 p(0.5,
0.5).
Agora supuser que p(0.5,
0.5)
seja verdadeira, tem-se a
situação: p(0.5, 0.5) verdadeira e p(0.5, 0.5) também verdadeira. Ora, a lógica em questão
admite intuitivamente contradições verdadeiras. Coisa semelhante acontece se p (0.5,
0.5)
for falsa. Há p(0.5,
0.5)
falsa e p(0.5,
0.5)
também falsa, ou seja, E é também
paracompleta. Daí, E é não-alética. De modo geral, tem-se p(, )  p(, ). O fato de
a negação lógica ser “absorvida” na anotação, faz com que a lógica E tenha
propriedades de fundamental importância na hora de implementações físicas, bem
como propriedades de extrema fecundidade em programação e em implementações
físicas (ABE, 2011).
71
2.4.2 Conectivos da Conjunção, Disjunção e Implicação
Dadas às proposições p(, ) e q(, ) podemos formar a conjunção, disjunção e
a implicação entre elas:
p(, )  q(, ) – leia-se a conjunção de p(, ) e q(, )
p(, )  q(, ) – leia-se a disjunção de p(, ) e q(, )
p(, )  q(, ) – leia-se a implicação de q(, ) por p(, )
O conectivo da bi-implicação introduz-se de modo habitual:
p(, )  q(, ) = p(, )  q(, )  q(, )  p(, ) – leia-se p(, ) equivale a q(, )
2.4.3 Reticulado 
Terminologias específicas. O par (, ) denomina-se constante de anotação.
Tal par é um elemento de [0,1] X 0,1] que é indicado por [0,1]. Mune-se esse conjunto
de uma relação de ordem assim definida (ABE, 2011):
(1, 1)  (2, 2)  1  2 e 2  1.
Propriedades:
1. ,   , (, )  (, ) (reflexividade)
2. 1, 1, 2, 2  , (1, 1)  (2, 2) e (2, 2)  (1, 1), implicam (1, 1) = (2,
2) (antissimetria).
3. 1, 1, 2, 2, 3, 3 , (1, 1)  (2, 2) e (2, 2)  (3, 3),
implicam (1,
1)  (3, 3) (transitividade)
4. 1, 1, 2, 2  , existe o supremo de {(1, 1), (2, 2)} indicado por (1, 1) 
(2, 2) = (Máx{1, 2}, Mín{1, 2})
72
5. 1, 1, 2, 2  , existe o ínfimo de {(1, 1), (2, 2)} indicado por (1, 1) 
(2, 2) = (Mín{1, 2}, Máx{1, 2})
6. ,   , (0, 1) ≤ (, )  (1, 0)
O quadrado unitário [0,1] X [0,1] com a relação de ordem constitui um reticulado
que é simbolizado por <, > ou simplesmente por  (ABE, 2011).
2.4.4 Graus de Certeza e de Incerteza
Para se obter melhor representação é comum utilizar um reticulado que em
cada vértice aloca-se um símbolo e, por sua vez, pode ser considerado como estado
lógico. Esse mesmo estado lógico é identificado por meio de dois valores de anotação
representados pelo par (, ) onde  indica Grau de Evidência Favorável e  Grau
de Evidência Desfavorável em relação à proposição, como demonstrado nas Figuras
15 e 16.
Figura 15: Representação do reticulado  das anotações pelo diagrama de Hasse (ABE, 2008).
73
Figura 16: Reticulado com graus de certeza e incerteza (ABE, 2011).
No reticulado  notam-se quatro pontos que nortearão as perquirições neste
trabalho. Denominam-se pontos cardeais. Tais são elas:
A  (1.0, 0.0)  estado verdadeiro
B  (0.0, 1.0)  estado falso
C  (1.0, 1.0)  estado inconsistente
D  (0.0, 0.0)  estado paracompleto
Embasados nos pontos cardeais, e pelo uso das propriedades dos números
reais, cuidadosamente constrói-se uma estrutura matemática com o fito de
materializar as ideias de como se quer manipular mecanicamente o conceito de
incerteza, contradição e de paracompleteza, entre outros. Tal mecanismo englobará,
os estados de verdadeiro e falso tratados dentro do escopo da lógica clássica, com
todas as suas consequências (ABE, 2011).
74
Para tanto, iremos introduzir diversos conceitos que julgados “intuitivos” para a
finalidade acima esboçada.
Segmento perfeitamente definido AB:
 +  -1 = 0; 0  ,   1
Segmento perfeitamente indefinido DC:
 -  = 0; 0  ,   1
As constantes de anotação (,) que incidem no segmento perfeitamente
indefinido, possuem a relação  -  = 0, ou seja,  = . A evidência favorável é idêntica
à evidência desfavorável, mostrando que a proposição p(,) expressa uma indefinição.
Ela varia continuamente desde a inconsistência (1,1) até o paracompleto (0,0).
Já as constantes de anotação (, ), que incidem no segmento perfeitamente
definido possuem a relação  +  -1 = 0, ou seja  = 1 - , ou ainda  = 1 - . Logo no
primeiro caso, a evidência favorável é o complemento booleano da evidência
desfavorável e, no segundo, a evidência desfavorável é o complemento booleano da
evidência favorável, mostrando que as evidências, favorável e desfavorável
‘comportam-se’ como no caso clássico. Elas variam continuamente desde a falsidade
(0,1) até a veracidade (1,0) (ABE, 2011).
Introduziu-se o conceito de grau a partir das aplicações:
Gic:[0, 1][0, 1]  [0, 1], Gpa:[0, 1][0, 1]  [-1, 0], Gve:[0, 1][0, 1]  [0, 1],
Gfa:[0, 1][0, 1]  [-1, 0]
definidas por:
Grau de Inconsistência:
Gic(,) =  +  -1, desde que  +  -1  0
Grau de Paracompleteza:
Gpa(,) =  +  -1, desde que  +  -1  0
Grau de Veracidade:
Gve(,) =  - , desde que  -   0
Grau de Falsidade:
Gfa(,) =  - , desde que  -   0
Vê-se que o Grau de Inconsistente “mede” o quão uma anotação (,) “distancia”
do segmento perfeitamente indefinido e quão se “aproxima” do estado “inconsistente”
e o Grau de Paracompleteza “mede” o quão uma anotação (,) “distancia” do
segmento perfeitamente indefinido e quão se “aproxima” do estado paracompleto.
75
Chama-se Grau de Incerteza Gin(,) de uma anotação (,) a qualquer um dos
graus de inconsistência ou
de paracompleteza. Por exemplo, o grau de Incerteza é máximo no estado
inconsistente, ou seja, Gic (1,1) = 1.
Chama-se Grau de Certeza Gce(,) de uma anotação (,) a qualquer um dos
graus de verdade ou de falsidade. Por exemplo, o grau de verdade da anotação (½,
¼) é ¼, ou seja, Gve (½,¼) = ½ – ¼= ¼.
2.4.5 Estados de Decisão: Extremos e Não-extremos
Segundo os conceitos do item 2.4.4, pode-se trabalhar com “faixas” de verdade,
ao invés de a “verdade” ser um conceito ‘hirto’, ‘inflexível’. Talvez melhor dizer que a
verdade é uma faixa de certeza com respeito a certa proposição. Para determinarem
tais faixas, são introduzidos os seguintes conceitos:
Quatro valores limites extremos:
Vcve
= C1 = Valor de controle de veracidade;
½  Vcve  1
Vcfa
= C2 = Valor de controle de falsidade;
-1  Vcfa  -½
Vcic
= C3 = Valor de controle de inconsistência;
½  Vcic  1
Vcpa
= C4 = Valor de controle de paracompleteza;
-1  Vcpa  -½
Tais valores nortearão uma proposição considerada, por exemplo, “verdadeira”
para a tomada de decisão positivamente, e assim por diante. As Figuras 17 e 18
ajudarão a introduzir conceitos suplementares.
76
Figura 17: Estados extremos e não-extremos (ABE, 2011).
Figura 18: Diagrama com os graus de incerteza e de certeza, com valores ajustáveis de controle limite
indicados nos eixos. Observem-se também as regiões consideradas (ABE, 2011).
77
Tabela 1: Apresenta os estados lógicos extremos e símbolos com os respectivos valores de Graus de
Evidência Favorável e Desfavorável (ABE, 2011).
Estados Extremos
Símbolo
Graus de Evidência ()
Verdadeiro
V
(1,0)
Falso
F
(0,1)
Inconsistente
T
(1,1)
Paracompleto

(0,0)
Os Graus de Evidência Favorável e de Evidência Desfavorável são utilizados
como informações de entrada do sistema de Análise Paraconsistente e, como
resultado de saída, obtêm os estados lógicos representados nos vértices do
reticulado, demonstrado na Figura 19.
Figura 19: Sistema básico de Análise Paraconsistente (ABE, 2008).
Nos sistemas de Análise Paraconsistente, os Graus de Evidências Favorável e
Desfavorável podem ser concebidos como conhecimento. Ao passo que se obtêm
novas evidências, diminuem-se as contradições e há melhores condições de o
sistema chegar a uma conclusão mais acertada (ABE, 2008)
.
A análise paraconsistente dos Graus de Evidência é realizada por meio da
representação do reticulado em um QUPC (Quadrado Unitário no Plano
Cartesiano)(Figura 20), em que “[...] os valores do Grau de Evidência favorável ficam
78
expostos no eixo x, e os valores do Grau de Evidência desfavorável  ficam expostos
no eixo y” (ABE, 2008).
λ
B = (0,1)
C = (1,1)
D = (0,0)
A = (1,0)
Figura 20: Reticulado representado por um QUPC (ABE, 2008).

No QUPC é possível calcular o Grau de Incerteza (Gin) utilizando a seguinte
equação: Gin =  + λ - 1. Tal grau pode variar de -1 a +1, sendo que seu valor equivale
a distância do ponto de intersecção entre os Graus de Evidências Favorável e
Desfavorável à reta que liga o ponto A=(1,0) verdadeiro ao ponto B=(0,1) Falso.
O valor -1 que se dá no ponto D=(0,0) indica que há uma contradição máxima
negativa e o valor +1 que acontece no ponto C=(1,1) aponta para uma contradição
máxima positiva, ou seja, os valores de entradas são informações contraditórias.
Em sistemas de análise paraconsistente, quanto mais a intersecção entre os
Graus de Evidência estiver próxima do segmento de reta BA menor é a qualidade de
contraditoriedade no que diz respeito às informações de entrada.
Os valores dos Graus de Incerteza são incluídos verticalmente no reticulado
associado à Lógica Paraconsistente Anotada Evidencial Ecompondo o eixo
denominado de eixo dos Graus de Incerteza (FIGURA 18).
Por outro lado, também é possível calcular o Grau de Certeza (Gce) através da
equação: Gce =  - λ. Esse grau também pode variar de –1 a +1, e seu valor
79
corresponde à distância do ponto de intersecção entre os Graus de Evidência
à reta que liga o ponto D=(0,0), Paracompleto, ao ponto C=(1,1), Inconsistente.
Seguindo-se esse raciocínio, o valor –1, que acontece no ponto B=(0,1), indica
que há uma certeza máxima na negação da proposição e o valor +1, que acontece no
ponto A=(1,0), indica que há uma certeza máxima na afirmação da proposição.
Os valores dos Graus de Certeza são alocados horizontalmente no reticulado
associado à LPA, constituindo o eixo denominado eixo dos Graus de Certeza,
demonstrado pela figura 21 juntamente com o Grau de Incerteza:
Figura 21: Representação dos Graus de Certeza e de Incerteza (ABE, 2008).
De acordo com ABE (2008), dado que os valores dos Graus de Evidência
variam entre 0 e 1, é possível obter como saída os valores dos Graus de Incerteza e
de Certeza e identificar se há contradição, chegando-se a uma conclusão da seguinte
forma:

Caso exista um alto grau de contradição significa que ainda não existe
certeza quanto à decisão a ser tomada e é necessário buscar novas
evidências.

Existindo baixo grau de contradição e alto Grau de Certeza, pode-se
formular a conclusão.
80
Como explicado por ABE (2008), uma forma de determinar as ações que o
sistema vai tomar após a análise paraconsistente é discretizar o reticulado criando
regiões delimitadas internas equivalentes aos estados lógicos de saída.
Figura 22 : Divisão do QUPC em 12 regiões (ABE, 2008).
Na FIGURA 22, o reticulado está repartido em 12 regiões, correspondendo a
12 estados lógicos de saída, com os seus respectivos símbolos. O formato dessas
regiões podem ser variados através de ajuste de controles limites feitos
externamente, possibilitando a otimização do sistema de análise paraconsistente,
conforme a Tabela 2: Estados Lógicos Não-Extremos .
.
81
Tabela 2: Estados Lógicos Não-Extremos (ABE, 2011).
Estados Lógicos Não-Extremos
Quase-Verdadeiro tendendo ao Inconsistente
QVT
Quase-Verdadeiro tendendo ao Paracompleto
QV
Quase-Falso tendendo ao Inconsistente
QFT
Quase-Falso tendendo ao Paracompleto
QF
Quase-Inconsistente tendendo ao Verdadeiro
QTV
Quase-Inconsistente tendendo ao Falso
QTF
Quase-Paracompleto tendendo ao Verdadeiro
QV
Quase-Paracompleto tendendo ao Falso
QF
Caracterização dos estados:
Estado Verdadeiro:
Gin(, ) =  -  = Gve(, )  ½ e
½e
½
Estado Falso:
Gin(, ) =  -  = Gfa(, )  -½ e
½e
½
Estado Inconsistente:
Gce(, ) =  +  - 1 = Gct(, )  ½ e
½e
½
Estado Paracompleto:
Gce(, ) =  +  - 1 = Gpa(, )  -½ e
½e
½
Símbolo
82
Estado Quase-Verdadeiro tendendo ao Inconsistente:
Gin(, ) =  -  = Gve(, )  ½ e
½e
Gce(, ) =  +  - 1 = Gct(, )  0
Estado Quase-Verdadeiro tendendo ao Paracompleto:
Gin(, ) =  -  = Gve(, )  ½ e
½e
Gce(, ) =  +  - 1 = Gpa(, )  0
Estado Quase-Falso tendendo ao Inconsistente:
Gin(, ) =  -  = Gfa(, )  -½ e
½e
Gce(, ) =  +  - 1 = Gct(, )  0
Estado Quase-Falso tendendo ao Paracompleto:
Gin(, ) =  -  = Gfa(, )  -½ e
½e
Gce(, ) =  +  - 1 = Gct(, )  0
Estado Quase-Inconsistente tendendo ao Verdadeiro:
Gce(, ) =  +  - 1 = Gct(, )  ½ e
½e
Gin(, ) =  -  = Gve(, )  0
Estado Quase-Inconsistente Falso tendendo ao Falso:
Gce(, ) =  +  - 1 = Gct(, )  ½ e
½e
Gin(, ) =  -  = Gfa(, )  0
83
Estado Quase-Paracompleto tendendo ao Verdadeiro:
Gce(, ) =  +  - 1 = Gpa(, )  -½ e
½e
Gin(, ) =  -  = Gve(, )  0
Estado Quase-Paracompleto tendendo ao Falso:
Gin(, ) =  +  - 1 = Gpa(, )  -½ e
½e
Gce(, ) =  -  = Gfa(, )  0
Na discretização do reticulado somente um estado lógico estará ativo no final
de cada análise, isto é, o Sistema Paraconsistente pode formular conclusão e tomar
uma decisão baseado em uma palavra binária de 12 dígitos, sendo apto a trabalhar
em sistemas de controles híbridos. E é esse processo de discretização que facilita a
descrição de todo o reticulado, originando-se um algoritmo que foi denominado de
“Para-Analisador”, indicado na FIGURA 23.
Figura 23: Diagrama do Para-Analizador (ABE, 2008).
Com esse algoritmo, facilita-se a elaboração de circuitos eletrônicos de
controladores que funcionam conforme a Lógica Paraconsistente, bem como,
simuladores e controladores na forma de programação, utilizando qualquer linguagem
de computação.
84
Do ponto de vista conceitual, o algoritmo Para-Analisador efetua a tradução da análise
paraconsistente, utilizando o tratamento dos valores dos Graus de Evidência que
resultam nos valores dos Graus de Certeza e Incerteza. Além da saída analógica,
representando os Graus de Incerteza e de Certeza, o algoritmo traz uma palavra
binária de 12 dígitos em que um único dígito ativo representa o estado lógico
resultante da análise, conforme verifica-se os estados da Tabela 1 e da Tabela 2:
Estados Lógicos Não-Extremos .
.
A Lógica Paraconsistente Anotada Evidencial Ejuntamente com o Algoritmo
Para-Analisador podem ser utilizados em diversas áreas do conhecimento que
demandam tratamento de conhecimentos incertos, como agentes de decisão em
Redes de Inteligência Artificial, o que leva à abordagem das RNAP’s.
85
2.5 Redes Neurais Artificiais Paraconsistentes
2.5. 1 Introdução
As raízes de todo trabalho em redes neurais giram em torno de estudos
neurobiológicos. As pesquisas relacionadas à Inteligência Artificial buscam
incessantemente modelar o comportamento do cérebro humano, isto porque a
obtenção de um modelo matemático que determinasse o entendimento completo do
seu funcionamento daria condições para que todo o processamento de sinais
cerebrais pudessem ser reproduzidos por alguma máquina (ABE, 2008).
O sistema nervoso juntamente com o sistema endócrino proporciona muitas
das funções de controle do corpo. O sistema nervoso, de que o cérebro faz parte,
controla as reações rápidas do corpo, como uma contração muscular. Partes do corpo
que têm as funções controladas pelo sistema nervoso têm tempo de resposta
relativamente rápido. O sistema endócrino, por outro lado, controla muitas funções do
metabolismo do corpo e sua atuação é mais lenta. Existem dois tipos principais de
células no cérebro, os neurônios e a glia. É comum atribuir aos neurônios as principais
funções cerebrais já que as funções da glia ainda são uma incógnita.
2.5.2 Neurônio Biológico
O neurônio é célula especial formada por: dendritos, sinapses, corpo celular e
axônio (FIGURA 24) (BARRETO, 2008).
I. Dendritos
Ramificações correspondentes aos
informação (sinais elétricos, escala mV).
canais de
entrada de
86
II. Axônio
Canal de saída do neurônio, ou seja, caminho de propagação dos
impulsos nervosos em direção a outros neurônios ou músculos.
III. Sinapse
Pontos de contato entre neurônios onde há passagem de
neurotransmissores do axônio de um neurônio para os dendritos de
outro neurônio.
IV. Corpo celular
Local onde é realizado o balanço energético da célula nervosa
(soma das contribuições de energia).
Cabe aos neurônios a condução dos impulsos nervosos, ou seja, é uma célula
especializada em enviar e receber sinais através do corpo humano (BARRETO, 2008).
Figura 24: Neurônio Biológico (BARRETO, 2008)
O fluxo de informação ocorre sempre a partir dos dendritos, passando pelo
corpo celular e axônio, até o próximo neurônio (FIGURA 24). O axônio emite um
impulso elétrico (potencial de ação) apenas se o balanço energético realizado no
corpo celular for maior que certo limiar. Neste caso, diz-se que o neurônio disparou
ou está ativado (FIGURA 25) (BARRETO, 2008).
87
Figura 25: Sentido de propagação dos impulsos nervosos (BARRETO, 2008)
Figura 26: Balanço energético realizado no corpo celular (BARRETO, 2008).
A FIGURA 26 apresenta a reação cerebral ao um evento criado pelo corpo.
Uma pessoa pisa em um prego, gerando um estimulo que deve ser respondido pelo
cérebro. A informação é, então, codificada na frequência dos impulsos. A chegada
desses impulsos nos terminais do axônio provoca a liberação de transmissores na
88
fenda sináptica (FIGURA 27) e daí para outro neurônio, diretamente para o músculo
ou até para órgãos sensoriais (BARRETO, 2008).
Figura 27: Neurônio Biológico em funcionamento (BARRETO, 2008).
Foi baseado no estudo do comportamento do cérebro que McCulloch e Pitts
(McCulloch, 1943) foram os primeiros a desenvolver um modelo matemático para um
simples neurônio. Neste modelo, os neurônios são combinados de forma a produzir
qualquer saída que possa ser representada como uma combinação de funções
lógicas. O fluxo de informações através de um neurônio é modelado com o uso de
uma função degrau (“limiar”) como função de ativação, ou seja, se a entrada do
neurônio for maior que o “limiar” ele dispara. Este modelo têm sido vastamente
aplicado em diversos trabalhos na área de Redes Neurais Artificiais. O neurônio de
McCulloch e Pitts é conhecido como M-P (McCulloch-Pitts) (FIGURA 28) (BARRETO,
2008).
89
Figura 28: Neurônio Artificial M-P (McCulloch-Pitts) (BARRETO, 2008).
2.5.3 Modelo matemático de um neurônio
Na construção do neurônio M-P se está interessado em modelar aspectos
ligados ao processamento da informação em um neurônio biológico. Entende-se por
processamento da informação os caminhos e etapas pelas quais passam os
potenciais de ação que trafegam de (BARRETO, 2008):
i.
um neurônio a outro neurônio,
ii.
receptores sensoriais a um neurônio, ou
iii.
de um neurônio a um atuador (e.g. músculo).
Assim, devem-se desenvolver modelos matemáticos que representem os
dendritos (FIGURA 29), as sinapses (FIGURA 30), o corpo celular (FIGURA 31) e o
axônio (FIGURA 32) (BARRETO, 2008).
90
Figura 29: Representação dos dendritos, M-P (McCulloch-Pitts) (BARRETO, 2008).
Figura 30: Representação das sinapses, M-P (McCulloch-Pitts) (BARRETO, 2008).
91
Figura 31: Representação do corpo celular, M-P (McCulloch-Pitts) (BARRETO, 2008).
Figura 32 : Representação do corpo celular, M-P (McCulloch-Pitts) (BARRETO, 2008).
Fazendo uma análise geométrica do neurônio artificial temos FIGURA 33
92
Figura 33 : Análise Geométrica, M-P (McCulloch-Pitts) (BARRETO, 2008)
A Eq. (15) define um plano em (x1, x2, u).
u>0
u<0
Figura 34: Análise Geométrica (Eq. 1), M-P (McCulloch-Pitts) (BARRETO, 2008)
O tracejado (FIGURA 34) indica onde o plano está abaixo do plano (x1, x2).
Para fins de classificação basta trabalhar no plano (x1, x2).
Isto equivale a fazer u = 0 na equação do plano, ou seja:
u = w1x1 + w2x2 - θ = 0 (16)
93
Assim, a equação da reta no plano (x1, x2) é dada por:
x2 = -(w1/w2)x1 + θ/w2
(17)
A Eq. (17) define a seguinte reta em (x1,x2) (FIGURA 35)
Figura 35: Análise Geométrica (Eq. 2), M-P (McCulloch-Pitts) (BARRETO, 2008).
Assim, um neurônio pode ser usado para separar com eficiência duas classes
que estejam livremente separadas uma da outra (FIGURA 36).
Figura 36 : Análise Geométrica (separação de classes), M-P (McCulloch-Pitts) (BARRETO, 2008).
Após uma análise, a seguinte questão pode ser levantada: Como fazer com
que o neurônio M-P (Perceptron) determine de forma automática os valores dos pesos
e do limiar para um problema específico? Como aprender sozinho, do modo que
ocorre nos neurônios biológicos?
94
Para que o neurônio M-P seja capaz de aprender sozinho a resolver um
problema de classificação é necessário dotá-lo de uma regra de aprendizagem. Uma
regra de aprendizagem nada mais é do que uma equação que altera os valores dos
pesos e do limiar em função dos erros cometidos durante a execução da tarefa de
classificação.
O neurônio M-P:

é um modelo simplificado do neurônio real.

possui p variáveis de entrada: x1, x2,..., xp

possui p pesos sinápticos: w1, w2,..., wp

possui uma variável de ativação: θ

possui uma variável de ativação: u
u = w1x1 + w2x2 + .... + wpxp - θ

possui uma variável de saída: y
y = sinal(u) = +1 (se u > 0) ou -1 (se u ≤ 0)

O neurônio MP nada mais é do que uma chave ON/OFF.

As condições que definem a ativação (y=1) ou não (y=0 ou -1)
do neurônio depende dos valores dos pesos e do limiar.

Assim, pode ser utilizado em problemas de reconhecimento de
padrões que envolvam duas categorias (binários).
A Rede Percepton Simples, proposta por Frank Rosenblatt em 1958, é
considerada o primeiro algoritmo de redes neurais artificiais.
Perceptron Simples = Neurônio de MP + Regra de Aprendizagem
A regra de aprendizagem é o mecanismo que torna a rede Perceptron Simples
um dispositivo inteligente
95
2.5.4 Redes Neurais Artificiais
As teorias das redes neurais artificiais são paradigmas computacionais
baseados em modelos matemáticos que, a despeito das tradicionais computações,
possuem uma estrutura e operação que, grosso modo, tentam imitar o funcionamento
do neurônio biológico humano e, assim, simular de algum modo como o cérebro
humano funciona frente a determinadas situações (LOPES, 2009).
Tais redes também são conhecidas como sistemas conexionistas, sistemas
distribuídos ou sistemas adaptativos, pois são compostos por uma série de elementos
de processamento interconectados que operam em paralelo (LOPES, 2009).
As redes neurais artificiais clássicas carecem de controle centralizado em
sentido clássico, portanto, todos os elementos de processamento interconectados
mudam ou se adaptam simultaneamente com o fluxo de informação e regras
adaptativas (LOPES, 2009).
Um dos objetivos originais das redes neurais artificiais é entender e modelar as
características funcionais e propriedades computacionais do cérebro quando executa
processos cognitivos tais como percepção sensorial, categorização de conceitos,
associação de conceitos e aprendizado. Entretanto, um grande esforço está
direcionado nas aplicações que envolvem reconhecimento e classificação de padrões,
compressão de dados e otimização de processos (LOPES, 2009).
Uma rede neural artificial genérica pode ser definida como um sistema
computacional consistindo de um conjunto de elementos de processamento altamente
interconectados, denominados neurônios artificiais, o qual processa uma informação
como resposta a um estímulo externo. Um neurônio artificial é uma representação
simplificada que emula a integração de sinais e dispara no limiar comportamento dos
neurônios biológicos por meio de equações matemáticas (LOPES, 2009).
Como em sua contraparte biológica, neurônios artificiais são limitados
conjuntamente por conexões que determinam o fluxo de informações entre os
neurônios. Estímulos são transmitidos de um processamento a outro, via sinapses ou
interconexões, que podem ser excitatórios ou inibitivos. Se a entrada a um neurônio é
excitatória, é mais provável que este neurônio transmita um sinal excitatório aos outros
96
neurônios a ele conectados. Uma entrada inibitória provavelmente se propagará como
sinal inibitório (ABE, 2008).
Redes neurais artificiais dispõem-se tipicamente em camadas. Cada camada
constitui um arranjo de elementos processadores ou neurônios. Informações fluem
através de cada elemento da forma entrada-saída. Cada elemento recebe um sinal de
entrada, manipula-o e encaminha um sinal de saída a outros elementos conectados
na camada adjacente (FIGURA 37) (LOPES, 2009).
Figura 37: Esquema básico de Rede Neural Artificial clássica. Entradas: são sinais de entradas;
Pesos: balanceiam os dados de entrada de acordo com sua relevância; Neurônios intermediários:
realizam os cálculos do processamento; Neurônios de saída: preparam os dados processados para
a saída. Saídas: são os valores resultantes do processamento (LOPES, 2009).
As redes neurais artificiais possuem um comportamento diferenciado em
relação à programação convencional. Conseguem resolver problemas que não
possuem solução algorítmica ou a solução disponível é complexa para ser obtida.
São indicadas para enfrentar problemas que são caracterizados pela predição
e reconhecimento de padrões (ABE, 2008).
97
2.5.5 Redes Neurais Artificias Paraconsistentes
Relacionando a RNA com a Lógica Paraconsistente Anotada Evidencial E, “em
uma definição mais geral, uma RNAP (Rede Neural Artificial Paraconsistente) é uma
estrutura de características conexionista composta de uma extensa rede de
componentes fundamentados na Lógica Paraconsistente Anotada – LPA” (DA SILVA
FILHO & ABE, 1999).
Dessa forma:
Na análise paraconsistente, o objetivo principal é saber com que medida ou
com que Grau de Certeza Gce podemos afirmar que uma proposição é Falsa ou
Verdadeira. É considerado como resultado da análise apenas o valor do grau de
Certeza Gce. O valor do Grau de Incerteza Gin é um indicativo que informa a medida
da inconsistência. Se houver um baixo valor de certeza ou muita inconsistência o
resultado é uma indefinição (DA SILVA FILHO & ABE, 1999).
Para a finalidade de aplicações LPA2v em neurocomputação, vamos utilizar o
algoritmo para fazer análise paraconsistente sem discretizar o reticulado; portanto,
quando a análise resultar em valores fora dos limites estipulados pelos valores de
controle, a conclusão na saída é de uma indefinição (DA SILVA FILHO & ABE, 1999).
Com estas considerações vamos apresentar o algoritmo Para-analisador
simplificado (Figura 38):
Figura 38: Para-Analisador Simplificado (DA SILVA FILHO & ABE, 1999).
98
1. Valores limites de comparação:
Vcve
= C1 = Valor de controle de veracidade;
0  Vcve  1
Vcfa
= C2 = Valor de controle de falsidade;
-1  Vcfa  0
Vcic
= C3 = Valor de controle de inconsistência;
0  Vcic  1
Vcpa
= C4 = Valor de controle de paracompleteza; -1  Vcpa  0
2. Valores de entrada:
μ1
Grau de Evidência Favorável
μ2
Grau de Evidência Desfavorável
3. O grau de Certeza calculado:
Gce = μ1 – μ2
4. O grau de Incerteza calculado:
Gin = μ1 + μ2 - 1
5. Estados lógicos resultantes da saída:
Se Gce = C1 então S1 = V
Se Gce = C2 então S1 = F
Se Gin = C3 então S1 = T
Se Gin = C4 então S1 = 
Senão S1 = I = Indefinição
Gce = S2a
Gin = S2b
Este algoritmo simplificado facilita a elaboração da Célula Artificial
Paraconsistente Básica CAPb, fundamental para implementação das Redes Neurais
Artificiais Paraconsistentes RNAP’s (DA SILVA FILHO & ABE, 1999).
99
O algoritmo demonstra que, na obtenção de subsídios para tomada de decisão
na análise paraconsistente, são necessárias apenas duas equações como
ferramentas principais. O processamento de sinais com as duas equações permite
saber com que medida ou Grau de Certeza podemos afirmar que uma proposição é
verdadeira (DA SILVA FILHO & ABE, 1999).
Como já foi dito:
É considerado como resultado da análise apenas o valor do grau de
Certeza Gce. O valor do grau de Incerteza Gin é um indicativo que informa
a medida da inconsistência. Se houver um baixo valor de certeza ou
muita inconsistência o resultado é uma indefinição.
Estas duas afirmações ficam claras quando verificamos no algoritmo ParaAnalisador
Simplificado
que
na
análise
paraconsistente,
ao
término
do
equacionamento das informações obtidas pelos valores dos Graus de Certeza e de
Incerteza Gce e Gin, se houver um baixo valor de certeza ou um alto grau de
contradição que, obviamente representa muita inconsistência, o resultado da análise
é uma indefinição (DA SILVA FILHO & ABE, 1999).
Toda a referência na análise paraconsistente é feita pela comparação entre os
valores limites ajustados externamente. São os valores limites que determinam se o
resultado é uma indefinição I, ou não (DA SILVA FILHO & ABE, 1999).
Uma análise mais sutil do processo que envolve as equações da Lógica
Paraconsistente Anotada leva à conclusão que os resultados, com o algoritmo ParaAnalisador no tratamento de sinais de informações, obtidos de situações reais que
podem chegar com incertezas, mostram forte semelhança com os modos de
processamento conhecidos no funcionamento do cérebro humano. A decisão tomada
a partir de informações adquiridas pelos sentidos é um processo mental biológico
próprio do ser humano (DA SILVA FILHO & ABE, 1999).
Com base nas funções análogas da análise paraconsistente e do cérebro, foi
criada uma Célula Artificial Paraconsistente básica CAPb (FIGURA 39) (DA SILVA
FILHO & ABE, 1999).
100
A primeira entrada da CAPb é o grau de evidência favorável (ou grau de crença
favorável, ou μ) à proposição analisada.
A segunda entrada da CAPb é o grau de evidência desfavorável (ou grau de
crença desfavorável, ou ).
A saída da CAPb é a resultante calculada (ou μr) pelos graus de certeza (Gce)
e de incerteza (Gin) com base nos valores de entrada (μ,).
Figura 39 : Célula Artificial Paraconsistente Básica (DA SILVA FILHO & ABE, 1999).
A CAPb é a Célula-Matter que originou a família de Células Neurais Artificiais
Paraconsistentes.
A partir dela foram criadas oito tipos de células todas funcionando com a
Equação Estrutural Básica (EEB) (FIGURA 40).
101
Figura 40: Família de Células Neurais Artificiais Paraconsistentes CNAP’s (DA SILVA FILHO & ABE,
1999).
A primeira característica da CAPb é a normalização das saídas. Define-se
então a saída μr somente em função das entradas, chegando-se ao resultado da
Equação Estrutural Básica (EEB).
Outra característica é a tolerância. Os fatores de tolerância servem para
simplificar o funcionamento da CAPb, pois não são em todos os níveis da RNAP que
102
se utiliza o reticulado completo. Em alguns níveis da RNAP são necessárias apenas
as respostas Verdadeira (V), Falsa (F) e Indefinida (I).
No caso de indefinição, é necessário informar se a indefinição existe por
insuficiência de informações, ou por alta incerteza. Define-se então:

Grau de Indefinição
Verifica-se pela EEB que, quando os graus de certeza e de incerteza
utilizados como entradas para a análise paraconsistente forem de
valores iguais, o grau de certeza resultante na saída μr será igual a 0.5.

Fator de Tolerância
Na análise paraconsistente, se entre os dois sinais de entrada houver
um alto grau de inconsistência representado por um alto valor do grau
de Incerteza (Gin), não se pode tirar nenhuma conclusão a respeito da
proposição analisada.
Na CAPb, todas as vezes que o Grau de Incerteza ultrapassar os valores limites
de incerteza previamente ajustados, conclui-se que o estado lógico resultante de
saída é Inconsistente ou Indeterminado, portanto, a saída terá como valor o grau de
certeza de indefinição que é igual a 0.5.
Para facilitar a implementação dos algoritmos que vão apresentar as CNAP’s
em Neurocomputação, vamos utilizar para fazer a comparação com o Grau de
Incerteza Gin,um valor único ao qual denominamos de fator de tolerância a incerteza
Ftinc.
Ftinc é um valor ajustado externamente e sua finalidade é determinar os limites
de contradição suportáveis entre os dois sinais aplicados nas entradas da célula.
Seguindo as propostas de uma RNAP o Ftinc deve ser ajustado entre valores contidos
no intervalo real fechado [0,1], portatno: 0 ≤ Ftinc ≤ 1. A partir do valor de Ftinc
estabelecido externamente são obtidos dois valores limites de incerteza.
103
Vcic = Valor de controle de Inconsistência
Vcpa = Valor de controle de Paracompleteza
Gin = μ1 + μ2 – 1
Vcic = (1 + Ftinc) / 2
Vcpa = (1 - Ftinc) / 2
Estes dois valores entrarão no algoritmo representativo da CNAP para a
comparação e elaboração da conclusão na saída da célula.
A decisão sobre o sinal de saída, representado pelo valor de Grau de Certeza
resultante μr relacionado à análise do valor de incerteza, è tomado à partir das
condições.
se ІGinІ < Vcpa e ІGinІ > Vcic então
μr
senão
(μ1 - μ2 + 1) / 2
μr
0.5
Na família de CNAP o fator de tolerância à incerteza é utilizado apenas na
Célula de Conexão Analítica (CNAPca).
Outro fator é o de tolerância à decisão (Ftd)

Valores limites de falsidade e verdade
VLf = (1 - Ftd ) / 2
e
VLv = (1 + Ftd) / 2
μr = (μ1 - μ2 + 1) / 2
104
se μr ≥ VLv então
S1
1
(Verdadeiro)
senão se μr ≤ VLf então
S1
senão S1
0
(Falso)
0.5
(Indefinido)
Considerações:
Ftd = 0
corresponde: VLv = 0.5 e
VLf = 0.5
Isto significa que para qualquer valor de Grau de Certeza resultante μr acima
de 0.5 a célula decide-se pela conclusão de estado lógico “verdadeiro”
e para
qualquer valor do Grau de Certeza abaixo de 0.5 a decisão é o estado lógico “falso”
Ftd = 1
corresponde: VLv = 1 e
VLf = 0
Isto significa que uma conclusão só será obtida se o Grau de Certeza resultante
μr, calculado pela EEB, estiver no seu valor máximo igual a 1, ou no seu valor mínimo
igual a 0.
Caso contrário, isto é, o resultado de μr não chegar a estes extremos, a célula
se acha incapacitada para emitir uma conclusão; ou seja a saída será 0.5 (Indefinição)
Os autores (DA SILVA FILHO & ABE, 1999) explicam que para chegar aos
sistemas neurais artificiais paraconsistentes de raciocínio lógico é necessário uma
série de concepções indicadas na FIGURA 41:
105
Figura 41: Desenvolvimento da Rede Neural Artificial Paraconsistente (DA SILVA FILHO & ABE,
1999).
O
ponto
de
partida
são
as
CNAP’s
(Células
Neurais
Artificiais
Paraconsistentes), quando conectadas, formam-se UNAP’s (Unidades Neurais
Artificiais Paraconsistentes) (PEREIRA, 2011).
106
A FIGURA 42 é uma demonstração do fluxograma com o bloco de análise
paraconsistente representativo de uma Célula Neural Artificial Paraconsistente básica
que apresenta características de análise da Lógica Paraconsistente Anotada
Evidencial E.
Figura 42: Fluxograma da Célula Artificial Paraconsistente Básica (DA SILVA FILHO & ABE, 1999)
107
2.5.6 Célula Neural Artificial Paraconsistente (CNAP)
A partir da CAPb abordada anteriormente, são estabelecidos os critérios e
fundamentos que possibilitam a implementação das CNAP’s, envolvendo alguns
conceitos básicos para a construção de algoritmos representativos de cada célula
componente da família de Células Neurais Artificiais Paraconsistentes (DA SILVA
FILHO & ABE, 1999) (PEREIRA, 2011).
Na família CNAP’s, todas as células estão alicerçadas em Lógica
Paraconsistente Anotada Evidencial E, mas cada uma possui uma função diferente
e é representada por um algoritmo que permite sua programação em linguagem de
programação, tendo-se as seguintes classificações de células segundo respectivas
funções (FIGURA 40) (DA SILVA FILHO & ABE, 1999) (PEREIRA, 2011):

Célula Neural Artificial Paraconsistente de Conexão analítica (CNAPCa): faz
a análise analógica dos sinais e conecta todas as células componentes da
rede.

Célula Neural Artificial Paraconsistente de Conexão lógica simples
(CNAPCIs): faz a análise lógica dos sinais utilizando conectivos lógico tais
como os de maximização e minimização.

Célula Neural Artificial Paraconsistente de Conexão lógica seletiva
(CNAPCIse): faz a análise lógica dos sinais utilizando conectivos lógicos,
tais como os de maximização e minimização, ao mesmo tempo que
seleciona qual das suas duas saídas deve ficar ativa, visto que possui duas
entradas e duas saídas distintas.

Célula Neural Artificial Paraconsistente de passagem (CNAPp): direciona o
fluxo de informações para determinada região da rede.

Célula Neural Artificial Paraconsistente de complementação (CNAPco): faz
a complementação do valor em relação à unidade para qualquer sinal
aplicado em sua entrada.

Célula Neural Artificial Paraconsistente de decisão (CNAPd): faz a análise
paraconsistente e determina uma decisão baseada nos resultados gerados
por tal análise, considerando que essa decisão é representada por um
estado lógico que pode ser Verdadeiro, Falso ou Indefinido.
108

Célula Neural Artificial Paraconsistente de aprendizagem (CNAPa): aprende
e desaprende padrões aplicados com frequência em sua entrada.

Célula Neural Artificial Paraconsistente de memorização (CNAPm): guarda
padrões aprendidos pela CNAPa em um processo de funcionamento de
aprendizagem/memorização.
Cada uma das CNAP’s viabiliza uma resposta funcional diferente e, quando
interligadas, constituem Unidades Neurais Artificiais Paraconsistentes UNAP’s com
funções mais específicas na rede.
2.5.7 Unidade Neural Artificial Paraconsistente (UNAP)
As UNAP’s são reunidas de modo a formar sistemas com funções
determinadas no processamento dos sinais (DA SILVA FILHO & ABE, 1999)
(PEREIRA, 2011):
O resultado deste processo é a obtenção de pequenos módulos ou ilhas de
tratamento de sinais que, de forma emergente, vão habilitar a construção de
Redes Neurais Artificiais Paraconsistentes com características de
funcionamento que são próprias do cérebro como, capacidade de
aprendizagem, desaprendizagem, plasticidade, robustez e tolerância a falhas
(DA SILVA FILHO & ABE, 1999) (PEREIRA, 2011).
Segundo os autores (DA SILVA FILHO & ABE, 1999), o tratamento de sinais
fundamentado
em
Lógica
Paraconsistente
Anotada
Evidencial
E
possui
procedimentos matemáticos simples e passíveis de aplicações práticas e diretas,
porque todos os componentes da RNAP são compostos por células. Assim, na
implementação da RNAP, as células são descritas por algoritmos que facilitam
implementações de projetos em linguagem convencional de programação:
[...] estes componentes são projetados para que elaborem as funções que
vão modelar comportamentos semelhantes aos apresentados pelo cérebro,
quando em suas atividades mentais. As várias conexões entre os
componentes vão dando forma a determinados blocos que, em conjunto,
fazem processamento de sinais com funções bem definidas e, por fim,
chegam a estrutura geral a qual denominamos de Rede Neural Artificial
Paraconsistente RNAP (DA SILVA FILHO & ABE, 1999) (PEREIRA, 2011).
109
Silva Filho e Abe (1999) apresentam dez configurações de UNAP's, mas
esclarecem que "[...] devido às diversidades de tipos das Células Neurais Artificiais
paraconsistentes e facilidades de conexões, outras Unidades com funções diferentes
das apresentadas podem ser facilmente implementadas" (DA SILVA FILHO & ABE,
1999).
Nesse sentido, "as diversas configurações das UNAP's vão formando blocos
com características de funcionamento próprias que denominamos de Sistemas
Neurais Artificiais Paraconsistentes" (DA SILVA FILHO & ABE, 1999).
2.5.8 Sistema Neural Artificial Paraconsistente (SNAP)
Os SNAP's correspondem a grupos de UNAP's interligadas para tratamento,
análise e direcionamento de sinais, sendo parte da RNAP. Os SNAP's podem ser
divididos em dois tipos: Sistema Neural Artificial Paraconsistente de aprendizado
condicionado (SNAPac) e Sistema Neural Artificial Paraconsistente de tratamento de
contradições (SNAPtc), dentre os quais interessa neste trabalho o primeiro.
No SNAPac "[...] As células são condicionadas a apresentarem certos padrões
na saída obtidos através de repetitividade de coincidências" (DA SILVA FILHO & ABE,
1999):
Quando um axônio de uma célula A está próximo o suficiente para excitar
uma célula B, e, repetitivamente ou persistentemente, toma parte no disparo
desta, algum processo de crescimento ou mudança metabólica acontece em
uma ou ambas as células, tal que a eficiência de A, como uma célula capaz
de disparar B, é aumentada (DA SILVA FILHO & ABE, 1999) (PEREIRA,
2011).
Viabiliza-se a elaboração de associações entre partes da rede, referentes a
proposições distintas, mas com alguma(s) semelhança(s) em suas informações que
podem ser significativas se for observado o processamento paralelo ou conexionista.
Isso porque as RNAP's correspondem à interligação entre vários SNAP's, permitindose o tratamento de sinais de maneira paralela e distribuída, o que deve ser observado
quando da elaboração da arquitetura da RNAP.
110
2.5.9 Arquitetura de RNAP
Na arquitetura de uma RNAP é necessário ter em vista que:
[...] algumas Unidades Neurais Artificiais Paraconsistentes UNAP's vão
funcionar como componentes periféricos, cujo procedimento é direcionar
sinais para controlar fluxo de dados no processamento.
Outras Unidades são interligadas compondo Sistemas Neurais Artificiais
Paraconsistentes SNAP's de processamento internos que vão manipular
dados fazendo análises, aprendendo, associando e memorizando padrões
(DA SILVA FILHO & ABE, 1999) (PEREIRA, 2011).
A arquitetura pode ser composta de três tipos de módulos (DA SILVA FILHO &
ABE, 1999), os quais são dispostos paralelamente:

Módulo de aprendizagem primária e memorização de padrões: tem as
funções de reconhecer, aprender e criar uma célula de memorização
para o padrão aprendido .

Módulo de direcionamento de sinais para efetuação da análise:
constituído por unidades neurais com o objetivo de comparar e
direcionar o fluxo de sinais em dada parte da rede.

Módulo de análise e aquisição de conhecimento: analisa os valores dos
sinais, bem como identificam similaridades nos padrões adquirindo-se,
dessa forma, conhecimento.
Tais módulos podem ser conectados por um sistema de raciocínio lógico
paraconsistente, que tratam dos processos de inferências. No entanto, não há
aprofundamento desse tipo de sistema no presente trabalho porque o tipo aqui
utilizado é de aprendizado supervisionado.
111
2.6 Medidas de Qualidade no Diagnóstico
2.6. 1 Os dados: o que deve ser coletado? O que deve ser calculado?
Há uma variedade de dados que podem ser coletados, refletindo a natureza e
a qualidade da prática de mamografia. Para decidir quais os dados mais essenciais,
deve-se considerar três principais questões que medem diretamente o desempenho
de um mamografista: (BASSETT, 2000)
I.
A prática atinge a meta primária de um programa efetivo de rastreamento?
Isto é, há uma grande porcentagem de cânceres sendo detectados na
população rastreada? Qual é a taxa de detecção e sensibilidade para o
câncer assintomático?
II.
Outros parâmetros importantes estão refletindo o sucesso equivalente do
rastreamento e do diagnóstico, demonstrado em outros programas de
rastreamento? Isto é, as taxas de requisição de avaliação adicional por
imagem encontra-se dentro de uma variação aceitável? Qual é a taxa de
reconvocação e qual é o valor preditivo positivo (VP+)?
III.
Uma grande porcentagem de cânceres com prognóstico favorável está
sendo encontrada? Isto é, a maioria dos cânceres mamograficamente
detectados são pequenos e confinados à mama? Quais são as
porcentagens encontradas de cânceres mínimos e nódulo-negativos?
O (Quadro 2) lista os dados essenciais brutos e deduzidos necessários para
responder as questões levantadas com exceção para sensibilidade.
112
Quadro 2: Auditória Mamográfica Essencial ou Básica; Dados Brutos e Deduzidos Minimante
Desejados (BASSETT, 2000).
A.
Dados Brutos
1.
Dados do período de auditoria e número total de exames neste período.
2.
Número de exames de rastreamento; número de exames de diagnóstico.
3.
Número de recomendações para avaliação posterior por imagem (reconvocação) (ACR BIRADS Categoria 0 = “Necessita Avaliação Posterior”).
4.
Número de indicações de biópsia ou consulta cirúrgica (ACR BI-RADS Categorias 4 e 5 =
“Achados Suspeitos” e “Altamente Sugestivo de Malignidade”).
5.
Resultados de biópsias: maligno ou benigno (guarde dados separados para casos de AAF ou
biópsia incisional).
6.
Estadiamento do tumor: tipo histológico (in situ [ductal] ou invasivo [ductal ou lobular]), grau,
dimensão e situação de linfonodos.
B.
Dados deduzidos (Calculados a partir dos dados brutos)
1.
Verdadeiros positivos
2.
Falsos positivos = três subdefinições: FP1, FP2, FP3
3.
Valor preditivo positivo
a. Em caso de serviço de rastreamento / diagnóstico
1.
Baseado em exame de rastreamento anormal (VP+1)
2.
Baseado em indicação para biópsia ou consulta cirúrgica (VP+2).
3.
Baseado em resultado de biópsia (VP+3 ou Taxa de Biópsia Positiva).
b. Em caso de serviço de rastreamento exclusivo, pode-se definir somente de uma
forma.
1.
Baseado em exame de rastreamento anormal (VP+1).
4.
Taxa de detecção de câncer para casos assintomáticos (rastreamento verdadeiro).
5.
Porcentagem de cânceres mínimos encontrados.
6.
Taxa de reconvocação.
Devem-se manter estatísticas de auditoria separadas para pacientes
assintomáticas e sintomáticas.
Câncer mínimo: invasivo ≤ 1 cm ou câncer ductal in situ
Os dados adicionais (Quadro 3) são postos como parte da lista mais completa
dos dados brutos, embora possam acrescentar tempo considerável e complexidade
113
ao processo de auditagem. Uma comparação interessante são as taxas de câncer
prevalente versus incidente (cânceres prevalentes são aqueles encontrados na
primeira mamografia; cânceres incidentes são aqueles detectados em mamografias
subsequentes), como valor preditivo de vários achados mamográficos e de
significância em vários fatores de risco (BASSETT, 2000).
Quadro 3: Auditória Mamográfica Mais Completa; Dados Brutos a Serem Coletados (BASSETT,
2000).
1.
Dados do período de auditoria e número total de exames neste período (usualmente período de 6 a
12 meses).
2.
Fatores de risco
a. Idade da paciente na época do exame
b. História de câncer de mama: pessoal ou familiar (especialmente câncer pré-menopausa em
parente de primeiro grau – mãe, irmã ou filha)
c. Terapia de reposição hormonal
d. Carcionoma lobular in situ ou atipia previamente comprovados por biópsia.
3.
Número e tipo de mamografias: rastreamento (assintomática) ou diagnóstica (sinais ou sintomas
mamários clínicos de possível anormalidade ou mamografia de rastreamento anormal)
4.
Primeiro exame ou estudo de acompanhamento (repetido).
5.
Interpretação e indicação mamográfica ( tentar concordar com o ACR Lexicon)
a.
Avaliação posterior por imagem (reconvocação) [ACR BI-RADS Categoria 0 = “Necessita
Avaliação Posterior”].
b.
Acompanhamento de rotina [ACR BI-RADS Categorias 1 e 2 = “Negativo” e “Achados
Benignos”).
c.
Acompanhamento precoce [ACR BI-RADS Categoria 3 = “Acompanhamento a Curto Prazo”.
d.
Biópsia ou consulta cirúrgica (ACR BI-RADS Categorias 4 e 5 = “Achados Suspeitos” e
“Altamente Sugestivo de Malignidade”)
6.
Resultados de biópsia: benigno ou maligno (manter dados separados para casos de AAF ou biópsia
incisional).
7.
Dados de câncer.
a.
Achados mamográficos: massas, calcificações, sinais indiretos de malignidade, não há
sinais mamográficos de malignidade
b.
Tumor palpável ou não-palpável
c.
Estadiamento do tumor (patológico): tipo histológico, grau, dimensão e estado de linfonodos.
Embora não necessários para o cálculo dos dados essenciais deduzidos
listados no Quadro 2, os dados brutos adicionais no Quadro 3 são ainda vantajosos
porque proporcionam informações sobre certas variáveis que podem causar
114
importante flutuação nos resultados de auditoria. Por exemplo, se uma grande
proporção de exames mamográficos foi realizada em pacientes rastreadas pela
primeira vez (aquelas com cânceres prevalentes), a taxa de cânceres detectados
deveria ser muito mais alta do que em uma população que foi rastreada previamente
(cânceres incidentes). Desta forma, o conhecimento da proporção das mamografias
de rastreamento iniciais para as mamografias de rastreamento de acompanhamento
pode afetar consideravelmente os resultados da auditoria (BASSETT, 2000).
Como ocorre com os dados brutos, os dados essenciais deduzidos podem ser
suplementados com dados deduzidos adicionais de grande valor (Quadro 4)
(BASSETT, 2000).
Quadro 4: Auditória Médica mais Completa: Dados Derivados a Serem Calculados (BASSETT, 2000).
1. Verdadeiros positivos, falsos positivos (três subdefinições: FP 1, FP2, FP3), verdadeiros
negativos, falsos negativos.
2. Sensibilidade.
3. Valor preditivo positivo.
a. Baseado em exame de rastreamento anormal (VPP1).
b. Baseado em indicação para biópsia ou consulta cirúrgica (VPP2).
c. Baseado em resultados de biópsia (VPP3).
4. Especificidade.
5. Taxa de detecção de câncer.
a. Taxa de detecção de câncer para casos assintomáticos (rastreamento verdadeiro).
b. Prevalente versus incidente.
c. Total.
d. Taxas dentro de grupos etários variados.
6. Porcentagem de cânceres mínimos encontrados.
7. Taxa de reconvocação.
Embora esses dados adicionais sejam altamente desejáveis, o tempo
dispendido limita o processo e falta de acessibilidade de certos dados brutos,
especialmente os falsos negativos, podendo impedir que sejam calculados.
115
Com base nos estudos de auditagem na literatura, para calcular qualquer um
dos dados deduzidos no Quadro 2 ou Quadro 3, cada exame mamográfico deve ser
catalogado em quatro grupos, de acordo com as seguintes definições: (BASSETT,
2000)
I.
Verdadeiro positivo (VP): Câncer diagnosticado dentro de um ano após a
recomendação de biópsia baseada em mamografia anormal (consenso).
II.
Verdadeiro negativo (VN): Ausência de diagnóstico conhecido de câncer
dentro de um ano após uma mamografia normal (consenso).
III.
Falsos negativos (FN): Diagnóstico de câncer dentro de uma ano após uma
mamografia normal.
IV.
Falsos positivos (FP): Três diferentes definições estão na literatura:
a. Ausência de câncer identificado, diagnosticado após um ano de uma
mamografia de rastreamento anormal (isto é, uma mamografia para
a qual foi recomendada avaliação posterior por imagem ou biópsia)
(FP1).
b. Ausência de câncer identificado, diagnosticado dentro de um ano
após recomendação de biópsia ou consulta cirúrgica baseadas em
uma mamografia anormal (FP2).
c. Doença benigna encontrada em biópsia dentro de um ano após
recomendação de biópsia ou consulta cirúrgica baseadas em
mamografia anormal (FP3).
Outra forma de conceituar a relação entre estes quatro grupos é expressa
graficamente na FIGURA 43.
116
Figura 43: Representação gráfica da relação entre verdadeiros positivos (VP), falsos positivos (FP),
falsos negativos (FN) e verdadeiros negativos (VN) (BASSETT, 2000).
As mulheres rastreadas para câncer de mama com mamografia foram postas
no grupo principal (positivo); se o teste indicou uma suspeita de câncer de mama, ou
no grupo final (negativo); se o teste foi normal. Cada grupo foi então subdivido
baseado em quais pacientes subsequentemente tiveram diagnóstico de câncer de
mama (coluna da esquerda) ou não (colunas da direita). Existem então quatro
combinações possíveis: (BASSETT, 2000)
I.
Se tanto o teste quanto a biópsia foram positivos para câncer, é
denominado um verdadeiro positivo (VP).
II.
Se ambos são negativos para câncer de mama ou se o teste é negativo
e não há evidência clínica de câncer de mama na ausência de biópsia,
trata-se de um verdadeiro negativo (VN).
III.
Se o teste é positivo e a biópsia é negativa ou não há evidência clínica
de câncer de mama dentro de um ano, é um falso positivo (FP).
IV.
Ao contrário, se o teste é negativo e a biópsia positiva, trata-se de falso
negativo (FN).
A partir destas definições e dos dados brutos é possível calcular os seguintes
dados reduzidos:
117
I.
Sensibilidade
Definida como a probabilidade de detectar um câncer quando ele
existe ou, alternativamente, como a porcentagem de todas as
pacientes com câncer de mama dentro de um ano após o
rastreamento, corretamente diagnosticadas como suspeitas na
mamografia.
Sensibilidade = VP / (VP + FN)
(18)
Valor Preditivo Positivo: Podem ser aplicadas três definições:
1) VP+1 (rastreamento anormal): a porcentagem de todos os
exames de rastreamento anormais (isto é, aqueles para os
quais foram recomendados biópsia, avaliação posterior por
imagem ou exame de acompanhamento de intervalo curto)
que resultem em diagnóstico de câncer.
VPP+1 = VP / número de exames de rastreamento
anormais ou VP / (VP + FP1)
(19)
2) VPP2 (biópsia recomendada): a porcentagem de todos os
casos onde houve indicação de biópsia ou consulta
cirúrgica em consequência de rastreamento que resultou
em diagnóstico de câncer.
VPP+2 = VP / número de casos onde houve
indicação de biópsia após exames de rastreamento
anormais ou VP / (VP + FP2)
(20)
3) VPP+3 (biópsia realizada): a porcentagem de todas as
biópsias realmente feitas em decorrência de rastreamento,
as quais resultaram em diagnóstico de câncer. Isto é
também conhecido como rendimento de malignidade de
biópsia ou a taxa positiva de biópsia.
118
VPP+3 = VP / número de biópsias
ou
VPP+3 = VP / (VP + FP3) (21)
É importante saber qual a definição de VPP+ que está sendo
usada para interpretar e comparar com precisão os dados de
auditagem.
Para clínicas que realizam só mamografias de rastreamento,
somente o VPP+1 é importante na avaliação de seus dados. Para
clínicas que fazem tanto a mamografia de rastreamento quanto a
de diagnóstico, todas as três definições de VP+ podem ser
aplicadas.
II.
Especificidade
Definida como a probabilidade de um laudo normal de
mamografia quando não existe câncer ou, alternativamente, como
a porcentagem de todas as pacientes sem evidência de câncer de
mama dentro de um ano após o rastreamento, corretamente
identificado como normal à época de sua realização.
Especificidade = VN / (FN + VN) (22)
Existe alguma variação no âmbito da especificidade, dependendo
da aplicação de definição de falsos positivo, mas as variações são
pequenas em decorrência do pequeno número de falsos positivo
e do grande número de verdadeiros negativos apresentados em
auditorias.
119
Taxa Global de Detecção de Câncer: É definida como o número
global de cânceres detectados por 1000 pacientes examinadas
através de mamografia. Este número deve estar disponível em
todas as auditagens básicas. É de grande valor a taxa de
detecção de câncer em pacientes assintomáticas, na medida em
que
este
grupo
rastreamento.
representa
Assim,
todas
a
verdadeira
população
as
mamografias
devem
de
ser
separadas por rastreamento ou diagnóstico, de forma que a taxa
de detecção de câncer no grupo assintomático possa ser
calculada.
2.6.2 Analisando os dados: o que realmente os dados quantitativos informam?
O real valor de calcular os dados na seção anterior reside no fato de permitir uma
medida quantitativa dos principais achados descritos anteriormente como reflexo da
qualidade do desempenho de um mamografista: porcentagem de todos os cânceres
achados mamograficamente, porcentagem de pacientes reconvocados para posterior
avaliação e biópsia, e porcentagem de cânceres pequenos com linfonodos negativos
detectados por rastreamento. Usando-se a sensibilidade (se mensurável), taxa de
detecção de câncer, VPP, taxa de reconvocação, tamanho do tumor e positividade
dos linfonodos, pode-se obter ótimos benefícios mesmo de uma auditagem básica
(BASSETT, 2000).
A relação entre estes dados pode ser mais bem conceituada usando-se uma
curva ROC (Receiver Operating Characteristic) em mamografia, como é mostrado na
FIGURA 44 (BASSETT, 2000).
120
Figura 44: Curva ROC representativa para mamografia (BASSETT, 2000).
A curva ROC para qualquer mamografista individualmente pode ser gerada
avaliando-se suas habilidades interpretativas na previsão da probabilidade de
malignidade em um grupo misto de casos mamográficos positiva e negativa com
resultados comprovados (BASSETT, 2000).
O mamografista registra seu desempenho como uma série de pontos gráficos
baseados em suas respostas a tal avaliação, com cada ponto representando que a
probabilidade observada pelo mamografista assinala contra os achados reais. As
séries resultantes de pontos assinalados definem a curva ROC individual. Cada curva
ROC do mamografista será levemente diferente, mas deverá estar sempre acima da
linha diagnonal (FIGURA 44), englobando a curva desde a esquerda inferior até a
direita superior, representando o desempenho. Aqueles com habilidade interpretativa
mais aguçada irão gerar uma curva ROC cujo arco se delineia mais alto, acima
daquela linha (mostrando uma alta porcentagem de interpretações de verdadeiro
121
positivo e verdadeiro negativo); aqueles com menos habilidade irão gerar uma curva
correndo próxima á linha (BASSETT, 2000).
2.6. 3 Benefícios adicionais: A auditoria como um instrumento de ensino
A auditoria de grupo é um importante instrumento de ensino porque proporciona
poder estatístico, que por sua vez dá ensejo a comparação com as taxas gerais
esperadas em outras auditorias de grupo (Quadro 5) (BASSETT, 2000).
Quadro 5: Análise dos dados de auditória médica: metas desejáveis (BASSETT, 2000).
VP+ baseado em exame de rastreamento anormal (VP+1)
5% - 10%
VP+ quando há indicação de biópsia (cirúrgica, AAF ou incisional (VP+ 2)
25% - 40%
Achado de tumores – estágio 0 ou 1
> 50%
Achado de tumores – câncer mínimo
> 30%
Positividade de linfonodo
< 25%
Achado de cânceres / 1000 casos
2 – 10
Achado de cânceres prevalentes / 1000 exames de primeira vez
6 – 10
Achado de cânceres incidentes / 1000 exames de acompanhamento
2–4
Taxa de reconvocação
≤ 10%
Sensibilidade (se mensurável)
> 85%
Especificidade (se mensurável)
> 90%
Somente casos de rastreamento.
Cânceres mínimos: câncer invasivo ≤ 1 cm ou câncer ductal in situ
2.6.4 Considerações Médico-Legais
Estatutos que protegem a revelação de registros em revisões pareados, gerados
por um comitê estruturado de revisões pareadas no ambiente hospitalar. No entanto,
não existe virtualmente nenhum estatuto para proteger das revelações de todas as
outras informações geradas no hospital sob os auspícios de atividades organizadas
de revisão de qualidade ou informação de revisão de qualidade obtidas no
ambulatório. Assim, é recomendado que auditorias completas de mamografia sejam
122
mantidas inicialmente como auditorias internas. Os médicos que interpretam não
devem divulgar os dados da auditoria sem conhecimento da legislação vigente
(BASSETT, 2000).
A instituição de uma ação legal por erro profissional médico tem a intenção de
buscar restituição para a paciente que acredite que o médico acusado não se tenha
conduzido de maneira razoável com respeito aos cuidados profissionais que deveriam
ter sido prestados. No campo das imagens da mama, os deveres do médico são
variáveis, dependendo do tipo de prática oferecida pelo serviço em que a assistência
foi prestada. Emergem tanto uma abordagem médica orientada para doenças, quanto
um serviço orientado para a saúde pública.
2.6.5
Curva ROC (Receiver Operating Characteristic)
A curvas ROC facilita o entendimento entre a relação da sensibilidade e a
especificidade de um teste diagnóstico quantitativo ao longo de valores contínuos de
ponto de corte (SOUZA, 2009).
Para construir uma curva ROC traça-se um plano cartesiano composto de
eixos unitários. Nesse plano são representados os pares FP (frações de falso positivo)
e TP (frações de verdadeiro positivo). FP representa a fração de pacientes sem câncer
de mama que foram incorretamente diagnosticados como positivos, isto é, são os
falsos positivos. TP, por sua vez, está relacionada com a fração de pacientes com
câncer de mama que foram corretamente diagnosticados como positivos, ou seja, são
os verdadeiros positivos (ESPÍRITO-SANTO, 2004).
Os pares ordenados (FP, TP) descrevem o desempenho dos sistemas de
diagnóstico (classificadores de atributos de mamografias) de uma maneira mais
significativa do que os simples indicadores do percentual (desvio absoluto, desvio
relativo, desvio erro quadrático) de acerto dos classificadores em relação ao valor real.
Contudo, a descrição do desempenho de classificadores feita a partir dos pares
ordenados (FP, TP) não é uma maneira inteiramente adequada de se descrever o
desempenho de um sistema de diagnóstico (ESPÍRITO-SANTO, 2004), pois dois
aspectos inerentes ao diagnóstico feito podem variar independentemente, quais
123
sejam:

A capacidade dos classificadores em distinguir os pacientes saudáveis
dos portadores da doença;

Quais as frações de FP e TP a serem empregadas em aplicações
clínicas quando existe disponível uma particular capacidade de
discriminação.
A referida capacidade de discriminação do sistema de diagnóstico de câncer
depende do nível de separação, ou da superposição, das distribuições de
probabilidades das evidências dos vários estados de verdade. Assim, cada estado de
verdade é representado por uma distribuição de probabilidade. A menos que a
capacidade de discriminação seja perfeita, pelo menos alguns diagnósticos devem ser
feitos fundamentados em evidências concretizadas a partir de mais de um estado de
verdade (ESPÍRITO-SANTO, 2004).
O observador pode, face à evidência disponível, adotar um limar de confiança
para selecionar o diagnóstico mais apropriado. Diferentemente da capacidade de
discriminação, o limiar de confiança utilizado por um observador dependerá das
estimativas de probabilidade que o mesmo emprega em aplicações médicas e dos
julgamentos feitos considerando as consequências dos vários tipos de decisões
corretas e incorretas. A distinção entre capacidade de discriminação e critério de
decisão é mais aparente quando um diagnóstico, feito a partir de duas distribuições
sobrepostas, implica na seleção de um limiar capaz de detectar (separar) casos
anormais. A mesma distinção é necessária em testes que devem ser interpretados de
maneira subjetiva em que uma particular impressão de confiança, também subjetiva,
considera o fato dos resultados dos testes serem originários de mais de um estado de
verdade (representados por distribuições distintas). Nessa situação, uma decisão é
tomada somente após a comparação de cada impressão com um limiar de confiança
interno (ESPÍRITO-SANTO, 2004).
Para uma capacidade de discriminação fixa, por exemplo, um conjunto de
populações não linearmente separáveis, representadas por distribuições de
probabilidades que se sobrepõem, define-se os termos sensibilidade e especificidade
(ESPÍRITO-SANTO, 2004). Sensibilidade representa as frações de verdadeiros
124
positivos, isto é, sensibilidade = TP. Especificidade, por sua vez, relaciona-se com a
fração de falsos positivos (FP) da seguinte maneira: FP = 1 – TN = 1 – especificidade,
em que TN é a fração de verdadeiros negativos.
A sensibilidade e a especificidade de um sistema de diagnóstico, mantido
constante a capacidade de discriminação, dependerá de um determinado limiar de
confiança que um observador emprega para decidir a partir de diferentes estados de
verdade representados.
A FIGURA 45, esquematicamente, a situação considerada. No diagrama da
figura, o eixo horizontal representa a confiança que um radiologista tem que uma dada
mamografia é de um paciente positivo, ou seja, a mamografia de um portador da
enfermidade (câncer de mama). Analogamente, o mesmo eixo pode representar a
confiança que o mesmo radiologista tem que a mamografia é de um paciente negativo
para o câncer (ESPÍRITO-SANTO, 2004).
As
duas
distribuições
Gaussianas
dispostas
na
figura
representam
respectivamente as Funções de Distribuição de Densidade de Probabilidade (FDDP)
da confiança de que a mamografia é de um paciente positivo para o câncer
(Gaussiana da direita) e de um paciente negativo para o câncer (Gaussiana da
esquerda). O limiar de confiança está representado pela reta vertical que divide o eixo
horizontal em duas partes (ESPÍRITO-SANTO, 2004).
A sobreposição das Gaussianas indica que pelo menos algum grau de confiança
intermediário de um diagnóstico positivo (diagnosticar câncer um paciente que
realmente é portador da doença) pode ser originário de um paciente portador do
câncer (paciente positivo) ou de um paciente negativo para o câncer (Figura 45)
(ESPÍRITO-SANTO, 2004).
125
Figura 45 : Modelo esquemático utilizado no entendimento da curva ROC. As duas Gaussianas
representam as distribuições de densidade de probabilidade do grau de confiança que um radiologista
tem ao fazer um diagnóstico positivo. A reta vertical traçada nas Gaussianas e um possível “limiar de
confiança” que separa diagnósticos positivos dos negativos (SOUZA, 2009)(ESPÍRITO-SANTO,
2004).
A Gaussiana que representa os diagnósticos positivos está posicionada mais à
direita, em relação à Gaussiana dos diagnósticos negativos, porque é interessante
que o radiologista tenha maior confiança em diagnosticar casos positivos (ESPÍRITOSANTO, 2004).
De acordo com o modelo de decisão de diagnóstico ora considerado, um
radiologista escolhe entre um diagnóstico positivo e um negativo a partir da
comparação do seu grau de confiança em diagnosticar câncer com o limiar de
confiança. Este limiar de confiança é especificado em função da experiência do
radiologista em diagnosticar câncer de mama. Sendo assim, uma imagem é
interpretada como sendo de um paciente “positivo” se o grau de confiança do
radiologista excede o limiar de confiança (ESPÍRITO-SANTO, 2004).
No gráfico da FIGURA 46, a fração de verdadeiro positivo (TP) é, no gráfico,
representada pela área sob a Gaussiana mais à direita (curva que representa a
distribuição de densidade de probabilidade dos pacientes com câncer), calculada a
partir do limiar de confiança. De modo equivalente, a fração de falso positivo (FP)
corresponde à área da Gaussiana mais à esquerda (curva que representa a
distribuição de densidade de probabilidade dos pacientes sem câncer), calculada
também a partir do limiar de confiança (ESPÍRITO-SANTO, 2004).
126
Mudanças no limiar de confiança (movimento para direita ou para esquerda),
implica em variações no par ordenado (TP, FP) ou na relação que existe entre a
sensibilidade e a especificidade. Um movimento do limiar de confiança mais para a
direita, o que implica em aumentar o grau de confiança do radiologista em diagnosticar
positivos, diminui a área sob a Gaussiana dos positivos e conseqüentemente o valor
de TP. O mesmo movimento reduz a área sob a Gaussiana dos negativos à direita do
limiar de confiança. Como a área dessa região corresponde ao valor de FP, observase também, uma redução de FP. Inversamente, um movimento do limiar de confiança
mais para a esquerda aumenta, por motivos idênticos, as áreas sob as Gaussianas,
elevando os valores de TP e FP (ESPÍRITO-SANTO, 2004).
Essas observações implicam que o par ordenado (TP, FP) varia diretamente
com os movimentos do limiar de confiança ao passo que a sensibilidade e a
especificidade variam de maneira inversa. Por exemplo, se em um sistema de
diagnóstico um paciente negativo para o câncer (diagnosticado por biópsia) for
diagnosticado como sendo positivo, porque o limiar de confiança utilizado foi o mais à
esquerda, então a sensibilidade do sistema aumentará porque mais pacientes
verdadeiros positivos serão corretamente diagnosticados. A especificidade (FP = 1 especificidade), contudo irá diminuir, pois mais pacientes verdadeiros negativos serão
diagnosticados incorretamente como positivos, o que justifica o aumento de FP
(FIGURA 46) (ESPÍRITO-SANTO, 2004).
Se o limiar de confiança é alterado em experimentos repetidos, então uma
variedade de pares ordenados (TP, FP) ou (sensibilidade, especificidade) é gerada,
podendo ser disposta em um plano cartesiano de eixos unitários. Se a variação do
“limiar de confiança é continua”, uma curva suave é obtida. Essencialmente, isto
constitui uma curva ROC. Cada ROC indica a relação entre TP e FP ou entre
sensibilidade e especificidade disponíveis no sistema de diagnóstico. Essa curva
descreve a capacidade de discriminação do sistema (ESPÍRITO-SANTO, 2004).
Um limiar de confiança arbitrário utilizado por um observador em uma decisão
particular determina o ponto de operação, uma combinação de TP e FP (ou
sensibilidade e especificidade) que é indicada na curva ROC do sistema de
diagnóstico. Por convenção, uma típica curva ROC é traçada exibindo TP
(sensibilidade) como função de FP (1 - especificidade) (ESPÍRITO-SANTO, 2004).
ROC’s típicas são mostradas na Figura 45. A ROC posicionada mais à
127
esquerda, ROC2, possui uma maior capacidade de discriminação do que a curva
ROC1, pois, considerando valores distintos de TP (no gráfico, TP1 e TP2) nas duas
curvas, observa-se que as correspondentes frações de falso positivo na curva ROC2
(FP21 e FP22) são menores que as frações de falso positivo da curva ROC1 (FP11 e
FP12) (ESPÍRITO-SANTO, 2004).
Isto implica que, para um mesmo diagnóstico (por exemplo, detecção de câncer
de mama em mamografias), as decisões tomadas pelo radiologista a partir da curva
ROC2 apresentam um maior grau de confiança (quando comparada com a curva
ROC1), pois, naquela curva, a um alto valor de TP (alta sensibilidade) está associado
um baixo valor (relativamente aos valores da ROC1) de FP (alta especificidade)
(ESPÍRITO-SANTO, 2004).
Em aplicações médicas, dedicadas ao diagnóstico de câncer, é desejável que
na ROC, e conseqüentemente no sistema de diagnóstico, que os pontos de operação
tenham alta sensibilidade (altos valores de TP) e alta especificidade (baixos valores
de FP) correspondente. Isto é interessante pois, face à sobreposição dos diversos
estados de verdade, que um diagnostico positivo (TP) seja menos influenciado pelas
frações de falso positivo (FP). O gráfico da próxima figura mostra ainda, a titulo de
ilustração e reforço do entendimento do significado da curva ROC em sistemas de
diagnóstico de câncer, uma ROC retilínea em que para qualquer ponto de operação
TP é igual a FP. Nessa ROC ou sistema de diagnóstico que ela representa, a
probabilidade de um radiologista diagnosticar um caso como positivo é exatamente
igual à probabilidade de diagnosticar o mesmo caso como negativo (Figura 46)
(ESPÍRITO-SANTO, 2004).
128
Figura 46: Curvas ROC típicas que podem resultar a partir da análise de mamografias. P11 e P21 são
postos particulares de operação respectivamente das curvas ROC1 e ROC2(ESPÍRITO-SANTO,
2004).
129
2.7 Estado da Arte
Neste tópico serão feitos relatos, com indicações de referências, do que existe
no meio científico relevante ao tema abordado neste trabalho. Conforme mencionado
anteriormente, Computer-Aided Diagnosis (CAD) é um sistema computacional que
pode ser empregado no apoio ao diagnóstico de câncer de mama feito por
radiologista. Geralmente, um sistema CAD manifesta-se sob dois aspectos distintos,
mais comunicáveis entre si: obtenção dos fatores de forma, texturas e bordas a partir
de mamografias e classificação dessas informações em malignos e benignos
(ESPÍRITO-SANTO, 2004).
O emprego de um sistema CAD tem por objetivo a redução, nas mamografias
analisadas, da taxa de ocorrência dos falsos-negativos e a elevação dos valores das
predições positivas para as ocorrências de lesões anormais. Percebe-se a partir daí
que o emprego de sistemas CAD na avaliação de mamografias pode reduzir a
quantidade de pacientes a serem submetidos ao exame de biópsia (ESPÍRITOSANTO, 2004).
Em um sistema CAD, o diagnóstico de câncer de mama é feito a partir da
extração de certos atributos de imagens médicas (mamografias) e posterior
discriminação desses atributos (features) em tumores e calcificações malignos ou
massas e calcificações benignas. Tal discriminação ou separação de classes é feita
utilizando-se implementações computacionais de classificadores de populações. A
tarefa dos classificadores é discriminar uma população, agrupando elementos
semelhantes em sub-populações com características afins. O foco do trabalho é o
desenvolvimento de um classificador paraconsistente capaz de auxiliar no diagnóstico
do câncer de mama, através da quantificação de características da imagem e sua
classificação como correspondendo a padrões normais ou anormais.
• Análise de atributos de mamografias (fatores de forma, texturas e bordas);
• Classificadores de atributos em malignos e benignos.
130
2.7.1 Benefícios potenciais da tecnologia CAD
Técnicas de CAD podem oferecer uma alternativa econômica para dupla-leitura
como um meio de reduzir os erros. Um sistema CAD poderia atuar como um segundo
leitor. O que pode levar o radiologista a rever áreas consideradas suspeitas em uma
mamografia, considerando a opinião de um algorítmo especializado de computador
(RANGARAJ, FABIO, & DESAUTELS, 2007).
Uma sessão típica CAD funciona da seguinte forma:
1. O radiologista realiza a primeira leitura da mamografia, registrando todas
as áreas questionáveis ou suspeitas. Opcionalmente, o radiologista
pode melhorar digitalmente a imagem mamográfica, a fim de prestar
mais atenção aos detalhes sutis que poderiam sugerir a presença de
lesões.
2. O sistema CAD digitaliza a mamografia, para detectar características
suspeitas.
3. O radiologista analisa as instruções dadas pelo sistema CAD para
verificar se alguma área suspeita foi deixada desmarcada na primeira
leitura.
4. Algorítmos CAD também podem ser usados
para estimar a
probabilidade de uma determinada lesão ser benigna ou maligna, tal
como uma estimativa revista pelo radiologista.
Estudos têm demonstrado que os sistemas CAD podem melhorar a
sensibilidade de um radiologista, sem um aumento substancial da taxa de
reconvocação de pacientes (ASTLEY & GILBERT, 2004).
Ciatto et al. (2003) comparam mamografias convencionais e leitura CAD em um teste
de proficiência nacional de mamografia na Itália. Os autores concluíram que o
desempenho de leitura única com CAD é semelhante ao da dupla leitura. Foram
utilizadas 89 mamografias de rastreamento negativos, para um grupo de 19
radiologistas. Como resultado: dupla leitura (sensibilidade de 46,1% e taxa de
reconvocação de 26,1%) e dupla leitura com CAD (sensibilidade de 42,1% e taxa de
reconvocação de 23,9%).
131
Freer e Ulissey (2001) realizaram um estudo prospectivo do efeito CAD na triagem,
onde 12.860 mamografias foram interpretadas com a ajuda de um sistema de CAD ao
longo de um período de 12 meses. Observou-se que o número de cânceres
detectados aumentou 19,5%, que a proporção de doenças malignas em fase inicial
detectadas aumentou de 73% para 78%. A taxa de reconvocação aumentou de 6,5%
para 7,7%, e o valor preditivo positivo da biópsia permaneceu inalterado em 38%. O
estudo levou à conclusão de que a utilização de uma ferramenta CAD pode melhorar
a detecção de tumores em fase inicial, sem efeito adverso sobre a taxa de
reconvocação ou do valor preditivo positivo da biópsia.
Burhenne et al. (2000) estudaram o desempenho de um sistema CAD comercial na
detecção de massas e calcificações em mamografia, obtendo-se uma sensibilidade
de 75% para a detecção de massas e distorção arquitetural, um falso-positivo por
imagem. Para o estudo, utilizaram 1083 mamografias (406 com calcificações, 677 com
massas ou distorção arquitetural) e 20 radiologistas.
Evans et al. (2002) estudaram a capacidade de um sistema CAD comercial para
marcar o carcinoma lobular invasivo da mama: a ferramenta CAD detectou 86 de 94
lesões (sensibilidade de 91%), também foram detectados 17 de 20 casos de distorção
arquitetural (sensibilidade de 85%). Para o estudo utilizaram 90 mamografias (94
lesões de carcinoma lobular invasivo).
Birdwell et al. (2001) estudaram o desempenho de uma ferramenta CAD comercial na
marcação de cânceres que foram negligenciados pelos radiologistas: o software
detectou cinco dos seis casos de distorção arquitetural, e 77% das lesões
anteriormente não atendidas, em 2,9 falsos-positivos por imagem. Para o estudo,
utilizaram 110 casos de cânceres detectados anteriormente, onde um grupo de
radiologistas recomendou a reconvocação dos pacientes.
Baker et al. (2003), estudaram a sensibilidade de duas ferramentas CAD comerciais
falharem na detecção de distorção arquitetural: menos de 50% dos 45 casos de
distorção arquitetural apresentados foram detectados (com uma sensibilidade
132
baseada na imagem 38% menor, ou 30 de 80 imagens, em 0,7 falso-positivo por
imagem).
Broeders et al. (1993) sugeriram que melhorias na detecção de distorção arquitetural
poderiam levar a uma efetiva evolução no prognóstico de pacientes com câncer de
mama.
2.7.2 Tecnicas empregadas em CAD
O desenvolvimento de novas ferramentas CAD voltadas para câncer de mama
é um campo de pesquisa atual, em particular no que diz respeito à detecção de
anormalidades sutis na mamografia (RANGARAJ, FABIO, & DESAUTELS, 2007).
Sistemas comerciais CAD alcançaram um grau satisfatório de eficácia na
detecção de massas e calcificações. No entanto, certas áreas de pesquisa voltadas
para o desenvolvimento de ferramentas CAD voltadas para câncer de mama ainda
exigem atenção (RANGARAJ, FABIO, & DESAUTELS, 2007).
Um número relativamente pequeno de pesquisadores (em comparação com o
número de pesquisadores que realizaram trabalhos relacionados com massas e
calcificações) tem concentrado sua atenção sobre o problema de detectar distorção
arquitetural, na ausência de uma massa central. A maioria dos esforços publicados é
direcionado para uma categoria mais geral de anomalias, tais como lesões
espiculadas, que englobam algumas das possíveis aparições de distorção
arquitetural. Outras linhas de pesquisa que requerem mais atenção incluem a análise
de assimetria bilateral, estruturas curvilíneas (CLS) e densidade da mama como um
preditor do risco de câncer de mama. Em um contexto mais amplo, as áreas de
interesse relacionadas com CAD de câncer de mama incluem o desenvolvimento de
sistemas para reconvocação baseados em conteúdo de mamografias, atlas indexados
e sistemas de mineração de dados. Sistemas de mamografia digital de campo total,
embora ainda em fase de avaliação, poderiam facilitar a aplicação rotineira das
técnicas acima mencionadas (RANGARAJ, FABIO, & DESAUTELS, 2007).
133
2.7.2.1 Melhoria da Imagem
As características de diagnóstico em mamografia, tais como massas e
calcificações, podem ser pequenas e ter baixo contraste relativamente aos tecidos
circundantes da mama. Esses atributos podem tornar os recursos de diagnóstico
difíceis de detectar. Técnicas de realce de contraste podem melhorar a capacidade
de um radiologista perceber características de diagnósticos sutis, levando a um
diagnóstico precoce, mais exato do câncer da mama (RANGARAJ, FABIO, &
DESAUTELS, 2007).
Melhorias no contraste podem melhorar a qualidade de uma mamografia, tal
como indicado por Ram (1982) , que indicaram, ainda, que a aplicação de técnicas de
aumento de contraste numa situação clínica pode reduzir a dose de radiação em cerca
de 50%. O aprimoramento de imagens mamográficas poderia melhorar a precisão da
detecção de sinais precoces de câncer de mama.
Laine et al. (1994) apresentaram um método para o realce de contraste não-linear
com base na representação de multi-resolução, com uso de pequenas ondulações
diádicas.
Gordon e Rangayyan (1984) foram os primeiros a relatar o uso de processamento de
imagem baseada em vizinhança adaptativa para melhorar o contraste da imagem
mamográfica.
Rangayyan e Nguyen (2003) definiram um método baseado em tolerância para o
cultivo de regiões de primeiro plano, que poderiam ter formas arbitrárias em vez de
formas quadradas.
Dhawan et al. (1986) investigaram os benefícios de várias funções de transferência
de contraste em um algoritmo de quadrados adaptativos por vizinhança para o realce
de contraste. As funções de transferência de contraste foram avaliadas como ln
(1+3C ), 1-exp (-3C ), √C , e tanh(3C ), onde C é o contraste original. Eles descobriram
que, enquanto a função de contraste adequado foi importante para trazer as
características de interesse em mamografias, foi difícil selecionar esse tipo de função.
134
Dhawan e Le Royer (1988) propuseram uma função de realce de contraste ajustável
para melhorar as características mamográficas.
Rangayyan et al. (1997) e (2002) estudaram o desempenho de seu algorítmo ANCE
em aumentar a sensibilidade do diagnóstico de câncer de mama por meio da análise
ROC e dos testes de McNemar (RANGAYYAN, 2005). Um conjunto de 78
mamografias de 21 casos difíceis (14 malignos e sete benignos) e outro conjunto de
222 mamografias de 28 pacientes com câncer e seis casos de controle benignos foram
digitalizadas com uma resolução de cerca de 4096 × 2048 × 10 bits pixels e,
subsequentemente, transformados com o algorítmo ANCE. Os filmes originais, bem
como as imagens não transformadas e as transformadas em correspondentes digitais,
foram apresentados a seis radiologistas experientes para uma análise ROC, e a três
radiologistas para a análise da progressão do câncer. Observou-se que o
desempenho dos radiologistas melhorou com o processamento ANCE, no que diz
respeito à imagem analógica e à leitura da imagem digital, em termos da área sob a
curva ROC. Observou-se também que a sensibilidade do diagnóstico foi melhorada
pelo algoritmo ANCE. Testes de simetria McNemar indicaram que a confiança no
diagnóstico de casos de progressão de câncer foi melhorada pela técnica ANCE com
um elevado nível de significância estatística ( p = 0 , 0 0 0 1 - 0,005), com nenhum
efeito significativo sobre o diagnóstico de casos de controle benignos ( p = 0,08 -,1).
2.7.2.2 Segmentação de mamografias e análise de densidade da mama
Foi observado que o aumento da densidade da mama está geralmente
associado a um maior risco de desenvolvimento de câncer (BOYD, 1995) e (URSIN,
2005). Muitos pesquisadores têm estudado métodos computacionais para a avaliação
do risco de desenvolvimento de câncer de mama por meio de análise automatizada
da densidade da mama. Byng et al. (BYNG, 1996) calcularam a assimetria de
histogramas de 24 × 24 (3,12 x 3,12 milímetros) seções de mamografias. Uma
assimetria média foi calculada para cada imagem pela média sobre todas as medidas
das imagens seccionadas. Mamografias de seios com maior densidade fibroglandular
foram observadas como tendo histogramas com maior densidade, resultando em
135
assimetria negativa. Por outro lado, as mamografias de seios gordos tendem a ter
assimetria positiva. A dimensão fractal da imagem de mama também foi calculada: a
imagem foi interpretada como um mapa de relevo e a dimensão fractal foi calculada
usando o método de contagem de caixa. A assimetria e as medidas de dimensões
fractais foram dimensionadas para serem úteis em predizer o risco de
desenvolvimento de câncer de mama.
Caulkin et al. (1998) observaram que o câncer da mama ocorre mais frequentemente
nos quadrantes superiores e exteriores da mama, e que a maioria dos cânceres são
associada com glândulas, em vez de tecidos adiposos. Portanto, a detecção de
diferentes estruturas anatômicas no seio (por exemplo, o tecido adiposo, o disco
fibroglandular e o músculo peitoral), pode facilitar a análise do risco de
desenvolvimento de câncer da mama, bem como a detecção precoce de câncer da
mama. No entanto, a maioria das técnicas propostas para CAD de câncer da mama
analisa toda a mamografia, sem ter em conta a observação de que os sinais de câncer
de mama podem ter diferentes aparências em regiões diferentes. Com base nestas
observações, alguns pesquisadores propuseram métodos para o segmento e também
para modelar mamografias em termos de regiões anatômicas.
Karssemeijer (1998) usou a transformada de Hough para identificar o músculo peitoral
como uma borda em linha reta na mamografia.
Ferrari et al. (2004) propuseram dois métodos para a identificação do músculo peitoral
em mamografias. O primeiro método é uma variante do método de Karssemeijer, que
utiliza a transformada de Hough e filtragem aplicada às células do acumulador. No
entanto, a hipótese de uma linha reta para a representação do músculo peitoral nem
sempre é válida, e pode impor limitações em fases subsequentes da análise de
imagens. O segundo método proposto por Ferrari et al. (2004) , com base na filtragem
direcional utilizando ondulações Gabor, supera esta limitação.
136
2.7.2.3 Detecção e classificação de microcalcificações
Calcificações em mamografias aparecem como regiões relativamente
brilhantes, devido ao maior coeficiente de atenuação de raios-X (ou densidade) do
cálcio, em comparação com o tecido normal da mama. Apresentar calcificações no
interior das massas densas ou sobrepostas por tecidos densos no processo de
realização de mamografias pode apresentar diferenças de nível de cinza baixo ou
contraste com relação ao seu fundo local. Calcificações malignas tendem a ser
numerosas, em agrupamentos pequenos, variando em tamanho, formato, ângulo, com
forma irregular e ramificações (FERRARI, 2004) e (SICKLES, 1986). Por outro lado,
calcificações associadas a doenças benignas são geralmente maiores e mais
arredondadas, em menor número, mais distribuídas e mais homogêneas em tamanho
e forma. A detecção e classificação de microcalcificações têm sido extensivamente
estudadas, com diversos autores relatando sobre várias abordagens com sucesso
para esta tarefa. A pesquisa realizada por Cheng et al. (2003) enumera cerca de 200
referências sobre a detecção auxiliada por computador e classificação de
microcalcificações, incluindo métodos para a melhoria visual de microcalcificações,
segmentação, detecção, análise de malignidade, e as estratégias para a avaliação de
algoritmos de detecção .
Shen et al. (1993), propuseram um método para a detecção e classificação de
calcificações mamográficas. O método começa com uma região de multi-tolerância
para a detecção das regiões de potencial de calcificação e de extração de
contornos. Recursos de forma baseados em momento, descritores de Fourier, e
compactação são então extraídos. Finalmente, uma rede neural é utilizada para a
classificação dos vetores característicos, a fim de distinguir entre calcificações
malignas e benignas. As taxas de classificação corretas para calcificações benignas
e malignas foram de 94% e 87%, respectivamente (RANGAYYAN, SHEN, &
DESAUTELS, 1993). Em um trabalho relacionado (SHEN, RANGAYYAN, &
DESAUTELS, 1994) sobre estudos de recursos de forma e uma análise mais
abrangente de classificação de calcificações, a precisão da classificação de 100% foi
obtida para calcificações benignas e malignas, com um banco de dados contendo 143
calcificações comprovadas por biópsia (79 malignos e 64 benignos). Apêndice A.
137
Strickland (1996) desenvolveu um método de duas etapas baseado em
transformações
de
ondas
para
a
detecção
e
a
segmentação
de
microcalcificações. Nesse método, a detecção de calcificações é realizada no domínio
das ondas. Os locais detectados são reforçados no domínio de ondulações, antes do
cálculo da transformada inversa da onda. O aparecimento de microcalcificações é
aumentado por este processo, um processo de limiar suficiente para segmentar as
calcificações. A base de dados de teste consistiu de 40 mamografias, e uma
sensibilidade de 91% em três falsos-positivos por imagem.
El-Naqa et al (2002) usaram máquinas de vetores de suporte para detectar
agrupamentos de microcalcificações. O algoritmo foi testado com 76 mamografias,
contendo 1120 microcalcificações. A sensibilidade de 94% foi relatada, com um falso
positivo por imagem.
Yu et al. (2006) utilizaram um filtro de ondulações para a detecção de
microcalcificações, e um modelo de campo aleatório de Markov para obter
características de textura da vizinhança de cada calcificação detectada. As
características aleatórias de textura de campo baseadas em Markov, juntamente com
três características de textura auxiliares (o valor médio do pixel, a variação de nível
de cinza e uma medida de densidade de borda) foram usadas para rejeitar falsospositivos. O método foi avaliado utilizando 20 mamografias contendo 25 áreas de
microcalcificações agrupadas. A sensibilidade de 92% foi obtida, com 0,75 falsopositivo por imagem.
Soltanian-Zadeh et al. (2004) comparam quatro grupos de características de acordo
com o seu poder de discriminação na separação de microcalcificações nas categorias
benignos e malignos. As microcalcificações foram segmentadas utilizando um método
automatizado, e vários recursos foram extraídos. Cada recurso pertencia a uma das
seguintes categorias: características baseadas em multi-ondulações, recursos
baseados em ondulações, características de textura de Haralick (1979) e
características de forma. Dentro de cada grupo, um procedimento de recurso de
seleção baseado em algoritmos genéticos foi utilizado para identificar os recursos
mais adequados para uso com um k-esquema de classificação do vizinho mais
138
próximo. O desempenho da classificação de cada grupo de características foi então
determinado utilizando análise ROC. A área sob a curva ROC varia entre 0,84-0,89, e
observou-se que as características de multi-ondulações proporcionaram o melhor
desempenho, seguido pelas características de forma.
2.7.2.4 Detecção e classificação de massas
Tumores de mama e massas aparecem geralmente na forma de regiões
densas na mamografia. Uma massa benigna típica tem um limite redondo, liso e bem
circunscrito e, por outro lado, um tumor maligno geralmente tem um limite espiculado,
áspero, e desfocado (M.J., 1997), (ESPÍRITO SANTO R. , 2004) e (American College
of Radiology (ACR), 1998). No entanto, não existem casos atípicos de massas
benignas macrolobulada ou espiculadas, bem como tumores malignos ou
microlobulados bem circunscrito. Diversas técnicas têm sido desenvolvidas para a
detecção e classificação de tumores, em mamografias. Os sistemas comerciais
disponíveis incorporam algumas destas técnicas.
Kegelmeyer et al. (1994) propuseram um método para a detecção de lesões
espiculadas que empregava quatro medidas de textura de Laws (1980) e um novo
recurso sensível a padrões. O banco de dados de teste consistiu de 85 casos, com 49
casos normais e 36 casos positivos; um total de 330 mamografias foram utilizadas,
com 68 lesões. A sensibilidade de 97% foi alcançada com 0,28 falso-positivo por
imagem.
Rangayyan et al. (2000)
introduziram dois novos fatores de forma, índice de forma
espiculada (SI) e concavidade fracionária (Fcc), e aplicaram-nos para a classificação
de massas mamográficas manualmente segmentadas. A utilização combinada do
índice espiculado, concavidade fracionada e compactação (C) rendeu uma precisão
da classificação benigna versus maligna de 81,5%. Apêndice B.
Rangayyan et al. (1997) propuseram o uso de fatores de forma e borda acutance (AC)
para a classificação de massas manualmente segmentadas como benigno ou
maligno, e espiculadas ou circunscritas. Uma exatidão de classificação de 95% foi
139
obtida com um banco de dados de 54 imagens mamográficas, incluindo 16
circunscritas benignas, sete circunscritas malignas, 12 espiculadas benignas e 19
massas espiculadas malignas. Apêndice B
Guliato et al. (2003) elaboraram dois métodos para a segmentação das massas
utilizando conjuntos fuzzy. O primeiro método determina o limite de uma massa
crescente por região, depois de uma etapa de pré-processamento, valorização
baseada em conjunto difuso, o método produziu limites do tumor que foram
consistentes com contornos desenhados manualmente. O segundo método incorpora
a teoria dos conjuntos Fuzzy na região onde o procedimento esta sendo realizado,
produzindo uma segmentação difusa das massas. Os autores observaram que o grau
de heterogeneidade ao entorno do limite de massa correlacionado com a natureza
benigna ou maligna do tumor, porque para os tumores malignos são esperadas
margens mal definidas. Usando uma medida da não homogeneidade da segmentação
distorcida na região de fronteira, os autores obtiveram uma classificação de
sensibilidade benigna ou maligna de 80% com uma especificidade de 90%. Guliato et
al.(2003) também desenvolveram um método para a combinação de vários resultados
de segmentação em um único resultado, o uso de operadores de fusão difusa. Foram
observadas as regiões segmentadas resultantes mais consistentes com as regiões
correspondentes segmentadas por um radiologista do que os resultados individuais
de segmentação.
2.7.2.5 Análise de estruturas curvilíneas
A presença de estruturas curvilíneas (CLS) é um fator importante na detecção
de anormalidades na mamografia. A mama contém muitas estruturas que são
reconhecidas como CLS, tais como dutos de leite, vasos sanguíneos, ligamentos,
tecido do parênquima e as bordas do músculo peitoral. Algumas lesões são
caracterizadas pela presença de certos tipos de CLS, como espículas, na imagem
mamográfica (por exemplo, massas espiculadas e distorções arquiteturais), ou pela
disposição assimétrica de textura na imagem da mama. Por outro lado, algumas
lesões, como massas circunscritas, podem ser obscurecidas por CLS sobrepostas; a
aparência alterada resultante pode levar a erros de diagnóstico. Portanto, a
140
capacidade para detectar e classificar o CLS poderia melhorar o desempenho de
algoritmos de CAD.
Evans et al. (2002) elaboraram um método para caracterização estatística de CLS
normais em mamografia. CLS foram detectadas automaticamente e seis fatores de
forma foram calculados a partir de cada CLS. Uma Análise de Componentes Principais
(PCA) foi realizada, e as duas dimensões principais foram modeladas utilizando um
modelo de mistura de Gauss.
Wai et al. (2004), propuseram um método para a segmentação de CLS, baseado em
modelos físicos de CLS na mama. Foram realizados experimentos qualitativos, e os
autores relataram que o seu método produziu respostas bem localizadas que são
imunes à presença de ruído.
2.7.2.6 Análise de assimetria bilateral
Um dos sinais utilizados por radiologistas para detectar a presença de câncer
da mama é a assimetria bilateral, onde as mamas esquerda e direita diferem uma da
outra na aparência global nas mamografias correspondentes. Em BI-RADS (American
College of Radiology (ACR), 1998) definiu-se que a assimetria indica a presença de
maior volume ou densidade do tecido mamário, sem uma massa distinta, ou condutos
mais proeminentes, de uma mama em comparação com a área correspondente, do
outro seio.
Miller e Astley (1994) propuseram uma técnica para a detecção de assimetria bilateral,
que compreendeu um procedimento baseado no de textura para a segmentação do
tecido glandular semi-automatizada, e as medidas de forma, para a detecção de
ocorrência de assimetria. Uma precisão de 86,7% foi registrada em um conjunto de
dados de teste de 30 pares de mamografias. Em outro estudo, Miller e Astley (Miller,
1994) apresentaram um método para a detecção de assimetria bilateral com base em
medidas de forma, topologia e distribuição de brilho no disco fibroglandular. O método
foi testado em 104 pares de mamografias, e uma exatidão de classificação de 74% foi
obtida.
141
Lau e Bischof (1991) desenvolveram um método para a detecção de tumores da
mama, utilizando uma definição de assimetria que engloba medidas de brilho,
rugosidade e de direcionamento. O método foi avaliado utilizando 10 pares de
mamografias com assimetria, que foi o fator significativo para o diagnóstico do
radiologista. Uma sensibilidade de 92% foi obtida com 4,9 falsos-positivos por
mamografia.
2.7.2.7 Detecção de Distorção Arquitetural
Distorção da arquitetura é uma das anormalidades mais comumente perdidas
na mamografia. Distorção arquitetural é definida como a distorção da arquitetura
normal, sem massa visível definida, incluindo espículas que irradiam de uma retração
ou distorção de um ponto focal na borda do parênquima (American College of
Radiology (ACR), 1998). A definição inespecífica de distorção arquitetural e sua
natureza sutil tornaram o desenvolvimento de técnicas de processamento de imagem
para a detecção em desafio.
Sampat et al. (2005) empregaram filtragem no domínio de transformação de Radon,
para melhorar a mamografia, seguido pela utilização de filtros espiculados radiais para
detectar lesões espiculadas. O algoritmo foi testado em 45 casos com massas
espiculadas, e 45 casos com a presença de distorção arquitetural. Uma sensibilidade
de 80% foi obtida com 14 falsos-positivos por imagem na detecção da distorção de
arquitetural, e 91% com 12 falsos-positivos por imagem na detecção de massas
espiculadas.O uso da dimensão fractal para caracterizar a presença de distorção de
arquitetura em regiões de interesse (ROIs) mamograficas tem sido explorado.
Guo et al. (2005) estudaram a caracterização de distorção arquitetural, utilizando a
dimensão de Hausdorff, e uma máquina classificadora vetorial para distinguir as ROIs
mamográficas, exibindo a distorção de arquitetura e aqueles com padrões normais de
mamografia. Um conjunto de 40 ROIs foi selecionado a partir do banco de dados
MIAS (SUCKLING, 1994) (19 ROIs com distorção arquitetural e 21 ROIs com padrões
de tecido normal). Os autores relataram uma precisão de classificação de 72,5%.
142
Tourassi et al. (2006) estudaram a utilização da dimensão fractal para diferenciar
padrões normais e distorção arquitetural em ROIs mamográficas. O conjunto de dados
utilizado na pesquisa continha 112 ROIs com padrões de distorção arquitetural e 1388
ROIs exibindo padrões de tecido normal. O resultado a partir da utilização da curva
ROC foi A z = 0 , 8 9 . Os autores relatam também que foi observada a dimensão
fractal média de ROIs exibindo a distorção arquitetural menor do que a de ROIs com
os padrões normais, e que a diferença observada foi estatisticamente significativa sob
uma amostra independente, bicaudal t-teste.
Ayres e Rangayyan (2003) e (Ayres F.J., 2005) estudaram a caracterização de
distorção arquitetural em ROIs mamográficas, usando retratos de fase. Um retrato de
fase é uma exposição dos possíveis percursos, no plano de fase, do estado de um
sistema dinâmico.
Rao e Jain (1992) propuseram o uso de retratos de fase em análise de textura
orientadan: os padrões geométricos nos retratos de fase dos sistemas lineares de
primeira ordem, as equações diferenciais podem ser associadas com os padrões
encontrados em uma imagem que apresenta textura orientada. Uma base de dados
de 106 ROIs extraídos da base de dados Mini-MIAS foi utilizada no trabalho de Ayres
e Rangayyan (2005), que contém 17 casos de distorção arquitetural, 45 normais, dois
ROIs com calcificações malignas, e 44 massas (oito espiculadas malignas, quatro
circunscritas malignas, 11 espiculadas benignas, e 19 massas circunscritas
benignas). Uma sensibilidade de 76,5% e uma especificidade de 76,4% foram obtidas,
com uma área sob a curva ROC de A z = 0 , 7 7 .
2.7.2.8
Atlas indexado, mineração de dados e recuperação baseada em
conteúdo
O advento dos programas de rastreio mamográfico tem gerado uma série de
dados, tais como relatórios de pacientes e imagens mamográficas, armazenados em
vários bancos de dados em centros de saúde e universidades ao redor do mundo. Tal
riqueza de dados pode ser explorada através do uso de tecnologias de informação de
gestão, beneficiando pesquisadores, profissionais clínicos, estudantes, pacientes,
143
empresas envolvidas na pesquisa e desenvolvimento relacionados com sistemas CAD
e outros participantes em um esforço para reduzir a mortalidade por câncer de mama.
O dicionário Merriam-Webster define dados como "informação factual (como
medidas ou estatísticas), utilizado como base para o raciocínio, discussão ou cálculo",
e informações como "o conhecimento obtido a partir de pesquisa, estudo ou
instrução". Os dados representam uma entidade sem sentido que são transformados
em informações através do processo de análise e atribuição de significado. É
necessário desenvolver as ferramentas computacionais adequadas a fim de obter
informações úteis a partir das vastas quantidades de dados presentes nas bases de
dados de mamografia e associados.
Pode-se discutir sobre a forma mais eficiente de recuperação e análise de
informações, observando como os mecanismos de busca ajudam a dominar a
complexidade e quantidade de dados disponíveis na Internet. No entanto, é
necessário ajustar as ferramentas de busca de informação sobre a natureza da
informação a ser recuperada.
Alto et al. (2005) estudaram a adequação de medidas objetivas de forma, nitidez de
borda e textura para recuperar mamografias com massas com características
semelhantes. A medida de precisão de recuperação foi determinada a ser de 91%
quando se utilizam os três recursos mais eficazes pesquisados pelos autores,
concavidade fracionada, a nitidez e soma entrópica (medida de textura definida por
Haralick (1979).
2.7.2.9
Atributos e classificação
Durante a leitura de uma mamografia o radiologista pode, por exemplo, notar
aspectos dimensionais (altura, largura e profundidade), forma, textura, borda, etc;
pode traduzir esses aspectos em valores específicos e, de uma maneira sistemática,
concluir, a partir dessas informações, que o câncer está presente ou não no material
examinado. Em CAD, o diagnóstico desse tipo de patologia é feito em duas etapas.
Inicialmente, recursos computacionais são empregados para extrair certas
características (atributos) das imagens médicas. Os atributos são traduzidos em
144
fatores de forma (SHEN, RANGAYYAN, & DESAUTELS, 1993), texturas (HARALICK,
SHANMUGAM, & DINSTEIN, 1973), (RANGAYYAN, MUDIGONDA, & DESAUTELS,
2000) e definição de borda (RANGAYYAN R. M., 1997) (TÚLIO & RANGAYYAN,
2003). A partir daí, certas ferramentas específicas, também de natureza
computacional, são utilizadas na identificação da presença do câncer. Uma dessas
ferramentas é o classificador de características (features classifiers) (ESPÍRITOSANTO, 2004).
Neste tópico são apresentadas algumas referências dedicadas ao estudo dos
aspectos morfológicos, texturas, definição de borda e classificação de atributos.
Bruce e Adhami, em (1999), utilizam a transformada de ondulação na extração de
forma de massas contidas em mamografias. O estudo envolve 60 mamografias
segmentadas manualmente por radiologistas. Na determinação das formas são
usadas as técnicas fundamentadas em resoluções simples e múltiplas. As formas são
classificadas em circular, nodular ou tentacular, usando o Linear Discriminant Analysis
(LDA). A precisão das classificações usando resolução simples e múltiplas assumem
um valor de 83%. Usando somente resolução simples, a precisão diminui para 72%.
Chan (1995) explora a utilização de informações de texturas (atributo de mamografias
digitalizadas) na classificação de massas e tecidos normais de mamas. São utilizadas
168 regiões de interesse (ROI) com massas mamográficas e 504 ROI’s contendo
tecidos normais, massa benignas ou malignas. As informações de textura, calculadas
a partir das regiões são: correlação, entropia, energia, inércia, diferença inversa de
momento, soma dos momentos médios, soma das entropias e diferenças das
entropias. Os valores de área sob a curva Receiver Operating Characteristics (ROC)
(WOODS & BOWYER, 1997) encontrados são 0,84 e 0,82, respectivamente, para o
treino e teste com o conjunto de dados.
Polakowski (1997) examina o desenvolvimento de modelos típicos de visão
computacional para detectar massas mamográficas a partir do cálculo do tamanho,
da circularidade, do contraste e dos atributos de textura;. Utilizou uma base de dados
constituída de 53 casos benignos e 36 casos malignos. Massas malignas são
identificadas com uma precisão de 92%, com uma razão de falsos-positivos de 1,8
por imagem.
145
Rangayyan (2000) faz a descrição da morfologia de massas mamográficas e tumores
a partir da fração de concavidade e convexidade, Índice de forma espiculada (forma
tentacular), fator de compactação e informações de texturas (correlação, diferença de
momentos, entropia, inverso da diferença de momentos e segundo momento). Neste
trabalho são empregadas 54 imagens mamográficas contendo massas e tumores (28
casos benignos e 26 casos malignos). A classificação das massas e dos tumores é
feita via Rede Neural Feedforward - MLP. A melhor proporção de classificação entre
casos malignos e benignos encontrada tem valor 82,1%, com uma área sob a ROC
igual a 0,85.
Túlio (2003) estudou a classificação de massas mamográficas em malignas e
benignas a partir dos seguintes atributos de imagem: fatores de forma (compactação
- C, descrição de Fourier -f, concavidade fracionária - Fcc e Índice de forma espiculada
- SI), texturas (14 medições de texturas: correlação, entropia, energia, inércia,
diferença inversa de momento, soma dos momentos médios, soma das entropias,
diferenças das entropias, etc.) e definição de borda (acutance - Ac). Os atributos são
extraídos de 57 mamografias a partir das técnicas de dilatação e erosão dos contornos
das massas. São realizadas simulações (treinamento e teste da rede de classificação)
com diversas combinações dos atributos de imagem e observada a influência das
combinações na classificação das massas. As combinações utilizadas são: fatores de
formas entre si, fatores de forma e texturas, fatores de forma e acutance; texturas,
fatores de forma e acutance. A classificação dos atributos é feita em um perceptron e
em uma MLP. A precisão das classificações é comparada em termos da área Az sob
a ROC. Treinamentos com fatores de forma e textura proporcionam valores de Az de
até 0,99. É observado, contudo, que somente combinações de atributos que incluem
ao menos um fator de forma, independente da topologia da rede de classificação
empregada, produzem elevados valores de Az. A descrição das complexidades de
calcificações em mamografias a partir dos fatores de forma: Descrição de Fourier (f),
Momento (m) e Fator de compactação (C) é estudada por Shen e Rangayyan (1993).
As calcificações são classificadas em malignas e benignas utilizando uma Rede
Neural do tipo multlayer perceptron (MLP). No treinamento da rede (MLP) é utilizado
o procedimento leave-one-out. Empregando uma base de dados constituída de 64
calcificações benignas e 79 malignas (confirmadas por biópsia), encontra-se nos
experimentos uma taxa de detecção de calcificações de 81% (casos benignos) e
146
853% (casos malignos) e uma taxa de classificações corretas de 94% (casos
benignos) e 87% (casos malignos).
2.7.2.10 Classificação feita a partir de Redes Neurais feedforward (MLP)
Em CAD, um típico classificador de atributos de imagens é a MLP. Aqui, serão
apresentados alguns trabalhos em que essa abordagem é empregada em aplicações
médicas dedicadas ao diagnóstico do câncer de mama (ESPÍRITO-SANTO, 2004).
Yuzen (1993) treinou uma MLP de três camadas para interpretar atributos
mamográficos extraídos por radiologistas. No treinamento da MLP seram utilizadas 43
imagens clínicas bem distribuídas em termos de casos malignos e benignos. O
desempenho da MLP foi avaliado empregando-se a ROC. A área calculada sob a ROC
tem valor 0,95.
Kupinsk e Anastasi (1999) realizaram experimentos com a classificação de dados
sintéticos (os pesquisadores não utilizaram imagens médicas). A classificação dos
dados foi feita com uma MLP e com algoritmos evolutivos. Os desempenhos das duas
abordagens foram analisados e comparados em uma curva ROC.
2.7.2.11 Classificadores de múltiplos estágios (a família ART)
Pesquisando os classificadores com mais de um estágio (Redes Neurais de
classificação), encontramos Redes Neurais cujas arquiteturas são constituídas de dois
estágios. No trabalho publicado por Carpenter e Markuzon (1998), por exemplo, a
família dos classificadores de duplo estágio ARTMAP é empregada em treinamentos
supervisionados (HAYKIN S. , 1999), reconhecimento e predição de casos clínicos.
Nesse trabalho é feito um estudo sobre a aplicabilidade dos ARTMAP na resolução de
problemas relacionados com a predição feita a partir de base de dados médicos. Um
desses problemas é a inconsistência de casos, isto é, vetores de entrada idênticos
correspondendo a diferentes resultados à saída da rede de classificação. Os
resultados obtidos com a família ARTMAP são, nesse trabalho, comparados com
outras abordagens, quais sejam: regressão logística (HOWELL, 1992), modelo ADAP
(uma espécie de perceptron) (SMITH, 1962), KNN (DUDA & HART, 1973), algoritmo
não supervisionado CLASSIT (GENNARI, 1989), classificadores baseados em
147
exemplos IB1, IB2 e IB3 (AHA & ALBERT, 1998) e árvore de decisão C4 (QUINLAN,
1986). A base de dados utilizada nos estudos é constituída de um conjunto de casos
de Diabetes, adquiridos junto aos pesquisadores (SMITH J. W., 1988), um conjunto
de mamografias originárias da Universidade de Winconsin, um conjunto de dados do
Hospital do Coração de Vancouver e dados médicos fornecidos pelo Medcare
Cholecystectomy.
Também encontramos na literatura, estudos (treinamentos, testes
e
classificação) feitos com a rede ART2LDA (HADJIIK, 1999). Essa abordagem combina
os modelos de treinamento não supervisionado (primeiro estágio - rede ART2) e
supervisionado (segundo estágio – LDA). Tal estudo encontra justificativas em dois
aspectos fundamentalmente significativos nas implementações de classificadores de
populações. Um dos aspectos são as limitações dos classificadores mono-estágios
em lidar com populações não linearmente separáveis (é o caso dos Discriminantes
Lineares ou LDA). O outro é a baixa capacidade de generalização desses
classificadores quando poucos casos são disponíveis para o treinamento da rede
(implementações MLP, por exemplo). O estudo utiliza 348 mamografias contendo 169
massas benignas e 179 tumores malignos (confirmados por biópsia). A visibilidade das
massas ou dos tumores é feita por um radiologista que atribui notas entre 1 e 10 às
mamografias analisadas. Uma nota 1 atribuída, significa que a massa tem uma
aparência muito próxima de massas benignas. A curva ROC é empregada para avaliar
a precisão das classificações feitas. A área sob a ROC (Az) calculada para a rede
ART2LDA tem valor 0,81, enquanto que os valores de Az calculados para as redes
LDA e MLP são, respectivamente, 0,80 e 0,78.
2.7.2.12 Algoritmos evolutivos (EA’s)
Yao (1999) estuda os EA’s ou Algoritmos Evolutivos. Nesse estudo, EA’s são
elementos pertencentes a uma classe especial de algoritmos que são desenvolvidos
a partir dos fundamentos e princípios da evolução natural. Eles incluem estratégia
evolutiva (ES) (SCHWEFEL, 1981) programação evolutiva (EP) e algoritmos
genéticos. Uma importante característica de todos os EA’s é a estratégia aplicada em
populações. Indivíduos pertencentes a uma população competem e trocam
informações uns com os outros, objetivando a realização de certas tarefas.
148
2.7.2.13 Classificação feita a partir da rede RBF
Funções de Base Radial (RBF) podem aproximar de maneira arbitrária
qualquer função contínua de várias variáveis em um domínio compacto, contanto que
um número suficiente de funções radiais seja conhecido (HAYKIN S. , 1999). Em
outras palavras, toda função de várias variáveis pode ser representada em um espaço
em que os geradores são funções radiais, ou seja, as funções de várias variáveis são,
nesse espaço, representadas a partir da combinação linear de funções radiais
(geradores ou bases do espaço). Funções, quando assim representadas, permitem a
configuração de uma rede com camada de entrada, camada de saída e pontos de
conexão, ou seja: a rede RBF.
Haykin (1999) apresenta toda a descrição matemática das RBF como classificadores
de populações. Também nessa referência são considerados aspectos relativos à
teoria de regularização de redes RBF e formas de treinamento.
2.7.2.14 Otimização Combinatória
A resolução de problemas de otimização, sem a interferência desfavorável dos
mínimos locais, não é uma exclusividade dos algoritmos evolutivos. Em nossa
pesquisa bibliográfica encontramos uma outra abordagem que resolve problemas de
otimização, encontrando sempre a solução ótima (ou mínimo absoluto ou máximo
absoluto). Estamos falando do algoritmo Simulated Annealing. Tal algoritmo tem seus
fundamentos na otimização combinatória. Encontramos na referência bibliográfica
(HAYKIN S. , 1999) os fundamentos dessa abordagem, modelagem matemática e
sinalização para a possibilidade de a mesma poder ser empregada no treinamento de
Redes Neurais RBF. Em (WILLIAM, 1992) encontramos um algoritmo do método
Simulate Annealing (ESPÍRITO-SANTO, 2004).
Em (SOUZA S. J., 2001) o algoritmo Simulated Annealing é empregado no
treinamento de uma rede RBF a ser utilizada na recuperação de padrões de sinais de
telecomunicações. Nos estudos feitos em (WILSON, 1991), a presente abordagem é
149
utilizada no treinamento de uma Rede Neural cujo objetivo é encontrar o ponto ótimo
de conectividade da rede para um número constante de entradas que apresentam
pesos (ligações sináptica) fixos. Nesse trabalho, a rede é treinada de uma maneira
diferente da usual, isto é: em lugar de procurar pelos pesos sinápticos ótimos para
pontos de conectividade fixos, pesquisa-se os pontos de conectividade ótima com
pesos fixos.
150
CAPÍTULO 3 – MATERIAIS E MÉTODO
Os recursos utilizados se fundamentam na utilização de métodos e ferramentas
necessários ao cumprimentos das fases do ciclo de desenvolvimento de um software.
3.1 Recursos específicos aplicados ao desenvolvimento
3.1.1 Hardware
Por se tratar de um projeto de construção de software1 sem vínculos com outros
dispositivos, o hardware utilizado se limita ao computador onde o processo de
modelagem, codificação, armazenamento dos dados e testes serão realizados.
Computador portátil, modelo Acer Aspire 5738-6294 (FIGURA 47).

Processador Intel Core 2 Duo T6600, 2.2 GHz, 800 MHz FSB.

Memória RAM de 3GB, DDR 3 1033 MHz.

Disco Rígido de 320 GB SATA 5400 rpm.

Drive Optico DVD Super Multi DL drive.

Tela de 15.6” polegadas Widescreen (WXGA) com tecnologia
CrystalBrite Full HD.

3 GB de Memória RAM.

Placa de Vídeo NVIDIA, com memória de vídeo de 128 MB dedicada.

Áudio com sistema de som com alto-falantes integrados.

Teclado em Português com tecla ç (Padrão ABNT2) com Teclado
numérico.
1

Apontador (Mouse) TouchPad eletrostático.

Fax/Modem de alta velocidade de 56Kbps (RJ-11).

Placa de Rede 10/100 Mbps Ethernet LAN (RJ-45).

Conexão sem fio (WIFI) 802. 11b/g Wireless LAN.
O software é a parte lógica, o conjunto de instruções e dados processados pelos circuitos eletrônicos do hardware.
151

Câmera de Vídeo, Webcam de 2.0 Megapixels integrada com
microfone embutido.

Entradas e Saídas: 04 x Portas USB 2.0, 01 x Saída VGA para
Monitores (15 pinos), 01 x Saída TV-Out (S-video) para Televisores, 01
x RJ-11 (modem), 01x RJ-45 (rede), 01 x HDMI, 01 x Entrada FireWire i
LINK IEEE-1394 (4 pinos), 01 x Entrada de Microfone Externo, 01 x
Saída para Fone de Ouvido ou Alto Falantes Externos, 01 x Entrada de
Energia (AC-IN).

Portas de Expansão, Suporte para Express Card

Leitor de Cartão de Memória; 5-em-1 com suporte para Secure Digital
cards MultiMedia cards, Memory Stick, Memory Stick Pro xD Picture

Dimensões de 38,0 cm (Largura) x 25,7 cm (Profundidade) x 2,6 cm
(Altura).

Peso de 2,9 Kg.

Alimentação, fonte bivolt (100 / 240 V).

Bateria com células de íons de lítion recarregável.
Figura 47: Acer Aspire 5738-6294 (Fonte: Acer Inc.)
3.1.2 Sistema Operacional
No computador utilizado estão instalados as versões Windows 7.0 Ultimate e
Windows XP com Service Pack 3 ambos da empresa Microsoft e as distribuições
152
Debian 6.0 e Ubuntu 12.10 do Linux.
O ambiente formado pela plataforma Microsoft adota como premissa o
pagamento pela utilização do software, enquanto que a plataforma Linux adota como
premissa o software livre2. Opções de desenvolvimento:
1.
Sistema Operacional
Linux,
Linguagem
de Programação Java
(Ferramenta de desenvolvimento - Eclipse) e Banco de Dados MySQL
ou Oracle.
2.
Sistema Operacional Windows XP ou Windows 7, Linguagem de
programação Object Pascal (Ferramenta de desenvolvimento - Delphi
RAD Studio XE2) e Banco de Dados Oracle ou Access.
Pela produtividade e facilidade de implementação da ferramenta Delphi RAD
Studio XE2 optei pela segunda opção. A única premissa que resolvi adotar foi manter
a compatibilidade entre o Windows XP e Windows 7. Para a versão do protótipo
também optei pelo Access.
3.1.3 Ferramenta para modelagem de banco de dado
A ferramenta CA Erwin Model Navigator versão 7.3, permite o desenvolvimento
do modelo do banco de dados lógico e físico gerando os scripts necessários à
construção das estruturas de bancos de dados.
3.1.4 Ferramenta para modelagem de negócio
A ferramenta Bizagi Modeler versão 2.4.0.8 permite o desenvolvimento do
modelo de negócio da aplicação gerando modelos de fácil entendimento.
2
Software Livre é o conceito de se disponibilizar um software para uso, com acesso ao seu código fonte para consulta ou
alteração, mediante autorização do seu proprietário.
153
3.1.5 Ferramenta para modelagem UML3
A ferramenta astah versão 6.0.1 permite o desenvolvimento da modelagem dos
diagramas presentes na Linguagem de Modelagem Unificada (UML).
3.1.6 Ferramenta para dados estáticos
IBM SPSS Statistics permite o gerenciamento de dados e cálculos estatísticos.
3.1.7 Metodologia aplicada ao desenvolvimento
Para o desenvolvimento do classificador, utilizou-se de pesquisa bibliografia e
de pesquisa de laboratório, uma vez que se trata de verificar o desempenho e
cumprimento dos objetivos estabelecidos por meio de controle das variáveis que
servem de parâmetro para o seu desenvolvimento.
O objetivo da pesquisa de laboratório é a própria aplicação desenvolvida, dentro
da qual somente os itens que não correspondem às variáveis-parâmetros devem ser
observados e não serão controlados, mas sim verificados.
3.1.8 Modelagem de Negócio
A partir do levantamento dos requisitos definiu-se que o software seria formado
por dois módulos principais, subdivididos em outros cinco módulos (figura 48):
Figura 48: Modelo de Processo de Negócio Macro do Classificador Paraconsistente (construído
pelo autor).
3
UML (Unified Modeling Language), linguagem visual utilizada para modelar sottwares baseados no paradigma de orientação
a objetos
154
RNAP
Descrição
O processo RNAP será responsável por definir a forma como os atributos de imagens
mamográficas serão classificados pela Rede Neural Artificial Paraconsistente e pela
qualidade das classificações geradas.
Calcificação
Descrição
O subprocesso Calcificação será divido em cadastramento de amostras, treinamento
da Rede Neural Artificial Paraconsistente e Classificação de novas amostras que
deverão ser comparadas ao padrão aprendido pela RNAP.
Massas Mamográficas e Tumores
Descrição
O subprocesso Massas Mamográficas será divido em cadastramento de amostras,
treinamento da Rede Neural Artificial Paraconsistente e Classificação de novas
amostras que deverão ser comparadas ao padrão aprendido pela RNAP.
Análise de Desempenho
Descrição
O subprocesso Análise de Desempenho terá como função monitorar a qualidade e o
desempenho das classificações realizadas.
Exame
Descrição
O processo Exame será subdivido em Laudo e Auditoria
Laudo
Descrição
O subprocesso Laudo deverá receber os dados pessoais da paciente, os dados de
identificação da unidade radiológica, o número do exame, os dados de Anamnese,
descrição de achados radiológicos, classificação radiológica, recomendações de
procedimentos, os dados do técnico e do médico envolvido no processo de realização
do exame de mamografia. Este módulo também de ser capaz de interagir com o
módulo RNAP para que o software possa classificar possíveis anormalidades, tais
155
como: calcificações, massas mamográficas e tumores. O médico após a coleta de
dados poderá gerar o laudo com as recomendações que julgar necessárias.
Auditoria
Descrição
O subprocesso Auditoria será responsável por monitorar o desempenho dos laudos
gerados.
A FIGURA 49 representa o processo geral de classificação do Classificador.
156
Figura 49: Processo Geral de Classificação do Classificador Paraconsistente (construído pelo autor).
O processo descrito pela FIGURA 49 será semelhante aos processos de
157
classificação para calcificações, massas mamográficas e tumores.
A diferença está na quantidade de atributos de imagens utilizados e no valor de
alguns atributos de textura que são maiores que o intervalo compreendido entre zero
e um.
Para o caso dos atributos de textura maiores que um se adotou como estratégia
a implementação de um método capaz de realizar a normalização de todos os
elementos correspondentes a esse atributo, ou seja, dividir todos os atributos pelo
maior deles, dessa forma todos os elementos serão redimensionados a faixa
compreendida por zero e um.
Uma inovação no processo de decisão foi à implementação de um método
capaz de balizar os valores resultantes das classificações (FIGURA 56). O
classificador passara a se equalizar de tal forma que as novas classificações serão
mais confiáveis.
Analisando os valores resultantes das classificações foi notado que os valores
Benignos na grande maioria são maiores que os valores Malignos. Nesses casos, o
resultado esta determinado (FIGURA 50).
BENIGNOS
Linha de
Corte
Central
MALIGNOS
Figura 50: Região bem definida entre Benignos e Malignos (construído pelo autor).
Porém nas situações que os valores Malignos ou Benignos atravessam a linha
de corte, o resultado mais acertado seria Indefinido.
O algoritmo de Balanceamento proposto indica uma tendência de o valor
resultante da classificação ser Maligno ou Benigno, dando uma orientação ao médico
radiologista de um provável resultado (FIGURA 51).
158
Passo 1: Classificação no modo Balanceamento de pelo menos dois conjuntos
de amostras Benignos.
Passo 2: Classificação no modo Balanceamento de pelo menos dois conjuntos
de amostras Malignas.
Passo 3: Identificação do Menor valor resultante Benigno.
Passo 4: Identificação do Maior valor resultante Maligno.
Passo 5: Tira-se a média aritmética entre os dos valores resultantes, o resultado
será o novo valor de corte.
Como existe uma distância relevante entre o valor médio obtido e os valores
resultantes Benignos e Malignos.
Passo 6: Repete-se o processo novamente na busca de dois novos valores de
corte.
Tira-se a média aritmética entre o maior Maligno e o Valor de Corte obtido
no Passo 5, resultando em um valor de corte intermediário superior.
Tira-se a média aritmética entre o menor Benigno e o Valor de Corte
obtido no Passo 5, resultando em um valor de corte intermediário inferior.
O resultado a partir de agora, será:
1. Entre o Maior Maligno e o Valor de Corte Superior, 75% para
Benigno.
2. Entre o Menor Benigno e o Valor de Corte Inferior, 75% para
Maligno.
3. Entre o Valor de Corte Superior e o Valor de Corte, tendendo a
Benigno.
4. Entre o Valor de Corte Inferior e o Valor de Corte, tendendo a
Maligno.
159
Linha de Corte
Superior
Linha de
Corte
Central
Linha de Corte
Inferior
Figura 51: Linha de Balizamento do Classificador (construído pelo autor).
A utilização do método de balizamento (FIGURA 52) pelo processo de
classificação reduz a região de conflito, melhorando o acerto de Benignos e Malignos.
Como será visto no capítulo 4.
Figura 52: Resultado apresentado como 75% para Benigno e valores de balizamento
(construído pelo autor).
O processo Geral de Classificação foi subdivido em três subprocessos:
Cadastro de Amostras, Treinamento da RNAP e Classificação de uma nova amostra.
160
Para efeito de implementação os 20 atributos de imagens (Capítulo 2) presentes na
Base de Dados 1 (Apêndice A) e na Base de Dados 2 (Apêndice B) foram subdivididos
em conjuntos:
I.
Calcificação (m, C, f)
II.
Série 1 (Ac, C, f, Fcc, Si, F1, F2, F3, F4, F5, F6, F7, F8, F9, F10, F11, F12)
III.
Série 2 (C, Fcc, Si)
IV.
Série 3 (C, f, Fcc, Si)
V.
Série 4 (Ac, C, f, Fcc, Si)
VI.
Série 5 (F1, F2, F3, F4, F5, F6, F7, F8, F9, F10, F11, F12)
VII.
Série 6 (Ac, C, Fcc, Si, F3, F5)
VIII.
Série 7 (Ac, C, Fcc, Si, F1, F2, F4)
Neste ponto do trabalho é necessário um esclarecimento. A opção de se dividir
os conjuntos de atributos em séries se deve a dificuldade do classificador RBFSimulated Annealing desenvolvido no doutorado que deu origem a esse trabalho em
treinar a sua rede, o tempo exigido é elevado e a utilização de muitas dimensões
(atributos de imagens) para treinamento praticamente inviabiliza o processamento
(ESPÍRITO SANTO R. , 2004). A Série 1, não pode ser implementada no classificador
RBF-Simulated Annealing, portanto, no capítulo 4, não será possível comparar o
desempenho do Classificador Paraconsistente com os classificadores testados no
trabalho anterior.
A simplicidade dos algoritmos desenvolvidos pelas RNAP permitiu que o
atributos de imagens da Série 1 fossem implementados com sucesso, como descrito
no capítulo 4.

Subprocesso: Cadastro de Amostras
A função deste módulo é armazenar um conjunto de amostras que
serão utilizadas como base para o treinamento da RNAP, onde
será definido um novo conjunto de amostras resultantes do
treinamento. As amostras resultantes conterão o padrão
161
aprendido pela rede. A FIGURA 53 representa o cadastramento
de amostras da Série 6 (Massas Mamográficas e Tumores)
Figura 53: Cadastro de Amostras – Série 6 (Massas Mamográficas e Tumores) (construído pelo
autor).

Subprocesso: Treinamento da RNAP
A função deste módulo é definir um comportamento padrão que
possa ser utilizado como comparação com novas amostras. O
treinamento da rede pode ser realizado a partir de um conjunto de
amostras Benignas, Malignas ou Benignas e Malignas. A figura 9
apresenta um conjunto de amostras Benignas da Série 6 que
passaram pelo treinamento. A FIGURA 54 apresenta o padrão
aprendido, para a Série. Para cada atributo de imagem haverá um
treinamento particular. Para três atributos de imagens, serão três
células de aprendizagem para cada conjunto de amostras. Para
doze atributos de imagens, serão 12 células neurais de
aprendizagem para cada conjunto de amostras (FIGURA 55).
162
Figura 54: Treinamento da Série 6 (Massas Mamográficas e Tumores) para amostras Benignas
(construído pelo autor).
Figura 55: Padrão Aprendido – Série 6 (Massas Mamográficas e Tumores) (construído pelo
autor).
163

Subprocesso: Classificação
A função deste módulo além de obter um valor resultante do
processamento da rede capaz de determinar se uma nova
amostra é Benigna ou Maligna deve exibir a qualidade ou
confiabilidade
da
classificação
através
do
cálculo
da
Sensibilidade, Especificidade, Valor Preditivo Positivo, Valor
Preditivo Negativo, Razão de Verossimilhança Positivo, Razão de
Verossimilhança Negativo e Acurácia. Além das quantidades de
Verdadeiros Positivos, Falsos Positivos, Verdadeiros Negativos e
Falsos Negativos. A FIGURA 56 apresenta a classificação para
Balizamento da amostra da Base de Dados 2 (Apêndice B).
Figura 56: Balizamento de uma amostra Benigna - Série 6 (Massas Mamográficas e Tumores)
(construído pelo autor).
164
A FIGURA 57 apresenta a classificação para Análise da amostra
57 da Base de Dados 2 (Apêndice B).
Figura 57: Resultado Maligno de uma classificação bem sucedida (construído pelo autor).
3.1.9 Desenvolvimento
Para o desenvolvimento do classificador foi utilizada orientação a objetos
associada a dois padrões de projeto, o MVC (Model-View-Controller) e o DAO (Data
Access Object).
3.1.10 Orientação a Objetos
O termo “orientação a objetos” significa que o software será organizado como
uma coleção de objetos distintos, que incorporam estrutura de dados e
comportamento. Um sistema orientado a objetos possui pelo menos quatro
características: identidade, classificação, herança e polimorfismo (RUMBAUGH &
BLAHA, 2006).

Identidade: os dados são quantizados em entidades distintas e
distinguíveis, chamadas objetos. Dois objetos são distintos mesmo que
todos os seus valores de atributos sejam idênticos.
165

Classificação: os objetos com a mesma estrutura de dados (atributos) e
comportamento (operações) são agrupados em uma classe. Uma classe
é uma abstração que descreve propriedades importantes para uma
aplicação e ignora as demais.

Herança: é o comportamento de atributos e operações entre classes
com base em um relacionamento hierárquico.

Polimorfismo: a mesma operação pode se comportar de forma diferente
para diferentes classes.
3.1.11 Padrões de Projeto
Todo projeto de desenvolvimento é de alguma maneira, novo, na medida em que
se quer desenvolver um novo sistema, seja porque ainda não existe um sistema para
resolver o problema que está sendo tratado, seja porque há aspectos indesejáveis
nos sistemas existentes. Isso não quer dizer que o projeto tenha que ser desenvolvido
a partir do zero. Muito pelo contrário. A reutilização é um aspecto fundamental no
desenvolvimento de software. Muitos sistemas previamente desenvolvidos são
similares ao sistema em desenvolvimento e há muito conhecimento que pode ser
reaplicado para solucionar questões recorrentes no projeto de software. Os padrões
(patterns) visam capturar esse conhecimento, procurando torná-lo mais geral e
amplamente aplicável, desvinculando-o das especificidades de um determinado
projeto ou sistema. Um padrão é uma solução testada e aprovada para um problema
geral (GAMMA, 2000).
Um padrão já foi cuidadosamente considerado por outras pessoas e aplicado
diversas vezes na solução de problemas anteriores de mesma natureza. Assim, tende
a ser uma solução de qualidade, com maiores chances de estar correto e estável do
que uma solução nova, específica, ainda não testada (BLAHA; RUMBAUGH, 2006).
3.1.12 MVC (Model-View-Controller)
Padrão de arquitetura que considera três papéis relacionados à interação
homem-computador, ou seja, indica como deve ser a organização global do sistema
(FOWLER, 2003 (A)).
166

Model ou modelo: se refere aos objetos que representam alguma
informação sobre o negócio, ou seja, as classes do domínio da
aplicação.

View ou visão: se refere à entrada e a exibição de informações na
interface de usuário (IU).

Controller ou controle: correspondem as classes que conectam o modelo
à visão. Este pega a entrada do usuário, envia uma requisição para a
camada de lógica de negócio, receber sua resposta e solicita que a visão
se atualize.
O padrão indica que as classes do modelo não devem conhecer as classes da
visão. Isso diminui o acoplamento entre estes componentes resultando em uma maior
independência das camadas, como resultado é possível se trocar a IU, de modo
gráfico para texto, de ambiente desktop para web, etc., sem afetar as classes modelo.
De maneira análoga, as classes da IU não devem implementar regras de negócio.
As classes de controle representam o mecanismo de interligação entre as
classes da IU e as classes do modelo. São responsáveis pelo encapsulamento dos
objetos garantindo um baixo acoplamento. Essa característica permite modificações
nas classes participantes de forma independente. De forma particular a classe de
controle contém tipicamente informações de sequenciamento das operações. Essas
classes não devem executar tarefas que pertençam às classes visão e modelo
(FOWLER, 2003 (A)).
3.1.13 DAO (Data Access Object)
O padrão DAO define uma interface de operações de persistência, incluindo
métodos para criar, recuperar, alterar, excluir e diversos tipos de consulta, relativa a
uma particular entidade persistente, agrupando o código relacionado à persistência
daquela entidade (BAUER, 2007).
Oferece uma interface comum de acesso a dados escondendo as
características específicas, o que permite se definir uma interface que pode ser
construída para cada nova fonte de dados, viabilizando a substituição de uma
implementação por outra (BAUER, 2007).
167
3.1.14 Arquitetura utilizada no Classificador Paraconsistente
A proposta do Classificador Paraconsistente é poder ser utilizado de forma real,
pelos médicos envolvidos no processo de diagnóstico do câncer de mama a partir de
mamografias. Para tanto, o classificador deve estar disponível nas mais variadas
plataformas.
A arquitetura definida para o protótipo do classificador caminha nesta direção,
pois permite que se criem novas IU, sem a necessidade de alteração da parte crucial
do classificador.
O armazenamento dos dados também pode ser migrado para outros bancos
de dados sem a necessidade de grandes alterações no classificador.
As camadas de banco de dados e IU, não afetam a estrutura principal do
classificador.
A FIGURA 58 representa a arquitetura do Classificador Paraconsistente que
utiliza os padrões de projetos, MVC e DAO associados.
Figura 58: Arquitetura – Classificador Paraconsistente (construído pelo autor).
168
3.1.15 Arquitetura RNAP
A FIGURA 59 representa a arquitetura da RNAP empregada no Classificador
Paraconsistente. Para cada atributo de imagem o processo se repetirá. No caso
particular da Série I que contém 17 atributos de imagens ou dimensões, haverá uma
RNAP para cada atributo, onde cada RNAP ao seu final apresentará um valor
resultante. A decisão final será tomada a partir dos 17 valores resultantes.
Figura 59: Arquitetura da RNAP (construído pelo autor).
169
3.1.16 Diagrama de Sequência – RNAP
A FIGURA 60 representa a sequência de eventos do processo de
cadastramento das amostras que servirão de base para o aprendizado da RNAP. Para
efeito ilustrativo tomei como base o processo formado pelos atributos de forma:
momento (m), compactação (C) e descrição de fourier (f) para a classificação de
calcificações em benignas ou malignas
Figura 60: Diagrama de Sequência - Cadastro de Amostras (construído pelo autor).
170
A FIGURA 61 representa a sequência de eventos do processo de treinamento
da RNAP.
Figura 61: Diagrama de Sequência - Treinamento da RNAP (construído pelo autor).
A FIGURA 62 representa a sequência de eventos do processo de classificação
da RNAP.
171
Figura 62: Diagrama de Sequência - Classificação da RNAP (construído pelo autor).
3.1.16.1
Modelo Entidade Relacionamento – RNAP
No processo de classificação dos atributos de imagens os dados são
armazenados em tabelas de banco de dados, representadas pelo Modelo Entidade
172
Relacionamento da FIGURA 63. Para o caso particular das calcificações são utilizadas
cinco
tabelas:
CALCIFICACAO_01
para
o
cadastro
de
amostras,
CALCIFICACAO_PADRAO_APRENDIDO_02 para o cadastro das amostras com o
padrão aprendido, TIPO_03 para se definir se a amostra é Benigna ou Maligna,
PREVISAO_BIOPSIA_08 para se definir se o resultado esperado é Benigno, Maligno
ou Indefinido, TIPO_CLASSIFICACAO_07 para se definir se a classificação é de
Balizamento ou Análise e a tabela AUDITORIA_SAIDA_CLASSIFICACAO_09 que
armazena o resultado da classificação e as medidas de qualidade de cada
classificação.
Para os casos de massas mamográficas e tumores são utilizadas sete tabelas:
MASSA_05 para o cadastro de amostras, MASSA_PADRAO_APRENDIDO_06 para
o cadastro das amostras com padrão aprendido, para se definir se a amostra é
Benigna ou Maligna, PREVISAO_BIOPSIA_08 para se definir se o resultado esperado
é Benigno, Maligno ou Indefinido, TIPO_CLASSIFICACAO_07 para se definir se a
classificação é de Balizamento ou Análise, SERIE_04 para se definir qual das sete
séries
disponíveis
será
classificada
AUDITORIA_SAIDA_CLASSIFICACAO_09
que
e
armazena
classificação e as medidas de qualidade de cada classificação.
a
o
tabela
resultado
da
173
Figura 63: Modelo Entidade Relacionamento – RNAP (construído pelo autor).
174
CAPÍTULO 4 – Testes Comparativos
O estudo comparativo entre o Classificador Paraconsistente e os estudos
desenvolvidos em (ESPÍRITO SANTO R. , 2004) vão levar em consideração os
conjuntos de atributos mamográficos utilizados nos testes originais, com algumas
exceções.
1. No trabalho original não foi possível utilizar todos os atributos
mamográficos disponíveis para massas mamográficas e tumores. Para o
Classificador Paraconsistente não houve problema, portanto, para este
teste só haverá resultados do Classificador Paraconsistente.
2. Os classificadores utilizados anteriormente necessitavam de uma
quantidade de amostras para treinamento maior que o número de
amostras
necessárias
para
o
treinamento
com
o
Classificador
Paraconsisnte, portanto, o Classificador Paraconsistente utilizará um
número menor de amostras para treinamento.
4.1 Conjuntos de Atributos Mamográficos utilizados nos testes
Para a base de dados BD1 não houve necessidade de se criar conjuntos de
atributos, portanto, foram utilizados os atributos (m, C e f) com todas as 143
ocorrências.
Para o conjunto de dados BD2 houve a necessidade de se criar conjuntos de
atributos:

Apenas para o Classificador Paraconsistente utilizou-se um conjunto com os
17 atributos de imagens.

Conjunto C1: Três fatores de forma (C, Fcc e SI);

Conjunto C2: Quatro fatores de forma (C, Fcc, Si e,f);

Conjunto C3: Quatro fatores de forma (C, Fcc Si, FF) e a Acutance (Ac);
175

Conjunto C4: Doze informações de textura (F1-F5, contraste-F6, energia-F7,
soma das variâncias-F8, diferença das variâncias-F9, diferença da entropiasF10, segundo momento-F11, máxima correlação-F12);

Conjunto C5: Três fatores de forma (C, Fcc e SI), Acutance (Ac) e duas medidas
de textura (F3 e F5).

Conjunto C6: Três fatores de forma (C, Fcc e SI), Acutance (Ac) e três medidas
de textura (F1, F2 e F4).
4.2 Caracterização dos atributos de imagens
Os atributos existentes nas mamografias são os elementos empregados na
caracterização das calcificações, das massas mamográficas e dos tumores. Neste
trabalho, a complexidade das calcificações (se são benignas ou malignas) é estudada
a partir do cálculo dos fatores de forma m. f e c. A definição e os modelos matemáticos
de recorrência destes fatores são examinados no capítulo 2. As massas mamográficas
e os tumores são identificados e discriminados (em benignas e malignas)
determinando-se os valores de C, f, Fcc, SI (fatores de forma), Ac (parâmetro que
depende do cálculo do gradiente) e algumas medidas de texturas (F1-F5 e F6-F12).
As definições e os modelos dos parâmetros que caracterizam as massas
mamográficas e os tumores podem ser encontrados no capítulo 2.
4.3 Métodos de treinamento e teste dos classificadores
Para os classificadores estudados anteriormente (ESPÍRITO SANTO R. , 2004)
os treinados e testes com as bases de dados descritas anteriormente, considerandose os subconjuntos de dados em que elas possam ser particionadas (quando for o
caso) e as diferentes topologias das redes. Para percebermos a capacidade de
generalização dos classificadores, isto é, a precisão em diagnosticar (classificar)
casos não previstos nos treinamentos, foram adotados nas simulações o
176
procedimento leave-one-out (também conhecido com método round-robin). Neste
procedimento, todos os casos da base de dados, exceto um, são utilizados no
treinamento da rede do classificador. O único caso deixado de fora do treinamento
(leave-one-out) é empregado no teste do classificador.
4.4 Testes Comparativos
Para quantificar a qualidade dos testes utilizou-se a curva ROC (Capítulo 2). A
exatidão de um teste diagnóstico é proporcional à área sob esta curva ROC (AUC),
isto é, ela será tanto maior quanto mais a curva se aproximar do canto superior
esquerdo do diagrama. Em virtude disso, a curva terá uma exatidão maior quanto
maior for a sua área. O valor da área igual a 1 representa um teste perfeito; a área
igual a 0,5 representa um valor sem importância (Tabela 3) (SOUZA P. R., 2009).
Tabela 3: Qualidade do diagnóstico em relação à área da curva ROC (SOUZA P. R., 2009)
Área (AUC)
Qualidade de Diagnóstico
0,9 a 1,0
Excelente
0,8 a 0,9
Bom
0,7 a 0,8
Regular
0,6 a 0,7
Ruim
0,5 a 0,6
Insignificante
Para o entendimento do gráfico, da curva ROC, quanto maior a sensibilidade
maior a ocorrência de acertos de casos malignos e quanto maior a especificidade
maior a ocorrência de acertos de casos benignos.
177
4.5 Testes utilizando a base de dados BD1
Para o teste com atributos de forma para a classificação de calcificações foram
utilizadas 21 amostras para o treinamento da RNAP e 122 para classificação. Base
de dados utilizada BD 1 (Apêndice A).
O gráfico 1 esboça a exatidão do teste 1.
Gráfico 1: Resultado do teste com atributos de forma para calcificação (construído pelo autor).
Tabela 4 : Área sob a curva ROC para o teste 1 (construído pelo autor).
Asymptotic 95% Confidence
Interval
Area
,986
Std. Errora
,017
Asymptotic Sig.b
,000
Lower Bound
,000
Upper Bound
1,000
178
Levando-se em consideração que a área sob a curva ROC foi de 0,986 o teste
segundo a tabela 3 pode ser considerado excelente.
4.6 Testes utilizando a base de dados BD2
Para todos os cojuntos (C1 a C6) e para a série composta por todos os atributos
de imagens foram utilizadas para treinamento da RNAP 21 amostras e outras 36 foram
utilizadas para classificação. Base de dados utilizada BD 2 (Apêndice B).
4.6.1 Teste com todos os atributos de imagens mamográficas para massas e
tumores
O gráfico 2 esboça a exatidão do teste 2.
Gráfico 2: Resultado do teste com todos os atributos de imagens para massas mamográficas e
tumores (construído pelo autor).
179
Tabela 5: Área sob a curva ROC para o teste 2 (construído pelo autor).
Asymptotic 95% Confidence
Interval
Area
,938
Std. Errora
Asymptotic Sig.b
,037
,000
Lower Bound
Upper Bound
,844
1,000
Levando-se em consideração que a área sob a curva ROC foi de 0,938 e que
em boa parte do teste a sensibilidade se manteve igual a 1,0 o teste segundo a tabela
3 pode ser considerado excelente.
4.6.2 Teste com os atributos de imagens do conjunto C1
O gráfico 3 esboça a exatidão do teste 3.
Gráfico 3: Resultado do teste com atributos de imagens para massas mamográficas e tumores,
conjunto C1 (construído pelo autor).
180
Tabela 6: Área sob a curva ROC para o teste 3 (construído pelo autor).
Asymptotic 95% Confidence
Interval
Area
,939
Std. Errora
Asymptotic Sig.b
,092
,175
Lower Bound
Upper Bound
,000
1,000
Levando-se em consideração que a área sob a curva ROC foi de 0,939 e que
a sensibilidade foi aumentando progressivamente até quase 1,0 o teste segundo a
tabela 3 pode ser considerado excelente.
4.6.3 Teste com os atributos de imagens do conjunto C2
O gráfico 4 esboça a exatidão do teste 4.
Gráfico 4: Resultado do teste com atributos de imagens para massas mamográficas e tumores,
conjunto C2 (construído pelo autor).
181
Tabela 6: Área sob a curva ROC para o teste 4(construído pelo autor).
Asymptotic 95% Confidence
Interval
Area
,935
Std. Errora
,081
Asymptotic Sig.b
,068
Lower Bound
Upper Bound
,000
1,000
Levando-se em consideração que a área sob a curva ROC foi de 0,935 e que
apesar da sensibilidade ter demorado a atingir um ponto de equilíbrio próximo a 1,0
segundo a tabela 3 o teste pode ser considerado excelente.
4.6.4 Teste com os atributos de imagens do conjunto C3
O gráfico 5 esboça a exatidão do teste 5.
Gráfico 5: Resultado do teste com atributos de imagens para massas mamográficas e tumores,
conjunto C3 (construído pelo autor).
Tabela 7: Área sob a curva ROC para o teste 5 (construído pelo autor).
Asymptotic 95% Confidence
Interval
Area
,875
Std. Errora
,135
Asymptotic Sig.b
,245
Lower Bound
,000
Upper Bound
1,000
182
Levando-se em consideração que a área sob a curva ROC foi de 0,875 e que
a sensibilidade foi aumentando progressivamente até quase 1,0 o teste segundo a
tabela 3 pode ser considerado bom.
4.6.5 Teste com os atributos de imagens do conjunto C4
O gráfico 6 esboça a exatidão do teste 6.
Gráfico 6: Resultado do teste com atributos de imagens para massas mamográficas e tumores,
conjunto C5 (construído pelo autor).
Tabela 8: Área sob a curva ROC para o teste 6(construído pelo autor).
Asymptotic 95% Confidence
Interval
Area
,500
Std. Errora
,143
Asymptotic Sig.b
1,000
Lower Bound
,219
Upper Bound
,781
183
Levando-se em consideração que a área sob a curva ROC foi de 0,500 e que
a sensibilidade é igual a especificidade o teste segundo a tabela 3 pode ser
considerado insignificante.
4.6.6 Teste com os atributos de imagens do conjunto C5
O gráfico 7 esboça a exatidão do teste 7.
Gráfico 7: Resultado do teste com atributos de imagens para massas mamográficas e tumores,
conjunto C5 (construído pelo autor).
Tabela 9: Área sob a curva ROC para o teste 7(construído pelo autor).
Asymptotic 95% Confidence
Interval
Area
,929
Std. Errora
,094
Asymptotic Sig.b
,007
Lower Bound
,000
Upper Bound
1,000
Levando-se em consideração que a área sob a curva ROC foi de 0,929 e que
apesar da sensibilidade ter demorado a atingir um ponto de equilíbrio próximo a 1,0
segundo a tabela 3 o teste pode ser considerado excelente.
184
4.6.7 Teste com os atributos de imagens do conjunto C6
O gráfico 8 esboça a exatidão do teste 8.
Gráfico 8: Resultado do teste com atributos de imagens para massas mamográficas e tumores,
conjunto C6 (construído pelo autor).
Tabela 9: Área sob a curva ROC para o teste 8(construído pelo autor).
Asymptotic 95% Confidence
Interval
Area
,939
Std. Errora
,092
Asymptotic Sig.b
Lower Bound
,175
,000
Upper Bound
1,000
Levando-se em consideração que a área sob a curva ROC foi de 0,939 segundo
a tabela 3 o teste pode ser considerado excelente.
185
CAPÍTULO 5 – AVALIAÇÃO DOS RESULTADOS
Neste capítulo serão examinados os resultados encontrados nas simulações
(treinamentos e testes) com MLP, ART2LDA, RBF - Simulated Annealing e
Classificador Paraconsistente. O objetivo deste capítulo é, pois, verificar (estudar) a
habilidade de cada um dos classificadores em reconhecer atributos mamográficos
benignos e malignos. As bases de dados empregadas nas simulações são, conforme
mencionado no capítulo 4, BD1 e BD2. BD1 é constituída de calcificações,
representada por 143 fatores de forma (m, c e f), contendo 64 casos benignos e 79
casos malignos. BD2 contém múltiplos atributos mamográficos (C, FC, FF, SI, Ac e
F1-F12), particionados em 6 grupos de treinamento e testes, isto é:
C1: Três fatores de forma - C, Fc e SI;
C2: Quatro fatores de forma - C, Fc Si e FF;
C3: Quatro fatores de forma e a Acutance - C, Fc Si, FF, Ac;
C4: Doze informações de textura F1-F12;
C5: Três fatores de forma, Acutance e duas medidas de textura - C, Fc, SI, Ac,
F3 e F5;
C6: Três fatores de forma, Acutance e três medidas de textura - C, Fc, SI, Ac,
F1, F2 e F4.
Para o Classificador Paraconsistente houve o 8° teste composto por todos os atributos
de massas mamográficas e tumores.
5.1 Resultados dos experimentos com BD1
Os resultados das áreas das curvas ROC dos classificadores MLP, ART2LDA e
RBF-Simulated Annealing foram extraídos de (ESPÍRITO SANTO R. , 2004). A tabela
10 apresenta os resultados dos testes de classificação de calcificações utilizando
fatores de forma.
186
Tabela 10: Resultados obtidos nos testes de classificação de calcificações
Classificadores MLP
ART2LDA
RBF-
Classificador
Simulated
Paraconsistente
Annealing
Az
0,70
0,696
0,986
0,94
5.2 Resultados dos experimentos com BD2
As simulações com a base de dados BD2 permitiram não só a observação do
desempenho dos classificadores em classificar os casos exemplos (fatores de forma,
definição de borda e indicações de textura) em benignos ou malignos, mas também
selecionar dentre os diversos conjuntos de dados (C1 a C6) em que BD2 foi
particionada, qual os mais recomendados para o diagnóstico de câncer de mama. Os
experimentos com BD2 podem ser resumidos da seguinte maneira:
Tabela 11: Resultados obtidos nos testes de classificação de massas mamográficas e tumores
Conjunto de dados
Az(LDA)
Az(ART2LDA)
C1
C2
C3
C4
C5
C6
0,854 0,842 0,800 0,672 0,832 0,834
0,901
0,89
0,850 0,767 0,884 0,885
Az (MLP)
0,994 0,994 0,970 0,887 0,987 0,982
Az (RBF-SIMULATED
ANNEALING)
0,912 0,924 0,996 0,907 0,998 0,999
Az (Classificador
Paraconsistente)
0,939 0,935 0,875 0,500 0,929 0,939
Para o conjunto formado por todos os atributos de imagens apenas o
Classificador Paraconsistente realizou o teste, Az = 0,938
187
CAPÍTULO 6 – CONCLUSÕES
O Classificador Paraconsistente apresenta uma arquitetura mais simples que a
arquitetura dos classificadores estudada por (ESPÍRITO SANTO R. , 2004). No caso
da classificação de massas mamografias e tumores para que o classificador proposto
por (ESPÍRITO SANTO R. , 2004) consegui-se realizar o processamento da rede
neural, houve a necessidade de divisão dos atributos mamográficos em conjuntos. No
caso do Classificador Paraconsistente foi possível utilizar todos os atributos de
imagens sem problema.
O número de amostras utilizadas para treinamento da rede também precisou
ser elevada para o classificador RBF-Simulated Annealing por isso a escolha do
método leave-one-out, ou seja, treinar todas as amostras com exceção de uma. A
amostra de sobra será utilizada para classificação.
No caso do Classificador Paraconsistente foi um teste inicial com 7 elementos
de amostra para treinamento, depois 14 elementos de amostra para treinamento e
depois com 21 elementos de amostra para treinamento. De 7 para 14 amostras
utilizadas para treinamento houve uma evolução considerável em relação ao acerto
das amostras utilizadas para classificação. No caso de 14 para 21 amostras utilizadas
para treinamento houve uma evolução pequena em relação ao acerto das amostras
utilizadas para classificação. Em termos estatísticos a Lógica Paraconsistente
Evidencial E sofre críticas quanto ao número de amostras utilizadas. Para os testes
com o Classificador Paraconsistente esse quesito também foi levado em
consideração. Os resultados demonstram que apesar do número de amostras
reduzido os resultados foram expressivos.
Para os testes envolvendo calcificações o Classificador Paraconsistente foi o
melhor com uma Az = 0,986 quase atingindo os 100% de acerto para a base de dados
em estudo.
Para os testes envolvendo massas mamográficas para o conjunto de todos os
atributos o único classificador a conseguir resultados foi o Classificador
Paraconsistente.
Para os conjuntos de atributos de C1, o Classificador Paraconsintente ficou
com o segundo melhor resultado.
188
Para os conjuntos de atributos de C2, o Classificador Paraconsintente ficou
com o segundo melhor resultado.
Para os conjuntos de atributos de C3, o Classificador Paraconsintente ficou
com o terceiro melhor resultado.
Para os conjuntos de atributos de C4, o Classificador Paraconsintente ficou
com o pior resultado.
Para os conjuntos de atributos de C5, o Classificador Paraconsintente ficou
com o terceiro melhor resultado.
Para os conjuntos de atributos de C6, o Classificador Paraconsintente ficou
com o terceiro melhor resultado.
Ao que tudo indica os atributos de textura influenciam de forma negativa a
desempenho do Classificador Paraconsistente.
A utilização do Classificador Paraconsistente pode melhorar o seu desempenho
graças ao ajuste do valor de corte entre valores Benignos e Malignos propiciados pelo
algoritmo de Balanceamento.
Tudo indica que o Classificador Paraconsistente pode ser utilizado como uma
ferramenta CAD aplicável no diagnóstico do câncer de mama. A sua capacidade de
detectar calcificações se mostrou muito superior a dos demais classificadores e a
capacidade de detectar massas mamográficas e tumores se mostrou próxima ao
melhor desempenho dos outros classificadores. Um número de amostras para testes
poderão das a oportunidade do Classificador Paraconsistente encontrar melhores
limites de decisão, portanto, atingir um melhor desempenho.
189
REFERÊNCIAS BIBLIOGRÁFICAS
ABE, J. M. (2004). Paraconsistent Artificial Neural Networks: an Introduction,
Knowledge-Based Intelligent Information and Engineering Systems. Springer.
ABE, J. M. (2010). Paraconsistent Artificial Neural Networks and EEG Analisis, Lecture
Notes in Computer Science . Springer.
ABE, J. M. (2010). Redes Neurais Artificiais Paraconsistentes e Análise de Distúrbio
de Aprendizagem., (pp. tese apresentada à Faculdade de Medicina da
Universidade de São Paulo para a obtenção do título de Professor LivreDocente junto ao Departamento de Patologia Disciplina de Informática Médica).
ABE, J. M. (2011). Applications of Paraconsistent Artificial Neural Networks in EEG,
Lecture Notes in Computer Science.
ABE, J. M. (2011). Lógica Anotada Evidencial Et. Santos - SP: COMUNICAR.
ABE, J. M., & NAKAMATSU, k. (2012). Paraconsistent Artificial Neural Networks and
Applications, capítulo de livro, “The Handbook on Reasoning-Based Intelligent
Systems”.
ABE, J. M., & NAKAMATSU, k. (2012). Paraconsistent Artificial Neural Networks and
Pattern Recognition: Speech Production Recognition and Cephalometric
Analysis, capítulo 12 do livro, “Intelligent Systems for Image Processing and
Pattern Recognition”.
ABE, J. M., DA SILVA FILHO, J. I., & TORRES, G. L. (2008). Inteligência Artificial com
Redes de Análises Paraconsistentes: Teoria e Aplicações. Rio de Janeiro: LTC.
ABE, J. M., LOPES, H. F., & ANGHINAH, R. (2009). Paraconsistent Artificial Neural
Network and Alzheimer Disease: A Preliminary Study, Dementia &
Neuropsychologia.
ABE, J. M., LOPES, H. F., & ANGHINAH, R. (2011). Paraconsistent artificial neural
networks and EEG analysis, International Journal of Reasoning-Based
Intelligent Systems.
ABE, J. M., LOPES, H. F., & NAKAMATSU, K. (2012). Paraconsistent Artificial Neural
Networks and Delta, Theta, Alpha, and Gamma Bands Detection, capítulo 11
do livro “Intelligent Systems for Image Processing and Pattern Recognition”.
Springer.
ABE, J. M., ORTEGA, M. N., MÁRIO, & M., D. S. (2005). Paraconsistent Artificial
Neural Network: an Application in Cephalometric Analysis. Springer.
ABE, J. M., PRADO, J. C., & NAKAMATSU, K. (2006). Paraconsistent Artificial Neural
Network: Applicability in Computer Analysis of Speech Productions. Springer.
ABE, J., LOPES, H. F., & NAKAMATSU, K. (2008). Improving EEG Analysis by Using
Paraconsistent Artificial Neural Networks, Knowledge-Based Intelligent
Information and Engineering Systems Lecture Notes in Computer Science.
Berlin: Springer.
AHA, D. W., & ALBERT, M. (1998). Instance-Based Algorithms. Machine Learning,
vol. 6, 323-336.
ALTO, H., RANGAYYAN, R. M., & DESAUTELS, J. E. (2005). Content-based retrieval
and analysis of mammographic masses. Journal of Electronic Imaging, Volume
14, Issue 2, 1-17.
190
American College of Radiology (ACR). (1998). Illustrated Breast Imaging Reporting
and Data System (BI-RADS) (third ed.). Reston, VA: American College of
Radiology.
ARRUDA, A. I. (1980). A survey of Paraconsistent Logic. Mathematical Logic in Latin
America, Proceedings of the IV Latin American Symposium on Mathematical
Logic Studies in Logic and the foundations of mathematic, 99, 1- 41.
ASTLEY, S. M., & GILBERT, F. J. (2004). Computer-aided detection in mammography
( Review ). Clinical Radiology Volume 59, Issue 5, 390-399.
AYRES, F. J., & RANGAYYAN, R. M. (2003). Characterization of architectural
distortion in mammograms. Proceedings of the 25th Annual International
Conference of the IEEE Engineering in Medicine and Biology Society (CDROM), (pp. 886–889). Cancún, Mexico.
AYRES, F. J., & RANGAYYAN, R. M. (2004). Detection of architectural distortion in
mammograms using phase portraits. Proceedings of SPIE Medical Imaging
2004: Image Processing, vol. 5370, 587–597.
AYRES, F. J., & RANGAYYAN, R. M. (2005). Characterization of architectural
distortion in mammograms. IEEE Engineering in Medicine and Biology
Magazine, Volume 24, Issue 1, 59-67.
AYRES, F. J., & RANGAYYAN, R. M. (2005). Characterization of architectural
distortion in mammograms. IEEE Engineering in Medicine and Biology
Magazine, Volume 24, Issue 1, 59-67.
AYRES, F. J., & RANGAYYAN, R. M. (2005). Detection of architectural distortion in
mammograms via analysis of phase portraits and curvilinear structures. Third
European Medical and Biological Engineering Conference, IFMBE European
Conference on Biomedical Engineering (CD-ROM), (pp. 1873, six pages on CDROM). Prague, Czech Republic.
AZEVEDO MARQUES, P. M. (19 de junho de 2001). DIAGNÓSTICO AUXILIADO
POR COMPUTADOR NA RADIOLOGIA. Radiol Bras, pp. 285-293.
BAKER, J. A. (2003). Computer-aided detection (CAD) in screening mammography:
Sensitivity of commercial CAD systems for detecting architectural distortion.
American Journal of Roentgenology, Volume 181, 1083-1088.
BALLEYGUIER, C. e. (2005). Comprendre et utiliser le CAD (Aide informatisée au
diagnostic) en mammographie. Éditions Françaises de Radiologie, 29-35.
BANKMAN, I. N. (1997). Segmentation Algorithms for Detecting Microcalcifications in
Mammograms. IEEE Transactions on Information Technology in Biomedicine,
Volume 1, Issue 2, 141-149.
BARRETO, G. (2008). Redes Neurais Artificiais: Uma Introdução Prática. Fortaleza,
Ceará, Brasil.
BARRETO, J. M. (2002). Indrodução às Redes Neurais Artificiais - Laboratório de
Conexionismo e Ciências Cognitivas: Universidade Federal de Santa Catarina
- Departamento de Informática e de Estatística. Florianópolis, Santa Catarina,
Brasil.
BASSETT, L. W. (2000). Doenças da Mama: Diagnóstico e Tratamento. Rio de
Janeiro: Editora RevinteR Ltda.
BAUER, C. K. (2007). Java persistence with hibernate. Manning.
BIRD, R. E., WALLACE, T. W., & YANKASKAS, B. C. (1992). Analysis of cancers
missed at screening mammography. Radiology, Volume 184, Issue 3, 613-617.
191
BIRDWELL, R. L. (2001). Mammographic characteristics of 115 missed cancers later
detected with screening mammography and the potential utility of computeraided detection. Radiology, Volume 219, Issue 1, 192-202.
BOYD, N. F. (1995). Quantitative classification of mammographic densities and breast
cancer risk: Results from the Canadian National Breast Screening Study.
Journal of the National Cancer Institute, Volume 87, Issue 9, 670-675.
BRASIL,
A.
(22
de
04
de
2013).
EBC.
Fonte:
EBC:
http://http://www.ebc.com.br/print/33541
BRASIL, L. M. (2008). Informática em Saúde. Brasília: Editora Universa.
BROEDERS, M. J. (1993). Use of previous screening mammograms to identify
features indicating cases that would have a possible gain in prognosis following
earlier detection. European Journal of Radiology, 39, 1770–1775.
BRUCE, L. M., & ADHAMI, R. R. (1999). Classifying Mommographic Mass Shapes
Using the Wavelet Transform Modulus-Maxima Method. IEEE Transaction on
Medical Imaging, Vol. 18, No. 12.
BRUNO, B. e. (2009). CAD in questions/answers Review of the literature. European
Journal of Radiology, 24-33.
BURHENNE, L. J. (2000). Potential contribution of computer-aided detection to the
sensitivity of screening mammography. Radiology, 215, 554–562.
BUSCHMANN, F. e. (1996). Pattern-Oriented Software Architecture: A System of
Patters V.1. Wiley .
BYNG, J. W. (1996). Automated analysis of mammographic densities. Physics in
Medicine and Biology, Volume 41, Issue 5, 909-923.
CADY, B., & CHUNG, M. (2005). Mammographic screening: No longer controversial.
American Journal of Clinical Oncology: Cancer Clinical Trials Volume 28, 1-4.
CALAS, M. J. (Set/Out de 2011). Evaluation of morphometric parameters calculated
from breast lesion contours at ultrasonography in the distinction among BIRADS categories. Radiol Bras, pp. 289–296.
CARPENTER, G. A., & MARKUSON, N. (1998). ARTMAP-IC and Medical diagnosis:
Instance Counting and Inconsistent Cases. Neural Networks 11, 323 - 336.
CARVALHO, F. R., & ABE, J. M. (2011). Tomadas de Decisão com Ferramentas da
Lógica Paraconstistente Anotada. São Paulo: Editora Edgard Blucher Ltda.
CAULKIN, S. e. (1998). Sites of occurrence of malignancies in mammograms.
Proceedings of the Fourth International Workshop on Digital Mammography,
(pp. 279–282). Nijmegen, The Netherlands.
CHAN, H. P. (1995). Computer-aided Classification of Mammographic Masses and
Normal Tissue: Linear Discriminant Analysis in Texture Feature Space. Phys.
Med. Biol., vol. 40, no. 5, 857–876.
CHENG, H. D. (2003). Computer-aided detection and classification of
microcalcifications in mammograms: A survey. Pattern Recognition, Volume 36,
Issue 12, 2967-2991.
CIATTO, S. A. (2003). Comparison of standard reading and computer aided detection
(CAD) on a national proficiency test of screening mammography. European
Journal of Radiology Volume 45, Issue 2, 135-138.
CONCEIÇÃO, M. M. (2006). Modelo de análise de variáveis craniométricas através
das Redes Neurais Artificiais Paraconsistentes. Acesso em 05 de 11 de 2010,
disponível em Faculdade de Medicina da Universidade de São Paulo:
http://www.teses.usp.br/teses/disponiveis/5/5160/tde-06112006-130001/ptbr.php
192
CORINNE, B. e. (2005). Computer-aided detection (CAD) in mammography: Does it
help the junior or the senior radiologist? European Journal of Radiology 54,
9096.
COSTA, N. C. (1980). Ensaios sobre os fundamentos da logica. São Paulo: Hucitec.
Fonte: , , Hucitec, 1980.
COUTO, J. E. (2009). Abordagem Não-Paramétrica para Cálculo do Tamanho da
Amostra com Base em Questionários ou Escalas de Avaliação na Área de
Saúde. Tese apresentada à Faculdade de Medicina da Universidade de São
Paulo para a obtenção do título de doutor em Ciência. São Paulo, São Paulo,
Brasil.
DA COSTA, N. C. (1999). Lógica Paraconsistente Aplicada. São Paulo: Atlas.
DA COSTA, N. C. (1999). Lógica Paraconsitente Aplicada. São Paulo: Atlas.
DA SILVA FILHO, J. .., TORRES, G. L., & ABE, J. M. (2010). Uncertainty Treatment
Using Paraconsistent Logic - Introducing Paraconsistent Artificial Neural
Networks. Holanda.
DA SILVA FILHO, J. I., & ABE, J. M. (1999). Fundamentos das redes neurais artificiais
paraconsistentes. São Paulo: Arte & Ciência.
DA SILVA FILHO, J. I., & ABE, J. M. (1999). Fundamentos das Redes Neurais
Artificiais Paraconsistentes. São Paulo: Arte & Ciência.
DA SILVA FILHO, J. I., & ABE, J. M. (2001). Fundamentos das Redes Neurais
Paraconsistentes – Destacando Aplicações em Neurocomputação. Arte &
Ciência.
DA SILVA FILHO, J. I., ABE, J. M., & TOREES, G. L. (2008). Inteligência Artificial com
as Redes de Análises Paraconsistentes: Teorias e Aplicações. Rio de Janeiro:
LTC.
DA SILVA FILHO, J. I., TORRES, G. L., & ABE, J. M. (2010). Uncertainty Treatment
Using Paraconsistent Logic - Introducing Paraconsistent Artificial Neural
Networks. Holanda.
DHAWAN, A. P., & LE ROYER, E. (1988). Mammographic feature enhancement by
computerized image processing. Computer Methods and Programs in
Biomedicine, Volume 27, Issue 1, 23-35.
DHAWAN, A. P., BUELLONI, G., & GORDON, R. (1986). ENHANCEMENT OF
MAMMOGRAPHIC FEATURES BY OPTIMAL ADAPTIVE NEIGHBORHOOD
IMAGE PROCESSING. IEEE Transactions on Medical Imaging, Volume MI-5,
Issue 1, 8-15.
DOI, K. (2007). Computer-aided diagnosis in medical imaging: Historical review,
current status and fatures potencial. Computerized Medical Imaging and
Graphics, 198-211.
DOS SANTOS, J. M. (2008). DIAGNÓSTICO ASSISTIDO POR COMPUTADOR EM
MAMOGRAFIA. Dissertação apresentada à Universidade de Aveiro para
cumprimento dos requisitos necessários à obtenção do grau de Mestre em
Engenharia Biomédica. Universidade de Aveiro. Aveiro, Portugal.
DROMAINA, C. e. (2013). Computed-aided diagnosis (CAD) in the detection of breast
cancer. European Journal of Radiology, 417-423.
DUDA, R. O., & HART, P. E. (1973). Pattern Classification and Scene Analysis. New
York: Wiley.
El-NAQA, I. e. (2002). A support vector machine approach for detection of
microcalcifications. IEEE Transactions on Medical Imaging, Volume 21, Issue
12, 1552-1563.
193
ESPÍRITO SANTO, R. (2004). Discriminação de Classes Fundamentada em Técnicas
de Otimização Não Linear e Combinatória Associadas a Funções de Base
Radiais:Um estudo de Caso em Mamografia. Tese de doutorado apresentada
à Escola Politécnica da Universidade de São Paulo. São Paulo.
ESPÍRITO SANTO, R., LOPES, R. D., & RANGAYYAN, R. M. (2009). Classification of
Breast Masses in Mammograms Using Radial Basis Functions and Simulated
Annealing. INTERNATIONAL JOURNAL OF Cognitive Informatics and Natural
Intelligence, 27-38.
EVANS, C., YATES, K., & BRADY, M. (2002). Statistical characterization of normal
curvilinear structures in mammograms. H.-O. Peitgen (Ed.), Proceedings of the
Sixth International Workshop on Digital Mammography (IWDM 2002) (pp. 285–
291). Bremen, Germany: Springer.
EVANS, W. P. (2002). Invasive lobular carcinoma of the breast: Mammographic
characteristics and computer-aided detection. Radiology, Volume 225, 182189.
FEIG, S. A., GALKIN, B. M., & MUIR, H. D. (1987). Evaluation of breast
microcalcifications by means of optically magnified tissue specimen
radiographs. Recent results in cancer research. Fortschritte der
Krebsforschung. Progres dans les recherches sur le cancer, Volume 105, 111123.
FERLAY, J. e. (2013). Cancer incidence and mortality patterns in Europe: Estimates
for 40 countries in 2012. European Journal of Cancer, 1374-1403.
FERRARA, L. F. (2004). Um Estudo da Rede Neural Artificial Paraconsistente RNAP
em Um Processo de Reconhecimento de Caracteres. Minas Gerais: UFU Universidade Federal de Uberlândia.
FERRARI, R. J. (2004). Automatic Identification of the Pectoral Muscle in
Mammograms. IEEE Transactions on Medical Imaging, Volume 23, Issue 2,
232-245.
FERRARI, R. J. (2004). Segmentation of the fibro-glandular disc in mammograms
using Gaussian mixture modelling. Medical and Biological Engineering and
Computing, Volume 42, Issue 3, 378-387.
FOWLER, M. (2003 (A)). Patterns of Enterprise Application Architecture. AddisonWesley.
FOWLER, M. (2003). UML Essencial: Um breve guia para a linguagem padrão.
Bookman.
FREER, T. W., & ULISSEY, M. J. (2001). Screening mammography with computeraided detection: Prospective study of 12,860 patients in a community breast
center. Radiology, 781-786.
GAMMA, E. e. (2000). Padrões de Projeto: Soluções Reutilizáveis de Software
Orientado a Objetos. Porto Alegre: Bookman.
GENNARI, J. H. (1989). Model of incremental concept formation. Artificial Intelligence,
vol. 40., 11-60.
GLAUBER, M. P. (s.d.). Arquitetura Para um Sistema de Diagnóstico Auxiliado por
Computador.
GONZALEZ, R. C., & WOODS, R. E. (2010). Processamento Digital de Imagens 3 ed.
São Paulo: Pearson Prentice Hall.
GORDON, R., & RANGAYYAN, R. M. (1984). FEATURE ENHANCEMENT OF FILM
MAMMOGRAMS USING FIXED AND ADAPTIVE NEIGHBORHOODS. Applied
Optics, Volume 23, Issue 4, 560-564.
194
GULIATO, D. e. (1996). Detection of Breast Tumor Boundaries Using Iso-Intensity
Contours and Dynamic Thresholding. São Paulo, São Paulo, Brasil: LSI.
EPUSP.
GULIATO, D. e. (1998). Segmentation of Breast Tumors in Mammograms by Fuzzy
Region Growing. 20th Annual International Conference of the IEEE Engineering
in Medicine and Biology Society, (pp. 1002-1004). Hong Kong.
GULIATO, D. e. (2003). Fuzzy fusion operators to combine results of complementary
medical image segmentation techniques. Journal of Electronic Imaging, Volume
12, Issue 3, 379-389.
GULIATO, D. e. (2003). Segmentation of breast tumors in mammograms using fuzzy
sets. Journal of Electronic Imaging, Volume 12, Issue 3, 369-378.
GUO, Q., SHAO, J., & RUIZ, V. (2005). Investigation of support vector machine for the
detection of architectural distortion in mammographic images. Journal of
Physics: Conference Series, Volume 15, Issue 1, 88-94.
HADJIIK, L. e. (1999). Classification of Malignant and Benign Masses Based on Hybrid
ART2LDA Approach. IEEE Transactions on Medical Imaging, vol. 18, no. 12,
1178-1193.
HARALICK, R. M. (1979). STATISTICAL AND STRUCTURAL APPROACHES TO
TEXTURE. Proc IEEE, Volume 67, Issue 5, 786-804.
HARALICK, R. M., SHANMUGAM, K., & DINSTEIN, I. (1973). Textural features for
image classification. IEEE Transactions on Systems, Man, and Cybernetics, vol.
SMC-3, no. 6, 610-621.
HAYKIN, S. (1999). Neural Network A Comprehensive Foundation. Upper Saddle
River, NJ: Pretince Hall.
HAYKIN, S. (2001). Redes Neurais: Principios e Prática. Porto Alegre: Bookman.
HILLARY, A., RANGAYYAN, R. M., & DESAUTELS, J. E. (2003). "An indexed atlas of
digital mammograms", in H-O. International Workshop on Digital
Mammography, Springer-Verlag (pp. 309-311). Bremen, Germany: Proceeding
of the IWDM 2002: 6th.
HOMER, M. J. (1997). Mammographic Interpretation: A Practical Approach (second
ed.). New York: McGraw-Hill.
HOWELL, S. C. (1992). Statistical Methods for Psychology. Belmont, CA: Duxbury
Press.
INCA. (2004). Controle do Câncer de Mama: Documento de Consenso. Rio de Janeiro.
INCA. (2007). Mamografia: da prática ao controle. Rio de Janeiro: Cooredenação de
Ensino e Divulgação Cientiíca (CEDC).
INCA. (2011 (A)). MINISTÉRIO DA SAÚDE- INSTITUTO NACIONAL DE CÂNCER
JOSÉ ALENCAR GOMES DA SILVA (INCA) - Estimativa 2012 : incidência de
câncer no Brasil. Rio de Janeiro.
INCA, I. N. (2011 (B)). Orientações para elaboração de laudo no sistema de
informação do controle do câncer de mama. Rio de Janeiro: Coodenação de
Educação (CEDC).
JANKEES, V. D. (2007). Um Sistema Para Diagnóstico Auxiliado por Computador
Voltado Para Imagens Mamográficas: Desempenho da Busca Baseada em
Conteúdo na Recuperação de Achados. VII Workshop de Informática Médica WIM 2007, (pp. 194-203).
KARSSEMEIJER, N. (1998). Automated classification of parenchymal patterns in
mammograms. Physics in Medicine and Biology, Volume 43, Issue 2, 365-378.
195
KEGELMEYER, J. W. (1994). Computer-aided mammographic screening for
spiculated lesions. Radiology, Volume 191, Issue 2, 331-337.
KUPINSKI, M. A., & ANASTASIO, M. A. (1999). Multiobjective Genetic Optimization of
Diagnostic Classifiers with Implication for Generating Receiver Operating
Characteristic Curves. IEEE Transactions on Medical Imaging, vol. 18. no. 8,
675-685.
LAINE, A. F. (1994). Mammographic feature enhancement by multiscale analysis.
IEEE Transactions on Medical Imaging, Volume 13, Issue 4, 725-740.
LAU, T. K., & BISCHOF, W. F. (1991). Automated detection of breast tumors using the
asymmetry approach. Computers and Biomedical Research, Volume 24, Issue
3, 273-295.
LAURIA, A. (2009). GPCALMA: Implementation in Italian hospitals of a computer aided
detection system for breast lesions by mammography examination. Science
Direct, 58-72.
LAWS, K. I. (1980). Rapid texture identification. Proceedings of SPIE:Image
Processing for Missile Guidance, vol. 238, 376–380.
LEMES, M. C., & VENSON, N. (02 de nov de 2009). Acesso em 20 de dez de 2010,
disponível em www.inf.ufsc.br/~barreto/trabaluno/TC_Nerio_Mauricio.pdf
LOPES, H. e. (2011). Improved Application of Paraconsistent Artificial Neural
Networks in Diagnosis of Alzheimer's Disease, American Journal of
Neuroscience.
LOPES, H. F. (2009). Aplicação de redes neurais artificiais paraconsistentes como
método de auxílio no diagnóstico da doença de Alzheimer: Dissertação
aprentada à Faculdade de Medicina da Universidade de São Paulo para a
obtenção do título de Mestre em Ciências. São Paulo, São Paulo, Brasil.
LOPES, H. F., & ABE, J. M. (2011). Aplicação de Redes Neurais Artificiais
Paraconsistentes como método de auxílio à análise de sinais de
eletroencefalograma, capítulo de livro, Ed. J.M.Abe, Aspectos de Lógica e
Teoria da Ciência, Instituto de Estudos Avançados da USP.
LOPES, H. F., ABE, J. M., & ANGHINAH, R. (2009). Application of Paraconsistent
Artificial Neural Networks as a Method of Aid in the Diagnosis of Alzheimer
Disease, Journal of Medical Systems. Springer-Netherlands.
MÁRIO, M. e. (2010). Paraconsistent Artificial Neural Network as Auxiliary in
Cephalometric Diagnosis, Artificial Organs, Wiley Interscience.
MCCULLOGH, W. S., & PITTS, W. (1943). A logical calculus of the ideas immanent in
nervous activity. Bulletin of Mathematical Biophysics, volume 5, 115 - 133.
MICHAEL, J. C., JEFFREY, H., & STEVEN, W. W. (2006). Computer-Aided Detection
and Diagnosis of Breast Cancer. Elsevier, 351-355.
MILLER, P., & ASTLEY, S. (1993). Detection of breast asymmetry using anatomical
features. Biomedical Image Processing and Biomedical Visualization, vol. 1905
of Proceedings of SPIESPIE, 433–442.
MILLER, P., & ASTLEY, S. (1994). Automated detection of breast asymmetry using
anatomical features. State of the Art in Digital Mammographic Image Analysis,
vol. 9 of Series in Machine Perception and Artificial IntelligenceWorld Scientific,
247–261.
MUDIGONDA, N. R. (2000). Gradient and Texture Analysis for the Classification of
Mammographic Masses. IEEE Transactions on Medical Imagins Vol. 19 No 10,
1032-1042.
196
MUDIGONDA, N. R., & DESAUTEL, J. E. (2001). Detection of breast masses in
mammograms by density slicing and texture flow-field analysis. IEEE
Transactions on Medical Imaging, v. 20, no. 12, 1215-1227.
NAGLAA, M. A., & WALEED, A. Y. (2013). Microcalcification detection with and without
CAD system (LIBCAD): A comparative study. The Egyptian Journal of
Radiology andNuclear Medicine.
NETTO, A. A., & TAVARES, W. R. (2006). Introdução à Engenharia de Produção.
Florianópolis: Visual Books Editora Ltda.
NUNES, F. L. (1997). Esquema de Diagnóstico Auxiliado por Computador para
Detecção de Agrumentos de Microcalcificações por Processamento de
Imagens Mamográficas: Dissertação apresentada à Escola de Engenharia de
São Carlos, da Universidade de São Paulo. São Carlos, São Paulo.
PAROCÍNIO, A. C. (2010). Computer-aided diagnosis (CAD) performances evaluation
to different mammographic image groups. Revista Brasileira de Física Médica,
67-70.
PASQUALETTE, H. A. (1998). Mamografia Atual. Rio de Janeiro: Editora RevinterR
Ltda.
PAULINELLI, R. R. (2003). Breast cancer in Goiás, in Brazil and in the World: current
incidence and mortality rates. Revista Brasileira de Saúde Materno Infantil vol.3
no.1 Recife Jan./Mar., 17-24.
PEREIRA, F. L. (2011). RECONHECIMENTO DE CARACTERES NUMÉRICOS
MANUSCRITOS
UTILIZANDO
REDES
NEURAIS
ARTIFICIAIS
PARACONSISTENTES. Dissertação apresentada ao Programa de PósGraduação em Engenharia de Produção da Universidade Paulista – UNIP para
a obtenção do título de Mestre em. São Paulo, Brasil.
POLAKOWSKI, W. E. (1997). Computer-aided breast cancer detection and diagnosis
of masses using difference of Gaussians and derivative-based feature saliency.
IEEE Trans. Med. Imag., vol. 16, no 6, 811–819.
PRINCIPE, J. C., EULIANO, N. R., & LEVEBVRE, W. C. (2000).
Neural and Adaptive Systems: Fundamentals through Simulations. John Wiley
and Sons.
QUINLAN, J. R. (1986). The Effect of Noise on Concept Leaning. Machine Learning:
One Artificial Intelligence Approach, vol. II., 149-166.
RAM, G. (1982). Optimization of ionizing radiation usage in medical imaging by means
of image enhancement techniques. Medical Physics, Volume 9, Issue 5, 733737.
RANGARAJ, M. R., & THANH, M. N. (2005). Pattern classification of breast masses
via fractal analysis of their contours. International Congress Series 1281 (pp.
1041-1046). Elsevier.
RANGARAJ, M. R., FABIO, J. A., & DESAUTELS, J. E. (2007). A review of computeraided diagnosis of breast cancer: Toward the detection of subtle signs. Journal
of the Franklin Institute, 312-348.
RANGAYYAN, R. M. (1997). Improvement of sensitivity of breast cancer diagnosis with
adaptive neighborhood contrast enhancement of mammograms. IEEE
Transactions on Information Technology in Biomedicine, Volume 1, Issue 3,
161-170.
RANGAYYAN, R. M. (1997). Improvement of sensitivity of breast cancer diagnosis with
adaptive neighborhood contrast enhancement of mammograms. IEEE
197
Transactions on Information Technology in Biomedicine, Volume 1, Issue 3,
161-170.
RANGAYYAN, R. M. (1997). Measures of Acutance and Shape for Classification of
Breast Tumors. IEEE Transactions on Medical Imaging, vol. 16, no. 6, 799-810.
RANGAYYAN, R. M. (2002). Image-Processing Techniques for Tumor Detection. R.N.
Strickland, 213–242.
RANGAYYAN, R. M. (2005). Biomedical Image Analysis. CRC Press.
RANGAYYAN, R. M., & NGUYEN, H. N. (2003). PIXEL-INDEPENDENT IMAGE
PROCESSING TECHNIQUES FOR NOISE REMOVAL AND FEATURE
ENHANCEMENT. IEEE Pacific Rim Conference on Communications,
Computers and Signal Processing. Victoria, BC, Can.
RANGAYYAN, R. M., MUDIGONDA, N. R., & DESAUTELS, J. E. (2000). Boundary
Modeling and Shape Analysis Methods for Classification of Mammographic
Masses. Medical & Biological Enginnering & Computing, vol. 38, 487-496.
RANGAYYAN, R. M., SHEN, L., & DESAUTELS, J. E. (1993). Detection and
Classification of Mammographic Calcifications. International Journal of Pattern
Recognition and Artificial Intelligence Vol. 7 No. 6, 1403-1416.
RAO, A. R., & JAIN, R. C. (1992). Computerized flow field analysis: oriented texture
fields. IEEE Trans. Pattern Anal. Mach. Intell., 14, 693–709.
RODRIGO, M. S., IÁLIS, C. P., & FÁTIMA, N. S. (2011). Técnicas de Processamento
de Imagens em Diagnóstico. Piaui.
RUMBAUGH, J., & BLAHA, M. (2006). Modelagem e Projetos Baseados em Objetos
com UML 2. Rio de Janeiro: Elsevier.
SAHA, P. K. (2001). Breast tissue density quantification via digitized mammograms.
IEEE Transactions on Medical Imaging, Volume 20, Issue 8, 792-803.
SAMPAT, M. P. (2005). Evidence based detection of spiculated masses and
architectural distortion. Proceedings of SPIE Medical Imaging 2005: Image
Processing, vol. 5747, 26–37.
SANTOS, C. R. (x de 2004). Análise de assinaturas manuscritas baseada nos
princípios de grafoscopia. Dissertação de Mestrado, Pontifícia Universidade
Católica do Paraná, Curitiba.
SCHWEFEL, H. P. (1981). Numerical Optimization of Computer Models. Chichester.
New York: Wiley.
SHEN, L., & RANGAYYAN, R. M. (1997). A Segmentation-Based Lossless Image
Coding Method for High-Resolution Medical Image Compression. IEEE
Transactions on Medical Imaging, Vol. 16 No. 3, 301-307.
SHEN, L., RANGAYYAN, R. M., & DESAUTELS, J. E. (1993). Detection and
classification of mammographic calcifications. Int. J. Pattern Recogn. Artif.
Intell., 7, 1403–1416.
SHEN, L., RANGAYYAN, R. M., & DESAUTELS, J. E. (1994). Application of shape
analysis to mammographic calcifications, Volume 13, Issue 2. IEEE
Transactions on Medical Imaging, Volume 13, Issue 2, 263-274.
SICKLES, E. A. (1986). Breast calcifications: Mammographic evaluation. Radiology,
Volume 160, Issue 2, 289-293.
SMITH, J. W. (1962). ADAP II, an Adaptive Routine for the LARC computer. Navy
Management Office (Available through the Logistics Management Institute
Library).
SMITH, J. W. (1988). Using the ADAP learning Algorithm to forecast the Onset of
Diabetes Mellitus. Computer Application and Medical Care, 261-265.
198
SOCIETY, A. C. (16 de 04 de 2013). American Cancer Society. Fonte:
http://www.cancer.org/
SOLTANIAN, Z. H., RAFIEE, R. F., & SIAMAK, P. N. (2004). Comparison of
multiwavelet, wavelet, Haralick, and shape features for microcalcification
classification in mammograms. Pattern Recognition, Volume 37, Issue 10,
1973-1986.
SOUZA, P. R. (2009). Métodos de apoio a decisão médica para análise em Diabetes
Mellitus Gestacional utilizando a probabilidade pragmática na lógica
paraconsistente anotada de dois valores para melhor precisão de resposta.
Tese de doutorado - Universidade de São Paulo. São Paulo, São Paulo.
SOUZA, S. J. (2001). Equalização Adaptativa Usando RBFS e Resfriamento
Simulado. Dissertação de Mestrado. Universidade Federal da Bahia. Salvador,
Bahia.
SOUZA, S., & ABE, J. M. (2011). Aspectos das Redes Neurais Artificiais
Paraconsistentes, capítulo de livro, Ed. J.M. Abe, Aspectos de Lógica e Teoria
da Ciência, Instituto de Estudos Avançados da USP.
STRICKLAND, R. N., & HAHN, H. (1996). Wavelet transforms for detecting
microcalcifications in mammograms. IEEE Transactions on Medical Imaging,
Volume 15, Issue 2, 218-229.
SUCKLING, J. e. (1994). The Mammographic Image Analysis Society Digital
Mammogram Database. Digital Mammography: Proceedings of the 2nd
International Workshop on Digital Mammography (pp. 375–378). York, UK:
Elsevier.
SUN, Y. e. (2006). A new approach for breast skin-line estimation in mammograms.
Pattern Analysis and Applications, Volume 9, Issue 1, 34-47.
TANG, J. e. (2009). Digital image processing and pattern recognition techniques for
the detection of cancer. Pattern Recognition, 1015-1016.
THURFJELL, E. L., LERNEVALL, K. A., & TAUBE, A. A. (1994). Benefit of independent
double reading in a population-based mammography screening program.
Radiology, 241-244.
TORRES, C. R. (2010). A Sensing System for an Autonomous Mobile Robot Based
on the Paraconsistent Artificial Neural Network Lecture Notes in Computer
Science. Springer.
TOURASSI, G. D., DELONG, D. M., & FLOYD, J. C. (2006). A study on the
computerized fractal analysis of architectural distortion in screening
mammograms. Physics in Medicine and Biology, Volume 51, Issue 5, 12991312.
TÚLIO, A. C., & RANGAYYAN, R. M. (2003). Classification of Tumors and Masses in
Mammograms Using Neural Networks With Shape and Texture Features. IEEE
Engineering in Medicine and Biology Society, (p. paper no. 6.7.2.4 (pp) CDROM
Proc. 25th). Cancun, Mexico.
URSIN, G. e. (2005). Greatly increased occurrence of breast cancers in areas of
mammographically dense tissue. Breast Cancer Res., 7, R605–R608.
VAN DIJCK, J. A., & al., e. (1993). The current detectability of breast cancer in a
mammographic screening program: A review of the previous mammograms of
interval and screen-detected cancers. Cancer, Volume 72, Issue 6, 1933-1938.
WAI, L. C., MELLOR, M., & BRANDY, M. (2004). A multi-resolution CLS detection
algorithm form mammographic image analysis. Lecture Notes in Computer
199
Science, Proceedings of Medical Image Computing and Computer-Assisted
Intervention (MICCAI 2004) (pp. 865-872). Berlin, Germany: Springer.
WILLIAM, H. P. (1992). Numerical Recipes in C: The Art of Scientific Computing.
Cambridge: Cambridge University Press.
WILSON, S. S. (1991). Teaching Network Connectivity Using Simulated Annealing on
a Massively Parallel Processor. IEEE, vol. 79, no. 4, 559-566.
WOODS, K., & BOWYER, K. W. (1997). Generating ROC Curves for Artificial Neural
Network. IEEE Transaction on Medical Imaging, vol. 16, no. 3, 329-337.
WU, Y. e. (1993). Artificial Neural Network in Mammography: Application to Decision
Making in the Diagnosis of Breast Cancer. Radiology, vol 187, 81-87.
YAO, X. (1999). Evolving Artificial Neural Networks. IEEE. Vol. 87, no, 9, 1423 – 1447.
YU, S. N., LI, K. Y., & HUANG, Y. K. (2006). Detection of microcalcifications in digital
mammograms using wavelet filter and Markov random field model.
Computerized Medical Imaging and Graphics, Volume 30, Issue 3, 163-173.
APÊNDICE A - BASE DE DADOS 1: CALCIFICAÇÕES
Esta base de dados foi adquirida junto ao Department of Radiological Sciences
and Diagnosis Imaging Foothills Hospital, localizado em Calgary, Alberta, Canadá
(RANGAYYAN,
SHEN,
&
DESAUTELS,
Detection
and
Classification
of
Mammographic Calcifications, 1993) (ESPÍRITO-SANTO, 2004). Tal base de dados
200
foi levantada por Fabio J. Ayres, sob orientação do Prof. Dr. Rangaraj M.
Rangayyan.
Ela é constituída de 64 casos benignos e 79 casos malignos, confirmados por
biópsia. Nas mamografias, as calcificações são identificadas manualmente por um
radiologista especializado em mamografia. A partir das identificações feitas, são
determinados os fatores de forma m, C e f (Capítulo 2). A TABELA A.1 mostra todos
os 143 fatores de forma de BD1.
TABELA A.1: BD1: Fatores de forma empregados nas simulações
Casos
m
C
f
tipo
Casos
M
C
f
tipo
1
0,04096 0,18416 0,198364
benigno
65
0,06866 0,24634 0,374814 maligno
2
0,04234 0,19632 0,215465
benigno
66
0,05019 0,25424 0,494472 maligno
3
0,01549 0,16084 0,130271
benigno
67
0,09953 0,28293 0,527956 maligno
4
0,03515 0,15849 0,172552
benigno
68
0,06450 0,25184 0,394444 maligno
5
0,04675 0,16504 0,137583
benigno
69
0,06682 0,22104 0,489363 maligno
6
0,06355 0,14954 0,136385
benigno
70
0,06374 0,22838 0,273843 maligno
7
0,04031 0,16086 0,127311
benigno
71
0,08880 0,40905 0,658988 maligno
8
0,03867 0,15156 0,124106
benigno
72
0,07773 0,3161
9
0,06058 0,14217 0,108983
benigno
73
0,07575 0,26848 0,362725 maligno
10
0,04708 0,1251
benigno
74
0,05717 0,21342 0,398715 maligno
11
0,03597 0,13453 0,13718
benigno
75
0,07610 0,45843 0,802567 maligno
12
0,05385 0,09149 0,154167
benigno
76
0,06786 0,25793 0,457942 maligno
13
0,04390 0,23572 0,258022
benigno
77
0,06819 0,25568 0,569686 maligno
14
0,05643 0,17461 0,162136
benigno
78
0,07448 0,32747 0,640461 maligno
15
0,04427 0,15819 0,142461
benigno
79
0,07922 0,31024 0,426094 maligno
16
0,04311 0,17437 0,164287
benigno
80
0,07520 0,30685 0,524189 maligno
17
0,03833 0,16786 0,128534
benigno
81
0,06140 0,46175 0,803819 maligno
18
0,04092 0,14148 0,107933
benigno
82
0,09272 0,18715 0,387449 maligno
19
0,05251 0,2058
0,234947
benigno
83
0,07942 0,36375 0,708555 maligno
20
0,06545 0,1275
0,122221
benigno
84
0,06195 0,30362 0,481059 maligno
21
0,07223 0,03544 0,142631
benigno
85
0,04967 0,18341 0,377594 maligno
0,108983
0,582339 maligno
201
22
0,07223 0,03544 0,142631
benigno
86
0,09178 0,33346 0,713152 maligno
23
0,05257 0,17214 0,144563
benigno
87
0,08714 0,2718
24
0,06906 0,11288 0,128534
benigno
88
0,05288 0,27072 0,479716 maligno
25
0,04518 0,12128 0,127311
benigno
89
0,09785 0,3283
26
0,05549 0,05892 0,0751998 benigno
90
0,08960 0,30193 0,51403
27
0,04358 0,09899 0,0803637 benigno
91
0,06063 0,43893 0,781863 maligno
28
0,04305 0,16232 0,154167
benigno
92
0,07335 0,28325 0,615273 maligno
29
0,00550 0,04841 0,0567275 benigno
93
0,06447 0,41891 0,699738 maligno
30
0,02769 0,19582 0,194649
benigno
94
0,07002 0,26502 0,525704 maligno
31
0,02969 0,22321 0,267417
benigno
95
0,09320 0,29402 0,60478
32
0,01679 0,16795 0,147731
benigno
96
0,08479 0,35174 0,664051 maligno
33
0,02931 0,17228 0,135322
benigno
97
0,08191 0,26668 0,526776 maligno
34
0,01460 0,1579
0,140226
benigno
98
0,05077 0,25717 0,520285 maligno
35
0,02388 0,15012 0,133431
benigno
99
0,03752 0,33995 0,529277 maligno
36
0,01154 0,16876 0,148891
benigno
100
0,07635 0,26015 0,59539
37
0,01854 0,15284 0,112112
benigno
101
0,07263 0,18234 0,282881 maligno
38
0,02624 0,18199 0,144819
benigno
102
0,05540 0,18806 0,337646 maligno
39
0,02015 0,16777 0,1387
benigno
103
0,09204 0,29652 0,613266 maligno
40
0,02612 0,21361 0,186685
benigno
104
0,05417 0,21798 0,356505 maligno
41
0,01417 0,12588 0,108875
benigno
105
0,11757 0,39556 0,784372 maligno
42
0,01775 0,15234 0,137411
benigno
106
0,10160 0,32763 0,497906 maligno
43
0,02325 0,14474 0,124008
benigno
107
0,05284 0,27785 0,477972 maligno
44
0,02049 0,12988 0,101459
benigno
108
0,04112 0,3103
45
0,01969 0,15464 0,149185
benigno
109
0,09112 0,43095 0,788424 maligno
46
0,01897 0,15368 0,121755
benigno
110
0,09190 0,32441 0,629324 maligno
47
0,01473 0,14009 0,101356
benigno
111
0,08936 0,36887 0,712074 maligno
48
0,02194 0,14988 0,118978
benigno
112
0,06157 0,3182
49
0,01954 0,15878 0,14136
benigno
113
0,10463 0,34571 0,542254 maligno
50
0,01512 0,14085 0,13089
benigno
114
0,07822 0,21787 0,268576 maligno
51
0,03310 0,16011 0,189109
benigno
115
0,08414 0,24565 0,287006 maligno
52
0,04047 0,14876 0,10351
benigno
116
0,05734 0,20604 0,384258 maligno
53
0,06545 0,1275
benigno
117
0,05597 0,22654 0,349779 maligno
0,122221
0,565093 maligno
0,619472 maligno
maligno
maligno
maligno
0,517037 maligno
0,642912 maligno
202
54
0,04917 0,17923 0,229208
benigno
118
0,09583 0,26325 0,294623 maligno
55
0,02607 0,22333 0,246503
benigno
119
0,08892 0,35021 0,62142
56
0,01773 0,13774 0,1083
benigno
120
0,07262 0,23577 0,480153 maligno
57
0,04484 0,13698 0,101632
benigno
121
0,07545 0,24159 0,371515 maligno
58
0,02310 0,13898 0,101882
benigno
122
0,07267 0,1752
59
0,02386 0,13042 0,119589
benigno
123
0,09455 0,24039 0,548398 maligno
60
0,05769 0,1421
0,157428
benigno
124
0,09047 0,24537 0,521919 maligno
61
0,03548 0,14317 0,105323
benigno
125
0,07766 0,28424 0,613786 maligno
63
0,03650 0,22576 0,22545
benigno
126
0,06897 0,21765 0,229482 maligno
63
0,05912 0,13634 0,160714
benigno
127
0,04047 0,16316 0,284713 maligno
64
0,03835 0,13121 0,100938
benigno
128
0,05017 0,18483 0,397343 maligno
129
0,05933 0,21893 0,442728 maligno
130
0,05741 0,27106 0,496517 maligno
131
0,06618 0,18987 0,417271 maligno
132
0,04236 0,18765 0,284021 maligno
133
0,04339 0,1954
134
0,05842 0,27747 0,472476 maligno
135
0,04004 0,19457 0,392121 maligno
136
0,04581 0,21724 0,402662 maligno
137
0,06989 0,2444
138
0,06087 0,24613 0,468223 maligno
139
0,06480 0,2868
140
0,05651 0,16859 0,292382 maligno
141
0,05773 0,19772 0,364201 maligno
142
0,05249 0,20164 0,421523 maligno
143
0,08957 0,22843 0,493069 maligno
maligno
0,347503 maligno
0,413398 maligno
0,532489 maligno
0,458332 maligno
APÊNDICE B - BASE DE DADOS 2: MASSAS MAMOGRÁFICAS E TUMORES
Esta base de dados foi adquirida junto ao Departments of Electrical & Computer
Engineering and Radiology, University of Calgary, Calgary, AB, Canada.
Ela é constituída de 37 informações associadas a massas benignas, quais
sejam: fatores de forma (C, f, Fcc, SI), atributos fundamentado no cálculo do gradiente
203
(Ac) e doze informações de textura (F1-F5 e F6-F12: correlação-F1, energia-F2,
entropia-F3, inverso da diferença do momento-F4, soma das entropias-F5 contrasteF6, energia-F7, soma das variâncias-F8, diferença das variâncias-F9, diferença da
entropias-F10, segundo momento-F11, máxima correlação-F12) e 20 valores dos
mesmos tipos de informações relacionados com tumores malignos.
Esses dados resultam de análises de massas e tumores feitas em mamografias
digitalizadas, em que (regiões de interesse) ROI’s são manualmente identificadas e
desenhadas nas mamografias por um radiologista experiente em mamografia. BD2 é
utilizada para treinar os classificadores a diagnosticar massas mamográficas em
massas benignas ou tumores malignos. A TABELA B.1 mostra os atributos
mamográficos de BD2. (TÚLIO & RANGAYYAN, 2003) (ESPÍRITO-SANTO, 2004)
TABELA B.1: BD2: Atributos mamográficos de base de dados
Gradiente
Fatores de forma
Informações de textura
Casos
Tipo
1
benigno
0,058802 0,16466 0,865093 0,0345 0,049462 0,9993 0,0024
9,1295 0,632
7,9067
2
benigno
0,054776 0,19226 0,846597 0,0938 0,039058 0,9997 0,0016
9,6468 0,6313
8,4168
3
benigno
0,070948 0,10898 0,879779
0 0,041676 0,9986 0,0013 10,0885 0,4716
8,1107
4
benigno
0,062454
5
benigno
6
Ac
C
f
Fcc
SI
F1
F2
0,1211 0,869856 0,074 0,032753 0,9984 0,0044
F3
F4
F5
8,1829 0,675
7,1488
9,5937 0,4086
7,3615
benigno
0,083916 0,17251 0,816295 0,2228 0,085936 0,9963 0,0009 10,5013 0,3574
7,9634
7
benigno
0,050226 0,13471 0,872252
0 0,066605 0,9994 0,0017
9,7674 0,5408
8,1258
8
benigno
0,057986 0,15690 0,867302
0 0,048622 0,9982 0,0014
9,9445 0,4683
7,9783
9
benigno
0,078047 0,17317 0,851622 0,0981 0,091689 0,9983
0,001 10,3904 0,4315
8,238
10
benigno
0,079582 0,51228 0,661407 0,2011 0,164396 0,9987 0,0022
9,2136 0,5788
7,7177
11
benigno
0,057418 0,22722 0,808194 0,1956
0,07985 0,999 0,0039
8,4148 0,685
7,4157
12
benigno
0,056188 0,14644
0,83834 0,1284 0,070328 0,9989 0,0015
9,7685 0,5277
8,0642
13
benigno
0,046536 0,19375 0,795405 0,2552 0,126376 0,9982 0,0116
6,9722 0,7759
6,3973
14
benigno
0,039012 0,11799 0,882518 0,0633
8,7598 0,7665
8,107
15
benigno
0,051197 0,10720 0,859699
0 0,042299 0,9992 0,0012 10,2315 0,4833
8,334
16
benigno
0,043041 0,15612 0,852226 0,0504 0,123487 0,9981 0,0025
9,1747 0,5354
7,5113
17
benigno
0,084688 0,15762 0,816726 0,064 0,103867 0,9979 0,0008
10,743 0,3757
8,3012
18
benigno
0,062779 0,11911 0,869421 0,0282 0,065358 0,9979 0,0014
9,8473 0,4711
7,8811
19
benigno
0,084887 0,25809 0,764226 0,237 0,184672 0,9978 0,0012
10,211 0,4217
8,0455
20
benigno
0,06884 0,19985 0,801223 0,1713 0,118254 0,998 0,0016
9,7506 0,4881
7,8488
21
benigno
0,049892 0,14621 0,846664 0,1499
8,9949 0,5957
7,6086
22
benigno
0,072441 0,13158 0,861257 0,0523 0,042846 0,9981 0,0012 10,0059 0,4495
7,9367
23
benigno
0,083694 0,17475 0,833779 0,1957 0,094885 0,9985 0,0009 10,4268 0,423
8,222
24
benigno
0,079899 0,15006 0,865271 0,0174 0,054651 0,9991
0,003
8,7607 0,6356
7,5504
35
benigno
0,063495 0,14131 0,878758 0,0296 0,045588 0,9994
0,005
8,0946 0,7467
7,3583
26
benigno
0,063265 0,13414 0,847582 0,0331 0,108722 0,995 0,0142
6,5296 0,7569
5,8654
0,06777 0,29388 0,851075
0 0,084442 0,9938 0,0017
0,02417 0,9999 0,0046
0,06458 0,9989 0,0029
204
27
benigno
0,053039 0,26767
0,79546 0,1485 0,090306 0,9977 0,0098
7,0829 0,7515
6,3937
28
benigno
0,063957 0,14717 0,848996 0,0609 0,057561 0,9988 0,0061
7,7593 0,7358
6,9917
29
benigno
0,065486 0,11556 0,870986
0 0,052385 0,9979 0,0082
7,3238 0,7292
6,5347
30
benigno
0,050505 0,18184 0,808135 0,2041 0,070202 0,9993 0,0053
31
benigno
32
8,063 0,7367
7,3071
0,852 0,2216 0,041324 0,9984 0,0065
7,621 0,7287
6,8284
benigno
0,045235 0,13585 0,834726 0,0912 0,089393 0,993 0,0155
6,4082 0,7566
5,7263
33
benigno
0,054391 0,25971 0,799724 0,2361 0,100384 0,999 0,0069
7,7454 0,7424
7,0102
34
benigno
0,057084 0,18131
0,80204 0,1726 0,121827 0,9991 0,0054
7,9537 0,7323
7,1773
35
benigno
0,062587 0,13784 0,849697 0,0406 0,070685 0,9995 0,0042
8,2692 0,7266
7,4681
36
benigno
0,035734 0,15788 0,828636 0,0992 0,066898 0,9997 0,0045
8,3942 0,7391
7,6378
37
benigno
0,051619 0,28325 0,757578 0,3129 0,154595 0,9994 0,0024
9,0801 0,6565
7,9496
38
maligno
0,045867 0,84090 0,552336 0,4704 0,730239 0,997 0,0023
9,2039 0,5196
7,4562
39
maligno
0,050803 0,83001 0,508834 0,5714
0,73467 0,9983 0,0016
9,7664 0,475
7,8607
40
maligno
0,078773 0,28192 0,758083 0,3933 0,274553 0,9984 0,0032
8,7723 0,6112
7,4204
41
maligno
0,074136 0,62330 0,646991 0,4209
0,5708 0,9946 0,0009 10,6751 0,3088
7,8873
42
maligno
0,088168 0,54652 0,630877 0,3676 0,489224 0,998 0,0009
10,407 0,4053
8,1496
43
maligno
0,033181 0,87478 0,521895 0,4405 0,742903 0,9978 0,0018
9,5034 0,5228
7,7602
44
maligno
0,026781 0,89290 0,469998 0,4099 0,727682 0,9993 0,0016
9,7583 0,555
8,1964
45
maligno
0,011961 0,98609 0,300401 0,4767 0,614686 0,9998 0,0027
9,1189 0,7243
8,2876
46
maligno
0,013923 0,95742 0,398604 0,4548 0,800991 0,9984 0,0039
8,6699 0,7409
7,8934
47
maligno
0,044267 0,61171 0,631205 0,4969
0,42632 0,9957 0,0022
9,304 0,5828
7,8401
48
maligno
0,021324 0,97808 0,363479 0,4649
0,73763 0,9993 0,0044
8,5321 0,6809
7,5299
48
maligno
0,048666 0,91602 0,445087 0,4318
0,85323 0,9978
0,001 10,3315 0,4147
8,109
50
maligno
0,041031 0,86640 0,484025 0,4159 0,774961 0,999 0,0014
9,8655 0,5011
8,0479
51
maligno
0,040491 0,75538 0,596097 0,4991 0,443559 0,9988 0,0034
8,7429 0,6268
7,4929
52
maligno
0,023732 0,93923 0,403834 0,4685 0,625335 0,9996
0,002
9,4296 0,6303
8,2019
53
maligno
0,050744 0,23344
0,79421 0,2881 0,083718 0,9996 0,0042
8,5489 0,7136
7,6905
54
maligno
0,029082 0,80806 0,576959 0,5025 0,586549 0,9995 0,0027
8,9137 0,6833
7,9115
55
maligno
0,063548 0,43683 0,692689 0,4373 0,149298 0,9992 0,0015
9,7848 0,5502
8,1837
56
maligno
0,073398 0,28817 0,770726 0,2851 0,120387 0,9986 0,0016
9,9894 0,504
8,1051
57
maligno
0,86445 0,9992 0,0012 10,1433 0,5009
8,3344
Casos
Tipo
1
benigno
2
0,05887 0,15056
0,02909 0,92974 0,430635 0,5029
F6
Informações de textura
F9
F10
F7
F8
F11
F12
1,3131
0,0024
3927,2751
0,878
1,3989
1
1,0417
benigno
1,3406
0,0016
9010,6531
0,8997
1,4114
1
1,0035
3
benigno
3,8008
0,0013
5519,9843
2,1433
2,2504
0,9999
1,0125
4
benigno
0,9974
0,0044
1280,4557
0,7071
1,1458
0,9999
1,016
5
benigno
5,3283
0,0017
1702,9965
2,7142
2,5164
0,9991
1,0179
6
benigno
8,0803
0,0009
4319,5527
4,0031
2,8093
0,9995
1,0083
7
benigno
2,4565
0,0017
7773,8277
1,4946
1,9087
0,9999
1,0076
8
benigno
3,7114
0,0014
4061,4512
2,0421
2,2467
0,9998
1,0132
205
9
benigno
4,9532
0,001
5930,5347
2,6766
2,4512
0,9999
1,0097
10
benigno
1,97
0,0022
3003,2565
1,2594
1,7253
0,9999
1,004
11
benigno
0,9522
0,0039
1922,4414
0,688
1,0921
0,9999
1,0026
12
benigno
2,6111
0,0015
4760,4113
1,5552
1,9614
0,9999
1,0039
13
benigno
0,5145
0,0116
584,5843
0,4234
0,4622
0,9998
1,0068
14
benigno
0,736
0,0046
13132,3727
0,6277
0,5864
1
1,0328
15
benigno
3,38
0,0012
8311,1799
1,8952
2,1732
0,9999
1,0101
16
benigno
2,4822
0,0025
2663,5504
1,4915
1,9214
0,9998
1,0182
17
benigno
7,3285
0,0008
6854,9099
3,7574
2,7351
0,9998
1,0293
18
benigno
3,7728
0,0014
3620,6606
2,1143
2,2495
0,9998
1,0583
19
benigno
5,057
0,0012
4623,3262
2,6593
2,472
0,9998
1,0053
20
benigno
3,4094
0,0016
3472,8531
1,9488
2,1733
0,9998
1,0107
21
benigno
1,6698
0,0029
3107,985
1,0686
1,6055
0,9999
1,0546
22
benigno
4,2949
0,0012
4609,8783
2,3405
2,35
0,9998
1,0084
23
benigno
5,1399
0,0009
6626,3881
2,7292
2,4837
0,9998
1,0045
24
benigno
1,3001
0,003
2815,3389
0,8768
1,385
0,9999
1,0173
25
benigno
0,6618
0,005
2054,551
0,5275
0,6987
1
1,0892
26
benigno
0,5834
0,0142
230,6965
0,4663
0,602
0,9992
1,0339
27
benigno
0,6046
0,0098
521,7172
0,4795
0,6403
0,9997
1,007
28
benigno
0,6811
0,0061
1164,8447
0,5294
0,7575
0,9999
1,0049
29
benigno
0,7057
0,0082
658,0703
0,5422
0,7991
0,9997
1,0169
30
benigno
0,6746
0,0053
1819,7928
0,5246
0,7498
0,9999
1,0277
31
benigno
0,7062
0,0065
855,5464
0,5418
0,8006
0,9999
1,0302
32
benigno
0,6161
0,0155
176,0775
0,4971
0,6162
0,999
1,0435
33
benigno
0,6466
0,0069
1317,6549
0,5068
0,7077
0,9999
1,0065
34
benigno
0,6927
0,0054
1485,3408
0,535
0,7789
0,9999
1,0132
35
benigno
0,7299
0,0042
2743,6832
0,5609
0,824
1
1,0052
36
benigno
0,7057
0,0045
4390,9154
0,5582
0,748
1
1,0038
37
benigno
1,1605
0,0024
4065,2222
0,8106
1,2697
1
1,0052
38
maligno
3,0131
0,0023
2022,9845
1,858
2,0209
0,9997
1,0924
39
maligno
3,4897
0,0016
4132,3909
1,923
2,2017
0,9998
1,0936
40
maligno
1,6085
0,0032
1981,2758
1,0717
1,5483
0,9999
1,0078
41
maligno
11,6399
0,0009
4313,8446
5,5039
3,0614
0,999
1,0505
42
maligno
5,7103
0,0009
5801,9487
2,9559
2,5619
0,9998
1,014
43
maligno
3,2257
0,0018
2973,4419
2,0899
2,0042
0,9998
1,021
44
maligno
2,1933
0,0016
6109,2819
1,3436
1,8282
1
1,014
45
maligno
0,7687
0,0027
8037,6411
0,5936
0,8526
1
1,0176
46
maligno
3,6374
0,0039
4663,4038
3,4219
0,7946
1
1,0486
47
maligno
9,1215
0,0022
4203,0124
8,076
1,7868
0,9999
1,0793
48
maligno
0,9606
0,0044
2728,9807
0,6867
1,1078
0,9999
1,0343
49
maligno
5,2416
0,001
4741,1939
2,7179
2,5024
0,9998
1,0085
50
maligno
3,0491
0,0014
5905,5467
1,7494
2,0942
0,9999
1,0093
51
maligno
1,3569
0,0034
2346,3182
0,9009
1,4277
0,9999
1,0071
206
52
maligno
1,3179
0,002
6634,9846
0,8771
1,4048
1
1,0122
53
maligno
0,7907
0,0042
4023,0391
0,5953
0,9089
1
1,0046
54
maligno
0,9598
0,0027
4168,7715
0,6915
1,1016
1
1,0128
55
maligno
2,2132
0,0015
5596,5702
1,3388
1,8412
0,9999
1,0069
56
maligno
3,7743
0,0016
5501,6325
2,3625
2,178
0,9999
1,0325
57
maligno
3,0165
0,0012
7632,4635
1,7243
2,0848
0,9999
1,0222
Download

UNIVERSIDADE PAULISTA – UNIP FÁBIO VIEIRA DO AMARAL