Universidade de São Paulo Escola de Engenharia de São Carlos Departamento de Engenharia Elétrica @LADIM – SEL - EESC - USP CHOPI – CCIFM - HCFMRP - USP Recuperação Baseada em Conteúdo de Imagens Mamográficas: Atributos Visuais de Forma, Espectrais no domínio de Radon e Granulometria Autores: Sérgio K. Kinoshita, R. R. Pereira Júnior, M.O. Honda, J.A.H. Rodrigues e Paulo M. de Azevedo Marques. Introdução 1. Câncer de mama é a principal causa de mortalidade na população feminina de acordo com ACS1 e o INC/MS2; 2. Mamografia é considerada a forma mais eficaz para a detecção precoce de câncer de mama, permitindo a identificação da lesão quando ainda não é palpável. 3. Associação da densidade mamária com o risco de desenvolvimento de câncer da mama (Wolfe, 1976). Vários trabalhos, até hoje, utilizam a medida de densidade como fator de risco de câncer de mama de acordo com o padrão de Wolfe. Existe controvérsia na adoção desse padrão, mas há a unanimidade de que a densidade mamária é um fator importante na avaliação da mamografia. 4. Surgimento de padrões com o objetivo da caracterização da densidade mamária Padrão BI-RADS 1American 2 Cancer Society, Cancer Facts and Figures, NY, 2004. Instituto Nacional de Cancer – Ministério da Saúde, 2003. Wolfe, JN (1976), “Risk for breast cancer development determined by mammographic parenchymal pattern”, Cancer, V.37, p.2486-92. 2 Introdução Padrão BI-RADS( descrição, enquadramento da mama e recomendações de conduta e conclusões) • Composição: é importante para especificar o grau de sensibilidade que se espera no diagnóstico. • • Categoria: é utilizado para classificar a mama de acordo com os achados radiológicos. • 1American Composição 1, 2, 3 e 4. Categoria 0, 1, 2, 3, 4A, 4B, 4C e 5. College of Radiology – Breast Imaging Reporting and Data System, 4th edition, 2003. 3 Introdução 5. Análise da mamografia pelo radiologista Padrão ( descrição e enquadramento, conclusão e conduta) TodoBI-RADS o processo é feito de forma visual e envolve alto grau de subjetividade. • Composição: é importante para especificar o grau de sensibilidade que se espera no diagnóstico. 6. Sistema Computadorizado de Auxílio ao Diagnóstico (CAD) • Composição 2, 3 e 4.dos trabalhos em análise de densidade em Representa a 1, maioria mamografia e tem objetivos bem definidos ao resultado •Categoria: é utilizado para classificar a mamaquanto de acordo com os esperado achados (classificação no padrão Wolfe e BI-RADS). mamográficos. 7. Sistema de Recuperação de4B, Imagens •Categoria 0, 1, 2, 3, 4A, 4C e 5. Baseado em Conteúdo (CBIR) Não trabalhos existe trabalho de análise de densidade em CBIR. •Vários realizam a caracterização de acordo com esse padrão. A busca de imagens é feita através de atributos visuais de similaridade. 4 Objetivo Investigar atributos visuais para a recuperação de imagens mamográficas baseado em conteúdo (CBIR) que levem em consideração a densidade de tecidos mamários, quanto à sua distribuição e intensidade. 5 Metodologia Esquema Geral Teste (consulta) Extração e Seleção de Atributos Atributos Visuais Treinamento Classificação e Comparação por Similaridade Imagem Recuperada Imagem Digitalizada Preparação e Processamento da Imagem Banco de Imagem 6 Metodologia Imagem Digitalizada Imagens selecionadas pertencem ao projeto de Banco de Imagens do HCFMRP-USP, módulo Mamografia, processo HCRP número 10093/2003. Foram selecionados 270 casos, correspondendo à 1080 imagens 270 CC direita, 270 CC esquerda, 270 MLO direita e 270 MLO esquerda. As imagens foram acompanhadas de respectivo laudo médico. A descrição dos laudos acompanha o padrão BI-RADS e contém descrições de características de simetria, classificação volumétrica, distribuição e forma da densidade mamária, classificação da composição da mama (1,2,3 ou 4), classificação da categoria (0,1,2,3,4A,4B,4C ou 5), etc. As imagens foram digitalizadas com resolução espacial de 300 dpi (84,67 m) e 12 bits de quantização (4096 níveis de cinza). Foram digitalizados 148 filmes mamográficos com dimensão de 240x300 mm e 932 filmes com dimensão de 180 x 240 mm. Após realizados recortes na imagem para eliminação da identificação da paciente, redimensionamento da imagem para 1024x1024, o tamanho dos pixels passaram a ter os tamanhos de 223,50 m e 279,40 m, de acordo com a dimensão do filme. 7 Metodologia Extração e Seleção de Atributos Extração de Atributos de Forma Os atributos utilizados pertencem aos grupos de textura e forma. Atributos de forma de área, solidez e razão de diâmetro. Atributos de Medida de Granulometria. Atributos Espectrais no Domínio de Radon 8 Metodologia Extração e Seleção de Atributos Extração de Atributos de Forma Área da Região da Mama A mais simples maneira de calcular a área de um objeto em uma imagem, é contar o número de pixels do objeto. O valor da área foi normalizado e transformado em milimetro. N: número de pixels do objeto. L N g h( g ) L: número de níveis de cinza do objeto. h(g): a freqüência de nível de cinza g que pertence ao objeto. A N tp n 2 A: área em milimetross tp: o tamanho do pixel (0,2235mm ou 0,2794mm) n2: o número total de pixels na imagem 9 Metodologia Extração e Seleção de Atributos Extração de Atributos de Forma Solidez, Compacidade ou Compactação Determina a razão do perímetro (P) e a área do objeto (A). A equação foi alterada de tal forma que para objetos semicirculares o valor aproxima de zero e aumenta de acordo com a complexidade ou rugosidade da forma. S P 2 A S 1 2 A P 2 10 Metodologia Extração e Seleção de Atributos Extração de Atributos de Forma Medida de Razão de Diâmetro Este atributo fornece o grau de elongação da forma da mama. Quanto maior o valor do atributo, mais elongado será a sua forma; caso contrário, a mama terá a forma achatada. CC MLO Dx Dy Dy RD Dy Dx Dx 11 Metodologia Extração e Seleção de Atributos Extração de Atributos de Forma a b Razão de Diâmetro (RD) Imagem Área (A) Solidez (S) Imagem (a) 0,0998 0,7958 1,5916 Imagem (b) 0,0211 0,8087 0,7904 Medidas de atributos de forma extraídos das imagens (área, solidez e razão de diâmetro). 12 Metodologia Extração e Seleção de Atributos Medida de Granulometria Fornece a distribuição dos tamanhos dos objetos presentes em uma amostra. São aplicados filtros morfológicos de abertura com elemento estruturante de tamanho crescente na imagem original. A diferença entre a imagem original e a imagem filtrada é computada a cada passagem crescente do elemento estruturante no filtro morfológico. No final do processo, essas diferenças são normalizadas e usadas na construção de um histograma de distribuição dos tamanhos dos objetos presentes na imagem. Na mamografia, a densidade comumente aparece com aspecto granular que pode interferir na exatidão da caracterização de achados na região da mama. Extraímos a distribuição da imagem da região fibro-glandular segmentada e aplicamos o filtro morfológico com elemento estruturante com formato circular e raio variando entre 5 e 60 pixels. Utilizamos o histograma de distribuição como atributo de medida de granulometria. 13 Metodologia Extração e Seleção de Atributos Medida de Granulometria Processo de extração de atributo de medida de Granulometria. (a) imagem original; (b) imagem com a região de tecido fibro-glandular segmentada; (c) imagem numa etapa de filtragem de abertura morfológica; (d) o histograma da quantidade de pixels em função do raio de abertura do elemento estruturante. 14 Metodologia Extração e Seleção de Atributos Domínio de Radon Ilustração de uma imagem em nível de cinza e o domínio de Radon aplicada a transformada de Radon. 15 Metodologia Extração e Seleção de Atributos Domínio de Radon No domínio de Radon, valores de picos representam altas intensidades numa determinada direção da imagem. A posição e direção destes picos são facilmente identificadas na imagem. Separamos o domínio de Radon R(t,) em duas funções unidimensionais da intensidade em função da posição R(t) e direção R(). Para analisar o comportamento das funções, extraímos os valores de Média, Momentos centrado na média (Desvio-padrão, Skewness e Kurtosis) e Entropia. 16 Metodologia Extração e Seleção de Atributos Domínio de Radon Gráfico das funções de decomposição do domínio de Radon. (a) imagem com a região fibro-glandular segmentada; (b) Domínio de Radon R(t,); (c-d) as funções decompostas Rt() e R(t). 17 Metodologia Extração e Seleção de Atributos Exemplo do Domínio de Radon Função Média Rt() 85,9352 R(t) 17,3467 Desviopadrão Skewness Kurtosis Entropia 53,2773 0,1314 1,7293 0,0082 218,5510 -0,0306 2,6100 0,0018 Medidas de momentos estatísticos extraídos dos gráficos Rt( e R(t) . 18 Metodologia Extração e Seleção de Atributos Seleção de Atributos Este processo definiu a combinação de atributos que irão compor o conjunto de vetores de entrada para o treinamento e teste da rede SOM de Kohonen. Foram realizadas combinações de atributos que variaram entre 10 e 33, foi utilizado o método de Análise de Componentes Principais (PCA) para redução da dimensionalidade. Os conjuntos de atributos foram normalizados para o intervalo [-1,1] antes da redução da dimensionalidade, utilizando a equação (1). Após a redução da dimensionalidade, os valores foram normalizados para o intervalo [0,1] para a entrada da rede SOM, utilizando a equação (2). (1) x x (2) x x x min x max x min 19 Metodologia Sistema CBIR com Rede SOM Definição dos Grupos de Amostras de Treinamento e Teste A amostra de atributos extraídas das imagens foi dividida em treinamento e teste, utilizando o método “leaving-one-out”. As imagens foram agrupadas em amostras de 270 imagens, sendo 269 imagens para treinamento e 1 imagem para teste, até completar o conjunto da amostra. Com isso, a avaliação do grau de generalização do classificador ficou, desta forma, garantida. 20 Metodologia Sistema CBIR com Rede SOM A Rede de Mapa Auto-Organizável de Kohonen (SOM) Adotamos a topologia de grade de 16x16 neurônios, totalizando 256 neurônios na camada de saída. Para o treinamento, adotamos o valor máximo de 8.000 epochs e a taxa de aprendizagem não fixada. 21 Metodologia Sistema CBIR com Rede SOM A Rede de Mapa Auto-Organizável de Kohonen (SOM) 22 Metodologia Avaliação do Sistema CBIR Avaliação do desempenho do sistema de recuperação Na saida da rede SOM, cada imagem teste foi classificada dentro de um grupo de imagens de acordo com a similaridade dos atributos utilizados. Para avaliar o desempenho do sistema de recuperação, utilizou-se a taxa de precisão pela classificação da composição dos tecidos pelo critério BI-RADS registrada no laudo médico da paciente. A classificação levou em consideração a variabilidade existente entre os observadores na descrição da composição dos tecidos no laudo médico. Foram calculadas as taxas médias de precisão entre a imagem de consulta e as imagens recuperadas. O coeficiente de correlação médio e o desvio-padrão foram calculados com o objetivo de demonstrar a correlação entre as imagens recuperadas e as imagens de consulta. 23 Metodologia Avaliação do Sistema CBIR Avaliação pela taxa de precisão da classificação da composição dos tecidos Para o cálculo da correlação, utilizamos um sistema de alinhamento entre as imagens (consulta e recuperadas). f ( x, y) N N cc ( f , g ) x f g( x, y) g y N N 2 2 f ( x , y ) f g ( x , y ) g x y 1 2 24 Metodologia Avaliação do Sistema CBIR Avaliação pela taxa de precisão da classificação da composição dos tecidos Imagens recuperadas com o atributo no domínio de Radon. Em (a) a imagem teste com composição 4, classificadas no padrão BI-RADS; em (b-d) imagem recuperada com composições diferentes. 25 Metodologia Avaliação do Sistema CBIR Avaliação pela taxa de precisão da classificação da composição dos tecidos Composição da imagem teste Faixa de classes consideradas pela composição de tecidos na classificação 1 1e2 2 1, 2 e 3 3 2, 3 e 4 4 3e4 Tabela do critério usado na classificação das imagens recuperadas considerando a variabilidade ocorrida durante a avaliação da imagem de acordo com a composição no padrão BI-RADS. 26 Metodologia Avaliação do Sistema CBIR Resultados da avaliação pela taxa de precisão da classificação da composição dos tecidos Taxa de Precisão Grupo de Atributos Coeficiente de Correlação ( ) 82,86% Domínio de Radon 0,8378 0,1014 81,81% Medida de Granulometria 0,8383 0,0925 84,74% Forma e Domínio de Radon 0,8478 0,0902 82,02% Forma e Medida de Granulometria 0,8381 0,0947 84,50% Forma, Domínio de Radon e Medida de Granulometria 0,8472 0,0949 Os melhores resultados obtidos pela classificação da composição dos tecidos, de acordo com o padrão BIRADS, para cada combinação de atributos. 27 Metodologia Avaliação do Sistema CBIR Resultados da avaliação pela taxa de precisão da classificação da composição dos tecidos Os resultados indicam a relevância dos atributos investigados para a recuperação baseada em conteúdo de imagens mamográfricas. 28 Universidade de São Paulo Escola de Engenharia de São Carlos Departamento de Engenharia Elétrica @LADIM – SEL - EESC - USP CHOPI – CCIFM - HCFMRP - USP Recuperação Baseada em Conteúdo de Imagens Mamográficas: Atributos Visuais de Forma, Espectrais no domínio de Radon e Granulometria Fim da Apresentação Autores: Sérgio K. Kinoshita, R. R. Pereira Júnior, M.O. Honda, J.A.H. Rodrigues e Paulo M. de Azevedo Marques.