Logo Studenta

DocsTec-5289

¡Este material tiene más páginas!

Vista previa del material en texto

Detección Automática de Agrupamientos
de Microcalcificaciones en Mamograf́ıas
Digitalizadas
T E S I S
Maestŕıa en Ciencias en Sistemas Inteligentes
Instituto Tecnológico y de Estudios Superiores de Monterrey
Por
Samuel Alonso Oporto Dı́az
Diciembre 2004
Detección Automática de Agrupamientos
de Microcalcificaciones en Mamograf́ıas
Digitalizadas
TESIS
Maestŕıa en Ciencias en
Sistemas Inteligentes
Instituto Tecnológico y de Estudios Superiores de Monterrey
Por
Samuel Alonso Oporto Dı́az
Diciembre 2004
Instituto Tecnológico y de Estudios Superiores de
Monterrey
División de Graduados en Electrónica, Computación,
Información y Comunicaciones
Dirección de Programas de Posgrado en Electrónica, Computación,
Información y Comunicaciones
Los miembros del comité de tesis recomendamos que la presente tesis de Samuel
Alonso Oporto Dı́az sea aceptada como requisito parcial para obtener el grado
académico de Maestro en Ciencias en:
Sistemas Inteligentes
Comité de tesis:
Dr. Hugo Terashima Maŕın
Asesor de la tesis
MSc. Santiago Enrique Conant
Pablos
Sinodal
MSc. Rolando Rafael Hernández
Cisneros
Sinodal
Dr. David A. Garza Salazar.
Director del Programa de Graduados
en Electrónica, Computación,
Información y Comunicaciones
Diciembre de 2004
Detección Automática de Agrupamientos
de Microcalcificaciones en Mamograf́ıas
Digitalizadas
Por
Samuel Alonso Oporto Dı́az
TESIS
Presentada a la División de Electrónica, Computación, Información y Comunicaciones
Este trabajo es requisito parcial para obtener el grado académico de Maestro en
Ciencias en Sistemas Inteligentes
Instituto Tecnológico y de Estudios Superiores de Monterrey
Campus Monterrey
Monterrey, N.L. Diciembre de 2004
Quiero dedicar esta tesis a mi esposa Sandra por su apoyo y comprensión por el
tiempo que he estado lejos. A mi hijo Alberto, por el tiempo que le he quitado en
desarrollar este trabajo. A mi madre Marina por su ejemplo de dedicación y esfuerzo.
A mi padre Eleazar por su apoyo. A Illa Ticsi por la motivación y el reto constante
que representa.
Reconocimientos
Deseo expresar un sincero agradecimiento a las personas que de alguna forma
colaboraron en el desarrollo de esta tesis.
A los integrantes del comité de tesis, el Dr. Hugo Terashima Maŕın, el MSc. San-
tiago Enrique Conant Pablos y el MSc. Rolando Rafael Hernández Cisneros, por su
apoyo constante en la direccionar el curso de la investigación.
A mis profesores del Centro de Sistemas Inteligentes por todos los conocimientos
que pusieron a disposición.
A mis compañeros del post-grado con quienes pasamos juntos múltiples amaneci-
das.
Samuel Alonso Oporto Dı́az
Instituto Tecnológico y de Estudios Superiores de Monterrey
Diciembre 2004
xi
Detección Automática de Agrupamientos
de Microcalcificaciones en Mamograf́ıas
Digitalizadas
Samuel Alonso Oporto Dı́az, M.C.
Instituto Tecnológico y de Estudios Superiores de Monterrey, 2004
Asesor de la tesis: Dr. Hugo Terashima Maŕın
La mamograf́ıa es una técnica no invasiva que permite el diagnóstico de cáncer
de mama. Es una representación bidimensional del grado de atenuación cuando los
rayos X pasan a través de un objeto tridimensional, la mama. Las calcificaciones son
pequeñas acumulaciones de calcio que se forman dentro de los ductos mamarios; su
etioloǵıa y localización determinan el tamaño, la forma y la relación que existe entre
ellas. Las técnicas de diagnóstico automático usan estas propiedades para la toma de
decisiones: calcificaciones aisladas o grandes tienen baja probabilidad de ser malignas,
pero calcificaciones pequeñas formando grupos de tres o más tienen alta probabilidad
de ser malignas.
Esta investigación pretende desarrollar un procedimiento para el diagnóstico au-
tomático del cáncer de mama desde mamograf́ıas digitalizadas, mediante la detección
de agrupamientos de calcificaciones. 22 imágenes con 252 calcificaciones en total for-
mando 27 regiones de interés tomadas de la base de datos de The Mammographic Image
Analysis Society (MIAS), se usaron para probar el desempeño del procedimiento.
La hipótesis que se intenta demostrar es que un sistema para la detección au-
tomática de agrupamientos de calcificaciones tiene mayor probabilidad de encontrar
casos malignos, que sólo detectando calcificaciones individuales. El sistema propor-
cionará mayor cantidad de información para que el especialista tome una decisión.
El procedimiento propuesto está conformado por cinco etapas. En resumen se
pretende detectar y segmentar regiones sospechosas de ser calcificaciones, para luego
agruparlas. El diagnóstico final puede tener dos resultados: la mamograf́ıa no presenta
agrupamientos o la mamograf́ıa presenta agrupamientos de calcificaciones y en este caso
indicar si son benignos o malignos.
Índice general
Reconocimientos XI
Resumen XIII
Índice de cuadros XIX
Índice de figuras XXI
Caṕıtulo 1. Introducción 1
1.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2. Definición del problema . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.3. Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.4. Preguntas de la investigación . . . . . . . . . . . . . . . . . . . . . . . . 7
1.5. Hipótesis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.6. Metodoloǵıa de la investigación . . . . . . . . . . . . . . . . . . . . . . 8
1.7. Alcances y limitaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.8. Organización del documento . . . . . . . . . . . . . . . . . . . . . . . . 11
Caṕıtulo 2. Revisión de la Literatura 13
2.1. Investigaciones recientes . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.2. Base de datos de imágenes . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.3. Cáncer de mama . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.3.1. Factores de riesgo . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.3.2. Técnicas de diagnóstico . . . . . . . . . . . . . . . . . . . . . . . 19
2.4. Mamograf́ıa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.4.1. Tejido predominante . . . . . . . . . . . . . . . . . . . . . . . . 21
2.4.2. Proyecciones básicas . . . . . . . . . . . . . . . . . . . . . . . . 21
2.4.3. Mamograf́ıa digital . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.5. Proceso de diagnóstico del cáncer de mama . . . . . . . . . . . . . . . . 22
2.6. Hallazgos en la mamograf́ıa . . . . . . . . . . . . . . . . . . . . . . . . 23
2.6.1. Clasificación BI-RADS . . . . . . . . . . . . . . . . . . . . . . . 24
2.6.2. Calcificaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
xv
2.6.3. Tipos de calcificaciones . . . . . . . . . . . . . . . . . . . . . . . 26
2.6.4. Tipos de agrupamientos de calcificaciones . . . . . . . . . . . . 30
2.7. Procesamiento de imágenes . . . . . . . . . . . . . . . . . . . . . . . . 30
2.8. Técnicas para la detección de calcificaciones . . . . . . . . . . . . . . . 32
2.9. Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
Caṕıtulo 3. Modelo de Solución 35
3.1. Modelo de solución . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
3.2. Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
Caṕıtulo 4. Preprocesamiento 39
4.1. Filtro mediana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
4.2. Imagen binaria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
4.3. Corte automático . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
4.4. Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
Caṕıtulo 5. Detección de Potenciales Microcalcificaciones 45
5.1. Diferencia de filtros gaussianos . . . . . . . . . . . . . . . . . . . . . . . 47
5.1.1.Aplicación del filtro DoG . . . . . . . . . . . . . . . . . . . . . . 49
5.2. Binarización . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
5.3. Etiquetado de regiones . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
5.3.1. Vecindad de pixeles . . . . . . . . . . . . . . . . . . . . . . . . . 53
5.3.2. Etiquetado de regiones . . . . . . . . . . . . . . . . . . . . . . . 53
5.4. Selección de puntos por área mı́nima . . . . . . . . . . . . . . . . . . . 56
5.5. Segmentación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
5.6. Selección de puntos por gris mı́nimo . . . . . . . . . . . . . . . . . . . . 58
5.7. Selección por gradiente mı́nimo . . . . . . . . . . . . . . . . . . . . . . 60
5.8. Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
Caṕıtulo 6. Clasificación de Señales en Microcalcificaciones 61
6.1. Extracción de caracteŕısticas . . . . . . . . . . . . . . . . . . . . . . . . 62
6.1.1. Contraste de la señal . . . . . . . . . . . . . . . . . . . . . . . . 64
6.1.2. Contraste del fondo . . . . . . . . . . . . . . . . . . . . . . . . . 65
6.1.3. Contraste relativo . . . . . . . . . . . . . . . . . . . . . . . . . . 66
6.1.4. Caracteŕısticas de forma . . . . . . . . . . . . . . . . . . . . . . 67
6.1.5. Momentos de la secuencia de contorno . . . . . . . . . . . . . . 72
6.1.6. Momentos geométricos invariantes . . . . . . . . . . . . . . . . 74
6.1.7. Resumen de caracteŕısticas . . . . . . . . . . . . . . . . . . . . . 76
6.2. Selección de caracteŕısticas . . . . . . . . . . . . . . . . . . . . . . . . . 78
6.2.1. Correlación entre caracteŕısticas . . . . . . . . . . . . . . . . . . 78
6.2.2. Selección de caracteŕısticas . . . . . . . . . . . . . . . . . . . . . 78
xvi
6.2.3. Discretización . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
6.2.4. Ganancia de información . . . . . . . . . . . . . . . . . . . . . . 83
6.2.5. Derivación de la búsqueda secuencial hacia adelante . . . . . . . 86
6.3. Diseño del clasificador . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
6.3.1. Redes neuronales artificiales . . . . . . . . . . . . . . . . . . . . 89
6.3.2. Arquitectura de la red . . . . . . . . . . . . . . . . . . . . . . . 89
6.3.3. Normalización de datos . . . . . . . . . . . . . . . . . . . . . . . 90
6.3.4. Estimador por validación cruzada de K-conjuntos . . . . . . . . 92
6.4. Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
Caṕıtulo 7. Detección de Agrupamientos de Calcificaciones y Extracción
de Caracteŕısticas 95
7.1. Detección de agrupamientos de calcificaciones . . . . . . . . . . . . . . 97
7.1.1. Búsqueda del siguiente agrupamiento . . . . . . . . . . . . . . . 99
7.2. Extracción de caracteŕısticas . . . . . . . . . . . . . . . . . . . . . . . . 100
7.2.1. Forma del agrupamiento . . . . . . . . . . . . . . . . . . . . . . 100
7.2.2. Área de las calcificaciones . . . . . . . . . . . . . . . . . . . . . 102
7.2.3. Contraste de las calcificaciones . . . . . . . . . . . . . . . . . . . 103
7.2.4. Resumen de caracteŕısticas . . . . . . . . . . . . . . . . . . . . . 104
7.3. Selección de caracteŕısticas . . . . . . . . . . . . . . . . . . . . . . . . . 105
7.4. Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
Caṕıtulo 8. Experimentación y Análisis de Resultados 107
8.1. Plataforma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
8.2. Base de Datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
8.2.1. Resumen de la base de datos. . . . . . . . . . . . . . . . . . . . 107
8.2.2. Detalle de la base de datos. . . . . . . . . . . . . . . . . . . . . 108
8.2.3. Análisis de la base de datos de la MIAS. . . . . . . . . . . . . . 111
8.2.4. Preparación de los datos de prueba . . . . . . . . . . . . . . . . 113
8.3. Diseño del experimento . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
8.3.1. Sensibilidad y especificidad de un experimento . . . . . . . . . . 121
8.4. Experimentación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
8.4.1. Extracción de puntos con 15 filtros DoG y 51 umbrales . . . . . 123
8.4.2. Preprocesamiento . . . . . . . . . . . . . . . . . . . . . . . . . . 130
8.4.3. Detección de señales . . . . . . . . . . . . . . . . . . . . . . . . 132
8.4.4. Muestreo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147
8.4.5. Extracción de caracteŕısticas . . . . . . . . . . . . . . . . . . . . 148
8.4.6. Selección de caracteŕısticas . . . . . . . . . . . . . . . . . . . . . 152
8.4.7. Detección de agrupamientos . . . . . . . . . . . . . . . . . . . . 176
8.5. Prueba de la hipótesis . . . . . . . . . . . . . . . . . . . . . . . . . . . 190
xvii
8.6. Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 194
Caṕıtulo 9. Conclusiones y Trabajos Futuros 195
9.1. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195
9.2. Contribuciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 200
9.3. Trabajos futuros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201
Bibliograf́ıa 203
Vita 213
xviii
Índice de cuadros
2.1. Resumen de art́ıculos relacionados con la detección de calcificaciones y
agrupamiento de calcificaciones. . . . . . . . . . . . . . . . . . . . . . . 14
2.2. Base de datos de mamograf́ıas. . . . . . . . . . . . . . . . . . . . . . . . 17
2.3. Trabajos de investigación que usaron la base de datos de la MIAS para
la detección de calcificaciones. . . . . . . . . . . . . . . . . . . . . . . . 17
2.4. Trabajos de investigación que usaron la base de datos de la MIAS para
la detección de agrupamientos de calcificaciones. . . . . . . . . . . . . . 18
2.5. Sistemas de mamograf́ıa digital aprobadas por la FDA . . . . . . . . . 22
2.6. Clasificación BI-RADS . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.7. Formato para el reporte de calcificaciones, según la clasificación BI-RADS 27
6.1. Momentos de la secuencia de contorno y descriptores modificados por
Shen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
6.2. Resumen de caracteŕısticas extráıdas desde las señales. . . . . . . . . . 76
7.1. Resumen de caracteŕısticas extráıdas desde los agrupamientos. . . . . . 104
8.1. Resumen de la base de datos de la MIAS, por tipo de hallazgo y tipo de
tejido. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
8.2. Detalle de la base de datos de la MIAS, imágenes con calcificaciones. . 109
8.3. Número de regiones y número de calcificaciones por imagen. . . . . . . 112
8.4. Número de puntos extráıdos automáticamente y número de calcifica-
ciones identificadas manualmente. . . . . . . . . . . . . . . . . . . . . . 117
8.5. Calcificaciones identificadas. Mamograf́ıas mdb209, mdb211, mdb213,
mdb216, mdb218, mdb219, mdb222, mdb223, mdb226, mdb227. . . . . 118
8.6. Calcificaciones identificadas. Mamograf́ıas mdb231, mdb233, mdb236,
mdb238, mdb239 y mdb241. . . . . . . . . . . . . . . . . . . . . . . . . 119
8.7. Calcificaciones identificadas. Mamograf́ıas mdb245, mdb248, mdb249,
mdb252, mdb253 y mdb256. . . . . . . . . . . . . . . . . . . . . . . . . 120
8.8. Ejemplo de puntos seleccionados (x,y), cercanos al centroide (rx, ry). . 127
8.9. Tamaño y desviación estándar de filtros. . . . . . . . . . . . . . . . . . 134
8.10. Umbral de binarización calculado para 15 filtros DoG. . . . . . . . . . . 143
xix
8.11. Número de puntos VP detectados por cada filtro DoG, considerando 51
umbrales de binarización. . . . . . . . . . . . . . . . . . . . . . . . . . . 144
8.12. Número de casos VP en cada muestra. . . . . . . . . . . . . . . . . . . 147
8.13. Estad́ısticos para las 47 caracteŕısticas extráıdas desde puntos (1’242,179
puntos). . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149
8.14. Estad́ısticos para las 47 caracteŕısticas extráıdas desde puntos cercanos
(8,566 puntos). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150
8.15. Matriz de correlación. Caracteŕısticas de contraste. . . . . . . . . . . . 152
8.16. Matriz de correlación. Caracteŕısticas de forma (área y peŕımetro). . . . 153
8.17. Matriz de correlación. Caracteŕısticas de forma 1. . . . . . . . . . . . . 154
8.18. Matriz de correlación. Caracteŕısticas de forma 2. . . . . . . . . . . . . 155
8.19. Matriz de correlación. Caracteŕısticas del momento de secuencia de con-
torno. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156
8.20. Ganancia de información y coeficiente de correlación. . . . . . . . . . . 160
8.21. Resultados obtenidos para clasificar señales en calcificaciones. . . . . . 175
8.22. Número de calcificaciones según la técnica y el radio. . . . . . . . . . . 179
8.23. Ejemplos de caracteŕısticas extráıdas desde 40 agrupamientos. . . . . . 180
8.24. Estad́ısticos para las 30 caracteŕısticas extráıdas desde los agrupamientos.183
8.25. Ejemplos de caracteŕısticas extráıdas desde 22 agrupamientos. . . . . . 184
8.26. Resultados obtenidos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191
8.27. Tabla ANOVA. 2 tratamientos . . . . . . . . . . . . . . . . . . . . . . . 193
8.28. Tabla ANOVA. 4 tratamientos . . . . . . . . . . . . . . . . . . . . . . . 193
xx
Índice de figuras
1.1. Relación entre verdaderos positivos (V+), verdaderos negativos (V-),
falsos positivos (F+) y falsos negativos (F-). . . . . . . . . . . . . . . . 4
1.2. Procedimientos usados en la solución del problema. . . . . . . . . . . . 5
1.3. Número de agrupamientos de microcalcificaciones en una imagen. . . . 9
2.1. Anatomı́a de las mamas y ejemplo de mamograf́ıa. . . . . . . . . . . . . 20
2.2. Tipo de tejido predominante. a). Graso, b). Graso glandular, c) Denso. 21
2.3. Proyecciones básicas. a). Cráneo-caudal, b). Oblicua medio-lateral. . . . 22
2.4. Hallazgos en la mamograf́ıa. . . . . . . . . . . . . . . . . . . . . . . . . 23
2.5. Tipo de calcificaciones, según la clasificación BI-RADS. . . . . . . . . . 28
3.1. Modelo de solución de la investigación. . . . . . . . . . . . . . . . . . . 35
4.1. Diagrama de flujo. Etapa de preprocesamiento. . . . . . . . . . . . . . 39
4.2. Aplicación del filtro mediana. a) imagen original, b) imagen con ruido,
c) filtro mediana de 3x3 y d) filtro promediador de 3x3. . . . . . . . . . 40
4.3. Creación de la imagen binaria. a) imagen original, b) imagen binaria. . 41
4.4. Histograma del porcentaje de la imagen que ocupa la mama. . . . . . . 42
4.5. Resultados del corte automático. a). imagen binaria (espejo), b). ima-
gen binaria sin regiones aisladas, c). determinación de los extremos para
ejecutar los cortes y d). imagen binaria luego del corte horizontal y vertical. 43
4.6. Resultados del corte automático. Imagen original e imagen resultante. . 44
5.1. Diagrama de flujo. Etapa de detección de microcalcificaciones. . . . . . 45
5.2. Nombres que adquieren las regiones identificadas en la mamograf́ıa. . . 46
5.3. Ejemplo de una función de distribución gaussiana en 2-D. . . . . . . . . 47
5.4. Ejemplos de máscaras gaussianas usadas con el filtro DoG. a). Máscara
5x5 con σ1 ≈ 0,7618, b). Máscara 7x7 con σ2 ≈ 0,8226 y c). Máscara
7x7 del filtro DoG. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
5.5. Gráfica de las máscaras Gaussianas usadas con el filtro DoG. . . . . . . 48
xxi
5.6. Aplicación de un filtro gaussiano 1-D, a). vector de datos, b). resultado de
restar los datos filtrados, c). datos filtrados con la máscara [2, 4, 9, 4, 2],
d). datos filtrados con la máscara [2, 4, 8, 16, 8, 4, 2]. . . . . . . . . . . . 50
5.7. Aplicación de filtro [DoG(5x5, 7x7)]. . . . . . . . . . . . . . . . . . . . 51
5.8. Aplicación de filtro [DoG(5x5, 9x9)]. . . . . . . . . . . . . . . . . . . . 51
5.9. Histograma t́ıpico de la imagen generada luego de aplicar el filtro DoG. 52
5.10. Resultados obtenidos para diferentes umbrales a). DoG(5x5, 7x7) y b).
DoG(5x5, 9x9). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
5.11. Tipos de vecindad: a). Vecindad V4, b). Vecindad V8. . . . . . . . . . . 53
5.12. Máscara usada en el algoritmo de coloreado de regiones. . . . . . . . . 53
5.13. Etiquetado de regiones. a). Imagen original, b). Imagen coloreada . . . 55
5.14. Etiquetado de regiones. a) imagen binarizada, b) etiquetado de regiones,
c) regiones seleccionadas como puntos. . . . . . . . . . . . . . . . . . . 57
5.15. Ejemplo de múltiples puntos ubicados en la misma ventana. a) imagen
preprocesada, b) ventana extráıda, c). ventana segmentada. . . . . . . . 58
5.16. Cálculo del gris promedio. a). niveles de gris (MI), b). máscara de la
región de interés (MD), c). región de interés. Promedio total = 166,
Promedio ROI = 175. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
6.1. Diagrama de flujo. Etapa de extracción de caracteŕısticas y clasificación. 61
6.2. Señales. a) Imagen en escala de grises, b) Imagen binaria, c) Imagen en
escala de grises, con ceros en los pixeles del fondo y d) Imagen en escala
de grises con ceros en los pixeles de la señal . . . . . . . . . . . . . . . 63
6.3. Asimetŕıa de una distribución de frecuencias. . . . . . . . . . . . . . . . 65
6.4. Kurtosis de una distribución de frecuencias. . . . . . . . . . . . . . . . 66
6.5. Área convexa. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
6.6. Peŕımetro de la señal. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
6.7. Diámetro máximo y diámetro mı́nimo. . . . . . . . . . . . . . . . . . . 68
6.8. Longitud de fibra y ancho de fibra. . . . . . . . . . . . . . . . . . . . . 69
6.9. Enrollamiento de algunas formas. . . . . . . . . . . . . . . . . . . . . . 70
6.10. Elongación de dos objetos. a). alta elongación, b). baja elongación. . . . 71
6.11. Solidez de algunos objetos: a). 0.90, b). 0.85, c). 0.84, d). 0.75, e). 1.00 72
6.12. Firma de un objeto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
6.13. Selección de caracteŕısticas. . . . . . . . . . . . . . . . . . . . . . . . . 79
6.14. Maldición de la dimensionalidad. . . . . . . . . . . . . . . . . . . . . . 79
6.15. Diagrama de flujo. Selección de caracteŕısticas. . . . . . . . . . . . . . . 81
6.16. Ejemplo de discretización de valores. . . . . . . . . . . . . . . . . . . . 83
6.17. Cálculo de la entroṕıa. . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
6.18. Ganancia de información. a). conjunto global (3 valores). b). atributo (4
valores) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
xxii
6.19. Ejemplo de las mejores caracteŕısticas seleccionadas. . . . . . . . . . . . 87
6.20. Tipos de clasificadores. . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
6.21. Arquitectura de la red neuronal . . . . . . . . . . . . . . . . . . . . . . 90
6.22. Normalización de datos al rango [-1, 1] . . . . . . . . . . . . . . . . . . 91
6.23. Estimador por validación cruzada con K conjuntos . . . . . . . . . . . . 92
7.1. Cálculo del radio del agrupamiento. . . . . . . . . . . . . . . . . . . . . 95
7.2. Diagrama de flujo general. Etapa de detección de agrupamientos de cal-
cificaciones. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
7.3. Diagrama de flujo. Detección de agrupamientos de calcificaciones. . . . 97
7.4. Preparación de puntos y bordes. . . . . . . . . . . . . . . . . . . . . . . 98
7.5. Cálculo de la densidad de puntos. . . . . . . . . . . . . . . . . . . . . . 99
7.6. a). Agrupamiento original, b). Envolvente convexa y c). Cierre convexo. 101
7.7. Diámetro máximo y diámetro mı́nimo. . . . . . . . . . . . . . . . . . . 102
8.1. Origen del sistemade coordenadas (mdb219) . . . . . . . . . . . . . . . 110
8.2. Ejemplo de calcificaciones (mdb219). a). Región de interés. b) Listado
de centroides . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
8.3. Mamograf́ıas con regiones de interés fuera de la mama . . . . . . . . . . 113
8.4. Actividades para identificar calcificaciones en las imágenes. . . . . . . . 113
8.5. Aplicación del filtro DoG en cascada . . . . . . . . . . . . . . . . . . . 115
8.6. Porcentaje de puntos seleccionados según el gradiente de gris promedio. 115
8.7. Ejemplo de calcificaciones con el mismo centroide pero diferentes pixeles. 117
8.8. Relación entre verdaderos positivos, verdaderos negativos, falsos positi-
vos y falsos negativos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
8.9. Tabla de contingencia de una prueba . . . . . . . . . . . . . . . . . . . 122
8.10. Diagrama de flujo. Experimento 1. . . . . . . . . . . . . . . . . . . . . 123
8.11. Distribución de frecuencia, número de puntos según el umbral. . . . . . 125
8.12. Pixeles considerados como cercanos. . . . . . . . . . . . . . . . . . . . . 126
8.13. Distribución de frecuencia, número de puntos cercanos según el umbral. 126
8.14. Promedio de puntos por calcificación. . . . . . . . . . . . . . . . . . . . 128
8.15. Puntos que conforman una calcificación (mdb219). . . . . . . . . . . . . 129
8.16. Resultados obtenidos aplicando diversos tamaños del filtro mediana. a)
imagen original, b) filtro de 3x3, c) filtro de 5x5, d) filtro de 7x7, e) filtro
de 9x9, f) filtro de 11x11. . . . . . . . . . . . . . . . . . . . . . . . . . . 131
8.17. Número de ventanas generadas en relación al tamaño de la ventana . . 132
8.18. Histograma del promedio de gris de las ventanas, ventanas de 8x8. . . . 132
8.19. Histograma del promedio de gris de las ventanas, ventanas de 16x16. . 133
8.20. Histograma del promedio de gris de las ventanas, ventanas de 32x32. . 133
8.21. Histograma del promedio de gris de las ventanas, ventanas de 64x64. . 134
xxiii
8.22. Relación σ2/σ1 para 15 filtros DoG . . . . . . . . . . . . . . . . . . . . 135
8.23. Máscara de filtros gaussianos de 5x5 y 7x7 . . . . . . . . . . . . . . . . 135
8.24. Máscara de filtros gaussianos de 9x9 y 11x11 . . . . . . . . . . . . . . . 136
8.25. Máscara de filtros gaussianos de 13x13 y 15x15 . . . . . . . . . . . . . . 136
8.26. a). Tamaño de cada pixel, b). Tamaño de ventana y borde. . . . . . . . 137
8.27. Distribución de frecuencia del área para puntos cercanos. . . . . . . . . 138
8.28. Distribución de frecuencia del área para puntos seleccionados. . . . . . 138
8.29. Distribución de frecuencia del promedio de gris para puntos cercanos. . 139
8.30. Distribución de frecuencia del promedio de gris para puntos seleccionados.139
8.31. Distribución de frecuencia del gradiente de gris para puntos cercanos. . 140
8.32. Distribución de frecuencia del gradiente de gris para puntos seleccionados.140
8.33. Porcentaje de éxito según el umbral, filtro gausiano de 5x5. . . . . . . . 141
8.34. Porcentaje de éxito según el umbral, filtro gausiano de 7x7. . . . . . . . 141
8.35. Porcentaje de éxito según el umbral, filtro gausiano de 9x9. . . . . . . . 142
8.36. Porcentaje de éxito según el umbral, filtro gausiano de 11x11. . . . . . 142
8.37. Porcentaje de éxito según el umbral, filtro gausiano de 13x13. . . . . . 143
8.38. Capacidad de detección de potenciales calcificaciones . . . . . . . . . . 146
8.39. Diagrama de cajas. Caracteŕısticas de contraste . . . . . . . . . . . . . 153
8.40. Diagrama de cajas. Caracteŕısticas de área y peŕımetro . . . . . . . . . 154
8.41. Diagrama de cajas. Caracteŕısticas de forma 1 . . . . . . . . . . . . . . 155
8.42. Diagrama de cajas. Caracteŕısticas de forma 2 . . . . . . . . . . . . . . 156
8.43. Diagrama de cajas. Caracteŕısticas del momento de la secuencia de con-
torno . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157
8.44. Ganancia de información promedio, según el tamaño de la muestra . . . 158
8.45. Ganancia de información promedio, según el porcentaje de VP . . . . . 159
8.46. Ganancias de información según el porcentaje de VP para una muestra
del 25,000 registros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 160
8.47. Ejemplos de arquitecturas de la red neuronal. . . . . . . . . . . . . . . 162
8.48. Porcentaje de indicadores de éxito y error del clasificador, muestra de
10,000 registros (25 % de VP) . . . . . . . . . . . . . . . . . . . . . . . 163
8.49. Comparación del porcentaje de VP para diferentes tamaños de muestra. 164
8.50. Comparación del porcentaje de VP para diferentes porcentajes de VP
en la muestra. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165
8.51. Relación entre el porcentaje de VP y el porcentaje de éxito . . . . . . . 166
8.52. GI estimada, ordenadas según el porcentaje de éxito. . . . . . . . . . . 167
8.53. GI estimada, ordenadas según el porcentaje de VP. . . . . . . . . . . . 168
8.54. GI estimada, ordenadas según el porcentaje de éxito. . . . . . . . . . . 169
8.55. GI estimada, ordenadas según el porcentaje de VP. . . . . . . . . . . . 170
8.56. GI estimada, ordenadas según la frecuencia de éxito. . . . . . . . . . . 171
8.57. GI estimada, ordenadas según el porcentaje de éxito. . . . . . . . . . . 172
xxiv
8.58. GI estimada, ordenadas según el porcentaje de VP. . . . . . . . . . . . 173
8.59. GI estimada, ordenadas según la frecuencia de éxito. . . . . . . . . . . 174
8.60. Número de agrupamientos detectados por mamograf́ıa en función del radio.176
8.61. Ejemplos de agrupamientos. a) Densidad y b). Compacidad. . . . . . . 177
8.62. Ejemplo de agrupamientos según la desviación estándar de los radios. . 178
8.63. Diagrama de cajas para diámetro mı́nimo, radio mı́nimo y radio promedio.182
8.64. Diagrama de cajas para gris mı́nimo y gris máximo. . . . . . . . . . . . 182
8.65. Caracteŕısticas ordenadas en función a la frecuencia de éxito. . . . . . . 185
8.66. Porcentaje de éxito para 30 clasificadores. . . . . . . . . . . . . . . . . 186
8.67. Desempeño de la red según el porcentaje de registros (40 agrupamientos).188
8.68. Desempeño de la red según el porcentaje de registros (22 agrupamientos).188
8.69. Desempeño de la red según el número de neuronas de la capa intermedia. 189
8.70. Desempeño de la red según el número de neuronas de la capa intermedia. 189
8.71. Diagrama de cajas de cuatro tratamientos. . . . . . . . . . . . . . . . . 192
xxv
Caṕıtulo 1
Introducción
1.1. Introducción
El cáncer de mama es una de las mayores causas de mortalidad en mujeres. Tiene
una incidencia de 25 por cada 100,000 personas; el 99 % de los afectados son mujeres y
el 30% de los quistes mamarios son malignos. En ausencia de una efectiva prevención,
el diagnóstico precoz y el tratamiento efectivo son los únicos medios para reducir la
mortalidad por cáncer de mama. El éxito en el tratamiento depende en gran medida
del grado de avance de la enfermedad, aśı en los estadios tempranos se logra alto grado
de efectividad en el tratamiento. La tasa de mortalidad va de 10% en el primer año al
80% en 5 años luego del diagnóstico (Gordo [36]).
Entre las principales técnicas usadas para el diagnóstico de cáncer de mama se
tiene el autoexamen, la exploración cĺınica, la mamograf́ıa, la ecograf́ıa mamaria y la
biopsia (Gordo [36], Almenteros [11], Calero [9]). Se pretende que estas técnicas sean
no invasivas y que permitan diagnosticar la enfermedad en sus estadios tempranos. La
mamograf́ıa tiene la ventaja de ser no invasiva y por otro lado, la densidad del tejido
predominante es bien representada en la imagen.
Las hallazgos que pueden ser observados en una mamograf́ıa son: masas, calcifi-
caciones, distorsiones arquitecturales, áreas de densidades asimétricas entre las mamas
y conductoslact́ıferos prominentes(De Paredes [24]).
La sensibilidad de la mamograf́ıa (probabilidad de un resultado anormal en pre-
sencia de cáncer de mama) es alta y está entre el 85% y el 95%, en relación al examen
cĺınico (50%). Dependiendo de la edad, la sensibilidad se incrementa. Por otro lado,
la especificidad de la mamograf́ıa (probabilidad de un resultado normal en ausencia de
enfermedad) es baja y está entre el 15% y el 30%. Alrededor de un 10% de las mamo-
graf́ıas practicadas en mujeres sin cáncer mamario (resultados falso positivos) sugieren
su presencia, provocando ansiedad, exámenes complementarios y biopsias mamarias
innecesarias (Valdivia [4]).
Entre el 2 % y el 22% de los resultados positivos obtenidos mediante una mamo-
graf́ıa la primera vez, requirieron nuevas evaluaciones para confirmar los resultados y
1
entre el 12% y el 78 % requirieron una biopsia (Mushlin [64], Shen [78]). Dada la baja
especificidad de la mamograf́ıa, el diagnóstico complementario es necesario, la técnica
frecuentemente usada es la biopsia, debido a su alta especificidad.
La elevada sensibilidad pero baja especificidad de la mamograf́ıa en el diagnóstico
del cáncer de mama se puede deber a: (Ganott [33]):
1. La baja diferenciación en la apariencia del tejido canceroso comparado con el
tejido parenquimal normal, en especial cuando el tejido predominante en la mama
es denso.
2. La variada morfoloǵıa de los hallazgos, muchos de ellos no relacionados con el
cáncer.
3. La semejanza entre las morfoloǵıas de los hallazgos.
4. El variado tamaño de los hallazgos.
5. Posibles deficiencias en la técnica para tomar la radiograf́ıa, entregando imágenes
de baja calidad.
6. La fatiga visual o distracción del radiólogo.
Se ha demostrado que el doble diagnóstico mejora la sensibilidad a lo más en
15% (Ciatto [15], Elmore [28]); mientras que cada radiólogo puede perder un pequeño
número de casos, el otro los puede detectar. Pero como cada mamograf́ıa debe de ser
revisada por dos radiólogos, este procedimiento es ineficiente desde el punto de vista
práctico debido a la escasez de especialistas y a que la productividad individual se
ve reducida. Tomar una placa radiográfica puede tomar entre 20 a 30 minutos, pero
diagnosticar una mamograf́ıa puede tomar al menos 40 minutos. Este tiempo se puede
incrementar si es que se encuentran regiones sospechosas que no se pueden declarar
fácilmente como procesos benignos (ver la sección 2.6).
Una alternativa viable es que el otro radiólogo sea un sistema computacional ac-
tuando como una segunda opinión, aśı los resultados obtenidos por el sistema pueden
ser confirmados o rechazados por el especialista (Anttinen [3], Thurfjell [85]). En con-
clusión, la mamograf́ıa es la técnica ideal para el diagnóstico temprano del cáncer de
mama, porque no es invasiva y porque puede representar adecuadamente las calcifica-
ciones. Una técnica es ideal porque permite detectar el cáncer antes que infiltre en el
tejido circundante.
Las calcificaciones son pequeñas acumulaciones de calcio de 0.1 mm a 2 mm de
ancho, y son indicadores favorables de la presencia de cáncer de mama. Frecuentemente
son usadas en el diagnóstico del carcinoma intraductal o carcinoma ductal in situ y
tienen probada capacidad para detectar estadios tempranos de la enfermedad. Entre el
2
30% y el 50 % del cáncer de mama en el mundo es diagnosticado debido a la detección
de calcificaciones.
Los agrupamientos de calcificaciones son grupos de 3 o más calcificaciones indi-
viduales que pueden aparecer en áreas menores a 1 cm2. Su presencia incrementa la
probabilidad de que la lesión sea maligna.
Muchos autores trataron el problema de segmentación automática de microcalci-
ficaciones en mamograf́ıas digitales (Lefebvre et al. [57], Bocchi et al. [7], Li et al. [59],
Liu et al. [61], Wróblewska et al. [89], Betal et al. [6], Ustymowicz et al. [87], Ibrahim
et al. [49], Cheng et al. [14], Kook et al. [51], Comer et al. [16] y Linguraru et al. [60]).
El problema no es sencillo de resolver, muchos de los obstáculos se originan en el ba-
jo contraste que exponen, en especial cuando el tejido predominante es denso (ver la
subsección 2.4.1). Por otro lado, las microcalcificaciones pueden ser muy pequeñas en
especial en sus estadios tempranos haciendo dif́ıcil la observación.
Otros autores han tratado el problema de detectar agrupamientos de microcalcifi-
caciones (Gavrielides [34], Salfity et al. [76], Papadopoulosa et al. [70], Songyang et al.
[92] y Norhayati et al. [67]). El problema que se intenta resolver es identificar grupos de
puntos con cierto grado de cercańıa de tal forma que se pueda afirmar que pertenecen
al mismo grupo.
Las técnicas orientadas a la detección de agrupamientos de calcificaciones se
pueden clasificar en dos tendencias:
1. Detectar en primer lugar la ubicación de calcificaciones individuales para luego
usar algún algoritmo para detectar agruparlas, con cierto grado de cercańıa.
2. Detectar directamente en la imagen grupos de calcificaciones, sin pasar por el
proceso de identificar la ubicación de calcificaciones individuales.
En esta investigación se intenta desarrollar un procedimiento para la detección
automática de agrupamientos de calcificaciones usando la primera tendencia. Para de-
tectar las calcificaciones individuales se usa el filtro DoG (ver la sección 5.1), para
reducir el número de potenciales calcificaciones (señales) éstas son clasificadas por una
red neuronal (ver el caṕıtulo 6) y para detectar los agrupamientos de microcalcifica-
ciones se propone una técnica basada en la densidad de ellas por cent́ımetro cuadrado
(ver el caṕıtulo 7).
Para validar la hipótesis de la investigación se toma como referencia la información
proporcionada por la base de datos de la MIAS (ver la subsección 8.2.2), donde se indica
si existe algún agrupamiento de microcalcificaciones, cuál es su ubicación en la imagen
y si es benigno o maligno.
3
1.2. Definición del problema
El problema que se pretende abordar en esta investigación es: dada una base
de datos de mamograf́ıas, conteniendo algunas de ellas microcalcificaciones y algunas
de estas últimas conformando agrupamientos de microcalcificaciones, cómo procesar
las imágenes para detectar agrupamientos de calcificaciones de tal forma que se logre
minimizar el número de falsos negativos; es decir los casos donde existiendo realmente
un agrupamiento de calcificaciones el sistema no los detecte y por otro lado minimizar
también el número de falsos positivos; es decir los casos donde no existiendo realmente
un agrupamiento de calcificaciones el sistema detecta un agrupamiento.
Resolver este problema permitirá mejorar la precisión del sistema, es decir incre-
mentar la especificidad del método propuesto (ver la subsección 8.3.1) y por otro lado
al convertirse el sistema en una segunda opinión sobre un mismo caso, incrementar la
productividad (número de casos revisados por d́ıa) del especialista.
El planteamiento del problema se puede ver más a detalle en la figura 1.1. En
la figura 1.1.a, se presentan dos distribuciones de probabilidad, la primera es la dis-
tribución de probabilidad de los verdaderos negativos y la segunda es la distribución de
probabilidad de los verdaderos positivos. La decisión de dónde se coloca el umbral que
divide a ambas distribuciones influye en el resultado de cada caso. Aśı, si el umbral se
coloca más a la derecha muchos casos serán declarados negativos siendo realmente po-
sitivos y si se coloca más a la izquierda muchos casos serán declarados positivos siendo
realmente negativos.
Igual situación se presenta para las distribuciones de probabilidad de los falsos
positivos y de los falsos negativos (ver la figura En la figura 1.1.b).
Figura 1.1: Relación entre verdaderos positivos (V+), verdaderos negativos (V-), falsos
positivos (F+) y falsos negativos(F-).
La definición del problema implica que si no se favorece la detección, colocando
fuertes restricciones al procedimiento, el número de falso negativos se incrementará,
pero por otro lado, si se favorece la detección de todos los posibles casos, sin colocar
4
suficientes restricciones al procedimiento, el número de falsos positivos se incremen-
tará. Ambos extremos resultan ser contraproducentes: en el primer caso, no se detecta
el agrupamiento, permitiendo que la enfermedad progrese, y en el segundo caso, se de-
tectan casos que no existen, generando falsas alarmas e intervenciones innecesarias. Se
pretende buscar un equilibrio entre ambos extremos.
Esta investigación se centra en confirmar que un hallazgo ubicado en la mamograf́ıa
corresponde o no a una calcificación. La decisión es tomada por un clasificador que
aprende un patrón de comportamiento en función a una serie de caracteŕısticas extráıdas
desde cada una de ellas. Determinar que un hallazgo corresponde o no a una calcificación
es uno de los aportes más importantes de este trabajo, dado que servirá para detectar
los agrupamientos.
Con la intención de abordar este problema se proponen dos métodos: el primero,
para identificar calcificaciones y el segundo para identificar agrupamientos de calcifi-
caciones (ver la figura 1.2). El resultado final del sistema es la lista de centroides de
cada agrupamiento y la lista de centroides de las calcificaciones que conforman cada
agrupamiento, de esta información se obtiene el número de agrupamientos de cada
mamograf́ıa y el número de calcificaciones de cada agrupamiento.
Figura 1.2: Procedimientos usados en la solución del problema.
El método para detectar calcificaciones en mamograf́ıas hace uso del filtro DoG
(ver la sección 5.1), este método ha sido usado en los trabajos de Dengler et al. [20],
Polakowski et al. [71], Führ et al. [31] y Netsch [65]. El filtro DoG se forma por la
diferencia de dos filtros gaussianos con diferentes desviaciones estándar. El filtro DoG
es usado frecuentemente para detectar cruces en cero, lo que permite detectar regiones
con contraste local. La formulación del filtro DoG está basada en la búsqueda de máxi-
mos y mı́nimos locales, en esta investigación se busca regiones con máximos locales
que corresponden a los puntos brillantes en la imagen. Los resultados experimentales
demuestran que su capacidad para ubicar los máximos locales, depende de la relación
σ1/σ2 donde σ1 y σ2 corresponden a las desviaciones estándar de cada uno de los fil-
tros; esta relación debe ser optimizada para lograr detectar los máximos contrastes.
Este procedimiento genera proporcionalmente muchos puntos potenciales (falsos posi-
tivos), en promedio sólo el 0.37% de los hallazgos corresponden a microcalcificaciones
(ver la subsección 8.4.4).
5
El método para detectar agrupamientos de calcificaciones es diferente al método
para detectar calcificaciones individuales, los agrupamientos pueden ser detectados sólo
después de haber identificado las calcificaciones. Grupos de 3 o más microcalcificaciones
dentro de una área de 1 cm2, pueden ser considerados como un agrupamiento. El criterio
usado para detectarlos dependerá de la densidad de calcificaciones por cm2, las regiones
con mayor densidad serán elegidas primero.
Las mamograf́ıas usadas en esta investigación se tomaron de The Mammographic
Image Analysis Society (MIAS [84]). La base de datos contiene 322 imágenes de las
cuales 22 contienen calcificaciones. En total se encontraron 252 calcificaciones confor-
mando 40 agrupamientos. Varias investigaciones relacionadas utilizaron esta base de
datos (Antonie [2], Egan [26], Hayken [45], Karssemeijer [50], Norhayati [67], Ran-
garayyan [72]).
1.3. Objetivos
El objetivo de esta investigación fue desarrollar un procedimiento para la detección
automática de agrupamientos de calcificaciones en mamograf́ıas digitalizadas tal que
se logren minimizar el número de falso positivos y de falsos negativos detectados por
el sistema.
Con el propósito de apoyar a la solución del problema planteado se identificaron
las siguientes metas:
1. Identificar la base de datos apropiada para el dominio de este problema.
2. Dada la base de datos, prepararla de tal forma que se pueda validar la hipótesis
de la investigación.
3. Identificar y evaluar técnicas para la detección de potenciales calcificaciones.
4. Identificar y evaluar técnicas para la extracción de caracteŕısticas desde las po-
tenciales calcificaciones.
5. Identificar y evaluar técnicas para seleccionar un subconjunto óptimo de carac-
teŕısticas a extraer desde las potenciales calcificaciones.
6. Identificar y evaluar técnicas de clasificación para clasificar las potenciales calci-
ficaciones en dos grupos (es calcificación o no es calcificación).
7. Identificar y evaluar la técnica apropiada para detectar agrupamientos de calcifi-
caciones, desde las calcificaciones detectadas.
8. Identificar y evaluar la técnica apropiada para extraer caracteŕısticas desde cada
agrupamiento de calcificaciones.
6
9. Identificar y evaluar la técnica apropiada para seleccionar un subconjunto óptimo
de caracteŕısticas a extraer desde cada agrupamiento.
10. Definir la técnica de clasificación para clasificar los agrupamientos detectados en
dos grupos (es benigno o es maligno).
Los objetivos se cumplieron satisfactoriamente. La base de datos seleccionada fue
obtenida de la MIAS. El procedimiento usado para preparar la base de datos corres-
ponde al proceso de extracción de caracteŕısticas. La técnica usada para identificar po-
tenciales calcificaciones fue el filtro DoG. Se extrajeron 47 caracteŕısticas relacionadas
con el contraste, la forma, los momentos de la secuencia del contorno y los momentos
geométricos invariantes desde cada calcificación potencial. Se aplicó una derivación del
algoritmo de búsqueda secuencial hacia adelante para la selección de un subconjunto
de caracteŕısticas tal que el desempeño del clasificador se aproximara al máximo. Una
red neuronal de tres capas fue usada como clasificador en esta investigación. Se usó el
criterio de la máxima densidad de puntos cercanos dentro de un radio, para detectar
los agrupamientos de calcificaciones. Se extrajeron 19 caracteŕısticas relacionadas con
la forma, el área y el contraste desde cada agrupamiento. Se aplicó la misma técnica
de selección de caracteŕısticas usada en la etapa de detección de calcificaciones para
seleccionar caracteŕısticas en la etapa de detección de agrupamientos.
1.4. Preguntas de la investigación
La investigación pretendió responder algunas preguntas en el dominio de la detec-
ción de calcificaciones y de agrupamientos de calcificaciones.
1. Detección de calcificaciones.
Si el método para la detección de potenciales calcificaciones (señales) usando el
filtro DoG permite identificar la mayor cantidad de señales verdaderas positivas.
2. Tipo de tejido predominante.
Si el tipo de tejido predominante en la mamograf́ıa influye en el desempeño de la
técnica propuesta.
3. Extracción de caracteŕısticas.
Si las caracteŕısticas extráıdas desde las señales proporcionan la información su-
ficiente para clasificarlos en calcificaciones.
4. Clasificador.
Si una red neuronal usada como clasificador proporciona resultados aceptables
para clasificar señales en calcificaciones.
7
5. Gran cantidad de verdaderos negativos.
Si el clasificador neuronal usado en esta investigación proporciona resultados
aceptables para discriminar las calcificaciones verdaderas positivas de las ver-
daderas negativas, dado la gran cantidad de verdaderas negativas que detecta el
filtro DoG.
6. Selección de caracteŕısticas.
Si el ordenamiento de caracteŕısticas en función a la ganancia de información
proporciona resultados cercanos al método de búsqueda secuencial hacia adelante.
7.Agrupamientos.
Si detectar en primer lugar calcificaciones y luego agrupamientos de ellas propor-
ciona mejores resultados que detectar los agrupamientos directamente.
8. Diagnóstico.
Si la propiedad benigna o maligna puede ser pronosticada para toda la imagen,
para cada agrupamiento o para cada calcificación individual.
1.5. Hipótesis
La hipótesis que se pretende demostrar en esta investigación intenta comparar
dos formas de pronosticar el diagnóstico de la mamograf́ıa (benigna o maligna), en el
primer caso se intenta pronosticar considerando las propiedades de cada agrupamiento
detectado (uno o varios), en el segundo caso se intenta pronosticar considerando las
propiedades de un solo agrupamiento conformado por todas las calcificaciones de la
mamograf́ıa.
La hipótesis establece que considerar a todas la calcificaciones de una imagen como
parte de un solo agrupamiento (ver la figura 1.3.a) no proporciona suficiente informa-
ción que si se considera que una imagen puede contener uno o más agrupamientos de
calcificaciones (ver la figura 1.3.b).
Para comparar los dos procedimientos, las caracteŕısticas a extraer en cada ca-
so siguen el mismo procedimiento como se menciona en la sección 7.2. La hipótesis
demuestra en la sección 8.5.
1.6. Metodoloǵıa de la investigación
Considerando la hipótesis que se intenta demostrar y el objetivo de la investi-
gación, la metodoloǵıa adoptada fue la cualitativa, dado que se pretendió determinar
qué procedimiento era el más apropiado para determinar la ubicación y el número de
agrupamientos de calcificaciones que existen en una mamograf́ıa.
8
Figura 1.3: Número de agrupamientos de microcalcificaciones en una imagen.
El diseño fue experimental, dado que se deseaba comprobar el desempeño del
procedimiento, ante variaciones en sus parámetros y técnicas.
Para validar los resultados de la investigación se consideró una muestra de 22
imágenes tomadas de la base de datos de la MIAS, conteniendo 252 calcificaciones en
total; 15 mamograf́ıas contienen 1 agrupamiento de microcalcificaciones, 4 mamograf́ıas
contienen 2 agrupamientos de microcalcificaciones y 3 mamograf́ıas contienen más de
3 agrupamientos de microcalcificaciones.
La investigación se basó en los siguientes métodos:
1. Recopilación documental.
Se revisó un conjunto de investigaciones relacionadas en revistas y libros que
permitió conocer con mayor detalle los avances logrados a la fecha en este tipo
de investigación.
2. Experimentación.
Se realizó un conjunto de experimentos en un ambiente controlado para probar
el desempeño del procedimiento propuesto.
3. Entrevista.
Se visitó a un especialista en Oncoloǵıa del Hospital San José en la ciudad de
Monterrey, N.L., México, con quién se intercambiaron opiniones acerca de la in-
vestigación.
4. Desarrollo de algoritmos.
Se desarrolló un conjunto de algoritmos usando MATLAB r Release 12, para
soportar la funcionalidad requerida por la investigación.
9
1.7. Alcances y limitaciones
Durante el desarrollo de la investigación se tomaron algunas decisiones que limi-
taron el alcance del estudio. Entre las principales tenemos:
1. Técnica de diagnóstico.
Esta investigación se orienta al uso de mamograf́ıas digitalizadas, como técnica
de diagnóstico. El especialista puede hacer uso de otras técnicas para confirmar
o descartar este diagnóstico ((ver la subsección 2.3.2)), entre las que tenemos: el
autoexamen, la ecograf́ıa y la biopsia.
2. Tipo de hallazgo.
En una mamograf́ıa se pueden encontrar los siguientes hallazgos: masas, calcifi-
caciones, distorsiones arquitecturales y densidad asimétrica. Esta investigación se
orienta al dominio de las calcificaciones (ver la subsección 2.6) y dentro de ellas
a las microcalcificaciones (ver la subsección 2.6.2) y se descartan las macrocalci-
ficaciones. En el transcurso de documento se mencionará el término calcificación
como sinónimo de microcalcificación.
3. Base de datos.
Se hace uso de la base de datos de la MIAS ([84]), conformada por 322 imágenes,
de las cuales 22 tienen al menos una calcificación, las imágenes fueron digitalizadas
a 8 bits (256 niveles de gris), con un tamaño de 1024x1024 pixeles, la resolución
de estas imágenes es de 200 µ/pixel. También se dispone de imágenes de mayor
resolución (50 µ/pixel), que no fueron usadas en esta investigación.
4. Datos de prueba.
Cada imagen de la MIAS tiene anexado una lista de los hallazgos (ver el cuadro
8.2), espećıficamente un centroide y un radio dentro del cual se ubica la lesión.
Esto es útil si se trata de masas, distorsiones arquitecturales o agrupamientos
definidos, pero no es útil cuando se trata de calcificaciones individuales, dado que
el área indicada puede contener muchas calcificaciones y otros objetos que no lo
son. Para resolver este problema se consideró un conjunto de procedimientos, para
identificar cada calcificación y validar su ubicación, independiente del proceso
general de la investigación (ver la subsección 8.2.4).
5. Resultados.
Esta investigación pretende detectar agrupamientos de calcificaciones entregando
como resultado el centroide del agrupamiento y la lista de centroides de cada
calcificación (ver la sección 7.1). Esto implica que el procedimiento puede afirmar
si en una mamograf́ıa existe o no existe al menos un agrupamiento y otro lado
puede afirmar si el agrupamiento es benigno o maligno.
10
6. Agrupamientos de calcificaciones desde calcificaciones.
La técnica usada para detectar agrupamiento de calcificaciones depende de la
técnica usada para detectar calcificaciones individuales. Este procedimiento ase-
gura que los componentes de cada agrupamiento corresponden a una calcificación.
Trabajos relacionados intentaron determinar los agrupamientos directamente des-
de la imagen (Diyana et. al.[23] y Lemaur et. al [58]).
7. Clasificador.
Existen diferentes técnicas para clasificar patrones de datos, entre las que se
tienen redes neuronales, reglas de asociación, árboles de decisión, etc. En esta
investigación se hace uso de una red neuronal de retropropagación en todos los
procedimientos donde se requiere clasificar patrones. Esta decisión se tomó por la
capacidad de las redes neuronales de adaptarse a patrones de caracteŕısticas con
comportamientos no lineales, su baja sensibilidad al ruido y finalmente porque no
es necesario discretizar los datos. La limitación de la técnica es que no se puede
conocer cómo es que toma sus decisiones.
1.8. Organización del documento
Los caṕıtulos siguientes del documento están organizados de la siguiente manera:
En el caṕıtulo 2, se hace una breve revisión de trabajos anteriores y se revisa la
bibliograf́ıa relacionada. Por otro lado se presenta el marco de referencia sobre el que
se desarrolla esta investigación. Se revisan algunos conceptos sobre cáncer de mama,
visión computacional y técnicas para la detección de calcificaciones.
En el caṕıtulo 3, se expone el modelo de solución usado en el desarrollo del trabajo.
En el caṕıtulo 4, se expone el método usado para el preprocesamiento de las
imágenes.
En el caṕıtulo 5, se expone el método usado para detectar potenciales calcifica-
ciones (señales).
En el caṕıtulo 6, se expone el método de extracción de caracteŕısticas desde cada
señal identificada y su posterior clasificación usando una red neuronal.
En el caṕıtulo 7, se expone el método para detectar agrupamientos de calcifica-
ciones.
En el caṕıtulo 8, se detalla el experimento realizado para probar la hipótesis
planteada.
En el caṕıtulo 9, se exponen las conclusiones de la investigación y las recomenda-
ciones para trabajos futuros.
11
Caṕıtulo 2
Revisión de la Literatura
Diversos investigadores desde la década de los 80’s vienen desarrollando trabajos
relacionados al dominio de las mamograf́ıas, entre los primeros trabajos se tienen los
deGresson et al. [38], Chang et al. [12], [13], Gordon et al.[37] y Feig et al. [29]. La
motivación frecuente de estos trabajos es diseñar métodos y sistemas para apoyar al
radiólogo en el diagnóstico de las mamograf́ıas. Esto implica que el sistema no toma la
decisión final acerca del caso que se analiza, dado que se requiere todav́ıa la confirmación
de un especialista.
Algunos trabajos pretenden diseñar sistemas para el diagnóstico automático, es
decir que el sistema tome una decisión. Este objetivo tiene amplias dificultades por
dos motivos: primero, la naturaleza de la enfermedad, donde casos benignos se pueden
confundir con casos malignos y viceversa, y segundo, la naturaleza de la mamograf́ıa.
La mamograf́ıa es una representación bidimensional del grado de atenuación con que
los rayos X pasan a través de la mama, conformada por tejido blando, lo que puede
generar pérdidas de información acerca de la profundidad de un hallazgo y de sus
caracteŕısticas.
Esta investigación se ubica entre los primeros, es decir un sistema de apoyo a la
toma de decisiones asistido por una computadora donde la decisión final lo toma el
especialista que usa el sistema. Con este propósito se intenta extraer la mayor cantidad
de información desde regiones sospechosas de la imagen, procesarlas y presentarlas
para que el sistema justifique su propuesta de diagnóstico y permita al especialista
confirmarla o negarla.
Se describen a continuación algunos trabajos encontrados en publicaciones espe-
cializadas, que han servido como referencia para el desarrollo de esta investigación.
2.1. Investigaciones recientes
Múltiples trabajos de investigación, informes y tesis se han desarrollado con la
finalidad de detectar calcificaciones y agrupamiento de calcificaciones en mamograf́ıas
digitalizadas. Estos pueden ser clasificados en función a la técnica usada, aśı se tienen
13
las investigaciones que se presentan el cuadro 2.1.
Cuadro 2.1: Resumen de art́ıculos relacionados con la detección de calcificaciones y
agrupamiento de calcificaciones.
Autores Año Mé-
todo
µC Cl T́ıtulo
Betal et al.
[6]
1997 MM x Segmentation and numerical analysis of microcalcifications on
mammograms using mathematical morphology.
Zhao et al.
[93]
1992 MM x Morphology on detection of calcifications in mammograms
Führ et al.
[31]
2003 LoG x Cluster-oriented Detection of Microcalcifications in Simulated
Low-Dose Mammography.
Fu, et al. [32] 2003 TX x Image Enhancement, Feature Extraction and Classification of
Microcalcifications in Mammograms.
Papadopou-
losa [70]
2002 TX x An automatic microcalcification detection system based on a
hybrid neural network classifier
El-Naqa, et
al [27]
2002 SVM x A Support Vector Machine Approach for Detection of Micro-
calcifications.
Bazzani, et
al. [1]
2000 SVM x x Automatic detection of clustered microcalcifications in digital
mammograms using an SVM classifier
Li, et al. [59] 1997 FR x Fractal modeling and segmentation for the enhancement of mi-
crocalcifications in digital mammograms
Bocchi, et al.
[7]
2004 FR x x Detection of single and clustered microcalcifications in mam-
mograms using fractals models and neural metworks
Yu, et al. [91] 2000 RN x x CAD System for the automatic detection of clustered micro-
calcifications in digitized mammogram films
Treiber et al.
[86]
2003 AD x An adaptive algorithm for the detection of microcalcifications
in simulated low-dose mammography
Nishikawa
[66]
1993 DI x Computer aided detection of clustered microcalcification: An
improved method for grouping detected signals
Ricketts et
al. [73]
1992 DI x The automated detection of clusters of microcalcifications
FR Fractales MM Matemática morfológica LoG Laplaciano del gaussiano
AD Adaptativo DI Diferencia de imágenes DoG Diferencia de gaussianos
TX Textural RN Redes neuronales SVM Máquina de vectores soporte
µC : Técnica orientada a identificar microcalcificaciones
Cl : Técnica orientada a identificar agrupamientos de microcalcificaciones
Betal [6] utilizó matemática morfológica para detectar calcificaciones. Aplicó un
algoritmo de mejoramiento de imágenes para resaltar bordes y suavizar regiones ho-
mogéneas. Luego aplicó operadores de apertura, cierre y binarización para obtener
marcadores únicos para cada microcalcificación. El umbral de binarización fue determi-
nado manualmente por un radiólogo. La segmentación de las calcificaciones fue posible
14
aplicando el algoritmo ”watershed”. La etapa final implicó el análisis numérico de los
calcificaciones detectadas. La información sobre el área y las dimensiones de las calci-
ficaciones fueron usadas. Las calcificaciones benignas tienden a ser estructuras grandes
(mas de 1 mm), mientras que las malignas tienden a ser más pequeños.
Nishikawa [66] desarrolló una técnica para la detección automática de agrupamien-
tos de calcificaciones. El método consiste de tres etapas: Primero, reduce las estructuras
del fondo de la imagen eliminando las estructuras normales, mediante el filtrado de la
imagen. Segundo, potenciales calcificaciones (señales) son identificadas por medio de
una binarización global, una erosión morfológica y una binarización local. Tercero, las
señales falsas son eliminadas examinando el espectro de enerǵıa de señales individuales,
determinando la distribución espacial de conjunto de señales y examinando la relación
entre el tamaño, la forma y el valor del pixel del fondo de calcificaciones.
Ricketts et al. [73] emplearon un algoritmo de varias etapas para la detección
automatizada de agrupamientos de calcificaciones. Primero asumieron que las calcifica-
ciones son pequeños grupos de pixeles, de formas lineales u ovaladas, más brillantes que
sus pixeles vecinos, con niveles de gris relativamente constantes y que tienen bordes bien
definidos. Finalmente, discutieron que los calcificaciones son significativas solamente si
se presentan agrupadas. De acuerdo con estos supuestos, utilizaron un procedimiento
que implicaba seis etapas: detección de borde, generación de contornos, localización
de potenciales calcificaciones (señales) usando un grafo, extracción de la caracteŕıstica,
clasificación de las señales y detección de agrupamientos. Llegaron a obtener el 91.75 %
de efectividad en el clasificador para las calcificaciones. Lograron el 100% de verdaderos
positivos con 0% de falsos positivos usando el método de restitución y el 98% de ver-
daderos positivos con el 0% de falsos negativos usando el método de validación cruzada
de K-conjuntos para los agrupamientos de calcificaciones.
Zhao et al. [93] desarrollaron un método para la binarización adaptativa en mamo-
graf́ıas. El trabajo combina operaciones de filtrado morfológico con una base de reglas.
El objetivo del trabajo es detectar regiones sospechosas en una mamograf́ıa y pro-
porcionar información acerca de la localización de ciertas calcificaciones con formas y
tamaños predefinidos, para el examen de un radiólogo. Lograron encontrar una función
de binarización adaptativa para operaciones morfológicas. Se usó la forma, el tamaño y
la densidad de la señal para encontrar la función adaptativa. El trabajo se desarrolló en
cinco pasos: primero, preprocesar la imagen para eliminar el ruido del fondo, segundo,
obtener información del esqueleto de la señal y determinar el tamaño de la sombra
del esqueleto usando operadores morfológicos, tercero, seleccionar el umbral de bina-
rización considerando el tamaño de la señal, cuarto, clasificar las regiones sospechosas
considerando formas y tamaños predefinidos de las señales y quinto, reconstruir los
niveles gris sólo alrededor de las regiones sospechosas. Para los pasos tercero y cuarto
fue necesario una base de reglas proporcionada por radiólogos.
El-Naqa, et al [27], desarrollaron un método para la detección de agrupamientos
15
de calcificaciones basado enla máquina de vectores soporte (SVM), en el trabajo se
propone un esquema de aprendizaje sucesivo para mejorar el desempeño del procedi-
miento. La SVM es una técnica de aprendizaje mecánico, basado en el principio de
minimizar el riesgo estructural, el cual tiene buen comportamiento cuando es aplicado
a problemas fuera de los datos de entrenamiento. El problema de detección de calcifica-
ciones es formulado como un problema de aprendizaje supervisado y se aplica la SVM
como un algoritmo de detección. La SVM se aplica a cada región de la imagen para
verificar si contiene o no una microcalcificación.
2.2. Base de datos de imágenes
Para comprobar los resultados obtenidos por sistemas de apoyo al diagnóstico
de cáncer de mama se requiere que los investigadores usen fuentes de información
comunes tal que se pueda comparar los resultados obtenidos por los métodos propuestos.
Múltiples bases de datos han sido usados para probar los métodos propuestos por
diversos investigadores(ver el cuadro 2.2). Dos de las bases de datos frecuentemente
usadas son las siguientes.
1. MIAS.
Esta base de datos fue desarrollada por The Mammographic Image Analysis So-
ciety [84]. Contiene 322 imágenes; 204 normales y 118 con algún hallazgo, de
los cuales 66 son benignas y 52 malignas. Los hallazgos que se pueden encontrar
son calcificaciones (25 casos), masas circunscritas (20 casos), masas espiculadas
(21 casos), masas mal definidas (15 casos), distorsión arquitectural (20 casos) y
asimetŕıa (17 casos).
De las 322 imágenes, 25 contienen al menos una calcificación, pero en esta inves-
tigación sólo se ha usado 22 de ellas (ver la subsección 8.2.2). De estas últimas 9
son benignas y 13 son malignas. Las imágenes fueren digitalizadas a 50 µ/pixel
y a 200 µ/pixel. En esta investigación se usan imágenes de 200 µ/pixel. La base
de datos de alta resolución (50 µ/pixel) puede ser adquirida y la base de datos
de baja resolución puede ser bajada desde el servidor de la MIAS.
2. DDSM.
Esta base de datos fue desarrollada por Nico Karssemeijer del departamento de
radioloǵıa del Hospital Universitario Nijmegen [46]. Contiene 2620 casos, clasi-
ficados según el sistema BI-RADS. Están organizados en 4 volúmenes: normal
(695 casos), cáncer (914 casos) y benignos (1011 casos). 100 de los casos con-
tienen al menos una calcificación, los cuales pueden ser dispuestos como 50 para
entrenamiento y 50 para prueba. Cada caso de la base de datos está conforma-
16
do por 4 imágenes, 2 del lado derecho y dos del izquierdo. Las imágenes fueren
digitalizadas a 100 µ/pixel.
Cuadro 2.2: Base de datos de mamograf́ıas.
Base de
Datos
Imágenes Tamaño Bits/pixel Resolución Imágenes con cal-
cificaciones
MIAS [84] 322 1024 x 1024 8 50 µ/pixel 22
MIAS 322 2600 x 4320 8 200 µ/pixel 22
DDSM [46] 2620 4104 x 5824 12 100 µ/pixel 100
En esta investigación se hace uso de la base de datos de la MIAS con imágenes
de baja resolución. Múltiples trabajos de investigación hicieron uso de esta base de
datos para la detección de calcificaciones (ver el cuadro 2.3) y para la detección de
agrupamientos de calcificaciones (ver el cuadro 2.4).
Cuadro 2.3: Trabajos de investigación que usaron la base de datos de la MIAS para la
detección de calcificaciones.
Autores Año Méto-
do
Reso-
lución
T́ıtulo
Lasztovicza
et al. [56]
2003 RN 200µm
/pixel
Neural Network Based Microcalcification Detection in a
Mammographic CAD System
Sajda et al.
[75]
2002 RN (*) Learning Contextual Relationships in Mammograms Using
a Hierarchical Pyramid Neural Network
Melloul et al.
[63]
2002 MF (*) Segmentation of microcalcification in X-ray mammograms
using entropy thresholding
Gulsrud [39] 2001 TX 50µm
/pixel
Analysis of mammographic microcalcifications using a
computationally efficient filter bank
MeGarry
[62]
1999 DoG (*) Performance Of The Generalised Gaussian Distribution
For Detection Of Calcifications In Mammographic Images
Sklansky et
al. [80]
1998 MF (*) A neurodatabase system for mammographic screening
Wu et al. [90] 1997 RN (*) Image feature analysis for classification of microcalcifica-
tions in digital mammography: neural networks and gene-
tic algorithms
Dinten et al.
[22]
1996 TX (*) Features extraction for a precise characterization of micro-
calcifications in mammograms
(*) Resolución no indicada.
Estos trabajos fueron usados como referencia para el desarrollo de esta investi-
gación. En cada cuadro se indica la técnica y el nivel de resolución de la base de datos
usada (no todos mencionan la resolución usada), aśı Lasztovicza [56] y Strausz [82]
usaron las imágenes de baja resolución (200 µ/pixel) y Gulsrud [39], [41], Halkiotis [44]
y Papadopoulosa [70] usaron las imágenes de alta resolución (50 µ/pixel).
17
Cuadro 2.4: Trabajos de investigación que usaron la base de datos de la MIAS para la
detección de agrupamientos de calcificaciones.
Autores Año Méto-
do
Reso-
lución
T́ıtulo
Diyana et al.
[23]
2003 MF (*) A comparison of clustered microcalcifications automated
detection methods in digital mammogram
Lemaur et al.
[58]
2003 WV (*) Highly Regular Wavelets for the Detection of Clustered
Microcalcifications in Mammograms
Strausz et al.
[82]
2003 TX 200µm
/pixel
Intelligent Solution for Mammography Image Diagnosis
Halkiotis et
al. [44]
2002 MF 50µm
/pixel
Computer-aided detection of clustered microcalcifications
in digital mammograms
Gulsrud [40] 2002 TX 200µm
/pixel
Computer-Aided Diagnosis in Digital Mammography
Papadopou-
losa et al.[70]
2002 RN 50µm
/pixel
An automatic microcalcification detection system based on
a hybrid neural network classifier
Gulsrud et
al. [41]
2001 TX 50µm
/pixel
Detection of clustered microcalcifications in compressed
mammograms
Gulsrud et
al. [42]
2000 TX (*) Optimal Filter for Detection of Clustered Microcalcifica-
tions
Lado et al.
[55]
1998 WV (*) Evaluation of an automated wavelet-based system dedi-
cated to the detection of clustered microcalcifications in
digital mammograms
Norhayati et
al. [67]
1997 TX (*) Automated detection of clustered microcalcifications on
mammograms. CAD system application to MIAS database
(*) Resolución no indicada.
2.3. Cáncer de mama
El cáncer de mama es una de las mayores causas de mortalidad de mujeres de edad
media, especialmente en las grandes ciudades. Este tipo de cáncer se puede detectar
tempranamente a través de exámenes cĺınicos y exploratorios.
2.3.1. Factores de riesgo
La variación geográfica en cuanto a incidencia y mortalidad, entre los diferentes
páıses, sugiere que el riesgo de cáncer de mama está determinado por factores ambien-
tales y de estilo de vida. Se han identificado muchos factores de riesgo para el cáncer
de mama, sin embargo la mayor parte de ellos se asocian con un riesgo moderado. Un
factor de riesgo no es equivalente a causal dado que por śı mismo no es suficiente para
que aparezca el cáncer, entre los principales factores de riesgo tenemos:
18
Factores de alto riesgo.
Los factores de riesgo están relacionados con el sexo femenino, edad mayor de
50 años, antecedentes familiares, alteraciones genéticas, nuliparidad, edad tard́ıa
del primer embarazo, obesidad, escaso ejercicio, edad precoz de la menarquia,
menopausia tard́ıa, otras lesiones hiperplásicas, raza blanca, nivel socio-económico
alto, etc.
Otros factores no controlados.
Los factores de riesgo son tomados en cuenta para la prevención, pero existen
factores que no pueden ser modificados por el especialista, tales como factores
genéticos, factores personales (paridad, edad de menarquia, nivel socio-económi-
co, raza, etc.), por lo que generalmente se sugiere el mejoramiento de los esti-
los de vida. No existen otros medios para prevenir la enfermedad por lo que su
tratamiento se inicia con el diagnóstico temprano de la enfermedad.
2.3.2. Técnicas de diagnóstico
Ninguna de las técnicas para el diagnóstico de cáncerde mama tiene certeza
absoluta en sus predicciones, pueden haber falsos positivos (no habiendo realmente
cáncer, se les declara positivos) o falsos negativos (habiendo realmente cáncer, se les
declara negativos), por lo que se sugiere una combinación de exámenes y su repetición
periódica. Se dispone de las siguientes técnicas para el diagnóstico de cáncer de mama,
las cuatro primeras son no invasivas:
1. Autoexamen. Es realizado por la paciente. Se trata de ubicar cambios en la for-
ma, tamaño y textura de la mama, nódulos, retracción del pezón, presencia de
secreciones y dolor no habitual.
2. Examen médico. Es realizado por el especialista, consiste en un examen cĺınico y
en la elaboración y/o seguimiento de la historia cĺınica de la paciente.
3. Mamograf́ıa. Es el método ideal para realizar el diagnóstico precoz del cáncer de
mama, es indoloro, se realizan un mı́nimo de 2 mamograf́ıas de cada mama en
diferentes posiciones. El especialista determinará la necesidad de realizar otras
mamograf́ıas más especificas ya sean focalizadas o ampliadas (ver la subsección
2.4.2). Se recomienda a partir de los cuarenta años.
4. Ecograf́ıa mamaria. La ecograf́ıa mamaria consiste en el uso del sonido como
método de diagnóstico. Tiene la ventaja de ser inocuo y puede repetirse sin conse-
cuencias para la paciente. En la mujer adulta, la ecograf́ıa se utiliza como elemento
de diagnóstico complementario de la mamograf́ıa. En la mujer adolescente o muy
joven, comúnmente, se utiliza la ecograf́ıa como primer elemento de diagnóstico.
19
5. Biopsia. Se lleva a cabo mediante una aguja o mediante una escisión, el teji-
do extráıdo es analizado para buscar células malignas. Es una técnica invasiva
recomendada para confirmar el diagnóstico obtenido con la mamograf́ıa.
2.4. Mamograf́ıa
Una mamograf́ıa es un tipo espećıfico de imagen que usa bajas dosis de rayos X
para examinar las mamas. Es una representación bidimensional del grado de atenuación
de los rayos X cuando pasan a través de un objeto tridimensional, lo cual implica que
toda la información en profundidad se pierde. Los resultados quedan registrados en una
placa fotográfica que el radiólogo puede usar para buscar anomaĺıas.
La mamograf́ıa muestra los diferentes elementos que conforman la mama, como
son el tejido conjuntivo, glandular y graso aśı como la piel (ver la figura 2.1). Estos
elementos se muestran debido a la diferencia de densidades que existe entre ellos, las
zonas oscuras corresponden a tejido blando y las zonas blancas a tejido denso.
Figura 2.1: Anatomı́a de las mamas y ejemplo de mamograf́ıa.
La técnica se prefiere porque permite detectar el cáncer de mama en sus estadios
iniciales, lo que ha permitido su amplia difusión, llegando a convertirse en un estándar.
Se recomienda su aplicación anual a partir de los cuarenta años. Lamentablemente
la mamograf́ıa tiene limitaciones importantes, dif́ıciles de eliminar. Primero, no logra
presentar todos los indicadores del cáncer de mama y segundo, las caracteŕısticas de la
imagen no permiten que los radiólogos lleguen a diagnósticos concluyentes. La forma
de abordar estos problemas serán detallados en los siguientes caṕıtulos.
20
2.4.1. Tejido predominante
Existe una gran variación en la densidad del parénquima mamario que se observa
en las mamograf́ıas. La densidad de la mamograf́ıa vaŕıa inversamente con la edad. Por
lo tanto, las mujeres más jóvenes tienden a tener mamas más densas que las mujeres
de más edad, pero muchas mujeres mayores también tienen mamas densas. El aspecto
general de la imagen proporciona información acerca del tejido predominante en la
mamograf́ıa, estos pueden ser tejido graso, tejido graso glandular y tejido denso (ver la
figura 2.2). La densidad del parénquima depende de la cantidad de tejido conectivo y
de tejido glandular en la mama. Aquellas dominadas por el tejido adiposo, que parecen
menos densas, son fáciles de analizar con la mamograf́ıa.
Figura 2.2: Tipo de tejido predominante. a). Graso, b). Graso glandular, c) Denso.
2.4.2. Proyecciones básicas
Por lo general se pueden tomar dos tipos de proyecciones básicas a la mama, la
craneo-caudal (CC) y la oblicua medio lateral (OML), pero se pueden realizar otras
proyecciones cuando se advierta la falta de visualización de parte del tejido mamario o
cuando se requiera más nitidez en la imagen.
1. La proyección cráneo-caudal (ver la figura 2.3.a) se realiza comprimiendo la ma-
ma desde su zona mas superior, es una vista de arriba hacia abajo, para evitar
imágenes dudosas el pezón se debe proyectar de forma paralela al detector, con
el fin de no confundirlo con un nódulo.
2. La proyección oblicua medio-lateral (ver la figura 2.3.b) es una vista de afuera
hacia adentro formando un ángulo de 45◦ hacia el lado opuesto de la mama,
teniendo la mama completamente comprimida. La mama se eleva proyectándola
hacia delante, colocando a la paciente de manera que la axila quede por encima
del borde del detector, evitando la formación de pliegues.
21
Figura 2.3: Proyecciones básicas. a). Cráneo-caudal, b). Oblicua medio-lateral.
2.4.3. Mamograf́ıa digital
Una de las limitaciones de la mamograf́ıa es su naturaleza fotográfica. La peĺıcula
sirve como medio de adquisición, almacenamiento, intercambio y visualización, generan-
do problemas como deterioro de la imagen y dificultad para compartir la imagen. La
mamograf́ıa digital, permite eliminar estas limitaciones facilitando su rápido intercam-
bio. Dado que la mamograf́ıa digital implica el registro de la mamograf́ıa directamente
en un medio digital, sin necesidad de usar placas fotográficas, su costo de adquisición se
incrementa. Es por esto que se prefiere digitalizar la mamograf́ıa, mediante sistemas de
digitalización de alta resolución. Si bien la técnica es ampliamente reconocida por los
radiólogos, a la fecha sólo 5 fabricantes (ver el cuadro 2.5) tienen sistemas aprobados
por la FDA (U. S. Food and Drug Administration), para aplicar la mamograf́ıa digital.
Cuadro 2.5: Sistemas de mamograf́ıa digital aprobadas por la FDA
Fabricante Fecha de
aprobación
GE Senographe 2100DS Full Field Digital Mammography (FFDM) System 19/02/2004
Lorad Digital Breast Imager Full Field Digital Mammography (FFDM) System 15/03/2002
Hologic/Lorad Selenia Full Field Digital Mammography (FFDM) System 10/02/2002
Fischer Imaging SenoScan Full Field Digital Mammography (FFDM) System 25/09/2001
GE Senographe 2000D Full Field Digital Mammography System 28/01/2000
2.5. Proceso de diagnóstico del cáncer de mama
El proceso de diagnóstico del cáncer de mama implica aplicar una serie de prue-
bas, entre las cuales tenemos las mamograf́ıas, la cual es usada primariamente. Las
mamograf́ıas pueden ser de dos tipos, de detección y de diagnóstico:
22
1. Las mamograf́ıas de detección implican usar alguna de las dos proyecciones básicas.
2. Las mamograf́ıas de diagnóstico implican imágenes de rayos X de la mama para
obtener imágenes más claras y más detalladas de cualquier área que se vea anor-
mal en una mamograf́ıa de detección. También se usan para ayudar al médico a
conocer más sobre cambios raros en las mamas, como bultos, dolor, engrosamien-
to, secreción del pezón o cambio en el tamaño o forma del seno. Las mamograf́ıas
de diagnóstico pueden enfocarse en un área espećıfica del seno. Pueden implicar
técnicas especiales y más proyecciones que las mamograf́ıas de detección.
La capacidad del radiólogo para interpretar una mamograf́ıa depende en gran
medida de la calidad de la imagen. El proceso de diagnóstico consiste de dos etapas:
1. Buscar regiones en la imagen que tengan apariencia diferente a otras regiones, ya
sea en la misma mama o en la opuesta.
2. Determinar si las caracteŕısticas morfológicas de cada región tiene el aspecto
de una variación normal o de un proceso benigno. Si no es posible

Continuar navegando