Análisis Espectral de Imágenes
Multicanal basado en Transformaciones
Reticulares Matriciales
por
Juan Carlos Valdiviezo Navarro
Tesis sometida como requisito parcial para
obtener el grado de
DOCTOR EN CIENCIAS EN LA
ESPECIALIDAD DE ÓPTICA
en el
Instituto Nacional de Astrofísica, Óptica
y Electrónica
Diciembre 2011
Tonantzintla, Puebla
Asesor:
Dr. Gonzalo J. Urcid Serrano, INAOE
c⃝INAOE 2011
El autor otorga al INAOE el permiso para
reproducir y distribuir copias en su totalidad o
en partes de esta tesis.
Abstract
Image spectrometers, instruments that simultaneously register the spatial and spectral infor-
mation of an area under study, have given solution to problems related with the identi�cation
of materials comprising a scene. However, one of the fundamental problems in the analysis of
spectral images is that many spectral pixels are conformed by spectral mixtures of di�erent
materials. This research work is oriented toward the autonomous determination of constituent
materials of a scene from spectral images acquired at di�erent wavelength intervals. Assuming
the spectrum collected at each image pixel is a linear combination of constituent materials
spectra, the objective is to determine a set of pixels with the spectrum of one material that can
be used to represent the mixtures. Geometrically, the spectral mixtures can be represented as
a convex set whose vertices correspond to those pixels with the spectrum of one material, while
any other pixel will be represented by the combination of pure pixels at di�erent proportions.
The scaled column vectors of lattice transforms WXX and MXX allow to extract the vertices
of a minimum convex set enclosing most of the spectral pixels belonging to a multichannel
image, which are associated with the constituent materials spectra. In fact, once these vertices
have been determined, it is possible to quantify the spectral mixtures at each image pixel. This
study begins with the use of lattice transforms for the autonomous segmentation of satured
colors from color images. After, we extend the proposed technique for the analysis of multi-
spectral and hiperspectral images. In the multispectral case, we present results of pigments
identi�cation from the multispectral collection of the Archimedes Palimpsest. In the second
case we present results in the determination of natural resources from two hyperspectral scenes
registered by a remote sensor.
i
Resumen
El uso de espectrómetros de imagen, los cuales registran simultáneamente la información es-
pacial y espectral de una zona, ha ayudado en la solución de problemas relacionados con la
identi�cación de los materiales que conforman la escena. Uno de los problemas fundamen-
tales en el análisis de imágenes espectrales es que muchos de sus pixeles contienen una mezcla
de espectros de diversos materiales. El presente trabajo de investigación está orientado a la
determinación autónoma de los materiales que conforman una escena, a partir de imágenes
adquiridas en distintas porciones del espectro electromagnético. Para ello se considera que el
espectro captado en cada pixel de la imagen es una combinación lineal de espectros de los
materiales constituyentes de la escena. Geométricamente estas mezclas se pueden representar
como un conjunto convexo en donde los vértices corresponden a los pixeles con el espectro de
un único material, mientras que cualquier otro pixel estará representado por la combinación de
estos pixeles puros en distintas proporciones. Las columnas escaladas de las transformaciones
reticulares matriciales WXX y MXX permiten determinar los vértices de un conjunto convexo
mínimo que encierra a los pixeles de una imagen multicanal. A su vez, estos vértices están
asociados a los espectros de los materiales constituyentes. Una vez que se han determinado los
pixeles espectrales más puros se pueden cuanti�car las mezclas en cada pixel de la imagen. El
presente estudio se inicia aplicando el método propuesto para la segmentación de colores satu-
rados en imágenes de tres canales. Posteriormente trasladamos la técnica al caso de imágenes
multiespecrales e hiperespectrales. En el primer caso se presentan resultados en la separación
de pigmentos a partir de los datos multiespectrales del palimpsesto de Arquímedes. En el se-
gundo caso se presentan resultados en la determinación de los recursos naturales a partir de
dos escenas cuyas imágenes fueron registradas por un sensor remoto.
ii
Prólogo
El desarrollo de este trabajo de investigación ha sido motivado por la necesidad de
desarrollar nuevas técnicas para la interpretación de datos multidimensionales. A este respecto
se pueden mencionar el creciente auge en las técnicas óptico-digitales para el procesamiento
de imágenes y, en particular, las crecientes aplicaciones de los métodos espectrales para la
identi�cación y monitoreo de materiales. El tratamiento matemático que se presenta en las
siguientes líneas se ha aplicado al caso más simple, que corresponde a las imágenes en tres
canales; su aplicabilidad se ha extendido al caso de imágenes multicanal, en el que el análisis
se vuelve más complicado debido a la cantidad de información. Por otra parte, durante el
desarrollo de este trabajo se ha tratado de complementar esta discusión con los aspectos
físicos que están involucrados tanto en la captura de los datos, como en el análisis de los
mismos.
Es mi deseo agradecer primeramente a la gente de México, quien a través del CONA-
CYT, me han brindado el apoyo necesario para realizar mis estudios de doctorado, mediante
la Beca No. 175027. Asimismo expreso mi gratitud al INAOE por brindarme los conocimientos
y las herramientas necesarias para desarrollarme tanto profesional como humanamente. Este
agradecimiento está también dirigido a los profesores y administrativos, así como a aquellos
que silenciosamente realizan su labor a diario y que hacen posible que los estudiantes teng-
amos espacios adecuados: a las personas de intendencia. Aprovecho también para agradecer el
tiempo, la paciencia y los comentarios oportunos que mis sinodales: Dr. Félix Aguilar Valdés,
Dr. Javier Báez Rojas, Dr. Juan Manuel Ramírez Cortés, Dr. Jorge Castro Ramos y Dr. Al-
fonso Padilla Vivanco han brindado a un servidor, mismos que han ayudado a que este trabajo
sea más completo. Por último expreso mi agradecimiento y admiración al Dr. Gonzalo Urcid
iii
Serrano porque a lo largo de estos años sus conocimientos, consejos y apoyo me han ayudado
a cumplir esta meta, ahora más que un asesor de tesis es un amigo y un colega. A mis padres,
familia y amigos mi cariño y admiración porque con su apoyo hemos construido un sueño.
Juan Carlos Valdiviezo Navarro,
Noviembre 7 de 2011.
J. C. Valdiviezo INAOE iv
Dedicatorias
Al Ser Supremo quien me ha acompañado en cada instante de mi vida y quien me
ha dado la oportunidad de cumplir este sueño.
A mis padres: Rogelio Valdiviezo Román y Mercedes Navarro Martínez quienes con
su amor y ejemplo me han enseñado a caminar por la vida.
A mis hermanos: Rocío, Gloria Estefanía y Luis Enrique, mi inspiración y mis
maestros quienes me han enseñado las cosas bellas de la vida.
A mis abuelitos: Estela, María de la Luz y Antero porque su sabio caminar me ha
enseñado que las di�cultades se superan con esfuerzo y voluntad.
A todos mis amigos que han sido parte de mi familia sin importar las distancias
o fronteras: Georgina, Nora, Sarah, Konni y los señores Jose�na, Rosario e Isidro
porque con su cariño las distancias se han vuelto relativas.
�El aprendizaje es el inicio de la riqueza, es el inicio de la salud, es el inicio de la
espiritualidad. Investigando y aprendiendo es donde todos los procesos milagrosos
comienzan.�
Jim Rohn
v
Índice general
1. Introducción 1
1.1. Antecedentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2. Planteamiento del problema . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.3. Objetivo General . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.3.1. Objetivos particulares . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.4. Avances recientes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.4.1. Técnicas basadas en geometría convexa . . . . . . . . . . . . . . . . . . 5
1.5. Metodología . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.5.1. Propuesta de solución . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.5.2. Estructura del trabajo de tesis . . . . . . . . . . . . . . . . . . . . . . . 10
2. Fundamentos de Espectroscopía 16
2.1. Principios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.1.1. La radiación electromagnética . . . . . . . . . . . . . . . . . . . . . . . 17
2.1.2. Interacción materia-energía . . . . . . . . . . . . . . . . . . . . . . . . 17
2.1.3. Espectros de emisión y absorción . . . . . . . . . . . . . . . . . . . . . 19
2.1.4. Re�ectancia, absortancia y transmitancia . . . . . . . . . . . . . . . . . 21
2.1.5. Características espectrales de la vegetación . . . . . . . . . . . . . . . . 21
2.2. Espectrómetros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.2.1. Resolución del monocromador . . . . . . . . . . . . . . . . . . . . . . . 25
2.2.2. Espectrómetro de línea BRC111A . . . . . . . . . . . . . . . . . . . . 27
2.2.3. Calibración del instrumento . . . . . . . . . . . . . . . . . . . . . . . . 29
vi
ÍNDICE GENERAL
2.3. Registro espectral de materiales . . . . . . . . . . . . . . . . . . . . . . . . . . 31
2.3.1. Espectros de vegetación . . . . . . . . . . . . . . . . . . . . . . . . . . 33
2.3.2. Mezclas espectrales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
2.4. Espectrómetros de imagen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
3. Fundamento Matemático 47
3.1. Álgebra reticular minimax . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
3.1.1. Ejemplos de retículos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
3.1.2. Conceptos generales . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
3.1.3. Operaciones matriciales . . . . . . . . . . . . . . . . . . . . . . . . . . 50
3.1.4. Independencia reticular . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
3.2. Geometría de conjuntos convexos . . . . . . . . . . . . . . . . . . . . . . . . . 53
3.2.1. Convexidad e independencia afín . . . . . . . . . . . . . . . . . . . . . 53
3.2.2. Simplex multidimensionales . . . . . . . . . . . . . . . . . . . . . . . . 55
3.2.3. Modelo de mezclado lineal . . . . . . . . . . . . . . . . . . . . . . . . . 57
3.3. Memorias asociativas reticulares . . . . . . . . . . . . . . . . . . . . . . . . . . 58
3.3.1. Propiedades algebraicas . . . . . . . . . . . . . . . . . . . . . . . . . . 60
3.3.2. Propiedades geométricas . . . . . . . . . . . . . . . . . . . . . . . . . . 61
3.3.3. Criterios para evaluar independencia afín . . . . . . . . . . . . . . . . . 62
3.3.4. Determinación de puntos extremos con W y M . . . . . . . . . . . . . 64
4. Segmentación de Imágenes a Color 70
4.1. Concepto de segmentación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
4.1.1. El método de distancias . . . . . . . . . . . . . . . . . . . . . . . . . . 72
4.1.2. El algoritmo de cuencas . . . . . . . . . . . . . . . . . . . . . . . . . . 73
4.2. Espacios de color . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
4.3. Segmentación basada en W y M . . . . . . . . . . . . . . . . . . . . . . . . . . 78
4.4. Ejemplos de segmentación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
4.5. Comparación de resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
4.6. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
J. C. Valdiviezo INAOE vii
ÍNDICE GENERAL
5. Análisis de Imágenes Multiespectrales 95
5.1. Imágenes multiespectrales de documentos antiguos . . . . . . . . . . . . . . . . 95
5.2. Registro multiespectral de una escena . . . . . . . . . . . . . . . . . . . . . . . 97
5.2.1. Técnicas de estimación de la re�ectancia espectral . . . . . . . . . . . . 99
5.2.2. El Palimpsesto de Arquímedes . . . . . . . . . . . . . . . . . . . . . . . 100
5.3. Métodos autónomos de análisis . . . . . . . . . . . . . . . . . . . . . . . . . . 102
5.3.1. Análisis de componentes principales . . . . . . . . . . . . . . . . . . . . 102
5.3.2. Agrupación con medias-K . . . . . . . . . . . . . . . . . . . . . . . . . 103
5.3.3. El método W y M aplicado al caso multiespectral . . . . . . . . . . . . 104
5.4. Determinación de pigmentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
5.4.1. Implementación numérica . . . . . . . . . . . . . . . . . . . . . . . . . 105
5.4.2. Comparación de resultados . . . . . . . . . . . . . . . . . . . . . . . . . 108
5.5. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
6. Procesado de Imágenes Hiperespectrales 114
6.1. Registro hiperespectral de una escena . . . . . . . . . . . . . . . . . . . . . . . 114
6.1.1. Fundamentos físicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
6.1.2. Resolución espacial y espectral . . . . . . . . . . . . . . . . . . . . . . . 116
6.1.3. Técnicas de estimación de la re�ectancia . . . . . . . . . . . . . . . . . 117
6.1.4. Instrumentos hiperespectrales . . . . . . . . . . . . . . . . . . . . . . . 119
6.2. Determinación de puntos extremos . . . . . . . . . . . . . . . . . . . . . . . . 120
6.2.1. Análisis de componentes de vértices . . . . . . . . . . . . . . . . . . . . 120
6.2.2. El método W y M aplicado al caso hiperespectral . . . . . . . . . . . . 120
6.3. Ejemplos de aplicación de sensado remoto . . . . . . . . . . . . . . . . . . . . 121
6.4. Separación espectral y comparación de resultados . . . . . . . . . . . . . . . . 127
6.5. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
7. Conclusiones 135
7.1. Conclusiones generales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
7.2. Aportaciones de esta investigación . . . . . . . . . . . . . . . . . . . . . . . . . 138
J. C. Valdiviezo INAOE viii
ÍNDICE GENERAL
7.2.1. Dirección del trabajo futuro . . . . . . . . . . . . . . . . . . . . . . . . 140
J. C. Valdiviezo INAOE ix
Índice de �guras
2.1. Espectro electromagnético en orden creciente de longitud de onda. . . . . . . . 18
2.2. Espectro de absorción de la cloro�la a y b. . . . . . . . . . . . . . . . . . . . . 23
2.3. Componentes ópticos de un espectrómetro. . . . . . . . . . . . . . . . . . . . . 24
2.4. Estructura de un espectrómetro de prisma elemental, W denota el ancho del
haz de iluminación y P1 de�ne el primer plano principal. . . . . . . . . . . . . 25
2.5. Per�l de una rejilla líneal de difracción con N líneas; d es el periodo de la rejilla
y s es la separación entre líneas. . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.6. Espectro de emisión de la fuente de iluminación. . . . . . . . . . . . . . . . . . 28
2.7. Diagrama de conexión de los componentes del espectrómetro de línea BRC111A. 28
2.8. Arreglo utilizado para veri�car la calibración por longitud de onda. . . . . . . 29
2.9. Espectro de energía transmitida para el �ltro pasa-bandas con λ0 = 450 nm. . . . . . . . . 31
2.10. Espectro de energía transmitida para el �ltro pasa-bandas con λ0 = 650 nm. . . . . . . . . 32
2.11. Espectro de energía transmitida para el �ltro pasa-altas con frecuencia de corte en 515 nm. . 33
2.12. Espectro de energía transmitida para el �ltro pasa-altas con frecuencia de corte en 715 nm. . 36
2.13. Arreglo utilizado para el registro de espectros de vegetación. . . . . . . . . . . 36
2.14. Espectros de energía re�ejada para una hoja de alcanfor en estados amarillo y seco. . . . . 37
2.15. Espectros de energía re�ejada registrada durante tres días para una hoja de pino. . . . . . 37
2.16. Espectro de energía re�ejada para una hoja de pasto verde. . . . . . . . . . . . . . . . . 38
2.17. Espectro de energía re�ejada para una hoja de pasto seco. . . . . . . . . . . . . . . . . 38
2.18. Espectro de energía re�ejada para una hoja de árbol rojiza de la familia del pino. . . . . . 39
2.19. Espectro de energía re�ejada para una hoja de bugambilia. . . . . . . . . . . . . . . . . 39
x
ÍNDICE DE FIGURAS
2.20. Espectro de energía re�ejada registrado a partir de la cáscara de un jitomate rojo. . . . . . 40
2.21. Espectro de energía re�ejada para la cáscara de una mandarina. . . . . . . . . . . . . . 40
2.22. Espectro mezclado obtenido a partir de una hoja verde y una amarilla. . . . . . . . . . . 41
2.23. Espectro mezclado obtenido a partir de una hoja verde y otra amarilla. En esta grá�ca f(λ)
es una función cuyos coe�cientes aproximan la forma del espectro mezclado. . . . . . . . . 41
2.24. Diagrama óptico del espectrómetro de imagen MIVIS. . . . . . . . . . . . . . . 44
3.1. Ejemplos de simplex para k = 1, . . . , 4 . . . . . . . . . . . . . . . . . . . . . . 56
4.1. Representación del espacio de color RGB. . . . . . . . . . . . . . . . . . . . . . . . . 75
4.2. Representación del espacio de color HSI. . . . . . . . . . . . . . . . . . . . . . . . . . 76
4.3. Representación del espacio de color L*a*b*, donde L* representa la luminancia o el eje de
escala de grises, mientras que a* y b* de�nen la saturación y el color. . . . . . . . . . . . 77
4.4. Primera �la, izquierda a derecha: imagen en color RGB utilizada en el Ejemplo 4.1, imágenes en
tonos de gris de las fracciones de color determinadas a partir de las columnas de W . Segunda
�la: fracciones de color determinadas a partir de las columnas de M . La correspondencia entre
el nivel de gris asignado y el valor numérico es el siguiente: 1 = blanco, 0.5 = gris medio, 0.33
= gris oscuro y 0 = negro. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
4.5. Fila superior: imágenes de color ejemplares; segunda a cuarta �las: imágenes en tonos de gris
representando las fracciones de los colores saturados seleccionados a partir de W y M . . . . 83
4.6. Izquierda: distribución en el espacio de los diferentes vectores de color en la imagen del mandril
de la �g. 4.5. Centro y derecha: diferentes tetraedros determinados por W = {w1,w2,w3} y
M = {m1,m2,m3} que encierran diferentes subconjuntos de X. . . . . . . . . . . . . . 84
4.7. Fila superior: imágenes de color ejemplares; segunda a cuarta �las: imágenes de colores seg-
mentados para las �guras ejemplares (resultado de umbralización y enmascaramiento). . . . 85
4.8. Primera �la: imagen de color en los espacios RGB, I1I2I3, HSI y L*a*b*, respectivamente;
segunda �la: imágenes conformadas por las segmentaciones de los pimientos rojos y verdes y
las porciones de luz re�ejada producidas por W y M para cada espacio de color. . . . . . . 87
J. C. Valdiviezo INAOE xi
ÍNDICE DE FIGURAS
4.9. Primera �la, de izquierda a derecha: resultados se segmentación obtenidos, respectivamente,
con W y M en los espacios RGB y I1I2I3, distancia de Mahalanobis y algoritmo de cuencas
e imagen de los �pimientos� cuantizada a 16 niveles de gris; segunda �la: imágenes de bordes
producidos por �ltros de Sobel para las imágenes de la primera �la. . . . . . . . . . . . . 88
4.10. Primera columna: imágenes en color RGB; segunda a quinta columnas: imágenes conformadas
por las segmentaciones producidas por W y M en los espacios RGB, I1I2I3, HSI y L*a*b*,
respectivamente. Las principales regiones de interès se han cuantizado. . . . . . . . . . . 90
5.1. Registro multiespectral de un documento antiguo usando un arreglo de �ltros. . . . . . . 98
5.2. Izquierda: imagen en color verdadero de la porción del palimpsesto utilizada para los experi-
mentos. Derecha: imagen en falso color realizada mediante la composición de las componentes
C1 y C2 obtenidas mediante PCA. . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
5.3. Curvas espectrales de los puntos extremos determinados a partir de W y M . La correspon-
dencia de estos puntos es: pigmento 1 = w11, pigmento 2 = m1 y cuero = m11. . . . . . . 109
5.4. Imágenes de las abundancias de los materiales constituyentes del palimpsesto determinados
a partir de W y M . Izquierda: texto escrito en el siglo XII (pigmento 2); centro: texto escrito
en el siglo X (pigmento 1); derecha: cuero del manuscrito. . . . . . . . . . . . . . . . . 110
5.5. Resultados de segmentación de los pigmentos presentes en el palimpsesto de Arquímedes.
Primera �la, de izquierda a derecha: subimagen del manuscrito desplegada en color verdadero,
composición en falso color utilizando PCA. Segunda �la, izquierda a derecha: resultados del
agrupamiento por medias-K, mapas de abundancia que corresponden a los dos tipos de es-
critura determinados por el método W M . . . . . . . . . . . . . . . . . . . . . . . . 111
6.1. Dos tipos de sistemas de barrido usados para capturar una escena hiperespectral; el
número de bandas espectrales está determinado por los detectores que cubren inter-
valos de longitudes de onda (λ) especí�cos. . . . . . . . . . . . . . . . . . . . . . . 116
6.2. Imágenes a color de la escena hiperespectral registrada sobre la costa del Golfo de México.
Izquierda: imagen formada por la combinación de las bandas 54 (rojo), 34 (verde) y 14 (azul).
Derecha: combinación de bandas 81 (rojo), 217 (verde) y 54 (azul). . . . . . . . . . . . . 123
J. C. Valdiviezo INAOE xii
ÍNDICE DE FIGURAS
6.3. Espectros de tres puntos extremos determinados con W y M en el cubo hiperespectral del
Golfo de México. Los valores de columna seleccionados a partir de W ∪M son: w2, w24, w54. 125
6.4. Espectros de tres puntos extremos obtenidos con el algoritmo VCA en el cubo hiperespec-
tral del Golfo de México. Los vectores columna sj para j = 1, . . . , 5 indican las columnas
correspondientes de S. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126
6.5. Imágenes a color de la escena hiperespectral de Beltsville. Izquierda: imagen formada por la
combinación de bandas 54 (rojo), 34 (verde) y 14 (azul). Derecha: combinación de bandas 81
(rojo), 54 (verde) y 34 (azul). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
6.6. Espectros de cuatro puntos extremos determinados con W y M en el cubo hiperespectral de
Beltsville. Los vectores columna seleccionados a partir de W ∪M son: w24, w37, w47, w64. 128
6.7. Espectros de cuatro puntos extremos obtenidos con el algoritmo VCA en el cubo hiperespectral
de Beltsville. Los vectores columna sj para j = 1, . . . , 7 indican las columnas correspondientes
de la matriz S. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130
6.8. Mapas de abundancia en color de los recursos naturales determinados con la identi�cación
autónoma de puntos extremos en el cubo hiperspectral del Golfo de México. Izquierda: abun-
dancias de cuatro puntos extremos determinados con W y M , cuya distribución de colores
corresponde a amarillo = w2, magenta = w24, verde = w43, azul = w54. Derecha: abundan-
cias de tres puntos extremos determinados con VCA cuya distribución de colores es amarillo
= s4, magenta = s2, verde = s3. Áreas más brillantes representan mayor concentración del
recurso natural. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
6.9. Mapas de abundancia en color de los tipos de vegetación obtenidos con la identi�cación
autónoma de puntos extremos en la imagen hiperespectral de Belstville. Izquierda: abundan-
cias de cuatro puntos extremos determinados con WM cuya distribución de colores corre-
sponde a magenta = w24, amarillo = w67, azul =m46, verde =m62. Derecha: abundancias de
cuatro puntos extremos determinados con VCA, cuya distribución de colores es magenta = s2,
amarillo = s3, azul = s5, verde = s7. Áreas más brillantes representan mayor concentración
del recurso natural. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
J. C. Valdiviezo INAOE 1
Capítulo 1
Introducción
En este primer capítulo se presenta el área de estudio en el que se desarrollará este trabajo de
tesis y plantea el problema que se quiere resolver. Subsecuentemente se presentan los objetivos
generales y particulares que se desean alcanzar por medio de esta investigación. En una sección
siguiente se hace una descripción de técnicas conocidas y que han sido reportadas para resolver
en forma alternativa el problema considerado. Finalmente, para cerrar este capítulo, se hace
una descripción de la propuesta de solución, base de esta investigación.
1.1. Antecedentes
El creciente surgimiento de dispositivos que realizan el registro de imágenes en distintos
escenarios y para diversas aplicaciones ha hecho necesario el desarrollo de nuevas técnicas para
el análisis y procesamiento de las imágenes. Este auge se debe a que las imágenes captadas
por un sensor proporcionan información útil sobre los objetos presentes en la escena. Especí�-
camente, una imagen se puede considerar como una función f(x, y) que conlleva información
de la energía radiada por una fuente de luz que ilumina la escena i(x, y) y la energía re�ejada
por los objetos, denominada re�ectancia r(x, y). De esta manera, debido a que la re�ectancia
de los objetos varía con la longitud de onda que emite la fuente de iluminación, el registro
de imágenes en porciones del espectro electromagnético distintas a la visible provee mayor
información acerca de los objetos presentes.
1
1.1. ANTECEDENTES
En años recientes, los instrumentos conocidos como espectrómetros han sido acoplados
a sistemas ópticos formadores de imagen, surgiendo así los denominados espectrómetros de
imagen; este desarrollo conjunto ha permitido el avance en las técnicas para la adquisición de
imágenes en diferentes porciones del espectro electromagnético. Estos dispositivos registran
en forma de imagen la energía re�ejada o esparcida por un área u objeto, en un determinado
intervalo de longitudes de onda, ∆λ. De acuerdo con el número de bandas adquiridas, estos
dispositivos se pueden clasi�car en: multiespectrales si el instrumento es capaz de registrar
decenas de bandas espectralmente anchas en intervalos distintos que no necesariamente son
continuos, o hiperespectrales cuando el instrumento adquiere cientos de bandas cuasi contiguas
y espectralmente angostas.
Una característica importante de las imágenes adquiridas con estas técnicas es que, al
apilar cada una de las bandas espectrales, se forma un cubo de datos en el que cada pixel
es considerado como un vector con información de las n bandas que conforman el cubo. Así,
cada pixel de la imagen contiene información de la re�ectancia de los objetos en diferentes
porciones del espectro electromagnético. Esta información o espectro colectado en cada pixel
puede ser utilizado para diferenciar e identi�car los objetos presentes en dicha imagen. Esta
característica ha hecho posible que las imágenes multiespectrales e hiperespectrales puedan
ser utilizadas para gran cantidad de aplicaciones en áreas diversas.
En un principio, los espectrómetros de imagen fueron desarrollados para el monitoreo
y cuanti�cación de recursos naturales utilizando plataformas aéreas [2]; posteriormente, estos
instrumentos fueron aplicados con éxito en microscopía, biología y medicina para la detec-
ción de anomalías en células y tejidos orgánicos [15]. En los últimos años, los dispositivos
multiespectrales e hiperespectrales han demostrado ser una valiosa herramienta para la iden-
ti�cación de pigmentos en pinturas arqueológicas, así como en el realce de escrituras ocultas
en manuscritos antiguos que han sido preservados por el paso del tiempo [3, 8, 22]. Las apli-
caciones mencionadas son relevantes ya que representan técnicas no invasivas que permiten
analizar una escena mediante el registro único de su re�ectancia espectral.
J. C. Valdiviezo INAOE 2
1.2. PLANTEAMIENTO DEL PROBLEMA
1.2. Planteamiento del problema
En una imagen adquirida mediante técnicas espectrales existen dos parámetros impor-
tantes que se deben considerar para realizar un análisis apropiado: la resolución espacial y la
resolución espectral. La resolución espacial se re�ere al detalle mínimo que puede ser registrado
por la óptica del instrumento. La resolución espacial está también relacionada con el tamaño
físico que abarca un pixel de la imagen sobre la escena registrada. La resolución espectral se
re�ere al ancho espectral de las bandas registradas. Así por ejemplo, los dispositivos hipere-
spectrales, que tienen una alta resolución espectral, realizan el registro de cientos de bandas
espectralmente angostas donde ∆λ ≤ 10 nm, que permiten comparar directamente el espectro
colectado en cualquier pixel de la imagen con algún espectro de referencia. Esta es una ven-
taja importante sobre los dispositivos multiespectrales, en los que la resolución espectral está
alrededor de 50 nm. Por su parte, la resolución espacial está en función de los componentes
ópticos y el mecanismo de adquisición que se utilice para el registro de la imagen. Ambas car-
acterísticas están relacionadas con el tipo de aplicación para el cual se requiere el instrumento
como, por ejemplo, monitoreo terrestre o análisis citológicos.
En diversas aplicaciones orientadas a la identi�cación de los materiales presentes en la
imagen, el proceso se di�culta debido a la presencia de espectros mezclados en muchos de los
pixeles; estas mezclas pueden originarse por dos razones. Primero, cuando la resolución espacial
del dispositivo es baja los pixeles de la imagen cubren una extensión física grande, lo que
conlleva a que la re�ectancia colectada esté compuesta por mezclas de espectros de diferentes
materiales en la zona. Además, las mezclas espectrales pueden ser causadas por la naturaleza
misma de los materiales que puedan estar combinados en una mezcla homogénea, como es el
caso del agua de mar o la arena. Por tanto la di�cultad en el análisis de imágenes adquiridas
con técnicas espectrales radica en la determinación de pixeles en la imagen que contengan el
espectro de re�ectancia de un único material. Al conjunto de pixeles que contienen el espectro
más puro de un único material se les denomina miembros �nales o puntos extremos [14].
En algunas aplicaciones donde se tiene conocimiento de los objetos que conforman la
escena es posible registrar el espectro de éstos con un espectrómetro de campo y utilizarlo para
identi�carlos en la imagen. Sin embargo, en muchas otras aplicaciones se requiere determinar
J. C. Valdiviezo INAOE 3
1.3. OBJETIVO GENERAL
estos pixeles puros directamente desde la imagen, lo que hace necesario el uso de una técnica
autónoma para determinar el conjunto de puntos extremos.
Por otra parte, con el propósito de cuanti�car los componentes presentes en una escena
es necesario representar las mezclas de espectros utilizando una representación matemática.
Un modelo frecuentemente utilizado para este análisis es el modelo de mezclado lineal con
restricciones (MLR), en el cual se considera que el espectro de re�ectancia medido en un pixel
corresponde a la mezcla lineal de los pixeles más puros en la zona en proporcionos o fracciones
distintas denominadas abundancias. Las restricciones planteadas en este modelo consisten en
que todas las abundancias deben ser cantidades positivas y que deben sumar la unidad.
De esta manera, el problema en la determinación del conjunto de puntos extremos se
puede apreciar desde un punto de vista geométrico al considerar que los pixeles espectrales
más puros de�nen un conjunto convexo en el que cualquier otro pixel mezclado reside en el
interior de este conjunto.
1.3. Objetivo General
Aplicar las técnicas y propiedades desarrolladas en el contexto del álgebra reticular mini-
max para el análisis y segmentación de imágenes en color, multiespectrales e hiperespectrales
con base a la localización de sus puntos extremos.
1.3.1. Objetivos particulares
1. Determinar los puntos extremos en una imagen en color usando propiedades del álgebra
reticular, representar las mezclas de color presentes usando el modelo de mezclado lineal
y, posteriormente, segmentarla.
2. Determinar los puntos extremos para el análisis de imágenes multiespectrales, en par-
ticular los diferentes pigmentos presentes en imágenes multiespectrales de documentos
antiguos.
3. Adquirir un conjunto de espectros en el laboratorio utilizando un espectrómetro de línea
J. C. Valdiviezo INAOE 4
1.4. AVANCES RECIENTES
para veri�car el modelo MLR.
4. Comparar el desempeño de un método conocido para el análisis de imágenes hiperespec-
trales con el método propuesto.
1.4. Avances recientes
En años recientes diversas técnicas basadas en geometría convexa han sido desarrolladas
con el propósito de determinar, de manera autónoma, el conjunto de pixeles más puros, que
a su vez corresponde a los materiales que conforman la imagen. Cada técnica está basada en
algun criterio particular de selección. En las siguientes líneas serán descritos los métodos más
importantes.
1.4.1. Técnicas basadas en geometría convexa
Estas técnicas han sido desarrollada para la determinación de puntos extremos en
imágenes hiperespectrales y comparten un fundamento geométrico, basado en el modelo MLR
y consiste en la representación de los pixeles espectrales n-dimensionales de la imagen como
un conjunto convexo, donde sus vértices corresponden a los puntos extremos.
Índice de pureza de pixel (Pixel purity index, PPI). El método realiza una reducción
de bandas del cubo de datos y continúa mediante repetidas proyecciones de los datos sobre
vectores unitarios aleatorios no paralelos (llamados skewers). Los puntos extremos en cada
proyección se marcan y se almacena en un contador, el número de veces que un pixel se
determina como extremo. El resultado �nal del conteo se utiliza para identi�car los pixeles
más puros en la escena y éstos, a su vez, se comparan con espectros de referencia [4, 5]. Debido a
que no hay un criterio para seleccionar el número de vectores unitarios, este procedimiento debe
realizarse a prueba y error, lo que resulta en una alta complejidad computacional. Además,
esta técnica no garantiza que los vectores �nales generados sean puntos extremos, por lo que
puede considerarse como una aproximación.
J. C. Valdiviezo INAOE 5
1.4. AVANCES RECIENTES
Análisis de cono convexo (Convex cone analysis, CCA). La técnica toma de base el hecho
de que cantidades físicas, como la radiancia, son estrictamente no-negativas y asume que los
vectores formados por estos espectros residen dentro de una región convexa. Así, con uno de
sus vértices en el origen, esta región de�ne un cono. De esta manera, el objetivo es encontrar
la frontera de esta región convexa. En el procedimiento se calcula una matriz de correlación a
partir de la imagen y se calculan los eigenvectores de la matriz por medio de la descomposición
de valores singulares (singular value decomposition, SVD). En esta descomposición se utiliza
una matriz de correlación y se seleccionan los eigenvectores relacionados con los eigenvalores
más grandes. La combinación lineal de estos eigenvectores produce vectores no-negativos. Es
posible entonces encontrar un conjunto de coe�cientes que produzcan una combinación lineal
y que contengan algunos elementos igual a cero y los demás estrictamente no-negativos. Estos
puntos representan los vértices del cono, cuyos espectros pueden ser usados como miembros
�nales. Al utilizar esta técnica se necesita conocer a priori el número de componentes de
interés, el cual no debe ser mayor a la dimensionalidad de los datos. Asimismo, la complejidad
computacional del algoritmo es alta [13].
Algoritmo N-FINDR. Este método está basado en el hecho de que en un arreglo n-dimensional
de pixeles espectrales los pixeles puros de�nen el simplex de volumen más grande. La técnica
determina el conjunto de pixeles que forman el volumen más grande posible al in�ar un sim-
plex dentro de los datos. Siendo la entrada el cubo de datos completo, el algoritmo comienza
con un conjunto aleatorio de vectores y una matriz E de miembros �nales. Para realizar una
buena estimación, cada pixel de la imagen debe ser evaluado; para ello, se calcula el volumen
de cada uno reemplazando cada punto extremo por un pixel en la posición del primero. Si el
reemplazo resulta en un incremento del volumen, el pixel reemplaza al punto extremo dado.
El procedimiento se repite hasta que no haya más reemplazos de puntos extremos. Una vez
que los pixeles puros se han encontrado, sus espectros pueden ser usados para separar las
mezclas en la imagen original. Una di�cultad con este método se presenta cuando hay pixeles
mezclados cuyo brillo es más alto que los pixeles puros, entonces el algoritmo los selecciona
como puntos extremos [23].
J. C. Valdiviezo INAOE 6
1.4. AVANCES RECIENTES
Análisis de componentes de vértices (Vertex component analysis, VCA). Esta técnica no
supervizada está basada en la descomposición de valores singulares y el análisis de componentes
principales como subprocedimientos [16]. En particular este algoritmo asume la existencia de
pixeles puros y explota el hecho de que los puntos extremos son vértices de un simplex,
por lo que la transformación afín de un simplex es también un simplex. La técnica proyecta
iterativamente los datos en una dirección ortogonal al subespacio ocupado por los puntos
extremos ya determinados. El nuevo espectro del miembro �nal es el extremo de la proyección,
entonces el lazo principal continúa hasta que todos los puntos extremos dados son agotados.
Algoritmo de crecimiento de un simplex. Este método está inspirado en el algoritmo
N-FINDR y toma de base sus limitaciones para mejorarlas. Primero, para estimar el número de
miembros �nales requeridos p, el método utiliza el concepto de dimensionalidad virtual (VD)
[7]. De esta manera, el algoritmo encuentra un simplex de dimensión p−1 con el volumen más
grande al crecer gradualmente varios simplex vértice por vértice. Es decir, en lugar de hacer
el intento por encontrar directamente un simplex con p vértices y con el máximo volumen, el
método primero encuentra un simplex con dos vértices con el volumen más grande; a partir
de éste se comienzan a crecer nuevos simplex. De esta manera, el método sólo tiene que
encontrar un miembro �nal a la vez hasta que alcance el número deseado de miembros �nales,
p, el cual ha sido estimado mediante VD. A diferencia del algoritmo N-FINDR que inicializa
la matriz E con pixeles aleatorios, el algoritmo de crecimiento de un simplex resuelve esta
di�cultad al seleccionar cuidadosamente los vectores para inicializar el algoritmo. Aunque el
algoritmo presenta una mayor complejidad computacional, los miembros �nales determinados
son similares a los obtenidos por VCA [8].
Un simplex que encierra el volumen mínimo (Minimum volume enclosing simplex,
MVES). Este método comienza con un simplex de volumen más grande e iterativamente mueve
sus caras hacia la nube de datos1. En la técnica se utilizan análisis convexo y técnicas de
optimización para desarrollar un algoritmo de separación hiperespectral. El uso del análisis
convexo está motivado por el hecho de que conceptos tales como casco afín y casco convexo,
1Esta idea fue propuesta por Craig et al. en [9].
J. C. Valdiviezo INAOE 7
1.5. METODOLOGÍA
son adecuados para el análisis de este problema. El procedimiento realizado por el método
se resume como sigue. Primero se realiza una reducción en la dimensionalidad de los pixeles
observados por medio de un concepto de análisis convexo denominado ajuste de conjunto afín.
El problema de hallar el volumen mínimo fue modi�cado a un problema de minimizar el volu-
men de un simplex sujeto a la condición de que todos los pixeles de dimensión reducida estén
encerrados por éste. Entonces se emplea el criterio de separación de Craig para formular la
separación como un problema de optimización. La función objetivo del MVES no es convexa,
pero el problema puede ser manejado en una manera cíclica al resolver una secuencia de prob-
lemas de programación lineal. Una ventaja de este método es que no necesitan haber pixeles
puros en la imagen [6].
1.5. Metodología
Con el desarrollo de este trabajo de investigación el problema que se desea resolver es el
de determinar el conjunto de pixeles más saturados, en el caso de una imagen en color, así como
aquellos que contengan la mayor pureza espectral en una imagen multi- o hiperespectral y que
puedan ser usados para representar las mezclas en la imagen. La segmentación de imágenes
de tres canales representa el punto de partida en el que se considera que la imagen ha sido
adquirida utilizando tres �ltros de banda ancha, centrados en las longitudes de onda del rojo
(700 nm), verde (546 nm) y azul (435 nm) [12]. De esta manera, el objetivo será determinar los
pixeles que contengan la mayor saturación en las longitudes consideradas. Una vez que sean
determinados los pixeles puros en una escena se tendrá información su�ciente para separar
los diversos componentes que presenten características espectrales semejantes dentro de la
imagen. Además, cualquier combinación de éstos será posible de estimar a partir del modelo
de mezclado lineal. Los alcances de este trabajo incluyen un estudio acerca de los métodos
para determinar, en cada pixel de la imagen, ya sean fracciones de color o las abundancias de
materiales según corresponda al tipo de imagen.
Parte complementaria en el desarrollo de este trabajo de investigación será el registro
de espectros de diversos tipos de vegetación, así como de mezclas espectrales obtenidas en el
J. C. Valdiviezo INAOE 8
1.5. METODOLOGÍA
laboratorio a través del espectrómetro de línea BWTek. El registro de espectros de vegetación
ayuda a comprender los factores que contribuyen a alteraciones en su forma debido a cambios
físicos como la temperatura o humedad. Además, la idea de realizar mezclas espectrales permite
corroborar el modelo de mezclado lineal para representar las mezclas de espectros de los
diferentes materiales presentes en una escena. Por tanto, con este trabajo experimental se
podrá tener una idea más clara del proceso de adquisición de pixeles mezclados en imágenes
multi- e hiperespectrales.
En el caso de imágenes multiespectrales de documentos antiguos, las imágenes que han
sido consideradas para el análisis espectral han sido registradas por el proyecto del Palimpsesto
de Arquímedes y se encuentran disponsibles con �nes de investigación en [1] y [3]. Estas
imágenes fueron registradas utilizando diodos emisores de luz (light emitting diodes, LEDs) que
emiten radiación en diferentes longitudes de onda. La porción del espectro electromagnético
que se ha registrado comprende de 365 a 870 nm, con una resolución espectral alrededor de
30 nm, siendo más angosta en ciertas porciones y más ancha en otras [10].
Por otra parte, existen imágenes de sensado remoto que pueden ser utilizadas para
localizar y cuanti�car los recursos naturales presentes en una escena. Las imágenes frecuente-
mente utilizadas por su disponibilidad son aquellas que han sido adquiridas utilizando el
espectrómetro de imagen AVIRIS (Airborne Visible and Infrared Imaging Spectrometer) [2]. El
instrumento registra imágenes en las porciones del espectro que comprenden de 400 a 2500
nm, con una resolución espectral de 10 nm. Una imagen adquirida en un área determinada
consta de 5 escenas; a su vez, cada una de estas escenas está formada por 512 líneas × 614
pixeles × 224 bandas espectrales, en donde los valores de re�ectancia están escalados por un
factor de 10000. Debido a que el instrumento se coloca en una plataforma aérea, cada pixel
de la imagen corresponde a un área terrestre de 20 × 20 = 400 m2. Las imágenes que están
disponibles para investigación han sido registradas sobre las zonas geográ�cas de Cuprite en
Nevada, además de Mo�et Field y Jasper Ridge en California, las cuales son importantes para
el estudio de minerales, asentamientos humanos y tipos de vegetación, respectivamente. En
esta investigación se ha considerado el uso de dos imágenes recientemente registradas por un
sensor remoto de la compañía SpecTir, cuyas características serán discutidas más adelante.
J. C. Valdiviezo INAOE 9
1.5. METODOLOGÍA
1.5.1. Propuesta de solución
En este trabajo de investigación se utilizarán desarrollos recientes del álgebra reticular
minimax y su relación con la geometría de conjuntos convexos para la determinación de
puntos extremos en imágenes a color, multiespectrales e hiperespectrales. En el análisis se toma
de base el modelo de mezclado lineal para describir las mezclas espectrales en las imágenes
utilizadas. Así, el objetivo de la técnica presentada consistirá en extraer desde cualquier imagen
el conjunto de puntos extremos que puedan ser utilizados para calcular sus correspondientes
abundancias en la imagen. Además, cualquier pixel de la imagen se podrá representar como
una combinación lineal de éstos.
Basado en el álgebra reticular minimax, el cálculo de dos memorias asociativas reticu-
lares matriciales, conocidas como memorias min-W y max-M , permitirá obtener un conjunto
de puntos extremos relacionados con la imagen. Especí�camente, dada una imagen con n
número de bandas, lo único que se requiere es calcular las memorias W y M y sus corre-
spondientes columnas escaladas. El conjunto formado por las columnas escaladas y las cotas
vectoriales mínima y máxima de�nen los vértices del conjunto convexo mínimo que es capaz
de encerrar a todos los pixeles de la imagen. De ahí que estas columnas puedan ser utilizadas
para calcular las fracciones de los puntos extremos en cada pixel de la imagen.
Las memorias asociativas reticulares fueron introducidas como un nuevo paradigma
en el almacenamiento y recuperación de imágenes afectadas por ruido [18, 19]. Posterior-
mente se propuso utilizar algunas de sus propiedades para determinar miembros �nales en
imágenes hiperespectrales [11]. Más recientemente, algunas otras aplicaciones han estado ori-
entadas a la determinación de conjuntos reticularmente independientes [20, 32]. Finalmente,
con el propósito de realizar una comparación cuantitativa de los resultados obtenidos con el
método propuesto, se realiza una comparación con aquellos determinados con el análisis de
componentes de vértices (VCA), descrito en p. 7.
1.5.2. Estructura del trabajo de tesis
La estructura de este documento es la siguiente. En el capítulo 2 se introducen los
fundamentos físicos de los procesos de interacción entre materia y energía, los cuales son
J. C. Valdiviezo INAOE 10
1.5. METODOLOGÍA
la base de la espectroscopía. Enseguida se describen algunos aspectos de instrumentación
que son importantes para conocer el funcionamiento de los espectrómetros. Más adelante se
presentan los resultados obtenidos al realizar el registro de espectros de energía re�ejada para
diversos tipos de vegetación en diferentes condiciones de vitalidad. El capítulo concluye con
una explicación de un instrumento moderno que se utiliza para registrar múltiples imágenes
de las características espectrales de una escena.
El capítulo 3 inicia con una breve explicación acerca de la geometría de conjuntos
convexos y su representación en espacios multidimensionales. Más adelante se dan los conceptos
y las propiedades del álgebra reticular minimax, que conforman la base matemática de esta
investigación. Después se de�nen las memorias asociativas reticulares y se mencionan sus
principales propiedades, así como algunas de sus aplicaciones. Finalmente se plantea el vínculo
existente entre la geometría de conjuntos convexos y los vectores columna de las memorias
asociativas reticulares escaladas.
El capítulo 4 inicia con una descripción del procedimiento de análisis que será utilizado
para realizar la segmentación de imágenes en color a partir de las memorias autoasociativas
reticulares. Posteriormente se propone el uso de otros espacios de color para mejorar los re-
sultados que se obtienen con la técnica propuesta. Finalmente, los resultados de segmentación
obtenidos se presentan y se realiza una comparación cuantitativa con algunas otras técnicas
conocidas en la literatura.
En el capítulo 5 se realiza el análisis multiespectral de una de las páginas del palimpses-
to de Arquímedes. Primeramente se realiza una descripción de la instrumentación, utilizada
para registrar la imagen multiespectral del documento, así como algunas técnicas empleadas
para estimar la re�ectancia espectral. Enseguida se describe la aplicación de las memorias
autoasociativas reticulares para el caso multiespectral. Al �nalizar este capítulo se presentan
los resultados de la distribución de pigmentos obtenidos para este tipo de imagen y se realiza
una comparación con el análisis de componentes principales y el agrupamiento con medias-k.
En el capítulo 6 se realiza el análisis de dos imágenes hiperespectrales registradas
por un espectrómetro de imagen de la compañía SpecTir. A partir de la descripción de la
instrumentación y el proceso de calibración de estos dispositivos se realiza una descripción de
J. C. Valdiviezo INAOE 11
1.5. METODOLOGÍA
las características de los datos hiperespectrales. Más adelante, se introduce una modi�cación
necesaria al método basado en las memorias autoasociativas para poder determinar el conjunto
de puntos extremos en este tipo de imágenes. Subsecuentemente, los mapas de abundancias
de los materiales se presentan para cada punto extremo determinado. Este capítulo concluye
mediante una comparación de los puntos extremos determinados con el método W y M y
el algoritmo VCA. El trabajo de tesis �naliza con el capítulo 7 en el que se resumen las
conclusiones principales y se comenta la dirección del trabajo futuro.
J. C. Valdiviezo INAOE 12
Bibliografía
[1] Archimedes Palimpsest, �The Archimedes Palimpsest Project,� www.archimedespalimpsest.net,
2008.
[2] Aviris JPL., �AVIRIS home page,� www.aviris.jpl.nasa.gov, 1997.
[3] Bearman G., Zuckerman B., Zucherman K., Chiu J., �Multi-spectral digital imaging of Dead Sea
scrolls and other ancient documents,� JPL Technical Report, California Institute of Technology,
1995.
[4] Boardman J.W., �Automated spectral unmixing of AVIRIS data using convex geometry concepts,�
AVIRIS Workshop Proceedings, JPL Publication, Vol. 1, No. 4, pp. 11�14, 1993.
[5] Boardman J.W. and Kruse F.A., �Automated spectral analysis: A geological example using
AVIRIS data, Northern Grapevine Mountains, Nevada,� Proc. 10th Thematic Conference, Ge-
ologic Remote Sensing, San Antonio, TX, 1994.
[6] Chan T.H., Chi C.Y., Huang Y.M., Ma W.K., �A convex analysis based minimum-volume enclos-
ing simplex algorithm for hyperspectral unmixing,� IEEE Trans. on Signal Processing, Vol. 57,
No. 11, pp. 4418-4432, 2009.
[7] Chang C.-I, Hyperspectral Imaging: Techniques for Spectral Detection and Classi�cation, Vol. 1,
Kluwer Academic, New York, NY, 2003.
[8] Chang C.I., Wu C.C., Liu W.M., Ouyang Y.C., �A new growing method for simplex based ex-
traction endmember algorithm,� IEEE Trans. on Geoscience and Remote Sensing, Vol. 44, No.
10, pp. 2804�2819, 2006.
13
BIBLIOGRAFÍA
[9] Craig M.D.,�Minimum-volume transforms for remotely sensed data,� IEEE Trans. Geoscience and
Remote Sensing, Vol. 32, No. 3, pp. 542�552, 1994.
[10] Easton R.L., Knox K.T., Christens-Barry W.A., �Multispectral imaging of the Archimedes
Palimpsest,� Proc. 32nd AIPR, pp. 111�118, 2003.
[11] Graña M., Gallego J., �Hyperspectral image analysis with associative morphological memories,�
IEEE Proc.: ICIP, Vol. 7803, pp. 549�552, 2003.
[12] Gonzalez R.C., Woods R.E., Digital Image Processing, 3rd edition, Pearson Education, pp. 331,
567�569, 2008.
[13] Ifarraguerri A., Chang C.-I, �Multispectral and hyperspectral image analysis with convex cones,�
IEEE Trans. on Geoscience and Remote Sensing, Vol. 37, No. 2, pp. 756�770, 1999.
[14] Keshava N., �A Survey of spectral unmixing algorithms,� Lincoln Laboratoy Journal, Vol. 14, No.
1, pp. 55�74, 2003.
[15] More K.A., �Spectrometers.� In: Encyclopedia of Modern Optics, Robert D. Guenther editor, Vol.
1, pp. 324�336, Elsevier, Academic Press, 2005.
[16] Nascimento J.M.P., Bioucas-Díaz J.M., �Vertex component analysis: a fast algorithm to unmix
hyperspectral data,� IEEE Trans. on Geoscience and Remote Sensing, Vol. 43, No. 4, pp. 898�910,
2005.
[17] Plaza A., Martínez P., Pérez R., Plaza J., �Spatial/spectral endmember extraction by multidi-
mensional morphological operations,� IEEE Trans. on Geoscience and Remote Sensing, Vol. 49,
No. 9, pp. 2025�2041, 2002.
[18] Ritter G. X., Sussner P., Diaz de Leon J. L., �Morphological associative memories,� IEEE Trans.
Neural Networks, Vol. 9, No. 2, pp. 281�293, 1998.
[19] Ritter G.X., Urcid G., Iancu L., �Reconstruction of patterns from noisy inputs using morpho-
logical associative memories,� Jour. of Math. Imag. and Vis., Vol. 19, No. 2, pp. 95�111, 2003.
[20] Ritter G.X., Schmalz M.S., Urcid G., �E�cient autonomous endmember determination using
lattice auto-associative memories,� WSC Proc. of the 10th Joint Conference on Information Sci-
ences, pp. 1632�1638, 2007.
J. C. Valdiviezo INAOE 14
BIBLIOGRAFÍA
[21] Valdiviezo J.C., Urcid G., �Hyperspectral endmember detection based on strong lattice indepen-
dence,� SPIE Proc.: Applications of Digital Image Processing XXX, Vol. 6696, pp. 669625:1�12,
2007.
[22] Ware G.A., Chabries D.M., Christiansen R.W., Brady J.E., Martin C.E., �Multispectral Analysis
of Ancient Maya Pigments: Implications for the Naj Tunich Corpus,� IEEE Proc.: IGARSS, Vol
6, pp. 2489�2491, 2000.
[23] Winter M.E., �N-FINDR: An algorithm for fast autonomous spectral endmember determination
in hyperspectral data,� SPIE Proc.: Imaging Spectrometry V, pp. 266�275, 1999.
J. C. Valdiviezo INAOE 15
Capítulo 2
Fundamentos de Espectroscopía
En este capítulo se introducen los fundamentos físicos de la emisión y absorción de energía
radiante, que serán útilies para comprender los capítulos subsecuentes. En particular, se hace
una descripción de los procesos fundamentales de interacción entre materia y energía; enseguida
se presenta una descripción de los instrumentos utilizados para medir espectros de energía y
se presentan algunos aspectos de su adquisición en el laboratorio utilizando un espectrómetro
de línea particular. Por último, se presenta la descripción de un espectrómetro de imagen.
2.1. Principios
La espectroscopía es un área de estudio importante cuyas técnicas han sido aplicadas con
éxito en áreas diversas como astronomía, biología, química y, en los últimos años, la percepción
remota. Formalmente, la espectroscopía consiste en el estudio de la materia y su interacción
con la energía radiante o radiación [15]. Las primeras aplicaciones de este campo de estudio
están relacionadas con la identi�cación de sustancias a partir del espectro de energía emitido
o absorbido. En la actualidad, las aplicaciones de la espectroscopía incluyen la medición de la
composición química, así como las propiedades físicas de diversos materiales.
16
2.1. PRINCIPIOS
2.1.1. La radiación electromagnética
Nuestros ojos son capaces de detectar una pequeña parte de la energía radiante existente
en la naturaleza y que hemos denominado luz visible; sin embargo, ésta corresponde a una
pequeña porción de la radiación electromagnética que es posible detectar con otros dispositivos.
La radiación electromagnética se ha clasi�cado en base a su energía o frecuencia, en lo que se
conoce como espectro electromagnético. Una clasi�cación del espectro en orden creciente de
energía es la siguiente: ondas de radio, microondas, infrarrojo, luz visible, ultravioleta, rayos X
y rayos gamma; mientras que las ondas de radio y las microondas poseen la menor cantidad de
energía, los rayos gamma son el tipo de radiación con la mayor energía. Además, una propiedad
importante que comparten todas las formas de radiación electromagnética es su velocidad de
propagación en el espacio libre; a esta velocidad se le conoce como velocidad de la luz c y su
valor es 299, 793 km/s [15]. Otra característica importante de la radiación electromagnética es
que su comportamiento puede ser descrito tanto como el de una onda como de un conjunto
de partículas.
Desde el punto de vista clásico de las ecuaciones de Maxwell, la radiación electromag-
nética es considerada como una onda sinusoidal compuesta por un campo eléctrico E y un
campo magnético B vibrando en planos perpendiculares uno respecto del otro. Estos campos
están en fase y sus magnitudes se representan como E y B, respectivamente. Además, cada
onda electromagnética está caracterizada por su longitud de onda λ (distancia entre picos)
y su frecuencia ν (número de ciclos por segundo), las cuales se relacionan con la velocidad
de la luz mediante λν = c. Es importante observar que, conforme aumenta la longitud de
onda, disminuye la frecuencia o energía. En la �gura 2.1 se presentan las distintas bandas que
conforman el espectro electromagnético.
2.1.2. Interacción materia-energía
La radiación electromagnética que interactúa con la materia puede sufrir diversos cam-
bios que dependen de la constitución física y química de los materiales que han sido expuestos
a esta radiación [14]. Al considerar una onda electromagnética que viaja en el espacio libre
y se encuentra en la frontera con algún medio material, parte de ella será re�ejada en la
J. C. Valdiviezo INAOE 17
2.1. PRINCIPIOS
-1510
-1110 10 10 10 10-8 -6 -3 -1 510
19 16 11 910 10 10 10 31010
22
RayosGamma
RayosX
UV IR Microondas
Radio
400 700
1310
l(m)
n(Hz)
l(nm)
Figura 2.1: Espectro electromagnético en orden creciente de longitud de onda.
frontera y la otra parte será transmitida al medio material dependiendo de su constitución.
Los fenómenos conocidos como re�exión, transmisión, absorción y emisión se describen en las
siguientes líneas.
La re�exión ocurre en la frontera que divide a los dos medios materiales y su dirección
dependerá tanto del ángulo de incidencia de la onda, así como de la rugosidad de la super�cie.
Si la super�cie es suave comparada con la longitud de onda incidente, la re�exión será de
manera especular; en caso contrario, si la super�cie es rugosa, la energía será dispersada en
diversas direcciones.
El fenómeno de transmisión de la onda electromagnética al medio causa un cambio en
su dirección de propagación, el cual se debe a una disminución de su velocidad al entrar a un
medio más denso. La ecuación que relaciona los ángulos de incidencia θ1 y refracción θ2 con
los índices de refracción de dos medios materiales n1 y n2, respectivamente, está dada por la
ley de Snell-Descartes,
n1 sin θ1 = n2 sin θ2. (2.1)
Por otra parte, la radiación transmitida puede ser absorbida por las moléculas del
material en ciertas longitudes de onda; a este fenómeno se le conoce como absorción y depende
de la constitución química del material. Finalmente, la energía que es absorbida por el material
se transforma en energía calórica que aumenta su temperatura; a su vez, esta energía puede
J. C. Valdiviezo INAOE 18
2.1. PRINCIPIOS
ser emitida en forma de radiación. A dicho fenómeno se le conoce como emisión, en donde la
longitud de onda emitida dependerá de la temperatura del material.
2.1.3. Espectros de emisión y absorción
Los primeros espectros de luz que fueron registrados datan del siglo XVII con los
experimentos de Isaac Newton, en los que descubre que la luz se dispersa en distintos colores
al pasar a través de un prisma. Más tarde se descubrió que un arreglo de alambres paralelos
e igualmente espaciados también eran capaces de dispersar luz. Estos descubrimientos cons-
tituyen los fundamentos de la espectroscopía y han permitido el desarrollo de instrumentos
para producir espectros de aborción y emisión a partir de algún material.
Durante el siglo XIX, diversos experimentos no pudieron ser explicados desde el punto
de vista clásico en el que la materia interactúa con la energía en forma continua. Así, los
trabajos de diversos cientí�cos como Planck y Bohr sugirieron que en muchas procesos de
interacción, la energía electromagnética podía ser tratada como un conjunto de partículas o
cuantos, cuya energía E está dada por:
E = hν, (2.2)
donde h = 6,626 × 10−34 J·s es la constante de Planck y ν es equivalente a la frecuencia de
la onda [15]. Basado en estos postulados, Niels Bohr propuso uno de los primeros modelos
atómicos que dieron una clara explicación al fenómeno de absorción y emisión de energía. En
este modelo atómico los electrones se consideran partículas pequeñas con carga negativa que se
mueven alrededor del núcleo del átomo, cargado positivamente. La interacción entre el núcleo
y los electrones mantienen al electrón en órbita. Este movimiento está restringido a intervalos
bien de�nidos a partir del núcleo y que se pueden pensar como niveles de energía permitidos.
Para explicar los espectros de emisión, Bohr descubrió que los átomos obedecen tres reglas
básicas.
1. Los electrones sólo tienen ciertos niveles de energía que corresponden a distancias desde
el núcleo. En estos niveles de energía, el electrón no perderá o absorberá energía.
J. C. Valdiviezo INAOE 19
2.1. PRINCIPIOS
2. Las órbitas más cercanas al núcleo tienen energía más baja.
3. Los átomos tienden a estar en el estado de energía más bajo posible, llamado estado
base.
En efecto, para que un electrón cambie a un nivel de energía más alto se necesita aplicar una
determinada cantidad de energía. Si la cantidad de energía recibida es su�ciente, el electrón
cambiará a un nuevo estado como resultado de una absorción. Una vez que el electrón está
en una órbita más alta, éste posee energía potencial. Después de un tiempo corto el electrón
regresa a un nivel de energía más bajo, emitiendo radiación. La cantidad de radiación emitida
es una función del fotón de energía absorbido.
En la actualidad se ha comprobado que cuando una molécula interacciona con la ra-
diación, un cuanto de energía o fotón se emite o absorbe. Así, el cambio de energía para
una molécula entre los niveles E1 y E2, donde E1 ≥ E2, puede ocurrir suministrando la en-
ergía apropiada ∆E = E1 − E2 . La frecuencia de emisión o absorción de radiación para una
transición entre estos estados de energía está dada por,
ν =E1 − E2
h. (2.3)
Lo anterior explica que para una molécula que se encuentra en el estado E2 y recibe radiación
electromagnética con frecuencia ν, la energía será absorbida y la molécula pasará al estado E1
[2]. Las absorciones de energía ocurren cuando la frecuencia de la energía incidente es igual a
la frecuencia de resonancia del átomo o molécula.
Los procesos de emisión y absorción selectiva de energía son utilizados para determinar
la composición química de las moléculas e identi�car a los materiales. Al realizar un muestreo
de las líneas de energía emitidas por un material en función de la longitud de onda incidente
se tiene un espectro de emisión. Por otra parte, si el muestreo se realiza tomando en cuenta
las líneas de absorción en función de la longitud de onda incidente, el espectro se conoce como
espectro de absorción [2, 3].
J. C. Valdiviezo INAOE 20
2.1. PRINCIPIOS
2.1.4. Re�ectancia, absortancia y transmitancia
Las cantidades radiométricas de re�ectancia, absortancia y transmitancia se utilizan
con frecuencia en espectroscopía y en sensado remoto para representar la cantidad de �ujo
radiante incidente que entra o sale de alguna super�cie. La ecuación que establece una relación
para la cantidad total de �ujo radiante incidente sobre una super�cie, Φi(λ), en una longitud
de onda λ, debe considerar la cantidad de �ujo re�ejado por la super�cie Φr(λ), la cantidad
de �ujo absorbido Φα(λ) y la cantidad de �ujo transmitido a través de la super�cie Φτ(λ) (por
ejemplo en unidades de W/cm2), ésto es,
Φi(λ) = Φr(λ) + Φα(λ) + Φτ(λ). (2.4)
Estas cantidades radiométricas están basadas en la cantidad de energía radiante incidente a
una super�cie en cualquier ángulo. Por tanto, se de�nen la re�ectancia r(λ), la transmitancia
τ(λ) y la absortancia α(λ), como la razón entre el �ujo radiante re�ejado, transmitido o
absorbido, respectivamente por una super�cie, y el �ujo incidente a ésta, las cuales están
de�nidas por las relaciones
r(λ) =Φr(λ)
Φi(λ)
, τ(λ) =Φτ(λ)
Φi(λ)
, α(λ) =Φα(λ)
Φi(λ)
. (2.5)
En efecto, tomando en cuenta las cantidades radiométricas antes de�nidas, se puede
escribir la ec. (2.4) como:
i(λ) = r(λ) + α(λ) + τ(λ) = 1. (2.6)
Esta ecuación implica que la energía radiante incidente debe conservarse ya sea que se re�eje,
se trasmita a través del material, se disperse y sea absorbida para luego ser transformada en
alguna otra forma de energía.
2.1.5. Características espectrales de la vegetación
La vegetación constituye uno de los objetivos de estudio de esta investigación ya que nos
permite analizar los factores que controlan la re�ectancia en las hojas como, por ejemplo, la
pigmentación y la humedad, así como estudiar las diferencias en la forma del espectro adquirido
J. C. Valdiviezo INAOE 21
2.1. PRINCIPIOS
debido a cambios en las condiciones físicas, como la temperatura o vitalidad de la muestra.
La vegetación absorbe gran cantidad de la energía radiante incidente que corresponde a la
porción visible debido a la fotosíntesis. Además, aproximadamente la mitad del �ujo radiante
incidente que corresponde al infrarrojo cercano es re�ejado por ella [10].
La fotosíntesis es un proceso de almacenamiento de energía que tiene lugar en las hojas
y en otras partes verdes de las plantas en presencia de luz. Este proceso se inicia cuando la
luz del sol llega a los cloroplastos, que son pequeños cuerpos en la hoja que contienen una
sustancia verde llamada cloro�la. La energía luminosa se almacena en una molécula simple de
azúcar (glucosa) que se produce por el bióxido de carbono (CO2) y el agua (H20) absorbida
por la planta. Cuando el dióxido de carbono y el agua se combinan, lo que forma una molécula
de azúcar (C6H12O6) en un cloroplasto, se libera gas de oxígeno (O2).
La energía electromagnética proveniente del sol interactúa con los pigmentos, el agua
y los espacios intercelulares dentro de la hoja de la planta. La cantidad de �ujo radiante
re�ejado por la hoja (Φr), el �ujo absorbido (Φα), y la cantidad de �ujo radiante transmitido
a través de la hoja (Φτ ) pueden ser medidos cuidadosamente. En base a la ec. (2.4), la energía
re�ejada por la super�cie de la hoja es igual a la energía incidente menos la energía absorbida
y la transmitida por la hoja. Tomando en cuenta la ec. (2.6), la relación entre la re�ectancia
espectral de la hoja con la absortancia y transmitancia dentro de la hoja puede escribirse de
la siguiente manera:
r(λ) = i(λ)− α(λ)− τ(λ), (2.7)
donde la energía re�ejada por la super�cie de la hoja es igual a la energía incidente menos
la energía absorbida directamente por la planta para realizar la fotosíntesis y la cantidad de
energía transmitida a través de la hoja.
Los factores dominantes que controlan la re�ectancia de las hojas en la porción visible
del espectro son los pigmentos conocidos como cloro�la a, b y β-caroteno. De esta manera,
cuando un fotón de luz llega a una molécula, ésta re�eja algo de la energía o puede absorberla y
así entrar dentro de un estado excitado. Cada molécula absorbe o re�eja sus propias longitudes
de onda características. En una planta verde común, las moléculas han evolucionado para
absorber longitudes de onda en la porción visible (350 a 700 nm) y son denominadas pigmentos.
J. C. Valdiviezo INAOE 22
2.2. ESPECTRÓMETROS
El espectro de absorción para un pigmento particular describe las longitudes de onda a las
cuales éste puede absorber luz y entrar a un estado excitado. Los pigmentos de cloro�la son
los más importantes en la planta pues absorben en las longitudes de onda de 430 y 660 nm
(cloro�la a), y en 450 y 650 nm (cloro�la b); estos espectros de absorción se pueden ver en la
�gura 2.2. En efecto, la absorción más baja de las longitudes de onda verdes, comparada con
aquellas que corresponden al rojo y azul, hacen que las plantas en estado saludable las veamos
verdes.
Longitud de onda (nm)
clorofila a
clorofila b
Ab
so
rta
ncia
Figura 2.2: Espectro de absorción de la cloro�la a y b.
2.2. Espectrómetros
El instrumento utilizado para medir la energía re�ejada o emitida por un material en
función de la longitud de onda se denomina espectrómetro. El elemento encargado de dispersar
la energía electromagnética de entrada se conoce como monocromador, mismo que puede ser un
prisma o una rejilla de difracción [1]. Los elementos ópticos que conforman un espectrómetro se
ilustran en la �gura 2.3. Básicamente, el funcionamiento de estos instrumentos es el siguiente:
una fuente de luz ilumina a una rendija de entrada y, por medio de una lente o espejo, el frente
de onda es colimado. Entonces la radiación se dispersa al pasar a través del monocromador y
J. C. Valdiviezo INAOE 23
2.2. ESPECTRÓMETROS
con ello la dirección de propagación de los rayos depende de la longitud de onda. Finalmente, la
radiación se enfoca nuevamente y el espectro consiste en una serie de imágenes monocromáticas
de la rendija de entrada. A la salida del instrumento es posible utilizar algún sistema de
detección para registrar el espectro.
fuente deiluminación rendija colimador
elementodispersor
elementode enfoque espectro
Figura 2.3: Componentes ópticos de un espectrómetro.
Los espectrómetros pueden registrar espectros de absorción o emisión dependiendo de
la posición en la que se coloque la muestra. Para los espectrómetros de emisión, la radiación de
interés es aquella que sale de la muestra ya que los fotones interactúan con sus componentes
y entonces son reemitidos a diferentes longitudes de onda, como es el caso de la �uorescen-
cia o fosforescencia. De esta manera, para poder determinar la longitud de onda emitida es
necesario posicionar el monocromador después de la muestra. En el caso de los espectrómetros
de absorción, la muestra se coloca después del monocromador y con ello se determinan las
longitudes de onda que fueron absorbidas por sus componentes.
Con el paso del tiempo, los sistemas de detección utilizados para registrar la radiación
de salida de un espectrómetro han ido cambiando. En sus inicios, los espectrómetros requerían
del uso de placas fotográ�cas para registrar el espectro de algún material. En la actualidad,
el desarrollo de nuevos detectores ha permitido reemplazar estas placas por detectores de �u-
jo radiante, como los fotomultiplicadores, o por arreglos de dispositivos acoplados por carga
(coupled-charge devices, CCD). A los instrumentos que utilizan un arreglo lineal de fotodetec-
tores para realizar el registro del espectro de salida se les denomina espectrómetros de línea.
J. C. Valdiviezo INAOE 24
2.2. ESPECTRÓMETROS
a
B
i1i1' i2
i2'
d
W
n P1
Figura 2.4: Estructura de un espectrómetro de prisma elemental, W denota el ancho del haz
de iluminación y P1 de�ne el primer plano principal.
2.2.1. Resolución del monocromador
El monocromador de un espectrómetro tiene la función de separar las distintas longi-
tudes de onda que conforman a la radiación de entrada. De esta manera es posible utilizar un
prisma o una rejilla dependiendo del poder de resolución que se requiere para el instrumento.
En el caso de un prisma dispersor, la luz colimada entrante1 se dispersa a diferentes ángulos
debido a la dependencia de la longitud de onda con el índice de refracción. Además, la distor-
sión de la imagen de la rendija de entrada se evita mediante el uso de iluminación de ondas
planas. Sin embargo, aún con este tipo de iluminación, la imagen de la rendija es curva ya que
no todos los rayos pueden atravesar el prisma en su primer plano principal.
Dado un prisma ajustado a la posición de desviación mínima, como el que se muestra
en la �gura 2.4, debe cumplirse que:
i1 = i′
2 = α/2 e i′
1 = i2 = (δm + α)/2, (2.8)
donde i1 e i′2 son los ángulos de entrada y salida, i
′1 e i2 son los ángulos internos de refracción,
α es el ángulo del prisma y δm es el denominado ángulo de desviación mínima. Para ángulos
pequeños, i.e., si θ ≤ 50, la expresión para el ángulo de desviación mínima es la siguiente:
δm = α(n− 1). (2.9)
1se entiende por luz colimada a aquella en la que los rayos son mutuamente paralelos y se propagan con un
mismo ancho W a lo largo de cualquier trayectoria.
J. C. Valdiviezo INAOE 25
2.2. ESPECTRÓMETROS
d
s
Figura 2.5: Per�l de una rejilla líneal de difracción con N líneas; d es el periodo de la rejilla y
s es la separación entre líneas.
donde n es el índice de refracción del vidrio. Por otra parte, la dispersión angular resultante
se de�ne como dδm/dλ = (B/W )(dn/dλ), siendo B la longitud de la base del prisma, W el
ancho del haz de iluminación y n el índice de refracción. De acuerdo al criterio de Rayleigh se
de�ne el poder de resolución de un instrumento, Pr, como la longitud de onda más pequeña
que se puede resolver, dividida entre la longitud promedio en esa región espectral, ésto es,
Pr =λ
∆λ=
λ
dδm
dδmdλ
=λ
dδm
B
W
dn
dλ. (2.10)
El límite de resolución depende de la difracción debido al ancho del haz �nito o a la
apertura efectiva del prisma, la cual es rectangular, por lo que
Pr =λ
∆λ=
λ
λ/W· BW
dn
dλ= B · dn
dλ. (2.11)
La ecuación anterior indica que, dado algún tipo de vidrio, el poder de resolución de un
prisma depende sólamente del máximo grosor del vidrio atravesado por los rayos y del índice
de refracción, siendo independiente del ángulo del prisma [12].
En el caso de considerar una rejilla de difracción con N líneas, como la que se muestra
en la �gura 2.5, se obtiene que la separación entre un máximo primario de orden m y un
mínimo vecino está dada por ∆p = λ/Nd. Si la longitud de onda se cambia por una cantidad
∆λ, el máximo de orden m está desplazado por una cantidad
∆′p =
|m|d
∆λ. (2.12)
Suponiendo que las líneas de longitud de onda λ ± 12∆λ estarán resueltas cuando el máximo
de una longitud coincida con el primer mínimo de la otra, se tiene en el límite de resolución
en el orden m que ∆p = ∆′p, y según [4],
λ
∆λ=
∆pNd|m|∆′p d
= |m|N. (2.13)
J. C. Valdiviezo INAOE 26
2.2. ESPECTRÓMETROS
Así, el poder de resolución para una rejilla es igual al producto del orden m y el número de
líneas N en la rejilla.
2.2.2. Espectrómetro de línea BRC111A
Con el objetivo de realizar el registro espectral de diversos materiales en el laboratorio
se ha utilizado un espectrómetro de línea de la serie BRC111A, fabricado por la compañía
BWTek. Las partes que conforman el instrumento son: un espectrómetro, una fuente de ilumi-
nación de halógeno-tungsteno y una punta de prueba de �bra óptica. Además, el instrumento
cuenta con un programa para controlar y visualizar los espectros registrados; el puerto de
comunicación para esta interfaz es el canal universal serial (universal serial bus, USB).
Los componentes ópticos del espectrómetro conforman un arreglo de tipo Czerny-
Turnerhaz de haz cruzado. El sistema de detección de este dispositivo lo constituyen 2048
elementos CCD que cubren la región espectral desde 350 a 1050 nm a una resolución alrede-
dor de 0.42 nm. Algunas especi�caciones técnicas se presentan en la Tabla 2.1. Respecto a la
fuente de iluminación de halógeno-tungsteno, la radiación que emite se encuentra en la porción
visible a infrarrojo cercano (visible - near infrared, VIS-NIR), con una potencia de salida de 5
W; la �gura 2.6 despliega el espectro de emisión de la fuente. El voltaje de alimentación para
esta fuente es de 6 V de corriente directa.
Tabla 2.1: Parámetros del espectrómetro de línea BRC111A
Parámetro Especi�cación
Intervalo espectral 350 a 1050 nm
Tamaño del CCD 14× 200µm
F# del espectrógrafo 3.0
Rejilla 700 líneas/mm
Dimensiones 97× 65× 32 mm
Tiempo de integración 9-65535 ms
Interfaz puerto USB 2.0
J. C. Valdiviezo INAOE 27
2.2. ESPECTRÓMETROS
Figura 2.6: Espectro de emisión de la fuente de iluminación.
Respecto a la punta de prueba de �bra óptica, su estructura bifurcada permite conectar
uno de los extremos a la fuente de iluminación, mientras el otro se conecta al espectrómetro.
Además, en su interior, la punta está conformada por siete �bras, seis de las cuales tienen
un diámetro de 200 µm y que se utilizan para iluminar la muestra; la otra �bra, localizada
en el centro y con diámetro ligeramente más grande, registra el espectro. De esta manera, la
punta de prueba ilumina al objeto de estudio y simultáneamente registra el espectro de la luz
re�ejada. La �gura 2.7 presenta el diagrama de conexiones de los componentes que conforman
el espectrómetro.
Fuente de
iluminación
Punta de
pruebaObjeto
Espectrómetro Computadora
Figura 2.7: Diagrama de conexión de los componentes del espectrómetro de línea BRC111A.
J. C. Valdiviezo INAOE 28
2.2. ESPECTRÓMETROS
2.2.3. Calibración del instrumento
Un primer experimento que se realizó fue el de veri�car la calibración por longitud de
onda del espectrómetro. Para ello se determinó la respuesta de transmisión para un conjunto
de 7 �ltros interferométricos pasabandas fabricados por Melles Griot.2 El arreglo utilizado se
muestra en la �gura 2.8. El procedimiento realizado para esta calibración es el siguiente. La
radiación proveniente de la fuente de tungsteno se hace incidir en forma normal a una de las
caras del �ltro; la energía que se transmite a través del �ltro es registrada por medio de la
punta de prueba, en la que uno de sus extremos se conecta al espectrómetro. El software de
adquisición permite ver la grá�ca del espectro adquirido, así como la longitud de onda central
(λ0) transmitida para cada uno de los �ltros. Estas longitudes de onda fueron comparadas
con aquellas longitudes de onda centrales de transmisión reportadas por el fabricante en las
hojas de datos [11]. Las �guras 2.9 y 2.10 presentan los espectros de transmisión para los
�ltros centrados en (a) λ0 = 450 nm (azul) y (b) λ0 = 650 nm (naranja), respectivamente. Los
resultados en la determinación de las longitudes de onda central se resumen en la Tabla 2.2.
Figura 2.8: Arreglo utilizado para veri�car la calibración por longitud de onda.
2Los �ltros pasabandas utilizados son de forma circular con un diámetro de 4.5 cm, cuentan con un ancho
de banda aproximado de 10 nm al 50% de transmisión, cubriendo el rango espectral visible.
J. C. Valdiviezo INAOE 29
2.2. ESPECTRÓMETROS
Tabla 2.2: Comparación de las longitudes de onda especi�cadas por el fabricante y las determinadas por
medio del espectrómetro BRC111A para un conjunto de �ltros interferométricos fabricados por Melles Griot.
Filtro λ0 especi�cada λ0 determinada Error |Error relativo|
002-400 401.66 401.70 ± 0.04 9.9 ×10−5
004-450 452.12 451.80 ± 0.32 70.8 ×10−5
006-500 502.22 502.20 ± 0.02 3.9 ×10−5
008-550 552.38 552.60 ± 0.22 39.8 ×10−5
018-600 602.12 602.90 ± 0.78 29.5 ×10−5
022-650 652.06 653.10 ± 1.04 1.6 ×10−3
024-700 702.97 704.80 ± 1.80 2.6 ×10−3
Tabla 2.3: Comparación de las frecuencias de corte especi�cadas por el fabricante y aquellas determinadas
por medio del espectrómetro BRC111A para un conjunto de �ltros pasa altas de Newport.
Filtro D0 esp. (nm) D0 det. (nm) Error |Error relativo|
OG515 515 515.6 ± 0.6 11.6 ×10−4
OG550 550 550.4 ± 0.4 7.2 ×10−4
RG610 610 611.2 ± 1.2 19.6 ×10−4
RG715 715 714.9 ± 0.1 1.4 ×10−4
RG780 780 781.2 ± 1.2 15.4 ×10−4
RG830 830 831.1 ± 1.1 13.2 ×10−4
RG850 850 848.6 ± 1.4 16.5 ×10−4
J. C. Valdiviezo INAOE 30
2.3. REGISTRO ESPECTRAL DE MATERIALES
Figura 2.9: Espectro de energía transmitida para el �ltro pasa-bandas con λ0 = 450 nm.
Además de caracterizar la respuesta del conjunto de �ltros interferométricos se deter-
minó el espectro de radiación transmitida y las frecuencias de corte para 7 �ltros pasa-altas
fabricados por Newport y que abarcan diferentes porciones del espectro electromagnético [13].3
Las �guras 2.11 y 2.12 presentan los espectros de transmisión para los �ltros con frecuencias
de corte en 515 nm y 715 nm, respectivamente. De acuerdo a las Tablas 2.2 y 2.3, para todos
los casos las frecuencias determinadas con el espectrómetro prácticamente coinciden con las
especi�cadas en las respectivas hojas de datos.
2.3. Registro espectral de materiales
Una vez veri�cada la calibración del instrumento se realizó, a manera de ejemplo, el
registro de espectros de ciertos tipos de vegetación. Para ello, con el objetivo de determinar la
3Los �ltros pasa-altas utilizados para este experimento son de forma cuadrada con una longitud de 5 cm
por lado.
J. C. Valdiviezo INAOE 31
2.3. REGISTRO ESPECTRAL DE MATERIALES
Figura 2.10: Espectro de energía transmitida para el �ltro pasa-bandas con λ0 = 650 nm.
distancia óptima a la cual se debía colocar la punta de prueba sobre el material bajo estudio,
se realizó un primer experimento utilizando una base movible. La punta de prueba se fue
desplazando gradualmente, usando un micrómetro, en distancias entre 0 y 15 mm por encima
de la muestra. De acuerdo a los resultados obtenidos, el rango de tolerancia en el que el
espectro conserva su forma está entre 0 y 1 mm.
El proceso de adquisición de espectros se inicia primeramente con el registro de un
espectro oscuro; enseguida se realiza el registro espectral de un material de referencia y, por
último, el espectro del material bajo estudio. El espectro oscuro se puede registrar colocando
la punta de prueba sobre una super�cie oscura o apagando la fuente de iluminación y tiene
la función de corregir los espectros adquiridos pues elimina el efecto de la luz presente en
el ambiente. Por su parte, el espectro de referencia se puede obtener a partir de un blanco
estándar (spectralón), que se caracteriza por tener alta re�ectancia en una amplia porción
del espectro electromagnético; este espectro se utiliza para convertir los datos de intensidad
relativa a valores de re�ectancia espectral. Además, ambos espectros se utilizan para realizar
J. C. Valdiviezo INAOE 32
2.3. REGISTRO ESPECTRAL DE MATERIALES
Figura 2.11: Espectro de energía transmitida para el �ltro pasa-altas con frecuencia de corte en 515 nm.
mediciones de color de las muestras. El último paso consiste en registrar el espectro de energía
re�ejada del material. En efecto, el software de adquisición del instrumento permite registrar
y visualizar los espectros en tiempo real.
2.3.1. Espectros de vegetación
Los tipos de vegetación utilizados en los experimentos que se presentan a continuación
pertenecen a hojas verdes o amarillas de las especies: alcanfor, pasto, pino y bugambilia,4
además de cáscaras de jitomate y mandarina. La �gura 2.13 presenta el arreglo que se ha
utilizado para la adquisición de espectros de luz re�ejada para los distintos tipos de vegetación;
en la �gura 2.14 se presenta el espectro registrado para una hoja de alcanfor en estados de
vitalidad verde y amarillo, mientras que en la �gura 2.15 se muestra el espectro colectado
para una hoja del árbol de pino y que fue registrado a lo largo de tres días para observar los
cambios en la forma del espectro debidos a pérdidas en su vitalidad.
4Las muestras fueron recolectadas el 11 de noviembre de 2009 en las instalaciones del INAOE.
J. C. Valdiviezo INAOE 33
2.3. REGISTRO ESPECTRAL DE MATERIALES
Las grá�cas anteriores caracterizan la respuesta espectral típica de una planta verde
saludable, en donde las bandas de absorción fuertes se presentan en las regiones azul (λ = 450
nm) y roja (λ = 650 nm), con un pico de energía re�ejada en la región verde del espectro visible
(0.08 en 550 nm). Aproximadamente el 0.8 de la energía incidente en la porción infrarroja
cercana es re�ejada por la hoja en λ = 720 nm. Por otra parte, conforme disminuye la in�uencia
de la cloro�la en el espectro obtenido para las hojas amarillas, cantidades más grandes de luz
verde y roja son re�ejadas por la hoja, lo que resulta en una apariencia amarilla.
En las �guras 2.16 y 2.17 se presentan los espectros de energía re�ejada para una hoja
de pasto verde y una de pasto seca. Al igual que en el caso anterior, el máximo de energía
re�ejada en la porción visible se localiza en λ = 550 nm. Cuando la hoja de pasto pierde su
vitalidad, la forma de la curva espectral se modi�ca completamente, presentando un máximo
para la región visible localizado en λ = 650 nm.
En las �guras 2.18 y 2.19 se presentan los espectros de energía re�ejados que corre-
sponden a una hoja rojiza del árbol de la familia del pino y a uno de los pétalos de la planta
conocida como bugambilia roja, respectivamente. En el primer caso el espectro está caracter-
izado por absorciones máximas en las longitudes de onda de 550 nm y 600 nm del espectro
visible. El máximo de re�exión se localiza alrededor de 700 nm, lo cual explica el color rojizo
presente en la hoja. El segundo espectro presenta una forma parecida al caso anterior, con la
diferencia de que el espectro es plano en las longitudes de onda verde y azul; el máximo de
re�exión se presenta alrededor de 710 nm, lo que origina la coloración guinda en el pétalo de
la planta.
Por otra parte, en las �guras 2.20 y 2.21 se presentan las curvas espectrales de la energía
re�ejada por la cáscara de un jitomate, así como el exterior de una mandarina, respectivamente.
En el primer caso, el espectro registrado presenta un intervalo máximo de energía re�ejada
aproximadamente entre 630 y 720 nm, el cual es relativamente plano; en el espectro de la
derecha se puede observar que, aunque la forma de la grá�ca es similar al obtenido para la
hoja rojiza de la �gura anterior, una de las diferencias radica en que el máximo de energía
re�ejada se presenta en 650 nm, lo cual explica la coloración naranja que se aprecia en la
cáscara de mandarina.
J. C. Valdiviezo INAOE 34
2.3. REGISTRO ESPECTRAL DE MATERIALES
2.3.2. Mezclas espectrales
De acuerdo a lo discutido en el Capítulo 1, muchos de los pixeles espectrales que son
registrados por un sensor remoto contienen la mezcla de espectros de diversos materiales. Para
simular la forma en que se presentan dichas mezclas se realizaron los siguientes experimentos.
En primer lugar, la punta de prueba se colocó en la distancia focal de una lente convergente
con f=5 cm para extender el campo de visión de la punta de prueba, lo que permitiría colocar
diversos materiales dentro del campo de visión. Sin embargo, debido a que la distancia de
detección de la punta está limitada a 1 cm, con este arreglo no se obtuvieron resultados
adecuados. En el siguiente experimento se emplearon materiales pequeños (alrededor de 2 mm
por lado) mezclados de manera homogénea para que la punta de prueba pudiera registrar el
espectro combinado de dichos meteriales. De esta manera, en un primer caso se utilizaron
fragmentos de una hoja verde y una seca, los cuales se colocaron, en la misma proporción,
en un porta objetos para colectar el espectro correspondiente. El espectro adquirido mediante
este procedimiento se presenta en la �gura 2.22.
En un segundo caso se utilizaron fragmentos pequeños de otro tipo de vegetación
en estados amarillo y verde, los cuales se han denotado respectivamente como espectro A y
espectro B. Las dos muestras de vegetación se mezclaron y la punta de prueba se colocó sobre
las muestras para registrar el espectro correspondiente. La �gura 2.23 presenta los espectros de
la vegetación A y B, además del espectro mezclado adquirido con el procedimiento descrito. Por
último, para comprobar que el espectro mezclado se puede representar como una combinación
lineal de los espectros A y B se determinó una función f(λ) con dos coe�cientes particulares
para aproximar la forma del espectro mezclado. La función que mejor aproxima esta curva está
representada por f(λ) =0.8A+0.2B. En la �gura se muestra, en línea punteada, la función
que aproxima esta mezcla espectral. De acuerdo a estos resultados, una combinación lineal
de los espectros de los materiales permite realizar una primera aproximación a las mezclas
espectrales.
J. C. Valdiviezo INAOE 35
2.3. REGISTRO ESPECTRAL DE MATERIALES
Figura 2.12: Espectro de energía transmitida para el �ltro pasa-altas con frecuencia de corte en 715 nm.
Figura 2.13: Arreglo utilizado para el registro de espectros de vegetación.
J. C. Valdiviezo INAOE 36
2.3. REGISTRO ESPECTRAL DE MATERIALES
Figura 2.14: Espectros de energía re�ejada para una hoja de alcanfor en estados amarillo y seco.
Figura 2.15: Espectros de energía re�ejada registrada durante tres días para una hoja de pino.
J. C. Valdiviezo INAOE 37
2.3. REGISTRO ESPECTRAL DE MATERIALES
Figura 2.16: Espectro de energía re�ejada para una hoja de pasto verde.
Figura 2.17: Espectro de energía re�ejada para una hoja de pasto seco.
J. C. Valdiviezo INAOE 38
2.3. REGISTRO ESPECTRAL DE MATERIALES
Figura 2.18: Espectro de energía re�ejada para una hoja de árbol rojiza de la familia del pino.
Figura 2.19: Espectro de energía re�ejada para una hoja de bugambilia.
J. C. Valdiviezo INAOE 39
2.3. REGISTRO ESPECTRAL DE MATERIALES
Figura 2.20: Espectro de energía re�ejada registrado a partir de la cáscara de un jitomate rojo.
Figura 2.21: Espectro de energía re�ejada para la cáscara de una mandarina.
J. C. Valdiviezo INAOE 40
2.3. REGISTRO ESPECTRAL DE MATERIALES
Figura 2.22: Espectro mezclado obtenido a partir de una hoja verde y una amarilla.
Figura 2.23: Espectro mezclado obtenido a partir de una hoja verde y otra amarilla. En esta grá�ca f(λ) es
una función cuyos coe�cientes aproximan la forma del espectro mezclado.
J. C. Valdiviezo INAOE 41
2.4. ESPECTRÓMETROS DE IMAGEN
2.4. Espectrómetros de imagen
El avance conjunto de la tecnología para formar imágenes y la espectroscopía ha per-
mitido el surgimiento de sistemas de adquisición espectral; estos instrumentos, denominados
espectrómetros de imagen, son capaces de formar la imagen de las características espectrales
de un objeto bajo estudio, en múltiples bandas que cubren una amplia región del espectro
electromagnético. Los espectrómetros de imagen han hecho posible la adquisición de datos en
cientos de bandas simultáneamente. Además, debido a la alta precisión de los datos adquiridos,
diversos problemas en áreas como sensado remoto, biología, medicina, entre otros, pueden ser
investigados con gran detalle.
Los espectrómetros de imagen surgieron en los años 80s como una herramienta en la
identi�cación de los recursos naturales de la super�cie de la tierra, en aplicaciones de sensado
remoto. Los precursores de estos instrumentos son los sistemas multiespectrales que utilizan
un arreglo de �ltros de banda ancha para registrar imágenes de una escena geográ�ca en
distintas porciones del espectro electromagnético. Por ejemplo el escudriñador multiespectral
LANDSAT (LANDSAT multispectral scanner, MMS), es un sistema optomecánico que utiliza
conjuntos de �ltros y elementos detectores discretos para captar la energía re�ejada por la
super�cie terrestre en las porciones visible e infrarrojo cercano. A diferencia de estos sistemas,
los espectrómetros de imagen tienen la capacidad de proporcionar un espectro de re�ectancia
de alta resolución para cada pixel de la imagen. Lo anterior representa una gran ventaja ya
que el espectro de re�ectancia registrado puede ser usado para identi�car una gran cantidad
de materiales que cubren la super�cie terrestre.
En forma general, los elementos que conforman un espectrómetro de imagen son: un
sistema optomecánico que se encarga de captar el �ujo radiante re�ejado, uno o varios espec-
trómetros para separar las distintas longitudes de onda y un arreglo de detectores sensibles
a diferentes longitudes de onda, que forman el conjunto de imágenes. El sistema colector de
luz es importante ya que permite escudriñar el campo de visión instantáneo (instantaneous
�eld of view, IFOV) del espectrómetro sobre una escena. En efecto, existen diversas con�gura-
ciones para registrar la energía re�ejada. Por ejemplo, en aplicaciones de sensado remoto, el
movimiento de la plataforma aérea es utilizado como parte del sistema de barrido a lo largo
J. C. Valdiviezo INAOE 42
2.4. ESPECTRÓMETROS DE IMAGEN
de la escena. Además, otro tipo de espectrómetros de imagen utiliza un �ltro espacial lineal
variable colocado sobre un arreglo bidimensional de fotodetectores. Aunque el costo de estos
sistemas es más elevado que los anteriores, proporcionan imágenes bien calibradas ya que cada
elemento detector forma la imagen de la escena en una banda espectral determinada.
De acuerdo al número de bandas adquiridas, un espectrómetro de imagen se puede clasi-
�car en las categorías siguientes. Se habla de un sistema multiespectral cuando el instrumento
registra decenas de bandas espectralmente anchas (∼ 50 nm) y separadas; un instrumento se
dice hiperespectral cuando registra cientos de bandas cuasi continuas y espectralmente angostas
(∼ 10 nm). Por su parte, un sistema puede ser ultraespectral cuando es capaz de registrar miles
de bandas contiguas y espectralmente muy angostas (∼ 2 nm). Los sistemas anteriores están
caracterizados por la resolución espectral, que indica el número y el ancho de las bandas re-
gistradas y la resolución espacial, que es una medida del detalle mínimo que puede ser captado
por un instrumento.
Ejemplo: el espectrómetro de imagen MIVIS. Este sistema de espectrómetro de imagen
multiespectral visible e infrarrojo, por las siglas Multispectral Visible and Infrared Imaging
Spectrometer (MIVIS), ha sido desarrollado por SenSyTech Imaging Group para el Consejo
Nacional de Investigación de Italia. El instrumento consta de cuatro espectrómetros y utiliza
un sistema de barrido por línea. En la Tabla 2.4 se presentan el número de bandas y el rango
espectral de cada espectrómetro y en la �gura 2.24 se presenta el diagrama óptico de este
instrumento.
Tabla 2.4: Especi�caciones técnicas del espectrómetro MIVIS.
Espectrómetro Rango espectral (nm) Bandas
1 433− 833 20
2 1150− 1550 8
3 2000− 2500 64
4 8200− 12700 10
En este espectrómetro de imagen, un espejo rotatorio de 45◦ barre una línea de pix-
eles sobre la super�cie. Cada pixel generado es colimado por medio de un espejo parabólico
J. C. Valdiviezo INAOE 43
2.4. ESPECTRÓMETROS DE IMAGEN
apertura
espejos
espejo
rotatorioParaboloide
secundario
Paraboloide
primario
filtros dicróicosrejilla de difracción
lente
filtro
detectores
retardador
lente
filtro
rejilla de difracción
rejilla de difracción
lente
lente
arreglo de
detectores
filtro
Sistema
de barrido
Espectrómetro
Figura 2.24: Diagrama óptico del espectrómetro de imagen MIVIS.
montado en un telescopio Gregoriano. Entonces, el haz colimado es re�ejado, por medio de
un ensamble Pfund (�ltros dicróicos), hacia un banco que contiene cuatro espectrómetros.
Una apertura en el ensamble Pfund de�ne un IFOV común para cada pixel. El haz colimado
se divide hacia cuatro espectrómetros, ya sea por espejos metálicos o por �ltros dicróicos.
Los espejos metálicos re�ejan longitudes de onda largas y transmiten las cortas. Las capas
dieléctricas múltiples causan interferencia tal que la luz se re�eja en las longitudes de onda
cortas y se transmite para las largas. Después de dividir el haz en cuatro bandas (visible,
infrarrojo cercano, infrarrojo medio e infrarrojo térmico) cada banda se dispersa en su propio
espectrómetro. El intervalo de longitudes de onda que abarca cada espectrómetro está basada
en la sensibilidad de diferentes arreglos de fotodetectores usados en cada espectrómetro [12].
J. C. Valdiviezo INAOE 44
Bibliografía
[1] Ball D.W., The Basics of Spectroscopy, Tutorial Texts in Optical Engineering, SPIE Press, Vol.
TT49, pp. 33�40, 2001.
[2] Banwell C.N., Fundamentos de Espectroscopía Molecular, Ediciones del Castillo, S.A., Madrid,
España, pp. 4�11, 1997.
[3] Beer R., Remote sensing by fourier transform spectroscopy, John Wiley and Sons, pp. 44�46,
52�54, 130�133, 1992.
[4] Born M. and Wolf E., Principles of Optics, 7th edition, Cambridge University Press, pp. 446�453,
2003.
[5] BWTek Inc., BWSpec 3.24 User Manual, Doc# 290020018, 2007.
[6] BWTek Inc., BRC111A Spectrometer User Manual, 2007.
[7] Clark G. L., The Encyclopedia of Spectroscopy, Reinhold Publishing Corporation, pp. 1�7, 1960.
[8] Hecht E., Óptica, 3a edición, Addison Wesley, pp. 86�124, 2000.
[9] Huebshman M.L., Schultz R.A., Garner H.R., �Hyperspectral imaging.� In: Encyclopedia of Mod-
ern Optics, Robert D. Guenther editor, Vol. 1, pp. 134�143, Elsevier, Academic Press, 2005.
[10] Jensen J.R., Remote Sensing of the Environment: an Earth Resource Perspective, 2nd edition,
Pearson Prentice Hall, 2007.
[11] Melles Griot, Visible Band-Pass Filters Technical Data, 2004.
45
BIBLIOGRAFÍA
[12] More K.A., �Spectrometers.� In: Encyclopedia of Modern Optics, Robert D. Guenther editor, Vol.
1, pp. 324�336, Elsevier, Academic Press, 2005.
[13] Newport Inc., High-Pass Filters Technical Data Sheet, 2000.
[14] Smith R.B., Introduction to Remote Sensing, Tutorial by Microimages, Inc., Lincoln, NE, 2001.
[15] Stuart B., Infrared Spectroscopy: Fundamentals and Applications, John Wiley, pp. 6�12, 2004.
J. C. Valdiviezo INAOE 46
Capítulo 3
Fundamento Matemático
En este capítulo se introducen las operaciones del álgebra reticular minimax, así como las
memorias asociativas reticulares. Se continúa con una descripción de conceptos emanados de
la teoría de conjuntos convexos que serán de gran utilidad para comprender los capítulos sub-
secuentes. Una propiedad importante a destacar será la relación existente entre las memorias
autoasociativas reticulares y los conjuntos convexos ya que ello hace posible que se pueda
determinar un conjunto de puntos extremos a partir de una imagen cualquiera.
3.1. Álgebra reticular minimax
En los últimos años, las operaciones basadas en el álgebra de retículos han sido apli-
cadas en áreas diversas de la ingeniería industrial, ciencias de la computación y en el análisis y
procesamiento digital de imágenes [5, 6, 19]. En estas aplicaciones, las operaciones matriciales
de suma y multiplicación del álgebra lineal son reemplazadas por las operaciones correspondi-
entes del álgebra reticular, cuyas propiedades han permitido establecer nuevas e interesantes
técnicas.
El concepto de retículo fue creado para generalizar y uni�car ciertas relaciones entre
subconjuntos de un conjunto dado, entre subestructuras de una estructura algebraica tales
como grupos, y entre estructuras geométricas tales como subespacios de espacios topológicos.
El desarrollo de la teoría de retículos comenzó en 1930 con los trabajos de Garrett Birkho� [2];
47
3.1. ÁLGEBRA RETICULAR MINIMAX
en la actualidad, numerosas investigaciones han ampliado su tratamiento teórico y extendido
su aplicabilidad. Una propiedad de gran utilidad en la teoría de retículos, que se conoce como
dualidad, permite de�nir conceptos duales a partir de la inversión del orden dado en una
de�nición. Un ejemplo de dualidad son las relaciones numéricas �mayor que� y �menor que�.
En las siguientes líneas se de�nen algunos conceptos fundamentales del álgebra reticular.
Sea Y un conjunto parcialmente ordenado con orden parcial denotado en general por
≼. Una cota superior de un subconjunto X de Y , si existe, es un elemento y ∈ Y tal que
x ≼ y ∀x ∈ X. La cota superior mínima o supremo, sup(X), es una cota superior y0 ∈ Y
de X tal que y0 ≼ y para cada cota superior y de X. De esta manera, si sup(X) existe,
entonces es única. El concepto de cota mínima y cota inferior máxima o ín�mo, denotada
por ınf(X), se de�nen de manera dual. Basado en lo anterior, un retículo es un conjunto
parcialmente ordenado L cuyos elementos x, y tienen un ín�mo, denotado por x ∧ y, y un
supremo, denotada por x ∨ y. Un retículo L es completo cuando existen ınf(X) y sup(X)
para cada uno de sus subconjuntos X.
Las operaciones binarias de ∨ y ∧ sobre retículos tienen varias propiedades importantes,
algunas de ellas son análogas a aquellas de la multiplicación y adición ordinarias. Si (X,≼) es
un conjunto parcialmente ordenado, entonces las operaciones ∨ y ∧ satisfacen las siguientes
propiedades.
1. x ∧ x = x, x ∨ x = x (idempotencia)
2. x ∧ y = y ∧ x, x ∨ y = y ∨ x (conmutatividad)
3. x ∧ (y ∧ z) = (x ∧ y) ∧ z, x ∨ (y ∨ z) = (x ∨ y) ∨ z (asociatividad)
4. x ∧ (x ∨ y) = x ∨ (x ∧ y) = x (absorción)
5. Si X tiene un elemento mínimo O, entonces O ∧ x = O y O ∨ x = x ∀x ∈ X
6. Si X tiene un elemento máximo I, entonces I ∧ x = x y I ∨ x = I ∀x ∈ X
En las relaciones anteriores no se hace explícito que el conjunto parcialmente ordenado
sea un retículo. En efecto, Birkho� probó que estas propiedades caracterizan completamente
a un retículo.
J. C. Valdiviezo INAOE 48
3.1. ÁLGEBRA RETICULAR MINIMAX
3.1.1. Ejemplos de retículos
El conjunto R de los números reales junto con las relaciones de menor o igual (≤) es
un conjunto totalmente ordenado. Por ejemplo, dado cualquier par x, y ∈ R, entonces
ocurre que tanto x ≤ y o y ≤ x. Si x ∨ y = máx{x, y} y x ∧ y = mín{x, y} ∀x, y ∈ R,
entonces R junto con las operaciones de ∨ y ∧ es un retículo totalmente ordenado que
denotamos como (R,∨,∧). Este retículo no es completo.
Sea R±∞ = R ∪ {−∞,∞}, el conjunto de números reales con los símbolos ∞ y −∞adjuntos. Entonces (R±∞,∨,∧) es un retículo completo con ∞ como el elemento más
grande y −∞ como el elemento más pequeño.
El conjunto R≥0∞ = R+ ∪ {0,∞} con la relación ≤ es un retículo completo. Aquí 0 es
el elemento más pequeño e ∞ el elemento más grande. (R≥0∞ ,∨,∧) es un subretículo de
(R±∞,∨,∧). El dual de este retículo se obtiene al reemplazar ≤ con la relación de ≥.
3.1.2. Conceptos generales
Como una extensión de la teoría de retículos a matrices y vectores, Cuninghame-
Green desarrolló un novedoso cálculo matricial basado en la suma-min y la suma-max [6]. A
este conjunto de operaciones se le ha denominado álgebra reticular minimax. En lo siguiente
de�niremos las operaciones del álgebra minimax basadas en el retículo (R±∞,∨,∧,+). Además,
dado un conjunto �nito X de vectores n-dimensionales cuyas componentes son números reales,
al usar la notación de columnas podemos denotar a este conjunto como X = {x1, . . . ,xk} ∈ Rn
donde k es el número de vectores.
Sean x,y ∈ Rn±∞ dos vectores columna n-dimensionales tales que x = (x1, . . . , xn)
T y
y = (y1, . . . , yn)T , donde el superíndice indica transposición; la desigualdad x ≤ y signi�ca
que ∀i, xi ≤ yi. Si x ≤ y entonces existe un índice i tal que xi > yi. El valor mínimo de
un vector está de�nido como∧
x =∧n
i=1 xi. Similarmente, el valor máximo de un vector es
el escalar∨x =
∨ni=1 xi. El conjugado aditivo de un vector columna x está de�nido como el
vector x∗ = −xT = (−x1, . . . ,−xn).
J. C. Valdiviezo INAOE 49
3.1. ÁLGEBRA RETICULAR MINIMAX
Se de�ne la suma escalar para un vector x = (x1, . . . , xn)T y un escalar a ∈ R±∞ como
a+ x = (a+ x1, . . . , a+ xn)T . Las operaciones de suma, mínimo y máximo entre dos vectores
cualesquiera están de�nidas respectivamente ∀ i = 1, . . . , n de la siguiente manera:
(x+ y)i = xi + yi ; (x ∧ y)i = xi ∧ yi ; (x ∨ y)i = xi ∨ yi. (3.1)
La suma externa minimax de dos vectores x ∈ Rm±∞ e y ∈ Rn
±∞, es la matriz de m× n
de�nida por,
x⊕ yT =
x1 + y1 · · · x1 + yn
.... . .
...
xm + y1 · · · xm + yn
. (3.2)
3.1.3. Operaciones matriciales
Dadas dos matrices: A = (aij), B = (bij) ∈ R±∞ de tamaño m×n, se de�nen el máximo
y el mínimo de A y B como las matrices, A ∨ B y A ∧ B, cuyas componentes ij se de�nen
respectivamente por,
(A ∨B)ij = aij ∨ bij ; (A ∧B)ij = aij ∧ bij. (3.3)
Para una matriz A de m× p y una matriz B de p× n con entradas de R±∞, se de�ne
la suma-max de A y B como la matriz C = A ∨ B, siendo
cij =
p∨k=1
(aik + bkj) = (ai1 + b1j) ∨ (ai2 + b2j) ∨ . . . ∨ (aip + bpj). (3.4)
La operación dual sobre las matrices A y B se denomina suma-min y se denota como
la matriz C = A ∧ B, donde
cij =
p∧k=1
(aik + bkj) = (ai1 + b1j) ∧ (ai2 + b2j) ∧ . . . ∧ (aip + bpj). (3.5)
J. C. Valdiviezo INAOE 50
3.1. ÁLGEBRA RETICULAR MINIMAX
Nótese que la suma-max y la suma-min son similares al producto matricial del álgebra lin-
eal, con la diferencia de que la suma y multiplicación son reemplazadas por las operaciones
generalizadas de máximo o mínimo de sumas, respectivamente.
Si A = (aij) ∈ R±∞ es una matriz de m × n, entonces la matriz conjugada A∗ es
la matriz A∗ = (a∗ij) de n × m, donde a∗ij = −aji es el conjugado aditivo. Por lo tanto las
siguientes relaciones se veri�can,
A ∧B = (A∗ ∨B∗)∗ y (A ∧ B)∗ = B∗ ∨ A∗. (3.6)
3.1.4. Independencia reticular
Las ideas de independencia reticular e independencia reticular fuerte de un conjunto
de vectores son propiedades matemáticas fundamentales para aplicaciones en reconocimiento
de patrones basadas en el álgebra reticular [21, 22, 31]. Especí�camente, estas ideas se han
utilizado para la construcción de memorias asociativas reticulares robustas ante ruido aleatorio
[21, 30], y recientemente para la determinación de puntos extremos en imágenes hiperespec-
trales [8, 9]. El concepto de dependencia reticular es el análogo del concepto de dependencia
lineal en los espacios vectoriales del álgebra lineal.
De�nición 3.1. Si X = (x1, . . . ,xk) es un subconjunto de Rn, entonces una combinación
minimax de este subconjunto, denotada como C(X), es cualquier vector x ∈ Rn±∞ que puede
ser escrito como cualquiera de las dos expresiones duales siguientes:
x =∨j∈J
k∧ξ=1
(aξj + xξ) ; x =∧i∈I
k∨ξ=1
(bξi + xξ) (3.7)
donde I, J son conjuntos �nitos de índices y aξj, bξi ∈ R±∞ son familias �nitas de escalares.
La combinación minimax anterior es similar a la combinación lineal de vectores∑k
ξ=1 aξxξ
con la excepción de la dualidad. De esta manera, cualquier combinación �nita que involucre
los operadores de máximo y mínimo y los vectores de la forma a+xξ, b+xξ donde a, b ∈ R±∞
y xξ ∈ X, es una combinación minimax.
J. C. Valdiviezo INAOE 51
3.1. ÁLGEBRA RETICULAR MINIMAX
De�nición 3.2. Un vector x ∈ Rn se dice que es dependiente reticular en X = (x1, . . . ,xk) si
y solo si x = C(x1, . . . ,xk), es decir, x es una combinación minimax formada con los patrones
de X. Un patrón es independiente reticular (IR) si y solo si no es dependiente reticular.
La propiedad de independencia reticular entre vectores implica que x no puede ser es-
crito como una combinación minimax de vectores, lo que implica que dicho vector no cumplirá
con cualesquiera de las dos igualdades expresadas en la ec. (3.7) para conjuntos de índices ar-
bitrarios y escalares correspondientes. De todas las posibles combinaciones minimax se pueden
derivar criterios especí�cos para evaluar independencia reticular dado un conjunto �nito de
vectores. La forma más simple se tiene haciendo aξj = 0 = bξi para todo i ∈ I, j ∈ J y para
todo ξ ∈ {1, . . . , k} [31]. Por tanto, dos casos particulares surgen como criterios para evaluar
independencia reticular:
1. Un conjunto de vectores X = (x1, . . . ,xk) es reticularmente independiente si y solo si
para todo η = 1, . . . , k existe un índice de �la j ∈ {1, . . . , n} tal que xηj >
∨ξ =η x
ξj ∀ξ = η.
2. Un conjunto de vectores X = (x1, . . . ,xk) es reticularmente independiente si y solo si
para todo η = 1, . . . , k existe un índice de �la j ∈ {1, . . . , n} tal que xηj <
∧ξ =η x
ξj ∀ξ = η.
Cualquiera de estos dos criterios puede ser utilizado para evaluar la propiedad de
independencia reticular de un conjunto de vectores. El criterio 1 ha sido utilizado como la base
matemática de la técnica de núcleos [27, 28]. Asimismo, para aplicaciones en reconocimiento
de patrones, ambos criterios se han de�nido como condiciones de independencia morfológica
en sentidos erosivo y dilatativo, respectivamente [8].
De�nition 3.3 Un conjunto de vectores X = (x1, . . . ,xk) ⊂ Rn se dice que es max-dominante,
dualmentemin-dominante, sí y sólo si para cada η ∈ {1, . . . , k}, existe un índice jη ∈ {1, . . . , n}tal que, se satisfacen las igualdades izquierda o derecha, respectivamente,
xηjη− xη
i =k∨
ξ=1
(xξjη− xξ
i ) ; xηjη− xη
i =k∧
ξ=1
(xξjη− xξ
i ) ∀i ∈ {1, . . . , n}. (3.8)
De acuerdo con las de�niciones anteriores, max-dominancia implica que, para cada
vector η ∈ {1, . . . , k}, debe existir un índice j, dependiendo de η, tal que xηj − xη
i ≥ xξj − xξ
i ,
J. C. Valdiviezo INAOE 52
3.2. GEOMETRÍA DE CONJUNTOS CONVEXOS
equivalentemente xηj − xξ
j ≥ xηi − xξ
i . De manera similar, min-dominancia implica que, para
cada vector η ∈ {1, . . . , k}, debe existir un índice j tal que xηj −xη
i ≤ xξj−xξ
i , equivalentemente
xηj − xξ
j ≤ xηi − xξ
i .
De�nición 3.4. Un conjunto de vectores X = (x1, . . . ,xk) posee la característica de inde-
pendencia reticular fuerte (IRF) sí y sólo si las siguientes dos condiciones son satisfechas: el
conjunto X es reticularmente independiente y X es max dominante o min dominante.
3.2. Geometría de conjuntos convexos
El estudio de los conjuntos convexos pertenence a un área de las matemáticas relati-
vamente reciente. Aunque algunos resultados importantes datan de �nales del siglo XIX, el
primer estudio sistemático fue escrito por los alemanes Bonnesen y Fenchel, titulado Theo-
rie der Konvexen Körper en 1934 [4]. En años recientes se descubrieron diversas aplicaciones
de conjuntos convexos, particularmente en el campo de optimización, lo que ha motivado su
estudio. En las siguientes líneas se describirán algunas de�niciones y teoremas derivados de
la teoría de conjuntos convexos que serán útiles para el análisis presentado en los capítulos
subsecuentes [3, 16, 25]. Para ser consistentes con la notación utilizada hasta ahora, cualquier
punto en el espacio Euclidiano se denotará como un vector x ∈ Rn.
3.2.1. Convexidad e independencia afín
De�nición 3.5. Un conjunto S es convexo si para cada par de puntos x, y en S el segmento
de línea recta que une a estos dos puntos reside completamente en S.
De�nición 3.6. Sea λi ∈ R con i = 1, . . . , k y suponga que λ1+λ2+ · · ·+λk = 1. Entonces a
y = λ1x1 + λ2x
2 + · · ·+ λkxk se le denomina una combinación afín de los puntos x1, . . . ,xk.
Si, además de la condición anterior, se requiere que λi ≥ 0 ∀i, entonces y se denomina una
combinación convexa de x1, . . . ,xk.
Consecuentemente un conjunto es convexo sí y sólo si es cerrado bajo combinaciones
J. C. Valdiviezo INAOE 53
3.2. GEOMETRÍA DE CONJUNTOS CONVEXOS
convexas de pares de sus elementos. Además, se dice que un conjunto S es afín sí y sólo si
cualquier combinación afín de puntos de S reside en S [16].
De�nición 3.7. Un conjunto �nito de vectores x1, . . . ,xm es dependiente afín si existen
números reales λ1, . . . , λk, no todos cero, tales que λ1 + · · ·+ λk = 0 y λ1x1 + · · ·+ λkx
k = 0
(origen del sistema coordenado). De otra forma, el conjunto es independiente afín.
El concepto de independencia lineal está relacionado con independencia afín. Sean
{x1, . . . ,xn} un conjunto de vectores, decimos que son linealmente dependientes si existen
números a1, a2, . . . , an, no todos iguales a cero, tales que a1x1 + a2x
2 + · · · + anxn = 0.
Si tales números no existen, entonces los vectores son linealmente independientes. Algunas
propiedades de los vectores linealmente independientes son: (1) un conjunto de vectores es
linealmente independiente sí y sólamente si ninguno es combinación lineal de los demás, (2)
si un conjunto de vectores es linealmente independiente cualquier subconjunto suyo también
lo es. Nótese que en la de�nición de dependencia afín se tiene que∑k
i=1 λi = 0, lo cual es
consistente con la de�nición 3.6 para x = λ1x1 + · · · + λkx
k, con∑k
i=1 λi = 1; lo anterior se
cumple sí y sólo si x − λ1x1 − · · · − λkx
k = 0, siendo la suma de todos los coe�cientes del
lado izquierdo igual a cero. De esta manera, los conceptos de dependencia lineal y afín están
relacionados ya que dependencia lineal implica dependencia afín.
De�nición 3.8. El casco convexo de un conjunto S es la intersección de todos los conjuntos
convexos que contienen a S y se denota como H(S).
De�nición 3.9. El casco afín de un conjunto S es la intersección de todos los conjuntos a�nes
que contienen a S y se denota como A(S).
Claramente el conjunto S es convexo sí y sólo si S=H(S); S es afín sí y sólo si S=A(S).
Dicho de otra manera, H(S) es el conjunto convexo más pequeño que contiene a S mientras
que A(S) es el conjunto afín más pequeño que contiene a S.
Teorema 3.1. Para cualquier conjunto S, el casco convexo H(S) consiste de todas las com-
binaciones convexas de los elementos de S.
J. C. Valdiviezo INAOE 54
3.2. GEOMETRÍA DE CONJUNTOS CONVEXOS
El teorema anterior no establece ninguna restricción sobre el número de puntos de S
requeridos para hacer la combinación. El siguiente teorema es básico en el estudio de conjuntos
convexos y fue demostrado primero por Caratheodory en 1907. El teorema establece que en
un espacio n-dimensional, el número de puntos de S en la combinación convexa no tiene que
ser mayor a n+ 1 [16].
Teorema 3.2 (Caratheodory). Si S es un subconjunto no vacío del espacio Euclidiano n-
dimensional Rn, entonces cualquier x ∈ H(S) puede ser expresado como una combinación
convexa de a lo más n+ 1 puntos de S.
Debido a que el casco convexo de un conjunto convexo S es igual al conjunto de todas
las combinaciones convexas de puntos de S, el teorema anterior puede ser enunciado de la
siguiente forma: x ∈ H(S) sí y sólo si x está en el casco convexo de a lo más n+ 1 puntos de
S.
3.2.2. Simplex multidimensionales
Se conoce como politopo o politopo convexo al casco convexo de un conjunto �nito de
puntos. La clase más simple de politopos es el simplex, cuya de�nición formal es la siguiente.
De�nición 3.10. Si S = {x1, . . . ,xk+1} y dim(S) = k, entonces a H(S) se le denomina un
simplex k-dimensional y los puntos x1, . . . ,xk+1 son sus vértices.
La de�nición anterior implica que un simplex es la estructura convexa mínima con
k + 1 vértices y que es capaz de encerrar un subespacio de dimensión k. El requisito de que
la dimensión de S = {x1, . . . ,xk+1} sea igual a k es equivalente a requerir que los vectores
x1, . . . ,xk+1 sean independientemente afínes. En efecto se debe recordar que un conjunto
S = {x0,x1, . . . ,xk} ⊂ Rn se dice independientemente afín sí y sólo si el conjunto {xj − x0 :
j = 1, . . . , k} es linealmente independiente.
Algunos ejemplos de simplex son los siguientes. Un simplex de dimensión cero está rep-
resentado por un punto; un simplex de dimensión uno corresponde a una línea recta, mientras
que en dos dimensiones el simplex es un triángulo; de manera análoga, el caso de un sim-
J. C. Valdiviezo INAOE 55
3.2. GEOMETRÍA DE CONJUNTOS CONVEXOS
x1
x2
x1
x1
x2
x3
x1
x2
x3
x4
x1
x2
x3
x4
x5
S0
S1
S2
S3
S4
Figura 3.1: Ejemplos de simplex para k = 1, . . . , 4
plex tridimensional corresponde a un tetraedro. En general, un simplex k-dimensional puede
construirse de la siguiente manera:
0-simplex S0: un punto único {x1}1-simplex S1: H(S0 ∪ {x2}) donde x2 /∈ A(S0)
2-simplex S2: H(S1 ∪ {x3}) donde x3 /∈ A(S1)
...
k-simplex Sk: H(Sk−1 ∪ {xk+1}) donde xk+1 /∈ A(Sk−1).
El simplex S0 está representado por un punto. Al unir un punto x2 que no está en
S0, se obtiene el segmento de línea S1, técnicamente se toma el casco convexo de S0 ∪ {x2}.Al unir el punto x3 que no está en la línea que contiene S1, se obtiene el triángulo S2. De
manera similar, al unir el punto x4 que no está en el plano de S2 se obtiene el tetraedro S3. Si
unimos un punto x5 (que no está en el espacio 3D de S3) con S3, se obtiene el pentatopo S4.
Es fácil observar que, conforme aumenta la dimensionalidad del espacio, se vuelve más difícil
representar el simplex. En la �gura 3.1 se presentan los k-simplex para k = 0 . . . 4. Así por
ejemplo S4 tiene 5 vértices, cualquier conjunto formado por 4 de ellos determinan una cara en
forma de tetraedro. En la �gura se ha enfatizado la cara con vértices {x1,x2,x4,x5}.Un punto x en un simplex S = H{x1, . . . ,xk} puede ser expresado como una combi-
nación lineal convexa de los vértices; es decir, x =∑k+1
i=1 αixi. De esta manera, cada punto en
el simplex H(S) tiene una única representación como una combinación de sus vértices.
J. C. Valdiviezo INAOE 56
3.2. GEOMETRÍA DE CONJUNTOS CONVEXOS
De�nición 3.11. Sea H(S) el simplex k-dimensional que contiene al punto x. Si la única
representación de x como una combinación convexa de los vértices está dada por x = λ1x1 +
· · ·+ λk+1xk+1, entonces los números λ1, . . . , λk+1 se denominan las coordenadas baricéntricas
de x.
3.2.3. Modelo de mezclado lineal
Los conceptos de simplex y su representación en espacios multidimensionales han sido
aplicados en el análisis de imágenes hiperespectrales para representar las mezclas de espectros
de diferentes objetos captadas en la apertura del sensor [13]. Para ello, el modelo de mezclado
lineal con restricciones (MLR) permite representar los datos mezclados como una combinación
convexa de los vértices del simplex que los encierra; es decir,
x =
p∑i=1
aisi + r = Sa+ r (3.9)
p∑i=1
ai = 1 ; ai ≥ 0 ∀i. (3.10)
donde x ∈ Rn es el espectro medido sobre n bandas, S = {s1, s2, . . . , sp} es una matriz de
tamaño n × p cuyas columnas son los puntos extremos o vértices del simplex que encierra
a los datos, (a1, a2, . . . , ap)T es un vector p-dimensional cuyas entradas son las abundancias
fraccionales correspondientes presentes en x y r es un vector de ruido aditivo.
En efecto, el objetivo de la representación anterior es determinar el vector de abundan-
cias a, conociendo la matriz S. Bajo la suposición de que r = 0, la solución más simple que
minimiza ∥x−Sa∥2 = ∥r∥2 está dada por la estimación de mínimos cuadrados sin restricciones
expresada como sigue:
a = S+x = (STS)−1STx, (3.11)
donde S+ denota la matriz pseudoinversa de Moore-Penrose. Esta estimación existe cuando
hay más bandas que columnas y cuando S es de rango completo. La solución irrestricta puede
ser reforzada para incorporar las condiciones de positividad (ai ≥ 0 ∀i) y aditividad completa
J. C. Valdiviezo INAOE 57
3.3. MEMORIAS ASOCIATIVAS RETICULARES
(∑p
i=1 ai = 1) impuestas por el modelo. El satisfacer la condición de aditividad completa
requiere del uso de multiplicadores de Lagrange de la forma siguiente.
aL = a− (STS)−1ZT [Z(STS)−1ZT ]−1(Za− b). (3.12)
donde Z es un vector �la de tamaño 1× p con todos sus elementos igual a uno y b = 1 [13].
Lo anterior tiene el efecto de restringir que la solución de mínimos cuadrados resida en el
hiperplano cuya ecuación es∑p
i=1 ai = 1.
Satisfacer la condición de positividad no es tan sencillo en la práctica ya que el min-
imizar ∥x − Sa∥2 manteniendo ai ≥ 0, ∀i = 1, . . . , p, cae en el dominio de la programación
cuadrática con desigualdades lineales como restricciones. Una alternativa comúnmente uti-
lizada es el algoritmo de estimación de mínimos cuadrados no negativa (non-negative least
square estimation, NNLS)[15]. La aproximación consiste en estimar iterativamente a y, en
cada iteración, encontrar una solución mínima cuadrada para aquellos coe�cientes de a que
son negativos usando sólo las columnas asociadas de S. Es importante mencionar que en la
práctica satisfacer ambas restricciones simultáneamente resulta difícil. Sin embargo, ya se han
desarrollado técnicas híbridas que permitan encontrar una solución para a sujeta a las dos
restricciones mencionadas [11].
3.3. Memorias asociativas reticulares
El surgimiento y desarrollo de las memorias asociativas reticulares, como un nuevo
paradigma en redes neuronales arti�ciales, ha brindado solución a diversos problemas en el
reconocimiento de patrones, tales como la asociación y la recuperación de patrones afectados
por ruido [20, 21, 26, 29]. En este contexto, los patrones se representan como vectores columna
xj ∈ R; cada componente xji con i = 1, . . . , n, representa una característica determinada del
patrón, por ejemplo, caracteres, curvatura o señal de intensidad. Enseguida se da primera-
mente una introducción a las memorias asociativas convencionales y después se presentan las
memorias asociativas reticulares, las cuales realizan el cómputo neuronal basado en el álgebra
reticular minimax.
J. C. Valdiviezo INAOE 58
3.3. MEMORIAS ASOCIATIVAS RETICULARES
Dados dos conjuntos de vectores X = (x1, . . . ,xk) y Y = (y1, . . . ,yk) con asociaciones
dadas por {(xξ,yξ) ∈ Rn × Rm : ξ = 1, . . . , k }, una memoria asociativa M debe ser capaz
de recuperar un patrón de salida yξ cuando se le presenta un patrón de entrada xξ o una
versión con ruido de ésta. Anderson y Kohonen propusieron una de las primeras memorias
matriciales de correlación basadas en redes neuronales lineales [1, 14]. De las memorias asocia-
tivas propuestas en la literatura, la red de Hop�eld es una de las más conocidas [12]. En estos
modelos, una memoria asociativa M se construye a partir de la suma del producto externo de
los patrones asociados yξ e xξ; ésto es,
M =k∑
ξ=1
yξ(xξ)T =k∑
ξ=1
yξ1x
ξ1 . . . yξ1x
ξn
.... . .
...
yξmxξ1 . . . yξmx
ξn
. (3.13)
En este caso, la entrada ij-ésima de M está dada por µij =∑k
ξ=1 yξi x
ξj . Si los patrones
de entrada x1, . . . ,xk son ortonormales, ésto es
(xj)T · xi =
1 si i = j
0 si i = j(3.14)
entonces, la recuperación de los patrones de salida y1, . . . ,yk es perfecta, ya que
M xi =∑j =i
[yj(xj)T ]xi + [yi(xi)T ]xi =∑j =i
yj[(xj)T · xi] + yi[(xi)T · xi] = yi. (3.15)
Sin embargo, en la mayoría de las aplicaciones, los patrones x1, . . . ,xk no son ortonor-
males, por lo que es necesario realizar procesos de ortonormalización o �ltrado usando funciones
de activación para recuperar los patrones deseados [22].
Las memorias asociativas reticulares son similares a las memorias clásicas con la difer-
encia de que están basadas en las operaciones del álgebra minimax. Sean (x1,y1), . . . , (xk,yk)
k pares de vectores, con xξ ∈ Rn y yξ ∈ Rm para ξ = 1 . . . , k, conjuntados en un par matricial
(X,Y ). Para almacernar los k pares de vectores en una memoria asociativa reticular (MAR),
J. C. Valdiviezo INAOE 59
3.3. MEMORIAS ASOCIATIVAS RETICULARES
de tamaño m× n, se utiliza un proceso de almacenamiento similar al de las memorias de cor-
relación pero reemplazando el producto externo en la ec. (3.13) con la suma externa minimax
de la ec. (3.2).
De�nición 3.12. Las memorias min-WXY y max -MXY, ambas de tamaño m × n, que al-
macenan un conjunto de asociaciones (X,Y ), así como sus componentes ij están de�nidas,
respectivamente, por las expresiones
WXY = Y ∧ X∗ =k∧
ξ=1
[yξ ⊕ (−xξ)T ] ; wij =k∧
ξ=1
(yξi − xξj), (3.16)
MXY = Y ∨ X∗ =k∨
ξ=1
[yξ ⊕ (−xξ)T ] ; mij =k∨
ξ=1
(yξi − xξj). (3.17)
Las memorias reticulares anteriores de�nidas para X = Y se denominan memorias
hetero-asociativas reticulares (MHAR) y para X = Y se denominan memorias auto-asociativas
reticulares (MAAR). Por lo tanto, para recuperar un patrón de salida yξ dado el patrón de
entrada xξ se hace uso de los operaciones suma-min y suma-max de�nidas en la sección
anterior. Así, yξ = WXY ∨ xξ o equivalentemente yξ = MXY ∧ xξ.
3.3.1. Propiedades algebraicas
Las memorias auto-asociativas reticulares constituyen el fundamento teórico del méto-
do que se emplea en esta investigación, por lo que es necesario mencionar algunas de sus
propiedades algebráicas. En base a las ecs. (3.16) y (3.17) con Y = X, WXX y MXX son
matrices cuadradas de tamaño n× n. Además, la memoria WXX se caracteriza por tener en-
tradas con valores negativos. Para evitar aglomerar la notación, a partir de ahora las memorias
auto-asociativas reticulares se denotarán simplemente como W y M , respectivamente. En las
siguientes líneas se presentan algunas propiedades algebráicas de estas memorias [22, 23, 31].
Diagonal principal nula. Las diagonales principales de W y M , denotadas como wii y
mii respectivamente, están conformadas enteramente por ceros i.e. wii =∧k
ξ=1(xξi −xξ
i ) =
0 =∨k
ξ=1(xξi − xξ
i ) = mii.
J. C. Valdiviezo INAOE 60
3.3. MEMORIAS ASOCIATIVAS RETICULARES
Dualidad. Para Y = X se tiene que X ∧ X∗ = (X∗)∗ ∧ X∗ = (X ∨ X)∗, entonces
M = W ∗. Por lo tanto, la memoria min-W y la memoria max -M son duales en el sentido
de conjugación matricial.
Capacidad de almacenamiento. Para cualquier patrón de entrada xξ se tiene que
WXX ∨ xξ = xξ = MXX ∧ xξ. De esta forma, no existen restricciones en la dimensión o
en el número de patrones que puedan ser almacenados en W o M .
Dominancia máxima y mínima en la diagonal. Sean wij y mij las entradas de W
y M , respectivamente. Si i, j ∈ {i, . . . , n}, se cumple entonces que wij + wji ≤ wil y
mij +mji ≥ mii. De esta forma, W es diagonalmente max-dominante, mientras que M
es diagonalmente min-dominante.
Conjunto de puntos �jos. Dados un conjunto de vectores X = (x1, . . . ,xk) y una
transformación T : Rn → Rn, entonces x ∈ Rn se denomina punto �jo de T sí y sólo
si T (x) = x. Esta igualdad se satisface para todo vector xξ ∈ X dado que WXX ∨ xξ =
xξ = MXX ∧ xξ. De este modo, W y M comparten el mismo conjunto de puntos �jos
denotado como F (X).
3.3.2. Propiedades geométricas
Dado un conjunto de vectores X = (x1, . . . ,xk) ∈ Rn, a partir de los cuales se contruyen
las memorias WXX y MXX, las reescribimos respectivamente como W = {w1, . . . ,wn} y M =
{m1, . . . ,mn} para explicitar sus vectores columna. Es posible entonces construir un casco
convexo n-dimensional que sea capaz de encerrar a todos o a la mayoría de los vectores en
el espacio dado. Geométricamente estos puntos serán los vértices de un simplex que deben
satisfacer la condición de independencia afín. Para determinar los vértices del simplex a partir
de los vectores columna de W y M , es necesario realizar un escalamiento aditivo sobre los
vectores de ambas memorias para trasladar los valores negativos de WXX al ortante positivo
del espacio Rn. Este escalamiento se realiza en base a los vectores cota máxima y cota mínima
que se de�nen a continuación.
J. C. Valdiviezo INAOE 61
3.3. MEMORIAS ASOCIATIVAS RETICULARES
De�nición 3.13. Sean X = (x1, . . . ,xk) un subconjunto �nito de Rn. Las cotas vectoriales
mínima y máxima están dadas respectivamente por v =∧k
ξ=1 xξ y u =
∨kξ=1 x
ξ; sus corre-
spondientes entradas se calculan, respectivamente como
vi =k∧
ξ=1
xξi ; ui =
k∨ξ=1
xξi i = 1, . . . , n. (3.18)
Por tanto, el escalamiento aditivo resulta en dos nuevas matrices, denotadas respectiva-
mente como W y M , cuyos vectores columna están de�nidos por
wi = wi + ui ; mi = mi + vi i = 1 . . . , n . (3.19)
Algunas características importantes que resultan de este escalamiento son las siguientes[23]:
1) W y M conservan las propiedades respectivas de dominancia máxima y mínima en la diago-
nal, 2) diag(W ) = u y diag(M) = v, 3) geométricamente los conjuntos formados por {W ∪u}o {M ∪ v} corresponden a los puntos extremos o vértices de dos simplex n-dimensionales que
encierran a subconjuntos de X y 4) el conjunto de puntos M ∪W ∪ {v,u} forma un politopo
convexo B con 2(n+ 1) vértices que contienen a X.
3.3.3. Criterios para evaluar independencia afín
Aunque en casos excepcionales es importante notar que los vectores columna de las
MAAMs no necesariamente satisfacen la propiedad de independencia afín, en cuyo caso, re-
sulta necesario utilizar criterios particulares para veri�car esta propiedad. A continuación, se
presentan dos criterios que pueden ser utilizados para determinar un subconjunto independi-
ente afín a partir de W o M .
Criterio I. Este criterio está basado en la siguiente conjetura, la cual fue establecida origi-
nalmente como un teorema en [22, 23].
Conjetura 3.1. Si X = (x1, . . . ,xk) ⊂ Rn es reticularmente independiente fuerte, entonces
X es independiente afín.
De acuerdo con esta conjetura es posible utilizar la propiedad de independencia reticular
fuerte para derivar un subconjunto de vectores independientes afín y que además sean los
J. C. Valdiviezo INAOE 62
3.3. MEMORIAS ASOCIATIVAS RETICULARES
vértices del conjunto convexo. De acuerdo con las propiedades de las memorias reticulares,
W es diagonalmente max-dominante, mientras que M es diagonalmente min-dominante; de
esta manera, para obtener un conjunto independiente reticular fuerte es su�ciente evaluar la
propiedad de independencia reticular (IR). El siguiente teorema provee un método para obtener
un conjunto de vectores que satisface independencia reticular fuerte a partir del conjunto de
puntos �jos F (X).
Teorema 3.3. Sea X = (x1, . . . ,xk) ⊂ Rn y sean W y M los vectores que conforman las
columnas de WXX y MXX, respectivamente, entonces existen V ⊂ W y N ⊂ M tal que V
y N son independientes reticulares fuertes y F (V ) = F (N) = F (X) o equivalentemente,
WVV = WXX y MNN = MXX.
Demostración. Dado que W es max-dominante, lo único que se necesita demostrar es la exis-
tencia de un conjunto independiente reticular V tal que WV V = WXX. Sea W = {w1, . . . ,wn}y el conjunto W1 = W\{w1}. Si WW1W1 = WXX , hacer V1 = W1, de otra forma V1 = W . Por
lo tanto, si V1 = W1, entonces w1 /∈ V1 cuando w1 es dependiente reticular, y w1 ∈ V1 cuando
w1 es independiente reticular. En cualquier caso se tiene que WV1V1 = WXX. Enseguida, hacer
V2 = V1\{w2} si WV2V2 = WXX, de otra forma hacer V2 = V1. De nuevo, en cualquier caso se
tendrá WV2V2 = WXX. Se continúa de esta forma hasta Vn = Vn−1\{wn} si WVnVn = WXX, de
otra forma hacer Vn = Vn−1. Una vez queW ha sido evaluado, hacer V = Vn. Por construcción,
V ⊆ W es un subconjunto independiente reticular para el cual WV V = WXX. Dado que V es
también max-dominante se tiene por lo tanto que V es independiente reticular fuerte �.
A partir de la demostración de este teorema surge un método para derivar una base
independiente reticular fuerte para cualquier conjunto de patrones X [24]. El procedimiento
consiste en construir la memoria WXX, y formar el conjunto W . Entonces remover cualquier
conjunto de patrones dependientes reticulares de W usando el método antes descrito y así
obtener el conjunto de patrones V con independencia reticular fuerte.
Criterio II. Este criterio está fundamentado en el siguiente teorema que provee cuatro
igualdades para probar computacionalmente la independencia afín de los conjuntos W =
J. C. Valdiviezo INAOE 63
3.3. MEMORIAS ASOCIATIVAS RETICULARES
{w1, . . . ,wn} y M = {m1, . . . ,mn} y que ha sido demostrado recientemente en [24]. En esta
discusión wi y mi denotan la i-ésima �la de W y M , respectivamente, en tanto que el vector
c denota un vector constante.
Teorema 3.4. Si j, l ∈ {1, . . . , n}, entonces las siguientes a�rmaciones son equivalentes: (1)
wj −wl = c, (2) wl = wj, (3) mj −ml = c, y (4) ml = mj.
El siguiente teorema, en conjunción con el Teorema 3.4, provee un método simple y
e�caz para derivar un conjunto de vectores independientes afín a partir de W y M . En este
tratamiento, dado el conjunto J = {1, . . . , n}, se denota a J ′ como un subconjunto arbitrario
de J .
Teorema 3.5. W ′ ⊂ W es independientemente afín sí y sólo si wj = wl para todos los
distintos pares {j, l} ⊂ J ′. Similarmente, M ′ ⊂ M es independientemente afín sí y sólo si
mj = ml para todos los distintos pares {j, l} ⊂ J ′.
En los teoremas anteriores se establecen las condiciones necesarias para determinar
vectores independientes afín a partir de las memorias sin escalamiento. De esta manera, lo
único que se tiene que veri�car es que dos vectores de W o M no sean iguales. Dado que el
escalamiento aditivo preserva la dominancia máxima y mínima en las diagonales deW yM , un
resultado fundamental derivado a partir de los teoremas dados es que, si wj = wl ∀{j, l} ⊂ J ,
entonces cualquier subconjunto no vacío de W o M puede servir como un conjunto de puntos
extremos.
3.3.4. Determinación de puntos extremos con W y M
Sea una imagen I(x, y,−→λ ), donde x = 1, . . .m e y = 1, . . . q representan sus coordenadas
espaciales y−→λ hace explícita su dependencia con la longitud de onda y que puede tomar los
valores de−→λ ∈ Rn con n ≥ 3, dependiendo del número de bandas presentes en la imagen. El
objetivo consiste en encontrar p vectores de dimensión 1× n cuyas coordenadas baricéntricas
correspondan a los vértices de H(I) que encierra a la mayoría de los datos. Estos puntos
extremos servirán para representar cualquier pixel dentro del conjunto convexo usando el
J. C. Valdiviezo INAOE 64
3.3. MEMORIAS ASOCIATIVAS RETICULARES
modelo MLR y se podrán estimar las abundancias fraccionales de los puntos extremos en cada
pixel de la imagen.
Las propiedades algebráicas y geométricas de las MAAMs permiten determinar un
conjunto de puntos extremos o vértices del simplex de dimensión n a partir de la imagen
bajo estudio. Primero es necesario modi�car la imagen I(x, y,−→λ ) de tal manera que cada
pixel se represente como un conjunto X = (x1,x2, . . . ,xmq) ∈ Rn. A partir del conjunto X se
construyen WXX y MXX y se realiza el escalamiento aditivo para obtener las matrices W y M .
El último paso consiste en utilizar cualquiera de los criterios I o II para veri�car independencia
afín entre los vectores columna derivados de cada memoria autoasociativa reticular.
En resumen, para determinar el conjunto de puntos extremos de una imagen multicanal
I(x, y,−→λ ) se realizan los siguientes pasos:
1. Cambiar la imagen I(x, y,−→λ ) al conjunto de pixeles espectrales X = (x1,x2, . . . ,xmq) ⊂
Rn.
2. Calcular WXX y MXX a partir de X
3. Calcular las cotas vectoriales u y v de X.
4. Obtener las matrices escaladas W y M .
5. Veri�car que W o M son independientes a�nes.
6. En el modeloMLR hacer S = W o S = M y calcular el vector a para cada pixel espectral.
En efecto, el métodoW yM es capaz de determinar el conjunto de puntos extremos que
forman un simplex que encierra los datos de la imagen bajo análisis sin importar su tamaño
y dimensión espectral.
J. C. Valdiviezo INAOE 65
Bibliografía
[1] Anderson J.A., �A simple neural network generating an interactive memory,� Mathematical Bio-
sciences, Vol. 14, pp. 197�220, 1972.
[2] Birkho� G., Lattice Theory, 3rd ed, American Mathematical Society, Providence RI, 1967.
[3] Boyd S. and Vandenberghe L., Convex Optimization, Cambridge University Press, 2004.
[4] Bonnesen T. and Fenchel W., Theorie der Konvexen Körper, Springer-Verlag, Berlin; reprinted
Chelsea, NY, 1948.
[5] Cuninghame-Green R., �Describing industrial processes with interference and approximating their
steady-state behaviour,� Oper. Research Quart., pp. 95�100, 1962.
[6] Cuninghame-Green R., �Minimax algebra and applications.� In: Advances in Imaging & Electron
Physics, P. Hawkes editor, Vol. 90, pp. 1�121, Academic Press, New York, NY, 1995.
[7] Graña M., Raducanu B., �Increasing the robustness of heteroassociative morphological memo-
ries for practical applications� Proc. 6th International Symposium on Mathematical Morphology,
Sidney, Australia, pp. 379�388, 2002.
[8] Graña M., Sussner P., Ritter G.X., �Innovative applications of associative morphological memories
for image processing and pattern recognition,� Mathware & Soft Computing, Vol. 10, pp. 155�168,
2003.
[9] Graña M., Gallego J., �Associative morphological memories for endmember induction,� IEEE
Proc.: IGARSS, Vol. 6, pp. 3757�3759, 2003.
66
BIBLIOGRAFÍA
[10] Graña M., Maldonado O., Vicente D., �Morphological independence and hyperspectral image
indexing,� SPIE Proc.: Mathematical Methods in Pattern and Image Analysis, Vol. 5916, pp. 1�
10, 2005.
[11] Heinz D.C., Chang C.I., �Fully constrained least square linear spectral mixture for material
quanti�cation in hyperspectral imagery,� Transactions on Geoscience and Remote Sensing, Vol.
39, No. 3, pp. 529�545, 2001.
[12] Hop�eld J.J., �Neural networks and physical systems with emergent collective computational
abilities,� Proc. of the National Academy of Sciences, pp. 2554�2558 1982.
[13] Keshava N. and Mustard J.F., �Spectral unmixing,� IEEE Signal Processing Magazine, Vol. 19,
pp. 44�57, 2002.
[14] Kohonen T., �Correlation Matrix Memory,� IEEE Transactions on Computers, Vol. C-21, No. 4,
pp. 353�359, 1972.
[15] Lawson C.L., Hanson R.J., Solving least squares problems, Prentice-Hall, Englewood Cli�s, NJ,
Chap. 23, 1974.
[16] Lay S.R., Convex Sets and Their Applications, Dover Publications, 2007.
[17] Ritter G.X., �Image algebra with applications.� Unpublished manuscript, available via anony-
mous ftp://cis.u�.edu./pub/src/ia/documents, 1994.
[18] Ritter G.X., Wilson J.N., Handbook of computer vision algorithms in image algebra, CCR Press
Inc, Florida, USA, pp. 289�308, 1996.
[19] Ritter G.X.,�Lattice algebra� and �Minimax algebra,� in Image Algebra, unpublished manuscript
available via anonymous ftp from ftp://ftp.cise.ufl.edu/pub/scr/ia/documents, Center for
Computer Vision and Visualization, CISE Department, University of Florida, Gainesville FL,
pp. 121�135, 1999.
[20] Ritter G.X., Sussner P., Diaz de León J.L.,�Morphological associative memories,� IEEE Trans.
on Neural Networks, Vol. 9, No. 2, pp. 281�293, 1998.
J. C. Valdiviezo INAOE 67
BIBLIOGRAFÍA
[21] Ritter G.X., Urcid G., Iancu L.,�Reconstruction of patterns from noisy inputs using morphological
associative memories,� Journal of Mathematical Imaging and Vision, Vol. 19, pp. 95�111, 2003.
[22] Ritter G.X., Gader P.,�Fixed point of lattice transforms and lattice associative memories.� In:
Advances in Imaging and Electron Physics, P. Hawkes ed., Vol. 144, Elsevier, San Diego, CA.
pp.165�242, 2006.
[23] Ritter G.X., Urcid G., Schmalz M.S., �Autonomous single-pass endmember approximation using
lattice auto-associative memories,� Neurocomputing, Vol. 72, No. 10-12, pp. 2101�2110, 2009.
[24] Ritter G.X., Urcid G., �Lattice algebra approach to endmember determination in hyperspec-
tral imagery,� Advances in Imaging and Electron Physics, P. Hawkes ed., Vol. 160, pp. 113�169,
Elsevier Inc, Academic Press, 2010.
[25] Serra J., Image Analysis and Mathematical Morphology, Academic Press, New York, NY, Chap.
4, 1982.
[26] Sussner P., Valle M.E., �Gray-scale morphological associative memories,� IEEE Transactions on
Neural Networks, Vol. 17, No. 3, pp. 559�570, 2006.
[27] Urcid G., Ritter G.X., �Kernel computation in morphological associative memories for grayscale
image recollection,� IASTED Proc.: 5th Int. Conf. on Signal and Image Processing, Honolulu, HI,
pp. 450�455, 2003.
[28] Urcid G., Ritter G.X., Iancu L., �Kernel computation in morphological bidirectional associative
memories,� LNCS Proc.: Progress in Pattern Recognition, Speech, and Image Analysis, Springer,
Vol. 2095, pp. 563�570, 2003.
[29] Urcid G. and Ritter G.X., �Noise masking for pattern recall using a single lattice matrix auto-
associative memory,� IEEE Proc.: International Conference on Fuzzy Systems, Vancouver, British
Columbia, Canada, pp. 187�194, September 2006.
[30] Urcid G., Ritter G.X., �Noise Masking for Pattern Recall using a Single Lattice Matrix Associative
Memory.� In: Computational Intelligence based on Lattice Theory, Kaburlasos, V.G. and Ritter,
G.X. eds., Vol. 67, Springer, Heidelberg, Germany, pp. 79�98, 2007.
J. C. Valdiviezo INAOE 68
BIBLIOGRAFÍA
[31] Urcid-S G., Valdiviezo-N. J.C., �Generation of lattice independent vector sets for pattern recog-
nition applications,� SPIE Proc.: Mathematics of Data/Image Pattern Recognition, Compression,
Coding and Encryption X, with Applications, Vol. 6700-12, San Diego, CA, 2007.
[32] Valdiviezo J.C., Urcid G., �Hyperspectral endmember detection based on strong lattice indepen-
dence,� SPIE Proc.: Applications of Digital Image Processing XXX, Vol. 6696, pp. 669625:1�12,
San Diego, CA, 2007.
J. C. Valdiviezo INAOE 69
Capítulo 4
Segmentación de Imágenes a Color
El método basado en W y M puede ser utilizado de manera e�ciente como una técnica de
segmentación para imágenes en color. En el siguiente capítulo se describe el uso de dicha
técnica aplicada a diversas imágenes en color RGB de dominio público. Los resultados de
segmentación obtenidos se comparan con los obtenidos por otras técnicas reportadas en la
literatura. Finalmente, se realiza una cuanti�cación de los resultados producidos al transformar
las imágenes RGB a los espacios de color I1I2I3, HSI, y L*a*b*.
4.1. Concepto de segmentación
En diversas aplicaciones orientadas al procesamiento y análisis de imágenes, la seg-
mentación es un proceso previo a la representación de objetos o regiones de interés en la
imagen. La segmentación consiste en subdividir una imagen en un conjunto �nito de regiones
cuyos pixeles comparten atributos bien de�nidos. Los algoritmos de segmentación fueron orig-
inalmente desarrollados para imágenes en niveles de gris y están basados en una de las dos
propiedades básicas de los valores de intensidad: discontinuidad y similitud. Estas técnicas
han sido modi�cadas, mejoradas o extendidas para funcionar adecuadamente en imágenes en
color o en sus respectivas transformaciones a otros espacios.
De�nición 4.1. Sea X un conjunto �nito con k elementos y P un predicado lógico respecto
70
4.1. CONCEPTO DE SEGMENTACIÓN
de un atributo cuanti�cable. Una segmentación de X es una familia de subconjuntos {Ri} de
X, con ki elementos para i = 1, . . . , q, que satisfacen las siguientes propiedades:
1. Ri ∩Rj = ∅ para i = j (no hay intersección entre subconjuntos distintos).
2.∪q
i=1 Ri = X y∑q
i=1 ki = k (la unión de subconjuntos forma la imagen completa).
3. Para cualquier i, Ri es un conjunto conexo.
4. ∀i,P(Ri) = verdad (los elementos en un subconjunto comparten el mismo atributo).
5. ∀i = j, P(Ri ∪ Rj) = falso (los elementos en la unión de subconjuntos no comparten
los mismos atributos).
La segmentación de imágenes a color ha sido desarrollada desde diferentes perspectivas
que pueden clasi�carse en las siguientes categorías: 1) segmentación basada en pixeles, 2)
área, 3) bordes y 4) en la física de las imágenes. Algunos compendios de estas técnicas se
pueden consultar en [17] y [20], mientras que tratamientos más recientes se pueden consultar
en [4, 10]. Los algoritmos basados en pixeles incluyen las técnicas que utilizan el histograma y
aquellas de análisis por agrupamiento de datos en diferentes espacios de color. En particular,
la umbralización óptima [2] es una técnica basada en el histograma. Las técnicas basadas en
área incluyen el crecimiento de regiones y el método de división y unión (split and merge); de
esta última se puede mencionar el uso de modelos de campos aleatorios de Markov [9, 15]. Por
otra parte, en las técnicas basadas en detección de bordes se pueden mencionar a los métodos
locales y la extensión de la transformación de cuencas (watershed); esta transformación y la
aproximación de zona plana para la segmentación de imágenes a color fueron originalmente
desarrolladas, respectivamente en [13] y [5]. Las técnicas basadas en física utilizan modelos
físicos que permitan particionar una imagen en regiones que corresponden a super�cies y
objetos; el tratamiento matemático que éstas utilizan incluye un modelo que describa los
cambios en la re�exión de la luz de materiales conocidos y que es empleado para segmentar
las imágenes.
Además de las técnicas anteriores, existen otras más recientes que contemplan la fusión
de varios métodos de segmentación con la �nalidad de mejorar los resultados; un ejemplo de
estas técnicas es la aplicación de la cerradura morfológica y la dilatación adaptativa para la
J. C. Valdiviezo INAOE 71
4.1. CONCEPTO DE SEGMENTACIÓN
umbralización del histograma de color [16]. El uso del algoritmo de cuencas para el agrupamien-
to de color con etiquetamiento de Markov ha sido desarrollado en [6]. Recientemente se han
propuesto técnicas alternativas basadas en computación suave que realizan la segmentación de
imágenes a color [21]; un tratamiento más amplio sobre estas técnicas y su uso en diferentes
espacios de color se puede consultar en [8, 14]. En las siguientes subsecciones se presentan
dos técnicas de segmentación por agrupamiento y que han sido utilizadas para comparar los
resultados obtenidos con el método propuesto.
4.1.1. El método de distancias
Esta técnica de segmentación útil y sencilla ha sido implementada para separar objetos
de un color o rango de colores determinado, en una imagen en color RGB (red, green, blue). A
partir de un color promedio elegido en una región de interés, la técnica se basa en clasi�car
cada pixel de la imagen tomando en cuenta la presencia o ausencia del color especi�cado.
De�nición 4.2. Sea R el conjunto de pixeles que pertenece a la región de interés. El vector
medio z y la matriz de covarianza1 C calculados a partir deR están expresados respectivamente
por
z =1
κ
κ∑i=1
xi ; C =1
κ
κ∑i=1
xixTi − zzT , (4.1)
donde κ denota el número de pixeles en R y xi ∈ R. De esta manera, el proceso de seg-
mentación se realiza por medio de alguna medida de distancia que permita clasi�car a cada
pixel en la imagen como parte de dicha región; es decir, siendo x ∈ R3 un vector arbitrario en
el espacio RGB se dice que x es similar a z si la distancia entre ellos es menor a un umbral
especi�cado, τ . Las distancias Euclidiana (dE) y de Mahalanobis (dM) pueden utilizarse para
esta tarea y están de�nidas respectivamente como sigue
dE(x, z) = [(x− z)T (x− z)]1/2 (4.2)
dM(x, z) = [(x− z)TC−1(x− z)]1/2. (4.3)
1La covarianza indica el sentido de la correlación entre variables y que a partir de la matriz de covarianza
se puede derivar una transformación lineal para decorrelacionar los datos.
J. C. Valdiviezo INAOE 72
4.1. CONCEPTO DE SEGMENTACIÓN
La localización de los puntos dE(x, z) ≤ τ de�ne una esfera sólida de radio τ . Los puntos
contenidos dentro o sobre la super�cie de la esfera satisfacen el criterio de color especi�cado.
Por su parte, la localización de los puntos dM(x, z) ≤ τ describe un cuerpo elíptico sólido con
la propiedad de que sus ejes principales están orientados en la dirección de extensión máxima
de los datos.
4.1.2. El algoritmo de cuencas
Este procedimiento de segmentación fue originalmente desarrollado para su uso en
imágenes en tonos de gris [1, 12] y posteriormente se propuso una extensión para el caso de
imágenes a color [13], la cual se ha utilizado ampliamente en los últimos años. En esta técnica
se considera el caso más simple de una imagen de intensidad como una super�cie topográ�ca
en donde cada tono de gris es interpretado como una altitud; así, la idea del algoritmo puede
entenderse como un proceso de inundación o llenado de esta super�cie topográ�ca. Para re-
alizar las inundaciones, en cada mínimo del relieve se abre un hueco por donde puede �uir
agua. Cuando el agua ha �uido a través de los huecos y el nivel se ha incrementado a velocidad
constante, el relieve se convierte en un lago.
En una imagen digital los huecos o semillas para el proceso de llenado pueden deter-
minarse al calcular el mínimo del gradiente de la imagen. Comenzando con estas semillas se
establece una jerarquía para el crecimiento de las regiones basado en las diferencias entre los
valores de intensidad de la semilla y de los pixeles vecinos. Primeramente, todos los pixeles
vecinos de una semilla obtienen la misma etiqueta que ella si sus diferencias de intensidad
son cero. Después, todos los pixeles vecinos de una semilla obtienen la misma etiqueta si sus
diferencias de intensidad son 1. Entonces el nivel de diferencias se incrementa aún más y el
procedimiento se continúa hasta que todos los pixeles en la imagen hayan sido etiquetados.
Cuando este esquema se aplica a la segmentación de imágenes a color las semillas en la
imagen pueden ser determinadas al calcular los mínimos de los gradientes en los tres canales.
Además, la diferencia entre los valores de intensidad es reemplazada por una diferencia de
color entre dos pixeles. En diversas aplicaciones es necesario realizar un proceso previo de
�ltrado de la imagen original para evitar lo que se conoce como sobre-segmentación.
J. C. Valdiviezo INAOE 73
4.2. ESPACIOS DE COLOR
4.2. Espacios de color
De acuerdo a la teoría de colores triestímulo, el color de un objeto puede ser representado
utilizando tres componentes que resultan de utilizar tres �ltros de colores f(λ) con λ=630 nm
(rojo), 550 nm (verde), 420 nm (azul) sobre la radiancia de la luz L(λ). Las cantidades de rojo,
verde y azul necesarias para formar algún color particular se denominan valores triestímulos
denotados por X,Y, Z respectivamente. De esta manera, para cualquier longitud de onda en
el espectro visible, los valores triestímulos necesarios para producir el color correspondiente
a esa longitud de onda pueden ser obtenidos directamente de curvas o tablas que han sido
obtenidas a través de diferentes experimentos [18].
Un espacio de color es una representación utilizada para especi�car y visualizar los
colores de una forma estándar y generalmente aceptada. En estas representaciones se utilizan
tres ejes coordenados que describen la posición del color dentro del espacio. Existen diferentes
espacios de color que estan dirigidos tanto a dispositivos de cómputo (monitores e impresoras),
como para aplicaciones donde el objetivo es la manipulaciòn del color. Entre los espacios
más utilizados en el primer caso se pueden mencionar el RGB (red, green, blue) empleado en
monitores de color y cámaras de video, así como los sistemas CMY (cyan, magenta, yellow) y
CMYK (cyan, magenta, yellow, black) empleados en los sistemas de impresión. Por otra parte,
el modelo HSI (hue, saturation, intensity) permite describir e interpretar los colores de una
forma cercana a la forma en que los humanos percibimos el color. En las siguientes líneas se
describen cuatro sistemas de color que serán de utilidad para la comparación de los resultados.
El espacio de color RGB
En este modelo cada color aparece en sus componentes espectrales primarias de rojo
(red, R), verde (green, G) y azul (blue, B) y está basado en el sistema coordenado cartesiano en
donde el subespacio de interés es un cubo (ver �gura 4.1). Los valores R,G,B están localizados
en tres de las esquinas del cubo y los colores magenta, cian y amarillo están ubicados en las
otras tres esquinas. La escala de grises, comprendida desde el origen (negro) hasta la esquina
más alejada (blanco), se extiende a lo largo de la línea que une estos dos puntos. Los distintos
colores son puntos dentro o sobre el cubo y están de�nidos como vectores ∈ R3 que se extienden
J. C. Valdiviezo INAOE 74
4.2. ESPACIOS DE COLOR
desde el origen del sistema.
Figura 4.1: Representación del espacio de color RGB.
Las imágenes representadas en este sistema consisten en tres canales, una para cada
color primario. Si consideramos cada una de estas componentes como una imagen de 8 bits, el
número de bits utilizado para representar cada pixel de color será de 24 bits. El número total
de colores en una imagen RGB de 24 bits es, por tanto, (28)3 = 16, 777, 216 colores.
Modelo de color I1I2I3
El modelo de color I1I2I3 es una medida de decorrelación entre los canales RGB, cuyo
propósito es el de extraer las características más importantes del color [9]. Las ecuaciones de
transformación entre el espacio de color RGB y el modelo I1I2I3 son las siguientes:
I1 =R +G+B
3, I2 =
R−B
2, I3 =
2G−R−B
4. (4.4)
El espacio de color HSI
Es un sistema utilizado para representar los colores de manera análoga al que realiza el
sistema visual humano, es decir, por medio del tono, saturación e intensidad [8]. El tono (hue,
H) es el color mismo como descrito por su longitud de onda, la saturación (saturation, S) es
J. C. Valdiviezo INAOE 75
4.2. ESPACIOS DE COLOR
la cantidad de color que está presente (pureza relativa o cantidad de luz blanca mezclada con
el tono) y la intensidad (intensity, I) es la cantidad de luz. El espacio en el que estos valores
son gra�cados puede representarse por un cono o doble cono circular o hexagonal cuyo eje es
la progresión de escala de grises de negro a blanco, de acuerdo a como se ilustra en la �gura
4.2; la distancia desde el eje central es la saturación y la dirección del vector es el tono. Una
característica importante de este sistema es que separa la información del color de una manera
que corresponde a la respuesta del sistema visual humano; por ejemplo, el uso del tono para
el proceso de segmentación regularmente corresponde con el de la percepción humana.
Figura 4.2: Representación del espacio de color HSI.
Diversas técnicas de procesamiento de imágenes pueden presentar ventajas al utilizar el
sistema de color HSI, lo que implica realizar una conversión entre espacios de color. Dada una
imagen RGB, la trasformación al espacio HSI se realiza por medio de las siguientes expresiones:
I =1
3(R +G+B) ; S = 1− mın(R,G,B)
I, (4.5)
H = arctan
(2B −R−G√
6,R−G√
6
). (4.6)
J. C. Valdiviezo INAOE 76
4.2. ESPACIOS DE COLOR
El espacio de color L*a*b*
Un espacio geométricamente simple y que es fácil de tratar matemáticamente es el
modelo L*a*b* [19]. Este espacio es perceptualmente uniforme siendo L* la luminancia o el eje
de escala de grises, a* y b* son dos ejes ortogonales que juntos de�nen la saturación y el color.
El eje de lumiancia toma los valores entre 0 y 100 siendo 0 el negro ideal y 100 el blanco de
referencia. De acuerdo a como se muestra en la �gura 4.3, el eje a* reccorre desde el rojo (+a*)
al verde (-a*) y el eje b* desde el amarillo (+b*) al azul (-b*). Estos ejes ofrecen un compromiso
práctico entre la simplicidad de modelo RGB y los espacios que son más �siológicos como el
HSI, los cuales son utilizados en muchos sistemas que manejan color.
Figura 4.3: Representación del espacio de color L*a*b*, donde L* representa la luminancia o el eje de escala
de grises, mientras que a* y b* de�nen la saturación y el color.
A partir de las coordenadas triestímulos XY Z se puede construir el espacio L*a*b*,
por medio de las expresiones siguientes:
L∗ = 25(100Y/Y0)1/3 − 16, (4.7)
a∗ = 500[(X/X0)
1/3 − (Y/Y0)1/3
], (4.8)
b∗ = 200[(Y/Y0)
1/3 − (Z/Z0)1/3
]. (4.9)
J. C. Valdiviezo INAOE 77
4.3. SEGMENTACIÓN BASADA EN W Y M
donde X0, Y0, Z0 son las valores triestímulos para el blanco de referencia. Además, los valores
X,Y, Z puden ser producidos a partir de las coordenadas RGB por medio de una transformación
lineal. La matriz para el sistema de recepción NTSC se ha utilizado para este propósito y está
de�nida por X
Y
Z
=
0.607 0.174 0.200
0.299 0.587 0.114
0.000 0.066 1.116
R
G
B
(4.10)
4.3. Segmentación basada en W y M
Dada una imagen de color A de m×q pixeles el objetivo del algoritmo de segmentación
propuesto consiste en determinar los pixeles más saturados (con mayor pureza de color) que
permitan separar las mezclas de color presentes en la imagen. Para ello, primeramente se
construye el conjunto X que contiene todos los colores distintos presentes en A, también
considerados vectores 3-D. El siguiente paso consiste en calcular las memorias min-WXX y
max -MXX usando respectivamente las ecs. (3.16) y (3.17), a partir del conjunto X. Para
el caso de imágenes a color las memorias matriciales calculadas son de tamaño 3 × 3, es
decir, W = (w1,w2,w3) y M = (m1,m2,m3). Como se mencionó en el capítulo anterior, de
acuerdo a la forma en que se construyen las memorias reticulares sus vectores columna no
necesariamente pertenecen al espacio de color de la imagen, por lo que se necesita realizar el
escalamiento expresado en la ec. (3.19). Las columnas escaladas de cada una de las matrices
W y M deben satisfacer la propiedad de independencia afín, la cual se puede veri�car de
manera sencilla en base al Teorema 3.5; en particular, para veri�car la independencia afín
de los vectores de W o M ninguna columna debe ser igual o un múltiplo de las dos restantes.
El siguiente paso en el proceso de segmentación consiste en utilizar los conjuntos
W = {w1,w2,w3} y M = {m1,m2,m3} para determinar diversos tetraedros que encierren
subconjuntos deX. Recuérdese que en el espacio de tres dimensiones un simplex corresponderá
a un tetraedro. De esta manera, si los vectores pixel de una imagen a color están encerrados
por algún tetraedro, cuya base esté formada por sus colores más saturados, entonces es posible
hacer una estimación de las fracciones en las cuales éstos aparecen en cualquier otro pixel de
J. C. Valdiviezo INAOE 78
4.4. EJEMPLOS DE SEGMENTACIÓN
la imagen. Un modelo que se puede utilizar para este análisis es el modelo de mezclado lineal
con restricciones en el cual cada vector de color se representa como una combinación lineal
de los colores más saturados en distintas proporciones; en efecto, a partir de las ecs. (3.9) y
(3.10) para i = 1, 2, 3 y haciendo r = 0 se tiene
x = Sa = a1s1 + a2s
2 + a3s3 , sujeto a (4.11)
a1, a2, a3 ≥ 0,
a1 + a2 + a3 = 1,
donde x es un vector pixel de la imagen, S = (s1, s2, s3) es una matriz cuadrada de 3×3 cuyas
columnas son los colores más saturados, y a es el vector de 3 × 1 que contiene las fracciones
de colores saturados presentes en x. Es importante mencionar que el conjunto de colores más
saturados de una imagen puede ser igual al conjunto de colores primarios (rojo, verde, azul)
o al conjunto de colores complementarios (magenta, cian, amarillo).
La geometría de W y M permite determinar los vértices de un tetraedro que encierra
a los pixeles en la imagen a partir de sus columnas escaladas; dichos vértices corresponden
a los colores más saturados de la imagen. Por lo tanto, el paso siguiente en el procedimiento
consiste en resolver la ecuación (4.11) haciendo S = W o S = M para determinar el vector
a para cada x ∈ X, proceso conocido como separación lineal. Una vez que la ec.(4.11) se ha
resuelto para cada pixel de color x, los valores de los vectores a son desplegados como una
imagen de fracciones de color saturados para s1, s2, s3. El paso �nal consiste en realizar una
umbralización entre 0 y 1 para obtener una segmentación de la imagen de color.
4.4. Ejemplos de segmentación
En las siguientes líneas se presenta un ejemplo que ilustra el funcionamiento del método
de segmentación propuesto, también conocido como método W M . Posteriormente se presen-
tan los resultados de segmentación obtenidos para un conjunto de imágenes en color RGB de
dominio público, así como un conjunto de imágenes representadas en otros espacios de color.
Ejemplo 4.1 En la parte superior izquierda de la �gura 4.4 se presenta una imagen RGB de
J. C. Valdiviezo INAOE 79
4.4. EJEMPLOS DE SEGMENTACIÓN
tamaño 256 × 256 que corresponde a los colores primarios en el modelo aditivo de color. De
acuerdo con el procedimiento descrito, el conjunto X se ha generado con todos los diferentes
colores presentes en la imagen. El número de vectores en la imagen es de 65,536 y el conjunto
X = {x1, . . . ,x8}. Utilizando X como el conjunto de entrada se han calculado las MAARs, así
como los vectores cota máxima y mínima usados para obtener las matrices escaladas W y M ,
los cuales están dados por
W =
255 0 0
0 255 0
0 0 255
, u
255
255
255
; M =
0 255 255
255 0 255
255 255 0
, v =
0
0
0
.
Figura 4.4: Primera �la, izquierda a derecha: imagen en color RGB utilizada en el Ejemplo 4.1, imágenes en
tonos de gris de las fracciones de color determinadas a partir de las columnas de W . Segunda �la: fracciones
de color determinadas a partir de las columnas de M . La correspondencia entre el nivel de gris asignado y el
valor numérico es el siguiente: 1 = blanco, 0.5 = gris medio, 0.33 = gris oscuro y 0 = negro.
Para determinar el vector de fracciones de color a para cada pixel en la imagen, un
simple análisis algebráico permite invertir la ecuación (4.11) haciendo primero S = W y luego
S = M . Así, es posible obtener una solución analítica para los vectores que conforman la
imagen; en efecto,
J. C. Valdiviezo INAOE 80
4.4. EJEMPLOS DE SEGMENTACIÓN
W−1
= 1255
1 1 1
1 1 1
1 1 1
; M−1
=1
510
−1 1 1
1 −1 1
1 1 −1
.
En el caso de W−1
= I/(255), siendo I la matriz identidad, se tiene que ai = xi/255
satisface la desigualdad 0 ≤ ai ≤ 1 para todo i = 1, 2, 3 dado que los vectores {x1, . . .x8} se en-cuentran en el intervalo [0,255]. La aditividad completa se satisface si
∑3i=1 ai =
∑3i=1 xi/255 =
1, por lo que los valores de los pixeles de colores residen en el plano x1 + x2 + x3 = 255 lo
cual sólo ocurre en los puntos (255,0,0), (0,255,0) y (0,0,255). Haciendo g = x1 + x2 + x3 se
puede especi�car un criterio que permita determinar las fracciones de color y que satisfaga
la condición anterior; es decir, ai = xi/g si g = 0, de otra forma ai = 0. De manera similar,
para M−1
se tiene que ai =∑
j =i(xj − xi)/510 para i = 1, 2, 3. Sin embargo, puesto que xξi
con ξ = {1, . . . , 8} está en el intervalo [0,255] entonces ai ∈ {−0,5, 0, 0,5, 1} lo que implica
que la positividad no se satisface para todo i. Además, la aditividad completa se satisface si∑3i=1(
∑j =i xj − xi)/510 = 1 indicando que los valores de los pixeles de colores están en el
plano x1 + x2 + x3 = 510, lo cual sucede en los puntos (0,255,255), (255,0,255) y (255,255,0).
Por lo tanto, haciendo g = x1+x2+x3 las fracciones de color que se obtienen con la memoria
M están dadas por ai = (∑
j =i xj − xi)/g si g = 0, de otra forma si g = 0, entonces ai = 0.
Por último para el caso ai = −1 es necesario hacer ai = 0 y entonces aj será igual a aj/2 para
j = i.
Los resultados del procedimiento antes descrito se han desplegado en la �gura 4.4. En
la primera �la se presentan las fracciones de color obtenidas con W que corresponden a la
segmentación de las porciones rojo, verde y azul de la �gura; por su parte en la segunda �la
se presentan las fracciones obtenidas con M que corresponden a las porciones cian, magenta
y amarillo, respectivamente. Cada imagen segmentada ha sido escalada linealmente al rango
[0,255] para su visualización.
Ejemplo 4.2 En la parte superior de la �gura 4.5 se presentan tres imágenes RGB de tamaño
256 × 256 pixeles que se han utlizado para demostrar la funcionalidad del método propuesto.
J. C. Valdiviezo INAOE 81
4.4. EJEMPLOS DE SEGMENTACIÓN
La Tabla 4.1 presenta información de las caracterísiticas propias de cada imagen.
Tabla 4.1: Información de las imágenes en color RGB utilizadas en el Ejemplo 4.2
Imagen Pixeles (mq) Colores (κ) Matrices
Mandril 65,536 63,106 Wα,Mα
Flores 65,536 40,805 W β,Mβ
Mariposa 65,536 53,298 W γ,Mγ
Las entradas numéricas de las versiones escaladas de las MAARs calculadas a partir de las
imágenes ejemplares están dadas explícitamente por:
W α =
255 129 72
55 255 156
0 90 255
; Mα =
0 200 255
126 0 165
183 99 0
,
W β =
255 224 167
207 255 145
95 129 255
; Mβ =
0 48 160
31 0 126
88 110 0
,
W γ =
255 249 243
90 255 166
61 118 247
; Mγ =
16 165 194
22 0 137
20 81 0
.
Para las imágenes anteriores se han utilizado independientemente W ℓ y M ℓ como la
matriz S, con ℓ = α, β, γ y se ha utilizado el algoritmo numérico del NNLS para estimar
las fracciones de color en los vectores de cada imagen. Además, las memorias matriciales
calculadas son de rango completo y, por lo tanto, las soluciones determinadas por el proceso
de separación lineal son únicas. Obsérvese que los vectores v y u (subrayados en las matrices
anteriores) corresponden respectivamente, a un color negro y un color cercano al blanco; es
posible entonces reemplazar alguna columna de W o M con uno de estos puntos extremos
para obtener una segmentación de las regiones brillantes u oscuras.
J. C. Valdiviezo INAOE 82
4.4. EJEMPLOS DE SEGMENTACIÓN
Figura 4.5: Fila superior: imágenes de color ejemplares; segunda a cuarta �las: imágenes en tonos de gris
representando las fracciones de los colores saturados seleccionados a partir de W y M .
Por otra parte, los vectores de fracciones de color satisfacen las desigualdades 0 ≤ a ≤ 1,
por lo que es posible mapear linealmente el subintervalo de�nido por [0, µ] ⊆ [0, 1] al rango
dinámico [0,255], donde µ = ∨kξ=1a
ξj . La �gura 4.5 presenta los resultados de segmentación
obtenidos para las �guras ejemplares a partir de las columnas de W y M . En estas �guras
los resultados se han desplegado en todos de gris donde los grises brillantes indican fracciones
de color cercanas a 1, mientras que los grises oscuros indican fracciones de color cercanas a 0.
La parte izquierda de la �gura 4.6 presenta una grá�ca 3-D de la distribución de los vectores
de la imagen del �mandril�. En las partes central y derecha se muestran cuatro tetraedros
que encierran distintos subconjuntos de X y que se obtienen al formar respectivamente los
conjuntos W ∪ {v} y W ∪ {u} (centro) o M ∪ {v} y M ∪ {u} (derecha).
Por último, si se require segmentar el color original de la imagen en cuestión, entonces
puede aplicarse un valor de umbral τ ∈ (0.3, 1) a la imagen de fracciones de color para
J. C. Valdiviezo INAOE 83
4.5. COMPARACIÓN DE RESULTADOS
Tabla 4.2: Datos de la segmentación de colores en las imágenes ejemplares
Imagen Vectores (Umbral)
Mandril w1α (0.78), m1
α (0.92), m3α (0.67)
Flores m2β (0.62), w1
β (0.51), w2β (0.30)
Mariposa m3γ (0.62), m2
γ (0.52), uγ (0.34)
Figura 4.6: Izquierda: distribución en el espacio de los diferentes vectores de color en la imagen del mandril de
la �g. 4.5. Centro y derecha: diferentes tetraedros determinados por W = {w1,w2,w3} y M = {m1,m2,m3}que encierran diferentes subconjuntos de X.
binarizarla y después hacer un enmascaramiento de la imagen de color original con la imagen
binarizada; la �gura 4.7 muestra los resultados del proceso de enmascaramiento para separar
los distintos colores presentes en las imágenes ejemplares. La Tabla 4.2 despliega los vectores
columna (pixeles de color saturados) seleccionados a partir de ℓ = α, β, γ junto con los valores
de umbral utilizados para realizar la segmentación de los colores de la imagen. Los resultados
de segmentación discutidos, así como una comparación con el método de distancias han sido
reportados en [22].
4.5. Comparación de resultados
Parte fundamental en el desarrollo de una nueva técnica de segmentación consiste
en evaluar los resultados respecto a otras técnicas reportadas en la literatura; lo anterior
J. C. Valdiviezo INAOE 84
4.5. COMPARACIÓN DE RESULTADOS
Figura 4.7: Fila superior: imágenes de color ejemplares; segunda a cuarta �las: imágenes de colores segmen-
tados para las �guras ejemplares (resultado de umbralización y enmascaramiento).
permitirá conocer el desempeño del método y determinar el tipo de imágenes en el que éste
puede ser utilizado. Además, algunas técnicas de segmentación presentan mejores resultados
en un determinado espacio de color, por tal motivo es necesario conocer si existen mejoras
en los resultados cuando se realizan transformaciones de la imagen original a otros espacios.
En esta sección se presentan los resultados de evaluar el desempeño del método basado en
W y M utilizando imágenes en color RGB y su transformación a los tres espacios de color
introducidos en las secciones anteriores. Más adelante se realiza una comparación cuantitativa
de estos resultados de segmentación en relación a los obtenidos con dos técnicas conocidas: la
técnica por agrupamiento basada en la distancia de Mahalanobis y el algoritmo de cuencas.
En la primera �la de la �gura 4.8 se presentan la imagen RGB de los �pimientos� y su
transformación a los espacios I1I2I3, HSI y L*a*b* que se han desplegado como imágenes en fal-
so color RGB. En la segunda �la se presentan las imágenes conformadas por las segmentaciones
J. C. Valdiviezo INAOE 85
4.5. COMPARACIÓN DE RESULTADOS
de los pimientos rojos y verdes y las porciones de luz re�ejada para los respectivos espacios
de color. Para formar cada una de las imágenes compuestas se ha realizado el procedimiento
siguiente. Primero, se han calculado W e independientemente M en base a la imagen en el
correspondiente espacio de color y para cada vector columna se han determinado las fracciones
de color por medio de la estimación NNLS. Después, se han seleccionado los mapas que pre-
sentan los mejores resultados en la distribución del color, a partir del conjunto {W ∪M}. Alos mapas seleccionados se les ha asignado un determinado tono de gris y se han combinado
para formar una imagen compuesta. La tabla 4.3 presenta los vectores correspondientes y um-
brales utilizados para producir dichas imágenes. Al observar detenidamente estos resultados se
puede concluir que la técnica propuesta presenta una mejor segmentación cuando se utilizan
los espacios I1I2I3 y RGB.
Tabla 4.3: Datos de segmentación utilizados para los diferentes espacios de color
Espacio de color Vector(umbral)
RGB w1(0.45), w2(0.36), m1(1.56)
I1I2I3 m3(0.39), w3(0.38), w1(0.34)
HSI w1(0.54), m1(0.16), w3(0.51)
L*a*b* w2(0.29), m2(0.53), w1(0.81)
La primera �la de la �gura 4.9, columnas 1 y 2, presenta los resultados de segmentación
producidos con el método WM en los espacios RGB e I1I2I3, respectivamente. En las columnas
3 y 4 de la misma �la se presentan los resultados obtenidos por medio de la distancia de
Mahalanobis y el algoritmo de cuencas. En la última columna se presenta la versión en tonos
de gris NTSC de la imagen de color original, que ha sido cuantizada a 16 niveles de gris.
Asimismo, en la segunda �la de la �gura se han presentado las imágenes de bordes resultado
de aplicar �ltros de Sobel a cada una de las imágenes de la primera �la. Es importante destacar
que la imagen de bordes producida para la versión en tonos de gris de la imagen original será
utilizada como referencia en el proceso de comparación.
Las imágenes de bordes producidas a partir de las segmentaciones antes descritas nos
J. C. Valdiviezo INAOE 86
4.5. COMPARACIÓN DE RESULTADOS
Figura 4.8: Primera �la: imagen de color en los espacios RGB, I1I2I3, HSI y L*a*b*, respectivamente; segunda
�la: imágenes conformadas por las segmentaciones de los pimientos rojos y verdes y las porciones de luz re�ejada
producidas por W y M para cada espacio de color.
permiten delimitar las regiones segmentadas por cada uno de los algoritmos. Estas regiones
pueden ser comparadas respecto de la imagen de bordes de la versión NTSC tomando en
cuenta los siguientes criterios: perímetro y área de las regiones, razón señal a ruido, coe�ciente
de correlación, entre otros [3]. Para la comparación que se presenta a continuación hemos
elegido como métricas el coe�ciente de correlación, φ, y la razón señal a ruido, SNR, los cuales
se de�nen en lo siguiente.
De�nición 4.3 Sean X e Y dos imágenes con mq = k elementos, sus vectores medios se
denotan respectivamente por zx y zy; se de�ne el coe�ciente de correlación φ como el índice
que mide la relación lineal entre estas dos variables, el cual está expresado como sigue
φ =CXY√σXσY
=
∑ki=1(xi − zx)(yi − zy)√∑k
i=1(xi − zx)2 ·∑k
i=1(yi − zy)2, (4.12)
donde CXY es la matriz de covarianza de X, Y y σX , σY son respectivamente las desviaciones
estándar de las distribuciones [7]. Los valores de φ están en el intervalo [-1,1], cuando φ = 1
existe una correlación positiva perfecta entre las dos imágenes; si φ = 0 no hay correlación y
si φ = −1 existe una correlación negativa total lo que implica una relación inversa entre las
dos imágenes.
J. C. Valdiviezo INAOE 87
4.5. COMPARACIÓN DE RESULTADOS
Figura 4.9: Primera �la, de izquierda a derecha: resultados se segmentación obtenidos, respectivamente,
con W y M en los espacios RGB y I1I2I3, distancia de Mahalanobis y algoritmo de cuencas e imagen de los
�pimientos� cuantizada a 16 niveles de gris; segunda �la: imágenes de bordes producidos por �ltros de Sobel
para las imágenes de la primera �la.
De�nición 4.4 Sean X una imagen de referencia y Y una imagen modi�cada, la razón señal
a ruido (signal to noise ratio, SNR) se de�ne como la razón entre la varianza de la imagen
original σ2X y la varianza de la diferencia de imágenes, matemáticamente,
SNR = 10 log10
(σ2X
σ2d
). (4.13)
donde σ2X representa la varianza de la imagen original y σ2
d es la varianza de la diferencia de
las imágenes original y modi�cada [11].
Los resultados de comparar las imágenes de bordes de la �gura 4.9 respecto de la imagen
de referencia (imagen de bordes de la versión NTSC) se presentan en la tabla 4.4. Se puede
notar que los mejores resultados de segmentación se han producido con el método basado en
W y M en el espacio de color I1I2I3 cuyos valores de correlación y SNR están por encima de
los otros métodos.
Finalmente, para el caso de imágenes de tres canales en el que el modelo MLR se
transforma en la ec. (4.11), dado que x ∈ R3 y p = 3, una solución alternativa para la
determinación de las abundancias de los colores saturados se puede realizar por medio de la
J. C. Valdiviezo INAOE 88
4.5. COMPARACIÓN DE RESULTADOS
Tabla 4.4: Comparación del desempeño de los algoritmos de segmentación.
Método de segmentación φ SNR
WM en RGB 0.707 14.179
WM en I1I2I3 0.717 14.931
WM en HSI 0.708 14.124
WM en L*a*b* 0.675 14.006
Distancia de Mahalanobis 0.632 12.917
Algoritmo de cuencas 0.594 9.814
inversión de matriz generalizada que refuerce la aditividad y además umbralice todos aquellos
valores negativos [24]. De esta forma, cualquier aq = 1−ag−ah con q = 1, 2, 3 y q = g < h = q
puede ser seleccionado para reducir el tamaño de la matriz S y el vector a. Por tanto, para
determinar las fracciones de colores saturados se debe resolver para cada pixel de color el
sistema xq = Sqaq, donde aq = (ag, ah)T , Sq = W q o Sq = M q. Las �la i-ésimas y las entradas
respectivas para i = 1, . . . , 3 están dadas por
Sq = (sig − siq, sih − siq) ; xq = (xi − siq). (4.14)
Cualquier valor negativo que resulte de esta inversión debe ser umbralizado al valor de cero
para satisfacer la condición de positividad. La solución expresada en la ec. (4.14), con q = 1,
ha sido empleada para realizar la determinación de las fracciones de colores saturados para el
conjunto de imágenes naturales de dominio público que se presentan en la �gura 4.10. En cada
�la, la imagen original en color RGB se despliega a la izquierda y de izquierda a derecha se
presentan las imágenes compuestas producidas por la segmentación del método W M en los
espacios RGB, I1I2I3, HSI y L*a*b*, respectivamente. Por ejemplo, la imagen en tonos de gris
correspondiente al �oso� en el espacio I1I2I3 fue generada mediante la composición de los mapas
de fracciones obtenidos por w2 y m2 después de la umbralización en τ =0.387 y τ =0.326,
respectivamente. En base a estos resultados se puede notar que el algoritmo de segmentación
basado en W y M presenta mejores resultados en el espacio de color I1I2I3.
J. C. Valdiviezo INAOE 89
4.5. COMPARACIÓN DE RESULTADOS
Figura 4.10: Primera columna: imágenes en color RGB; segunda a quinta columnas: imágenes conformadas
por las segmentaciones producidas por W y M en los espacios RGB, I1I2I3, HSI y L*a*b*, respectivamente.
Las principales regiones de interès se han cuantizado.
J. C. Valdiviezo INAOE 90
4.6. CONCLUSIONES
4.6. Conclusiones
En este capítulo se ha presentado un método de segmentación para imágenes en color
basado en las memorias autoasociativas reticualres W y M . Los vectores columna de ambas
memorias de�nen los pixeles de color más saturados en una imagen en color. En base al modelo
MLR, estos pixeles saturados permiten determinar las fracciones de color en cualquier otro pixel
de la imagen. Diversos ejemplos han ilustrado la aplicación de este método en imágenes RGB,
así como a imágenes transformadas a los espacios de color I1I2I3, HSI y L*a*b*. Los resultados
de comparar el método W y M con otras técnicas de segmentación proporcionan detalles en
la efectividad de los resultados obtenidos. En efecto, el método aquí presentado puede ser
clasi�cada como una técnica de agrupamiento de pixeles no supervisada.
J. C. Valdiviezo INAOE 91
Bibliografía
[1] Beucher S., �The watershed transform applied to image segmentation,� Scanning Mi-
croscopy International, Vol. 6, pp. 299�314, 1992.
[2] Celenk M., Uijt de Haag M., �Optimal thresholding for color images,� SPIE Proc.: Non-
linear Image Processing IX, Vol. 3304, San Jose, CA, pp. 250�259, 1998.
[3] Chalana V., Kim Y., �A methodology for evaluation of boundary detection algorithms on
medical images,� IEEE Trans. on Medical Imaging, Vol. 16, No. 5, pp. 642�652, 1997.
[4] Cheng H.D., Jain X.H., Sun Y., Wang J., �Color image segmentation: advances and
prospects,� Pattern Recognition, Vol. 34, No. 12, pp. 2259�2281, 2001.
[5] Crespo J., Schafer R.W., �The �at zone approach and color images.� In: Mathematical
morphology and its applications to image processing, J. Serra and P. Soille eds., Dordrecht,
The Netherlands: Kluwer Academic, pp. 85�92, 1994.
[6] Géraud T., Strub P-Y., Darbon J., �Color image segmentation based on automatic mor-
phological clustering,� IEEE Proc.: Inter. Conf. on Image Processing, Vol. 3, Thessaloniki,
Greece, pp. 70�73, 2001.
[7] Gonzalez R.C., Woods R.E., Digital Image Processing, 3rd edition, Pearson Education,
2008.
[8] Koschan A., Abidi M., Digital color image processing, Hoboken, NJ: John Wiley & Sons,
chap. 7, pp. 149�174, 2008
92
BIBLIOGRAFÍA
[9] Liu J., Yang Y.H., �Multiresolution color image segmentation,� IEEE Trans. on Pattern
Analysis and Machine Intelligence, Vol. 16, No. 7, pp. 689�700, 1994.
[10] Lucchese L., Mitra S.K., �Color image segmentation: A-state-of-the-art-survey,� Proc.
Indian Nat. Sci. Acad. (INSA-A), Vol. 67, No. 2, pp. 207�221, 2001.
[11] MacDonald L.W., Ronnier-Luo M., Colour Image Science: exploiting digital media, Eng-
land: John Wiley & Sons, pp. 378�380, 2002.
[12] Meyer F. and Beucher S., �Morphological segmentation,�� Journal of Visual Communi-
cation and Image Representation, Vol. 1, No. 1, pp. 21�46, 1990.
[13] Meyer F., �Color image segmentation,� IEEE Proc.: 4th Inter. Conf. on Image Processing
and its Applications, pp. 303�306, 1992.
[14] Palus H., �Color image segmentation: selected techniques.� In: Color image processing:
methods and applications, R. Lukac, K.N. Plataniotis eds., Boca Raton, FL: CRC Press,
chap. 5, pp. 103�128, 2006.
[15] Panjwani D.K., Healey G., �Unsupervised segmentation of textured colour images using
Markov random �eld models,� Proc. CVPR'93, New York, USA, pp. 776�777, 1993.
[16] Park S.H., Yun I.D., Lee S.U., �Color image segmentation based on 3-D clustering: mor-
phological approach,� Pattern Recognition, Vol. 31, No. 8, pp. 1061�1076, 1998.
[17] Plataniotis K.N., Venetsanopoulos A.N., Color image processing and applications, Berlin,
Germany: Springer, chap. 6, pp. 237�273, 2000.
[18] Poynton C.A., A technical introduction to digital video, NJ: John Wiley & Sons, 1996.
[19] Shafarenko L., Petrou H., Kittler J., �Histogram-based segmentation in a perceptually
uniform color space,� IEEE Trans. on image processing, Vol. 7, No. 9, pp. 1354�1358,
1998.
[20] Skarbek W., Koschan A., Colour image segmentation: a survey, Technical Report 94-32,
Technical University of Berlin, pp. 1�81, 1994.
J. C. Valdiviezo INAOE 93
BIBLIOGRAFÍA
[21] Sowmya B., Sheelanari B., �Color image segmentation using soft computing techniques,�
Int. Journal of Soft Computing Applications, Vol. 4, pp. 69�80, 2009.
[22] Urcid G. and Valdiviezo-N J.C., �Color image segmentation based on lattice autoassocia-
tive memories,� IASTED Proc.: 13th Arti�cial Intelligence and Soft Computing, Vol. 683,
Palma de Mallorca, Spain, pp. 166�173, 2009.
[23] Urcid G., Valdiviezo-N J.C., Ritter G.X., �Lattice associative memories for segmenting
color images in di�erent color spaces,� LNCS Proc.: Hybrid Arti�cial Intelligence Systems,
Springer, Vol. 6077/2010, pp. 359�366, 2010.
[24] Urcid G., Valdiviezo-N J.C., Ritter G.X., �Lattice algebra approach to color image seg-
mentation,� Journal of Mathematical Imaging and Vision, doi 10.1007/s10851-011-0302-2,
2011.
J. C. Valdiviezo INAOE 94
Capítulo 5
Análisis de Imágenes Multiespectrales
En este capítulo se realiza el análisis de un conjunto de imágenes multiespectrales usando
el método W M que se introdujo en el capítulo anterior. En primer lugar se explicará el
proceso para el registro de una escena multiespectral en el laboratorio. Después se describirá
la aplicación del método mencionado para el análisis de datos multiespectrales. Finalmente
se presenta una aplicación en la recuperación de la escritura original en el palimpsesto de
Arquímedes. El capitulo se concluye con una comparación de resultados entre el método que
aquí se presenta y dos métricas conocidas.
5.1. Imágenes multiespectrales de documentos antiguos
En años recientes el análisis de palimpsestos y otros documentos antiguos ha tenido
gran interés debido a la cantidad de información que es posible obtener mediante el registro
de imágenes en distintas porciones del espectro electromagnético. Muchos de los textos an-
tiguos que aún se conservan han sufrido daños severos durante el transcurso de varios siglos,
impidiendo que el escrito pueda ser interpretado correctamente. Investigaciones recientes se
han orientado al análisis y recuperación del contenido original aún presente en ellos mediante
técnicas de imagen. El fundamento físico de las técnicas de imagen está basado en el hecho
de que la re�ectancia de los materiales utilizados para la elaboración del documento varía
con la longitud de onda. Un estudio importante acerca de las propiedades ópticas de películas
95
5.1. IMÁGENES MULTIESPECTRALES DE DOCUMENTOS ANTIGUOS
delgadas de pinturas fue realizado por Van Asperen de Boer quien descubrió que, alrededor
de 2 µm, se puede lograr máxima penetración en la mayoría de las pinturas [17]. Sin embargo,
a longitudes de onda cercanas a los 2 µm, materiales comunes como la tinta de hierro-hiel y
la sepia se vuelven invisibles [5]. Lo anterior sugiere que el registro de imágenes espectrales en
la porción infrarroja puede ser utilizada para visualizar dibujos y textos originales sobre los
cuales se superpusieron nuevas �guras.
Los instrumentos multiespectrales, que fueron utilizados primeramente para registrar
imágenes de la super�ce terrestre, han sido empleados en la actualidad para el análisis, con-
servación y digitalización de objetos de arte y documentos con valor histórico. La re�ectancia
espectral derivada en base a este registro múltiple permite identi�car y clasi�car los elementos
presentes en la escena. De esta manera, el uso de instrumentos multiespectrales en conjunto
con las técnicas digitales de análisis de imagen han permitido el rescate de textos antiguos
y la preservación de una parte del patrimonio cultural. Uno de los primeros trabajos en el
que se utilizó un instrumento multiespectral para analizar la pintura denominada Santísima
Trinidad Predella se presenta en [2]. Las imágenes registradas en las porciones visible e infrar-
rojo cercano fueron procesadas con el objetivo de identi�car los materiales y mejorar las partes
oscuras de la pintura. Más adelante, se realizó la caracterización de las tinturas orgánicas y
minerales en una pintura del siglo XVI atribuída a la escuela de Pieter Brueguel el Elder [11].
Las imágenes captadas fueron analizadas utilizando la técnica de agrupamiento denominada
medias-c difusas. Por otro lado, el registro de imágenes multiespectrales ha dado lugar a nove-
dosas aplicaciones en el estudio de pinturas en murales. En particular, Ware et al analizaron
pigmentos mayas con coloración similar pero diferente composición química provenientes de la
caverna Naj Tunich en Guatemala [18]. Con el análisis de los datos utilizando técnicas de agru-
pamiento se logró diferenciar entre las pinturas originales y aquellas que fueron posteriormente
sobrepuestas.
Existen aplicaciones más especializadas en las que se requiere recuperar los textos
e imágenes originales en documentos históricos. En este contexto, el uso de instrumentos
multiespectrales fue primeramente empleado para visualizar e interpretar la escritura en las
partes dañadas de los Rollos del Mar Muerto [3, 9]. Además, en el caso de los denominados
J. C. Valdiviezo INAOE 96
5.2. REGISTRO MULTIESPECTRAL DE UNA ESCENA
palimpsestos, que son libros escritos en un periodo histórico determinado y cuyo texto original
fue borrado para sobre escribir en ellos un texto religioso, se ha podido rescatar exitosamente
gran parte del texto original. Uno de los estudios más importantes ha sido impulsado por el
proyecto Arquímedes [1, 8]. Aunque el registro multiespectral de los folios que conforman el
documento en las porciones ultravioleta, visible e infrarroja, en combinación con técnicas de
análisis de imagen han ayudado en el rescate de gran parte de los tratados del matemático
griego, existen partes del texto que no han podido ser rescatadas debido a la presencia de
moho [8].
Nuevas aplicaciones en el contexto de análisis multiespectral de palimpsestos han si-
do desarrolladas para el proyecto europeo denominado Renascimento Virtuale [15]. De esta
manera, diferentes instrumentos multiespectrales se han utilizado para interpretar escritos que
hasta entonces habían sido imposibles de leer. Aunque las técnicas de análisis multiespectral
han demostrado un gran potencial para este propósito, existen problemas relacionados con el
análisis de los datos que no han podido ser resueltos. Uno de estos problemas surge cuando los
tipos de escritura presentan curvas espectrales similares, lo que hace difícil su diferenciación.
En efecto, diversos algoritmos como el análisis de componentes principales o técnicas basadas
en agrupamiento, tales como medias-K o medias-C difusas, siguen siendo evaluadas con el
propósito de lograr una mejor diferenciación y mejoramiento de los textos originales.
5.2. Registro multiespectral de una escena
Existen diversas técnicas que pueden ser utilizadas para registrar una escena multi-
espectral en el laboratorio, las cuales se pueden clasi�car principalmente en dos clases: (1)
técnicas que usan �ltros, (2) técnicas que utilizan distintas fuentes de luz. En el primer ca-
so, el registro está basado en el uso de �ltros de banda angosta para muestrear la escena en
bandas espectrales a lo largo del espectro electromagnético. De esta manera, el proceso para
la adquisición del conjunto de imágenes es el siguiente. Una fuente de luz de amplio espec-
tro, que puede ser una lámpara de tungsteno, ilumina la muestra; la energía que es re�ejada
por la muestra se hace pasar a través de un �ltro de banda angosta (�ltro variable o �ltro
J. C. Valdiviezo INAOE 97
5.2. REGISTRO MULTIESPECTRAL DE UNA ESCENA
Fuentede luz
CCD
filtros
Figura 5.1: Registro multiespectral de un documento antiguo usando un arreglo de �ltros.
interferométrico), colocado en la entrada de un detector, que puede ser una cámara CCD, el
cual registra la imagen. Este procedimiento se repite para cada uno de los �ltros que permiten
muestrear el intervalo de longitudes de onda de interés. Por otra parte, en el segundo caso la
idea fundamental consiste en el uso de diversas fuentes de luz espectralmente angostas para
capturar imágenes de la misma escena en distintas bandas espectrales. De esta forma, los ele-
mentos que conforman el arreglo experimental son: una fuente de luz variable o un conjunto
de fuentes espectralmente angostas para iluminar la muestra y un elemento detector, tal como
una cámara CCD. En la �gura 5.1 se muestra el arreglo utilizado para registrar la imagen
multiespectral de un documento antiguo usando un arreglo de �ltros.
En efecto, con cualquiera de las dos técnicas la idea es submuestrear el espectro de
longitudes de onda de interés (visible o infrarrojo cercano) utilizando elementos ópticos o
fuentes de luz que limiten el registro de las imágenes en determinadas bandas relativamente
angostas. Una vez que se ha realizado el registro multiespectral de la escena es necesario
modelar los factores que intervienen en la adquisición con el propósito de derivar la re�ectancia
espectral de los materiales que la conforman. En las siguientes líneas se hará mención de
algunas de estas técnicas.
J. C. Valdiviezo INAOE 98
5.2. REGISTRO MULTIESPECTRAL DE UNA ESCENA
5.2.1. Técnicas de estimación de la re�ectancia espectral
Para un sistema de captura de imágenes multiespectrales que consta de una cámara
CCD monocromática, un conjunto m de �ltros ópticos y una fuente de luz de banda ancha, la
respuesta de la cámara ci que se obtiene con el i-ésimo �ltro (para i = 1, . . . ,m), asumiendo
iluminación de luz colimada a lo largo de la imagen, está dada por,
ci =
∫ λmax
λmın
o(λ)r(λ)dλ+ ni, (5.1)
donde o(λ) = fi(λ)E(λ) representa el producto de la sensibilidad espectral de la cámara para
el i-ésimo �ltro fi(λ) por la distribución espectral de la fuente de iluminación E(λ), r(λ)
es la re�ectancia espectral del objeto y ni es el ruido adherido en la i-ésima imagen [12].
Una solución a esta ecuación se puede conseguir utilizando técnicas de estimación discretas;
para ello, es necesario tomar K muestras de oi(λ) y r(λ) que permitan discretizar la integral
continua y expresarla en forma vectorial de la siguiente manera
ci = oTi r+ ni, (5.2)
donde oi y r son vectores de dimensión K × 1, respectivamente, y oTi = fTi E, es el producto
de fTi , el vector transpuesto de la sensibilidad espectral del i-ésimo �ltro por E, la matriz
diagonal de la distribución espectral de la iluminación. Además, la respuesta de la cámara ci
se puede representar como un vector de m× 1, tal que
c = Or+ n, (5.3)
donde oTi ocupa la i-ésima �la de la matriz O. Por tanto, una primera estimación r de la
re�ectancia espectral puede obtenerse a partir de la inversa generalizada asumiendo la ausencia
de ruido; ésto es,
r = O+c = OT (OOT )−1c. (5.4)
La inversa generalizada proporciona un error cuadrático medio mínimo, sin embargo, dicho
cálculo puede conducir a estimaciones oscilatorias. Una alternativa para evitar este problema
consiste en imponer algunas condiciones de suavizamiento sobre la solución. El uso de una
J. C. Valdiviezo INAOE 99
5.2. REGISTRO MULTIESPECTRAL DE UNA ESCENA
matriz de suavizamiento permite obtener una estimación suavizada, la cual está dada por [12],
r = M−1OT (OM−1OT )−1c; (5.5)
La matriz de suavizamiento M se de�ne como:
M =
1 −2 1 0 0 0 . . . 0
−2 5 −4 1 0 0 . . . 0
1 −4 6 −4 1 0 0
0 1 −4 6 −4 1 0...
. . ....
0 . . . . . . . . . 0 1 −2 1
. (5.6)
Una tercera alternativa consiste en aplicar métodos de estimación de Wiener en los
que se considera a r como un vector muestra que resulta de un proceso alteatorio con media
conocida y matriz de covarianza Cr [12]. De esta forma, la estimación de Wiener está de�nida
por,
r = CrOT (OCrO
T )−1c, (5.7)
Una aproximación utilizada para Cr en la que ésta es modelada como una matriz
de covarianza resultado de un proceso de Markov de primer orden está de�nida, para i, j =
1, . . . , K, como
(Cr)ij =
ρj−i ⇔ i < j
1 ⇔ i = j
ρi−j ⇔ i > j
, (5.8)
donde 0 ≤ ρ ≤ 1 es el factor de correlación del elemento adyacente.
5.2.2. El Palimpsesto de Arquímedes
El manuscrito original de Arquímedes es un texto escrito sobre cuero de animal que fue
creado en el siglo X para copiar siete de los tratados del cienti�co y matemático griego. Cada
hoja del manuscrito medía aproximadamente 20 cm de ancho por 30 cm de largo. En el siglo
XII el texto fue lavado, cada página fue cortada por la mitad y sobre ellas se reescribió un
J. C. Valdiviezo INAOE 100
5.2. REGISTRO MULTIESPECTRAL DE UNA ESCENA
libro cristiano de resos al que se le denominó el Euchologion. Durante la edad media reciclar
libros de esta manera era una práctica común debido a lo costoso que resultaba el tratamiento
de la piel de cordero para hacer nuevos pergaminos. Las hojas individuales del nuevo libro
miden aproximadamente 15 cm de ancho por 20 cm de largo y el texto religioso está escrito de
manera perpendicular a los textos originales borrados. La tinta utilizada para escribir el libro
de resos y la mayoría de los textos originales fue tinta hecha de hierro y hiel. En el Euchologion
la tinta es de color café oscura y los caracteres se leen muy bien en la mayoría de las páginas,
mientras que, en los textos borrados, las manchas de tinta remanentes son generalmente de
color más rojo y la visibilidad de los textos va desde evidente hasta virtualmente invisible.
El libro de resos fue utilizado por cientos de años en los servicios cristianos en el
Monasterio de San Saba, localizado en el desierto de Judea. En 1800, el libro fue colocado
en la biblioteca del Metochion del Santo Sepulcro en Constantinopla, donde su presencia
fue notado en 1844 por Constantin Von Tischendorf. Después de una larga trayectoria, en
octubre de 1998 el manuscrito fue comprado por un coleccionista anónimo, quien lo depositó
en el Museo de Arte Walters, en Baltimore, Maryland y desde entonces ha �nanciado un
programa intensivo para la restauración, conservación y el análisis del documento. De esta
forma, diversas técnicas y sensores han sido utilizados para la digitalización del documento,
incluyendo imágenes obtenidas mediante iluminación con rayos UV y rayos X [10].
El registro multiespectral del documento se realizó por medio de iluminación prove-
niente de arreglos LEDs, a diferentes longitudes de onda; para la captura de las imágenes del
documento se utilizó un sensor de color Sinar 54H, que registra valores RGB en cada pixel
por medio de traslaciones pizoeléctricas del sensor. Con el uso de este arreglo once imágenes
fueron registradas con bandas espectrales centradas en las longitudes de onda que se indican
en la Tabla 5.1. Una vez que los valores de radiancia captados por el sensor se transformaron
en re�ectancia, tomando en cuenta la respuesta de la cámara y la distribución espectral de las
fuentes de iluminación, el análisis de las imágenes permite diferenciar los pigmentos presentes
en la manuscrito en base a su re�ectancia espectral.
J. C. Valdiviezo INAOE 101
5.3. MÉTODOS AUTÓNOMOS DE ANÁLISIS
Tabla 5.1: Imágenes multiespectrales registradas para el documento de Arquímedes.
Bandas 1 2 3 4 5 6 7 8 9 10 11
λ0 (nm) 365 445 470 505 530 570 617 625 700 735 870
5.3. Métodos autónomos de análisis
En diversas aplicaciones se requieren técnicas autónomas que permitan clasi�car los elemen-
tos que conforman una imagen. En el caso de imágenes multiespectrales técnicas particulares
se han aplicado para este propósito, algunas de la cuales están basadas en criterios como:
transformaciones para reducir la redundancia de información, agrupamiento de pixeles con in-
formación espectral similar y técnicas basadas en geometría convexa. En esta sección se hace
mención de tres métodos importantes de análisis que se pueden utilizar para la separación de
los textos presentes en el manuscrito de Arquímedes.
5.3.1. Análisis de componentes principales
La transformación de componentes principales (principal component analysis, PCA),
ha sido ampliamente utilizada para reducir la redundancia de información en un conjunto de
datos multiespectrales. Esta técnica permite encontrar combinaciones lineales ortogonales de
un conjunto de características (bandas espectrales) que maximizan la variación existente dentro
de ellas; dichas variaciones se despliegan en un nuevo conjunto de imágenes denominadas
componentes. El tratamiento matemático del análisis de componentes principales se presenta
a continuación.
Dada una imagen con k vectores en Rn, el vector medio z y la matriz de covarianza
C se calculan mediante las expresiones introducidas en la ec. (4.1). La matriz C de tamaño
n × n es real y simétrica. Si los elementos xi y xj no están correlacionados, su covarianza es
cero y, por lo tanto, cij = cji = 0. Además, sean ei y λi con i = 1, . . . , n, respectivamente,
los eigenvectores y eigenvalores correspondientes de C, ordenados en orden descendente tal
que λj ≥ λj+1 para j = 1, . . . , n − 1. De esta manera, sea A una matriz cuyas �las estén
formadas por los eigenvectores de C, ordenados decrecientemente de acuerdo al valor de sus
J. C. Valdiviezo INAOE 102
5.3. MÉTODOS AUTÓNOMOS DE ANÁLISIS
correspondientes eigenvalores. Por lo tanto, siendo A una matriz de transformación que se
utiliza para mapear los vectores x a vectores correspondientes y, se de�ne la transformada
Hotelling de acuerdo a la siguiente expresión:
y = A(x− z). (5.9)
Es importante mencionar que en esta transformación los ejes del nuevo sistema coordenado
apuntan en la dirección de máxima varianza. Por otra parte, al calcular la matriz de covarianza
de y, los elementos fuera de la diagonal son cero, lo cual signi�ca que sus elementos no
poseen correlación. Finalmente, para el caso de las imágenes de componentes principales, una
característica importante es que una porción alta del contraste está contenida en las primeras
dos imágenes, decreciendo rápidamente a partir de la segunda componente.
5.3.2. Agrupación con medias-K
El algoritmo de medias-K (K-means) es utilizado para identi�car grupos de los puntos
de datos en un espacio n-dimensional. Dado un conjunto de datos {x1, . . . ,xQ} que consiste
en Q observaciones de una variable aleatoria X ∈ Rn, el propósito es particionar el conjunto
de datos en algún número K de grupos. En particular, un grupo consiste en un conjunto de
datos cuyas distancias entre puntos son pequeñas comparadas con las distancias con puntos
fuera del grupo. Los vectores −→ς ξ, con ξ = 1, . . . , K, representan los centros de dichos grupos.
De esta forma, el objetivo del algoritmo es determinar el conjunto de vectores −→ς ξ, así como
asignar los datos a alguno de los grupos tal que la suma del cuadrado de las distancias de cada
punto a su vector −→ς ξ más cercano sea un mínimo.
Formalmente, para cada punto xq, con q = 1, . . . Q, un conjunto de variables indicadoras
binarias dq,ξ ∈ {0, 1} describe a cual de los K grupos el punto xq es asignado, tal que si este
punto se asigna al grupo ξ, entonces dq,ξ = 1 y dq,j = 0 para j = ξ. Se de�ne entonces la
siguiente función objetivo, tal que
J =
Q∑q=1
K∑ξ=1
dq,ξ ∥ xq −−→ς ξ ∥2, (5.10)
J. C. Valdiviezo INAOE 103
5.3. MÉTODOS AUTÓNOMOS DE ANÁLISIS
la cual representa la suma de los cuadrados de las distancias de cada punto a su vector asignado−→ς ξ. Dado que esta función tiene por objetivo encontrar valores de dq,ξ y −→ς ξ que minimicen
a J , el algoritmo realiza un proceso iterativo en el que cada iteración involucra dos procesos
de optimización. Primero se escogen valores iniciales para −→ς ξ. Entonces se minimiza J con
respecto a dq,ξ, manteniendo a −→ς ξ �jo. En la segunda etapa se minimiza J con respecto a−→ς ξ, manteniendo a dq,ξ �jo. Estos dos pasos se repiten hasta que el algoritmo converge [4]. En
efecto, con el procedimiento descrito todos los puntos se clasi�can en alguno de los K grupos.
5.3.3. El método W y M aplicado al caso multiespectral
En el caso de imágenes multiespectrales, el método basado en W y M se puede utilizar
para determinar el conjunto de puntos extremos de la imagen, que a su vez representan a los
pixeles espectrales más puros. En base al modeloMLR, enunciado en la ec. (3.9), la información
registrada en cada pixel de una imagen multiespectral puede considerarse como la re�ectancia
mezclada de los diversos materiales que conforman la escena. Es decir, muchos de los pixeles
de la escena habrán registrado un espectro combinado y algunos otros contendrán el espectro
de un único material. En particular, para el caso del palimpsesto de Arquímedes, la mezcla
espectral estará conformada por los espectros que pertenecen a los dos tipos de pigmentos
utilizados para los dos escritos y el cuero del manuscrito. Por tanto, la representación de
mezclas espectrales permitirá estimar la presencia de alguno de los pigmentos en cada pixel
de la imagen.
De acuerdo con la discusión presentada en el Capítulo 3, después de calular las memo-
rias escaladas W y M es necesario veri�car que sus columnas cumplen con la propiedad de
independientes afín. De esta manera, la extensión de este método para el caso multiespectral
consiste en el uso de cualquiera de los dos criterios para derivar subconjuntos de W y M que
sean independientes afín. En el Criterio I la idea fundamental consiste en determinar los vec-
tores que cumplen con independencia reticular fuerte ya que se ha establecido que ésta implica
independencia afín. De acuerdo a lo descrito en el Teorema 3.3, dado queW es max-dominante
y M es min-dominante en la diagonal, para la búsqueda de vectores IRF es su�ciente evaluar
únicamente la propiedad de independencia reticular. En efecto, la demostración de este teo-
J. C. Valdiviezo INAOE 104
5.4. DETERMINACIÓN DE PIGMENTOS
rema provee un método para comprobar la propiedad de independencia reticular y con ello
derivar un subconjunto de vectores independientes afín.
El Criterio II está basado en los Teoremas 3.4 y 3.5, en los que se establece que, para
obtener un conjunto independiente afín, ningun vector columna deW e independientementeM
debe ser igual o un múltiplo de alguno de los demás vectores. De esta forma, el procedimiento
en este caso consiste en eliminar cualquier vector columna que sea un múltiplo de los restantes.
Una vez que se han determinado subconjuntos de W y M se pueden utilizar ambos
conjuntos o determinadas columnas de ellos como la matriz S en el MLR. Por último, de
manera análoga al caso de imágenes en color, se debe estimar la proporción de cada uno de
los materiales constituyentes que forman las columnas de S, en cada pixel de la imagen. Para
ello, es posible utilizar el algoritmo de estimación por mínimos cuadrados no-negativa (NNLS),
la técnica de multiplicadores de Lagrange o la técnica híbrida presentada en la ec. (4.14).
5.4. Determinación de pigmentos
El análisis multiespectral de documentos antiguos se ha realizado por medio de los
tres métodos descritos anteriormente, aplicados al conjunto multiespectral perteneciente al
palimpsesto de Arquímedes. El objetivo que se pretende lograr con cada una de estas técnicas
es separar los diferentes pigmentos presentes. En esta sección se presentan las imágenes de
segmentación que se obtienen en cada caso y que incluyen los tipos de escritura y el cuero que
fue utilizado para la elaboración del documento.
5.4.1. Implementación numérica
Los métodos de análisis se han aplicado utilizando una subimagen de tamaño 270×360
pixeles de las once bandas multiespectrales que corresponde a la página inferior izquierda del
folio 014v-019r en el palimpsesto. Los datos de este conjunto multiespectral corresponden
a valores de re�ectancia, por lo que cualquiera de los métodos se pueden aplicar de forma
directa. Para el análisis se forma primeramente la matrix X con todos los pixeles espectrales
que contiene la imagen; así, X = {x1, . . . ,xk} ∈ R11, con k = 270× 360 vectores.
J. C. Valdiviezo INAOE 105
5.4. DETERMINACIÓN DE PIGMENTOS
Componentes principales
Al emplear el análisis de componentes principales, a partir del conjunto X se calcu-
laron el vector z y la matriz de covarianza C, respectivamente. El cálculo de los eigenvalores y
eigenvectores de C se utilizó para formar la matriz A cuyas �las contienen a los eigenvectores
ordenados en forma decreciente de su correspondiente eigenvalor. Además, las once compo-
nentes de la imagen se calcularon por medio de la trasformación expresada en la ecuacion
(5.9). La Tabla 5.2 muestra los eigenvalores ordenados en forma decreciente. De acuerdo a
la discusión presentada en la sección anterior, en esta transformación es posible representar
las características más importantes de la imagen utilizando las componentes con los mayores
eigenvalores. Por tanto, las dos primeras componentes principales de la imagen, denotadas por
C1 y C2, se han utilizado para formar una imagen en falso color, tal que C1, C2, C1 han sido
empleadas respectivamente, como los canales R,G y B de la nueva imagen. La parte izquierda
de la �gura 5.2 presenta la imagen en color verdadero de la porción del manuscrito empleada
para las simulaciones, mientras que la parte derecha despliega la imagen RGB que resulta de
la combinación de C1 y C2.
Tabla 5.2: Eigenvalores λi con i = 1, . . . , 11 calculados para el análisis de componentes principales.
λ1 λ2 λ3 λ4 λ5 λ6 λ7 λ8 λ9 λ10 λ11
284.3 215 67.9 59.17 16.23 10.88 9 7.29 6.49 4.69 3.33
Medias-K.
La implementación numérica del algoritmo de acumulación por medias K en Matlab
fue utilizado para separar las tres clases presentes en el conjunto de datos X. Para ello, los
parámetros que se pueden especi�car como entrada en el algoritmo son: el número de clases, el
tipo de distancia a utilizar, el número de veces que se desea repetir el agrupamiento y el método
utilizado para elegir las posiciones de los centroides iniciales. En base a los resultados obtenidos
con componentes principales, el número de clases se estableció igual a 3. Además, después de
realizar distintas iteraciones con diferentes parámetros para determinar el mejor desempeño
del algoritmo los parámetros restantes se de�nieron como sigue. La distancia Euclidiana se
J. C. Valdiviezo INAOE 106
5.4. DETERMINACIÓN DE PIGMENTOS
Figura 5.2: Izquierda: imagen en color verdadero de la porción del palimpsesto utilizada para los experimen-
tos. Derecha: imagen en falso color realizada mediante la composición de las componentes C1 y C2 obtenidas
mediante PCA.
de�nió como métrica entre las clases, el número de veces que se repitió el agrupamiento fue
igual a 5 y los centroides iniciales se eligieron de acuerdo a una selección aleatoria a partir
del conjunto X. La Tabla 5.3 despliega los valores de los centroides −→ς 1,−→ς 2,−→ς 3 determinados
con el algoritmo. En la parte inferior izquierda de la �gura 5.5 se muestra la clasi�cación de
los tipos de escritura y el fondo realizados por el agrupamiento de medias-K.
Tabla 5.3: Centroides determinados por medias-K para separar las tres clases en el palimpsesto.
−→ς 1 116.4 56.5 74.5 92.2 94.9 81.4 98.3 94.4 77.4 73.6 118.9−→ς 2 82.4 41.3 54.2 68.6 71.7 65.5 88.5 83.6 69.9 68.1 114.8−→ς 3 48.6 25.6 32.9 41.4 43.6 40.9 59.5 56.9 52.2 54.5 107.8
Método W y M .
El cálculo de las matrices WXX y MXX se realizó a partir del conjunto X y los vectores
u y v fueron utilizados para calcular las versiones escaladas W y M , respectivamente. Después
de comprobar la independencia afín de las columnas de ambas memorias, cada matriz está
J. C. Valdiviezo INAOE 107
5.4. DETERMINACIÓN DE PIGMENTOS
conformada por 11 columnas, por lo que el máximo número de puntos extremos que se pueden
determinar a partir deW∪M∪{v∪u} es igual a 11+11+2 = 24. Es importante mencionar que,
aunque las columnas que conforman a W ∪M corresponden a valores extremos que encierran
al conjunto X, existe una correlación entre columnas adyacentes de cada matriz escalada. De
ahí que sea necesario aplicar una medida que permita discriminar entre aquellas columnas
que no presenten correlación, mismas que serán utilizadas como columnas de la matriz S en
el modelo MLR. En esta aplicación se utilizó el ángulo espectral entre vectores (spectral angle
mapper, SAM) como métrica para seleccionar un subconjunto de éstos, el cual calcula el ángulo
θ entre un vector espectral x y un espectro de referencia t y está de�nida por [14],
θ = cos−1 x · t∥x∥∥t∥
. (5.11)
A partir de los 24 vectores extremos, 3 columnas no correlacionadas fueron seleccionadas
en base a los valores más altos de θ calculados para todo el conjunto de vectores; de esta
manera, las columnas seleccionadas fueron w11,m1,m11. La �gura 5.3 muestra las curvas de
dichos vectores espectrales. Finalmente, los vectores espectrales se utilizaron como columnas
de la matriz S en la ec. (3.9). La solución obtenida por medio del método numérico de NNLS
permitió determinar los coe�cientes de abundancias para cada punto extremo en cada pixel
de la imagen. Además, dichos coe�cientes fueron escalados en el rango dinámico [0,255] para
su visualización como mapas de abundancia. La �gura 5.4 muestra los mapas de abundancia
de los tipos de escritura y el fondo del manuscrito determinados a partir de W y M .
5.4.2. Comparación de resultados
Los resultados de segmentación obtenidos con cada uno de los métodos anteriores se
resumen en la �gura 5.5. En la primera �la, de izquierda a derecha, se presentan la subimagen
del manuscrito desplegada en color verdadero, así como la composición en falso color obtenida
con el método PCA. La segunda �la despliega los resultados del agrupamiento realizado por
medias-K (izquierda) y la combinación de dos mapas de abundancia, que corresponden a los
tipos de escritura, determinados por el método W y M (derecha). En base a este panel es
posible realizar una comparación visual de los resultados. Así, al tratar de interpretar el texto
J. C. Valdiviezo INAOE 108
5.4. DETERMINACIÓN DE PIGMENTOS
Figura 5.3: Curvas espectrales de los puntos extremos determinados a partir de W y M . La correspondencia
de estos puntos es: pigmento 1 = w11, pigmento 2 = m1 y cuero = m11.
escrito en forma horizontal, el cual corresponde al texto original que data del siglo X, las tres
técnicas permiten resaltar o extraer gran parte de información. Por ejemplo, la composición
realizada en base a PCA ayuda a contrastar los dos textos presentes en el palimpsesto, lo
que facilita su interpretación. En el caso de medias-K, aunque se logran separar las tres
clases, existen diversos cortes en el texto original así como muchos pixeles mal clasi�cados
en los que el algoritmo ha señalado la presencia del pigmento 1. Por otra parte, dado que
con el método basado en W y M se han calculado las abundancias fraccionales para cada
pigmento en los pixeles de la imagen, la separación de los dos textos y el cuero se ha logrado
en buena proporción, lo cual permite una mejor extracción e interpretación del texto original.
Una ventaja adicional del método propuesto es que los textos se pueden visualizar de forma
separada. Por otra parte, en muchas aplicaciones es deseable realizar una cuanti�cación de
los resultados obtenidos en cada caso. Sin embargo, para este caso de estudio en el que no
se cuenta con una imagen de referencia con la que se puedan comparar dichos resultados, la
comparación está limitada a una interpretación visual.
J. C. Valdiviezo INAOE 109
5.5. CONCLUSIONES
Figura 5.4: Imágenes de las abundancias de los materiales constituyentes del palimpsesto determinados a
partir de W y M . Izquierda: texto escrito en el siglo XII (pigmento 2); centro: texto escrito en el siglo X
(pigmento 1); derecha: cuero del manuscrito.
5.5. Conclusiones
En este capítulo se ha discutido la aplicación del métodoW yM para la segmentación de
textos en imágenes multiespectrales de documentos antiguos. En primer lugar se ha descrito el
proceso para el registro de imágenes multiespectrales, así como algunos métodos para estimar
la re�ectancia espectral de la escena. Además, se han discutido los criterios para la aplicación de
W yM al caso multiespectral y se han presentado los fundamentos matemáticos de dos técnicas
adicionales que se pueden emplear para el análisis de los textos del palimpsesto de Arquímedes.
Los resultados obtenidos con el método W y M , así como aquellos determinados por PCA y
medias-K han permitido extraer gran parte del texto original presente en el documento. En
particular, las primeras componentes de PCA pueden ser utilizadas para contrastar los textos
del documento, mientras que el agrupamiento realizado por medias-K permite clasi�car los
pixeles que pertenecen a un determinado tipo de escritura. Aunque los resultados con ambos
métodos son buenos, los que se han obtenido con W y M logran una mejor separación de los
pigmentos y con ello una mayor porción del texto original ha sido extraída. De esta manera,
con los resultados obtenidos se concluye que es posible emplear el análisis de mezclado lineal
para representar las mezclas espectrales en cada pixel de la imagen.
J. C. Valdiviezo INAOE 110
5.5. CONCLUSIONES
Figura 5.5: Resultados de segmentación de los pigmentos presentes en el palimpsesto de Arquímedes. Primera
�la, de izquierda a derecha: subimagen del manuscrito desplegada en color verdadero, composición en falso
color utilizando PCA. Segunda �la, izquierda a derecha: resultados del agrupamiento por medias-K, mapas de
abundancia que corresponden a los dos tipos de escritura determinados por el método W M .
J. C. Valdiviezo INAOE 111
Bibliografía
[1] Archimedes Palimpsest, �The Archimedes Palimpsest Project,� www.archimedespalimpsest.net,
2008.
[2] Baronti S., Casini A., Lotti F., Porcinai S., �Multispectral imaging systems for the mapping of
pigments in works of art by use of principal component analysis,� Applied Optics, Vol. 37, No. 8,
pp. 1299�1309, 1998.
[3] Bearman G.H., Spiro S.E., �Archaeological applications of advanced imaging techniques,� The
Biblical Archaeologist, Vol. 59, No. 1, pp. 56�66, 1996.
[4] Bishop C.M., Pattern Recognition and Machine Learning, Springer, pp. 424�425, 2006.
[5] Burmester A., Bayerer F., �Towards improved infrared re�ectograms,� Studies in Conservation,
Vol. 38, No. 3, pp. 145�154, 1993.
[6] Casini A., Lotti F., Picollo M., Stefani L., Buzzegoli E., �Image spectroscopy mapping technique
for non-invasive analysis of paintings,� Studies in Conservation Vol. 44, No. 1, pp. 39�48, 1999.
[7] Conde J., Haneishi H., Yamaguchi M., Ohyama N., Baez J., �Spectral re�ectance estimation of
ancient mexican condices, multispectral images approach,� Revista Mexicana de Física, Vol. 50,
No. 5, pp. 484�489, 2004.
[8] Easton R.L., Knox K.T., Christens-Barry W.A., �Multispectral imaging of the Archimedes
Palimpsest,� Proc. 32nd AIPR, pp. 111�118, 2003.
[9] Easton R.L., Knox K.T., �Digital restoration of erased and damaged manuscripts,� Proc. 39th
Annual Convention of the Association of Jewish Libraries, Brooklyn, NY, June 20-23, 2004.
112
BIBLIOGRAFÍA
[10] Easton, R.L., �In�nite possibilities: Ten year of study of the Archimedes Palimpsest,� Proc. of
the American Philosophical Society, Vol.154, No. 1, pp. 50�76, 2010.
[11] Mans�eld J.R., Sowa M.G., Majzels C., Collins C., Cloutis E., Mantsch H.H., �Near infrared
spectroscopic re�ectance imaging: supervised vs. unsupervised analysis using an art conservation
application,� Vibrational Spectroscopy, Vol. 19, pp. 33�45, 1999.
[12] Pratt W.K., Mancill C.E., �Spectral estimation techniques for the spectral calibration of a color
image scanner,� Applied Optics, Vol. 15, No. 1, pp. 73�75, 1976.
[13] Park S.K., Huck F.O., �Estimation of spectral re�ectance curves from multispectral image data,�
Applied Optics, Vol. 16, No. 12, pp. 3107�3114, 1977.
[14] Smith R.B., �Introduction to hyperspectral images,� Microimages Inc. Tutorial, Lincoln, NE.
(2001).
[15] Rinascimento Virtuale, www.bml.firenze.sb.it/rinascimentovirtuale, January 2006.
[16] Valdiviezo-Navarro J.C. and Urcid G., �Multispectral images segmentation of ancient documents
with lattice memories,� OSA Proc.: Digital Image Processing and Analysis, Tucson, AZ, June
2010.
[17] Van Asperen de Boer J.R.J., �Re�ectrography of paintings using an infra-red vidicon television
system,� Studies in Conservation, Vol. 14, pp. 96�118, 1969.
[18] Ware G.A., Chabries D.M., Christiansen R.W., Brady J.E., Martin C.E., �Multispectral Analysis
of Ancient Maya Pigments: Implications for the Naj Tunich Corpus,� IEEE Proc.: IGARSS, Vol
6, pp. 2489�2491, 2000.
J. C. Valdiviezo INAOE 113
Capítulo 6
Procesado de Imágenes Hiperespectrales
En este capítulo se presenta el análisis de puntos extremos utilizando las memorias reticulares
para el caso de dos imágenes hiperespectrales remotamente registradas. El capítulo se inicia con
una breve descripción de los fundamentos físicos involucrados en el registro de estas imágenes,
sus características partículares, así como los métodos utilizados para derivar la re�ectancia
espectral. Más adelante se presentan los espectros de los puntos extremos determinados con
W y M , los cuales se comparan con los obtenidos por el análisis de componentes de vértices.
Para concluir el capítulo se muestran los mapas de la distribución de los recursos naturales
calculados a partir de los puntos extremos determinados con cada método.
6.1. Registro hiperespectral de una escena
El desarrollo de tecnologías de formación de imágenes más so�sticadas en combinación
con espectrómetros de alta resolución ha dado lugar a una nueva perspectiva para el sensado
remoto, en la que es posible registrar, simultáneamente, la información espacial y espectral
de la energía re�ejada por la super�cie de la Tierra. Estos instrumentos, conocidos como es-
pectrómetros de imagen, forman la imagen de la radiancia solar re�ejada o emitida por los
materiales de la super�cie, en cientos de bandas cuasi-contiguas usualmente en la porción solar
de re�exión del espectro (de 0.35 a 2.5 µm). En aplicaciones de percepción remota la región
que comprende de 0.35 a 1.0 µm se conoce como visible/infrarrojo cercano, (visible and near
114
6.1. REGISTRO HIPERESPECTRAL DE UNA ESCENA
infrared, VNIR) y la región que comprende de 1.0 a 2.5 µm se conoce como infrarrojo de longi-
tud de onda corta (short wavelength infrared, SWIR). Por lo tanto, los datos hiperespectrales
resultantes están conformados en un cubo de imágenes con dos dimensiones espaciales y una
espectral. La información contenida en un pixel único de la imagen hiperespectral puede ser
usada para comparar e identi�car cualquier objeto en base a sus características espectrales,
en una localización especí�ca de la zona de interés.
6.1.1. Fundamentos físicos
Existen procesos importantes de interacción entre materia y energía que constituyen
la base física de la información que es capturada por los espectrómetros. La energía electro-
magnética procedente del sol puede ser modi�cada en su dirección, intensidad o polarización
cuando toca la super�cie terrestre. Estos cambios de energía dependen de la constitución físi-
ca y química de los materiales que conforman la super�cie, los cuales pueden ser clasi�cados
como: transmisión, re�exión, absorción y emisiòn de radiación1. Más aún, los procesos de
interacción entre materia y energía permiten identi�car los materiales que conforman la su-
per�cie terrestre a partir de determinadas bandas de absorción o emisión presentes en los datos
hiperespectrales registrados por un sensor.
Para aplicaciones en percepción remota los espectrómetros de imagen son colocados
sobre plataformas aéreas, principalmente en satélites o aviones [4]. Por tanto, las partes fun-
damentales que conforman a estos instrumentos son las siguientes. (1) Óptica para colectar luz,
(2) un sistema mecánico para barrer el campo de visión instantáneo (IFOV) del espectrómetro
sobre una escena y (3) un arreglo de espectrómetros que subdividen la porción del espectro de
interés. Además, el proceso de adquisición de la imagen se realiza de acuerdo a lo siguiente. Un
espejo de barrido acoplado al sistema mecánico, así como el movimiento de la plataforma se
encargan de colectar la energía re�ejada por la super�cie. Para el proceso de barrido de cada
línea de la escena se pueden utilizar diferentes sistemas. Si la óptica forma la imagen de un
punto único sobre la super�cie, tal que el sistema barre una línea larga que es perpendicular
al movimiento de la plataforma, el sistema se conoce como �escobilla giratoria� (�whiskbroom�
1Los fenómenos de interacción materia y energía fueron descritos con detalle en el Capítulo 2
J. C. Valdiviezo INAOE 115
6.1. REGISTRO HIPERESPECTRAL DE UNA ESCENA
Azul
Verde
Rojo
IR
espejo rotatorio
Sistema "whiskbroom" Sistema "pushbroom"
Figura 6.1: Dos tipos de sistemas de barrido usados para capturar una escena hiperespectral; el
número de bandas espectrales está determinado por los detectores que cubren intervalos de longitudes
de onda (λ) especí�cos.
system). Por otro lado, si la óptica forma la imagen de una rendija larga sin necesitar de un
sistema mecánico de barrido más que el movimiento de la plataforma para formar una imagen,
el sistema se conoce como �escobilla de empuje� (�pushbroom� system). Ambos sistemas se ilus-
tran el la �gura 6.1. Existe otro sistema que utiliza un arreglo bidimensional de fotodetectores
y un arreglo lineal de �ltros para registrar de manera simultánea las bandas de la imagen [4].
Después de que la energía se ha colectado, la radiación incidente es entonces dirigida a un
conjunto de espectrómetros que dividen la luz en múltiples bandas estrechas de energía por
medio de un elemento dispersivo, que puede ser una rejilla o un prisma. Finalmente la energía
que sale del elemento dispersivo es capturada por medio de fotodetectores cuya sensibilidad
responde a intervalos de longitudes de onda especí�cos, lo que da lugar a cientos de bandas
espectrales.
6.1.2. Resolución espacial y espectral
En los espectrómetros de imagen existen dos características básicas que de�nen el
grado de resolución del sistema: la resolución espacial y espectral. La resolución espacial es
una medida del mínimo detalle sobre la super�cie que puede ser captado por un sensor remoto
dado. La resolución espacial depende de las características propias del sensor y de la altura de
J. C. Valdiviezo INAOE 116
6.1. REGISTRO HIPERESPECTRAL DE UNA ESCENA
vuelo de la plataforma aérea. En particular, para un espectrómetro de imagen la resolución
espacial está de�nida por el tamaño de los pixeles del CCD en la dirección y y la ampli�cación
del sistema microscópico. Sin embargo, en la dirección x, la resolución depende del ancho de la
rendija del espectrómetro y de la ampli�cación del sistema [3]. Sean ∆x y ∆y las dimensiones
de los pixeles del CCD, respectivamente, y M la ampli�cación del sistema. El ancho de la
rendija del espectrómetro, denotado por ws, siempre será mayor a ∆x. Entonces, la resolución
espacial en la dirección y es 2∆y/M , mientras que en la dirección x es 2ws/M . Más aún, una
de�nición de resolución comúnmente utilizada es aquella que relaciona el tamaño del pixel y
la altitud de vuelo; es decir, esta resolución se re�ere al área física sobre la super�cie terrestre
ocupada por un pixel único. Claramente, la resolución espacial incrementa conforme la altitud
de la plataforma aérea decrementa.
Por otra parte, la resolución espectral se re�ere al número y ancho de las bandas
espectrales que un sensor puede registrar. La resolución espectral depende de las componentes
del espectrómetro, lo cual incluye al ancho de la rendija, la dispersión de la rejilla o prisma
y el tamaño del pixel del dispositivo. Por ejemplo, para un pixel CCD de 10 µm2 de área, la
dispersión en operación normal es aproximadamente de 40 nm por mm o, equivalentemente,
0.4 nm por pixel.
6.1.3. Técnicas de estimación de la re�ectancia
En términos radiométricos, la energía que llega a la apertura de entrada de un sensor
es la cantidad conocida como radiancia. Dado que la re�ectancia espectral es una cantidad
que está relacionada con las propiedades de los materiales, resulta necesario estimar dicha re-
�ectancia a partir de la información de radiancia contenida en los datos hiperespectrales. Para
este propósito, el nivel de energía solar de fondo debe ser removido y los efectos de absorción
y esparcimiento atmosféricos deben ser compensados. Existen tres técnicas principales que
pueden ser usadas para derivar la re�ectancia espectral de los materiales, las cuales pueden
ser: (1) técnicas basadas en imagen, (2) métodos empíricos, (3) aproximación basada en mod-
elos. Una técnica basada en imágenes utiliza sólo los datos captados por el instrumento, con el
requisito de que las imágenes incluyan regiones de re�ectancia relativamente uniformes. Así,
J. C. Valdiviezo INAOE 117
6.1. REGISTRO HIPERESPECTRAL DE UNA ESCENA
cualquier absorción presente en la re�ectancia medida sobre estas regiones estará relacionada
con las efectos antes mencionados y, por lo tanto, tales efectos pueden ser compensados para
la imagen completa. De esta manera, al dividir cada espectro de la imagen por el espectro de
campo plano, la escena se convierte a re�ectancia relativa.
Por otro lado, los métodos empíricos emplean tanto los datos sensados remotamente,
como mediciones de campo de la re�ectancia, r(λ), para resolver una ecuación lineal que la
relaciona con la radiancia del sensor, tal que,
L(λ) = br(λ) + c , (6.1)
donde L(λ) representa la radiancia capturada por el sensor y que varía con la longitud de
onda λ, y b, c representan, respectivamente, términos multiplicativo y aditivo para ajustar la
radiancia del sensor.
Las aproximaciones basadas en modelos buscan representar matemáticamente todos los
factores involucrados en la radiancia adquirida en cada pixel, incluyendo las perturbaciones
atmosféricas. Para este propósito, se utiliza el espectro de irradiancia solar simulado, entonces
el método estima la radiancia solar en el día y la hora de la adquisición de la imagen y los
efectos de esparcimiento y absorción de la atmósfera. Por tanto, la radiancia solar que llega a
la apertura del sensor Ls, en función de la longitud de onda λ puede ser modelado como
Ls(λ) =1
π(Er(λ) +Mt)τθ + Lp , (6.2)
donde E es la irradiancia sobre la super�cie terrestre, r(λ) es la re�ectancia de la super�cie,
Mt es la excitancia radiante espectral a temperatura t, τθ es la transmitancia de la atmósfera a
un ángulo zenith θ y Lp es la radiancia espectral de trayectoria de la atmósfera [2]. El resolver
la ec. (6.2) permite obtener resultados exactos en la estimación ya que dicha ecuación incluye
todos los factores que contribuyen en el proceso de adquisición de la imagen. De manera
adicional, las aproximaciones basadas en modelos son empleadas para estimar las propiedades
atmosféricas directamente de los datos hiperespectrales.
J. C. Valdiviezo INAOE 118
6.1. REGISTRO HIPERESPECTRAL DE UNA ESCENA
6.1.4. Instrumentos hiperespectrales
Uno de los primeros instrumentos hiperespectrales colocado en una base aérea para
aplicaciones de observación terrestre es el espectrómetro de imagen AVIRIS (Airborne, Visible
and Infrared Imaging Spectrometer). El instrumento fue desarrollado en el Laboratorio de
Propulsión de Aviones de la NASA y está compuesto por un sistema de barrido de tipo �escobilla
giratoria� y cuatro espectrómetros de rejillas (A, B, C y D) que dividen la región de longitudes
de onda de 0.4 a 2.45 µm en cuatro segmentos espectrales: 0.41-0.7 µm, 0.68-1.27 µm, 1.25-
1.86 µm y 1.84-2.45 µm. De esta forma, la �na resolución espectral del instrumento (alrededor
de 10 nm) permite registrar 224 bandas espectrales, por medio de un arreglo lineal de 224
sensores de silicio e indio-antimonio. Cuando el sensor es colocado a bordo del avión ER-2,
el cual vuela a una altura de 20 km sobre el nivel terrestre, la resolución espacial del sensor
está alrededor de 400 m2, con un FOV de 30◦ y un IFOV de 1.0 mrad. Sin embargo, cuando
el instrumento es colocado sobre un avión que vuela a una altura de 4 km sobre el nivel del
mar, la resolución espacial del sensor está alrededor de 16 m2.
Por otra parte, el sensor CHRIS es un espectrómetro de imagen europeo que se encuentra
operando actualmente. El instrumento tiene una resolución espacial de 17 m y registra 62
bandas. Los datos capturados por el sensor permiten una variedad de aplicaciones, tales como
el monitoreo de zonas costeras y de la super�cie terrestre. Otros espectrómetros de imagen que
están en uso actualmente son: el instrumento conocido como HYDICE (Hyperspectral Digital
Imagery Collection Experiment) y los espectrómetros de imagen comerciales desarrollados por
la compañía SpecTir [12].
Además de los sensores hiperespectrales mencionados, tres misiones están planeadas
para los próximos cinco años. La Agencia Espacial Italiana ASI planea lanzar en 2012 un
instrumento de media resolución, conocido como Prisma. El dispositivo combinará un sensor
hiperespectral con una cámara pancromática de mediana resolución, capaz de registrar 235
bandas espectrales en las porciones VNIR y SWIR. El Centro Aeroespacial Alemán (DLR)
planea lanzar el satélite hiperespectral denominado EnMAP en 2014; el sensor está diseñado
para registrar imágenes de la super�cie terrestre en 200 bandas angostas a color. Por otra parte,
en 2015 la agencia espacial NASA planea poner en funcionamiento el instrumento infrarrojo
J. C. Valdiviezo INAOE 119
6.2. DETERMINACIÓN DE PUNTOS EXTREMOS
conocido como HyspIRI. La misión incluye dos instrumentos colocados en un satélite en órbita
terrestre baja. El primero, un espectrómetro de imagen, registrará imágenes a una resolución
de 10 nm en las porciones visible a infrarrojo de onda corta. El segundo instrumento es un
sensor multiespectral que cubrirá las porciones infrarrojo medio y térmico (3 a 12 µm). Ambos
instrumentos tendrán una resolución espacial de 60 m y serán capaces de colectar 210 bandas
espectrales [1].
6.2. Determinación de puntos extremos
6.2.1. Análisis de componentes de vértices
Este método considera que los datos hiperespectrales se encuentran mezclados lineal-
mente. Así, su objetivo es determinar el conjunto de puntos extremos, que serán utilizados
para el proceso de separación espectral, a partir de los vértices de un simplex que encierra
los vectores espectrales. El algoritmo asume la presencia de pixeles puros y proyecta iterativa-
mente los datos sobre una dirección ortogonal al subespacio ocupado por los miembros �nales
ya determinados. Los nuevos miembros �nales corresponden a los extremos de la proyección.
Especí�camente, la técnica considera que, en ausencia de ruido, los vectores espectrales res-
iden en un cono convexo Cp que está contenido en un subespacio Ep, con p igual al número
de puntos extremos presentes. Por tanto, el algoritmo comienza por identi�car Ep mediante la
descomposición de valores singulares y entonces proyecta los puntos en Cp sobre un simplex Sp
por medio de una transformación. Este simplex está contenido en un conjunto a�n de dimen-
sión p − 1. Una ventaja de este algoritmo es que su complejidad computacional es un orden
de magnitud menor al de N-FINDR, con la di�cultad de que el número de puntos extremos es
un parámetro de entrada [9].
6.2.2. El método W y M aplicado al caso hiperespectral
El método basado en lasMAARs puede ser aplicado al caso de imágenes hiperespectrales
de acuerdo al procedimiento discutido en el Capítulo anterior. Una vez calculadas W y M es
J. C. Valdiviezo INAOE 120
6.3. EJEMPLOS DE APLICACIÓN DE SENSADO REMOTO
necesario veri�car que sus vectores columna satisfacen la propiedad de independencia afín.
Más aún, a diferencia de los casos de aplicación en imágenes en color y multiespectrales, para
imágenes hiperespectrales en las que n es de alto orden, los vectores columna de W presentan
un �pico hacia arriba�, mientras que los vectores de M presentan un �pico hacia abajo�. Este
efecto de picos se debe al escalamiento aditivo previamente realizado puesto que wii = ui
y mii = vi, respectivamente. Resulta necesario entonces realizar un procedimiento simple de
suavización considerando uno o dos de los vectores espectrales más cercanos a wii o mii, el
cual está dado, para cualquier i ∈ {1, . . . , n}, por
zii =
z1,2 ⇔ i = 1,
12(zi−1,i + zi+1,i) ⇔ 1 < i < n,
zn−1,n ⇔ i = n,
(6.3)
donde z puede ser igual a w o m. Una vez que se ha realizado este proceso de suavización, un
subconjunto de W ∪M puede ser utilizado como puntos extremos en el modelo de mezclado
lineal.
6.3. Ejemplos de aplicación de sensado remoto
La funcionalidad de los métodos de identi�cación de puntos extremos puede ilustrarse
utilizando conjuntos de datos hiperespectrales reales. El objetivo de los ejemplos siguientes
es proporcionar detalles su�cientes en el uso de la técnica basada en WXX y MXX, la cual
ha demostrado ser efectiva para el análisis de datos multiespectrales. Como un complemento
a estos resultados se presentarán los puntos extremos determinados por el algoritmo VCA,
mismos que serán comparados con los obtenidos con el primer método. Al �nal de la sección
se presentan los mapas de abundancias generados a partir de la estimación de las proporciones
de cada punto extremo en cada escena hiperespectral.
Las siguientes imágenes fueron tomadas de la base de datos de la compañía SpecTir
[12]. La información que se tiene acerca del proceso de adquisición de las imágenes indica que
fueron registradas por un espectrómetro de imagen en las porciones VNIR y SWIR, cubriendo
J. C. Valdiviezo INAOE 121
6.3. EJEMPLOS DE APLICACIÓN DE SENSADO REMOTO
el intervalo de longitudes de onda de 0.395 a 2.45 µm. Cada escena tiene una reolución espec-
tral de 5 nm, con un total de 360 bandas espectrales. De esta manera, un cubo hiperespectral
está conformado por 600 líneas × 320 pixeles × 360 bandas (alrededor de 132 Mbytes). Dada
la alta resolución espectral, una práctica común para evitar información redundante consiste
en reducir la dimensionalidad espectral de los datos mediante una técnica determinada; por
ejemplo, PCA, la transformación de fracciones de mínimo ruido o una reducción de bandas
adyacentes altamente correlacionadas [6, 10, 11], las cuales son necesarias para disminuir el
costo computacional. En los cubos de datos usados para esta simulación, el número de bandas
espectrales fue reducido a 90 por medio de una selección de bandas a subintervalos de 20 nm,
que en conjunto cubren la misma porción del espectro. Esta reducción espectral permite acel-
erar los tiempos de cómputo sin ocasionar cambios signi�cativos en la tarea de identi�cación.
Ejemplo 1. Costa del Golfo de México
Este cubo hiperespectral fue registrado sobre el Refugio Nacional de vida salvaje de
Suwanee, el cual se localiza en la costa norte del Golfo que pertenece a Estados Unidos. El
refugio alberga uno de los ecosistemas más grandes del río Delta, en el que habitan numerosas
especies de vida salvaje. Los datos registrados cubren pantanos, así como múltiples reservas de
vida salvaje durante el periodo de mayo a junio del 2010. Las imágenes capturaron el estado
de la vegetación en ese momento y pueden ser utilizadas para localizar la presencia o ausencia
de hidrocarburos en la super�cie de la vegetación. Además, debido a que los datos fueron
adquiridos antes del derrame de petroleo ocurrido en 2010, éstos pueden ser comparados con
imágenes más recientes para ayudar en la recuperación de los áreas afectadas. La �gura 6.2
muestra dos imágenes compuestas de la escena hiperespectral de la costa del Golfo. La parte
izquierda de la �gura fue formada por la combinación de las bandas 54 (rojo, λ = 693 nm),
34 (verde, λ = 584 nm) y 14 (azul, λ = 469.5 nm), dando la apariencia de imagen de color
verdadero; la parte derecha fue formada con las bandas 81 (rojo, λ = 851 nm), 217 (verde,
λ = 1631 nm) y 54 (azul, λ = 693 nm), cuya combinación de bandas en el infrarrojo resalta
las áreas de vegetación en colores verde, naranja y café.
Para el proceso de determinación de los puntos extremos se siguió un proceso similar
al discutido para el caso multiespectral. Primero se formó el conjunto X = {x1, . . . ,xk} ∈ Rn,
J. C. Valdiviezo INAOE 122
6.3. EJEMPLOS DE APLICACIÓN DE SENSADO REMOTO
Figura 6.2: Imágenes a color de la escena hiperespectral registrada sobre la costa del Golfo de México.
Izquierda: imagen formada por la combinación de las bandas 54 (rojo), 34 (verde) y 14 (azul). Derecha:
combinación de bandas 81 (rojo), 217 (verde) y 54 (azul).
donde k = 600 × 320 = 192000 y n = 90, compuesto con todos los vectores espectrales que
conforman la escena. A partir de la matriz X se calcularon las memorias WXX y MXX. Asimis-
mo, por medio de los vectores v y u, las columnas de ambas memorias fueron escaladas para
obtener W y M . Para comprobar la independencia afín de los vectores se veri�có que ninguna
columna de W y M fueran iguales. En este ejemplo, cada matriz escalada está conformada
por 90 columnas independientes afín y, por lo tanto, cada una posee 90 �candidatos� a puntos
extremos. De manera adicional, antes de seleccionar un subconjunto de puntos extremos se
realizó el proceso de suavizamiento de los picos que aparecen en la diagonal principal de ambas
memorias, por medio de la ecuación (6.3).
Es importante destacar que el método basado en W y M siempre proporciona un
número de candidatos a puntos extremos que es igual o ligeramente menor que la dimen-
sionalidad espectral. En la práctica, sin embargo, las columnas contiguas están altamente
J. C. Valdiviezo INAOE 123
6.3. EJEMPLOS DE APLICACIÓN DE SENSADO REMOTO
correlacionadas siendo necesario utilizar algunas técnicas para seleccionar un conjunto reduci-
do [11]. En estos ejemplos se ha utilizado una técnica simple basada en el hecho de que las
memorias forman ⌊√n+ 1⌋ subconjuntos, cada uno con ⌊
√n+ 1⌋ vectores columna tanto para
W como para M . De esta manera, un representante de cada grupo es seleccionado como punto
extremo. Aunque esta técnica provee un número razonable de puntos extremos, en situaciones
prácticas donde un pequño número de materiales conforman la escena hiperespectral, es nece-
sario realizar una selección �nal al considerar sólo aquellos espectros que están completamente
decorrelacionados. Por lo tanto en este ejemplo de aplicación, de los 20 candidatos a puntos
extremos determinados a partir de W ∪M , una selección �nal de puntos extremos no correla-
cionados proporcionó un conjunto de 5 vectores espectrales que forman las columnas de S; así,
S = (w2,w24,w43,w54,w79).
Por otra parte, el algoritmo VCA se aplicó al mismo conjunto de datos hiperespec-
trales. De acuerdo a la implementación, el algoritmo requiere como parámetro de entrada el
número de puntos extremos a determinarse; la salida del algoritmo incluye los espectros de
los puntos extremos obtenidos, así como las posiciones de los pixeles en la imagen de donde
éstos fueron extraídos. Iteraciones repetidas con el mismo número de puntos extremos pro-
duce casi el mismo conjunto de salida, con la diferencia en el orden en el que sus espectros
aparecen. Después de probar diferentes valores de entrada, tales como 5, 7, 9, 10, se eligió
utilizar el número de puntos extremos determinados con W y M como entrada para VCA.
De ahí que el conjunto S de puntos extremos identi�cados con VCA está conformado por
S = (x27876,x90661,x97850,x84588,x191634). La �gura 6.3 despliega los espectros de tres puntos
extremos determinados mediante la selección de columnas de W ∪M , cuyas curvas espectrales
corresponden a recursos naturales en la escena de la costa del Golfo. De manera similar, la
�gura 6.4 muestra los espectros de tres puntos extremos obtenidos con el algoritmo VCA. En
ambos casos la distribución espectral de los valores de re�ectancia se normalizó del rango
[0,6000] al intervalo unitario [0,1]. En ambas �guras se puede observar una similitud entre
curvas espectrales dibujadas con el mismo color.
Ejemplo 2. Belstville
En el siguiente ejemplo se utilizó un cubo hiperespectral registrado sobre el área de
J. C. Valdiviezo INAOE 124
6.3. EJEMPLOS DE APLICACIÓN DE SENSADO REMOTO
Longitud de onda
Refl
ecta
ncia
norm
ali
zada
Figura 6.3: Espectros de tres puntos extremos determinados con W y M en el cubo hiperespectral del Golfo
de México. Los valores de columna seleccionados a partir de W ∪M son: w2, w24, w54.
Belstville, que se localiza al norte del condado de Prince George en Maryland, Estados Unidos.
El área registrada por el sensor incluye muestras de agricultura y vegetación. De forma similar
a la imagen anterior, el cubo de datos empleado para este experimento es de tamaño 600 ×320× 90, abarcando el mismo intervalo de longitudes de onda. La parte izquierda de la �gura
6.5 despliega una imagen a color compuesta por la combinación de bandas 54 (rojo, λ = 693
nm), 34 (verde, λ = 584 nm) y 14 (azul, λ = 469.5 nm), simulando una imagen de color
verdadero; la parte derecha de la �gura fue formada con las bandas 81 (rojo, λ = 851 nm), 54
(verde, λ = 693 nm) y 34 (azul, λ = 584 nm) que permite resaltar las áreas de vegetación en
tonos rojos.
La determinación de los puntos extremos en base a W y M se realizó de manera similar
al procedimiento descrito en el ejemplo previo. El conjunto de todos los vectores espectrales
de la imagen está formado por X = {x1, . . . ,xk}, con k = 600 × 320 = 192000 y n = 90. A
partir de X se calcularon las memorias WXX, MXX = −W TXX, así como las matrices escaladas
W y M . Una vez que la condición de independencia afín es veri�cada, las memorias escaladas
son de tamaño 90× 90. Además los efectos de picos que aparecen en la diagonal principal de
ambas memorias fueron removidos por medio de la ec. (6.3). A partir del conjunto W ∪M se
J. C. Valdiviezo INAOE 125
6.3. EJEMPLOS DE APLICACIÓN DE SENSADO REMOTO
Longitud de onda
Refl
ecta
ncia
n
orm
ali
zad
a
Figura 6.4: Espectros de tres puntos extremos obtenidos con el algoritmo VCA en el cubo hiperespectral del
Golfo de México. Los vectores columna sj para j = 1, . . . , 5 indican las columnas correspondientes de S.
realizó una selección de 20 candidatos a puntos extremos. La elección de los vectores columna
espectralmente diferentes permitió formar el conjunto �nal de puntos extremos, cuyos vectores
de�nen las columnas de S, tal que S = {w24,w37,w47,w64,m46,m57,m62}; dicho conjunto
será empleado para estimar las abundancias fraccionales de cada punto extremo.
Por otra parte, la búsqueda de puntos extremos con el algoritmo VCA se realizó estable-
ciendo el valor de 7 como parámetro de entrada. Los espectros resultantes de este procedimiento
fueron usados para formar la matriz S = (s1, . . . , s7), cuyos vectores columna asociados son
(x191845,x191419,x9630,x111446,x114301,x191724,x65969). La �gura 6.6 muestra cuatro de los pun-
tos extremos �nales obtenidos con la selección realizada a partir de W ∪ M . La �gura 6.7
despliega cuatro de los puntos extremos determinados por VCA y que son similares a aquellos
calculados con las memorias. La similitud entre curvas espectrales se puede identi�car para
curvas dibujadas con el mismo color.
J. C. Valdiviezo INAOE 126
6.4. SEPARACIÓN ESPECTRAL Y COMPARACIÓN DE RESULTADOS
Figura 6.5: Imágenes a color de la escena hiperespectral de Beltsville. Izquierda: imagen formada por la
combinación de bandas 54 (rojo), 34 (verde) y 14 (azul). Derecha: combinación de bandas 81 (rojo), 54 (verde)
y 34 (azul).
6.4. Separación espectral y comparación de resultados
Aunque las curvas en ambos conjuntos parecen ser similares, algún criterio debe ser
aplicado para cuanti�car estas similitudes. Aqui se han calculado los coe�cientes de correlación
(φ) entre los vectores determinados por las MAAMs y aquellos producidos por VCA, en cada
uno de los ejemplos. La Tabla 6.1 muestra los coe�cientes de correlación calculados para las
curvas espectrales desplegadas en las �guras 6.3, 6.4 y 6.6, 6.7, respectivamente.
El proceso de separación espectral puede efectuarse mediante la inversión de la ec.
(3.9), sujeta a las restricciones de aditividad completa y no negatividad de los coe�cientes de
abundancia. Esta inversión se expresa en la ec. (3.11), la cual es un sistema sobre determinado
de ecuaciones lineales, tal que n > p. Para los ejemplos aquí presentados, ambas matrices W y
M son de rango completo, así sus vectores columna son linealmente independientes. Además,
J. C. Valdiviezo INAOE 127
6.4. SEPARACIÓN ESPECTRAL Y COMPARACIÓN DE RESULTADOS
Longitud de onda
Refl
ecta
ncia
n
orm
ali
zad
a
Figura 6.6: Espectros de cuatro puntos extremos determinados con W y M en el cubo hiperespectral de
Beltsville. Los vectores columna seleccionados a partir de W ∪M son: w24, w37, w47, w64.
los conjuntos de miembros �nales determinados tanto con las MAAMs como con VCA son
linealmente independientes, cuya matriz pseudoinversa es única. Para los ejemplos presentados,
donde n > p con n = 90 y p = 7 o p = 5, se ha utilizado la estimación de mínimos cuadrados
no negativa NNLS que resuelve el problema de minimizar la norma Euclidiana ∥Sa − x∥2,sujeta a la condición a > 0 [7].
La �gura 6.8 despliega los mapas de abundancia en color de los puntos extremos de-
terminados con los dos métodos aquí discutidos. En estas imágenes las áreas más brillantes
representan máxima distribución del punto extremo correspondiente. La parte izquierda de la
misma �gura muestra la distribución de cuatro recursos naturales que fueron determinados
con W y M en el cubo hiperespectral de la costa del Golfo. La parte derecha despliega la dis-
tribución de tres recursos naturales que fueron determinados por el algoritmo VCA. En ambos
casos se presentan sólo los mapas de abundancia que proveen información útil ya que algunos
otros mapas presentan información redundante o áreas predominantemente oscuras, los cuales
no fueron incluidos. Aunque la región es particularmente caracterizada por la presencia de
pantanos, no fue posible identi�car los recursos naturales en base a un conjunto de espectros
de referencia pues no se cuenta con dichos espectros.
J. C. Valdiviezo INAOE 128
6.5. CONCLUSIONES
Tabla 6.1: Coe�cientes de correlación (φ) para espectros similares obtenidos con el método WM y algoritmo
VCA para las imágenes hiperespectrales del Golfo de México y Beltsville.
Golfo de México Beltsville
VCA & WM φ VCA & WM φ
s2 y w24 0.980 s1 y w37 0.965
s3 y w54 0.974 s2 y w24 0.944
s4 y w2 0.641 s3 y w64 0.912
− − s4 y w47 0.939
La �gura 6.9 despliega los mapas de abundancia en color de los puntos extremos deter-
minados en base aW yM (izquierda) y con VCA (derecha), a partir del cubo hiperespectral de
Belstville. Aunque el conjunto S está conformado por siete puntos extremos, en ambos casos
se han incluido los mapas de abundancia que mejor se asemejan a la distribución de vegetación
que se puede interpretar en la �gura 6.5. En este ejemplo es evidente que la identi�cación de
los tipos de vegetación, producida por cada uno de los métodos, presenta resultados similares
para las segmentaciones mostradas en colores amarillo y magenta. Sin embargo, los resultados
presentan diferencias importantes en las segmentaciones verde y azul. Estas diferencias son
causadas principalmente por el procedimiento de búsqueda de puntos extremos que emplea
cada uno de los métodos. Más aún, el hecho de que las curvas espectrales de los tipos de
vegetación sean similares, presentando variaciones únicamente en ciertas bandas de absorción,
contribuye con las discrepancias en los resultados de segmentación.
6.5. Conclusiones
El uso de espectrómetros de imagen de alta resolución para observaciones de la super�cie
de la Tierra ha dado lugar a múltiples aplicaciones orientadas a la identi�cación, clasi�cación
y monitoreo de recursos naturales a partir de datos remotamente sensados. En este capítulo
se han descrito los fundamentos físicos detrás de la adquisición y calibración de las imágenes
hiperespectrales y que constituyen la base de instrumentos como AVIRIS, HYDICE, entre otros.
J. C. Valdiviezo INAOE 129
6.5. CONCLUSIONES
Longitud de onda
Refl
ecta
ncia
norm
ali
zada
Figura 6.7: Espectros de cuatro puntos extremos obtenidos con el algoritmo VCA en el cubo hiperespectral
de Beltsville. Los vectores columna sj para j = 1, . . . , 7 indican las columnas correspondientes de la matriz S.
Gran parte de los métodos que han sido propuestos para la identi�cación de puntos extremos
están basados en la geometría de conjuntos convexos; el fundamento matemático de dichos
métodos es modelar las mezclas espectrales adquiridas en los pixeles como una combinación
lineal de materiales constituyentes de la escena. Además, el método basado en MAAMs se
ha empleado para la identi�cación de recursos naturales en imágenes hiperespectrales. Los
resultados obtenidos en la identi�cación de puntos extremos se han comparado con aquellos
presentados con el algoritmo VCA. Los mapas de abundancias de los materiales calculados
para cada método permiten conocer la distribución de un determinado material a lo largo de
la escena. En efecto, dichos mapas presentan resultados similares con algunas discrepancias
en la distribución de determinados recursos naturales. De esta manera, se puede decir que el
método W y M es una técnica autónoma con resultados adecuados que pueden ser utilizados
para la clasi�cación de materiales en imágenes hiperespectrales.
J. C. Valdiviezo INAOE 130
6.5. CONCLUSIONES
Figura 6.8: Mapas de abundancia en color de los recursos naturales determinados con la identi�cación
autónoma de puntos extremos en el cubo hiperspectral del Golfo de México. Izquierda: abundancias de cuatro
puntos extremos determinados con W y M , cuya distribución de colores corresponde a amarillo = w2, magenta
= w24, verde = w43, azul = w54. Derecha: abundancias de tres puntos extremos determinados con VCA cuya
distribución de colores es amarillo = s4, magenta = s2, verde = s3. Áreas más brillantes representan mayor
concentración del recurso natural.
J. C. Valdiviezo INAOE 131
6.5. CONCLUSIONES
Figura 6.9: Mapas de abundancia en color de los tipos de vegetación obtenidos con la identi�cación autónoma
de puntos extremos en la imagen hiperespectral de Belstville. Izquierda: abundancias de cuatro puntos extremos
determinados con WM cuya distribución de colores corresponde a magenta = w24, amarillo = w67, azul =
m46, verde = m62. Derecha: abundancias de cuatro puntos extremos determinados con VCA, cuya distribución
de colores es magenta = s2, amarillo = s3, azul = s5, verde = s7. Áreas más brillantes representan mayor
concentración del recurso natural.
J. C. Valdiviezo INAOE 132
Bibliografía
[1] European Space Agency, website: www.esa.int, 2010.
[2] Farrand W.H., �Hyperspectral remote sensing of land and the atmosphere.� In: Encyclopedia of
Modern Optics, Robert D. Guenther ed., Vol. 1, pp. 395�403, Elsevier, Academic Press, 2005.
[3] Huebshman M.L., Schultz R.A., Garner H.R., �Hyperspectral imaging.� In: Encyclopedia of
Modern Optics, Robert D. Guenther ed., Vol. 1, pp. 134�143, Elsevier, Academic Press, 2005.
[4] Jensen J.R., Remote Sensing of the Environment: an Earth Resource Perspective, 2nd edition,
Pearson Prentice Hall, 2007.
[5] Keshava N., Mustard J.F., �Spectral unmixing,� IEEE Signal Processing Magazine, Vol. 19, No.
1, pp. 44�57, 2002.
[6] Keshava N., �A survey of spectral unmixing algorithms,� Lincoln Laboratory Journal, Vol. 14,
No. 1, pp. 55�78, 2003.
[7] Lawson C.L., Hanson R.J., Solving least squares problems, chap. 23, Prentice-Hall, Englewood
Cli�s NJ, 1974.
[8] More K.A., �Spectrometers,� In: Encyclopedia of Modern Optics, Robert D. Guenther ed., Vol.
1, pp. 324�336, Elsevier, Academic Press, 2005.
[9] Nascimento J.M.P., Bioucas-Dias J.M., �Vertex component analysis: a fast algorithm to unmix
hyperspectral data,� IEEE Trans. on Geoscience and Remote Sensing, Vol. 43, No. 4, pp. 898�
910, 2005.
133
BIBLIOGRAFÍA
[10] Ritter G.X., Urcid G., Schmalz M.S., �Autonomous single-pass endmember approximation using
lattice auto-associative memories,� Neurocomputing, Vol. 72, No. 10-12, pp. 2101�2110, June
2009.
[11] Ritter G.X., Urcid G., �Lattice algebra approach to endmember determination in hyperspectral
imagery.� In: Advances in Imaging and Electron Physics, Peter W. Hawkes ed., Vol. 160, pp.
113�169, Elsevier Inc, Academic Press, 2010.
[12] SpecTir. SpecTir: end to end hyperspectral solutions, website: www.spectir.com, 2009.
[13] Urcid G., Valdiviezo-N. J.C., Ritter G.X., �Endmember search techniques based on lattice
auto-associative memories: a case on vegetation discrimination,� SPIE Proc.: Image and Signal
Processing for Remote Sensing, Vol. 7477, Berlín, Germany, pp. 74771D:1�12, 2009.
[14] Valdiviezo J.C., Urcid G., �Convex set approaches for material quanti�cation in hyperspectral
imagery.� In: Earth Observation, Rustam B. Rustamov and Saida E. Salahova eds., In Press.
J. C. Valdiviezo INAOE 134
Capítulo 7
Conclusiones
7.1. Conclusiones generales
El desarrollo de los espectrómetros de imagen ha dado lugar a una gran diversidad de
aplicaciones en la identi�ación, clasi�cación, cuanti�cación y monitoreo de los materiales que
conforman una escena en base a sus espectros de re�ectancia. Este trabajo de investigación ha
sido motivado por la necesidad de desarrollar métodos matemáticos e�cientes que permitan
un mejor análisis de las imágenes registradas por dichos instrumentos. En el método aquí
desarrollado se asume que cada pixel de una imagen espectral particular está conformado por
una combinación lineal de los espectros de los materiales que conforman la escena, en propor-
ciones determinadas. Esta representación es en realidad un conjunto convexo, cuyos vértices
representan los pixeles espectrales más puros y que además están asociados a los materiales
constituyentes. Así, para determinar las mezclas en cada pixel es necesario determinar primero
los vértices o puntos extremos; para este efecto se han utilizado las transformaciones reticu-
lares WXX y MXX cuya aplicación a imágenes en color, multiespectrales e hiperespectrales ha
presentado resultados satisfactorios.
En el Capítulo 1 de esta investigación se ha introducido la problemática a resolver y
se han presentado tanto las motivaciones como los objetivos que se buscaron a lo largo de
este trabajo. Más adelante, en el Capítulo 2 se describieron los procesos fundamentales de
la interacción materia y energía, los cuales constituyen la base física de la espectroscopía y
135
7.1. CONCLUSIONES GENERALES
se de�nieron los conceptos de re�ectancia y absortancia que son útiles para comprender los
capítulos subsecuentes. Además, se presentaron espectros de energía re�ejada registrados para
diversos tipos de vegetación utilizando un espectrómetro de línea de la compañia BWTek. El
registro de espectros en el laboratorio ha sido fundamental en este trabajo ya que ha permitido
tener una idea más clara de los factores que están involucrados en el proceso de registro de
espectros y de los fenómenos que originan cambios en las curvas espectrales. Al tratar de
simular los mecanismos que originan las mezclas espectrales se ha determinado que es posible
representar dichas mezclas usando un modelo de mezclado lineal.
En el Capítulo 3 se enunció la base matemática del método desarrollado en esta in-
vestigación. En particular, las operaciones del álgebra reticular minimax fueron de�nidas y se
presentó un breve tratamiento de conjuntos convexos y su relación con el análisis de mezclado
lineal. Más aún, al de�nir las memorias autoasociativas reticulares WXX y MXX se enunció
también su relación con la geometría de conjuntos convexos. Así, las columnas escaladas de
ambas memorias permiten determinar los puntos extremos que envuelven a los datos. De ahí
que el conjunto W ∪ M ∪ {u ∪ v} de�ne un politopo con 2(n + 1) vértices, donde n es la
dimensión del espacio dado. Un subconjunto de puntos extremos derivados a partir de este
politopo puede ser usado para cuanti�car las mezclas en cada pixel de una imagen dada.
En el Capítulo 4 se ha introducido una novedosa técnica de segmentación para imágenes
en color, la cual está basada en la determinación de puntos extremos usando las memorias
autoasociativas reticulares. Los puntos extremos determinados a partir de imágenes en tres
canales corresponden a los pixeles de color saturados en la imagen, los cuales son utilizados en
el modelo de mezclado lineal para representar las mezclas de color en cada pixel. El cálculo de
los coe�cientes fraccionales de cada color saturado en los pixeles de la imagen permite realizar
una segmentación global de los colores que la conforman. El método basado en W y M se
ha aplicado a imágenes transformadas a otros espacios de color, con lo que se han logrado
mejoras en los resultados de segmentación cuando se utiliza el espacio I1I2I3. Al comparar esta
técnica con métodos de segmentación conocidos, tales como la distancia de Mahalanobis y el
algoritmo de cuencas, los resultados de segmentación son superiores a los que presentan dichas
técnicas. En efecto, el método propuesto puede ser considerado como una técnica autónoma
J. C. Valdiviezo INAOE 136
7.1. CONCLUSIONES GENERALES
para la segmentación de imágenes en tres canales.
En el Capítulo 5 se han presentado los resultados del uso de las memorias reticulares
para determinar los espectros de los pigmentos presentes en el palimpsesto de Arquímedes. Al
aplicar el método propuesto para el caso de imágenes multiespectrales es fundamental compro-
bar que los vectores de W , e independientemente M , satisfacen la propiedad de independencia
afín. Con esta condición se busca evitar que algún punto extremo sea una combinación lineal
de los anteriores. Además, dado que el número de puntos extremos determinados es mucho
mayor al número de materiales que conforman una escena resulta necesario realizar un pro-
ceso de selección de aquellos vectores que sean menos correlacionados. El ángulo espectral o
el coe�ciente de correlación calculados a partir de los espectros de los puntos extremos son
métricas que proporcionan resultados adecuados para dicha selección. El subconjunto de vec-
tores seleccionado es empleado entonces para calcular las abundancias fraccionales en cada
pixel de la imagen. La aplicación de esta técnica al conjunto de imágenes multiespectrales
del palimpsesto ha permitido calcular mapas de las abundancias de los dos pigmentos y del
cuero que conforman el manuscrito; con la determinación de la distribución de los pigmentos
se ha logrado recuperar satisfactoriamente gran parte del texto original del manuscrito. De
esta manera, el método aquí desarrollado se puede utilizar para el análisis de pigmentos en
documentos antiguos.
Por otra parte, en el Capítulo 6 se ha discutido el caso de imágenes hiperespectrales; las
memorias reticulares se han empleado para determinar los espectros de los materiales consti-
tuyentes de la escena, sin la necesidad de recurrir a espectros medidos directamente en la zona.
Lo anterior representa un logro importante ya que no se necesita tener conocimiento a priori
de los recursos naturales que se encuentran en el área bajo estudio. Por tanto, los espectros
de los puntos extremos obtenidos mediante las memorias reticulares fueron empleados para el
cálculo de las abundancias de cada recurso natural. Los resultados de segmentación obtenidos
para las dos imágenes ejemplares permiten conocer la presencia de los recursos naturales exis-
tentes. En efecto, en base a los resultados obtenidos en cada uno de los casos aquí discutidos se
ha demostrado que es posible aplicar las memorias autoasociativas reticulares para el análisis
y segmentación de imágenes multicanal.
J. C. Valdiviezo INAOE 137
7.2. APORTACIONES DE ESTA INVESTIGACIÓN
7.2. Aportaciones de esta investigación
La realización de este trabajo de investigación proporciona detalles signi�cativos en
el uso y el potencial de las memorias reticulares para el análisis de imágenes en color, multi-
espectrales e hiperespectrales. En el primer caso se ha desarrollado un método de segmentación
e�ciente que permite conocer las distribuciones de color a lo largo de la imagen. Además para
este caso de tres dimensiones, el cálculo de las fracciones de color saturado se ha realizado
por medio de una matriz generalizada que permite resolver el sistema de ecuaciones y además
satisfacer las restricciones de aditividad completa y positividad, impuestas en el modelo. Por
lo tanto, esta técnica de segmentación es rápida y puede ser aplicada en cualquier espacio
de color con resultados satisfactorios. Es importante mencionar que este método, así como
los resultados de segmentación de imágenes en color han sido reportados en los siguientes
manuscritos:
G. Urcid, J.C. Valdiviezo-N, G.X. Ritter, �Lattice algebra approach to color image seg-
mentation,� Journal of Mathematical Imaging and Vision, doi 10.1007/s10851-011-0302-
2, June 2011.
Gonzalo Urcid, Juan Carlos Valdiviezo-N, Gerhard X. Ritter, �Lattice associative memo-
ries for segmenting color images in di�erent color spaces,� LNCS Proc.: Hybrid Arti�cial
Intelligence Systems, Springer, Vol. 6077/2010, pp. 359�366, 2010.
G. Urcid and J.C. Valdiviezo-Navarro, �Color image segmentation based on lattice au-
toassociative memories,� IASTED Proc.: 13th Arti�cial Intelligence and Soft Computing,
Vol. 683, Palma de Mallorca, Spain, pp. 166�173, 2009.
La aplicación del método W y M para el análisis de imágenes multiespectrales de
documentos antiguos provee resultados importantes pues se ha logrado recuperar gran parte
del texto original del palimpsesto de Arquímedes. En efecto, esta técnica presenta un gran
potencial para el análisis de pigmentos y trabajos de arte. Además de este tratamiento, se
han discutido aspectos fundamentales en el proceso de estimación de la re�ectancia para
imágenes multiespectrales, así como los aspectos físicos que intervienen en dicha estimación
J. C. Valdiviezo INAOE 138
7.2. APORTACIONES DE ESTA INVESTIGACIÓN
para imágenes hiperespectrales. Los resultados de la separación de textos en el palimpsesto de
Arquímedes han sido publicados en el manuscrito:
Juan C. Valdiviezo-Navarro and Gonzalo Urcid, �Multispectral images segmentation of
ancient documents with lattice memories,� OSA Proc.: Digital Image Processing and
Analysis, Tucson, AZ, June 2010.
Una aportación adicional de esta investigación es que el cálculo de W y M facilita la
determinación autónoma de los recursos naturales que conforman una escena remotamente
sensada. Para ello sólo se necesita seleccionar un conjunto reducido de los puntos extremos
determinados con ambas memorias y separar las mezclas en cada pixel de la imagen hipere-
spectral. Los resultados en la determinación de recursos naturales en imágenes hiperespectrales
han sido reportados en los siguientes manuscritos:
J.C. Valdiviezo, G. Urcid, �Convex set approaches for material quanti�cation in hyper-
spectral imagery.� In: Earth Observation, Rustam B. Rustamov and Saida E. Salahova
editors, In Press.
Gonzalo Urcid, Juan Carlos Valdiviezo-N. and Gerhard X. Ritter, �Endmember search
techniques based on lattice auto-associative memories: a case on vegetation discrimina-
tion,� SPIE Proc.: Image and Signal Processing for Remote Sensing, Vol. 7477, Berlín,
Germany, 74771D:1�12, 2009.
Además de las aportaciones del trabajo de investigación, en la segunda mitad del tercer
año de doctorado se realizó una estancia de investigación en el Instituto de Óptica �Daza de
Valdés,� en Madrid España. Durante la estancia se trabajó en temas relacionados con el análisis
y mejoramiento de imágenes de Óptica Biomédica. Uno de los resultados de esta estancia ha
sido la publicación del siguiente manuscrito:
R. Redondo, M.G. Bueno, J.C. Valdiviezo, R. Nava, G. Cristóbal, M. García, O. Déniz, B.
Escalante-Ramirez, �Evaluation of autofocus measures for microscopic images of biop-
sy and cytology,� SPIE Proc.: 22nd Congress of the ICO, Vol. 8011, pp. 801194:1�9,
November 2011.
J. C. Valdiviezo INAOE 139
7.2. APORTACIONES DE ESTA INVESTIGACIÓN
7.2.1. Dirección del trabajo futuro
Uno de los resultados más satisfactorios que se lograron con el desarrollo de este trabajo
fue la recuperación del texto borrado a partir de las imágenes multiespectrales del palimpsesto
de Arquímedes. De esta manera, una aplicación inmediata de esta técnica es en el contexto del
análisis y restauración de documentos antiguos. Estas aplicaciones son de gran importancia ya
que el uso de técnicas ópticas y digitales pueden ayudar a la preservación y rescate de muchos
de estos documentos. Por tal motivo, la dirección del trabajo futuro está orientada a la restau-
ración del color digital en imágenes multiespectrales de códices mexicanos. Dichos códices son
parte del patrimonio artístico y cultural de nuestro país por lo que es importante aplicar las
técnicas desarrolladas para su preservación. Por otra parte, el desarrollo de algoritmos que
permitan remover los huecos e identi�car la presencia de pigmentos en las partes dañadas de
los códices resulta necesario para realizar la restauración de estos documentos.
J. C. Valdiviezo INAOE 140
Top Related