Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito...

154

Transcript of Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito...

Page 1: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

Análisis Espectral de Imágenes

Multicanal basado en Transformaciones

Reticulares Matriciales

por

Juan Carlos Valdiviezo Navarro

Tesis sometida como requisito parcial para

obtener el grado de

DOCTOR EN CIENCIAS EN LA

ESPECIALIDAD DE ÓPTICA

en el

Instituto Nacional de Astrofísica, Óptica

y Electrónica

Diciembre 2011

Tonantzintla, Puebla

Asesor:

Dr. Gonzalo J. Urcid Serrano, INAOE

c⃝INAOE 2011

El autor otorga al INAOE el permiso para

reproducir y distribuir copias en su totalidad o

en partes de esta tesis.

Page 2: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

Abstract

Image spectrometers, instruments that simultaneously register the spatial and spectral infor-

mation of an area under study, have given solution to problems related with the identi�cation

of materials comprising a scene. However, one of the fundamental problems in the analysis of

spectral images is that many spectral pixels are conformed by spectral mixtures of di�erent

materials. This research work is oriented toward the autonomous determination of constituent

materials of a scene from spectral images acquired at di�erent wavelength intervals. Assuming

the spectrum collected at each image pixel is a linear combination of constituent materials

spectra, the objective is to determine a set of pixels with the spectrum of one material that can

be used to represent the mixtures. Geometrically, the spectral mixtures can be represented as

a convex set whose vertices correspond to those pixels with the spectrum of one material, while

any other pixel will be represented by the combination of pure pixels at di�erent proportions.

The scaled column vectors of lattice transforms WXX and MXX allow to extract the vertices

of a minimum convex set enclosing most of the spectral pixels belonging to a multichannel

image, which are associated with the constituent materials spectra. In fact, once these vertices

have been determined, it is possible to quantify the spectral mixtures at each image pixel. This

study begins with the use of lattice transforms for the autonomous segmentation of satured

colors from color images. After, we extend the proposed technique for the analysis of multi-

spectral and hiperspectral images. In the multispectral case, we present results of pigments

identi�cation from the multispectral collection of the Archimedes Palimpsest. In the second

case we present results in the determination of natural resources from two hyperspectral scenes

registered by a remote sensor.

i

Page 3: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

Resumen

El uso de espectrómetros de imagen, los cuales registran simultáneamente la información es-

pacial y espectral de una zona, ha ayudado en la solución de problemas relacionados con la

identi�cación de los materiales que conforman la escena. Uno de los problemas fundamen-

tales en el análisis de imágenes espectrales es que muchos de sus pixeles contienen una mezcla

de espectros de diversos materiales. El presente trabajo de investigación está orientado a la

determinación autónoma de los materiales que conforman una escena, a partir de imágenes

adquiridas en distintas porciones del espectro electromagnético. Para ello se considera que el

espectro captado en cada pixel de la imagen es una combinación lineal de espectros de los

materiales constituyentes de la escena. Geométricamente estas mezclas se pueden representar

como un conjunto convexo en donde los vértices corresponden a los pixeles con el espectro de

un único material, mientras que cualquier otro pixel estará representado por la combinación de

estos pixeles puros en distintas proporciones. Las columnas escaladas de las transformaciones

reticulares matriciales WXX y MXX permiten determinar los vértices de un conjunto convexo

mínimo que encierra a los pixeles de una imagen multicanal. A su vez, estos vértices están

asociados a los espectros de los materiales constituyentes. Una vez que se han determinado los

pixeles espectrales más puros se pueden cuanti�car las mezclas en cada pixel de la imagen. El

presente estudio se inicia aplicando el método propuesto para la segmentación de colores satu-

rados en imágenes de tres canales. Posteriormente trasladamos la técnica al caso de imágenes

multiespecrales e hiperespectrales. En el primer caso se presentan resultados en la separación

de pigmentos a partir de los datos multiespectrales del palimpsesto de Arquímedes. En el se-

gundo caso se presentan resultados en la determinación de los recursos naturales a partir de

dos escenas cuyas imágenes fueron registradas por un sensor remoto.

ii

Page 4: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

Prólogo

El desarrollo de este trabajo de investigación ha sido motivado por la necesidad de

desarrollar nuevas técnicas para la interpretación de datos multidimensionales. A este respecto

se pueden mencionar el creciente auge en las técnicas óptico-digitales para el procesamiento

de imágenes y, en particular, las crecientes aplicaciones de los métodos espectrales para la

identi�cación y monitoreo de materiales. El tratamiento matemático que se presenta en las

siguientes líneas se ha aplicado al caso más simple, que corresponde a las imágenes en tres

canales; su aplicabilidad se ha extendido al caso de imágenes multicanal, en el que el análisis

se vuelve más complicado debido a la cantidad de información. Por otra parte, durante el

desarrollo de este trabajo se ha tratado de complementar esta discusión con los aspectos

físicos que están involucrados tanto en la captura de los datos, como en el análisis de los

mismos.

Es mi deseo agradecer primeramente a la gente de México, quien a través del CONA-

CYT, me han brindado el apoyo necesario para realizar mis estudios de doctorado, mediante

la Beca No. 175027. Asimismo expreso mi gratitud al INAOE por brindarme los conocimientos

y las herramientas necesarias para desarrollarme tanto profesional como humanamente. Este

agradecimiento está también dirigido a los profesores y administrativos, así como a aquellos

que silenciosamente realizan su labor a diario y que hacen posible que los estudiantes teng-

amos espacios adecuados: a las personas de intendencia. Aprovecho también para agradecer el

tiempo, la paciencia y los comentarios oportunos que mis sinodales: Dr. Félix Aguilar Valdés,

Dr. Javier Báez Rojas, Dr. Juan Manuel Ramírez Cortés, Dr. Jorge Castro Ramos y Dr. Al-

fonso Padilla Vivanco han brindado a un servidor, mismos que han ayudado a que este trabajo

sea más completo. Por último expreso mi agradecimiento y admiración al Dr. Gonzalo Urcid

iii

Page 5: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

Serrano porque a lo largo de estos años sus conocimientos, consejos y apoyo me han ayudado

a cumplir esta meta, ahora más que un asesor de tesis es un amigo y un colega. A mis padres,

familia y amigos mi cariño y admiración porque con su apoyo hemos construido un sueño.

Juan Carlos Valdiviezo Navarro,

Noviembre 7 de 2011.

J. C. Valdiviezo INAOE iv

Page 6: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

Dedicatorias

Al Ser Supremo quien me ha acompañado en cada instante de mi vida y quien me

ha dado la oportunidad de cumplir este sueño.

A mis padres: Rogelio Valdiviezo Román y Mercedes Navarro Martínez quienes con

su amor y ejemplo me han enseñado a caminar por la vida.

A mis hermanos: Rocío, Gloria Estefanía y Luis Enrique, mi inspiración y mis

maestros quienes me han enseñado las cosas bellas de la vida.

A mis abuelitos: Estela, María de la Luz y Antero porque su sabio caminar me ha

enseñado que las di�cultades se superan con esfuerzo y voluntad.

A todos mis amigos que han sido parte de mi familia sin importar las distancias

o fronteras: Georgina, Nora, Sarah, Konni y los señores Jose�na, Rosario e Isidro

porque con su cariño las distancias se han vuelto relativas.

�El aprendizaje es el inicio de la riqueza, es el inicio de la salud, es el inicio de la

espiritualidad. Investigando y aprendiendo es donde todos los procesos milagrosos

comienzan.�

Jim Rohn

v

Page 7: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

Índice general

1. Introducción 1

1.1. Antecedentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1.2. Planteamiento del problema . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

1.3. Objetivo General . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

1.3.1. Objetivos particulares . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

1.4. Avances recientes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

1.4.1. Técnicas basadas en geometría convexa . . . . . . . . . . . . . . . . . . 5

1.5. Metodología . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

1.5.1. Propuesta de solución . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

1.5.2. Estructura del trabajo de tesis . . . . . . . . . . . . . . . . . . . . . . . 10

2. Fundamentos de Espectroscopía 16

2.1. Principios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

2.1.1. La radiación electromagnética . . . . . . . . . . . . . . . . . . . . . . . 17

2.1.2. Interacción materia-energía . . . . . . . . . . . . . . . . . . . . . . . . 17

2.1.3. Espectros de emisión y absorción . . . . . . . . . . . . . . . . . . . . . 19

2.1.4. Re�ectancia, absortancia y transmitancia . . . . . . . . . . . . . . . . . 21

2.1.5. Características espectrales de la vegetación . . . . . . . . . . . . . . . . 21

2.2. Espectrómetros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

2.2.1. Resolución del monocromador . . . . . . . . . . . . . . . . . . . . . . . 25

2.2.2. Espectrómetro de línea BRC111A . . . . . . . . . . . . . . . . . . . . 27

2.2.3. Calibración del instrumento . . . . . . . . . . . . . . . . . . . . . . . . 29

vi

Page 8: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

ÍNDICE GENERAL

2.3. Registro espectral de materiales . . . . . . . . . . . . . . . . . . . . . . . . . . 31

2.3.1. Espectros de vegetación . . . . . . . . . . . . . . . . . . . . . . . . . . 33

2.3.2. Mezclas espectrales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

2.4. Espectrómetros de imagen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

3. Fundamento Matemático 47

3.1. Álgebra reticular minimax . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

3.1.1. Ejemplos de retículos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

3.1.2. Conceptos generales . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

3.1.3. Operaciones matriciales . . . . . . . . . . . . . . . . . . . . . . . . . . 50

3.1.4. Independencia reticular . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

3.2. Geometría de conjuntos convexos . . . . . . . . . . . . . . . . . . . . . . . . . 53

3.2.1. Convexidad e independencia afín . . . . . . . . . . . . . . . . . . . . . 53

3.2.2. Simplex multidimensionales . . . . . . . . . . . . . . . . . . . . . . . . 55

3.2.3. Modelo de mezclado lineal . . . . . . . . . . . . . . . . . . . . . . . . . 57

3.3. Memorias asociativas reticulares . . . . . . . . . . . . . . . . . . . . . . . . . . 58

3.3.1. Propiedades algebraicas . . . . . . . . . . . . . . . . . . . . . . . . . . 60

3.3.2. Propiedades geométricas . . . . . . . . . . . . . . . . . . . . . . . . . . 61

3.3.3. Criterios para evaluar independencia afín . . . . . . . . . . . . . . . . . 62

3.3.4. Determinación de puntos extremos con W y M . . . . . . . . . . . . . 64

4. Segmentación de Imágenes a Color 70

4.1. Concepto de segmentación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

4.1.1. El método de distancias . . . . . . . . . . . . . . . . . . . . . . . . . . 72

4.1.2. El algoritmo de cuencas . . . . . . . . . . . . . . . . . . . . . . . . . . 73

4.2. Espacios de color . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74

4.3. Segmentación basada en W y M . . . . . . . . . . . . . . . . . . . . . . . . . . 78

4.4. Ejemplos de segmentación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79

4.5. Comparación de resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84

4.6. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91

J. C. Valdiviezo INAOE vii

Page 9: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

ÍNDICE GENERAL

5. Análisis de Imágenes Multiespectrales 95

5.1. Imágenes multiespectrales de documentos antiguos . . . . . . . . . . . . . . . . 95

5.2. Registro multiespectral de una escena . . . . . . . . . . . . . . . . . . . . . . . 97

5.2.1. Técnicas de estimación de la re�ectancia espectral . . . . . . . . . . . . 99

5.2.2. El Palimpsesto de Arquímedes . . . . . . . . . . . . . . . . . . . . . . . 100

5.3. Métodos autónomos de análisis . . . . . . . . . . . . . . . . . . . . . . . . . . 102

5.3.1. Análisis de componentes principales . . . . . . . . . . . . . . . . . . . . 102

5.3.2. Agrupación con medias-K . . . . . . . . . . . . . . . . . . . . . . . . . 103

5.3.3. El método W y M aplicado al caso multiespectral . . . . . . . . . . . . 104

5.4. Determinación de pigmentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105

5.4.1. Implementación numérica . . . . . . . . . . . . . . . . . . . . . . . . . 105

5.4.2. Comparación de resultados . . . . . . . . . . . . . . . . . . . . . . . . . 108

5.5. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110

6. Procesado de Imágenes Hiperespectrales 114

6.1. Registro hiperespectral de una escena . . . . . . . . . . . . . . . . . . . . . . . 114

6.1.1. Fundamentos físicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115

6.1.2. Resolución espacial y espectral . . . . . . . . . . . . . . . . . . . . . . . 116

6.1.3. Técnicas de estimación de la re�ectancia . . . . . . . . . . . . . . . . . 117

6.1.4. Instrumentos hiperespectrales . . . . . . . . . . . . . . . . . . . . . . . 119

6.2. Determinación de puntos extremos . . . . . . . . . . . . . . . . . . . . . . . . 120

6.2.1. Análisis de componentes de vértices . . . . . . . . . . . . . . . . . . . . 120

6.2.2. El método W y M aplicado al caso hiperespectral . . . . . . . . . . . . 120

6.3. Ejemplos de aplicación de sensado remoto . . . . . . . . . . . . . . . . . . . . 121

6.4. Separación espectral y comparación de resultados . . . . . . . . . . . . . . . . 127

6.5. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129

7. Conclusiones 135

7.1. Conclusiones generales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135

7.2. Aportaciones de esta investigación . . . . . . . . . . . . . . . . . . . . . . . . . 138

J. C. Valdiviezo INAOE viii

Page 10: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

ÍNDICE GENERAL

7.2.1. Dirección del trabajo futuro . . . . . . . . . . . . . . . . . . . . . . . . 140

J. C. Valdiviezo INAOE ix

Page 11: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

Índice de �guras

2.1. Espectro electromagnético en orden creciente de longitud de onda. . . . . . . . 18

2.2. Espectro de absorción de la cloro�la a y b. . . . . . . . . . . . . . . . . . . . . 23

2.3. Componentes ópticos de un espectrómetro. . . . . . . . . . . . . . . . . . . . . 24

2.4. Estructura de un espectrómetro de prisma elemental, W denota el ancho del

haz de iluminación y P1 de�ne el primer plano principal. . . . . . . . . . . . . 25

2.5. Per�l de una rejilla líneal de difracción con N líneas; d es el periodo de la rejilla

y s es la separación entre líneas. . . . . . . . . . . . . . . . . . . . . . . . . . . 26

2.6. Espectro de emisión de la fuente de iluminación. . . . . . . . . . . . . . . . . . 28

2.7. Diagrama de conexión de los componentes del espectrómetro de línea BRC111A. 28

2.8. Arreglo utilizado para veri�car la calibración por longitud de onda. . . . . . . 29

2.9. Espectro de energía transmitida para el �ltro pasa-bandas con λ0 = 450 nm. . . . . . . . . 31

2.10. Espectro de energía transmitida para el �ltro pasa-bandas con λ0 = 650 nm. . . . . . . . . 32

2.11. Espectro de energía transmitida para el �ltro pasa-altas con frecuencia de corte en 515 nm. . 33

2.12. Espectro de energía transmitida para el �ltro pasa-altas con frecuencia de corte en 715 nm. . 36

2.13. Arreglo utilizado para el registro de espectros de vegetación. . . . . . . . . . . 36

2.14. Espectros de energía re�ejada para una hoja de alcanfor en estados amarillo y seco. . . . . 37

2.15. Espectros de energía re�ejada registrada durante tres días para una hoja de pino. . . . . . 37

2.16. Espectro de energía re�ejada para una hoja de pasto verde. . . . . . . . . . . . . . . . . 38

2.17. Espectro de energía re�ejada para una hoja de pasto seco. . . . . . . . . . . . . . . . . 38

2.18. Espectro de energía re�ejada para una hoja de árbol rojiza de la familia del pino. . . . . . 39

2.19. Espectro de energía re�ejada para una hoja de bugambilia. . . . . . . . . . . . . . . . . 39

x

Page 12: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

ÍNDICE DE FIGURAS

2.20. Espectro de energía re�ejada registrado a partir de la cáscara de un jitomate rojo. . . . . . 40

2.21. Espectro de energía re�ejada para la cáscara de una mandarina. . . . . . . . . . . . . . 40

2.22. Espectro mezclado obtenido a partir de una hoja verde y una amarilla. . . . . . . . . . . 41

2.23. Espectro mezclado obtenido a partir de una hoja verde y otra amarilla. En esta grá�ca f(λ)

es una función cuyos coe�cientes aproximan la forma del espectro mezclado. . . . . . . . . 41

2.24. Diagrama óptico del espectrómetro de imagen MIVIS. . . . . . . . . . . . . . . 44

3.1. Ejemplos de simplex para k = 1, . . . , 4 . . . . . . . . . . . . . . . . . . . . . . 56

4.1. Representación del espacio de color RGB. . . . . . . . . . . . . . . . . . . . . . . . . 75

4.2. Representación del espacio de color HSI. . . . . . . . . . . . . . . . . . . . . . . . . . 76

4.3. Representación del espacio de color L*a*b*, donde L* representa la luminancia o el eje de

escala de grises, mientras que a* y b* de�nen la saturación y el color. . . . . . . . . . . . 77

4.4. Primera �la, izquierda a derecha: imagen en color RGB utilizada en el Ejemplo 4.1, imágenes en

tonos de gris de las fracciones de color determinadas a partir de las columnas de W . Segunda

�la: fracciones de color determinadas a partir de las columnas de M . La correspondencia entre

el nivel de gris asignado y el valor numérico es el siguiente: 1 = blanco, 0.5 = gris medio, 0.33

= gris oscuro y 0 = negro. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80

4.5. Fila superior: imágenes de color ejemplares; segunda a cuarta �las: imágenes en tonos de gris

representando las fracciones de los colores saturados seleccionados a partir de W y M . . . . 83

4.6. Izquierda: distribución en el espacio de los diferentes vectores de color en la imagen del mandril

de la �g. 4.5. Centro y derecha: diferentes tetraedros determinados por W = {w1,w2,w3} y

M = {m1,m2,m3} que encierran diferentes subconjuntos de X. . . . . . . . . . . . . . 84

4.7. Fila superior: imágenes de color ejemplares; segunda a cuarta �las: imágenes de colores seg-

mentados para las �guras ejemplares (resultado de umbralización y enmascaramiento). . . . 85

4.8. Primera �la: imagen de color en los espacios RGB, I1I2I3, HSI y L*a*b*, respectivamente;

segunda �la: imágenes conformadas por las segmentaciones de los pimientos rojos y verdes y

las porciones de luz re�ejada producidas por W y M para cada espacio de color. . . . . . . 87

J. C. Valdiviezo INAOE xi

Page 13: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

ÍNDICE DE FIGURAS

4.9. Primera �la, de izquierda a derecha: resultados se segmentación obtenidos, respectivamente,

con W y M en los espacios RGB y I1I2I3, distancia de Mahalanobis y algoritmo de cuencas

e imagen de los �pimientos� cuantizada a 16 niveles de gris; segunda �la: imágenes de bordes

producidos por �ltros de Sobel para las imágenes de la primera �la. . . . . . . . . . . . . 88

4.10. Primera columna: imágenes en color RGB; segunda a quinta columnas: imágenes conformadas

por las segmentaciones producidas por W y M en los espacios RGB, I1I2I3, HSI y L*a*b*,

respectivamente. Las principales regiones de interès se han cuantizado. . . . . . . . . . . 90

5.1. Registro multiespectral de un documento antiguo usando un arreglo de �ltros. . . . . . . 98

5.2. Izquierda: imagen en color verdadero de la porción del palimpsesto utilizada para los experi-

mentos. Derecha: imagen en falso color realizada mediante la composición de las componentes

C1 y C2 obtenidas mediante PCA. . . . . . . . . . . . . . . . . . . . . . . . . . . . 107

5.3. Curvas espectrales de los puntos extremos determinados a partir de W y M . La correspon-

dencia de estos puntos es: pigmento 1 = w11, pigmento 2 = m1 y cuero = m11. . . . . . . 109

5.4. Imágenes de las abundancias de los materiales constituyentes del palimpsesto determinados

a partir de W y M . Izquierda: texto escrito en el siglo XII (pigmento 2); centro: texto escrito

en el siglo X (pigmento 1); derecha: cuero del manuscrito. . . . . . . . . . . . . . . . . 110

5.5. Resultados de segmentación de los pigmentos presentes en el palimpsesto de Arquímedes.

Primera �la, de izquierda a derecha: subimagen del manuscrito desplegada en color verdadero,

composición en falso color utilizando PCA. Segunda �la, izquierda a derecha: resultados del

agrupamiento por medias-K, mapas de abundancia que corresponden a los dos tipos de es-

critura determinados por el método W M . . . . . . . . . . . . . . . . . . . . . . . . 111

6.1. Dos tipos de sistemas de barrido usados para capturar una escena hiperespectral; el

número de bandas espectrales está determinado por los detectores que cubren inter-

valos de longitudes de onda (λ) especí�cos. . . . . . . . . . . . . . . . . . . . . . . 116

6.2. Imágenes a color de la escena hiperespectral registrada sobre la costa del Golfo de México.

Izquierda: imagen formada por la combinación de las bandas 54 (rojo), 34 (verde) y 14 (azul).

Derecha: combinación de bandas 81 (rojo), 217 (verde) y 54 (azul). . . . . . . . . . . . . 123

J. C. Valdiviezo INAOE xii

Page 14: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

ÍNDICE DE FIGURAS

6.3. Espectros de tres puntos extremos determinados con W y M en el cubo hiperespectral del

Golfo de México. Los valores de columna seleccionados a partir de W ∪M son: w2, w24, w54. 125

6.4. Espectros de tres puntos extremos obtenidos con el algoritmo VCA en el cubo hiperespec-

tral del Golfo de México. Los vectores columna sj para j = 1, . . . , 5 indican las columnas

correspondientes de S. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126

6.5. Imágenes a color de la escena hiperespectral de Beltsville. Izquierda: imagen formada por la

combinación de bandas 54 (rojo), 34 (verde) y 14 (azul). Derecha: combinación de bandas 81

(rojo), 54 (verde) y 34 (azul). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127

6.6. Espectros de cuatro puntos extremos determinados con W y M en el cubo hiperespectral de

Beltsville. Los vectores columna seleccionados a partir de W ∪M son: w24, w37, w47, w64. 128

6.7. Espectros de cuatro puntos extremos obtenidos con el algoritmo VCA en el cubo hiperespectral

de Beltsville. Los vectores columna sj para j = 1, . . . , 7 indican las columnas correspondientes

de la matriz S. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130

6.8. Mapas de abundancia en color de los recursos naturales determinados con la identi�cación

autónoma de puntos extremos en el cubo hiperspectral del Golfo de México. Izquierda: abun-

dancias de cuatro puntos extremos determinados con W y M , cuya distribución de colores

corresponde a amarillo = w2, magenta = w24, verde = w43, azul = w54. Derecha: abundan-

cias de tres puntos extremos determinados con VCA cuya distribución de colores es amarillo

= s4, magenta = s2, verde = s3. Áreas más brillantes representan mayor concentración del

recurso natural. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131

6.9. Mapas de abundancia en color de los tipos de vegetación obtenidos con la identi�cación

autónoma de puntos extremos en la imagen hiperespectral de Belstville. Izquierda: abundan-

cias de cuatro puntos extremos determinados con WM cuya distribución de colores corre-

sponde a magenta = w24, amarillo = w67, azul =m46, verde =m62. Derecha: abundancias de

cuatro puntos extremos determinados con VCA, cuya distribución de colores es magenta = s2,

amarillo = s3, azul = s5, verde = s7. Áreas más brillantes representan mayor concentración

del recurso natural. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132

J. C. Valdiviezo INAOE 1

Page 15: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

Capítulo 1

Introducción

En este primer capítulo se presenta el área de estudio en el que se desarrollará este trabajo de

tesis y plantea el problema que se quiere resolver. Subsecuentemente se presentan los objetivos

generales y particulares que se desean alcanzar por medio de esta investigación. En una sección

siguiente se hace una descripción de técnicas conocidas y que han sido reportadas para resolver

en forma alternativa el problema considerado. Finalmente, para cerrar este capítulo, se hace

una descripción de la propuesta de solución, base de esta investigación.

1.1. Antecedentes

El creciente surgimiento de dispositivos que realizan el registro de imágenes en distintos

escenarios y para diversas aplicaciones ha hecho necesario el desarrollo de nuevas técnicas para

el análisis y procesamiento de las imágenes. Este auge se debe a que las imágenes captadas

por un sensor proporcionan información útil sobre los objetos presentes en la escena. Especí�-

camente, una imagen se puede considerar como una función f(x, y) que conlleva información

de la energía radiada por una fuente de luz que ilumina la escena i(x, y) y la energía re�ejada

por los objetos, denominada re�ectancia r(x, y). De esta manera, debido a que la re�ectancia

de los objetos varía con la longitud de onda que emite la fuente de iluminación, el registro

de imágenes en porciones del espectro electromagnético distintas a la visible provee mayor

información acerca de los objetos presentes.

1

Page 16: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

1.1. ANTECEDENTES

En años recientes, los instrumentos conocidos como espectrómetros han sido acoplados

a sistemas ópticos formadores de imagen, surgiendo así los denominados espectrómetros de

imagen; este desarrollo conjunto ha permitido el avance en las técnicas para la adquisición de

imágenes en diferentes porciones del espectro electromagnético. Estos dispositivos registran

en forma de imagen la energía re�ejada o esparcida por un área u objeto, en un determinado

intervalo de longitudes de onda, ∆λ. De acuerdo con el número de bandas adquiridas, estos

dispositivos se pueden clasi�car en: multiespectrales si el instrumento es capaz de registrar

decenas de bandas espectralmente anchas en intervalos distintos que no necesariamente son

continuos, o hiperespectrales cuando el instrumento adquiere cientos de bandas cuasi contiguas

y espectralmente angostas.

Una característica importante de las imágenes adquiridas con estas técnicas es que, al

apilar cada una de las bandas espectrales, se forma un cubo de datos en el que cada pixel

es considerado como un vector con información de las n bandas que conforman el cubo. Así,

cada pixel de la imagen contiene información de la re�ectancia de los objetos en diferentes

porciones del espectro electromagnético. Esta información o espectro colectado en cada pixel

puede ser utilizado para diferenciar e identi�car los objetos presentes en dicha imagen. Esta

característica ha hecho posible que las imágenes multiespectrales e hiperespectrales puedan

ser utilizadas para gran cantidad de aplicaciones en áreas diversas.

En un principio, los espectrómetros de imagen fueron desarrollados para el monitoreo

y cuanti�cación de recursos naturales utilizando plataformas aéreas [2]; posteriormente, estos

instrumentos fueron aplicados con éxito en microscopía, biología y medicina para la detec-

ción de anomalías en células y tejidos orgánicos [15]. En los últimos años, los dispositivos

multiespectrales e hiperespectrales han demostrado ser una valiosa herramienta para la iden-

ti�cación de pigmentos en pinturas arqueológicas, así como en el realce de escrituras ocultas

en manuscritos antiguos que han sido preservados por el paso del tiempo [3, 8, 22]. Las apli-

caciones mencionadas son relevantes ya que representan técnicas no invasivas que permiten

analizar una escena mediante el registro único de su re�ectancia espectral.

J. C. Valdiviezo INAOE 2

Page 17: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

1.2. PLANTEAMIENTO DEL PROBLEMA

1.2. Planteamiento del problema

En una imagen adquirida mediante técnicas espectrales existen dos parámetros impor-

tantes que se deben considerar para realizar un análisis apropiado: la resolución espacial y la

resolución espectral. La resolución espacial se re�ere al detalle mínimo que puede ser registrado

por la óptica del instrumento. La resolución espacial está también relacionada con el tamaño

físico que abarca un pixel de la imagen sobre la escena registrada. La resolución espectral se

re�ere al ancho espectral de las bandas registradas. Así por ejemplo, los dispositivos hipere-

spectrales, que tienen una alta resolución espectral, realizan el registro de cientos de bandas

espectralmente angostas donde ∆λ ≤ 10 nm, que permiten comparar directamente el espectro

colectado en cualquier pixel de la imagen con algún espectro de referencia. Esta es una ven-

taja importante sobre los dispositivos multiespectrales, en los que la resolución espectral está

alrededor de 50 nm. Por su parte, la resolución espacial está en función de los componentes

ópticos y el mecanismo de adquisición que se utilice para el registro de la imagen. Ambas car-

acterísticas están relacionadas con el tipo de aplicación para el cual se requiere el instrumento

como, por ejemplo, monitoreo terrestre o análisis citológicos.

En diversas aplicaciones orientadas a la identi�cación de los materiales presentes en la

imagen, el proceso se di�culta debido a la presencia de espectros mezclados en muchos de los

pixeles; estas mezclas pueden originarse por dos razones. Primero, cuando la resolución espacial

del dispositivo es baja los pixeles de la imagen cubren una extensión física grande, lo que

conlleva a que la re�ectancia colectada esté compuesta por mezclas de espectros de diferentes

materiales en la zona. Además, las mezclas espectrales pueden ser causadas por la naturaleza

misma de los materiales que puedan estar combinados en una mezcla homogénea, como es el

caso del agua de mar o la arena. Por tanto la di�cultad en el análisis de imágenes adquiridas

con técnicas espectrales radica en la determinación de pixeles en la imagen que contengan el

espectro de re�ectancia de un único material. Al conjunto de pixeles que contienen el espectro

más puro de un único material se les denomina miembros �nales o puntos extremos [14].

En algunas aplicaciones donde se tiene conocimiento de los objetos que conforman la

escena es posible registrar el espectro de éstos con un espectrómetro de campo y utilizarlo para

identi�carlos en la imagen. Sin embargo, en muchas otras aplicaciones se requiere determinar

J. C. Valdiviezo INAOE 3

Page 18: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

1.3. OBJETIVO GENERAL

estos pixeles puros directamente desde la imagen, lo que hace necesario el uso de una técnica

autónoma para determinar el conjunto de puntos extremos.

Por otra parte, con el propósito de cuanti�car los componentes presentes en una escena

es necesario representar las mezclas de espectros utilizando una representación matemática.

Un modelo frecuentemente utilizado para este análisis es el modelo de mezclado lineal con

restricciones (MLR), en el cual se considera que el espectro de re�ectancia medido en un pixel

corresponde a la mezcla lineal de los pixeles más puros en la zona en proporcionos o fracciones

distintas denominadas abundancias. Las restricciones planteadas en este modelo consisten en

que todas las abundancias deben ser cantidades positivas y que deben sumar la unidad.

De esta manera, el problema en la determinación del conjunto de puntos extremos se

puede apreciar desde un punto de vista geométrico al considerar que los pixeles espectrales

más puros de�nen un conjunto convexo en el que cualquier otro pixel mezclado reside en el

interior de este conjunto.

1.3. Objetivo General

Aplicar las técnicas y propiedades desarrolladas en el contexto del álgebra reticular mini-

max para el análisis y segmentación de imágenes en color, multiespectrales e hiperespectrales

con base a la localización de sus puntos extremos.

1.3.1. Objetivos particulares

1. Determinar los puntos extremos en una imagen en color usando propiedades del álgebra

reticular, representar las mezclas de color presentes usando el modelo de mezclado lineal

y, posteriormente, segmentarla.

2. Determinar los puntos extremos para el análisis de imágenes multiespectrales, en par-

ticular los diferentes pigmentos presentes en imágenes multiespectrales de documentos

antiguos.

3. Adquirir un conjunto de espectros en el laboratorio utilizando un espectrómetro de línea

J. C. Valdiviezo INAOE 4

Page 19: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

1.4. AVANCES RECIENTES

para veri�car el modelo MLR.

4. Comparar el desempeño de un método conocido para el análisis de imágenes hiperespec-

trales con el método propuesto.

1.4. Avances recientes

En años recientes diversas técnicas basadas en geometría convexa han sido desarrolladas

con el propósito de determinar, de manera autónoma, el conjunto de pixeles más puros, que

a su vez corresponde a los materiales que conforman la imagen. Cada técnica está basada en

algun criterio particular de selección. En las siguientes líneas serán descritos los métodos más

importantes.

1.4.1. Técnicas basadas en geometría convexa

Estas técnicas han sido desarrollada para la determinación de puntos extremos en

imágenes hiperespectrales y comparten un fundamento geométrico, basado en el modelo MLR

y consiste en la representación de los pixeles espectrales n-dimensionales de la imagen como

un conjunto convexo, donde sus vértices corresponden a los puntos extremos.

Índice de pureza de pixel (Pixel purity index, PPI). El método realiza una reducción

de bandas del cubo de datos y continúa mediante repetidas proyecciones de los datos sobre

vectores unitarios aleatorios no paralelos (llamados skewers). Los puntos extremos en cada

proyección se marcan y se almacena en un contador, el número de veces que un pixel se

determina como extremo. El resultado �nal del conteo se utiliza para identi�car los pixeles

más puros en la escena y éstos, a su vez, se comparan con espectros de referencia [4, 5]. Debido a

que no hay un criterio para seleccionar el número de vectores unitarios, este procedimiento debe

realizarse a prueba y error, lo que resulta en una alta complejidad computacional. Además,

esta técnica no garantiza que los vectores �nales generados sean puntos extremos, por lo que

puede considerarse como una aproximación.

J. C. Valdiviezo INAOE 5

Page 20: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

1.4. AVANCES RECIENTES

Análisis de cono convexo (Convex cone analysis, CCA). La técnica toma de base el hecho

de que cantidades físicas, como la radiancia, son estrictamente no-negativas y asume que los

vectores formados por estos espectros residen dentro de una región convexa. Así, con uno de

sus vértices en el origen, esta región de�ne un cono. De esta manera, el objetivo es encontrar

la frontera de esta región convexa. En el procedimiento se calcula una matriz de correlación a

partir de la imagen y se calculan los eigenvectores de la matriz por medio de la descomposición

de valores singulares (singular value decomposition, SVD). En esta descomposición se utiliza

una matriz de correlación y se seleccionan los eigenvectores relacionados con los eigenvalores

más grandes. La combinación lineal de estos eigenvectores produce vectores no-negativos. Es

posible entonces encontrar un conjunto de coe�cientes que produzcan una combinación lineal

y que contengan algunos elementos igual a cero y los demás estrictamente no-negativos. Estos

puntos representan los vértices del cono, cuyos espectros pueden ser usados como miembros

�nales. Al utilizar esta técnica se necesita conocer a priori el número de componentes de

interés, el cual no debe ser mayor a la dimensionalidad de los datos. Asimismo, la complejidad

computacional del algoritmo es alta [13].

Algoritmo N-FINDR. Este método está basado en el hecho de que en un arreglo n-dimensional

de pixeles espectrales los pixeles puros de�nen el simplex de volumen más grande. La técnica

determina el conjunto de pixeles que forman el volumen más grande posible al in�ar un sim-

plex dentro de los datos. Siendo la entrada el cubo de datos completo, el algoritmo comienza

con un conjunto aleatorio de vectores y una matriz E de miembros �nales. Para realizar una

buena estimación, cada pixel de la imagen debe ser evaluado; para ello, se calcula el volumen

de cada uno reemplazando cada punto extremo por un pixel en la posición del primero. Si el

reemplazo resulta en un incremento del volumen, el pixel reemplaza al punto extremo dado.

El procedimiento se repite hasta que no haya más reemplazos de puntos extremos. Una vez

que los pixeles puros se han encontrado, sus espectros pueden ser usados para separar las

mezclas en la imagen original. Una di�cultad con este método se presenta cuando hay pixeles

mezclados cuyo brillo es más alto que los pixeles puros, entonces el algoritmo los selecciona

como puntos extremos [23].

J. C. Valdiviezo INAOE 6

Page 21: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

1.4. AVANCES RECIENTES

Análisis de componentes de vértices (Vertex component analysis, VCA). Esta técnica no

supervizada está basada en la descomposición de valores singulares y el análisis de componentes

principales como subprocedimientos [16]. En particular este algoritmo asume la existencia de

pixeles puros y explota el hecho de que los puntos extremos son vértices de un simplex,

por lo que la transformación afín de un simplex es también un simplex. La técnica proyecta

iterativamente los datos en una dirección ortogonal al subespacio ocupado por los puntos

extremos ya determinados. El nuevo espectro del miembro �nal es el extremo de la proyección,

entonces el lazo principal continúa hasta que todos los puntos extremos dados son agotados.

Algoritmo de crecimiento de un simplex. Este método está inspirado en el algoritmo

N-FINDR y toma de base sus limitaciones para mejorarlas. Primero, para estimar el número de

miembros �nales requeridos p, el método utiliza el concepto de dimensionalidad virtual (VD)

[7]. De esta manera, el algoritmo encuentra un simplex de dimensión p−1 con el volumen más

grande al crecer gradualmente varios simplex vértice por vértice. Es decir, en lugar de hacer

el intento por encontrar directamente un simplex con p vértices y con el máximo volumen, el

método primero encuentra un simplex con dos vértices con el volumen más grande; a partir

de éste se comienzan a crecer nuevos simplex. De esta manera, el método sólo tiene que

encontrar un miembro �nal a la vez hasta que alcance el número deseado de miembros �nales,

p, el cual ha sido estimado mediante VD. A diferencia del algoritmo N-FINDR que inicializa

la matriz E con pixeles aleatorios, el algoritmo de crecimiento de un simplex resuelve esta

di�cultad al seleccionar cuidadosamente los vectores para inicializar el algoritmo. Aunque el

algoritmo presenta una mayor complejidad computacional, los miembros �nales determinados

son similares a los obtenidos por VCA [8].

Un simplex que encierra el volumen mínimo (Minimum volume enclosing simplex,

MVES). Este método comienza con un simplex de volumen más grande e iterativamente mueve

sus caras hacia la nube de datos1. En la técnica se utilizan análisis convexo y técnicas de

optimización para desarrollar un algoritmo de separación hiperespectral. El uso del análisis

convexo está motivado por el hecho de que conceptos tales como casco afín y casco convexo,

1Esta idea fue propuesta por Craig et al. en [9].

J. C. Valdiviezo INAOE 7

Page 22: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

1.5. METODOLOGÍA

son adecuados para el análisis de este problema. El procedimiento realizado por el método

se resume como sigue. Primero se realiza una reducción en la dimensionalidad de los pixeles

observados por medio de un concepto de análisis convexo denominado ajuste de conjunto afín.

El problema de hallar el volumen mínimo fue modi�cado a un problema de minimizar el volu-

men de un simplex sujeto a la condición de que todos los pixeles de dimensión reducida estén

encerrados por éste. Entonces se emplea el criterio de separación de Craig para formular la

separación como un problema de optimización. La función objetivo del MVES no es convexa,

pero el problema puede ser manejado en una manera cíclica al resolver una secuencia de prob-

lemas de programación lineal. Una ventaja de este método es que no necesitan haber pixeles

puros en la imagen [6].

1.5. Metodología

Con el desarrollo de este trabajo de investigación el problema que se desea resolver es el

de determinar el conjunto de pixeles más saturados, en el caso de una imagen en color, así como

aquellos que contengan la mayor pureza espectral en una imagen multi- o hiperespectral y que

puedan ser usados para representar las mezclas en la imagen. La segmentación de imágenes

de tres canales representa el punto de partida en el que se considera que la imagen ha sido

adquirida utilizando tres �ltros de banda ancha, centrados en las longitudes de onda del rojo

(700 nm), verde (546 nm) y azul (435 nm) [12]. De esta manera, el objetivo será determinar los

pixeles que contengan la mayor saturación en las longitudes consideradas. Una vez que sean

determinados los pixeles puros en una escena se tendrá información su�ciente para separar

los diversos componentes que presenten características espectrales semejantes dentro de la

imagen. Además, cualquier combinación de éstos será posible de estimar a partir del modelo

de mezclado lineal. Los alcances de este trabajo incluyen un estudio acerca de los métodos

para determinar, en cada pixel de la imagen, ya sean fracciones de color o las abundancias de

materiales según corresponda al tipo de imagen.

Parte complementaria en el desarrollo de este trabajo de investigación será el registro

de espectros de diversos tipos de vegetación, así como de mezclas espectrales obtenidas en el

J. C. Valdiviezo INAOE 8

Page 23: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

1.5. METODOLOGÍA

laboratorio a través del espectrómetro de línea BWTek. El registro de espectros de vegetación

ayuda a comprender los factores que contribuyen a alteraciones en su forma debido a cambios

físicos como la temperatura o humedad. Además, la idea de realizar mezclas espectrales permite

corroborar el modelo de mezclado lineal para representar las mezclas de espectros de los

diferentes materiales presentes en una escena. Por tanto, con este trabajo experimental se

podrá tener una idea más clara del proceso de adquisición de pixeles mezclados en imágenes

multi- e hiperespectrales.

En el caso de imágenes multiespectrales de documentos antiguos, las imágenes que han

sido consideradas para el análisis espectral han sido registradas por el proyecto del Palimpsesto

de Arquímedes y se encuentran disponsibles con �nes de investigación en [1] y [3]. Estas

imágenes fueron registradas utilizando diodos emisores de luz (light emitting diodes, LEDs) que

emiten radiación en diferentes longitudes de onda. La porción del espectro electromagnético

que se ha registrado comprende de 365 a 870 nm, con una resolución espectral alrededor de

30 nm, siendo más angosta en ciertas porciones y más ancha en otras [10].

Por otra parte, existen imágenes de sensado remoto que pueden ser utilizadas para

localizar y cuanti�car los recursos naturales presentes en una escena. Las imágenes frecuente-

mente utilizadas por su disponibilidad son aquellas que han sido adquiridas utilizando el

espectrómetro de imagen AVIRIS (Airborne Visible and Infrared Imaging Spectrometer) [2]. El

instrumento registra imágenes en las porciones del espectro que comprenden de 400 a 2500

nm, con una resolución espectral de 10 nm. Una imagen adquirida en un área determinada

consta de 5 escenas; a su vez, cada una de estas escenas está formada por 512 líneas × 614

pixeles × 224 bandas espectrales, en donde los valores de re�ectancia están escalados por un

factor de 10000. Debido a que el instrumento se coloca en una plataforma aérea, cada pixel

de la imagen corresponde a un área terrestre de 20 × 20 = 400 m2. Las imágenes que están

disponibles para investigación han sido registradas sobre las zonas geográ�cas de Cuprite en

Nevada, además de Mo�et Field y Jasper Ridge en California, las cuales son importantes para

el estudio de minerales, asentamientos humanos y tipos de vegetación, respectivamente. En

esta investigación se ha considerado el uso de dos imágenes recientemente registradas por un

sensor remoto de la compañía SpecTir, cuyas características serán discutidas más adelante.

J. C. Valdiviezo INAOE 9

Page 24: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

1.5. METODOLOGÍA

1.5.1. Propuesta de solución

En este trabajo de investigación se utilizarán desarrollos recientes del álgebra reticular

minimax y su relación con la geometría de conjuntos convexos para la determinación de

puntos extremos en imágenes a color, multiespectrales e hiperespectrales. En el análisis se toma

de base el modelo de mezclado lineal para describir las mezclas espectrales en las imágenes

utilizadas. Así, el objetivo de la técnica presentada consistirá en extraer desde cualquier imagen

el conjunto de puntos extremos que puedan ser utilizados para calcular sus correspondientes

abundancias en la imagen. Además, cualquier pixel de la imagen se podrá representar como

una combinación lineal de éstos.

Basado en el álgebra reticular minimax, el cálculo de dos memorias asociativas reticu-

lares matriciales, conocidas como memorias min-W y max-M , permitirá obtener un conjunto

de puntos extremos relacionados con la imagen. Especí�camente, dada una imagen con n

número de bandas, lo único que se requiere es calcular las memorias W y M y sus corre-

spondientes columnas escaladas. El conjunto formado por las columnas escaladas y las cotas

vectoriales mínima y máxima de�nen los vértices del conjunto convexo mínimo que es capaz

de encerrar a todos los pixeles de la imagen. De ahí que estas columnas puedan ser utilizadas

para calcular las fracciones de los puntos extremos en cada pixel de la imagen.

Las memorias asociativas reticulares fueron introducidas como un nuevo paradigma

en el almacenamiento y recuperación de imágenes afectadas por ruido [18, 19]. Posterior-

mente se propuso utilizar algunas de sus propiedades para determinar miembros �nales en

imágenes hiperespectrales [11]. Más recientemente, algunas otras aplicaciones han estado ori-

entadas a la determinación de conjuntos reticularmente independientes [20, 32]. Finalmente,

con el propósito de realizar una comparación cuantitativa de los resultados obtenidos con el

método propuesto, se realiza una comparación con aquellos determinados con el análisis de

componentes de vértices (VCA), descrito en p. 7.

1.5.2. Estructura del trabajo de tesis

La estructura de este documento es la siguiente. En el capítulo 2 se introducen los

fundamentos físicos de los procesos de interacción entre materia y energía, los cuales son

J. C. Valdiviezo INAOE 10

Page 25: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

1.5. METODOLOGÍA

la base de la espectroscopía. Enseguida se describen algunos aspectos de instrumentación

que son importantes para conocer el funcionamiento de los espectrómetros. Más adelante se

presentan los resultados obtenidos al realizar el registro de espectros de energía re�ejada para

diversos tipos de vegetación en diferentes condiciones de vitalidad. El capítulo concluye con

una explicación de un instrumento moderno que se utiliza para registrar múltiples imágenes

de las características espectrales de una escena.

El capítulo 3 inicia con una breve explicación acerca de la geometría de conjuntos

convexos y su representación en espacios multidimensionales. Más adelante se dan los conceptos

y las propiedades del álgebra reticular minimax, que conforman la base matemática de esta

investigación. Después se de�nen las memorias asociativas reticulares y se mencionan sus

principales propiedades, así como algunas de sus aplicaciones. Finalmente se plantea el vínculo

existente entre la geometría de conjuntos convexos y los vectores columna de las memorias

asociativas reticulares escaladas.

El capítulo 4 inicia con una descripción del procedimiento de análisis que será utilizado

para realizar la segmentación de imágenes en color a partir de las memorias autoasociativas

reticulares. Posteriormente se propone el uso de otros espacios de color para mejorar los re-

sultados que se obtienen con la técnica propuesta. Finalmente, los resultados de segmentación

obtenidos se presentan y se realiza una comparación cuantitativa con algunas otras técnicas

conocidas en la literatura.

En el capítulo 5 se realiza el análisis multiespectral de una de las páginas del palimpses-

to de Arquímedes. Primeramente se realiza una descripción de la instrumentación, utilizada

para registrar la imagen multiespectral del documento, así como algunas técnicas empleadas

para estimar la re�ectancia espectral. Enseguida se describe la aplicación de las memorias

autoasociativas reticulares para el caso multiespectral. Al �nalizar este capítulo se presentan

los resultados de la distribución de pigmentos obtenidos para este tipo de imagen y se realiza

una comparación con el análisis de componentes principales y el agrupamiento con medias-k.

En el capítulo 6 se realiza el análisis de dos imágenes hiperespectrales registradas

por un espectrómetro de imagen de la compañía SpecTir. A partir de la descripción de la

instrumentación y el proceso de calibración de estos dispositivos se realiza una descripción de

J. C. Valdiviezo INAOE 11

Page 26: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

1.5. METODOLOGÍA

las características de los datos hiperespectrales. Más adelante, se introduce una modi�cación

necesaria al método basado en las memorias autoasociativas para poder determinar el conjunto

de puntos extremos en este tipo de imágenes. Subsecuentemente, los mapas de abundancias

de los materiales se presentan para cada punto extremo determinado. Este capítulo concluye

mediante una comparación de los puntos extremos determinados con el método W y M y

el algoritmo VCA. El trabajo de tesis �naliza con el capítulo 7 en el que se resumen las

conclusiones principales y se comenta la dirección del trabajo futuro.

J. C. Valdiviezo INAOE 12

Page 27: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

Bibliografía

[1] Archimedes Palimpsest, �The Archimedes Palimpsest Project,� www.archimedespalimpsest.net,

2008.

[2] Aviris JPL., �AVIRIS home page,� www.aviris.jpl.nasa.gov, 1997.

[3] Bearman G., Zuckerman B., Zucherman K., Chiu J., �Multi-spectral digital imaging of Dead Sea

scrolls and other ancient documents,� JPL Technical Report, California Institute of Technology,

1995.

[4] Boardman J.W., �Automated spectral unmixing of AVIRIS data using convex geometry concepts,�

AVIRIS Workshop Proceedings, JPL Publication, Vol. 1, No. 4, pp. 11�14, 1993.

[5] Boardman J.W. and Kruse F.A., �Automated spectral analysis: A geological example using

AVIRIS data, Northern Grapevine Mountains, Nevada,� Proc. 10th Thematic Conference, Ge-

ologic Remote Sensing, San Antonio, TX, 1994.

[6] Chan T.H., Chi C.Y., Huang Y.M., Ma W.K., �A convex analysis based minimum-volume enclos-

ing simplex algorithm for hyperspectral unmixing,� IEEE Trans. on Signal Processing, Vol. 57,

No. 11, pp. 4418-4432, 2009.

[7] Chang C.-I, Hyperspectral Imaging: Techniques for Spectral Detection and Classi�cation, Vol. 1,

Kluwer Academic, New York, NY, 2003.

[8] Chang C.I., Wu C.C., Liu W.M., Ouyang Y.C., �A new growing method for simplex based ex-

traction endmember algorithm,� IEEE Trans. on Geoscience and Remote Sensing, Vol. 44, No.

10, pp. 2804�2819, 2006.

13

Page 28: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

BIBLIOGRAFÍA

[9] Craig M.D.,�Minimum-volume transforms for remotely sensed data,� IEEE Trans. Geoscience and

Remote Sensing, Vol. 32, No. 3, pp. 542�552, 1994.

[10] Easton R.L., Knox K.T., Christens-Barry W.A., �Multispectral imaging of the Archimedes

Palimpsest,� Proc. 32nd AIPR, pp. 111�118, 2003.

[11] Graña M., Gallego J., �Hyperspectral image analysis with associative morphological memories,�

IEEE Proc.: ICIP, Vol. 7803, pp. 549�552, 2003.

[12] Gonzalez R.C., Woods R.E., Digital Image Processing, 3rd edition, Pearson Education, pp. 331,

567�569, 2008.

[13] Ifarraguerri A., Chang C.-I, �Multispectral and hyperspectral image analysis with convex cones,�

IEEE Trans. on Geoscience and Remote Sensing, Vol. 37, No. 2, pp. 756�770, 1999.

[14] Keshava N., �A Survey of spectral unmixing algorithms,� Lincoln Laboratoy Journal, Vol. 14, No.

1, pp. 55�74, 2003.

[15] More K.A., �Spectrometers.� In: Encyclopedia of Modern Optics, Robert D. Guenther editor, Vol.

1, pp. 324�336, Elsevier, Academic Press, 2005.

[16] Nascimento J.M.P., Bioucas-Díaz J.M., �Vertex component analysis: a fast algorithm to unmix

hyperspectral data,� IEEE Trans. on Geoscience and Remote Sensing, Vol. 43, No. 4, pp. 898�910,

2005.

[17] Plaza A., Martínez P., Pérez R., Plaza J., �Spatial/spectral endmember extraction by multidi-

mensional morphological operations,� IEEE Trans. on Geoscience and Remote Sensing, Vol. 49,

No. 9, pp. 2025�2041, 2002.

[18] Ritter G. X., Sussner P., Diaz de Leon J. L., �Morphological associative memories,� IEEE Trans.

Neural Networks, Vol. 9, No. 2, pp. 281�293, 1998.

[19] Ritter G.X., Urcid G., Iancu L., �Reconstruction of patterns from noisy inputs using morpho-

logical associative memories,� Jour. of Math. Imag. and Vis., Vol. 19, No. 2, pp. 95�111, 2003.

[20] Ritter G.X., Schmalz M.S., Urcid G., �E�cient autonomous endmember determination using

lattice auto-associative memories,� WSC Proc. of the 10th Joint Conference on Information Sci-

ences, pp. 1632�1638, 2007.

J. C. Valdiviezo INAOE 14

Page 29: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

BIBLIOGRAFÍA

[21] Valdiviezo J.C., Urcid G., �Hyperspectral endmember detection based on strong lattice indepen-

dence,� SPIE Proc.: Applications of Digital Image Processing XXX, Vol. 6696, pp. 669625:1�12,

2007.

[22] Ware G.A., Chabries D.M., Christiansen R.W., Brady J.E., Martin C.E., �Multispectral Analysis

of Ancient Maya Pigments: Implications for the Naj Tunich Corpus,� IEEE Proc.: IGARSS, Vol

6, pp. 2489�2491, 2000.

[23] Winter M.E., �N-FINDR: An algorithm for fast autonomous spectral endmember determination

in hyperspectral data,� SPIE Proc.: Imaging Spectrometry V, pp. 266�275, 1999.

J. C. Valdiviezo INAOE 15

Page 30: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

Capítulo 2

Fundamentos de Espectroscopía

En este capítulo se introducen los fundamentos físicos de la emisión y absorción de energía

radiante, que serán útilies para comprender los capítulos subsecuentes. En particular, se hace

una descripción de los procesos fundamentales de interacción entre materia y energía; enseguida

se presenta una descripción de los instrumentos utilizados para medir espectros de energía y

se presentan algunos aspectos de su adquisición en el laboratorio utilizando un espectrómetro

de línea particular. Por último, se presenta la descripción de un espectrómetro de imagen.

2.1. Principios

La espectroscopía es un área de estudio importante cuyas técnicas han sido aplicadas con

éxito en áreas diversas como astronomía, biología, química y, en los últimos años, la percepción

remota. Formalmente, la espectroscopía consiste en el estudio de la materia y su interacción

con la energía radiante o radiación [15]. Las primeras aplicaciones de este campo de estudio

están relacionadas con la identi�cación de sustancias a partir del espectro de energía emitido

o absorbido. En la actualidad, las aplicaciones de la espectroscopía incluyen la medición de la

composición química, así como las propiedades físicas de diversos materiales.

16

Page 31: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

2.1. PRINCIPIOS

2.1.1. La radiación electromagnética

Nuestros ojos son capaces de detectar una pequeña parte de la energía radiante existente

en la naturaleza y que hemos denominado luz visible; sin embargo, ésta corresponde a una

pequeña porción de la radiación electromagnética que es posible detectar con otros dispositivos.

La radiación electromagnética se ha clasi�cado en base a su energía o frecuencia, en lo que se

conoce como espectro electromagnético. Una clasi�cación del espectro en orden creciente de

energía es la siguiente: ondas de radio, microondas, infrarrojo, luz visible, ultravioleta, rayos X

y rayos gamma; mientras que las ondas de radio y las microondas poseen la menor cantidad de

energía, los rayos gamma son el tipo de radiación con la mayor energía. Además, una propiedad

importante que comparten todas las formas de radiación electromagnética es su velocidad de

propagación en el espacio libre; a esta velocidad se le conoce como velocidad de la luz c y su

valor es 299, 793 km/s [15]. Otra característica importante de la radiación electromagnética es

que su comportamiento puede ser descrito tanto como el de una onda como de un conjunto

de partículas.

Desde el punto de vista clásico de las ecuaciones de Maxwell, la radiación electromag-

nética es considerada como una onda sinusoidal compuesta por un campo eléctrico E y un

campo magnético B vibrando en planos perpendiculares uno respecto del otro. Estos campos

están en fase y sus magnitudes se representan como E y B, respectivamente. Además, cada

onda electromagnética está caracterizada por su longitud de onda λ (distancia entre picos)

y su frecuencia ν (número de ciclos por segundo), las cuales se relacionan con la velocidad

de la luz mediante λν = c. Es importante observar que, conforme aumenta la longitud de

onda, disminuye la frecuencia o energía. En la �gura 2.1 se presentan las distintas bandas que

conforman el espectro electromagnético.

2.1.2. Interacción materia-energía

La radiación electromagnética que interactúa con la materia puede sufrir diversos cam-

bios que dependen de la constitución física y química de los materiales que han sido expuestos

a esta radiación [14]. Al considerar una onda electromagnética que viaja en el espacio libre

y se encuentra en la frontera con algún medio material, parte de ella será re�ejada en la

J. C. Valdiviezo INAOE 17

Page 32: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

2.1. PRINCIPIOS

-1510

-1110 10 10 10 10-8 -6 -3 -1 510

19 16 11 910 10 10 10 31010

22

RayosGamma

RayosX

UV IR Microondas

Radio

400 700

1310

l(m)

n(Hz)

l(nm)

Figura 2.1: Espectro electromagnético en orden creciente de longitud de onda.

frontera y la otra parte será transmitida al medio material dependiendo de su constitución.

Los fenómenos conocidos como re�exión, transmisión, absorción y emisión se describen en las

siguientes líneas.

La re�exión ocurre en la frontera que divide a los dos medios materiales y su dirección

dependerá tanto del ángulo de incidencia de la onda, así como de la rugosidad de la super�cie.

Si la super�cie es suave comparada con la longitud de onda incidente, la re�exión será de

manera especular; en caso contrario, si la super�cie es rugosa, la energía será dispersada en

diversas direcciones.

El fenómeno de transmisión de la onda electromagnética al medio causa un cambio en

su dirección de propagación, el cual se debe a una disminución de su velocidad al entrar a un

medio más denso. La ecuación que relaciona los ángulos de incidencia θ1 y refracción θ2 con

los índices de refracción de dos medios materiales n1 y n2, respectivamente, está dada por la

ley de Snell-Descartes,

n1 sin θ1 = n2 sin θ2. (2.1)

Por otra parte, la radiación transmitida puede ser absorbida por las moléculas del

material en ciertas longitudes de onda; a este fenómeno se le conoce como absorción y depende

de la constitución química del material. Finalmente, la energía que es absorbida por el material

se transforma en energía calórica que aumenta su temperatura; a su vez, esta energía puede

J. C. Valdiviezo INAOE 18

Page 33: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

2.1. PRINCIPIOS

ser emitida en forma de radiación. A dicho fenómeno se le conoce como emisión, en donde la

longitud de onda emitida dependerá de la temperatura del material.

2.1.3. Espectros de emisión y absorción

Los primeros espectros de luz que fueron registrados datan del siglo XVII con los

experimentos de Isaac Newton, en los que descubre que la luz se dispersa en distintos colores

al pasar a través de un prisma. Más tarde se descubrió que un arreglo de alambres paralelos

e igualmente espaciados también eran capaces de dispersar luz. Estos descubrimientos cons-

tituyen los fundamentos de la espectroscopía y han permitido el desarrollo de instrumentos

para producir espectros de aborción y emisión a partir de algún material.

Durante el siglo XIX, diversos experimentos no pudieron ser explicados desde el punto

de vista clásico en el que la materia interactúa con la energía en forma continua. Así, los

trabajos de diversos cientí�cos como Planck y Bohr sugirieron que en muchas procesos de

interacción, la energía electromagnética podía ser tratada como un conjunto de partículas o

cuantos, cuya energía E está dada por:

E = hν, (2.2)

donde h = 6,626 × 10−34 J·s es la constante de Planck y ν es equivalente a la frecuencia de

la onda [15]. Basado en estos postulados, Niels Bohr propuso uno de los primeros modelos

atómicos que dieron una clara explicación al fenómeno de absorción y emisión de energía. En

este modelo atómico los electrones se consideran partículas pequeñas con carga negativa que se

mueven alrededor del núcleo del átomo, cargado positivamente. La interacción entre el núcleo

y los electrones mantienen al electrón en órbita. Este movimiento está restringido a intervalos

bien de�nidos a partir del núcleo y que se pueden pensar como niveles de energía permitidos.

Para explicar los espectros de emisión, Bohr descubrió que los átomos obedecen tres reglas

básicas.

1. Los electrones sólo tienen ciertos niveles de energía que corresponden a distancias desde

el núcleo. En estos niveles de energía, el electrón no perderá o absorberá energía.

J. C. Valdiviezo INAOE 19

Page 34: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

2.1. PRINCIPIOS

2. Las órbitas más cercanas al núcleo tienen energía más baja.

3. Los átomos tienden a estar en el estado de energía más bajo posible, llamado estado

base.

En efecto, para que un electrón cambie a un nivel de energía más alto se necesita aplicar una

determinada cantidad de energía. Si la cantidad de energía recibida es su�ciente, el electrón

cambiará a un nuevo estado como resultado de una absorción. Una vez que el electrón está

en una órbita más alta, éste posee energía potencial. Después de un tiempo corto el electrón

regresa a un nivel de energía más bajo, emitiendo radiación. La cantidad de radiación emitida

es una función del fotón de energía absorbido.

En la actualidad se ha comprobado que cuando una molécula interacciona con la ra-

diación, un cuanto de energía o fotón se emite o absorbe. Así, el cambio de energía para

una molécula entre los niveles E1 y E2, donde E1 ≥ E2, puede ocurrir suministrando la en-

ergía apropiada ∆E = E1 − E2 . La frecuencia de emisión o absorción de radiación para una

transición entre estos estados de energía está dada por,

ν =E1 − E2

h. (2.3)

Lo anterior explica que para una molécula que se encuentra en el estado E2 y recibe radiación

electromagnética con frecuencia ν, la energía será absorbida y la molécula pasará al estado E1

[2]. Las absorciones de energía ocurren cuando la frecuencia de la energía incidente es igual a

la frecuencia de resonancia del átomo o molécula.

Los procesos de emisión y absorción selectiva de energía son utilizados para determinar

la composición química de las moléculas e identi�car a los materiales. Al realizar un muestreo

de las líneas de energía emitidas por un material en función de la longitud de onda incidente

se tiene un espectro de emisión. Por otra parte, si el muestreo se realiza tomando en cuenta

las líneas de absorción en función de la longitud de onda incidente, el espectro se conoce como

espectro de absorción [2, 3].

J. C. Valdiviezo INAOE 20

Page 35: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

2.1. PRINCIPIOS

2.1.4. Re�ectancia, absortancia y transmitancia

Las cantidades radiométricas de re�ectancia, absortancia y transmitancia se utilizan

con frecuencia en espectroscopía y en sensado remoto para representar la cantidad de �ujo

radiante incidente que entra o sale de alguna super�cie. La ecuación que establece una relación

para la cantidad total de �ujo radiante incidente sobre una super�cie, Φi(λ), en una longitud

de onda λ, debe considerar la cantidad de �ujo re�ejado por la super�cie Φr(λ), la cantidad

de �ujo absorbido Φα(λ) y la cantidad de �ujo transmitido a través de la super�cie Φτ(λ) (por

ejemplo en unidades de W/cm2), ésto es,

Φi(λ) = Φr(λ) + Φα(λ) + Φτ(λ). (2.4)

Estas cantidades radiométricas están basadas en la cantidad de energía radiante incidente a

una super�cie en cualquier ángulo. Por tanto, se de�nen la re�ectancia r(λ), la transmitancia

τ(λ) y la absortancia α(λ), como la razón entre el �ujo radiante re�ejado, transmitido o

absorbido, respectivamente por una super�cie, y el �ujo incidente a ésta, las cuales están

de�nidas por las relaciones

r(λ) =Φr(λ)

Φi(λ)

, τ(λ) =Φτ(λ)

Φi(λ)

, α(λ) =Φα(λ)

Φi(λ)

. (2.5)

En efecto, tomando en cuenta las cantidades radiométricas antes de�nidas, se puede

escribir la ec. (2.4) como:

i(λ) = r(λ) + α(λ) + τ(λ) = 1. (2.6)

Esta ecuación implica que la energía radiante incidente debe conservarse ya sea que se re�eje,

se trasmita a través del material, se disperse y sea absorbida para luego ser transformada en

alguna otra forma de energía.

2.1.5. Características espectrales de la vegetación

La vegetación constituye uno de los objetivos de estudio de esta investigación ya que nos

permite analizar los factores que controlan la re�ectancia en las hojas como, por ejemplo, la

pigmentación y la humedad, así como estudiar las diferencias en la forma del espectro adquirido

J. C. Valdiviezo INAOE 21

Page 36: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

2.1. PRINCIPIOS

debido a cambios en las condiciones físicas, como la temperatura o vitalidad de la muestra.

La vegetación absorbe gran cantidad de la energía radiante incidente que corresponde a la

porción visible debido a la fotosíntesis. Además, aproximadamente la mitad del �ujo radiante

incidente que corresponde al infrarrojo cercano es re�ejado por ella [10].

La fotosíntesis es un proceso de almacenamiento de energía que tiene lugar en las hojas

y en otras partes verdes de las plantas en presencia de luz. Este proceso se inicia cuando la

luz del sol llega a los cloroplastos, que son pequeños cuerpos en la hoja que contienen una

sustancia verde llamada cloro�la. La energía luminosa se almacena en una molécula simple de

azúcar (glucosa) que se produce por el bióxido de carbono (CO2) y el agua (H20) absorbida

por la planta. Cuando el dióxido de carbono y el agua se combinan, lo que forma una molécula

de azúcar (C6H12O6) en un cloroplasto, se libera gas de oxígeno (O2).

La energía electromagnética proveniente del sol interactúa con los pigmentos, el agua

y los espacios intercelulares dentro de la hoja de la planta. La cantidad de �ujo radiante

re�ejado por la hoja (Φr), el �ujo absorbido (Φα), y la cantidad de �ujo radiante transmitido

a través de la hoja (Φτ ) pueden ser medidos cuidadosamente. En base a la ec. (2.4), la energía

re�ejada por la super�cie de la hoja es igual a la energía incidente menos la energía absorbida

y la transmitida por la hoja. Tomando en cuenta la ec. (2.6), la relación entre la re�ectancia

espectral de la hoja con la absortancia y transmitancia dentro de la hoja puede escribirse de

la siguiente manera:

r(λ) = i(λ)− α(λ)− τ(λ), (2.7)

donde la energía re�ejada por la super�cie de la hoja es igual a la energía incidente menos

la energía absorbida directamente por la planta para realizar la fotosíntesis y la cantidad de

energía transmitida a través de la hoja.

Los factores dominantes que controlan la re�ectancia de las hojas en la porción visible

del espectro son los pigmentos conocidos como cloro�la a, b y β-caroteno. De esta manera,

cuando un fotón de luz llega a una molécula, ésta re�eja algo de la energía o puede absorberla y

así entrar dentro de un estado excitado. Cada molécula absorbe o re�eja sus propias longitudes

de onda características. En una planta verde común, las moléculas han evolucionado para

absorber longitudes de onda en la porción visible (350 a 700 nm) y son denominadas pigmentos.

J. C. Valdiviezo INAOE 22

Page 37: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

2.2. ESPECTRÓMETROS

El espectro de absorción para un pigmento particular describe las longitudes de onda a las

cuales éste puede absorber luz y entrar a un estado excitado. Los pigmentos de cloro�la son

los más importantes en la planta pues absorben en las longitudes de onda de 430 y 660 nm

(cloro�la a), y en 450 y 650 nm (cloro�la b); estos espectros de absorción se pueden ver en la

�gura 2.2. En efecto, la absorción más baja de las longitudes de onda verdes, comparada con

aquellas que corresponden al rojo y azul, hacen que las plantas en estado saludable las veamos

verdes.

Longitud de onda (nm)

clorofila a

clorofila b

Ab

so

rta

ncia

Figura 2.2: Espectro de absorción de la cloro�la a y b.

2.2. Espectrómetros

El instrumento utilizado para medir la energía re�ejada o emitida por un material en

función de la longitud de onda se denomina espectrómetro. El elemento encargado de dispersar

la energía electromagnética de entrada se conoce como monocromador, mismo que puede ser un

prisma o una rejilla de difracción [1]. Los elementos ópticos que conforman un espectrómetro se

ilustran en la �gura 2.3. Básicamente, el funcionamiento de estos instrumentos es el siguiente:

una fuente de luz ilumina a una rendija de entrada y, por medio de una lente o espejo, el frente

de onda es colimado. Entonces la radiación se dispersa al pasar a través del monocromador y

J. C. Valdiviezo INAOE 23

Page 38: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

2.2. ESPECTRÓMETROS

con ello la dirección de propagación de los rayos depende de la longitud de onda. Finalmente, la

radiación se enfoca nuevamente y el espectro consiste en una serie de imágenes monocromáticas

de la rendija de entrada. A la salida del instrumento es posible utilizar algún sistema de

detección para registrar el espectro.

fuente deiluminación rendija colimador

elementodispersor

elementode enfoque espectro

Figura 2.3: Componentes ópticos de un espectrómetro.

Los espectrómetros pueden registrar espectros de absorción o emisión dependiendo de

la posición en la que se coloque la muestra. Para los espectrómetros de emisión, la radiación de

interés es aquella que sale de la muestra ya que los fotones interactúan con sus componentes

y entonces son reemitidos a diferentes longitudes de onda, como es el caso de la �uorescen-

cia o fosforescencia. De esta manera, para poder determinar la longitud de onda emitida es

necesario posicionar el monocromador después de la muestra. En el caso de los espectrómetros

de absorción, la muestra se coloca después del monocromador y con ello se determinan las

longitudes de onda que fueron absorbidas por sus componentes.

Con el paso del tiempo, los sistemas de detección utilizados para registrar la radiación

de salida de un espectrómetro han ido cambiando. En sus inicios, los espectrómetros requerían

del uso de placas fotográ�cas para registrar el espectro de algún material. En la actualidad,

el desarrollo de nuevos detectores ha permitido reemplazar estas placas por detectores de �u-

jo radiante, como los fotomultiplicadores, o por arreglos de dispositivos acoplados por carga

(coupled-charge devices, CCD). A los instrumentos que utilizan un arreglo lineal de fotodetec-

tores para realizar el registro del espectro de salida se les denomina espectrómetros de línea.

J. C. Valdiviezo INAOE 24

Page 39: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

2.2. ESPECTRÓMETROS

a

B

i1i1' i2

i2'

d

W

n P1

Figura 2.4: Estructura de un espectrómetro de prisma elemental, W denota el ancho del haz

de iluminación y P1 de�ne el primer plano principal.

2.2.1. Resolución del monocromador

El monocromador de un espectrómetro tiene la función de separar las distintas longi-

tudes de onda que conforman a la radiación de entrada. De esta manera es posible utilizar un

prisma o una rejilla dependiendo del poder de resolución que se requiere para el instrumento.

En el caso de un prisma dispersor, la luz colimada entrante1 se dispersa a diferentes ángulos

debido a la dependencia de la longitud de onda con el índice de refracción. Además, la distor-

sión de la imagen de la rendija de entrada se evita mediante el uso de iluminación de ondas

planas. Sin embargo, aún con este tipo de iluminación, la imagen de la rendija es curva ya que

no todos los rayos pueden atravesar el prisma en su primer plano principal.

Dado un prisma ajustado a la posición de desviación mínima, como el que se muestra

en la �gura 2.4, debe cumplirse que:

i1 = i′

2 = α/2 e i′

1 = i2 = (δm + α)/2, (2.8)

donde i1 e i′2 son los ángulos de entrada y salida, i

′1 e i2 son los ángulos internos de refracción,

α es el ángulo del prisma y δm es el denominado ángulo de desviación mínima. Para ángulos

pequeños, i.e., si θ ≤ 50, la expresión para el ángulo de desviación mínima es la siguiente:

δm = α(n− 1). (2.9)

1se entiende por luz colimada a aquella en la que los rayos son mutuamente paralelos y se propagan con un

mismo ancho W a lo largo de cualquier trayectoria.

J. C. Valdiviezo INAOE 25

Page 40: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

2.2. ESPECTRÓMETROS

d

s

Figura 2.5: Per�l de una rejilla líneal de difracción con N líneas; d es el periodo de la rejilla y

s es la separación entre líneas.

donde n es el índice de refracción del vidrio. Por otra parte, la dispersión angular resultante

se de�ne como dδm/dλ = (B/W )(dn/dλ), siendo B la longitud de la base del prisma, W el

ancho del haz de iluminación y n el índice de refracción. De acuerdo al criterio de Rayleigh se

de�ne el poder de resolución de un instrumento, Pr, como la longitud de onda más pequeña

que se puede resolver, dividida entre la longitud promedio en esa región espectral, ésto es,

Pr =λ

∆λ=

λ

dδm

dδmdλ

dδm

B

W

dn

dλ. (2.10)

El límite de resolución depende de la difracción debido al ancho del haz �nito o a la

apertura efectiva del prisma, la cual es rectangular, por lo que

Pr =λ

∆λ=

λ

λ/W· BW

dn

dλ= B · dn

dλ. (2.11)

La ecuación anterior indica que, dado algún tipo de vidrio, el poder de resolución de un

prisma depende sólamente del máximo grosor del vidrio atravesado por los rayos y del índice

de refracción, siendo independiente del ángulo del prisma [12].

En el caso de considerar una rejilla de difracción con N líneas, como la que se muestra

en la �gura 2.5, se obtiene que la separación entre un máximo primario de orden m y un

mínimo vecino está dada por ∆p = λ/Nd. Si la longitud de onda se cambia por una cantidad

∆λ, el máximo de orden m está desplazado por una cantidad

∆′p =

|m|d

∆λ. (2.12)

Suponiendo que las líneas de longitud de onda λ ± 12∆λ estarán resueltas cuando el máximo

de una longitud coincida con el primer mínimo de la otra, se tiene en el límite de resolución

en el orden m que ∆p = ∆′p, y según [4],

λ

∆λ=

∆pNd|m|∆′p d

= |m|N. (2.13)

J. C. Valdiviezo INAOE 26

Page 41: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

2.2. ESPECTRÓMETROS

Así, el poder de resolución para una rejilla es igual al producto del orden m y el número de

líneas N en la rejilla.

2.2.2. Espectrómetro de línea BRC111A

Con el objetivo de realizar el registro espectral de diversos materiales en el laboratorio

se ha utilizado un espectrómetro de línea de la serie BRC111A, fabricado por la compañía

BWTek. Las partes que conforman el instrumento son: un espectrómetro, una fuente de ilumi-

nación de halógeno-tungsteno y una punta de prueba de �bra óptica. Además, el instrumento

cuenta con un programa para controlar y visualizar los espectros registrados; el puerto de

comunicación para esta interfaz es el canal universal serial (universal serial bus, USB).

Los componentes ópticos del espectrómetro conforman un arreglo de tipo Czerny-

Turnerhaz de haz cruzado. El sistema de detección de este dispositivo lo constituyen 2048

elementos CCD que cubren la región espectral desde 350 a 1050 nm a una resolución alrede-

dor de 0.42 nm. Algunas especi�caciones técnicas se presentan en la Tabla 2.1. Respecto a la

fuente de iluminación de halógeno-tungsteno, la radiación que emite se encuentra en la porción

visible a infrarrojo cercano (visible - near infrared, VIS-NIR), con una potencia de salida de 5

W; la �gura 2.6 despliega el espectro de emisión de la fuente. El voltaje de alimentación para

esta fuente es de 6 V de corriente directa.

Tabla 2.1: Parámetros del espectrómetro de línea BRC111A

Parámetro Especi�cación

Intervalo espectral 350 a 1050 nm

Tamaño del CCD 14× 200µm

F# del espectrógrafo 3.0

Rejilla 700 líneas/mm

Dimensiones 97× 65× 32 mm

Tiempo de integración 9-65535 ms

Interfaz puerto USB 2.0

J. C. Valdiviezo INAOE 27

Page 42: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

2.2. ESPECTRÓMETROS

Figura 2.6: Espectro de emisión de la fuente de iluminación.

Respecto a la punta de prueba de �bra óptica, su estructura bifurcada permite conectar

uno de los extremos a la fuente de iluminación, mientras el otro se conecta al espectrómetro.

Además, en su interior, la punta está conformada por siete �bras, seis de las cuales tienen

un diámetro de 200 µm y que se utilizan para iluminar la muestra; la otra �bra, localizada

en el centro y con diámetro ligeramente más grande, registra el espectro. De esta manera, la

punta de prueba ilumina al objeto de estudio y simultáneamente registra el espectro de la luz

re�ejada. La �gura 2.7 presenta el diagrama de conexiones de los componentes que conforman

el espectrómetro.

Fuente de

iluminación

Punta de

pruebaObjeto

Espectrómetro Computadora

Figura 2.7: Diagrama de conexión de los componentes del espectrómetro de línea BRC111A.

J. C. Valdiviezo INAOE 28

Page 43: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

2.2. ESPECTRÓMETROS

2.2.3. Calibración del instrumento

Un primer experimento que se realizó fue el de veri�car la calibración por longitud de

onda del espectrómetro. Para ello se determinó la respuesta de transmisión para un conjunto

de 7 �ltros interferométricos pasabandas fabricados por Melles Griot.2 El arreglo utilizado se

muestra en la �gura 2.8. El procedimiento realizado para esta calibración es el siguiente. La

radiación proveniente de la fuente de tungsteno se hace incidir en forma normal a una de las

caras del �ltro; la energía que se transmite a través del �ltro es registrada por medio de la

punta de prueba, en la que uno de sus extremos se conecta al espectrómetro. El software de

adquisición permite ver la grá�ca del espectro adquirido, así como la longitud de onda central

(λ0) transmitida para cada uno de los �ltros. Estas longitudes de onda fueron comparadas

con aquellas longitudes de onda centrales de transmisión reportadas por el fabricante en las

hojas de datos [11]. Las �guras 2.9 y 2.10 presentan los espectros de transmisión para los

�ltros centrados en (a) λ0 = 450 nm (azul) y (b) λ0 = 650 nm (naranja), respectivamente. Los

resultados en la determinación de las longitudes de onda central se resumen en la Tabla 2.2.

Figura 2.8: Arreglo utilizado para veri�car la calibración por longitud de onda.

2Los �ltros pasabandas utilizados son de forma circular con un diámetro de 4.5 cm, cuentan con un ancho

de banda aproximado de 10 nm al 50% de transmisión, cubriendo el rango espectral visible.

J. C. Valdiviezo INAOE 29

Page 44: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

2.2. ESPECTRÓMETROS

Tabla 2.2: Comparación de las longitudes de onda especi�cadas por el fabricante y las determinadas por

medio del espectrómetro BRC111A para un conjunto de �ltros interferométricos fabricados por Melles Griot.

Filtro λ0 especi�cada λ0 determinada Error |Error relativo|

002-400 401.66 401.70 ± 0.04 9.9 ×10−5

004-450 452.12 451.80 ± 0.32 70.8 ×10−5

006-500 502.22 502.20 ± 0.02 3.9 ×10−5

008-550 552.38 552.60 ± 0.22 39.8 ×10−5

018-600 602.12 602.90 ± 0.78 29.5 ×10−5

022-650 652.06 653.10 ± 1.04 1.6 ×10−3

024-700 702.97 704.80 ± 1.80 2.6 ×10−3

Tabla 2.3: Comparación de las frecuencias de corte especi�cadas por el fabricante y aquellas determinadas

por medio del espectrómetro BRC111A para un conjunto de �ltros pasa altas de Newport.

Filtro D0 esp. (nm) D0 det. (nm) Error |Error relativo|

OG515 515 515.6 ± 0.6 11.6 ×10−4

OG550 550 550.4 ± 0.4 7.2 ×10−4

RG610 610 611.2 ± 1.2 19.6 ×10−4

RG715 715 714.9 ± 0.1 1.4 ×10−4

RG780 780 781.2 ± 1.2 15.4 ×10−4

RG830 830 831.1 ± 1.1 13.2 ×10−4

RG850 850 848.6 ± 1.4 16.5 ×10−4

J. C. Valdiviezo INAOE 30

Page 45: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

2.3. REGISTRO ESPECTRAL DE MATERIALES

Figura 2.9: Espectro de energía transmitida para el �ltro pasa-bandas con λ0 = 450 nm.

Además de caracterizar la respuesta del conjunto de �ltros interferométricos se deter-

minó el espectro de radiación transmitida y las frecuencias de corte para 7 �ltros pasa-altas

fabricados por Newport y que abarcan diferentes porciones del espectro electromagnético [13].3

Las �guras 2.11 y 2.12 presentan los espectros de transmisión para los �ltros con frecuencias

de corte en 515 nm y 715 nm, respectivamente. De acuerdo a las Tablas 2.2 y 2.3, para todos

los casos las frecuencias determinadas con el espectrómetro prácticamente coinciden con las

especi�cadas en las respectivas hojas de datos.

2.3. Registro espectral de materiales

Una vez veri�cada la calibración del instrumento se realizó, a manera de ejemplo, el

registro de espectros de ciertos tipos de vegetación. Para ello, con el objetivo de determinar la

3Los �ltros pasa-altas utilizados para este experimento son de forma cuadrada con una longitud de 5 cm

por lado.

J. C. Valdiviezo INAOE 31

Page 46: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

2.3. REGISTRO ESPECTRAL DE MATERIALES

Figura 2.10: Espectro de energía transmitida para el �ltro pasa-bandas con λ0 = 650 nm.

distancia óptima a la cual se debía colocar la punta de prueba sobre el material bajo estudio,

se realizó un primer experimento utilizando una base movible. La punta de prueba se fue

desplazando gradualmente, usando un micrómetro, en distancias entre 0 y 15 mm por encima

de la muestra. De acuerdo a los resultados obtenidos, el rango de tolerancia en el que el

espectro conserva su forma está entre 0 y 1 mm.

El proceso de adquisición de espectros se inicia primeramente con el registro de un

espectro oscuro; enseguida se realiza el registro espectral de un material de referencia y, por

último, el espectro del material bajo estudio. El espectro oscuro se puede registrar colocando

la punta de prueba sobre una super�cie oscura o apagando la fuente de iluminación y tiene

la función de corregir los espectros adquiridos pues elimina el efecto de la luz presente en

el ambiente. Por su parte, el espectro de referencia se puede obtener a partir de un blanco

estándar (spectralón), que se caracteriza por tener alta re�ectancia en una amplia porción

del espectro electromagnético; este espectro se utiliza para convertir los datos de intensidad

relativa a valores de re�ectancia espectral. Además, ambos espectros se utilizan para realizar

J. C. Valdiviezo INAOE 32

Page 47: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

2.3. REGISTRO ESPECTRAL DE MATERIALES

Figura 2.11: Espectro de energía transmitida para el �ltro pasa-altas con frecuencia de corte en 515 nm.

mediciones de color de las muestras. El último paso consiste en registrar el espectro de energía

re�ejada del material. En efecto, el software de adquisición del instrumento permite registrar

y visualizar los espectros en tiempo real.

2.3.1. Espectros de vegetación

Los tipos de vegetación utilizados en los experimentos que se presentan a continuación

pertenecen a hojas verdes o amarillas de las especies: alcanfor, pasto, pino y bugambilia,4

además de cáscaras de jitomate y mandarina. La �gura 2.13 presenta el arreglo que se ha

utilizado para la adquisición de espectros de luz re�ejada para los distintos tipos de vegetación;

en la �gura 2.14 se presenta el espectro registrado para una hoja de alcanfor en estados de

vitalidad verde y amarillo, mientras que en la �gura 2.15 se muestra el espectro colectado

para una hoja del árbol de pino y que fue registrado a lo largo de tres días para observar los

cambios en la forma del espectro debidos a pérdidas en su vitalidad.

4Las muestras fueron recolectadas el 11 de noviembre de 2009 en las instalaciones del INAOE.

J. C. Valdiviezo INAOE 33

Page 48: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

2.3. REGISTRO ESPECTRAL DE MATERIALES

Las grá�cas anteriores caracterizan la respuesta espectral típica de una planta verde

saludable, en donde las bandas de absorción fuertes se presentan en las regiones azul (λ = 450

nm) y roja (λ = 650 nm), con un pico de energía re�ejada en la región verde del espectro visible

(0.08 en 550 nm). Aproximadamente el 0.8 de la energía incidente en la porción infrarroja

cercana es re�ejada por la hoja en λ = 720 nm. Por otra parte, conforme disminuye la in�uencia

de la cloro�la en el espectro obtenido para las hojas amarillas, cantidades más grandes de luz

verde y roja son re�ejadas por la hoja, lo que resulta en una apariencia amarilla.

En las �guras 2.16 y 2.17 se presentan los espectros de energía re�ejada para una hoja

de pasto verde y una de pasto seca. Al igual que en el caso anterior, el máximo de energía

re�ejada en la porción visible se localiza en λ = 550 nm. Cuando la hoja de pasto pierde su

vitalidad, la forma de la curva espectral se modi�ca completamente, presentando un máximo

para la región visible localizado en λ = 650 nm.

En las �guras 2.18 y 2.19 se presentan los espectros de energía re�ejados que corre-

sponden a una hoja rojiza del árbol de la familia del pino y a uno de los pétalos de la planta

conocida como bugambilia roja, respectivamente. En el primer caso el espectro está caracter-

izado por absorciones máximas en las longitudes de onda de 550 nm y 600 nm del espectro

visible. El máximo de re�exión se localiza alrededor de 700 nm, lo cual explica el color rojizo

presente en la hoja. El segundo espectro presenta una forma parecida al caso anterior, con la

diferencia de que el espectro es plano en las longitudes de onda verde y azul; el máximo de

re�exión se presenta alrededor de 710 nm, lo que origina la coloración guinda en el pétalo de

la planta.

Por otra parte, en las �guras 2.20 y 2.21 se presentan las curvas espectrales de la energía

re�ejada por la cáscara de un jitomate, así como el exterior de una mandarina, respectivamente.

En el primer caso, el espectro registrado presenta un intervalo máximo de energía re�ejada

aproximadamente entre 630 y 720 nm, el cual es relativamente plano; en el espectro de la

derecha se puede observar que, aunque la forma de la grá�ca es similar al obtenido para la

hoja rojiza de la �gura anterior, una de las diferencias radica en que el máximo de energía

re�ejada se presenta en 650 nm, lo cual explica la coloración naranja que se aprecia en la

cáscara de mandarina.

J. C. Valdiviezo INAOE 34

Page 49: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

2.3. REGISTRO ESPECTRAL DE MATERIALES

2.3.2. Mezclas espectrales

De acuerdo a lo discutido en el Capítulo 1, muchos de los pixeles espectrales que son

registrados por un sensor remoto contienen la mezcla de espectros de diversos materiales. Para

simular la forma en que se presentan dichas mezclas se realizaron los siguientes experimentos.

En primer lugar, la punta de prueba se colocó en la distancia focal de una lente convergente

con f=5 cm para extender el campo de visión de la punta de prueba, lo que permitiría colocar

diversos materiales dentro del campo de visión. Sin embargo, debido a que la distancia de

detección de la punta está limitada a 1 cm, con este arreglo no se obtuvieron resultados

adecuados. En el siguiente experimento se emplearon materiales pequeños (alrededor de 2 mm

por lado) mezclados de manera homogénea para que la punta de prueba pudiera registrar el

espectro combinado de dichos meteriales. De esta manera, en un primer caso se utilizaron

fragmentos de una hoja verde y una seca, los cuales se colocaron, en la misma proporción,

en un porta objetos para colectar el espectro correspondiente. El espectro adquirido mediante

este procedimiento se presenta en la �gura 2.22.

En un segundo caso se utilizaron fragmentos pequeños de otro tipo de vegetación

en estados amarillo y verde, los cuales se han denotado respectivamente como espectro A y

espectro B. Las dos muestras de vegetación se mezclaron y la punta de prueba se colocó sobre

las muestras para registrar el espectro correspondiente. La �gura 2.23 presenta los espectros de

la vegetación A y B, además del espectro mezclado adquirido con el procedimiento descrito. Por

último, para comprobar que el espectro mezclado se puede representar como una combinación

lineal de los espectros A y B se determinó una función f(λ) con dos coe�cientes particulares

para aproximar la forma del espectro mezclado. La función que mejor aproxima esta curva está

representada por f(λ) =0.8A+0.2B. En la �gura se muestra, en línea punteada, la función

que aproxima esta mezcla espectral. De acuerdo a estos resultados, una combinación lineal

de los espectros de los materiales permite realizar una primera aproximación a las mezclas

espectrales.

J. C. Valdiviezo INAOE 35

Page 50: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

2.3. REGISTRO ESPECTRAL DE MATERIALES

Figura 2.12: Espectro de energía transmitida para el �ltro pasa-altas con frecuencia de corte en 715 nm.

Figura 2.13: Arreglo utilizado para el registro de espectros de vegetación.

J. C. Valdiviezo INAOE 36

Page 51: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

2.3. REGISTRO ESPECTRAL DE MATERIALES

Figura 2.14: Espectros de energía re�ejada para una hoja de alcanfor en estados amarillo y seco.

Figura 2.15: Espectros de energía re�ejada registrada durante tres días para una hoja de pino.

J. C. Valdiviezo INAOE 37

Page 52: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

2.3. REGISTRO ESPECTRAL DE MATERIALES

Figura 2.16: Espectro de energía re�ejada para una hoja de pasto verde.

Figura 2.17: Espectro de energía re�ejada para una hoja de pasto seco.

J. C. Valdiviezo INAOE 38

Page 53: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

2.3. REGISTRO ESPECTRAL DE MATERIALES

Figura 2.18: Espectro de energía re�ejada para una hoja de árbol rojiza de la familia del pino.

Figura 2.19: Espectro de energía re�ejada para una hoja de bugambilia.

J. C. Valdiviezo INAOE 39

Page 54: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

2.3. REGISTRO ESPECTRAL DE MATERIALES

Figura 2.20: Espectro de energía re�ejada registrado a partir de la cáscara de un jitomate rojo.

Figura 2.21: Espectro de energía re�ejada para la cáscara de una mandarina.

J. C. Valdiviezo INAOE 40

Page 55: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

2.3. REGISTRO ESPECTRAL DE MATERIALES

Figura 2.22: Espectro mezclado obtenido a partir de una hoja verde y una amarilla.

Figura 2.23: Espectro mezclado obtenido a partir de una hoja verde y otra amarilla. En esta grá�ca f(λ) es

una función cuyos coe�cientes aproximan la forma del espectro mezclado.

J. C. Valdiviezo INAOE 41

Page 56: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

2.4. ESPECTRÓMETROS DE IMAGEN

2.4. Espectrómetros de imagen

El avance conjunto de la tecnología para formar imágenes y la espectroscopía ha per-

mitido el surgimiento de sistemas de adquisición espectral; estos instrumentos, denominados

espectrómetros de imagen, son capaces de formar la imagen de las características espectrales

de un objeto bajo estudio, en múltiples bandas que cubren una amplia región del espectro

electromagnético. Los espectrómetros de imagen han hecho posible la adquisición de datos en

cientos de bandas simultáneamente. Además, debido a la alta precisión de los datos adquiridos,

diversos problemas en áreas como sensado remoto, biología, medicina, entre otros, pueden ser

investigados con gran detalle.

Los espectrómetros de imagen surgieron en los años 80s como una herramienta en la

identi�cación de los recursos naturales de la super�cie de la tierra, en aplicaciones de sensado

remoto. Los precursores de estos instrumentos son los sistemas multiespectrales que utilizan

un arreglo de �ltros de banda ancha para registrar imágenes de una escena geográ�ca en

distintas porciones del espectro electromagnético. Por ejemplo el escudriñador multiespectral

LANDSAT (LANDSAT multispectral scanner, MMS), es un sistema optomecánico que utiliza

conjuntos de �ltros y elementos detectores discretos para captar la energía re�ejada por la

super�cie terrestre en las porciones visible e infrarrojo cercano. A diferencia de estos sistemas,

los espectrómetros de imagen tienen la capacidad de proporcionar un espectro de re�ectancia

de alta resolución para cada pixel de la imagen. Lo anterior representa una gran ventaja ya

que el espectro de re�ectancia registrado puede ser usado para identi�car una gran cantidad

de materiales que cubren la super�cie terrestre.

En forma general, los elementos que conforman un espectrómetro de imagen son: un

sistema optomecánico que se encarga de captar el �ujo radiante re�ejado, uno o varios espec-

trómetros para separar las distintas longitudes de onda y un arreglo de detectores sensibles

a diferentes longitudes de onda, que forman el conjunto de imágenes. El sistema colector de

luz es importante ya que permite escudriñar el campo de visión instantáneo (instantaneous

�eld of view, IFOV) del espectrómetro sobre una escena. En efecto, existen diversas con�gura-

ciones para registrar la energía re�ejada. Por ejemplo, en aplicaciones de sensado remoto, el

movimiento de la plataforma aérea es utilizado como parte del sistema de barrido a lo largo

J. C. Valdiviezo INAOE 42

Page 57: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

2.4. ESPECTRÓMETROS DE IMAGEN

de la escena. Además, otro tipo de espectrómetros de imagen utiliza un �ltro espacial lineal

variable colocado sobre un arreglo bidimensional de fotodetectores. Aunque el costo de estos

sistemas es más elevado que los anteriores, proporcionan imágenes bien calibradas ya que cada

elemento detector forma la imagen de la escena en una banda espectral determinada.

De acuerdo al número de bandas adquiridas, un espectrómetro de imagen se puede clasi-

�car en las categorías siguientes. Se habla de un sistema multiespectral cuando el instrumento

registra decenas de bandas espectralmente anchas (∼ 50 nm) y separadas; un instrumento se

dice hiperespectral cuando registra cientos de bandas cuasi continuas y espectralmente angostas

(∼ 10 nm). Por su parte, un sistema puede ser ultraespectral cuando es capaz de registrar miles

de bandas contiguas y espectralmente muy angostas (∼ 2 nm). Los sistemas anteriores están

caracterizados por la resolución espectral, que indica el número y el ancho de las bandas re-

gistradas y la resolución espacial, que es una medida del detalle mínimo que puede ser captado

por un instrumento.

Ejemplo: el espectrómetro de imagen MIVIS. Este sistema de espectrómetro de imagen

multiespectral visible e infrarrojo, por las siglas Multispectral Visible and Infrared Imaging

Spectrometer (MIVIS), ha sido desarrollado por SenSyTech Imaging Group para el Consejo

Nacional de Investigación de Italia. El instrumento consta de cuatro espectrómetros y utiliza

un sistema de barrido por línea. En la Tabla 2.4 se presentan el número de bandas y el rango

espectral de cada espectrómetro y en la �gura 2.24 se presenta el diagrama óptico de este

instrumento.

Tabla 2.4: Especi�caciones técnicas del espectrómetro MIVIS.

Espectrómetro Rango espectral (nm) Bandas

1 433− 833 20

2 1150− 1550 8

3 2000− 2500 64

4 8200− 12700 10

En este espectrómetro de imagen, un espejo rotatorio de 45◦ barre una línea de pix-

eles sobre la super�cie. Cada pixel generado es colimado por medio de un espejo parabólico

J. C. Valdiviezo INAOE 43

Page 58: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

2.4. ESPECTRÓMETROS DE IMAGEN

apertura

espejos

espejo

rotatorioParaboloide

secundario

Paraboloide

primario

filtros dicróicosrejilla de difracción

lente

filtro

detectores

retardador

lente

filtro

rejilla de difracción

rejilla de difracción

lente

lente

arreglo de

detectores

filtro

Sistema

de barrido

Espectrómetro

Figura 2.24: Diagrama óptico del espectrómetro de imagen MIVIS.

montado en un telescopio Gregoriano. Entonces, el haz colimado es re�ejado, por medio de

un ensamble Pfund (�ltros dicróicos), hacia un banco que contiene cuatro espectrómetros.

Una apertura en el ensamble Pfund de�ne un IFOV común para cada pixel. El haz colimado

se divide hacia cuatro espectrómetros, ya sea por espejos metálicos o por �ltros dicróicos.

Los espejos metálicos re�ejan longitudes de onda largas y transmiten las cortas. Las capas

dieléctricas múltiples causan interferencia tal que la luz se re�eja en las longitudes de onda

cortas y se transmite para las largas. Después de dividir el haz en cuatro bandas (visible,

infrarrojo cercano, infrarrojo medio e infrarrojo térmico) cada banda se dispersa en su propio

espectrómetro. El intervalo de longitudes de onda que abarca cada espectrómetro está basada

en la sensibilidad de diferentes arreglos de fotodetectores usados en cada espectrómetro [12].

J. C. Valdiviezo INAOE 44

Page 59: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

Bibliografía

[1] Ball D.W., The Basics of Spectroscopy, Tutorial Texts in Optical Engineering, SPIE Press, Vol.

TT49, pp. 33�40, 2001.

[2] Banwell C.N., Fundamentos de Espectroscopía Molecular, Ediciones del Castillo, S.A., Madrid,

España, pp. 4�11, 1997.

[3] Beer R., Remote sensing by fourier transform spectroscopy, John Wiley and Sons, pp. 44�46,

52�54, 130�133, 1992.

[4] Born M. and Wolf E., Principles of Optics, 7th edition, Cambridge University Press, pp. 446�453,

2003.

[5] BWTek Inc., BWSpec 3.24 User Manual, Doc# 290020018, 2007.

[6] BWTek Inc., BRC111A Spectrometer User Manual, 2007.

[7] Clark G. L., The Encyclopedia of Spectroscopy, Reinhold Publishing Corporation, pp. 1�7, 1960.

[8] Hecht E., Óptica, 3a edición, Addison Wesley, pp. 86�124, 2000.

[9] Huebshman M.L., Schultz R.A., Garner H.R., �Hyperspectral imaging.� In: Encyclopedia of Mod-

ern Optics, Robert D. Guenther editor, Vol. 1, pp. 134�143, Elsevier, Academic Press, 2005.

[10] Jensen J.R., Remote Sensing of the Environment: an Earth Resource Perspective, 2nd edition,

Pearson Prentice Hall, 2007.

[11] Melles Griot, Visible Band-Pass Filters Technical Data, 2004.

45

Page 60: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

BIBLIOGRAFÍA

[12] More K.A., �Spectrometers.� In: Encyclopedia of Modern Optics, Robert D. Guenther editor, Vol.

1, pp. 324�336, Elsevier, Academic Press, 2005.

[13] Newport Inc., High-Pass Filters Technical Data Sheet, 2000.

[14] Smith R.B., Introduction to Remote Sensing, Tutorial by Microimages, Inc., Lincoln, NE, 2001.

[15] Stuart B., Infrared Spectroscopy: Fundamentals and Applications, John Wiley, pp. 6�12, 2004.

J. C. Valdiviezo INAOE 46

Page 61: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

Capítulo 3

Fundamento Matemático

En este capítulo se introducen las operaciones del álgebra reticular minimax, así como las

memorias asociativas reticulares. Se continúa con una descripción de conceptos emanados de

la teoría de conjuntos convexos que serán de gran utilidad para comprender los capítulos sub-

secuentes. Una propiedad importante a destacar será la relación existente entre las memorias

autoasociativas reticulares y los conjuntos convexos ya que ello hace posible que se pueda

determinar un conjunto de puntos extremos a partir de una imagen cualquiera.

3.1. Álgebra reticular minimax

En los últimos años, las operaciones basadas en el álgebra de retículos han sido apli-

cadas en áreas diversas de la ingeniería industrial, ciencias de la computación y en el análisis y

procesamiento digital de imágenes [5, 6, 19]. En estas aplicaciones, las operaciones matriciales

de suma y multiplicación del álgebra lineal son reemplazadas por las operaciones correspondi-

entes del álgebra reticular, cuyas propiedades han permitido establecer nuevas e interesantes

técnicas.

El concepto de retículo fue creado para generalizar y uni�car ciertas relaciones entre

subconjuntos de un conjunto dado, entre subestructuras de una estructura algebraica tales

como grupos, y entre estructuras geométricas tales como subespacios de espacios topológicos.

El desarrollo de la teoría de retículos comenzó en 1930 con los trabajos de Garrett Birkho� [2];

47

Page 62: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

3.1. ÁLGEBRA RETICULAR MINIMAX

en la actualidad, numerosas investigaciones han ampliado su tratamiento teórico y extendido

su aplicabilidad. Una propiedad de gran utilidad en la teoría de retículos, que se conoce como

dualidad, permite de�nir conceptos duales a partir de la inversión del orden dado en una

de�nición. Un ejemplo de dualidad son las relaciones numéricas �mayor que� y �menor que�.

En las siguientes líneas se de�nen algunos conceptos fundamentales del álgebra reticular.

Sea Y un conjunto parcialmente ordenado con orden parcial denotado en general por

≼. Una cota superior de un subconjunto X de Y , si existe, es un elemento y ∈ Y tal que

x ≼ y ∀x ∈ X. La cota superior mínima o supremo, sup(X), es una cota superior y0 ∈ Y

de X tal que y0 ≼ y para cada cota superior y de X. De esta manera, si sup(X) existe,

entonces es única. El concepto de cota mínima y cota inferior máxima o ín�mo, denotada

por ınf(X), se de�nen de manera dual. Basado en lo anterior, un retículo es un conjunto

parcialmente ordenado L cuyos elementos x, y tienen un ín�mo, denotado por x ∧ y, y un

supremo, denotada por x ∨ y. Un retículo L es completo cuando existen ınf(X) y sup(X)

para cada uno de sus subconjuntos X.

Las operaciones binarias de ∨ y ∧ sobre retículos tienen varias propiedades importantes,

algunas de ellas son análogas a aquellas de la multiplicación y adición ordinarias. Si (X,≼) es

un conjunto parcialmente ordenado, entonces las operaciones ∨ y ∧ satisfacen las siguientes

propiedades.

1. x ∧ x = x, x ∨ x = x (idempotencia)

2. x ∧ y = y ∧ x, x ∨ y = y ∨ x (conmutatividad)

3. x ∧ (y ∧ z) = (x ∧ y) ∧ z, x ∨ (y ∨ z) = (x ∨ y) ∨ z (asociatividad)

4. x ∧ (x ∨ y) = x ∨ (x ∧ y) = x (absorción)

5. Si X tiene un elemento mínimo O, entonces O ∧ x = O y O ∨ x = x ∀x ∈ X

6. Si X tiene un elemento máximo I, entonces I ∧ x = x y I ∨ x = I ∀x ∈ X

En las relaciones anteriores no se hace explícito que el conjunto parcialmente ordenado

sea un retículo. En efecto, Birkho� probó que estas propiedades caracterizan completamente

a un retículo.

J. C. Valdiviezo INAOE 48

Page 63: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

3.1. ÁLGEBRA RETICULAR MINIMAX

3.1.1. Ejemplos de retículos

El conjunto R de los números reales junto con las relaciones de menor o igual (≤) es

un conjunto totalmente ordenado. Por ejemplo, dado cualquier par x, y ∈ R, entonces

ocurre que tanto x ≤ y o y ≤ x. Si x ∨ y = máx{x, y} y x ∧ y = mín{x, y} ∀x, y ∈ R,

entonces R junto con las operaciones de ∨ y ∧ es un retículo totalmente ordenado que

denotamos como (R,∨,∧). Este retículo no es completo.

Sea R±∞ = R ∪ {−∞,∞}, el conjunto de números reales con los símbolos ∞ y −∞adjuntos. Entonces (R±∞,∨,∧) es un retículo completo con ∞ como el elemento más

grande y −∞ como el elemento más pequeño.

El conjunto R≥0∞ = R+ ∪ {0,∞} con la relación ≤ es un retículo completo. Aquí 0 es

el elemento más pequeño e ∞ el elemento más grande. (R≥0∞ ,∨,∧) es un subretículo de

(R±∞,∨,∧). El dual de este retículo se obtiene al reemplazar ≤ con la relación de ≥.

3.1.2. Conceptos generales

Como una extensión de la teoría de retículos a matrices y vectores, Cuninghame-

Green desarrolló un novedoso cálculo matricial basado en la suma-min y la suma-max [6]. A

este conjunto de operaciones se le ha denominado álgebra reticular minimax. En lo siguiente

de�niremos las operaciones del álgebra minimax basadas en el retículo (R±∞,∨,∧,+). Además,

dado un conjunto �nito X de vectores n-dimensionales cuyas componentes son números reales,

al usar la notación de columnas podemos denotar a este conjunto como X = {x1, . . . ,xk} ∈ Rn

donde k es el número de vectores.

Sean x,y ∈ Rn±∞ dos vectores columna n-dimensionales tales que x = (x1, . . . , xn)

T y

y = (y1, . . . , yn)T , donde el superíndice indica transposición; la desigualdad x ≤ y signi�ca

que ∀i, xi ≤ yi. Si x ≤ y entonces existe un índice i tal que xi > yi. El valor mínimo de

un vector está de�nido como∧

x =∧n

i=1 xi. Similarmente, el valor máximo de un vector es

el escalar∨x =

∨ni=1 xi. El conjugado aditivo de un vector columna x está de�nido como el

vector x∗ = −xT = (−x1, . . . ,−xn).

J. C. Valdiviezo INAOE 49

Page 64: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

3.1. ÁLGEBRA RETICULAR MINIMAX

Se de�ne la suma escalar para un vector x = (x1, . . . , xn)T y un escalar a ∈ R±∞ como

a+ x = (a+ x1, . . . , a+ xn)T . Las operaciones de suma, mínimo y máximo entre dos vectores

cualesquiera están de�nidas respectivamente ∀ i = 1, . . . , n de la siguiente manera:

(x+ y)i = xi + yi ; (x ∧ y)i = xi ∧ yi ; (x ∨ y)i = xi ∨ yi. (3.1)

La suma externa minimax de dos vectores x ∈ Rm±∞ e y ∈ Rn

±∞, es la matriz de m× n

de�nida por,

x⊕ yT =

x1 + y1 · · · x1 + yn

.... . .

...

xm + y1 · · · xm + yn

. (3.2)

3.1.3. Operaciones matriciales

Dadas dos matrices: A = (aij), B = (bij) ∈ R±∞ de tamaño m×n, se de�nen el máximo

y el mínimo de A y B como las matrices, A ∨ B y A ∧ B, cuyas componentes ij se de�nen

respectivamente por,

(A ∨B)ij = aij ∨ bij ; (A ∧B)ij = aij ∧ bij. (3.3)

Para una matriz A de m× p y una matriz B de p× n con entradas de R±∞, se de�ne

la suma-max de A y B como la matriz C = A ∨ B, siendo

cij =

p∨k=1

(aik + bkj) = (ai1 + b1j) ∨ (ai2 + b2j) ∨ . . . ∨ (aip + bpj). (3.4)

La operación dual sobre las matrices A y B se denomina suma-min y se denota como

la matriz C = A ∧ B, donde

cij =

p∧k=1

(aik + bkj) = (ai1 + b1j) ∧ (ai2 + b2j) ∧ . . . ∧ (aip + bpj). (3.5)

J. C. Valdiviezo INAOE 50

Page 65: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

3.1. ÁLGEBRA RETICULAR MINIMAX

Nótese que la suma-max y la suma-min son similares al producto matricial del álgebra lin-

eal, con la diferencia de que la suma y multiplicación son reemplazadas por las operaciones

generalizadas de máximo o mínimo de sumas, respectivamente.

Si A = (aij) ∈ R±∞ es una matriz de m × n, entonces la matriz conjugada A∗ es

la matriz A∗ = (a∗ij) de n × m, donde a∗ij = −aji es el conjugado aditivo. Por lo tanto las

siguientes relaciones se veri�can,

A ∧B = (A∗ ∨B∗)∗ y (A ∧ B)∗ = B∗ ∨ A∗. (3.6)

3.1.4. Independencia reticular

Las ideas de independencia reticular e independencia reticular fuerte de un conjunto

de vectores son propiedades matemáticas fundamentales para aplicaciones en reconocimiento

de patrones basadas en el álgebra reticular [21, 22, 31]. Especí�camente, estas ideas se han

utilizado para la construcción de memorias asociativas reticulares robustas ante ruido aleatorio

[21, 30], y recientemente para la determinación de puntos extremos en imágenes hiperespec-

trales [8, 9]. El concepto de dependencia reticular es el análogo del concepto de dependencia

lineal en los espacios vectoriales del álgebra lineal.

De�nición 3.1. Si X = (x1, . . . ,xk) es un subconjunto de Rn, entonces una combinación

minimax de este subconjunto, denotada como C(X), es cualquier vector x ∈ Rn±∞ que puede

ser escrito como cualquiera de las dos expresiones duales siguientes:

x =∨j∈J

k∧ξ=1

(aξj + xξ) ; x =∧i∈I

k∨ξ=1

(bξi + xξ) (3.7)

donde I, J son conjuntos �nitos de índices y aξj, bξi ∈ R±∞ son familias �nitas de escalares.

La combinación minimax anterior es similar a la combinación lineal de vectores∑k

ξ=1 aξxξ

con la excepción de la dualidad. De esta manera, cualquier combinación �nita que involucre

los operadores de máximo y mínimo y los vectores de la forma a+xξ, b+xξ donde a, b ∈ R±∞

y xξ ∈ X, es una combinación minimax.

J. C. Valdiviezo INAOE 51

Page 66: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

3.1. ÁLGEBRA RETICULAR MINIMAX

De�nición 3.2. Un vector x ∈ Rn se dice que es dependiente reticular en X = (x1, . . . ,xk) si

y solo si x = C(x1, . . . ,xk), es decir, x es una combinación minimax formada con los patrones

de X. Un patrón es independiente reticular (IR) si y solo si no es dependiente reticular.

La propiedad de independencia reticular entre vectores implica que x no puede ser es-

crito como una combinación minimax de vectores, lo que implica que dicho vector no cumplirá

con cualesquiera de las dos igualdades expresadas en la ec. (3.7) para conjuntos de índices ar-

bitrarios y escalares correspondientes. De todas las posibles combinaciones minimax se pueden

derivar criterios especí�cos para evaluar independencia reticular dado un conjunto �nito de

vectores. La forma más simple se tiene haciendo aξj = 0 = bξi para todo i ∈ I, j ∈ J y para

todo ξ ∈ {1, . . . , k} [31]. Por tanto, dos casos particulares surgen como criterios para evaluar

independencia reticular:

1. Un conjunto de vectores X = (x1, . . . ,xk) es reticularmente independiente si y solo si

para todo η = 1, . . . , k existe un índice de �la j ∈ {1, . . . , n} tal que xηj >

∨ξ =η x

ξj ∀ξ = η.

2. Un conjunto de vectores X = (x1, . . . ,xk) es reticularmente independiente si y solo si

para todo η = 1, . . . , k existe un índice de �la j ∈ {1, . . . , n} tal que xηj <

∧ξ =η x

ξj ∀ξ = η.

Cualquiera de estos dos criterios puede ser utilizado para evaluar la propiedad de

independencia reticular de un conjunto de vectores. El criterio 1 ha sido utilizado como la base

matemática de la técnica de núcleos [27, 28]. Asimismo, para aplicaciones en reconocimiento

de patrones, ambos criterios se han de�nido como condiciones de independencia morfológica

en sentidos erosivo y dilatativo, respectivamente [8].

De�nition 3.3 Un conjunto de vectores X = (x1, . . . ,xk) ⊂ Rn se dice que es max-dominante,

dualmentemin-dominante, sí y sólo si para cada η ∈ {1, . . . , k}, existe un índice jη ∈ {1, . . . , n}tal que, se satisfacen las igualdades izquierda o derecha, respectivamente,

xηjη− xη

i =k∨

ξ=1

(xξjη− xξ

i ) ; xηjη− xη

i =k∧

ξ=1

(xξjη− xξ

i ) ∀i ∈ {1, . . . , n}. (3.8)

De acuerdo con las de�niciones anteriores, max-dominancia implica que, para cada

vector η ∈ {1, . . . , k}, debe existir un índice j, dependiendo de η, tal que xηj − xη

i ≥ xξj − xξ

i ,

J. C. Valdiviezo INAOE 52

Page 67: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

3.2. GEOMETRÍA DE CONJUNTOS CONVEXOS

equivalentemente xηj − xξ

j ≥ xηi − xξ

i . De manera similar, min-dominancia implica que, para

cada vector η ∈ {1, . . . , k}, debe existir un índice j tal que xηj −xη

i ≤ xξj−xξ

i , equivalentemente

xηj − xξ

j ≤ xηi − xξ

i .

De�nición 3.4. Un conjunto de vectores X = (x1, . . . ,xk) posee la característica de inde-

pendencia reticular fuerte (IRF) sí y sólo si las siguientes dos condiciones son satisfechas: el

conjunto X es reticularmente independiente y X es max dominante o min dominante.

3.2. Geometría de conjuntos convexos

El estudio de los conjuntos convexos pertenence a un área de las matemáticas relati-

vamente reciente. Aunque algunos resultados importantes datan de �nales del siglo XIX, el

primer estudio sistemático fue escrito por los alemanes Bonnesen y Fenchel, titulado Theo-

rie der Konvexen Körper en 1934 [4]. En años recientes se descubrieron diversas aplicaciones

de conjuntos convexos, particularmente en el campo de optimización, lo que ha motivado su

estudio. En las siguientes líneas se describirán algunas de�niciones y teoremas derivados de

la teoría de conjuntos convexos que serán útiles para el análisis presentado en los capítulos

subsecuentes [3, 16, 25]. Para ser consistentes con la notación utilizada hasta ahora, cualquier

punto en el espacio Euclidiano se denotará como un vector x ∈ Rn.

3.2.1. Convexidad e independencia afín

De�nición 3.5. Un conjunto S es convexo si para cada par de puntos x, y en S el segmento

de línea recta que une a estos dos puntos reside completamente en S.

De�nición 3.6. Sea λi ∈ R con i = 1, . . . , k y suponga que λ1+λ2+ · · ·+λk = 1. Entonces a

y = λ1x1 + λ2x

2 + · · ·+ λkxk se le denomina una combinación afín de los puntos x1, . . . ,xk.

Si, además de la condición anterior, se requiere que λi ≥ 0 ∀i, entonces y se denomina una

combinación convexa de x1, . . . ,xk.

Consecuentemente un conjunto es convexo sí y sólo si es cerrado bajo combinaciones

J. C. Valdiviezo INAOE 53

Page 68: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

3.2. GEOMETRÍA DE CONJUNTOS CONVEXOS

convexas de pares de sus elementos. Además, se dice que un conjunto S es afín sí y sólo si

cualquier combinación afín de puntos de S reside en S [16].

De�nición 3.7. Un conjunto �nito de vectores x1, . . . ,xm es dependiente afín si existen

números reales λ1, . . . , λk, no todos cero, tales que λ1 + · · ·+ λk = 0 y λ1x1 + · · ·+ λkx

k = 0

(origen del sistema coordenado). De otra forma, el conjunto es independiente afín.

El concepto de independencia lineal está relacionado con independencia afín. Sean

{x1, . . . ,xn} un conjunto de vectores, decimos que son linealmente dependientes si existen

números a1, a2, . . . , an, no todos iguales a cero, tales que a1x1 + a2x

2 + · · · + anxn = 0.

Si tales números no existen, entonces los vectores son linealmente independientes. Algunas

propiedades de los vectores linealmente independientes son: (1) un conjunto de vectores es

linealmente independiente sí y sólamente si ninguno es combinación lineal de los demás, (2)

si un conjunto de vectores es linealmente independiente cualquier subconjunto suyo también

lo es. Nótese que en la de�nición de dependencia afín se tiene que∑k

i=1 λi = 0, lo cual es

consistente con la de�nición 3.6 para x = λ1x1 + · · · + λkx

k, con∑k

i=1 λi = 1; lo anterior se

cumple sí y sólo si x − λ1x1 − · · · − λkx

k = 0, siendo la suma de todos los coe�cientes del

lado izquierdo igual a cero. De esta manera, los conceptos de dependencia lineal y afín están

relacionados ya que dependencia lineal implica dependencia afín.

De�nición 3.8. El casco convexo de un conjunto S es la intersección de todos los conjuntos

convexos que contienen a S y se denota como H(S).

De�nición 3.9. El casco afín de un conjunto S es la intersección de todos los conjuntos a�nes

que contienen a S y se denota como A(S).

Claramente el conjunto S es convexo sí y sólo si S=H(S); S es afín sí y sólo si S=A(S).

Dicho de otra manera, H(S) es el conjunto convexo más pequeño que contiene a S mientras

que A(S) es el conjunto afín más pequeño que contiene a S.

Teorema 3.1. Para cualquier conjunto S, el casco convexo H(S) consiste de todas las com-

binaciones convexas de los elementos de S.

J. C. Valdiviezo INAOE 54

Page 69: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

3.2. GEOMETRÍA DE CONJUNTOS CONVEXOS

El teorema anterior no establece ninguna restricción sobre el número de puntos de S

requeridos para hacer la combinación. El siguiente teorema es básico en el estudio de conjuntos

convexos y fue demostrado primero por Caratheodory en 1907. El teorema establece que en

un espacio n-dimensional, el número de puntos de S en la combinación convexa no tiene que

ser mayor a n+ 1 [16].

Teorema 3.2 (Caratheodory). Si S es un subconjunto no vacío del espacio Euclidiano n-

dimensional Rn, entonces cualquier x ∈ H(S) puede ser expresado como una combinación

convexa de a lo más n+ 1 puntos de S.

Debido a que el casco convexo de un conjunto convexo S es igual al conjunto de todas

las combinaciones convexas de puntos de S, el teorema anterior puede ser enunciado de la

siguiente forma: x ∈ H(S) sí y sólo si x está en el casco convexo de a lo más n+ 1 puntos de

S.

3.2.2. Simplex multidimensionales

Se conoce como politopo o politopo convexo al casco convexo de un conjunto �nito de

puntos. La clase más simple de politopos es el simplex, cuya de�nición formal es la siguiente.

De�nición 3.10. Si S = {x1, . . . ,xk+1} y dim(S) = k, entonces a H(S) se le denomina un

simplex k-dimensional y los puntos x1, . . . ,xk+1 son sus vértices.

La de�nición anterior implica que un simplex es la estructura convexa mínima con

k + 1 vértices y que es capaz de encerrar un subespacio de dimensión k. El requisito de que

la dimensión de S = {x1, . . . ,xk+1} sea igual a k es equivalente a requerir que los vectores

x1, . . . ,xk+1 sean independientemente afínes. En efecto se debe recordar que un conjunto

S = {x0,x1, . . . ,xk} ⊂ Rn se dice independientemente afín sí y sólo si el conjunto {xj − x0 :

j = 1, . . . , k} es linealmente independiente.

Algunos ejemplos de simplex son los siguientes. Un simplex de dimensión cero está rep-

resentado por un punto; un simplex de dimensión uno corresponde a una línea recta, mientras

que en dos dimensiones el simplex es un triángulo; de manera análoga, el caso de un sim-

J. C. Valdiviezo INAOE 55

Page 70: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

3.2. GEOMETRÍA DE CONJUNTOS CONVEXOS

x1

x2

x1

x1

x2

x3

x1

x2

x3

x4

x1

x2

x3

x4

x5

S0

S1

S2

S3

S4

Figura 3.1: Ejemplos de simplex para k = 1, . . . , 4

plex tridimensional corresponde a un tetraedro. En general, un simplex k-dimensional puede

construirse de la siguiente manera:

0-simplex S0: un punto único {x1}1-simplex S1: H(S0 ∪ {x2}) donde x2 /∈ A(S0)

2-simplex S2: H(S1 ∪ {x3}) donde x3 /∈ A(S1)

...

k-simplex Sk: H(Sk−1 ∪ {xk+1}) donde xk+1 /∈ A(Sk−1).

El simplex S0 está representado por un punto. Al unir un punto x2 que no está en

S0, se obtiene el segmento de línea S1, técnicamente se toma el casco convexo de S0 ∪ {x2}.Al unir el punto x3 que no está en la línea que contiene S1, se obtiene el triángulo S2. De

manera similar, al unir el punto x4 que no está en el plano de S2 se obtiene el tetraedro S3. Si

unimos un punto x5 (que no está en el espacio 3D de S3) con S3, se obtiene el pentatopo S4.

Es fácil observar que, conforme aumenta la dimensionalidad del espacio, se vuelve más difícil

representar el simplex. En la �gura 3.1 se presentan los k-simplex para k = 0 . . . 4. Así por

ejemplo S4 tiene 5 vértices, cualquier conjunto formado por 4 de ellos determinan una cara en

forma de tetraedro. En la �gura se ha enfatizado la cara con vértices {x1,x2,x4,x5}.Un punto x en un simplex S = H{x1, . . . ,xk} puede ser expresado como una combi-

nación lineal convexa de los vértices; es decir, x =∑k+1

i=1 αixi. De esta manera, cada punto en

el simplex H(S) tiene una única representación como una combinación de sus vértices.

J. C. Valdiviezo INAOE 56

Page 71: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

3.2. GEOMETRÍA DE CONJUNTOS CONVEXOS

De�nición 3.11. Sea H(S) el simplex k-dimensional que contiene al punto x. Si la única

representación de x como una combinación convexa de los vértices está dada por x = λ1x1 +

· · ·+ λk+1xk+1, entonces los números λ1, . . . , λk+1 se denominan las coordenadas baricéntricas

de x.

3.2.3. Modelo de mezclado lineal

Los conceptos de simplex y su representación en espacios multidimensionales han sido

aplicados en el análisis de imágenes hiperespectrales para representar las mezclas de espectros

de diferentes objetos captadas en la apertura del sensor [13]. Para ello, el modelo de mezclado

lineal con restricciones (MLR) permite representar los datos mezclados como una combinación

convexa de los vértices del simplex que los encierra; es decir,

x =

p∑i=1

aisi + r = Sa+ r (3.9)

p∑i=1

ai = 1 ; ai ≥ 0 ∀i. (3.10)

donde x ∈ Rn es el espectro medido sobre n bandas, S = {s1, s2, . . . , sp} es una matriz de

tamaño n × p cuyas columnas son los puntos extremos o vértices del simplex que encierra

a los datos, (a1, a2, . . . , ap)T es un vector p-dimensional cuyas entradas son las abundancias

fraccionales correspondientes presentes en x y r es un vector de ruido aditivo.

En efecto, el objetivo de la representación anterior es determinar el vector de abundan-

cias a, conociendo la matriz S. Bajo la suposición de que r = 0, la solución más simple que

minimiza ∥x−Sa∥2 = ∥r∥2 está dada por la estimación de mínimos cuadrados sin restricciones

expresada como sigue:

a = S+x = (STS)−1STx, (3.11)

donde S+ denota la matriz pseudoinversa de Moore-Penrose. Esta estimación existe cuando

hay más bandas que columnas y cuando S es de rango completo. La solución irrestricta puede

ser reforzada para incorporar las condiciones de positividad (ai ≥ 0 ∀i) y aditividad completa

J. C. Valdiviezo INAOE 57

Page 72: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

3.3. MEMORIAS ASOCIATIVAS RETICULARES

(∑p

i=1 ai = 1) impuestas por el modelo. El satisfacer la condición de aditividad completa

requiere del uso de multiplicadores de Lagrange de la forma siguiente.

aL = a− (STS)−1ZT [Z(STS)−1ZT ]−1(Za− b). (3.12)

donde Z es un vector �la de tamaño 1× p con todos sus elementos igual a uno y b = 1 [13].

Lo anterior tiene el efecto de restringir que la solución de mínimos cuadrados resida en el

hiperplano cuya ecuación es∑p

i=1 ai = 1.

Satisfacer la condición de positividad no es tan sencillo en la práctica ya que el min-

imizar ∥x − Sa∥2 manteniendo ai ≥ 0, ∀i = 1, . . . , p, cae en el dominio de la programación

cuadrática con desigualdades lineales como restricciones. Una alternativa comúnmente uti-

lizada es el algoritmo de estimación de mínimos cuadrados no negativa (non-negative least

square estimation, NNLS)[15]. La aproximación consiste en estimar iterativamente a y, en

cada iteración, encontrar una solución mínima cuadrada para aquellos coe�cientes de a que

son negativos usando sólo las columnas asociadas de S. Es importante mencionar que en la

práctica satisfacer ambas restricciones simultáneamente resulta difícil. Sin embargo, ya se han

desarrollado técnicas híbridas que permitan encontrar una solución para a sujeta a las dos

restricciones mencionadas [11].

3.3. Memorias asociativas reticulares

El surgimiento y desarrollo de las memorias asociativas reticulares, como un nuevo

paradigma en redes neuronales arti�ciales, ha brindado solución a diversos problemas en el

reconocimiento de patrones, tales como la asociación y la recuperación de patrones afectados

por ruido [20, 21, 26, 29]. En este contexto, los patrones se representan como vectores columna

xj ∈ R; cada componente xji con i = 1, . . . , n, representa una característica determinada del

patrón, por ejemplo, caracteres, curvatura o señal de intensidad. Enseguida se da primera-

mente una introducción a las memorias asociativas convencionales y después se presentan las

memorias asociativas reticulares, las cuales realizan el cómputo neuronal basado en el álgebra

reticular minimax.

J. C. Valdiviezo INAOE 58

Page 73: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

3.3. MEMORIAS ASOCIATIVAS RETICULARES

Dados dos conjuntos de vectores X = (x1, . . . ,xk) y Y = (y1, . . . ,yk) con asociaciones

dadas por {(xξ,yξ) ∈ Rn × Rm : ξ = 1, . . . , k }, una memoria asociativa M debe ser capaz

de recuperar un patrón de salida yξ cuando se le presenta un patrón de entrada xξ o una

versión con ruido de ésta. Anderson y Kohonen propusieron una de las primeras memorias

matriciales de correlación basadas en redes neuronales lineales [1, 14]. De las memorias asocia-

tivas propuestas en la literatura, la red de Hop�eld es una de las más conocidas [12]. En estos

modelos, una memoria asociativa M se construye a partir de la suma del producto externo de

los patrones asociados yξ e xξ; ésto es,

M =k∑

ξ=1

yξ(xξ)T =k∑

ξ=1

yξ1x

ξ1 . . . yξ1x

ξn

.... . .

...

yξmxξ1 . . . yξmx

ξn

. (3.13)

En este caso, la entrada ij-ésima de M está dada por µij =∑k

ξ=1 yξi x

ξj . Si los patrones

de entrada x1, . . . ,xk son ortonormales, ésto es

(xj)T · xi =

1 si i = j

0 si i = j(3.14)

entonces, la recuperación de los patrones de salida y1, . . . ,yk es perfecta, ya que

M xi =∑j =i

[yj(xj)T ]xi + [yi(xi)T ]xi =∑j =i

yj[(xj)T · xi] + yi[(xi)T · xi] = yi. (3.15)

Sin embargo, en la mayoría de las aplicaciones, los patrones x1, . . . ,xk no son ortonor-

males, por lo que es necesario realizar procesos de ortonormalización o �ltrado usando funciones

de activación para recuperar los patrones deseados [22].

Las memorias asociativas reticulares son similares a las memorias clásicas con la difer-

encia de que están basadas en las operaciones del álgebra minimax. Sean (x1,y1), . . . , (xk,yk)

k pares de vectores, con xξ ∈ Rn y yξ ∈ Rm para ξ = 1 . . . , k, conjuntados en un par matricial

(X,Y ). Para almacernar los k pares de vectores en una memoria asociativa reticular (MAR),

J. C. Valdiviezo INAOE 59

Page 74: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

3.3. MEMORIAS ASOCIATIVAS RETICULARES

de tamaño m× n, se utiliza un proceso de almacenamiento similar al de las memorias de cor-

relación pero reemplazando el producto externo en la ec. (3.13) con la suma externa minimax

de la ec. (3.2).

De�nición 3.12. Las memorias min-WXY y max -MXY, ambas de tamaño m × n, que al-

macenan un conjunto de asociaciones (X,Y ), así como sus componentes ij están de�nidas,

respectivamente, por las expresiones

WXY = Y ∧ X∗ =k∧

ξ=1

[yξ ⊕ (−xξ)T ] ; wij =k∧

ξ=1

(yξi − xξj), (3.16)

MXY = Y ∨ X∗ =k∨

ξ=1

[yξ ⊕ (−xξ)T ] ; mij =k∨

ξ=1

(yξi − xξj). (3.17)

Las memorias reticulares anteriores de�nidas para X = Y se denominan memorias

hetero-asociativas reticulares (MHAR) y para X = Y se denominan memorias auto-asociativas

reticulares (MAAR). Por lo tanto, para recuperar un patrón de salida yξ dado el patrón de

entrada xξ se hace uso de los operaciones suma-min y suma-max de�nidas en la sección

anterior. Así, yξ = WXY ∨ xξ o equivalentemente yξ = MXY ∧ xξ.

3.3.1. Propiedades algebraicas

Las memorias auto-asociativas reticulares constituyen el fundamento teórico del méto-

do que se emplea en esta investigación, por lo que es necesario mencionar algunas de sus

propiedades algebráicas. En base a las ecs. (3.16) y (3.17) con Y = X, WXX y MXX son

matrices cuadradas de tamaño n× n. Además, la memoria WXX se caracteriza por tener en-

tradas con valores negativos. Para evitar aglomerar la notación, a partir de ahora las memorias

auto-asociativas reticulares se denotarán simplemente como W y M , respectivamente. En las

siguientes líneas se presentan algunas propiedades algebráicas de estas memorias [22, 23, 31].

Diagonal principal nula. Las diagonales principales de W y M , denotadas como wii y

mii respectivamente, están conformadas enteramente por ceros i.e. wii =∧k

ξ=1(xξi −xξ

i ) =

0 =∨k

ξ=1(xξi − xξ

i ) = mii.

J. C. Valdiviezo INAOE 60

Page 75: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

3.3. MEMORIAS ASOCIATIVAS RETICULARES

Dualidad. Para Y = X se tiene que X ∧ X∗ = (X∗)∗ ∧ X∗ = (X ∨ X)∗, entonces

M = W ∗. Por lo tanto, la memoria min-W y la memoria max -M son duales en el sentido

de conjugación matricial.

Capacidad de almacenamiento. Para cualquier patrón de entrada xξ se tiene que

WXX ∨ xξ = xξ = MXX ∧ xξ. De esta forma, no existen restricciones en la dimensión o

en el número de patrones que puedan ser almacenados en W o M .

Dominancia máxima y mínima en la diagonal. Sean wij y mij las entradas de W

y M , respectivamente. Si i, j ∈ {i, . . . , n}, se cumple entonces que wij + wji ≤ wil y

mij +mji ≥ mii. De esta forma, W es diagonalmente max-dominante, mientras que M

es diagonalmente min-dominante.

Conjunto de puntos �jos. Dados un conjunto de vectores X = (x1, . . . ,xk) y una

transformación T : Rn → Rn, entonces x ∈ Rn se denomina punto �jo de T sí y sólo

si T (x) = x. Esta igualdad se satisface para todo vector xξ ∈ X dado que WXX ∨ xξ =

xξ = MXX ∧ xξ. De este modo, W y M comparten el mismo conjunto de puntos �jos

denotado como F (X).

3.3.2. Propiedades geométricas

Dado un conjunto de vectores X = (x1, . . . ,xk) ∈ Rn, a partir de los cuales se contruyen

las memorias WXX y MXX, las reescribimos respectivamente como W = {w1, . . . ,wn} y M =

{m1, . . . ,mn} para explicitar sus vectores columna. Es posible entonces construir un casco

convexo n-dimensional que sea capaz de encerrar a todos o a la mayoría de los vectores en

el espacio dado. Geométricamente estos puntos serán los vértices de un simplex que deben

satisfacer la condición de independencia afín. Para determinar los vértices del simplex a partir

de los vectores columna de W y M , es necesario realizar un escalamiento aditivo sobre los

vectores de ambas memorias para trasladar los valores negativos de WXX al ortante positivo

del espacio Rn. Este escalamiento se realiza en base a los vectores cota máxima y cota mínima

que se de�nen a continuación.

J. C. Valdiviezo INAOE 61

Page 76: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

3.3. MEMORIAS ASOCIATIVAS RETICULARES

De�nición 3.13. Sean X = (x1, . . . ,xk) un subconjunto �nito de Rn. Las cotas vectoriales

mínima y máxima están dadas respectivamente por v =∧k

ξ=1 xξ y u =

∨kξ=1 x

ξ; sus corre-

spondientes entradas se calculan, respectivamente como

vi =k∧

ξ=1

xξi ; ui =

k∨ξ=1

xξi i = 1, . . . , n. (3.18)

Por tanto, el escalamiento aditivo resulta en dos nuevas matrices, denotadas respectiva-

mente como W y M , cuyos vectores columna están de�nidos por

wi = wi + ui ; mi = mi + vi i = 1 . . . , n . (3.19)

Algunas características importantes que resultan de este escalamiento son las siguientes[23]:

1) W y M conservan las propiedades respectivas de dominancia máxima y mínima en la diago-

nal, 2) diag(W ) = u y diag(M) = v, 3) geométricamente los conjuntos formados por {W ∪u}o {M ∪ v} corresponden a los puntos extremos o vértices de dos simplex n-dimensionales que

encierran a subconjuntos de X y 4) el conjunto de puntos M ∪W ∪ {v,u} forma un politopo

convexo B con 2(n+ 1) vértices que contienen a X.

3.3.3. Criterios para evaluar independencia afín

Aunque en casos excepcionales es importante notar que los vectores columna de las

MAAMs no necesariamente satisfacen la propiedad de independencia afín, en cuyo caso, re-

sulta necesario utilizar criterios particulares para veri�car esta propiedad. A continuación, se

presentan dos criterios que pueden ser utilizados para determinar un subconjunto independi-

ente afín a partir de W o M .

Criterio I. Este criterio está basado en la siguiente conjetura, la cual fue establecida origi-

nalmente como un teorema en [22, 23].

Conjetura 3.1. Si X = (x1, . . . ,xk) ⊂ Rn es reticularmente independiente fuerte, entonces

X es independiente afín.

De acuerdo con esta conjetura es posible utilizar la propiedad de independencia reticular

fuerte para derivar un subconjunto de vectores independientes afín y que además sean los

J. C. Valdiviezo INAOE 62

Page 77: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

3.3. MEMORIAS ASOCIATIVAS RETICULARES

vértices del conjunto convexo. De acuerdo con las propiedades de las memorias reticulares,

W es diagonalmente max-dominante, mientras que M es diagonalmente min-dominante; de

esta manera, para obtener un conjunto independiente reticular fuerte es su�ciente evaluar la

propiedad de independencia reticular (IR). El siguiente teorema provee un método para obtener

un conjunto de vectores que satisface independencia reticular fuerte a partir del conjunto de

puntos �jos F (X).

Teorema 3.3. Sea X = (x1, . . . ,xk) ⊂ Rn y sean W y M los vectores que conforman las

columnas de WXX y MXX, respectivamente, entonces existen V ⊂ W y N ⊂ M tal que V

y N son independientes reticulares fuertes y F (V ) = F (N) = F (X) o equivalentemente,

WVV = WXX y MNN = MXX.

Demostración. Dado que W es max-dominante, lo único que se necesita demostrar es la exis-

tencia de un conjunto independiente reticular V tal que WV V = WXX. Sea W = {w1, . . . ,wn}y el conjunto W1 = W\{w1}. Si WW1W1 = WXX , hacer V1 = W1, de otra forma V1 = W . Por

lo tanto, si V1 = W1, entonces w1 /∈ V1 cuando w1 es dependiente reticular, y w1 ∈ V1 cuando

w1 es independiente reticular. En cualquier caso se tiene que WV1V1 = WXX. Enseguida, hacer

V2 = V1\{w2} si WV2V2 = WXX, de otra forma hacer V2 = V1. De nuevo, en cualquier caso se

tendrá WV2V2 = WXX. Se continúa de esta forma hasta Vn = Vn−1\{wn} si WVnVn = WXX, de

otra forma hacer Vn = Vn−1. Una vez queW ha sido evaluado, hacer V = Vn. Por construcción,

V ⊆ W es un subconjunto independiente reticular para el cual WV V = WXX. Dado que V es

también max-dominante se tiene por lo tanto que V es independiente reticular fuerte �.

A partir de la demostración de este teorema surge un método para derivar una base

independiente reticular fuerte para cualquier conjunto de patrones X [24]. El procedimiento

consiste en construir la memoria WXX, y formar el conjunto W . Entonces remover cualquier

conjunto de patrones dependientes reticulares de W usando el método antes descrito y así

obtener el conjunto de patrones V con independencia reticular fuerte.

Criterio II. Este criterio está fundamentado en el siguiente teorema que provee cuatro

igualdades para probar computacionalmente la independencia afín de los conjuntos W =

J. C. Valdiviezo INAOE 63

Page 78: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

3.3. MEMORIAS ASOCIATIVAS RETICULARES

{w1, . . . ,wn} y M = {m1, . . . ,mn} y que ha sido demostrado recientemente en [24]. En esta

discusión wi y mi denotan la i-ésima �la de W y M , respectivamente, en tanto que el vector

c denota un vector constante.

Teorema 3.4. Si j, l ∈ {1, . . . , n}, entonces las siguientes a�rmaciones son equivalentes: (1)

wj −wl = c, (2) wl = wj, (3) mj −ml = c, y (4) ml = mj.

El siguiente teorema, en conjunción con el Teorema 3.4, provee un método simple y

e�caz para derivar un conjunto de vectores independientes afín a partir de W y M . En este

tratamiento, dado el conjunto J = {1, . . . , n}, se denota a J ′ como un subconjunto arbitrario

de J .

Teorema 3.5. W ′ ⊂ W es independientemente afín sí y sólo si wj = wl para todos los

distintos pares {j, l} ⊂ J ′. Similarmente, M ′ ⊂ M es independientemente afín sí y sólo si

mj = ml para todos los distintos pares {j, l} ⊂ J ′.

En los teoremas anteriores se establecen las condiciones necesarias para determinar

vectores independientes afín a partir de las memorias sin escalamiento. De esta manera, lo

único que se tiene que veri�car es que dos vectores de W o M no sean iguales. Dado que el

escalamiento aditivo preserva la dominancia máxima y mínima en las diagonales deW yM , un

resultado fundamental derivado a partir de los teoremas dados es que, si wj = wl ∀{j, l} ⊂ J ,

entonces cualquier subconjunto no vacío de W o M puede servir como un conjunto de puntos

extremos.

3.3.4. Determinación de puntos extremos con W y M

Sea una imagen I(x, y,−→λ ), donde x = 1, . . .m e y = 1, . . . q representan sus coordenadas

espaciales y−→λ hace explícita su dependencia con la longitud de onda y que puede tomar los

valores de−→λ ∈ Rn con n ≥ 3, dependiendo del número de bandas presentes en la imagen. El

objetivo consiste en encontrar p vectores de dimensión 1× n cuyas coordenadas baricéntricas

correspondan a los vértices de H(I) que encierra a la mayoría de los datos. Estos puntos

extremos servirán para representar cualquier pixel dentro del conjunto convexo usando el

J. C. Valdiviezo INAOE 64

Page 79: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

3.3. MEMORIAS ASOCIATIVAS RETICULARES

modelo MLR y se podrán estimar las abundancias fraccionales de los puntos extremos en cada

pixel de la imagen.

Las propiedades algebráicas y geométricas de las MAAMs permiten determinar un

conjunto de puntos extremos o vértices del simplex de dimensión n a partir de la imagen

bajo estudio. Primero es necesario modi�car la imagen I(x, y,−→λ ) de tal manera que cada

pixel se represente como un conjunto X = (x1,x2, . . . ,xmq) ∈ Rn. A partir del conjunto X se

construyen WXX y MXX y se realiza el escalamiento aditivo para obtener las matrices W y M .

El último paso consiste en utilizar cualquiera de los criterios I o II para veri�car independencia

afín entre los vectores columna derivados de cada memoria autoasociativa reticular.

En resumen, para determinar el conjunto de puntos extremos de una imagen multicanal

I(x, y,−→λ ) se realizan los siguientes pasos:

1. Cambiar la imagen I(x, y,−→λ ) al conjunto de pixeles espectrales X = (x1,x2, . . . ,xmq) ⊂

Rn.

2. Calcular WXX y MXX a partir de X

3. Calcular las cotas vectoriales u y v de X.

4. Obtener las matrices escaladas W y M .

5. Veri�car que W o M son independientes a�nes.

6. En el modeloMLR hacer S = W o S = M y calcular el vector a para cada pixel espectral.

En efecto, el métodoW yM es capaz de determinar el conjunto de puntos extremos que

forman un simplex que encierra los datos de la imagen bajo análisis sin importar su tamaño

y dimensión espectral.

J. C. Valdiviezo INAOE 65

Page 80: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

Bibliografía

[1] Anderson J.A., �A simple neural network generating an interactive memory,� Mathematical Bio-

sciences, Vol. 14, pp. 197�220, 1972.

[2] Birkho� G., Lattice Theory, 3rd ed, American Mathematical Society, Providence RI, 1967.

[3] Boyd S. and Vandenberghe L., Convex Optimization, Cambridge University Press, 2004.

[4] Bonnesen T. and Fenchel W., Theorie der Konvexen Körper, Springer-Verlag, Berlin; reprinted

Chelsea, NY, 1948.

[5] Cuninghame-Green R., �Describing industrial processes with interference and approximating their

steady-state behaviour,� Oper. Research Quart., pp. 95�100, 1962.

[6] Cuninghame-Green R., �Minimax algebra and applications.� In: Advances in Imaging & Electron

Physics, P. Hawkes editor, Vol. 90, pp. 1�121, Academic Press, New York, NY, 1995.

[7] Graña M., Raducanu B., �Increasing the robustness of heteroassociative morphological memo-

ries for practical applications� Proc. 6th International Symposium on Mathematical Morphology,

Sidney, Australia, pp. 379�388, 2002.

[8] Graña M., Sussner P., Ritter G.X., �Innovative applications of associative morphological memories

for image processing and pattern recognition,� Mathware & Soft Computing, Vol. 10, pp. 155�168,

2003.

[9] Graña M., Gallego J., �Associative morphological memories for endmember induction,� IEEE

Proc.: IGARSS, Vol. 6, pp. 3757�3759, 2003.

66

Page 81: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

BIBLIOGRAFÍA

[10] Graña M., Maldonado O., Vicente D., �Morphological independence and hyperspectral image

indexing,� SPIE Proc.: Mathematical Methods in Pattern and Image Analysis, Vol. 5916, pp. 1�

10, 2005.

[11] Heinz D.C., Chang C.I., �Fully constrained least square linear spectral mixture for material

quanti�cation in hyperspectral imagery,� Transactions on Geoscience and Remote Sensing, Vol.

39, No. 3, pp. 529�545, 2001.

[12] Hop�eld J.J., �Neural networks and physical systems with emergent collective computational

abilities,� Proc. of the National Academy of Sciences, pp. 2554�2558 1982.

[13] Keshava N. and Mustard J.F., �Spectral unmixing,� IEEE Signal Processing Magazine, Vol. 19,

pp. 44�57, 2002.

[14] Kohonen T., �Correlation Matrix Memory,� IEEE Transactions on Computers, Vol. C-21, No. 4,

pp. 353�359, 1972.

[15] Lawson C.L., Hanson R.J., Solving least squares problems, Prentice-Hall, Englewood Cli�s, NJ,

Chap. 23, 1974.

[16] Lay S.R., Convex Sets and Their Applications, Dover Publications, 2007.

[17] Ritter G.X., �Image algebra with applications.� Unpublished manuscript, available via anony-

mous ftp://cis.u�.edu./pub/src/ia/documents, 1994.

[18] Ritter G.X., Wilson J.N., Handbook of computer vision algorithms in image algebra, CCR Press

Inc, Florida, USA, pp. 289�308, 1996.

[19] Ritter G.X.,�Lattice algebra� and �Minimax algebra,� in Image Algebra, unpublished manuscript

available via anonymous ftp from ftp://ftp.cise.ufl.edu/pub/scr/ia/documents, Center for

Computer Vision and Visualization, CISE Department, University of Florida, Gainesville FL,

pp. 121�135, 1999.

[20] Ritter G.X., Sussner P., Diaz de León J.L.,�Morphological associative memories,� IEEE Trans.

on Neural Networks, Vol. 9, No. 2, pp. 281�293, 1998.

J. C. Valdiviezo INAOE 67

Page 82: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

BIBLIOGRAFÍA

[21] Ritter G.X., Urcid G., Iancu L.,�Reconstruction of patterns from noisy inputs using morphological

associative memories,� Journal of Mathematical Imaging and Vision, Vol. 19, pp. 95�111, 2003.

[22] Ritter G.X., Gader P.,�Fixed point of lattice transforms and lattice associative memories.� In:

Advances in Imaging and Electron Physics, P. Hawkes ed., Vol. 144, Elsevier, San Diego, CA.

pp.165�242, 2006.

[23] Ritter G.X., Urcid G., Schmalz M.S., �Autonomous single-pass endmember approximation using

lattice auto-associative memories,� Neurocomputing, Vol. 72, No. 10-12, pp. 2101�2110, 2009.

[24] Ritter G.X., Urcid G., �Lattice algebra approach to endmember determination in hyperspec-

tral imagery,� Advances in Imaging and Electron Physics, P. Hawkes ed., Vol. 160, pp. 113�169,

Elsevier Inc, Academic Press, 2010.

[25] Serra J., Image Analysis and Mathematical Morphology, Academic Press, New York, NY, Chap.

4, 1982.

[26] Sussner P., Valle M.E., �Gray-scale morphological associative memories,� IEEE Transactions on

Neural Networks, Vol. 17, No. 3, pp. 559�570, 2006.

[27] Urcid G., Ritter G.X., �Kernel computation in morphological associative memories for grayscale

image recollection,� IASTED Proc.: 5th Int. Conf. on Signal and Image Processing, Honolulu, HI,

pp. 450�455, 2003.

[28] Urcid G., Ritter G.X., Iancu L., �Kernel computation in morphological bidirectional associative

memories,� LNCS Proc.: Progress in Pattern Recognition, Speech, and Image Analysis, Springer,

Vol. 2095, pp. 563�570, 2003.

[29] Urcid G. and Ritter G.X., �Noise masking for pattern recall using a single lattice matrix auto-

associative memory,� IEEE Proc.: International Conference on Fuzzy Systems, Vancouver, British

Columbia, Canada, pp. 187�194, September 2006.

[30] Urcid G., Ritter G.X., �Noise Masking for Pattern Recall using a Single Lattice Matrix Associative

Memory.� In: Computational Intelligence based on Lattice Theory, Kaburlasos, V.G. and Ritter,

G.X. eds., Vol. 67, Springer, Heidelberg, Germany, pp. 79�98, 2007.

J. C. Valdiviezo INAOE 68

Page 83: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

BIBLIOGRAFÍA

[31] Urcid-S G., Valdiviezo-N. J.C., �Generation of lattice independent vector sets for pattern recog-

nition applications,� SPIE Proc.: Mathematics of Data/Image Pattern Recognition, Compression,

Coding and Encryption X, with Applications, Vol. 6700-12, San Diego, CA, 2007.

[32] Valdiviezo J.C., Urcid G., �Hyperspectral endmember detection based on strong lattice indepen-

dence,� SPIE Proc.: Applications of Digital Image Processing XXX, Vol. 6696, pp. 669625:1�12,

San Diego, CA, 2007.

J. C. Valdiviezo INAOE 69

Page 84: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

Capítulo 4

Segmentación de Imágenes a Color

El método basado en W y M puede ser utilizado de manera e�ciente como una técnica de

segmentación para imágenes en color. En el siguiente capítulo se describe el uso de dicha

técnica aplicada a diversas imágenes en color RGB de dominio público. Los resultados de

segmentación obtenidos se comparan con los obtenidos por otras técnicas reportadas en la

literatura. Finalmente, se realiza una cuanti�cación de los resultados producidos al transformar

las imágenes RGB a los espacios de color I1I2I3, HSI, y L*a*b*.

4.1. Concepto de segmentación

En diversas aplicaciones orientadas al procesamiento y análisis de imágenes, la seg-

mentación es un proceso previo a la representación de objetos o regiones de interés en la

imagen. La segmentación consiste en subdividir una imagen en un conjunto �nito de regiones

cuyos pixeles comparten atributos bien de�nidos. Los algoritmos de segmentación fueron orig-

inalmente desarrollados para imágenes en niveles de gris y están basados en una de las dos

propiedades básicas de los valores de intensidad: discontinuidad y similitud. Estas técnicas

han sido modi�cadas, mejoradas o extendidas para funcionar adecuadamente en imágenes en

color o en sus respectivas transformaciones a otros espacios.

De�nición 4.1. Sea X un conjunto �nito con k elementos y P un predicado lógico respecto

70

Page 85: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

4.1. CONCEPTO DE SEGMENTACIÓN

de un atributo cuanti�cable. Una segmentación de X es una familia de subconjuntos {Ri} de

X, con ki elementos para i = 1, . . . , q, que satisfacen las siguientes propiedades:

1. Ri ∩Rj = ∅ para i = j (no hay intersección entre subconjuntos distintos).

2.∪q

i=1 Ri = X y∑q

i=1 ki = k (la unión de subconjuntos forma la imagen completa).

3. Para cualquier i, Ri es un conjunto conexo.

4. ∀i,P(Ri) = verdad (los elementos en un subconjunto comparten el mismo atributo).

5. ∀i = j, P(Ri ∪ Rj) = falso (los elementos en la unión de subconjuntos no comparten

los mismos atributos).

La segmentación de imágenes a color ha sido desarrollada desde diferentes perspectivas

que pueden clasi�carse en las siguientes categorías: 1) segmentación basada en pixeles, 2)

área, 3) bordes y 4) en la física de las imágenes. Algunos compendios de estas técnicas se

pueden consultar en [17] y [20], mientras que tratamientos más recientes se pueden consultar

en [4, 10]. Los algoritmos basados en pixeles incluyen las técnicas que utilizan el histograma y

aquellas de análisis por agrupamiento de datos en diferentes espacios de color. En particular,

la umbralización óptima [2] es una técnica basada en el histograma. Las técnicas basadas en

área incluyen el crecimiento de regiones y el método de división y unión (split and merge); de

esta última se puede mencionar el uso de modelos de campos aleatorios de Markov [9, 15]. Por

otra parte, en las técnicas basadas en detección de bordes se pueden mencionar a los métodos

locales y la extensión de la transformación de cuencas (watershed); esta transformación y la

aproximación de zona plana para la segmentación de imágenes a color fueron originalmente

desarrolladas, respectivamente en [13] y [5]. Las técnicas basadas en física utilizan modelos

físicos que permitan particionar una imagen en regiones que corresponden a super�cies y

objetos; el tratamiento matemático que éstas utilizan incluye un modelo que describa los

cambios en la re�exión de la luz de materiales conocidos y que es empleado para segmentar

las imágenes.

Además de las técnicas anteriores, existen otras más recientes que contemplan la fusión

de varios métodos de segmentación con la �nalidad de mejorar los resultados; un ejemplo de

estas técnicas es la aplicación de la cerradura morfológica y la dilatación adaptativa para la

J. C. Valdiviezo INAOE 71

Page 86: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

4.1. CONCEPTO DE SEGMENTACIÓN

umbralización del histograma de color [16]. El uso del algoritmo de cuencas para el agrupamien-

to de color con etiquetamiento de Markov ha sido desarrollado en [6]. Recientemente se han

propuesto técnicas alternativas basadas en computación suave que realizan la segmentación de

imágenes a color [21]; un tratamiento más amplio sobre estas técnicas y su uso en diferentes

espacios de color se puede consultar en [8, 14]. En las siguientes subsecciones se presentan

dos técnicas de segmentación por agrupamiento y que han sido utilizadas para comparar los

resultados obtenidos con el método propuesto.

4.1.1. El método de distancias

Esta técnica de segmentación útil y sencilla ha sido implementada para separar objetos

de un color o rango de colores determinado, en una imagen en color RGB (red, green, blue). A

partir de un color promedio elegido en una región de interés, la técnica se basa en clasi�car

cada pixel de la imagen tomando en cuenta la presencia o ausencia del color especi�cado.

De�nición 4.2. Sea R el conjunto de pixeles que pertenece a la región de interés. El vector

medio z y la matriz de covarianza1 C calculados a partir deR están expresados respectivamente

por

z =1

κ

κ∑i=1

xi ; C =1

κ

κ∑i=1

xixTi − zzT , (4.1)

donde κ denota el número de pixeles en R y xi ∈ R. De esta manera, el proceso de seg-

mentación se realiza por medio de alguna medida de distancia que permita clasi�car a cada

pixel en la imagen como parte de dicha región; es decir, siendo x ∈ R3 un vector arbitrario en

el espacio RGB se dice que x es similar a z si la distancia entre ellos es menor a un umbral

especi�cado, τ . Las distancias Euclidiana (dE) y de Mahalanobis (dM) pueden utilizarse para

esta tarea y están de�nidas respectivamente como sigue

dE(x, z) = [(x− z)T (x− z)]1/2 (4.2)

dM(x, z) = [(x− z)TC−1(x− z)]1/2. (4.3)

1La covarianza indica el sentido de la correlación entre variables y que a partir de la matriz de covarianza

se puede derivar una transformación lineal para decorrelacionar los datos.

J. C. Valdiviezo INAOE 72

Page 87: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

4.1. CONCEPTO DE SEGMENTACIÓN

La localización de los puntos dE(x, z) ≤ τ de�ne una esfera sólida de radio τ . Los puntos

contenidos dentro o sobre la super�cie de la esfera satisfacen el criterio de color especi�cado.

Por su parte, la localización de los puntos dM(x, z) ≤ τ describe un cuerpo elíptico sólido con

la propiedad de que sus ejes principales están orientados en la dirección de extensión máxima

de los datos.

4.1.2. El algoritmo de cuencas

Este procedimiento de segmentación fue originalmente desarrollado para su uso en

imágenes en tonos de gris [1, 12] y posteriormente se propuso una extensión para el caso de

imágenes a color [13], la cual se ha utilizado ampliamente en los últimos años. En esta técnica

se considera el caso más simple de una imagen de intensidad como una super�cie topográ�ca

en donde cada tono de gris es interpretado como una altitud; así, la idea del algoritmo puede

entenderse como un proceso de inundación o llenado de esta super�cie topográ�ca. Para re-

alizar las inundaciones, en cada mínimo del relieve se abre un hueco por donde puede �uir

agua. Cuando el agua ha �uido a través de los huecos y el nivel se ha incrementado a velocidad

constante, el relieve se convierte en un lago.

En una imagen digital los huecos o semillas para el proceso de llenado pueden deter-

minarse al calcular el mínimo del gradiente de la imagen. Comenzando con estas semillas se

establece una jerarquía para el crecimiento de las regiones basado en las diferencias entre los

valores de intensidad de la semilla y de los pixeles vecinos. Primeramente, todos los pixeles

vecinos de una semilla obtienen la misma etiqueta que ella si sus diferencias de intensidad

son cero. Después, todos los pixeles vecinos de una semilla obtienen la misma etiqueta si sus

diferencias de intensidad son 1. Entonces el nivel de diferencias se incrementa aún más y el

procedimiento se continúa hasta que todos los pixeles en la imagen hayan sido etiquetados.

Cuando este esquema se aplica a la segmentación de imágenes a color las semillas en la

imagen pueden ser determinadas al calcular los mínimos de los gradientes en los tres canales.

Además, la diferencia entre los valores de intensidad es reemplazada por una diferencia de

color entre dos pixeles. En diversas aplicaciones es necesario realizar un proceso previo de

�ltrado de la imagen original para evitar lo que se conoce como sobre-segmentación.

J. C. Valdiviezo INAOE 73

Page 88: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

4.2. ESPACIOS DE COLOR

4.2. Espacios de color

De acuerdo a la teoría de colores triestímulo, el color de un objeto puede ser representado

utilizando tres componentes que resultan de utilizar tres �ltros de colores f(λ) con λ=630 nm

(rojo), 550 nm (verde), 420 nm (azul) sobre la radiancia de la luz L(λ). Las cantidades de rojo,

verde y azul necesarias para formar algún color particular se denominan valores triestímulos

denotados por X,Y, Z respectivamente. De esta manera, para cualquier longitud de onda en

el espectro visible, los valores triestímulos necesarios para producir el color correspondiente

a esa longitud de onda pueden ser obtenidos directamente de curvas o tablas que han sido

obtenidas a través de diferentes experimentos [18].

Un espacio de color es una representación utilizada para especi�car y visualizar los

colores de una forma estándar y generalmente aceptada. En estas representaciones se utilizan

tres ejes coordenados que describen la posición del color dentro del espacio. Existen diferentes

espacios de color que estan dirigidos tanto a dispositivos de cómputo (monitores e impresoras),

como para aplicaciones donde el objetivo es la manipulaciòn del color. Entre los espacios

más utilizados en el primer caso se pueden mencionar el RGB (red, green, blue) empleado en

monitores de color y cámaras de video, así como los sistemas CMY (cyan, magenta, yellow) y

CMYK (cyan, magenta, yellow, black) empleados en los sistemas de impresión. Por otra parte,

el modelo HSI (hue, saturation, intensity) permite describir e interpretar los colores de una

forma cercana a la forma en que los humanos percibimos el color. En las siguientes líneas se

describen cuatro sistemas de color que serán de utilidad para la comparación de los resultados.

El espacio de color RGB

En este modelo cada color aparece en sus componentes espectrales primarias de rojo

(red, R), verde (green, G) y azul (blue, B) y está basado en el sistema coordenado cartesiano en

donde el subespacio de interés es un cubo (ver �gura 4.1). Los valores R,G,B están localizados

en tres de las esquinas del cubo y los colores magenta, cian y amarillo están ubicados en las

otras tres esquinas. La escala de grises, comprendida desde el origen (negro) hasta la esquina

más alejada (blanco), se extiende a lo largo de la línea que une estos dos puntos. Los distintos

colores son puntos dentro o sobre el cubo y están de�nidos como vectores ∈ R3 que se extienden

J. C. Valdiviezo INAOE 74

Page 89: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

4.2. ESPACIOS DE COLOR

desde el origen del sistema.

Figura 4.1: Representación del espacio de color RGB.

Las imágenes representadas en este sistema consisten en tres canales, una para cada

color primario. Si consideramos cada una de estas componentes como una imagen de 8 bits, el

número de bits utilizado para representar cada pixel de color será de 24 bits. El número total

de colores en una imagen RGB de 24 bits es, por tanto, (28)3 = 16, 777, 216 colores.

Modelo de color I1I2I3

El modelo de color I1I2I3 es una medida de decorrelación entre los canales RGB, cuyo

propósito es el de extraer las características más importantes del color [9]. Las ecuaciones de

transformación entre el espacio de color RGB y el modelo I1I2I3 son las siguientes:

I1 =R +G+B

3, I2 =

R−B

2, I3 =

2G−R−B

4. (4.4)

El espacio de color HSI

Es un sistema utilizado para representar los colores de manera análoga al que realiza el

sistema visual humano, es decir, por medio del tono, saturación e intensidad [8]. El tono (hue,

H) es el color mismo como descrito por su longitud de onda, la saturación (saturation, S) es

J. C. Valdiviezo INAOE 75

Page 90: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

4.2. ESPACIOS DE COLOR

la cantidad de color que está presente (pureza relativa o cantidad de luz blanca mezclada con

el tono) y la intensidad (intensity, I) es la cantidad de luz. El espacio en el que estos valores

son gra�cados puede representarse por un cono o doble cono circular o hexagonal cuyo eje es

la progresión de escala de grises de negro a blanco, de acuerdo a como se ilustra en la �gura

4.2; la distancia desde el eje central es la saturación y la dirección del vector es el tono. Una

característica importante de este sistema es que separa la información del color de una manera

que corresponde a la respuesta del sistema visual humano; por ejemplo, el uso del tono para

el proceso de segmentación regularmente corresponde con el de la percepción humana.

Figura 4.2: Representación del espacio de color HSI.

Diversas técnicas de procesamiento de imágenes pueden presentar ventajas al utilizar el

sistema de color HSI, lo que implica realizar una conversión entre espacios de color. Dada una

imagen RGB, la trasformación al espacio HSI se realiza por medio de las siguientes expresiones:

I =1

3(R +G+B) ; S = 1− mın(R,G,B)

I, (4.5)

H = arctan

(2B −R−G√

6,R−G√

6

). (4.6)

J. C. Valdiviezo INAOE 76

Page 91: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

4.2. ESPACIOS DE COLOR

El espacio de color L*a*b*

Un espacio geométricamente simple y que es fácil de tratar matemáticamente es el

modelo L*a*b* [19]. Este espacio es perceptualmente uniforme siendo L* la luminancia o el eje

de escala de grises, a* y b* son dos ejes ortogonales que juntos de�nen la saturación y el color.

El eje de lumiancia toma los valores entre 0 y 100 siendo 0 el negro ideal y 100 el blanco de

referencia. De acuerdo a como se muestra en la �gura 4.3, el eje a* reccorre desde el rojo (+a*)

al verde (-a*) y el eje b* desde el amarillo (+b*) al azul (-b*). Estos ejes ofrecen un compromiso

práctico entre la simplicidad de modelo RGB y los espacios que son más �siológicos como el

HSI, los cuales son utilizados en muchos sistemas que manejan color.

Figura 4.3: Representación del espacio de color L*a*b*, donde L* representa la luminancia o el eje de escala

de grises, mientras que a* y b* de�nen la saturación y el color.

A partir de las coordenadas triestímulos XY Z se puede construir el espacio L*a*b*,

por medio de las expresiones siguientes:

L∗ = 25(100Y/Y0)1/3 − 16, (4.7)

a∗ = 500[(X/X0)

1/3 − (Y/Y0)1/3

], (4.8)

b∗ = 200[(Y/Y0)

1/3 − (Z/Z0)1/3

]. (4.9)

J. C. Valdiviezo INAOE 77

Page 92: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

4.3. SEGMENTACIÓN BASADA EN W Y M

donde X0, Y0, Z0 son las valores triestímulos para el blanco de referencia. Además, los valores

X,Y, Z puden ser producidos a partir de las coordenadas RGB por medio de una transformación

lineal. La matriz para el sistema de recepción NTSC se ha utilizado para este propósito y está

de�nida por X

Y

Z

=

0.607 0.174 0.200

0.299 0.587 0.114

0.000 0.066 1.116

R

G

B

(4.10)

4.3. Segmentación basada en W y M

Dada una imagen de color A de m×q pixeles el objetivo del algoritmo de segmentación

propuesto consiste en determinar los pixeles más saturados (con mayor pureza de color) que

permitan separar las mezclas de color presentes en la imagen. Para ello, primeramente se

construye el conjunto X que contiene todos los colores distintos presentes en A, también

considerados vectores 3-D. El siguiente paso consiste en calcular las memorias min-WXX y

max -MXX usando respectivamente las ecs. (3.16) y (3.17), a partir del conjunto X. Para

el caso de imágenes a color las memorias matriciales calculadas son de tamaño 3 × 3, es

decir, W = (w1,w2,w3) y M = (m1,m2,m3). Como se mencionó en el capítulo anterior, de

acuerdo a la forma en que se construyen las memorias reticulares sus vectores columna no

necesariamente pertenecen al espacio de color de la imagen, por lo que se necesita realizar el

escalamiento expresado en la ec. (3.19). Las columnas escaladas de cada una de las matrices

W y M deben satisfacer la propiedad de independencia afín, la cual se puede veri�car de

manera sencilla en base al Teorema 3.5; en particular, para veri�car la independencia afín

de los vectores de W o M ninguna columna debe ser igual o un múltiplo de las dos restantes.

El siguiente paso en el proceso de segmentación consiste en utilizar los conjuntos

W = {w1,w2,w3} y M = {m1,m2,m3} para determinar diversos tetraedros que encierren

subconjuntos deX. Recuérdese que en el espacio de tres dimensiones un simplex corresponderá

a un tetraedro. De esta manera, si los vectores pixel de una imagen a color están encerrados

por algún tetraedro, cuya base esté formada por sus colores más saturados, entonces es posible

hacer una estimación de las fracciones en las cuales éstos aparecen en cualquier otro pixel de

J. C. Valdiviezo INAOE 78

Page 93: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

4.4. EJEMPLOS DE SEGMENTACIÓN

la imagen. Un modelo que se puede utilizar para este análisis es el modelo de mezclado lineal

con restricciones en el cual cada vector de color se representa como una combinación lineal

de los colores más saturados en distintas proporciones; en efecto, a partir de las ecs. (3.9) y

(3.10) para i = 1, 2, 3 y haciendo r = 0 se tiene

x = Sa = a1s1 + a2s

2 + a3s3 , sujeto a (4.11)

a1, a2, a3 ≥ 0,

a1 + a2 + a3 = 1,

donde x es un vector pixel de la imagen, S = (s1, s2, s3) es una matriz cuadrada de 3×3 cuyas

columnas son los colores más saturados, y a es el vector de 3 × 1 que contiene las fracciones

de colores saturados presentes en x. Es importante mencionar que el conjunto de colores más

saturados de una imagen puede ser igual al conjunto de colores primarios (rojo, verde, azul)

o al conjunto de colores complementarios (magenta, cian, amarillo).

La geometría de W y M permite determinar los vértices de un tetraedro que encierra

a los pixeles en la imagen a partir de sus columnas escaladas; dichos vértices corresponden

a los colores más saturados de la imagen. Por lo tanto, el paso siguiente en el procedimiento

consiste en resolver la ecuación (4.11) haciendo S = W o S = M para determinar el vector

a para cada x ∈ X, proceso conocido como separación lineal. Una vez que la ec.(4.11) se ha

resuelto para cada pixel de color x, los valores de los vectores a son desplegados como una

imagen de fracciones de color saturados para s1, s2, s3. El paso �nal consiste en realizar una

umbralización entre 0 y 1 para obtener una segmentación de la imagen de color.

4.4. Ejemplos de segmentación

En las siguientes líneas se presenta un ejemplo que ilustra el funcionamiento del método

de segmentación propuesto, también conocido como método W M . Posteriormente se presen-

tan los resultados de segmentación obtenidos para un conjunto de imágenes en color RGB de

dominio público, así como un conjunto de imágenes representadas en otros espacios de color.

Ejemplo 4.1 En la parte superior izquierda de la �gura 4.4 se presenta una imagen RGB de

J. C. Valdiviezo INAOE 79

Page 94: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

4.4. EJEMPLOS DE SEGMENTACIÓN

tamaño 256 × 256 que corresponde a los colores primarios en el modelo aditivo de color. De

acuerdo con el procedimiento descrito, el conjunto X se ha generado con todos los diferentes

colores presentes en la imagen. El número de vectores en la imagen es de 65,536 y el conjunto

X = {x1, . . . ,x8}. Utilizando X como el conjunto de entrada se han calculado las MAARs, así

como los vectores cota máxima y mínima usados para obtener las matrices escaladas W y M ,

los cuales están dados por

W =

255 0 0

0 255 0

0 0 255

, u

255

255

255

; M =

0 255 255

255 0 255

255 255 0

, v =

0

0

0

.

Figura 4.4: Primera �la, izquierda a derecha: imagen en color RGB utilizada en el Ejemplo 4.1, imágenes en

tonos de gris de las fracciones de color determinadas a partir de las columnas de W . Segunda �la: fracciones

de color determinadas a partir de las columnas de M . La correspondencia entre el nivel de gris asignado y el

valor numérico es el siguiente: 1 = blanco, 0.5 = gris medio, 0.33 = gris oscuro y 0 = negro.

Para determinar el vector de fracciones de color a para cada pixel en la imagen, un

simple análisis algebráico permite invertir la ecuación (4.11) haciendo primero S = W y luego

S = M . Así, es posible obtener una solución analítica para los vectores que conforman la

imagen; en efecto,

J. C. Valdiviezo INAOE 80

Page 95: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

4.4. EJEMPLOS DE SEGMENTACIÓN

W−1

= 1255

1 1 1

1 1 1

1 1 1

; M−1

=1

510

−1 1 1

1 −1 1

1 1 −1

.

En el caso de W−1

= I/(255), siendo I la matriz identidad, se tiene que ai = xi/255

satisface la desigualdad 0 ≤ ai ≤ 1 para todo i = 1, 2, 3 dado que los vectores {x1, . . .x8} se en-cuentran en el intervalo [0,255]. La aditividad completa se satisface si

∑3i=1 ai =

∑3i=1 xi/255 =

1, por lo que los valores de los pixeles de colores residen en el plano x1 + x2 + x3 = 255 lo

cual sólo ocurre en los puntos (255,0,0), (0,255,0) y (0,0,255). Haciendo g = x1 + x2 + x3 se

puede especi�car un criterio que permita determinar las fracciones de color y que satisfaga

la condición anterior; es decir, ai = xi/g si g = 0, de otra forma ai = 0. De manera similar,

para M−1

se tiene que ai =∑

j =i(xj − xi)/510 para i = 1, 2, 3. Sin embargo, puesto que xξi

con ξ = {1, . . . , 8} está en el intervalo [0,255] entonces ai ∈ {−0,5, 0, 0,5, 1} lo que implica

que la positividad no se satisface para todo i. Además, la aditividad completa se satisface si∑3i=1(

∑j =i xj − xi)/510 = 1 indicando que los valores de los pixeles de colores están en el

plano x1 + x2 + x3 = 510, lo cual sucede en los puntos (0,255,255), (255,0,255) y (255,255,0).

Por lo tanto, haciendo g = x1+x2+x3 las fracciones de color que se obtienen con la memoria

M están dadas por ai = (∑

j =i xj − xi)/g si g = 0, de otra forma si g = 0, entonces ai = 0.

Por último para el caso ai = −1 es necesario hacer ai = 0 y entonces aj será igual a aj/2 para

j = i.

Los resultados del procedimiento antes descrito se han desplegado en la �gura 4.4. En

la primera �la se presentan las fracciones de color obtenidas con W que corresponden a la

segmentación de las porciones rojo, verde y azul de la �gura; por su parte en la segunda �la

se presentan las fracciones obtenidas con M que corresponden a las porciones cian, magenta

y amarillo, respectivamente. Cada imagen segmentada ha sido escalada linealmente al rango

[0,255] para su visualización.

Ejemplo 4.2 En la parte superior de la �gura 4.5 se presentan tres imágenes RGB de tamaño

256 × 256 pixeles que se han utlizado para demostrar la funcionalidad del método propuesto.

J. C. Valdiviezo INAOE 81

Page 96: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

4.4. EJEMPLOS DE SEGMENTACIÓN

La Tabla 4.1 presenta información de las caracterísiticas propias de cada imagen.

Tabla 4.1: Información de las imágenes en color RGB utilizadas en el Ejemplo 4.2

Imagen Pixeles (mq) Colores (κ) Matrices

Mandril 65,536 63,106 Wα,Mα

Flores 65,536 40,805 W β,Mβ

Mariposa 65,536 53,298 W γ,Mγ

Las entradas numéricas de las versiones escaladas de las MAARs calculadas a partir de las

imágenes ejemplares están dadas explícitamente por:

W α =

255 129 72

55 255 156

0 90 255

; Mα =

0 200 255

126 0 165

183 99 0

,

W β =

255 224 167

207 255 145

95 129 255

; Mβ =

0 48 160

31 0 126

88 110 0

,

W γ =

255 249 243

90 255 166

61 118 247

; Mγ =

16 165 194

22 0 137

20 81 0

.

Para las imágenes anteriores se han utilizado independientemente W ℓ y M ℓ como la

matriz S, con ℓ = α, β, γ y se ha utilizado el algoritmo numérico del NNLS para estimar

las fracciones de color en los vectores de cada imagen. Además, las memorias matriciales

calculadas son de rango completo y, por lo tanto, las soluciones determinadas por el proceso

de separación lineal son únicas. Obsérvese que los vectores v y u (subrayados en las matrices

anteriores) corresponden respectivamente, a un color negro y un color cercano al blanco; es

posible entonces reemplazar alguna columna de W o M con uno de estos puntos extremos

para obtener una segmentación de las regiones brillantes u oscuras.

J. C. Valdiviezo INAOE 82

Page 97: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

4.4. EJEMPLOS DE SEGMENTACIÓN

Figura 4.5: Fila superior: imágenes de color ejemplares; segunda a cuarta �las: imágenes en tonos de gris

representando las fracciones de los colores saturados seleccionados a partir de W y M .

Por otra parte, los vectores de fracciones de color satisfacen las desigualdades 0 ≤ a ≤ 1,

por lo que es posible mapear linealmente el subintervalo de�nido por [0, µ] ⊆ [0, 1] al rango

dinámico [0,255], donde µ = ∨kξ=1a

ξj . La �gura 4.5 presenta los resultados de segmentación

obtenidos para las �guras ejemplares a partir de las columnas de W y M . En estas �guras

los resultados se han desplegado en todos de gris donde los grises brillantes indican fracciones

de color cercanas a 1, mientras que los grises oscuros indican fracciones de color cercanas a 0.

La parte izquierda de la �gura 4.6 presenta una grá�ca 3-D de la distribución de los vectores

de la imagen del �mandril�. En las partes central y derecha se muestran cuatro tetraedros

que encierran distintos subconjuntos de X y que se obtienen al formar respectivamente los

conjuntos W ∪ {v} y W ∪ {u} (centro) o M ∪ {v} y M ∪ {u} (derecha).

Por último, si se require segmentar el color original de la imagen en cuestión, entonces

puede aplicarse un valor de umbral τ ∈ (0.3, 1) a la imagen de fracciones de color para

J. C. Valdiviezo INAOE 83

Page 98: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

4.5. COMPARACIÓN DE RESULTADOS

Tabla 4.2: Datos de la segmentación de colores en las imágenes ejemplares

Imagen Vectores (Umbral)

Mandril w1α (0.78), m1

α (0.92), m3α (0.67)

Flores m2β (0.62), w1

β (0.51), w2β (0.30)

Mariposa m3γ (0.62), m2

γ (0.52), uγ (0.34)

Figura 4.6: Izquierda: distribución en el espacio de los diferentes vectores de color en la imagen del mandril de

la �g. 4.5. Centro y derecha: diferentes tetraedros determinados por W = {w1,w2,w3} y M = {m1,m2,m3}que encierran diferentes subconjuntos de X.

binarizarla y después hacer un enmascaramiento de la imagen de color original con la imagen

binarizada; la �gura 4.7 muestra los resultados del proceso de enmascaramiento para separar

los distintos colores presentes en las imágenes ejemplares. La Tabla 4.2 despliega los vectores

columna (pixeles de color saturados) seleccionados a partir de ℓ = α, β, γ junto con los valores

de umbral utilizados para realizar la segmentación de los colores de la imagen. Los resultados

de segmentación discutidos, así como una comparación con el método de distancias han sido

reportados en [22].

4.5. Comparación de resultados

Parte fundamental en el desarrollo de una nueva técnica de segmentación consiste

en evaluar los resultados respecto a otras técnicas reportadas en la literatura; lo anterior

J. C. Valdiviezo INAOE 84

Page 99: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

4.5. COMPARACIÓN DE RESULTADOS

Figura 4.7: Fila superior: imágenes de color ejemplares; segunda a cuarta �las: imágenes de colores segmen-

tados para las �guras ejemplares (resultado de umbralización y enmascaramiento).

permitirá conocer el desempeño del método y determinar el tipo de imágenes en el que éste

puede ser utilizado. Además, algunas técnicas de segmentación presentan mejores resultados

en un determinado espacio de color, por tal motivo es necesario conocer si existen mejoras

en los resultados cuando se realizan transformaciones de la imagen original a otros espacios.

En esta sección se presentan los resultados de evaluar el desempeño del método basado en

W y M utilizando imágenes en color RGB y su transformación a los tres espacios de color

introducidos en las secciones anteriores. Más adelante se realiza una comparación cuantitativa

de estos resultados de segmentación en relación a los obtenidos con dos técnicas conocidas: la

técnica por agrupamiento basada en la distancia de Mahalanobis y el algoritmo de cuencas.

En la primera �la de la �gura 4.8 se presentan la imagen RGB de los �pimientos� y su

transformación a los espacios I1I2I3, HSI y L*a*b* que se han desplegado como imágenes en fal-

so color RGB. En la segunda �la se presentan las imágenes conformadas por las segmentaciones

J. C. Valdiviezo INAOE 85

Page 100: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

4.5. COMPARACIÓN DE RESULTADOS

de los pimientos rojos y verdes y las porciones de luz re�ejada para los respectivos espacios

de color. Para formar cada una de las imágenes compuestas se ha realizado el procedimiento

siguiente. Primero, se han calculado W e independientemente M en base a la imagen en el

correspondiente espacio de color y para cada vector columna se han determinado las fracciones

de color por medio de la estimación NNLS. Después, se han seleccionado los mapas que pre-

sentan los mejores resultados en la distribución del color, a partir del conjunto {W ∪M}. Alos mapas seleccionados se les ha asignado un determinado tono de gris y se han combinado

para formar una imagen compuesta. La tabla 4.3 presenta los vectores correspondientes y um-

brales utilizados para producir dichas imágenes. Al observar detenidamente estos resultados se

puede concluir que la técnica propuesta presenta una mejor segmentación cuando se utilizan

los espacios I1I2I3 y RGB.

Tabla 4.3: Datos de segmentación utilizados para los diferentes espacios de color

Espacio de color Vector(umbral)

RGB w1(0.45), w2(0.36), m1(1.56)

I1I2I3 m3(0.39), w3(0.38), w1(0.34)

HSI w1(0.54), m1(0.16), w3(0.51)

L*a*b* w2(0.29), m2(0.53), w1(0.81)

La primera �la de la �gura 4.9, columnas 1 y 2, presenta los resultados de segmentación

producidos con el método WM en los espacios RGB e I1I2I3, respectivamente. En las columnas

3 y 4 de la misma �la se presentan los resultados obtenidos por medio de la distancia de

Mahalanobis y el algoritmo de cuencas. En la última columna se presenta la versión en tonos

de gris NTSC de la imagen de color original, que ha sido cuantizada a 16 niveles de gris.

Asimismo, en la segunda �la de la �gura se han presentado las imágenes de bordes resultado

de aplicar �ltros de Sobel a cada una de las imágenes de la primera �la. Es importante destacar

que la imagen de bordes producida para la versión en tonos de gris de la imagen original será

utilizada como referencia en el proceso de comparación.

Las imágenes de bordes producidas a partir de las segmentaciones antes descritas nos

J. C. Valdiviezo INAOE 86

Page 101: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

4.5. COMPARACIÓN DE RESULTADOS

Figura 4.8: Primera �la: imagen de color en los espacios RGB, I1I2I3, HSI y L*a*b*, respectivamente; segunda

�la: imágenes conformadas por las segmentaciones de los pimientos rojos y verdes y las porciones de luz re�ejada

producidas por W y M para cada espacio de color.

permiten delimitar las regiones segmentadas por cada uno de los algoritmos. Estas regiones

pueden ser comparadas respecto de la imagen de bordes de la versión NTSC tomando en

cuenta los siguientes criterios: perímetro y área de las regiones, razón señal a ruido, coe�ciente

de correlación, entre otros [3]. Para la comparación que se presenta a continuación hemos

elegido como métricas el coe�ciente de correlación, φ, y la razón señal a ruido, SNR, los cuales

se de�nen en lo siguiente.

De�nición 4.3 Sean X e Y dos imágenes con mq = k elementos, sus vectores medios se

denotan respectivamente por zx y zy; se de�ne el coe�ciente de correlación φ como el índice

que mide la relación lineal entre estas dos variables, el cual está expresado como sigue

φ =CXY√σXσY

=

∑ki=1(xi − zx)(yi − zy)√∑k

i=1(xi − zx)2 ·∑k

i=1(yi − zy)2, (4.12)

donde CXY es la matriz de covarianza de X, Y y σX , σY son respectivamente las desviaciones

estándar de las distribuciones [7]. Los valores de φ están en el intervalo [-1,1], cuando φ = 1

existe una correlación positiva perfecta entre las dos imágenes; si φ = 0 no hay correlación y

si φ = −1 existe una correlación negativa total lo que implica una relación inversa entre las

dos imágenes.

J. C. Valdiviezo INAOE 87

Page 102: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

4.5. COMPARACIÓN DE RESULTADOS

Figura 4.9: Primera �la, de izquierda a derecha: resultados se segmentación obtenidos, respectivamente,

con W y M en los espacios RGB y I1I2I3, distancia de Mahalanobis y algoritmo de cuencas e imagen de los

�pimientos� cuantizada a 16 niveles de gris; segunda �la: imágenes de bordes producidos por �ltros de Sobel

para las imágenes de la primera �la.

De�nición 4.4 Sean X una imagen de referencia y Y una imagen modi�cada, la razón señal

a ruido (signal to noise ratio, SNR) se de�ne como la razón entre la varianza de la imagen

original σ2X y la varianza de la diferencia de imágenes, matemáticamente,

SNR = 10 log10

(σ2X

σ2d

). (4.13)

donde σ2X representa la varianza de la imagen original y σ2

d es la varianza de la diferencia de

las imágenes original y modi�cada [11].

Los resultados de comparar las imágenes de bordes de la �gura 4.9 respecto de la imagen

de referencia (imagen de bordes de la versión NTSC) se presentan en la tabla 4.4. Se puede

notar que los mejores resultados de segmentación se han producido con el método basado en

W y M en el espacio de color I1I2I3 cuyos valores de correlación y SNR están por encima de

los otros métodos.

Finalmente, para el caso de imágenes de tres canales en el que el modelo MLR se

transforma en la ec. (4.11), dado que x ∈ R3 y p = 3, una solución alternativa para la

determinación de las abundancias de los colores saturados se puede realizar por medio de la

J. C. Valdiviezo INAOE 88

Page 103: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

4.5. COMPARACIÓN DE RESULTADOS

Tabla 4.4: Comparación del desempeño de los algoritmos de segmentación.

Método de segmentación φ SNR

WM en RGB 0.707 14.179

WM en I1I2I3 0.717 14.931

WM en HSI 0.708 14.124

WM en L*a*b* 0.675 14.006

Distancia de Mahalanobis 0.632 12.917

Algoritmo de cuencas 0.594 9.814

inversión de matriz generalizada que refuerce la aditividad y además umbralice todos aquellos

valores negativos [24]. De esta forma, cualquier aq = 1−ag−ah con q = 1, 2, 3 y q = g < h = q

puede ser seleccionado para reducir el tamaño de la matriz S y el vector a. Por tanto, para

determinar las fracciones de colores saturados se debe resolver para cada pixel de color el

sistema xq = Sqaq, donde aq = (ag, ah)T , Sq = W q o Sq = M q. Las �la i-ésimas y las entradas

respectivas para i = 1, . . . , 3 están dadas por

Sq = (sig − siq, sih − siq) ; xq = (xi − siq). (4.14)

Cualquier valor negativo que resulte de esta inversión debe ser umbralizado al valor de cero

para satisfacer la condición de positividad. La solución expresada en la ec. (4.14), con q = 1,

ha sido empleada para realizar la determinación de las fracciones de colores saturados para el

conjunto de imágenes naturales de dominio público que se presentan en la �gura 4.10. En cada

�la, la imagen original en color RGB se despliega a la izquierda y de izquierda a derecha se

presentan las imágenes compuestas producidas por la segmentación del método W M en los

espacios RGB, I1I2I3, HSI y L*a*b*, respectivamente. Por ejemplo, la imagen en tonos de gris

correspondiente al �oso� en el espacio I1I2I3 fue generada mediante la composición de los mapas

de fracciones obtenidos por w2 y m2 después de la umbralización en τ =0.387 y τ =0.326,

respectivamente. En base a estos resultados se puede notar que el algoritmo de segmentación

basado en W y M presenta mejores resultados en el espacio de color I1I2I3.

J. C. Valdiviezo INAOE 89

Page 104: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

4.5. COMPARACIÓN DE RESULTADOS

Figura 4.10: Primera columna: imágenes en color RGB; segunda a quinta columnas: imágenes conformadas

por las segmentaciones producidas por W y M en los espacios RGB, I1I2I3, HSI y L*a*b*, respectivamente.

Las principales regiones de interès se han cuantizado.

J. C. Valdiviezo INAOE 90

Page 105: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

4.6. CONCLUSIONES

4.6. Conclusiones

En este capítulo se ha presentado un método de segmentación para imágenes en color

basado en las memorias autoasociativas reticualres W y M . Los vectores columna de ambas

memorias de�nen los pixeles de color más saturados en una imagen en color. En base al modelo

MLR, estos pixeles saturados permiten determinar las fracciones de color en cualquier otro pixel

de la imagen. Diversos ejemplos han ilustrado la aplicación de este método en imágenes RGB,

así como a imágenes transformadas a los espacios de color I1I2I3, HSI y L*a*b*. Los resultados

de comparar el método W y M con otras técnicas de segmentación proporcionan detalles en

la efectividad de los resultados obtenidos. En efecto, el método aquí presentado puede ser

clasi�cada como una técnica de agrupamiento de pixeles no supervisada.

J. C. Valdiviezo INAOE 91

Page 106: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

Bibliografía

[1] Beucher S., �The watershed transform applied to image segmentation,� Scanning Mi-

croscopy International, Vol. 6, pp. 299�314, 1992.

[2] Celenk M., Uijt de Haag M., �Optimal thresholding for color images,� SPIE Proc.: Non-

linear Image Processing IX, Vol. 3304, San Jose, CA, pp. 250�259, 1998.

[3] Chalana V., Kim Y., �A methodology for evaluation of boundary detection algorithms on

medical images,� IEEE Trans. on Medical Imaging, Vol. 16, No. 5, pp. 642�652, 1997.

[4] Cheng H.D., Jain X.H., Sun Y., Wang J., �Color image segmentation: advances and

prospects,� Pattern Recognition, Vol. 34, No. 12, pp. 2259�2281, 2001.

[5] Crespo J., Schafer R.W., �The �at zone approach and color images.� In: Mathematical

morphology and its applications to image processing, J. Serra and P. Soille eds., Dordrecht,

The Netherlands: Kluwer Academic, pp. 85�92, 1994.

[6] Géraud T., Strub P-Y., Darbon J., �Color image segmentation based on automatic mor-

phological clustering,� IEEE Proc.: Inter. Conf. on Image Processing, Vol. 3, Thessaloniki,

Greece, pp. 70�73, 2001.

[7] Gonzalez R.C., Woods R.E., Digital Image Processing, 3rd edition, Pearson Education,

2008.

[8] Koschan A., Abidi M., Digital color image processing, Hoboken, NJ: John Wiley & Sons,

chap. 7, pp. 149�174, 2008

92

Page 107: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

BIBLIOGRAFÍA

[9] Liu J., Yang Y.H., �Multiresolution color image segmentation,� IEEE Trans. on Pattern

Analysis and Machine Intelligence, Vol. 16, No. 7, pp. 689�700, 1994.

[10] Lucchese L., Mitra S.K., �Color image segmentation: A-state-of-the-art-survey,� Proc.

Indian Nat. Sci. Acad. (INSA-A), Vol. 67, No. 2, pp. 207�221, 2001.

[11] MacDonald L.W., Ronnier-Luo M., Colour Image Science: exploiting digital media, Eng-

land: John Wiley & Sons, pp. 378�380, 2002.

[12] Meyer F. and Beucher S., �Morphological segmentation,�� Journal of Visual Communi-

cation and Image Representation, Vol. 1, No. 1, pp. 21�46, 1990.

[13] Meyer F., �Color image segmentation,� IEEE Proc.: 4th Inter. Conf. on Image Processing

and its Applications, pp. 303�306, 1992.

[14] Palus H., �Color image segmentation: selected techniques.� In: Color image processing:

methods and applications, R. Lukac, K.N. Plataniotis eds., Boca Raton, FL: CRC Press,

chap. 5, pp. 103�128, 2006.

[15] Panjwani D.K., Healey G., �Unsupervised segmentation of textured colour images using

Markov random �eld models,� Proc. CVPR'93, New York, USA, pp. 776�777, 1993.

[16] Park S.H., Yun I.D., Lee S.U., �Color image segmentation based on 3-D clustering: mor-

phological approach,� Pattern Recognition, Vol. 31, No. 8, pp. 1061�1076, 1998.

[17] Plataniotis K.N., Venetsanopoulos A.N., Color image processing and applications, Berlin,

Germany: Springer, chap. 6, pp. 237�273, 2000.

[18] Poynton C.A., A technical introduction to digital video, NJ: John Wiley & Sons, 1996.

[19] Shafarenko L., Petrou H., Kittler J., �Histogram-based segmentation in a perceptually

uniform color space,� IEEE Trans. on image processing, Vol. 7, No. 9, pp. 1354�1358,

1998.

[20] Skarbek W., Koschan A., Colour image segmentation: a survey, Technical Report 94-32,

Technical University of Berlin, pp. 1�81, 1994.

J. C. Valdiviezo INAOE 93

Page 108: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

BIBLIOGRAFÍA

[21] Sowmya B., Sheelanari B., �Color image segmentation using soft computing techniques,�

Int. Journal of Soft Computing Applications, Vol. 4, pp. 69�80, 2009.

[22] Urcid G. and Valdiviezo-N J.C., �Color image segmentation based on lattice autoassocia-

tive memories,� IASTED Proc.: 13th Arti�cial Intelligence and Soft Computing, Vol. 683,

Palma de Mallorca, Spain, pp. 166�173, 2009.

[23] Urcid G., Valdiviezo-N J.C., Ritter G.X., �Lattice associative memories for segmenting

color images in di�erent color spaces,� LNCS Proc.: Hybrid Arti�cial Intelligence Systems,

Springer, Vol. 6077/2010, pp. 359�366, 2010.

[24] Urcid G., Valdiviezo-N J.C., Ritter G.X., �Lattice algebra approach to color image seg-

mentation,� Journal of Mathematical Imaging and Vision, doi 10.1007/s10851-011-0302-2,

2011.

J. C. Valdiviezo INAOE 94

Page 109: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

Capítulo 5

Análisis de Imágenes Multiespectrales

En este capítulo se realiza el análisis de un conjunto de imágenes multiespectrales usando

el método W M que se introdujo en el capítulo anterior. En primer lugar se explicará el

proceso para el registro de una escena multiespectral en el laboratorio. Después se describirá

la aplicación del método mencionado para el análisis de datos multiespectrales. Finalmente

se presenta una aplicación en la recuperación de la escritura original en el palimpsesto de

Arquímedes. El capitulo se concluye con una comparación de resultados entre el método que

aquí se presenta y dos métricas conocidas.

5.1. Imágenes multiespectrales de documentos antiguos

En años recientes el análisis de palimpsestos y otros documentos antiguos ha tenido

gran interés debido a la cantidad de información que es posible obtener mediante el registro

de imágenes en distintas porciones del espectro electromagnético. Muchos de los textos an-

tiguos que aún se conservan han sufrido daños severos durante el transcurso de varios siglos,

impidiendo que el escrito pueda ser interpretado correctamente. Investigaciones recientes se

han orientado al análisis y recuperación del contenido original aún presente en ellos mediante

técnicas de imagen. El fundamento físico de las técnicas de imagen está basado en el hecho

de que la re�ectancia de los materiales utilizados para la elaboración del documento varía

con la longitud de onda. Un estudio importante acerca de las propiedades ópticas de películas

95

Page 110: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

5.1. IMÁGENES MULTIESPECTRALES DE DOCUMENTOS ANTIGUOS

delgadas de pinturas fue realizado por Van Asperen de Boer quien descubrió que, alrededor

de 2 µm, se puede lograr máxima penetración en la mayoría de las pinturas [17]. Sin embargo,

a longitudes de onda cercanas a los 2 µm, materiales comunes como la tinta de hierro-hiel y

la sepia se vuelven invisibles [5]. Lo anterior sugiere que el registro de imágenes espectrales en

la porción infrarroja puede ser utilizada para visualizar dibujos y textos originales sobre los

cuales se superpusieron nuevas �guras.

Los instrumentos multiespectrales, que fueron utilizados primeramente para registrar

imágenes de la super�ce terrestre, han sido empleados en la actualidad para el análisis, con-

servación y digitalización de objetos de arte y documentos con valor histórico. La re�ectancia

espectral derivada en base a este registro múltiple permite identi�car y clasi�car los elementos

presentes en la escena. De esta manera, el uso de instrumentos multiespectrales en conjunto

con las técnicas digitales de análisis de imagen han permitido el rescate de textos antiguos

y la preservación de una parte del patrimonio cultural. Uno de los primeros trabajos en el

que se utilizó un instrumento multiespectral para analizar la pintura denominada Santísima

Trinidad Predella se presenta en [2]. Las imágenes registradas en las porciones visible e infrar-

rojo cercano fueron procesadas con el objetivo de identi�car los materiales y mejorar las partes

oscuras de la pintura. Más adelante, se realizó la caracterización de las tinturas orgánicas y

minerales en una pintura del siglo XVI atribuída a la escuela de Pieter Brueguel el Elder [11].

Las imágenes captadas fueron analizadas utilizando la técnica de agrupamiento denominada

medias-c difusas. Por otro lado, el registro de imágenes multiespectrales ha dado lugar a nove-

dosas aplicaciones en el estudio de pinturas en murales. En particular, Ware et al analizaron

pigmentos mayas con coloración similar pero diferente composición química provenientes de la

caverna Naj Tunich en Guatemala [18]. Con el análisis de los datos utilizando técnicas de agru-

pamiento se logró diferenciar entre las pinturas originales y aquellas que fueron posteriormente

sobrepuestas.

Existen aplicaciones más especializadas en las que se requiere recuperar los textos

e imágenes originales en documentos históricos. En este contexto, el uso de instrumentos

multiespectrales fue primeramente empleado para visualizar e interpretar la escritura en las

partes dañadas de los Rollos del Mar Muerto [3, 9]. Además, en el caso de los denominados

J. C. Valdiviezo INAOE 96

Page 111: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

5.2. REGISTRO MULTIESPECTRAL DE UNA ESCENA

palimpsestos, que son libros escritos en un periodo histórico determinado y cuyo texto original

fue borrado para sobre escribir en ellos un texto religioso, se ha podido rescatar exitosamente

gran parte del texto original. Uno de los estudios más importantes ha sido impulsado por el

proyecto Arquímedes [1, 8]. Aunque el registro multiespectral de los folios que conforman el

documento en las porciones ultravioleta, visible e infrarroja, en combinación con técnicas de

análisis de imagen han ayudado en el rescate de gran parte de los tratados del matemático

griego, existen partes del texto que no han podido ser rescatadas debido a la presencia de

moho [8].

Nuevas aplicaciones en el contexto de análisis multiespectral de palimpsestos han si-

do desarrolladas para el proyecto europeo denominado Renascimento Virtuale [15]. De esta

manera, diferentes instrumentos multiespectrales se han utilizado para interpretar escritos que

hasta entonces habían sido imposibles de leer. Aunque las técnicas de análisis multiespectral

han demostrado un gran potencial para este propósito, existen problemas relacionados con el

análisis de los datos que no han podido ser resueltos. Uno de estos problemas surge cuando los

tipos de escritura presentan curvas espectrales similares, lo que hace difícil su diferenciación.

En efecto, diversos algoritmos como el análisis de componentes principales o técnicas basadas

en agrupamiento, tales como medias-K o medias-C difusas, siguen siendo evaluadas con el

propósito de lograr una mejor diferenciación y mejoramiento de los textos originales.

5.2. Registro multiespectral de una escena

Existen diversas técnicas que pueden ser utilizadas para registrar una escena multi-

espectral en el laboratorio, las cuales se pueden clasi�car principalmente en dos clases: (1)

técnicas que usan �ltros, (2) técnicas que utilizan distintas fuentes de luz. En el primer ca-

so, el registro está basado en el uso de �ltros de banda angosta para muestrear la escena en

bandas espectrales a lo largo del espectro electromagnético. De esta manera, el proceso para

la adquisición del conjunto de imágenes es el siguiente. Una fuente de luz de amplio espec-

tro, que puede ser una lámpara de tungsteno, ilumina la muestra; la energía que es re�ejada

por la muestra se hace pasar a través de un �ltro de banda angosta (�ltro variable o �ltro

J. C. Valdiviezo INAOE 97

Page 112: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

5.2. REGISTRO MULTIESPECTRAL DE UNA ESCENA

Fuentede luz

CCD

filtros

Figura 5.1: Registro multiespectral de un documento antiguo usando un arreglo de �ltros.

interferométrico), colocado en la entrada de un detector, que puede ser una cámara CCD, el

cual registra la imagen. Este procedimiento se repite para cada uno de los �ltros que permiten

muestrear el intervalo de longitudes de onda de interés. Por otra parte, en el segundo caso la

idea fundamental consiste en el uso de diversas fuentes de luz espectralmente angostas para

capturar imágenes de la misma escena en distintas bandas espectrales. De esta forma, los ele-

mentos que conforman el arreglo experimental son: una fuente de luz variable o un conjunto

de fuentes espectralmente angostas para iluminar la muestra y un elemento detector, tal como

una cámara CCD. En la �gura 5.1 se muestra el arreglo utilizado para registrar la imagen

multiespectral de un documento antiguo usando un arreglo de �ltros.

En efecto, con cualquiera de las dos técnicas la idea es submuestrear el espectro de

longitudes de onda de interés (visible o infrarrojo cercano) utilizando elementos ópticos o

fuentes de luz que limiten el registro de las imágenes en determinadas bandas relativamente

angostas. Una vez que se ha realizado el registro multiespectral de la escena es necesario

modelar los factores que intervienen en la adquisición con el propósito de derivar la re�ectancia

espectral de los materiales que la conforman. En las siguientes líneas se hará mención de

algunas de estas técnicas.

J. C. Valdiviezo INAOE 98

Page 113: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

5.2. REGISTRO MULTIESPECTRAL DE UNA ESCENA

5.2.1. Técnicas de estimación de la re�ectancia espectral

Para un sistema de captura de imágenes multiespectrales que consta de una cámara

CCD monocromática, un conjunto m de �ltros ópticos y una fuente de luz de banda ancha, la

respuesta de la cámara ci que se obtiene con el i-ésimo �ltro (para i = 1, . . . ,m), asumiendo

iluminación de luz colimada a lo largo de la imagen, está dada por,

ci =

∫ λmax

λmın

o(λ)r(λ)dλ+ ni, (5.1)

donde o(λ) = fi(λ)E(λ) representa el producto de la sensibilidad espectral de la cámara para

el i-ésimo �ltro fi(λ) por la distribución espectral de la fuente de iluminación E(λ), r(λ)

es la re�ectancia espectral del objeto y ni es el ruido adherido en la i-ésima imagen [12].

Una solución a esta ecuación se puede conseguir utilizando técnicas de estimación discretas;

para ello, es necesario tomar K muestras de oi(λ) y r(λ) que permitan discretizar la integral

continua y expresarla en forma vectorial de la siguiente manera

ci = oTi r+ ni, (5.2)

donde oi y r son vectores de dimensión K × 1, respectivamente, y oTi = fTi E, es el producto

de fTi , el vector transpuesto de la sensibilidad espectral del i-ésimo �ltro por E, la matriz

diagonal de la distribución espectral de la iluminación. Además, la respuesta de la cámara ci

se puede representar como un vector de m× 1, tal que

c = Or+ n, (5.3)

donde oTi ocupa la i-ésima �la de la matriz O. Por tanto, una primera estimación r de la

re�ectancia espectral puede obtenerse a partir de la inversa generalizada asumiendo la ausencia

de ruido; ésto es,

r = O+c = OT (OOT )−1c. (5.4)

La inversa generalizada proporciona un error cuadrático medio mínimo, sin embargo, dicho

cálculo puede conducir a estimaciones oscilatorias. Una alternativa para evitar este problema

consiste en imponer algunas condiciones de suavizamiento sobre la solución. El uso de una

J. C. Valdiviezo INAOE 99

Page 114: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

5.2. REGISTRO MULTIESPECTRAL DE UNA ESCENA

matriz de suavizamiento permite obtener una estimación suavizada, la cual está dada por [12],

r = M−1OT (OM−1OT )−1c; (5.5)

La matriz de suavizamiento M se de�ne como:

M =

1 −2 1 0 0 0 . . . 0

−2 5 −4 1 0 0 . . . 0

1 −4 6 −4 1 0 0

0 1 −4 6 −4 1 0...

. . ....

0 . . . . . . . . . 0 1 −2 1

. (5.6)

Una tercera alternativa consiste en aplicar métodos de estimación de Wiener en los

que se considera a r como un vector muestra que resulta de un proceso alteatorio con media

conocida y matriz de covarianza Cr [12]. De esta forma, la estimación de Wiener está de�nida

por,

r = CrOT (OCrO

T )−1c, (5.7)

Una aproximación utilizada para Cr en la que ésta es modelada como una matriz

de covarianza resultado de un proceso de Markov de primer orden está de�nida, para i, j =

1, . . . , K, como

(Cr)ij =

ρj−i ⇔ i < j

1 ⇔ i = j

ρi−j ⇔ i > j

, (5.8)

donde 0 ≤ ρ ≤ 1 es el factor de correlación del elemento adyacente.

5.2.2. El Palimpsesto de Arquímedes

El manuscrito original de Arquímedes es un texto escrito sobre cuero de animal que fue

creado en el siglo X para copiar siete de los tratados del cienti�co y matemático griego. Cada

hoja del manuscrito medía aproximadamente 20 cm de ancho por 30 cm de largo. En el siglo

XII el texto fue lavado, cada página fue cortada por la mitad y sobre ellas se reescribió un

J. C. Valdiviezo INAOE 100

Page 115: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

5.2. REGISTRO MULTIESPECTRAL DE UNA ESCENA

libro cristiano de resos al que se le denominó el Euchologion. Durante la edad media reciclar

libros de esta manera era una práctica común debido a lo costoso que resultaba el tratamiento

de la piel de cordero para hacer nuevos pergaminos. Las hojas individuales del nuevo libro

miden aproximadamente 15 cm de ancho por 20 cm de largo y el texto religioso está escrito de

manera perpendicular a los textos originales borrados. La tinta utilizada para escribir el libro

de resos y la mayoría de los textos originales fue tinta hecha de hierro y hiel. En el Euchologion

la tinta es de color café oscura y los caracteres se leen muy bien en la mayoría de las páginas,

mientras que, en los textos borrados, las manchas de tinta remanentes son generalmente de

color más rojo y la visibilidad de los textos va desde evidente hasta virtualmente invisible.

El libro de resos fue utilizado por cientos de años en los servicios cristianos en el

Monasterio de San Saba, localizado en el desierto de Judea. En 1800, el libro fue colocado

en la biblioteca del Metochion del Santo Sepulcro en Constantinopla, donde su presencia

fue notado en 1844 por Constantin Von Tischendorf. Después de una larga trayectoria, en

octubre de 1998 el manuscrito fue comprado por un coleccionista anónimo, quien lo depositó

en el Museo de Arte Walters, en Baltimore, Maryland y desde entonces ha �nanciado un

programa intensivo para la restauración, conservación y el análisis del documento. De esta

forma, diversas técnicas y sensores han sido utilizados para la digitalización del documento,

incluyendo imágenes obtenidas mediante iluminación con rayos UV y rayos X [10].

El registro multiespectral del documento se realizó por medio de iluminación prove-

niente de arreglos LEDs, a diferentes longitudes de onda; para la captura de las imágenes del

documento se utilizó un sensor de color Sinar 54H, que registra valores RGB en cada pixel

por medio de traslaciones pizoeléctricas del sensor. Con el uso de este arreglo once imágenes

fueron registradas con bandas espectrales centradas en las longitudes de onda que se indican

en la Tabla 5.1. Una vez que los valores de radiancia captados por el sensor se transformaron

en re�ectancia, tomando en cuenta la respuesta de la cámara y la distribución espectral de las

fuentes de iluminación, el análisis de las imágenes permite diferenciar los pigmentos presentes

en la manuscrito en base a su re�ectancia espectral.

J. C. Valdiviezo INAOE 101

Page 116: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

5.3. MÉTODOS AUTÓNOMOS DE ANÁLISIS

Tabla 5.1: Imágenes multiespectrales registradas para el documento de Arquímedes.

Bandas 1 2 3 4 5 6 7 8 9 10 11

λ0 (nm) 365 445 470 505 530 570 617 625 700 735 870

5.3. Métodos autónomos de análisis

En diversas aplicaciones se requieren técnicas autónomas que permitan clasi�car los elemen-

tos que conforman una imagen. En el caso de imágenes multiespectrales técnicas particulares

se han aplicado para este propósito, algunas de la cuales están basadas en criterios como:

transformaciones para reducir la redundancia de información, agrupamiento de pixeles con in-

formación espectral similar y técnicas basadas en geometría convexa. En esta sección se hace

mención de tres métodos importantes de análisis que se pueden utilizar para la separación de

los textos presentes en el manuscrito de Arquímedes.

5.3.1. Análisis de componentes principales

La transformación de componentes principales (principal component analysis, PCA),

ha sido ampliamente utilizada para reducir la redundancia de información en un conjunto de

datos multiespectrales. Esta técnica permite encontrar combinaciones lineales ortogonales de

un conjunto de características (bandas espectrales) que maximizan la variación existente dentro

de ellas; dichas variaciones se despliegan en un nuevo conjunto de imágenes denominadas

componentes. El tratamiento matemático del análisis de componentes principales se presenta

a continuación.

Dada una imagen con k vectores en Rn, el vector medio z y la matriz de covarianza

C se calculan mediante las expresiones introducidas en la ec. (4.1). La matriz C de tamaño

n × n es real y simétrica. Si los elementos xi y xj no están correlacionados, su covarianza es

cero y, por lo tanto, cij = cji = 0. Además, sean ei y λi con i = 1, . . . , n, respectivamente,

los eigenvectores y eigenvalores correspondientes de C, ordenados en orden descendente tal

que λj ≥ λj+1 para j = 1, . . . , n − 1. De esta manera, sea A una matriz cuyas �las estén

formadas por los eigenvectores de C, ordenados decrecientemente de acuerdo al valor de sus

J. C. Valdiviezo INAOE 102

Page 117: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

5.3. MÉTODOS AUTÓNOMOS DE ANÁLISIS

correspondientes eigenvalores. Por lo tanto, siendo A una matriz de transformación que se

utiliza para mapear los vectores x a vectores correspondientes y, se de�ne la transformada

Hotelling de acuerdo a la siguiente expresión:

y = A(x− z). (5.9)

Es importante mencionar que en esta transformación los ejes del nuevo sistema coordenado

apuntan en la dirección de máxima varianza. Por otra parte, al calcular la matriz de covarianza

de y, los elementos fuera de la diagonal son cero, lo cual signi�ca que sus elementos no

poseen correlación. Finalmente, para el caso de las imágenes de componentes principales, una

característica importante es que una porción alta del contraste está contenida en las primeras

dos imágenes, decreciendo rápidamente a partir de la segunda componente.

5.3.2. Agrupación con medias-K

El algoritmo de medias-K (K-means) es utilizado para identi�car grupos de los puntos

de datos en un espacio n-dimensional. Dado un conjunto de datos {x1, . . . ,xQ} que consiste

en Q observaciones de una variable aleatoria X ∈ Rn, el propósito es particionar el conjunto

de datos en algún número K de grupos. En particular, un grupo consiste en un conjunto de

datos cuyas distancias entre puntos son pequeñas comparadas con las distancias con puntos

fuera del grupo. Los vectores −→ς ξ, con ξ = 1, . . . , K, representan los centros de dichos grupos.

De esta forma, el objetivo del algoritmo es determinar el conjunto de vectores −→ς ξ, así como

asignar los datos a alguno de los grupos tal que la suma del cuadrado de las distancias de cada

punto a su vector −→ς ξ más cercano sea un mínimo.

Formalmente, para cada punto xq, con q = 1, . . . Q, un conjunto de variables indicadoras

binarias dq,ξ ∈ {0, 1} describe a cual de los K grupos el punto xq es asignado, tal que si este

punto se asigna al grupo ξ, entonces dq,ξ = 1 y dq,j = 0 para j = ξ. Se de�ne entonces la

siguiente función objetivo, tal que

J =

Q∑q=1

K∑ξ=1

dq,ξ ∥ xq −−→ς ξ ∥2, (5.10)

J. C. Valdiviezo INAOE 103

Page 118: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

5.3. MÉTODOS AUTÓNOMOS DE ANÁLISIS

la cual representa la suma de los cuadrados de las distancias de cada punto a su vector asignado−→ς ξ. Dado que esta función tiene por objetivo encontrar valores de dq,ξ y −→ς ξ que minimicen

a J , el algoritmo realiza un proceso iterativo en el que cada iteración involucra dos procesos

de optimización. Primero se escogen valores iniciales para −→ς ξ. Entonces se minimiza J con

respecto a dq,ξ, manteniendo a −→ς ξ �jo. En la segunda etapa se minimiza J con respecto a−→ς ξ, manteniendo a dq,ξ �jo. Estos dos pasos se repiten hasta que el algoritmo converge [4]. En

efecto, con el procedimiento descrito todos los puntos se clasi�can en alguno de los K grupos.

5.3.3. El método W y M aplicado al caso multiespectral

En el caso de imágenes multiespectrales, el método basado en W y M se puede utilizar

para determinar el conjunto de puntos extremos de la imagen, que a su vez representan a los

pixeles espectrales más puros. En base al modeloMLR, enunciado en la ec. (3.9), la información

registrada en cada pixel de una imagen multiespectral puede considerarse como la re�ectancia

mezclada de los diversos materiales que conforman la escena. Es decir, muchos de los pixeles

de la escena habrán registrado un espectro combinado y algunos otros contendrán el espectro

de un único material. En particular, para el caso del palimpsesto de Arquímedes, la mezcla

espectral estará conformada por los espectros que pertenecen a los dos tipos de pigmentos

utilizados para los dos escritos y el cuero del manuscrito. Por tanto, la representación de

mezclas espectrales permitirá estimar la presencia de alguno de los pigmentos en cada pixel

de la imagen.

De acuerdo con la discusión presentada en el Capítulo 3, después de calular las memo-

rias escaladas W y M es necesario veri�car que sus columnas cumplen con la propiedad de

independientes afín. De esta manera, la extensión de este método para el caso multiespectral

consiste en el uso de cualquiera de los dos criterios para derivar subconjuntos de W y M que

sean independientes afín. En el Criterio I la idea fundamental consiste en determinar los vec-

tores que cumplen con independencia reticular fuerte ya que se ha establecido que ésta implica

independencia afín. De acuerdo a lo descrito en el Teorema 3.3, dado queW es max-dominante

y M es min-dominante en la diagonal, para la búsqueda de vectores IRF es su�ciente evaluar

únicamente la propiedad de independencia reticular. En efecto, la demostración de este teo-

J. C. Valdiviezo INAOE 104

Page 119: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

5.4. DETERMINACIÓN DE PIGMENTOS

rema provee un método para comprobar la propiedad de independencia reticular y con ello

derivar un subconjunto de vectores independientes afín.

El Criterio II está basado en los Teoremas 3.4 y 3.5, en los que se establece que, para

obtener un conjunto independiente afín, ningun vector columna deW e independientementeM

debe ser igual o un múltiplo de alguno de los demás vectores. De esta forma, el procedimiento

en este caso consiste en eliminar cualquier vector columna que sea un múltiplo de los restantes.

Una vez que se han determinado subconjuntos de W y M se pueden utilizar ambos

conjuntos o determinadas columnas de ellos como la matriz S en el MLR. Por último, de

manera análoga al caso de imágenes en color, se debe estimar la proporción de cada uno de

los materiales constituyentes que forman las columnas de S, en cada pixel de la imagen. Para

ello, es posible utilizar el algoritmo de estimación por mínimos cuadrados no-negativa (NNLS),

la técnica de multiplicadores de Lagrange o la técnica híbrida presentada en la ec. (4.14).

5.4. Determinación de pigmentos

El análisis multiespectral de documentos antiguos se ha realizado por medio de los

tres métodos descritos anteriormente, aplicados al conjunto multiespectral perteneciente al

palimpsesto de Arquímedes. El objetivo que se pretende lograr con cada una de estas técnicas

es separar los diferentes pigmentos presentes. En esta sección se presentan las imágenes de

segmentación que se obtienen en cada caso y que incluyen los tipos de escritura y el cuero que

fue utilizado para la elaboración del documento.

5.4.1. Implementación numérica

Los métodos de análisis se han aplicado utilizando una subimagen de tamaño 270×360

pixeles de las once bandas multiespectrales que corresponde a la página inferior izquierda del

folio 014v-019r en el palimpsesto. Los datos de este conjunto multiespectral corresponden

a valores de re�ectancia, por lo que cualquiera de los métodos se pueden aplicar de forma

directa. Para el análisis se forma primeramente la matrix X con todos los pixeles espectrales

que contiene la imagen; así, X = {x1, . . . ,xk} ∈ R11, con k = 270× 360 vectores.

J. C. Valdiviezo INAOE 105

Page 120: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

5.4. DETERMINACIÓN DE PIGMENTOS

Componentes principales

Al emplear el análisis de componentes principales, a partir del conjunto X se calcu-

laron el vector z y la matriz de covarianza C, respectivamente. El cálculo de los eigenvalores y

eigenvectores de C se utilizó para formar la matriz A cuyas �las contienen a los eigenvectores

ordenados en forma decreciente de su correspondiente eigenvalor. Además, las once compo-

nentes de la imagen se calcularon por medio de la trasformación expresada en la ecuacion

(5.9). La Tabla 5.2 muestra los eigenvalores ordenados en forma decreciente. De acuerdo a

la discusión presentada en la sección anterior, en esta transformación es posible representar

las características más importantes de la imagen utilizando las componentes con los mayores

eigenvalores. Por tanto, las dos primeras componentes principales de la imagen, denotadas por

C1 y C2, se han utilizado para formar una imagen en falso color, tal que C1, C2, C1 han sido

empleadas respectivamente, como los canales R,G y B de la nueva imagen. La parte izquierda

de la �gura 5.2 presenta la imagen en color verdadero de la porción del manuscrito empleada

para las simulaciones, mientras que la parte derecha despliega la imagen RGB que resulta de

la combinación de C1 y C2.

Tabla 5.2: Eigenvalores λi con i = 1, . . . , 11 calculados para el análisis de componentes principales.

λ1 λ2 λ3 λ4 λ5 λ6 λ7 λ8 λ9 λ10 λ11

284.3 215 67.9 59.17 16.23 10.88 9 7.29 6.49 4.69 3.33

Medias-K.

La implementación numérica del algoritmo de acumulación por medias K en Matlab

fue utilizado para separar las tres clases presentes en el conjunto de datos X. Para ello, los

parámetros que se pueden especi�car como entrada en el algoritmo son: el número de clases, el

tipo de distancia a utilizar, el número de veces que se desea repetir el agrupamiento y el método

utilizado para elegir las posiciones de los centroides iniciales. En base a los resultados obtenidos

con componentes principales, el número de clases se estableció igual a 3. Además, después de

realizar distintas iteraciones con diferentes parámetros para determinar el mejor desempeño

del algoritmo los parámetros restantes se de�nieron como sigue. La distancia Euclidiana se

J. C. Valdiviezo INAOE 106

Page 121: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

5.4. DETERMINACIÓN DE PIGMENTOS

Figura 5.2: Izquierda: imagen en color verdadero de la porción del palimpsesto utilizada para los experimen-

tos. Derecha: imagen en falso color realizada mediante la composición de las componentes C1 y C2 obtenidas

mediante PCA.

de�nió como métrica entre las clases, el número de veces que se repitió el agrupamiento fue

igual a 5 y los centroides iniciales se eligieron de acuerdo a una selección aleatoria a partir

del conjunto X. La Tabla 5.3 despliega los valores de los centroides −→ς 1,−→ς 2,−→ς 3 determinados

con el algoritmo. En la parte inferior izquierda de la �gura 5.5 se muestra la clasi�cación de

los tipos de escritura y el fondo realizados por el agrupamiento de medias-K.

Tabla 5.3: Centroides determinados por medias-K para separar las tres clases en el palimpsesto.

−→ς 1 116.4 56.5 74.5 92.2 94.9 81.4 98.3 94.4 77.4 73.6 118.9−→ς 2 82.4 41.3 54.2 68.6 71.7 65.5 88.5 83.6 69.9 68.1 114.8−→ς 3 48.6 25.6 32.9 41.4 43.6 40.9 59.5 56.9 52.2 54.5 107.8

Método W y M .

El cálculo de las matrices WXX y MXX se realizó a partir del conjunto X y los vectores

u y v fueron utilizados para calcular las versiones escaladas W y M , respectivamente. Después

de comprobar la independencia afín de las columnas de ambas memorias, cada matriz está

J. C. Valdiviezo INAOE 107

Page 122: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

5.4. DETERMINACIÓN DE PIGMENTOS

conformada por 11 columnas, por lo que el máximo número de puntos extremos que se pueden

determinar a partir deW∪M∪{v∪u} es igual a 11+11+2 = 24. Es importante mencionar que,

aunque las columnas que conforman a W ∪M corresponden a valores extremos que encierran

al conjunto X, existe una correlación entre columnas adyacentes de cada matriz escalada. De

ahí que sea necesario aplicar una medida que permita discriminar entre aquellas columnas

que no presenten correlación, mismas que serán utilizadas como columnas de la matriz S en

el modelo MLR. En esta aplicación se utilizó el ángulo espectral entre vectores (spectral angle

mapper, SAM) como métrica para seleccionar un subconjunto de éstos, el cual calcula el ángulo

θ entre un vector espectral x y un espectro de referencia t y está de�nida por [14],

θ = cos−1 x · t∥x∥∥t∥

. (5.11)

A partir de los 24 vectores extremos, 3 columnas no correlacionadas fueron seleccionadas

en base a los valores más altos de θ calculados para todo el conjunto de vectores; de esta

manera, las columnas seleccionadas fueron w11,m1,m11. La �gura 5.3 muestra las curvas de

dichos vectores espectrales. Finalmente, los vectores espectrales se utilizaron como columnas

de la matriz S en la ec. (3.9). La solución obtenida por medio del método numérico de NNLS

permitió determinar los coe�cientes de abundancias para cada punto extremo en cada pixel

de la imagen. Además, dichos coe�cientes fueron escalados en el rango dinámico [0,255] para

su visualización como mapas de abundancia. La �gura 5.4 muestra los mapas de abundancia

de los tipos de escritura y el fondo del manuscrito determinados a partir de W y M .

5.4.2. Comparación de resultados

Los resultados de segmentación obtenidos con cada uno de los métodos anteriores se

resumen en la �gura 5.5. En la primera �la, de izquierda a derecha, se presentan la subimagen

del manuscrito desplegada en color verdadero, así como la composición en falso color obtenida

con el método PCA. La segunda �la despliega los resultados del agrupamiento realizado por

medias-K (izquierda) y la combinación de dos mapas de abundancia, que corresponden a los

tipos de escritura, determinados por el método W y M (derecha). En base a este panel es

posible realizar una comparación visual de los resultados. Así, al tratar de interpretar el texto

J. C. Valdiviezo INAOE 108

Page 123: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

5.4. DETERMINACIÓN DE PIGMENTOS

Figura 5.3: Curvas espectrales de los puntos extremos determinados a partir de W y M . La correspondencia

de estos puntos es: pigmento 1 = w11, pigmento 2 = m1 y cuero = m11.

escrito en forma horizontal, el cual corresponde al texto original que data del siglo X, las tres

técnicas permiten resaltar o extraer gran parte de información. Por ejemplo, la composición

realizada en base a PCA ayuda a contrastar los dos textos presentes en el palimpsesto, lo

que facilita su interpretación. En el caso de medias-K, aunque se logran separar las tres

clases, existen diversos cortes en el texto original así como muchos pixeles mal clasi�cados

en los que el algoritmo ha señalado la presencia del pigmento 1. Por otra parte, dado que

con el método basado en W y M se han calculado las abundancias fraccionales para cada

pigmento en los pixeles de la imagen, la separación de los dos textos y el cuero se ha logrado

en buena proporción, lo cual permite una mejor extracción e interpretación del texto original.

Una ventaja adicional del método propuesto es que los textos se pueden visualizar de forma

separada. Por otra parte, en muchas aplicaciones es deseable realizar una cuanti�cación de

los resultados obtenidos en cada caso. Sin embargo, para este caso de estudio en el que no

se cuenta con una imagen de referencia con la que se puedan comparar dichos resultados, la

comparación está limitada a una interpretación visual.

J. C. Valdiviezo INAOE 109

Page 124: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

5.5. CONCLUSIONES

Figura 5.4: Imágenes de las abundancias de los materiales constituyentes del palimpsesto determinados a

partir de W y M . Izquierda: texto escrito en el siglo XII (pigmento 2); centro: texto escrito en el siglo X

(pigmento 1); derecha: cuero del manuscrito.

5.5. Conclusiones

En este capítulo se ha discutido la aplicación del métodoW yM para la segmentación de

textos en imágenes multiespectrales de documentos antiguos. En primer lugar se ha descrito el

proceso para el registro de imágenes multiespectrales, así como algunos métodos para estimar

la re�ectancia espectral de la escena. Además, se han discutido los criterios para la aplicación de

W yM al caso multiespectral y se han presentado los fundamentos matemáticos de dos técnicas

adicionales que se pueden emplear para el análisis de los textos del palimpsesto de Arquímedes.

Los resultados obtenidos con el método W y M , así como aquellos determinados por PCA y

medias-K han permitido extraer gran parte del texto original presente en el documento. En

particular, las primeras componentes de PCA pueden ser utilizadas para contrastar los textos

del documento, mientras que el agrupamiento realizado por medias-K permite clasi�car los

pixeles que pertenecen a un determinado tipo de escritura. Aunque los resultados con ambos

métodos son buenos, los que se han obtenido con W y M logran una mejor separación de los

pigmentos y con ello una mayor porción del texto original ha sido extraída. De esta manera,

con los resultados obtenidos se concluye que es posible emplear el análisis de mezclado lineal

para representar las mezclas espectrales en cada pixel de la imagen.

J. C. Valdiviezo INAOE 110

Page 125: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

5.5. CONCLUSIONES

Figura 5.5: Resultados de segmentación de los pigmentos presentes en el palimpsesto de Arquímedes. Primera

�la, de izquierda a derecha: subimagen del manuscrito desplegada en color verdadero, composición en falso

color utilizando PCA. Segunda �la, izquierda a derecha: resultados del agrupamiento por medias-K, mapas de

abundancia que corresponden a los dos tipos de escritura determinados por el método W M .

J. C. Valdiviezo INAOE 111

Page 126: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

Bibliografía

[1] Archimedes Palimpsest, �The Archimedes Palimpsest Project,� www.archimedespalimpsest.net,

2008.

[2] Baronti S., Casini A., Lotti F., Porcinai S., �Multispectral imaging systems for the mapping of

pigments in works of art by use of principal component analysis,� Applied Optics, Vol. 37, No. 8,

pp. 1299�1309, 1998.

[3] Bearman G.H., Spiro S.E., �Archaeological applications of advanced imaging techniques,� The

Biblical Archaeologist, Vol. 59, No. 1, pp. 56�66, 1996.

[4] Bishop C.M., Pattern Recognition and Machine Learning, Springer, pp. 424�425, 2006.

[5] Burmester A., Bayerer F., �Towards improved infrared re�ectograms,� Studies in Conservation,

Vol. 38, No. 3, pp. 145�154, 1993.

[6] Casini A., Lotti F., Picollo M., Stefani L., Buzzegoli E., �Image spectroscopy mapping technique

for non-invasive analysis of paintings,� Studies in Conservation Vol. 44, No. 1, pp. 39�48, 1999.

[7] Conde J., Haneishi H., Yamaguchi M., Ohyama N., Baez J., �Spectral re�ectance estimation of

ancient mexican condices, multispectral images approach,� Revista Mexicana de Física, Vol. 50,

No. 5, pp. 484�489, 2004.

[8] Easton R.L., Knox K.T., Christens-Barry W.A., �Multispectral imaging of the Archimedes

Palimpsest,� Proc. 32nd AIPR, pp. 111�118, 2003.

[9] Easton R.L., Knox K.T., �Digital restoration of erased and damaged manuscripts,� Proc. 39th

Annual Convention of the Association of Jewish Libraries, Brooklyn, NY, June 20-23, 2004.

112

Page 127: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

BIBLIOGRAFÍA

[10] Easton, R.L., �In�nite possibilities: Ten year of study of the Archimedes Palimpsest,� Proc. of

the American Philosophical Society, Vol.154, No. 1, pp. 50�76, 2010.

[11] Mans�eld J.R., Sowa M.G., Majzels C., Collins C., Cloutis E., Mantsch H.H., �Near infrared

spectroscopic re�ectance imaging: supervised vs. unsupervised analysis using an art conservation

application,� Vibrational Spectroscopy, Vol. 19, pp. 33�45, 1999.

[12] Pratt W.K., Mancill C.E., �Spectral estimation techniques for the spectral calibration of a color

image scanner,� Applied Optics, Vol. 15, No. 1, pp. 73�75, 1976.

[13] Park S.K., Huck F.O., �Estimation of spectral re�ectance curves from multispectral image data,�

Applied Optics, Vol. 16, No. 12, pp. 3107�3114, 1977.

[14] Smith R.B., �Introduction to hyperspectral images,� Microimages Inc. Tutorial, Lincoln, NE.

(2001).

[15] Rinascimento Virtuale, www.bml.firenze.sb.it/rinascimentovirtuale, January 2006.

[16] Valdiviezo-Navarro J.C. and Urcid G., �Multispectral images segmentation of ancient documents

with lattice memories,� OSA Proc.: Digital Image Processing and Analysis, Tucson, AZ, June

2010.

[17] Van Asperen de Boer J.R.J., �Re�ectrography of paintings using an infra-red vidicon television

system,� Studies in Conservation, Vol. 14, pp. 96�118, 1969.

[18] Ware G.A., Chabries D.M., Christiansen R.W., Brady J.E., Martin C.E., �Multispectral Analysis

of Ancient Maya Pigments: Implications for the Naj Tunich Corpus,� IEEE Proc.: IGARSS, Vol

6, pp. 2489�2491, 2000.

J. C. Valdiviezo INAOE 113

Page 128: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

Capítulo 6

Procesado de Imágenes Hiperespectrales

En este capítulo se presenta el análisis de puntos extremos utilizando las memorias reticulares

para el caso de dos imágenes hiperespectrales remotamente registradas. El capítulo se inicia con

una breve descripción de los fundamentos físicos involucrados en el registro de estas imágenes,

sus características partículares, así como los métodos utilizados para derivar la re�ectancia

espectral. Más adelante se presentan los espectros de los puntos extremos determinados con

W y M , los cuales se comparan con los obtenidos por el análisis de componentes de vértices.

Para concluir el capítulo se muestran los mapas de la distribución de los recursos naturales

calculados a partir de los puntos extremos determinados con cada método.

6.1. Registro hiperespectral de una escena

El desarrollo de tecnologías de formación de imágenes más so�sticadas en combinación

con espectrómetros de alta resolución ha dado lugar a una nueva perspectiva para el sensado

remoto, en la que es posible registrar, simultáneamente, la información espacial y espectral

de la energía re�ejada por la super�cie de la Tierra. Estos instrumentos, conocidos como es-

pectrómetros de imagen, forman la imagen de la radiancia solar re�ejada o emitida por los

materiales de la super�cie, en cientos de bandas cuasi-contiguas usualmente en la porción solar

de re�exión del espectro (de 0.35 a 2.5 µm). En aplicaciones de percepción remota la región

que comprende de 0.35 a 1.0 µm se conoce como visible/infrarrojo cercano, (visible and near

114

Page 129: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

6.1. REGISTRO HIPERESPECTRAL DE UNA ESCENA

infrared, VNIR) y la región que comprende de 1.0 a 2.5 µm se conoce como infrarrojo de longi-

tud de onda corta (short wavelength infrared, SWIR). Por lo tanto, los datos hiperespectrales

resultantes están conformados en un cubo de imágenes con dos dimensiones espaciales y una

espectral. La información contenida en un pixel único de la imagen hiperespectral puede ser

usada para comparar e identi�car cualquier objeto en base a sus características espectrales,

en una localización especí�ca de la zona de interés.

6.1.1. Fundamentos físicos

Existen procesos importantes de interacción entre materia y energía que constituyen

la base física de la información que es capturada por los espectrómetros. La energía electro-

magnética procedente del sol puede ser modi�cada en su dirección, intensidad o polarización

cuando toca la super�cie terrestre. Estos cambios de energía dependen de la constitución físi-

ca y química de los materiales que conforman la super�cie, los cuales pueden ser clasi�cados

como: transmisión, re�exión, absorción y emisiòn de radiación1. Más aún, los procesos de

interacción entre materia y energía permiten identi�car los materiales que conforman la su-

per�cie terrestre a partir de determinadas bandas de absorción o emisión presentes en los datos

hiperespectrales registrados por un sensor.

Para aplicaciones en percepción remota los espectrómetros de imagen son colocados

sobre plataformas aéreas, principalmente en satélites o aviones [4]. Por tanto, las partes fun-

damentales que conforman a estos instrumentos son las siguientes. (1) Óptica para colectar luz,

(2) un sistema mecánico para barrer el campo de visión instantáneo (IFOV) del espectrómetro

sobre una escena y (3) un arreglo de espectrómetros que subdividen la porción del espectro de

interés. Además, el proceso de adquisición de la imagen se realiza de acuerdo a lo siguiente. Un

espejo de barrido acoplado al sistema mecánico, así como el movimiento de la plataforma se

encargan de colectar la energía re�ejada por la super�cie. Para el proceso de barrido de cada

línea de la escena se pueden utilizar diferentes sistemas. Si la óptica forma la imagen de un

punto único sobre la super�cie, tal que el sistema barre una línea larga que es perpendicular

al movimiento de la plataforma, el sistema se conoce como �escobilla giratoria� (�whiskbroom�

1Los fenómenos de interacción materia y energía fueron descritos con detalle en el Capítulo 2

J. C. Valdiviezo INAOE 115

Page 130: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

6.1. REGISTRO HIPERESPECTRAL DE UNA ESCENA

Azul

Verde

Rojo

IR

espejo rotatorio

Sistema "whiskbroom" Sistema "pushbroom"

Figura 6.1: Dos tipos de sistemas de barrido usados para capturar una escena hiperespectral; el

número de bandas espectrales está determinado por los detectores que cubren intervalos de longitudes

de onda (λ) especí�cos.

system). Por otro lado, si la óptica forma la imagen de una rendija larga sin necesitar de un

sistema mecánico de barrido más que el movimiento de la plataforma para formar una imagen,

el sistema se conoce como �escobilla de empuje� (�pushbroom� system). Ambos sistemas se ilus-

tran el la �gura 6.1. Existe otro sistema que utiliza un arreglo bidimensional de fotodetectores

y un arreglo lineal de �ltros para registrar de manera simultánea las bandas de la imagen [4].

Después de que la energía se ha colectado, la radiación incidente es entonces dirigida a un

conjunto de espectrómetros que dividen la luz en múltiples bandas estrechas de energía por

medio de un elemento dispersivo, que puede ser una rejilla o un prisma. Finalmente la energía

que sale del elemento dispersivo es capturada por medio de fotodetectores cuya sensibilidad

responde a intervalos de longitudes de onda especí�cos, lo que da lugar a cientos de bandas

espectrales.

6.1.2. Resolución espacial y espectral

En los espectrómetros de imagen existen dos características básicas que de�nen el

grado de resolución del sistema: la resolución espacial y espectral. La resolución espacial es

una medida del mínimo detalle sobre la super�cie que puede ser captado por un sensor remoto

dado. La resolución espacial depende de las características propias del sensor y de la altura de

J. C. Valdiviezo INAOE 116

Page 131: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

6.1. REGISTRO HIPERESPECTRAL DE UNA ESCENA

vuelo de la plataforma aérea. En particular, para un espectrómetro de imagen la resolución

espacial está de�nida por el tamaño de los pixeles del CCD en la dirección y y la ampli�cación

del sistema microscópico. Sin embargo, en la dirección x, la resolución depende del ancho de la

rendija del espectrómetro y de la ampli�cación del sistema [3]. Sean ∆x y ∆y las dimensiones

de los pixeles del CCD, respectivamente, y M la ampli�cación del sistema. El ancho de la

rendija del espectrómetro, denotado por ws, siempre será mayor a ∆x. Entonces, la resolución

espacial en la dirección y es 2∆y/M , mientras que en la dirección x es 2ws/M . Más aún, una

de�nición de resolución comúnmente utilizada es aquella que relaciona el tamaño del pixel y

la altitud de vuelo; es decir, esta resolución se re�ere al área física sobre la super�cie terrestre

ocupada por un pixel único. Claramente, la resolución espacial incrementa conforme la altitud

de la plataforma aérea decrementa.

Por otra parte, la resolución espectral se re�ere al número y ancho de las bandas

espectrales que un sensor puede registrar. La resolución espectral depende de las componentes

del espectrómetro, lo cual incluye al ancho de la rendija, la dispersión de la rejilla o prisma

y el tamaño del pixel del dispositivo. Por ejemplo, para un pixel CCD de 10 µm2 de área, la

dispersión en operación normal es aproximadamente de 40 nm por mm o, equivalentemente,

0.4 nm por pixel.

6.1.3. Técnicas de estimación de la re�ectancia

En términos radiométricos, la energía que llega a la apertura de entrada de un sensor

es la cantidad conocida como radiancia. Dado que la re�ectancia espectral es una cantidad

que está relacionada con las propiedades de los materiales, resulta necesario estimar dicha re-

�ectancia a partir de la información de radiancia contenida en los datos hiperespectrales. Para

este propósito, el nivel de energía solar de fondo debe ser removido y los efectos de absorción

y esparcimiento atmosféricos deben ser compensados. Existen tres técnicas principales que

pueden ser usadas para derivar la re�ectancia espectral de los materiales, las cuales pueden

ser: (1) técnicas basadas en imagen, (2) métodos empíricos, (3) aproximación basada en mod-

elos. Una técnica basada en imágenes utiliza sólo los datos captados por el instrumento, con el

requisito de que las imágenes incluyan regiones de re�ectancia relativamente uniformes. Así,

J. C. Valdiviezo INAOE 117

Page 132: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

6.1. REGISTRO HIPERESPECTRAL DE UNA ESCENA

cualquier absorción presente en la re�ectancia medida sobre estas regiones estará relacionada

con las efectos antes mencionados y, por lo tanto, tales efectos pueden ser compensados para

la imagen completa. De esta manera, al dividir cada espectro de la imagen por el espectro de

campo plano, la escena se convierte a re�ectancia relativa.

Por otro lado, los métodos empíricos emplean tanto los datos sensados remotamente,

como mediciones de campo de la re�ectancia, r(λ), para resolver una ecuación lineal que la

relaciona con la radiancia del sensor, tal que,

L(λ) = br(λ) + c , (6.1)

donde L(λ) representa la radiancia capturada por el sensor y que varía con la longitud de

onda λ, y b, c representan, respectivamente, términos multiplicativo y aditivo para ajustar la

radiancia del sensor.

Las aproximaciones basadas en modelos buscan representar matemáticamente todos los

factores involucrados en la radiancia adquirida en cada pixel, incluyendo las perturbaciones

atmosféricas. Para este propósito, se utiliza el espectro de irradiancia solar simulado, entonces

el método estima la radiancia solar en el día y la hora de la adquisición de la imagen y los

efectos de esparcimiento y absorción de la atmósfera. Por tanto, la radiancia solar que llega a

la apertura del sensor Ls, en función de la longitud de onda λ puede ser modelado como

Ls(λ) =1

π(Er(λ) +Mt)τθ + Lp , (6.2)

donde E es la irradiancia sobre la super�cie terrestre, r(λ) es la re�ectancia de la super�cie,

Mt es la excitancia radiante espectral a temperatura t, τθ es la transmitancia de la atmósfera a

un ángulo zenith θ y Lp es la radiancia espectral de trayectoria de la atmósfera [2]. El resolver

la ec. (6.2) permite obtener resultados exactos en la estimación ya que dicha ecuación incluye

todos los factores que contribuyen en el proceso de adquisición de la imagen. De manera

adicional, las aproximaciones basadas en modelos son empleadas para estimar las propiedades

atmosféricas directamente de los datos hiperespectrales.

J. C. Valdiviezo INAOE 118

Page 133: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

6.1. REGISTRO HIPERESPECTRAL DE UNA ESCENA

6.1.4. Instrumentos hiperespectrales

Uno de los primeros instrumentos hiperespectrales colocado en una base aérea para

aplicaciones de observación terrestre es el espectrómetro de imagen AVIRIS (Airborne, Visible

and Infrared Imaging Spectrometer). El instrumento fue desarrollado en el Laboratorio de

Propulsión de Aviones de la NASA y está compuesto por un sistema de barrido de tipo �escobilla

giratoria� y cuatro espectrómetros de rejillas (A, B, C y D) que dividen la región de longitudes

de onda de 0.4 a 2.45 µm en cuatro segmentos espectrales: 0.41-0.7 µm, 0.68-1.27 µm, 1.25-

1.86 µm y 1.84-2.45 µm. De esta forma, la �na resolución espectral del instrumento (alrededor

de 10 nm) permite registrar 224 bandas espectrales, por medio de un arreglo lineal de 224

sensores de silicio e indio-antimonio. Cuando el sensor es colocado a bordo del avión ER-2,

el cual vuela a una altura de 20 km sobre el nivel terrestre, la resolución espacial del sensor

está alrededor de 400 m2, con un FOV de 30◦ y un IFOV de 1.0 mrad. Sin embargo, cuando

el instrumento es colocado sobre un avión que vuela a una altura de 4 km sobre el nivel del

mar, la resolución espacial del sensor está alrededor de 16 m2.

Por otra parte, el sensor CHRIS es un espectrómetro de imagen europeo que se encuentra

operando actualmente. El instrumento tiene una resolución espacial de 17 m y registra 62

bandas. Los datos capturados por el sensor permiten una variedad de aplicaciones, tales como

el monitoreo de zonas costeras y de la super�cie terrestre. Otros espectrómetros de imagen que

están en uso actualmente son: el instrumento conocido como HYDICE (Hyperspectral Digital

Imagery Collection Experiment) y los espectrómetros de imagen comerciales desarrollados por

la compañía SpecTir [12].

Además de los sensores hiperespectrales mencionados, tres misiones están planeadas

para los próximos cinco años. La Agencia Espacial Italiana ASI planea lanzar en 2012 un

instrumento de media resolución, conocido como Prisma. El dispositivo combinará un sensor

hiperespectral con una cámara pancromática de mediana resolución, capaz de registrar 235

bandas espectrales en las porciones VNIR y SWIR. El Centro Aeroespacial Alemán (DLR)

planea lanzar el satélite hiperespectral denominado EnMAP en 2014; el sensor está diseñado

para registrar imágenes de la super�cie terrestre en 200 bandas angostas a color. Por otra parte,

en 2015 la agencia espacial NASA planea poner en funcionamiento el instrumento infrarrojo

J. C. Valdiviezo INAOE 119

Page 134: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

6.2. DETERMINACIÓN DE PUNTOS EXTREMOS

conocido como HyspIRI. La misión incluye dos instrumentos colocados en un satélite en órbita

terrestre baja. El primero, un espectrómetro de imagen, registrará imágenes a una resolución

de 10 nm en las porciones visible a infrarrojo de onda corta. El segundo instrumento es un

sensor multiespectral que cubrirá las porciones infrarrojo medio y térmico (3 a 12 µm). Ambos

instrumentos tendrán una resolución espacial de 60 m y serán capaces de colectar 210 bandas

espectrales [1].

6.2. Determinación de puntos extremos

6.2.1. Análisis de componentes de vértices

Este método considera que los datos hiperespectrales se encuentran mezclados lineal-

mente. Así, su objetivo es determinar el conjunto de puntos extremos, que serán utilizados

para el proceso de separación espectral, a partir de los vértices de un simplex que encierra

los vectores espectrales. El algoritmo asume la presencia de pixeles puros y proyecta iterativa-

mente los datos sobre una dirección ortogonal al subespacio ocupado por los miembros �nales

ya determinados. Los nuevos miembros �nales corresponden a los extremos de la proyección.

Especí�camente, la técnica considera que, en ausencia de ruido, los vectores espectrales res-

iden en un cono convexo Cp que está contenido en un subespacio Ep, con p igual al número

de puntos extremos presentes. Por tanto, el algoritmo comienza por identi�car Ep mediante la

descomposición de valores singulares y entonces proyecta los puntos en Cp sobre un simplex Sp

por medio de una transformación. Este simplex está contenido en un conjunto a�n de dimen-

sión p − 1. Una ventaja de este algoritmo es que su complejidad computacional es un orden

de magnitud menor al de N-FINDR, con la di�cultad de que el número de puntos extremos es

un parámetro de entrada [9].

6.2.2. El método W y M aplicado al caso hiperespectral

El método basado en lasMAARs puede ser aplicado al caso de imágenes hiperespectrales

de acuerdo al procedimiento discutido en el Capítulo anterior. Una vez calculadas W y M es

J. C. Valdiviezo INAOE 120

Page 135: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

6.3. EJEMPLOS DE APLICACIÓN DE SENSADO REMOTO

necesario veri�car que sus vectores columna satisfacen la propiedad de independencia afín.

Más aún, a diferencia de los casos de aplicación en imágenes en color y multiespectrales, para

imágenes hiperespectrales en las que n es de alto orden, los vectores columna de W presentan

un �pico hacia arriba�, mientras que los vectores de M presentan un �pico hacia abajo�. Este

efecto de picos se debe al escalamiento aditivo previamente realizado puesto que wii = ui

y mii = vi, respectivamente. Resulta necesario entonces realizar un procedimiento simple de

suavización considerando uno o dos de los vectores espectrales más cercanos a wii o mii, el

cual está dado, para cualquier i ∈ {1, . . . , n}, por

zii =

z1,2 ⇔ i = 1,

12(zi−1,i + zi+1,i) ⇔ 1 < i < n,

zn−1,n ⇔ i = n,

(6.3)

donde z puede ser igual a w o m. Una vez que se ha realizado este proceso de suavización, un

subconjunto de W ∪M puede ser utilizado como puntos extremos en el modelo de mezclado

lineal.

6.3. Ejemplos de aplicación de sensado remoto

La funcionalidad de los métodos de identi�cación de puntos extremos puede ilustrarse

utilizando conjuntos de datos hiperespectrales reales. El objetivo de los ejemplos siguientes

es proporcionar detalles su�cientes en el uso de la técnica basada en WXX y MXX, la cual

ha demostrado ser efectiva para el análisis de datos multiespectrales. Como un complemento

a estos resultados se presentarán los puntos extremos determinados por el algoritmo VCA,

mismos que serán comparados con los obtenidos con el primer método. Al �nal de la sección

se presentan los mapas de abundancias generados a partir de la estimación de las proporciones

de cada punto extremo en cada escena hiperespectral.

Las siguientes imágenes fueron tomadas de la base de datos de la compañía SpecTir

[12]. La información que se tiene acerca del proceso de adquisición de las imágenes indica que

fueron registradas por un espectrómetro de imagen en las porciones VNIR y SWIR, cubriendo

J. C. Valdiviezo INAOE 121

Page 136: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

6.3. EJEMPLOS DE APLICACIÓN DE SENSADO REMOTO

el intervalo de longitudes de onda de 0.395 a 2.45 µm. Cada escena tiene una reolución espec-

tral de 5 nm, con un total de 360 bandas espectrales. De esta manera, un cubo hiperespectral

está conformado por 600 líneas × 320 pixeles × 360 bandas (alrededor de 132 Mbytes). Dada

la alta resolución espectral, una práctica común para evitar información redundante consiste

en reducir la dimensionalidad espectral de los datos mediante una técnica determinada; por

ejemplo, PCA, la transformación de fracciones de mínimo ruido o una reducción de bandas

adyacentes altamente correlacionadas [6, 10, 11], las cuales son necesarias para disminuir el

costo computacional. En los cubos de datos usados para esta simulación, el número de bandas

espectrales fue reducido a 90 por medio de una selección de bandas a subintervalos de 20 nm,

que en conjunto cubren la misma porción del espectro. Esta reducción espectral permite acel-

erar los tiempos de cómputo sin ocasionar cambios signi�cativos en la tarea de identi�cación.

Ejemplo 1. Costa del Golfo de México

Este cubo hiperespectral fue registrado sobre el Refugio Nacional de vida salvaje de

Suwanee, el cual se localiza en la costa norte del Golfo que pertenece a Estados Unidos. El

refugio alberga uno de los ecosistemas más grandes del río Delta, en el que habitan numerosas

especies de vida salvaje. Los datos registrados cubren pantanos, así como múltiples reservas de

vida salvaje durante el periodo de mayo a junio del 2010. Las imágenes capturaron el estado

de la vegetación en ese momento y pueden ser utilizadas para localizar la presencia o ausencia

de hidrocarburos en la super�cie de la vegetación. Además, debido a que los datos fueron

adquiridos antes del derrame de petroleo ocurrido en 2010, éstos pueden ser comparados con

imágenes más recientes para ayudar en la recuperación de los áreas afectadas. La �gura 6.2

muestra dos imágenes compuestas de la escena hiperespectral de la costa del Golfo. La parte

izquierda de la �gura fue formada por la combinación de las bandas 54 (rojo, λ = 693 nm),

34 (verde, λ = 584 nm) y 14 (azul, λ = 469.5 nm), dando la apariencia de imagen de color

verdadero; la parte derecha fue formada con las bandas 81 (rojo, λ = 851 nm), 217 (verde,

λ = 1631 nm) y 54 (azul, λ = 693 nm), cuya combinación de bandas en el infrarrojo resalta

las áreas de vegetación en colores verde, naranja y café.

Para el proceso de determinación de los puntos extremos se siguió un proceso similar

al discutido para el caso multiespectral. Primero se formó el conjunto X = {x1, . . . ,xk} ∈ Rn,

J. C. Valdiviezo INAOE 122

Page 137: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

6.3. EJEMPLOS DE APLICACIÓN DE SENSADO REMOTO

Figura 6.2: Imágenes a color de la escena hiperespectral registrada sobre la costa del Golfo de México.

Izquierda: imagen formada por la combinación de las bandas 54 (rojo), 34 (verde) y 14 (azul). Derecha:

combinación de bandas 81 (rojo), 217 (verde) y 54 (azul).

donde k = 600 × 320 = 192000 y n = 90, compuesto con todos los vectores espectrales que

conforman la escena. A partir de la matriz X se calcularon las memorias WXX y MXX. Asimis-

mo, por medio de los vectores v y u, las columnas de ambas memorias fueron escaladas para

obtener W y M . Para comprobar la independencia afín de los vectores se veri�có que ninguna

columna de W y M fueran iguales. En este ejemplo, cada matriz escalada está conformada

por 90 columnas independientes afín y, por lo tanto, cada una posee 90 �candidatos� a puntos

extremos. De manera adicional, antes de seleccionar un subconjunto de puntos extremos se

realizó el proceso de suavizamiento de los picos que aparecen en la diagonal principal de ambas

memorias, por medio de la ecuación (6.3).

Es importante destacar que el método basado en W y M siempre proporciona un

número de candidatos a puntos extremos que es igual o ligeramente menor que la dimen-

sionalidad espectral. En la práctica, sin embargo, las columnas contiguas están altamente

J. C. Valdiviezo INAOE 123

Page 138: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

6.3. EJEMPLOS DE APLICACIÓN DE SENSADO REMOTO

correlacionadas siendo necesario utilizar algunas técnicas para seleccionar un conjunto reduci-

do [11]. En estos ejemplos se ha utilizado una técnica simple basada en el hecho de que las

memorias forman ⌊√n+ 1⌋ subconjuntos, cada uno con ⌊

√n+ 1⌋ vectores columna tanto para

W como para M . De esta manera, un representante de cada grupo es seleccionado como punto

extremo. Aunque esta técnica provee un número razonable de puntos extremos, en situaciones

prácticas donde un pequño número de materiales conforman la escena hiperespectral, es nece-

sario realizar una selección �nal al considerar sólo aquellos espectros que están completamente

decorrelacionados. Por lo tanto en este ejemplo de aplicación, de los 20 candidatos a puntos

extremos determinados a partir de W ∪M , una selección �nal de puntos extremos no correla-

cionados proporcionó un conjunto de 5 vectores espectrales que forman las columnas de S; así,

S = (w2,w24,w43,w54,w79).

Por otra parte, el algoritmo VCA se aplicó al mismo conjunto de datos hiperespec-

trales. De acuerdo a la implementación, el algoritmo requiere como parámetro de entrada el

número de puntos extremos a determinarse; la salida del algoritmo incluye los espectros de

los puntos extremos obtenidos, así como las posiciones de los pixeles en la imagen de donde

éstos fueron extraídos. Iteraciones repetidas con el mismo número de puntos extremos pro-

duce casi el mismo conjunto de salida, con la diferencia en el orden en el que sus espectros

aparecen. Después de probar diferentes valores de entrada, tales como 5, 7, 9, 10, se eligió

utilizar el número de puntos extremos determinados con W y M como entrada para VCA.

De ahí que el conjunto S de puntos extremos identi�cados con VCA está conformado por

S = (x27876,x90661,x97850,x84588,x191634). La �gura 6.3 despliega los espectros de tres puntos

extremos determinados mediante la selección de columnas de W ∪M , cuyas curvas espectrales

corresponden a recursos naturales en la escena de la costa del Golfo. De manera similar, la

�gura 6.4 muestra los espectros de tres puntos extremos obtenidos con el algoritmo VCA. En

ambos casos la distribución espectral de los valores de re�ectancia se normalizó del rango

[0,6000] al intervalo unitario [0,1]. En ambas �guras se puede observar una similitud entre

curvas espectrales dibujadas con el mismo color.

Ejemplo 2. Belstville

En el siguiente ejemplo se utilizó un cubo hiperespectral registrado sobre el área de

J. C. Valdiviezo INAOE 124

Page 139: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

6.3. EJEMPLOS DE APLICACIÓN DE SENSADO REMOTO

Longitud de onda

Refl

ecta

ncia

norm

ali

zada

Figura 6.3: Espectros de tres puntos extremos determinados con W y M en el cubo hiperespectral del Golfo

de México. Los valores de columna seleccionados a partir de W ∪M son: w2, w24, w54.

Belstville, que se localiza al norte del condado de Prince George en Maryland, Estados Unidos.

El área registrada por el sensor incluye muestras de agricultura y vegetación. De forma similar

a la imagen anterior, el cubo de datos empleado para este experimento es de tamaño 600 ×320× 90, abarcando el mismo intervalo de longitudes de onda. La parte izquierda de la �gura

6.5 despliega una imagen a color compuesta por la combinación de bandas 54 (rojo, λ = 693

nm), 34 (verde, λ = 584 nm) y 14 (azul, λ = 469.5 nm), simulando una imagen de color

verdadero; la parte derecha de la �gura fue formada con las bandas 81 (rojo, λ = 851 nm), 54

(verde, λ = 693 nm) y 34 (azul, λ = 584 nm) que permite resaltar las áreas de vegetación en

tonos rojos.

La determinación de los puntos extremos en base a W y M se realizó de manera similar

al procedimiento descrito en el ejemplo previo. El conjunto de todos los vectores espectrales

de la imagen está formado por X = {x1, . . . ,xk}, con k = 600 × 320 = 192000 y n = 90. A

partir de X se calcularon las memorias WXX, MXX = −W TXX, así como las matrices escaladas

W y M . Una vez que la condición de independencia afín es veri�cada, las memorias escaladas

son de tamaño 90× 90. Además los efectos de picos que aparecen en la diagonal principal de

ambas memorias fueron removidos por medio de la ec. (6.3). A partir del conjunto W ∪M se

J. C. Valdiviezo INAOE 125

Page 140: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

6.3. EJEMPLOS DE APLICACIÓN DE SENSADO REMOTO

Longitud de onda

Refl

ecta

ncia

n

orm

ali

zad

a

Figura 6.4: Espectros de tres puntos extremos obtenidos con el algoritmo VCA en el cubo hiperespectral del

Golfo de México. Los vectores columna sj para j = 1, . . . , 5 indican las columnas correspondientes de S.

realizó una selección de 20 candidatos a puntos extremos. La elección de los vectores columna

espectralmente diferentes permitió formar el conjunto �nal de puntos extremos, cuyos vectores

de�nen las columnas de S, tal que S = {w24,w37,w47,w64,m46,m57,m62}; dicho conjunto

será empleado para estimar las abundancias fraccionales de cada punto extremo.

Por otra parte, la búsqueda de puntos extremos con el algoritmo VCA se realizó estable-

ciendo el valor de 7 como parámetro de entrada. Los espectros resultantes de este procedimiento

fueron usados para formar la matriz S = (s1, . . . , s7), cuyos vectores columna asociados son

(x191845,x191419,x9630,x111446,x114301,x191724,x65969). La �gura 6.6 muestra cuatro de los pun-

tos extremos �nales obtenidos con la selección realizada a partir de W ∪ M . La �gura 6.7

despliega cuatro de los puntos extremos determinados por VCA y que son similares a aquellos

calculados con las memorias. La similitud entre curvas espectrales se puede identi�car para

curvas dibujadas con el mismo color.

J. C. Valdiviezo INAOE 126

Page 141: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

6.4. SEPARACIÓN ESPECTRAL Y COMPARACIÓN DE RESULTADOS

Figura 6.5: Imágenes a color de la escena hiperespectral de Beltsville. Izquierda: imagen formada por la

combinación de bandas 54 (rojo), 34 (verde) y 14 (azul). Derecha: combinación de bandas 81 (rojo), 54 (verde)

y 34 (azul).

6.4. Separación espectral y comparación de resultados

Aunque las curvas en ambos conjuntos parecen ser similares, algún criterio debe ser

aplicado para cuanti�car estas similitudes. Aqui se han calculado los coe�cientes de correlación

(φ) entre los vectores determinados por las MAAMs y aquellos producidos por VCA, en cada

uno de los ejemplos. La Tabla 6.1 muestra los coe�cientes de correlación calculados para las

curvas espectrales desplegadas en las �guras 6.3, 6.4 y 6.6, 6.7, respectivamente.

El proceso de separación espectral puede efectuarse mediante la inversión de la ec.

(3.9), sujeta a las restricciones de aditividad completa y no negatividad de los coe�cientes de

abundancia. Esta inversión se expresa en la ec. (3.11), la cual es un sistema sobre determinado

de ecuaciones lineales, tal que n > p. Para los ejemplos aquí presentados, ambas matrices W y

M son de rango completo, así sus vectores columna son linealmente independientes. Además,

J. C. Valdiviezo INAOE 127

Page 142: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

6.4. SEPARACIÓN ESPECTRAL Y COMPARACIÓN DE RESULTADOS

Longitud de onda

Refl

ecta

ncia

n

orm

ali

zad

a

Figura 6.6: Espectros de cuatro puntos extremos determinados con W y M en el cubo hiperespectral de

Beltsville. Los vectores columna seleccionados a partir de W ∪M son: w24, w37, w47, w64.

los conjuntos de miembros �nales determinados tanto con las MAAMs como con VCA son

linealmente independientes, cuya matriz pseudoinversa es única. Para los ejemplos presentados,

donde n > p con n = 90 y p = 7 o p = 5, se ha utilizado la estimación de mínimos cuadrados

no negativa NNLS que resuelve el problema de minimizar la norma Euclidiana ∥Sa − x∥2,sujeta a la condición a > 0 [7].

La �gura 6.8 despliega los mapas de abundancia en color de los puntos extremos de-

terminados con los dos métodos aquí discutidos. En estas imágenes las áreas más brillantes

representan máxima distribución del punto extremo correspondiente. La parte izquierda de la

misma �gura muestra la distribución de cuatro recursos naturales que fueron determinados

con W y M en el cubo hiperespectral de la costa del Golfo. La parte derecha despliega la dis-

tribución de tres recursos naturales que fueron determinados por el algoritmo VCA. En ambos

casos se presentan sólo los mapas de abundancia que proveen información útil ya que algunos

otros mapas presentan información redundante o áreas predominantemente oscuras, los cuales

no fueron incluidos. Aunque la región es particularmente caracterizada por la presencia de

pantanos, no fue posible identi�car los recursos naturales en base a un conjunto de espectros

de referencia pues no se cuenta con dichos espectros.

J. C. Valdiviezo INAOE 128

Page 143: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

6.5. CONCLUSIONES

Tabla 6.1: Coe�cientes de correlación (φ) para espectros similares obtenidos con el método WM y algoritmo

VCA para las imágenes hiperespectrales del Golfo de México y Beltsville.

Golfo de México Beltsville

VCA & WM φ VCA & WM φ

s2 y w24 0.980 s1 y w37 0.965

s3 y w54 0.974 s2 y w24 0.944

s4 y w2 0.641 s3 y w64 0.912

− − s4 y w47 0.939

La �gura 6.9 despliega los mapas de abundancia en color de los puntos extremos deter-

minados en base aW yM (izquierda) y con VCA (derecha), a partir del cubo hiperespectral de

Belstville. Aunque el conjunto S está conformado por siete puntos extremos, en ambos casos

se han incluido los mapas de abundancia que mejor se asemejan a la distribución de vegetación

que se puede interpretar en la �gura 6.5. En este ejemplo es evidente que la identi�cación de

los tipos de vegetación, producida por cada uno de los métodos, presenta resultados similares

para las segmentaciones mostradas en colores amarillo y magenta. Sin embargo, los resultados

presentan diferencias importantes en las segmentaciones verde y azul. Estas diferencias son

causadas principalmente por el procedimiento de búsqueda de puntos extremos que emplea

cada uno de los métodos. Más aún, el hecho de que las curvas espectrales de los tipos de

vegetación sean similares, presentando variaciones únicamente en ciertas bandas de absorción,

contribuye con las discrepancias en los resultados de segmentación.

6.5. Conclusiones

El uso de espectrómetros de imagen de alta resolución para observaciones de la super�cie

de la Tierra ha dado lugar a múltiples aplicaciones orientadas a la identi�cación, clasi�cación

y monitoreo de recursos naturales a partir de datos remotamente sensados. En este capítulo

se han descrito los fundamentos físicos detrás de la adquisición y calibración de las imágenes

hiperespectrales y que constituyen la base de instrumentos como AVIRIS, HYDICE, entre otros.

J. C. Valdiviezo INAOE 129

Page 144: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

6.5. CONCLUSIONES

Longitud de onda

Refl

ecta

ncia

norm

ali

zada

Figura 6.7: Espectros de cuatro puntos extremos obtenidos con el algoritmo VCA en el cubo hiperespectral

de Beltsville. Los vectores columna sj para j = 1, . . . , 7 indican las columnas correspondientes de la matriz S.

Gran parte de los métodos que han sido propuestos para la identi�cación de puntos extremos

están basados en la geometría de conjuntos convexos; el fundamento matemático de dichos

métodos es modelar las mezclas espectrales adquiridas en los pixeles como una combinación

lineal de materiales constituyentes de la escena. Además, el método basado en MAAMs se

ha empleado para la identi�cación de recursos naturales en imágenes hiperespectrales. Los

resultados obtenidos en la identi�cación de puntos extremos se han comparado con aquellos

presentados con el algoritmo VCA. Los mapas de abundancias de los materiales calculados

para cada método permiten conocer la distribución de un determinado material a lo largo de

la escena. En efecto, dichos mapas presentan resultados similares con algunas discrepancias

en la distribución de determinados recursos naturales. De esta manera, se puede decir que el

método W y M es una técnica autónoma con resultados adecuados que pueden ser utilizados

para la clasi�cación de materiales en imágenes hiperespectrales.

J. C. Valdiviezo INAOE 130

Page 145: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

6.5. CONCLUSIONES

Figura 6.8: Mapas de abundancia en color de los recursos naturales determinados con la identi�cación

autónoma de puntos extremos en el cubo hiperspectral del Golfo de México. Izquierda: abundancias de cuatro

puntos extremos determinados con W y M , cuya distribución de colores corresponde a amarillo = w2, magenta

= w24, verde = w43, azul = w54. Derecha: abundancias de tres puntos extremos determinados con VCA cuya

distribución de colores es amarillo = s4, magenta = s2, verde = s3. Áreas más brillantes representan mayor

concentración del recurso natural.

J. C. Valdiviezo INAOE 131

Page 146: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

6.5. CONCLUSIONES

Figura 6.9: Mapas de abundancia en color de los tipos de vegetación obtenidos con la identi�cación autónoma

de puntos extremos en la imagen hiperespectral de Belstville. Izquierda: abundancias de cuatro puntos extremos

determinados con WM cuya distribución de colores corresponde a magenta = w24, amarillo = w67, azul =

m46, verde = m62. Derecha: abundancias de cuatro puntos extremos determinados con VCA, cuya distribución

de colores es magenta = s2, amarillo = s3, azul = s5, verde = s7. Áreas más brillantes representan mayor

concentración del recurso natural.

J. C. Valdiviezo INAOE 132

Page 147: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

Bibliografía

[1] European Space Agency, website: www.esa.int, 2010.

[2] Farrand W.H., �Hyperspectral remote sensing of land and the atmosphere.� In: Encyclopedia of

Modern Optics, Robert D. Guenther ed., Vol. 1, pp. 395�403, Elsevier, Academic Press, 2005.

[3] Huebshman M.L., Schultz R.A., Garner H.R., �Hyperspectral imaging.� In: Encyclopedia of

Modern Optics, Robert D. Guenther ed., Vol. 1, pp. 134�143, Elsevier, Academic Press, 2005.

[4] Jensen J.R., Remote Sensing of the Environment: an Earth Resource Perspective, 2nd edition,

Pearson Prentice Hall, 2007.

[5] Keshava N., Mustard J.F., �Spectral unmixing,� IEEE Signal Processing Magazine, Vol. 19, No.

1, pp. 44�57, 2002.

[6] Keshava N., �A survey of spectral unmixing algorithms,� Lincoln Laboratory Journal, Vol. 14,

No. 1, pp. 55�78, 2003.

[7] Lawson C.L., Hanson R.J., Solving least squares problems, chap. 23, Prentice-Hall, Englewood

Cli�s NJ, 1974.

[8] More K.A., �Spectrometers,� In: Encyclopedia of Modern Optics, Robert D. Guenther ed., Vol.

1, pp. 324�336, Elsevier, Academic Press, 2005.

[9] Nascimento J.M.P., Bioucas-Dias J.M., �Vertex component analysis: a fast algorithm to unmix

hyperspectral data,� IEEE Trans. on Geoscience and Remote Sensing, Vol. 43, No. 4, pp. 898�

910, 2005.

133

Page 148: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

BIBLIOGRAFÍA

[10] Ritter G.X., Urcid G., Schmalz M.S., �Autonomous single-pass endmember approximation using

lattice auto-associative memories,� Neurocomputing, Vol. 72, No. 10-12, pp. 2101�2110, June

2009.

[11] Ritter G.X., Urcid G., �Lattice algebra approach to endmember determination in hyperspectral

imagery.� In: Advances in Imaging and Electron Physics, Peter W. Hawkes ed., Vol. 160, pp.

113�169, Elsevier Inc, Academic Press, 2010.

[12] SpecTir. SpecTir: end to end hyperspectral solutions, website: www.spectir.com, 2009.

[13] Urcid G., Valdiviezo-N. J.C., Ritter G.X., �Endmember search techniques based on lattice

auto-associative memories: a case on vegetation discrimination,� SPIE Proc.: Image and Signal

Processing for Remote Sensing, Vol. 7477, Berlín, Germany, pp. 74771D:1�12, 2009.

[14] Valdiviezo J.C., Urcid G., �Convex set approaches for material quanti�cation in hyperspectral

imagery.� In: Earth Observation, Rustam B. Rustamov and Saida E. Salahova eds., In Press.

J. C. Valdiviezo INAOE 134

Page 149: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

Capítulo 7

Conclusiones

7.1. Conclusiones generales

El desarrollo de los espectrómetros de imagen ha dado lugar a una gran diversidad de

aplicaciones en la identi�ación, clasi�cación, cuanti�cación y monitoreo de los materiales que

conforman una escena en base a sus espectros de re�ectancia. Este trabajo de investigación ha

sido motivado por la necesidad de desarrollar métodos matemáticos e�cientes que permitan

un mejor análisis de las imágenes registradas por dichos instrumentos. En el método aquí

desarrollado se asume que cada pixel de una imagen espectral particular está conformado por

una combinación lineal de los espectros de los materiales que conforman la escena, en propor-

ciones determinadas. Esta representación es en realidad un conjunto convexo, cuyos vértices

representan los pixeles espectrales más puros y que además están asociados a los materiales

constituyentes. Así, para determinar las mezclas en cada pixel es necesario determinar primero

los vértices o puntos extremos; para este efecto se han utilizado las transformaciones reticu-

lares WXX y MXX cuya aplicación a imágenes en color, multiespectrales e hiperespectrales ha

presentado resultados satisfactorios.

En el Capítulo 1 de esta investigación se ha introducido la problemática a resolver y

se han presentado tanto las motivaciones como los objetivos que se buscaron a lo largo de

este trabajo. Más adelante, en el Capítulo 2 se describieron los procesos fundamentales de

la interacción materia y energía, los cuales constituyen la base física de la espectroscopía y

135

Page 150: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

7.1. CONCLUSIONES GENERALES

se de�nieron los conceptos de re�ectancia y absortancia que son útiles para comprender los

capítulos subsecuentes. Además, se presentaron espectros de energía re�ejada registrados para

diversos tipos de vegetación utilizando un espectrómetro de línea de la compañia BWTek. El

registro de espectros en el laboratorio ha sido fundamental en este trabajo ya que ha permitido

tener una idea más clara de los factores que están involucrados en el proceso de registro de

espectros y de los fenómenos que originan cambios en las curvas espectrales. Al tratar de

simular los mecanismos que originan las mezclas espectrales se ha determinado que es posible

representar dichas mezclas usando un modelo de mezclado lineal.

En el Capítulo 3 se enunció la base matemática del método desarrollado en esta in-

vestigación. En particular, las operaciones del álgebra reticular minimax fueron de�nidas y se

presentó un breve tratamiento de conjuntos convexos y su relación con el análisis de mezclado

lineal. Más aún, al de�nir las memorias autoasociativas reticulares WXX y MXX se enunció

también su relación con la geometría de conjuntos convexos. Así, las columnas escaladas de

ambas memorias permiten determinar los puntos extremos que envuelven a los datos. De ahí

que el conjunto W ∪ M ∪ {u ∪ v} de�ne un politopo con 2(n + 1) vértices, donde n es la

dimensión del espacio dado. Un subconjunto de puntos extremos derivados a partir de este

politopo puede ser usado para cuanti�car las mezclas en cada pixel de una imagen dada.

En el Capítulo 4 se ha introducido una novedosa técnica de segmentación para imágenes

en color, la cual está basada en la determinación de puntos extremos usando las memorias

autoasociativas reticulares. Los puntos extremos determinados a partir de imágenes en tres

canales corresponden a los pixeles de color saturados en la imagen, los cuales son utilizados en

el modelo de mezclado lineal para representar las mezclas de color en cada pixel. El cálculo de

los coe�cientes fraccionales de cada color saturado en los pixeles de la imagen permite realizar

una segmentación global de los colores que la conforman. El método basado en W y M se

ha aplicado a imágenes transformadas a otros espacios de color, con lo que se han logrado

mejoras en los resultados de segmentación cuando se utiliza el espacio I1I2I3. Al comparar esta

técnica con métodos de segmentación conocidos, tales como la distancia de Mahalanobis y el

algoritmo de cuencas, los resultados de segmentación son superiores a los que presentan dichas

técnicas. En efecto, el método propuesto puede ser considerado como una técnica autónoma

J. C. Valdiviezo INAOE 136

Page 151: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

7.1. CONCLUSIONES GENERALES

para la segmentación de imágenes en tres canales.

En el Capítulo 5 se han presentado los resultados del uso de las memorias reticulares

para determinar los espectros de los pigmentos presentes en el palimpsesto de Arquímedes. Al

aplicar el método propuesto para el caso de imágenes multiespectrales es fundamental compro-

bar que los vectores de W , e independientemente M , satisfacen la propiedad de independencia

afín. Con esta condición se busca evitar que algún punto extremo sea una combinación lineal

de los anteriores. Además, dado que el número de puntos extremos determinados es mucho

mayor al número de materiales que conforman una escena resulta necesario realizar un pro-

ceso de selección de aquellos vectores que sean menos correlacionados. El ángulo espectral o

el coe�ciente de correlación calculados a partir de los espectros de los puntos extremos son

métricas que proporcionan resultados adecuados para dicha selección. El subconjunto de vec-

tores seleccionado es empleado entonces para calcular las abundancias fraccionales en cada

pixel de la imagen. La aplicación de esta técnica al conjunto de imágenes multiespectrales

del palimpsesto ha permitido calcular mapas de las abundancias de los dos pigmentos y del

cuero que conforman el manuscrito; con la determinación de la distribución de los pigmentos

se ha logrado recuperar satisfactoriamente gran parte del texto original del manuscrito. De

esta manera, el método aquí desarrollado se puede utilizar para el análisis de pigmentos en

documentos antiguos.

Por otra parte, en el Capítulo 6 se ha discutido el caso de imágenes hiperespectrales; las

memorias reticulares se han empleado para determinar los espectros de los materiales consti-

tuyentes de la escena, sin la necesidad de recurrir a espectros medidos directamente en la zona.

Lo anterior representa un logro importante ya que no se necesita tener conocimiento a priori

de los recursos naturales que se encuentran en el área bajo estudio. Por tanto, los espectros

de los puntos extremos obtenidos mediante las memorias reticulares fueron empleados para el

cálculo de las abundancias de cada recurso natural. Los resultados de segmentación obtenidos

para las dos imágenes ejemplares permiten conocer la presencia de los recursos naturales exis-

tentes. En efecto, en base a los resultados obtenidos en cada uno de los casos aquí discutidos se

ha demostrado que es posible aplicar las memorias autoasociativas reticulares para el análisis

y segmentación de imágenes multicanal.

J. C. Valdiviezo INAOE 137

Page 152: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

7.2. APORTACIONES DE ESTA INVESTIGACIÓN

7.2. Aportaciones de esta investigación

La realización de este trabajo de investigación proporciona detalles signi�cativos en

el uso y el potencial de las memorias reticulares para el análisis de imágenes en color, multi-

espectrales e hiperespectrales. En el primer caso se ha desarrollado un método de segmentación

e�ciente que permite conocer las distribuciones de color a lo largo de la imagen. Además para

este caso de tres dimensiones, el cálculo de las fracciones de color saturado se ha realizado

por medio de una matriz generalizada que permite resolver el sistema de ecuaciones y además

satisfacer las restricciones de aditividad completa y positividad, impuestas en el modelo. Por

lo tanto, esta técnica de segmentación es rápida y puede ser aplicada en cualquier espacio

de color con resultados satisfactorios. Es importante mencionar que este método, así como

los resultados de segmentación de imágenes en color han sido reportados en los siguientes

manuscritos:

G. Urcid, J.C. Valdiviezo-N, G.X. Ritter, �Lattice algebra approach to color image seg-

mentation,� Journal of Mathematical Imaging and Vision, doi 10.1007/s10851-011-0302-

2, June 2011.

Gonzalo Urcid, Juan Carlos Valdiviezo-N, Gerhard X. Ritter, �Lattice associative memo-

ries for segmenting color images in di�erent color spaces,� LNCS Proc.: Hybrid Arti�cial

Intelligence Systems, Springer, Vol. 6077/2010, pp. 359�366, 2010.

G. Urcid and J.C. Valdiviezo-Navarro, �Color image segmentation based on lattice au-

toassociative memories,� IASTED Proc.: 13th Arti�cial Intelligence and Soft Computing,

Vol. 683, Palma de Mallorca, Spain, pp. 166�173, 2009.

La aplicación del método W y M para el análisis de imágenes multiespectrales de

documentos antiguos provee resultados importantes pues se ha logrado recuperar gran parte

del texto original del palimpsesto de Arquímedes. En efecto, esta técnica presenta un gran

potencial para el análisis de pigmentos y trabajos de arte. Además de este tratamiento, se

han discutido aspectos fundamentales en el proceso de estimación de la re�ectancia para

imágenes multiespectrales, así como los aspectos físicos que intervienen en dicha estimación

J. C. Valdiviezo INAOE 138

Page 153: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

7.2. APORTACIONES DE ESTA INVESTIGACIÓN

para imágenes hiperespectrales. Los resultados de la separación de textos en el palimpsesto de

Arquímedes han sido publicados en el manuscrito:

Juan C. Valdiviezo-Navarro and Gonzalo Urcid, �Multispectral images segmentation of

ancient documents with lattice memories,� OSA Proc.: Digital Image Processing and

Analysis, Tucson, AZ, June 2010.

Una aportación adicional de esta investigación es que el cálculo de W y M facilita la

determinación autónoma de los recursos naturales que conforman una escena remotamente

sensada. Para ello sólo se necesita seleccionar un conjunto reducido de los puntos extremos

determinados con ambas memorias y separar las mezclas en cada pixel de la imagen hipere-

spectral. Los resultados en la determinación de recursos naturales en imágenes hiperespectrales

han sido reportados en los siguientes manuscritos:

J.C. Valdiviezo, G. Urcid, �Convex set approaches for material quanti�cation in hyper-

spectral imagery.� In: Earth Observation, Rustam B. Rustamov and Saida E. Salahova

editors, In Press.

Gonzalo Urcid, Juan Carlos Valdiviezo-N. and Gerhard X. Ritter, �Endmember search

techniques based on lattice auto-associative memories: a case on vegetation discrimina-

tion,� SPIE Proc.: Image and Signal Processing for Remote Sensing, Vol. 7477, Berlín,

Germany, 74771D:1�12, 2009.

Además de las aportaciones del trabajo de investigación, en la segunda mitad del tercer

año de doctorado se realizó una estancia de investigación en el Instituto de Óptica �Daza de

Valdés,� en Madrid España. Durante la estancia se trabajó en temas relacionados con el análisis

y mejoramiento de imágenes de Óptica Biomédica. Uno de los resultados de esta estancia ha

sido la publicación del siguiente manuscrito:

R. Redondo, M.G. Bueno, J.C. Valdiviezo, R. Nava, G. Cristóbal, M. García, O. Déniz, B.

Escalante-Ramirez, �Evaluation of autofocus measures for microscopic images of biop-

sy and cytology,� SPIE Proc.: 22nd Congress of the ICO, Vol. 8011, pp. 801194:1�9,

November 2011.

J. C. Valdiviezo INAOE 139

Page 154: Juan Carlos Valdiviezo Navarro...Juan Carlos Valdiviezo Navarro Tesis sometida como requisito parcial para obtener el grado de DOCTOR EN CIENCIAS EN LA ESPECIALIDAD DE ÓPTICA en el

7.2. APORTACIONES DE ESTA INVESTIGACIÓN

7.2.1. Dirección del trabajo futuro

Uno de los resultados más satisfactorios que se lograron con el desarrollo de este trabajo

fue la recuperación del texto borrado a partir de las imágenes multiespectrales del palimpsesto

de Arquímedes. De esta manera, una aplicación inmediata de esta técnica es en el contexto del

análisis y restauración de documentos antiguos. Estas aplicaciones son de gran importancia ya

que el uso de técnicas ópticas y digitales pueden ayudar a la preservación y rescate de muchos

de estos documentos. Por tal motivo, la dirección del trabajo futuro está orientada a la restau-

ración del color digital en imágenes multiespectrales de códices mexicanos. Dichos códices son

parte del patrimonio artístico y cultural de nuestro país por lo que es importante aplicar las

técnicas desarrolladas para su preservación. Por otra parte, el desarrollo de algoritmos que

permitan remover los huecos e identi�car la presencia de pigmentos en las partes dañadas de

los códices resulta necesario para realizar la restauración de estos documentos.

J. C. Valdiviezo INAOE 140