Foto: ESA
Una investigación desarrollada en la Facultad de Informática de la Universidad Politécnica de Madrid ha dado un paso importante en la aplicación de redes neuronales autoorganizativas en el campo de la teledetección, según informa la mencionada Facultad en un comunicado.
Más concretamente, esta investigación ha desarrollado nuevos algoritmos de entrenamiento y visualización de redes neuronales autoorganizativas para su aplicación en teledetección, generando así modelos simplificados de grandes volúmenes de información de naturaleza multiespectral.
Las redes neuronales son modelos matemáticos inspirados en el funcionamiento de las redes de neuronas biológicas que se aplican en la actualidad a una amplia área de disciplinas para resolver una gran variedad de problemas. Uno de los modelos de redes neuronales más ampliamente utilizado es el denominado mapa autoorganizativo.
La teledetección se puede definir como la disciplina que permite la adquisición de información de la superficie de la tierra sin realizar ningún contacto con el material objeto de la observación. El desarrollo de herramientas para analizar y procesar imágenes multiespectrales capturadas por sensores a bordo de satélites ha ofrecido la posibilidad de automatizar tareas que no podrían realizarse de otra manera.
Gran volumen de datos
El principal problema relacionado con la teledetección es el gran volumen de datos de naturaleza multidimensional que debe manejarse. La red neuronal autoorganizativa, concretamente el modelo planteado por Kohonen, ha demostrado ser una herramienta versátil y útil en el análisis exploratorio de datos.
El modelo de Kohonen presenta, sin embargo, ciertas limitaciones relacionadas principalmente con su arquitectura, lo que ha hecho surgir nuevos tipos de mapas autoorganizativos que palian esta problemática, como el modelo Growing Cell Structures (GCS).
El modelo GCS permite visualizar las relaciones de los patrones de entrada de información sin las limitaciones topológicas del modelo de Kohonen, aunque tiene a su vez un inconveniente en la configuración de determinados parámetros de entrenamiento, ya que a pesar de tener asignados valores constantes, no tienen acotado el rango de valores que estos patrones pueden tomar.
Nuevo algoritmo
La investigación desarrollada en la Facultad constituye un avance en la solución de este problema, ya que propone un nuevo algoritmo de entrenamiento del modelo GCS que mejora la adaptación de esta red a la topología del espacio de entrada.
La modificación del algoritmo GCS facilita la explotación de este modelo de red neuronal en la generación de modelos simplificados de grandes volúmenes de información de naturaleza multiespectral, típicamente asociados al área de la teledetección.
Con el fin de explotar este paradigma dentro del área de Teledetección, la investigación ha desarrollado diversos métodos de visualización de información multidimensional basados en el modelo GCS, así como distintas técnicas de etiquetado de la red para tareas de clasificación semi-supervisada y no supervisada, o procesos de estimación de variables a través de información multiespectral. De igual manera, ha desarrollado diversas medidas adaptadas al modelo GCS para evaluar la calidad de la red entrenada.
La metodología desarrollada se ha utilizado en diversas tareas de máximo interés en el área de Teledetección, como son la clasificación de cubiertas terrestres en procesos semi-supervisados y no supervisados, la evaluación de la calidad de la selección de áreas de entrenamiento, la estimación de variables físicas de cubiertas acuosas o el análisis de la validez de índices espectrales sobre imágenes con características específicas.
Aplicación a otras áreas
Las características de las herramientas desarrolladas han hecho de la metodología propuesta un instrumento de gran utilidad en otras áreas de investigación, que comparten con la Teledetección la necesidad de manejar información multidimensional.
Es por ello que se han incluido en esta investigación experimentos relacionados con el manejo de cadenas de ADN, así como con el tratamiento de datos médicos relacionados con variables cinemáticas de la marcha en niños. Ello han permitido validar la metodología desarrollada.
Esta investigación se ha desarrollado como tesis doctoral en Ingeniería Informática de Soledad Delgado Sanz. Dirigida por Consuelo Gonzalo Martín (doctora en Ciencias Físicas) y Estíbaliz Martínez Izquierdo (doctora en Ciencias Químicas), fue leída ante el tribunal el pasado 5 de febrero.
Más concretamente, esta investigación ha desarrollado nuevos algoritmos de entrenamiento y visualización de redes neuronales autoorganizativas para su aplicación en teledetección, generando así modelos simplificados de grandes volúmenes de información de naturaleza multiespectral.
Las redes neuronales son modelos matemáticos inspirados en el funcionamiento de las redes de neuronas biológicas que se aplican en la actualidad a una amplia área de disciplinas para resolver una gran variedad de problemas. Uno de los modelos de redes neuronales más ampliamente utilizado es el denominado mapa autoorganizativo.
La teledetección se puede definir como la disciplina que permite la adquisición de información de la superficie de la tierra sin realizar ningún contacto con el material objeto de la observación. El desarrollo de herramientas para analizar y procesar imágenes multiespectrales capturadas por sensores a bordo de satélites ha ofrecido la posibilidad de automatizar tareas que no podrían realizarse de otra manera.
Gran volumen de datos
El principal problema relacionado con la teledetección es el gran volumen de datos de naturaleza multidimensional que debe manejarse. La red neuronal autoorganizativa, concretamente el modelo planteado por Kohonen, ha demostrado ser una herramienta versátil y útil en el análisis exploratorio de datos.
El modelo de Kohonen presenta, sin embargo, ciertas limitaciones relacionadas principalmente con su arquitectura, lo que ha hecho surgir nuevos tipos de mapas autoorganizativos que palian esta problemática, como el modelo Growing Cell Structures (GCS).
El modelo GCS permite visualizar las relaciones de los patrones de entrada de información sin las limitaciones topológicas del modelo de Kohonen, aunque tiene a su vez un inconveniente en la configuración de determinados parámetros de entrenamiento, ya que a pesar de tener asignados valores constantes, no tienen acotado el rango de valores que estos patrones pueden tomar.
Nuevo algoritmo
La investigación desarrollada en la Facultad constituye un avance en la solución de este problema, ya que propone un nuevo algoritmo de entrenamiento del modelo GCS que mejora la adaptación de esta red a la topología del espacio de entrada.
La modificación del algoritmo GCS facilita la explotación de este modelo de red neuronal en la generación de modelos simplificados de grandes volúmenes de información de naturaleza multiespectral, típicamente asociados al área de la teledetección.
Con el fin de explotar este paradigma dentro del área de Teledetección, la investigación ha desarrollado diversos métodos de visualización de información multidimensional basados en el modelo GCS, así como distintas técnicas de etiquetado de la red para tareas de clasificación semi-supervisada y no supervisada, o procesos de estimación de variables a través de información multiespectral. De igual manera, ha desarrollado diversas medidas adaptadas al modelo GCS para evaluar la calidad de la red entrenada.
La metodología desarrollada se ha utilizado en diversas tareas de máximo interés en el área de Teledetección, como son la clasificación de cubiertas terrestres en procesos semi-supervisados y no supervisados, la evaluación de la calidad de la selección de áreas de entrenamiento, la estimación de variables físicas de cubiertas acuosas o el análisis de la validez de índices espectrales sobre imágenes con características específicas.
Aplicación a otras áreas
Las características de las herramientas desarrolladas han hecho de la metodología propuesta un instrumento de gran utilidad en otras áreas de investigación, que comparten con la Teledetección la necesidad de manejar información multidimensional.
Es por ello que se han incluido en esta investigación experimentos relacionados con el manejo de cadenas de ADN, así como con el tratamiento de datos médicos relacionados con variables cinemáticas de la marcha en niños. Ello han permitido validar la metodología desarrollada.
Esta investigación se ha desarrollado como tesis doctoral en Ingeniería Informática de Soledad Delgado Sanz. Dirigida por Consuelo Gonzalo Martín (doctora en Ciencias Físicas) y Estíbaliz Martínez Izquierdo (doctora en Ciencias Químicas), fue leída ante el tribunal el pasado 5 de febrero.