Análisis Interactivo de DatosMapas Autoorganizados
- Buendía Ramón, Vicente
- José David Martín Guerrero Director/a
- Emilio Soria Olivas Director/a
Universidad de defensa: Universitat de València
Fecha de defensa: 09 de diciembre de 2015
- Ignacio José Díaz Blanco Presidente/a
- Antonio José Serrano López Secretario/a
- Manuel Domínguez González Vocal
Tipo: Tesis
Resumen
Los fenómenos físicos, así como los procesos industriales, producen volúmenes cada vez más cuantiosos de datos, a menudo de difícil tratamiento. Se hace preceptiva la generación de sistemas y procedimientos que permitan extraer, en una primera etapa visual de análisis, la información subyacente a estos datos, orientando así los cálculos y estudios posteriores que puedan aplicarse. El análisis visual será reforzado si se complementa con elementos interactivos que permitan al usuario dirigirse hacia los focos de su interés. Dentro de las técnicas de visualización de datos para los fines expuestos destacan los Mapas Autoorganizados (también llamados SOM, acrónimo de Self-Organizing Maps), un tipo de redes neuronales visuales cuya efectividad será potenciada si son dotados de interactividad. Las aportaciones destacadas del presente trabajo son: 1. Desarrollo de una herramienta de código abierto de ayuda en entornos tecnológicos, académicos e industriales, que incorpora entrenamiento de Mapas Autoorganizados y sistema interactivo de visualización de resultados. Dicha herramienta constituye un prototipo de código abierto, fácil de modificar y escalar, y compatible con los sistemas operativos de uso más habitual en el mercado. Se realiza el entrenamiento de diferentes modelos de Mapas Autoorganizados: GSOM (Growing SOM), GHSOM (Growing Hierarchical SOM) y una nueva propuesta: GCHSOM. Los entrenamientos permiten diversidad de parámetros y se realizan por lotes, almacenando los resultados que presenten mejores mediciones en sus medidas de calidad (error de cuantificación, error topográfico e índice de Kaski y Lagus). 2. Presentación de los Mapas Autoorganizados como herramienta de visualización de datos para su empleo en fases iniciales de análisis de información. Sus propiedades de cuantificación de datos y proyección de las relaciones existentes entre éstos en espacios de bajas dimensiones los convierten en útiles muy eficaces para el análisis visual de información. 3. Mejora de los Mapas Autoorganizados mediante la adición de interactividad, como respuesta a las necesidades actuales de análisis visual de datos. Entre otras opciones, se destaca la realización de una selección de distintos modos de color (secuencial, escala de grises, bipolares secuenciales, escalas de pseudocolores) que por sus características facilitarán en algunos casos, la discriminación, y en otros, la cuantificación. Además se realizan agrupamientos de la información que facilitan su comprensión. Las opciones interactivas de tratamiento de los datos facilitan la discriminación de la información, permitiendo así la visualización de muchas capas. 4. Optimizaciones en el proceso de entrenamiento de grupos de Mapas Autoorganizados para un mismo conjunto de datos para, posteriormente, seleccionar de entre éstos al que reúna mejores condiciones. Se realizan una serie de mejoras sobre el algoritmo base de entrenamiento (paralelismo, cacheado de cálculos) que facilitan la realización de experimentos. 5. Valoración de modelos de entrenamiento y propuesta de variantes en el ámbito de visualización de datos. Concretamente se propone una variante de Mapa Autoorganizado bautizada como GCHSOM (Growing Cluster Hierarchical SOM) que consiste en una estructura de Mapas Autoorganizados de tipo GSOM. Esta variante permite que los datos a analizar se muestren gráficamente en una primera instancia con alto nivel de detalle, permitiendo además al investigador realizar nuevas consultas visuales siguiendo una estructura jerárquica que le guiará permitiendo el acceso a diferentes subconjuntos o contextos de los datos, proporcionando nuevos matices sobre cada uno de estos contextos.