Diseño e implementación de una aplicación en Processing para la representación visual de datos multidimensionales utilizando técnicas de Minería de Datos

  1. Sáez Ibáñez, Miguel Ángel
Dirigida por:
  1. José David Martín Guerrero Director/a
  2. Emilio Soria Olivas Director/a

Universidad de defensa: Universitat de València

Fecha de defensa: 10 de diciembre de 2015

Tribunal:
  1. Manuel Domínguez González Presidente
  2. Ignacio José Díaz Blanco Secretario/a
  3. Alfredo Vellido Alacena Vocal

Tipo: Tesis

Resumen

La posibilidad de disponer de representaciones gráficas de los datos es de gran valor a la hora de extraer conocimiento útil. Sus principales ventajas son la visualización de información de una forma sencilla, rápida y directa. No obstante, muchos de los conjuntos de datos contienen numerosos registros, que pueden ser de naturaleza multivariante. En estos casos, la representación visual de datos se convierte en una tarea complicada y las técnicas clásicas que suelen utilizarse obtienen resultados poco intuitivos. Esta tesis se plantea como objetivo el diseño e implementación de una aplicación versátil capaz de representar visualmente gran cantidad de datos multidimensionales de forma eficaz para su fácil comprensión. Mediante el uso de esta aplicación se pretende que el usuario encuentre un entorno interactivo de uso sencillo con el que poder visualizar su conjunto de datos. Para conseguir el objetivo de visualizar conjuntos con gran cantidad de datos se propone la utilización de métodos de agrupamiento en la aplicación. Estos procedimientos permiten que el conjunto de datos pueda distribuirse en grupos con características similares y ser representados visualmente de forma unitaria aunque conservando toda la información de los registros individuales que los componen. De este modo se pretende obtener representaciones gráficas de una forma más simple y apta para su inspección visual. Con el fin de representar visualmente datos multidimensionales se dota a la aplicación de diferentes técnicas de reducción de la dimensionalidad. Mediante estas técnicas, se puede lograr la transformación de los datos de alta dimensión en una representación de menor dimensión que sea significativa y que respete su estructura original. En el caso de la aplicación desarrollada, se utilizan estas técnicas para reducir la dimensión original de los datos a solamente dos para proceder a su representación en el plano. De igual modo, con esta aplicación no solamente se pretende que pueda representar visualmente conjuntos de datos multidimensionales de manera intuitiva y lógica sino que también ofrezca grandes posibilidades de interacción natural con el usuario. Para ello la aplicación ha de contar con herramientas mediante las cuales se pueda analizar la representación visual desde distintos puntos de vista y a diferentes niveles de detalle según la voluntad del usuario contando con servicios adecuados para poder manejar y almacenar la información obtenida. Atendiendo a este objetivo, se estima el entorno de programación Processing (www.processing.org) como el más adecuado para implementar la aplicación por su sencillez de manejo, velocidad de ejecución y su orientación hacia el desarrollo de aplicaciones visuales. A estas características se le unen la capacidad de producir aplicaciones multiplataforma y un tratamiento interactivo eficaz. La aplicación, una vez implementada, se evalúa y se utiliza para la extracción de conclusiones del problema analizado. En este sentido, se analizan los resultados obtenidos en diferentes contextos reales. Finalmente, se pone la aplicación a disposición de otros investigadores de manera gratuita con el objetivo de no solamente ser de utilidad en su aplicación a diferentes problemas y fenómenos sino también de obtener información acerca de la dirección o direcciones de evolución de esta herramienta.