Imprecisión e incertidumbre en el modelo multidimensionalaplicación a la minería de datos

  1. Molina Fernández, Carlos
Dirigée par:
  1. María Amparo Vila Miranda Directeur/trice

Université de défendre: Universidad de Granada

Fecha de defensa: 23 septembre 2005

Jury:
  1. Miguel Delgado Calvo-Flores President
  2. Daniel Sánchez Fernández Secrétaire
  3. Enrique López González Rapporteur
  4. Luis Jimenes Linares Rapporteur
  5. Luis Martínez López Rapporteur

Type: Thèses

Teseo: 130295 DIALNET

Résumé

La utilización de la tecnología OLAP en nuevos campos de conocimiento y el uso de fuentes de datos no estructuradas han hecho que surjan nuevos requerimientos sobre los modelos a utilizar en la definición de los datacubos, Se hace necesaria la utilización de estructuras flexibles que permitan modelar y trabajar sobre la imprecisión resultante de la integración. Una fuente interesante de la información serían los datos proporcionados por expertos para enriquecer los análisis. Normalmente esta información vendrá dada de forma vaga. En estos sistemas también se suelen integrar técnicas de minería de datos para enriquecer las posibilidades de obtención de información de cara al usuario. Estas técnicas deberán ser capaces también de trabajar sobre la imprecisión de estos datos. Lo que proponemos en esta tesis es, por un lado, un modelo multidimensional el cual mediante la utilización de la lógica difusa permite la representación y manejo de información imprecisa. Para ello permite tanto de definición de hechos difusos como la utilización de jerarquías difusas para relacionar los conceptos considerados. De esta manera se pueden representar conceptos más cercanos al usuario. Pero es posible que la imprecisión no sólo surja al definir los conceptos sino también las relaciones entre ellos. Para ayudar en estos casos, el modelo permite definir las relaciones jerárquicas mediante la utilización de etiquetas lingüísticas, permitiendo al experto proporcionarlas mediante el uso de expresiones lingüísticas. Este modelo se ha dotado de las operaciones habituales sobre datacubos. Para aislar al usuario de la complejidad añadida, la estructura propuesta se ha envuelto mediante la utilización de operadores de resumen difuso, de tal manera que el usuario accede a la información de una manera más intuitiva. Para demostrar su aplicación se han construido tres datacubos sobre datos reales tomados de intervenciones quir