Descriptor morfológico invariante para caracteres occidentales basado en la codificación genética del código de cadena modificado

  1. Fernández Díaz, Ramón Ángel
Dirigida por:
  1. Ángel Alonso Álvarez Director

Universidad de defensa: Universidad de León

Fecha de defensa: 19 de diciembre de 2002

Tribunal:
  1. José Ángel Hermida Alonso Presidente
  2. Enrique Alegre Gutiérrez Secretario
  3. Juan Manuel Sánchez Pérez Vocal
  4. Luis Pastor Pérez Vocal
  5. Daniel Fernando García Martínez Vocal

Tipo: Tesis

Teseo: 94406 DIALNET

Resumen

En este trabajo se presenta un descriptor para caracteres impresos del alafabeto occidental basado en la información de los contornos de imágenes de caracteres segmentados. El sistema de extracción de características se basa en la codificación del contorno exterior mediante el código de cadena de Freeman, que ha sido modificado para facilitar la obtención de dos códigos de cadena derivados, y en el número de Euler de la imagen de un carácter. A partir de los códigos de cadena modificado y derivados, se extraen características de tipo estructural del contorno exterior de un carácter, mientras que del número de Euler se obtiene el número de sus contornos interiores o huecos. Para generar el descriptor, se utiliza la terminología de la Genética y se considera que cada una de las características extraídas es un gen del carácter que se analiza. Así, se puede construir la secuencia genética propia de un carácter mediante la concentración de sus genes. El hecho de establecer una analogía con el campo de la genética para describir entidades no vivas responde a la intención de encontrar un número reducido de características diferentes y sencillas de obtener que contengan la información del patrón de un carácter representado en una imagen. Además, el objetivo final consiste en disponer de una secuencia de genes característica de cada uno de los elementos de un alfabeto y que permita diferenciarlos entre si, lo equivale a conocer su genoma. Para comprobar la validez del descriptor, se proponen los genomas de los diferentes caracteres del alfabeto occidental y se utilizan junto con un sistema de clasificación secuencial para identificar un conjunto de caracteres extraídos de periódicos del siglo XX. Se ha desarrollado una aplicación gráfica, genroc, utilizando el entorno de Matlab para identificar caracteres mediante la obtención de sus secuencias genéticas y la búsqueda de genomas conocidos dentro d