Descriptor morfológico invariante para caracteres occidentales basado en la codificación genética del código de cadena modificado
- Ángel Alonso Álvarez Director
Universidade de defensa: Universidad de León
Fecha de defensa: 19 de decembro de 2002
- José Ángel Hermida Alonso Presidente
- Enrique Alegre Gutiérrez Secretario
- Juan Manuel Sánchez Pérez Vogal
- Luis Pastor Pérez Vogal
- Daniel Fernando García Martínez Vogal
Tipo: Tese
Resumo
En este trabajo se presenta un descriptor para caracteres impresos del alafabeto occidental basado en la información de los contornos de imágenes de caracteres segmentados. El sistema de extracción de características se basa en la codificación del contorno exterior mediante el código de cadena de Freeman, que ha sido modificado para facilitar la obtención de dos códigos de cadena derivados, y en el número de Euler de la imagen de un carácter. A partir de los códigos de cadena modificado y derivados, se extraen características de tipo estructural del contorno exterior de un carácter, mientras que del número de Euler se obtiene el número de sus contornos interiores o huecos. Para generar el descriptor, se utiliza la terminología de la Genética y se considera que cada una de las características extraídas es un gen del carácter que se analiza. Así, se puede construir la secuencia genética propia de un carácter mediante la concentración de sus genes. El hecho de establecer una analogía con el campo de la genética para describir entidades no vivas responde a la intención de encontrar un número reducido de características diferentes y sencillas de obtener que contengan la información del patrón de un carácter representado en una imagen. Además, el objetivo final consiste en disponer de una secuencia de genes característica de cada uno de los elementos de un alfabeto y que permita diferenciarlos entre si, lo equivale a conocer su genoma. Para comprobar la validez del descriptor, se proponen los genomas de los diferentes caracteres del alfabeto occidental y se utilizan junto con un sistema de clasificación secuencial para identificar un conjunto de caracteres extraídos de periódicos del siglo XX. Se ha desarrollado una aplicación gráfica, genroc, utilizando el entorno de Matlab para identificar caracteres mediante la obtención de sus secuencias genéticas y la búsqueda de genomas conocidos dentro d