viernes, 4 de julio de 2008

Conceptos básicos del PDI

Para hablar de Procesamiento digital de imagenes (PDI), es necesario definir el término de imagen, el cual se refiere a una función bidimensional representando intensidad de luz, donde x e y son las coordenadas espaciales y el valor de f en cualquier punto (x,y) es proporcional al brillo (o nivel de gris) de la imagen en ese punto.

Una imagen consiste en un conjunto de puntos llamados píxeles (la palabra píxel es la abreviación de PICture ELement o elemento de imagen). Por lo tanto, el píxel es el componente más pequeño de la imagen digital. Todo el conjunto de estos píxeles se encuentra en una tabla de dos dimensiones que constituye la imagen:

El número de puntos (píxeles) que constituyen la imagen, es decir, sus "dimensiones" (el número de columnas de la imagen multiplicado por el número de filas) se conoce como definición. Una imagen de 640 píxeles de ancho y 480 píxeles de alto se representa 640 x 480.

Por otro lado, la resolución, un término muchas veces confundido con "definición", está determinada por el número de puntos por unidad de área, expresada en puntos por pulgada (DPI). Una pulgada equivale a 2,54 cm. Por lo tanto, la resolución permite establecer la relación entre el número de píxeles de una imagen y el tamaño real de su representación en un soporte físico.

Existen algunos elementos fundamentales que intervienen en el PDI, los cuales son:

  • Digitalizador (unidad de entrada de datos)
  • Procesador (unidad de proceso de datos)
  • Pantalla (unidad de salida de datos)

Digitalizador: Es un dispositivo que convierte una imagen en una representación numérica (imagen digital). Existen multitud de aparatos que realizan esta función.

Procesador: Se entiende por tal un dispositivo capaz de realizar algún tipo de manipulación con imágenes digitales. Entran en esta categoría desde pequeños microprocesadores especializados hasta grandes ordenadores. Hay que indicar una parte muy importante y diferenciable del procesador es la memoria, o dispositivo físico en el que de alguna forma quedan almacenados los datos, tanto los introducidos por el digitalizador como los resultados de algún proceso.

Pantalla: La función de la pantalla es la inversa que la del digitalizador, esto es, convertir las matrices numéricas que representan imágenes digitales en alguna forma de representación discernible por el ser humano a través de los sentidos. Los principales dispositivos pantalla son: tubos de rayos catódicos y sistemas de impresión.


Las etapas fundamentales del PDI son: Adquisición de la imágen, preprocesado, segmentación, representación y descripción y reconocimiento e interpretación de resultados. El PDI comprende un amplio rango de hardware, software y recursos teóricos.


Adquisición de la imagen: Para esta etapa se requiere un sensor de imágenes y la posibilidad de digitalizarla.


Por ejemplo, el sensor puede ser una cámara fotográfica de alta resolución.
Esta etapa emula el sistema de visión humano, el cual tiene como atributos fundamentales diferenciar contornos, tamaños, color y textura.

Preprocesamiento de la imagen: La función básica del preprocesamiento de la imagen es la de mejorar la imagen adquirida, de forma que se aumente la posibilidad de exito en procedimientos posterior. En esta temática se trata principalemente de mejorar el contraste, eliminar el ruido y aislar regiones cuya textura indica la posibilidad de información alfanumérica.

Segmentación: Consiste en partir una imagen de entrada en sus partes constituyentes u objetos. Es la parte más dificil del PDI.

Representación y descripción: Se enpezará con el concepto de representación, el cual es sólo una parte de la solución para transformar los datos de pixel en bruto a una forma adecuada para ser posteriormente tratados computacionalmente. La descripción, que también se denomina selección de rasgos, consiste en extraer rasgos con alguna información cuantitativa de interés o que sean fundamentales para diferenciar una clase de objeto de otra.

jueves, 3 de julio de 2008

Operaciones del PDI

El Histograma
Un histograma es un gráfico estadístico que permite representar la distribución de intensidad de los píxeles de una imagen, es decir, el número de píxeles que corresponde a cada intensidad luminosa. Por convención, el histograma representa el nivel de intensidad con coordinadas X que van desde lo más oscuro (a la izquierda) a lo más claro (a la derecha).


Ecualización de histograma

El objetivo de la ecualización del histograma es armonizar la distribución del nivel de luminosidad de la imagen, de tal manera que cada uno de los niveles del histograma tienda hacia contener el mismo número de píxeles. Esta operación se propone aumentar los matices de la imagen.


A continuación se encuentra un ejemplo donde se observa la utilización de la ecualización de histograma.

Imagen Original


Imagen ecualizada


La imagen original se muestra una imagen con alto grado de intensidad de gris y en la siguiente imagen se puede observar el proceso de ecualización de los niveles de gris.

Umbral

Consiste en utilizar cero para todos los píxeles cuyo nivel de gris se encuentra por debajo de un cierto valor (llamado el umbral) y el valor máximo para todos los píxeles con un valor mayor. De esta manera, el resultado de la aplicación de este umbral es una imagen binaria que contiene píxeles negros y blancos; es por eso que a veces se utiliza el término binarización. El umbral hace posible destacar formas u objetos en una imagen.

Ejemplo: En las siguientes imágenes se encuentra una imagen con 256 niveles de gris y el resultado de una operación de aplicación de umbral con valor de 125.




miércoles, 2 de julio de 2008

Filtrado de imágenes

El filtrado consiste en aplicar una transformación (llamada filtro) a una imagen digital completa, o a una parte de ella, por medio de un operador. Los tipos de filtro son los siguientes:


Filtro pasa_bajo: Consisten en atenuar los componentes de la imagen con alta frecuencia (píxeles oscuros). Este tipo de filtro generalmente se usa para atenuar el ruido de una imagen; por eso usualmente se lo denomina suavizado.

Filtro pasa_alto: A diferencia de los filtros de paso bajo, atenúan los componentes de la imagen de frecuencia baja y en particular posibilitan acentuar los detalles y el contraste; por esa razón a veces se usa el término "filtro agudizador".

Filtros pasa_banda: Permiten que se obtenga la diferencia entre la imagen original y la que se logra aplicando un filtro de paso bajo. Los filtros de dirección aplican una transformación según una dirección dada. Las operaciones de filtrado tienen una etapa preliminar de selección de píxeles denominada filtrado adaptativo.

Filtros para la detección de bordes

Un filtro para la detección de bordes es el filtro Sobel, el cual utiliza dos mascaras o filtros los cuales uno detecta los bordes verticales y el otro los horizontales, para obtener los bordes completos se realiza la suma de las imágenes que resultaron con los bordes verticales y horizontales.

Otro filtro para la detección de bordes es Prewitt, el cual consta de 8 matrices, que se aplican pixel a pixel en la imagen y luego se suman las imagenes para obtener los bordes bien marcados. El filtro de Prewitt, marca muy bien los bordes, ya que sus matrices atacan estos de seis lados diferentes, en general cada matriz toma el nombre de un punto cardinal: Norte, Sur, Este, Oeste, Noroeste, Noreste, Suroeste, Sureste.


Imagen Original

Imagen con filtro Sobel

Imagen con filtro Prewitt


Otros enlaces