Mejorando el reconocimiento facial en sistemas de vigilancia mediante super-resolución embebida



Palabras clave:

Súper resolución, mejora de rostros, visión por computador, video vigilancia, aprendizaje supervisado


Este documento detalla la implementación de una red neuronal convolucional de aplicación a nivel sub-pixel diseñada para mejorar la resolución de imágenes faciales. El modelo utiliza una serie de filtros para aumentar progresivamente el número de píxeles, estimando la información necesaria para los nuevos píxeles tanto de la imagen original como del entrenamiento derivado de 17,500 imágenes sintéticas producidas por redes neuronales adversarias. Dentro del contexto de la vigilancia y aplicaciones relacionadas, la red neuronal convolucional entrenada muestra características beneficiosas. Por ejemplo, se puede implementar dentro de un dispositivo para lograr imágenes de mayor resolución de las que la cámara física puede producir. Esta investigación subraya la viabilidad de dicho dispositivo a través de la implementación y evaluación de la red en el sistema embebido NVIDIA Jetson TX2. Los hallazgos demuestran la practicidad del modelo para aplicaciones de vigilancia en tiempo real y su capacidad para producir imágenes de calidad superior en comparación con varios métodos de interpolación, según lo determinado por un proceso de prueba exhaustivo que mide varios atributos de las imágenes generadas.


Biografía del autor/a

Andrés David Gómez-Bautista, Pontificia Universidad Javeriana

Estudiante, Departamento de Electrónica

Francisco Carlos Calderón-Bocanegra, Pontificia Universidad Javeriana

Profesor e Investigador. Departamento de Ingeniería Electrónica


