Localización, mapeo, y etiquetamiento denso de la escena usando una cámara de profundidad


  • Andrés Alejandro Díaz-Toro Universidad del Valle
  • Lina María Paz-Pérez Corporación Intel
  • Pedro Antonio Piniés-Rodríguez Corporación Intel
  • Eduardo Francisco Caicedo-Bravo Universidad del Valle https://orcid.org/0000-0003-0727-2917



Palabras clave:

reconstrucción densa, localización de la cámara, sensor de profundidad, representación volumétrica, detección de objetos, etiquetamiento de múltiples instancias


Presentamos un sistema de localización con información densa, reconstrucción 3D, y detección de objetos en ambientes tipo escritorio, usando una cámara de profundidad; el sensor Kinect. La cámara se mueve manualmente mientras se estima su posición, y se construye un modelo denso con información de color de la escena que se actualiza permanentemente. El usuario puede, alternativamente, acoplar el módulo de detección de objetos (YOLO: you only look once [1]) para detectar y propagar al modelo información de categorías de objetos comúnmente encontrados sobre escritorios, como monitores, teclados, libros, vasos y laptops, obteniendo un modelo con color asociado a la categoría del objeto. La posición de la cámara es estimada usando una técnica modelo-frame con el algoritmo iterativo de punto más cercano (ICP, iterative closest point) con resolución en niveles, logrando una trayectoria libre de deriva, robustez a movimientos rápidos de la cámara y a condiciones variables de luz. Simultáneamente, los mapas de profundidad son fusionados en una estructura volumétrica desde las posiciones estimadas de la cámara. Para visualizar una representación explícita de la escena se emplea el algoritmo marching cubes. Los algoritmos de localización, fusión, marching cubes y detección de objetos fueron implementados usando hardware para procesamiento gráfico con el fin de mejorar el desempeño del sistema. Se lograron resultados sobresalientes en la posición de la cámara, alta calidad en la geometría y color del modelo, estabilidad del color usando el módulo de detección de objetos (robustez a detecciones erróneas) y manejo exitoso de múltiples instancias de la misma categoría.

Biografía del autor/a

Andrés Alejandro Díaz-Toro, Universidad del Valle

Grupo de Investigación Percepción y Sistemas Inteligentes (PSI), Escuela de Ingeniería Eléctrica y Electrónica.

Lina María Paz-Pérez, Corporación Intel

Investigadora y Desarrolladora de Software.

Pedro Antonio Piniés-Rodríguez, Corporación Intel

Investigador y Desarrollador de Software.

Eduardo Francisco Caicedo-Bravo, Universidad del Valle

Grupo de Percepción y Sistemas Inteligentes (PSI), Escuela de Ingeniería Eléctrica y Electrónica.


Cómo citar

Díaz-Toro, A. A., Paz-Pérez, L. M., Piniés-Rodríguez, P. A., & Caicedo-Bravo, E. F. (2018). Localización, mapeo, y etiquetamiento denso de la escena usando una cámara de profundidad. Revista Facultad De Ingeniería Universidad De Antioquia, (86), 54–69. https://doi.org/10.17533/udea.redin.n86a07