Dibujo de objetos desconocidos utilizando recuperación de imágenes
DOI:
https://doi.org/10.17533/udea.redin.13546Palabras clave:
PHOG, segmentación, K medias, objeto etiquetado, aprendizaje de objetosResumen
En este trabajo se presenta un modelo para el dibujo de objetos desconocidos. Aquí se describe una técnica que permite construir una idea visual del significado de una palabra, mediante imágenes recuperadas a través de internet, haciendo posible el aprendizaje de cualquier palabra en cualquier momento. Este proceso es realizado sin previo entrenamiento ni conocimiento de la apariencia de los objetos. Sin embargo ésta información debe ser filtrada con el fin de construir el modelo visual a partir de las imágenes más representativas de la palabra de entrada y así poder generar de manera automática, la relación entre palabras e imágenes de forma no supervisada, tal y como lo hacemos los humanos. Para éste propósito se realiza una extracción de características utilizando el descriptor Pirámide de Histograma de Orientación de Gradientes (PHOG), estas características son agrupadas mediante el algoritmo K medias, seguido de una segmentación de color y una segunda extracción de características. De esta manera la imagen final obtenida es dibujada, representando así la comprensión que se tubo de la palabra de entrada. El modelo propuesto fue implementado en un robot y algunos experimentos son presentados para evaluar la precisión del algoritmo.
Descargas
Citas
K. Dautenhahn, I. Werry, J. Rae, P. Dickerson, P. Stribling, B. Ogden, “Robotic Playmates: Analysing Interactive Competencies of Children with Autism Playing with a Mobile Robot”. Socially Intelligent Agents - Creating Relationships with Computers and Robots. K. Dautenhahn, A. Bond, L. Canamero, B. Edmonds (editors). Ed. Kluwer Academic Publishers. Boston. 2002. pp.117-124. DOI: https://doi.org/10.1007/0-306-47373-9_14
A. M. Howard, H.W. Park, C. C. Kemp. Extracting Play Primitives for a Robot Playmate by Sequencing Low-Level Motion Behaviors. Proc. of IEEE Int. Symp. on Robot and Human Interactive Communication. Munich, Germany. August 2008. pp.360-365. DOI: https://doi.org/10.1109/ROMAN.2008.4600692
A. J. B. Trevor, H. W. Park, A. M. Howard, C. C. Kemp. Playing with Toys: Towards Autonomous Robot Manipulation for Therapeutic Play. Proc. of IEEE Int. Conf. on Robotics and Automation. Kobe, Japan, May 2009. pp. 2139-2145. DOI: https://doi.org/10.1109/ROBOT.2009.5152589
H. Fu, Z. Chi, D. Feng. “Recognition of attentive objects with a concept association network for image annotation”. Pattern Recognition. Vol. 43. 2010. pp. 3539-3547. DOI: https://doi.org/10.1016/j.patcog.2010.04.009
Z. Li, Z. Shi, X. Liu, Z. Li, Z. Shi. “Fusing semantic aspects for image annotation and retrieval”. Journal of Visual Communications and Image Representation. Vol. 21. 2010. pp. 789-805. DOI: https://doi.org/10.1016/j.jvcir.2010.06.004
R. Kachouri, K. Djemal, H. Maaref. “Multi-model classification method in heretogeneous image database”. Pattern Recognition. Vol. 43. 2010. pp. 4077-4088. DOI: https://doi.org/10.1016/j.patcog.2010.07.001
R. Fergus, F. Li, P. Perona, A. Zisserman. “Learning Object Categories Form Internet Image Search”. JPROC. of IEEE. Vol. 98. 2010. pp. 1453-1466. DOI: https://doi.org/10.1109/JPROC.2010.2048990
B. C. Russell, A. Torralba, K. P. Murphy, W. T. Freeman. “Labelme: a database and webbased tool for image annotation”. IJCV. Vol. 77. 2008. pp. 157-173. DOI: https://doi.org/10.1007/s11263-007-0090-8
A. Torralba, R. Fergus, W. T. Freeman. “80 million tiny images: a large database for nonparametric object and scene recognition”. IEEE trans. on PAMI. Vol. 30. 2008. pp. 1958-1970. DOI: https://doi.org/10.1109/TPAMI.2008.128
R. Fergus, L. Fei-Fei, P. Perona, and A. Zisserman. “Learning object categories from google’s image search”. Proc. of ICCV. Vol. 2. 2005. pp. 1816-1823. DOI: https://doi.org/10.1109/ICCV.2005.142
F. Schroff, A. Criminisi, A. Zisserman. Harvesting Image Database from the Web. Proc. of International Conference on Computer Vision. Rio de Janeiro, Brazil. October 2007. pp. 1-8. DOI: https://doi.org/10.1109/ICCV.2007.4409099
A. Bosch, A. Zisserman, X. Munoz. Representing shape with a spatial pyramid kernel. Proceedings of the International Conference on Image and Video Retrieval. New York, USA. 2007. pp. 401-408. DOI: https://doi.org/10.1145/1282280.1282340
A. Bosch, A. Zisserman, X. Munoz, Image Classification using Random Forests and Ferns. Proceedings of the International Conference on Image and Video Retrieval. Rio de Janeiro, Brazil, October 2007. pp. 1-8. DOI: https://doi.org/10.1109/ICCV.2007.4409066
D. MacKay. “An Example Inference Task: Clustering”. Information Theory, Inference and Learning Algorithms. Ed.Cambridge University Press. Chapter20. Cambridge, United Kingdom. September 2003. pp. 284–292.
K. Jain. “Data Clustering: 50 years beyond K-means”. Pattern Recognition Letters. Elsevier Journal. Vol. 31. 2010. pp. 651–666. DOI: https://doi.org/10.1016/j.patrec.2009.09.011
N. Sasao, T. Kondo, T. Suenaga, Y. Matsumoto, T. Ogasawara. Multi-Modal Interaction by HRP-2- Implementation of a Portrait Drawing Function. Proceedings on Conference of Robotics Society of Japan (CD-ROM). Yokohama, Japan. September. 2005. Vol. 23. pp. 1H13.
S. Kudoha, K. Ogawarab, M. Ruchanurucks, K. Ikeuchi. “Painting Robot with Multi-Fingered Hands and Stereo Vision”. Robotics and Autonomous Systems. Vol. 57. 2009. pp. 279-288. DOI: https://doi.org/10.1016/j.robot.2008.10.007
S. Calinon, J. Epiney, A. Billard. A Humanoid Robot Drawing Human Portraits. Proc. of IEEE-RAS Int. Conf. on Humanoid Robots. Tsukuba, Japan, December 2005. pp.161-166
Descargas
Publicado
Cómo citar
Número
Sección
Licencia
Derechos de autor 2018 Revista Facultad de Ingeniería
![Creative Commons License](http://i.creativecommons.org/l/by-nc-sa/4.0/88x31.png)
Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial-CompartirIgual 4.0.
Los artículos disponibles en la Revista Facultad de Ingeniería, Universidad de Antioquia están bajo la licencia Creative Commons Attribution BY-NC-SA 4.0.
Eres libre de:
Compartir — copiar y redistribuir el material en cualquier medio o formato
Adaptar : remezclar, transformar y construir sobre el material.
Bajo los siguientes términos:
Reconocimiento : debe otorgar el crédito correspondiente , proporcionar un enlace a la licencia e indicar si se realizaron cambios . Puede hacerlo de cualquier manera razonable, pero no de ninguna manera que sugiera que el licenciante lo respalda a usted o su uso.
No comercial : no puede utilizar el material con fines comerciales .
Compartir igual : si remezcla, transforma o construye a partir del material, debe distribuir sus contribuciones bajo la misma licencia que el original.
El material publicado por la revista puede ser distribuido, copiado y exhibido por terceros si se dan los respectivos créditos a la revista, sin ningún costo. No se puede obtener ningún beneficio comercial y las obras derivadas tienen que estar bajo los mismos términos de licencia que el trabajo original.