Aplicación de dos nuevos algoritmos para agrupar resultados de búsquedas en sistemas de catálogos públicos en línea (OPAC)

Autores/as

  • Andrés Marín Universidad de Antioquia
  • John W. Branch B. Universidad Nacional de Colombia

DOI:

https://doi.org/10.17533/udea.rib.1918

Palabras clave:

K-means, clustering, OPACS, data mining, information retrieval.

Resumen

Con la facilidad que da la Internet y, en particular la Web, cada día es más fácil acceder a nuevas fuentes
de información puestas a disposición en cualquier lugar del mundo. Los usuarios buscan información
específica de acuerdo a sus necesidades particulares, a través de la Web. Ellos pueden hacer búsquedas
ya sea mediante motores de búsqueda tales como Google o Yahoo!, o también mediante bases de datos
particulares de bibliotecas o sistemas de información. Sin embargo, los resultados de consultas en
motores de búsqueda, sistemas de catálogos de acceso público en línea, y en general sistemas de
consulta en la Web, pueden saturar a un usuario por la abundancia de resultados, causando pérdida de
efectividad del sistema de búsqueda. Para resolver este problema, la investigación "Agrupamiento de
resultados obtenidos de consultas distribuidas en sistemas de catálogos públicos en línea (OPAC)",
de la que se deriva este artículo, propone dos algoritmos de agrupamiento de resultados orientados a
sistemas en línea concurrentes, con características de bajo consumo de ciclos de procesador y memoria, los cuales se usan en un prototipo de software.
|Resumen
= 238 veces | PDF
= 85 veces| | PDF
= 24 veces|

Descargas

Los datos de descargas todavía no están disponibles.

Biografía del autor/a

Andrés Marín, Universidad de Antioquia

Mágister en Ingeniería de Sistemas. Docente Facultad de Ingeniería, Universidad de Antioquia

John W. Branch B., Universidad Nacional de Colombia

Doctor en Ingeniería de Sistemas. Director de áreas de programas curriculares de la Facultad de Minas, Universidad Nacional de Colombia

Citas

BORGMAN, C. L. Why are online catalogs still hard to use?. Journal of theAmerican Society for Information Sciences. 1996, no. 47, p. 493–503.

CUTTING, Douglass R.; PEDERSEN, Jan O.; KARGER, David and TUKEY,John W. Scatter/ gather: A cluster-based approach to browsing large documentcollections. En: Proceedings of the Fifteenth Annual International ACMSIGIR Conference on Research and Development in Information Retrieval,1992, p. 318–329.

FREITAS,Alex A. Data Mining and Knowledge Discovery withEvolutionary Algorithms. Estados Unidos: Springer Verlag , 2002.

HAN, Eui-Hong; BOLEY, Daniel; GINI, Maria; GROSS, Robert; HASHING,Kyle; KARYPIS, George; KUMAR, Vipin; MOBASHER, B. and MOORE,Jerry. Webace: A web agent for document categorization and exploration. En:Proceedings of the 2nd Internationl conference on Autonomous Agents,1998.

HEARST, Marti A. y PEDERSEN, Jan O. Reexamining the cluster hypothesis:Scatter/gather on retrieval results. En:Proceedings of SIGIR-96, 19th ACMInternacional Conference on Research and Development in InformationRetrieval, pages (76–84, Zurich, CH, 1996)

KARYPIS, George. Cluto a clustering toolkit. [En línea]. 2003. Disponibleen: http://www.cs.umn.edu/ ̃karypis.[Consulta: enero 12 de 2005]

LEWIS, D. Reuters-21578 text categorization text collection 1.0. [En línea]Disponible en: http://www.research.att.com/ ̃lewis [Consulta: enero 12 de2005]

MAAREK, Yoelle S.; FAGIN, Ronald; BEN-SHAUL, Israel Z. and PELLEG,Dan. Ephemeral document clustering for web applications. Technical Re-port RJ 10186, IBM Research, 2000.

MARCOS, Mari Carmen. Mejoras en la consulta y presentación de losresultados en catálogos de bibliotecas. En: IV Congreso de InteracciónPersona-Ordenador IPO ’03 (Vigo), (Junio 2003)

MATTHEWS, Joseph R. Time for new opac initiatives: An overview oflandmarks in the literature and introduction to wordfocus. Library Hi Tech.1997, vol. 57-58, no. 5, p 111– 122.

MURAMATSU, J. y PRATT, W. Transparent queries: Investigating user ́smental models of search engines. In SIGIR-01. Proc of the Twenty fourthInternacional ACM Conference on Research and Depelopment inInformation Retrieval. September 2001. New Orleans, LA. ACM.

NESCHEN, Martin. Hierarchical binary vector quantisation classifiers forhandwritten character recognition. In Sagerer, Gerhard; Posch, Stefan andKummert, Franz, editors, DAGM-Symposium. Estados unidos: Springer,1995.p. 419–427.

RIEKERT, Wolf-Fritz. The design of a multicatalog system for a publicenvironmental information network. Technical report, GEIN: GermanEnvironmental Information Network, 1999.

SALTON, G.; YANG, C. S.; and YU, C. T. A theory of term importance inautomatic text analysis. Journal of the American Society for InformationScience, 1975, vol. 26, no.1, p.33–44.

SALTON, Gerald. Automatic Text Processing. New York: Addison-Wesley,1989.

SHANNON, C.E. A mathematical theory of communication. The Bell SystemTechnical Journal, 1948, vol 27, pp 379–423,623–656.

STEINBACH, Michael; KARYPIS, George and KUMAR, Vipin. Acomparison od document clusterind techniques. Technical Report 00-034,Department of Computer Science and Engineering. University of Minesota,2000.

Tr ec. Text retrieva conference relevance judgments. [En línea]. Disponibleen: http://trec.nist.gov/data/qrels-eng/index.html .[Consulta: enero 12 de 2005]

Tr ec. Text retrieval conference. [En línea]. Disponible en: http://trec.nist.gov[Consulta: enero 12 de 2005]

WARREN, P. Why thy still cannot use their library catalogues? In Confer-ence on Information Technology in Tertiary Education. June 2000. CITTE2000 Conference, Organising Committee,Attention: CJ Nel,ITServices,University of Port Elizabeth, PO Box 1600,Port Elizabeth, 6000. Uni-versity of Port Elizabeth.

WEISS, Dawid. Introduction to search results clustering. In Proceedings ofthe 6th International Conference on Soft Computing and DistributedProcessing, Rzeszów. 2002. Poland.

Zamir. ClusteringWeb Documents: A Phrase-Based Method for GroupingSearch Engine Results. 1999. (PhD thesis, University of Washington)

Descargas

Publicado

2009-07-14

Cómo citar

Marín, A., & Branch B., J. W. (2009). Aplicación de dos nuevos algoritmos para agrupar resultados de búsquedas en sistemas de catálogos públicos en línea (OPAC). Revista Interamericana De Bibliotecología, 31(1), 47–65. https://doi.org/10.17533/udea.rib.1918

Número

Sección

Investigaciones