PROCESAMIENTO DE VARIANTES MORFOLÓGICAS EN BÚSQUEDAS DE TEXTOS EN CASTELLANO.
DOI:
https://doi.org/10.17533/udea.rib.7843Abstract
El tratamiento de los morfemas dependientes es una de las estrategias utilizadas con la finalidad de incrementar la proporción de documentos relevantes recuperados en los sistemas de búsqueda de información. La técnica de stemming permite extraer sufijos y prefijos comunes, de tal forma que palabras que literalmente son diferentes, pero tienen una raiz común, pueden ser consideradas como un sólo término con base en su raíz.
El presente trabajo consiste en una adaptación del algoritmo de Porter, para procesar corpus de documentos en castellano.
Palabras clave: Stemming, procesamiento de sufijos, incremento de relevancia.
Abstract
Processing dependent morphemes is one of the strategies used to increase the proportion of relevant retrieved documents in information retrieval systems. The stemming technique allows the extraction of common suffixes, in such a way that literarlly different words with a common root can be considered as a single term, as referred to their root. The present work is an adaptation of Porter's algorithm to process spanish corpora.
Keywords: Stemming, suffixes processing, relevance increase.