Extracción de contextos definitorios de tecnologías biomédicas en corpus especializado francés
DOI:
https://doi.org/10.17533/udea.mut.v14n2a11Palabras clave:
lingüística de corpus, contextos definitorios, traducción especializada, tecnologías biomédicasResumen
Ante nuevos campos de conocimiento, los traductores se enfrentan a lagunas contextuales y terminológicas que los diccionarios especializados no cubren. Gracias al potencial que demuestran las herramientas de análisis y gestión de corpus, estas se perfilan como indispensables a la hora de estudiar las relaciones gramaticales entre palabras concretas y sus vínculos semánticos, y extraer información definitoria que supla las carencias de los diccionarios en el proceso de traducción. Por ello, esta investigación extrae contextos definitorios en el ámbito de las tecnologías biomédicas, ámbito de conocimiento en continua expansión y con desarrollo constante de técnicas, instrumentos, metodologías y productos, mediante lenguaje de interrogación de corpus (Corpus Query Language, CQL) y expresiones regulares. En otras palabras, se pretende establecer unas pautas para la creación de búsquedas que combinen cql y expresiones regulares, para localizar información que defina, reformule o matice terminología presente en este ámbito. Para ello, se compila un corpus de 100 artículos en francés de investigación sobre ingeniería genética y biotecnología en la herramienta en línea de gestión de corpus Sketch Engine. Las ecuaciones de búsqueda y los ejemplos muestran la utilidad de esta estrategia para localizar contextos ricos en conocimiento que podrían resultar de interés no solo en el ámbito investigador, sino también en el ámbito profesional de la traducción especializada del francés al español, que actualmente cuenta con pocos recursos terminológicos.
Descargas
Citas
Alarcón, R., Bach, C. y Sierra, G. (2007). Extracción de contextos definitorios en corpus especializados: hacia la elaboración de una herramienta de ayuda terminográfica. Revista Española de Lingüística (rsel), 37(1), 247-277. https://doi.org/10.31810/RSEL.37.1
Alarcón. R. y Sierra G. (2006). Reglas léxico-metalingüísticas para la extracción automática de contextos definitorios. En A. Hernández y J. L. Zechineli (Eds.), Avances en la ciencia de la computación, vii Encuentro Internacional de Computación ENC’06 18 al 22 de septiembre 2006, San Luis Potosí, México (pp. 242-247). mscc.
Alarcón, R. y Sierra, G. (2017). El rol de las predicaciones verbales en la extracción automática de conceptos. Estudios de Lingüística Aplicada, (38), 129-144. https://ela.enallt.unam.mx/in-dex.php/ela/article/view/753
American Psychological Association. (2020). Publication manual of the American Psychological Association (7.ª ed.). apa.
Barceló Martínez, T. y Delgado Pugés, I. (2015). La traducción de la preposición sur en el lenguaje jurídico francés: un estudio de caso. Çédille, (11), 51-67.
Boré, C. y Malrieu, D. (2017). Approche textométrique des séquences de discours direct dans un corpus de contes. A textometric approach of direct speech sequences in a tales corpus. Corpus, (17), 1-16. https://doi.org/10.4000/corpus.2856
Bordons, M. (2004). Hacia el reconocimiento internacional de las publicaciones científicas españolas. Revista Española de Cardiología, 57(9), 799-802. https://www.revespcardiol.org/es-hacia-el-reconocimiento-internacional-publicaciones-articulo-13065646
Cabezas-García, M. y Faber, P. (2018). Phraseology in specialized resources: An approach to complex nominals. Lexicography, 5, 55-83. https://doi.org/10.1007/s40607-018-0046-x
Cabré, M. T. (2001). La terminología. Representación y comunicación. iula.
Cabré, M. T., Estopà, R. y Vivaldi, J. (2001). Automatic term detection. A review of current systems. En D. Bourigault, C. Jaquemin y M. C. l’Homme (Eds.), Recent advances in computational terminology (pp. 53-87). John Benjamins.
Cagnolati, B. E. (2015). Interferencia en la traducción francés-español de textos de ciencias sociales. Hikma, 14, 55-74. https://doi.org/10.21071/ hikma.v14i.5200
Capsada Blanch, R. y Torruella Casañas, J. (2017). Métodos para medir la riqueza léxica de los textos. Revisión y propuesta. Verba, 44, 347- 408. https://doi.org/10.15304/verba.44.3155
Cartier, E. y Viaux, J. (2018). Étude de la pénétration des anglicismes de type N ou ADJ(-)Ving à partir d’un corpus contemporain journalistique : les exemples de bashing et shaming en français contemporain. En C. Jacquet-Pfau, A. Napieralski y J.-F. Sablayrolles (Eds.), Emprunts néologiques et équivalents autochtones : études interlangues (pp. 11-34). Presses Universitaires de Łódź.
Clark, A., Fox, C. y Lappin, S. (2010). The handbook of computational linguistics and natural language processing. Wiley-Blackwell.
Condamines, A., Josselin-Leray, A., Fabre, C., Lefeuvre, L., Picton, A. y Rebeyrolle, J. (2013). Using comparable corpora to characterize knowledge-rich contexts for various kinds of users: Preliminary steps. Procedia – Social and Behavioral Sciences, 95, 581-586. https://doi.org/10.1016/j.sbspro.2013.10.685
Condamines, A. y Rebeyrolle, J. (1997). Construction d’une base de connaissances terminologiques à partir de textes : expérimentation et définition d’une méthode. En Actes Journées Ingénierie des Connaissances et Apprentissage Automatique, JICAA’97 (pp. 191-206). Institut National de Recherche en Informatique et en Automatique.
Corpas Pastor, G. (1996). Manual de fraseología española. Gredos.
Corpas Pastor, G. (2001). Compilación de un corpus ad hoc para la enseñanza de la traducción inversa especializada. Trans, 5, 155-184. https://doi.org/10.24310/TRANS.2001. v0i5.2916
Corpas Pastor, G. y Roldán Juárez, M. (2014). Análisis de necesidades documentales y terminológicas de médicos y traductores médicos como base para el diseño de un diccionario multilingüe de nueva generación. MonTI, 6, 167-202. http://dx.doi.org/10.6035/MonTI.2014.6.6
Corpas Pastor, G. y Seghiri Domínguez, M. (2007). Determinación del umbral de representatividad de un corpus mediante el algoritmo N-Cor. Procesamiento del Lenguaje Natural, (39), 165-172. http://journal.sepln.org/sepln/ojs/ojs/index.php/pln/article/view/2670
Denis, P. y Sagot, B. (2012). Coupling an annotated corpus and a lexicon for state-of-the-art pos tagging. Language Resources and Evaluation, 46, 721-736. https://doi.org/10.1007/s10579- 012-9193-0
eagles (1996). Preliminary recommendations on corpus typology. eagles document, eag-tcwg-fr-2. http://www.ilc.cnr.it/EAGLES/corpustyp/ corpustyp.html
Egbert, J., Larsson, T. y Biber, D. (2020). Doing lin¬guistics with a corpus. Cambridge.
Estopà, R. (2001). Elementos lingüísticos de las unidades terminológicas para su extracción automática. En M. T. Cabré y J. Feliu (Eds.), La terminología científico-técnica. Reconocimiento, análisis y extracción de información formal y semántica (pp. 67-80). Universitat Pompeu Fa¬bra, Institut Universitari de Lingüística Aplicada.
Evert, S., Harlamov, O., Heinrich, P. y Banski, P. (2020). Corpus Query Lingua Franca part II: Ontology. En N. Calzolari, F. Béchet, P. Blache, K. Choukri, C. Cieri, T. Declerck, S. Goggi, H. Isahara, B. Maegaard, J. Mariani, H. Mazo, A. Moreno, J. Odijk y S. Piperidis (Eds.), Proceedings of the 12th Language Resources and Evaluation Conference, May 2020, Marseille (pp. 3346-3352). European Language Resources Association. https://www.aclweb.org/anthology/2020.lrec-1.410/
Fromm, G., Grama, D. F., Bilke, N. S. y Guarato Santos, C. (2020). Wordsmith Tools and Sketch Engine: An analytical comparative study for scientific research with corpora ma¬nipulation. Revista de estudos de linguagem, 28(3), 1101-1248. http://dx.doi.org/10.17851/2237-2083.28.3.1191-1248
Haße, W., Peters, S. y Fey, K. H. (2011). ¿Lingua franca impuesta o lenguas europeas de la ciencia en medicina? La opción del multilingüismo. Panace@, 12(34), 267-372. https://www.tre-medica.org/wp-content/uploads/n34-tribuna-abepetersfey_ESP.pdf
Jakubíček, M., Kilgariff, A., McCarthy, D. y Ry¬chlý, P. (2010). Fast syntactic searching in very large corpora for many languages. En R. Otoguro, K. Ishikawa, H. Umemoto, K. Yoshimoto y Y. Harada (Eds.), Proceedings of the 24th Pa¬cific Asia Conference on Language, Information and Computation (pp. 741-747). Waseda University, Institute of Digital Enhancement of Cognitive Processing. https://www.aclweb.org/anthology/Y10-1086/
Ježek, E. y Melloni, C. (2011). Nominals, polysemy and co-predication. Journal of Cognitive Science, 12(1), 1-31. https://doi.org/10.17791/ jcs.2011.12.1.1
Kilgarriff, A., Baisa, V., Bušta, J., Jakubíček, M., Kovář, V., Michelfeit, J., Rychlý, P. y Su¬chomel, V. (2014). The Sketch Engine: ten years on. Lexicography, 1, 7-36. https://doi.org/10.1007/s40607-014-0009-9
Kunilovskaya, M. y Koviazina, M. (2017). Sketch engine: A toolbox for linguistic discovery. Journal of Linguistics, 68(3), 503-507. https://doi.org/10.2478/jazcas-2018-0006
Laursen, A. y Arinas-Pellón, I. (2012). Text corpora in translator training. A case of study of use of comparable corpora in classroom teaching. The Interpreter and Translator Trainer, 6(1), 45- 70. https://doi.org/10.1080/13556509.2012.10798829
León-Araúz, P., San Martín, A. y Faber, P. (2016). Pattern-based word sketches for the extraction of semantic relations. En P. Drouin, N. Grabar, T. Hamon, K. Kageura y K. Takeuchi (Eds.), Proceedings of the 5th International Workshop on Computational Terminology (Computerm2016) (pp. 73-82). acl. https://www.aclweb.org/anthology/W16-4709/
León-Araúz, P. y Reimerink, A. (2019). High-density knowledge rich contexts. Argentinian Journal of Applied Linguistics, 7(1), 109-130. https://redib.org/Record/oai_articulo2061846-high-density-knowledge-rich-contexts
León-Araúz, P. y Reimerink, A. (2020). Improved knowledge rich context extraction for terminography. En T. Read, S. Montaner y B. Sedano (Eds.), Technological innovation for specialized linguistic domains. Languages for digital lives and cultures. Proceedings of tislid’18 (pp. 69-84). Éditions universitaires européennes.
López Rodríguez, C. I. (2020). Marcos predicativos asociados al concepto signo y síntoma en textos sobre medicina en español. Revista Signos, 53(103), 392-418. https://doi.org/10.4067/ S0718-09342020000200392
Martínez López, A. B. (2010). La terminología médica en francés, inglés y español: problemas que se derivan de la presencia del inglés como lingua franca de la comunicación científica a es¬cala internacional. Anales de Filología Francesa, (18), 393-404. https://revistas.um.es/analesff/article/view/117041
McEnery, T., Xiao, R. y Tono, Y. (2006). Corpus-based language studies. An advanced resource book. Routledge.
Meyer, I. (2001). Extracting knowledge-rich contexts for terminography. A conceptual and methodological framework. En D. Bourigault, C. Jacquemin y M.-C. L’Homme (Eds.), Recent advances in computational terminology (pp. 279- 302). John Benjamins.
Navarro, F. A. (2001). El inglés, el idioma internacional de la medicina. Panace@, 3(2), 35- 51. https://www.tremedica.org/wp-content/uploads/n3_Panacea3_Marzo2001.pdf
Navarro, F. A. (2006). La anglización del español: mucho más allá de bypass, piercing, test, airbag, container y spa. En L. González y P. Hernúñez (Coords.), Traducción: contacto y contagio. Actas del III Congreso Internacional “El Español, lengua de traducción”. Puebla (México) (pp. 231-232). ESLEtRA. https://cvc.cervantes.es/lengua/esletra/pdf/03/017_navarro.pdf
Nazar, R. y Galdames, A. (2020). Formalización de reglas para la detección del plural en castellano en el caso de unidades no diccionarizadas. Linguamática, 11(2), 17-32. https://doi. org/10.21814/lm.11.2.285
Ortega Arjonilla, E. (2003). Aspectos metodológicos de la traducción científica y técnica. Aplicaciones al ámbito francés-español. En M. Á. García Peinado y E. Ortega Arjonilla (Coords.), Panorama actual de la investigación en traducción e interpretación (pp. 199-234). Atrio.
Picton, A., Josselin-Leray, A. y Planas, E. (2017). Defining knowledge-rich contexts for specialized translation: Uses and limitations of a mixed-method approach. En I. Simonnæs, Ø. Andersen y K. Schubert (Eds.), 21st Conference on Language for Specific Purposes, Bergen (Norway), June 28-30 (pp. 289-307). Frank & Timme.
Pimienta, D. y Prado, D. (2016). Medición de la presencia de la lengua española en la internet: métodos y resultados. Revista Española de Documentación Científica, 39(3), 1-14. https://doi. org/10.3989/redc.2016.3.1328
Rodríguez Martínez, M. C. (2017). Particularidades de la traducción en el ámbito biosanitario del francés al español. En E. Ortega, A. B. Martínez López y F. García Luque (Eds.), Cartografía de la traducción, la interpretación y las industrias de la lengua. Mundo profesional y formación académica: interrogantes y desafíos (pp. 151-166). Comares.
Rodríguez Martínez, M. C. y Ortega Arjonilla, E. (2020). Particularidades morfológicas en traducción biosanitaria del francés al español: el prospecto de medicamentos para uso humano. Trans, (24), 401-418. https://doi.org/10.24310/TRANS.2020.v0i24.6440
Ruiz Rosendo, L. (2007). El predominio del inglés en el lenguaje científico: características del lenguaje médico español en la actualidad. Polissema, (7), 85-113. https://core.ac.uk/rea-der/47137820
Ryšavá, D., Volková, N. y Rambousek, A. (2015). Converting the corpus query language to the natural language. En A. Hokák, P. Rychlý y A. Rambousek (Eds.), Proceedings of recent advances in Slavonic natural language processing, raslan 2015 (pp. 43-48). Tribun eu. https://nlp.fi.muni.cz/raslan/2015/paper11-Rysava_Volkova_ Rambousek.pdf
Sierra, G. (2009). Extracción de contextos definitorios en textos de especialidad a partir del reconocimiento de patrones lingüísticos. Linguamática, 1(2), 13-37. https://www.linguamatica.com/index.php/linguamatica/article/view/38
Sierra, G. (2011). Lexicografía computacional en las búsquedas onomasiológicas con lenguaje natural. En M. E. Vázquez Laslop, K. Zimmerman y F. Segovia (Eds.), De la lengua por sólo la extrañeza: estudios de lexicología, norma lingüística, historia y literatura en homenaje a Luis Fernando Lara (pp. 445-464). El Colegio de México.
Sierra, G. (2017). Introducción a los corpus lingüísticos. unam, Instituto de Ingeniería.
Sierra, G., Alarcón, R., Aguilar, C., Barrón, A., Benítez, B. y Baca, I. (2008). Corpus de contextos definitorios: una herramienta para la lexicografía y la terminología. En L. Fabbri (Ed.), Terminología, conocimientos, sociedad y poder: x Simposio Iberoamericano de Terminología (riterm): Montevideo, 7 a 19 de noviembre de 2006. riterm; Intendencia Municipal de Montevideo.
Sierra, G., Medina, A., Alarcón, R. y Aguilar, C. A. (2003). Towards the extraction of conceptual information from corpora. En D. Archer, P. Rayson, A. Wilson y T. McEnery (Eds.), Pro¬ceedings of the Corpus Linguistics 2003 Conference (pp. 691-697). ucrel.
Sierra, G., Torres-Moreno, J.-M. y Molina, A. (2010). Regroupement sémantique de défini-tions en espagnol. ArXiv, abs/1501.04920.
Sketch Engine (s. f). Learn how language works. https://www.sketchengine.eu/
Valero Doménech, E. y Alcina Caudet, A. (2010). Exploración de características conceptuales en contextos ricos en conocimiento mediante un programa de análisis cualitativo. Revista de Lingüística y Lenguas Aplicadas, 5, 241-254. https://doi.org/10.4995/rlyla.2010.772
Publicado
Cómo citar
Número
Sección
Licencia
Derechos de autor 2021 Mutatis Mutandis. Revista Latinoamericana de Traducción

Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial-CompartirIgual 4.0.
Aquellos autores/as que tengan publicaciones con esta revista, aceptan los términos siguientes:
- La revista es el titular de los derechos de autor de los artículos, los cuales estarán simultáneamente sujetos a la Licencia de reconocimiento no comercial sin obra derivada de Creative Commons que permite a terceros compartir la obra siempre que se indique su autor y su primera publicación esta revista.
- Los autores/as podrán adoptar otros acuerdos de licencia no exclusiva de distribución de la versión de la obra publicada (p. ej.: depositarla en un archivo telemático institucional o publicarla en un volumen monográfico) siempre que se indique la publicación inicial en esta revista.
- Se permite y recomienda a los autores/as difundir su obra a través de Internet (p. ej.: en archivos telemáticos institucionales o en su página web) antes y durante el proceso de envío, lo cual puede producir intercambios interesantes y aumentar las citas de la obra publicada.