Extracción de contextos definitorios de tecnologías biomédicas en corpus especializado francés

Manuel Cristóbal Rodríguez Martínez

doi:10.17533/udea.mut.v14n2a11

Auteurs-es

Manuel Cristóbal Rodríguez Martínez Université européenne de l'Atlantique

DOI :

https://doi.org/10.17533/udea.mut.v14n2a11

Mots-clés :

linguistique de corpus, contextes riches en connaissance, contextes définitoires, technologies biomédicales, traduction spécialisée.

Résumé

Face à des nouveaux domaines, les traducteurs se trouvent confrontés avec des lacunes contextuelles et terminologiques, lesquelles ne peuvent pas être couvertes par les dictionnaires spécialisés. Grâce au potentiel des outils de gestion et d’analyse de corpus, ils s’imposent comme des outils essentiels pour analyser les relations grammaticales entre des mots particuliers, leurs relations sémantiques et pour extraire des informations définitoires afin de combler les lacunes des dictionnaires au cours du procès de traduction. Pour cette raison, cette étude réalise une extraction de contextes définitoires dans le domaine des technologies biomédicales, domaine de connaissance toujours croissante et en développement continu de techniques, instruments, méthodologies et produits avec la combinaison de cql (Corpus Query Language) et expressions régulières (RegEx). Ainsi, cette étude vise à établir certaines stratégies pour la création de recherches basée sur cql et expressions régulières afin de récupérer des informations qui définissent, reformulent ou nuancent la terminologie présente dans ce domaine. Pour ce faire, un corpus a été compilé avec 100 articles de recherche écrits en français (génie génétique et biotechnologie) avec l’outil en ligne de gestion de corpus Sketch Engine. La syntaxe de recherche et les exemples montrent l’utilité de cette stratégie pour la localisation de contextes riches en connaissances qui pourraient être d’intérêt non seulement dans le domaine de la recherche scientifique mais aussi dans le cadre professionnel de la traduction spécialisée du français vers l’espagnol, actuellement avec des ressources terminologiques limitées.

|Résumé

= 866 veces | HTML (ESPAÑOL (ESPAÑA))

= 16 veces| | VISOR (ESPAÑOL (ESPAÑA))

= 6 veces| | PDF (ESPAÑOL (ESPAÑA))

= 431 veces|

Téléchargements

Les données relatives au téléchargement ne sont pas encore disponibles.

Biographie de l'auteur-e

Manuel Cristóbal Rodríguez Martínez, Université européenne de l'Atlantique

Il est titulaire d'un doctorat en linguistique, littérature et traduction de l'Université de Malaga, ainsi que d'une maîtrise en traduction éditoriale de la même université. Il enseigne les technologies de traduction et d'interprétation, l'informatique appliquée, la localisation et la traduction audiovisuelle, entre autres, à l'Universidad Europea del Atlántico (Santander). Il est PI dans le projet de recherche "Gamification pour la motivation des étudiants dans des contextes universitaires" financé par CITICAN (Centre de Recherche et de Technologie Industrielle de Cantabrie) et est membre du groupe de recherche HUM767. Ses axes de recherche portent sur la traduction biosanitaire et la traduction littéraire (du français vers l'espagnol), la linguistique de corpus et les technologies de traduction.

Références

Alarcón, R., Bach, C. y Sierra, G. (2007). Extracción de contextos definitorios en corpus especializados: hacia la elaboración de una herramienta de ayuda terminográfica. Revista Española de Lingüística (rsel), 37(1), 247-277. https://doi.org/10.31810/RSEL.37.1

Alarcón. R. y Sierra G. (2006). Reglas léxico-metalingüísticas para la extracción automática de contextos definitorios. En A. Hernández y J. L. Zechineli (Eds.), Avances en la ciencia de la computación, vii Encuentro Internacional de Computación ENC’06 18 al 22 de septiembre 2006, San Luis Potosí, México (pp. 242-247). mscc.

Alarcón, R. y Sierra, G. (2017). El rol de las predicaciones verbales en la extracción automática de conceptos. Estudios de Lingüística Aplicada, (38), 129-144. https://ela.enallt.unam.mx/in-dex.php/ela/article/view/753

American Psychological Association. (2020). Publication manual of the American Psychological Association (7.ª ed.). apa.

Barceló Martínez, T. y Delgado Pugés, I. (2015). La traducción de la preposición sur en el lenguaje jurídico francés: un estudio de caso. Çédille, (11), 51-67.

Boré, C. y Malrieu, D. (2017). Approche textométrique des séquences de discours direct dans un corpus de contes. A textometric approach of direct speech sequences in a tales corpus. Corpus, (17), 1-16. https://doi.org/10.4000/corpus.2856

Bordons, M. (2004). Hacia el reconocimiento internacional de las publicaciones científicas españolas. Revista Española de Cardiología, 57(9), 799-802. https://www.revespcardiol.org/es-hacia-el-reconocimiento-internacional-publicaciones-articulo-13065646

Cabezas-García, M. y Faber, P. (2018). Phraseology in specialized resources: An approach to complex nominals. Lexicography, 5, 55-83. https://doi.org/10.1007/s40607-018-0046-x

Cabré, M. T. (2001). La terminología. Representación y comunicación. iula.

Cabré, M. T., Estopà, R. y Vivaldi, J. (2001). Automatic term detection. A review of current systems. En D. Bourigault, C. Jaquemin y M. C. l’Homme (Eds.), Recent advances in computational terminology (pp. 53-87). John Benjamins.

Cagnolati, B. E. (2015). Interferencia en la traducción francés-español de textos de ciencias sociales. Hikma, 14, 55-74. https://doi.org/10.21071/ hikma.v14i.5200

Capsada Blanch, R. y Torruella Casañas, J. (2017). Métodos para medir la riqueza léxica de los textos. Revisión y propuesta. Verba, 44, 347- 408. https://doi.org/10.15304/verba.44.3155

Cartier, E. y Viaux, J. (2018). Étude de la pénétration des anglicismes de type N ou ADJ(-)Ving à partir d’un corpus contemporain journalistique : les exemples de bashing et shaming en français contemporain. En C. Jacquet-Pfau, A. Napieralski y J.-F. Sablayrolles (Eds.), Emprunts néologiques et équivalents autochtones : études interlangues (pp. 11-34). Presses Universitaires de Łódź.

Clark, A., Fox, C. y Lappin, S. (2010). The handbook of computational linguistics and natural language processing. Wiley-Blackwell.

Condamines, A., Josselin-Leray, A., Fabre, C., Lefeuvre, L., Picton, A. y Rebeyrolle, J. (2013). Using comparable corpora to characterize knowledge-rich contexts for various kinds of users: Preliminary steps. Procedia – Social and Behavioral Sciences, 95, 581-586. https://doi.org/10.1016/j.sbspro.2013.10.685

Condamines, A. y Rebeyrolle, J. (1997). Construction d’une base de connaissances terminologiques à partir de textes : expérimentation et définition d’une méthode. En Actes Journées Ingénierie des Connaissances et Apprentissage Automatique, JICAA’97 (pp. 191-206). Institut National de Recherche en Informatique et en Automatique.

Corpas Pastor, G. (1996). Manual de fraseología española. Gredos.

Corpas Pastor, G. (2001). Compilación de un corpus ad hoc para la enseñanza de la traducción inversa especializada. Trans, 5, 155-184. https://doi.org/10.24310/TRANS.2001. v0i5.2916

Corpas Pastor, G. y Roldán Juárez, M. (2014). Análisis de necesidades documentales y terminológicas de médicos y traductores médicos como base para el diseño de un diccionario multilingüe de nueva generación. MonTI, 6, 167-202. http://dx.doi.org/10.6035/MonTI.2014.6.6

Corpas Pastor, G. y Seghiri Domínguez, M. (2007). Determinación del umbral de representatividad de un corpus mediante el algoritmo N-Cor. Procesamiento del Lenguaje Natural, (39), 165-172. http://journal.sepln.org/sepln/ojs/ojs/index.php/pln/article/view/2670

Denis, P. y Sagot, B. (2012). Coupling an annotated corpus and a lexicon for state-of-the-art pos tagging. Language Resources and Evaluation, 46, 721-736. https://doi.org/10.1007/s10579- 012-9193-0

eagles (1996). Preliminary recommendations on corpus typology. eagles document, eag-tcwg-fr-2. http://www.ilc.cnr.it/EAGLES/corpustyp/ corpustyp.html

Egbert, J., Larsson, T. y Biber, D. (2020). Doing lin¬guistics with a corpus. Cambridge.

Estopà, R. (2001). Elementos lingüísticos de las unidades terminológicas para su extracción automática. En M. T. Cabré y J. Feliu (Eds.), La terminología científico-técnica. Reconocimiento, análisis y extracción de información formal y semántica (pp. 67-80). Universitat Pompeu Fa¬bra, Institut Universitari de Lingüística Aplicada.

Evert, S., Harlamov, O., Heinrich, P. y Banski, P. (2020). Corpus Query Lingua Franca part II: Ontology. En N. Calzolari, F. Béchet, P. Blache, K. Choukri, C. Cieri, T. Declerck, S. Goggi, H. Isahara, B. Maegaard, J. Mariani, H. Mazo, A. Moreno, J. Odijk y S. Piperidis (Eds.), Proceedings of the 12th Language Resources and Evaluation Conference, May 2020, Marseille (pp. 3346-3352). European Language Resources Association. https://www.aclweb.org/anthology/2020.lrec-1.410/

Fromm, G., Grama, D. F., Bilke, N. S. y Guarato Santos, C. (2020). Wordsmith Tools and Sketch Engine: An analytical comparative study for scientific research with corpora ma¬nipulation. Revista de estudos de linguagem, 28(3), 1101-1248. http://dx.doi.org/10.17851/2237-2083.28.3.1191-1248

Haße, W., Peters, S. y Fey, K. H. (2011). ¿Lingua franca impuesta o lenguas europeas de la ciencia en medicina? La opción del multilingüismo. Panace@, 12(34), 267-372. https://www.tre-medica.org/wp-content/uploads/n34-tribuna-abepetersfey_ESP.pdf

Jakubíček, M., Kilgariff, A., McCarthy, D. y Ry¬chlý, P. (2010). Fast syntactic searching in very large corpora for many languages. En R. Otoguro, K. Ishikawa, H. Umemoto, K. Yoshimoto y Y. Harada (Eds.), Proceedings of the 24th Pa¬cific Asia Conference on Language, Information and Computation (pp. 741-747). Waseda University, Institute of Digital Enhancement of Cognitive Processing. https://www.aclweb.org/anthology/Y10-1086/

Ježek, E. y Melloni, C. (2011). Nominals, polysemy and co-predication. Journal of Cognitive Science, 12(1), 1-31. https://doi.org/10.17791/ jcs.2011.12.1.1

Kilgarriff, A., Baisa, V., Bušta, J., Jakubíček, M., Kovář, V., Michelfeit, J., Rychlý, P. y Su¬chomel, V. (2014). The Sketch Engine: ten years on. Lexicography, 1, 7-36. https://doi.org/10.1007/s40607-014-0009-9

Kunilovskaya, M. y Koviazina, M. (2017). Sketch engine: A toolbox for linguistic discovery. Journal of Linguistics, 68(3), 503-507. https://doi.org/10.2478/jazcas-2018-0006

Laursen, A. y Arinas-Pellón, I. (2012). Text corpora in translator training. A case of study of use of comparable corpora in classroom teaching. The Interpreter and Translator Trainer, 6(1), 45- 70. https://doi.org/10.1080/13556509.2012.10798829

León-Araúz, P., San Martín, A. y Faber, P. (2016). Pattern-based word sketches for the extraction of semantic relations. En P. Drouin, N. Grabar, T. Hamon, K. Kageura y K. Takeuchi (Eds.), Proceedings of the 5th International Workshop on Computational Terminology (Computerm2016) (pp. 73-82). acl. https://www.aclweb.org/anthology/W16-4709/

León-Araúz, P. y Reimerink, A. (2019). High-density knowledge rich contexts. Argentinian Journal of Applied Linguistics, 7(1), 109-130. https://redib.org/Record/oai_articulo2061846-high-density-knowledge-rich-contexts

León-Araúz, P. y Reimerink, A. (2020). Improved knowledge rich context extraction for terminography. En T. Read, S. Montaner y B. Sedano (Eds.), Technological innovation for specialized linguistic domains. Languages for digital lives and cultures. Proceedings of tislid’18 (pp. 69-84). Éditions universitaires européennes.

López Rodríguez, C. I. (2020). Marcos predicativos asociados al concepto signo y síntoma en textos sobre medicina en español. Revista Signos, 53(103), 392-418. https://doi.org/10.4067/ S0718-09342020000200392

Martínez López, A. B. (2010). La terminología médica en francés, inglés y español: problemas que se derivan de la presencia del inglés como lingua franca de la comunicación científica a es¬cala internacional. Anales de Filología Francesa, (18), 393-404. https://revistas.um.es/analesff/article/view/117041

McEnery, T., Xiao, R. y Tono, Y. (2006). Corpus-based language studies. An advanced resource book. Routledge.

Meyer, I. (2001). Extracting knowledge-rich contexts for terminography. A conceptual and methodological framework. En D. Bourigault, C. Jacquemin y M.-C. L’Homme (Eds.), Recent advances in computational terminology (pp. 279- 302). John Benjamins.

Navarro, F. A. (2001). El inglés, el idioma internacional de la medicina. Panace@, 3(2), 35- 51. https://www.tremedica.org/wp-content/uploads/n3_Panacea3_Marzo2001.pdf

Navarro, F. A. (2006). La anglización del español: mucho más allá de bypass, piercing, test, airbag, container y spa. En L. González y P. Hernúñez (Coords.), Traducción: contacto y contagio. Actas del III Congreso Internacional “El Español, lengua de traducción”. Puebla (México) (pp. 231-232). ESLEtRA. https://cvc.cervantes.es/lengua/esletra/pdf/03/017_navarro.pdf

Nazar, R. y Galdames, A. (2020). Formalización de reglas para la detección del plural en castellano en el caso de unidades no diccionarizadas. Linguamática, 11(2), 17-32. https://doi. org/10.21814/lm.11.2.285

Ortega Arjonilla, E. (2003). Aspectos metodológicos de la traducción científica y técnica. Aplicaciones al ámbito francés-español. En M. Á. García Peinado y E. Ortega Arjonilla (Coords.), Panorama actual de la investigación en traducción e interpretación (pp. 199-234). Atrio.

Picton, A., Josselin-Leray, A. y Planas, E. (2017). Defining knowledge-rich contexts for specialized translation: Uses and limitations of a mixed-method approach. En I. Simonnæs, Ø. Andersen y K. Schubert (Eds.), 21st Conference on Language for Specific Purposes, Bergen (Norway), June 28-30 (pp. 289-307). Frank & Timme.

Pimienta, D. y Prado, D. (2016). Medición de la presencia de la lengua española en la internet: métodos y resultados. Revista Española de Documentación Científica, 39(3), 1-14. https://doi. org/10.3989/redc.2016.3.1328

Rodríguez Martínez, M. C. (2017). Particularidades de la traducción en el ámbito biosanitario del francés al español. En E. Ortega, A. B. Martínez López y F. García Luque (Eds.), Cartografía de la traducción, la interpretación y las industrias de la lengua. Mundo profesional y formación académica: interrogantes y desafíos (pp. 151-166). Comares.

Rodríguez Martínez, M. C. y Ortega Arjonilla, E. (2020). Particularidades morfológicas en traducción biosanitaria del francés al español: el prospecto de medicamentos para uso humano. Trans, (24), 401-418. https://doi.org/10.24310/TRANS.2020.v0i24.6440

Ruiz Rosendo, L. (2007). El predominio del inglés en el lenguaje científico: características del lenguaje médico español en la actualidad. Polissema, (7), 85-113. https://core.ac.uk/rea-der/47137820

Ryšavá, D., Volková, N. y Rambousek, A. (2015). Converting the corpus query language to the natural language. En A. Hokák, P. Rychlý y A. Rambousek (Eds.), Proceedings of recent advances in Slavonic natural language processing, raslan 2015 (pp. 43-48). Tribun eu. https://nlp.fi.muni.cz/raslan/2015/paper11-Rysava_Volkova_ Rambousek.pdf

Sierra, G. (2009). Extracción de contextos definitorios en textos de especialidad a partir del reconocimiento de patrones lingüísticos. Linguamática, 1(2), 13-37. https://www.linguamatica.com/index.php/linguamatica/article/view/38

Sierra, G. (2011). Lexicografía computacional en las búsquedas onomasiológicas con lenguaje natural. En M. E. Vázquez Laslop, K. Zimmerman y F. Segovia (Eds.), De la lengua por sólo la extrañeza: estudios de lexicología, norma lingüística, historia y literatura en homenaje a Luis Fernando Lara (pp. 445-464). El Colegio de México.

Sierra, G. (2017). Introducción a los corpus lingüísticos. unam, Instituto de Ingeniería.

Sierra, G., Alarcón, R., Aguilar, C., Barrón, A., Benítez, B. y Baca, I. (2008). Corpus de contextos definitorios: una herramienta para la lexicografía y la terminología. En L. Fabbri (Ed.), Terminología, conocimientos, sociedad y poder: x Simposio Iberoamericano de Terminología (riterm): Montevideo, 7 a 19 de noviembre de 2006. riterm; Intendencia Municipal de Montevideo.

Sierra, G., Medina, A., Alarcón, R. y Aguilar, C. A. (2003). Towards the extraction of conceptual information from corpora. En D. Archer, P. Rayson, A. Wilson y T. McEnery (Eds.), Pro¬ceedings of the Corpus Linguistics 2003 Conference (pp. 691-697). ucrel.

Sierra, G., Torres-Moreno, J.-M. y Molina, A. (2010). Regroupement sémantique de défini-tions en espagnol. ArXiv, abs/1501.04920.

Sketch Engine (s. f). Learn how language works. https://www.sketchengine.eu/

Valero Doménech, E. y Alcina Caudet, A. (2010). Exploración de características conceptuales en contextos ricos en conocimiento mediante un programa de análisis cualitativo. Revista de Lingüística y Lenguas Aplicadas, 5, 241-254. https://doi.org/10.4995/rlyla.2010.772