Extraction de contextes définitoires de génie génétique dans un corpus spécialisé français
DOI :
https://doi.org/10.17533/udea.mut.v14n2a11Mots-clés :
linguistique de corpus, contextes riches en connaissance, contextes définitoires, technologies biomédicales, traduction spécialisée.Résumé
Face à des nouveaux domaines, les traducteurs se trouvent confrontés avec des lacunes contextuelles et terminologiques, lesquelles ne peuvent pas être couvertes par les dictionnaires spécialisés. Grâce au potentiel des outils de gestion et d’analyse de corpus, ils s’imposent comme des outils essentiels pour analyser les relations grammaticales entre des mots particuliers, leurs relations sémantiques et pour extraire des informations définitoires afin de combler les lacunes des dictionnaires au cours du procès de traduction. Pour cette raison, cette étude réalise une extraction de contextes définitoires dans le domaine des technologies biomédicales, domaine de connaissance toujours croissante et en développement continu de techniques, instruments, méthodologies et produits avec la combinaison de cql (Corpus Query Language) et expressions régulières (RegEx). Ainsi, cette étude vise à établir certaines stratégies pour la création de recherches basée sur cql et expressions régulières afin de récupérer des informations qui définissent, reformulent ou nuancent la terminologie présente dans ce domaine. Pour ce faire, un corpus a été compilé avec 100 articles de recherche écrits en français (génie génétique et biotechnologie) avec l’outil en ligne de gestion de corpus Sketch Engine. La syntaxe de recherche et les exemples montrent l’utilité de cette stratégie pour la localisation de contextes riches en connaissances qui pourraient être d’intérêt non seulement dans le domaine de la recherche scientifique mais aussi dans le cadre professionnel de la traduction spécialisée du français vers l’espagnol, actuellement avec des ressources terminologiques limitées.
Téléchargements
Références
Alarcón, R., Bach, C. y Sierra, G. (2007). Extracción de contextos definitorios en corpus especializados: hacia la elaboración de una herramienta de ayuda terminográfica. Revista Española de Lingüística (rsel), 37(1), 247-277. https://doi.org/10.31810/RSEL.37.1
Alarcón. R. y Sierra G. (2006). Reglas léxico-metalingüísticas para la extracción automática de contextos definitorios. En A. Hernández y J. L. Zechineli (Eds.), Avances en la ciencia de la computación, vii Encuentro Internacional de Computación ENC’06 18 al 22 de septiembre 2006, San Luis Potosí, México (pp. 242-247). mscc.
Alarcón, R. y Sierra, G. (2017). El rol de las predicaciones verbales en la extracción automática de conceptos. Estudios de Lingüística Aplicada, (38), 129-144. https://ela.enallt.unam.mx/in-dex.php/ela/article/view/753
American Psychological Association. (2020). Publication manual of the American Psychological Association (7.ª ed.). apa.
Barceló Martínez, T. y Delgado Pugés, I. (2015). La traducción de la preposición sur en el lenguaje jurídico francés: un estudio de caso. Çédille, (11), 51-67.
Boré, C. y Malrieu, D. (2017). Approche textométrique des séquences de discours direct dans un corpus de contes. A textometric approach of direct speech sequences in a tales corpus. Corpus, (17), 1-16. https://doi.org/10.4000/corpus.2856
Bordons, M. (2004). Hacia el reconocimiento internacional de las publicaciones científicas españolas. Revista Española de Cardiología, 57(9), 799-802. https://www.revespcardiol.org/es-hacia-el-reconocimiento-internacional-publicaciones-articulo-13065646
Cabezas-García, M. y Faber, P. (2018). Phraseology in specialized resources: An approach to complex nominals. Lexicography, 5, 55-83. https://doi.org/10.1007/s40607-018-0046-x
Cabré, M. T. (2001). La terminología. Representación y comunicación. iula.
Cabré, M. T., Estopà, R. y Vivaldi, J. (2001). Automatic term detection. A review of current systems. En D. Bourigault, C. Jaquemin y M. C. l’Homme (Eds.), Recent advances in computational terminology (pp. 53-87). John Benjamins.
Cagnolati, B. E. (2015). Interferencia en la traducción francés-español de textos de ciencias sociales. Hikma, 14, 55-74. https://doi.org/10.21071/ hikma.v14i.5200
Capsada Blanch, R. y Torruella Casañas, J. (2017). Métodos para medir la riqueza léxica de los textos. Revisión y propuesta. Verba, 44, 347- 408. https://doi.org/10.15304/verba.44.3155
Cartier, E. y Viaux, J. (2018). Étude de la pénétration des anglicismes de type N ou ADJ(-)Ving à partir d’un corpus contemporain journalistique : les exemples de bashing et shaming en français contemporain. En C. Jacquet-Pfau, A. Napieralski y J.-F. Sablayrolles (Eds.), Emprunts néologiques et équivalents autochtones : études interlangues (pp. 11-34). Presses Universitaires de Łódź.
Clark, A., Fox, C. y Lappin, S. (2010). The handbook of computational linguistics and natural language processing. Wiley-Blackwell.
Condamines, A., Josselin-Leray, A., Fabre, C., Lefeuvre, L., Picton, A. y Rebeyrolle, J. (2013). Using comparable corpora to characterize knowledge-rich contexts for various kinds of users: Preliminary steps. Procedia – Social and Behavioral Sciences, 95, 581-586. https://doi.org/10.1016/j.sbspro.2013.10.685
Condamines, A. y Rebeyrolle, J. (1997). Construction d’une base de connaissances terminologiques à partir de textes : expérimentation et définition d’une méthode. En Actes Journées Ingénierie des Connaissances et Apprentissage Automatique, JICAA’97 (pp. 191-206). Institut National de Recherche en Informatique et en Automatique.
Corpas Pastor, G. (1996). Manual de fraseología española. Gredos.
Corpas Pastor, G. (2001). Compilación de un corpus ad hoc para la enseñanza de la traducción inversa especializada. Trans, 5, 155-184. https://doi.org/10.24310/TRANS.2001. v0i5.2916
Corpas Pastor, G. y Roldán Juárez, M. (2014). Análisis de necesidades documentales y terminológicas de médicos y traductores médicos como base para el diseño de un diccionario multilingüe de nueva generación. MonTI, 6, 167-202. http://dx.doi.org/10.6035/MonTI.2014.6.6
Corpas Pastor, G. y Seghiri Domínguez, M. (2007). Determinación del umbral de representatividad de un corpus mediante el algoritmo N-Cor. Procesamiento del Lenguaje Natural, (39), 165-172. http://journal.sepln.org/sepln/ojs/ojs/index.php/pln/article/view/2670
Denis, P. y Sagot, B. (2012). Coupling an annotated corpus and a lexicon for state-of-the-art pos tagging. Language Resources and Evaluation, 46, 721-736. https://doi.org/10.1007/s10579- 012-9193-0
eagles (1996). Preliminary recommendations on corpus typology. eagles document, eag-tcwg-fr-2. http://www.ilc.cnr.it/EAGLES/corpustyp/ corpustyp.html
Egbert, J., Larsson, T. y Biber, D. (2020). Doing lin¬guistics with a corpus. Cambridge.
Estopà, R. (2001). Elementos lingüísticos de las unidades terminológicas para su extracción automática. En M. T. Cabré y J. Feliu (Eds.), La terminología científico-técnica. Reconocimiento, análisis y extracción de información formal y semántica (pp. 67-80). Universitat Pompeu Fa¬bra, Institut Universitari de Lingüística Aplicada.
Evert, S., Harlamov, O., Heinrich, P. y Banski, P. (2020). Corpus Query Lingua Franca part II: Ontology. En N. Calzolari, F. Béchet, P. Blache, K. Choukri, C. Cieri, T. Declerck, S. Goggi, H. Isahara, B. Maegaard, J. Mariani, H. Mazo, A. Moreno, J. Odijk y S. Piperidis (Eds.), Proceedings of the 12th Language Resources and Evaluation Conference, May 2020, Marseille (pp. 3346-3352). European Language Resources Association. https://www.aclweb.org/anthology/2020.lrec-1.410/
Fromm, G., Grama, D. F., Bilke, N. S. y Guarato Santos, C. (2020). Wordsmith Tools and Sketch Engine: An analytical comparative study for scientific research with corpora ma¬nipulation. Revista de estudos de linguagem, 28(3), 1101-1248. http://dx.doi.org/10.17851/2237-2083.28.3.1191-1248
Haße, W., Peters, S. y Fey, K. H. (2011). ¿Lingua franca impuesta o lenguas europeas de la ciencia en medicina? La opción del multilingüismo. Panace@, 12(34), 267-372. https://www.tre-medica.org/wp-content/uploads/n34-tribuna-abepetersfey_ESP.pdf
Jakubíček, M., Kilgariff, A., McCarthy, D. y Ry¬chlý, P. (2010). Fast syntactic searching in very large corpora for many languages. En R. Otoguro, K. Ishikawa, H. Umemoto, K. Yoshimoto y Y. Harada (Eds.), Proceedings of the 24th Pa¬cific Asia Conference on Language, Information and Computation (pp. 741-747). Waseda University, Institute of Digital Enhancement of Cognitive Processing. https://www.aclweb.org/anthology/Y10-1086/
Ježek, E. y Melloni, C. (2011). Nominals, polysemy and co-predication. Journal of Cognitive Science, 12(1), 1-31. https://doi.org/10.17791/ jcs.2011.12.1.1
Kilgarriff, A., Baisa, V., Bušta, J., Jakubíček, M., Kovář, V., Michelfeit, J., Rychlý, P. y Su¬chomel, V. (2014). The Sketch Engine: ten years on. Lexicography, 1, 7-36. https://doi.org/10.1007/s40607-014-0009-9
Kunilovskaya, M. y Koviazina, M. (2017). Sketch engine: A toolbox for linguistic discovery. Journal of Linguistics, 68(3), 503-507. https://doi.org/10.2478/jazcas-2018-0006
Laursen, A. y Arinas-Pellón, I. (2012). Text corpora in translator training. A case of study of use of comparable corpora in classroom teaching. The Interpreter and Translator Trainer, 6(1), 45- 70. https://doi.org/10.1080/13556509.2012.10798829
León-Araúz, P., San Martín, A. y Faber, P. (2016). Pattern-based word sketches for the extraction of semantic relations. En P. Drouin, N. Grabar, T. Hamon, K. Kageura y K. Takeuchi (Eds.), Proceedings of the 5th International Workshop on Computational Terminology (Computerm2016) (pp. 73-82). acl. https://www.aclweb.org/anthology/W16-4709/
León-Araúz, P. y Reimerink, A. (2019). High-density knowledge rich contexts. Argentinian Journal of Applied Linguistics, 7(1), 109-130. https://redib.org/Record/oai_articulo2061846-high-density-knowledge-rich-contexts
León-Araúz, P. y Reimerink, A. (2020). Improved knowledge rich context extraction for terminography. En T. Read, S. Montaner y B. Sedano (Eds.), Technological innovation for specialized linguistic domains. Languages for digital lives and cultures. Proceedings of tislid’18 (pp. 69-84). Éditions universitaires européennes.
López Rodríguez, C. I. (2020). Marcos predicativos asociados al concepto signo y síntoma en textos sobre medicina en español. Revista Signos, 53(103), 392-418. https://doi.org/10.4067/ S0718-09342020000200392
Martínez López, A. B. (2010). La terminología médica en francés, inglés y español: problemas que se derivan de la presencia del inglés como lingua franca de la comunicación científica a es¬cala internacional. Anales de Filología Francesa, (18), 393-404. https://revistas.um.es/analesff/article/view/117041
McEnery, T., Xiao, R. y Tono, Y. (2006). Corpus-based language studies. An advanced resource book. Routledge.
Meyer, I. (2001). Extracting knowledge-rich contexts for terminography. A conceptual and methodological framework. En D. Bourigault, C. Jacquemin y M.-C. L’Homme (Eds.), Recent advances in computational terminology (pp. 279- 302). John Benjamins.
Navarro, F. A. (2001). El inglés, el idioma internacional de la medicina. Panace@, 3(2), 35- 51. https://www.tremedica.org/wp-content/uploads/n3_Panacea3_Marzo2001.pdf
Navarro, F. A. (2006). La anglización del español: mucho más allá de bypass, piercing, test, airbag, container y spa. En L. González y P. Hernúñez (Coords.), Traducción: contacto y contagio. Actas del III Congreso Internacional “El Español, lengua de traducción”. Puebla (México) (pp. 231-232). ESLEtRA. https://cvc.cervantes.es/lengua/esletra/pdf/03/017_navarro.pdf
Nazar, R. y Galdames, A. (2020). Formalización de reglas para la detección del plural en castellano en el caso de unidades no diccionarizadas. Linguamática, 11(2), 17-32. https://doi. org/10.21814/lm.11.2.285
Ortega Arjonilla, E. (2003). Aspectos metodológicos de la traducción científica y técnica. Aplicaciones al ámbito francés-español. En M. Á. García Peinado y E. Ortega Arjonilla (Coords.), Panorama actual de la investigación en traducción e interpretación (pp. 199-234). Atrio.
Picton, A., Josselin-Leray, A. y Planas, E. (2017). Defining knowledge-rich contexts for specialized translation: Uses and limitations of a mixed-method approach. En I. Simonnæs, Ø. Andersen y K. Schubert (Eds.), 21st Conference on Language for Specific Purposes, Bergen (Norway), June 28-30 (pp. 289-307). Frank & Timme.
Pimienta, D. y Prado, D. (2016). Medición de la presencia de la lengua española en la internet: métodos y resultados. Revista Española de Documentación Científica, 39(3), 1-14. https://doi. org/10.3989/redc.2016.3.1328
Rodríguez Martínez, M. C. (2017). Particularidades de la traducción en el ámbito biosanitario del francés al español. En E. Ortega, A. B. Martínez López y F. García Luque (Eds.), Cartografía de la traducción, la interpretación y las industrias de la lengua. Mundo profesional y formación académica: interrogantes y desafíos (pp. 151-166). Comares.
Rodríguez Martínez, M. C. y Ortega Arjonilla, E. (2020). Particularidades morfológicas en traducción biosanitaria del francés al español: el prospecto de medicamentos para uso humano. Trans, (24), 401-418. https://doi.org/10.24310/TRANS.2020.v0i24.6440
Ruiz Rosendo, L. (2007). El predominio del inglés en el lenguaje científico: características del lenguaje médico español en la actualidad. Polissema, (7), 85-113. https://core.ac.uk/rea-der/47137820
Ryšavá, D., Volková, N. y Rambousek, A. (2015). Converting the corpus query language to the natural language. En A. Hokák, P. Rychlý y A. Rambousek (Eds.), Proceedings of recent advances in Slavonic natural language processing, raslan 2015 (pp. 43-48). Tribun eu. https://nlp.fi.muni.cz/raslan/2015/paper11-Rysava_Volkova_ Rambousek.pdf
Sierra, G. (2009). Extracción de contextos definitorios en textos de especialidad a partir del reconocimiento de patrones lingüísticos. Linguamática, 1(2), 13-37. https://www.linguamatica.com/index.php/linguamatica/article/view/38
Sierra, G. (2011). Lexicografía computacional en las búsquedas onomasiológicas con lenguaje natural. En M. E. Vázquez Laslop, K. Zimmerman y F. Segovia (Eds.), De la lengua por sólo la extrañeza: estudios de lexicología, norma lingüística, historia y literatura en homenaje a Luis Fernando Lara (pp. 445-464). El Colegio de México.
Sierra, G. (2017). Introducción a los corpus lingüísticos. unam, Instituto de Ingeniería.
Sierra, G., Alarcón, R., Aguilar, C., Barrón, A., Benítez, B. y Baca, I. (2008). Corpus de contextos definitorios: una herramienta para la lexicografía y la terminología. En L. Fabbri (Ed.), Terminología, conocimientos, sociedad y poder: x Simposio Iberoamericano de Terminología (riterm): Montevideo, 7 a 19 de noviembre de 2006. riterm; Intendencia Municipal de Montevideo.
Sierra, G., Medina, A., Alarcón, R. y Aguilar, C. A. (2003). Towards the extraction of conceptual information from corpora. En D. Archer, P. Rayson, A. Wilson y T. McEnery (Eds.), Pro¬ceedings of the Corpus Linguistics 2003 Conference (pp. 691-697). ucrel.
Sierra, G., Torres-Moreno, J.-M. y Molina, A. (2010). Regroupement sémantique de défini-tions en espagnol. ArXiv, abs/1501.04920.
Sketch Engine (s. f). Learn how language works. https://www.sketchengine.eu/
Valero Doménech, E. y Alcina Caudet, A. (2010). Exploración de características conceptuales en contextos ricos en conocimiento mediante un programa de análisis cualitativo. Revista de Lingüística y Lenguas Aplicadas, 5, 241-254. https://doi.org/10.4995/rlyla.2010.772
Téléchargements
Publié-e
Comment citer
Numéro
Rubrique
Licence
(c) Tous droits réservés Mutatis Mutandis. Revista Latinoamericana de Traducción 2021

Cette œuvre est sous licence Creative Commons Attribution - Pas d'Utilisation Commerciale - Partage dans les Mêmes Conditions 4.0 International.
Aquellos autores/as que tengan publicaciones con esta revista, aceptan los términos siguientes:
- La revista es el titular de los derechos de autor de los artículos, los cuales estarán simultáneamente sujetos a la Licencia de reconocimiento no comercial sin obra derivada de Creative Commons que permite a terceros compartir la obra siempre que se indique su autor y su primera publicación esta revista.
- Los autores/as podrán adoptar otros acuerdos de licencia no exclusiva de distribución de la versión de la obra publicada (p. ej.: depositarla en un archivo telemático institucional o publicarla en un volumen monográfico) siempre que se indique la publicación inicial en esta revista.
- Se permite y recomienda a los autores/as difundir su obra a través de Internet (p. ej.: en archivos telemáticos institucionales o en su página web) antes y durante el proceso de envío, lo cual puede producir intercambios interesantes y aumentar las citas de la obra publicada.