La concordancia se define como una relación entre rasgos sublexicales -pares «valor: atributo»- de los ítems léxicos (O’Grady, 2005). En español dichos rasgos son «persona», «número» y «género», junto a sus valores. Corbett (2006) denominó controlador al ítem léxico que determina la concordancia y objetivo al elemento cuya forma es determinada por aquel. Además, definió al dominio como el entorno sintáctico en el cual ocurre la concordancia. Esta se establece por una covarianza sistemática de rasgos. En este trabajo el controlador será nominal, presente y expresará sus rasgos abiertamente. Por otra parte, los objetivos consistirán en artículos (definidos e indefinidos), adjetivos y pronombres (demostrativos, posesivos, indefinidos); además, concordarán con un solo controlador obligatoriamente. Los dominios relevantes serán el sintagma nominal, el sintagma verbal (predicativo) y la oración subordinada. La concordancia se considerará asimétrica -el género y número de los objetivos dependen del controlador nominal-.
La literatura de adquisición ha arrojado los siguientes resultados en lo que respecta a la producción. Fernández- García (1999) investigó la concordancia de género en el sintagma nominal en siete aprendientes ingleses de nivel intermedio a partir de entrevistas grabadas. En general, hubo menos errores en contextos masculinos. Se detectó, en primer lugar, que el masculino se usó mayormente como default en artículos indefinidos y adjetivos. Además, se verificó más precisión con artículos que con adjetivos. Los sustantivos que marcaban las clases en -o /-a (libro) lograron mayor precisión que los no marcados (flor). También existieron menos errores para aquellos motivados semánticamente en el sexo biológico. Asimismo, los alumnos produjeron menos errores con los sustantivos animados (tío) que con los inanimados (tenedor). Por su parte, Liceras, Díaz y Mongeon (2000) compararon la adquisición de género y número en L1 y L2 en el contexto del sintagma nominal y de elipsis (las faldas negras / las negras) en cuatro niños con (edades entre los 4 y 8 años. Los errores de concordancia de género (el zapatos; el cama) en L1 y L2 tenían porcentajes muy similares, despareciendo eventualmente en L1 y persistiendo en L2. En cuanto al número, los errores en L2 eran siempre menos que los de género y eventualmente desaparecían, como sucede en L1. En otro estudio, Francheschina (2001) siguió a un hablante de inglés que había alcanzado nivel superior. El participante exhibió un alto grado de precisión en la concordancia de artículos, adjetivos, demostrativos y pronombres. Sin embargo, los errores de género eran siempre más que los de número, concentrándose estos últimos en los adjetivos. Asimismo, el sujeto observado extendió más veces el uso del masculino a contextos femeninos que viceversa en adjetivos y artículos. Entretanto, Bruhn de Garabito y White (2002) estudiaron el género en estudiantes de secundaria cuya lengua materna era el francés, divididos en dos grupos según estuvieran terminando el primer o el segundo año de español. Aunque la precisión en general fue alta, esta resultó mejor en los artículos que en los adjetivos. Sumado a esto, se verificaron más errores en el artículo definido que en el indefinido. Dichos errores fueron mayores con controladores de género motivados semánticamente que con aquellos motivados morfológicamente -sugiriendo que los alumnos estaban prestando atención a la morfología-. Nuevamente, hubo más sobreextensiones del masculino a contextos femeninos, es decir, una preferencia de masculino como default. Asimismo, White et al. (2004) investigaron la producción y la comprensión en la concordancia de género y número con estudiantes franceses e ingleses de ELE, divididos a su vez en grupos de nivel inicial, medio y superior. En lo que atañe a la producción, tanto tomando en cuenta bigramas Artículo + Nombre, como trigramas Art. + N + Adj., la precisión en general fue alta. Se volvió a observar mayor facilidad para adquirir la concordancia del artículo respecto de los adjetivos por un lado y más precisión en el número respecto al género, por el otro. También se notó nuevamente la tendencia a utilizar el masculino como default. En cuanto a la incurrencia en errores, se constató que desaparecerían a medida que subía el nivel. En suma, pues, se detectó un efecto de competencia -la precisión difería significativamente de acuerdo con el nivel- y uno de rasgo -diferencia significativa en la producción de (valores de) rasgos correctos requeridos por el contexto, por ejemplo, masculino correcto en el adjetivo si el controlador era masculino-. Sin embargo, no hubo un influjo de la lengua materna, dado que los resultados de los aprendientes ingleses no diferían significativamente de los obtenidos por los franceses. Por otra parte, Echevarría & Prévost (2004) investigaron la concordancia de plural en los adjetivos atributivos (prenominales) y en los cuantificadores mucho, bastante y demasiado, para alumnos de francés como lengua materna de nivel intermedio y superior. En lo que atañe a los adjetivos, la concordancia obtuvo altos niveles de precisión. La precisión en mucho resultó muy alta, por lo que en la tarea de producción se observó el orden mucho > demasiado > bastante en los niveles de corrección. Posteriormente, Bruhn de Garavito (2008) analizó el plural en hablantes de francés L1 divididos en dos grupos de edades entre los 14 y 17 años pertenecientes, respectivamente, al nivel 1 y 2 de ELE. El investigador encontró que la adquisición del plural seguía las etapas plural nulo > plural en /-s/ > plural en /-es/. En otro estudio, Montrul et al. (2008) se enfocaron en las diferencias de la concordancia de género entre estudiantes de ELE de habla inglesa (grupo 1) y aquellos nacidos en EE. UU. hijos de padres mexicanos expuestos al inglés antes de los cinco años (grupo 2). El grupo de control estaba conformado por hablantes nativos de inglés. En la tarea de producción de sintagmas nominales [Art. + N + Adj.] apareció un efecto de grupo, obteniendo el grupo 2 mejores resultados que el 1. Se verificó también un efecto de animicidad: mayor precisión en los sustantivos transparentes (-o / -a como en vaso, maestra) animados que en los inanimados. También se halló un efecto de morfología: los sustantivos terminados en consonante (el camión, la canción) con mejores resultados que los terminados en -e (el puente, la suerte); además, los opuestos (la mano) fueron los que se erraron más, especialmente con los adjetivos. Asimismo, se observó un efecto de valor de rasgo: masculino mejor que femenino; pero ningún efecto de modificador (artículo / adjetivo). De modo similar, Alarcón (2011) replicó la tarea de producción del estudio anterior con estudiantes de L2 ingleses e hijos de inmigrantes nacidos en EE. UU. expuestos al español antes de los 5 años. Ambos grupos tenían una competencia similar de nivel superior; durante la investigación, participaron hablantes nativos incluidos dentro de un grupo de control. Se halló significancia en los siguientes factores: a) grupo: mejor en los hijos de inmigrantes que en los estudiantes de L2; b) rasgo: mejor en el masculino que en el femenino; c) morfología: mejor en sustantivos transparentes que en menos transparentes; d) rasgo*grupo: la diferencia en precisión entre masculino y femenino fue mayor en el caso de los aprendientes ingleses; e) rasgo*morfología: la diferencia en precisión entre nombres más y menos transparentes resultó mayor para el femenino; f) rasgo*modificador: la precisión fue significativamente mayor para los artículos que para los adjetivos en el caso del masculino; g) grupo*morfología: ambos grupos con mejores resultados en sustantivos transparentes que menos transparentes pero, al igual que en d), con diferencia mayor entre los aprendientes ingleses. Recientemente, Foote (2015) investigó el rol de la transparencia morfológica del controlador en la concordancia de género (singular), con aprendientes ingleses de ELE de nivel intermedio y superior. En el experimento se utilizaba una tarea de completamiento del tipo: la pared (N1) del baño (N2) está... limpia/*o. Las variables manipuladas fueron: i) género: el género del núcleo N1 del SN (masculino / femenino); ii) morfología: la transparencia de marca de género en el N1 (transparente / opaca); iii) correspondencia: la igualdad o desigualdad entre los géneros del N1 y el N2 (igual / distinto); iv) grupo: el nivel de competencia (intermedio / superior / nativo). Los resultados arrojaron una interacción significativa grupo*correspondencia: los aprendientes de nivel intermedio cometían significativamente más errores que los de nivel superior; y estos, más que los nativos. Además, hubo más errores en la condición de no igualdad de género entre N1 y N2, por lo queno hubo un efecto de transparencia morfológica ni de género.
El objetivo general de este trabajo fue identificar algunos factores influyentes en la producción de concordancia plural en cuatro aprendientes italianos de ELE. Para ello, se utilizó el marco de las redes complejas (Newman, 2010), un método poco aplicado en adquisición de L2. Para cada alumno, se crearon redes «de amistad» en las cuales las palabras / actores establecen enlaces / relaciones de concordancia erróneas con otras palabras / actores. A partir de este planteamiento, se intentó encontrar efectos respecto de los atributos de las palabras que influyeran en la aparición o desaparición de enlaces de concordancia con error en la evolución temporal de la adquisición1.
En esta sección se analizarán los datos obtenidos de cuatro casos de estudiantes adultos, de lengua nativa italiana, estudiantes de ELE en el Instituto Cervantes de Milán durante el año académico 2008-2009. Cada alumno poseía un nivel distinto de competencia lingüística según el Marco Común Europeo de Referencia. Inicialmente, se hicieron entrevistas de 30 minutos entre el alumno y el investigador autor de este trabajo. La tarea consistió en sostener conversaciones no estructuradas sobre temas acordes al nivel de competencia de los participantes. Dichas entrevistas tuvieron lugar durante aproximadamente cada 20 días, según la disponibilidad de los alumnos. Cada aprendiente realizaba simultáneamente el curso de español que le correspondía. Durante el tiempo de la investigación, hubo entre doce y catorce entrevistas con cada sujeto. De este modo, el corpus está constituido por los siguientes conjuntos de transcripciones: SONIA (nivel A1/A2), con 12 transcripciones; NATI (nivel B1), con 14 transcripciones; JAKO (nivel B2), con 14 transcripciones; y MIRKA (nivel C1), con 12 transcripciones. La codificación y transcripción de los datos se hizo mediante el formato CHAT, siguiendo a Mac Whinney (2020). Cada concordancia se codificó con dos términos, aunque era posible que hubiese más términos «objetivo»: por ejemplo, en los libros azules se codificaron dos instancias: los libros y libros azules. Para la realización del conteo, se utilizó el programa CLAN. A modo de ilustración, considérese el siguiente fragmento de transcripción MIRKA [sesión 6]:
Se crearon cuatro redes acumulando los casos de concordancia con error de las sesiones. Las redes eran dirigidas, donde la flecha indicaba el origen del error (Ej.: la casas recibiría la representación , mostrando que el error se ubica en el artículo). Si el error estaba en ambos términos, entonces la flecha era bidireccional. Así, se tomaron solamente los casos de concordancia de error, es decir, se trataba de redes de crecimiento de error. Para ello, se agruparon las sesiones en tres etapas (de crecimiento acumulado) según el siguiente esquema:
1. SONIA y MIRKA: i) hasta la sesión 4; ii) hasta la sesión 8; iii) hasta la sesión 12.
2. NATI y JAKO: i) hasta la sesión 5; ii) hasta la sesión 9; iii) hasta la sesión 14.
Nótese que las redes mantienen constantes los nodos / palabras y lo que se agrega en cada etapa son las aristas. La Figura 1 muestra la red de SONIA (hasta la sesión 12). Por otro lado, la Figura 2 ilustra las redes de todos los aprendientes.
Por otra parte, se crearon variables que caracterizaban cada término dentro de una concordancia (nodo en la red), las cuales son descritas a continuación (el primer nivel se considera el de referencia):
-ERROR. Cantidad de errores de concordancia en los que interviene el término. Por ejemplo, el plural profesores puede estar involucrado en las concordancias producidas: los profesores, los profesore, mucho profesores; con lo cual estaría involucrada en dos concordancias erróneas.
-ESPA. Concordancia en español (sin error).
-MOD. Tipo de modificador del controlador. Niveles: 0 = no es modificador; 1 = artículo definido; 2 = artículo indefinido; 3 = determinante (adjetivos posesivos, indefinidos, demostrativos, interrogativos, exclamativos); 4 = adjetivos (calificativos, numerales, ordinales).
-ES. Se especificó si en la palabra había una desinencia que requería la inserción de e epentética [-(e)s]; según: 0 = sin e epentética; 1 = con e epentética.
-ANIM. Si el controlador era o no animado. Es decir, si la entidad a la que refiere el nombre puede moverse o no por propia voluntad, según: 0 = no es controlador; 1 = inanimado, 2 = animado.
-ESP1. Se codificó la vocal final de la palabra más la desinencia de plural en español del primer término. Según: 1 = us [Ej.: sus]; 2 = is [Ej.: mis]; 3 = os [ej.: rojos]; 4 = as [ej.: blancas]; 5 = es [ej.: azules]; 6 = *es [ej.: útiles (-e- epentética)]
-ESP2. Se codificó la vocal final de la palabra más la desinencia de plural en español del segundo término (mismos niveles que ESP1).
Los siguientes atributos, sobre rasgos del controlador, se extrajeron de la base de datos BuscaPalabras (Davis & Perea, 2005):
Concretud (CONC): índice subjetivo en escala de 1 a 7 que indica cuán concreta es una palabra de menos (+ abstracta) a más (+ concreta).
Familiaridad (FAM): índice subjetivo en escala de 1 a 7, que indica cuán frecuentemente una palabra es oída, leída o producida diariamente.
Imaginabilidad (IMA): índice subjetivo en escala de 1 a 7 que indica la intensidad con la que una palabra evoca imágenes.
Frecuencia (LEXESP): frecuencia de la palabra en el corpus “BuscaPalabras”, en escala por mil.
Además, se crearon dos variables basadas en la distancia de Levenstein (Nerbonne et al., 2013; Oakes, 1998), con el objetivo de medir la similitud entre las raíces léxicas del español y el italiano; y entre los morfemas de género y número plural. El algoritmo de Levenstein calcula la distancia entre dos secuencias de caracteres como el número mínimo de operaciones necesarias para transformar una secuencia en la otra. Estas operaciones son: DELETE (borrar); SUBSTITUTE (sustituir); INSERT (insertar). A partir de esto, se asignaron los siguientes pesos para las operaciones: i) DELETE = 0.3; ii) SUBSTITUTE = 0.6; INSERT = 1. Por ejemplo, en la instancia much-os amig-os [SONIA, sesión 1, línea 7] (it. molt-i amic-i) la similitud entre las terminaciones de ambos términos de la concordancia se calculó como: . En ambos términos es necesario operar una sustitución (= 0.6) de i por o y una inserción de s (= 1), cuya suma es 1.6. También se practicó una corrección sumando 0.2 al valor arrojado por el algoritmo en los casos en los que interviene una -e- epentética. Esto es así porque el algoritmo no distingue entre una terminación -es donde la e es epentética [canciones] y otra en que no lo es [calles]. A modo de ejemplo, en el caso de las lecciones [SONIA, sesión 8, línea 370] (it. le lezioni) donde el segundo término tiene -e- epentética, se calculó:.
Además de la similitud entre las desinencias, se calculó la similitud entre las raíces léxicas de ambos términos. Para ello, se extrajo la raíz de cada uno de los términos y se aplicó la distancia de Levenstein. Por ejemplo, en much-os person-as [SONIA, sesión 1, línea 56] (it. molt-e person-e) se calculó como: .
Por otra parte, se realizaron las siguientes operaciones de pre-procesamiento. En primer lugar, se transformó al logaritmo la frecuencia del controlador, sumándole una unidad (Corpus “BuscaPalabras”): .Como resultado de estas operaciones, se recolectaron en total 1857 casos de concordancia. Sin embargo, los atributos relacionados con el controlador (excepto ANIM) a veces no tenían datos registrados en la base de datos de BuscaPalabras. Debido a ello, hubo 161 casos en los que faltaban datos en una o más de estas variables. Los casos faltantes representaron el 8.6 % de la base de datos. Para tal efecto, se utilizó el paquete mice [Multivariate Imputation by Chained Equations] de (Van Buuren & Groothuis-Oudshoorn, 2011), que realiza imputación múltiple.
Por otra parte, se empleó la correlación de Spearman entre las variables extraídas de BuscaPalabras: Imaginabilidad (IMA), Concretud (CONC), Familiaridad (FAM)y Frecuencia en escala logarítmica (LEXESP). Las variables fueron escaladas en la ecuación (). Una vez realizadas, se observó una correlación positiva moderada
(0.68) entre Imaginabilidad y Concretud, como era de suponerse: entre más concreta resulte una palabra, más fácil resulta evocar imágenes de esta. Además, existió una correlación positiva entre Familiaridad y Frecuencia (0.50): entre más frecuente resulta una palabra, más familiar parece. Se aplicó, pues, un Análisis de Componentes Principales (PCA, por sus siglas en inglés). La técnica permite obtener nuevas variables ortogonales llamadas componentes principales, que se calculan como combinación lineal de las variables cuantitativas originales (Peña, 2002). En la primera componente, denominada IMA.CONC, cargaban las variables Imaginabilidad y Concretud; y en la segunda, Familiaridad y LEXESP, denominadaFAM.LEX. En suma, se resolvió la colinealidad pasando de cuatro variables de controlador con correlación a dos componentes sin correlación entre sí.
Por último, se decidió discretizar los atributos cuantitativos utilizando clustering por mezcla de gausianas. Para ello, se utilizó el paquete mclust de R (Strucca et al., 2016) con el fin de hacer el agrupamiento. Durante el proceso, se discretizaron los atributos: IMA.CONC y FAM.LEX. El atributo FAM.LEX se discretizó en dos categorías poniendo como punto de corte a la mediana; ya que el clustering no resultó efectivo. A continuación, en la Tabla 1 se ilustran los resultados obtenidos, mientras que en la Tabla 2 se describen los atributos de los nodos.
En este punto, se aplicó el llamado Actor-Based Stochastic Model (Snijders, 1996; Snijders et al., 2007, 2010), un modelo estadístico de evolución temporal de redes. El modelo trata a cada nodo de una red como un actor. Ya que los enlaces de la red se modelan como si fueran estados, se considera el cambio como un proceso de Markov -en cada punto del tiempo el estado actual de la red determina probabilísticamente el estado de la red en el instante sucesivo, sin influencia de estados pasados-. En este modelo, el proceso es continuo, es decir, la red observada en cada punto es el resultado de microcambios continuos realizados en minipasos. En cada uno de estos, dicho actor debe decidir si preserva, elimina o establece enlaces con otros actores. Este cambio se halla influenciado por factores endógenos a la red -por ejemplo, la tendencia a la reciprocidad de los enlaces: si soy tu amigo, eres mi amigo-; o exógenos a ésta: covariables del actor -los atributos del nodo- o covariables diádicas -interacciones entre atributos de dos nodos conectados por un enlace, como presencia de la característica en ambos nodos-. Además, en la evolución temporal pueden cambiar características de los actores influenciados por la estructura de la red.2 Por lo tanto, se pueden seguir dos dinámicas: una de la red y otra de características comportamentales de los actores. Las relaciones entre los actores están representadas en la matriz de adyacencia (n actores); con si hay un enlace entre los actores i y j, y si no lo hay.3
Los atributos de comportamiento de los actores deben ser categóricos u ordinales y se los denotará como , el valor del h-ésimo atributo del i-ésimo actor. Por lo tanto, cada actor tendrá las observaciones , en cada tiempo discreto . El proceso de cambio se descompone en dos subprocesos.
El primero modela la frecuencia con la que suceden los cambios (de enlaces y del comportamiento de los actores) en los minipasos. Es una función de tasa de arribo que depende del efecto de la tasa del periodo , de efectos de covariables del actor y de efectos de posición del actor en la red (por ejemplo, la cantidad de enlaces de un nodo). Son:
Por tanto, los tiempos de espera entre minipasos de cada actor sigue una distribución exponencial de parámet- ro (). Si hay tasa constante: , . Por otra parte, se modela el subproceso de cambio determinístico; es decir, en cuál enlace o atributo comportamental se produce el cambio. Los atributos de comportamiento cambian siempre en una unidad -crecen o decrecen-. La función se descompone en tres partes: una función de evaluación, una función de satisfacción y un término de error (modelado a partir de la distribución de Gumbel): . La segunda función pe- naliza la pérdida de un enlace o el decrecimiento de un valor comportamental como pérdida de satisfacción. Sin embargo, no será usado dicho componente en el análisis. La parte fundamental es, pues, la función de evaluación, que especifica los efectos de estructura o de comportamiento. En este punto, el actor seleccionará el cambio que maximiza dicha función. Al igual que con la función de tasa de arribo, hay dos; una para cada dinámica:
En donde son parámetros, son funciones que dependen de la estructura de la red y son funciones que dependen del comportamiento del actor, pero también del comportamiento o características estructurales (de red) de sus vecinos.
Por fin, la probabilidad de que un actor cambie de estado (enlace o comportamental) se define como:
A continuación, se describen los efectos de estructura incluidos en el modelo elegido para este estudio.
-Outdegree-Popularity. Es el número de enlaces salientes de los nodos conectados a un nodo i-ésimo.
-Indegree-Popularity. Es el número de enlaces entrantes de los nodos conectados a un nodo i-ésimo.
-Reciprocity. Es el número de enlaces recíprocos entre dos nodos.
-Anti isolates. Efecto de conexión con otros nodos, los cuales estarían aislados sin dicha conexión.
-Isolate - popularity. Efecto de estar conectado con actores cuyo grado de enlaces entrantes es 1.
-out-in degree^(1/2) assortativity. La tendencia de que los nodos con alto grado de enlaces salientes estén conectados a nodos con alto grado de enlaces entrantes.
-Balance. Similitud entre los enlaces salientes del nodo i-ésimo y los enlaces salientes de los otros nodos con los cuales se conecta dicho nodo i-ésimo.
-In-struct equivalence. Similitud entre los enlaces entrantes del nodo i-ésimo y los enlaces entrantes de los otros nodos con los cuales se conecta dicho nodo i-ésimo.
-SameX. Mismo comportamiento entre los actores (nodos) y [homofilia respecto de atributos cualitativos].
-sameXRecip. Mismo comportamiento (homofilia) en enlaces bidireccionales.
-SimX. Suma de las similitudes centradas (respecto de un determinado atributo ) entre i y los otros actores j con los que está conectado [Asortatividad para atributos cuantitativos].
-SimRecipX. Similitud respecto de enlaces bidireccionales.
-EgoX. El número de enlaces salientes pesados por un valor de covariable del actor.
-AltX. La suma de la covariable sobre todos los actores con los cuales tiene un enlace.
-EffFrom. Dependencia de un atributo de otras variables de comportamiento
Entonces, las funciones de evaluación para la dinámica de la red y la del comportamiento se definen como:
Las tasas de arribo son constantes (sin efectos de covariables o de estructura): ; . Para la dinámica de comportamiento se considera la cantidad de errores de una palabra / nodo.4 Se utilizó RSiena (Ripley et al., 2018).
Se testearon las siguientes hipótesis:
El nodo (palabra) es origen de error, según un determinado atributo [EgoX].
El nodo (palabra) no es origen de error, según un determinado atributo [AltX].
Un determinado atributo es similar en ambos nodos (palabra) [SimX, SameX].
El error es recíproco, según un determinado atributo [SimRecipX, sameXRecip].
La acumulación de errores en una palabra crece, según un determinado atributo [EffFrom].
Las Tablas 4 a 7 muestran los resultados significativos del modelo estimado para cada aprendiente.5 En estas aparecen las palabras de controlador con alta imaginabilidad y concretud, así como aquellas que funcionan como adjetivos y las que conllevan -e- epentética susceptibles a la incurrencia en errores. De modo similar, las palabras con controlador de familiaridad / frecuencia léxica alta tienden tanto a generar como a recibir errores. Por otra parte, las palabras terminadas en es (ej., cantantes, amables), las que conllevan -e- epentética y las que tienen alta similitud de raíz / desinencia con el italiano tienden a tener valores similares con el otro término de la concordancia errónea. Solamente en el caso de MIRKA se halló un efecto de influencia en la acumulación de error, respecto de controladores con valores imaginabilidad / concretud altos. Por lo tanto, no hubo efectos significativos de reciprocidad de errores. En la Tabla 3 se resume lo dicho.
Hipótesis | SONIA | NATI | JAKO | MIRKA |
---|---|---|---|---|
i) | FAM.LEX | MOD = «4»; ES | IMA.CONC | - |
ii) | FAM.LEX | - | - | - |
iii) | ES; ESP = «es»; STEM | ESP = «es» | MORF | ESP = «es»; ES |
iv) | - | - | - | - |
v) | - | - | - | IMA.CONC |
Una manera de evaluar la bondad de ajuste del modelo consiste en comparar el modelo observado con otros resultados posibles simulados a partir del modelo ajustado. Se simularon 1000 redes generadas a partir de los parámetros del modelo y se calculó para cada una la probabilidad de cada grado entrante [in degree: cantidad de enlaces entrantes a un nodo], tomando de cero a tres grados. Los resultados se muestran mediante un violin plot para cada grado mostrando la distribución sobre los mil valores obtenidos. En el punto rojo se indica el valor observado. El p-valor, por su parte, muestra la probabilidad de observar la distribución de grado observada en las mil simulaciones -o más extrema-. Cuanto más alto, mejor ajuste es decir, que la hipótesis nula es «el modelo ajusta bien» y, por ende, no debe rechazarse []. Se puede notar, pues, que ningún modelo ajustado rechaza la hipótesis nula (ver Figura 3).
El objetivo de este trabajo fue identificar algunos factores influyentes en la aparición de errores en un corpus longitudinal de concordancias plurales para cuatro alumnos de ELE. Para ello, se crearon redes complejas según tres oleadas de acumulación de errores. Es estas, un enlace indicaba la aparición de una concordancia errónea entre dos términos / nodos. Inicialmente, se caracterizó cada nodo con una serie de atributos. Para ello, se usó una técnica estadística de evolución de redes para predecir la aparición de un enlace (error de concordancia) en la siguiente oleada según la influencia de los atributos especificados en los nodos. Un efecto significativo reportado en la revisión de literatura es que las concordancias con adjetivos son más difíciles que aquellas con artículo (Fernández-García, 1999; White et al., 2004; Montrul et al., 2008; Alarcón, 2011). En NATI, se puede notar que los términos (nodos) que funcionan como adjetivos tienden a crear relaciones de concordancias erróneas con otros términos, a medida que pasa el tiempo, y en la dirección de origen del error. Otro hecho constatado es que el plural en -es [-e- epentética] se adquiere luego del plural en -s (Bruhn de Garavito, 2008). Es razonable suponer que las concordancias que involucren plurales en -es resulten más desafiantes. Se halló en NATI, además, que las palabras con plurales que involucran -e- epentética son origen de error. Es más, en SONIA y MIRKA se tiende a establecer una relación errónea si ambos términos conllevan -e- epentética [pantalones azules]. Sin embargo, en SONIA, NATI y MIRKA también se encontró el efecto de similitud con terminaciones en s en los dos términos con singulares no canónicos terminados en -e [fuentes grandes]. Por otra parte, la revisión de literatura también se reporta un efecto de animicidad para el género (Fernández-García, 1999; Montrul et al., 2008), ausente en el presente análisis. No obstante, se incluyeron otras características del controlador, encontrándose que las palabras de controlador con alta imaginabilidad y concretud tendieron a ser origen del error en JAKO. Asimismo, ejercieron un efecto en el aumento acumulado del error en MIRKA. Por otro lado, las palabras con controlador de familiaridad / frecuencia léxica alta tendieron tanto a generar como a recibir errores. Dichos efectos abogan por la inclusión en los estudios de más características del controlador, además de la animicidad. Por último, las palabras que conllevan alta similitud de raíz / desinencia con el italiano tienden a tener valores similares con el otro término de la concordancia errónea en SONIAy JAKO.
A modo de cierre, se considera que ste trabajo ha contribuido al estudio de la adquisición de ELE incorporando una herramienta de análisis temporal; es decir, que tenga en cuenta la naturaleza dinámica del aprendizaje de una lengua extranjera.
1. Alarcón, I. (2011). Spanish Grammatical Gender Under Complete and Incomplete Acquisition: Early and Late Bilinguals’ Linguistic Behavior Within the Noun Phrase. Bilingualism: Language and Cognition, 14(3), 332-350.
I. Alarcón 2011Spanish Grammatical Gender Under Complete and Incomplete Acquisition: Early and Late Bilinguals’ Linguistic Behavior Within the Noun PhraseBilingualism: Language and Cognition143332350
2. Bruhn de Garavito, J. (2008). Acquisition of the Spanish Plural by French L1 Speakers: The Role of Transfer. In J. Liceras, H. Zobl, & H. Goodluck (Eds.), The Role of Features in Second Language Acquisition (pp. 270-298). Mahwah, NJ: Lawrence Erlbaum.
J. Bruhn de Garavito 2008Acquisition of the Spanish Plural by French L1 Speakers: The Role of Transfer J. Liceras H. Zobl H. Goodluck The Role of Features in Second Language Acquisition270298Mahwah, NJLawrence Erlbaum
3. Bruhn de Garavito, J. & White, L. (2002). The Second Language Acquisition of Spanish DPs: The Status of Grammatical Features. In A. T. Pérez-Leroux & J. Muñoz Liceras (Eds.), The Acquisition of Spanish Morphosyntax: The L1/L2 Connection (pp. 153-178). Dordrecht: Kluwer.
J. Bruhn de Garavito L. White 2002The Second Language Acquisition of Spanish DPs: The Status of Grammatical Features A. T. Pérez-Leroux J. Muñoz Liceras The Acquisition of Spanish Morphosyntax: The L1/L2 Connection153178DordrechtKluwer
5. Davis, C. & Perea, M. (2005). BuscaPalabras: A Program for Deriving Orthographic and Phonological Neighborhood Statistics and Other Psycholinguistic Indices in Spanish. Behavior Research Methods, 37(4), 665- 671.
C. Davis M. Perea 2005BuscaPalabras: A Program for Deriving Orthographic and Phonological Neighborhood Statistics and Other Psycholinguistic Indices in SpanishBehavior Research Methods374665 671
7. Español-Echevarría, M. & Prévost, P. (2004). Acquiring Number Specification on L2 Spanish Quantifiers: Evidence Against the Rich Agreement Hypothesis. En J. Van Kampen & S. Baauw (Eds.), Proceedings of the 2003 Conference on Generative Approaches to Language Acquisition (pp. 151-162). Utrecht: LOT.
M. Español-Echevarría P. Prévost 2004Acquiring Number Specification on L2 Spanish Quantifiers: Evidence Against the Rich Agreement Hypothesis J. Van Kampen S. Baauw Proceedings of the 2003 Conference on Generative Approaches to Language Acquisition151162UtrechtLOT
8. Fernández-García, M. (1999). Patterns of Gender Agreement in the Speech of Second Language Learners. In J. Gutiérrez-Rexach & F. Martínez-Gil (Eds.), Advances in Hispanic Linguistics: Papers from the 2nd Hispanic Linguistics Symposium (pp. 3-15). Somerville, MA: Cascadilla Press.
M. Fernández-García 1999Patterns of Gender Agreement in the Speech of Second Language Learners J. Gutiérrez-Rexach F. Martínez-Gil Advances in Hispanic Linguistics: Papers from the 2nd Hispanic Linguistics Symposium315Somerville, MACascadilla Press
10. Franceschina, F. (2001). Morphological or Syntactic Deficit in Near-native Speakers? An Assessment of Some Current Proposals. Second Language Research , 17, 213-247.
F. Franceschina 2001Morphological or Syntactic Deficit in Near-native Speakers? An Assessment of Some Current ProposalsSecond Language Research17213247
11. Muñoz Liceras, J., Díaz Rodríguez, L., & Mongeon, C. (2000). N-drop and Determiners in Native and Non- native Spanish: More on the Role of Morphology in the Acquisition of Syntactic Knowledge. In R. P. Leow & C. Sanz (Eds.), Current Research on the Acquisition of Spanish (pp. 67-96). Somerville, MA: Cascadilla Press.
J. Muñoz Liceras L. Díaz Rodríguez C. Mongeon 2000N-drop and Determiners in Native and Non- native Spanish: More on the Role of Morphology in the Acquisition of Syntactic Knowledge R. P. Leow C. Sanz Current Research on the Acquisition of Spanish6796Somerville, MACascadilla Press
12. Mac Whinney, B. (2020). The Childes Project: Tools for Analyzing Talk. Part 1 & 2. Electronic Edition. https://talkbank.org/manuals
B. Mac Whinney 2020The Childes Project: Tools for Analyzing Talk. Part 1 & 2Electronic Editionhttps://talkbank.org/manuals
13. Montrul, S., Foote, R. & Perpiñan, S. (2008). Gender Agreement in Adult Second Language Learners and Spanish Heritage Speakers: The Effects of Age and Context of Acquisition. Language Learning, 58(3), 503-553.
S. Montrul R. Foote S. Perpiñan 2008Gender Agreement in Adult Second Language Learners and Spanish Heritage Speakers: The Effects of Age and Context of AcquisitionLanguage Learning583503553
14. Nerbonne, J., Van Ommen, S., Gooskens, C. y Wieling, M. (2013). Measuring Socially Motivated Pronunciation Differences. In L. Borin & A. Saxena (Eds.), Approaches to Measuring Linguistic Differences (pp. 107-140). De Gruyter Mouton.
J. Nerbonne S. Van Ommen C. Gooskens M. Wieling 2013Measuring Socially Motivated Pronunciation Differences L. Borin A. Saxena Approaches to Measuring Linguistic Differences107140De Gruyter Mouton
19. Ripley, R., Snijders, T., Boda, Z., Voros, A., & Preciado, P. (2018). Manual for Siena Version 4.0; R Package Version 1.2-12. https://www.cran.r-project.org/web/packages/RSiena/
R. Ripley T. Snijders Z. Boda A. Voros P. Preciado 2018Manual for Siena Version 4.0; R Package Version 1.2-12https://www.cran.r-project.org/web/packages/RSiena/
20. Scrucca, L., Fop, M., Murphy, T. & Raftery, A. (2016). Mclust 5: Clustering, Classification and Density Estimation Using Gaussian Finite Mixture Models. The R Journal, 8(1), 205-233.
L. Scrucca M. Fop T. Murphy A. Raftery 2016Mclust 5: Clustering, Classification and Density Estimation Using Gaussian Finite Mixture ModelsThe R Journal81205233
22. Snijders, T., Steglich, C. & Schweinberger, M. (2007). Modeling the Co-evolution of Networks and Behavior. In K. Van Montfort, J. Oud & A. Satorra (Eds.), Longitudinal Models in the Behavioral and Related sciences (pp. 41-71). Mahwah, NJ: Lawrence Erlbaum .
T. Snijders C. Steglich M. Schweinberger 2007Modeling the Co-evolution of Networks and Behavior K. Van Montfort J. Oud A. Satorra Longitudinal Models in the Behavioral and Related sciences4171Mahwah, NJLawrence Erlbaum
25. White, L., Valenzuela, E., Kozlowska-Macgregor, M., & Leung, Y. (2004). Gender and Number Agreement in Nonnative Spanish. Applied Psycholinguistics, 25(2), 105-133.
L. White E. Valenzuela M. Kozlowska-Macgregor Y. Leung 2004Gender and Number Agreement in Nonnative SpanishApplied Psycholinguistics252105133
[1]El código de R empleado para el análisis se puede encontrar en el siguiente enlace: https://github.com/pablomarafioti/Pablo-Marafioti/tree/master/redes_complejas/R%20script
[2]Un estudiante que fuma puede ser amigo de otro que fuma [homofilia]; o bien no fumar inicialmente, pero comenzar a hacerlo si la mayoría de su grupo de amigos es fumador [asimilación].
[5]Se considera una convergencia aceptable para el ajuste de cada coeficiente si y la ratio de convergencia máximo del modelo es menor a 0.25.
[6]Cómo citar: Marafioti, P. E. (2021). Análisis de la evolución de errores de concordancia en cuatro aprendientes italianos de ELE usando redes complejas. Lingüística Y Literatura, 42(79), 180-198. https://doi.org/10.17533/udea.lyl.n79a10