Academia.eduAcademia.edu
ALGUNAS APLICACIONES DE LA LINGÜÍSTICA DE CORPUS EN EL AULA DE ALE (ÁRABE/LENGUA EXTRANJERA) Paula Santillán Grimm Casa Árabe […]orandum est ut sit mens sana in corpore sano. Saturae X, v. 356 Decimus Iunius Iuvenalis (ss. I – II d. C.) RESUMEN: Tras una introducción a los corpus y su desarrollo en el campo de la lingüística moderna, presentamos un panorama general sobre la situación actual de los corpus del árabe centrándonos en el funcionamiento del arabiCorpus. Seguidamente exponemos los beneficios del uso de los corpus aplicados a la enseñanza de lenguas extranjeras subrayando que, sin embargo, se carece hasta el momento de estudios o materiales que apliquen el conocimiento sobre los corpus a la enseñanza del árabe. Finalmente sugerimos una serie de actividades basadas en el manejo del arabiCorpus que esperemos aporten a los profesores de árabe ideas innovadoras para sus clases de ALE. 1. Introducción Como ocurre en otras tantas disciplinas del conocimiento humano, a lo largo de la historia el dialéctico péndulo de la investigación lingüística ha tendido a oscilar entre dos extremos, llámenseles enfoques racionalistas y empíricos, deductivos e inductivos o cognitivos y experimentales. Así, suele ocurrir que los lingüistas, convencidos de la utilidad de un enfoque y de la inutilidad del resto, terminan abogando por un estilo único y puro de pensar la lingüística, descartando la posibilidad de ser contagiados (¿nutridos?) –aunque sea colateralmente– por los principios y procedimientos de otros enfoques. En el caso de la lingüística de corpus (en adelante, LdeC), la literatura suele considerar su advenimiento como una reacción a la lingüística generativa de la escuela chomskiana -la cual a su vez se había posicionado frente a la naturaleza descriptiva de la lingüística de principios del s. XX. Del otro lado del espejo, los generativistas (o lingüistas ‘de sillón’, como los denomina Fillmore, 1992: 35) critican los principios metodológicos de los lingüistas ‘de corpus’ por basarse en un modelo de lengua demasiado experimental e intrínsecamente empírico, el cual difícilmente puede representar la capacidad lingüística innata de los seres humanos. Desde nuestro punto de vista creemos que los recursos y las posibilidades que nos brinda la LdeC no tienen necesariamente que divorciarse de ciertos enfoques cognitivos. Más bien abogamos por lograr cierto nivel de retroalimentación entre ambas posturas en aras de proporcionar resultados más reveladores e interesantes para la investigación lingüística. Esta tendencia conciliadora viene a confirmar una inclinación que las ciencias sociales han tomado recientemente hacia enfoques multimetódicos (McEnery y Wilson, 2001). Se trata más bien de utilizar los corpus como una fuente de debate lingüístico más que como una fuente exhaustiva de conocimiento, 1 pues no olvidemos que pueden desvelar estructuras lingüísticas que, en no pocas ocasiones, habrían permanecido ocultas a nuestra conciencia. 2. Corpus y lingüística de corpus: qué son y para qué sirven Si bien estrictamente hablando cualquier colección de textos puede ser llamada un ‘corpus’, en la lingüística moderna este término ha pasado a denominar vastas cantidades de textos escritos u orales compilados de forma sistemática y representativa. Estos textos se archivan en formato electrónico y son susceptibles de ser analizados (cuantitativa y cualitativamente) y manipulados de forma sencilla y rápida mediante software específico. El hecho de que los corpus sean archivos electrónicos de textos permite: a) al usuario (lingüista, docente, estudiante o usuario general) recurrir a herramientas de búsqueda que le permitan obtener resultados significativos a una velocidad y con un precisión mucho mayor que si se basara en sus intuiciones de análisis sobre un corpus escrito; b) al diseñador del corpus a enriquecerlo mediante la anotación de información extra de diversos tipos: sintáctica, semántica, pragmática, etc. Concebida como una rama de la lingüística moderna, la LdeC surgió en los años 60, si bien alcanzó su auge a partir los años 90, a la par que se normalizaba la accesibilidad de los recursos informáticos y de los corpus electrónicos, tanto a nivel institucional como privado. Actualmente las aplicaciones de la LdeC son extrapolables a áreas tan diversas como la lexicología, la lexicografía, la semántica, la sintaxis, la dialectología, la estilística, la traducción, la lingüística histórica, la psicolingüística, la adquisición de segundas lenguas y, por supuesto, a la lingüística aplicada a la enseñanza de lenguas. En relación a esta última disciplina, la explotación de los corpus va desde la toma de ejemplos reales para la ilustración de diccionarios (sobre todo pero no exclusivamente los de aprendices) y gramáticas de referencia hasta la validación de usos lingüísticos vis à vis el uso real de la lengua, pasando por el diseño de actividades basadas en la búsqueda de patrones léxico-gramaticales o la frecuencia de uso de ciertos lexemas. El boom que ha experimentado la LdeC en los últimos decenios ha calado en el mundo de las publicaciones comerciales hasta tal punto que algunas editoriales cuentan hoy día con colecciones o series específicamente basadas en la explotación de corpus para el diseño y redacción de diccionarios, gramáticas, libros de uso de la lengua y libros de texto1, y esto con el objetivo de combinar un enfoque prescriptivo de la lengua (cómo debería usarse una lengua) con información empírica descriptiva (cómo se usa una lengua). 3. Corpus del árabe Tal y como ocurre en otras tantas áreas de la investigación lingüística, la posición que el árabe ocupa dentro de la investigación en la LdeC es muy distante de la mayoría de lenguas occidentales, sobre todo del inglés. Este rezago puede estar motivado, además de por tratarse de una lengua periférica desde el punto de vista de su 1 Probablemente las pioneras y más punteras sean la Cambridge University Press (http://tinyurl.com/3pjh7os), que se basa en el CEC (Cambridge English Corpus) y la Oxford University Press (http://tinyurl.com/3jv4grn), basada en el OEC (Oxford English Corpus). 2 enseñanza (lo que en inglés se denominan como Less Commonly Taught Languages o Lesser-Used Languages), por el hecho de que el diseño y la búsqueda en un corpus del árabe plantea ciertas dificultades que no plantean otras lenguas: inconsistencia en el uso de las vocales, direccionalidad de los números, artículos y preposiciones sufijadas a los lexemas, etc. La producción de corpus del árabe fue impulsada a inicios de los 90 y ha proliferado sustancialmente en los últimos cinco años. Hoy en día contamos con una cantidad respetable de corpus del árabe, si bien esta producción se encuentra muy descompensada si comparamos la cantidad de corpus elaborados dentro del circuito comercial (es decir, corpus que están a la venta) con aquellos elaborados en el mundo académico. Un listado de corpus del árabe -cómodo por estar en línea aunque algo obsoleto- es el que incluye en la sección Arabic Corpora de su página web Latifa Al Sulaiti, en el que se incluyen una veintena de corpus privados y seis corpus gratuitos. Sin duda la oferta más completa de corpus del árabe es la que ofrecen dos entidades que se han dedicado a su diseño, desarrollo y comercialización desde principios de la década de los 90: el Linguistic Data Consoritum2 (LDC) en EE. UU. y el NEMLAR Project3 en la zona euromediterránea, del cual se derivan los subproyectos MEDAR 4, ELRA5 y ELDA6. A fecha de la publicación de este artículo, el LDC y ELRA ofrecen, respectivamente, 90 y 22 corpus del árabe en lengua tanto escrita como oral, en fusha y en dialectos, así como corpus de lenguaje especializado (de prensa, deportivo, etc.). Los precios de los corpus oscilan entre los 100€ y los 75.000€, dependiendo del tipo de corpus, la fecha de creación, el uso que se le vaya a dar (comercial o académico) y, ante todo, de si el comprador es o no miembro de la entidad productora del mismo. En algunas ocasiones los corpus pueden ser adquiridos directamente de las fuentes originales, como es el caso del periódico Al-Hayat, que compila los textos publicados anualmente y los pone a la venta en un CD-ROM. En cuanto a los corpus del árabe gratuitos, en su mayoría se trata de proyectos académicos amparados por universidades estadounidenses o británicas. En algunos casos hablamos de corpus relativamente pequeños y descargables, como en el caso del Corpus of Contemporary Arabic, Arabic Blogs y Essex Arabic Summaries Corpus (EASC 1.0) (todos descargables desde la página de Al Sulaiti). En otros, se trata de corpus que contienen una mayor cantidad de palabras y, en algunos casos, en línea lo cual facilita enormemente su uso. Éstos son el 2 Fundado en 1992 y con sede en la Universidad de Pennsylvania, el LDC es un consorcio de universidades, empresas y laboratorios de investigación gubernamentales. Su labor es la de crear, compilar y distribuir bases de datos de textos escritos y orales, lexicones así como otros recursos destinados al desarrollo de la investigación. 3 El NEMLAR (Network for Euro-Mediterranean Language Resources) Project 2003-05, fundado por la Comisión Europea, fomenta la cooperación entre los actores de la región euromediterránea con el objetivo de impulsar el desarrollo de la tecnología lingüística de la lengua árabe y otras lenguas regionales 4 El MEDAR (Mediterranen Arabic Language and Speech Technology) Project gestiona la cooperación internacional entre la UE y la región del Mediterráneo en relación al desarrollo de Human Language Technology (HLT), recursos lingüísticos y herramientas para el procesamiento del lenguaje para el árabe. 5 ELRA (European Language Resources Association) tiene como misión fomentar los recursos lingüísticos para el sector de la Human Language Technology (HLT), así como evaluar las tecnologías de la ingeniería del lenguaje. Para ello ofrece servicios como: identificación de recursos lingüísticos; producción, validación, evaluación y distribución de los mismos; estandarización. 6 ELDA (Evaluations and Language Resources Distribution Agency) es el ente legal y operacional de ELRA. Se dedica a supervisar la ejecución de los proyectos de ésta, así como a gestionar la distribución de sus recursos lingüísticos. 3 Leeds Internet Corpora (desarrollado por Serge Sharoff de la Universidad de Leeds y disponible en: http://smlc09.leeds.ac.uk/query-ar.html), el arabiCorpus (desarrollado por Dilworth Parkinson de la Universidad de Brigham Young y disponible en: http://arabicorpus.byu.edu/), que trataremos en detalle en el siguiente epígrafe, y el The Quranic Arabic Corpus (disponible en: http://corpus.quran.com/). Este último es un proyecto de Kais Dukes de impresionante envergadura pues se trata de un corpus anotado mediante el cual se puede analizar exhaustivamente la gramática, la sintaxis, la morfología y la semántica de El Corán. Sin duda, la aplicación JavaAPI (JQuranTree), el diseño (tipografías, uso de colores, gráficos, etc.) y los recursos (treebanks, hipervínculos, campos ontológicos, etc.) que Dukes ha utilizado maximizan de forma única la visualización y el análisis de las búsquedas. Finalmente, cabe destacar tres proyectos léxicos de gran envergadura. En primer lugar, el proyecto del profesor Samy Boudelaa Aralex (http://www.mrc-cbu.cam.ac.uk:8081/aralex.online/login.jsp), una base léxica de 40 millones de palabras y 37.494 entradas lexicográficas que proporciona información cuantitativa de las palabras y los morfemas del árabe clásico. En segundo lugar, el todavía no finalizado International Corpus of Arabic, un proyecto encabezado por el profesor Sameh Al Ansary de la Universidad de Alejandría en colaboración con el Ibrahim Shihata Arabic UNL Center de la Bibliotheca Alexandrina. Se prevé que el ICA, según sus diseñadores, sea un corpus representativo de la lengua árabe, con lo que contendrá cerca de 100 millones de palabras, cubrirá diversos tipos de textos provenientes de todos los países árabes y su software permitirá aplicar diversos métodos de búsqueda. Finalmente, el Modern Written Corpus of Contemporary Arabic (MWcoca), también en desarrollo, cuyo compilador, el doctorando en la Universidad de Lancaster Safwat Ali Saleh, prevé que contenga un billón de palabras extraídas de periódicos, revistas y sitios web durante los últimos diez años. 4. El arabiCorpus El corpus que hemos elegido como herramienta de trabajo es el Arabicorpus, compilado y diseñado por el profesor Dilworth Parkinson de la Universidad Birgham Young en EE. UU. Las razones que han motivado esta elección son varias. En primer lugar, se trata de un corpus en línea y gratuito, características que facilitan enormemente no sólo su uso por parte del profesor en el aula sino que además incentivan al estudiante a utilizarlo de forma autónoma en su casa, requiriéndose para ello únicamente una conexión a internet. En segundo lugar, es un corpus que trae incorporado un software para realizar búsquedas de diferente tipo de una forma accesible, clara y que no requiere conocimientos informáticos avanzados. En tercer lugar, contiene un número de palabras suficiente (cerca de 69 millones) como para sacar conclusiones relevantes a partir de los resultados de las búsquedas. Finalmente, consideramos también ventajosa la posibilidad de este corpus para realizar las búsquedas tanto mediante caracteres árabes como latinos (el arabiCorpus incluye su propia tabla de transcripción)7. 7 Al inicio, especialmente para aquellos que aún no estén familiarizados con los corpus, las instrucciones de uso pueden resultar algo abrumadoras, por lo que recomendamos seguir el tutorial que Parkinson facilita a los usuarios así como leer atentamente la sección de ‘preguntas frecuentes’. 4 El arabiCorpus se subdivide en subcorpus de varios tipos: prensa, literatura moderna, novela, ciencias medievales, El Corán, Las Mil y Una Noches, etc. Los resultados del arabiCorpus se presentan en siete secciones, las dos últimas de muy reciente incorporación: summary, citations, subsections, word forms, words before/after, collocates y download citations. La primera subsección presenta un resumen de las características de nuestra búsqueda (la KWIC8, el subcorpus en el que hemos buscado, cuánto tiempo ha tomado la búsqueda, etc.) y dos datos cuantitativos que pueden resultar útiles en la enseñanza del árabe: el total de veces que la palabra aparece en el subcorpus y el porcentaje de aparición de ese lexema cada cien mil palabras. En la siguiente subsección, citations, aparecen las citas de la KWIC con diez palabras como máximo a cada lado y con un máximo de 100 citas por página. Los resultados pueden visualizarse bien según el orden alfabético de la palabra que viene antes o el de la que viene después. Para visualizar la cita completa hay que pinchar sobre el número que aparece en el extremo izquierdo, mientras que en el derecho, aparece la subsección del corpus en la que aparece la cita. Imagen 1. Subsección summary del arabiCorpus. Imagen 2. Subsección citations del arabiCorpus. En subsections encontramos información acerca de la frecuencia de uso de un lexema en una obra determinada. Este recurso puede ser útil si comparamos, por ejemplo, el uso de ciertos giros y expresiones por un autor basándonos en su sexo u origen geográfico. No obstante, se trata de la única subsección que carece de hipertextualidad pues no ofrece la posibilidad de pinchar sobre el nombre de la fuente para obtener los resultados. En la subsección word forms aparece el número de formas en las que la KWIC aparece en el corpus y, en este caso sí, podemos pinchar sobre cada una para visualizar los resultados de forma agrupada. Esta sección es especialmente útil para comparar el uso de distintas formas personales verbales o para observar el uso del artículo con una determinada palabra. 8 KWIC (key word in context) es la palabra que introducimos en el cuadro de búsqueda y que aparecerá centrada en las líneas de concordancia. 5 Imagen 3. Subsección subsections del arabiCorpus. Imagen 4. Subsección word forms del arabiCorpus. Word before/after y collocates pueden ser consideradas dos subsecciones complementarias. En aquélla obtenemos una lista de aquellas palabras que aparecen a cada lado de la KWIC por lo menos dos veces; en ésta, una lista de las cuatro palabras que aparecen a cada lado del KWIC un mínimo de cuatro veces. Sin duda, esta sección es una cuya explotación para crear material didáctico es de las más recurridas. Imagen 5. Subsección words before/after del arabiCorpus. Imagen 6. Subsección collocates del arabiCorpus. Finalmente, en la subsección download citations el usuario se puede descargar la lista completa de citas en un documento tab-delimited (txt) en el caso de que desee sacarle partido de forma personalizada. 5. Aplicaciones de la LdeC en la enseñanza de lenguas Las primeras aplicaciones de la LdeC en el campo de la enseñanza de lenguas se centraron en la elaboración de listas de frecuencia de palabras (Thorndike, 1921 y Palmer, 1933) y no fue hasta mediados de la década de los 80 que empezaron a utilizarse las concordancias en el aula en el marco del llamado data driven learning (Johns, 1986 y 1991). En la década de los 90 los corpus empezaron a explotarse para la elaboración de diccionarios de estudiantes y, posteriormente, su manejo se fue extendiendo de forma gradual en la elaboración de numerosos 6 materiales didácticos y diseños curriculares, generalmente los que atañen a las lenguas de más divulgación didáctica (§ 2). Los artículos y libros dedicados a explicar el potencial de aplicación de la LdeC a la enseñanza de lenguas extranjeras son numerosos (por citar algunos: Anderson y Corbett, 2009; Altenberg y Granger, 2001; Biber, 1988 y 1993; Biber, Conrad y Reppen, 1998; Biber y Reppen, 2002; Conrad, 1999; Csomay, 2005; Flowerdew, 2001; Flowerdew, 2005; Gilmore, 2004; Hunston, 2005; O’Keefe, McCarthy y Carter, 2007). En primer lugar, la ventaja fundamental derivada del uso de los corpus reside en el hecho de que éstos nos aportan una evidencia empírica acerca de nuestras intuiciones sobre la lengua, evidencia que puede utilizarse para ratificar, matizar o rebatir esas intuiciones mediante los resultados obtenidos. La contribución, por tanto, que la LdeC ha aportado a la descripción de la lengua que enseñamos es (o puede llegar a ser) incuestionable. En segundo lugar, los corpus pueden aportarnos información acerca de aspectos de la lengua que antes no habían llamado nuestra atención como docentes de árabe, como es el caso de la frecuencia de aparición de lexemas, la frecuencia de elementes prefabricados o chunks, la saliencia (salience) de ciertos elementos lingüísticos y de patrones léxicogramaticales, etc. De esta forma podemos diferenciar mejor entre reglas meramente probabilísticas y otras más deterministas del árabe. En tercer lugar, la información empírica que nos proporcionan los corpus puede guiar a los profesores de lenguas extranjeras a la hora de priorizar ciertos ítems léxicos (ya sea por su frecuencia o por su significancia) frente a otros [¿por qué empeñarse en enseñar la conjugación de ّ (fallecer) en presente si es un verbo que se utiliza sólo en el pasado de su forma pasiva?], así como a la hora de secuenciar los contenidos de los materiales didácticos (¿debemos introducir primero ‫ ا‬o ‫رع‬ ‫)?ا‬. En este sentido, varias investigaciones han demostrado que existe un elevado nivel de disparidad entre la lengua que presentan los materiales didácticos y la lengua usada por los hablantes (Biber y Reppen, 2002; Carter, 1998; Frazier, 2003; Gilmore, 2004; Glisan y Drescher, 1993; Holmes, 1988; Lawson, 2001; O’Connor Di Vito, 1991; Walz, 1989;) y que, si los diseños curriculares se basaran más en la evidencia de los corpus, disminuiría este contraste. Los aprendices, por su parte, se benefician asimismo de la LdeC pues fomenta los procesos que intervienen en la adquisición de las formas de los lexemas y en el mapeo forma-significado del lexicón. En cuarto lugar, los corpus nos aportan información de tipo cualitativa acerca de aspectos tales como la variedad de registros de una lengua (en particular cómo ciertos elementos lingüísticos se comportan en determinados contextos y situaciones de uso), variedades dialectales, estilos de escritura, comparación entre lenguaje escrito y oral, lo cual deberías hacernos reflexionar acerca de cómo podemos presentar la lengua enmarcada en los contextos y formas frecuentes de uso (¿podremos superar a Zayd y Amru?). En quinto lugar, las técnicas de búsqueda en los corpus y su aplicación en la enseñanza de lenguas estimulan tanto el aprendizaje directo (mediante las actividades en sí) como el indirecto (mediante la exposición a cantidades de input en contexto). No obstante, a pesar de todo el potencial que los corpus nos pueden ofrecer en el campo de la enseñanza de lenguas, no podemos obviar que existen también varios factores que provocan cierto recelo entre los docentes a la hora de animarse a utilizarlos. Probablemente el aspecto más desmotivador para los docentes de árabe sea la necesidad de formación y familiarización con los mismos, pues carecemos en España de una formación 7 específica al respecto9. Tal como recalcan Maddalena (2001) y Breyer (2008) la formación es absolutamente necesaria para ser capaces de usar correctamente los corpus, seleccionar la información adecuada y la cantidad justa para no sobresaturar a los estudiantes que, de lo contrario, pueden sentirse abrumados por tanta información (Conrad, 1999). Este último punto es básico para suscitar el entusiasmo acerca del uso de los corpus a los aprendices. El profesor, por su parte, debe aprender a adoptar un papel de facilitador de actividades que fomenten el aprendizaje autónomo y la búsqueda de conocimiento. Aparte de la formación de LdeC, lo ideal sería que los profesores se nutran de la literatura que versa sobre el enfoque léxico para la enseñanza de lenguas (Willis, 1990; Lewis, 1993, 1997 y 2000), pues está estrechamente relacionada con la explotación de los corpus en el aula. En segundo lugar, ciertas prácticas de la LdeC han recibido críticas directas por parte de la comunidad científica. En concreto, al DDL (Johns 1991), que se basa en el análisis de concordancias para hacer que los estudiantes descubran patrones léxico-gramaticales, se le ha reprochado el hecho de centrarse demasiado en la forma, pues ello entra en contradicción con el enfoque comunicativo y por tareas que ha imperado en los últimos tiempos en la enseñanza de lenguas (Kennedy, 1992). Por este motivo algunos investigadores y profesores han preferido optar por basarse en metodologías con un enfoque top-down y en ejercicios centrados en el discurso en vez de en estructuras lingüísticas formales (Simpson-Vlach y Sheryl, 2006). Un tercer motivo que, si no desmotiva por lo menos limita la aplicación de los corpus en la enseñanza de lenguas, es la dificultad de poder utilizarlos en todos los niveles debido a que la mayoría de ejercicios son más adecuados para explicar y ejemplificar estructuras y léxico que pertenecen a un nivel igual o superior al B1 del Marco Común Europeo de Referencia (2002). Un cuarto factor desmotivador es que el mercado no ofrece materiales para la enseñanza del árabe basados en la investigación con corpus, por lo que el docente tendrá que emplear el tiempo y dedicación necesarios para diseñarlos (previa formación adquirida). Finalmente, antes de finales este apartado, quisiéramos aportar algunas sugerencias que creemos deberían ser tomados en cuenta por aquellos docentes que no estén familiarizados todavía con la LdeC y se planteen empezar a utilizarla en sus clases: • Con estudiantes poco familiarizados con los corpus, limitar el número de búsquedas manualmente (repartir fotocopias en vez de utilizar el buscador original). • Con estudiantes ya familiarizados con la LdeC, utilizar corpus en línea preferiblemente gratuitos (arabiCorpus o Arabic Gigaword corpus). • En una primera fase, minimizar el número de actividades abiertas y de tipo holístico; aumentar las que impliquen una mayor concreción en estructuras específicas de la lengua. 9 Nos referimos en los departamentos de árabe y no en los de lingüística, donde sí se ha llevado a cabo cierta investigación teórica ([destacamos el trabajo del Laboratorio de Lingüística Automática de la Universidad Autónoma de Madrid (http://www.lllf.uam.es/ESP/), con Sandoval y Samy como investigadores principales. 8 • Sin embargo, incluso en niveles más avanzados, tratar de no limitar las actividades a aquellas basadas en el mero análisis de datos derivados del corpus sino ampliarlas para tomar conciencia de aspectos más globales como el discurso o el contexto situacional. • No radicalizar el uso de los corpus sino presentarlo como una herramienta que complementa otros recursos más tradicionales como el diccionario o las gramáticas. • A la hora de diseñar actividades basadas en corpus, tomar en cuenta el nivel de los estudiantes, su perfil cultural y su edad. • Conviene asimismo tratar que las actividades sean llevadas a cabo en parejas para fomentar la discusión metalingüística entre los aprendices. 6. Actividades para el aula de ALE basadas en la LdeC En el caso del árabe los pioneros en la explotación de los corpus (entendidos desde el punto de vista de la lingüística moderna pues la lexicografía árabe clásica ya se basaba en vastos corpus) han sido también los lexicógrafos (Buckwalter y Parkinson 2011; Guidère 2003; Hoogland et alii 2003; Hoogland et alii10; Parkinson 2006; van Mol y Berghman 2001) -paradójicamente todos de origen extranjero. Sin embargo, la producción de materiales y diseños curriculares para la enseñanza del árabe -ya sea como lengua nativa, segunda o lengua extranjera- sigue estando teñida de un corte esencialmente tradicionalista en lo que al uso real de la lengua se refiere. Esto queda patente, por un lado, en la organización de los contenidos en los currículos del árabe, donde se sigue apostando por la secuenciación de conceptos gramaticales de una forma fuertemente arraigada en una concepción clásica y estática de la lengua; y, por otro lado, en la ausencia de referencias a aspectos del uso de la lengua generados a partir de la explotación de corpus. Con esto no queremos decir que los libros de texto no se sirvan de materiales auténticos sino que las explicaciones y actividades que se derivan de ellos no dejan de ser creaciones ad hoc basadas en la intuición de su(s) autor(es) para trabajar estructuras concretas. La única referencia a la frecuencia de aparición de ítems de vocabulario que hemos encontrado es Carandell et alii (2008 2ª ed.), donde los autores, basándose en la lista de Landau (1959), clasifican la relevancia de las palabras de los glosarios en cuatro niveles. En conclusión, el campo de la EALE necesita de avances en esta dirección y, aunque la aportación de este artículo podríamos considerarla simbólica, esperemos que estimule la investigación mediante la exploración de corpus para enseñar árabe en nuestro país pues ello ayudaría a entender y desvelar aspectos de la lengua árabe hasta ahora ignorados. Esperamos que las actividades que presentamos a continuación, aunque escasas por la limitación de espacio en la presente publicación, ejemplifiquen de forma convincente e inspiradora algunas formas en que los profesores pueden usar los corpus y usarlos para desarrollar actividades afines para el aula de ALE. 10 La elaboración de este diccionario está en proceso y será publicado por Oxford University Press. Está basado en el Arabic Gigaword corpus, para el cual se puede solicitar el acceso a Peter Whitelock en: pete.whitelock@oup.com (Jan Hoogland, comunicación personal). 9 6.1.Gramática inductiva para entender ُ Una de las técnicas más explotadas en el uso de los corpus para la enseñanza de lenguas es, junto con la colocabilidad, la gramática inductiva, en la que partiendo de datos empíricos se puede generalizar acerca de la función sintáctica o el significado de un lexema. En la actividad que proponemos a continuación hemos tomado el ejemplo de la partícula ُ : su significado y su entorno gramatical, pues se trata de que el estudiante llegue a la conclusión de que ُ requiere ser precedida por una partícula negativa (A.1). A continuación, debido a la similitud gráfica con la partícula َ en los textos no vocalizados, creemos oportuno que el estudiante compare las diferencias entre ambas así como sus entornos (partícula negativa precediendo a ُ y masdar después de َ ) (A.2). A.1. Observa las siguientes líneas de concordancia. ¿Qué crees que significa la partícula ُ ? ¿Qué generalización puedes sacar respecto a su uso? ْ ‫ا ا‬ !" ‫ و ت‬%" ‫! ء‬ ! ‫ ا‬45 ) ‫ و ي‬/ '; ‫" " رھ‬ ‫ اد‬+ ‫=* ا‬ ‫؟‬.. C‫َ"* أ@ـ‬ -F G E H ‫ا ﱡ‬ 'J. ‫' ا‬E= K( / ً- M‫ ا‬N َ/ ' ‫د ا )( ت‬ ُ ُ ‫ة‬ ُ ُ ُ ُ ُ ُ ‫ـــ ـ‬ *' +" ', -'./ "0‫ ة ا‬1 ‫ ت ا‬/0 ‫ ان وا‬/‫ان ا‬ 7 ' ,‫ أ‬:ِ ‫ أدري‬0 ‫أ ' ء‬ >? ‫ا' @ن‬ ‫ ـ ا‬E ‫!أ ـ‬ ‫أُ( ّ ر‬ ‫ل‬Pْ+ُ/ ;‫ال وا‬QF A continuación, compara las siguientes líneas y decide acerca de cuándo se trata de ُ ْ َ y cuándo de َ ْ َ . ‫ ؟‬J‫'ﱢـ ي أ@ ـ أ@ــ‬F / -'M '+% ‫ وا‬-'%‫' ات ا ط‬U ‫ ا‬V'; *" ‫دة‬0 ‫ا‬ Y ‫ ل =! ا‬M ;‫ و ة ا >=' ا ا‬E= " = 40 ‫" ور‬ ‫)ق‬5@) ‫ رأي‬-' / ‫ا‬ F ‫ رة‬J ‫ا‬ ‫ ا ^ اء‬-; F ‫ درة‬U" ‫ ة‬.! ‫ ط` ا‬5! ‫ ر ا‬J ‫ د‬1 ‫ا‬ ‫ ت‬. ‫ ي إذا‬. d@P 'F / ، ‫أ رك‬ ‫م‬X‫ ا‬- ; K / Hُ! -"‫ ا‬. ‫ [ رة ا‬:‫;]ار‬ ‫ رة‬M H / +; " ‫ ر‬Y -' ‫ ة ا‬5_ ‫" ھ ا‬ " ‫' ت‬E = -" ‫' ت ھ‬Y ُ ( -'"‫أم د‬ eP ‫ أ‬d( ‫ ' ا‬dE Figura 1. Ejemplo de actividad inductiva. 6.2. Deducir la gramática en activo: la partícula ّ ; Parte de la complejidad que para un aprendiz de árabe supone adquirir la partícula ّ ; viene determinada por el amplio abanico de usos que conlleva, los cuales en ocasiones pueden incluso resultar semánticamente contradictorios. En los libros de texto o gramáticas tradicionales suelen introducirse los distintos significados de esta partícula seguidos de uno o dos ejemplos de cada tipo de uso, lo cual no sólo denota un acercamiento gramatical deductivo sino que también delega al estudiante a una actitud de observador o receptor de información meramente pasivo. 10 A diferencia de la actividad presentada en 6.1, en este caso tal vez no sería conveniente optar por un enfoque inductivo pues para ejemplificar suficientemente cada uso de ّ ; correríamos el riesgo de abrumar al aprendiz con demasiadas líneas de concordancia. No obstante, aun manteniendo un enfoque deductivo, sí es posible hacer que el estudiante se implique de forma más activa en la búsqueda de los significados de ّ ;, para lo cual el contexto juega un rol determinante. Además, la información sobre la frecuencia de aparición de cada uso de ّ ; puede arrojar luz sobre qué usos conviene priorizar y enfatizar a la hora de explicar (y entender) esta partícula. La siguiente actividad se gradúa en cuatro pasos. En primer lugar, el docente explica las funciones sintácticas de ّ ; así como sus usos semánticos (B.1). A continuación, ya sea directamente con un ordenador o mediante la entrega de materiales fotocopiados, el grupo observa una serie de líneas de concordancia para tratar de adivinar qué uso de ّ ; se hace en cada una de ellas (B.2). En tercer lugar, el profesor divide a la clase en grupos y les pide que busquen tres ejemplos de cada uso en el corpus. En el caso de ser una actividad para hacer en casa, se puede pedir que cada uno encuentre un par de ejemplos de cada (B.3). Finalmente, se le pide al estudiante que focalice su búsqueda en el subcorpus de prensa para ver qué uso(s) es el más frecuente en el mismo (B.4). B.1. A continuación te presentamos algunos usos de la partícula ّ ;: B.2. En la siguiente lista de concordancias, ¿podrías adivinar de qué usos de la partícula ّ ; se trata en cada caso? -h ‫ ا‬62 ‫ دل‬/ " 4' *" ‫ ا ^ ا ? ري‬4E5" i" @ ! ‫ " ] ء ا‬d . " d@ e‫و‬ .-@ ?" ‫ن‬j‫ا‬ -'@ 5/ ! ‫ ا ! ا‬d ‫ و" زا‬، ‫* ھ‬M : '@ 5/ % *= 0‫و‬Q+" e ; ‫ ن‬./ ‫ن‬P 7 -Y _ ‫ ا‬: '; -.E ‫ " رد ا‬:+%@ ‫ رد‬/ ‫* أن‬. / '!‫' ط‬, ‫ ن‬+@‫ه إ‬Q5m "‫ إ‬-= ‫'* ا‬E" ‫ ا‬K @ *" Je‫ ن ا‬e ‫ ' ت‬+ ‫أول ا‬ 7@‫ ا‬7 %./ *" ‫' رة‬F E= dE ;‫ و‬n1 ‫ ا‬7% ; ‫و‬ oU ‫ ا‬% ،-%E." *. ‫ و‬،‫ ظ ة‬-"‫' " و‬N -‫ن‬j‫ا‬ d1?@ . ‫' ھ‬Y‫ ر‬-' Y ; ‫ أر‬7 ‫ ات ذ‬G = 1 F - (X‫ ا‬E= - ‫ أو‬، " E " ‫ ا‬K' @ ‫' أو‬% +@ -*'=‫ ا د‬m‫ آ‬- ‫ وع‬5" ‫ م‬e ‫ أو‬، 'E1 ‫ أو =! ا‬،‫=! ا ھ ب‬ . '%. ‫]ا ا‬ ^/ 0 :@s - -F‫ ودرا‬-/‫ روا‬HY -V/ 1 ‫ ا ان ھ]ا ا‬:! @ @ .‫ وا; ة‬-( " M ‫ >اء ا‬F‫)ل وا‬U F0 ‫ ا اط* ھ‬H! /‫اط* و‬ .1 / ‫ ؟‬- ‫ "* ا و‬Je‫ ا ل أ‬:/ M ‫ھ ا‬ . . ‫ ا‬t ." ، %+ ‫ ا‬tG ;‫ و‬، ‫ا زل‬ />_ ‫ و‬، ‫ ر و‬+' ‫ا‬ 11 -/>"‫ ر‬/ 4" d@‫ ^ وا ؟ أم أ‬F‫* ا‬/] ‫ ل ا‬%‫ط‬X‫ ر ا‬Y !!*5! ‫ خ ا‬% @‫ ا‬t ? != ‫ ل‬0‫ ا‬v/ ‫ا _ رج =* ط‬ * G ‫ أ‬4" *EY‫ ا‬/ d@ @0‫ا‬ ».‫ اره‬F‫ د ا‬-' " ‫ ت‬Y *" @ = ‫ان‬ ‫' وﷲ‬F / :d (‫ م و‬/X‫ " "* ا‬/ -/‫ ? ر‬dE m‫ا ? ز ا‬ : 1Y‫ وأ‬:G‫وزرا‬ ;‫ أ‬:@‫ ل [ إ‬M ‫; "* ا‬X M‫>و‬/ ‫ ب‬X‫ ا‬7 ]e‫ و‬-%E _ ‫@ ا= ا‬P ‫ ت‬/ ‫ ا‬-F‫ر‬ ‫! ر‬. ‫ا‬ ‫"ن‬ . ; E= ( % ‫ "* ا‬Je‫ أ‬:'E= *' %^" e .*' " Y ‫ ر‬U ‫ا‬ ‫و@ ء‬ ، ‫ ا‬E= ‫ء‬ e ^@ 4" d@‫ ھ أ‬، ... ' ./‫ ر‬e‫! و‬m /d@ @0‫ ا‬/ =‫ م و ( ا‬E= * E ‫ ء و أ" ت‬+@ ‫و‬ ،‫' ة‬U ‫ وا‬-5F ‫ ا‬-;) ‫ ت ا‬e N "‫ا_ "ت ى‬ ‫ "* ا ار‬e t; /‫ = ھ و‬H! ‫ و‬+ ‫ا ? ز‬ :'E= />/ 0 " `% ‫' ة و=>ة ا‬U ‫ وا‬-( 1 ‫ "* ا‬: 1 ‫و‬ ‫ ل وا ^! ب‬%‫ط‬X‫ ا‬vE5 / ،K' ‫ا‬ 4' ? ‫ ' ا‬V!E/ ‫ ب ا‬5_ ‫ ا‬-= F ‫ ءت‬M‫و‬ B.3. Con la ayuda de un corpus encuentra tres ejemplos de cada uno de estos usos y justifica tu elección. ‫ﺮ‬ ‫ّﻰ‬ ‫ﺮ‬ ‫ﺎ‬ ‫ﺪء‬ ‫ﺮ‬ ‫ّﺮ‬ ‫ﺮ‬ B.4. ¿Cuál crees que es el uso que más abunda en el lenguaje de prensa? Figura 2. Ejemplo de actividad deductiva. 6.3. Colocar verbos, colocar adjetivos Probablemente uno de los fenómenos léxicos que más frecuentemente se explota a través de los corpus sea el de las colocaciones, ya sean gramaticales o léxicas. Esta inclinación por detectar y subrayar las frecuentes asociaciones que existen entre las palabras se ha desarrollado considerablemente tras el surgimiento del enfoque léxico al inicio de la década de los 90, enfoque que concibe la lengua como la suma de elementos fraseológicos (chunks) y no únicamente como la superposición de palabras tal y como tradicionalmente las entendemos. El aporte que en este sentido puede darnos la búsqueda de colocaciones en un corpus es determinante, por un lado, para los docentes nativos del árabe -pues, aunque sea su lengua nativa, la velocidad con la que actúa la intuición humana no puede compararse con la de un ordenador-, pero sobre todo lo es para los docentes no nativos, pues para ellos puede resultar más difícil determinar qué pares de palabras son más significativos que otros y, por tanto, de más peso en la enseñanza del árabe. En la actividad C.1 hemos seleccionado una serie de verbos con diferentes niveles de colocabilidad léxica con el fin de que el estudiante: a) se familiarice con el concepto de colocación; b) busque tantos colocados como pueda para cada verbo; y c) se percate de la relación inversamente proporcional entre la frecuencia de una palabra y el nivel de lexicalidad de la misma (Lewis, 1997: 23). Este tipo de ejercicios brindan asimismo una buena ocasión para explicar la existencia de los verbos11 y sustantivos delexicalizados en árabe, los cuales se caracterizan por 11 Para una lista de verbos soporte o delexicalizados en árabe ver Ibrahim (2002). 12 tener un significado muy amplio que se concretiza únicamente al combinarse con otro lexema (por ejemplo: ... / ‫ط‬/ /0 J"/oG 1 ‫ب ا‬ , etc.). C.1. A continuación te presentamos una lista de verbos. Averigua cuáles tienen mayor colocabilidad y con qué palabras suelen coocurrir. Anótalas teniendo en cuenta su frecuencia de coaparición junto con el verbo. ... ‫إ‬ ‫ﺮ‬ ‫ﺮ‬ ‫ﻮ‬ ‫ﺮ‬ ّ ّ‫ﺮ‬ Figura 3. Ejemplo de actividad con colocaciones (verbos). Igualmente interesante desde el punto de vista de la combinatoria léxica resulta trabajar con los colocados de la colocación (y no con la base, como en la actividad anterior). Por ejemplo, en la actividad D.1 la idea es la opuesta a la de la actividad anterior, pues se trata de asignar a cada base un colocado posible. De esta forma el aprendiz aprende a identificar los matices de sentido entre palabras con un significado similar (y en especial los adjetivos). D.1. Basándote en un corpus del árabe, asigna (uno o más de) los adjetivos de los círculos a los sustantivos que están a la derecha: ‫رّار‬ ‫م‬ ‫ي‬ ّ ‫و‬ ‫ھ ل‬ ‫ظم‬ ‫را‬ ‫ّن‬ ‫ظم‬ ‫ا زام‬ ‫رز‬ ّ ! Figura 4. Ejemplo de actividad con colocaciones (adjetivos). 6.4. Expansión léxico-semántica: amasar las palabras La siguiente actividad tiene cierta relación con la actividad anterior en tanto en cuanto atañe a los cuasisinónimos. En este caso, sin embargo, se hace hincapié en el abuso de la utilización de ciertos ítems de vocabulario que, habiendo sido adquiridos en las etapas iniciales del aprendizaje, se convierten en fósiles léxicos que el estudiante utiliza de forma recurrente en detrimento de la variedad léxica. La consecuencia directa de esta 13 fosilización y sobreuso de palabras básicas en contextos múltiples es que la lengua de los aprendices, incluso la de aquellos que ya han alcanzado un nivel B1 o superior, sufre un acusado empobrecimiento. Por este motivo, en clases de niveles B1 en adelante, resulta necesario dedicar sesiones a expandir cualitativamente el mapeo léxico-semántico de los aprendices a través la búsqueda de nuevos lexemas que representen campos semánticos amplios: grandeza (...‫ رز‬،4G‫ را‬،‫ " ز‬، 'N=), calidad ( _ ،>ّ' " ،*+; ، ّ'M), maldad (... ّ " ، ' ; ، /ّ ،‫ ء‬F), idoneidad (... G)" ،tF "), intensidad (...KّJ." ،>eّ " ، / ،‫)( ي‬, etc. En el caso del ejercicio E.1. hemos tomado la palabra '!e, un adjetivo de cuyo uso los estudiantes suelen abusar tanto en textos orales como escritos, incluso una vez superado el nivel intermedio-alto. Lo que haremos es presentarles en la columna derecha combinaciones léxicas ‘empobrecidas’ por el adjetivo '!e y pedirles que, con la ayuda de un corpus, encuentren la palabra que realce esa expresión. En niveles más avanzados puede incluso pedírseles que busquen también la expresión antónima (columna izquierda). Conviene advertir que en este tipo de ejercicio, en aras de rentabilizar al máximo el input que recibe el estudiante, la selección por parte del profesor de las bases de las combinaciones (los sustantivos) deberá centrarse en lexemas de alta coaparición. E.1. A menudo utilizamos adjetivos demasiado vagos para describir aspectos de nuestra vida diaria. Éstos son útiles porque tienen una aplicación muy amplia pero empobrecen nuestro lenguaje pues dejamos de utilizar la palabra precisa que los describe. Con la ayuda de un corpus busca el sustituto más adecuado de continuación intenta dar con la expresión antónima. ‫ﺎ ّد‬ ‫ﺮ‬ _________ ّ _________ ‫ﺸ ﺔ‬ _________ _________ ‫أ‬ _________ ‫ﻮ ﻮ‬ : ‫ﻮ‬ ‫أ‬ _________ ّ _________ ‫ﺸ ﺔ‬ _________ _________ ‫أ‬ _________ ‫ﻮ ﻮ‬ '!e en las siguientes expresiones. A : ‫ﻮ‬ ‫ﺎد أ‬ ‫ّ ﺮ‬ ‫ﺸ ﺔ ﺮ‬ ‫ﺮ‬ ‫ﺮ‬ ‫أ‬ ‫ﺮ‬ ‫ﻮ ﻮ‬ Figura 5. Ejemplo de actividad para la expansión léxico-semántica. 6.5. Subcorpus El objetivo de la actividad F.1. es el de mostrar a los estudiantes el potencial que puede tener un corpus si lo utilizamos de forma comparativa. En este caso, hemos tomado un adjetivo, *m F, con un marcado contraste entre su uso literal y el figurativo, aquél en el subcorpus de literatura moderna y este último en el de lenguaje de prensa. Así, mientras que en el primer caso se combina exclusivamente con lexemas relacionados con la temperatura del agua (con ‫ " ء‬doce veces y con ‫ ; ّ م‬seis), en el caso del subcorpus de prensa la mayoría de combinaciones ocurren con sustantivos abstractos. 14 F.1. Comprueba la colocabilidad del adjetivo *m F, primero en el subcorpus de literatura y luego en el de prensa. ¿Qué puedes decir acerca de los resultados? ¿Crees que ‫ رد‬puede tener unos resultados similares? Subcorpus de prensa Subcorpus de literatura moderna 417 "# ‫ا‬ 6 85 $# ‫ا‬ 4 82 ‫ا ط ردة‬ 3 74 ‫ا !ط‬ 3 66 ‫ا )ت‬ 2 61 ‫!ط‬ 52 *+‫وا‬ 51 ‫ا ء‬ ‫ء‬ ‫ء‬ ‫م‬ ‫وا‬ ‫ت‬ 45 ,) 44 ‫طق‬ ‫ا‬ 42 40 ‫أ داث‬ 33 ‫ داث‬0‫ا‬ 31 ‫ا ء‬ 30 # 29 ‫وار‬ Figura 6. Ejemplo de actividad sobre subcorpus. 6.6. Colocaciones temáticas Si en la actividad E.1. se trataba de expandir el mapeo léxico-semántico de ciertas unidades léxicas anquilosadas, en esta actividad (basada en McCarthy y O’Dell, 2005: 84) proponemos una incursión a lo largo y ancho de la geografía léxico-semántica del concepto de d(‫و‬. En realidad más que una actividad lo que presentamos a continuación es un esquema que precedería a una serie actividades (rellanar huecos, relacionar dos partes de una oración, relacionar lexema y significado, elección múltiple, etc.) basadas en él y en las que el aprendiz debería contextualizar las expresiones presentadas (actividades que no hemos incluido debido a la falta de espacio). El esquema de presentación de estas combinaciones léxicas se divide en tres columnas. En primer lugar, la columna derecha incluye una serie de colocaciones frecuentes (que el profesor habrá buscado previamente en el 15 corpus) en las que se combina la palabra d(‫ و‬con verbos, adjetivos y adverbios. En la columna central se ejemplifica cada una de estas combinaciones con una o dos oraciones significativas y recurrentes tomadas del corpus. Finalmente, en la columna de la izquierda se incluyen los comentarios que sean útiles de cara a completar el significado lingüístico de la expresión, sobre todo aquellos relacionados con el uso real de esa combinación en el lenguaje: paráfrasis, definiciones, usos alternativos, usos habituales (por ejemplo, si un verbo suele utilizarse en forma negativa o imperativa), usos comunes pero erróneos, referencias al uso en el lenguaje oral, etc. Debido a la cantidad de texto que se presenta, en este tipo de esquemas es especialmente recomendable, además de negritas y cursivas, el uso de tipografías distintas para tratar de no sobrecargar la capacidad receptiva visual del estudiante y fomentar su potencial mnemotécnico. G.1. A continuación te presentamos una serie de colocaciones relacionadas son el concepto de tiempo que te serán útiles para completar los ejercicios de esta unidad. ‫ت‬ . ‫ﺔ‬ . ‫ل‬ ‫ﻮ‬ ‫ﻮ‬ ‫ﺎ ﺎ‬ ‫ﺎ‬ ‫أ‬ ‫ﺬ‬ ‫ﻮ‬ . ‫ﺸ ء‬ ‫ﻈﺮأ‬ . ‫ﺎ‬ ‫ﺎ‬ ‫ﺮ‬ ‫ﺎ ﺔ‬ ‫ﻮ‬ ! .‫ﺔ‬ ‫ﻮ‬ ‫ح‬ ‫ﺰ‬ ‫ﺎ‬ ‫ﺎﺋ‬ ‫طو‬ ‫رق و‬5 ‫ﺮ ﺎﺔ‬ ‫ﺎ‬ ‫ﺮ‬ ‫ﻰ ﺎء‬ ‫أ‬ ‫ﻮ‬ ‫ﺮح‬ ‫ﺮ‬ ‫ﺪد‬ ‫ﺔ‬ ‫ﺬ‬ ‫ﻮ‬ ‫ﺮ‬ ‫ذھب‬ ‫ﺪي ؟‬ ‫ﺮ‬ ‫ﺎ‬ ‫ﺮ ﺰ‬ ‫ﻮ‬ ‫؛‬ ‫ﻮ‬ ‫راوتو‬ ‫ﺋ ﺔ‬ ‫أ‬ ‫ﺔ‬ ‫ﺎأ‬ ‫) ﺎ ﺔ‬ .‫ﻈﺔ‬ ‫ﻐﺔ‬ ‫ﺔ‬ ‫ﺎ‬ .‫ﺔ‬ ‫ﺮ‬ ‫ب‬ ‫ﺔ‬ ّ ‫ﻮ أ‬ ‫ﻮ ﻮ‬ ‫ﺎ ﺸﺎ‬ .‫ﺎ ﺎ‬ ‫ﻆ‬ ‫د‬ ‫ ﺮ ﺔ ﺄ ﺬ‬:‫ﻮ أ ﺎ‬ .( ‫ﺎ‬ ‫ﻐﺔ‬ ‫ﺮ ﺎ ﺔ‬ ‫ﺬي‬ ‫ﺬي ﺮ ﺪ أ‬ ...‫ري‬+ ‫ وا " ر‬2 ‫ﺸ ء‬ . ّ ‫ﻮ‬ ‫زم ا‬ ‫ﻮ‬ ‫ﺎأ ﺎ‬ .‫ﺎ ﺔ‬ : ‫ﻮ‬ ‫؟‬ ‫ﺎ ﺸﺮ ﺎ‬ ‫ﺎح ﺪ ﺮ‬ ‫ﺎ ﺎ‬ ‫أ ﺪ‬ ‫ﻮ‬ ‫ ﻈ‬،‫ﺎ ﻰ‬ ! ‫ﺎء‬ ‫إن ا ر ا ر‬ .‫ط رة‬ ‫ﺮأ ﺬ‬ ‫ﺸ ﺔ‬ ‫ﻐ‬ ‫أ ﺎ‬/ ‫ﻰ‬ ‫ﺎ‬ ‫ﻮ‬ ‫ﻮ‬ ‫ﻮ‬ ّ‫ﻈ‬ ‫ﻐﺮ‬ ‫أ ﺬ‬ ‫ﺮ‬ ‫ﺎ‬ ‫ﺎ ؟‬ ‫ﻮ‬ ‫ﻮ‬ ‫ﺮ‬ ‫ﺬ‬ . ‫ﺎ‬ ‫أ‬ ‫ﺮ‬ .‫ﺎ ﺪ‬ ‫ﺮّ ﻮ‬ ‫ﻮ‬ ‫ﺬ‬ .‫ﻐﺎ ﺔ‬ ‫ﺮ‬ . ‫ا‬ ‫ﺮ‬ ‫ﺎ‬ ‫ﻮ‬ ‫ﻮ‬ ‫ﻮ‬ ‫ﻮ‬ ‫ ﻮ‬/ّ Figura 7. Ejemplo de actividad sobre colocaciones temáticas. 16 7. Conclusiones A pesar de que a lo largo de las últimas dos décadas la investigación y las aplicaciones la LdeC han cobrado una importancia destacada en el campo de la enseñanza de lenguas extranjeras, el árabe sigue sufriendo cierto rezago respecto a otras lenguas de mayor difusión pedagógica y editorial. No obstante, disponemos de un cierto número de corpus del árabe (privados y públicos) que permiten al docente utilizarlos como herramienta para complementar sus clases (currículos, programación, actividades) con técnicas basadas en la búsqueda de información lingüística a través de los mismos. Estas técnicas pueden centrarse en aspectos cuantitativos de la lengua (frecuencia de aparición, combinaciones léxicas, comparaciones léxicas intracorpus) o en aspectos cualitativos (fórmulas del discurso, estilo, entorno gramatical, gradación semántica entre cuasisinónimos) o en una combinación de ambos (patrones léxico-gramaticales, coligación, prosodia). Las actividades que hemos presentado en este artículo son una sugerencia –y, esperamos, un estímulo- para aquellos docentes que crean que es necesario basar la enseñanza del árabe en una metodología más acorde con el uso real de la(s) lengua(s) meta en contexto. Asimismo, conscientes de la carencia de oferta formativa y de materiales basados en la LdeC del árabe y, por tanto, del reto que un acercamiento a éste puede representar para los docentes del árabe en nuestro país, quisiéramos que este artículo sea una invitación al acercamiento y al uso de una herramienta que, sin duda, propiciará para muchos un camino para (re)descubrir la lengua árabe. BIBLIOGRAFÍA Referencias ALTENBERG, Bengt y Sylviane GRANGER. (2001): “The grammatical and lexical patterning of MAKE in native and non-native student writing”, Applied Linguistics 22, 173-94. ANDERSON, Wendy y John CORBETT (2009): Exploring English With Online Corpora. An introduction, Hampshire: Palgrave Macmillan. BENNETT, Gena R. (2010): Using Corpora in the Language Learning Classroom. Corpus Linguistics for Teachers, Ann Arbor: University of Michigan Press. BIBER, D. (1988): Variation across speech and writing, Cambridge: Cambridge University Press. BIBER, D. (1993): “The multi-dimensional approach to linguistic analyses of genre variation: An overview of methodology and findings”, Computers and the Humanities 26, 331-345. BIBER, Douglas, Susan CONRAD y Randi REPPEN (1998): Corpus linguistics: Investigating language structure and use, Cambridge: Cambridge University Press. BIBER, Douglas y Randi REPPEN (2002): “What does frequency have to do with grammar teaching?”, Studies in Second Language Acquisition 24, 199-208. BREYER, Yvonne (2008): “Learning and teaching with corpora: Reflections by student teachers”, Computer Assisted Language Learning 22(2), 153-172. BUCKWALTER, Tim. y Dilworth PARKINSON (2011): A Frequency Dictionary of Arabic. Core Vocabulary for Learners, New York: Routledge Language Learning. CARANDELL, Juan, Jaime SÁNCHEZ y Ahmed TEZITI (1998): Árabe de prensa (I y II). Método para la comprensión auditiva y escrita, Cuadernos 8 de la Escuela de Traductores de Toledo, Toledo: Universidad de Castilla-La Mancha. 17 CARTER, Ronald (1998): “Orders of reality: CANCODE, communication, and culture”, ELT Journal 52(1): 43–56. CONNOR, Ulla y Thomas A. UPTON (2004): Applied Corpus Lingusitics: a multidimensional perspective, Amsterdam, Atlanta: Rodopi. CONRAD, Susan (1999): “The importance of corpus-based research for language teachers”, System, 27, 1-18. Consejo de Europa (2002): Marco Común Europeo de Referencia para las Lenguas: aprendizaje, enseñanza, evaluación [disponible en: http://cvc.cervantes.es/ensenanza/biblioteca_ele/marco/]. CSOMAY, Eniko (2005): “Linguistic variation within university classroom talk: A corpus-based Perspective”, Linguistics and Education, 15(3), 243-274. FARGHALY, Ali (2010): Arabic Computational Linguistics, Chicago: University of Chicago Press. FILLMORE, Charles J. (1992): ‘ “Corpus linguistics” or “computer-aided armchair linguistics” ’, en J. SVARTVIK (ed.) Directions in Corpus Linguistics: Proceedings of Nobel Symposium 82, Estocolmo 4-8 Agosto de 1991. Berlin: Mouton de Gruyter: 35-60. FLOWERDEW, John (2001): “Concordancing as a tool in course design”, M. Ghadessy, A. Henry y R. Roseberry (eds.), Small Corpus Studies and ELT: Theory and Practice, Amsterdam: John Benjamins Publishing Company, 71-93. FLOWERDEW, Lynne (2005): “An integration of corpus-based and genre-based approaches to text analysis in EAP/ESP: Countering criticisms against corpus-based methodologies”, English for Specific Purposes 24, 321332. FRANKENBERG-GARCIA, Ana, Guy ASTON y Lynne FLOWERDEW (2011): New Trends in Corpora and Language Learning (Corpus and Discourse), Nueva York, Londres: Continuum Publishing Corporation. FRAZIER, S. (2003): “A corpus analysis of Would-clauses without adjacent If-clauses”, TESOL Quarterly 37(3): 443–46. GLISAN, E.W. y V. DERSCHER (1993): “Textbook grammar: Does it reflect native speaker speech?”, The Modern Language Journal 77(1): 23–33. GILMORE, A. (2004): “A comparison of textbook and authentic interactions”, ELT Journal 58(4), 363-74. GUIDÈRE, Mathieu (2003): Kalimat. Le vocabulaire arabe, Paris: Editions Ellipses. HAFIZ, Al-Taher. (2004): Al-Hafiz Dictionary of Arabic Collocations (Arabic-English). Beirut: Librarie du Liban. HOLMES, J. (1988): “Doubt and certainty in ESL textbooks”, Applied Linguistics 9(1): 21–44. HOOGLAND, Jan, Kees VERSTEEGH y Manfred WOIDICH (eds.) (2003a): Woordenboek ArabischNederlands, Amsterdam: Bulaaq. —— (eds.) (2003b). Woordenboek Nederlands-Arabisch, Amsterdam: Bulaaq. HUNSTON, Susan (2005): Corpora in applied linguistics. Cambridge: Cambridge University Press. IBRAHIM, Amr Helmy (2002): “Les verbes support en arabe”, Bulletin de la Société de Linguistique de Paris XCVIII(1), 315-352. JOHNS, Tim (1986): “Micro-concord, a language-learner’s research tool”, System 14(2), 151-162. —— (1991): “Should you be persuaded: Two samples of data-driven learning materials, English Language Research Journal 4: 1-16. KENNEDY, Graeme (1992): "Preferred ways of putting things", J. Svartvik (ed.) Directions in Corpus Linguistics, Berlin: Mouton de Gruyter: 335-73. LANDAU, Jacob M. (1959): A word count of Arabic modern prose, Nueva York: Spoken Language Services. LAWSON, Aaron (2001): “Rethinking French grammar for pedagogy: The contribution of French corpora”, Corpus Linguistics in North America, Ann Arbor: University of Michigan Press. LEWIS, Michael (1993): The Lexical Approach: The State of ELT and the Way Forward, Hove: Language Teaching Publications. 18 —— (1997): Implementing the Lexical Approach: Putting theory into practice, Hove: Language Teaching Publications. —— (ed.) (2000): Teaching Collocation: Further Developments in the Lexical Approach, Hove: Language Teaching Publications. LOMBARDO, Linda (ed.) (2009): Using Corpora to Learn about Language and Discourse, Oxford: Peter Lang. MADDALENA, Sean Romano (2001): “An investigation into how corpus analysis may be used in the second language classroom to solve some of the problems surrounding non-native speakers’ understanding of seemingly synonymous words”. [disponible en: http://www.bcl.edu.ar/spip/spip.php?article29]. McCARTHY, Michael y Felicity O’DELL (2005): English Collocations in Use, Cambridge: Cambridge University Press. McENERY, Tony y Andrew WILSON (2001): Corpus Linguistics. Edinburgh: Edinburgh University Press. O’CONNOR DI VITO, Nadine (1991): “Incorporating native speakers norms in second language materials”, Applied Linguistics 12(4): 383–95. O’KEEFE, Anne, Michael McCARTHY y Ronald CARTER (2007): From corpus to classroom: Language use and language teaching, Cambridge: Cambridge University Press. PALMER, Harold E. (1933): Second Interim Report on English Collocations, Tokyo: Institute for Research in English Teaching. Willis, Dave (1990): The Lexical Syllabus: A New Approach to Language Teaching, London : Collins Cobuild. PARKINSON, Dilworth B. (2006): Using Arabic Synonyms, Cambridge: Cambridge University Press. REPPEN, Randi (2010): Using Corpora in the Language Classroom, Cambridge: Cambridge University Press. SIMPSON-VLACH, Rita C. y Sheryl LEICHER (2006): The MICASE Handbook: A Resource for Users of the Michigan Corpus of Academic Spoken English. Ann Arbor: University of Michigan Press. THORNDIKE, Edward L. (1921): A Teacher's Wordbook, New York: Columbia Teachers College. WALZ, J. (1989): “Context and Contextualized Language Practice in Foreign Language Teaching”, The Modern Language Journal 73(2): 160-168. Páginas web arabiCorpus: [En linea] < http://arabicorpus.byu.edu/> ARALEX: [En linea] <http://www.mrc-cbu.cam.ac.uk:8081/aralex.online/login.jsp> ELDA: [En linea] <http://www.elda.org/> ELRA: [En linea] < http://catalog.elra.info/index.php> ICA (International Corpus of Arabic): [En linea] < http://www.bibalex.org/unl/Frontend/Project.aspx?id=9> Latifa Al Sulaiti (página personal): [En linea] < http://www.comp.leeds.ac.uk/eric/latifa/> LDC: [En linea] < http://www.ldc.upenn.edu/> MEDAR: [En linea] <http://www.nemlar.org/> NEMLAR: [En linea] < www.medar.info/The_Nemlar_Project/index.html> 19