UABC-ODS

ODS 4ODS 16
Facultad de Pedagogía e Innovación Educativa.

Fundamentos para un diagnóstico de riqueza léxica y diversidad lingüística en estudiantes de preparatoria de Mexicali.

 

Descripción

El proyecto consiste en construir un diagnóstico de la riqueza léxica y la diversidad lingüística de estudiantes de preparatoria en Mexicali, con el propósito de generar un índice de referencia útil para la docencia y la toma de decisiones. Metodológicamente, articula dos procesos de recopilación diferenciados: por un lado, el habla oral mediante entrevistas sociolingüísticas y conversaciones guiadas entre pares; por otro, el habla escrita, preservando la ortografía y la puntuación originales para no distorsionar el uso real.

El diseño prevé una muestra por conglomerados con cuotas por semestre (1°, 3° y 6°) y género, en nueve planteles de la ciudad. A la fecha, se han realizado 30 entrevistas y, como primer acercamiento complementario, se levantó una muestra preliminar de 380 cuestionarios de actitudes lingüísticas, lo que permite perfilar percepciones y sesgos antes del análisis del corpus. El componente escrito se robustecerá con un subestudio de tesis doctoral asociado que recopilará, durante un semestre, producciones de cerca de 100 estudiantes organizadas por tipologías textuales, según Van Dijk: argumentativa, expositiva, descriptiva, narrativa y prescriptiva, con el propósito de correlacionar la riqueza léxica con el género discursivo.

Tras la recolección, el flujo de tratamiento contempla la transcripción asistida por inteligencia artificial con verificación humana, la anonimización y el renombrado de archivos, el fichado de metadatos, la generación de textos limpios, el etiquetado y la lematización mediante herramientas de procesamiento de lenguaje natural (NLP), como spaCy, así como el cálculo de medidas contemporáneas de diversidad y sofisticación léxica (MATTR, proporción de palabras de contenido, frecuencia léxica, puntuaciones de bigramas y concreción). A partir de estos insumos, se implementará un sistema informático preliminar de diagnóstico comparado con un índice normalizado.

Detalle visual del proyecto

Problemática

Imagen de la problemática

En el ámbito educativo es frecuente escuchar que los jóvenes de preparatoria “hablan y escriben mal”, con una supuesta “pobreza léxica”. Estas percepciones, más cercanas al prejuicio que a la evidencia empírica, invisibilizan la diversidad real del habla juvenil. Los diagnósticos nacionales, como PLANEA 2017 y PISA 2022, muestran rezagos en lectura y escritura, pero omiten indicadores clave como la riqueza y la diversidad léxica, fundamentales para comprender la competencia lingüística de los estudiantes. En Mexicali, esta situación se complejiza por el contexto fronterizo y migratorio, donde conviven variedades del español, lenguas indígenas y hablas de herencia. No obstante, no existen instrumentos locales que permitan medir de manera objetiva el uso del léxico en estudiantes de preparatoria.

A ello se suma el impacto de las tecnologías del lenguaje y la inteligencia artificial, que tienden a homogeneizar las producciones juveniles y aumentan el riesgo de perder rasgos propios de su expresión. Frente a este vacío, se vuelve necesario contar con un diagnóstico sólido y basado en datos empíricos que documente la riqueza léxica y la diversidad lingüística en la región. Solo así será posible diseñar estrategias educativas más inclusivas, combatir prejuicios sobre el habla juvenil y fundamentar políticas que fortalezcan la identidad cultural y el derecho a la diversidad.

Objetivo

Imagen del objetivo

Desarrollar un índice de riqueza léxica normalizado para estudiantes de preparatoria de Mexicali, a partir del análisis de un corpus oral y escrito, con el fin de generar un diagnóstico empírico que permita diseñar estrategias educativas inclusivas, fortalecer la valoración de la diversidad lingüística y combatir prejuicios sobre el habla juvenil.

Impacto

El proyecto se encuentra en desarrollo y ya cuenta con avances verificables. Se ha desplegado un doble frente de recolección: un corpus oral mediante entrevistas sociolingüísticas y conversaciones guiadas, y un corpus escrito que preserva la ortografía y la puntuación originales. Se han realizado 30 entrevistas y se levantó una muestra preliminar de 380 cuestionarios de actitudes lingüísticas. Con nueve planteles vinculados y el flujo técnico de tratamiento operando —transcripción asistida por IA con verificación humana, anonimización, fichado de metadatos, generación de archivos TXT y etiquetado y lematización con NLP—, se consolida la base para un índice normalizado de riqueza léxica y un sistema preliminar de diagnóstico.

Conforme al manual del observatorio, al tratarse de un proyecto en curso, se reportan avances y resultados preliminares, alineados con el ODS 4 (Educación de calidad) y el ODS 10 (Reducción de las desigualdades) en un contexto fronterizo. Para docentes en formación y en servicio, el impacto social inmediato se traduce en una línea base local útil para diseñar estrategias de lectura y escritura más inclusivas, evaluar con mayor justicia la diversidad del español y reconocer las fortalezas léxicas reales del estudiantado. Para los estudiantes, el beneficio directo es doble: la visibilización de su propia voz, tanto oral como escrita, y el acceso a retroalimentación situada, desligada de prejuicios, que oriente su progreso.

A mediano plazo, se entregará un prototipo de software para el diagnóstico de riqueza léxica, con evaluación de protección de propiedad intelectual —registro de software y, de proceder, solicitud de patente del método—, así como un cuadernillo para el aula, un curso-taller y un micrositio de divulgación que faciliten su adopción por escuelas de nivel medio superior. El impacto proyectado escala desde la intervención directa en 72 entrevistas y el trabajo con entre 18 y 25 docentes de los planteles participantes, hasta la transferencia con 17 docentes y aproximadamente 100 estudiantes de la FPIE en actividades formativas. Se estima que ello incida en entre 16 y 18 grupos de lengua y literatura, equivalentes a alrededor de 850 estudiantes, y, a largo plazo, en una población municipal cercana a los 10,000 estudiantes. De manera paralela, el subestudio doctoral que recopilará textos de cerca de 100 estudiantes durante un semestre permitirá una aplicabilidad directa en el aula y un impacto potencial en planes y programas de estudio, al constituir un fundamento empírico para la política educativa.

Responsables

Manuel Alejandro Sánchez Fernández.

Colaboradores

Luis Alejandro Acevedo Zapata, Julieta López Zamora, Clotilde Lomelí Agruel, María Amparo Oliveros Ruiz, Lidia Esther Vargas Osuna, Porfiria Del Rosario Bustamante De La Cruz.

Evidencias