El Corpus del español mexicano contemporáneo II reúne textos escritos y hablados a partir del año 1975 y hasta el 2018, con los mismos fines del primero: reunir muestras que sean representativas de los usos de la lengua en México, orientadas, sobre todo, a documentar vocabulario, tanto del más reciente, como del tradicional que, sin embargo, puede haber tenido modificaciones, ya sea en sus significados o ya sea en su morfología y su sintaxis. Ello no impide, por supuesto, utilizar el Corpus para investigaciones sintácticas, particularmente.
El Corpus del español mexicano contemporáneo II reúne textos escritos y hablados a partir del año 1975 y hasta el 2018, con los mismos fines del primero: reunir muestras que sean representativas de los usos de la lengua en México, orientadas, sobre todo, a documentar vocabulario, tanto del más reciente, como del tradicional que, sin embargo, puede haber tenido modificaciones, ya sea en sus significados o ya sea en su morfología y su sintaxis. Ello no impide, por supuesto, utilizar el Corpus para investigaciones sintácticas, particularmente.
La estructura del Corpus II es igual a la del Corpus I, para que las muestras obtenidas sean comparables entre sí. Es decir, se agruparon los textos en 14 “géneros”; en cada “género” se seleccionaron al azar párrafos completos de las obras o las transcripciones de discurso hablado, hasta alcanzar aproximadamente 2000 ocurrencias de palabras gráficas por cada una.
Sin embargo, hubo que modificar algunos géneros, debido a la desaparición de ciertos tipos de texto, como las fotonovelas; a la lamentable inexistencia de documentos dialectales como los que constituyeron el Atlas lingüístico de México; y a la falta de documentos contemporáneos que testimoniaran la conservación de la lírica popular tradicional, por ejemplo.
En el género 7, llamado en el CEMC-I “Habla culta de la ciudad de México”, se tomaron muestras, esta vez, de la investigación de El Colegio de México Corpus sociolingüístico de la Ciudad de México, seleccionando únicamente entrevistas a personas catalogadas como “cultas” en esa investigación. En el género 8, “Literatura popular” se tomaron muestras de obras que se podrían considerar particularmente “de entretenimiento”, otras de autoayuda y otras de amplia circulación en los puestos de periódico, así como varios libretos de telenovelas. El género 9 “Habla media de la Ciudad de México” se cubre con selecciones de entrevistas a personas clasificadas con esas características por los autores del mismo Corpus sociolingüístico de la Ciudad de México. El género 10 “Lírica popular” recoge canciones de los diferentes tipos que se escuchan hoy en día por todo el país, de rock, de hip-hop, de bandas, gruperos, etc., así como canciones románticas. El género 11 “Textos dialectales” reúne entrevistas de los corpus de “El habla de Monterrey” y de Quintana Roo, únicos a los que se tuvo acceso. El género 13 “Textos jergales” recoge párrafos de comunicaciones en redes sociales, en los cuales no necesariamente se utilizan solamente jergas juveniles. Por último el género 14 consta de textos de entrevistas a prisioneros en las cárceles, la mayoría de ellos, ladrones, traficantes de drogas al menudeo y tratantes de blancas.