CEMC II

Filtros


Introducción

El Corpus del español mexicano contemporáneo II reúne textos escritos y hablados a partir del año 1975 y hasta el 2018, con los mismos fines del primero: reunir muestras que sean representativas de los usos de la lengua en México, orientadas, sobre todo, a documentar vocabulario, tanto del más reciente, como del tradicional que, sin embargo, puede haber tenido modificaciones, ya sea en sus significados o ya sea en su morfología y su sintaxis. Ello no impide, por supuesto, utilizar el Corpus para investigaciones sintácticas, particularmente.

Acerca del CEMC II

El Corpus del español mexicano contemporáneo II reúne textos escritos y hablados a partir del año 1975 y hasta el 2018, con los mismos fines del primero: reunir muestras que sean representativas de los usos de la lengua en México, orientadas, sobre todo, a documentar vocabulario, tanto del más reciente, como del tradicional que, sin embargo, puede haber tenido modificaciones, ya sea en sus significados o ya sea en su morfología y su sintaxis. Ello no impide, por supuesto, utilizar el Corpus para investigaciones sintácticas, particularmente.

La estructura del Corpus II es igual a la del Corpus I, para que las muestras obtenidas sean comparables entre sí. Es decir, se agruparon los textos en 14 “géneros”; en cada “género” se seleccionaron al azar párrafos completos de las obras o las transcripciones de discurso hablado, hasta alcanzar aproximadamente 2000 ocurrencias de palabras gráficas por cada una.

Sin embargo, hubo que modificar algunos géneros, debido a la desaparición de ciertos tipos de texto, como las fotonovelas; a la lamentable inexistencia de documentos dialectales como los que constituyeron el Atlas lingüístico de México; y a la falta de documentos contemporáneos que testimoniaran la conservación de la lírica popular tradicional, por ejemplo.

En el género 7, llamado en el CEMC-I “Habla culta de la ciudad de México”, se tomaron muestras, esta vez, de la investigación de El Colegio de México Corpus sociolingüístico de la Ciudad de México, seleccionando únicamente entrevistas a personas catalogadas como “cultas” en esa investigación. En el género 8, “Literatura popular” se tomaron muestras de obras que se podrían considerar particularmente “de entretenimiento”, otras de autoayuda y otras de amplia circulación en los puestos de periódico, así como varios libretos de telenovelas. El género 9 “Habla media de la Ciudad de México” se cubre con selecciones de entrevistas a personas clasificadas con esas características por los autores del mismo Corpus sociolingüístico de la Ciudad de México. El género 10 “Lírica popular” recoge canciones de los diferentes tipos que se escuchan hoy en día por todo el país, de rock, de hip-hop, de bandas, gruperos, etc., así como canciones románticas. El género 11 “Textos dialectales” reúne entrevistas de los corpus de “El habla de Monterrey” y de Quintana Roo, únicos a los que se tuvo acceso. El género 13 “Textos jergales” recoge párrafos de comunicaciones en redes sociales, en los cuales no necesariamente se utilizan solamente jergas juveniles. Por último el género 14 consta de textos de entrevistas a prisioneros en las cárceles, la mayoría de ellos, ladrones, traficantes de drogas al menudeo y tratantes de blancas.

Base estadística del CEMC II


Total de la muestra: 100%
Porcentajes por géneros
Lengua culta:
67.32 %
Literatura
23.11 %
Periodismo
26.21 %
Ciencias
26.30%
Técnicas
14.77 %
Discurso político
2.77 %
Religión
1.85 %
Habla culta
4.99 %
100 %
 
 
Lengua sub-culta:
11.52 %
Lírica popular
21.28 %
Literatura popular
53.47 %
Habla media
25.25 %
100 %
 
 
Lengua no-estándar
21.16 %
Documentos antropológicos
16.03 %
Habla popular
17.42 %
Jergas
5.81 %
Textos dialectales
60.74 %
100 %

Estratificación y tamaño del corpus


Nivel
Género
Número de textos
Número de ocurrencias
Porcentaje de ocurrencias
Lengua culta
Literatura
150
320 758
15.5596 %
Periodismo
176
363 839
17.6494 %
Ciencias
180
364 942
17.7029 %
Técnicas
102
205 016
9.9451 %
Discurso político
18
38 380
1.8617 %
Religión
12
25 665
1.2449 %
Habla culta
30
69 244
3.3589 %
Subtotal
668
1 387 844
67.3230
Lengua sub-culta
Literatura popular
63
126 955
6.1584 %
Habla media
30
59 960
2.9086 %
Lírica popular
24
50 532
2.4512 %
Subtotal
117
237 447
11.5183 %
Lengua no-estándar
Textos dialectales
129
264 904
12.8502 %
Documentos antropológicos
33
6 992
3.3918 %
Jergas
12
25 354
1.2298 %
Habla popular
37
76000
3.6866 %
Subtotal
211
436 180
21.1586 %
Totales
 
996
2 061 471
100 %

Equipo responsable del CEMC II

Responsable del proyecto
Dr. Luis Fernando Lara
Equipo de trabajo
Dr. Alfonso Medina Urrea
Mtro. Alejandro Rosales Martínez
Mtro. Carlos Fernando Diez Sánchez
Mtro. Juan Luis Serralde Galicia
Equipo de becarios
Alexandra Astrid Ruiz Surget
Beatriz Alejandra Piña Castro
Carlos Oswaldo Hernández Trujillo
David Huerta Meza
Diego Arturo Robles Barrios
Jesús Mendoza Ruiz
Laura Leticia Velázquez Velázquez
Pedro Emilio Rivera Díaz