DEFINICIÓN DE CORPUS

Mayo 6, 2008 at 10:34 am (Joseba Abaitua, Language Resources 07/o8)

El concepto de llevar a cabo la investigación sobre textos hablados o escritos no se limita a la lingüística de corpus. De hecho, a menudo, cada uno de los textos se utilizan para muchos tipos de obras literarias y análisis lingüístico – el análisis estilístico de un poema, una conversación o análisis de un talk show de televisión. Sin embargo, la noción de un corpus como la base para una forma empírica de la lingüística es diferente de varias menras del único examen de los textos fundamentales. En principio, cualquier colección de más de un texto puede ser llamado un corpus (corpus para ser latín “cuerpo”, por lo tanto, un corpus es cualquier cuerpo de texto). Pero el término “corpus” cuando se utiliza en el contexto de la lingüística moderna tiende con mayor frecuencia a tener más connotaciones específicas que esta simple definición.

La siguiente lista describe los cuatro principales características del corpus moderno:

  • Forma legible por máquina
  • Un patrón de referencia
  • Muestreo y representatividad
  • Tamaño pequeño

Escribe un comentario