La Novedad léxica como medida de riqueza léxica en un corpus oral contemporáneo: el corpus PRESEEA-Santander
The lexical novelty as lexical richness measure in a contemporary oral corpus: the PRESEEA-Santander corpus
Ver/ Abrir
Registro completo
Mostrar el registro completo DCFecha
2025Derechos
Attribution 4.0 International
Publicado en
Revista Signos, 2025, 58(117), 121-143
Editorial
Pontificia Universidad Católica de Valparaíso, Instituto de Literatura y Ciencias del Lenguaje
Enlace a la publicación
Palabras clave
Riqueza léxica
Novedad léxica
Variación léxica
Corpus sociolingüístico
Análisis cuantitativo del léxico
Lexical richness
Lexical Novelty
Lexical variation
Sociolinguistic corpus
Quantitative analysis of lexicon
Resumen/Abstract
Los estudios cuantitativos del léxico más generalizados son, entre otros, los léxicos básicos, los disponibles y los que miden la riqueza léxica (Ávila Muñoz, 2014). En esta última dirección se ubica el presente estudio. Tradicionalmente, la fórmula empleada a partir de la cual se obtiene la riqueza media de cada texto es TTR (Type Tokens Ratio), consistente en dividir el número de vocablos diferentes entre el total de frecuencias de palabras (Capsada & Torruella, 2017). Esta fórmula es válida cuando se comparan corpus de igual tamaño, pero no resulta fiable al cotejar textos de distinta dimensión. Junto a la Densidad (Ávila Muñoz, 2014), otros índices para medir la riqueza léxica -como la Diversidad (Baayen, 2001), la Información (Shannon & Weaver, 1963) o lo que se conoce como Peculiaridad (Baayen, 2001, 2008)- tampoco están exentos de problemas. El objetivo final de este trabajo es comprobar la eficacia de nuestra propuesta, la Novedad léxica, como un nuevo índice de riqueza léxica. Para medir dicha eficacia, se ofrece la fórmula específica y se compara con los otros índices, tomando como base del análisis el corpus PRESEEA-Santander en dos direcciones: los parámetros sociolingüísticos (sexo, edad y nivel educativo) y la categoría gramatical. Los resultados obtenidos muestran una diferencia notable de Novedad léxica en función de la categoría gramatical y escasa en lo que atañe a los criterios sociolingüísticos.
The most common quantitative lexical studies are, among others, the basic lexicon, the available lexicon and those that measure lexical richness (Ávila Muñoz, 2014). The present study is framed within the latter category. Traditionally, the formula used to obtain the average richness of each text is TTR (Type Tokens Ratio), which consists of dividing the number of different words by the total frequency of words (Capsada & Torruella, 2017). This formula is valid when comparing corpora of equal size, but it is not reliable when comparing texts of different dimensions. Along with Density (Ávila Muñoz, 2014), other indices to measure lexical richness -such as Diversity (Baayen, 2001), Information (Shannon & Weaver, 1963) or what is known as Peculiarity (Baayen, 2001, 2008)- are also not without problems. The final objective of this work is to verify the effectiveness of our proposed Lexical Novelty as a new index of lexical richness. To measure this effectiveness, the specific formula is offered and compared with the other indices, taking the PRESEEA-Santander corpus as the basis of the analysis in two directions: the sociolinguistic parameters (sex, age and educational level) and the grammatical category. The results obtained show a notable difference in Lexical Novelty as a function of grammatical category but a little difference in terms of sociolinguistic criteria.
Colecciones a las que pertenece
- D13 Artículos [219]