Moby Dick, un libro extraordinario

HeXaN

La digitalización masiva de libros, unida a técnicas cada vez más complejas de análisis de datos, permite realizar estudios de todo tipo, como por ejemplo la densidad de vocabulario de un texto.

El investigador Zack Booth Simpson realizó en el año 2000 un estudio, basándose en manuales digitalizados por el Proyecto Gutenberg: en cada libro contó el número total de palabras y la cantidad de palabras diferentes, es decir, el ‘tamaño’ de su vocabulario. Por supuesto, los textos más voluminosos contenían mayor número de palabras, pero ¿mayor variedad de ellas? La medida relevante de la riqueza del vocabulario es su densidad, es decir, el cociente del número de palabras diferentes entre el número total de ellas.

¿Y cuál resultó ser el libro más rico en vocabulario? Moby Dick de Herman Melville: con 17.227 palabras diferentes para un total de 211.763 –el cociente es 0,0813–; esto significa que Melville introduce una nueva palabra ¡en casi todas las líneas!

Este gráfico –extraído y adaptado del blog ‘Science Étonnante’– resume algunos datos del estudio de Zack Booth Simpson:

El libro menos rico en vocabulario es La Biblia: 12.867 palabras diferentes para 790.126 totales –el cociente es 0,0163–: posee una densidad cinco veces menor que Moby Dick.

Más recientemente, el lingüista Matthew Jockers ha estudiado una base de datos de 3.600 libros digitalizados, para los que ha calculado cerca de 500 características diferentes basadas en el vocabulario, la puntuación, los temas tratados, etc. Todas estas propiedades definen coordenadas para cada libro, y es posible calcular ‘la distancia’ entre dos libros en este espacio de dimensión tan grande.

La anterior imagen muestra una representación de cómo funciona esta distancia entre libros: si dos puntos están cerca, los libros que representan se parecen en muchos de los aspectos estudiados. En el pequeño grupo destacado en la esquina superior izquierda se sitúa Moby Dick y los pocos libros que le son próximos.

Fuente.


Pues me ha sorprendido este estudio. Voy a tener que darle otra lectura a este libro para volver a empaparme de sus descripciones minuciosas. Curioso también el dato de la Biblia.

8
Rivendel

#1 me lo pienso leer solo por esto.

P.D.:

S

Como dato es interesante, como medida de calidad de algo más allá de poder ser una pista me parece irrelevante.

Shatterz

Best novel ever. Está en la cima de la narrativa en todos los aspectos. Aún no he leído nada que se le parezca.

1
Zrak87

No sé por qué, pero me ha venido esto a la cabeza nada más leer #1.

https://www.youtube.com/watch?v=_D-mtCdYgsA

Sé que es una novela y que no es poesía pero me vino a la cabeza.

1
UnleasheD

#1 Está muy bien, pero espero que te lo leas en inglés para apreciar todos esos matices, por que con la traducción no se yo.

y anda que no hay que saber inglés para leerselo.... vamos, yo ni de coña.

10 días después
Morkar

Llamadme Ismael. Hace unos años -no importa cuánto hace exactamente-, teniendo poco o ningún dinero en el bolsillo, y nada en particular que me interesara en tierra, pensé que me iría a navegar un poco por ahí, para ver la parte acuática del mundo. Es un modo que tengo de echar fuera la melancolía y arreglar la circulación. Cada vez que me sorprendo poniendo una boca triste; cada vez que en mi alma hay un nuevo noviembre húmedo y lloviznoso; cada vez que me encuentro parándome sin querer ante las tiendas de ataúdes; y, especialmente, cada vez que la hipocondria me domina de tal modo que hace falta un recio principio moral para impedirme salir a la calle con toda deliberación a derribar metódicamente el sombrero a los transeúntes, entonces, entiendo que es más que hora de hacerme a la mar tan pronto como pueda. Es mi sustituto de la pistola y la bala. Catón se arroja sobre su espada, haciendo aspavientos filosóficos; yo me embarco pacíficamente. No hay en ello nada sorprendente. Si bien lo miran, no hay nadie que no experimente, en alguna ocasión u otra, y en más o menos grado, sentimientos análogos a los míos respecto del océano.

2

Usuarios habituales

  • Morkar
  • UnleasheD
  • Zrak87
  • Shatterz
  • Spike_Spigel
  • Rivendel
  • HeXaN