martes, 13 de noviembre de 2012

Juegos de palabras

Al principio fue el verbo.

Hay tantas interpretaciones del significado del comienzo del evangelio de Juan como teólogos (es decir, pocas). La más habitual es suponer que "el verbo" (o "the word" o "logos", según el idioma) se refiere a Jesús.

Otra interpretación, que es la que yo prefiero, es suponer que el verbo es exactamente eso, una orden verbal. El pensamiento mágico asigna poder real a las palabras. En ese contexto, Dios sería el über mago, creando el universo con un simple "hágase", en un big-bang abracadabrante.

Ni que decir tiene que yo no creo en el poder mágico de las palabras, pero sí me parece que tienen mucha importancia en el modo en el que nuestro cerebro es capaz de razonar. El hecho mismo de asignar una palabra a un concepto nos permite pensar sobre ello con más facilidad. La mente (al menos la mía) necesita palabras para representar internamente categorías.

Casualmente, ayer leí la siguiente frase de Gödel:
The human mind is incapable of formulating (or mechanizing) all its mathematical intuitions, i.e., if it has succeeded in formulating some of them, this very fact yields new intuitive knowledge [...]
Dicho de otra forma, cada nueva formulación matemática nos sirve como un clavo al que aferrarnos para generar nuevo conocimiento y nuevas intuiciones. De forma similar, me parece a mi, nuevas palabras cubriendo nuevos conceptos nos permiten generar nuevas intuiciones y aumentar el espacio de lo cognoscible. De ser así, esto podría ser una explicación del effecto Flynn.

No sólo las palabras, la estructura del lenguaje en sí podría tener efecto en la forma en que pensamos y nuestra capacidad intelectual. Hay incluso lenguas artificiales como Ithkuil, pensadas específicamente para permitir pensar sobre cosas más profundas de lo que las lenguas naturales permiten.

¿Y todo este rollo para qué? os preguntaréis. La verdad es que quería hablar de la herramienta de n-gramas de Google y el prólogo se me fue de las manos.




Pero vamos a ello.

Google ngrams

Esta página de Google permite estudiar la frecuencia de uso de palabras en inglés. La fuente son los libros escaneados por Google y, por tanto, hay que tener en cuenta que no es perfecta. En particular tenemos los siguientes problemas:
  • El OCR no es perfecto y puede haber errores en la interpretación de las palabras.
  • El número de obras escaneadas decrece cuanto más nos movemos atrás en el tiempo. Puesto que los resultados aparecen en forma de porcentaje, esto no resulta claramente visible, pero hay que tener en cuenta que tales porcentajes están más sujetos a error cuanto más antiguos son. Para evitar esto no voy a incluir resultados muy antiguos, donde el ruido es más claro.
  • Hay palabras que pueden haber tenido usos en cierta época que no son obvios actualmente: una marca comercial como General Electric puede aumentar artificialmente el uso de "electric" y "general" en determinada época, lo mismo es aplicable a apellidos.
Teniendo en cuenta estas cosas, vamos a divertirnos echando un vistazo a ciertas gráficas (no soy el primero y quizás hasta me repita).



Con este gráfico intentaba ver cómo habían cambiado los temas en la ciencia ficción (y junto a ellos, en la población en general). Al principio, las historias hablaban de cohetes, más tarde de robots y últimamente de realidad virtual. Hay un hueco alrededor del 1975 que yo identifico con la ciencia ficción sobre sociedades humanas (distopías y similares). Como curiosidad, la palabra "society" tiene un pico claro sobre esos años, aunque al ser una palabra común se nos sale de la escala.


No hay una fina línea entre "love" y "hate"; hay un salto considerable, piensen lo que piensen los pesimistas. Además ¿quién habría dicho que los años 60 no sólo están cerca de ser el minimo absoluto del uso de "love", sino que además la tendencia es descendiente?

Al parecer el porno se inventó más o menos a la vez que internet. Entre el 1970 y el 2000 parece que el porno es la derivada de internet (yo pensaba que sería al revés).

Hay muchas más posibilidades y no quiero privaros de la diversión de buscarlas vosotros. Sólo voy a incluir una más que no sé cómo interpretar.


Me parece curioso que una palabra tan común como "table" cambie de frecuencia de uso tan clara y consistentemente. Sus dos significados principales son "mesa" y "tabla" (en su sentido gráfico, no de madera). Ninguno de ellos me parece que debería variar significativamente, pero aquí vemos cambios importantes. ¿A alguien se le ocurre alguna razón? ¿Por que los americanos dejaron de hablar de mesas o tablas en los 70?

Pongo "table" como ejemplo, pero prácticamente todas las palabras muestran cambios similares. Es realmente difícil encontrar una que no esté sujeta a ellos. La más constante que he visto es "in", y eso que parece que su uso ha empezado a decaer en los últimos años (y sí,coincide con un aumento de "out", aunque ésta última tiene mucha más variabilidad).