martes, 13 de noviembre de 2012

Juegos de palabras

Al principio fue el verbo.

Hay tantas interpretaciones del significado del comienzo del evangelio de Juan como teólogos (es decir, pocas). La más habitual es suponer que "el verbo" (o "the word" o "logos", según el idioma) se refiere a Jesús.

Otra interpretación, que es la que yo prefiero, es suponer que el verbo es exactamente eso, una orden verbal. El pensamiento mágico asigna poder real a las palabras. En ese contexto, Dios sería el über mago, creando el universo con un simple "hágase", en un big-bang abracadabrante.

Ni que decir tiene que yo no creo en el poder mágico de las palabras, pero sí me parece que tienen mucha importancia en el modo en el que nuestro cerebro es capaz de razonar. El hecho mismo de asignar una palabra a un concepto nos permite pensar sobre ello con más facilidad. La mente (al menos la mía) necesita palabras para representar internamente categorías.

Casualmente, ayer leí la siguiente frase de Gödel:
The human mind is incapable of formulating (or mechanizing) all its mathematical intuitions, i.e., if it has succeeded in formulating some of them, this very fact yields new intuitive knowledge [...]
Dicho de otra forma, cada nueva formulación matemática nos sirve como un clavo al que aferrarnos para generar nuevo conocimiento y nuevas intuiciones. De forma similar, me parece a mi, nuevas palabras cubriendo nuevos conceptos nos permiten generar nuevas intuiciones y aumentar el espacio de lo cognoscible. De ser así, esto podría ser una explicación del effecto Flynn.

No sólo las palabras, la estructura del lenguaje en sí podría tener efecto en la forma en que pensamos y nuestra capacidad intelectual. Hay incluso lenguas artificiales como Ithkuil, pensadas específicamente para permitir pensar sobre cosas más profundas de lo que las lenguas naturales permiten.

¿Y todo este rollo para qué? os preguntaréis. La verdad es que quería hablar de la herramienta de n-gramas de Google y el prólogo se me fue de las manos.




Pero vamos a ello.

Google ngrams

Esta página de Google permite estudiar la frecuencia de uso de palabras en inglés. La fuente son los libros escaneados por Google y, por tanto, hay que tener en cuenta que no es perfecta. En particular tenemos los siguientes problemas:
  • El OCR no es perfecto y puede haber errores en la interpretación de las palabras.
  • El número de obras escaneadas decrece cuanto más nos movemos atrás en el tiempo. Puesto que los resultados aparecen en forma de porcentaje, esto no resulta claramente visible, pero hay que tener en cuenta que tales porcentajes están más sujetos a error cuanto más antiguos son. Para evitar esto no voy a incluir resultados muy antiguos, donde el ruido es más claro.
  • Hay palabras que pueden haber tenido usos en cierta época que no son obvios actualmente: una marca comercial como General Electric puede aumentar artificialmente el uso de "electric" y "general" en determinada época, lo mismo es aplicable a apellidos.
Teniendo en cuenta estas cosas, vamos a divertirnos echando un vistazo a ciertas gráficas (no soy el primero y quizás hasta me repita).



Con este gráfico intentaba ver cómo habían cambiado los temas en la ciencia ficción (y junto a ellos, en la población en general). Al principio, las historias hablaban de cohetes, más tarde de robots y últimamente de realidad virtual. Hay un hueco alrededor del 1975 que yo identifico con la ciencia ficción sobre sociedades humanas (distopías y similares). Como curiosidad, la palabra "society" tiene un pico claro sobre esos años, aunque al ser una palabra común se nos sale de la escala.


No hay una fina línea entre "love" y "hate"; hay un salto considerable, piensen lo que piensen los pesimistas. Además ¿quién habría dicho que los años 60 no sólo están cerca de ser el minimo absoluto del uso de "love", sino que además la tendencia es descendiente?

Al parecer el porno se inventó más o menos a la vez que internet. Entre el 1970 y el 2000 parece que el porno es la derivada de internet (yo pensaba que sería al revés).

Hay muchas más posibilidades y no quiero privaros de la diversión de buscarlas vosotros. Sólo voy a incluir una más que no sé cómo interpretar.


Me parece curioso que una palabra tan común como "table" cambie de frecuencia de uso tan clara y consistentemente. Sus dos significados principales son "mesa" y "tabla" (en su sentido gráfico, no de madera). Ninguno de ellos me parece que debería variar significativamente, pero aquí vemos cambios importantes. ¿A alguien se le ocurre alguna razón? ¿Por que los americanos dejaron de hablar de mesas o tablas en los 70?

Pongo "table" como ejemplo, pero prácticamente todas las palabras muestran cambios similares. Es realmente difícil encontrar una que no esté sujeta a ellos. La más constante que he visto es "in", y eso que parece que su uso ha empezado a decaer en los últimos años (y sí,coincide con un aumento de "out", aunque ésta última tiene mucha más variabilidad).

5 comentarios:

  1. Pues está interesante la herramienta. Estuve haciendo algunas pruebas y pasé un rato entretenido.

    Por cierto, puede valer la pena echar un vistazo a la info, porque la herramienta tiene más de lo que parece a simple vista:
    http://books.google.com/ngrams/info

    ResponderEliminar
  2. Esto del Ithkuil es mucho mejor que el Klingon, dónde vas a parar. De hecho es casi lo contrario si lo vas a ver.

    Y hablando un poco de todo me gustó también esta comparación http://books.google.com/ngrams/graph?content=liberalism%2Csocialism%2C+communism&year_start=1800&year_end=2008&corpus=15&smoothing=3&share=

    (Muy bueno el artículo, por cierto)

    ResponderEliminar
  3. Emilio: Gracias por la "info", de habermela leido antes hubiera podido mejorar los graficos que puse.

    Ramiro: El problema con "liberalism" es que significa cosas distintas a uno y otro lado del atlantico y es defendida por partidos de signos opuestos.

    De hecho, si te quedas con el corpus de ingles americano, liberalism correlaciona casi perfectamente con socialism y communism, mientras que si escoges el ingles britanico, no existe mucha correlacion.

    Sospecho que parte de tu comentario es el aumento de la frecuencia de liberalism y la decadencia del uso de las otras en los ultimos tiempos (mas claro en el caso del ingles britanico). Mi interpretacion no es que el uso de liberalism haya aumentado, sino que el uso del resto de palabras ha disminuido :-P

    ResponderEliminar
  4. El físico teórico Michio Kaku afirma haber creado una teoría que puede apuntar a la existencia de Dios. La información ha creado un gran revuelo en la comunidad científica porque Kaku es considerado uno de los científicos más importantes de la actualidad, uno de los creadores y desarrolladores revolucionarios de la Teoría de Cuerdas por lo que es muy respetado en todo el mundo.
    Para llegar a sus conclusiones, el físico hizo uso un “semi-radio primitivo de táquiones” (que son partículas teóricas capaces de “despegar” la materia del universo o el contacto de vacío con ella, dejando así todo libre de las influencias del universo que les rodea), tecnología creada recientemente en 2005.

    Aunque la tecnología para llegar a las verdaderas partículas de taquiones aún está lejos de ser una realidad, el semi-radio tiene algunas pocas propiedades de estas partículas teóricas, que son capaces de crear el efecto de los verdaderos taquiones en una escala subatómica.
    Según Michio, vivimos en un “Matrix”: “He llegado a la conclusión de que estamos en un mundo hecho por reglas creadas por una inteligencia, no muy diferente de su juego de ordenador favorito, por supuesto, más complejo e impensable. Analizando el comportamiento de la materia a escala subatómica, afectado por el semi radio primitivo de taquiones, un diminuto punto en el espacio, por primera vez en la historia, totalmente libre de cualquier influencia del universo, la materia, la fuerza o la ley se percibe de una forma inédita el caos absoluto. Créeme, todo lo que llamamos casualidad hoy no tendrá más sentido. Para mí está claro que estamos en un plano regido, por reglas creadas y no determinadas por azares universales”, dijo el científico.
    --

    Siendo una matrix de informacion (cuantica), la palabra podria formar o deformar la realidad... en planos superiores del entendimiento.

    ResponderEliminar
  5. Hola Alberto,

    Había publicado una respuesta, pero parece que no ha funcionado y he perdido lo que había puesto... a empezar otra vez.

    No he encontrado referencias a eso que dices que Michio Kaku dijo, salvo en webs poco creíbles y pseudomísticas. Ese señor aparece mucho en los medios y es raro que de haber afirmado algo así, no se pueda encontrar.

    De hecho si he encontrado vídeos en los que sale él negando que vivamos en Matrix: https://www.youtube.com/watch?v=m6mUj1W9UZo

    Respecto a que realmente vivamos en una simulación... es una posibilidad tan válida como la de que todo el universo haya sido creado ayer y nuestros recuerdos de días anteriores hayan sido implantados. Podemos imaginar miles de posibilidades similares, pero no aportan nada, no son falsables e introducen complicaciones innecesarias.

    ResponderEliminar