¿Tenemos que dejar de decir eso de "Correlación no implica causalidad"?

¿Tenemos que dejar de decir eso de "Correlación no implica causalidad"?
Sin comentarios Facebook Twitter Flipboard E-mail

Internet tiene sus regularidades: cada cierto tiempo los buscadores lanzan sus spiders para cartografiar la red, cada cierto tiempo aparece un nueva start-up que va a revolucionar el mundo y cada cierto tiempo alguien escribe "repite conmigo, correlación no implica causalidad". Todos estamos de acuerdo en esto último, pero ¿son correlación y causalidad un amor imposible como lo pintan o sencillamente, como diría Facebook, 'es complicado'?

Pero antes de continuar, tengo que confesar un conflicto de intereses. No me pasa muy a menudo, pero recuerdo perfectamente la primera vez que escuché esa frase. Sería julio (pero un julio de verdad, andaluz, inmisericorde) sobre las tres de la tarde y yo tendría 16 años. Inexplicablemente unas 15 personas esperábamos el autobús y yo era de los primeros en la fila. Cuando llegó, entré rápido buscando el aire acondicionado, pero no funcionaba la tarjeta del bonobús. Detrás de mí, la gente se impacientaba, así que me giré al conductor (un señor mayor con cara de señor Wilson) y le dije:

  • Perdone, la tarjeta no funciona.
  • Suele pasar - me dijo mientras me miraba -. Sobre todo cuando tratas de pagar con la tarjeta del videoclub.
  • Uy, es verdad. Disculpe. Es que con este calor estoy como atontado.
  • Correlación no implica causalidad, hijo.

Como podéis entender, mi relación con la famosa frase ha sido conflictiva. Por eso, el hecho de que últimamente cada vez leo y escucho más la frase me ha hecho pensar que o bien tengo una obsesión enfermiza o algo raro está pasando. ¿Os decantáis por la primera? Yo, que me conozco mejor que vosotros, también. Y por eso me fui a "los datos".

"Los datos"

En Menéame, ayer a las 12 de la noche había 70344 comentarios en los que aparecían las palabras "correlación no implica causalidad". Hoy, a la una de la tarde, hay 70364. Según este improvisado y torticero análisis que acabo de realizar: los comentaristas de menéame usan esa frase más de una vez cada hora. Para que os hagáis una idea, en estas horas - y recién salidos los presupuestos de este año - se han posteado dieciséis comentarios con la palabra "Rajoy" por veinte que contenían nuestra frase de marras.

Google Ngram Viewer (la aplicación de Google que nos dice cuantas veces se repite una palabra en su base de datos de libros) también nos puede echar una mano con esto:

Capturacorrelacion

Es curioso que el uso de la frase empezara a extenderse en los 60-70 (y se disparara en los 2000) cuando el "descubridor" de la correlación, el señor Pearson, en 1900 ya decía que "[t]oda causalidad como la hemos definido es correlación, pero lo contrario no es necesariamente verdad".

¿Cómo es posible que una frase estadística se haya hecho tan popular? Y más aún, ¿Como una frase esencialmente cierta puede hacer que estemos tan equivocados?

Existen muchas 'frases hechas' que pese a ser esencialmente ciertas son usadas para justo lo contrario de lo que fueron diseñadas. Uno de mis ejemplos favoritos es 'Don't feed the troll' que de ser una efectiva técnica para garantizar la participación de todos en los espacios de internet ha pasado a convertirse en una excusa para no debatir con nadie que no piense como yo.

"Hemos convertido esta frase en un recurso para rechazar todo aquello que no concuerda con nuestras creencias y prejuicios"

Ese es el caso de la frase que nos ocupa. A día de hoy, cada vez que alguien lanza una hipótesis en internet, alguien la rebate con el famoso 'correlación no implica causalidad'. Y listo. Al siguiente flame. Daniel Engber tiene una recopilación muy interesante sobre cómo (mal)usamos esta frase para rechazar cosas que no nos encajan.

Sí, la frase es correcta...

Aunque lo pueda parecer nada tienen que ver el número de doctores en informática y los beneficios de las salas de recreativos.

Chart

Ni el consumo per cápita de margarina con la tasa de divorcios en Maine.

Chart 1

Y os prometo de verdad que, aunque a todos lo hayamos sospechado alguna vez, Nicolas Cage no es el responsable de las muertes por ahogamiento en las piscinas.

Chart 2

Es cierto, las correlaciones espureas existen y nosotros, sea por sesgos, aprendizaje o costumbre, tendemos a ver en ellas causalidad aunque no exista. Por eso es bueno no olvidarlo.

...pero no hay que sacarla de contexto.

Tener eso en cuenta está bien y es necesario pero dejémoslo claro de una vez: aunque la correlación no implica causalidad, da pistas. Y buenas.

En 1950, Richard Doll y Bradford Hill publicaron un artículo en el que demostraban una solidísima relación entre fumar y el cáncer de lengua. Tan alarmante eran los resutlados que el mismo Doll dejó de fumar. Con el eco mediático, las primeras demandas no tardaron en llegar pero la industria tabacalera, con ayuda del Council on Tobacco Research (creado por ella misma en el 53), consiguió sostener durante más de 35 años que no había "pruebas de relación de causalidad".

Mientras en 1982 Johns-Manville Sales Corp, el mayor productor mundial de amianto, quebraba, las tabacaleras seguían facturando miles de millones por falta de un nexo causal (que sí estaba demostrado en el amianto y el cáncer de pulmón).

Las correlaciones son una de las herramientas más importantes que tienen las ciencias (sean naturales o sociales). No podemos permitirnos renunciar a ellas simplemente porque no son 'suficientemente buenas'.

En el fondo, "Correlación no implica causalidad" es un sencillo recordatorio de que estemos alerta, un recordatorio de que existen correlaciones espureas (algunas muy graciosas), un recordatorio de que no nos dejemos llevar por nuestro sesgos. Pero en ningún caso esta frase significa que las correlaciones no sean interesantes y por supuesto no es una invitación a dejarnos llevar por el resto de nuestros sesgos y prejuicios.

Comentarios cerrados
Inicio