Causalité ou corrélation ?

On était tranquillement en train de regarder passer une fille en jupe rouge, quand Régis nous interpella : “Tu y crois à cette histoire de développement des big data qui nous aurait fait passer de la causalité à la corrélation ?”

Couple assis sur un canapé après une dispute. Le mari tourne le dos à son épouse.
Tablette de chocolat à moitié sortie de son emballage et croquée dans un coin.

Et là, comment dire ? Comme un blanc en terrasse, un trou noir spatio-temporel…
“— Non mais, ça s’est mal passé ta soirée hier, avec Eléonore ? C’est le pain sans gluten qui t’est resté sur l’estomac ? C’est quoi, ces conneries ?
— J’ai entendu ça sur France Culture. Un podcast, cette nuit quand je n’arrivais pas à dormir, un peu à cause de Eléonore, oui, c’est vrai ! Les spécialistes discutaient autour de ça, causalité et corrélation.”

La jupe rouge a disparu, un nuage nous masque le soleil. Régis poursuit.
“— On va faire simple, la corrélation, tu relies deux données, et c’est effectivement ce que les big data brassent à très grosse échelle, aujourd’hui. Ils accumulent une somme considérable de données sur chaque individu. Ils te réduisent même à ça… et ils croisent tout ça en fonction de ce que l’on veut faire dire. Et ça marche à tous les coups. Exemple, quand t’es malade. Surtout ne va pas à l’hôpital. La probabilité de mourir dans un lit d’hôpital est 10 fois plus grande que dans ton lit, à la maison.”

On décortique. On ne meurt pas plus parce qu’on est dans un lit d’hôpital. Mais si on est à l’hôpital, c’est sûrement parce qu’on est plus sérieusement malade. Et  dans ce cas, la probabilité de mourir est plus grande.

A l’inverse, pour déterminer la nature du lien de causalité entre plusieurs éléments, c’est plus complexe. Ça marche pas bien avec les algorithmes qui sont finalement… très binaires. La causalité, cela demande du temps et de la distance, c’est du billard à 5 bandes.

Et Régis de reprendre :
“— Moi par exemple, à chaque fois que je mange du chocolat, cela me donne des boutons. Donc, d’après toi, c’est de la causalité ou de la corrélation ?
— OK, tu as deux éléments. Tu manges du chocolat et des boutons apparaissent. Tu fais le lien entre la consommation de chocolat et l’apparition de boutons. Corrélation OK. Et pourtant, tu peux voir les choses avec plus de distance… Si tu manges du chocolat, c’est peut-être que Eléonore, hier soir, elle t’a stressé, et c’est peut-être le stress qui te colle des boutons. Stress, chocolat, boutons. Tu vois ?
— T’as raison, faut vraiment que j’arrête le chocolat !”