La causalité n’est pas simple corrélation ou la confusion logique dans l’analyse de données

La boulimie de chiffres, caractérisant si bien notre société actuelle, se lit également dans la pléthore presque infinie de séries statistiques à notre disposition. Ainsi, on pourra, par exemple, facilement trouver l’évolution temporelle du nombre de voitures dans notre pays, de résidents, ou de travailleurs.
La tentation est donc grande de confronter parallèlement l’évolution de deux (ou plusieurs) de ces séries et, par la même, établir une possible corrélation entre elles. Mais, l’existence d’une corrélation – ou, par une paraphrase, d’un synchronisme des mouvements historiques – de ces séries n’assure en rien l’existence d’un lien de causalité entre elles. En d’autres termes, rien nous dit que les variations enregistrées dans l’une soit à la base des variations (pourtant simultanées-ou très proches- temporellement) dans l’autre.
Un exemple extrême s’impose pour bien illustrer ces propos.  Supposons que nous revêtons le rôle d’un observateur décidé à collecter- simultanément- le nombre de patients admis dans un hôpital et le nombre de décès dans la même institution. On sera point surpris d’y découvrir une forte corrélation entre ces deux variables : Dans les jours de forte affluence à l’hôpital, il est fort probable d’enregistrer (avec un délai temporel somme toute négligeable) une augmentation significative du nombre de décès. Sur la base d’un tel constat, on pourrait même conclure à la dangerosité de l’hôpital ; un homme politique à court de réflexions, mais bien imbibé de chiffres, pourrait demander la fin de cette institution !
Maintenant, l’absurdité de ce type de démarche est claire à nous tous : Les véritables causes de l’augmentation de la mortalité ne sont point à rechercher au niveau de l’institution, mais plutôt dans le fait qu’il y a plus de gens malades dans la population.
L’exemple, même dans son absurdité, illustre parfaitement un concept fondamental : pour la compréhension d’un phénomène, il nous faut une théorie qui puisse nous faire prendre du recul par rapport aux chiffres collectées, et nous obliger à nous renseigner sur l’état du système dans son ensemble et donc sur les véritables changements qu’il est en train de subir.
Ainsi, pour utiliser une dernière fois notre exemple, on pourra s’interroger sur l’existence d’un éventuel problème d’eau potable comme véritable source de l’augmentation de malades dans la population.
Deux sortes de conclusion s’ouvrent à nous :

A. D’un point de vue purement logique, dans un monde où la production statistique est désormais hors contrôle, il faut réactualiser l’ancien proverbe « comparaison n’est pas raison » pour un plus actuel « corrélation n’est pas raison ».
De nos jours, trop souvent on assiste à des liens de cause à effet établis juste sur la base de séries dont les valeurs sont connues (accidentellement) le même jour. L’exemple classique est l’établissement d’une causalité avérée entre l’évolution du nombre de chômeurs et celle de l’immigration (nette) de nouveaux travailleurs.
Ce faisant, on oublie de considérer plusieurs autres variables (bien plus importantes) pour expliquer l’augmentation du chômage, comme :

  • Le vieillissement de la population active indigène et donc une augmentation des coûts salariaux brute, ce qui poussent bien des entreprises (dans beaucoup de secteurs) à se passer de cette main-d ‘ouvres.
  • La course effrénée à l’efficience économique de la part des entreprises dans plusieurs secteurs d’activités (par exemple, industrie des machines, chimie, certain services IT) ; obéissant à un marché de plus en plus globalisé et concurrentiel, lequel marché leur impose un prix de vente qui réduit leur marge et les force à réduire leur coût de production.
  • Le progrès technologique qui permet d’une part, la substitution du facteur travail par du capital, d’autre part d’externaliser le travail en le transférant dans des unités de production loin du pays.

B. Pour éviter le piège de relier corrélation à raison, il nous faut comprendre le fait (phénomène) socio-économico-politique dans son environnement et sa complexité : Le seul guide ici est le recours à un discours théorique qui lui seule peut nous aider à visualiser les véritables causes.

Cependant, le bon usage de l’outillage théorique implique du temps de la réflexion et de la prise de distance :
Des denrées bien rares dans le monde actuel qui fait des commentaires rapides en 150 caractères maximum, et délivrés à la minute près, sa vraie raison d’être.

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s