Êtes-vous un bon statisticien ?

Daniel Kahneman a consacré une partie de son travail à montrer que nous sommes de piètres statisticiens, alors que nous avons tendance à nous fier à notre intuition dans ce domaine. À sa grande surprise, ce constat concerne également un nombre important de professionnels des probabilités.

Rien de tel qu’un petit exemple, tiré de mon livre Mieux Réussir Ensemble, pour vous en convaincre.

Vous réalisez chez votre médecin un test de dépistage d’un type de cancer qui touche 0,1 % de la population. Quelques semaines plus tard, le verdict tombe : positif. Vous demandez alors à votre médecin si le test est fiable. Celui-ci vous explique que : « si vous avez le cancer, le test sera positif dans 90 % des cas. Et si vous ne l’avez pas, il sera négatif dans 97 % des cas ».
Quelle est, selon vous, la probabilité réelle d’avoir contracté cette maladie ? 90 % ? Plus ? Moins ?

Il s’agit de probabilités conditionnelles, aussi appelée probabilités bayésiennes. Développons le raisonnement et imaginons que 10 000 personnes effectuent le test de dépistage.

  • Puisque ce type de cancer touche 0,1 % de la population, 10 personnes de cet échantillon seront effectivement touchées.
  • Puisque le test est fiable à 90 %, seuls 9 sur ces 10 malades obtiendront un résultat positif.
  • Quid des 9 990 personnes restantes, celles dont on sait qu’elles sont saines ? Parmi elles, le test de dépistage sera négatif dans 97 % des cas.
  • Il y aura donc grosso modo 9 690 tests négatifs et 300 tests positifs. Ce sont les faux positifs.
  • En conclusion, sur l’échantillon de 10 000 personnes, 309 auront été testées positives pour seulement 9 « vrais positifs » (réellement malades).

À combien tombe votre probabilité d’être réellement atteint du cancer après avoir été testé positif ? 9/309. Soit… 2,9 % ! Étonnant, n’est-ce pas ?

La raison principale de nos erreurs probabilistes réside dans le fait que nous avons tendance à négliger le « taux de base ». Le taux de base représente la distribution des éléments étudiés dans le contexte considéré. Dans l’exemple ci-dessus, le taux de base est : 0,1% de la population est touchée par ce type de cancer. C’est un élément décisif dans le calcul qui nous occupait.