statistiques trompeuses

Voir le sujet précédent Voir le sujet suivant Aller en bas

statistiques trompeuses

Message  gérard menvussa le Ven 31 Mai - 19:34

Dans une discussion, nous sommes souvent confrontés à des chiffres donnés par le calcul de probabilité. Or celui ci comporte des "biais" (pour nous tromper, de bonne ou mauvaise fois) qu'il est important de connaitre. L'un des plus redoutable est les erreurs entrainées par les "probabilités conditionnelles". Trouvé sur le "c@fé des sciences, un excellent article (trés pédagogique) sur le coté trompeur des "probabilités conditionnelles :


Probabilités inversées et propagande
Posté le 28 mai 2013 - 745 vues
21

conditional_riskLe printemps et mes allergies revenus, j’ai décidé de passer par la pharmacie acheter quelques anti-allergiques. Après m’être passablement énervé contre la pharmacienne qui me proposait de l’homéopathie (les allergies me rendent grincheux…), j’ai décidé de me remonter le moral en lisant quelques billets du blog Le Pharmachien (efficacité garantie!) et notamment son comic strip à propos de la dépression. Je tombe alors sur cette info qui me rappelle des souvenirs: près de 3/4 des personnes commettant un suicide souffraient de dépression. Tiens, tiens, ne serait-ce pas là un exemple de « probabilité inversée »?!

Probabilité conditionnelle

Mathématiquement, on note p(A|B) -prononcez p de A sachant B- la probabilité que l’évènement A se produise sachant que B a eu lieu. Il s’agit d’une probabilité conditionnelle. Or cela peut paraitre étrange au premier abord mais p(A|B) n’est généralement pas égale à p(B|A). Sur l’exemple cité, si on note A l’évènement « commettre un suicide » et B « souffrir de dépression », p(A|B) donne la probabilité de commettre un suicide sachant qu’on est dépressif et p(B|A) celle d’avoir affaire à une personne dépressive sachant que cette personne s’est suicidée. Vous voyez la différence?

Dans notre exemple 1, calculer p(B|A) est simple: il suffit de recenser le nombre de suicidés et de regarder si ces personnes étaient dépressives ou non avant leur suicide. »3/4 des personnes commettant un suicide souffraient de dépression » nous donne justement cette information. Or, ce qui généralement peut intéresser l’entourage d’une personne dépressive, c’est de savoir la probabilité que cette connaissance se suicide, ce qui n’est certainement pas de 75% (3/4), du moins je l’espère!

Propagande

En fait, Wikipedia avance un pourcentage de 3,4% aux USA et j’imagine que cela doit être du même ordre de grandeur en France. Concrètement, une personne déprimée a environ 3% de risque de se suicider. Remarquez que cette donnée fait beaucoup moins peur que le 3/4 avancé au départ. Vous l’aurez donc compris, la confusion entre p(A|B) et p(B|A) est ici entretenue à des fins de propagandes (consciemment ou non). On comprend aisément l’importance d’un tel message, mais on peut regretter l’utilisation abusive de ce genre de probabilité « inversée » notamment par la grande presse. On pourrait faire passer le même message tout en gardant le caractère agressif en parlant en terme de probabilité relative: une personne dépressive a 30% de risque en plus qu’une personne saine de ce suicider 2. Ce qui me semble suffisamment fort pour faire passer le message de sensibilisation.

Manipulation

« Seulement un homme sur mille qui maltraite sa femme finit par la tuer. » C’est l’argument utilisé par les avocats de O.J. Simpson pour le défendre pendant son procès 3. Les violentes disputes entre sa femme et lui n’étaient pas contestées mais la défense cherchait à démontrer avec cet argument que la probabilité que Simpson ait tué sa femme était extrêmement faible. La manipulation vous saute-t-elle aux yeux? Elle n’est pas forcément évidente.

Il ne s’agit pas tout à fait d’un cas de probabilité « inversée », mais cela y ressemble bougrement. Notons A l’évènement « le mari tue la femme » et B l’évènement « le mari bat la femme ». Les avocats nous donnent p(A|B) qui est faible et ce n’est pas une surprise. Après tout, la plupart des femmes ne sont pas tuées et cela reste vraie même pour celles qui sont victimes de violences conjugales. Or la donnée qui nous intéresse ici est tout autre puisque nous savons déjà que la compagne a été tuée. En d’autres termes, un jury devrait plutôt se demander quelle est la probabilité que le mari soit coupable sachant que la femme est morte et que son mari la violente? Ou encore, quelle est la probabilité qu’une femme battue par son mari soit tuée par quelqu’un d’autre que son mari? On conçoit alors volontiers que le risque que le mari ait tué sa femme est bien plus grand que le 1/1000 annoncé au départ 4

Les probabilités, il faut s’en méfier!

Les médias sont toujours très friands de ces probabilités « inversées » car l’effet choc est généralement assuré. Souvenez-vous par exemple du tollé qu’avait crée Eric Zemmour qui affirmait quelque chose du genre: la grande majorité des délinquants sont noirs ou arabes. Un bel exemple de probabilité inversée, car si les noirs et les arabes sont surreprésentés chez les délinquants ce qui nous intéresse ici est de savoir quelle est la probabilité qu’une personne noire ou arabe soit un délinquant? Évidemment, cette probabilité est beaucoup plus faible et contredit l’idée reçue que les étrangers sont des délinquants et sur lequel Zemmour cherchait à surfer du temps de sa médiatisation.

On pourrait par ailleurs signaler un deuxième biais de raisonnement dont on a régulièrement parlé sur ce blog et qui se cumule avec ce jeu « d’inversement » sur les probabilités: corrélation et causalité. La corrélation éventuellement observée entre noirs, arabes et délinquants, n’impliqueraient pas forcément une causalité: parce qu’ils sont noirs et arabes, ils sont délinquants. Il est d’ailleurs évident que la première cause de délinquance est à chercher du côté des conditions sociales et non d’une quelconque couleur de peau ou de « culture ». Mais ceci est un autre débat!

Maintenant que vous savez tout ou presque 5, c’est à vous de jouer! Je vous invite à poster vos plus beaux exemples de probabilités inverses et un peu moins glauques que ceux que j’ai donnés, hein!
avatar
gérard menvussa

Messages : 6658
Date d'inscription : 06/09/2010
Age : 60
Localisation : La terre

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: statistiques trompeuses

Message  gérard menvussa le Lun 3 Juin - 18:30

Beaucoup d'autres "biais" (on appelle "biais" en science une erreur faite "en toute bonne fois") peuvent être trouvé. Sans compter bien entendu les erreurs de statistiques faites "en connaissance de cause" (et en manipulant volontairement les chiffres) Tout cela nécessite tout un ensemble de connaissances plus ou moins pointue du domaine, c'est a dire des mathématique (aie aie aie, s'écrie la plupart de l'assistance) Et pourtant c'est diablement utile...
Une petite biographie :
Joseph Klatzmann Attention statistiques Editions la découverte
Nicolas Gauvrit Statistiques : Méfiez-vous ! Ellipses Marketing
François Grosjean, Jean-Yves Dommergues et Gilles Macagno La Statistique en clair Ellipses Marketing
avatar
gérard menvussa

Messages : 6658
Date d'inscription : 06/09/2010
Age : 60
Localisation : La terre

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: statistiques trompeuses

Message  yannalan le Mar 4 Juin - 8:52

Pour donner un exemple de perspectives trompeuses: le dernier rapport de la Médiatrice de l'Educ Nat parles des conseils de discipline et dit assez dramatiquement en gros " plus de 80% se traduisent par une exclusion définitive" :
Ca fait énorme. Juste, faut savoir que c'est une procedure lourde , chiante et assez dramatique. Donc quand le collège la sort, c'est qu'il y a eu un TRES gros problème. Au CE où bosse ma compagne, dans les dernières années, les exclusions ont concerné un trafic de hasch et deux menaces par armes blanches (sérieuses", pas un canif).
Donc ça fait 100%... Si on regarde que le chiffre, ça fait répression horrible...

yannalan

Messages : 2073
Date d'inscription : 25/06/2010

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: statistiques trompeuses

Message  Achille le Mar 4 Juin - 9:17

Très bon rappel merci, mais attention ici certains pourraient vous dire que c'est du "scientisme". Laughing

Achille

Messages : 2739
Date d'inscription : 24/12/2011

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: statistiques trompeuses

Message  yannalan le Mar 4 Juin - 9:51

Le scientisme c'est le contraire de ça, c'est une attitude de confiance aveugle dans les cientifiques sans regarder l'environnement social et économique.

yannalan

Messages : 2073
Date d'inscription : 25/06/2010

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: statistiques trompeuses

Message  Achille le Mar 4 Juin - 10:11

yannalan a écrit:Le scientisme c'est le contraire de ça, c'est une attitude de confiance aveugle dans les cientifiques sans regarder l'environnement social et économique.

toutafé, confiance aveugle, croyance, ...etc. sont à l'opposé de la démarche scientifique qui repose sur le doute, le questionnement, l'expérience, voire la réfutation Very Happy

Achille

Messages : 2739
Date d'inscription : 24/12/2011

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: statistiques trompeuses

Message  gérard menvussa le Mar 4 Juin - 12:29

Achille a écrit:Très bon rappel merci, mais attention ici certains pourraient vous dire que c'est du "scientisme". Laughing
Un enjeu (entre autre "politique") est de distinguer "science" et "scientisme". Qui sont deux choses bien différentes. Personnellement, "j'aime la science", (c'est même pour ça que je pense qu'il faut la défendre contre le capitalisme) et condamne le scientisme comme idéologie "typiquement bourgeoise" (même si on la retrouve dans certains compartiments du mouvement ouvrier)
Pour en revenir a ce que dit Yannalan, c'est un trés bon exemple, en effet. Qui montre d'ailleurs que les erreurs statistiques ne sont pas "uniquement" dues a une volonté délibérée de nous tromper. Mais nous pouvons également tomber dans des piéges plus ou moins complexes avec la meilleure volonté du monde.
Si ça vous intéresse, je vais préparer un topo sur le "paradoxe de Simpson" (tout a fait redoutable)
avatar
gérard menvussa

Messages : 6658
Date d'inscription : 06/09/2010
Age : 60
Localisation : La terre

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: statistiques trompeuses

Message  Ermolay le Mar 24 Juin - 20:19

Il est vrai qu'un minimum de culture statistique est indispensable a tout-e  citoyen-ne pour ne pas se laisser abuser par les sophismes dont nous sommes continuellement abreuves. Je rappelle le livre deja classique de Normand Baillargeon, "Petit cours d'autodefense intellectuelle", et signale ce recent billet sur l'excellent site "Images des maths".

Ermolay

Messages : 60
Date d'inscription : 21/05/2014

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: statistiques trompeuses

Message  Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Voir le sujet précédent Voir le sujet suivant Revenir en haut


 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum