Décidément, j'aime beaucoup ce blog / chaîne Youtube de science.
Dernière vidéo en date sur ce « crétin de cerveau » c'est-à-dire les biais cognitifs. Et cet épisode m'inspire particulièrement parce qu'il parle de probabilités et de l'impossibilité pour l'être humain de les ressentir correctement.
Regardez donc la vidéo, faites vos choix et fur et à mesure et … WTF ! J'adore :)
Wow, très intéressant. Quelques bouts de codes et un peu de théorie sur la robustesse en apprentissage statistique. Voir les slides aussi, très intéressantes (bien qu'assez peu "autoporteuses" : le speech aurait été un plus)
via : https://twitter.com/dataandme/status/757648167940816896
Un excellent article de JADDO sur les diagnostics systématiques de certains cancers. Il y a de tout : une explication du calcul de la balance bénéfice-risque, un peu de théorie sur les probabilités conditionnelles (théorème de Bayes), et état des lieux et plein d'études citées et référencées. Bref, un article très accessible pour parler d'un truc qu'on devrait tous connaître avant d'accepter un diagnostic systématique.
À lire donc !
Article et vidéo sur un biais cognitif : l'effet d'ancrage. Que je ne connaissais pas. Honte à moi.
Bien documenté.
Super vidéo sur l'effet Halo (biais cognitif qui nous laisse penser que les plus grands / plus beaux, sont plus capables).
Une vidéo humoristique pour donner quelques statistiques à propos du terrorisme. Percutant.
Reparlons des boîtes noires et de l'algo magique : cette infographie illustre la problématique en terme de probas.
Même en prenant des hypothèses hyper-optimistes (du genre, l'armée développe le meilleur algo de machine-learning qui n'aie jamais existé ET la science bien de faire un saut en avant) on obtient moins de 1% des terroristes détectés et plusieurs centaines de milliers d'innocents emmerdés par la police. Shit happen.
Font chier les maths.
Un vrai bon article sur le dépistage du cancer du sein, et sa balance bénéfice risque, expliquée en chiffres.
Voir aussi (important !) : http://docteurdu16.blogspot.fr/2015/10/desorganiser-le-depistage-organise-du.html
Apparemment, il existe une bonne littérature sur le sujet : d'abord Prescrire (!), ensuite des professeurs de médecine ou de simples badauds informés (Rachel Campergue).
D'ailleurs, pour cette dernière, il est très intéressant de lire son commentaire dans le second article, qui dit bien (si j'ai bien compris) qu'il ne faut pas rejeter en bloc l'idée de diagnostic, mais qu'il faut parfaire ce dernier.
C'est rafraichissant de lire ça.
EDIT : je rajoute cet article : https://30ansplustard.wordpress.com/2015/10/07/deconstruction-dune-manipulation/
Un bon et utile rappel sur le SIDA, à l'occasion de la campagne annuelle pour la prévention et l'information.
Quelques proba (qui sont incroyablement basses, mais la loi des grands nombres existe même et surtout avec les maladies) :
« [from Wikipedia]
La campagne de AIDES est très bonne d'ailleurs, et j'aime beaucoup son principe : ils ont "humanisé" le SIDA en le faisant participer (virtuellement je crois) aux réseaux sociaux. Une petite voix qui vient dire : je suis là, hého.
J'aime bien les décodeurs. C'est un travail sain et nécessaire. Mais qui se sent encore concerné par la vérité ?
Notamment le fameux cliché du français glandeur (qui pourtant est l'un des plus productif au monde) : http://www.lemonde.fr/les-decodeurs/article/2014/09/18/la-france-pays-ou-l-on-travaille-le-moins_4489150_4355770.html
via : https://twitter.com/romainlalanne/status/575650394161938432
Un bon résumé des manipulations, tromperies et mensonges des instituts de sondage français. Et encore, je pourrais rajouter une foule d'arguments, à la pelle.
Euh… mais c'est pas interdit ce genre de pratiques ?
Shorter : les pinces de fête foraines sont totalement réglables (en tout point) pour offrir le rendement monétaire. Pire, certaines parties ne peuvent être gagnantes (ce qui devrait constituer le délit, puisque plus de place au hasard ; ce qui est fâcheux dans un jeu de … hasard.)
Tiens, il me semblait l'avoir déjà publié, mais je ne le retrouve pas.
Des explications sur les notions de risque statistique, d'étude de mise sur le marché / efficacité / impactologie / etc., et du fameux problème du paradoxe de Simpson (facteur de confusion caché)
C'est vraiment très intéressant de l'expliquer comme ça : simple, efficace.
via : https://twitter.com/Dr_Stephane/status/591512248230617089
Un avis éclairé et technique de chercheurs sur les algorithmes des boîtes noires et leurs performances attendues. Je suis totalement de cet avis, avec à peu près les mêmes arguments.
(diantre, mais pourquoi, dès que des chercheurs sont interrogés, on se sent obligé de glisser ce genre de truc : « Cet entretien reflète exclusivement l'opinion de ses auteurs et n’engage en aucune façon l’Inria. » Il n'y a plus si longtemps, le corps des chercheurs était l'un des rares corps de fonctionnaires à avoir un droit et une liberté de parole totale. D'où l'absence de nécessité d'user de ce genre de truc… Ça m'agace, ça montre que même leur liberté s'effrite)
via : https://twitter.com/FlorianP123/status/595867822632361984
Un article sur l'erreur méthodologique de comparaison des rendements en agriculture bio versus conventionnelle. C'est intéressant d'un point de vue statistique et de modélisation, mais ça reflète également des problèmes de notre système : les modes de publication scientifique, la politique agricole, etc.
« En bio, les paramètres n’ont de sens que dans leurs relations mutuelles et varient toujours de façon combinée. Par conséquent, faire varier « un unique paramètre » dans un système biologique signifie très exactement nier ce système, le détruire, le trahir. »
Autrement dit, le conventionnel c'est faire pousser une plante, et le bio, s'occuper d'un système (dans le sens technique du terme)
Encore autrement, et comme c'est dit dans l'article : « la bio, ce n'est pas le conventionnel "moins" la chimie »
Dans la série stat/proba/ML mais surtout corrélation vs. causalité, cette vidéo qui explique comme un charme plusieurs choses.
Cependant gros désaccord sur le comportement à avoir dans ces cas-là, qui est de dire « ben, si on réfléchi, ça se voit bien ! » Pas du tout automatique comme démarche, donc non scientifique. Ça n’empêchera pas les erreurs, mais on passera à côté de choses.
Pour expliquer : il y a corrélation, dépendance et causalité. Seule la dernière notion nécessite une démarche interactive humaine, pas [nécessairement] les autres. En tout cas, des tests bien posés et selon les bonnes hypothèses + démarche = pas de mauvaise interprétation.
Bon, je triche un peu, statistiquement parlant, on interpole souvent l'interprétation à cause de problèmes comme "la suffisance causale" et ce genre de truc, mais OSEF, dans le principe c'est ça.
via : https://twitter.com/Jaddo_fr/status/487665517608849408
Article intéressant, à classer dans mes liens "statistiques probabilités sondages" (il s'avère que c'est un sujet qui m'intéresse beaucoup et un peu mon métier)
En résumé : quelques pièges à éviter (que les manipulateurs exploitent à fond) pour faire de l'analyse de données (il en manque pas mal d'autres, mais c'est un bon début)
Dans la série probabilités/statistiques/sondages, un site tout à fait intéressant : il liste des corrélations très fortes entre deux phénomènes sans qu'on puisse les rapprocher.
Autrement dit, un site à montrer à tous ces malinformés de journalistes et autres politiques manipulateurs qui nous montrent des corrélations de partout pour expliquer n'importe quoi.
Oh marrant : Pierre-Feuille-Ciseaux, lorsqu'il est joué par des humains, n'est pas un jeu de pur hasard. Et il existe donc des stratégies qui permettent de gagner statistiquement.