« Nous avons juste un nouvel exemple, caricatural, de ce qu'est l'élite française. Un refus d'être contrôlé, et un mépris plus que souverain pour tout ce qui ne vient pas de la caste. »
« Il faut en finir avec ces élites. Certes, les mandarins vont continuer à couiner, voire à cogner. Ils trouveront encore un peu d'échos dans leur milieu, mais c'est bien tout. Le ton de la tribune et la pauvreté de l'argumentation montrent bien à quel point cette élite à l'ancienne est démunie face à l'émergence des données, et des possibilités de communication offertes à la société civile par internet. »
Rien ne change, tout va bien.
via : https://twitter.com/laurentchemla/status/580477524918067200
Un article sur l'erreur méthodologique de comparaison des rendements en agriculture bio versus conventionnelle. C'est intéressant d'un point de vue statistique et de modélisation, mais ça reflète également des problèmes de notre système : les modes de publication scientifique, la politique agricole, etc.
« En bio, les paramètres n’ont de sens que dans leurs relations mutuelles et varient toujours de façon combinée. Par conséquent, faire varier « un unique paramètre » dans un système biologique signifie très exactement nier ce système, le détruire, le trahir. »
Autrement dit, le conventionnel c'est faire pousser une plante, et le bio, s'occuper d'un système (dans le sens technique du terme)
Encore autrement, et comme c'est dit dans l'article : « la bio, ce n'est pas le conventionnel "moins" la chimie »
Je sais pas si c'est sérieux ce graphique, mais ça prête à réflexion.
Pas con : pour mesurer la popularité de différents outils en entreprise, ces gens ont mesuré sur des plateformes d'offre d'emploi les occurrences des différents noms (en les débarrassant des ambiguïtés)
Intéressant.
Très drôles ces sortes de statistiques basées sur des requêtes Google.
Pas mal.
Bon, y a des petites manipulations d'interprétation, mais sur le fond c'est beau. J'ai déjà entendu plus ou moins tous ces chiffres.
Dans la série stat/proba/ML mais surtout corrélation vs. causalité, cette vidéo qui explique comme un charme plusieurs choses.
Cependant gros désaccord sur le comportement à avoir dans ces cas-là, qui est de dire « ben, si on réfléchi, ça se voit bien ! » Pas du tout automatique comme démarche, donc non scientifique. Ça n’empêchera pas les erreurs, mais on passera à côté de choses.
Pour expliquer : il y a corrélation, dépendance et causalité. Seule la dernière notion nécessite une démarche interactive humaine, pas [nécessairement] les autres. En tout cas, des tests bien posés et selon les bonnes hypothèses + démarche = pas de mauvaise interprétation.
Bon, je triche un peu, statistiquement parlant, on interpole souvent l'interprétation à cause de problèmes comme "la suffisance causale" et ce genre de truc, mais OSEF, dans le principe c'est ça.
via : https://twitter.com/Jaddo_fr/status/487665517608849408
C'est bête à rappeler mais c'est intéressant de le voir couché sur papier. Il faudrait que je réfléchisse à quels algos je mettrais dans un top-10…
via : https://twitter.com/romainlalanne/status/489711861152362496 (vive lui d'ailleurs, c'est assez cool de le suivre)
À toi qui participe à ce genre de « challenge » (façon de faire travailler gratuitement des gens à forte compétence sur des problématiques hautement stratégiques) merci de recevoir mon mépris le plus total.
Citation : « Les 3 meilleurs contributeurs recevront chacun 600 € en "chèque cadeau SNCF" » … #CQFD
Pas mal ces infographies, pour tenter de comprendre à quoi est lié le bonheur (attention, aucune étude statistique de dépendance, juste de la stat exploratoire qui décrit l'évolution de certains critères, comme le bonheur, l'argent, etc. au cours de la vie)
Du coup, c'est un premier travail de recoupement très intéressant pour commencer des études stat' complètes dans certains pays. Et donc pouvoir ensuite "driver" la politique via des leviers (si jamais il nous prenait le malheur de s'intéresser à l'intérêt général)
« La preuve que les statistiques c'est du grand n'importe quoi »
Euh, justement le site montre exactement le contraire…
Très intéressant. Bon, c'est plein de petites imprécisions mais le propos général est plaisant.
Pour résumer : là où les statistiques ont permis d'étudier la société à gros grains, donc en lissant les différences (par l'utilisation de "segments" "groupes" "moyennes / écarts-types" "clusters" etc.) l'informatique et le stockage de très nombreux critères descriptifs parvient à montrer et utiliser la complexité dont nous sommes faits. C'est vraiment une bonne chose que de ne plus "catégoriser" aussi facilement, parce que justement nous devenons conscience de la complexité intrinsèque de chaque personne.
Article intéressant, à classer dans mes liens "statistiques probabilités sondages" (il s'avère que c'est un sujet qui m'intéresse beaucoup et un peu mon métier)
En résumé : quelques pièges à éviter (que les manipulateurs exploitent à fond) pour faire de l'analyse de données (il en manque pas mal d'autres, mais c'est un bon début)
Dans la série probabilités/statistiques/sondages, un site tout à fait intéressant : il liste des corrélations très fortes entre deux phénomènes sans qu'on puisse les rapprocher.
Autrement dit, un site à montrer à tous ces malinformés de journalistes et autres politiques manipulateurs qui nous montrent des corrélations de partout pour expliquer n'importe quoi.
Oh marrant : Pierre-Feuille-Ciseaux, lorsqu'il est joué par des humains, n'est pas un jeu de pur hasard. Et il existe donc des stratégies qui permettent de gagner statistiquement.
Une data-vis assez intéressante basée sur les données INSEE sociaux-géographiques de la répartition des revenus. Pas de surprise en effet, ni au global, ni dans le détail.
via : http://www.rue89.com/2013/12/19/bleu-les-riches-rouge-les-pauvres-faites-test-quartier-248481
Ça, faut vraiment que je le garde sous la main. Dans la série : "stats, probas, manipulation des masses, mensonge"
C'est bien présenté en plus. C'est un exemple concret de comment présenter des chiffres liés à une diminution du risque après prise d'un médoc pour laisser penser à une grande efficacité. Et ce, simplement en jouant avec les notions de risques relatifs et risques absolus.
Je cite, en vrac :
« [exemple du DABIGATRAN] Concernant :
Le risque d'AVC ou d'embolie systémique : - 33%
Le risque d'hémorragie intracrânienne : - 59%
Le risque d'AVC hémorragique : - 73% »
et plus loin :
« Résumons-nous :
Quand le labo vous dit -33% il faut comprendre -1%
Quand le labo vous dit -59% il faut comprendre -0,9%
Quand il vous dit -73% il faut comprendre -0,5%
»
Ah tiens, j'avais râté cet exemple de manipulation (habituelle sur ce genre de sujet). Alors que l'enquête PISA nous dit que la France a … dégringolé (pour les médias = passée de 23 à 25ème place d'un classement ayant aujourd'hui 65 individus, et moins lors de la précédente) elle dit aussi que la marge d'erreur est de … 5.
Donc en fait rien. Pas de conclusion dite "significative". On nous bourre le crâne. Et Schneidermann l'a bien compris, j'en suis ravi (d'autant plus que c'est rare)
[Merde, fermé sans avoir sauvé ; je recommence]
Un article intéressant qui va raviver les débats bayésiens versus classiques (dit-on classiciens ? Ou classisticiens ?)
En gros, un article publié dans PNAS affirme que les expériences basées sur de la stat (massive j'ajouterais) se gourent souvent. Et que c'est la cause d'une grande difficulté à reproduire les expériences et avoir les mêmes résultats. En cause, la valeur de « seuil de confiance » utilisée en stat classique. Habituellement fixée à 5%.
Et du coup, le débat fait rage avec les adeptes des méthodes bayésiennes, car cette valeur n'existe pas. Bon, sachant de quoi je parle, je sais qu'il existe de bien pires ennemies encore dans les méthodes bayésiennes, mais tout ça alimente le débat.
Bref, pour ma part, une affaire vachement intéressante et donc à suivre. Ça aura des implications bien en dehors du monde de la science.
via : Margaux (http://www.margaux-perrin.com/serendipity) et Julien@Facebook.
Toujours aussi sympa cette BD : comment les journalistes traitent l'information "statistique" dans leurs journaux.
Je tiens à dire que j'approuve complètement ce message.