Rôôô, génial : une publication qui explique comment faire des graphes de dispersion qui possèdent les mêmes caractéristiques statistiques (moyennes, écart-types, corrélation) à l'aide d'algorithme de recuit simulé.
Résultat, cette image magnifique :
Dans la série stat/proba/ML mais surtout corrélation vs. causalité, cette vidéo qui explique comme un charme plusieurs choses.
Cependant gros désaccord sur le comportement à avoir dans ces cas-là, qui est de dire « ben, si on réfléchi, ça se voit bien ! » Pas du tout automatique comme démarche, donc non scientifique. Ça n’empêchera pas les erreurs, mais on passera à côté de choses.
Pour expliquer : il y a corrélation, dépendance et causalité. Seule la dernière notion nécessite une démarche interactive humaine, pas [nécessairement] les autres. En tout cas, des tests bien posés et selon les bonnes hypothèses + démarche = pas de mauvaise interprétation.
Bon, je triche un peu, statistiquement parlant, on interpole souvent l'interprétation à cause de problèmes comme "la suffisance causale" et ce genre de truc, mais OSEF, dans le principe c'est ça.
via : https://twitter.com/Jaddo_fr/status/487665517608849408