Owwww. Un nouveau projet Apache (Top-Level s'iouplait) pour la gestion du données. Une sorte de micro-batching, mais sans sérialisation / désérialisation. Et donc, visiblement plus rapide.
À tester donc.
Génial. Une lib Python pour trainer et utiliser des réseaux de neurones. Toute sorte de réseaux. À garder absolument sous le coude.
Reparlons des boîtes noires et de l'algo magique : cette infographie illustre la problématique en terme de probas.
Même en prenant des hypothèses hyper-optimistes (du genre, l'armée développe le meilleur algo de machine-learning qui n'aie jamais existé ET la science bien de faire un saut en avant) on obtient moins de 1% des terroristes détectés et plusieurs centaines de milliers d'innocents emmerdés par la police. Shit happen.
Font chier les maths.
Pas con : pour mesurer la popularité de différents outils en entreprise, ces gens ont mesuré sur des plateformes d'offre d'emploi les occurrences des différents noms (en les débarrassant des ambiguïtés)
Intéressant.
Très bon historique des technologies de stockage de données. Où l'on voit que tout n'est qu'un problème de performance et de bottleneck.
Franchement, j'dois dire un grand merci à Shaarli (donc à SebSauvage et les contributeurs du projet)
J'suis -- encore -- à la bourre pour une présentation importante à mon travail. Manque d'inspiration.
Puis « tiens, si j'allais voir dans mon Shaarli si j'ai deux trois ressources pour un canevas de prés… WHAAAAT !!?? »
Parfait mon poto, tu viens d'sauver ma nuit !
Le paradoxe de Braess vachement bien expliqué.
Ça va certainement me servir.
10 points d'analyse statistique à respecter. Intéressant.
Hadoop 2 est sorti !
(félicitations encore à Apache qui fait un grand boulot)