Excellent article sur l'idée de la "singularité". Une sorte de mot clé totalement hype que tous les prévisionnologues s'emploient à utiliser partout. Une analyse critique donc :
Jean-Gabriel Ganascia constate que le succès du mythe de la Singularité tient pour beaucoup à l’hubris, l’ivresse de la démesure des grandes sociétés du web. Nous sommes face à des gens qui ne voient aucune limite à leurs succès financiers, à leur esprit de conquête… Les succès technologiques qu’ils connaissent les encouragent : ils sont persuadés de posséder les clefs du futur. L’hypothèse de la Singularité est à la fois la rencontre entre l’éblouissement de leurs propres exploits, l’assurance de pouvoir les démultiplier encore et aussi de les maîtriser, d’en limiter les conséquences…
Mais, ce pouvoir cache en fait une faiblesse, lié justement à la promesse bien trop forte d'un futur différent. Bref, les sociétés du web sont survendues, on le sait :
Ce besoin d’un grand récit concurrentiel va de pair avec ce sentiment de pouvoir… d’entrepreneurs dont les capitalisations représentent des centaines de fois leurs chiffres d’affaires. Pour rester dans des situations de pouvoir, ils doivent proposer un grand récit, un récit fou, exagéré, prophétique qui semble d’ailleurs toujours plus développé. « On lève de l’argent avec un récit de disruption et de transformation du monde très élevé », qui s’apprend d’ailleurs…
Article long, mais à lire, donc (et peut-être le bouquin dont il est question)
via : https://twitter.com/MaliciaRogue/status/879293700551172096
Owwww. Un nouveau projet Apache (Top-Level s'iouplait) pour la gestion du données. Une sorte de micro-batching, mais sans sérialisation / désérialisation. Et donc, visiblement plus rapide.
À tester donc.
Une carte montrant le déplacement des vélibs par heure à Paris. Apparemment, tout le monde commence à bosser à la même heure ! et habite à l'extérieur de Paris. En tout cas, j'aime bien ce genre de visualisation.
Facebook met à disposition en open-source des outils de machine-learning ou deep-learning. Ils travaillent (évidemment) beaucoup sur le sujet actuellement.
À garder sous le coude.
via : https://twitter.com/erikbryn/status/556454800150499328
Un avis éclairé et technique de chercheurs sur les algorithmes des boîtes noires et leurs performances attendues. Je suis totalement de cet avis, avec à peu près les mêmes arguments.
(diantre, mais pourquoi, dès que des chercheurs sont interrogés, on se sent obligé de glisser ce genre de truc : « Cet entretien reflète exclusivement l'opinion de ses auteurs et n’engage en aucune façon l’Inria. » Il n'y a plus si longtemps, le corps des chercheurs était l'un des rares corps de fonctionnaires à avoir un droit et une liberté de parole totale. D'où l'absence de nécessité d'user de ce genre de truc… Ça m'agace, ça montre que même leur liberté s'effrite)
via : https://twitter.com/FlorianP123/status/595867822632361984
Une dataviz des migrations à travers les âges. Réalisée et publiée dans la revue Nature.
De la grosse architecture Big Data chez BitLy. Je serais curieux d'y jeter un œil en détail. Du coup, je me garde la vidéo pour quand je rentre de mes vacances (faut pas déconner, ça reste du travail :p) : http://devslovebacon.com/conferences/bacon-2014/talks/lessons-learned-building-distributed-systems-at-bitly
10 points d'analyse statistique à respecter. Intéressant.
Bon, ça commence à ressembler à quelque chose. Le nouveau portail data.gouv.fr dédié à l'open-data vient de paraître. L'organisation est encore un peu chaotique, les données n'ont pas forcément une belle normalisation, mais le contenu est là.
Personnellement, ça va bien me servir. Citoyens, data-journalistes, etc. au boulot !
Rapport à ça : http://foualier.gregory-thibault.com/?-hGXRA
Une autre DataViz, cette fois sur les impôts ISF.
Une data-vis assez intéressante basée sur les données INSEE sociaux-géographiques de la répartition des revenus. Pas de surprise en effet, ni au global, ni dans le détail.
via : http://www.rue89.com/2013/12/19/bleu-les-riches-rouge-les-pauvres-faites-test-quartier-248481
Dans le dernier MISC, un dossier très intéressant sur parallélisme, HPC, Big Data (via Map Reduce & analytics), optimisation, instructions SSE, OpenMP, Open CL, GPGPU, etc. Bref, tout ce qui concerne le HPC en général. Avis aux amateurs et big-dateurs.
Hadoop 2 est sorti !
(félicitations encore à Apache qui fait un grand boulot)
Oh, un reportage sur le Big Data et la collecte de données où l'on voit Bluetouff et ensuite, Jean-Marc Manach interrogé.
Bref, en résumé : Big Data, Big Business (même si je m'oppose un peu à l'apposition du terme Big Data ici)
Le reportage se termine dans un datacenter que je connais bien … mais je me demande quel est le rapport (et pour moi il n'y en a pas)
Ouah, du beau boulot. Un bel exemple de data vizualisation à partir des données de "Le Bon Coin"
Et tout ça, avec les détails techniques je vous prie.
via : http://www.rue89.com/2013/09/09/carte-france-bon-coin-245546
Hmmm, une autre utilisation très intéressante techniquement, mais un peu limite en terme de privacy :
« Objectif numéro un du groupe : faire passer son infrastructure d'un centre de coûts à un centre de profit »
De bons cas d'usage de la plateforme Hadoop.
3 DSI qui ont été primées au salon BigData (j'y étais !)