Fou à lier
Nuage de tags
Mur d'images
Quotidien
Flux RSS
  • Flux RSS
  • ATOM Feed
  • Daily Feed
Liens par page
  • 20 links
  • 50 links
  • 100 links
9 results tagged work  ✕
Apache Arrow Homepage
26/02/2016 16:31:08 archive.org
QRCode
cluster icon
  • 10 things statistics taught us about big data analysis | Simply Statistics : 10 points d'analyse statistique à respecter. Intéressant.
  • Hadoop 2 : l'infrastructure Big Data passe à la vitesse supérieure - JDN Web & Tech : Hadoop 2 est sorti ! (félicitations encore à Apache qui fait un grand boulot)
  • Choosing R or Python for data analysis? An infographic | Diego Marinho de Oliveira | LinkedIn : Une comparaison de R et Python pour l'analyse de données. Ça me laisse un peu pantois : on sait déjà tous un peu ça, et les faits ne facilitent pas le...
  • Facebook open-sources new A.I. smarts | Computerworld : Facebook met à disposition en open-source des outils de machine-learning ou deep-learning. Ils travaillent (évidemment) beaucoup sur le sujet actuelle...
  • La force de la donnée molle | Arnaud Vincent | LinkedIn : Très bon article sur les données “molles”. Concept qui recouvre plusieurs choses : les méta-données, la psychologie, et notamment dans la mesure, etc....

Owwww. Un nouveau projet Apache (Top-Level s'iouplait) pour la gestion du données. Une sorte de micro-batching, mais sans sérialisation / désérialisation. Et donc, visiblement plus rapide.

À tester donc.

analytic Apache BigData datascience Hadoop W work
https://arrow.apache.org/
Getting Started — TensorFlow
22/11/2015 18:47:47 archive.org
QRCode
cluster icon
  • Image Synthesis from Yahoo's open_nsfw : Que se passe-t-il quand un réseau de neurones profond (DeepLearning) adapté à la vision/reconnaissance d'images est utilisé en marche arrière (en modè...
  • Teaching image-recognition algorithms to produce nightmarish hellscapes - Boing Boing : Je mets ça ici : le truc de Google en deeplearning, qui « produit des images » par rapport à d'autres, et par voie de ressemblance. Dans ce cas, ce so...
  • meetup_tensorflow_in_context - Google Slides : Intéressante présentation sur TensorFlow, un outil de deep-learning de Google. À garder sous le coude. via : https://www.facebook.com/bdla2014/pos...
  • GitHub - p-e-w/maybe: :rabbit2: See what a program does before deciding whether you really want it to happen. : À garder sous le coude : un utilitaire (sous Python) qui décortique des programmes sous Linux, via l'interception des appels systèmes. Ça ne marche pa...
  • Le deep learning : Supers vidéo et article sur le deep-learning. En particulier les exemples sous la vidéo :)

Génial. Une lib Python pour trainer et utiliser des réseaux de neurones. Toute sorte de réseaux. À garder absolument sous le coude.

apprentissage deep-learning développement imba lib machine-learning neurones programmation réseaux-de-neurones TODO W Work
http://tensorflow.org/get_started
GROCK sur Twitter : "Effets attendus du #PJLRenseignement contre la menace terroriste: Multiplier par 100 les effectifs du renseignement! http://t.co/SBQa4NG1xJ"
09/11/2015 23:53:12 archive.org
QRCode
cluster icon
  • Some Intuition About the Theory of Statistical Learning | Freakonometrics : Wow, très intéressant. Quelques bouts de codes et un peu de théorie sur la robustesse en apprentissage statistique. Voir les slides aussi, très intére...
  • The Popularity of Data Analysis Software | r4stats.com : Pas con : pour mesurer la popularité de différents outils en entreprise, ces gens ont mesuré sur des plateformes d'offre d'emploi les occurrences des ...
  • 40 légendes urbaines, idées reçues et canulars décodés : J'aime bien les décodeurs. C'est un travail sain et nécessaire. Mais qui se sent encore concerné par la vérité ? Notamment le fameux cliché du fran...
  • Loi renseignement : « Des dizaines de milliers de personnes vont être suspectées à tort » : Un avis éclairé et technique de chercheurs sur les algorithmes des boîtes noires et leurs performances attendues. Je suis totalement de cet avis, avec...
  • Same Stats, Different Graphs: Generating Datasets with Varied Appearance and Identical Statistics through Simulated Annealing | Autodesk Research : Rôôô, génial : une publication qui explique comment faire des graphes de dispersion qui possèdent les mêmes caractéristiques statistiques (moyennes, é...

Reparlons des boîtes noires et de l'algo magique : cette infographie illustre la problématique en terme de probas.
Même en prenant des hypothèses hyper-optimistes (du genre, l'armée développe le meilleur algo de machine-learning qui n'aie jamais existé ET la science bien de faire un saut en avant) on obtient moins de 1% des terroristes détectés et plusieurs centaines de milliers d'innocents emmerdés par la police. Shit happen.
Font chier les maths.

algorithme boîtes-noires infographie machine-learning PJLR privacy probabilités statistiques W work
https://twitter.com/leclown/status/603564447521755136
The Popularity of Data Analysis Software | r4stats.com
04/12/2014 14:15:50 archive.org
QRCode
cluster icon
  • GROCK sur Twitter : "Effets attendus du #PJLRenseignement contre la menace terroriste: Multiplier par 100 les effectifs du renseignement! http://t.co/SBQa4NG1xJ" : Reparlons des boîtes noires et de l'algo magique : cette infographie illustre la problématique en terme de probas. Même en prenant des hypothèses hyp...
  • Some Intuition About the Theory of Statistical Learning | Freakonometrics : Wow, très intéressant. Quelques bouts de codes et un peu de théorie sur la robustesse en apprentissage statistique. Voir les slides aussi, très intére...
  • 10 things statistics taught us about big data analysis | Simply Statistics : 10 points d'analyse statistique à respecter. Intéressant.
  • 40 légendes urbaines, idées reçues et canulars décodés : J'aime bien les décodeurs. C'est un travail sain et nécessaire. Mais qui se sent encore concerné par la vérité ? Notamment le fameux cliché du fran...
  • Apache Arrow Homepage : Owwww. Un nouveau projet Apache (Top-Level s'iouplait) pour la gestion du données. Une sorte de micro-batching, mais sans sérialisation / désérialisat...

Pas con : pour mesurer la popularité de différents outils en entreprise, ces gens ont mesuré sur des plateformes d'offre d'emploi les occurrences des différents noms (en les débarrassant des ambiguïtés)

Intéressant.

emploi machine-learning mesure outils popularité statistiques W work
http://r4stats.com/articles/popularity/
Cache is the new RAM | MemSQL - The Database for Speed, Scale & Simplicity
25/11/2014 13:44:47 archive.org
QRCode
cluster icon
  • Yoshinori Matsunobu's blog: Tables on SSD, Redo/Binlog/SYSTEM-tablespace on HDD : Comment configurer sa base de données avec un SSD ? Réponse rapide (pour InnoDB mais généralisable) : - Sur **disque rotatif (HDD)** : REDO logs,...
  • Friends don't let friends use BTRFS for OLTP | PostgreSQL Addict : BTRFS est-il adapté pour les bases de données d'analyse ? Non. Intéressant *benchmarking*. *Shorter*: l'utilisation du *copy-on-write* plombe les ...
  • Alignement de partitions pour amélioration des performances de MS-SQL Server : Intéressant. Je n'avais jamais vraiment entendu parler des problèmes dus à l'alignement de partition sur un disque. J'avais tout juste entendu le term...
  • BBC - Future - These unlucky people have names that break computers : Oh, la pauvre femme. Son nom est J. Null. Oui, son p-m-atronyme est Null. D'autant plus Null que cette valeur est bannie de la plupart des softs (je c...
  • L'amour au temps du chiffrement : Beau. L'amour au temps du numérique, de l'espionnage massif, de la pérennité de la moindre donnée. Une histoire d'amour et de hackers. Je n'ai pas lu ...

Très bon historique des technologies de stockage de données. Où l'on voit que tout n'est qu'un problème de performance et de bottleneck.

via : https://twitter.com/Korben/status/536420009732759552

bases-de-données bottleneck database histoire informatique performances work
http://blog.memsql.com/cache-is-the-new-ram/
Shaarli et mon travail
19/10/2014 23:52:55 archive.org
QRCode
cluster icon
  • 10 things statistics taught us about big data analysis | Simply Statistics : 10 points d'analyse statistique à respecter. Intéressant.
  • Apache Arrow Homepage : Owwww. Un nouveau projet Apache (Top-Level s'iouplait) pour la gestion du données. Une sorte de micro-batching, mais sans sérialisation / désérialisat...
  • Aux lecteurs de SebSauvage : Petit message de service et d'avertissement : suite à des vacances prises l'année dernière j'ai eu un retard fou dans les Shaarli de SebSauvage à lire...
  • Cognitive bias cheat sheet : Wow !! Un mec a fait un travail extraordinaire à partir de Wikipedia : il a recensé les biais dits "cognitifs" dans une grande carte hiérarchique. Je ...
  • Commits · shaarli/Shaarli · GitHub : Et bah franchement, c'est super de mettre à jour Shaarli et de profiter des plugins. J'utilise seulement trois d'entre eux, mais il y en a un qui est ...

Franchement, j'dois dire un grand merci à Shaarli (donc à SebSauvage et les contributeurs du projet)
J'suis -- encore -- à la bourre pour une présentation importante à mon travail. Manque d'inspiration.
Puis « tiens, si j'allais voir dans mon Shaarli si j'ai deux trois ressources pour un canevas de prés… WHAAAAT !!?? »

Parfait mon poto, tu viens d'sauver ma nuit !

datascience imba SebSauvage Shaarli work
?vyvcCQ
Le paradoxe de Braess, ou comment aller plus vite en allant plus lentement - Le Hollandais Volant
30/07/2014 14:44:14 archive.org
QRCode
cluster icon
  • Les 231 morts fictifs de la dompéridone expliqués à ma fille : Tiens, il me semblait l'avoir déjà publié, mais je ne le retrouve pas. Des explications sur les notions de risque statistique, d'étude de mise sur ...
  • L’effet de halo (Crétin de cerveau #1) : Super vidéo sur l'effet Halo (biais cognitif qui nous laisse penser que les plus grands / plus beaux, sont plus capables).
  • You Can’t Sacrifice Partition Tolerance | codahale.com : Article FRANCHEMENT intéressant sur le théorème CAP, qui est souvent mal compris. Il m'a ouvert les yeux alors que je pensais le maitriser. Ceci dit,...
  • 10 things statistics taught us about big data analysis | Simply Statistics : 10 points d'analyse statistique à respecter. Intéressant.
  • Apache Arrow Homepage : Owwww. Un nouveau projet Apache (Top-Level s'iouplait) pour la gestion du données. Une sorte de micro-batching, mais sans sérialisation / désérialisat...

Le paradoxe de Braess vachement bien expliqué.
Ça va certainement me servir.

via : http://sebsauvage.net/links/?XcA1Og

Braess explication paradoxe recherche-opérationnelle science vulgarisation W work
http://lehollandaisvolant.net/?d=2014/07/26/19/15/37-le-paradoxe-de-braess-ou-comment-aller-plus-vite-en-allant-plus-lentement
10 things statistics taught us about big data analysis | Simply Statistics
04/06/2014 16:04:31 archive.org
QRCode
cluster icon
  • Apache Arrow Homepage : Owwww. Un nouveau projet Apache (Top-Level s'iouplait) pour la gestion du données. Une sorte de micro-batching, mais sans sérialisation / désérialisat...
  • Choosing R or Python for data analysis? An infographic | Diego Marinho de Oliveira | LinkedIn : Une comparaison de R et Python pour l'analyse de données. Ça me laisse un peu pantois : on sait déjà tous un peu ça, et les faits ne facilitent pas le...
  • Cognitive bias cheat sheet : Wow !! Un mec a fait un travail extraordinaire à partir de Wikipedia : il a recensé les biais dits "cognitifs" dans une grande carte hiérarchique. Je ...
  • Comparison of JavaScript charting frameworks - Wikipedia, the free encyclopedia : Décidément, je fais bien de vider les Shaarli du patron (Seb) que j'avais mis de côté (certains datent de deux ans !) Ici, le tableau Wikipedia des f...
  • Facebook open-sources new A.I. smarts | Computerworld : Facebook met à disposition en open-source des outils de machine-learning ou deep-learning. Ils travaillent (évidemment) beaucoup sur le sujet actuelle...

10 points d'analyse statistique à respecter. Intéressant.

analytic BigData datascience pratique statistique W work
http://simplystatistics.org/2014/05/22/10-things-statistics-taught-us-about-big-data-analysis/
Hadoop 2 : l'infrastructure Big Data passe à la vitesse supérieure - JDN Web & Tech
17/10/2013 16:34:07 archive.org
QRCode
cluster icon
  • Apache Arrow Homepage : Owwww. Un nouveau projet Apache (Top-Level s'iouplait) pour la gestion du données. Une sorte de micro-batching, mais sans sérialisation / désérialisat...
  • 10 things statistics taught us about big data analysis | Simply Statistics : 10 points d'analyse statistique à respecter. Intéressant.
  • Comment se repérer dans la jungle des licences open source - JDN Web & Tech : C'est vrai que c'est totalement la jungle actuellement les licences. Un point important souligné ici : bien réfléchir à la compatibilité entre licence...
  • @comeetie : carte données carroyées : Une data-vis assez intéressante basée sur les données INSEE sociaux-géographiques de la répartition des revenus. Pas de surprise en effet, ni au globa...
  • @comeetie :: Galerie : Ouah, du beau boulot. Un bel exemple de data vizualisation à partir des données de "Le Bon Coin" Et tout ça, avec les détails techniques je vous prie...

Hadoop 2 est sorti !
(félicitations encore à Apache qui fait un grand boulot)

Apache BigData Hadoop logiciel release soft work
http://www.journaldunet.com/developpeur/outils/hadoop-2-1013.shtml
2412 links
Shaarli - Le gestionnaire de marque-page personnel, minimaliste, et sans base de données par la communauté Shaarli - Theme by kalvn