Fou à lier

GitHub - gto76/python-cheatsheet: Comprehensive Python Cheatsheet

2019-02-06T09:25:23+01:00

Pratique. Un cheat sheet Python très complet.

via : https://sebsauvage.net/links/?-_e6UA
— Permalien

Unsupervised Image-to-Image Translation Networks | Research

2018-04-24T15:52:33+02:00

Ouch, avec l'IA, il va être de plus en plus difficile de ne pas remettre en cause ce que l'on voit, ce que l'on entend, etc.

— Permalien

DbeGV44WkAAjNAx.jpg:large (Image JPEG, 1585 × 815 pixels)

2018-04-24T15:40:23+02:00

Vachement intéressant comme pratique : un freelance explique comment il prend en compte la satisfaction que lui procurera une mission pour calculer son tarif.

Le tout résumé sur une ABAC :

— Permalien

Friends don't let friends use BTRFS for OLTP | PostgreSQL Addict

2017-08-03T17:06:53+02:00

BTRFS est-il adapté pour les bases de données d'analyse ? Non.

Intéressant benchmarking.
Shorter: l'utilisation du copy-on-write plombe les performances de 50%, quelque soit le système de fichier qui l'emploi. Mais en plus, BTRFS, à cause de sa popote interne obtient une variabilité impressionnante dans les perfs.

Moralité ? Si on veut faire du live-snapshot sans outil couteux (ou base de données très chère qui le gère en interne) il vaut mieux utiliser un autre système de fichier COW compatible ou directement du LVM Linux.
L'avantage de ce dernier, c'est aussi de pouvoir passer en COW que lorsque nécessaire, donc d'impacter les performances la nuit quand la base est à peu près au repos.
— Permalien

Yoshinori Matsunobu's blog: Tables on SSD, Redo/Binlog/SYSTEM-tablespace on HDD

2017-08-03T16:56:10+02:00

Comment configurer sa base de données avec un SSD ?

Réponse rapide (pour InnoDB mais généralisable) :

Sur disque rotatif (HDD) : REDO logs, BIN logs, tablespace (system ou general), buffer data
Sur disque solide (SSD) : UNDO logs, table files (donc les table-space si on utilise separate table-space)

C'est assez dingue en soit : ça veut dire que les bases de données sont largement optimisées pour fonctionner sur disque classique, et que seule une petite partie du traitement est à accès aléatoire (donc déplaçable sur SSD).

Random i/o oriented:

Table files (*.ibd)

UNDO segments (ibdata)

Sequential write oriented:

REDO log files (ib_logfile*)

Binary log files (binlog.XXXXXX)

Doublewrite buffer (ibdata)

Insert buffer (ibdata)

Slow query logs, error logs, general query logs, etc

D'ailleurs, fait intéressant dans l'article : il obtient une perf meilleure en HDD + SDD que en dual SSD. Peut-être parce que les SSD sont en bus SATA commun et que ce dernier sature, alors que ses HDD sont en bus SAS (donc séparé).

Pour aller plus loin, et configurer proprement la base :

(mysql) Paramétrer les emplacements de fichiers
— Permalien

Parsing Text for Emotion Terms: Analysis & Visualization Using R | DataScience+

2017-05-25T15:50:32+02:00

Analyse de sentiment en R et représentation.

via : https://m.rweekly.org/users/rweekly/updates/438
— Permalien

Learn Python for Data Science - Online Course

2017-05-17T18:49:54+02:00

MOOC sur Python for Data Science, à garder sous le coude.
— Permalien

Same Stats, Different Graphs: Generating Datasets with Varied Appearance and Identical Statistics through Simulated Annealing | Autodesk Research

2017-05-04T00:14:11+02:00

Rôôô, génial : une publication qui explique comment faire des graphes de dispersion qui possèdent les mêmes caractéristiques statistiques (moyennes, écart-types, corrélation) à l'aide d'algorithme de recuit simulé.
Résultat, cette image magnifique :

https://twitter.com/TahaYasseri/status/859084459127316480
— Permalien

alias - Aliases not available when using sudo - Ask Ubuntu

2017-03-17T15:16:08+01:00

Oh my god, le hint de ouf : pour utiliser ses propres alias tout en faisant un sudo (sachant qu'un sudo sans option ne source ni .profile ni .bashrc etc.) il faut faire :

alias sudo='sudo '

L'utilisateur qui répond brillamment cite la doc de bash :

Aliases allow a string to be substituted for a word when it is used as the first word of a simple command. The shell maintains a list of aliases that may be set and unset with the alias and unalias builtin commands.

The first word of each simple command, if unquoted, is checked to see if it has an alias. If so, that word is replaced by the text of the alias. The characters ‘/’, ‘$’, ‘`’, ‘=’ and any of the shell metacharacters or quoting characters listed above may not appear in an alias name. The replacement text may contain any valid shell input, including shell metacharacters. The first word of the replacement text is tested for aliases, but a word that is identical to an alias being expanded is not expanded a second time. This means that one may alias ls to "ls -F", for instance, and Bash does not try to recursively expand the replacement text. If the last character of the alias value is a space or tab character, then the next command word following the alias is also checked for alias expansion.

Et pourquoi je découvre ça que maintenant moi :rage: ? Quel délire.

P.S : j'ai du lire 100 fois l'immense man bash et j'ai l'impression que j'ai tout à apprendre encore. L'outil est juste incroyablement bien pensé. Trop même.
— Permalien

GitHub - leehomyc/High-Res-Neural-Inpainting: High-Resolution Image Inpainting using Multi-Scale Neural Patch Synthesis

2017-02-28T17:54:55+01:00

Woké : encore du dessin / de la génération d'image assistée par du deep-learning. Cette fois, on supprime un bout de l'image, et on lui demande de compléter. Résultat juste bluffant.

via : http://sebsauvage.net/links/?d4kVJQ
— Permalien

Image-to-Image Demo - Affine Layer

2017-02-28T17:45:30+01:00

Woké. Avec un bon réseau de neurones profonds, on peu désormais faire un dessin au crayon et le voir devenir une sorte de photo (c'est évidemment encore du TensorFlow).
Bon, perso j'ai essayé, mais étant très mauvais dessinateur, les résultats n'étaient pas non plus dingues (sauf à considérer ce qu'il faut de technique pour arriver ne serait-ce que là).
Je serais curieux de voir le résultat de meilleurs dessinateurs.
— Permalien

The Data Visualisation Catalogue

2017-02-22T14:55:43+01:00

Très intéressant : un catalogue de Dataviz où l'on peut choisir sa représentation par fonction ou par type. Très bien !

via : https://www.margaux-perrin.com/serendipity/?euUl1Q
— Permalien

Risques, décisions et incertitudes : la théorie des perspectives

2017-01-07T11:01:07+01:00

Décidément, j'aime beaucoup ce blog / chaîne Youtube de science.
Dernière vidéo en date sur ce « crétin de cerveau » c'est-à-dire les biais cognitifs. Et cet épisode m'inspire particulièrement parce qu'il parle de probabilités et de l'impossibilité pour l'être humain de les ressentir correctement.

Regardez donc la vidéo, faites vos choix et fur et à mesure et … WTF ! J'adore :)
— Permalien

datamake:project | film money

2016-11-04T17:45:15+01:00

Une histoire de l'argent dans les films US (budgets, revenus, etc.).
Le sujet est intéressant, mais c'est surtout la visualisation qu'il faut voir. C'est magnifique, j'imagine pas le boulot pour faire tout ça.

À voir !

via : https://twitter.com/arnicas/status/794473485703802880
— Permalien

intro-docker.pdf

2016-10-27T16:08:10+02:00

Balthazar Rouberol (tech lead Docker @OVH) a fait ces slides intéressantes pour introduire Docker. Sous la main.
Merci Balto.

via : https://twitter.com/brouberol/status/788843466818289664
— Permalien

Image Synthesis from Yahoo's open_nsfw

2016-10-22T16:57:41+02:00

Que se passe-t-il quand un réseau de neurones profond (DeepLearning) adapté à la vision/reconnaissance d'images est utilisé en marche arrière (en modèle générateur) ? Des chercheurs l'avaient déjà réalisé à partir de l'outil de Google.

Cette fois, c'est sur celui de Yahoo! pour la classification d'images pornographiques. Donc, ça fait une machine à créer des rêves pornographiques totalement chelous.
Les images sont dérangeantes à souhait, mais complètement SFW.

via : http://sebsauvage.net/links/?Ev2Fkg
— Permalien

KobOne, recrutez les meilleurs graphistes, webdesigners, motion-designers freelances et salariés

2016-09-16T17:20:35+02:00

Tout ce qu'il faut pour devenir Freelance (forum de conseils, outils, recherche d'emploi, etc.)
Bien pratique !
— Permalien

Oh, shit, git!

2016-09-15T16:56:32+02:00

Pas mal pratique cette page qui liste les opérations à réaliser sur Git quand on a merdé.

via : http://sebsauvage.net/links/?F4v_RQ
— Permalien

Cognitive bias cheat sheet

2016-09-09T17:46:56+02:00

Wow !! Un mec a fait un travail extraordinaire à partir de Wikipedia : il a recensé les biais dits "cognitifs" dans une grande carte hiérarchique. Je suis soufflé par tant de boulot.

via : https://twitter.com/Margauxlergo/status/773184663032590337
— Permalien

Administration et optimisation générales Mysql

2016-09-07T17:25:28+02:00

Une bonne page pour l'optimisation générale de MySQL (dont InnoDB). Ça liste un peu toutes les variables importantes et ce qu'il faut faire.
— Permalien

Some Intuition About the Theory of Statistical Learning | Freakonometrics

2016-07-26T14:41:45+02:00

Wow, très intéressant. Quelques bouts de codes et un peu de théorie sur la robustesse en apprentissage statistique. Voir les slides aussi, très intéressantes (bien qu'assez peu "autoporteuses" : le speech aurait été un plus)

via : https://twitter.com/dataandme/status/757648167940816896
— Permalien

Why Not to Trust Statistics | Math with Bad Drawings

2016-07-19T17:59:50+02:00

Les différentes métriques statistiques en dessin, et pourquoi elles ne sont jamais significatives seules :

moyenne,
médiane,
catégorie (modale),
étendues (== range),
corrélation,
variance.

Dommage que le titre soit si mal trouvé.
Il y a toujours ce dicton qui dit "il ne faut pas croire les chiffres / les statistiques" mais c'est totalement faux. C'est l'interprétation qui est fausse ou biaisée.

Ce serait comme de dire que l'ordinateur se trompe : no, it isn't. C'est le programme qui est faux par rapport à la fonction, pas l'exécution.

via : https://twitter.com/MaliciaRogue/status/754940561304551424
— Permalien

BashPitfalls - Greg's Wiki

2016-05-27T18:03:07+02:00

Plein, plein, plein d'erreurs courantes en shell (que ce soit bash, zsh, sh, ksh, POSIX, etc.).
Et aussi un site merveilleux où on peut trouver plein de trucs utiles.
Merci à Pierre-Alain de qosgof pour ça (oui, je sais, le partage date d'aout 2013…)

via : http://qosgof.fr/fosteb/?Ze8vKQ
— Permalien

Comparison of JavaScript charting frameworks - Wikipedia, the free encyclopedia

2016-05-25T15:36:26+02:00

Décidément, je fais bien de vider les Shaarli du patron (Seb) que j'avais mis de côté (certains datent de deux ans !)
Ici, le tableau Wikipedia des frameworks JS pour de la DataViz. Ça va bien me servir.

via : http://sebsauvage.net/links/?0TvjmQ
— Permalien

Docker for Beginners

2016-05-25T15:35:23+02:00

Cool : un tuto Docker qui semble relativement complet. Je garde sous le coude.

via : http://sebsauvage.net/links/?Zudseg
— Permalien

neural-style/README.md at master · jcjohnson/neural-style · GitHub

2016-05-25T15:32:15+02:00

Excellent : un outil de deep-mining sur des images pour reproduire des styles graphiques de peintres. Ça marche relativement bien (voir très bien).
Bluffant.

via : http://sebsauvage.net/links/?q0kjug
— Permalien

Last Week Tonight with John Oliver: Scientific Studies (HBO) - YouTube

2016-05-24T16:01:39+02:00

John Oliver parle des études scientifiques (parfois un peu en carton) et de la façon dont elles sont communiquées au public par des journalistes imbéciles. C'est drôle et pertinent.

via : https://twitter.com/BadAstronomer/status/730071029519802369
— Permalien

L’effet de halo (Crétin de cerveau #1)

2016-05-23T11:18:25+02:00

Super vidéo sur l'effet Halo (biais cognitif qui nous laisse penser que les plus grands / plus beaux, sont plus capables).
— Permalien

Le deep learning

2016-04-09T11:15:37+02:00

Supers vidéo et article sur le deep-learning. En particulier les exemples sous la vidéo :)
— Permalien

meetup_tensorflow_in_context - Google Slides

2016-03-27T19:40:37+02:00

Intéressante présentation sur TensorFlow, un outil de deep-learning de Google.
À garder sous le coude.

via : https://www.facebook.com/bdla2014/posts/1890901097803514 (Big Data Learning Association)
— Permalien

Relationship Extraction from Unstructured Text Based on Stanford NLP with Spark - YouTube

2016-03-26T21:00:02+01:00

Oulà, j'ai tellement envie de voir ça, mais ça dur 27 minutes. Tant pis, je pose-là, à lire plus tard.
— Permalien

Software Development Methods Explained With Cars (Infographic)

2016-03-25T17:37:48+01:00

Un super dessin, assez pratique, que m'a passé un collègue pour comprendre comment s'articulent les méthodes (en particulier Agiles) les unes par rapport aux autres.
C'est franchement bien fichu, ça donne une bonne overview, et c'est drôle.
— Permalien

Sommaire [Les recettes Python de Tyrtamos]

2016-03-09T16:30:36+01:00

Plein de petites recettes Python, sur toute sorte de sujets. Pratique.

via : http://sebsauvage.net/links/?eqSGng
— Permalien

Apache Arrow Homepage

2016-02-26T16:31:08+01:00

Owwww. Un nouveau projet Apache (Top-Level s'iouplait) pour la gestion du données. Une sorte de micro-batching, mais sans sérialisation / désérialisation. Et donc, visiblement plus rapide.

À tester donc.
— Permalien

habibi sur Twitter : "Stocks de @Velib par stations toutes les heures pendant 1 semaine à @Paris https://t.co/KMUmeh6gAW"

2015-12-13T18:17:07+01:00

Une carte montrant le déplacement des vélibs par heure à Paris. Apparemment, tout le monde commence à bosser à la même heure ! et habite à l'extérieur de Paris. En tout cas, j'aime bien ce genre de visualisation.
— Permalien

Getting Started — TensorFlow

2015-11-22T18:47:47+01:00

Génial. Une lib Python pour trainer et utiliser des réseaux de neurones. Toute sorte de réseaux. À garder absolument sous le coude.
— Permalien

GROCK sur Twitter : "Effets attendus du #PJLRenseignement contre la menace terroriste: Multiplier par 100 les effectifs du renseignement! http://t.co/SBQa4NG1xJ"

2015-11-09T23:53:12+01:00

Reparlons des boîtes noires et de l'algo magique : cette infographie illustre la problématique en terme de probas.
Même en prenant des hypothèses hyper-optimistes (du genre, l'armée développe le meilleur algo de machine-learning qui n'aie jamais existé ET la science bien de faire un saut en avant) on obtient moins de 1% des terroristes détectés et plusieurs centaines de milliers d'innocents emmerdés par la police. Shit happen.
Font chier les maths.
— Permalien

Using Azure ML to Build Clickthrough Prediction Models - Machine Learning - Site Home - TechNet Blogs

2015-11-04T01:00:21+01:00

« Using Azure ML to Build Clickthrough Prediction Models »

Franchement, ils m'impressionnent chez Microsoft. Je les croyais mourants, inertes, plus à la page et complètement déconnectés des innovations actuelles. Et ben avec leur Azure ML, ils envoient du gros lourd.

via : https://twitter.com/FranmerMS/status/661606891760574464
— Permalien

What PostgreSQL has over other open source SQL databases: Part I

2015-11-01T16:00:22+01:00

Un super article pour décrire les capacités de PostgreSQL face à ses principaux concurrents (les RDBMS open-source). Beaucoup de ces features ne se retrouvent même pas dans Oracle, DB/2, …

via : https://twitter.com/brouberol/status/659466786069479424
— Permalien

Choosing R or Python for data analysis? An infographic | Diego Marinho de Oliveira | LinkedIn

2015-10-30T11:36:17+01:00

Une comparaison de R et Python pour l'analyse de données. Ça me laisse un peu pantois : on sait déjà tous un peu ça, et les faits ne facilitent pas le choix. J'crois qu'il faut simplement apprendre les deux…
— Permalien

Fou à lier | EDIT MediapartBridge

2015-08-16T16:30:55+02:00

Au fait, si quelqu'un veut m'aider ?
Je n'ai pas réussi à faire correctement cette expression rationnelle :
preg_match('/^Set-Cookie:\s([^;]+).(?:;\sexpires=([^;])).*$/i', $headline, $matches)

Ce que je cherche, c'est à stocker la valeur du cookie ($headline est une ligne d'en-tête renvoyée par le serveur) mais également la date d'expiration seulement si on la trouve : expires=…
À cause du comportement glouton de .* que je n'ai pas réussi à minimiser correctement, je n'arrive pas à faire ça. Du coup, l'expression rationnelle qui est ici suppose que tout set-cookie renvoyé contiendra expires=… ce qui n'est pas la norme.

Bref, à vot' bon cœur, parce que moi j'ai abandonné.

*Indice : je pense qu'il faut utiliser des alternatives, mais je n'ai pas trouvé comment.

exemple de ligne : "Set-Cookie: SESS1121212121=454545454545; path=/; expires=Fri, 14 august 2015 GMT; domain=.mediapart.fr\r\n"
— Permalien

Add Mediapart full text bridge #145 | rss-bridge | GitHub

2015-08-16T16:17:38+02:00

Yop,

j'ai commis ça (commit, uhuh). J'avais pas codé dans ce genre de langage depuis bien longtemps, et ça m'a pris un peu de temps, mais c'était un vrai plaisir. D'autant plus que j'avais quasi jamais fait de php et jamais utilisé les différentes lib présentes (cURL, etc.) (oui, mon travail consiste plutôt à utiliser des langages de statistiques, alors ça fait plaisir de revenir vers un truc qui a du sens).
J'ai même mis la main 5 minutes dans git/github pour faire un beau pull request. C'est-y pas merveilleux ? #fier

Je crois savoir que c'était un truc attendu (en tout cas, moi je l'attendais, so DIY). N'hésitez pas à partager vers les intéressés et faire des retours (et me féliciter :p)

Bisous.

EDIT : à propos de Regexp [à vot' bon cœur] http://foualier.gregory-thibault.com/?GCLwNQ
— Permalien

Teaching image-recognition algorithms to produce nightmarish hellscapes - Boing Boing

2015-07-15T00:54:28+02:00

Je mets ça ici : le truc de Google en deeplearning, qui « produit des images » par rapport à d'autres, et par voie de ressemblance. Dans ce cas, ce sont des réseaux neuronaux multicouches qui sont utilisés.

via : http://sebsauvage.net/links/?r2kuRQ
— Permalien

La force de la donnée molle | Arnaud Vincent | LinkedIn

2015-07-09T10:09:31+02:00

Très bon article sur les données “molles”. Concept qui recouvre plusieurs choses : les méta-données, la psychologie, et notamment dans la mesure, etc.

Dans un monde de data, c'est important d'avoir ça en tête, parce qu'il faut sortir de la donnée stricte qui peut être hyper trompeuse.
— Permalien

Présentation Docker - YouTube

2015-07-05T16:32:29+02:00

Une autre initiation à Docker, en français cette fois.
Super.

via : http://korben.info/video/initiation-a-docker
— Permalien

▶ Cellphone use tracks holiday population shifts - YouTube

2015-06-22T16:35:40+02:00

Visualisation des déplacements des français, grâce à leurs téléphones portables. Année 2007. Génial.
— Permalien

Workshop : 45 minutes pour comprendre Docker avec Jérôme Petazzoni - YouTube

2015-06-10T17:10:07+02:00

Pour comprendre pas mal de choses sur Docker.
Shorter : ça ne remplace pas les VMs, chaque instance, et même chaque état possède un ID, on peut revenir en arrière, etc. Horriblement plus flexible que du Cloud VM. Mais finalement peut-être moins pratique des des gros bundles en VM pour les grosses applis pré-industrialisées.

via : https://twitter.com/brouberol/status/546421962244124673
— Permalien

Facebook open-sources new A.I. smarts | Computerworld

2015-05-25T23:53:17+02:00

Facebook met à disposition en open-source des outils de machine-learning ou deep-learning. Ils travaillent (évidemment) beaucoup sur le sujet actuellement.
À garder sous le coude.

via : https://twitter.com/erikbryn/status/556454800150499328
— Permalien

40 légendes urbaines, idées reçues et canulars décodés

2015-05-17T17:00:11+02:00

J'aime bien les décodeurs. C'est un travail sain et nécessaire. Mais qui se sent encore concerné par la vérité ?

Notamment le fameux cliché du français glandeur (qui pourtant est l'un des plus productif au monde) : http://www.lemonde.fr/les-decodeurs/article/2014/09/18/la-france-pays-ou-l-on-travaille-le-moins_4489150_4355770.html

via : https://twitter.com/romainlalanne/status/575650394161938432
— Permalien

Sondages honteux sur les départementales 2015

2015-05-17T16:53:19+02:00

Un bon résumé des manipulations, tromperies et mensonges des instituts de sondage français. Et encore, je pourrais rajouter une foule d'arguments, à la pelle.

via : https://twitter.com/GrablyR/status/575900326080999424
— Permalien