Fou à lier
Nuage de tags
Mur d'images
Quotidien
Flux RSS
  • Flux RSS
  • ATOM Feed
  • Daily Feed
Liens par page
  • 20 links
  • 50 links
  • 100 links
8 results tagged database  ✕
Comment OVH sauvegarde un million de bases de données chaque jour ?
20/08/2017 14:44:50 archive.org
QRCode
cluster icon
  • Yoshinori Matsunobu's blog: Tables on SSD, Redo/Binlog/SYSTEM-tablespace on HDD : Comment configurer sa base de données avec un SSD ? Réponse rapide (pour InnoDB mais généralisable) : - Sur **disque rotatif (HDD)** : REDO logs,...
  • Administration et optimisation générales Mysql : Une bonne page pour l'optimisation générale de MySQL (dont InnoDB). Ça liste un peu toutes les variables importantes et ce qu'il faut faire.
  • CNAME record - Wikipedia, the free encyclopedia : Merde, les zones DNS d'OVH ne supportent pas le champ DNAME… Du coup, impossible de centraliser l'écriture d'un champ TXT pour DKIM (alors que c'est ...
  • Développer un contrat/programme sur Ethereum - pses2016-contrats-ethereum-SHOW.pdf : La conf de Bortzmeyer sur Ethereum (et le carnage TheDAO) en quelques slides (bimer). C'est super, c'est la première fois que je trouve un document u...
  • OVH News - La goutte DDoS n'a pas fait déborder le VAC* : OVH communique sur une attaque DDoS d'ampleur qu'ils ont subi il y a quelques jours, et en profite pour faire un peu de pédagogie auprès de nos amis (...

Comment OVH gère le backup de dizaines de milliers de bases de données (MySQL et PostgreSQL) ?

TL;DR:

  • répartition homogène des backup dans le temps grâce à une fonction de hachage sur le nom de la base ;
  • dump avec verrouillage de tables si présence de tables MyISAM ;
  • dump avec transaction si 100% InnoDB ;
  • backup en sus au format SGBD (avec XtraBackup) si base volumineuse (temps de restore > 10 minutes) ;
  • mysqlcheck pour réparer au préalable les tables, mais en prenant soin de doubler la RAM temporairement ;
  • backup exportés et dédupliqués (cluster Ceph, disques locaux si prod externe, Cloud Storage)

via : http://sebsauvage.net/links/?8vhoGw

backup database DB imba informatique MySQL OVH technique
https://www.ovh.com/fr/blog/realiser-un-million-de-backup-bases-de-donnees-par-jour/
Friends don't let friends use BTRFS for OLTP | PostgreSQL Addict
03/08/2017 17:06:53 archive.org
QRCode
cluster icon
  • Yoshinori Matsunobu's blog: Tables on SSD, Redo/Binlog/SYSTEM-tablespace on HDD : Comment configurer sa base de données avec un SSD ? Réponse rapide (pour InnoDB mais généralisable) : - Sur **disque rotatif (HDD)** : REDO logs,...
  • Cache is the new RAM | MemSQL - The Database for Speed, Scale & Simplicity : Très bon historique des technologies de stockage de données. Où l'on voit que tout n'est qu'un problème de performance et de bottleneck. via : http...
  • What PostgreSQL has over other open source SQL databases: Part I : Un super article pour décrire les capacités de PostgreSQL face à ses principaux concurrents (les RDBMS open-source). Beaucoup de ces features ne se re...
  • Comment OVH sauvegarde un million de bases de données chaque jour ? : Comment OVH gère le *backup* de dizaines de milliers de bases de données (MySQL et PostgreSQL) ? TL;DR: - répartition homogène des backup dans le ...
  • Administration et optimisation générales Mysql : Une bonne page pour l'optimisation générale de MySQL (dont InnoDB). Ça liste un peu toutes les variables importantes et ce qu'il faut faire.

BTRFS est-il adapté pour les bases de données d'analyse ? Non.

Intéressant benchmarking.
Shorter: l'utilisation du copy-on-write plombe les performances de 50%, quelque soit le système de fichier qui l'emploi. Mais en plus, BTRFS, à cause de sa popote interne obtient une variabilité impressionnante dans les perfs.

Moralité ? Si on veut faire du live-snapshot sans outil couteux (ou base de données très chère qui le gère en interne) il vaut mieux utiliser un autre système de fichier COW compatible ou directement du LVM Linux.
L'avantage de ce dernier, c'est aussi de pouvoir passer en COW que lorsque nécessaire, donc d'impacter les performances la nuit quand la base est à peu près au repos.

bases-de-données BDD BTRFS COW database filesystem informatique Linux technique W
https://blog.pgaddict.com/posts/friends-dont-let-friends-use-btrfs-for-oltp
Yoshinori Matsunobu's blog: Tables on SSD, Redo/Binlog/SYSTEM-tablespace on HDD
03/08/2017 16:56:10 archive.org
QRCode
cluster icon
  • Friends don't let friends use BTRFS for OLTP | PostgreSQL Addict : BTRFS est-il adapté pour les bases de données d'analyse ? Non. Intéressant *benchmarking*. *Shorter*: l'utilisation du *copy-on-write* plombe les ...
  • Cache is the new RAM | MemSQL - The Database for Speed, Scale & Simplicity : Très bon historique des technologies de stockage de données. Où l'on voit que tout n'est qu'un problème de performance et de bottleneck. via : http...
  • Comment OVH sauvegarde un million de bases de données chaque jour ? : Comment OVH gère le *backup* de dizaines de milliers de bases de données (MySQL et PostgreSQL) ? TL;DR: - répartition homogène des backup dans le ...
  • Administration et optimisation générales Mysql : Une bonne page pour l'optimisation générale de MySQL (dont InnoDB). Ça liste un peu toutes les variables importantes et ce qu'il faut faire.
  • Comparison of JavaScript charting frameworks - Wikipedia, the free encyclopedia : Décidément, je fais bien de vider les Shaarli du patron (Seb) que j'avais mis de côté (certains datent de deux ans !) Ici, le tableau Wikipedia des f...

Comment configurer sa base de données avec un SSD ?

Réponse rapide (pour InnoDB mais généralisable) :

  • Sur disque rotatif (HDD) : REDO logs, BIN logs, tablespace (system ou general), buffer data
  • Sur disque solide (SSD) : UNDO logs, table files (donc les table-space si on utilise separate table-space)

C'est assez dingue en soit : ça veut dire que les bases de données sont largement optimisées pour fonctionner sur disque classique, et que seule une petite partie du traitement est à accès aléatoire (donc déplaçable sur SSD).

Random i/o oriented:

  • Table files (*.ibd)
  • UNDO segments (ibdata)

Sequential write oriented:

  • REDO log files (ib_logfile*)
  • Binary log files (binlog.XXXXXX)
  • Doublewrite buffer (ibdata)
  • Insert buffer (ibdata)
  • Slow query logs, error logs, general query logs, etc

D'ailleurs, fait intéressant dans l'article : il obtient une perf meilleure en HDD + SDD que en dual SSD. Peut-être parce que les SSD sont en bus SATA commun et que ce dernier sature, alors que ses HDD sont en bus SAS (donc séparé).

Pour aller plus loin, et configurer proprement la base :

  • (mysql) Paramétrer les emplacements de fichiers
bases-de-données database informatique infrastructure MySQL performances technique TODO W
https://yoshinorimatsunobu.blogspot.fr/2009/05/tables-on-ssd-redobinlogsystem.html
Two Generals' Problem - Wikipedia, the free encyclopedia
25/07/2016 18:00:16 archive.org
QRCode
cluster icon
  • You Can’t Sacrifice Partition Tolerance | codahale.com : Article FRANCHEMENT intéressant sur le théorème CAP, qui est souvent mal compris. Il m'a ouvert les yeux alors que je pensais le maitriser. Ceci dit,...
  • What PostgreSQL has over other open source SQL databases: Part I : Un super article pour décrire les capacités de PostgreSQL face à ses principaux concurrents (les RDBMS open-source). Beaucoup de ces features ne se re...
  • A practical guide to sort colors : Lecture intéressante sur le trie des couleurs. C'est-à-dire la projection d'un espace vectoriel multi-dimensionnel sur un autre à … une seule dimensio...
  • Administration et optimisation générales Mysql : Une bonne page pour l'optimisation générale de MySQL (dont InnoDB). Ça liste un peu toutes les variables importantes et ce qu'il faut faire.
  • Biomimétisme : peut-on trouver l’algorithme qui dessine les rayures du zèbre ? | Rue89 : Une interrogation tout à fait intéressante sur le bio-mimétisme. Le bio-mimétisme est très utilisé en informatique, notamment pour la recherche opé...

Ah tiens, je découvre que ce problème a un nom : Two General's Problem.
C'est notamment ce qu'il se passe dans les commit-à-deux-phases des bases de données distribuées (et ACID) ou plus fréquemment sur les négociations via TCP.

C'est un problème démontré comme non calculable.

ACID calculabilité CAP database distribué informatique problème science SGBD
https://en.wikipedia.org/wiki/Two_Generals%27_Problem
What PostgreSQL has over other open source SQL databases: Part I
01/11/2015 16:00:22 archive.org
QRCode
cluster icon
  • You Can’t Sacrifice Partition Tolerance | codahale.com : Article FRANCHEMENT intéressant sur le théorème CAP, qui est souvent mal compris. Il m'a ouvert les yeux alors que je pensais le maitriser. Ceci dit,...
  • Administration et optimisation générales Mysql : Une bonne page pour l'optimisation générale de MySQL (dont InnoDB). Ça liste un peu toutes les variables importantes et ce qu'il faut faire.
  • NoSQL : arrêtons de dire n’importe quoi | Sam & Max: Python, Django, Git et du cul : Article intéressant de Sam&Max sur le NoSQL. J'suis évidemment d'accord avec eux, même si je n'ai pas leur retour de développeur sur le sujet. Simple...
  • Two Generals' Problem - Wikipedia, the free encyclopedia : Ah tiens, je découvre que ce problème a un nom : *Two General's Problem*. C'est notamment ce qu'il se passe dans les *commit-à-deux-phases* des bases...
  • Yoshinori Matsunobu's blog: Tables on SSD, Redo/Binlog/SYSTEM-tablespace on HDD : Comment configurer sa base de données avec un SSD ? Réponse rapide (pour InnoDB mais généralisable) : - Sur **disque rotatif (HDD)** : REDO logs,...

Un super article pour décrire les capacités de PostgreSQL face à ses principaux concurrents (les RDBMS open-source). Beaucoup de ces features ne se retrouvent même pas dans Oracle, DB/2, …

via : https://twitter.com/brouberol/status/659466786069479424

database informatique NoSQL PostgreSQL RDBMS SGBD storage W
https://www.compose.io/articles/what-postgresql-has-over-other-open-source-sql-databases/
Always Encrypted: SQL Server 2016 includes new advances that keep data safer - Next at Microsoft
07/06/2015 22:37:08 archive.org
QRCode
cluster icon
  • Blog Stéphane Bortzmeyer: Ma nouvelle clé PGP : Les recommandations d'un spécialiste (Bortzmeyer) pour générer sa clé PGP/GPG. Fascinant. via : http://sebsauvage.net/links/?XwOyrA
  • CrackStation - Online Password Hash Cracking - MD5, SHA1, Linux, Rainbow Tables, etc. : Une rainbow table distribuée accessible en ligne. Marche aussi avec les pass MySQL :) = sha1(sha1_bin())
  • CryptCheck, vérifiez vos implémentations de TLS : Excellent article sur la sécurité de TLS (via OpenSSL). Ça m'a permis de changer le chiffrement d'un outil que je développe (non critique, bien heure...
  • Crypto Law Survey - Page 2 : Excellent boulot ce site ! Il liste et catégorise les lois relatives à la cryptographie dans le monde (utilisation, import, export, limitations d'usag...
  • Cryptosystème de Paillier - Wikipédia : Tiens, intéressant. Le cryptosystème de Paillier est un cryptosystème pour le chiffrement homomorphique. Soient A, B et C tels que A + B = C et A_c,...

Microsoft va sortir une version de SQL Server "Always Encrypted". C'est bien.
Je n'ai pas regardé dans les détails, donc je ne sais pas si elle opère l'arithmétique.
Connaissez-vous d'ailleurs ça ? J'en ai entendu quand j'étais en master, il y a une huitaine d'année. Des bases de données qui peuvent manipuler des objets toujours chiffrés, y compris en appliquant des opérateurs arithmétiques. En gros : a op b = dec(enc-a enc-op enc-b) = dec(en-c) = c

via : https://twitter.com/FranmerMS/status/606695465619488768

chiffrement concept database Microsoft SQL SQL-Server sécurité
https://blogs.microsoft.com/next/2015/05/27/always-encrypted-sql-server-2016-includes-new-advances-that-keeps-data-safer/
Cache is the new RAM | MemSQL - The Database for Speed, Scale & Simplicity
25/11/2014 13:44:47 archive.org
QRCode
cluster icon
  • Yoshinori Matsunobu's blog: Tables on SSD, Redo/Binlog/SYSTEM-tablespace on HDD : Comment configurer sa base de données avec un SSD ? Réponse rapide (pour InnoDB mais généralisable) : - Sur **disque rotatif (HDD)** : REDO logs,...
  • Friends don't let friends use BTRFS for OLTP | PostgreSQL Addict : BTRFS est-il adapté pour les bases de données d'analyse ? Non. Intéressant *benchmarking*. *Shorter*: l'utilisation du *copy-on-write* plombe les ...
  • Alignement de partitions pour amélioration des performances de MS-SQL Server : Intéressant. Je n'avais jamais vraiment entendu parler des problèmes dus à l'alignement de partition sur un disque. J'avais tout juste entendu le term...
  • BBC - Future - These unlucky people have names that break computers : Oh, la pauvre femme. Son nom est J. Null. Oui, son p-m-atronyme est Null. D'autant plus Null que cette valeur est bannie de la plupart des softs (je c...
  • L'amour au temps du chiffrement : Beau. L'amour au temps du numérique, de l'espionnage massif, de la pérennité de la moindre donnée. Une histoire d'amour et de hackers. Je n'ai pas lu ...

Très bon historique des technologies de stockage de données. Où l'on voit que tout n'est qu'un problème de performance et de bottleneck.

via : https://twitter.com/Korben/status/536420009732759552

bases-de-données bottleneck database histoire informatique performances work
http://blog.memsql.com/cache-is-the-new-ram/
MongoDB Inc. Worth $1.2 Billion, Are They the Next Oracle? | Architects Zone
08/10/2013 14:07:47 archive.org
QRCode
cluster icon
  • What PostgreSQL has over other open source SQL databases: Part I : Un super article pour décrire les capacités de PostgreSQL face à ses principaux concurrents (les RDBMS open-source). Beaucoup de ces features ne se re...
  • Comment OVH sauvegarde un million de bases de données chaque jour ? : Comment OVH gère le *backup* de dizaines de milliers de bases de données (MySQL et PostgreSQL) ? TL;DR: - répartition homogène des backup dans le ...
  • Administration et optimisation générales Mysql : Une bonne page pour l'optimisation générale de MySQL (dont InnoDB). Ça liste un peu toutes les variables importantes et ce qu'il faut faire.
  • Always Encrypted: SQL Server 2016 includes new advances that keep data safer - Next at Microsoft : Microsoft va sortir une version de SQL Server "Always Encrypted". C'est bien. Je n'ai pas regardé dans les détails, donc je ne sais pas si elle opère...
  • Cache is the new RAM | MemSQL - The Database for Speed, Scale & Simplicity : Très bon historique des technologies de stockage de données. Où l'on voit que tout n'est qu'un problème de performance et de bottleneck. via : http...

10gen, développeur de MongoDB, lève 150 m$ pour atteindre 1.2M$ en valorisation. Pas mal pour du NoSQL.

Oracle serait intéressé ?

10gen BdD database DB NoSQL Oracle valorisation
http://architects.dzone.com/articles/mongodb-inc-worth-12-billion?mz=36885-nosql
2412 links
Shaarli - Le gestionnaire de marque-page personnel, minimaliste, et sans base de données par la communauté Shaarli - Theme by kalvn