Do your fucking backups !

Ou « DYFB », pour les intimes. Profitons de cette fin d’année pour lancer ce mot d’ordre.

En effet, il est passé quelques messages malheureux sur mon hub DirectConnect favori, signalant la mort (électrique, mécanique ou logique) d’un disque dur et par la même occasion la perte de centaines de giga-octets de japanimation parfois très difficile à trouver. Perte car la récupération en salle blanche coute horriblement cher au méga-octet, c’est davantage adressé aux moldus de l’informatique qui n’ont pas sauvegardé leur Excel de compta personnelle qu’aux otakus en puissance.

Malheureusement je suis d’avis qu’il faut passer par là pour saisir tout le caractère indispensable d’une bonne sauvegarde, à jour et facilement exploitable. Par chance, j’ai subi ma seule perte de données à un âge très jeune et avec des données franchement pas utiles (des dessins sous MSPaint, des cliparts dans Word, vous voyez). Ah c’était l’époque où j’empilais des disquettes de 1,38 Mo (car les disquettes de 100 Mo et lecteurs Zip, ça coutait trop cher). J’insiste sur le sujet car le contexte s’y prête bien: disques durs et SSD deviennent abordables pour de hautes capacités, offrant bien un stockage pérenne pour une décennie. Cet article vous fera rire quand on aura le stockage par gravure sur verre ou holographique, en attendant nos données on doit se contenter de volumes de stockage de 500, 1000, 2000 Giga-octets.

  • 1 disque dur Western Digital Scorpio Blue 2.5″  1 To:  ~83 €
  • 1 boitier Advance Arty POP Manga: ~13 €

Pour un peu moins de 100 € chez LDLC, vous avez déjà de quoi stocker vos séries avec en plus un boitier design fourni avec sa housse de transport. Détail: le boitier externe USB permet de brancher à loisir le disque dur quand vous en avez besoin, et facilite le transport. Le disque dur 2.5″: capacité et prix sont très similaires entre les 2.5″ et 3.5″, donc vous pouvez préférer les 2.5″ qui consomment moins (auto-alimentés par USB), chauffent moins, sont certes moins rapides mais résistent sensiblement mieux aux chocs (normal, c’est conçu pour les PC portables qu’on fait tomber). Que la vitesse ne vous rebute pas, ça monte quand même à 28 Mo/s et un seek respectable, on veut faire de la sauvegarde, pas faire booter un système. Et puis accessoirement c’est plus léger et plus compact, ça entre dans la poche et pourrait normalement vous suivre pendant votre jogging matinal sans casser.

Trop sensible pour vous ? Vous avez peu de données à sauvegarder mais par contre d’une grande importance (genre votre profil Firefox) ?

  • 1 volume SSD Crucial M4 64 Go: ~80 €

Bon je vous rassure j’ai pas tenu à vérifier si ça résistait à un écrasement par un camion ou une demi-heure au barbecue, mais puisqu’il n’y a rien de mécanique dans les SSD ça craint beaucoup moins les chocs. Là j’ai donné un exemple pour un prix comparable à un disque dur (pour rester en dessous des 100 € avec boitier), mais sachez que la capacité de 64 Go vous pourrez la multiplier dans les prochains mois: ça évolue très vite. Et les SSD ont une vitesse de seek sans commune mesure avec les disques durs ainsi qu’une vitesse de transfert supérieure. Votre machin de stockage de sauvegarde, vous pourrez sans problème le recycler comme volume système de votre ordinateur par la suite. Et puis ne craignez pas d’user le SSD trop vite, à moins de le remplir complètement une dizaine de fois par jour.

  • 1 logiciel de sauvegarde efficace

Chers windowsiens, adoptez Cobian Backup pour faire vos sauvegardes incrémentielles (ne pas oublier de cocher la case « tâche en miroir »). Chers linuxiens, vous l’avez sans doute déjà sous la main tellement c’est répandu: rsync. Exemple de script pour sauvegarder un disque dur vers un autre:

rsync -aPh --no-inc-recursive --exclude="lost+found" --del "/media/DATA/" "/media/SAUV_DATA/"

Courte explication: le paramètre « a » indique archive, fichiers et dossiers seront copiés à l’identique selon leur taille+date de modification. « P » indique reprise des transferts partiels et affichage de la progression. « h » indique affichage humain (conversion des tailles en kilo-octets, méga-octets,.. « –no-inc-recursive » indique que le comptage se fait avant le transfert, donc vous avez une indication précise de l’avancement (genre fichier 542/51641). « –exclude » exclut un fichier ou dossier selon ce mot clé, « lost+found » étant un dossier spécial crée sur les partitions Linux pour les fichiers récupérés en cas de crash. Ledit dossier étant protégé en écriture, rsync bute dessus (« i/o error ») et annule donc toute suppression de fichier sur le volume de destination (ce qui n’est pas bien, car) « del » indique à rsync de supprimer au fur et à mesure les fichiers de la destination s’ils ne sont plus dans la source, histoire d’avoir une copie exacte de tous les fichiers sur les deux volumes. La suite: « {source} » et « {destination} ». Voilà 🙂

Oui je sais si c’est pour copier à l’exact un disque dur vers un autre, on peut faire un RAID 1. Oui mais voilà: c’est mieux de faire un RAID 1 si on a 2 modèles identiques des disques durs (pour avoir un parfait alignement de cylindres, au risque de subir les mêmes éventuels défauts de conception), et évidemment on ne peut pas jongler entre différents types de partitions (il se peut que je veuille du btrfs pour le stockage principal et du ext3 ou NTFS pour la sauvegarde pour être sûr que ça soit interopérable). Et le RAID 1, vous devez le laisser branché ou subir des heures de reconstruction. Pas top pour du « cool-backup » 😉

Et sinon pour quelques petits fichiers il y a la clé USB. Ah oui, autre chose: le Cloud tout ça, oubliez. Outre les problèmes de confidentialité des données, vols et hacks, si l’opérateur estime que c’est pas assez rentable ou que vous abusez de son service, il coupe et vous perdez votre sauvegarde durement uploadée à 80 ko/s. Il y a mieux: compressez les données et envoyez-les sur Freenet. C’est chiffré et stocké de façon répartie, et sous forme de « freesite » vous pouvez facilement faire des snapshots qui resteront récupérables certes très lentement mais assez longtemps. Couper Freenet ou déchiffrer des données sans le lien SSK/USK avec sa clé de déchiffrement ? Hahaha, si seulement au moins la Chine le pouvait, mais non 😀

Bref, vous n’avez plus aucune excuse si vous perdez vos données 🙂

6 réflexions sur « Do your fucking backups ! »

  1. Bonjour, merci pour l’article. Sous Windows, aussi pratique que rsync sous Linux : robocopy, outil en ligne de commande facilement paramétrable pour réaliser des copies incrémentales, très véloce, …

  2. Hello,

    Sous Linux, un très bon utilitaire qui utilise rsync : backintime. Gestion de backup incrémentiel, inscription dans le crontab, masque d’inclusion/exclusion de fichier. Et en prime une interface gnome et kde pour ceux qui n’aime pas la ligne de commande.

    Bref une perle.

  3. Bonjour,

    Merci, maintenant j’en sais un peu plus sur rsync dont certaines options ne me parlaient pas vraiment, avec une dédicace spéciale à –no-inc-recursive.

    Concernant deux points que je n’ai pas retrouvé dans votre billet mais qui me semblent importants :

    le stockage physique du support de sauvegarde. Si c’est au même endroit que les données originales ça peut ne pas suffire en cas d’incendie ou de vol.
    les sauvegardes multiples, voire sur des supports de types différents (clef USB, DVD) au moins pour les données importantes. Car c’est quand les données d’origine sont irrécupérables que, loi de Murphy oblige, la/les sauvegarde se révèle défectueuse… Voir à ce sujet http://www.korezian.net/2011/10/09/donnees-politique-de-sauvegarde-et-loi-de-murphy/

  4. Méfiance avec -P. Elle implique –partial –progress. Pas de problème avec cette dernière, mais –partial peut avoir de lourdes conséquences : la simple augmentation de la taille d’un fichier va faire ajouter seulement la fin de celui-ci à celle du fichier sauvegardé (un « diff » seulement sur la taille, en somme).

    C’est bien pour des logs, mais d’autres fichiers pourraient être corrompus.

    Attention donc de n’utiliser -P que dans une situation avec risque de coupure, et si l’on est sûr de relancer rsync juste après la coupure. Sinon, –progress ne prend pas de risque.

Les commentaires sont fermés.