Rédigé par Geoffrey Dorne
Le
41 commentaires
Au mois de novembre dernier, j’ai entrepris de me créer une sauvegarde de « mon Web » en local, offline, sur un disque dur. Quand je dis mon web, ce sont les médias, outils, savoirs, vidéos, documents, etc. qui comptent pour moi et que j’utilise régulièrement.
Dans cet article, je vais vous expliquer :
J’ai appelé ça « BCKUP » pour Backup (sauvegarde), j’ai dessiné un logo en ASCII et j’ai réalisé toute l’interface avec mes compétences de designer d’interface et designer graphique.
Prendre des jours et des semaines pour sauver du contenu en ligne sur un disque dur, il faut que ça en vaille la peine. Alors pourquoi faire cela ? Mes réponses sont nombreuses, très personnelles et évidemment toutes complémentaires :
Comment m’y suis-je pris ? Tout d’abord il m’a fallu un support de stockage, en l’occurrence, un disque dur de 1To. C’est énorme et c’est pas beaucoup, mais il me fallait de toute façon une contrainte de support.
Ensuite, je l’ai chiffré, pour le rendre inutilisable si quelqu’un essaye de l’ouvrir. Si quelqu’un le consulte, ce serait un peu comme donner accès à l’ensemble de ses préférences / centres d’intérêts / listes de contacts, etc. Son univers numérique c’est privé (et j’en profite : n’installez pas StopCovid si vous tenez à votre vie privée). Pour le chiffrement, il y a plein d’outils (sur Windows, il y a AxCrypt, GnuPG, DiskCryptor, j’en passe…).
Enfin, j’ai listé une arborescence dans laquelle j’ai mis mes usages quotidiens : travailler (donc des logiciels, banques de brush, des typos, etc.), lire (donc des livres numériques, des guides, des manuels, etc.), apprendre (donc Wikipedia, des playlists Youtube, des podcasts, etc.), et bien d’autres usages. Ces usages m’ont permis de créer un ensemble de dossiers sur mon disque dur.
Voici la liste actuelle :
J’ai créé une arborescence assez simple qui recueille l’ensemble de ce que j’ai mis dans cette sauvegarde, à savoir :
Dans les documents personnels, j’y ai mis :
Dans les documents publics, et c’est là le plus intéressant, j’y ai mis :
Télécharger des livres :
Pour les livres, il y a énormément d’ouvrages au format ePub sur Internet. J’en ai profité aussi ces dernières semaines car avec le confinement, plusieurs maisons d’éditions ont mis en ligne des ouvrages de façon gratuite, je pense notamment à La Fabrique ou Libertalia (leur offre est terminée mais leurs ouvrages valent vraiment le coup!). Enfin, il y a évidemment au projet Gutemberg, Gallica, ce catalogue des livres francophones et j’en passe (vous trouverez beaucoup de sources sur ce site).
Télécharger des vidéos Youtube :
Là, c’était un peu plus élaboré. En effet, j’ai quelques dizaines de chaînes Youtube que je consulte, auxquelles je suis abonné et que je serai un peu déçu de voir disparaître. Alors, je les ai téléchargées en intégralité tout en les compressant à la volée pour ne pas que chaque vidéo pèse des centaines de Mo. Pour ce faire, j’utilise 4K video Downloader, qui fonctionne parfaitement bien. J’ai donc téléchargé des chaînes Youtube en intégralité, des playlists de vidéos, des documentaires et aussi des playlists musicales (car avec ce logiciel je peux convertir à la volée les vidéos en format mp3, donc sans la vidéo, juste avec le son)
Télécharger des playlistes musicales :
Sur Youtube, j’ai donc téléchargé quelques playlists musicales avec toujours le même outil (4K video Downloader), mais j’ai également pu télécharger avec cet outil des playlists et l’intégralité d’artistes qui diffusent leur musique sur Soundcloud. Évidemment, ceci m’évite là encore d’écouter en streaming la musique à longueur de temps. Là, j’ai tout en local, c’est moins énergivore et bien plus pratique.
Télécharger un système d’exploitation :
J’ai choisi TAILS (que vous pouvez télécharger ici), un système d’exploitation portable qui protège votre vie privée et vous aide à contourner la censure.
Télécharger des logiciels « portables » :
Pour les logiciels, c’est assez facile car mise à part la Suite Adobe (Photoshop & co), je n’utilise que des logiciels libres. Et souvent, les logiciels libres existent en version portables, autrement dit : que l’on n’a pas besoin d’installer. Voici ma petite liste :
Question : je suis curieux de savoir quels logiciels vous auriez ajouté ?
Télécharger des documents PDF :
Tout dépend de ce que vous cherchez… Mais sur Google ou d’autres moteurs de recherches, il vous suffit de taper : « LaRechercheQueVousVoulez filetype:pdf », ce qui donne ceci :
Pour ma part, j’ai surtout cherché des guides de fabrication, de permaculture, des livres de recettes, des dictionnaires, des thèses, des livres, etc.
Télécharger Wikipedia en local et déconnecté :
Je pensais que c’était plus compliqué que ça… mais en fait, ça se fait facilement. En trois étapes :
Télécharger des cartes de France :
Là, c’était moins évident. Au début, je voulais télécharger Maps.me en local offline ou encore OpenStreetMap, mais je n’ai rien trouvé de simple. Alors, j’ai fait des recherches de grandes cartes détaillées en PDF avec notamment les réseaux routiers, les villes principales, les hôpitaux, etc. Si vous avez de meilleures solutions, je suis preneur 😉
Vous le savez, je suis designer graphique et numérique et pour pouvoir accéder en local, à tout ça, j’ai créé une interface en HTML toute simple avec la liste des dossiers ainsi que quelques raccourcis vers des fichiers ou des outils dont je me sers souvent.
Bref, je suis assez content du résultat, j’ai obtenu ce que je voulais : un énorme bout d’autonomie numérique (et donc une autonomie au niveau de mon savoir, de mon travail, de mes divertissement, de mes connaissances, etc.) et j’ai pris vraiment plaisir à faire ce projet. Si vous voulez avoir la même chose : faites-le vous même, avec vos recherches, vos goûts, vos idées, car je ne mettrai par ces centaines de Go en téléchargement en ligne, ça n’aurait aucun sens 🙂
Je tiens aussi à souligner qu’en plus de cette base de contenus, il y évidemment des années de savoirs-faire (apprendre le design, apprendre à programmer, à créer mes propres outils numériques, des logiciels, mes propres fontes, etc.). Et tout ça, c’est ça de moins qui pèse sur un disque dur 😉
Les prochaines étapes pour moi sont les suivantes :
De votre côté, je suis curieux de savoir ce que vous en pensez, ce que vous auriez ajouté, ce qu’il me manque, etc. N’hésitez pas à me le dire dans les commentaires et à raconter à quoi ressemblerait votre web offline pour votre autonomie numérique, en attendant la fin du monde 😉
J’aime beaucoup l’idée de la « capsule de temps ». Imagine mec dans 5000 ans une personne tombe sur ton disc dur et découvre tout ça. Que pourrait-il se dire ? « ah les boloss ils utilisaient des ordinateurs ! c’est tellement pas puissant ! » ou alors de l’archéologie « incroyable, je viens de retrouver un parchemin numérique qui date de -200 ans avant l’ère d’effondrement ».
Sinon, plus terre à terre : fais le sur deux disc dur : j’ai entrepris la même chose il y a 5 ou 6 ans, de temps en temps j’y allais pour en rajouter . Et soudain… c’est le drame ! Mon disc dur est décédé il y a 6 mois. Sur le moment je me suis débattu comme je pouvais, des recherches sur les forums : comment je peux le réparer, comment je peux récupérer, comment… la résilience a repris le dessus : tant pis. Il y avait du travail dont je suis fier dessus, des 3D qui m’ont pris tellement de temps, de sketch, des documents perso, des reportages, des PDF que je surkiffais et d’autre à lire si j’ai le temps un jour. Drôle de sensation, un peu comme si je rentrais le soir après le boulot et ohhh l’appart a brulé dis ! L’aspect éphémère du graffiti m’a rattrapé : je me suis très détaché de ce que je faisais, et ce qui me restait, ce sont mes plantes, mes abeilles, mes livres physiques, mes crayons et ma tête. (bon là ça vire à la séance de psy j’arrête là haha)
Si j’ai un retour d’expérience à partager : fais le sur 2 disc durs 😀
Génial ton idée de parchemin !!
Et merciiii pour le fait de dupliquer ce disque : totalement d’accord, c’est prévu :)))
Merci encore et salutations à tes abeilles 🙂
En ce qui concerne la redondance des données, je suis un paranoïaque halluciné et délirant.
Donc, en plus de la source des données, j’ai deux sauvegardes sur des devices différents.
Je sauvegarde toutes les données utilisateurs des ordinateurs et des smartphones.
Pour cela, j’ai un disque exclusivement dédié à Nexcloud. Synchronisation plusieurs fois par jour
des terminaux. En prime données accessibles depuis n’importe où avec un navigateur.
Ce disque est sauvegardé une fois par jour à un NAS dont les disques sont en raid 0+1
(miroir et répartition).
Je fais aussi des archives horodatées directement depuis les terminaux sur le NAS au moins une fois par
semaine.
Cerise sur le gâteau, je sauvegarde une partie de mes données sur deux serveurs distants.
Un à Amsterdam (Nextcloud, 2 Go), un autre à Clermond-Ferrand (O2switch) avec Pitivi pour les images et les photos.
On peut faire encore mieux.
ce sont je suis surtout curieux, c’est de connaître le contenu avec plus de détail 😉
Pour ça, faut me payer un café 😉
Je fais chauffer l’eau.
Si Calibre est incontournable, on ne peut pas ne pas utiliser Sigil.
Avec ce logiciel, on fait ce qu’on veut avec des fichiers epub.
https://sigil-ebook.com/
J’ajoute en passant mupdf et qtphoto. Ces deux logiciels ont une version
Windows.
Depuis très longtemps j’utilise httrack, l’outil absolu pour
récupérer des sites web. J’ai des sites web en local qui n’existent plus depuis belle
lurette. Enfin je signale youtube-dl, indispensable pour télécharger des vidéos
d’un très grand nombre de sites en plus de youtube.
Génial, mille mercis pour ces nouvelles références d’outils, je file les découvrir plus en détails 🙂
Excellente référence que httrack que j’utilise depuis des années aussi
Je partage totalement : « l’aspirateur de site » est hyper pertinent je trouve dans cette stratégie de résilience.
Excellent article ça m’a donné envie de faire la même chose. As tu pensé à utiliser Archive box ?
https://github.com/pirate/ArchiveBox
Je ne connaissais pas ArchiveBox, merci pour la découverte !
Encore un chouette partage, merci ! J’ajouterais certainement un manuel de premiers secours ou une illustration des gestes qui sauvent. Des planches d’anatomie, des planches avec des végétaux et leurs propriétés médicinales et une carte du ciel !
C’est marrant, je pensais faire une démarche un peu similaire mais pour en faire un WWW local – partagé à mon immeuble, un espace simple d’accès sans traceur, partageant un savoir essentiel.
Il n’existe pas d’outil qui enregistrerait en temps réel sa navigation Web en local ? Ça serait tellement plus facile et moins fastidieux 🙂 Et en plus, il ferait du versioning lorsque des contenus sont mis à jour. Ça serait top !
Bonne idée !! 🙂
Initiative intéressante ! Je suis tombée dans l’informatique à une époque où les documents numériques ne se trouvaient pas sur les internets mais s’échangeaient sur disquette. On les conservait donc préciseusement, comme des livres dans une bibliothèque réelle. Depuis, je n’ai jamais pu me faire au « tout en ligne » ; je télécharge et stocke quasi-systématiquement tous mes documents de travail, programmes et autres données utiles. Et quand je vois ce qui disparaît des internets, je ne regrette rien. Mais il faut être prête à passer du temps à télécharger, classer, mettre à jour, faire des copies de sauvegarde…
Le problème, comme tu le soulevais, ce sont les cartes. Il est difficile d’en récupérer des versions déconnectées. On peut toujours siphoner les images des sites de carto et les monter ensemble pour en faire de grandes cartes détaillées, mais ce n’est pas pratique (pas de recherche) et plutôt gourmand en mémoire.
Sinon je plussoie l’un des commentaires précédent qui suggérait youtube-dl, c’est vraiment indispensable. Je rajoute CapTVty, pour récupérer les émissions de TV.
Petite question : pourquoi récupérer des versions « portables » des logiciels, donc pour Windows, alors que tu as choisi Trails (Debian) comme OS ?
Intéressant, mais surtout pas sur un SSD. Les composants des SSD s’usent avec le temps, contrairement aux composants mécaniques d’un disque dur à plateau, s’usent à l’usage (et aux chocs). Pour ce qui est de l’empreinte carbone, je suis un peu mitigé, ça la fabrication d’un disque prend beaucoup de ressources, donc à voir si c’est moins consommateur que quelques recherches.
Top pour le disque à plateau, il m’en reste dans mes cartons 🙂
et pour le SSD, c’était un dont je ne me servais pas, également 🙂
Merci !
J’ai aussi adopté ce type de stratégie depuis quelques année déjà. Moins esthétique et moins élégant que toi mais cela me convient.
Les différences que j’ai avec toi c’est que les documents importants je ne les mets pas sur mon disque principal mais sur une clé cryptée. Je n’ai pas les compétences pour faire une partition cryptée donc j’ai « sous traité » via une clé USB spéciale.
Par ailleurs, dans mon dispositif J’ai ajouté une kindle pour pouvoir consulter mes livres et documents sans ordi.
Très beau projet… qui renoue avec l’histoire éditoriale des supports tangibles et de proximité. Il nous confirme aussi que le numérique off-line a de beaux jours devant lui…
Avec quoi avez-vous créer l’interface Web ? Fait-maison ?
Merci 🙂
C’est une très bonne idée.
Par contre, à l’usage, je suis moins satisfait de httrack pour aspirer des sites internet. Je trouve que les captures qu’il réalise sont moins réussies et complètes qu’auparavant. L’architecture des sites se modifie pour rendre ces opérations de capture moins faciles.
Avec vous une solution plus efficace, ou des suggestions de paramétrage.
Merci d’avance.
Salut,
On a tous pensé faire ça à un moment où à un autre mais ça représente une somme de travail astronomique. Si quelqu’un voulait s’éviter toute cette peine, à combien tu vendrais ton travail? 😂
Bonjour
Pour la carto tu peux te monter un serveur openstreet Map. Le forcer à générer toutes les tuiles par niveau
Ensuite un simple serveur http avec une page HTML et leaflet.js tu auras ta carto offline. Attention plus tu montes de niveau (zoom) plus il y a de tuiles, plus cela prend de la place. De mémoire niveau 13 pour la France c’est 15go(que le niveau 13)
Il te manquera alors un outils de référencement géographique. Mais si tu as wikipédia tu as déjà toutes les communes avec leurs positions gps.
Tout ça est intéressant. Le gros challenge c’est d’avoir un script qui te fait des Mises à jour différentielles.
Bonjour,
Je trouve l’idée génial mais que soit sur disque plateau ou ssd on n’a pas accès au donnés directement : il vous faut du hardware. Ne faudrai t’il pas utiliser un tablette ou smartphone avec une sauvegarde à la maison.
Oui c’est une idée ! Merci 🙂
C’est personnellement ce que j’ai fait :
J’ai acheté un tabletpc (une sorte de surface-like) sur amazon, pas forcément d’une qualité dingue, mais ça fait le job. Elle fait 11 pouces donc rentre dans une petite pochette en bandoulière.
J’ai installé une ubuntu dessus, et ça me sert de serveur pour mon nextcloud. Quand j’ai déménagé, j’ai juste eu besoin de l’éteindre, de le ranger dans le sac à dos, et boom. Si je dois partir de chez moi en urgence, en espérant que ça n’arrive pas, j’ai juste à débrancher la tablette et à partir. Le chargeur est un chargeur usb-c, donc je peux facilement le remplacer au besoin. Et vu que c’est un pc fonctionnel tel quel, je peux facilement naviguer dans les fichiers pour les visualiser directement « sur place ».
Régulièrement, j’ai un backup qui part vers mon nas (raspberry pi 4 avec disque dur mécanique) + je fais des backups réguliers sur un disque dur ssd et un disque dur mécanique. Pour certains trucs spécifiques (documents importants notamment), ça peut m’arriver de copier également vers une carte microSD chiffrée, que je balade avec un adaptateur usb/usb-c pour pouvoir les avoir à portée de main facilement au besoin (très pratique quand tu cherche à louer un appart, d’avoir toutes les feuilles de paie sur soi ^^).
Pour youtube, je me suis créé une playlist « non répertoriée », et un job cron qui régulièrement fait un youtube-dl de cette playlist, comme ça ça me télécharge automatiquement toute nouvelle vidéo que j’y ajoute.
Pour les pages web, en fonction de ce que c’est, j’ai un raccourcis pour « imprimer en pdf » la page, + l’extension firefox save as ebook (https://github.com/alexadam/save-as-ebook) qui me permet de la sauvegarder en epub le cas échéant. Le tout arrive directement dans mon dossier nextcloud, et est donc synchronisé avec mon serveur.
J’ai également un wallabag sur mon serveur, qui me permet de sauvegarder mes liens. Je fais régulièrement un dump de la bdd, qui pareil part vers le nas + disques durs.
Et sinon, faire tout ça a eu un avantage : j’ai demandé des exports de tous mes comptes « cloud »; que j’ai sauvegardé en local; et j’ai fait BEAUCOUP de ménage dans ce que j’avais là bas … du coup, je suis en inbox 0 actuellement 😀
Super projet.
J’adore la typo de l’interface! Quelle est-elle?
Ca m’a donné envie de faire qqchose.
J’aime l’idée plus manuelle d’archivage pour avoir ce qui est important et pas une masse informe de tout.
J’adorerais aussi plus de détails sur une partie du contenu. Ce qui est public surtout serait top en « liens » qqpart, tant que le web est là.
Hello 🙂
L’interface ? C’est de moi ^^
La typo ? Du courrier 😉
Pour le contenu.. J’ai mis les liens vers les logiciels, Wikipedia et quelques outils mais pas vers les chaînes Youtube, ni mes goûts musicaux ni mes goûts littéraires, ça n’aurait pas eu de sens 😉
J’aime apprendre des gouts des autres. La curation de personnes interessantes est ma meilleure source d’apprentissage 🙂
Courier aussi simple que cela.
Bravo et merci pour l’inspiration
yes I looooove that typography too,
it seems Courier *New* . Background is 2C2C2E . Foreground is C8EFCF . The « dotted » chars are ░░▒▓ , and then the « BCKUP » part is « inverted » colors, it spans over three lines (those are standard key characters), it’s bold and (it seems to me from my tests using Keynote) is horizontally condensed by around 8%.
Thanks Geoffrey for coming up with this design, it’s fantastic and inspiring. Someone should make a text adventure using this style!
Yo !
Excellente idée. J’ai commencé aussi de mon coté avec u vieux NAS synology. Un NAS une baie tout simple avec un backup automatique sur un HDD en USB. Et au lieu de le laisser allumé en permancence je l’allume que quand j’ai besoin de consulter ou rajouter quelque chose. Avant je l’utilisais pour matter des series sur ma TV et puis j’ai arreter. J’ai tout simplement transféré les series du NAS sur un HDD branché en usb a la TV. Une belle economie d’energie et une belle securité pour mes données car si le nas est eteint : pas d’attaque possible.
Sinon ca serait pas mal de partager un concentré de connaissance a avoir en cas de rupture de normalité. Tout le monde pourrait le DL sur une simple clé, ca serait vraiment bien.
Tcho.
@Yannick : merci à toi.. Et joli site au passage 🙂
Jolie réalisation et le récit est agréable. Merci du partage. Pour ma part, si j’avais à construire une capsule temporelle, je ne sais pas si elle serait numérique.
Un message pour rajouter le petit logiciel DropIt qui sert à automatiser beaucoup d’actions sur Windows et sans connaissances de dev. Personnalisable à souhait, il me sert beaucoup à filtrer mes téléchargements par dossier en fonction du type ou du nom par exemple.
Je ne connaissais pas, je fonce voir ça ! merci :)))
Bonsoir,
perso, j’aurais téléchargé VS Codium à la place de Notepad++. Très puissant, sur base de Visual Studio Code mais codé par des libristes purs et durs et surtout débarrassé des trackers W$.
Me revoilà sur cet article hautement inspirant (du genre « faut vraiment que je le fasse aussi »). Et je me dis : mais geoffrey ne devrait-il pas « partager » une partie de ces travaux (les éléments génériques, pas personnels) sous la forme d’un torrent ou autre. Parce que quelque part, tu donne le mode d’emploi, ce qui est génial, mais si on pouvait « scrapper », « fetcher », « ripper » ça facilement, ça serait cool aussi. Bon peut-être que c’est un peu un mode fainéant, mais je pense que c’est un mode démultiplicateur aussi, celui qui facilite la résilience numérique de chacun. Non décidément, quel article sacrément inspirant.
tu seras certainement intéréssé par: https://internet-in-a-box.org/ et https://archivebox.io/
aussi: https://www.wallabag.org/ et https://shaarli.readthedocs.io/
avec un wallabag en local tu peux avoir des copies locales des pages web que tu veux garder (plus pratique que httrack)
pour les cartes openstreetmap voila où les télécharger, les imprimer en papier et se monter un serveur local:
https://wiki.openstreetmap.org/wiki/Planet.osm#Downloading
https://wiki.openstreetmap.org/wiki/Planet.osm#Country_and_area_extracts
https://planet.openstreetmap.org/
https://wiki.openstreetmap.org/wiki/Downloading_data
https://wiki.openstreetmap.org/wiki/OSM_on_Paper
https://print.get-map.org/
https://wiki.openstreetmap.org/wiki/Use_OpenStreetMap (section get data)
https://www.tartarefr.eu/se-construire-un-serveur-de-tuile-openstreetmap/
pour choper des ebooks, il y a des ressources comme: https://b-ok.cc/s/ ou https://libgen.is/ ou https://ps-survival.com/ (en cours de refonte, spécialisé dans la préparation à l effondrement)
Pour des communautés pleines de bonnes idées:
https://teddit.net/r/Archiveteam/
https://teddit.net/r/DataHoarder/
https://teddit.net/r/selfhosted/
Les awesome lists: https://project-awesome.org/
incluant par exemple https://github.com/awesome-selfhosted/awesome-selfhosted
Wow, merci pour tous ces liens ! Ultra précieux 🙂
Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *
Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.
Créé par Geoffrey Dorne, designer & fondateur de Design & Human, ce blog présente des projets autour du graphisme, du design, de la création.
© 2008-2023 Geoffrey Dorne — Creative Commons License BY-NC-ND 4.0