Entrez vos identifiants

x
OU
Vous avez oublié votre mot de passe ?
Utilisateur wiki : vous n'aviez pas d'email ?

Korben - Site d'actualité geek et tech

Go Top


Comment convertir un site web en ebook

Comment convertir un site web en ebook

Hier, j'ai trouvé un site web sympa avec tellement d'articles que j'avais la flemme de tout lire sur l'ordi. Du coup, je me suis dit que j'allais en faire un bouquin pour mon Kindle, histoire que ça se digère mieux.

Voici donc la méthode que j'ai utilisée qui vous servira peut-être...

Tout d'abord, je devais récupérer en local tous les articles au format HTML. J'ai donc utilisé un petit wget mais vous pouvez aussi utiliser un soft comme httracks (ou similaire). Vu que je ne voulais pas m'encombrer de pages inutiles (contact, index...etc.) et garder uniquement les pages d'articles, je suis tombé une longue page "archives" sur le site, qui rassemble toute la liste des articles du blog année par année.

Je suis donc parti, pour mon scan, de cette page avec une récursivité minimale pour ne récupérer que les articles linkés sur cette page d'archives.

Bref, une fois que j'avais terminé, j'avais sur mon disque dur l'ensemble des articles du site + une jolie page d'archive.

J'ai ensuite nettoyé la page d'archive pour lui donner le format suivant (en html) :

<html>
<body>
<h1>Table des matières</h1>
<p style="text-indent:0pt">
<a href="file1.html">Premier article</a><br/>
<a href="file2.html">Second article</a><br/>
.
.
.
</p>
</body>
</html>

L'idée c'est de créer un sommaire des pages que vous avez récupéré. Pour nettoyer cette page d'archive, j'ai du jouer avec quelques "rechercher-remplacer" dans un éditeur de texte. Mais si vous n'avez aucune page d'archives, vous pouvez aussi récupérer le résultat d'un "ls" ou d'un "dir" et habiller chaque ligne avec le code html qui va bien. Alphabetizer peut vous aider... Ou alors quelques expressions régulières. L'important, c'est d'avoir les liens vers chaque fichier.

Ensuite, ce sommaire, on va le donner à "manger" à Calibre, le célèbre gestionnaire d'ebooks.

Il suffit donc de glisser-déposer cette page d'archive nettoyée dans Calibre, qui se chargera alors d'aller chercher chaque article pour en faire un ebook. À vous ensuite de le convertir en epub ou un autre format de votre choix.

calibre

À partir de là, vous pouvez donc le transférer sur votre liseuse. Moi je me suis rendu compte qu'il y avait pas mal de pages "déchet" avant chaque article. J'ai donc ouvert mon EPUB avec l'outil Sigil, qui est un éditeur d'ebook.

Puis j'ai fait le ménage pour supprimer toutes les pages inutiles (chez moi, elle se terminaient par _000). Puis j'ai du faire à nouveau un rechercher-remplacer dans la page Archives via Sigil pour re-mapper chaque lien du sommaire avec la page correspondante en _001.

sigil

Et voilà ! Une petite sauvegarde, un nouveau transfert via Calibre sur ma liseuse et le tour est joué !

Bon j'ai conscience que tout ceci est artisanal et vous me sortirez peut-être des outils ou des scripts qui font tout ça automatiquement, mais c'est moins drôle ^^. N'hésitez pas quand même à me les indiquer, je les ajouterai à l'article.

Merci et bonne lecture à tous !


Facebook Twitter Email Copier Url

7 Responses to “Comment convertir un site web en ebook”

  1. Sakesannin dit :

    Merci. J’ai tenté de faire ça pour réviser mon code de la route, sans succès. Pourtant j’avais un bon outil (Calibre), mais pas la technique, j’essayais de passer par du pdf et non du code html! du coup sans succès. Merci pour cette astuce!

  2. Cretingame dit :

    Cette outils est sympa, mais le mieux c’est d’avoir un navigateur intégrée dans la liseuse, c’est moins confortable mais on perd beaucoup moins de temps.

  3. Bonne astuce pour les sites complets, merci ! Pour ceux que ça intéresseraient, Readability (et peut-être d’autres services de type “lire plus tard”) propose de télécharger des epubs des articles sauvés. L’avantage est qu’ils sont déjà traités pour ne laisser plus ou moins que le texte, du coup ça fait des epubs relativement propres. Par contre pour un site complet c’est un peu long et chiant, gros avantage à la Korben Method (c) !

  4. C’est clair que Calibre + Sigil est la bonne combinaison pour faire ce genre de chose! A noter que pour la conversion en epub et pour des pages html simples (certains articles sont sous ce format), pandoc peut aussi être une bonne alternative comme outil de conversion d’un fichier html vers un epub.

  5. Riggins dit :

    Le module complémentaire “printpages2pdf” sur firefox fait bien l’affaire :)

  6. fr4nky89 dit :

    @Korben t’a la flemme de lire des articles et tu as le courage de faire tout ça ^^

  7. guguspass dit :

    Pour transformer des pages web en PDF j’utilise wkhtmltopdf. Quelques options sont disponibles.
    ex:
    wkhtmltopdf /rep/fichiers0* /rep/fichiers1*

A gagner – Des codes abonnement pour F-Secure Key

bigstock

Aujourd'hui je vous propose de gagner des codes pour des abonnements d'un an pour Key, le gestionnaire de mot de passe de F-Secure.

Si vous êtes adeptes des ouvertures de comptes en ligne à tout-va, ce petit soft peut vous être d'une grande utilité, voir pour ceux qui décideraient de renforcer tous leurs mots de passe en cours d'utilisation.

Avec Key vous pouvez stocker tous vos mots de passe et y accéder facilement, sur n'importe quel appareils, desktop ou mobile et même générer des mots de passe renforcés et uniques chaque fois que vous en avez besoin.

Pratique pour ceux qui ont tendance à aller au plus vite en mettant la date de naissance du dernier né ;)

Pour jouer ça se passe tranquillou avec Kontest:

Toutes les fonctionnalités de Key sont listées ici

Vous avez aimé cet article ? Alors partagez-le avec vos amis en cliquant sur les boutons ci-dessous :

Twitter Facebook Google Plus Linkedin email
Rejoignez les 57010 korbenautes
et réveillez le bidouilleur qui est en vous
abonnez-vous en savoir plus
"Vous aimez bidouiller ?" Oui j'adore l'informatique et la technologie
Suivez Korben Un jour ça vous sauvera la vie.. Ou celle d'un(e) ami(e)
  • Rejoignez les 57010 bidouilleurs de la grande famille des Korbenautes
    «Je considère que votre email est aussi important que le mien.»
    Korben
  • Les Derniers Articles du Blog

  • Inscrivez vous aux bon plans

  •  
  • Site hébergé par
    Agarik Sponsor Korben
  • DANS TON CHAT (BASHFR)

    Patchy : j'adore quand une fille baille, c'est mignon je trouve
    Patchy : c'est surement parce que c'est le seul moment ou elle ouvre sa grande gueule sans dire de conneries...

    -- http://danstonchat.com/6734.html
  • Un boitier externe pour booter des ISO à

    gogo sans se prendre la tête

    Il s'agit d'un boitier externe pour disque dur 2,5" fabriqué par la société Zalman, qui a la particularité d'avoir un petit écran de contrôle et qui permet de choisir l'ISO sur laquelle vous souhaitez booter...lire la suite

    Microsoft récupère vos clés de chiffrement.

    Voici comment les en empêcher

    Si vous avez acheté un appareil sous Windows 10 équipé d'une puce qui chiffre par défaut le disque, ne vous pensez pas en sécurité pour autant : La clé de récupération qui vous permet de déchiffrer vos données...lire la suite

    En ce moment dans l'univers "Raspberry Pi"

    Voir tous les articles »