Skip to content
Korben, roi d’internet, logo bébé avec des lunettes en mode thug life

Extraire des données structurées à partir d’un PDF

Si vous cherchez un moyen d’extraire de manière structurée des données à partir de PDF, j’ai ce qu’il vous faut. C’est une application sous licence MIT nommé Tabula dont les sources sont dispo ici, qui permet simplement en traçant des zones sur des PDF que vous importez, de récupérer des données sous la forme de CSV.

tabula1

tabula2

Idéal pour extraire des infos proprement surtout qu’il est possible de répéter les zones de sélection sur l’ensemble des pages de vos documents.

Tabula est téléchargeable ici et dispo sous Mac, Linux et Windows.


A la recherche d’un job dans le numérique et envie de changer de région et de vie ?

Est-ce que je fais vraiment le boulot que j’aime ? Ma qualité de vie dans cette grosse ville bruyante, polluée, chère … est-elle vraiment la meilleure ? Est-ce que ce village de campagne est le lieu le plus propice pour préparer mes enfants au futur ? Nous sommes nombreux à nous être posé ce genre de questions à un moment ou un autre, moi le premier.

Et bien si vous êtes dans cette situation, que vous avez envie de changer d’air sans pour autant changer de travail, Laou vous accompagne dans toutes les étapes de ce nouveau voyage, pour que vous ayez l’esprit serein jusqu’au moment d’envoyer votre premier mail pro 😉

Découvrir leur service et lancez-vous



Les articles du moment