Aller au contenu
Korben, roi d’internet, logo bébé avec des lunettes en mode thug life

Portia – Un outil de web scrapping visuel

Je ne sais pas si vous vous souvenez, mais je vous ai déjà parlé de Scrapy, un framework capable de crawler le web et d’en extraire des données structurées qui tourne sous Windows, Mac et Linux. L’avantage de ce genre de truc, c’est de pouvoir capter des données en provenance de sites classiques pour ensuite les réutiliser dans vos propres projets.

Et bien j’ai une bonne nouvelle à vous annoncer puisque les développeurs de Scrapy viennent de mettre en ligne une première version de Portia, un outil de scrapping basé sur Scrapy qui permet de faire la même chose tout au clic, c’est à dire sans mettre les mains dans le code.

Voici une démo, ça a l’air très prometteur.

Les initiateurs du projets réfléchissent à mettre à disposition Portia pour que chacun puisse l’utiliser directement en ligne. Mais en attendant, vous pouvez récupérer les sources sur Github et l’installer chez vous pour voir ce que ça donne.


Les articles du moment