Aller au contenu
Korben, roi d’internet, logo bébé avec des lunettes en mode thug life

Comment extraire en données structurées les infos contenues sur des pages web

Si vous avez besoin d’extraire des données à partir de pages web pour les transformer en données structurées, j’ai peut-être un truc qui va vous plaire. Il s’agit d’un bookmarklet qui se place dans votre barre de favoris sur votre navigateur et qui permet d’exporter sous forme de tableau CSV, le contenu d’une page web.

Par exemple, sur Amazon, je peux extraire en données structurées une page de résultat. C’est tout con, mais vachement pratique. Ce bookmarklet s’appelle ConvExtra et il faudra s’inscrire sur leur site pour exporter les résultats en CSV.

Vous trouverez toutes les infos ici et une démo en vidéo ci-dessous :


Les articles du moment