Comment extraire en données structurées les infos contenues sur des pages web
Si vous avez besoin d’extraire des données à partir de pages web pour les transformer en données structurées, j’ai peut-être un truc qui va vous plaire. Il s’agit d’un bookmarklet qui se place dans votre barre de favoris sur votre navigateur et qui permet d’exporter sous forme de tableau CSV, le contenu d’une page web.
Par exemple, sur Amazon, je peux extraire en données structurées une page de résultat. C’est tout con, mais vachement pratique. Ce bookmarklet s’appelle ConvExtra et il faudra s’inscrire sur leur site pour exporter les résultats en CSV.
Vous trouverez toutes les infos ici et une démo en vidéo ci-dessous :