Skip to content
Korben, roi d’internet, logo bébé avec des lunettes en mode thug life

Nettoyer et organiser des données en vrac

Il m’est arrivé à plusieurs reprises de devoir nettoyer des données, les organiser, et rendre tout ceci un peu moins bordélique et surtout intégrable dans des bases pour être utilisée par un moteur de recherche. En général, ça se passe à grand coup de rechercher / remplacer, d’expressions régulières et parfois de macro ou de code.

Bref, c’est chiant.

Puis ce matin, je découvre un projet open source sous licence BSD et initié par Google en 2011 qui s’appelle OpenRefine et dont le but est justement de permettre à tout un chacun de faire ce genre de nettoyage beaucoup plus rapidement.

Pour résumer, OpenRefine est un « structurateur de données en bordel ». J’ai regardé les vidéos d’explication et j’ai trouvé ça vraiment sympa. Pour ceux qui se demandent si Google récupère les données, rassurez-vous… L’outil se lance sur votre ordinateur et fonctionne uniquement en local (Windows, OSX, Linux).

Bref, je me note ça pour la prochaine fois que j’aurai des gros fichiers de data à réorganiser.

Plus d’infos ici


Quel VPN choisir ?

Si tu es à la recherche d’un service de VPN qui à la fois protège ton anonymat, te permet d’accéder à des sites bloqués dans ton pays en changeant d’IP et qui te donne accès aux catalogues étrangers de Netflix, Amazon…etc, j’ai ce qu’il te faut.

Découvre le VPN de Cyberghost

Lien partenaire

Les articles du moment