Korben, roi d’internet, logo bébé avec des lunettes en mode thug life Korben, roi d’internet, logo bébé avec des lunettes en mode thug life

Korben Upgrade your mind

Nettoyer et organiser des données en vrac

Il m’est arrivé à plusieurs reprises de devoir nettoyer des données, les organiser, et rendre tout ceci un peu moins bordélique et surtout intégrable dans des bases pour être utilisée par un moteur de recherche. En général, ça se passe à grand coup de rechercher / remplacer, d’expressions régulières et parfois de macro ou de code.

Bref, c’est chiant.

Puis ce matin, je découvre un projet open source sous licence BSD et initié par Google en 2011 qui s’appelle OpenRefine et dont le but est justement de permettre à tout un chacun de faire ce genre de nettoyage beaucoup plus rapidement.

Pour résumer, OpenRefine est un « structurateur de données en bordel ». J’ai regardé les vidéos d’explication et j’ai trouvé ça vraiment sympa. Pour ceux qui se demandent si Google récupère les données, rassurez-vous… L’outil se lance sur votre ordinateur et fonctionne uniquement en local (Windows, OSX, Linux).

Bref, je me note ça pour la prochaine fois que j’aurai des gros fichiers de data à réorganiser.

Plus d’infos ici


Travailler dans un groupe d’aéronautique ?

Découvrez les offres d’emploi et de stages de Safran dans la data, le digital, le logiciel et les systèmes d’information

Machine Learning, technologie 3D, systèmes de communication ou encore robotique, nous serais amenés à travailler sur différents projets innovants dans une entreprise qui vous laissera entièrement libre de proposer vos idées et qui vous accompagnera dans vos projets.

Vous pourrait peut être travailler sur notre projet Cassiopée : il s’agit du service que l’on rend aux compagnies aériennes, sur l’analyse de leurs données de détection et de déviation par rapport aux standards opérationnels, à des fins de sécurité aérienne.

Si vous n’avez pas peur d’être ambitieux venez consulter nos postes ouverts