Entrez vos identifiants

x
OU
Vous avez oublié votre mot de passe ?
Utilisateur wiki : vous n'aviez pas d'email ?

Korben - Site d'actualité geek et tech

Go Top

Nettoyer et organiser des données en vrac

Nettoyer et organiser des données en vrac

Il m'est arrivé à plusieurs reprises de devoir nettoyer des données, les organiser, et rendre tout ceci un peu moins bordélique et surtout intégrable dans des bases pour être utilisée par un moteur de recherche. En général, ça se passe à grand coup de rechercher / remplacer, d'expressions régulières et parfois de macro ou de code.

Bref, c'est chiant.

Puis ce matin, je découvre un projet open source sous licence BSD et initié par Google en 2011 qui s'appelle OpenRefine et dont le but est justement de permettre à tout un chacun de faire ce genre de nettoyage beaucoup plus rapidement.

Pour résumer, OpenRefine est un "structurateur de données en bordel". J'ai regardé les vidéos d'explication et j'ai trouvé ça vraiment sympa. Pour ceux qui se demandent si Google récupère les données, rassurez-vous... L'outil se lance sur votre ordinateur et fonctionne uniquement en local (Windows, OSX, Linux).

Bref, je me note ça pour la prochaine fois que j'aurai des gros fichiers de data à réorganiser.

Plus d'infos ici

Vous avez aimé cet article ? Alors partagez-le avec vos amis en cliquant sur les boutons ci-dessous :

Twitter Facebook Google Plus Linkedin email Flattr ! Bitcoin DogeCoin


CotEditor – Un éditeur de texte à la Notepad++ pour OSX

CotEditor – Un éditeur de texte à la Notepad++ pour OSX

Sous OSX, il y a un éditeur par défaut qui s'appelle TextEdit. Mais bon, il est plus que basique et se rapproche un peu de Notepad sous Windows en terme de fonctionnalités.

Sous Windows, les gens le remplacent assez facilement par des trucs comme Notepad++. Mais sous OSX, si on veut un bon éditeur, il faut se tourner vers des Coda et Textmate qui sont quand même plus des outils de dev que de véritables blocs-notes évolués.

M'enfin peu importe puisque ce vide est maintenant comblé grâce à CotEditor. Cet outil gratuit et libre (licence GPL) est très léger, se lance en un clin d'oeil et propose des petites fonctionnalités pas dégeus comme la coloration syntaxique des principaux langages (PHP, Python, Ruby, Markdown, HTML...etc.), des fonctionnalités de recherche/remplacement évoluées (supporte des expressions régulières), la possibilité de splitter un document pour avoir sous les yeux différentes parties de ce même doc, et un gestion parfaite de l'encodage des caractères.

tools

Autrement, CotEditor est ultra personnalisable. Vous pouvez paramétrer votre propre coloration syntaxique (s'il manque un langage supporté), déclencher des templates lorsque vous glissez déposer un document dans la fenêtre...

preferences

...mais aussi mettre au point de véritables scripts (macros) en Python, Perl, Ruby, PHP, Shell Unix, Applescript et même JavaScript sous Yosemite pour manipuler ou modifier votre contenu. On peut imaginer ouvrir un log Apache avec CotEditor, et lancer une macro qui le transformera en rapport lisible facilement (ou en page HTML..etc.).

À vous de voir, la seule limite, c'est votre imagination !

CotEditor est téléchargeable ici.

Vous avez aimé cet article ? Alors partagez-le avec vos amis en cliquant sur les boutons ci-dessous :

Twitter Facebook Google Plus Linkedin email Flattr ! Bitcoin DogeCoin

Astral – Organisez vos découvertes GitHub

Astral – Organisez vos découvertes GitHub

Si vous passez beaucoup de temps sur Github à sélectionner des projets sympas, voici une petite app en ligne qui va vous intéresser. En effet, lorsqu'on se rend sur un projet Github, on peut cliquer sur le bouton "Star" pour dire qu'on l'aime bien, un peu comme un like Facebook ou un +1 Google.

star

Seulement, ensuite c'est un peu perdu dans la nature. Et c'est là qu'intervient Astral.

Astral est une app en ligne qui va lister de manière agréable tous les projets Github que vous avez mis en favori, avec la possibilité d'ajouter des tags sur ces projets, de visualiser le Readme de chacun d'entre eux et surtout de faire des recherches sur tout ça.

astralapp

L'intérêt, c'est que bien taggé, il vous sera facile de remettre la main sur un projet Github croisé lors de l'une de vos séances de surf.

Bref, pratique pour ceux qui aiment conserver dans un coin ce genre de chose

Vous avez aimé cet article ? Alors partagez-le avec vos amis en cliquant sur les boutons ci-dessous :

Twitter Facebook Google Plus Linkedin email Flattr ! Bitcoin DogeCoin

Syncthing devient Pulse et compte bien détrôner Bittorrent Sync

Syncthing devient Pulse et compte bien détrôner Bittorrent Sync

Au moment où Bittorrent annonce une offre payante à 39,99 € par an qui permettra de synchroniser sur vos propres espaces de stockages (pas de cloud ici) un très grand nombre de machines et une très grande quantité de données, voici un petit nouveau qui fait la même chose. Normal, car c'est tout simplement le successeur officiel de Syncthing dont je vous avais déjà causé.

Son nom : Pulse.

Cet outil dispo sous Windows, Mac, Linux, BSD et Solaris utilise le protocole Block Exchange qui permet de synchroniser des répertoires entre plusieurs machines, le tout de manière sécurisée (clés RSA + utilisation de TLS ).

Vous définissez les répertoires, puis vous configurez les machines en indiquant aux unes et aux autres, les clés d'identifications. Et contrairement à BtSync qui permet de se connecter à tout et n'importe quoi du moment qu'on obtient (ou devine) la clé, Pulse demande de choisir lors de la config, les machines que vous souhaitez autoriser.

pulse2

BtSync est un logiciel fermé et Pulse / Syncthing est distribué sous licence GPLv3. D'ailleurs les sources sont disponibles ici.

Pour ne rien gâcher à l'affaire, il est totalement portable. Vous pouvez donc vous balader avec sur une clé USB et synchroniser vos fichiers, peu importe votre localisation.

Pulse est encore jeune, mais très prometteur, car il reprend les grands principes de Bittorrent Sync, sans ses défauts (fermeture des sources et synchro openbar).

Il ne manque que des versions officielles pour le NAS (version non officielle ici) et les applications mobiles qui vont bien... (Android non officielle ici) Mais tout ceci devrait arriver bientôt, car les gens d'Ind.ie qui sont derrière cet outil ont lancé une campagne de financement participatif pour booster leurs différents projets.

A tester donc ! (Et à soutenir si ça vous plait)

Vous avez aimé cet article ? Alors partagez-le avec vos amis en cliquant sur les boutons ci-dessous :

Twitter Facebook Google Plus Linkedin email Flattr ! Bitcoin DogeCoin

Extraire plusieurs zip en ligne de commande ? Caution: filename not matched

Extraire plusieurs zip en ligne de commande ? Caution: filename not matched

Voici une petite astuce à la con que je me note là pour plus tard, quand je serai vieux et que je l'aurai oublié.

J'ai eu besoin aujourd'hui de dézipper un grand nombre de fichiers .zip via mon terminal. Pour cela, j'ai naïvement tapé la commande :

unzip *.zip

Mais tout ce que j'ai obtenu c'est une longue liste d'erreur

  • caution: filename not matched: Premier.zip
  • caution: filename not matched: Second.zip
  • caution: filename not matched: Troisième.zip
  • ....

Même souci sous OSX et apparemment Linux.

Après réflexion, il s'avère que la commande unzip lancée comme ceci ouvre tout simplement le premier zip trouvé et recherche à l'intérieur les autres zip.

Pas du tout ce que je veux faire. Finalement, j'ai trouvé...

Il suffit d'échapper le caractère * avec un antislash. Du coup pour dézipper tous mes fichiers, je n'ai eu qu'à taper :

unzip \*.zip

Et le tour est joué...

Vous pouvez aussi utiliser des guillements :

unzip "*.zip"

Vous avez aimé cet article ? Alors partagez-le avec vos amis en cliquant sur les boutons ci-dessous :

Twitter Facebook Google Plus Linkedin email Flattr ! Bitcoin DogeCoin

Laby – Ce moment où je me suis souvenu que j’étais une sous-merde en calcul mental

Laby – Ce moment où je me suis souvenu que j’étais une sous-merde en calcul mental

Si vous aimez le calcul mental, et les petits jeux rigolos, alors vous allez surkiffer ce vendredi ensoleillé (en tout cas, chez moi en Auvergne).

Laby est un jeu qui au premier coup d'oeil ressemble au fils prodige d'un 2048-like et d'une grille de Sudoku. Mais ne vous y trompez pas, car il vous faudra des supers pouvoirs en calcul mental si vous voulez aller loin dans les niveaux.

Je crois mon premier zéro à l'école, c'était en CM2, justement en calcul mental. Bizarrement, à chaque fois que j'ai besoin de faire un calcul, même simple, avec ma matière grise dégénérée, mon cerveau se bloque, un peu comme un Windows qui freeze.

M'enfin, peu importe, je partage quand même ce jeu dont le but est de déplacer un total dans cette grille, en essayant d'obtenir le résultat demandé plus haut. Additions, soustractions, multiplications, divisions... Elles y sont toutes et vous aurez l'impression d'être dans une partie sans fin des Chiffres et des Lettres.

objectif

Et lorsque votre total correspondra à celui demandé, paf, niveau suivant !

Reste à savoir maintenant si ce jeu vous agacera au bout de 5 minutes ou si vous allez passer tout votre vendredi dessus pour péter des records et faire travailler vos méninges.

🎵 Laby, c'est fini. Je ne crois pas que j'y retournerai un jour. Laby, c'est finiiiiiii.....🎵

Vous avez aimé cet article ? Alors partagez-le avec vos amis en cliquant sur les boutons ci-dessous :

Twitter Facebook Google Plus Linkedin email Flattr ! Bitcoin DogeCoin

  • Rejoignez les 55351 bidouilleurs de la grande famille des Korbenautes
    «Je considère que votre email est aussi important que le mien.»
    Korben
  • Univers Populaires

  • DANS TON CHAT (BASHFR)

    <Fish> je trouve rien du tout, c'est très gênant
    <Trankill> Fish: beh ça veut dire qu'on t'a menti... et en fait t'es une fille :)

    -- http://danstonchat.com/294.html
  • Inscrivez vous aux bon plans

  • RSS Emplois sécurité

  • Site hébergé par
    Agarik Sponsor Korben
  • RSS Offres d’emploi

  • Vidéos

  • Une astuce pour rendre

    Windows 10 plus rapide

    Si vous trouvez que Windows 10 est un peu lent, que vos applications ne se lancent pas très vite, que vos compilations prennent du temps, voici une petite astuce débusquée par Brominou pour accélérer le bouzin. Cliquez dans la zone de recherche de la barre Windows et tapez le mot clé...lire la suite

    Cryptool pour s'initier à la cryptographie

    Alors attention, ce n'est pas nouveau, mais je me suis dit que ce serait intéressant de vous en parler si vous ne connaissez pas encore. Cryptool est un logiciel open source éducatif qui va vous permettre de comprendre les principes de base de la cryptographie. Dans sa version 2, Cryptool intègre...lire la suite

    En ce moment dans l'univers "Windows"

    Voir tous les articles »