Entrez vos identifiants

x
OU
Vous avez oublié votre mot de passe ?
Utilisateur wiki : vous n'aviez pas d'email ?

Korben - Site d'actualité geek et tech

Go Top

Extraire du texte à partir d’une image

Extraire du texte à partir d’une image

Qui n'a jamais voulu faire un copier coller d'un texte en provenance d'une image ? Par exemple, lorsque des RP qui n'ont rien compris à ce qu'est le web envoient des communiqués de presse en image PNG, je pleure. Mais plus maintenant grâce à Gttext, un petit soft qui permet de faire de l'OCR sur tout ou une partie d'image.

L'outil est très rapide, simple à utiliser et gratuit ! Grâce à cela, vous allez pouvoir extraire n'importe quel chaine de caractères de n'importe quelle photo ou capture écran, sans avoir à tout retaper à la main !

Je déclare ce soft, logiciel le plus pratique de la semaine !

[Source et photo]

Facebook Twitter Email Copier Url

50 Responses to “Extraire du texte à partir d’une image”

  1. ravaged dit :

    Merci pour la newz. Y’a Google Goggles qu’est sensé le faire en prenant une photo et en la scannant, mais c’est pas du tout au point leur truc.
    Ça servira, thx ;)

  2. ravaged dit :

    Alors je viens d’essayer, et au premier coup j’obtiens toujours une sorte de lorem ipsum, un texte illisible, dans ce cas n’hésitez pas à faire “réessayer” et du 2ème coup c’est nickel ;-)

  3. Naoki dit :

    “Je déclare ce soft, logiciel le plus pratique de la semaine !”

    Le plus pratique de l’année tu veux dire. *o*

    Ca fonctionne sur des photocopies ?

  4. Simon dit :

    Ah oui quand même … c’est démentiellement bon ça ! Merci ! :)

  5. Kerlutin dit :

    Nickel ! Merci beaucoup pour l’astuce !

  6. Grefz dit :

    Bonjour es que quelqu’un a une idée de la technologie utiliser pour cela?

  7. Gana dit :

    des milliers de petits chinois qui recopient le texte qu’il y a sur l’image

  8. Leozero dit :

    http://fr.wikipedia.org/wiki/Reconnaissance_optique_de_caract%C3%A8res
    La techno a été initié en 1950 apparemment et les softs existent depuis pas mal d’années maintenant. Mais là si c’est léger et performant (et gratuit) c’est encore mieux.

  9. Foukekette dit :

    Il y a ABBYY FineReader aussi que j’utilise régulièrement, il est très complet, mais en licence payante…
    Après je veux bien tester ce petit Gttext =)

  10. Mickythekiller dit :

    Du coup çà donne quoi pour les email pgn antibot ?? ^^

  11. Crugg2002 dit :

    Kasperky trouve un virus pendant le téléchargement (Trojan downloader W32 Generic)

  12. Fabien dit :

    De même avec Kasperky. Du coup, ça sera sans moi.

  13. Michel dit :

    Même chose !

  14. Ozon3 dit :

    Merci pour l’information:)

  15. Deedoff dit :

    c’est dingue la technologie…ça va me servir !

  16. Photoscope dit :

    Trojan detected, dommage, ça aurait pu être bien comme soft.

  17. Geotrouvetout dit :

    Euh… mon AV trouve un virus dans l’exécutable Windows ! Quelqu’un confirme ?

  18. stiix13 dit :

    Depuis le temps que je cherche un soft comme ça qui fonctionne et gratuit o/

  19. m1k4 dit :

    Très intéressant merci pour le partage ^^
    Tesseract fonctionne plutot bien, il est utilisé par Pyload notamment, et ca marche très bien chez moi.

    Gros -1 pour la version Win uniquement… à moins que je n’ai pas trouvé la version nux, un peu dommage :|

    Pour ceux qui aurait Kaspersky, je pense qu’il détecte un trojan à cause du composant OCR.
    http://www.virustotal.com/file-scan/report.html?id=b279107f7a70cc7bc7be0361787a36076faf852f73faf4cc811c5a15ee06b4bd-1318406971
    (un ticket a été ouvert sur le track du projet, à priori rien de compromis).

    @ravaged:disqus : Je SUPPOSE que Google utilise aussi tesseract au sein de goggles, vu que c’est un projet à HP et eux (mais je peux me tromper), donc ya des chances que sur une même image, le résultat soit le même

  20. Alain Ternaute dit :

    Je l’ai essayé aussi. Mais le résultat n’est pas terrible… A moins que ça se soit amélioré depuis.

  21. papillon41 dit :

    Pour linux, une petite ligne de commande :
    cuneiform -l fra -o texte_pour_ocr.txt texte_pour_ocr.png

  22. Bloodyspawm dit :

    S’il marche super bien, il devrait bypasser les captcha,non? quelqu’un a testé? cela serait inquiétant :(

  23. Mickythekiller dit :

    çà existe déjà pour les captcha, y a qu’a voir jdownloader… mais maintenant les captcha c’est plus des hyeroglyphes lol

  24. Woofy dit :

    Vraiment sympa.
    Manque seulement une fonction : pouvoir faire ça directement sur ce qui est affiché sur l’écran (en gros, il prendrait une capture d’écran lui même, un peu comme le fait l’outil capture de Windows 7). Parce qu’avec ça, je gagnerais beaucoup beaucoup beaucoup de temps !
    Là faut faire une capture, l’enregistrer, l’ouvrir avec le soft, et scanner la partie à récupérer, ce qui est un poil long si on l’utilise beaucoup.

  25. Woofy dit :

    Bon après quelques recherches, en gros ScreenOCR fait ça.
    Sauf qu’il est payant, ne fonctionne que sur le moniteur principal, et n’est pas vraiment super efficace question reconnaissance (du moins sur le test que j’ai fais)

  26. Mickythekiller dit :

    Seul kaspersky detect un faux positif, c’est un peu leger pour laisser tomber ce fabuleux utilitaire

  27. Fabien dit :

    C’est vrai. Je prends alors

  28. Jastjuck dit :

    Un utilitaire comparable sur Linux (Ubuntu) ?

  29. vb078 dit :

    Pas de version pour mac ?

  30. Datawolf dit :

    J’en avais même un qui transformait directement en Excel. Super pratique quand tu as des tableaux… quand un utilisateur t’envoie des screenshots à la place de fichiers.  ;-)

  31. Alexol dit :

    Le truc qui pourrait être encore amélioré, c’est de le faire directement sur l’écran, sans le faire depuis une image (=> manipulation trop lourde pour moi : screen, ouvrir GText, charger l’image…Je préfère : Menu contextuel > GText > Zone de séléction > Hop…)

  32. Dodutils dit :

    J’ai dû rater quelque chose… j’ai l’impression que c’est un simple outil d’OCR comme tant d’autres.

  33. Dodutils dit :

    Par contre sur nirsoft.net (Nir Sofer… encore lui !)  il y a un outil qui récupère les textes dans les menus, listes déroulantes, champs de saisie, label et autres objets Windows pouvant contenir du texte, pour n’importe quel processus lancé (sauf Java et Flash/Air utilisent leurs propres objets).

    Cet outil se nomme SysExporter.

  34. AKD dit :

    de la semaine ? de l’année même !

  35. Lapin Panda dit :

    Ya OneNote de Microsoft Office qui le fait très bien aussi ;)

    L’avantage est qu’on bosse déjà sur un document word par exemple, suite office et hop hop hop

  36. Sureader dit :

    Oui il marche incoryablement bien, je l’ai utiliser des heures hier pour le travail, il fonctionne a chaque… bon il faut enlever les retour de ligne et parfois les “i” sont reconnue bizarement mais il vaut vraiment la peine..

  37. y aurait pas une version en addon pour firefox? ^^

  38. loïc dit :

    Ce serait intéressant de voir si il est plus efficace que OCR encore expérimental du génial projet Sikuli (http://sikuli.org/).

    http://sikuli.org/docx/region.html#extracting-text-from-a-region

    Sikuli est à l’avantage d’être multiplatforme. (avec la notion d’extension possible dans Sikulli on pourrait imaginer d’y intégré les algol de Gtexte)  

  39. Mzeon dit :

    Pas vraiment fiable si on fait autre chose que du bricolage; J’attendrai que la version soit plus au point, sur 15 images testées le programme à planté 12 fois et à reconnu le texte plus ou moins qu’une seule fois; donc bon, c’est un gadget plus qu’autre chose.

  40. Thomas dit :

    Heu j’ai du loupé un truc mais j’ai fait une impression écran des commentaires que j’ai enregistré en bmp et ouvert avec le soft et j’arrive pas a sélectionner de zone à traité en ocr.

  41. GT.exe – Erreur d’application
    L’instruction à …emploie l’adresse mémoire…

    Poubelle. Dommage ça m’aurait bien été utile :/

  42. Moi dit :

    même problème ici. J’ai testé 3 versions ça fait toujours pareil. Domage ça avait l’air basique comme il faut.

  43. Guillaume dit :

    Le soft ne rend pas des bons résultats suite a mes essais: text clair sur fond noir, police taille 10.

    Il confond les chiffres: interprete le 3 en 8, le 6 en 9 (et inversement)

    Agrandir l’image en x6 limite les dégats, mais toujours pas top: il se trombe ~2 fois sur 3 (en cliquant sur re-essayer)

    IMO, pour l’instant le meilleur outil d’OCR reste celui inclu de base dans la suite microsoft office.
    Je l’utilise intensivement (avec un robot qui scanne ~5000 images/jour), et il a un rendu tres correct.
    inconvenient: on a besoin d’installer toute la suite office pour ce petit bout de feature.

    J’avais essayé Tessaract il y a 6 mois et il me pondait des résutlats tres incohérents: ei: lettres générées là ou il devrait y avoir des chiffres, blocs de texte rendus n’ayant rien a voir avec le contenu de l’image …
    Il semblerait que cet outil soit un GUI pour Tessaract qui est en ligne de code.

    Merci de l’info quand meme

  44. Batmkana dit :

    plante chez moi, je préfère ABBYY Fine reader

  45. damien paillot dit :

    Merci beaucoup pour l’astuce !

  46. Mick dit :

    En important avec google doc une image il est possible de la convertir en text, c’est un peu plus simple non??

  47. kyavijaya dit :

    Génial, quelqu’un connait un projet similaire mais complétement open-source, c’est à dire où on peut voir les sources ?

  48. z_z dit :

    ce logiciel use tesseract qui est open source. Je travaille sur de l’OCR, je connais bien le sujet et rien n’est plus fiable que tesseract en gratuit et open source (même si la fiabilité est loin d’un bon résultat)
    Les logiciels payants sont parfois plus fiables mais la plupart des outils utilisent tesseract en interne.
    Pour info, Sikuli utilise aussi tesseract

La menace des failles 0-Day

capture-vjhj

"En avril 2014, les chercheurs en sécurité de Google sont tombé sur une vulnérabilité présente à l’intérieur de la bibliothèque cryptographique OpenSSL. Petit problème, OpenSSL est utilisé sur les 2/3 des sites web qui utilisent HTTPS mais aussi par les téléphones Android. Heartbleed était né."

Si comme moi vous êtes un passionné de sécurité informatique et que vous vous demandez qu'est-ce qu'un truc comme Heartbleed peut causer comme dommages, la lecture de cet article sur les failles 0-Day est pour vous...et je vous rassure je ne parle pas du dernier film Blackhat récemment vu au ciné ;)

Lire la suite

Vous avez aimé cet article ? Alors partagez-le avec vos amis en cliquant sur les boutons ci-dessous :

Twitter Facebook Google Plus Linkedin email
Rejoignez les 55248 korbenautes
et réveillez le bidouilleur qui est en vous
abonnez-vous en savoir plus
"Vous aimez bidouiller ?" Oui j'adore l'informatique et la technologie
Suivez Korben Un jour ça vous sauvera la vie.. Ou celle d'un(e) ami(e)
  • Rejoignez les 55248 bidouilleurs de la grande famille des Korbenautes
    «Je considère que votre email est aussi important que le mien.»
    Korben
  • Univers Populaires

  • Site hébergé par
    Agarik Sponsor Korben
  • Vidéos

  • DANS TON CHAT (BASHFR)

    Peach : ça fait plaisir de voir un peu d'humanité *-*
    terminator66 : salut les connards

    -- http://danstonchat.com/7855.html
  • Themes

  • Une astuce pour rendre

    Windows 10 plus rapide

    Si vous trouvez que Windows 10 est un peu lent, que vos applications ne se lancent pas très vite, que vos compilations prennent du temps, voici une petite astuce débusquée par Brominou pour accélérer le bouzin. Cliquez dans la zone de recherche de la barre Windows et tapez le mot clé...lire la suite

    Cryptool pour s'initier à la cryptographie

    Alors attention, ce n'est pas nouveau, mais je me suis dit que ce serait intéressant de vous en parler si vous ne connaissez pas encore. Cryptool est un logiciel open source éducatif qui va vous permettre de comprendre les principes de base de la cryptographie. Dans sa version 2, Cryptool intègre...lire la suite

    En ce moment dans l'univers "Windows"

    Voir tous les articles »