Aller au contenu
Korben, roi d’internet, logo bébé avec des lunettes en mode thug life

Utilisez MetaGoofil pour extraire les méta-données des documents trouvés sur Internet

Capture d'écran de l'interface utilisateur montrant comment augmenter la place réservée aux programmes sur l'Apple Touch
MetaGoofil est un outil conçu pour extraire les méta-données de fichiers comme les doc, xls, ppt, pdf…etc

La particularité de cet outil est qu’il scanne en ligne les documents se trouvant sur un site particulier (grâce à Google… Ce sont donc des documents publics) et vous faire un petit rapport très interressant sur les infos qu’ils contiennent. Evidement, ces informations comme des noms, des dates de créations, des versions de logiciels…etc pourraient très bien servir à un attaquant potentiel.

Pour tester Metagoofil, vous devez le télécharger en cliquant ici.

Ensuite, décompressez le dans un répertoire.

Vous devez avoir « extract » installé sur votre PC

sudo apt-get install extract

Executez ensuite Metagoofil

./metagoofil

Voici les options que nous avons à notre diposition

usage: metagoofil options

-d: domain to search
-f: filetype to download (all,pdf,doc,xls,ppt, etc)
-l: limit of results to work with (default 100)
-o: output file, html format.
-t: target directory to download files.
Essayons par exemple sur le site de la Poste… (Pourquoi la Poste ? Je sais pas, j’ai pris le premier truc qui me passait par la tête)


./metagoofil.py -d laposte.fr -f all -l 100 -o lapost.html -t toto

Le script nous récupère 100 fichiers sur le site de laposte et nous générera un lapost.html dans lequel on verra les méta données de tous les documents.

Voici par exemple ce qu’on trouve dans les documents du site laposte (j’ai masqué les noms des gens) :


mimetype - application/msword

revision history - Revision #9: Author 'DE COQ**********NT Hervé' worked on 'F:diagnostic_voies-2-3.doc'
revision history - Revision #8: Author 'DE COQ**********NT Hervé' worked on 'F:diagnostic_voies-2-3.doc'
revision history - Revision #7: Author 'DE COQ**********NT Hervé' worked on 'F:Contrats de Servicesdiagnostic_voies-2.doc'
revision history - Revision #6: Author 'DE COQ**********NT Hervé' worked on 'C:diagnostic_voies-2.doc'
revision history - Revision #5: Author 'AR******ANT' worked on 'C:SiteSPIPresdocdiagnostic_voies.doc'
revision history - Revision #4: Author 'AR******ANT' worked on 'C:Documents and SettingsAR******ANTApplication DataMicrosoftWordEnregistrement automatique dediagnostic.asd'
revision history - Revision #3: Author 'AR******ANT' worked on 'C:Documents and SettingsAR******ANTApplication DataMicrosoftWordEnregistrement automatique dediagnostic.asd'
revision history - Revision #2: Author 'AR******ANT' worked on 'C:Documents and SettingsAR******ANTBureaudiagnostic.doc'
revision history - Revision #1: Author 'TR****D' worked on 'C:InternetsnaMairiesdocumentsdiagnostic.doc'
revision history - Revision #0: Author 'TR****D' worked on 'C:Documents and SettingsTR****DLocal SettingsTemporary Internet FilesOLK5FICHIERS DIAGNOSTIC POUR INTERNET.doc'
language - U.S. English
paragraph count - 5
line count - 24
last saved by - DE COQ**********NT Hervé
character count - 2994
template - Normal
creation date - 2007-07-05T14:43:00Z
title - MEMO é??STRATEGIE AVEC LES COA POUR LIENS MAIRIES
word count - 525
page count - 2
creator - WIN98
date - 2007-07-05T14:44:00Z
generator - Microsoft Word 9.0
Et j’en passe des pages et des pages… On a bien sûr à la fin un petit topo sur les noms des personnes qui ont travaillés sur les documents. Bref que du bonheur pour tout social engineer qui se respecte… mais très dangereux pour les entreprises.

Par contre, je n’ai pas pris le temps de chercher mais je ne sais pas si il existe des softs pour nettoyer ces méta-données…

Le tuto en vidéo est dispo chez IronGeek

A bon entendeur…


Les articles du moment