Korben, roi d’internet, logo bébé avec des lunettes en mode thug life Korben, roi d’internet, logo bébé avec des lunettes en mode thug life

Korben Upgrade your mind

Photon – Un crawler aussi rapide que la lumière

Si vous cherchez un petit crawler de sites rapide et efficace, pourquoi ne pas tester Photon ?

Développé en python comme la majorité des outils de ce genre, Photon est capable d’extraire des pages parcourues, des URLs (dans le scope ou hors scope), des URLs avec paramètres, des données comme les emails, les comptes de réseau sociaux, les buckets Amazon (héhé), les fichiers JavaScript, les PDF, PNG, XML…etc. ainsi que n’importe quelle chaine de caractère correspondant à une regex.

Le secret de sa rapidité ? Un multithread correctement géré qui lui permet de traiter des dizaines voire des centaines de requêtes sans broncher.

Au-delà de ça, Photon offre un mode Ninja lui permettant de rebondir sur des services en ligne tiers capables d’aller requêter à votre place la cible. Cela signifie qu’au lieu de tout requêter depuis votre ordinateur avec votre IP, Photon vous offre 3+1, soit 4 points d’accès ce qui permet de booster encore plus la récupération des données, mais aussi de réduire le risque de déconnexion due à la rapidité d’enchainement des requêtes.

Pour télécharger et apprendre à utiliser Photon, je vous invite à vous rendre sur sa page Github.


IoT, réalité virtuelle, intelligence artificielle… Comment tirer le meilleur parti des datas ?

Le volume des datas en circulation explose…

20 milliards d’objets connectés prévus en 2020, 1,7 mégabytes de données créé chaque secondes par chaque individu sur Terre et 7,7 milliards d’abonnements à un téléphone mobile dans le monde en 2017 ont été enregistrés.
Les donnees circulent partout et leur flux est de plus en plus important. Je vous invite à aller checker cette infographie sur les datas c’est très intéressant.

En Savoir +



Réponses notables

  1. Et à quoi sert un web crawler ? Peut-on me donner des exemples concrets ? Merci.

  2. À récupérer plein d’infos en masse du web, ça peut te servir pour du big data, ou par exemple pour récupérer tout les liens de plusieurs sites/forums connus pour servir à exposer des leaks et regarder régulièrement si tes noms de domaine perso ou d’entreprise y apparaissent si tu fais de la veille sécu.

Continuer la discussion sur Korben Communauté

4 commentaires supplémentaires dans les réponses

Participants