Aller au contenu
Korben, roi d’internet, logo bébé avec des lunettes en mode thug life

Besoin d’un hébergement pour ton site web ? Clique-ici ! (lien partenaire)

Vous êtes toujours à la recherche d’une bonne image à partager sur vos réseaux ou à utiliser dans vos créations, seulement, voilà, vous n’avez pas forcément le temps de parcourir toutes les bibliothèques d’images en ligne.

Pas de souci les copains, j’ai ce qu’il vous faut ! C’est un site qui s’appelle DDMM et qui propose une recherche unifiée d’images sur tout un tas de sites plus ou moins cool, dans la licence de votre choix (commerciale ou creative commons).

Mais cela ne s’arrête pas là, puisqu’une fois une image trouvée, en cliquant dessus, vous aurez des images alternatives générées par IA, à partir de l’image d’origine.

DDMM propose ainsi des images de type « Expand », un genre de reverse de l’image d’origine, qui est ensuite utilisé pour en générer de nouvelles avec Stable Diffusion.

Ou tout simplement des variations de celle-ci, plus ou moins ratées.

Et comme vous pouvez éditer ou créer de nouveaux prompts, cela peut vous permettre d’obtenir une image qui vous convienne mieux si vous ne trouvez pas l’image parfaite dans les résultats de recherche classiques.

Concernant les images générées, ce n’est pas forcement super sexy mais ça peut faire illusion. Tout dépend de votre utilisation. Mais je trouve le concept de métamoteur d’images couplé à une IA qui recrée les images (qui a dit plagier ??) très intéressant.

Ah et pour récupérer une image faite avec l’IA, il n’y a pas de bouton « Download »… Faudra faire simplement un clic droit sur l’image et l’enregistrer.

Si ça vous branche de tester, c’est par ici que ça se passe.


Bonjour à tous ! Aujourd’hui, je vais vous parler d’un nouvel allié dans notre quête pour explorer et capturer l’immensité du web : Trafilatura.

Cet outil open source codé en Python va vous permettre de collecter efficacement des textes sur des pages Web tout en simplifiant grandement la tâche des développeurs et utilisateurs. Plongeons ensemble dans les détails.

Trafilatura est à la fois un logiciel en ligne de commande et une lib Python (+ R) développé pour répondre aux besoins spécifiques que sont le crawling mais aussi l’extraction et le traitement de texte à partir de sources Internet.

L’outil est également capable de récupérer des métadonnées ou encore des commentaires issus des pages webs. L’idée derrière ce projet c’est réussir à ne pas se perdre dans cette jungle HTML en ne conservant que l’essentiel du contenu et en faisant abstraction du reste (sidebar, header, footer…etc). Le challenge ici est donc d’éliminer ces « éléments parasites » inutiles et de pouvoir accéder uniquement au contenu intéressant.

Pour l’installer, c’est hyper simple avec pip :

pip install trafilatura

Et pour le code, voici un exemple d’utilisation :

from trafilutura import fetch_url, extract

downloaded = fetch_url('https://korben.info')
result = extract(downloaded)
print(result['content']) # Affiche seulement le contenu principal.

Maintenant que vous avez une idée de ce à quoi sert Trafilatura, parlons un peu plus en détail des fonctionnalités dispo. Trafilatura est capable de gérer les sitemaps (txt et xml) ainsi que les flux (atom, json, rss). Vous pouvez lui donner des listes de liens à récupérer mais également filtrer certains contenus, voire les dé-dupliquer si besoin.

Au niveau des sources, comme je le disais, il peut prendre en entrée une simple URL mais vous pouvez aussi lui passer directement le HTML. Il gère bien les demandes, ce qui évitera de se faire bloquer par les serveurs et vous pourrez lancer plusieurs récupérations en parallèle. Au niveau des données récupérées, je vous ai parlé des métadonnées et du texte, mais il peut aussi récupérer les liens, la mise en forme HTML et les commentaires des gens sur les pages.

Au niveau de la sortie, il peut vous pondre du texte, du CSV, du JSON ou encore du XML.

Vous pouvez également l’appeler directement depuis votre terminal comme ceci :

trafilatura -u "https://korben.info"

En résumé, Trafilatura est un outil vraiment intéressant pour tous ceux qui travaillent avec des données en provenance du web et qui veulent aller directement à l’essentiel.

Source


Ça vous dirait de tester en local certains modèles LLM (IA) sans trop vous prendre la tête à télécharger des trucs et à installer des machins ?

Et bien, j’ai ce qu’il vous faut !

Cela s’appelle Faraday et c’est un client LLM développé en Proton qui permet d’expérimenter des tas de modèles différents comme Vicuna, Wizard ou encore Vigogne (en français). Une fois le ou les modèles de votre choix récupéré, et bien y’a plus qu’à discuter avec l’outil en vous réglant un persona selon vos propres désirs.

De quoi remplacer ChatGPT pour pas mal d’usages pratiques comme faire des synthèses ou rédiger des tweets. Des tâches simples qui fonctionneront très bien et qui la plupart du temps vous suffiront. Après ça dépendra des modèles que vous utiliserez et il y a fort à parier que dans le futur, ce sera encore plus ouf.

Quoiqu’il en soit, vous devrez avoir une machine puissante, mais rassurez-vous, si vous êtes trop gourmand, Faraday vous informera que le modèle que vous essayez de télécharger est trop costaud pour votre config misérable.

Merci à KaosProject pour le partage.

Faraday est à télécharger ici.


Next INpact vient de fêter ses 23 années d’existence et ce média indépendant bien connu de tous, traverse actuellement une période financière plutôt difficile. Leur modèle économique reposant sur les abonnements et la pub, cette aventure risque aujourd’hui de s’achever à cause d’une campagne de financement faiblarde.

La société derrière Next INpact a besoin de 200 000 euros pour continuer son aventure sereinement cette année et si ça foire, elle devra déposer le bilan.

J’ai toujours trouvé ça hyper tendu de faire tenir des salaires uniquement grâce au soutien des lecteurs, mais je pensais que si un média Tech pouvait le faire, ce serait bien Next INpact. Toutefois en 2019, ils ont été contraints de faire quelques ajustements, ce qui malheureusement n’a pas suffi.

Évidemment, j’aurais encore beaucoup de choses à dire sur tout ça, avec mes 19 ans d’existence et après avoir failli également disparaitre moi-même (enfin, le site ^^) il y a 2 ans.

Sur le financement par abonnement bien sûr, mais également au sujet de la publicité sous toutes ses formes, sur le fonctionnement d’un média en ligne et sur sa résilience. Sans oublier de parler des internautes qui « consomment » ces contenus et bien sûr, de la fameuse indépendance éditoriale chère à tous… mais je pense que ce n’est pas le moment opportun donc on verra ça plus tard.

Bref, si comme moi, vous appréciez le travail de Next INpact et que vous voulez les soutenir, cliquez ici !

Je suis certain que leur appel au secours sera suffisant pour continuer cette année grâce à tous ! Merci pour eux.

(et merci à Johnny de m’avoir alerté)


Vous avez toujours été fasciné par le monde mystérieux de la cryptographie ?

Et bien, aujourd’hui, je vous présente une plateforme en ligne gratuite et vraiment très fun qui va vous permettre de vous plonger dans cet univers captivant: CryptoHack !

Cette plateforme en ligne vous propose une série d’énigmes crypto et de défis pour apprendre la cryptographie moderne tout simplement en… la cassant. Hé oui !

Ainsi, en résolvant des défis, vous gagnerez des points ce qui vous fera monter dans le classement. Avant de commencer, vous devrez évidemment installer Python et pip ainsi que diverses libs qui vous seront demandés au fur et à mesure des challenges.

Les défis de CryptoHack couvrent divers sujets liés à la crypto et ceux-ci deviendront de plus en plus pointus au fur et à mesure de votre progression. Mais rassurez-vous, ce sera toujours bien expliqué dans les leçons (en anglais et très fun à faire. C’est comme un jeu finalement et en plus, c’est totalement gratuit.

À vous de jouer ! Et vous trouverez également d’autres ressources (dont root_me) pour vous exercer au Ethical Hacking en cliquant sur ce lien.