Aller au contenu
Korben, roi d’internet, logo bébé avec des lunettes en mode thug life

Vous aimez les cryptomonnaies ❤️ Korben.info, alors cliquez ici pour me soutenir ! Merci !

Savez-vous ce qu’est un Tarpit ?

Alors, non, c’est pas l’ex d’Angelina. C’est plutôt l’équivalent numérique du nid de poule rempli de goudron dans lequel allaient mourir les dinosaures et les mammouth. Un tarpit est donc un système informatique qui va ralentir, voire embourber, n’ayons pas peur des mots ^^ les scripts kiddies qui seraient tentés de faire du bruteforce sur votre serveur.

Vous l’aurez compris, c’est donc un système de sécurité qui fait perdre du temps à l’assaillant en lui faisant croire qu’il est bon endroit, mais où chacun de ses essais de mots de passe devient de plus en plus lent.

Alors comment est ce qu’on met ça en place ?

Et bien sur votre serveur Linux, vous pouvez opter pour l’outil Endlessh. C’est open source, et c’est vachement efficace contre les bruteforce à destination de SSH. Une fois configuré, quand l’attaquant arrive sur l’écran de connexion SSH, tout ce qu’il fera ou verra à l’écran sera en réalité un faux écran de login SSH propulsé par Endlessh qui s’affichera tellement lentement que la seule option sera d’abandonner l’attaque.

Tout est réglable, à savoir le port utilisé, le délai d’affichage des messages, le nombre max de clients…etc.

Usage: endlessh [-vhs] [-d MS] [-f CONFIG] [-l LEN] [-m LIMIT] [-p PORT]
  -4        Bind to IPv4 only
  -6        Bind to IPv6 only
  -d INT    Message millisecond delay [10000]
  -f        Set and load config file [/etc/endlessh/config]
  -h        Print this help message and exit
  -l INT    Maximum banner line length (3-255) [32]
  -m INT    Maximum number of clients [4096]
  -p INT    Listening port [2222]
  -s        Print diagnostics to syslog instead of standard output
  -v        Print diagnostics (repeatable)

De base, les gens qui utilisent ce tarpit le branchent sur le port 22 (qui est normalement celui de SSH) pour utiliser un autre port pour leur vrai accès distant. Mais grâce à cet autre projet nommé Fail2ban Endlessh, il est parfaitement possible de conserver une connexion classique SSH sur le port 22, mais de rediriger les IPs qui vous maltraitent vers Endlessh.

Voilà super outil qui ne consomme rien en termes de ressources, mais qui vous permettra de vous défendre contre les tentatives de connexions SSH non autorisées tout en réduisant la charge du serveur (puisque ça dissuade les cyber-Titouan de le bruteforcer).

Merci à MaitreTofu pour le partage.


— Article en partenariat avec Incogni

Hellow les amis, comment se passe votre premier été de l’année ? (vu les températures on pourrait presque s’y tromper). De mon côté je m’arrange pour continuer à vous parler du service Incogni de Surfshark et ses différentes utilités au quotidien. Pas de repos pour les braves, je bronzerai plus tard.

Ces derniers mois j’ai pas mal exploré avec vous la problématique du respect de vos informations privées sur le web. Notamment quels sont les organismes qui volent vos données, les achètent ou les récupèrent légalement sans votre consentement. Les fameux data brokers. Mais nous avons aussi vu que les failles potentielles ne viennent pas toujours de ce qui nous parait le plus probable (site web, ecommerce, boite mail, réseaux sociaux …).

Incogni Infos Perso

Pour vous le rappeler en 2 lignes, un data broker va chercher à se procurer des tonnes de données variées. Puis va croiser toutes ses sources pour dresser un profil aussi précis que possible de chaque internaute. Ce qui est assez simple puisqu’il suffit d’extraire les éléments communs à plusieurs bases de données. Votre adresse mail et votre lieu d’habitation sont renseignés chez un vendeur en ligne ? Le même mail a servi pour créer un profil sur un Tinder-like depuis votre smartphone ? Bam, le courtier sait que vous avez la dalle, l’endroit ou vous habitez et comment vous démarcher de plusieurs manières différentes. Mais toutes les fuites potentielles ne sont pas si facilement identifiables ou nous n’avons simplement jamais pensé qu’elles pouvaient présenter un problème.

Par exemple votre voiture intelligente est une source exploitable et surtout exploitée (certaines marques ne cachent même pas qu’elles font de la revente de données). Tout comme votre smartphone (mais ça on s’y attendait déjà), et probablement toute connexion à un service VPN gratuit & Co. C’est déjà pas mal oui, mais voilà il semble qu’il y a un autre acteur à prendre en compte : les gouvernements.

Selon Numérama, c’est en tous cas ce qu’a révélé officiellement un élu américain, Ron Wyden, fin janvier. Documents à l’appui il explique que la NSA se procure les informations personnelles d’internautes auprès de ces mêmes datas brokers dont je parlais plus haut. Et cela depuis plusieurs années. Vous allez me dire que ce n’est pas grave, c’est chez les ricains. Sauf que la NSA a également reconnu récupérer des infos sur des téléphones hors territoire national.

Et même s’ils ne s’occupaient que du peuple américain, peut-on imaginer qu’il en va différemment chez nous ? Nous avons quelques lois comme RGPD & co, mais je doute que ce soit un réel problème pour notre classe dirigeante. Donc, que faire ? Déjà commencer par sécuriser au mieux votre surf au quotidien : se servir d’outils respectueux de la vie privée, bloquer un maximum de traqueurs, cookies & Co, disposer d’un VPN fiable, ne pas s’inscrire sur des sites inutilement, nettoyer ses métadonnées et autres footprints, éventuellement utiliser des adresses jetables, etc.

Mais lorsque le mal est fait, et lorsque les brokers ont récupéré vos infos, l’éventail d’options est assez maigre. Soit vous allez devoir partir en quête de tous les courtiers, les contacter, les harceler pour qu’ils vous fassent disparaitre, faire du suivit pour vérifier qu’ils ne vous remettent pas dans leur base, etc. Ça, c’est l’option usante, frustrante et qui va occuper vos longues soirées d’hiver d’été.

L’autre possibilité c’est Incogni. Vous seul avez la capacité d’agir de manière préventive. Cependant, l’outil de Surfshark est là pour vous soutenir en ce qui concerne les incidents qui ont déjà échappé à votre vigilance.

Si vous n’êtes pas encore conscient du risque que représente la divulgation de vos données personnelles, sachez qu’il est probable qu’elles circulent déjà de manière non autorisée (surtout que la plupart des grosses plateformes ont fuité il y a juste quelques semaines). Incogni se propose de vous assister dans le nettoyage de ces données. Le service cible déjà près de 200 courtiers, et ce chiffre continue de croître. Lorsque vous sollicitez Incogni, il examine cette liste et vous informe des organismes qui détiennent des informations vous concernant, incluant le niveau de danger associé.

interface incogni

Par la suite, Incogni entre en contact avec ces entités pour faire valoir vos droits et demander la suppression de vos données de leurs bases. Ce processus est répété aussi longtemps que nécessaire, tout en surveillant constamment pour éviter tout ajout ultérieur de votre information par ceux qui l’ont retirée précédemment. Et bien sûr vous suivez toute l’évolution du processus via une interface simple à prendre en main. Vous pouvez jeter un oeil sur mon test pour vous faire une idée concrète.

Vous ne perdez rien à l’essayer, en prenant l’option annuelle cela vous reviendra à moins de 6.5€/mois (HT). Avec l’habituelle garantie 30 jours satisfait ou remboursé. Sinon vous pouvez aussi accéder au service en prenant le pack Surfshark One+. Ce dernier vous permet de bénéficier également d’un VPN, d’un antivirus, d’un système d’alerte et d’un moteur de recherche personnel pour seulement 1€/mois de plus. À vous de choisir !

Découvrir le service Incogni !


On est tous là avec nos formats d’images d’avant la guerre, à savoir le JPEG, le PNG et le WebP alors qu’il existe des trucs beaucoup plus efficaces aujourd’hui en 2024. L’objectif de cet article est donc de vous les présenter.

Le premier s’appelle AVIF (AV1 Image File Format) qui est basé sur le codec vidéo AV1, très connu pour son efficacité en termes de compression. L’AVIF est très adapté pour tout ce qui est images pour les sites web, mais également pour tout ce qui est images animées. Ça en fait donc une bonne alternative aux GIF animés et surtout, de très nombreux navigateurs modernes le supportent déjà.

L’autre format c’est le JXL qui n’est ni plus ni moins que la contraction de JPEG et de XL. Celui-ci est conçu pour compresser efficacement les photos avec ou sans perte selon ce que vous choisissez, tout en préservant une très haute résolution (au-delà du milliard de pixels si ça vous chante) avec plein dé détails. L’algo qui permet d’encoder les images en JXL est d’ailleurs jusqu’à 10 fois plus rapide que celui d’AVIF.

Ces deux formats qui supportent tous les deux la transparence, sont sortis vers 2019 et sont open source et non commerciaux. Alors c’est bien beau tout ça, mais comment on fait pour convertir nos images dans ces formats ? Et bien logiquement, n’importe quel outil de traitement d’image un peu récent peu le faire, mais autrement, y’a des outils.

Pour l’AVIF, vous pouvez utiliser les outils cavif-rs ou encore FFMPEG. Cavif-rs ce sera plus pour les images statiques et FFMPEG pour les gifs animés.

Prenons cette image PNG pour un beau fond d’écran de 1,9 Mo et d’une résolution de 1456 × 816 pixels :

En la convertissant en AVIF à l’aide de la commande suivante :

cavif Downloads/wallpaper.png -o Downloads/wallavif.avif -f

On obtient la même image, avec la même résolution sauf qu’elle pèse maintenant 77 ko. Je vous l’intégre dans mon WordPress pour que vous voyiez que c’est bien supporté par votre navigateur, mais comme WordPress ne supporte pas encore nativement ce format, le rendu est un peu cra-cra :

Je ne vous avais pas menti, c’est sacrément efficace. Dommage pour moi, ce format n’est pas supporté par mon WordPress, donc je ne peux pas encore l’intégrer à mon article.

Passons maintenant à une image animée avec FFMPEG. Je prends ce GIF de 1,1 Mo :

Avec FFMPEG, je dois d’abord convertir le format des pixels en yuv420p qui est un format de couleur très utilisé pour la vidéo et compatible AVIF :

ffmpeg -i happy.gif -pix_fmt yuv420p -f yuv4mpegpipe happy.y4m

Ensuite, il faut installer la lib avif comme ceci sous Linux :

sudo apt install libavif-bin

Comme ça sous mac :

brew install libavif

Ensuite armé de ce fichier y4m, je peux alors appeler l’outil d’encodage avifenc qui va alors le convertir en AVIF animé :

avifenc happy.y4m happy.avif

Et voilà, je me retrouve avec la même image animée sauf qu’elle pèse 45 ko. C’est magique.

Pour le format JXL c’est encore plus simple, puisqu’il y a un outil officiel à télécharger ici. Si vous êtes sous mac, vous pouvez même l’installer comme ceci :

brew install jpeg-xl

Ensuite, y’a plus qu’à appeler la commande comme ceci avec le paramètre lossless afin de n’avoir aucune perte :

cjxl wallpaper.png wallpaper.jxl --lossless_jpeg=0

Je passe donc d’un fond d’écran de 1,9 Mo en PNG au même fond d’écran de 202 Ko. Voici l’incrustation de ce JXL :

Après si vous avez la flemme de jouer avec tous ces outils sachez que ezgif dont je vous ai déjà parlé ici, propose des convertisseurs pour l’AVIF et le JXL.

D’ailleurs, si vous vous demandez comment je l’ai intégré, et bien, il existe une astuce qui permet d’avoir un rendu de JXL ou d’AVIF avec une image PNG en secours pour les anciens navigateurs qui ne supporteraient ni le AVIF ni le JXL.

Voici le code :

<picture>
      <source type="image/jxl" srcset="https://korben.info/wallpaper.jxl" />
      <img src="https://korben.info/wallpaper.png" />
</picture>

Et pour de l’AVIF ce sera comme ça :

<picture>
      <source type="image/avif" srcset="https://korben.info/wallpaper.avif" />
      <img src="https://korben.info/wallpaper.png" />
</picture>

Bref, tout ça pour dire que les résultats en matière de qualité et de compression avec JXL et AVIF sont assez phénoménaux que ce soit avec perte ou non de qualité. Je vous encourage fortement à adopter ces futurs standards même si pour le moment, c’est encore un peu roots, mais c’est déjà bien supporté sur les navigateurs récents du marché, donc pourquoi s’en priver. J’espère que WordPress le supportera également nativement rapidement, comme ils l’ont fait pour le webp.


Le changement climatique est déjà là et avec lui son lot de surprises, notamment avec un climat qui vient taper dans les extrêmes un peu plus souvent qu’avant, parce que totalement déréglé. Et comme on n’est pas spécialement scientifique, difficile de savoir à quoi ressemblera notre chez nous dans 20 ans, dans 50 ans.

Afin de nous aider à y voir un peu plus clair sur ce nouveau climat qui arrive, l’INRAE (Institut national de recherche pour l’agriculture, l’alimentation et l’environnement) a mis au point une carte nommée Climate Change Explorer qui vous permet de savoir quelles seront les températures moyennes et la pluviométrie chez vous entre 2041 et 2060.

Vous saisissez votre ville et Climate Change Explorer vous indiquera une ville jumelle dont le climat actuel est celui que vous aurez entre 2041-2060.

Donc par exemple, moi c’est Clermont-Ferrand et dans 20/30/40 ans, son climat sera comparable à la ville d’Ancona en Italie, avec des températures moyennes max de 28,5°C, min de 1,4°C et 722 mm de pluie à l’année. Les autres points jaunes sur la carte sont d’autres villes analogues. Dont pour Clermont-Ferrand, c’est également Venise, Canberra ou d’autres villes en Turquie et Afrique du Sud.

Évidemment, ce sont des projections et d’ici là, ça a encore le temps de partir encore plus en couille. Mais je trouve ça quand même bien de savoir à quelle sauce climatique on risque d’être mangé. La retraite au soleil quoi…

Par contre, je pense aux gens qui habitent dans des endroits où il fait déjà extrêmement chaud et humide. Eux n’auront d’autre choix que de partir et devenir ce qu’on appelle maintenant des réfugiés climatiques. Espérons que nous saurons les aider le moment venu.

À découvrir ici.


La dernière nouveauté dans le domaine de l’IA c’est la détection des types de fichiers. Hé ouais ! Google a récemment ouvert les sources de Magika, un système d’identification de types de fichiers basé sur l’IA, qui a pour but de nous aider (enfin, nos outils) à détecter avec précision les types de fichiers binaires et textuels.

Depuis longtemps maintenant, les systèmes Linux sont équipés de libmagic et de l’utilitaire file, qui ont servi de norme de facto pour l’identification des types de fichiers, et ce pendant plus de 50 ans !!

Les navigateurs web, les éditeurs de code et d’innombrables autres logiciels s’appuient sur la détection des types de fichiers pour décider comment afficher correctement un fichier. Par exemple, les IDE modernes utilisent la détection des types de fichiers pour choisir le schéma de coloration syntaxique à utiliser lorsque le développeur commence à taper dans un nouveau fichier.

La détection précise des types de fichiers est un problème difficile, car chaque format de fichier a une structure différente, ou pas de structure du tout. Et c’est encore plus dur pour les formats textuels et les langages de programmation, car ils ont des constructions très similaires. Jusqu’à présent, libmagic et la plupart des autres logiciels d’identification des types de fichiers s’appuyaient sur une collection plutôt artisanale (hmm hmm) d’heuristiques et de règles personnalisées pour détecter chaque format de fichier.

Cette approche manuelle étant à la fois longue et sujette aux erreurs, ce n’est pas forcément l’idéal notamment pour les applications de sécurité où la création d’une détection fiable est particulièrement difficile, car les attaquants tentent constamment de tromper la détection avec des payloads maison 🙂

Pour résoudre ce problème et fournir une détection rapide et précise des types de fichiers, Google a donc développé Magika, un nouveau détecteur de types de fichiers basé sur l’IA.

Sous le capot, Magika utilise un modèle de deep learning personnalisé et hautement optimisé conçu et formé à l’aide de Keras qui ne pèse environ que 1 Mo. Magika utilise aussi Onnx comme moteur d’inférence pour garantir que les fichiers soient identifiés en quelques millisecondes, presque aussi rapidement qu’un outil non basé sur l’IA, même sur un CPU.

En termes de performances, Magika, grâce à son modèle d’IA et son grand ensemble de données d’apprentissage, est capable de surpasser d’autres outils existants d’environ 20 % lorsqu’il est évalué sur un benchmark de 1 million de fichiers englobant plus de 100 types de fichiers. En décomposant par type de fichier, comme indiqué dans le tableau ci-dessous, on observe des gains de performance encore plus importants sur les fichiers textuels, notamment les fichiers de code et les fichiers de configuration avec lesquels d’autres outils peuvent avoir des difficultés.

Magika est utilisé en interne chez Google à grande échelle pour aider à améliorer la sécurité des utilisateurs de leurs services notamment pour l’acheminement des fichiers au sein de Gmail, Drive ou encore Safe Browsing vers des scanners de sécurité et des filtres de contenu.

En examinant une moyenne hebdomadaire de centaines de milliards de fichiers, Google a constaté que Magika améliorait la précision de l’identification des types de fichiers de 50 % par rapport à leur système précédent basé sur de simples règles. Cette augmentation de la précision leur a permis d’analyser 11 % de fichiers en plus avec leurs scanners de documents malveillants spécialisés en IA et ils ont ainsi pu réduire le nombre de fichiers non identifiés à 3 %.

La prochaine intégration de Magika se fera dans VirusTotal et viendra ainsi compléter la fonctionnalité Code Insight existante de la plateforme, qui utilise l’IA générative de Google pour analyser et détecter les codes malveillants. Magika agira alors comme un pré-filtre avant que les fichiers ne soient analysés par Code Insight, améliorant ainsi l’efficacité et la précision de la plateforme. Cette intégration, en raison de la nature collaborative de VirusTotal, contribue directement à l’écosystème cyber, et ça c’est plutôt une bonne nouvelle pour tout le monde.

En ouvrant les sources de Magika, l’objectif de Google est d’aider d’autres éditeurs de logiciels à améliorer leur précision d’identification des fichiers et d’offrir aux chercheurs une méthode fiable pour identifier les types de fichiers à très grande échelle. Le code et le modèle de Magika sont disponibles gratuitement sur Github sous la licence Apache2.

Si vous êtes intéressé, vous pouvez essayer la démo web de Magika.

Magika peut également être rapidement installé en tant qu’utilitaire autonome et bibliothèque python via le gestionnaire de paquets pypi en tapant simplement :

pip install magika

Et pas besoin de GPU !

Pour en savoir plus sur la façon de l’utiliser, je vous invite à vous rendre sur la documentation de Magika.

Merci à Letsar pour l’info !