Kotaemon - l'assistant RAG open source qui booste votre productivité

par Korben -

Salut la compagnie ! Aujourd’hui on va parler d’un petit outil open source qui va vous faire gagner un temps fou quand il s’agit de discuter avec vos documents.

Son petit nom ? Kotaemon. Non, ce n’est pas un nouveau Pokémon, mais plutôt votre futur meilleur pote quand il s’agit de faire du RAG (Retrieval-Augmented Generation pour les intimes).

Alors le RAG, c’est quoi ? Imaginez un assistant virtuel capable de fouiller dans une montagne de docs pour vous sortir l’info dont vous avez besoin, le tout en discutant avec vous comme si de rien n’était au travers d’une interface toute propre. Idéal pour chatter avec vos documents, que vous soyez un simple utilisateur qui veut poser des questions à ses fichiers, ou un développeur qui veut mettre les mains dans le cambouis pour créer son propre pipeline RAG aux petits oignons.

Commençons par le commencement : l’installation. Rien de plus simple, il suffit de lancer cette commande dans votre terminal :

docker run -e GRADIO_SERVER_NAME=0.0.0.0 -e GRADIO_SERVER_PORT=7860 -p 7860:7860 -it --rm taprosoft/kotaemon:v1.0

Et hop, rendez-vous sur http://localhost:7860/ pour accéder à l’interface web. Le compte par défaut c’est admin/admin, mais vous pourrez créer d’autres utilisateurs directement depuis l’interface.

Maintenant, parlons un peu des fonctionnalités qui déchirent :

1. Multi-utilisateurs : Kotaemon supporte la connexion de plusieurs utilisateurs. Pratique pour bosser en équipe ou partager vos collections de documents préférées avec vos collègues.

2. Modèles LLM variés : Que vous soyez team OpenAI, Azure, ou que vous préfériez les modèles open source comme Llama, Kotaemon s’adapte à vos envies. Il supporte même les modèles locaux via Ollama ou llama-cpp-python.

3. Pipeline RAG hybride : Kotaemon utilise un mix de recherche full-text et vectorielle pour trouver les infos les plus pertinentes dans vos docs.

4. Support multi-modal : Textes, images, tableaux… Kotaemon gère tout ça comme un chef. C’est parfait pour vos rapports bourrés de graphiques incompréhensibles.

5. Citations avancées : Fini les réponses sorties de nulle part. Kotaemon vous dit exactement d’où viennent ses infos, avec un petit coup de surligneur dans le document original. Pratique pour vérifier que votre assistant n’est pas en train de vous raconter des conneries.

6. Raisonnement complexe : Pour les questions tordues qui nécessitent de combiner plusieurs infos, Kotaemon peut décomposer le problème en sous-questions. Merci Sherlock !

7. Interface configurable : Vous pouvez tweaker pas mal de paramètres directement depuis l’interface, sans avoir à plonger dans le code. Bref, l’idéal pour les allergiques au terminal.

8. Extensibilité : Pour les devs qui aiment bidouiller, Kotaemon est basé sur Gradio. Ça veut dire que vous pouvez ajouter vos propres éléments d’interface ou customiser le pipeline de traitement comme bon vous semble.

Maintenant, si vous voulez vraiment pousser le bouchon, voici quelques astuces pour tirer le meilleur de Kotaemon :

1. Optimisez vos documents : Plus vos docs sont bien structurés, plus Kotaemon sera efficace. Pensez à utiliser des titres clairs, des listes à puces, et à formater proprement vos tableaux.

2. Jouez avec les paramètres : N’hésitez pas à bidouiller les réglages de récupération et de génération. Parfois, un petit ajustement peut faire toute la différence dans la qualité des réponses.

3. Combinez les modèles : Essayez différentes combinaisons de modèles d’embedding et de LLM pour trouver le duo parfait pour vos besoins.

4. Utilisez les agents : Pour les tâches complexes, les agents comme ReAct ou ReWOO peuvent vraiment faire la différence.

5. Personnalisez les prompts : Les prompts par défaut sont bien, mais en les adaptant à votre domaine spécifique, vous pouvez obtenir des réponses encore plus pertinentes.

Et pour les devs qui voudraient pousser encore plus loin, sachez que vous pouvez facilement ajouter vos propres pipelines de raisonnement ou d’indexation. Le projet fournit même un exemple de pipeline GraphRAG pour vous donner des idées.

Bon, je vous entends déjà : “Mais Korben, c’est pas un peu overkill tout ça pour juste poser des questions à mes docs ?”. Eh bien, figurez-vous que non ! Imaginez un peu : vous êtes en train de bosser sur un projet énorme, avec des centaines de pages de specs, de rapports, et de notes diverses. Au lieu de passer des heures à tout éplucher pour trouver une info précise, vous balancez une question à Kotaemon et boom, vous avez votre réponse en quelques secondes, avec les sources exactes. Ça, mes amis, ça s’appelle gagner en productivité !

Et le plus beau dans tout ça, c’est que c’est open source.

Allez jeter un œil au repo GitHub du projet et commencez à jouer avec.