NVIDIA NIM - Utilisez de l'IA dans vos projets sans GPU (local)

par Korben -

Aujourd’hui, j’ai le plaisir de vous présenter une avancée technologique qui pourrait bien changer votre quotidien de développeur, surtout si comme moi, vous êtes passionné d’IA. Bah oui, parce que vous pensez peut-être qu’il est indispensable de posséder une machine puissante équipée d’un GPU haut de gamme pour se lancer dans le développement d’application IA. Mais détrompez-vous, car NVIDIA a mis au point une solution baptisée NVIDIA NIM, qui permet de dépasser ces contraintes matérielles.

Avec NVIDIA NIM, vous allez pouvoir développer tout ce qui vous passe par la tête et déployer les derniers modèle IA sans avoir à investir dans du matos couteux et sans vous soucier de la puissance de votre ordinateur. Vous n’avez plus de limite mis à part celle de votre imagination !

En effet, NVIDIA NIM (NVIDIA Inference Microservices) utilise des microservices d’inférence d’IA générative pour simplifier le déploiement de modèles d’IA à grande échelle. En d’autres termes, elle vous donne accès à des modèles d’IA pré-entraînés et optimisés, hébergés sur des serveurs distants puissants. Vous pouvez ainsi vous concentrer sur l’essentiel à savoir, créer des applications innovantes.

NVIDIA NIM ne se contente pas de supprimer les barrières matérielles. La plateforme offre une gamme de fonctionnalités avancées pour répondre aux besoins des développeurs dans divers domaines :

  • Extraction multimodèle de PDF : Traitez des documents complexes en permettant à vos systèmes d’IA d’interpréter et d’extraire efficacement des informations à partir de différents types de PDFs.
  • Interaction avec des humains numériques : Créez des avatars d’IA ultra-réalistes pour révolutionner le service client, l’éducation ou le divertissement. Cette fonctionnalité ouvre de nouvelles possibilités en matière d’interaction homme-machine.
  • Applications pharmaceutiques : Dans le secteur pharmaceutique, NVIDIA NIM facilite le développement de petites molécules, démontrant ainsi la polyvalence de la plateforme dans des industries spécialisées.

L’un des atouts majeurs de NVIDIA NIM est son vaste catalogue de modèles d’IA. Ces modèles peuvent être facilement intégrés dans vos applications via une API Python conviviale. Vous pouvez ainsi :

  • Tester les réponses de l’API : Observez comment les modèles réagissent à vos requêtes et affinez-les en conséquence.
  • Exécuter les modèles localement (si le matériel le permet) : Si vous disposez d’un matériel compatible, vous pouvez exécuter certains modèles sur votre propre machine.
  • Intégrer les capacités d’IA dans vos applications : Enrichissez vos projets avec des fonctionnalités avancées sans complexité supplémentaire.

Rendez-vous sur le site officiel de NVIDIA AI et inscrivez-vous au programme développeur de NVIDIA. L’inscription est gratuite et vous donne accès à de nombreuses ressources, y compris l’accès à NVIDIA NIM.

Voici un exemple d’implémentation :

from openai import OpenAI

text = """
coucou j'avais mi un texte un peu long ici avant.
"""

client = OpenAI(
base_url = "https://integrate.api.nvidia.com/v1",
api_key = ""
)

completion = client.chat.completions.create(
model="nvidia/nemotron-4-340b-instruct",
messages=[{"role":"user","content":"Résume moi le texte ci-dessous en français en 3 lignes : " + text}],
temperature=0.2,
top_p=0.7,
max_tokens=1024,
stream=False
)

print(completion.choices[0].message.content)

Et je vous ai même fait un tuto en vidéo. Vous pouvez d’ailleurs remercier les Patreons, car c’est grâce à eux !


Voilà, vous pouvez maintenant intégrer les modèles IA proposé par Nvidia dans vos projets sans vous soucier de l’infrastructure sous-jacente.

Notez que NVIDIA NIM offre aux développeurs des crédits API et si vous souhaitez exécuter les modèles localement, comme la configuration de Docker est supportée, c’est facilement transposable et ça garantit la cohérence entre les différents environnements de développement.

La personnalisation est également un aspect clé de NVIDIA NIM. Les développeurs ont la possibilité d’ajuster et de peaufiner les modèles existants pour répondre à des besoins spécifiques. Par exemple, vous pouvez :

  • Créer des chatbots IA adaptés à votre secteur : En fine-tunant les modèles, vous pouvez les spécialiser pour votre domaine d’activité.
  • Développer des applications spécialisées : Adaptez les modèles préexistants à de nouvelles tâches ou domaines.

Pour cela, des outils tels que LoRA (Low-Rank Adaptation) peuvent être utilisés pour ajuster les modèles de manière efficace.

A vous de jouer maintenant !

Source