Nvidia est depuis longtemps dans le domaine de l’intelligence artificielle et cela leur permet de sortir un logiciel absolument incroyable. Voici comment faire votre propre IA nourrie par les données que vous souhaitez.
La fusion entre RTX et IA
Nvidia, le géant des cartes graphiques et en passe de devenir plus gros que Google, s'aventure sur un terrain de jeu bien connu de l'entreprise avec la sortie de Chat with RTX. Il s’agit d’une application démo pour PC proposant une IA conversationnelle innovante. À première vue, l'objectif semble surprenant : résumer des vidéos YouTube et faciliter la recherche d'informations dans vos propres documents. Pas sûre que ce soit vraiment ce dont les gamers rêvaient… Et pourtant !
L'application, encore en version alpha, repose sur deux technologies : les bibliothèques d'apprentissage automatique Mistral ou Llama 2 et la puissance des cœurs Tensor des cartes graphiques RTX 30 et 40. Le résultat ? Une IA conversationnelle capable de traiter vos données sans jamais les envoyer vers le cloud. C’est un peu comme avoir une IA que l’on entraîne soit même.
En pratique, Chat with RTX se révèle prometteur pour des tâches bien spécifiques. La possibilité de résumer automatiquement des vidéos YouTube est particulièrement intéressante pour digérer rapidement des podcasts ou des conférences. Son utilité est ainsi vraiment bluffante pour les journalistes, les étudiants ou toute personne souhaitant analyser une grosse quantité de documents.
Sauf que ça ne s'arrête pas là, car l'outil permet également de faire une “demande précise”. Il suffit de lui indiquer l'URL d'une vidéo YouTube pour qu'il en explore la transcription à la recherche de mots-clés précis. Il peut également indexer vos PDF, documents Word, etc.
Un test convaincant
Les journalistes de The Verge ont ainsi eu l’occasion de tester l’intelligence artificielle d’Nvidia et le moins que l’on puisse dire c’est qu’il y a quelques aspects à peaufiner. Du coup, Chat with RTX reste une démo et souffre encore de quelques défauts. L'installation semble laborieuse (30 minutes sur une configuration haut de gamme) et l'application est gourmande en ressources consommant près de 40 Go d'espace disque et 3 Go de RAM.
Surtout, la précision et la fiabilité ne sont pas encore au rendez-vous. La recherche dans les vidéos YouTube peut parfois dérailler et l'attribution des sources n'est pas toujours exacte. De plus, l'absence de prise en compte du contexte rend impossibles les questions liées à une conversation précédente. L’IA n’apprend et ne sait que ce que vous venez de lui donner et n’a pas d’apprentissage à long terme.
Reste à savoir si NVIDIA choisira de poursuivre le développement de Chat with RTX et d'en faire une véritable application grand public. En attendant, la démo demeure un laboratoire d'idées, nous offrant un aperçu de ce que l'avenir de l'IA locale pourrait nous réserver.