CONNEXION
  • RetourJeux
    • Tests
    • Soluces
    • Previews
    • Sorties
    • Hit Parade
    • Les + attendus
    • Tous les Jeux
  • RetourActu
    • French Days
    • Culture Geek
    • Astuces
    • Réalité Virtuelle
    • Rétrogaming
    • Toutes les actus
  • French Days
  • RetourHigh-Tech
    • French Days
    • Actus JVTECH
    • Bons plans
    • Tutoriels
    • Tests produits High-Tech
    • Guides d'achat High-Tech
    • JVTECH
  • RetourVidéos
    • A la une
    • Gaming Live
    • Vidéos Tests
    • Vidéos Previews
    • Gameplay
    • Trailers
    • Chroniques
    • Replay Web TV
    • Toutes les vidéos
  • RetourForums
    • Hardware PC
    • PS5
    • Switch
    • Xbox Series
    • Overwatch 2
    • FUT 23
    • League of Legends
    • Genshin Impact
    • Tous les Forums
  • Smartphone et Tablette
  • Mobilité urbaine
  • Hardware
  • Image et son
  • WEB 3.0
  • Bons Plans
En ce moment Genshin Impact Valhalla Breath of the wild Animal Crossing GTA 5 Red dead 2
Créer un contenu
News JVTech L'intelligence artificielle est censée résoudre les problèmes de l'humanité : Pokémon rouge échoue et ne trouve pas l'arène après 50 000 heures
Profil de nicoln,  Jeuxvideo.com
nicoln - Journaliste jeuxvideo.com

Un Youtubeur a utilisé une intelligence artificielle pour jouer à Pokémon rouge et c’est bien plus compliqué que prévu pour l’IA. Le modèle a beau être poussé, il s’est retrouvé bloqué dans des situations inattendues.

93 515 vues

L’IA cherche absolument des récompenses

L'intelligence artificielle, censée résoudre les problèmes de l'humanité, se heurte à un défi inattendu : Pokémon Rouge. Le YouTubeur Peter Whidden a entrepris une aventure fascinante en apprenant à une IA à jouer à Pokémon à l'aide d'un émulateur.

Le concept est simple en apparence : l'IA doit jouer au jeu aussi naturellement qu'un être humain. Pour cela, Peter Whidden a conçu un système de récompenses pour guider l'IA dans la bonne direction. Sauf que l'IA est loin d'être parfaite. Elle peut ressentir ce que l'on pourrait appeler de la "peur" en entrant dans les centres Pokémon, un véritable traumatisme lorsqu'elle a rangé des Pokémon et qu’elle s’est vu retirer des points car le niveau de son équipe avait diminué.

Pour augmenter la vitesse d'apprentissage, Whidden a effectué 40 sessions de tests en parallèle. À chaque découverte de quelque chose de nouveau, mesurée en pixels sur l'écran, l'IA reçoit des points de récompense. Mais comme on peut s’y attendre, cette démarche l'a conduit à s'attarder sur l'animation de l'eau au lieu de progresser vers la prochaine ville. Une IA contemplative devant la beauté des pixels

D'autres récompenses ont été introduites, telles que la capture de Pokémon, le niveau global de l'équipe, la victoire dans un combat d'entraîneur ou la conquête d'une arène. Malgré ces incitations, des problèmes persistaient.

Une IA traumatisée

L'IA a vécu des moments curieux lors de sa visite au Pokémon Center. En interagissant avec l'ordinateur et en stockant certains Pokémon, son niveau d'équipe a diminué, ce qui a créé une sorte de traumatisme. Cela l'a poussée à éviter activement ces centres. Whidden a donc dû ajuster le système et introduire une nouvelle récompense pour surmonter cette aversion.

Les combats ont également réservé leur lot de surprises. L'IA a participé à chaque combat, qu'elle puisse gagner ou non. Cependant, après la première défaite, elle a refusé d'appuyer sur le bouton A après la mort du dernier Pokémon, cherchant à rester éternellement dans l'écran de combat pour ne pas perdre de points.

Le combat contre Pierre dans la première arène était tout sauf logique. Pendant longtemps, l'IA n'a pas compris que les attaques d'eau étaient la faiblesse des Pokémon de type roche. Après des milliers d'heures de jeu, une victoire facile a finalement été obtenue.

Malgré les défis, l'IA s'est montrée particulièrement friande de Pokémon Magicarpe, en en obtenant plus de 10 000 auprès d'un revendeur qui les vendait pour 500 Pokédollars. Cette démarche était sans doute l’option la plus simple et la plus rapide pour étendre son nombre de Pokémon, car l'IA était programmée pour enrichir son équipe en attrapant de nouveaux Pokémons.

Pour mettre en œuvre son algorithme d'apprentissage, Whidden a utilisé Proximal Policy Optimization, une norme également employée pour ChatGPT. Cependant, la partie la plus délicate de ce processus consiste à guider la machine sans lui expliquer chaque étape individuellement, car l'IA est censée apprendre de manière autonome. Contrairement aux IA textuelles ou vocales, Pokémon Rouge ne disposait pas de base de données volumineuse, ce qui rendait cette aventure encore plus impressionnante.

Bien que l'intelligence artificielle ait échoué dans sa quête de la deuxième arène après 50 000 heures de souffrance, elle a tout de même accompli des prouesses étonnantes. Cette expérience témoigne du potentiel et des limites de l'IA à apprendre et à évoluer.

Intelligence Artificielle et Robot
Commentaires
Vous devez être connecté pour poster un commentaire.
SonGoku2021 SonGoku2021
MP
Niveau 5
le 28 oct. 2023 à 11:28

Ce n'est pas l'IA le problème mais le programmeur. Il a choisi des schémas de récompenses qui ne collent pas au jeu.

Lire la suite...
Les jeux attendus
1
Grand Theft Auto VI
2025
2
Senua's Saga : Hellblade II
21 mai 2024
3
Solo Leveling : Arise
05 mai 2024
4
Kingdom Come Deliverance 2
2024
5
Age of Mythology : Retold
2024
La vidéo du moment