IA Jeu de NIM
Le Concept
Une Intelligence Artificielle conçue pour apprendre les règles et les stratégies gagnantes du Jeu de NIM (version 8 bâtons) grâce à l'apprentissage par renforcement. L'IA commence sans aucune connaissance et s'améliore en s'affrontant elle-même.
Développé en Python, le projet simule des milliers de parties. À chaque fin de tour, les décisions menant à une victoire sont récompensées (augmentation du poids de l'action), tandis que les erreurs sont punies (diminution du poids), permettant à l'IA de "résoudre" mathématiquement le jeu.
Le système repose sur un moteur d'apprentissage pondéré où chaque état du plateau (nombre de bâtons restants) possède ses propres probabilités de décision, évoluant dynamiquement au fil des simulations.
Challenge Technique
Le défi majeur a été de mettre en place une logique de pondération robuste pour éviter que les probabilités ne tombent à zéro (sécurité des poids minimaux) et d'assurer que l'IA puisse explorer toutes les combinaisons possibles avant de converger vers la stratégie optimale de retrait des bâtons.