Comment fonctionne l'IA
Le labyrinthe est résolu par apprentissage par imitation : une recherche A* experte calcule les coups optimaux, et des réseaux de neurones apprennent à les copier. Le résultat est un ensemble de 5 réseaux qui votent (majorité) à chaque pas — vérifié sur 500/500 labyrinthes 21×21 (100 %).
Entrées → sorties
- Entrées (26) : par direction — mur, proximité du but, déjà visité, nombre de visites, coût-restant A* et un indicateur optimal — plus l'écart relatif vers la sortie.
- Sorties : le prochain coup (N/S/E/O).
Entraînement
- Imitation A* : imiter le chemin optimal sur de nombreux labyrinthes.
- DAgger : laisser le réseau conduire puis corriger ses erreurs avec l'expert.
- Curriculum : du 5×5 jusqu'au 21×21.
Ce que vous voyez
Le panneau réseau montre les vraies activations de l'ensemble, et des traces de phéromones s'illuminent sur le chemin choisi.