Mise à jour: l’IA a pu dépasser le record du monde dans ma nouvelle vidéo: les robots IA ont appris à jouer au QWOP comme des humains et ont obtenu les 10 meilleures vitesses (1m 8s). Utilisez l’apprentissage par renforcement et l’apprentissage par imitation pour la formation. Écrit par: Github repo: Articles mentionnés: -Commentaire d’acteur à haute efficacité avec rejeu d’expérience -Apprentissage en profondeur du canal Kurodo par exemple démonstration: classement QWOP speedrun: