L’intelligence artificielle a appris à garer les voitures dans les parkings dans des simulations physiques 3D. La simulation utilise le cadre ML-Agents d’Unity (l’IA est composée d’un réseau de neurones profond, chaque réseau de neurones a 3 couches cachées et chaque neurone contient 128 neurones) pour la simulation, et utilise une méthode d’apprentissage par renforcement. L’algorithme d’optimisation (PPO) est formé. L’entrée du réseau neuronal est la lecture de huit capteurs de profondeur, la vitesse et la position actuelles de la voiture et sa position relative par rapport à la cible, et la sortie du réseau neuronal est interprétée comme la force du moteur, la force de freinage et la force de direction. La sortie peut être vue dans le coin supérieur droit de l’objectif de la caméra avec un zoom arrière. L’IA commence par un comportement aléatoire, qui utilise des poids aléatoires pour initialiser un réseau de neurones, puis apprend progressivement à résoudre des tâches en réagissant aux commentaires environnementaux. L’environnement indique à l’IA si elle est bonne ou mauvaise grâce à des signaux de récompense positifs ou négatifs. Dans ce projet, l’IA recevra un petit signal positif à l’approche de p. La place de parking est encadrée en rouge. Lorsqu’elle arrive réellement à la place de parking et s’arrête à la place de parking, une récompense plus importante peut être obtenue. La récompense finale pour atteindre une place de stationnement dépend de la façon dont la voiture s’arrête parallèlement par rapport à la position de stationnement réelle. Par exemple, si la voiture s’arrête à un angle de 90 ° par rapport à la direction de stationnement réelle, l’IA ne recevra qu’une très petite récompense par rapport au montant obtenu en stationnant complètement parallèlement à la direction réelle. Lorsque l’IA s’éloigne du parking ou rencontre un obstacle, elle sera punie par un signal de récompense négatif. Le processus de formation présenté dans cette vidéo a duré environ 23 heures sur un ordinateur équipé d’i5 (7e ou 8e génération) et d’un ordinateur avec une vitesse de simulation de 100 fois la GTX 1070. Abonnez-vous à des contenus plus similaires: Suivez-moi sur Twitter pour obtenir des mises à jour plus fréquentes sur mon projet: Consultez également d’autres vidéos liées au projet: Deux IA se disputent le même espace de stationnement: Expliquez en une minute Réseau neuronal: Les voitures apprennent à manipuler la génétique algorithmes pour donner des conférences: Musique de départ: “Sunday” par Otis McDonald, Musique de Bensound.com: Musique time-lapse: “Elevator Bossa Nova” Comédie Contexte: “Jazz comédie” Outro: “Tous” Réseau #Neural.