Ce mémoire propose une solution pour alléger les contrôleurs d'un robot en utilisant le machine learning. Le but est de réduire la complexité du contrôleur en confiant certaines parties du code à un algorithme de machine learning. L’agent apprend de son environnement via le mécanisme de récompense et de punition. Deux algorithmes d’apprentissage par renfoncement ont été utilisé et testé : Q-learning et le Sarsa. Leur implémentation a réalisé sous le langage de programmation python. Le résultat de l’algorithme est testé dans un simulateur de robots Webots (avec comme robot Thymbio II). C’est le simulateur de robot mobile open source, Webots, qui a été privilégié pour cette recherche. Il existe plusieurs choix de langages de programmation dans le simulateur Webots (MatLab, Java, Python, C, C++, ROS). Pour ce travail, c’est le langage python qui a été utilisé comme langage de programmation.
la date de réponse | 31 août 2020 |
---|
langue originale | Français |
---|
L'institution diplômante | |
---|
Superviseur | Jean-Noel Colin (Promoteur) |
---|
- Apprentissage par renforcement
- robotique
- Webots
Proactive computing and Machine Learning applied to advanced virtual robotics
Nazili Wanlongo, C. (Auteur). 31 août 2020
Student thesis: Master types › Master en sciences informatiques à finalité spécialisée en data science