Proactive computing and Machine Learning applied to advanced virtual robotics

  • Christian Nazili Wanlongo

Student thesis: Master typesMaster en sciences informatiques à finalité spécialisée en data science

Résumé

Ce mémoire propose une solution pour alléger les contrôleurs d'un robot en utilisant le machine learning. Le but est de réduire la complexité du contrôleur en confiant certaines parties du code à un algorithme de machine learning. L’agent apprend de son environnement via le mécanisme de récompense et de punition. Deux algorithmes d’apprentissage par renfoncement ont été utilisé et testé : Q-learning et le Sarsa. Leur implémentation a réalisé sous le langage de programmation python. Le résultat de l’algorithme est testé dans un simulateur de robots Webots (avec comme robot Thymbio II). C’est le simulateur de robot mobile open source, Webots, qui a été privilégié pour cette recherche. Il existe plusieurs choix de langages de programmation dans le simulateur Webots (MatLab, Java, Python, C, C++, ROS). Pour ce travail, c’est le langage python qui a été utilisé comme langage de programmation.
la date de réponse31 août 2020
langue originaleFrançais
L'institution diplômante
  • Universite de Namur
SuperviseurJean-Noel Colin (Promoteur)

mots-clés

  • Apprentissage par renforcement
  • robotique
  • Webots

Contient cette citation

'