Apprentissage d'une politique de gestion de ressources en temps réel : application au combat maritime

Authors: Cinq-Mars, Patrick
Advisor: Chaib-draa, Brahim
Abstract: Dans le secteur de la défense, la majorité des processus de combat soulèvent des problèmes complexes, comme l'allocation de ressources. Le projet NEREUS cherche des méthodologies de planification et d'exécution de stratégies pour le centre de commandement et de contrôle (C2) d'une frégate canadienne. L'approche par apprentissage proposée dans ee mémoire permet de constater que de nouvelles stratégies découvertes par expérimentation peuvent se comparer à des doctrines préalablement conçues. Les processus de decision de Markov ont été utilisés pour construire un cadre de développement et modéliser des agents capables d'agir dans des environnements en temps réel. Un agent basé sur l'apprentissage par renforcement a donc été évalué dans un environnement de simulation de combat maritime et un formalisme issu du Weapon-Target Assignment a été utilisé pour définir le problème en temps réel.
Document Type: Mémoire de maîtrise
Issue Date: 2010
Open Access Date: 17 April 2018
Permalink: http://hdl.handle.net/20.500.11794/21723
Grantor: Université Laval
Collection:Thèses et mémoires

Files in this item:
SizeFormat 
26648.pdf20.23 MBAdobe PDFView/Open
All documents in CorpusUL are protected by Copyright Act of Canada.