pot qui suivra.
Titre de la thèse:
"Apprentissage dans les Processus de Décision Markoviens pour la Prédiction
Structurée,
Applications à l'étiquetage de séquences, la transformation d'arbres et
l'apprentissage dans les problèmes de recherche combinatoire"
La soutenance se déroulera le jeudi 15 octobre à 14h00 au LIP6, salle 549
- 5ème étage (Site Passy-Kennedy).
=========
Résumé
=========
De nombreux problèmes d'apprentissage supervisé font intervenir des
sorties complexes : séquences, arbres ou graphes. La prédiction de sorties
structurées pose d'importants défis, liés à la nature combinatoire du
problème. Récemment, la prédiction structurée incrémentale, une approche
générale et de faible complexité, a été proposée pour attaquer ces
problèmes sous l'angle de la prise de décisions séquentielles.
Dans cette thèse, je m'inscris dans cette approche et propose une nouvelle
formulation basée sur le cadre des processus de décision Markoviens
(PDMs). Cela permet d'utiliser des algorithmes d'apprentissage par
renforcement pour résoudre les problèmes de prédiction structurée et de
traiter des problèmes particulièrement complexes qu'aucun algorithme
n'était en mesure de résoudre jusqu'alors. En plus de cette contribution
majeure, je propose un nouvel algorithme d'apprentissage de politiques
basé sur l'apprentissage d'une fonction d'ordonnancement d'actions.
La validation est effectuée sur deux tâches: l'étiquetage de séquences et
la transformation d'arbres. Les résultats obtenus sur les séquences sont
compétitifs avec l'état de l'art et pour certains significativement
meilleurs. La transformation d'arbres est un des problèmes d'apprentissage
statistique les plus complexes abordés à ce jour et pour lequel il
n'existait aucun modèle applicable. Je démontre l'efficacité de
l'apprentissage par renforcement pour ce problème sur cinq jeux de
données, dont deux à très large échelle.
L'ensemble du code source développé au cours de cette thèse est testé,
documenté et publié en code-ouvert dans le Journal of Machine Learning
Research.
========
Jury
========
- Boris Chidlovskii, Centre de recherche Xerox Europe, Examinateur
- Ludovic Denoyer, Maitre de conférence à l'université Pierre et Marie
Curie (Paris 6), Encadrant de these
- Patrick Gallinari, Professeur à l'université Pierre et Marie Curie
(Paris 6), Directeur de these
- Rémi Gilleron, Professeur à l'université de Lille 3, Rapporteur
- Olivier Sigaud, Professeur à l'université Pierre et Marie Curie (Paris
6), Examinateur
- Jean-Philippe Vert, Mines ParisTech et Institut Curie, Examinateur
- Louis Wehenkel, Professeur à l'université de Liège, Rapporteur
========
Accès
========
LIP6 : 104 avenue du président Kennedy, 75016 Paris.
Plan d'accès : http://www.lip6.fr/informations/comment.php
Demander un badge visiteur à l'accueil et prévoir une pièce d'identité.
Cordialement,
Francis MAES.
Aucun commentaire:
Enregistrer un commentaire