lundi 1 février 2010

Soutenance de thèse Antoine Bordes

Bonjour,

J'ai le plaisir de vous convier à la soutenance de ma thèse intitulée:

New Algorithms for Large-Scale Support Vector Machines

Nouveaux Algorithmes pour l'Apprentissage de Machines à Vecteurs Supports sur de Grandes Masses de Données

 

La soutenance aura lieu le mardi 9 février à 14h00 dans la salle 549 du Laboratoire d'Informatique de Paris 6. Vous êtes aussi cordialement invités au pot de thèse qui suivra (même endroit, presque même heure).

 

Résumé:

Il existe un besoin certain dans la communauté de l'apprentissage statistique pour des méthodes capables d'être entraînées sur des ensembles d'apprentissage de grande échelle, et pouvant ainsi gérer les quantités colossales d'informations générées quotidiennement. Dans cette thèse, nous proposons des solutions pour réduire le temps d'entraînement et les besoins en mémoire d'algorithmes d'apprentissage sans pour autant dégrader leur précision. Nous nous intéressons en particulier aux Machines à Vecteurs Supports (SVMs), des méthodes populaires utilisées en général pour des tâches de classification automatique mais qui peuvent être adaptées à d'autres applications. Nous étudions tout d'abord le processus d'apprentissage par descente de gradient stochastique pour les SVMs linéaires. Cela nous amène à définir et étudier le nouvel algorithme, SGD-QN. Après cela, nous introduisons une nouvelle procédure d'apprentissage: le principe du "Process/Reprocess". Nous déclinons alors trois algorithmes qui l'utilisent. Le Huller et LaSVM servent à apprendre des SVMs destinés à traiter des problèmes de classification binaire (décision entre deux classes). Pour la tâche plus complexe de prédiction de sorties structurées, nous modifions en profondeur l'algorithme LaSVM, ce qui conduit à l'algorithme LaRank. Notre dernière contribution concerne le problème récent de l'apprentissage avec une supervision ambiguë pour lequel nous proposons un nouveau cadre théorique (et un algorithme associé). Nous l'appliquons au problème de l'étiquetage sémantique du langage. Tous les algorithmes introduits dans cette thèse atteignent les performances de l'état-de l'art, en particulier en ce qui concerne les vitesses d'entraînement.

 

Jury:

- Jacques Blanc-Talon (Examinateur): Responsable scientifique à la DGA/MRIS.
- Léon Bottou (Examinateur): Distinguished senior researcher à NEC Labs of America.
- Stéphane Canu (Rapporteur): Professeur et directeur du LITIS à l'INSA de Rouen.
- Matthieu Cord (Examinateur): Professeur au LIP6.
- Patrick Gallinari (Directeur de thèse): Professeur et directeur du LIP6.
- Bernhard Schölkopf (Examinateur): Professeur et directeur du MPI for Biological Cybernetics.
- John Shawe-Taylor (Rapporteur): Professeur et directeur du CSML à l'University College London.

 

Accès:

LIP6 : 104 avenue du président Kennedy, 75016 Paris.
Plan d'accès : http://www.lip6.fr/informations/comment.php
Demander un badge visiteur à l'accueil et prévoir une pièce d'identité.

 

Cordialement,

 

Antoine Bordes

Aucun commentaire: