mercredi 16 septembre 2009

Soutenance de thèse de Jason Forest

Bonjour,

J'ai le plaisir de vous inviter à ma soutenance de thèse intitulée :
"Caractérisation de classes par la découverte automatique de sous-classes"

qui sera présentée le mercredi 23 Septembre 2009 à 14h30 au Laboratoire
d'Informatique de Paris 6, situé au 104 avenue du Président Kennedy,
75016 Paris, salle 847, ainsi qu'au pot qui suivra.
(Plan d'accès : http://www.lip6.fr/informations/comment.php )

Cette thèse sera présentée devant le Jury composé de :
Mr Carl Frélicot, Professeur à l'université de La Rochelle (rapporteur),
Mr Mohammed Ramdani, Professeur à l'université de Mohammedia (rapporteur),
Mr Matthieu Cord, Professeur à l'université Paris 6 (examinateur),
Mr Julien Velcin, Maître de conférence à l'université Lyon 2 (examinateur),
Mme Bernadette Bouchon-Meunier, Directrice de recherche CNRS (directrice
de thèse),
Mme Maria Rifqi, Maître de conférence à l'université Paris 2 (encadrante).

Résumé :
La fouille de données a pour objectif l'extraction de connaissances à
partir de grandes bases de données. La caractérisation de données
s'inscrit de ce domaine et regroupe les méthodes qui mettent en avant
les caractéristiques et les tendances des données. Nos travaux se
placent dans le cadre de la caractérisation de données supervisées et se
focalisent sur la caractérisation de classe.
Dans les jeux de données réelles, il arrive qu'une classe regroupe en
son sein plusieurs comportements distincts. On parle alors de classe
non-homogène. Ce type de classes pose des problèmes aux méthodes de
caractérisation usuelles, comme la construction de prototypes ou de
résumés, qui ne sont pas en mesure de détecter les différentes
tendances. Pour être correctement prises en compte, les classes
non-homogènes nécessitent d'être segmentées en sous-classes pertinentes.
Nous proposons, dans notre thèse, une approche novatrice de segmentation
automatique de classes en sous-classes qui détecte et isole les
différents comportements. Nous proposons également une nouvelle
définition du calcul des scores de typicalité qui se base sur ce
découpage. Contrairement aux méthodes existantes, qui utilisent un
algorithme de clustering, notre approche s'appuie sur l'organisation des
classes dans le jeu de données et détecte automatiquement le bon nombre
de sous-classes.
Notre algorithme permet une amélioration des méthodes de construction de
prototypes flous et donne des résultats de caractérisation plus riches.
Notre approche a été testée et validée aussi bien sur des jeux de
données artificielles que sur des jeux de données réelles issus, par
exemple, du marketing pharmaceutique ou encore des bases d'images.

Cordialement,
Jason Forest.

--

Jason Forest
Laboratoire d'Informatique de Paris 6
104 avenue du Président Kennedy 75016 Paris
Bureau 616 bis
Tel : 01 44 27 87 51 Fax : 01 44 27 70 00
Jason.Forest@lip6.fr

Aucun commentaire: