jeudi 10 novembre 2011

Invitation à la soutenance de thèse de Myriam Ben Saad

Bonjour,

Vous êtes cordialement invité à ma soutenance de thèse intitulée :

« Qualité des archives Web : Modélisation et Optimisation »

La soutenance aura lieu le Vendredi 18 Novembre 2011 à 14h30, en salle 105
couloir 25-26 (1er étage), au Laboratoire d'Informatique de Paris 6
(LIP6), 4 Place Jussieu, 75005 Paris.

Un pot suivra dans la même salle, auquel vous êtes aussi conviés.


----------------------------------------------------------------------

Résumé de la thèse :

Aujourd'hui, le Web est devenu le moyen le plus important pour véhiculer
des informations qui peuvent avoir une grande valeur culturelle,
scientifique, économique, etc. Archiver son contenu ou du moins une partie
est devenu crucial afin de préserver certaines informations utiles pour
les générations futures de chercheurs, écrivains, historiens, etc.
Cependant, les archivistes doivent faire face à un grand défi qui consiste
à préserver la qualité des données collectées pour garantir la plus grande
fidélité du Web. C'est dans cette perspective d'améliorer la qualité des
archives que nos travaux de thèse s'inscrivent. Nous nous intéressons aux
deux mesures de qualité: la complétude temporelle et la cohérence
temporelle qui sont très pertinentes pour évaluer les archives Web. Nous
proposons une nouvelle approche d'archivage qui exploite le rendu visuel
des pages pour y détecter les changements de la même manière que les
utilisateurs les perçoivent. Nous proposons ensuite une méthode pour
évaluer l'importance des changements visuels ainsi détectés. Par la suite,
nous modélisons l'importance des changements sous forme de patterns, par
le modèle PPaC (Pattern of Pages Changes). Contrairement aux modèles déjà
existants basés sur un taux moyen de changements, PPaC permet de mieux
prédire les moments les plus opportuns durant lesquels des modifications
importantes sont censées survenir dans les pages. En se basant sur PPaC,
nous proposons différentes stratégies de crawling qui visent à améliorer
la complétude et/ou la cohérence temporelle. Nos différentes stratégies
ont été implémentées puis expérimentées aussi bien sur des pages simulées
que sur de vraies pages Web. Les résultats obtenus démontrent que le
modèle PPaC basé sur l'importance des changements est un instrument utile
pour améliorer considérablement la qualité des archives.

----------------------------------------------------------------------

Membres du jury :
Serge Abiteboul Directeur de recherche à INRIA-Saclay [Rapporteur]
Vassilis Christophides Professeur à FORTH-ICS [Rapporteur]
Elisabeth Murisasco Professeur à l'USTV [Examinateur]
Bernd Amann Professeur à l'UPMC [Examinateur]
Julien Masanès Directeur d'Internet Memory Foundation [Examinateur]
Jérôme Mainka Directeur de recherche à Antidot [Examinateur]
Stéphane Gançarski Maitre de conférences (HDR) à l'UPMC [Directeur de thèse]


Cordialement,
Myriam Ben Saad.

Aucun commentaire: