UE INF 2342 - Indexation et recherche d'informations multimédia
Objectifs
Ce cours aborde les problématiques liées à la prise en compte des données atypiques (données textuelles, multimédia, semi-structurées, multidimensionnelles) dans les bases de données, qui s'éloignent du modèle traditionnel classiquement supporté par les SGBD - requêtes précises sur des données exactes - pour aller vers des besoins d'exploitation plus imprécis et approchés, portant sur des données à structure complexe ou inconnue. Les problématiques concernent la description, la gestion, l'exploitation (recherche, comparaison, navigation), le stockage et la restitution d'information, avec la prise en compte de grands volumes de données hétérogènes.
Contenu
- Structures d'indexation des données
- Modèles de recherche d'information : modèle booléen - Modèle vectoriel - Modèle probabiliste - Modèle flou
- Interaction et recherche d'information : ' la boucle de retour de pertinence '
- Traitements spécifiques en fonction du média : non structuré (texte libre) - Semi-structuré (texte formaté : ex. XML) - Images - Séries temporelles - Vidéo
- Filtrage de l'information (classification)
- Extraction d'information (recherche et extraction d'éléments structurés) : reconnaissance des entités nommées - Méthodes basées sur les automate d'états finis - Extraction ontologies - Web wrappers et agents
- Recherche d'information dans les " hyper documents " (WEB)
Programmation
Cours : 22 h - TP : 22 h
Prérequis
Bibliographie
- Ricardo Baeza-Yates, Berthier Ribeiro-Neto(). Modern Information Retrieval, Adison Wesley ed.
- Intelligent Multimedia Information Retrieval, Edited by Mark T. Maybury, AAAI Press / MIT Press
- P. Schauble , Multimedia Information Retrieval, Kluwer Academic, Boston, Mass, USA, 1997
- U. M. Fayyad, G. Piatetsky-Shapiro, P. Smyth, R. Uthurusamy (eds) (1996) Advances in Knowledge Discovery and Data Mining. Menlo Park, Cal. AAAI Press / The MIT Press.
Intervenants