Séminaire LIASD : Vers de nouveaux défis pour la fouille de données massives


Séminaire LIASD et Masters Conduite de Projets Informatiques et Informatique et Sciences Humaines


organisé par le LIASD
 
 
 
Intervention de Mustapha LEBBAH, LIPN, Université Paris 13
 

Titre : Vers de nouveaux défis pour la fouille de données massives


 
L’exposé est consacré à la fouille et à l’analyse de données massives provenant de différents systèmes d’information et pour lesquelles la représentation des variables a des limites.
 
Il existe actuellement un nombre conséquent de méthodes de clustering mais elles ne s’adaptent pas toujours aux particularités de certains types de données :
  • catégorielles
  • binaires
  • mixtes
  • séquences
  • flux
  • graphes
  • processus métiers

 
On distingue 2 grandes familles de modèles de classification non supervisée : les modèles probabilistes et les modèles "déterministes". L’exposé abordera aussi des travaux sur le clustering en utilisant le paradigme MapReduce/Spark. En plus des difficultés soulevées par ces nouveaux paradigmes, le développement des approches actuelles nécessite de relever différents défis, en particulier :
  • le traitement incrémental des flux de données
  • la robustesse sur les données aberrantes
  • la visualisation

 
 
 

Informations pratiques


Contact : sign@ai.univ-paris8.fr
 
 

En savoir plus


Jeudi 19 février 2015
à 13h30
Salle A 148

Abonnez-vous à la newsletter de l'université Paris 8