Logo LVSN
EnglishAccueil
A proposPersonnesRecherchePublicationsEvenementsProfil
A propos
Publications

 

 

 

 

CERVIM

REPARTI

MIVIM

Forage distribué des données : une comparaison entre l'agrégation d'échantillons et l'agrégation de règles


Mohamed Aounallah, Sébastien Quirion and Guy Mineau


Abstract - Pour nous attaquer au problème du forage de très grandes bases de données distribuées, nous proposons d’étudier deux approches. La première est de télécharger seulement un échantillon de chaque base de données puis d’y effectuer le forage. La deuxième approche est de miner à distance chaque base de données indépendamment, puis de télécharger les modèles résultants, sous forme de règles de classification, dans un site central où l’agrégation de ces derniers est réalisée. Dans cet article, nous présentons une vue d’ensemble des techniques d’échantillonnage les plus communes. Nous présentons ensuite cette nouvelle technique de forage distribué des données où la mécanique d’agrégation est basée sur un coefficient de confiance attribué à chaque règle et sur de très petits échantillons de chaque base de données. Le coefficient de confiance d’une règle est calculé par des moyens statistiques en utilisant le théorème limite centrale. [...]



Bibtex:

@article{Aounallah661,
    author    = { Mohamed Aounallah and Sébastien Quirion and Guy Mineau },
    title     = { Forage distribué des données : une comparaison entre l'agrégation d'échantillons et l'agrégation de règles },
    volume    = { 1 },
    number    = { E-3 },
    pages     = { 43-54 },
    year      = { 2005 },
    journal   = { Revue des Nouvelles Technologies de l'Information, Extraction et Gestion de Connaissances }
}

Dernière modification: 2006/12/19 par squirion

     
   
   

©2002-. Laboratoire de Vision et Systèmes Numériques. Tous droits réservés