|
Publications |
|
Forage distribué des données : une comparaison entre l'agrégation d'échantillons et l'agrégation de règlesAbstract - Pour nous attaquer au problème du forage de très grandes bases de données distribuées, nous proposons d’étudier deux approches. La première est de télécharger seulement un échantillon de chaque base de données puis d’y effectuer le forage. La deuxième approche est de miner à distance chaque base de données indépendamment, puis de télécharger les modèles résultants, sous forme de règles de classification, dans un site central où l’agrégation de ces derniers est réalisée. Dans cet article, nous présentons une vue d’ensemble des techniques d’échantillonnage les plus communes. Nous présentons ensuite cette nouvelle technique de forage distribué des données où la mécanique d’agrégation est basée sur un coefficient de confiance attribué à chaque règle et sur de très petits échantillons de chaque base de données. Le coefficient de confiance d’une règle est calculé par des moyens statistiques en utilisant le théorème limite centrale. [...] Bibtex:
@article{Aounallah661, Dernière modification: 2006/12/19 par squirion |
|||
©2002-. Laboratoire de Vision et Systèmes Numériques. Tous droits réservés |