|
|
|
Forage de trajectoires dans des banques de données administratives en santé |
Doctorat |
Ahmed Najjar |
Christian Gagné (Directeur) Daniel Reinharz (Codirecteur) |
|
Problème: Dans une société qui produit et consomme une quantité croissante d’information, des méthodes permettant de donner un sens à toutes ces informations deviennent indispensables. L’apprentissage automatique essaie de répondre à ce besoin par des modèles qui expliquent certains aspects d’un ensemble de données. La discipline de l’apprentissage automatique peut donc déjà revendiquer des succès dans un grand nombre de domaines d’application. Des logiciels de fouille de données sont utilisés à grande échelle dans plusieurs domaines tels que la médecine et l’éducation.
Le clustering (ou regroupement) est un sujet de recherche en apprentissage émanant d’une problématique plus générale, à savoir l’apprentissage à partir de données. On distingue l’apprentissage supervisé et l’apprentissage non supervisé. Dans le premier cas, il s’agit d’apprendre à classer un nouvel individu au sens statistique parmi un ensemble de classes prédéfinies, à partir de données d’entraînement. Issue des statistiques, et plus précisément de l’analyse de données, la classification non-supervisée, comme son nom l’indique, consiste à apprendre sans superviseur. A partir d’une population, il s’agit d’extraire des classes ou groupes d’individus présentant des caractéristiques communes, le nombre et la définition des classes n’étant pas disponibles a priori. Le développement d’outils informatiques puissants a permis d’envisager de nouvelles pistes de recherche dans le domaine de la classification non supervisée.
|
Motivation: Depuis les années 1990, on peut considérer que le clustering constitue un domaine d’étude incontournable en apprentissage touchant plusieurs domaines d’application. L’adaptation de ces méthodes pour le domaine de santé prend de plus en plus d’ampleur et plusieurs projets sont lancés pour l’extraction de données à partir des bases de données médicales.
L’utilisation des bases de données pour le stockage de l’historique médicales des patients a mis en disposition une grande quantité de données médicales. L’exploitation de l’information contenue dans les bases de données devient de plus en plus un champ de recherche intéressant pour l’application des méthodes de clustering. Les bases de données administratives de Québec présentent une mine de données pour extraire des connaissances utiles par des méthodes de clustering. L’avantage d’un tel projet réside dans deux aspects. Le premier est la pertinence de la connaissance extraite pour améliorer les pratiques des médecins et leurs connaissances du contenu de ces bases de données. Le deuxième aspect est la participation scientifique à la conception et l’implémentation d’un cadre informatique qui peut donner les moyens pour l’exploitation des banques de données médicales. |
Approche: De ce fait, notre projet cherche dans sa phase principale à concevoir et adapter des méthodes de clustering permettant d’atteindre cet objectif de recherche. |
|
|
|
|
|
|
Dernière modification: 2012/01/27 par ahnaj2 |
|
|