Échantillonnage Actif pour la Découverte de Règles Classification via des Comparaisons par Paires
Résumé
Dans cet article, nous proposons une nouvelle méthode de fouille de données interactive, dédiée à l'extraction de règles de classification. Elle combine un apprentissage interactif des préférences multi-critères, basé sur l'intégrale de Choquet, avec une exploration guidée de l'espace des règles à l'aide d'une technique d'échantillonnage MCMC. Cette approche permet d'identifier efficacement les paires de règles présentant le plus d'incertitudes, qui sont ensuite soumises à l'utilisateur pour comparaison. Nous analysons les propriétés de convergence de la chaîne de Markov associée et démontrons, sous certaines hypothèses, que la probabilité d'échantillonnage d'une règle augmente proportionnellement à son score. Des expériences réalisées sur des jeux de données de l'UCI montrent que notre méthode converge plus rapidement vers des règles pertinentes, en comparaison avec la technique décrite dans (Vernerey et al., 2024).
Origine | Fichiers produits par l'(les) auteur(s) |
---|---|
licence |