Communication Dans Un Congrès Année : 2025

Échantillonnage Actif pour la Découverte de Règles Classification via des Comparaisons par Paires

Résumé

In this paper, we present a novel interactive data mining method for extracting classification rules. It combines interactive multi-criteria preference learning based on the Choquet integral with guided exploration of the rule space through an MCMC sampling technique. This approach efficiently identifies pairs of rules with the highest uncertainty, which are then presented to the user for comparison. We investigate the convergence properties of the associated Markov chain and show that, under certain conditions, the probability of sampling a rule increases in proportion to its score. Experiments on UCI datasets demonstrate that our method converges more rapidly to relevant rules when compared to the technique presented in (Vernerey et al., 2024).

Dans cet article, nous proposons une nouvelle méthode de fouille de données interactive, dédiée à l'extraction de règles de classification. Elle combine un apprentissage interactif des préférences multi-critères, basé sur l'intégrale de Choquet, avec une exploration guidée de l'espace des règles à l'aide d'une technique d'échantillonnage MCMC. Cette approche permet d'identifier efficacement les paires de règles présentant le plus d'incertitudes, qui sont ensuite soumises à l'utilisateur pour comparaison. Nous analysons les propriétés de convergence de la chaîne de Markov associée et démontrons, sous certaines hypothèses, que la probabilité d'échantillonnage d'une règle augmente proportionnellement à son score. Des expériences réalisées sur des jeux de données de l'UCI montrent que notre méthode converge plus rapidement vers des règles pertinentes, en comparaison avec la technique décrite dans (Vernerey et al., 2024).

Fichier principal
Vignette du fichier
final-egc-2025.pdf (400.27 Ko) Télécharger le fichier
Origine Fichiers produits par l'(les) auteur(s)
licence

Dates et versions

hal-04932747 , version 1 (06-02-2025)

Licence

Identifiants

  • HAL Id : hal-04932747 , version 1

Citer

Tudor Matei Opran, Samir Loudni. Échantillonnage Actif pour la Découverte de Règles Classification via des Comparaisons par Paires. Extraction et Gestion des Connaissances, EGC'2025, Jan 2025, Strasboug, France. pp.231-238. ⟨hal-04932747⟩
0 Consultations
0 Téléchargements

Partager

More