Le Monde des Utilisateurs de L'Analyse de Données

Numéro 42

 
 

L’incohérence de l’aire sous la courbe ROC, que faire à ce propos?.David Hand.  La revue MODULAD, numéro 42, 2010.

Résumé
Différents critères sont largement utilisés pour évaluer la performance de règles de classement. L’un d’eux est l’aire sous la courbe ROC (AUC : the area under the curve). Cette mesure a l’agréable propriété de synthétiser la performance pour tous les seuils de classement possibles. Malheureusement, au cœur de l’AUC se trouve une distribution qui dépend de l’outil de classification dont la performance est évaluée, si bien que les estimations qui utilisent cette mesure sont fondamentalement incohérentes: c’est-à-dire qu’aucune comparaison ne peut être faite quand l’AUC est utilisé. Cette incohérence est examinée, ses implications sont présentées, et une alternative cohérente est décrite.

Mots clés 
Discrimination, aire sous la courbe ROC, performance de la discrimination, la mesure H

Abstract
Various different criteria are in widespread use for evaluating the performance of classification rules.  One of these is the area under the ROC curve (the AUC).  This measure has the attractive property that it summarises performance over all possible values of the classification threshold.  Unfortunately, at the heart of the AUC lies a distribution which depends on the classifier being evaluated, so that evaluations using this measure are fundamentally incoherent: like is not being compared with like when the AUC is used.  This incoherence is explored, its implications noted, and a coherent alternative is described

Key words 
Classification, area under the curve, ROC curve, classifier performance, H measure

Article