Critères de qualité d'un classifieur généraliste
Résumé
This paper considers the problem of choosing a good classifier. For each problem there exist an optimal classifier, but none are optimal, regarding the error rate, in all cases. Because there exists a large number of classifiers, a user would rather prefer an all-purpose classifier that is easy to adjust, in the hope that it will do almost as good as the optimal. In this paper we establish a list of criteria that a good generalist classifier should satisfy. We first discuss data analytic, these criteria are presented. Six among the most popular classifiers are selected and scored according to these criteria. Tables allow to easily appreciate the relative values of each. In the end, random forests turn out to be the best classifiers.-Cet article considère le problème de choisir un bon classifieur. Pour chaque contexte il existe un classifieur optimal selon le critère du taux d'erreur, mais aucun n'est optimal dans tous les cas. Comme il existe de nombreux classi-fieurs, lÕutilisateur préférera souvent choisir un classifieur généraliste, dont l'ajustement et l'exploitation sont à sa portée, en espérant que celui-ci fait presque aussi bien que l'optimal. Cet article établit une liste de critères que devrait rencontrer un bon classifieur généraliste, destiné à être ajusté et utilisé avec un minimum d'intervention humaine. Après avoir introduit l'analytique des données, ces critères sont présentés et commentés. Puis un sous-ensemble de six classifieurs est choisi parmi les plus populaires et des scores leur sont attribués en regard de ces critères. Des tables permettent d'apprécier les résul-tats et facilitent le choix d'un bon classifieur. Le classifieur qui ressort de cet exercice avec les meilleurs scores est la forêt aléatoire et ses variantes.léatoire (random forest) et ses variantes.
Origine | Fichiers produits par l'(les) auteur(s) |
---|
Loading...