Pour savoir comment effectuer et gérer un dépôt de document, consultez le « Guide abrégé – Dépôt de documents » sur le site Web de la Bibliothèque. Pour toute question, écrivez à corpus@ulaval.ca.
 

Personne :
Leboeuf, Jean-Samuel

En cours de chargement...
Photo de profil

Adresse électronique

Date de naissance

Projets de recherche

Structures organisationnelles

Fonction

Nom de famille

Leboeuf

Prénom

Jean-Samuel

Affiliation

Université Laval. Département d'informatique et de génie logiciel

ISNI

ORCID

Identifiant Canadiana

ncf11907651

person.page.name

Résultats de recherche

Voici les éléments 1 - 2 sur 2
En cours de chargement...
Vignette d'image
PublicationAccès libre

On the generalization properties of VC classes and application to decision trees

2023, Leboeuf, Jean-Samuel, Marchand, Mario

La théorie « Vapnik-Chervonenkis » (VC) est un sous-domaine de la théorie de l'apprentissage automatique qui offre un moyen de comprendre la notion de généralisation d'un algorithme d'apprentissage en bornant le taux d'erreur des prédicteurs par l'utilisation d'outils combinatoires, tels que la dimension VC et la fonction de croissance. Bien que des pistes de recherche récentes indiquent que la théorie VC n'est pas le bon cadre pour comprendre la généralisation dans les réseaux de neurones profonds (Zhang et al., 2021), elle reste pertinente pour les modèles interprétables basés sur des décisions à seuil ferme, comme les arbres de décision et les formules booléennes. Pourtant, les bornes de généralisation pour les classes VC n'ont pas connu d'améliorations substantielles depuis près d'une décennie, et les propriétés combinatoires des arbres de décision, nécessaires à l'application de ces bornes, sont encore mal comprises. Dans cette thèse, nous abordons ces deux problèmes de deux manières distinctes, présentées en deux parties différentes. Dans la première partie, nous améliorons significativement les bornes de généralisation pour les classes VC à l'aide de deux idées majeures. Premièrement, nous évitons d'utiliser les inégalités de concentration en inversant la queue de l'hypergéométrique pour obtenir une borne supérieure non-uniforme, très serrée et indépendante de la distribution, sur le risque pour les classes VC. Ensuite, l'utilisation de l'inversion de la queue de l'hypergéométrique permet d'optimiser l'astuce de l'échantillon fantôme pour obtenir des gains supplémentaires non négligeables. Ces améliorations sont ensuite utilisées pour dériver une borne de déviation relative, une borne pour les classificateurs multiclasses à marge, ainsi qu'une borne inférieure. Dans nos dérivations, nous prenons soin d'introduire aussi peu d'approximations que possible afin de réduire au minimum les facteurs constants de la borne. Des comparaisons numériques montrent que la nouvelle borne est presque toujours informative et qu'elle est plus serrée que toute autre borne VC courante pour toutes des tailles raisonnables de jeux de données. Ensuite, dans la deuxième partie, nous revisitons les arbres de décision binaires du point de vue des partitions des données. Nous introduisons la notion de fonction de partitionnement, et nous la relions à la fonction de croissance et à la dimension VC. Nous considérons trois types d'attributs : à valeur réelle, catégorique ordinale et catégorique nominale, chacune avec des règles de décision différentes. Pour chaque type d'attribut, nous bornons supérieurement la fonction de partitionnement des souches de décision avant d'étendre les bornes aux arbres de décision généraux (avec n'importe quelle structure fixe) en utilisant une approche récursive. Parmi les nouveaux résultats les plus notables, nous obtenons que la dimension VC exacte des souches de décision sur des exemples de *ℓ* attributs à valeurs réelles est donnée par le plus grand entier *d* tel que $2\ell\geq \bigl(\begin{smallmatrix} d \\\left \lfloor \frac{d}{2}\right \rfloor \end{smallmatrix}\bigr)$. De plus, nous montrons que la dimension VC d'une structure d'arbre binaire avec $L_T$ feuilles sur des exemples de *ℓ* attributs à valeurs réelles est de l'ordre de $O(L_T\,log(L_T\ell))$. Enfin, nous élaborons un algorithme d'élagage basé sur ces résultats qui surpasse les populaires algorithmes d'élagage *cost-complexity* (C4.5) et *reduced-error* (ID3) sur de nombreux jeux de données, avec l'avantage qu'aucune validation croisée n'est nécessaire.

En cours de chargement...
Vignette d'image
PublicationAccès libre

Un théorème no-go pour les théories supersymétriques pleinement unifiées brisées par un vide métastable

2017, Leboeuf, Jean-Samuel, Fortin, Jean-François

Le modèle standard, bien qu’étant la théorie la plus complète et précise jamais conçue, mène toutefois à plusieurs problèmes et questions non résolues, tels le problème de la hiérarchie ou de l’origine de la masse des neutrinos. Parmi les solutions avancées, les plus populaires sont sans doute les théories de grande unification et l’ajout de la supersymétrie. L’inclusion simultanée de ces deux extensions du modèle standard semble d’ailleurs encouragée par l’unification des constantes de couplage. Toutefois, briser la supersymétrie constitue un obstacle de taille à la réalisation de modèles réalistes et nécessite donc l’introduction d’un secteur caché, découplé du modèle standard. Le présent mémoire a pour objectif de tester une unification totale du secteur caché et du modèle standard supersymétrique minimal unifié sous la bannière des théories supersymétriques pleinement unifiées. Pour délimiter l’étude de tels modèles, deux hypothèses sont posées : le mécanisme de brisure de supersymétrie du secteur caché est le mécanisme Intriligator-Seiberg-Shih et les brisures de symétrie jaugée surviennent par un mécanisme de Higgs avec un potentiel quartique. Un théorème no-go est par la suite démontré, stipulant qu’il est impossible d’avoir une théorie supersymétrique pleinement unifiée soumise à ces deux conditions.