Pour savoir comment effectuer et gérer un dépôt de document, consultez le « Guide abrégé – Dépôt de documents » sur le site Web de la Bibliothèque. Pour toute question, écrivez à corpus@ulaval.ca.
 

Publication :
Applications de méthodes de classification non supervisées à la détection d'anomalies

bul.contributor.advisor-marc100Duchesne, Thierry|=$aDuchesne, Thierry
bul.contributor.advisor-marc100Marchand, Mario|=$aMarchand, Mario,$d1956-
bul.contributor.author-marc100Jabiri, Fouad|=$aJabiri, Fouad
bul.date.reception2021-01-06
bul.description.alirenoadg spbar
bul.faculteFaculté des sciences et de génie.
bul.identifier.controlNumber1232449175
bul.identifier.uuid07c1e8e7-d30a-4a90-88db-495a4ff3b0de
dc.contributor.advisorDuchesne, Thierry
dc.contributor.advisorMarchand, Mario
dc.contributor.authorJabiri, Fouad
dc.date.accessioned2021-01-25T08:39:07Z
dc.date.available2021-01-25T08:39:07Z
dc.date.issued2020
dc.date.updated20210211
dc.description.abstractDans ce présent mémoire, nous présenterons dans un premier temps l’algorithme d’arbres binaires de partitionnement et la forêt d’isolation. Les arbres binaires sont des classificateurs très populaires dans le domaine de l’apprentissage automatique supervisé. La forêt d’isolation appartient à la famille des méthodes non supervisées. Il s’agit d’un ensemble d’arbres binaires employés en commun pour isoler les instances qui semblent aberrantes ou anormales. Par la suite, nous présenterons l’approche que nous avons nommée "Exponential smoothig" (ou "pooling"). Cette technique consiste à encoder des séquences de variables de longueurs différentes en un seul vecteur de taille fixe. En effet, l’objectif de ce mémoire est d’appliquer l’algorithme des forêts d’isolation pour identifier les anomalies dans les réclamations et les formulaires d’assurances disponibles dans la base de données d’une grande compagnie d’assurances canadienne. Cependant, un formulaire est une séquence de réclamations. Chaque réclamation est caractérisée par un ensemble de variables. Ainsi, il serait impossible d’appliquer l’algorithme des forêts d’isolation directement sur ce genre de données. Pour cette raison, nous allons appliquer le pooling. Notre application parvient effectivement à isoler des réclamations et des formulaires anormaux. Nous constatons que ces derniers ont plus tendances à être audités parla compagnie que les formulaires normaux.fr
dc.description.abstractIn this thesis, we will first present the binary tree partitioning algorithm and isolation forests. Binary trees are very popular classifiers in supervised machine learning. The isolation forest belongs to the family of unsupervised methods. It is an ensemble of binary trees used in common to isolate outlying instances. Subsequently, we will present the approach that we have named "Exponential smoothig" (or "pooling"). This technique consists in encoding sequences of variables of different lengths into a single vector of fixed size. Indeed, the objective of this thesis is to apply the algorithm of isolation forests to identify anomalies in insurance claim forms available in the database of a large Canadian insurance company in order to detect cases of fraud. However, a form is a sequence of claims. Each claim is characterized by a set of variables and thus it will be impossible to apply the isolation forest algorithm directly to this kind of data. It is for this reason that we are going to apply Exponential smoothing. Our application effectively isolates claims and abnormal forms, and we find that the latter tend to be audited by the company more often than regular forms.en
dc.format.extent1 ressource en ligne (x, 61 pages)
dc.identifier.bacTC-QQLA-36987
dc.identifier.nothese36987
dc.identifier.other36987
dc.identifier.urihttp://hdl.handle.net/20.500.11794/67914
dc.languagefre
dc.rightshttp://purl.org/coar/access_right/c_abf2
dc.subject.rvmApprentissage automatique.fr_CA
dc.subject.rvmStructures de données (Informatique)fr_CA
dc.subject.rvmArbres de décision.fr_CA
dc.subject.rvmSystèmes de classeurs.fr_CA
dc.subject.rvmForêts d'arbres décisionnels.fr_CA
dc.subject.rvmCompagnies d'assurances -- Bases de données.fr_CA
dc.titleApplications de méthodes de classification non supervisées à la détection d'anomalies
dc.typemémoire de maîtrise
dc.type.legacyCOAR1_1::Texte::Thèse::Mémoire de maîtrisefr
dcterms.publisher.locationQuébec
dspace.accessstatus.time2024-03-20 18:25:59
dspace.entity.typePublication
etdms.degree.disciplineMaîtrise en statistique
etdms.degree.grantorUniversité Lavalfr_CA
etdms.degree.nameMaître ès sciences (M. Sc.)fr_CA
relation.isAdvisorOfPublication338165ed-d68a-4d6a-827d-59e32d424538
relation.isAdvisorOfPublicationa66370d3-d408-4b52-b990-9dac07a3ea00
relation.isAdvisorOfPublication.latestForDiscovery338165ed-d68a-4d6a-827d-59e32d424538
relation.isAuthorOfPublication42597e74-a7de-415e-b4f3-66f710d079b0
relation.isAuthorOfPublication.latestForDiscovery42597e74-a7de-415e-b4f3-66f710d079b0
relation.isResourceTypeOfPublication5324f3cf-6e18-4f28-a339-115c99bd2b34
relation.isResourceTypeOfPublication.latestForDiscovery5324f3cf-6e18-4f28-a339-115c99bd2b34

Fichiers

Bundle original
Voici les éléments 1 - 1 sur 1
En cours de chargement...
Vignette d'image
Nom :
36987.pdf
Taille :
2.58 MB
Format :
Adobe Portable Document Format
Description :