Personne :
Desbois-Bédard, Laurence

En cours de chargement...
Photo de profil
Adresse électronique
Date de naissance
Projets de recherche
Structures organisationnelles
Fonction
Nom de famille
Desbois-Bédard
Prénom
Laurence
Affiliation
Département de mathématiques et statistique, Faculté des sciences et de génie, Université Laval
ISNI
ORCID
Identifiant Canadiana
ncf11907419
person.page.name

Résultats de recherche

Voici les éléments 1 - 1 sur 1
  • Publication
    Accès libre
    Génération de données synthétiques pour des variables continues : étude de différentes méthodes utilisant les copules
    (2017) Desbois-Bédard, Laurence; Charest, Anne-Sophie; Rivest, Louis-Paul
    L’intérêt des agences statistiques à permettre l’accès aux microdonnées d’enquête est grandissant. À cette fin, plusieurs méthodes permettant de publier les microdonnées tout en protégeant la confidentialité des répondants ont été proposées ; ce mémoire se penche sur l’une d’entre-elles : la génération de données synthétiques. Deux approches sont présentées, GADP et C-GADP, et une nouvelle est proposée. La méthode GADP suppose que les variables des données originales et synthétiques sont de loi normale, alors que la méthode C-GADP suppose qu’elles sont jointes par une copule normale. La nouvelle méthode est basée sur les modèles de copules en vigne. Ces modèles sont employés dans l’espoir de mieux modéliser les liens entre les variables. Les trois approches sont évaluées selon les concepts d’utilité et de risque. L’utilité de données confidentielles s’apprécie selon la similitude qu’elles ont avec les données originales et le risque, par la possibilité d’une violation de la confidentialité des répondants. Le risque peut survenir par identification ou par inférence. Seul le risque d’inférence est possible dans le cadre de ce mémoire. Précisément, l’utilité est évaluée avec quelques mesures faites à partir d’analyses spécifiques et une mesure globale basée sur les scores de propension calculés avec une régression logistique. Quant au risque, il est évalué avec une prévision basée sur la distance.