« Diffuser ses données de recherche à partir de sources confidentielles : Le cas du projet SUBWORK sur la géographie des emplois populaires de production » par Nicolas RAIMBAULT (ESO) et Aliette ROUX (PROGEDO-Loire)
Le 14/03/2022 de 14h à 16h
Salle T203, Bâtiment Nouveau Tertre, Campus Tertre, Université de Nantes [bâtiment 3 sur ce plan d’accès]. Une solution distancielle (via Zoom) est aussi prévue : le lien sera envoyé quelques heures avant la séance aux personnes inscrites. Merci de compléter ce court formulaire d’inscription
Cette séance du séminaire PROGEDO-Loire est conjointe avec le séminaire So-MSH de la MSH Ange-Guépin, consacré aux problématiques de science ouverte en SHS.
Cette séance discutera les enjeux d’une recherche inscrite dans une perspective de science ouverte, à partir d’un projet de recherche (intégrant le projet Subwork) qui interroge la géographie quantitative et infra-communale des emplois populaires et activités productives dans les aires urbaines nantaise et parisienne.
Cette géographie permet de prendre la mesure de la mixité fonctionnelle et sociale des espaces urbains, et d’aiguiser un regard critique sur les discours qui la promeuvent, à l’heure où plusieurs éléments de contexte semblent effectivement la favoriser : citons notamment l’inscription de la mixité fonctionnelle dans les documents de planification urbaine à plusieurs échelles ; ou encore l’effet de loupe produit par la pandémie du Coronavirus sur ceux qui ont été politiquement et médiatiquement nommés les « travailleurs essentiels ». Mais comment mesurer la mixité fonctionnelle et notamment les activités dites productives (une catégorie de plus en plus mobilisées par les politiques publiques locales) ? Sont-elles associées à des emplois populaires ? Où se situent exactement ces activités productives et ces emplois populaires dans la ville ?
Ce projet de recherche s’inscrit dans une perspective de science ouverte au sens large, intégrant certes la diffusion des données de recherche et des publications (qui constituent les priorités des deux plans Vidal), mais aussi la réutilisation de données déjà existantes et le recours à des méthodes transparentes et reproductibles.
Débutant par une présentation des questionnements de recherche (et des raisons de recourir à des données personnelles et confidentielles produites par la statistique publique), cette séance proposera par la suite :
- une présentation du dispositif (le CASD) rendant possible le traitement et la diffusion de données personnelles et confidentielles produites par la statistique publique et les chercheurs ;
- un retour d’expérience sur la transformation de données confidentielles et personnelles en données « ouvertes » (aussi dites données FAIR) : astuces utilisées (et compromis) pour anonymiser en minimisant la perte d’information ; recours à des méthodes transparentes et reproductibles (en utilisant notamment un outil de programmation lettrée, RMarkdown) pour documenter les méthodes d’appariement ayant produit les données à diffuser ; choix du portail de diffusion et ses implications ;
- une présentation du portail de diffusion Quetelet-Progedo-Diffusion ;
- une description des données utilisées dans le cadre de cette recherche (DADS/Tous Salariés, SIRENE, BAN, RP) notamment dans une perspective d’analyse géographique ou de sociologie du travail.
La présentation se conclura sur les enjeux de cette « ouverture », en soulignant notamment son impact sur les méthodes d’analyse et de travail.