Cette formation présentera quelques méthodes quantitatives d’analyse de données textuelles, et notamment : les statistiques de spécificités dont l’AFC, la classification de Reinhert, l’analyse de réseaux de mots). Chaque participant les appliquera sur son propre corpus à l’aide du logiciel R. Le recours au logiciel R a plusieurs intérêts : développer des méthodes non proposées par la plupart des logiciels de textométrie dits intuitifs ; s’inscrire dans une perspective de « science ouverte » en insérant ses analyses dans une suite de commandes reproductibles ; formater ses données pour les utiliser dans d’autres logiciels ; mais surtout mieux maîtriser la suite des opérations d’analyse textuelle, rendues assez opaque dans les logiciels « clic-bouton ». Cette formation sera aussi l’occasion d’aborder les « expressions régulières » qui permettent de détecter, au sein d’une séquence de caractères, une suite répondant à des critères précis.
Public : Tous ceux qui font de la recherche en SHS dans les universités ligériennes (Nantes, Angers, Le Mans)
Prérequis :
- Être en possession de données textuelles que vous voulez analyser quantitativement dans le cadre de votre recherche. Ces données doivent être au format numérique (.doc, .odt, .txt, .xls, .ods, .csv, .xls, .html…)
- Avoir suivi la formation PROGEDO-Loire « Initiation à R et à la statistique en SHS » ou avoir déjà une expérience significative avec le logiciel R
Durée de la formation : 12 h
Dates de la formation et de l’atelier [*] : 7 et 8 juillet 2025 (9h-12h et 13h-16h) / Atelier : à déterminer
Intervenant : Aliette ROUX, IR PROGEDO-Loire – MSH Ange-Guépin
Formulaire de candidature à compléter avant le 21/04/2025
Programme :
- Tour d’horizon des principaux packages R pour l’analyse quantitative textuelle
- Présentation du package quanteda : fonctions et types d’objets
- Lemmatiser
- Réaliser des tables de fréquences
- Réaliser une AFC
- Réaliser une classification de Reinhert
- Réaliser une analyse de réseau des cooccurrences
[*] Environ 10 jours après la fin de la formation, nous proposons une journée d’atelier. Pourquoi une journée d’atelier ? Pendant la formation, chaque participant est amené à travailler son propre jeu de données, mais ce temps peut s’avérer parfois trop court. Souvent, le travail sur son propre jeu de données est seulement entamé, comme l’interprétation des premiers résultats. Nous invitons le participant à poursuivre la démarche engagée pendant les dix jours suivant la formation. La journée d’atelier, sans ordre du jour, réunit à nouveau les participants qui le souhaitent pour répondre aux questions, résoudre un problème… il s’agit en quelque sorte du « service après vente » de la formation !
Télécharger le catalogue 2021/2025 des formations PROGEDO-Loire au format pdf