Analyse quantitative de données textuelles avec R

Cette formation présentera quelques méthodes quantitatives d’analyse de données textuelles, et notamment : les statistiques de spécificités dont l’AFC, la classification de Reinhert, l’analyse de réseaux de mots). Chaque participant les appliquera sur son propre corpus à l’aide du logiciel R. Le recours au logiciel R a plusieurs intérêts : développer des méthodes non proposées par la plupart des logiciels de textométrie dits intuitifs ; s’inscrire dans une perspective de « science ouverte » en insérant ses analyses dans une suite de commandes reproductibles ; formater ses données pour les utiliser dans d’autres logiciels ; mais surtout mieux maîtriser la suite des opérations d’analyse textuelle, rendues assez opaque dans les logiciels « clic-bouton ». Cette formation sera aussi l’occasion d’aborder les « expressions régulières » qui permettent de détecter, au sein d’une séquence de caractères, une suite répondant à des critères précis.

Public : Tous ceux qui font de la recherche en SHS dans les universités ligériennes (Nantes, Angers, Le Mans)

Prérequis :

  • Être en possession de données textuelles que vous voulez analyser quantitativement dans le cadre de votre recherche. Ces données doivent être au format numérique (.doc, .odt, .txt, .xls, .ods, .csv, .xls, .html…)
  • Avoir suivi la formation PROGEDO-Loire « Initiation à R et à la statistique en SHS » ou avoir déjà une expérience significative avec le logiciel R

Durée de la formation : 12 h

Dates de la formation et de l’atelier [*] : 7 et 8 juillet 2025 (9h-12h et 13h-16h) / Atelier : à déterminer

Intervenant : Aliette ROUX, IR PROGEDO-Loire – MSH Ange-Guépin

Formulaire de candidature à compléter avant le 21/04/2025

Programme :

  • Tour d’horizon des principaux packages R pour l’analyse quantitative textuelle
  • Présentation du package quanteda : fonctions et types d’objets
  • Lemmatiser
  • Réaliser des tables de fréquences
  • Réaliser une AFC
  • Réaliser une classification de Reinhert
  • Réaliser une analyse de réseau des cooccurrences

[*] Environ 10 jours après la fin de la formation, nous proposons une journée d’atelier. Pourquoi une journée d’atelier ? Pendant la formation, chaque participant est amené à travailler son propre jeu de données, mais ce temps peut s’avérer parfois trop court. Souvent, le travail sur son propre jeu de données est seulement entamé, comme l’interprétation des premiers résultats. Nous invitons le participant à poursuivre la démarche engagée pendant les dix jours suivant la formation. La journée d’atelier, sans ordre du jour, réunit à nouveau les participants qui le souhaitent pour répondre aux questions, résoudre un problème… il s’agit en quelque sorte du « service après vente » de la formation !

Leave a Reply

Your email address will not be published. Required fields are marked *