Analyse quantitative de données textuelles avec R

Cette formation s’adresse aux collègues pratiquant déjà la textométrie, ou ayant suivi la formation d’analyse quantitative de données textuelles avec Iramuteq. En effet, cette formation ne reviendra pas sur les principales méthodes d’analyse (statistiques de spécificités dont l’AFC, classification de Reinhert, analyse de réseaux de mots). Elle est essentiellement technique, visant à accompagner les participants dans l’application de ces méthodes avec le logiciel R. Le recours au logiciel R a plusieurs intérêts : développer des méthodes non proposées par la plupart des logiciels de textométrie dits intuitifs ; s’inscrire dans une perspective de « science ouverte » en insérant ses analyses dans une suite de commandes reproductibles ; formater ses données pour les utiliser dans d’autres logiciels ; mais surtout mieux maîtriser la suite des opérations d’analyse textuelle, renduez assez opaque dans les logiciels « clic-bouton ». Cette formation sera aussi l’occasion d’aborder les « expressions régulières » qui permettent de détecter, au sein d’une séquence de caractères, une suite répondant à des critères précis.

Public : Tous ceux qui font de la recherche en SHS dans les universités ligériennes (Nantes, Angers, Le Mans)

Prérequis :

  • Être en possession de données textuelles que vous voulez analyser quantitativement dans le cadre de votre recherche. Ces données doivent être au format numérique (.doc, .odt, .txt, .xls, .ods, .csv, .xls, .html…)
  • Avoir suivi la formation PROGEDO-Loire « Initiation à R et à la statistique en SHS » ou avoir déjà une expérience significative avec le logiciel R
  • Connaître les principales méthodes quantitatives d’analyse textuelle, ou avoir suivi la formation PROGEDO-Loire « Analyse quantitative de données textuelles avec Iramuteq« 

Durée de la formation : 6 h

Dates de la formation : 12 mai 2022 (9h-12h et 13h-16h)

Date de l’atelier [*] : 19 mai 2022 (à partir de 10h)

Intervenant : Aliette ROUX, IR PROGEDO-Loire – MSH Ange-Guépin

Formulaire de candidature à compléter avant le 01/05/2022

Programme :

  • Préparer ses données :
    • l’import et le formatage
    • les expressions régulières
  • Lemmatiser
  • Réaliser une table de fréquence et un nuage de mots
  • Réaliser une AFC
  • Réaliser une classification de Reinhert
  • Réaliser une analyse de réseau des cooccurrences

[*] Environ 10 jours après la fin de la formation, nous proposons une journée d’atelier. Pourquoi une journée d’atelier ? Pendant la formation, chaque participant est amené à travailler son propre jeu de données, mais ce temps peut s’avérer parfois trop court. Souvent, le travail sur son propre jeu de données est seulement entamé, comme l’interprétation des premiers résultats. Nous invitons le participant à poursuivre la démarche engagée pendant les dix jours suivant la formation. La journée d’atelier, sans ordre du jour, réunit à nouveau les participants qui le souhaitent pour répondre aux questions, résoudre un problème… il s’agit en quelque sorte du « service après vente » de la formation !

Leave a Reply

Your email address will not be published. Required fields are marked *