Initiation à R et à la statistique en SHS

Cette formation est à la fois méthodologique et technique : elle définit des notions de base concernant les méthodes quantitatives ; et elle vous accompagne dans l’application d’analyses univariées à partir du logiciel R, en se basant sur vos propres jeux de données (ceux que vous souhaitez interroger dans le cadre de votre recherche). La formation initie les participants au langage R à travers son IDE RStudio – aussi cette formation est-elle un prérequis pour suivre les autres formations PROGEDO-Loire utilisant ce logiciel (analyses bivariées, multivariées, de réseaux…). Ce logiciel libre est massivement utilisé par la communauté scientifique : il est gratuit et ses capacités restent inégalées (analyse de données, analyse textuelle, analyse de réseaux, cartographie, analyse spatiale, photogrammétrie…). En plus d’apporter de l’intérêt à vos propres jeux de données, la formation s’appuiera sur des exemples de données et de travaux issus des SHS.

Public : Tous ceux qui font de la recherche en SHS dans les universités ligériennes (Nantes, Angers, Le Mans)

Prérequis :

  • Être en possession d’un jeu de données que vous voulez analyser quantitativement (contactez l’IR PROGEDO-Loire si vous rencontrez des difficultés d’accès à ces données)
  • Avoir pensé à un traitement statistique que vous souhaiteriez réaliser dans le cadre de votre recherche

Durée de la formation : 18h

Dates de la formation et de l’atelier [*] :

  • Edition 1 – 21h : 18 février 2021 (10h-13h), 1er mars 2021 (9h-12h et 13h-16h), 2 mars 2021 (9h-12h et 13h-16h) et 4 mars 2021 (9h-12h et 13h-16h) / Atelier : 11 mars 2021 (à partir de 13h30)
  • Edition 2 – 18h : 27 septembre 2021 (9-12h et 13h-16h), 28 septembre 2021 (9-12h et 13h-16h) et 30 septembre 2021 (9-12h et 13h-16h) / Atelier : 7 octobre 2021 (à partir de 10h)
  • Edition 3 – 18h : 3 février 2022 (9-12h et 13h-16h), 8 février 2022 (9-12h et 13h-16h), 10 février 2022 (9-12h et 13h-16h) / Atelier : 21 février 2022 (à partir de 14h)
  • Edition 4 : 28 février, 2 et 7 mars 2023 (9-12h et 13h-16h) / Atelier : 13 mars 2023 (à partir de 13h)

Formulaire de candidature à compléter avant le 06/02/2023 (édition 4)

Intervenant : Aliette ROUX, IR PROGEDO-Loire – MSH Ange-Guépin

Programme :

Jour 1 (6h)

  • Logiciels R et RStudio : intérêts et différences
  • Les différents types d’objets dans R
  • Packages / Fonctions
  • Vocabulaire de base d’un tableau de données
  • Si ma « banque de données » est un SGBD : Comment l’interroger dans R ?
  • Importer son jeu de données dans RStudio
  • Interroger la structure d’un tableau
  • Interroger la structure des autres objets

Jour 2 (6h)

  • Manipuler des données : le langage R « basique » et le package tidyverse
  • Jointures
  • Interroger les valeurs et leurs variations, variable par variable
  • Concevoir et préparer les variables nécessaires à l’analyse
  • Construire et lire un tableau

Jour 3 (6h)

  • La visualisation des données : pourquoi, comment
  • Visualiser ses données avec le package ggplot
  • Exporter un tableau de données et un graphique
  • Les structures conditionnelles
  • Programmer une boucle
  • Réaliser un document R Markdown : document simple contenant à la fois du texte, des instructions R et le résultat fourni par R

[*] Environ 10 jours après la fin de la formation, nous proposons une journée d’atelier. Pourquoi une journée d’atelier ? Pendant la formation, chaque participant est amené à travailler son propre jeu de données, mais ce temps peut s’avérer parfois trop court. Souvent, le travail sur son propre jeu de données est seulement entamé, comme l’interprétation des premiers résultats. Nous invitons le participant à poursuivre la démarche engagée pendant les dix jours suivant la formation. La journée d’atelier, sans ordre du jour, réunit à nouveau les participants qui le souhaitent pour répondre aux questions, résoudre un problème… il s’agit en quelque sorte du « service après vente » de la formation !

Leave a Reply

Your email address will not be published. Required fields are marked *