Analyses multivariées et classifications avec R

Les analyses multivariées visent à étudier simultanément plusieurs variables. On distingue classiquement deux grands types de méthodes : celles qui reposent sur le principe du « toutes choses égales par ailleurs » et qui cherchent à modéliser les variations d’une variable par d’autres variables (on les appelle « méthodes confirmatoires ») ; et celles qui visent à structurer et résumer l’information d’un tableau comprenant de nombreuses variables (on les appelle « méthodes exploratoires »). Les premières renvoient aux régressions multiples ; les secondes sont regroupées parmi les méthodes d’analyse géométrique des données (AGD comprenant ACP, AFC, ACM, AFM). Nous formerons les participants à l’application des analyses multivariées (quelles analyses dans quelles situations ? comment s’y prendre ?) et à l’interprétation des résultats (où porter son intérêt ? quelles formulations ? etc.). La formation abordera également deux techniques de classification (CAH et k-means) visant à partitionner une population en différentes classes ou sous-groupes. En plus d’apporter de l’intérêt à vos propres jeux de données, nous nous appuierons sur des exemples de données et de travaux issus des SHS.

Public : Tous ceux qui font de la recherche en SHS dans les universités ligériennes (Nantes, Angers, Le Mans)

Prérequis :

  • Être en possession d’un jeu de données que vous voulez analyser quantitativement (contactez l’IR PROGEDO-Loire si vous rencontrez des difficultés d’accès à ces données)
  • Avoir suivi la formation PROGEDO-Loire « Statistique bivariée avec R pour les SHS« 

Durée de la formation : 12 h ou 9 h

Dates de la formation et de l’atelier [*] :

  • Edition 112h : 29 mars 2021 (9h-12h et 13h-16h) et 30 mars 2021 (9h-12h et 13h-16h) / Atelier : 8 avril 2021 (à partir de 10h)
  • Edition 2 – 9h : 14 octobre 2021 (9h-12h et 13h-16h) et 21 octobre 2021 (9h-12h) / Atelier : 21 octobre 2021 (à partir de 13h)
  • Edition 3 – 12h : 8 mars 2022 (9h-12h et 13h-16h) et 10 mars (9h-12h et 13h-16h) / Atelier : 17 mars 2022 (à partir de 10h)
  • Edition 4 : 28 et 30 mars 2023 (9h-12h et 13h-16h) / Atelier : 11 avril 2023 (à partir de 10h)

Intervenant : Aliette ROUX, IR PROGEDO-Loire – MSH Ange-Guépin

Formulaire de candidature à compléter avant le 15/03/2023 (édition 4)

Programme :

  • Les analyses géométriques de données (AGD)
    • Introduction – Les AGD, de quoi s’agit-il ?
    • Principes généraux de l’AGD
    • Eléments communs à l’interprétation des AGD
    • Différences entre les méthodes d’AGD
    • Le choix des variables actives et supplémentaires
  • Les classifications (CAH et k-means)
    • CAH – Classification ascendante hiérarchique
    • Méthode des k-means, méthode de partition directe
    • Compléments et description des classes
  • Les régressions multiples

[*] Environ 10 jours après la fin de la formation, nous proposons une journée d’atelier. Pourquoi une journée d’atelier ? Pendant la formation, chaque participant est amené à travailler son propre jeu de données, mais ce temps peut s’avérer parfois trop court. Souvent, le travail sur son propre jeu de données est seulement entamé, comme l’interprétation des premiers résultats. Nous invitons le participant à poursuivre la démarche engagée pendant les dix jours suivant la formation. La journée d’atelier, sans ordre du jour, réunit à nouveau les participants qui le souhaitent pour répondre aux questions, résoudre un problème… il s’agit en quelque sorte du « service après vente » de la formation !

Leave a Reply

Your email address will not be published. Required fields are marked *