Au delà d’un certain nombre de ligne dans un tableur, il devient difficile de faire des graphiques de statistiques.
De ce point de vue, le langage informatique R, le logiciel R, et son interface graphique RStudio sont très pratiques, même si leur temps de prise en main est plus important que ce n’est le cas pour un tableur.
En particulier, les packages (sortes de plug-in au logiciel) de la suite Tidyverse permettent de réaliser de nombreuses opérations statistiques et une variété de graphiques associés.
C’est en particulier le package ggplot, qui est la plus intéressant d’un point de vue graphique, même si certaines fonctionnalités d’autres packages viennent le compléter.
R et RStudio
Documentation
La documentation en ligne sur R est particulièrement abondante :
- les manuels en ligne pour le logiciel R sont assez arides, mais il existe un wikibook en français plus accessible
- L’aide en ligne à l’utilisation de R en français est intéressante:
- présentation des fonctions graphiques ,
- des statistiques, avec des renvois vers des vidéos en ligne (la statistique expliquée à mon chat, Science4All).
- Les ressources en anglais pour RStudio sont bien faites : ouvrages, webinaires et vidéos, ressources dédiées à l’apprentissage, et « Cheatsheets » (aides-mémoires en anglais dont certains sont traduits en français).
Lise Vaudor, ingénieure de recherche au CNRS, propose en ligne des supports de formation à R très agréables et pédagogiques. Attention, les exercices sont réservés au formations pour des raisons techniques.
Initiation : tutos vidéo
- Pourquoi utiliser R: 00:22
- Pourquoi utiliser R (bis): 01:24
- Console, commandes: 02:10
- Commentaires, historique des commandes, commande incomplète: 03:02
- Assignation: 04:08
- Environnement: 05:45
- Affichage des objets: 06:37
- RStudio: scripts et IDE: 07:14
- Présentation de RStudio: 08:26
- Crédits: 11:22
- Création d’objets: 00:28
- Création de vecteurs: 00:52
- Création de vecteurs (bis) : 02:09
- Classes des objets: 03:23
- Combinaison de vecteurs et classes: 03:52
- Valeurs manquantes: 04:30
- Création de facteurs: 05:00
- Création de listes: 06:00
- Création de tableaux de données: 06:55
- Conversion d’objets: 08:00
- Indexation d’un vecteur ou d’un facteur: 08:32
- Indexation d’une liste: 10:03
- Indexation d’un tableau de données: 10:50
- Indexation d’un tableau de données (bis): 11:39
- Crédits: 12:25
- Opérateurs arithmétiques: 00:14
- Opérateurs de comparaison: 00:59
- Opérateurs logiques: 01:53
- Opérateurs: opérations terme-à-terme: 03:19
- Fonctions: exemples statistiques: 03:51
- Fonctions: exemples statistiques (bis): 04:20
- Fonctions : quelques remarques: 04:56
- Fonctions: ordre et noms des arguments: 06:24
- Documentation: accès à l’aide associée à une fonction 07:36
- Documentation: organisation de l’aide associée à une fonction : 08:10
Tydiverse et ggplot2
Documentation
En ce qui concerne Tidyverse et ggplot2 en particulier :
- En anglais, l’ouvrage R for DataScience (R4DS) est disponible en ligne de façon libre ; il est complété par des exercices associés. Il existe un autre ouvrage en ligne, Statistical Inference via Data Science : A ModernDive into R and the Tidyverse, disponible en licence creative commons.
- En français, un cours particulièrement intéressant a été rédigé par Julien Barnier, chercheur au Centre Max Weber à Lyon, Introduction à R et au tidyverse. Il permet de s’approprier la démarche étape par étape.
- Il a aussi produit un powerpoint synthétique concernant la librairie question r. Il a par ailleurs mis au point différentes applications autour de R, disponibles sur son compte Github.
- L’Insee a produit son propre tutoriel, UtilitR, qui explique notamment comment requêter les API de l’Insee. Il est accompagné d’un guide de bonne pratiques pour les projets R.
Aides-mémoire
Ci-dessous, des aides mémoires utiles qui ont été traduites en français :
Customiser R avec des packages
Palettes de couleurs
Différentes palettes de couleurs peuvent être incorporées dans R via l’ajout de packages.
Une liste avec les échantillons est disponible sur le dépôt Github r-color-palettes. Pour les palettes de couleurs discrètes, il est même possible de choisir ses couleurs avant de charger le plugin correspondant. La documentation du plugin est bien bien entendu disponible.