Lise Vaudor
21/09/2021
(en l’occurrence, ces principes sont inspirés du livre “The
Grammar of Graphics” de Leland
Wilkinson, d’où le
=> production simple et intuitive de graphiques beaux et riches |
|
Commençons par charger le package |
Jeu de données illustratif Pour vous illustrer les principes et résultats graphiques du package
|
On crée un graphique à l’aide de la fonction ggplot. On spécifie sur quel jeu de données le graphique va être construit, ainsi que les aesthetics x et y: |
On peut simplifier l’écriture de cette commande en omettant de
préciser les noms des arguments |
On peut par exemple de représenter l’information à l’aide d’un geom “point”: Si je souhaite réaliser un graphique de type boxplot
plutôt que point alors il faudra que je modifie la fonction
|
RemarqueVous devez choisir un type de geom compatible avec la nature des informations (en x et y) que vous voulez représenter!
|
Graphique univarié, x discrète |
Graphique univarié, x continue |
Bivarié, x et y continues |
Bivarié, x et y continues |
Bivarié, x discrète et y continue |
Bivarié, x discrète et y continue |
Evidemment tous les geoms peuvent être paramétrés. Je peux par exemple modifier la couleur de mes boîtes à moustache de la façon suivante: |
Parmi les arguments les plus utilisés pour paramétrer les geoms, on peut citer:
|
|
|
Nous avons vu comment définir les paramètres des geoms de manière “absolue”. Par exemple: |
Je peux aussi lier un paramètre graphique à une variable. On appelle ce procédé mapping. Cette variable fait alors partie des aesthetics. |
On peut utiliser en aesthetic des variables autres que celles qui définissent x et y… Cela veut dire que l’on peut très simplement rajouter des couches d’information (et les légendes correspondantes!) au graphique. |
Remarquez que l’esthétique fill=sex
peut être spécifiée
à la fois dans l’appel à geom_boxplot()
et l’appel à
ggplot()
elle-même
Cependant l’endroit où l’esthétique est spécifiée peut avoir un effet quand le graphique comprend plusieurs couches:
|
Un des aspects les plus intéressants de ggplot2
est la
facilité avec laquelle on peut transformer les variables de position x
et y.
sans transformation d’échelle |
avec transformation d’échelle |
On peut également définir des limites d’axes
sans limites d’axes |
avec limites d’axesOn peut également définir des limites d’axes |
Ou définir les endroits où les barres s’affichent sur l’axe (argument breaks), ainsi que les étiquettes associées (argument labels). |
Les thèmes permettent de définir l’allure globale du graphique. On peut modifier le thème de la manière suivante :
classic |
black & white |
Les thèmes permettent de définir l’allure globale du graphique. On peut modifier le thème de la manière suivante :
minimal |
grey |
Le package Cela permet par exemple de calculer des statistiques descriptives qui
résument l’information par groupe. On peut évidemment
passer par les fonctions de Par exemple, on peut rajouter un geom de type point qui nous informe
sur les moyennes par groupes -définis pour la variable x, c’est à dire
|
On peut calculer une statistique en groupant les données
selon plusieurs variables. Ici par exemple on combien
les groupes données par la variable |
Le package
|
On ajoute une droite de régression avec la fonction
|
On peut préciser le modèle en précisant des aesthetics supplémentaires:
`geom_smooth()` using method = 'loess' and formula = 'y ~
x'
|
|