initR 6: Graphiques avec ggplot2: approfondissement

Lise Vaudor

10/10/2018

Titres des axes

ggplot2 offre également des outils pour travailler facilement sur les problèmes de titres, d’échelles et d’axes.

Echelles des axes

Un des aspects les plus intéressants de ggplot2 est la facilité avec laquelle on peut transformer les variables de position x et y.

sans transformation d’échelle

Limites des axes

On peut également définir des limites d’axes

sans limites d’axes

Etiquettes des axes

Ou définir les endroits où les barres s’affichent sur l’axe (argument breaks), ainsi que les étiquettes associées (argument labels).

Echelles colorées

Echelles colorées

Thèmes

Les thèmes permettent de définir l’allure globale du graphique. On peut modifier le thème de la manière suivante :

classic

Thèmes

Les thèmes permettent de définir l’allure globale du graphique. On peut modifier le thème de la manière suivante :

minimal

Statistiques descriptives

Le package ggplot2 permet en outre de rajouter des informations provenant de jeux de données supplémentaires.

Cela permet par exemple de calculer des statistiques descriptives qui résument l’information par groupe. On peut évidemment passer par les fonctions de dplyr pour calculer ces statistiques!!

Par exemple, on peut rajouter un geom de type point qui nous informe sur les moyennes par groupes -définis pour la variable x, c’est à dire haircolor-.

Statistiques descriptives

On peut calculer une statistique en groupant les données selon plusieurs variables. Ici par exemple on combien les groupes données par la variable haircolor et par la variable sex:

Modèle de régression

Le package ggplot2 offre aussi des possibilités intéressantes pour travailler sur le lien entre deux variables quantitatives (modèles de régression):

## `geom_smooth()` using method = 'loess' and formula 'y ~ x'

Modèle de régression

On peut préciser le modèle en précisant des aesthetics supplémentaires:

p <- ggplot(catdata, aes(x=age,y=weight,col=sex)) +
  geom_point() +
  geom_smooth()
plot(p)
## `geom_smooth()` using method = 'loess' and formula 'y ~ x'

Modèle de régression linéaire

Le type de régression réalisé est également paramétrable. Ici, par exemple, on réalise une régression linéaire:

On récapitule!

On a parlé de quoi, déjà?

On a parlé de quoi, déjà?