Chapitre 5 La grammaire des graphiques (GG)
5.1 Les bases de GG
Commençons par les bases! La librairie ggplot2
est basée sur la Grammaire des Graphiques (GG), qui est un cadre pour la visualisation de données qui décompose chaque élément d’un graphique en composants individuels, créant ainsi des couches distinctes. En utilisant le système GG, nous pouvons construire des graphiques étape par étape pour des résultats flexibles et personnalisables.
Les couches GG ont des noms spécifiques que vous verrez tout au long de l’atelier:
Pour créer un ggplot
, les couches de données et de mapping sont des exigences de base, tandis que les autres couches sont destinées à une configuration supplémentaire. Les couches ‘non requises’ sont toujours importantes à considérer, mais vous serez en mesure de générer un graphique de base sans celles-ci.
5.2 Les couches de GG
5.2.1 Descriptions de couches courantes
Voici une décomposition de chaque couche Grammaire des Graphiques et des arguments courants pour chacune d’elles qui peut vous servir de référence:
- Données :
- vos données, dans un format tidy, fourniront les ingrédients de votre graphique.
- utilisez les techniques
dplyr
pour préparer les données pour un format optimal pour la visualisation. - En général, cela signifie que vous devez avoir une rangée pour chaque observation que vous voulez visualiser.
- Esthétique (aes), pour rendre les données visibles
x
,y
: position le long des axes x et ycolour
: la couleur des géométries selon les donnéesfill
: la couleur intérieure des géométriesgroup
: à quel groupe appartient une géométrieshape
: la forme des pointslinetype
: le type de ligne utilisé (pleine, pointillée, etc.)size
: la taille des points ou des lignesalpha
: la transparence des géométries
- Objets géométriques (geoms)
geom_point()
: diagramme de dispersiongeom_line()
: lignes reliant des points par une valeur croissante de xgeom_path()
: lignes reliant des points dans l’ordre d’apparitiongeom_boxplot()
: diagramme en boîte (boxplot) pour les variables catégoriquesgeom_bar()
: diagrammes à barres pour un axe des x catégoriquegeom_histogram()
: histogramme pour l’axe des x continugeom_violin()
: kernel de distribution de la dispersion des donnéesgeom_smooth()
: ligne de lissage en fonction des données
- Facettes
facet_wrap()
oufacet_grid()
pour de petits multiples
- Statistiques
- similaire aux géométries, mais issue de calcul sur les données
- indique les moyennes, les comptages et autres résumés statistiques des données
- Coordonnées - ajustement des données sur une page
coord_cartesian
pour fixer des limitescoord_polar
pour les graphiques circulairescoord_map
pour différentes projections cartographiques
- Thèmes
- Effets visuels globaux par défaut
- polices, couleurs, formes, contours
5.2.2 Comment assembler ces couches
Essayons de mettre ces couches ensemble! Voici les étapes de base pour construire une figure. Vous pouvez vous référer à ces étapes tout au long de l’atelier si vous voulez de l’aide !
plot.object <- ggplot()
plot.object <- plot.object + geom_*()
plot.object <- plot.object + coord_*() + theme()
plot.object
ouprint(plot.object)
.Nous reviendrons sur cette syntaxe au chapitre 6.4, où nous aborderons les couches de manière plus approfondie!