Chapitre 5 La grammaire des graphiques (GG)

5.1 Les bases de GG

Commençons par les bases! La librairie ggplot2 est basée sur la Grammaire des Graphiques (GG), qui est un cadre pour la visualisation de données qui décompose chaque élément d’un graphique en composants individuels, créant ainsi des couches distinctes. En utilisant le système GG, nous pouvons construire des graphiques étape par étape pour des résultats flexibles et personnalisables.

Les couches GG ont des noms spécifiques que vous verrez tout au long de l’atelier:

Image adaptée de [The Grammar of Graphics](https://www.springer.com/gp/book/9780387245447).

Figure 5.1: Image adaptée de The Grammar of Graphics.

Pour créer un ggplot, les couches de données et de mapping sont des exigences de base, tandis que les autres couches sont destinées à une configuration supplémentaire. Les couches ‘non requises’ sont toujours importantes à considérer, mais vous serez en mesure de générer un graphique de base sans celles-ci.

Conditions de base pour générer un `ggplot'.

Figure 5.2: Conditions de base pour générer un `ggplot’.

5.2 Les couches de GG

5.2.1 Descriptions de couches courantes

Voici une décomposition de chaque couche Grammaire des Graphiques et des arguments courants pour chacune d’elles qui peut vous servir de référence:

  • Données :
    • vos données, dans un format tidy, fourniront les ingrédients de votre graphique.
    • utilisez les techniques dplyr pour préparer les données pour un format optimal pour la visualisation.
    • En général, cela signifie que vous devez avoir une rangée pour chaque observation que vous voulez visualiser.
  • Esthétique (aes), pour rendre les données visibles
    • x, y: position le long des axes x et y
    • colour: la couleur des géométries selon les données
    • fill: la couleur intérieure des géométries
    • group: à quel groupe appartient une géométrie
    • shape: la forme des points
    • linetype: le type de ligne utilisé (pleine, pointillée, etc.)
    • size: la taille des points ou des lignes
    • alpha: la transparence des géométries
  • Objets géométriques (geoms)
    • geom_point() : diagramme de dispersion
    • geom_line() : lignes reliant des points par une valeur croissante de x
    • geom_path() : lignes reliant des points dans l’ordre d’apparition
    • geom_boxplot() : diagramme en boîte (boxplot) pour les variables catégoriques
    • geom_bar() : diagrammes à barres pour un axe des x catégorique
    • geom_histogram() : histogramme pour l’axe des x continu
    • geom_violin() : kernel de distribution de la dispersion des données
    • geom_smooth() : ligne de lissage en fonction des données
  • Facettes
    • facet_wrap() ou facet_grid() pour de petits multiples
  • Statistiques
    • similaire aux géométries, mais issue de calcul sur les données
    • indique les moyennes, les comptages et autres résumés statistiques des données
  • Coordonnées - ajustement des données sur une page
    • coord_cartesian pour fixer des limites
    • coord_polar pour les graphiques circulaires
    • coord_map pour différentes projections cartographiques
  • Thèmes
    • Effets visuels globaux par défaut
    • polices, couleurs, formes, contours

5.2.2 Comment assembler ces couches

Essayons de mettre ces couches ensemble! Voici les étapes de base pour construire une figure. Vous pouvez vous référer à ces étapes tout au long de l’atelier si vous voulez de l’aide !

  1. Créer un objet graphique simple :
  • plot.object <- ggplot()
  1. Ajouter des couches géométriques :
  • plot.object <- plot.object + geom_*()
  1. Ajouter des couches d’apparence :
  • plot.object <- plot.object + coord_*() + theme()
  1. Répétez l’étape 2-3 jusqu’à ce que vous soyez satisfait, puis imprimez :
  • plot.object ou print(plot.object).

Nous reviendrons sur cette syntaxe au chapitre 6.4, où nous aborderons les couches de manière plus approfondie!