Chapitre 13 Introduction aux GLMM

Les modèles linéaires généralisés mixtes (GLMM) sont une extension des modèles linéaires généralisés (GLM) qui prennent en compte une structure supplémentaire dans l’ensemble des données.

Ils suivent des étapes similaires à celles que nous venons de présenter avec les modèles linéaires mixtes (LMM):

  • 1. Ils incorporent les effets aléatoires (comme les LMMs)

  • 2. Permettent de gérer des données non-normales (en laissant les erreurs prendre différentes familles de distribution - e.g Poisson ou binomial négatif) (comme les GLMs; atelier 6)


Comme pour la partie LMM de cet atelier, nous allons travailler sur le matériel GLMM avec un ensemble de données afin de mieux comprendre le fonctionnement des GLMMs et comment les implémenter dans R.

Dans le jeu de données Arabidopsis, l’effet de la disponibilité des nutriments et de l’herbivorie (effets fixes) sur la production de fruits (variable de réponse) d’Arabidopsis thaliana a été évalué en mesurant 625 plantes dans 9 populations différentes, chacune comprenant 2 à 3 génotypes différents (effets aléatoires).

Chargez les données Arabidopsis banta_totalfruits.csv dans R.

dat.tf <- read.csv("data/banta_totalfruits.csv")

# Dans cet ensemble de données, les en-têtes de colonne
# sont définis comme suit: popu: facteur avec un niveau
# pour chaque population gen: facteur avec un niveau pour
# chaque génotype nutrient: facteur avec niveau bas (valeur
# = 1) ou haut (valeur = 8) amd: facteur précisant
# l'absence ou la présence d'herbivorie total.fruits:
# nombre entier indiquant le nombre de fruits par plante