Chapitre 9 GLM binomial avec des proportions

Parfois, les données de proportions sont plus similaires à une régression logistique que ce que vous pensez…

En comptes discrets, nous pouvons, par exemple, mesurer le nombre de présences d’individus par rapport au nombre total de populations échantillonnées.

Nous obtiendrons ainsi un nombre proportionnel de “succès” dans l’observation des individus en divisant les comptes par les comptes totaux.

Dans glm(), nous devons fournir des poids a priori si la variable de réponse est la proportion de succès.

Les proportions peuvent être codées en fournissant le nombre de succès et des poids a priori dans la fonction:

prop.reg <- glm(cbind(Galumna, totalabund - Galumna) ~ Topo +
    WatrCont, data = mites, family = binomial)
summary(prop.reg)
## 
## Call:
## glm(formula = cbind(Galumna, totalabund - Galumna) ~ Topo + WatrCont, 
##     family = binomial, data = mites)
## 
## Deviance Residuals: 
##     Min       1Q   Median       3Q      Max  
## -1.4808  -0.9699  -0.6327  -0.1798   4.1688  
## 
## Coefficients:
##              Estimate Std. Error z value Pr(>|z|)    
## (Intercept) -3.288925   0.422109  -7.792 6.61e-15 ***
## TopoHummock  0.578332   0.274928   2.104   0.0354 *  
## WatrCont    -0.005886   0.001086  -5.420 5.97e-08 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 140.702  on 69  degrees of freedom
## Residual deviance:  85.905  on 67  degrees of freedom
## AIC: 158.66
## 
## Number of Fisher Scoring iterations: 5

Les poids peuvent aussi être spécifiés dans glm():

prop.reg2 <- glm(prop ~ Topo + WatrCont, data = mites, family = binomial,
    weights = totalabund)
summary(prop.reg2)
## 
## Call:
## glm(formula = prop ~ Topo + WatrCont, family = binomial, data = mites, 
##     weights = totalabund)
## 
## Deviance Residuals: 
##     Min       1Q   Median       3Q      Max  
## -1.4808  -0.9699  -0.6327  -0.1798   4.1688  
## 
## Coefficients:
##              Estimate Std. Error z value Pr(>|z|)    
## (Intercept) -3.288925   0.422109  -7.792 6.61e-15 ***
## TopoHummock  0.578332   0.274928   2.104   0.0354 *  
## WatrCont    -0.005886   0.001086  -5.420 5.97e-08 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 140.702  on 69  degrees of freedom
## Residual deviance:  85.905  on 67  degrees of freedom
## AIC: 158.66
## 
## Number of Fisher Scoring iterations: 5