Chapitre 6 L’algèbre matricielle, très brièvement

L’algèbre matricielle est bien adaptée à l’écologie, car la plupart (sinon tous) des ensembles de données avec lesquels nous travaillons sont dans un format matrix.

6.1 Les ensembles de données sont des matrices

Les tableaux de données écologiques sont obtenus sous forme d’observations d’objets ou d’unités d’échantillonnage, et sont souvent enregistrés sous cette forme :

Objets \(y_1\) \(y_2\) \(\dots\) \(y_n\)
\(x_1\) \(y_{1,1}\) \(y_{1,2}\) \(\dots\) \(y_{1,n}\)
\(x_2\) \(y_{2,1}\) \(y_{2,2}\) \(\dots\) \(y_{2,n}\)
\(\vdots\) \(\vdots\) \(\vdots\) \(\ddots\) \(\vdots\)
\(x_m\) \(y_{m,1}\) \(y_{m,2}\) \(\dots\) \(y_{m,n}\)

\(x_m\) est l’unité d’échantillonnage \(m\) ; et \(y_n\) est le descripteur écologique qui peut être, par exemple, les espèces présentes dans une unité d’échantillonnage, une localité ou une variable chimique.

Le même tableau de données écologiques peut être représenté en notation matricielle de la manière suivante :

\[Y = [y_{m,n}] = \begin{bmatrix} y_{1,1} & y_{1,2} & \cdots & y_{1,n} \\ y_{2,1} & y_{2,2} & \cdots & y_{2,n} \\ \vdots & \vdots & \ddots & \vdots \\ y_{m,1} & y_{m,2} & \cdots & y_{m,n} \end{bmatrix}\]

où les lettres minuscules indiquent les éléments, et les lettres en indice indiquent la position de ces éléments dans la matrice (et dans le tableau !).

De plus, tout sous-ensemble d’une matrice peut être reconnu.

Nous pouvons sous-ensembler une matrice de lignes, comme ci-dessous :

\[\begin{bmatrix} y_{1,1} & y_{1,2} & \cdots & y_{1,n} \\ \end{bmatrix}\]

Nous pouvons également sous-ensemble une matrice de colonnes, comme ci-dessous :

\[\begin{bmatrix} y_{1,1} \\ y_{2,2} \\ \vdots \\ y_{m,2} \end{bmatrix}\]

6.2 Matrices d’association

Deux matrices importantes peuvent être dérivées de la matrice des données écologiques : la matrice d’association entre les objets et la matrice d’association entre les descripteurs.

En utilisant les données de notre matrice \(Y\),

\[ Y = \begin{array}{cc} \begin{array}{ccc} x_1 \rightarrow\\ x_2 \rightarrow\\ \vdots \\ x_m \rightarrow\\ \end{array} & \begin{bmatrix} y_{1,1} & y_{1,2} & \cdots & y_{1,n} \\ y_{2,1} & y_{2,2} & \cdots & y_{2,n} \\ \vdots & \vdots & \ddots & \vdots \\ y_{m,1} & y_{m,2} & \cdots & y_{m,n} \end{bmatrix} \end{array} \]

on peut examiner la relation entre les deux premiers objets :

\[x_1 \rightarrow \begin{bmatrix} y_{1,1} & y_{1,2} & \cdots & y_{1,n} \\ \end{bmatrix} \]

\[x_2 \rightarrow \begin{bmatrix} y_{2,1} & y_{2,2} & \cdots & y_{2,n} \\ \end{bmatrix} \]

et obtenir \(a_{1,2}\).

Nous pouvons remplir la matrice d’association \(A_{n,n}\) avec les relations entre tous les objets de \(Y\) :

\[A_{n,n} = \begin{bmatrix} a_{1,1} & a_{1,2} & \cdots & a_{1,n} \\ a_{2,1} & a_{2,2} & \cdots & a_{2,n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{n,1} & a_{n,2} & \cdots & a_{n,n} \end{bmatrix}\]

Parce que \(A_{n,n}\) a le même nombre de lignes et de colonnes, on la désigne comme une matrice carrée.

Donc \(A_{n,n}\) a \(n^2\) éléments.

Par conséquent, \(A_{n,n}\) a \(n^2\) éléments.

Nous pouvons également obtenir la relation entre les deux premiers descripteurs de \(Y\), \(y_1\) et \(y_2\) :

\[\begin{bmatrix} y_{1,2} \\ y_{2,2} \\ \vdots \\ y_{m,2} \end{bmatrix}\]

\[\begin{bmatrix} y_{1,1} \\ y_{2,1} \\ \vdots \\ y_{m,1} \end{bmatrix}\]

et le stocker dans \(a_{1,2}\).

Nous pouvons remplir la matrice d’association \(A_{m,m}\) avec les relations entre tous les descripteurs de \(Y\) :

\[A_{m,m} = \begin{bmatrix} a_{1,1} & a_{1,2} & \cdots & a_{1,m} \\ a_{2,1} & a_{2,2} & \cdots & a_{2,m} \\ \vdots & \vdots & \ddots & \vdots \\ a_{m,1} & a_{m,2} & \cdots & a_{m,m} \end{bmatrix}\]

Cette \(A_{m,m}\) est une matrice carrée, et elle a \(m^2\) éléments.

Ces matrices, (A_{n,n}) et (A_{m,m}), sont à la base des analyses Q-mode et R-mode en écologie.

La R-mode consiste à analyser l’association entre des descripteurs ou des espèces, tandis que la Q-mode analyse l’association entre des OTU, des objets ou des sites.