mercredi 17 février 2016

Excel - Calculs matriciels et méthode des moindres carrés

La méthode des moindres carrés dont la paternité est attribuée conjointement à Carl Friedrich Gauss (1777 - 1855) et à Adrien Marie Legendre (1752 - 1833) reste la méthode la plus couramment utilisée pour l'estimation des paramètres d'un modèle lors de l'analyse des résultats d'un plan de mélange. Par voie de conséquence, cette méthode est souvent la seule qui est évoquée dans les techniques d'analyse de régression utilisée dans les plans d'expériences.

La minimisation de la somme des carrés des écarts entre les valeurs observées et les valeurs restituées par la partie déterministe d'un modèle conduit à générer un système de p équations à p inconnues, p représentant le nombre de paramètres du modèle que l'on souhaite estimer. Les équations de ce système sont parfois appelées les équations normales, notamment dans les techniques d'étalonnage. 

Dans le contexte particulier d'une courbe d'étalonnage matérialisée par une droite avec constante, la démarche consiste à résoudre alors un système de deux équations à deux inconnues ; la méthode de substitution ou la méthode de Cramer permettent très rapidement d'estimer l'ordonnée à l'origine et la pente de la droite. Dès que le modèle devient plus complexe et que le nombre de régresseurs devient plus important, le recours à une approche matricielle devient incontournable pour inverser des matrices carrées de rang p. C'est naturellement le cas dans les plans de mélange y compris en présence d'un mélange binaire qui nous servira ici à illustrer les étapes de la démarche.

Les tableurs informatiques possèdent tous des fonctions matricielles qui vont permettre les transpositions, les produits et les inversions nécessaires à la mise en œuvre de la méthode. Toutes ces opérations nécessitent de sélectionner la zone de résultat préalablement à l'utilisation de la fonction matricielle dont on valide la mise en oeuvre à partir des touches CTRL+SHIFT+ENTREE. Il faut donc prévoir à l'avance la dimension des différentes matrices et des différents vecteurs apparaissant dans la démarche. Des rappels de cours précèdent l'illustration de l'utilisation du tableur Excel.



La démarche présentée à partir d'un mélange binaire et de la forme canonique d'un modèle polynomial de degré 3 est naturellement généralisable à des mélanges présentant un nombre plus important de constituants et/ou à d'autres formes canoniques ou non de modèles linéaires moyennant quelques précautions :

  1. Il faut s'assurer tout d'abord que la somme des proportions des constituants soit constante, de manière à ne pas propager rapidement des erreurs d'arrondi lors des multiplications entre les proportions dans les différentes opérations matricielles.
  2. Les proportions étant représentées par des nombres réels inférieurs ou égaux à 1, le produit de ces proportions devient rapidement petit, en particulier quand on souhaite estimer les paramètres de modèles de degré élevé. Par ailleurs, la contrainte relationnelle implicite traduisant la constance de la somme des proportions implique une quasi-colinéarité entre les colonnes de la matrice du modèle et, tout au moins des corrélations fortes produisant un phénomène qualifié de "ill-conditioned matrix". Tout ceci a pour conséquence de conduire à une valeur de déterminant parfois très faible pour la matrice d'information. La fonction permettant d'inverser une matrice renvoie à un algorithme qui peut présenter des limites en deçà desquelles la fonction renvoie un message d'erreur. L'utilisation d'une transformation en pseudo-constituants permet parfois de contourner le problème, mais le recours à un logiciel reste souvent incontournable. Il est difficile de donner une valeur à cette limite, mais une valeur inférieure à 10-40 ou 10-50 pour le déterminant de la matrice d'information doit inviter l'utilisateur à s'interroger sur l'exactitude des calculs.
  3. Il peut être utile d'installer des "détrompeurs", c'est-à-dire des cellules qui permettent de vérifier des propriétés numériques inhérentes à la méthode des moindres carrés. La moyenne des valeurs de la réponse observée est égale à la moyenne des valeurs de la réponse calculée à partir du modèle et, par voie de conséquence, la moyenne des résidus est nulle. La somme des valeurs sur une ligne de la matrice H est unitaire, tout comme la somme des valeurs dans une colonne pour cette même matrice. La somme des valeurs de la matrice H est donc égale au nombre N de mélanges mis en œuvre. De même, la somme des termes diagonaux de cette matrice est égale au nombre p de paramètres à estimer dans le modèle.

Cette présentation n'a en aucun cas l'ambition de rivaliser avec tel ou tel logiciel, si ce n'est cependant lorsqu'on est confronté à l'étude d'un mélange binaire, cas particulier pour lequel même les meilleurs logiciels restent impuissants ! Excepté ce cas de figure, que l'on rencontre toutefois de temps à autre, le tableur doit être considéré comme un accompagnement pédagogique aidant à mieux comprendre la logique de construction des plans de mélange. L'interactivité d'une feuille de calcul reste inégalée par rapport aux possibilités offertes par un logiciel.

Comme je l'ai indiqué dans le film associé à cet article, en faisant varier les coordonnées des mélanges au sein de la matrice d'expériences, on peut constater immédiatement les conséquences de ces modifications sur des indicateurs algébriques, tels que le déterminant de la matrice d'information, les éléments de la trace de la matrice de dispersion ou encore les leviers, termes diagonaux de la matrice H.

Cet article et ce film représentent un préambule à de futurs chapitres qui parleront des indicateurs algébriques en leur donnant un sens, puis des méthodes de construction de plans optimaux, ces derniers visant à optimiser tel ou tel critère algébrique.

Je vous invite vivement à mettre en oeuvre ce petit exemple afin de découvrir ou de redécouvrir les possibilités d'un tableur que vous utilisez parfois quotidiennement.