next up previous
Next: Premier exemple

Outils pour l'ingénieur - TD 5
Analyse en composante principale

Michel Bercovier - Olivier Ricou

L'analyse en composante principale permet d'extraire d'un échantillonnage de donnée les tendances principales. Plusieurs cas peuvent être envisagés : reconstitution d'une photo satellite à partir d'images prise à différentes fréquences, analyse chimique ou physique d'un produit en fonction de différents tests, étude des caractéristiques d'une population...

Dans tout ces cas, on travaille sur un ensemble de données, où pour chaque élément, on a différentes valeurs. On stocke sous forme de matrice ces données, avec dans chaque colonne les valeurs de l'éléments correspondant à la colonne. Par exemple, pour chaque individu d'une population, on a sa taille et son poids ce qui donne :

\begin{displaymath}
\left[
\begin{array}
{cccc}
t_1 & t_2 & \cdots & t_N \\ p_1 ...
 ...\begin{array}
{cccc}
X_1 & X_2 & \cdots & X_N\end{array}\right]\end{displaymath}

Si on appelle M la valeur moyenne, l'écart entre un point Xk et M est $\hat X_k = X_k - M$. On défini la matrice de covariance S par

\begin{displaymath}
S = \frac{1}{N-1}B\, B^T\end{displaymath}

$B=[\hat X_1, \hat X_2, \cdots, \hat X_N]$.

L'analyse en composante principale consiste à extraire de l'ensemble des caractéristiques une caractéristique principale. Dans le cas de photos prises à différentes fréquences, la caractéristique principale est l'objet photographié. Une analyse en composante principale peut permettre de mieux retrouver cet objet en combinant les différentes photos avec des poids variant suivant les photos prises. On aura ainsi, par exemple, que la couleur des points de l'image <<parfaite>> doit être ci = 0.54 ph1i + 0.63 ph2i + 0.56 ph3i avec phKi la couleur de ce même point sur la photo K.

Pour choisir les coefficients de la combinaison linéaire ci-dessus, on choisit le vecteur propre correspondant à la valeur propre la plus importante de la matrice de covariance.

Dans l'exemple de la photo, la matrice de covariance est

\begin{displaymath}
S_{photo} = 
\left[
\begin{array}
{ccc}
2382.78 & 2611.84 & ...
 ....47 & 2553.90 \\ 2136.20 & 2553.90 & 2650.71\end{array}\right].\end{displaymath}

Les valeurs propres de cette matrice sont $7614.24, \, 427.63, \, 98.1$ et le vecteur propre correspondant à la plus élevée est $v_1 = [ 0.54, \, 0.63, \, 0.56]$. On retrouve les coefficients de la combinaison linéaire.



 
next up previous
Next: Premier exemple
Olivier Ricou
9/29/1997