1. **Énoncé du problème** :
Nous avons 4 individus A, B, C, D décrits par deux variables X1 et X2. Nous devons construire deux dendrogrammes (lien maximum et Ward), puis calculer l'inertie intra-classe et totale pour la partition en deux classes issue du dendrogramme de Ward.
2. **Données** :
$$
\begin{array}{c|cc}
& X1 & X2 \\
\hline
A & 5 & 4 \\
B & 4 & 5 \\
C & 1 & -2 \\
D & 0 & -3
\end{array}
$$
3. **Calcul des distances euclidiennes entre individus** :
La distance euclidienne entre deux points $P=(x_1,y_1)$ et $Q=(x_2,y_2)$ est
$$d(P,Q) = \sqrt{(x_1 - x_2)^2 + (y_1 - y_2)^2}$$
Calculons toutes les distances :
- $d(A,B) = \sqrt{(5-4)^2 + (4-5)^2} = \sqrt{1 + 1} = \sqrt{2} \approx 1.414$
- $d(A,C) = \sqrt{(5-1)^2 + (4+2)^2} = \sqrt{16 + 36} = \sqrt{52} \approx 7.211$
- $d(A,D) = \sqrt{(5-0)^2 + (4+3)^2} = \sqrt{25 + 49} = \sqrt{74} \approx 8.602$
- $d(B,C) = \sqrt{(4-1)^2 + (5+2)^2} = \sqrt{9 + 49} = \sqrt{58} \approx 7.616$
- $d(B,D) = \sqrt{(4-0)^2 + (5+3)^2} = \sqrt{16 + 64} = \sqrt{80} \approx 8.944$
- $d(C,D) = \sqrt{(1-0)^2 + (-2+3)^2} = \sqrt{1 + 1} = \sqrt{2} \approx 1.414$
4. **Dendrogramme du lien maximum (complete linkage)** :
- Étape 1 : Fusionner les points les plus proches : $A$ et $B$ (distance 1.414), ou $C$ et $D$ (distance 1.414). Choisissons $A$ et $B$.
- Étape 2 : Calculer la distance entre le groupe $\{A,B\}$ et les autres points en prenant la distance maximale entre un point du groupe et un point extérieur.
- $d(\{A,B\},C) = \max(d(A,C), d(B,C)) = \max(7.211, 7.616) = 7.616$
- $d(\{A,B\},D) = \max(d(A,D), d(B,D)) = \max(8.602, 8.944) = 8.944$
- Étape 3 : Fusionner les points les plus proches restants : $C$ et $D$ (distance 1.414).
- Étape 4 : Fusionner les deux groupes $\{A,B\}$ et $\{C,D\}$ avec distance maximale :
$$d(\{A,B\}, \{C,D\}) = \max(d(A,C), d(A,D), d(B,C), d(B,D)) = 8.944$$
5. **Dendrogramme de Ward (pondération 1)** :
La méthode de Ward minimise l'inertie intra-classe. La distance entre deux groupes $G$ et $H$ est calculée par la formule :
$$d^2(G,H) = \frac{|G||H|}{|G|+|H|} \|\bar{x}_G - \bar{x}_H\|^2$$
avec $\bar{x}_G$ la moyenne des points dans $G$.
- Étape 1 : Calcul des distances entre points (déjà calculées).
- Étape 2 : Fusion des points les plus proches : $A$ et $B$ (distance 1.414).
- Étape 3 : Calcul des centres de gravité :
- $\bar{x}_{AB} = \left(\frac{5+4}{2}, \frac{4+5}{2}\right) = (4.5, 4.5)$
- Étape 4 : Calcul des distances entre $\{A,B\}$ et $C$, $D$ :
- $d^2(AB,C) = \frac{2 \times 1}{3} \times \| (4.5,4.5) - (1,-2) \|^2$
- Calcul de $\| (4.5,4.5) - (1,-2) \|^2 = (4.5-1)^2 + (4.5+2)^2 = 3.5^2 + 6.5^2 = 12.25 + 42.25 = 54.5$
- Donc $d^2(AB,C) = \frac{2}{3} \times 54.5 = 36.333$
- $d(AB,C) = \sqrt{36.333} \approx 6.03$
- $d^2(AB,D) = \frac{2 \times 1}{3} \times \| (4.5,4.5) - (0,-3) \|^2$
- $\| (4.5,4.5) - (0,-3) \|^2 = 4.5^2 + 7.5^2 = 20.25 + 56.25 = 76.5$
- $d^2(AB,D) = \frac{2}{3} \times 76.5 = 51$
- $d(AB,D) = \sqrt{51} \approx 7.141$
- Étape 5 : Fusionner les points les plus proches restants : $C$ et $D$ (distance 1.414).
- Étape 6 : Calcul du centre de gravité $\bar{x}_{CD} = \left(\frac{1+0}{2}, \frac{-2-3}{2}\right) = (0.5, -2.5)$
- Étape 7 : Calcul de la distance entre $\{A,B\}$ et $\{C,D\}$ :
- $d^2(AB,CD) = \frac{2 \times 2}{4} \times \| (4.5,4.5) - (0.5,-2.5) \|^2 = 2 \times ((4.5-0.5)^2 + (4.5+2.5)^2) = 2 \times (4^2 + 7^2) = 2 \times (16 + 49) = 2 \times 65 = 130$
- $d(AB,CD) = \sqrt{130} \approx 11.401$
6. **Inertie intra-classe de la partition en deux classes issue de Ward** :
La partition est $\{A,B\}$ et $\{C,D\}$.
L'inertie intra-classe est la somme des variances pondérées :
$$I_W = \sum_{k} \sum_{i \in G_k} \|x_i - \bar{x}_{G_k}\|^2$$
- Pour $G_1 = \{A,B\}$ :
- $\|A - \bar{x}_{AB}\|^2 = (5-4.5)^2 + (4-4.5)^2 = 0.25 + 0.25 = 0.5$
- $\|B - \bar{x}_{AB}\|^2 = (4-4.5)^2 + (5-4.5)^2 = 0.25 + 0.25 = 0.5$
- Somme = 1
- Pour $G_2 = \{C,D\}$ :
- $\|C - \bar{x}_{CD}\|^2 = (1-0.5)^2 + (-2+2.5)^2 = 0.25 + 0.25 = 0.5$
- $\|D - \bar{x}_{CD}\|^2 = (0-0.5)^2 + (-3+2.5)^2 = 0.25 + 0.25 = 0.5$
- Somme = 1
Donc
$$I_W = 1 + 1 = 2$$
7. **Inertie totale** :
C'est la somme des distances au centre de gravité global.
- Centre global :
$$\bar{x} = \left(\frac{5+4+1+0}{4}, \frac{4+5-2-3}{4}\right) = \left(\frac{10}{4}, \frac{4}{4}\right) = (2.5, 1)$$
- Calcul des distances au centre :
- $\|A - \bar{x}\|^2 = (5-2.5)^2 + (4-1)^2 = 2.5^2 + 3^2 = 6.25 + 9 = 15.25$
- $\|B - \bar{x}\|^2 = (4-2.5)^2 + (5-1)^2 = 1.5^2 + 4^2 = 2.25 + 16 = 18.25$
- $\|C - \bar{x}\|^2 = (1-2.5)^2 + (-2-1)^2 = 1.5^2 + (-3)^2 = 2.25 + 9 = 11.25$
- $\|D - \bar{x}\|^2 = (0-2.5)^2 + (-3-1)^2 = 2.5^2 + (-4)^2 = 6.25 + 16 = 22.5$
- Somme totale :
$$I_T = 15.25 + 18.25 + 11.25 + 22.5 = 67.25$$
8. **Pourcentage d'inertie expliquée par la partition** :
$$\text{Pourcentage} = \frac{I_T - I_W}{I_T} \times 100 = \frac{67.25 - 2}{67.25} \times 100 \approx 97.02\%$$
**Réponses finales :**
- Dendrogramme lien maximum : fusion $A$-$B$, $C$-$D$, puis $\{A,B\}$-$\{C,D\}$ avec distance 8.944.
- Dendrogramme Ward : fusion $A$-$B$, $C$-$D$, puis $\{A,B\}$-$\{C,D\}$ avec distance 11.401.
- Inertie intra-classe partition Ward (2 classes) : $2$.
- Inertie totale : $67.25$.
- Pourcentage d'inertie expliquée : $97.02\%$.
Dendrogramme Ward 22D11D
Step-by-step solutions with LaTeX - clean, fast, and student-friendly.