Subjects statistiques

Dendrogramme Ward 22D11D

Step-by-step solutions with LaTeX - clean, fast, and student-friendly.

Use the AI math solver

1. **Énoncé du problème** : Nous avons 4 individus A, B, C, D décrits par deux variables X1 et X2. Nous devons construire deux dendrogrammes (lien maximum et Ward), puis calculer l'inertie intra-classe et totale pour la partition en deux classes issue du dendrogramme de Ward. 2. **Données** : $$ \begin{array}{c|cc} & X1 & X2 \\ \hline A & 5 & 4 \\ B & 4 & 5 \\ C & 1 & -2 \\ D & 0 & -3 \end{array} $$ 3. **Calcul des distances euclidiennes entre individus** : La distance euclidienne entre deux points $P=(x_1,y_1)$ et $Q=(x_2,y_2)$ est $$d(P,Q) = \sqrt{(x_1 - x_2)^2 + (y_1 - y_2)^2}$$ Calculons toutes les distances : - $d(A,B) = \sqrt{(5-4)^2 + (4-5)^2} = \sqrt{1 + 1} = \sqrt{2} \approx 1.414$ - $d(A,C) = \sqrt{(5-1)^2 + (4+2)^2} = \sqrt{16 + 36} = \sqrt{52} \approx 7.211$ - $d(A,D) = \sqrt{(5-0)^2 + (4+3)^2} = \sqrt{25 + 49} = \sqrt{74} \approx 8.602$ - $d(B,C) = \sqrt{(4-1)^2 + (5+2)^2} = \sqrt{9 + 49} = \sqrt{58} \approx 7.616$ - $d(B,D) = \sqrt{(4-0)^2 + (5+3)^2} = \sqrt{16 + 64} = \sqrt{80} \approx 8.944$ - $d(C,D) = \sqrt{(1-0)^2 + (-2+3)^2} = \sqrt{1 + 1} = \sqrt{2} \approx 1.414$ 4. **Dendrogramme du lien maximum (complete linkage)** : - Étape 1 : Fusionner les points les plus proches : $A$ et $B$ (distance 1.414), ou $C$ et $D$ (distance 1.414). Choisissons $A$ et $B$. - Étape 2 : Calculer la distance entre le groupe $\{A,B\}$ et les autres points en prenant la distance maximale entre un point du groupe et un point extérieur. - $d(\{A,B\},C) = \max(d(A,C), d(B,C)) = \max(7.211, 7.616) = 7.616$ - $d(\{A,B\},D) = \max(d(A,D), d(B,D)) = \max(8.602, 8.944) = 8.944$ - Étape 3 : Fusionner les points les plus proches restants : $C$ et $D$ (distance 1.414). - Étape 4 : Fusionner les deux groupes $\{A,B\}$ et $\{C,D\}$ avec distance maximale : $$d(\{A,B\}, \{C,D\}) = \max(d(A,C), d(A,D), d(B,C), d(B,D)) = 8.944$$ 5. **Dendrogramme de Ward (pondération 1)** : La méthode de Ward minimise l'inertie intra-classe. La distance entre deux groupes $G$ et $H$ est calculée par la formule : $$d^2(G,H) = \frac{|G||H|}{|G|+|H|} \|\bar{x}_G - \bar{x}_H\|^2$$ avec $\bar{x}_G$ la moyenne des points dans $G$. - Étape 1 : Calcul des distances entre points (déjà calculées). - Étape 2 : Fusion des points les plus proches : $A$ et $B$ (distance 1.414). - Étape 3 : Calcul des centres de gravité : - $\bar{x}_{AB} = \left(\frac{5+4}{2}, \frac{4+5}{2}\right) = (4.5, 4.5)$ - Étape 4 : Calcul des distances entre $\{A,B\}$ et $C$, $D$ : - $d^2(AB,C) = \frac{2 \times 1}{3} \times \| (4.5,4.5) - (1,-2) \|^2$ - Calcul de $\| (4.5,4.5) - (1,-2) \|^2 = (4.5-1)^2 + (4.5+2)^2 = 3.5^2 + 6.5^2 = 12.25 + 42.25 = 54.5$ - Donc $d^2(AB,C) = \frac{2}{3} \times 54.5 = 36.333$ - $d(AB,C) = \sqrt{36.333} \approx 6.03$ - $d^2(AB,D) = \frac{2 \times 1}{3} \times \| (4.5,4.5) - (0,-3) \|^2$ - $\| (4.5,4.5) - (0,-3) \|^2 = 4.5^2 + 7.5^2 = 20.25 + 56.25 = 76.5$ - $d^2(AB,D) = \frac{2}{3} \times 76.5 = 51$ - $d(AB,D) = \sqrt{51} \approx 7.141$ - Étape 5 : Fusionner les points les plus proches restants : $C$ et $D$ (distance 1.414). - Étape 6 : Calcul du centre de gravité $\bar{x}_{CD} = \left(\frac{1+0}{2}, \frac{-2-3}{2}\right) = (0.5, -2.5)$ - Étape 7 : Calcul de la distance entre $\{A,B\}$ et $\{C,D\}$ : - $d^2(AB,CD) = \frac{2 \times 2}{4} \times \| (4.5,4.5) - (0.5,-2.5) \|^2 = 2 \times ((4.5-0.5)^2 + (4.5+2.5)^2) = 2 \times (4^2 + 7^2) = 2 \times (16 + 49) = 2 \times 65 = 130$ - $d(AB,CD) = \sqrt{130} \approx 11.401$ 6. **Inertie intra-classe de la partition en deux classes issue de Ward** : La partition est $\{A,B\}$ et $\{C,D\}$. L'inertie intra-classe est la somme des variances pondérées : $$I_W = \sum_{k} \sum_{i \in G_k} \|x_i - \bar{x}_{G_k}\|^2$$ - Pour $G_1 = \{A,B\}$ : - $\|A - \bar{x}_{AB}\|^2 = (5-4.5)^2 + (4-4.5)^2 = 0.25 + 0.25 = 0.5$ - $\|B - \bar{x}_{AB}\|^2 = (4-4.5)^2 + (5-4.5)^2 = 0.25 + 0.25 = 0.5$ - Somme = 1 - Pour $G_2 = \{C,D\}$ : - $\|C - \bar{x}_{CD}\|^2 = (1-0.5)^2 + (-2+2.5)^2 = 0.25 + 0.25 = 0.5$ - $\|D - \bar{x}_{CD}\|^2 = (0-0.5)^2 + (-3+2.5)^2 = 0.25 + 0.25 = 0.5$ - Somme = 1 Donc $$I_W = 1 + 1 = 2$$ 7. **Inertie totale** : C'est la somme des distances au centre de gravité global. - Centre global : $$\bar{x} = \left(\frac{5+4+1+0}{4}, \frac{4+5-2-3}{4}\right) = \left(\frac{10}{4}, \frac{4}{4}\right) = (2.5, 1)$$ - Calcul des distances au centre : - $\|A - \bar{x}\|^2 = (5-2.5)^2 + (4-1)^2 = 2.5^2 + 3^2 = 6.25 + 9 = 15.25$ - $\|B - \bar{x}\|^2 = (4-2.5)^2 + (5-1)^2 = 1.5^2 + 4^2 = 2.25 + 16 = 18.25$ - $\|C - \bar{x}\|^2 = (1-2.5)^2 + (-2-1)^2 = 1.5^2 + (-3)^2 = 2.25 + 9 = 11.25$ - $\|D - \bar{x}\|^2 = (0-2.5)^2 + (-3-1)^2 = 2.5^2 + (-4)^2 = 6.25 + 16 = 22.5$ - Somme totale : $$I_T = 15.25 + 18.25 + 11.25 + 22.5 = 67.25$$ 8. **Pourcentage d'inertie expliquée par la partition** : $$\text{Pourcentage} = \frac{I_T - I_W}{I_T} \times 100 = \frac{67.25 - 2}{67.25} \times 100 \approx 97.02\%$$ **Réponses finales :** - Dendrogramme lien maximum : fusion $A$-$B$, $C$-$D$, puis $\{A,B\}$-$\{C,D\}$ avec distance 8.944. - Dendrogramme Ward : fusion $A$-$B$, $C$-$D$, puis $\{A,B\}$-$\{C,D\}$ avec distance 11.401. - Inertie intra-classe partition Ward (2 classes) : $2$. - Inertie totale : $67.25$. - Pourcentage d'inertie expliquée : $97.02\%$.