1. Planteamiento del problema:
Tenemos un conjunto de datos de tiempos de permanencia en un sitio web (n=32) y queremos:
a) Calcular el rango.
b) Estimar el número de clases usando el método de Sturges.
c) Definir la amplitud y límites de clase.
d) Construir la tabla de frecuencia agrupada con marca de clase.
Luego, con la tabla, estimar media, mediana, moda, varianza y desviación estándar, e interpretar cada medida.
2. Datos:
$\{2,3,4,4,4,5,6,7,8,8,9,9,10,10,11,12,12,13,13,14,15,16,18,18,19,20,21,22,24,25,27,30\}$
3. a) Calcular el rango:
El rango es la diferencia entre el valor máximo y mínimo:
$$\text{Rango} = \max - \min = 30 - 2 = 28$$
4. b) Estimar número de clases (Sturges):
La fórmula de Sturges es:
$$m = 1 + \log_2(n)$$
Donde $n=32$.
Calculamos:
$$m = 1 + \log_2(32) = 1 + 5 = 6$$
5. c) Definir amplitud y límites:
La amplitud $a$ se calcula como:
$$a = \frac{\text{Rango}}{m} = \frac{28}{6} \approx 4.67$$
Redondeamos a 5 para facilitar.
Límites de clase:
- Clase 1: 2 a 6.99
- Clase 2: 7 a 11.99
- Clase 3: 12 a 16.99
- Clase 4: 17 a 21.99
- Clase 5: 22 a 26.99
- Clase 6: 27 a 31.99
6. d) Tabla de frecuencia agrupada con marca de clase:
Calculamos frecuencia absoluta $f_i$, frecuencia acumulada $F_i$, y marca de clase $x_i$ (punto medio de cada clase).
| Clase | Límites | Marca $x_i$ | Frecuencia $f_i$ | Frecuencia acumulada $F_i$ |
|-------|---------|-------------|------------------|----------------------------|
| 1 | 2-6.99 | $\frac{2+6.99}{2}=4.495$ | 7 (2,3,4,4,4,5,6) | 7 |
| 2 | 7-11.99 | $\frac{7+11.99}{2}=9.495$ | 6 (7,8,8,9,9,10,10,11) 8 datos, pero 11 es límite superior, incluimos 11 | 7+8=15 |
| 3 | 12-16.99| $\frac{12+16.99}{2}=14.495$ | 6 (12,12,13,13,14,15,16) 7 datos, 16 incluido | 15+7=22 |
| 4 | 17-21.99| $\frac{17+21.99}{2}=19.495$ | 5 (18,18,19,20,21) | 22+5=27 |
| 5 | 22-26.99| $\frac{22+26.99}{2}=24.495$ | 3 (22,24,25) | 27+3=30 |
| 6 | 27-31.99| $\frac{27+31.99}{2}=29.495$ | 2 (27,30) | 30+2=32 |
7. Segunda parte: Estimar media, mediana, moda, varianza y desviación estándar usando marcas de clase.
- Media:
$$\bar{x} = \frac{\sum f_i x_i}{n} = \frac{7\times4.495 + 8\times9.495 + 7\times14.495 + 5\times19.495 + 3\times24.495 + 2\times29.495}{32}$$
Calculamos numerador:
$$7\times4.495=31.465,\quad 8\times9.495=75.96,\quad 7\times14.495=101.465,\quad 5\times19.495=97.475,\quad 3\times24.495=73.485,\quad 2\times29.495=58.99$$
Sumamos:
$$31.465 + 75.96 + 101.465 + 97.475 + 73.485 + 58.99 = 438.84$$
Entonces:
$$\bar{x} = \frac{438.84}{32} \approx 13.71$$
- Mediana:
La mediana está en la clase donde la frecuencia acumulada supera $\frac{n}{2} = 16$.
La clase 3 tiene $F_i=22$ que es la primera mayor que 16.
Límites de clase 3: $12$ a $16.99$, frecuencia $f_3=7$, frecuencia acumulada anterior $F_2=15$.
Fórmula mediana:
$$M = L + \left( \frac{\frac{n}{2} - F_{anterior}}{f_i} \right) \times a$$
Donde:
$L=12$, $n=32$, $F_{anterior}=15$, $f_i=7$, $a=5$
Calculamos:
$$M = 12 + \left( \frac{16 - 15}{7} \right) \times 5 = 12 + \frac{1}{7} \times 5 = 12 + 0.714 = 12.71$$
- Moda:
La clase modal es la de mayor frecuencia, que es la clase 2 con $f_2=8$.
Límites clase 2: $7$ a $11.99$, $a=5$.
Frecuencias vecinas: $f_1=7$, $f_3=7$.
Fórmula moda:
$$Mo = L + \left( \frac{f_m - f_{anterior}}{(f_m - f_{anterior}) + (f_m - f_{siguiente})} \right) \times a$$
Calculamos:
$$Mo = 7 + \left( \frac{8 - 7}{(8 - 7) + (8 - 7)} \right) \times 5 = 7 + \frac{1}{2} \times 5 = 7 + 2.5 = 9.5$$
- Varianza y desviación estándar:
Primero calculamos $\sum f_i x_i^2$:
$$7\times4.495^2 = 7\times20.20=141.4$$
$$8\times9.495^2 = 8\times90.17=721.36$$
$$7\times14.495^2 = 7\times210.07=1470.49$$
$$5\times19.495^2 = 5\times380.17=1900.85$$
$$3\times24.495^2 = 3\times599.99=1799.97$$
$$2\times29.495^2 = 2\times869.94=1739.88$$
Sumamos:
$$141.4 + 721.36 + 1470.49 + 1900.85 + 1799.97 + 1739.88 = 7773.95$$
Varianza:
$$s^2 = \frac{\sum f_i x_i^2}{n} - \bar{x}^2 = \frac{7773.95}{32} - 13.71^2 = 242.94 - 188.00 = 54.94$$
Desviación estándar:
$$s = \sqrt{54.94} \approx 7.41$$
8. Interpretación:
- Rango: Indica la dispersión total de los datos.
- Número de clases: Nos ayuda a organizar los datos en intervalos adecuados.
- Media: Valor promedio, centro de los datos.
- Mediana: Valor central que divide los datos en dos partes iguales.
- Moda: Valor más frecuente, indica tendencia central.
- Varianza y desviación estándar: Miden la dispersión o variabilidad de los datos alrededor de la media.
Frecuencia Sturges 83A282
Step-by-step solutions with LaTeX - clean, fast, and student-friendly.