Datos agrupados

                                                              ¿Qué son los datos agrupados?


Los datos agrupados son un tipo de organización de datos en estadística donde los valores se presentan en intervalos o clases, en lugar de mostrar cada dato individual por separado. Se utilizan principalmente cuando hay muchos datos y es más práctico resumirlos.

 ¿Para qué sirven?

  • Para resumir grandes cantidades de datos.

  • Para hacer tablas de frecuencia, gráficas (como histogramas), y análisis estadístico (como media y desviación estándar).

  • Son útiles cuando los datos son numéricos y extensos.


 Tipos de datos agrupados

  1. Datos agrupados en intervalos (clases) → como en el ejemplo anterior.

  2. Datos agrupados por categorías → cuando los datos no son numéricos, como colores favoritos o tipos de comida. 

                                                                                         Caracteres estadísticos 

 Como primer ejemplo tenemos esta tabla donde podemos apreciar 5 columnas, en la primer columna se encuentra:

El sexo de las personas: es un carácter cualitativo, eso quiere decir que es una característica o atributo de un individuo o elemento que no puede medirse numéricamente, sino que se describe con palabras o categorías. También se le conoce como variable cualitativa o categórica
En la segunda columna podemos encontrar el tipo de contrato: y esto también es una característica cualitativa. 
En la tercer columna tenemos en salario anual: esto es un carácter cuantitativo continuo esto quiere decir que es una característica de un individuo o elemento que puede medirse numéricamente y expresarse mediante cantidades. También se conoce como variable cuantitativa
En la penúltima columna tenemos la experiencia laboral: esto es un característica cuantitativa discreta esto quiere decir que solo puede tomar valores numéricos enteros y específicos, generalmente como resultado de un conteo y no puede tomar valores intermedios entre ellos.
En la ultima columna tenemos meses desde el contrato: esto también es una característica cuantitativa discreta.

    

                                                                  Tabla de frecuencia 




A continuación tenemos una tabla de frecuencia que realice en base a los datos del ejercicio anterior, Una tabla de frecuencia es una herramienta estadística que se utiliza para organizar y resumir un conjunto de datos, mostrando cuántas veces se repite cada valor (o grupo de valores) de una variable. Sirve para analizar la distribución de los datos de manera clara y ordenada.  

                               ¿Cómo se construye una tabla de frecuencia?

1. Recolectar los datos

Reunir todos los valores observados de una variable (pueden ser cualitativos o cuantitativos).

2Ordenar los datos

En caso de variables cuantitativas, se ordenan de menor a mayor. Si hay muchos valores distintos, se pueden agrupar en intervalos (especialmente con variables continuas).

3. Contar las repeticiones (frecuencias absolutas)

Se cuenta cuántas veces aparece cada valor o intervalo.

                                                                        Explicación de cada columna:

Valor o clase: Es el valor individual o el intervalo (si se agrupa).

Frecuencia absoluta (f): Número de veces que aparece un valor o intervalo en el conjunto de datos.

Ejemplo: si el número 5 aparece 3 veces, entonces f = 3.

Frecuencia acumulada (F): Suma progresiva de las frecuencias absolutas. Indica cuántos datos son menores o iguales a un cierto valor.

Ejemplo: si los valores 3, 4, y 5 tienen frecuencias 2, 4 y 3 respectivamente, la frecuencia acumulada de 5 es 2 + 4 + 3 = 9.

Frecuencia relativa (fr): Proporción o porcentaje que representa cada valor respecto al total.

Fórmula:

fr=fTotal de datos 


Frecuencia relativa acumulada (Fr): Suma acumulada de las frecuencias relativas.

Es útil para ver en qué punto se alcanza cierto porcentaje del total.​

Es el valor más pequeño que puede tomar un intervalo o clase. 

Ejemplo:

En el intervalo 10 – 20, el límite inferior es 10.

Limite  superior: Es el valor más grande que puede tomar un intervalo o clase. 

Ejemplo

En el intervalo 10 – 20, el límite superior es 20.

Marca de clase: La marca de clase es un valor representativo del intervalo. Se calcula como el promedio (media) del límite inferior y el límite superior de cada clase.  

 Fórmula:

Marca de clase (MC)=Lıˊmite inferior+Lıˊmite superior2\text{Marca de clase (MC)} = \frac{\text{Límite inferior} + \text{Límite superior}}{2}

Ejemplo:

Para el intervalo 10–20:








Comentarios

Entradas populares de este blog