Logo Studenta

Resumen de formulas estadística

¡Estudia con miles de materiales!

Vista previa del material en texto

RESUMEN DE FÓRMULAS DE ESTADÍSTICA I 
Estadística descriptiva y tratamiento de datos: 
 Caso de elementos discretos 
Tabla de frecuencias: 
a. Frecuencia absoluta: es el número de veces que se repite un elemento, se representa 
como 𝑓𝑖. 
b. Frecuencia acumulada: es el número de elementos que se encuentran por detrás y en él, 
se representa como 𝐹𝑖. 
c. Frecuencia absoluta relativa: es el número de veces que se repite un elemento, dividido en 
el número total de datos. Se representa como 𝑓𝑟 . 
d. Frecuencia acumulada relativa: es el número de elementos que se encuentran por detrás y 
en él, dividido en el número total de datos. Se representa como 𝐹𝑟 . 
Gráficos: 
Grafico de barras: en él se grafican líneas o columnas, en las cuales el eje horizontal contiene a los 
elementos (𝑥𝑖) y el eje vertical a la frecuencia absoluta o la frecuencia absoluta relativa. 
 
Medidas de posición central 
Media: 
�̅� =
∑ 𝑥𝑖 ∙ 𝑓𝑖
𝑛
 
Mediana: 
- Cuando haya un número impar de valores, la mediana será justo el valor central. 
𝑀𝑒 = 𝑥𝑛
2
 
 
- Cuando haya un número par de valores, la mediana será la media de los dos valores 
centrales de la variable. Del mismo modo que en el caso anterior: 
𝑀𝑒 =
𝑥𝑛
2
+ 𝑥
(
𝑛
2
+1)
2
 
Moda 
Es el valor de la variable que más veces se repite, es decir, el valor que tiene mayor frecuencia 
absoluta. En las distribuciones sin agrupar, la obtención de la moda es inmediata, solo debemos 
encontrar el elemento x con mayor frecuencia absoluta. 
Medidas de dispersión 
Varianza 
𝑆2 =
(𝑥𝑖 − �̅�)2 ∙ 𝑓𝑖 
𝑛
 
Desviación estándar 
𝑆 = √
(𝑥𝑖 − �̅�)2 ∙ 𝑓𝑖 
𝑛
 
Coeficiente de variación 
𝐶𝑉 =
𝑆
�̅�
 
 Caso de agrupación por intervalos 
Armado de intervalos: 
a. Rango: el recorrido comprendido entre el valor mínimo y el valor máximo se denominada 
rango, se representa con una 𝑅. 
b. Número de intervalos: se representa como 𝑘 y se debe calcular conociendo 𝑛, luego de 
ello si nos da como resultado un número decimal, siempre se redondea a un número 
impar. 
𝑘 = 1 + 3,3 ∙ log(𝑛) 
c. Amplitud de intervalo: La amplitud de intervalo nos indica el ancho de un intervalo, esta 
se representa con 𝑤, y se calcula como: 
𝑤 = 𝑅/𝑘 
d. Amplitud ampliada: la amplitud nos da un número decimal, para corregir eso se elige un 
numero entre el valor de la amplitud y entre la amplitud aumentada un 10%, que seria 
1,1𝑤. La amplitud ampliada se representa como 𝑤𝑎. 
𝑤 ≤ 𝑤𝑎 ≤ 1,1𝑤 
e. Rango ampliado: el rango ampliado (𝑅𝑎) es nuestro nuevo rango, a lo cual este se calcula 
como: 
𝑅𝑎 = 𝑘 ∙ 𝑤𝑎 
f. Modificación del rango y selección de nuevo valor mínimo: como el rango ampliado 
muchas veces es mayor que el rango de origen, se procede a calcular la diferencia de 
rangos “𝑑”, que se calcula como: 
𝑑 = 𝑅𝑎 − 𝑅 
Con ello ahora el nuevo valor mínimo donde van a comenzar nuestros intervalos se calcula como: 
𝑉𝑚í𝑛,𝑁𝑢𝑒𝑣𝑜 = 𝑉𝑚í𝑛 − 𝑑/2 
g. Construcción de intervalos: Ahora a este nuevo valor mínimo vamos a comenzar a 
sumarle la amplitud ampliada, y así obtenemos los valores limites de cada intervalo. 
Tabla de frecuencias: 
a. Intervalos: los intervalos están formados por un límite inferior y un límite superior, a lo 
cual dentro de estos límites se encuentran múltiples números. 
b. Frecuencia absoluta: es el número de veces que se repite un elemento o el número de 
elementos que están dentro de un intervalo, se representa como 𝑓𝑖 . 
c. Frecuencia acumulada: es el número de elementos que se encuentran por detrás del 
límite superior de un intervalo, se representa como 𝐹𝑖. 
d. Frecuencia absoluta relativa: es el número de veces que se repite un elemento o el 
número de elementos que están dentro de un intervalo, dividido en el número total de 
datos. Se representa como 𝑓𝑟 . 
e. Frecuencia acumulada relativa: es el número de elementos que se encuentran por detrás 
del límite superior de un intervalo, dividido en el número total de datos. Se representa 
como 𝐹𝑟 . 
f. Marca de clase: es un valor que representa cada intervalo, se calcula como límite superior 
más límite inferior, todo esto dividido en dos, se representa como 𝑚𝑖 o 𝑚𝑐𝑖. 
𝑚𝑖 =
𝐿𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 + 𝐿𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟
2
 
g. 
Gráficos: 
Histograma: en él se grafican columnas unidas unas a otras, en las cuales el eje horizontal 
contiene a las marcas de clase (𝑚𝑖) en el medio de las columnas y el eje vertical a la frecuencia 
absoluta o la frecuencia absoluta relativa de cada intervalo. 
Ojiva: en él se grafican líneas que se unen unas a otras, en las cuales el eje horizontal contiene a 
los limites de los intervalos y el eje vertical a la frecuencia acumulada o la frecuencia acumulada 
relativa, donde la grafica de cada intervalo comienza en el valor acumulado anterior, y termina en 
el valor acumulado que le corresponde. 
Medidas de posición central 
Media: 
�̅� =
∑ 𝑚𝑖 ∙ 𝑓𝑖
𝑛
 
Mediana: 
Se busca el intervalo que acumule el 50% de los datos (esto se observa en la frecuencia acumulada 
relativa), a lo cual la marca de clase de ese intervalo será nuestra mediana. 
Moda 
En los supuestos que la distribución venga dada en intervalos, se busca el intervalo con la mayor 
frecuencia absoluta, y por ende como no podemos elegir un intervalo como moda, vamos a utilizar 
su marca de clase (𝑚𝑖) correspondiente como moda. 
Medidas de dispersión 
Varianza 
𝑆2 =
(𝑚𝑖 − �̅�)2 ∙ 𝑓𝑖 
𝑛
 
Desviación estándar 
𝑆 = √
(𝑚𝑖 − �̅�)2 ∙ 𝑓𝑖 
𝑛
 
Coeficiente de variación 
𝐶𝑉 =
𝑆
�̅�
 
Probabilidad 
Probabilidad simple: 
𝑝(𝑠𝑢𝑐𝑒𝑠𝑜) =
𝐶𝑎𝑠𝑜𝑠 𝑓𝑎𝑣𝑜𝑟𝑎𝑏𝑙𝑒𝑠
𝑐𝑎𝑠𝑜𝑠 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑠
 
Probabilidades marginales, conjuntas y condicionales 
Probabilidad marginal: probabilidad de que un evento característico suceda: 𝑃(𝐴) 
Probabilidad conjunta: probabilidad que sucedan dos elementos en simultáneo: 𝑃(𝐴𝑦𝐵) 
Probabilidad condicional: probabilidad que aparezca un suceso, dado que otro ya sucedió: 
𝑃(𝐴/𝐵) 
Tipos de eventos 
Eventos mutuamentes excluyentes: son aquellos que no tienen elementos en común, por lo tanto 
𝑃(𝐴𝑦𝐵) = 0 
Eventos independientes: son aquellos que dependen de la ocurrencia de uno u otro, la prueba de 
independencia es la siguiente: 
𝑃(𝐴𝑦𝐵) = 𝑃(𝐴) ∙ 𝑃(𝐵) 
Si no se cumple son elementos dependientes. 
Operaciones con probabilidades: 
Unión: cuando decimos que suceda un evento o que también suceda otro, hablamos de una 
unión: 
𝑃(𝐴𝑜𝐵) = 𝑃(𝐴) + 𝑃(𝐵) − 𝑃(𝐴𝑦𝐵) 
Condicionalidad: si calculamos una probabilidad condicional esta depende si son dependientes o 
independientes, a lo cual: 
Si son dependientes: 
𝑃(𝐴/𝐵) =
𝑃(𝐴𝑦𝐵)
𝑃(𝐵)
 
Si son independientes: 
𝑃(𝐴/𝐵) = 𝑃(𝐴) 
Complemento: se dice que el complemento es buscar lo que tiene relación con un evento, por 
ejemplo, el evento A, su complemento es todo lo que no es A, se representa como 𝐴𝐶 . 
𝑃(𝐴𝐶) = 1 − 𝑃(𝐴)

Continuar navegando