Logo Studenta

estadistica-basica-1

¡Este material tiene más páginas!

Vista previa del material en texto

ESTADÍSTICA DESCRIPTIVA 
 
 1
OBJETIVOS: 
1. Definir conceptos importantes de la Estadística 
2. Definir e Identificar tablas de frecuencias simple y con intervalos. 
3. Construir tablas de frecuencias simple y con intervalos. 
4. Interpretar las tablas simple y con intervalos. 
TEMÁTICA: 
UNIDAD I: ESTADÍSTICA DESCRIPTIVA 
1.1. Introducción a la ciencia estadística. (Conceptos básicos y definiciones). 
1.2. Distribuciones de frecuencias. 
1.3. Métodos gráficos. 
1.4. Medidas de posición. (La moda, La media Aritmética, La Mediana, Los 
 Percentiles, Los cuarteles, Los Deciles) 
 1.5. Medidas de dispersión. 
 1.6. Descripción conjunta de dos variables. (Distribuciones de frecuencias 
 bivariantes, Distribución conjunta, Distribuciones marginales, Diagrama de 
 dispersión) 
 1.7. Análisis de Correlación y Análisis de Regresión 
 
 
 
ESTADÍSTICA DESCRIPTIVA 
 
 2
CONTENIDOS 
1.1. Introducción a la ciencia estadística: 
El término estadística tiene su raíz en la palabra Estado, pero además nace como una función 
matemática asociadas a datos. La importancia radica en la cuantificación para su uso con fines 
económicos o militares o gubernamentales. 
La estadística es una ciencia y la encontramos presente en muchas disciplinas se puede decir 
que se encuentra en la totalidad del resto de ciencias. La razón es clara: por una parte la estadística 
proporciona técnicas precisas para obtener información, (recogida y descripción de datos) y por otra 
parte proporciona métodos para el análisis de esta información. 
 
La estadística de divide en: 
1. Estadística Descriptiva: Basada en una muestra de datos (recogida según una técnica 
concreta), y obtener la descripción de las características más importantes, entendiendo como 
características, aquellas cantidades que nos proporcionen información sobre el tema de interés del 
cual hacemos el estudio. 
 
2. Estadística Inferencial: Conjunto de técnicas y métodos basado en los datos obtenidos a 
partir de una muestra y así poder inferir a través de estimadores las característica de una población.
 
 
 
 
 
ESTADÍSTICA DESCRIPTIVA 
 
 3
Conceptos básicos. 
 
Población: Es el conjunto de elementos, individuos o entes sujetos a estudio y de los cuales 
queremos obtener un resultado. 
 
Variable: Es la característica que estamos midiendo. 
Existen dos categorías o tipo de variables: 
 
1. Variable cualitativa: Es aquella que expresa un atributo o característica, ejemplo: Rubio, 
moreno, etc. 
 
2. Variable cuantitativa: Es aquella que podemos expresar numéricamente: edad, peso, nº. de 
hijos, etc. A su vez la podemos subdividir en: 
 
2.1. Variable discreta, aquella que entre dos valores próximos puede tomar a lo 
sumo un número finito de valores. Ejemplos: el número de hijos de una familia, el de 
obreros de una fabrica, el de alumnos de la universidad, etc. 
 
2.2. Variable continua la que puede tomar los infinitos valores de un intervalo. En 
muchas ocasiones la diferencia es más teórica que práctica, ya que los aparatos de 
medida dificultan que puedan existir todos los valores del intervalo. Ejemplos, peso, 
estatura, distancias, etc. 
ESTADÍSTICA DESCRIPTIVA 
 
 4
 
La variable se denota por una letra mayúsculas X . A su vez cada una de estas variables puede 
tomar distintos valores, colocando un subíndice ki xxxx ,...,,...,, 21 
 
 
 
 
 
 
3. Muestra: Conjunto de elementos que forman parte de población. La muestra representa a esta 
población. 
 
4. Tamaño muestral: Es el número total de elementos que conforman la muestra. Se denota por n. 
 
5. Dato: Cada uno de los individuos, cosas, entes abstractos que integran una población o universo 
determinado. Dicho de otra forma, cada valor observado de la variable. 
 
 
 
 
Variables 
Cualitativas Cuantitativas 
 Discretas Continuas 
ESTADÍSTICA DESCRIPTIVA 
 
 5
Distribuciones de frecuencias. 
Frecuencia absoluta: Llamaremos así al número de veces que se presenta una observación. Se 
representa por if . 
Frecuencia relativa: Es la frecuencia absoluta dividida por el número total de datos (n), se suele 
expresar en tanto por uno, siendo su valor i-ésimo. 
 n
fh ii = 
La suma de todas las frecuencias relativas, siempre debe ser igual a la unidad. 
Frecuencia absoluta acumulada: es la suma acumulada de los distintos valores de la frecuencia 
absoluta. La última frecuencia absoluta acumulada es igual al tamaño de la muestra n 
1 1
2 1 2
1 2 1
 
 
 . . . . . . p p p
F f
F f f
F f f f f n−
=
= +
= + + + + =
 
 Frecuencia relativa acumulada: es el resultado de dividir cada frecuencia absoluta acumulada por 
el número total de datos, se la suele representar con la notación: iH , o puede ser definido a partir de 
la frecuencia relativa, como la suma de los distintos valores de la frecuencia relativa, tomando como 
referencia un individuo dado. La última frecuencia relativa acumulada es igual a la unidad. 
 
ESTADÍSTICA DESCRIPTIVA 
 
 6
a) Tabla de frecuencia simple: Variables discretas 
 
X if iF ih iH 
1x 1f 1 1F f= 1
1
fh
n
= 1 1H h= 
2x 2f 2 1 2F f f= + 2
2
fh
n
= 2 1 2H h h= + 
3x 3f 3 1 2 3F f f f= + + 3
3
fh
n
= 2 1 2 3H h h h= + + 
 : : : 
ix if 1 2 ..i iF f f f= + + + i
i
fh
n
= 1 2 ...i iH h h h= + + + 
 : : : 
px pf 1 2p pF f f f n= + +…+ = p
p
f
h
n
= 1 2
... 1p pH h h h= + + + = 
 
 if n=∑ 1ih =∑
 
 
 
 
 
 
 
 
 
ESTADÍSTICA DESCRIPTIVA 
 
 7
Ejemplos: 
1) En cierta comuna del país se desea investigar que pasa con el número medio de hijos por familia 
y compararlo con el obtenido en la década anterior. Para ello ha encuestado a 50 familias respecto al 
número de hijos, y ha obtenido los siguientes datos: 
 
2 4 2 3 1 2 4 2 3 0 2 2 2 3 2 6 2 3 2 2 3 2 3 3 4 
3 3 4 5 2 0 3 2 1 2 3 2 2 3 1 4 2 3 2 4 3 3 2 2 1 
Se pide: 
 
a) ¿Cuál es la población objeto de estudio? 
b) ¿Cuál es el tamaño de la muestra? 
c) ¿Qué variable estamos estudiando? 
d) ¿Qué tipo de variable es? 
e) Construir la tabla de frecuencias? 
f) ¿Cuál es el número de familias que tiene como máximo 2 hijos? 
g) ¿Cuántas familias tienen más de 1 hijo, pero como máximo 3? 
h) ¿Qué porcentaje de familias tiene más de 3 hijos? 
 
 
 
ESTADÍSTICA DESCRIPTIVA 
 
 8
Solución: 
a) La población objeto de estudio es el conjunto de familias de un determinado país. 
b) El tamaño es el correspondiente a la cantidad de familias encuestadas: 50 familias 
c) La variable que estamos estudiando es el número de hijos por familia 
d) El tipo de variable es discreta ya que el número de hijos solo puede tomar determinados 
valores enteros (es imposible tener medio o un cuarto de hijo). 
e) Para construir la tabla de frecuencias tenemos que ver cuantas familias tienen un determinado 
número de hijos. Podemos ver que el número de hijos, toma los valores existentes entre 0 
hijos, los que menos y 6 hijos, los que más y tendremos: 
 
Xi fi Fi hi Hi 
0 2 2 0.04 0.04 
1 4 6 0.08 0.12 
2 21 27 0.42 0.54 
3 15 42 0.30 0.84 
4 6 48 0.12 0.96 
5 1 49 0.02 0.98 
6 1 50 0.024 1 
 n = 50 1 
f) El número de familias que tienen dos o menos hijos es: 2+4+21 = 27 
g) El número de familias que tienen más de un hijo pero tres como máximo es: 21 + 15 = 36 
h) Por último el porcentaje de familias que tiene más de tres hijos, son aquellos que tienen 4; 5 y 6 es 
decir 6+1+1= 8. El porcentaje será el tanto por uno multiplicado por cien es decir, la frecuencia 
relativa de dichos valores multiplicado por 100: ( 0.12+0.02+0.02)* 100 = 0,16 + 100 = 16 % 
 
ESTADÍSTICA DESCRIPTIVA 
 
 9
b) Tabla de frecuencias con intervalos: para variable continua: recorrido, intervalo, amplitud, 
marca de clase, densidad de frecuencia. 
Cuando nos encontramos con una distribución con un gran número de variables,se suelen 
agrupar en intervalos para facilitar la comprensión de los datos. Esta práctica tiene en cambio un 
inconveniente: se pierde información sobre la propia distribución. 
El proceso utilizado es el siguiente: 
1. Se obtiene la cantidad de intervalos a través de fórmula de Sturges: 
( )( )Cantidad intervalo 1 3,3logci parte entera n= = + 
2. La amplitud del intervalo 
 – 
 mayor menor
x x
a
ci
= 
donde a – mayor menorx x se le denomina el recorrido. 
3. Se comienza la tabla con el intervalo con [L1 , L2) tal que L1= xmenor y L2 = xmenor + a 
En general se sigue con [Li , Li+1) donde Li al extremo inferior del intervalo y Li+1 al extremo 
superior. Cerramos el intervalo por la izquierda y abrimos por la derecha. El último intervalo será 
[Ln-1 , Ln] . 
4. Se debe incorporar a esta tabla la marca de clase, el punto medio de un intervalo. Para calcularla 
podemos definirla como la semisuma de los valores extremos del intervalo, esto es sumar los 
extremos, y dividir entre 2, se escribe y calcula como: 1 ’
2
i iL Lx ++= . 
 
ESTADÍSTICA DESCRIPTIVA 
 
 10
Ejemplo: 
1) Se desea estudiar el precio por habitación de una serie de hoteles de veraneo de la quinta región, 
para eso el experto estudia los precios por habitación de 40 hoteles de la misma categoría de esa 
ciudad. Los datos obtenidos en miles de pesos fueron 
 
3,9 4,7 3,7 5,6 4,3 4,9 5,0 6,1 5,1 4,5 
5,3 3,9 4,3 5,0 6,0 4,7 5,1 4,2 4,4 5,8 
3,3 4,3 4,1 5,8 4,4 4,8 6,1 4,3 5,3 4,5 
4,0 5,4 3,9 4,7 3,3 4,5 4,7 4,2 4,5 4,8 
 
Se pide: 
a) ¿Cuál es la población objeto de estudio? 
b) ¿Qué variable estamos estudiando? 
c) ¿Qué tipo de variable es? 
d) ¿Qué problema plantea la construcción de la tabla de frecuencias? 
e) ¿Cuánto hoteles tienen un precio entre 3,25 y 3,75? 
f) ¿Cuánto hoteles tienen un precio superior a 4,75? 
g) ¿Qué porcentaje de hoteles cuestan como mucho 4,25? 
h) ¿Cuál es el tamaño de la muestra? 
 
ESTADÍSTICA DESCRIPTIVA 
 
 11
Solución 
a) La población objeto de estudio son los hoteles de una ciudad. 
b) La variable que estamos estudiando es el precio. 
c) El tipo de variable es continua. 
d) El problema que plantea es que existen muchos valores diferentes para por tanto es bueno 
agrupar la serie en intervalos. 
1. ci = parte entera (1+3,3log(40))= 6,28 ≈6 intervalos 
2. 
 – 6,1 – 3,3 0, 46
6
mayor menorx xa
ci
= = =
 
3. 
[Li-1,, Li) fi Fi hi Hi 
[3,3 ; 3,767) 3 3 0.075 0.075 
[3,767 ; 4,234) 8 11 0.2 0.275 
[4,234 ; 4,701) 14 25 0.35 0.625 
[4,701 ; 5,168) 6 31 0.15 0.775 
[5,168 ; 5,635) 4 35 0.1 0.875 
[5,635 ; 6,102) 5 40 0.125 1 
 n= 40 1 
e) 3 
f) 15 
g) %=F2*100=0.275*100=27.5 
h) El tamaño de la muestra es 40 hoteles 
 
ESTADÍSTICA DESCRIPTIVA 
 
 12
Ejercicios: 
1) Responda V: verdadero o F: falso según corresponda 
____ El tamaño de la muestra se obtiene sumando todas frecuencias absolutas 
____ La frecuencia absoluta acumulada F4 = f1 + f2 + f3 + f4 
____ La población es parte de la muestra 
____ La marca de clase se utiliza en todas las tablas de frecuencias 
____ Las variables discreta pueden ser numeradas 
____ Estadística descriptiva describe los que acontece en una muestra 
____ La cantidad de intervalo será parte entera (1+3,3log(n)) con n tamaño de la muestra 
____ La ultima frecuencia absoluta acumulada debe ser igual al tamaño de la muestra 
____ La variables son cuantitativas y cualitativas 
____ Si frecuencia absoluta es 4 indica que el dato se repite cuatro veces en el muestra 
____ La frecuencia relativa acumulada H4 = (f1 + f2 + f3 + f4)/4 
____ La muestra es un subconjunto de la población 
____ La sumas de todas las frecuencia relativas acumuladas debes dar el tamaño de la muestra 
____ La frecuencia relativa se obtienes dividiendo su frecuencia absoluta el tamaño de la muestra 
____ Datos no es lo mismo que variables

Continuar navegando