Logo Studenta

2-Conceptos Introductorios - Gonzalo Sosa_

¡Estudia con miles de materiales!

Vista previa del material en texto

Estadística y Análisis de Datos 
 
 
1 
CONCEPTOS INTRODUCTORIOS 
 
 
 Definición de ESTADÍSTICA 
 
“Según el diccionario, la Estadística es una ciencia que se ocupa de la: RECOLECCIÓN, CLASIFICACIÓN, 
RESUMEN, ANÁLISIS e INTERPRETACIÓN de hechos o datos numéricos” 
 
 Pero en realidad la Estadística va más allá de este concepto: La Estadística forma parte de la 
matemática aplicada que reúne un conjunto de procedimientos o métodos que nos permite: 
 Analizar las diferencias, variaciones que existen entre las personas, cosas u objetos en miles de 
aspectos. Encontrar un comportamiento “promedio” y generalizarlo. 
 Obtener información de una población grande, sin necesidad de estudiar a todos los individuos o 
elementos que la componen. 
 Tomar decisiones razonables frente a la incertidumbre 
 
 UNIDAD ELEMENTAL, UNIDAD ESTADISTICA o UNIDAD DE OBSERVACIÓN: Todo objeto real, 
convencional o ideal de carácter singular sobre el cual pueden efectuarse observaciones o mediciones: 
un individuo, un objeto que luego de ser observado, medido, nos otorga un dato. 
 
 POBLACION: Es el conjunto de unidades elementales que satisfacen una definición común y de la cual 
se quiere obtener información estadística. Se la debe definir en el tiempo y en el espacio. 
 
Nota: En estadística POBLACIÓN no se refiere necesariamente a un conjunto de personas. 
 
Ejemplo: Supongamos que nuestra población objeto de estudio está compuesta por ustedes. 
 
 
 
La población así definida es distinta a las siguientes poblaciones: 
 Total de alumnos de la asignatura Estadística y Análisis de Datos de la FACENA de la UNNE que 
cursaron la Asignatura en el año 2012. 
 Los alumnos de la carrera de Ing. Eléctrica de la FACENA de la UNNE que están inscriptos en la 
Asignatura “Estadística y Análisis de Datos” en el año 2021. 
 Los 30 de alumnos de la carrera de Ing. Electrónica de la FACENA de la UNNE que cursaron la 
Asignatura “Estadística y Análisis de Datos” en el año 2013. 
 Los 48 canes sometidos a esterilización por la fundación sin fines de lucro (CANES), durante el mes 
de marzo de 2012. 
 Total de tornillos producidos en la fábrica “Tornillitos” de la ciudad de Tortuguitas durante el 
mes de mayo del año 2010. 
 
 
 
 
 
 
 
 
Unidad elemental, de observación o estadística: Un alumno de la 
cátedra de Estadística y Análisis de Datos de la FACENA de la UNNE 
que cursa la Asignatura en el año 2021. 
Población: Total de alumnos de Estadística y Análisis de Datos de la FACENA de la UNNE 
que cursan la Asignatura en el año 2021. 
INFINITAS: Cuando en la práctica no se pueden listar o 
individualizar a todos los elementos que la componen. Es la que 
está compuesta por un número indefinidamente grande de 
unidades elementales 
FINITAS: Cuando todas las unidades elementales que la componen 
pueden ser físicamente listadas o individualizadas 
POBLACIONES 
Estadística y Análisis de Datos 
 
 
2 
POBLACIÓN 
Tamaño: N 
MUESTRA:(Tamaño: n < N) 
Es un subconjunto de la población objeto de 
estudio. Se la debe definir también en el 
tiempo y en el espacio, que debe coincidir con 
el de la población. La principal condición que 
debe cumplir es la de ser representativa de 
la población a la que pertenece. 
(Para determinar su tamaño y para que sea 
representativa, existen métodos estadísticos 
que veremos más adelante) 
 MUESTRA: 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 DISEÑO DEL ESTUDIO: Según la cantidad de unidades elementales que van a ser observadas. 
 
 
 
 
 
 
 
 
 
 
 
FACTORES que se 
deben tener en cuenta 
para decidir si se 
realiza un CENSO o 
un MUESTREO 
COSTO 
TIEMPO 
IMPOSIBILIDAD de acceder a todos los elementos que componen 
la población objeto de estudio. 
(En caso de poblaciones infinitas, sí o sí se trabajan con muestras) 
DESTRUCCIÓN: Existen estudios que para ser desarrollados, 
terminan destruyendo a las unidades elementales, por lo tanto, se 
debe trabajar con muestras. Por ejemplo: Un fabricante de 
lámparas quiere determinar la vida útil de las mismas. 
Todo proceso de recolección de 
datos tiene un costo y demanda un 
tiempo determinado. (Un Muestreo 
es más barato y demanda un tiempo 
menor de recolección de datos que 
un Censo) 
EXACTITUD o 
PRECISIÓN 
Si realizamos un Censo el valor del 
parámetro es exacto, en cambio con un 
Muestreo solo se estima el valor del 
parámetro (contiene error, es estimado, 
aproximado) 
DISEÑO DEL ESTUDIO 
 
CENSO: Cuando se observa a todas las unidades 
elementales que componen la Población objeto de estudio 
MUESTREO o ENCUESTA: Cuando se observa a una parte 
o subconjunto de las unidades elementales que componen 
la Población objeto de estudio (MUESTRA) 
Estadística y Análisis de Datos 
 
 
3 
Población 
N=120 
Diseño del estudio: CENSO 
μ =
 xi
n
i=1
N
 PARÁMETRO: μ : promedio 
ESTADISTICA DESCRIPTIVA: Con el cálculo de μ, ya se tiene la 
información buscada DE TODA la población objeto de estudio. 
INFERENCIA ESTADÍSTICA o ESTADÍSTICA INFERENCIAL: 
Es la parte de la Estadística que se ocupa de los métodos y técnicas usadas para 
hacer generalizaciones, predicciones o estimaciones sobre poblaciones a 
partir de muestras aleatorias. 
ESTADÍSTICA 
 CLASIFICACION GENERAL DE LA ESTADISTICA 
 
La Estadística, de acuerdo a los tipos de procedimientos o metodologías que se aplican, se divide en dos 
grandes ramas: 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 ESTADÍSTICO Y PARÁMETRO 
 
 ESTADÍSTICO: es el resultado de hacer operaciones u observaciones sobre los datos de una 
muestra con el objetivo de obtener una medida descriptiva de ella. Los estadísticos varían de 
muestra a muestra. 
 PARÁMETRO: es el resultado de hacer operaciones u observaciones sobre los datos de una 
población con el objetivo de obtener una medida descriptiva de ella (puede ser calculado con 
todos los datos de la población o estimado partiendo del resultado de un ESTADISTICO). El valor 
de un parámetro es constante para cada población, lo que puede suceder es que sea: conocido o 
desconocido. 
 
Medidas estadísticas (algunas) 
Simbología 
PARÁMETRO ESTADÍSTICO 
General  θ̂ 
Proporción p p̂ 
Media aritmética (promedio) μ X̅ 
 
Ejemplo 1: 
 
POBLACIÓN: Alumnos de la carrera de Ing. Eléctrica de la FACENA de la UNNE que cursan la Asignatura 
“Estadística y Análisis de Datos” en el año 2015. 
UNIDAD ELEMENTAL: Un alumno de la carrera de Ing. Eléctrica de la FACENA de la UNNE que cursa la 
Asignatura “Estadística y Análisis de Datos” en el año 2015. 
DISEÑO DEL ESTUDIO: Censo 
PARÁMETRO DE INTERÉS: Promedio de materias aprobadas de toda la población: μ 
VARIABLE EN ESTUDIO: Cantidad de materias aprobadas por alumno. 
 
 
 
 
 
 
 
 
 
 
 
ESTADISTICA DESCRIPTIVA: 
Los resultados y las conclusiones que se obtienen, no va más allá del conjunto que 
aportó los datos. Por lo tanto, si el diseño del estudio es: 
 CENSO: Con el conjunto de métodos o procedimientos que reúne esta rama 
de la estadística, se obtiene, y se describe a toda la POBLACIÓN, que es 
nuestro objetivo. 
 MUESTREO: Con el conjunto de métodos y procedimientos que reúne esta 
rama de la estadística, sólo se describe a la Muestra, por lo que queda 
pendiente, inconcluso, el conocimiento de la POBLACIÓN, que es nuestro 
objetivo. 
Estadística y Análisis de Datos 
 
 
4 
Ejemplo 2: 
 
POBLACIÓN: Alumnos de la carrera de Ing. Eléctrica de la FACENA de la UNNE que cursan la Asignatura 
“Estadística y Análisis de Datos” en el año 2015. 
MUESTRA: 30 alumnos de la carrera de Ing. Eléctrica de la FACENA de la UNNE que cursan la Asignatura 
“Estadística y Análisis de Datos” en el año 2015. 
UNIDAD ELEMENTAL: Un alumno de la carrera de Ing. Eléctrica de la FACENA de la UNNE que cursa la 
Asignatura “Estadística y Análisis de Datos” en el año 2015. 
DISEÑO DEL ESTUDIO: Muestreo o Encuesta 
PARÁMETRO DE INTERÉS: Promedio de materias aprobadas de toda la población: μ 
ESTADÍSTICO A CALCULAR: Promedio de materias aprobadas por los alumnosque pertenecen a la 
muestra: X̅ 
VARIABLE EN ESTUDIO: Cantidad de materias aprobadas por alumno. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 RESUMIENDO 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
MUESTRA n = 30 
ESTADISTICO: X̅ promedio 
POBLACIÓN 
N=120 
Diseño del estudio: MUESTREO 
 
X̅ =
 xi
n
i=1
n
 
PARÁMETRO: μ ???? 
(Supongamos desconocido) 
ESTADISTICA DESCRIPTIVA: 
Con el cálculo de X̅ sólo 
describimos a la MUESTRA 
X̅ → μ 
ESTADÍSTICA INFERENCIAL 
Con el conocimiento que nos 
aporta una muestra, se aplican 
procedimientos para ESTIMAR o 
INFERIR sobre toda la población. 
DATOS 
(insumos) 
ESTADISTICA 
DESCRIPTIVA 
 Clasificar, ordenar, resumir 
 Calcular medidas descriptivas 
 Presentar (gráficos, tablas, texto) 
 Interpretar 
Muestra? SI NO ESTADISTICA 
INFERENCIAL 
CONCLUSIONES SOBRE TODA 
LA POBLACION 
(Censo) 
Estadística y Análisis de Datos 
 
 
5 
 ERRORES EN ESTADISTICA: La Estadística trabaja con errores de distintos tipos (medición, 
generalización, estimación). Pero tiene la capacidad de “medir” esos errores. 
 
 DEFINICIÓN DEL OBJETIVO DEL ESTUDIO: ¿QUÉ información queremos obtener de un conjunto de 
unidades elementales? 
- Porcentaje de los que fuman 
- Promedio de materias aprobadas 
- Gasto semanal promedio 
- Proporción de varones 
- Proporción de acuerdo al lugar de procedencia 
- Tiempo promedio dedicado al estudio 
- Proporción de los que practican algún deporte 
 
 Para obtener lo anterior, ¿QUÉ OBSERVAMOS? ¿QUÉ MEDIMOS? 
 
 
 VARIABLES 
 
 
 DISEÑO DEL ESTUDIO: De acuerdo a si es observación o experimental. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
CARACTERÍSTICAS 
OBSERVABLES: 
CONSTANTES: La palabra lo dice todo. Sirven para definir a la 
población objeto de estudio. 
VARIABLES 
CUALITATIVAS: Son aquellas variables que vienen expresadas por la presencia 
o no de una cualidad o característica. El dato no es un número. 
Admite una clasificación DICOTOMICA (dos clases) o POLICOTÓMICA (más de 
dos clases) 
CUANTITATIVAS: Son aquellas variables que se expresan por un número, 
como resultado de una medición con instrumento o por conteo. 
Variables cuantitativas DISCRETAS: 
Los resultados de la observación (datos) 
son valores numéricos discretos. 
Variables cuantitativas CONTINUAS: 
Los resultados de la observación (datos) 
admiten cualquier valor real (ℝ). 
DISEÑO DEL ESTUDIO: 
 
DE OBSERVACIÓN: Cuando solamente se observa y se mide, 
sin manipular o modificar ciertos estados de las unidades 
elementales. 
Por ejemplo, considere un estudio diseñado para determinar 
la influencia de la temperatura ambiental sobre la energía 
eléctrica que consumen las instalaciones de una planta 
química. Es evidente que los niveles de la temperatura 
ambiental no se pueden controlar, por lo tanto, la única 
manera en que se puede supervisar la estructura de los datos 
es a partir de los datos de la planta a través del tiempo. 
EXPERIMENTAL: Cuando se manipula o modifica ciertos 
estados de las unidades elementales para medir la variable 
en estudio. Por ejemplo, si el objetivo del estudio consiste en 
determinar la eficacia de una nueva droga para la 
hipertensión. 
A un grupo de personas se los trata con la nueva droga y a 
otro grupo no. Luego se comparan ambos grupos. 
VARIABLES: Son aquellas características susceptibles de tomar 
distintos estados entre unidades elementales o varían dentro 
de una misma unidad elemental a través del tiempo. 
Estadística y Análisis de Datos 
 
 
6 
 ESCALA DE MEDICION ESTADISTICA 
 
MEDICIÓN: medir es asignar números a las observaciones de acuerdo a reglas matemáticas definidas de 
antemano con el objeto de manipular estos números y obtener nueva información sobre los objetos 
medidos. 
ESCALAS DE MEDICIÓN: Una escala es un instrumento de medición. Existen distintos tipos: 
 Escala Nominal o clasificatoria. (Variables Cualitativas) 
 Escala Ordinal. (Variables Cualitativas) 
 
 Escala de Intervalo. (Variables Cuantitativas) 
 Escala de Razón o Proporción. (Variables Cuantitativas) 
 
PARA VARIABLES CUALITATIVAS 
Escala de Medición Características Estadísticos que permiten 
NOMINAL o 
CLASIFICATORIA 
Clasifica 
Sólo clasifica. Los datos no pueden acomodarse en 
un esquema de ordenamiento 
*Medida estadística: Moda 
*Frecuencias simples 
Ejemplo: Estado civil 
ORDINAL o 
JERARQUICA 
Clasifica y Ordena 
Las categorías están ordenadas, pero no es 
posible determinar diferencias. 
*Medidas estadísticas: Moda y Mediana 
* Frecuencias simples 
* Frecuencias acumuladas 
Ejemplo: Nivel educacional alcanzado 
 
PARA VARIABLES CUANTITATIVAS 
Escala de Medición Características Estadísticos que permiten 
INTERVALOS 
IGUALES 
Clasifica, Ordena, Tiene unidad de intervalo y 
Valor cero arbitrario 
Se pueden calcular diferencias entre valores, pero 
no existe un punto de partida inherente. 
Los cocientes no tienen significado. 
*Medidas estadísticas: Todas, excepto el 
Coeficiente de Variación 
*Frecuencias simples 
*Frecuencias acumuladas 
Ejemplo: 
Temperaturas: 0°C; 5°C; 10°C; 50°C 
0°C: no significa ausencia de 
temperatura. 
Entre 5°C y 10°C existe una diferencia de 
5°C. 
90°C no es dos veces más caliente que 
45º C. 
PROPORCION, 
RAZON o 
COCIENTE 
Clasifica, Ordena, Tiene unidad de intervalo y 
Valor cero absoluto real 
Igual que la de Intervalos, pero con un punto de 
partida inherente. Los cocientes tienen 
significados. 
*Medidas estadísticas: Todas, inclusive 
el Coeficiente de Variación. 
*Frecuencias simples 
*Frecuencias acumuladas 
Ejemplo: 
Pesos (Kg): 15Kg; 30Kg; 50kg 
0 kg: significa ausencia de peso. 
Entre 10kg y 30kg existe una diferencia 
de 20kg. 
40 kg es doble de peso de 20Kg. 
 
EJEMPLOS: para ver diferencia entre los dos últimos niveles de medición estadística: 
 
Variable A: Temperatura en °C 
En esta escala tenemos: 
 30°C > 20°C 
 (40°C  30°C) = (20°C  10°C) 
 NO podemos decir: 40°C es el doble de temperatura que 20°C 
 0°C: no significa ausencia de temperatura El “0” es el punto de fusión del agua. 
Estadística y Análisis de Datos 
 
 
7 
 0°C ~ 32°F 
 El punto 0 es arbitrario 
 La unidad de medida de la variable es arbitraria 
 
Entonces esta variable tiene un nivel de medición estadística de INTERVALOS IGUALES 
 
Algunos ejemplos de variables medidas en ellas son: 
 Escalas de los test psicológicos. 
 Ubicación de una carretera respecto de un punto de referencia (Km 85, Ruta 5). 
 Nivel de aceite en el motor de un automóvil medido con una vara graduada. 
 Variables usadas en test de rendimiento. 
 Sobrepeso respecto de un patrón de comparación. 
 
Variable B: Peso en Kg 
En esta escala tenemos: 
 30 kg >20kg 
 (40 kg  30kg) = (20 kg  10kg) 
 Podemos decir: 40 Kg es el doble de peso que 20 kg 
 0 kg: significa ausencia de peso 
 0 Kg = 0 libras 
 El punto 0 no es arbitrario, es un cero real. 
 La unidad de medida de la variable es arbitraria. 
 
Entonces esta variable tiene un nivel de medición estadística de PROPORCIÓN o RAZÓN 
 
Algunos ejemplos de variables medidas en este tipo de escala son: 
 Número de hijos en una familia. 
 Medición magnitudes físicas como: longitud, masa, intensidad de corriente, peso, velocidad, etc. 
 Estatura de las personas. 
 Litros de agua consumidos por persona al día. 
 Velocidad de un auto de carreras. 
 Número de goles marcados por un jugador en un partido. 
 Nivel de productividad. 
 Ventas de un producto. 
 Ingreso familiar mensual. 
 
 CLASIFICACIÓN GENERAL DE LAS VARIABLES EN UN ESTUDIO ESTADÍSTICO 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Según el tipo de variable 
Según la cantidad de variables 
CUALITATIVAS 
CUANTITATIVAS 
MULTIVARIABLE: (peso, estatura y nivel de colesterol) 
BIVARIABLE: (peso y estatura) 
Dicotómicas 
UNIVARIABLE: (peso) 
Policotómicas 
Discretas 
Continuas 
DE CORTE TRANSVERSAL (en un momento dado) 
SERIES DE TIEMPO (a través del tiempo):Ej. Nro. de 
accidentes por mes 
Según el momento de la medición 
Estadística y Análisis de Datos 
 
 
8 
PROPIEDADES DE 
TODA 
CLASIFICACIÓN 
EXCLUYENTE: Significa que toda unidad elemental de 
acuerdo al dato que otorga, debe pertenecer sólo a UNA 
“CLASE” o “CLASIFICACIÓN” de la variable en estudio (no 
debe existir ambigüedad) 
EXHAUSTIVA: Significa que toda unidad elemental de acuerdo 
al dato que otorga, debe pertenecer a ALGUNA “CLASE” O 
“CLASIFICACIÓN” de la variable en estudio. Es decir, debe 
existir la CLASE a la que pertenece. 
 CLASIFICACION DE LOS DATOS 
 
CLASIFICAR: Es una manera de ordenar y resumir los datos. Consiste en agrupar a las unidades 
elementales en “CLASES” o “CATEGORIAS” de acuerdo a una definición común y al tipo de variable que se 
trate. 
 
Ejemplo 
Variable: Condición Laboral: 
 
U.E. DATOS DATOS CODIFICADOS 
1 trabaja T T T SI S 1 0 20 
2 trabaja T T T SI S 1 0 20 
3 No trabaja NO T T’ T̅ NO N 2 1 50 
4 No trabaja NO T T’ T̅ NO N 2 1 50 
5 trabaja T T T SI S 1 0 20 
…. ………. ….. … … ….. … … … .. 
N No trabaja NO T T’ T̅ NO N 2 1 50 
 
Codificación numérica: En este ejemplo (donde no existe jerarquía entre las clases), la codificación 
numérica no tiene las propiedades de los números, el NÚMERO solamente sirve para darle NOMBRE a la 
clase o clasificación.

Continuar navegando