Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Estadística y Análisis de Datos 1 CONCEPTOS INTRODUCTORIOS Definición de ESTADÍSTICA “Según el diccionario, la Estadística es una ciencia que se ocupa de la: RECOLECCIÓN, CLASIFICACIÓN, RESUMEN, ANÁLISIS e INTERPRETACIÓN de hechos o datos numéricos” Pero en realidad la Estadística va más allá de este concepto: La Estadística forma parte de la matemática aplicada que reúne un conjunto de procedimientos o métodos que nos permite: Analizar las diferencias, variaciones que existen entre las personas, cosas u objetos en miles de aspectos. Encontrar un comportamiento “promedio” y generalizarlo. Obtener información de una población grande, sin necesidad de estudiar a todos los individuos o elementos que la componen. Tomar decisiones razonables frente a la incertidumbre UNIDAD ELEMENTAL, UNIDAD ESTADISTICA o UNIDAD DE OBSERVACIÓN: Todo objeto real, convencional o ideal de carácter singular sobre el cual pueden efectuarse observaciones o mediciones: un individuo, un objeto que luego de ser observado, medido, nos otorga un dato. POBLACION: Es el conjunto de unidades elementales que satisfacen una definición común y de la cual se quiere obtener información estadística. Se la debe definir en el tiempo y en el espacio. Nota: En estadística POBLACIÓN no se refiere necesariamente a un conjunto de personas. Ejemplo: Supongamos que nuestra población objeto de estudio está compuesta por ustedes. La población así definida es distinta a las siguientes poblaciones: Total de alumnos de la asignatura Estadística y Análisis de Datos de la FACENA de la UNNE que cursaron la Asignatura en el año 2012. Los alumnos de la carrera de Ing. Eléctrica de la FACENA de la UNNE que están inscriptos en la Asignatura “Estadística y Análisis de Datos” en el año 2021. Los 30 de alumnos de la carrera de Ing. Electrónica de la FACENA de la UNNE que cursaron la Asignatura “Estadística y Análisis de Datos” en el año 2013. Los 48 canes sometidos a esterilización por la fundación sin fines de lucro (CANES), durante el mes de marzo de 2012. Total de tornillos producidos en la fábrica “Tornillitos” de la ciudad de Tortuguitas durante el mes de mayo del año 2010. Unidad elemental, de observación o estadística: Un alumno de la cátedra de Estadística y Análisis de Datos de la FACENA de la UNNE que cursa la Asignatura en el año 2021. Población: Total de alumnos de Estadística y Análisis de Datos de la FACENA de la UNNE que cursan la Asignatura en el año 2021. INFINITAS: Cuando en la práctica no se pueden listar o individualizar a todos los elementos que la componen. Es la que está compuesta por un número indefinidamente grande de unidades elementales FINITAS: Cuando todas las unidades elementales que la componen pueden ser físicamente listadas o individualizadas POBLACIONES Estadística y Análisis de Datos 2 POBLACIÓN Tamaño: N MUESTRA:(Tamaño: n < N) Es un subconjunto de la población objeto de estudio. Se la debe definir también en el tiempo y en el espacio, que debe coincidir con el de la población. La principal condición que debe cumplir es la de ser representativa de la población a la que pertenece. (Para determinar su tamaño y para que sea representativa, existen métodos estadísticos que veremos más adelante) MUESTRA: DISEÑO DEL ESTUDIO: Según la cantidad de unidades elementales que van a ser observadas. FACTORES que se deben tener en cuenta para decidir si se realiza un CENSO o un MUESTREO COSTO TIEMPO IMPOSIBILIDAD de acceder a todos los elementos que componen la población objeto de estudio. (En caso de poblaciones infinitas, sí o sí se trabajan con muestras) DESTRUCCIÓN: Existen estudios que para ser desarrollados, terminan destruyendo a las unidades elementales, por lo tanto, se debe trabajar con muestras. Por ejemplo: Un fabricante de lámparas quiere determinar la vida útil de las mismas. Todo proceso de recolección de datos tiene un costo y demanda un tiempo determinado. (Un Muestreo es más barato y demanda un tiempo menor de recolección de datos que un Censo) EXACTITUD o PRECISIÓN Si realizamos un Censo el valor del parámetro es exacto, en cambio con un Muestreo solo se estima el valor del parámetro (contiene error, es estimado, aproximado) DISEÑO DEL ESTUDIO CENSO: Cuando se observa a todas las unidades elementales que componen la Población objeto de estudio MUESTREO o ENCUESTA: Cuando se observa a una parte o subconjunto de las unidades elementales que componen la Población objeto de estudio (MUESTRA) Estadística y Análisis de Datos 3 Población N=120 Diseño del estudio: CENSO μ = xi n i=1 N PARÁMETRO: μ : promedio ESTADISTICA DESCRIPTIVA: Con el cálculo de μ, ya se tiene la información buscada DE TODA la población objeto de estudio. INFERENCIA ESTADÍSTICA o ESTADÍSTICA INFERENCIAL: Es la parte de la Estadística que se ocupa de los métodos y técnicas usadas para hacer generalizaciones, predicciones o estimaciones sobre poblaciones a partir de muestras aleatorias. ESTADÍSTICA CLASIFICACION GENERAL DE LA ESTADISTICA La Estadística, de acuerdo a los tipos de procedimientos o metodologías que se aplican, se divide en dos grandes ramas: ESTADÍSTICO Y PARÁMETRO ESTADÍSTICO: es el resultado de hacer operaciones u observaciones sobre los datos de una muestra con el objetivo de obtener una medida descriptiva de ella. Los estadísticos varían de muestra a muestra. PARÁMETRO: es el resultado de hacer operaciones u observaciones sobre los datos de una población con el objetivo de obtener una medida descriptiva de ella (puede ser calculado con todos los datos de la población o estimado partiendo del resultado de un ESTADISTICO). El valor de un parámetro es constante para cada población, lo que puede suceder es que sea: conocido o desconocido. Medidas estadísticas (algunas) Simbología PARÁMETRO ESTADÍSTICO General θ̂ Proporción p p̂ Media aritmética (promedio) μ X̅ Ejemplo 1: POBLACIÓN: Alumnos de la carrera de Ing. Eléctrica de la FACENA de la UNNE que cursan la Asignatura “Estadística y Análisis de Datos” en el año 2015. UNIDAD ELEMENTAL: Un alumno de la carrera de Ing. Eléctrica de la FACENA de la UNNE que cursa la Asignatura “Estadística y Análisis de Datos” en el año 2015. DISEÑO DEL ESTUDIO: Censo PARÁMETRO DE INTERÉS: Promedio de materias aprobadas de toda la población: μ VARIABLE EN ESTUDIO: Cantidad de materias aprobadas por alumno. ESTADISTICA DESCRIPTIVA: Los resultados y las conclusiones que se obtienen, no va más allá del conjunto que aportó los datos. Por lo tanto, si el diseño del estudio es: CENSO: Con el conjunto de métodos o procedimientos que reúne esta rama de la estadística, se obtiene, y se describe a toda la POBLACIÓN, que es nuestro objetivo. MUESTREO: Con el conjunto de métodos y procedimientos que reúne esta rama de la estadística, sólo se describe a la Muestra, por lo que queda pendiente, inconcluso, el conocimiento de la POBLACIÓN, que es nuestro objetivo. Estadística y Análisis de Datos 4 Ejemplo 2: POBLACIÓN: Alumnos de la carrera de Ing. Eléctrica de la FACENA de la UNNE que cursan la Asignatura “Estadística y Análisis de Datos” en el año 2015. MUESTRA: 30 alumnos de la carrera de Ing. Eléctrica de la FACENA de la UNNE que cursan la Asignatura “Estadística y Análisis de Datos” en el año 2015. UNIDAD ELEMENTAL: Un alumno de la carrera de Ing. Eléctrica de la FACENA de la UNNE que cursa la Asignatura “Estadística y Análisis de Datos” en el año 2015. DISEÑO DEL ESTUDIO: Muestreo o Encuesta PARÁMETRO DE INTERÉS: Promedio de materias aprobadas de toda la población: μ ESTADÍSTICO A CALCULAR: Promedio de materias aprobadas por los alumnosque pertenecen a la muestra: X̅ VARIABLE EN ESTUDIO: Cantidad de materias aprobadas por alumno. RESUMIENDO MUESTRA n = 30 ESTADISTICO: X̅ promedio POBLACIÓN N=120 Diseño del estudio: MUESTREO X̅ = xi n i=1 n PARÁMETRO: μ ???? (Supongamos desconocido) ESTADISTICA DESCRIPTIVA: Con el cálculo de X̅ sólo describimos a la MUESTRA X̅ → μ ESTADÍSTICA INFERENCIAL Con el conocimiento que nos aporta una muestra, se aplican procedimientos para ESTIMAR o INFERIR sobre toda la población. DATOS (insumos) ESTADISTICA DESCRIPTIVA Clasificar, ordenar, resumir Calcular medidas descriptivas Presentar (gráficos, tablas, texto) Interpretar Muestra? SI NO ESTADISTICA INFERENCIAL CONCLUSIONES SOBRE TODA LA POBLACION (Censo) Estadística y Análisis de Datos 5 ERRORES EN ESTADISTICA: La Estadística trabaja con errores de distintos tipos (medición, generalización, estimación). Pero tiene la capacidad de “medir” esos errores. DEFINICIÓN DEL OBJETIVO DEL ESTUDIO: ¿QUÉ información queremos obtener de un conjunto de unidades elementales? - Porcentaje de los que fuman - Promedio de materias aprobadas - Gasto semanal promedio - Proporción de varones - Proporción de acuerdo al lugar de procedencia - Tiempo promedio dedicado al estudio - Proporción de los que practican algún deporte Para obtener lo anterior, ¿QUÉ OBSERVAMOS? ¿QUÉ MEDIMOS? VARIABLES DISEÑO DEL ESTUDIO: De acuerdo a si es observación o experimental. CARACTERÍSTICAS OBSERVABLES: CONSTANTES: La palabra lo dice todo. Sirven para definir a la población objeto de estudio. VARIABLES CUALITATIVAS: Son aquellas variables que vienen expresadas por la presencia o no de una cualidad o característica. El dato no es un número. Admite una clasificación DICOTOMICA (dos clases) o POLICOTÓMICA (más de dos clases) CUANTITATIVAS: Son aquellas variables que se expresan por un número, como resultado de una medición con instrumento o por conteo. Variables cuantitativas DISCRETAS: Los resultados de la observación (datos) son valores numéricos discretos. Variables cuantitativas CONTINUAS: Los resultados de la observación (datos) admiten cualquier valor real (ℝ). DISEÑO DEL ESTUDIO: DE OBSERVACIÓN: Cuando solamente se observa y se mide, sin manipular o modificar ciertos estados de las unidades elementales. Por ejemplo, considere un estudio diseñado para determinar la influencia de la temperatura ambiental sobre la energía eléctrica que consumen las instalaciones de una planta química. Es evidente que los niveles de la temperatura ambiental no se pueden controlar, por lo tanto, la única manera en que se puede supervisar la estructura de los datos es a partir de los datos de la planta a través del tiempo. EXPERIMENTAL: Cuando se manipula o modifica ciertos estados de las unidades elementales para medir la variable en estudio. Por ejemplo, si el objetivo del estudio consiste en determinar la eficacia de una nueva droga para la hipertensión. A un grupo de personas se los trata con la nueva droga y a otro grupo no. Luego se comparan ambos grupos. VARIABLES: Son aquellas características susceptibles de tomar distintos estados entre unidades elementales o varían dentro de una misma unidad elemental a través del tiempo. Estadística y Análisis de Datos 6 ESCALA DE MEDICION ESTADISTICA MEDICIÓN: medir es asignar números a las observaciones de acuerdo a reglas matemáticas definidas de antemano con el objeto de manipular estos números y obtener nueva información sobre los objetos medidos. ESCALAS DE MEDICIÓN: Una escala es un instrumento de medición. Existen distintos tipos: Escala Nominal o clasificatoria. (Variables Cualitativas) Escala Ordinal. (Variables Cualitativas) Escala de Intervalo. (Variables Cuantitativas) Escala de Razón o Proporción. (Variables Cuantitativas) PARA VARIABLES CUALITATIVAS Escala de Medición Características Estadísticos que permiten NOMINAL o CLASIFICATORIA Clasifica Sólo clasifica. Los datos no pueden acomodarse en un esquema de ordenamiento *Medida estadística: Moda *Frecuencias simples Ejemplo: Estado civil ORDINAL o JERARQUICA Clasifica y Ordena Las categorías están ordenadas, pero no es posible determinar diferencias. *Medidas estadísticas: Moda y Mediana * Frecuencias simples * Frecuencias acumuladas Ejemplo: Nivel educacional alcanzado PARA VARIABLES CUANTITATIVAS Escala de Medición Características Estadísticos que permiten INTERVALOS IGUALES Clasifica, Ordena, Tiene unidad de intervalo y Valor cero arbitrario Se pueden calcular diferencias entre valores, pero no existe un punto de partida inherente. Los cocientes no tienen significado. *Medidas estadísticas: Todas, excepto el Coeficiente de Variación *Frecuencias simples *Frecuencias acumuladas Ejemplo: Temperaturas: 0°C; 5°C; 10°C; 50°C 0°C: no significa ausencia de temperatura. Entre 5°C y 10°C existe una diferencia de 5°C. 90°C no es dos veces más caliente que 45º C. PROPORCION, RAZON o COCIENTE Clasifica, Ordena, Tiene unidad de intervalo y Valor cero absoluto real Igual que la de Intervalos, pero con un punto de partida inherente. Los cocientes tienen significados. *Medidas estadísticas: Todas, inclusive el Coeficiente de Variación. *Frecuencias simples *Frecuencias acumuladas Ejemplo: Pesos (Kg): 15Kg; 30Kg; 50kg 0 kg: significa ausencia de peso. Entre 10kg y 30kg existe una diferencia de 20kg. 40 kg es doble de peso de 20Kg. EJEMPLOS: para ver diferencia entre los dos últimos niveles de medición estadística: Variable A: Temperatura en °C En esta escala tenemos: 30°C > 20°C (40°C 30°C) = (20°C 10°C) NO podemos decir: 40°C es el doble de temperatura que 20°C 0°C: no significa ausencia de temperatura El “0” es el punto de fusión del agua. Estadística y Análisis de Datos 7 0°C ~ 32°F El punto 0 es arbitrario La unidad de medida de la variable es arbitraria Entonces esta variable tiene un nivel de medición estadística de INTERVALOS IGUALES Algunos ejemplos de variables medidas en ellas son: Escalas de los test psicológicos. Ubicación de una carretera respecto de un punto de referencia (Km 85, Ruta 5). Nivel de aceite en el motor de un automóvil medido con una vara graduada. Variables usadas en test de rendimiento. Sobrepeso respecto de un patrón de comparación. Variable B: Peso en Kg En esta escala tenemos: 30 kg >20kg (40 kg 30kg) = (20 kg 10kg) Podemos decir: 40 Kg es el doble de peso que 20 kg 0 kg: significa ausencia de peso 0 Kg = 0 libras El punto 0 no es arbitrario, es un cero real. La unidad de medida de la variable es arbitraria. Entonces esta variable tiene un nivel de medición estadística de PROPORCIÓN o RAZÓN Algunos ejemplos de variables medidas en este tipo de escala son: Número de hijos en una familia. Medición magnitudes físicas como: longitud, masa, intensidad de corriente, peso, velocidad, etc. Estatura de las personas. Litros de agua consumidos por persona al día. Velocidad de un auto de carreras. Número de goles marcados por un jugador en un partido. Nivel de productividad. Ventas de un producto. Ingreso familiar mensual. CLASIFICACIÓN GENERAL DE LAS VARIABLES EN UN ESTUDIO ESTADÍSTICO Según el tipo de variable Según la cantidad de variables CUALITATIVAS CUANTITATIVAS MULTIVARIABLE: (peso, estatura y nivel de colesterol) BIVARIABLE: (peso y estatura) Dicotómicas UNIVARIABLE: (peso) Policotómicas Discretas Continuas DE CORTE TRANSVERSAL (en un momento dado) SERIES DE TIEMPO (a través del tiempo):Ej. Nro. de accidentes por mes Según el momento de la medición Estadística y Análisis de Datos 8 PROPIEDADES DE TODA CLASIFICACIÓN EXCLUYENTE: Significa que toda unidad elemental de acuerdo al dato que otorga, debe pertenecer sólo a UNA “CLASE” o “CLASIFICACIÓN” de la variable en estudio (no debe existir ambigüedad) EXHAUSTIVA: Significa que toda unidad elemental de acuerdo al dato que otorga, debe pertenecer a ALGUNA “CLASE” O “CLASIFICACIÓN” de la variable en estudio. Es decir, debe existir la CLASE a la que pertenece. CLASIFICACION DE LOS DATOS CLASIFICAR: Es una manera de ordenar y resumir los datos. Consiste en agrupar a las unidades elementales en “CLASES” o “CATEGORIAS” de acuerdo a una definición común y al tipo de variable que se trate. Ejemplo Variable: Condición Laboral: U.E. DATOS DATOS CODIFICADOS 1 trabaja T T T SI S 1 0 20 2 trabaja T T T SI S 1 0 20 3 No trabaja NO T T’ T̅ NO N 2 1 50 4 No trabaja NO T T’ T̅ NO N 2 1 50 5 trabaja T T T SI S 1 0 20 …. ………. ….. … … ….. … … … .. N No trabaja NO T T’ T̅ NO N 2 1 50 Codificación numérica: En este ejemplo (donde no existe jerarquía entre las clases), la codificación numérica no tiene las propiedades de los números, el NÚMERO solamente sirve para darle NOMBRE a la clase o clasificación.
Compartir