Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Cálculo Estadístico – Guía de Trabajos Prácticos de contingencia 2022 17 TP Nº 4: CORRELACIÓN LINEAL y REGRESIÓN LINEAL Ejercicio 1 Se estudió, entre otras características, la altura y la longitud del caparazón de la lapa Nacella magellanica (un caracol con caparazón de forma cónica ampliamente distribuido en la costa atlántica de Argentina). Se deseaba saber si existe alguna relación entre esas medidas por lo que tomó una muestra al azar de 28 individuos de esta especie y a cada uno se le midió la longitud y la altura, obteniendo los datos que se muestran en la tabla: altura (mm) 0.9 1.5 1.6 1.7 1.7 1.8 1.8 1.9 1.9 1.9 2.0 2.0 2.0 2.1 2.1 2.1 2.1 2.2 longitud (mm) 3.1 3.6 4.3 4.7 5.5 5.7 5.2 5.0 5.3 5.7 4.4 5.2 5.3 5.4 5.6 5.7 5.8 5.2 altura (mm) 2.2 2.2 2.2 2.3 2.3 2.3 2.3 2.4 2.4 2.7 longitud (mm) 5.3 5.6 5.8 5.8 6.2 6.3 6.4 6.4 6.3 6.3 a) ¿Cuáles son las variables analizadas y de qué tipo? b) Interprete el gráfico que representa estos datos. ¿Cómo se denomina el gráfico? c) Interprete el coeficiente de correlación muestral r = 0,86 d) ¿Puede afirmar con un 95% de confianza que existe correlación entre las variables? Rta: sí. Ejercicio 2 Los compuestos de organofosfato se utilizan en gran medida como pesticidas, por ello es importante estudiar sus efectos sobre la fauna expuesta a ellos. En un estudio de laboratorio se suministraron dosis diferentes (en mg/kg de peso del cuerpo) de un pesticida de este tipo a ratones hembras, todas de la misma edad y condición general. La respuesta básica a la exposición se evaluó midiendo la actividad cerebral de los ratones (moléculas/l/minuto), obteniendo los siguientes datos: Dosis 0 2,3 3,4 4,6 6,8 9,2 15,0 18,4 Actividad cerebral 10,6 9,9 11,0 10,4 9,2 8,2 5,4 3,4 a) Identifique las variables estudiadas y clasifíquelas. ¿Cuál es el tamaño de la muestra? b) Se estimaron los parámetros de la regresión: a = 11,6, b = -0,41. Exprese la relación funcional entre las variables e indique qué es cada término. c) Interprete el valor del coeficiente b en los términos del ejemplo. d) Pruebe si la actividad cerebral disminuye con el incremento de las dosis de pesticida, utilizando un nivel de significación del 5%, sabiendo que el error estándar de b (b) = 0,044. Rta: tc = -9,32. e) Estime la pendiente de regresión poblacional con una confianza del 95%. Interprete el intervalo. Compare su información con los resultados de la prueba realizada en d). f) Se calculó el coeficiente de determinación R2 = 93,5%. Exprese en palabras que representa. g) ¿Podría estimar la actividad cerebral de un ratón que recibió una dosis de 23 mg/kg? Justifique. h) En la siguiente tabla se presentan los pares de datos y los valores de residuos (RDUO_Activ_cerebral) y de predichos (PRED_Activ_cerebral) de cada uno. Explique a qué corresponden esas columnas y cómo se calcularon esos valores. Interprete los valores resaltados. i) Dosis Activ _cerebral RDUO_Activ _cerebral PRED_Activ _cerebral 0 10,6 -1 11,6 2,3 9,9 -0,75 10,65 3,4 11 0,81 10,19 4,6 10,4 0,7 9,7 6,8 9,2 0,41 8,79 9,2 8,2 0,41 7,79 15 5,4 0 5,4 18,4 3,4 -0,59 3,99 0.0 0.5 1.0 1.5 2.0 2.5 3.0 altura 3.0 3.5 4.0 4.5 5.0 5.5 6.0 6.5 7.0 lo n g itu d 0.0 2.0 4.0 6.0 8.0 10.0 12.0 14.0 16.0 18.0 20.0 Dosis 1.32 4.51 7.70 10.89 14.08 A c ti v id a d c e re b ra l Cálculo Estadístico – Guía de Trabajos Prácticos de contingencia 2022 18 j) Se estimó mediante un intervalo del 95% de confianza la actividad cerebral esperada de un ratón expuesto a 5,5 mg/kg de peso del cuerpo: 7,36; 11,29. ¿A qué variable corresponden estos valores límites? ¿Cómo se interpreta este intervalo? k) Se estimó mediante un intervalo de confianza del 95%, la actividad cerebral promedio esperada de un ratón expuesto a 2,5 mg/kg de pesticida: 9,72; 11,41. ¿A qué variable corresponden estos valores límites? ¿Cómo se interpreta este intervalo? Ejercicio 3 El crecimiento de una especie arbórea podría estar afectado por las características del suelo en el que se desarrolla, así como esas características podrían estar interactuando. Se midió el crecimiento en diámetro de 10 individuos de una especie arbórea, tomados al azar, y se midió la profundidad del horizonte superficial y el contenido de materia orgánica del suelo en el que crecían. Los datos registrados, que se presentan en la tabla, fueron analizados con InfoStat. A partir de las salidas responda a los siguientes ítems: Crecimiento (mm/día) 0,1 0,4 0,5 0,6 0,7 0,2 0,4 0,6 0,7 0,2 Profundidad (cm) 15 20 15 28 25 14 18 22 26 17 Materia Orgánica (%) 3,2 2,7 4,2 3,7 2,2 2,4 3,5 2,8 3,1 3,2 a) Analice e interprete los gráficos de dispersión. b) Interprete los valores de los coeficientes. Compare con la información de los gráficos. c) Plantee las hipótesis a poner a prueba que crea pertinentes. Indique a qué corresponden e interprete los valores de probabilidad. Exprese las conclusiones que pueda extraer. Coeficientes de correlación Correlación de Pearson Variable(1) Variable(2) n Pearson p-valor Crecimiento (mm/día) Profundidad (cm) 10 0.82 0.0034 Crecimiento (mm/día) Materia Orgánica (%) 10 -0.01 0.9815 Profundidad (cm) Materia Orgánica (%) 10 -0.12 0.7482 Ejercicio 4 La dureza de los árboles es difícil de medir directamente. Puede hacerse utilizando el método Janka, que mide la fuerza necesaria para incrustar completamente dentro de la madera una semiesfera de acero cuya sección diametral tiene una superficie de 1 cm2; esta fuerza es expresada en kp/mm3 (kp = kilopondio o kilogramo-fuerza). La densidad de la madera expresa la relación entre la masa y el volumen y es relativamente fácil de medir. Por ello es gran interés disponer de un modelo que permita predecir la dureza un árbol a partir de su densidad. Para determinar la relación entre estas medidas en eucaliptos australianos se tomó una muestra de 36 árboles y se les midió su densidad (kg/m3) y su dureza (kp/mm3). Los valores de densidad registrados en la muestra variaron entre 24,07 y 69,01 kg/m3. Los datos registrados se analizaron con InfoStat. Analice la salida de InfoStat impresa más abajo y responda: a) Indique cuál es la ecuación de regresión estimada. ¿Qué representa cada término? Interprete el valor de la pendiente en los términos del ejemplo. b) Plantee las hipótesis para evaluar si la relación es significativa. Con base en la información de la tabal de salida de InfoStat, explique la decisión y exprese la conclusión. c) ¿Cuál es y cuánto vale el grado de ajuste de los datos a la recta de regresión estimada? 10,00 15,00 20,00 25,00 30,00 Profundidad (cm) 0,00 1,00 2,00 3,00 4,00 5,00 M a te ri a O rg á n ic a ( % ) Cálculo Estadístico – Guía de Trabajos Prácticos de contingencia 2022 19 d) Indique que representa cada una de las columnas de la “Tabla con algunos datos y más”. Indique cómo se obtuvieron los valores de PRED Dureza y RDUO Dureza. e) Interprete los valores de la “Tabla con algunos datos y más” resaltados en negrita. f) Represente a mano alzada la banda de confianza en el mismo gráfico. ¿Qué representa esa banda? g) ¿Qué tan buenas serán las estimaciones de dureza calculadas con la recta de regresión estimada? Explique. h) ¿Podría estimar la dureza de un árbol que tiene una densidad de 20 kg/m3? Justifique su respuesta. i) ¿Cuál es la estimación por intervalo de la media de dureza para árboles con densidad de 29 kg/m3? j) ¿Cuál es la estimación por intervalo de la densidad para un árbol con dureza 30,03 kg/m3? Análisis de regresión lineal Variable N R² R² Aj ECMP AIC BIC Dureza 36 0.96 0.96 29387.05 471.27 476.02 Coeficientes de regresión y estadísticos asociados Coef Est. E.E. LI(95%) LS(95%) T p-valor CpMallows VIF const -1104.61 93.36 -1294.33 -914.88 -11.83 <0.0001 Densidad 56.70 1.98 52.6960.72 28.70 <0.0001 823.70 1.00 Tabla con algunos datos y más: Densidad Dureza RDUO Dureza PRED Dureza ICON(LI) Dureza ICON(LS) Dureza IPRE(LI) Dureza IPRE(LS) Dureza 24,07 484 223,78 260,22 159,32 361,12 -79,18 599,62 24,08 427 166,21 260,79 159,92 361,66 -78,6 600,17 27,03 413 -15,06 428,06 336,97 519,15 91,45 764,67 28,04 517 31,67 485,33 397,47 573,18 149,58 821,08 29,00 648 108,24 539,76 454,91 624,61 204,79 874,74 30,03 587 -11,17 598,17 516,47 679,87 263,98 932,36 32,07 704 -9,84 713,84 638,09 789,59 381,05 1046,62 … … 69,01 3140 331,58 2808,42 2698,97 2917,88 2466,39 3150,46 Ejercicio de repaso Un agrónomo desea saber si la cantidad de fósforo (P) que es aprovechado por una planta de maíz está en relación con la cantidad de P presente en el suelo. Para ello se prepararon muestras de suelos con distintas cantidades de fósforo (X, expresada en partes por millón), y se cultivaron plantas de maíz cultivadas en cada uno. Estas plantas fueron analizadas para determinar su contenido en fósforo (Y, también en ppm). Los datos obtenidos fueron analizados con InfoStat obteniendo las salidas presentadas más abajo. Con base en las salidas de InfoStat responda: a) Identifique las variables estudiadas y clasifíquelas. ¿Cuál era el tamaño de la muestra? b) Exprese la función que relaciona las variables analizadas. Interprete el coeficiente b. c) Plantee las hipótesis necesarias para probar si la pendiente es significativa. Con base en la salida indique y explique cuál es la decisión, exprese la conclusión que puede extraer. d) ¿A qué corresponden los valores de la columna RDUO_Y y PRED_Y ? ¿Cómo se calculan estos valores? e) Estime la pendiente de regresión poblacional mediante un intervalo de confianza del 95%. Con base en la información proporcionada por este intervalo, ¿puede afirmar con un 95% de confianza que la relación que plantea el agrónomo es significativa? Justifique su respuesta. f) ¿Cuál es la estimación del promedio de fósforo aprovechado por plantas que crecieron en un suelo con 9,4 ppm de fósforo? g) ¿Cuál es la estimación de la cantidad de fósforo que aprovecharía una planta que crece en suelo con 23,1 ppm de fósforo? Cálculo Estadístico – Guía de Trabajos Prácticos de contingencia 2022 20 h) Interprete los valores resaltados en negrita en la tabla de datos. Análisis de regresión lineal Variable N R² R²Aj ECMP AIC BIC Y 18 0,48 0,45 554,90 162,92 165,59 Coeficientes de regresión y estadísticos asociados Coef Est, E,E, LI(95%) LS(95%) T p-valor CpMallows const 59,20 7,42 43,46 74,94 7,97 <0,0001 X 1,84 0,48 0,83 2,86 3,85 0,0014 15,00 Tabla con algunos datos y más X Y RDUO_Y PRED_Y ICON(LS)_Y ICON(LI)_Y IPRE(LI)_Y IPRE(LS)_Y 0,40 64,00 4,07 59,93 44,51 75,36 14,69 105,18 0,40 60,00 0,07 59,93 44,51 75,36 14,69 105,18 3,10 71,00 6,09 64,91 51,45 78,37 20,30 109,52 4,70 54,00 -13,86 67,86 55,43 80,30 23,55 112,18 1,70 77,00 14,67 62,33 47,88 76,78 17,41 107,25 9,40 81,00 4,47 76,53 66,18 86,88 32,76 120,30 10,90 75,00 -4,30 79,30 69,22 89,38 35,59 123,01 23,10 96,00 -5,79 101,79 86,66 116,92 56,65 146,94 23,10 77,00 -24,79 101,79 86,66 116,92 56,65 146,94 23,10 95,00 -6,79 101,79 86,66 116,92 56,65 146,94 29,90 99,00 -15,33 114,33 93,52 135,15 66,98 161,68
Compartir