Logo Studenta

TP4_CE

¡Estudia con miles de materiales!

Vista previa del material en texto

Cálculo Estadístico – Guía de Trabajos Prácticos de contingencia 2022 17 
TP Nº 4: CORRELACIÓN LINEAL y REGRESIÓN LINEAL 
 
Ejercicio 1 Se estudió, entre otras características, la altura y la longitud del caparazón de la lapa Nacella 
magellanica (un caracol con caparazón de forma cónica ampliamente distribuido en la costa atlántica de 
Argentina). Se deseaba saber si existe alguna relación entre esas medidas por lo que tomó una muestra 
al azar de 28 individuos de esta especie y a cada uno se le midió la longitud y la altura, obteniendo los 
datos que se muestran en la tabla: 
altura (mm) 0.9 1.5 1.6 1.7 1.7 1.8 1.8 1.9 1.9 1.9 2.0 2.0 2.0 2.1 2.1 2.1 2.1 2.2 
longitud (mm) 3.1 3.6 4.3 4.7 5.5 5.7 5.2 5.0 5.3 5.7 4.4 5.2 5.3 5.4 5.6 5.7 5.8 5.2 
 
altura (mm) 2.2 2.2 2.2 2.3 2.3 2.3 2.3 2.4 2.4 2.7 
longitud (mm) 5.3 5.6 5.8 5.8 6.2 6.3 6.4 6.4 6.3 6.3 
a) ¿Cuáles son las variables analizadas y de qué tipo? 
b) Interprete el gráfico que representa estos datos. ¿Cómo se denomina 
el gráfico? 
c) Interprete el coeficiente de correlación muestral r = 0,86 
d) ¿Puede afirmar con un 95% de confianza que existe correlación entre 
las variables? Rta: sí. 
 
Ejercicio 2 Los compuestos de organofosfato se utilizan en gran medida como pesticidas, por ello es 
importante estudiar sus efectos sobre la fauna expuesta a ellos. En un estudio de laboratorio se 
suministraron dosis diferentes (en mg/kg de peso del cuerpo) de un pesticida de este tipo a ratones 
hembras, todas de la misma edad y condición general. La respuesta básica a la exposición se evaluó 
midiendo la actividad cerebral de los ratones (moléculas/l/minuto), obteniendo los siguientes datos: 
Dosis 0 2,3 3,4 4,6 6,8 9,2 15,0 18,4 
Actividad cerebral 10,6 9,9 11,0 10,4 9,2 8,2 5,4 3,4 
a) Identifique las variables estudiadas y clasifíquelas. ¿Cuál es el tamaño de la muestra? 
b) Se estimaron los parámetros de la regresión: a = 11,6, b = -0,41. Exprese la relación funcional entre 
las variables e indique qué es cada término. 
c) Interprete el valor del coeficiente b en los términos del ejemplo. 
d) Pruebe si la actividad cerebral disminuye con el incremento de las dosis de pesticida, utilizando un 
nivel de significación del 5%, sabiendo que el error estándar de b (b) = 0,044. Rta: tc = -9,32. 
e) Estime la pendiente de regresión poblacional con una confianza del 95%. Interprete el intervalo. 
Compare su información con los resultados de la prueba realizada en d). 
f) Se calculó el coeficiente de determinación R2 = 93,5%. Exprese en palabras que representa. 
g) ¿Podría estimar la actividad cerebral de un ratón que recibió una dosis de 23 mg/kg? Justifique. 
h) En la siguiente tabla se presentan los pares de datos y los valores de residuos (RDUO_Activ_cerebral) 
y de predichos (PRED_Activ_cerebral) de cada uno. Explique a qué corresponden esas columnas y 
cómo se calcularon esos valores. Interprete los valores 
resaltados. 
i) Dosis Activ _cerebral 
RDUO_Activ
_cerebral 
PRED_Activ
_cerebral 
0 10,6 -1 11,6 
2,3 9,9 -0,75 10,65 
3,4 11 0,81 10,19 
4,6 10,4 0,7 9,7 
6,8 9,2 0,41 8,79 
9,2 8,2 0,41 7,79 
15 5,4 0 5,4 
18,4 3,4 -0,59 3,99 
0.0 0.5 1.0 1.5 2.0 2.5 3.0
altura 
3.0
3.5
4.0
4.5
5.0
5.5
6.0
6.5
7.0
lo
n
g
itu
d
0.0 2.0 4.0 6.0 8.0 10.0 12.0 14.0 16.0 18.0 20.0
Dosis
1.32
4.51
7.70
10.89
14.08
A
c
ti
v
id
a
d
 c
e
re
b
ra
l
Cálculo Estadístico – Guía de Trabajos Prácticos de contingencia 2022 18 
 
j) Se estimó mediante un intervalo del 95% de confianza la actividad cerebral esperada de un ratón 
expuesto a 5,5 mg/kg de peso del cuerpo: 7,36; 11,29. ¿A qué variable corresponden estos valores 
límites? ¿Cómo se interpreta este intervalo? 
k) Se estimó mediante un intervalo de confianza del 95%, la actividad cerebral promedio esperada de 
un ratón expuesto a 2,5 mg/kg de pesticida: 9,72; 11,41. ¿A qué variable corresponden estos valores 
límites? ¿Cómo se interpreta este intervalo? 
 
Ejercicio 3 El crecimiento de una especie arbórea podría estar afectado por las características del suelo 
en el que se desarrolla, así como esas características podrían estar interactuando. Se midió el crecimiento 
en diámetro de 10 individuos de una especie arbórea, tomados al azar, y se midió la profundidad del 
horizonte superficial y el contenido de materia orgánica del suelo en el que crecían. Los datos registrados, 
que se presentan en la tabla, fueron analizados con InfoStat. A partir de las salidas responda a los 
siguientes ítems: 
 
Crecimiento (mm/día) 0,1 0,4 0,5 0,6 0,7 0,2 0,4 0,6 0,7 0,2 
Profundidad (cm) 15 20 15 28 25 14 18 22 26 17 
Materia Orgánica (%) 3,2 2,7 4,2 3,7 2,2 2,4 3,5 2,8 3,1 3,2 
 
a) Analice e interprete los gráficos de dispersión. 
b) Interprete los valores de los coeficientes. Compare con la información de los gráficos. 
c) Plantee las hipótesis a poner a prueba que crea pertinentes. Indique a qué corresponden e 
interprete los valores de probabilidad. Exprese las conclusiones que pueda extraer. 
Coeficientes de correlación 
Correlación de Pearson 
 Variable(1) Variable(2) n Pearson p-valor 
Crecimiento (mm/día) Profundidad (cm) 10 0.82 0.0034 
Crecimiento (mm/día) Materia Orgánica (%) 10 -0.01 0.9815 
Profundidad (cm) Materia Orgánica (%) 10 -0.12 0.7482 
 
Ejercicio 4 La dureza de los árboles es difícil de medir directamente. Puede hacerse utilizando el método 
Janka, que mide la fuerza necesaria para incrustar completamente dentro de la madera una semiesfera 
de acero cuya sección diametral tiene una superficie de 1 cm2; esta fuerza es expresada en kp/mm3 (kp = 
kilopondio o kilogramo-fuerza). La densidad de la madera expresa la relación entre la masa y el volumen 
y es relativamente fácil de medir. Por ello es gran interés disponer de un modelo que permita predecir la 
dureza un árbol a partir de su densidad. Para determinar la relación entre estas medidas en eucaliptos 
australianos se tomó una muestra de 36 árboles y se les midió su densidad (kg/m3) y su dureza (kp/mm3). 
Los valores de densidad registrados en la muestra variaron entre 24,07 y 69,01 kg/m3. Los datos 
registrados se analizaron con InfoStat. Analice la salida de InfoStat impresa más abajo y responda: 
a) Indique cuál es la ecuación de regresión estimada. ¿Qué representa cada término? Interprete el valor 
de la pendiente en los términos del ejemplo. 
b) Plantee las hipótesis para evaluar si la relación es significativa. Con base en la información de la tabal 
de salida de InfoStat, explique la decisión y exprese la conclusión. 
c) ¿Cuál es y cuánto vale el grado de ajuste de los datos a la recta de regresión estimada? 
10,00 15,00 20,00 25,00 30,00
Profundidad (cm)
0,00
1,00
2,00
3,00
4,00
5,00
M
a
te
ri
a
 O
rg
á
n
ic
a
 (
%
)
Cálculo Estadístico – Guía de Trabajos Prácticos de contingencia 2022 19 
d) Indique que representa cada una de las columnas de la “Tabla con algunos datos y más”. Indique 
cómo se obtuvieron los valores de PRED Dureza y RDUO Dureza. 
e) Interprete los valores de la “Tabla con algunos datos y más” resaltados en negrita. 
f) Represente a mano alzada la banda de confianza en el mismo gráfico. ¿Qué representa esa banda? 
g) ¿Qué tan buenas serán las estimaciones de dureza calculadas con la recta de regresión estimada? 
Explique. 
h) ¿Podría estimar la dureza de un árbol que tiene una densidad de 20 kg/m3? Justifique su respuesta. 
i) ¿Cuál es la estimación por intervalo de la media de dureza para árboles con densidad de 29 kg/m3? 
j) ¿Cuál es la estimación por intervalo de la densidad para un árbol con dureza 30,03 kg/m3? 
 
Análisis de regresión lineal 
Variable N R² R² Aj ECMP AIC BIC 
Dureza 36 0.96 0.96 29387.05 471.27 476.02 
 
Coeficientes de regresión y estadísticos asociados 
 Coef Est. E.E. LI(95%) LS(95%) T p-valor CpMallows VIF 
const -1104.61 93.36 -1294.33 -914.88 -11.83 <0.0001 
Densidad 56.70 1.98 52.6960.72 28.70 <0.0001 823.70 1.00 
 
Tabla con algunos datos y más: 
Densidad Dureza 
RDUO 
Dureza 
PRED 
Dureza 
ICON(LI) 
Dureza 
ICON(LS) 
Dureza 
IPRE(LI) 
Dureza 
IPRE(LS) 
Dureza 
24,07 484 223,78 260,22 159,32 361,12 -79,18 599,62 
24,08 427 166,21 260,79 159,92 361,66 -78,6 600,17 
27,03 413 -15,06 428,06 336,97 519,15 91,45 764,67 
28,04 517 31,67 485,33 397,47 573,18 149,58 821,08 
29,00 648 108,24 539,76 454,91 624,61 204,79 874,74 
30,03 587 -11,17 598,17 516,47 679,87 263,98 932,36 
32,07 704 -9,84 713,84 638,09 789,59 381,05 1046,62 
… … 
69,01 3140 331,58 2808,42 2698,97 2917,88 2466,39 3150,46 
 
 
Ejercicio de repaso 
Un agrónomo desea saber si la cantidad de fósforo (P) que es aprovechado por una planta de maíz está 
en relación con la cantidad de P presente en el suelo. Para ello se prepararon muestras de suelos con 
distintas cantidades de fósforo (X, expresada en partes por millón), y se cultivaron plantas de maíz 
cultivadas en cada uno. Estas plantas fueron analizadas para determinar su contenido en fósforo (Y, 
también en ppm). Los datos obtenidos fueron analizados con InfoStat obteniendo las salidas presentadas 
más abajo. Con base en las salidas de InfoStat responda: 
a) Identifique las variables estudiadas y clasifíquelas. ¿Cuál era el tamaño de la muestra? 
b) Exprese la función que relaciona las variables analizadas. Interprete el coeficiente b. 
c) Plantee las hipótesis necesarias para probar si la pendiente es significativa. Con base en la salida 
indique y explique cuál es la decisión, exprese la conclusión que puede extraer. 
d) ¿A qué corresponden los valores de la columna RDUO_Y y PRED_Y ? ¿Cómo se calculan estos valores? 
e) Estime la pendiente de regresión poblacional mediante un intervalo de confianza del 95%. Con base 
en la información proporcionada por este intervalo, ¿puede afirmar con un 95% de confianza que la 
relación que plantea el agrónomo es significativa? Justifique su respuesta. 
f) ¿Cuál es la estimación del promedio de fósforo aprovechado por plantas que crecieron en un suelo 
con 9,4 ppm de fósforo? 
g) ¿Cuál es la estimación de la cantidad de fósforo que aprovecharía una planta que crece en suelo con 
23,1 ppm de fósforo? 
Cálculo Estadístico – Guía de Trabajos Prácticos de contingencia 2022 20 
h) Interprete los valores resaltados en negrita en la tabla de datos. 
Análisis de regresión lineal 
Variable N R² R²Aj ECMP AIC BIC 
Y 18 0,48 0,45 554,90 162,92 165,59 
 
Coeficientes de regresión y estadísticos asociados 
Coef Est, E,E, LI(95%) LS(95%) T p-valor CpMallows 
const 59,20 7,42 43,46 74,94 7,97 <0,0001 
X 1,84 0,48 0,83 2,86 3,85 0,0014 15,00 
 
Tabla con algunos datos y más 
 
X Y RDUO_Y PRED_Y ICON(LS)_Y ICON(LI)_Y IPRE(LI)_Y IPRE(LS)_Y 
0,40 64,00 4,07 59,93 44,51 75,36 14,69 105,18 
0,40 60,00 0,07 59,93 44,51 75,36 14,69 105,18 
3,10 71,00 6,09 64,91 51,45 78,37 20,30 109,52 
4,70 54,00 -13,86 67,86 55,43 80,30 23,55 112,18 
1,70 77,00 14,67 62,33 47,88 76,78 17,41 107,25 
9,40 81,00 4,47 76,53 66,18 86,88 32,76 120,30 
10,90 75,00 -4,30 79,30 69,22 89,38 35,59 123,01 
23,10 96,00 -5,79 101,79 86,66 116,92 56,65 146,94 
23,10 77,00 -24,79 101,79 86,66 116,92 56,65 146,94 
23,10 95,00 -6,79 101,79 86,66 116,92 56,65 146,94 
29,90 99,00 -15,33 114,33 93,52 135,15 66,98 161,68

Continuar navegando

Materiales relacionados

148 pag.
CB-0478886

User badge image

Contenidos Increíbles

301 pag.
bfa003805

UNM

User badge image

Materiales Muy Locos