Logo Studenta

TP3_CE

¡Estudia con miles de materiales!

Vista previa del material en texto

Cálculo Estadístico – Guía de Trabajos Prácticos de contingencia 2022 11 
 
TP Nº 3: INFERENCIA ESTADÍSTICA 
 
 
Ejercicio 1 En el ejercicio 3 del TP Nº 1 se presentan los datos correspondientes a mediciones en árboles 
presentes en una parcela analizada durante un inventario forestal*, consideraremos a esta parcela como 
una muestra al azar del bosque correspondiente. La muestra nos permite inferir sobre las características 
de esta población de árboles. Por ejemplo, podemos estimar cuál es la altura comercial o del DAP de los 
árboles (todos) de este bosque. Con base en los datos y las medidas de resumen calculadas en el primer 
TP indique: 
a) ¿Qué individuos (unidades estadísticas) componen la población bajo estudio? 
b) ¿Con los datos que tiene se puede conocer la media de altura comercial de esta población de árboles? 
Justifique. 
c) ¿Cuál es y cuánto vale el estimador puntual de  para la altura comercial de los individuos del bosque? 
d) ¿Cómo se mide la precisión de este estimador? 
e) Estime mediante un intervalo de confianza del 95% el promedio del DAP de los árboles. Exprese el 
intervalo de confianza en palabras. Rta: [23,01; 28,80] 
f) Estime mediante un intervalo del 99% el mismo parámetro. ¿Esta estimación resultó más o menos 
precisa? Justifique su respuesta. Rta: [22,03; 29,78] 
g) Si dispusiera de una muestra de menor tamaño, ¿el intervalo de confianza calculado sería más o 
menos preciso? Justifique su respuesta. 
h) ¿Cuál de las dos estimaciones realizadas (puntual y por I de C) es mejor? ¿Por qué? 
i) ¿Qué tamaño debería tener la muestra para estimar, con un 95% de confianza, el DAP promedio de 
los árboles con un error de estimación de 2 cm? Rta: n  79. 
 
Utilizando el programa InfoStat para estimar la media poblacional de la altura total de los árboles se 
obtiene esta salida: 
Intervalos de confianza 
Bilateral 
Estimación paramétrica 
Variable Parámetro Estimación E.E. n LI(95%) LS(95%) 
DAP Media 25,91 1,43 40 22.03 29.78 
 
*Estos datos están disponibles en el Aula virtual, Sección “Bases de Datos”, como archivo “Datos inventario 
forestal.xlsx” 
 
Ejercicio 2 Se realizó un estudio para evaluar los efectos de la presencia de bórax en el agua sobre la 
supervivencia y reproducción del sapo común (Buffo arenarum). En una zona del río cercana a la descarga 
de efluentes de una planta de tratamiento de este mineral, se tomaron muestras de puestas de huevos 
de sapo común y se llevaron al laboratorio para su análisis. Se encontraron un total de 1000 huevos en 
las puestas y se observó que 572 tenían el embrión muerto (no eran viables). 
a) ¿Qué variable se registró? ¿Cuál sería la unidad estadística? ¿Qué tipo de variable es? 
b) Con la información obtenida realice una estimación puntual y una por intervalo de confianza (del 95%) 
para la proporción de huevos no viables de la población de huevos de esta zona de descarga. Exprese 
el intervalo de confianza en palabras. Rta: [0,54; 0,60] 
c) Calcule qué tamaño debería tener la muestra para estimar con la misma confianza la proporción de 
huevos no viables con un error de 0,01. Rta: n = 9405 huevos. 
d) ¿Qué tendría que hacer para conocer el valor de la proporción poblacional de huevos no viables? 
 
Ejercicio 3 Se registraron las precipitaciones medias anuales en cada una de 29 localidades seleccionadas 
al azar en la provincia de Salta, correspondientes a dos tipos de ambientes: árido y semiárido. Los datos 
se encuentran disponibles en el Aula virtual, Sección Bases de Datos, como archivo “datos inferencia. xls” 
Cálculo Estadístico – Guía de Trabajos Prácticos de contingencia 2022 12 
en la hoja “localidades salta”. Con el programa InfoStat, en el menú Estadísticas Inferencia basada en 
una muestra  Intervalo de confianza, se obtuvo la siguiente información: 
 
Ambiente n x S I de C 95% 
Árido 16 193,94 44,85 [170,04; 217,84] 
Semiárido 13 538,08 99,21 [478,12; 598,03] 
a) ¿Cuál es la variable analizada? ¿De qué tipo es? ¿Cuál es la variable de clasificación (la que agrupa a 
los datos)? 
b) Realice a mano el cálculo de los intervalos de confianza presentados en la tabla. Calcule la precisión 
de cada uno de estos intervalos de confianza. 
c) Represente gráficamente ambas estimaciones sobre un mismo eje (recuerde que los intervalos de 
confianza se representan usando un segmento). Preste atención a la ubicación relativa y a la amplitud 
de los intervalos. Reflexione sobre las causas de la diferencia en la precisión de ambos intervalos. 
d) Estime mediante un intervalo de confianza del 95% la variabilidad de las precipitaciones en el 
ambiente semiárido. Rta: [5061,69; 26823,02] 
 
Ejercicio 4 Utilizando los datos de DAP de los árboles medidos durante el inventario (ejercicio 3 del TP 
Nº1), realizaremos varias pruebas con el fin de comparar los resultados y obtener una conclusión 
importante que permite relacionar los intervalos de confianza con las respectivas pruebas de hipótesis. 
a) Pruebe si la media poblacional del DAP es igual a 27 cm, realice una prueba de dos colas utilizando 
un nivel de significación de 5%. Rta: Estadístico =-0,77, no rechazo Ho. 
b) Pruebe si la media poblacional del DAP es igual a 20 cm, realice una prueba de dos colas utilizando 
un  = 5%. Rta: Estadístico = 4,13, rechazo Ho. 
Si se realizan estas pruebas con InfoStat se obtienen las siguientes salidas: 
Prueba t para una media 
Valor de la media bajo la hipótesis nula: 27 
Variable n Media DE LI(95) LS(95) T p(Bilateral) 
DAP 40 25.91 9.04 23.01 28.80 -0.77 0.4483 
 
Valor de la media bajo la hipótesis nula: 20 
Variable n Media DE LI(95) LS(95) T p(Bilateral) 
DAP 40 25.91 9.04 23.01 28.80 4.13 0.0002 
 
c) Con base en las salidas de Infostat: Interprete el valor P y tome la decisión en cada prueba. Compare 
con lo resuelto en el inciso a) y en el b), debería coincidir. 
d) Verifique si los valores asignados a la media poblacional en la Ho de cada una de las pruebas de 
hipótesis realizadas en los incisos anteriores están contenidos en el intervalo de confianza construido en 
el inciso c) del ejercicio 1 y el informado por InfoStat. Cuando el intervalo contenía al valor asignado al 
parámetro en la Ho, la decisión fue “no rechazar” y cuando el intervalo no lo contenía la decisión fue 
“rechazar”. 
e) Explique la relación que existe entre lo que expresa el intervalo de confianza calculado y el resultado 
de la prueba de hipótesis correspondiente. 
f) ¿Qué tipo de error podría cometer en cada una de las pruebas realizadas? ¿En qué consiste el error? 
Exprese cada uno de esos errores en los términos del problema. ¿Cómo se denota su probabilidad 
asociada? ¿En la salida, se presenta alguna de las probabilidades? 
 
Ejercicio 5 En el ejercicio 2 se estimó, mediante un intervalo de confianza, la proporción de huevos no 
viables cuando están expuestos a niveles altos de bórax. Se sabe que la mortalidad de los huevos de esta 
especie en condiciones normales es del 47%. Con base en la información provista por el intervalo de 
confianza y teniendo en cuenta la relación que tiene con la prueba de hipótesis correspondiente, ¿puede 
Cálculo Estadístico – Guía de Trabajos Prácticos de contingencia 2022 13 
afirmar con un 95% de confianza que la descarga de efluente aumenta la mortalidad de los huevos? 
Explique su respuesta. (Sugerencia: plantee las hipótesis pertinentes para utilizarlas en su explicación). 
 
Ejercicio 6 Las semillas de Caesalpinia paraguariensis (guayacán) presentan una testa dura que impide 
que entre aire o agua a su interior y se ponga en contacto con el endosperma, es decir presentan 
dormancia física. La escarificación es un tratamiento que se hace a la semilla para romper la dormancia. 
Se realizó un experimento para determinar cuál de dos mecanismos de escarificación es mejor para 
romper la dormancia física de las semillas de guayacán. Se utilizaron dos agentes escarificadores: 
mecánico (lijadocon papel de lija) y químico (con ácido sulfúrico al 98% durante tres minutos), cada uno 
aplicado a 150 semillas. Las semillas fueron puestas a germinar bajo las mismas condiciones, obteniendo 
al cabo de 30 días 67 semillas germinadas para la escarificación mecánica y 17 para la escarificación 
química (información proporcionada por Dr. Ortega Baes). 
a) ¿Cuál era el objetivo del experimento? 
b) ¿Cuál es la unidad experimental? ¿Cuál es la variable analizada y de qué tipo? Calcule la proporción 
de semillas germinadas obtenida con cada agente escarificador. Con los valores calcule la diferencia de 
proporciones muestrales (p). 
c) Construya el intervalo de confianza del 99% para la diferencia de proporciones poblacionales. Rta: 
[0,216; 0,464] 
d) Indique dos maneras de aumentar la precisión de esta estimación. Explique. 
e) Sobre la base de la información proporcionada por el intervalo calculado en c): ¿puede decirse que 
algún agente escarificador es mejor? En ese caso, ¿cuál? Justifique su respuesta. Rta: es mejor el 
escarificador mecánico. 
 
Ejercicio 7 Se realizó un estudio para evaluar si un sitio contaminado ha sido recuperado al punto que 
el nivel de polucionante es semejante al presente en sitios comparables no contaminados, es decir, 
0,87 ppm en promedio. Se tomaron 20 muestras de suelo en puntos elegidos al azar en el sitio 
contaminado y se midió la cantidad de polucionante en partes por millón (ppm), obteniendo una 
media de 1,17 ppm y una varianza de 0,17 ppm2 (los datos se encuentran disponibles en el Aula virtual, 
Sección Bases de Datos, como archivo “datos inferencia. xlsx”, en la hoja “polucionante”). 
a) Realice todos los pasos de la prueba de hipótesis para evaluar, con un 95% de confianza, si el sitio 
se ha recuperado. Rta: Estadístico = 3,22, rechazo Ho. 
b) Explique tres maneras de aumentar la potencia de la prueba realizada. 
c) Estime mediante un intervalo de confianza del 95% una medida de la variabilidad en la cantidad 
de polucionante presente en el sitio contaminado. Rta: [0,10; 0,36] 
 
Con InfoStat se obtiene una salida como esta: 
Intervalos de confianza 
Bilateral 
Estimación paramétrica 
Variable Parámetro Estimación E.E. n LI(95%)) LS(95%)) 
Concentración Media 1,17 0,09 20 0,97 1,36 
Concentración Varianza 0,17 0,05 20 0,10 0,36 
 
Ejercicio 8 Se desea comparar el grado de contaminación atmosférica de dos zonas próximas a una 
gran ciudad. Una de las maneras de evaluar la calidad del aire es utilizar como indicador la medida del 
diámetro del cuerpo vegetativo de una especie de liquen, ya que un mayor desarrollo del liquen indica 
menor polución. En cada zona se tomaron los diámetros de líquenes seleccionados al azar (los datos 
se encuentran disponibles en el Aula virtual, Sección Bases de Datos, como archivo “datos inferencia. 
xlsx”, en hoja “líquenes”). Sobre la base de la salida proporcionada por InfoStat al analizar los datos 
obtenidos responda: 
a) Analice las estimaciones mediante intervalos de confianza para la media poblacional del diámetro de 
los líquenes de cada zona. Compare los intervalos. ¿En qué zona son de mayor tamaño? 
Cálculo Estadístico – Guía de Trabajos Prácticos de contingencia 2022 14 
b) Plantee las hipótesis necesarias para probar si el grado de contaminación es el mismo en ambas 
zonas. Indique cuál es la decisión y por qué. Escriba la conclusión indicando si alguna zona tiene mayor 
polución. 
c) ¿Coincide la información brindada por los intervalos de confianza calculados en a) y la prueba t 
realizada en b)? Explique. 
d) ¿Qué tipo de error podría estar cometiendo al tomar su decisión en b)? Exprese en qué consiste ese 
error en los términos de este problema. ¿Cuánto vale su probabilidad en este caso? 
e) ¿Cuál es la estimación (puntual y por intervalo de confianza) de la diferencia en el tamaño de los 
líquenes entre zonas? 
f) ¿Puede afirmar con un 95% de confianza que la variabilidad en el tamaño de los líquenes es el mismo 
en ambas zonas? Justifique su respuesta. 
 
Intervalos de confianza 
Bilateral 
Estimación paramétrica 
 Zona Variable Parámetro Estimación E.E. n LI(95%)) LS(95%)) 
Zona 1 diámetro Media 3.35 0.07 24 3.21 3.48 
Zona 2 diámetro Media 2.40 0.06 24 2.28 2.51 
 
Prueba T 
Variable:diámetro - Clasific:Zona - prueba:Bilateral 
 Zona 1 Zona 2 
n 24 24 
Media 3.35 2.40 
Varianza 0.10 0.08 
Media(1)-Media(2) 0.95 
LI(95) 0.78 
LS(95) 1.12 
pHomVar 0.4914 
T 11.04 
gl 46 
p-valor <0.0001 
 
Ejercicio 9 La cantidad de materia orgánica (MO) presente en el suelo disminuye con la profundidad. 
Un ingeniero agrónomo evaluó esta condición en una finca con baja actividad agrícola ubicada en el 
norte de la provincia de Salta, con el fin de determinar la magnitud de esta disminución de contenido 
de MO. Para eso tomó muestras, de 1 kilogramo de suelo cada una, a dos profundidades (0 a 10 cm y 
10 a 20 cm), en cada uno de 28 sitios seleccionados al azar en la finca, y determinó en laboratorio el 
porcentaje de MO contenido en cada una. Los datos están en la hoja “materia orgánica” del archivo 
“datos inferencia.xlsx”, y se analizaron con InfoStat: 
Prueba T (muestras apareadas) 
Obs(1) Obs(2) N media(dif) Media(1) Media(2) DE(dif) LI(95%)) LS(95%)) T Bilateral 
0-10 10-20 28 0,44 5,05 4,62 0,79 0,13 0,74 2,91 0,0072 
a) ¿Cuál fue el objetivo del estudio? ¿Cuál es la población estadística estudiada? 
b) ¿Cuál es la variable analizada? ¿Cuál es la unidad estadística? 
c) ¿Cuál es la estimación puntual de la magnitud de la disminución de contenido de MO? 
d) ¿Qué prueba estadística debería realizar para responder al objetivo y teniendo en cuenta los datos 
obtenidos? 
e) ¿Puede afirmar con una confianza del 95% que la cantidad de MO disminuye con la profundidad? 
Justifique la respuesta. 
f) ¿A qué parámetro corresponden los límites del intervalo de confianza calculado por InfoStat? 
Interprete el intervalo en los términos del problema. 
Cálculo Estadístico – Guía de Trabajos Prácticos de contingencia 2022 15 
g) Determine cuántas muestras de suelo debería tomar para estimar, con una confianza del 95%, la 
magnitud de la disminución de MO con un error de ±0,10 %. Rta: n = 263 muestras. Exprese esta 
información en un párrafo. 
 
Ejercicio 6 Los datos del archivo de InfoStat “Censo Vegetación.idb” corresponden a una investigación 
realizada en Venezuela, en la que se estudió la cubierta vegetal de una zona semiárida. Según se menciona 
en el programa, la vegetación es el conjunto de especies vegetales interactuantes que existen en una zona 
como resultado de la acción de los factores ambientales. En este caso se presentan los datos florísticos 
registrados para 104 censos de vegetación tomados sobre cada parcela ubicada a lo largo de una 
transecta que recorrió toda la zona de interés. En particular se presenta la densidad de individuos de cada 
una de las 19 especies registradas en las 104 parcelas. 
Se utilizó el programa para realizar una estimación puntual y por intervalo de confianza del 95%, para el 
porcentaje de parcelas en las que está presente la especie 16 y la especie 19, considerando que un valor 
de densidad igual a cero indica ausencia de esa especie, mientras que un valor mayor que cero indica que 
la especie está presente en la parcela. 
A continuación, se muestra una parte de la salida de InfoStat. La opción que debe utilizar para obtener el 
cálculo con InfoStat es: Intervalo de confianza, dentro del submenú Inferencia basada en una muestra del 
menú Estadísticas del programa. 
 
Intervalos de confianza 
Bilateral 
Estimación paramétrica 
 
Variable Parámetro Estimación E.E. n 
Esp16 Proporción(>0) 0.84 0.04 104 
Esp19Proporción(>0) 0.61 0.05 104 
 
a) Calcule la estimación por intervalo de confianza del 95% para la proporción de parcelas en las que 
está presente la especie 16 y la misma proporción para la especie 19. Rta: Especie 16: [0,77; 0,91], 
Especie 19: [0,51; 0,70] 
b) Plantee las hipótesis necesarias para evaluar si la proporción de parcelas en la que están presentes 
estas especies es la misma. Calcule el estadístico de prueba, tome una decisión y extraiga una 
conclusión. 
c) Con la información de los intervalos de confianza obtenidos, ¿podría afirmar que ambas especies 
están presentes en la misma proporción de parcelas? Justifique su respuesta. 
 
Ejercicios de repaso 
Ejercicio a Se condujo un experimento de clausura para determinar si el pastoreo tiene efecto sobre 
la densidad de una especie arbustiva. Se seleccionaron al azar 30 parcelas en las que estaba presente 
la especie y cada una se dividió en dos partes iguales. Una de esas partes se mantuvo con exclusión 
del ganado (clausura), es decir que los animales no podían acceder a este sector, y en la otra parte se 
mantuvo sin exclusión. Al cabo de dos años se registró, en cada parte, la densidad de la especie 
arbustiva. Los datos de densidad (expresada como número de individuos/ha) se encuentran disponibles 
en el Aula virtual, Sección Bases de Datos, como archivo “datos inferencia. xlsx”, en la hoja “ganado”). Se 
realizaron los análisis pertinentes utilizando InfoStat y se obtuvo la siguiente salida: 
 
Prueba T 
Obs(1) Obs(2) N media(dif) Media(1) Media(2) DE(dif) LI(95%) LS(95%) T Bilateral 
sin con 30 -0.45 5.09 5.54 0.40 -0.60 -0.31 -6.25 <0.0001 
 
a) Plantee las hipótesis necesarias para probar si el pastoreo tiene efecto sobre la densidad de plantas 
de esta especie. 
b) Sobre la base de la salida, ¿cuál es su decisión? Justifique su respuesta. 
c) ¿Qué tipo de error podría cometer al tomar esta decisión? Explique. ¿Cuál es su probabilidad? 
Cálculo Estadístico – Guía de Trabajos Prácticos de contingencia 2022 16 
d) Exprese la conclusión a la que llegó en términos del enunciado. ¿Cuál es la magnitud de la diferencia 
promedio en la densidad de plantas entre el sector con y sin clausura? ¿Cómo afecta a la densidad la 
presencia de estos animales? 
 
Ejercicio b Se realizó un estudio para evaluar la presencia de parásitos helmintos en una población 
silvestre de monos caí (Sapajus nigritus), en la población del Parque Nacional Iguazú, en el Nordeste 
de Argentina. A partir del análisis parasitológico de 665 muestras fecales tomadas en distintas épocas 
del año, se determinó que la prevalencia (proporción de monos infectados) para distintos tipos de 
helmintos. Para los helmintos de la familia Hymenolepididae (el parásito más frecuente) la prevalencia 
fue de 0,32. En un estudio similar en otra población de estos monos se encontró una prevalencia de 
0,37 para ese tipo de helminto. 
a) ¿Puede afirmar con un 95% de confianza que la prevalencia de Hymenolepididae es menor en los 
monos del Parque Iguazú? Rta: Estadístico = -2,78, rechazo Ho.

Continuar navegando

Materiales relacionados

148 pag.
DO-FCE-EE-MAI-UC0307-2018

SIN SIGLA

User badge image

Mucha Aprendizaje

123 pag.
cuaderno_ejercicios_estadistica2

Vicente Riva Palacio

User badge image

stuany Martenely machare solorzano

45 pag.
ejercicios

User badge image

Veronica Roldan