Lista_07_Gabarito

Genética na Agropecuária

•

UFLA

Marcos Fachinni

01/12/2023

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 10 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 10 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 9, do total de 10 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Genética na Agropecuária

840 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

Prof. Glauco Peres ( FLS 5028 e FLP 0406 ): Lista de Exerćıcio #7
Universidade de São Paulo
Faculdade de Filosofia, Letras e Ciências Humanas
Departamento de Ciência Poĺıtica
FLS 5028
Métodos Quantitativos e Técnicas de Pesquisa em Ciência Poĺıtica
FLP0406
Métodos e Técnicas de Pesquisa em Ciência Poĺıtica
1o semestre / 2016
Prof. Glauco Peres da Silva
LISTA DE EXERCÍCIOS 07
Data de entrega: 09/05/2016 (noturno) e 11/05/2016 (vespertino)
Exerćıcio 1 (2 pontos)
Após ler atenciosamente os textos indicados para a aula, avalie as afirmações a seguir. Para cada uma
delas, julgue se é “verdadeira” ou “falsa”. Adicionalmente, reescreva as frases que forem classificadas como
“falsas”, corrigindo-as no que for necessário (lembre de sublinhar as alterações feitas por você).
(a)
(F) O teste de significância usa dados para resumir a evidência sobre uma hipótese, comparando as esti-
mativas por pontos dos parâmetros aos valores previstos pela hipótese. Tanto nos testes de significância
bilaterais quanto nos unilaterais, as hipóteses (H0 e H1) sempre se referem às estat́ısticas amostrais e não
aos parâmetros da população, de forma que podemos expressar uma hipótese nula como H0 : Ȳ = 0.
O primeiro peŕıodo está correto. O segundo peŕıodo, entretanto, está errado: as hipóteses sempre se
referem aos parâmetros da população e não às estat́ısticas amostrais. Portanto, nunca podemos expressar
uma hipótese usando uma notação estat́ıstica amostral como “H0 : Ȳ = 0”. H0 deve fazer referência ao
parâmetro da população (ex. H0 : µ = µ0). Referência: Agresti e Finlay, caṕıtulo 6, páginas 169 e 179.
Exerćıcio 1 (2 pontos) continua na próxima página. . . Página 1 de 10
Prof. Glauco Peres ( FLS 5028 e FLP 0406 ): Lista de Exerćıcio #7Exerćıcio 1 (2 pontos) (continuação)
(b)
(F) Para evitarmos tendenciosidade ao conduzirmos um teste de hipótese, podemos definir o ńıvel de signi-
ficância (α) após a análise dos dados. Os ńıveis geralmente escolhidos são 0,05 e 0,01.
Devemos selecionar o ńıvel de significância antes de analisar os dados, para evitarmos tendenciosidade na
escolha - Agresti e Finlay, cap 6, pág. 180 .
(c)
(F) Ao realizarmos um teste de significância para uma proporção (variável categórica) utilizamos o escore-t
como estat́ıstica teste e a média Ȳ como parâmetro da população. Considerando-se H0 : µ = µ̂0, podemos
calcular a estat́ıstica teste da seguinte forma:
t =
Ȳ − µ0
ep
tal que, ep =
s√
n
Para uma variável categórica, o parâmetro é a proporção da população em uma determinada ca-tegoria
(π). Para amostras grandes, se H0 é verdadeira, a estat́ıstica-teste Z tem uma distribuição normal padrão;
seu cálculo é realizado da seguinte forma:
z =
π̂ − π0
ep0
tal que, ep0 =
√
π0(1− π0)
n
(d)
(V) Há dois tipos de erros em testes de hipótese. O “erro do Tipo I” ocorre se rejeitamos a hipótese nula
(H0) mesmo ela sendo verdadeira. A probabilidade de incorrermos em um erro do Tipo I é exatamente o
ńıvel de significância “α” para o teste, ou seja, se α = 0, 05, temos 5% de probabilidade de incorrermos no
erro do Tipo I.
Exerćıcio 2 (4 pontos)
(Todos os cálculos devem ser demonstrados)
Suponhamos que a Faculdade de Filosofia Letras e Ciências Humanas da USP (FFLCH) realizava um teste
com uma amostra aleatória de 50 alunos todos os anos para avaliar o desempenho do conhecimento de seus
alunos. Este teste era sempre consistente em seu ńıvel de dificuldade e que a média até o ano de 2015 era
de 60. No ano de 2016 a FFLCH realizou este teste com uma amostra aleatória de 50 alunos e obteve uma
média de 80 pontos. Considere que o desvio padrão seja de 55.
Exerćıcio 2 (4 pontos) continua na próxima página. . . Página 2 de 10
Prof. Glauco Peres ( FLS 5028 e FLP 0406 ): Lista de Exerćıcio #7Exerćıcio 2 (4 pontos) (continuação)
(a)
Realize um teste de significância para as médias para testar se a nova pontuação se deveu apenas a uma
variação amostral, com ńıvel de significância de 95%. Calcule o erro padrão e a estat́ıstica-t.
Teste de significância para uma média - variável quantitativa.
n = 50
s = 55
Ȳ = 80
µ = 60
ep =
s√
n
=
55√
50
= 7, 78
t =
Ȳ − µ0
ep
=
80− 60
7, 78
= 2, 57
(b)
Desenhe um gráfico com a estat́ıstica-t encontrada e o ponto cŕıtico para o qual rejeitamos a hipótese nula
de que a diferença entre as médias se deveu a uma variação amostral. Indique também o valor-p encontrado
para o teste.
Observando a tabela da estat́ıstica-t, com gl=50-1 e ńıvel de significância de 5%, vemos que o valor-t =
2,0.
Portanto, temos forte evidência contra a hipótese nula (H0).
(c)
A partir de seus cálculos o que você pode concluir sobre o desempenho dos alunos do ano de 2016?
O valor-t encontrado em nossos cálculos é ainda mais extremo que este (t = 2, 57) o que indica que podemos
rejeitar a hipótese nula de que a diferença entre as médias se deu apenas por uma variação amostral. Ou
seja, podemos concluir que os alunos de 2016 foram melhores que a média dos anos anteriores.
Página 3 de 10
Prof. Glauco Peres ( FLS 5028 e FLP 0406 ): Lista de Exerćıcio #7 Exerćıcio 2 (4 pontos)
Exerćıcio 3 (4 pontos)
A prefeitura de São Paulo quer implementar uma nova lei de zoneamento para o bairro Butantã e acredita
que ao menos 50% dos moradores daquele bairro é favorável à nova lei. Para confirmar o apoio popular a
esta medida, a prefeitura realizou uma pesquisa com uma amostra aleatória de 350 moradores. O número
de moradores favoráveis à pesquisa foi de 165, enquanto 185 se manifestaram contra.
(a)
Qual a hipótese nula e a hipótese alternativa nesta pesquisa? Calcule o erro padrão estimado sob a suposição
de que H0 é verdadeira (ep0) e construa um intervalo de 95% confiança para a propor-ção da amostra.
Este é um teste de significância para uma proporção, ou seja, estamos lidando com uma variável categórica.
n = 350
a favor = 165 ou 0, 47
contra = 185 ou 0, 53
H0 : π = 0, 5
H1 : π > 0, 5
ep0 =
π0(1− π0)√
n
=
√
0, 5× 0, 5
350
=
√
0, 25
350
= 0, 027
IC95% : π̂ ± 1, 96× (ep0)
IC95% : 0, 47± 1, 96× 0, 027
IC : 0, 417 a 0, 523
(b)
Desenhe um gráfico que resuma o valor-p encontrado, indicando a posição da estat́ıstica-teste em relação à
média e sombreando a área de rejeição de H0.
z =
π̂ − π0
ep
=
0, 47− 0, 5
0, 027
=
−0, 03
0, 027
= −1, 11
Nossa estat́ıstica-z de -1,11 não encontra-se na área de rejeição da hipótese nula, que corresponde a 1,96
desvios padrão da média 0,5. O valor-p equivale a 0,267, ou seja, a probabilidade de encontrarmos um
valor tão extremo quanto 0,47 presumindo que 0,5 seja verdadeira é de 26,7%, o que é uma probabilidade
alta e longe do ńıvel de significância de 5%.
Exerćıcio 3 (4 pontos) continua na próxima página. . . Página 4 de 10
Prof. Glauco Peres ( FLS 5028 e FLP 0406 ): Lista de Exerćıcio #7Exerćıcio 3 (4 pontos) (continuação)
(c)
Se você fosse o funcionário responsável para reportar os resultados da pesquisa ao prefeito, como você
resumiria os achados? Podemos supor que a população daquele bairro seja majoritariamente a favor da
medida? Justifique sua resposta.
Com 95% de confiança, podemos dizer que a população do Butantã que é a favor da nova lei de zoneamento
está entre 41,7% e 52,3%. A proporção encontrada na amostra de 47% favoráveis pode estar sub ou
supervalorizada, de forma que não temos certeza de que a maioria dos residentes daquele bairro são
favoráveis ao projeto. O que podemos inferir a partir do intervalo de confiança constrúıdo é que a população
local encontra-se dividida nesta matéria, e que seria improvável haver um grande bloco populacional
contrário ou favorável ao projeto de lei.
Exerćıcio 4 (5 pontos)
Suponhamos que um pesquisador acredita que os homens são mais afeitos a avaliar negativamente a atuação
do prefeito Haddadno governo do que as mulheres. Para testar tal hipótese, ele constrói uma tabela de con-
tingência com as variáveis “gênero” e “avaliação do governo Haddad”, ambas optidas no site do Datafolha1.
O resultado obtido é o seguinte:
Tabela 1a: Gênero e avaliação do governo Haddad (frequência absoluta).
Avaliação do Sexo
governo Haddad Masculino Feminino
TOTAL
Ótimo/Bom 82 81 163
Regular 153 215 368
Ruim/Péssimo 266 268 534
Total 501 564 1065
(a)
A partir do enunciado do exerćıcio, estabeleça as hipóteses nula (H0) e alternativa (H1).
H0: A variável gênero e a variável avaliação do governo Haddad são independentes. (elas não covariam)
H1: A variável gênero e a variável avaliação do governo Haddad são dependentes. (elas covariam)
1O Datafolha fez uma pesquisa intitulada “Avaliação do prefeito de São Paulo Fernando Haddad” entre 28 e 29/10/2015.
(http://media.folha.uol.com.br/datafolha/2015/11/03/avaliacao-haddad.pdf). Os dados utilizados nesse exerćıcio foram retira-
dos da tabela na página 10 do relatório. Os valores correspondentes à categoria “Não sabe” foram desconsiderados.
Exerćıcio 4 (5 pontos) continua na próxima página. . . Página 5 de 10
Prof. Glauco Peres ( FLS 5028 e FLP 0406 ): Lista de Exerćıcio #7Exerćıcio 4 (5 pontos) (continuação)
(b)
Apresente uma tabela de contingência com a frequência esperada (fe) para cada célula.
A frequência esperada (fe =
(Total da Linha)× (Total da Coluna)
Total das observacoes
) para cada célula é a frequência que
esperaŕıamos encontrar caso as variáveis “gênero” e “avaliação do governo Haddad” não tivessem nenhuma
relação. Ou seja, ao variar a variável “gênero”, a variável “avaliação do governo Haddad” não sofreria
nenhuma alteração.
Como a variável dependente está posicionada nas linhas da tabela e a variável independente nas colunas,
faremos a porcentagem pelo total das colunas. Esse procedimento serve para compararmos se há ou não
relação entre as duas variáveis, como explicado por Kellstedt e Whitten (2013, p.152). Então a tabela
ficaria dessa forma:
Tabela 1: Gênero e avaliação do governo Haddad
(frequência absoluta e frequência relativa)
Avaliação do governo Haddad Masculino Feminino Total
Ótimo/Bom 82 (16,37%) 81 (14,36%) 163 (15,31%)
Regular 153 (30,54%) 215 (38,12%) 368 (34,55%)
Ruim/Péssimo 266 (53,1%) 268 (47,52%) 534 (50,14%)
Total 501 (100%) 564 (100%) 1065 (100%)
Como podemos observar o número de homens que avaliam negativamente o governo do Haddad (53,1%)
é um pouco maior do que esperaŕıamos caso estas duas variáveis não tivessem nenhum relação (50,1%),
como apresentado na tabela abaixo:
Tabela 2: Tabela de contingência com a frequência esperada (fe) para cada célula.
Avaliação do governo Haddad Masculino Feminino Total
Ótimo/Bom 76 (15,17%) 86 (15,25%) 163 (15,31%)
Regular 173 (34,53%) 195 (34,57%) 368 (34,55%)
Ruim/Péssimo 251 (50,1%) 283 (50,18%) 534 (50,14%)
Total 501 (100%) 564 (100%) 1065 (100%)
(c)
Calcule o valor do qui-quadrado. Apresente o cálculo realizado.
Para saber se os valores observados estão muito distantes dos valores esperados, precisamos calcular o
valor do qui-quadrado que é dado pela seguinte fórmula: χ2 = Σ
(O − E)2
E
χ2 = Σ
(O − E)2
E
=
(82− 76)2
76
+
(81− 86)2
86
+
(153− 173)2
173
+
(215− 195)2
195
+
(266− 251)2
251
+
(268− 283)2
283
=
36
76
+
25
86
+
400
173
+
400
195
+
225
251
+
225
283
= 0, 474 + 0, 291 + 2, 312 + 2, 051 + 0, 896 + 0, 795
χ2 = 6, 819
(1)
Exerćıcio 4 (5 pontos) continua na próxima página. . . Página 6 de 10
Prof. Glauco Peres ( FLS 5028 e FLP 0406 ): Lista de Exerćıcio #7Exerćıcio 4 (5 pontos) (continuação)
(d)
Em vista das hipóteses estabelecidas em (a) e do valor do qui-quadrado calculado em (c), realize um teste
de hipóteses com ńıvel de significância de 95%. Interprete o resultado obtido.
H0: A variável gênero e a variável avaliação do governo Haddad são independentes. (elas não covariam)
H1: A variável gênero e a variável avaliação do governo Haddad são dependentes. (elas covariam)
χ2 = 6, 819
Cálculo do graus de liberade: gl = (l − 1)(c− 1) = (3− 1)(2− 1) = 2× 1 = 2
De acordo com a tabela da distribuição do qui-quadrado o valor χ2 cŕıtico para 1 grau de liberdade e com
ńıvel de significância de 95%, corresponde a 5,991.
Figura 1: Distribuição qui-quadrado.
O valor encontrado do qui-quadrado (χ2 = 6, 819) é maior do que o qui-quadrado cŕıtico. Portanto, o
valor do qui-quadrado deste exerćıcio está na área de rejeição da curva acima (área em vermelho). Assim
sendo, nós rejeitamos a hipótese nula do teste, que postula que as duas variáveis são idenpendentes. Em
suma, a variável “gênero”e a variável “avaliação do governo Haddad” não são independentes.
Exerćıcio 4 (5 pontos) continua na próxima página. . . Página 7 de 10
Prof. Glauco Peres ( FLS 5028 e FLP 0406 ): Lista de Exerćıcio #7Exerćıcio 4 (5 pontos) (continuação)
(e)
Em vista das hipóteses estabelecidas em (a) e do valor do qui-quadrado calculado em (c), realize um teste
de hipóteses com ńıvel de significância de 99%. Interprete o resultado obtido.
H0: A variável gênero e a variável avaliação do governo Haddad são independentes. (elas não covariam)
H1: A variável gênero e a variável avaliação do governo Haddad são dependentes. (elas covariam)
χ2 = 6, 819
Cálculo do graus de liberade: gl = (l − 1)(c− 1) = (3− 1)(2− 1) = 2× 1 = 2
De acordo com a tabela da distribuição do qui-quadrado o valor χ2 cŕıtico para 1 grau de liberdade e com
ńıvel de significância de 99%, corresponde a 9,210.
Figura 1: Distribuição qui-quadrado.
O valor encontrado do qui-quadrado (χ2 = 6, 819) é inferior ao qui-quadrado cŕıtico. Portanto, o valor
do qui-quadrado deste exerćıcio não está na área de rejeição da curva acima (área em vermelho). Assim
sendo, nós não rejeitamos a hipótese nula do teste, que postula que as duas variáveis são idenpendentes.
Em suma, a variável “gênero”e a variável “avaliação do governo Haddad” são independentes e não têm
relação.
(f)
E por que utilizamos um Teste Qui-Quadrado ao invés de um Teste-Z ou um Teste-T neste caso? (Máx. 5
linhas)
Isso porque o teste qui-quadrado é utilizado quando tanto a variável dependente e a variável independente
são categóricas (este ponto é explicado por Kellstedt e Whitten (2013, caṕıtulo 7)), como é o caso das
variáveis “gênero”e “avaliação do governo Haddad” analisado neste exerćıcio. Por sua vez, o Teste-Z
e o Teste-T são utilizados quando ou a variável dependente e/ou a variável independente são variáveis
cont́ınuas.
Exerćıcio 4 (5 pontos) continua na próxima página. . . Página 8 de 10
Prof. Glauco Peres ( FLS 5028 e FLP 0406 ): Lista de Exerćıcio #7Exerćıcio 4 (5 pontos) (continuação)
(g)
Um teste qui-quadrado, tal como o utilizado no exerćıcio anterior, nos permite inferir uma relação de cau-
salidade entre “gênero” e “avaliação do governo Haddad”? Justifique sua resposta (Máx. 7 linhas).
Não, o teste qui-quadrado não nos possibilita inferir causalidade entre as variáveis. Com explicado por
Kellstedt e Whitten (2013, p.156), o teste qui-quadrado permite identificar se as duas variáveis analisadas
covariam, que seria o terceiro passo para se estabelecer uma relação de causalidade. O que este teste não
permite e é essencial para se estabelecer uma relação de causalidade é identificar se há uma variável Z
que torne a associação entre estas duas variáveis analisadas em uma relação espúria (4o e último passo).
Como o teste qui-quadrado é um teste de bi-variáveis, por definição, nós não conseguiŕıamos saber se há
uma variável Z relevante, dado que só há duas variáveis sendo analisadas.
(h)
Explique o que é o p-valor e como ele é utilizado em um teste de hipóteses.
Como descrito por Kellstedte Whitten (2013, p.147-148), o p-valor é um elemento do teste de hipótese
que varia entre 0 e 1. Como em estat́ıstica, a ideia é comparar padrões com dados do mundo real, o
p-valor entra na lógica de que quanto mais diferente os dados observados são dos dados que esperaŕıamos
encontrar, caso não houvesse nenhum relação entre as variáveis, mais confiantes estaremos em afirmar
que há uma relação entre as duas variáveis analisadas. Assim sendo, o p-valor nos diz a probabilidade
de que veŕıamos esta relação observada entre as duas variáveis obtidas pela amostra, se fosse realmente
verdade que não haveria nenhuma relação entre elas na população (hipótese nula). Ou seja, quanto menor
o p-valor, mais confiança nós temos em afirmar que há uma relação sistemática entre as duas variáveis,
para as quais nós estimamos este p-valor.
(i)
Há algum problema em interpretar o p-valor no survey da “Chewing Magazine”? Comente sobre as limitações
do p-valor.
Exerćıcio 4 (5 pontos) [(i)] continua na próxima página. . . Página 9 de 10
Prof. Glauco Peres ( FLS 5028 e FLP 0406 ): Lista de Exerćıcio #7 Exerćıcio 4 (5 pontos)
Uma das limitações é que o p-valor não reflete a qualidade do processo de mensuração das variáveis
analisadas. Dessa forma, se não estamos confiantes nas nossas medições, devemos também ser cautelosos
ao afirmar que tal relação é estatisticamente significativa dado um determinado p-valor. O quadrinho acima
retrata uma situação em que a mensuração dos dados foi manipulada, portanto devemos ser cautelosos ao
analisar os dados do survey da “Chewing Magazine”.
Outras limitações do p-valor: (a) apesar do p-valor estimar a confiança que podemos ter de que há uma
relação entre as duas variáveis, ele não indica que há uma relação de causalidade entre as variáveis;
(b) outra limitação é referente a intensidade da relação, um p-valor baixo (próximo de zero) não indica
necessariamente que a relação entre as duas variáveis é muito forte; (c) por fim, o p-valor tem como
pressuposto de que a amostra foi obtida de forma aleatória, quando este pressuposto não é seguido,
devemos ter cautela com relação ao p-valor estimado.
Página 10 de 10