Buscar

Lista_07_Gabarito

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 10 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 10 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 10 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Prof. Glauco Peres ( FLS 5028 e FLP 0406 ): Lista de Exerćıcio #7
Universidade de São Paulo
Faculdade de Filosofia, Letras e Ciências Humanas
Departamento de Ciência Poĺıtica
FLS 5028
Métodos Quantitativos e Técnicas de Pesquisa em Ciência Poĺıtica
FLP0406
Métodos e Técnicas de Pesquisa em Ciência Poĺıtica
1o semestre / 2016
Prof. Glauco Peres da Silva
LISTA DE EXERCÍCIOS 07
Data de entrega: 09/05/2016 (noturno) e 11/05/2016 (vespertino)
Exerćıcio 1 (2 pontos)
Após ler atenciosamente os textos indicados para a aula, avalie as afirmações a seguir. Para cada uma
delas, julgue se é “verdadeira” ou “falsa”. Adicionalmente, reescreva as frases que forem classificadas como
“falsas”, corrigindo-as no que for necessário (lembre de sublinhar as alterações feitas por você).
(a)
(F) O teste de significância usa dados para resumir a evidência sobre uma hipótese, comparando as esti-
mativas por pontos dos parâmetros aos valores previstos pela hipótese. Tanto nos testes de significância
bilaterais quanto nos unilaterais, as hipóteses (H0 e H1) sempre se referem às estat́ısticas amostrais e não
aos parâmetros da população, de forma que podemos expressar uma hipótese nula como H0 : Ȳ = 0.
O primeiro peŕıodo está correto. O segundo peŕıodo, entretanto, está errado: as hipóteses sempre se
referem aos parâmetros da população e não às estat́ısticas amostrais. Portanto, nunca podemos expressar
uma hipótese usando uma notação estat́ıstica amostral como “H0 : Ȳ = 0”. H0 deve fazer referência ao
parâmetro da população (ex. H0 : µ = µ0). Referência: Agresti e Finlay, caṕıtulo 6, páginas 169 e 179.
Exerćıcio 1 (2 pontos) continua na próxima página. . . Página 1 de 10
Prof. Glauco Peres ( FLS 5028 e FLP 0406 ): Lista de Exerćıcio #7Exerćıcio 1 (2 pontos) (continuação)
(b)
(F) Para evitarmos tendenciosidade ao conduzirmos um teste de hipótese, podemos definir o ńıvel de signi-
ficância (α) após a análise dos dados. Os ńıveis geralmente escolhidos são 0,05 e 0,01.
Devemos selecionar o ńıvel de significância antes de analisar os dados, para evitarmos tendenciosidade na
escolha - Agresti e Finlay, cap 6, pág. 180 .
(c)
(F) Ao realizarmos um teste de significância para uma proporção (variável categórica) utilizamos o escore-t
como estat́ıstica teste e a média Ȳ como parâmetro da população. Considerando-se H0 : µ = µ̂0, podemos
calcular a estat́ıstica teste da seguinte forma:
t =
Ȳ − µ0
ep
tal que, ep =
s√
n
Para uma variável categórica, o parâmetro é a proporção da população em uma determinada ca-tegoria
(π). Para amostras grandes, se H0 é verdadeira, a estat́ıstica-teste Z tem uma distribuição normal padrão;
seu cálculo é realizado da seguinte forma:
z =
π̂ − π0
ep0
tal que, ep0 =
√
π0(1− π0)
n
(d)
(V) Há dois tipos de erros em testes de hipótese. O “erro do Tipo I” ocorre se rejeitamos a hipótese nula
(H0) mesmo ela sendo verdadeira. A probabilidade de incorrermos em um erro do Tipo I é exatamente o
ńıvel de significância “α” para o teste, ou seja, se α = 0, 05, temos 5% de probabilidade de incorrermos no
erro do Tipo I.
Exerćıcio 2 (4 pontos)
(Todos os cálculos devem ser demonstrados)
Suponhamos que a Faculdade de Filosofia Letras e Ciências Humanas da USP (FFLCH) realizava um teste
com uma amostra aleatória de 50 alunos todos os anos para avaliar o desempenho do conhecimento de seus
alunos. Este teste era sempre consistente em seu ńıvel de dificuldade e que a média até o ano de 2015 era
de 60. No ano de 2016 a FFLCH realizou este teste com uma amostra aleatória de 50 alunos e obteve uma
média de 80 pontos. Considere que o desvio padrão seja de 55.
Exerćıcio 2 (4 pontos) continua na próxima página. . . Página 2 de 10
Prof. Glauco Peres ( FLS 5028 e FLP 0406 ): Lista de Exerćıcio #7Exerćıcio 2 (4 pontos) (continuação)
(a)
Realize um teste de significância para as médias para testar se a nova pontuação se deveu apenas a uma
variação amostral, com ńıvel de significância de 95%. Calcule o erro padrão e a estat́ıstica-t.
Teste de significância para uma média - variável quantitativa.
n = 50
s = 55
Ȳ = 80
µ = 60
ep =
s√
n
=
55√
50
= 7, 78
t =
Ȳ − µ0
ep
=
80− 60
7, 78
= 2, 57
(b)
Desenhe um gráfico com a estat́ıstica-t encontrada e o ponto cŕıtico para o qual rejeitamos a hipótese nula
de que a diferença entre as médias se deveu a uma variação amostral. Indique também o valor-p encontrado
para o teste.
Observando a tabela da estat́ıstica-t, com gl=50-1 e ńıvel de significância de 5%, vemos que o valor-t =
2,0.
Portanto, temos forte evidência contra a hipótese nula (H0).
(c)
A partir de seus cálculos o que você pode concluir sobre o desempenho dos alunos do ano de 2016?
O valor-t encontrado em nossos cálculos é ainda mais extremo que este (t = 2, 57) o que indica que podemos
rejeitar a hipótese nula de que a diferença entre as médias se deu apenas por uma variação amostral. Ou
seja, podemos concluir que os alunos de 2016 foram melhores que a média dos anos anteriores.
Página 3 de 10
Prof. Glauco Peres ( FLS 5028 e FLP 0406 ): Lista de Exerćıcio #7 Exerćıcio 2 (4 pontos)
Exerćıcio 3 (4 pontos)
A prefeitura de São Paulo quer implementar uma nova lei de zoneamento para o bairro Butantã e acredita
que ao menos 50% dos moradores daquele bairro é favorável à nova lei. Para confirmar o apoio popular a
esta medida, a prefeitura realizou uma pesquisa com uma amostra aleatória de 350 moradores. O número
de moradores favoráveis à pesquisa foi de 165, enquanto 185 se manifestaram contra.
(a)
Qual a hipótese nula e a hipótese alternativa nesta pesquisa? Calcule o erro padrão estimado sob a suposição
de que H0 é verdadeira (ep0) e construa um intervalo de 95% confiança para a propor-ção da amostra.
Este é um teste de significância para uma proporção, ou seja, estamos lidando com uma variável categórica.
n = 350
a favor = 165 ou 0, 47
contra = 185 ou 0, 53
H0 : π = 0, 5
H1 : π > 0, 5
ep0 =
π0(1− π0)√
n
=
√
0, 5× 0, 5
350
=
√
0, 25
350
= 0, 027
IC95% : π̂ ± 1, 96× (ep0)
IC95% : 0, 47± 1, 96× 0, 027
IC : 0, 417 a 0, 523
(b)
Desenhe um gráfico que resuma o valor-p encontrado, indicando a posição da estat́ıstica-teste em relação à
média e sombreando a área de rejeição de H0.
z =
π̂ − π0
ep
=
0, 47− 0, 5
0, 027
=
−0, 03
0, 027
= −1, 11
Nossa estat́ıstica-z de -1,11 não encontra-se na área de rejeição da hipótese nula, que corresponde a 1,96
desvios padrão da média 0,5. O valor-p equivale a 0,267, ou seja, a probabilidade de encontrarmos um
valor tão extremo quanto 0,47 presumindo que 0,5 seja verdadeira é de 26,7%, o que é uma probabilidade
alta e longe do ńıvel de significância de 5%.
Exerćıcio 3 (4 pontos) continua na próxima página. . . Página 4 de 10
Prof. Glauco Peres ( FLS 5028 e FLP 0406 ): Lista de Exerćıcio #7Exerćıcio 3 (4 pontos) (continuação)
(c)
Se você fosse o funcionário responsável para reportar os resultados da pesquisa ao prefeito, como você
resumiria os achados? Podemos supor que a população daquele bairro seja majoritariamente a favor da
medida? Justifique sua resposta.
Com 95% de confiança, podemos dizer que a população do Butantã que é a favor da nova lei de zoneamento
está entre 41,7% e 52,3%. A proporção encontrada na amostra de 47% favoráveis pode estar sub ou
supervalorizada, de forma que não temos certeza de que a maioria dos residentes daquele bairro são
favoráveis ao projeto. O que podemos inferir a partir do intervalo de confiança constrúıdo é que a população
local encontra-se dividida nesta matéria, e que seria improvável haver um grande bloco populacional
contrário ou favorável ao projeto de lei.
Exerćıcio 4 (5 pontos)
Suponhamos que um pesquisador acredita que os homens são mais afeitos a avaliar negativamente a atuação
do prefeito Haddadno governo do que as mulheres. Para testar tal hipótese, ele constrói uma tabela de con-
tingência com as variáveis “gênero” e “avaliação do governo Haddad”, ambas optidas no site do Datafolha1.
O resultado obtido é o seguinte:
Tabela 1a: Gênero e avaliação do governo Haddad (frequência absoluta).
Avaliação do Sexo
governo Haddad Masculino Feminino
TOTAL
Ótimo/Bom 82 81 163
Regular 153 215 368
Ruim/Péssimo 266 268 534
Total 501 564 1065
(a)
A partir do enunciado do exerćıcio, estabeleça as hipóteses nula (H0) e alternativa (H1).
H0: A variável gênero e a variável avaliação do governo Haddad são independentes. (elas não covariam)
H1: A variável gênero e a variável avaliação do governo Haddad são dependentes. (elas covariam)
1O Datafolha fez uma pesquisa intitulada “Avaliação do prefeito de São Paulo Fernando Haddad” entre 28 e 29/10/2015.
(http://media.folha.uol.com.br/datafolha/2015/11/03/avaliacao-haddad.pdf). Os dados utilizados nesse exerćıcio foram retira-
dos da tabela na página 10 do relatório. Os valores correspondentes à categoria “Não sabe” foram desconsiderados.
Exerćıcio 4 (5 pontos) continua na próxima página. . . Página 5 de 10
Prof. Glauco Peres ( FLS 5028 e FLP 0406 ): Lista de Exerćıcio #7Exerćıcio 4 (5 pontos) (continuação)
(b)
Apresente uma tabela de contingência com a frequência esperada (fe) para cada célula.
A frequência esperada (fe =
(Total da Linha)× (Total da Coluna)
Total das observacoes
) para cada célula é a frequência que
esperaŕıamos encontrar caso as variáveis “gênero” e “avaliação do governo Haddad” não tivessem nenhuma
relação. Ou seja, ao variar a variável “gênero”, a variável “avaliação do governo Haddad” não sofreria
nenhuma alteração.
Como a variável dependente está posicionada nas linhas da tabela e a variável independente nas colunas,
faremos a porcentagem pelo total das colunas. Esse procedimento serve para compararmos se há ou não
relação entre as duas variáveis, como explicado por Kellstedt e Whitten (2013, p.152). Então a tabela
ficaria dessa forma:
Tabela 1: Gênero e avaliação do governo Haddad
(frequência absoluta e frequência relativa)
Avaliação do governo Haddad Masculino Feminino Total
Ótimo/Bom 82 (16,37%) 81 (14,36%) 163 (15,31%)
Regular 153 (30,54%) 215 (38,12%) 368 (34,55%)
Ruim/Péssimo 266 (53,1%) 268 (47,52%) 534 (50,14%)
Total 501 (100%) 564 (100%) 1065 (100%)
Como podemos observar o número de homens que avaliam negativamente o governo do Haddad (53,1%)
é um pouco maior do que esperaŕıamos caso estas duas variáveis não tivessem nenhum relação (50,1%),
como apresentado na tabela abaixo:
Tabela 2: Tabela de contingência com a frequência esperada (fe) para cada célula.
Avaliação do governo Haddad Masculino Feminino Total
Ótimo/Bom 76 (15,17%) 86 (15,25%) 163 (15,31%)
Regular 173 (34,53%) 195 (34,57%) 368 (34,55%)
Ruim/Péssimo 251 (50,1%) 283 (50,18%) 534 (50,14%)
Total 501 (100%) 564 (100%) 1065 (100%)
(c)
Calcule o valor do qui-quadrado. Apresente o cálculo realizado.
Para saber se os valores observados estão muito distantes dos valores esperados, precisamos calcular o
valor do qui-quadrado que é dado pela seguinte fórmula: χ2 = Σ
(O − E)2
E
χ2 = Σ
(O − E)2
E
=
(82− 76)2
76
+
(81− 86)2
86
+
(153− 173)2
173
+
(215− 195)2
195
+
(266− 251)2
251
+
(268− 283)2
283
=
36
76
+
25
86
+
400
173
+
400
195
+
225
251
+
225
283
= 0, 474 + 0, 291 + 2, 312 + 2, 051 + 0, 896 + 0, 795
χ2 = 6, 819
(1)
Exerćıcio 4 (5 pontos) continua na próxima página. . . Página 6 de 10
Prof. Glauco Peres ( FLS 5028 e FLP 0406 ): Lista de Exerćıcio #7Exerćıcio 4 (5 pontos) (continuação)
(d)
Em vista das hipóteses estabelecidas em (a) e do valor do qui-quadrado calculado em (c), realize um teste
de hipóteses com ńıvel de significância de 95%. Interprete o resultado obtido.
H0: A variável gênero e a variável avaliação do governo Haddad são independentes. (elas não covariam)
H1: A variável gênero e a variável avaliação do governo Haddad são dependentes. (elas covariam)
χ2 = 6, 819
Cálculo do graus de liberade: gl = (l − 1)(c− 1) = (3− 1)(2− 1) = 2× 1 = 2
De acordo com a tabela da distribuição do qui-quadrado o valor χ2 cŕıtico para 1 grau de liberdade e com
ńıvel de significância de 95%, corresponde a 5,991.
Figura 1: Distribuição qui-quadrado.
O valor encontrado do qui-quadrado (χ2 = 6, 819) é maior do que o qui-quadrado cŕıtico. Portanto, o
valor do qui-quadrado deste exerćıcio está na área de rejeição da curva acima (área em vermelho). Assim
sendo, nós rejeitamos a hipótese nula do teste, que postula que as duas variáveis são idenpendentes. Em
suma, a variável “gênero”e a variável “avaliação do governo Haddad” não são independentes.
Exerćıcio 4 (5 pontos) continua na próxima página. . . Página 7 de 10
Prof. Glauco Peres ( FLS 5028 e FLP 0406 ): Lista de Exerćıcio #7Exerćıcio 4 (5 pontos) (continuação)
(e)
Em vista das hipóteses estabelecidas em (a) e do valor do qui-quadrado calculado em (c), realize um teste
de hipóteses com ńıvel de significância de 99%. Interprete o resultado obtido.
H0: A variável gênero e a variável avaliação do governo Haddad são independentes. (elas não covariam)
H1: A variável gênero e a variável avaliação do governo Haddad são dependentes. (elas covariam)
χ2 = 6, 819
Cálculo do graus de liberade: gl = (l − 1)(c− 1) = (3− 1)(2− 1) = 2× 1 = 2
De acordo com a tabela da distribuição do qui-quadrado o valor χ2 cŕıtico para 1 grau de liberdade e com
ńıvel de significância de 99%, corresponde a 9,210.
Figura 1: Distribuição qui-quadrado.
O valor encontrado do qui-quadrado (χ2 = 6, 819) é inferior ao qui-quadrado cŕıtico. Portanto, o valor
do qui-quadrado deste exerćıcio não está na área de rejeição da curva acima (área em vermelho). Assim
sendo, nós não rejeitamos a hipótese nula do teste, que postula que as duas variáveis são idenpendentes.
Em suma, a variável “gênero”e a variável “avaliação do governo Haddad” são independentes e não têm
relação.
(f)
E por que utilizamos um Teste Qui-Quadrado ao invés de um Teste-Z ou um Teste-T neste caso? (Máx. 5
linhas)
Isso porque o teste qui-quadrado é utilizado quando tanto a variável dependente e a variável independente
são categóricas (este ponto é explicado por Kellstedt e Whitten (2013, caṕıtulo 7)), como é o caso das
variáveis “gênero”e “avaliação do governo Haddad” analisado neste exerćıcio. Por sua vez, o Teste-Z
e o Teste-T são utilizados quando ou a variável dependente e/ou a variável independente são variáveis
cont́ınuas.
Exerćıcio 4 (5 pontos) continua na próxima página. . . Página 8 de 10
Prof. Glauco Peres ( FLS 5028 e FLP 0406 ): Lista de Exerćıcio #7Exerćıcio 4 (5 pontos) (continuação)
(g)
Um teste qui-quadrado, tal como o utilizado no exerćıcio anterior, nos permite inferir uma relação de cau-
salidade entre “gênero” e “avaliação do governo Haddad”? Justifique sua resposta (Máx. 7 linhas).
Não, o teste qui-quadrado não nos possibilita inferir causalidade entre as variáveis. Com explicado por
Kellstedt e Whitten (2013, p.156), o teste qui-quadrado permite identificar se as duas variáveis analisadas
covariam, que seria o terceiro passo para se estabelecer uma relação de causalidade. O que este teste não
permite e é essencial para se estabelecer uma relação de causalidade é identificar se há uma variável Z
que torne a associação entre estas duas variáveis analisadas em uma relação espúria (4o e último passo).
Como o teste qui-quadrado é um teste de bi-variáveis, por definição, nós não conseguiŕıamos saber se há
uma variável Z relevante, dado que só há duas variáveis sendo analisadas.
(h)
Explique o que é o p-valor e como ele é utilizado em um teste de hipóteses.
Como descrito por Kellstedte Whitten (2013, p.147-148), o p-valor é um elemento do teste de hipótese
que varia entre 0 e 1. Como em estat́ıstica, a ideia é comparar padrões com dados do mundo real, o
p-valor entra na lógica de que quanto mais diferente os dados observados são dos dados que esperaŕıamos
encontrar, caso não houvesse nenhum relação entre as variáveis, mais confiantes estaremos em afirmar
que há uma relação entre as duas variáveis analisadas. Assim sendo, o p-valor nos diz a probabilidade
de que veŕıamos esta relação observada entre as duas variáveis obtidas pela amostra, se fosse realmente
verdade que não haveria nenhuma relação entre elas na população (hipótese nula). Ou seja, quanto menor
o p-valor, mais confiança nós temos em afirmar que há uma relação sistemática entre as duas variáveis,
para as quais nós estimamos este p-valor.
(i)
Há algum problema em interpretar o p-valor no survey da “Chewing Magazine”? Comente sobre as limitações
do p-valor.
Exerćıcio 4 (5 pontos) [(i)] continua na próxima página. . . Página 9 de 10
Prof. Glauco Peres ( FLS 5028 e FLP 0406 ): Lista de Exerćıcio #7 Exerćıcio 4 (5 pontos)
Uma das limitações é que o p-valor não reflete a qualidade do processo de mensuração das variáveis
analisadas. Dessa forma, se não estamos confiantes nas nossas medições, devemos também ser cautelosos
ao afirmar que tal relação é estatisticamente significativa dado um determinado p-valor. O quadrinho acima
retrata uma situação em que a mensuração dos dados foi manipulada, portanto devemos ser cautelosos ao
analisar os dados do survey da “Chewing Magazine”.
Outras limitações do p-valor: (a) apesar do p-valor estimar a confiança que podemos ter de que há uma
relação entre as duas variáveis, ele não indica que há uma relação de causalidade entre as variáveis;
(b) outra limitação é referente a intensidade da relação, um p-valor baixo (próximo de zero) não indica
necessariamente que a relação entre as duas variáveis é muito forte; (c) por fim, o p-valor tem como
pressuposto de que a amostra foi obtida de forma aleatória, quando este pressuposto não é seguido,
devemos ter cautela com relação ao p-valor estimado.
Página 10 de 10

Outros materiais