Baixe o app para aproveitar ainda mais
Prévia do material em texto
Prof. Glauco Peres ( FLS 5028 e FLP 0406 ): Lista de Exerćıcio #7 Universidade de São Paulo Faculdade de Filosofia, Letras e Ciências Humanas Departamento de Ciência Poĺıtica FLS 5028 Métodos Quantitativos e Técnicas de Pesquisa em Ciência Poĺıtica FLP0406 Métodos e Técnicas de Pesquisa em Ciência Poĺıtica 1o semestre / 2016 Prof. Glauco Peres da Silva LISTA DE EXERCÍCIOS 07 Data de entrega: 09/05/2016 (noturno) e 11/05/2016 (vespertino) Exerćıcio 1 (2 pontos) Após ler atenciosamente os textos indicados para a aula, avalie as afirmações a seguir. Para cada uma delas, julgue se é “verdadeira” ou “falsa”. Adicionalmente, reescreva as frases que forem classificadas como “falsas”, corrigindo-as no que for necessário (lembre de sublinhar as alterações feitas por você). (a) (F) O teste de significância usa dados para resumir a evidência sobre uma hipótese, comparando as esti- mativas por pontos dos parâmetros aos valores previstos pela hipótese. Tanto nos testes de significância bilaterais quanto nos unilaterais, as hipóteses (H0 e H1) sempre se referem às estat́ısticas amostrais e não aos parâmetros da população, de forma que podemos expressar uma hipótese nula como H0 : Ȳ = 0. O primeiro peŕıodo está correto. O segundo peŕıodo, entretanto, está errado: as hipóteses sempre se referem aos parâmetros da população e não às estat́ısticas amostrais. Portanto, nunca podemos expressar uma hipótese usando uma notação estat́ıstica amostral como “H0 : Ȳ = 0”. H0 deve fazer referência ao parâmetro da população (ex. H0 : µ = µ0). Referência: Agresti e Finlay, caṕıtulo 6, páginas 169 e 179. Exerćıcio 1 (2 pontos) continua na próxima página. . . Página 1 de 10 Prof. Glauco Peres ( FLS 5028 e FLP 0406 ): Lista de Exerćıcio #7Exerćıcio 1 (2 pontos) (continuação) (b) (F) Para evitarmos tendenciosidade ao conduzirmos um teste de hipótese, podemos definir o ńıvel de signi- ficância (α) após a análise dos dados. Os ńıveis geralmente escolhidos são 0,05 e 0,01. Devemos selecionar o ńıvel de significância antes de analisar os dados, para evitarmos tendenciosidade na escolha - Agresti e Finlay, cap 6, pág. 180 . (c) (F) Ao realizarmos um teste de significância para uma proporção (variável categórica) utilizamos o escore-t como estat́ıstica teste e a média Ȳ como parâmetro da população. Considerando-se H0 : µ = µ̂0, podemos calcular a estat́ıstica teste da seguinte forma: t = Ȳ − µ0 ep tal que, ep = s√ n Para uma variável categórica, o parâmetro é a proporção da população em uma determinada ca-tegoria (π). Para amostras grandes, se H0 é verdadeira, a estat́ıstica-teste Z tem uma distribuição normal padrão; seu cálculo é realizado da seguinte forma: z = π̂ − π0 ep0 tal que, ep0 = √ π0(1− π0) n (d) (V) Há dois tipos de erros em testes de hipótese. O “erro do Tipo I” ocorre se rejeitamos a hipótese nula (H0) mesmo ela sendo verdadeira. A probabilidade de incorrermos em um erro do Tipo I é exatamente o ńıvel de significância “α” para o teste, ou seja, se α = 0, 05, temos 5% de probabilidade de incorrermos no erro do Tipo I. Exerćıcio 2 (4 pontos) (Todos os cálculos devem ser demonstrados) Suponhamos que a Faculdade de Filosofia Letras e Ciências Humanas da USP (FFLCH) realizava um teste com uma amostra aleatória de 50 alunos todos os anos para avaliar o desempenho do conhecimento de seus alunos. Este teste era sempre consistente em seu ńıvel de dificuldade e que a média até o ano de 2015 era de 60. No ano de 2016 a FFLCH realizou este teste com uma amostra aleatória de 50 alunos e obteve uma média de 80 pontos. Considere que o desvio padrão seja de 55. Exerćıcio 2 (4 pontos) continua na próxima página. . . Página 2 de 10 Prof. Glauco Peres ( FLS 5028 e FLP 0406 ): Lista de Exerćıcio #7Exerćıcio 2 (4 pontos) (continuação) (a) Realize um teste de significância para as médias para testar se a nova pontuação se deveu apenas a uma variação amostral, com ńıvel de significância de 95%. Calcule o erro padrão e a estat́ıstica-t. Teste de significância para uma média - variável quantitativa. n = 50 s = 55 Ȳ = 80 µ = 60 ep = s√ n = 55√ 50 = 7, 78 t = Ȳ − µ0 ep = 80− 60 7, 78 = 2, 57 (b) Desenhe um gráfico com a estat́ıstica-t encontrada e o ponto cŕıtico para o qual rejeitamos a hipótese nula de que a diferença entre as médias se deveu a uma variação amostral. Indique também o valor-p encontrado para o teste. Observando a tabela da estat́ıstica-t, com gl=50-1 e ńıvel de significância de 5%, vemos que o valor-t = 2,0. Portanto, temos forte evidência contra a hipótese nula (H0). (c) A partir de seus cálculos o que você pode concluir sobre o desempenho dos alunos do ano de 2016? O valor-t encontrado em nossos cálculos é ainda mais extremo que este (t = 2, 57) o que indica que podemos rejeitar a hipótese nula de que a diferença entre as médias se deu apenas por uma variação amostral. Ou seja, podemos concluir que os alunos de 2016 foram melhores que a média dos anos anteriores. Página 3 de 10 Prof. Glauco Peres ( FLS 5028 e FLP 0406 ): Lista de Exerćıcio #7 Exerćıcio 2 (4 pontos) Exerćıcio 3 (4 pontos) A prefeitura de São Paulo quer implementar uma nova lei de zoneamento para o bairro Butantã e acredita que ao menos 50% dos moradores daquele bairro é favorável à nova lei. Para confirmar o apoio popular a esta medida, a prefeitura realizou uma pesquisa com uma amostra aleatória de 350 moradores. O número de moradores favoráveis à pesquisa foi de 165, enquanto 185 se manifestaram contra. (a) Qual a hipótese nula e a hipótese alternativa nesta pesquisa? Calcule o erro padrão estimado sob a suposição de que H0 é verdadeira (ep0) e construa um intervalo de 95% confiança para a propor-ção da amostra. Este é um teste de significância para uma proporção, ou seja, estamos lidando com uma variável categórica. n = 350 a favor = 165 ou 0, 47 contra = 185 ou 0, 53 H0 : π = 0, 5 H1 : π > 0, 5 ep0 = π0(1− π0)√ n = √ 0, 5× 0, 5 350 = √ 0, 25 350 = 0, 027 IC95% : π̂ ± 1, 96× (ep0) IC95% : 0, 47± 1, 96× 0, 027 IC : 0, 417 a 0, 523 (b) Desenhe um gráfico que resuma o valor-p encontrado, indicando a posição da estat́ıstica-teste em relação à média e sombreando a área de rejeição de H0. z = π̂ − π0 ep = 0, 47− 0, 5 0, 027 = −0, 03 0, 027 = −1, 11 Nossa estat́ıstica-z de -1,11 não encontra-se na área de rejeição da hipótese nula, que corresponde a 1,96 desvios padrão da média 0,5. O valor-p equivale a 0,267, ou seja, a probabilidade de encontrarmos um valor tão extremo quanto 0,47 presumindo que 0,5 seja verdadeira é de 26,7%, o que é uma probabilidade alta e longe do ńıvel de significância de 5%. Exerćıcio 3 (4 pontos) continua na próxima página. . . Página 4 de 10 Prof. Glauco Peres ( FLS 5028 e FLP 0406 ): Lista de Exerćıcio #7Exerćıcio 3 (4 pontos) (continuação) (c) Se você fosse o funcionário responsável para reportar os resultados da pesquisa ao prefeito, como você resumiria os achados? Podemos supor que a população daquele bairro seja majoritariamente a favor da medida? Justifique sua resposta. Com 95% de confiança, podemos dizer que a população do Butantã que é a favor da nova lei de zoneamento está entre 41,7% e 52,3%. A proporção encontrada na amostra de 47% favoráveis pode estar sub ou supervalorizada, de forma que não temos certeza de que a maioria dos residentes daquele bairro são favoráveis ao projeto. O que podemos inferir a partir do intervalo de confiança constrúıdo é que a população local encontra-se dividida nesta matéria, e que seria improvável haver um grande bloco populacional contrário ou favorável ao projeto de lei. Exerćıcio 4 (5 pontos) Suponhamos que um pesquisador acredita que os homens são mais afeitos a avaliar negativamente a atuação do prefeito Haddadno governo do que as mulheres. Para testar tal hipótese, ele constrói uma tabela de con- tingência com as variáveis “gênero” e “avaliação do governo Haddad”, ambas optidas no site do Datafolha1. O resultado obtido é o seguinte: Tabela 1a: Gênero e avaliação do governo Haddad (frequência absoluta). Avaliação do Sexo governo Haddad Masculino Feminino TOTAL Ótimo/Bom 82 81 163 Regular 153 215 368 Ruim/Péssimo 266 268 534 Total 501 564 1065 (a) A partir do enunciado do exerćıcio, estabeleça as hipóteses nula (H0) e alternativa (H1). H0: A variável gênero e a variável avaliação do governo Haddad são independentes. (elas não covariam) H1: A variável gênero e a variável avaliação do governo Haddad são dependentes. (elas covariam) 1O Datafolha fez uma pesquisa intitulada “Avaliação do prefeito de São Paulo Fernando Haddad” entre 28 e 29/10/2015. (http://media.folha.uol.com.br/datafolha/2015/11/03/avaliacao-haddad.pdf). Os dados utilizados nesse exerćıcio foram retira- dos da tabela na página 10 do relatório. Os valores correspondentes à categoria “Não sabe” foram desconsiderados. Exerćıcio 4 (5 pontos) continua na próxima página. . . Página 5 de 10 Prof. Glauco Peres ( FLS 5028 e FLP 0406 ): Lista de Exerćıcio #7Exerćıcio 4 (5 pontos) (continuação) (b) Apresente uma tabela de contingência com a frequência esperada (fe) para cada célula. A frequência esperada (fe = (Total da Linha)× (Total da Coluna) Total das observacoes ) para cada célula é a frequência que esperaŕıamos encontrar caso as variáveis “gênero” e “avaliação do governo Haddad” não tivessem nenhuma relação. Ou seja, ao variar a variável “gênero”, a variável “avaliação do governo Haddad” não sofreria nenhuma alteração. Como a variável dependente está posicionada nas linhas da tabela e a variável independente nas colunas, faremos a porcentagem pelo total das colunas. Esse procedimento serve para compararmos se há ou não relação entre as duas variáveis, como explicado por Kellstedt e Whitten (2013, p.152). Então a tabela ficaria dessa forma: Tabela 1: Gênero e avaliação do governo Haddad (frequência absoluta e frequência relativa) Avaliação do governo Haddad Masculino Feminino Total Ótimo/Bom 82 (16,37%) 81 (14,36%) 163 (15,31%) Regular 153 (30,54%) 215 (38,12%) 368 (34,55%) Ruim/Péssimo 266 (53,1%) 268 (47,52%) 534 (50,14%) Total 501 (100%) 564 (100%) 1065 (100%) Como podemos observar o número de homens que avaliam negativamente o governo do Haddad (53,1%) é um pouco maior do que esperaŕıamos caso estas duas variáveis não tivessem nenhum relação (50,1%), como apresentado na tabela abaixo: Tabela 2: Tabela de contingência com a frequência esperada (fe) para cada célula. Avaliação do governo Haddad Masculino Feminino Total Ótimo/Bom 76 (15,17%) 86 (15,25%) 163 (15,31%) Regular 173 (34,53%) 195 (34,57%) 368 (34,55%) Ruim/Péssimo 251 (50,1%) 283 (50,18%) 534 (50,14%) Total 501 (100%) 564 (100%) 1065 (100%) (c) Calcule o valor do qui-quadrado. Apresente o cálculo realizado. Para saber se os valores observados estão muito distantes dos valores esperados, precisamos calcular o valor do qui-quadrado que é dado pela seguinte fórmula: χ2 = Σ (O − E)2 E χ2 = Σ (O − E)2 E = (82− 76)2 76 + (81− 86)2 86 + (153− 173)2 173 + (215− 195)2 195 + (266− 251)2 251 + (268− 283)2 283 = 36 76 + 25 86 + 400 173 + 400 195 + 225 251 + 225 283 = 0, 474 + 0, 291 + 2, 312 + 2, 051 + 0, 896 + 0, 795 χ2 = 6, 819 (1) Exerćıcio 4 (5 pontos) continua na próxima página. . . Página 6 de 10 Prof. Glauco Peres ( FLS 5028 e FLP 0406 ): Lista de Exerćıcio #7Exerćıcio 4 (5 pontos) (continuação) (d) Em vista das hipóteses estabelecidas em (a) e do valor do qui-quadrado calculado em (c), realize um teste de hipóteses com ńıvel de significância de 95%. Interprete o resultado obtido. H0: A variável gênero e a variável avaliação do governo Haddad são independentes. (elas não covariam) H1: A variável gênero e a variável avaliação do governo Haddad são dependentes. (elas covariam) χ2 = 6, 819 Cálculo do graus de liberade: gl = (l − 1)(c− 1) = (3− 1)(2− 1) = 2× 1 = 2 De acordo com a tabela da distribuição do qui-quadrado o valor χ2 cŕıtico para 1 grau de liberdade e com ńıvel de significância de 95%, corresponde a 5,991. Figura 1: Distribuição qui-quadrado. O valor encontrado do qui-quadrado (χ2 = 6, 819) é maior do que o qui-quadrado cŕıtico. Portanto, o valor do qui-quadrado deste exerćıcio está na área de rejeição da curva acima (área em vermelho). Assim sendo, nós rejeitamos a hipótese nula do teste, que postula que as duas variáveis são idenpendentes. Em suma, a variável “gênero”e a variável “avaliação do governo Haddad” não são independentes. Exerćıcio 4 (5 pontos) continua na próxima página. . . Página 7 de 10 Prof. Glauco Peres ( FLS 5028 e FLP 0406 ): Lista de Exerćıcio #7Exerćıcio 4 (5 pontos) (continuação) (e) Em vista das hipóteses estabelecidas em (a) e do valor do qui-quadrado calculado em (c), realize um teste de hipóteses com ńıvel de significância de 99%. Interprete o resultado obtido. H0: A variável gênero e a variável avaliação do governo Haddad são independentes. (elas não covariam) H1: A variável gênero e a variável avaliação do governo Haddad são dependentes. (elas covariam) χ2 = 6, 819 Cálculo do graus de liberade: gl = (l − 1)(c− 1) = (3− 1)(2− 1) = 2× 1 = 2 De acordo com a tabela da distribuição do qui-quadrado o valor χ2 cŕıtico para 1 grau de liberdade e com ńıvel de significância de 99%, corresponde a 9,210. Figura 1: Distribuição qui-quadrado. O valor encontrado do qui-quadrado (χ2 = 6, 819) é inferior ao qui-quadrado cŕıtico. Portanto, o valor do qui-quadrado deste exerćıcio não está na área de rejeição da curva acima (área em vermelho). Assim sendo, nós não rejeitamos a hipótese nula do teste, que postula que as duas variáveis são idenpendentes. Em suma, a variável “gênero”e a variável “avaliação do governo Haddad” são independentes e não têm relação. (f) E por que utilizamos um Teste Qui-Quadrado ao invés de um Teste-Z ou um Teste-T neste caso? (Máx. 5 linhas) Isso porque o teste qui-quadrado é utilizado quando tanto a variável dependente e a variável independente são categóricas (este ponto é explicado por Kellstedt e Whitten (2013, caṕıtulo 7)), como é o caso das variáveis “gênero”e “avaliação do governo Haddad” analisado neste exerćıcio. Por sua vez, o Teste-Z e o Teste-T são utilizados quando ou a variável dependente e/ou a variável independente são variáveis cont́ınuas. Exerćıcio 4 (5 pontos) continua na próxima página. . . Página 8 de 10 Prof. Glauco Peres ( FLS 5028 e FLP 0406 ): Lista de Exerćıcio #7Exerćıcio 4 (5 pontos) (continuação) (g) Um teste qui-quadrado, tal como o utilizado no exerćıcio anterior, nos permite inferir uma relação de cau- salidade entre “gênero” e “avaliação do governo Haddad”? Justifique sua resposta (Máx. 7 linhas). Não, o teste qui-quadrado não nos possibilita inferir causalidade entre as variáveis. Com explicado por Kellstedt e Whitten (2013, p.156), o teste qui-quadrado permite identificar se as duas variáveis analisadas covariam, que seria o terceiro passo para se estabelecer uma relação de causalidade. O que este teste não permite e é essencial para se estabelecer uma relação de causalidade é identificar se há uma variável Z que torne a associação entre estas duas variáveis analisadas em uma relação espúria (4o e último passo). Como o teste qui-quadrado é um teste de bi-variáveis, por definição, nós não conseguiŕıamos saber se há uma variável Z relevante, dado que só há duas variáveis sendo analisadas. (h) Explique o que é o p-valor e como ele é utilizado em um teste de hipóteses. Como descrito por Kellstedte Whitten (2013, p.147-148), o p-valor é um elemento do teste de hipótese que varia entre 0 e 1. Como em estat́ıstica, a ideia é comparar padrões com dados do mundo real, o p-valor entra na lógica de que quanto mais diferente os dados observados são dos dados que esperaŕıamos encontrar, caso não houvesse nenhum relação entre as variáveis, mais confiantes estaremos em afirmar que há uma relação entre as duas variáveis analisadas. Assim sendo, o p-valor nos diz a probabilidade de que veŕıamos esta relação observada entre as duas variáveis obtidas pela amostra, se fosse realmente verdade que não haveria nenhuma relação entre elas na população (hipótese nula). Ou seja, quanto menor o p-valor, mais confiança nós temos em afirmar que há uma relação sistemática entre as duas variáveis, para as quais nós estimamos este p-valor. (i) Há algum problema em interpretar o p-valor no survey da “Chewing Magazine”? Comente sobre as limitações do p-valor. Exerćıcio 4 (5 pontos) [(i)] continua na próxima página. . . Página 9 de 10 Prof. Glauco Peres ( FLS 5028 e FLP 0406 ): Lista de Exerćıcio #7 Exerćıcio 4 (5 pontos) Uma das limitações é que o p-valor não reflete a qualidade do processo de mensuração das variáveis analisadas. Dessa forma, se não estamos confiantes nas nossas medições, devemos também ser cautelosos ao afirmar que tal relação é estatisticamente significativa dado um determinado p-valor. O quadrinho acima retrata uma situação em que a mensuração dos dados foi manipulada, portanto devemos ser cautelosos ao analisar os dados do survey da “Chewing Magazine”. Outras limitações do p-valor: (a) apesar do p-valor estimar a confiança que podemos ter de que há uma relação entre as duas variáveis, ele não indica que há uma relação de causalidade entre as variáveis; (b) outra limitação é referente a intensidade da relação, um p-valor baixo (próximo de zero) não indica necessariamente que a relação entre as duas variáveis é muito forte; (c) por fim, o p-valor tem como pressuposto de que a amostra foi obtida de forma aleatória, quando este pressuposto não é seguido, devemos ter cautela com relação ao p-valor estimado. Página 10 de 10
Compartilhar