Buscar

Módulo 05 - Poder estatístico 20171003

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 61 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 61 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 61 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Poder estatístico
Bruno Ferman
Professor da FGV-SP
Pesquisador afiliado do J-PAL
Objetivos
• Entender o que é poder estatístico
• Compreender a importância do poder estatístico no desenho de uma 
avaliação de impacto
• Entender como se determina o poder estatístico e como ele se relaciona 
com o tamanho da amostra e outros elementos de desenho de uma 
avaliação
2
Estrutura
1. O que é poder estatístico?
2. A importância do poder estatístico
3. Fatores que afetam o poder estatístico
3
O que é poder estatístico?
Incerteza e poder estatístico
• O poder estatístico é a probabilidade de se detectar o impacto de 
um programa quando referido impacto existe na população
• Por que falamos da probabilidade de se detectar um impacto 
existente?
Porque, ao trabalhar com dados de uma amostra, 
sempre existe um certo grau de incerteza
5
Variabilidade amostral
• A amostra é um subgrupo de uma população
• Distintas amostras extraídas de uma mesma população 
produzem diferentes resultados
• Isso se chama variabilidade amostral: os valores calculados a 
partir de amostras variam de uma amostra a outra
6
Exemplo de variabilidade amostral
P
o
p
u
la
ç
ã
o
-a
lv
o
Tratamento
Controle
8
9
8
6
99
129
8
8
9
8
9
10
5
10
6
12
9
129
10
6
9
8
109
2
9
12
9
8
6
6
8 10
12
9
Indicador: dias de desemprego
Suponha que queremos estudar o impacto de um programa 
de formação profissional
Para baratear custos, 
tomamos duas amostras 
representativas: uma do 
grupo de tratamento e 
outra do grupo de 
controle
7
P
o
p
u
la
ç
ã
o
 a
lv
o
Tratamento
Controle
8
9
8
6
99
129
8
8
9
8
9
10
5
10
6
12
9
129
10
6
6
9
8
109
2
9
12
9
8
6
6
2
Tratamento: 
9 + 8 + 6 + 6 + 2
5
= 6,2
8 10
12
9 Controle: 
9 + 12 + 10 + 8 + 9
5
= 9,6
Concluímos que o programa teve um efeito positivo 
de -3,4 dias de desemprego
Exemplo de variabilidade amostral
Indicador: dias de desemprego
Extraímos uma amostra entre o grupo de tratamento e uma do 
grupo de controle, e assim verificamos: 
8
P
o
p
u
la
ç
ã
o
 a
lv
o
Tratamento
Controle
8
9
8
6
99
9
8
8
9
8
9
10
5
10
6
12
9
129
6
6
9
8
109
2
9
9
8
6
6
2
Tratamento: 
9 + 10 + 6 + 8 + 12
5
=
8 10
12
9 Controle: 
9 + 6 + 10 + 8 + 5
5
=
Agora concluímos que o programa teve um efeito 
negativo de +1,4 dia de desemprego
Exemplo de variabilidade amostral
Indicador: dias de desemprego
Mas se as amostras forem escolhidas de outra maneira...
9 10
8
12
6 9
5
9 8
10
6
7.6
9
Um cenário típico em que há um efeito positivo 
percebido
Duas causas podem explicar diferença de resultados a partir de uma só 
amostra:
a. Na população realmente existe uma diferença entre o grupo de 
tratamento e controle: o programa teve impacto
b. A diferença estimada é fruto de erro amostral. Na realidade, não houve 
impacto (a diferença real entre os dois grupos é zero)  ERRO TIPO 1
10
Um cenário típico em que não há efeito percebido
Duas causas podem explicar diferença de resultados a partir de uma só 
amostra:
a. Na população realmente não existe uma diferença entre o grupo de 
tratamento e controle: o programa não teve impacto
b. A ausência de diferença na estimação é fruto de erro amostral. Na 
realidade, houve impacto (a diferença real entre os dois grupos é 
diferente de zero)  ERRO TIPO 2
Mas como sabemos se o que observamos 
se encaixa em A ou B?
11
A importância do poder estatístico
Dois tipos de erros estatísticos
Dois tipos de erros estatísticos
Erro tipo I
(falso positivo)
Erro tipo II
(falso negativo)
Você está 
grávido!
Você não 
está 
grávida!
15
Dois tipos de erros estatísticos
CONCLUSÃO
Programa teve impacto
A 
VERDADE
SIM
Programa 
teve impacto 
NÃO
Programa 
não teve 
impacto

Concluímos que o 
programa teve impacto, 
quando na realidade não 
teve 
16
Dois tipos de erros estatísticos
O que falta 
nesta tabela?
CONCLUSÃO
Programa teve impacto
A 
VERDADE
SIM
Programa 
teve impacto 
NÃO
Programa 
não teve 
impacto

Concluímos que o 
programa teve impacto, 
quando na realidade não 
teve 
17
Dois tipos de erros estatísticos
CONCLUSÃO
Programa teve impacto Programa não teve impacto
A 
VERDADE
SIM
Programa 
teve impacto 

Concluímos que o programa não teve 
impacto, quando na realidade teve
(mas a amostra é muito pequena 
para detectar o impacto)
NÃO
Programa 
não teve 
impacto

Concluímos que o 
programa teve impacto, 
quando na realidade não 
teve 

18
Erro tipo I
CONCLUSÃO
Programa teve impacto Programa não teve impacto
A 
VERDADE
SIM
Programa 
teve impacto 

Concluímos que o programa não teve 
impacto, quando na realidade teve
(mas a amostra é muito pequena 
para detectar o impacto)
NÃO
Programa 
não teve 
impacto

Concluímos que o 
programa teve impacto, 
quando na realidade não 
teve 

Erro tipo I 19
Poder estatístico
Poder estatístico
Poder Estatístico: probabilidade de detectar 
um impacto quando ele existe
CONCLUSÃO
Programa teve 
impacto
Programa não teve impacto
A 
VERDADE
SIM
Programa 
teve 
impacto


Concluímos que o programa não 
teve impacto, quando na realidade 
teve
(mas a amostra é muito pequena 
para detectar o impacto)
NÃO
Programa 
não teve 
impacto

Concluímos que o 
programa teve impacto, 
quando na realidade não 
teve 

20
Erro tipo II
CONCLUSÃO
Programa teve 
impacto
Programa não teve impacto
A 
VERDADE
SIM
Programa 
teve 
impacto


Concluímos que o programa não 
teve impacto, quando na realidade 
teve
(mas a amostra é muito pequena 
para detectar o impacto)
NÃO
Programa 
não teve 
impacto

Concluímos que o 
programa teve impacto, 
quando na realidade não 
teve 

Erro tipo II
21
CONCLUSÃO
SIM
Programa teve impacto
NÃO
Programa não teve 
impacto
A VERDADE
Efeito
Sem efeito
Poder 
estatístico
Você não 
está grávido!
Você está 
grávida!
Você não está 
grávida!
22
22
Por que o poder estatístico é importante?
Avaliação com 
baixo poder 
estatístico
Alta 
probabilidade 
de erro tipo II 
(falso negativo)
Risco de se
encerrar ou 
mudar um 
programa que 
é efetivo
Exemplo: Programa de microcrédito em Gana
Como diferentes taxas de juros afetam a 
demanda por microcrédito?
23
24
A cada 100 donos de negócios…
… 15 participaram de oficina sobre 
microcrédito
Exemplo: Sensibilidade a taxa de juros (Gana)
25
Exemplo: Sensibilidade a taxa de juros (Gana)
Dos 15 participantes…
5 começaram a preencher formulário
2 completaram o formulário
1 pediu o microcrédito
26
Baixa taxa de 
participação nas 
oficinas
Amostra 
pequena
Baixo poder 
estatístico
Avaliação foi 
cancelada
Exemplo: Sensibilidade a taxa de juros (Gana)
Fatores que afetam o poder 
estatístico
Fatores que afetam o poder estatístico
• Tamanho da amostra
• Tamanho do efeito
• Participação (take-up) 
• Variância
• Proporções de alocação experimental
• Clusters
30
Tamanho da amostra
• Fazemos um experimento com uma amostra, que é um 
subgrupo escolhido aleatoriamente da população
População
Amostra
Amostragem aleatória
29
Tamanho da amostra
• Quanto maior a amostra, mais representativa ela 
será da população 
População Amostra
Amostragem aleatória
30
Tamanho da amostra
Quanto maior a amostra
• Mais representativa ela será da população
• Mais provável que o experimento capture qualquer impacto que 
ocorre na população
• Menor chance de erros tipo II (não detectar impacto)
• Maior poder e precisão
31
Uma amostra maior dá maior poder à avaliação experimental
32
Poder
Tamanho da amostra
1
0.75
0.5
0.3
Regra de ouro número 1
Regra de ouro número 1
Uma amostra maior dá maior poder à avaliação experimental
Menos poder
Mais poder


33
Fatores que afetam o poder estatístico
• Tamanho da amostra
• Tamanho do efeito
• Participação (take-up) 
• Variância
• Proporções de alocação experimental• Clusters
37
Exemplo: Prova Brasil (Brasil)
• A avaliação, realizada pelo Instituto Nacional de Estudos e Pesquisas 
Educacionais (Inep), é aplicada em todo o país, e é composta por uma 
prova, realizada pelos alunos do quinto e do nono ano de escolas rurais 
e urbanas
• Um programa tem como meta melhorar os resultados das escolas 
tratadas em 20 pontos
• Outro programa visa melhorar os resultados em 1 ponto
É mais fácil de perceber as mudanças 
de 20 pontos do que de 1 ponto
É muito mais provável que meu grupo de tratamento seja, por um acaso, 
aleatorizado com uma nota em média um ponto acima da média da 
população do que com 20 pontos acima da população como um todo
35
Efeito grande Efeito pequeno
Se o efeito é pequeno, precisamos de uma 
“lupa” com maior aumento para vê-lo
2.5x
10x
36
Regra de ouro número 2
O tamanho do efeito e o tamanho da amostra são inversamente 
proporcionais a um nível de poder estatístico
Exige amostra menor
Exige amostra maior
Efeito grande
Efeito pequeno
37
Fatores que afetam o poder estatístico
• Tamanho da amostra
• Tamanho do efeito
• Participação (take-up) 
• Variância
• Proporções de alocação experimental
• Clusters
43
Participação e tamanho do efeito
• Suponha um programa que dá fertilizantes a cada família rural beneficiada
• Suponha que entregamos o benefício do programa a quatro pessoas 
(grupo de tratamento) e temos outras quatro pessoas do grupo de controle 
que não o recebem
39
Tamanho do efeito com 100% de participação
Tratamento Controle
40
*
*
f f
f f
*
*
f = receberam fertilizantes
* = utilizaram os fertilizantes recebidos
Tamanho do efeito com 50% de participação
Tratamento Controle
41
f = receberam fertilizantes
* = utilizaram os fertilizantes recebidos
*
*
f f
f f
Regra de ouro número 3
• Participação imperfeita implica um menor efeito e vai exigir uma amostra 
maior para um nível de poder dado (regra de ouro número 2)
• Se já se antecipa que o programa terá uma participação imperfeita, é 
necessário planejar uma amostra maior
Exige uma amostra menor
Exige uma amostra maior
Participação 
perfeita
Participação 
imperfeita
42
f f
ff
*
f f
*
ff
* *
**
Fatores que afetam o poder estatístico
• Tamanho da amostra
• Tamanho do efeito
• Participação (take-up)
• Variância
• Proporções de alocação experimental
• Clusters
49
Variância
• Suponha que temos um programa de saúde para aumentar a altura de 
crianças que vivem em extrema pobreza no Norte do Brasil
• Mas existe grande variância na altura da população
• Risco: podemos acabar com uma amostra que tem a maioria dos altos… 
ou uma com a maioria de baixos
AmostraPopulação
Amostragem aleatória
44
Variância
• Em uma população com muita variância, há uma probabilidade maior 
de que nossa amostra não seja representativa 
• Por outro lado, em uma população com pouca variação na altura, é 
mais provável que a amostra seja representativa
AmostraPopulação
Amostragem aleatória
45
Implicações de maior variância
• Se no final do programa as crianças tratadas são mais altas que as crianças 
do grupo de controle...
• É porque o grupo de tratamento tinha crianças mais altas ou é porque o 
programa funciona?
Controle
Tratamento
População Amostra
Amostragem aleatória
Programa implementado
46
Implicações de maior variância
Se a população tem uma altura similar no início, seria fácil saber:
• É mais provável que tenhamos uma amostra representativa
• E a diferença que vemos no final deve ser explicada pelo programa
47
Controle
Tratamento
População Amostra
Amostragem aleatória
Programa implementado
Regra de ouro número 4
• Para um nível de poder estatístico, quanto maior a variância, maior 
a amostra de que necessitamos
Precisamos de uma amostra
menor
Precisamos de uma amostra 
maior
Maior 
variância
Menor
variância
48
Fatores que afetam o poder estatístico
• Tamanho da amostra
• Tamanho do efeito
• Participação (take-up)
• Variância
• Proporções de alocação experimental
• Clusters
56
50
Aumentar o tamanho da amostra aumenta o poder 
estatístico, mas cada vez menos
Poder
Tamanho da amostra
1
0.75
0.5
0.3
Maximizando o poder em uma amostra
• P é a proporção do tratamento na amostra
…P sempre será um número entre 0 a 1
• Para ter o máximo de poder estatístico para o tamanho de uma dada 
amostra, devemos minimizar
• Este termo é minimizado quando 𝑃 = 0,5: a metade da amostra está no 
grupo de tratamento
51
Regra de ouro número 5
• Para um nível de amostra, o poder estatístico é maximizado quando a 
amostra é dividida igualmente entre os grupos de tratamento e controle
Controle (n=4)
Tratamento (n=4)Amostra (n=8)
52
Fatores que afetam o poder estatístico
• Tamanho da amostra
• Tamanho do efeito
• Participação (take-up) 
• Variância
• Proporções de alocação experimental
• Clusters (Agrupamentos)
61
Os indivíduos dentro de um cluster podem se 
comportar da mesma maneira
Controle
Tratamento
População
54
Regra de ouro número 6
• Para uma dada amostra, aleatorizar por clusters reduz o poder estatístico
Precisamos de amostra 
menor
Precisamos de amostra
maior
55
• Para uma dada amostra, há menos poder estatístico quando se 
aleatoriza por clusters
• Apesar disso, pode ser que aleatorizar por clusters seja a melhor opção por 
outras razões: externalidades, razões logísticas etc. 
Em geral, o número de clusters é determinante para o poder estatístico, 
não o número de pessoas em cada cluster
56
Regra de ouro número 6
Controle
Tratamento
População
57
Ou os indivíduos dentro de um cluster podem 
se comportar de maneira diferente
A correlação intra-clusters (CIC) mede o quanto os indivíduos dentro de 
um cluster são similares no que se refere à variável de interesse
• CIC pode ser alto
• CIC pode ser baixo
Correlação Intra-Clusters (CIC)
58
Regra de ouro número 7
• Para um dado nível de poder estatístico, uma maior Correlação Intra- Clusters 
(CIC)  é necessária uma amostra maior
– Quanto maior o CIC, a melhor solução é aumentar a amostra incluindo mais 
clusters, em vez de mais indivíduos aos clusters
Precisamos de amostra 
menor
Precisamos de amostra 
maior
59
• Distintas amostras extraídas de uma mesma população produzem 
resultados distintos
• É necessário ter poder estatístico para detectar o impacto de um programa
• O tamanho da amostra é o principal determinante do poder estatístico
Conclusões
69
Regras de ouro
1. Amostra maior  Mais poder estatístico
2. Para detectar efeito menor  Necessidade de amostra maior
3. Participação (take-up) baixa  Necessidade de amostra maior
4. Alta variância na população  Necessidade de amostra maior
5. Para uma dada amostra, um número igual de unidades no grupo de 
tratamento e no grupo de controle maximiza o poder
6. Para uma dada amostra, agrupar clusters significa  menor poder
7. Maior correlação entre clusters  é necessário maior tamanho de amostra
61

Outros materiais