Nota_de_aula_3

Econometria

•

UNIFESP

1

0

1

0

Julio Cezar

22/12/2014

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 15 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 15 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 9, do total de 15 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Econometria

6.363 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

1 
 
Notas de aula para o curso de Econometria I 
Nota 3: Estimação por intervalo e testes de hipóteses 
Thiago Fonseca Morello 
fonseca.morello@ufabc.edu.br 
sala 301, Bloco Delta, SBC 
1 Estimação por intervalo 
Para estimar um parâmetro populacional pode-se tomar por base um único valor, a 
estimativa pontual. Mas é também possível obter um intervalo de valores que contenha 
o valor procurado. 
O termo “intervalo” deve ser, desde início, interpretado corretamente. Trata-se de dois 
limites que contêm, com probabilidade suficientemente alta, o parâmetro populacional. 
Por exemplo, pode-se construir um intervalo que contenha com 95% de probabilidade o 
valor efetivo da média populacional, μ. Ou seja, trata-se de tomar I1 e I2 de modo que 
P(I1 < μ <I2) = 0,95. Este tipo de intervalo é denominado por “intervalo de confiança” 
com 95% de probabilidade. 
Um equívoco comum de interpretação da expressão P(I1 < μ <I2) = 0,95 está em 
entender que 95% é a probabilidade do valor populacional da média, μ, pertencer ao 
intervalo I1 e I2. Porém μ não é uma variável aleatória, mas uma constante e, portanto, o 
conceito de probabilidade não pode ser aplicado a ela. A interpretação correta parte da 
percepção de que o intervalo {I1, I2} é aleatório, de modo que 95% corresponde à 
probabilidade deste intervalo conter o valor fixo da média populacional. 
Seja assumido que a amostra disponível, X1, X2,...,XN é aleatória de modo que todas as 
observações têm média μ e variância σ2, i.e., E[Xi] = μ e V[Xi]= σ2, i=1,...,N. Além 
disso, todas as observações se distribuem normalmente, i.e., Xi ~ N(μ, σ2), i=1,...,N. 
Nesta condições, deseja-se obter o intervalo que contém, com 95% de probabilidade, a 
média populacional, μ. 
Como limites do intervalo, i.e., I1 e I2, toma-se geralmente a estimativa pontual 
descontada ou acrescentada por uma margem de erro fixa, ∈, i.e., I1= θ෠ை−	∈ e I2 = 
θ෠ை+	∈, em que θ෠ை é o valor observado do estimador θ෠ ou estimativa pontual. 
 
 
 
 
 
2 
 
É sabido que θ෠ = Xഥ é um estimador não viesado, consistente e eficiente para μ. Além 
disso, é possível demonstrar que E[Xഥ] = μ, V[Xഥ] = σ2/N e que Xഥ ~ N(μ, σ2/N). Isso quer 
dizer que, para estimar a média μ, pode-se tomar o intervalo [Xഥை−	∈; Xഥை+	∈], em que Xഥை é a estimativa pontual, i.e., a média obtida para a amostra. A questão agora está em 
saber qual deve ser o valor de ∊. Uma vez que se deseja especificar, a priori, a 
probabilidade ߙ com que o intervalo contém μ, o valor de ∊ pode ser escolhido de 
maneira a que P(Xഥ−	∈ < μ < Xഥ+	∈) = ߙ. 
Este critério para selecionar ∊ pode ser visualizado a partir do gráfico da FD N(μ, σ2/N), 
que segue abaixo. Por mero fim de clareza, será assumido que α = 95%. 
Figura 4 Intervalo de confiança para estimação da média populacional 
 
Conforme a figura acima indica, o intervalo que se deseja construir é aquele que 
corresponde à área hachurada sob a curva normal com massa de probabilidade 
equivalente a 95%. O valor de ∊, portanto, tem de ser compatível com este objetivo. 
A dificuldade fundamental está em que, para conhecer o valor de ∊ adequado, é 
necessário conhecer a FD de Xഥ, pois apenas assim pode-se saber quais valores de Xഥ 
contêm entre si uma massa de probabilidade de 95%. O que requer o conhecimento de 
μ. Chega-se, pois, a uma circularidade aparentemente intransponível: para calcular o 
intervalo que contém μ com 95% de probabilidade é preciso conhecer μ. 
3 
 
Há, contudo, uma saída. Existe uma variante da FD normal, denominada FD normal 
padrão, que se caracteriza por ter média (μ) igual a zero e desvio padrão igual à unidade. 
Sempre é possível, portanto, determinar o intervalo em torno da média da normal 
padrão (zero, no caso) que corresponde a uma massa de probabilidade desejada. E isso 
pois a média desta distribuição é sempre zero. 
Porém, a FD normal em questão não necessariamente é a normal padrão, representada 
por N(0,1), mas sim a FD N(μ, σ2/N). Na verdade, não se sabe, a priori, quais são os 
valores de seus parâmetros. A média, por exemplo, pode ser positiva, i.e., μ > 0. 
Mesmo assim, sempre há, felizmente, uma conexão fundamental entre uma distribuição 
normal padrão genérica, N(μ, σ2/N), no caso, e a distribuição normal padrão, N(0,1). 
Esta conexão consiste no fato de que subtraindo Xഥ o valor de sua média populacional, μ, 
e dividindo o resultado pelo valor populacional do desvio padrão de Xഥ, ඥσଶ ܰ⁄ , gera-se 
uma VA transformada que tem FD normal padrão, quaisquer que sejam os valores de μ 
e de σଶ ܰ⁄ , i.e., ଡ଼
ഥିஜ
ඥ஢మ ே⁄
~ܰ(0,1). Desta maneira, pois: 
P ቆ Xഥ − μ
ඥσଶ ܰ⁄
≤ γቇ = P(Z ≤ γ) = ߜఊ 
Em que γ é um valor genérico, Z é uma VA com FD N(0,1) e δγ é a massa de 
probabilidade acumulada até ele. O que implica em: 
P ቆ−γ ≤ Xഥ − μ
σ/√N ≤ γቇ = P(−γ ≤ Z ≤ γ) = 1 − 2δఊ	(݅) 
É preciso considerar mais um fato para resolver o problema, o qual decorre da 
manipulação a seguir da expressão P(Xഥ−	∈ < μ < Xഥ+	∈). 
(1) Subtraindo Xഥ dos dois lados das duas desigualdades: P(Xഥ−	∈	< 		μ	 < 	Xഥ+	∈) = P(−	∈	< 		μ − Xഥ 	<	∈) = P(−	∈	< 		Xഥ − μ	 <	∈) 
(2) Dividindo os dois lados das duas desigualdades obtidas por σ/√N: 
P(−	∈	< 		Xഥ − μ	 <	∈) = P ቆ−	 ∈
σ/√N 	< 		Xഥ − μ	σ/√N < 	 ∈σ/√Nቇ	 
Finalmente, pois, pode-se afirmar que Pቀ−	 ∈
஢/√୒ 	< 		 ଡ଼ഥିஜ	஢/√୒ < 	 ∈஢/√୒ቁ = ߙ	(݅݅). 
Comparando (i) e (ii), tem-se: 
Pቆ−γ ≤ Xഥ − μ
σ/√N ≤ γቇ = P(−γ ≤ Z ≤ γ) = 1 − 2δఊ(݅) 
4 
 
Pቆ−	 ∈
σ/√N 	< 		Xഥ − μ	σ/√N < 	 ∈σ/√Nቇ = P(Xഥ−	∈	< 		μ	 < 	Xഥ+	∈) = ߙ	(݅݅) 
Se ߛ for tomado de maneira a que 1 − 2δఊ = ߙ, o intervalo [-ߛ; ߛ] torna-se equivalente 
ao intervalo [-∈/(σ/√N); ∈/(σ/√N)]. Sendo ߛα tal que P(−γఈ ≤ Z ≤ γఈ) = ߙ	, resulta 
que ∈/(σ/√N) = ߛߙ, i.e., ∈ = ߛߙ(σ/√N). E aí temos nosso valor para a margem fixa de 
erro, ∈. 
Vale a pena assinalar que ߛߙ é o valor de Z que corresponde ao intervalo simétrico em 
torno da média (zero) cuja probabilidade associada é ߙ, 95%, por exemplo, ou 99%, a 
depender da escolha do pesquisador. De qualquer maneira, ߙ é denominado nível de 
confiança e o intervalo [ തܺ − 	γఈ ஢√୒ ; തܺ + 	γఈ ஢√୒], intervalo de confiança. 
Outro fato relevante a ser assinalado é o de que o intervalo de confiança tem limites 
aleatórios, sendo, em si, aleatório. Por isso, ele pode conter ou não o valor populacional 
da média de X, denotada por μ. O que o nível de confiança garante é que, com 95% de 
probabilidade, o intervalo aleatório contém a média populacional. Mas não há certeza 
quanto a isso, trata-se de um fato probabilístico. 
2 Testes de hipóteses 
2.1 Conceito básico: um teste intuitivo rudimentar 
O objetivo central de um teste de hipóteses é utilizar a evidência contida na amostra 
disponível para fazer uma afirmação quanto ao valor populacional de um parâmetro1. 
Trata-se, pois, de um procedimento de inferência uma vez que, com base no conteúdo 
informacional da amostra, se retira uma conclusão acerca da população. 
Um teste de hipóteses é sempre composto por um par de hipóteses, a principal delas é 
denominada hipótese nula e geralmente especifica um valor pontual para o parâmetro 
sob investigação. A hipótese alternativa especifica o intervalo de valores (mais 
provável) ao qual o parâmetro deve pertencer na situação hipotética em que a hipótese 
nula não é válida. 
A hipótese nula canônica (mais comum) é a de que o valor populacional de um dado 
parâmetro, θ, é zero. O que é escrito geralmente como H0: θ = 0. 
A hipótese alternativa mais geral possível é, claramente, a possibilidade complementar à 
que define a hipótese nula, i.e., H1: θ ≠ 0. Ou, de maneira equivalente, H1: θ < 0 ou θ > 
0. 
Quando se pode dizer que a amostra contém evidências que permitam tomar uma 
decisão acerca da plausibilidade da hipótese nula? Uma possível resposta é encontrada 
em um critério grosseiro, porém esclarecedor.1 Ver Casella & Berger, “Statistical Inference”, 1990, Duxbury Press, cap.8. 
5 
 
Seja assumido que se tem por objetivo gerar uma estimativa pontual para o valor 
populacional θ. A estimativa obtida dos dados disponíveis é denotada por θ෠ை. 
Um critério suficientemente “grosseiro” é o seguinte: se for observado um valor para a 
estimativa pontual muito distante de zero, será afirmado que a hipótese nula é falsa. 
Porque este critério faz sentido? A resposta é intuitiva (ou pelo menos deveria ser). A 
hipótese nula afirma que o valor populacional do parâmetro é zero, i.e, θ = 0. Para a 
julgar, temos apenas uma amostra disponível, a qual nos permite obter apenas uma 
estimativa, θ෠ை. Caso este valor seja próximo de zero, a evidência disponível é favorável 
à hipótese nula. De maneira inversa, pois, quanto mais distante de zero for o valor 
estimado, menos favorável à hipótese é a evidência. 
Um exemplo pode tornar mais claro o critério grosseiro. Um dos problemas mais 
famosos em economia do trabalho é o de mensuração da contribuição da educação para 
a remuneração obtida no mercado de trabalho. O que pode ser exprimido em duas 
perguntas. Será que trabalhadores com maior nível educacional são melhor 
remunerados? Em que medida isso é verdade? 
Com nos dados da Pesquisa Nacional por Amostra de Domicílios (PNAD) é possível 
responder as duas perguntas. Uma maneira de fazer isso é empregar o estimador de 
mínimos quadrados ordinários e obter uma estimativa para o efeito educação-
remuneração, ou retorno (econômico) da educação, a qual será denotada por ߚመை. O 
parâmetro-alvo, portanto, aquilo que os economistas do trabalho desejam conhecer, não 
é o valor específico do retorno da educação na amostra da PNAD, ߚመை, mas sim o valor 
populacional deste efeito, β. 
O teste de hipóteses relevante é composto pela hipótese nula H0: β = 0 e pela alternativa 
H1: β ≠ 0. 
Caso seja obtida uma estimativa pontual muito grande, por exemplo, os resultados 
indiquem que um ano a mais de educação aumenta a remuneração mensal do 
trabalhador em 100% (duplicação), a hipótese nula deve ser rejeitada. Isso pois 100% é 
um valor consideravelmente superior a zero - ao menos aparentemente, para fins deste 
exemplo de aplicação do critério grosseiro. Por outro lado, se os resultados indicarem 
que um ano a mais de educação aumenta o salário mínimo em 0,1%, seria precária a 
base em que o pesquisador se apoiaria ao procurar argumentar que a educação tem 
efeito relevante sobre a remuneração. E isso porque 0,1% – aparentemente, mais uma 
vez – é um valor próximo de zero. 
O critério grosseiro é o fundamento do teste de hipóteses: todo e qualquer teste de 
hipóteses se assenta sobre ele e, “forçando” o argumento (por motivos didáticos), é 
possível afirmar que os testes de hipóteses diferem sobretudo em função da medida que 
propõem para a distância entre o valor do parâmetro especificado pela hipótese nula 
(zero, geralmente) e a estimativa pontual. 
6 
 
O salto do critério grosseiro para um critério mais preciso é dado a partir da resposta a 
seguinte pergunta: como é possível afirmar que um valor, assumido pela estimativa 
pontual, é grande o bastante para se rejeitar a hipótese nula? Ou que ele é 
suficientemente próximo de zero para que a decisão correta seja a de não rejeitar a 
hipótese nula? 
No exemplo de economia do trabalho, um aumento do rendimento de 100% parece 
suficientemente grande e um aumento de 0,1% suficientemente pequeno. Mas, porém, 
estes são valores fictícios, empregados para fins didáticos. Segundo os resultados 
obtidos por Teixeira e Menezes-Filho2 a partir das PNADs de 1997 a 2007, um ano 
adicional de educação proporciona, em média, um aumento de 5,5% na remuneração 
mensal, com desvio padrão de 0,8%. Será que 5,5% é suficientemente grande? A 
resposta agora não é tão evidente. É preciso apelar para um critério objetivo. A 
possibilidade mais comum está em olhar para a FD do estimador que prevaleceria caso a 
hipótese nula para o retorno da educação fosse verdadeira. Assumindo que o desvio 
padrão da distribuição populacional é equivalente a 0,8%, a FD do retorno estimado da 
educação é tal como ilustrada na figura a seguir. 
 
A mera distância entre a estimativa pontual e zero não é uma medida precisa para o grau 
em que a evidência é favorável à hipótese nula. Uma melhor medida é a probabilidade 
de ocorrência da estimativa pontual. 
 
2 Está sendo considerada a estimativa pontual gerada pelo modelo IV, conforme consta na tabela 4 de 
Teixeira, W. M., Menezes-filho, N.A. "Estimando o retorno à educação do Brasil considerando a 
legislação educacional brasileira como um instrumento". Revista de Economia Política, vol. 32, nº 3 
(128), pp. 479-496, julho-setembro/2012. Disponível em http://www.scielo.br/pdf/rep/v32n3/08.pdf 
7 
 
Se for observada uma estimativa pontual cuja probabilidade de ocorrência, calculada 
sob a validade hipótese nula, é baixíssima, há algo de errado neste resultado. A razão 
para isso está em que o que ocorre com baixíssima probabilidade não deveria ocorrer. 
Especialmente quando o número de ocorrências observadas é pequeno; unitário, na 
realidade, uma vez que há apenas uma amostra e, pois, apenas uma estimativa pontual. 
Se é baixíssima a probabilidade do retorno de um ano adicional de educação ser de 
5,5%, este não deveria ser o valor obtido como resultado. 
Há apenas duas possibilidades, ou a evidência está errada ou a hipótese nula é 
equivocada. Em pesquisa científica, não há sentido algum em tentar salvar uma teoria 
que não corresponde à realidade, afirmando que é a realidade que está errada. 
Exatamente por isso, a discrepância entre uma hipótese, geralmente proveniente da 
teoria, e uma evidência, é tomada como indicação de incoerência da hipótese. 
De fato, a probabilidade de ocorrência de um retorno percentual de 5,5% é muito baixa, 
de 1 x 10-11, segundo a figura acima. Isso indica que o verdadeiro valor médio 
populacional do retorno é superior a zero. I.e., que a verdadeira distribuição normal está 
“deslocada” para a direita, conforme a figura abaixo. E isso pois, quanto menor a 
distância entre a estimativa pontual e o verdadeiro valor populacional da média, maior é 
a probabilidade de ocorrência da primeira. 
 
 
2.2 Duas abordagens para os testes de hipóteses 
O recurso à probabilidade de ocorrência da estimativa pontual não resolve 
completamente o problema de obtenção de uma medida objetiva para o grau em que a 
8 
 
evidência disponível é desfavorável à hipótese nula. E isso pois como saber se um dado 
valor para a probabilidade é suficientemente pequeno? É preciso tomar por base uma 
definição para o termo “suficientemente pequeno” consensualmente aceita pela 
comunidade científica. 
Para isso, é necessário que se tenha por claro que há dois erros que podem ser 
cometidos na tomada de decisão acerca do resultado do teste3. Em primeiro lugar, pode-
se decidir por rejeitar uma hipótese que é verdadeira, equívoco este denominado por 
“erro do tipo I”. Em segundo lugar, é possível não rejeitar uma hipótese falsa, este o 
“erro do tipo II”. A tabela descreve os dois erros. 
Tabela X Dois tipos de erros em um teste de hipóteses 
Hipótese 
verdadeira / 
Decisão 
Rejeitar H0 Não rejeitar H0 
H0 Erro tipo 1 Decisão correta 
H1 Decisão correta Erro tipo 2 
Fonte: Casella & Berger, p.359. 
A probabilidade de ocorrência de cada um dos erros pode ser reduzida a um nível 
aceitável a partir da maneira como o teste é construído, i.e., de acordo com o critério de 
tomada de decisão adotado. Uma maneira de fazer isso está em tomar um valor 
suficientemente baixo para a probabilidade de ocorrência do erro do tipo I. A convenção 
em voga é a de que 5% é um valor suficientemente baixo. 
Há uma relação crucial entre aprobabilidade de cometer um erro do tipo I e uma 
medida do grau em que a evidência é favorável à hipótese nula. Retomando a ideia do 
teste grosseiro, H0 deve ser rejeitada sempre que a estimativa pontual se mostrar 
consideravelmente distante dela. É o que se tem quando a probabilidade de ocorrência 
de um valor da estimativa pontual mais extremo do que o observado é não superior a 
5%, o que pode ser atestado de duas maneiras alternativas. Antes de passar a elas, cabe 
expressar as condições de um problema de teste de hipóteses de maneira mais geral. 
Seja assumido que a amostra disponível, X1, X2,...,XN é aleatória de modo que ela 
ocorre com probabilidade f(x1,...,xN|θ) = ∏ f(x௜|θ)ே௜ୀଵ = f(xN|θ)...f(xN|θ), em que f(x|θ) é 
a FD das observações, a qual se define exclusivamente em função do parâmetro 
populacional θ. O objetivo da análise consiste em realizar o teste de hipóteses H0: θ = 0 
vs. H1: θ ≠ 0. 
Trata-se de um teste “bicaudal”, pois a hipótese alternativa aponta para dois intervalos, 
θ < 0 e H1: θ > 0. O teste seria “unicaudal” caso a hipótese apontasse para apenas um 
intervalo. 
 
3 Cabe assinalar que, por mais que tal decisão esteja fundamentada em um procedimento estatístico em 
número ela nunca é livre de erros. 
9 
 
Seja θ෠ um estimador não-viesado para θ, i.e., E[θ෠] = θ. Este estimador recebe o nome de 
estatística do teste para o teste genérico que se acaba de definir. A FDA do estimador 
será denotada por P(θ෠ ≤ 	θ෠ை |θ) = F஘෡൫θ෠ை|θ൯. Será assumido que F஘෡൫−θ෠ை|θ൯ = 1 −F஘෡൫θ෠ை|θ൯, i.e., que a FDA é simétrica em torno da média populacional θ (como é o caso 
das FDs Normal e t de Student). 
Primeira abordagem: valores críticos e região crítica do teste. 
Assumindo a hipótese nula como válida, i.e., tomando θ = 0, pode-se obter os valores γ1 
e γ2 do estimador tais que P(γ1 ≤ θ෠ ≤ γ2|θ=0)4 = 95%. É necessário assinalar que esta 
probabilidade é obtida a partir da FDA de θ෠ para θ = 0. É desta maneira que se coloca 
em confronto a hipótese nula, a qual, pois, aparece como uma hipótese acerca da FD da 
estatística, e a evidência, esta última, no caso, a estimativa pontual. 
Os valores γ1 e γ2 são denominados por “valores críticos”. Se a estimativa pontual 
assumir um valor mais extremo do que um dos valores críticos, deve-se rejeitar a 
hipótese nula. A figura abaixo ilustra esta abordagem, retomando o exemplo de 
estimação do retorno da educação. Assume-se que a estatística do teste segue um FD 
normal com média zero, segundo a hipótese nula, e com desvio padrão 0,8%. 
 
Os valores críticos, indicados com linhas verticais pontilhadas de cor cinza, 
correspondem a γ1 = -1.645 e γ2 = 1.645. O valor da estimativa pontual, 5,55%, é mais 
extremo do que o valor crítico positivo. 
 
4 Para uma distribuição simétrica em torno da média populacional, esta probabilidade é equivalente a 1 − 2F஘෡൫θ෠ை|θ൯. 
10 
 
O invervalo [γ1 ;γ2] é denominado “região de aceitação” ou “região crítica” do teste, 
enquanto que a união dos dois intervalos complementares, [-∞;γ1], [γ2; ∞] é denominada 
por “região de rejeição”. A região crítica pode ser, genericamente, indicada por 
RC(α,θ), em que α é o nível de significância do teste ou a probabilidade de cometer um 
erro do tipo I, geralmente fixada em 5% (de modo que a probabilidade de uma decisão 
correta seja de 95%). 
Segunda abordagem: p-valor do teste de hipóteses. 
A hipótese nula pode ser rejeitada sempre que a probabilidade de obter um valor mais 
extremo do que o observado para a estimativa pontual for inferior a 5%, de acordo com 
a FDA de θ෠ para θ = 0. A “probabilidade de um valor mais extremo” é denominada p-
valor, conceito ilustrado na figura abaixo para o exemplo de retorno da educação. O p-
valor corresponde à área entre as duas linhas verticais pontilhadas em cinza na figura 
abaixo. Esta, mais uma vez, considera o exemplo de retorno da educação, assumindo 
que a estatística do teste segue um FD normal com média zero, segundo a hipótese nula, 
e com desvio padrão 0,8%. 
 
A área correspondente ao p-valor pode ser melhor visualizada no gráfico abaixo, o qual 
traz um zoom do gráfico anterior no segmento [5,4;6,5] do eixo horizontal. 
 
 
 
11 
 
 
 
2.3 Testes de hipóteses mais utilizados em econometria 
2.3.1 Teste t 
O teste para a média populacional de uma variável aleatória com distribuição normal 
padrão foi apresentado no exemplo acima (retorno da educação). Este teste é pouco 
utilizado em econometria dado que pressupõe o conhecimento da variância 
populacional, o que não é realista. Nenhum parâmetro das funções de distribuição de 
probabilidade relevantes para os estudos econométricos é conhecido a priori; todos eles 
têm de ser estimados. 
Seja mantida a hipótese simplificadora de que há apenas uma característica de interesse, 
X. A amostra disponível, aleatória, é dada por {X1,...,XN}. De acordo com a teoria 
estatística convencional, a probabilidade de ocorrência da amostra é dada por uma 
função de distribuição de probabilidades conjunta, ܨ௑భ,…,௑ಿ(ݔଵ, … , ݔே ;ߠ). Será assumida 
que esta função é uma normal multivariada, o que, em conjunto com a hipótese de 
distribuição aleatória, garante que a distribuição populacional da média da característica 
seja normal com média μ e variância σ2/N5. Porém, como a variância não é conhecida, o 
mais adequado é tomar a estatística abaixo como estatística do teste. E isso pois a FD 
dela é conhecida. 
ܶ = Xഥ − ߤ଴
ඥܸ(Xഥ) ~ݐேିଵ 
 
5 Vide Casella & Berger, exemplo 5.2.1, p.209. 
12 
 
Esta estatística tem uma distribuição t de Student com N – 1 graus de liberdade, em que 
N é o tamanho da amostra. A grandeza ߤ଴ é o valor do parâmetro populacional 
especificado pela hipótese nula e V( തܺ) é a variância da média. 
Todos os componentes da estatística podem ser calculados a partir da amostra e ߤ଴ é 
definido pelo próprio pesquisador, sendo geralmente zero. 
O procedimento do teste para ߤ଴ = 0 consiste nos passos abaixo. 
1. Calcular o valor da estatística do teste, ෠ܶ; 
2. Abordagem da região crítica: 
a. Obter os valores críticos, i.e., os valores da distribuição t que ocorrem com 
5% de probabilidade, {-tc, tc} 
b. Se ෠ܶ > 0, rejeitar H0 se ෠ܶ >	tc; 
c. Se ෠ܶ < 0, rejeitar H0 se ෠ܶ < −	tc; 
3. Abordagem do p-valor: 
a. Se ෠ܶ > 0, o p-valor é dado por ݌̂ = P(t > ෠ܶ). Obtê-lo; 
b. Se ෠ܶ < 0, o p-valor é dado por ݌̂ = P(t < ෠ܶ). Obtê-lo; 
c. rejeitar H0 se ݌̂ ≤ 5%. 
 
Retomando o exemplo de estimação do retorno da educação, a estatística do teste é dada 
por: 
ܶ = β෠ − ߚ଴
ටܸ(β෠) ~ݐேି௄ 
Há uma particularidade nesta estatística, o número de graus de liberdade dela é N-K e 
não N-1. A razão disso está em que não se trata de um teste para a média, mas sim para 
um parâmetro que capta a relação entre duas variáveis. Por hora, não é preciso se 
preocupar em entender este detalhe, ele será esclarecido na parte III do curso. Basta 
saber que K é o número de variáveis explicativas que compõem o modelo de regressão 
linear a partir do qual se estima a relação entre nível educacional e remuneração. 
Segundo os resultados obtidos pelos autores, β෠ = 5,5%, ටܸ(β෠) = 0,8% e β0 = 0, pois a 
hipótese em vista é a de que a educação tem contribuição nula para a remuneração. O 
valor observado da estatística é, pois, de ෠ܶ = 6.875. O número de graus de liberdade é 
N - K = 1.248.998 – 50 = 1.248.948. Os valores críticos para um nível de significância 
bicaudal de 5% e para os graus de liberdade são {-1,645; 1,645}. Uma vez que ෠ܶ >
	1,96, a hipótese nula é rejeitada. O p-valor é de 2 x 10-11 < 5%, o que também aponta 
para a rejeição da hipótese nula. 
 
13 
 
2.3.2 Teste qui-quadrado 
Para testar hipótesesreferentes ao valor da variância populacional, a estatística 
apropriada é a variância amostral, como segue. 
߯ = 1ܰ ෍( ௜ܺ − Xഥ)ଶே
௜ୀଵ
~߯ே 
A função de distribuição é uma qui-quadrado com N graus de liberdade. A única 
diferença em relação aos testes já vistos tem origem em que a distribuição qui-quadrado 
é assimétrica e está definida apenas para valores positivos. Desta maneira, portanto, 
evidências desfavoráveis à hipótese nula apenas podem ocorrer para valores muito 
grandes. O teste é sempre uni-lateral e seu procedimento é descrito no que segue. 
1. Calcular o valor da estatística do teste, ߯̂; 
2. Abordagem da região crítica: 
a. Obter o valor crítico, i.e., χc tal P(χ > χc) = 0,05; 
b. Rejeitar H0 se ߯̂ >	χc; 
3. Abordagem do p-valor: 
a. Obter o p-valor dado por ݌̂ = P(χ > χො); 
b. rejeitar H0 se ݌̂ ≤ 5%. 
O gráfico abaixo ilustra o p-valor de uma VA com distribuição qui-quadrado com 10 
graus de liberdade. 
 
 
14 
 
2.3.3 Teste F 
Seja Y a variável que o modelo de regressão linear procura explicar. A razão entre a 
porção da variação amostral de Y explicada pela regressão, SQE, e a porção não 
explicada, SQR, denominada por coeficiente de determinação, é r2 = SQE / SQR. A FD 
desta estatística é a F de Snedecor com graus de liberdade K-1 e N-K, ou seja: 
ݎଶ = ܵܳܧ/ܭ − 1
ܴܵܳ/ܰ − ܭ~ܨ௄ିଵ,ேି௄ 
Seja R2 o valor populacional de ݎଶ . O teste de hipóteses H0: R2 = 0 vs. H1: R2 > 0 (ݎଶ é 
sempre positivo) pode ser realizado como segue. 
1. Calcular o valor da estatística do teste, ܨ෠; 
2. Abordagem da região crítica: 
a. Obter o valor crítico, i.e., Fc tal P(χ > Fc) = 0,05; 
b. Rejeitar H0 se ܨ෠ >	Fc; 
3. Abordagem do p-valor: 
a. Obter o p-valor dado por ݌̂ = P(F > F෠); 
b. rejeitar H0 se ݌̂ ≤ 5%. 
O gráfico abaixo indica o valor crítico para o teste com nível de significância de 5% 
para uma VA com distribuição F com 10 e 10 graus de liberdade. 
 
 
15 
 
2.4 Poder de um teste 
A probabilidade de não ocorrência de um erro tipo II é denominada poder de um teste, 
ou seja, trata-se da probabilidade de rejeitar uma hipótese falsa. Esta probabilidade pode 
ser representada como: P(T ∈ RC(ߙ; θ)| θ ≠ θ0), i.e., a probabilidade da estimativa 
pertencer à região crítica quando a hipótese nula é equivocada. Esta probabilidade 
depende do valor verdadeiro de θ. É intuitivo que, quanto mais distante estiver este 
valor do especificado pela hipótese nula, maior será a probabilidade de rejeitar a 
hipótese nula, i.e., maior o poder do teste. 
Quanto mais próximo estiver θ de θ0, mais próximo estará o poder do teste de ߙ. De 
fato, para θ = θ0, o poder do teste é equivalente ao nível de significância, i.e., P(T ∈ 
RC(ߙ; θ)| θ = θ0) = ߙ. 
O gráfico abaixo descreve como o poder de um teste, representado por π(θ) varia como 
o valor de θ. 
Figura X Poder de um teste