Buscar

Estatística - Testes de hipóteses paramétricos

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 16 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 16 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 16 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

ESTATÍSTICA
Juliane Silveira 
Freire da Silva
Testes de hipóteses 
paramétricos
Objetivos de aprendizagem
Ao final deste texto, você deve apresentar os seguintes aprendizados:
 � Conhecer a estrutura dos testes de hipóteses.
 � Reconhecer as consequências dos tipos de erros.
 � Contrastar os tipos de erro de acordo com a empresa ou atividade
envolvida.
Introdução
Neste capítulo, você conhecerá a estrutura dos testes de hipóteses 
paramétrico e não paramétrico. Além disso, saberá reconhecer as 
consequências de cada tipo de erros e contrastá-los, na prática, de 
acordo com a empresa ou atividade envolvida.
Estrutura dos testes de hipóteses
Os testes estatísticos são utilizados nas estatísticas inferenciais, utilizados 
para verificar estatisticamente hipóteses para médias, variâncias, proporções, 
dentre outros.
Em estatística, há dois grupos de testes de hipóteses: paramétricos e não 
paramétricos.
Os testes paramétricos são utilizados quando existem variáveis com nível 
de mensuração quantitativa e se pode calcular intervalos de confiança para 
os dados. Existe, também, a exigência de normalidade para os dados, o que 
costuma ocorrer com amostras maiores do que 30 elementos (devido à teoria 
do limite central) e se é necessário supor a homogeneidade dos dados.
Os testes não paramétricos têm menos exigências, e o nível de mensuração 
das variáveis pode ser qualitativo. Não é necessário que se conheça a distri-
buição de probabilidades que os dados seguem. Algumas vezes, quando os 
pressupostos dos testes paramétricos não são aceitos, pode-se utilizar testes 
não paramétricos para as variáveis quantitativas.
O objeto de estudo deste capítulo serão os testes paramétricos, em que 
consideraremos normalidade e homogeneidade nas variáveis estudadas.
Independentemente de o teste estatístico utilizado ser paramétrico ou não 
paramétrico, sempre teremos as mesmas etapas para a sua resolução.
Em todos os testes de hipóteses, precisamos formular duas destas — uma 
o oposto da outra. Formulamos a H0 – hipótese nula — e a H1 – hipótese 
alternativa (que também pode ser representada por Ha).
H0: hipótese nula
H1: hipótese alternativa
Em todos os testes de hipóteses, há uma estatística de teste que é composta 
por um ou mais cálculos matemáticos. A cada teste, teremos um cálculo 
diferente. Os testes paramétricos costumam ter fórmulas matemáticas menos 
complicadas para essa resolução.
Para cada um dos testes, teremos uma tabela de distribuição de probabi-
lidades associada, para que possamos definir a região crítica, e sempre con-
cluiremos de acordo com o resultado do teste realizado nos passos anteriores 
(Quadro 1).
1. Formular hipóteses.
2. Calcular a estatística de teste.
3. Definir a região crítica.
4. Concluir a respeito do teste.
Quadro 1. Passos para a resolução de um teste de hipóteses
Os testes de hipóteses podem ser utilizados para comparar uma estimativa 
com um parâmetro (valor de referência) ou, então, comparar duas estimativas 
entre elas, ou mais de duas estimativas.
Entre os testes paramétricos, veremos exemplos de teste para uma média, 
teste para duas médias e para mais de duas médias. 
Testes de hipóteses paramétricos2
Parâmetros são resumos numéricos referentes a uma população, e estimadores são 
resumos numéricos referentes a uma amostra. 
Consequências dos tipos de erros
Precisamos ficar atentos, pois, sempre que realizamos um teste de hipóteses, 
estamos lidando com valores de médias, e não estamos analisando valores 
únicos e absolutos. Estamos, sim, comparando a média de uma amostra, ou de 
duas ou mais amostras. Sabemos que, ao compararmos os valores absolutos 2 
e 3, por exemplo, estes obviamente são diferentes, pois estamos comparando 
valores absolutos. Todavia, no caso de uma amostra de tamanho n de uma 
variável que tenha uma média e uma variabilidade, será que esses valores 
podem ser considerados estatisticamente diferentes?
Quando realizamos um teste de hipóteses, existe a possibilidade de come-
termos um erro na nossa decisão. Podemos rejeitar uma hipótese quando, na 
realidade, ela seria a hipótese verdadeira. 
Quando aceitamos H0 e essa é a hipótese verdadeira, estamos tomando a 
decisão correta. Assim como também ocorre quando rejeitamos a hipótese 
nula, que é realmente a hipótese falsa.
Porém, podemos cometer um erro ao rejeitar H0 quando, na realidade, 
esta é a hipótese verdadeira. Nesse caso, estamos cometendo o erro do tipo I 
quando rejeitamos a hipótese verdadeira. Simbolizamos esse tipo de erro pela 
letra α. Quando aceitamos H0 e essa é, na realidade, a hipótese falsa, estamos 
cometendo o erro do tipo II, cujo símbolo é a letra β. Veja o Quadro 2, a seguir.
H0 verdadeira H0 falsa
H0 aceita Decisão correta Erro tipo II (β)
H0 rejeitada Erro tipo I (α) Decisão correta
Quadro 2. Tipos de erros no teste de hipóteses
3Testes de hipóteses paramétricos
Segundo Doane e Seward (2014), pelo fato de raramente contarmos com 
informações perfeitas sobre uma situação verdadeira, não conseguimos sempre 
saber se foi cometido o erro tipo I ou tipo II. Entretanto, ao utilizarmos a esta-
tística, podemos calcular a probabilidade de tomarmos uma decisão incorreta, 
minimizando a chance de erro, ao reunirmos o maior número de evidências 
amostrais que nossos recursos permitam e selecionando procedimentos de 
testes adequados.
Podem ser feitas analogias, normalmente utilizadas para exemplificar os 
tipos de erros que podemos cometer ao termos duas hipóteses a serem testadas.
Uma das analogias utilizadas é a de um julgamento, considerando que 
a hipótese nula seja a de o réu ser inocente. Consequentemente, a hipótese 
alternativa será a de o réu ser culpado. Dessa forma, cometemos o erro do 
tipo I, quando condenamos o réu, mas, na realidade, ele é inocente. O erro do 
tipo II é cometido quando absolvemos o réu, sendo este, na verdade, culpado. 
Ao cometermos o erro tipo I, estamos prejudicando o réu, enquanto o erro do 
tipo II prejudica a sociedade, pelo fato de termos absolvido um criminoso.
Outra analogia é o lançamento de um medicamento por uma indústria 
farmacêutica. A empresa só investirá nesse medicamento caso a eficácia seja 
comprovada. Consideramos a hipótese nula — o medicamento é eficiente — e 
a hipótese alternativa — o medicamento não é eficiente. Ao cometermos o erro 
do tipo I, não lançamos o medicamento, alegando que ele não é eficiente, mas, 
na realidade, ele é. Ao cometermos o erro do tipo II, lançamos o medicamento, 
alegando que ele é eficiente, quando, na realidade, ele não é.
Podem ser feitas várias analogias para o dia a dia. Outro exemplo: em 
uma agência bancária, a gerente concede crédito para os clientes que ela julga 
serem bons pagadores, por escores de crédito. H0 representa o cliente bom 
pagador e H1, o cliente mau pagador. A gerente comete erro do tipo I quando 
não concede crédito a um cliente que, na verdade, seria um bom pagador e 
comete erro do tipo II quando concede crédito a um mau pagador.
O erro considerado mais importante a ser evitado ou controlado é o erro do 
tipo I, representado por α e denominado como o nível de significância do teste 
estatístico aplicado. O seu complementar 1 – α é denominado nível de confiança.
Os valores para o nível de significância são encontrados em tabelas de 
distribuição de probabilidades e determinarão a região crítica, se rejeitamos 
a hipótese nula ou se não temos evidências suficientes para rejeitar a hipótese 
nula (aceitar H0).
Observe que, quando aceitamos H0, podemos estar cometendo o erro do tipo II, 
que não é fixado. Então, não podemos afirmar que aceitamos H0 ao nível de 
significância fixado, pois não é esse tipo de erro que está nessa sentença.
Testes de hipóteses paramétricos4
Esse nível de significância determinará a região crítica de acordo com 
as hipóteses formuladas. Com testes unilaterais, existe a probabilidade em 
uma das caudas da distribuição de probabilidades, dependendo das hipóteses 
formuladas. Já com um teste bilateral,há α/2 nas duas caudas da distribuição. 
Veja as representações da Figura 1.
Figura 1. Regiões críticas, considerando a distribuição normal.
Fonte: Freund (2006, p. 307).
Rejeitar a 
hipótese nula
Rejeitar a
hipótese nula
Rejeitar a 
hipótese nula
Rejeitar a 
hipótese nula
α
α/2 α/2
α
–zα
–zα/2 zα/2
zα
z
z
z
Hipótese alternativa μ < μ 0
Hipótese alternativa μ > μ 0
Hipótese alternativa μ ≠ μ 0
0
0
0
Identificar o tipo de erro faz parte do teste de hipóteses, quando definimos 
o nível de significância do teste — ele é definido juntamente com as hipóteses, 
antes mesmo de qualquer coleta de dados ser efetuada. 
5Testes de hipóteses paramétricos
O valor de nível de significância (α) mais utilizado é o de 5%. Isso dependerá 
de uma decisão do pesquisador, querendo ser mais rigoroso ou não.
Com a teoria das probabilidades de erro tipo I e tipo II, podemos, também, 
determinar o poder do teste utilizado. O poder de um teste é definido pela 
probabilidade do complementar do erro do tipo II, ou seja, 1 – β. Logo, quanto 
menor a probabilidade de erro do tipo II, mais poder terá o teste aplicado. 
Para a diminuição da probabilidade de erro do tipo II, aumenta-se a amostra 
estudada. Então, costuma-se afirmar que, quanto maior for o tamanho da 
amostra pesquisada, mais poderoso será o teste utilizado.
Tipos de erros na prática
Quando estamos comparando hipóteses, podemos, na maioria das vezes, estar 
cometendo um erro na nossa decisão. Só podemos ter certeza se soubermos a 
verdade. Para uma melhor compreensão dessa situação, podemos fazer uma 
analogia com um ditado que diz: “para toda a situação existem três versões: 
a sua, a da outra parte e a verdade”.
No caso da estatística, só sabemos se temos efetivamente a verdade quando 
tivermos o valor do parâmetro populacional. Fora isso, quando temos uma 
amostra da população, haverá sempre uma possibilidade de errar, o que seria 
a realidade da população em estudo.
Além dos exemplos do caso jurídico, do lançamento do medicamento e 
da concessão de crédito, no dia a dia, existem outros dos mais variados na 
tomada de decisões.
Por exemplo, muitos celulares atualmente desbloqueiam a tela por impressão 
digital, sendo assim: 
H0 desbloqueia a tela, as impressões conferem. 
H1 não desbloqueia a tela, as impressões não conferem. 
Cometemos o erro do tipo I quando rejeitamos H0, e, na realidade, as im-
pressões eram verdadeiras. E cometemos o erro do tipo II quando aceitamos 
H0, mas, na verdade, as impressões não conferem. 
Assim como nos demais exemplos, o erro a ser controlado é do tipo I, “que 
seja culpado até que provem o contrário”.
Isso ocorre no exemplo do réu, julgando que um dano ao réu (uma vez que 
será condenado sendo inocente) seja menos prejudicial à sociedade do que o 
erro do tipo II, que considera inocente um criminoso. Porém, de acordo com 
os direitos humanos, não podemos arcar com o dano de condenar uma pessoa 
Testes de hipóteses paramétricos6
inocente. Para controlar o erro do tipo II, as cortes refinam seus métodos de 
julgamento.
No exemplo da indústria farmacêutica, quando não lançamos um medi-
camento ao cometer o erro do tipo I, estamos de qualquer forma deixando os 
usuários desse medicamento sem a solução para a doença. Porém, se cometemos 
o erro do tipo II, lançamos um medicamento que não é eficaz, o que pode 
causar danos, mas a indústria farmacêutica refina a cada dia seus métodos 
para testes de novos medicamentos.
Assim como no exemplo da gerente de banco, conceder crédito a um mau 
pagador, que configura erro do tipo II, é prejudicial apenas para a instituição 
de crédito. Já o erro do tipo I, de negar crédito a um bom pagador, acaba 
prejudicado o cliente e não o banco. Sendo assim, o erro tipo I seria o pior 
de ser aceito, sem contar que as instituições financeiras a cada dia melhoram 
seus escores de crédito, e o erro do tipo II é menos comum.
Por esses motivos que o erro fixado é o do tipo I, chamado de nível de 
significância (α). Essa será sempre a probabilidade de erro fixada nos testes 
de hipóteses paramétricos e não paramétricos.
Desejamos controlar, então, o falso positivo, erro do tipo I, quando rejeita-
mos a hipótese nula e ela seria a verdadeira. Os falsos negativos, erros do tipo II, 
quando aceitamos a hipótese nula e ela seria falsa, podem ser controlados com 
o aumento da amostra estudada. Devemos, então, conseguir um equilíbrio 
por meio da redução de ambas as probabilidades de erro.
Na prática, um teste estatístico será iniciado pela formulação das hipóteses 
nula e alternativa, depois calculada a estatística de teste, que atualmente é 
facilmente resolvida em planilhas eletrônicas e softwares estatísticos, então, 
a tomada de decisão de acordo com o nível de significância do teste realizado 
e, por último, a conclusão do teste.
Queremos comparar as médias salariais de homens e mulheres que trabalham com 
cargos gerenciais. Foram coletados dados de 15 homens e 12 mulheres, considerando 
nível de significância de 5%.
Como estamos lidando com duas amostras independentes, utilizaremos o teste t 
para duas delas.
7Testes de hipóteses paramétricos
Primeiro, formulamos as hipóteses:
H0: salário dos homens é igual ao salário das mulheres
H1: salário dos homens é diferente do salário das mulheres
Depois calculamos a estatística de teste:
tcalc =
(x–1 – x
–
2)
s21
n1
s22
n2
+
= =
(6640 – 6375)
174000
15
+ 367500
12
265
205,49
= 1,2896
De acordo com a saída do Excel:
  Homem Mulher
Média 6640 6375
Variância 174000 367500
Observações 15 12
Hipótese da diferença de média 0
gl 19
Stat t 1,289618
P(T<=t) unicaudal 0,106331
t crítico unicaudal 1,729133
P(T<=t) bicaudal 0,212661
t crítico bicaudal 2,060024  
Teste-t: duas amostras presumindo variâncias diferentes
O próximo passo é definir a região crítica. Nesse caso, o valor tabelado da distribuição 
é t-student com α/2 = 0,025 e com os graus de liberdade iguais a GL = n1 + n2 – 2 = 
15 + 12 – 2 = 25. 
Testes de hipóteses paramétricos8
Nível de significância - alfa
GL 0,250 0,100 0,050 0,025 0,010 0,005
1 1,000 3,078 6,314 12,706 31,821 63,657
2 0,816 1,886 2,920 4,303 6,965 9,925
3 0,765 1,638 2,353 3,182 4,541 5,841
4 0,741 1,533 2,132 2,776 3,747 4,604
5 0,727 1,476 2,015 2,571 3,365 4,032
6 0,718 1,440 1,943 2,447 3,143 3,707
7 0,711 1,415 1,895 2,365 2,998 3,499
8 0,706 1,397 1,860 2,306 2,896 3,355
9 0,703 1,383 1,833 2,262 2,821 3,250
10 0,700 1,372 1,812 2,228 2,764 3,169
11 0,697 1,363 1,796 2,201 2,718 3,106
12 0,695 1,356 1,782 2,179 2,681 3,055
13 0,694 1,350 1,771 2,160 2,650 3,012
14 0,692 1,345 1,761 2,145 2,624 2,977
15 0,691 1,341 1,753 2,131 2,602 2,947
16 0,690 1,337 1,746 2,120 2,583 2,921
17 0,689 1,333 1,740 2,110 2,567 2,898
18 0,688 1,330 1,734 2,101 2,552 2,878
19 0,688 1,328 1,729 2,093 2,539 2,861
20 0,687 1,325 1,725 2,086 2,528 2,845
21 0,686 1,323 1,721 2,080 2,518 2,831
22 0,686 1,321 1,717 2,074 2,508 2,819
23 0,685 1,319 1,714 2,069 2,500 2,807
24 0,685 1,318 1,711 2,064 2,492 2,797
25 0,684 1,316 1,708 2,060 2,485 2,787
9Testes de hipóteses paramétricos
Na tabela, encontramos o valor tabelado de 2,06.
Como a estatística de teste = 1,2896 < valor tabelado = 2,06, consequentemente 
fora da região crítica, aceitamos H0.
Por fim, concluímos a respeito do teste:
Não existem evidências suficientes para rejeitar H0. Logo, o salário médio de homens 
e mulheres pode ser considerado igual, ao nível de significância de 5%.
Estamos estudando o valor do preço do combustível nos 3 estados da região Sul. 
Em cada uma das regiões, foi pesquisado o valor da gasolina comum. Tomaremos a 
decisão considerando o nível de significância de 5%.
Como estamos querendo comparar três médias, utilizaremos o teste ANOVA (análise 
de variância).
Primeiramente, formulamos as hipóteses:
H0: o valor do preço médio da gasolina comum 
é igual nos três estados
H1: o valor do preço médio da gasolina comum é diferente 
em pelo menos um dos três estados
O segundopasso é o cálculo da estatística de teste. Para o teste ANOVA, os cálculos 
manuais são bastante extensos. Por isso, tomaremos por base apenas a saída do Excel.
Resumo
Grupo Contagem Soma Média Variância
RS 10 48,63 4,863 0,001534
SC 12 55,65 4,6375 0,002039
PR 8 39,66 4,9575 0,001393
Testes de hipóteses paramétricos10
ANOVA
Fonte 
da va-
riação
SQ gl MQ F valor-P F crítico
Entre 
grupos
0,554895 2 0,277448 162,9027 8,54E-16 3,354131
Dentro 
dos 
grupos
0,045985 27 0,001703
Total 0,60088 29
Na terceira etapa, definimos a região crítica.
Como o valor calculado na tabela F = 162,9027 > valor tabelado da distribuição 
Fcrítico = 3,354131, rejeitamos H0.
Observe que podemos tomar a decisão do teste por meio da comparação 
do valor calculado da estatística de teste com o valor tabelado na distribuição 
de probabilidades referente ao teste utilizado. Esse valor tabelado é o que 
chamamos de crítico — é o valor tabelado considerando o nível de signifi-
cância fixado.
Se estatística de teste > valor tabelado (valor crítico) → rejeitamos H0
Se estatística de teste < valor tabelado (valor crítico) → não rejeitamos H0
Assim como também podemos tomar a decisão de acordo com a probabi-
lidade da estatística de teste (valor p) comparada com a probabilidade fixada 
do nível de significância (por exemplo, 5%).
valor de p (probabilidade da estatística de teste) > nível de significância
 → não rejeitamos H0
valor de p (probabilidade da estatística de teste) > nível de significância 
→ rejeitamos H0
11Testes de hipóteses paramétricos
M
ét
od
o
N
ív
el
 d
e 
m
en
su
ra
çã
o 
da
 v
ar
iá
ve
l
Te
st
es
 d
e 
hi
pó
te
se
s
U
m
a 
am
os
tr
a
D
ua
s 
am
os
tr
as
Vá
ri
as
 a
m
os
tr
as
Re
la
ci
on
ad
as
N
ão
 re
la
ci
on
ad
as
Re
la
ci
on
ad
as
N
ão
 re
la
ci
on
ad
as
N
ão
 
Pa
ra
m
ét
ric
o
N
om
in
al
Bi
no
m
ia
l
Q
ui
 q
ua
dr
ad
o 
um
a 
am
os
tr
a
M
ac
N
em
ar
Q
ui
 q
ua
dr
ad
o 
du
as
 a
m
os
tr
as
Co
ch
ra
n 
Q
Q
ui
 q
ua
dr
ad
o 
vá
ria
s a
m
os
tr
as
 
in
de
pe
nd
en
te
s
O
rd
in
al
Ko
lm
og
or
ov
-
-S
m
irn
ov
W
ilc
ox
on
M
ed
ia
na
,
M
an
n-
W
hi
tn
ey
 U
,
Ko
lm
og
or
ov
-
-S
m
irn
ov
An
ál
ise
 d
e 
va
riâ
nc
ia
 e
m
 
du
as
 d
ire
çõ
es
 
de
 F
rie
dm
an
M
ed
ia
na
-
-v
ár
ia
s a
m
os
tr
as
 
in
de
pe
nd
en
te
s
An
ál
ise
 d
e 
va
riâ
nc
ia
 
nu
m
a 
di
re
çã
o 
de
 
Kr
us
ka
l-W
al
lis
Pa
ra
m
ét
ric
o
Q
ua
nt
ita
tiv
a 
z 
pa
ra
 u
m
a 
m
éd
ia
,
t p
ar
a 
um
a 
m
éd
ia
t p
ar
a 
am
os
tr
as
 
re
la
ci
on
ad
as
 
(p
ar
ea
da
s)
D
ife
re
nç
a 
de
 
m
éd
ia
s
z 
pa
ra
 d
ua
s a
m
os
-
tr
as
 in
de
pe
nd
en
te
s
t p
ar
a 
du
as
 a
m
os
-
tr
as
 in
de
pe
nd
en
te
s
Re
gr
es
sã
o
An
ál
ise
 d
e 
va
riâ
nc
ia
Q
ua
dr
o 
3.
 R
es
um
o 
de
 ti
po
s d
e 
te
st
es
 d
e 
hi
pó
te
se
s
Testes de hipóteses paramétricos12
DOANE, D. P.; SEWARD, L. E. Estatística aplicada à administração e economia. 4. ed. Porto 
Alegre: AMGH, 2014.
FREUND, J. E. Estatística aplicada: economia, administração e contabilidade. 11. ed. 
Porto Alegre: Bookman, 2006.
13Testes de hipóteses paramétricos
Conteúdo:

Outros materiais

Outros materiais