4. testes de hipóteses

Estatística I

•

UNIDERP - ANHANGUERA

Alison Ribeiro

13.03.2018

Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original

Testes de Hipóteses
Silvana Ligia Vincenzi
Slides preparados a partir do material dos seguintes Professores:
Márcio Souza, Armando Mateus Ferreira, Dr. Osvaldo Silva, Filipe Gago da Câmara e
1
Introdução
		O processo de estimação que generaliza resultados de amostras para diferentes universos. 
		Uma evolução do uso da estimação é apresentada por meio dos testes de hipóteses, que buscam confrontar alegações sobre o todo com resultados obtidos de amostras. 
TESTE DE HIPÓTESES
Trata-se de uma técnica para se fazer a inferência estatística sobre uma população a partir de uma amostra.
É uma regra de decisão para aceitar ou rejeitar uma hipótese estatística com base nos elementos amostrais. 
*	Paramétricos (calcula as diferenças numéricas exatas entre os resultados); assumem premissas sobre a distribuição de parâmetros da população;
*	Não paramétricos (apenas consideram se certos resultados são superiores ou inferiores a outros resultados); utilizados quando não se pode supor ou assumir características sobre parâmetros da população de onde a amostra foi extraída.
Os testes de hipóteses podem ser:
Requisitos para utilização de testes paramétricos
Quando se pretende empregar um teste t de Student ou uma análise da variância para fazer comparações entre amostras (testes paramétricos), existe uma lista de requisitos que inclui, entre outros:
que a variável tenha sido mensurada num nível mínimo intervalar 
que a distribuição seja simétrica e mesocurtica
a característica estudada (variável) tem distribuição normal numa dada população
5
Opção
	Sempre que não se pode, honestamente, admitir a simetria e a normalidade de distribuição, ou os dados foram recolhidos num nível de mensuração inferior ao intervalar, devemos recorrer a testes que não incluem a normalidade da distribuição ou nível intervalar de mensuração.
	Esses testes chamam-se não paramétricos
6
A escolha dos testes
	Comparação entre duas amostras:
Não Pareadas
Não normal
Normal
Nominal
Ordinal, intervalar ou razão
Teste de Qui-Quadrado (Homogeneidade) 
Teste Mann-Whitney U, Wald-Wolfowitz Runs Test, Kolmogorov-Smirnov Two-Sample Test 
Teste t de Student
Amostras não pareadas = amostras independentes
Normal = testes paramétricos
Não normal = testes não paramétricos
A escolha dos testes
	Comparação entre duas amostras:
Pareadas
Não normal
Normal
Dicotômica
Ordinal, intervalar ou razão
Teste de McNemar
Teste de Friedman, Sign-Test, Wilcoxon Matched-Pairs Test 
Teste t de Student Pareado 
A escolha dos testes
	Comparação entre três ou mais amostras:
Não Pareadas
Não normal
Normal
Nominal
Ordinal, intervalar ou razão
Teste de Qui-Quadrado (Homogeneidade) 
ANOVA de Kruskal-Wallis 
ANOVA c/ Grupos Independentes 
A escolha dos testes
	Comparação entre três ou mais amostras:
Pareadas
Não normal
Normal
Nominal
Ordinal, intervalar ou razão
Teste Q de Cochran
ANOVA de Friedman
ANOVA c/ Medidas Repetidas 
PRINCIPAIS CONCEITOS
HIPÓTESE ESTATÍSTICA
É uma suposição quanto ao valor de um parâmetro populacional que será verificada por um teste paramétrico.
PRINCIPAIS CONCEITOS
TIPOS DE HIPÓTESES
Designa-se por Ho, chamada hipótese nula, a hipótese estatística a ser testada, e por H1, a hipótese alternativa. 
A HIPÓTESE NULA É UMA ASSERTIVA DE COMO O MUNDO DEVERIA SER, SE NOSSA SUPOSIÇÃO ESTIVESSE ERRADA.
A hipótese nula expressa uma igualdade, enquanto a hipótese alternativa é dada por uma desigualdade.
Ex: Ho -  = 1,65 m
 H1 -  1,65 m
Nível de Significância ()
O nível de significância () é o limite para a probabilidade de significância a partir do qual se passa a rejeitar a hipótese nula do teste.
Representa a probabilidade tolerável de se rejeitar Ho quando esta for verdadeira.
Os valores mais comuns para o nível de significância são 5%, 10% e 1%.
Tipos de erros
(PODER DO TESTE)
Tipos de erros
Exemplo: 
Uma pessoa é inocente até prova do contrário
H0: A pessoa é inocente;
H1: A pessoa é culpada;
Erro I (): A pessoa é condenada mas é inocente;
Erro II (): A pessoa é absolvida mas é culpada;
* Um caso de justiça:
Tipos de amostras
Amostras independentes
Exemplo – Considere o problema de comparar dois materiais (A e B), para sola de tênis, em termos do grau de desgaste após um certo período de uso. Seguem dois projetos de experimentos alternativos:
1) Um grupo de indivíduos usa tênis com solas feitas com o material A; e outro grupo usa tênis com solas feitas com o material B. 
Amostras independentes
Material B
Material A
divisão aleatória
Mensuração do grau de desgaste
Mensuração do grau de desgaste
Amostras pareadas (se g > 2, “em blocos”)
2) Fabricam-se, para a realização do experimento, pares de tênis com os dois tipos de sola, isto é, um dos pés com o material A e o outro pé com o material B. Em cada par, o material usado em cada pé (direito ou esquerdo) é decidido por sorteio.
Amostras pareadas 
(se g > 2, “em blocos”)
Mensuração do grau de desgaste
B
A
B
A
A
B
B
A
A
B
alocação aleatória de A e B em cada par
Procedimentos para se efetuar um teste
Enunciar as hipóteses Ho e H1
Fixar o limite de erro e identificar a variável do teste
Determinar a RA região de aceitação e RC região crítica, pelas tabelas estatísticas
Por meio de elementos amostrais, avaliar o valor da variável do teste.
Concluir pela aceitação ou rejeição de Ho pela comparação do valor obtido no 4º passo com as regiões críticas e de aceitação fixadas no 3º passo.
Quando se utiliza um pacote estatístico (BioEstat, SPSS, Minitab) basta enunciar as hipóteses e decidir o teste com base no valor de p (p valor, sig ou p value)
 
Se p-valor  , rejeita-se H0.
Se p-valor > , não rejeita-se Ho.
Teste para duas amostras: hipóteses
Na abordagem bilateral: H0: 1 = 2 e H1: 1  2 
onde:	
1	é o valor esperado da resposta sob o tratamento 1 e 2	é o valor esperado da resposta sob o tratamento 2. 
Na abordagem unilateral, a hipótese alternativa é do tipo H1: 1 > 2 ou H1: 1 < 2.
Monocaudal para direita ou Unilateral a direita
Monocaudal para esquerda ou Unilateral à esquerda
Bicaudal ou bilateral 
Testes Paramétricos
Teste para comparação de duas Médias
Amostras independentes (não pareadas)
Amostras pareadas
	
Distribuição t de Student com (n-1) graus de liberdade ou,
 Distribuição Normal (n>30) (quando a amostra for grande ou a população tiver distribuição normal, e conhecer o desvio padrão populacional ).
Teste para duas médias Independentes
Estatística: Quando não conhecemos a variância da população
Onde Sc é a variância comum:
Com gl=n1+n2 - 2
Teste para duas médias independentes
Estatística: Se o desvio padrão populacional for conhecido ou o tamanho da amostra for igual ou maior que 30
Teste t para duas amostras pareadas
onde: n	é o tamanho da amostra (número de pares); 
		é a média das diferenças observadas; e
		é o desvio padrão das diferenças observadas. 
Usa distribuição t de Student com gl = n – 1 graus de liberdade (supondo populações com distribuição normal).
Estatística:
Exemplo: Teste t para duas amostras pareadas
 Seja o problema de verificar se um novo algoritmo de busca em um banco de dados é mais rápido que o algoritmo atualmente usado. Para se fazer a comparação dos dois algoritmos, planeja-se realizar uma amostra aleatória de 10 buscas experimentais (ensaios). Em cada ensaio, uma dada busca é realizada pelos dois algoritmos e o tempo de resposta de cada algoritmo anotado. Observamos que em cada ensaio os dois algoritmos são usados em condições idênticas, caracterizando 10 pares de observações.
H0: em média, os dois algoritmos são igualmente rápidos e 
H1: em média, o algoritmo novo é mais rápido do que o algoritmo em uso.
1 é o tempo esperado de resposta do algoritmo novo e 
2 é o tempo esperado de resposta do algoritmo antigo.
H0:
2 = 1 
H1: 1 < 2
Ensaio
NOVO X1
ANTIGO x2
d= Diferença
1
22
25
2
21
28
3
28
26
4
30
36
5
33
32
6
33
39
7
26
28
8
24
33
9
31
30
10
22
27
RESOLUÇAO NO CADERNO
Exemplo: Amostras não pareadas
Desejamos verificar se os catalisadores A e B têm efeitos
diferentes no rendimento de uma certa reação química. As hipóteses são:
• H0: em média, os dois catalisadores são iguais em termos de rendimento; e
• H1: em média, os dois catalisadores são diferentes em termos de rendimento.
Catalisador A
Catalisador B
45 51 50 62 43 42 53 504155
45 35 43 59 48 45 41 43 49 39
33
 	No Excel
Clique em Ferramentas, Análise de dados:
Amostras pareadas – Teste-T duas amostras em par para médias
Amostras independentes: Teste – T duas amostras presumindo variâncias equivalentes ou variâncias diferentes depende dos resultados das variâncias. Em ambos basta selecionar os dados e ok.
	
Valores de Z tabelado

0.10
0.05
0.01
0.005
0.002
Unilateral
-1.28 ou1.28
-1.645
ou 1.645
-2.33 ou 2.33
-2.58 ou 2.58
-2.88 ou2.88
Bilateral
-1.645 e 1.645
-1.96e 1.96
-2.58 e 2.58
-2.81 e 2.81
-3.08 e 3.08
Tem outros como o Teste de Kolmogorov-Smirnov, o Teste de Lilliefors.
Exemplo: Normalidade
Verifique se os dados provêm de uma população que segue distribuição normal:
H0: os dados provêm de uma população que segue distribuição normal;
H1: os dados não provêm de uma população que segue distribuição normal.
Normalidade - No BioEstat ir em normalidade – 
Decisão: Segundo o teste Anderson-Darling, o p_valor=0,36>=0,05, não rejeita Ho, logo, os dados provêm de uma distribuição normal, ao nível de 5%.
93,45
94,46
94,93
96,17
96,74
97,07
97,68
97,93
99,1
100,73
103,29
103,83
105,2
Testes de hipóteses
 NÃO PARAMÉTRICOS
As técnicas de estatística não paramétrica são particularmente adaptáveis aos dados das ciências do comportamento. 
A aplicação dessas técnicas não exige suposições quanto à distribuição da população da qual se tenha retirado amostras para análises.
Podem ser aplicadas a dados que se disponham simplesmente em ordem, ou mesmo para estudo de variáveis nominais.
Na estatística paramétrica, as variáveis são, na maioria das vezes, intervalares.
Exigem poucos cálculos e são aplicáveis para análise de pequenas amostras.
Independe dos parâmetros populacionais e amostrais (média, variância, desvio padrão).
TIPOS DE TESTE
Qui-Quadrado
Teste de Wilcoxon
Teste de Mann-Whitney
Teste de Kruskal-Wallis
Duas Amostras Independentes
QUI-QUADRADO (2)
Testes de Adequação de amostras e Associação entre variáveis
Qui-quadrado (2)
QUI-QUADRADO (2)
Denominado teste de adequação ou ajustamento.
Usos 
Adequação ou Aderência dos dados: frequência observada adequada a uma frequência esperada);
Independência ou Associação entre duas variáveis Comportamento de uma variável depende de outra.
			 
				2 = 
 Ho: as variáveis são independentes;
	H1: as variáveis são dependentes;
EXEMPLO
Dependência entre bairro e escolha do sabor de pasta de dente
Dados:
					Ho: a preferência pelo sabor independe do 				 	 bairro;
					H1: a preferência pelo sabor depende do 					 bairro
					 = 5%
					
				
Sabor
Bairros

A
B
C
Limão
70
44
86
200
Chocolate
50
30
45
125
Hortelã
10
6
34
50
Menta
20
20
85
125

150
100
250
500
	Resultados do Bio Estat
Tabela de Contingência =	4 x 3
Qui-Quadrado =	37.867
Graus de liberdade =	6
(p) =	< 0.0001
Decisão: Como o valor de p <0,0001 < =0,05, rejeita a hipótese nula, logo a preferência pelo sabor depende do bairro, ao nível de 5%.
No Bio Estat
Estatísticas – Qui-quadrado – tabela de contingência (L x C) – Seleciona os dados e assinale execute estatística (copia os dados conforme exemplo no excel).
Duas amostras independentes – Qui-quadrado (LxC) - Seleciona os dados e assinale execute estatística .
Exemplo 2
Um investigador deseja verificar a relação entre os interesses vocacionais e a escolha do currículo, e a taxa de desistência do curso universitário por parte de estudantes bem dotados.
Ho: Não há diferenças entre os grupos no que diz respeito à proporção de estudantes que permanecem na faculdade.
H1: A percentagem de permanência na faculdade é maior que os estudantes cuja a escolha do currículo foi considerada “positiva”.
Decisão: Como o valo de p = 0,0199<  = 0,05, rejeita a hipótese nula, logo A percentagem de permanência na faculdade é maior que os estudantes cuja a escolha do currículo foi considerada “positiva, ao nível de 5%.
 
Positivo
Negativo
Total
Afastamento
10
11
21
Permanência
46
13
59
Total
56
24
80
Teste Mann-Whitney-Wilcoxon
É usado para testar se das amostras independentes foram retiradas de populações com média iguais.
Trata-se de uma interessante alternativa ao teste paramétrico para igualdade de médias, pois o teste não exige considerações sobre a distribuição populacional. Aplicado à variáveis intervalares e ordinais.
O teste de Mann-Whitney-Wilcoxon (ou teste M-W-W) é um teste não-paramétrico alternativo ao teste t-Student para comparar as médias de duas amostras independentes.
Exemplo: a média de vendas de dois shoppings são diferentes?
Exemplo 1
Na disciplina de Estatística Aplicada, onde se encontra inscritos alunos do curso de Matemática (ensino de) e Matemática Informática, registraram-se as seguintes classificações numa das frequências:
O que se pode concluir a cerca das médias das ordens das classificações?
Mat
10,5
16,5
11
9,8
17,1
1,5
14,8
9,9
9,8
10,3
8,7
Mat/Info
11,4
12,9
10,1
7,9
8,8
12,8
 
 
 
 
 
Hipóteses:
Ho: Não há diferença entre as médias das ordens das notas dos alunos de matemática (ensino de ) e de Matemática/Informática
H1: Há diferenças entre as médias das ordens (teste bilateral).
Resultado	Amostra 1	Amostra 2
Tamanho da amostra	11	6
Soma dos Postos (Ri)	100.0	53.0
Mediana =	10.00	10.50
		
U =	32.00	
Z(U) =	0.1005	
p-valor (unilateral) =	0.4600	
p-valor (bilateral) =	0.9199	
Bio Estat
Decisão: Como p=0.92> 0,05, não rejeita hipótese nula, logo Não há diferença entre as médias das ordens das notas dos alunos de matemática (ensino de ) e de Matemática/Informática.
Duas amostras pareadas
Teste de Wilcoxon
Quando se têm pares de observações e as diferenças têm distribuição normal, usa-se o teste paramétrico t-Student para comparar as médias de duas amostras emparelhadas. Porém, se as diferenças não se distribuem normalmente, pode usar-se o teste de Wilcoxon sobre as diferenças, desde que estas tenham um comportamento contínuo e simétrico.
Este teste leva em consideração a magnitude da diferença para cada par.
Exemplo: um processo de emagrecimento em teste. 
 Cada par no caso é o mesmo indivíduo com peso antes e depois do processo.
Exemplo:
Existem diversos métodos de estimação do volume de madeira produzido pelas árvores, nomeadamente modelos de estimação baseados no diâmetro basal e modelos de estimação baseados no diâmetro à altura do peito (dap). Pretende-se comparar um método de estimação baseado no diâmetro basal com outro método baseado no dap. 
Para tal, os volumes (m3) de madeira dos mesmos 15 pinheiros foram estimados pelos dois métodos:
Como exposto, pretendendo testar se as estimativas pelos dois métodos são idênticas então a média das diferenças entre as observações será nula, e o teste de hipóteses é:
Z = , 
Decisão: Como o valor de p= 0,955>= 0,05, não rejeita a hipótese nula, logo não existe diferença nos métodos de estimação basal e dap, ao nível de 5%.
Basal
1.06
1.08
1.12
0.98
1.05
0.85
1.06
0.87
1.03
1.1
0.95
0.78
1.23
1.04
0.88
Dap
1.12
0.97
1.15
1.07
0.89
0.98
1.13
0.82
1.15
1.25
0.86
0.83
1.05
0.89
1.02
	ResultadosCols. 1 e 2
T =	59
Número de pares =	15
Z =	0.0568
p-valor (unilateral) =	0.4774
p-valor (bilateral) =	0.9547