Buscar

Correlação e Regressão: Técnicas Estatísticas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 22 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 22 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 22 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Unidade 3 IMPRIMIR AQUI 17/04
Correlação e Regressão 
São duas técnicas relacionadas, que visa estimar uma relação que possa existir entre duas variáveis na população.
Por exemplo, em uma competição esportiva, o mapa de dispersão para os corredores dos cem metros, deixa a impressão que o menor tempo para as mulheres corresponde ao maior tempo para os homens e o maior tempo para as mulheres corresponde ao maior tempo para os homens.
Essa relação mostra que os tempos para as mulheres estão correlacionados positivamente com os tempos dos homens. (Larson/Farber).
 
Larson/Farber: Correlação e Regressão. Página 333
Graficamente, a reta chamada de regressão, se ajusta aos pontos da forma mais próxima possível.
Correlação
Uma correlação é o grau de relacionamento entre duas variáveis, x e y por exemplo. Os dados podem ser representados por pares ordenados (x, y), onde x é a variável independente e y é a variável dependente.
Mapa de dispersão mostra se existe uma correlação linear ou não linear e se não há correlação. Veja alguns exemplos a seguir:
 
Coeficiente de Correlação
O coeficiente de correlação é uma forma mais precisa para verificar o grau de correlação linear entre duas variáveis. O valor pode variar entre -1 e 1 e o resultado obtido define se a correlação é negativa ou positiva.
Quando o valor do coeficiente estiver próximo de 1 significa que a existe uma forte correlação positiva entre as variáveis, se estiver próximo de -1, significa que existe uma forte correlação negativa, se o coeficiente estiver próximo de zero, a correlação linear é fraca e se for igual a 0 significa que as variáveis não dependem uma da outra.
Cálculo do coeficiente de correlação
O coeficiente de correlação de Pearson, também chamado de produto momento de Pearson mede a correlação linear entre as variáveis.
 
Mas não se preocupe com o tamanho da fórmula, pois a maioria das calculadoras possui funções automáticas para esse cálculo.
Exemplo
Considere a tabela abaixo e calcule o coeficiente de correlação de Pearson e apresente sua conclusão. Os elementos necessários para o cálculo de correlação são:
Encontrando o coeficiente de correlação:
Substituindo os valores na fórmula:
Conclusão: Como r é próximo de 1, então existe uma forte correlação positiva entre as variáveis x e y.
Exemplo 2
Um sociólogo conduz um estudo para determinar se existe uma relação linear entre o nível de renda familiar (em milhares de dólares) e o percentual da renda doado para entidades assistenciais. Os dados estão dispostos na tabela a seguir.
Calcule o coeficiente de correlação para o nível de renda e o percentual de donativos. E apresente sua conclusão.
Adaptado de Larson; Farber, página 338
 
 
Conclusão: Como r está próximo de -1 existe uma forte correlação negativa entre o nível de renda e a porcentagem de doação.
Regressão Linear
Vimos a correlação entre duas variáveis x e y, agora vamos determinar a equação da reta que melhor apresenta os dados desta correlação. Essa reta recebe o nome de regressão e por meio de sua equação pode se prever o valor de y para um valor de x.
A reta de regressão descreve como uma variável dependente y varia em relação a uma variável independente x.
A equação de uma reta de regressão para uma variável independente x e uma variável dependente y é dada:
Exemplo
Vamos considerar o exemplo 2 de correlação, para determinar a equação da reta de regressão para o nível de renda e a porcentagem de donativos.
 
Substituindo na fórmula
 
 
Resposta: A equação da reta da regressão é y = -0,213x + 18,761.
Distribuição Normal
A distribuição contínua de probabilidade considerada a mais importante em estatística é a distribuição normal. Pode ser usada para modelar muitos conjuntos de medida em áreas diversas como indústria, comércio etc 
Nesta aula você irá reconhecer a distribuição normal e usar as suas propriedades. A distribuição normal é uma distribuição contínua de probabilidade de uma variável aleatória X. Seu gráfico é chamado de curva normal.
.
Possui as seguintes propriedades:
» P1 - O gráfico tem a forma de um sino.
» P2 – A área sob a curva é igual a 100%.
» P3 – A curva é uma função de x e o seu domínio estende-se de - a +?.
» P4 - A curva é assintótica; nunca toca o eixo horizontal e, portanto, a função de x jamais se anula.
» P5 - A distribuição é simétrica em torno da média.
» P6 - A curva tem dois pontos de inflexão, simétricos em relação à média. Esses pontos de inflexão são desvio padrão da distribuição normal.
Entendendo a distribuição normal padrão
A distribuição normal padrão possui uma média 0 (zero) e um desvio padrão 1. Para diferenciar de uma distribuição utiliza-se a letra z para representar a variável normal padrão.
Regra Empírica
 
Em uma distribuição normal com média e desvio padrão , pode-se aproximar áreas sob a curva normal da seguinte forma:
Tabela de Distribuição Normal
Há vários tipos de tabelas que apresentam as áreas (probabilidades) sob a curva normal padrão. Iremos utilizar duas tabelas, sendo uma com valores positivos para z e outra com valores negativos para z.
Tabela com valores de z positivos
Exemplo 1
Obter a área para z = 1,24.
Localizamos primeiro o valor 1,2 na coluna à esquerda e depois procuramos o valor 0,04 na linha. Veja na tabela. O valor obtido será 0,8925.
Z = 1,24 = área 0,8925 ou 89,25% (Multiplicado por 100)
Exemplo 2
Obter a área para z = 2,07.
Localizamos primeiro o valor 2,0 na coluna à esquerda e depois procuramos o valor 0,07 na linha. Veja na tabela. O valor obtido será 0,9808.
Z = 2,07 = área 0,9808 ou 98,08%(Multiplicado por 100)
Tabela com valores de z negativos
Intervalo de Confiança
Um intervalo de confiança é um intervalo que contém um parâmetro populacional.
São usados para indicar a confiabilidade de uma estimativa, pode ser usado para descrever o quanto os resultados de uma pesquisa são confiáveis. Uma pesquisa que apresenta um menor intervalo de confiança é mais confiável do que uma que apresenta um intervalo de confiança maior.
O intervalo de confiança é expresso em porcentagem, e os mais indicados são 90%, 95% e 99%, sendo o de 95% mais utilizado.
Observe a figura a seguir:
 
Nível de confiança
Os níveis de confiança mais indicados são 90%, 95%, 99%. O escore z desses níveis são:
 
Construindo um intervalo de confiança para populações
Considerando x como variável de interesse, encontramos o intervalo de confiança para população utilizando a seguinte fórmula:
Exemplo 1
Resposta: 95% da população está entre 29,82 e 32,96.
Exemplo 2
Encontre um intervalo de confiança de 95% para o QI (Quociente de Inteligência) de uma população, com uma média de 100 e desvio padrão igual a 15.
Resposta: Considerando os dados apresentados, 95% da população tem o QI entre 70,6 e 129,4.
Intervalos de confiança para amostras
Exemplo 1
Construa um intervalo de confiança de 95% considerando uma amostra de 25 notas de despesas, de um determinado mês, em uma empresa com 500 funcionários, com uma despesa média de R$ 220,00, com um desvio padrão de R$ 20,00.
Temos:
Substituindo na fórmula
Resposta: Com 95% de confiança, a despesa média da empresa está entre R$ 212,16 e R$ 227,84
Exemplo 2
Determine o intervalo de confiança ao nível de 95% de uma amostra aleatória de 100 alunos de uma universidade, supondo que as alturas tenham distribuição normal, com desvio padrão igual a 15 cm e média de 175 cm.
Temos:
Substituindo na fórmula
Resposta: Com 95% de confiança, a altura média dos alunos está entre 172,06 cm e 177,94 cm.
Números índices 
Fundamentação Teórica
Os números-índices são medidas estatísticas utilizadas por administradores, economistas para comparar grupos de variáveis relacionadas entre si e obter alterações em áreas relacionadas como preços de matérias-primas, aumento do PIB (Produto Interno Bruto), aumento dos salários, entre outros. Nesta aula, veremos alguns índices econômicos e sua utilização.
Índices simples
Número-índice é o quociente entre dois valores. Determina a variação percentual de um item em relação a seu valor em outro período,chamado de período-base.
Índice = x 100
Exemplo 1
Comparar o preço do refrigerante lata no supermercado sendo de R$ 2,25 e o preço praticado na lanchonete sendo R$ 5,00.
Resposta: A diferença percentual entre os preços é de 222,22%.
Observe que o preço no supermercado é diferente do praticado na lanchonete.
Exemplo 2
O valor do salário mínimo nacional em 2018 era R$ 954,00. Em 2019 era de R$ 998,00 e em 2020 foi para R$ 1.045,00. Verifique o aumento percentual em 2019 e em 2020.
Exemplo 3
Observe a tabela a seguir:
Calcular o índice dos lucros considerando 2016 ano-base.
Interpretação dos índices
Número índice maior que 100 o valor aumentou em relação ao período-base.
Número índice igual a 100 o valor não se alterou em relação ao período-base.
Número índice menor que 100 o valor diminuiu em relação ao período-base.
Índices encadeados.
Neste tipo de índice, o período-base ou ano-base progride em um período a cada cálculo realizado. Vamos utilizar a fórmula:
x 100
Exemplo
Na tabela a seguir, vamos calcular e interpretar o índice encadeado utilizando janeiro como base.
Unidade 4 – Cálculo de Probabilidades 
Probabilidade da Reunião ou União
Se A e B são eventos quaisquer de um espaço amostral S, finito e não vazio, então
 
Exemplo 1
Considerando a probabilidade de um conjunto A igual a 3/10 e a probabilidade de um conjunto B igual a 5/10 e a intersecção entre os conjuntos A e B sendo de 2/10 , determine a união entre os dois conjuntos A e B.
Solução:
Exemplo 2
Retirando ao acaso uma carta de um baralho comum de 52 cartas, qual a probabilidade de obter um rei ou uma carta de ouros?
 
Solução
Observe as cartas de um baralho comum, o espaço amostral é igual a 52 cartas, ou seja, n(S) = 52.
Vamos chamar de A para o evento Rei que será igual a n(A) = 4/52. Veja nas cartas que temos uma carta rei de cada naipe.
Vamos chamar de B para o evento Carta de Ouros que será igual a n(B) = 13/52.
Entre as quatro cartas de rei e as treze cartas de ouros, existe uma única carta comum. Assim temos n(A ∩ B) = 1/52.
Substituindo na fórmula:
Eventos Mutuamente Exclusivos
Se A ∩ B = Ø, então A e B são chamados mutuamente exclusivos.
Observe que P (A ∩ B) = 0 e então:
P (AUB) = P(A) + P(B)
 
Exemplo
Retirando ao acaso uma carta de um baralho comum de 52 cartas, qual é a probabilidade de retirar uma dama ou um rei?
Solução:
 
Observe as cartas de um baralho comum, o espaço amostral é igual a 52 cartas, ou seja, n(S) = 52.
Seja A para o evento dama que será igual a n(A) = 4/52.
Seja B para o evento rei que será igual a n(B) = 4/52.
Os eventos A e B são mutuamente exclusivos, pois a intersecção entre A e B é vazia.
(Prefeitura de Porto Alegre – Fundatec 2012). Uma questão de uma prova de Estatística apresenta grau médio de dificuldade. João tem 75% de chance de resolvê-la, e Daniel tem 60% de probabilidade de não a resolver. Se eles tentam resolver a questão de modo independente, qual será a probabilidade de que a questão seja resolvida?
A) 22,5%
B) 55,0%
C) 70,0%
D) 75,5%
E) 85,0%
Solução
Pelo enunciado temos: P(A) = 75% João conseguir resolver a questão.
P(B) = 40% Daniel conseguir resolver a questão.
P(AØB) = 75% x 40% = 30% (Veja na aula 4 da unidade 2: eventos independentes).
Utilizando a fórmula da probabilidade da união de dois eventos:
P(A ∪ B) = P(A) + P(B) – P (A Ø B )
P(A ∪ B) = 75% + 40% – 30%
P(A ∪ B) = 85%
Feedback: Letra E.
Probabilidade Condicional 
É a probabilidade de ocorrer um evento, considerando um outro evento ocorrido.
A probabilidade condicional de o evento B ocorrer, dado que o evento A já ocorreu, é indicada pela fórmula.
P (B|A) (lê-se “probabilidade de B, dado A”).
P (B|A) =
Exemplo 1
Duas cartas são selecionadas em sequência em um baralho comum de 52 cartas. Qual a probabilidade de a segunda carta ser uma dama, sendo que a primeira carta foi um rei, considerando que não há reposição de cartas.
Solução
 
Como a primeira carta foi um rei e não houve reposição, o baralho ficou com 51 cartas, sendo 4 damas. Assim, temos:
Exemplo 2
Retirando-se uma carta de um baralho comum de 52 cartas, qual a probabilidade de obter-se um rei, sabendo-se que a carta é de ouros?
Solução
Eventos Independentes
Dois eventos A e B, são independentes se a ocorrência de um deles não afeta a probabilidade de ocorrência do outro.
P(B|A) = P(B) ou P(A|B) = P(A)
Os eventos que não são independentes, são considerados dependentes.
Exemplo 1
Sejam os eventos:
A - Lançamento de uma moeda, obter uma cara.
B – Lançamento de um dado de seis faces e obter face 5.
Esses eventos A e B, são independentes?
Solução
A ocorrência de A não modifica a probabilidade da ocorrência de B, portanto são independentes.
Exemplo 2
Sejam os eventos:
A: Praticar natação.
B: Tornar-se um campeão de natação.
Esses eventos são independentes?
Solução
Se a pessoa treinar natação, suas chances de se tornar um campeão de natação aumentam, portanto, esses eventos são dependentes.
Regra da Multiplicação
Para obter a probabilidade de dois eventos ocorrerem em sequência, utilizamos a regra da multiplicação.
P(A e B) = P(A). P(B|A)
Se os eventos forem independentes a regra é simplificada.
P(A e B) = P(A). P(B)
Exemplo:
Lançando uma moeda e um dado, qual a probabilidade de sair coroa e em seguida um 4?
Solução
Os eventos são independentes, então
Contextualização
(UFF–RJ) Em um jogo de bingo são sorteadas, sem reposição, bolas numeradas de 1 a 75, e um participante concorre com a cartela reproduzida abaixo. Qual é a probabilidade de que os três primeiros números sorteados estejam nessa cartela?
Observe que a cartela contém 24 números entre um total de 75 que serão sorteados. A chance dos três primeiros números dessa cartela serem sorteados nas três primeiras rodadas respeita a seguinte ordem:
1º sorteio – 24/75.
2º sorteio - 23/74.
3º sorteio – 22/73.
Calculamos a chance realizando o produto entre os eventos:
A chance dos três primeiros números sorteados serem da cartela é de 3%.
Cálculo de Probabilidade 
Fundamentação Teórica
Variável Aleatória
Uma variável aleatória pode ser entendida como uma variável quantitativa, cujo resultado depende de fatores aleatórios.
 
Conceito de variável aleatória
Considere um experimento E e seu espaço amostral S = {a1, a2, a3, ..., an }
Qualquer função x que transforma os valores a1, a2, ..., an em números reais é chamada variável aleatória discreta.
Exemplo 1
No lançamento de uma moeda, a variável aleatória x anota o número de caras obtidas neste lançamento.
A variável aleatória x transformou o espaço amostral {c, k} no espaço amostral {o, 1}, constituído por números reais.
Exemplo 2
No lançamento de um dado e a observação da face superior, a variável aleatória x será:
Função Probabilidade
Seja X uma variável aleatória. A cada possível resultado xi, associa-se um número f(xi) = p(xi) = P(X =xi), denominada função de probabilidade de xi. A distribuição f satisfaz as condições:
A distribuição de probabilidades da variável aleatória X é o conjunto formado pelos pares [ xi , P(xi)]
Exemplo 1
No lançamento de uma moeda, a variável aleatória x anota o número de caras obtidas neste lançamento. Determine a função de probabilidade associada à variável aleatória x.
Exemplo 2
No lançamento de dois dados, a variável aleatória x anota a soma dos pontos. Determine a função de probabilidade associada à variável aleatória x.
Valor Esperado
Um valor esperado é uma média dos possíveis resultados de acordo com sua probabilidade de ocorrência:
Exemplo
A tabela a seguir apresenta o tempo gasto para concluir exercícios do capítulo de um texto de Estatística. Encontre o tempo esperado que alguém levaria para concluir esses exercícios. (Texto: Smailes, McGrane.2006).
Solução:
Seja x = número de minutos.
P(x) = probabilidade de passar x minutos no exercício.
∑xPx= 1,25 + 1,5 + 7 + 6 + 13,5 + 7,5 + 5,5 = 42,25
Portanto, o tempo de conclusão esperado para os exercícios é de 42,25 minutos.
Contextualização
Uma empresa precisa escolher entre dois produtos alternativos: estima-se que o produto A tenha uma probabilidadede sucesso de 0,45, enquanto se imagina que o produto B tenha uma probabilidade de sucesso de 0,6. Se o produto A fizer sucesso, ele produzirá um lucro de R$ 9.000,00. Se for um fracasso, terá uma perda de R$ 2.100,00. O produto B produzirá lucros de R$ 7.500,00 se fizer sucesso e perdas de R$ 1.500,00, caso contrário. Calculando o valor esperado de cada produto, sugira que produto a empresa deve lançar.
(Texto: Smailes e McGrane, p.152,2006)
Solução:
E (produto A) = 0,45 * 9.000 + (1 – 0,45) * (-2.100) = R$ 2.895,00.
E (produto B) = 0.6 * 7.500 + (1 – 0,6) * (-1.500) = R$ 3.900,00.
Conclusão:
Então o produto B seria preferível ao produto A, pois possui valor esperado mais alto.
Teste de Hipótese
É um procedimento que usa estatística amostral para testar uma alegação sobre o valor de um parâmetro populacional. Auxiliam na tomada de decisões em quase todas as áreas, como por exemplo, na política, na medicina entre outras. O teste de hipótese consiste em verificar se a afirmação é verdadeira ou falsa.
Como estabelecer uma hipótese
Para testar uma hipótese estatística, você deve estabelecer um par de hipóteses, em que uma será chamada de alegação e a outra, seu complemento. Dessas duas hipóteses, aquela que contém uma afirmativa de igualdade é chamada de hipótese nula. O complemento de uma hipótese nula é a hipótese alternativa.
Definição
Hipótese nula (Ho) contém afirmação de igualdade, como ,
Hipótese alternativa (Ha) contém afirmação de desigualdade, como >, , <. É o complemento da hipótese nula.
Ho lê-se H zero ou hipótese nula.
Ha lê-se H a ou hipótese alternativa
Observação:
Quando a hipótese nula é verdadeira, a hipótese alternativa é falsa.
Quando a hipótese nula é falsa, a hipótese alternativa é verdadeira.
Segue uma tabela que ajudará você a identificar as afirmações.
 
Como identificar uma hipótese nula e alternativa
Para identificar uma hipótese, devemos transformar a formulação verbal da alegação em uma formulação matemática e em seguida, escrever seu complemento.
Exemplo:
Estabeleça a alegação, escreva a sentença matemática e identifique as hipóteses nula e alternativa, em cada caso a seguir:
a) Uma empresa de refrigerantes alega que seu faturamento é de 45% ao mês.
Solução:
Alegação: Faturamento é de 45% ao mês.
Em sentença matemática: x = 45%
Como a afirmação é de igualdade, ela é hipótese nula (Ho)
O seu complemento será: x ≠ 45%, a hipótese alternativa (Ha)
Então, simplificando:
b) Um fabricante de lâmpadas alega que a vida média de seu produto é de maior ou igual a 200 horas.
Solução:
c) Uma revista eletrônica alega que as assinaturas são maiores que 49%.
Solução:
Tipos de Erro
Ao testar uma hipótese estatística, encontramos dois tipos possíveis de erro. Pode-se rejeitar uma hipótese quando ela é verdadeira ou aceitar uma hipótese quando ela é falsa. Quando rejeitamos uma hipótese verdadeira, temos o erro tipo I e a aceitação de uma hipótese falsa, temos o erro tipo II.
Resumindo:
Definição
Erro tipo I ocorre se a hipótese nula for rejeitada quando ela for verdadeira.
Erro tipo II ocorre se a hipótese nula não for rejeitada quando ela for falsa.
Teste de Significância
Definição
Em um teste de hipótese, o nível de significância é a probabilidade máxima permitida de ocorrer um erro do tipo I. Ele é indicado pela letra grega alfa, α. A probabilidade de um erro tipo II é indicada pela letra grega beta, β.
Os três níveis de significância mais usados são:
α = 0,10
α = 0,05
α = 0,01
Tipos de Testes de Hipótese
A natureza de um teste de hipótese depende do fato de o teste ser:
1. Monocaudal esquerdo: se a hipótese alternativa tiver o símbolo de menor que (<). 2. Monocaudal direito: a hipótese alternativa contém o símbolo de maior que (>). 3. Bicaudal: se a hipótese alternativa, tiver o símbolo de diferente (≠).
 
Valor P (Valor da Probabilidade)
Supondo que a hipótese nula seja verdadeira, um valor P (valor da probabilidade) de um teste de hipótese é a probabilidade de obter uma estatística amostral com valor mais extremo do que aquele determinado a partir dos dados da amostra.
Exemplo 1
A estatística teste para um teste Monocaudal direito é z = 1,56. Determinar o valor P.
 
Conforme vimos na aula 2 da unidade 3 e utilizando a tabela normal, a área à direita de z = 1,56 é 1 – 0,9406 = 0,0594.
Logo o valor de P é 0,0594 ou 5,94%.
Exemplo 2
A estatística teste para um teste bicaudal é z = -2,63. Determine o valor de P.
 
Conforme vimos na aula 2 da unidade 3 e utilizando a tabela normal, a área bicaudal é z = -2,63.
A área à esquerda de z = -2,63 é 0,0043.
O valor de P é 2 vezes 0,0043. Então P é igual a 0,0086 ou 0,86%.
Tomando decisão usando o valor de P
Para tomar uma decisão, em relação a um teste de hipótese, há somente dois resultados possíveis para o teste de hipótese:
a. Rejeitar a hipótese nula
b. Não conseguir rejeitar a hipótese nula.
Comparando o valor de P com α, temos:
Então:
Observação:
O fato de não rejeitar a hipótese nula, deve-se ao fato, muitas vezes, de não ter evidência suficiente para rejeitar a hipótese nula.
Exemplo 1
O valor P de um teste de hipótese é 0,0649. Tome sua decisão a um nível de significância de 0,05.
Solução:
Exemplo 2
Seja P = 0,0212 e α = 0,05. Tome sua decisão.
Solução:
Igualando as casa decimais e comparando P e α, temos que 0,0212 ≤ 0,0500Como P≤ α,então a decisão será rejeitar a hipótese nula.
O limite do Departamento de Agricultura dos Estados Unidos para a contaminação por salmonella em frangos é de 20%. Uma granja alega que seus frangos estão dentro do limite. Você realiza um teste de hipótese para determinar se a alegação da granja é verdadeira. Quando ocorrerão os erros dos tipos I e II? Qual deles é o mais grave?
(Fonte: United States Departament of Agriculture) (Texto: Larson/Farber. 2015).
Solução
Vamos considerar p a proporção de frangos contaminados.
A granja alega que a proporção dos contaminados é menor ou igual a 20%.
As duas hipóteses podem ser apresentadas da seguinte forma.
Erro tipo I: se a proporção real dos frangos contaminados for menor ou igual a 20% e você decide rejeitar a Hipótese Nula.
Erro tipo II: se a proporção real dos frangos contaminados for maior do que 20% e você decide não rejeitar a Hipótese Nula.
Qual deles é o mais grave?
Com o erro do tipo I, pode se criar o medo de contaminação e diminuir as vendas dos frangos, embora estejam dentro do limite permitido pelo Departamento de Agricultura.
Com o erro do tipo II, pode se permitir que frangos que excederam os limites de contaminação, segundo o Departamento de Agricultura, sejam vendidos aos consumidores.
Portanto, o erro do tipo II é o mais grave, pois pode resultar em doença e até em morte.

Continue navegando