Aula 08 - Analise de Dados

ESTÁCIO

Adriano Freitas

em 28/06/2025

Conteúdos escolhidos para você

30 pág.

Atividades Bioestatisticas

FAEL

42 pág.

CW 4 - Estatística Inferencial

139 pág.

Distribuição Amostral e Teorema Central do Limite

UNIP

81 pág.

Livro Texto Unidade II

UNIP

48 pág.

Livro-Texto Unidade II

UNIP

Perguntas dessa disciplina

A estatística não paramétrica, frequentemente chamada de “estatística livre de distribuição”, é essencial na agronomia para lidar com variáveis qualit

UNIASSELVI

47:33 Progresso:4/5 60 minutos QUESTIONÁRIO 03 – ESTATÍSTICA APLICADA A EDUCAÇÃO. 1 Sobre o uso da estatística, é INCORRETO afirmar que: As pesquisas

Em um experimento para avaliar a eficiência de três biofertilizantes (F1, F2 e F3) na produtividade de alface, os pesquisadores verificaram que os dad

UNIASSELVI

Em uma fábrica de embalagens, o gerente de qualidade deseja verificar se diferentes espessuras de plástico influenciam a resistência final do produ...

Anhanguera

Os testes de hipóteses são estratégias fundamentais nas tomadas de decisões no contexto da estatística. Entre eles, podemos destacar o teste de t S...

Material

Conteúdos escolhidos para você

30 pág.

Atividades Bioestatisticas

FAEL

42 pág.

CW 4 - Estatística Inferencial

139 pág.

Distribuição Amostral e Teorema Central do Limite

UNIP

81 pág.

Livro Texto Unidade II

UNIP

48 pág.

Livro-Texto Unidade II

UNIP

Perguntas dessa disciplina

A estatística não paramétrica, frequentemente chamada de “estatística livre de distribuição”, é essencial na agronomia para lidar com variáveis qualit

UNIASSELVI

47:33 Progresso:4/5 60 minutos QUESTIONÁRIO 03 – ESTATÍSTICA APLICADA A EDUCAÇÃO. 1 Sobre o uso da estatística, é INCORRETO afirmar que: As pesquisas

Em um experimento para avaliar a eficiência de três biofertilizantes (F1, F2 e F3) na produtividade de alface, os pesquisadores verificaram que os dad

UNIASSELVI

Em uma fábrica de embalagens, o gerente de qualidade deseja verificar se diferentes espessuras de plástico influenciam a resistência final do produ...

Anhanguera

Os testes de hipóteses são estratégias fundamentais nas tomadas de decisões no contexto da estatística. Entre eles, podemos destacar o teste de t S...

Prévia do material em texto

Disciplina: Análise de dados
Aula 8: Testes de Hipóteses e Análise de Variância
User
Destacar
Apresentação
Na Aula 6, vimos alguns fundamentos referentes aos testes de hipóteses. Agora, você verá como realizá-los a partir de
informações obtidas por meio de uma ou mais amostras.
Abordaremos a identi�cação das hipóteses nula e alternativa; especi�cação do nível de con�ança; determinação da
estatística de teste e conclusão do teste. Realizaremos um teste de hipótese para a média populacional com desvio-padrão
conhecido e outro com variância desconhecida.
E, também, descreveremos como realizamos testes para testar a igualdade de três ou mais médias populacionais por meio
da ANOVA (Análise de Variância) de um fator.
Objetivos
Aplicar testes de hipótese para a média com uma amostra.
Utilizar a tabela ANOVA (Análise de Variância) para testar a igualdade de três (ou mais) médias populacionais.
User
Destacar
User
Destacar
User
Destacar
Testes de hipóteses
Na Aula 6, já falamos um pouco sobre testes de hipóteses apresentando alguns fundamentos que nos permitem compreender
para que servem e para qual tipo de situação podem ser utilizados.
As de�nições de hipótese e de teste de hipóteses foram apresentadas da seguinte forma:
Em Estatística, uma hipótese é uma a�rmação sobre um ou mais parâmetros populacionais
de uma distribuição de probabilidades de uma variável aleatória X.
Um teste de hipóteses é de�nido como o procedimento ou a regra de decisão que nos
possibilita escolher pela aceitação ou rejeição de uma hipótese, com base em informações
contidas em uma amostra.
O que apresentamos foi apenas uma prévia do que iremos fazer nesta aula. Há testes de hipóteses para diversas situações.
Alguns são realizados com apenas uma amostra, outros se utilizam de duas ou mais amostras. Uns testam hipóteses que
envolvem médias, outros miram proporções, desvios ou outros parâmetros populacionais.
Para cada tipo de teste há um procedimento diferente, mas os fundamentos são muito semelhantes. A compreensão de um tipo
de teste certamente lhe permitirá entender outros que são aplicados em situações distintas.
Não há como abordar, aqui, todos os tipos de testes existentes, mas iremos apresentar três tipos diferentes que se baseiam em
obter conclusões acerca da média de uma população ou das médias de duas ou mais populações.
Antes de apresentar de forma detalhada os testes desta aula,
vamos relembrar alguns pontos importantes para a realização
deles?
Lembre-se que, primeiro, precisamos de�nir as hipóteses que serão testadas: hipótese nula (H0) e hipótese alternativa (H1).
Vamos retomar um exemplo apresentado na Aula 6.

Fonte: Wokandapix /
Pixabay.
https://pixabay.com/pt/users/wokandapix-614097/?utm_source=link-attribution&utm_medium=referral&utm_campaign=image&utm_content=3075420
User
Destacar
User
Destacar
User
Destacar
User
Destacar
User
Destacar
User
Destacar
User
Destacar
User
Destacar
User
Destacar
User
Destacar
Exemplo 1
O supervisor de Qualidade de uma indústria metalúrgica deseja avaliar se o lote de parafusos recebidos de determinado
fornecedor tem realmente a resistência especi�cada, que é de 72kgf (valor nominal especi�cado pelo fabricante), em média. Para
isso, selecionou uma amostra de 25 desses parafusos e testou-os, chegando a uma média de resistência de 69kgf.
Será que o resultado obtido é su�ciente para contestar a informação do fornecedor? Ou a diferença entre a média da amostra
(69kgf) e o valor especi�cado (72kgf) é devido à variação amostral?
As hipóteses que de�nimos, nesse caso, foram:
H0 : μ = 72kgf ou H1 : μ ≠ 72kgf
É comum de�nirmos hipótese nula por meio de uma igualdade que envolve o parâmetro testado. E a hipótese alternativa é
aquela que consideramos no caso de rejeição da primeira. O termo nula é usado para indicar que não ocorre nenhuma mudança
ou nenhum efeito.
Da forma como de�nimos a hipótese alternativa, o teste é considerado bilateral. Mas, hipótese alternativa também poderia ser
de�nida como:
H1 : μ > 72kgf ou H1 : μ Z α
2
. Portanto, essas duas desigualdades
de�nem o que chamamos de regiões de rejeição de H0, conforme mostradona Figura 1. Já o intervalo:
-Z α
2
 / Unsplash.
Exemplo 2
Um engenheiro deseja testar se o ponto de uma liga é de 900°C. Para isso, observou uma amostra de 36 unidades desse tipo de
liga, chegando a uma média de 895°C. Sabe-se que o desvio-padrão desse tipo de processo é de 12°C. Considerando um nível de
signi�cância α = 0, 05, a qual conclusão chegou o engenheiro?
Os valores dados são:
μ0 = 900°Cn = 36X̄ = 895°Cσ = 12°C
As hipóteses que podemos considerar, nesse caso, são:
https://unsplash.com/photos/9Q_pLLP_jmA?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText
User
Destacar
User
Destacar
User
Destacar
User
Destacar
H0 : μ = 900°CH1 : μ ≠ 900°C
Por tratar-se de um teste bilateral, os pontos críticos -Z α
2
 e Z α
2
 serão dados, respectivamente, por:
-Z α
2
= - Z 0 , 05
2
= - Z0 , 025 = - 1, 96
Z α
2
= Z 0 , 05
2
= Z0 , 025 = 1, 96
Os pontos críticos acima são valores da distribuição normal padrão, que está representada na Tabela 2. Consideraremos,
portanto, como região de aceitação o intervalo de –1,96 a 1,96.
A estatística de teste será dada por:
Z0 =
X̄ - μ0
σ
√n
=
395 °C - 900 °C
12 °C
√36
=
- 5 °C
2 °C = - 2, 5
Como:
Z0 900°C
O teste seria classi�cado como unilateral à direita. Nesse caso, a região de rejeição é de�nida pelo intervalo:
Z0 > Zα
As Figuras 2 e 3 mostram as regiões de aceitação e rejeição de testes unilaterais, respectivamente, à esquerda e à direita.
 Figura 2: Regiões de aceitação e rejeição de 
H
0
 para um teste unilateral à esquerda para média populacional com
desvio-padrão conhecido.
 Figura 3: Regiões de aceitação e rejeição de 
H
0
 para um teste unilateral à direita para média populacional com desvio-
padrão conhecido.
Testes de hipóteses para a média populacional com desvio-
padrão conhecido
Na seção anterior, consideramos que o desvio-padrão populacional σ é conhecido. No entanto, na prática, quando realizamos um
teste de hipóteses, esse parâmetro raramente é conhecido. Nesses casos, devemos substitui-lo pelo desvio-padrão amostral s.
Mas não é só isso, pois é preciso veri�car a distribuição da estatística de teste e o tamanho da amostra.
Para grandes amostras (n > 30), a estatística de teste passará a ser dada por:
Z0 =
X̄ - μ0
s
√n
Sua distribuição pode ser considerada uma normal padrão, isto é, N(0, 1). Portanto, praticamente não haverá alteração na
User
Destacar
User
Destacar
User
Destacar
User
Destacar
realização do teste, a não ser pela substituição de σ por s. Veja no exemplo a seguir.
 Fonte: Alexandre Debiève / Unsplash.
Exemplo 3
Para testar se a duração média de certo componente eletrônico é superior a 1.000 horas, o supervisor de Qualidade de uma
empresa observou uma amostra de 100 desses componentes e chegou a uma média de 1.005 horas com desvio-padrão de 40
horas. Ao nível de 0,05 de signi�cância, qual foi a conclusão do supervisor?
O desvio-padrão populacional σ é desconhecido, mas o tamanho da amostra maior que 30. Então, podemos realizar o teste de
forma semelhante ao que foi apresentado na seção anterior.
Os valores dados são:
μ0 = 1. 000hn = 100X̄ = 1. 005hs = 4
As hipóteses que podemos considerar, nesse caso, são:H0 : μ = 1. 000hH1 : μ > 1. 000h
Por tratar-se de um teste unilateral, o ponto crítico Zα será dado por:
Zα = Z0 , 05 = 1, 645
O ponto crítico acima é a média entre os valores Z = 1, 64 e Z = 1, 65 associados, respetivamente, aos valores de probabilidade
0,4495 e 0,4505, na Tabela 2.
A estatística de teste será dada por:
https://unsplash.com/photos/FO7JIlwjOtU?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText
Z0 =
X̄ - μ0
s
√n
=
1 . 005h - 1 . 000h
40h
√100
=
5h
4 = 1, 25
Como:
Z0 / Unsplash.
Exemplo 4
O setor de produção de uma empresa estima que a perda média de certo insumo seja de 26kg por cada tonelada processada.
Para testar essa informação, uma amostra de tamanho 25 foi observada e chegou-se a uma média de 27,8kg/ton com desvio-
padrão de 4,5kg/ton.
Considerando um nível de signi�cância de 10%, pode-se concluir que a a�rmação do setor de produção esteja correta?
Os valores dados são:
μ0 = 26
Kg
ton n = 25X̄ = 27, 8
Kg
ton s = 4, 5
As hipóteses que podemos considerar, nesse caso, são:
H0 : μ = 26
Kg
tonH1 : μ = 26
Kg
ton
Trata-se, portanto, de um teste bilateral.
Como o desvio-padrão populacional σ é desconhecido e a amostra é pequena (n ≤ 30), então a estatística de teste será dada por:
https://unsplash.com/photos/xD5SWy7hMbw?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText
T0 =
X - μ0
s
√n
=
27 , 8 - 26
4 , 5
√25
=
1 , 8
0 , 9 = 2
E seu valor crítico para α = 0, 10 será:
t α
2 ; n - 1 = t 0 , 10
2 ; 25 - 1 = t0 , 05 ; 24 = 1, 711
Como T0 está na região de rejeição de H0, pois T0 > 1, 711, então concluímos que a perda média desse insumo é diferente da
alegada pelo setor de produção.
Caso estivéssemos interessados em veri�car se a perda média do insumo é superior ao valor alegado (26 kg/ton), então teríamos
as seguintes hipóteses:
H0 : μ = 26
Kg
tonH1 : μ > 26
Kg
ton
E o teste seria considerado unilateral. Nesse caso, o valor crítico seria dado por:
tα ; n - 1 = t0 , 10 ; 25 - 1 = t0 , 10 ; 24 = 1, 318
E continuaríamos a rejeitar a hipótese nula H0.
Na seção a seguir, veremos um método que nos permite testar a igualdade entre médias de três ou mais populações.
Testes de hipóteses para a média populacional com três ou mais
amostras: ANOVA
Um teste bastante utilizado para comparar médias de diferentes populações é conhecido por Análise de Variância. Por meio dele
conseguimos determinar se há ou não diferença entre os valores de tais médias (relativas a um mesmo fator). Para uma melhor
ideia do cenário em que esse teste é aplicado, considere a situação apresentada no exemplo a seguir.
User
Destacar
User
Destacar
User
Destacar

Fonte: Andreas160578 / Pixabay.
Exemplo 5
Três marcas de gasolina aditivada, A, B e C, estão sendo testadas quanto aos seus rendimentos médios. Para cada uma delas, foi
coletada uma amostra de 8 elementos, obtidos sob as mesmas condições.
Rendimentos (em km/litro)
Observação Gasolina A Gasolina B Gasolina C
1 9,7 9,4 9,6
2 9,5 9,3 9,4
3 9,9 9,5 9,9
4 9,6 9,7 9,8
5 9,5 9,1 9,7
6 9,8 9,8 9,4
7 9,9 9,4 9,5
8 9,7 9,5 9,4
Médias 9,70 9,46 9,59
Variâncias 0,03 0,05 0,04
O que se pretende, nesse tipo de teste, é determinar se as variações ocorridas nas amostras são reais (causadas por diferenças
signi�cativas nas populações observadas) ou aleatórias (decorrentes apenas da variabilidade amostral).
Considera-se que se as diferenças são pequenas, então são decorrentes de mera variação amostral. Mas, se por outro lado, tais
diferenças são grandes, então concluímos que as diferenças são geradas por causas reais, isto é, as amostras são provenientes
de populações cujas médias não são todas iguais.
Observe que esses são os mesmos fundamentos do teste que abordamos anteriormente.
Os pressupostos para aplicação da análise de variância são:
https://pixabay.com/pt/users/andreas160578-2383079/?utm_source=link-attribution&utm_medium=referral&utm_campaign=image&utm_content=2157211
As amostras devem ser aleatórias e independentes;
as populações devem ter distribuição normal com variâncias iguais.
No entanto, na prática, essas condições não necessitam ser satisfeitas de forma rigorosa. Os resultados são satisfatórios se a
distribuição não for acentuadamente assimétrica e se as variâncias forem próximas. Observe que os dados apresentados no
Exemplo 5 satisfazem tais condições.
As hipóteses, nesse caso, são:
H0: as médias populacionais são todas iguais (μ1 = μ2 = μ3)
H1: as médias populacionais não são todas iguais, isto é, há pelo menos uma diferente das demais.
Cada amostra representa uma população, que nesse caso, chamamos de tratamento.
A estatísticade teste utilizada na análise de variância é conhecida por estatística F e é dada por:
F =
variância entre amostras
variância dentro das amostras
A variância entre amostras mede as diferenças relacionadas ao tratamento a que cada amostra está submetida e é denotada por
MSB, média entre quadrados.
A variância dentro das amostras avalia as diferenças entre os valores de uma mesma amostra e é denotada por MSW, média dos
quadrados internos.
Portanto, podemos escrever:
F =
MSB
MSW
Se MSB e MSW forem próximos, isto é, se há pouca ou nenhuma diferença entre as médias, então a estatística de teste MSB será
próxima de 1. No entanto, se uma dessas médias for signi�cativamente diferente das demais, MSB será maior que MSW e MSB
será maior que 1.
À medida que o valor de MSB cresce, há mais chances de rejeitar H0. Para concluirmos pela aceitação ou rejeição dessa hipótese,
precisamos comparar o valor de MSB com o valor crítico Fc fornecido pela Tabela da Distribuição MSB. Se MSB for maior que o
valor crítico F0, então rejeitamos a hipótese nula H0.
Dica
Essa tabela, para um nível de signi�cância α = 0, 05, pode ser encontrada aqui
 .
Veremos adiante como realizar esse teste utilizando o Excel, o que torna desnecessário o uso da referida tabela.
O Excel dispõe de um recurso denominado ANOVA, a maneira mais comum que utilizamos para nos referir à análise de variância.
Normalmente, esse teste é realizado pela montagem de uma tabela que leva esse nome. Ele é uma abreviação da expressão, em
inglês, que designa esse teste: analysis of variance.
A tabela ANOVA tem a seguinte disposição:
https://edisciplinas.usp.br/pluginfile.php/3333945/mod_resource/content/1/Distribuicao%20F%205%25.pdf
Variação Soma dos quadrados Graus de liberdade Média dos quadrados F
Entre SSB g. l.N MSB =
SSB
g . l .N
MSB
MSW
Interna SSW g. l.D MSW =
SSW
g . l .D
Os termos apresentados na tabela ANOVA são:
SSB
É a soma dos quadrados
entre as amostras.
SSW
É a soma dos quadrados
internos das amostras.
g. l.N
São os graus de liberdade
dados por 𝑘−1, em que 𝑘 é o
número de amostras.
g. l.D
São os graus de liberdade
dados por 𝑁−1, em que 𝑁 é a
soma dos tamanhos das
amostras.
MSB
É a variância entre as
amostras.
MSW
É a variância interna das
amostras.
Para obter a tabela ANOVA, via Excel, é preciso, primeiro habilitar as “Ferramentas de Análise” no menu “Dados”. Para isso, clique
no menu “Opções”. A Figura 4 mostra a janela que se abrirá.
 Figura 4: Janela de opções para instalação de suplementos do Excel.
Nela, selecione, à esquerda, a opção “Suplementos” e, em seguida, clique em “Ferramentas de Análise”. Dê “OK” e uma nova janela
se abrirá, como mostra a Figura 5. Nela, habilite a opção “Ferramentas de Análise” e clique em “Ir”. Pronto! A ferramenta que
precisamos já está instalada.
 Figura 5: Janela de opções para instalação de
suplementos do Excel.
Para certi�car-se, no menu, clique em “Dados” e veri�que se na barra de ferramentas aparece a opção “Análise de dados” (vide
Figura 6).
 Figura 6: Menu “Dados” com a opção “Análise de Dados”.
Voltando aos dados do Exemplo 5, vamos construir uma tabela ANOVA utilizando o Excel. Após digitar os valores referentes às
amostras de consumos dos três tipos de gasolina, em uma planilha do Excel, clique, no menu, em “Dados” e, em seguida, na
opção “Análise de Dados”.
Na janela que se abrirá, “Análise de dados”, selecione a primeira opção “ANOVA: fator único” e clique em “OK”. Na nova janela,
clique no campo “Intervalo de entrada” e selecione o intervalo no qual os valores estão digitados, como mostra a Figura 7.
 Figura 7: Ferramenta “ANOVA: fator único”.
Vamos considerar um nível de signi�cância α = 0, 05 para esse teste. Observe que você pode digitar o nível que desejar. Em
seguida, clique em “OK”. Uma nova planilha será criada com a tabela ANOVA, conforme mostrado na Figura 8.
 Figura 8: Resumo dos dados e Tabela ANOVA para os dados do Exemplo 5.
Pelos resultados apresentados, temos:
F = 3, 011111 e Fc = 3, 4668
Como F ;
Teste de hipóteses .
http://www.leg.ufpr.br/~paulojus/CE210/ce210/node3.html
http://www.ufscar.br/jcfogo/Estat_2/arquivos/Teste_Hipotese.pdf

Aula 08 - Analise de Dados

ESTÁCIO

Ferramentas de estudo

Conteúdos escolhidos para você

Atividades Bioestatisticas

CW 4 - Estatística Inferencial

Distribuição Amostral e Teorema Central do Limite

Livro Texto Unidade II

Livro-Texto Unidade II

Perguntas dessa disciplina

A estatística não paramétrica, frequentemente chamada de “estatística livre de distribuição”, é essencial na agronomia para lidar com variáveis qualit

47:33 Progresso:4/5 60 minutos QUESTIONÁRIO 03 – ESTATÍSTICA APLICADA A EDUCAÇÃO. 1 Sobre o uso da estatística, é INCORRETO afirmar que: As pesquisas

Em um experimento para avaliar a eficiência de três biofertilizantes (F1, F2 e F3) na produtividade de alface, os pesquisadores verificaram que os dad

Em uma fábrica de embalagens, o gerente de qualidade deseja verificar se diferentes espessuras de plástico influenciam a resistência final do produ...

Os testes de hipóteses são estratégias fundamentais nas tomadas de decisões no contexto da estatística. Entre eles, podemos destacar o teste de t S...

Conteúdos escolhidos para você

Atividades Bioestatisticas

CW 4 - Estatística Inferencial

Distribuição Amostral e Teorema Central do Limite

Livro Texto Unidade II

Livro-Texto Unidade II

Perguntas dessa disciplina

A estatística não paramétrica, frequentemente chamada de “estatística livre de distribuição”, é essencial na agronomia para lidar com variáveis qualit

47:33 Progresso:4/5 60 minutos QUESTIONÁRIO 03 – ESTATÍSTICA APLICADA A EDUCAÇÃO. 1 Sobre o uso da estatística, é INCORRETO afirmar que: As pesquisas

Em um experimento para avaliar a eficiência de três biofertilizantes (F1, F2 e F3) na produtividade de alface, os pesquisadores verificaram que os dad

Em uma fábrica de embalagens, o gerente de qualidade deseja verificar se diferentes espessuras de plástico influenciam a resistência final do produ...

Os testes de hipóteses são estratégias fundamentais nas tomadas de decisões no contexto da estatística. Entre eles, podemos destacar o teste de t S...

Mais conteúdos dessa disciplina