Logo Passei Direto
Buscar
Material
páginas com resultados encontrados.
páginas com resultados encontrados.

Prévia do material em texto

Imprimir
INTRODUÇÃO
Olá, estudante!
Os métodos grá�cos e os métodos tabulares são ferramentas de muita importância dentro da estatística, pois
analisam dados e mostram os resultados de forma mais acessível. Eles permitem representar informações,
muitas vezes complexas, de forma clara, precisa e intuitiva, auxiliando a compreensão das tendências, dos
padrões e das relações existentes entre as variáveis em questão.
Com o auxílio dos métodos grá�cos, podemos explorar dados e identi�car possíveis tendências de qualquer
tipo de variável que possa ser exposta nesse formato. Já os métodos tabulares nos trazem um resumo e uma
organização nos dados com os quais estamos trabalhando.
A compreensão dos métodos grá�cos, assim como dos métodos tabulares, é de grande importância para a
interpretação de dados e variáveis, e suas informações auxiliam a tomada de decisões.
Aula 1
ESTATÍSTICA DESCRITIVA
Com o auxílio dos métodos grá�cos, podemos explorar dados e identi�car possíveis tendências de
qualquer tipo de variável que possa ser exposta nesse formato. Já os métodos tabulares nos trazem um
resumo e uma organização nos dados com os quais estamos trabalhando.
20 minutos
ESTATÍSTICA APLICADA E PROBABILIDADE
 Aula 1 - Estatística descritiva
 Aula 2 - Distribuição amostral das médias e das proporções
 Aula 3 - Planejamento e análise de experimentos
 Aula 4 - Métodos de tomada de decisão
 Aula 5 - Revisão da unidade
 Referências
147 minutos
11/10/2024, 19:07 wlldd_232_u4_met_mat
https://www.avaeduc.com.br/mod/url/view.php?id=3340524 1/53
Bons estudos!
11/10/2024, 19:07 wlldd_232_u4_met_mat
https://www.avaeduc.com.br/mod/url/view.php?id=3340524 2/53
MÉTODOS GRÁFICOS E TABULARES
Na estatística, precisamos utilizar algumas técnicas e métodos para melhor compreender, analisar e
interpretar os dados de interesse. Alguns resultados numéricos são su�cientes, mas se analisados juntamente
com grá�cos e tabelas, nos levam a tomar melhores decisões, uma vez que, desta forma, temos uma visão
mais especí�ca e detalhada dos acontecimentos.
Os métodos grá�cos são técnicas usadas na estatística para representar de forma visual dados estatísticos.
Pode-se dizer que é a representação em forma de grá�cos de valores, números e outras referências da
informação. Eles utilizam grá�cos para exibir informações de maneira clara e intuitiva, auxiliando a
compreensão de certos padrões, tendências e relações de um conjunto de dados que está sendo analisado.
Os métodos grá�cos mais comuns podem ser obtidos por uma série de ferramentas, sendo que a mais
utilizada é o Excel. Com a inserção dos dados em planilha própria deste programa, podemos construir grá�cos
como: histograma, grá�co de barras, de colunas, de linha, entre vários outros, sempre dependendo do
objetivo pretendido ao expor aqueles dados. Os grá�cos são construídos, em geral, após a depuração e
organização dos dados.
A construção de cada tipo de grá�co segue uma sequência lógica, não podendo ser generalizada a construção
dos vários tipos existentes. Na sequência, veremos os tipos mais utilizados e como são construídos. Porém é
importante salientar que todos os grá�cos precisam ter:
Título: ele é usado para identi�car o grá�co e fornecer informações sobre o que está representando.
Eixos x e y: em alguns grá�cos, são usados para identi�car as variáveis dependentes e independentes.
Rótulos de eixo: identi�cam a grandeza que cada eixo representa.
Legenda: é usada para identi�car as diferentes séries de dados.
Em um grá�co, é importante apresentarmos a maior quantidade de informações possível, sem poluir a
imagem.
Figura 1 | Exemplos de grá�cos
11/10/2024, 19:07 wlldd_232_u4_met_mat
https://www.avaeduc.com.br/mod/url/view.php?id=3340524 3/53
Fonte: Pexels.
Os métodos tabulares, por sua vez, são técnicas da estatística utilizadas para representar dados em forma de
tabelas. É por meio delas que podemos resumir e organizar, de forma clara e com fácil compreensão, uma
série de dados, números, nomes e os mais diversos tipos de variáveis.
As tabelas podem resumir, de forma organizada, muitos dados que poderiam não ser bem compreendidos
caso não estivessem organizados. Existem vários tipos de tabelas e com intencionalidades diferentes. Porém,
é importante que todas elas tenham:
Título: é usado para identi�car a tabela e fornecer informações sobre o que ela está representando.
Linhas: separam a tabela, sendo verticais e horizontais.
Rótulos: são usados para identi�car as informações referentes às linhas e às colunas.
Totalizadores: usados para resumir os dados, podendo ser a soma deles.
Estes elementos são importantes para a clareza e interpretação correta de uma tabela. Além disso, é
importante que sejam formatados de maneira clara e legível, para que os dados possam ser lidos e
compreendidos facilmente.
Quadro 1 | Exemplo de tabela – Orçamento da Educação (MEC) em bilhões
Ano Orçamento inicial Contingenciamento Orçamento �nal
2014 124.698,60 7% 115.969,70
11/10/2024, 19:07 wlldd_232_u4_met_mat
https://www.avaeduc.com.br/mod/url/view.php?id=3340524 4/53
2015 139.747,10 8% 128.567,33
2016 137.863,00 4% 132.348,48
2017 144.307,50 4% 138.535,20
2018 143.656,70 2% 140.783,57
2019 149.735,90 3,9% 143.896,20
Fonte: adaptada pela autora a partir do Portal MEC.
11/10/2024, 19:07 wlldd_232_u4_met_mat
https://www.avaeduc.com.br/mod/url/view.php?id=3340524 5/53
TIPOS DE GRÁFICOS E DE TABELAS
Os grá�cos e as tabelas  trazem à análise de dados estatísticos uma melhor compreensão das informações.
Além disso, são formas claras e concisas de mostrar os resultados desejados. De uma forma didática, os
grá�cos e tabelas nos trazem uma compreensão visual das variáveis analisadas estatisticamente.
Existem várias formas de representar gra�camente um conjunto de dados estatísticos e cada um deles tem
um propósito e uma forma adequada para ser usado. Vejamos alguns dos tipos mais conhecidos e utilizados:
Grá�co de barras: podem ser barras horizontais ou verticais. Serve para comparar diferentes categorias
ou grupos.
Grá�co de linhas: é utilizado para demonstrar a ascensão ou o declínio de uma variável ao longo de um
determinado tempo.
Grá�co de dispersão: é utilizado para demonstrar a relação entre duas variáveis.
Histograma: é um grá�co de barras justapostas, ou seja, de barras grudadas umas às outras e serve para
representar uma distribuição de frequências em classes de dados quantitativos.
Box plot: além de representar os dados quantitativos, também é utilizado para representar a média, a
mediana e os quartis.
Grá�co setorial: também conhecido como grá�co de pizza, por se assemelhar ao formato uma. É utilizado
quando se deseja mostrar a proporção do grupo ou das classes em relação ao todo. Em geral, neste
grá�co, se usa a porcentagem.
Na Figura 2, você pode observar alguns dos grá�cos citados acima, como o grá�co setorial, de barras, de
linhas e algumas outras variações. É importante que você saiba que todos estes grá�cos podem ser
construídos por meio do Excel apenas com o fornecimento das informações na planilha de dados
quantitativos.
Figura 2 | Exemplos de grá�cos estatísticos
11/10/2024, 19:07 wlldd_232_u4_met_mat
https://www.avaeduc.com.br/mod/url/view.php?id=3340524 6/53
Fonte: Wikimedia Commons.
As tabelas, assim como os grá�cos, nos dão uma in�nidade de possibilidades quanto à compreensão dos
dados, pois, nelas, estes dados estão melhor estruturados e organizados, permitindo ao leitor uma melhor
análise e interpretação.
Assim como os grá�cos, as tabelas possuem vários tipos. As principais e mais utilizadas são:
Tabela de frequência: usada para mostrar o número de ocorrências de determinada variável.
Tabela 2 | Exemplo de tabela de frequência – Quantidade de alunos nos cursos de uma faculdade
Cursos Quantidade de alunos matriculados
Engenharias 586
Pedagogia 238
Direito 750
Administração 423
Ciências Contábeis 128
Psicologia 435
11/10/2024, 19:07 wlldd_232_u4_met_matque 86,21% das amostras apresentam resistência variando entre 73N/mm² e 95N/mm²; isso
nos indica uma grande concentração delas com pouca dispersão, uma vez que temos 1,62 desvios para um
lado e 1,37 desvios para outro. Esses valores mostram uma estabilidade. Agora podemos comparar, entre os
três tipos diferentes de materiais, se há diferença signi�cativa entre eles.
Para isso, façamos o cálculo da ANOVA:
z =   x−μ
σ
z =   73−84,9
7,36 =   − 1,62
z =   95−84,9
7,36 = 1,37
11/10/2024, 19:07 wlldd_232_u4_met_mat
https://www.avaeduc.com.br/mod/url/view.php?id=3340524 47/53
Construindo a tabela com a soma dos valores e com a soma de seus quadrados:
Quadro 1 | Tipos de Materiais
material 1 y² material 2 y² material 3 y²
70 4900 85 7225 90 8100
75 5625 81 6561 91 8281
80 6400 83 6889 93 8649
72 5184 87 7569 94 8836
78 6084 84 7056 92 8464
79 6241 82 6724 91 8281
81 6561 88 7744 89 7921
80 6400 93 8649 88 7744
76 5776 95 9025 93 8649
73 5329 89 7921 95 9025
total 764 58500 867 75363 916 50
Fonte: elaborada pela autora.
Realizando os cálculos:
H0: não há diferença entre os três tipos de materiais em relação a resistência à tração;
Ha: há diferença entre os três tipos de materiais em relação a resistência à tração.
C =   (764+867+916)²
30 = 216.240,3
SQT = (58500 + 75363 + 83950) − 216.240,3 = 1.572,7
SQTr =  [ (764)²
10 + (867)²
10 + (916)²
10 ] − 216.240,3 = 1.203,8
SQR  =  1. 527, 7 – 1. 203, 8  =  323, 9
QMTr =   1203,82 = 601,9
QMR = 323,9
27 = 12
F =   601,912 =  50,2
11/10/2024, 19:07 wlldd_232_u4_met_mat
https://www.avaeduc.com.br/mod/url/view.php?id=3340524 48/53
Assim resulta a tabela ANOVA:
Quadro 2 | Tabela ANOVA resultante
Fonte de variação
Soma dos
quadrados
Graus de liberdade médias Estatística F
Tratamentos 1203,8 2 601,9
50,2Resíduo 3239 27 12
Total 1527,7 29
Fonte: elaborada pela autora.
Consultando a tabela F para G.L 2 e 27 e signi�cância de 5%, temos que o valor crítico é de 19,46.
Figura 6 | Tabela F
Fonte: Costa (2011, p. 284).
Como a estatística F é maior que o valor crítico (50,2 > 19,46), rejeitamos a hipótese nula (H0). Assim,
concluímos que há diferenças entre as médias dos três tipos de materiais quanto a sua resistência à tração.
Uma vez que existe diferenças entre a resistência nos três tipos de materiais analisados, o ideal  seria
promover um teste de hipótese com o tipo de material e sua amostra que possui a maior média de resistência
entre as três para ter um processo resistente e con�ável.
Assim, ao realizar (em Excel) o cálculo da média dos três tipos de materiais, veri�camos aquele que possui a
média com menor desvio padrão. Usamos a amostra com menos variabilidade:
Quadro 3 | Média e desvio padrão dos materiais
material 1 material 2 material 3 Estatística F
11/10/2024, 19:07 wlldd_232_u4_met_mat
https://www.avaeduc.com.br/mod/url/view.php?id=3340524 49/53
Média 76,4 86,7 91,6
50,2desvio padrão 3,806427 4,643993 2,2211108
Total 1527,7 29
Fonte: elaborada pela autora.
Observe que o material 3 possui uma média de resistência maior e com uma variabilidade menor. Então este
material poderia ser considerado ideal. Para nos certi�carmos disto, vamos realizar um teste de hipóteses. No
caso, um teste t, pois a amostra total é 30. Para isso, devemos seguir os passos de um teste de hipóteses:
1º.  H0: a média da resistência é igual a 84,9 (encontrada no início do problema).
     Ha: a média da resistência é maior 84,9 (comparando com a nova média encontrada de 91,6).
2º.  O valor crítico na tabela z para 5% de signi�cância ou 95% de con�ança é +1,645, como já visto em
exercício anterior. 
3º. Construindo as regiões de aceitação e rejeição, temos:
1. H0: a média da resistência é igual a 84,9 (encontrada no início do problema).
Ha: a média da resistência é maior 84,9 (comparando com a nova média encontrada de 91,6).
2. O valor crítico na tabela z para 5% de signi�cância ou 95% de con�ança é +1,645, como já visto em
exercício anterior. 
3. Construindo as regiões de aceitação e rejeição, temos:
Figura 7 | Regiões de aceitação e rejeição
Fonte: elaborada pela autora.
4. Calcular o teste z:
5. Como 3,02 > 1,645, então veri�camos o teste z sobre a região de rejeição e concluímos que H0 é falsa.
z =   91,6−84,9
2,22 = 3,02
11/10/2024, 19:07 wlldd_232_u4_met_mat
https://www.avaeduc.com.br/mod/url/view.php?id=3340524 50/53
Neste sentido, podemos a�rmar que, se utilizarmos apenas o material 3, esse nos fornecerá uma maior
resistência à tração para a fabricação deste novo motor, descartando o uso dos outros dois tipos de materiais.
Todo este estudo nos mostra a aplicação dos 4 principais temas vistos até aqui, suas conexões e a importância
deles para a tomada de decisões.
Adicionalmente, conheça mais um contexto de aplicação para os conceitos abordados.
Em uma indústria de fabricação de peças de aço, a equipe de engenharia notou que a produtividade no
processo de fabricação de uma determinada peça estava abaixo do esperado e que a qualidade do produto
�nal não estava atendendo aos padrões de qualidade estabelecidos.
Com o objetivo de melhorar o processo de fabricação, a equipe decidiu aplicar ferramentas estatísticas, tais
como grá�cos, tabelas, distribuição normal, ANOVA e testes de hipóteses. Inicialmente, foi feita uma análise
exploratória dos dados coletados do processo de fabricação, utilizando grá�cos e tabelas para identi�car
possíveis pontos de melhoria. Foi constatado que a variabilidade nos dados era alta, o que sugeria que havia
algum fator que estava causando instabilidade no processo. Em seguida, a equipe decidiu aplicar a
distribuição normal para analisar a distribuição dos dados coletados.
Com base nos resultados obtidos, foi possível identi�car que a distribuição dos dados seguia a curva normal, o
que permitiu a aplicação da ANOVA para comparar os valores médios entre as diferentes etapas do processo
de fabricação. Os resultados da ANOVA mostraram que havia diferença signi�cativa entre as etapas do
processo de fabricação, sugerindo que a variação na qualidade do produto �nal poderia estar sendo causada
por diferenças no processo em cada etapa. Com base nessa informação, a equipe decidiu investigar mais a
fundo cada etapa do processo, a �m de identi�car possíveis causas da variabilidade.
Para isso, foram realizados testes de hipóteses para comparar as médias de cada etapa do processo com a
média geral do processo. Os testes de hipóteses mostraram que a média de uma das etapas do processo era
signi�cativamente diferente da média geral do processo, o que sugeriu que essa etapa poderia estar
causando a variabilidade observada nos dados.
A equipe decidiu realizar uma análise detalhada dessa etapa do processo, identi�cando que a temperatura de
um dos equipamentos estava oscilando muito. Isso estava afetando a qualidade do produto �nal. Foi realizada
uma calibração no equipamento e, após essa mudança, a variação nos dados foi reduzida e a qualidade do
produto �nal melhorou signi�cativamente. Por �m, a equipe de engenharia concluiu que a aplicação das
ferramentas estatísticas permitiu uma análise mais detalhada do processo de fabricação, identi�cando
possíveis pontos de melhoria e permitindo a tomada de decisão com base em evidências quantitativas!
Decisões importantes como esta, se tomadas de forma errada, podem comprometer muitos processos e
colocar, inclusive, vidas em riscos, como vimos no nosso estudo de caso.
RESUMO VISUAL
11/10/2024, 19:07 wlldd_232_u4_met_mat
https://www.avaeduc.com.br/mod/url/view.php?id=3340524 51/53
Fonte: elaborada pela autora.
Aula 1
BONAFINI, F. C. (org.). Probabilidade e estatística. São Paulo: Pearson Education do Brasil, 2015.
BUSSAB, W.; MORETTIN, P. Estatística Básica. São Paulo: Saraiva, 2002.
COSTA, G. G. de O. Curso de Estatística básica: teoria e prática. São Paulo: Atlas, 2011.
SPIEGEL, M. Estatística. São Paulo: Makron Books, 1993.
Aula 2
BONAFINI, F. C. (org.). Probabilidade e estatística. São Paulo: PearsonEducation do Brasil, 2015.
BUSSAB, W.; MORETTIN, P. Estatística Básica. São Paulo: Saraiva, 2002.
COSTA, G. G. de O. Curso de Estatística básica: teoria e prática. São Paulo: Atlas, 2011.
SPIEGEL, M. Estatística. São Paulo: Makron Books, 1993.
REFERÊNCIAS
2 minutos
11/10/2024, 19:07 wlldd_232_u4_met_mat
https://www.avaeduc.com.br/mod/url/view.php?id=3340524 52/53
Imagem de capa: Storyset e ShutterStock.
Aula 3
BONAFINI, F. C. (org.). Probabilidade e estatística. São Paulo: Pearson Education do Brasil, 2015.
BUSSAB, W.; MORETTIN, P. Estatística Básica. São Paulo: Saraiva, 2002.
COSTA, G. G. de O. Curso de Estatística básica: teoria e prática. São Paulo: Atlas, 2011.
SPIEGEL, M. Estatística. São Paulo: Makron Books, 1993.
Aula 4
BONAFINI, F. C. (org.). Probabilidade e estatística. São Paulo: Pearson Education do Brasil, 2015.
BUSSAB, W.; MORETTIN, P. Estatística Básica. São Paulo: Saraiva, 2002.
Aula 5
BONAFINI, F. C. (org.). Probabilidade e estatística. São Paulo: Pearson Education do Brasil, 2015.
BUSSAB, W.; MORETTIN, P. Estatística Básica. São Paulo: Saraiva, 2002.
COSTA, G. G. de O. Curso de Estatística básica: teoria e prática. São Paulo: Atlas, 2011.
DOWNING, D.; CLARK, J. Estatística Aplicada. 2ª ed. São Paulo: Saraiva, 2006.
SPIEGEL, M. Estatística. São Paulo: Makron Books, 1993. 
11/10/2024, 19:07 wlldd_232_u4_met_mat
https://www.avaeduc.com.br/mod/url/view.php?id=3340524 53/53
https://storyset.com/
https://www.shutterstock.com/pt/https://www.avaeduc.com.br/mod/url/view.php?id=3340524 7/53
Total 2.460
Fonte: elaborada pela autora.
Tabela de distribuição de frequência: usada para mostrar a contagem do número de frequências dos
itens estudados; também pode comportar as frequências acumulada crescente, acumulada decrescente
e a frequência relativa.
Tabela 3 | Exemplo tabela de distribuição de frequência – Medidas dos diâmetros (em cm) de uma peça da produção da indústria Y
CLASSES (cm) F
10 ├ 12 2
12 ├ 14 2
14 ├ 16   7
16 ├ 18 3
18 ├ 20 5
20 ├ 22 0
22 ├ 24 1
⅀ 20
Fonte: elaborada pela autora.
Tabela de contingência: usada para mostrar a relação existente entre duas ou mais variáveis.
Tabela 4 | Exemplo de tabela de contingência – Número de pessoas em situação laboral de acordo com sua escolaridade
Escolaridade
Situação no mercado
desempregado empregado
apenas
estudando
Ensino médio completo 125 250 56
Ensino superior 123 270 42
11/10/2024, 19:07 wlldd_232_u4_met_mat
https://www.avaeduc.com.br/mod/url/view.php?id=3340524 8/53
Pós-graduação 89 350 23
Fonte: elaborada pela autora.
Há ainda a tabela cruzada, que é uma variação da tabela de contingência. Nela, são apresentadas informações
sobre a distribuição de uma variável em relação à outra.
Estes tipos de tabelas não são únicos, mas são os mais utilizados e possuem maior relevância nos estudos
estatísticos. Cabe ressaltar que a escolha do tipo de tabela correta vai depender do tipo da variável a ser
analisada, além do objetivo do estudo. As tabelas, quando bem elaboradas, confeccionadas e escolhidas de
forma adequada, trazem uma grande riqueza de informações e auxiliam conclusões assertivas e tomada de
decisões de grande êxito.
Conhecer os principais tipos de tabelas e grá�cos é muito importante dentro da tomada de decisões. Dados
bem apresentados fornecem informações com mais clareza.
GRÁFICOS E TABELAS: O USO DO EXCEL
A ideia de construir grá�cos e tabelas para representar dados estatísticos é utilizar uma ferramenta a mais de
interpretação. É importante lembrar também que a escolha do grá�co e da tabela depende muito do objetivo
da pesquisa.
Podemos citar algumas aplicações em que mais se utilizam grá�cos e tabelas:
Na análise exploratória de dados, na qual os grá�cos e as tabelas são úteis para visualizar e explorar os
dados antes mesmo de serem feitas análises mais avançadas, propiciando ao pesquisador uma ideia
mais precisa dos resultados encontrados.
Na comunicação de resultados para um público não técnico; neste caso, os grá�cos e as tabelas são a
forma mais indicada.
Na modelagem de dados, os grá�cos e as tabelas possuem uma grande importância, pois fazem com que
os dados mostrem e apresentem uma certa tendência, de modo que podemos visualizar a relação entre
as variáveis, para então poder escolher o modelo estatístico que mais se adeque aos dados.
No estudo de tendências, os grá�cos e as tabelas podem mostrar o comportamento das variáveis que
estão sendo analisadas, pois provisionam valores futuros com base na análise dos dados daquilo que já
aconteceu.
Na comparação de grupos, os grá�cos e as tabelas mostram o comportamento de cada um deles e
comparam-nos ao mesmo tempo.
Na identi�cação de outliers, pois os grá�cos e tabelas podem auxiliar a identi�cação destes pontos fora
da curva ou fora do comportamento padronizado ou de tendência, fazendo com que se possa detectar
11/10/2024, 19:07 wlldd_232_u4_met_mat
https://www.avaeduc.com.br/mod/url/view.php?id=3340524 9/53
possíveis falhas ou erros dentro do processo.
É importante salientar que grá�cos e tabelas devem ser construídos com o auxílio de softwares especí�cos
para se obter os melhores e mais precisos resultados.
O software mais utilizado para construir grá�cos é o Excel, que possui diversas possibilidades. Seu uso é auto
sugestivo e possui ferramentas visuais e cálculos estatísticos disponíveis. Outros softwares como o libreO�ce
Calc e o editor de planilhas eletrônicas do Google também são excelentes ferramentas gratuitas, embora
pouco populares.
A interface do Excel parece uma grande tabela pronta para ser preenchida, com disposição de linhas e
colunas. Uma vez inseridos os dados para construir grá�cos, basta selecionar os dados e buscar o botão de
inserir grá�cos, escolher o que mais se adeque às suas necessidades e solicitar a construção. Após a escolha
do grá�co, é necessário dar um título a ele, construir as legendas e estabelecer os eixos, quando for o caso.
Contudo, por ser uma ferramenta, o trabalho manual de inserir as informações de forma correta ainda é
essencial para um bom resultado. Um exercício interessante é você, estudante, vivenciar essa criação de
grá�co pelo Excel. Monte uma tabela com os seguintes dados: gastos com alimentação, transporte e diversão
dos últimos 10 meses, coloque na planilha do Excel. Após preencher a planilha, selecione os dados e escolha a
opção inserir e escolha um grá�co que seja capaz de mostrar a comparação dos gatos com estes três itens.
Perceba que uma boa sugestão quanto ao formato do grá�co para isto é o de linhas, e que você pode usar
vários formatos dele. Veja no exemplo 1 como �caria:
Figura 3 | Simulação de tabela e grá�co dos gastos com alimentação, transporte e diversão, obtidos pelo Excel
Fonte: captura de tela do Microsoft Excel.
11/10/2024, 19:07 wlldd_232_u4_met_mat
https://www.avaeduc.com.br/mod/url/view.php?id=3340524 10/53
VIDEO RESUMO
Você verá, neste vídeo, como os grá�cos e tabelas auxiliam de forma clara e concisa a depuração e
interpretação de dados estatísticos. Uma boa análise estatística e a assertiva tomada de decisões depende de
escolher bem um grá�co e uma tabela para representar os dados. Grá�cos e tabelas são formas de expressar
dados quantitativos de maneira que possamos ter uma melhor compreensão do seu comportamento.
 Saiba mais
Você conhece o Tableau Public? Trata-se de um software especialista em análise de dados, com
possibilidade de criar grá�cos dinâmicos e estruturas nem sempre disponíveis no Excel. Con�ra-o e se
aprofunde neste vasto campo.
INTRODUÇÃO
Olá, estudante!
A distribuição amostral e a distribuição normal são conceitos fundamentais para a área da estatística. São elas
que permitem generalizar, para dados populacionais, valores e resultados obtidos de forma amostral. Estas
distribuições de probabilidade consideram todas as amostras possíveis de mesmo tamanho, tomadas sempre
de uma mesma população.
Com estas distribuições, podemos modelar muitos processos dentro da engenharia, por exemplo, além de
melhor compreendê-los. Dentro das consideradas distribuições de probabilidade contínuas, a distribuição
normal é a que merece o maior destaque. Sua importância está sobretudo por ter sua construção advinda de
um histograma.
Bons estudos!
Aula 2
DISTRIBUIÇÃO AMOSTRAL DAS MÉDIAS E DAS
PROPORÇÕES
A distribuição amostral e a distribuição normal permitem generalizar, para dados populacionais, valores
e resultados obtidos de forma amostral.
26 minutos
11/10/2024, 19:07 wlldd_232_u4_met_mat
https://www.avaeduc.com.br/mod/url/view.php?id=3340524 11/53
https://public.tableau.com/app/discover
DISTRIBUIÇÕES AMOSTRAIS E DISTRIBUIÇÃO NORMAL
As técnicas de contagem são métodos matemáticos usados para contar o número de maneiras que
determinados eventos podem ocorrer. Essas técnicas são usadas para resolver problemas envolvendo
combinações e arranjos de objetos, probabilidade, teoria da contagem e outros campos da matemática e da
estatística. Algumas das técnicas de contagem mais comuns incluem fórmulas de combinações, princípios de
inclusão-exclusão, métodos de recorrência e probabilidade de Markov. Essas técnicas são amplamente
utilizadas para resolver problemas envolvendo contagem e probabilidade na matemática, na estatística, na
computação, na engenharia, na biologia e em outras áreas.
A distribuição amostral é a distribuição dos valores de uma variável em uma amostra aleatória de dados. Em
outras palavras, a distribuiçãoamostral representa a frequência com que determinados valores aparecem na
amostra. Ela pode ser representada gra�camente por um histograma ou por uma função de densidade de
probabilidade.
É importante notar que a distribuição amostral é uma estimativa aproximada da distribuição verdadeira dos
dados na população, e que a forma da distribuição amostral pode variar de amostra a amostra. Esta deve ser,
obrigatoriamente, �el à população. Para representarem uma população, as amostras devem possuir as
mesmas características que ela.
A distribuição normal é uma das distribuições de probabilidade mais importantes e amplamente utilizadas na
estatística. Ela é uma distribuição contínua de probabilidade que é simétrica em relação a uma média,
denotada por μ, e com uma variância, denotada por σ² ou pelo desvio padrão, que é a raiz quadrada da
variância. Além disso, a distribuição normal é unimodal, seu prolongamento horizontal vai de - ∞ até + ∞,
sendo uma curva suave abaixo da qual se encontra uma probabilidade de ocorrência de evento de 100%.
A distribuição normal é descrita por uma função de densidade de probabilidade, que pode ser representada
por uma curva gaussiana ou curva de sino. A distribuição normal é importante porque muitos fenômenos
naturais e sociais apresentam distribuições que se aproximam da curva normal. Além disso, a distribuição
normal fornece uma base teórica para muitas técnicas estatísticas, como a inferência estatística e a
modelagem.
A grande maioria dos fenômenos, naturais ou não, podem ser representados por uma distribuição normal.
Sua base ocorre por uma distribuição de frequências em classes, com a construção de um histograma de
representação.
Pode-se notar que muitas variáveis contínuas tendem a ter, em geral, um comportamento dito “normalizado”,
justamente pelo seu comportamento unimodal, com média de referência, margem de erro e continuidade
como características. Neste caso, este tipo de variável gera indicadores que encaminham a tomada de
decisões.
Figura 1 | Exemplo de curva normal
11/10/2024, 19:07 wlldd_232_u4_met_mat
https://www.avaeduc.com.br/mod/url/view.php?id=3340524 12/53
Fonte: Wikimedia Commons.
Nota-se que a curva normal tem o formato de sino, é suave, e unimodal. Seus parâmetros são a média – valor
mais central – e o desvio padrão ou a variância. O centro, onde se encontram a média e a moda, é a parte
mais alta da curva e, neste mesmo ponto, há a divisão da curva em duas partes simétricas.
A CURVA NORMAL OU DE GAUSS
Para melhor exempli�car como os dados contínuos podem ser interpretados e, assim, nos levar à tomada de
decisões mais assertivas em relação ao comportamento destas variáveis, aprofundaremos o estudo da
distribuição normal, também conhecida como curva de Gauss.
A curva normal é chamada de “curva de Gauss” em homenagem ao matemático alemão Carl Friedrich Gauss
(1777-1855). Gauss é considerado um dos maiores matemáticos de todos os tempos e fez importantes
contribuições para a estatística, incluindo a teoria da distribuição normal.
Ele foi um dos primeiros a compreender a importância da distribuição normal na representação de dados e na
modelagem de fenômenos naturais e sociais com variáveis contínuas. Além disso, ele desenvolveu métodos
para calcular probabilidades na distribuição normal, o que é amplamente utilizado até os dias de hoje.
Gauss desenvolveu inúmeras formas de estabelecer a probabilidade de ocorrência de um certo evento com
base no comportamento de dados “normalizados”, ou seja, que podem ser representados por meio de uma
curva normal.
Uma das maneiras mais simples de obter esta probabilidade é pelo cálculo do escore reduzido (z). Este valor é
obtido pela fórmula representada na Figura 2. Depois, busca-se sua probabilidade correspondente na tabela,
criada por Gauss, chamada de tabela z – escore reduzido.
Figura 2 | Cálculo do escore reduzido
z = x−μ
σ
11/10/2024, 19:07 wlldd_232_u4_met_mat
https://www.avaeduc.com.br/mod/url/view.php?id=3340524 13/53
Fonte: elaborada pela autora.
As variáveis desta fórmula são:
z = escore reduzido, valor a ser buscado na tabela.
X = variável aleatória, valor cuja probabilidade até à média se deseja encontrar.
μ = média aritmética amostral.
σ = desvio padrão amostral.
O cálculo do escore reduzido pode ser feito também por meio do cálculo de uma integral.
A curva normal é classi�cada de acordo com duas características: a média (μ) e a desvio padrão (σ). A média
representa o valor central dos dados, enquanto o desvio padrão representa a dispersão dos dados em relação
à média.
A classi�cação da curva normal é baseada na comparação dessas duas medidas, ou seja, se a média é alta ou
baixa e se o desvio padrão é grande ou pequeno. Algumas das classi�cações mais comuns são:
Curva normal padrão: é aquela em que a média vale zero e o desvio padrão vale um.
Curva normal simétrica: é aquela que tem simetria em relação à média.
Curva normal assimétrica: é aquela em que um dos lados não tem simetria em relação ao outro.
Curva normal larga: é aquela em que, sendo a média a mesma, o desvio padrão é maior, havendo mais
dispersão.
Curva normal estreita: é aquela em que, sendo a média a mesma, o desvio padrão é menor, havendo
menos dispersão.
Também podemos estudar e classi�car a curva normal pela sua assimetria e pela sua curtose. Mas, o que são
assimetria e curtose?
Assimetria se refere à inclinação ou desequilíbrio de uma distribuição em relação à sua média. Uma
distribuição é considerada assimétrica positiva se a cauda da direita é mais longa do que a da esquerda, e
assimétrica negativa se a cauda da esquerda é mais longa do que a da direita.
Figura 3 | Assimetria da curva normal
11/10/2024, 19:07 wlldd_232_u4_met_mat
https://www.avaeduc.com.br/mod/url/view.php?id=3340524 14/53
Fonte: adaptada de Wikimedia Commons.
Curtose é a medida do achatamento de uma distribuição. Uma distribuição pode ser classi�cada pelo seu
achatamento em:
Mesocúrtica (quando o cálculo da curtose é igual a 0,263).
Platcicúrtica (quando o cálculo da curtose é maior que 0,263).
Leptocúrtica (quando o cálculo da curtose é menor que 0,263).
A curva normal tem uma assimetria próxima de zero e uma curtose próxima de três, o que signi�ca que é uma
distribuição simétrica e relativamente achatada. As medidas de assimetria e curtose são importantes porque
ajudam a descrever a forma da distribuição e a determinar se uma distribuição é anômala ou não.
Figura 4 | Curva normal classi�cada pela sua curtose
Fonte: Scribbr.
ESCORE REDUZIDO
11/10/2024, 19:07 wlldd_232_u4_met_mat
https://www.avaeduc.com.br/mod/url/view.php?id=3340524 15/53
Nos aprofundando um pouco mais no estudo da distribuição normal ou curva de Gauss, podemos, com seu
conceito, estabelecer e conhecer um pouco mais sobre a forma com que trabalhamos com esta curva.
A curva normal possui um formato particular, a partir de suas características, seus parâmetros e suas
respectivas probabilidades de ocorrência.
Figura 5 | Curva normal padronizada
Fonte: Wikimedia Commons.
Percebemos que, a partir do ponto mais central, onde se localizam a média e a moda, temos áreas simétricas.
Quando, a partir da média, temos um desvio padrão para a direita e um desvio padrão para a esquerda,
totalizamos uma probabilidade de ocorrência de evento de 68,26%. Já quando esta mesma situação ocorre
com dois desvios para cada lado, a possibilidade de ocorrência do evento é de 95,44%. E, com três desvios
padrão, as chances de ocorrência deste evento é de 99,74%. Observe que, quanto mais nos afastamos da
média, maior é a probabilidade de ocorrência do evento.
Mas como determinar estes percentuais?
Por meio da tabela z do escore reduzido, com sua fórmula própria, como visto anteriormente. Após realizar o
cálculo do escore reduzido, buscamos o valor na tabela z e determinamos, multiplicando por 100, o valor de
probabilidade que nela consta, obtendo, assim, o percentual.
Figura 6 | Tabela z: curva normal padronizada– unilateral
11/10/2024, 19:07 wlldd_232_u4_met_mat
https://www.avaeduc.com.br/mod/url/view.php?id=3340524 16/53
Fonte: Costa (2011, p. 271).
Note que, pela tabela, o valor na coluna da esquerda de 1,0 em encontro com o valor da linha superior no
valor 0, nos fornece uma probabilidade de ocorrência de evento de 0,3413. Multiplicado por 100, geram-se os
34,13%, um desvio de dispersão da média. Dispersando um desvio para a direita e um para a esquerda e
somando os dois valores, obtemos 6,26%, como observamos na Figura 5.
Vejamos uma situação em que utilizaremos a curva normal.
Imagine que uma empresa de produção de baterias quer determinar o tempo médio que uma de suas
baterias dura. Eles realizam um experimento aleatório com 1000 baterias e, para todas elas, medem o tempo
de vida de cada uma. Após realizar as medidas, constatam que a média de durabilidade de cada uma delas é
de 200 horas com uma margem de erro, neste caso, um desvio padrão de 50 horas.
11/10/2024, 19:07 wlldd_232_u4_met_mat
https://www.avaeduc.com.br/mod/url/view.php?id=3340524 17/53
Com base nestes dados, podemos construir uma curva normal para representar a distribuição de tempo de
vida das baterias. Sabemos que a média é 200 horas e o desvio padrão é 50 horas, então podemos usar essas
informações para encontrar a probabilidade de uma bateria durar menos de 150 horas. Para fazer isso,
podemos usar a fórmula da curva normal para calcular o valor z associado a 150 horas e, em seguida,
consultar uma tabela z para encontrar a probabilidade associada.
Aplicando a fórmula do escore reduzido, teremos:
Consultando a tabela z da curva normal, teremos o valor 0,3413 associado a este escore reduzido, que
multiplicado por 100, gera uma probabilidade de 34,13% de chance de ocorrer baterias durando entre 150 e
200 horas, mas como se deseja saber a probabilidade de baterias durarem menos de 150 horas, devemos
subtrair este resultado encontrado de 50%, o que nos fornece uma resposta �nal de 15,87%, que é a chance
de que uma bateria tenha menos que 150 horas de duração.
Mas por que devemos diminuir 50%?
Como os cálculos com a curva normal sempre nos fornecem o valor da média até um valor aleatório qualquer,
quando querermos menos que um valor que está à esquerda da média ou um valor superior a outro que
esteja à direita da média, devemos subtrair da metade da curva o valor encontrado, para então obter o
resultado que chamamos de valor de cauda.
Figura 7 | Cálculo tabela z
Fonte: elaborada pela autora.
VÍDEO RESUMO
Você verá, neste vídeo, a importância que as distribuições amostrais e de probabilidade exercem na
estatística. Sobretudo, a distribuição normal ou curva de Gauss. A distribuição amostral e a distribuição
normal são conceitos fundamentais para o entendimento da estatística e para a análise de dados em muitas
áreas, incluindo ciências sociais, biomedicina, engenharia, entre outras.
z = 150−200
50 = − 50
50 = −1
11/10/2024, 19:07 wlldd_232_u4_met_mat
https://www.avaeduc.com.br/mod/url/view.php?id=3340524 18/53
 Saiba mais
Você conhece o Minitab? Ele é um software de análise estatística completo que possui uma série de
ferramentas para trabalhar com curvas normais, incluindo grá�cos e cálculos de probabilidade. Con�ra
todas as possibilidades estatísticas deste software.
INTRODUÇÃO
Olá, estudante!
Um dos principais objetivos da estatística é trazer informações sobre processos, preferências e
comportamentos. Além disso, a estatística é responsável por fornecer muitos dados para um setor dentro da
área de produção, que é o da qualidade. Este setor, que teve seu auge nos anos de 1990, busca trazer
métodos e formas de mostrar como os processos e produções podem ser controlados pelos seus aspectos de
qualidade.
Das várias formas existentes dentro da estatística para realizar este controle, temos uma das mais
importantes, conhecidas como análise de variância ou, simplesmente, ANOVA. Veremos nesta aula, como a
ANOVA pode ser uma arma poderosa para certo tipo de controle dentro da área da qualidade.
Bons estudos!
ANÁLISE ESTATÍSTICA
Experimentos aleatorizados com um único fator são um tipo de experimento que busca avaliar o efeito de um
único fator sobre uma variável resposta. Nesse tipo de experimento, o pesquisador manipula um único fator,
enquanto mantém todos os outros constantes, e observa o efeito da variação dele na variável resposta.
O objetivo é determinar se existe uma relação causal entre o fator manipulado e a variável resposta, bem
como quanti�car a magnitude dessa relação. Esses experimentos são amplamente utilizados em diversas
áreas da ciência, como medicina, psicologia, biologia, agronomia, entre outras.
Aula 3
PLANEJAMENTO E ANÁLISE DE EXPERIMENTOS
A estatística é responsável por fornecer muitos dados para um setor dentro da área de produção, que é
o da qualidade. Este setor, que teve seu auge nos anos de 1990, busca trazer métodos e formas de
mostrar como os processos e produções podem ser controlados pelos seus aspectos de qualidade.
27 minutos
11/10/2024, 19:07 wlldd_232_u4_met_mat
https://www.avaeduc.com.br/mod/url/view.php?id=3340524 19/53
https://www.minitab.com/pt-br/products/minitab/free-trial/
Alguns exemplos de experimentos aleatorizados com um único fator são:
Um experimento para determinar a e�cácia de diferentes medicamentos para reduzir a pressão arterial
em pacientes com hipertensão. O fator em estudo é o tipo de medicamento, e os pacientes são
randomizados para receber um dos medicamentos em estudo ou um placebo.
Um experimento para determinar a e�cácia de diferentes fertilizantes na produção de uma determinada
cultura. O fator em estudo é o tipo de fertilizante, e as parcelas de terra são randomizadas para receber
um dos fertilizantes em estudo ou nenhum fertilizante.
Existem várias técnicas para realizar experimentos aleatorizados com um único fator. Algumas das mais
comuns incluem:
Completamente aleatório: nesta técnica, os sujeitos são atribuídos aleatoriamente a cada tratamento.
Blocos aleatórios: nesta técnica, os sujeitos são divididos em grupos semelhantes e depois são
aleatoriamente designados para um tratamento dentro desse grupo.
Casos pareados: nesta técnica, os sujeitos são pareados com base em alguma característica e depois
cada par é aleatoriamente designado para um tratamento.
Fatorial: nesta técnica, dois ou mais fatores são combinados e cada combinação é usada como um
tratamento.
Essas técnicas podem ser utilizadas em diversos tipos de estudos e pesquisas, permitindo que os
pesquisadores avaliem o efeito de diferentes variáveis em uma determinada resposta.
A ANOVA (análise de variância) é uma técnica estatística utilizada para realizar experimentos aleatorizados
com um único fator.
ANOVA é uma técnica estatística utilizada para comparar a média de três ou mais grupos independentes e
determinar se existem diferenças signi�cativas entre essas médias. Ela compara a variação entre grupos com
a variação dentro de cada grupo, para veri�car se ela é signi�cativamente maior do que a dentro dos grupos.
Se a variação entre os grupos for signi�cativa, a hipótese nula de que todas as médias são iguais é rejeitada e
conclui-se que pelo menos uma média é diferente das demais. A ANOVA pode ser usada em diversos
contextos, como em estudos experimentais, em pesquisas de mercado, na análise de dados �nanceiros, entre
outros.
Alguns exemplos de aplicações são:
Na pesquisa de mercado: usada para comparar a opinião dos consumidores sobre diferentes produtos
ou marcas.
No controle de qualidade: aplicada para comparar a qualidade de produtos fabricados em diferentes
locais ou por diferentes fornecedores.
Na agricultura: usada para comparar o desempenho de diferentes sementes ou tipos de culturas em
diferentes condições climáticas.
11/10/2024, 19:07 wlldd_232_u4_met_mat
https://www.avaeduc.com.br/mod/url/view.php?id=3340524 20/53
Na engenharia: aplicada para avaliar a in�uência de diferentes variáveisno desempenho de um produto,
como a resistência de materiais em diferentes condições de teste.
ANÁLISE DE VARIÂNCIA
Sendo a ANOVA, uma ferramenta estatística tão importante para analisar se existe uma diferença signi�cante
entre as médias, e sabendo que os fatores exercem in�uência nesta diferença, faz-se importante conhecer
primeiramente os erros que devem ser levados em consideração, para que os resultados da análise sejam
válidos. São eles:
Ausência de dados discrepantes.
Erros independentes.
Variância constante.
Distribuição dos erros normal.
Estes pressupostos básicos devem ser levados em consideração para que a ANOVA e seus resultados tenham
validade. A análise da variância só é feita se decompormos a variância total das observações em duas
componentes: a variância dos tratamentos e a dos resíduos, também chamada de variância dos erros.
Se a variância do tratamento for maior do que a calculada com os resíduos, podemos concluir que existe
diferença signi�cativa entre as médias.
Mas como calculamos a análise de variância?
A tabela ANOVA para determinar se há diferença entre as médias de um grupo na análise de variância com
um fator pode ser resumida no Quadro 1:
Quadro 1 | ANOVA de um fator
Fonte de variação
Soma dos
quadrados
Graus de liberdade médias Estatística F
Tratamentos SQTr k-1 QMTr
QMTr/QMRResíduo SQR n-k QMR
Total SQT n-1
Fonte: adaptada pela autora a partir de Costa (2011).
Na qual:
SQTr = é a soma dos quadrados dos grupos (tratamentos).
SQR = é a soma dos quadrados dos resíduos, dentro dos grupos.
11/10/2024, 19:07 wlldd_232_u4_met_mat
https://www.avaeduc.com.br/mod/url/view.php?id=3340524 21/53
SQT = SQTr + SQR (mede a variação geral de todas as observações).
QMTr = média quadrada dos grupos.
QMR = média quadrada dos resíduos (entre os grupos).
No caso de haver dois fatores a serem analisados pela ANOVA, a tabela para cálculo seria a mesma,
adicionando a soma e a média para os blocos. Os blocos encontram-se nas linhas e são variáveis de per�l
in�uentes nas medidas do estudo, cujas categorias se comportam de forma heterogênea na população. Por
este motivo, o experimento deve estrati�car estas categorias (COSTA, 2011). Assim �caria a tabela ANOVA para
dois fatores:
Quadro 2 | Tabela de cálculo da ANOVA para 2 fatores
Fonte de variação
Soma dos
quadrados
Graus de liberdade médias Estatística F
Tratamentos SQTr k-1 QMTr
QMTr/QMR
Blocos SQB r-1 QMB
Resíduo SQR n-k QMR
Total SQT n-1
Fonte: adaptado COSTA, 2011.
Suas respectivas fórmulas estão disponibilizadas na Tabela 3:
Quadro 3 | Fórmulas para cálculo da ANOVA
C (correção)
SQT (soma de quadrado total)
SQTr (soma dos quadrados de tratamentos ou dos grupos)
SQR (soma dos quadrados dos resíduos, dentro dos grupos)
QMTr (quadrado médio dos tratamentos)
QMR (quadrado médio dos resíduos)
F (estatística F)
Fonte: elaborada pela autora.
c = (∑ y)2
n
SQT = ∑ y2 − c
SQTr = ∑ T 2
r − c
SQR  =  SQT   −  SQTr
QMTr =   SQTr
k−1
QMR = SQR
n−k
F = QMTr
QMR
11/10/2024, 19:07 wlldd_232_u4_met_mat
https://www.avaeduc.com.br/mod/url/view.php?id=3340524 22/53
O passo a passo dos cálculos a serem realizados podem ser resumidos na seguinte sequência:
1. Estabelecer a hipótese nula e a hipótese alternativa. A hipótese nula é a suposição de que não há
diferença signi�cativa entre as médias dos grupos, enquanto a hipótese alternativa é a suposição de que
pelo menos uma das médias é diferente das demais.
2. Coletar os dados. Os dados devem ser coletados para cada grupo e organizados em um formato
apropriado para a ANOVA.
3. Calcular as somas de quadrados. É necessário calcular as somas de quadrados entre grupos, dentro de
grupos e total
4. Calcular os graus de liberdade. Os graus de liberdade são calculados para cada uma das somas de
quadrados, sendo que os graus de liberdade total são iguais ao número total de observações menos um.
5. Calcular as médias quadráticas. As médias quadráticas são calculadas para cada uma das somas de
quadrados, dividindo-se a soma de quadrados pelo seu respectivo grau de liberdade.
6. Calcular a estatística F. A estatística F é calculada como a razão entre a média quadrática entre grupos
(MSB) e a média quadrática dentro de grupos (MSW).
7. Determinar o valor crítico. O valor crítico para a estatística F é determinado a partir da tabela F e dos
graus de liberdade.
8. Comparar a estatística F com o valor crítico. Se a estatística F for maior do que o valor crítico, a hipótese
nula é rejeitada e conclui-se que pelo menos uma das médias é diferente das demais.
9. Interpretar os resultados. Com base na análise estatística, é possível determinar se há diferenças
signi�cativas entre as médias dos grupos e, em caso positivo, quais grupos apresentam médias
signi�cativamente diferentes.
Aprender sobre a ANOVA é importante porque ela é uma das técnicas mais utilizadas na pesquisa cientí�ca,
especialmente em áreas como medicina, psicologia, biologia, agricultura, entre outras. Além disso, a ANOVA é
uma ferramenta poderosa para identi�car fatores que in�uenciam uma determinada variável e entender
como esses fatores se relacionam entre si. Portanto, dominar a ANOVA é essencial para conduzir estudos
estatísticos robustos e con�áveis.
O USO DA ANOVA
Um dos estudos mais importantes que utilizou a ANOVA foi o realizado pelo estatístico Ronald A. Fisher, em
1925, no qual ele aplicou a ANOVA para avaliar as diferenças entre as colheitas de trigo em diferentes campos
experimentais. Esse estudo é considerado um marco na história da estatística experimental e foi fundamental
para o desenvolvimento da teoria da ANOVA e da metodologia experimental em geral. Desde então, a ANOVA
tem sido amplamente utilizada em diversas áreas, como a medicina, a psicologia, a biologia, a economia, entre
outras, para analisar as diferenças entre grupos de dados e avaliar a e�cácia de tratamentos e intervenções.
11/10/2024, 19:07 wlldd_232_u4_met_mat
https://www.avaeduc.com.br/mod/url/view.php?id=3340524 23/53
Promover este estudo da ANOVA nos leva a gerar resultados entre grupos que nos permitem realizar
excelentes tomadas de decisões.
Para compreendermos melhor o uso da ANOVA e todas as suas possibilidades de análise, vejamos um
exemplo dentro da área da engenharia.
Exemplo 1) Um fabricante de ferramentas está investigando três métodos diferentes de tratamento térmico
para suas brocas de aço. O objetivo é determinar se existe diferença na vida útil média das brocas tratadas
por esses métodos. Para isso, o fabricante selecionou aleatoriamente 15 brocas e as dividiu igualmente entre
os três métodos de tratamento térmico. A vida útil em horas de cada broca foi registrada. Os resultados estão
no Quadro 4 a seguir:
Quadro 4 | Resultado dos experimentos com as brocas
MÉTODO 1 MÉTODO 2 MÉTODO 3
100 95 105
110 100 95
95 105 100
105 100 90
90 95 105
Fonte: elaborada pela autora.
Para testar se existe diferença signi�cativa nas médias das três amostras, vamos realizar uma ANOVA e
interpretar os resultados.
Resolução:
1º) Formulação das hipóteses:
H0: as médias das três amostras são iguais.
Ha: pelo menos uma média é diferente das demais.
2º) Nível de signi�cância:
Vamos adotar um nível de signi�cância de 5% (α = 0,05).
3º) Cálculo da ANOVA:
Podemos realizar a ANOVA por meio de um software estatístico, como o SPSS, por planilha Excel, ou apenas
fazendo o uso das fórmulas. Os resultados da ANOVA são mostrados no quadro abaixo:
11/10/2024, 19:07 wlldd_232_u4_met_mat
https://www.avaeduc.com.br/mod/url/view.php?id=3340524 24/53
Quadro 5  | Resultado da ANOVA
FONTE DE VARIAÇÃO
SOMA DOS
QUADRADOS
GRAUS DE
LIBERDADE
MÉDIAS ESTATÍSTICA F
TRATAMENTOS 3,33 2 1,665
0,040
RESÍDUOS 490 12 40,83
TOTAL 493,33 14
Fonte: elaborada pela autora.
Para encontrar estes resultados sem uso de software especí�co, seria interessante calcular a tabela com os
dados fornecidos:
Quadro 6 | Tabela calculada com os dados fornecidos
MÉTODO 1 Y² MÉTODO 2 Y² MÉTODO3 Y²
100 10000 95 9025 105 11025
110 12100 100 10000 95 9025
95 9025 105 11025 100 10000
105 11025 100 10000 90 8100
90 8100 95 9025 105 11025
TOTAL 500 50250 495 49075 495 49175
Fonte: elaborada pela autora.
Agora observe o passo a passo:
c =
(∑ y)
2
n =   (500+495+495)²
15 = 148.006,67
SQT =  ∑ y2 − c = (50250 + 49075 + 49175) − 148.006,67 = 493,33
SQTr =
∑ T ²
r − c =  [ 5002
5 + 4952
5 + 4952
5 ] − 148.006,67 = 3,33 
SQR  =  SQT  – SQTr  =  493, 33 – 3, 33  =  490
QMTr =   SQTr
k−1 = 3,33
3−1 = 1,665
QMR = SQR
n−k =   490
15−3 = 40,83
11/10/2024, 19:07 wlldd_232_u4_met_mat
https://www.avaeduc.com.br/mod/url/view.php?id=3340524 25/53
4º) Análise dos resultados:
A estatística F é 0,040. Como 0,040 
19,46, rejeitamos a hipótese nula de que as médias dos três grupos são iguais. Portanto, há evidências
estatísticas de que há diferenças signi�cativas entre as médias de sabor dos produtos testados.
5º) Conclusão:
Concluímos que a empresa pode escolher qualquer uma das formulações de sabor, porém haverá diferença
nas preferências e o processo em relação à qualidade sensorial dos produtos pode ser comprometida.
VIDEO RESUMO
Você verá, neste vídeo, a importância que o estudo da ANOVA possui nos controles de qualidade, mais
especi�camente quando precisamos comparar a média de três grupos ou mais. Aprender sobre a ANOVA é
importante, porque ela é uma das técnicas mais utilizadas na pesquisa cientí�ca, especialmente em áreas
como medicina, psicologia, biologia, agricultura, entre outras. Além disso, a ANOVA é uma ferramenta
poderosa para identi�car fatores que in�uenciam uma determinada variável e entender como esses fatores se
relacionam entre si.
 Saiba mais
11/10/2024, 19:07 wlldd_232_u4_met_mat
https://www.avaeduc.com.br/mod/url/view.php?id=3340524 28/53
Você conhece o SPSS (Statistical Package for Social Sciences)? Ele é um software estatístico amplamente
utilizado para análise de dados. Foi desenvolvido originalmente para análises estatísticas em ciências
sociais, mas atualmente é usado em diversas áreas, incluindo negócios, saúde e educação. O SPSS possui
uma interface grá�ca amigável que permite aos usuários importar dados, realizar análises descritivas,
cálculo da ANOVA, testes de hipóteses, regressão e outros tipos de análises estatísticas.
INTRODUÇÃO
Olá, estudante!
Os testes estatísticos são uma ferramenta fundamental para a tomada de decisões em diversas áreas,
incluindo negócios, saúde, ciências sociais e muitas outras. Dois testes amplamente utilizados são os de uma e
duas caudas, que ajudam a determinar se uma amostra de dados é estatisticamente diferente de um valor de
referência. Também temos outros testes comuns, como o teste t e o teste z, que são usados para testar se a
média de uma amostra é signi�cativamente diferente da média populacional ou de uma outra amostra. Esses
testes são importantes para garantir que as conclusões tomadas a partir dos dados sejam precisas e
con�áveis.
Os testes de hipóteses fazem parte da área da inferência estatística, que é responsável por fazer inferências
sobre uma população a partir de uma amostra aleatória. A inferência estatística envolve a utilização de
métodos estatísticos para analisar os dados e tirar conclusões sobre uma população com base em
informações limitadas disponíveis em uma amostra. Veremos, nesta aula, como os testes podem ser uma
ferramenta poderosa para analisar dados e, sobretudo para a tomada de decisões.
Bons estudos!
TESTES DE HIPÓTESES
Aula 4
MÉTODOS DE TOMADA DE DECISÃO
Os testes estatísticos são uma ferramenta fundamental para a tomada de decisões em diversas áreas,
incluindo negócios, saúde, ciências sociais e muitas outras. Os testes de hipóteses fazem parte da área
da inferência estatística, que é responsável por fazer inferências sobre uma população a partir de uma
amostra aleatória.
28 minutos
11/10/2024, 19:07 wlldd_232_u4_met_mat
https://www.avaeduc.com.br/mod/url/view.php?id=3340524 29/53
https://spss.softonic.com.br/?psafe_param=1&utm_source=SEM&utm_medium=paid&utm_campaign=EN_PT_Brazil_DSA&gclid=CjwKCAjwvJyjBhApEiwAWz2nLZliOvsOe0gYpeRti_GtTJZ1hqYc_e6ALbGhy8U6tnniGWBratUjLRoCin4QAvD_BwE
Os testes de hipóteses são ferramentas de relevante importância dentro da grande área estatística chamada
inferência estatística. Os testes de hipóteses são utilizados em diversas áreas da ciência, tais como
engenharia, medicina, psicologia, entre outras. Eles são aplicados para avaliar se uma determinada hipótese
sobre uma população é plausível, a partir da análise de uma amostra da população em questão.
Em outras palavras, os testes de hipóteses são utilizados para veri�car se uma a�rmação ou suposição sobre
uma população é verdadeira ou não, com base em evidências estatísticas amostrais. Os resultados desses
testes são importantes para tomadas de decisão em áreas como planejamento de experimentos, controle de
qualidade, análise de dados, entre outras.  Os testes de hipóteses são relevantes na estatística porque
permitem veri�car se uma determinada a�rmação sobre uma população é estatisticamente válida ou não,
com base em uma amostra dela. Isso é feito a partir da construção de uma hipótese nula, que é a a�rmação a
ser testada, e uma hipótese alternativa, que é a negação da hipótese nula.
Mas, por que é importante saber,entender e conhecer os testes de hipóteses?
A importância de trabalhar com testes de hipóteses está em fornecer uma ferramenta estatística para tomada
de decisão com base em evidências amostrais. Ao realizar um teste de hipóteses corretamente, é possível
quanti�car o grau de incerteza associado a uma determinada a�rmação e avaliar se os dados observados são
su�cientemente diferentes para rejeitar a hipótese nula.
Além disso, os testes de hipóteses são amplamente utilizados em pesquisas cientí�cas, nas quais é necessário
avaliar a signi�cância estatística de resultados experimentais ou observacionais. Isso é fundamental para
garantir a validade dos resultados e evitar conclusões precipitadas ou enganosas.
Testes de uma e duas caudas são tipos de testes de hipóteses estatísticas utilizados para avaliar se uma
amostra de dados difere signi�cativamente de uma determinada população.
No teste de uma cauda, a hipótese nula a�rma que a média da população é igual a um determinado valor, e a
hipótese alternativa a�rma que a média da população é maior ou menor do que esse valor. Neste caso,
trabalha-se só com um lado da cauda para realizar a análise.
Figura 1 | Exemplo de teste de uma cauda
11/10/2024, 19:07 wlldd_232_u4_met_mat
https://www.avaeduc.com.br/mod/url/view.php?id=3340524 30/53
Fonte: Fernandes et al. (2016).
Já no teste de duas caudas, a hipótese nula a�rma que a média da população é igual a um determinado valor,
e a hipótese alternativa a�rma que a média da população é diferente desse valor, ou seja, pode ser maior ou
menor. Neste caso, trabalha-se com os dois lados da curva.
Figura 2 | Exemplo de teste de duas caudas
Fonte: Fernandes et al. (2016).
Há que se destacar que, para realizar os testes de uma ou de duas caudas, é necessário que os dados sejam
normalmente distribuídos.
Os testes t e z são exemplos de testes de hipóteses que podem ser utilizados tanto em testes de uma cauda
quanto de duas caudas. O teste t é utilizado quando a amostra é pequena (estatisticamente falando, amostras
são consideradas pequenas quando são menores que 30) ou quando a variância populacional é desconhecida,
11/10/2024, 19:07 wlldd_232_u4_met_mat
https://www.avaeduc.com.br/mod/url/view.php?id=3340524 31/53
enquanto o teste z é utilizado quando a amostra é grande (amostras são consideradas grandes na estatística
quando o valor em questão é igual ou maior que 30) e a variância populacional é conhecida ou estimada.
TESTE Z OU TESTE T
Os testes t e z são amplamente utilizados na estatística inferencial para testar hipóteses sobre médias
populacionais. Ambos os testes são úteis quando se deseja determinar se uma diferença observada entre
duas amostras é estatisticamente signi�cativa ou se ela pode ter ocorrido apenas por acaso. Esses testes são
particularmente úteis na pesquisa cientí�ca, na qual é comum coletar dados de amostras para fazer
inferências sobre a população em geral.  
Mas, como calcular um teste de hipótese t ou teste de hipótese z? Basicamente, os passos para o cálculo dos
dois tipos de teste é o mesmo, o que difere é o tamanho da amostra e o desvio padrão. Relembrando:
Realizar teste t quando a amostra é pequena (na qualidade das peças produzidas.
Outra aplicação seria em testes de resistência de materiais, com os quais se pode veri�car se a resistência
média de um determinado material está de acordo com as especi�cações de projeto.
11/10/2024, 19:07 wlldd_232_u4_met_mat
https://www.avaeduc.com.br/mod/url/view.php?id=3340524 35/53
Vejamos uma situação prática para o uso dos testes de hipóteses.
Uma indústria de transformação de plásticos está buscando otimizar seu processo de produção, visando a
reduzir custos e aumentar a e�ciência. A empresa suspeita que a média de tempo de processamento das
peças em uma determinada máquina está acima do valor desejado e, para con�rmar essa suspeita, coletou
uma amostra aleatória de 50 peças e registrou o tempo de processamento de cada uma delas. O valor médio
encontrado na amostra foi de 38 minutos com desvio padrão de 8 minutos, mas a média desejada é de 35
minutos. Para saber se há diferença estatisticamente signi�cativa entre a média da amostra e a média
desejada, o engenheiro responsável pela análise decidiu realizar um teste de hipótese. Use signi�cância de 5%
(α = 0,05).
Solução:
1º) Estabelecer H0 e Ha. A hipótese nula é de que a média real de tempo de processamento é igual a 35
minutos e a hipótese alternativa é de que a média real é maior que 35 minutos. Assim:
H0: μ = 35
Ha: μ > 35
2º) Como a signi�cância é 5% = 0,05 e o teste é com a tabela z pois a amostra é grande (n>30), temos para
valor crítico c = 1,645
OBS.: Como obter este valor na tabela z? No caso, como a con�ança é de (5% unilateral, signi�ca que toda a
outra parte da curva corresponde a 50%, sobrando 45% = 0,4500. Procurando este valor no meio da tabela,
encontramos apenas os valores que são 0,4495 com um z correspondente de 1,64 e 04505 com um valor de z
correspondente de 1,64, não sendo nenhum deles o valor desejado. Este encontra-se justamente no meio dos
dois, logo faz-se uma média aritmética simples entre os valores de 1,64 e 1,5, encontrando o valor de 1,645.
Veja na �gura a seguir.
Figura 5 | Tabela z – Curva Normal
11/10/2024, 19:07 wlldd_232_u4_met_mat
https://www.avaeduc.com.br/mod/url/view.php?id=3340524 36/53
Fonte: Costa (2011, p. 271).
3º) Calcular o teste z
Para realizar o teste, o engenheiro calculou a estatística de teste usando a fórmula:
4º) Estabelecer as regiões de aceitação e rejeição com o valor crítico.
Figura 6 | Regiões de aceitação e rejeição com o valor crítico
z = x−μ
σ
√n
=   35−38
8
√50
= 2,65–
11/10/2024, 19:07 wlldd_232_u4_met_mat
https://www.avaeduc.com.br/mod/url/view.php?id=3340524 37/53
Fonte: elaborada pela autora.
5º) Comparar o valor do cálculo do teste z com o valor crítico:
Como z > c, ou seja, 2,65 > 1,645, veri�camos que o teste está na área de rejeição e, desta forma, não
aceitaremos a hipótese nula.
Com isso, rejeita-se a hipótese nula e concluiu que há evidências estatísticas para a�rmar que a média real de
tempo de processamento das peças é maior que 35 minutos. Com essa informação em mãos, a empresa
poderá realizar ajustes em seu processo de produção para atingir a média desejada de 35 minutos,
aumentando assim a e�ciência e reduzindo custos.
Perceba que foi cometido um erro neste teste, você saberia dizer qual é?
A indústria já havia delimitado uma média inicial e estava con�ante de que esta era verdadeira, mas depois
veri�cou com o teste estatístico que isto não estava acontecendo de fato na produção. Então rejeitamos H0
mesmo ela sendo verdadeira, por isso o erro cometido foi o TIPO 1: quando a hipótese nula é verdadeira, mas
é rejeitada. Veja na Tabela 1.
VIDEO RESUMO
Você verá, neste vídeo, a importância que os testes de hipóteses, junto a outras ferramentas estatísticas,
possuem e qual o peso deles e de seus resultados na tomada de decisão. Os testes de hipóteses têm uma
grande importância na tomada de decisão, pois permitem avaliar a validade de uma a�rmação feita sobre
uma população com base em uma amostra. Com base nessa análise, é possível tomar decisões mais
embasadas em relação a um processo ou produto, por exemplo, e decidir se uma mudança na fabricação de
um produto foi efetiva ou se os resultados obtidos são apenas fruto do acaso.
 Saiba mais
11/10/2024, 19:07 wlldd_232_u4_met_mat
https://www.avaeduc.com.br/mod/url/view.php?id=3340524 38/53
Você sabia que os testes de hipótese podem ser calculados em várias plataformas? Existem diversos
softwares estatísticos disponíveis para o cálculo de testes de hipóteses, incluindo: SAS (Statistical Analysis
System); Excel; Minitab; Python (usando bibliotecas como SciPy e StatsModels). A escolha do software
dependerá das suas necessidades especí�cas, bem como do nível de familiaridade e habilidade com cada
programa.
SAS
Minitab
ESTATÍSTICA APLICADA PARA A TOMADA DE DECISÕES
Olá, estudante!
Na era da informação, é cada vez mais comum a coleta de dados para auxiliar as decisões empresariais e
institucionais. No entanto, ter dados em mãos nem sempre é su�ciente. É preciso saber interpretá-los de
forma e�caz para que sejam transformados em informações úteis para a tomada de decisão. Nesse contexto,
as ferramentas estatísticas, como grá�cos, tabelas, distribuição normal, ANOVA e testes de hipóteses ganham
importância fundamental nas mais diversas áreas.
Os grá�cos são ferramentas importantes para a análise de dados, pois possibilitam uma visualização rápida e
intuitiva das informações coletadas. Através deles, é possível identi�car padrões, tendências e relações entre
variáveis. Há diversos tipos de grá�cos que podem ser utilizados em diferentes situações, como o grá�co de
barras, o de linhas, o de pizza, entre outros.
Já as tabelas são fundamentais para a organização dos dados coletados. Elas permitem a visualização dos
dados de forma ordenada e facilitam a análise e comparação entre diferentes variáveis. Além disso, as tabelas
também podem ser utilizadas para cálculos estatísticos, como médias, desvios-padrão e correlações.
A distribuição normal é uma ferramenta importante para a análise estatística de dados. Ela é uma distribuição
de probabilidade que possui um grá�co semelhante a um sino e é utilizada para determinar a probabilidade
de ocorrência de um determinado evento em uma amostra ou população. Essa distribuição é amplamente
utilizada em diversas áreas, como a engenharia, a medicina e a economia, e permite a realização de cálculos
estatísticos mais precisos.
Aula 5
REVISÃO DA UNIDADE
44 minutos
11/10/2024, 19:07 wlldd_232_u4_met_mat
https://www.avaeduc.com.br/mod/url/view.php?id=3340524 39/53
https://www.sas.com/pt_br/curiosity.html?utm_source=google&utm_medium=cpc&utm_campaign=brand-global&utm_content=GMS-158646-gbc-cf&gclid=CjwKCAjwvJyjBhApEiwAWz2nLQEES44L3gVTlTR5Ie-xG6yhtZPBE7oTOZkkHYfC9lprbd51wQ6ybRoCFAEQAvD_BwE
https://www.minitab.com/pt-br/products/minitab/free-trial/?utm_campaign=BFO+-+Brazil+-+Portuguese+-+Branded&utm_medium=ppc&utm_term=minitab%20gratuito&utm_source=adwords&hsa_net=adwords&hsa_mt=p&hsa_ver=3&hsa_grp=78035232460&hsa_ad=381041252397&hsa_tgt=a
A análise de variância (ANOVA) é uma técnica estatística utilizada para comparar a média de duas ou mais
amostras independentes. Essa técnica é amplamente utilizada em pesquisas cientí�cas e na indústria,
permitindo a comparação de diferentes tratamentos ou intervenções em uma determinada população.
Por �m, os testes de hipóteses são ferramentas importantes para validar ou refutar uma hipótese a partir dos
dados coletados. Eles permitem determinar se uma diferença observada entre duas amostras é real ou
apenas fruto do acaso. Essa ferramenta é amplamente utilizada em diversas áreas, como a medicina, a
psicologia e a engenharia, e permite a tomada de decisões mais embasada em dados concretos.
É importante que você perceba que as ferramentas estatísticas são fundamentais para a análise de dados e
para a tomada de decisões mais assertivas. Grá�cos e tabelas permitem uma organização visual dos dados
coletados, enquanto aEducation do Brasil, 2015.
BUSSAB, W.; MORETTIN, P. Estatística Básica. São Paulo: Saraiva, 2002.
COSTA, G. G. de O. Curso de Estatística básica: teoria e prática. São Paulo: Atlas, 2011.
SPIEGEL, M. Estatística. São Paulo: Makron Books, 1993.
REFERÊNCIAS
2 minutos
11/10/2024, 19:07 wlldd_232_u4_met_mat
https://www.avaeduc.com.br/mod/url/view.php?id=3340524 52/53
Imagem de capa: Storyset e ShutterStock.
Aula 3
BONAFINI, F. C. (org.). Probabilidade e estatística. São Paulo: Pearson Education do Brasil, 2015.
BUSSAB, W.; MORETTIN, P. Estatística Básica. São Paulo: Saraiva, 2002.
COSTA, G. G. de O. Curso de Estatística básica: teoria e prática. São Paulo: Atlas, 2011.
SPIEGEL, M. Estatística. São Paulo: Makron Books, 1993.
Aula 4
BONAFINI, F. C. (org.). Probabilidade e estatística. São Paulo: Pearson Education do Brasil, 2015.
BUSSAB, W.; MORETTIN, P. Estatística Básica. São Paulo: Saraiva, 2002.
Aula 5
BONAFINI, F. C. (org.). Probabilidade e estatística. São Paulo: Pearson Education do Brasil, 2015.
BUSSAB, W.; MORETTIN, P. Estatística Básica. São Paulo: Saraiva, 2002.
COSTA, G. G. de O. Curso de Estatística básica: teoria e prática. São Paulo: Atlas, 2011.
DOWNING, D.; CLARK, J. Estatística Aplicada. 2ª ed. São Paulo: Saraiva, 2006.
SPIEGEL, M. Estatística. São Paulo: Makron Books, 1993. 
11/10/2024, 19:07 wlldd_232_u4_met_mat
https://www.avaeduc.com.br/mod/url/view.php?id=3340524 53/53
https://storyset.com/
https://www.shutterstock.com/pt/

Mais conteúdos dessa disciplina