Logo Passei Direto
Buscar
Material

Prévia do material em texto

PROBABILIDADE 
E ESTATÍSTICA
A Faculdade Multivix está presente de norte a sul 
do Estado do Espírito Santo, com unidades em 
Cachoeiro de Itapemirim, Cariacica, Castelo, Nova 
Venécia, São Mateus, Serra, Vila Velha e Vitória. 
Desde 1999 atua no mercado capixaba, 
destacando-se pela oferta de cursos de 
graduação, técnico, pós-graduação e 
extensão, com qualidade nas quatro áreas 
do conhecimento: Agrárias, Exatas, 
Humanas e Saúde, sempre primando pela 
qualidade de seu ensino e pela formação 
de profissionais com consciência cidadã 
para o mercado de trabalho.
Atualmente, a Multivix está entre o seleto 
grupo de Instituições de Ensino Superior que 
possuem conceito de excelência junto ao 
Ministério da Educação (MEC). Das 2109 institu-
ições avaliadas no Brasil, apenas 15% conquis-
taram notas 4 e 5, que são consideradas 
conceitos de excelência em ensino.
Estes resultados acadêmicos colocam 
todas as unidades da Multivix entre as 
melhores do Estado do Espírito Santo e 
entre as 50 melhores do país.
 
MISSÃO
Formar profissionais com consciência 
cidadã para o mercado de trabalho, com elevado 
padrão de qualidade, sempre mantendo a credibil-
idade, segurança e modernidade, visando à satis-
fação dos clientes e colaboradores.
 
VISÃO
Ser uma Instituição de Ensino Superior reconheci-
da nacionalmente como referência em qualidade 
educacional.
R E I TO R
GRUPO
MULTIVIX
R E I
2
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
BIBLIOTECA MULTIVIX (Dados de publicação na fonte)
Alexandre Erdmann Silva; Wagner dos Anjos Carvalho.
Probabilidade e Estatística / Silva, Alexandre Erdmann; Carvalho, Wagner dos Anjos. - Multivix, 2020.
Catalogação: Biblioteca Central Multivix 
 2020 • Proibida a reprodução total ou parcial. Os infratores serão processados na forma da lei.
3
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
4
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
LISTA DE TABELAS E QUADROS
 Tabela 1: Distribuição de probabilidade para cálculo da variância. 43
 Tabela 2: Nomenclatura da distribuição binomial. 46
 Quadro 1: Dados apresentados pela empresa ao fim do ano passado 111
5
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
LISTA DE FIGURAS
 Figura 1: População e amostra 17
 Figura 2: Gráficos 17
 Figura 3: Representação de gráficos 19
 Figura 4: Gráfico de curvas. 22
 Figura 5: Gráfico de setores. 23
 Figura 6: Maior conjunto 25
 Figura 1: Complemento de um evento A 32
 Figura 2: União de dois eventos A e B. 33
 Figura 3: Interseção de A e B. 33
 Figura 1: homem pensando. 49
 Figura 2: resultados do lançamento de dois dados. 50
 Figura 4: pontos de interrogação. 52
 Figura 5: resultado dos lançamentos de dois dados. 52
 Figura 6: resultado dos lançamentos de dois dados. 53
 Figura 7: distribuição de probabilidade 54
 Figura 1: A busca de informações é fundamental para a gestão 
organizacional. 59
 Figura 2: O processo de tomada de decisão com base em dados. 60
 Figura 3: A importância das hipóteses na tomada de decisão gerencial. 61
 Figura 4: O risco associado a aceitação das hipóteses estatísticas. 63
 Figura 5: Os dados do exemplo. 64
 Figura 6: A inserção dos dados no programa SPSS 24.0. 65
 Figura 7: O resultado do teste t simples do exemplo. 65
 Figura 8: A inserção dos dados no programa SPSS 24.0. 67
 Figura 9: O resultado do teste t simples do exemplo. 67
 Figura 10: Interpretação geométrica do comparativo entre distribuições 
com base nos testes comparativos. 68
 Figura 11: Testes de comparação entre distribuições normais. 69
 Figura 12: Os testes estatísticos paramétricos sendo aplicados no 
cotidiano. 70
6
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
 Figura 13: Comparativo entre os testes paramétricos e não paramétricos. 71
 Figura 14: O significado do termo verossimilhança. 72
 Figura 1: experimentos químicos ou bioquímicos. 78
 Figura 3: valor esperado de vendas. 81
 Figura 6: avaliação dos dados por menor variância. 85
 Figura 7: proporção populacional. 86
 Figura 8: intervalos de confiança. 88
 Figura 9: curva normal. 89
 Figura 1: A importância da associação entre grandezas na gestão 97
 Figura 2: A correlação na prática do mercado organizacional 98
 Figura 3: A correlação e regressão na prática organizacional 98
 Figura 4: O IC para a média populacional com a variância populacional 
conhecida 101
 Figura 5: O IC para a média populacional com a variância populacional 
desconhecida 103
 Figura 6: O IC para a variância populacional para uma 
distribuição normal 106
 Figura 8: As variáveis envolvidas no processo de regressão linear 110
 Figura 9: O gráfico de dispersão do exemplo 111
 Figura 10: A importância da correlação entre amostras no contexto 
do sucesso organizacional 112
 Figura 11: Tipologia dos coeficientes de correlação 113
 Figura 12: A correlação entre grandezas categóricas 115
 Figura 13: A importância da correlação entre grandezas categóricas 
no contexto organizacional 116
 Figura 14: Uma aplicação envolvendo o teste qui-quadrado 117
7
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
1UNIDADE
2UNIDADE
3UNIDADE
SUMÁRIO
APRESENTAÇÃO DA DISCIPLINA 10
1 ESTATÍSTICA DESCRITIVA 13
INTRODUÇÃO DA UNIDADE 13
1.1 PROCESSO ESTATÍSTICO 14
1.2 POPULAÇÕES E AMOSTRAS 15
1.3 TABELAS E SÉRIES ESTATÍSTICAS 17
1.4 GRÁFICOS ESTATÍSTICOS 21
1.5 MEDIDAS DE LOCALIZAÇÃO 23
1.6 MEDIDAS DE DISPERSÃO 26
2 PROBABILIDADE 29
INTRODUÇÃO DA UNIDADE 29
2.1 INTRODUÇÃO À PROBABILIDADE 29
2.2 ESPAÇO AMOSTRAL E EVENTOS 31
2.3 TÉCNICA DA CONTAGEM 34
2.4 PROBABILIDADE CONDICIONAL 35
2.5 TEOREMA DE BAYES 36
2.6 EVENTOS INDEPENDENTES 37
3 VARIÁVEIS ALEATÓRIAS DISCRETAS E CONTÍNUAS 41
INTRODUÇÃO DA UNIDADE 41
3.1 ESPERANÇA MATEMÁTICA E VARIÂNCIA 41
3.2 DISTRIBUIÇÕES HIPERGEOMÉTRICAS, BINOMIAL E DE POISSON 45
3.3 DISTRIBUIÇÃO NORMAL 48
3.4 VARIÁVEIS ALEATÓRIAS BIDIMENSIONAIS 50
3.5 DISTRIBUIÇÕES MARGINAIS, INDEPENDENTES E CONDICIONAIS 52
3.6 FUNÇÕES DE VARIÁVEIS ALEATÓRIAS 55
8
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
4UNIDADE
5UNIDADE
6UNIDADE
4 AVALIAÇÃO DE TESTES DE HIPÓTESES 59
INTRODUÇÃO DA UNIDADE 59
4.1 HIPÓTESE E PROCEDIMENTO DE TESTE 60
4.2 TESTE COM RELAÇÃO À MÉDIA DA POPULAÇÃO 64
4.3 TESTES DE COMPARAÇÃO DE DUAS MÉDIAS 66
4.4 TESTES DE COMPARAÇÃO DE DUAS DISTRIBUIÇÕES 68
4.5 TESTE PARAMÉTRICO 70
4.6 TESTE DE VEROSSIMILHANÇA 72
5 ESTIMATIVA PONTUAL 77
INTRODUÇÃO DA UNIDADE 77
5.1 ESTIMADORES NÃO VICIADOS 78
5.2 VALOR ESPERADO 81
5.3 ESTIMADORES COM MÍNIMA VARIÂNCIA 84
5.4 PROPORÇÃO POPULACIONAL 86
5.5 ESTIMAÇÃO POR INTERVALO DE CONFIANÇA 88
5.6 ESTIMAÇÃO POR MÁXIMO VEROSSIMILHANÇA 92
6 INTERVALO DE CONFIANÇA, ANÁLISE DE REGRESSÃO 
E CORRELAÇÃO 97
INTRODUÇÃO DA UNIDADE 97
6.1 PROPRIEDADES DO INTERVALO DE CONFIANÇA 99
6.2 INTERVALOS COM BASE EM DISTRIBUIÇÃO POPULACIONAL 
NORMAL 101
6.3 INTERVALOS DE CONFIANÇA PARA A VARIÂNCIA E DESVIO 
PADRÃO PARA UMA POPULAÇÃO COM DISTRIBUIÇÃO NORMAL 106
6.4 REGRESSÃO LINEAR 109
6.5 CORRELAÇÃO AMOSTRAL 112
6.6 CORRELAÇÕES COM VARIÁVEIS CATEGÓRICAS E ASSOCIAÇÕES 114
9
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
ATENÇÃO 
PARA SABER
SAIBA MAIS
ONDE PESQUISAR
DICAS
LEITURA COMPLEMENTAR
GLOSSÁRIO
ATIVIDADES DE
APRENDIZAGEM
CURIOSIDADES
QUESTÕES
ÁUDIOSMÍDIAS
INTEGRADAS
ANOTAÇÕES
EXEMPLOS
CITAÇÕES
DOWNLOADS
ICONOGRAFIA
10
PROBABILIDADE E ESTATÍSTICA
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
APRESENTAÇÃO DA DISCIPLINA
Bem-vindos à disciplina de Probabilidade e Estatística.Ao longo do tempo, a estatística está se destacando para o mercado devido 
aos avanços no processamento computacional e no volume de dados obtidos 
para realizar as análises e obter possibilidades para compreensão de proces-
sos, mercado e oportunidades. 
Por conta disso, esta disciplina tem por objetivo fazer com que você conhe-
ça o processo de exploração de dados por meio da estatística descritiva e 
as possibilidades; para isso, forneceremos ferramentas estatísticas para que 
você apresente os dados obtidos de amostras por meio de tabelas, gráficos 
etc., aplicando o processo estatístico e passando pelas fases de definição do 
problema a ser analisado, planejamento dos dados necessários para serem 
coletados, a forma que será realizada essa coleta, a análise crítica dos dados 
coletados, apresentação dos dados e análise e interpretação desses dados. 
Além do que já foi dito, alguns outros assuntos abordados aqui são: o levanta-
mento de dados (que gera e verifica se as informações obtidas na coleta são 
representativas para a população analisada – aqui se destaca a probabilida-
de), a tentativa de encontrar qual a probabilidade de um determinado evento 
ocorrer e a definição de parâmetros para validar uma hipótese formulada na 
definição do problema são assuntos abordados para que você, aluno, domine 
e aplique essas ferramentas no seu dia a dia.
Enfim, esperamos promover reflexões sobre o assunto e desejamos sucesso 
e bons estudos!
11
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
12
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
> Conhecer o 
processo de 
exploração de 
dados;
> Diferenciar 
adequadamente 
amostras e 
população;
> Representar séries 
e dados estatísticos 
utilizando tabelas, 
gráficos;
> Analisar os 
dados obtidos 
com medidas 
de localização 
e medida de 
dispersão.
UNIDADE 1
OBJETIVO 
Ao final desta 
unidade, 
esperamos que 
você seja capaz 
de:
13
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
1 ESTATÍSTICA DESCRITIVA
INTRODUÇÃO DA UNIDADE
Esta unidade abordará o método estatís-
tico, que também pode ser lembrado nas 
pesquisas de opinião. Esta é uma área de 
grande importância, pois, para solucionar 
os inúmeros problemas que aparecem 
para profissionais de gestão, análises mé-
dicas e engenharia, são necessárias infor-
mações ligadas à estatística, que utiliza 
dados para associar com o problema que 
é estudado. Portanto, após planejar o que 
coletar e como realizar a coleta, o profis-
sional pode obter conclusões a partir des-
sas informações.
Assim, o método estatístico tem como objetivo auxiliar você, profissional, a 
realizar o seu trabalho de forma eficiente.
A estatística é separada em três grandes áreas:
• Estatística descritiva: 
É o conjunto de técnicas analíticas utilizado para resumir o conjunto de 
todos os dados coletados em uma dada pesquisa relativamente com 
poucos números e gráficos (COSTA, 2015, p. 6). 
• Estatística inferencial: 
É o processo para conseguir informações de uma população com base 
nos dados obtidos de uma amostra (COSTA, 2015, p. 6).
Para visualizar os marcos 
históricos do IBGE, acesse o 
link https://memoria.ibge.gov.
br/sinteses-historicas/linha-
do-tempo.html.
https://memoria.ibge.gov.br/sinteses-historicas/linha-do-tempo.html
https://memoria.ibge.gov.br/sinteses-historicas/linha-do-tempo.html
https://memoria.ibge.gov.br/sinteses-historicas/linha-do-tempo.html
14
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
 • Probabilidade: 
É uma forma de obter modelos matemáticos utilizados para explicar 
os fenômenos estudados pela estatística (DEVORE, 2014, p. 45.) 
Segundo Loesch (2015), a estatística está presente em diversas etapas de uma 
pesquisa: do início, na fase de planejamento, até a interpretação dos resulta-
dos; portanto, essa área pode influenciar ao longo do processo de pesquisa.
No Brasil, o maior e principal provedor de dados e informações do país é o 
Instituto Brasileiro de Geografia e Estatística (IBGE). 
Vamos aprender um pouco mais sobre os outros assuntos nesta unidade?
1.1 PROCESSO ESTATÍSTICO
Para realizar um levantamento estatístico, o profissional deve seguir por uma 
trajetória de 5 fases:
• planejamento;
• coleta de dados;
• organização dos dados;
• exposição de resultados;
• interpretação dos dados.
Na fase de planejamento, você é responsável por formular os objetivos gerais 
e específicos e, assim, determinar as características que serão observadas e 
medidas.
Você deve definir a população, ou seja, o conjunto de elementos que o estudo 
pretende abranger, e o tamanho mínimo que sua amostra deve ter para ga-
rantir o nível de confiança que se deseja e que esteja dentro do erro tolerado.
Deve determinar também a forma mais econômica para coleta de dados, pois 
isso pode impactar diretamente no estudo, podendo tornar a pesquisa inviável.
15
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
A fase de coleta de dados é considerada a etapa operacional do processo 
estatístico. Nesta fase você vai obter os dados utilizando um instrumento de-
finido na fase de planejamento.
A fase de organização dos dados é realizada após a coleta, pois geralmente 
esses dados são obtidos de forma desordenada. Nesta fase, geralmente, são 
utilizadas as tabelas.
Já a última fase, a de exposição de resultados, os dados obtidos podem ser 
representados de duas formas:
Forma tabular – consiste em 
apresentar os dados em linhas e 
colunas de modo ordenado:
Forma gráfica – consiste em 
apresentar os dados de forma 
gráfica sem apresentar os 
detalhes obtidos na tabela:
Por fim, na fase de interpretação de resultados, utiliza-se técnicas estatísti-
cas para realizar estimativas, previsões, análise exploratória de dados e testes 
para chegar em conclusões.
1.2 POPULAÇÕES E AMOSTRAS
Antes de definir populações e amostras, você compreenderá as técnicas de 
amostragem. Essas técnicas são importantes, pois a amostra a ser analisada 
deve ser representativa de forma efetiva da população.
16
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
Segundo Loesch (2015), as técnicas de amostragem são:
• amostragem aleatória simples – cada elemento da população recebe um 
número distinto e alguns elementos são sorteados. Considerando uma 
população de N elementos, todos os elementos devem ter a mesma a 
probabilidade;
• amostragem sistemática – técnica que estabelece a extração de elementos 
periodicamente espaçados;
• amostragem estratificada – técnica que tem por objetivo dividir a população 
em subgrupos conhecidos como estratos;
• amostragem de conglomerados – técnica utilizada em populações que 
apresentam muitos subgrupos, assim reúnem-se os subgrupos em 
conglomerados;
• amostragem por julgamento – técnica que consiste em obter os elementos 
através de julgamento.
Costa (2015) define população como o conjunto de todos os elementos refe-
rentes a um determinado fenômeno em estudo que contém, ao menos, uma 
característica em comum e que pode ser classificado em:
• finita – número de observações limitado, em que é possível contabilizar;
• infinita – número de observações ilimitado.
A amostra é um subconjunto da população e que deve ser escolhida utilizan-
do como base regras, representando, assim, as características da população.
A Figura 3 ilustra a população e a amostra. Todas as pessoas de uma re-
gião fazem parte da população; já as pessoas que possuem característica 
específ ica (neste exemplo, as de verde) fazem parte da amostra da popu-
lação estudada.
17
MULTIVIX EAD
Credenciada pela portaria MECnº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
FIGURA 1: POPULAÇÃO E AMOSTRA
POPULAÇÃO
AMOSTRA
Fonte: Elaborada pelo autor.
1.3 TABELAS E SÉRIES ESTATÍSTICAS
A estatística descritiva é o conjunto de técnicas usadas para resumir o conjun-
to de dados coletados, e que envolve distribuição em frequências, representa-
ção tabular, gráficas, medidas de tendência central e dispersão.
FIGURA 2: GRÁFICOS
Fonte: Plataforma Deduca (2019).
18
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
É necessário definir variáveis estatísticas, que são as características que po-
dem ser observadas em cada elemento da população. 
Essas variáveis podem ser divididas em dois grupos:
• Variáveis qualitativas
Resultam de uma classificação por tipo ou atributo (LOESCH, 2015);
• Variáveis quantitativas 
Resultam de valores que são expressos em quantidades e podem 
ser apresentados como variáveis discretas − em que os valores são 
apresentados por números inteiros − e variáveis contínuas − em que os 
valores são expressos em intervalos (LOESCH, 2015).
Cada variável pode ser organizada em tabelas, fornecendo clareza e objetivo, 
para ser utilizada em diversas análises matemáticas. As tabelas são conjuntos 
de dados dispostos em uma ordem de classificação, que é utilizada para sin-
tetizar os dados.
Para a representação de tabelas é necessário seguir a norma de apresentação 
tabular NBR 14724 de 1993. Essa norma tem como objetivo fixar os conceitos e 
procedimentos aplicáveis para a elaboração de tabelas de dados numéricos, 
de forma a garantir a clareza das informações apresentadas.
Variáveis Qualitativas – a cor da camisa pode assumir os valores branca, 
preta, azul, amarela e verde.
Variáveis Quantitativas Discretas – número de canetas produzidas.
Variáveis Quantitativas Contínuas – salários dos empregados de uma 
empresa. 
19
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
FIGURA 3: REPRESENTAÇÃO DE GRÁFICOS
Fonte: Plataforma Deduca (2019).
Como característica, toda a tabela deve 
possuir significado próprio (não sendo ne-
cessário consultar texto para compreen-
dê-la), deve ter numeração independente 
e consecutiva e deve ser colocada em po-
sição vertical. Além disso, as tabelas não 
devem ser fechadas nas laterais, mas em 
cima e embaixo com linhas horizontais.
1.3.1 SÉRIES ESTATÍSTICAS
As séries estatísticas são classificadas em temporal, geográfica e categórica.
Uma série temporal varia a época e mantém fixo o local e a categoria. Já na 
série geográfica há variação de local, mas o período e a categoria permane-
cem fixos, e na série categórica ou específica existe variação de categoria e o 
local e o período da análise são fixos.
Por fim, na série de distribuição em frequência existe uma série categórica que 
mantém o local e o período de análise fixos e é apresentada por intervalos.
Acesse a norma NBR 14724, 
disponível também no site 
do IBGE, pelo link: https://
biblioteca.ibge.gov.br/
visualizacao/livros/liv23907.
pdf
https://biblioteca.ibge.gov.br/visualizacao/livros/liv23907.pdf
https://biblioteca.ibge.gov.br/visualizacao/livros/liv23907.pdf
https://biblioteca.ibge.gov.br/visualizacao/livros/liv23907.pdf
https://biblioteca.ibge.gov.br/visualizacao/livros/liv23907.pdf
20
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
1.3.2 SÉRIES DE DISTRIBUIÇÃO EM 
FREQUÊNCIA
As variáveis quantitativas podem ser representadas por séries de distribuição 
em frequência. 
Essas séries são classificadas em:
• Séries de distribuição de frequência simples 
São usadas para representar dados com alta taxa de repetição e 
poucos dados distintos. Para construir séries de distribuição em 
frequência simples, ordene os dados distintos na coluna da variável 
discreta analisada e conte o número de vezes que os dados que se 
repetem aparecem e insira na coluna frequência (LOESCH, 2015, p. 14).
• Séries de distribuição de frequência em classe 
São usadas para representar dados de variáveis numéricas que 
possuem grande quantidade de dados e pouca repetição; neste caso, 
cria-se faixas de valores e conta-se as quantidades dentro da faixa 
(LOESCH, 2015, p. 15).
A distribuição de frequência em classes tem algumas características impor-
tantes que você deve considerar.
É importante identificar o valor máximo, que aqui será representado por maxx , 
e o valor mínimo, que será representado por minx .
Com os valores máximo e mínimo, você pode calcular a amplitude total que 
é dada por: max minA x x= − 
Um grande desafio é definir o número de classes e você pode utilizar a fórmu-
la de Sturges para calcular o número de classes: 101 3,322 logNc n= + ∗ 
Com o número calculado, você já pode encontrar a amplitude dos intervalos 
que será representado por Ai:
AAi
Nc
=
21
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
Agora já é possível identificar a quantida-
de de vezes em que os dados obtidos se 
encontram dentro das faixas estipuladas.
Para a representação das classes, utili-
zamos a notação que representa valores 
que estão compreendidos do valor até e 
os valores que são iguais ao valor são in-
cluídos na faixa, enquanto os valores que 
são iguais ao valor são excluídos da faixa.
Na tabela você pode inserir a frequência 
absoluta, representada por if , e a frequ-
ência relativa representada por rf . A frequência relativa é calculada por frequ-
ência absoluta dividido pelo número de elementos: i
r
ff
n
=
1.4 GRÁFICOS ESTATÍSTICOS
Os gráficos são formas de representar as informações utilizando ilustrações, 
formas e cores; são construídos a partir das tabelas e têm o objetivo de trazer 
uma compreensão mais rápida dos dados (COSTA, 2015, p. 83).
Os gráficos devem abranger três características:
• ser simples;
• ser claro;
• ser verídico.
Para a construção dos gráficos estatísticos, deve-se colocar o título e a fonte 
iguais aos da série de dados que você utilizou. Também é necessário que se 
utilize legendas para que a pessoa que irá analisar o gráfico não tenha que 
consultar a fonte de dados.
1.4.1 GRÁFICOS DE COLUNAS
Esse gráfico é representado por retângulos dispostos verticalmente, manten-
do-se iguais a largura e variando a altura, conforme a grandeza da variável 
que está sendo analisada.
A amplitude dos intervalos 
não precisa ser idêntica, 
podendo variar o valor final 
ou inicial.
22
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
1.4.2 GRÁFICOS DE BARRAS
Esse tipo de gráfico é representado por retângulos dispostos horizontalmen-
te, mantendo-se iguais a altura e variando a largura, conforme a grandeza da 
variável que está sendo analisada.
1.4.3 GRÁFICOS DE CURVAS
Esse gráfico é muito utilizado em séries temporais. Na abscissa eixo horizon-
tal, você deve inserir os períodos de análise enquanto que, no eixo das orde-
nadas, o valor da variável que você está analisando. Lembre-se que os pontos 
são interligados por linhas.
FIGURA 4: GRÁFICO DE CURVAS.
Fonte: Plataforma Deduca (2019).
1.4.4 GRÁFICOS DE SETORES
Esse gráfico, também conhecido como gráfico de pizza, divide os dados em 
setores, que são representados por um setor no círculo. Recomenda-se utili-
zar legenda.
23
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
FIGURA 5: GRÁFICO DE SETORES.
Fonte: Plataforma Deduca (2019).
1.4.5 HISTOGRAMA
O histograma é um gráfico de colunas sem espaçamento entre as colunas. 
No eixo das abcissas são colocadas as faixas de frequência e, no eixo das orde-
nadas, são colocadas as frequências.
1.5 MEDIDAS DE LOCALIZAÇÃO
As medidas de localização são númerosque apresentam o valor central de 
uma frequência. Essas medidas são:
• média; 
• mediana;
• moda.
24
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
1.5.1 MÉDIA
A média é a medida de localização mais utilizada e a representação da média 
é dada por x . O cálculo da média é realizado por:
1
1 n
i
i
x x
n =
= ∑
As propriedades da média são:
• a média de valores iguais é igual ao valor dos dados;
• se aumentar ou reduzir todos os valores em uma quantidade fixa C, a média 
também será aumentada ou reduzida em C;
• se multiplicar ou dividir todos os valores em uma quantidade fixa C, a média 
também será multiplicada ou dividida em C;
• a soma algébrica dos desvios em relação a média é nula.
1.5.2 MEDIANA
A mediana é uma medida de localização que divide a série ordenada exata-
mente ao meio.
Na mediana, 50% dos valores estão abaixo da mediana e 50% estão acima da 
mediana. Para obter a mediana, você deve ordenar os dados e depois pode 
aplicar as equações a seguir:
Se o número de dados é ímpar (1 )
2
nMe += , a mediana será o valor encontrado 
na posição encontrado em Me.
Já se o número de dados é par, então 
1
2 2
n nx x
Me
n
 +  
+
= .
25
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
1.5.3 MODA
A moda é o valor do conjunto de dados que aparece com maior frequência e 
é uma medida de concentração.
FIGURA 6: MAIOR CONJUNTO
Fonte: Plataforma Deduca (2019).
Considere os dados 3, 4, 6, 6, 7, 4, 5, 5, 5 para determinar a média e a 
mediana.
Para obter a média, você deve somar os valores de dados e dividir pelo 
número de observações.
3 4 6 6 7 4 5 5 5 5
9
x + + + + + + + += =
Para calcular a mediana, primeiramente vamos colocar os dados em 
ordem crescente: 3, 4, 4, 5, 5, 5, 6, 6, 7.
A posição da mediana pode ser obtida por 
1 9 5
2
Me += = 
3 4 4 5 5 5 6 6 7
Posição1 Posição2 Posição3 Posição4 Posição5 Posição6 Posição7 Posição8 Posição9
 O valor na posição é a mediana 5 e, no exemplo, o valor da mediana é 5. 
26
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
1.6 MEDIDAS DE DISPERSÃO
Com os valores de localização, encontramos quais os pontos centrais do con-
junto de dados analisado, porém esse tipo de medida não traz a informação 
da flutuação dos dados em relação a esses valores.
Para isso, utilizamos as medidas de dispersão, que são usadas para indicar o 
grau de variabilidade dos valores em torno da medida de localização.
1.6.1 AMPLITUDE TOTAL
A amplitude total é utilizada para determinar a faixa de variação em uma dis-
tribuição em frequência, que é a diferença entre o maior e o menor valor dos 
dados obtidos:
max minA X X= −
1.6.2 DESVIO PADRÃO
O desvio padrão é representado por duas formas:
• σ – Usado para representar o desvio padrão da população.
• s – Usado para representar o desvio padrão da amostra.
Para cálculo do desvio padrão de uma população, você deve utilizar a seguin-
te equação:
σ 2
1
1 ( )
n
i
i
x x
n
s
=
= −∑
Já para cálculo do desvio padrão de uma amostra, você deve utilizar a seguin-
te equação:
2
1
1 ( )
1
n
i
i
s x x
n =
= −
− ∑
27
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
1.6.3 COEFICIENTE DE VARIAÇÃO
O coeficiente de variação, representado pela sigla CV, é obtido dividindo-se o 
desvio padrão pela média. Em geral, esse valor é apresentado em porcenta-
gem e trata-se de uma medida adimensional:
100sCV
x
= ⋅
CONCLUSÃO
Esta unidade abordou o método estatístico, que é utilizado em pesquisas de 
opinião e na resolução de problemas com informações passadas aos gesto-
res, engenheiros e outros profissionais.
Você observou que o método estatístico passa por cinco fases distintas: pla-
nejamento, coleta de dados, organização de dados, exposição dos resultados 
e interpretação dos dados.
Com base nesse processo estatístico, você também pode, além de resolver 
problemas, após a análise dos dados identificar oportunidades para empre-
sas e processos.
Você também aprendeu a diferença entre população e amostra: na popula-
ção, você possui a informação de todos os envolvidos, enquanto que a amos-
tra representa apenas uma parte da população.
Além disso, verificou as formas de tabular os dados e as características e as 
normas das tabelas, as formas de representar séries estatísticas e as formas 
de construir gráficos.
Por fim, nesta unidade você também aprendeu a calcular a média, identificar 
a mediana e a moda utilizando as medidas de localização e a variação que 
esses dados possuem usando as medidas de dispersão.
28
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
> Compreender 
o conceito de 
probabilidade;
> Reconhecer o 
espaço amostral;
> Utilizar a técnica 
de contagem;
> Reconhecer 
e aplicar a 
probabilidade 
condicional;
> Utilizar e definir o 
teorema de Bayes;
> Reconhecer 
eventos 
independentes.
UNIDADE 2
OBJETIVO 
Ao final desta 
unidade, 
esperamos que 
você seja capaz 
de:
29
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
2 PROBABILIDADE
INTRODUÇÃO DA UNIDADE
Esta unidade abordará os conceitos de probabilidade, que se refere ao estudo 
da incerteza e dos eventos aleatórios.
Aqui, você verá como quantificar as chances e as possibilidades de ocorrer um 
resultado em uma situação.
No seu dia a dia, você já deve ter escutado ou lido leu algum termo que em-
pregava a probabilidade no contexto como, por exemplo, a previsão do tem-
po, que é geralmente fornecida como temperatura máxima, mínima além da 
a porcentagem de chance de chuva. 
Vamos lá!
2.1 INTRODUÇÃO À PROBABILIDADE
A probabilidade refere-se ao estudo da aleatoriedade e incerteza em uma si-
tuação em que diversos resultados podem ocorrer. Com a probabilidade, você 
tem métodos de quantificação das chances ou possibilidade de ocorrência 
associadas aos resultados (DEVORE, 2015, p. 45).
Por se tratar de um estudo de fenômenos aleatórios, para realizar a observa-
ção de tais fenômenos é necessário realizar um experimento aleatório, que 
possui as seguintes características:
W. Grosset foi o primeiro a estudar matematicamente o controle de 
qualidade e é conhecido por Student, no início do século XX.
Porém, apenas em 1930 os primeiros documentos de cunho prático e 
destinado a engenheiros e a difusão dos métodos na engenharia só 
iniciou durante a Segunda Guerra Mundial. 
30
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
Para exemplificar o conceito de fenômenos aleatórios, veja os exemplos a seguir:
Meteorologia – verificação da 
probabilidade de chover ou não.
Lançamento de uma moeda - 
verificação da probabilidade de 
cair cara ou coroa.
Não se sabe um valor do experimento antes de ser executado.
É possível descrever todos os possíveis resultados.
É possível identificar uma regularidade a medida que aumentamos o 
número de repetições do experimento. 
31
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
2.2 ESPAÇO AMOSTRAL E EVENTOS 
Segundo DEVORE, um experimento é qualquer atividade ou processo cujo 
resultado está sujeito à incerteza. 
Mesmo que um experimento sugira uma situação controlada de testes labo-
ratoriais, trabalharemos o experimento em um sentido amplo.
Os experimentos que realizaremos são ensaios os quais fazemos a atividade 
por diversas vezes e verificamos o resultado obtido.
Definido o experimento, podemos agora definir o conceito de espaço amos-
tral do experimento.
O espaço amostral de um experimento, representado por S ou Ω, é o conjun-to de todos os resultados possíveis desse experimento (DEVORE, 2015, p. 45).
Um evento é um subconjunto de S e é 
qualquer subconjunto de resultados con-
tidos no espaço amostral S. Pode ter as se-
guintes situações:
Simples – Se o evento 
consistir exatamente um 
único resultado.
Composto – Se ele consistir 
em mais de um resultado.
Lançamento de uma moeda: ao jogar uma moeda para 
cima 2 vezes, quais são as possibilidades?
O experimento é o lançamento da moeda duas vezes.
Considere o lançamento de uma moeda duas vezes. Os 
resultados que podem ser obtidos são o que representaremos 
por Ca e Coroa que representaremos por Co 
O espaço amostral é S = {CaCa, CaCo, CoCa, CoCo}
32
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
Um evento é um conjunto; assim, você pode utilizar as relações e resultados 
da teoria de conjuntos para estudo dos eventos.
Para isso, vamos utilizar algumas definições:
• Complemento de um evento A, é representado por A’ ou AC, é o conjunto de 
todos os eventos em S que não estão contidos em A.
FIGURA 1: COMPLEMENTO DE UM EVENTO A
S AC
A
Fonte: Elaborada pelo autor (2019).
• União de dois eventos A e B, representado por A ∪ B, deve ser lida como A 
união B, pois é o evento que consiste em todos os resultados que estão no 
evento A ou no evento B ou em A e B.
Um dado equilibrado é lançado, o espaço amostral é:
S = {1, 2, 3, 4, 5, 6}
Um evento A simples é o resultado ser 1, representamos por A = {1}
Um evento B composto é o resultado ser par, representamos por 
B = {2, 4, 6}
33
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
FIGURA 2: UNIÃO DE DOIS EVENTOS A E B.
S A∪B
A B
Fonte: Elaborada pelo autor (2019).
• Interseção de dois eventos A e B, representado por A ∩ B, deve ser lida como 
A interseção B, pois é o evento que consiste em todos os resultados contidos 
de forma simultânea em A e B.
FIGURA 3: INTERSEÇÃO DE A E B.
S A∩B
A B
Fonte: Elaborada pelo autor (2019).
34
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
2.3 TÉCNICA DA CONTAGEM
Quando os diversos resultados possuem a mesma probabilidade de um even-
to ocorrer, a tarefa de calcular a probabilidade se reduz a contagem (DEVORE, 
2015, p. 57).
Representado por N o número de resultados em um espaço amostral e repre-
sentado por N(A) o número de resultados contidos em um evento A, a proba-
bilidade de A é calculada por:
( )( ) N AP A
N
=
 
Para listas pequenas de resultados, você pode montar uma tabela com os 
valores e contar os resultados.
Porém, em muitos casos, o número de possibilidades é muito grande e torna-
-se inviável montar uma lista. Para resolver esses casos, vamos utilizar algu-
mas regras gerais da contagem.
2.3.1 REGRA DO PRODUTO PARA PARES 
ORDENADO
Se um conjunto consiste em pares ordenados de objetos e você deseja contar 
o número desses pares, um par ordenado pode ser compreendido por O1 e O2; 
se forem objetos o par (O1, O2), é diferente do para (O2, O1).
2.3.2 ARRANJOS E COMBINAÇÕES
Considere um grupo de n indivíduos ou objetos distintos. Aqui, vamos dar 
dois exemplos para que você possa pensar em quantas maneiras se pode es-
calar uma equipe para atuar em um determinado turno. 
Considere que você precisa encontrar para sua empresa 
um Engenheiro mecânico e um Engenheiro eletricista. 
Você recebeu 5 empresas com profissionais de Engenharia 
Mecânica e 3 de Engenharia Elétrica.
Segundo o definido na regra do produto de par ordenado, 
temos como resultado: N = (5)(3) = 15.
35
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
Primeiro exemplo: a empresa conta com 15 profissionais – em quantas formas 
podemos selecionar 9 profissionais para trabalhar com você?
Um segundo exemplo: sua empresa tem que vender 15 produtos, porém tem 
apenas 3 locais para expor os produtos. De quantas formas esses 3 produtos 
podem ser escolhidos?
No primeiro caso, você deve levar em consideração a posição e o equipamen-
to que será utilizado, por exemplo, fulano X vai trabalhar em um equipamen-
to, enquanto sicrano Y vai para outro equipamento.
No segundo caso, a ordem de exibição não é importante e isso acontece com 
frequência.
Nesses dois exemplos, temos aqui dois conceitos relacionados, que é o sub-
conjunto ordenado, que é chamado de arranjo, cujo número de arranjos de 
tamanho k pode ser criado a partir dos n indivíduos ou objetos em um grupo 
será representado por Pk,n . O tamanho pode ser calculado por:
,
!
( )!k n
nP
n k
=
−
 
Já um subconjunto desordenado é chamado de combinação e, para repre-
sentar a combinação, utilizamos Ck,n ou , em que você deve ler n tomados 
k a k e o tamanho pode ser calculado por:
 
1. Conjunto ordenado, representado por Pk,n e pode ser calculado por: 
,
!
( )!k n
nP
n k
=
−
2. Conjunto desordenado, combinação que é representado por e pode 
ser calculada por: .
2.4 PROBABILIDADE CONDICIONAL
Considere um experimento aleatório com seu espaço amostral S e A, B even-
tos em S. A probabilidade do evento B quando o evento A tiver ocorrido é re-
presentada por P (A|B) (LASC, 2015, p. 35), desde que P(A) > 0.
( )( | )
( )
P A BP B A
P A
∩=
36
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
Além da probabilidade condicional, é necessário definir a independência: dois 
eventos A e B de um espaço amostral S são independentes entre si quando:
( ) ( ). ( )P A B P A P B∩ =
Se essa igualdade não ocorrer, dizemos que as variáveis são dependentes en-
tre si.
2.5 TEOREMA DE BAYES
Considere A1, A2, A3, ..., Ak uma coleção de k eventos mutuamente exclusivos 
e exaustivos com probabilidade P(Ai) (i = 1, ..... , k). Então, para qualquer outro 
evento B para o qual P(B) > 0, a probabilidade de Aj dado que B ocorreu é:
 
Sejam A e B eventos de Ω tais que P(B)>0. Nestas condições são equivalentes:
a) A e B são independentes; 
b) ( )AP P A
B
  =  
.
Vamos supor que de todos os clientes de uma câmera de vídeo X, 60% 
incluíram um cartão de memória opcional na compra, 40% incluíram 
bateria extra e 30% um cartão e uma bateria. Considere uma seleção 
aleatória de um comprador sendo: A = {Compra do cartão de memória} 
e B = {Compra de bateria}, assim P(A)=0,60, P(B) = 0,40 e P (Compra de 
ambos) = P(A ∩ B) = 0,30. Dado que o cliente comprou uma bateria extra, 
a probabilidade de compra de um cartão é:
Qual a probabilidade do cliente que comprou o cartão de memória de 
adquirir uma bateria?
37
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
Demonstração: 
Dizer que a) e b) são equivalentes significa dizer que a) está para b) e b) está 
para a). 
I) Demonstração de a) para b).
Hipótese: A e B são independentes
Tese: ( )AP P A
B
  =  
 .
Prova:
)(
)()/(
BP
BAPBAP ∩= = (pela hip. de independência) = ( ). ( ) ( )
( )
P A P B P A
P B
= . 
II) Demonstração de b) para a) 
Hipótese: P(A/B) = P(A)
Tese: A e B são independentes. 
Prova: 
)( BAP ∩ = (por definição de (B)AP P
B
  =  
= (pela hipótese) = P(A) P(B).
2.6 EVENTOS INDEPENDENTES
A definição de dois eventos A e B são independentes se P(A|B) = P(A) e depen-
dentes em caso contrário (DEVORE, 2015, p. 74).
Sejam A e B eventos de Ω. A e B são ditos independentes se e somente se 
( ) ( ). ( )P A B P A P B∩ = .
Os eventos A, B e C de Ω são ditos independentes se e somente se:
( ) ( ). ( )P A B P A P B∩ = ; ( ) ( ). (C)P A C P A P∩ = ; (B ) (B). (C)P C P P∩ =
e (A ) (A).P(B). (C)P B C P P∩ ∩ = .
Generalize as definições anteriores para qualquer família finita de eventos.
Sejam A e B dois eventos mutuamente exclusivos, isto é, se um ocorrer o ou-
tro não pode ocorrer,com P(A) > 0. 
38
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
Por exemplo: uma fábrica produz veículos de quatro e seis cilindros. Se se-
lecionarmos aleatoriamente um veículo da linha de produção, sendo A = {o 
carro com quatro cilindros} e B = {o carro com seis cilindros}, são eventos mu-
tuamente exclusivos pois se B ocorrer, A não pode ter ocorrido, então P(A|B) = 
0 ≠ P(A).
Aqui, você pode concluir que se dois eventos forem mutuamente exclusivos, 
não podem ser independentes.
CONCLUSÃO
Esta unidade abordou os conceitos de probabilidade.
Você observou que a probabilidade realiza o estudo das incertezas e permite 
quantificar a possibilidade de um determinado evento ocorrer. Com base na 
probabilidade, você também pode verificar, além de eventos únicos, combi-
nações de eventos.
Você também aprendeu o significado de espaço amostral, onde são todas as 
possibilidades de resultados que pode ser obtido em um experimento alea-
tório.
Você também verificou as formas de calcular a probabilidade de eventos con-
dicionais.
Por fim, nesta unidade você também aprendeu a calcular a probabilidade de 
eventos independentes.
39
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
40
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
> Descrever as 
variáveis aleatórias 
discretas e 
contínuas;
> Reconhecer as 
funções;
> Identificar 
os modelos de 
distribuição.
UNIDADE 3
OBJETIVO 
Ao final desta 
unidade, 
esperamos que 
você seja capaz 
de:
41
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
3 VARIÁVEIS ALEATÓRIAS 
DISCRETAS E CONTÍNUAS
INTRODUÇÃO DA UNIDADE
Quando falamos de experimentos aleatórios podemos pensar, por exemplo, 
no lançamento de uma moeda. Este experimento, assim como outros, forne-
ce resultados numéricos.
De forma análoga, outros podem fornecer resultados não numéricos, todavia po-
demos associar números aos possíveis resultados gerados. Por exemplo, se o ex-
perimento for escolher um time da capital e registrar o número de títulos desse 
clube, teremos um conjunto numérico, porém se indagarmos sobre a série que 
ele acompanha num canal fechado, teremos um conjunto não numérico.
Muitas situações experimentais requerem a atribuição de um valor real x a 
todos os elementos do espaço amostral, assim vamos definir o conceito de 
variável aleatória.
E é nesta unidade que serão apresentadas os conceitos variáveis aleatórias 
discretas e contínuas uni e bidimensionais, esperança e variância, distribui-
ções de probabilidades discretas (binomial, hipergeométrica e Poisson), dis-
tribuição normal, as distribuições marginais, condicionais e independência 
como também as funções de variáveis aleatórias.
Vamos começar os nossos estudos?
3.1 ESPERANÇA MATEMÁTICA E VARIÂNCIA
A maioria das distribuições de probabilidades discretas e contínuas tem um 
valor esperado E(X) e uma variância V(X), que representam as medidas de ten-
dência central e de dispersão (LOESCH, 2015, p. 47).
42
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
O valor esperado é um número real representado por E(X) também conheci-
do como valor médio ou média de distribuição e pode ser calculado por:
Para entendermos como podemos realizar o cálculo da média de uma vari-
ável aleatória discreta, vamos continuar com o nosso exemplo anterior. Lem-
brando que, alguém quer lhe fazer companhia na viagem, mas está queren-
do saber, em média, quanto dias de chuvas teoricamente podem ocorrer.
A média de uma variável aleatória discreta é dada por:
Cada valor de “x” é ponderado por sua probabilidade ao longo 
da distribuição e o resultado representa a “média teórica” de um 
experimento de probabilidade.
A variância de uma variável aleatória discreta é dada por:
43
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
Utilizando a distribuição de probabilidade, vamos calcular a média 
dessa distribuição e apresentar uma conclusão para esta informação. 
Para o cálculo da variância vamos incluir uma nova coluna à direita que 
calcule o valor da variável aleatória X agora elevada ao quadrado.
TABELA 1: DISTRIBUIÇÃO DE PROBABILIDADE PARA CÁLCULO DA VA-
RIÂNCIA.
Dias de chuva, X Probabilidades X.P(X) X2.P(x)
0 0,216 0 0
1 0,432 0,432 0,432
2 0,288 0,576 1,152
3 0,064 0,192 0,576
Fonte: elaborado pelo próprio autor.
m 0, 432 2 0,( ) 0 . 0, 216 288 31 . . . 0,064 1,2E xm + + == = +
2 2 22 2 0, 4( ) 0 . 0,216 1 . .32 2 0, 288 3 0,064 2,. 16E x + + == +
s 2 22,16 (1,2) 0,72xs = - =
Como a distribuição ela é discreta, não podemos ter 1,2 dia de chuva e, 
então, teremos uma média teórica de 1 dia de chuva, aproximadamente. 
E uma variância de 0,72 dias de chuva
44
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
Os depósitos efetuados num determinado banco (em salário mínimo) são re-
presentados por uma v.a. contínua X com fdp dada abaixo. Um depósito é 
selecionado, ao acaso, dos depósitos referentes de um mês. Determine o valor 
esperado e a variância de depósitos.
No próximo assunto, vamos abordar os conceitos das distribuições de proba-
bilidades discretas, sendo primordial a apresentação desses conceitos ante-
riores para entendimento da disciplina.
A média para uma variável contínua X é dado por: 
A variância de uma variável contínua X é dada por: 
E assim, como na variância de uma variável aleatória discreta tínhamos 
que calcular o 
2(x )E assim o fazemos na contínua.
45
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
3.2 DISTRIBUIÇÕES HIPERGEOMÉTRICAS, 
BINOMIAL E DE POISSON
Nesse tópico descreveremos as distribuições de probabilidade discretas mais 
usuais. Para entendimento de cada conceito, serão feitos exemplos clássicos 
que utilizam moeda, urna, baralho, etc. Em cada exemplo apresentado serão 
explicitadas as características do experimento. Tais características são as fer-
ramentas necessárias para sabermos qual modelo se aplica a uma determi-
nada situação prática.
3.2.1 DISTRIBUIÇÃO BINOMIAL
Martins (2011) considera uma distribuição binomial como:
Trata-se de um modelo que dá a probabilidade do número de sucessos quan-
do são realizados n provas do mesmo tipo – o experimento é repetido n vezes. 
Cada experimento admite dois resultados – sucesso ou fracasso – com pro-
babilidade p de sucesso e 1 – p = q de fracasso, constantes em cada uma das 
provas (MARTINS, 2011, p. 160). Um experimento binomial é um experimento 
de probabilidade que preencha os seguintes critérios:
• O experimento é repetido por um número fixo de tentativas, onde cada 
tentativa é independente das outras;
• Há apenas dois resultados possíveis de interesse para cada tentativa.
Os resultados podem ser classificados como sucesso (p) ou fracasso (q), lem-
brando que a probabilidade de um sucesso (p) é a mesma para cada tentati-
va. Já a variável aleatória “x” contabiliza o número de tentativas com sucesso.
A função do cálculo de uma distribuição binomial de certo número y de su-
cessos em n provas é dada por:
46
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
TABELA 2: NOMENCLATURA DA DISTRIBUIÇÃO BINOMIAL.
Símbolo Descrição
n O número de vezes que uma tentativa é repetida
p A probabilidade de sucesso em uma tentativa única
q A probabilidade de fracasso em uma tentativa única (q = 1 – p)
x
A variável aleatória que representa a contagem dos números de sucessos 
nas tentativas:0, 1, 2, 3, ..., x n= .
Fonte: Martins (2019).
3.2.2 DISTRIBUIÇÃO HIPERGEOMÉTRICA
Segundo Morettin (2013), essa distribuição é adequada quando consideramos 
extrações casuais feitas sem reposição de uma população dividida segundo 
seus atributos.
Ou seja, se realizo uma extração e se essa extração não for resposta, significa 
que o espaço amostral foi afetado e, por isso, esta é uma característica desta 
distribuição.
Ao se fazer os testes, se não forem independentes, não podemos aplicar a 
distribuição de probabilidades binomiais para encontrar a probabilidade de x 
sucessos em n testes. Ela se difere da binomial, pois a probabilidade de suces-
so muda de um experimento para o outro. Essa distribuição é extremamente 
importante no contexto de amostragem sem reposição;
Cirurgias de microfraturas no joelho têm 75% de 
chance de sucesso em pacientes com joelhos 
degenerativos. A cirurgia é realizada em três 
pacientes. Encontre a probabilidade de a cirurgia 
ser um sucesso em exatamente dois pacientes. 
47
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
3.2.3 DISTRIBUIÇÃO DE POISSON
A distribuição de Poisson é largamente empregada quando se deseja contar 
o número de eventos de certo tipo que ocorrem num intervalo de tempo, ou 
superfície ou volume (MORETTIN, 2013).
A distribuição de Poisson é um experimento de probabilidade que deve pre-
encher os seguintes critérios:
• O experimento consiste em calcular o número de vezes, “x”, que um evento 
ocorre em um dado intervalo. Esse intervalo pode ser tempo, área ou volume.
• A probabilidade de o evento acontecer é a mesma para cada intervalo.
• O número de ocorrências em um intervalo é independente do número de 
ocorrências em outro intervalo.
Em uma caixa, há cinco peças boas e quatro defeituosas. 
São retiradas aleatoriamente três peças sem reposição. Qual 
a probabilidade de sair duas peças boas e uma defeituosa?
48
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
3.3 DISTRIBUIÇÃO NORMAL
Diversas variáveis aleatórias contínuas que descrevem fenômenos sociais e 
naturais apresentam em suas representações distribuições de probabilida-
des que se aproximam de uma distribuição normal.
A distribuição normal aparece na estatística por duas razões principais:
• Descreve muitas populações originais, pois não é difícil encontrar variáveis 
que se referem a fenômenos naturais ou sociais, como por exemplo 
inteligência, altura física de pessoas, erros de medida, comportamento etc.
• Descreve algumas distribuições amostrais importantes, em especial a da 
média amostral. Assim, a distribuição normal pode servir como a descrição 
de uma população original ou de uma distribuição amostral.
Vamos imaginar que conseguimos medir a altura dos alunos de um determi-
nado turno de uma instituição de ensino, e encontramos as seguintes infor-
mações: 150 2; 0 cc mm sm == .
De acordo com a distribuição normal, o valor que divide a curva ao meio (mé-
dia) vale 150 cm, ou seja, tenho 50% das informações para ambos os lados com 
um desvio de 20 cm para mais ou para menos. Se quisesse saber a probabili-
dade de encontrar alguém com uma altura de 170 cm, seria fácil. Basta pegar 
50% e adicionar mais 20% do desvio. Mas, e se quisesse saber a probabilidade 
para 183 cm? Aí a nossa situação muda, ou melhor, se torna difícil!
Para 183 cm não teríamos como definir a probabilidade de forma trivial já que 
este valor está compreendido entre 170 cm e 190 cm (2 desvios para mais (150 
+ 40)), ou seja, este valor está contido num intervalo contínuo.
A média do número de acidentes por mês em certa 
interseção é três. Qual é a probabilidade de que, em 
qualquer mês dado, quatro acidentes ocorram nesta 
interseção?
Usando x = 4 e a m = 3, a probabilidade que 4 acidentes 
aconteçam em qualquer mês dado na interseção é:
4 33 . P(4) 16,8%
4!
e-
= @
49
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
A v.a. X que toma todos os valores reais x- ¥ < < ¥ , tem uma distribuição nor-
mal (ou Gaussiana) se sua fdp é dada por:
2
2
( )
21( )
2
x
f x e
m
s
s p
-
-
=
Onde: 
2 em s são parâmetros da distribuição.
Vamos tentar calcular a ( 183)P X > usando a função da Distribuição Normal 
(percebam a dificuldade em resolvermos esta integral!):
2
2
(183 150)
2.20
183
1( 183) 
20 2
P X e
p
-¥ -
> = ò
FIGURA 1: HOMEM PENSANDO.
Fonte: Plataforma Deduca (2019).
Realmente, calcular a probabilidade desta altura ficou complicado! Mas, te-
nha calma!
Existe o conceito da normal reduzida que nos tira dessa enrascada e 
facilita o cálculo deste valor. Leia sobre normal reduzida em https:// http://
www.portalaction.com.br/probabilidades/62-distribuicao-normal.
http://www.portalaction.com.br/probabilidades/62-distribuicao-normal
http://www.portalaction.com.br/probabilidades/62-distribuicao-normal
50
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
3.4 VARIÁVEIS ALEATÓRIAS BIDIMENSIONAIS
De acordo com Morettin (2013), em muitas situações, ao descrevermos os re-
sultados de um experimento, atribuímos a um mesmo ponto amostral os va-
lores de duas ou mais variáveis aleatórias.
Considere o experimento E, que consiste no lançamento de dois dados:
seja x a variável aleatória que anota o número de pontos da face superior do 
primeiro dado;
seja y a variável aleatória que anota o número de pontos da face superior do 
segundo dado.
FIGURA 2: RESULTADOS DO LANÇAMENTO DE DOIS DADOS.
j J
x
y 1 2 3 4 5 6
i
1 (1,1) (1,2) (1,3) (1,4) (1,5) (1,6)
2 (2,1) (2,2) (2,3) (2,4) (2,5) (2,6)
3 (3,1) (3,2) (3,3) (3,4) (3,5) (3,6)
4 (4,1) (4,2) (4,3) (4,4) (4,5) (4,6)
5 (5,1) (5,2) (5,3) (5.4) (5,5) (5,6)
6 (6,1) (6,2) (6,3) (6,4) (6,5) (6,6)
Fonte: elaborado pelo próprio autor.
De forma geral, o elemento ( , )i ix y será denotado por ( , )i ix x y y= = , por exem-
plo, ( 2, 3)x y= = representa o elemento (2,3).
Dessa forma, a variável conjunta será representada por (x,y) e, de forma geral, 
o elemento ( , )i ix y será denotado por ( , )i ix x y y= = , por exemplo, ( 2, 3)x y= = 
que representa o elemento (2,3).
A probabilidade da variável conjunta será representada por P( , )i ix x y y= = e 
essa probabilidade deve atender as seguintes condições:
a. 0 P( , ) 1i ix x y y£ = = £
51
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
A probabilidade conjunta tem que ser maior e igual a zero e menor e igual a 
um, isto é, a probabilidade conjunta deve estar dentro deste intervalo.
b. P( , ) 1i ix x y y= = =å å
O somatório de todas as probabilidades conjuntas deve ser igual a um ou 
cem porcento.
Note que, o resultado encontrado é um resultado que está contido dentro do 
intervalo e que se somarmos todos os valores o resultado será rigorosamente 
igual a um.:
0 ( , ) ( , ) 1i i i ip x x y y e p x x y y£ = = = = =å å
No caso da variável conjunta (x,y) do exemplo anterior cada evento é 
independente e possui as seguintes probabilidades:
x y 1 2 3 4 5 6 p(x)
1 1/36 1/36 1/36 1/36 1/36 1/36 1/6
2 1/36 1/36 1/36 1/36 1/36 1/36 1/6
3 1/36 1/36 1/36 1/36 1/36 1/36 1/6
4 1/36 1/36 1/36 1/36 1/36 1/36 1/6
5 1/36 1/36 1/36 1/36 1/36 1/36 1/6
6 1/36 1/36 1/36 1/36 1/36 1/36 1/6
p(y) 1/6 1/6 1/6 1/6 1/6 1/6 1
A probabilidade de sair a face 1 do primeiro dado e do segundo num 
lançamento simultâneo é igual a 1/36, já que cada dado é um evento 
independente. P( 1, 1) 1/ 36x y= = =
Análogo as demais situações: ( 1, 2) 1/ 36,..., ( 6, 6) 1/ 36p x y p x y= = = = = =
52
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
FIGURA 4: PONTOS DE INTERROGAÇÃO.
Fonte: PlataformaDeduca (2019).
3.5 DISTRIBUIÇÕES MARGINAIS, 
INDEPENDENTES E CONDICIONAIS
3.5.1 DISTRIBUIÇÃO MARGINAL
Como o nome sugere é aquilo que está na margem, ou extremidade de uma 
distribuição. Veja que os valores em negrito na distribuição são as marginais 
tanto para X quanto para Y.
FIGURA 5: RESULTADO DOS LANÇAMENTOS DE DOIS DADOS.
x
y 1 2 3 4 5 6 p(x)
1 1/36 1/36 1/36 1/36 1/36 1/36 1/6
2 1/36 1/36 1/36 1/36 1/36 1/36 1/6
3 1/36 1/36 1/36 1/36 1/36 1/36 1/6
4 1/36 1/36 1/36 1/36 1/36 1/36 1/6
5 1/36 1/36 1/36 1/36 1/36 1/36 1/6
6 1/36 1/36 1/36 1/36 1/36 1/36 1/6
p(y) 1/6 1/6 1/6 1/6 1/6 1/6 1
Fonte: elaborado pelo próprio autor.
53
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
Para as distribuições de probabilidade marginal discretas de x chama-se 
( )iP X x= a função:
Para distribuição de probabilidade marginal discreta de y indica-se (Y )iP y= 
a função:
Já para as distribuições de probabilidade marginal contínua chama-se:
3.5.2 DISTRIBUIÇÃO INDEPENDENTE
Diremos que x e y são variáveis aleatórias independentes se para todo (xi,yi), se:
Ou seja, a probabilidade conjunta tem que ser igual ao produto de suas mar-
ginais.
No quadro exemplo anterior, podemos observar um exemplo de variáveis x e 
y independentes.
FIGURA 6: RESULTADO DOS LANÇAMENTOS DE DOIS DADOS.
x
y 1 2 3 4 5 6 p(x)
1 1/36 1/36 1/36 1/36 1/36 1/36 1/6
2 1/36 1/36 1/36 1/36 1/36 1/36 1/6
3 1/36 1/36 1/36 1/36 1/36 1/36 1/6
4 1/36 1/36 1/36 1/36 1/36 1/36 1/6
5 1/36 1/36 1/36 1/36 1/36 1/36 1/6
6 1/36 1/36 1/36 1/36 1/36 1/36 1/6
p(y) 1/6 1/6 1/6 1/6 1/6 1/6 1
Fonte: elaborado pelo próprio autor.
54
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
Esta distribuição mostra que X e Y são independentes, pois a probabilidade 
conjunta é rigorosamente igual ao produto de sua marginais.
3.5.3 DISTRIBUIÇÃO CONDICIONAL
Se a condição de independência não for satisfeita, ou seja, o valor da proba-
bilidade conjunta é diferente do produto de suas marginais significa que a 
relação é de dependência entre X e Y. Dessa forma:
Chama-se função de probabilidade condicional de y dado x e indica-se p(y = yi / 
x = xi) a função:
Chama-se função de probabilidade condicional de y dado x e indica-se p(x = xi / 
y = yi) a função:
FIGURA 7: DISTRIBUIÇÃO DE PROBABILIDADE
x
y 2 4 6 p(y)
1 0,05 0,08 0,05 0,18
3 0,18 0,17 0,05 0,40
5 0,25 0,07 0,20 0,42
p(X) 0,48 0,32 0,20 1,00
Fonte: elaborado pelo próprio autor.
Calcule:
55
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
3.6 FUNÇÕES DE VARIÁVEIS ALEATÓRIAS
Segundo Loesch (2015), em muitas circunstâncias, uma variável Y depende 
funcionalmente de outra variável aleatória X. Dada a característica de aleato-
riedade de X, isto é, o resultado de um experimento em particular depende do 
acaso, o mesmo ocorre para Y, que também deverá ser uma variável aleatória.
Considere o caso da corrida de táxi, em que o valor cobrado pelo taxista 
referente a uma corrida de X km rodados é Y 1,5X 2= + . Suponha X uma 
variável aleatória de fdp 
0,15( ) 0,15 Xf x e-= para 0x ³ e ( ) 0f x = para 0x <
.Encontrar a fdp de Y. Qual é a probabilidade de o taxista cobrar R$ 15,00 
ou mais por uma corrida aleatória?
Nesse caso a função de variável aleatória é ( ) 1,5 2H X X= + . por integrar 
( )f x , tem-se a fda 
0,15( ) 1 xF x e-= - para 0x ³ . então,
( 2)(a) ( ) ( ) (1,5 2 ) (1,5 2)
1,5
yG y P Y y P X y P X y P X
æ ö- ÷ç= £ = + £ = £ - = £ ÷ç ÷÷çè ø
( 2)0,15
1,5 0,1( 2)( 2) ( ) 1 1 2
1,5
y
yyG y F e e para y
æ öæ ö- ÷ç ÷ç ÷÷-ç ç ÷÷ç ç ÷÷ç ÷ç è øè ø - -æ ö- ÷ç= = - = - ³÷ç ÷÷çè ø
0,1( 2)( )( ) ( ) 0,1 ydG yb g y e
dy
- -= =
( ) ( ) 0 2 2c g y para y para y> > < , tem-se ( ) 0g y = , devido à 
impossibilidade de que o valor cobrado seja inferior à bandeirada 
de R$ 2,00. Então, para calcular a probabilidade solicitada, 
0,1(15 2)( 15) 1 ( 15) 1 (15) 0,2725 27,75%P Y P Y G e ou- -³ = - < = - = =
56
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
CONCLUSÃO
Nesta unidade passeamos sobre os conceitos de variáveis aleatórias discretas 
e contínuas, suas medidas, distribuições (uni e bivariada) e suas funções e essa 
temática contribui substancialmente para o desenvolvimento de competên-
cias que auxiliam nas construções de modelos para tomadas de decisão.
Uma variável aleatória é se o seu conjunto de valores possíveis é uma coleção 
de pontos isolados ao longo de uma linha numérica.
Uma variável aleatória é se o seu conjunto de valores possíveis inclui um inter-
valo completo de uma linha numérica.
A distribuição de probabilidade de uma variável aleatória discreta x dá a pro-
babilidade associada com cada possível valor x. Cada probabilidade é a fre-
quência relativa de longo prazo da ocorrência de um valor x correspondente 
quando o experimento aleatório é realizado um grande número de vezes. 
Quando examinamos as replicações independentes de um experimento biná-
rio, não estamos interessados (apenas) no resultado de um caso, mas no nú-
mero total de sucessos (ou falhas) chamamos de uma Distribuição binomial.
Alguns dados vêm de medidas em escalas essencialmente contínuas, tais 
como: temperatura, concentrações, etc. 
Na prática, eles são registrados com precisão limitada, mas em geral descon-
sideramos isso na modelagem (Não é o caso dos físicos ou químicos). 
Tais medidas terão usualmente um componente de variação aleatória, que as 
torna menos do que perfeitamente reproduzíveis. 
Contudo, estas flutuações aleatórias tenderão a seguir padrões – tipicamente 
vão se agrupar em torno de um valor central, com grandes variações, sendo 
mais raras do que as menores. 
Para modelar dados contínuos, precisamos definir variáveis aleatórias que po-
dem assumir os valores de quaisquer números reais.
E baseado nesses estudos que as organizações tomam decisões sobre even-
tos que já aconteceram e é dessa maneira que as ações definidas pela parte 
estratégica são tomadas e conduzidas.
57
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
58
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
> Definir e 
criar hipóteses 
estatísticas.
> Validar ou 
descartar as 
hipóteses criadas 
utilizando os testes 
de hipóteses
UNIDADE 4
OBJETIVO 
Ao final desta 
unidade, 
esperamos que 
você seja capaz 
de:
59
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
4 AVALIAÇÃO DE TESTES DE 
HIPÓTESES 
INTRODUÇÃO DA UNIDADE
No mundo globalizado atual, marcado por intensa concorrência entre indiví-
duos e organizações, é sabido que a tomada de decisão em nível empresarial 
ou pessoal é de fundamental importância para a sobrevivência.
FIGURA 1: A BUSCA DE INFORMAÇÕES É FUNDAMENTAL PARA A GESTÃO 
ORGANIZACIONAL.
Fonte: Plataforma Deduca (2019).
Especificamente falando, a todo momento gestores e decisores, num contex-
to geral, são bombardeados por um número exponencial de informações ou 
dados. Assim, o conhecimento e o domínio de técnicas, além dos métodos de 
análise quantitativa se torna um diferencial de mercado. Nessa direção, ob-
viamente, temos um alicerce muito mais propício para a tomada de decisão 
com confiabilidade.
60
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
FIGURA 2: O PROCESSO DE TOMADA DE DECISÃO COM BASE EM DADOS.
Fonte: Plataforma Deduca (2019).
Aqui, surge a estatística inferencial que realiza inferências sobre dados e infor-
mações mostrando caminhos mais coerentes e estruturados que podem nos 
levara realização do sucesso nas tomadas de decisões.
Portanto, esta unidade tem como objetivo apresentar algumas técnicas da 
estatística inferencial, como os testes de hipóteses, métodos de comparação 
de médias e testes paramétricos e não paramétricos. 
4.1 HIPÓTESE E PROCEDIMENTO DE TESTE
O que seria uma hipótese para você? Como poderia se utilizar de algum tipo 
de aparato para que possa comprovar que determinada hipótese é ou não 
verdadeira? Grosso modo, hipótese é sinônimo de afirmação e, dessa forma, 
no contexto atual a todo momento discutimos a veracidade ou não delas. 
Ilustrando, temos como exemplos típicos de hipóteses:
• Os usuários frequentes e os usuários eventuais de dado produto diferem em 
termos de características psicográficas.
• Uma dada empresa tem melhor imagem do que sua concorrente. 
Note sem grandes dificuldades que criamos hipóteses facilmente no contex-
to a ser estudado ou mensurado. 
61
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
FIGURA 3: A IMPORTÂNCIA DAS HIPÓTESES NA TOMADA DE DECISÃO GERENCIAL.
Fonte: Plataforma Deduca (2019).
Na inferência estatística, é habitual o uso de provas de significação ou conhe-
cidas popularmente por Provas de Contraste ou Provas de Decisão. 
Segundo Loesch (2015, p. 34), tais provas 
de decisão servem para caracterizar a 
existência de distinções entre grupos ou 
distribuições e à dependência entre gran-
dezas. Dessa forma, as provas de decisão 
têm como marco inicial a descrição das 
hipóteses estatísticas. As hipóteses es-
tatísticas são classificadas em: a Hipótese 
Nula (H0) e a Hipótese Alternativa (H1). A 
seguir, descrevemos de forma detalhada 
cada uma delas.
A Estatística Indutiva ou 
Inferência Estatística é 
a técnica que se origina 
no particular (amostra) 
e visa generalizar o geral 
(população).
62
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
De outra forma, temos que:
Nesse contexto, quando aceitamos H0 vemos que a diferença não é estatisti-
camente significativa. Contrariamente, a aceitação de H1 nos leva a entender 
que a diferença é estatisticamente significativa. Para a tomada de decisão em 
termos de H0 ou H1, definimos a região crítica como: 
Assim, deve ficar evidente que não podemos misturar as hipóteses estatís-
ticas com as hipóteses científicas, já que as hipóteses científicas são uma 
espécie de proposta de resolução do problema fundamentadas na teoria e 
A Hipótese Nula (H0) é uma declaração em que não se espera qualquer 
diferença ou efeito, assim se a hipótese nula não é descartada, não se 
realizará modificação alguma. 
A Hipótese Alternativa (H1) é uma declaração em que se espera 
qualquer diferença ou efeito, assim se a hipótese alternativa é aceita, 
deve-se modificar opiniões ou atitudes. 
A região crítica é a região ou zona de distribuição em que rejeitamos a 
hipótese nula.
63
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
podendo ser validadas com experimentos. A decisão à qual chegamos tem 
sempre relacionado a ela um risco de erro. Existem duas possibilidades de 
falsearmos, que ganham os nomes de erro de tipo I (com um risco ALFA a) e 
erro de tipo II (com um risco de BETA b). De acordo com Loesch (2015, p. 43), 
o nível de significação (a) é o risco de erro que estamos dispostos a declarar 
em caso de rejeitarmos H0. 
FIGURA 4: O RISCO ASSOCIADO A ACEITAÇÃO DAS HIPÓTESES ESTATÍSTICAS.
Fonte: Plataforma Deduca (2019).
Os valores mais usados são a = 0,05 (ou 5%), 0,01 (ou 1%), 0,10 (ou 10%). Logo, 
tomar a = 5%, temos 5% de erros possíveis no momento de rejeitarmos a hipó-
tese nula. De forma contrária, o grau de significação (p ou p-valor) é a proba-
bilidade de erro ao rejeitarmos a H0. Cientificamente falando, quanto menor 
for p, maior será a probabilidade de a hipótese nula ser falsa. A tomada de 
decisão em função de H0 ou H1 é dada por:
• Se p > a então aceitamos H0 (Região Viável);
• Se p ≤ a então rejeitamos H0 com p = (valor obtido), ou seja, aceitamos H1 
(Região Crítica).
64
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
4.2 TESTE COM RELAÇÃO À MÉDIA DA 
POPULAÇÃO
Frequentemente, devemos ou estimar a média de uma população ou até 
mesmo compararmos dois grupos ou amostras, ilustrando, quando um ge-
rente de produção de uma empresa deseja comparar a eficiência de dois tur-
nos de trabalho. Para o caso de uma amostra (amostra simples), o teste t com-
para a média de uma amostra com a média presumida conhecida de uma 
população. Dessa forma, tomando a média populacional por m e a estimativa 
x , logo o teste de hipótese aqui é descrito como H0 : x – m e H1 : x p m, ou 
equivalentemente, por H0 : x – m = 0 e H1 : x – m p 0. Vamos ver um exemplo.
Exemplo 1: Um pesquisador na área socioeconômica trabalha uma pesquisa 
para averiguação da taxa de desemprego em uma pequena cidade litorânea. 
Para tal, a partir de algumas informações, indicadores econômicos e simula-
ções, ele descreveu a taxa de desemprego nos últimos doze meses. Os dados 
são apresentados na Figura 3 a seguir. Nesse sentido, devemos testar a hipó-
tese nula de que a taxa de desemprego na região da cidade litorânea é equi-
valente a 12%, adotando a = 5%.
FIGURA 5: OS DADOS DO EXEMPLO.
Mês 1 2 3 4 5 6 7 8 9 10 11 12
Taxa 
(%)
10,95 12 11,8 10,9 11,7 11,2 11,89 12,01 13,02 10,99 11,75 12,04
Fonte: Elaborada pelo próprio autor (2019).
Solução: Neste caso, temos como hipóteses estatísticas, Hipótese nula (H0): 
Taxa de desemprego = 12% e Hipótese Alternativa (H1): Taxa de desemprego 
≠ 12%. Vamos implementar os resultados por meio do programa estatístico 
SPSS 24.0, em que a descrição de passos é mostrada nas ilustrações a seguir, 
sendo que a primeira nos descreve a inserção dos dados no programa.
65
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
FIGURA 6: A INSERÇÃO DOS DADOS NO PROGRAMA SPSS 24.0.
Fonte: Elaborada pelo próprio autor (2019).
A seguir, a resolução segue o caminho de selecionarmos na sequência as fun-
ções específicas do teste t para uma amostra no SPSS 24.0, que são: ANALI-
SAR > COMPARAR MÉDIAS > TESTE T PARA UMA AMOSTRA e, selecionando a 
variável taxa de desemprego (para variável teste), bem como inserindo o valor 
a ser testado (igual a 12), clicamos em OK para geração dos resultados. Em 
outra aba (interface de saída), ele nos gera os resultados conforme nos mostra 
a ilustração a seguir:
FIGURA 7: O RESULTADO DO TESTE T SIMPLES DO EXEMPLO.
Fonte: Elaborada pelo próprio autor (2019).
66
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
Observe que o p (p-valor ou grau de significação) comparece no SPSS com 
a nomenclatura (2. Sig duas extremidades), ou seja, no nosso caso P-valor = 
0,102 ou 10,2%. Assim sendo, concluímos que devemos aceitar a hipótese 
nula (pois p-valor = 0,102 > 0,05) e que a taxa de desemprego na cidade em 
questão pode ser estimada como sendo igual a 12%.
4.3 TESTES DE COMPARAÇÃO DE DUAS MÉDIAS
E se tivéssemos que comparar duas médias de duas amostras ou de dois gru-
pos? O que podemos fazer? Em verdade, podemos generalizar a argumen-
tação descrita anteriormente para uma amostra, ou seja, poderíamos utilizar 
mais uma vez o Teste t de Student, porém para duas amostras ou grupos. 
Grosso modo, temos dois casos a considerar. O primeiro caso é quando temos 
duas amostras emparelhadas ou pareadas, acontecendo exatamente quan-
do um mesmo grupo de indivíduos são mensurados duas vezes, por exemplo. 
Para o segundo caso, é quando tivermos duas amostras sem nenhuma asso-
ciação, ou seja, quando temos duas amostras independentes.
Exemplo 2: (Teste tpara Amostras Pareadas) (Adaptado de Loesch 2015, p. 
59) Da literatura, sabemos que motivação é um impulso que faz com que as 
pessoas atuem em prol de seus objetivos. Assim, um dado estudo quer verifi-
car se a motivação de um indivíduo ao término de um evento é similar à mo-
tivação que tinha perante o início do mesmo evento. Foram amostrados os 
dados de 20 indivíduos alicerçado em um treinamento relacionado a “clima 
empresarial”. Cada indivíduo foi mensurado segundo uma escala que variava 
de 0 a 50 por um método peculiar que caracterizava o seu grau de motivação 
para com o dado treinamento. Os dados estão dispostos na Figura 6. Pode-
mos declarar categoricamente que não existe diferença entre a motivação no 
início e ao final de tal treinamento envolvendo o clima empresarial?
Solução: Neste caso, temos como hipóteses estatísticas:
Hipótese nula (H0): Não existe diferença entre o grau de motivação dos in-
divíduos antes e após o treinamento, ou seja, o treinamento não atingiu as 
expectativas motivacionais de seus membros participantes. 
Hipótese Alternativa (H1): Existe diferença entre o grau de motivação dos 
indivíduos antes e após o treinamento, ou seja, o treinamento não atingiu as 
expectativas motivacionais de seus membros participantes. A implementa-
ção mais uma vez pode ser feita com base no programa SPSS 24.0. 
67
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
FIGURA 8: A INSERÇÃO DOS DADOS NO PROGRAMA SPSS 24.0.
Fonte: Elaborada pelo próprio autor (2019).
A seguir, a resolução segue o caminho das funções no SPSS 24.0, que são: 
ANALISAR > COMPARAR MÉDIAS > TESTE T PARA AMOSTRAS EM PARES. Em 
outra aba (interface de saída), os resultados gerados estão na Figura 7.
FIGURA 9: O RESULTADO DO TESTE T SIMPLES DO EXEMPLO.
Fonte: Elaborada pelo próprio autor (2019).
Assim, concluímos que como o p-valor = 0,000 ou 0% que é menor do que a = 
5%, podemos dizer que temos evidência para rejeitar a hipótese nula de que 
as médias entre as populações são iguais (aceitamos a hipótese alternativa), 
ou seja, temos evidências de que a média motivacional antes do treinamento 
é maior do que a média motivacional após o treinamento. Em outras palavras, 
fica evidenciado que a diferença aqui é significativa.
Para o caso relacionado a amostras independentes, o procedimento é seme-
lhante ao caso descrito para amostras emparelhadas. As hipóteses estatísti-
cas para o caso de independência entre as amostras possuem como hipótese 
nula a fala de que as médias dos dois grupos são iguais e para H1 descreve 
que as médias são distintas estatisticamente falando. A implementação no 
68
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
SPSS 24.0 segue os passos similares, exceto que aqui selecionamos ANALISAR 
> COMPARAR MÉDIAS > TESTE T PARA AMOSTRAS INDEPENDENTES.
4.4 TESTES DE COMPARAÇÃO DE DUAS 
DISTRIBUIÇÕES
Outro ponto interessante a ser abordado com relação aos testes de hipóteses 
é o contexto que relaciona duas distribuições de probabilidades. Desta forma, 
poderíamos indagar: como assim são duas distribuições de probabilidade 
com testes de hipóteses relacionados?
Isso mesmo, temos algumas situações cotidianas que demandam da utiliza-
ção de testes para que possamos efetuar um comparativo entre distribuições, 
sejam elas normais, binomiais ou de Poisson e assim por diante.
FIGURA 10: INTERPRETAÇÃO GEOMÉTRICA DO COMPARATIVO ENTRE DISTRIBUIÇÕES 
COM BASE NOS TESTES COMPARATIVOS.
Fonte: Plataforma Deduca (2019).
Salientamos que, nessa direção, podemos ter: teste para a diferença entre 
duas médias com base na distribuição normal de Gauss, teste da diferença 
entre duas médias utilizando as distribuições t de Student, teste de uma pro-
porção hipotética utilizando as distribuições binomiais e teste de uma pro-
porção hipotética utilizando a distribuição normal.
69
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
FIGURA 11: TESTES DE COMPARAÇÃO ENTRE DISTRIBUIÇÕES NORMAIS.
Fonte: Plataforma Deduca (2019).
Devemos ainda comentar, de modo adi-
cional, que todo esse aparato é funda-
mental para que possamos, por exemplo, 
determinar o tamanho de amostras espe-
cíficas para que simulações possam ser 
feitas em referência às médias, propor-
ções ou variâncias etc.
Particularmente, poderíamos empregar 
tal aparato para analisarmos os salários 
médios de duas companhias industriais 
(duas distribuições) com base em amos-
tras peculiares geradas, independente-
mente do tamanho delas. De outra forma, 
para as situações em que é necessário 
olharmos para a diferença entre duas mé-
dias é testada com base nas distribuições t de Student, temos a presença de 
uma suposição adicional, que é a de que as variâncias das duas distribuições 
ou populações sejam equivalentes.
A generalização do teste t, 
ou seja, para estudarmos 
a diferença envolvendo 
três ou mais amostras pela 
média utilizamos a Análise 
de Variância (ANOVA). Para 
mais detalhes, você pode 
pesquisar em Costa (2015, p. 
132 a 156). 
70
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
4.5 TESTE PARAMÉTRICO
Já sabemos que na inferência estatística procuramos descrever conclusões 
sobre um grande número de eventos alicerçados na observação de apenas 
uma parte deles. Assim, Loesch (2015, p. 62) afirma que, no desenvolvimento 
dos métodos das inferências estatísticas, as primeiras técnicas de estimação 
que apareceram foram exatamente aquelas focadas em diversas hipóteses 
sobre a natureza da população cujos dados ou informações eram retirados. 
FIGURA 12: OS TESTES ESTATÍSTICOS PARAMÉTRICOS SENDO APLICADOS NO COTIDIANO.
Fonte: Elaborada pelo próprio autor (2019).
Obviamente, como os valores coletados com a população são “parâmetros”, 
tais técnicas estatísticas são frequentemente denominadas paramétricas. 
Uma técnica de estimação pode ser alicerçada na hipótese de que as infor-
mações tenham sido coletadas de uma população normal ou, ainda, pode 
basear-se na hipótese de que dois conjuntos de informações tenham sido 
retirados de populações que apresentem a mesma variância populacional.
Parâmetro é uma característica numérica estabelecida para toda 
uma população, enquanto estimador é uma característica numérica 
estabelecida para uma amostra. 
71
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
De outro modo, de acordo com Loesch (2015, p. 64), é interessante pontuar-
mos que tais técnicas paramétricas são compostas por qualificadores. Assim, 
podemos dizer: “Se as hipóteses relativas à descrição da população (ou popu-
lações) são válidas, então concluímos que ...” A finalização aqui vai depender 
do contexto estudado. Por outro lado, no 
desenvolvimento da ciência dos dados ou 
da estatística propriamente dita, origina-
ram-se um crescente número de técnicas 
de estimação que não requerem hipóte-
ses muito numerosas ou densas sobre os 
parâmetros populacionais. Tais técnicas 
de acordo com Loesch (2015, p. 66) são ro-
tineiramente denominadas testes de dis-
tribuição livre ou técnicas não paramétri-
cas ou testes não paramétricos. 
Para o âmbito dos testes não paramétri-
cos, dizemos que suas conclusões apre-
sentam menos qualificações. Assim, por 
exemplo, com base na aplicação de um 
teste não paramétrico poderíamos dizer, por exemplo, que “autonomamente 
da descrição da população (ou das populações), concluímos que ...”. Veja a Fi-
gura 13 que compara testes paramétricos e não paramétricos. 
FIGURA 13: COMPARATIVO ENTRE OS TESTES PARAMÉTRICOS E NÃO PARAMÉTRICOS.
Testes Paramétricos Testes Não Paramétricos
- São testes conhecidos em linhas gerais por 
testes t.
- Exigem que a(s) amostras tenha(m) 
normalidade(principalmente se n < 30). 
- Para n > 30, a distribuição original é quase 
normal e então aplicamos a metodologia dos 
testes t. 
- Não precisam de quesitos tão fortes, 
como a normalidade.
- São também sugeridos para 
pequenas amostras. 
- São empregados quando a amostra 
possui uma distribuição que não é 
normal ou quando, n > 30, se escolhe 
por conclusões mais habituais 
(pesquisador mais previdente).
Fonte: Elaborada pelo próprio autor (2019).
A inferioridade dos testes 
não paramétricos reside 
no fato que não são tão 
potentes quanto os testes 
paramétricos, ou seja, com 
os testes não paramétricos 
não encontramos muitas 
distinções entre os dados, 
quando a diferença prevalece. 
72
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
4.6 TESTE DE VEROSSIMILHANÇA
Agora, poderíamos ser curiosos e num primeiro momento questionar: o que 
seria um teste de verossimilhança? Ou ainda: para que nos serve esse tipo de 
teste? Onde aplicamos? Primeiramente, devemos salientar que a terminolo-
gia “verossimilhança” significa nas entrelinhas algo que se assemelha ou está 
muito próximo a verdade. Podemos também usar os dizeres probabilidade, 
plausível ou provável para o lugar de verossimilhança. 
FIGURA 14: O SIGNIFICADO DO TERMO VEROSSIMILHANÇA.
Fonte: Elaborada pelo próprio autor (2019).
Segundo Loesch (2015, p. 132), o teste da razão verossimilhança é um teste de 
hipóteses que confronta a qualidade do ajustamento de dois modelos − es-
pecificamente falando, um modelo ilimitado com todos os parâmetros livres 
e o seu modelo limitado pela hipótese nula para um número menor de pa-
râmetros, para caracterizar qual presenteia um melhor ajuste para os dados 
coletados com base na teoria da amostragem. Assim, poderíamos utilizar do 
mesmo teste para averiguarmos a qualidade de ajustamento de uma distri-
buição exponencial para um parâmetro com a distribuição exponencial para 
dois parâmetros ilimitados. Com base na descrição dos testes de hipóteses 
comentada anteriormente, se acontecer do p-valor ser menor do que a = 5% 
ou 1% ou 10%, concluiríamos que o modelo para dois parâmetros ilimitados 
gera uma qualidade ao ajustamento estatisticamente significativo melhor do 
que a modelagem para um parâmetro dos seus dados amostrados.
73
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
Outro ponto a ser destacado é que, segundo Loesch (2015, p. 136), o processo 
de comparação é alicerçado na razão da função de verossimilhança com va-
lor máximo do modelo limitado para a função de verossimilhança com valor 
máximo do modelo que não possui nenhuma restrição ou limitação. Logica-
mente, se o valor desse quociente for moderadamente pequeno, concluímos 
que o modelo ilimitado se ajusta aos nossos dados amostrais melhor do que o 
modelo mais simples limitado pela hipótese nula H0. Particularmente falan-
do, se denotarmos pela letra grega λ o valor do quociente da verossimilhança 
para amostras infinitas (grandes amostras), ou seja, para n > 30, temos uma 
distribuição qui quadrado com graus de liberdade equivalentes à subtração 
entre a cardinalidade de parâmetros livres nos modelos ilimitado e limitado. 
Portanto, a implementação numérica para 
esse tipo de procedimento de teste de hi-
pótese pode ser realizada facilmente e de 
forma dinâmica no SPSS ou por outros pa-
cotes estatísticos, com base na caracteriza-
ção dos valores do p-valor relacionados ao 
teste da razão de verossimilhança da distri-
buição qui quadrado. 
A distribuição do qui 
quadrado é um teste voltado 
para a caracterização da 
independência entre duas 
variáveis ou grandezas, sendo 
adequado para grandezas 
que tenham escala de 
mensuração qualitativa.
74
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
CONCLUSÃO
Esta unidade teve como objetivo explicar, em linhas gerais, as principais infor-
mações acerca da teoria da tomada de decisão diretamente relacionada aos 
testes de hipóteses. Grosso modo, iniciamos a tratativa teórica da unidade 
com a apresentação das principais definições tais como hipóteses estatísticas, 
nível de significação e grau de significação, entre outros. Especificamente fa-
lando, a hipótese nula leva em consideração a igualdade, enquanto a hipóte-
se alternativa leva em consideração a diferença. Discutimos também sobre 
os testes ou provas de contrastes que têm como objetivo a comparação de 
médias. 
Para a estimativa de uma média ou de duas médias usamos o teste t, enquan-
to para três ou mais médias usamos a ANOVA. Além disso, temos o contexto 
envolvendo os testes para a comparação entre duas distribuições, que po-
dem ser realizados com base nas distribuições que comparecem em análise. 
Por fim, discutimos as particularidades e principais diferenças relacionadas 
aos testes paramétricos e não paramétricos, bem como descrevemos os tes-
tes de razão de verossimilhança.
75
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
76
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
> Definir estimadores não 
viciados;
> Identificar o valor 
esperado como estimador;
> Utilizar os estimadores 
com mínima variância;
> Identificar a proporção 
populacional;
> Utilizar a estimação por 
intervalo de confiança;
> Realizar a estimação 
de valores por máxima 
verossimilhança.
UNIDADE 5
OBJETIVO 
Ao final desta 
unidade, 
esperamos que 
você seja capaz 
de:
77
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
5 ESTIMATIVA PONTUAL
INTRODUÇÃO DA UNIDADE
Segundo Loesch (2015), o objetivo da Estatística Indutiva é obter conclusões 
probabilísticas sobre aspectos populacionais com base nos dados obtidos de 
amostras extraídas dessas populações. Os problemas da Estatística Indutiva 
podem ser divididos em dois grandes grupos: estimação de parâmetros e tes-
tes de hipóteses.
Morettin (2017) diz que a Inferência Estatística tem por objetivo fazer generali-
zações sobre uma população, com base nos dados de uma amostra. Pensan-
do nesse conceito, salientamos que há dois problemas básicos nesse processo: 
• Estimação de parâmetros; e
• Teste de hipóteses sobre parâmetros.
Para simplificar nosso entendimento: os parâmetros são funções de valores 
populacionais, enquanto que as estatísticas são funções de valores amostrais.
Para se ter uma ideia do que estamos falando, na grande maioria das situa-
ções, os valores de parâmetros populacionais são desconhecidos. Assim, esti-
mam-se os parâmetros populacionais mediante estatísticas calculadas.
Pode-se, por exemplo, usar a média amostral para estimar a média popula-
cional. Nesse caso, distinguem-se dois tipos de estimação:
• Por ponto: neste caso, um único valor será a estimativa do parâmetro 
populacional.
• Por intervalo: obtém-se um intervalo que contém, com certa probabilidade, 
o parâmetro populacional.
Nesta unidade, iremos discutir as ideias básicas sobre estimativa pontual. Para 
ilustrar, consideremos o exemplo seguinte.
78
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
5.1 ESTIMADORES NÃO VICIADOS
Segundo Montgomery (2018), um estimador deve estar “perto”, de algum 
modo, do valor verdadeiro do parâmetro desconhecido. Formalmente, dize-
mos que q̂ é um estimador não tendencioso de q , se o valor esperado de q̂ 
for igual a q . Isso é equivalente a dizer que a média da distribuição de proba-
bilidades de q̂ (ou a média da distribuição amostral de q̂ ) é igual a q .
O estimador q̂ é chamado não viciado, imparcial ou não tendencioso se seu 
valor esperado ou médio for igualao verdadeiro valor do parâmetro, q , isto é:
)( ˆE q q=
Caso o estimador q̂ seja viciado, parcial ou tendencioso, então a diferença
)( ˆE q q-
É chamada de tendência.
Concluímos que, se o estimador q̂ não for tendencioso, a tendência é ZERO, 
ou seja:
ˆ)(E q q q- =
Por analogia com experimentos químicos ou bioquímicos, o vício corresponde 
ao “erro sistemático” ou “erro do método”. Um químico pode usar determinado 
método para o qual os resultados obtidos, em experimentos repetidos, podem 
ser muito próximos um do outro, mas, em média, não dão a resposta correta. 
FIGURA 1: EXPERIMENTOS QUÍMICOS OU BIOQUÍMICOS.
Fonte: Plataforma Deduca (2019).
79
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
Morettin (2017) diz que, em algumas situações, podemos ter mais de um esti-
mador para um mesmo parâmetro e desejamos saber qual deles é “melhor”. 
O julgamento pode ser feito analisando as propriedades desses estimadores. 
Vejamos um exemplo.
A média amostral X é um estimador não viciado da média da 
população, ( )E X m= , e ˆ( )E p p= , ou seja, a proporção estimada p̂ é um 
estimador não viciado de p. Por outro lado, o estimador da variância da 
população:
2 2
1
1 ( )
n
i
i
x x
N
s
=
= -å dado por 
2 2
1
1ˆ ( )
n
i
i
x x
N
s
=
= -å
é viciado, pois, como pode ser demonstrado, 
2 2 2 21 1ˆ( ) nE
n n
s s s s
-
= = - onde 
2 21( )b
n
s s= -
.
Tomando-se o estimador “ajustado” 2 2 2
1
1 1ˆ ( )
1
n
ii
n s x x
n n
s
=
-
= = -
- å , 
então s2 é um estimador não viciado para 2ŝ , porque
2 2 2 21 ˆ ˆ(s ) ( )
1
n nE E E
n n
s s s
æ ö- ÷ç= = =÷ç ÷çè ø -
80
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
 Morettin (2017) traz um exemplo que explica bem o conceito, vejamos. 
Desejamos comprar um rifle e, após algumas seleções, restaram quatro 
alternativas, que chamaremos de rifles A, B, C e D. Foi feito um teste com 
cada rifle, que consistiu em fixá-lo num cavalete, mirar o centro de um 
alvo e disparar 15 tiros. Os resultados estão ilustrados na figura abaixo:
Figura 2: resultados de 15 tiros dados por 15 rifles.
Fonte: Morettin (2017).
Para analisar qual a melhor arma, podemos fixar critérios. Por exemplo, 
segundo o critério de “em média acertar o alvo”, escolheríamos as 
armas A e C. Segundo o critério de “não ser muito dispersivo” (variância 
pequena), a escolha recairia nas armas C e D. A arma C é aquela que 
reúne as duas propriedades e, segundo esses critérios, seria a melhor 
arma. Mas, se outro critério fosse introduzido (por exemplo, menor 
preço), talvez não fosse a arma escolhida. Muitas vezes, a solução deve 
ser um compromisso entre as propriedades.
Esse exemplo também nos permite introduzir os conceitos de acurácia 
e precisão. A acurácia mede a proximidade de cada observação do valor 
alvo que se procura atingir. A precisão mede a proximidade de cada 
observação da média de todas as observações.
Desse modo, podemos descrever cada arma da seguinte maneira:
Arma A: não viesada, pouco acurada e baixa precisão. 
Arma B: viesada, pouco acurada e baixa precisão. 
Arma C: não viesada, muito acurada e boa precisão. 
Arma D: viesada, pouco acurada e alta precisão.
81
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
Obter um estimador não tendencioso de um parâmetro q é, em geral, uma 
tarefa bastante fácil, dado que as componentes de uma amostra são identica-
mente distribuídas. Nessas condições, podemos definir muitos estimadores 
não tendenciosos para o parâmetro m, média da população X.
5.2 VALOR ESPERADO
FIGURA 3: VALOR ESPERADO DE VENDAS.
Fonte: Plataforma Deduca (2019).
Segundo Loesch (2015), o melhor estimador para o valor esperado é a média 
amostral, tanto na situação de amostragem com reposição quanto na amos-
tragem sem repetição de uma população finita.
1. Com reposição: independência entre os dados. ( ) (X)E X E= , e assim X é 
um estimador justo para (X)E . Além disso,
2. Sem reposição: população finita. ( ) (X)E X E= , e assim X é um estimador 
justo para (X)E . 
A variância é calculada por
()
2
1
N nV E
n N
s æ ö- ÷ç= ÷ç ÷çè ø-
e atinge o valor 0 quando n alcança seu valor máximo N. 
Pode-se também demonstrar que X é o estimador de (X)E mais eficien-
te. Outros estimadores, como mediana e moda, poderiam ser considerados. 
82
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
Para populações simétricas a média e a mediana coincidem, e a mediana da 
amostra é um estimador justo da média da população. A consistência tam-
bém se verifica, no entanto, sua eficiência é apenas da ordem de 64% da efi-
ciência da média amostral (eficiência relativa = 0,64).
O melhor estimador da média populacional m é a média amostral x , pois 
trata-se de um estimador justo e consistente:
• Justo porque o valor esperado da média amostral será a média populacional;
• Consistente porque se o tamanho da amostra n tender ao infinito a variância 
da média amostral (do Estimador) tenderá a zero.
83
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
Reconsidere as 20 observações seguintes que tratam sobre a voltagem 
de rompimento dielétrica de peças de resina de epóxi.
Figura 4: Dados.
Fonte: DEVORE (2018, p. 232).
O padrão no gráfico de probabilidade normal mostrado é bastante 
reto; assim, assumimos que a distribuição da voltagem de quebra é 
normal com valor médio m. Em virtude de as distribuições normais 
serem simétricas, também m é a vida mediana útil da distribuição. As 
observações dadas são, então, assumidas como o resultado de uma 
amostra aleatória 1 2 20, ,...,x x x dessa distribuição normal. Considere os 
seguintes estimadores e estimativas resultantes para m:
Estimador Estimativa Resultado
X
ixx
n
= å 555,86 27,79320x = =
X%
1 2( )
2
C Cx +=% (27,94 27,98) 27,96
2
x += =%
(10)trX (10)trx (10)
555,86 24,46 25,61 29,50 30,88
16
27,838
trx
- - - -
=
=
Fonte: Elaborada pelo próprio autor (2019).
84
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
Para Devore (2018), cada um dos estimadores utiliza uma medida diferente 
do centro da amostra para estimar m. Qual das estimativas está mais próxima 
do valor real? Esta questão não pode ser respondida sem saber o valor real. 
Uma pergunta que pode ser respondida é: “Que estimador, quando usado 
em outras amostras dos Xi, tenderá a produzir estimativas mais próximas do 
valor real?”. Consideraremos em breve esse tipo de pergunta.
5.3 ESTIMADORES COM MÍNIMA VARIÂNCIA
Para explicar o conceito sobre os estimadores com mínima variância, vamos re-
lembrar o exemplo que foi apresentado no Capítulo 1, citado por Morettin (2017).
Desejamos comprar um rifle e, após algumas seleções, restaram quatro 
alternativas, que chamaremos de rifles A, B, C e D. Foi feito um teste com 
cada rifle, que consistiu em fixá-lo num cavalete, mirar o centro de um 
alvo e disparar 15 tiros. Os resultados estão ilustrados na Figura abaixo:
Figura 5: resultados de 15 tiros dados por 15 rifles.
Fonte: Morettin (2017).
Para analisar qual a melhor arma, podemos fixar critérios. Por exemplo, 
segundo o critério de “em média acertar o alvo”, escolheríamos as armas A 
e C. Segundo o critério de “não ser muito dispersivo” (variância pequena), 
a escolha recairia nas armas C e D. A arma C é aquela que reúne as duas 
propriedades e, segundo esses critérios, seria a melhor arma. 
85
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
Vamos tratar do assunto falando sobre o segundo critério de escolha,mas 
apenas quanto a variância!
Queremos decidir qual arma comprar em relação a menor dispersão, ou seja, 
menor variância. Perceba que tanto o alvo C quanto o D apresentam marca-
ções bem próximas umas das outras, o que significa que ambas possuem 
menor variância.
Entretanto, a escolha deve ser mutuamente excludente e é preciso decidir 
qual o melhor rifle, ou seja, o rifle mais eficiente. Os critérios de imparcialida-
de (ser não tendencioso) e mínima variância não podem ser considerados 
separadamente, já que o objetivo é comprar um rifle que “em média acerte o 
alvo” e “não ser muito dispersivo” já que uma estimativa levemente tenden-
ciosa com uma pequena variância pode ser preferível a uma estimativa não 
tendenciosa mas com grande variância.
Por isso, decidiríamos pelo rifle C!
FIGURA 6: AVALIAÇÃO DOS DADOS POR MENOR VARIÂNCIA.
Fonte: Plataforma Deduca (2019).
Se esta condição ocorre para todo valor do parâmetro pertencente ao espaço 
paramétrico W, o estimador é denominado uniformemente não tendencioso 
com variância mínima.
Então, podemos concluir que o estimadores com mínima variância são aque-
les que apresentam a menor variabilidade possível entre os experimentos.
86
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
5.4 PROPORÇÃO POPULACIONAL
FIGURA 7: PROPORÇÃO POPULACIONAL.
Fonte: Plataforma Deduca (2019).
Caso se queira estimar a proporção p de elementos da população (ou proba-
bilidade p, quando se fala em distribuições), usa-se como estimador a frequ-
ência relativa: 1
if Xx
æ ö÷ç= ÷ç ÷çè øå
De acordo com a definição de estimadores não viciados, o valor esperado é:
( )E f p=
Portanto, o estimador f é justo para a proporção p. Já a variância de f é:
(1 )( ) p pVar f
n
-
=
cujo limite é 0 quando n tende ao infinito, mostrando que o estimador f é 
também consistente. Além disso, esse estimador também é o mais eficiente.
A proporção amostral p̂ é a melhor estimativa pontual da proporção popula-
cional p.
ˆ xp
n
=
87
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
5.4.1 MARGEM DE ERRO DA ESTIMATIVA P
2
ˆ ˆ(1 )p pErro Z
na
-
= ´
5.4.2 INTERVALO DE CONFIANÇA PARA A 
PROPORÇÃO POPULACIONAL
ˆ ˆp E p p E- < < +
5.4.3 TAMANHO DA AMOSTRA PARA ESTIMAR 
A PROPORÇÃO P DE UMA POPULAÇÃO 
INFINITA
Segundo Martins (2019), se a variável escolhida for nominal ou ordinal e a po-
pulação considerada infinita, você poderá determinar o tamanho da amostra 
pela fórmula: 2
2
2
ˆ ˆZ p q
n
d
a ´ ´
=
Vamos imaginar que uma instituição de ensino possua 
1.000 alunos matriculados no turno da manhã. Desses 
alunos, 350 são meninos. Determine a proporção de 
meninos.
350ˆ 0,35
1.000
p = =
Suponha que a variável escolhida em um estudo seja a 
proporção de eleitores favoráveis ao candidato X e que 
o investigador tenha elementos para suspeitar que essa 
porcentagem seja de 30%. Admitir a população infinita, 
um nível de confiança de 99% e um erro amostral de 2% 
(ou seja, que a diferença entre a verdadeira proporção de 
eleitores do candidato X e a estimativa a ser calculada na 
amostra seja no máximo de 2%). (MARTINS, 2019) Assim:
2
2
2,57 0,30 0,70 3.467,57 3.468
0,02
n ´ ´= = @
88
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
5.4.4 TAMANHO DA AMOSTRA PARA ESTIMAR 
A PROPORÇÃO P DE UMA POPULAÇÃO FINITA
Segundo Martins (2019) se a variável escolhida for nominal ou ordinal e a po-
pulação finita, teremos: 2
2
2 2
2
ˆ ˆ
ˆ ˆ( 1)
Z p q N
n
d N Z p q
a
a
´ ´ ´
=
- + ´ ´
5.5 ESTIMAÇÃO POR INTERVALO DE CONFIANÇA
FIGURA 8: INTERVALOS DE CONFIANÇA.
Fonte: Plataforma Deduca (2019).
Segundo Martins (2019), uma estimativa por intervalo para um parâmetro po-
pulacional é um intervalo determinado por dois números, obtidos a partir de 
elementos amostrais, que se espera contenham o valor do parâmetro com 
dado nível de confiança ou probabilidade de (1 – a)%.
Admitir os mesmos dados do exemplo anterior e que a 
população de eleitores seja finita de 20.000 eleitores. Logo 
(MARTINS, 2019):
2
2 2
2,57 0,30 0,70 20.000 2.955,33 2,956
0,02 (20.000 1) 2,57 0,30 0,70
n ´ ´ ´= = @
- + ´ ´
89
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
O intervalo [1,60 m; 1,64 m] contém a altura dos moradores do município 
X, com nível de confiança de 95%;
Com 97,5% de confiança, o intervalo [8%; 10%] contém a proporção de 
analfabetos da cidade Y;
O intervalo [37 mm; 39 mm] contém o desvio-padrão do comprimento 
de uma peça, com 90% de confiança.
5.5.1 INTERVALO DE CONFIANÇA PARA 
A MÉDIA POPULACIONAL (m) QUANDO A 
VARIÂNCIA É CONHECIDA (s2)
Como sabemos, verificamos que o estimador de m é X e a distribuição de 
probabilidade de X para populações infinitas é dada por Martins, (2019):
2
;dX
n
s
m
æ ö÷ç ÷= ç ÷ç ÷çè ø
E para populações finitas: 2;
1
d N nX
n N
s
m
é ùæ ö- ÷çê ú= ÷ç ÷çê úè ø-ë û
Assim, para o caso de populações infinitas, a variável normal padronizada de 
X será:
/
XZ
n
m
s
-
=
FIGURA 9: CURVA NORMAL. 
Fonte: Morettin (2017)
90
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
Usando-se a tabela da distribuição N(0,1), pode-se determinar um valor 
2
Za , 
tal que: 
E a equação é:
2 2
1P Z Z Za a a
æ ö÷ç ÷- < < = -ç ÷ç ÷çè ø
2 2
1P X Z X Z
n na a
s s
m a
æ ö÷ç ÷- < < + = -ç ÷ç ÷çè ø
Em que:
2 2
 X Z a e X Z b
n na a
s s
- = + =
2
erro padrão da média 
Denomina se
erro da estimativa da média
xn
Z
na
s
s
s
ìïï = =ïïï- íïï =ïïïî
Se 1 0,95a- =
1,96 1,96 0,95P X X
n n
s s
m
æ ö÷ç - < < + =÷ç ÷÷çè ø
5.5.2 INTERVALO DE CONFIANÇA PARA 
A MÉDIA POPULACIONAL (m) QUANDO A 
VARIÂNCIA É DESCONHECIDA (s2)
Segundo Martins (2019), quando temos pequenas amostras e não conhece-
mos o valor do desvio padrão populacional, podemos construir intervalos de 
confiança para a média. Para tanto, é necessário que a população de onde foi 
extraída a amostra aleatória tenha distribuição normal.
Quando s é desconhecido, precisamos substituí-lo por s (desvio-padrão amos-
tral) que, contrariamente a s, é uma variável aleatória. Então, o estimador:
/
xt
s n
m-
=
tem uma distribuição t de Student com ( 1)n - graus de liberdade.
91
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
Grau de liberdade (gl) conceitua-se como o número de valores independen-
tes de uma estatística. Tomando como exemplo o estimador s2 de 2s , foi visto 
anteriormente que a quantidade ( 1)n - é o divisor que aparece na fórmula de 
s2.
Pode-se concluir da distribuição t, que:
2 2
1
/
xP t t
s na a
m
a
æ ö- ÷ç ÷- < < = -ç ÷ç ÷çè ø
Substituindo o valor de t, e resolvendo as inequações para m, obtemos o inter-
valo para média, quando a variância 
2( )s é desconhecida:
2 2
1s sP X t X t
n na a
m a
æ ö÷ç ÷- < < + = -ç ÷ç ÷çè ø
5.5.3 INTERVALO DE CONFIANÇA PARA 
PROPORÇÃO
Segundo Martins (2019), para amostras suficientemente grandes (n >30), a 
distribuição amostral de ˆ /f p x n= = é aproximadamente normal com média 
p, isto é:
( ) ( )
(1 ) :f f
p pp e desvio padrão dado por
n
m s
-
= - =
Em síntese, para grandes amostras:
(1 ); 
(1 )
d if pp pf p ou Z
n p p
n
æ ö -- ÷ç= =÷ç ÷çè ø -
2 2
1
(1 )
x npP Z Z
np pa a
a
æ ö- ÷ç ÷ç- < < = -÷ç ÷÷ç -è ø
Já em um intervalo com (1 )a- de confiança aproximado para p é obtido ao 
escrevermos como:
2 2
(1 ) (1 )ˆ ˆ 1p p p pP p Z p p Z
n na a
a
æ ö- - ÷ç ÷- < < + = -ç ÷ç ÷÷çè ø
92
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
5.6 ESTIMAÇÃO POR MÁXIMO 
VEROSSIMILHANÇA
O Novo Dicionário Aurélio daLíngua Portuguesa (2ª edição, p. 986) define 
verossímil (ou verossimilhante) aquilo que é semelhante à verdade, provável, 
e verossimilhança (ou verossimilidade ou ainda verossimilitude) à qualidade 
ou caráter de verossímil (MORETTIN, 2017).
Segundo Morettin (2017), o princípio da verossimilhança afirma que devemos 
escolher aquele valor do parâmetro desconhecido que maximiza a probabili-
dade de obter a amostra particular observada, ou seja, o valor que torna aque-
la amostra a “mais provável”.
O uso desse princípio conduz a um método de estimação pelo qual se 
obtêm os chamados estimadores de máxima verossimilhança que, em geral, 
têm propriedades muito boas. Esse princípio foi enunciado por Fisher pela 
primeira vez em 1912 e, em 1922, deu-lhe forma mais completa, introduzindo 
a expressão “likelihood” (verossimilhança) (MORETTIN, 2017, p. 312).
Suponha que temos n provas de BERNOULLI COM 
2( ) (2 1 ) (1 )L p P sucessos e fracasso p p= = -2( ) (2 1 ) (1 )L p P sucessos e fracasso p p= = -2( ) (2 1 ) (1 )L p P sucessos e fracasso p p= = -( ) , 0 1 P sucesso p p e X número de sucessos= < < = . Devemos tomar como 
estimador aquele valor de p que torna a amostra observada a mais 
provável de ocorrer.
Suponha, por exemplo, que 3n = e que obtemos dois sucessos e um 
fracasso. A função de verossimilhança é
2( ) (2 1 ) (1 )L p P sucessos e fracasso p p= = - .
Maximizando essa função em relação a p, obtemos
2'( ) 2 (1 ) 0 (2 3 ) 0L p p p p p p= - - = ® - = , do que seguem 0p = ou 2 / 3p = . 
É fácil ver que o ponto máximo é ˆ 2 / 3p = , que é o estimador de máxima 
verossimilhança (EMV) de p.
De modo geral, o EMV do parâmetro p de uma distribuição binomial é
ˆ
'MV
Xp
n
=
93
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
A função de verossimilhança é definida por
1 1( ; ,..., ) ( ; ),..., ( ; )n nL x x f x f xq q q= ,
que deve ser encarada como uma função de q . O estimador de máxima ve-
rossimilhança de q é o valor 
ˆ
MVq que maximiza 1( ; ,..., )nL x xq .
Se indicarmos por 1( ,..., ) 'nx x x= o vetor contendo a amostra, é costume deno-
tar a verossimilhança por L( / )xq .
Segundo Martins (2019), o método da máxima verossimilhança é usado para 
desenvolver um modelo de regressão que possa prever o logaritmo da ra-
zão L. Esse modelo pode ser expresso como:
0 1 1 2 2ln( ) i i k ki iL X X X Ub b b b= + + + ×××+ +
Onde:
k é o número de variáveis independentes do modelo; e
Ui é o erro aleatório da observação i.
Para amostra de dados dessas variáveis, teremos:
0 1 1 2 2ln(valor estimado de )i i i k kiL b b X b X b X= + + + ×××+
E o valor estimado de L será:
ln(valor esperado de )LL e=
Uma vez obtido L, a probabilidade estimada de sucesso será:
1
L
L+
Será apresentado um exemplo de Martins (2019) para clarear o conceito expli-
cado anteriormente.
94
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
O Departamento de Marketing de uma empresa de cartões de crédito 
pretende lançar uma campanha para que seus usuários com padrão 
standard mudem para um padrão mais elevado, oferecendo um 
desconto para a taxa anual do novo cartão.
Para uma amostra de 30 clientes com o padrão standard, foram medidas 
as variáveis:
Y: mudaria para o novo cartão (0 = não, 1 = sim);
X1i: total de gastos no ano anterior: US$;
X2i: possui cartão adicional (0 = não, 1 = sim).
Deseja-se uma estimativa de compra do novo cartão para um cliente 
com gastos de US$ 36 mil e 1 cartão adicional.
Com uso do pacote Statistix para a regressão logística, obtiveram-se as 
seguintes estimativas:
b0 = – 6,92923
b1 = 0,13925
b2 = 2,77118
Considerando X1 = 36 e X2 = 1, teremos:
logo:  0,85495 2,3513L e= = .
Então, a probabilidade de compra (mudança) será de:
Ou seja, 70,16% é a probabilidade estimada de compra (mudança) para 
o novo cartão de um cliente com gastos de US$ 36.000 que possui um 
cartão adicional.
95
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
CONCLUSÃO
Segundo Martins (2019), o objetivo da Estatística é conhecer populações por 
meio de informações amostrais. Como as populações são caracterizadas por 
medidas numéricas descritivas, denominadas parâmetros, a estatística diz res-
peito à realização de inferência sobre parâmetros populacionais desconhecidos.
E, nesse tópico, tivemos a oportunidade de conhecer os estimadores não vi-
ciados, conhecer o valor esperado dos estimadores, conhecer com é impor-
tante a tomada de decisão usando os estimadores de mínima variância, os 
conceitos sobre intervalos de confiança e de proporções e, por fim, os estima-
dores por máxima verossimilhança.
Reunir esses conceitos para inferir sobre uma determinada população em es-
tudo demonstra a importância de trabalharmos com uma amostra desde que 
esta respeite e tenha informações significativas para tal análise e estimação.
96
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
> Definir um 
intervalo de 
confiança.
> Realizar análises 
de regressão e 
correlação.
UNIDADE 6
OBJETIVO 
Ao final desta 
unidade, 
esperamos que 
você seja capaz 
de:
97
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
6 INTERVALO DE CONFIANÇA, 
ANÁLISE DE REGRESSÃO E 
CORRELAÇÃO
INTRODUÇÃO DA UNIDADE
Sabemos que, em diversas situações do contexto organizacional, a descrição 
da associação ou de um modelo de associação entre grandezas ou variáveis é 
de fundamental importância para a tomada de decisão.
FIGURA 1: A IMPORTÂNCIA DA ASSOCIAÇÃO ENTRE GRANDEZAS NA GESTÃO
Fonte: Plataforma Deduca (2019).
Como não falar, por exemplo, em mercado futuro, quando queremos predizer 
valores futuros de uma grandeza em função de valores conhecidos de outra 
grandeza; particularmente falando, quando queremos identificar o melhor 
modelo matemático de associação entre o custo total de produção e a quan-
tidade produzida. Com essa modelagem em mãos, podemos descrever os 
valores estimados dos custos fixos, identificar o ponto de equilíbrio e assim 
por diante. Para tal, devemos conhecer a análise de regressão.
98
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
De outro modo, em problemas envolvendo a inadimplência, como podemos 
descrever a força de associação entre a taxa de comprometimento da renda 
do consumidor e a taxa de inadimplência em potencial? Para respondermos, 
necessitamos da teoria da correlação para variáveis quantitativas, em geral, e 
do coeficiente de correlação de Pearson, em específico.
FIGURA 2: A CORRELAÇÃO NA PRÁTICA DO MERCADO ORGANIZACIONAL 
Fonte: Plataforma Deduca (2019).
Além disso, qual o significado de comentarmos que a margem de erro de 
uma pesquisa são 5%? Ou ainda, que a margem de erro da pesquisa são 2,5% 
para cima e 2,5% para baixo? Para tal, é necessário compreendermos os inter-
valos de confiança, que descrevem exatamente a confiabilidade delas.
FIGURA 3: A CORRELAÇÃO E REGRESSÃO NA PRÁTICA ORGANIZACIONAL
Fonte: Plataforma Deduca (2019).
Portanto, esta unidade tem como objetivo básico a descrição das proprieda-
des relacionadas aos intervalos de confiança, correlação e regressão linear. 
Vamos lá?
99
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
6.1 PROPRIEDADES DO INTERVALO DE 
CONFIANÇA
É importante pontuarmos, inicialmente, que quando trabalhamos com a com-
preensão da estatística descritiva, que coleta e sumariza dados ou informações, 
bem como quando pontuamos probabilidades e distribuições de probabilida-
des, estamos trabalhando com a primeira ramificaçãoda Estatística. 
Ilustrando, quando falamos na fabricação de veículos automotivos, por exem-
plo, os responsáveis pelo ciclo produtivo se utilizam da estatística descritiva 
para interpretar os dados amostrados durante os períodos de testes de veícu-
los dirigidos em seus laboratórios experimentais.
Aplicando a estatística 
descritiva: é a primeira parte 
da Estatística, que trabalha 
fundamentalmente com tabelas 
e gráficos, bem como medidas 
de síntese e de assimetria, 
que visam principalmente a 
interpretação de parâmetros 
descritivos (média, desvio 
padrão, variância, coeficiente de 
assimetria etc.).
Neste momento, vamos estudar mais uma parte da segunda ramificação da 
Estatística, que é a concentração na caracterização de intervalos de confiança 
ou descrição do grau de confiabilidade. Tal ramificação é exatamente a estatís-
tica inferencial, em que os intervalos de confiança e outras técnicas de estima-
ção desempenham papel fundamental para os nossos propósitos. Novamente, 
como exemplo, podemos falar sobre veículos automotivos e seus fabricantes. 
Tendo em mãos a média da amostra da linha de carros de passeio, por exemplo, 
poderiam efetuar uma inferência ou estimativa para encontrar o índice médio 
em relação à economia do combustível utilizado, afirmando que o consumo 
médio seria de 16,4 km/litro para todo o ciclo produtivo para tal setor.
100
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
Aplicando a estatística inferencial: 
É a segunda parte da Estatística, que trabalha fundamentalmente 
com estimativas ou simulações realizadas em amostras para gerar 
valores pontuais ou intervalares de parâmetros populacionais.
Intervalos de confiança: 
Os intervalos de confiança, que caminham conjuntamente com os 
testes de hipóteses, são considerados um dos elementos chave para a 
estatística inferencial.
Segundo Devore (2018, p. 142), com base em uma amostra gerada de forma 
aleatória de uma população normalmente distribuída, podemos construir 
um intervalo de confiança para um parâmetro populacional desconhecido, 
com uma probabilidade associada de (1 – ), que é chamada de nível de con-
fiança, para que o intervalo até então construído contenha o parâmetro po-
pulacional simulado.
É importante comentarmos que o nível de confiabilidade ou nível de confian-
ça pode assumir diversos valores, tais como: 80%, 85%, 90%, 92%, 95%, 99%, e 
assim sucessivamente. Nessa direção, o valor do nível de significância será 
o erro que teremos ao declarar que, exemplificando, em 95% das vezes, o in-
tervalo a < x < b contém o parâmetro x, que é de 5%.
Interpretando o intervalo de confiança na prática: 
Quando falamos que um dado estudo apresenta 95% de 
confiabilidade significa que, em outras palavras, se realizarmos 
o estudo 100 vezes, em 95 vezes esperaríamos obter os mesmos 
resultados. O intervalo de confiança é representado pela simbologia IC.
Desta maneira, tais informações iniciais acerca dos intervalos de confiança nos 
mostram que o nível de confiança deve ser o maior possível (amplitude), para 
que possamos ter a maior parte dos valores numéricos do parâmetro populacio-
nal estimado dentro do intervalo de confiança, todavia não com toda a amplitu-
de para não desconfiarmos ou comprometermos a significância do mesmo.
101
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
Os intervalos de confiança podem ser descritos com base em algumas situa-
ções especificas como, por exemplo, com uma população normal, conhecen-
do ou não o desvio padrão e/ou a variância, com uma proporção populacional 
e assim por diante. Vejamos alguns desses casos a seguir.
6.2 INTERVALOS COM BASE EM DISTRIBUIÇÃO 
POPULACIONAL NORMAL
Trabalhando com uma população que seja normalmente distribuída, pode-
mos gerar o intervalo de confiança para a média populacional com base em 
dois contextos: com a variância populacional conhecida ou com a variância 
populacional desconhecida.
6.2.1 VARIÂNCIA POPULACIONAL 
CONHECIDA
Da distribuição das médias amostrais, temos: . Observemos a Fi-
gura 4 a seguir.
FIGURA 4: O IC PARA A MÉDIA POPULACIONAL COM A VARIÂNCIA POPULACIONAL 
CONHECIDA
Fonte: Devore (2018, p. 152).
Assim, o intervalo desejado é descrito como: 
.
102
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
Logo, se substituirmos a fórmula de z no intervalo, e separando no centro a 
média populacional , obtemos:
2 2
( ) ( ). ( ) . 1X XP X z X X z
n na a
s s
m a
 
− ≤ ≤ + = − 
 
1. Erro de estimação:
É interpretado como sendo o desvio em torno do parâmetro 
populacional, ou seja, podendo ser descrito pela expressão matemática 
dada por: .
2. Intervalo de confiança: 
Desta maneira, o intervalo de confiança pode ser visto como: 
.
Além disso, é importante comentarmos sobre os aspectos relacionados a po-
pulações finitas e populações infinitas. Assim sendo, vem que:
1. População infinita: 
Quando não conhecemos o tamanho da população, consideramos 
esta como sendo uma população infinita.
2. População finita: 
Caso seja conhecido o tamanho da população, devemos computar o 
valor do quociente (que é conhecida por fração de amostragem).
103
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
3. Fração de amostragem: 
Se < 0,05 ou 5%, a população é considerada uma população infinita.
4. Fração de amostragem: 
Se > 0,05 ou 5%, a população é considerada uma população finita. 
Além disso, para a fórmula do erro de estimação, devemos multiplicá-
la pelo fator de correção finita e, assim, escrevemos: .
6.2.2 VARIÂNCIA POPULACIONAL 
DESCONHECIDA
Da distribuição das médias amostrais, temos que: . Observe a fi-
gura 5:
FIGURA 5: O IC PARA A MÉDIA POPULACIONAL COM A VARIÂNCIA POPULACIONAL 
DESCONHECIDA
Fonte: Devore (2018, p. 156).
Assim, o intervalo desejado é descrito como: 
.
104
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
Logo, se substituirmos a fórmula de t no intervalo, e separando no centro a 
média populacional , obtemos:
1. Erro de estimação para população infinita: 
Neste caso, o erro de estimação é dado por .
2. Erro de estimação para população finita: 
Neste caso, o erro de estimação é dado por .
3. Intervalo de confiança: 
Assim sendo, o intervalo de confiança pode ser descrito como 
.
105
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
Vejamos um exemplo ilustrativo.
Um pesquisador extraiu os dados amostrais 20, 25, 27, 30, 32, 35, 38, 
40, 37 e 23 de uma população normalmente distribuída. A variância 
populacional é igual a 36, logo vamos construir um IC para a verdadeira 
média dessa população tomando como referência o nível de 6% de 
significância. 
De início, identifiquemos as informações dadas no exemplo, que são: 
, e . Desta forma, podemos 
escrever , bem como da amostra temos que é . Como 
não temos nada dizendo sobre o tamanho da população, vamos tomar 
ela como sendo infinita. Daí, vem e 
 
 
Dizemos então que 94% das vezes em que extrairmos amostras de 
tamanho n = 10 desta mesma população, esperamos que a média se 
concentre entre 27,13 e 34,27.
106
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
6.3 INTERVALOS DE CONFIANÇA PARA A 
VARIÂNCIA E DESVIO PADRÃO PARA UMA 
POPULAÇÃO COM DISTRIBUIÇÃO NORMAL
Primeiramente, trabalharemos com a descrição do intervalo de confiança 
para a variância populacional . 
6.3.1 INTERVALO DE CONFIANÇA PARA A 
VARIÂNCIA POPULACIONAL 
Para tal, consideremos X uma população normalmente distribuída com mé-
dia igual a e variância .Tendo como referênciao resultado de Fis-
cher (teorema), escrevemos:
Observe a figura 6:
FIGURA 6: O IC PARA A VARIÂNCIA POPULACIONAL PARA UMA DISTRIBUIÇÃO NORMAL
Fonte: Devore (2018, p. 163).
Assim sendo, o intervalo de confiança desejado pode ser descrito em símbo-
los por:
Agora vamos identificar o intervalo de confiança para o desvio padrão popu-
lacional . Para tal, vamos nos basear em Vieira (2015, p. 98).
107
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
6.3.2 INTERVALO DE CONFIANÇA PARA O 
DESVIO PADRÃO POPULACIONAL 
Segundo Vieira (2015, p. 98), para tal, extraindo a raiz quadrada para a fórmula 
matemática do intervalo de confiança para a variância populacional, descre-
vemos sem grandes dificuldades a expressão característica do intervalo de 
confiança para o desvio padrão populacional como segue:
Vejamos uma ilustração.
108
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
Um pesquisador extraiu os dados amostrais 20, 25, 27, 30, 32, 35, 38, 
40, 37 e 23 de uma população com distribuição normal. Assim sendo, 
vamos gerar o IC para a variância populacional e para o desvio padrão 
populacional tomando como referência o nível de 5% de significância. 
Inicialmente, podemos perceber, sem grandes dificuldades, a amostra 
 e então . Além disso, observamos que:
Observe a figura 7:
Figura 7: A interpretação geométrica do nosso exemplo
Fonte: Devore (2018, p. 166).
Desta forma, escrevemos: 
E, de outro modo, também escrevemos: 
 
Ou seja, concluímos que 95% das vezes em que extrairmos amostras n = 
10 desta mesma população, esperamos que a variância populacional se 
encontre no intervalo com extremos 22,11 e 155,60. 
De outra forma, podemos concluir que 95% das vezes em que extrairmos 
amostras n = 10 desta mesma população, esperamos que o desvio 
padrão populacional se encontre no intervalo com extremos 4,70 e 12,47.
109
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
6.4 REGRESSÃO LINEAR
Primeiramente, falamos que diversos estudos na área de análise quantitativa 
e qualitativa de mercado e, por conseguinte, na área da Estatística têm como 
intuito principal descrever uma relação, compreendida por uma equação 
matemática (modelo matemático), que nos permite simular o valor de uma 
variável, em função de outra variável ou de outras variáveis. 
O caso mais simples é caracterizar tal relação por uma equação de uma reta, 
quando o aumento de uma variável, chamada por dependente (Y), varia de 
forma linear com os aumentos gerados em outra variável denominada de in-
dependente (X). Essas equações são usadas em situações práticas do nosso 
cotidiano, seja em nível pessoal ou empresarial. Então podemos: 
• Simular ou estimar valores de uma variável com base em valores conhecidos 
de outra;
• Detalhar valores de uma variável em termos de outra;
• Predizer valores futuros de uma variável em função de valores conhecidos da 
outra (mercado futuro em linhas financeiras e mercado futuro de café, por 
exemplo).
Duas importantes propriedades da equação linear devem ser mencionadas: 
o coeficiente angular da reta e a cota da reta em determinado ponto (tam-
bém denominado de coeficiente linear ou simplesmente intercepto).
Entendemos por variável dependente aquela variável não controlada 
em um dado experimento, sendo por conceituação não padronizados os 
seus valores. É também chamada rotineiramente de variável endógena. 
De outro modo, a variável independente é aquela que podemos 
controlar em um dado experimento ou, ainda, seus valores são exatos. 
Comumente é chamada por variável exógena ou explicativa.
110
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
Observe a figura 8:
FIGURA 8: AS VARIÁVEIS ENVOLVIDAS NO PROCESSO DE REGRESSÃO LINEAR
É a variável não controlada - 
Variável Endógena
É a variável controlada - Variável 
Exógena ou Explicativa
• Variável Dependente • Variável Independente
Fonte: Elaborada pelo autor (2019).
1. Regressão Linear: 
Estabelece uma relação entre as variáveis (modelo matemático).
2. Método dos Mínimos Quadrados: 
Procedimento estatístico para caracterização da reta de regressão, 
gerando assim o melhor modelo de associação entre duas variáveis 
(método dos mínimos quadrados).
Outro ponto importante vinculado a metodologia da Regressão Linear Sim-
ples é um tipo especial de gráfico, denominado Diagrama de Dispersão. 
Desta forma, para compreendermos um pouco mais a regressão linear sim-
ples, é desejável a construção de tal gráfico. Particularmente falando, cada 
valor é marcado em função das coordenadas de X e Y. Vejamos uma situação 
ilustrativa introdutória envolvendo a construção do gráfico de dispersão.
111
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
O quadro 1 descreve as quantidades produzidas, de certo componente, e 
os respectivos custos totais de produção apresentados por uma empresa 
no interior paulista ao fim do ano passado.
QUADRO 1: DADOS APRESENTADOS PELA EMPRESA AO FIM DO ANO 
PASSADO
Quantidade 
Produzida (X)
Custo Total (R$) 
(Y)
100 1460,00
250 2950,00
500 5400,00
800 8390,00
1000 10200,00
Fonte: Elaborada pelo autor (2019).
Desta forma, o gráfico de dispersão associado é dado na Figura 10 abaixo. 
Note que o gráfico foi gerado no pacote SPSS 21.0.
FIGURA 9: O GRÁFICO DE DISPERSÃO DO EXEMPLO
Fonte: Elaborada pelo autor (2019).
112
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
Devemos notar que o gráfico de dispersão nos dá uma ideia intuitiva acerca 
da regressão linear simples, em que tentamos visualizar uma possível reta 
passando pela maior parte dos pontos desenhados na distribuição conjunta 
entre as variáveis.
6.5 CORRELAÇÃO AMOSTRAL
Agora vamos comentar a respeito da correlação entre amostras, ou seja, nos 
procedimentos estatísticos para que possamos caracterizar com confiabilida-
de a força de associação entre duas variáveis ou grandezas. 
É importante salientarmos que a correlação constitui uma aplicação prática 
envolvendo os testes de hipóteses, o que significa que, quando computamos 
a força ou grau de associação entre duas grandezas ou variáveis, caracteriza-
mos o coeficiente de correlação entre as mesmas e, assim, verificamos por 
um teste de hipótese se o coeficiente é estatisticamente significativo ou não. 
Em outras palavras: isso nos mostra um poderoso alicerce para a tomada de 
decisão a nível organizacional.
FIGURA 10: A IMPORTÂNCIA DA CORRELAÇÃO ENTRE AMOSTRAS NO CONTEXTO DO 
SUCESSO ORGANIZACIONAL
Fonte: Plataforma Deduca (2019).
Quando estudamos duas ou mais variáveis, é importante também conhecer 
se elas possuem algum tipo de associação ou relacionamento entre si, isto é, 
se os valores altos (ou baixos) de uma das variáveis implicam em valores altos 
(ou baixos) da outra variável. Devore (2018, p. 172) afirma que quando não é 
113
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
possível interpretarmos uma relação sistemática entre as variáveis, falamos 
que elas não são correlacionadas ou, ainda, são independentes ou são orto-
gonais. Neste caso, poderíamos estar interessados em descrever se existe as-
sociação entre os seguintes pares de variáveis:
• O volume de vendas a prazo e a taxa de inadimplência no comércio varejista 
de uma determinada cidade do interior carioca;
• O custo total de produção e a quantidade produzida de dado produto;
• Valor monetário investido em marketing e o retorno operacional das vendas 
praticadas por uma organização.
A interpretação ou compreensão do relacionamento entre duas oumais va-
riáveis é rotineiramente conhecido por correlação. Geralmente, a correlação 
tem como intuito básico descrever um número que sumarize o grau de asso-
ciação linear entre as duas variáveis em estudo. Se o estudo tratar apenas de 
duas variáveis, temos a correlação simples (ou bivariada) e, caso tenhamos no 
contexto mais de duas variáveis, teremos a correlação múltipla.
Vieira (2015, p. 102) afirma que o coeficiente de correlação como medida de 
intensidade de relação linear entre duas variáveis é apenas uma espécie de 
entendimento matemático, ficando sem uma interpretação ou implicação 
de causa e efeito. Isso nos diz que o fato de que duas variáveis tendam a au-
mentar ou a diminuir não pressupõe que uma delas exerça efeito direto e 
indireto sobre a outra variável.
FIGURA 11: TIPOLOGIA DOS COEFICIENTES DE CORRELAÇÃO
Variáveis 
Qualitativas
CORRELAÇÃO
Variáveis 
Quantitativas
Coeficiente de 
Correlação de 
por Postos de 
Spearman
Coeficiente de 
Correlação de 
Pearson
Fonte: Elaborada pelo autor (2019).
114
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
Segundo Devore (2018, p. 174), o coeficiente de correlação simples de Pe-
arson é uma medida de associação linear envolvendo variáveis de caráter 
quantitativo, cujo valor varia no intervalo de – 1 e + 1. 
Além disso, devemos ter em mente que se trata de um teste de hipóteses, ou 
seja, a análise de correlação é feita com base em um teste de hipótese, em 
que a H0 nos diz que o coeficiente de correlação obtido não é significativo e 
a H1 é o coeficiente de correlação obtido estatisticamente significativo. Assim 
sendo, quando seu valor equivale a – 1, a correlação é denominada perfeita 
negativa; desta forma, percebe-se que os valores altos em uma variável cor-
respondem a valores baixos na outra variável. Quando seu valor é +1, a corre-
lação é denominada perfeita positiva, logo, valores altos em uma variável 
correspondem a valores altos na outra variável. De outra forma, podemos con-
cluir que se o seu valor for nulo ou equivalente a 0 (zero) não há correlação 
ou associação entre as variáveis em estudo. 
Ao final, o coeficiente de variação de Pearson pode ser encarado como uma 
versão padronizada derivativa da covariância, interpretando os desvios pa-
drões como fatores de estandardização. 
6.6 CORRELAÇÕES COM VARIÁVEIS 
CATEGÓRICAS E ASSOCIAÇÕES
Como podemos mensurar a correlação entre variáveis ou grandezas que são 
categóricas? Ou seja, entre variáveis que são classificadas como nominais ou 
ordinais? Poderíamos pensar: como assim? Será que podemos pensar em um 
procedimento estatístico para trabalharmos com a caracterização da força de 
associação ou dependência entre tais variáveis? 
115
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
FIGURA 12: A CORRELAÇÃO ENTRE GRANDEZAS CATEGÓRICAS
Fonte: Plataforma Deduca (2019).
Perceba que o procedimento realizado para variáveis quantitativas pode ser 
levado ou generalizado para variáveis ou grandezas categóricas. Grosso modo, 
o que será modificado é o coeficiente pelo qual é computado o grau ou a for-
ça de associação. 
Para as variáveis categóricas, os coeficientes mais utilizados são o de Spear-
man e o tau-b de Kendall. Especificamente falando, podemos pensar na ca-
racterização da associação entre sexo e classe social ou, ainda, entre cidade de 
origem e frequência de compras e assim por diante.
Vamos abrir um pouco mais a análise com foco em variáveis categóricas para 
interpretarmos a força de associação entre elas.
116
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
Vejamos um pouco mais de ilustrações especificas envolvendo tal aparato. 
Poderíamos estar interessados em descrever se existe associação entre os se-
guintes pares de variáveis:
• O sexo (masculino e feminino) com o perfil de compras no fim do ano;
• A classe social (alta, média e baixa) e a escolha por determinadas marcas de 
roupas;
• O local de residência e a forma de pagamentos das compras eventuais e 
frequentes.
FIGURA 13: A IMPORTÂNCIA DA CORRELAÇÃO ENTRE GRANDEZAS CATEGÓRICAS NO 
CONTEXTO ORGANIZACIONAL
Fonte: Plataforma Deduca (2019).
Para todos esses casos temos variáveis categóricas e, num primeiro momen-
to, para identificarmos a correlação entre elas, utilizamos o coeficiente de 
Spearman ou o coeficiente tau-b de Kendall. Para abrirmos um pouco mais 
sobre informações da correlação entre variáveis categóricas, podemos traba-
lhar com a prova ou teste do qui-quadrado, adequados para variáveis quali-
tativas, com duas ou mais categorias, para medir o grau de discrepância entre 
um conjunto de frequências observadas e um conjunto de frequências espe-
117
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
radas; em outras palavras, é um teste não paramétrico que pode ser usado 
para avaliar a relação entre duas variáveis qualitativas. 
Grosso modo, a estatística chamada “Qui-quadrado” (e indicada por 
2c ) é 
usada para o contexto de dados descontínuos que envolvem contagens de 
indivíduos isolados ou unidades classificadas em categorias mutuamente 
excludentes. Por exemplo: número de candidatos que foram “reprovados” e 
“aprovados” em um exame vinculado a um processo seletivo de trainee ou 
que estão em determinada listagem de espera.
Uma importante aplicação do Teste Qui-quadrado ocorre quando queremos 
estudar a associação (ou dependência ou homogeneidade) entre duas ou 
mais variáveis que são categóricas. 
Devore (2018, p. 148) nos diz que o teste Qui-quadrado é um teste não para-
métrico que pode ser usado para caracterizar a correlação entre duas variáveis 
categóricas. É importante ressaltarmos que este teste, apesar de menos po-
tente que o teste paramétrico, é utilizado amplamente por pesquisadores e 
gestores por não precisar da hipótese inicial de normalidade das variáveis para 
compreendermos o grau de associação entre as duas variáveis. Por exemplo, 
poderíamos estar interessados em caracterizar a associação entre a emissão 
de cheques sem fundos e o porte de empresas de uma cidade metropolitana. 
FIGURA 14: UMA APLICAÇÃO ENVOLVENDO O TESTE QUI-QUADRADO
Fonte: Plataforma Deduca (2019).
118
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
CONCLUSÃO
Nesta unidade, trabalhamos especificamente com os intervalos de confiança, 
correlação e regressão linear. Primeiramente, apresentamos as conceituações 
e propriedades específicas dos intervalos de confiança, com base na norma-
lidade ou não, e com base no desconhecimento da variância populacional. 
Além disso, apresentamos formalmente duas outras técnicas de estimação, 
que são a correlação e a regressão. A correlação é a técnica que descreve a for-
ça de associação entre duas grandezas, que podem ser quantitativas ou quali-
tativas. De outra forma, a regressão trabalha com a ideia de descrever o melhor 
modelo matemático de ajustamento entre duas grandezas ou variáveis. 
119
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
120
PROBABILIDADE E ESTATÍSTICA
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
REFERÊNCIAS 
COSTA, G. G de O. Curso de estatística básica. 2 ed. São Paulo: Atlas, 2015.
DEVORE, J. L. Probabilidade e estatística para engenharia e ciências. São Paulo: Cengage 
Learning, 2018.
LOESCH, Claudio. Probabilidade e estatística. Rio de Janeiro: LTC, 2015.
MARTINS, G. de A.; DOMINGUES, O. Estatística geral e aplicada. 6. ed. São Paulo: Atlas, 2019. 
MATTOS, V. L. D. de.; KONRATH, A. C.; AZAMBUJA, A. M. V. de. Introdução à estatística: aplica-
ções em ciênciasexatas. Rio de Janeiro: LTC, 2017. 
MONTGOMERY, D. C. Estatística aplicada e probabilidade para engenheiros. 6. ed. Rio de 
Janeiro: LTC, 2018.
MORETTIN, P. A.; BUSSAB, P. A. Estatística básica. 9. ed. São Paulo: Saraiva, 2017. 
OLIVEIRA, F. E. M. de. Estatística e probabilidade: com ênfase em exercícios resolvidos e pro-
postos. 3. ed. Rio de Janeiro: LTC, 2017. 
VIEIRA, S. Estatística básica. São Paulo: Cengage Learning, 2015.
121
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
PROBABILIDADE E ESTATÍSTICA
EAD.MULTIVIX.EDU.BR
CONHEÇA TAMBÉM NOSSOS CURSOS DE PÓS-GRADUAÇÃO A DISTÂNCIA NAS ÁREAS DE:
SAÚDE • EDUCAÇÃO • DIREITO • GESTÃO E NEGÓCIOS
	Tabela 1: Distribuição de probabilidade para cálculo da variância.
	Tabela 2: Nomenclatura da distribuição binomial.
	Quadro 1: Dados apresentados pela empresa ao fim do ano passado
	Figura 1: População e amostra
	Figura 2: Gráficos
	Figura 3: Representação de gráficos
	Figura 4: Gráfico de curvas.
	Figura 5: Gráfico de setores.
	Figura 6: Maior conjunto
	Figura 1: Complemento de um evento A
	Figura 2: União de dois eventos A e B.
	Figura 3: Interseção de A e B.
	Figura 1: homem pensando.
	Figura 2: resultados do lançamento de dois dados.
	Figura 4: pontos de interrogação.
	Figura 5: resultado dos lançamentos de dois dados.
	Figura 6: resultado dos lançamentos de dois dados.
	Figura 7: distribuição de probabilidade
	Figura 1: A busca de informações é fundamental para a gestão organizacional.
	Figura 2: O processo de tomada de decisão com base em dados.
	Figura 3: A importância das hipóteses na tomada de decisão gerencial.
	Figura 4: O risco associado a aceitação das hipóteses estatísticas.
	Figura 5: Os dados do exemplo.
	Figura 6: A inserção dos dados no programa SPSS 24.0.
	Figura 7: O resultado do teste t simples do exemplo.
	Figura 8: A inserção dos dados no programa SPSS 24.0.
	Figura 9: O resultado do teste t simples do exemplo.
	Figura 10: Interpretação geométrica do comparativo entre distribuições com base nos testes comparativos.
	Figura 11: Testes de comparação entre distribuições normais.
	Figura 12: Os testes estatísticos paramétricos sendo aplicados no cotidiano.
	Figura 13: Comparativo entre os testes paramétricos e não paramétricos.
	Figura 14: O significado do termo verossimilhança.
	Figura 1: experimentos químicos ou bioquímicos.
	Figura 3: valor esperado de vendas.
	Figura 6: avaliação dos dados por menor variância.
	Figura 7: proporção populacional.
	Figura 8: intervalos de confiança.
	Figura 9: curva normal. 
	Figura 1: A importância da associação entre grandezas na gestão
	Figura 2: A correlação na prática do mercado organizacional 
	Figura 3: A correlação e regressão na prática organizacional
	Figura 4: O IC para a média populacional com a variância populacional conhecida
	Figura 5: O IC para a média populacional com a variância populacional desconhecida
	Figura 6: O IC para a variância populacional para uma distribuição normal
	Figura 8: As variáveis envolvidas no processo de regressão linear
	Figura 9: O gráfico de dispersão do exemplo
	Figura 10: A importância da correlação entre amostras no contexto do sucesso organizacional
	Figura 11: Tipologia dos coeficientes de correlação
	Figura 12: A correlação entre grandezas categóricas
	Figura 13: A importância da correlação entre grandezas categóricas no contexto organizacional
	Figura 14: Uma aplicação envolvendo o teste qui-quadrado
	Apresentação da disciplina
	1 ESTATÍSTICA DESCRITIVA
	INTRODUÇÃO da unidade
	1.1 PROCESSO ESTATÍSTICO
	1.2 POPULAÇÕES E AMOSTRAS
	1.3 TABELAS E SÉRIES ESTATÍSTICAS
	1.4 GRÁFICOS ESTATÍSTICOS
	1.5 MEDIDAS DE LOCALIZAÇÃO
	1.6 MEDIDAS DE DISPERSÃO
	2 PROBABILIDADE
	INTRODUÇÃO da unidade
	2.1 INTRODUÇÃO À PROBABILIDADE
	2.2 ESPAÇO AMOSTRAL E EVENTOS 
	2.3 TÉCNICA DA CONTAGEM
	2.4 PROBABILIDADE CONDICIONAL
	2.5 TEOREMA DE BAYES
	2.6 EVENTOS INDEPENDENTES
	3 VARIÁVEIS ALEATÓRIAS DISCRETAS E CONTÍNUAS
	INTRODUÇÃO DA UNIDADE
	3.1 ESPERANÇA MATEMÁTICA E VARIÂNCIA
	3.2 DISTRIBUIÇÕES HIPERGEOMÉTRICAS, BINOMIAL E DE POISSON
	3.3 DISTRIBUIÇÃO NORMAL
	3.4 VARIÁVEIS ALEATÓRIAS BIDIMENSIONAIS
	3.5 DISTRIBUIÇÕES MARGINAIS, INDEPENDENTES E CONDICIONAIS
	3.6 FUNÇÕES DE VARIÁVEIS ALEATÓRIAS
	4 AVALIAÇÃO DE TESTES DE HIPÓTESES 
	INTRODUÇÃO DA UNIDADE
	4.1 HIPÓTESE E PROCEDIMENTO DE TESTE
	4.2 TESTE COM RELAÇÃO À MÉDIA DA POPULAÇÃO
	4.3 TESTES DE COMPARAÇÃO DE DUAS MÉDIAS
	4.4 TESTES DE COMPARAÇÃO DE DUAS DISTRIBUIÇÕES
	4.5 TESTE PARAMÉTRICO
	4.6 TESTE DE VEROSSIMILHANÇA
	5 ESTIMATIVA PONTUAL
	INTRODUÇÃO DA UNIDADE
	5.1 ESTIMADORES NÃO VICIADOS
	5.2 VALOR ESPERADO
	5.3 ESTIMADORES COM MÍNIMA VARIÂNCIA
	5.4 PROPORÇÃO POPULACIONAL
	5.5 ESTIMAÇÃO POR INTERVALO DE CONFIANÇA
	5.6 ESTIMAÇÃO POR MÁXIMO VEROSSIMILHANÇA
	6 INTERVALO DE CONFIANÇA, ANÁLISE DE REGRESSÃO E CORRELAÇÃO
	INTRODUÇÃO DA UNIDADE
	6.1 PROPRIEDADES DO INTERVALO DE CONFIANÇA
	6.2 INTERVALOS COM BASE EM DISTRIBUIÇÃO POPULACIONAL NORMAL
	6.3 INTERVALOS DE CONFIANÇA PARA A VARIÂNCIA E DESVIO PADRÃO PARA UMA POPULAÇÃO COM DISTRIBUIÇÃO NORMAL
	6.4 REGRESSÃO LINEAR
	6.5 CORRELAÇÃO AMOSTRAL
	6.6 CORRELAÇÕES COM VARIÁVEIS CATEGÓRICAS E ASSOCIAÇÕES
	MTBlankEqn
	_heading=h.30j0zll
	_Hlk23537327
	_Hlk24440106
	_GoBack

Mais conteúdos dessa disciplina