Livro-Texto Unidade IV

•
UNIP

Nayra Zanini
27/03/2024
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 88 páginas
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 88 páginas
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 88 páginas
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
E aí, curtiu este material?
Ajude a incentivar outros estudantes a melhorar o conteúdo
Gostou desse material? Compartilhe! 🧡
Estatística I

56.948 Materiais compartilhados
Baixe o app para aproveitar ainda mais
Leia os materiais offline, sem usar a internet. Além de vários outros recursos!
Prévia do material em texto
127
ESTATÍSTICA
Unidade IV
7 MODELOS TEÓRICOS DISCRETOS E CONTÍNUOS E INFERÊNCIA ESTATÍSTICA
7.1 Variável aleatória discreta unidimensional
A seguir, vamos definir:
• o que é uma variável discreta aleatória;
• o que são funções de probabilidade;
• o que é e como calcular o valor esperado e a variância de uma variável discreta aleatória.
7.1.1 Definição de variável discreta aleatória
Segundo Morettin (2019, p. 46), “[…] variável aleatória é uma função que associa a todo evento 
pertencente a uma partição do espaço amostral um único número real”.
Uma variável aleatória é dita discreta se assume apenas determinados valores, e não qualquer valor 
contido em um intervalo de valores (nesse caso, teríamos uma variável contínua). Um exemplo de 
quantidades discretas está nos resultados do lançamento de um dado, em que se pode obter apenas 
números inteiros de 1 a 6, e nunca números fracionários.
7.1.2 Função de probabilidade
Morettin (2019, p. 46) define função de probabilidade como “[…] a função que associa cada valor 
assumido pela variável aleatória à probabilidade do evento correspondente”. O autor define ainda 
distribuição de probabilidade como o conjunto formado pelos valores das variáveis aleatórias e suas 
probabilidades correspondentes.
A distribuição de probabilidades pode ser representada de forma gráfica, colocando‑se os valores 
da variável aleatória no eixo horizontal e as probabilidades correspondentes no eixo vertical. Como se 
trata de uma variável discreta, o gráfico é composto por pontos, e não se pode traçar uma curva sobre 
esses pontos.
128
Unidade IV
Exemplo de aplicação
Ao fazer o lançamento de um dado numérico de 6 faces, foram obtidos os resultados a seguir.
Tabela 45 – Resultados dos lançamentos de um dado
Face Número de ocorrências
1 2
2 4
3 9
4 8
5 3
6 1
Soma‑se todas as ocorrências para termos o total de lançamentos:
2 +4 + 9 + 8 + 3 + 1 = 27
Para calcular a probabilidade de obter cada face, divide‑se o número de ocorrências pelo total 
de lançamentos.
Tabela 46 – Probabilidades de ocorrência 
dos lançamentos de um dado
Face Probabilidade de ocorrência
1 2/27 = 0,074
2 4/27 = 0,15
3 9/27 = 0,33
4 8/27 = 0,30
5 3/27 = 0,11
6 1/27 = 0,037
Desse modo, ao construir o gráfico da distribuição de probabilidades do lançamento desse dado e 
colocar as faces no eixo horizontal e as probabilidades de ocorrência no eixo vertical, temos o que segue:
129
ESTATÍSTICA
0,30
0,20
0,10
1 2 3 4 5 6
face
propabilidade 
de ocorrência
Figura 35 – Distribuição de probabilidades para o lançamento do dado
Note que há probabilidades apenas para valores inteiros da face do dado, pois trata‑se justamente 
de um problema discreto, e, por isso, não é possível traçar uma curva sobre os pontos.
7.1.3 Valor esperado de uma variável discreta aleatória
O valor esperado de uma variável aleatória, também conhecido como esperança matemática, é igual 
ao valor médio dessa variável. O valor esperado de uma variável aleatória X é indicado por E(X).
O valor esperado E(X) é calculado pela média ponderada dos valores assumidos pela variável, em que 
os pesos são as probabilidades:
( ) ( )
N
i i
i 1
E X x .p x
=
=∑
Note que, na expressão, usam‑se as probabilidades como peso. Então, não é preciso dividir a 
média pelo número de ocorrências, já que a soma de todas as probabilidades do evento deve ser igual 
a 1 (no caso, seria equivalente a dividir a equação por 1, o que não se faz necessário).
Exemplo de aplicação
Em um jogo de caça‑níqueis, verificou‑se que:
• a probabilidade do jogador ganhar 10 reais era de 2%;
130
Unidade IV
• a probabilidade do jogador ganhar 5 reais era 6%;
• a probabilidade do jogador ganhar 50 reais era 0,1%.
Qual é o prêmio médio nesse jogo?
Figura 36 – Máquinas de caça‑níqueis
Disponível em: https://cutt.ly/9Mc1JyV. Acesso em: 14 nov. 2022.
Organizando os prêmios e as probabilidades em uma tabela, temos o que segue.
Tabela 47 – Prêmios e probabilidades
Prêmio (R$) Probabilidade (%)
50,00 0,1
10,00 2
5,00 6
0,00
Na tabela está relacionada também a probabilidade de o jogador não ganhar nenhum prêmio no 
jogo de caça níqueis, calculada como 100% menos a soma das probabilidades de ganhar um prêmio.
131
ESTATÍSTICA
Dividindo as probabilidades por 100%, para que elas sejam dadas em valores unitários e não em 
porcentagens, temos o que segue:
Tabela 48 – Prêmios e probabilidades
Prêmio (R$) Probabilidade
50,00 0,001
10,00 0,02
5,00 0,06
0,00 0,919
Calculando o valor esperado (valor médio) nesse jogo, temos:
E 50.0,001 1 0.0,02 5.0,06 0.0,919= + + +
E 0,05 0,2 0,30= + +
E 0,55=
Logo, o prêmio médio desse jogo de azar é R$ 0,55 (ou 55 centavos).
7.1.4 Variância de uma variável discreta aleatória
A variância de uma variável aleatória e discreta X, representada por VAR(X), é calculada por:
( ) ( ) ( )
N
2
i x i
i 1
VAR X x .p x
=
= −µ∑
Na equação:
• xi representa cada valor da variável aleatória;
• µx representa o valor verdadeiro (ou valor médio) da grandeza;
• p(xi) representa a probabilidade de ocorrência de cada valor da variável aleatória xi.
A variância ainda pode ser indicada por V(X), σ2(X), σX
2 ou σ2.
A variância é um indicador de dispersão, fornecendo, portanto, uma medida do espalhamento 
dos dados.
132
Unidade IV
Exemplo de aplicação
No exemplo anterior, calculou‑se o prêmio médio em um jogo de caça níqueis, obtendo E = 0,55, que 
será considerado como igual ao valor verdadeiro (valor médio da distribuição) do prêmio pago. Pode‑se 
calcular a variância associada à premiação paga nesse jogo de azar.
A variância é calculada de forma mais fácil usando uma tabela. Os resultados e as probabilidades 
foram dados na tabela a seguir.
Tabela 49 – Cálculo da variância para as premiações 
do jogo de caça‑níqueis (parte 1)
xi p(xi) xi‑E (xi‑E)
2 (xi‑E)
2.p(xi)
50,00 0,001
10,00 0,02
5,00 0,06
0,00 0,919
Calculando os valores da terceira coluna, subtraindo E = 0,55 de cada valor xi, temos:
Tabela 50 – Cálculo da variância para as premiações 
do jogo de caça‑níqueis (parte 2)
xi p(xi) xi‑E (xi‑E)
2 (xi‑E)
2.p(xi)
50,00 0,001 49,45
10,00 0,02 9,45
5,00 0,06 4,45
0,00 0,919 ‑0,55
Calculando os valores da quarta coluna, elevando os valores da terceira coluna ao quadrado, temos:
Tabela 51 – Cálculo da variância para as premiações 
do jogo de caça‑níqueis (parte 3)
xi p(xi) xi‑E (xi‑E)
2 (xi‑E)
2.p(xi)
50,00 0,001 49,45 2445,3
10,00 0,02 9,45 89,3
5,00 0,06 4,45 19,8
0,00 0,919 ‑0,55 0,30
133
ESTATÍSTICA
Multiplicando cada um dos resultados da quarta coluna pelas probabilidades associadas (dadas na 
segunda coluna), preenche‑se a última coluna da tabela:
Tabela 52 – Cálculo da variância para as premiações do jogo de 
caça‑níqueis (parte 4)
xi p(xi) xi‑E (xi‑E)
2 (xi‑E)
2.p(xi)
50,00 0,001 49,45 2445,3 2,44
10,00 0,02 9,45 89,3 1,79
5,00 0,06 4,45 19,8 1,19
0,00 0,919 ‑0,55 0,30 0,28
A variância é dada pela soma dos valores da última coluna da tabela, pois:
( ) ( ) ( )
N
2
i x i
i 1
VAR X x .p x
=
= −µ∑
Fazendo esse cálculo, temos:
VAR 2,44 1,79 1,19 0,28 5,7= + + + =
Logo, a variância associada aos prêmios pagos pelo jogo de caça níqueis é 5,7.
7.2 Modelos teóricos discretos e contínuos de probabilidade
7.2.1 Distribuição binomial
A distribuição binomial é uma distribuição discreta de probabilidades que se aplica sempre que o 
processo de amostragem tem as seguintes características:
• em cada tentativa, há apenas dois resultados possíveis, chamados de sucesso e fracasso, que são 
mutuamente exclusivos;
• os eventos de uma série de tentativas são independentes;
• o processo é estacionário, ou seja, a probabilidade de sucesso não varia entre uma tentativa e outra.
Os processos de amostragem com essas características são conhecidos como processos de Bernoulli.
134
Unidade IV
 Saiba mais
Para saber mais sobre processos de Bernoulli, acesse:
PROCESSO Bernoulli. Stringfixer, [s.d.].
Disponível em: https://cutt.ly/tMDwrJo. Acessoem: 14 nov. 2022.
Chamando de p a probabilidade de sucesso em uma única tentativa, a probabilidade de fracasso 
nessa mesma tentativa é dada por:
q 1 p= −
Ou seja, existem dois resultados possíveis e mutuamente exclusivos. O número 1 na expressão 
anterior indica a probabilidade de ocorrência de 100%.
A probabilidade P(X) de termos X sucessos em N tentativas é dada pela seguinte expressão:
( ) X N XN,XP X C .p .q −=
Escrevendo explicitamente o binômio CN,X, temos:
( ) ( )
X N XN!P X .p .q
X!. N X !
−=
−
 Lembrete
Vimos que o fatorial de um número inteiro n é calculado por:
( ) ( ) ( )n! n. n 1 . n 2 . n 3 3.2.1= − − − …
Vimos também que o número de combinações de n elementos em 
grupos de p elementos é dado pela seguinte expressão:
( )n,p
n!
C
p!. n p !
=
−
Na equação, n e p são números inteiros. Lemos Cn,p como a combinação 
de n elementos tomados p a p.
135
ESTATÍSTICA
Exemplo de aplicação
Um dado de 6 faces, numeradas de 1 a 6, foi lançado 4 vezes. Qual é a probabilidade de se obter 
2 vezes o número 3 no lançamento do dado?
Figura 37 – Dados de 6 faces
Disponível em: https://cutt.ly/aMc2i8I. Acesso em: 14 nov. 2022.
Para responder a essa pergunta, deve‑se usar a distribuição binomial de probabilidades – já que 
temos apenas duas possibilidades mutuamente excludentes: obter ou não obter o número 3.
Ao lançar um dado, há 6 possibilidades de resultado distintas. Logo, a probabilidade de se obter o 
número 3 lançando um dado de 6 faces é:
1
p
6
=
Então, a probabilidade de se obter qualquer número, exceto o número 3, é dada por:
q 1 p= −
1
q 1
6
= −
6 1
q
6 6
= −
5
q
6
=
136
Unidade IV
Da expressão da distribuição binomial, para obtermos 2 vezes o resultado desejado (a face 3) em 4 
tentativas, ou seja, com X = 2 e N = 4, pode‑se fazer o seguinte:
( ) X N XN,XP X C .p .q −=
( ) 2 4 24,2P 2 C .p .q −=
( ) 2 24,2P 2 C .p .q=
Escrevendo a combinação de 4 dois a dois em termos de fatoriais, temos:
( ) ( )
2 4 24!P 2 .p .q
2!. 4 2 !
−=
−
( ) ( )
2 24!P 2 .p .q
2!. 4 2 !
=
−
( ) 2 24!P 2 .p .q
2!.2!
=
É possível escrever 4! como 4.3.2!, de forma que:
( ) 2 24.3.2!P 2 .p .q
2!.2!
=
( ) 2 24.3P 2 .p .q
2!
=
( ) 2 24.3P 2 .p .q
2.1
=
( ) 2 212P 2 .p .q
2
=
( ) 2 2P 2 6.p .q=
Substituindo as probabilidades de sucesso (dado com a face 3 para cima) e insucesso (dado com 
outra face que não a 3 para cima), tem‑se:
137
ESTATÍSTICA
( )
2 21 5
P 2 6. .
6 6
   =    
   
( ) 1 25P 2 6. .
36 36
   =    
   
E chega‑se a:
( )P 2 0,116=
Multiplicando esse valor por 100% para se obter a probabilidade em porcentagem, ficamos com:
( )P 2 0,116.100%=
( )P 2 11,6%=
Logo, a probabilidade de obtermos 2 vezes a face 3 em 4 lançamentos de um dado de 6 faces é 
11,6%.
Exemplo de aplicação
Verificou‑se que a probabilidade de chover no fim da tarde em um dia de janeiro é de 75%. Sabendo 
que janeiro tem 31 dias, qual é a probabilidade de ocorrerem apenas 10 dias de chuva no fim da 
tarde no mês?
Figura 38 – Fim de tarde chuvoso
Disponível em: https://cutt.ly/iMc2xHv. Acesso em: 14 nov. 2022.
138
Unidade IV
Do enunciado, temos N = 31, X = 10 e p = 0,75. A probabilidade de não ter chuva no fim da tarde 
em janeiro é:
q 1 p= −
q 1 0,75= −
q 0,25=
Como são apenas duas possibilidades mutuamente excludentes, chover ou não chover, pode‑se usar 
a distribuição binomial de probabilidades para calcular a probabilidade desejada.
Para uma distribuição binomial, temos:
( ) X N XN,XP X C .p .q −=
Especificamente para esse problema, temos:
( ) 10 31 1031,10P 10 C .0,75 .0,25 −=
Escrevendo a combinação em termos de fatoriais, temos:
( ) ( )
10 31 1031!P 10 .0,75 .0,25
10!. 31 10 !
−=
−
( ) 10 2131!P 10 .0,75 .0,25
10!.21!
=
( ) 10 2131.30.29.28.27.26.25.24.23.22.21!P 10 .0,75 .0,25
10.9.8.7.6.5.4.3.2.1.21!
=
( ) 10 2131.30.29.28.27.26.25.24.23.22P 10 .0,75 .0,25
10.9.8.7.6.5.4.3.2.1
=
139
ESTATÍSTICA
Usando uma calculadora para fazer a multiplicação do numerador e do denominador da fração, 
temos:
( )
14
10 211,60945.10P 10 .0,75 .0,25
3628800
=
( ) 10 21P 10 30045015.0,75 .0,25=
( ) 13P 10 44352127 . 0,0563 . 2,27.10−=
( ) 7P 10 5,67.10−=
Multiplicando esse resultado por 100% para termos a probabilidade em porcentagem, temos:
( ) 7P 10 5,67.10 .100%−=
( )P 10 0,0000567%=
Logo, a probabilidade de chover no final da tarde em apenas 10 dias de janeiro é 0,0000567% – ou 
seja, uma probabilidade muito pequena.
7.2.2 Distribuição normal
A distribuição normal de probabilidades é uma distribuição de probabilidades contínua, simétrica 
em relação à média, e cuja curva tem o formato de uma gaussiana. Essa curva que dá a distribuição de 
probabilidades é chamada de função densidade de probabilidade (fdp).
A probabilidade de ocorrência de um evento está relacionada com a área sob a curva da função 
densidade de probabilidade.
Em uma distribuição normal de probabilidades, temos o seguinte:
x x x−σ < < + σ→ p = 68%
x 2. x x 2.− σ < < + σ→ p = 95%
x 23 x x 3.− σ < < + σ→ p = 99,7%
140
Unidade IV
Isso pode ser visto na figura a seguir:
68%
95%
99,7%
x x x x x x� � � � �3 2 2� � � � �������� ������� ������� ������� ������� ��������x � 3�
Figura 39 ‑ Distribuição normal e probabilidades
Fonte: Souza et al. (2020, p. 153).
Então, a probabilidade de um valor estar no intervalo entre uma vez o desvio padrão, tanto para o 
lado negativo como para o lado positivo, é de 68% para uma distribuição normal. A probabilidade de 
um valor estar no intervalo dentro de 2 vezes o desvio padrão, tanto para o lado negativo como para 
o positivo, é de 95%. Já a probabilidade de um valor estar no intervalo limitado por 3 vezes o desvio 
padrão, tanto para o lado negativo como para o positivo, é de 99,7%. Outra implicação disso é que a 
probabilidade de um valor estar além de 3 vezes o desvio padrão é cerca de 0,3%.
 Saiba mais
A curva gaussiana tem esse nome em homenagem ao matemático, 
astrônomo e físico J. Gauss. Para saber mais sobre Gauss, leia:
AMARAL, D. A. Gauss, Carl Friedrich (1777‑1855). Faculdade de 
Engenharia Mecânica da Unicamp, Campinas, 31 jan. 2001. Disponível em: 
https://cutt.ly/MMDrmFx. Acesso em: 14 nov. 2022.
141
ESTATÍSTICA
A função densidade de probabilidade de uma distribuição normal de média x e desvio padrão 
σ é dada por:
( )
21 x x
.
21f x .e
. 2.
− −  σ =
σ π
 Observação
O número e na expressão da distribuição normal é conhecido como 
número de Euler ou número neperiano. Trata‑se de um número irracional 
(com infinitas casas decimais) e aproximadamente igual a 2,71.
A exponencial de base e, como na equação anterior, é frequente em física 
e matemática, e é facilmente calculada por uma calculadora científica.
 Saiba mais
Para saber mais sobre a distribuição normal, leia o capítulo 3.1, 
“Distribuição normal”, na obra de Juliana Sena de Souza e colegas em:
SOUZA, J. S. et al. Distribuição normal. In: SOUZA, J. S. et al. 
Probabilidade e estatística (EAD). Porto Alegre: UFRGS, 2020. Disponível 
em: https://cutt.ly/MMc3qSk. Acesso em: 14 nov. 2022. p. 139‑153.
Pode‑se converter qualquer distribuição normal de probabilidades em uma distribuição normal 
padronizada. Para isso, convertem‑se os valores x da distribuição em valores padronizados z. Usamos a 
seguinte expressão:
x x
z
−
=
σ
A conversão para uma distribuição normal padronizada faz com que seja possível usar uma tabela 
para obter as probabilidades, sem realizar cálculos que demandem a equação da função densidade de 
probabilidade que vimos anteriormente. Essa tabela é mostrada a seguir.
142
Unidade IV
Tabela 53 – Áreas sob uma distribuição normal 
padrão, em relação ao valor médio
z 0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359
0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753
0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141
0,3 0,1179 0,1217 0,1255 0,1293 0,13310,1368 0,1406 0,1443 0,1480 0,1517
0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879
0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224
0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549
0,7 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852
0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133
0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389
1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621
1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830
1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015
1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177
1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319
1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441
1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545
1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633
1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706
1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767
2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817
2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857
2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890
2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916
2,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936
2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952
2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964
2,7 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974
2,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981
2,9 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986
3,0 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990
143
ESTATÍSTICA
Para usar essa tabela, parte‑se do valor de z à procura da combinação entre linha e coluna até 
obter‑se esse valor. Por exemplo, a área sob a gaussiana para z = 1,42 é obtida por 1,4 + 0,02, e essa 
área está no cruzamento da linha 1,4 com a coluna 0,02, o que dá área de 0,4222 (ver tabela a seguir).
Tabela 54 – Áreas sob uma distribuição normal 
padrão, em relação ao valor médio para z = 1,42
z 0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359
0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753
0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141
0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517
0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879
0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224
0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549
0,7 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852
0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133
0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389
1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621
1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830
1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015
1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177
1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319
1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441
1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545
1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633
1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706
1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767
2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817
2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857
2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890
2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916
2,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936
2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952
2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964
2,7 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974
2,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981
2,9 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986
3,0 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990
Lembre‑se de que essas tabelas fornecem a área entre o meio da curva e o z que procuramos. 
Se quisermos a área entre dois lados da curva simétricos, devemos dobrar o valor obtido na tabela.
144
Unidade IV
A tabela também pode ser usada no sentido inverso, consultando um valor de probabilidade 
e, a partir da posição desse valor, é obtido o valor de z pela soma da linha e da coluna da 
probabilidade desejada.
No exemplo a seguir é demonstrado como trabalhar com a tabela da distribuição normal 
padronizada.
Exemplo de aplicação
Considere que a vida útil das lâmpadas produzidas em dada fábrica siga uma distribuição normal 
com média x = 5000 horas e com desvio padrão σ = 100 horas. Qual é a probabilidade de que uma 
lâmpada produzida por essa fábrica dure entre 5100 e 5200 horas?
Primeiro, calcula‑se o coeficiente z para os limites do intervalo de durabilidade da lâmpada.
Para o limite inferior do intervalo, de 5100 horas, temos:
x x
z
−
=
σ
5100 5000
z
100
−
=
100
z
100
z 1=
Para o limite superior do intervalo, de 5200 horas, temos:
x x
z
−
=
σ
5200 5000
z
100
−
=
200
z
100
=
z 2=
145
ESTATÍSTICA
Na segunda coluna da tabela 55, localizamos as probabilidades correspondentes a z = 1 e a z = 2.
Tabela 55 – Áreas sob uma distribuição normal 
padrão, em relação ao valor médio para z entre 1 e 2
z 0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359
0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753
0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141
0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517
0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879
0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224
0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549
0,7 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852
0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133
0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389
1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621
1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830
1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015
1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177
1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319
1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441
1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545
1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633
1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706
1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767
2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817
2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857
2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890
2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,49162,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936
2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952
2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964
2,7 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974
2,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981
2,9 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986
3,0 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990
146
Unidade IV
( )p z 1 0,3413= =
( )p z 2 0,4772= =
Lembrando que essas probabilidades são de o valor estar entre o valor z = 0 e z dado, e a questão é 
calcular a probabilidade de o valor estar entre z = 2 e z = 1.
( ) ( ) ( )p z 1 a 2 p z 2 p z 1= = = − =
( )p z 1 a 2 0,4772 0,3413= = −
( )p z 1 a 2 0,1359= =
Multiplicando esse valor por 100% para se obter a probabilidade em porcentagem, ficamos com:
( )p z 1 a 2 0,1359 .1 00%= =
( )p z 1 a 2 1 3,6%= =
Logo, a probabilidade de ter uma lâmpada com durabilidade de 5100 a 5200 horas é de 13,6%.
7.3 Inferência estatística
Inferência estatística é o processo estatístico que tem como objetivo fazer generalizações de uma 
população a partir de uma amostra.
A inferência estatística envolve amostragem, estimadores e intervalos de confiança, conceitos que 
serão detalhados a seguir.
7.3.1 Amostragem
A seleção de uma amostra de uma população chama‑se levantamento amostral. Esse levantamento 
amostral pode ser de dois tipos: probabilístico ou não probabilístico.
Os levantamentos amostrais probabilísticos podem ser classificados em:
• amostragem aleatória simples;
147
ESTATÍSTICA
• amostragem aleatória sistemática;
• amostragem aleatória estratificada;
• amostragem aleatória por conglomerados.
Na amostragem aleatória simples, todos os elementos de uma população têm igual probabilidade 
de serem selecionados para a amostra. Nesse processo de seleção, é comum sortear aleatoriamente os 
elementos participantes. Esse é o método mais simples de compor uma amostra.
Na amostragem aleatória sistemática, os elementos da população são selecionados de acordo com 
critérios preestabelecidos, como seleção pela inicial do nome, por exemplo. Esse processo de amostragem 
é bastante usado para compor amostras em pesquisas de opinião.
Na amostragem aleatória estratificada, a população é dividida em grupos homogêneos, 
chamados de estratos, e, em seguida, é feita uma amostragem aleatória simples dentro de cada 
estrato. Os estratos podem ser faixas salariais em uma empresa ou faixas etárias de uma população, 
por exemplo.
Na amostragem aleatória por conglomerados, a população é dividida por áreas geográficas e então 
é feita uma amostragem simples em uma pequena área geográfica.
Os levantamentos amostrais não probabilísticos podem ser classificados em:
• amostragem não aleatória intencional;
• amostragem não aleatória voluntária;
• amostragem não aleatória acidental.
Na amostragem não aleatória intencional, o pesquisador escolhe uma característica da 
população para compor sua amostra, por exemplo, selecionando pessoas pelo seu time de futebol.
Na amostragem não aleatória voluntária, as pessoas tomam a iniciativa de fazer parte da amostra, 
oferecendo‑se para participar da pesquisa.
Por sua vez, na amostragem não aleatória acidental, os elementos que compõem a amostra são 
escolhidos sem nenhum critério estabelecido, como selecionar todas as pessoas que passam por 
determinada rua.
148
Unidade IV
7.3.2 Estimadores
Define‑se estimador como uma grandeza obtida a partir de observações de uma amostra. O estimador 
é considerado um indicador de um parâmetro desconhecido da população.
Chamamos de estimativa o valor atribuído a um estimador.
A estimativa de um parâmetro pode ser feita de duas formas:
• estimativa por ponto;
• estimativa por intervalo.
A estimativa por ponto é o nome dado ao valor obtido a partir de cálculos estatísticos com os 
elementos da amostra, servindo como uma aproximação do parâmetro estimado.
Um exemplo de estimativa por ponto é o valor médio de uma amostra, calculado a partir dos 
elementos dessa amostra, e assumido como uma aproximação do valor médio da população a partir da 
qual a amostra foi selecionada.
A estimativa por intervalo não é feita por um único valor, mas por uma faixa de valores que são 
considerados uma aproximação do parâmetro estimado. As estimativas por intervalo são chamadas de 
intervalo de confiança. Em geral, calculam‑se intervalos de confiança que tenham uma chance de 95% 
de conter o valor verdadeiro.
7.3.3 Intervalos de confiança
O nível de confiança é o valor que exprime o grau de confiança associado a dado intervalo 
de confiança.
Chama‑se de x o valor médio, de s o desvio padrão da amostra, de µ o valor médio e de σ o desvio 
padrão da população a partir da qual a amostra foi obtida.
No caso de uma distribuição simétrica, o valor médio da amostra está no meio do intervalo de 
confiança. Então, definindo o erro amostral c e considerando a probabilidade de 95% do valor médio da 
população estar contido nesse intervalo de confiança, temos:
P(x c x c) 95%− <µ< + =
No caso de uma população infinita, o erro amostral c é determinado por:
c z.
n
σ
=
149
ESTATÍSTICA
Na equação:
• σ é o desvio padrão da população, que pode ser aproximado pelo desvio padrão da amostra caso 
esse primeiro seja desconhecido;
• n é o tamanho da amostra;
• z é a abcissa da distribuição normal padronizada para dado nível de confiança.
Se a população for finita e de tamanho N, o erro amostral c é determinado por:
2 2z . N
c . 1
N 1 n
σ  = − −  
Na equação:
• σ é o desvio padrão da população, que pode ser aproximado pelo desvio padrão da amostra caso 
esse primeiro seja desconhecido;
• n é o tamanho da amostra;
• z é a abcissa da distribuição normal padronizada para um dado nível de confiança.
No caso de um nível de confiança de 95%, o mais usual, z é obtido da forma descrita a seguir:
Como a tabela 53 dá a área sob a curva da distribuição gaussiana a partir do eixo de simetria, é 
preciso dividir a probabilidade de 95% por 2:
95% 0,95
0,4750
2 2
= =
Procurando por esse valor na tabela de áreas sob a gaussiana, vemos que ele é localizado no 
cruzamento das probabilidades 0,06 na horizontal e 1,9 na vertical (ver tabela a seguir), o que resulta em:
z 1 ,9 0,06 1 ,96= + =
150
Unidade IV
Tabela 56 – Áreas sob uma distribuição normal 
padrão, em relação ao valor médio para z = 1,96
z 0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359
0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753
0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141
0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517
0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879
0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224
0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549
0,7 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852
0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133
0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389
1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621
1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830
1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015
1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177
1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319
1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441
1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545
1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633
1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706
1,9 0,4713 0,47190,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767
2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817
2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857
2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890
2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916
2,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936
2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952
2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964
2,7 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974
2,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981
2,9 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986
3,0 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990
Essas ideias ficarão mais claras ao ler o texto a seguir, escrito em 2018.
151
ESTATÍSTICA
 Destaque
O que significam os números de uma pesquisa eleitoral?
Christiane Mazur Doi
Nos últimos meses, com as pesquisas feitas em função do período eleitoral em nosso 
país, temos visto e ouvido os termos “margem de erro”, “grau de confiança”, “tamanho da 
amostra” e muitos outros.
Qual é o sentido dessas expressões? E o que significam os números relacionados a elas?
Para responder a essas questões, podemos analisar uma situação específica, como a 
exposta a seguir.
Segundo pesquisa divulgada pelo Instituto Datafolha em 10 de outubro de 2018 
sobre o segundo turno da eleição presidencial no Brasil, o candidato Jair Bolsonaro tinha 
58% dos votos válidos e o candidato Fernando Haddad tinha 42% dos votos válidos.
O Datafolha também informou que:
• o levantamento de dados foi realizado em 10 de outubro de 2018;
• foram entrevistados 3.235 eleitores em 227 municípios;
• 6% dos entrevistados não sabiam em quem votar;
• 8% dos entrevistados votavam em branco ou anulavam o voto;
• a margem de erro foi de 2 pontos percentuais para cima ou para baixo;
• o nível de confiança da pesquisa foi de 95%.
Vamos analisar essa pesquisa.
Os resultados de votos válidos “valeram” para o dia em que a pesquisa foi feita e não 
são uma previsão do que vai realmente acontecer nas urnas. Vemos, inclusive, que os 6% de 
indecisos podem votar tanto em um candidato quanto no outro, ou podem anular seus votos.
A margem de erro de 2% de erro indica que, no momento da realização da entrevista, 
Bolsonaro poderia ter entre 56% (58% menos 2%) e 60% (58% mais 2%) e Haddad 
poderia ter entre 40% (42% menos 2%) e 44% (42% mais 2%).
152
Unidade IV
No entanto, como o nível de confiança da pesquisa foi de 95%, a chance, na ocasião, 
de um candidato ter entre 56% e 60% e do outro ter entre 40% e 44% foi de 95%. Ou 
seja, mesmo com a margem de erro, não há 100% de certeza da verdadeira intenção dos 
eleitores em 10 de outubro de 2018, mas há elevada probabilidade de os resultados da 
pesquisa coincidirem com essa intenção.
Há ainda que se considerar que o Brasil tem cerca de 5.570 munícipios e que, 
segundo Tribunal Superior Eleitoral (TSE), no primeiro turno das eleições, ocorrido em 7 
de outubro de 2018, houve o comparecimento de 117.364.560 eleitores, com 107.050.673 
de votos válidos.
O leitor pode pensar: uma pesquisa feita com 3.235 eleitores em 227 municípios 
pode ser válida para estimar o que pensam mais de 100 milhões de eleitores em mais de 
5.500 municípios?
A resposta é sim. Vejamos um exemplo que trata de um caso bem mais simples do que 
o caso que estamos analisando, mas útil para entendermos o problema.
Imagine que você compre uma garrafa com 750 mL de um vinho de altíssimo padrão. 
Você precisa tomar todo esse volume para atestar que o vinho é de excelência? Não. A 
ingestão de um cálice com 30 mL de vinho, ou até menos, é suficiente, pois esse volume 
é uma amostra que representa todo o conteúdo da garrafa.
De modo geral, quase sempre “o todo” (população) que queremos estudar é 
inacessível, pois é muito grande, como no caso de mais de 100 milhões de eleitores em 
mais de 5.500 municípios, ou é desconhecido. Assim, a ideia é coletar uma amostra para 
se fazer uma inferência sobre a população que queremos estudar.
Na pesquisa eleitoral que usamos como exemplo, a população é o eleitorado brasileiro 
com 16 anos ou mais. Uma amostra representativa dessa população deve ser formada por 
um conjunto de pessoas com as mesmas características de idade, gênero e distribuição 
regional da população, traduzindo fielmente o conjunto de todo o eleitorado. Ou seja, 
toda a diversidade da população deve “aparecer” na amostra na mesma proporção em 
que ocorre na população.
Concluímos que uma amostra de eleitores não deve ser necessariamente grande 
para representar o conjunto “completo” de eleitores: o importante é que o método de 
amostragem garanta a representatividade da amostra. Se esse método não for eficiente, 
uma amostra “muito grande”, com elevada quantidade de entrevistados pode não ser “boa”.
No caso de pesquisas eleitorais como as do Datafolha, trabalha‑se com amostra 
estratificada. Incialmente, os 5.570 municípios brasileiros são classificados em três 
estratos: capital, região metropolitana e interior. Para cada estrato, são feitas, com base 
em critérios estatísticos robustos, que incluem a proporcionalidade, a seleção aleatória 
do município que fará parte da amostra, a seleção aleatória dos pontos de abordagem do 
município e a seleção aleatória do entrevistado com base na distribuição de gênero e de 
faixa etária do eleitorado brasileiro.
153
ESTATÍSTICA
Enfim, números relacionados à “margem de erro”, ao “grau de confiança” e ao 
“tamanho da amostra” em pesquisas eleitorais não são simplesmente valores que fazem 
uma previsão de reais resultados: eles refletem a realidade da data da pesquisa e estão 
vinculados a probabilidades. São inferências.
Exemplo de aplicação
Em uma cotação de preços para a compra de um equipamento de informática, foram levantados 
10 orçamentos, e o preço médio foi de R$ 1.250,00 com desvio padrão igual a R$ 85,00. Determine 
o intervalo de confiança para o preço desse equipamento, considerando um nível de confiança 
de 95%.
Vimos que um intervalo de confiança de 95% implica z = 1,96. No problema, temos ainda x = 1250. 
Considerando o desvio padrão amostral igual ao desvio padrão populacional, temos σ= 85.
Calculando o erro amostral c para população infinita – considerando infinito o número de 
equipamentos existentes à venda, ou seja, uma quantidade muito grande –, temos o seguinte:
c z.
n
σ
=
85
c 1,96.
10
=
85
c 1,96.
3,162
=
c=1,96.26,88
c 52,68=
Escrevendo o intervalo de confiança, considerado o erro amostral c calculado, temos:
P(x c x c) 95%− <µ< + =
P(1250 52,68 1 250 52,68) 95%− <µ< − =
P(1197,32 1 302,68) 95%<µ< =
Logo, há a probabilidade de 95% de que o valor verdadeiro (valor médio de mercado, ou seja, para a 
população) do equipamento esteja entre R$1.197,32 e R$1.302,68.
154
Unidade IV
8 REGRESSÃO LINEAR SIMPLES
Na regressão linear, é ajustada uma reta aos dados. Antes de discutir a regressão em si, é importante 
tratar a respeito de funções lineares, ou funções do primeiro grau, cujos gráficos são retas.
A função do primeiro grau tem equação do tipo:
y a.x b= +
Na equação:
• x é a variável independente;
• y é a variável dependente;
• a é coeficiente angular;
• b é o coeficiente linear.
É dito que essa função é uma função do primeiro grau porque a variável independente x está 
elevada à primeira potência. Gráficos de funções do primeiro grau são retas.
 Observação
As letras usadas para representar a equação podem variar conforme 
o autor do material, mas o coeficiente linear é sempre o que “aparece” 
somando ou subtraindo. Nesse caso, o sinal faz parte do coeficiente. 
O coeficiente angular é sempre o que multiplica a variável.
Em uma equação y = m . x + p, m é o coeficiente angular e p é o 
coeficiente linear.
Exemplo de aplicação
Considerea função y 4x 2= + .
Sabendo que o coeficiente linear é o termo que apenas soma ou subtrai, conclui‑se que o coeficiente 
linear dessa equação é 2. Sabendo que o coeficiente angular é o que multiplica a variável independente x, 
conclui‑se que o coeficiente angular, no caso, é igual a 4.
O coeficiente linear dá informação sobre o cruzamento da reta do gráfico da função com o eixo y.
155
ESTATÍSTICA
O coeficiente angular dá informação sobre a inclinação da reta. Quanto maior o coeficiente 
angular, mais inclinada será a reta. O coeficiente angular ainda nos diz se a reta é crescente (a > 0) ou 
decrescente (a < 0).
2
1
‑1
‑2
‑1,0 1,0
x
y
‑0,5 0,5
Figura 40 – Gráfico da função y = 2x, como exemplo de reta crescente
2
1
‑1
‑2
‑1,0 1,0
x
y
‑0,5 0,5
Figura 41 – Gráfico da função y = –2x, como exemplo de reta decrescente
Exemplo de aplicação
Considere a equação y 5.x 1= − + . O que é possível dizer sobre o gráfico dessa equação?
Primeiramente, vê‑se que a variável x está elevada à potência 1. Logo, estamos tratando de uma 
função do primeiro grau, e seu gráfico é uma reta.
O termo independente da equação é igual a 1 e é o coeficiente linear dessa reta. Logo, a reta cruza 
o eixo y em y 1= .
A variável é multiplicada por –5, ou seja, o coeficiente angular é, no caso, igual a –5. Como o 
coeficiente angular é negativo (a < 0), a função tem como gráfico uma reta decrescente.
Na figura a seguir, é apresentado o gráfico da função y 5x 1= − + .
156
Unidade IV
2,5
2,0
1,5
1,0
0,5
‑0,5
x
y
0,30,20,1‑0,1‑0,2‑0,3
Figura 42 – Gráfico da função y = –5x + 1
Note que o gráfico da figura 42 é uma reta decrescente e que cruza o eixo y em y = 1.
8.1 Relação entre duas variáveis
Quando estudamos um processo, frequentemente desejamos saber se duas quantidades estão 
correlacionadas. Será que o número de usuários de uma rede está relacionado com o tempo de resposta 
nessa rede? Se essas quantidades estão relacionadas, como se dá essa relação? Quanto mais usuários, 
o tempo de resposta é maior ou menor? Qual será o tempo de resposta na rede quando houver 50 
usuários conectados?
São perguntas desse tipo que desejamos responder quando estudamos correlação de variáveis.
Um exemplo clássico de relação incomum é a venda de fraldas descartáveis e a venda de cervejas 
em supermercados.
Figura 43 – Fralda descartável
Disponível em: https://cutt.ly/DMc5qiB. Acesso em: 14 nov. 2022.
157
ESTATÍSTICA
 Saiba mais
GUROVITZ, H. O que cerveja tem a ver com fraldas? exame., São Paulo, 
18 fev. 2011. Disponível em: https://cutt.ly/gMDBz9F. Acesso em: 
14 nov. 2022.
MONTEIRO, F. Cervejas e fraldas, e essa estranha (cor)relação. Medium, 
San Francisco, 16 ago. 2020. Disponível em: https://cutt.ly/uMDBYBp. 
Acesso em: 14 nov. 2022.
A forma mais simples de verificar se há correlação entre duas grandezas é fazer um gráfico do tipo 
dispersão (scatter plot) com uma das variáveis no eixo vertical e a outra variável no eixo horizontal. 
Ao analisar o agrupamento dos pontos, é possível dizer se as variáveis são relacionadas e de que 
forma isso se dá.
 Saiba mais
Para saber como construir gráficos do tipo dispersão no Excel, acesse:
APRESENTAR seus dados em um gráfico de dispersão ou em um gráfico 
de linha. Microsoft, Redmond, [s.d.]. Disponível em: https://cutt.ly/RMDNkPu. 
Acesso em: 14 nov. 2022.
Para saber como construir gráficos do tipo dispersão em R, assista:
DIAGRAMA de dispersão no R – Como criar do Zero. 2020. 1 vídeo (7:55). 
Publicado por Mercel Santos. Disponível em: https://cutt.ly/FMDMs4n. 
Acesso em: 14 nov. 2022.
Para saber como construir um gráfico do tipo dispersão usando 
Python, acesse:
ROCHA, D. Gráfico de dispersão feito no Python Jupyter Notebook. 
RStudio, 10 nov. 2018. Disponível em: https://cutt.ly/iMDMDut. Acesso em: 
14 nov. 2022.
158
Unidade IV
O gráfico a seguir é um exemplo de gráfico de dispersão, feito com o objetivo de verificar se há 
relação entre a expectativa de vida e o PIB per capita para diferentes países.
Expectativa de vida 
(anos)
PIB per capita (US$)
0 20000 40000 60000 80000 100000 120000 140000
80
60
Figura 44 – Expectativa de vida em função do PIB per capita como exemplo de gráfico do tipo 
espalhamento para verificar se há correlação entre essas duas quantidades
8.2 Correlação linear
Ao analisar o gráfico de espalhamento para verificar se há correlação entre duas grandezas e se os 
pontos nesse gráfico se espalham ao longo de uma reta, define‑se se os dados apresentam correlação 
linear ou se são linearmente correlacionados.
Os dados podem ter:
• correlação linear positiva;
• correlação linear negativa;
• correlação não linear;
• nenhuma correlação.
159
ESTATÍSTICA
Exemplos de gráficos com dados com essas diferentes formas de correlação são apresentados 
a seguir:
x
3
2,5
2
1,5
1
0,5
0
y
0 0,2 0,4 0,6 0,8 1,21
Figura 45 – Dados com correlação linear positiva
Note que na figura 45 os pontos do gráfico apresentam comportamento linear e crescente, mesmo 
com espalhamento ao redor da reta. Conforme os valores de x aumentam, percebe‑se a tendência de 
aumento dos valores de y.
1
0,5
0
‑0,5
‑1
‑1,5
‑2
‑2,5
‑3
x
y
0 0,2 0,4 0,6 0,8 1,21
Figura 46 – Dados com correlação linear negativa
Note que na figura 46 os pontos do gráfico apresentam comportamento linear e decrescente, 
mesmo com espalhamento ao redor dessa reta. Conforme os valores de x aumentam, percebe‑se a 
tendência de diminuição dos valores de y.
160
Unidade IV
x
0,35
0,3
0,25
0,2
0,15
0,1
0,05
0
y
0 0,2 0,4 0,6 0,8 1,21
Figura 47 – Dados com correlação não linear
Note que na figura 47 os pontos do gráfico não passam aproximadamente sobre uma reta, mesmo 
considerando o espalhamento dos dados. Nela, os dados parecem seguir uma parábola.
1,2
1
0,8
0,6
0,4
0,2
0
y
x
0,80 0,20,1 0,40,3 0,60,5 0,7 10,9
Figura 48 – Dados não correlacionados
Observe que na figura 48 os pontos estão espalhados na área do gráfico sem seguir 
comportamento algum.
161
ESTATÍSTICA
Muitas vezes não é possível dizer se os pontos estão espalhados ao longo de uma reta, 
principalmente quando o espalhamento dos dados é grande. Então, é preciso calcular o coeficiente 
de correlação linear para ser possível dizer se os dados são correlacionados linearmente ou não.
8.3 Coeficiente de correlação linear
O coeficiente de correlação linear de Pearson dá uma medida do grau de correlação entre duas 
grandezas, além de fornecer o sinal dessa correlação, que diz se os dados são direta ou inversamente 
relacionados.
O coeficiente de correlação linear de Pearson é representado por r e é calculado pela seguinte 
expressão:
( ) ( )
n n n
i i i ii 1 i 1 i 1
2 2n n n n2 2
i i i ii 1 i 1 i 1 i 1
n. x .y x . y
r
n. x x . n. y y
= = =
= = = =
−
=
− −
∑ ∑ ∑
∑ ∑ ∑ ∑
Na igualdade, temos que:
• xi é o um valor qualquer da variável x.
• yi é o um valor qualquer da variável y, correspondente a xi.
• n é o número de pares de dados.
Para simplificar o cálculo dessa equação, pode‑se calcular cada somatório separadamente para, 
depois, calcular o coeficiente de correlação, o que pode ser feito da seguinte forma:
( ) ( )
xy x y
22
2 x 2 yx y
n.S S .S
r
n.S S . n.S S
−
=
− −
Na equação:
n
xy i i
i 1
S x .y
=
=∑
n
x i
i 1
S x
=
=∑
162
Unidade IV
n
y i
i 1
S y
=
=∑
n
2
2 ix
i 1
S x
=
=∑
n
2
2 iy
i 1
S y
=
=∑
O valor do coeficiente de correlação linear de Pearson varia sempre entre ‑1 e +1 e é uma 
quantidade adimensional – ou seja, sem unidade.
O coeficiente de correlação linear de Pearson dá a informação sobre correlação da forma mostrada 
a seguir.
• r 1=− → correlação linear perfeita negativa.
• r 0= → dados sem correlação.
• r 1=+ → correlação linear perfeita positiva.
Dessa maneira:
• quanto mais perto o coeficiente r estiver do valor +1, maior será a correlação linear positiva 
dos dados;
• quanto mais perto o coeficiente r estiver do valor ‑1, maior será a correlação linear negativa 
dos dados;• quanto mais perto o coeficiente r estiver de zero, menor será a correlação dos dados.
Exemplo de aplicação
Considere os dados a seguir:
Tabela 57 – Dados para estudo de correlação
x y
1 2
3 6
2 3
1 1
163
ESTATÍSTICA
Para analisar se os dados estão correlacionados, calcula‑se o coeficiente de correlação linear r de 
Pearson, dado por:
( ) ( )
xy x y
22
2 x 2 yx y
n.S S .S
r
n.S S . n.S S
−
=
− −
Calculando primeiro cada um dos somatórios, lembrando que são 4 dados de x e 4 dados de y, e, 
portanto, n = 4, tem‑se o seguinte:
n
xy i i
i 1
S x .y
=
=∑
xyS 1.2 3.6 2.3 1.1= + + +
xyS 2 18 6 1= + + +
xyS 27=
n
x i
i 1
S x
=
=∑
xS 1 3 2 1= + + +
xS 7=
n
y i
i 1
S y
=
=∑
yS 2 6 3 1= + + +
yS 12=
n
2
2 ix
i 1
S x
=
=∑
164
Unidade IV
2 2 2 2
2x
S 1 3 2 1= + + +
2x
S 1 9 4 1= + + +
x
S 15=
n
2
2 iy
i 1
S y
=
=∑
2 2 2 2
2y
S 2 6 3 1= + + +
2y
S 4 35 9 1= + + +
2y
S 50=
Substituindo os cálculos anteriores na expressão do coeficiente de correlação linear r de Pearson, 
lembrando que, para este caso, n = 4, temos:
( ) ( )
xy x y
22
2 x 2 yx y
n.S S .S
r
n.S S . n.S S
−
=
− −
( )22
4.27 7.12
r
4.15 7 . 4.50 12
−
=
− −
Fazendo os cálculos, ficamos com:
108 84
r
60 49. 200 144
−
=
− −
24
r
11. 56
=
24
r
3,3166 . 7,4833
=
165
ESTATÍSTICA
24
r
24,8193
=
r 0,97=
Chega‑se, assim, a um coeficiente de correlação linear de Pearson r = 0,97, o que indica forte 
correlação linear positiva dos dados – ou seja, quando x aumenta, espera‑se também o aumento de y.
A figura a seguir mostra o gráfico de dispersão desses dados, demonstrando a forte correlação 
linear positiva.
y
6
4
2
1 2 2 3 3
x
Figura 49 – Gráfico de dispersão do conjunto de dados do exemplo
No exemplo anterior, havia forte correlação entre os dados. Vamos ver mais um exemplo de cálculo 
do fator de correlação de Pearson.
Exemplo de aplicação
Considere os dados a seguir:
Tabela 58 – Dados para estudo de correlação
x y
1 1
2 1
3 1
4 0
166
Unidade IV
Para verificar se os dados estão correlacionados, calcula‑se o coeficiente de correlação linear r de 
Pearson, dado por:
( ) ( )
xy x y
22
2 x 2 yx y
n.S S .S
r
n.S S . n.S S
−
=
− −
Calculando primeiro cada um dos somatórios, lembrando que são 4 dados de x e 4 dados de y, e, 
portanto, n = 4, temos o seguinte:
n
xy i i
i 1
S x .y
=
=∑
xyS 1.1 2.1 3.1 4.0= + + +
xyS 1 2 3= + +
xyS 6=
n
x i
i 1
S x
=
=∑
xS 1 2 3 4= + + +
xS 10=
n
y i
i 1
S y
=
=∑
yS 1 1 1 0= + + +
yS 3=
n
2
2 ix
i 1
S x
=
=∑
167
ESTATÍSTICA
2 2 2 2
2x
S 1 2 3 4= + + +
2x
S 1 4 9 16= + + +
2x
S 30=
n
2
2 iy
i 1
S y
=
=∑
2 2 2 2
2y
S 1 1 1 0= + + +
2y
S 1 1 1= + +
2y
S 3=
Substituindo os cálculos anteriores na expressão do coeficiente de correlação linear r de Pearson, 
lembrando que, para este caso, n = 4, temos:
( ) ( )
xy x y
22
2 x 2 yx y
n.S S .S
r
n.S S . n.S S
−
=
− −
Fazendo os cálculos, ficamos com:
2 2
4.6 10.3
r
4.30 10 . 4.3 3
−
=
− −
24 30
r
120 100. 12 9
−
=
− −
6
r
20. 3
−
=
6
r
4,4721 .1 ,7320
−
=
168
Unidade IV
6
r
7,7460
−
=
r 0,77= −
Chega‑se a um coeficiente de correlação linear de Pearson r 0,77= − , o que indica correlação linear 
negativa dos dados – ou seja, quando x aumenta, espera‑se também a diminuição de y.
A figura a seguir mostra o gráfico de dispersão do conjunto de dados do exemplo.
y
1,0
0,5
0,0
1 2 2 3 3 4 4
x
Figura 50 – Gráfico de dispersão dos dados do exemplo
Note que, no gráfico, a correlação linear dos dados não fica tão evidente como no exemplo 
anterior, e a existência de correlação precisa do cálculo do coeficiente de correlação linear de Pearson 
para ser confirmada.
Mesmo ao estudar a correlação entre dois conjuntos de dados é preciso ficar atento, porque 
nem sempre a correlação está relacionada a uma relação de causa e efeito. Por exemplo, pode haver 
correlação entre a migração de pássaros na Austrália e o peso do sanduíche da lanchonete da sua rua, 
mas, certamente, não há relação de causa e efeito entre essas duas quantidades.
8.4 Ajuste de reta aos dados
Caso seja notado que a correlação entre duas variáveis tem comportamento linear, pode‑se ajustar 
uma reta sobre esses dados. A equação da reta ajustada pode ser usada para fazer predições da grandeza 
que foi medida. A seguir, será abordado como fazer esse ajuste de reta.
É importante conhecermos os métodos não só de ajuste de reta para não tratarmos essas ferramentas 
como caixas‑pretas, mas sim entendermos o processo de cálculo e as suas limitações.
169
ESTATÍSTICA
8.4.1 Método dos mínimos quadrados
Em um processo de tomada de dados, são obtidas informações de duas variáveis, x e y, além da 
incerteza σ associada à variável y. Se temos n dados, eles podem ser representados por:
( ) ( ) ( ) ( )1 1 1 2 2 2 3 3 3 n n nx ,y , , x ,y , , x ,y , x ,y ,σ σ σ … σ
Aqui, considera‑se a variável x isenta de erros.
 Observação
Também chamamos a incerteza associada a uma medida de erro. 
Isso não significa que a medida esteja errada, mas que ela apenas não é 
totalmente precisa. A medida é afetada por erros sistemáticos, por erros 
aleatórios e, possivelmente, por erros grosseiros.
 Saiba mais
Para saber mais sobre os tipos de erros ou incertezas presentes no 
processo de medição de uma grandeza, acesse:
WATANABE, E. H. Erro de medição. Instituto Federal de Santa Catarina, 
Joinville, 13 fev. 2019. Disponível em: https://cutt.ly/bMD9Hex. Acesso em: 
14 nov. 2022.
O método da máxima verossimilhança diz que a melhor função f(x) que pode ser ajustada a um 
conjunto de dados é aquela que, se admitida como verdadeira, é mais verossímil possível com os 
pontos experimentais.
 Observação
Verossímil é um adjetivo cuja definição é:
“Que aparenta ser verdadeiro; sobre algo cuja verdade não se duvida: 
uma descrição verossímil.
Admissível ou realizável por não se opor à verdade; que não repugna à 
verdade; plausível: história verossímil (VEROSSÍMIL…, c2022).
170
Unidade IV
O método dos mínimos quadrados pode ser deduzido a partir do método da máxima 
verossimilhança, supondo que as distribuições de erros são gaussianas e que a melhor função f(x) 
ajustada aos dados tem forma e número de parâmetros predefinidos.
O método dos mínimos quadrados dá os coeficientes da função ajustada, mas não diz qual função 
devemos ajustar aos dados, o que deve ser decidido por quem analisa os dados.
O método dos mínimos quadrados, como o nome diz, minimiza o quadrado da distância entre a 
função ajustada e os pontos experimentais.
Considere que yi representa os pontos experimentais e que f(xi; a1, a2, a3, … , aP) representa a função 
que queremos ajustar aos dados, de grau p e de parâmetros a1, a2, a3, … , aP, dada por:
( ) 2 P1 2 3 p 1 2 i 3 i P if xi; a , a , a , , a a a .x a . x a . x… = + + +…+
O método dos mínimos quadrados tem como objetivo minimizar a quantidade S dada por:
( )
n 2
i i 1 2 p
i 1
S y f x ;a ,a , ,a
=
 = − … ∑
Figura 51 – Exemplo da distância entre os pontos 
experimentais (em azul) e a função ajustada (em vermelho)
Na figura 51 é mostrada a distância para o terceiro ponto da figura. O método dos mínimos 
quadrados minimiza o quadrado dessa distância para todos os pontos experimentais.
Os ajustes de reta apresentados a seguir, tanto para incertezas diferentes quanto para incertezas 
iguais, são uma aplicação do método de mínimos quadrados para o ajuste de funções – no caso, de 
funções lineares.
171
ESTATÍSTICA
8.4.2 Ajuste de reta para incertezas diferentes
Considere a variável y medida em função da variável x. Considere também que há incertezas σ 
associadas apenas à variável y.
O conjunto de n dados experimentais pode, portanto, ser escrito da seguinte forma:
( ) ( ) ( ) ( )1 1 1 2 2 2 3 3 3 n n nx ,y , , x ,y , , x ,y , x ,y ,σ σ σ … σ
Ajustando sobre esses dados uma reta de equação y = a.x + b, os coeficientes angular e linear dessa 
reta ajustada são dados, respectivamente, por:
( )xy x y1a . S .S S .Sσ=−∆
( )2 y x xyx1b . S .S S .S= −∆
Na equação:
n
2
i 1 i
1
Sσ
=
=
σ
∑
n
i
x 2
i 1 i
x
S
=
=
σ
∑
n 2
i
2 2x
i 1 i
x
S
=
=
σ
∑
n
i
y 2
i 1 i
y
S
=
=
σ
∑
n
i i
xy 2
i 1 i
x .y
S
=
=
σ
∑
( )22 xxS .S Sσ∆ = −
172
Unidade IV
As variâncias dos coeficientes angular e linear da reta ajustada são dadas, respectivamente, por:
2
a
Sσσ =
∆
22 x
b
S
σ =
∆
A covariância dos coeficientes angular e linear é dada por:
( ) xScov a,b = −
∆
Exemplo de aplicação
O resistor é o componente elétrico que se opõe à passagem de corrente elétrica. Considere as 
medidas da tensão V e da intensidade de corrente I em um resistor mostradas na tabela a seguir.
Tabela 59 – Medidas de tensão e corrente em um resistor
I (A) V (V) 𝜎V (V)
0,10 9,5 0,8
0,20 21,4 1,2
0,30 28,0 1,4
0,40 38,7 1,2
Destaca‑se a seguir o gráfico das duas grandezas medidas para analisar se os dados podem ser 
ajustados por uma reta.
I (A)
40
30
20
10
0
V (V)
0 0,1 0,2 0,3 0,50,4
Figura 52 – Gráfico de tensão V em função da intensidade 
de corrente elétrica I para os valores da tabela 59
173
ESTATÍSTICA
Vê‑se, no gráfico da figura 52, que os dados podem ser ajustados por uma reta crescente. Como cada 
valor de tensão tem uma incerteza associada diferente, é necessário fazer o ajuste de reta para o caso 
de incertezas diferentes.
Começa‑se calculando os coeficientes S e ∆ para, em seguida, calcular os coeficientes angular e 
linear da reta ajustada. Note que temos I no eixo x e V no eixo y do gráfico (pois trabalhamos com as 
incertezas no eixo y). Logo, xi corresponde aos valores de intensidade de corrente I e yi corresponde aos 
valores de tensão V.
n
2
i 1 i
1
Sσ
=
=
σ
∑
2 2 2 2
1 1 1 1
S
0,8 1,2 1,4 1,2
σ = + + +
1 1 1 1
S
0,64 1,44 1,96 1,44σ
= + + +
S 1,562 0,694 0,510 0,694σ = + + +
S 3,46σ =
n
i
x 2
i 1 i
x
S
=
=
σ
∑
x 2 2 2 2
0,10 0,20 0,30 0,40
S
0,8 1,2 1,4 1,2
= + + +
x
0,10 0,20 0,30 0,40
S
0,64 1,44 1,96 1,44
= + + +
xS 0,156 0,139 0,153 0,278= + + +
xS 0,73=
n 2
i
2 2x
i 1 i
x
S
=
=
σ
∑
174
Unidade IV
2 2 2 2
2 2 2 2 2x
0,10 0,20 0,30 0,40
S
0,8 1,2 1,4 1,2
= + + +
2x
0,01 0,04 0,09 0,16
S
0,64 1,44 1,96 1,44
= + + +
2x
S 0,016 0,0278 0,0459 0,111= + + +
2x
S 0,20=
n
i
y 2
i 1 i
y
S
=
=
σ
∑
y 2 2 2 2
9,5 21,4 28,0 38,7
S
0,8 1,2 1,4 1,2
= + + +
y
9,5 21,4 28,0 38,7
S
0,64 1,44 1,96 1,44
= + + +
yS 14,844 14,861 14,286 26,875= + + +
xS 70,87=
n
i i
xy 2
i 1 i
x .y
S
=
=
σ
∑
xy 2 2 2 2
0,10.9,5 0,20.21,4 0,30.28,0 0,40.38,7
S
0,8 1,2 1,4 1,2
= + + +
xy
0,950 4,280 8,400 15,480
S
0,64 1,44 1,96 1,44
= + + +
xyS 1,484 2,972 4,286 10,750= + + +
xyS 19,49=
175
ESTATÍSTICA
( )22 xxS .S Sσ∆ = −
( )23,46.0,20 0,73∆ = −
0,692 0,533∆ = −
0,16∆ =
Calculando os coeficientes angular e linear da reta ajustada, temos:
( )xy x y1a . S .S S .Sσ= −∆
( )1a . 3,46 .1 9,49 0,73 . 70,87
0,16
= −
( )1a . 67,435 51,735
0,16
= −
15,700
a
0,16
=
a 98,13=
( )2 y x xyx1b . S .S S .S= −∆
( )1b . 0,20.70,87 0,73.19,49
0,16
= −
( )1b . 14,174 14,228
0,16
= −
0,0537
b
0,16
−
=
b 0,33= −
176
Unidade IV
Logo, a equação que ajusta os dados é dada por:
y a.x b= +
y 98,13.x 0,33= −
Como são usadas a tensão V no eixo y e a intensidade da corrente I no eixo x, a forma correta de 
escrever a equação de reta ajustada aos dados é:
V 98,13.I 0,33= −
Para verificar se essa reta ajustada está correta, podemos construir um gráfico dos dados e da 
reta ajustada:
I (A)
50
40
30
20
10
0
V 
(V
)
0 0,1 0,2 0,3 0,50,4
Figura 53 – Dados de tensão e corrente como pontos em azul e reta ajustada em vermelho
Pelo gráfico da figura anterior, vemos que a reta se ajusta bem aos pontos, seguindo o comportamento 
dos pontos no gráfico.
177
ESTATÍSTICA
 Saiba mais
No exemplo anterior, usamos dados de tensão e de intensidade 
corrente de um resistor, e não foi preciso usar conceitos de eletricidade 
para ajustarmos uma reta aos dados fornecidos.
Caso você queira saber o que é tensão e o que é corrente elétrica, leia:
O QUE é tensão e corrente elétrica? Click Geradores, Ibirama, 15 dez. 
2021. Disponível em: https://cutt.ly/TMFr6iw. Acesso em: 14 nov. 2022.
Figura 54 – Placa de circuito eletrônico
Disponível em: https://cutt.ly/SMQNkIn. Acesso em: 14 nov. 2022.
8.4.3 Ajuste de reta para incertezas iguais
Quando as incertezas associadas a cada dado experimental são iguais, o cálculo do ajuste de reta 
aos dados torna‑se mais simples.
O conjunto de n dados experimentais pode, nesse caso, ser escrito da seguinte forma:
( ) ( ) ( ) ( )1 1 2 2 3 3 n nx ,y , , x ,y , , x ,y , x ,y ,σ σ σ … σ
178
Unidade IV
Ajustando sobre esses dados uma reta de equação y a.x b= + , os coeficientes angular e linear dessa 
reta ajustada são dados, respectivamente, por:
( )xy x y1a . s .s s .sσ= −∆
( )2 y x xyx1b . s .s s .s= −∆
Na equação:
2
1
s nσ =
σ
n
x i
i 1
s x
=
=∑
n
3
2 ix
i 1
s x
=
=∑
n
y i
i 1
s y
=
=∑
n
xy i i
i 1
s x .y
=
=∑
( )22 xxs .s sσ∆ = −
Desse modo, as variâncias dos coeficientes angular e linear da reta ajustada são dadas, nesse caso, 
respectivamente, por:
2 2
a
s
.σσ = σ
∆
22 2x
b
s
.σ = σ
∆
179
ESTATÍSTICA
8.5 Coeficiente de determinação
O coeficiente de determinação é indicado por R2 e tem como objetivo indicar quão adequada foi a 
escolha de determinada função para ser ajustada a um conjunto de pontos experimentais. O valor de R2 
pode ser expresso como um número entre 0 e 1 ou na forma de porcentagem.
 Lembrete
Como vimos quando estudamos probabilidades, para converter um 
número para porcentagem, basta multiplicá‑lo por 100%. Dessa forma:
0,70 .1 00% 70%=
O coeficiente de determinação R2 é calculado por:
2 res
tot
SQ
R 1
SQ
= −
Na equação:
( )
n
res i i
i 1
ˆSQ y y
=
= −∑
( )
n
tot i i
i 1
SQ y y
=
= −∑
Temos o seguinte:
• n é o número de dados;
• yi é o valor observado para a grandeza;
• ŷ é o valor previsto pela função ajustada para a grandeza yi;
• ȳ é o valor médio para a grandeza yi.
O coeficiente de determinação calculado dessa forma tem um inconveniente: quanto maior o 
número de parâmetros da função, maior o coeficiente de determinação. Isso passa uma falsa ideia de 
que é sempre melhor usar funções com mais parâmetros, o que não é verdade. Para contornar esse 
problema, usa‑se o coeficiente de explicação ajustado, dado por:
180
Unidade IV
( ) ( )
2 2n 1R 1 . 1 R
n k 1
−
= − −
− +
Na equação:
• k é o número de parâmetros da função ajustada;
• n é o número de dados;
• R é o coeficiente de determinação.
8.6 Funções linearizáveis
Podemos ter funções que, a princípio, não têm gráficos lineares (ou seja, representados por uma 
reta), mas que, com algumas adaptações, podem ter os gráficos são linearizados.
Por exemplo, considere a função matemática a seguir.
by a.x=
Na equação, a e b são constantes, ou seja, são números. O gráfico desse tipo de função é uma reta 
apenas se b 1= . Nos demais casos, o gráfico não é linear.
 Lembrete
Vimos que a função de primeiro grau y a.x b= + tem esse nome porque 
a variável x está elevada à primeira potência, e seu gráfico é uma reta.
4
3
2
1
y
x
‑1,0 ‑0,5 0,5 1,0
Figura 55 – Gráfico da função 2y 3.x= , função do tipo by a.x= , 
com a = 3 e b = 2, mostrando que o gráfico não é linear
181
ESTATÍSTICA
 Observação
O logaritmo de uma função é indicado por ( )\y log x= e tem como 
operação inversa a potência, ou seja, x = ya. Na equação do logaritmo, a 
é a base do logaritmo. Quando essa base não é indicada, ela é igual 
a 10, ou seja, ( ) ( )10log x log x= .
Vamos precisar de algumas propriedades de logaritmos, listadas 
a seguir:
( ) ( ) ( )log a.b log a log b= +
( ) ( )blog a b.log a=
Uma forma de linearizar o gráfico de funções do tipo y = a.xb, com a e b constantes, é calcular o 
logaritmo dos dois lados da função.
by a.x=
( ) ( )blog y log a.x=
Como o logaritmo do produto é igual à soma dos logaritmos, temos:
( ) ( ) ( )blog y log a log x= +
Sobre oexpoente dentro da função logarítmica, podemos fazer:
( ) ( ) ( )log y log a b.log x= +
Se compararmos essa equação com uma equação de reta, teremos:
( ) ( ) ( )log y log a b.log x= +
Y A B .X= +
Então, se no eixo y do gráfico for colocado o logaritmo dos valores de y e no eixo x do gráfico 
for colocado o logaritmo dos valores de x, a função passa a ser linearizada (ou seja, seu gráfico 
torna‑se uma reta).
182
Unidade IV
A figura a seguir apresenta o gráfico da função 2y 3.x= , mas com eixos em escala logarítmica.
10
1
0,1
0,01
0,1 1
Figura 56 – Gráfico da função y = 3 . x2, com ambos os eixos em escala logarítmica
Quando é usada a escala logarítmica nos eixos dos gráficos, é necessário estar atento ao fato de que 
logaritmo de zero e de valores negativos não podem ser calculados. Então, não é possível simplesmente 
“pegar” um gráfico que passa pela origem e aplicar a escala logarítmica nos eixos. Na figura 56, foi 
utilizado apenas um trecho do gráfico da figura 55, com valores de x positivos, para mudar a escala do 
gráfico para escala logarítmica.
Note que a escala dos eixos do gráfico da figura anterior não é linear. Temos no eixo y os 
seguintes valores:
0,010,1110
Esses valores aparecem igualmente espaçados no eixo do gráfico, o que é uma indicação de que o 
gráfico está na escala logarítmica.
A figura a seguir apresenta novamente o gráfico da expectativa de vida em função do PIB per capita, 
mas agora em escala logarítmica.
183
ESTATÍSTICA
PIB per capita (US$)
1000,0 2000,0 5000,0 10000,0 20000,0 50000,0 100000,0
Expectativa de vida 
(anos)80
70
60
50
Figura 57 – Gráfico da expectativa de vida em função 
do PIB per capita em escala logarítmica em ambos os eixos
Um ponto importante é que não é preciso calcular o logaritmo dos valores para fazer isso, dado que 
a maioria dos programas de plotagem de gráficos permite aplicar escalas logarítmicas aos eixos dos 
gráficos. Se o gráfico for feito à mão, há um papel próprio, chamado de papel dilog, ou log‑log, que já 
faz com que o gráfico seja linearizado.
 Saiba mais
Para saber como alterar a escala dos eixos de um gráfico do Excel para 
escala logarítmica, leia:
ALTERAR a escala do eixo vertical (valor) em um gráfico. Microsoft, 
Redmond, [s.d.]. Disponível em: https://cutt.ly/7MFyNyr. Acesso em: 
14 nov. 2022.
Uma desvantagem dos gráficos em escala logarítmica é que eles podem não ser compreendidos 
por pessoas sem conhecimentos de matemática, o que faz com que esse tipo de gráfico não seja o 
mais adequado para apresentações para qualquer público, como no caso de gráficos de reportagens.
184
Unidade IV
 Resumo
Segundo Morettin (2019, p. 46), “variável aleatória é uma função que 
associa a todo evento pertencente a uma partição do espaço amostral 
um único número real”. Uma variável aleatória é dita discreta se assume 
apenas determinados valores, e não qualquer valor contido em um 
intervalo de valores (nesse caso teríamos uma variável contínua). Um 
exemplo de quantidades discretas está nos resultados do lançamento de 
um dado, em que podemos obter apenas números inteiros de 1 a 6, e nunca 
números fracionários.
Vimos que Morettin (2019, p. 46) define a função de probabilidade 
como “a função que associa cada valor assumido pela variável aleatória 
à probabilidade do evento correspondente”. O autor define, ainda, a 
distribuição de probabilidade como o conjunto formado pelos valores das 
variáveis aleatórias e duas probabilidades correspondentes.
A distribuição de probabilidades pode ser representada de forma 
gráfica, colocando‑se os valores da variável aleatória no eixo horizontal 
e as probabilidades correspondentes no eixo vertical. Como estamos 
tratando de uma variável discreta, o gráfico será composto por pontos, e 
não podemos traçar uma curva sobre esses pontos.
O valor esperado de uma variável aleatória, também conhecido como 
esperança matemática, é igual ao valor médio dessa variável.
O valor esperado de uma variável aleatória X, indicado por E(X), é 
calculado pela média ponderada dos valores assumidos pela variável, em 
que os pesos são as probabilidades:
( ) ( )
N
i i
i 1
E X x .p x
=
=∑
A variância de uma variável aleatória e discreta X, representada por 
VAR(X), é calculada por:
( ) ( ) ( )
N
2
i x i
i 1
VAR X x .p x
=
= −µ∑
185
ESTATÍSTICA
Na equação, xi representa cada valor da variável aleatória, µx representa 
o valor verdadeiro (ou valor médio) da grandeza e p(xi) representa a 
probabilidade de ocorrência de cada valor da variável aleatória xi.
A variância ainda pode ser indicada por V(X), σ2(X), σX
2 ou σ2. 
A variância é um indicador de dispersão, ou seja, fornece uma medida do 
espalhamento dos dados.
A distribuição binomial é uma distribuição discreta de probabilidades 
que se aplica ao processo de amostragem que tiver as seguintes 
características:
• em cada tentativa, há apenas dois resultados possíveis, chamados de 
sucesso e fracasso, que são mutuamente exclusivos;
• os eventos de uma série de tentativas são independentes;
• o processo é estacionário, ou seja, a probabilidade de sucesso não 
varia entre uma tentativa e outra.
A probabilidade P(X) de termos X sucessos em N tentativas é dada pela 
seguinte expressão:
( ) X N XN,XP X C .p .q −=
Escrevendo explicitamente o binômio CN,X, temos:
( ) ( )
X N XN!P X .p .q
X!. N X !
−=
−
A distribuição normal de probabilidades é uma distribuição de 
probabilidades contínua, simétrica em relação à média, e cuja curva tem 
o formato de uma gaussiana. Essa curva é chamada de função densidade 
de probabilidade (fdp). A probabilidade de ocorrência de um evento está 
relacionada com a área sob a curva da função densidade de probabilidade.
Em uma distribuição normal de probabilidades, temos o que segue.
x x x−σ< < + σ → p = 68%
x 2. x x 2.− σ< < + σ → p = 95%
x 23 x x 3.− σ< < + σ → p = 99,7%
186
Unidade IV
A probabilidade de um valor estar no intervalo entre uma vez o desvio 
padrão, tanto para o lado negativo como para o lado positivo, é de 68% para 
uma distribuição normal. A probabilidade de um valor estar no intervalo 
dentro de 2 vezes o desvio padrão, tanto para o lado negativo como para 
o positivo, é de 95%. Já a probabilidade de um valor estar no intervalo 
limitado por 3 vezes o desvio padrão, tanto para o lado negativo como para 
o positivo, é de 99,7%. Outra implicação disso é que a probabilidade de um 
valor estar além de 3 vezes o desvio padrão é cerca de 0,3%.
A função densidade de probabilidade de uma distribuição normal de 
média x e desvio padrão σ é dada por:
( )
21 x x
.
21f x .e
. 2.
− −  σ =
σ π
Podemos converter qualquer distribuição normal de probabilidades 
em uma distribuição normal padronizada, convertemos os valores x da 
distribuição em valores padronizados z usando a seguinte expressão:
x x
z
−
=
σ
A conversão para uma distribuição normal padronizada faz com 
que possamos usar uma tabela para obter as probabilidades, sem que 
tenhamos que realizar cálculos usando a equação da função densidade de 
probabilidade que vimos anteriormente. Essa tabela é mostrada a seguir.
Tabela 60 – Áreas sob uma distribuição normal 
padrão, em relação ao valor médio
z 0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359
0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753
0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141
0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517
0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879
0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224
0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549
0,7 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852
0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133
0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,33650,3389
187
ESTATÍSTICA
z 0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621
1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830
1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015
1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177
1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319
1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441
1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545
1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633
1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706
1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767
2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817
2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857
2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890
2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916
2,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936
2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952
2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964
2,7 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974
2,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981
2,9 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986
3,0 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990
Para usarmos essa tabela, podemos partir do valor de z e procurar a 
combinação entre linha e coluna até obtermos esse valor. Por exemplo, a 
área sob a gaussiana para z = 1,42 é obtida por 1,4 + 0,02, e essa área está 
no cruzamento da linha 1,4 com a coluna 0,02, o que dá a área de 0,4222 
(ver tabela a seguir).
Tabela 61 – Áreas sob uma distribuição normal padrão, 
em relação ao valor médio para z = 1,42
z 0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359
0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753
0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141
0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517
0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879
0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224
0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549
0,7 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852
0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133
188
Unidade IV
z 0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389
1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621
1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830
1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015
1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177
1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319
1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441
1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545
1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633
1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706
1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767
2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817
2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857
2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890
2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916
2,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936
2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952
2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964
2,7 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974
2,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981
2,9 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986
3,0 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990
Lembre‑se de que essas tabelas fornecem a área entre o meio da curva e 
o z que procuramos. Assim, se quisermos a área entre dois lados da curva 
simétricos, devemos dobrar o valor obtido na tabela.
A tabela também pode ser usada no sentido inverso, em que consultamos 
um valor de probabilidade e, a partir da posição desse valor, obtemos o 
valor de z pela soma da linha e da coluna da probabilidade desejada.
A inferência estatística é o processo estatístico que tem como 
objetivo fazer generalizações de uma população a partir de uma amostra. 
A inferência estatística envolve a amostragem, os estimadores e os 
intervalos de confiança, conceitos que detalharemos a seguir.
A seleção de uma amostra de uma população é chamada levantamento 
amostral. Esse levantamento amostral pode ser de dois tipos, probabilístico 
ou não probabilístico.
189
ESTATÍSTICA
Os levantamentos amostrais probabilísticos podem ser classificados 
em amostragem aleatória simples, sistemática, estratificada ou por 
conglomerados.
Na amostragem aleatória simples, todos os elementos de uma 
população têm igual probabilidade de serem selecionados para a amostra. 
Nesse processo de seleção, é comum sortearmos aleatoriamente os 
elementos da população que irão compor a amostra. Esse é o método 
mais simples de compor uma amostra.
Na amostragem aleatória sistemática, os elementos da população são 
selecionados de acordo com critérios pré‑estabelecidos, como seleção pela 
inicial do nome, por exemplo. Esse processo de amostragem é bastante 
usado para compor amostras em pesquisas de opinião.
Na amostragem aleatória estratificada, a população é dividida em 
grupos homogêneos, chamados de estratos, e, em seguida, é feita uma 
amostragem aleatória simples dentro de cada estrato. Os estratos podem 
ser faixas salariais em uma empresa ou faixas etárias de uma população, 
por exemplo.
Na amostragem aleatória por conglomerados, a população é dividida 
por áreas geográficas, e é feita então uma amostragem simples em uma 
pequena área geográfica.
Os levantamentos amostrais não probabilísticos podem ser classificados 
em amostragem não aleatória intencional, voluntária ou acidental.
Na amostragem não aleatória intencional, o pesquisador escolhe 
uma característica da população para compor sua amostra, por exemplo, 
selecionando pessoas pelo seu time de futebol.
Na amostragem não aleatória voluntária, as pessoas tomam a iniciativa 
de fazer parte da amostra, oferecendo‑se para participar da pesquisa.
Na amostragem não aleatória acidental, os elementos que compõem 
a amostra são escolhidos sem nenhum critério estabelecido, por exemplo, 
selecionar todas as pessoas que passam por determinada rua.
Definimos estimador como uma grandeza obtida a partir de observações 
de uma amostra. Ele é um indicador de um parâmetro desconhecido 
da população.
Chamamos de estimativa o valor atribuído a um estimador. A estimativa 
de um parâmetro pode ser feita de duas formas: por ponto ou por intervalo.
190
Unidade IV
A estimativa por ponto é o nome dado ao valor obtido a partir de 
cálculos estatísticos com os elementos da amostra, servindo como uma 
aproximação do parâmetro estimado. A estimativa por intervalo não é 
feita por um único valor, mas por uma faixa de valores, considerados uma 
aproximação do parâmetro estimado. As estimativas por intervalo são 
relacionadas ao intervalo de confiança. Em geral, calculamos intervalos 
de confiança que tenham a chance de 95% de conter o valor verdadeiro.
O nível de confiança