Prévia do material em texto
Inferência Estatística
Material Teórico
Responsável pelo Conteúdo:
Prof.ª Me. Adriana Domingues Freitas
Revisão Textual:
Prof.ª Dr.ª Luciene Oliveira da Costa Granadeiro
Inferência Estatística e Conceitos de Probabilidade
• Inferência Estatística;
• População e Amostra, Parâmetros e Estimadores;
• A Ideia de Probabilidade;
• Propriedades da Probabilidade de Eventos Aleatórios;
• Modelos Probabilísticos Contínuos;
• A Distribuição Normal de Probabilidade;
• Normal Padronizada ou Reduzida;
• Como Associar uma Distribuição Normal a uma Normal Reduzida?
• Reconhecer e diferenciar parâmetros e estimadores estatísticos;
• Reconhecer e diferenciar modelos probabilísticos discretos e contínuos;
• Calcular probabilidades de eventos em modelos discretos;
• Calcular probabilidades em modelos contínuos por meio da distribuição normal
de probabilidade.
OBJETIVOS DE APRENDIZADO
Inferência Estatística e
Conceitos de Probabilidade
Orientações de estudo
Para que o conteúdo desta Disciplina seja bem
aproveitado e haja maior aplicabilidade na sua
formação acadêmica e atuação profissional, siga
algumas recomendações básicas:
Assim:
Organize seus estudos de maneira que passem a fazer parte
da sua rotina. Por exemplo, você poderá determinar um dia e
horário fixos como seu “momento do estudo”;
Procure se alimentar e se hidratar quando for estudar; lembre-se de que uma
alimentação saudável pode proporcionar melhor aproveitamento do estudo;
No material de cada Unidade, há leituras indicadas e, entre elas, artigos científicos, livros, vídeos
e sites para aprofundar os conhecimentos adquiridos ao longo da Unidade. Além disso, você tam-
bém encontrará sugestões de conteúdo extra no item Material Complementar, que ampliarão sua
interpretação e auxiliarão no pleno entendimento dos temas abordados;
Após o contato com o conteúdo proposto, participe dos debates mediados em fóruns de discus-
são, pois irão auxiliar a verificar o quanto você absorveu de conhecimento, além de propiciar o
contato com seus colegas e tutores, o que se apresenta como rico espaço de troca de ideias e de
aprendizagem.
Organize seus estudos de maneira que passem a fazer parte
Mantenha o foco!
Evite se distrair com
as redes sociais.
Mantenha o foco!
Evite se distrair com
as redes sociais.
Determine um
horário fixo
para estudar.
Aproveite as
indicações
de Material
Complementar.
Procure se alimentar e se hidratar quando for estudar; lembre-se de que uma
Não se esqueça
de se alimentar
e de se manter
hidratado.
Aproveite as
Conserve seu
material e local de
estudos sempre
organizados.
Procure manter
contato com seus
colegas e tutores
para trocar ideias!
Isso amplia a
aprendizagem.
Seja original!
Nunca plagie
trabalhos.
UNIDADE Inferência Estatística e Conceitos de Probabilidade
Inferência Estatística
A inferência estatística consiste em obter informações de uma população a partir
das observações e análises de uma ou mais amostras dessa população, ou seja, a
partir da análise de determinados resultados amostrais, é possível estimar informa-
ções e características numéricas acerca da população; matematicamente, dizemos
que a partir do cálculo e observação de medidas de um determinado subconjunto,
podemos estimar medidas que representem todo o conjunto.
Obviamente, ao partir da análise de uma parte para representar o todo, temos
que ter em mente de que se trata de estimativa e assim como tal pode não se apre-
sentar totalmente fiel. Portanto, ao generalizar uma situação com base em dados
reduzidos a ponto de estender para uma conclusão do todo, temos que levar em
consideração o quão próximo do real está a estimativa.
O conjunto de técnicas e procedimentos matemáticos e probabilísticos permite à
inferência estatística não só extrapolar esses cálculos como também gerenciar o grau
de aproximação de confiabilidade, gerenciando o erro estatístico, chamado também
de grau de incerteza, que é inerente ao processo do cálculo das estimativas.
Para compreender a inferência estatística, devemos alicerçar conceitos estatís-
ticos como população, amostra, parâmetros e estimadores, bem como conceitos
fundamentais de probabilidade para modelos contínuos e discretos, esse último
essencial para a compreensão dos intervalos de confiança e testes de significância.
População e Amostra,
Parâmetros e Estimadores
Importante termos clareza sobre os conceitos de amostra, população, estima-
dores (também chamados de estatística ou medidas) e parâmetros. Por definição,
a população é todo o conjunto de dados de determinada pesquisa, todos os dados
possíveis de observação ou todos os dados que podem ser obtidos em um experi-
mento. Como, por exemplo, todos os produtos produzidos em uma fábrica, todos
os habitantes de determinada cidade, todos os alunos de determinada instituição,
todos os clientes atendidos em uma rede de assistência médica, todas as ligações
recebidas por uma central de atendimento, todos os veículos que passaram em
determinada rodovia em certo período, todas as decolagens registradas em um ae-
roporto, todas as crianças vacinadas em uma determinada campanha, entre outros.
Já a amostra é um subconjunto dessa população: como, por exemplo, no caso de
a população ser todo o conjunto de itens produzidos em uma fábrica, a amostra
pode ser uma amostra aleatória simples de 15% dessa produção, ou seja, é uma
parte, mas não o todo. Isso define uma amostra. Ou ainda, no caso do aeroporto,
a amostra seriam os voos que decolaram em determinado período observado.
8
9
Ao buscar caracterizar uma população, são usadas medidas numéricas, como, por
exemplo, média, desvio-padrão, variância e proporção – são os chamados parâmetros.
Já ao buscar caracterizar uma amostra, também utilizamos medidas numéricas,
como média, desvio-padrão, variância e proporção, porém, nesse caso, são chama-
dos de estimadores ou estatísticas.
Vale destacar que, quando nos referimos a “parâmetros”, estamos automatica-
mente nos referindo às medidas numéricas da população; já quando nos referimos
a “estatísticas” (ou, ainda, estimadores, em alguns livros), estamos referenciando
medidas numéricas das amostras.
A simbologia também é diferente quando se refere à população ou à amostra,
como se observa na tabela abaixo, na qual temos a relação entre Amostras, Popu-
lação, Estimadores e Parâmetros e seus respectivos símbolos.
Tabela 1
População
símbolos dos Parâmetros
Amostra
símbolos dos Estimadores
Média µ x
Desvio Padrão σ S
Variância σ2 S2
Proporção π p
Estimadores, chamados também de estatística, são provenientes de amostras já os
parâmetros são provenientes de população.
Tendo ciência da distinção entre amostra e população e entre estimadores e
parâmetros seguimos adiante com o conceito de inferência estatística e como ela
ocorre, reforçando que a ideia essencial da inferência que é utilizar amostras para
estimar parâmetros da população.
A Ideia de Probabilidade
Como vimos, uma ideia básica na estatística é: a partir do resultado observado
em uma amostra, podemos estimar algo sobre uma população. Devemos ter claro
que, quando temos uma determinada população e, a partir dela, analisamos dife-
rentes amostras, podemos ter resultados distintos entre as amostras analisadas.
E justamente nesse cenário vamos discutir agora a importância da probabilidade.
Como confiar, ou melhor, com qual nível de precisão podemos confiar em uma
amostra aleatória? Como uma amostra aleatória, ou um conjunto de amostras dis-
tintas podem representar uma população?
9
UNIDADE Inferência Estatística e Conceitos de Probabilidade
É comprovado que comportamento do acaso é imprevisível no curto prazo, mas
que tem padrão regular e previsível no longo prazo.
Na probabilidade, classificamos como aleatório o fenômeno cujo resultado é
incerto, mesmo que se tenha, ao repetir esse evento por inúmeras vezes, uma dis-
tribuição regular dos resultados.
Por exemplo: ao lançar uma moeda e verificarqual a face ficou voltada para
cima, não há como garantir qual será o resultado desse lançamento. O que pode-
mos garantir é que certamente teremos ou cara ou coroa, mas não temos como
garantir exatamente o resultado em um lançamento que ainda não ocorreu.
A probabilidade então pode ser definida como a proporção de vezes que o resul-
tado ocorreria em uma série muito longa de resultados.
Voltamos ao exemplo da moeda, observe que temos dois resultados possíveis
{cara, coroa}, é intuitivo pensar que a chance, em um único lançamento, de ocorrer
o resultado {cara} é de uma 1 em 2, ou seja de 0,5 já que {cara} é um resultado em
dois que são os possíveis {cara, coroa}. Agora, suponha que vamos usar essa mes-
ma moeda em uma sequência de seis lançamentos, o resultado seria igualmente
dividido entre cara e coroa? Até seria possível, assim como também não, pois aqui
está explícita a aleatoriedade do evento – pode ser que nesses seis lançamentos
tenhamos mais cara do que coroa, ou mais coroa do que cara, ou exatamente três
caras e três coroas.
Porém, se nesse mesmo evento o lançamento de uma moeda com faces cara e
coroa for repetido exaustivamente, o padrão irá se aproximar de metade de vezes
para cara, metade de vezes para coroa.
A imagem abaixo ilustra o comportamento do resultado, cara ou cora, à medida
que se realizam mais eventos de lançamento.
Figura 1 – Lançamento de Moedas
Fonte: MOORE, NOTZ E FLIGNER, 2017
10
11
Observe que, nos primeiros lançamentos, há uma disparidade de resultados, ora
para cara, ora para coroa, porém, à medida que se repetem os lançamentos, por vol-
ta de 5.000 lançamentos, a proporção para ambos os resultados tende a ser de 0,5.
Essa é a essência da probabilidade: a existência de um padrão regular nos
resultados que surgem após muitas repetições de um determinado evento, sob
mesmas condições.
Obviamente temos que ter em mente que, por se tratar de probabilidade, lida-
mos com as chances de ocorrer e nunca com a certeza da ocorrência.
Trazendo essa essência para a estatística, se tivermos uma determinada popula-
ção e dela observarmos amostras, cada vez mais amostras (sob mesmas condições)
dessa população, chegaremos ao resultado que poderá caracterizar a população.
Assim, uma amostra poderá, dentro de uma determinada margem de erro, expres-
sar uma população de acordo com certa probabilidade.
Antes de prosseguir, relembre alguns conceitos e termos utilizados em Probabilidade:
• Espaço Amostral (S): trata-se do conjunto de resultados possíveis para um
determinado experimento aleatório. Para um espaço amostral finito, podemos
determinar o número de elementos (ou resultados) que o compõe, o que deno-
tamos por n(S). Observe a seguir alguns exemplos:
» Exemplo 1 – Espaços Amostrais:
a) O espaço amostral do lançamento de uma moeda será S = {Cara, Co-
roa} e, nesse caso, n(S) = 2;
b) O espaço amostral do lançamento de um dado será S = {1, 2, 3, 4, 5, 6},
portanto n(S)= 6;
c) O espaço amostral do lançamento de uma moeda e de um dado (juntos),
será S = {(Cara, 1), (Cara, 2), (Cara, 3), (Cara, 4), (Cara, 5), (Cara, 6),
(Coroa, 1), (Coroa, 2), (Coroa, 3), (Coroa, 4), (Coroa, 5), (Coroa, 6)} e,
nesse caso, n(S) = 12;
d) O espaço amostral do lançamento de dois dados simultaneamente, será
dado por S = {(1,1), (1,2), (1,3), (1,4), (1,5), (1,6), (2,1), (2,2), (2,3), ... ,
(6,1), (6,2), (6,3), (6,4), (6,5), (6,6)} o que expressa n(S) = 36;
e) O espaço amostral da retirada de uma carta de um determinado baralho
será descrito pelas 52 cartas que compõe o baralho, o que resulta em
n(S) = 52.
Como destacam Moore, Notz e Fligner (2017), podemos ter um espaço amos-
tral S muito simples ou muito complexo. Quando o Gallup extrai uma amostra
aleatória de 1.005 adultos, o espaço amostral contém todas as escolhas possí-
veis de 1.005 pessoas dos 241 milhões de pessoas. Nesse caso, cada membro
de S é uma possível amostra, de modo que S é a coleção, ou “espaço” de
todas as possíveis amostras. Veremos também que poderemos ter um espaço
11
UNIDADE Inferência Estatística e Conceitos de Probabilidade
amostral infinito (chamado também de contínuo), mas detalharemos um pouco
mais à frente.
• Evento (E): em Probabilidade, quando falamos de Evento, tratamos de um re-
sultado possível, mas para o qual não há a certeza premeditada da ocorrência.
Matematicamente, um evento é definido como um subconjunto dos resulta-
dos possíveis, ou seja: um subconjunto do espaço amostral. Normalmente, o
evento é representado por uma letra maiúscula do alfabeto, e temos por “n” o
número de elementos do subconjunto Evento, ou seja: o número de resultados
possíveis. Observe a seguir:
» Exemplo 2 – Eventos:
a) Evento A: observar a face Cara em uma moeda, portanto: A = {Cara}
e n(A) = 1;
b) Evento B: observar a face 5 em um dado, logo: B = {Face 5} e n(B) = 1;
c) Evento C: no lançamento de um dado e uma moeda, o evento C {ob-
servar o número 3 como resultado}, logo C = { (Cara, 3), (Coroa, 3) } e
temos que n(C)= 2;
d) Evento D: no lançamento simultâneo de dois dados, o evento D {que
a soma das faces observadas seja igual a 8}, para esse evento temos:
D = {(2, 6), (6, 2), (3, 5), (5, 3), (4, 4)} e n(D) = 5.
Quando tratamos de espaços amostrais equiprováveis, ou seja, nos quais cada
evento possui igual chance de ocorrer, calculamos a probabilidade de um de-
terminado evento ocorrer pela razão entre o número de elementos (resultados)
do evento, pelo número de elementos (resultados) do espaço amostral.
Assim, sendo E um determinado evento e S o Espaço Amostral Equiprovável,
temos que a probabilidade do evento E ocorrer, ou seja, P(E) será dada por:
( ) número de elementos do evento
número deelementos do espaço amostral
P E =
Ou seja:
( ) ( )( )
n E
P E
n S
=
» Exemplo 3: voltamos novamente no exemplo do lançamento da moeda e
observamos a face voltada para cima e ela ser igual à Cara.
a) Evento E= {face cara}
b) E = {Cara}, n(E) = 1
c) S = {Cara, Coroa}, n(S) = 2
12
13
( ) ( )( )
1 0,5
2
n E
P E
n S
= = =
Logo, probabilidade de termos a face igual à cara, em um lançamento, é de 1
em 2, ou seja: ½ ou ainda 0,5.
» Exemplo 4: Ao lançar um dado honesto, observar sua face voltada para
cima e ela ser igual a 6.
a) Evento E = {Face 6}, portanto n(E) = 1, já que só há uma face igual a 6
no dado.
b) Espaço Amostral S = {1, 2, 3, 4, 5, 6}, portanto n(S) = 6.
Sendo assim, temos que:
( ) ( )( )
1 0,1667
6
n E
P E
n S
= = ≅
Logo, a probabilidade de termos a face 6, em um lançamento, é de 1 em 6, ou
seja: 1/6, ou 0,1667.
• Exemplo 5:
a) Evento D: no lançamento simultâneo de dois dados, o evento D {que
a soma das faces observadas seja igual a 8}, para esse evento temos:
D = {(2, 6), (6, 2), (3, 5), (5, 3), (4, 4)} e n(D) = 5 , em um espaço
amostral S = { (1,1), (1,2), (1,3), (1,4), (1,5), (1,6), (2,1), (2,2), (2,3) ...
(6,1), (6,2), (6,3), (6,4), (6,5), (6,6)} que sabemos ser de 36 resultados.
Logo:
( ) ( )( )
5 0,1389
36
n E
P E
n S
= = ≅
Logo, a probabilidade de termos, com o lançamento de dois dados, a soma
das faces igual a 8 será de 5 em 36 ou 5/36 que é aproximadamente 0,1389.
Propriedades da Probabilidade
de Eventos Aleatórios
Vejamos agora algumas propriedades importantes:
• A probabilidade P(E), de um evento E qualquer resulta em 0 ≤ P(E) ≤ 1.
Isso quer dizer que a probabilidade de um evento é um número compreendido
entre 0 (zero) e 1, inclusive pode ser igual a 0, quando temos um evento inexistente,
13
UNIDADE Inferência Estatística e Conceitos de Probabilidade
ou igual a 1 quando temos o evento chamado de certo, ou seja, o evento que temos
certeza de que irá ocorrer.
Observe que, no lançamento de um dado, a probabilidade do evento E = {sair a
face igual a 7} é igual a 0 (zero), já que a face ser igual a 7 é um evento inexistente
no espaço amostral.
Já a probabilidade, no lançamento de um dado, do evento E = {face ser igual
a 1, 2, 3, 4, 5, ou 6} é igual a 1 , pois todos os elementos do espaçoamostral
S = { 1, 2, 3, 4, 5, 6} fazem parte do evento E { 1, 2, 3, 4, 5, 6 }.
• P(S) = 1. Ou seja: a probabilidade da ocorrência do próprio espaço amostral
é igual a 1.
Nesse caso, é intuitivo verificar que, de fato, se o evento corresponder ao pró-
prio espaço amostral, então se trata do evento certo e, nesse caso, a probabilidade
é igual a 1.
• Para qualquer evento E, a probabilidade desse evento E não ocorrer será dada
por P(E não ocorrer) = 1 – P(E).
Vale refletir que, se a probabilidade de um evento E está em 0 ≤ P(E) ≤ 1 e se,
por exemplo, a probabilidade de um determinado evento ocorrer P(E) = 0,35, então
a probabilidade desse mesmo evento não ocorrer é o complementar para 1, nesse
caso P (E não ocorrer) = 1 - 0,35 = 0,65.
Não é foco neste estudo explorar as regras gerais de probabilidade, como regra da adição,
regra da multiplicação e probabilidade condicional. Mas, para explorar o tema, indicamos o
vídeo de “Probabilidade. Conceitos Fundamentais” da UNIVESP.
Disponível em: https://youtu.be/yWJB3nMHRYE
Ex
pl
or
Importante observar que todos os exemplos listados até agora se referem a um
número inteiro de eventos (resultados), o que, normalmente, é definido pelos esta-
tísticos como modelos probabilísticos discretos.
Porém, há modelos nos quais não podemos atribuir probabilidades a valores
individuais, ou ainda nos quais o que se quer calcular está entre um intervalo de
números reais; são os denominados modelos probabilísticos contínuos e aqui há
uma diferença do cálculo da probabilidade que passa a ser equivalente a uma deter-
minada área sob uma curva de densidade. Dessa forma, a probabilidade é atribuída
a intervalos de resultados e não mais a resultados individuais.
Quando temos um modelo probabilístico contínuo, o cálculo da probabilidade ocorre
a partir do cálculo da área sob uma curva de densidade.
14
15
Modelos Probabilísticos Contínuos
Devemos retomar o conceito de que a curva densidade é a que descreve o padrão
idealizado de uma amostra. Veja, quando temos a representação gráfica dos dados de
uma amostra, temos todo o conjunto de dados da amostra representados na imagem
e, conforme ilustra a imagem abaixo, podemos ainda ter uma curva que está sempre
sobre o eixo horizontal ou acima dele e que representa esse mesmo conjunto.
A Curva Densidade representa, então, o conjunto de dados da amostra já que
a área formada por essa curva e o eixo horizontal possuirá área total igual a 1, o
que corresponde a 100% dos registros analisados e, por consequência, a área sob a
curva e acima de qualquer intervalo de valores no eixo horizontal será a proporção
de todos os registros nos intervalos.
Figura 2 – Ilustração de uma Curva de Densidade de uma Amostra
Fonte: Acervo do Conteudista
Figura 3 – Ilustração da Curva Densidade de uma Amostra Normal
Fonte: Acervo do Conteudista
15
UNIDADE Inferência Estatística e Conceitos de Probabilidade
Para saber mais sobre curva densidade, trata-se de um vídeo criado e disponibilizado gratui-
tamente pela Khan Academy. Disponível em: http://bit.ly/2AB05TIEx
pl
or
Dentre as curvas densidade mais usuais, destacamos: a Normal, a T de Student
e a Qui-Quadrado. Nesse momento, teremos como foco a Curva Normal.
Sabemos que, quando temos um modelo probabilístico contínuo, o cálculo da
probabilidade ocorre a partir do cálculo da área sob uma curva de densidade. Ve-
remos agora como esse cálculo ocorre, tomando como foco a distribuição normal
de probabilidade.
A Distribuição Normal de Probabilidade
Observe a ilustração abaixo que representa um esboço de uma curva normal.
Por sua representação gráfica lembrar a forma de um sino, ela é popularmente
chamada de função sino ou bell.
Figura 4 – Curva Normal
Fonte: Acervo do Conteudista
Nessa curva, que representa a distribuição dos resultados, temos que os resul-
tados são dispersos em forma da curva de sino, onde há um ponto central, e essa
curva é simétrica em relação a esse ponto, que representa a média da amostra, que,
por sua vez, é igual à Moda (Mo) e à Mediana (Md).
Dessa forma, observe que os valores mais prováveis estão concentrados em um
ponto central e os menos prováveis nos respectivos extremos, o que nos remete à
famosa regra 68 – 95 – 97,7 da Distribuição Normal.
16
17
Figura 5 – Curva Normal e regra 68-95-97,7
Fonte: Acervo do Conteudista
Essa regra diz que, na distribuição normal, com média µ e desvio padrão , temos
que, aproximadamente:
• 68% dos valores estão entre –1σ e 1σ;
• 95% dos valores estão entre –2σ e 2σ;
• 99,7 dos valores estão entre –3σ e 3σ.
O que permite rapidamente análises aproximadas acerca dessas proporções.
Como já vimos, há uma relação numérica direta entre a área que se forma sob
a curva, que representa a distribuição normal, e a probabilidade de ocorrência de
registros de determinada amostra. Essa relação é de extrema importância: já que,
como a área abaixo da curva representa todos os dados da amostra, temos então
100% da amostra. Assim, se quisermos calcular a probabilidade de determinados
registros ocorrerem, devemos pensar na proporcionalidade entre as áreas que re-
presentam os determinados registros, abaixo da curva, e é a partir dessa relação
que efetuamos os cálculos das probabilidades de uma distribuição normal.
Esse cálculo pode ser realizado por meio do cálculo da integral da área formada
pela curva em um dado intervalo, porém, como o cálculo por meio dessa integral é
analiticamente complexo, trabalhamos então com uma Tabela Normal Padronizada
que permite o cálculo de forma prática e direta.
Normal Padronizada ou Reduzida
A Curva Normal Padronizada ou Normal Reduzida tem, por convenção, a média
igual a zero (média nula) e o desvio-padrão igual a 1. Além disso, muda-se a variável
x para uma variável padronizada que chamaremos de z. O cálculo de uma Normal
Padronizada torna-se extremamente usual, pois seus valores já são previamente
tabulados, o que a torna extremamente prática.
17
UNIDADE Inferência Estatística e Conceitos de Probabilidade
Observe o esboço abaixo, como a média é igual a zero, temos que a normal pa-
dronizada é simétrica em relação ao zero e seus pontos de inflexão ocorrem em 1
e -1 respectivamente, já que o desvio-padrão considerado é igual a 1.
Para a Distribuição Normal Reduzida, temos: o desvio-padrão σ = 1 e média x = 0,
e a variável padronizada z.
Figura 6 – Área sob a Curva de uma Distribuição Normal Reduzida
Fonte: Acervo do Conteudista
Decorre do fato de a Normal Padronizada possuir área total igual a 1, e ser cen-
trada na média, que temos duas áreas iguais de 0,5 e que são simétricas em relação
à média zero. E esse fato é extremamente importante para o cálculo das probabili-
dades com a tabela que apresentaremos ainda nesta unidade.
Como qualquer outra curva densidade, o cálculo da probabilidade então, por
meio da normal reduzida, consiste em associar os intervalos observados à área
correspondente sob a curva.
Dessa forma, então, dada uma amostra, de característica de distribuição normal,
para calcular a probabilidade de determinados registros ocorrerem, devemos asso-
ciá-los à normal reduzida e, então, por meio de dados tabelados, obter o resultado.
Vejamos, a seguir, como realizar essa associação e calcular a probabilidade.
Como Associar uma Distribuição
Normal a uma Normal Reduzida?
Usualmente, chamamos de “normalizar”, ou ainda “padronizar”, a transforma-
ção de uma distribuição normal qualquer para a distribuição normal padronizada.
18
19
O processo consiste em associar a variável x a uma variável z, da seguinte forma:
ii
x xz
σ
−
=
Assim, a partir da variável z, equiparar a área da distribuição normal original
para a distribuição padronizada e, então, procurar nos valores tabelados.
Veja o exemplo a seguir:
• Exemplo 6: Para uma amostra cuja média = 80 e desvio-padrão igual a 16, va-
mos calcular a probabilidade de ocorrência para resultados entre 80 ≤ x ≤ 100.
Observe, na Figura a seguir, que a probabilidade procuradaé numericamente
igual à área formada entre o eixo OX e a curva destacada em vermelho e que, no
caso desse intervalo, será 80 ≤ x ≤ 100.
Figura 7 – Esboço de Distribuição Normal do exemplo 6
Fonte: Acervo do Conteudista
Para calcular essa área, utilizaremos a Normal Padronizada, o que implica ini-
cialmente em fazer a relação (transformação) da variável x para a variável padroni-
zada z.
Logo, se temos:
ii
x xz
σ
−
=
E os dados do exemplo são: x = 80, σ = 16 e xi = 100.
Portanto:
100 80 1,25
16
i
i
x xz
σ
− −
= = =
19
UNIDADE Inferência Estatística e Conceitos de Probabilidade
A partir da variável x “padronizada”, ou seja, transformada para a variável z,
temos agora o seguinte esboço para a mesma distribuição:
Figura 8 – Esboço de Distribuição Normal Reduzida do exemplo 6
Fonte: Acervo do Conteudista
Perceba que os intervalos 80 ≤ x ≤ 100 e 0 ≤ x ≤ 1,25 possuem áreas equiva-
lentes e, por consequência, mesma probabilidade.
Figura 9 – Esboço de Equivalência de Áreas Simétricas do Exemplo 6
Fonte: Acervo do Conteudista
O cálculo se torna extremamente simples e prático, uma vez que os dados das
áreas da Normal Padronizada são, como já mencionamos antes, tabelados.
A tabela que apresentaremos nesta unidade fornece o valor das áreas para da-
dos intervalos em que 0 ≤ x ≤ z e é chamada de Tabela Normal Reduzida (z ≥ 0).
Outra tabela que também pode ser referência para essas observações é Tabela
Normal Acumulada.
Tabela 2 – Tabela normal reduzida z ≥ 0
Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359
0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753
0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141
0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517
0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879
20
21
Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224
0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549
0,7 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852
0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133
0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389
1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621
1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830
1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015
1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177
1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319
1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441
1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545
1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633
1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706
1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767
2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817
2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857
2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890
2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916
2,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936
2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952
2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964
2,7 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974
2,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981
2,9 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986
3,0 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990
3,1 0,4990 0,4991 0,4991 0,4991 0,4992 0,4992 0,4992 0,4992 0,4993 0,4993
3,2 0,4993 0,4993 0,4994 0,4994 0,4994 0,4994 0,4994 0,4995 0,4995 0,4995
3,3 0,4995 0,4995 0,4995 0,4996 0,4996 0,4996 0,4996 0,4996 0,4996 0,4997
3,4 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4998
3,5 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998
3,6 0,4998 0,4998 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,7 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,8 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,9 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000
A partir dos dados contidos nessa tabela, podemos facilmente calcular áreas
em outros tipos de intervalos, como veremos nos exemplos a seguir.
21
UNIDADE Inferência Estatística e Conceitos de Probabilidade
Importante!
Essa tabela apresenta os dados a partir da média 0 (zero) e logo teremos, dependendo
da situação, que associar à área simétrica, que está à esquerda da média, porém, há uma
outra tabela que traz valores acumulados para a distribuição normal e que também pode
ser utilizada. Para análise final dos dados, ambas possuem o mesmo resultado, porém,
há uma mudança sutil na leitura e intepretação dos registros. No Material Complemen-
tar, indicaremos vídeos com exemplos de como calcular e consultar a tabela acumulada.
Importante!
Observe, a seguir, um recorte dessa tabela: veja que, na primeira coluna da es-
querda, temos o valor inteiro e o primeiro decimal de z. As demais colunas corres-
pondem ao segundo decimal do valor de z. Consideraremos o valor z sempre com
duas casas decimais.
Então, para o valor de z = 1,25, devemos procurar 1,2 na parte inteira e 0,05
para o segundo decimal, conforme segue:
Figura 10 – Consulta à Tabela Normal Reduzida referente ao exemplo 6
Fonte: Acervo do Conteudista
Note que, no cruzamento da linha de 1,2 (primeira coluna) com a coluna do
segundo decimal (0,05), temos o valor igual a 0,3944, que é a área do correspon-
dente ao intervalo 0 ≤ z ≤ 1,25.
22
23
Assim, a probabilidade para esse intervalo e que corresponde ao intervalo 80 ≤ x
≤ 100 será igual a 0,3944, ou seja, em uma determinada amostra em que a média
é igual a 100, o desvio-padrão igual a 16, a probabilidade de ocorrer um valor de x
que esteja entre 80 e 100 é de 0,3944 ou em representação percentual: 39,44%.
No próximo exemplo, veremos um intervalo em que a estratégia é a soma das
áreas, além disso, também deveremos observar a importância da simetria.
Importante ressaltar que, para a busca, a tabela somente apresenta números
para z com duas casas decimais e, portanto, números com mais casas decimais
devem ser arredondados.
Se você estivesse consultado a tabela normal acumulada (também muito usual
e presente em diversos livros). O valor para z = 1,25 na tabela seria de 0,8944
porque ela possui a área acumulada, à esquerda da média, e, nesse caso (desse
exemplo), teria então que subtrair 0,5 desse valor, obtendo o 0,3944. Note que o
resultado final é o mesmo, o que muda é a referência da tabela e sua análise.
• Exemplo 7: Em uma amostra de registros das alturas de determinados indiví-
duos, na qual a média é igual a 1,6m e o desvio-padrão igual a 0,06m. Qual a
probabilidade de um dos registros dessa amostra estar entre os valores de 1,70
e 1,75?
O esboço para essa distribuição está na seguinte Figura:
Figura 11 – Esboço da Distribuição Normal do Exemplo 7
Fonte: Acervo do Conteudista
Transformando para a Normal Reduzida, temos:
1
1,70 1,60 1,67
0,06
z −= = 2
1,75 1,60 2,50
0,06
z −= =
23
UNIDADE Inferência Estatística e Conceitos de Probabilidade
E no esboço da Normal Reduzida:
Figura 12 – Esboço da Distribuição Normal Reduzida do Exemplo 7
Fonte: Acervo do Conteudista
Os valores consultados na tabela Normal Reduzida são:
• para 1,67 o valor de 0,4525;
• para 2,50 o valor de 0,4938.
A área que procuramos está compreendida entre 1,67 e 2,50, como calculá-la então?
Os valores observados na tabela são os valoresa partir de 0, tanto para 1,67
como para 2,50. Então o que devemos fazer é subtrair da área formada pelo inter-
valo 0 ≤ z ≤ 2,50 a área formada pelo intervalo 0 ≤ z ≤ 1,67 obtendo, assim, a área
formada pelo intervalo 1,67 ≤ z ≤ 2,50.
Se você estiver com a tabela Normal Acumulada, os valores serão:
• para 1,67 o valor de 0,9525;
• para 2,50 o valor de 0,9938.
E a diferença entre eles é a mesma: 0,0413.
Logo, a probabilidade para esse intervalo será 0,4938 – 0,4525 = 0,0413.
• Exemplo 8: O nível de produção de uma montadora é uma variável em distri-
buição normal com média de 485 peças por dia e desvio-padrão de 18 peças.
Se a meta imposta pela gerência é 492, qual é a probabilidade de a produção
ser igual ou superior à meta?
Da leitura da situação problema, temos que: x = 485, σ = 18, P(x) ≥ 492.
Na sequência, devemos “padronizar” para a variável z e construir o esboço para
identificar a área que representa a probabilidade procurada.
z = (492 – 485)/18 = 0,39
Como esboço para a representação da área já padronizada, temos:
24
25
Figura 13 - Esboço da Distribuição Normal Reduzida do Exemplo 8
Fonte: Acervo do Conteudista
Observamos que a área procurada está em um intervalo que não inicia em z = 0. Logo,
como a tabela só fornece valores a partir de 0 (Zero), calcularemos então 0 ≤ z ≤ 0,39
e subtrairemos esse valor de 0,5 que corresponde à área para 0 ≤ z.
Na tabela, o valor correspondente a 0,39 é igual a 0,1517, portanto, a probabi-
lidade será dada por 0,5 – 0,1517 = 0,3483. Logo, a probabilidade de a produção
ser igual ou superior à meta (minimante 492 peças) é de 0,3483 ou, em termos
percentuais, 34,83%.
Veremos agora o processo inverso, ou seja, de uma determinada área vamos
encontrar uma variável x que a contemple.
Exemplo 9: Em um determinado concurso, cujas pontuações seguem uma dis-
tribuição normal, a média da pontuação foi de 485 pontos com desvio-padrão de
18 pontos. Foram relacionados para a segunda fase os candidatos que estavam en-
tre os 8% melhores colocados. Qual a pontuação mínima obtida pelos candidatos
que foram relacionados para a segunda fase?
Importante observar que esse exemplo traz o valor da área e pede o valor de x,
ou seja: é o inverso do que estávamos fazendo até então.
Os dados informados são: x = 485, σ = 18 , proporção igual ou maior a 8%,
portanto, a representação gráfica será:
Figura 14 – Esquema Gráfi co da Distribuição do Exemplo 9
Fonte: Acervo do Conteudista
25
UNIDADE Inferência Estatística e Conceitos de Probabilidade
Como a informação fornecida é a área sob a curva, realizaremos o cálculo inverso
para saber qual valor na tabela normal reduzida corresponde à área informada.
Sabemos que os valores que constam na tabela normal reduzida correspondem
sempre a valores de áreas para um intervalo a partir do valor zero de z = 0. Logo,
na tabela, o valor a ser procurado não poderá corresponder a 0,08, mas sim a
0,42, já que 0,5 – 0,08 = 0,42. Procuraremos, então, na tabela, o valor mais
próximo de 0,42 e temos dois possíveis valores que são: 0,4207 e 0,4192. Entre
os dois, o mais próximo de 0,42 será 0,4207 já que 0,4207 – 0,42 = 0,0007 e
0,42 – 0,4192 = 0,0008.
Sendo 0,4207 o mais próximo, e verificando na tabela, no número de z será
igual a 1,41.
Figura 15 – Consulta à Tabela Normal Reduzida do Exemplo 9
Fonte: Acervo do Conteudista
Sabendo que z = 1,41, x = 485 e σ = 18, vamos aos cálculos para identificar o
valor de x.
4851,41
18
4785 1,41 18
25,38 485 510,38
x
x
x
−
=
− = ⋅
= + =
26
27
Como x = 510,38, então, para estar entre os 8% melhores colocados, ou seja,
estar nessa região gráfica, minimamente, a pontuação deve ser de 510,38 pontos.
Figu ra 16 – Esboço Gráfi co da Curva Normal para o Exemplo 9
Fonte: Acervo do Conteudista
Na Figura representada, podemos observar que é justamente a partir de 510,38
pontos que estão os 8% melhores pontuados, nessa distribuição normal, cuja média
é 485 pontos e desvio-padrão de 18 pontos.
Bem, chegamos ao fim desta unidade, releia o texto, assista à videoaula, refaça
os exemplos numéricos e veja o material complementar indicado. Sobre o que
vimos nesta unidade, é importante que você saiba reconhecer a diferença entre
população e amostra, parâmetros e estimadores, bem como a diferença entre mo-
delos probabilísticos discretos e contínuos, sobretudo para o cálculo de probabilida-
des dos modelos contínuos que ficam então associados ao cálculo da área sob uma
curva de densidade de distribuição.
Bons estudos!
27
UNIDADE Inferência Estatística e Conceitos de Probabilidade
Material Complementar
Indicações para saber mais sobre os assuntos abordados nesta Unidade:
Livros
A estatística básica e sua prática
MOORE, D. S.; NOTZ, W. I.; FLIGNER M. A. A estatística básica e sua prática.
Tradução de Ana Maria Lima de Farias. Rio de Janeiro: LTC, 2017. Para melhor
aprofundamento dos temas tratados nesta unidade, leia os capítulos 12 e 13 do livro.
Nesta unidade, fiz uma recuperação de informações sobre a Distribuição Normal que
você também pode encontrar no capítulo 3 do mesmo livro.
Vídeos
Tabela Normal Padrão: como usar. Distribuição Normal de Probabilidades
Para compreender melhor como fazer a leitura de uma Tabela Normal Reduzida,
assista ao vídeo do prof. Conrad Pinheiro.
https://youtu.be/OTyc8gUHqv0
Distribuição de Probabilidade – Como usar a tabela da distribuição normal
Sobre a Tabela Normal Acumulada e a diferença para a Tabela Normal Reduzida.
https://youtu.be/ec9HWoY2kt8
Tabela distribuição Normal Reduzida
Neste video, você terá acesso à resolução de exercícios utilizando a Tabela de
Distribuição Normal Reduzida.
https://youtu.be/xtLjpZ1XjzQ
28
29
Referências
MOORE, D. S.; NOTZ, W. I.; FLIGNER M. A. A estatística básica e sua prática.
Tradução de Ana Maria Lima de Farias. Rio de Janeiro: LTC, 2017.
29