Buscar

Estatistica Tema15

Prévia do material em texto

Distribuição normal da probabilidade
José Tadeu de Almeida
Introdução
Nesta aula, você conhecerá a distribuição normal de probabilidade e sua representação grá-
fica. Por meio desses conceitos, é possível estimar a probabilidade de ocorrência de eventos esta-
tísticos dentro de margens de variação em torno da média dos valores observados em um experi-
mento. Abordaremos, ainda, as possibilidades de manipulação de amostras e suas probabilidades 
com o Teorema do Limite Central.
Objetivos de aprendizagem
Ao final desta aula, você será capaz de:
 • identificar a curva normal da probabilidade.
1 Distribuição normal
Você já percebeu que nas pesquisas de intenção de voto anunciadas pelos noticiários sem-
pre há uma “margem de erro de n pontos percentuais para mais ou para menos”? Esta expressão 
diz respeito à probabilidade de erro na porcentagem real das preferências de voto dos eleitores, 
obtidas a partir de um experimento de pesquisa com amostras de tamanho grande. 
Nesses casos, é possível verificar que o comportamento da amostra segue uma distribuição 
razoavelmente uniforme, com a maior parte dos resultados situando-se dentro de uma margem 
de confiança. 
FIQUE ATENTO!
No caso das eleições, as pesquisas indicam qual é a porcentagem de votos espera-
da para um determinado candidato, com a possibilidade de uma oscilação (margem 
de erro), a qual define o grau de exatidão de uma pesquisa com grandes amostras.
Esse modelo de distribuição de probabilidades é conhecido como distribuição normal. 
Nela, as probabilidades associadas a cada valor da amostra estão distribuídas de maneira uni-
forme em torno da média. Seu aspecto gráfico é dado pela imagem a seguir. 
Figura 1 – Distribuição normal
0
μμ - σ μ + σ
Fonte: elaborada pelo autor, 2017.
Esta ilustração corresponde à chamada curva normal. Perceba que os múltiplos resultados 
que compõem a amostra distribuem-se igualmente em torno da média, dada por μ. Assim, pode-
mos verificar que a distribuição é simétrica, pois há 50% de elementos abaixo da média e 50% 
acima (MILONE; ANGELINI, 1993).
As margens definidas pelo desvio padrão (σ), dadas pelo intervalo (μ – σ, μ + σ), demonstram 
o grau de homogeneidade da distribuição de elementos, ou seja, a dispersão do conjunto de dados, 
sendo que quanto menor for o desvio padrão, menos dispersos estarão os dados em torno da 
média (BUSSAB; MORETTIN, 2010).
FIQUE ATENTO!
No exemplo mencionado e a partir do conceito do desvio padrão, quanto menor for 
esse desvio, menor será a “margem de erro” da pesquisa.
Podemos efetuar algumas considerações sobre a distribuição normal. Confira!
 • Sua representação gráfica é semelhante a um sino, dada sua simetria em torno da 
média.
 • Como consequência, 50% dos valores são inferiores à média e 50% superiores a ela.
 • Os pontos de inflexão, no quais há mudança do sinal de crescimento da variável 
analisada (positivo/negativo), são determinados pelo desvio padrão, de modo que 
a função de distribuição normal N possui média igual a μ e desvio padrão igual a σ, 
podendo ser resumida por N(μ,σ).
 • Os pontos de inflexão estão a um desvio padrão de distância da média.
O ponto médio da distribuição é o ponto máximo da função de distribuição, situado sobre a 
média (MILONE; ANGELINI, 1993).
SAIBA MAIS!
A simetria em torno da média faz com que cada metade do gráfico de distribuição 
normal seja um “espelho” da outra metade, de modo que a área dessas duas figuras 
é igual.
Conhecendo as distribuições normais, podemos verificar as probabilidades de ocorrência de 
determinados eventos dentro de uma certa margem de variação (CRESPO, 2005). Por exemplo, se 
sabemos que uma firma produz canetas com peso médio de 60 gramas, com 5% de variação para 
mais ou menos (ou seja, com desvio padrão de 3 gramas), qual é a probabilidade de uma caneta 
pesar entre 60 e 62 gramas? Descobriremos a resposta nas próximas seções. 
2 Distribuição normal padrão
Como demonstramos anteriormente, a distribuição normal se caracteriza pela simetria da 
organização de valores em torno da média. Desse modo, verificamos que existem infinitas possi-
bilidades de distribuições simétricas, cada uma com uma média. Sabendo, no entanto, que essa 
situação é constante nas distribuições normais, é possível realizar uma padronização, isto é, tornar 
constante a média μ = 0 e o desvio padrão σ =1 por meio de transformações algébricas. 
Trata-se da distribuição normal padronizada, ou padrão, de notação N(0,1), ou seja, com 
média zero e desvio padrão igual a 1. A partir dela, podemos estabelecer mais facilmente as pro-
babilidades de ocorrência de eventos em torno da média e do desvio padrão das diferentes distri-
buições normais (MILONE; ANGELINI, 1993).
FIQUE ATENTO!
As probabilidades associadas às distribuições padronizadas estão dispostas na 
Tabela de Probabilidades.
Figura 2 – Distribuição normal e probabilidades
Fonte: Lamnee / Shutterstock.com
Quando realizamos a padronização, temos por resultado a criação de uma variável Z, que 
mede o afastamento das variáveis em relação à média, em número de desvios padrões, a partir 
da expressão:
−µ
=
σ
XZ
Entenda que o Z é o número de desvios padrões, a partir da média, ao passo que X representa 
os infi nitos valores relacionados à variável de estudo. O indicador μ, por sua vez, é a média da dis-
tribuição, e σ corresponde ao desvio padrão (CRESPO, 2005). A seguir, verifi caremos a aplicação 
prática desse conceito.
3 Determinando probabilidades
Agora que você já sabe que, à medida que padronizamos a distribuição normal, conseguimos 
obter com maior facilidade as probabilidades de ocorrência de variações em relação à média, ao 
valor esperado de um experimento. O que se realiza, na verdade, é uma relativização, uma opera-
ção de padronização de dados em torno de uma média pré-defi nida (CRESPO, 2005).
Com efeito, uma vez que padronizamos as distribuições normais e as reduzimos a uma dis-
tribuição N(0,1), podemos previamente calcular as probabilidades associadas a esta distribuição, 
por meio da Tabela de Distribuição de Probabilidades.
Tabela 1 – Tabela de Distribuição de Probabilidades associada a uma distribuição normal N(0,1)
Parte 
inteira e 
primeira 
de Zc
Segunda decimal de Zc Parte inteira e 
primeira 
decimal 
de Zc
0 1 2 3 4 5 6 7 8 9
P =0
0,0 00000 00399 00798 01197 01595 01994 02392 02790 03188 03586 0.0
0,1 03983 04380 04776 05172 05567 05962 06356 06749 07142 07535 0,1
0,2 07926 08317 08706 09095 09483 09871 10257 10642 11026 11409 0,2
0,3 11791 12172 12552 12930 13307 13683 14058 14431 14803 15173 0,3
0,4 15542 15910 16276 16640 17003 17364 17724 18082 18439 18793 0,4
0,5 19146 19497 19847 20194 20540 20884 21226 21566 21904 22240 0,5
0,6 22575 22907 23237 23565 23891 24215 24537 24857 25175 25490 0,6
0,7 25804 26115 26424 26730 27035 27337 27637 27935 28230 28524 0,7
0,8 28814 29103 29389 29673 29955 30234 30511 30785 31057 31327 0,8
0,9 31594 31859 32121 32381 32639 32894 33147 33398 33646 33891 0,9
1,0 34134 34375 34614 34850 35083 35314 35543 35769 35993 36214 1,0
1,1 36433 36650 36864 37076 37286 37493 37698 37900 38100 38298 1,1
1,2 38493 38686 38877 39065 39251 39435 39617 39796 39973 40147 1,2
1,3 40320 40490 40658 40824 40988 41149 41309 41466 41621 41774 1,3
1,4 41924 42073 42220 42364 42507 42647 42786 42922 43056 43189 1.4
1,5 43319 43448 43574 43699 43822 43943 44062 44179 44295 44408 1,5
1,6 44520 44630 44738 44845 44950 45053 45154 45254 45352 45449 1,6
1,7 45543 45637 45728 45818 45907 45994 46080 46164 46246 46327 1,7
1,8 46407 46485 46562 46638 46712 46784 46856 46926 46995 47062 1,8
1,9 47128 47193 47257 47320 47381 47441 47500 47558 47615 47670 1,9
2,0 47725 47778 47831 47882 47932 47982 48030 48077 48124 48169 2,0
2,1 48214 48257 48300 48341 48382 48422 4846148500 48537 48574 2,1
2,2 48610 48645 48679 48713 48745 48778 48809 48840 48870 48899 2,2
2,3 48928 48956 48983 49010 49036 49061 49086 49111 49134 49158 2,3
2,4 49180 49202 49224 49245 49266 49286 49305 49324 49343 49361 2,4
2,5 49379 49396 49413 49430 49446 49461 49477 49492 49506 49520 2,5
2,6 49534 49547 49560 49573 49585 49598 49609 49621 49632 49643 2,6
2,7 49653 49664 49674 49683 49693 49702 49711 49720 49728 49736 2,7
2,8 49744 49752 49760 49767 49774 49781 49788 49795 49801 49807 2,8
2,9 49813 49819 49825 49831 49836 49841 49845 49851 49856 49861 2,9
3,0 49865 49869 49874 49878 49882 49886 49889 49893 49897 49900 3,0
3,1 49903 49906 49910 49913 49916 49918 49921 49924 49926 49929 3,1
Parte 
inteira e 
primeira 
de Zc
Segunda decimal de Zc Parte inteira e 
primeira 
decimal 
de Zc
0 1 2 3 4 5 6 7 8 9
3,2 49931 49934 49936 49938 49940 49942 49944 49946 49948 49950 3,2
3,3 49952 49953 49955 49957 49958 49960 49961 49962 49964 49965 3,3
3,4 49966 49968 49969 49970 49971 49972 49973 49974 49975 49976 3.4
3,5 49977 49978 49978 49979 49980 49981 49981 49982 49983 49983 3,5
3,6 49984 49985 49985 49986 49986 49987 49987 49988 49988 49989 3.6
3,7 49989 49990 49990 49990 49991 49991 49992 49992 49992 49992 3,7
3,8 49993 49993 49993 49994 49994 49994 49994 49995 49995 49995 3,8
3,9 49995 49995 49996 49996 49996 49996 49996 49996 49997 49997 3,9
4,0 49997 49997 49997 49997 49997 49997 49998 49998 49998 49998 4.0
4,5 49999 50000 50000 50000 50000 50000 50000 50000 50000 50000 4,5
Fonte: BUSSAB; MORETTIN, 2010, p. 511.
EXEMPLO
Se o peso médio de uma caneta é de 60 gramas, então μ = 60. Se a variação espe-
rada é de 3 gramas, o desvio padrão é dado por σ = 3. Para saber a probabilidade de 
uma caneta, selecionada ao acaso, pesar entre 60 e 62 gramas, vamos transformar 
o peso efetivo em relativo, por meio da distribuição normal padronizada: 
62 60 2
0,66
3 3
−µ −62 60 2−µ −62 60 2
= = = == = = == = = == = = =
σ
XZ
Ao obter a variável Z, você pode verifi car que estamos analisando a probabilidade 
de uma caneta apresentar uma variação de até 0,66 desvios padrões em relação à 
média. Nesse caso, saberemos a porcentagem recorrendo à Tabela de Probabili-
dades. Para encontrar o valor exato, devemos entrar com o valor Z = 0,66 na tabela 
normal e achar o valor correspondente à probabilidade. 
Na coluna Z, você encontrará o decimal 0,6 formando uma linha com diversos 
valores (parte inteira e primeira decimal). Siga essa linha até a coluna 6 (ou 0,06). 
Na intersecção da linha 0,6 com a coluna 6 (ou 0,06), você encontrará a probabilidade 
associada a distribuições normais com até 0,66 desvios padrões, ou seja, 0,2454. 
Assim, verifi camos que, se uma caneta pode pesar entre 57 e 63 gramas, a pro-
babilidade de selecionar uma ao acaso que pese entre 60 e 62 gramas é dada por 
P (0 < Z < 0,66) = 24,54%.
Com a tabela apresentada, podemos obter as probabilidades associadas a todas as distribui-
ções normais (CRESPO, 2005).
4 Teorema do Limite Central
O Teorema do Limite Central demonstra que, à medida que aumenta o número de elementos 
em um conjunto de dados, a distribuição das frequências (o número de vezes em que são observa-
dos os diferentes valores da variável) e suas probabilidades de ocorrência aproxima-se progressiva-
mente de uma distribuição normal, com média μ e variância σ2/n. A variância demonstra a dispersão 
total dos dados, sendo calculada pelo quadrado do desvio padrão (BUSSAB; MORETTIN, 2010).
Imagine que você queira checar a probabilidade de obtermos “coroa” no lançamento de qua-
tro moedas. A probabilidade associada a cada um dos possíveis resultados (de zero a quatro, ou 
seja, o número de resultados possíveis é n = 5) é descrita pela figura a seguir. 
Figura 3 – Distribuição de probabilidades com n=5
1 20 3 4
0
0,05
0,1
0,15
0,2
0,25
0,3
0,35
0,4
Fonte: elaborada pelo autor, 2017.
Por outro lado, se você lançar trinta moedas, a probabilidade de obter entre zero e trinta 
coroas é dado pelo seguinte gráfico:
Figura 4 – Aproximação de uma distribuição de probabilidades a uma distribuição normal com n=30
0 1 2 3 4 5 6 7 8 9 10 1112 13 14 15 1617 18 19 20 21 22 2324 25 2627 28 29 30
-
0,02
0,04
0,06
0,08
0,10
0,12
0,14
0,16
Fonte: elaborada pelo autor, 2017.
Você pode perceber que, à medida que o número de elementos de uma amostra (n) aumenta, 
a distribuição de probabilidades torna-se semelhante a uma distribuição normal, com média igual 
a 15 e variância igual a 2,75. 
SAIBA MAIS!
Conheça mais a respeito do Teorema do Limite Central no tópico 3.2 da tese de 
doutorado de Chang Kuo Rodrigues (PUC-SP), disponível em: <http://www.pucrs.br/
famat/viali/tic_literatura/teses/chang_kuo_rodrigues.pdf>.
Por meio da imagem anterior, que ilustra um histograma com n = 30 observações, há uma tendên-
cia de aglutinação dos dados em torno da média. Essa distribuição, portanto, é simétrica e pode 
ser padronizada em uma distribuição normal. Por transformação algébrica, distribuições normais 
com amostras de tamanho n podem ser padronizadas à distribuição normal N(0,1) por meio da 
seguinte fórmula:
−µ
= ×
σ
XZ nZ n= ×Z n= ×= ×Z n= ×
Pelo Teorema do Limite Central, podemos checar as probabilidades de uma amostra enqua-
drar-se dentro de determinados intervalos em torno da média dos valores observados pelo pesqui-
sador (BUSSAB; MORETTIN, 2010).
EXEMPLO
Imagine que a estatura de um grupo de alunos do Ensino Fundamental segue uma 
distribuição normal, com média igual a 100 centímetros e desvio padrão igual a 10 
centímetros. Se retirarmos uma amostra de 16 alunos dessa população, e X for a 
média dessa amostra, qual será a probabilidade P (90 < X < 110)?
Para responder à questão, devemos recorrer ao Teorema do Limite Central, que nos 
permite obter probabilidades associadas a intervalos por meiode amostras. Tendo 
em mente que n = 16, μ = 100 e σ = 10, faremos a padronização da variável Z em 
duas partes. Primeiramente, para P (90 < X):
1
90 100
16 4,00
90 100
16 4,00
90 100
10
16 4,00
10
16 4,00
−µ −−µ −90 100−µ −90 100
16 4,00
−µ −
16 4,00
90 100
16 4,00
90 100−µ −90 100
16 4,00
90 100
= × = × = −= × = × = −= × = × = −16 4,00= × = × = −16 4,0016 4,00= × = × = −16 4,00
−µ −
= × = × = −
−µ −−µ −
= × = × = −
−µ −
16 4,00
−µ −
16 4,00= × = × = −16 4,00
−µ −
16 4,00
σ
XZ nZ n1Z n1 = × = × = −Z n= × = × = −= × = × = −Z n= × = × = −
Já para P(X < 110), temos:
2
110 100
16 4,00
110 100
16 4,00
110 100
10
16 4,00
10
16 4,00
−µ −−µ −110 100−µ −110 100
16 4,00
−µ −
16 4,00
110 100
16 4,00
110 100−µ −110 100
16 4,00
110 100
= × = × == × = × == × = × =16 4,00= × = × =16 4,0016 4,00= × = × =16 4,00
−µ −
= × = × =
−µ −−µ −
= × = × =
−µ −
16 4,00
−µ −
16 4,00= × = × =16 4,00
−µ −
16 4,00
σ
XZ nZ n2Z n2 = × = × =Z n= × = × == × = × =Z n= × = × =
Recorrendo à tabela de distribuição normal, vemos que o valor associado a Z = 4,00 
é de aproximadamente 49,997%. Logo, se há 49,997% de chance dos alunos terem 
entre 90 e 100 centímetros (em Z1), e 49,997% de chance de terem entre 100 e 110 
centímetros (em Z2), temos que P (90 < X < 110) = 99,994%.
O Teorema do Limite Central é importante para verificarmos a aderência de uma amostra a 
uma distribuição normal. Por meio dele, podemos verificar as margens de erro de uma pesquisa 
associada a um conjunto de observações (BUSSAB; MORETTIN, 2010).
Fechamento
Nesta aula, você teve possibilidade de:
 • conhecer a distribuição normal e suas aplicações;
 • entender o conceito de Teorema do Limite Central e seus efeitos sobre uma pesquisa a 
partir de um conjunto de amostras.
Bibliografia
BUSSAB, Wilton de Oliveira; MORETTIN, Pedro. Estatística Básica. 6. ed. São Paulo: Saraiva,2010.
CRESPO, Antonio. Estatística Fácil. São Paulo: Saraiva, 2005.
MILONE, Giuseppe; ANGELINI, Flávio. Estatística geral. São Paulo: Atlas, 1993.
RODRIGUES, Chang Kuo. O Teorema Central do Limite: Um estudo ecológico do saber e do 
didático. Tese (Doutorado em Educação Matemática) - São Paulo: PUC-SP, 2009. Disponível em: 
<http://www.pucrs.br/famat/viali/tic_literatura/teses/chang_kuo_rodrigues.pdf>. Acesso em: 07 
mar. 2017.

Continue navegando