Baixe o app para aproveitar ainda mais
Prévia do material em texto
159 ESTATÍSTICA Unidade III 7 DISTRIBUIÇÕES DE PROBABILIDADES Vimos as maneiras que se apresentam dados estatísticos, conceituamos frequência simples e posteriormente frequência relativa. Vimos, ainda, que probabilidades podem ser definidas como as frequências simples de eventos ocorridos quando houver uma quantidade de repetições considerável do experimento. Como decorrência disso nós podemos estabelecer o conceito de distribuição de probabilidades em analogia com as distribuições de frequências com algumas diferenças: • Na distribuição de frequências normalmente utilizávamos como informação principal a frequência simples. Na distribuição de probabilidades priorizaremos as frequências relativas, agora chamadas de probabilidades. • Distribuições de frequências são informações reais, exatas, decorrência de observações efetuadas. Já distribuições de probabilidade são previsões feitas a partir daquelas observações, portanto não são reais, são evidentemente prováveis. • Enquanto em estatística descritiva utilizamos nos cálculos os dados apresentados na forma de tabelas, nesta etapa será mais frequente o uso das informações na forma de gráficos. 7.1 Conceitos de distribuição de probabilidades Definimos anteriormente tabela ou distribuições de frequências como sendo uma relação entre os valores possíveis dentro de uma amostra com o número de vezes que esse valor ou classe de valores ocorreu. Por exemplo, em uma prova 20 alunos tiraram nota 10 ou então 27 funcionários da minha empresa são casados. Perceba o tempo verbal, no passado ou no presente. De modo semelhante podemos definir distribuição ou tabela de probabilidades. É a relação entre os valores possíveis de ocorrer e a probabilidade que esse valor venha a ocorrer. Por exemplo, 15% dos alunos de estatística serão aprovados sem exame ou, então, ter terminado o curso superior aumentará em 25% o seu salário. O tempo verbal agora está no futuro. A distribuição de probabilidades, à semelhança com distribuição de frequências, é uma listagem dos valores possíveis com suas respectivas probabilidades. Essa listagem pode ser na forma de tabela ou de gráfico, ou ambas. 160 Unidade III Como trabalhamos muitas vezes com variáveis discretas e outras tantas com variáveis contínuas, dividimos as distribuições de probabilidades em dois grandes grupos, cada um deles com modelos matemáticos específicos: • Distribuições de probabilidades discretas: —― Distribuição binomial. — Distribuição de Poisson. — Distribuição hipergeométrica. • Distribuições de probabilidades contínuas: — Distribuição normal. — Distribuição exponencial. O modelo de distribuição a ser utilizado depende dos aspectos específicos da situação – problema que está sendo estudado. De modo geral, para os cálculos que envolvam as distribuições discretas, utilizamos equações estatísticas para calcular as probabilidades. Já para as contínuas nos valemos de gráficos e de tabelas deles decorrentes. Como as distribuições binomiais, de Poisson e em especial as distribuições normais são as mais utilizadas na prática, concentraremos nossos estudos nessas três. As demais distribuições apresentam modelos matemáticos diferenciados (fórmulas e gráficos se alteram de uma para outra), mas seguem padrões de cálculos semelhantes, o que facilitará o estudo futuro para aqueles que assim necessitarem e desejaram. Saiba mais Todos nós temos uma tendência de raciocinar segundo uma função de 1º grau. A regra de três parece solucionar todas as nossas dúvidas. Mas a realidade não é assim e pode ser surpreendente descobrir que não estamos preparados para o raciocínio exponencial. Em um curto vídeo de pouco mais de sete minutos, Mauricio Féo mostra as consequências desse desconhecimento. Veja o vídeo apresentado na matéria a seguir: OLIVEIRA, E. Enigma da vitória-régia vira exemplo em vídeo que explica o que é o crescimento exponencial da pandemia. G1., 10 abr. 2020. Disponível em: https://g1.globo.com/bemestar/coronavirus/noticia/2020/04/10/enigma-da- vitoria-regia-vira-exemplo-em-video-que-explica-o-que-e-o-crescimento- exponencial-da-pandemia.ghtml. Acesso em: 3 nov. 2020. 161 ESTATÍSTICA 7.2 Distribuições para variáveis discretas Variáveis discretas são aquelas que podem apresentar apenas determinados valores preestabelecidos dentro da lógica do experimento. São variáveis contáveis e não mensuráveis, e, portanto, normalmente números inteiros, como número de filhos numa família; número de funcionários em determinado setor da empresa; número de chutes na direção do gol de um time em certa partida. 7.2.1 Cálculo de distribuições binomiais a partir de probabilidades com poucos eventos A distribuição de binomial é uma distribuição para variáveis discretas e, como o nome indica, é utilizada quando temos a presença de dois eventos complementares. É uma generalização do binômio de Newton e adapta-se às situações estatísticas que seguem o princípio de Bernoulli, que são os seguintes: • Em cada repetição do experimento, nomeado como tentativa, existem dois e apenas dois resultados possíveis, complementares chamados por conveniência de sucesso e insucesso. • A série de tentativas é composta de eventos independentes. • As probabilidades de sucesso e insucesso permanecem constantes ao longo das tentativas. É um processo estacionário. Para entender o funcionamento e a utilidade da distribuição binomial vamos recuperar um tipo de problema que já equacionamos anteriormente: Exemplo 1 Um vendedor sabe que, ao sair para fazer um determinado tipo de venda, tem 20% de probabilidade de concretizá-la. Num dia qualquer ele sai para atender a três clientes, qual é a probabilidade de fazer exatamente duas vendas? O problema pode ser resolvido usando os conceitos aprendidos antes. Mas, veja bem, isso só é possível porque ele pretende fazer poucas visitas. Caso ele saísse para fazer dez visitas, a resolução seria demasiadamente trabalhosa. Vamos começar pelo caso mais fácil. A árvore de decisões apresentada a seguir mostra três caminhos nos quais o vendedor consegue efetivar exatamente duas vendas. 162 Unidade III Caminho 1 0,2 x 0,2 x 0,2 = 0,23 x 0,80 = 0,0080 Caminho 5 0,8 x 0,2 x 0,2 = 0,22 x 0,81 = 0,0320 Caminho 3 0,2 x 0,8 x 0,2 = 0,22 x 0,81 = 0,0320 Caminho 7 0,8 x 0,8 x 0,2 = 0,21 x 0,82 = 0,1280 Caminho 2 0,2 x 0,2 x 0,8 = 0,22 x 0,81 = 0,0320 Caminho 6 0,8 x 0,2 x 0,8 = 0,21 x 0,82 = 0,1280 Caminho 4 0,2 x 0,8 x 0,8 = 0,21 x 0,82 = 0,1280 Caminho 8 0,8 x 0,8 x 0,8 = 0,20 x 0,83 = 0,5120 Somatório das probabilidades de todos os caminhos = 1 0,2 0,2 0,2 0,2 0,2 0,2 0,2 0,8 0,8 0,8 0,8 0,8 0,8 0,8 Efetua a compra 3º Cliente Efetua a compra Efetua a compra Efetua a compra Efetua a compra Efetua a compra 3º Cliente 2º Cliente Não efetua a compra 3º Cliente Não efetua a compra Não efetua a compra Não efetua a compra Não efetua a compra Não efetua a compra 3º Cliente 2º Cliente Efetua a compra Não efetua a compra 1º Cliente Figura 43 O vendedor efetiva exatamente duas vendas se ocorrer um desses caminhos (possibilidades): 2; 3 e 5. Como vimos anteriormente a probabilidade de o vendedor realizar exatamente duas vendas será a soma das probabilidades dos três caminhos. ( ) ( ) ( ) ( )P exatamente duas vendas P caminho 2 P caminho 3 P caminho5= + + ( )P exatamente duas vendas 0,0320 0,320 0,0320 0,0960 ou 9,60%= + + = Desse modo, a probabilidade de o vendedor conseguir efetivar exatamente duas vendas é de 9,60%. Observe alguns dados interessantes sobre esse cálculo que acabamos de fazer: • Todos os caminhos têm o mesmo cálculo: 0,22 x 0,81 = 0,0320. Note que 0,2 é a probabilidade de se concretizar a venda e o expoente dele, 2, é o número de vendas que queremos concretizar; 0,8 é a probabilidade de não se concretizar a venda e o expoente dele, 1, é o número de vendas que não iremos concretizar. • Observe também que existem três caminhos possíveis. Você deve lembrar que esse valorse refere às combinações possíveis de três elementos (os clientes visitados) tomados dois a dois (o número de vendas que queremos efetivar): ( ) ( )n,x 3,2 n! 3! 31 1 2 3 C C 3 x! n x ! 2! 3 2 ! 2! 1! 1 2 1 × ×= → = = = = − − × × × 163 ESTATÍSTICA Dessa forma conseguimos encontrar uma fórmula para calcular qualquer quantidade de eventos, com muito menos trabalho, como no seguinte exemplo. Exemplo 2 Um vendedor sabe que, ao sair para fazer um determinado tipo de venda, tem 30% de probabilidade de concretizá-la. Num dia qualquer ele sai para atender 20 clientes, qual é a probabilidade de fazer exatamente oito vendas? Nessa questão os números envolvidos são muito maiores que o exemplo anterior, causando um trabalho braçal muito grande quando resolvido “na raça” como no exemplo anterior. Mas agora, como já conhecemos o funcionamento da distribuição, é só usá-lo: • Probabilidade de se efetivar uma venda: 30% ou 0,3. • Número de vendas que quero efetivar: oito. • Probabilidade de não se efetivar uma venda: 70% ou 0,7 (lembre-se: são eventos complementares). • Número de vendas que não se efetivarão: 12 (lembre-se: se o vendedor vai fazer 20 visitas e concretiza a venda em oito delas, não concretizará vendas em 12 delas, obviamente). Aplicando a fórmula: • Número de caminhos: ( ) ( )n,x 20,8 n! 20! C C 125.970 x! n x ! 8! 8 2 ! = → = = − − • Probabilidade de ocorrência de cada caminho: 0,38 x 0,712 = 0,0000009081. • Probabilidade de se efetivarem exatamente oito vendas: 125.970 x 0,0000009081 = 0,1144 ou 11,44%. Perceba que, apesar de os números envolvidos serem difíceis de trabalhar, ainda é muito mais simples que o raciocínio da árvore. Formalmente, a fórmula para o cálculo da distribuição binomial é a seguinte: ( ) ( )n xxn,xP X x C p 1 p −= = × × − Onde: 164 Unidade III • ( )P X x= é a probabilidade que o número de sucessos obtidos seja exatamente igual a x. • n é o número de tentativas realizadas, ou seja, o número de vezes que o experimento é realizado. • x é o número de sucessos que desejamos obter. • p é a probabilidade de sucesso numa única tentativa. No exemplo a seguir vamos efetuar o cálculo usando diretamente a fórmula da distribuição binomial. Exemplo 3 Num ano qualquer, 55% das ações negociadas na Bolsa de Valores de São Paulo sofreram alta, enquanto 45% se mantiveram estáveis ou sofreram baixas. Uma corretora de ações separa dez ações de sua carteira ao acaso. Qual é a probabilidade de que, dessas dez ações: • Exatamente oito ações tenham tido alta? • Todas as dez ações tenham tido altas? • No máximo duas ações tenham tido altas? Perceba que temos que, para usar a fórmula, determinar o valor de três grandezas: n; p; x. Nos cálculos dos três itens solicitados, o valor de n e p não se alteram. O que vai alterar de um item para outro é apenas o valor de x: • Número de tentativas: n = 10. • Probabilidade de sucesso: p 0,55 = (probabilidades de uma ação ter alta). Para responder às questões, basta determinar o valor de x específico e aplicar a fórmula: • Na primeira pergunta, o valor de x é oito: x = 8, logo, o cálculo será: ( ) ( ) ( ) ( )n x 10 8x 8n,x 10,8P X x C p 1 p P X 8 C 0,55 1 0,55− −= = × × − → = = × × − ( ) ( ) ( ) 10 88 8 210!P X 8 0,55 1 0,55 45 0,55 0,45 45 0,0084 0,2025 8! 10 8 ! −= = × × − = × × = × × − ( )P X 8 0,0765 ou 7,65%= = 165 ESTATÍSTICA P(X 8) 0,0765 7,65%= = = • Na segunda pergunta, o valor de x é dez: x = 10, e o cálculo será: ( ) ( ) ( ) ( )n x 10 10x 10n,x 10,10P X x C p 1 p P X 10 C 0,55 1 0,55− −= = × × − → = = × × − ( ) ( ) ( ) 10 1010 10 010!P X 10 0,55 1 0,55 1 0,55 0,45 10! 10 10 ! −= = × × − = × × − ( )P X 10 0,0025 ou 0,25%= = • Na terceira pergunta, o valor de x é 0; 1 e 2, porque queremos no máximo duas ações com altas, ou seja, nenhuma ação com alta ou uma ação com alta ou duas ações com alta. Observação A fórmula da distribuição binomial nos permite calcular a probabilidade de exatamente uma possibilidade. Quando queremos as probabilidades de várias possibilidades, devemos calculá-las separadamente e somar os valores encontrados. Vamos então fazer os três cálculos e somar os valores: ( ) ( )10 0010,0P X 0 C 0,55 1 0,55 0,0003−= = × × − = ( ) ( )10 1110,1P X 1 C 0,55 1 0,55 0,0042−= = × × − = ( ) ( )10 2210,2P X 2 C 0,55 1 0,55 0,0229−= = × × − = ( )P X no máximo duas ações em alta 0,0003 0,0042 0,0229 0,0274 ou 2,74%= = + + = Nos exemplos calculamos algumas possibilidades, mas a rigor a distribuição de probabilidades binomial seria uma tabela, com todos os possíveis resultados (possibilidades) associados às suas probabilidades correspondentes. A tabela a seguir faz isso para os dados da questão das ações negociadas em Bolsa. 166 Unidade III Tabela 69 Número de ações em alta (x) Cálculos das probabilidades para n = 10 e p = 0,55 Probabilidade de ocorrência 0 P (X = 0) = C10,0 x 0,55 0 x (1 - 0,55) 10-0 0,03% 1 P (X = 1) = C10,1 x 0,55 1 x (1 - 0,55) 10-1 0,42% 2 P (X = 2) = C10,2 x 0,55 2 x (1 - 0,55) 10-2 2,29% 3 P (X = 3) = C10,3 x 0,55 3 x (1 - 0,55) 10-3 7,46% 4 P (X = 4) = C10,4 x 0,55 4 x (1 - 0,55) 10-4 15,96% 5 P (X = 5) = C10,5 x 0,55 5 x (1 - 0,55) 10-5 23,40% 6 P (X = 6) = C10,6 x 0,55 6 x (1 - 0,55) 10-6 23,84% 7 P (X = 7) = C10,7 x 0,55 7 x (1 - 0,55) 10-7 16,65% 8 P (X = 8) = C10,8 x 0,55 8 x (1 - 0,55) 10-8 7,63% 9 P (X = 9) = C10,9 x 0,55 9 x (1 - 0,55) 10-9 2,07% 10 P (X = 10) = C10,10 x 0,55 10 x (1 - 0,55) 10-10 0,25% Somatório 100,00% Observe a tabela anterior e verifique a semelhança com a apresentação feita na parte de estatística descritiva para as amostras. Lembre-se de que, a partir de informações desse tipo, definíamos as medidas de posição e as medidas de dispersão para as amostras. De maneira semelhante iremos agora definir as mesmas medidas para as populações, com a diferença que para amostras são valores reais e para população valores prováveis, ou esperados. Como fizemos com as tabelas de frequências, poderíamos apresentar esses mesmos dados na forma gráfica, com um histograma, por exemplo: 104 82 60 93 71 5 0,00% 5,00% 10,00% 15,00% 25,00% 20,00% 30,00% Figura 44 167 ESTATÍSTICA 7.2.2 Definição e cálculo de valores esperados (esperança matemática) e desvio padrão esperado para a binomial Vimos que as amostras apresentam medidas estatísticas importantes calculáveis a partir da distribuição ou tabela de frequências. Com as populações ocorre algo similar. Podemos calcular as mesmas medidas a partir das distribuições de probabilidades com a diferença que os valores obtidos são prováveis, e não reais e exatos. Por exemplo, a nota média final que você tirou em uma matéria do primeiro semestre é algo real, definido e exato. É uma média amostral. Já a média que você tirará numa matéria do oitavo semestre é um valor provável (apesar de poder ser estimada tomando os devidos cuidados). Chamamos esta de média populacional. O que se reproduz para as demais medidas estatísticas. Observação Alguns autores diferenciam as medidas estatísticas amostrais das populacionais atribuindo a essas últimas o termo “parâmetros estatísticos”. Neste texto, sempre que necessário, utilizaremos os termos amostral e populacional para estabelecer a diferença. Aparecerá o termo “esperado” para significar algo provável. A média de uma população é um valor provável ou, se preferir, esperado, e é calculado de maneira semelhante ao que foi calculado na amostra, mas utilizando-se os valores de probabilidades ao invés das frequências. Utiliza-se como símbolo da média populacional a letra grega µ (mi), ou então o símbolo E(x), significando a esperança de x ou o valor esperado para x, e é obtida pela fórmula: ( ) n 1 1 2 2 3 3 n n i i 1 1 E x p x p x p x p x p x = = + + +…+ = ∑ Usando os dados do exemplo 3, vamos efetuar o cálculo do valor esperado ou média populacional. Perceba a semelhança com o cálculo da média amostral feita em estatística descritiva. 168 Unidade III Tabela 70A B C D = A x C Número de ações em alta Probabilidade de ocorrência em percentual Probabilidade de ocorrência em decimal pi × xi xi pi 0 0,03% 0,0003 0,0000 1 0,42% 0,0042 0,0042 2 2,29% 0,0229 0,0458 3 7,46% 0,0746 0,2238 4 15,96% 0,1596 0,6383 5 23,40% 0,2340 1,1702 6 23,84% 0,2384 1,4302 7 16,65% 0,1665 1,1653 8 7,63% 0,0763 0,6104 9 2,07% 0,0207 0,1865 10 0,25% 0,0025 0,0253 Somatório E (x)= 5,5000 Isso significa que o valor esperado de ações em alta nessa Bolsa é de 5,5 ações, das dez consideradas. Podemos afirmar que, em cada dez ações acompanhadas, 5,5 devem estar em alta. Perceba que não é uma certeza, é um valor sujeito à variabilidade. Observação É costumeiro nos referir ao valor esperado com termos variados como esperança matemática, média provável, média populacional etc. São termos equivalentes. A simbologia usada para as medidas populacionais são letras do alfabeto grego. A média populacional, como já dito, é µ, o desvio padrão é σ e a variância é σ2. A variabilidade a que nos referimos é medida pela variância (ou pela sua raiz quadrada o desvio padrão), que tem as mesmas definição e características daquela definida para a amostra e é calculada pela fórmula: ( ) ( ) ( ) 22Var x E x E x = − A tabela a seguir mostra o cálculo da variância, semelhante ao feito para as amostras. 169 ESTATÍSTICA Tabela 71 A B C D = A x C E = A x A F = E x C Número de ações em alta Probabilidade de ocorrência percentual Probabilidade de ocorrência decimal pi × xi Valor (n. de ações) ao quadrado pi × xi 2 xi pi xi 2 0 0,03% 0,0003 0,0000 0 0 1 0,42% 0,0042 0,0042 1 0,0042 2 2,29% 0,0229 0,0458 4 0,0916 3 7,46% 0,0746 0,2238 9 0,6714 4 15,96% 0,1596 0,6383 16 2,5531 5 23,40% 0,2340 1,1702 25 5,8508 6 23,84% 0,2384 1,4302 36 8,5812 7 16,65% 0,1665 1,1653 49 8,1574 8 7,63% 0,0763 0,6104 64 4,8834 9 2,07% 0,0207 0,1865 81 1,6787 10 0,25% 0,0025 0,0253 100 0,2533 Somatório E (x) 5,5000 E (x2) 32,7250 ( ) ( ) ( ) ( ) [ ]2 22Var x E x E x Var x 32,7 5,5 32,7 30,3 2,4 = − → = − = − = Lembrete A fórmula Var(x) = E(x2) - [E(x)]2 é lida da seguinte forma: “variância de x é igual ao valor esperado do quadrado de x menos o valor esperado de x ao quadrado”. Você se lembra de que o desvio padrão é a raiz quadrada da variância? O símbolo do desvio padrão populacional é a letra grega σ (sigma), portanto: ( )Var xσ = Nesse exemplo, o desvio padrão é dado por: ( )Var x 2,4 1,5σ = → σ = = Todas essas informações estatísticas, que acabamos de ver e calcular para o caso do lote de ações da Bolsa de Valores, podem ser apresentadas na forma gráfica, de modo semelhante ao que fizemos para as amostras. 170 Unidade III Observe que, enquanto no eixo horizontal continuamos a colocar os valores envolvidos, no eixo vertical colocamos agora as probabilidades, e não mais as frequências. De resto são gráficos bastante semelhantes, com a já sabida e repisada diferença de que um apresenta valores reais (quando trabalhamos com amostras) e o outro, valores prováveis (para a população). 104 Número de ações em alta Pr ob ab ili da de s 82 60 93 71 5 µ-σ µ+σµ 0% 5% 10% 15% 25% 20% Figura 45 No gráfico podemos definir: • As probabilidades de cada ocorrência (determinado número de ações em alta), representadas pelas colunas verticais. • A média (µ) ou valor esperado para essa distribuição, representada pela linha tracejada central. • A variação de um desvio padrão (σ) para mais, representada pela linha traço ponto da direita. • A variação de um desvio padrão (σ) para menos, representada pela linha traço ponto da esquerda. • Uma curva que passa pelo topo de todas as colunas, centrada na média e com inflexões nos desvios padrões para mais e para menos. Essa curva extremamente importante para a estatística é a normal. Verifique, por ora, que é evidente o fato de que, quanto maior for o número de colunas, mais definida será a referida curva, em outras palavras a distribuição binomial tende à distribuição normal quando o número de elementos envolvidos aumenta. Veremos mais à frente que, quando n ≥ 30, as distribuições praticamente se confundem. 171 ESTATÍSTICA 7.2.3 Definição e cálculo de distribuição de Poisson A distribuição de Poisson é uma distribuição discreta de probabilidades usada para determinar a probabilidade do número de ocorrências num determinado intervalo de tempo ou espaço. Por exemplo, quando desejamos saber a probabilidade de que em determinada hora de atendimento no caixa de um banco comparecem exatamente cinco clientes. Essa distribuição trata de eventos relativamente raros e tem como característica o fato de contar os sucessos, mas não os fracassos. Perceba que o número de clientes que comparecem à uma agência bancária é relativamente pequeno em comparação ao total de clientes dessa agência. Outra característica importante é que nessa distribuição é possível contar os sucessos, mas não os insucessos ou falhas. Por exemplo, podemos contar o número de clientes que vão à uma agência bancária, mas não os que não vão. A distribuição binomial é utilizada quando desejamos saber a probabilidade de ocorrência de um determinado número de sucessos dentro de uma série de repetições. Já a distribuição de Poisson pesquisa a probabilidade de ocorrência de um número específico de resultados dentro de um determinado intervalo de tempo ou espaço. O uso da distribuição de Poisson deve satisfazer às seguintes condições: • Devemos contar o número de vezes que determinado evento ocorre num intervalo de tempo ou espaço. • A probabilidade de que o evento venha a ocorrer é a mesma em cada intervalo considerado. • O número de ocorrências em um intervalo independe do número de ocorrências em outros intervalos. Nessas condições, a probabilidade que ocorra exatamente x ocorrências em um intervalo é dada por: ( ) ( ) x tt e P x x! −λλ = Onde: P (x) = probailidade de ocorrerm exatamente x sucessos λ = número médio de sucesso em um determinado intervalo (de tempo ou espaço) t = intervalo de tempo ou espaço contínuo de observações e = constante neperiana cujo valor aproximado é de 2,7183 x = número de sucessos no intervalo desejado 172 Unidade III Observação A constante neperiana muitas vezes é chamada de constante de Euler; constante de Napier, número de Neper; número neperiano; constante matemática, número exponencial entre outros termos. É a base dos logaritmos naturais e seu valor aproximado é de 2,718281828459045235360287, sendo um valor irracional, usaremos o valor com quatro casas decimais 2,7183. Através de exemplos, entenderemos melhor o uso dessa ferramenta. Exemplo 1 Uma grande agência bancária recebe em seus caixas em média dez clientes por hora. Qual a probabilidade de que em um intervalo de meia hora receba exatamente quatro clientes? Temos que: λ =10 (clientes por hora) t = 0,5 (hora) x = 4 ( ) ( ) ( ) ( ) ( )x 4 10 0,5t 4 5t e 10 0,5 e 5 e P x P 4 x! 4! 1 2 3 4 625x0,00674 4,21250 0,1755 ou 17,55% 24 24 − ×−λ −λ × ×= → = = = × × × = = = A probabilidade de exatamente quatro clientes comparecerem no intervalo de meia hora nos caixas dessa agência é de 17,55%. Exemplo 2 Uma pesquisa do Ibama revelou que em determinada região amazônica existem uma média de 2,6 onças por 100 km2. Qual a probabilidade de serem encontradas exatamente duas onças numa área florestal com 25 km2? Temos que: ( )22,6 onças por 100 kmλ = 173 ESTATÍSTICA ( )2t 25 km= x 2= ( ) ( ) ( ) ( ) ( )x 2 2,6 0,25t 2 0,65t e 2,6 0,25 e 0,65 e P x P 2,6 x! 2! 1 2 0,4225x0,5220 0,2205 0,1103 ou 11,03% 2 2 − ×−λ −λ × ×= → = = = × = = = Existe 11,03% de probabilidade de na área considerada existirem exatamente duas onças. Exemplo 3 Uma grande siderúrgica tem uma média de 14 acidentes por ano. Qual a probabilidade que ela passe um mês sem nenhum acidente? Temos que: λ = 14 (acidentes por ano) t = 1 (mês) x = 0 ( ) ( ) ( ) 10 14 12 x t 1,667 1 14 e t e 1 e12P x P 0 x! 0! 1 1x0,31140,3114 0,3114 ou 31,14% 2 1 − × −λ − × λ ×= → = = = = = = A probabilidade de a siderúrgica não ter acidentes durante um mês inteiro é de 21,14%. Como na distribuição binomial a média, a variância e o desvio padrão podem ser calculados por fórmulas previamente demonstradas, são elas: Média: tµ = λ ⋅ 2Variância: tσ = λ ⋅ Desvio padrão : tσ = λ ⋅ 174 Unidade III Exemplo 4 Uma máquina automática de venda de refrigerantes apresenta em média três falhas por semana. Calcular para um intervalo de 210 dias de funcionamento. • Qual o número esperado de falhas nesse período? Temos 3 3 falhas por semana ou por dia 7 λ = t 210 dias= 3 t 210 90 falhas 7 µ = λ ⋅ = × = • Qual o desvio padrão do número de falhas esperadas? 3 t 210 90 9,5 falhas 7 σ = λ ⋅ = × = = Exemplo de aplicação Uma refinaria de petróleo tem capacidade de receber e abastecer de gasolina no máximo quatro caminhões por dia. Caso receba mais do que quatro caminhões, o excesso deverá pernoitar num estacionamento próximo. Sabe-se que em média chegam três caminhões por dia. Qual a probabilidade de, em dado dia, alguns caminhões terem de pernoitar para abastecer no dia seguinte? Resolução A necessidade de pernoite ocorre quando há mais do que quatro caminhões para serem abastecidos, logo, quando há menos do que isso, a refinaria atende no mesmo dia. Devemos então calcular a probabilidade da presença de quatro ou de três ou de dois ou de um ou de zero caminhões. Nesses casos, todos serão atendidos, portanto a probabilidade complementar corresponde aos não atendimentos. Assim temos que: λ = 3 (caminhões por dia) t = 1 (dia) x = 0; 1; 2; 3; 4 175 ESTATÍSTICA ( ) ( ) ( ) 10 14 12 x t 1,667 1 14 e t e 12P x P 4 x! 0! 1 e 1x0,3114 0,3114 0,3114 ou 31,14% 1 2 1 − × −λ − × λ = → = = ×= = = = ( ) ( ) ( ) ( ) ( )x 0 3 1t 3t e 3 1 e 1 e P x P 0 0,0498 x! 0! 1 − ×−λ −λ × ×= → = = = ( ) ( ) ( ) ( ) ( )x 1 3 1t 3t e 3 1 e 3 e P x P 1 0,1494 x! 1! 1 − ×−λ −λ × ×= → = = = ( ) ( ) ( ) ( ) ( )x 2 3 1t 3t e 3 1 e 9 e P x P 2 0,2240 x! 2! 2 − ×−λ −λ × ×= → = = = ( ) ( ) ( ) ( ) ( )x 3 3 1t 3t e 3 1 e 27 e P x P 3 0,2240 x! 3! 6 − ×−λ −λ × ×= → = = = ( ) ( ) ( ) ( ) ( )x 4 3 1t 3t e 3 1 e 81 e P x P 4 0,1680 x! 4! 24 − ×−λ −λ × ×= → = = = Assim a probabilidade de haver uma quantidade de caminhão compatível com a capacidade da refinaria é de: ( ) ( ) ( ) ( ) ( ) ( )P dentro da capacidade P 0 P 1 P 2 P 3 P 4= + + + + = ( )P dentro da capacidade 0,0498 0,1494 0,2240 0,2240 0,1680 0,8152= + + + + = A probabilidade de não atendimento é o complementar da de atendimento: ( ) ( )P fora da capacidade 1 P dentro da capacidade 1 0,8152 0,1848 ou 18,48%= − = − = A probabilidade de um caminhão ter que pernoitar para ser abastecido é de 18,48%. 176 Unidade III 8 DISTRIBUIÇÕES PARA VARIÁVEIS CONTÍNUAS Vimos a mais importante distribuição de probabilidades discretas, a distribuição binomial. Para variáveis contínuas, a mais importante distribuição é a distribuição normal ou de Gauss. Aliás, essa é a mais importante entre todas as distribuições de probabilidades e a mais usada. Uma enorme quantidade de situações estatísticas recai na distribuição normal. O gráfico já apresentado e repetido a seguir mostra o surgimento da curva a partir de um histograma de probabilidades, com suas características principais: • centrado na média; • com sua forma definida pelo valor do desvio padrão. 104 Número de ações em alta Pr ob ab ili da de s 82 60 93 71 5 µ-σ µ+σµ 0% 5% 10% 15% 25% 20% Figura 46 Vamos entender a distribuição normal a partir da próxima tabela. Nela estão relacionados dados referentes às ações em alta de três diferentes bolsas de valores. Foram acompanhadas 30 diferentes ações em cada uma das bolsas e calculados os comportamentos estatísticos, através dos conceitos de valores esperados para a binomial. Cada uma delas com um comportamento diferente expresso pela média e pelo desvio padrão. Tabela 72 Bolsa de valores Número de observações Probabilidade de ações em alta Média de ações em alta Desvio padrão de ações em alta A 30 30% 9 2,51 B 30 50% 15 2,74 C 30 80% 24 2,19 177 ESTATÍSTICA Observação A média e o desvio padrão de cada uma das bolsas foram calculados através das fórmulas de esperança matemática. Para a Bolsa A, por exemplo, temos: np 30 0,3 9µ = = × = e ( ) ( )n p 1 p 30 0,3 1 0,3 2,51σ = × × − = × × − = . Essas mesmas informações estão mostradas no gráfico a seguir. Perceba que retiramos as colunas do histograma e mantivemos apenas a curva. Essas curvas são as chamadas distribuições normais. Quando o número de observações (tentativas) numa distribuição binomial aumenta, ela se aproxima cada vez mais da distribuição normal, até que ficam indistinguíveis. Chama-se a isso de aproximação da binomial pela normal. 20% 12% 16% 8% 2% 18% 10% 4% 14% 6% 0% 0 5 2010 2515 Número de ações em alta (x) 30 f (x) Bolsa A (9; 2; 51) Bolsa B (15; 2; 74) Bolsa C (24; 2; 19) Figura 47 Observando atentamente o gráfico anterior percebemos que na Bolsa C é praticamente impossível (ou seja, a probabilidade é muito próxima de zero) que existam menos de 15 ações em alta. Para a Bolsa A é o oposto, é praticamente impossível que tenha mais do que 16 ou 17 ações em alta. Já para a Bolsa B o mais provável é que haja 15 ações em alta. Lembrete As probabilidades estão relacionadas às áreas entre a curva e o eixo horizontal. Quando não existe área, não existe probabilidade. É o caso da curva C após o valor 17 (aproximadamente). Ela praticamente toca o eixo dos x, reduzindo a área correspondente a praticamente zero. 178 Unidade III Percebe-se também que a curva que apresenta o maior desvio padrão é a mais baixa e achatada (Bolsa B) e a que apresenta menor desvio padrão mais alta e afilada (Bolsa C). A Bolsa com maior probabilidade de ter ações em alta (Bolsa C) possui o gráfico deslocado para a direita, enquanto a com menor probabilidade (Bolsa A) está deslocada para a esquerda. A Bolsa B, que tem 50% de suas ações em alta, está localizada exatamente em torno do valor central e, percebe-se, é mais regular, menos “deformada” que as outras. Resumindo, a curva normal é determinada em todos os seus aspectos pela média e pelo desvio padrão. Conhecendo esses dois parâmetros, conheceremos o comportamento probabilístico do experimento. 8.1 Distribuição normal – definição Observe agora a curva referente à Bolsa B. Perceba que ela é absolutamente simétrica em relação ao eixo vertical. O lado esquerdo dela em relação à média é idêntico ao lado direito. Em outras palavras, metade da área sob essa curva está do lado esquerdo da média e metade está do lado direito; a probabilidade de se ter 15 ações ou mais em alta nessa bolsa é de 50%, assim como a probabilidade de se ter 15 ações ou menos. Essa é uma importante decorrência das distribuições contínuas, entre elas a normal: as probabilidades são proporcionais às áreas definidas pelos valores envolvidos. A questão proposta a seguir demonstra a utilidade destes conceitos: Exemplo 1 Uma empresa de pneumáticos acompanhou a vida útil de uma quantidade considerável de pneus de um determinado tipo e chegou à conclusão que essa vida útil é normalmente distribuída e tem uma média de 42.000 km com desvio padrão de 5.800 km. Um cliente adquire um desses pneus e o instala no seu automóvel. Qual é a probabilidade que ele dure mais do que 50.000 km? Antes de mais nada, vamos entender os procedimentos operacionais envolvidos. O fabricante não acompanha todos os pneus que fabrica, evidentemente, acompanha uma pequena fração deles, anotando a quilometragem durante a qual eles foram utilizados. Com esses dados, que devem ser em quantidade considerável, ele calcula a média e o desvio padrão, como nós o fizemos em estatística descritiva, e assume que, se ele tivesse acompanhado todos os pneus fabricados, os valores seriam muito próximos. Ele consegueobservar também se o experimento segue ou não a curva normal. Feita essa observação, veja o gráfico a seguir (dados fictícios). 179 ESTATÍSTICA Vida útil em milhares de km 0 5 35 6520 50 42 Área na qual estão localizados os pneus que têm vida útil maior ou igual a 50.000 km De ns id ad e Figura 48 Na área sob a curva estão representados todos os possíveis pneus desse tipo, desde o que menos rodou ou rodará até o que mais rodou ou rodará, ou seja, está representada a população dos pneus desse tipo. Perceba que o pneu que menos roda faz isso por aproximadamente 25.000 km e o mais resistente roda cerca de 65.000 km. Se todos os pneus estão representados pela área total (At) e os pneus que duram 50.000 ou mais quilômetros, na área vermelha (Ap = área pedida), então é lógico deduzir a partir do que já sabemos: P(pneu rodar 50.000 km ou mais)( ) p t A P pneu rodar 50.000 km ou mais A = Nessas circunstâncias, calcular a probabilidade significa calcular duas áreas. Não é uma tarefa fácil, matematicamente, mas foram desenvolvidos procedimentos que facilitam esses cálculos. Logo a seguir mostraremos como são esses procedimentos. Por ora, você acreditará quando digo que a área dada desse exercício corresponde a 8,38% da área total, portanto: P(pneu rodar 50.000 km ou mais) = 0,0838 = 8,31% 180 Unidade III Saiba mais As ferramentas estatísticas, em especial a distribuição normal, são ferramentas vitais do método científico. Às vezes se confundem com ele. Mas um risco grande é utilizá-las para distorcer a verdade, aproveitando do amplo desconhecimento de como elas funcionam. Estudos pseudocientíficos giram as redes sociais semeando a falsidade. Isso não é de hoje. Em 1994 o lançamento do livro A curva do sino provocou reações violentas por pretensamente “provar” teorias racistas. Leia o artigo pelo qual Marco Chiaretti mostra como o livro não seguia os ditames científicos e falseava a verdade: CHIARETTI, M. Uma questão de inteligência: livro A curva normal não é científico. SuperInteressante, 31 jan. 1995. Disponível em: https://super. abril.com.br/ciencia/uma-questao-de-inteligencia-livro-a-curva-normal- nao-e-cientifico/. Acesso em: 28 out. 2020. 8.2 Cálculo de probabilidades através da curva normal Como notamos na resolução da questão anterior, o cálculo de uma probabilidade que segue a distribuição normal é relativamente fácil e pouco trabalhoso; o grande problema é calcular as áreas envolvidas. Esse tipo de cálculo é matematicamente muito trabalhoso e teria que ser refeito a cada problema a se resolver, visto que, como cada curva normal é caracterizada pela média e pelo desvio padrão, qualquer alteração nesses parâmetros provocaria uma mudança na curva e consequentemente o recálculo das áreas envolvidas. Para facilitar esses cálculos que são repetidos centenas de milhares de vezes, foi estabelecida uma curva padrão, chamada de curva normal reduzida, a partir da qual, por analogia, determinam-se as áreas de situações práticas. 181 ESTATÍSTICA 100,0%* 68,2%* 4 Z P (z) 3210-1-2-3-4 95,4%* 99,7%* Figura 49 Essa curva tem várias características interessantes que facilitarão nossos cálculos: • Utiliza-se a variável reduzida (padrão) z para diferenciar da variável real, aquela que envolve os problemas práticos que continuaremos a chamar de x (por exemplo, vida útil do pneu do nosso exemplo). • É construída para uma média igual a zero e um desvio padrão igual a 1 (µ=0; σ=1). • A área total sob a curva normal reduzida é igual a 1. • A curva varia, no eixo z, desde -4 até mais 4, ou seja, de menos quatro desvios padrões da média até mais quatro desvios padrões da média. • Todas as áreas são tabeladas (vide tabela do Anexo). • A relação entre a curva normal reduzida e a curva normal real é feita pela fórmula: x z − µ= σ Onde: z é a variável reduzida x é a variável real 182 Unidade III µ é a média real σ é o desvio padrão real Como veremos logo a seguir, os cálculos de probabilidades através da distribuição normal são feitos por analogia entre uma situação real, caracterizada por valores específicos de µ e σ, e uma situação padrão caracterizada por uma média igual a zero e um desvio padrão igual a 1. Perceba que, entre um desvio padrão para menos, em relação à média, e um desvio padrão para mais, a área é de 68,2% do total. Entre dois desvios padrões para menos e dois desvios padrões para mais, a área é de 95,4% do total e assim por diante. Perceba que não existe área antes de quatro vezes o desvio padrão para menos e depois de quatro vezes o desvio padrão para mais, ou seja, é estatisticamente impossível ocorrer algo que se distancie mais do que quatro vezes o desvio padrão da média. Os cálculos das probabilidades envolvendo distribuições normais são basicamente a determinação das áreas envolvidas, através do uso da tabela da curva normal reduzida, acessada através de analogia com a situação real que estamos trabalhando. Precisamos então entender o funcionamento da tabela da curva normal reduzida que você encontra no Anexo. O critério básico da tabela é que as áreas tabeladas começam sempre da extrema esquerda da curva e terminam no valor de z que se está trabalhando. Como exemplo, vamos calcular a área tabelada para z = -1,65, ou seja, o valor da área que começa na extremidade esquerda da curva e termina no valor -1,65. 4 Z P (z) 3210 z = -1,65 At -1-2-3-4 Figura 50 A área marcada começa na extrema esquerda e termina em z1 = -1,65, portanto é uma área tabelada e o valor dela é obtido na tabela da seguinte forma: 183 ESTATÍSTICA Tabela 73 Z 0 1 2 3 4 5 6 7 8 9 -1,8 0,0359 0,0351 0,0344 0,0336 0,0329 0,0322 0,0314 0,0307 0,0301 0,0294 -1,7 0,0446 0,0436 0,0427 0,0418 0,0409 0,0401 0,0392 0,0384 0,0375 0,0367 -1,6 0,0548 0,0537 0,0526 0,0516 0,0505 0,0495 0,0485 0,0475 0,0465 0,0455 -1,5 0,0668 0,0655 0,0643 0,0630 0,0618 0,0606 0,0594 0,0582 0,0571 0,0559 -1,4 0,0808 0,0793 0,0778 0,0764 0,0749 0,0735 0,0721 0,0708 0,0694 0,0681 Perceba que a tabela tem duas páginas. Uma para valores de z positivos e outra para valores de z negativos. No exemplo anterior usamos a tabela para valores de z negativos, obviamente. Na coluna da esquerda localizamos os dois primeiros algarismos do z dado, ou seja, 1,6. Na linha de cabeçalho localizamos o valor do último algarismo de z, o algarismo 5. A área tabelada é obtida pelo cruzamento das duas informações. A área tabelada, mostrada no gráfico é, portanto, 0,0495. Como já vimos, os valores de z serão obtidos por analogia com o problema que efetivamente estivermos trabalhando. A questão a seguir mostrará todos os cálculos possíveis e imagináveis que podem ser feitos nessa situação. Exemplo 2 A produção mensal de um produto químico é normalmente distribuída com uma média de 12.500 toneladas e desvio padrão de 1.200 toneladas. Calcular as probabilidades para se ter: A) Uma produção mensal inferior a 11.000 toneladas. Nessa questão usaremos, inicialmente, a imagem das duas curvas. Uma supõe a situação real (a produção do produto químico), a outra é a normal reduzida. Com isso conseguiremos mostrar a analogia a ser feita. A área que desejamos calcular está localizada à esquerda do valor 11.000 toneladas, ou seja, nos meses em que produção está abaixo de 11.000 toneladas. Veja o gráfico: 184 Unidade III 4 Z P (z) 11.000 12.500 Produção mensal 3210 z = -1,25 Ap = At Ap -1-2-3-4 Figura 51 O valor 11.000 toneladas, na situação real, corresponde ao valor -1,25 na situação reduzida, como mostra a fórmula de conversão: x 11.000 12.500 z 1,25 1.200 − µ −= = = − σ Note que a média 12.500 corresponde à média zero na curva reduzida; o desvio padrão 1.200 ao desvio padrão reduzido 1; o valor 11.000 ao valor reduzido -1,25, então podemos dizer que as duas áreas sombreadas nos gráficos também são correspondentes. Sabendo o valor percentual de uma, sabemos o valor percentual da outra. Observe que as áreas tabeladas são sempreas que estão entre a extrema esquerda e o valor de z. Exatamente o que ocorre nesse caso. Basta, portanto, obter o valor da área na tabela da curva normal reduzida. Tabela 74 Z 0 1 2 3 4 5 6 7 8 9 -1,4 0,0808 0,0793 0,0778 0,0764 0,0749 0,0735 0,0721 0,0708 0,0694 0,0681 -1,3 0,0968 0,0951 0,0934 0,0918 0,0901 0,0885 0,0869 0,0853 0,0838 0,0823 -1,2 0,1151 0,1131 0,1112 0,1093 0,1075 0,1056 0,1038 0,1020 0,1003 0,0985 -1,1 0,1357 0,1335 0,1314 0,1292 0,1271 0,1251 0,1230 0,1210 0,1190 0,1170 -1,0 0,1587 0,1562 0,1539 0,1515 0,1492 0,1469 0,1446 0,1423 0,1401 0,1379 185 ESTATÍSTICA tz 1,25 A 0,1056 ou1 0,56%= − → = p tNesse caso : A A 10,56%= = A probabilidade de que num mês qualquer se produza menos de 11.000 toneladas de produto químico é de 10,56%. B) Uma produção mensal superior a 13.800 toneladas. A área que desejamos calcular está localizada à direita do valor 13.800 toneladas, ou seja, nos meses em que a produção é superior a 13.800 toneladas. 4 Z P (z) 13.00012.500 Produção mensal 3210 z1 = -1,08 Ap = 1 - At Ap -1-2-3-4 Figura 52 O valor 13.800 toneladas na situação real corresponde ao valor 1,08 na situação reduzida: x 13.800 12.500 z 1,08 1.200 − µ −= = = σ Portanto, se a média 12.500 corresponde à média zero na curva reduzida; o desvio padrão 1.200 ao desvio padrão reduzido 1; o valor 13.800 ao valor reduzido 1,08, então podemos dizer que as duas áreas 186 Unidade III sombreadas nos gráficos anteriores também são correspondentes. Sabendo o valor percentual de uma, podemos calcular o valor percentual da outra. Observe, no entanto, que as áreas tabeladas são sempre as que estão entre a extrema esquerda e o valor de z, o que não ocorre nesse caso. Temos então que estabelecer uma relação entre as áreas envolvidas. Note que a área total sob a curva normal reduzida é igual a 1. A área que permanece em branco no gráfico é tabelada, portanto, a área que desejamos é igual a um menos a área tabelada: Tabela 75 Z 0 1 2 3 4 5 6 7 8 9 0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359 0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753 0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141 0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517 0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879 0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224 0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549 0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852 0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133 0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389 1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621 tz 1,08 A 0,8599 ou 85,99%= → = p tNesse caso : A 1 A 1 0,8599 0,1401 ou1 4,01%= − = − = Assim a probabilidade de que num mês qualquer se produza acima de 13.800 toneladas é de 14,01%. C) Uma produção mensal que esteja entre 12.000 e 13.500 toneladas. A área que desejamos calcular está localizada entre os valores 12.000 e 13.500 toneladas, ou seja, corresponde aos meses em que se produz mais de 12.000 toneladas e menos de 13.500 toneladas. 187 ESTATÍSTICA P (z) 4 Z 3210 z1 = -0,42 z1 = 0,83 At2 -1-2-3-4 4 Z P (z) 3210 z1 = -0,42 z1 = 0,83 At1 -1-2-3-4 4 Z P (z) 13.50012.000 12.500 Produção mensal 3210 z1 = -0,42 z1 = 0,83 Ap = At1 - At2 Ap -1-2-3-4 Figura 53 O valor 12.000 toneladas na situação real corresponde ao valor -0,42 na situação reduzida e o valor 13.500 a 0,83. Veja os cálculos a seguir: 1 x 12.000 12.500 z 0,42 1.200 − µ −= = = − σ 2 x 13.500 12.500 z 0,83 1.200 − µ −= = = σ Como vimos anteriormente, podemos fazer a analogia: se a média 12.500 corresponde à média zero na curva reduzida; o desvio padrão 1.200 ao desvio padrão reduzido 1; o valor 12.000 ao valor reduzido – 0,42 e o valor 13.500 ao valor 0,83, então podemos dizer que as duas áreas também são correspondentes. Observe que as áreas tabeladas são sempre as que estão entre a extrema esquerda e o valor de z, o que não ocorre nesse caso. Assim sendo, temos que efetuar um raciocínio que permita o cálculo. 188 Unidade III Note que, se entrarmos na tabela com o valor de z igual a – 0,42 iremos obter a área 0,3372. Essa área é a localizada à esquerda de z1 = - 0,42. No gráfico é a área tabelada 1 (At1). Para o valor z2 igual a 0,83, a área obtida é 0,7967. Essa área está à esquerda de z2. No gráfico é a área tabelada 2 (At2). Tabela 76 Z 0 1 2 3 4 5 6 7 8 9 -0,4 0,3446 0,3409 0,3372 0,3336 0,3300 0,3264 0,3228 0,3192 0,3156 0,3121 0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133 Perceba que a área de 0,7967 nada mais é do que a área 0,3372 mais a área cujo valor estamos procurando, logo, o valor da área procurada é a diferença das áreas que lemos na tabela, ou seja: p t t2 1 A A A 0,7967 0,3372 0,4595 ou 45,95%= − = − = Portanto a probabilidade de que num mês qualquer se produza entre 12.000 e 13.500 é de 45,95%. As questões a seguir serão resolvidas sem mostrarmos os gráficos e tabela, já que são repetitivos em relação aos três anteriores. D) Uma produção mensal que esteja entre 13.000 e 15.000 toneladas. Como desejamos calcular uma probabilidade e, consequentemente, uma área entre dois valores, devemos calcular a área à esquerda de cada um deles e depois subtrair a menor da maior: 1 t1 x 13.000 12.500 z 0,42 tabela A 0,6628 1.200 − µ −= = = → → = σ t2 x 15.000 12.500 z 2,08 tabela A 0,9812 1.200 − µ −= = = → → = σ p t t2 1 A A A 0,9812 0,6628 0,3184 31,84%= − = − = = A probabilidade de num determinado mês serem produzidas entre 13.000 e 15.000 toneladas de produto químico será de 31,84%. E) Uma produção mensal que seja inferior a 14.200 toneladas. Como desejamos calcular a probabilidade de a produção ser inferior a 14.200 toneladas, basta calcular a área à esquerda do valor de z correspondente: 189 ESTATÍSTICA t x 14.200 12.500 z 1,42 tabela A 0,9222 1.200 − µ −= = = → → = σ p tA A 0,9222 ou 92,22%= = A probabilidade de num determinado mês serem produzidos menos de 14.200 toneladas de produto químico é de 92,22%. F) Uma produção mensal que seja superior a 10.000 toneladas. Como desejamos a probabilidade de a produção ser superior a 10.000 toneladas, devemos calcular a área à esquerda do valor de z correspondente e tirá-la de 1: t x 10.000 12.500 z 2,08 tabela A 0,0188 1.200 − µ −= = = − → → = σ p tA 1 A 1 0,0188 0,9812 ou 98,12%= − = − = Portanto, a probabilidade de num determinado mês serem produzidas mais de 10.000 toneladas de produto químico é de 98,12%. 8.3 Cálculo das condições correspondentes a probabilidades da curva normal No exercício do item anterior verificamos como se calcula a probabilidade de ocorrência de um evento que segue a distribuição normal (os mais comuns dos eventos). Ocorre que muitas vezes precisamos fazer o cálculo ao contrário, ou seja, saber qual é o valor de uma determinada probabilidade e quais os valores que a definem. A questão a seguir demonstra esse raciocínio e os cálculos decorrentes. Exemplo 1 Uma oficina automotiva efetua seus consertos no tempo médio de 45 minutos com desvio padrão de oito minutos, normalmente distribuído. Nessas circunstâncias pergunta-se: • Qual é a previsão de tempo de trabalho que a oficina deve passar ao cliente para que tenha 90% de probabilidades de efetuar o trabalho dentro do prazo? • Qual é a previsão de tempo de trabalho que a oficina deve passar ao cliente para que tenha no máximo 30% risco de efetuar o trabalho dentro do prazo? 190 Unidade III Resolução da primeira questão Observe a figura a seguir. A área sombreada corresponde a 90% da área total e é limitada pelo valor z, que desejamos achar. O problema se resolve obtendo na tabela o valor de z correspondente a uma área de 90% ou aproximada. Note, portanto, que utilizamosa tabela no sentido oposto que fizemos nos exercícios anteriores. P (z) 4 Z 3210 z = ? Ad = At = 90% ou 0,9000 -1-2-3-4 Figura 54 Tabela 77 – Valor mais próximo na tabela de 0,9000 (90%) Z 0 1 2 3 4 5 6 7 8 9 1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830 1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015 1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177 Portanto, para que a área sombreada tenha o valor de 90%, é necessário que z seja igual a 1,28, correspondente à área de 0,8997 (valor da tabela mais próximo de 0,9000 ou 90%). Tendo esse valor, é só aplicar a fórmula de conversão devidamente adaptada: ( )xz x z x 45 1,28 8 x 55,24− µ= ∴ = µ + σ → = + × → = σ Dessa maneira, se a oficina estimar em 55,24 minutos o tempo de conserto, ela terá uma probabilidade de 90% de não ultrapassar o tempo. Resolução da segunda questão O cálculo é semelhante ao item anterior, com a diferença de que a área dada está à direita do gráfico, como mostra a figura. 191 ESTATÍSTICA P (z) 4 Z 3210 z = ? At = 1 - Ad = 1 - 0,3000 = 0,7000 Ad = 30% ou 0,3000 -1-2-3-4 Figura 55 Por causa disso, devemos entrar na tabela com a área de 70%. Lembre-se de que todas as áreas tabeladas começam na extremidade esquerda da curva. Para uma área de 70%, o valor de z deverá ser 0,52, portanto: ( )xz x z x 45 052 8 x 49,16− µ= ∴ = µ + σ → = + × → = σ Dessa maneira, se a oficina estimar em 49,16 minutos o tempo de conserto, ela terá uma probabilidade de 70% de não ultrapassar o tempo, ou seja, um risco de 30% de não cumprir ao prometido. Exemplo de aplicação A empresa Doces Venenos S.A. produz e comercializa o produto químico environmental detonation, conhecido pela sigla ED. As vendas mensais do ED são normalmente distribuídas com média de 1.000 caixas e desvio padrão de 200 caixas. As quantidades mensais produzidas também se distribuem normalmente com média de 1.200 caixas e desvio padrão de 300 caixas. Nessas condições apresentadas deseja-se saber: • Qual é a probabilidade de vender mais do que 1.500 caixas em um determinado mês? • Qual é a probabilidade de produzir menos do que 850 caixas em um determinado mês? • Qual é o valor máximo de vendas ocorrido em 15% dos piores meses (naqueles em que menos se vende)? • Qual a produção mínima ocorrida em 25% dos melhores meses (naqueles em que mais se produz)? • Em determinado mês as vendas foram limitadas pela empresa a 700 caixas. Qual a probabilidade de faltar produto para ser entregue aos clientes? 192 Unidade III • Em determinado mês, a produção foi orientada a produzir exatamente 1.200 caixas. Qual a probabilidade de faltar produto? • Considerando que não sejam feitas limitações externas de qualquer tipo, qual a probabilidade de se gerar estoques em algum mês em particular? Resolução A probabilidade de se venderem mais do que 1.500 caixas é dada por uma área da curva normal à direita da desse valor. Portanto, devemos localizar na tabela a área à esquerda do valor de z e tirar de 1 (ou 100%). Assim temos: t x 1.500 1.000 z 2,50 A 0,9938 200 − µ −= = = → = σ p tA 1 A 1 0,9938 0,0062 ou 0,62%= − = − = A probabilidade de que se venda mais do que 1.500 caixas de ED é de apenas 0,62%. A probabilidade de se produzirem menos que 850 caixas num mês é dada por uma área à esquerda do valor, portanto, basta calcular a área tabelada. t x 850 1.200 z 1,17 A 0,1210 300 − µ −= = = − → = σ p tA A 0,1210 ou 12,10%= = Existe uma probabilidade de 12,10% que em um determinado mês sejam produzidas menos do que 850 caixas de produto. Os piores meses de vendas estão localizados do lado esquerdo da curva normal das vendas. Os 15% piores meses correspondem a uma área de 0,1500 à esquerda cujo valor da variável reduzida limitante é z = -1,04 (valor mais aproximado correspondente na verdade a uma área de 0,1492). Com esses dados podemos calcular o valor máximo de vendas que ocorre nesses piores meses. ( )x z 1.000 1,04 200 792 caixas= µ + σ = + − × = Nos 15% piores meses de vendas a empresa vende 792 caixas ou menos. 193 ESTATÍSTICA Os melhores meses de produção estão localizados do lado direito da curva normal de produção, e 25% dos melhores meses de produção correspondem a uma área de 0,2500 à direita. Essa área não é tabelada, mas, se tirarmos ela de 1 (ou 100%), encontraremos a área tabelada. t dA 1 A 1 0,2500 0,7500 tabela z 0,67= − = − = → → = ( )x z 1.200 0,67 300 1.401 caixas= µ + σ = + × = Em 25% dos melhores meses de produção a empresa produz no mínimo 1.401 caixas de produto. A empresa limitou as vendas em determinado mês a 700 caixas. Isso significa que ela terá de produzir 700 caixas ou mais para que nenhum cliente fique sem ser atendido. A probabilidade de que a empresa produza menos do que 700 caixas é de: t x 700 1.200 z 1,67 A 0,0475 300 − µ −= = = − → = σ p tA A 0,0475 ou 4,75%= = Existe uma probabilidade de 4,75% de que a empresa, mesmo tendo vendido pouco, não consiga atender a todos os clientes porque sua produção foi excepcionalmente ruim. A produção está limitada a exatamente 1.200 caixas, logo não pode ser vendida mais do que essa quantidade, sob o risco de não se atender a todos os pedidos. A probabilidade de que isso ocorra é: t x 1.200 1.000 z 1,00 A 0,8413 200 − µ −= = = → = σ p tA 1 A 1 0,8413 0,1587 ou 15,87%= − = − = Nessas condições, existe uma probabilidade de 15,87% de que se venda mais do que a produção fixada e nem todos os clientes sejam atendidos. Estoque, nesse contexto, é definido como a diferença entre produção e vendas. Numa situação que não houvesse variações, o estoque seria calculado simplesmente subtraindo o volume vendido do valor produzido, ou seja, o estoque gerado mensalmente seria de 200 caixas (1.200 produzidas menos 1.000 vendidas). Ocorre, no entanto, que existem variações, caracterizadas pelos desvios padrões e elas têm de ser consideradas. Em um mês pode-se vender muito mais e produzir muito menos e aí o estoque seria menor ou inexistente ou, ao contrário, produzir muito mais e vender menos, gerando estoques maiores. 194 Unidade III Essa análise é feita através da distribuição normal, como mostra a figura a seguir: Produção σP = 300 µP = 1.200 µV = 1.000 µE = µV - µV = 1.200 - 1.000 = 200 σV = 200 σE = 300 2 + 2002 = 361 Vendas Estoque 0 P<V(falta produto) P>V(gera estoque)# # Figura 56 O comportamento estatístico tanto das vendas como da produção são distribuições normais e consequentemente o comportamento dos estoques também o será. O cálculo da média esperada de estoques é intuitivo. É a diferença entre o que é produzido e o que é vendido: E P V 1.200 1.000 200 µ = µ − µ = − = Já o cálculo do desvio padrão dos estoques necessita de duas observações. Os efeitos dos desvios padrões se somam, e não se subtraem. Um desvio padrão é a expressão das variações ocorridas num processo qualquer (no caso produção e vendas). Essas variações evidentemente se somam e não se subtraem. Uma subtração imaginaria a compensação dos problemas de um processo pelos do outro. O desvio padrão toma os desvios ao quadrado, então a soma deles deve ser considerada com o mesmo critério. Assim temos: 2 2 2 2 E P V 300 200 361σ = σ + σ = + = A partir daí seguimos os cálculos já feitos anteriormente. Como desejamos calcular a probabilidade de gerar estoques devemos calcular a área acima de 0 (zero seria a situação em que não sobraria nem faltaria produto). A área sombreada, portanto, corresponde à probabilidade de gerar estoque e segue os cálculos conhecidos. t x 0 200 z 0,55 tabela A 0,2912 361 − µ −= = = − → → = σ ( ) p tP gerar estoques : A 1 A 1 0,2912 0,7088 ou 70,88%= − = − = Existem 70,88% de probabilidade de a operação dessa empresa gerar estoque. 195 ESTATÍSTICA Observação Quando a empresa limita suas vendas, o atendimento depende da produção, visto que as vendas estão fixadas. Já quando a produção está fixada, o atendimento ao cliente édado pela variação de vendas. Ou seja, quem limita as vendas é a produção e quem limita a produção são as vendas. Resumo Distribuições de probabilidades são modelos matemáticos que descrevem fenômenos que são em alguma medida dependentes do acaso, da aleatoriedade. Apesar de originalmente elas terem sido estudadas visando o entendimento dos jogos de azar, são ferramentas que podem nos ajudar a prover situações futuras nas diversas áreas do conhecimento humano. Usamos as distribuições de probabilidades para pesquisar aspectos administrativos, econômicos e contábeis, para ficar na nossa área de concentração, mas praticamente em todos os aspectos profissionais e científicos elas são utilizadas. Existem diversas distribuições de probabilidade, cada uma delas destinada a fenômenos específicos. Determinar qual delas usar é a primeira tarefa a ser executada. A primeira característica a ser observada é a natureza da variável estatística, se discreta ou contínua. Ainda que no limite as distribuições para variáveis discretas possam ser aproximadas pela normal nos casos de amostras de menor quantidade de elementos, devemos usar a distribuição específica. A distribuição de probabilidades normal, destinada a variáveis contínuas, é a mais utilizada de todas as distribuições. Entre as destinadas às variáveis discretas se sobressaem as distribuições binomial e de Poisson. Além da natureza da variável envolvida, outras características devem ser analisadas na escolha do modelo matemático a ser usado: independência dos eventos; complementariedade dos eventos; possibilidade ou não de contar sucessos e falhas etc. Diante de uma situação problema, identificando-se a distribuição de probabilidades adequada e as medidas estatísticas pertinentes, podemos determinar as probabilidades de uma ocorrência ou então o valor correspondente a determinada probabilidade. 196 Unidade III Assim poderemos determinar com boa margem de acerto o resultado de uma eleição, ou então a produtividade esperada de um processo, ou o índice de inflação no próximo período ou ainda as necessidades de capital de giro de uma empresa. Grande parte das decisões que um profissional deve tomar, portanto, são facilitadas ou até possibilitadas a partir de pesquisa estatísticas que envolvem os modelos matemáticos estudados. Exercícios Questão 1. Um dado honesto é lançado três vezes. A probabilidade de que, nesses três lançamentos, obtenhamos a face 1 duas vezes é aproximadamente igual a: A) 0,50. B) 0,25. C) 0,18. D) 0,07. E) 0,03. Resposta correta: alternativa D. Análise da questão O dado honesto tem seis faces, numeradas de 1 a 6. Vamos considerar as situações a seguir. Sucesso (S): ocorrência da face 1 no lançamento do dado. Fracasso (F): não ocorrência da face 1 no lançamento do dado. Em cada lançamento do dado honesto, temos o que segue. Probabilidade de sucesso (p): p = 1/6. Probabilidade de fracasso (q): q = 1 - p = 1 - 1/6 → q=5/6 O espaço amostral Ω da situação em estudo é o que segue. Ω = {SSS, SSF, SFS, SFF, FSS, FSF, FFS, FFF} 197 ESTATÍSTICA Queremos conhecer o número total de sucessos, que corresponde ao número de vezes em que temos a face 1 em três lançamentos de um dado honesto. Para isso, construímos a árvore de probabilidades mostrada na figura a seguir. S S S S p p p p p p p S S F F S F F F F F q q q q q q q Figura 57 – Árvore de probabilidades para a situação em estudo Pela análise da árvore de probabilidades, podemos construir a tabela a seguir, em que X representa o número de sucessos. Nela, indicamos a probabilidade procurada em negrito, que equivale a p (X=2) = 0,0694. Ou seja, a probabilidade solicitada pelo enunciado é aproximadamente igual a 0,07. Tabela 78 – Número de sucessos e probabilidade Evento(s) X (n. de sucessos) Probabilidade FFF 0 q3 =(5/6)3 = 0,5787 SFF, FSF, FFS 1 3pq2 = 3(1/6)(5/6)2 = 0,3472 SSF, SFS, FSS 2 3p2q = 3(1/6)2(5/6) = 0,0694 SSS 3 p3 = (1/6)3 = 0,0046 Alternativamente, poderíamos ter resolvido o problema usando o modelo de probabilidade binomial, em que procuramos a X=2 sucessos em n=3 ensaios de Bernoulli independentes e com a mesma probabilidade p=1/6 de sucesso. Nesse modelo, fazemos o cálculo a seguir. ( ) k n kn!P(X k) p q k! n k ! − = = − 198 Unidade III ( ) 2 13! 1 5 P(X 2) 2! 3 2 ! 6 6 = = − 3! 1 5 3.2! 1 5 5 P(X 2) 0,0692 0,07 2!1! 36 6 2! 36 6 72 = = = = = ≅ Questão 2. (Enade 2014) Suponha que a distância percorrida por um ciclista que pedala regularmente pode ser inferida pela variável aleatória x, com densidade de probabilidade normal, tal que: ( )2x 22 2 2 1 f(x : , ) e 2 −µ − σµ σ = πσ Na expressão, temos μ=25 km e σ2=25 km2. A duração média do seu treino é de 1h15min. Com base nesses dados, avalie as afirmativas: I – A velocidade média de cada treino é de 21,7 km/h. II – A distância média percorrida em cada treino é de 25 km. III – A área média percorrida em cada treino é de 25 km2. IV – A distância percorrida de cada treino, em um desvio padrão, está entre 20 km e 30 km. V – A velocidade média de cada treino, em um desvio padrão, está entre 16 km/h e 24 km/h. É correto apenas o que se afirma em: A) I. B) I e IV. C) II e III. D) III e V. E) II, IV e V. Resposta correta: alternativa E. 199 ESTATÍSTICA Análise das afirmativas Antes de fazermos a análise das afirmativas, precisamos lembrar que a distribuição normal de probabilidades é uma curva em formato de sino dada por: ( )2x 22 2 2 1 f(x : , ) e 2 −µ − σµ σ = πσ Na expressão, μ é o valor médio da distribuição e σ é seu desvio padrão. O valor médio está associado ao pico da distribuição normal e é o valor mais frequente. O desvio padrão está relacionado à largura da curva da distribuição de probabilidades e, consequentemente, ao “espalhamento” dos dados em torno da média. No caso da distribuição normal, conforme indicado na figura a seguir, temos que: • a probabilidade de se obter um dado no intervalo μ±σ é de 68%; • a probabilidade de se obter um dado no intervalo μ±2σ é de 95%; • a probabilidade de se obter um dado no intervalo μ±3σ é superior a 99%. 2,14% -3 34,13% 0 13,60% -2 13,60% 1 34,13% -1 Desvios padrões 2,14% 2 3 0,13%0,13% Figura 58 – Distribuição normal com indicação de probabilidades 200 Unidade III I – Afirmativa incorreta. Justificativa: a velocidade média é a razão entre o espaço percorrido e o tempo gasto nesse trajeto. Logo, no caso em estudo, a velocidade média é a razão entre a distância média de 25 km e o tempo de 1h15min (1,25 h) gasto no percurso, conforme segue. 25 v 20km / h t 1,25 µ= = = ∆ II – Afirmativa correta. Justificativa: a média da distribuição de probabilidades é μ=25 km. Logo, a distância média percorrida em cada treino é igual a esse valor. III – Afirmativa incorreta. Justificativa: o problema não faz referência alguma à área, já que a quantidade σ2=25 km2 representa a variância, ou seja, o quadrado do desvio padrão dos dados. IV – Afirmativa correta. Justificativa: a distância percorrida em cada treino, considerando-se um desvio padrão, está no intervalo μ±σ, ou seja, 25±5 km. Logo, a distância percorrida em cada treino, nessa situação, está entre 20 km e 30 km. V – Afirmativa correta. Justificativa: considerando-se o intervalo de um desvio padrão, a velocidade média em cada treino pode ser calculada conforme segue. 25 5 v 20 4km / h t 1,25 µ ± σ ±= = = ± ∆ Logo, a velocidade média, nessa situação, está entre 16 km/h e 24 km/h. 201 FIGURAS E ILUSTRAÇÕES Figura 5 IBGE. Índice Nacional de Preço ao Consumidor – IPCA. [s.d.]. Disponível em: https://www.ibge.gov.br/ estatisticas/economicas/precos-e-custos/9256-indice-nacional-de-precos-ao-consumidor-amplo. html?=&t=series-historicas. Acesso em: 29 out. 2020. Adaptada. REFERÊNCIAS Audiovisuais MONEYBALL. Direção: Bennett Miller. Estados Unidos: Columbia Pictures,2011. 133 min. QUEBRANDO a banca. Direção: Robert Luketic. Estados Unidos: Relativity Media, 2008. 123 min. Textuais AGRA, A. A. Estatística básica. Campinas: Ourograf, 2003. AGRESTI, A.; FINLAY, B. Métodos estatísticos para ciências sociais. 4. ed. Porto Alegre: Penso, 2012. ALBIERI, S. Pesquisas por amostragens: política de divulgação de estimativas com baixa precisão amostral. In: V CONFERÊNCIA NACIONAL DE ESTATÍSTICA (Confest), 5., 2006, Rio de Janeiro. Rio de Janeiro: IBGE, 2006. Disponível em: https://www.ibge.gov.br/confest_e_confege/pesquisa_trabalhos/ CD/mesas_redondas/294-3.pdf. Acesso em: 27 out. 2020. ANDERSON, D. R.; SWEENEY, D. J.; WILLIAMS, T. A. Estatística aplicada à administração e economia. 2. ed. São Paulo: Thomson Learning, 2007. APRENDENDO GESTÃO. Árvores de decisão: exemplo completo. [s.d.]. Disponível em: https:// aprendendogestao.com.br/2019/09/21/arvores-de-decisao-exemplo-completo. Acesso em: 3 nov. 2021. BARROW, M. Estatística para economia, contabilidade e administração. São Paulo: Ática, 2007. BRAULE, R. Estatística aplicada com Excel para os cursos de administração e economia. Rio de Janeiro: Elsevier, 2001. BRUNI, A. B. Estatística aplicada à gestão empresarial. São Paulo: Atlas, 2013. BUSSAB, W. O.; MORETIN, P. A. Estatística básica. 5. ed. São Paulo: Saraiva, 2004. CASELLA, G.; BERGER, R. L. Inferência estatística. São Paulo: Cengage Learning, 2010. 202 CHIARETTI, M. Uma questão de inteligência: livro A curva normal não é científico. SuperInteressante, 31 jan. 1995. Disponível em: https://super.abril.com.br/ciencia/uma-questao-de-inteligencia-livro-a- curva-normal-nao-e-cientifico/. Acesso em: 28 out. 2020. COSTA, G. G. O. Curso de estatística básica: teoria e prática. São Paulo: Atlas, 2011. COSTA, G. G. O. Curso de estatística inferencial e probabilidades: teoria e prática. São Paulo: Atlas, 2012. COSTA NETO, P. L. O. Estatística. São Paulo: Edgard Blücher, 1977. COSTA NETO, P. L. O.; CYMBALISTA, M. Probabilidades. São Paulo: Edgard Blücher, 1974. CRESPO, A. A. Estatística fácil. 17. ed. São Paulo: Saraiva, 2001. DOWNING, D.; CLARK, J. Estatística aplicada. 2. ed. São Paulo: Saraiva 2003. FERREIRA, A. B. H. Novo Aurélio século XXI: o dicionário da língua portuguesa. Rio de Janeiro, Nova Fronteira, 1999. FONSECA, J. S.; MARTINS, G. A.; TOLETO, G. L. Estatística aplicada. São Paulo: Atlas, 1995. GUERRA, M.; GUERRA, M. J.; DONAIRE, D. Estatística aplicada. São Paulo: Ciência e Tecnologia, 1991. HOUAISS, A. Dicionário Houaiss de língua portuguesa. Rio de Janeiro: Objetiva, 2009. IBGE. Índice Nacional de Preço ao Consumidor – IPCA. [s.d.]. Disponível em: https://www.ibge.gov.br/ estatisticas/economicas/precos-e-custos/9256-indice-nacional-de-precos-ao-consumidor-amplo. html?=&t=series-historicas. Acesso em: 29 out. 2020. IGNACIO, S. A. Importância da estatística para o processo de conhecimento e tomada de decisão. Revista paranaense de desenvolvimento, Curitiba, n. 118, p. 175-192, jan./jun. 2010 JOHNSON, R.; KUBY, P. Estat. São Paulo: Cegange Learning, 2013. KAZMIER, L. J. Estatística aplicada à economia e administração. São Paulo: Makron Books, 1982. KUNE, H. Métodos estatísticos para a melhoria da qualidade. São Paulo: Gente, 1993. LAPPONI, J. A. Estatística usando Excel. 4. ed. Rio de Janeiro: Elsevier, 2005. LARSON, R.; FARBER, B. Estatística aplicada. 2. ed. São Paulo: Prentice Hall, 2004. LEVINE, D. M.; BERENSON. M. L.; STEPHAN, D. Estatística: teoria e aplicações. Rio de Janeiro: LTC, 2000. 203 LEWIS, M. Moneyball: o homem que mudou o jogo. Rio de Janeiro: Intrínseca, 2015. MARTINS, G. A. Estatística geral e aplicada. 2. ed. São Paulo: Atlas, 2002. MARTINS, G. A.; DONAIRE, D. Princípios de estatística. 4. ed. São Paulo: Atlas, 1990. MARTINS, G. A.; DOMINGUES, O. Estatística geral e aplicada. 5. ed. São Paulo: Atlas, 2014. MATOS, O. C. Econometria básica: teoria e aplicações. 2. ed. São Paulo: Atlas, 1997. MAXIMIANO, A. C. A. Introdução à administração. 2. ed. c. rev. e at. São Paulo: Atlas, 2011. MEDEIROS, E. et al. Estatística para os cursos de economia, administração e ciências contábeis. 4. ed. São Paulo: Atlas, 2010. (v. 1 e 2) MEDEIROS, E. et al. Tabelas de estatística para os cursos de economia, administração e ciências contábeis. 2. ed. São Paulo: Atlas, 1999. MEYER, P. L. Probabilidade: aplicações à estatística. Rio de Janeiro: LTC, 1976. MILONE, G.; ANGELINI, F. Estatística aplicada. São Paulo: Atlas, 1995. MOORE, D. A estatística básica e sua prática. Rio de Janeiro: LTC, 2000. MOORE, D. et al. A prática da estatística empresarial: como usar dados para tomar decisões. Rio de Janeiro: LTC, 2006. NEUFELD, J. L. Estatística aplicada à administração usando Excel. São Paulo: Pretince Hall, 2003. NOVAES, D. V.; COUTINHO, C. Q. S. Estatística para educação profissional. São Paulo: Atlas, 2009. OLIVEIRA, E. Enigma da vitória-régia vira exemplo em vídeo que explica o que é o crescimento exponencial da pandemia. G1., 10 abr. 2020. Disponível em: https://g1.globo.com/bemestar/ coronavirus/noticia/2020/04/10/enigma-da-vitoria-regia-vira-exemplo-em-video-que-explica-o-que- e-o-crescimento-exponencial-da-pandemia.ghtml. Acesso em: 3 nov. 2020. PORTAL DO GOVERNO. Conheça Atibaia, a cidade que tem o 2º melhor clima do mundo. 31 dez. 2009. Disponível em: https://www.saopaulo.sp.gov.br/ultimas-noticias/conheca-atibaia-a-cidade-que- tem-o-2-melhor-clima-do-mundo/#:~:text=O%20munic%C3%ADpio%20do%20Atibaia%2C%20 distante,e%20a%20Cultura%20(Unesco). Acesso em: 27 out. 2020. ROCHA, S. Estatística geral e aplicada para os cursos de engenharia. São Paulo: Atlas, 2014. 204 SARTORIS, A. Estatística e introdução à econometria. São Paulo: Saraiva, 2003. SMAILES, J.; MCGRANE, A. Estatística aplicada à administração com Excel. São Paulo: Atlas, 2002. SPIEGEl, M. R. Estatística. São Paulo: Makron Books, 1993. STEVENSON, W. J. Estatística aplicada à administração. São Paulo: Habra, 1981. TIBONI, C. G. R. Estatística básica: para os cursos de administração, ciências contábeis, tecnológicos e de gestão. São Paulo: Atlas, 2010. TRIOLA, M. F. Introdução à estatística: atualização da tecnologia. 11. ed. Rio de Janeiro: LTC, 2015. WITTE, R. S.; WITTE, J. S. Estatística. 7. ed. Rio de Janeiro: LTC, 2005. Sites http://datafolha.folha.uol.com.br/ (Datafolha) http://ibge.gov.br (IBGE) https://www.ipea.gov.br/portal/ (Ipea) http://www.periodicos.capes.gov.br/ (Capes) https://www.scielo.br/ (SciElo) Exercícios Unidade I – Questão 2: INSTITUTO NACIONAL DE ESTUDOS E PESQUISAS EDUCACIONAIS ANÍSIO TEIXEIRA (INEP). Exame Nacional de Desempenho dos Estudantes (Enade) 2012: Administração. Questão 17. Disponível em: http://download.inep.gov.br/educacao_superior/enade/provas/2012/01_ ADMINISTRACAO.pdf. Acesso em: 29 out. 2020. Unidade II – Questão 1: INSTITUTO NACIONAL DE ESTUDOS E PESQUISAS EDUCACIONAIS ANÍSIO TEIXEIRA (INEP). Exame Nacional de Desempenho dos Estudantes (Enade) 2017: Matemática. Questão 10. Disponível em: http://download.inep.gov.br/educacao_superior/enade/provas/2017/34_ MATEMATICA_BACHAREL_BAIXA.pdf. Acesso em: 29 out. 2020. Unidade II – Questão 2: INSTITUTO NACIONAL DE ESTUDOS E PESQUISAS EDUCACIONAIS ANÍSIO TEIXEIRA (INEP). Exame Nacional de Desempenho dos Estudantes (Enade) 2017: Matemática. Questão 21. Disponível em: http://download.inep.gov.br/educacao_superior/enade/provas/2017/34_ MATEMATICA_BACHAREL_BAIXA.pdf. Acesso em: 29 out. 2020. 205 Unidade III – Questão 2: INSTITUTO NACIONAL DE ESTUDOS E PESQUISAS EDUCACIONAIS ANÍSIO TEIXEIRA (INEP). Exame Nacional de Desempenho dos Estudantes (Enade) 2014: Engenharia de Produção. Questão 9. Disponível em: http://download.inep.gov.br/educacao_superior/enade/ provas/2014/16_engenharia_producao.pdf. Acesso em: 29 out. 2020. 206 ANEXO Áreas sob a curva normal reduzida Valores da variável reduzida negativos - Área entre -3,99 e z y z Z 0 1 2 3 4 5 6 7 8 9 -3,9 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,00000,0000 -3,8 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 -3,7 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 -3,6 0,0002 0,0002 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 -3,5 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 -3,4 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0002 -3,3 0,0005 0,0005 0,0005 0,0004 0,0004 0,0004 0,0004 0,0004 0,0004 0,0003 -3,2 0,0007 0,0007 0,0006 0,0006 0,0006 0,0006 0,0006 0,0005 0,0005 0,0005 -3,1 0,0010 0,0009 0,0009 0,0009 0,0008 0,0008 0,0008 0,0008 0,0007 0,0007 -3,0 0,0013 0,0013 0,0013 0,0012 0,0012 0,0011 0,0011 0,0011 0,0010 0,0010 -2,9 0,0019 0,0018 0,0018 0,0017 0,0016 0,0016 0,0015 0,0015 0,0014 0,0014 -2,8 0,0026 0,0025 0,0024 0,0023 0,0023 0,0022 0,0021 0,0021 0,0020 0,0019 -2,7 0,0035 0,0034 0,0033 0,0032 0,0031 0,0030 0,0029 0,0028 0,0027 0,0026 -2,6 0,0047 0,0045 0,0044 0,0043 0,0041 0,0040 0,0039 0,0038 0,0037 0,0036 -2,5 0,0062 0,0060 0,0059 0,0057 0,0055 0,0054 0,0052 0,0051 0,0049 0,0048 -2,4 0,0082 0,0080 0,0078 0,0075 0,0073 0,0071 0,0069 0,0068 0,0066 0,0064 -2,3 0,0107 0,0104 0,0102 0,0099 0,0096 0,0094 0,0091 0,0089 0,0087 0,0084 -2,2 0,0139 0,0136 0,0132 0,0129 0,0125 0,0122 0,0119 0,0116 0,0113 0,0110 -2,1 0,0179 0,0174 0,0170 0,0166 0,0162 0,0158 0,0154 0,0150 0,0146 0,0143 -2,0 0,0228 0,0222 0,0217 0,0212 0,0207 0,0202 0,0197 0,0192 0,0188 0,0183 -1,9 0,0287 0,0281 0,0274 0,0268 0,0262 0,0256 0,0250 0,0244 0,0239 0,0233 -1,8 0,0359 0,0351 0,0344 0,0336 0,0329 0,0322 0,0314 0,0307 0,0301 0,0294 -1,7 0,0446 0,0436 0,0427 0,0418 0,0409 0,0401 0,0392 0,0384 0,0375 0,0367 -1,6 0,0548 0,0537 0,0526 0,0516 0,0505 0,0495 0,0485 0,0475 0,0465 0,0455 -1,5 0,0668 0,0655 0,0643 0,0630 0,0618 0,0606 0,0594 0,0582 0,0571 0,0559 -1,4 0,0808 0,0793 0,0778 0,0764 0,0749 0,0735 0,0721 0,0708 0,0694 0,0681 -1,3 0,0968 0,0951 0,0934 0,0918 0,0901 0,0885 0,0869 0,0853 0,0838 0,0823 -1,2 0,1151 0,1131 0,1112 0,1093 0,1075 0,1056 0,1038 0,1020 0,1003 0,0985 -1,1 0,1357 0,1335 0,1314 0,1292 0,1271 0,1251 0,1230 0,1210 0,1190 0,1170 -1,0 0,1587 0,1562 0,1539 0,1515 0,1492 0,1469 0,1446 0,1423 0,1401 0,1379 -0,9 0,1841 0,1814 0,1788 0,1762 0,1736 0,1711 0,1685 0,1660 0,1635 0,1611 -0,8 0,2119 0,2090 0,2061 0,2033 0,2005 0,1977 0,1949 0,1922 0,1894 0,1867 -0,7 0,2420 0,2389 0,2358 0,2327 0,2296 0,2266 0,2236 0,2206 0,2177 0,2148 -0,6 0,2743 0,2709 0,2676 0,2643 0,2611 0,2578 0,2546 0,2514 0,2483 0,2451 -0,5 0,3085 0,3050 0,3015 0,2981 0,2946 0,2912 0,2877 0,2843 0,2810 0,2776 -0,4 0,3446 0,3409 0,3372 0,3336 0,3300 0,3264 0,3228 0,3192 0,3156 0,3121 -0,3 0,3821 0,3783 0,3745 0,3707 0,3669 0,3632 0,3594 0,3557 0,3520 0,3483 -0,2 0,4207 0,4168 0,4129 0,4090 0,4052 0,4013 0,3974 0,3936 0,3897 0,3859 -0,1 0,4602 0,4562 0,4522 0,4483 0,4443 0,4404 0,4364 0,4325 0,4286 0,4247 0,0 0,5000 0,4960 0,4920 0,4880 0,4840 0,4801 0,4761 0,4721 0,4681 0,4641 207 Áreas sob a curva normal reduzida Valores da variável reduzida positivos - Área entre z e 3,99 y z Z 0 1 2 3 4 5 6 7 8 9 0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359 0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753 0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141 0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517 0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879 0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224 0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549 0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852 0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133 0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389 1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621 1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830 1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015 1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177 1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319 1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441 1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545 1,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633 1,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706 1,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9767 2,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817 2,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9857 2,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,9890 2,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,9916 2,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,9936 2,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,9952 2,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,9964 2,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,9974 2,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,9981 2,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,9986 3,0 0,9987 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,9990 0,9990 3,1 0,9990 0,9991 0,9991 0,9991 0,9992 0,9992 0,9992 0,9992 0,9993 0,9993 3,2 0,9993 0,9993 0,9994 0,9994 0,9994 0,9994 0,9994 0,9995 0,9995 0,9995 3,3 0,9995 0,9995 0,9995 0,9996 0,9996 0,9996 0,9996 0,9996 0,9996 0,9997 3,4 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9998 3,5 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 3,6 0,9998 0,9998 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 3,7 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 3,8 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 3,9 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 208 209 210 211 212 Informações: www.sepi.unip.br ou 0800 010 9000
Compartilhar