Baixe o app para aproveitar ainda mais
Prévia do material em texto
Distribuições Contínuas de Probabilidade APRESENTAÇÃO Em muitas situações envolvendo investigações estatísticas temos algum conhecimento sobre a função de massa de probabilidade ou sobre a função densidade de probabilidade da população estudada, o que nos permite realizar aproximações por meio de curvas ou funções, denominadas distribuições de probabilidade. As distribuições de probabilidade em estatística podem ser discretas ou contínuas, dependendo do tipo de variável que está sendo estudado. Para variáveis discretas (valores resultantes de contagem), utilizamos distribuições discretas, sendo a Binomial e a de Poisson as mais conhecidas. Para variáveis contínuas (que resultam de medições), utilizamos distribuições contínuas, sendo a Normal e a Student as mais conhecidas. Nesse tipo de distribuição, a função densidade de probabilidade (FDP), que terá uma função matemática associada, precisará de uma integral para a resolução do cálculo de probabilidade, por isso é muito comum o uso de tabelas para auxiliar no cálculo das probabilidades. Nesta Unidade de Aprendizagem, vamos identificar quando uma variável segue uma distribuição contínua, conhecer as principais distribuições contínuas e como podemos encontrar a probabilidade utilizando a distribuição normal. Bons estudos. Ao final desta Unidade de Aprendizagem, você deve apresentar os seguintes aprendizados: Comparar as principais distribuições contínuas de probabilidade.• Identificar as características das distribuições contínuas.• Usar a tabela da distribuição normal para encontrar a probabilidade desejada. • DESAFIO Muitos experimentos envolvem a ideia de distribuição de probabilidade, ou seja, a população ou a amostra estudada seguem um comportamento padrão que pode ser aproximado por uma função. No caso das distribuições contínuas, temos a função densidade de probabilidade, que é diferente para cada modelo de distribuição estudado. Dessa forma, é muito importante que na prática conheçamos as condições que tornam um modelo de distribuição de probabilidade apropriado para a situação que estamos investigando. Vamos ao desafio. Você foi escolhido para ministrar uma aula de estatística e o assunto será as distribuições contínuas de probabilidade. Na aula, você deverá citar, pelo menos, quatro distribuições contínuas diferentes, indicando seus respectivos usos. A resposta será avaliada conforme o seguinte critério: não serão aceitas cópias dos conceitos constantes nos livros indicados. É importante explicá-la de forma clara. INFOGRÁFICO As distribuições de probabilidade podem ser discretas ou contínuas, dependendo do tipo de variável estudada. Quando temos valores resultantes de contagem, estamos lidando com variáveis discretas e utilizamos distribuições discretas de probabilidade. Quando os valores são resultantes de medição, temos variáveis aleatórias contínuas e utilizamos distribuições contínuas de probabilidade. Neste Infográfico, vamos comparar os dois tipos de distribuições, discretas e contínuas, e reconhecer as diferenças entre os seus gráficos. CONTEÚDO DO LIVRO Acompanhe o capítuloDistribuições Contínuas de Probabilidade do livro Estatística, que é a base teórica para esta Unidade de Aprendizagem. Boa leitura. driller.vmi Text Box Padrão de resposta esperado Sua resposta deve conter algumas das seguintes distribuições: - Distribuição Normal - se ajustam bem a esta distribuição as medidas naturais (antropomórficas, por exemplo) e as várias medidas industriais. - Distribuição Uniforme contínua - muito utilizada quando se conhece pouco a respeito do fenômeno modelado. - Distribuição Triangular - muito utilizada quando se conhece um pouco mais sobre o fenômeno modelado em relação às suposições da Distribuição Uniforme. - Distribuição Beta - muito utilizada para modelar incertezas a respeito de probabilidades, frações ou prevalências. - Distribuição Exponencial - utilizada em processos de contagem ao longo do tempo em que os eventos de interesse são independentes entre si e ocorrem a uma taxa constante ao longo do tempo. - Distribuição de Erlang - emerge nos fenômenos relacionados a redes de telecomunicações. - Distribuição de Weibull - utilizada para encontrar importantes aplicações em estudos de confiabilidade, em Engenharia de Produção, em gestão de estoques, seguridade e meteorologia. - Distribuição Gama - utilizada na Biologia e modelagem do comportamento do consumidor. - Distribuição F - emerge nos problemas de Estatística Inferencial envolvendo a análise de variância. - Distribuição t de Student - emerge em problemas de Estatística Inferencial baseada em amostras pequenas. - Distribuição Lognormal - modelagem de fenômenos econômicos relevantes, como para modelar o retorno financeiro de títulos negociados em bolsa. - Distribuição de Laplace - encontra aplicações em processamento de imagens e de voz, em Biologia e na análise da dinâmica industrial. - Distribuição Logística - encontra aplicações em processos relacionados a crescimento, seja demográfico, de vendas, de difusão tecnológica. - Distribuição de Maxwell - modela a velocidade de partículas e moléculas em gases em equilíbrio térmico. - Distribuição de Pareto - modela adequadamente muitos fenômenos sociais, físicos e econômicos. ESTATÍSTICA Juliane Silveira Freire da Silva Distribuições contínuas de probabilidade Objetivos de aprendizagem Ao final deste texto, você deve apresentar os seguintes aprendizados: � Comparar as principais distribuições contínuas de probabilidade. � Identificar as características das distribuições contínuas. � Usar a tabela da distribuição normal para encontrar probabilidade desejada. Introdução Neste capítulo, você identificará quando uma variável em estudo segue um modelo de distribuição contínua de probabilidade, conhecerá as principais distribuições contínuas de probabilidade e aprenderá a utilizar a mais importante de todas as distribuições em estatística: a distribuição normal. Distribuições contínuas de probabilidade Existem distribuições discretas e contínuas de probabilidade. No primeiro caso, temos variáveis aleatórias discretas, ou seja, valores resultantes de contagens. Então, no caso das distribuições discretas de probabilidade, podemos calcular probabilidade do valor da variável que se quer investigar. Temos funções matemáticas que fornecem essas probabilidades. Porém, nas distribuições contínuas de probabilidade, estamos lidando com variáveis aleatórias contínuas, ou seja, que resultam de uma medição. Nesses casos, não temos valores únicos em uma escala, mas, sim, em intervalos, pois, na variável aleatória contínua, podemos ter qualquer valor na reta dos reais. Dessa forma, a função densidade de probabilidade (FDP), que terá uma função matemática associada, necessitará uma integral para a resolução do cálculo de probabilidade. Nesse caso, estamos calculando intervalos abaixo de uma curva, como mostrado na Figura 1. Figura 1. Curva de distribuição contínua. Fonte: Freund (2006, p. 215). Conforme podemos observar na Figura 1, para obtermos a probabilidade, no caso da distribuição contínua, não podemos obtê-la em um ponto único, mas apenas em intervalos, como em um intervalo entre os pontos e quaisquer abaixo de uma curva. Concluímos, então, que, na distribuição contínua de probabilidade, não existe probabilidade no ponto. Matematicamente, a resolução dessas probabilidades se dá com a integração da função da distribuição em estudo. Isso nem sempre é simples, pois nem todas as integrações de funções de probabilidade são de fácil resolução. Para isso, funções comumente utilizadas contêm tabelas para auxiliar no cálculo de probabilidade. Esse é o caso da distribuição normal, a mais importante distribuição de probabilidade em estatística. É do pressuposto de normalidade dos dados que muitas inferências são possíveis. Mas, independentemente de estarmos estudando distribuições discretas ou distribuições contínuasde probabilidade, alguns axiomas continuam va- lendo, como: 0 ≤ f(x) ≤ 1 e a área total abaixo da curva sempre somarão 1 na distribuição acumulada. Características das distribuições contínuas Veremos, aqui, as características de algumas distribuições de probabilidade contínuas além da distribuição normal. Mais adiante, trataremos da distri- buição de Gauss (normal), à qual, por ser a mais importante, daremos um maior destaque. Distribuições contínuas de probabilidade98 Para o caso da distribuição de probabilidade exponencial, segundo Doane e Seward (2014), no modelo exponencial, o foco está no tempo de espera até o evento subsequente: uma variável contínua. A função densidade de probabi- lidade exponencial aproxima-se de zero à medida que o valor de x aumenta. Isso é útil para calcular tempo de vida de alguns componentes. f(x) = λe –λx se x ≥ 0 0 se x < 0 onde: λ é a taxa média pelo tempo ou espaço; x é o valor da variável aleatória que se quer obter a probabilidade. Representamos a distribuição exponencial por x~Exp(λ), ou seja, a variável x aproxima-se de uma distribuição exponencial de parâmetro λ, conforme gráfico da Figura 2. Figura 2. Distribuição exponencial. Fonte: Adaptada de Portal Action (2017, documento on-line). 1.7 1.6 1.5 1.4 1.3 1.2 1.1 1.0 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0.0 0.0 0.5 1.0 1.5 2.0 3.0 4.0 5.0 6.02.5 3.5 4.5 5.5 x λ = 1/2 λ = 1 λ = 3/2 Fu nç ão d en sid ad e de p ro ba bi lid ad e 99Distribuições contínuas de probabilidade Temos, também, a distribuição de probabilidade de Laplace, também cha- mada de exponencial dupla, pois, algumas vezes, é como se tivéssemos uma exponencial positiva junto a uma exponencial negativa. Pode ser utilizada para dados de modelagem em biologia e finanças. Tem por função a distribuição de probabilidade: f(x) = 12σ e , –∞ < x < ∞, –∞ < μ < ∞, –∞ < σ < ∞ |x – µ| σ( ) onde: 𝜎 é o desvio-padrão; μ é a média; x é o valor da variável aleatória que se quer obter a probabilidade. Representamos a distribuição Laplace por x~Laplace(μ, 𝜎), ou seja, a variável x aproxima-se de uma distribuição Laplace de parâmetros μ e 𝜎. A forma da distribuição de Laplace é semelhante à normal, porém com um pico bem mais fino e acentuado, como na Figura 3. Figura 3. Distribuição Laplace comparada à distribuição normal. Fonte: Suporte ao Minitab (c2017a, documento on-line). Outra distribuição de probabilidade contínua de grande utilização é a distribuição logística, utilizada mais largamente para dados demográficos e de vendas, quando se investiga o crescimento. A função é definida por: Distribuições contínuas de probabilidade100 f(x) = , –∞ < x < ∞, –∞ < μ < ∞, –∞ < σ < ∞ e (x – µ) σ– ( )(x – µ)σ–σ 1 + e 2 𝜎 é o desvio-padrão; μ é a média; x é o valor da variável aleatória que se quer obter a probabilidade. Representamos a distribuição logística por x~Logist(μ, 𝜎), ou seja, a variável x aproxima-se de uma distribuição logística de parâmetros μ e 𝜎. A forma da distribuição logística é semelhante à normal, porém com caudas mais longas, como na Figura 4. Figura 4. Distribuição logística. Fonte: Suporte ao Minitab (c2017b, documento on-line). Grá�co de distribuição logística; Loc = 1 0,25 0,20 0,15 0,10 0,05 0,00 D en sid ad e –50 50 75–25 250 x Escala 1 5 10 Ainda temos a distribuição de pareto, utilizada para modelar fenômenos sociais, físicos e econômicos. O princípio de pareto diz que aproximadamente 80% dos efeitos provêm de 20% das causas. Além dessas distribuições citadas, ainda há outras tantas, como a distri- buição beta, de Cauchy, de Maxwell, etc. 101Distribuições contínuas de probabilidade Distribuição normal Como já mencionado, esta é a distribuição de probabilidade contínua mais importante e utilizada dentro da estatística. Muito da inferência estatística parte do pressuposto da normalidade dos dados, além, é claro, de grande parte das variáveis encontradas seguir esse modelo de distribuição. Essa distribuição tem como parâmetros a média que é uma medida de posição e o desvio-padrão que é a medida de variabilidade. Então, o formato dessa distribuição depende da variabilidade — quanto mais achatada for a distribuição, maior será a variabilidade dos dados e, ao contrário, quanto mais estreita for a distribuição, menor será a variabilidade. Já a média situa no eixo em que os dados se concentram. É com base na teoria da distribuição de probabilidade normal que podemos estruturar testes de hipótese, estabelecer intervalos de confiança e calcular tamanhos de amostra. A função matemática que descreve a distribuição de probabilidade normal é dada por: f(x) = , –∞ < x < ∞, –∞ < μ < ∞, –∞ < σ < ∞ (x – µ)2 2σ2–1 √2�σ e Representamos a distribuição normal por x~N(μ, 𝜎), ou seja, a variável x aproxima-se de uma distribuição normal de parâmetros μ (média) e 𝜎 (desvio-padrão). O formato da distribuição normal é parecido com um sino. Por esse motivo, alguns a chamam de distribuição em forma de sino, ou distribuição de Gauss (Figura 5). Veja, a seguir, as propriedades da distribuição normal. � A distribuição normal é simétrica em torno da média (μ). � A média, a moda e a mediana são iguais e localizam-se no pico mais alto da distribuição. � Quanto maior for o desvio-padrão, mais achatado será o gráfico da distribuição normal. � A área total abaixo da curva soma 1 (1 corresponde a 100%). � Os parâmetros são a média (μ) e o desvio-padrão (𝜎). � Não existe probabilidade menor do que zero, nem maior do que 1. Distribuições contínuas de probabilidade102 Figura 5. Distribuição normal. Fonte: Doane e Seward (2014, p. 254). 0,09 0,08 0,07 0,06 0,05 0,04 0,03 0,02 0,01 0,00 f(x ) 60 70 80 9065 75 85 FDP normal Velocidade (milhas por hora) Como se pode perceber, a resolução de uma integral para a FDP da normal é bastante elaborada. Por esse motivo, fazemos uso de uma tabela para nos auxiliar no cálculo de probabilidade. Como a média e o desvio-padrão variam de variável para variável e só temos uma tabela, estabeleceu-se, para fins de cálculo da tabela, que a média seria igual a zero, e o desvio-padrão igual a 1. Claramente, na vida real, as médias das variáveis não são iguais a 1, e o desvio-padrão também não é igual a 0. Precisamos, então, antes de usarmos a tabela, padronizar a nossa variável com a seguinte fórmula: Z = x – µ σ Padronizamos a variável x com sua média e seu desvio-padrão específicos e transformamos na variável z com média 1 e desvio-padrão 0, para podemos fazer uso da tabela da normal padrão. Existe apenas uma tabela, porém existem apresentações distintas dela. Em uma delas, é apresentada a área total abaixo da curva, sendo acumulada de – ∞ até + ∞. A outra forma de apresentação é apenas com metade da curva normal de 0 até + ∞. Veja o Quadro 1, a seguir. 103Distribuições contínuas de probabilidade Quadro 1. Distribuição normal Vamos utilizar um exemplo para aprendermos como encontrar as pro- babilidades nessa tabela. Suponha uma financeira que empresta, em média, R$ 2.000,00 para seus clientes com um desvio-padrão de R$ 900,00. Calcu- laremos a probabilidade de a financeira emprestar menos de R$ 2.200,00 a um cliente. P(X < 2200) = P z < = P(z < 0,22)2200 – 2000900( ) Observem que, até aqui, apenas fizemos a padronização da variável com média de 2.000 e desvio-padrão de 900 em uma variável z com média 1 e Distribuições contínuas de probabilidade104 desvio-padrão 0. Depois da padronização, precisamos observar a tabela para encontrarmos a probabilidade. Procuramos, na tabela, o cruzamento da linha com o 0,2 até a coluna do 0,02, que é a nossa segunda casa decimal. Nesse cruzamento, encontramos o valor de 0,08706. Estamos trabalhando em uma tabela que tem apenas metade da distribuição. Nesse caso, precisamos adicionar a outra metade que não está na tabela a esse valor de probabilidade encontrado. A áreade cálculo é mostrada na Figura 6. Figura 6. Área de cálculo da tabela apresentada. Fonte: Freund (2006, p. 492). 0 z P(X < 2200) = 0,08706 + 0,5 = 0,58706 = 58,71% Agora queremos calcular a probabilidade de a financeira emprestar mais de R$ 2.100,00. Primeiramente, vamos calcular a probabilidade de emprestar menos de R$ 2.100,00. ( )P(X < 2100) = P z < = P(z < 0,11)2100 – 2000900 Olhamos na linha do 0,1 até a coluna do 0,01 da tabela e encontramos o valor de 0,04380. Para encontrar (P > 0,11) temos que fazer a subtração, pois a tabela forneceu o valor de P(z < 0,11). Assim: P(X > 2100) = 0,5 – 0,04380 = 0,45620 Se quisermos calcular a probabilidade de a financeira emprestar entre R$ 2.100,00 e R$ 2.200,00, este seria o cálculo: 105Distribuições contínuas de probabilidade P(2100 < X < 2200) = P z < = 0,222200 – 2000 900( ) ( )P z < = 0,112100 – 2000900 Olhamos, na tabela, os valores referentes a essas duas padronizações e encontramos, respectivamente, 0,08706 e 0,04380. P(2.000 < X < 2.200) = 0,08706 – 0,0438 = 0,04326 = 4,33% Vale ressaltar que, com a tabela normal com a área total abaixo da curva, a utilização é diferente para encontrarmos a probabilidade. Ainda como exemplo de distribuições contínuas de probabilidade, temos a distribuição t-student (Figura 7). Ela tem uma curva muito semelhante à nor- mal, também tem parâmetros de média e desvio-padrão, porém é influenciada pelo tamanho da amostra. Quando n tende a infinito, a distribuição normal e a distribuição t são equivalentes. A distribuição t-student é utilizada nos casos em que temos amostras de tamanho inferior a 30 ou não conhecemos o desvio-padrão populacional, quando a população tem distribuição aproxi- madamente normal. Figura 7. Distribuição t com 2 graus de liberdade. Fonte: Suporte ao Minitab (c2017c, documento on-line). Grá�co de distribuição T; gl–2 0,4 0,3 0,2 0,1 0,0 –5,0 5,0 7,5–2,5 2,50,0 x D en sid ad e Distribuições contínuas de probabilidade106 DOANE, D. P.; SEWARD, L. E. Estatística aplicada à administração e economia. 4. ed. Porto Alegre: AMGH, 2014. FREUND, J. E. Estatística aplicada: economia, administração e contabilidade. 11. ed. Porto Alegre: Bookman, 2006. PORTAL ACTION. Distribuição exponencial. 2017. Disponível em: <http://www.porta- laction.com.br/probabilidades/612-distribuicao-exponencial>. Acesso em: 3 jan. 2018. SUPORTE AO MINITAB. Distribuição de Laplace. c2017a. Disponível em: <https://sup- port.minitab.com/pt-br/minitab/18/help-and-how-to/probability-distributions-and- random-data/supporting-topics/distributions/laplace-distribution/>. Acesso em: 3 jan. 2019. SUPORTE AO MINITAB. Distribuição logística. c2017b. Disponível em: <https://support.mi- nitab.com/pt-br/minitab/18/help-and-how-to/probability-distributions-and-random- data/supporting-topics/distributions/logistic-distribution/>. Acesso em: 3 jan. 2019. SUPORTE AO MINITAB. Selecione a distribuição e os parâmetros. c2017c. Disponível em: <https://support.minitab.com/pt-br/minitab/18/help-and-how-to/graphs/how-to/pro- bability-distribution-plot/create-the-graph/select-the-distribution-and-parameters/#t>. Acesso em: 3 jan. 2019. 107Distribuições contínuas de probabilidade DICA DO PROFESSOR Para obtermos a probabilidade, no caso da distribuição contínua, consideramos intervalos, entre pontos abaixo de uma curva. Matematicamente, a resolução se dá por meio da integração da função da distribuição em estudo, o que nem sempre é simples, por isso costumamos utilizar tabelas para auxiliar no cálculo de probabilidade. No vídeo, falaremos um pouco mais sobre distribuições contínuas de probabilidade e em que situações cada uma delas pode ser utilizada. Conteúdo interativo disponível na plataforma de ensino! EXERCÍCIOS O salário médio de 500 funcionários de uma empresa é de R$ 7.550,00 com desvio- padrão de R$ 750,00. Se os salários estão normalmente distribuídos, quantos funcionários ganham entre R$ 6.000,00 e R$ 7.750,00? Confira, a seguir, a tabela da Distribuição Normal. 1) A) 293 salários. B) 250 salários. driller.vmi Stamp C) 294 salários. D) 500 salários. E) 127 salários. Em um determinado concurso público, as notas apresentaram média de 550 pontos e desvio-padrão de 100 pontos. Considerando uma distribuição Normal e sabendo que apenas 1% dos candidatos foi aprovado, qual a nota do último candidato classificado? Confira a tabela a seguir. 2) driller.vmi Highlight driller.vmi Text Box Consultando a tabela, temos que a área entre os valores é de 0,5872, ou seja, 58,72% que, aplicado aos 500 funcionários significa 294 salários (o resultado, neste caso, precisa ser em número inteiro, já que ninguém recebe menos do que o seu próprio salário). A) 650 pontos. B) 550 pontos. C) 100 pontos. D) 783 pontos. E) 1100 pontos. O carrinho de uma montanha russa é indicado para até seis passageiros. O engenheiro que o projetou e construiu sabe que ele suporta até 500 kg. Se a distribuição do peso das pessoas que frequentam o parque é N(70,100),ou seja, segue uma distribuição normal com μ=70 e σ=10, calcule a probabilidade de seis pessoas ultrapassarem o limite de carga do carrinho e avalie se o brinquedo é seguro ou não. Confira a tabela a seguir 3) driller.vmi Highlight driller.vmi Stamp driller.vmi Stamp A) 92%. O brinquedo é muito perigoso e deveria ser interditado. B) 9,2%. O brinquedo é razoavelmente perigoso e deveria ser interditado. driller.vmi Highlight C) 0,92%. O brinquedo é um pouco perigoso e deveria ser utilizado apenas por adultos. D) 0,092%. O brinquedo é muito seguro, mas ainda assim, deve-se instalar uma balança de verificação ou evitar que adultos muito grandes o utilizem ao mesmo tempo. E) 0,0092%. O brinquedo é 100% seguro. Uma fábrica de lâmpadas efetuou testes de qualidade e descobriu que elas duram, em média, 800 horas com desvio-padrão de 20 horas. Se o fabricante quer estabelecer uma garantia de troca, em caso de defeito, para trocar menos que 3% das lâmpadas, qual deve ser o número de horas da garantia? 4) A) 20 horas. B) 762 horas. driller.vmi Highlight C) 800 horas. D) 837 horas. E) 777 horas. Suponha que uma máquina produza parafusos de 2 cm com distribuição Normal e desvio-padrão de 0,04 cm. Os clientes devolvem todos os parafusos menores que 1,96 cm ou maiores que 2,04 cm. Qual será o percentual de devolução das vendas? 5) driller.vmi Stamp driller.vmi Stamp A) 0,04%. B) 3,17%. C) 31,73%. D) 4%. E) 43,17%. NA PRÁTICA Muitas distribuições contínuas de probabilidade têm o desvio-padrão como um de seus parâmetros, como por exemplo, a distribuição normal, cujos parâmetros são a média e o desvio- padrão. No caso da normal, o formato dessa distribuição depende da variabilidade — quanto mais achatada for a distribuição, maior será a variabilidade dos dados e, ao contrário, quanto mais estreita for a distribuição, menor será a variabilidade. Já a média situa no eixo em que os dados se concentram. Acompanhe nesse exemplo como o desvio-padrão se relaciona com o controle de qualidade de uma empresa. SAIBA + driller.vmi Highlight Para ampliar o seu conhecimento a respeito desse assunto, veja abaixo as sugestões do professor: Distribuição Normal - Introdução Esse vídeo primeiramente apresenta a definição de função densidade de probabilidade, suas características e seu gráfico. Depois aborda a distribuição normal a partir de um experimento de lançamento de moedas. Conteúdo interativo disponível na plataforma de ensino! Distribuição normal Esse vídeo define a distribuição normal, apresentando sua curva, a expressão da função densidade de probabilidade e a distribuição normal padrão. Os conceitos são aplicados na resolução de problemas. Conteúdo interativo disponível na plataforma de ensino! Distribuição de Probabilidade Contínua Esse vídeo apresenta as distribuiçõescontínuas de probabilidade, destacando as diferenças entre as variáveis discretas e contínuas e ilustrando por meio de gráfico. Conteúdo interativo disponível na plataforma de ensino!
Compartilhar