Baixe o app para aproveitar ainda mais
Prévia do material em texto
Estatística Descritiva- Unidade 4 - Probabilidade II Estatística Descritiva Unidade 4 - Probabilidade II Rafaela Rodrigues Oliveira Amaro Estatística Descritiva- Unidade 4 - Probabilidade II Introdução E… voltamos ao estudo das probabilidades, ótimo não é? Bem, na unidade anterior fomos apresentados as teorias que constituem este importante ramo da matemática como a probabilidade condicional e o Teorema de Bayes. As características e diferenças entre as variáveis discretas e contínuas foram abordadas de maneira a conhecermos um pouco mais sobre as distribuições de probabilidades, que podem estar atreladas a estes dois tipos de variáveis, deste modo conhecemos as distribuições de: Bernoulli e Binomial; mas será que há outras que conectam a esses mesmos tipos de elementos? A resposta é sim, e se chama Distribuição de Poisson. Outra dúvida pertinente a este panorama está na existência de uma distribuição de frequência de uma variável contínua, afinal existe? E a resposta novamente é sim, aqui seremos familiarizados com a distribuição acumulada e exponencial; além de ser apresentado a uma distribuição que é considerada uma das mais importantes e utilizadas para modelar fenômenos, conheceremos a Distribuição Normal, todas suas particularidades e aplicabilidade. Vamos em frente? Bons estudos!!! 1. Distribuição de Poisson Agora não trabalharemos com ensaios de Bernoulli, logo não será necessário encontrar a chance de um sucesso ou fracasso ocorrer pois conforme Martins e Domingues (2017) a distribuição de Poisson é um modelo probabilístico indicado para avaliar um grande número de fenômenos observáveis e aplicáveis a sequências de eventos que ocorrem por unidade de tempo, área, volume , tais como: ● Acidentes por unidade de tempo; ● Chamadas telefónicas por unidade de tempo; ● Arranhões por unidade de área; ● Acidentes por unidade de tempo. Estatística Descritiva- Unidade 4 - Probabilidade II Você sabia? Espera na fila para ser atendido ou servido recebe o nome Queuing; existem vários exemplos de Queuing em nosso cotidiano, como esperar em uma fila para ser atendido em uma padaria, esperar para utilizar um elevador ou ainda aguardar o sinal verde em um semáforo para seguir viagem entre outras situações. A Distribuição de Poisson serve de base para prever e modelar o número de pessoas (veículos, pessoas, etc) que provavelmente chegarão a fila (LARSON E FARBER, 2016). Um único valor é preciso para determinar a probabilidade de um dado número de sucessos na dinâmica de Poisson, uma vez que o número médio de sucessos determinará a probabilidade para a situação específica. Esse número médio é representado pela letra grega 𝜆(lambda) e a fórmula para determinar a probabilidades em uma distribuição de Poisson é: 𝑃(𝑥) = 𝜆𝑥 ⋅ 𝑒−𝜆 𝑥! Em que 𝜆corresponde a média, 𝑒 ≃ 2,72 é uma constante e representa a base dos logaritmos naturais e 𝑥 o número de sucessos. Valores para 𝑒−𝜆 podem ser encontrados com o auxílio de uma calculadora científica ou alguns valores podem ser consultados por intermédio da tabela 1 a seguir: Estatística Descritiva- Unidade 4 - Probabilidade II Tabela 1: Valores de 𝑒−𝜆para alguns valores de 𝜆. Fonte: Castanheira (2017) Você sabia? Na planilha Excel existe uma função específica para o cálculo que utiliza da Distribuição de Poisson; por intermédio desta relação é devolvido o valor da probabilidade específica para certo número de sucessos ou o valor da probabilidade acumulada; esta função é descrita por POISSON (x;média;acumulada) em sua versão em português e POISSON (x;mean;cumulative) na versão em inglês (MARTINS E DOMINGUES, 2017). Estatística Descritiva- Unidade 4 - Probabilidade II O setor de inspeção de uma empresa que fabrica faixas adesivas para decoração de paredes identificou que, em média, a cada 70 metros encontra-se 7 emendas. Admita que a distribuição do número de emendas é modelada conforme uma distribuição de Poisson. Vamos encontrar as probabilidades de: a) De não existir nenhuma emenda? Se existe uma emenda a cada 70 metros, logo a média é 𝜆 = 7 70 = 1 10 = 0,1, como foi solicitado a probabilidade de não existir emendas que equivale a 𝑃(𝑥 = 0), agora substituindo essas informações: 𝑃(𝑥 = 0) = 0,10⋅𝑒−0,1 0! ≃ 90,48% Desta maneira, há 90.48% de chance de não encontrar nenhuma emenda em uma faixa de 70 metros. b) De ocorrer no máximo duas emendas? No máximo duas emendas equivale a encontrar a probabilidade de encontrar nenhuma, uma ou duas emendas, logo: 𝑃(𝑥 ≤ 2) = 𝑃(0) + 𝑃(1) + 𝑃(2) 𝑃(𝑥 = 0) = 0,1 0 ⋅ 𝑒−0,1 0! ≃ 90,48% 𝑃(𝑥 = 1) = 0,1 1 ⋅ 𝑒−0,1 1! ≃ 9,05% 𝑃(𝑥 = 2) = 0,1 2 ⋅ 𝑒−0,1 2! ≃ 0,45% Logo, 𝑃(𝑥 ≤ 2) = 𝑃(0) + 𝑃(1) + 𝑃(2) = 90.48% + 9,05% + 0,45% = 99,98% A chance de ocorrer no máximo duas emendas em uma faixa de 70 metros equivale a 99,98%. c) De encontrar pelo menos uma emenda? Pelo menos uma emenda equivale a no mínimo uma emenda, ou seja, 𝑃(𝑥 ≥ 1) = 1 − 𝑃(0) pois não tem como determinar o número máximo de Estatística Descritiva- Unidade 4 - Probabilidade II emendas, assim, recorremos ao raciocínio contrário, considerando que 1 equivale a 100%. Como: 𝑃(𝑥 = 0) = 0,1 0 ⋅ 𝑒−0,1 0! ≃ 90,48% → 1 − 𝑃(0) = 100% − 90,48% = 9,52% Há 9,52% de encontrar pelo menos uma emenda em um rolo de 70 metros. Você sabia? Siméon Denis Poisson (1781- 1840) foi um engenheiro e matemático francês que desenvolveu pesquisas sobre mecânica, eletricidade, elasticidade, calor, som, além de estudos matemáticos com equações diferenciais e probabilidade (COSTA, 2019). 2. Função ou distribuição de probabilidade Função ou distribuição de probabilidade de uma experiência aleatória é a função que a cada evento possível possui correspondência com a probabilidade do um evento ocorrer; essa distribuição pode ser expressa por uma tabela, gráfico ou fórmula (MARTINS e DOMINGUES, 2017). 2.1. Distribuição de probabilidade acumulada Uma vez que trabalhamos com variáveis aleatórias contínuas, de acordo com Martins e Domingues (2017), podemos caracterizar função de distribuição acumulada em determinado ponto 𝑥 como a soma das probabilidades dos valores de 𝑥𝑖menores ou iguais a 𝑥. Logo: 𝐹(𝑥) = ∑𝑥𝑖 ≤ 𝑥 𝑝(𝑥𝑖) A função distribuição acumulada calcula a probabilidade acumulada para um determinado valor de x. É empregada para determinar a probabilidade de que uma observação aleatória que é extraída da população seja menor ou igual a um determinado valor ou a probabilidade de que uma observação seja maior do que um determinado valor ou esteja entre dois valores. Estatística Descritiva- Unidade 4 - Probabilidade II Figura 1: Área de uma função acumulada. Fonte: Neto e Cymbalista (2012) Há distinções quanto ao uso da distribuição acumulada para variáveis contínuas ou discretas. Para distribuições contínuas, a função de distribuição acumulada fornece a área sob a função densidade de probabilidade, até o valor de x estabelecido e para distribuições discretas, a função de distribuição acumulada gera a probabilidade acumulada para os valores de x previamente estipulado. Você sabia? O livro O Andar do Bêbado é um livro divertido e envolvente sobre como podemos utilizar estatística para nos auxiliar nas tomadas de decisões em nosso dia a dia, o autor, Leonard Mlodinow, fala sobre como a estatística foi desenvolvida além de explicar sua grande potencialidade. 3. Distribuição exponencial Semelhante a distribuição de Poisson, a distribuição exponencial descreve o espaço ou o tempo; como o tempo de chegadas de clientes a um supermercados ou a área entre três defeitos consecutivos em um rolo de tecido podem ser modelados por tal distribuição. Neste contexto,este modelo probabilístico é muito utilizado em modelos de duração de vida de componentes Estatística Descritiva- Unidade 4 - Probabilidade II que não se desgastam com o tempo, de maneira geral detém um papel muito importante na teoria de fila e em problemas de confiabilidade (WALPOLE et al., 2008). Martins e Domingues (2017) definem que uma variável aleatória contínua 𝑡 que considere todos os valores não negativos terá uma distribuição exponencial. A probabilidade é a área compreendida entre o eixo x e a curva do gráfico da função densidade de probabilidade. Utilizaremos as seguintes fórmulas para o cálculo: 𝑃(𝑥 > 𝑡) = 𝑒−𝜆𝑡, onde 𝜇 = 1 𝜆 Por consequência, a probabilidade de um evento complementar será calculado por: 𝑃(𝑥 ≤ 𝑡) = 1 − 𝑒−𝜆𝑡 Atente-se que o parâmetro 𝜆 é interpretado como o número médio de ocorrências por unidade de tempo, logo uma constante positiva. A figura 2 a seguir apresenta a representação gráfica de uma distribuição exponencial quando 𝜆 = 1. Estatística Descritiva- Unidade 4 - Probabilidade II Figura 2: Distribuição exponencial para 𝜆 = 1 Fonte: Neto e Cymbalista (2012) Considere que, em determinado período do dia, o tempo médio de atendimento em um caixa de banco seja de 2 minutos. Admitindo que o tempo para atendimento tenha distribuição exponencial, determinar a probabilidade de um cliente: a) esperar 3 minutos; Observe que 𝜇 = 2, e 𝜇 = 1 𝜆 = 1 2 = 0,5; como o desejado é a probabilidade de esperar três minutos, logo: 𝑃(𝑥 ≻ 4) = 𝑒−𝜆𝑡 = 𝑒− 3⋅0,5 = 𝑒−1,5 = 0,2231 = 22,31%. Desta forma, é possível concluir que há 22,31% de chance de um cliente esperar o atendimento em um caixa por três minutos.. b) esperar no máximo 1,5 minutos; 𝑃(𝑥 ≤ 1,5) = 𝑒−𝜆𝑡 = 𝑒− 0,5⋅1,5 = 𝑒−0,75 = 1 − 0,4724 = 0,5276 = 52,76% Assim, a probabilidade de se esperar no máximo 1, 5 minutos é de 52,76%. Estatística Descritiva- Unidade 4 - Probabilidade II Você sabia? A função EXPONDIST (em inglês) e DISTEXPON (em português) disponível entre as ferramentas estatísticas da Planilha Excel permite calcular probabilidades fundamentadas no conceito de Distribuição de Probabilidade Exponencial através das relações (X;Lambda;Cumulative) na versão em inglês ou (X;Lambda;Acumulada) em português (DOMINGUES E MARTINS, 2017). 4. Distribuição normal Meados dos séculos XVIII e XIX, matemáticos e físicos elaboraram uma função densidade de probabilidade (equação que representa a distribuição de probabilidade de uma variável aleatória contínua). Essa função densidade de probabilidade resultou na bem conhecida curva em forma de sino, chamada de distribuição normal ou gaussiana. Essa distribuição fornece uma aproximação de curvas de freqüência para medidas de dimensões e qualidades humanas (CAIRE, 2013). A distribuição de probabilidade contínua mais importante e mais utilizada é a distribuição normal, costumeiramente denominada como curva normal ou curva de Gauss. Seu estudo é muito importante, pois muitas técnicas estatísticas, como análise de variância, de regressão e alguns testes de hipótese, assumem e exigem a normalidade dos dados. Castanheira (2013) afirma que a distribuição de probabilidade normal é de extrema importância na inferência estatística pelos seguintes motivos: ➔ as medidas produzidas por diferentes processos aleatórios seguem essa distribuição; ➔ podem ser utilizadas como aproximações de outras distribuições de probabilidade, como a de Poisson e a Binomial; Estatística Descritiva- Unidade 4 - Probabilidade II ➔ distribuições de estatística da amostra, como a média e a proporção, regularmente seguem distribuição normal, independentemente da distribuição da população. Inicialmente, considerava-se que todos os fenômenos não conseguiriam ser modelados conforme o modelo de uma curva normal, devido ao processo de coleta de dados; contudo verificou-se que uma grande gama de situações são adaptados a esta padronização por isso a denominação distribuição normal de probabilidade(CASTANHEIRA, 2013). Observe a figura 3 a curva normal com média 𝜇 e desvio padrão 𝜎. Figura 3: Distribuição normal Fonte: Neto e Cymbalista (2012) Larson e Farber (2016) reiteram que a curva normal possui algumas propriedades: ● A curva é assintótica, ou seja, nunca toca o eixo horizontal, logo, a função de x jamais anula-se; ● A área compreendida pela curva nesse intervalo é sempre igual a 1; ● A função tem um máximo, que corresponde, à média da distribuição; ● A distribuição é simétrica em torno da média; Estatística Descritiva- Unidade 4 - Probabilidade II ● A média, a moda e a mediana são iguais; ● A curva tem dois pontos de inflexão, simétricos em relação à média, indicados por serem o desvio padrão da distribuição normal. Você sabia? A denominação"curva em forma de sino" é atribuída a Esprit Jouffret (1837-1904) matemático e militar que foi o primeiro a utilizar o termo "superfície de sino" em 1872 (CAIRE, 2013). O Teorema do limite Central afirma que na medida em que o tamanho da amostra aumenta, a distribuição amostral das médias amostrais tende para uma distribuição normal (WARPOLE, et al.; 2008); logo, se uma população tem distribuição normal, a distribuição das médias amostrais retiradas da população também terá distribuição normal, para qualquer tamanho de amostra. Também mesmo na situação de uma distribuição que não seja normal, conforme Warpole et al. (2008), a distribuição das médias amostrais será aproximadamente normal, desde que a amostra seja grande; pois não é necessário conhecer a distribuição de uma população para podermos fazer inferência sobre ela a partir de dados amostrais. A única limitação é que o tamanho da amostra seja grande, assim deve consistir de 30 ou mais observações. 4.1. Distribuição normal padronizada Conforme Pearson e Farber (2016) explicam, é desnecessário o uso de tabelas separadas de áreas sob as curvas normais para todos os pares imagináveis de valores da média de desvios padrão, logo, é tabelado as áreas para a distribuição normal com 𝜇 = 0 e 𝜎 = 1 , a chamada de distribuição normal padronizada. Por este artifício é possível obter áreas sob qualquer curva normal fazendo a mudança de escala que transforma as unidades de medida da escala original, ou seja, a escala x, em unidades padronizadas, escores padronizados ou Estatística Descritiva- Unidade 4 - Probabilidade II denominados escores z utilizando a fórmula 𝑧 = 𝑥−𝜇 𝜎 . É importante ressaltar que para seu uso demanda conhecer dois valores numéricos que devem ser previamente informados, a média 𝜇e o desvio padrão 𝜎. Uma vez que 𝜇 e 𝜎 geram uma distribuição normal, as tabelas de probabilidade normal são fundamentadas em uma distribuição normal de probabilidade com 𝜇 = 0e 𝜎 = 1; a tabela 2 sinaliza as proporções de áreas para diversos intervalos de valores para a distribuição de probabilidade normal padronizada, com o limite inferior do intervalo começando sempre na média (CASTANHEIRA, 2013). Estatística Descritiva- Unidade 4 - Probabilidade II Tabela 2: Área de uma distribuição normal padrão. Fonte: Castanheira (2013) Estatística Descritiva- Unidade 4 - Probabilidade II Você sabia? Na Planilha Excel há uma ferramenta apropriada para o cálculo de probabilidade envolvendo a distribuição normal assim como para construir a curva noval desde que informados a média e o desvio padrão. Estas funções são acionadas por intermédio da função Statistical (em inglês) ou Estatística (em português). Na versão em inglês são dispostas as funções: NORMDIST, NORMINV, NORMSDIST, NORMSINV e STANDARDIZE; já na versão em português estas relações são identificadas por: DIST.NORM., INV.NORM, DIST.NORMP, INV.NORMP e PADRONIZAR (MARTINS E DOMINGUES, 2017).Agora vamos colocar em prática as definições apresentadas anteriormente este importante conteúdo da probabilidade? Vamos em frente! Admita que a precipitação pluviométrica média em certa cidade, no mês de dezembro, foi de 8,9 cm. Admitindo que estes dados são modelados conforme uma distribuição normal com desvio padrão de 2,5 cm, determinar a probabilidade de que no mês de dezembro próximo, a precipitação seja: a) entre 1,6 cm e 8,9 cm? O primeiro passo é transformar a variável x em uma z, dados 𝜇 = 8,9e 𝜎 = 2,5 é possível realizar tal comando pela relação, logo: 𝑧 = 𝑥−𝜇 𝜎 → 𝑧 = 1,6 − 8,9 2,5 = −2,92; como a curva normal é simétrica, o sinal negativo só indica que esta medida está a esquerda da média, porém quando consultar a tabela a referência é +2,92, uma vez que a tabela de área considera tal interpretação, desta forma após realizar consulta na tabela observe que para tal valor de z equivale a uma área de 0,4982 cm2. Estatística Descritiva- Unidade 4 - Probabilidade II Logo, a probabilidade da precipitação pluviométrica ser 1,6 cm, ou seja 𝑃(1,6 ≤ 𝑋 ≤ 8,9) é de 49,82%. b) superior a 5 cm mas não superior a 11 cm; Neste caso, será necessário realizar duas conversões, para x = 5 e x = 11, uma vez que são valores distintos; em seguida realizamos a troca por cada valor de x e obtemos: 𝑧 = 𝑥−𝜇 𝜎 → 𝑧 = 5 − 8,9 2,5 = −1,56 e 𝑧 = 𝑥−𝜇 𝜎 → 𝑧 = 11− 8,9 2,5 = 0,84, de posse deste valor encontraremos na tabela 2 uma área igual a 0,4406 para z = - 1,56 e 0,2995 para z = 0,84 respectivamente. Neste contexto como o solicitado é a probabilidade entre 5cm e 11 cm, basta adicionar uma área com a outra, tal identificação é possível com a visualização da curva a seguir: Logo, a probabilidade da precipitação pluviométrica ser superior a 5 cm, ou seja, maior que 5 cm, mas não superior a 11 cm é de 74,01%, pois equivale a soma: 0,4406 + 0,2995.. c) superior a 12 cm. O primeiro passo transformar a variável x em uma z, logo: 𝑧 = 𝑥−𝜇 𝜎 → 𝑧 = 12 − 8,9 2,5 = 1,24; de posse deste valor consultamos a tabela 2 e encontramos área Estatística Descritiva- Unidade 4 - Probabilidade II equivalente a 0,3925, porém como o que deseja é probabilidade de ser superior a 12 cm, ou seja, maior que 12 cm é necessário realizar a subtração entre as áreas, é importante ressaltar que metade da área equivale a 50%, ou seja, 0,5 , e como a tabela utilizada define que a área tabelada parte da média é necessário realizar a operação de diferença a seguir : 𝑃(𝑋 ≻ 12) =0,5 - 0,3925 = 0,1025. Logo, a probabilidade da precipitação pluviométrica ser superior a 12 cm equivale a 10,25%. Você Já ouviu falar no termo Big Data? Ele é o uso da estatística na prática para análise de um grande volume de dados. A ciência dos dados está cada vez mais em alta, veja a matéria a seguir sobre o que é e como surgiu: https://www.oracle.com/br/big-data/guide/what-is-big-data.html Síntese Dando continuidade, no âmbito da probabilidade ao estudo das distribuições de probabilidade de variáveis discretas conhecemos outra categoria, denominada distribuição de Poisson, bem como suas particularidades e aplicações em nosso cotidiano. No contexto de variáveis aleatórias contínuas foram analisadas: a distribuição acumulada, a distribuição exponencial e a mais importante e mais utilizada (sem desmerecer as outras) a distribuição normal, que se baseia na https://www.oracle.com/br/big-data/guide/what-is-big-data.html Estatística Descritiva- Unidade 4 - Probabilidade II proporção da área ocupada em uma curva normal. Nestas três distribuições foi apresentado sua fundamentação teórica, aplicação e resolução de problemas envolvendo tais definições. Nesta última unidade, você teve a oportunidade de: ● Conhecer a definição e aplicabilidade da Distribuição de Poisson; ● Resolver situações-problema por intermédio da Distribuição de Poisson; ● Entender sobre as Distribuições de Probabilidade de variáveis contínuas; ● Conhecer a definição e aplicabilidade das distribuições acumuladas; ● Resolver situações-problema por distribuições acumuladas; ● Conhecer a definição e aplicabilidade da distribuição Exponencial; ● Resolver situações-problema por intermédio da distribuição Exponencial; ● Compreender as peculiaridades de uma distribuição Normal; ● Ler e Interpretar os dados contidos na tabela de distribuição Normal; ● Resolver situações problema por intermédio da distribuição Normal. Estatística Descritiva- Unidade 4 - Probabilidade II Estatística Descritiva- Unidade 4 - Probabilidade II Bibliografia CAIRE, Elaine. A história da origem da curva normal. 2013. Dissertação (Mestre em Educação Matemática) - Universidade Estadual Paulista Júlio de Mesquita Filho, Rio Claro, 2013. Disponível em: https://repositorio.unesp.br/bitstream/handle/11449/91024/caire_e_me_rcla.pdf ?sequence=1. Acesso em: 2 jul. 2019. CASTANHEIRA, Nelson Pereira. Estatística aplicada a todos os níveis. Curitiba: Intersaberes, 2013. Disponível em: Minha Biblioteca. COSTA, Giovani Glaucio de Oliveira. Curso de estatística básica - Teoria e Prática. 2ªedição. São Paulo: Atlas, 2015. Disponível em: Minha Biblioteca. COSTA, Keilla Renata."Siméon Denis Poisson"; Brasil Escola. Disponível em: https://brasilescola.uol.com.br/biografia/simeon-denis.htm. Acesso em 02 de julho de 2019. FREUND, John E. Economia, Administração e Contabilidade. Estatística Aplicada. Porto Alegre: Bookman, 2009. JACQUES Bernoulli. [S. l.], 9 abr. 2017. Disponível em: https://www.somatematica.com.br/biograf/bernoulliJacques.php. Acesso em: 30 jun. 2019. Estatística Descritiva- Unidade 4 - Probabilidade II LARSON, Ron; FARBER, Betsy. Estatística Aplicada. 6. ed. São Paulo: Pearson, 2016. 654 p. v. único. Disponível em: Biblioteca Virtual Universitária. MARTINS, Gilberto de Andrade; DOMINGUES, Osmar. Estatística Geral e Aplicada. São Paulo: Atlas, 2017. MAGALHÃES, Marcos ; LIMA, Antonio Carlos Predroso de. Noções de Probabilidade e Estatística. São Paulo: Edusp, 2015. MILONE, Giuseppe. Estatística Geral e Aplicada. Rio de Janeiro: Thomson, 2006.v MONTGOMERY, Douglas C; RUNGER, Georg C. Estatística Básica e Probabilidade para Engenheiros. São Paulo: LTR, 2016. MORETIM, Luiz Gonzaga. Estatística Básica: probabilidade e inferência. 1. ed. São Paulo: Pearson, 2010. 376 p. v. único. Disponível em: Biblioteca Virtual Universitária MORAES, Fabíola Eugênio Arrabaça. Estatística Descritiva. 1. ed. São Paulo: Pearson, 2010. 142 p. v. único. Disponível em: Biblioteca Virtual Universitária. NETO, Pedro Luiz de Oliveira Costa; CYMBALISTA, Melvin. Probabilidades. São Paulo: Edgard Blucher, 2012.Disponível em: Biblioteca Virtual Universitária. PENA, Sérgio Danilo. Thomas Bayes: o cara!. Belo Horizonte, 1 jul. 2009. Disponível em: http://cienciahoje.org.br/artigo/thomas-bayes-o-cara/. Acesso em: 26 jun. 2019. WALPOLE, Ronald E. et al. Probabilidade e Estatística para engenharias e ciências. São Paulo: Pearson, 2008.
Compartilhar