Baixe o app para aproveitar ainda mais
Prévia do material em texto
GL301 – Estatística I Leonardo T. Duarte Primeiro Semestre de 2013 Variável Aleatória Distribuições contínuas Variáveis Aleatórias Contínuas ● Variáveis aleatórias também podem ser definidas para dados contínuos Discreto Contínuo Função massa de probabilidade Função densidade de probabilidade Variáveis Aleatórias Contínuas ● Exemplos de variáveis aleatórias contínuas ● pH de um composto químico selecionado aleatoriamente num processo industrial ● Altura de uma população ● Peso de uma peça selecionada aleatoriamente de um lote Caraterização de uma VA contínua ● Uma VA contínua pode ser caracterizada por uma função densidade de probabilidade ● Exemplo: Considere uma variável aleatória X distribuída uniformemente entre -0.5 e 0.5 ● A função densidade de probabilidade neste caso é dada por: -0.5 x f(x) -0.5 Caraterização de uma VA contínua ● A função densidade de probabilidade pode ser interpretada como um histograma no qual os intervalos possuem uma largura infinitesimal e quantidade de dados é extremamente grande. Exemplo: - 6 - 4 - 2 0 2 4 6 0 1 2 3 4 x 1 0 5 - 6 - 4 - 2 0 2 4 6 0 2 4 6 8 x 1 0 4 - 6 - 4 - 2 0 2 4 6 0 0 . 5 1 1 . 5 2 2 . 5 x 1 0 4 Caraterização de uma VA contínua ● Dada uma VA X cuja função densidade de probabilidade (fdp) é dada fX(x), como calcular a probabilidade de uma realização de X estar no intervalo [a,b]? Exemplo: ● Devemos calcular a área sob fX(x) no intervalo desejado. 1 x f(x) 1,5 2,5 0.5 1 3 x f(x) 0.5 Caraterização de uma VA contínua ● Dada uma VA X cuja função densidade de probabilidade (fdp) é dada fX(x), como calcular a probabilidade de uma realização de X estar no intervalo [a,b]? Exemplo: ● Devemos calcular a área sob fX(x) no intervalo desejado. 1 x f(x) 1,5 2,5 0.5 1 3 x f(x) 0.5 Caraterização de uma VA contínua ● Exemplo: Considere a densidade abaixo ● Calcule c para esta curva seja uma densidade: área total sob a curva deve ser 1 ● Qual a probabilidade de uma realização da VA associada a esta densidade estar no intervalo [0,0.5]: temos que calcular a área neste intervalo P(0 ≤ x ≤ 0.5) = x f(x) 10,5 x f(x) c Caraterização de uma VA contínua ● Exemplo: Considere a densidade abaixo ● Calcule c para esta curva seja uma densidade: área total sob a curva deve ser 1 ● Qual a probabilidade de uma realização da VA associada a esta densidade estar no intervalo [0,0.5]: temos que calcular a área neste intervalo P(0 ≤ x ≤ 0.5) = (0.5 × 2) / 2 = 0.5 x f(x) 10,5 x f(x) c Caraterização de uma VA contínua ● Dado que ● Uma fdp deve respeitar as seguintes condições: ● A primeira condição evita probabilidades negativas. ● A segunda condição garante que probabilidade do evento certo seja 1. Caraterização de uma VA contínua ● Implicação interessante: qual a probabilidade de uma VA contínua ser igual a um dado número c? ● Ou seja, a probabilidade de uma VA assumir um dado valor é nula! ● Intuição: numa variável aleatória contínua há um número infinitamente grande de elementos no espaço amostral. ● Logo, a probabilidade de um dado ponto é zero. Função de distribuição acumulada ● A função de distribuição acumulada (fda) de uma VA X, representada por FX(x), é definida com FX(x) = P(X ≤ x) ● Podemos escrever FX(x) = P(- ∞ ≤ X ≤ x) ● Logo ● Pelo teorema fundamental do cálculo Exercício ● Num processo de manufatura, há variação no peso de cada embalagem produzida. O engenheiro responsável modelou esta variação por meio de uma VA X cuja fdp é ● Determine k ● Sabendo que o valor desejado é 1, determine a probabilidade de uma embalagem escolhida ao acaso ter peso no intervalo [0,75, 1]. ● Determine e esboce a função de distribuição acumulada ● Determine a média, variância e mediana. VAs Contínuas ● A média de uma VA contínua X é dada por: ● De modo mais geral ● A variância de X é dada por E{(X-E{X})2}, e logo Revisão VAs Contínuas ● A média é um operador linear Revisão VAs Contínuas ● A média é um operador linear ● A variância de Y = aX + b é dada por: Revisão VAs Contínuas ● A média é um operador linear ● A variância de Y = aX + b é dada por: Revisão VAs Contínuas ● A média é um operador linear ● A variância de Y = aX + b é dada por: Revisão VAs Contínuas ● A média é um operador linear ● A variância de Y = aX + b é dada por: Revisão VAs Contínuas ● A média é um operador linear ● A variância de Y = aX + b é dada por: Importantes distribuições contínuas ● Distribuição Normal (ou Gaussiana) ● Distribuição Uniforme ● Distribuição exponencial ● Distribuição gama ● Distribuição lognormal Distribuição Gaussiana ● Distribuição Normal ou Gaussiana ● Variável aleatória mais importante em estatística - 1 . 5 - 1 - 0 . 5 0 0 . 5 1 1 . 5 2 2 . 5 3 3 . 5 0 0 . 2 0 . 4 0 . 6 0 . 8 1 1 . 2 1 . 4 1 . 6 x f(x ) de Moivre Laplace Gauss Distribuição Gaussiana ● Função densidade de probabilidade Distribuição Gaussiana ● Função densidade de probabilidade ● Mostra-se que E{X} = μ e que a variância de X é σ2. Distribuição Gaussiana ● Função densidade de probabilidade ● Mostra-se que E{X} = μ e que a variância de X é σ2. ● Neste caso, mediana = média = moda Distribuição Gaussiana ● Função densidade de probabilidade ● Mostra-se que E{X} = μ e que a variância de X é σ2. ● Neste caso, mediana = média = moda ● Exemplo (Montgomery, 2003) Distribuição Gaussiana ● Função de distribuição acumulada da VA normal é Distribuição Gaussiana ● Função de distribuição acumulada da VA normal é ● Esta integral só pode ser calculada numericamente. ● No caso em que E{X} = μ = 0 e σ2 =1, temos a chamada distribuição normal padrão Distribuição Gaussiana ● Função de distribuição acumulada da VA normal é ● Esta integral só pode ser calculada numericamente. ● No caso em que E{X} = μ = 0 e σ2 =1, temos a chamada distribuição normal padrão ● Historicamente, a função Φ(z) é tabelada. Atualmente, softwares matemáticos calculam rapidamente esta função. FDA de uma distribuição Gaussiana FDA de uma distribuição Gaussiana FDA de uma distribuição Gaussiana ● Exemplos (Wikipedia) FDP FDA Distribuição Gaussiana ● Exemplo: uma VA Z segue uma distribuição normal padronizada (μ = 0 e σ2 =1). Calcule: ● P(Z ≤ 1.5) = FZ(1.5) Distribuição Gaussiana ● Exemplo: uma VA Z segue uma distribuição normal padronizada (μ = 0 e σ2 =1). Calcule: ● P(Z ≤ 1.5) = FZ(1.5) = Φ(1.5) = 0.933. Distribuição Gaussiana ● Exemplo: uma VA Z segue uma distribuição normal padronizada (μ = 0 e σ2 =1). Calcule: ● P(Z ≤ 1.5) = FZ(1.5) = Φ(1.5) = 0.933. ● P(-1.25 ≤ Z ≤ 0.37)= FZ(0.37) –FZ(-1.25) = Φ(0.37) -Φ(-1.25) = 0.644 – 0.105 = 0.538 Distribuição Gaussiana ● Como calcular a probabilidade no caso de uma VA normal X não-padronizada de média μ e variância σ2 =1? Distribuição Gaussiana ● Como calcular a probabilidade no caso de uma VA normal X não-padronizada de média μ e variância σ2 =1? ● Padronizar a variável X ● É fácil verificar que Z possui média 0 e variância 1. Distribuição Gaussiana ● Como calcular a probabilidade no caso de uma VA normal X não-padronizada de média μ e variância σ2 =1? ● Padronizar a variável X ● É fácil verificar que Z possui média 0 e variância 1. ● LogoDistribuição Gaussiana ● Como calcular a probabilidade no caso de uma VA normal X não-padronizada de média μ e variância σ2 =1? ● Padronizar a variável X ● É fácil verificar que Z possui média 0 e variância 1. ● Logo ● Portanto, Distribuição Gaussiana ● Exemplo: A potência dissipada em um resistor segue uma VA normal com μ = 1 W e variância σ2 = 0.1 W2. Qual a probabilidade desta potência estar no intervalo [1,1.5]W? ● Qual a probabilidade da potência dissipada ser maior do que 1.5W? 0 1 0 0 2 0 0 3 0 0 4 0 0 5 0 0 6 0 0 7 0 0 8 0 0 9 0 0 1 0 0 0 0 0 . 5 1 1 . 5 2 2 . 5 Po tê nc ia (W ) 0 0.5 1 1.5 2 2.5 00.20.40.60.811.21.4 x f X (x) Distribuição Gaussiana ● Qual a probabilidade da potência dissipada ser maior do que 1.5W? Distribuição Gaussiana ● Qual a probabilidade da potência dissipada ser maior do que 1.5W? Distribuição Gaussiana ● Qual a probabilidade da potência dissipada ser maior do que 1.5W? Distribuição Gaussiana ● A porcentagem de área em torno da média a cada incremento de desvio padrão. Distribuição Gaussiana ● Exemplo de aplicação em qualidade. Considere uma certa especificação para um produto (e.g. peso). Distribuição Gaussiana ● Exemplo de aplicação em qualidade. Considere uma certa especificação para um produto (e.g. peso). ● Defeito: quando a característica desejada está fora do intervalo que define os limites da especificação (LSL-USL). Distribuição Gaussiana ● Exemplo de aplicação em qualidade. Considere uma certa especificação para um produto (e.g. peso). ● Defeito: quando a característica desejada está fora do intervalo que define os limites da especificação (LSL-USL). ● Considere que a característica analisada segue uma distribuição normal, cuja média μ é o valor especificado. ● Assumindo que LSL = μ – 3σ e USL = μ + 3σ, quantas peças serão defeituosas? Distribuição Gaussiana ● Exemplo de aplicação em qualidade. Considere uma certa especificação para um produto (e.g. peso). ● Defeito: quando a característica desejada está fora do intervalo que define os limites da especificação (LSL-USL). ● Considere que a característica analisada segue uma distribuição normal, cuja média μ é o valor especificado. ● Assumindo que LSL = μ – 3σ e USL = μ + 3σ, quantas peças serão defeituosas? ● Resposta: Aproximadamente 0,27% ● Processo +/- 3 sigma ● Qualidade +/- 3 sigma Distribuição Gaussiana ● É possível considerar outros níveis de sigma em qualidade. ● Processo seis sigma (desenvolvido pela Motorola em 1986) apresenta 0.002 peças defeituosas por milhão. Distribuição Gaussiana ● É possível considerar outros níveis de sigma em qualidade. ● As porcentagens são menores aqui pois geralmente não é possível garantir exatamente o valor nominal. Variável Aleatória Gaussiana ● Por que a VA Gaussiana é tão importante? Variável Aleatória Gaussiana ● Por que a VA Gaussiana é tão importante? ● Vamos considerar um conjunto de N variáveis aleatórias: X1, X2,...,XN Variável Aleatória Gaussiana ● Por que a VA Gaussiana é tão importante? ● Vamos considerar um conjunto de N variáveis aleatórias: X1, X2,...,XN ● Somando este conjunto, obtemos uma nova VA: Y = X1 + X2 + … + XN Variável Aleatória Gaussiana ● Por que a VA Gaussiana é tão importante? ● Vamos considerar um conjunto de N variáveis aleatórias: X1, X2,...,XN ● Somando este conjunto, obtemos uma nova VA: Y = X1 + X2 + … + XN ● À medida que N cresce, a densidade de Y tende a uma Gaussiana, não importando quais são as densidade de X1, X2,...,XN Variável Aleatória Gaussiana ● Por que a VA Gaussiana é tão importante? ● Vamos considerar um conjunto de N variáveis aleatórias: X1, X2,...,XN ● Somando este conjunto, obtemos uma nova VA: Y = X1 + X2 + … + XN ● À medida que N cresce, a densidade de Y tende a uma Gaussiana, não importando quais são as densidade de X1, X2,...,XN ● Este resultado é conhecido como Teorema Central do Limite. Variável Aleatória Gaussiana ● Ilustração do teorema central do limite (TCL): vamos considerar N variáveis aleatórias uniformes -0.5 x f(x) -0.5 -0.5 x f(x) -0.5 -0.5 x f(x) -0.5 … Variável Aleatória Gaussiana ● Ilustração do teorema central do limite (TCL): vamos considerar N variáveis aleatórias uniformes ● Y → soma das realizações dessas Vas (não é a soma das pdfs!). Densidade aproximada de Y: -0.5 x f(x) -0.5 N = 2 -0.5 x f(x) -0.5 -0.5 x f(x) -0.5 … N = 3 N = 10 - 1 . 5 - 1 - 0 . 5 0 0 . 5 1 1 . 5 0 5 0 1 0 0 1 5 0 2 0 0 2 5 0 3 0 0 - 1 . 5 - 1 - 0 . 5 0 0 . 5 1 1 . 5 0 5 0 1 0 0 1 5 0 2 0 0 2 5 0 3 0 0 3 5 0 - 4 - 3 - 2 - 1 0 1 2 3 0 5 0 1 0 0 1 5 0 2 0 0 2 5 0 3 0 0 3 5 0 4 0 0 4 5 0 Implicação do TCL ● Média amostral mX: pode ser vista como uma realização da seguinte variável aleatória Y = (X1 + X2 + … + XN)/N onde X1, X2, … , XN possuem a mesma distribuição fX(x) Implicação do TCL ● Média amostral mX: pode ser vista como uma realização da seguinte variável aleatória Y = (X1 + X2 + … + XN)/N onde X1, X2, … , XN possuem a mesma distribuição fX(x) ● Pela linearidade da esperança da E{Y} = E{X} ● Além disso, é fácil mostrar que σY2 = σX2/N Implicação do TCL ● Média amostral mX: pode ser vista como uma realização da seguinte variável aleatória Y = (X1 + X2 + … + XN)/N onde X1, X2, … , XN possuem a mesma distribuição fX(x) ● Pela linearidade da esperança da E{Y} = E{X} ● Além disso, é fácil mostrar que σY2 = σX2/N ● Finalmente pelo TCL, a distribuição de Y tende a uma Gaussiana a medida que N cresce. Implicação do TCL ● Exemplo: Seja X uma variável aleatória uniforme ● A média populacional (esperança) é E{X} = 0.5 ● Vamos estudar a distribuição Y da média amostral considerando diferentes números de amostras N Y = (X1 + X2 + … + XN)/N 1 x f(x) 1 Implicação do TCL ● Média amostral de uma VA uniforme Média estimada com N = 1 amostra (10000 repetições) ● Resultados apresentados em um histograma 0 0 . 1 0 . 2 0 . 3 0 . 4 0 . 5 0 . 6 0 . 7 0 . 8 0 . 9 1 0 2 0 4 0 6 0 8 0 1 0 0 1 2 0 1 4 0 1 6 0 1 8 0 2 0 0 M é d i a a m o s t r a l Implicação do TCL ● Média amostral de uma VA uniforme Média estimada com N = 5 amostras (10000 repetições) ● Resultados apresentados em um histograma 0 0 . 1 0 . 2 0 . 3 0 . 4 0 . 5 0 . 6 0 . 7 0 . 8 0 . 9 1 0 2 0 4 0 6 0 8 0 1 0 0 1 2 0 1 4 0 1 6 0 1 8 0 2 0 0 M é d i a a m o s t r a l Implicação do TCL ● Média amostral de uma VA uniforme Média estimada com N = 10 amostras (10000 repetições) ● Resultados apresentados em um histograma 0 0 . 1 0 . 2 0 . 3 0 . 4 0 . 5 0 . 6 0 . 7 0 . 8 0 . 9 1 0 2 0 4 0 6 0 8 0 1 0 0 1 2 0 1 4 0 1 6 0 1 8 0 2 0 0 M é d i a a m o s t r a l Implicação do TCL ● Média amostral de uma VA uniforme Média estimada com N=100 amostras (10000 repetições) ● Resultados apresentados em um histograma 0 0 . 1 0 . 2 0 . 3 0 . 4 0 . 5 0 . 6 0 . 7 0 . 8 0 . 9 1 0 2 0 4 0 6 0 8 0 1 0 0 1 2 0 1 4 0 1 6 0 1 8 0 2 0 0 M é d i a a m o s t r a l Implicação do TCL ● Média amostral de uma VA uniforme Média estimada com N=5000 amostras (10000 repetições) ● Resultados apresentados em um histograma 0 0 . 1 0 . 2 0 . 3 0 . 4 0 . 5 0 . 6 0 . 7 0 . 8 0 . 9 1 0 2 0 4 0 6 0 8 0 1 0 0 1 2 0 1 4 01 6 0 1 8 0 2 0 0 M é d i a a m o s t r a l Aproximação da binomial pela normal ● A distribuição normal é muito utilizada para aproximar outras distribuições Aproximação da binomial pela normal ● A distribuição normal é muito utilizada para aproximar outras distribuições ● Exemplo: Binomial ● Adequada para np>10 e n(1-p>10) ● Por que funciona? Binomial é uma soma de variáveis de Bernoulli ! Soma de VAs normais ● Soma de duas variáveis aleatórias (independentes) normais também é uma variável normal Y = X1 + X2 ● Se X1 e X2 seguem uma distribuição normal, então Y também seguirá uma distribuição normal. ● É possível mostrar que E{Y} = E{X1} + E{X2} σY2 = σX12 + σX22 Exercício ● O lucro anual de uma empresa (em dezenas de milhões de real) segue uma distribuição normal de média 12 e variância 3. Diante disso, calcule ● A probabilidade do lucro em um ano ser maior que 9 e menor que 14 ● A probabilidade do lucro total em dois anos ser maior do que 25 ● A probabilidade do lucro em um dado ano exceder o lucro do ano seguinte em 3 Slide 1 Slide 2 Slide 3 Slide 4 Slide 5 Slide 6 Slide 7 Slide 8 Slide 9 Slide 10 Slide 11 Slide 12 Slide 13 Slide 14 Slide 15 Slide 16 Slide 17 Slide 18 Slide 19 Slide 20 Slide 21 Slide 22 Slide 23 Slide 24 Slide 25 Slide 26 Slide 27 Slide 28 Slide 29 Slide 30 Slide 31 Slide 32 Slide 33 Slide 34 Slide 35 Slide 36 Slide 37 Slide 38 Slide 39 Slide 40 Slide 41 Slide 42 Slide 43 Slide 44 Slide 45 Slide 46 Slide 47 Slide 48 Slide 49 Slide 50 Slide 51 Slide 52 Slide 53 Slide 54 Slide 55 Slide 56 Slide 57 Slide 58 Slide 59 Slide 60 Slide 61 Slide 62 Slide 63 Slide 64 Slide 65 Slide 66 Slide 67 Slide 68 Slide 69 Slide 70
Compartilhar