Baixe o app para aproveitar ainda mais
Prévia do material em texto
Universidade do Estado do Rio de Janeiro Instituto de Matemática e Estatística Probabilidade e Estatística III Variáveis aleatórias discretas e contínuas Grupo 8 T: 02 Deivisson Costa Gomes Max V. M. Dias Anderson Leonardo Conceição Rio de janeiro, 07 de dezembro de 2011. I. Variáveis aleatórias discretas. 1. Definição. Muitos experimentos aleatórios produzem resultados não - numéricos. Antes de analisá- los, é conveniente transformar seus resultados em números, o que é feito através da variável aleatória, que é uma regra de associação de um valor numérico a cada ponto do espaço amostral. Portanto, variáveis aleatórias são variáveis numéricas às quais iremos associar modelos probabilísticos. Veremos que uma variável aleatória tem um numero para cada resultado de um experimento e que uma distribuição de probabilidades associa uma probabilidade a cada resultado numérico de um experimento. Seja E um experimento e S o espaço associado ao experimento. Uma função X, que associe a cada elemento s pertence S um número real X(s), é denominado variável aleatória. Exemplo: E: lançamento de duas moedas; X: número de caras obtidas nas duas moedas; S={(c,c),(c,r),(r,c),(r,r)} X=0 > corresponde ao evento (r,r) com probabilidade ¼; X=1 > corresponde ao evento (r,c), (x,r) com probabilidade 2/4; X=2 > corresponde ao evento (c,c) com probabilidade ¼; Empregamos a termo variável aleatória para descrever o valor que corresponde ao resultado de determinado experimento. As variáveis aleatórias também podem ser discretas ou continuas e temos as seguintes definições: Variáveis aleatórias discretas – Admite um número finito de valores ou tem uma quantidade enumerável de valores. Variáveis aleatórias contínuas – Pode tomar um número infinito de valores, e esses valores podem ser associados a mensurações em uma escala contínua. 2. Distribuição de probabilidade. Uma vez definida a variável aleatória, existe interesse no cálculo dos valores das probabilidades correspondentes. O conjunto das variáveis e das probabilidades correspondentes é denominado distribuição de probabilidades, isto é: 3. Função de densidade de probabilidade. É a função que associa a cada valor assumido pela variável aleatória a probabilidade do evento correspondente, isto é: 4. Esperança matemática, variância e desvio padrão: propriedades. Existem características numéricas que são muito importantes em uma distribuição de probabilidades de uma variável aleatória discreta. São os parâmetros das distribuições, a saber: > Esperança matemática (ou simplesmente média) – E (x) – é um número real, é também uma média aritmética; > Variância – VAR (x) – é a medida que dá o grau de dispersão (ou de concentração) de probabilidade em torno da média. O fato de conhecermos a média de uma distribuição de probabilidades já nos ajuda bastante, porém, precisamos de uma medida que nos dê o grau de dispersão de probabilidade em torno dessa média. 5. Distribuições de variáveis aleatórias discretas. Será feita uma discussão sobre algumas distribuições de probabilidades discretas. Tais distribuições partem da pressuposição de certas hipóteses bem definidas. Como diversas situações reais muitas vezes se aproximam dessas hipóteses, esses modelos são úteis no estudo de tais situações, daí a sua importância. Um cuidado muito grande deve ser tomado ao se escolher uma distribuição de probabilidade que descreve corretamente as observações geradas por um experimento. Primeiramente analisaremos as distribuições discretas de probabilidades mais importantes e que descrevem as variáveis aleatórias comumente encontradas na prática. Por último analisaremos algumas distribuições de v.a. contínuas de importância similar. 6.1. Distribuição Uniforme. É a mais simples de todas as distribuições discretas de probabilidade. É aquela na qual a v.a. assume todos os seus valores com a mesma probabilidade. Tal distribuição é chamada distribuição uniforme. A distribuição discreta uniforme é dada por: P(x,k) = 1/k = P(X = x) onde x é um dos possíveis valores da v.a. X. Utilizamos aqui P(x,k) ao invés de p(x) para indicar que a distribuição uniforme depende do parâmetro k. Este é o caso mais simples de v.a. discreta, onde cada possível valor ocorre com a mesma probabilidade. i) Definição: A variável aleatória discreta X, assumindo os valores x1,x2, ..., xn , tem distribuição uniforme , se e somente se, ��� = ��� = ����� = � = , para todo i = 1, 2,..., n. 6.2. Distribuição de Bernoulli. Seja um exemplo aleatório E realizado repetidas vezes, sempre nas mesmas condições, de tal forma que o resultado pode ser um Sucesso (s) (se acontecer o evento que nos interessa) ou um Fracasso (f) (se o evento não se realizar). Seja X a variável aleatória: Sucesso ou Fracasso Essas condições caracterizam um conjunto de Provas de Bernoulli ou um experimento de Bernoulli, e sua função probabilidade é dada por: > Média: > Variância: 6.3 Distribuição Binomial. Uma variável aleatória tem distribuição binomial quando o experimento ao qual está relacionada apresenta apenas dois resultados (sucesso ou fracasso). Este modelo fundamenta-se nas seguintes hipóteses: − n provas independentes e do mesmo tipo são realizadas; − cada prova admite dois resultados – Sucesso ou Fracasso; − a probabilidade de sucesso em cada prova é p e de fracasso 1-p = p ; Define-se a Variável X que conta o número de sucessos nas n realizações do experimento. (X pode assumir os valores 0, 1, 2, 3,..., n.). Fazendo sucesso corresponder a 1 fracasso, a 0, temos: − Para X = 0, uma seqüência de n zeros: 00000...000. − Para X = 1, uma seqüência do tipo: 1000...0; 01000...0; 001000...0; será n seqüência, cada uma com um único sucesso e n seqüência, cada uma com um único sucesso e n-1 fracassos: − Para X = x, tem-se x sucessos e (n-x) fracassos, correspondendo às seqüências com x algarismos 1 e n-x zeros. Cada seqüência terá probabilidade ��� � e como há � ����� � seqüências distintas, tem-se: � Média: � Variância: 6.4 Distribuição de Poisson. Consideremos a probabilidade de ocorrência de sucessos em um determinado intervalo. A probabilidade da ocorrência de um sucesso no intervalo é proporcional ao intervalo. A probabilidade de mais de um sucesso nesse intervalo é bastante pequena em relação à probabilidade de um sucesso. Seja X o número de sucessos no intervalo; temos, então: A distribuição de Poisson é muito usada na distribuição do número de: • Carros que passam por um cruzamento por minuto, durante certa hora do dia; • Erros tipográficos por página, em um material impresso; • Defeitos por unidade (m³, m², m, etc.) por peça fabricada; • Problemas de filas de espera em geral, e outros. � Média: � Variância: OBS: Muitas vezes, no uso da binomial, acontece que n é muito grande e p é muito pequeno. Podemos, então, fazer uma aproximação de binomial pela distribuição de Poisson, da seguinte forma: 6.5 Distribuição Geométrica. Consideremos tentativas sucessivas e independentes de uma mesmo experimento aleatório. Cada tentativa admite sucesso com probabilidade p e fracasso com probabilidade q; p + q = 1. Seja X: número de tentativas necessárias ao aparecimento do primeiro sucesso. Logo, X assumem os valores: X = 1, que corresponde ao sucesso (S) e P (X = 1) = p; X = 2, que corresponde ao fracasso (F) na 1ª tentativa e sucesso na segunda, (FS) e P (X = 2) = P (F ∩ S) = q·p; X = 3, que corresponde a (FFS) e P (X = 3) = P (F ∩ F ∩ S) = q · q · p = �� ∙ �; X = 4, que correspondea (FFFS) e P (X = 4) = �� ∙ �; E assim sucessivamente. X = x, que corresponde a FF ... FS = x, com função de probabilidade: ��� = �� = �� ∙ � A variável X tem então distribuição geométrica. � Média: ���� = 1� � Variância: ������ = ��� 6.6 Distribuição Hipergeométrica. Consideremos uma população com N elementos, dos quais r tem uma determinada característica (a retirada de um desses elementos corresponde ao sucesso). Retiramos dessa população, sem reposição, uma amostra de tamanho n. Seja X: número de sucessos na amostra (saída do elemento com a característica). Para sabermos a função de probabilidade, consideramos que podemos tirar �� � amostras sem reposição. Os sucessos na amostra podem ocorrer com ���� maneiras e fracassos de �� � �� modos. Logo: ��� = �� = � !��"# $#!��"$� , 0 ≤ � ≤ ' ) � ≤ �. A variável X assim definida tem distribuição hipergeométrica. � Média. E (X) = np � Variância. Var (X) = Np (1 – p) �� ��� �, onde � = ��. II. Variáveis aleatórias contínuas. 1. Definição. Variável aleatória contínua é uma variável aleatória X é contínua em R se existir uma função f(x), tal que: � f(x) ≥ 0 (não negativa); � * +���,� = 1- - . A função f(x) é chamada função densidade de probabilidade (f.d.p.). Observamos que: ��� ≤ � ≤ .� = * +���,�/0 (corresponde à área delimitada pela função f(x), eixo dos X e pelas retas X = a e X = b). Podemos estender todas as definições de variáveis aleatórias discretas para variáveis contínuas. Se X é uma variável aleatória contínua, então temos a média e a variância sendo: ���� = * � ∙ +���,�- - A média pode ser entendida como um “centro de distribuição de probabilidades”. E sua variância é dada por: ������ = ����� − 2����3�, onde ����� = * �� ∙ +���,�- - 2. Distribuição de variáveis aleatórias discretas. Distribuições contínuas são muito distintas das distribuições discretas. Nas distribuições discretas, as massas de probabilidade estão concentradas nos pontos de um conjunto enumerável. Assim, seja o experimento aleatório E com espaço amostral S e y uma variável aleatória com domínio S e imagem Sy. A distribuição de probabilidade de y é uma distribuição contínua se: P(y = w) = 0 para cada w ∈ Sy Ademais, se cada ponto tem probabilidade 0 então P(A) =0 sendo A qualquer subconjunto enumerável de Sy. A definição pode parecer paradoxal, mas, conceitualmente, é o mesmo que considerar, por exemplo, um intervalo não degenerado de números reais e cada ponto desse intervalo. O intervalo tem medida (comprimento) positiva enquanto que cada ponto tem medida (comprimento) nula. Como já enfatizado, as distribuições contínuas estão em total contraste com as distribuições discretas. Nas distribuições contínuas, a massa de probabilidade se dispersa continuamente sobre Sy enquanto que nas discretas ela se concentra nos pontos de massa. A figura abaixo ilustra a continuidade do espaço amostral e um evento desse espaço. 2.1 Distribuição Uniforme. Uma variável aleatória contínua X tem distribuição uniforme de probabilidades no intervalo [a,b] se sua f.d.p é dada por: +��� = 5 � 6) � ≤ � ≤ .0 6) � < � 89 � > . Onde o valor de k é: ;� ,� = 1/ 0 � = 1. − � Logo: +��� = < / 00 6) � < � 89 � > . 6) � ≤ � ≤ . A função de distribuição de X é dada por: +��� = ; 1. − ��0 ,6 = � − �. − � Logo: f(x) = = 0 6) � ≤ �� 0/ 0 6) � < � < .1 6) � ≥ . e seu gráfico é: � A média de X é dada por: E (X) = ? @ AB � A Variância de X é dada por: VAR (X) = �? A�²DB 2.2 Distribuição Exponencial. A distribuição exponencial é aplicada a dados com forte assimetria. Também é um caso especial da distribuição gama com λ= 1. Uma variável aleatória contínua X tem distribuição exponencial de probabilidade se sua f.d.p é dada por: +��� = EF ) G� 6) � ≥ 0H 6) � < 0 O gráfico da f.d.p de X é: A função de distribuição de X é: +��� = ; F ) GI�J ,6 = 1 − ) G� Logo : +��� = E1 − ) G� 6) � > 00 6) � ≤ 0 E o gráfico é: � A média da distribuição de X é dada por: E (x) = G � A Variância de X é dada por: VAR (X) = DK² 2.3 Distribuição Normal. É uma distribuição de probabilidade contínua, que é simétrica e a curva de freqüência em a forma de um sino, a média fica no centro da distribuição e o desvio padrão representa a forma da curva, mais pontiaguda ou mais achatada. Uma variável aleatória contínua X tem distribuição normal de probabilidade se a sua f.d.p é dada por: +��� = 1L√2O ) � P� − QL R ², ���� − ∞ < � < + ∞ O gráfico de f(x) é: As principais características dessa função são: a) O ponto máximo de f(x) é o ponto X = Q. b) Os pontos de inflexão da função são X = Q + L ) � = Q − L. c) A curva é simétrica com relação a Q. d) E (X) = Q e VAR (X) = L². Demonstra-se que * W√�X . ) Y� P� ZW R ²,� = 1 - - Se quisermos calcular a probabilidade indicada na figura, devemos fazer: ��� ≤ � ≤ .� = * W√�X . ) �[#\�²�]² ,�/0 , que representa um grau relativo de dificuldade. Usaremos a seguinte notação: X: N(Q, L²� X tem distribuição normal com média Q e variância L². Seja X: N(Q, L²�, definimos: Z= ^ ZW Demonstra-se que Z também tem distribuição normal. Z é chamada de Variável Normal Reduzida, Normal Padronizada ou Variável Normalizada. Mostraremos que E (Z) = 0 e VAR (Z) = 1 E (Z) = E5�� Z�W _ = WE(X- Q) = W 2���� − Q3 = 0 VAR (Z) = VAR5�� Z�W _ = W²VAR(X- Q) = W²VAR �X� = 1 Logo, se: X: N(Q, L²�, teremos Z : N(0,1) A f.d.p de Z é +�d� = √�X . ) e² �f , ���� − ∞ < d < + ∞ Essa curva é também simétrica com relação à Qe. Verificaremos agora a correspondência entre X e Z por meio de exemplo: Seja X: N(20,4). Achar os valores reduzidos correspondentes a � = 14, �� = 16, �� = 18, �g = 20, �h = 22, �i = 24 e �j = 26. Se X: N(20,4) 5Q = 20L = 2 ) Z = �� Z�W = ^ �J� a) � = 14 k = g �J� = -3 ∴ k = −3 b) �� = 16 k� = i �J� = -2 ∴ k� = −2 c) �� = 18 k� = n �J� = -1 ∴ k� = −1 d) �g = 20 kg = �J �J� = 0 ∴ kg = 0 e) �h = 22 kh = �� �J� = 1 ∴ kh = 1 f) �i = 24 ki = �g �J� = 2 ∴ kh = 2 g) �j = 26 kj = �i �J� = 3 ∴ kj = 3 Graficamente: opq pr gs tu �v is tu �v ns tu v�Js tu ��s tu@ v�wx yuz�{�|x yuz}{ opq pr �s t~ �v �s t~ �v s t~ vJs t~ s t~@ v�x y~z �{}x y~z }{ Concluímos que a variável Z indica quantos desvios padrões a variável X está afastada da média. Como as curvas são simétricas em relação às médias. � �Q − L ≤ � ≤ Q� = �� Q ≤ � ≤ Q + L� � �−1 ≤ k ≤ 0� = ��0 ≤ � ≤ 1� Também concluímos que se X: N(Q, L²�, então : � �� ≤ � ≤ ��� = ��k ≤ � ≤ k�� Pois: � �� ≤ � ≤ ��� = * W√�X . ) Y�P[#\] R²,�^�^Y e � �k ≤ � ≤ k��= * 1√2O . )−d² 2f ,d�Y onde k = ��1 Z�W e k�= ��2 Z�W 2.4 Distribuição do tipo Gama. Por ser um caso geral da distribuição exponencial e da distribuição qui-quadrado, a distribuição gama, à semelhança da distribuição normal, tem grande importância tanto na teoria estatística (como distribuição de probabilidade de estatísticas) quanto nas aplicações da metodologia estatística (como distribuição associada a populações estatísticas), fornecendo uma representação útil para muitas situações físicas. Como a soma de variáveis exponenciais independentes tem distribuição gama, torna-se adequada para a teoriados contadores aleatórios e outros processos estocásticos associados com o tempo, em particular, aqueles relativos às precipitações meteorológicas e aos estudos envolvendo tempos de vida de componentes. A distribuição gama é apropriada para modelar o tempo requerido para o acontecimento de exatamente α eventos independentes que ocorrem a uma taxa constante λ. Por exemplo, o tempo para falha de um sistema é uma variável gama se essa falha ocorre após exatamente α falhas menores, ocorrem independentemente a uma taxa constante λ. Essa característica torna a distribuição gama importante na modelagem estatística de problemas de fila, que trata com tempos em linhas de espera e tempos de serviço. Observa-se também que α e λ são parâmetros importantes no contexto. A distribuição gama é o caso geral de distribuições importantes, mas, ela própria, é um caso particular de outras famílias de distribuições. Mais especificamente, ela pertence à família exponencial ao tipo III da família personiana de distribuições e é também denominado como distribuição de Pearson tipo III. Em estudos hidrológicos é prática comum a utilização dessa distribuição para modelar o logaritmo da variável. Nesse caso, recebe o nome log-Pearson tipo III. A distribuição gama, na sua forma mais geral, possui três parâmetros: um parâmetro de deslocamento θ, um parâmetro de dispersão β e um parâmetro de formato β, todos positivos. Nesse caso, a indicação é: y ~ Gama (θ, β, α) A figura abaixo ilustra a distribuição para α = 2, β = 1 e θ = (0, 2, 4). A distribuição é nula no parâmetro de deslocamento e tem um único ponto de máximo em w = θ + β(α - 1). No caso de um parâmetro a moda ocorre em w = α - 1, com α ≥ 1. A distribuição gama pertence à família localização-dispersão. Desse modo, fazendo x = y - θβ , então: x ~ Gama (α) é a forma padrão da distribuição gama e resta apenas o parâmetro de formato. Se α ≤ 1 a distribuição tem o formato de um J invertido, ou seja, cresce indefinidamente quando w→0 e decresce mono tonicamente quando w → ∞. A figura que segue ilustra a forma padrão (θ = 0 e β = 1) para α = 1/3, 1/2, 1, 2, 4, 6. Outra forma comum inclui os parâmetros de dispersão e formato, ou seja, θ=0. Nesse caso, a distribuição é representada como: y ~ Gama (α , β) A figura que segue ilustra a distribuição gama com α = 2 e β = 2, 4, 6. Em algumas situações, ao invés do parâmetro de dispersão β, é utilizado o parâmetro de taxa λ=1/β. � Função de probabilidade: � Média: � Variância: 2. 5 Distribuição do tipo Qui-Quadrado. A distribuição qui-quadrado é uma distribuição contínua de grande importância para a inferência estatística. É uma distribuição que surge no contexto de somas de quadrados de variáveis aleatórias com distribuição normal. Uma variável qui-quadrado aparece em numerosas situações da inferência estatística: - Análise de tabelas de contingência. - Verificação da qualidade de ajustamento de modelos estatísticos e modelos probabilísticos aos dados estatísticos. - Serve como base para obtenção de outras distribuições relevantes da estatística clássica, como a distribuição F e a distribuição t. - Aproximação para muitos procedimentos de inferência na estatística não paramétrica. Uma variável qui-quadrado é a soma das variáveis aleatórias independentes com a distribuição normal padrão. Assim, a função de densidade da distribuição qui-quadrado pode ser obtida considerando-se a distribuição de q = z2, quando z ~ N(0,1), ou seja, quando z tem distribuição normal padrão. Posteriormente, pode-se considerar a distribuição de q = z12+z22 quando d ~���0,1�, j∈1:2 e, finalmente, quando � = ∑ d�∈ : quando d ~��N(0,1), j∈1: ν Nesse caso, diz-se que q tem distribuição qui-quadrado com ν graus de liberdade e representa-se como: q ~ χ2(ν) � Função probabilidade quando α = υ/2 e β = 2, com v > 0 inteiro: � Média: E(q) = ν � Variância: ������ = L�� = 2 Bibliografia FPR (Org.). Tipos de Variáveis. Disponível em: <http://leg.ufpr.br/~silvia/CE055/node8.html>. Acesso em: 04 dez. 2011. MATEMATIQUÊS, Portal. Variáveis (Dados) Quantitativas Contínuas e Discretas. Disponível em: <http://matematiques.sites.uol.com.br/pereirafreitas/1.3variaveisoudados.htm>. Acesso em: 04 dez. 2011. UNESA (Macaé). Conceitos fundamentais de estatística. Disponível em: <http://pt.scribd.com/doc/52871710/5/Variaveis-Continuas-e-Discretas>. Acesso em: 01 dez. 2011. CAMPOS, Geraldo Maia. Estatística Prática para Docentes e Pós-Graduandos. Disponível em: <http://www.forp.usp.br/restauradora/gmc/gmc_livro/gmc_livro_cap02.html>. Acesso em: 04 dez. 2011. BRASIL PARANÁ. Ricardo Ehlers. Ufpr (Org.). A lista de distribuições. Inferencia Estatistica. Disponível em: <http://leg.ufpr.br/~paulojus/CE210/ce210/node4.html>. Acesso em: 05 dez. 2011 SÃO PAULO. Sistema Galileu de Educação Estatística. Usp (Org.). Distribuições de Probabilidade: Distribuição contínua. Disponível em: <http://www.galileu.esalq.usp.br/mostra_curso.php?cod=13&pag=2&ct=272>. Acesso em: 05 dez. 2011. SÃO PAULO. Sistema Galileu de Educação Estatística. Usp (Org.). Distribuições de Probabilidade: Distribuição qui-quadrado. Disponível em: <http://www.galileu.esalq.usp.br/mostra_topico.php?cod=315>. Acesso em: 05 dez. 2011. SÃO PAULO. Sistema Galileu de Educação Estatística. Usp (Org.). Distribuições de Probabilidade: Distribuição gama. Disponível em: <http://www.galileu.esalq.usp.br/mostra_topico.php?cod=247>. Acesso em: 05 dez. 2011. RS. Rossana Fraga Benites. Pucrs. DISTRIBUIÇÕES CONTÍNUAS DE PROBABILIDADE: Distribuição Normal. Disponível em: <http://www.pucrs.br/famat/rossana/educacao2/Dist_Normal.pdf>. Acesso em: 05 dez. 2011. SÃO PAULO. Instituto de Ciências Atmosféricas. Usp. Distribuição Exponencial. Disponível em: <http://www.dca.iag.usp.br/www/material/morales/Climatologia1/Aula_6_Distribui%E 7%F5esdeProbabilidade_III_16-06-2010.pdf>. Acesso em: 05 dez. 2011. MORETTIN, Luiz Gonzaga. Estatística Básica - Volume 1: Probabilidade. 7. ed. São Paulo: Makron Books do Brasil, 1999. 210 p. CORREA, Sonia Maria Barros Barbosa. Probabilidade e Estatística. 2ª Belo Horizonte: Puc Minas Virtual, 2003. 210 p. Disponível em: <http://w.virtual.pucminas.br/0300>. Acesso em: 02 dez. 2011.
Compartilhar