Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 FGV/EPGE - Mestrado em Finanças e Economia Empresarial Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos ESTATÍSTICA Professor: Eduardo Campos • O Que é Estatística? DADOS INFORMAÇÃO ESTATÍSTICA: Estatística é a ciência que permite obter informações sobre um fenômeno, a partir do registro de observações deste fenômeno. A estatística divide-se em duas áreas: - Estatística Descritiva - Inferência Estatística Estatística Descritiva ou Análise Exploratória de Dados A estatística descritiva ocupa-se da análise/descrição de um conjunto de dados por intermédio de tabelas, gráficos e/ou medidas-resumo, com o objetivo de facilitar sua visualização e compreensão. Exemplo: Cálculo do coeficiente de rendimento (c.r.) = média ponderada das notas em cada disciplina medida-resumo do desempenho acadêmico de um aluno. Inferência Estatística ou Estatística Inferencial A inferência estatística consiste de um conjunto de técnicas para, a partir de uma amostra selecionada de um universo, formular conclusões para este universo. 2 FGV/EPGE - Mestrado em Finanças e Economia Empresarial Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos Exemplo: Pesquisa eleitoral estimação dos percentuais de intenções de voto em todo o universo eleitoral, a partir de uma amostra de, digamos, 2.000 pessoas. • Tipos de Dados Dados = matéria prima da estatística. A identificação da ferramenta estatística adequada para tratá-los depende da identificação correta do tipo dos dados. A seguir são apresentadas as tipologias mais importantes para classificar dados. 1 - Dados Primários x Secundários • Dados primários são aqueles obtidos de forma direta, mediante observação, pesquisas ou experimentos controlados. • Dados secundários são aqueles que não são obtidos diretamente, e sim mediante publicações (como relatórios ou artigos). 2 - Dados em Corte x Séries Temporais • Dados em corte (transversal) são aqueles referentes ao mesmo instante de tempo. • Dados de séries temporais são aqueles registrados ao longo de um período de tempo, com determinada frequência. Obs - Dados que possuem ambas as dimensões (de corte e de tempo) são denominados longitudinais ou em painel. • Dados em painel consistem no registro de informações ao longo do tempo para um conjunto de unidades em corte transversal. Também podem ser encarados como um conjunto de n séries temporais. 3 - Dados Qualitativos x Quantitativos • Dados qualitativos são aqueles que representam um atributo ou qualidade. Exemplos: profissão, gênero, raça, estado civil, classe social, nível de educação, etc. • Dados quantitativos são números que resultam de uma contagem ou medida. Exemplos: idade, peso, altura, renda, número de filhos, número de banheiros em casa, etc. 3 FGV/EPGE - Mestrado em Finanças e Economia Empresarial Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos 1. ESTATÍSTICA DESCRITIVA Exemplo 1.1 - Faturamento bruto no mês passado, em milhões de R$, das 30 filiais de uma determinada empresa de varejo: 11,8 3,6 16,6 13,5 4,8 8,3 8,9 9,1 7,7 2,3 12,1 6.1 10,2 8,0 11,4 6,8 9,6 19,5 15,3 12,3 8,5 15,9 18,7 11,7 6,2 11,2 10,4 7,2 5,5 14,5 Que conclusões você pode tirar? É disto que trata a estatística descritiva! Esses dados estão na chamada forma bruta, difícil de analisar diretamente. Precisamos usar técnicas adequadas para resumí-los ou facilitar sua visualização. A distribuição de frequências é uma tabela que agrupa os dados em classes (intervalos), indicando o número ou a proporção de observações que pertencem a cada uma das classes. Distribuição de Frequências As classes não precisam ter amplitudes iguais. • Distribuição de Frequências Absolutas Classe Frequência 2 | 5 3 5 | 8 7 8 | 11 7 11 | 14 7 14 | 17 4 17 | 20 2 Total: 30 A notação | significa que o extremo inferior da classe não está incluído, e o extremo superior está incluído! • Distribuição de Frequências Relativas Representa a proporção ou o percentual de observações que caem em cada classe. Classe Frequência Relativa 2 | 5 3/30 = 0,1 = 10% 5 | 8 = 7/30 ou 23,33% 8 | 11 23,33% 11| 14 23,33% 14 | 17 13,33% 17 | 20 6,67% Total: 1 = 100% 4 FGV/EPGE - Mestrado em Finanças e Economia Empresarial Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos O histograma é uma representação gráfica da distribuição de frequências. Como obter o histograma? Colocar as classes no eixo horizontal, as frequências no eixo vertical, e traçar um diagrama de barras. Histograma Histograma (Frequências Absolutas) - ex. 1.1: 0 2 4 6 8 10 2-|5 5-|8 8-|11 11-|14 14-|17 17-|20 Frequências Classes O histograma de frequências relativas tem o mesmo formato, com o eixo vertical modificado. • Gráfico de Barras Representação gráfica apropriada para variáveis que representam contagens. Consiste de barras verticais centradas nos valores assumidos pela variável, e com espaços separando as barras. Exemplo 1.2 Número de reclamações diárias x frequência em certo mês, no SAC de uma empresa: • Gráfico de Pizza ou de Setores O gráfico de pizza, ou de setores, é um diagrama estatístico bastante popular. É apropriado quando o objetivo é identificar partes de um todo. Exemplo 1.3: 5 FGV/EPGE - Mestrado em Finanças e Economia Empresarial Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos • Medidas de Posição Uma medida de posição é um valor em torno do qual os dados estão concentrados. Sinônimos: medida de localização ou de tendência central. Principais medidas de posição: Média , Mediana e Moda. É a soma das observações dividida pelo número de observações: Média . n x...xx n x n21 n 1i i i-ésima observação no de observações No exemplo 1.1, o faturamento médio é = 307,7/30 = 10,3 milhões. Nenhum problema! A média de um conjunto de dados não precisa ser um dos valores observados. Note que o valor 10,3 não ocorre. Exemplo 1.4: Salários de economistas recém-formados (em R$ 1.000): 2,8; 6,0; 2,6; 3,1; 3,0. Salário médio (destes 5 economistas): = 3,5 (R$ 3.500,00). Este número é representativo dos salários desses 5 economistas? R: Não, pois está bem acima de 4 dos 5 valores. Claramente, o valor responsável por esta distorção foi o “6,0”. O “6,0” é um valor atípico ou discrepante, tecnicamente denominado outlier. Conclusão: A média é uma medida de posição muito sensível à presença de outliers! Neste caso, é recomendável utilizar outra medida de posição, chamada mediana! 6 FGV/EPGE - Mestrado em Finanças e Economia Empresarial Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos É o valor Md que divide os dados ordenados em duas partes iguais. Se n for ímpar: Md = observação central. Se n for par: Md = média das duas observações centrais. Mediana Exemplo 1.4 (cont.): Salários ordenados: 2,6; 2,8; 3,0; 3,1; 6,0. Md = 3,0. Nota-se que 3,0 é mais representativo da posição ou tendência central dos salários. Obs - A mediana é uma medida de posição robusta ou resistente. O sentido é que ela resiste (mantém seu valor) na presença de outliers. Em algumas situações, nem a média nem a mediana serão medidas apropriadas. Exemplo 1.5 - O gerente de uma loja de calçados está interessado em saber qual tamanho de calçado ele deve priorizar na hora de planejar seu estoque,a partir dos tamanhos dos calçados vendidos no último mês. Qual a medida de posição adequada? A moda é o valor que ocorre com maior frequência em um conjunto de observações (notação: Mo). Moda Exercício 1.1 - As notas de uma turma foram: 9, 7, 8, 6, 3, 8, 7 e 8. Obtenha a média, a mediana e a moda das notas. Um conjunto de dados que possua 2 modas é chamado bimodal. Se possui mais de 2, multimodal. Se não possui moda, amodal. Embora as três medidas de posição apresentadas até aqui sejam as medidas de posição mais “populares”, existem algumas outras que também são importantes, apresentadas a seguir. 7 FGV/EPGE - Mestrado em Finanças e Economia Empresarial Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos Exemplo 1.6 - Em uma pequena empresa, os salários dos 12 funcionários estão distribuídos da seguinte forma: 5 ganham R$ 2.500,00; 2 ganham R$ 3.000,00; 3 ganham R$ 4.000,00; 2 ganham R$ 4.500,00. Calcule o salário médio dos funcionários desta empresa. A média ponderada, p, é definida como: . ... x...xx x k21 kk2211 k 1j j k 1j jj p Média Ponderada peso do j-ésimo valor distinto de x (no exemplo = frequência do j-ésimo salário) Resposta do exemplo 1.6: R$ 3.291,67. Obs - Média para Dados Agrupados Quando os dados estão disponíveis agrupados (na forma de uma distribuição de frequências), só é possível obter a média por aproximação. O que se faz é a média dos pontos médios das classes, ponderados por suas frequências. Classe Frequência 40 | 50 Kg 2 50 | 60 Kg 5 60 | 70 Kg 7 70 | 80 Kg 8 80 | 90 Kg 3 Exercício 1.2 - Obtenha o peso médio da população cuja distribuição de frequências é: Solução: (2*45 + 5*55 + 7*65 + 8*75 + 3*85)/25 = 67 Kg. A média geométrica g é definida da seguinte forma: Média Geométrica .x...xx n 1 n21g Exemplo 1.7 - Seja um investimento com taxas de retorno anuais de 10 e 20% nos anos 1 e 2, respectivamente. A média simples (aritmética) dos retornos é 15%. Isto poderia levar à impressão de que alguém que invista neste ativo por 2 anos obteria um retorno de 15% ao ano, uma conclusão totalmente equivocada. 8 FGV/EPGE - Mestrado em Finanças e Economia Empresarial Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos Para ilustrar, considere um capital de R$ 1000,00 investido no início do ano 1. Qual o valor capitalizado ao final dos 2 anos? 1.000*(1+R1)*(1+R2) = 1.000*1,1*1,2 = R$ 1.320,00. fator de capitalização no ano 1 fator de capitalização no ano 2 O retorno médio efetivo ou equivalente Req é o retorno por período que levaria ao mesmo valor final caso os retornos de todos os períodos fossem iguais. O fator de capitalização equivalente referente a n períodos é obtido por meio da média geométrica dos fatores de capitalização referentes à cada período: (1+Req) n = (1+R1)(1+R2)...(1+Rn) (1+Req) = [(1+R1)(1+R2)...(1+Rn)] 1/n E daí se obtém o Req. No exemplo 1.7: de tal forma que Req = 14,8913%. Interpretação: para obter o valor final de R$ 1.320,00 com a mesma taxa de retorno em cada ano, esta taxa teria que ser 14,8913%. ,148913,132,1)R1)(R1( )R1( 21eq • Medidas de Dispersão Frequentemente, uma medida de posição não fornece todas as informações de que precisamos para tomar uma certa decisão. Por exemplo, uma pessoa com metade do corpo em um forno, e a outra metade em um freezer, “na média” estará bem! Exemplo 1.8 - Dois fornecedores, A e B, apresentaram os seguintes prazos de entrega, referentes aos últimos 5 clientes (em dias): Fornecedor A – 18; 10; 17; 3; 2. Fornecedor B – 9; 10; 10; 9; 12. Com base nos prazos acima, qual dos fornecedores você escolheria: A ou B? 9 FGV/EPGE - Mestrado em Finanças e Economia Empresarial Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos Naturalmente, você escolheria o fornecedor B (menor risco inerente ao prazo de entrega). Uma forma mais completa de definir uma medida de dispersão é: valor que nos informa o quanto os dados variam em torno de uma medida de posição. A medida de dispersão mais simples é a amplitude total = máximo - mínimo. Seja (xi-) o desvio de xi em relação à média. Possíveis medidas de dispersão seriam: . n )x( ou )x( n 1i in 1i i Problema: sempre! ,0)x( n 1i i Solução: trabalhar com os módulos ou quadrados dos desvios! Variância (2) . n )x( n 1i 2 i 2 Exercício 1.2 - Seja um conjunto de 3 dados: x1 = 2, x2 = 5 e x3 = 8. Ache a variância. R: 6. É a média dos quadrados dos desvios: Forma alternativa para o cálculo de 2: . n x n nx 2 n 1i 2 i 2 n 1i 2 i 2 A variância apresenta um sério problema: ela é expressa no quadrado da unidade original, em geral uma unidade que sequer faz sentido. Como consequência, a variância não possui interpretação direta. Por esta razão o desvio padrão, apresentado a seguir, é adotado com maior frequência. Desvio Padrão () .2 O desvio padrão preserva a unidade original dos dados (no exemplo, é expresso em dias). Adicionalmente, se os dados são gerados por uma distribuição Normal de probabilidade, ele possui interpretação direta (capítulo 5). 10 FGV/EPGE - Mestrado em Finanças e Economia Empresarial Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos • Aplicação em Análise de Investimentos É usual analisar a média e o desvio padrão dos retornos (variações de preço) de um ativo. Neste contexto, o desvio padrão é uma medida do risco do ativo, chamada volatilidade. RETORNOS DIÁRIOS DE 2 AÇÕES -8 -6 -4 -2 0 2 4 6 8 10 12 1 5 9 1 3 1 7 2 1 2 5 2 9 3 3 3 7 4 1 4 5 4 9 DIAS Ação A Ação B Exemplo 1.9: Em compensação, a flutuação dos retornos da ação B é bem maior maior risco. A curva mais clara (ação B) oscila em torno de um patamar superior àquele em torno do qual oscilam os retornos da ação A. Quando queremos comparar dados expressos em diferentes unidades ou magnitudes, o uso do desvio padrão leva a conclusões equivocadas, sendo necessário utilizar uma outra medida chamada coeficiente de variação. Coeficiente de Variação (CV) Exemplo 1.10 - Suponha que estejamos interessados em estudar a variabilidade de salários em diferentes ramos de atividade profissional. Como um caso extremo, considere a comparação entre salários de gerentes e de auxiliares de escritório. Sabe-se que o salário médio dos gerentes é de R$ 5.000,00 e o dos auxiliares de escritório é de R$ 500,00. O desvio padrão dos salários dos gerentes foi igual ao dos salários dos auxiliares de escritório, ambos iguais a 100. Isto indica variabilidade alta ou baixa? No caso dos auxiliares de escritório, cujos salários estão em torno de R$ 500,00, é alta. Já para os gerentes, cujos salários estão em torno de R$ 5.000,00, é relativamente baixa. .CV CV dos salários dos auxiliares de escritório: 100/500 = 0,2 ou 20%. CV dos salários dos gerentes: 100/5.000 = 0,02 ou 2% dispersão relativa menor. Fórmula do Coeficiente de Variação: 11 FGV/EPGE - Mestrado em Finanças e Economia Empresarial Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos Propriedades do Coeficiente de Variação: 1 - É adimensional, isto é, não é expresso em nenhuma unidade de medida. 2 - É uma medida de dispersão relativa. 3 - CV pequeno = dados homogêneos e CV grande = dados heterogêneos. • Outras Medidas Importantes Medidas de posição e dispersão são importantes, mas não exaustivas para representar um conjunto de dados. Estudaremos a seguir os conceitos de assimetria, curtose e percentis. A assimetria é uma medida do quanto adistribuição dos dados está afastada de um aspecto simétrico em relação ao eixo central. Se a metade esquerda da curva é um “espelho” da metade direita, dizemos que os dados são simétricos. Caso contrário, que são assimétricos. Assimetria esta distribuição é simétrica esta distribuição apresenta assimetria positiva ou à direita esta distribuição apresenta assimetria negativa ou à esquerda A figura a seguir ilustra as três possibilidades, e respectivas relações entre as medidas de posição: A curtose é uma medida do “achatamento” da distribuição dos dados. aspecto achatado, com valores distribuídos de modo uniforme aspecto pontiagudo, com valores concentrados em um intervalo estreito e caudas mais pesadas referência Curtose O p-ésimo percentil ou percentil p de um conjunto de dados é o valor x tal que p% dos dados são menores ou iguais a x. Os percentis 25, 50 e 75 são chamados quartis: 250 Percentil = primeiro quartil (Q1) 500 Percentil = segundo quartil (Q2) = mediana 750 Percentil = terceiro quartil (Q3). Percentis (ou Quantis) 12 FGV/EPGE - Mestrado em Finanças e Economia Empresarial Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos Quartis São medidas Q1, Q2 e Q3 que dividem os dados em 4 partes iguais. É uma medida de dispersão dada pela diferença entre o terceiro e o primeiro quartis: Q = Q3 – Q1. • Amplitude Interquartílica Obs - não confundir com amplitude total = valor máximo - valor mínimo. É um diagrama que representa: - a mediana, - os quartis Q1 e Q3, - uma linha que vai de Q3 até a maior observação menor ou igual a LS = Q3+1,5Q, - outra linha que vai de Q1 até a menor observação maior ou igual a LI = Q1-1,5Q. . Box-Plot Exemplo 1.11 - Seja o seguinte conjunto de dados (ordenado): 5, 10, 12, ... , 37, 42, 45. Sabendo-se que os quartis são 20, 25 (mediana) e 28, obtenha o box-plot. Aplicações do Box-Plot 1. Comparar dispersões (via amplitudes interquartílicas) de dois conjuntos de dados. 2. Identificar a presença de assimetria (e o tipo dela – se é positiva ou negativa). Como detectar e identificar o tipo de assimetria? A partir das distâncias da mediana aos quartis. Se a mediana está mais próxima de Q1, os dados apresentam assimetria positiva. Se a mediana está mais próxima de Q3, os dados apresentam assimetria negativa. Uma distância igual entre a mediana e cada um dos quartis é condição necessária para simetria. 13 FGV/EPGE - Mestrado em Finanças e Economia Empresarial Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos Aplicações do Box-Plot (cont.) 3. Detectar a presença de outliers: Valores acima de LS são outliers (superiores) Valores abaixo de LI são outliers (inferiores) Os outliers costumam ser assinalados com *. Exercício 1.3 - As idades das mulheres com 40 anos ou mais, em uma localidade, apresentam Q1 = 49, Md = 54 e Q3 = 63. A mais velha tem 71 anos. Obtenha o box-plot. Solução: • Análise Bidimensional É a análise estatística que envolve 2 variáveis. Por exemplo: 1) gasto com alimentação e renda 2) nota em uma prova e horas de estudo 3) vendas e investimento em publicidade etc. Um diagrama de dispersão é um gráfico de pontos {(xi,yi); i = 1,2,...,n} que indica se parece ou não existir alguma relação entre 2 variáveis X e Y, e identificar qual o tipo desta relação. Diagrama de Dispersão cada ponto desses representa o valor de X e de Y para a i-ésima observação A covariância é uma medida da variabilidade conjunta de X e Y. Fórmula: Covariância . n yx n )y)(x( YX n 1i ii n 1i YiXi XY A covariância evidencia o sentido da relação entre as variáveis, mas o interesse maior costuma ser medir a força desta associação. No caso de relações lineares (isto é, aquelas que são bem representadas por uma reta), o coeficiente de correlação resolve o problema. 14 FGV/EPGE - Mestrado em Finanças e Economia Empresarial Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos O coeficiente de correlação é um número entre -1 e 1, que mede a força da associação linear entre X e Y. Fórmula: Coeficiente de Correlação . YX XY XY Interpretação do Coeficiente de Correlação: - Se a relação linear entre X e Y for positiva e perfeita, a correlação é igual a 1. - Se a relação linear entre X e Y for negativa e perfeita, a correlação é igual a -1. - Se não houver relação linear: o valor do coeficiente de correlação é zero. Obs - Correlação x Independência! É importante frisar que a correlação mede apenas a força de uma associação linear, não fornecendo informação acerca de relações de dependência não lineares. Por exemplo, se Y = X2, XY = 0, porém as variáveis são dependentes. Se a relação linear entre X e Y for positiva, mas não perfeita, a correlação está entre 0 e 1. Neste caso, quanto maior a intensidade da associação, mais próximo XY está de 1. Por exemplo, um coeficiente de correlação igual a 0,95 indica uma relação linear positiva e forte entre X e Y. Se a relação linear entre X e Y for negativa, mas não perfeita, a correlação está entre -1 e 0. Neste caso, quanto maior a intensidade da associação, mais próximo XY está de -1. Por exemplo, um coeficiente de correlação igual a -0,1 indica uma relação linear negativa e fraca entre X e Y. Resumo das Propriedades do Coeficiente de Correlação: 1 - varia entre -1 e 1 2 - é adimensional (não possui unidade) 3 - representa a força da relação linear (apenas) entre 2 variáveis. Obs - correlação x causalidade. 15 FGV/EPGE - Mestrado em Finanças e Economia Empresarial Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos 2. PROBABILIDADE (CONCEITOS E LEIS BÁSICAS) Os 3 conceitos fundamentais da teoria da probabilidade são os seguintes: 1 - Experimento Aleatório 2 - Espaço Amostral 3 - Evento. Cada um deles é apresentado e exemplificado a seguir. Notas de Aula - Professor Eduardo Lima Campos. Um experimento aleatório é uma ação cujo resultado não pode ser previsto. Exemplos: 2.1 - Lançar um dado e observar a face que fica voltada para cima. 2.2 - Selecionar uma bolinha de uma urna com bolinhas vermelhas e azuis e verificar sua cor. Experimento Aleatório Embora o resultado de um experimento aleatório não possa ser pré-determinado, é possível descrever o conjunto dos resultados que podem ocorrer. Este conjunto é chamado espaço amostral. Notas de Aula - Professor Eduardo Lima Campos. O espaço amostral associado a um experimento aleatório é o conjunto de todos os seus possíveis resultados. Notação: S. No exemplo 2.1 – S = {1,2,3,4,5,6}. No exemplo 2.2 – S = {´azul`,´vermelha`}. Espaço Amostral Um evento é um subconjunto do espaço amostral. No exemplo 2.1, alguns possíveis eventos são: A = ´face par` = {2,4,6}; B = ´face>3` = {4,5,6}; C = ´face=2` = {2}. Evento Notas de Aula - Professor Eduardo Lima Campos. 16 FGV/EPGE - Mestrado em Finanças e Economia Empresarial Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos Um evento ocorre quando o resultado do experimento é um ponto que pertence a ele. Exemplos com os eventos do slide anterior: Se a face observada foi o 5, dizemos que B ocorreu, Se a face observada foi o 4, dizemos que A e B ocorreram, e assim por diante... • União e Interseção de Eventos No exemplo 2.1, considere os eventos: A: ´Face par` = {2,4,6} B: ´Face > 3` = {4,5,6} Notas de Aula - Professor Eduardo Lima Campos. O evento´A ou B ocorre` é dado pela união do evento A com o evento B. AB = {2,4,5,6}. Notas de Aula - Professor Eduardo Lima Campos. O evento ´A e B ocorrem` é dado pela interseção do evento A com o evento B. AB = {4,6}. Seja A um evento definido em um espaço amostral S. A probabilidade de A, denotada por P(A), é uma função que satisfaz a 3 Axiomas, os quais são apresentados a seguir. Probabilidade – Definição Propriedades da Probabilidade: 1) 0 P(A) 1, p/ todo A definido em S. 2) P(S) = 1. 3) P(AB) = P(A) + P(B), se AB = . Axiomas da Probabilidade quanto mais perto de 1, maior a probabilidade de que A ocorra. este é um evento especial, chamado evento certo. O Axioma 3 pode ser generalizado para mais de 2 eventos. Por exemplo, P(ABC) = P(A)+P(B)+P(C), se os 3 pares possíveis têm interseções vazias. • Eventos Especiais e suas Probabilidades O espaço amostral S é o evento certo, cuja probabilidade é 1 (Axioma 2). O conjunto (vazio) é o evento impossível, cuja probabilidade é 0. O evento composto de todos os pontos não favoráveis a A é chamado evento complementar de A e denotado por Ac. Sua probabilidade é: P(Ac) = 1-P(A). 17 FGV/EPGE - Mestrado em Finanças e Economia Empresarial Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos • Atribuição de Probabilidades Se os elementos do espaço amostral são todos equiprováveis, a probabilidade de um evento A é obtida da seguinte forma: S# A# )A(P casos favoráveis ao evento A casos possíveis Exemplo 2.3 - Seja o experimento: lançar 3 moedas e observar as faces voltadas para cima. Seja: ´CA` = cara e ´CO` = coroa. O espaço amostral associado a este experimento aleatório é: S = {(CA,CA,CA);(CA,CA,CO); (CA,CO,CA);(CO,CA,CA);(CA,CO,CO); (CO,CA,CO);(CO,CO,CA);(CO,CO,CO)}, totalizando #S = 8 casos possíveis. Seja o evento: A = ´2 caras`. Obtenha a probabilidade de A. Solução: #A = 3 casos favoráveis. A = {(CA,CA,CO);(CA,CO,CA);(CO,CA,CA)} . 8 3 S# A# )A(P Obs - A abordagem anterior para obter probabilidades é chamada clássica. Existem duas outras abordagens: Abordagem Frequentista: A probabilidade de um evento A é a frequência relativa de ocorrência de A, quando o experimento aleatório é repetido muitas vezes (n). Notas de Aula - Professor Eduardo Lima Campos. Abordagem Subjetivista: baseada na opinião de especialistas. Sejam A e B dois eventos, com interseção AB. Qual a probabilidade de AB? (ou seja, de que A ou B ocorram) P(AB) = P(A) + P(B) - P(AB) Lei da Adição (Probabilidade do ´OU`) A Lei da Adição fornece a solução deste problema, por meio da seguinte fórmula: Notas de Aula - Professor Eduardo Lima Campos. Exemplo 2.4 - Um aluno estuda para um exame por 2 livros. O primeiro aborda 30% do programa. O segundo, 28%. 24% do programa é abordado pelos dois livros. Qual a probabilidade de que determinado tópico do programa esteja em pelo menos um dos dois livros utilizados pelo aluno? Notas de Aula - Professor Eduardo Lima Campos. 18 FGV/EPGE - Mestrado em Finanças e Economia Empresarial Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos Solução: Seja A = ´tópico estar no primeiro livro` e B = ´tópico estar no segundo livro`. Pede-se P(AB). São dados no enunciado: P(A) = 0,30, P(B) = 0,28 e P(AB) = 0,24. Aplicando a Lei da Adição: P(AB) = 0,30 + 0,28 – 0,24 = 0,34. Notas de Aula - Professor Eduardo Lima Campos. • Leis de DeMorgan AcBc = (AB)c AcBc = (AB)c Exemplo 2.4 (cont.) - Calcule a probabilidade de que o conteúdo não esteja em nenhum dos dois livros. 2 eventos A e B são mutuamente exclusivos (ou disjuntos) se a ocorrência de um impede a ocorrência do outro. Se B ocorre, então A não ocorre, e vice-versa. Em outras palavras, são aqueles que não possuem pontos em comum, ou seja: AB = , o que implica P(AB) = 0. Eventos Mutuamente Exclusivos Notas de Aula - Professor Eduardo Lima Campos. Exemplo 2.5 - Distribuição por sexo dos funcionários promovidos em uma empresa: Promovidos Não-Promovidos Total Masc. 46 184 230 Fem. 8 72 80 Total 54 256 310 Notas de Aula - Professor Eduardo Lima Campos. Responda as perguntas a seguir. a) Qual a probabilidade de um funcionário ser do sexo masculino e ter sido promovido? Solução: sejam os eventos: A = ´ter sido promovido` e B = ´ser do sexo masculino`. Diretamente da tabela, temos que 46 indivíduos satisfazem ambas as condições. Assim: P(AB) = 46/310 = 0,1483. O que está sendo pedido é a probabilidade (condicional) de A dado B, denotada por P(A|B). b) Qual a probabilidade de um funcionário do sexo masculino ter sido promovido? Notas de Aula - Professor Eduardo Lima Campos. Obs - Perceba a diferença entre P(A|B) e P(AB). Esta é uma confusão comum! 19 FGV/EPGE - Mestrado em Finanças e Economia Empresarial Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos Promovidos Não-Promovidos Total Masc. 46 184 230 Fem. 8 72 80 Total 54 256 310 A idéia é que somente os casos favoráveis ao evento condicionante (B = ´ser do sexo masculino`) passam a ser os casos possíveis. Notas de Aula - Professor Eduardo Lima Campos. A probabilidade de A dado B é, portanto, 46/230 = 0,2. Se dividirmos numerador e denominador acima pelo total de funcionários (310), obtemos P(A|B) em função de P(AB) e P(B), conforme apresentado a seguir. Notas de Aula - Professor Eduardo Lima Campos. Sejam 2 eventos A e B, tais que P(B)>0. A probabilidade de A dado B é: P(A|B) = P(AB)/P(B). Probabilidade Condicional Notas de Aula - Professor Eduardo Lima Campos. R: 2/3. Exemplo 2.6 - Considere novamente o exemplo 2.1, e sejam os eventos: A: ´Face par` e B: ´Face > 3`. a) Calcule P(A|B). 2 eventos são independentes se a ocorrência de um não interfere na probabilidade de ocorrência do outro. Ou seja, se: P(A|B) = P(A). Eventos Independentes Notas de Aula - Professor Eduardo Lima Campos. Exemplo 2.6 (cont.) - b) A: ´face par` e B: ´face > 3` são eventos independentes? R: não, pois P(A|B) P(A). Notas de Aula - Professor Eduardo Lima Campos. Obs - Não confunda eventos independentes com eventos mutuamente exclusivos! 20 FGV/EPGE - Mestrado em Finanças e Economia Empresarial Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos Exemplo 2.7 - Em uma classe, os percentuais de aprovados em álgebra e literatura são, respectivamente, 75% e 84%. 63% são aprovados em ambas as disciplinas. a) Qual a probabilidade de um aluno ter passado em álgebra ou em literatura? b) Se um aluno passou em literatura, qual a probabilidade de ter passado em álgebra? c) Ter passado em álgebra e ter passado em literatura são eventos independentes? Notas de Aula - Professor Eduardo Lima Campos. Solução: Sejam A = ´ter passado em álgebra` e B = ´ter passado em literatura`. a) P(AB) = P(A) + P(B) - P(AB) = 0,75 + 0,84 – 0,63 = 0,96. b) P(A|B) = P(AB)/P(B) = 0,75. c) Sim, pois P(A|B) = P(A) = 0,75. Notas de Aula - Professor Eduardo Lima Campos. Exemplo 2.8 - Seja uma urna com 8 bolinhas azuis e 4 vermelhas. 2 bolinhas são selecionadas ao acaso desta urna. a) Qual a probabilidade de que a primeira bolinha retirada da urna seja vermelha e que a segunda seja azul? Seja A = segunda bolinha azul e B = primeira bolinha vermelha. Queremos P(AB). Notas de Aula - Professor Eduardo Lima Campos. Para revolver o problema, basta inverter a fórmula da probabilidade condicional para obter P(AB) como função de P(A|B) e P(B). P(A|B) = P(AB)/P(B). P(AB) = P(A|B)P(B). Notas de Aula - ProfessorEduardo Lima Campos. Sejam A e B dois eventos, com P(B)>0. Qual a probabilidade de que A e B ocorram? Lei da Multiplicação (Probabilidade do ´E`) A Lei da Multiplicação fornece a solução deste problema, por meio da fórmula a seguir: P(AB) = P(A|B)P(B) Solução do exemplo 2.8, item a: A = segunda bolinha azul e B = primeira bolinha vermelha. Do enunciado, temos que: P(A|B) = 8/11 e P(B) = 4/12. Assim: P(AB) = 8/33. Notas de Aula - Professor Eduardo Lima Campos. 21 FGV/EPGE - Mestrado em Finanças e Economia Empresarial Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos Diagrama de Árvore: B Bc A A Ac Ac P(B) P(Bc) P(A|B) P(Ac|B) P(A|Bc) P(Ac|Bc) Notas de Aula - Professor Eduardo Lima Campos. • Evento AB no Diagrama de Árvore: B Bc A A Ac Ac P(B) P(Bc) P(A|B) P(Ac|B) P(A|Bc) P(Ac|Bc) Notas de Aula - Professor Eduardo Lima Campos. • Forma-Produto para Independência Vimos que, pela Lei da Multiplicação: P(AB) = P(A|B)P(B). Por outro lado, vimos que 2 eventos A e B são independentes se: P(A|B) = P(A). Pode-se concluir que A e B são independentes se: P(AB) = P(A)P(B). Notas de Aula - Professor Eduardo Lima Campos. Exercício 2.1 - Sejam 2 eventos A e B tais que P(A) = 0,3 e P(AB) = 0,5. Determine o valor de P(B) se: a) A e B são mutuamente exclusivos. b) A e B são independentes. Respostas: a) 0,2. b) 2/7. Exemplo 2.8 (cont.) b) Qual a probabilidade de que a segunda bolinha selecionada seja azul? Considere novamente: A = segunda bolinha azul e B = primeira bolinha vermelha. Notas de Aula - Professor Eduardo Lima Campos. • Evento A no Diagrama de Árvore B Bc A A Ac Ac P(B) P(Bc) P(A|B) P(Ac|B) P(A|Bc) P(Ac|Bc) Notas de Aula - Professor Eduardo Lima Campos. 22 FGV/EPGE - Mestrado em Finanças e Economia Empresarial Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos Sejam A e B dois eventos, em que A possa ocorrer condicionado a B ou a Bc. A probabilidade “total” do evento A pode ser calculada por meio da seguinte fórmula: P(A) = P(A|B)P(B) + P(A|Bc)P(Bc) Lei da Probabilidade Total Notas de Aula - Professor Eduardo Lima Campos. Solução do exemplo 2.8, item b: Do enunciado, temos que: P(A|B) = 8/11, P(B) = 4/12, P(A|Bc) = 7/11 e P(Bc) = 8/12. Assim: P(A) = 2/3. Notas de Aula - Professor Eduardo Lima Campos. Exemplo 2.9 - A empresa X lança um serviço inédito de envio de mensagens pelo celular. Ela calcula que este novo serviço gera lucro no primeiro ano com probabilidade 0,6, caso o concorrente não introduza um serviço semelhante. Caso contrário, a probabilidade de lucro é 0,3. Suponha ainda que exista 50% de chances de que o concorrente introduza um serviço semelhante naquele ano. Uma dica aqui é começar identificando os possíveis eventos de interesse, e as probabilidades fornecidas no enunciado: A: ´serviço é lucrativo p/ a empresa X` B: ´concorrente introduz serviço semelhante`. São fornecidas no enunciado as seguintes probabilidades: P(A|B) = 0,3; P(A|Bc) = 0,6 e P(B) = 0,5. a) Qual a probabilidade de que o concorrente introduza o serviço e que, mesmo assim, ele seja lucrativo para a empresa X? b) Qual a probabilidade de que o serviço seja lucrativo para a empresa X? c) Qual a probabilidade de que o serviço seja lucrativo para a empresa X ou o concorrente introduza o serviço? Solução: a) Pela Lei da Multiplicação, temos que: P(AB) = P(A|B)P(B) = 0,3*0,5 = 0,15. b) Pela Lei da Probabilidade Total: P(A) = P(A|B)P(B) + P(A|Bc)P(Bc) = 0,3*0,5 + 0,6*0,5 = 0,45. c) Pela Lei da Adição: P(AB) = P(A) + P(B) – P(AB) = 0,45 + 0,5 – 0,15 = 0,8. 23 FGV/EPGE - Mestrado em Finanças e Economia Empresarial Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos Exemplo 2.10 - 2 máquinas (M1 e M2) são usadas para fabricar o mesmo tipo de item. Suponha que: 60% dos itens tenham sido fabricados por M1, 40% dos itens tenham sido fabricados por M2, e que: 1% dos itens fabricados por M1 têm defeito, 2% dos itens fabricados por M2 têm defeito. Notas de Aula - Professor Eduardo Lima Campos. Um item é selecionado aleatoriamente. a) Qual a probabilidade de que ele seja defeituoso? Notas de Aula - Professor Eduardo Lima Campos. Os eventos de interesse são: Sejam A = ´ser defeituoso` e B = ´ter sido produzido por M1`. São fornecidas no enunciado as seguintes probabilidades: P(B) = 0,6, P(Bc) = 0,4, P(A|B) = 0,01 e P(A|Bc) = 0,02. Notas de Aula - Professor Eduardo Lima Campos. Solução do item a: Pede-se P(A) Aplicando a Lei da Probabilidade Total: P(A) = P(A|B)P(B) + P(A|Bc)P(Bc) = 0,01*0,6 + 0,02*0,4 = 0,014. Notas de Aula - Professor Eduardo Lima Campos. b) Se (= dado que) o item selecionado é defeituoso, qual a probabilidade de que ele tenha sido produzido por M1? Notas de Aula - Professor Eduardo Lima Campos. Solução do item b: pede-se P(B|A), que pode ser obtida da seguinte forma: P(B|A) = P(AB)/P(A) = P(A|B)P(B)/P(A) = 0,01*0,6/0,014 = 0,429. A fórmula acima, que permite obter P(B|A) a partir de P(A|B) é chamada Teorema de Bayes. Notas de Aula - Professor Eduardo Lima Campos. 24 FGV/EPGE - Mestrado em Finanças e Economia Empresarial Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos Sejam A e B eventos definidos em S, sendo A dependente de B, na sequência: B A. O Teorema de Bayes (p/ 2 eventos) se ocupa da sequência reversa: A B, fornecendo: Teorema de Bayes . )A(P )B(P)B|A(P )A|B(P obtida pela Lei da Probabilidade Total Notas de Aula - Professor Eduardo Lima Campos. Exemplo 2.11 - Um candidato que cursou o MFEE tem probabilidade 0,9 de ser selecionado para uma vaga em um cargo gerencial. Caso contrário, esta probabilidade é de apenas 0,3. 70% dos candidatos cursaram o MFEE. a) Calcule a probabilidade de que um candidato ao acaso seja selecionado para a vaga. Os eventos de interesse são: A = ´ser selecionado` B = ´ter cursado o MFEE`. São fornecidas no enunciado as seguintes probabilidades: P(A|B) = 0,9, P(A|Bc) = 0,3 e P(B) = 0,7. Notas de Aula - Professor Eduardo Lima Campos. Solução do Item a: Pede-se P(A). Aplicando a Lei da Probabilidade Total: P(A) = P(A|B)P(B) + P(A|Bc)P(Bc) = 0,9*0,7 + 0,3*0,3 = 0,72. Notas de Aula - Professor Eduardo Lima Campos. Exemplo 2.11 (cont.) b) Se um candidato foi selecionado para a vaga, qual a probabilidade de que ele tenha cursado o MFEE? Solução do Item b: Pede-se P(B|A) P(B|A) = P(A|B)P(B)/P(A) = 0,9*0,7/0,72 = 0,875. Notas de Aula - Professor Eduardo Lima Campos. O Teorema de Bayes pode ser ampliado para mais de 2 Eventos, fazendo, por exemplo: B1, B2 e B3, ao invés de B e B c. 25 FGV/EPGE - Mestrado em Finanças e Economia Empresarial Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos • Teorema de Bayes para 3 Eventos Exemplo 2.12 - Os funcionários de uma empresa dividem-se em 3 grupos: economistas, engenheiros e analistas de sistemas. Estes funcionários podem ocupar cargos técnicos ou gerenciais. Sabemos que 20% dos funcionários são analistas de sistemas, 30% são engenheiros e 50% são economistas. 1% dos analistas de sistemas, 2% dos engenheiros e 3% dos economistas fazem parte da direção da empresa. Um funcionário é selecionado aleatoriamente. a) Qual a probabilidade de que ele seja um dos diretores da empresa? b) Dado que ele é um dos diretores, qual a probabilidade de que seja engenheiro? Os eventos de interesse são: A = ser diretor da empresa B1 = ser analista B2 = ser engenheiro B3 = ser economista. São fornecidasno enunciado as seguintes probabilidades: P(B1) = 0,2, P(B2) = 0,3, P(B3) = 0,5, P(A|B1) = 0,01, P(A|B2) = 0,02, P(A|B3) = 0,03. Solução do Item a - Ampliando a Lei da Probabilidade Total para 3 eventos: P(A) = P(A|B1)P(B1) + P(A|B2)P(B2) + P(A| B3)P(B3) = 0,01*0,2 + 0,02*0,3 + 0,03*0,5 = 0,002 + 0,006 + 0,015 = 0,023. Solução do Item b: P(B2|A) = P(A|B2)P(B2)/P(A) = 0,02*0,3/0,023 = 0,2609. • Lei da Adição para 3 Eventos P(ABC) = P(A) + P(B) + P(C) - P(AB) - P(AC) - P(BC) + P(ABC). • Lei da Multiplicação para 3 Eventos P(ABC) = P(A|BC)P(B|C)P(C). • Independência para 3 Eventos P(ABC) = P(A)P(B)P(C), P(AB) = P(A)P(B), P(AC) = P(A)P(C), e P(BC) = P(B)P(C). 3 eventos A, B e C são independentes se, e somente se: 26 FGV/EPGE - Mestrado em Finanças e Economia Empresarial Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos 3. VARIÁVEIS ALEATÓRIAS Uma variável aleatória (v.a.) é uma representação numérica dos resultados possíveis de um experimento aleatório. Variável Aleatória (V.A.) Exemplo 3.1 - Seja o experimento do exemplo 2.3 (lançar três moedas e observar o número de caras). A v.a. adequada é: X = número de caras observadas. S (espaço amostral): (CO,CO,CO) 0 (CA,CO,CO) (CO,CA,CO) 1 (CO,CO,CA) (CA,CA,CO) 2 (CA,CO,CA) (CO,CA,CA) 3 (CA,CA,CA) Valores de X: • V.A.`s Discretas x Contínuas A v.a. do exemplo anterior assume valores contáveis. Este tipo de v.a. é chamada discreta. Uma v.a. que assuma valores em um intervalo contínuo é chamada contínua. • Distribuição de Probabilidade Representa como as probabilidades distribuem-se de acordo com os valores de X. Notação: Para a v.a. em si X (maiúscula). Para os valores de X x (minúscula). É uma função P(X=x) que associa, a cada valor possível x de uma v.a. discreta X, a sua probabilidade. Distribuição de Probabilidade Discreta Propriedades de uma distribuição discreta: x 1)xX(P )2 x,0)xX(P )1 27 FGV/EPGE - Mestrado em Finanças e Economia Empresarial Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos Exemplo 3.2 - Na situação do exemplo 3.1, qual a distribuição de probabilidade de X? Solução - a distribuição de probabilidade de X é: x P(X=x) 0 1/8 1 3/8 2 3/8 3 1/8 Uma distribuição contínua f(x) é uma função que permite calcular a probabilidade de que uma v.a. contínua pertença a um intervalo. P(aXb) é a área sob o gráfico de f(x) que corresponde ao intervalo [a,b]. Distribuição de Probabilidade Contínua (Função de Densidade) Exemplo 3.3 - Seja X = peso de um carregamento em Kg, com distribuição: A figura mostra: P(6.000X8.000). f(x) x O cálculo desta área envolve uma integral: 000.8 000.6 dx)x(f Propriedades de uma função de densidade: 1) f(x) 0, para todo x. 2) A área total sob o gráfico é igual a 1. 3) P(X=x) = 0, para todo x. Exemplo 3.4 - Seja X uma v.a. contínua com a seguinte distribuição: f(x) = cx2, 0<x<2. a) Qual o valor da constante c? b) Calcule P(X>1). Você tem que igualar a integral a 1. R: a) 3/8 b) 7/8. O valor esperado de uma v.a. X, E(X), é a média dos valores que X assumiria em infinitas repetições do experimento. Fórmula para o caso discreto: Valor Esperado de uma V.A. .)xX(xP)X(E x 28 FGV/EPGE - Mestrado em Finanças e Economia Empresarial Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos Exemplo 3.5 - Considere a distribuição: P(X=0) = 1/2 P(X=1) = 1/3 P(X=2) = 1/6. Calcule o valor esperado de X. Solução: E(X) = 0*1/2 + 1*1/3 + 2*1/6 = 2/3. Observações: 1 - E(X) é também chamado média de X. 2 - E(X) não é um valor que se espera que ocorra, podendo ser (e em geral é) um valor que não ocorre, como neste caso! 3 - E(X) pode ser interpretado como o ponto de equilíbrio da distribuição, em que as probabilidades são os pesos. Exemplo 3.6 - Um investimento de risco oferece, em um ano, rentabilidade de 10% com probabilidade 0,4 e rentabilidade de -4% com probabilidade 0,6. Qual a rentabilidade esperada ao final do ano? O investimento compensa? Obs - trata-se de um investimento, de tal forma que é imprescindível considerar o custo de oportunidade. Solução: O retorno de (- 4)% ocorre com probabilidade 0,6. O retorno de 10% ocorre com probabilidade 0,4. O retorno esperado é: (- 4)*0,6 + 10*0,4 = 1,6%, bem inferior, por exemplo, à rentabilidade anual da poupança. Portanto, o investimento não compensa. Fórmula do valor esperado para o caso contínuo: Exemplo 3.7 - Calcule E(X), sendo X a v.a. definida no exemplo 3.4. . 2 3 4 x 8 3 dxx 8 3 dxx 8 3 x)X(E 2 0 42 0 3 2 2 0 f(x) .dx)x(f x)X(E • Moda de uma V.A. No caso discreto, é o valor que ocorre com maior probabilidade. No caso contínuo, é definida como x tal que f(x) seja máxima. É o valor que divide a distribuição em 2 intervalos com probabilidades iguais (0,5). No caso contínuo, divide f(x) em 2 áreas iguais. • Mediana de uma V.A. 29 FGV/EPGE - Mestrado em Finanças e Economia Empresarial Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos Exemplo 3.8 - Calcule a mediana da v.a. definida no exemplo 3.4. Solução: .4k4k5,0 8 k 5,0dxx 8 3 5,0dxx 8 3 33 3 k 0 22 k 0 Valor Esperado de uma Função g(X): x )xX(P)x(g)]X(g[E O caso mais importante é do da função g(X) = [X-E(X)]2, que define a variância. dx)x(f)x(g)]X(g[E A variância V(X) de uma v.a. X é o valor esperado de [X-E(X)]2. A variância costuma ser obtida mediante a forma equivalente: V(X) = E(X2) - E2(X) Variância de uma V.A. contínuo. caso no ,dx f(x) x)X(E e discreto caso no ,)xX(Px)X(E 22 x 22 Exemplo 3.9 - Calcule V(X), sendo X a v.a. definida no exemplo 3.5. Solução: E(X2) = 02*1/2 + 12*1/3 + 22*1/6 = 1. V(X) = E(X2) - E2(X) = 1-(2/3)2 = 1 - 4/9 = 5/9. Exemplo 3.10 - Calcule V(X), sendo X a v.a. definida no exemplo 3.4. . 20 3 2 3 5 12 )X(E)X(E)X(V . 5 12 5 x 8 3 dxx 8 3 dxx 8 3 x)X(E 2 22 2 0 52 0 4 2 2 0 22 f(x) É a raiz quadrada de V(X): )X(V)X(DP . )X(E )X(DP )X(CV • Coeficiente de Variação de uma V.A. • Desvio Padrão de uma V.A. 30 FGV/EPGE - Mestrado em Finanças e Economia Empresarial Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos • Algumas Propriedades Importantes do Valor Esperado e da Variância (1) Se b é uma constante, e Y = b: E(Y) = b e V(Y) = 0. (2) Se a é uma constante, e Y = aX: E(Y) = aE(X) e V(Y) = a2V(X). (3) Se a e b são constantes, e Y = aX + b: E(Y) = aE(X) + b e V(Y) = a2V(X). Exemplo 3.11 - Seja um produto importado cujo preço, em dólares, apresenta, ao longo de um período, média 80 e desvio padrão 8. a) Se a taxa de câmbio for 2 R$/Dólar, calcule o valor esperado, a variância, o desvio padrão e o CV do preço em R$. b) Se o preço do produto aumenta 10 dólares, calcule a média, a variância, o desvio padrão e o CV do preço (em dólares), após o aumento. Solução do item a: a) Seja X o preço do produto em dólares. Então: E(X) = 80, DP(X) = 8 e V(X) = 64. Seja Y o preço do produto em R$. Então: Y = 2X. Logo, E(Y) = 2E(X) = R$ 160, V(Y) = 22V(X) = 4*64 = 256 R$2, DP(Y) = R$ 16 e CV(Y) = 16/160 = 0,1 = 10%. Solução do item b: b) Seja Z o preço em dólares após o aumento. Então: Z = X + 10. Logo, E(Z) = E(X) + 10 = 90 dólares, V(Z) = V(X) = 64 dólares2, DP(Z) = 8 dólares e CV(Z) = 8/90 = 8,88%. • Padronizando uma V.A. Seja X uma v.a. tal que E(X) = eV(X) = 2. Seja Z = (X-)/. Então: E(Z) = 0 e V(Z) = 1. Isto se chama padronizar a v.a. X (ou seja, transformá-la em uma nova v.a., chamada de Z, que possui média zero e variância 1). Função F(x) que associa, a cada valor x, a probabilidade de que X seja menor ou igual a x, isto é: P(Xx). Exemplo 3.12 - Ache F(x) para a v.a. do exemplo 3.5 (relembrando a distribuição: P(X=0) = 1/2, P(X=1) = 1/3, P(X=2) = 1/6). Função de Distribuição (Acumulada) 31 FGV/EPGE - Mestrado em Finanças e Economia Empresarial Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos Solução: Para x < 0, F(x) = 0. Para 0 x < 1, F(x) = 1/2. Para 1 x < 2, F(x) = 1/2 + 1/3 = 5/6. Para x 2, F(x) = 1/2 + 1/3 + 1/6 = 1. Exemplo 3.13 - Considere a distribuição de probabilidade: f(x) = 2x, 0<x<1. Ache F(x). Solução: Para x < 0, F(x) = 0. Para 0 x < 1: Para x 1, F(x) = 1. .x xdx2dx)x(f)xX(P)x(F 2 x 0 x 0 Propriedades de F(x): . dx )x(dF )x(f .1)x(FLim e 0)x(FLim .1 xx 2. No caso discreto, F(x) é contínua à direita. No caso contínuo, é contínua. 3. No caso contínuo, é possível, a partir da f.d.a., obter a função de densidade f(x) original, derivando F(x) com respeito a x: • Covariância e Correlação entre 2 V.A.`s A covariância entre duas variáveis aleatórias X e Y é definida como: ).Y(E)X(E)XY(E :ainda ou ))],Y(EY))(X(EX[(E)Y,X(Cov . )Y(V)X(V )Y,X(Cov )Y,X(Corr XY E o coeficiente de correlação é: Propriedades da Covariância (a, b, c e d constantes) P.1) Cov(X,X) = V(X). P.2) Cov(aX,cY) = acCov(X,Y). P.3) Cov(aX+b,cY+d) = acCov(X,Y). Exercício 3.1 - Seja X uma v.a. com média 1 e variância 4. Sejam ainda: Y = 2X e Z = 3X + 2. Determine: a) Cov(X,Y) R:8. b) Cov(X,Z) R: 12. c) Cov(Y,Z) R: 24. d) Corr(X,Z) R: 1. e) Corr(Y,Z) R: 1. 32 FGV/EPGE - Mestrado em Finanças e Economia Empresarial Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos 4. DISTRIBUIÇOES DISCRETAS É a distribuição discreta mais simples possível. Considera que todos os valores de X possuem a mesma probabilidade: Exemplo 4.1 - No lançamento de um dado, a v.a. que representa a face voltada para cima segue distribuição uniforme discreta. • Distribuição Uniforme Discreta k. ..., 2, 1, x , k 1 )xX(P Experimento de Bernoulli é um experimento aleatório que possui apenas dois resultados possíveis. Exemplos: 4.2 - Lançar uma moeda e observar a face voltada para cima. 4.3 - Observar se um atirador acerta o alvo. • Distribuição de Bernoulli Um dos resultados é chamado “sucesso”, e o outro, “fracasso”. A probabilidade de sucesso é designada por p. Como consequência, a probabilidade de fracasso é 1-p. . Seja agora uma v.a. X que assume valor 0, se ocorre um fracasso, e 1, se ocorre um sucesso. A distribuição desta v.a. é: x P(X=x) 0 1-p 1 p A distribuição acima é chamada distribuição de Bernoulli. P(X=x) = px(1-p)1-x, x = 0,1; 0<p<1. Fórmula da Distribuição de Bernoulli: o “~” significa “segue distribuição” Notação usual: X ~ Bernoulli(p). 33 FGV/EPGE - Mestrado em Finanças e Economia Empresarial Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos Sejam agora n realizações independentes de experimentos de Bernoulli com a mesma probabilidade de sucesso p. Considere que estejamos interessados no número de sucessos observados. • Distribuição Binomial Exemplo 4.4 - Ao lançar 3 moedas, qual a probabilidade de obtermos 2 caras? Façamos: {CA} = sucesso e {CO} = fracasso. Neste problema, a v.a. X de interesse representa o número de sucessos (caras). A distribuição da v.a. que representa o número de sucessos em n realizações independentes de experimentos de Bernoulli, todos com mesma probabilidade de sucesso p, chama-se binomial. n (número de realizações) e p (probabilidade de sucesso) são os parâmetros da distribuição. Fórmula da Distribuição Binomial: )xX(P probabilidade de obter x sucessos em n realizações independentes xnx )p1(p x n .1p0 ;n,...,1,0x , . )!xn(!x !n Notação usual: X ~ Bin(n,p). Solução do Exemplo 4.4: A v.a. de interesse é: X = número de caras. X ~ Bin(3,1/2). Pede-se P(X=2). . 8 3 2 1 2 1 2 3 )2X(P 12 Exemplo 4.5 - Qual a probabilidade de que um atirador acerte o alvo 3 vezes em 5 tentativas, se a probabilidade dele acertar um tiro em uma tentativa qualquer é 2/3? 34 FGV/EPGE - Mestrado em Finanças e Economia Empresarial Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos Solução: A v.a. de interesse é: X = número de acertos. Se considerarmos que as tentativas são independentes, então: X ~ Bin(5,2/3). .3292,0 3 1 3 2 3 5 )3X(P 23 Daí: Valor Esperado e Variância da Binomial: E(X) = np V(X) = np(1-p) Exemplo 4.5 (cont.) - Calcule o valor esperado do número de acertos do atirador. Exemplo 4.6 - Considere um exame com 20 questões de múltipla escolha, cada uma com 5 alternativas. Se um aluno que não estudou nada resolve “chutar” todas as respostas, qual é a probabilidade de que acerte 30% da prova (isto é, 6 questões)? Solução: .1091,08,02,0 6 20 )6X(P 146 Qual o valor esperado do número de questões que o aluno acerta? A v.a. de interesse é: X = número de acertos. Logo: X ~ Bin(20;0,2). Daí: Exemplo 4.7 (importante aplicação em finanças) - O preço de uma ação a cada dia é uma v.a., com probabilidade 0,4 de descer R$ 1,00 e probabilidade 0,6 de subir R$ 1,00. As variações de preço a cada dia são independentes, e as probabilidades de aumento ou queda de preço se mantém fixas. Se no primeiro dia o preço da ação é R$ 100,00, calcule o valor esperado do preço da ação no quinto dia. Solução: A trajetória da ação pode ser representada em uma árvore, chamada árvore binomial. A v.a. de interesse é: X = número de vezes que a ação sobe. Qual a distribuição de X? 35 FGV/EPGE - Mestrado em Finanças e Economia Empresarial Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos x P(X=x) 0 0,0256 1 0,1536 2 0,3456 3 0,3456 4 0,1296 Seja agora Y uma outra v.a., representando o preço final da ação. Note que, se a ação cair todos os dias (X=0), Y será igual a R$ 96,00. Por outro lado, se a ação subir todos os dias (X=4), Y será igual a R$ 104,00. E nos casos intermediários? y P(Y=y) 96 0,0256 98 0,1536 100 0,3456 102 0,3456 104 0,1296 O valor esperado de Y pode ser calculado de 2 formas. Forma 1 - diretamente da distribuição de Y, aplicando a definição de valor esperado: .8,1001296,0*1043456,0*1023456,0*100 1536,0*980256,0*96)yY(yP)Y(E y R: o valor esperado do preço (preço esperado) da ação no quinto dia é R$ 100,80. Forma 2 - escrevendo Y como função de X: Y = 2X+96, e aplicando a fórmula do valor esperado de aX+b (capítulo 3): E(aX+b) = aE(X) + b. No caso, a = 2, b = 96 e E(X) = np = 2,4. Assim: E(Y) = 2*2,4+96 = 100,8. 36 FGV/EPGE - Mestrado em Finanças e Economia Empresarial Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos • Distribuição Hipergeométrica Exemplo 4.8 - Considere 4 extrações sem reposição de bolinhas, de uma urna que contém 8 bolinhas azuis e 5 vermelhas. Calcule a probabilidade de que 3 sejam azuis. Em princípio, poderíamos pensar na extração de cada bolinha como um experimento de Bernoulli, e a v.a. X de interesse (número de bolinhas azuis na amostra) seguindo distribuição binomial. Pergunta: o que nos impede de fazer isto? Resposta: A amostragem é sem reposição, o que faz com que sucessivas extrações sejam dependentes e as probabilidades de sucesso mudem a cada extração. De formageral, considere uma população (no exemplo, urna) com N elementos (no exemplo, bolinhas), dentre os quais temos r sucessos (no exemplo, ser azul). Seja então uma amostra de tamanho n, obtida sem reposição. Qual é a probabilidade de que tenhamos exatamente x sucessos nesta amostra? A distribuição da v.a. que representa o número de sucessos na amostra chama- se hipergeométrica, c/ parâmetros N, r e n. Para obter a fórmula da distribuição hipergeométrica é só fazer: P(A) = #A/#S (casos favoráveis sobre casos possíveis). O número de casos possíveis é o número total de amostras de tamanho n que podemos obter da população, ou seja: . n N O número de casos favoráveis é o número de formas de extrair x sucessos dentre os r possíveis e (n-x) fracassos dentre os N-r possíveis: . xn rN x r 37 FGV/EPGE - Mestrado em Finanças e Economia Empresarial Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos Fórmula da Distribuição Hipergeométrica: . n N xn rN x r )xX(P probabilidade de que ocorram x sucessos, em uma amostra sem reposição de tamanho n Notação usual: X ~ Hiper(N,r,n). Solução do exemplo 4.8: Seja X o número de bolinhas azuis na amostra de tamanho 4. Então: .3916,0 4 13 1 5 3 8 4 13 34 813 3 8 )3X(P Exemplo 4.9 Considere um lote de 10 peças, das quais 4 são defeituosas. Se extrairmos 5 peças, sem reposição, qual a probabilidade de que 2 sejam defeituosas? Solução: Seja X o número de peças defeituosas na amostra de tamanho 5. Então: .4762,0 5 10 3 6 2 4 )2X(P Exemplo 4.10 - Para tentar passar pela alfândega, um traficante esconde 5 pílulas de narcóticos em um vidro que contém 10 pílulas de aspirina. O fiscal fica desconfiado, e decide tomar uma amostra de 4 pílulas, para inspeção. Qual a probabilidade do traficante ser preso? Solução: seja X = número de pílulas de narcóticos na amostra. Que valores X tem que assumir para que o traficante seja preso? 38 FGV/EPGE - Mestrado em Finanças e Economia Empresarial Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos O traficante é preso se X1. Mas P(X1) = 1-P(X=0), sendo P(X=0) calculada a seguir: Logo: P(X1) = 1 – 0,1539 = 0,8461. 0,1539. 4 15 4 10 0 5 )0X(P Valor Esperado e Variância da Hipergeométrica: 1N nN N r 1 N r nV(X) N r nXE )( • Aproximação da Hipergeométrica pela Binomial Se N é muito maior do que n (N 20n), a distribuição hipergeométrica pode ser aproximada pela distribuição binomial (cujas probabilidades são mais simples de calcular), com parâmetros n e p = r/N. Exemplo 4.11 - Em uma eleição, suponha que 300 dos 1000 habitantes de um município são eleitores de um candidato A. Toma-se uma amostra de 10 eleitores. Qual a probabilidade de que exatamente 5 deles pretendam votar no candidato A? Solução: A probabilidade exata seria calculada da seguinte forma: Note que as combinações envolvidas são bastante chatas de se calcular... . 10 1000 5 700 5 300 )5X(P A probabilidade aproximada pode ser calculada utilizando a distribuição binomial, com n = 10 e p = 300/1000 = 0,3. Compare com o resultado exato (calculado no Excel: 0,1026) .1029,0)7,0()3,0( 5 10 )5X(P 55 39 FGV/EPGE - Mestrado em Finanças e Economia Empresarial Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos • Distribuição Geométrica Considere, como na definição da Binomial, realizações independentes de experimentos de Bernoulli, todos com mesma probabilidade de sucesso p. A distribuição da v.a. que representa o número de realizações necessárias até que ocorra o primeiro sucesso chama-se geométrica, com parâmetro p. Fórmula da Distribuição Geométrica: 1.p0 ,...;2,1x ,p)p1()xX(P 1x probabilidade de que o primeiro sucesso venha a ocorrer na x-ésima realização. Notação: X ~ Geom(p). Parâmetro: p. .0082,0 3 2 3 2 1)5X(P 4 Exemplo 4.12 - A probabilidade de um indivíduo acertar um alvo é 2/3. Se ele deve atirar até que acerte o alvo pela primeira vez, qual a probabilidade de que sejam necessários exatamente 5 tiros? Solução: Seja X o número de tiros até o primeiro acerto. Então: X ~ Geom(2/3). Valor Esperado e Variância da Geométrica: E(X) = 1/p V(X) = (1-p)/p2 No exemplo 4.12, qual o número de tiros esperado até que ocorra o primeiro acerto? Exercício (Resolvido) 4.1 - Um jogador converte 10% dos pênaltis que cobra. a) Qual a probabilidade de que ele acerte apenas uma cobrança em 5 tentativas? b) Qual a probabilidade de que ele precise bater 5 pênaltis até acertar o primeiro? Solução: a) Seja X o número de pênaltis que o jogador acerta. Então: X ~ Bin(5;0,1). Pede-se P(X=1). .32805,0)9,0()1,0( 1 5 )1X(P 41 40 FGV/EPGE - Mestrado em Finanças e Economia Empresarial Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos b) Seja X o número de cobranças até que o jogador acerte a primeira. Então: X ~ Geom(0,1). Pede-se: .06561,0)1,0()9,0()5X(P 4 Exemplo motivador para a próxima distribuição a ser apresentada: Exemplo 4.13 - Na situação do exemplo 4.12, calcule a probabilidade de que o atirador precise de 4 tiros para acertar pela segunda vez o alvo (ou seja, de que o segundo acerto ocorra no quarto tiro). • Distribuição Binomial Negativa Considere novamente realizações independentes de experimentos de Bernoulli com probabilidade de sucesso p. A distribuição da v.a. que representa o número de realizações necessárias até que ocorra o r-ésimo sucesso (r = 1, 2, 3, ...) chama-se binomial negativa, com parâmetros r e p. Se r = 1, caímos na distribuição geométrica (caso particular). Fórmula da Distribuição Binomial Negativa: .1p0 ,...;1r,rx ,p)p1( 1r 1x )xX(P rrx Notação usual: X ~ BNeg(r,p). Parâmetros: r e p. probabilidade de que o r-ésimo sucesso venha a ocorrer na x-ésima realização. Solução do exemplo 4.13: Seja X o número de tiros até o segundo acerto. X ~ BNeg(2,2/3). .1481,0 3 2 3 2 1 1 3 )4X(P 22 Valor Esperado e Variância da Binomial Negativa: E(X) = r/p V(X) = r(1-p)/p2 41 FGV/EPGE - Mestrado em Finanças e Economia Empresarial Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos • Distribuição de Poisson Seja a taxa de ocorrência de um evento por unidade de tempo ou de espaço. Por exemplo, acidentes/hora em uma estrada. A distribuição da v.a. que representa o número de ocorrências de um evento com taxa , no intervalo correspondente, chama-se Poisson, com parâmetro . Fórmula da Distribuição de Poisson: .0 ,...;1,0x , !x e )xX(P x probabilidade de que ocorram x eventos, em um intervalo no qual ocorrem, em média, eventos Notação usual: X ~ Poi(). Parâmetro: . Valor Esperado e Variância da Poisson: E(X) = V(X) = A Poisson é a única distribuição na qual a média e a variância são sempre iguais! Exemplo 4.14 - Em determinada rodovia, ocorrem, em média, 3 acidentes por hora. Supondo distribuição de Poisson, calcule as seguintes probabilidades: a) De que ocorram 2 acidentes em uma hora.b) De que ocorram pelo menos 2 acidentes em 20 minutos (20 minutos = 1/3 de hora). Solução: .e5,4 !2 e3 )2X(P )a 3 32 .e21)]1X(P)0X(P[1)2X(P :e 1, é minutos 20 para o Assim, minutos. 20 cada a 1 média em ocorre então hora, uma em acidentes 3 média, em ocorrem, se hora) de 1/3 ( minutos 20 de período o para oconverter se-deve Aqui )b 1 • Aproximação da Binomial pela Poisson Se n for grande e p for pequeno, o número de sucessos em n realizações independentes de experimentos de Bernoulli pode ser aproximado pela distribuição de Poisson, com = np. 42 FGV/EPGE - Mestrado em Finanças e Economia Empresarial Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos Exemplo 4.15 - Uma companhia de seguros de automóveis descobriu que somente cerca de 0,005% da população está incluída em um certo tipo de sinistro cada ano. Se seus 20.000 segurados são escolhidos ao acaso na população, qual é a probabilidade aproximada de que 3 clientes venham a ser incluídos nesta categoria de sinistro no próximo ano? Exercício (Resolvido) 4.1 (cont.) (combinando conteúdos dos capítulos 2 e 4) c) Dado que são necessárias mais que 3 tentativas até o primeiro acerto, qual é a probabilidade de que este acerto ocorra em, no máximo, 5 tentativas? Solução: Um olhar desatento poderia nos levar a calcular P(X=4) + P(X=5), quando o que é pedido é uma probabilidade condicional: ),3X|5X(P sendo X ~ Geom(0,1). Esta probabilidade é calculada da seguinte forma: .19,0 729,0 1385,0 3XP2XP1XP1 5XP4XP 3XP 3X5XP )3X|5X(P Observações: 1 - A probabilidade do denominador não exclui P(X = 0), porque uma v.a. geométrica não pode assumir valor 0! Note que a geométrica e a binomial negativa são as únicas distribuições discretas que não assumem valor 0. 2 - Esta probabilidade P(X > 3) pode ser obtida de forma direta pela distribuição binomial com n = 3 e p = 0,1, já que, se Y ~ Bin(3;0,1), então: P(X > 3) = P(Y = 0). Assim: .729,09,01,0 0 3 )0Y(P)3X(P 30 43 FGV/EPGE - Mestrado em Finanças e Economia Empresarial Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos 5. DISTRIBUIÇOES CONTÍNUAS • Distribuição Uniforme Contínua É a distribuição contínua mais simples que existe. Pressupõe que as probabilidades estejam distribuídas de maneira uniforme pelo intervalo de variação de X (de a ). Fórmula da Uniforme: f(x) = 1/(-), <x<. Parâmetros: e . Notação: X ~ Unif(,). Cálculo de Probabilidades Utilizando a Uniforme: P(aXb) = (b-a)/(-) Valor Esperado e Variância da Uniforme: E(X) = (+)/2 V(X) = (-)2/12 Exemplo 5.1 - As notas de uma turma apresentam média 5 e variância 3. A nota mínima para aprovação é 7. Supondo distribuição uniforme, calcule a probabilidade de um aluno ser aprovado. R: 1/6. 44 FGV/EPGE - Mestrado em Finanças e Economia Empresarial Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos • Distribuição Exponencial Distribuição definida para valores de X estritamente positivos, usual para representar tempo (duração, espera, etc.). Fórmula da Exponencial: .0 ;0x ,e)x(f x Parâmetro: . Notação: X ~ Expo(). Valor Esperado e Variância: E(X) = 1/ V(X) = 1/2 Demonstração do Valor Esperado: Esta integral deve ser resolvida por partes, fazendo u = x e dv = e-xdx. Temos então que: du = dx e v = -e-x/. Assim: .dxxedxex)X(E 0 x 0 x . 1e xe dxexe dx ee x)X(E 0 x 0 x 0 x 0 x 0 x 0 x Demonstração da Variância: V(X) = E(X2) – E2(X). E(X2) é calculado da seguinte forma: Esta integral também deve ser resolvida por partes, mas agora fazendo u = x2 e dv = e-xdx. .dxexdxex)X(E 0 x2 0 x22 Função Distribuição Acumulada da Exponencial: F(x) = P(Xx) = 0, x0 = 1-e-x, x>0. 45 FGV/EPGE - Mestrado em Finanças e Economia Empresarial Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos Demonstração da F.D.A.: Para x0, F(x) = P(Xx) = 0. Para x>0: .e1 e1 dxe dxe )xP(X)x(F x xx 0 x x 0 x Exemplo 5.2 - O tempo de espera em uma fila segue distribuição exponencial. Se um cliente espera, em média, 10 minutos para ser atendido, qual a probabilidade: a) De que demore menos do que 12 minutos para ele ser atendido? R: 1-e-1,2. b) De que demore menos do que 7 minutos para ele ser atendido? R: 1-e-0,7. c) E entre 7 e 12 minutos? R: e-0,7-e-1,2. d) De que ele espere mais do que 10 minutos (isto é, mais do que a média E(X))? R: e-1 0,368. O resultado do item d) indica que a média da exponencial é sempre maior que a mediana! Exemplo 5.3 - O tempo (em horas) de duração das lâmpadas de uma marca segue uma distribuição exponencial com = 0,01. Calcule a mediana do tempo de duração das lâmpadas. R: 69,31 horas. Interpretação: 50% das lâmpadas desta marca duram mais do que 69,31 horas. • Falta de Memória É uma importantíssima propriedade da distribuição exponencial. Ela diz que: P(X>x+s|X>x) = P(X>s). Interpretação: se uma lâmpada já durou x horas, a probabilidade dela durar mais s horas a partir dali é a mesma que ela teria de durar s horas a partir da sua fabricação. Em outras palavras, não há desgaste. Isto é considerado uma crítica ao uso da exponencial para este tipo de aplicação. 46 FGV/EPGE - Mestrado em Finanças e Economia Empresarial Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos Demonstração da Falta de Memória: P(X>x+s|X>x) = P[(X>x+s)(X>x)]/P(X>x) = P(X>x+s)/P(X>x) = e-(x+s)/e-x = e-s = P(X>s), C.Q.D. Parâmetros: (=E(X)) e 2 (=V(X)). Notação: X ~ N(,2). O gráfico da distribuição Normal apresenta formato similar ao de um sino (bell shaped). .0,;x;e 2 1 )x(f 22 )x( 2 2 • Distribuição Normal Distribuição Normal para diferentes valores de : Distribuição Normal para diferentes valores de : • Cálculo de Probabilidades Normais Exemplo 5.4 - Considere que as alturas dos alunos desta turma sigam distribuição Normal, com média igual a 170 cm e desvio padrão igual a 5 cm. Seja o experimento que consiste na seleção de um aluno qualquer e na medição de sua altura. A v.a. que representa o resultado deste experimento é X ~ N(170,25). Qual a probabilidade de que a altura do aluno esteja entre 170 e 172,3 cm? Em princípio, você calcularia: Problema: A integral de não possui solução analítica! 3,172 170 50 )170x( dxe 25 1 )3,172X170(P 2 2 2 2 )x( e 2 1 )x(f altura de um aluno selecionado ao acaso 47 FGV/EPGE - Mestrado em Finanças e Economia Empresarial Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos Para calcular a probabilidade solicitada, usaremos a tabela Normal. A tabela Normal fornece probabilidades associadas a uma v.a. padronizada, : que possui média 0 e variância 1 (como vimos no capítulo 3 do curso). , X Z P(0 < Z < 0,46) é encontrada na tabela. ).46,0Z0(P 5 1703,172 Z 5 170170 P 3,172X170 P )3,172X170(P Usando a Tabela Normal: Resposta final do item a): A probabilidade de que a altura de um aluno selecionado ao acaso esteja entre 170 e 172,3 cm é 0,1772. b) Qual a probabilidade de que a altura do aluno esteja entre 170 e 175 cm? Neste caso: ).1Z0(P 5 170175 Z 5 170170 P 175X170 P )175X170(P k Ilustrando na Tabela Normal: 48 FGV/EPGE - Mestrado em Finanças e Economia Empresarial Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos Resposta final do item b): 0,3413. c) Qual a probabilidade de que a altura do aluno esteja entre 165 e 170 cm? Solução: Pela simetria da Normal, temos: P(-1 < Z < 0) = P(0 < Z < 1) = 0,3413. Ilustração da Simetria da Normal: P(-1 < Z < 0) P(0 < Z < 1) P(-1 < Z < 1) d) Qual a probabilidade de que a altura do aluno esteja entre 165 e 175 cm? Esta é a probabilidade de X estar a no máximo 1 desvio padrão de distância da sua média. Solução: do slide anterior, P(-1 < Z < 1) = 0,6826. 99,72% Revisitando a figura do capítulo 1: Considerando = E(X) e = DP(X). e) Qual a probabilidade de que a altura do aluno esteja entre 170 e 180 cm? Solução: P(170 < X < 180) = P(0 < Z < 2) = 0,4772. f) E entre 160 e 180 cm? Solução: P(160 < X < 180) = P(-2 < Z < 2) = 2*0,4772 = 0,9544. g) Qual a probabilidade de que a altura do aluno seja maior do que 170 cm? Solução: P(X > 170) = P(Z > 0). A área total sob a curva é igual a 1. Logo, a resposta é 0,5. h) E maior do que 175 cm? Solução: P(X > 175) = P(Z > 1) = 0,5 - P(0 < Z < 1) = 0,5 - 0,3413 = 0,1587. P(Z > 0) 49 FGV/EPGE - Mestrado em Finanças e Economia Empresarial Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos i) E menor do que 175 cm? Solução: P(X < 175) = P(Z < 1) = 0,5 + P(0 < Z < 1) = 0,5 + 0,3413 = 0,8413. j) E menor do que 165 cm? Solução: P(X < 165) = P(Z < -1) = P(Z > 1) = 0,1587. P(Z < 0) Exemplo 5.5 - O VPL de um projeto, em R$ 1.000,00, segue distribuição N(80,16). Calcule a probabilidade do VPL ser: a) maior que 80 e menor que 83 mil. b) maior que 79 e menor que 82 mil. Solução: a) ).75,0Z0(P 4 8083 Z 4 8080 P 83X80 P )83X80(P VPL do projeto Ilustrando na Tabela Normal: Resposta do item a) 0,2734. b) ).5,0Z0(P)25,0Z0(P )5,0Z0(P)0Z25,0(P 5,0Z25,0P 4 8082X 4 8079 P )82X79(P Por causa da simetria! Ilustrando na Tabela Normal: Resposta do item b): 0,0987+0,1915 = 0,2902. 50 FGV/EPGE - Mestrado em Finanças e Economia Empresarial Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos Exemplo 5.6 - A rentabilidade de uma estratégia financeira no mercado futuro, referente a certo período, possui distribuição Normal, com média 5% e desvio padrão 3%. a) Qual a probabilidade da rentabilidade ser negativa, no período considerado? Solução: Seja X1 = rentabilidade da estratégia. .0475,0 67,1ZP 3 50 ZP 0X P )0X(P 1 1 b) Compare a estratégia do item a) com outra cuja média é 6% e cujo desvio padrão é 4%. Considere como critério de comparação a probabilidade de perda (rentabilidade negativa). Considerando este critério, por qual das estratégias você optaria? Solução: Seja X2 = rentabilidade da nova estratégia. .0668,0 5,1ZP 4 60 ZP 0X P )0X(P 2 2 Considerando a probabilidade de perda, a primeira estratégia é mais vantajosa. Exemplo 5.7 - As notas dos alunos de um vestibular distribuem-se normalmente, com média 8 e desvio padrão 1. Se a relação candidato/vaga é de 40 para 1, calcule a nota mínima para que o aluno seja aprovado. Obs - será necessário achar * tal que: P(X > *) = 0,025. Buscaremos na tabela o valor k tal que: P(Z > k) = 0,025, denotado por z0,025. k Temos que achar na tabela o valor de k correspondente à probabilidade 0,475: Assim: z0,025 = 1,96. Resposta do Exemplo 5.7: 9,96. 51 FGV/EPGE - Mestrado em Finanças e Economia Empresarial Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos • Distribuição Lognormal Seja uma v.a. Normal X ~ N(,2) e seja Y = eX. A distribuição de Y é chamada lognormal, com parâmetros e 2. Fórmula: A distribuição lognormal apresenta assimetria positiva. Valor Esperado: .0 , 0,y ;e 2y 1 )y(f 2 2 )y(ln 2 1 2 2 e)Y(E Aplicação da lognormal em economia e finanças: Pressuposto usual para a distribuição dos preços de ativos no mercado financeiro. Cálculo de probabilidades lognormais: É conduzido usando que, se Y segue distribuição lognormal com parâmetros e 2, então X = lnY segue distribuição Normal com os mesmos parâmetros. Exemplo 5.8 - As alturas em uma população (em cm) seguem distribuição lognormal com parâmetros = 5,11 e 2 = 1. Qual a porcentagem de indivíduos desta população com altura inferior a 164 cm? .496,001,0ZP 1 11,5164ln 1 11,5X P Solução: P(Y<164) = P(lnY<ln164) = = X ~ N(5,11;1). 5,1. • Distribuição Qui-Quadrado Fórmula: Parâmetro: (graus de liberdade) Notação: 0. ;0x ;ex 2 1 )x(f 2 x 1 2 2 .~X 2 Valor Esperado e Variância: E(X) = V(X) = 2 Relação entre a Qui-Quadrado e a Normal: 2 1 2 ~ZY :N(0,1)~ ZSe 52 FGV/EPGE - Mestrado em Finanças e Economia Empresarial Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos 6. FUNÇÕES LINEARES DE V.A.`s • Soma de V.A.`s Exemplo 6.1 - Um elevador suporta um peso máximo de 500Kg. Podemos estar interessados na probabilidade do peso limite ser ultrapassado quando 7 pessoas entram neste elevador. Neste caso, a v.a. de interesse é: e a probabilidade de interesse é: P(S>500). ,XS 7 1i i peso da i-ésima pessoa. • Valor Esperado da Soma de n V.A.`s: • Variância da Soma de n V.A.`s Descorrelacionadas: .)X(V)S(V n 1i i .)X(E)S(E n 1i i • Soma de Normais Independentes com Médias e Variâncias Iguais Considere a soma S de n v.a.`s Xi, i = 1,2,...,n, Normais e independentes, c/ médias e variâncias 2. Então: ).n,n(N~S 2 E agora estamos aptos a calcular a probabilidade de interesse do exemplo 6.1. Exemplo 6.1 (cont.) e queremos P(S>500). Supondo que os pesos das pessoas deste universo tenham média = 70 e variância 2 = 100, temos que S ~ N(490,700), e: ,XS 7 1i i peso da i-ésima pessoa .3520,0)38,0Z(P ) 700 490500 Z(P)500S(P Exemplo 6.2 - Uma máquina de café é calibrada para produzir pacotes com peso 500g. Entretanto, na prática, os pesos reais dos pacotes produzidos serão v.a.`s. Suponha que os pesos dos pacotes produzidos pela máquina sigam distribuição Normal com média 500 g e variância 16 g2. a) Se selecionarmos 100 pacotes (considere os pesos dos pacotes independentes), qual a probabilidade de que o peso total seja maior do que 49,96 Kg? 53 FGV/EPGE - Mestrado em Finanças e Economia Empresarial Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos Solução: .8413,05,0)1Z0(P 5,0)0Z1(P1ZP 40 000.50960.49 ZP)960.49S(P ).n,n(N~XS 2 n 1i i peso total = soma dos pesos • Média de V.A.`s A média de n v.a.`s X1, X2, ..., Xn, é definida da seguinte forma: . n X X n 1i i Note que, assim como a soma, a média de n v.a.`s é, também uma variável aleatória. • Média de Normais Independentes com Médias e Variâncias Iguais Considere a média de n v.a.`s Xi, i = 1,2,...,n, independentes e Normais, c/ médias e variâncias 2. Então: ). n ,(N~X 2 X Em particular, assim como a soma, a média de Normais independentes também é Normal. Demonstração do Valor Esperado
Compartilhar