Baixe o app para aproveitar ainda mais
Prévia do material em texto
Esse material será usado como apostila-texto para a referida disciplina, com o objetivo de dar suporte às aulas teóricas. Não substitui a leitura de livros técnicos sobre o assunto. Está em constante atualização e correção de eventuais erros. Convém ressaltar que o presente material não está completo e os capítulos que não constam nessa apostila, ou que estão incompletos, serão liberados para serem copiados assim que estiverem prontos. No caso de correções e/ou sugestões, favor enviar e-mail para peternelli@ufv.br. Viçosa, Agosto de 2020. Prof. Luiz Alexandre Peternelli mailto:peternelli@ufv.br EST 106 Prof. Luiz Alexandre Peternelli CONTEÚDO CAPÍTULO 1 - CONCEITOS INTRODUTÓRIOS 1 1. INTRODUÇÃO 1 1.1. Conceitos de estatística, população e amostra 1 1.2. Por que estudar estatística? 4 1.3. O uso da estatística 5 2. TÓPICO ESPECIAL 6 2.1. SOMATÓRIO 6 2.2. PRODUTÓRIO 16 CAPÍTULO 2 - ESTATÍSTICA DESCRITIVA 1 1. ESTATÍSTICA INDUTIVA: (INFERÊNCIA ESTATÍSTICA) 1 2. ESTATÍSTICA DESCRITIVA 1 3. APRESENTAÇÃO GRÁFICA E TABULAR 4 4.1. Medidas de Posição 23 4.2. Medidas de Dispersão 33 CAPÍTULO 3 - TÓPICOS GERAIS DE PROBABILIDADE 1 1. INTRODUÇÃO 1 2. ALGUNS CONCEITOS 2 2.1.Experimentos probabilísticos ou aleatórios 2 2.2.Espaço amostral (S) 5 2.3.Eventos 6 2.4.Eventos Mutuamente Exclusivos 7 3. NOÇÕES FUNDAMENTAIS DE PROBABILIDADE - CONCEITOS 8 3.1.Um conceito 9 3.2.Outro Conceito 10 3.3.Ainda outro conceito 13 3.4.Uma definição – Probabilidade Geométrica 18 4. PRINCIPAIS TEOREMAS PARA O CÁLCULO DE PROBABILIDADES 20 5. PROBABILIDADE CONDICIONAL 25 6. TEOREMA DO PRODUTO DAS PROBABILIDADES 30 7. INDEPENDÊNCIA ESTOCÁSTICA (OU PROBABILÍSTICA) 31 8. PARTIÇÃO DO ESPAÇO AMOSTRAL E O TEOREMA DE BAYES 34 8.1. Teorema da Probabilidade Total 34 8.2. Teorema de Bayes 36 CAPÍTULO 4 - VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES DE PROBABILIDADE 1 1. CONCEITO DE VARIÁVEL ALEATÓRIA 1 2. DISTRIBUIÇÃO DE PROBABILIDADE 7 2.1. X é uma v.a.d. 7 2.2. X é uma v.a.c. 11 3. FUNÇÃO DE DISTRIBUIÇÃO ACUMULADA (OU FUNÇÃO DE DISTRIBUIÇÃO) 21 3.1. F(x) para X v.a.d. 22 3.2. F(x) para X v.a.c. 23 EST 106 Prof. Luiz Alexandre Peternelli 4. DISTRIBUIÇÕES EMPÍRICAS 28 5. DISTRIBUIÇÕES DE PROBABILIDADES CONJUNTAS 37 5.1. Definição 38 5.2. Distribuição conjunta de duas variáveis aleatórias, distribuições marginais e condicionais 39 5.3. Variáveis aleatórias independentes 48 6. CONCEITOS E PROPRIEDADES DE ESPERANÇA MATEMÁTICA E VARIÂNCIA DE VARIÁVEIS ALEATÓRIAS 55 6.1. Esperança matemática (média ou valor esperado de uma v. a.) 55 6.2. Variância de uma variável aleatória 60 CAPÍTULO 5 - ALGUMAS DISTRIBUIÇÕES DE VARIÁVEIS ALEATÓRIAS DISCRETAS E CONTÍNUAS 1 1. DISTRIBUIÇÕES DE VARIÁVEIS ALEATÓRIAS DISCRETAS 1 1.1. Uniforme 2 1.2. Binomial (uma extensão da distribuição de Bernoulli) 5 1.3. Multinomial 20 1.4. Poisson 22 1.5. Geométrica 33 1.6. Binomial negativa 36 1.7. Hipergeométrica 40 2. DISTRIBUIÇÕES DE VARIÁVEIS ALEATÓRIAS CONTÍNUAS 45 2.1. Uniforme 45 2.2. Exponencial 49 2.3. Normal 54 2.4. Lognormal 69 2.5. Gamma 71 2.6. Weibull 74 2.7. Beta 76 2.8. Qui-quadrado ( 2) 77 2.9. F 79 CAPÍTULO 6 - TESTES DE SIGNIFICÂNCIA 1 1. INTRODUÇÃO 1 1.1. Hipótese Estatística 2 1.2. Hipótese de Nulidade e Hipótese Alternativa 3 2. PROCEDIMENTOS PARA A REALIZAÇÃO DE UM TESTE DE HIPÓTESE 5 3. TESTE Z 7 3.1. Teste z para 1 média 7 4. TESTE T 14 4.2. Teste t para duas médias (2 amostras independentes) 19 5. TESTE DE QUI-QUADRADO 28 5.1. Teste de Aderência 29 5.2. Teste para independência 36 6. TESTE F 38 EST 106 Prof. Luiz Alexandre Peternelli CAPÍTULO 7 - INTERVALOS DE CONFIANÇA 1 1. INTRODUÇÃO 1 2. INTERVALOS DE CONFIANÇA PARA MÉDIA E VARIÂNCIA 3 2.1. Intervalo de confiança para a média, quando a variância é conhecida 3 2.2. Intervalo de confiança para média, quando a variância populacional é desconhecida 6 2.3. Intervalo de confiança para a variância de uma população normal 9 3. INTERVALO DE CONFIANÇA PARA A PROPORÇÃO 11 4. DETERMINAÇÃO DO TAMANHO DA AMOSTRA 13 4.1.Baseado no I.C. para a média, quando 2 é conhecida 13 4.2. Baseado no I.C. para a média, quando não conhecemos a 2 16 CAPÍTULO 8 - NOÇÕES DE TÉCNICAS DE AMOSTRAGEM 1 1. INTRODUÇÃO 1 2. QUESTIONÁRIO 2 3. AMOSTRAGEM 3 3.1. Amostragem Aleatória Simples 4 3.2. Amostragem Sistemática 5 3.3. Amostragem Aleatória Estratificada 6 CAPÍTULO 9 - REGRESSÃO LINEAR E CORRELAÇÃO 1 1. CORRELAÇÃO AMOSTRAL 2 1.1. O Diagrama de dispersão 3 1.2. O coeficiente de correlação 5 2. REGRESSÃO LINEAR 7 2.1. Modelo linear de 1º grau (REGRESSÃO LINEAR SIMPLES) 9 2.2. Coeficiente de determinação 12 2.3. Teste de hipótese na regressão linear simples 14 2.4. Regressão linear múltipla 22 ANEXO 1 – EXERCÍCIOS EXTRAS 1 ANEXO 2 – TABELAS 1 EST 106 Prof. Luiz Alexandre Peternelli 1 CAPÍTULO 1 - Conceitos introdutórios 1. Introdução 1.1. Conceitos de estatística, população e amostra (V.M.11) Estatística é uma área da ciência ligada com a extração de informação de dados numéricos e a sua utilização na tomada de decisões (estabelecimento de inferências) sobre uma população da qual os dados foram obtidos. (M.G.1) Estatística corresponde ao campo da ciência que trata da coleção, apresentação, análise e uso de dados numéricos para a tomada de decisões e solução de problemas. EST 106 Prof. Luiz Alexandre Peternelli 2 População: o conjunto de elementos que têm, em comum, determinada característica. As populações podem ser finitas ou infinitas. Além disso, existem populações que, embora finitas, são consideradas infinitas para qualquer finalidade prática. Amostra: qualquer conjunto de elementos retirado da população, desde que esse conjunto seja não-vazio e tenha menor número de elementos do que a população. Exemplos O que seria, então, de interesse primário? A amostra ou a população? EST 106 Prof. Luiz Alexandre Peternelli 3 outros conceitos importantes Parâmetro: uma medida da população Estimador: uma fórmula ou função dos elementos amostrais, usado para estimar um parâmetro Estimativa: valor numérico associado ao estimador, obtido com base na amostra. Exemplo EST 106 Prof. Luiz Alexandre Peternelli 4 1.2. Por que estudar estatística? Possíveis razões para o estudo da Estatística: Atualização para facilitar o entendimento de artigos em revistas especializadas, que utilizam muito a estatística para a apresentação e interpretação dos resultados. Desenvolvimento de trabalhos É de fundamental importância para o auxílio no desenvolvimento de trabalhos científicos e no estabelecimento de posteriores conclusões. obs.: para quem tiver interesse no desenvolvimento de trabalhos de iniciação científica, ou mesmo, mais tarde, para quem pretender realizar um curso de pós-graduação. (podem ter certeza que farão, no mínimo, mais uma estatística na pós-graduação). EST 106 Prof. Luiz Alexandre Peternelli 5 1.3. O uso da estatística O método estatístico usado para o estimar a tensão de ruptura ou o coeficiente de dilatação térmica de um metal o estimar o tempo médio que leva uma secretária para executar uma tarefa o estimar a média do Q.I. (quociente de inteligência) dos alunos que pretendem ingressar em algum curso da UFV. É O MESMO! O método estatístico usado para o comparar o trabalho de duas máquinas o comparar a efetividade de dois processos de ensino o comparar o mérito de dois fertilizantes o comparar a audiência de dois programas de rádio. EST 106 Prof. Luiz Alexandre Peternelli 6 2. Tópico Especial 2.1. SOMATÓRIO 2.1.1. Introdução X i i n 1 Lê-se: somatório deX índice i, com i variando de 1 até n, onde: n, é a ordem da última parcela ou limite superior (LS) do somatório; i=1, é a ordem da primeira parcela da soma ou limite inferior do somatório (LI); i, é o índice EST 106 Prof. Luiz Alexandre Peternelli 7 Principais representações: 1) X i i n 1 = X X Xn1 2 , soma simples 2) X X X Xi n i n 2 1 2 2 2 2 1 , soma de quadrados (SQ) 3) ( )X i i n 1 2 = ( )X X Xn1 2 2 , quadrado da soma 4) X Y X Y X Y X Yi i n n i n 1 1 2 2 1 , soma de produtos (SP) 5) X Y X X X Y Y Yi j n m j m i n ( ).( ... )1 2 1 2 11 , produto das somas EST 106 Prof. Luiz Alexandre Peternelli 8 2.1.2. Número de Termos (Parcelas) do Somatório (NT) NT = (LS - LI) + 1 – r, onde r é o número de restrições a que o somatório está sujeito. Exemplo 1.2.: Obter o número de termos para os seguintes somatórios: a) X i i 3 8 , NT = (8-3) + 1 = 6 b) Yk k k 1 9 11 15 , , NT = (15 - 1) + 1 - 2 = 13 c) 3 1 2 ,)4( i iX NT = 3-1+1 = 3 termos, que são: 2 3 2 2 2 1 )4()4()4( XXX EST 106 Prof. Luiz Alexandre Peternelli 9 2.1.3. Propriedades de Somatório P.1. Somatório de uma constante k k i n 1 = k + k +...+ k = nk Exemplo 1.3.: a) 5 1 10 i → NT = [(10 - 1) + 1](5) = 10(5) = 50 b) Yj i 3 12 → NT = [(12 -3) + 1] Yj = 10 Yj EST 106 Prof. Luiz Alexandre Peternelli 10 P.2. Somatório do produto de uma constante por uma variável kX i i n 1 = kX kX kX k X X X k Xn n i i n 1 2 1 2 1 ... ( ... ) Exemplo 1.4.: a) i n i i i nX X k 1 12 1 2 1 2 , b) 3 3 1 1 j i j i i i Y X Y X no caso, jk Y EST 106 Prof. Luiz Alexandre Peternelli 11 P.3. Somatório de uma soma ou subtração de variáveis ( )X Y W X Y Wi i i i i i i n i n i n i n 1111 considere o seguinte exemplo: Se X1 = 2; X2 = 4; X3 = 8, calcule de duas maneiras o 3 1 2)4( i iX - usando o conceito de somatório - usando as propriedades EST 106 Prof. Luiz Alexandre Peternelli 12 2.1.4. Somatório Duplo j = 1 j = 2 j = 3 i = 1 X11 X12 X13 i = 2 X21 X22 X23 EST 106 Prof. Luiz Alexandre Peternelli 13 Exercícios Propostos 1) Considerando os seguintes valores: X X X X Y Y 1 2 3 4 1 2 3 4 2 6 7 9 1 4 5 11 Y Y Calcular: a) ( )Yi i 2 2 1 3 b) ( )X Yi i i 4 1 4 c) i i j X 1 3 2 4 2( ) d) i i j j X Y 2 4 2 3 3( ) EST 106 Prof. Luiz Alexandre Peternelli 14 e) Mostre, algebricamente, que 3 1 3 1 )( j ji i yx = 3 1 3 1 j j i i yx f) Verifique a equivalência das expressões do item e numericamente. Para esse fim escolha um conjunto numérico qualquer. R: a) 14 b) -60 c) 63 d) 51 2) Efetuar a) ( )i ji 2 1 3 1 b) (opcional) i j i j i i 3 6 0 2 3 ( ).( ) R: a) 5(3 + 1/j) b) 429/20 EST 106 Prof. Luiz Alexandre Peternelli 15 3) Expanda os somatórios dados abaixo, compare as equações obtidas e depois calcule X1 e X3 : X X X X i i i i i i i i i i 42 364 34 324 1 6 2 1 6 2 1 1 3 6 1 1 3 6 ,, R: X1 = 2 e X3 = 6 ou X1 = 6 e X3 = 2. 4) Calcular: a) ( )i j ji 2 4 1 5 b) i j ij 1 6 5 9 R.: a) 90 b) 735 EST 106 Prof. Luiz Alexandre Peternelli 16 2.2. PRODUTÓRIO 2.2.1. Introdução X X X X i n i n 1 2 1 . ..... Lê-se: produtório de X índice i, com i variando de 1 a n. EST 106 Prof. Luiz Alexandre Peternelli 17 Fatos: 1) b b b b b b n fatores i n n . . .... 1 2) cX cX cX cX c X X X c Xi n i n n n n i i n 1 2 1 1 2 1 . ..... . . ..... cuidado! Na verdade deveríamos pensar (ou escrever) LS LIi i NT LS LIi i XccX 3) n i i n i i n i nnnnii YXYYYXXXYXYXYXYX 111 21212211 ............ 4) i n n i n 1 12 3. . ..... ! útil para simplificar notações 5) log log . ... log log ... log logX X X X X X X Xi n i n n i i n 1 2 1 1 2 1 útil para ... EST 106 Prof. Luiz Alexandre Peternelli 18 Exercícios resolvidos: Exemplo 1.6. Seja Gi ={1,2,3} e Hj ={0,2,4}. Calcule a) 0625,0 144 9 12 )3( 12 )1( 4)34(3 32 4)4( 2 4)4( 2 222 3 2 1 3 2 1 2 G I G Ii iG i i i EST 106 Prof. Luiz Alexandre Peternelli 19 b) 5 6 30 6 1011882 6 )23( 6 )22( 6 )21( 3 )03( 3 )02( 3 )01( 2.3 )( 2.3 )( 2.3 )( 1.3 )( 1.3 )( 1.3 )( 3 )( 222222 2 23 2 22 2 21 2 13 2 12 2 11 2 1 3 1 2 HGHGHGHGHGHG j HG j i ji EST 106 Prof. Luiz Alexandre Peternelli 20 Calcular: a) X X X X i i 1 3 1 2 3 2 3 5 30. . . . b) Y Y Y Y i i 1 2 3 1 3 3 5 7 105. . . . c) 3 3 27 30 810 3 1 3 1 3 . ( )X Xi i ii d) 3 2 1 3 2 1 2 901093.3 i i i i ii XX e) 3 1i iiYX = (X1Y1).( X2Y2). (X3Y3) = (2.3).(3.5).(5.7) = 6.15.35 = 3150 Exemplo 1.7. Sabendo-se que: X X Y Y 1 2 3 1 2 3 2 3 5 3 5 7 X Y EST 106 Prof. Luiz Alexandre Peternelli 21 EXERCÍCIOS PROPOSTOS 1) Seja uma variável X, assumindo os seguintes valores: X = {5, 2, 3, 0, 1, 2, 6, 9, 4, 8} n=10 Calcule: a) X i i 1 10 b) X i i 2 1 10 c) X i i 1 10 2 d) X X i i i i 2 1 10 2 1 10 10 10 1 e) X i i 4 1 10 f) X i i 4 2 1 10 g) X i i 4 10 1 2 1 10 h) X i i 1 10 10 R.: a) 40; b) 240; c) 1600; d) 8,88; e) 0; f) 80; g) 8,88; h) 4 EST 106 Prof. Luiz Alexandre Peternelli 22 2) Sabendo-se que X i i 6 1 5 e X i i 2 1 5 12 , calcule: a) 4 5 1 5 X i i b) X Xi i i 2 1 5 c) X i i 3 2 1 5 R.: a) 1; b) 24; c) 93 3) Desenvolver e calcular: a) i bj ji 2 6 1 3 b) i j ij 1 5 1 2 c) i j ji 3 0 2 1 2 2 d) cb ji 0 8 1 7 e) i ji 2 1 5 1 4 EST 106 Prof. Luiz Alexandre Peternelli 23 4) Utilizando os dados da tabela abaixo, referente aos valores Xij calcule o resultado numérico quando possível: j i 1 2 3 4 1 8 7 5 9 2 4 0 10 2 a) X i i 1 1 2 b) X j j 1 1 4 c) X ij ji 1 4 1 2 d) X ij j j 1 3 4 e) X j j 2 2 3 f) 1 21 2 4 X jj j g) 6 1 1 3 4 X j j j h) X j j j 2 1 2 4 R.: a) 12; b) 29; c) 45; e) 10; f) 17/20; g) 3024; h) 80 EST 106 Prof. Luiz Alexandre Peternelli 24 5) Considere o artigo intitulado “A nonparametric test for the general two-sample problem”, por Baumgartner, Weib e Schindler; Biometrics 54, 1129 – 1135, 1998. Lá os autores apresentam uma fórmula para a estatística do teste B, como:B 2 1 (Bx + By) Onde, Bx n i i n nmm n i m i i n nm G n 1 2 )( ) 1 1( 1 )( 1 e By n j j m nmn m j m j j m nm H m 1 2 )( ) 1 1( 1 )( 1 EST 106 Prof. Luiz Alexandre Peternelli 25 OBS: Para o conjuntos dos dados X1, X2, ..., Xn e Y1, Y2, ..., Ym, o rank Gi (ou Hj) de cada elemento Xi (ou Yj) é definido como o número de dados em ambos os conjuntos que são menores ou iguais a Xi (ou Yj). Pede-se: Considerando as informações acima, calcule o valor de B para os conjuntos de dados: Xi (i = 1, 2, ..., n) = 166, 247, 295, 588, 642 Yj (j = 1, 2, ..., m) = 178, 182, 202, 393, 906 Resposta: Bx = 0,378 ; By = 0,500 ; B = 0,439 Dica: Verifique, inicialmente, que m = n = 5 e Gi (i = 1, 2, ..., n) = 1, 5, 6, 8, 9 Hj (j = 1, 2, ..., m) = 2, 3, 4, 7, 10 EST 106 Prof. Luiz Alexandre Peternelli 1 CAPÍTULO 2 - Estatística Descritiva Estatística: estatística indutiva (inferência estatística) e estatística descritiva. 1. Estatística Indutiva: (Inferência Estatística) A ser tratado no final do curso 2. Estatística Descritiva Procura somente descrever e avaliar um certo grupo, seja ele a população ou a amostra. Obs.: Quais seriam as etapas de um trabalho científico? EST 106 Prof. Luiz Alexandre Peternelli 2 Etapas de um trabalho científico: 1. Definição do problema 2. Planejamento (incluindo revisão de literatura) 3. Coleta dos dados a. Crítica dos dados 4. Apresentação dos dados a. tabelas b. gráficos 5. Descrição dos dados 6. Análise e estabelecimento de inferências. Esta parte estaria além da simples “Estatística Descritiva”. Na verdade essa etapa caracterizaria a “Estatística Indutiva”, ou também chamada “Estatística Inferencial”, ou “Inferência Estatística”. Exemplos: Estatística Descritiva EST 106 Prof. Luiz Alexandre Peternelli 3 Veremos: Apresentações (e descrições resumidas) dos dados. métodos gráficos o envolvendo apresentação gráfica e/ou o tabular métodos numéricos o envolvendo apresentações de medidas de posição e/ou o de dispersão EST 106 Prof. Luiz Alexandre Peternelli 4 3. Apresentação gráfica e tabular Gráficos: uma das formas mais eficientes de apresentação de dados. o Um gráfico é, essencialmente, uma figura constituida a partir de uma tabela. Tabelas: idéia mais precisa; possibilitam uma inspeção mais rigorosa aos dados. Gráficos: mais indicados em situações que objetivam dar uma visão mais rápida e fácil. Cuidado com as regras gerais para confecção de tabelas e gráficos Obs.: as tabelas (e figuras) devem ter significado próprio, ou seja, devem ser entendidas mesmo quando não se lê o texto em que estão apresentadas → títulos bem escritos. EST 106 Prof. Luiz Alexandre Peternelli 5 Veremos: Diagrama de pontos Diagrama de ramos-e-folhas Tabela de distribuição de frequências Histograma (e Ogiva) Outros (eventualmente) EST 106 Prof. Luiz Alexandre Peternelli 6 Diagrama de pontos (dot diagram) (ou diagrama uniaxial de variação) Útil para apresentar um pequeno conjunto de dados (até algo em torno de 20 observações). podemos ver, de uma maneira rápida e fácil: o a tendência central dos dados o sua distribuição ou variabilidade. EST 106 Prof. Luiz Alexandre Peternelli 7 Exemplo 2.1.: Considere o seguinte resultado de um experimento no qual o engenheiro testa adição de uma substância em cimento de construção para determinar seu efeito na força da tensão de aderência (em determinada unidade/cm2): Dados: 16,85 16,40 17,21 16,35 16,52 17,04 16,96 17,15 16,59 16,57 Observe que os dados estão centrados num valor próximo de 16,8 e que os valores da tensão de aderência caem no intervalo de cerca de 16,3 até 17,2 ud/cm2. EST 106 Prof. Luiz Alexandre Peternelli 8 Obs.: pode também ser usado para se comparar dois ou mais conjuntos de dados. Exemplo: suponha ter sido também verificado a tensão de aderência em cimentos não modificados com o aditivo. Dados: 17,00 17,13 17,75 17,50 17,36 17,25 17,72 17,40 17,46 17,65 Faça a comparação e conclua. EST 106 Prof. Luiz Alexandre Peternelli 9 Diagrama de ramos e folhas (stem-and-leaf diagram) Quando número de observações é relativamente grande quando se quer manter os detalhes informativos dos dados nos dá uma idéia da distribuição dos valores originais. Exemplo 2.2.: (no R) Barulho é medido em decibéis, representado por dB. Um decibel corresponde ao nível do som mais fraco que pode ser ouvido em um local silencioso por alguém com boa audição. Um sussurro corresponde a cerca de 30 dB; a voz humana em conversação normal corresponde a cerca de 70dB; um rádio em volume alto cerca de 100 dB; Desconforto para os ouvidos geralmente ocorre a cerca de 120 dB. Os dados abaixo correspondem aos níveis de barulho medidos em 36 horários diferentes em um determinado local. scripts/exemplo%202.2%20no%20cap%202%20-%20ramos%20e%20folhas.R EST 106 Prof. Luiz Alexandre Peternelli 10 82 89 94 110 74 122 112 95 100 78 65 60 90 83 87 75 114 85 69 94 124 115 107 88 97 74 72 68 83 91 90 102 77 125 108 65 6 0,5,5,8,9 7 2,4,4,5,7,8 8 2,3,3,5,7,8,9 9 0,0,1,4,4,5,7 10 0,2,7,8 11 0,2,4,5 12 2,4,5 Figura 2.2: Níveis de barulho (em decibéis) medido em 36 horários diferentes em um determinado local. EST 106 Prof. Luiz Alexandre Peternelli 11 Distribuição de frequência (forma tabular) Organização dos dados em classes de ocorrência, ou não, segundo suas frequências absolutas. Obs.: util quando o número de valores distintos da variável em estudo é muito grande. Em tais casos seria útil dividir os valores em grupos, ou intervalos de classe. Obs.: (para definir o número de classes) i) não escolher muito poucas classes, para evitar perda de informação sobre os dados; ii) não escolher muitas classes, para ão mascarar algum padrão de distribuição para a variável em estudo. Na prática: tentar variados números de classes e verificar, com a ajuda de um computador, o número ideal para os dados em questão (a não ser que as classes já sejam pré-definidas) EST 106 Prof. Luiz Alexandre Peternelli 12 Exemplo 2.3.: Tabela 2.3: Distribuição de frequências dos conceitos dos estudantes de EST 105 matriculados no Segundo semestre de 2009. Conceitos (Notas) Número de alunos Porcentagem A (90 a 100) 14 7,07 B (75 a 89) 32 16,16 C (60 a 74) 50 25,25 R (< 60) 63 31,82 L 1/ 39 19,70 198 100,00 FONTE: Departamento de Estat – UFV; 1/ Reprovação por faltas. EST 106 Prof. Luiz Alexandre Peternelli 13 Só para ilustrar comentário anterior: Comparando com a apresentação gráfica (apelo visual) A B C L R 0 1 0 2 0 3 0 4 0 5 0 6 0 A BC L R EST 106 Prof. Luiz Alexandre Peternelli 14 Exemplo 2.4.: (no R) Suponha que uma empresa deseja avaliar a distribuição dos salários pagos por hora a seus funcionários. Dados (dados brutos): 13,3 15,2 12,4 15,8 9,6 10,4 13,2 8,8 8,3 8,5 10,2 11,5 12,6 10,7 12,6 9,7 12,1 13,5 10,3 14,3 9,8 12,3 10,4 11,6 12,4 12,9 11,6 10,3 14,2 13,8 Uma maneira de escolher o número de classes (k): n Amplitude da classe: (15,8 – 8,3)/5 = 1,5 Considere a seguinte tabela (com intervalo fechado à esquerda): scripts/exemplo%202.4%20no%20cap2.r EST 106 Prof. Luiz Alexandre Peternelli 15 Tabela 2.4.: Distribuição de frequências dos salários pagos por hora aos funcionários da empresa XX Classes Frequências 8,3 |– 9,8 5 9,8 |– 11,3 7 11,3 |– 12,8 9 12,8 |– 14,3 6 14,3 |– 15,8 3 Número de observações 30 Se quiséssemos obter maiores informações sobreos dados, poderíamos montar uma nova tabela (Tabela 2.4.1.), incluindo outros tipos de frequência, como: frequência acumulada (fa), frequência relativa (fr), e frequência acumulada relativa (far). EST 106 Prof. Luiz Alexandre Peternelli 16 Tabela 2.4.1.: Distribuição de frequências (frequência simples, fi; frequências acumuladas, fai; frequências relativas, fri; e frequências acumuladas relativas, fari) dos salários pagos por hora aos funcionários da empresa XX Classes fi fai fri fari 8,3 |– 9,8 5 5 0,17 0,17 9,8 |– 11,3 7 12 0,23 0,40 11,3 |– 12,8 9 21 0,30 0,70 12,8 |– 14,3 6 27 0,20 0,90 14,3 |– 15,8 3 30 0,10 1,00 30 1,00 Verifique se consegue entender como são obtidos esses diferentes tipos de frequências. Os próprios nomes atribuidos a elas são bastante sugestivos. EST 106 Prof. Luiz Alexandre Peternelli 17 Algumas discussões: i) Na terceira coluna, a frequência acumulada 21 indica que, nessa empresa, 21 funcionários recebem salários/hora abaixo de 12,8 unidades; ii) Podemos constatar, também, uma certa predominância de salários mais baixos. Realmente cerca de 70% da distribuição de salários concentra-se até o salário de 12,8 unidades; iii) Os maiores salários servem a apenas 10% dos funcionários da empresa; iv) 40% dos funcionários (12 funcionários) recebem até 11,3 unidades, sendo 23% (ou seja, 7 funcionários) recebendo entre 9,8 e 11,3 unidades. EST 106 Prof. Luiz Alexandre Peternelli 18 Histograma É essencialmente uma representação gráfica de uma tabela de distribuição de freqüências, quando temos classes com valores numéricos apresentando continuidade. Feito a partir das frequências simples de cada classe ou a partir das frequências relativas. Bastaria informar corretamente o que seria usado no eixo vertical. EST 106 Prof. Luiz Alexandre Peternelli 19 Figura 2.4.1: aqui vem o título da figura. EST 106 Prof. Luiz Alexandre Peternelli 20 Figura 2.4.1: aqui vem o título da figura. EST 106 Prof. Luiz Alexandre Peternelli 21 Se usar as frequências acumuladas, ou frequências acumuladas relativas. Nesse caso teríamos a chamada Ogiva, ou ogiva percentual, respectivamente Figura 2.4.2.: aqui vem o título da figura. EST 106 Prof. Luiz Alexandre Peternelli 22 Obs.: comparação do uso de diferentes números de classes (classes definidas como no exemplo versus classes com amplitude 1. Qual melhor reprentaria o conjunto de dados original? classes fr e q . s im p le s 8 10 12 14 16 0 2 4 6 8 classes fr e q . s im p le s 8 10 12 14 16 0 1 2 3 4 5 6 7 EST 106 Prof. Luiz Alexandre Peternelli 23 4. Medidas de posição e de dispersão Apresentaremos algumas estatísticas úteis para resumir, de modo bastante conciso, as informações contidas em um conjunto de dados. 4.1. Medidas de Posição Veremos: Média aritmética Mediana Moda estatística: alguma quantidade numérica cujo valor é determinado pelos dados. EST 106 Prof. Luiz Alexandre Peternelli 24 4.1.1. Média Aritmética Dado um conjunto de n valores numéricos x1, x2, …, xn, n x x n i i 1 Exemplo: x = {10, 15, 11} → 12 3 36 3 111510 3 3 1 i ix x Exemplo: x = {50,20,20,30,40,30,20,40,30,30} → 31 10 310 10 30...2050 10 10 1 i ix x EST 106 Prof. Luiz Alexandre Peternelli 25 obs.: Simplificando o cálculo da média: se yi = axi + b (i = 1,...,n) e a e b são constantes, então bxa n bax n bax n y y n i n i i n i i n i i 1111 )( Exemplo 2.5.: Considere o seguinte conjunto de dados: 284, 280, 277, 282, 279, 285, 281, 283, 278, 277 encontre a média desses valores. solução: Solução direta: 10 277280284 x 280,6; outra solução: faça yi = xi – 280, ou seja, yi = 4, 0, -3, 2, -1, 5, 1, 3, -2, -3. A média dos valores transformados será: EST 106 Prof. Luiz Alexandre Peternelli 26 .6,010/6 y Desse modo, .6,280280 yx EST 106 Prof. Luiz Alexandre Peternelli 27 OBS.: média para dados organizados em uma tabela de distribuição de frequências n xf x k i ii 1 , onde k i ifn 1 Exemplo 2.6.: (no R) distribuição de frequência das idades de jovens em determinada lanchonete a determinada hora. Idade Frequência 15 14 16 15 17 14 18 4 19 5 20 2 Media ponderada Encontre a média aritmética da idade dos indivíduos: solução: x (14.15 + 15.16 + 14.17 +49.18 + 5.19 + 2.20)/54 16,57. scripts/exemplo%202.6%20no%20cap2.r EST 106 Prof. Luiz Alexandre Peternelli 28 OBS.: se a tabela for organizada em classes de valores da variável: Exemplo 2.7.: (no R) Considere a tabela abaixo, adaptada do exemplo anterior: Idade Frequência 15 a 16 29 17 a 18 18 19 a 20 7 Assim, teríamos (29.15,5) (18.17,5) (7.19,5) (29.15,5) (18.17,5) (7.19,5) (29 18 7) 54 x 16,68 Substituir as classes pelos seus pontos médios = (LSi + LIi)/2 Idade Frequência 15,5 29 17,5 18 19,5 7 Média aproximada!! scripts/exemplo%202.7%20no%20cap2.r EST 106 Prof. Luiz Alexandre Peternelli 29 4.1.2. Mediana amostral valor intermediário do rol de um conjunto de dados. Se n for ímpar: Xmd será o valor que ocupa a posição (n + 1)/2; Exemplo: X = {1, 2, 5, 8, 10, 15, 18} → Xmd = X(n+1)/2 = X(7+1)/2 = X4 = 8 se n for par: mediana será a média dos valores ocupando as posições n/2 e n/2 +1. Exemplo: X = {1, 2, 15, 8, 10, 5, 18, 9} → Xmd = 0,5[Xn/2 + Xn/2 +1] = 0,5[X4 + X5] = 8,5 EST 106 Prof. Luiz Alexandre Peternelli 30 Exemplo 2.8.: Dados Idade Frequência 15 14 16 15 17 14 18 4 19 5 20 2 n = 54 solução: já que temos 54 observações, segue que a mediana amostral será a media dos valores ocupando as posições 27 e 28, quando essas 54 observações são organizadas em ordem crescente. Portanto a mediana será o valor 16. Encontre a mediana da idade dos indivíduos: EST 106 Prof. Luiz Alexandre Peternelli 31 OBS.: a escolha entre média e mediana depende do tipo de informação que o pesquisador tenta obter dos dados. A media é afetada por valores extremos ocorrendo na distribuição, enquanto a mediana faz uso de apenas um ou dois valores centrais, não sendo, portanto, afetada por valores extremos. Exemplos: EST 106 Prof. Luiz Alexandre Peternelli 32 4.1.3. Moda amostral É o valor que ocorre com maior frequência. Podemos ter séries amodais, unimodais, bimodais ou multimodais, dependendo do número de valores modais (0, 1, 2, mais que 2, respectivamente) ocorrendo na amostra. Exemplo 2.9.: Dados Idade Frequência 15 14 16 15 17 14 18 4 19 5 20 2 n = 54 Xmo = 16 Justificativa: esse valor ocorre com maior frequência na distribuição. Essa seria uma distribuição unimodal. EST 106 Prof. Luiz Alexandre Peternelli 33 4.2. Medidas de Dispersão Úteis para complementar as informações fornecidas pelas medidas de posição. Descrevem a variabilidade ocorrendo no conjunto de dados sendo analisados. Exemplo introdutório: Sejam as notas (em matemática, inglês e biologia) de dois candidatos a certo emprego: X = {100, 60, 80} Y = {81, 82, 77} Qual candidato você selecionaria? Justifique. EST 106 Prof. Luiz Alexandre Peternelli 34 4.2.1. Variância amostral A variância amostral de um conjunto de dados, x1, x2, …, xn, é definida por 1 )( 1 2 2 n xx s n i i = 1n SQD x , Exemplo 2.10.: encontre a variância amostral para os dois conjuntos de dados abaixo: A: 3, 4, 6, 7, 10 B: -20, 5, 15, 24 solução: a média para o conjunto A é 6; portanto a variância será: s2 = [(-3)2+(-2)2 + (0)2 + 12 + 42]/4 = 7,5 a média para o conjunto B também é 6; portanto a variância de B será: s2 = [(-26)2 + (-1)2 + 92 + (18)2]/3 360,67 SQDx: soma de quadrados dos desvios de X. EST 106 Prof. Luiz Alexandre Peternelli 35 Obs.: Para o cálculo da variância útil se faz a seguinte identidade algébrica: n x xxnx)xx( 2n 1i in 1i 2 i 2 n 1i 2 i n 1i 2 i Obs.: o cálculo da variância pode ser simplificado por notar que se: baxy ii , i = 1, …, n então 221 22 1 2 2 1 )( 1 )( x n i i n i i y sa n xxa n yy s EST 106 Prof. Luiz Alexandre Peternelli 36 Exemplo 2.11.: O conjunto de dados abaixo fornece o número mundial de acidentes aéreos fatais de aeronaves comerciais nos anos de 1985 a 1993. Ano 1985 1986 1987 1988 1989 1990 1991 1992 1993 Acidentes 22 22 26 28 27 25 30 29 24 encontre a variância amostral do número de acidentes nesses anos. solução: considere o seguinte conjunto de dados resultante da subtração de 22 de cada valor original: 0, 0, 4, 6, 5, 3, 8, 7, 2 chamando esses valores de y1, y2, …, y9, teremos ,35 9 1 i iy 203 9 1 2 i y . 361,8 8 )9/35(9203 2 2 s EST 106 Prof. Luiz Alexandre Peternelli 37 OBS.: se a cada valor de X tivermos associado sua frequência de ocorrência, então 1 )( 2 2 i i i ii f xxf s = 1 )( 2 2 i i i i i ii ii f f xf xf = 1n SQD EST 106 Prof. Luiz Alexandre Peternelli 38 Exemplo 2.12.:(no R) Dados: Idade Frequência 15 14 16 15 17 14 18 4 19 5 20 2 Problema: cálculo pode conter muitos erros acumulados (aproximações sobre aproximações). Alternativa: SQD = i i i ii ii f xf xf 2 2 )( . encontre a variância da idade dos indivíduos solução: n = soma das frequências = 54; média = 16,6 SQD = 14(15 – 16,6)2 + 15(16 – 16,6)2 + ... + 2(20 – 16,6)2 = 103,24 Assim, s2 = 103,24/53 1,9479; Soma dos quadrados = 14.152 + 15.162 + ... + 2.202 = 14937 Soma simples = 14.15 + 15.16 + ... + 2.20 = 895 Logo, SQD = 14937 – (895)2/54 103,2037 e s2 = 103,2037/53 = 1,9472 scripts/exemplo%202.12%20no%20cap2.r EST 106 Prof. Luiz Alexandre Peternelli 39 Exemplo 2.13.: (no R) Considere a tabela abaixo, adaptada do exemplo anterior: Idade Frequência 15 a 16 29 17 a 18 18 19 a 20 7 Assim, teríamos soma de quadrados = 29.15,52 + 18.17,52 + 7.19,52 = 15141,5 soma simples = 29.15,5 + 18.17,5 + 7.19,5 = 901 Assim, SQD = 15141,5 – (901)2/54 = 108,1481 e s2 = 108,1481/53 2,0405. Substituir as classes pelos seus pontos médios = (LSi + LIi)/2 Idade Frequência 15,5 29 17,5 18 19,5 7 variância aproximada scripts/exemplo%202.13%20no%20cap2.r EST 106 Prof. Luiz Alexandre Peternelli 40 4.2.2. Desvio padrão amostral Raiz quadrada positiva da variância amostral 1 )( 1 2 2 n xx ss n i i EST 106 Prof. Luiz Alexandre Peternelli 41 4.2.3. Amplitude total A amplitude total (AT) é a diferença entre o maior e o menor valor da série. AT = max(X) – min(X) Tem a vantagem de ser rápido e fácil de ser calculada Fornece um número índice grosseiro da variabilidade de uma distribuição, por levar em conta apenas 2 valores de um conjunto. EST 106 Prof. Luiz Alexandre Peternelli 42 4.2.4. Erro-padrão da média O erro-padrão da média mede a precisão da média. Sua fórmula é dada por: n s n s XVsXs XX X 2 )()( Obs.: maior erro padrão da média → menor precisão menor erro padrão da média → maior precisão Obs.: como ter confiança nos dados obtidos de certo experimento? Ou seja, como obter maior precisão num experimento? Discutir... EST 106 Prof. Luiz Alexandre Peternelli 43 4.2.5. Coeficiente de Variação É uma medida de dispersão relativa. Útil para comparação, em termos relativos, do grau de concentração, em torno da média, de séries distintas. Permite a comparação de séries de variáveis com unidades diferentes. 100(%)CV X sX OBS.: sejam duas amostras distintas A e B. A amostra mais homogênea (de menor variabilidade relativa) será a que tiver o menor CV. Obs.: se BA XX , então o próprio desvio padrão informará qual é a mais homogênea. Obs.: valores muito altos de C.V. indicam pequena representatividade da média. EST 106 Prof. Luiz Alexandre Peternelli 44 Exemplo 2.14.: Supor duas amostras: A={1, 3, 5}; B={53, 55, 57}. Pergunta-se: Qual das duas é a mais homogênea? solução: C.V.A = 2/3(100) = 66,7%; C.V.B = 2/55(100) = 3,6% Portanto a amostra B é a mais homogênea. EST 106 Prof. Luiz Alexandre Peternelli 45 Exercícios resolvidos: Exemplo 2.15. (no R) Considere os dados (fictícios) abaixo referentes ao tempo em minutos de secagem de certa mistura especial de concreto, que está sob pesquisa. 13,2 23,3 20,9 9,0 14,7 12,7 18,0 11,8 4,7 10,6 17,8 9,6 5,6 12,7 10,5 26,6 2,1 3,0 11,6 18,8 22,2 9,0 10,8 15,0 16,8 24,3 13,9 14,1 15,1 19,5 23,7 10,9 15,2 23,7 17,9 28,3 18,1 27,5 20,8 23,5 34,8 30,8 12,2 8,8 28,5 31,2 24,2 11,4 14,1 32,3 Utilize apenas a primeira linha scripts/exemplo%202.15%20no%20cap2.r EST 106 Prof. Luiz Alexandre Peternelli 46 a) Obtenha a média do tempo de secagem; min89,13 10 9,138 10 10,64,711,818,012,714,79,020,923,313,21 n X X n i i b) Obtenha a mediana do tempo de secagem. Interprete o resultado obtido; Dados ordenados: 4,7 9,0 10,6 11,8 12,7 13,2 14,7 18,0 10,9 23,3 min95,12)2,137,12( 2 1 )( 2 1 2 1 10 65 1 22 xxXXXn nnmd EST 106 Prof. Luiz Alexandre Peternelli 47 c) Obtenha o desvio padrão do tempo de secagem; min5846,5 min1876,31 9 689,280 1 689,280 10 9,138 01,2210 01,221010,6²4,7²11,8²18,0²12,7²14,7²9,0²20,9²23,3²13,2² 138,910,64,711,818,012,714,79,020,923,313,2 2 22 2 2 2 2 ss n SQD s n x xSQD x x i i i i EST 106 Prof. Luiz Alexandre Peternelli 48 Exemplo 2.16. (no R) Considerando os dados do exemplo anterior (exemplo 2.15.), pede-se: Monte uma tabela de distribuição de freqüências com 5 classes de amplitude 7, e limite inferior da primeira classe igual a 1(um). Use intervalo fechado à esquerda e aberto à direita. a) Apresente a tabela no espaço abaixo. classes if [1 , 8) 4 [8 , 15) 19 [15 , 22) 12 [22 , 29) 11 [29 , 36) 4 50 scripts/exemplo%202.16%20no%20cap2.r EST 106 Prof. Luiz Alexandre Peternelli 49 b) Com referência à tabela em a, calcule a média aproximada do tempo de secagem c) Com referência à tabela em a, calcule a mediana aproximada do tempo de secagem. if Pmi 4 4,5 19 11,5 12 18,5 11 25,5 4 32,5 iaf Pmi 4 4,5 23 11,5 35 18,5 46 25,5 50 32,5 min38,17 50 869 50 32,5425,51118,51211,5194,54 5 1 5 1 i i i mii f Pf X R.: Classe mediana é a terceira que contém do 24X ao 35X Portanto mediana = 18,5 min EST 106 Prof. Luiz Alexandre Peternelli 50 d) Com referência à tabela em a, calcule a moda aproximada do tempo de secagem. R.: classe modal é a que possui maior freqüência. [8 ; 35) moda min5,115 158 e) Com referência à tabela em a, calcule o desvio padrão aproximado de X; if Pmi 4 4,5 19 11,5 12 18,5 11 25,5 4 32,5 min79,7 min72,60 49 28,2975 1 28,2975 50 869 5,18078 18078,532,5²425,5²1118,5²1211,5²194,5²4 86932,5425,51118,51211,5194,54 2 22 2 2 2 2 ss n SQDs n x xSQD xf xf PX i i ii ii mii EST 106 Prof. Luiz Alexandre Peternelli 51 f) Explique o motivo de estarmos nos referindo aos valores dos itens b,c,d e e acima como valores aproximados; g) Com referência à tabela em a, apresente o histograma. EST 106 Prof. Luiz Alexandre Peternelli 52 Exercícios Propostos 1) Considerando os dados amostrais abaixo, calcular: média aritmética, variância, desvio padrão, erro padrão da média e coeficiente de variação. (no R) Dados: 2, 3, 5, 1, 2, 1, 4, 3, 3, 4, 3.; R.:2,81; 1,56; 1,25; 0,37; 44,37% 2) Em certa região a temperatura média é 20 0C e a precipitação média é 700 mm. O desvio padrão para temperatura é 3 0C, enquanto que a variância para a precipitação é 1225 mm2. Qual dos dois fenômenos apresenta maior variabilidade? Justifique. R.: a temperatura apresenta maior variabilidade relativa. Você justifica… scripts/cap2%20exerc%20propostos%201.r EST 106 Prof. Luiz Alexandre Peternelli 53 3) Um artigo retirado da revista Technometrics (Vol. 19, 1977, p. 425) apresenta os seguintes dados sobre a taxa de octanagem de várias misturas de gasolina: (no R) 88,5 87,7 83,4 86,7 87,5 91,5 88,6 100,3 96,5 93,3 94,7 91,1 91,0 94,2 87,8 89,9 88,3 87,6 84,3 86,7 84,3 86,7 88,2 90,8 88,3 98,8 94,2 92,7 93,2 91,0 90,1 93,4 88,5 90,1 89,2 88,3 85,3 87,9 88,6 90,9 89,0 96,1 93,3 91,8 92,3 90,4 90,1 93,0 88,7 89,9 89,8 89,6 87,4 88,4 88,9 91,2 89,3 94,4 92,7 91,8 91,6 90,4 91,1 92,6 89,8 90,6 91,1 90,4 89,3 89,7 90,3 91,6 90,5 93,7 92,7 92,2 92,2 91,2 91,0 92,2 90,0 90,7 a) Construa o diagrama de folhas-e-ramos para esses dados b) Construa a distribuição de frequência e o histograma. Use 8 intervalos de classe. c) Construa a distribuição de frequência e o histograma, agora com 16 intervalos de classe. d) Compare a forma dos dois histogramas em b e c. Ambos os histogramas mostram informações similares? scripts/cap2%20exerc%20propostos%203.r EST 106 Prof. Luiz Alexandre Peternelli 54 4) O seguinte conjunto de dados representa as “vidas” de 40 baterias de carro da mesma marca e mesmas características com aproximação até décimos do ano. As baterias tinham garantia para 3 anos. 2,2 4,1 3,5 4,5 3,2 3,7 3,0 2,6 3,4 1,6 3,1 3,3 3,8 3,1 4,7 3,7 2,5 4,3 3,4 3,6 2,9 3,3 3,9 3,1 3,3 3,1 3,7 4,4 3,2 4,1 1,9 3,4 4,7 3,8 3,2 2,6 3,9 3,0 4,2 3,5 a) Construa a distribuição de frequência e o histograma; b) Faça o gráfico da distribuição de frequências relativas acumuladas. c) Calcule a média aritmética dos dados originais d) Usando a distribuição de frequência conforme obtido em a calcule a média novamente. Para tal, considere os pontos médios de cada classe (média entre os dois limites de cada classe) para serem os valores da variável no cálculo da média. e) Obtenha a variância para os dados originais conforme feito para a média em c. EST 106 Prof. Luiz Alexandre Peternelli 55 f) Obtenha a variância a partir da distribuição de frequência conforme feito para a média no ítem d. obs.: use 7 intervalos de classe. Amplitude da classe igual a 0,5. E o início do intervalo mais baixo em 1,5. 5) Mostre que 2 )( i ii xxf = i i i ii ii f xf xf 2 2 )( 6) Mostre que a soma dos desvios em relação à média, n i i xx )( , é igual a zero. EST 106 Prof. Luiz Alexandre Peternelli 56 7) Considere a distribuição das notas dos estudantes de INF162 do I/2001: Classes fi Pmi [0, 20) [20, 40) [40, 60) [60, 80) [80, 100] 2 4 14 49 9 10 30 50 70 90 Pede-se: a) Calcule o valor aproximado para a média amostral. R: 65,13 b) Indique a classe de valores que contém a mediana amostral. c) Calcule o valor aproximado para o erro padrão da média. R: 1,86 d) Se subtrairmos 50 de cada valor original, como seria a nova tabela de distribuição das frequências? d.1) Qual seria a média aproximada dos novos valores? R: 15,13 EST 106 Prof. Luiz Alexandre Peternelli 57 d.2) Qual seria a variância aproximada dos novos valores? R: 272,0612 e) Sabe-se que, para os valores originais, a média amostral é igual a 64,24167, e a variância amostral é 253,6385. Obtenha a soma dos quadrados dos valores originais. R:341435,52 OBS: Os valores podem não ser exatos devido a pequenas aproximações realizadas. f) A partir da tabela dada no problema, construa o histograma e a ogiva percentual. g) Qual dos gráficos do item “f” deve ser usado para obter o valor aproximado da mediana? Obtenha esse valor. 8) Mostre que a soma de quadrados dos desvios (SQD) em relação à média é um mínimo. Dica: Considere f(a) a função que representa a SQD em relação a a. Ou seja, n i i axaf 1 2 )()( . EST 106 Prof. Luiz Alexandre Peternelli 58 Usando seus conhecimentos de cálculo, mostre que f(a) será mínimo quando a for igual a média dos valores de X. 9) Calcule a média, mediana, e amplitude total dos valores dispostos no seguinte diagrama de ramos-e-folhas 6 0 5 5 8 9 7 2 4 4 5 7 8 8 2 3 3 5 7 8 9 9 0 0 1 4 4 5 7 10 0 2 7 8 11 0 2 4 5 12 2 4 5 R.: respectivamente: 90,6; 89,5; 65. EST 106 Prof. Luiz Alexandre Peternelli 1 CAPÍTULO 3 - Tópicos gerais de probabilidade 1. Introdução base para: o entender como a inferência estatística e as técnicas de auxílio de decisão são desenvolvidas, o porque elas funcionam, o e como as conclusões obtidas a partir desses procedimentos podem ser apresentadas e interpretadas corretamente. Para o perfeito entendimento de probabilidade, alguns conceitos são importantes. EST 106 Prof. Luiz Alexandre Peternelli 2 2. Alguns Conceitos 2.1.Experimentos probabilísticos ou aleatórios Um experimento que pode resultar em diferentes resultados, mesmo que seja repetido sempre da mesma maneira várias vezes Obs.: “experimento”: um ensaio científico destinado à certificação de um fenômeno. Características de um experimento aleatório: o Cada experimento poderá ser repetido indefinidamente sob condições essencialmente inalteradas. o Difícil afirmar o resultado exato, mas é possível descrever o conjunto de todos os possíveis resultados de um experimento. EST 106 Prof. Luiz Alexandre Peternelli 3 o se o experimento for repetido um grande número de vezes, uma certa regularidade surgirá. esta regularidade → modelo matemático preciso → se analisará o experimento. EST 106 Prof. Luiz Alexandre Peternelli 4 Exemplo 3.1.: (i) 1E : Ensaiar uma lâmpada quanto a duração da vida até queimar (ii) 2E : Escolher, ao acaso, um ponto de um círculo de raio unitário. (iii) 3E : Registrar as vazões num certo rio, no mesmo mês, dia e hora em anos sucessivos. (iv) 4E : jogar um dado ao ar e observar a sua face superior. (v) E5 : Seleção de três ítens ao acaso de uma linha de fabricação. Cada ítem é inspecionado e classificado com defeituoso ou não defeituoso. EST 106 Prof. Luiz Alexandre Peternelli 5 2.2.Espaço amostral (S) O conjunto de todos os possíveis resultados de um experimento aleatório Exemplo 3.2.: Veja experimentos aleatórios exemplificados anteriormente: (i) S1 = {t | t 0} (ii) S2 = {(x,y); x 2 + y2 1} (iii) S3 = {q | 0 q qmax} , onde q é a vazão (iv) S4 = {1, 2, 3, 4, 5, 6} (v) S5 = {DDD, DDN, DND, DNN, NDD, NDN, NND, NNN} EST 106 Prof. Luiz Alexandre Peternelli 6 2.3.Eventos um subconjunto do espaço amostral de um experimento aleatório. Exemplo 3.3.: Veja o S4 apresentado acima. Possíveis eventos: A={sair número par}={2,4,6}; ou B={sair número maior que 4}={5,6}, etc. OBS.:Novos eventos podem ser originados da combinação de eventos existentes. união de eventos → E1 E2. interseção de eventos → E1 E2. complemento de um evento → E (ou Ec)EST 106 Prof. Luiz Alexandre Peternelli 7 2.4.Eventos Mutuamente Exclusivos AB = Exemplo 3.4.: Veja S4 acima. Considere os eventos A={1}; B={5, 6}; C={número par}. Então: A e B são mutuamente exclusivos pois AB = A e C são mutuamente exclusivos pois AC = B e C não são mutuamente exclusivos pois BC = {6}. EST 106 Prof. Luiz Alexandre Peternelli 8 3. Noções Fundamentais de Probabilidade - Conceitos Como atribuir valores de probabilidade a eventos? Conceito subjetivo, moderno ou axiomático de probabilidade conceito clássico ou probabilidade a priori frequência relativa ou probabilidade a posteriori ou probabilidade empírica Probabilidade geométrica Combinando resultados... o Uso de teoremas o Probabilidade condicional o Produto das probabilidades o Independência probabilística o Partição do espaço amostral e teorema de Bayes EST 106 Prof. Luiz Alexandre Peternelli 9 3.1.Um conceito Seja E um experimento aleatório. Seja S um espaço amostral associado ao experimento E. Podemos entender a probabilidade como sendo em número real associado a um evento A qualquer, que satisfaz às seguintes propriedades: (1) )A(P0 (2) P(S) = 1 (3) Se A e B são eventos mutuamente exclusivos, então P(AB) = P(A) + P(B) Generalizando ... P(A1A2...An) = P(A1) + P(A2) + ... + P(An) = 1 n i P(Ai) conceito subjetivo, moderno ou axiomático de probabilidade. Exemplo: EST 106 Prof. Luiz Alexandre Peternelli 10 3.2.Outro Conceito NCF P(A)= NCP Regra mais prática → conceito clássico ou probabilidade a priori. jogos de azar → origem à teoria de probabilidade nos idos do século XVI. se aplica a situações em que temos S finitos, equiprováveis e enumeráveis. Espaço amostral finito equiprovável: S = {a1, a2, …, an} iaP Probabilidade de ai = n 1 n,...,2,1i,0aP i e 1)a(P i n 1i EST 106 Prof. Luiz Alexandre Peternelli 11 Exemplo 3.5.: i) Seja E o experimento relativo ao lançamento de um dado honesto. Seja A o evento ocorrência da face 6. Portanto, S = { 1, 2, 3, 4, 5, 6} e P(A) = 1/6 ii) Considerando ainda o mesmo experimento, seja B o evento ocorrência de uma face par. Logo, B = {2, 4, 6}; então: P(B) = 3/6 = ½ iii) Seja o espaço amostral referente ao número de caras obtidas em dois lances de uma moeda. Seja A o evento ocorrência de uma cara. Então, S = {0, 1, 2} e A = {1}. Qual seria a P(A)? EST 106 Prof. Luiz Alexandre Peternelli 12 Cuidado! espaço amostral original: S' = {cc, ck, kc, kk}, sendo c=cara e k=coroa, vê-se que A = {ck, kc} e, portanto, P(A) = 2/4 = 1/2. Exemplo: EST 106 Prof. Luiz Alexandre Peternelli 13 3.3.Ainda outro conceito maneira teórica mais objetiva se experimento pode ser repetido indefinidas vezes. ( )lim ( )r A n f P A . frequência relativa ou probabilidade a posteriori ou probabilidade empírica. EST 106 Prof. Luiz Alexandre Peternelli 14 Exemplo 3.6.: Em 660 lançamentos de uma moeda foram observadas 310 caras. Qual a probabilidade de, num lançamento dessa moeda obter-se coroa? f = 350/660 = 0,5303. Esta frequência relativa seria a estimativa da probabilidade do evento A={obter coroa num lançamento dessa moeda}. Exemplo 3.7.: (série histórica) Em Sobral, no Ceará, observaram-se seis anos de seca no período 1901-66 (66 anos). Qual é a probabilidade do próximo ano ser seco? Aqui, a estimativa f da probabilidade p será: f = 6/66 = 1/11. EST 106 Prof. Luiz Alexandre Peternelli 15 Importante: A probabilidade assim determinada é apenas uma estimativa do verdadeiro valor. Quanto maior a amostra, mais confiável é a estimativa da probabilidade (desde que os princípios teóricos de amostragem sejam considerados ). A probabilidade só é válida para um conjunto de condições idênticas àquelas sob as quais se originaram os dados. EST 106 Prof. Luiz Alexandre Peternelli 16 Exemplo 3.8.: A tabela a seguir apresenta o resultado hipotético do lançamento de uma moeda 10 vezes consecutivas Face Freqüência observada Freqüência relativa Freqüência esperada Freqüência esperada relativa Cara 2 2/10 = 0,2 5 1/2 = 0,5 coroa 8 8/10 = 0,8 5 1/2 = 0,5 10 1,0 EST 106 Prof. Luiz Alexandre Peternelli 17 0 1 2 3 4 5 6 0 2 4 sample(6, 6, T) 1 2 3 4 5 6 0 2 4 sample(6, 12, T) 0 1 2 3 4 5 6 0 4 8 1 4 sample(6, 60, T) 1 2 3 4 5 6 0 2 0 4 0 sample(6, 240, T) 1 2 3 4 5 6 0 2 0 0 sample(6, 2400, T) 1 2 3 4 5 6 0 2 0 0 0 sample(6, 24000, T) Exemplo 3.9.: Arremessos de um dado honesto (6 a 24000 vezes). (no R) EST 106 Prof. Luiz Alexandre Peternelli 18 3.4.Uma definição – Probabilidade Geométrica Suponhamos que um segmento l seja parte de um outro segmento L Escolhe-se ao acaso um ponto de L . Se admitirmos que a probabilidade de este ponto pertencer a l é proporcional ao comprimento de l e não depende do lugar que l ocupa em L , então a probabilidade de que o ponto selecionado esteja em l será L l P de ocompriment de ocompriment Exemplo: EST 106 Prof. Luiz Alexandre Peternelli 19 Analogamente: suponhamos que uma figura plana g seja parte de uma outra figura plana G Escolhe-se ao acaso um ponto de G. Se admitirmos que a probabilidade de este ponto pertencer a g é proporcional à área de g e não depende do lugar que g ocupa em G, então a probabilidade de que o ponto selecionado esteja em g será: G g P de área de área Exemplo: EST 106 Prof. Luiz Alexandre Peternelli 20 4. Principais Teoremas para o Cálculo de Probabilidades Cálculo de probabilidades: o axiomas (conceito moderno) o Teoremas auxíliares. Obs.: diagramas de Venn → compreensão dos teoremas e demonstração. I) Se for o conjunto vazio, então P() = 0 Prova: A = A P(A) = P(A) = P(A) + P() (propriedade 2) logo, P() = P(A) – P(A) = 0 EST 106 Prof. Luiz Alexandre Peternelli 21 II) Se Ac é o complemento de A, então P(Ac) = 1 – P(A) Diagrama: Prova: S = A Ac 1 = P(A) + P(Ac) (propriedades 2 e 3) logo, P(Ac) = 1 – P(A). A Ac S EST 106 Prof. Luiz Alexandre Peternelli 22 III) Se A e B forem dois eventos quaisquer, então P(AB) = P(A) + P(B) – P(AB) Diagrama: Prova: A idéia desta demonstração é decompor AB e B em dois eventos mutuamente exclusivos. logo, podemos escrever: AB = A (B Ac) ......(1) B = (AB) (B Ac) .....(2) consequentemente, P(AB) = P(A) + P(B Ac) .....(1) P(B) = P(AB) + P(BA ) .....(2) Fazendo-se (1) – (2), tem-se: A B AB EST 106 Prof. Luiz Alexandre Peternelli 23 P(AB) - P(B) = P(A) – P(AB) e , então: P(AB) = P(A) + P(B) – P(AB) FATO: Para três eventos quaisquer A, B e C, temos que: P(ABC) = P(A) + P(B) + P(C) – P(AB) – P(AC) – P(BC) + P(ABC) Exemplo: EST 106 Prof. Luiz Alexandre Peternelli 24 IV) Se A B, então P(A) P(B) Diagrama: Prova: B = A (B Ac) P(B) = P[A (B Ac)] P(B) = P(A) + P(B Ac) logo P(B) é P(A) pois P(B Ac) é 0 (propriedade 1) A B EST 106 Prof. Luiz Alexandre Peternelli 25 5. Probabilidade Condicional Sejam E → S → eventos A e B P(B|A) = ( ) ( ) P A B P A , para P(A) > 0 Analogamente: P(A|B) = ( ) ( ) P A B P B , para P(B) > 0 Obs.: Pode-se verificar que P(B|A) satisfaz aos postulados de probabilidade: i. 0 ≤ P(B|A) ≤ 1 ii. P(S|A) = 1 iii. P[(B1 B2)|A] = P(B1|A) + P(B2|A) – P[(B1 B2)|A], ou P(B1|A) + P(B2|A) se B1 B2 = . Obs: Se A e B são eventos mutuamente exclusivos, então: P(B|A) = P(A|B) = 0 EST 106 Prof. Luiz Alexandre Peternelli26 Exemplo 3.12.: Os dados abaixo se referem a 200 alunos matriculados em determinado Instituto de matemática, de acordo com o sexo e o curso: Masculino Feminino Total Matemática Pura 60 50 110 Estatística 80 10 90 Total 140 60 200 Qual seria a probabilidade de uma pessoa aleatoriamente escolhida: a) Estar matriculada em matemática pura? b) Estar matriculada em matemática pura, dado ser homem? c) Ser homem? d) Ser homem dado que está matriculado em estatística? e) Estar matriculada em matemática pura, sabendo-se que é mulher? EST 106 Prof. Luiz Alexandre Peternelli 27 Solução: sejam os eventos: A={aluno faz matemática pura} E={aluno faz estatística} M={aluno é do sexo masculino} F={aluno é do sexo feminino} a) Estar matriculada em matemática pura? P(A) = 110 200 NCF NCP b) Estar matriculada em matemática pura, dado ser homem? P(A|M) = 60 ( ) 60200 140( ) 140 200 P A M P M EST 106 Prof. Luiz Alexandre Peternelli 28 c) Ser homem? P(M) = 140 200 d) Ser homem dado que está matriculado em estatística? P(M|E) = 80 ( ) 80200 90( ) 90 200 P M E P E e) Estar matriculada em matemática pura, sabendo-se que é mulher? P(A|F) = 50 ( ) 50200 60( ) 60 200 P A F P F EST 106 Prof. Luiz Alexandre Peternelli 29 Obs.: A P(B|A) pode ser calculada de duas maneiras: i) pela definição → P(AB) e P(A) são calculados em relação ao espaço amostral original S; ii) pelo conceito → espaço amostral reduzido. Exemplo extra EST 106 Prof. Luiz Alexandre Peternelli 30 6. Teorema do Produto das Probabilidades Se ( ) ( | ) ( ) P A H P A H P H então P(AH) = P(A|H) . P(H) Para três eventos A, B, C: P(ABC) = P[C|(AB)] . P(B|A) . P(A) EST 106 Prof. Luiz Alexandre Peternelli 31 7. Independência Estocástica (ou Probabilística) Seja E → S → eventos A e B. A e B são independentes se: P(A|B) = P(A) ou P(B|A) = P(B) → P(AB) = P(A) . P(B) Obs: n eventos A1, A2, ..., An são mutuamente independentes se: Para 1<i<j<k<n 1 2 1 ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) i j i j i j k i j k n n l l P A A P A P A P A A A P A P A P A P A A A P A EST 106 Prof. Luiz Alexandre Peternelli 32 Obs.: caso de três eventos três eventos A1, A2, A3 são mutuamente independentes se: 1 2 1 2 1 3 1 3 2 3 2 3 1 2 3 1 2 3 ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) P A A P A P A P A A P A P A P A A P A P A P A A A P A P A P A Exemplo: EST 106 Prof. Luiz Alexandre Peternelli 33 Exemplo 3.14. Suponha que o cálculo da estrutura de certa construção esteja sendo realizado, independentemente, por dois engenheiros recém formados. Sabe-se que profissionais pouco experientes como estes erram este tipo de cálculo, em média, 8 vezes a cada 40 que executam. Pergunta-se: Qual a probabilidade de ambos não errarem no cálculo da estrutura dessa construção. Solução: P(errar) = 8/40 = 0,2 → P(não errar) = P(N) = 1 – 0,2 = 0,8 Logo P(ambos não errarem) P(N1N2) = P(N1)P(N2) = 0,8 2 = 0,64 EST 106 Prof. Luiz Alexandre Peternelli 34 8. Partição do Espaço Amostral e o Teorema de BAYES 8.1. Teorema da Probabilidade Total A = (AB1) (AB2) ... (ABn) Logo: P(A) = P(AB1) + P(AB2) + ... + P(ABn) Mediante aplicação da probabilidade condicional e teorema do produto: B1 B2 B3 B4 Bn A EST 106 Prof. Luiz Alexandre Peternelli 35 P(ABi) = P(A|Bi) P(Bi), teremos P(A) = P(A|B1) P(B1) + P(A|B2) P(B2) + … + P(A|Bn) P(Bn) Ou seja, 1 ( ) ( | ) ( ) n i i i P A P A B P B EST 106 Prof. Luiz Alexandre Peternelli 36 8.2. Teorema de Bayes Sejam A e B dois eventos arbitrários com P(A) > 0 e P(B) > 0. Então: P(B|A) = ( ) ( | ) ( ) ( ) ( ) P B A P A B P B P A P A Combinando este resultado com o teorema da probabilidade total, temos: 1 ( | ) ( ) ( | ) ( | ) ( ) j j j n i i i P A B P B P B A P A B P B EST 106 Prof. Luiz Alexandre Peternelli 37 Exemplo extra: Certo armazém recebe produtos dos fornecedores A, B e C na proporção 30:30:40, ou seja, 30% de A, 30% de B e 40% de C. De cada fornecedor sabemos que 10, 5 e 2% de sua produção são de produtos de pior qualidade (Ruins). Escolhido ao acaso um produto do armazém, pede-se: a) Qual a probabilidade do produto ser de pior qualidade? b) Sabendo-se que o produto é de pior qualidade, qual a probabilidade de que tenha vindo do fornecedor B)? c) Se você encontrou um produto de “ruim” e quer fazer uma reclamação, para qual fornecedor deverá ser dirigida tal reclamação? Suponha que você possa realizar apenas uma única reclamação, ou seja, apenas um dos fornecedores poderá ser contactado. EST 106 Prof. Luiz Alexandre Peternelli 38 Exemplo 3.15.: Em uma escola, as turmas A, B e C têm 40, 50 e 10 % do total de alunos de determinada série, respectivamente. Dos alunos de cada turma, 3, 5 e 2 %, respectivamente, serão reprovados. Escolhido ao acaso um aluno dessa série, pede-se: Qual a probabilidade de o aluno ser reprovado? Seleciona-se ao acaso um aluno dessa escola. Sabendo-se que o aluno será reprovado, qual a probabilidade de que ele seja da turma B? Solução: Sejam os eventos: A={aluno da turma A} B={aluno da turma B} C={aluno da turma C} R={aluno reprovado} Método 1: EST 106 Prof. Luiz Alexandre Peternelli 39 P(A) = 0,40 P(B) = 0,50 P(C) = 0,10 P(R/A) = 0,03 P(R/B) = 0,05 P(R/C) = 0,02 a) )CR()BR()AR(R P(R) = P(RA) + P(RB) + P(RC) P(R) = P(A) . P(R/A) + P(B) . P(R/B) + P(C) . P(R/C) P(R) = 0,40 . 0,03 + 0,50 . 0,05 + 0,10 . 0,02 P(R) = 0,012 + 0,025 + 0,002 = 0,039 b) P(B/R) = P B R P R P B P R B P R ( ) ( ) ( ). ( / ) ( ) , . , , , , , 0 50 0 05 0 039 0 025 0 039 25 39 0 641 Método 2: EST 106 Prof. Luiz Alexandre Peternelli 40 R R A 0,012 0,388 0,40 B 0,025 0,475 0,50 C 0,002 0,098 0,10 0,039 0,961 1,00 a) P(R) = 0,039 b) P(B/R) = 0 025 0 039 0 641 , , , Método 3: (Diagrama em árvore) A B C 0,40 0,50 0,10 R R R R R R 0,03 0,97 0,05 0,95 0,02 0,98 EST 106 Prof. Luiz Alexandre Peternelli 41 a) P(R) = P(AR) + P(BR) + P(CR) = 0,40 . 0,03 + 0,50 . 0,05 + 0,10 . 0,02 = 0,039 b) P(B/R) = P B R P R ( ) ( ) , . , , , 0 50 0 05 0 039 0 641 EST 106 Prof. Luiz Alexandre Peternelli 42 Exercícios propostos 1. Numa prova há 7 questões do tipo verdadeiro-falso ( V ou F ). Calcule a probabilidade de acertarmos todas as 7 questões se: a) Escolhermos aleatoriamente as 7 respostas. b) Escolhermos aleatoriamente as respostas, mas, sabendo que ha mais respostas V do F. 2. Num exame de múltipla escolha há 3 alternativas para cada questão e apenas uma delas é correta. Portanto, para cada questão, um aluno tem probabilidade 1/3 de escolher a resposta correta se ele esta assinalando aleatoriamente e 1 se sabe a resposta. Um estudante sabe 30% das respostas do exame. Se ele assinalou corretamente uma das questões, qual é a probabilidade de que ele tenha a assinalado ao acaso ? EST 106 Prof. Luiz Alexandre Peternelli 43 3. Certa firma utiliza um teste para classificar os funcionários em categorias; ao final eles são classificados em: 25% bons ( B ); 50% médios ( M ) e 25% fracos ( F ). Um novo teste é proposto, de tal forma a classificar os funcionários como aprovado ( A ) ou reprovado ( R ). Com base em informações do antigo teste, foram obtidas os seguintes resultados com o novo teste: CATEGO RIAS % de APROVADO S B 80 M 50 F 20 Deseja-se saber qual a probabilidadede um fucionário aprovado no novo teste, ser classificado como fraco pelo antigo teste ? EST 106 Prof. Luiz Alexandre Peternelli 44 4. Considere a escolha aleatória de um número entre os 10 primeiros números inteiros positivos (a partir de 1), e os eventos: A = {1,2,3,4,5}, B = {4,5,6,7} e C = {5,9}. Pede-se: Os eventos são Mutuamente Independentes ? Justifique. 5. Uma urna contém 5 bolas vermelhas e 3 brancas. Uma bola é selecionada, aleatoriamente, dessa urna e não é reposta. Em seguida, duas bolas de cor diferente da bola extraída anteriormente ( branca ou vermelha ) são colocadas na urna. Se uma segunda bola é extraída aleatoriamente, qual é a probabilidade de: a) A segunda bola ser vermelha ? b) A segunda bola ser da mesma cor da primeira ? EST 106 Prof. Luiz Alexandre Peternelli 45 6. Tendo-se tomado, ao acaso, dois números positivos x e y, que não excedem a dois, determinar a probabilidade P de que o produto xy não exceda à unidade e o quociente y/x não exceda a dois. DICA: represente, num mesmo gráfico, essas duas funções e use seu conhecimento de Cálculo para solucionar o problema. 7. Certo dispositivo para controle de natalidade usado por homens é eficiente em 95% dos casos, enquanto que um outro, para mulheres, é eficiente em 90% dos casos. Suponha que certa mulher esteja em seu período fétil. Se o casal sempre usa os contraceptivos, qual a probabilidade e a mulher ficar grávida após o ato sexual? Dica: defina os eventos Di = {defesa, ou seja, contraceptivo é eficiente na proteção do indivíduo i (i = m ou h, para mulher ou homem, respectivamente)} e G = {ficar grávida}. EST 106 Prof. Luiz Alexandre Peternelli 46 8) Seja o sistema abaixo com 4 componentes funcionando independentemente, com confiabilidade p1, p2, p3 e p4. Obtenha a confiabilidade do sistema: Obs.: pi é a probabilidade do componente i (i = 1, 2, 3 e 4) funcionar. Cada pi é chamado de “confiabilidade do componente i”; Obs.: Se E: o sistema funciona, então P(E) é chamado “confiabilidade do sistema” Obs.: nesse exemplo considere pi = 0,5 para i = 1 a 4. 4 1 3 2 EST 106 Prof. Luiz Alexandre Peternelli 47 9) Um teste de sangue em laboratório é 99% eficiente em detectar uma certa doença quando de fato essa doença está presente. No entanto, o teste também mostra resultados “falso positivos” em 1% dos casos. Se 0,5% da população tem a doença, qual é a probabilidade de uma pessoa realmente ter a doença se o resultado do teste de seu sangue foi positivo? Seria > 50% ou seria < 50%? Obs.: falso positivo: se falso positivo = 1%, isso significa que se uma pessoa sadia é testada, então, com probabilidade 0,01 o teste implicará que ela tem a doença. Dica: defina os eventos D = {pessoa testada tem a doença} e E = {o resultados do teste é positivo}. RESPOSTAS 1) a) 1/128 b) 1/64; 2) 7/16; 3) 0,10; 4) Não; 5) a) 41/72 b) 13/36 6) aproximadamente 0,385; 7) 0,005; 8) 11/16; 9) 0,3322 EST 106 Prof. Luiz Alexandre Peternelli 1 CAPÍTULO 4 - Variáveis aleatórias e distribuições de probabilidade 1. Conceito de variável aleatória Uma função cujo valor é um número real determinado por cada elemento em um espaço amostral. função que associa um número real a cada resultado de um experimento aleatório. Esquematicamente temos: obs.:letras maiúsculas (X, Y, Z, etc.) → representa a v.a. a correspondente letra minúscula (x, y, z, etc.) → um dos seus valores. obs.: cada possível valor x de X representa um evento que é um subconjunto do espaço amostral. EST 106 Prof. Luiz Alexandre Peternelli 2 Exemplo 4.1.: Duas peças são retiradas sucessivamente, sem reposição, de uma esteira, numa linha de fabricação. Faça B → peça boa; D → peça defeituosa. Assim, S = {BB, BD, DB, DD}. Se considerarmos a v.a. Y = número de peças boas retiradas teríamos: S* = {0, 1, 2}. Fazendo uma correspondência entre S e S* teríamos: Evento Simples Y = y BB 2 BD 1 DB 1 DD 0 EST 106 Prof. Luiz Alexandre Peternelli 3 Exemplo 4.2.: Considere o lançamento de duas moedas e seja X = no de caras obtidas, c = cara e k = coroa S = {cc, ck, kc, kk}; X = {0, 1, 2}. Obs.: ainda para o exemplo 4.1., porém definindo outro experimento e, portanto, outro espaço amostral, poderíamos definir Y={tempo decorrido desde o início do experimento até a coleta de cada item defeituoso}. No caso, estamos definindo o “início” do experimento como sendo o momento em que iniciou a máquina. Teríamos, então, que o espaço amostral seria dado por Y={tempo t : t > 0}. Um experimento desse tipo teria como objetivo verificar se haveria relação entre o tempo de funcionamento da máquina e a ocorrência de peças defeituosas. Uma pergunta do persquisador poderia ser: Será que com o aquecimento da máquina ao longo do tempo ocorreria uma desregulagem e, portanto, um aumento de itens defeituosos (fora da especificação)? EST 106 Prof. Luiz Alexandre Peternelli 4 Quando S contém um número finito de pontos, ou uma sequência infinita enumerável de pontos amostrais → espaço amostral discreto. A v.a. definida em S é chamada variável aleatória discreta (v.a.d.). Quando S contém pontos amostrais que formam uma continuidade → espaço amostral contínuo. A v.a. definida em S é chamada variável aleatótia contínua (v.a.c.). obs.: na maior parte dos problemas práticos as v.a.c. representam dados medidos, conforme já citado acima, e as v.a.d. representam dados contados, tais como o número de itens defeituosos em uma amostra de n peças ou o número de acidentes na estrada Viçosa – Belo Horizonte no ano passado. EST 106 Prof. Luiz Alexandre Peternelli 5 Exemplo 4.3.: v.a.d.: o nº de acidentes ocorridos em uma semana; o nº de defeitos por peça produzida por um fabricante; o nº de vitórias obtidas por um atleta; o nº de filhos do sexo masculino por casal. v.a.c.: o Tempo de funcionamento de certo dispositivo eletrônico; o Volume de água desperdiçada; o Peso de animais capturados; o Diâmetro de peças produzidas por uma máquina. EST 106 Prof. Luiz Alexandre Peternelli 6 Obs.: No caso das v.a.c. somente terão interesse as probabilidades de que a v.a. assuma valores em dados intervalos. Esse seria o caso, quando usamos o exemplo 4.1 modificado, do pesquisador ter interesse em calcular a probabilidade de que o item defeituoso ocorra entre os períodos t1 e t2 de funcionamento da máquina, ou após certo tempo de funcionamento da máquina. Em qualquer caso, estaríamos interessados no cálculo das probabilidades associadas ao evento hora definido. Essas probabilidades poderão ser determinadas com o conhecimento da distribuição de probabilidade da v.a. em estudo. EST 106 Prof. Luiz Alexandre Peternelli 7 2. Distribuição de probabilidade Depende se v.a.d. ou v.a.c.: 2.1. X é uma v.a.d. À coleção de pares [ ix , P( ix )], i = 1, 2, ..., n, denominaremos distribuição de probabilidade da v.a.d. X, pode ser representada por meio de tabelas e/ou gráficos. Nesse caso precisamos saber os valores da v.a.d. X e de sua função de probabilidade. Chama-se função de probabilidade (f.p.) da v.a.d. X, a função ( ) ( )i i iP X x P x p que a cada valor de X (ou seja, a cada ix ) associa sua probabilidade de ocorrência. EST 106 Prof. Luiz Alexandre Peternelli 8 obs.: essa função muitas vezes está reduzida a um valor numérico e, em outros casos, pode ser representada por uma fórmula. A função P( ix ) será uma função de probabilidade se satisfizer às seguintes condições: i) P( ix ) 0, para todo xi ii) ( ) 1i i P x EST 106 Prof. Luiz Alexandre Peternelli 9 Exemplo 4.4.:Seja E: lançamento de um dado viciado de tal forma que a probabilidade é proporcional ao valor obtido no lançamento. S = {1, 2, 3, 4, 5, 6} Seja a v.a. X = {nº de pontos obtidos num lançamento}, ou X = {resultado num lançamento} Assim X = {1, 2, 3, 4, 5, 6}, com as respectivas probabilidades: p + 2 p + 3 p + 4 p + 5 p + 6 p = 1 21 p = 1 p = 1/21 Distribuição de probabilidades da v.a. X: i) Gráfico 1 2 3 4 5 6 0 0,05 0,1 0,15 0,2 0,25 0,3 P (x ) x 1/21 2/21 3/21 4/21 5/21 6/21 ii) Tabela ix 1 2 3 4 5 6 P( ix ) 1/21 2/21 3/21 4/21 5/21 6/21 , para 1,2,3,4,5,6 ( ) 21 0, para outros valores de i i i i x x P x x EST 106 Prof. Luiz Alexandre Peternelli 10 Problema proposto: Uma urna contém 2 bolas brancas e 3 vermelhas. Três bolas são retiradas sucessivamente. Considere que tais retiradas possam ser: (i) com reposição e (ii) sem reposição. Determinar, em cada caso, a distribuição de probabilidade e a função de probabilidade do no de bolas brancas retiradas. Apresente um gráfico de cada distribuição de probabilidade obtida. EST 106 Prof. Luiz Alexandre Peternelli 11 2.2. X é uma v.a.c. A distribuição de probabilidades da v.a.c. X já é definida pela sua f.d.p. Representação → forma gráfica. Obs.: Somente há interesse nas probabilidades de que a v.a. assuma valores em dados intervalos. Precisamos conhecer a função densidade de probabilidade (f.d.p.) da v.a.. A função f (x) é uma f.d.p. se i) f (x) 0, para a < x < b e ii) ( ) b a f x dx = 1, EST 106 Prof. Luiz Alexandre Peternelli 12 obs.: 1) Para , ( ) ( ) d c c d P c X d f x dx 2) Para um valor fixo de X, por exemplo, 0X x , temos que 0 0 0( ) ( ) 0 x x P X x f x dx ; sendo assim, as probabilidades abaixo são todas iguais, se X for uma v.a.c.: ( ) ( ) ( ) ( )P c X d P c X d P c X d P c X d . 3) A função densidade de probabilidade f (x), não representa probabilidade. Somente quando a função for integrada entre dois limites, ela produzirá uma probabilidade, que será a área sob a curva da função entre os valores considerados. EST 106 Prof. Luiz Alexandre Peternelli 13 Exemplo 4.5.: (para ser resolvido em sala de aula) Uma v.a.c. X possui a seguinte função: , para 0 1 ( ) (2 ),para1 2 0, para outros valores de k x f x k x x x Pede-se: a) A constante k para que f (x) seja uma f.d.p. b) O gráfico da f (x). 1 1 3 3 1 3 ) 1; ) ; ) ; ) ; ) 2 2 2 2 2 2 2 c P X d P X e P X f P X g P X Respostas: a) 2 3; c)1 3 ; d)7/12; e) 0; f)7/12; g) 0. EST 106 Prof. Luiz Alexandre Peternelli 14 Exemplo 4.6.: Seja uma v.a.c. X com valores variando de zero a um, e que apresenta a seguinte fdp: f (x) = 2x para x [0,1); e f (x) = 0 para outros valores de x. Pede-se: a) Ao selecionarmos, aleatoriamente, um valor dessa v.a. X, o que seria mais provável de acontecer: (i) um valor de X menor que 0.5, ou (ii)um valor de X maior que 0,5, ou (iii) um valor de X igual a 0,5?; b) Haveria algum valor de X mais provável de ocorrer? Qual seria esse valor de X mais provável? Qual seria essa probabilidade? c) Se escolhermos, aleatória e independentemente, dois valores (digamos X1 e X2) dessa variável aleatória, qual seria a probabilidade de apenas um deles ser maior que 0,25? P(X1 > 0,25) = 1-P(X1 < 0,25) = 1 – 16 15 16 1 1 2 2 12 25,0 0 225,0 0 x dxx 1 2 1 2 1 1 1 1 15 15 15 2. 1 0,1172 4 4 4 4 16 16 128 P X X P X X EST 106 Prof. Luiz Alexandre Peternelli 15 Exemplo 4.7.: Seja a v.a.c x com a seguinte função densidade de probabilidade: f (x) = kx, se 0 ≤ x < 1; f (x) = k, se 1 ≤ x < 2; e f (x) = 0 , qualquer outro x Pede-se: a) Se k = 2/3, então f (x) corresponde a um f.d.p. Verifique esta afirmativa. b) Indique(não precisa fazer cálculos) como proceder para obter a P(1/2 ≤ x ≤ 3/2). c) Obter a P(X = 2/4); Resolução: a) Para uma f(x) ser uma f.d.p a soma das probabilidades tem que ser igual a 1, e o cálculo das probabilidades é a integral definida da f(x) em seu intervalo. Daí: Para k = 2/3 a probabilidade será escrita como : 1 3 2 3 1 3 2 3 4 3 1 3 2 3 2 2 1 1 0 dxxdx Então pode-se concluir que quando k = 2/3 a f (x) é uma f.d.p. EST 106 Prof. Luiz Alexandre Peternelli 16 b) P(1/2 ≤ x ≤ 3/2) Para achar a probabilidade de um intervalo usa-se a integral definida da f (x) no intervalo sugerido. Daí : 2/3 1 1 2/1 kdxkxdx c) A probabilidade de uma v.a.c é dada pela integral definida da f(x) no x determinado, logo a probabilidade de um ponto de uma v.a.c é igual a zero. Ex: 0 16 4 16 4 4/2 4/2 kkdxkx EST 106 Prof. Luiz Alexandre Peternelli 17 Problemas propostos: 1. Seja uma v.a.c. X definida pela seguinte f.d.p.: 0, para 0 ( ) , para 0 2 0, para 2 x f x kx x x a) Determinar o valor de k b) Traçar o gráfico da f.d.p. c) Calcular P(X1). Respostas: a)1 2 ; c) 1 4 EST 106 Prof. Luiz Alexandre Peternelli 18 2. Uma v.a.c. X tem a seguinte f.d.p. 0, para 0 , para 0 5 ( ) (10 ), para 5 10 0, para 10 x kx x f x k x x x a) Determinar o valor de k b) Traçar o gráfico da f.d.p. c) Calcular P(X3) Respostas: a)1 25; b) 41 50 EST 106 Prof. Luiz Alexandre Peternelli 19 3. Considere a seguinte função de X 3 para 0 ( ) 0 c. c. xk e x f x a) Encontre o valor de k para que f (x) seja uma função densidade de probabilidade; b) Encontre P(0,5 X 1); c) Faça o gráfico da f (x). Respostas: a) k = 3; b) 0,173 EST 106 Prof. Luiz Alexandre Peternelli 20 Existem muitos problemas nos quais é de interesse conhecer a probabilidade que a v.a. X assumisse valores menores que um particular valor x. P(X ≤ x) Exemplos: Análise de sobrevivência (na biologia) Análise de confiabilidade (na engenharia) Nesse caso precisamos definir a função de distribuição acumulada de X. Ideias e formulações parecidas aplicadas a diferentes áreas EST 106 Prof. Luiz Alexandre Peternelli 21 3. Função de distribuição acumulada (ou função de distribuição) É a função F(x) definida por: ( ) ( )F x P X x . Observe que o domínio de F é todo o conjunto real. obs.: a) 0 F(x) 1 para todo x. b) Se x1 x2, então F(x1) F(x2), isto é, F(x) é não-decrescente. Qual a representação da F(x) quando X é v.a.d e quando X é v.a.c.? ( ) ( ) ( ) ( ) x F x P X x P X x f t dt ( ) ( ) ( )F x P X x P t t x EST 106 Prof. Luiz Alexandre Peternelli 22 3.1. F(x) para X v.a.d. Se X é v.a.d. temos que: ( ) ( ) ( )F x P X x P t t x Exemplo 4.8.: (para ser resolvido em sala de aula) Seja X uma v.a.d. com a seguinte distribuição de probabilidade ix 0 1 2 3 4 tota l ( )iP x 1/1 6 4/1 6 6/1 6 4/1 6 1/1 6 1,0 0 Pede-se: a) Traçar o gráfico da distribuição de probabilidade de X. b) Obter a função de distribuição acumulada e traçar seu gráfico. EST 106 Prof. Luiz Alexandre Peternelli 23 3.2. F(x) para X v.a.c. Para X uma v.a.c. temos que: ( ) ( ) ( ) ( ) x F x P X x P X x f t dt Temos ainda que, ( ) ( ) ( ) ( ) d c P c X d F d F c f x dx . Vê-se também que ( ) ( ) dF x f x dx em todos os pontos de continuidade de f (x), isto é, a derivada da função de distribuição é a função densidade de probabilidade.
Compartilhar