Baixe o app para aproveitar ainda mais
Prévia do material em texto
Estatı́stica Básica Universidade Federal Rural do Rio de Janeiro Profª: Josiane S. Cordeiro Coelho Prof: Felipe Leite Coelho da Silva Estatı́stica Básica 1 Capı́tulo 1 Estatı́stica Descritiva Antes de iniciarmos com a análise exploratória de dados, apresentaremos a notação de somatório que será utilizada mais adiante. 1.1 Somatório Podemos utilizar a notação do somatório para representar somas de elementos relaciona- dos a um conjunto de valores. Seja X = {x1, x2, · · · , xn} um conjunto com n elementos numéricos. Podemos representar a soma de seus elementos de forma reduzida utilizando a notação de somatório: x1 + x2 + · · ·+ xn = n∑ i=1 xi, onde lê-se ”somatório de xi para i variando de 1 até n.” Vejamos alguns exemplos bastante utilizados abaixo. Sejam os conjuntos de valoresX = {x1, x2, · · · , xn}, Y = {y1, y2, · · · , yn} eZ = {z11, z12, · · · , z1k, z21, z22, · · · , z2k, · · · , zn1, zn2, · · · , znk}. a) Somatório simples: n∑ i=1 xi = x1 + x2 + · · ·+ xn. b) Somatório de quadrados: n∑ i=1 x2i = x 2 1 + x 2 2 + · · ·+ x2n. c) Quadrado do somatório:( n∑ i=1 xi )2 = (x1 + x2 + · · ·+ xn)2 . 2 Estatı́stica Básica d) Somatório de produtos: n∑ i=1 xiyi = x1y1 + x2y2 + · · ·+ xnyn. e) Produto de somatórios: n∑ i=1 xi k∑ i=1 yi = (x1 + x2 + · · ·+ xn)(y1 + y2 + · · ·+ yk). f) Somatório duplo: n∑ i=1 k∑ j=1 zij = n∑ i=1 (zi1 + zi2 + · · ·+ zik) = (z11 + z12 + · · ·+ z1k)+· · ·+(zn1 + zn2 + · · ·+ znk) . A seguir, apresentamos algumas propriedades do somatório que podem ser úteis quando estamos operando. Principais propriedades de somatório: i) ∑n i=1(xi + yi) = ∑n i=1 xi + ∑n i=1 yi. ii) ∑n i=1 A = nA, em que A é uma constante. iii) ∑n i=1 Axi = A ∑n i=1 xi, em que A é uma constante. iv) ∑n i=1(Axi + A) = A ∑n i=1 xi + nA, em que A é uma constante. Exemplo 1: Considere três conjuntos com 6 elementos cada descritos na tabela abaixo: i 1 2 3 4 5 6 xi 2 3 4 3 2 1 fi 4 5 6 8 10 12 gi 10 6 12 4 5 10 Determine o valor de cada somatório: a) ∑6 i=1 xi b) ∑4 i=2(fi + xi + gi) c) ∑4 i=2(f 2 i − g2i ) d) ∑6 i=1 xi + f3 − x1 e) ∑3 i=2(3xi + 10fi) f) ∑6 i=1 x5 g) ∑3 i=1 ∑6 i=1(xi + fi) h) ∑6 i=1 25 Soluções: a) ∑6 i=1 xi = x1 + x2 + x3 + x4 + x5 + x6 = 2 + 3 + 4 + 3 + 2 + 1 = 15. b) ∑4 i=2(fi + xi + gi) = (f2 + x2 + g2) + (f3 + x3 + g3)(f4 + x4 + g4) = (3 + 5 + 6) + (4 + 6 + 12) + (3 + 8 + 4) = 14 + 22 + 15 = 41. 3 Estatı́stica Básica Exercı́cio: A tabela a seguir apresenta a variação do preço do dólar no mês de setembro de 2008 e a compra da moeda realizada por duas empresas. A variável c(x) representa a compra de dólares pelas duas empresas. 23/09 24/09 25/09 26/09 27/09 Preço do dólar 1.83 1.85 1.82 1.85 1.96 c(xi)(Empresa A) 1000 750 400 900 300 c(xi)(Empresa B) 1200 600 510 780 310 Qual foi a empresa que investiu mais nestes cinco dias do mês de setembro de 2008? E quanto investiu em reais? 1.2 Principais definições • Estatı́stica: planejamento, coleta, redução, análise, modelagem e interpretação de dados. • Análise exploratória de dados: consiste na redução (tabelas, gráficos e medidas numéricas), análise e interpretação dos dados. • Variável: qualquer caracterı́stica observável da unidade de interesse. • População: conjunto de indivı́duos (ou objetos, elementos) que tem em comum pelo menos uma variável observável. • Amostra: qualquer parte (subconjunto) de uma população. Classificação de uma variável. • Quantitativas: apresenta como possı́veis realizações uma contagem ou mensuração. – Discretas: possı́veis resultados formam um conjunto finito ou enumerárel (por exemplo, 0, 1, 2, · · · ). Ex: nº de irmãos, idade em anos. – Contı́nuas: possı́veis resultados formam um conjunto não enumerárel (inter- valos reais). Ex: peso, altura, salário. 4 Estatı́stica Básica • Qualitativas: apresenta como possı́veis realizações uma qualidade/atributo da uni- dade de estudo. – Ordinal: apresenta ordem/hierarquia nos seus possı́veis resultados. Ex: nı́vel de instrução, classe social. – Nominal: não apresenta ordem/hierarquia nos seus possı́veis resultados. Ex: sexo, estado civil, religião. Exercı́cio: Classifique as seguintes variáveis: 1. Taxa de natalidade na cidade de Seropédica (número de nascimentos por 1000 habi- tantes (nesta região) em um ano). 2. Grau de ajustamento familiar (baixo, médio e alto). 3. Fertilizante utilizado em plantação de batatas (nenhum, nitrogênio, esterco, nitrogênio ou esterco); 4. Número de casos diários de Covid-19 no estado do Rio de Janeiro. 5 Estatı́stica Básica 1.3 Representação Tabular de Variáveis: Tabela de Distri- buição de Frequências Podemos tabular um conjunto de dados a fim de obter um resumo e/ou uma apresentação dos dados. A tabulação pode ser feita para variáveis qualitativas ou quantitativas. Se- guem alguns exemplos. A tabela abaixo é simples e não faz nenhum tipo de redução dos dados, apenas organiza. 6 Estatı́stica Básica Id Turma Sexo Idade Alt Peso Filhos Toler Exerc TV OpTV 1 A F 17 1,6 60,5 2 P 0 16 R 2 A F 18 1,69 55 1 M 0 7 R 3 A M 18 1,85 72,8 2 P 5 15 R 4 A M 25 1,85 80,9 2 P 5 20 R 5 A F 19 1,58 55 1 M 2 5 R 6 A M 19 1,76 60 3 M 2 2 R 7 A F 20 1,6 58 1 P 3 7 R 8 A F 18 1,64 47 1 I 2 10 R 9 A F 18 1,62 57,8 3 M 3 12 R 10 A F 17 1,64 58 2 M 2 10 R 11 A F 18 1,72 70 1 I 10 8 N 12 A F 18 1,66 54 3 M 0 0 R 13 A F 21 1,7 58 2 M 6 30 R 14 A M 19 1,78 68,5 1 I 5 2 N 15 A F 18 1,65 63,5 1 I 4 10 R 16 A F 19 1,63 47,4 3 P 0 18 R 17 A F 17 1,82 66 1 P 3 10 N 18 A M 18 1,8 85,2 2 P 3 10 R 19 A F 20 1,6 54,5 1 P 3 5 R 20 A F 18 1,68 52,5 3 M 7 14 M 21 A F 21 1,7 60 2 P 8 5 R 22 A F 18 1,65 58,5 1 M 0 5 R 23 A F 18 1,57 49,2 1 I 5 10 R 24 A F 20 1,55 48 1 I 0 28 R 25 A F 20 1,69 51,6 2 P 8 4 N 26 A F 19 1,54 57 2 I 6 5 R 27 B F 23 1,62 63 2 M 8 5 R 28 B F 18 1,62 52 1 P 1 10 R 29 B F 18 1,57 49 2 P 3 12 R 30 B F 25 1,65 59 4 M 1 2 R 31 B F 18 1,61 52 1 P 2 6 N 32 B M 17 1,71 73 1 P 1 20 R 33 B F 17 1,65 56 3 M 2 14 R 34 B F 17 1,67 58 1 M 4 10 R 35 B M 18 1,73 87 1 M 7 25 B 36 B F 18 1,6 47 1 P 5 14 R 37 B M 17 1,7 95 1 P 10 12 N 38 B M 21 1,85 84 1 I 6 10 R 39 B F 18 1,7 60 1 P 5 12 R 40 B M 18 1,73 73 1 M 4 2 R 7 Estatı́stica Básica 1.3.1 Tabela de frequências A tabela de distribuição de frequências apresenta as informações de frequências absolutas, frequências relativas e acumuladas dos dados observados. Tabela 1.1: Tabela de frequências. Classes ni fi fiac Percentual c1 n1 f1 f1ac 100× f1 c2 n2 f2 f2ac 100× f2 ... ... ... ... ck nk fk 1 100× fk Total n 1 100% Considere que: • k é o número de classes; • ni é a frequência absoluta, n1 + n2 + · · ·+ nk = n; • fi é a frequência relativa, fi = ni n ; • fiac é a frequência relativa acumulada, fiac = i∑ j=1 fj . Importante: O número de classes (k) para uma tabela de frequências pode ser obtido utilizando os seguintes métodos: • Método da raiz quadrada: k = √ n, se n > 25; 5, caso contrário. • Método de Sturges: k = 1 + 3, 22 log10 n (1.1) • Também podemos escolher de acordo com nosso interesse na pesquisa. 8 Estatı́stica Básica Exemplo. Variável: Nı́vel de Instrução= fundamental (ni = 12, fi = 0, 33), médio (ni = 18, fi = 0, 50) e superior (ni = 6, fi = 0, 17). Nı́vel de Instrução ni fi % fac Fundamental 12 0,33 33 0,33 Médio 18 0,50 50 0,83 Superior 6 0,17 17 1,00 Total 36 1,00 100 - Tabela 1.2: Tabela de Distribuição de Frequências em que: ni: frequência absoluta; fi: frequência relativa; %: porcentagem; fac: frequência relativa acumulada. Tabela de dupla entrada Considere a quantia de empréstimos diários (em milhares) de quatro diferentes bancos (B1, B2, B3 e B4) com agências de mesmo porte em três avenidas (A1, A2 e A3) de uma cidade: Tabela 1.3: Dados Banco/Avenida A1 A2 A3 Total B1 2535 24 84 B2 32 28 27 87 B3 27 33 31 B4 41 60 25 126 Total 125 156 107 388 9 Estatı́stica Básica Exemplo. Foi realizada uma pesquisa com 20 funcionários de uma empresa para avaliar a preferência entre dois produtos (A e B). A tabela abaixo apresenta os resultados das seguintes caracterı́sticas investigadas: Renda do trabalho em número de salários mı́nimos (X); Sexo (F - feminino e M - masculino); Preferência entre os produtos A ou B. Entrevistado 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 No salários (X) 2 3,7 1,7 3 4 5 1,4 3 3 1,8 6 4,8 2,3 1,5 3,2 2,2 1 4,4 2 2 Sexo M M F M F M M F F F M M F M F F M F M F Preferência A B A B B B A B A A B B A A A A A B A A Construa uma tabela de frequências de dupla entrada para as variáveis qualitativas. 10 Estatı́stica Básica 1.4 Representação Gráfica de Variáveis • Qualitativas: – gráfico de colunas/barras; – gráfico de setores; • Quantitativas: – gráfico de colunas/barras; – gráfico de linhas; – gráfico de dispersão; – ramo e folhas; – ogiva; – histograma; – polı́gono de frequências. Todos os gráficos a seguir foram gerados utilizando o software livre R. Você pode fazer o download do programa pela site oficial: https://cran.r-project.org/ 1.4.1 Gráfico de Barras/Colunas Variável: Nı́vel de Instrução= fundamental (ni = 12, fi = 0, 33), médio (ni = 18, fi = 0, 50) e superior (ni = 6, fi = 0, 17). 11 Estatı́stica Básica fundamental médio superior Grau de Instrução F re qu ên ci a 0 5 10 15 Figura 1.1: Gráfico de barras para variável nı́vel de instrução. 1.4.2 Gráfico de Setores/Pizza Variável: Nı́vel de Instrução= fundamental (ni = 12, fi = 0, 33), médio (ni = 18, fi = 0, 50) e superior (ni = 6, fi = 0, 17). 1(33.3%) 2(50%) 3(16.7%) 1=Fundamental, 2=Médio, 3=Superior Figura 1.2: Gráfico de setores para variável nı́vel de instrução. Pode vir acompanhado com uma legenda ou porcentagens ao lado das respostas. 12 Estatı́stica Básica 1.4.3 Gráfico de Linhas Variável: Nº de filhos por estudante = {0, 1, 2, 0, 0, 0, 0, 0, 1, 0, 2, 0, 0, 3, 0, 0, 1, 2, 0, 0, 1, 0, 0, 0, 2, 2, 0, 0, 5, 2, 0, 1, 3, 0, 2, 3}. Estudantes N º de fi lh os 0 5 10 15 20 25 30 35 0 1 2 3 4 5 Figura 1.3: Gráfico de linhas para variável número de filhos por estudante. 13 Estatı́stica Básica 1.4.4 Gráfico de Dispersão Útil para séries temporais ou para relacionar duas variáveis quantitativas. Variáveis: Ve- locidade (4, 4, 7, 7, 8, 9, 10, 10, 10, ..., 24, 25) e Distância (10, 4, 22, 16, 10, 18, 26, 34, ..., 120, 85). ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● Velocidade D is tâ nc ia 5 10 15 20 25 0 20 40 60 80 10 0 12 0 Figura 1.4: Gráfico de dispersão entre as variáveis velocidade e distância. 1.4.5 Ramo e folhas Vejamos um exemplo. Dados: 91,96,98,104,105,108,108,112,112,112,113,113,114,115,115,116,116,116,116,118,118, 118,119,120,121,121,121,121,121,123,123,123,124,126,126,126,126,126,127,127,128,128, 129, 129,129,130,130,130,131,132,132,132,133,133,134,134,134,134,134,134,135,136, 136,137, 138, 141,141,141,142,143,143,144,144,144,144,145,146,146,146,146,147,147, 148,148,149, 150,150, 150, 153,154,154,154,154,,157,157,158,158. 14 Estatı́stica Básica 9 | 168 10 | 4588 11 | 2223345566668889 12 | 0111113334666667788999 13 | 00012223344444455566678 14 | 11123344445666677889 15 | 000344447788 Tabela 1.4: Gráfico de ramo e folhas. 1.4.6 Ogiva Gráfico das frequências relativas (proporções) acumuladas fac. Exemplo. Variável: Velocidade (4, 4, 7, 7, 8, 9, 10, 10, 10, 11, 11,..., 24, 24, 24, 24, 25), com frequências relativas = 0.03703704, 0.03703704, 0.01851852, 0.01851852, 0.05555556, 0.03703704, ..., 0.01851852, 0.07407407, 0.09259259). ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● 5 10 15 20 25 Velocidade P ro po rç ão A cu m ul ad a (F ac ) 0. 0 0. 2 0. 4 0. 6 0. 8 1. 0 Figura 1.5: Gráfico das frequências relativas acumuladas. 15 Estatı́stica Básica 1.4.7 Histograma Suponha o seguinte conjunto de n = 36 dados: 4,00; 4,56; 5,25; 5,73; 6,26; 6,66; 6,86; 7,39; 7,59; 7,44; 8,12; 8,46 ; 8,74 ; 8,95; 9,13; 9,35; 9,77; 9,80; 10,53; 10,76; 11,06; 11,59; 12,00; 12,79 ;13,23; 13,60; 13,85; 14,69; 14,71; 15,99; 16,22; 16,61; 17,26; 18,75; 19,40; 23,30. Para construir o histograma, primeiro agrupamos os dados em intervalos de classe e apre- sentamos em uma tabela de frequências. A fim de agrupar em intervalos, precisamos de- finir o número de classes. Aqui, utilizaremos o conhecimento do pesquisador escolhendo o número de classes e realizando o procedimento a seguir. Calculamos a amplitude total do conjunto: ∆ = 23, 30− 4, 00 = 19, 30. Suponha que queremos dividir em 5 intervalos de igual tamanho, basta fazer ∆i = ∆ 5 = 19, 30 5 = 3, 86 ≈ 4, (sempre arredondar para mais, garantindo que o último valor seja incluı́do). Classes xi ni fi % fac di [4,8) 6 10 0,28 28 0,28 0,0700 [8,12) 10 12 0,33 33 0,61 0,0825 [12,16) 14 8 0,22 22 0,83 0,0550 [16,20) 18 5 0,14 14 0,97 0,0350 [20,24) 22 1 0,03 3 1,00 0,0075 Total - 36 1,00 100 - - em que: xi: ponto médio do i-ésimo intervalo de classe; ni: frequência absoluta do i-ésimo intervalo de classe; fi: frequência relativa do i-ésimo intervalo de classe; %: porcentagem do i-ésimo intervalo de classe; fac: frequência relativa acumulada até o i-ésimo intervalo de classe; 16 Estatı́stica Básica di: densidade do i-ésimo intervalo de classe. Note que: • os histogramas são formados por retângulos cujas bases são os intervalos de classes dos dados agrupados e as alturas são as densidades de cada classe (di). • podemos ter histogramas de frequências (di = niδi ), de proporção (di = fi δi ) e de por- centagem (di = 100fiδi ). • nos histogramas de proporção, temos a área total igual a 1. • nos histogramas de proporção, cada retângulo representa a proporção da respectiva classe representada. Salário D en si da de d e F re qu ên ci a 0 4 8 12 16 20 24 0. 00 0. 02 0. 04 0. 06 0. 08 0. 10 28% 33% 22% 14% 3% Figura 1.6: Histograma. 17 Estatı́stica Básica 1.4.8 Polı́gono de Frequências ● ● ● ● ● ● ● Salário D en si da de 0 5 10 15 20 25 30 0. 00 0. 02 0. 04 0. 06 0. 08 0. 10 Figura 1.7: Polı́gono de frequências. Podemos também sobrepor o histograma e o polı́gono de frequências: Salário D en si da de d e F re qu ên ci a 0 4 8 12 16 20 24 0. 00 0. 02 0. 04 0. 06 0. 08 0. 10 ● ● ● ● ● ● ● Figura 1.8: Histograma e polı́gono de frequências. 18 Estatı́stica Básica Exercı́cio: Considere um conjunto com os dados de idade (em meses) de uma determinada planta. 1 2 2 6 8 9 15 17 20 20 20 21 27 29 29 35 37 37 43 48 Faça o histograma com 5 classes iniciando no menor valor do conjunto. E, em seguida, o polı́gono de frequência. 19 Estatı́stica Básica 1.5 Medidas Resumo: Medidas de Posição e Medidas de Dispersão As medidas de posição e de dispersão são somente aplicadas aos conjuntos de dados quantitativos, fornecendo informções que resumem e auxiliam no conhecimento sobre o conjunto. Considere um conjunto de dados X = {x1, x2, · · · , xn} com n observações. 1.5.1 Medidas de Posição São medidas que resumem o conjunto de dados em relação à posição. • Moda (Mo): é a observação que mais se repete no conjunto de dados. Exemplos: 1. Unimodal: X = {4, 7, 5, 3, 4, 9, 10, 2}, logo Mo = 4. 2. Amodal: X = {4, 7, 5, 3, 9, 10, 2}, logo não existe Mo. 3. Bimodal: X = {4, 7, 5, 3, 4, 9, 10, 2, 7}, logo Mo = 4 e 7. 4. Multimodal: X = {4, 7, 5, 3, 4, 9, 10, 2, 7, 9}, logo Mo = 4, 7 e 9. • Mediana (Md): é o valor do conjunto de dados que divide o conjunto ordenado em duas partes iguais. Exemplos: 1. X = {4, 7, 5, 3, 9, 10, 2}. Ordenando: {2, 3, 4, 5, 7, 9, 10}, logo Md = 5, que ocupa a 4ª posiçãono conjunto com 7 observações deixando 3 observações para cada lado. 2. X = {4, 7, 5, 3, 9, 10, 2, 7}. Ordenando: {2, 3, 4, 5, 7, 7, 9, 10}, que é um conjunto com 8 observações. A mediana é o valor que deixa 4 observações abaixo e 4 observações acima e, podemos obtê-la tomando o ponto médio en- tre as observações da 4ª posição e da 5ª posição: Md = 5 + 7 2 = 6, que é um valor que não pertence ao conjunto de dados. Note que para conjuntos com total de observações ı́mpar, a mediana pertence ao conjunto, já para total de observações par, a mediana pode pertencer ou não. 20 Estatı́stica Básica • Média: é uma medida extremamente conhecida e utilizada. Dependendo do con- junto de dados, pode ser mais indicado diferentes tipos de médias, como apresenta- mos abaixo. – Média Aritmética Simples: x̄ = ∑n i=1 xi n . – Média Aritmética Ponderada: Suponha, ainda, um conjunto de pesos W = {w1, w2, · · · , wn} associado ao conjunto X . A média aritmética do conjunto X ponderada pelo conjunto W é dada por: x̄p = ∑n i=1 xiwi∑n i=1wi . – Média Geométrica: x̄g = n √ x1 × x2 × · · · xn. Útil para encontrar taxas médias. – Média Harmônica: x̄h = n∑n i=1 1 xi . Útil para encontrar a média de taxas médias e velocidades médias. Exemplos: Seja o conjunto de observações X = {4, 7, 5, 3, 9, 10, 2}. Vamos determi- nar cada uma das médias apresentadas acima. 1. x̄ = 4 + 7 + 5 + 3 + 9 + 10 + 2 7 ≈ 5, 72; 2. Considere o conjunto de pesos W = {1, 3, 2, 1, 3, 2, 1}, logo: x̄p = 4 ∗ 1 + 7 ∗ 3 + 5 ∗ 2 + 3 ∗ 1 + 9 ∗ 3 + 10 ∗ 2 + 2 ∗ 1 13 ≈ 6, 69; 3. x̄g = 7 √ 4× 7× 5× 3× 9× 10× 2 ≈ 4, 98; 4. x̄h = 7 1 4 + 1 7 + 1 5 + 1 3 + 1 9 + 1 10 + 1 2 ≈ 4, 28. • Separatrizes ou Quantis: Dividem o conjunto de dados ordenado em partes iguais. – Mediana: divide em duas partes iguais (Md). – Quartis: divide em 4 partes iguais (Q1, Q2, Q3). – Decis: divide em 10 partes iguais (D1, · · · , D9). 21 Estatı́stica Básica – Percentis: divide em 100 partes iguais (P1, · · · , P99). Podemos utilizar a seguinte fórmula para encontrar a posição dos quantis de forma geral: s(n+ 1) r , em que s é a ordem do quantil (quartil {1, 2, 3}; decil {1, 2, · · · , 9}; percentil {1, 2, · · · , 99}), r é o quantil desejado (4,10 ou 100) e n é o tamanho do conjunto de dados. Exemplo: SejaX = {160, 145, 133, 144, 152, 167, 200, 156, 143, 144, 167, 177, 160, 153, 155} com n = 15 observações. Encontre os quartis, D3, P25 e P10. Ordenando, obtemos: {133, 143, 144, 144, 145, 152, 153, 155, 156, 160, 160, 167, 167, 177, 200}. 1. D3: encontrando a posição s(n+ 1) r = 3 ∗ (15 + 1) 10 = 4, 8 ≈ 5, logo D3 = 145; 2. P25: encontrando a posição 25 ∗ (15 + 1) 100 = 4, logo P25 = 144; 3. P10: encontrando a posição 10 ∗ (15 + 1) 100 = 1, 6 ≈ 2, logo P10 = 143. Medidas de Posição para Dados Agrupados Considere um conjunto de dados agrupados em K intervalos de classes, em que xi é o ponto médio do i-ésimo intervalo de classe; ni é a frequência absoluta do i-ésimo intervalo de classe; e, fi é a frequência relativa do i-ésimo intervalo de classe. Podemos calcular medidas resumo de um conjunto de dados agrupados, que serão medidas aproximadas, e não exatas, do conjunto de dados original. Definimos: • Moda: valor xi com maior ni ou fi. 22 Estatı́stica Básica • Mediana: vamos encontrar pelo histograma de proporção, utilizando que a as áreas de cada retângulo corresponde a proporção de observados na respectiva classe. • Média Aritmética: x̄ = ∑K i=1 xini n = K∑ i=1 xifi. Exemplo: SejaX = {4, 00; 4, 56; 5, 25; 5, 73; 6, 26; 6, 66; 6, 86; 7, 39; 7, 59; 7, 44; 8, 12; 8, 46; 8, 74; 8, 95; 9, 13; 9, 35; 9, 77; 9, 80; 10, 53; 10, 76; 11, 06; 11, 59; 12, 00; 12, 79; 13, 23; 13, 60; 13, 85; 14, 69; 14, 71; 15, 99; 16, 22; 16, 61; 17, 26; 18, 75; 19, 40; 23, 30}, agrupado em 5 intervalos de classes: Classes xi ni fi % fac di [4,8) 6 10 0,28 28 0,28 0,07 [8,12) 10 12 0,33 33 0,61 0,0825 [12,16) 14 8 0,22 22 0,83 0,055 [16,20) 18 5 0,14 14 0,97 0,035 [20,24) 22 1 0,03 3 1,00 0,0075 Salário D en si da de d e F re qu ên ci a 0 4 8 12 16 20 24 0. 00 0. 02 0. 04 0. 06 0. 08 0. 10 28% 33% 22% 14% 3% 1. Moda = 10. 2. Mediana = 10,67 (obtida via histograma). Como determinar? A mediana deixa 50% dos dados abaixo dela. No primeiro retângulo do histograma, temos 28% dos dados 23 Estatı́stica Básica (f1) que não é suficiente, então temos que somar mais a proporção de 33% do se- gundo retângulo, que já ultrapassa os 50% da mediana. Logo, a mediana é um valor no intervalo de 8 até 12, que determina um retângulo de área 22% para somar com os 28% do retângulo anterior e totalizar 50%. Temos a seguinte equação: 0,22(área do retângulo determinado pela mediana)=(Md−8)(base do retângulo)*0,0825(altura do retângulo). Basta isolarmos a Md e encontramos Md = 8 + 0, 22 0, 0825 = 10, 67. 3. Média Aritmética = 6× 10 + 10× 12 + 14× 8 + 18× 5 + 22× 1 10 + 12 + 8 + 5 + 1 = 6 × 0, 28 + 10 × 0, 33 + 14× 0, 22 + 18× 0, 14 + 22× 0, 03 = 11, 24. 1.5.2 Medidas de Dispersão São medidas que resumem o conjunto de dados em relação à dispersão/variabilidade dos dados. • Suponha que queremos pensar em dispersão dos dados em torno da sua média aritmética. Então, poderı́amos olhar para as diferenças de cada xi, para i = 1, · · · , n, em relação à média x̄, isto é, xi − x̄, e, pensando numa única medida para todo conjunto poderı́amos pensar em n∑ i=1 (xi − x̄) = n∑ i=1 xi − n∑ i=1 x̄ = nx̄− n∑ i=1 x̄ = 0, que é sempre igual a zero para qualquer que seja X . Para contornar esse problema, temos as seguintes propostas: – Desvio médio absoluto: DMA(X) = ∑n i=1 |xi − x̄| n . – Variância (amplamente utilizado): V ar(X) = ∑n i=1(xi − x̄)2 n = ∑n i=1 x 2 i n − (x̄)2. 24 Estatı́stica Básica – Desvio Padrão (retornando a escala original dos dados): DP (X) = √ V ar(X). • Intervalo Interquartı́lico: IQ(X) = Q3(X)−Q1(X). • Coeficiente de Variação (medida adimensional, muito útil para comaprar conjuntos com escalas diferentes): CV (X) = DP (X) x̄ , para x̄ 6= 0. Exemplo: Seja X = {4, 7, 5, 3, 9, 10, 2}. Portanto: • DMA(X) = |4− 5, 72|+ |7− 5, 72|+ |5− 5, 72|+ |3− 5, 72|+ |9− 5, 72|+ |10− 5, 72|+ |2− 5, 72| 7 ≈ 2, 53; • V AR(X) = 42 + 72 + 52 + 32 + 92 + 102 + 22 7 − 5, 722 ≈ 7, 92; • DP (X) = √ 7, 92 ≈ 2, 81; • IQ(X) = 8 − 3, 5 = 4, 5, pois Q1(X) = 3, 5 ( 3 + 4 2 ) e Q3(X) = 8 ( 7 + 9 2 ) extraı́dos do conjunto ordenado {2, 3, 4, 5, 7, 9, 10} com 7 observações; • CV (X) = 2, 81 5, 72 ≈ 0, 49. Medidas de Dispersão para Dados Agrupados Considere um conjunto de dados agrupados em K intervalos de classes, em que xi é o ponto médio do i-ésimo intervalo de classe; ni é a frequência absoluta do i-ésimo intervalo de classe; e, fi é a frequência relativa do i-ésimo intervalo de classe. Assim como para as medidas de posição, podemos calcular as medidas de dispersão de um conjunto de dados agrupados, que serão medidas aproximadas, e não exatas, do conjunto de dados original. Definimos: • DMA(X) = ∑K i=1 |xi − x̄|ni n = K∑ i=1 |xi − x̄|fi. • V ar(X) = ∑K i=1(xi − x̄)2ni n = K∑ i=1 (xi − x̄)2fi = K∑ i=1 x2i fi − (x̄)2. 25 Estatı́stica Básica • Desvio padrão, intervalo interquartı́lico e coeficiente de variação: permacem com as mesmas fórmulas, somente adaptando-se as medidas envolvidas que serão calcula- das a partir dos dados agrupados. Calcule todas as medidas de dispersão apresentadas para o conjunto de dados agrupados da tabela abaixo. Classes xi ni fi % fac di [4,8) 6 10 0,28 28 0,28 0,07 [8,12) 10 12 0,33 33 0,61 0,0825 [12,16) 14 8 0,22 22 0,83 0,055 [16,20) 18 5 0,14 14 0,97 0,035 [20,24) 22 1 0,03 3 1,00 0,0075 Salário D en si da de d e F re qu ên ci a 0 4 8 12 16 20 24 0. 00 0. 02 0. 04 0. 06 0. 08 0. 10 28% 33% 22% 14% 3% Calculando: • DMA(X) = ∑K i=1|xi − x̄|ni n = |6− 11, 24| × 10 + |10− 11, 24| × 12 + |14− 11, 24| × 8 + |18− 11, 24| × 5 + |22− 11, 24| × 1 36 = 3, 72; • V ar(X) = K∑ i=1 x2i fi − (x̄)2 = (62 × 0, 28 + 102 × 0, 33 + 142 × 0, 22 + 182 × 0, 14 + 222 × 0, 03)− (11, 24)2 ≈ 19, 74; 26 Estatı́stica Básica • DP (X) = √ 19, 7 ≈ 4, 44; • IQ(X) = Q3(X)−Q1(X) = 14, 545455− 7, 571429 = 6, 974026, pois através do histo- grama determinamos os quartis: – Q1 deixa 25% dos dados abaixo dele. No primeiro retângulo do histograma, temos 28% dos dados (f1) que já ultrapassa os 25% do primeiro quartil. Logo, o Q1 é um valor no intervalo de 4 até 8. Temos a seguinte equação: 0,25(área do retângulo determinado peloQ1)=(Q1−4)(base do retângulo)*0,07(altura do retângulo). Basta isolarmos o Q1 e encontramos Q1 = 4 + 0, 25 0, 07 = 7, 571429. – Q3 deixa 75% dos dados abaixo dele. Precisamos alcançar no mı́nimo os 75%, assim precisamos dois 3 primeiros retângulos, que somam 28%+33%+22%=83% dos dados que ultrapassa os 75% do terceiro quartil. Logo, o Q3 é um valor no intervalo de 12 até 16, que determina uma área de 14% para somar com os dois primeiros retângulos um total de 75%. Temos a seguinte equação: 0,14(área do retângulo determinado peloQ3)=(Q3−12)(base do retângulo)*0,055(altura do retângulo). Basta isolarmos o Q3 e encontramos Q3 = 12 + 0, 14 0, 055 = 14, 545455. • CV (X) = DP (X) X̄ = 4, 44 11, 24 ≈ 0, 40. 1.5.3 Propriedades das Medidas de Posição e Dispersão Sejam a, b ∈ < e X = {x1, x2, · · · , xn}. • Se Y = {a, a, · · · , a}, então todas as medidas de posição são iguais a ”a”e todas as medidas de dispersão são iguais a zero. • Seja o conjunto Y = {ax1, ax2, · · · , axn}, então ȳ = ax̄, Mo(Y ) = aMo(X), Md(Y ) = aMd(X); DMA(Y ) = |a|DMA(X), V ar(Y ) = a2V ar(X), DP (Y ) = |a|DP (X), IQ(Y ) = |a|IQ(X). • Seja o conjunto Z = {x1 + b, x2 + b, · · · , xn + b}, então z̄ = x̄+ b, Mo(Z) = Mo(X) + b, Md(Z) = Md(X) + b e o mesmo vale para todos os quantis; as medidas de dispersão permanecem inalteradasDMA(Z) = DMA(X), V ar(Z) = V ar(X),DP (Z) = DP (X), IQ(Z) = IQ(X). 27 Estatı́stica Básica • Seja o conjunto W = {ax1 + b, ax2 + b, · · · , axn + b}, então w̄ = ax̄ + b, Mo(W ) = aMo(X)+b,Md(W ) = aMd(X)+b e o mesmo vale para todos os quantis;DMA(W ) = |a|DMA(X), V ar(W ) = a2V ar(X), DP (W ) = |a|DP (X), IQ(W ) = |a|IQ(X). Exemplo: Seja X = {4, 7, 5, 3, 9, 10, 2}. Defina Y = 3X , Z = X + 4 e W = 2X − 1. Determine: • as médias de Y , Z, e W : ȳ = 3x̄ = 3× 5, 72 = 17, 16; z̄ = x̄+ 4 = 5, 72 + 4 = 9, 72; w̄ = 2x̄− 1 = 2× 5, 72− 1 = 10, 44. • as medianas de Y , Z, e W : Md(Y ) = 3Md(X) = 3× 5 = 15; Md(Z) = Md(X) + 4 = 5 + 4 = 9; Md(W ) = 2Md(X)− 1 = 2× 5− 1 = 9. • as variâncias de Y , Z, e W : V ar(Y ) = 32V ar(X) = 32 × 7, 92 = 71, 28; V ar(Z) = V ar(X) = 7, 92; V ar(W ) = 22V ar(X) = 22 × 7, 92 = 31, 68. • os desvios padrões de Y , Z, e W : DP (Y ) = √ V ar(Y ) = √ 71, 28 = 8, 442748; DP (Z) = √ V ar(Z) = √ 7, 92 = 2, 814249; DP (W ) = √ V ar(W ) = √ 31, 68 = 5, 628499. Exercı́cio Segundo um laboratório, os ı́ndices de glicose (em mg por decilitro) de vinte pacientes no inı́cio da coletagem de um certo dia foram: 77, 75, 82, 76, 69, 71, 80, 66, 85, 77, 72, 100, 80, 86, 74, 90, 69, 89, 74 e 115. Sabendo que 20∑ i=1 xi = 1607 e 20∑ i=1 x2i = 131705 1. Encontre a média e a variância destes ı́ndices. 28 Estatı́stica Básica 2. Encontre a média e a variância destes ı́ndices, supondo que houve um erro de medição de 10 mg/dL para menos em todos os pacientes. 3. Supondo, ainda, que houve um erro de medição de 10 mg/dL para menos em todos os pacientes, determine a média e a variância dos ı́ndices multiplicados por -2. 29 Estatı́stica Básica 1.6 Assimetria e Curtose Vamos falar agora de duas formas de classificação de um conjunto de dados que auxiliam na sua descrição e entendimento, a assimetria e a curtose. 1.6.1 Assimetria Um conjunto de dados é dito ser simétrico se sua moda, mediana e média são iguais. Da mesma forma, se os lados direito e esquerdo do diagrama/gráfico de pontos (ou de barras), ou do histograma, são a imagem espelhada um do outro. Observe que, para discutirmos assimetria o conjunto de dados deve ser unimodal. Caso seja não seja simétrico, dizemos que é assimétrico. Um conjunto de dados é as- simétrico à direita se a cauda direita do histograma se estende muito mais do que a cauda esquerda, ou seja, a cauda declina para direita. Nesse caso, temos média>mediana>moda. E um conjunto de dados é assimétrico à esquerda se a cauda esquerda do histograma se estende muito mais do que a cauda direita, ou seja, a cauda declina para esquerda. Nesse caso, temos média<mediana<moda. Seja um conjunto de dados com n observações Figura 1.9: Possı́veis casos de assimetria. A seta representa a média da distribuição. Fonte: Apostila de Estatı́stica Descritiva da Ana Maria Farias-UFF X = {x1, x2, · · · , xn}. Existem vários coeficientes que medem o grau de assimetria de um conjunto. Vamos estudar o coeficiente de assimetria de Pearson que é dado por: e = x̄−Mo(X) DP (X) . Note que: 1. se e = 0, então x̄ − Mo(X) = 0 ⇒ x̄ = Mo(X), logo a distribuição de valores é simétrica; 30 Estatı́stica Básica 2. se e > 0, então x̄ −Mo(X) > 0 (lembre que DP (X) ≥ 0, sempre), daı́ x̄ > Mo(X), logo a distribuição de valores é assimétrica à direita; 3. se e < 0, então x̄ −Mo(X) < 0 (lembre que DP (X) ≥ 0, sempre), daı́ x̄ < Mo(X), logo a distribuição de valores é assimétrica à esquerda. Exemplo: Seja X = {4, 7, 5, 3, 9, 10, 2, 7, 4, 5, 7, 8, 9, 2, 3, 5, 6, 9, 4, 5, 6, 6, 4, 8, 2, 6, 4} com 27 observações. 2 3 4 5 6 7 8 9 10 X F re qu ên ci a A bs ol ut a 0 1 2 3 4 5 Figura 1.10: Gráfico de barras do exemplo O conjunto X é simétrico? Calcule seu coeficiente de assimetria. Para isso, precisamos calcular: • x̄ = 4 + 7 + 5 + 3 + · · ·+ 2 + 6 + 4 27 = 5, 56; • Mo(X) = 4, que é o valor com maior ocorrência; • DP (X) = √ V ar(X) = √ 5, 14 = 2, 27, em que V ar(X) = 42 + 72 + 52 + 32 + · · ·+ 22 + 62 + 42 27 − (5, 56)2 = 5, 14. 31 Estatı́stica Básica Portanto, o coeficiente de assimetria é dado por e = x̄−Mo(X) DP (X) = 5, 56− 4 2, 27 = 0, 69 > 0, logo a distribuição de valores é assimétrica à direita ou positiva. 1.6.2 Curtose A curtose ou achatamento de um conjunto de dados mede a concentração ou dispersão dos valores de um conjunto de valores em relação às medidas de tendência central em uma distribuição de frequências conhecida (a distribuição Normal padrão que será estu- dada ainda no curso). Como ainda não conhecemos essa distribuição, podemos entendê- la como uma distribuição padrão com um grau de achatamento mediano. A distribuição dos dados pode ser classificada em três classes: leptocúrtica (afunilada), mesocúrtica e platicúrtica (achatada). Seja um conjunto de dados com n observações X = {x1, x2, · · · , xn}. Também existem vários coeficientes de curtose, mas iremos estudar o coeficiente dado por: c = m4(X) DP (X)4 − 3, em que m4(X) = ∑n i=1(xi − x̄)4 n . Como a curtose da normal padrão é 3, o valor limiar para a classificação da curtose é o zero. Portanto, dizemos que X é: 1. Leptocúrtica: se c > 0; 2. Mesocúrtica: se c = 0; 32 Estatı́stica Básica 3. Platicúrtica: se c < 0. Exemplo: Retomando o exemplo anterior, sejaX = {4, 7, 5, 3, 9, 10, 2, 7, 4, 5, 7, 8, 9, 2, 3, 5, 6, 9, 4, 5, 6, 6, 4, 8, 2, 6, 4} com 27 observações. Calcule seu coeficiente de curtose e classifique. Para isso, precisamos calcular: • m4(X) = (4− 5, 56)4 + (7− 5, 56)4 + (5− 5, 56)4 + · · ·+ (6− 5, 56)4 + (4− 5, 56)4 27 = 55, 24; • DP (X) = 2, 27, calculado no exemplo anterior. Portanto, o coeficiente de curtose é dado por c = m4(X) DP (X)4 − 3 = 55, 24 2, 274 − 3 = −0, 92 < 0, logo a distribuição de valores é platicúrtica. Exercı́cio Segundo a SOBRAC (Sociedade Brasileirade Arritmias Cardı́acas), no Brasil, 40 milhões de pessoas têm algum tipo de Arritmia Cardı́aca. Estima-se que até 20% da população seja acometida pela doença. O ritmo cardı́aco (ou freqüência cardı́aca) ade- quado é ritmo regular. A frequência dos batimentos cardı́acos depende da atividade que o indivı́duo está realizando e é medida pelo número de contrações do coração por uma unidade de tempo, geralmente por minuto e é expressa em BPM (batimentos por minuto). A frequência cardı́aca pode variar muito, mas normalmente situa-se entre 60 bpm e 100 bpm num indivı́duo em repouso ou atividades habituais. Em algumas situações, como durante exercı́cios fı́sicos de alta intensidade, estes batimentos podem atingir até mesmo 180 bpm. Por outro lado, quando dormimos ou estamos em repouso, a frequência pode ficar abaixo dos 60 bpm. Seguindo critérios rigorosos, foram medidos os ritmos cardı́acos de repouso de 10 idosas brasileiras, obtendo-se os seguintes resultados (dados fictı́cios): 51, 55, 77, 99, 60, 75, 77, 85, 65, 62. Classifique o conjunto de ritmos cardı́acos de repouso em relação ao grau de assimetria e ao grau de curtose. 33 Estatı́stica Básica 1.7 Boxplot O Boxplot é uma representação gráfica que para ser construı́do e entendido precisa dos conhecimentos apresentados anteriormente sobre medidas de posição e dispersão. Por isso, dapresentaremos esse gráfico somente agora. Esta representação gráfica é bastante rica no sentido de informar a variabilidade e simetria dos dados, envolvendo os quar- tis do conjunto observado. Além disso, podemos observar se os dados possuem valores discrepantes (outliers). 1.7.1 Construção: O Boxplot é construı́do a partir de um retângulo em que o nı́vel superior é dado pelo ter- ceiro quartil e o nı́vel inferior pelo primeiro quartil. A mediana é representada por um traço no interior do retângulo e os segmentos de reta são colocados do retângulo até os valores máximo e mı́nimo, que não sejam observações discrepantes. As observações que estiverem acima do limite superior (LS) ou abaixo do limite inferior (LI) são denominadas de valores discrepantes (pontos exteriores). LI = Q1 − 3 2 IQ, LS = Q3 + 3 2 IQ e IQ = Q3 −Q1. Figura 1.11: Boxplot Exemplo: Construa o boxplot para o conjunto de pesos abaixo. Dados: 44.0 45.0 45.0 47.0 47.0 47.0 47.4 48.0 49.0 49.0 49.2 50.0 50.0 51.6 52.0 52.0 52.0 52.0 52.5 54.0 54.5 54.5 55.0 55.0 55.0 55.0 56.0 57.0 57.8 58.0 58.0 58.0 58.0 58.5 59.0 59.0 60.0 60.0 34 Estatı́stica Básica 60.0 60.5 63.0 63.5 66.0 67.0 68.5 70.0 71.0 71.0 72.8 73.0 73.0 75.0 79.0 80.9 84.0 85.2 86.0 87.0 95.0 97.0 Primeiro, precisamos verificar se os dados estão ordenados. Nesse caso, estão em ordem crescente. Precisamos calcular: • Q1 = 52 + 52 2 = 52, Q2 = 58 + 58 2 = 58 e Q3 = 68, 5 + 70 2 = 69, 25; • IQ = Q3 −Q1 = 69, 25− 52 = 17, 25; • LI = Q1 − 3 2 IQ = 52− 3 2 17, 25 = 26, 125; • LS = Q3 + 3 2 IQ = 69, 25 + 3 2 17, 25 = 95, 125. Assim, determinamos as alças superior igual a 44 e inferior igual 95, levando ao dado discrepante 97 que é maior do que o LS de 95,125. ● 50 60 70 80 90 P es o (K g) Figura 1.12: Boxplot para os dados da variável Peso (Kg) Podemos também ter vários boxplots juntos a fim de comparar diferentes conjuntos de dados. O eixo y das ordenadas continua igual e apenas usamos o eixo x das abscissas para distanciarmos os boxplots, sem nenhuma interpretação numérica. Exercı́cio 1 Suponha que no exercı́cio anterior, sobre os ritmos cardı́acos de repouso, uma das 10 observações foi corrigida (devido a um erro de registro), sendo 105 bpm ao invés 35 Estatı́stica Básica de 99 bpm, obtendo-se o novo conjunto de dados (dados fictı́cios): 51, 55, 77, 105, 60, 75, 77, 85, 65, 62. Construa o boxplot. Exercı́cio 2 Considere o tempo (em minutos) de atendimento em um determinado banco para um conjunto de 20 pessoas: 2; 2; 2; 3; 3; 4; 4; 4; 4; 4; 5; 5; 6; 6; 10; 12; 15; 17; 23; 25. Construa o gráfico de boxplot e interprete. 36 Estatı́stica Básica 1.8 Análise Bidimensional de Dados Estuda a relação/associação/dependência entre duas variáveis de interesse. Pode ser feita tanto para variáveis quantitativas quanto para variáveis qualitativas. 1.8.1 Análise Bidimensional de Variáveis Quantitativas e pareadas Quando temos disponı́vel duas variáveis quantitativas pareadas (mesmo número de observações), inicialmente, uma inspeção visual pode ser feita através de um gráfico de dispersão. Va- mos desenvolver o conceito dentro de um exemplo. Exemplo. Suponha as variáveis: Anos de Estudo (6, 4, 8, 8, 9, 12, 13, 9, 25, 15) e Salário Médio (1, 0.9, 1.2, 1.5, 1.8, 3, 2.5, 2, 10, 4) em milhares. ●● ● ● ● ● ● ● ● ● Anos de Estudo S al ár io M éd io ( em m ilh ar es ) 5 10 15 20 25 2 4 6 8 10 Figura 1.13: Gráfico de Dispersão das variáveis Anos de Estudo e Salário Médio. Podemos ainda, utilizar o coeficiente de correlação linear de Pearson para verificar se há indı́cios de uma relação linear significativa entre essas duas variáveis. Para utilizar esse coeficiente, precisamos de observações de variáveis pareadas, da forma {(x1, y1), (x2, y2), · · · , (xn, yn)}. Isso ocorre no caso do exemplo. 37 Estatı́stica Básica O coeficiente de correlação linear de Pearson é definido por cor(X, Y ) = cov(X, Y ) DP (X)DP (Y ) = ∑n i=1 xiyi − nx̄ȳ√ ( ∑n i=1 x 2 i − nx̄2) ( ∑n i=1 y 2 i − nȳ2) , tal que cov(X, Y ) = 1 n ∑n i=1 [(xi − x̄)(yi − ȳ)] , representa a covariância entre X e Y . Assim definido, o coeficiente somente assume valores no intervalo [−1, 1]. E, sua interpretação segue: • valores do coeficiente mais próximos de -1, indicam maior relação linear negativa/decrescente; • valores do coeficiente mais próximos de 1, indicam maior relação linear positiva/crescente; • valores do coeficiente mais próximos de 0, indicam menor relação linear ; No exemplo, temos para n = 10:∑n i=1 xi = 109; ∑n i=1 yi = 27, 9; ∑n i=1 x 2 i = 1505; ∑n i=1 y 2 i = 143, 99; ∑n i=1 xiyi = 443, 9 ; x̄ = 10, 9 e ȳ = 2, 79; em que X representa a variável Anos de Estudo e Y representa o Salário Médio. Assim, obtemos que cor(X, Y ) = ∑n i=1 xiyi − nx̄ȳ√ ( ∑n i=1 x 2 i − nx̄2) ( ∑n i=1 y 2 i − nȳ2) = 443, 9− 10 ∗ 10, 9 ∗ 2, 79√ (1505− 10 ∗ (10, 9)2) (143, 99− 10 ∗ (2, 79)2) = 0, 944116, indicando alta relação linear crescente. 1.8.2 Análise Bidimensional para Variáveis Qualitativas ou Quantitati- vas Considere a quantia de empréstimos diários (em milhares) de quatro diferentes bancos com agências de mesmo porte em três avenidas de uma cidade: 38 Estatı́stica Básica Banco/Avenida A1 A2 A3 Total B1 25 35 24 84 B2 32 28 27 87 B3 27 33 31 91 B4 41 60 25 126 Total 125 156 107 388 Será que a quantia de empréstimos varia de acordo com o banco? Podemos calcular o coefiente de contigência para começar a responder essa pergunta. Para esse cálculo, precisamos primeiro construir a tabela de contigência dos dados que contempla tanto a frequência observada (oij) quanto a esperada(eij), caso haja independência entre as variáveis. A frequência esperada de cada casela da tabela é dada por: eij = total da linha i x total da coluna j total geral . Nesse caso, teremos então: e11 = 84× 125 388 = 27, 06; e12 = 84× 156 388 = 33, 77 e13 = 84× 107 388 = 23, 17; e21 = 87× 125 388 = 28, 03; e22 = 87× 156 388 = 34, 98; e23 = 87× 107 388 = 23, 99; e31 = 91× 125 388 = 29, 32; e32 = 91× 156 388 = 36, 59; e33 = 91× 107 388 = 25, 10; e41 = 126× 125 388 = 40, 59; e42 = 126× 156 388 = 50, 66; e43 = 126× 107 388 = 34, 75. E, a tabela de contigência é dada por: Banco/Avenida A1 A2 A3 Total oij eij oij eij oij eij B1 25 27,06 35 33,77 24 23,17 84 B2 32 28,03 28 34,98 27 23,99 87 B3 27 29,32 33 36,59 31 25,10 91 B4 41 40,59 60 50,66 25 34,75 126 Total 125 - 156 - 107 - 388 39Estatı́stica Básica O coeficiente de contigência é dado por: C = √ χ2 χ2 + total geral , tal que χ2 = ∑ i ∑ j (oij − eij)2 eij é a medida de qui-quadrado e o total geral é o número total de observações. No exemplo, obtemos que χ2 = (25− 27, 06)2 27, 06 + (35− 33, 77)2 33, 77 + (24− 23, 17)2 23, 17 + (32− 28, 03)2 28, 03 +· · ·+(25− 34, 75) 2 34, 75 = 8, 95. Logo, C = √ 8, 95 8, 95 + 388 = 0, 15 indicando que não há relação entre as variáveis. Uma medida mais robusta é obtida pelo coeficiente de contigência corrigido: C∗ = C√ (t− 1)/t , em que t = min{total de linhas , total de colunas }. No exemplo, t = min{4, 3} = 3 e, portanto, C∗ = 0, 15√ (3− 1)/3 = 0, 18, confirmando a indicação de independência entre as variáveis, dada pelo baixo valor do coeficiente de contigência. Exercı́cios. 1. Uma amostra de 10 casais e seus respectivos salários anuais (em salários mı́nimos) foi colhida em um certo bairro conforme abaixo: Casal 1 2 3 4 5 6 7 8 9 10 Total Homem (X) 10 10 10 15 15 15 15 20 20 20 150 Mulher (Y ) 5 10 10 5 10 10 15 10 10 15 100 (a) Construa o diagrama de dispersão. (b) Encontre a correlação entre os salários anuais. 40 Estatı́stica Básica (c) Qual a interpretação do coeficiente calculado? A interpretação concorda com o que foi observado no gráfico de dispersão? 2. Uma companhia de seguros analisou a frequência com que 150 segurados usaram (ou não) o hospital. Os resultados foram os seguintes: Uso do Hospital/Sexo Homem Mulher Total Usaram o hospital 10 20 30 Não usaram o hospital 110 10 120 Total 120 30 150 Queremos verificar se existe ou não relação entre o sexo e o uso do hospital, isto é, se as variáveis são dependentes. 41 Capı́tulo 2 Probabilidade 2.1 Conceitos Básicos Definição 1. Um experimento aleatório (�) é um experimento cujo resultado não pode ser previsto, com certeza, antes de sua ocorrência. Exemplo 1. (i) Lançar um dado equilibrado duas vezes e observar a soma dos pontos obtidos. (ii) Taxa de desemprego. (iii) Ocorrência de chuva amanhã. Definição 2. Espaço amostral (Ω): é o conjunto de todos os possı́veis resultados de um experimento aleatório. Exemplo 2. �1: Lançamento de um dado com 6 faces. Ω = {1, 2, 3, 4, 5, 6}. �2: Lançamento de dois dados com 6 faces cada. Ω = {1, 2, 3, 4, 5, 6} × {1, 2, 3, 4, 5, 6} = {(1, 1), (1, 2), (1, 3), (1, 4), (1, 5), (1, 6), (2, 1), (2, 2), (2, 3), (2, 4), (2, 5), (2, 6), (3, 1), (3, 2), (3, 3), (3, 4), (3, 5), (3, 6), (4, 1), (4, 2), (4, 3), (4, 4), (4, 5), (4, 6), (5, 1), (5, 2), (5, 3), (5, 4), (5, 5), (5, 6), (6, 1), (6, 2), (6, 3), (6, 4), (6, 5), (6, 6)}. �3: medir a vida útil de uma lâmpada. Ω = [0,∞). Definição 3. Um evento A é qualquer subconjunto do espaço amostral, isto é, A ⊂ Ω. Exemplo 3. �: Lançamento de um dado com 6 faces. Exemplos de eventos: A = {2, 4, 6} (face par); B = {5, 6} (face é maior do que 4). 2.1.1 Operações com Eventos Aleatórios Sejam A e B eventos definidos no espaço amostral Ω. 42 Estatı́stica Básica 1. Interseção: Ocorrência simultânea. A ∩B = {x ∈ Ω;x ∈ A e x ∈ B}. 2. União: Ocorrência de pelo menos um. A ∪B = {x ∈ Ω;x ∈ A ou x ∈ B}. 3. Complementar: Negação do evento. AC = A = {x ∈ Ω;x /∈ A}. 4. Diferença: A−B = A ∩BC = {x ∈ Ω;x ∈ A e x /∈ B}. 5. A e B são ditos disjuntos ou mutuamente exclusivos, se A ∩B = �. Exemplo 4. Considere os seguintes eventos no lançamento de um dado com 6 faces: A= {sair um número par} e B= {sair um número ı́mpar}. Logo: A = {2, 4, 6}; B = {1, 3, 5}; A ∩B = �(disjuntos); A ∪B = Ω; AC = B; A−B = A. 2.1.2 Probabilidade Definição 4 (Definições Clássicas). Seja o evento A ⊂ Ω, sendo Ω espaço amostral associado a um experimento aleatório, então: (i) Resultados Equiprováveis. Se Ω é finito e seus elementos são equiprováveis, então P (A) = nA nΩ , em que nA é o número de elementos (cardinalidade) do evento A e nΩ é o número de elementos de Ω. (ii) Geométrica. Se a área de A estiver bem definida, então P (A) = área A área Ω . Exemplo 5. (i) Jogar um dado equilibrado com 6 faces e observar a face superior. Logo, P ({1, 2}) = 2 6 . (ii) Escolher, ao acaso, um ponto do cı́rculo unitário de raio 1 centrado na origem. Então Ω = {(x, y) ∈ R2;x2 + y2 ≤ 1}. E, P ({distância entre o ponto escolhido e a origem é ≤ 1/2}) = π(1/2) 2 π . 43 Estatı́stica Básica Definição 5 (Definição Frequentista). Seja o eventoA ⊂ Ω, sendo Ω espaço amostral associado a um experimento aleatório, então podemos definir probabilidade como o limite da frequência relativa da ocorrência de A em n repetições independentes do experimento, quando n tende ao infinito, isto é, P (A) = lim n→∞ nA n , em que nA é o número de ocorrências do evento A em n repetições independentes do experimento. Observe que não é possı́vel repetir o experimento infinitas vezes, logo não podemos ava- liar de fato essa probabilidade. Definição 6 (Definição Subjetiva). Seja o evento A ⊂ Ω, sendo Ω espaço amostral associado a um experimento aleatório, então a probabilidade de A representa uma medida do grau da crença de alguém na ocorrência de A. Exemplo 6. Seja A o evento ´´está chovendo no RJ”. Para alguém que está, por exemplo, em Portugal e não sabe nada sobre o clima no RJ, provavelmente essa probabilidade seria de 0,5. Por outro lado, alguém em Seropédica poderia estabelecer que essa probabilidade é de 0,7, se também está chovendo em Seropédica. Finalmente, para uma pessoa no RJ, essa probabilidade é 1 se está chovendo no RJ. Definição 7 (Definição Axiomática). Seja Ω espaço amostral associado a um experimento aleatório. Uma função P : Ω→ < é chamada de probabilidade se satisfaz os seguintes axiomas: (1) P (A) ≥ 0, ∀A ⊂ Ω; (2) P (Ω) = 1; (3) Se A1, A2, · · · ⊂ Ω são disjuntos, então P (∪∞i=1Ai) = ∞∑ i=1 P (Ai). 2.1.3 Propriedades de Probabilidade: Sejam P uma probabilidade e A um evento em Ω. Então, as propriedades abaixo são consequências dos axiomas: (i) P (Ac) = 1− P (A) (axiomas 2 e 3), com caso particular P (�) = 1− P (Ω) = 0; (ii) 0 ≤ P (A) ≤ 1 (axioma 1 e (i)); (iii) Se A ⊂ B, então P (B − A) = P (B)− P (A) e P (A) ≤ P (B); (iv) Se A,B ⊂ Ω, então P (A ∪B) = P (A) + P (B)− P (A ∩B). 44 Estatı́stica Básica 2.1.4 Probabilidade Condicional Definição 8. Sejam A e B eventos em Ω. A probabilidade condicional de A dado que ocorreu B é definida por P (A|B) = P (A ∩B) P (B) , se P (B) > 0. Caso P (B) = 0 então, por convenção, P (A|B) = 0 ou P (A|B) = P (A). Exemplo 7. Uma carta de um baralho com 52 cartas é retirada ao acaso. Considere os eventos, C={carta é de copas} e R={carta é um rei}. Encontre P (C), P (C ∩R), P (R) e P (C|R). Teorema 1 (Regra do Produto). Sejam os eventosA1, A2, ... , An definidos em Ω, com P (∩ni=1Ai) > 0, então P (∩ni=1Ai) = P (A1)P (A2|A1)P (A3|A1 ∩ A2) · · ·P (An| ∩n−1i=1 Ai). Definição 9 (Independência de Dois Eventos). Sejam A e B eventos em Ω. A e B são ditos ser eventos independentes se P (A ∩B) = P (A)P (B). Uma definição alternativa é que A e B são ditos ser eventos independentes se P (A|B) = P (A) e P (B|A) = P (B). Definição 10. A sequência de eventos A1, A2, ... , An é dita formar uma partição do espaço amostral Ω, se (i) Ai ∩ Aj = �, para todo i 6= j; (ii) ∪ni=1Ai = Ω. Teorema 2 (Lei da Probabilidade Total). Suponha que os eventos A1, A2, ... , An definidos em Ω formam uma partição de Ω, então P (B) = n∑ i=1 P (Ai)P (B|Ai), ∀B ∈ A. Teorema 3 (Teorema de Bayes). Suponha que os eventosA1, A2, ... , An definidos em Ω formam uma partição de Ω , então P (Aj|B) = P (B|Aj)P (Aj)∑n i=1 P (Ai)P (B|Ai) . Exemplo 8. Uma fábrica produz três tipos de circuitos, sendo: 20% do tipo I , 50% do tipo II e 30% do tipo III . A probabilidade de defeito é, respectivamente, 2%, 8% e 5%. a) Qual é a probabilidade de um circuito testado não ser defeituoso? b)Um circuito foi testado aleatoriamente e verificou-se que estava com defeito, qual é a probabilidade do circuito ser do tipo II? 45 Estatı́stica Básica 2.2 Alguns Conceitos/Resultados Importantes Leis de Morgan Sejam os conjuntos A1, A2, ... , An. Vale que: 1. ( ⋃n i=1Ai) C = ⋂n i=1 A C i ; 2. ( ⋂n i=1Ai) C = ⋃n i=1 A C i . 46 Capı́tulo 3 Variáveis Aleatórias Uma variável aleatória (v.a.) é uma função real X que associa elementos do espaço amos- tral a valores reais, i.e., X : Ω→ <. Definição 11 (Variáveis Aleatórias Discretas (v.a.d.) ). Uma variável aleatória X em Ω é dita ser discreta se assume valores em um conjunto de valores finito ou enumerável infinito. Exemplo 9. Exemplo: Suponha 2 lançamentos de uma moeda. Represente por c cara e por k coroa, então Ω = {cc, ck, kc, kk}. O número de caras observadas nesses 2 lançamentos é uma quantidade numérica e podemos definir X = ´´nº de caras observadas”. Note que X pode assumir valores no conjunto finito {0, 1, 2}. Definição 12 (Função de probabilidade (fp)). A função p(·) que atribui a cada valor da variável aleatória discreta X sua probabilidade é denominada função de probabilidade. Assim, se X assume valores x1, x2, · · · temos p(xi) = P (X = xi) = P ({ω ∈ Ω;X(ω) = xi}), para i = 1, · · · , n. Também é usual apresentá-la em forma de tabela: X x1 x2 ... pi p1 p2 ... Propriedades da função de probabilidade: Uma função de probabilidade satisfaz as se- guintes condições: (i) 0 ≤ p(xi) ≤ 1, ∀i; (ii) ∑ i p(xi) = 1. 47 Estatı́stica Básica Exemplo 10. Descreva o comportamento da variável aleatória X que conta o número de caras em dois lançamentos independentes de uma moeda. Espaço amostral: Ω = {cc, ck, kc, kk} Variável aleatória discreta X : X = xi 0 1 2 p(xi) 1 4 1 2 1 4 Definição 13 (Função de Distribuição (acumulada) (fda)). Seja X uma v.a.d. em Ω, então sua função de distribuição acumulada é definida por FX(x) = P (X ≤ x), para todo x ∈ <. Exemplo 11. Considere o lançamento de uma moeda. Então Ω = {c, k} e a função probabilidade é dada por P (c) = P (k) = 1/2. Defina X : Ω→ < como: X = 1, se ω = c0, se ω = k (3.1) Vamos obter sua função de distribuição acumulada: x < 0⇒ F (x) = P (X ≤ x) = 0; 0 ≤ x < 1⇒ F (x) = P (X ≤ x) = P (X = 0) = 1/2; x ≥ 1⇒ F (x) = P (X ≤ x) = P (X = 0) + P (X = 1) = 1/2 + 1/2 = 1. Portanto, F (x) = 0, se x < 0 1/2, se 0 ≤ x < 1 1, se x ≥ 1 (3.2) Propriedades da função de distribuição acumulada: Uma função de distribuição acumu- lada F de uma v.a.d. X em Ω goza das seguintes propriedades: (i) limx→−∞ F (x) = 0 e limx→∞ F (x) = 1; (ii) F (x) é contı́nua a direita, isto é, limh→0 F (x+ h) = F (x) ; (iii) F (x) é não decrescente, isto é, ∀x, y ∈ <, se x < y, então F (x) ≤ F (y). Note que no exemplo acima, as propriedades são satisfeitas pela F encontrada. 48 Estatı́stica Básica O comportamento de uma variável aleatória e toda informação sobre ela podem ser obti- dos através de sua função de distribuição acumulada. Além disso, toda função real que satisfaça as propriedades acima é a função de distribuição acumulada de uma variável aleatória. Funções de Variáveis Aleatórias Seja X uma v.a.d. definida em Ω, então a função ou transformação g : X → < também é uma v.a.d.. Assim, dada a distribuição de X , o interesse consiste em conhecer o comportamento probabilı́stico de sua transformação. Exemplo 12. Seja X uma v.a.d. com função de probabilidade dada abaixo: X = xi -1 0 1 p(xi) 1 3 1 2 1 6 Seja Y = 2X + 1. Logo, a função de probabilidade de Y é dada por: X = xi -1 0 1 Y = yi = 2xi + 1 -1 1 3 p(yi) 1 3 1 2 1 6 Exemplo 13. Considerando X como no exemplo anterior, definamos Z = X2. Logo, temos que considerar que tanto X = −1 quanto X = 1 levam a Z = 1, portanto temos que a função de probabilidade de Z é dada por: Z = zi = x 2 i 0 1 p(zi) 1 3 + 1 6 = 1 2 1 2 Definição 14 (Esperança ou Valor Esperado). Seja X uma v.a.d. com função de probabilidade p, então a esperança (matemática) de X é dada por E[X] = ∑ x xp(x), desde que exista. Exemplo 14. Como no exemplo anterior, seja X uma v.a.d. com função de probabilidade dada abaixo: Determine a esperança de X : E[X] = −1× 1/3 + 0× 1/2 + 1× 1/6 ≈ −0, 17. 49 Estatı́stica Básica X = xi -1 0 1 p(xi) 1 3 1 2 1 6 Vale que: 1. Se c é uma constante tal que P (X = c) = 1 então E[X] = c; 2. E[aX + b] = aE[X] + b, para a e b constantes reais. 3.1 Momentos A fim de conhecer melhor o comportamento probabilı́stico de uma variável aleatória, de forma segura e universalmente interpretável, podemos obter seus momentos. Os momen- tos podem ser: momentos em relação a uma certa constante c ∈ < , e momentos absolutos em relação a essa mesma constante. Note que existem distribuições que não possuem momentos. Definição 15 (Momentos). Seja X uma variável aleatória discreta. Para k = 1, 2, · · · e c ∈ <, o momento de ordem k em relação a c é dado por: E[(X − c)k], desde que exista. Podemos ter: 1. Momento absoluto de ordem k em relação a c: E[|X − c|k]. Em todas as próximas definições, podemos ter a versão usando o valor absoluto. 2. Se c = 0, então o momento é dito ser ordinário: E[Xk]. 3. Se c = E[X] <∞, então temos o momento central de ordem k: E[(X − E[X])k]. Os momentos de ordem par fornecem uma indicação da concentração da distribuição probabilı́stica: se forem muito pequenos, essa concentração será grande, porque os valores da variável aleatória serão próximos; se forem grandes, será inversa a situação. Exemplo 15. O primeiro momento ordinário (de ordem k = 1) de uma v.a. X é o seu valor esperado. 50 Estatı́stica Básica Definição 16 (Variância). Seja X uma variável aleatória discreta, então a variância de X é defi- nida por V ar(X) = E[(X − E[X])2] = E[X2]− (E[X])2, que é segundo momento central de X . Sua raiz quadrada é o desvio padrão de X , que possui a mesma unidade dos dados. Exemplo 16. Considerando o mesmo exemplo anterior, determine a variância de X : V ar(X) = E[X2]− (E[X])2 = 0, 5− (−0, 17)2 = 0, 4711, pois E[x2] = −12 × 1/3 + 02 × 1/2 + 12 × 1/6 = 0, 5 e E[X] = −0, 17. Enquanto que a esperança de uma v.a. é uma medida de locação/localização, a variância é uma medida de escala (como referência a média). Exemplo 17. O número X de mensagens enviadas por hora, através de uma rede de compu- tadores, tem a seguinte distribuição: X assume os valores {10, 12, 15, 20} com probabilidades {0, 1; 0, 3; 0, 5; 0, 1}, respectivamente. Determine o desvio-padrão de X . E[X] = 10(0, 1) + 12(0, 3) + 15(0, 5) + 20(0, 1) = 14, 1; E[X2] = 102(0, 1) + 122(0, 3) + 152(0, 5) + 202(0, 1) = 205, 7; V ar(X) = 205, 7− 14, 12 = 6, 89⇒ DP (X) = √ 6, 89 = 2, 624881. Seja X uma v.a.d., vale que: 1. Se c é uma constante tal que P (X = c) = 1 então V ar[X] = 0; 2. V ar[aX + b] = a2V ar[X], para a e b constantes reais. Definição 17 (Coeficiente de Variação). Seja X uma v.a.d. com esperança µ e desvio padrão σ, o coeficiente de variação de X é dado por CV (X) = σ µ . O coeficiente de variação mede a dispersão relativa da distribuição de X , ao contrário do desvio padrão, de X , que mede a dispersão absoluta. Note que ele é um coeficiente adimensional. 51 Estatı́stica Básica 3.2 Alguns Modelos Discretos Uma v.a. fica completamente especificada pela sua função de distribuição. No caso dis- creto, podemos também utilizar a função de probabilidade para fazer essa caracterização. Apresentaremos a seguir alguns modelos discretos, representados por suas funções de probabilidade, que são aplicáveis em diversas situações práticas. 3.2.1 Modelo Uniforme Discreto Seja X uma v.a. com n possı́veis valores reais {x1, x2, ..., xn} equiprováveis. Então, X segue o modelo uniforme discreto e tem função deprobabilidade dada por p(xi) = P (X = xi) = 1n , se i = 1, 2, ..., n,0, c.c. Notação: X ∼ Uniforme{x1, x2, · · · , xn}. Exemplo 18. Uma rifa tem 100 bilhetes numeradas de 1 a 100. Tenho 5 bilhetes consecutivos e meu amigo tem outros 5 bilhetes quaisquer. Quem tem maior possibilidade de ser sorteado? Note que sua função de distribuição acumulada é do tipo escada com saltos nos pontos {x1, x2, · · · , xn}. Exercı́cio: Determine sua fda, sua esperança e sua variância. 3.2.2 Modelo Bernoulli Experimento de Bernoulli: é um experimento aleatório com apenas dois resultados possı́veis: por convenção, um deles é chamado “sucesso”e o outro “fracasso”. Exemplo 19. a) Lançar uma moeda e observar o resultado; b) Pergunta-se a um eleitor se ele vai votar no candidato A ou B. A distribuição de Bernoulli está associada a um experimento de Bernoulli, onde se define: X({sucesso}) = 1 e X({fracasso}) = 0, chamando de p a probabilidade de sucesso, com 0 ≤ p ≤ 1. Assim, uma v.a.d. X segue o modelo de Bernoulli, se assume apenas os valores 0 e 1, e tem função de probabilidade dada por p(x) = p, se x = 1, (1− p), se x = 0, 0, c.c. 52 Estatı́stica Básica onde p é a probabilidade de sucesso (X = 1), com 0 ≤ p ≤ 1. Exemplo 20. Um exemplo clássico do modelo de Bernoulli é o lançamento de uma moeda. X = 1, se cara;0, se coroa. p(1) = p(0) = 1/2 (moeda equilibrada). Notação: X ∼ Bernoulli(p). A função de distribuição de X é dada por FX(x) = 0, se x < 0, (1− p), se 0 ≤ x < 1, 1, se x ≥ 1. Exercı́cio: Faça o gráfico desta função e determine sua esperança e sua variância. 3.2.3 Modelo Binomial Seja X o número de sucessos em n realizações independentes de um experimento de Ber- noulli com probabilidade p de sucesso. Então,X tem distribuição binomial com parâmetros n e p, e sua função de probabilidade é dada por p(x) = n x px(1− p)n−x, para x = 0, 1, · · · , n 0, c.c., em que n x = n! x! (n− x)! . Notação: X ∼ Binomial(n, p). Exemplo 21. A taxa de imunização de uma vacina é de 80%. Um grupo com 10 pessoas foi selecionado, desejamos saber o comportamento probabilı́stico do número de pessoas imunizadas deste grupo. Determine a probabilidade: a) de 8 pessoas estarem imunizadas; b) de pelo menos 8 estarem imunizadas; c) de no máximo 7 estarem imunizadas; c) de todas estarem imunizadas. 53 Estatı́stica Básica 3.2.4 Modelo Geométrico Seja X o número de realizações necessárias para a obtenção do primeiro sucesso de um experimento de Bernoulli com probabilidade p de sucesso. Então, dizemos que X segue o modelo geométrico com parâmetro p, 0 < p < 1, e tem função de probabilidade dada por p(x) = P (X = x) = p(1− p)x−1, se x = 1, 2, · · · ,0, c.c.. Notação: X ∼ Geo(p). Exemplo 22. Uma linha de fabricação de um equipamento de precisão é interrompida na primeira ocorrência de um defeito. Seja 0, 02 é a probabilidade do equipamento ter defeito, qual é o modelo probabilı́stico que descreve o número de dias até o equipamento parar? Exercı́cio: Determine sua esperança. 3.2.5 Modelo Binomial Negativo (Pascal) Seja X o número de realizações necessárias para a obtenção de r sucessos de um experi- mento de Bernoulli com probabilidade p de sucesso. Então, dizemos que X segue o mo- delo Binomial Negativo com parâmetros r e p, 0 < p < 1, e tem função de probabilidade dada por p(x) = P (X = x) = x− 1 r − 1 pr(1− p)x−r, se x = r, r + 1, · · · , 0, c.c.. Notação: X ∼ BinNeg(r, p). Note que o modelo Geométrico é um caso particular do modelo Binomial Negativo, quando r = 1. Exemplo 23. Um atirador acerto o alvo na mosca em 30% dos tiros. Qual é a probabilidade de que somente no vigésimo tiro o atirador acerte na mosca 2 vezes? 3.2.6 Modelo Hipergeométrico Seja uma população de tamanho N dividida em 2 classes, uma composta de r “sucessos”e a outra composta de N − r “fracassos”. Desta população, vamos extrair uma amostra de 54 Estatı́stica Básica tamanho n, sem reposição. Seja X o número de sucessos obtidos, então X segue o modelo Hipergeométrico com parâmetros N, n, e r, e tem função de probabilidade dada por p(x) = P (X = x) = ( r x )( N − r n− x ) ( N n ) , se max{0, n− (N − r)} ≤ x ≤ min{n, r} 0, c.c., em que N é o total de elementos do conjunto, n é o tamanho da amostra (n < N ) e r é o número de “sucessos”. Notação: X ∼ Hiper(N, n, r). Exemplo 24. Considere um conjunto com 20 pessoas, das quais 7 são mulheres. Selecionando-se 5 pessoas deste conjunto, sem reposição, qual seria a probabilidade de: a) 2 mulheres serem escolhidas? b) 1 homem ser escolhido? c) apenas mulheres serem escolhidas? d) pelo menos 5 mulheres serem escolhidas? e) no máximo 2 homens serem escolhidos? f) Fernando e Paula serem escolhidos? g) Paula e Maria serem escolhidas, dado que as pessoas selecionadas foram mulheres? h) Paula e Maria serem escolhidas, dado que as pessoas selecionadas foram homens? 3.2.7 Modelo de Poisson Uma v.a.d. X segue o modelo de Poisson de parâmetro λ, λ > 0, se sua função de proba- bilidade é dada por p(x) = P (X = x) = e−λλx x! , se x = 0, 1, 2, · · · 0, c.c.. Notação: X ∼ Poisson(λ), onde λ indica a taxa de ocorrência por unidade de medida. Aqui, X representa contagens, como contar o número de eventos de um certo tipo que ocorrem em um instante de tempo fixo (ou superfı́cie ou volume), se estes eventos ocorrem com uma razão média conhecida e independentemente do tempo desde o último evento. Exemplo 25. (1) número de chamadas recebidas por uma central telefônica durante um perı́odo de 40 minutos; (2) número de bactérias em um litro de água. 55 Estatı́stica Básica Exemplo 26 (Bombas em Londres). Durante a Segunda Guerra Mundial a cidade de londres foi bombardeada por aviões alemães. Um interesse é sobre a aleatoriedade dos alvos, se houve tendência em lançar em alguns pontos especı́ficos ou não. Subdivindindo-se a parte do sul da cidade em 576 partes, é contado o número de regiões que receberam x bombas, denotado por nx. O total de bombas nas parte sul foi de 537, levando a uma taxa de 537/576 ≈ 0, 93 bombas por região. Uma maneira de verificarmos se o modelo Poisson seria aplicável para modelar o número de bombas lançadas por região, é calcular as frequências de bombas que ocorreram (observadas) fo e comparar com as frequências esperadas de bombas que seriam lançadas supondo o modelo Poisson válido fe. Assim, se X representa o nº de bombas em uma região da parte sul, então suponha que X ∼ Poisson(0, 93). X = x 0 1 2 3 4 5 ou mais fo 229 211 93 35 7 1 p(x) 0,395 0,367 0,171 0,053 0,012 0,003 fe 227,520 211,392 98,496 30,528 6,912 1,728 Exercı́cio: Determine sua esperança. 56 Estatı́stica Básica 3.3 Variáveis Aleatórias Contı́nuas Definição 18 (Variáveis Aleatórias Contı́nuas (v.a.c.) ). Uma variável aleatória X é contı́nua se sua imagem é um conjunto infinito não enumerável (formada por intervalos). Uma v.a.c. possui uma função de densidade de probabilidade f com a qual podemos cal- cular probabilidades associadas a variável aleatória. Uma função de densidade de probabilidade satisfaz as seguintes condições: (i) f(x) ≥ 0, para todo x ∈ <; (ii) a área abaixo do gráfico da função f é igual a 1, ou seja, ∫ ∞ −∞ f(x)dx = 1. Para obtermos a probabilidade de uma v.a.c. assumir valores em um intervalo (a, b], para a < b, basta calcular P (a < X ≤ b) = ∫ b a f(x)dx. Note que P (a < X ≤ b) = P (a ≤ X < b) = P (a < X < b) = P (a ≤ X ≤ b). Portanto, a probabilidade de uma v.a.c. assumir um valor especı́fico é igual a zero, isto é, P (X = c) = 0, c ∈ <. Exemplo 27. Considere a função fX(x) = 1/4 se 0 ≤ x ≤ 40 c.c. 1. Esboce o gráfico da fX . 2. fX é uma função de densidade de probabilidade de alguma v.a.c. X? 3. Se é uma fdp,então calcule P (2 ≤ X ≤ 3). Seja X uma v.a.c. com função densidade de probabilidade f(x), podemos definir: • Função de distribuição acumulada: F (x) = P (X ≤ x) = ∫ x −∞ f(x)dx, para todo x ∈ <. • Esperança: E[X] = ∫ x xf(x)dx. • Variância: V ar(X) = E[X2]− E[X]2. 57 Estatı́stica Básica 3.3.1 Modelo Uniforme Contı́nuo Seja X uma v.a.c. com possı́veis valores no intervalo real [a, b], em que a chance de ocorrência de intervalos de mesmo tamanho é a mesma. Então, X segue o modelo uni- forme contı́nuo e tem função densidade de probabilidade dada por f(x) = 1b−a , se a ≤ x ≤ b,0, c.c. Notação: X ∼ Uniforme[a, b]. É fácil ver que a função acima satisfaz as propriedades de função densidade de probabili- dade f(x) ≥ 0, para todo x ∈ < e que ∫∞ −∞ f(x)dx = 1. Exemplo 28. O rótulo de refrigerante indica que o conteúdo é de 350 ml. Suponha que a linha de produção encha as latas de forma que o conteúdo seja uniformemente distribuı́do no intervalo [345,355]. 1. Qual é a probabilidade de que uma lata tenha conteúdo superior a 353 ml? 2. Qual é a probabilidade de que uma lata tenha conteúdo inferior a 346 ml? 3. O controle de qualidade aceita uma lata com conteúdo dentro de 4 ml do conteúdo exibido na lata. Qual é a proporção de latas rejeitadas nessa linha de produção? 3.3.2 Modelo Normal Uma v.a.c. X tem distribuição Normal com parâmetros µ e σ2, se sua f.d.p. é dada por fX(x;µ, σ 2) = 1√ 2πσ2 e −1 2 ( x− µ σ )2 , −∞ < x < +∞. • Notação: X ∼ N(µ;σ2), onde µ é a média e σ2 é a variância. • Propriedades: – A f.d.p. fX(x) é simétrica em torno de µ; – A f.d.p. fX(x)→ 0 quando x→ ±∞; – O máximo da f.d.p. fX(x) ocorre quando x = µ. 58 Estatı́stica Básica Para calcular probabilidades associadas a uma v.a.c. normal, terı́amos que resolver inte- grais que envolvem a f descrita acima. Porém, isto não é possı́vel analiticamente, mas somente de forma numérica. Sem o auxı́lio de um programa computacional que rea- lize tal tarefa, não seria possı́vel tabular todas as probabilidades associadas a qualquer distribuição normal, isto é, para quaisquer valores de µ e σ2 possı́veis. Entretanto, é possı́vel mostrar que a partir de qualquer normal chegamos em uma normal, chamada padrão, com parâmetros µ = 0 e σ2 = 1. −4 −2 0 2 4 0. 0 0. 1 0. 2 0. 3 0. 4 Normal(0,1) x D en si da de −4 −2 0 2 4 0. 0 0. 2 0. 4 0. 6 0. 8 1. 0 Função de distribuição acumulada (FDA) x F D A Figura 3.1: Gráficos da função de densidade de probabilidade e da função de distribuição acumulada da Normal Padrão. Utilização da tabela Normal padrão Uma v.a. X tem distribuição Normal padrão ou Normal reduzida, se X ∼ N(0, 1). Importante: • Se X ∼ N(0, 1), então podemos usar a tabela Normal padrão. • Se X ∼ N(µ;σ2) com µ 6= 0 e/ou σ2 6= 1, então temos que padronizar a v.a. X por Z = X − µ σ ∼ N(0, 1). Exemplo 29. Suponha que Z tenha distribuição N(0; 1). Usando a tabela da distribuição normal padrão, deter- mine o valor de probabilidade de: a)P (0 ≤ Z ≤ 1, 65) b)P (Z ≤ 1, 29) c)P (0 ≤ Z ≤ 1, 34) d)P (−1 ≤ Z ≤ 1) e)P (Z ≤ 2, 45) f)P (Z ≥ −2, 01) g)P (Z ≥ 1, 65) h)P (Z > 2, 13) i)P (|Z| > 1, 61) 59 Estatı́stica Básica Exemplo 30. Suponha que Z tenha distribuição N(0; 1). Empregando a tábua da distribuição normal, determine o valor de z: a)P (Z ≥ z) = 0, 5 b)P (0 ≤ Z ≤ z) = 0, 3264 c)P (0 ≤ Z ≤ z) = 0, 3461 d)P (z ≤ Z ≤ 1) = 0, 6826 e)P (−1, 05 ≤ Z ≤ z) = 0, 7280 f)P (Z ≥ z) = 0, 0640 Exemplo 31. Em determinado laboratório de pesquisa de células tronco para problemas motores nos membros inferiores estuda a recuperação total dos movimentos. O responsável pelo procedimento afirma que o tempo que o paciente leva para obter melhoras significativas nos movimento, após cirurgia, segue uma distribuição Normal com média de 10 meses e desvio padrão de 4 meses. Segundo estas informações, qual é a probabilidade de um paciente obter melhoras significativas nos movimentos de 9 a 12 meses após a cirurgia? Até 6 meses? E após 10 meses? 60 Estatı́stica Básica Tabela 3.1: Probabilidades p = P [0 ≤ Z ≤ z] da Distribuição Normal padrão com valores de z dados nas margens da tabela z 0 1 2 3 4 5 6 7 8 9 0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359 0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753 0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141 0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517 0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879 0.5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224 0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549 0.7 0.2580 0.2611 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852 0.8 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133 0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.3389 1.0 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621 1.1 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.3770 0.3790 0.3810 0.3830 1.2 0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.3980 0.3997 0.4015 1.3 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177 1.4 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319 1.5 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441 1.6 0.4452 0.4463 0.4474 0.4484 0.4495 0.4505 0.4515 0.4525 0.4535 0.4545 1.7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4625 0.4633 1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706 1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.4750 0.4756 0.4761 0.4767 2.0 0.4772 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817 2.1 0.4821 0.4826 0.4830 0.4834 0.4838 0.4842 0.4846 0.4850 0.4854 0.4857 2.2 0.4861 0.4864 0.4868 0.4871 0.4875 0.4878 0.4881 0.4884 0.4887 0.4890 2.3 0.4893 0.4896 0.4898 0.4901 0.4904 0.4906 0.4909 0.4911 0.4913 0.4916 2.4 0.4918 0.4920 0.4922 0.4925 0.4927 0.4929 0.4931 0.4932 0.4934 0.4936 2.5 0.4938 0.4940 0.4941 0.4943 0.4945 0.4946 0.4948 0.4949 0.4951 0.4952 2.6 0.4953 0.4955 0.4956 0.4957 0.4959 0.4960 0.4961 0.4962 0.4963 0.4964 2.7 0.4965 0.4966 0.4967 0.4968 0.4969 0.4970 0.4971 0.4972 0.4973 0.4974 2.8 0.4974 0.4975 0.4976 0.4977 0.4977 0.4978 0.4979 0.4979 0.4980 0.4981 2.9 0.4981 0.4982 0.4982 0.4983 0.4984 0.4984 0.4985 0.4985 0.4986 0.4986 3.0 0.4987 0.4987 0.4987 0.4988 0.4988 0.4989 0.4989 0.4989 0.4990 0.4990 3.1 0.4990 0.4991 0.4991 0.4991 0.4992 0.4992 0.4992 0.4992 0.4993 0.4993 3.2 0.4993 0.4993 0.4994 0.4994 0.4994 0.4994 0.4994 0.4995 0.4995 0.4995 3.3 0.4995 0.4995 0.4995 0.4996 0.4996 0.4996 0.4996 0.4996 0.4996 0.4997 3.4 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4998 3.5 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 3.6 0.4998 0.4998 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 3.7 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 3.8 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 3.9 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 61 Capı́tulo 4 Inferência 4.0.1 Conceitos Básicos Definição 19. População: conjunto de indivı́duos (ou objetos, elementos) que tem em comum pelo menos uma variável observável que pode ser representada por uma v.a. X . Definição 20. Amostra: é qualquer subconjunto da população. Definição 21. Parâmetro: é uma medida usada para descrever uma caracterı́stica da população. Definição 22 (Inferência Estatı́stica). É o uso de técnicas estatı́sticas para gerar afirmações sobre uma dada caracterı́stica da população a partir de uma amostra. Por exemplo, a média, a variância, o desvio padrão, a moda, etc. Em geral, nosso interesse é estimar o valor de um parâmetro ou estimar o valor de uma funçãode um parâmetro. Definição 23. Amostra Aleatória Simples (aas): Uma aas de tamanho n de uma v.a. X (po- pulação) é um conjunto de n v.a.’s X1, X2, · · · , Xn independentes e identicamente distribuı́das (iid). Isto é, quando escolhemos ao acaso um subconjunto de tamanho n da população de forma que cada elemento da amostra seja v.a. com a mesma distribuição da população. Quando a população tem tamanho finito, então o sorteio é feito com reposição mantendo chance igual de qualquer elemento ser sorteado. Definição 24. Estatı́stica: qualquer função da amostraX1, X2, · · · , Xn é dita ser uma estatı́stica, isto é, T é estatı́stica se T = g(X1, X2, · · · , Xn), para g sendo uma função qualquer. 62 Estatı́stica Básica Assim, T também é uma variável aleatória. As inferências estatı́sticas são baseadas em estatı́sticas. Exemplo 32. Exemplos de estatı́sticas: Seja X1, · · · , Xn uma aas de uma população X , podemos considerar as estatı́sticas X̄ = n∑ i=1 Xi n Média amostral σ̂2 = n∑ i=1 ( Xi − X̄ )2 n S2 = n∑ i=1 ( Xi − X̄ )2 n− 1 Variância amostral X(1) = min{X1, · · · , Xn} Mı́nimo X(n) = max{X1, · · · , Xn} Máximo Assim, T também é uma variável aleatória. As inferências estatı́sticas são baseadas em estatı́sticas. Definição 25. Estimador: uma estatı́stica T é dita ser estimador de um parâmetro θ se utilizamos T para estimar θ. Notação: T = θ̂ Exemplo 33. X̄ é estimador para média populacional µ; Exemplo 34. σ̂2 e S2 são estimadores para variância populacional σ2. Definição 26. Estimativa: valor observado de um estimador na amostra. Propriedades dos estimadores Algumas propriedades dos estimadores nos ajudam a escolher qual estimador utilizar para fazer a inferência. • Estimador não viciado: Um estimador T de θ é dito ser não viciado se E[T ] = θ. Exemplos: E[X̄] = µ e E(S2) = σ2, com S2 = 1 n−1 ∑n i=1(Xi − X̄)2 . • Se T1 e T2 são dois estimadores não viciados de θ, diz-se que T1 é mais eficiente do que T2 se V ar(T1) < V ar(T2). • Estimador consistente: Tn é um estimador consistente para θ se limn→∞E[Tn] = θ e limn→∞ V ar(Tn) = 0, com Tn sendo uma estatı́stica baseada na amostra de tamanho n. 63 Estatı́stica Básica 4.0.2 Distribuição Amostral A distribuição amostral de uma estatı́stica T é a distribuição de todos os possı́veis valo- res que ela pode assumir, calculados a partir de todas as possı́veis amostras de mesmo tamanho. Distribuição Amostral da Média Teorema 4. Seja X1, X2, · · · , Xn uma aas de tamanho n de uma população representada pela v.a. X com média µ e variância σ2. Então, E(X̄) = µ e V ar(X̄) = σ2 n . Importante: Se X ∼ N(µ, σ2), então X̄ ∼ N(µ, σ 2 n ). Teorema 5. Teorema Central do Limite Seja X1, X2, · · · , Xn uma aas de tamanho n de uma população X com média µ e variância σ2. Então, a distribuição de X̄ aproxima-se de uma distribuição Normal com média µ e variância σ2 n quando n tende ao infinito (n→∞). Assim, X̄ − µ σ/ √ n ≈ N(0, 1). Observação: Geralmente amostras de tamanho n > 30 fornecem uma aproximação razoável. Exemplo 35. A capacidade máxima de um elevador é de 600Kg. Se a distribuição dos pesos dos usuários é N(70, 100), qual é a probabilidade de que 8 pessoas ultrapassem esse limite? 4.1 Intervalos de Confiança Motivação Uma empresa deseja estimar a média de vendas, por estabelecimento, du- rante o último ano de um determinado produto. Sabemos que o desvio padrão populaci- onal é de 200 reais. Suponha que temos disponı́vel uma amostra de 25 estabelecimentos, com média de vendas de 5000 reais. • Podemos usar X̄ para estimar a verdadeira média desconhecida. • Podemos obter alguma informação sobre a variabilidade desta estimativa (erro de amostragem)? Queremos obter uma estimação intervalar fornecendo uma margem de erro, além da esti- mativa pontual que obtemos através dos estimadores dos parâmetros. 64 Estatı́stica Básica 4.1.1 Intervalo de confiança para a média de uma população normal com variância conhecida Seja X ∼ N(µ, σ2) com variância σ2 conhecida. Se X1, · · · , Xn é uma aas dessa população, então o intervalo de confiança de nı́vel de confiança (1 − α)% para a média populacional µ é dado por [ X̄ − zα/2 σ√ n ; X̄ + zα/2 σ√ n ] . Importante: • A margem de erro é dada por: � = zα/2 σ√n ; • α é o nı́vel de significância, que é um valor no intervalo (0, 1); • 1 − α é o nı́vel de confiança, que em geral é um valor alto (por exemplo, 0,90; 0,95; 0,99); • Mesmo quando a população não é Normal, podemos utilizar este intervalo para a média se n > 30. A ideia é que o intervalo contenha o verdadeiro valor do parâmetro na maioria das vezes (ou na maioria das amostras possı́veis), isto é, com probabilidade (1−α). Após a amostra ser observada, ou o intervalo inclui o verdadeiro valor do parâmetro ou não inclui. Para entendermos a notação zα/2, considere o nı́vel de confiança do intervalo 1−α = 0, 95, portanto α = 0, 05 e α/2 = 0, 025. Então, zα/2 = z0,025 é tal que P (Z ≥ z0,025) = 0, 025. A figura 1 apresenta esse exemplo. 65 Estatı́stica Básica Normal Padrão −4 −1.96 0 1.96 4 0. 0 0. 1 0. 2 0. 3 0. 4 95% 2,5% 2,5% Figura 4.1: Suponha α = 0, 05, portanto 1− α = 0, 95 e zα/2 = 1, 96. Exemplo 36. Uma empresa deseja estimar a média de vendas, por estabelecimento, durante o último ano de um determinado produto. Sabemos que o desvio padrão populacional é de 200 reais. Suponha que temos disponı́vel uma amostra de 25 estabelecimentos, com média de vendas de 5000 reais. Solução: • Estimativa pontual para média de vendas: X̄ = 5000; • Variância da média das vendas: 2002 25 = 1600reais2; • Supondo normalidade, para um nı́vel de confiança de 95%, temos que � = zα/2 σ√ n = 1, 96 200√ 25 = 78, 4; • Logo, o ic de 95% para a média de vendas é dado por: [5000− 78, 4; 5000 + 78, 4] = [4921, 6; 5078, 4] . Ideia básica da construção: Seja X1, · · · , Xn uma aas da distribuição Normal(µ, σ2), com σ2 conhecido. Podemos definir α tal que P (−zα/2 < Z < zα/2) = 1− α (intervalo simétrico é o de menor comprimento). 66 Estatı́stica Básica Sabemos que Z = √ n(X̄ − µ) σ ∼ Normal(0, 1), logo podemos escrever P ( −zα/2 < (X̄ − µ) √ n σ < zα/2 ) = 1− α⇔ P ( −zα/2 σ√ n < (X̄ − µ) < zα/2 σ√ n ) = 1− α⇔ P ( −zα/2 σ√ n − X̄ < −µ < zα/2 σ√ n − X̄ ) = 1− α⇔ P ( X̄ − zα/2 σ√ n < µ < X̄ + zα/2 σ√ n ) = 1− α. Portanto, supondo σ2 conhecido, o intervalo para µ com coeficiente de confiança 1− α é dado por [X̄ − �; X̄ + �], em que a margem de erro � = zα/2 σ√ n . Intervalo de confiança para a proporção populacional Considere uma população em que a proporção de elementos com certa caracterı́stica é p. Podemos definir uma v.a.: X = 1, se o elemento possui a caracterı́stica;0, se o elemento não possui a caracterı́stica. Logo, X ∼ Bernoulli(p), com média E[X] = p e variância V ar(X) = p(1− p). Suponha X1, · · · , Xn uma aas de X , logo Y = n∑ i=1 Xi ∼ Bin(n, p). Podemos estimar a proporção populacional de portadores da caraterı́stica, utilizando a estatı́stica p̂ = X̄ = n∑ i=1 Xi n , que é um estimador não viciado para p. Pelo TCL, temos que p̂ = X̄∼̇Normal ( p, p(1− p) n ) , em que a aproximação é boa se np ≥ 5 e n(1 − p) ≥ 5. Daı́, podemos proceder usando a mesma ideia do i.c. para média e obter o i.c. para proporção. O intervalo de confiança para proporção populacional p com (1−α)% de confiança é dado por IC (p; (1− α)) = [ p̂− zα/2 √ p̂(1− p̂)√ n ; p̂+ zα/2 √ p̂(1− p̂)√ n ] . 67 Estatı́stica Básica Exemplo 37. Um levantamento com 1018 adultos, concluiu que 255 deles planejaram gastar me- nos dinheiro em presentes durante a época de férias de 2018 em comparação ao ano anterior. a) Qual é a estimativa da proporção de todos os adultos que planejaram gastar menos dinheiro em presentes durante a época de férias
Compartilhar