Baixe o app para aproveitar ainda mais
Prévia do material em texto
127 ESTATÍSTICA Unidade IV 7 MODELOS TEÓRICOS DISCRETOS E CONTÍNUOS E INFERÊNCIA ESTATÍSTICA 7.1 Variável aleatória discreta unidimensional A seguir, vamos definir: • o que é uma variável discreta aleatória; • o que são funções de probabilidade; • o que é e como calcular o valor esperado e a variância de uma variável discreta aleatória. 7.1.1 Definição de variável discreta aleatória Segundo Morettin (2019, p. 46), “[…] variável aleatória é uma função que associa a todo evento pertencente a uma partição do espaço amostral um único número real”. Uma variável aleatória é dita discreta se assume apenas determinados valores, e não qualquer valor contido em um intervalo de valores (nesse caso, teríamos uma variável contínua). Um exemplo de quantidades discretas está nos resultados do lançamento de um dado, em que se pode obter apenas números inteiros de 1 a 6, e nunca números fracionários. 7.1.2 Função de probabilidade Morettin (2019, p. 46) define função de probabilidade como “[…] a função que associa cada valor assumido pela variável aleatória à probabilidade do evento correspondente”. O autor define ainda distribuição de probabilidade como o conjunto formado pelos valores das variáveis aleatórias e suas probabilidades correspondentes. A distribuição de probabilidades pode ser representada de forma gráfica, colocando‑se os valores da variável aleatória no eixo horizontal e as probabilidades correspondentes no eixo vertical. Como se trata de uma variável discreta, o gráfico é composto por pontos, e não se pode traçar uma curva sobre esses pontos. 128 Unidade IV Exemplo de aplicação Ao fazer o lançamento de um dado numérico de 6 faces, foram obtidos os resultados a seguir. Tabela 45 – Resultados dos lançamentos de um dado Face Número de ocorrências 1 2 2 4 3 9 4 8 5 3 6 1 Soma‑se todas as ocorrências para termos o total de lançamentos: 2 +4 + 9 + 8 + 3 + 1 = 27 Para calcular a probabilidade de obter cada face, divide‑se o número de ocorrências pelo total de lançamentos. Tabela 46 – Probabilidades de ocorrência dos lançamentos de um dado Face Probabilidade de ocorrência 1 2/27 = 0,074 2 4/27 = 0,15 3 9/27 = 0,33 4 8/27 = 0,30 5 3/27 = 0,11 6 1/27 = 0,037 Desse modo, ao construir o gráfico da distribuição de probabilidades do lançamento desse dado e colocar as faces no eixo horizontal e as probabilidades de ocorrência no eixo vertical, temos o que segue: 129 ESTATÍSTICA 0,30 0,20 0,10 1 2 3 4 5 6 face propabilidade de ocorrência Figura 35 – Distribuição de probabilidades para o lançamento do dado Note que há probabilidades apenas para valores inteiros da face do dado, pois trata‑se justamente de um problema discreto, e, por isso, não é possível traçar uma curva sobre os pontos. 7.1.3 Valor esperado de uma variável discreta aleatória O valor esperado de uma variável aleatória, também conhecido como esperança matemática, é igual ao valor médio dessa variável. O valor esperado de uma variável aleatória X é indicado por E(X). O valor esperado E(X) é calculado pela média ponderada dos valores assumidos pela variável, em que os pesos são as probabilidades: ( ) ( ) N i i i 1 E X x .p x = =∑ Note que, na expressão, usam‑se as probabilidades como peso. Então, não é preciso dividir a média pelo número de ocorrências, já que a soma de todas as probabilidades do evento deve ser igual a 1 (no caso, seria equivalente a dividir a equação por 1, o que não se faz necessário). Exemplo de aplicação Em um jogo de caça‑níqueis, verificou‑se que: • a probabilidade do jogador ganhar 10 reais era de 2%; 130 Unidade IV • a probabilidade do jogador ganhar 5 reais era 6%; • a probabilidade do jogador ganhar 50 reais era 0,1%. Qual é o prêmio médio nesse jogo? Figura 36 – Máquinas de caça‑níqueis Disponível em: https://cutt.ly/9Mc1JyV. Acesso em: 14 nov. 2022. Organizando os prêmios e as probabilidades em uma tabela, temos o que segue. Tabela 47 – Prêmios e probabilidades Prêmio (R$) Probabilidade (%) 50,00 0,1 10,00 2 5,00 6 0,00 Na tabela está relacionada também a probabilidade de o jogador não ganhar nenhum prêmio no jogo de caça níqueis, calculada como 100% menos a soma das probabilidades de ganhar um prêmio. 131 ESTATÍSTICA Dividindo as probabilidades por 100%, para que elas sejam dadas em valores unitários e não em porcentagens, temos o que segue: Tabela 48 – Prêmios e probabilidades Prêmio (R$) Probabilidade 50,00 0,001 10,00 0,02 5,00 0,06 0,00 0,919 Calculando o valor esperado (valor médio) nesse jogo, temos: E 50.0,001 1 0.0,02 5.0,06 0.0,919= + + + E 0,05 0,2 0,30= + + E 0,55= Logo, o prêmio médio desse jogo de azar é R$ 0,55 (ou 55 centavos). 7.1.4 Variância de uma variável discreta aleatória A variância de uma variável aleatória e discreta X, representada por VAR(X), é calculada por: ( ) ( ) ( ) N 2 i x i i 1 VAR X x .p x = = −µ∑ Na equação: • xi representa cada valor da variável aleatória; • µx representa o valor verdadeiro (ou valor médio) da grandeza; • p(xi) representa a probabilidade de ocorrência de cada valor da variável aleatória xi. A variância ainda pode ser indicada por V(X), σ2(X), σX 2 ou σ2. A variância é um indicador de dispersão, fornecendo, portanto, uma medida do espalhamento dos dados. 132 Unidade IV Exemplo de aplicação No exemplo anterior, calculou‑se o prêmio médio em um jogo de caça níqueis, obtendo E = 0,55, que será considerado como igual ao valor verdadeiro (valor médio da distribuição) do prêmio pago. Pode‑se calcular a variância associada à premiação paga nesse jogo de azar. A variância é calculada de forma mais fácil usando uma tabela. Os resultados e as probabilidades foram dados na tabela a seguir. Tabela 49 – Cálculo da variância para as premiações do jogo de caça‑níqueis (parte 1) xi p(xi) xi‑E (xi‑E) 2 (xi‑E) 2.p(xi) 50,00 0,001 10,00 0,02 5,00 0,06 0,00 0,919 Calculando os valores da terceira coluna, subtraindo E = 0,55 de cada valor xi, temos: Tabela 50 – Cálculo da variância para as premiações do jogo de caça‑níqueis (parte 2) xi p(xi) xi‑E (xi‑E) 2 (xi‑E) 2.p(xi) 50,00 0,001 49,45 10,00 0,02 9,45 5,00 0,06 4,45 0,00 0,919 ‑0,55 Calculando os valores da quarta coluna, elevando os valores da terceira coluna ao quadrado, temos: Tabela 51 – Cálculo da variância para as premiações do jogo de caça‑níqueis (parte 3) xi p(xi) xi‑E (xi‑E) 2 (xi‑E) 2.p(xi) 50,00 0,001 49,45 2445,3 10,00 0,02 9,45 89,3 5,00 0,06 4,45 19,8 0,00 0,919 ‑0,55 0,30 133 ESTATÍSTICA Multiplicando cada um dos resultados da quarta coluna pelas probabilidades associadas (dadas na segunda coluna), preenche‑se a última coluna da tabela: Tabela 52 – Cálculo da variância para as premiações do jogo de caça‑níqueis (parte 4) xi p(xi) xi‑E (xi‑E) 2 (xi‑E) 2.p(xi) 50,00 0,001 49,45 2445,3 2,44 10,00 0,02 9,45 89,3 1,79 5,00 0,06 4,45 19,8 1,19 0,00 0,919 ‑0,55 0,30 0,28 A variância é dada pela soma dos valores da última coluna da tabela, pois: ( ) ( ) ( ) N 2 i x i i 1 VAR X x .p x = = −µ∑ Fazendo esse cálculo, temos: VAR 2,44 1,79 1,19 0,28 5,7= + + + = Logo, a variância associada aos prêmios pagos pelo jogo de caça níqueis é 5,7. 7.2 Modelos teóricos discretos e contínuos de probabilidade 7.2.1 Distribuição binomial A distribuição binomial é uma distribuição discreta de probabilidades que se aplica sempre que o processo de amostragem tem as seguintes características: • em cada tentativa, há apenas dois resultados possíveis, chamados de sucesso e fracasso, que são mutuamente exclusivos; • os eventos de uma série de tentativas são independentes; • o processo é estacionário, ou seja, a probabilidade de sucesso não varia entre uma tentativa e outra. Os processos de amostragem com essas características são conhecidos como processos de Bernoulli. 134 Unidade IV Saiba mais Para saber mais sobre processos de Bernoulli, acesse: PROCESSO Bernoulli. Stringfixer, [s.d.]. Disponível em: https://cutt.ly/tMDwrJo. Acessoem: 14 nov. 2022. Chamando de p a probabilidade de sucesso em uma única tentativa, a probabilidade de fracasso nessa mesma tentativa é dada por: q 1 p= − Ou seja, existem dois resultados possíveis e mutuamente exclusivos. O número 1 na expressão anterior indica a probabilidade de ocorrência de 100%. A probabilidade P(X) de termos X sucessos em N tentativas é dada pela seguinte expressão: ( ) X N XN,XP X C .p .q −= Escrevendo explicitamente o binômio CN,X, temos: ( ) ( ) X N XN!P X .p .q X!. N X ! −= − Lembrete Vimos que o fatorial de um número inteiro n é calculado por: ( ) ( ) ( )n! n. n 1 . n 2 . n 3 3.2.1= − − − … Vimos também que o número de combinações de n elementos em grupos de p elementos é dado pela seguinte expressão: ( )n,p n! C p!. n p ! = − Na equação, n e p são números inteiros. Lemos Cn,p como a combinação de n elementos tomados p a p. 135 ESTATÍSTICA Exemplo de aplicação Um dado de 6 faces, numeradas de 1 a 6, foi lançado 4 vezes. Qual é a probabilidade de se obter 2 vezes o número 3 no lançamento do dado? Figura 37 – Dados de 6 faces Disponível em: https://cutt.ly/aMc2i8I. Acesso em: 14 nov. 2022. Para responder a essa pergunta, deve‑se usar a distribuição binomial de probabilidades – já que temos apenas duas possibilidades mutuamente excludentes: obter ou não obter o número 3. Ao lançar um dado, há 6 possibilidades de resultado distintas. Logo, a probabilidade de se obter o número 3 lançando um dado de 6 faces é: 1 p 6 = Então, a probabilidade de se obter qualquer número, exceto o número 3, é dada por: q 1 p= − 1 q 1 6 = − 6 1 q 6 6 = − 5 q 6 = 136 Unidade IV Da expressão da distribuição binomial, para obtermos 2 vezes o resultado desejado (a face 3) em 4 tentativas, ou seja, com X = 2 e N = 4, pode‑se fazer o seguinte: ( ) X N XN,XP X C .p .q −= ( ) 2 4 24,2P 2 C .p .q −= ( ) 2 24,2P 2 C .p .q= Escrevendo a combinação de 4 dois a dois em termos de fatoriais, temos: ( ) ( ) 2 4 24!P 2 .p .q 2!. 4 2 ! −= − ( ) ( ) 2 24!P 2 .p .q 2!. 4 2 ! = − ( ) 2 24!P 2 .p .q 2!.2! = É possível escrever 4! como 4.3.2!, de forma que: ( ) 2 24.3.2!P 2 .p .q 2!.2! = ( ) 2 24.3P 2 .p .q 2! = ( ) 2 24.3P 2 .p .q 2.1 = ( ) 2 212P 2 .p .q 2 = ( ) 2 2P 2 6.p .q= Substituindo as probabilidades de sucesso (dado com a face 3 para cima) e insucesso (dado com outra face que não a 3 para cima), tem‑se: 137 ESTATÍSTICA ( ) 2 21 5 P 2 6. . 6 6 = ( ) 1 25P 2 6. . 36 36 = E chega‑se a: ( )P 2 0,116= Multiplicando esse valor por 100% para se obter a probabilidade em porcentagem, ficamos com: ( )P 2 0,116.100%= ( )P 2 11,6%= Logo, a probabilidade de obtermos 2 vezes a face 3 em 4 lançamentos de um dado de 6 faces é 11,6%. Exemplo de aplicação Verificou‑se que a probabilidade de chover no fim da tarde em um dia de janeiro é de 75%. Sabendo que janeiro tem 31 dias, qual é a probabilidade de ocorrerem apenas 10 dias de chuva no fim da tarde no mês? Figura 38 – Fim de tarde chuvoso Disponível em: https://cutt.ly/iMc2xHv. Acesso em: 14 nov. 2022. 138 Unidade IV Do enunciado, temos N = 31, X = 10 e p = 0,75. A probabilidade de não ter chuva no fim da tarde em janeiro é: q 1 p= − q 1 0,75= − q 0,25= Como são apenas duas possibilidades mutuamente excludentes, chover ou não chover, pode‑se usar a distribuição binomial de probabilidades para calcular a probabilidade desejada. Para uma distribuição binomial, temos: ( ) X N XN,XP X C .p .q −= Especificamente para esse problema, temos: ( ) 10 31 1031,10P 10 C .0,75 .0,25 −= Escrevendo a combinação em termos de fatoriais, temos: ( ) ( ) 10 31 1031!P 10 .0,75 .0,25 10!. 31 10 ! −= − ( ) 10 2131!P 10 .0,75 .0,25 10!.21! = ( ) 10 2131.30.29.28.27.26.25.24.23.22.21!P 10 .0,75 .0,25 10.9.8.7.6.5.4.3.2.1.21! = ( ) 10 2131.30.29.28.27.26.25.24.23.22P 10 .0,75 .0,25 10.9.8.7.6.5.4.3.2.1 = 139 ESTATÍSTICA Usando uma calculadora para fazer a multiplicação do numerador e do denominador da fração, temos: ( ) 14 10 211,60945.10P 10 .0,75 .0,25 3628800 = ( ) 10 21P 10 30045015.0,75 .0,25= ( ) 13P 10 44352127 . 0,0563 . 2,27.10−= ( ) 7P 10 5,67.10−= Multiplicando esse resultado por 100% para termos a probabilidade em porcentagem, temos: ( ) 7P 10 5,67.10 .100%−= ( )P 10 0,0000567%= Logo, a probabilidade de chover no final da tarde em apenas 10 dias de janeiro é 0,0000567% – ou seja, uma probabilidade muito pequena. 7.2.2 Distribuição normal A distribuição normal de probabilidades é uma distribuição de probabilidades contínua, simétrica em relação à média, e cuja curva tem o formato de uma gaussiana. Essa curva que dá a distribuição de probabilidades é chamada de função densidade de probabilidade (fdp). A probabilidade de ocorrência de um evento está relacionada com a área sob a curva da função densidade de probabilidade. Em uma distribuição normal de probabilidades, temos o seguinte: x x x−σ < < + σ→ p = 68% x 2. x x 2.− σ < < + σ→ p = 95% x 23 x x 3.− σ < < + σ→ p = 99,7% 140 Unidade IV Isso pode ser visto na figura a seguir: 68% 95% 99,7% x x x x x x� � � � �3 2 2� � � � �������� ������� ������� ������� ������� ��������x � 3� Figura 39 ‑ Distribuição normal e probabilidades Fonte: Souza et al. (2020, p. 153). Então, a probabilidade de um valor estar no intervalo entre uma vez o desvio padrão, tanto para o lado negativo como para o lado positivo, é de 68% para uma distribuição normal. A probabilidade de um valor estar no intervalo dentro de 2 vezes o desvio padrão, tanto para o lado negativo como para o positivo, é de 95%. Já a probabilidade de um valor estar no intervalo limitado por 3 vezes o desvio padrão, tanto para o lado negativo como para o positivo, é de 99,7%. Outra implicação disso é que a probabilidade de um valor estar além de 3 vezes o desvio padrão é cerca de 0,3%. Saiba mais A curva gaussiana tem esse nome em homenagem ao matemático, astrônomo e físico J. Gauss. Para saber mais sobre Gauss, leia: AMARAL, D. A. Gauss, Carl Friedrich (1777‑1855). Faculdade de Engenharia Mecânica da Unicamp, Campinas, 31 jan. 2001. Disponível em: https://cutt.ly/MMDrmFx. Acesso em: 14 nov. 2022. 141 ESTATÍSTICA A função densidade de probabilidade de uma distribuição normal de média x e desvio padrão σ é dada por: ( ) 21 x x . 21f x .e . 2. − − σ = σ π Observação O número e na expressão da distribuição normal é conhecido como número de Euler ou número neperiano. Trata‑se de um número irracional (com infinitas casas decimais) e aproximadamente igual a 2,71. A exponencial de base e, como na equação anterior, é frequente em física e matemática, e é facilmente calculada por uma calculadora científica. Saiba mais Para saber mais sobre a distribuição normal, leia o capítulo 3.1, “Distribuição normal”, na obra de Juliana Sena de Souza e colegas em: SOUZA, J. S. et al. Distribuição normal. In: SOUZA, J. S. et al. Probabilidade e estatística (EAD). Porto Alegre: UFRGS, 2020. Disponível em: https://cutt.ly/MMc3qSk. Acesso em: 14 nov. 2022. p. 139‑153. Pode‑se converter qualquer distribuição normal de probabilidades em uma distribuição normal padronizada. Para isso, convertem‑se os valores x da distribuição em valores padronizados z. Usamos a seguinte expressão: x x z − = σ A conversão para uma distribuição normal padronizada faz com que seja possível usar uma tabela para obter as probabilidades, sem realizar cálculos que demandem a equação da função densidade de probabilidade que vimos anteriormente. Essa tabela é mostrada a seguir. 142 Unidade IV Tabela 53 – Áreas sob uma distribuição normal padrão, em relação ao valor médio z 0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359 0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753 0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141 0,3 0,1179 0,1217 0,1255 0,1293 0,13310,1368 0,1406 0,1443 0,1480 0,1517 0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879 0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224 0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549 0,7 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852 0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133 0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389 1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621 1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830 1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015 1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177 1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319 1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441 1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545 1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633 1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706 1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767 2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817 2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857 2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890 2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916 2,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936 2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952 2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964 2,7 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974 2,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981 2,9 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986 3,0 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990 143 ESTATÍSTICA Para usar essa tabela, parte‑se do valor de z à procura da combinação entre linha e coluna até obter‑se esse valor. Por exemplo, a área sob a gaussiana para z = 1,42 é obtida por 1,4 + 0,02, e essa área está no cruzamento da linha 1,4 com a coluna 0,02, o que dá área de 0,4222 (ver tabela a seguir). Tabela 54 – Áreas sob uma distribuição normal padrão, em relação ao valor médio para z = 1,42 z 0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359 0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753 0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141 0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517 0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879 0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224 0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549 0,7 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852 0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133 0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389 1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621 1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830 1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015 1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177 1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319 1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441 1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545 1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633 1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706 1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767 2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817 2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857 2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890 2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916 2,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936 2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952 2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964 2,7 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974 2,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981 2,9 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986 3,0 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990 Lembre‑se de que essas tabelas fornecem a área entre o meio da curva e o z que procuramos. Se quisermos a área entre dois lados da curva simétricos, devemos dobrar o valor obtido na tabela. 144 Unidade IV A tabela também pode ser usada no sentido inverso, consultando um valor de probabilidade e, a partir da posição desse valor, é obtido o valor de z pela soma da linha e da coluna da probabilidade desejada. No exemplo a seguir é demonstrado como trabalhar com a tabela da distribuição normal padronizada. Exemplo de aplicação Considere que a vida útil das lâmpadas produzidas em dada fábrica siga uma distribuição normal com média x = 5000 horas e com desvio padrão σ = 100 horas. Qual é a probabilidade de que uma lâmpada produzida por essa fábrica dure entre 5100 e 5200 horas? Primeiro, calcula‑se o coeficiente z para os limites do intervalo de durabilidade da lâmpada. Para o limite inferior do intervalo, de 5100 horas, temos: x x z − = σ 5100 5000 z 100 − = 100 z 100 z 1= Para o limite superior do intervalo, de 5200 horas, temos: x x z − = σ 5200 5000 z 100 − = 200 z 100 = z 2= 145 ESTATÍSTICA Na segunda coluna da tabela 55, localizamos as probabilidades correspondentes a z = 1 e a z = 2. Tabela 55 – Áreas sob uma distribuição normal padrão, em relação ao valor médio para z entre 1 e 2 z 0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359 0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753 0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141 0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517 0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879 0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224 0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549 0,7 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852 0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133 0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389 1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621 1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830 1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015 1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177 1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319 1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441 1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545 1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633 1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706 1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767 2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817 2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857 2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890 2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,49162,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936 2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952 2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964 2,7 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974 2,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981 2,9 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986 3,0 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990 146 Unidade IV ( )p z 1 0,3413= = ( )p z 2 0,4772= = Lembrando que essas probabilidades são de o valor estar entre o valor z = 0 e z dado, e a questão é calcular a probabilidade de o valor estar entre z = 2 e z = 1. ( ) ( ) ( )p z 1 a 2 p z 2 p z 1= = = − = ( )p z 1 a 2 0,4772 0,3413= = − ( )p z 1 a 2 0,1359= = Multiplicando esse valor por 100% para se obter a probabilidade em porcentagem, ficamos com: ( )p z 1 a 2 0,1359 .1 00%= = ( )p z 1 a 2 1 3,6%= = Logo, a probabilidade de ter uma lâmpada com durabilidade de 5100 a 5200 horas é de 13,6%. 7.3 Inferência estatística Inferência estatística é o processo estatístico que tem como objetivo fazer generalizações de uma população a partir de uma amostra. A inferência estatística envolve amostragem, estimadores e intervalos de confiança, conceitos que serão detalhados a seguir. 7.3.1 Amostragem A seleção de uma amostra de uma população chama‑se levantamento amostral. Esse levantamento amostral pode ser de dois tipos: probabilístico ou não probabilístico. Os levantamentos amostrais probabilísticos podem ser classificados em: • amostragem aleatória simples; 147 ESTATÍSTICA • amostragem aleatória sistemática; • amostragem aleatória estratificada; • amostragem aleatória por conglomerados. Na amostragem aleatória simples, todos os elementos de uma população têm igual probabilidade de serem selecionados para a amostra. Nesse processo de seleção, é comum sortear aleatoriamente os elementos participantes. Esse é o método mais simples de compor uma amostra. Na amostragem aleatória sistemática, os elementos da população são selecionados de acordo com critérios preestabelecidos, como seleção pela inicial do nome, por exemplo. Esse processo de amostragem é bastante usado para compor amostras em pesquisas de opinião. Na amostragem aleatória estratificada, a população é dividida em grupos homogêneos, chamados de estratos, e, em seguida, é feita uma amostragem aleatória simples dentro de cada estrato. Os estratos podem ser faixas salariais em uma empresa ou faixas etárias de uma população, por exemplo. Na amostragem aleatória por conglomerados, a população é dividida por áreas geográficas e então é feita uma amostragem simples em uma pequena área geográfica. Os levantamentos amostrais não probabilísticos podem ser classificados em: • amostragem não aleatória intencional; • amostragem não aleatória voluntária; • amostragem não aleatória acidental. Na amostragem não aleatória intencional, o pesquisador escolhe uma característica da população para compor sua amostra, por exemplo, selecionando pessoas pelo seu time de futebol. Na amostragem não aleatória voluntária, as pessoas tomam a iniciativa de fazer parte da amostra, oferecendo‑se para participar da pesquisa. Por sua vez, na amostragem não aleatória acidental, os elementos que compõem a amostra são escolhidos sem nenhum critério estabelecido, como selecionar todas as pessoas que passam por determinada rua. 148 Unidade IV 7.3.2 Estimadores Define‑se estimador como uma grandeza obtida a partir de observações de uma amostra. O estimador é considerado um indicador de um parâmetro desconhecido da população. Chamamos de estimativa o valor atribuído a um estimador. A estimativa de um parâmetro pode ser feita de duas formas: • estimativa por ponto; • estimativa por intervalo. A estimativa por ponto é o nome dado ao valor obtido a partir de cálculos estatísticos com os elementos da amostra, servindo como uma aproximação do parâmetro estimado. Um exemplo de estimativa por ponto é o valor médio de uma amostra, calculado a partir dos elementos dessa amostra, e assumido como uma aproximação do valor médio da população a partir da qual a amostra foi selecionada. A estimativa por intervalo não é feita por um único valor, mas por uma faixa de valores que são considerados uma aproximação do parâmetro estimado. As estimativas por intervalo são chamadas de intervalo de confiança. Em geral, calculam‑se intervalos de confiança que tenham uma chance de 95% de conter o valor verdadeiro. 7.3.3 Intervalos de confiança O nível de confiança é o valor que exprime o grau de confiança associado a dado intervalo de confiança. Chama‑se de x o valor médio, de s o desvio padrão da amostra, de µ o valor médio e de σ o desvio padrão da população a partir da qual a amostra foi obtida. No caso de uma distribuição simétrica, o valor médio da amostra está no meio do intervalo de confiança. Então, definindo o erro amostral c e considerando a probabilidade de 95% do valor médio da população estar contido nesse intervalo de confiança, temos: P(x c x c) 95%− <µ< + = No caso de uma população infinita, o erro amostral c é determinado por: c z. n σ = 149 ESTATÍSTICA Na equação: • σ é o desvio padrão da população, que pode ser aproximado pelo desvio padrão da amostra caso esse primeiro seja desconhecido; • n é o tamanho da amostra; • z é a abcissa da distribuição normal padronizada para dado nível de confiança. Se a população for finita e de tamanho N, o erro amostral c é determinado por: 2 2z . N c . 1 N 1 n σ = − − Na equação: • σ é o desvio padrão da população, que pode ser aproximado pelo desvio padrão da amostra caso esse primeiro seja desconhecido; • n é o tamanho da amostra; • z é a abcissa da distribuição normal padronizada para um dado nível de confiança. No caso de um nível de confiança de 95%, o mais usual, z é obtido da forma descrita a seguir: Como a tabela 53 dá a área sob a curva da distribuição gaussiana a partir do eixo de simetria, é preciso dividir a probabilidade de 95% por 2: 95% 0,95 0,4750 2 2 = = Procurando por esse valor na tabela de áreas sob a gaussiana, vemos que ele é localizado no cruzamento das probabilidades 0,06 na horizontal e 1,9 na vertical (ver tabela a seguir), o que resulta em: z 1 ,9 0,06 1 ,96= + = 150 Unidade IV Tabela 56 – Áreas sob uma distribuição normal padrão, em relação ao valor médio para z = 1,96 z 0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359 0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753 0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141 0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517 0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879 0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224 0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549 0,7 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852 0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133 0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389 1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621 1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830 1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015 1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177 1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319 1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441 1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545 1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633 1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706 1,9 0,4713 0,47190,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767 2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817 2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857 2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890 2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916 2,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936 2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952 2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964 2,7 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974 2,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981 2,9 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986 3,0 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990 Essas ideias ficarão mais claras ao ler o texto a seguir, escrito em 2018. 151 ESTATÍSTICA Destaque O que significam os números de uma pesquisa eleitoral? Christiane Mazur Doi Nos últimos meses, com as pesquisas feitas em função do período eleitoral em nosso país, temos visto e ouvido os termos “margem de erro”, “grau de confiança”, “tamanho da amostra” e muitos outros. Qual é o sentido dessas expressões? E o que significam os números relacionados a elas? Para responder a essas questões, podemos analisar uma situação específica, como a exposta a seguir. Segundo pesquisa divulgada pelo Instituto Datafolha em 10 de outubro de 2018 sobre o segundo turno da eleição presidencial no Brasil, o candidato Jair Bolsonaro tinha 58% dos votos válidos e o candidato Fernando Haddad tinha 42% dos votos válidos. O Datafolha também informou que: • o levantamento de dados foi realizado em 10 de outubro de 2018; • foram entrevistados 3.235 eleitores em 227 municípios; • 6% dos entrevistados não sabiam em quem votar; • 8% dos entrevistados votavam em branco ou anulavam o voto; • a margem de erro foi de 2 pontos percentuais para cima ou para baixo; • o nível de confiança da pesquisa foi de 95%. Vamos analisar essa pesquisa. Os resultados de votos válidos “valeram” para o dia em que a pesquisa foi feita e não são uma previsão do que vai realmente acontecer nas urnas. Vemos, inclusive, que os 6% de indecisos podem votar tanto em um candidato quanto no outro, ou podem anular seus votos. A margem de erro de 2% de erro indica que, no momento da realização da entrevista, Bolsonaro poderia ter entre 56% (58% menos 2%) e 60% (58% mais 2%) e Haddad poderia ter entre 40% (42% menos 2%) e 44% (42% mais 2%). 152 Unidade IV No entanto, como o nível de confiança da pesquisa foi de 95%, a chance, na ocasião, de um candidato ter entre 56% e 60% e do outro ter entre 40% e 44% foi de 95%. Ou seja, mesmo com a margem de erro, não há 100% de certeza da verdadeira intenção dos eleitores em 10 de outubro de 2018, mas há elevada probabilidade de os resultados da pesquisa coincidirem com essa intenção. Há ainda que se considerar que o Brasil tem cerca de 5.570 munícipios e que, segundo Tribunal Superior Eleitoral (TSE), no primeiro turno das eleições, ocorrido em 7 de outubro de 2018, houve o comparecimento de 117.364.560 eleitores, com 107.050.673 de votos válidos. O leitor pode pensar: uma pesquisa feita com 3.235 eleitores em 227 municípios pode ser válida para estimar o que pensam mais de 100 milhões de eleitores em mais de 5.500 municípios? A resposta é sim. Vejamos um exemplo que trata de um caso bem mais simples do que o caso que estamos analisando, mas útil para entendermos o problema. Imagine que você compre uma garrafa com 750 mL de um vinho de altíssimo padrão. Você precisa tomar todo esse volume para atestar que o vinho é de excelência? Não. A ingestão de um cálice com 30 mL de vinho, ou até menos, é suficiente, pois esse volume é uma amostra que representa todo o conteúdo da garrafa. De modo geral, quase sempre “o todo” (população) que queremos estudar é inacessível, pois é muito grande, como no caso de mais de 100 milhões de eleitores em mais de 5.500 municípios, ou é desconhecido. Assim, a ideia é coletar uma amostra para se fazer uma inferência sobre a população que queremos estudar. Na pesquisa eleitoral que usamos como exemplo, a população é o eleitorado brasileiro com 16 anos ou mais. Uma amostra representativa dessa população deve ser formada por um conjunto de pessoas com as mesmas características de idade, gênero e distribuição regional da população, traduzindo fielmente o conjunto de todo o eleitorado. Ou seja, toda a diversidade da população deve “aparecer” na amostra na mesma proporção em que ocorre na população. Concluímos que uma amostra de eleitores não deve ser necessariamente grande para representar o conjunto “completo” de eleitores: o importante é que o método de amostragem garanta a representatividade da amostra. Se esse método não for eficiente, uma amostra “muito grande”, com elevada quantidade de entrevistados pode não ser “boa”. No caso de pesquisas eleitorais como as do Datafolha, trabalha‑se com amostra estratificada. Incialmente, os 5.570 municípios brasileiros são classificados em três estratos: capital, região metropolitana e interior. Para cada estrato, são feitas, com base em critérios estatísticos robustos, que incluem a proporcionalidade, a seleção aleatória do município que fará parte da amostra, a seleção aleatória dos pontos de abordagem do município e a seleção aleatória do entrevistado com base na distribuição de gênero e de faixa etária do eleitorado brasileiro. 153 ESTATÍSTICA Enfim, números relacionados à “margem de erro”, ao “grau de confiança” e ao “tamanho da amostra” em pesquisas eleitorais não são simplesmente valores que fazem uma previsão de reais resultados: eles refletem a realidade da data da pesquisa e estão vinculados a probabilidades. São inferências. Exemplo de aplicação Em uma cotação de preços para a compra de um equipamento de informática, foram levantados 10 orçamentos, e o preço médio foi de R$ 1.250,00 com desvio padrão igual a R$ 85,00. Determine o intervalo de confiança para o preço desse equipamento, considerando um nível de confiança de 95%. Vimos que um intervalo de confiança de 95% implica z = 1,96. No problema, temos ainda x = 1250. Considerando o desvio padrão amostral igual ao desvio padrão populacional, temos σ= 85. Calculando o erro amostral c para população infinita – considerando infinito o número de equipamentos existentes à venda, ou seja, uma quantidade muito grande –, temos o seguinte: c z. n σ = 85 c 1,96. 10 = 85 c 1,96. 3,162 = c=1,96.26,88 c 52,68= Escrevendo o intervalo de confiança, considerado o erro amostral c calculado, temos: P(x c x c) 95%− <µ< + = P(1250 52,68 1 250 52,68) 95%− <µ< − = P(1197,32 1 302,68) 95%<µ< = Logo, há a probabilidade de 95% de que o valor verdadeiro (valor médio de mercado, ou seja, para a população) do equipamento esteja entre R$1.197,32 e R$1.302,68. 154 Unidade IV 8 REGRESSÃO LINEAR SIMPLES Na regressão linear, é ajustada uma reta aos dados. Antes de discutir a regressão em si, é importante tratar a respeito de funções lineares, ou funções do primeiro grau, cujos gráficos são retas. A função do primeiro grau tem equação do tipo: y a.x b= + Na equação: • x é a variável independente; • y é a variável dependente; • a é coeficiente angular; • b é o coeficiente linear. É dito que essa função é uma função do primeiro grau porque a variável independente x está elevada à primeira potência. Gráficos de funções do primeiro grau são retas. Observação As letras usadas para representar a equação podem variar conforme o autor do material, mas o coeficiente linear é sempre o que “aparece” somando ou subtraindo. Nesse caso, o sinal faz parte do coeficiente. O coeficiente angular é sempre o que multiplica a variável. Em uma equação y = m . x + p, m é o coeficiente angular e p é o coeficiente linear. Exemplo de aplicação Considerea função y 4x 2= + . Sabendo que o coeficiente linear é o termo que apenas soma ou subtrai, conclui‑se que o coeficiente linear dessa equação é 2. Sabendo que o coeficiente angular é o que multiplica a variável independente x, conclui‑se que o coeficiente angular, no caso, é igual a 4. O coeficiente linear dá informação sobre o cruzamento da reta do gráfico da função com o eixo y. 155 ESTATÍSTICA O coeficiente angular dá informação sobre a inclinação da reta. Quanto maior o coeficiente angular, mais inclinada será a reta. O coeficiente angular ainda nos diz se a reta é crescente (a > 0) ou decrescente (a < 0). 2 1 ‑1 ‑2 ‑1,0 1,0 x y ‑0,5 0,5 Figura 40 – Gráfico da função y = 2x, como exemplo de reta crescente 2 1 ‑1 ‑2 ‑1,0 1,0 x y ‑0,5 0,5 Figura 41 – Gráfico da função y = –2x, como exemplo de reta decrescente Exemplo de aplicação Considere a equação y 5.x 1= − + . O que é possível dizer sobre o gráfico dessa equação? Primeiramente, vê‑se que a variável x está elevada à potência 1. Logo, estamos tratando de uma função do primeiro grau, e seu gráfico é uma reta. O termo independente da equação é igual a 1 e é o coeficiente linear dessa reta. Logo, a reta cruza o eixo y em y 1= . A variável é multiplicada por –5, ou seja, o coeficiente angular é, no caso, igual a –5. Como o coeficiente angular é negativo (a < 0), a função tem como gráfico uma reta decrescente. Na figura a seguir, é apresentado o gráfico da função y 5x 1= − + . 156 Unidade IV 2,5 2,0 1,5 1,0 0,5 ‑0,5 x y 0,30,20,1‑0,1‑0,2‑0,3 Figura 42 – Gráfico da função y = –5x + 1 Note que o gráfico da figura 42 é uma reta decrescente e que cruza o eixo y em y = 1. 8.1 Relação entre duas variáveis Quando estudamos um processo, frequentemente desejamos saber se duas quantidades estão correlacionadas. Será que o número de usuários de uma rede está relacionado com o tempo de resposta nessa rede? Se essas quantidades estão relacionadas, como se dá essa relação? Quanto mais usuários, o tempo de resposta é maior ou menor? Qual será o tempo de resposta na rede quando houver 50 usuários conectados? São perguntas desse tipo que desejamos responder quando estudamos correlação de variáveis. Um exemplo clássico de relação incomum é a venda de fraldas descartáveis e a venda de cervejas em supermercados. Figura 43 – Fralda descartável Disponível em: https://cutt.ly/DMc5qiB. Acesso em: 14 nov. 2022. 157 ESTATÍSTICA Saiba mais GUROVITZ, H. O que cerveja tem a ver com fraldas? exame., São Paulo, 18 fev. 2011. Disponível em: https://cutt.ly/gMDBz9F. Acesso em: 14 nov. 2022. MONTEIRO, F. Cervejas e fraldas, e essa estranha (cor)relação. Medium, San Francisco, 16 ago. 2020. Disponível em: https://cutt.ly/uMDBYBp. Acesso em: 14 nov. 2022. A forma mais simples de verificar se há correlação entre duas grandezas é fazer um gráfico do tipo dispersão (scatter plot) com uma das variáveis no eixo vertical e a outra variável no eixo horizontal. Ao analisar o agrupamento dos pontos, é possível dizer se as variáveis são relacionadas e de que forma isso se dá. Saiba mais Para saber como construir gráficos do tipo dispersão no Excel, acesse: APRESENTAR seus dados em um gráfico de dispersão ou em um gráfico de linha. Microsoft, Redmond, [s.d.]. Disponível em: https://cutt.ly/RMDNkPu. Acesso em: 14 nov. 2022. Para saber como construir gráficos do tipo dispersão em R, assista: DIAGRAMA de dispersão no R – Como criar do Zero. 2020. 1 vídeo (7:55). Publicado por Mercel Santos. Disponível em: https://cutt.ly/FMDMs4n. Acesso em: 14 nov. 2022. Para saber como construir um gráfico do tipo dispersão usando Python, acesse: ROCHA, D. Gráfico de dispersão feito no Python Jupyter Notebook. RStudio, 10 nov. 2018. Disponível em: https://cutt.ly/iMDMDut. Acesso em: 14 nov. 2022. 158 Unidade IV O gráfico a seguir é um exemplo de gráfico de dispersão, feito com o objetivo de verificar se há relação entre a expectativa de vida e o PIB per capita para diferentes países. Expectativa de vida (anos) PIB per capita (US$) 0 20000 40000 60000 80000 100000 120000 140000 80 60 Figura 44 – Expectativa de vida em função do PIB per capita como exemplo de gráfico do tipo espalhamento para verificar se há correlação entre essas duas quantidades 8.2 Correlação linear Ao analisar o gráfico de espalhamento para verificar se há correlação entre duas grandezas e se os pontos nesse gráfico se espalham ao longo de uma reta, define‑se se os dados apresentam correlação linear ou se são linearmente correlacionados. Os dados podem ter: • correlação linear positiva; • correlação linear negativa; • correlação não linear; • nenhuma correlação. 159 ESTATÍSTICA Exemplos de gráficos com dados com essas diferentes formas de correlação são apresentados a seguir: x 3 2,5 2 1,5 1 0,5 0 y 0 0,2 0,4 0,6 0,8 1,21 Figura 45 – Dados com correlação linear positiva Note que na figura 45 os pontos do gráfico apresentam comportamento linear e crescente, mesmo com espalhamento ao redor da reta. Conforme os valores de x aumentam, percebe‑se a tendência de aumento dos valores de y. 1 0,5 0 ‑0,5 ‑1 ‑1,5 ‑2 ‑2,5 ‑3 x y 0 0,2 0,4 0,6 0,8 1,21 Figura 46 – Dados com correlação linear negativa Note que na figura 46 os pontos do gráfico apresentam comportamento linear e decrescente, mesmo com espalhamento ao redor dessa reta. Conforme os valores de x aumentam, percebe‑se a tendência de diminuição dos valores de y. 160 Unidade IV x 0,35 0,3 0,25 0,2 0,15 0,1 0,05 0 y 0 0,2 0,4 0,6 0,8 1,21 Figura 47 – Dados com correlação não linear Note que na figura 47 os pontos do gráfico não passam aproximadamente sobre uma reta, mesmo considerando o espalhamento dos dados. Nela, os dados parecem seguir uma parábola. 1,2 1 0,8 0,6 0,4 0,2 0 y x 0,80 0,20,1 0,40,3 0,60,5 0,7 10,9 Figura 48 – Dados não correlacionados Observe que na figura 48 os pontos estão espalhados na área do gráfico sem seguir comportamento algum. 161 ESTATÍSTICA Muitas vezes não é possível dizer se os pontos estão espalhados ao longo de uma reta, principalmente quando o espalhamento dos dados é grande. Então, é preciso calcular o coeficiente de correlação linear para ser possível dizer se os dados são correlacionados linearmente ou não. 8.3 Coeficiente de correlação linear O coeficiente de correlação linear de Pearson dá uma medida do grau de correlação entre duas grandezas, além de fornecer o sinal dessa correlação, que diz se os dados são direta ou inversamente relacionados. O coeficiente de correlação linear de Pearson é representado por r e é calculado pela seguinte expressão: ( ) ( ) n n n i i i ii 1 i 1 i 1 2 2n n n n2 2 i i i ii 1 i 1 i 1 i 1 n. x .y x . y r n. x x . n. y y = = = = = = = − = − − ∑ ∑ ∑ ∑ ∑ ∑ ∑ Na igualdade, temos que: • xi é o um valor qualquer da variável x. • yi é o um valor qualquer da variável y, correspondente a xi. • n é o número de pares de dados. Para simplificar o cálculo dessa equação, pode‑se calcular cada somatório separadamente para, depois, calcular o coeficiente de correlação, o que pode ser feito da seguinte forma: ( ) ( ) xy x y 22 2 x 2 yx y n.S S .S r n.S S . n.S S − = − − Na equação: n xy i i i 1 S x .y = =∑ n x i i 1 S x = =∑ 162 Unidade IV n y i i 1 S y = =∑ n 2 2 ix i 1 S x = =∑ n 2 2 iy i 1 S y = =∑ O valor do coeficiente de correlação linear de Pearson varia sempre entre ‑1 e +1 e é uma quantidade adimensional – ou seja, sem unidade. O coeficiente de correlação linear de Pearson dá a informação sobre correlação da forma mostrada a seguir. • r 1=− → correlação linear perfeita negativa. • r 0= → dados sem correlação. • r 1=+ → correlação linear perfeita positiva. Dessa maneira: • quanto mais perto o coeficiente r estiver do valor +1, maior será a correlação linear positiva dos dados; • quanto mais perto o coeficiente r estiver do valor ‑1, maior será a correlação linear negativa dos dados;• quanto mais perto o coeficiente r estiver de zero, menor será a correlação dos dados. Exemplo de aplicação Considere os dados a seguir: Tabela 57 – Dados para estudo de correlação x y 1 2 3 6 2 3 1 1 163 ESTATÍSTICA Para analisar se os dados estão correlacionados, calcula‑se o coeficiente de correlação linear r de Pearson, dado por: ( ) ( ) xy x y 22 2 x 2 yx y n.S S .S r n.S S . n.S S − = − − Calculando primeiro cada um dos somatórios, lembrando que são 4 dados de x e 4 dados de y, e, portanto, n = 4, tem‑se o seguinte: n xy i i i 1 S x .y = =∑ xyS 1.2 3.6 2.3 1.1= + + + xyS 2 18 6 1= + + + xyS 27= n x i i 1 S x = =∑ xS 1 3 2 1= + + + xS 7= n y i i 1 S y = =∑ yS 2 6 3 1= + + + yS 12= n 2 2 ix i 1 S x = =∑ 164 Unidade IV 2 2 2 2 2x S 1 3 2 1= + + + 2x S 1 9 4 1= + + + x S 15= n 2 2 iy i 1 S y = =∑ 2 2 2 2 2y S 2 6 3 1= + + + 2y S 4 35 9 1= + + + 2y S 50= Substituindo os cálculos anteriores na expressão do coeficiente de correlação linear r de Pearson, lembrando que, para este caso, n = 4, temos: ( ) ( ) xy x y 22 2 x 2 yx y n.S S .S r n.S S . n.S S − = − − ( )22 4.27 7.12 r 4.15 7 . 4.50 12 − = − − Fazendo os cálculos, ficamos com: 108 84 r 60 49. 200 144 − = − − 24 r 11. 56 = 24 r 3,3166 . 7,4833 = 165 ESTATÍSTICA 24 r 24,8193 = r 0,97= Chega‑se, assim, a um coeficiente de correlação linear de Pearson r = 0,97, o que indica forte correlação linear positiva dos dados – ou seja, quando x aumenta, espera‑se também o aumento de y. A figura a seguir mostra o gráfico de dispersão desses dados, demonstrando a forte correlação linear positiva. y 6 4 2 1 2 2 3 3 x Figura 49 – Gráfico de dispersão do conjunto de dados do exemplo No exemplo anterior, havia forte correlação entre os dados. Vamos ver mais um exemplo de cálculo do fator de correlação de Pearson. Exemplo de aplicação Considere os dados a seguir: Tabela 58 – Dados para estudo de correlação x y 1 1 2 1 3 1 4 0 166 Unidade IV Para verificar se os dados estão correlacionados, calcula‑se o coeficiente de correlação linear r de Pearson, dado por: ( ) ( ) xy x y 22 2 x 2 yx y n.S S .S r n.S S . n.S S − = − − Calculando primeiro cada um dos somatórios, lembrando que são 4 dados de x e 4 dados de y, e, portanto, n = 4, temos o seguinte: n xy i i i 1 S x .y = =∑ xyS 1.1 2.1 3.1 4.0= + + + xyS 1 2 3= + + xyS 6= n x i i 1 S x = =∑ xS 1 2 3 4= + + + xS 10= n y i i 1 S y = =∑ yS 1 1 1 0= + + + yS 3= n 2 2 ix i 1 S x = =∑ 167 ESTATÍSTICA 2 2 2 2 2x S 1 2 3 4= + + + 2x S 1 4 9 16= + + + 2x S 30= n 2 2 iy i 1 S y = =∑ 2 2 2 2 2y S 1 1 1 0= + + + 2y S 1 1 1= + + 2y S 3= Substituindo os cálculos anteriores na expressão do coeficiente de correlação linear r de Pearson, lembrando que, para este caso, n = 4, temos: ( ) ( ) xy x y 22 2 x 2 yx y n.S S .S r n.S S . n.S S − = − − Fazendo os cálculos, ficamos com: 2 2 4.6 10.3 r 4.30 10 . 4.3 3 − = − − 24 30 r 120 100. 12 9 − = − − 6 r 20. 3 − = 6 r 4,4721 .1 ,7320 − = 168 Unidade IV 6 r 7,7460 − = r 0,77= − Chega‑se a um coeficiente de correlação linear de Pearson r 0,77= − , o que indica correlação linear negativa dos dados – ou seja, quando x aumenta, espera‑se também a diminuição de y. A figura a seguir mostra o gráfico de dispersão do conjunto de dados do exemplo. y 1,0 0,5 0,0 1 2 2 3 3 4 4 x Figura 50 – Gráfico de dispersão dos dados do exemplo Note que, no gráfico, a correlação linear dos dados não fica tão evidente como no exemplo anterior, e a existência de correlação precisa do cálculo do coeficiente de correlação linear de Pearson para ser confirmada. Mesmo ao estudar a correlação entre dois conjuntos de dados é preciso ficar atento, porque nem sempre a correlação está relacionada a uma relação de causa e efeito. Por exemplo, pode haver correlação entre a migração de pássaros na Austrália e o peso do sanduíche da lanchonete da sua rua, mas, certamente, não há relação de causa e efeito entre essas duas quantidades. 8.4 Ajuste de reta aos dados Caso seja notado que a correlação entre duas variáveis tem comportamento linear, pode‑se ajustar uma reta sobre esses dados. A equação da reta ajustada pode ser usada para fazer predições da grandeza que foi medida. A seguir, será abordado como fazer esse ajuste de reta. É importante conhecermos os métodos não só de ajuste de reta para não tratarmos essas ferramentas como caixas‑pretas, mas sim entendermos o processo de cálculo e as suas limitações. 169 ESTATÍSTICA 8.4.1 Método dos mínimos quadrados Em um processo de tomada de dados, são obtidas informações de duas variáveis, x e y, além da incerteza σ associada à variável y. Se temos n dados, eles podem ser representados por: ( ) ( ) ( ) ( )1 1 1 2 2 2 3 3 3 n n nx ,y , , x ,y , , x ,y , x ,y ,σ σ σ … σ Aqui, considera‑se a variável x isenta de erros. Observação Também chamamos a incerteza associada a uma medida de erro. Isso não significa que a medida esteja errada, mas que ela apenas não é totalmente precisa. A medida é afetada por erros sistemáticos, por erros aleatórios e, possivelmente, por erros grosseiros. Saiba mais Para saber mais sobre os tipos de erros ou incertezas presentes no processo de medição de uma grandeza, acesse: WATANABE, E. H. Erro de medição. Instituto Federal de Santa Catarina, Joinville, 13 fev. 2019. Disponível em: https://cutt.ly/bMD9Hex. Acesso em: 14 nov. 2022. O método da máxima verossimilhança diz que a melhor função f(x) que pode ser ajustada a um conjunto de dados é aquela que, se admitida como verdadeira, é mais verossímil possível com os pontos experimentais. Observação Verossímil é um adjetivo cuja definição é: “Que aparenta ser verdadeiro; sobre algo cuja verdade não se duvida: uma descrição verossímil. Admissível ou realizável por não se opor à verdade; que não repugna à verdade; plausível: história verossímil (VEROSSÍMIL…, c2022). 170 Unidade IV O método dos mínimos quadrados pode ser deduzido a partir do método da máxima verossimilhança, supondo que as distribuições de erros são gaussianas e que a melhor função f(x) ajustada aos dados tem forma e número de parâmetros predefinidos. O método dos mínimos quadrados dá os coeficientes da função ajustada, mas não diz qual função devemos ajustar aos dados, o que deve ser decidido por quem analisa os dados. O método dos mínimos quadrados, como o nome diz, minimiza o quadrado da distância entre a função ajustada e os pontos experimentais. Considere que yi representa os pontos experimentais e que f(xi; a1, a2, a3, … , aP) representa a função que queremos ajustar aos dados, de grau p e de parâmetros a1, a2, a3, … , aP, dada por: ( ) 2 P1 2 3 p 1 2 i 3 i P if xi; a , a , a , , a a a .x a . x a . x… = + + +…+ O método dos mínimos quadrados tem como objetivo minimizar a quantidade S dada por: ( ) n 2 i i 1 2 p i 1 S y f x ;a ,a , ,a = = − … ∑ Figura 51 – Exemplo da distância entre os pontos experimentais (em azul) e a função ajustada (em vermelho) Na figura 51 é mostrada a distância para o terceiro ponto da figura. O método dos mínimos quadrados minimiza o quadrado dessa distância para todos os pontos experimentais. Os ajustes de reta apresentados a seguir, tanto para incertezas diferentes quanto para incertezas iguais, são uma aplicação do método de mínimos quadrados para o ajuste de funções – no caso, de funções lineares. 171 ESTATÍSTICA 8.4.2 Ajuste de reta para incertezas diferentes Considere a variável y medida em função da variável x. Considere também que há incertezas σ associadas apenas à variável y. O conjunto de n dados experimentais pode, portanto, ser escrito da seguinte forma: ( ) ( ) ( ) ( )1 1 1 2 2 2 3 3 3 n n nx ,y , , x ,y , , x ,y , x ,y ,σ σ σ … σ Ajustando sobre esses dados uma reta de equação y = a.x + b, os coeficientes angular e linear dessa reta ajustada são dados, respectivamente, por: ( )xy x y1a . S .S S .Sσ=−∆ ( )2 y x xyx1b . S .S S .S= −∆ Na equação: n 2 i 1 i 1 Sσ = = σ ∑ n i x 2 i 1 i x S = = σ ∑ n 2 i 2 2x i 1 i x S = = σ ∑ n i y 2 i 1 i y S = = σ ∑ n i i xy 2 i 1 i x .y S = = σ ∑ ( )22 xxS .S Sσ∆ = − 172 Unidade IV As variâncias dos coeficientes angular e linear da reta ajustada são dadas, respectivamente, por: 2 a Sσσ = ∆ 22 x b S σ = ∆ A covariância dos coeficientes angular e linear é dada por: ( ) xScov a,b = − ∆ Exemplo de aplicação O resistor é o componente elétrico que se opõe à passagem de corrente elétrica. Considere as medidas da tensão V e da intensidade de corrente I em um resistor mostradas na tabela a seguir. Tabela 59 – Medidas de tensão e corrente em um resistor I (A) V (V) 𝜎V (V) 0,10 9,5 0,8 0,20 21,4 1,2 0,30 28,0 1,4 0,40 38,7 1,2 Destaca‑se a seguir o gráfico das duas grandezas medidas para analisar se os dados podem ser ajustados por uma reta. I (A) 40 30 20 10 0 V (V) 0 0,1 0,2 0,3 0,50,4 Figura 52 – Gráfico de tensão V em função da intensidade de corrente elétrica I para os valores da tabela 59 173 ESTATÍSTICA Vê‑se, no gráfico da figura 52, que os dados podem ser ajustados por uma reta crescente. Como cada valor de tensão tem uma incerteza associada diferente, é necessário fazer o ajuste de reta para o caso de incertezas diferentes. Começa‑se calculando os coeficientes S e ∆ para, em seguida, calcular os coeficientes angular e linear da reta ajustada. Note que temos I no eixo x e V no eixo y do gráfico (pois trabalhamos com as incertezas no eixo y). Logo, xi corresponde aos valores de intensidade de corrente I e yi corresponde aos valores de tensão V. n 2 i 1 i 1 Sσ = = σ ∑ 2 2 2 2 1 1 1 1 S 0,8 1,2 1,4 1,2 σ = + + + 1 1 1 1 S 0,64 1,44 1,96 1,44σ = + + + S 1,562 0,694 0,510 0,694σ = + + + S 3,46σ = n i x 2 i 1 i x S = = σ ∑ x 2 2 2 2 0,10 0,20 0,30 0,40 S 0,8 1,2 1,4 1,2 = + + + x 0,10 0,20 0,30 0,40 S 0,64 1,44 1,96 1,44 = + + + xS 0,156 0,139 0,153 0,278= + + + xS 0,73= n 2 i 2 2x i 1 i x S = = σ ∑ 174 Unidade IV 2 2 2 2 2 2 2 2 2x 0,10 0,20 0,30 0,40 S 0,8 1,2 1,4 1,2 = + + + 2x 0,01 0,04 0,09 0,16 S 0,64 1,44 1,96 1,44 = + + + 2x S 0,016 0,0278 0,0459 0,111= + + + 2x S 0,20= n i y 2 i 1 i y S = = σ ∑ y 2 2 2 2 9,5 21,4 28,0 38,7 S 0,8 1,2 1,4 1,2 = + + + y 9,5 21,4 28,0 38,7 S 0,64 1,44 1,96 1,44 = + + + yS 14,844 14,861 14,286 26,875= + + + xS 70,87= n i i xy 2 i 1 i x .y S = = σ ∑ xy 2 2 2 2 0,10.9,5 0,20.21,4 0,30.28,0 0,40.38,7 S 0,8 1,2 1,4 1,2 = + + + xy 0,950 4,280 8,400 15,480 S 0,64 1,44 1,96 1,44 = + + + xyS 1,484 2,972 4,286 10,750= + + + xyS 19,49= 175 ESTATÍSTICA ( )22 xxS .S Sσ∆ = − ( )23,46.0,20 0,73∆ = − 0,692 0,533∆ = − 0,16∆ = Calculando os coeficientes angular e linear da reta ajustada, temos: ( )xy x y1a . S .S S .Sσ= −∆ ( )1a . 3,46 .1 9,49 0,73 . 70,87 0,16 = − ( )1a . 67,435 51,735 0,16 = − 15,700 a 0,16 = a 98,13= ( )2 y x xyx1b . S .S S .S= −∆ ( )1b . 0,20.70,87 0,73.19,49 0,16 = − ( )1b . 14,174 14,228 0,16 = − 0,0537 b 0,16 − = b 0,33= − 176 Unidade IV Logo, a equação que ajusta os dados é dada por: y a.x b= + y 98,13.x 0,33= − Como são usadas a tensão V no eixo y e a intensidade da corrente I no eixo x, a forma correta de escrever a equação de reta ajustada aos dados é: V 98,13.I 0,33= − Para verificar se essa reta ajustada está correta, podemos construir um gráfico dos dados e da reta ajustada: I (A) 50 40 30 20 10 0 V (V ) 0 0,1 0,2 0,3 0,50,4 Figura 53 – Dados de tensão e corrente como pontos em azul e reta ajustada em vermelho Pelo gráfico da figura anterior, vemos que a reta se ajusta bem aos pontos, seguindo o comportamento dos pontos no gráfico. 177 ESTATÍSTICA Saiba mais No exemplo anterior, usamos dados de tensão e de intensidade corrente de um resistor, e não foi preciso usar conceitos de eletricidade para ajustarmos uma reta aos dados fornecidos. Caso você queira saber o que é tensão e o que é corrente elétrica, leia: O QUE é tensão e corrente elétrica? Click Geradores, Ibirama, 15 dez. 2021. Disponível em: https://cutt.ly/TMFr6iw. Acesso em: 14 nov. 2022. Figura 54 – Placa de circuito eletrônico Disponível em: https://cutt.ly/SMQNkIn. Acesso em: 14 nov. 2022. 8.4.3 Ajuste de reta para incertezas iguais Quando as incertezas associadas a cada dado experimental são iguais, o cálculo do ajuste de reta aos dados torna‑se mais simples. O conjunto de n dados experimentais pode, nesse caso, ser escrito da seguinte forma: ( ) ( ) ( ) ( )1 1 2 2 3 3 n nx ,y , , x ,y , , x ,y , x ,y ,σ σ σ … σ 178 Unidade IV Ajustando sobre esses dados uma reta de equação y a.x b= + , os coeficientes angular e linear dessa reta ajustada são dados, respectivamente, por: ( )xy x y1a . s .s s .sσ= −∆ ( )2 y x xyx1b . s .s s .s= −∆ Na equação: 2 1 s nσ = σ n x i i 1 s x = =∑ n 3 2 ix i 1 s x = =∑ n y i i 1 s y = =∑ n xy i i i 1 s x .y = =∑ ( )22 xxs .s sσ∆ = − Desse modo, as variâncias dos coeficientes angular e linear da reta ajustada são dadas, nesse caso, respectivamente, por: 2 2 a s .σσ = σ ∆ 22 2x b s .σ = σ ∆ 179 ESTATÍSTICA 8.5 Coeficiente de determinação O coeficiente de determinação é indicado por R2 e tem como objetivo indicar quão adequada foi a escolha de determinada função para ser ajustada a um conjunto de pontos experimentais. O valor de R2 pode ser expresso como um número entre 0 e 1 ou na forma de porcentagem. Lembrete Como vimos quando estudamos probabilidades, para converter um número para porcentagem, basta multiplicá‑lo por 100%. Dessa forma: 0,70 .1 00% 70%= O coeficiente de determinação R2 é calculado por: 2 res tot SQ R 1 SQ = − Na equação: ( ) n res i i i 1 ˆSQ y y = = −∑ ( ) n tot i i i 1 SQ y y = = −∑ Temos o seguinte: • n é o número de dados; • yi é o valor observado para a grandeza; • ŷ é o valor previsto pela função ajustada para a grandeza yi; • ȳ é o valor médio para a grandeza yi. O coeficiente de determinação calculado dessa forma tem um inconveniente: quanto maior o número de parâmetros da função, maior o coeficiente de determinação. Isso passa uma falsa ideia de que é sempre melhor usar funções com mais parâmetros, o que não é verdade. Para contornar esse problema, usa‑se o coeficiente de explicação ajustado, dado por: 180 Unidade IV ( ) ( ) 2 2n 1R 1 . 1 R n k 1 − = − − − + Na equação: • k é o número de parâmetros da função ajustada; • n é o número de dados; • R é o coeficiente de determinação. 8.6 Funções linearizáveis Podemos ter funções que, a princípio, não têm gráficos lineares (ou seja, representados por uma reta), mas que, com algumas adaptações, podem ter os gráficos são linearizados. Por exemplo, considere a função matemática a seguir. by a.x= Na equação, a e b são constantes, ou seja, são números. O gráfico desse tipo de função é uma reta apenas se b 1= . Nos demais casos, o gráfico não é linear. Lembrete Vimos que a função de primeiro grau y a.x b= + tem esse nome porque a variável x está elevada à primeira potência, e seu gráfico é uma reta. 4 3 2 1 y x ‑1,0 ‑0,5 0,5 1,0 Figura 55 – Gráfico da função 2y 3.x= , função do tipo by a.x= , com a = 3 e b = 2, mostrando que o gráfico não é linear 181 ESTATÍSTICA Observação O logaritmo de uma função é indicado por ( )\y log x= e tem como operação inversa a potência, ou seja, x = ya. Na equação do logaritmo, a é a base do logaritmo. Quando essa base não é indicada, ela é igual a 10, ou seja, ( ) ( )10log x log x= . Vamos precisar de algumas propriedades de logaritmos, listadas a seguir: ( ) ( ) ( )log a.b log a log b= + ( ) ( )blog a b.log a= Uma forma de linearizar o gráfico de funções do tipo y = a.xb, com a e b constantes, é calcular o logaritmo dos dois lados da função. by a.x= ( ) ( )blog y log a.x= Como o logaritmo do produto é igual à soma dos logaritmos, temos: ( ) ( ) ( )blog y log a log x= + Sobre oexpoente dentro da função logarítmica, podemos fazer: ( ) ( ) ( )log y log a b.log x= + Se compararmos essa equação com uma equação de reta, teremos: ( ) ( ) ( )log y log a b.log x= + Y A B .X= + Então, se no eixo y do gráfico for colocado o logaritmo dos valores de y e no eixo x do gráfico for colocado o logaritmo dos valores de x, a função passa a ser linearizada (ou seja, seu gráfico torna‑se uma reta). 182 Unidade IV A figura a seguir apresenta o gráfico da função 2y 3.x= , mas com eixos em escala logarítmica. 10 1 0,1 0,01 0,1 1 Figura 56 – Gráfico da função y = 3 . x2, com ambos os eixos em escala logarítmica Quando é usada a escala logarítmica nos eixos dos gráficos, é necessário estar atento ao fato de que logaritmo de zero e de valores negativos não podem ser calculados. Então, não é possível simplesmente “pegar” um gráfico que passa pela origem e aplicar a escala logarítmica nos eixos. Na figura 56, foi utilizado apenas um trecho do gráfico da figura 55, com valores de x positivos, para mudar a escala do gráfico para escala logarítmica. Note que a escala dos eixos do gráfico da figura anterior não é linear. Temos no eixo y os seguintes valores: 0,010,1110 Esses valores aparecem igualmente espaçados no eixo do gráfico, o que é uma indicação de que o gráfico está na escala logarítmica. A figura a seguir apresenta novamente o gráfico da expectativa de vida em função do PIB per capita, mas agora em escala logarítmica. 183 ESTATÍSTICA PIB per capita (US$) 1000,0 2000,0 5000,0 10000,0 20000,0 50000,0 100000,0 Expectativa de vida (anos)80 70 60 50 Figura 57 – Gráfico da expectativa de vida em função do PIB per capita em escala logarítmica em ambos os eixos Um ponto importante é que não é preciso calcular o logaritmo dos valores para fazer isso, dado que a maioria dos programas de plotagem de gráficos permite aplicar escalas logarítmicas aos eixos dos gráficos. Se o gráfico for feito à mão, há um papel próprio, chamado de papel dilog, ou log‑log, que já faz com que o gráfico seja linearizado. Saiba mais Para saber como alterar a escala dos eixos de um gráfico do Excel para escala logarítmica, leia: ALTERAR a escala do eixo vertical (valor) em um gráfico. Microsoft, Redmond, [s.d.]. Disponível em: https://cutt.ly/7MFyNyr. Acesso em: 14 nov. 2022. Uma desvantagem dos gráficos em escala logarítmica é que eles podem não ser compreendidos por pessoas sem conhecimentos de matemática, o que faz com que esse tipo de gráfico não seja o mais adequado para apresentações para qualquer público, como no caso de gráficos de reportagens. 184 Unidade IV Resumo Segundo Morettin (2019, p. 46), “variável aleatória é uma função que associa a todo evento pertencente a uma partição do espaço amostral um único número real”. Uma variável aleatória é dita discreta se assume apenas determinados valores, e não qualquer valor contido em um intervalo de valores (nesse caso teríamos uma variável contínua). Um exemplo de quantidades discretas está nos resultados do lançamento de um dado, em que podemos obter apenas números inteiros de 1 a 6, e nunca números fracionários. Vimos que Morettin (2019, p. 46) define a função de probabilidade como “a função que associa cada valor assumido pela variável aleatória à probabilidade do evento correspondente”. O autor define, ainda, a distribuição de probabilidade como o conjunto formado pelos valores das variáveis aleatórias e duas probabilidades correspondentes. A distribuição de probabilidades pode ser representada de forma gráfica, colocando‑se os valores da variável aleatória no eixo horizontal e as probabilidades correspondentes no eixo vertical. Como estamos tratando de uma variável discreta, o gráfico será composto por pontos, e não podemos traçar uma curva sobre esses pontos. O valor esperado de uma variável aleatória, também conhecido como esperança matemática, é igual ao valor médio dessa variável. O valor esperado de uma variável aleatória X, indicado por E(X), é calculado pela média ponderada dos valores assumidos pela variável, em que os pesos são as probabilidades: ( ) ( ) N i i i 1 E X x .p x = =∑ A variância de uma variável aleatória e discreta X, representada por VAR(X), é calculada por: ( ) ( ) ( ) N 2 i x i i 1 VAR X x .p x = = −µ∑ 185 ESTATÍSTICA Na equação, xi representa cada valor da variável aleatória, µx representa o valor verdadeiro (ou valor médio) da grandeza e p(xi) representa a probabilidade de ocorrência de cada valor da variável aleatória xi. A variância ainda pode ser indicada por V(X), σ2(X), σX 2 ou σ2. A variância é um indicador de dispersão, ou seja, fornece uma medida do espalhamento dos dados. A distribuição binomial é uma distribuição discreta de probabilidades que se aplica ao processo de amostragem que tiver as seguintes características: • em cada tentativa, há apenas dois resultados possíveis, chamados de sucesso e fracasso, que são mutuamente exclusivos; • os eventos de uma série de tentativas são independentes; • o processo é estacionário, ou seja, a probabilidade de sucesso não varia entre uma tentativa e outra. A probabilidade P(X) de termos X sucessos em N tentativas é dada pela seguinte expressão: ( ) X N XN,XP X C .p .q −= Escrevendo explicitamente o binômio CN,X, temos: ( ) ( ) X N XN!P X .p .q X!. N X ! −= − A distribuição normal de probabilidades é uma distribuição de probabilidades contínua, simétrica em relação à média, e cuja curva tem o formato de uma gaussiana. Essa curva é chamada de função densidade de probabilidade (fdp). A probabilidade de ocorrência de um evento está relacionada com a área sob a curva da função densidade de probabilidade. Em uma distribuição normal de probabilidades, temos o que segue. x x x−σ< < + σ → p = 68% x 2. x x 2.− σ< < + σ → p = 95% x 23 x x 3.− σ< < + σ → p = 99,7% 186 Unidade IV A probabilidade de um valor estar no intervalo entre uma vez o desvio padrão, tanto para o lado negativo como para o lado positivo, é de 68% para uma distribuição normal. A probabilidade de um valor estar no intervalo dentro de 2 vezes o desvio padrão, tanto para o lado negativo como para o positivo, é de 95%. Já a probabilidade de um valor estar no intervalo limitado por 3 vezes o desvio padrão, tanto para o lado negativo como para o positivo, é de 99,7%. Outra implicação disso é que a probabilidade de um valor estar além de 3 vezes o desvio padrão é cerca de 0,3%. A função densidade de probabilidade de uma distribuição normal de média x e desvio padrão σ é dada por: ( ) 21 x x . 21f x .e . 2. − − σ = σ π Podemos converter qualquer distribuição normal de probabilidades em uma distribuição normal padronizada, convertemos os valores x da distribuição em valores padronizados z usando a seguinte expressão: x x z − = σ A conversão para uma distribuição normal padronizada faz com que possamos usar uma tabela para obter as probabilidades, sem que tenhamos que realizar cálculos usando a equação da função densidade de probabilidade que vimos anteriormente. Essa tabela é mostrada a seguir. Tabela 60 – Áreas sob uma distribuição normal padrão, em relação ao valor médio z 0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359 0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753 0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141 0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517 0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879 0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224 0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549 0,7 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852 0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133 0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,33650,3389 187 ESTATÍSTICA z 0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621 1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830 1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015 1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177 1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319 1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441 1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545 1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633 1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706 1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767 2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817 2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857 2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890 2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916 2,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936 2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952 2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964 2,7 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974 2,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981 2,9 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986 3,0 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990 Para usarmos essa tabela, podemos partir do valor de z e procurar a combinação entre linha e coluna até obtermos esse valor. Por exemplo, a área sob a gaussiana para z = 1,42 é obtida por 1,4 + 0,02, e essa área está no cruzamento da linha 1,4 com a coluna 0,02, o que dá a área de 0,4222 (ver tabela a seguir). Tabela 61 – Áreas sob uma distribuição normal padrão, em relação ao valor médio para z = 1,42 z 0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359 0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753 0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141 0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517 0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879 0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224 0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549 0,7 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852 0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133 188 Unidade IV z 0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389 1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621 1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830 1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015 1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177 1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319 1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441 1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545 1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633 1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706 1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767 2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817 2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857 2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890 2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916 2,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936 2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952 2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964 2,7 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974 2,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981 2,9 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986 3,0 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990 Lembre‑se de que essas tabelas fornecem a área entre o meio da curva e o z que procuramos. Assim, se quisermos a área entre dois lados da curva simétricos, devemos dobrar o valor obtido na tabela. A tabela também pode ser usada no sentido inverso, em que consultamos um valor de probabilidade e, a partir da posição desse valor, obtemos o valor de z pela soma da linha e da coluna da probabilidade desejada. A inferência estatística é o processo estatístico que tem como objetivo fazer generalizações de uma população a partir de uma amostra. A inferência estatística envolve a amostragem, os estimadores e os intervalos de confiança, conceitos que detalharemos a seguir. A seleção de uma amostra de uma população é chamada levantamento amostral. Esse levantamento amostral pode ser de dois tipos, probabilístico ou não probabilístico. 189 ESTATÍSTICA Os levantamentos amostrais probabilísticos podem ser classificados em amostragem aleatória simples, sistemática, estratificada ou por conglomerados. Na amostragem aleatória simples, todos os elementos de uma população têm igual probabilidade de serem selecionados para a amostra. Nesse processo de seleção, é comum sortearmos aleatoriamente os elementos da população que irão compor a amostra. Esse é o método mais simples de compor uma amostra. Na amostragem aleatória sistemática, os elementos da população são selecionados de acordo com critérios pré‑estabelecidos, como seleção pela inicial do nome, por exemplo. Esse processo de amostragem é bastante usado para compor amostras em pesquisas de opinião. Na amostragem aleatória estratificada, a população é dividida em grupos homogêneos, chamados de estratos, e, em seguida, é feita uma amostragem aleatória simples dentro de cada estrato. Os estratos podem ser faixas salariais em uma empresa ou faixas etárias de uma população, por exemplo. Na amostragem aleatória por conglomerados, a população é dividida por áreas geográficas, e é feita então uma amostragem simples em uma pequena área geográfica. Os levantamentos amostrais não probabilísticos podem ser classificados em amostragem não aleatória intencional, voluntária ou acidental. Na amostragem não aleatória intencional, o pesquisador escolhe uma característica da população para compor sua amostra, por exemplo, selecionando pessoas pelo seu time de futebol. Na amostragem não aleatória voluntária, as pessoas tomam a iniciativa de fazer parte da amostra, oferecendo‑se para participar da pesquisa. Na amostragem não aleatória acidental, os elementos que compõem a amostra são escolhidos sem nenhum critério estabelecido, por exemplo, selecionar todas as pessoas que passam por determinada rua. Definimos estimador como uma grandeza obtida a partir de observações de uma amostra. Ele é um indicador de um parâmetro desconhecido da população. Chamamos de estimativa o valor atribuído a um estimador. A estimativa de um parâmetro pode ser feita de duas formas: por ponto ou por intervalo. 190 Unidade IV A estimativa por ponto é o nome dado ao valor obtido a partir de cálculos estatísticos com os elementos da amostra, servindo como uma aproximação do parâmetro estimado. A estimativa por intervalo não é feita por um único valor, mas por uma faixa de valores, considerados uma aproximação do parâmetro estimado. As estimativas por intervalo são relacionadas ao intervalo de confiança. Em geral, calculamos intervalos de confiança que tenham a chance de 95% de conter o valor verdadeiro. O nível de confiança
Compartilhar