Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 2 SUMÁRIO 1 O QUE É A ESTATÍSTICA ...................................................................... 5 1.1 Definição de Estatística .................................................................... 5 2 ESTATÍSTICA DESCRITIVA .................................................................. 6 2.1 O que são as Medidas de Centralidade na estatística descritiva? ... 6 2.2 O que é uma Média Aritmética na estatística descritiva? ................. 6 2.3 O que é a Mediana na estatística descritiva? ................................... 7 2.4 O que é Moda na estatística descritiva? ........................................... 8 2.5 O que são os Percentis (ou quartis)? ............................................... 9 2.6 Como calcular o primeiro quartil? ................................................... 10 3 PROBABILIDADE ................................................................................. 10 3.1 Experimento aleatório e ponto amostral ......................................... 10 3.2 Espaço amostral ............................................................................. 12 3.3 Evento ............................................................................................ 12 3.4 Cálculo da probabilidade ................................................................ 13 4 VARIÁVEIS ALEATÓRIAS DISCRETAS .............................................. 15 4.1 Distribuição de probabilidade ......................................................... 16 4.2 Função de densidade de probabilidade ......................................... 17 4.3 Esperança matemática, variância e desvio padrão: propriedades . 17 5 DISTRIBUIÇÕES DE VARIÁVEIS ALEATÓRIAS DISCRETAS ........... 18 5.1 Distribuição de Bernoulli ................................................................. 18 5.2 Distribuição Binomial ...................................................................... 19 5.3 Distribuição de Poisson .................................................................. 20 3 5.4 Distribuição Geométrica ................................................................. 21 5.5 Distribuição Uniforme ..................................................................... 22 5.6 Distribuição Hipergeométrica ......................................................... 22 6 VARIÁVEIS ALEATÓRIAS CONTÍNUAS.............................................. 23 6.1 Distribuição de variáveis aleatórias discretas: ................................ 24 6.2 Distribuição Uniforme: .................................................................... 25 6.3 A média de X é dada por: ............................................................... 26 6.4 Distribuição Exponencial ................................................................ 26 6.5 Distribuição Normal ........................................................................ 27 6.6 Distribuição do tipo Gama .............................................................. 31 6.7 Distribuição do tipo Qui-Quadrado ................................................. 35 7 DISTRIBUIÇÕES DE PROBABILIDADES CONTÍNUAS E DISCRETAS 36 7.1 O que é a distribuição contínua? .................................................... 36 7.2 Exemplo da distribuição de pesos .................................................. 37 7.3 O que é a distribuição discreta? ..................................................... 38 7.4 Exemplo do número de reclamações de clientes ........................... 38 8 REGRESSÃO E CORRELAÇÃO .......................................................... 40 8.1 Correlação ...................................................................................... 40 8.2 Correlação linear ............................................................................ 41 8.3 Medidas de correlação ................................................................... 42 8.4 Regressão ...................................................................................... 44 Regressão da linha reta .......................................................................... 48 9 TEORIA DA ESTIMAÇÃO ..................................................................... 53 9.1 Estimação por ponto....................................................................... 54 4 9.2 Estimação por intervalo .................................................................. 54 9.3 Intervalo de Confiança.................................................................... 55 9.4 Intervalo de confiança para a média quando a variância é conhecida 56 10 NOÇÕES DE AMOSTRAGEM .......................................................... 57 10.1 MOTIVAÇÃO ............................................................................... 57 10.2 Métodos de Amostragem ............................................................ 57 10.3 Amostragem Aleatória Simples ................................................... 58 10.4 Amostragem Sistemática ............................................................ 58 10.5 Amostragem Estratificada ........................................................... 58 10.6 Amostragem por Conglomerados ............................................... 59 10.7 Amostragem Acidental (Conveniência) ....................................... 60 10.8 Amostragem Julgamento ou intencional ..................................... 60 10.9 Amostragem por Quotas ............................................................. 60 11 TESTES DE HIPÓTESES ................................................................. 61 12 ANÁLISE DA VARIÂNCIA (ANOVA) ................................................. 64 12.1 Hipóteses do ANOVA de um critério ........................................... 65 BIBLIOGRAFIA ........................................................................................... 69 5 1 O QUE É A ESTATÍSTICA Para muitos, a estatística não passa de conjuntos de tabelas de dados numéricos. Os estatísticos são pessoas que coletam esses dados. •A estatística originou-se com a coleta e construção de tabelas de dados para os governos • A situação evoluiu e está coleta de dados representa somente um dos aspectos da estatística. Fonte: ignisengenharia.com.br 1.1 Definição de Estatística A estatística é um conjunto de técnicas que permite, de forma sistemática, organizar, descrever, analisar e interpretar dados oriundos de estudos ou experimentos, realizados em qualquer área do conhecimento. A estatística descritiva é a etapa inicial da análise utilizada para descrever e resumir os dados. A disponibilidade de uma grande quantidade de dados e de métodos computacionais muito eficientes revigorou está área da estatística. 6 2 ESTATÍSTICA DESCRITIVA Estatística descritiva é o ramo da estatística que visa sumarizar e descrever qualquer conjunto de dados. Em outras palavras, é aquela estatística que está preocupada em sintetizar os dados de maneira direta, se preocupando menos com variações e intervalos de confiança dos dados. Exemplos de estatísticas descritivas são a média, o desvio padrão, a mediana, etc. 2.1 O que são as Medidas de Centralidade na estatística descritiva? São procedimentos gráficos que ajudam a visualizar a forma da distribuição das medidas (como é o caso do histograma). O próximo passo na análise é quantificar alguns aspectos importantes da distribuição. Duas medidas são amplamente utilizadas, uma para localizar a posição central e outra para quantificar a variabilidade ou dispersão da distribuição. A medida de posição central é um valor representativo da distribuição em torno do qual as outras medidas se distribuem. Duas medidas são as mais utilizadas: a média aritmética e a mediana. 2.2 O que é uma Média Aritmética na estatística descritiva? A média aritmética de um conjunto de nº valores, como o próprionome indica, é obtida somando-se todas as medidas e dividindo-se a soma por n. Representamos cada valor individual por uma letra (x, y, z, etc.) seguida por um sub índice, ou seja, representamos os nº valores da amostra por x1, x2, x3, …, xn, onde x1 é a primeira observação, x2 é a segunda e assim por diante. Então escrevemos: Onde é um símbolo matemático que se lê “somatório” de xi, para i variando de 1 a n, que é equivalente a x1 + x2 + x3 +…+xn. http://www.fm2s.com.br/histograma http://www.fm2s.com.br/6-sigma-variabilidade/ 7 Exemplo: O número médio de filhos por família, usando os dados do exemplo acima, é dado por: 2.3 O que é a Mediana na estatística descritiva? A mediana é uma medida alternativa à média aritmética para representar o centro da distribuição, muito usada em estatística descritiva. A mediana de um conjunto de medidas (x1, x2, x3, …, xn) é um valor M tal que pelo menos 50% das medidas são menores ou iguais a M e pelo menos 50% das medidas são maiores ou iguais a M. Em outras palavras, 50% das medidas ficam abaixo da mediana e 50% acima. Exemplo: Uma mulher, durante seu período reprodutivo, deu à luz a 5 crianças. Os pesos dos recém-nascidos foram: 9.2, 6.4, 10.5, 8.1 e 7.8. Calcule a mediana dos pesos. Os valores ordenados são: 6.4 7.8 8.1 9.2 10.5. Portanto a mediana é 8.1. Exemplo: Os dados abaixo são tempos de vida (em dias) de 8 lâmpadas: 500 550 550 550 600 700 750 2000 Note que temos dois valores que satisfazem a condição de ser mediana, o quarto (550) e o quinto (600) valor na lista ordenada. Nesse caso, definimos a mediana como sendo a média dos dois valores centrais: Observe que se a lâmpada que sobreviveu 2000 dias tivesse sobrevivido 3950 dias o valor da mediana não se alteraria, mas a média aritmética aumentaria. Não ser afetada por valores extremos é uma vantagem da mediana em relação à média. Quando a distribuição dos dados é simétrica os valores da média e da 8 mediana praticamente coincidem. Quando a distribuição é assimétrica a média é “puxada” na direção da assimetria. Fonte: educare.pt Quase sempre quando olhamos uma média fazemos algum julgamento de valor. Se lemos no jornal qual é a renda média de uma determinada comunidade somos tentados a avaliar como é a situação econômica dessa comunidade. O valor pode ser alto e mesmo assim a situação social ser muito ruim. Basta que poucos ganhem muito e muitos ganhem pouco. A mediana não é influenciada por esses valores extremos e nesse caso refletirá melhor a condição econômica da comunidade. Em qualquer estudo, é interessante reportar as duas medidas de centralidade. 2.4 O que é Moda na estatística descritiva? A moda de uma distribuição é o valor que ocorre mais frequentemente, ou o valor que corresponde ao intervalo de classe com a maior frequência. A moda, da mesma forma que a mediana, não é afetada por valores extremos. Uma distribuição de frequência que apresenta apenas uma moda é chamada de uni modal. Se a distribuição apresenta dois pontos de alta concentração ela é 9 chamada de bimodal. Distribuições bimodais ou multimodais podem indicar que na realidade a distribuição de frequência se refere a duas populações cujas medidas foram misturadas. Por exemplo, suponha que um lote de caixas de leite longa vida é amostrado e em cada caixa da amostra é medido o volume envasado. Se o lote é formado pela produção de duas máquinas de envase que estão calibradas em valores diferentes, é possível que o dihistograma apresente duas modas, uma para cada valor de calibração. 2.5 O que são os Percentis (ou quartis)? Se o número de observações é grande, é interessante calcular algumas outras medidas de posição. Essas medidas são uma extensão do conceito de mediana. Suponha que estamos conduzindo um experimento com animais. Eles recebem uma droga e medimos o tempo de vida (em dias) após a ingestão dessa droga. Poderíamos fazer a seguinte pergunta: Qual é o tempo em que 50% dos animais ainda estão vivos? Obviamente esse valor será a mediana. Poderíamos estar interessados em saber qual é o tempo em que 75% dos animais estão vivos. Ou 25%. Esses valores são chamados de Quartis da distribuição (dividem a distribuição em quartas partes) e são representados por Q1 (1º quartil – 25%) e Q3 (3º quartil – 75%). O segundo quartil, Q2, que corresponde a 50%, é a mediana. Esse conceito pode ser estendido um pouco mais, e em lugar de 25%, 50% e 75%, podemos querer calcular percentis (5%,10%, 90%, Tc). Seja p um número qualquer entre 0 e 1. O 1100×p-ésimo percentil é um valor tal que depois das medidas terem sido ordenadas, pelo menos 100×p% das medidas são menores ou iguais a esse valor, e pelo menos 100×(1-p)% das medidas são maiores ou iguais a esse valor. Exemplo: O ganho em peso de 9 ratos submetidos a uma dieta são dados a seguir: 93.9 105.8 106.5 116.6 125.0 128.3 132.1 136.7 152.4 10 2.6 Como calcular o primeiro quartil? Cálculo de Q1: Q1 corresponde a 25%. Então p=0.25. O número de observações menores ou iguais a Q1 é 0.25×9=2.25. O número de observações maiores ou iguais a Q1 é (1-0.25)×9=6.75 Em outras palavras, pelo menos 3 observações têm que ser menores ou iguais a Q1, e pelo menos 7 observações têm que ser maiores ou iguais a Q1. A medida 106.5 satisfaz esses requerimentos e, portanto, Q1 = 106.5. Cálculo de Q3: Argumentos semelhantes mostram que Q3 = 132.1. Temos também que Q2 = 125.0, que é a mediana. Exemplo: Calcular os quartis e os percentis 5%, 10%, 90% e 95% para a amostra de valor de venda de um produto em 95 pontos de venda amostrados apresentado acima. 75% Q3 45.3 5% 35.2 50% Q2 42.2 10% 37.0 25% Q1 39.5 90% 47.0 Média 42.4 95% 50.21 3 PROBABILIDADE Probabilidade é o estudo das chances de obtenção de cada resultado de um experimento aleatório. A essas chances são atribuídos os números reais do intervalo entre 0 e 1. Resultados mais próximos de 1 têm mais chances de ocorrer. Além disso, a probabilidade também pode ser apresentada na forma percentual. 3.1 Experimento aleatório e ponto amostral Um experimento aleatório pode ser repetido inúmeras vezes e nas mesmas condições e, mesmo assim, apresenta resultados diferentes. Cada um desses 1 Texto de: Virgilio F.M. Dos Santos. Extraído: www.fm2s.com.br https://mundoeducacao.bol.uol.com.br/matematica/chances-um-evento-acontecer.htm https://mundoeducacao.bol.uol.com.br/matematica/experimento-aleatorio-espaco-amostral.htm https://mundoeducacao.bol.uol.com.br/matematica/conjunto-dos-numeros-reais.htm https://mundoeducacao.bol.uol.com.br/matematica/porcentagem.htm 11 resultados possíveis é chamado de ponto amostral. São exemplos de experimentos aleatórios: A) Cara ou coroa Lançar uma moeda e observar se a face voltada para cima é cara ou coroa é um exemplo de experimento aleatório. Se a moeda não for viciada e for lançada sempre nas mesmas condições, poderemos ter como resultado tanto cara quanto coroa. Fonte: professorloureiro.com B) Lançamento de um dado Lançar um dado e observar qual é o número da face superior também é um experimento aleatório. Esse número pode ser 1, 2, 3, 4, 5 ou 6 e cada um desses resultados apresenta a mesma chance de ocorrer. Em cada lançamento, o resultado pode ser igual ao anterior ou diferente dele. Observe que, no lançamento da moeda, as chances de repetir o resultado anterior são muito maiores. C). Retirar uma carta aleatória de um baralho Cada carta tem a mesma chance de ocorrência cada vez que o experimentoé realizado, por isso, esse é também um experimento aleatório. 12 3.2 Espaço amostral O espaço amostral (Ω) é o conjunto formado por todos os resultados possíveis de um experimento aleatório. Em outras palavras, é o conjunto formado por todos os pontos amostrais de um experimento. Veja exemplos: a) O espaço amostral do experimento “cara ou coroa” é o conjunto S = {Cara, Coroa}. Os pontos amostrais desse experimento são os mesmos elementos desse conjunto. b) O espaço amostral do experimento “lançamento de um dado” é o conjunto S = {1, 2, 3, 4, 5, 6}. Os pontos amostrais desse experimento são 1, 2, 3, 4, 5 e 6. O espaço amostral também é chamado de Universo e pode ser representado pelas outras notações usadas nos conjuntos. Além disso, todas as operações entre conjuntos valem também para espaços amostrais. O número de elementos do espaço amostral, número de pontos amostrais do espaço amostral ou número de casos possíveis em um espaço amostral é representado da seguinte maneira: n (Ω). 3.3 Evento Um evento é qualquer subconjunto de um espaço amostral. Ele pode conter nenhum elemento (conjunto vazio) ou todos os elementos de um espaço amostral. O número de elementos do evento é representado da seguinte maneira: n (E), sendo E o evento em questão. São exemplos de eventos: A). Sair cara em um lançamento de uma moeda O evento é sair cara e possui um único elemento. A representação dos eventos também é feita com notações de conjuntos: E = {cara} O seu número de elementos é n (E) = 1. B). Sair um número par no lançamento de um dado. O evento é sair um número par: https://mundoeducacao.bol.uol.com.br/matematica/operacoes-entre-conjuntos.htm https://mundoeducacao.bol.uol.com.br/matematica/operacoes-entre-conjuntos.htm 13 E = {2, 4, 6} O seu número de elementos é n (E) = 3. Os eventos que possuem apenas um elemento (ponto amostral) são chamados de simples. Quando o evento é igual ao espaço amostral, ele é chamado de evento certo e sua probabilidade de ocorrência é de 100%. Quando um evento é igual ao conjunto vazio, ele é chamado de evento impossível e possui 0% de chances de ocorrência. 3.4 Cálculo da probabilidade Seja E um evento qualquer no espaço amostral Ω. A probabilidade do evento A ocorrer é a razão entre o número de resultados favoráveis e o número de resultados possíveis. Em outras palavras, é o número de elementos do evento dividido pelo número de elementos do espaço amostral a que ele pertence. P(E) = n(E) n(Ω) Observações: O número de elementos do evento sempre é menor ou igual ao número de elementos do espaço amostral e maior ou igual a zero. Por isso, o resultado dessa divisão sempre está no intervalo 0 ≤ P (A) ≤ 1; Quando é necessário usar porcentagem, devemos multiplicar o resultado dessa divisão por 100 ou usar regra de três; A probabilidade de um evento não acontecer é determinada por: P (A-1) = 1 – P (A) Exemplos: →. Qual é a probabilidade de, no lançamento de uma moeda, o resultado ser cara? Solução: Observe que o espaço amostral só possui dois elementos e que o evento é sair cara e, por isso, possui apenas um elemento. 14 P(E) = n(E) n(Ω) P(E) = 1 2 P(E) = 0,5 = 50% Fonte: pensevestibular.com.br →. Qual é a probabilidade de, no lançamento de duas moedas, obtermos resultados iguais? Solução: Representando cara por C e coroa por K, teremos os seguintes resultados possíveis: (C, K); (C, C); (K, C); (K, K) O evento obter resultados iguais possui os seguintes casos favoráveis: (C, C); (K, K) Há quatro casos possíveis (número de elementos do espaço amostral) e dois casos favoráveis (número de elementos do evento), logo: P(E) = n(E) n(Ω) P(E) = 2 4 P(E) = 0,5 = 50% 15 →. No lançamento de um dado, qual é a probabilidade de sair um resultado menor que 3? Solução: Observe que os números do dado menores do que 3 são 1 e 2, por isso, o evento possui apenas dois elementos. O espaço amostral possui seis elementos: 1, 2, 3, 4, 5 e 6. P(E) = n(E) n(Ω) P(E) = 2 6 P(E) = 0,33... = 33,3% →. Qual é a chance de não sair o número 1 no lançamento de um dado? Solução: Temos duas maneiras de resolver esse problema. Note que não sair o número 1 é o mesmo que sair qualquer outro número. Faremos o mesmo cálculo de probabilidade considerando que o evento possui cinco elementos. A outra maneira é usar a fórmula para a probabilidade de um evento não ocorrer: P (A-1) = 1 – P (E) O evento que não pode ocorrer possui apenas um elemento, logo: P (A-1) = 1 – P (E) P(A-1) = 1 – n(E) n(Ω) P(A-1) = 1 – 1 6 P (A-1) = 1 – 0,166. P (A-1) = 0,8333… = 83,3% 4 VARIÁVEIS ALEATÓRIAS DISCRETAS Muitos experimentos aleatórios produzem resultados não - numéricos. Antes de analisá-los, é conveniente transformar seus resultados em números, o que é feito através da variável aleatória, que é uma regra de associação de um valor numérico a cada ponto do espaço amostral. Portanto, variáveis aleatórias são variáveis numéricas às quais iremos associar modelos probabilísticos. Veremos que uma variável aleatória tem um 16 número para cada resultado de um experimento e que uma distribuição de probabilidades associa uma probabilidade a cada resultado numérico de um experimento. Seja E um experimento e S o espaço associado ao experimento. Uma função X, que associe a cada elemento s pertence S um número real X (s), é denominado variável aleatória. Exemplo: E: lançamento de duas moedas; X: número de caras obtidas nas duas moedas; S= {(c,c),(c,r),(r,c),(r,r)} X=0 > corresponde ao evento (r,r) com probabilidade ¼; X=1 > corresponde ao evento (r,c), (x,r) com probabilidade 2/4; X=2 > corresponde ao evento (c,c) com probabilidade ¼; Empregamos a termo variável aleatória para descrever o valor que corresponde ao resultado de determinado experimento. As variáveis aleatórias também podem ser discretas ou continuas e temos as seguintes definições: Variáveis aleatórias discretas – Admite um número finito de valores ou tem uma quantidade enumerável de valores. Variáveis aleatórias contínuas – Pode tomar um número infinito de valores, e esses valores podem ser associados a mensurações em uma escala contínua. 4.1 Distribuição de probabilidade Uma vez definida a variável aleatória, existe interesse no cálculo dos valores das probabilidades correspondentes. O conjunto das variáveis e das probabilidades correspondentes é denominado distribuição de probabilidades, isto é: 17 4.2 Função de densidade de probabilidade É a função que associa a cada valor assumido pela variável aleatória a probabilidade do evento correspondente, isto é: 4.3 Esperança matemática, variância e desvio padrão: propriedades Existem características numéricas que são muito importantes em uma distribuição de probabilidades de uma variável aleatória discreta. São os parâmetros das distribuições, a saber: > Esperança matemática (ou simplesmente média) – E (x) – é um número real, é também uma média aritmética; > Variância – VAR (x) – é à medida que dá o grau de dispersão (ou de concentração) de probabilidade em torno da média. O fato de conhecermos a média de uma distribuição de probabilidades já nos ajuda bastante, porém, precisamos de uma medida que nos dê o grau de dispersão de probabilidade em torno dessa média. Fonte: antoniolima.web.br.com 18 5 DISTRIBUIÇÕES DE VARIÁVEIS ALEATÓRIAS DISCRETAS Será feita uma discussão sobre algumas distribuições de probabilidades discretas. Tais distribuições partem da pressuposição de certas hipóteses bem definidas. Como diversas situações reais muitas vezes se aproximam dessas hipóteses, esses modelos são úteis no estudo de tais situações, daí a sua importância.Um cuidado muito grande deve ser tomado ao se escolher uma distribuição de probabilidade que descreve corretamente as observações geradas por um experimento. Primeiramente analisaremos as distribuições discretas de probabilidades mais importantes e que descrevem as variáveis aleatórias comumente encontradas na prática. Por último analisaremos algumas distribuições de v.a. contínuas de importância similar. 5.1 Distribuição de Bernoulli Seja um exemplo aleatório E realizado repetidas vezes, sempre nas mesmas condições, de tal forma que o resultado pode ser um Sucesso (s) (se acontecer o evento que nos interessa) ou um Fracasso (f) (se o evento não se realizar). Seja X a variável aleatória: Sucesso ou Fracasso Essas condições caracterizam um conjunto de Provas de Bernoulli ou um experimento de Bernoulli, e sua função probabilidade é dada por: > Média: > Variância: 19 5.2 Distribuição Binomial Uma variável aleatória tem distribuição binomial quando o experimento ao qual está relacionada apresenta apenas dois resultados (sucesso ou fracasso). Este modelo fundamenta-se nas seguintes hipóteses: N provas independentes e do mesmo tipo são realizadas; Cada prova admite dois resultados – Sucesso ou Fracasso; A probabilidade de sucesso em cada prova é p e de fracasso 1-p = p; Define-se a Variável X que conta o número de sucessos nas n realizações do experimento. (X pode assumir os valores 0, 1, 2, 3, ..., n.). Fazendo sucesso corresponder a 1 fracasso, a 0, temos: Para X = 0, uma sequência de n zeros: 00000...000 1. Para X = 1, uma sequência do tipo: 1000...0; 01000...0; 001000...0; será n sequência, cada uma com um único sucesso e n sequência, cada uma com um único sucesso e n-1 fracassos: 2. Para X = x, tem-se x sucessos e (n-x) fracassos, correspondendo às sequências com x algarismos 1 e n-x zeros. Cada sequência terá probabilidade e como há sequências distintas, tem-se: Média: 20 Variância: 5.3 Distribuição de Poisson Consideremos a probabilidade de ocorrência de sucessos em um determinado intervalo. A probabilidade da ocorrência de um sucesso no intervalo é proporcional ao intervalo. A probabilidade de mais de um sucesso nesse intervalo é bastante pequena em relação à probabilidade de um sucesso. Seja X o número de sucessos no intervalo; temos, então: A distribuição de Poisson é muito usada na distribuição do número de: • Carros que passam por um cruzamento por minuto, durante certa hora do dia; • Erros tipográficos por página, em um material impresso; • Defeitos por unidade (m³, m², m, etc.) por peça fabricada; • Problemas de filas de espera em geral, e outros. Média: Variância: OBS: Muitas vezes, no uso da binomial, acontece que n é muito grande e p é muito pequeno. Podemos, então, fazer uma aproximação de binomial pela distribuição de 21 Poisson, da seguinte forma: Fonte:.abril.com.br 5.4 Distribuição Geométrica Consideremos tentativas sucessivas e independentes de uma mesmo experimento aleatório. Cada tentativa admite sucesso com probabilidade p e fracasso com probabilidade q; p + q = 1. Seja X: número de tentativas necessárias ao aparecimento do primeiro sucesso. Logo, X assumem os valores: X = 1, que corresponde ao sucesso (S) e P (X = 1) = p; X = 2, que corresponde ao fracasso (F) na 1ª tentativa e sucesso na segunda, (FS) e P (X = 2) = P (F ∩ S) = q∙p; X = 3, que corresponde a (FFS) e P (X = 3) = P (F ∩ F ∩ S) = q ∙ q ∙ p = ; X = 4, que corresponde a (FFFS) e P (X = 4) = E assim sucessivamente. 22 X = x, que corresponde a FF ... FS = x, com função de probabilidade: A variável X tem então distribuição geométrica. Média: Variância: 5.5 Distribuição Uniforme É a mais simples de todas as distribuições discretas de probabilidade. É aquela na qual a v.a. assume todos os seus valores com a mesma probabilidade. Tal distribuição é chamada distribuição uniforme. A distribuição discreta uniforme é dada por: P (x,k) = 1/k = P(X = x) Onde x é um dos possíveis valores da v.a. X. Utilizamos aqui P (x,k) ao invés de p(x) para indicar que a distribuição uniforme depende do parâmetro k. Este é o caso mais simples de v.a. discreta, onde cada possível valor ocorre com a mesma probabilidade. Definição: A variável aleatória discreta X, assumindo os valores x1,x2, ..., xn , tem distribuição uniforme , se e somente se, , para todo i = 1, 2, ..., n. 5.6 Distribuição Hipergeométrica Consideremos uma população com N elementos, dos quais r tem uma determinada característica (a retirada de um desses elementos corresponde ao sucesso). Retiramos dessa população, sem reposição, uma amostra de tamanho n. Seja X: número de sucessos na amostra (saída do elemento com a característica). 23 Para sabermos a função de probabilidade, consideramos que podemos tirar amostras sem reposição. Os sucessos na amostra podem ocorrer com maneiras e fracassos de modos. Logo: , . A variável X assim definida tem distribuição hipergeométrica. Média: E (X) = np Variância: Var (X) = Np (1 – p) , onde . 6 VARIÁVEIS ALEATÓRIAS CONTÍNUAS Definição: Variável aleatória contínua é uma variável aleatória X é contínua em R se existir uma função f(x), tal que: f(x) ≥ 0 (não negativa); . A função f(x) é chamada função densidade de probabilidade (f.d.p.). Observamos que: (Corresponde à área delimitada pela função f (x), eixo dos X e pelas retas X = a e X = b). Podemos estender todas as definições de variáveis aleatórias discretas para variáveis contínuas. Se X é uma variável aleatória contínua, então temos a média e a variância sendo: A média pode ser entendida como um “centro de distribuição de probabilidades”. E sua variância é dada por: 24 , onde Fonte: gpp.pt 6.1 Distribuição de variáveis aleatórias discretas: Distribuições contínuas são muito distintas das distribuições discretas. Nas distribuições discretas, as massas de probabilidade estão concentradas nos pontos de um conjunto enumerável. Assim, seja o experimento aleatório E com espaço amostral S e y uma variável aleatória com domínio S e imagem Sy. A distribuição de probabilidade de y é uma distribuição contínua se: P (y = w) = 0 para cada w ∈ Sy Ademais, se cada ponto tem probabilidade 0 então P (A) =0 sendo A qualquer subconjunto enumerável de Sy. A definição pode parecer paradoxal, mas, conceitualmente, é o mesmo que considerar, por exemplo, um intervalo não degenerado de números reais e cada ponto desse intervalo. O intervalo tem medida (comprimento) positiva enquanto que cada ponto tem medida (comprimento) nula. Como já enfatizado, as distribuições contínuas estão em total contraste com as distribuições discretas. Nas distribuições contínuas, a massa de probabilidade se dispersa continuamente sobre Sy enquanto que nas discretas ela 25 se concentra nos pontos de massa. A figura abaixo ilustra a continuidade do espaço amostral e um evento desse espaço. 6.2 Distribuição Uniforme: Uma variável aleatória contínua X tem distribuição uniforme de probabilidades no intervalo [a,b] se sua f.d.p é dada por: Onde o valor de k é: Logo: A função de distribuição de X é dada por: Logo: 26 f(x) = E seu gráfico é: 6.3 A média de X é dada por: E (X) = A Variância de X é dada por: VAR (X) = 6.4 Distribuição Exponencial A distribuição exponencial é aplicada a dados com forte assimetria. Também é um caso especial da distribuição gama com λ= 1. Uma variável aleatória contínua X tem distribuição exponencial de probabilidade se sua f.d.p é dada por: O gráfico da f.d.p de X é: 27 A função de distribuição de X é: Logo: E o gráfico é: A média da distribuição de X é dada por: E (x) = A Variância de X é dada por: VAR(X) = 6.5 Distribuição Normal É uma distribuição de probabilidade contínua, que é simétrica e a curva de frequência em a forma de um sino, a média fica no centro da distribuição e o desvio padrão representa a forma da curva, mais pontiaguda ou mais achatada. Uma variável aleatória contínua X tem distribuição normal de probabilidade se a sua f.d.p é dada por: O gráfico de f(x) é: 28 As principais características dessa função são: O ponto máximo de f(x) é o ponto X = . Os pontos de inflexão da função são X = . A curva é simétrica com relação a E (X) = e VAR (X) = Demonstra-se que Se quisermos calcular a probabilidade indicada na figura, devemos fazer: , que representa um grau relativo de dificuldade. Usaremos a seguinte notação: X: N( X tem distribuição normal com média e variância Seja X: N( , definimos: Z= Demonstra-se que Z também tem distribuição normal. Z é chamada de Variável Normal Reduzida, Normal Padronizada ou Variável Normalizada. Mostraremos que E (Z) = 0 e VAR (Z) = 1 E (Z) = E = E(X- ) = = 0 29 VAR (Z) = VAR = VAR(X- ) = = 1 Logo, se: X: N( , teremos Z : N(0,1) A f.d.p de Z é Essa curva é também simétrica com relação à . Verificaremos agora a correspondência entre X e Z por meio de exemplo: Seja X: N (20,4). Achar os valores reduzidos correspondentes a = 14, = 16, = 18, = 20, = 22, = 24 e = 26. Se X: N(20,4) Z = = = 14 = -3 = 16 = -2 = 18 = -1 = 20 = 0 = 22 = 1 = 24 = 2 = 26 = 3 30 Graficamente: Concluímos que a variável Z indica quantos desvios padrões a variável X está afastada da média. Como as curvas são simétricas em relação às médias. Também concluímos que se X: N( , então : 31 Pois: = E = Onde = e = 6.6 Distribuição do tipo Gama Por ser um caso geral da distribuição exponencial e da distribuição qui- quadrado, a distribuição gama, à semelhança da distribuição normal, tem grande importância tanto na teoria estatística (como distribuição de probabilidade de estatísticas) quanto nas aplicações da metodologia estatística (como distribuição associada a populações estatísticas), fornecendo uma representação útil para muitas situações físicas. Como a soma de variáveis exponenciais independentes tem distribuição gama, torna-se adequada para a teoria dos contadores aleatórios e outros processos estocásticos associados com o tempo, em particular, aqueles 32 relativos às precipitações meteorológicas e aos estudos envolvendo tempos de vida de componentes. Fonte: gti.projetointegrador.com.br A distribuição gama é apropriada para modelar o tempo requerido para o acontecimento de exatamente α eventos independentes que ocorrem a uma taxa constante λ. Por exemplo, o tempo para falha de um sistema é uma variável gama se essa falha ocorre após exatamente α falhas menores, ocorrem independentemente a uma taxa constante λ. Essa característica torna a distribuição gama importante na modelagem estatística de problemas de fila, que trata com tempos em linhas de espera e tempos de serviço. Observa-se também que α e λ são parâmetros importantes no contexto. A distribuição gama é o caso geral de distribuições importantes, mas, ela própria, é um caso particular de outras famílias de distribuições. Mais especificamente, ela pertence à família exponencial ao tipo III da família personiana de distribuições e é também denominado como distribuição de Pearson tipo III. Em estudos hidrológicos é prática comum a utilização dessa distribuição para modelar o logaritmo da variável. Nesse caso, recebe o nome log-Pearson tipo III. 33 A distribuição gama, na sua forma mais geral, possui três parâmetros: um parâmetro de deslocamento θ, um parâmetro de dispersão β e um parâmetro de formato β, todos positivos. Nesse caso, a indicação é: y ~ Gama (θ, β, α) A figura abaixo ilustra a distribuição para α = 2, β = 1 e θ = (0, 2, 4). A distribuição é nula no parâmetro de deslocamento e tem um único ponto de máximo em w = θ + β(α - 1). No caso de um parâmetro a moda ocorre em w = α - 1, com α ≥ 1. A distribuição gama pertence à família localização-dispersão. Desse modo, fazendo x = y - θβ , então: x ~ Gama (α) é a forma padrão da distribuição gama e resta apenas o parâmetro de formato. Se α ≤ 1 a distribuição tem o formato de um J invertido, ou seja, cresce indefinidamente quando w→0 e decresce mono tonicamente quando w → ∞. A figura que segue ilustra a forma padrão (θ = 0 e β = 1) para α = 1/3, 1/2, 1, 2, 4, 6. 34 Outra forma comum inclui os parâmetros de dispersão e formato, ou seja, θ=0. Nesse caso, a distribuição é representada como: y ~ Gama (α , β) A figura que segue ilustra a distribuição gama com α = 2 e β = 2, 4, 6. Em algumas situações, ao invés do parâmetro de dispersão β, é utilizado o parâmetro de taxa λ=1/β. Função de probabilidade: Média: 35 Variância: 6.7 Distribuição do tipo Qui-Quadrado A distribuição qui-quadrado é uma distribuição contínua de grande importância para a inferência estatística. É uma distribuição que surge no contexto de somas de quadrados de variáveis aleatórias com distribuição normal. Uma variável qui-quadrado aparece em numerosas situações da inferência estatística: Fonte: www.ime.unicamp.br - Análise de tabelas de contingência. - Verificação da qualidade de ajustamento de modelos estatísticos e modelos probabilísticos aos dados estatísticos. - Serve como base para obtenção de outras distribuições relevantes da estatística clássica, como a distribuição F e a distribuição t. - Aproximação para muitos procedimentos de inferência na estatística não paramétrica. Uma variável qui-quadrado é a soma das variáveis aleatórias independentes com a distribuição normal padrão. Assim, a função de densidade da distribuição qui-quadrado pode ser obtida considerando-se a distribuição de q = z2, quando z ~ N (0,1), ou seja, quando z tem distribuição normal padrão. Posteriormente, pode-se considerar a distribuição de q = z12+z22 quando , j∈1:2 e, finalmente, quando 36 quando N(0,1), j∈1: ν Nesse caso, diz-se que q tem distribuição qui-quadrado com ν graus de liberdade e representa-se como: q ~ χ2(ν) Função probabilidade quando α = υ/2 e β = 2, com v > 0 inteiro: Média: E (q) = ν Variância:2 7 DISTRIBUIÇÕES DE PROBABILIDADES CONTÍNUAS E DISCRETAS As distribuições de probabilidade podem ser distribuições de probabilidades contínuas ou distribuições de probabilidade discretas, dependendo se eles definem probabilidades para variáveis contínuas ou discretas. 7.1 O que é a distribuição contínua? A distribuição contínua descreve as probabilidades dos possíveis valores de uma variável aleatória contínua. Uma variável aleatória contínua é uma variável aleatória com um conjunto de valores possíveis (conhecidos como a intervalos) que é infinito e incontável. As probabilidades de variáveis aleatórias contínuas (X) são definidas como a área sob a curva da sua distribuição. Assim, apenas as faixas de valores podem ter 2 Texto de: Max Vinnicius Medeiros Dias. Extraído: www.ebah.com.br 37 uma probabilidade diferente de zero. A probabilidade de que uma variável aleatória contínua seja igual a algum valor é sempre zero. 7.2 Exemplo da distribuição de pesos A distribuição normal contínua pode descrever a distribuição de peso de indivíduos do sexo masculino adultos. Por exemplo, você pode calcular a probabilidade de que um homem pesa entre 160 e 170 libras. Gráfico da distribuição do peso de adultos do sexo masculino A região sombreada sob a curva, neste exemplo, representa o intervalo entre 160 e 170 libras. A área deste intervalo é 0,136; por conseguinte,a probabilidade de um homem selecionado aleatoriamente pesar entre 160 e 170 libras é de 13,6%. Toda a área sob a curva equivale a 1,0. No entanto, a probabilidade de que X seja exatamente igual a algum valor é sempre zero porque a área sob a curva em um único ponto, que não tem nenhuma largura, é zero. Por exemplo, a probabilidade de um homem pesar exatamente 190 libras para a precisão infinita é zero. É possível calcular uma probabilidade não nula de que um homem pese mais do que 190 libras, ou menos do que 190 libras, ou entre 189,9 e 190,1 libras, mas a probabilidade de que ele pesa exatamente 190 libras é zero. 38 7.3 O que é a distribuição discreta? Uma distribuição discreta descreve a probabilidade de ocorrência de cada valor de uma variável aleatória discreta. Uma variável aleatória discreta é uma variável aleatória que tem valores contáveis, como uma lista de inteiros não negativos. Com uma distribuição de probabilidade discreta, cada valor possível da variável aleatória discreta pode ser associado a uma probabilidade diferente de zero. Deste modo, uma distribuição de probabilidade discreta é, por vezes, apresentada em forma de tabela. Fonte: engproducaoconceitual.blogspot.com 7.4 Exemplo do número de reclamações de clientes Com uma distribuição discreta, ao contrário de uma distribuição contínua, é possível calcular a probabilidade de que X é exatamente igual a algum valor. Por exemplo, você pode usar a distribuição discreta de Poisson para descrever o número de reclamações de clientes em um dia. Suponha que o número médio de reclamações por dia seja de 10 e você queira saber a probabilidade de receber 5, 10 e 15 reclamações de clientes em um dia. 39 x P (X = x) 5 0,037833 10 0,12511 15 0,034718 Também é possível visualizar uma distribuição discreta em um gráfico de distribuição para ver as probabilidades entre intervalos. Gráfico de distribuição enredo do número de reclamações de clientes A barra sombreada neste exemplo representa o número de ocorrências quando as reclamações de clientes diárias forem 15 ou mais. As alturas das barras somam 0,08346; por conseguinte, a probabilidade de que o número de chamadas por dia seja de 15 ou mais é 8,35%.3 3 Texto extraído: www.support.minitab.com 40 8 REGRESSÃO E CORRELAÇÃO 8.1 Correlação É o estudo do grau de associação entre variáveis. Na correlação interessa observar se duas ou mais variáveis são independentes ou variam juntas. - Tamanho do braço ou tamanho da perna em uma população de mamíferos. - Conteúdo de colesterol no sangue e peso de pessoas de mesma idade e sexo. - Estatura dos pais e estatura dos filhos de pessoas de mesma raça. - Renda e consumo por faixa de salário. - Preço e Demanda. - Produção agrícola e fertilizante, etc., Como o objetivo da análise de correlação é medir a intensidade de relação entre as variáveis, devemos estar atentos aos princípios desta relação. Nas correlações supostamente lógicas, as relações causais se compreendem claramente. Nas chamadas correlações ilusórias não se encontra nenhuma conexão razoável entre as variáveis. Assim o tamanho de uma população de insetos pode estar correlacionado com a altura de algum tipo de erva ou, pode ser simplesmente uma função do tempo. Pode não haver relação ecológica entre as plantas e os insetos. A população de insetos pode depender de outras variáveis que não necessariamente a altura das ervas. Tipos de Correlação: Correlação Simples – quando se estuda o grau de relação entre duas variáveis, sendo uma dependente (Yi) e outra independente (Xi). Correlação Múltipla – quando se estuda o grau de relação simultânea entre a variável dependente e duas ou mais variáveis independentes. 41 Correlação Parcial – no caso de uma relação múltipla, quando se estuda a relação pura entre duas variáveis, depois de eliminada estatisticamente a influência de outras variáveis independentes. 8.2 Correlação linear Investiga a existência de associação entre duas variáveis, isto é, o grau de inter-relacionamento entre a variável dependente e a independente. Porém devemos ficar atentos que a correlação linear simplesmente comprova uma variação concomitante entre duas variáveis, não significando, a priori, que uma é causa da outra, visto que muitas outras variáveis, não consideradas no estudo, podem afetar o comportamento da variável dependente. De acordo com a relação entre as variáveis esta correlação pode ser: Direta ou Positiva – quando a variável dependente está diretamente relacionada com a variável independente. Ex.: Renda e Consumo. Indireta ou Negativa – quando a variável dependente tem relação inversamente proporcionalmente com a variável independente. Ex.: Preço e Demanda. Nula – quando não há inter-relação entre as variáveis. O diagrama de dispersão indica a forma da relação entre as variáveis estudadas e proporciona uma ideia sobre as funções de regressão a serem utilizadas. A depender da relação entre as variáveis, os pontos observados, às vezes, se encontram, relativamente, próximos da linha de regressão e em outras situações bastante disseminados em torno dela. 42 Para melhor quantificar está “aproximação” é necessário determinar um coeficiente de correlação entre as variáveis. Porém não devemos interpretar a palavra “correlação” como a que quantifica uma relação de causa (Ex: emissão do Banco Central) e efeito (Ex: índice de preços ao consumidor). O valor obtido assinala unicamente uma relação funcional em determinado conjunto de dados. 8.3 Medidas de correlação Coeficiente de Correlação (r) é a medida estatística que dimensiona o grau de relação entre duas ou mais variáveis. O coeficiente de correlação, também, pode ser calculado através do estudo das variâncias. A variância total (σt 2) é a soma da variância explicada (σe 2) mais a variância residual (σr 2), isto é: σt 2 = σe 2 + σr 2. Dividindo ambos os membros da equação pela variância total temos: 1 = σe 2 /σt 2 + σr 2 /σt 2. A razão σr 2 /σt 2 corresponde ao coeficiente de alienação (k2) e mede o grau de afastamento entre as variáveis, enquanto que σe 2 /σt 2 mede o grau de aproximação existente entre as variáveis, sendo conhecido por coeficiente de determinação (r2). Neste caso podemos encontrar o coeficiente de correlação a partir do coeficiente de determinação, isto é: 1 = r2 +K2 ⇒ r2 = 1 – k2 ⇒ r = √1 – k2. Existindo uma perfeita relação entre as variáveis o coeficiente de determinação (r2) é igual a um (1), enquanto o de alienação é zero. O coeficiente de correlação pode, no máximo, ser igual a ± 1. Isto é: √1 – k2 ⇒ r = √1 – 0 ⇒ r = ± 1, compreendendo valores no intervalo: – 1 ≤ r ≤ 1. Para: r =1 ou r = –1 ⇒ perfeita correlação positiva ou negativa. 43 Para: r = 0,5 ou r = – 0,5 ⇒ regular correlação positiva ou negativa. A medida que o valor de r se aproxima de 1 ou de –1 a correlação entre as variáveis vai se tornando forte. Quando r tende para “zero” a correlação passa a ser fraca. Quando r = 0 não existe a correlação procurada (correlação nula), podendo, no entanto, existir outro tipo de correlação, razão pela qual devemos ser bastante cautelosos quando afirmarmos da inexistência de correlação entre variáveis. Equação de Regressão da variável dependente (função linear). Exemplo: calcular o coeficiente de correlação entre altura (Xi ) e peso (Yi ) de uma amostra de 10 estudantes universitários. Estimar o peso de um estudante com 196 cm de altura. 44 Coeficientes de Correlação Equação de Regressão Peso esperado para um estudante com 196 cm de altura. Ýi = – 69,4 + 0,88 (196) ⇒ Ýi ≅ 90kg Avaliação da Estimativa Variância Total: st 2 =18,9333 Variância Residual: sr 2= 4,4733 Variância Explicada:se 2= 14,4600 Coeficiente de Variação Residual: Cr = 3,05% Coeficiente de Determinação: r2 ≅ 0,7744 ≅ 77,44 8.4 Regressão É o estudo do comportamento de uma variável dependente (Yi) em função da variação de uma ou mais variáveis independentes (Xi, Zi, Wi, ...) supondo que estas variáveis estão numa relação de causa e efeito. Regressão Linear: A relação funcional entre as variáveis implica na possibilidade de estimar o valor de uma 45 variável, dado o valor da outra, de acordo a função matemática que apresente melhor aderência aos dados observados. Convém, porém, observar que em algumas situações, as relações entre as variáveis podem não estar sujeita a uma relação de causa e efeito. Por uma simples relação acidental ambas podem ser função de uma causa comum que as afeta. Isto, porém, não tira a importância que tem a regressão no estudo do relacionamento entre variáveis. Fonte: mazeberry.com É preciso apenas cuidado e nos casos mais difíceis de identificação da relação, pode-se optar por uma regressão múltipla, para maior segurança de análise e das projeções a serem efetuadas. Na regressão a variável independente (Xi) se mede sem erro. Ela não varia ao acaso, está sempre ao controle do investigador. Somente a variável dependente (Yi) é que é aleatória, e está sujeita a pequenas variações (afastamentos) a depender do grau de relação entre as variáveis e do modelo de regressão utilizado. Assim a dosagem de certo tipo de droga (Xi) aplicada em pacientes, está sobre o controle do pesquisador, porém a pressão sanguínea (Yi) é aleatória, dependendo, portanto, da relação causa-efeito entre as variáveis. A determinação de uma equação de ajuste depende do comportamento dos dados, inicialmente observados pelo diagrama de dispersão entre as variáveis, com conclusão assegurada pelo “critério dos mínimos quadrados” que indica como 46 melhor função ajustaste aquela que minimiza a soma dos quadrados das diferenças entre os valores observados (Yi) e os estimados (Ýi) pelas respectivas funções: ∑ (Yi – Ýi) 2 = mínimo. Isto é, quanto menor a variância residual, melhor a equação ajustaste. Na regressão ente duas variáveis as principais relações a serem estudadas são: Yi = a + bXi; Yi ⇒ a. bXi; Yi ⇒ a + bXi + c Xi 2; Yi ⇒ a. Xi b etc. Uma vez especificada a forma de relação entre as variáveis, deve-se estimar os coeficientes da função, obtendo assim a equação de Regressão. Para isto é preciso ter informações acumuladas (mínimo de 10 itens) das variáveis estudadas para se descobrir a tendência de seu comportamento (regularidade); e, dessa forma, escolher qual dos modelos existentes de regressão é o mais apropriado. Algumas funções ajustastes podem ser identificadas pelas diferenças entre os valores observados da variável dependente. Se as primeiras diferenças: (Y2 – Y1 ); (Y3 – Y2 ); ... ;(Yn – Yn-1) forem mais ou menos constantes, dizemos que a variável se ajusta a uma reta. No caso das segundas diferenças se apresentarem mais ou menos constantes, a variável se ajusta a uma parábola do segundo grau. O diagrama de dispersão também nos fornece boa orientação do tipo de função que melhor se ajusta aos dados. Porém, a decisão final, quanto à melhor função ajustaste depende do coeficiente de variação residual e/ou do coeficiente de determinação, visto que a medida de aderência é representada pela minimização dos resíduos entre os valores observados e os estimados pela função de regressão. Conhecida a equação ajustaste e reconhecida a sua máxima aderência, isto é: menor variância residual podemos fazer previsões do comportamento da variável dependente para os próximos períodos da série estudada. Mesmo assim é preciso muita cautela, tendo em vista a multiplicidade de fatores que podem influir nos resultados obtidos pela regressão. Por exemplo: a produção agrícola não depende apenas da pluviometria, outros fatores como: qualidade das sementes, esgotamento do solo, fertilizantes, etc., podem influir decisivamente no volume de produção, fatos que na realidade desprezamos quando aplicamos a regressão linear. 47 Tais advertências, no entanto, não invalidam as relações de dependência entre duas variáveis, mas simplesmente chamam nossa atenção para os cuidados que devemos ter com as estimativas. Consideremos a representação gráfica do diagrama de dispersão. Como os desvios di podem ser positivos ou negativos caso estejam os pontos observados, respectivamente, acima ou abaixo da função ajustaste consideram-se então os quadrados de di para cálculo do afastamento médio, neste caso representado pelo desvio padrão residual. Note-se que a função ajustaste quase nunca contém os dados observados, mas deve representar com grande aproximação, o conjunto desses pontos, isto é, deve representar o comportamento da série observada. Para termos uma boa regressão é importante levarmos em conta as seguintes considerações: 1. Quanto maior o número de observações, tanto melhor será a estimativa obtida. 2. Os métodos de ajustamento são válidos para dados isentos de tendenciosidade. 3. Escolher sempre a melhor função ajustaste de acordo com os critérios já estabelecidos, pelo método dos mínimos quadrados, onde: ∑ (Yi – Ýi) 2 é mínimo. 48 Regressão da linha reta ⇒ Yi = α + β Xi É indicada quando a representação dos pontos observados em um diagrama de dispersão apresenta uma seqüência retilínea. Para determinar os coeficientes “a” e “b” recorre-se ao método dos mínimos quadrados ∑ (Yi – Ýi) 2 = mínimo. Sendo: Yi = valor observado; Ýi = valor estimado pela equação de regressão. Substituindo Ýi (por a + bXi) na equação ∑ (Yi – Ýi) 2 = mínimo e derivando parcialmente a equação em relação aos coeficientes “a” e “b” encontramos um sistema de equações, que nos permite estimar os coeficientes da equação de regressão. Para que Z seja mínimo as derivadas parciais devem ser iguais a zero. Exemplo: consideremos os dados relativos a quantidade de fertilizante utilizada (Xi) e a produção obtida (Yi) de soja em determinado município, conforme tabela a seguir: Para termos uma ideia inicial do modelo de regressão a ser utilizado, elaboramos o diagrama de dispersão das variáveis. Pela tendência apresentada vamos trabalhar uma função linear, cujos coeficientes podem ser obtidos pelas equações normais ou pelos desvios reduzidos das respectivas variáveis. 49 50 A função linear Ýi = 32,86 + 0,068Xi - fornece a relação entre a produção obtida (Yi) e a quantidade de fertilizante empregada (Xi). Este modelo pode ser utilizado para estimar a variável dependente de acordo com o comportamento da variável independente. Isto é, admitindo a utilização de 800 kg de fertilizante por ha a produção esperada de soja é de 87 toneladas. Para melhor avaliar se as equações ajustam-te encontrada é a opção mais adequada, devemos calcular a o erro de estimativa por intermédio do desvio padrão residual e comparar com a de outros modelos de regressão. A função que apresentar menor erro de estimativa, isto é: menor Coeficiente de Variação Residual é a melhor opção. Variância residual: é calculada entre os valores observados e estimados da variável dependente, para um mesmo período. A raiz quadrada deste valor representa o Erro Padrão de estimativa ou Desvio Padrão Residual. Coeficiente de Variação Residual Cr = sr / Y Variância Explicada – é calculada entre os valores estimados da variável dependente e a média dos valores observados: Variância Total – é calculada entre os valores observados da variável dependente e sua respectiva média. A variância total é igual à variância explicada mais a variância residual. 51 Estas duas últimas variâncias fornecem condições para cálculo do coeficiente de determinação (r2) que pode comprovar a existência ou não deboa correlação e regressão entre as variáveis observadas. O coeficiente de determinação indica quantos por cento a variação explicada pela regressão representa da variação total. Isto é, este coeficiente indica o grau de explicação do modelo proposto, onde: 0 ≤ r2 ≤ 1. No caso em que r2 = 1, todos os pontos observados se situam “exatamente” sobre a reta de regressão. Diremos então que o ajuste é perfeito, isto é, as variações de Yi são 100% explicadas pelas variações de Xi, não havendo, portanto desvios em torno da função estimada. Por outro lado, se r2 = 0, concluiremos que as variações de Yi são exclusivamente aleatórias, isto é: a variável Xi não tem nenhuma participação sobre as variações de Yi. Exemplo: Ajustar a Função Linear ao consumo residencial de energia elétrica no Estado de Sergipe (1987 – 96) e projetar este consumo para 1997, 1998 e 1999. 52 Coeficientes da Reta Estimativa do consumo residual de energia elétrica. Ý97 = 463 (1000 Mwh); Ý98 = 488 (1000 Mwh) e Ý99 = 512 (1000Mwh). Uma característica a ser observada nas estimativas é que a soma dos valores ajustados sempre é igual à soma dos valores observados: ∑Ýi = ∑Yi. Avaliação das Estimativas - Variância Residual: sr 2 = ∑ (Yi – Ýi) 2 / (n – 1) = 5652/9 = 628,00 - Desvio Padrão Residual: = sr = 25,0599 53 - Coeficiente de Variação Residual (erro de estimativa): Cr = sr / Y Cr = 25,0599/9 = 7,64% - Variância Total: st 2= ∑ (Yi – Yi) 2 / (n – 1) = 55215,60/9 ⇒ st 2 = 6135,07 - Variância Explicada: se 2 = 5.507,07 - Coeficiente de Determinação: r2 = se 2 /st 2 ⇒ r2 = 0,8976 = 89,76%4 Fonte: luteranos.com.br 9 TEORIA DA ESTIMAÇÃO Um dos métodos para realizar inferências a respeito dos parâmetros é a estimação, que determina estimativas dos parâmetros populacionais. Consiste em utilizar dados amostrais para estimar (ou prever) os valores de parâmetros populacionais desconhecidos, tais como média, desvio padrão, proporções, etc. Existem dois tipos de estimação de um parâmetro populacional: estimação por ponto e a estimação por intervalo. 4 Texto extraído: www.cesadufs.com.br http://www.luteranos.com.br/ 54 9.1 Estimação por ponto É a estimativa de um parâmetro populacional dada por um único número. A partir das observações, usando o estimador, procura-se encontrar um valor numérico único (estimativa) que esteja bastante próximo do verdadeiro valor do parâmetro. Este procedimento não permite julgar a magnitude do erro que podemos estar cometendo, mas a distribuição por amostragem dos estimadores torna possível o estudo das qualidades do estimador. Na estimativa pontual, raramente os estimadores estatísticos coincidem com os valores populacionais. Assim, é importante delimitar a faixa de valores onde o parâmetro populacional deve ser procurado. Isso ocorre através das estimativas intervalares. Estimadores pontuais dos principais parâmetros populacionais: 9.2 Estimação por intervalo Essa estimativa consiste em uma amplitude (ou um intervalo) de valores, no qual se admite esteja o parâmetro populacional. 55 Procura determinar um intervalo que contenha o valor do parâmetro populacional, com certa margem de segurança. Este procedimento permite julgar a magnitude do erro que podemos estar cometendo. 9.3 Intervalo de Confiança Quando se constrói um intervalo de confiança são determinados dois limites entre os quais se espera estar o parâmetro da população, de acordo com um risco conhecido de erro (ou nível de confiança). As informações sobre a precisão de uma estimativa de intervalo são transmitidas pela sua extensão. Se o nível de confiança for alto e o intervalo resultante, bastante restrito, o conhecimento do valor do parâmetro será razoavelmente preciso. Um intervalo de confiança muito amplo passa a ideia de que há muita incerteza com relação ao valor que estamos estimando. Com base na amostra, uma maneira de expressar a precisão da estimação é calcular os limites de um intervalo, o Intervalo de Confiança (IC), tais que (1 – α) seja a probabilidade de que o verdadeiro valor do parâmetro esteja contido nele. Portanto: α = grau de desconfiança, nível de incerteza ou nível de significância. 1-α = coeficiente de confiança ou nível de confiabilidade; Os valores de α mais utilizados são: α = 0,10 →(1 – α) = 0,90 ou 90% α = 0,05 →(1 – α) = 0,95 ou 95% α = 0,01 →(1 – α) = 0,99 ou 99% Estima-se que o verdadeiro valor do parâmetro estará contido em (1 – α). Algumas estimativas intervalares incluem e outras não incluem o verdadeiro valor do parâmetro da população. Ao se retirar uma amostra e calcular um intervalo de confiança não se sabe, na verdade, se o parâmetro da população se encontra naquele intervalo calculado. O importante é saber que se está utilizando um método com (1 – α) de probabilidade de sucesso. 56 9.4 Intervalo de confiança para a média quando a variância é conhecida Utiliza-se quando por quantidade de medidas ou por conhecimento histórico do processo de medida, o valor do desvio padrão está perfeitamente estabelecido de modo que o mesmo pode ser considerado como desvio padrão da população. Para grandes amostras, utiliza-se a seguinte fórmula: Para populações finitas, utiliza-se a seguinte fórmula: Intervalo de confiança para a proporção (grandes amostras) Para populações finitas o IC será:5 5 Texto de: Professor Alexandre. Extraído: www.alexandreprofessor.blogspot.com 57 10 NOÇÕES DE AMOSTRAGEM 10.1 MOTIVAÇÃO Raramente se consegue obter a distribuição exata de alguma variável, ou porque isso é muito dispendioso, ou muito demorado ou às vezes porque consiste num processo destrutivo. Conceitos preliminares ● População: Conjunto dos elementos a serem estudados ● Amostra: Subconjunto da população ● Amostragem: Processos de obtenção de uma amostra a partir de uma população 10.2 Métodos de Amostragem A amostragem será probabilística se todos os elementos da população tiverem probabilidade conhecida, e diferente de zero, de pertencer à amostra. Caso contrário, a amostragem será não-probabilística Métodos Probabilísticos ● Aleatória Simples; ● Sistemática; ●. Estratificada; ● Áreas ● Conglomerados; A grande vantagem deste método é que os resultados obtidos na pesquisa podem ser projetados para a população total. Amostragem Aleatória Simples Dado um conjunto, enumeramos seus elementos e realizamos um sorteio, os elementos sorteados constituirão nossa amostra. Podem ser com ou sem repetição dos elementos. 58 10.3 Amostragem Aleatória Simples Procedimentos: 1. Enumerar os N elementos da população; 2. Sortear, sem reposição, n números compreendidos entre 1 a N; 3. Os elementos correspondentes aos números escolhidos formarão a amostra de n elementos. 10.4 Amostragem Sistemática Dado um conjunto de elementos ordenados retiramos periodicamente um elemento para a amostra. (Não recomendada para eventos sazonais) Ex.: Linhas de montagem. 1. Definir a quantidade de elementos da amostra 2. Obter um intervalo de amostragem K 3. Sortear um número r inteiro entre 1 e K. 4. A amostra será composta pelos elementos na ordem: (r, r + k, r + 2k …) 10.5 Amostragem Estratificada Quando uma população pode ser dividida em subgrupos (estratos) que são mais ou menos homogêneos. Após a determinação dos estratos, seleciona-se uma amostra aleatória simples de cada estrato. 59 1. Amostragem Estratificada Proporcional: A proporcionalidade do tamanho de cada estrato da população é mantida na amostra. 2. Amostragem Estratificada Uniforme: Selecionamos o mesmo número de elementos em cada estrato. É o processo usual quando se deseja comparar os diversos estratos. Procedimentos:1. Dividir a população em L subpopulações chamadas estratos. 2. Calcular a fração f da amostragem dada por f = n/N 3. Calcular o número de elementos a serem sorteados em cada estrato n1 = N1. f 4. Realizar a amostragem aleatória simples dentro de cada estrato Amostragem por Áreas A população é dividida em áreas, a partir das áreas coletaremos as amostras. 10.6 Amostragem por Conglomerados A população é dividida em conglomerados, onde cada conglomerado é representativo da população. Selecionamos aleatoriamente um conjunto de conglomerados e a amostra é constituída por todos os elementos dos conglomerados selecionados. Quanto mais heterogeneidade melhor. Suponha que se pretende estudar o nível de satisfação dos trabalhadores têxteis, das empresas do Norte do País. Método AAS nos conglomerados. Procedimentos: 1. Há vários estágios de seleção até atingirmos a população desejada para o estudo; 60 2. Em cada estágio utiliza-se um tipo de seleção probabilística. (Normalmente AAS); Conglomerados v.s Estratificada A principal diferença entre a amostragem de conglomerados e a amostragem estratificada é a unidade de amostragem. ● Conglomerados: Todos os conglomerados existentes; (Todas as cidades, empresas, etc.) ●. Estratificada: Os elementos da população; Métodos não-probabilísticos ●. Acidental; ● Julgamento ou Intencional; ● Quotas; Generalização é cercada de cuidados! 10.7 Amostragem Acidental (Conveniência) Os elementos da amostra são escolhidos por serem os mais acessíveis ou fáceis de serem avaliados. Ex.: Pesquisas de opinião entre amigos 10.8 Amostragem Julgamento ou intencional Consiste na escolha dos elementos da amostra por um especialista no assunto, que seleciona os elementos que julga os mais apropriados e representativos para o estudo em questão.6 10.9 Amostragem por Quotas Análogo ao método de amostragem estratificada, porém sem a aleatoriedade das amostras. Normalmente escolhidos por conveniência. Ex.: Pesquisas de intenção de voto. 6 Texto extraído: www.nbcgib.uesc.br 61 1. Classificação da população em termos de propriedades que se sabe, ou presume, serem relevantes para a característica a ser estudada; 2. Determinação da proporção da população para cada característica, com base na constituição conhecida, presumida ou estimada, da população; 3. Fixação de cotas para cada entrevistador a quem tocará a responsabilidade de selecionar entrevistados, de modo que a amostra total observada ou entrevistada contenha a proporção de cada classe tal como determinada no segundo passo. Fonte: datalyzer.com.br 11 TESTES DE HIPÓTESES Em geral, intervalos de confiança são a forma mais informativa de apresentar os achados principais de um estudo. Contudo, algumas vezes existe um particular interesse em decidir sobre a verdade ou não de uma hipótese específica (se dois grupos têm a mesma média ou não, ou se o parâmetro populacional tem um valor em particular ou não). Os Testes de hipóteses fornecem-nos uma estrutura para que façamos isto. Veremos que intervalos de confiança e testes de hipóteses estão intimamente relacionados. http://www.datalyzer.com.br/ 62 Exemplo: Um pesquisador deseja responder a seguinte pergunta: Os pássaros migratórios engordam antes de migrar? Considere os dados coletados por um ornitologista sobre o uso de um determinado lugar para engorda por pássaros de uma certa espécie. Pode-se perguntar se em média estes pássaros engordam entre agosto e setembro. Somente 10 pássaros foram capturados e seu peso médio nas duas ocasiões foram 11.47 e 12.35 então o peso médio aumentou para esta amostra em particular. (Note que o mesmo conjunto de pássaros foram medidos ambas as vezes.) Podemos generalizar para o resto dos pássaros que não foram capturados? Será que esta diferença poderia ser devida simplesmente ao acaso? Em termos estatísticos queremos testar a hipótese nula ou de nulidade (H ) de que, em média, não existe mudança no peso dos pássaros. Assumiremos que os 10 pássaros foram uma amostra aleatória de todos os pássaros migradores daquela espécie e usaremos primeiramente o que aprendemos sobre intervalos de confiança para responder nossas perguntas. Primeiro vamos calcular as mudanças de peso (setembro-agosto): Seja a mudança média de peso na população. Então nossa hipótese nula H e a hipótese alternativa H podem ser escritas como segue: Um procedimento útil é calcular um intervalo de confiança para a média populacional , e verificar se o intervalo inclui 0 como um valor plausível. Alternativamente, pode-se proceder da seguinte forma: Denotando pôr as diferenças de peso e tem-se que e , então o erro padrão da diferença de peso média é 63 e um valor- de 2.262 é obtido da coluna e linha . Um intervalo de confiança de 95% para é portanto O intervalo não conte o valor 0, fornecendo evidências contra a hipótese nula. Podemos dizer que existem evidências significativas ( ) de que, em média, os pássaros da espécie estudada mudam de peso de Agosto para Setembro; ou que estamos 95% confiantes de que em média os pesos aumentam por um montante entre 0.12 e 1.64 gramas. Mas e o intervalo de 99%? Será que ele conteria o valor 0? Este intervalo seria mais amplo e então é mais provável que ele contenha 0. Se ele não incluir 0, isto indicaria uma evidência ainda mais forte contra . Calculando o intervalo de confiança exatamente da mesma forma, exceto que desta vez precisamos olhar na coluna para obter : Como esperado, este é mais amplo, e agora inclui o valor 0. Podemos agora dizer: “não existem evidências significativas ao nível de 1% de que, em média, os pássaros da espécie estudada mudam de peso de agosto para setembro. ” O que nós acabamos de fazer foi conduzir um teste perfeitamente válido para a hipótese nula usando intervalos de confiança. Podemos fazer o teste mais rapidamente e obter exatamente as mesmas conclusões pelo seguinte procedimento: Calcule (o número de erros padrão que dista de 0). Compare este valor de com aqueles na linha da tabela. 64 Para este exemplo, está entre os valores nas colunas e . Então nosso valor deve corresponder a um entre estes e portanto devemos ter . O valor de é interpretado como a probabilidade de observar um valor de mais extremo do que o observado quando . É uma medida análoga à proporção de pessoas sadias que são erroneamente diagnosticadas como doentes num exame de laboratório, ou seja, uma medida de falsos positivos.7 12 ANÁLISE DA VARIÂNCIA (ANOVA) Análise da Variância (ANOVA) é um método para testar a igualdade de três ou mais médias populacionais, baseado na análise das variâncias amostrais. Os dados amostrais são separados em grupos segundo uma característica (fator). Fator (ou tratamento): é uma característica que permite distinguir diferentes populações umas das outras. Cada fator contém dois ou mais grupos (classificações). Exemplos: (1) amostras do consumo de combustível para 3 tipos de carros, de fábricas (marcas) diferentes. Neste caso temos amostras de 3 populações de carros. Temos um único fator: A marca. Este fator se separa em 3 tratamentos, cada uma das marcas. (2) Amostras do consumo de combustível para 3 tamanhos de motor (1,5 L, 2,2 L e 2,5 L) e tipo de transmissão (manual ou automática). Temos dois fatores: - O fator tamanho do motor, que contém três categorias: 1,5 L, 2,2 L e 2,5 L. 7 Texto extraído: www.leg.ufpr.br 65 - O fator tipo de transmissão, que contém duas categorias: manual e automática. ANOVA de um critério (um fator) Suposições: Populações normalmente distribuída Populações tem mesma variância (ou mesmo desvio padrão). Amostrassão aleatórias e mutuamente independentes. As diferentes amostras são obtidas de populações classificadas em apenas uma categoria. O estatístico George E. P. Box mostrou que os resultados são confiáveis desde que os tamanhos das amostras são iguais (ou quase iguais), as diferenças entre as variâncias podem ser de tal ordem que a maior seja nove vezes a menor. Se a distribuições são fortemente não normais devemos utilizar outros métodos, por exemplo, o teste de Kruskal-Wallis. 12.1 Hipóteses do ANOVA de um critério Hipótese nula: a média de todas as populações são iguais, ou seja, o tratamento (fator) não tem efeito (nenhuma variação em média entre os grupos). Hipótese alternativa: nem todas a médias populacionais são iguais, ou seja: Pelo menos uma média é diferente, isto é, existe efeito do tratamento. Não quer dizer que todas as médias são diferentes (alguns pares podem ser iguais).8 8 Texto extraído: www.edisciplinas.usp.br 66 67 68 Fonte: edisciplinas.usp.br http://www.edisciplinas.usp.br/ 69 BIBLIOGRAFIA BONAFINI, F. C. (Org.). Estatística. 1ª ed. São Paulo SP.: Pearson, 2012. CASTANHEIRA, N. P. Estatística aplicada a todos os níveis. 1ª ed. Curitiba PR: Intersaberes, 2012. DAVILA, V. H. L. Estatística Descritiva. Disponível em http://www.ime.unicamp.br/~hlachos/estdescr1.pdf. Acesso em: 30 julho de 2018. SANTOS, V. F. M. Estatística descritiva básica e centralidade. Blog análise de dados. SILVA, L. P. M. Definições básicas de probabilidade. Mundo Educação. Distribuições de probabilidades contínuas e discretas. Disponível em <support.minitab.com/pt-br/minitab/18/help-and-how-to/probability-distributions- and-random-data/supporting-topics/basics/continuous-and-discrete-probability- distributions>. Acesso em: 30 julho de 2018. RODRIGUES, PEDRO CARVALHO. Bioestatística. Universidade Federal Fluminense. FONSECA, JAIRO DA. Curso de Estatística. Editora Atlas. OLIVEIRA, FRANCISCO ESTEVAM MARTINS DE. Estatística e Probabilidade. Editora Atlas. TANAKA. Elementos de Estatística. Editora McGraw.Hill. BARBETTA, PEDRO A. Estatística aplicada às Ciências Sociais. Editora da UFSC. GÓES, LUIZ A. C. Estatística I e II. Editora Saraiva. DÍAZ, FRANCISCA; LOPES, FRANCISCO JAVIER. Bioestatística. Editora Thomson. 70 FRAGOSO, Gustavo. Noções de Amostragem. Disponível em < http://nbcgib.uesc.br/lec/download/faria/cet756/apresentacoes/nocoes_amostrage m.pdf>. Acesso em: 30 de julho de 2018. MORETTIN, L. G. Estatística Básica: Probabilidade e Interferência. 1ª ed. São Paulo SP.: Pearson, 2010. Testes de Hipóteses. Disponível em: < http://leg.ufpr.br/~silvia/CE701/node51.html > Acesso em: 30 de julho de 2018. http://leg.ufpr.br/~silvia/CE701/node51.html
Compartilhar