Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 Estatística Prof. Antonio Estanislau Sanches 2014 / 1 2 Inferência Estatística 3 Inferência estatística é o conjunto de metodologia que apoiam na formulação de conclusões sobre as características de uma POPULAÇÃO a partir de uma parte dessa população, denominada de AMOSTRA. População ou Universo É a coleção de unidades individuais com uma ou mais características comuns, que se pretende estudar Exemplos Alunos de uma escola; Crianças de 0 à 5 anos de um orfanato; Agregados familiar de uma província; Carteiras dentro do campus da N Lins; Automóveis da cidade de Manaus. 4 Introdução à Amostragem Se uma população for muito grande, para estudá-la demandará muito trabalho e geralmente com resultados falhos. Recorre–se então, a uma AMOSTRA, sendo esta uma PARTE representativa da POPULAÇÃO em dimensões reduzidas, porém, com as mesmas características. Exemplo 1. Tendo uma escola 400 alunos, podemos colher uma amostra de 40 alunos para estudar o comportamento da variável ALTURA, apenas nesses alunos. Exemplo 2. O censo mostra a existência de 15 mil agregados familiares na província de Manica. Objetivando analisar a variável “número médio dos agregados por família”, podemos estudar o comportamento dessa variável em 601 agregados. 5 Uma AMOSTRA tem que ser: Representativa →conter em proporção tudo o que a população possui qualitativa e quantitativamente; Imparcial →todos os elementos da população tem igual oportunidade de fazer parte da amostra; Uma AMOSTRA é a redução de uma população em dimensões menores, porém, sem perda de suas características. Ao processo de definição da amostra chama-se AMOSTRAGEM 6 Amostragem Probabilistica e Não Probabilistica Métodos Probablisticos (Aleatórios) Todos os elementos da população tem uma probabilidade conhecida, diferente de zero, de pertencer à amostra. Desta forma, a amostragem probabilística implica um sorteio com regras bem determinadas. Métodos Não Probablisticos (Não Aleatórios) Quando não é possível designar uma probabilidade a cada elemento da população, dizemos que a amostragem é não probabilística. Amostragens Probabilísticas: Aleatória Simples Estratificada Por Clusters Multi-Etapas 7 ERRO AMOSTRAL Não há dúvida de que uma amostra não representa perfeitamente uma população. Ou seja, a utilização de uma amostra implica na aceitação de uma margem de erro que se denomina ERRO AMOSTRAL. Erro Amostral é a diferença entre um resultado amostral e o verdadeiro resultado populacional; tais erros resultam de flutuações amostrais aleatórias. Não podemos evitar a ocorrência do ERRO AMOSTRAL, porém podemos limitar seu valor através da escolha de uma amostra de tamanho adequado. Obviamente, o ERRO AMOSTRAL e o TAMANHO da AMOSTRA seguem sentidos contrários. Quanto maior o tamanho da amostra, menor o erro cometido e vice-versa. 8 ERRO AMOSTRAL Considere uma POPULAÇÃO de média μ e uma AMOSTRA dessa população, cuja média seja representada por Ẍ; O ERRO AMOSTRAL, será medido pela diferença entre: E = Ẍ - μ sendo E = Z*σ/Ѵn e Z obtido da tabela de distribuição normal ou pela função INV.NORMP(α/2), quando α representa o grau de confiança EXEMPLO: O CREA/AM deseja pesquisar o salário médio dos engenheiros de Manaus. Já o CONFEA informa que o desvio padrão do salário da categoria em âmbito nacional é de R$ 6.250,00 Entrevistados 600 engenheiros, obteve-se uma média salarial de R$ 9.600,00 Calcular o erro amostral, para uma grau de confiança de 95% sendo a população infinita. σ = 6250 ; Ẍ = 9600 ; n = 600 ; α = 0,05 e α/2 = 0,025 calcular E = ? 9 ERRO AMOSTRAL - Solução σ = 6250 ; Ẍ = 9600 ; n = 600 ; α = 0,05 e α/2 = 0,025 calcular E = ? Z = INV.NORMP.N(0,975) ou Z = 1,96 E = Z*σ/Ѵn E = (1,96 * 6250) / Ѵ600 E = 500 INTERVALO DE CONFIANÇA: P[(Ẍ-E)<μ<(Ẍ+E)] ou P[(9.600 – 500) < μ < (9.600 + 500)] ou Intervalo de Confiança: P[9.100 < μ < 10.100] INTERVALO DE CONFIANÇA: Para a média populacional μ estimada pela média amostral Ẍ é um intervalo de valores, acima e abaixo dessa média, dentro do qual se acredita que possa estar a verdadeira média populacional μ, com um grau de confiança de tantos pontos percentuais, no caso do exemplo: 95%, determinado por Z. 10 DETERMINAÇÃO DO TAMANHO DE UMA AMOSTRA COM BASE NA ESTIMATIVA DA MÉDIA POPULACIONAL A determinação do tamanho de uma amostra é problema de grande importância: Amostras muito grandes acarretam desperdício de tempo e de dinheiro; Amostras muito pequenas podem levar a resultados não confiáveis. 11 12 13 14 15 Fórmula para cálculo do tamanho da amostra para uma estimativa confiável da MÉDIA POPULACIONAL (μ): Onde: n → Número de indivíduos na amostra; Z α/2 → Valor crítico que corresponde ao grau de confiança desejado; s → Desvio-padrão populacional da variável estudada; E → Margem de erro ou ERRO MÁXIMO DE ESTIMATIVA. Identifica a diferença máxima entre a MÉDIA AMOSTRAL ( Ẍ ) e a verdadeira MÉDIA POPULACIONAL (μ) [Ẍ - μ ]; α → Nível de significância. 16 Os valores de confiança mais utilizados e os valores de Z correspondentes. Valores críticos associados ao grau de confiança na amostra 17 Exemplo Um economista deseja estimar a renda média para o primeiro ano de trabalho de um bacharel em direito. Quantos valores de renda devem ser tomados, se o economista deseja ter 95% de confiança em que a média amostral esteja a menos de $500,00 da verdadeira média populacional? Suponha que saibamos, por um estudo prévio, que para tais rendas, s = $6.250,00. Resolução 18 Exemplo Um economista deseja estimar a renda média para o primeiro ano de trabalho de um bacharel em direito. Quantos valores de renda devem ser tomados, se o economista deseja ter 95% de confiança em que a média amostral esteja a menos de $500,00 da verdadeira média populacional? Suponha que saibamos, por um estudo prévio, que para tais rendas, s = $6.250,00. Resolução Queremos determinar o tamanho n da amostra, dado que α = 0,05 (95% de confiança) Z α/2=1,96. Desejamos que a média amostral seja a menos de $ 500 da média populacional, de forma que E = 500 Supondo S = 6.250 e aplicamos a equação, obtendo: Com tal amostra teremos 95% de confiança em que a média amostral Ẍ difira em menos de R$500,00 da verdadeira média populacional μ. 19 No mesmo problema e utilizando uma margem de erro maior, no caso $ 1.000,00 determine o tamanho da amostra: Resolução: Z α/2=1,96 S = 6.250 E = 1.000 N = ? 20 No mesmo problema e utilizando uma margem de erro maior, no caso $ 1.000,00 determine o tamanho da amostra: Resolução: Queremos determinar o tamanho n da amostra, dado que α = 0,05 (95% de confiança) Z α/2=1,96. Desejamos que a média amostral seja a menos de $ 500 da média populacional, de forma que E = 1.000 Supondo S = 6.250 e aplicamos a equação, obtendo: N = ((1,96*6250)/1000)2 => N = 150 21 Quando o desvio-padrão “S” for desconhecido, devemos utilizar um valor preliminar obtido por : 1. Utilizar a aproximação S = amplitude/4 ; 2. Realizar um estudo piloto, iniciando o processo de amostragem. Com base numa coleção de pelo menos 31 valores amostrais selecionados aleatoriamente, calcular o desvio-padrão amostral S e utilizá-lo num processo de refinado com a obtenção de mais dados amostrais. 3. Substituir o desvio padrão populacional σ (desconhecido) por um múltiplo ou fração desse mesmo desvio padrão. Por exemplo: substituindo o E (erro amostral) da fórmula, por 2σ, nesse caso, o fator σ é automaticamente eliminado. 22 Quandoo desvio-padrão “S” for desconhecido, devemos utilizar um valor preliminar obtido por : Porém, se não existisse esse trabalho prévio, o que normalmente ocorre, poderia se supor o erro amostral como 20% de σ, ou seja, E = 0,20σ. Nesse caso, quantas entrevistas seriam necessárias para essa pesquisa? – (Caso 3) Para um α = 96% teremos um Z = 2,054 23 Quando o desvio-padrão “S” for desconhecido, devemos utilizar um valor preliminar obtido por : A cadeia de lanchonetes Marreco Donaldo, MD, esta interessada em conhecer o gasto médio por pessoa, dos clientes de uma cadeia de lanchonetes concorrente. Os executivos da MD admitem que a despesa de um cliente possa variar entre R$ 3,00 e R$ 15,00. Eles desejam um grau de confiança de 98 % e admitem uma margem de erro de R$ 0,25. Pede-se calcular o tamanho da amostra para esta pesquisa? – (Caso 1) Para um α = 98% teremos um Z = 2,33 24 Quando o desvio-padrão “S” for desconhecido, devemos utilizar um valor preliminar obtido por : No problema do cálculo do erro amostral da pesquisa dos salários dos engenheiros na cidade de Manaus, como estimar a quantidade de entrevistas, sabendo que o erro amostral E=500 e grau de confiança 95%? – (Caso 2) Como não conhecemos o desvio padrão da população, realizamos uma pesquisa amostral entre 30 engenheiros, escolhidos randomicamente. A pesquisa apresentou o resultado da tabela abaixo: Um α = 95% gera Z = 1,96 6.592,62 25 Cálculo do tamanho da amostra quando a população for FINITA: Nesse caso, o ERRO AMOSTRAL (E) deverá sofrer uma correção, ou seja, o ERRO deverá ser multiplicado pelo Coeficiente de População Finita = CPF. Existe, uma condição a ser satisfeita: o numero de amostras colhidas, n, deverá ser igual a pelo menos 5 % do tamanho da população N. O município de Arapiraca deseja fazer uma pesquisa do peso de papéis descartados mensalmente pelas residências da cidade, para planejamento da coleta de lixo. O peso médio do papel descartado em um mês, por uma amostra de 62 residências, foi de 9,4281 kg. e o desvio padrão dessa amostra foi de 4,1681 kg. Como a cidade possui 2.637 residências, deseja-se conhecer o intervalo de confiança para esta média, com grau de confiança de 95 %. Um α = 95% gera Z = 1,96 26 Cálculo do ERRO AMOSTRAL quando a população for FINITA: INTERVALO DE CONFIANÇA: P[(Ẍ-E)<μ<(Ẍ+E)] ou P[(9,4281 – 1,025) < μ < (9,4281 + 1,025)] ou Intervalo de Confiança: P[8,4031 < μ < 10,4531] Um α = 95% gera Z = 1,96 Cálculo do tamanho da amostra quando a população for FINITA: gera: 27 Um α = 95% gera Z = 1,96 Cálculo do tamanho da amostra quando a população for FINITA: No caso anterior o município de Arapiraca deseja fazer uma pesquisa do peso de papéis descartados mensalmente pelas residências da cidade, para planejamento da coleta de lixo. O peso médio do papel descartado, por uma amostra teste em 31 residências, foi de 9,4281 kg e o desvio padrão dessa amostra foi de 4,1681 kg. Como a cidade possui 2.637 residências, deseja-se calcular o tamanho da amostra a ser coletada, com grau de confiança de 95 %. 28 Fórmula para cálculo do tamanho da amostra com base na estimativa da proporção populacional (p): 29 Exemplo Um assistente social deseja saber o tamanho da amostra (n) necessário para determinar a proporção da população atendida por uma Unidade de Saúde, que pertence ao município de Cariacica. Não foi feito um levantamento prévio da proporção amostral e, portanto, seu valor é desconhecido. Ela quer ter 90% de confiança que o erro máximo de estimativa (E) seja de ±5% (ou 0,05). Quantas pessoas necessitam ser entrevistadas?. Resolução OBS: Quando os valores de “p” e “q” forem desconhecidos, considera-se p = q = 0,5 ou seja, p*q = 0,25 30 Exemplo Um assistente social deseja saber o tamanho da amostra (n) necessário para determinar a proporção da população atendida por uma Unidade de Saúde, que pertence ao município de Cariacica. Não foi feito um levantamento prévio da proporção amostral e, portanto, seu valor é desconhecido. Ela quer ter 90% de confiança em sua pesquisa e um erro máximo de estimativa (E) de ±5% (ou 0,05). Quantas pessoas necessitam ser entrevistadas?. Resolução Considerando que o valor da proporção amostral de atendimentos para pessoas de Cariacica não é conhecida. Utilizamos a equação indicada para determinar o tamanho da amostra. Sabemos que, para 90% de confiança teremos o valor crítico (Zα/2 ) = 1,645, conforme INV.NORMP.N(0,95) = 1,645. 31 Mas se o Nível de Confiança for de 90% porque utilizar 0,95 como argumento da função INV.NORMP ? Resposta: fórmula, podemos obter INV.NORMP.N(0,95) = 1,645. Haverá uma probabilidade de 1-α da média amostral conter um erro não superior a E. Por outro lado, haverá uma probabilidade α = (α/2) + (α/2) da média amostral conter um erro superior a E. 32 MODELOS PROBABILÍSTICOS PADRÕES Veremos adiante alguns MODELOS PROBABILÍSTICOS PADRÕES, que nos auxiliarão em diversas situações práticas. 33 MODELOS PROBABILÍSTICOS PADRÕES 1. DISTRIBUIÇÃO BINOMIAL Trata-se de uma distribuição de probabilidade adequada aos experimentos que apresentam apenas dois resultados possíveis: sucesso ou fracasso. Fornece a base para inferências sobre proporções. HIPÓTESES DO MODELO BINOMIAL 1. O experimento é repetido n vezes nas mesmas condições. 2. Os resultados das repetições são independentes, ou seja, uma repetição não interfere nas subseqüentes. 3. Cada repetição admite apenas dois resultados: sucesso ou fracasso. 4. As probabilidades de sucesso “p” e de insucesso “q” (q=1-p) se mantêm constantes durante as repetições. Por exemplo: a) Lançar uma moeda 5 vezes e observar o número de caras. b) Numa linha de produção, observar 10 itens tomados ao acaso e verificar o número de defeituosos. c) Verificar o número de bits que não estão afetados por ruído num pacote com n bits. 34 MODELOS PROBABILÍSTICOS PADRÕES 1. DISTRIBUIÇÃO BINOMIAL Define-se a VARIÁVEL BINOMIAL X como o número de sucessos em n repetições do experimento. A expressão geral da Distribuição Binomial é: NOTAS: 1. O nome BINOMIAL se deve ao fato da expressão acima corresponder ao termo geral do desenvolvimento do BINÔMIO DE NEWTON. 2. Para p=0,5 a distribuição é simétrica. Para P<0,5, a distribuição tem inclinação para a direita. 3. No caso de n grande (n 30) e p não muito pequena nem muito grande (valores centrais, com alguns autores recomendando np>5 e nq>5), a DISTRIBUIÇÃO BINOMIAL pode ser aproximada pela DISTRIBUIÇÃO NORMAL, que será vista adiante. 35 MODELOS PROBABILÍSTICOS PADRÕES 1. DISTRIBUIÇÃO BINOMIAL PRINCIPAIS CARACTERÍSTICAS DA DISTRIBUIÇÃO BINOMIAL Média μx = E{X} = np e Variância 2 x = V{X} = npq. EXEMPLO: Uma moeda não viciada é lançada 5 vezes. Encontre a probabilidade de: a) dar exatamente 3 caras b) pelo menos uma cara c) no máximo 2 caras d) calcular o valor esperado e o desvio padrão 36 MODELOS PROBABILÍSTICOS PADRÕES 1. DISTRIBUIÇÃO BINOMIAL EXEMPLO: Uma moeda não viciada é lançada 5 vezes. Encontre a probabilidade de: a) dar exatamente 3 caras b) pelo menos uma cara c) no máximo 2 caras d) calcular o valor esperado e o desvio padrão 37 MODELOS PROBABILÍSTICOS PADRÕES 2. DISTRIBUIÇÃO DE POISSON Considere as situações em que se avalia o número de ocorrências de um determinado evento por unidade de tempo, de comprimento, de área ou de volume (genericamente denominados de área de oportunidade). Em muitos casos, conhece-se o número de sucessos, mas às vezes é muito difícil ou até mesmo impossível determinaro número de fracassos. Imagine o número de automóveis que passam por uma esquina: pode-se anotar o número de veículos que passaram num determinado intervalo de tempo, mas não se pode determinar quantos deixaram de passar. A distribuição de Poisson é aplicada nos tipos de situações em que nos interessa o número de vezes em que um evento pode ocorrer durante um intervalo de tempo ou em determinado ambiente físico (área de oportunidade). Tomando como referência o número de ocorrências em determinado intervalo de tempo, em um processo de Poisson podem ser observados eventos discretos num intervalo de tempo, de tal forma que, reduzindo suficientemente este intervalo, tenhamos: 38 MODELOS PROBABILÍSTICOS PADRÕES 2. DISTRIBUIÇÃO DE POISSON HIPÓTESES DO MODELO DE POISSON 1. A probabilidade de observar apenas um sucesso no intervalo é estável. 2. A probabilidade de observar mais que um sucesso no intervalo é zero. 3. A ocorrência de um sucesso em qualquer intervalo é independente da ocorrência de sucesso em qualquer outro intervalo. A distribuição de Poisson é caracterizada apenas pelo parâmetro λ, que representa o valor esperado ou média, do número de sucessos por intervalo t. Em outras palavras, λ é a taxa de ocorrência dos eventos no intervalo de tempo. A função de probabilidade da distribuição de Poisson é: e é uma constante (base do logarítmo neperiano) valendo 2,718... λ é o número esperado de sucessos no intervalo considerado x é o número de sucessos (x = 0, 1, 2, ...,∞.) 39 MODELOS PROBABILÍSTICOS PADRÕES 2. DISTRIBUIÇÃO DE POISSON PRINCIPAIS CARACTERÍSTICAS DA DISTRIBUIÇÃO DE POISSON Média μx = E{X} = λ e Variância 2 x = V{X} = λ. EXEMPLO: As consultas a um banco de dados ocorrem de forma independente e aleatória, à base de 3 consultas por minuto. Calcule as probabilidades: a) no próximo minuto ocorrerem exatamente 3 consultas b) no próximo minuto ocorrerem menos de 3 consultas c) nos próximos dois minutos, ocorrerem mais do que 5 consultas 40 MODELOS PROBABILÍSTICOS PADRÕES 2. DISTRIBUIÇÃO DE POISSON EXEMPLO: As consultas a um banco de dados ocorrem de forma independente e aleatória, à base de 3 consultas por minuto. Calcule as probabilidades: a) no próximo minuto ocorrerem exatamente 3 consultas b) no próximo minuto ocorrerem menos de 3 consultas c) nos próximos dois minutos, ocorrerem mais do que 5 consultas 41 MODELOS PROBABILÍSTICOS PADRÕES 3. DISTRIBUIÇÃO EXPONENCIAL Se o número de ocorrências de um evento por unidade de tempo seguir a Distribuição de Poisson, então automaticamente a distribuição do intervalo de tempo entre ocorrências do evento segue a DISTRIBUIÇÃO EXPONENCIAL. Assim, se λ é a taxa à qual ocorrem eventos de Poisson, a distribuição do tempo entre chegadas sucessivas é expressa por: A distribuição exponencial também é caracterizada apenas pelo parâmetro λ, que representa a taxa de ocorrência dos eventos no intervalo de tempo. A função de probabilidade acumulada da distribuição exponencial é: onde: e é constante de Euler (base do logarítmo neperiano) valendo 2,71828... λ é a taxa de ocorrência do evento por unidade de tempo x é o tempo entre chegadas sucessivas 42 MODELOS PROBABILÍSTICOS PADRÕES 3. DISTRIBUIÇÃO EXPONENCIAL PRINCIPAIS CARACTERÍSTICAS DA DISTRIBUIÇÃO EXPONENCIAL Média μx = E{X} = 1/λ e Variância 2 x = V{X} = 1/λ. EXEMPLO: Carros chegam a um posto de gasolina aleatoriamente a cada 2 minutos em média. Determine a probabilidade de o tempo entre chegadas não exceder 1 minuto. 43 MODELOS PROBABILÍSTICOS PADRÕES 4. DISTRIBUIÇÃO NORMAL É considerada a distribuição de probabilidades mais importante, pois permite modelar uma infinidade de fenômenos naturais, e além disso, possibilita realizar aproximações para calcular probabilidades de muitas variáveis aleatórias que têm outras distribuições, tais como a BINOMIAL (n 30, np>5 e nq>5). Também conhecida como distribuição de GAUSS, é muito importante também na inferência estatística. A distribuição Normal é caracterizada por uma FUNÇÃO DE DENSIDADE DE PROBABILIDADE cujo gráfico descreve uma curva em forma de sino, que evidencia maior probabilidade. Função Densidade de Probabilidade da Distribuição NORMAL onde: μ = média da distribuição = desvio padrão da distribuição π e e são constantes (3,1416... e 2,718...) 44 MODELOS PROBABILÍSTICOS PADRÕES 4. DISTRIBUIÇÃO NORMAL PARÂMETROS DA DISTRIBUIÇÃO NORMAL Média ou Valor Esperado μx = E{X} = μ e Variância 2 x = V{X} = 2 45 MODELOS PROBABILÍSTICOS PADRÕES 4. DISTRIBUIÇÃO NORMAL 46 MODELOS PROBABILÍSTICOS PADRÕES 4. DISTRIBUIÇÃO NORMAL FUNÇÕES DO EXCEL PARA A DISTRIBUIÇÃO NORMAL O Excel disponibiliza as unções para cálculos com a Distribuição Normal: Função DIST.NORMP.N(z), onde, z: valor da VA Normal Padrão ou Reduzida. Esta função retorna a probabilidade P(-∞<Z< z) = P(Z< z), p/ qualquer valor de z. Para um intervalo genérico P(a<z<b), pode-se aplicar F(b) – F(a) diretamente: P(a<z<b) = DIST.NORMP.N(b) – DIST.NORMP.N(a) Para P(z>a), usa-se 1 – P(z<a) e portanto P(z>a) = 1 – DIST.NORMP.N(a). 47 MODELOS PROBABILÍSTICOS PADRÕES 4. DISTRIBUIÇÃO NORMAL FUNÇÕES DO EXCEL PARA A DISTRIBUIÇÃO NORMAL Exemplos do emprego da Função DIST.NORMP.N(z): a) Calcule P(z < 0,85) ► DIST.NORMP.N(0,85;1) ► = 0,8023 ( ou 80,23%). b) Calcule P(0 < z < 1,25) ► DIST.NORMP.N(1,25;1)-DIST.NORMP.N(0;1) ► = 0,3944 (ou 39,44%). c) Calcule P(z>2,39) ► 1-DIST.NORMP.N(2,39;1) ► = 0,0084 ou 0,84%. d) Calcule P(-2,55 < z < 1,2) ► DIST.NORMP.N(1,2;1)-DIST.NORMP.N(-2,55;1) ► = 0,8795 ou 87,95%. Função DIST.NORM.N( x ; média ; desv_padrão ; cumulativo), Onde x: valor da VA Normal; média: média da VA X ; desv_padrão: desvio padrão da VA X ; cumulativo: um valor lógico que define o tipo de distribuição: VERDADEIRO (1): retorna o valor da função de distribuição acumulada (FDA) F(x) = P(X x) e FALSO (0): retorna o valor da função densidade de probabilidade (fdp) no ponto x: f(x) Essa é a função mais completa para tratamento de distribuição normal. No caso de média=0, desvio=1 e cumulativo=1(verdadeiro), esta função retorna o mesmo valor da DIST.NORMP.N 48 MODELOS PROBABILÍSTICOS PADRÕES FUNÇÕES DO EXCEL PARA A DISTRIBUIÇÃO NORMAL Função INV.NORMP.N(probabilidade), Retorna o valor z da VA Normal Padrão, abaixo do qual se tem a probabilidade informada. É o inverso da função DIST.NORMP.N(z) Exemplo do emprego da Função INV.NORMP.N (p): Sendo, P(z<a) = 0,3015 ache “a” ► INV.NORMP.N(0,3015)► = -0,524401 Função INV.NORM.N( probabilidade ; média ; desv_padrão) Como no caso acima, é o inverso da função geral DIST.NORM.N(), aplicável a qualquer VA Normal X, desde que conhecidos sua média e desvio padrão. Função PADRONIZAR( x ; média ; desv_padrão) Retorna o desvio padrão normalizado z, considerando os argumentos x, média e desvio padrao, utilizando a fórmula já apresentada: Exemplo do emprego da PADRONIZAR( x ; média ; desv_padrão): A altura dos alunos de uma escola é normalmente distribuída com média 1,60 m e desvio padrão 0,30 m. Calcule a probabilidade de um aluno medir entre 1,50 m e 1,80 m. z1 = (1,50 – 1,60)/0,30 ► PADRONIZAR(1,5;1,6;0,3) ► = -0,33 z2 = (1,80 – 1,60)/0,30 ► PADRONIZAR(1,8;1,6;0,3) ► = 0,67 Logo: P(-0,33 < z < 0,67) ► DIST.NORMP.N(0,67;1)-DIST.NORMP.N(-0,33;1) ► = 0,3779 ou 37,79% 49 MODELOS PROBABILÍSTICOS PADRÕES 5. DISTRIBUIÇÃO QUI-QUADRADO É um modelo de distribuição contínua muito importante para a teoria da inferência estatística. Considere x1, x2, x3 ...xp, “n” variáveis aleatórias independentes, normalmente distribuídas com média zero e variância 1, ou seja, “n”variáveis tipo normal padrão. Define-se a variável aleatória com distribuição Qui-Quadrado como: n 2 = x1 2 + x2 2 + x3 2 + ... + xn 2 ou onde “n” é um parâmetro da função densidade de probabilidade denominado grau de liberdade e geralmente denotado pela letra grega (lê-se fi), ou eventualmente por gl. CARACTERÍSTICAS DA DISTRIBUIÇÃO QUI-QUADRADO 1. n 2 0 2. Média = n 3. Variância = 2n 4. A função densidade de probabilidade está representada graficamente para alguns valores de n: 50 MODELOS PROBABILÍSTICOS PADRÕES 5. DISTRIBUIÇÃO QUI-QUADRADO Observe que à medida que n cresce, (ou gl), a função de densidade de probabilidade tende à forma da FUNÇÃO NORMAL. 51 MODELOS PROBABILÍSTICOS PADRÕES 5. DISTRIBUIÇÃO QUI-QUADRADO TABELA QUI-QUADRADO A tabela do Qui-Quadrado em função do grau de liberdade n (ou gl), apresenta o valor numérico da VA que deixa à sua direita determinada área α, ou seja α = P(X x) Para cálculo da probabilidade P(X x), ou seja, área na cauda esquerda da distribuição, utiliza-se a propriedade P(X x) = 1 – P(X x) = 1 – α, conforme ilustrado abaixo. 1. O valor à direita, chamado, qui-quadrado superior é obtido na tabela com n =12 e α =0,025. Logo, x2 = 23,34 ou INV.QUIQUA.CD(0,025;12) 2. O valor da abscissa à esquerda, Chamado qui-quadrado inferior, é obtido da tabela com n =12 e α =1 - 0,025, portanto α =0,975. Logo, x2 = 4,40 ou INV.QUIQUA.CD(0,975;12) 52 MODELOS PROBABILÍSTICOS PADRÕES 5. DISTRIBUIÇÃO QUI-QUADRADO EXEMPLOS Qual a probabilidade P(X > 18), sendo n = 25 (sendo n = gl): Resp: DIST.QUIQUA.CD(18;25) ► = 84,24%. Qual o valor da variável que gerou a probabilidade 0,8424 ? Resp: INV.QUIQUA.CD(0,8424;25) ► = 18. 6. DISTRIBUIÇÃO T DE STUDENT É um modelo de distribuição contínua que se assemelha à distribuição normal padrão N(0 ; 1). É utilizada para inferências estatísticas, quando se tem amostras com tamanhos inferiores a 30 elementos. A distribuição t de Student, com n graus de liberdade é dada por: Para valores de n < 30, a distribuição apresenta maior dispersão que z N(0;1). À medida que n aumenta, t se aproxima cada vez mais de z. 53 MODELOS PROBABILÍSTICOS PADRÕES 6. DISTRIBUIÇÃO T DE STUDENT CARACTERÍSTICAS DA DISTRIBUIÇÃO t DE STUDENT 1. Média = 0 2. Variância = 3. A distribuição é simétrica em relação à média. 4. A comparação entre t e z é mostrada no gráfico ao lado. Trata-se de uma distribuição bicaudal, conforme ilustrado abaixo: 54 MODELOS PROBABILÍSTICOS PADRÕES 6. DISTRIBUIÇÃO T DE STUDENT EXEMPLOS Qual o valor de "t" para: n = 9 e α = 5%. (sendo n = gl): Resp: INV.T(1-0,025;9) ► =2,26216. Se n = 9, qual o valor de "p" para um t de 2,2622 ou P(X = 2,2622) ? Resp: 1-DIST.T(2,2622;9;1) ► = 0,02499825 ou 2,5%. 7. DISTRIBUIÇÃO F DE SNEDECOR Considere duas distribuições , a primeira com n graus de liberdade e a segunda com d graus de liberdade. A distribuição F de Snedecor, também referida como F de Fisher (Snedecor foi o pseudônimo adotado por Fisher), é definida como: 55 MODELOS PROBABILÍSTICOS PADRÕES 7. DISTRIBUIÇÃO F DE SNEDECOR No caso de n=20 e d=10, a Distribuição F possui a forma de sua fdp como mostrado abaixo. Para fins de utilização da distribuição, na prática tabela-se, para cada par (n,d), o valor de F que deixa determinada área à sua direita. 56 7. DISTRIBUIÇÃO F DE SNEDECOR EXEMPLOS Qual o valor de P(F>x) para o gl_n=20, gl_d=10, sendo x=2,77: Resp: DIST.F(2,774;20;10;FALSO) ► =0,0504 ou 5,04%. Qual o valor crítico "X", para o gl_n=20, gl_d=10, sendo a probabilidade p=0,05 ? Resp: INV.F(1-0,05;20;10) ► = 2,774 MODELOS PROBABILÍSTICOS PADRÕES 57
Compartilhar