Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 ESTATÍSTICA – Resumo Prof. Ricardo Luís Rocha Estatística é uma coleção de métodos para planejar experimentos, obter dados e organizá-los, resumi-los, analisá-los, interpretá- los e deles extrair conclusões. 5 etapas: 1) Definir cuidadosamente o problema 2) Formular um plano para coleta dos dados 3) Coligir os dados 4) Analisar e interpretar os dados 5) Relatar as conclusões É dividida em três partes: Estatística Descritiva, Probabilidade e Amostragem 1. Definições: 1. MODELO Versão simplificada de algum problema ou situação da vida real destinado a ilustrar certos aspectos. 2. PROBABILIDADES A teoria da probabilidade proporciona uma base racional para lidar com situações influenciadas por fatores relacionados ao acaso. 3. AMOSTRAGEM Diz respeito à análise e interpretação de dados amostrais. A idéia básica é efetuar determinada mensuração sobre uma parcela pequena, mas típica, de determinada “população” e utilizar esta informação para fazer inferência sobre a população toda. 4. POPULAÇÃO É uma coleção completa de todos elementos (valores, pessoas, medidas etc.) a serem estudados. 5. AMOSTRA É uma parte extraída dos elementos da população. 6. CENSO É uma coleção de dados relativos a todos elementos de uma população. 7. PARÂMETRO Medida numérica que descreve uma característica da população. 8. ESTATÍSTICA Medida numérica que descreve uma característica de uma amostra. 9. DADOS QUANTITATIVOS Constituem-se em números que representam contagens ou medidas. 10. DADOS CONTÍNUOS São os dados quantitativos referentes às variáveis contínuas que podem assumir qualquer valor num intervalo contínuo. (Para solução de problemas: 1- Determinar intervalo de dados; 2- Determinar o número k de classes; 3- Calcular a amplitude da classe; 4- Estabelecer limites de classes; 5- Relacionar os intervalos e fazer a contagem; 6- Construir a tabela.) 11. DADOS DISCRETOS São dados quantitativos referentes às variáveis discretas que assumem valores inteiros e são resultantes de uma contagem de itens. (Para solução de problemas: 1- Estabelecer as classes; 2- Enquadrar os dados nas classes; 3- Contar o número em cada classe; 4- Apresentar os resultados em tabela.) 12. DADOS QUALITATIVOS (ou categóricos ou atributos) Podem ser separados em diferentes categorias que se distinguem por uma característica não-numérica. NOTAÇÃO Característica amostra população Somatório de um conjunto de valores Valores individuais dos dados x i x i Número de valores (tam. do conjunto) n N Média x Desvio padrão s 2s 2Variância Range R - CV= Sx x100Coef. Variação Proporção x/n x/N x - 2 13. DADOS NOMINAIS Surgem quando se definem categorias e se conta o número de observações pertencentes a cada categoria. São dados qualitativos e não podem ser dispostos em um esquema ordenado. 14. DADOS POR POSTOS OU ORDINAIS Consistem de valores relativos atribuídos para denotar ordem: primeiro, segundo, terceiro, pequeno, médio, grande, pouco, médio, muito etc. São dados qualitativos, referem-se tipicamente a avaliações subjetivas 15. MEDIDAS DE POSIÇÃO (tendência central) Média aritmética de um conjunto de valores n x xou n x x 1 i n i Características: - É a mais importante das medidas de tendência central - A média de um conjunto de números pode ser sempre calculada - Para um dado conjunto de números, a média é única - É sensível a (ou afetada) todos os valores do conjunto. Assim se um valor se modifica, a média também se modifica - Somando-se ou reduzindo-se uma constante a cada valor do conjunto, a média ficará aumentada ou reduzida dessa constante. µ(x ± k) = µ (x) ± k - Multiplicando-se ou dividindo-se cada valor do conjunto por uma constante, a média ficará multiplicada ou reduzida por essa constante. µ(x .\ k) = µ (x) .\ k - µ(x ± y) = µ (x) ± µ (y) e µ (x.\y) = µ (x) .\ µ (y) (só se x e y forem independentes - A somas dos desvios dos números de um conjunto a contar da média é zero - É conhecida como o centro de gravidade do conjunto de valores Média ponderada n i i x x n x 1 1 Média geométrica nnn ng xxxxxxx 1 2121 ....*....* Média harmônica n i i n i iip wxwx 11 W – peso de cada elemento X – valor de cada elemento natureza dos dados alunos 2º grau idades, pesos nº da classe menino/menina 2º grau automóveis velocidade Km/h nº defeitos / carro cores grau de limpeza vendas de imóveis valor Cr$ n º ofertas acima do preço muito dispendioso populações contínuo discreto nominal por postos ou ordinal 3 Mediana Divide um conjunto de dados ordenados em dois grupos iguais. Conjunto de valores pares ( n = par) 2 122 nn valorvalor MD Conjunto de valores impares ( n = par) 12 nIntvalorMD Moda É o valor ou classe de maior freqüência num conjunto de dados. - pode não existir - pode não ser única Quartis, decis, percentis Os 3 quartis dividem conjuntos de dados ordenados (ordem crescente) em 4 partes iguais: Q1 25% dos valores serão inferiores ao primeiro quartil (Q1) Q2 50% serão inferiores ao segundo quartil (Q2 = mediana) Q3 75% serão inferiores ao terceiro quartil (Q3) e 25% serão superiores ao terceiro quartil Há 9 decis denotados por D1, D2, D3, ......D9, que dividem os dados (ordem crescente) em 10 grupos com cerca de 10% deles em cada grupo. Há 99 percentis que dividem os dados (ordem crescente) em 100 grupos com cerca de 1% em cada grupo. 16. MEDIDAS DE DISPERSÃO Amplitude, range ou intervalo É expresso pela diferença entre o maior e o menor número num grupo, ou pela identificação desses dois números. Limitação: só leva em conta os dois valores extremos do conjunto, nada informando sobre os outros valores. Desvio médio absoluto n xx DMA i Conquanto o desvio médio absoluto seja fácil de entender, não é muito usado como medida de dispersão, porque outras medidas apresentam propriedades matemáticas mais interessantes. O DMA apresenta algumas aplicações no controle de inventários. apropriada para dados ao nível nominal não não pode não existir; pode ter mais de uma moda usada às vezes valor mais freqüente moda costuma ser boa escolha se há valores extremos não não existe sempre usada valor médio mediana muito utilizada em estatística sim sim existe sempre “média” mais familiar média vantagens e desvantagens afetada pelos valores extremos? leva em conta todos os valores? existência quão freqüente definição medida x = x n 4 Variância 1 ou 1 22 2 2 2 n nxx S n xx S ii x i x n – 1 amostra; n população Características: - A variância de uma constante é nula 2(k) = 0 - Se multiplicarmos todos os valores de uma variável aleatória por uma constante, sua variância fica multiplicada pelo quadrado da constante 2(kx) = k2 . 2(x) - A variância de uma soma ou diferença de variáveis aleatórias independentes é igual à soma das variâncias dessas variáveis 2(x ± y) = 2(x) + 2(y) - Se somarmos ou subtraímos uma constante aos valores de uma variável aleatória, sua variância permanece inalterada 2(x ± k) = 2(x) Desvio padrão 1 ou 1 222 n nxx S n xx S ii x i x - só raiz positiva da variância - O desvio padrão é mais comumente usado porque se apresenta na mesma unidade da variável em análise. Assim, se a unidade da variável for mm, o desvio padrão também será mm. Isso não acontece com a variância. - O desvio padrão é a medida de dispersão mais usada. Quanto maior é o desvio padrão maior é a dispersão dos dados em torno da média. Coeficiente de variação 100* x S CV% x Nos dá a idéia do tamanho do desvio padrão em relação à média. Uma pequena dispersão absoluta pode ser na verdade considerável quando comparada com os valores da variável 17. DISTRIBUIÇÕES DE FREQÜÊNCIA É um grupamento de dados em classes, exibindo o número ou percentagem de observações em cada classe. Uma distribuição pode ser apresentada em forma gráfica ou tabular. DISTRIBUIÇÃO DE FREQÜÊNCIA PARA DADOS CONTÍNUOS Etapas para construção 1 - Determinar o intervalo dos dados 2 - Determinar o número K de classes É aconselhável tomar entre 5 a 20 classes Regra prática: n K Ajustá-la se for necessário Certifique-se que k vezes a amplitude é maior que o intervalo, pois, de outra forma, os valores extremos não serão incluídos 3 - Calcular a amplitude da classe Amplitude = intervalo / nº de classes (k) É importante que não ocorra lacunas na fixação das classes (deve haver uma classe para cada valor) As classes não devem intercepta-se (um valor deve pertencer a só uma classe 4 - Estabelecer limites de classes preliminares. Rever os limites, que devem tocar-se mas não intercepta-se 5 - Relacionar os intervalos e fazer a contagem dos pontos por classe (a contagem total dever ser igual a n) 6 - Construir uma tabela de freqüência ou histograma de freqüência 5 Histograma Alternativa ao histograma POLÍGONO DE FREQÜÊNCIA Certa quantidade de informação é perdida porque os valores individuais perdem sua identidade quando são grupados em classes. Para dados discretos isto também pode ocorrer dependendo da natureza dos dados e do objetivo do analista. DISTRIBUIÇÃO DE FREQÜÊNCIA PARA DADOS DISCRETOS 1. Estabelecer as Classes 2. Enquadrar os dados nas classes 3. Contar o nº em cada classe 4. Apresentar os resultados em tabela 0,30 0,20 0,10 0,00 3 8 13 18 23 28 33 classes fr eq ü ên ci a re la ti v a o u a b so lu ta 3 8 13 18 23 28 33 f r e q ü ê n ci a classes 0,30 0,20 0,10 0,00 safras P er ce n ta g em d e ár v o re s Gráfico de barras Histograma 0 1 2 3 4 5 6 7 8 9 4 acidentes por dia ocorreram 9 vezes (18%) a) sem perda de informação 20 15 10 5 fr eq ü ên ci a d e ac id en te s b) com perda de informação 20 15 10 5 0-1 2-3 4-5 6-7 8-9 fr eq ü ên ci a d e ac id en te s 6 fr eq ü ên ci a fr eq ü ên ci a Determinação da moda num gráfico a) sem perda b) com perda moda classe modal DISTRIBUIÇÃO DE FREQÜÊNCIA ACUMULADA PARA DADOS DISCRETOS A freqüência acumulada tem por objetivo indicar o número ou percentagem de itens menores do que, ou iguais a determinado valor. 18. MEDIDAS DA DISTRIBUIÇÃO DE FREQÜÊNCIA Média nfxxnfcx n i ii n i ii 11 ou n - número de elementos do conjunto de dados c i - centro de cada classe de freqüência f i - freqüência de cada classe Mediana - MD mf md a i h f Fn LMD 2 L i - limite inferior da classe que contém a mediana n - número de elementos do conjunto de dados F a - soma das freqüências das classes anteriores à que contém a mediana f md - freqüência da classe que contém a mediana h md - amplitude da classe que contém a mediana (1. Identificar o intervalo que contém a mediana; 2. determinar a posição; ordenar os valores da classe; 4. identificar a mediana) Moda - MO h dd d LMO i 21 1 Mo - valor ou valores num conjunto de dados L i - limite inferior da classe modal d 1 - diferença entre a freqüência da classe modal e da classe imediatamente anterior d 2 - diferença entre a freqüência da classe modal e da classe imediatamente seguinte h - amplitude das classes DADOS DISCRETOS Sem perda de informação fr eq ü ên ci a ac u m u la d a 1,00 0,80 0,60 0,40 0,20 0,00 78% dos acidentes acorreram 6 vezes por dia ou menos 0 1 2 3 4 5 6 7 8 9 Com perda de informação fr eq ü ên ci a ac u m u la d a 1,00 0,80 0,60 0,40 0,20 0,00 0-1 2-3 4-5 6-7 8-9 com perda de informação sem perda de informação 7 Variância 1 ou 1 22 2 2 2 n nxfxf s n xxf s iiiii Na utilização da classe de freqüência com perda de informação, x i é o centro da classe de freqüência. O desvio padrão é a raiz positiva da variância. 19. MEDIDAS DE FORMAS DAS DISTRIBUIÇÕES DE FREQÜÊNCIA ASSIMETRIA ACHATAMENTO O coeficiente de achatamento (Kurtosis) é uma medida de planicidade (flatness) da distribuição. 2 = 3 - planicidade de uma curva normal - mesocúrtica 2 = 4,5 - curva bastante aguda -leptocúrtica (leptokurtosis) 2 = 1 - curva mais achatada – platicúrtica (platykurtosis) 20. BOX-AND-WHISKER PLOTS OU DIAGRAMA EM CAIXA Os diagramas em caixa são convenientes para revelar tendências centrais, dispersão, distribuição de dados e presença de outliers (valores extremos) Para a construção são necessários: valor mínimo primeiro quartil Q1, a mediana (ou segundo quartil Q2) terceiro quartil Q3 e valor máximo A mediana revela a tendência central Os quartis indicam a dispersão dos dados O diagrama em caixa tem a vantagem de não ser tão sensível a valores extremos Não dão informações tão detalhadas quanto o histograma ou gráfico de ramo-e-folhas A melhor aplicação do diagrama em caixa é na comparação de dois ou mais conjuntos de dados (é necessário usar a mesma escala). Não há diferenças substanciais nos dois conjunto de dados. Os não fumantes têm mais valores extremos, mas as medianas parecem coincidir. A dispersão dos dados são parecidas Obs.: os outliers 8 e 15 foram excluídos moda mediana média média mediana moda moda = mediana = média Assimétrica à esquerda: média e mediana estão a esquerda da moda Simétrica: média, moda e mediana coincidem Assimétrica à direita: média e mediana estão à direita da moda = 4,5 = 3,0 = 1,0 platícúrtica mesocúrtica leptocúrtica (normal) fumantes não fumantes p u ls aç ão 80 90 70 40 60 50 100 8 2.PROBABILIDADES 1. Conceito: É a chance que alguma coisa tem para ocorrer. Exprime a chancede ocorrência de determinado evento. Empírico: Fazer vários experimentos e anotar resultados Subjetivo: Opinião pessoal. 2. Notação: P – denota probabilidade A, B, C – denotam eventos específicos P(A) – denota a probabilidade do evento A ocorrer Pode ser expressa em fração decimal (0 a 1) ou percentagem (0 a 100%), sendo: - 0 ou 0% a probabilidade de um evento impossível e - 1 ou 100% a probabilidade de ocorrência um evento certo 3. Definição de Probabilidade: As probabilidades são utilizadas para exprimir a chance de ocorrência de determinado evento. A probabilidade de um certo evento A ocorrer é igual à freqüência relativa de vezes que A é observado, quando o experimento é repetido um número infinitamente grande de vezes. A probabilidade de ocorrência de um evento é dada por um número que varia de 0 a 1. 4. Definição de Eventos: São os resultados possíveis de um experimento. ex.: Se o experimento fosse o lançamento de uma moeda, os eventos possíveis seriam cara e coroa. 5. Definição de Conjunto: Coleção bem definida de objetos ou itens. ex.: conjunto A = {João, Maria , José} 6. Definição de Espaço Amostral: É o conjunto de todos os resultados possíveis de um experimento. 7. Definição de Complemento: Complemento de um evento consiste de todos os outros resultados do espaço amostral que não façam parte do evento. 8. Definição de Eventos Mutuamente Exclusivos: São aqueles que não podem ocorrer simultaneamente. ex.: Na extração de uma carta, os eventos a carta é de copas e a carta é de ouros são mutuamente excludentes, pois uma carta não pode ser simultaneamente de copas e de ouros. 9. Definição de Eventos Coletivamente Exaustivos: Quando somente um resultado é possível de ocorrer em um dado experimento. ex.: Na extração de uma carta, os eventos carta preta e carta vermelha são coletivamente exaustivos. Ou seja, somente um resultado é possível. 10. Definição de Eventos Independentes: Dois eventos são independentes quando a ocorrência ou a não-ocorrência de um não influencia a ocorrência do(s) outro(s). ex.: A se jogar duas moedas, verificar a probabilidade de ambas darem cara. 11. Eventos dependentes Um evento influencia a ocorrência do outro. 9 Os eventos são mutuamente exclusivos ? Sim P(A e B) = 0, quando ocorrerem dois eventos P(A ou B) = P(A) + P(B), quando ocorrer ao menos um de dois eventos Não Os eventos são independentes ? por ex.: P(A|B)=P(A) ? Sim P(A e B) = P(A) x P(B), quando ocorrerem dois eventos P(A ou B) = P(A) + P(B) - P(A e B), quando ocorrer ao menos um de dois eventos Amostras com reposição Amostras sem reposição Binomial Quando o valor de n é grande e o de p é pequeno, usar a Tabela ou a Fórmula de Poisson. Hipergeométrica O eventos são condicionais ? (é um evento dependente do outro ?) Quando ocorrerem dois eventos e um depender da ocorrência do outro. P(A e B) = P(A) x P(B|A) P(A e B) = P(B) x P(A|B) Não Sim PROBABILIDADE Probabilidade do evento E: n(A) n(E) P(E) seja,ou amostral espaço do elementos de nº E evento do elementos de nº )( EP N n EP )( 00,1)(00,0 EP 1)( iEP E de ocorrência-não de adeprobabilid a )'( sendo )(1)'( EPEPEP CHANCE E em NÃO resultados de nº E em SIM resultados de nº E de Chance Exemplo: Uma urna tem 10 bolas, 8 vermelhas e 2 verdes. A chance a favor da vermelha é de 8:2 ou 4:1. PROBABILIDADE DE OCORREREM DOIS EVENTOS (A e B) Eventos independentes -> a ocorrência ou não de um não influencia a ocorrência do outro. Ex.: Jogam-se duas moedas equilibradas. Qual a probabilidade de ambas darem cara ? Sol.: P(cara) = 1/2 logo, P(cara e cara) = 1/2 x 1/2 = 1/4. P(B) x P(A) B)P(A :notação Outra . idem B),|P(A x P(B) B) eP(A ou P(B) A)|P(B tesindependen são eventos os como mas A),|P(B x P(A) B) eP(A P(A) x P(B) B) eP(A P(B) x P(A) B) eP(A Eventos dependentes um do outro. (Probabilidade Condicional) Ex.: A urna Y tem 8 fichas vermelhas e 2 brancas. A urna Z tem 5 vermelhas e 5 brancas. Escolhendo a urna Y, qual a probabilidade de sair uma ficha vermelha ? Sol.: P(Urna Y e ficha vermelha) = 8/20 = 0,40, ou seja: A = Urna Y B= ficha vermelha P(A)= ½ P(B|A)=8/10, logo P(A e B) = 1/2 x 8/10 = 8/20 ou 0,40. B)|P(A x P(B) B)P(A A)|P(B x P(A) B)P(A :notação Outra B)|P(A x P(B) B) eP(A A)|P(B x P(A) B) eP(A Se A e B são dois eventos, a probabilidade de B ocorrer, depois de A ter ocontecido é definida por P(B|A), ou seja, é chamada "probabilidade condicional de B". Eventos mutuamente exclusivos quando a realização de um exclui a realização do(s) outro(s). 0 B)P(A :notação Outra 0 B) e(A P PROBABILIDADE DE OCORRER AO MENOS UM DE DOIS EVENTOS (A ou B) Eventos mutuamente exclusivos (ou seja, que não podem ocorrer simultaneamente), a probabilidade de ocorrência de um deles é a soma de suas probabilidades individuais. ex.: A probabilidade de ocorrer 5 ou 6 numa jogada com um dado é: P(cinco) + P(seis) = 1/6 + 1/6 = 2/6 P(B) P(A) B)P(A :Notação Outra P(B) P(A) B)ou P(A Eventos não mutuamente exclusivos, ou seja, é possível a ocorrência conjunta de ambos. ex.: Em um baralho de 52 cartas há 13 cartas de paus, 4 dez e 1 dez de paus. A probabilidade de se tirar 1 carta de paus, ou dez ou ambos (dez de paus) é: P(paus) = 13/52 P(dez) = 4/52 P(dez de paus) = 1/52 Logo, P(paus, ou dez, ou ambos) =P(paus) + P(dez) – P(dez de paus)= 13/52 + 4/52 – 1/52 = 16/52. vêzes. duas somada seja não intersecão a que para B),P(Aou B) eP(A têrmoo se-Subtrai :Nota B)P(A - P(B) P(A) B)P(A :notação Outra B) eP(A - P(B) P(A) B)ou P(A Quando se tem mais de dois eventos, por ex., P(A B C ) = (1-P(A)) x (1-P(B)) x (1-P(C)) 12. FLUXOGRAMA DA PROBABILIDADE 10 13. REGRAS DE CONTAGEM QUANDO A ORDEM É IMPORTANTE ARRANJO Número de grupamentos em que interfere a ordem. )!( ! A xn, xn n ex.: Tomando 4 cores: V, A, B, L Temos A4,3 = 24 VAB,VBA,AVB,ABV,BAV,...,etc PERMUTAÇÃO Uma permutação é um arranjo com a totalidade dos elementos. Com repetição n1, n2, ..., nk )!)...(!2)(!1( ! P nkn2,...,n1,n nknn n QUANDO NÃO INTERESSA A ORDEM COMBINAÇÃO Uma combinação é um maior número de grupamentos possíveis. O número de combinações é sempre inferior ao número de arranjos. )!(! ! C xn, xnx n x n ex.:Tomando 4 cores: V, A, B, L Temos C4,3=4 VAB, VAL, VBL, ABL PROBABILIDADE TOTAL Sejam B1, B2, B3,...,Bk um conjunto de eventos mutuamente exclusivos cuja união forma o espaço amostral. Seja A outro evento no mesmo espaço amostral, tal que P(A) > 0. Logo, P(A)= P(AB1) + P(AB2) + +P(AB3)+...+P(ABk) P(A) = P (B1) x P(A|B1) + P(B2) x P(A|B2) +...+P(Bk) x P(A|Bk) Logo, Probabilidade Total = [P(Bi) x P(A|Bi)] 14. REGRA DE BAYES: Thomas Bayes (1702 ~1761) afirmou que as probabilidadesdevem ser revistas, quando conhecemos algo mais sobre os eventos. O teorema de Bayes é uma técnica utilizada para revisar estimativas probabilísticas iniciais com base em dados amostrais. Na solução pelo Teorema de Bayes, temos de definir: 1- a probabilidade a priori. 2- a probabilidade do evento em questão. Fórmulas: P(A) = [P(Bi) x P(A|Bi) P(A Bi) = P(A) x P(Bi|A) => P(Bi|A) = P(ABi) / P(A) P(Bi|A) = P(Bi) x P(A|Bi) / [P(Bi) x P(A|Bi)] 15. DISTRIBUIÇÕES DE PROBABILIDADE Uma distribuição de probabilidades é uma distribuição de freqüências para os resultados de um espaço amostral. Uma distribuição de probabilidade dá a probabilidade de cada valor de uma variável aleatória. Variável aleatória - va É uma variável (geralmente representada por x), que tem um valor numérico único (determinado aleatoriamente) para cada resultado de um experimento. É uma função com valores numéricos, cujo valor é determinado por fatores de chance Variável aleatória discreta toma valores que podem ser contados. Número final da placa de carros que chegam ao aeroporto de congonhas Número de mulheres entre 10 empregados recém-admitidos Variável aleatória contínua toma qualquer valor de um determinado intervalo. Altura das mulheres que compareceram ao exame médico no ultimo mês 11 Valor esperado O valor esperado de um experimento é uma média e pode ser calculado prazo. longo de médio valor um como dointerpretaser Deve PE 1 n i iix x Para se ter uma distribuição de probabilidades é necessário: P(x) = 1, onde x toma todos valores possíveis 0 P(x) 1 para todo o x. DESCONTÍNUAS OU DISCRETAS Envolvem distribuições de probabilidades de variáveis aleatórias relativas a dados que podem ser contados. - BINOMIAL - BINOMIAL NEGATIVA OU DE PASCAL - GEOMÉTRICA - POISSON - MULTINOMIAL OU POLINOMIAL - HIPERGEOMÉTRICA PROCESSO DE BERNOULLI - O experimento tem n provas - Cada prova tem duas possibilidades: sucesso e falha - Cada prova é independente da outra - A probabilidade de sucesso ou falhas é constante para todas as provas - A distribuição binomial é um processo de Bernoulli - A distribuição hipergeométrica não é um processo de Bernoulli DISTRIBUIÇÃO BINOMIAL Designa situações em que os resultados de uma variável aleatória podem ser grupados em duas classes ou categorias (prova de Bernoulli) Exemplos de eventos binomiais - Respostas nominais (sucesso ou falha; V ou F; sim ou não; perfeito ou defeituoso; bolas verdes ou não verdes) - Deve comportar um número fixo n de provas idênticas - As provas devem ser independentes (uma prova não afeta a probabilidade de outra acontecer) - Categorias mutuamente excludentes (sucesso e falha) - As probabilidades devem permanecer constantes para cada prova - Categorias coletivamente exaustivas (soma de todos resultados possíveis igual a 1) - Eventos = observações = provas = experimentos = trials Cálculo das probabilidades binomiais 1. Fórmula binomial 2. Tabela de probabilidades binomiais tabela individual tabela acumulada NOTAÇÃO Se S e F (sucesso e falha) denotam as duas categorias possíveis de todos os resultados; p e q denotam as probabilidades de S e F respectivamente, assim: P(S) = p e P(F) = 1 – p = q n número fixo de provas x número específico de sucessos em n provas (nº inteiro entre 0 e n) p probabilidade de sucesso em uma das n provas q probabilidade de falha em uma das n provas P(x) probabilidade de obter exatamente x sucessos em n provas xnxnxx qpP 12 Para nº de sucessos: npq Padrão Desvio np Média Para percentagem de sucessos: npq Padrão Desvio p Média DISTRIBUIÇÃO DE POISSON ocorrências típicas do modelo de distribuição de Poisson 3. Dados de tempo ou espaço (def./cm2; acid./dia; cham./h; vaca/acre) OBSERVAÇÃO A unidade de medida é contínua (tempo, área etc.), mas o número de ocorrências (variável aleatória) é discreta A distribuição de Poisson é útil para descrever a probabilidade do número de ocorrências num campo ou intervalo contínuo (em geral tempo ou espaço) CARACTERÍSTICAS - A variável aleatória x é o número de ocorrências de um evento num intervalo - A probabilidade de uma ocorrência é a mesma em todo o intervalo considerado (ocorrências aleatórias) - As ocorrências são distribuídas uniformemente ao longo do intervalo considerado - O número de ocorrências em qualquer intervalo é independente do número de ocorrências em outros intervalos - A probabilidade de mais de 1 ocorrência no mesmo ponto é praticamente nula FÓRMULA DE POISSON !! x e x te P xxt x A média é o parâmetro que caracteriza a distribuição de Poisson µ = t , logo P(x) = probabilidade de ocorrer x ocorrências µ = é a média de ocorrências no intervalo t = taxa média por unidade t = é o número de unidades ou intervalo x = número de ocorrências e = é a base dos logaritmos neperianos = 2,71828 Padrão Desvio Variânciat Média 2 DISTRIBUIÇÃO POISSON COMO APROXIMAÇÃO DA BINOMIAL Quando deve-se fazer a aproximação por Poisson? - Número n de observações é grande n 100 e np <10 (regra prática) - Probabilidade de sucesso “p” está próxima de 0 ou 1 - Porque fazer a aproximação por Poisson? - A distribuição binomial descreve adequadamente muitas situações de interesse - A maioria das tabelas está limitada a n 20 - A fórmula binomial pode exigir esforço substancial para obtenção de uma solução exata 13 DISTRIBUIÇÃO MULTINOMIAL OU POLINOMIAL Utilizada nas situações onde há mais de dois resultados mutuamente excludentes. (tste de múltipla escolha) EXIGE-SE: - Que as provas sejam independentes - Tenham probabilidade de ocorrência constante A probabilidade multinomial de que, em n observações, o resultado E1 ocorra n1 vezes, E2 ocorra n2 vezes, ... , e Ek ocorra nk vezes é dado pela fórmula: nkknnn K pppp nnnn n ... !!...!! ! P 33 2 2 1 1 321 x DISTRIBUIÇÃO HIPERGEOMÉTRICA Utiliza-se a distribuição hipergeométrica em situações com dois ou mais resultados, em que a probabilidade de sucessos varia de uma prova para outra (extração sem reposição de uma população finita). - Observações dependentes - Probabilidade variável de prova para prova - Amostragem sem reposição Nn r x rN xn nr,N,|xP N = tamanho da população n = tamanho da amostra r = nº de sucessos da população x = nº de sucessos da amostra VNE x Padrão Desvio 1-N n-N p-1 np V Variância rp np; Média x DISTRIBUIÇÃO GEOMÉTRICA Seja o experimento que consiste em se repetir a prova de Bernoulli tantas vezes quantas forem necessárias, até se obter o primeiro sucesso. Se forem provas independentes e de mesma probabilidade de sucesso p, o número de tentativas X terá distribuição geométrica. VE x Padrão Desvio p q V Variância ; p 1 Média .... 3, 2, 1, k ; pqkxP 2x 1k DISTRIBUIÇÃO DE PASCAL OU BINOMIAL NEGATIVA Nas condições em que foi definida a distribuição geométrica, se considerarmos X o número de tentativas até se obter o r-ésimo sucesso (exemplo: 17º sucesso), teremos uma distribuição de Pascal. Sendo r a ordem do sucesso desejado e k o número de tentativas para o obter o sucesso desejado, temos: Qual a probabilidade deocorrer k provas até que ocorra r sucessos (ou falhas) VE p x k r Padrão Desvio p rq V Variância ; p r Média .... 3,r 2,r 1,r r, k ; qpkxP 2x 1kr1 1 14 COMPARAÇÃO ENTRE BINOMIAL E POISSON BINOMIAL - Afetada pelo tamanho amostral n e pela probabilidade p - Valores possíveis da variável aleatória x são 0, 1, 2, 3 .....n - Contagem de sucessos e falhas POISSON - Afetada apenas pela média µ - Valores possíveis da variável aleatória x são 0, 1, 2, 3 ..... sem limite superior - Contagem de sucessos somente APLICAÇÕES DAS DISTRIBUIÇÕES DISCRETAS DE PROBABILIDADE Distribuição exemplos Hipóteses binomial dois resultados jogada de uma moeda teste V ou F defeituoso, não defeituoso observações independentes probabilidades constantes de poisson só ocorrências acidentes / ano defeitos / jarda chamadas / minuto observações independentes probabilidades constantes hipergeométrica dois ou mais resultados amostragem sem reposição observações dependentes multinomial mais de dois resultados teste de múltipla escolha observações independentes probabilidades constantes DISTRIBUIÇÕES DE PROBABILIDADE CONTÍNUAS - UNIFORME OU RETANGULAR - NORMAL - EXPONENCIAL - LOGNORMAL - BETA - GAMA - WEIBULL - F DE SNEDECOR - QUI-QUADRADO 2 - t DE STUDENT - ERLANG - BIVARIADA NORMAL Quando se usa as distribuições contínuas? - A variável aleatória discreta apresenta um grande número de resultados - A variável aleatória em questão é contínua Os ponteiros de um relógio podem parar em qualquer dos infinitos pontos do círculo logo, A probabilidade de parar em um ponto definido é zero - Nas distribuições contínuas utilizam-se a probabilidade da ocorrência em um intervalo P(a < x < b). - Em uma distribuição contínua, a probabilidade é dada pela área contida no intervalo considerado. 15 P(x) f(x) 0 a c d b DISTRIBUIÇÃO UNIFORME OU RETANGULAR Quando se usa as distribuições uniformes? Quando a variável aleatória pode tomar qualquer valor numa escala contínua entre dois pontos (intervalo) e que estes valores sejam igualmente prováveis. 12 a-b Variância 2 ba Média 2 ab cd P dxc DISTRIBUIÇÃO NORMAL IMPORTÂNCIA DA DISTRIBUIÇÃO NORMAL - Retrata com boa aproximação, as distribuições de freqüência de muitos fenômenos naturais e físicos - Serve como aproximação das probabilidades binomiais quando n é grande - Representa a distribuição das médias e proporções em grandes amostras, o que tem relevante implicação na amostragem (a mais importante) Também é conhecida por “Distribuição Gaussiana”, em função do modelo matemático desenvolvido por Karl F. Gauss para este comportamento. CARACTERÍSTICAS - A curva normal tem a forma de sino - É simétrica em relação a média - Prolonga-se de - a + (apenas em teoria) - Fica completamente especificada por sua média e seu desvio padrão; há uma distribuição normal para cada par média e desvio padrão - A área total sob a curva é considerada 100% ou igual a 1 - A área sob a curva entre dois pontos é a probabilidade de uma variável normalmente distribuída tomar um valor entre esses pontos - A probabilidade de uma variável aleatória normalmente distribuída tomar exatamente determinado valor é zero (característica da distribuição contínua) - A área sob a curva entre a média e um ponto arbitrário é função do número de desvios padrões entre a média e aquele ponto A probabilidade de uma variável aleatória tomar um valor entre dois pontos quaisquer é igual à área sob a curva normal entre aqueles pontos 2 2 2 2 1 x x ef x – ponto considerado da distrib. µ - média da distribuição - desvio padrão da distribuição OBSERVAÇÃO x - µ = distância do ponto considerado à média Curva normal típica Média = µ Desvio padrão = média forma de uma boca de sino 50% 50% área sob a curva = 1 16 x z número de desvios padrões a contar da média. Ex.: 2,5 desvios padrões z = valor z ou score z. Pode-se obter valores negativos de z para valores de x inferiores à média A distância entre a média e um ponto qualquer é dado em número de desvios padrões (z) DISTRIBUIÇÃO BINOMIAL aproximada Pela NORMAL quando : np 5 e nq 5 Por POISSON quando: n 100 e np < 10 GRAUS DE LIBERDADE “A razão pela qual se recomenda usar n-1 ao invés de n no denominador da expressão de s2 está relacionada com o número de grau de liberdade. Esta questão é, possivelmente, abstrata; tomemos, por exemplo, as estatísticas µ e o2. Essas estatísticas têm n graus de liberdade, ou seja, n valores xi, livres que devem ser considerados para cálculo dos valores das estatísticas. Em outras palavras, desconhecendo-se qualquer valor xi, torna-se impossível a determinação do valor da estatística. Já a estatística s2, por usar x ao invés de µ, tem um grau de liberdade a menos, porque seu cálculo pressupõe-se que anteriormente já se tenha calculado x (usamos já uma vez todos os valores da amostra). No momento de usarmos novamente os valores xi, para cálculo de s2, esses valores tem n-1 graus de liberdade, pois, dados quaisquer n-1 deles, o valor restante estará perfeitamente determinado, pelo fato de já conhecermos a média, não sendo, portanto, livre”. Normal padronizada Normal não padronizada z = x - µ µ x 0 z P P -3 -2 -1 0 +1 +2 +3 68% 95,5% 99,7% n n 0% 50% 100% P(“sucesso”) 20 1 20 1 use a aproximação normal para n e p nesta área aprox. de Poisson aprox. de Poisson use a tabela ou a fórmula binomial para n e p nesta área 17 DISTRIBUIÇÃO t DE STUDENT E QUANDO TIVERMOS A VARIÁVEL CONTÍNUA DE UMA POPULAÇÃO COM DESVIO PADRÃO DESCONHECIDO E AMOSTRA PEQUENA ? - William Gosset (1876 – 1937), Irlandês, químico da Cervejaria Guinness. - A distribuição t se assemelha à distribuição normal Propriedades importantes - A distribuição t de varia conforme o tamanho da amostra (veja figura) - A distribuição t tem a mesma forma geral simétrica que a distr. normal, mas reflete a maior variabilidade que é esperada nas pequenas amostras - A distribuição tem média t = 0 (tal como a distr. normal padronizada com z = 0) - para grandes amostras, n > 30, a distribuição t se aproxima muito da distribuição normal. Nestes casos utiliza-se os valores de z (curva normal) no lugar de t (curva t). RELAÇÃO COM A CURVA NORMAL Pode-se observar ainda que a distribuição t é muito semelhante à curva normal. À medida em que aumentam os gl, a distribuição t aproxima-se da distribuição normal padronizada (média = 0, desvio-padrão = 1). A curva normal padronizada é um caso particular da distribuição t quando gl tende ao infinito. Para os propósitos práticos, os valores da distribuição t aproximam-se dos valores da distribuição normal padronizada relativamente depressa, tal que quando gl = 30 esses valores são quase idênticos. A distribuição t é uma distribuição de probabilidade teórica.É simétrica, campaniforme, e semelhante à curva normal standard. Difere da curva normal standard, porém, nisso tem um parâmetro adicional, os chamados graus de liberdade que mudam sua forma. GRAUS DE LIBERDADE Graus de liberdade, normalmente simbolizados por gl, são um parâmetro da distribuição t que pode ser qualquer número real maior que zero. Fixando o valor de gl definimos uma situação particular da família de distribuições t. Uma distribuição t com um gl menor tem mais área nas caudas da distribuição que uma distribuição com um gl maior. O efeito dos gl na distribuição de t está ilustrado nas três distribuições t mostradas na figura. Note-se que quanto menor o número de gl, mais aplainada (platocurtica) é a forma da distribuição, resultando em maior área nas caudas da distribuição. t0 gl = gl = 6 gl = 3 2,45 -3,18 -1,96 1,96 3,18 -2,45 n = 7 n = 4 Distribuição t de student com n = 3 Distribuição t de student com n = 12 Distribuição normal padronizada 18 Distribuição normal ou t ? início n > 30 população tem distr. normal população é conhecido usar distribuição t pelo teorema do limite central podemos usar a distrib. normal (use s se não for conhecido) usar métodos não-paramétricos ou de reamostragem usar a distribuição normal sim sim sim não não não 19 n = 100 n = 80 n = 60 n = 40 p= 0,1 p=0,5 p= 0,9 AMOSTRAGEM PROBABILÍSTICA 1. Sistemática – Lista aleatória de itens 2. Estratificada – Subgrupos homogêneos 3. Por Conglomerado – Itens fisicamente próximos uns dos outros AMOSTRAGEM NÃO PROBABILÍSTICA AMOSTRAGEM POR JULGAMENTO ERRO AMOSTRAL (ou randon error) Sabemos de antemão que no baralho existem 4 ases. A esse desvio na amostra em relação ao valor real é chamado de erro amostral. - Este tipo de erro não pode ser evitado mas pode ser controlado - De uma forma ou de outra ele interfere em nossa decisão - Esse erro, entretanto não ocorre de forma descontrolada, desde que a amostra seja retirada aleatoriamente do lote - Leis probabilísticas regem os limites de variação desse erro. - Ao retirar uma amostra com critério de aceitação definido, existe o risco de: - Um lote de má qualidade poder ser aprovado ou - Um lote de boa qualidade poder ser reprovado ERRO AMOSTRAL depende de três fatores 1 – Estatística que está sendo considerada A variabilidade associada a diferentes estatísticas amostrais, são descritas por diferentes distribuições de probabilidades 2 – Tamanho da amostra Há menor variabilidade entre estatísticas de grandes amostras do que entre pequenas amostras 3 – Variabilidade existente na própria população submetida a amostragem Populações com muita variabilidade produzem estatísticas amostrais com maior variabilidade do que populações com pequena variação entre os valores populacionais Distribuição Amostral Uma distribuição amostral é uma distribuição de probabilidades que indica até que ponto uma estatística amostral tende a variar devido a variações casuais na amostragem aleatória Duas distribuições amostrais mais usadas são a Binomial e a Normal Quanto a amostra aumenta: - A distribuição amostral das proporções tende para a forma da distribuição normal - A variabilidade amostral decresce - A média da distribuição amostral é sempre igual à proporção da população Quanto a Probabilidade de cada evento muda: DISTRIBUIÇÕES DE MÉDIAS AMOSTRAIS É uma distribuição de probabilidade que indica quão prováveis são as diversas médias amostrais. É função: - da média da população - do desvio padrão da população - do tamanho da amostra Conclusões importantes das distribuições de médias - A média da distribuição é sempre igual à média da população - desvio padrão (variabilidade) diminui quando aumenta o tamanho da amostra Média da distribuição amostral: xx 20 Desvio padrão da distribuição amostral n x x TEOREMA DO LIMITE CENTRAL (válido para médias amostrais) Capacidade de fazer inferência sobre parâmetros populacionais depende do conhecimento da distribuição amostral Precisamos conhecer: As estatísticas de interesse como média amostral e desvio padrão amostral Forma da distribuição amostral O teorema do limite central se refere exatamente à forma da distribuições amostrais: 1 - Se a população sob amostragem tem distribuição normal, a distribuição das médias amostrais também será normal para todos tamanhos de amostras. 2 - Se a população básica é não-normal, a distribuição de médias amostrais será aproximadamente normal para grande amostras. Após a análise do teorema do limite central, concluímos que não é necessário conhecer a forma da distribuição da população, bastando que o tamanho da amostra seja grande pois assim a distribuição amostral será normal. Uma regra prática muito usada é que a amostra deve consistir de 30 ou mais observações. População original normal uniforme assimétrica médias amostrais n = 5 médias amostrais n = 30 médias amostrais n =10 21 DISTRIBUIÇÕES AMOSTRAIS DAS PROPORÇÕES E DO NÚMERO DE OCORRÊNCIAS As distribuições amostrais de proporções e número de ocorrências são essencialmente as mesmas. Ambas dizem respeito à contagem de dados, e não à mensurações. amostra menor que 20 tab. binomial cálculo de probabilidade amostra maior que 20 normal Distribuição Amostral Média Desvio Padrão Pop. infiita Pop. Finita (n/N > 0,05) Médias x n x x 1 N nN n x x Proporções p 1 n pp p 1 1 N nN n pp p Nº de Ocorrências np 1 pnpnp 1 1 N nN pnpnp AMOSTRAGEM DE UMA POPULAÇÃO Populações grandes ou infinitas - Não há necessidade de reposição - Probabilidades de cada prova é constante Populações finitas ou quando amostra é superior a 5% da população ( n/ N > 5%) - Deveria se fazer a reposição, mas não se faz - A probabilidade de cada prova varia - Os desvios padrões das distribuições amostrais devem ser multiplicados pelo fator de correção finita 1 N nN N – população; n - amostra
Compartilhar