Baixe o app para aproveitar ainda mais
Prévia do material em texto
19 Variável Aleatória Discreta Uma função X, definida sobre o espaço amostral e assumindo valores num conjunto enumerável de pontos é dita uma variável aleatória discreta. Uma variável aleatória X do tipo discreto estará bem caracterizada se indicarmos os possíveis valores x1, x2, …, xk que ela pode assumir e as respectivas probabilidades f(x1), f(x2), …, f(xk), ou seja, se conhecemos a sua função de probabilidade (x; f(x)), sendo f(x) = P(X = x). O conjunto de pares ordenados (x; f(x)) é a função de probabilidade ou distribuição de probabilidade da v.a. discreta X se: i) ( ) 0, para todo if x i ; ii) 1 ( ) 1i i f x Exemplo 1: Se um experimento consiste em verificar o número de circuitos defeituosos num sistema formado por quatro circuitos, a função: X = “número de circuitos defeituosos”, define uma variável aleatória discreta, que pode assumir cinco valores possíveis: 0, 1, 2, 3 ou 4. Função de distribuição acumulada F(x) A função de distribuição acumulada fornece a probabilidade de que a variável em questão esteja abaixo de um determinado valor. Em geral, ela é representada por ou F x x e assim: 1 2 1 k k k k i i F x P X X P X x P X x P X x P X x . Exemplo 2: Considere a variável aleatória discreta X com a seguinte função de probabilidade: X 0 1 2 3 4 P[X = x] 0,1 0,3 0,4 0,1 0,1 1,0 Então, sua função distribuição acumulada é: X 0 1 2 3 4 F(x) 0,1 0,4 0,8 0,9 1,0 A distribuição de probabilidade da variável aleatória X pode ser representada graficamente por: Figura – Gráfico da função distribuição acumulada da variável aleatória X. 20 Exemplo 3: Se uma agência vende 50% de seu estoque de carro importado com “airbag”, determine a função de probabilidade e a função de distribuição acumulada para a variável número de carros com “airbags” entre os próximos 4 carros vendidos na agência. Resolução: Seja A carro vendido tem “airbag” e S o carro vendido sem “airbag”. Como 50% dos carros vendidos tem airbag, então P(A) = P(S) = 0,5. O espaço amostral possui 24 = 16 pontos. A v.a. número de carros com “airbag” entre os 4 vendidos pode assumir os valores 0, 1, 2, 3, 4. O numero de maneiras de se obter cada valor no espaço amostral é: A função de probabilidade pode ser apresentada pela fórmula 4( ) ; x = 0,1,2,3,4 16 xCf x ou na tabela, Tabela: Função de probabilidade para a v.a. número de carros com airbag. X 0 1 2 3 4 5 1 i i P X x P[X = x] 1/16 4/16 6/16 4/16 1/16 1 Observa-se que a distribuição de probabilidade acima é uma função de probabilidade pois, as condições (i) e (ii) foram satisfeitas, isto é, todas as probabilidades são maiores que zero e, a soma das probabilidades é igual a um. Exercício: Representar graficamente a função de probabilidade. Obter a função de distribuição acumulada e representar graficamente. Variável aleatória contínua Uma variável aleatória cujos valores são expressos em uma escala contínua é dita uma variável aleatória contínua. Uma v.a. contínua tem probabilidade zero de assumir exatamente um valor P(X = x ) = 0. As probabilidades são calculadas em intervalos como P(a < X < b ). Exemplos de v.a. contínuas são, o peso de recém-nascidos, a altura dos alunos, a temperatura ambiente, o diâmetro de peças. Função de densidade de probabilidade de uma v.a. contínua: A função f(x) é uma função densidade de probabilidade (fdp) da v.a. X se: 0 4 1 4 2 4 3 4 4 4 0 1 1 4 2 6 3 4 4 1 C C C C C maneira maneiras maneiras maneiras maneira 21 i) 0, f x x ; ii) 1f x dx . Observação: b a P a x b P a x b P X a P X b P a x b P a x b f x dx . Função de distribuição acumulada F(x) de uma v.a. contínua X. ( ) x F x P X x f t dt . Na função de distribuição acumulada tem-se: a) F x 0 1; b) se x x1 2 , então, F x F x1 2 ; c) ( ) ( )P a X b F b F a d) ( )( ) '( )dF xf x F x dx e) F 0 f) F 1 g) F(x) é uma função não decrescente. Exemplo: Suponha que o erro na temperatura de reação (em °C) para um experimento de laboratório seja a v.a. X com fdp dada por: 2 , -1< x < 2( ) 3 0, caso contrario x f x a) Verifique a condição (ii) b) Determine P(o < X < 1 ). c) Determine F(x) e use-a para determinar P(o < X < 1 ). Esboce o gráfico. Esperança matemática ou valor esperado de uma variável aleatória Em uma distribuição de probabilidade, ou função de densidade de probabilidade, existem valores numéricos muito importantes, chamados de parâmetros da distribuição, que são a esperança matemática, a variância e o desvio padrão. A esperança matemática da variável aleatória X - E(X) - é também chamada de valor esperado, e representa a média (aritmética) ou valor médio da variável. 22 Definição: Esperança matemática: Seja X uma variável aleatória com distribuição de probabilidade f(x). A média ou esperança matemática de X é dada por: xx xxpxxfXE )()()( , se X for discreta; e dxxxfXE )()( , se X for contínua. Propriedades da Esperança Matemática Supondo k uma constante e X e Y variáveis aleatórias, podemos definir as seguintes propriedades da esperança matemática: i) E(k) = k ii) E(kX) = kE(X) iii) E(X Y) = E(X) E(Y) iv) E(X k) = E(X) k v) Se X e Y são variáveis aleatórias independentes, então: E(XY) = E(X). E(Y) Exemplos: 1) Para o exemplo do carro com “airbag”, calcular a esperança de X. 2) Em um jogo de azar, um homem recebe $5 se consegue três caras ou três coroas, quando três moedas são jogadas, e paga $3 quando uma ou duas caras são obtidas. Qual é o seu ganho esperado? O jogo pode ser considerado justo? 3) Seja X a variável que denota a vida, em horas, de certo equipamento eletrônico, com fdp: 3 20.000 , x > 100 f (x) x 0 , caso contrário Qual o tempo médio de duração do equipamento? Variância e desvio padrão de uma variável aleatória X. A variância da variável aleatória X - Var(X) – é uma medida de dispersão (ou concentração) de probabilidades em torno da média. O desvio padrão - DP(X)- é a raiz quadrada da variância. Definição: Seja X uma variável aleatória com distribuição de probabilidade f(x). A variância Var(X) = 2 de X é: i) Se X for discreta, com x xfxXE )()( 22 : 23 22 2 2( ) ( ) ( ) ( ) ( ) x Var X f x x E X E X ; e ii) Se X for contínua com )()( 22 xfxXE : 22 2 2( ) ( ) ( ) ( ) ( )Var X x f x dx E X E X , Desvio padrão ( ) ( )xDP X Var X Exemplos: 1) Seja X a variável aleatória discreta número de automóveis usados com propósitos comerciais durante um dia de trabalho. A distribuição de probabilidades para as empresas A e B estão nas tabelas a seguir. Empresa A EmpresaB x 1 2 3 x 0 1 2 3 4 f(x) 0,3 0,4 0,3 f(x) 0,2 0,1 0,3 0,3 0,1 Mostre que a variância da distribuição de probabilidade da empresa B é maior do que a da empresa A. Represente graficamente as distribuições. 2) A demanda semanal por refrigerante, em milhares de litros, de uma loja de conveniência é a variável aleatória contínua X, que tem como densidade de probabilidade: 2(x 1), 1<x <2 f (x)0 , caso contrário Determine a média e a variância de X. 24 Modelos probabilísticos para variáveis aleatórias discretas As observações geradas por diferentes experimentos podem, por vezes, apresentar o mesmo tipo geral de comportamento. As variáveis aleatórias associadas a esses experimentos podem então ser descritas pela mesma distribuição de probabilidade, ou representadas por uma única fórmula. Para descrever o comportamento de muitas das variáveis aleatórias, existem importantes distribuições de probabilidade, também chamadas de modelos probabilísticos. Alguns dos principais modelos probabilísticos discretos são: - Distribuição uniforme discreta; - Distribuição de Bernoulli; - Distribuição Binomial - Distribuição Poisson; - Distribuição Geométrica; - Distribuição Hipergeométrica; - Distribuição Binomial negativa (Pascal); - Distribuição Polinomial. 1. Distribuição uniforme discreta É a mais simples das distribuições de probabilidades discretas. A variável aleatória assume cada um de seus valores com igual probabilidade. Definição: Considere uma v.a. X cujos valores são x1, x2, ..., xk, todos têm igual probabilidade de ocorrência 1k . Então, a v. a. X tem distribuição de probabilidade uniforme discreta dada por: 1f (x;k) P X x k ; x = x1, x2, ..., xk. A notação f(x;k) indica que a distribuição depende do parâmetro k. Exemplos. 1) Quando selecionamos aleatoriamente uma lâmpada, em uma caixa com 4 lâmpadas, sendo uma de 40, uma de 60, uma de 75 e uma de 100 watts, cada elemento do espaço amostral ocorre com probabilidade de 14 . Portanto, temos a variável aleatória X com distribuição uniforme: 1f (x;4) P X x 4 ; x = 40, 60, 75, 100. 2) No lançamento de um dado: 1f (x;6) P X x 6 x 1 2 3 4 5 6 f (x) 16 16 16 16 16 16 Representação gráfica: (exemplo) Média e variância da distribuição uniforme (parâmetros característicos da distribuição): x 1E(X) x k ou 1( ) 2 kE X e x 1Var(X) (x ) k ou 2 1( ) 12 kVar X 25 2. Distribuição de Bernoulli Considere uma única realização de um experimento aleatório, no qual se pode obter sucesso, com probabilidade p ou fracasso com probabilidade q, sendo p + q = 1. Seja a v.a. X igual ao número de sucessos em uma única tentativa. Então: O, fracasso com P(X 0) q X 1, sucesso com P(X 1) p Nessas condições a v. a. X tem distribuição de Bernoulli e sua função de probabilidade é dada por: x 1 xP(X x) p q ; sendo q = 1- p. Os parâmetros da distribuição de Bernoulli são: 1 0 ( ) ( ) 0 1 ( ) x E X xP X x q p E X p e ( ) (1 ) Var X p p pq Exemplos de variáveis de Bernoulli: Em uma linha de montagem, uma peça selecionada pode ser defeituosa (sucesso) ou não defeituosa (fracasso). No lançamento de uma moeda, cara (sucesso) ou coroa (fracasso). Uma semente avaliada pode germinar (sucesso) ou não germinar (fracasso). Exemplo: 1) Considere um experimento que consiste no lançamento de um dado e verifique a ocorrência da face 5 (sucesso) ou não. Determine a função de probabilidade e a distribuição acumulada. 2) Uma urna contém 4 bolas vermelhas e 6 brancas. Uma bola é extraída, observada sua cor e reposta na urna. Numa única extração somente dois resultados podem ocorrer: bola vermelha ou bola branca. a) Defina uma variável aleatória X neste experimento e indique o modelo de distribuição de probabilidades mais adequado para descrever seu comportamento. b) Determine a função de probabilidade de X e seu respectivo gráfico. c) Determine a função de distribuição de X e seu respectivo gráfico. d) Determine a esperança matemática e a variância de X. Interprete essas medidas. 26 3. Distribuição Binomial É uma generalização da distribuição de Bernoulli. É a mais importante das distribuições teóricas de probabilidade para variáveis discretas. São realizados n ensaios independentes de Bernoulli. A probabilidade de sucesso em cada ensaio é constante. Como as probabilidades p de sucesso se mantêm constantes em cada ensaio, a distribuição binomial é indicada para os casos em que a amostragem é feita com reposição. Definição: Seja a variável aleatória X que conta o número total de sucessos obtidos numa seqüência de n ensaios independentes de Bernoulli. A variável X segue uma distribuição binomial com parâmetros n e p, denotada por X ~ b(x; n, p), e tem função de probabilidade: n x n x x x n x x nb(x; n,p) P(X x) ( )p q C p q , x = 0, 1, 2, ..., n n é o nº de repetições do experimento; x é o nº desejado de sucessos; n - x é o nº esperado de fracassos; p é a probabilidade de sucesso num ensaio individual; 1 – p é a probabilidade de fracasso num ensaio individual; Exemplos: 1. A probabilidade de um produto fabricado não atender as especificações de projeto é igual a 5% (produto não-conforme). São selecionadas ao acaso 8 unidades deste produto. a) Defina uma variável aleatória X neste experimento e indique o modelo de distribuição de probabilidades mais adequado para descrever seu comportamento probabilístico. b) Determine a função de probabilidade de X e seu respectivo gráfico. c) Determine a função de distribuição de X e seu respectivo gráfico. d) Determine a esperança matemática e a variância de X. Interprete essas medidas. e) Qual a probabilidade de no máximo 5 não atenderem as especificações? f) Qual a probabilidade de pelo menos 3 não atenderem as especificações? 2. A probabilidade de que certo tipo de componente sobreviva a um teste de choque é de ¾. Determine a probabilidade de que dos próximos quatro componentes testados, a) exatamente 2 sobrevivam. b) pelo menos 2 sobrevivam. c) no máximo 2 sobrevivam. Os parâmetros da distribuição Binomial são: ( ) E X np e 2 ( ) Var X npq 27 4. Distribuição Poisson A distribuição Poisson ocorre quando se deseja contar o número de eventos de um certo tipo, verificados em um intervalo de tempo, de superfície (área) ou volume. Uma variável aleatória X com distribuição Poisson pode assumir infinitos valores no conjunto dos inteiros positivos (v.a. discreta). Exemplos de variáveis de Poisson: - Número de telefonemas recebidos por hora em um escritório. - Número de bactérias por unidade de área em uma lâmina. - Número de erros de digitação por página. - Numero de falhas de um computador em um dia de operação. Uma variável aleatória X com distribuição Poisson tem: função de probabilidade: xef (x; ) P(X x) x! parâmetros: x E(X) Var(X) A distribuição Poisson tem aplicação também nos casos em que os parâmetros n e p da distribuição binomial dificultam o cálculo por esta distribuição (eventos raros). Nesses casos, a Poisson é usada como aproximação da binomial, sendo a aproximação considerada adequada quando n é “grande” e p é “pequeno” n 50 e p 0,10 . Neste caso a media da Poisson será: = = n.p. Exemplos. 1) Durante um experimento de laboratório, o número médio de partículas que passam por um contador em um milésimo de segundo é quatro. a) Qual é a probabilidade de que seis partículas entrem em um dado contador, em um específico milésimo de segundo? R: 0,1042 b) Qual é a probabilidade de que 10 partículas entrem no contador, em 5 milésimos de segundo? c) Qual é a probabilidade de que no mínimo uma partícula entre em um dado contador, em dois milésimos desegundo? 2) Em certa instalação industrial, acidentes ocorrem com baixa freqüência. Sabe-se que a probabilidade de um acidente em certo dia é de 0,005, e os acidentes são independentes uns dos outros. a) Qual é a probabilidade de que, em qualquer período de 400 dias, haja 1 acidente em um dia? 0,271 b) Qual é a probabilidade de que haja no máximo três dias com acidente? R. 0,857 4. Distribuição Geométrica É aplicada nas mesmas condições da binomial exceto pelo fato de que o número de tentativas não é fixo. Utilizada quando desejamos saber a probabilidade que o primeiro evento de 28 sucesso ocorra na tentativa de número x. Desta forma, antes do evento x (sucesso) com probabilidade p, tivemos (x-1) fracassos, com probabilidade q = 1 – p. A v.a. X, definida como sendo o número de tentativas necessárias para se obter o primeiro sucesso, segue a distribuição geométrica, e sua função de probabilidade será: x 1P(X x) pq Parâmetros: 2 1 qE(X) Var(x) p p Observe que quanto menor for o valor de p (probabilidade de sucesso), maior será o número de experiências até o primeiro sucesso. Essa distribuição é muito utilizada em processos de controle de qualidade, e a variável é, muitas vezes, denominada de v.a. discreta de tempo de espera, pois representa a espera, em termos do número de falhas, até que ocorra o primeiro sucesso. Exemplos 1) Um rapaz está numa festa e sabe que a probabilidade de uma menina aceitar um convite para dançar é 0,2. Quantas recusas ele espera receber antes de conseguir uma parceira de dança? A probabilidade de sucesso é p = 0,2 e a probabilidade de falha, q = 1 − 0,2 = 0,8. A média é dada por: E(X) = 1/ p = 1/0,2 = 5. Portanto, ele pode esperar 4 negativas antes de achar uma parceira. 2) Um casal recorreu a uma técnica de inseminação artificial, cuja eficiência é de 20% e o custo de cada inseminação de U$ 2000. a) Qual a probabilidade de o casal ter êxito na primeira inseminação? b) Qual o custo esperado para se engravidar por este método? 5. Distribuição binomial negativa (Pascal) É uma generalização da distribuição Geométrica. Consiste em determinar a probabilidade de ocorrer o sucesso de número r da v. a.. Se x conta o número de eventos até que o r – ésimo sucesso ocorra, então, a v.a. X tem distribuição binomial negativa, e sua função de probabilidade é: r 1 r x r x 1P(X x) C p q Parâmetros: 2 r rqE(X) Var(X) p p Exemplo: Um vendedor de uma loja de eletrodomésticos tem por cota realizar 3 vendas por dia. Cada cliente, atendido por esse vendedor tem probabilidade 0,25 de efetuar uma compra qualquer. Qual a probabilidade do vendedor ter que atender a 5 clientes para completar sua cota? 0,0527 Em média quantos clientes ele deve atender para cumprir sua cota? 12 X=5 r=3 p=0,25 29 6. Distribuição hipergeométrica Aplicada em situações onde se vai proceder extrações casuais sem reposição, de uma população que apresenta dois atributos (sucesso e fracasso). É muito utilizada em testes de amostragem por aceitação (de produtos), testes eletrônicos e garantia de qualidade, em que o item testado é destruído e não pode ser reposto. Considere uma população de N objetos, r dos quais tem o atributo A e N – r tem o atributo B. Um grupo de n elementos é selecionado ao acaso sem reposição. Estamos interessados em calcular a probabilidade de que este grupo contenha X elementos com o atributo A. Esta probabilidade será dada por: x n x r N r n N C CP(X x) C Parâmetros: ; ( ) ; V ( ) 1 r N np E X np ar X npq N N N = tamanho da população, n = tamanho da amostra, r = número de sucessos na população, x = numero de sucessos na amostra Exemplo 1: Em um determinado processo de produção a cada 100 peças produzidas 5 são selecionadas e destruídas para análises. Espera-se que 10% das peças apresentem problemas na inspeção. a) Qual a probabilidade de que em um teste não ocorra peças com problemas b) Qual a probabilidade de obter pelo menos 2 com problemas c) Determinar o número médio e o desvio padrão de peças com problemas por inspeção. N = 100. n = 5; r = 10 0 5 10 90 5 100 ) ( 0) 0,5837 C Ca P X C ; 1 4 10 90 5 100 ) ( 1) 1 (0,5837 ) 0,0769 C Cb P X C ) ( ) . 5.0,1 0,5 100 5( ) . . . 5.0,1.0,9. 10,68 1 5 1 3, 27 c E X n p N nVar X n p q n Desvio padrão Exemplo 2: Uma remessa de 800 estabilizadores de tensão é adquirida por uma Empresa. São inspecionados 20 aparelhos da remessa, que será aceita se ocorrer no máximo um defeituoso. Há 80 defeituosos no lote. Qual a probabilidade do lote ser aceito? 0,3884 30 Modelos probabilísticos para variáveis aleatórias contínuas 1. Distribuição uniforme contínua Na distribuição uniforme, a probabilidade de se gerar qualquer ponto em um intervalo contido no espaço amostral é proporcional ao tamanho do intervalo. Uma variável aleatória contínua X tem distribuição uniforme no intervalo [a,b] se sua função densidade de probabilidade é dada por: 1 a x b f (x) b a 0 caso contrário 2( )( ) ; ( ) 2 12 a b b aE X Var X ; ( ) 1 b a f x (área do retângulo) f(x) 1/(b-a) a b x Figura 1– Função Densidade de Probabilidade para a Distribuição Uniforme F(x) Figura 2 – Função de distribuição acumulada Uniforme 2. Distribuição normal A distribuição normal ou de Gauss ou Gaussiana é uma das mais importantes distribuições da estatística. Além de descrever uma série de fenômenos físicos, naturais, financeiros, nas indústrias e nas pesquisas em geral, possui grande uso na estatística inferencial. É inteiramente descrita por seus parâmetros média e desvio padrão , ou seja, conhecendo-se estes é possível determinar qualquer probabilidade em uma distribuição Normal. - Seu gráfico tem a forma campanular (sino) - É uma distribuição simétrica em relação à média - É duplamente assintótica em relação ao eixo das abscissas - Tem dois pontos de inflexão que correspondem à media ± desvio padrão. 31 Uma variável aleatória contínua X tem uma distribuição normal ou gaussiana se a função densidade de probabilidade for dada por: 2 2 (x ) 21f (x) e 2 para - < x < , - < < e 2 > 0 Notação: X~N( , 2): X tem distribuição normal com média =E(X) e variância Var(X) = 2. Probabilidades (áreas) especiais: ( ) 0,68 P x x ; ( 2 2 ) 0,95 P x x ; ( 3 3 ) 0,99 P x x Função de distribuição acumulada: x F(x) P(X x) f (x)dx Cálculo de probabilidades: Suponha a v.a. X~N( , 2) 2 2 (x )b b 2 a a 1P(a x b) f (x)dx e dx 2 A integral não pode ser resolvida analiticamente. Distribuição normal padrão (padronizada ou reduzida) Seja 2~ ( , )X N . Subtraímos de x a média, dividimos pelo desvio padrão e obtemos a variável Z, que tem média zero e variância 1, sendo chamada de distribuição normal padronizada;~ (0,1)Z N cuja fdp é 2(Z) 21f (Z) e 2 ; sendo XZ . Com esta densidade, é possível resolver a integral e calcular probabilidades de intervalos, que podem ser tabelados para a variável Z. A variável X é transformada na variável Z, já que a transformação preserva a área abaixo da curva, ou seja, 1 2 1 2P(x x x ) P(z Z z ) , sendo 11 XZ e 22 XZ . A tabela de probabilidade Z, e o gráfico. (0 ) P Z z ( ) 1f x dx 32 Exemplo de uso da tabela: P(0 < Z < 1,64)= 0,4495 Calcular as seguintes probabilidades: a) P(0 < Z < 1,28) b) P(Z>1,96) c) P(Z< 2,57) d) P(Z< - 1,33) e) P(Z> -1,00) f) P( -1,00 < Z < 1,45) g) P( 1,00< Z < 1,96) Determinar os valores de k para: a) P(Z> k) = 0,0505 b) P( Z < k) = 0,9949 c) P( Z < k) = 0,0505 d) P(Z> K) = 0,8997 e) P(-1,00 < Z < k) = 0,6826 Exemplo1. Os registros indicam que o tempo médio para se fazer um teste é aproximadamente normal, com média de 50 min e variância 20 min2. Nestas condições, determinar: a) a porcentagem de candidatos que levam menos de 45 min. b) se o tempo concedido é de 1h, que porcentagem não conseguirá terminar o teste. Exemplo 2. Em um processo industrial, as especificações exigem que o diâmetro de um rolamento tenha medida de 3 0,01 cm . Sabe-se que a medida do diâmetro tem distribuição normal com média 3cm e desvio padrão de 0,005. Qual a porcentagem de peças que será inutilizada por estar fora das especificações? R: 0,0456 Exemplo 3. A nota média em um exame é 74, e o desvio padrão é 7. Se 12% da classe recebe A e as notas seguem uma distribuição normal, qual é o A mais baixo possível, e o B mais baixo possível (inteiros)? R: 83 e82 33 3. Distribuição exponencial A distribuição exponencial tem ampla aplicação em engenharia. É muito usada para modelar o tempo e o espaço entre ocorrências de um evento Poisson. - Exemplo: v.a. X número de veículos que passam por um cruzamento (X ~Poisson); v.a. T tempo entre as chegadas desses veículos no cruzamento (T ~ exponencial). Usada para calcular tempo de falhas. - Exemplo: intervalo de tempo entre o instante em que uma peça foi sujeita a esforço mecânico e o instante em que ocorreu a falha. Uma v.a. contínua tem X tem distribuição exponencial com parâmetro se sua fdp é dada por, 1 ; x 0, 0; caso contrário x e sef x Média e variância: 2 2( ) ; V ( )X XE X ar X . Exemplo 1. A duração em horas de certo equipamento segue a distribuição exponencial com fdp 5001 ; x 0 500 0; x < 0 x e sef x Calcular a duração média e o desvio padrão. Calcule a probabilidade de um equipamento durar mais que 500 horas. 500 P(X 500) f (x)dx = (R: 0,3678) Exemplo 2. Um sistema possui certo tipo de componente, cujo tempo, em anos, até a falha é modelado pela distribuição exponencial, com tempo médio até a falha de 5 . Se cinco desses componentes são instalados em sistemas diferentes, calcule a probabilidade de que pelo menos dois ainda estejam funcionando após 8 anos, sendo que o número de componentes funcionando segue a distribuição binomial. R : 0,2627 34 Amostragem e distribuições amostrais População ou Universo: é o conjunto de indivíduos ou elementos que apresentam uma ou mais características em comum (universo sob investigação). Amostra: é um subconjunto finito de uma população, que preserva as características dessa população (representatividade). Amostragem: é o ato de tomar amostras da população. Pode ser com ou sem reposição. Censo: Estudo de todos os elementos da população. Parâmetro: Medida usada para descrever uma característica populacional. Seu valor é geralmente desconhecido. Estimador: é uma variável que é função dos dados amostrais. Permite estimar o valor de um parâmetro. Estimativa: é o valor numérico obtido a partir do estimador. Exemplos: 1) Estudar a proporção de indivíduos, em uma cidade, que são favoráveis a certo projeto governamental. Uma amostra de 200 pessoas é sorteada, e a opinião de cada uma é registrada como sendo a favor ou contra o projeto; 2) Investigar a duração de vida de um novo tipo de lâmpada: 100 lâmpadas do novo tio são deixadas acesas até queimarem. A duração em horas de cada lâmpada é registrada. 3) a escolha de jogadores de futebol para fazer o exame de antidoping. Amostragem probabilística: Quando todos os elementos da população tiveram uma probabilidade conhecida e diferente de zero, de pertencer à amostra. Amostragem não probabilística: Quando não se conhece a probabilidade de um elemento da população pertencer à amostra. A amostragem é restrita aos elementos que se tem acesso (exemplos, usuários de drogas, voluntários em testes de remédios ou vacinas). O objetivo da amostragem é determinar métodos para estudar as populações por meio de amostras. A amostragem nos possibilita concluir (inferir) sobre um todo a partir de apenas uma parte. Razões para se amostrar: redução de custo e material, rapidez nos resultados, redução do trabalho, facilidade no treinamento de pessoal, o ato de observar pode ser destrutivo. Quando o uso de amostragem não é interessante? População pequena; necessidade de alta precisão. Principais técnicas de Amostragem: 1. Amostragem Simples ao Acaso ou Amostragem Aleatória Simples (AAS). É a técnica de amostragem mais simples e é utilizada quando a população é homogênea e finita. Pode ser feita com ou sem reposição. São sorteados n elementos de uma população de tamanho N. A probabilidade de selecionar um indivíduo específico da população para uma amostra é 1/N. O sorteio pode ser feito por qualquer método aleatório, como papéis ou bolas numeradas, calculadora computador, tabela de números aleatórios ou outros. Exemplo: a) escolher 10 funcionários no setor de produção de uma empresa para estudar o aumento de produtividade. AAS. b) escolher 10 funcionários de toda a empresa para estudar o aumento de produtividade. Deve-se usar outro tipo de amostragem (estratificada). 2. Amostragem Estratificada: 35 A população heterogênea é dividida em sub-populações homogêneas (estratos), e em seguida é feita a AAS em cada estrato. Suponha que uma população heterogênea de tamanho N seja dividida em L estratos de tamanhos 1 2 1 2 1 , , , e L L L h h N N N N N N N N . L amostras (AAS) são retiradas (uma amostra de cada estrato) de tamanhos : 1 2, , , Ln n n e 1 2 1 L L h h n n n n n (em que n é o tamanho da amostra). A amostragem estratificada pode ser classificada quanto ao tipo de estratificação, em : estratificação uniforme: cada estrato possui o mesmo número de elementos. O tamanho de amostra de cada estrato é n/L . estratificação proporcional : No critério proporcional extrai-se de cada estrato uma quantidade de elementos hn proporcional ao tamanho hN do respectivo estrato. Este critério é recomendado quando o tamanho dos estratos são distintos e a variabilidade dos estratos é homogênea. O tamanho da amostra do estrato hL é hn : h h n N n N estratificaçãoótima ( Partilha Ótima): O número de elementos hn é proporcional ao tamanho hN e ao desvio padrão h do respectivo estrato. 1 h h L h h h h n N n N Exemplo: Suponha que uma empresa hoteleira deseja realizar uma pesquisa com os seus 84 funcionários, em que 25 pessoas são do sexo feminino (F) e as 59 restantes do sexo masculino (M). Estabelecendo 9n (10% no mínimo), encontre o número de mulheres e de homens que devem ser entrevistados. 3. Amostragem Sistemática Enumeram-se todos os elementos da população 1, 2, , N e sorteia-se um primeiro elemento “ i ” para formar parte da amostra. Os demais são retirados em uma progressão aritmética, saltando “ r ” elementos, até completar o total da amostra (n). O valor “ r ” é chamado passos de amostragem e é determinado por: r = N/n. O primeiro elemento deve ser sorteado entre os r primeiros. Exemplo: Uma rua contém 1000 prédios, dos quais desejamos obter uma amostra sistemática formada por 100 deles. 36 4. Amostragem por Conglomerados Um Conglomerado é um subgrupo de elementos da população, que deve representar bem toda a população. A população é dividida em sub-populações (conglomerados) distintas (quarteirões, residências, famílias, bairros, estados, etc.). Alguns dos conglomerados são selecionados segundo a AAS e todos os indivíduos nos conglomerados selecionados são observados. Em geral, é menos eficiente que a AAS ou AE, mas é também mais econômica. Dentro de cada conglomerado há muita heterogeneidade, Entre os conglomerados há uma pequena variabilidade. Distribuições amostrais Considerem-se todas as amostras possíveis de tamanho “n” que podem ser retiradas de uma população de tamanho “N” (com ou sem reposição). Para cada amostra pode-se calcular uma grandeza estatística, como a média, o desvio padrão etc., que varia de amostra para amostra. Com os valores obtidos para determinada grandeza, podemos construir uma distribuição de probabilidades, que será denominada de distribuição amostral. Exemplo: Suponha uma v.a. X uniforme, com possíveis valores 1, 2, 3 (N=3). Retirar todas as amostras possíveis de tamanho n = 2, com reposição, e calcular a média em cada uma delas. Obter a distribuição amostral da média e a distribuição de x. Fazer os gráficos e comparar. Distribuição de X. x 1 2 3 p (x) 13 13 13 Distribuição amostral da média – Teorema do limite central (TLC) Se a v.a. X tem uma distribuição qualquer, com média X e variância 2 X , então a média amostral x , baseada em uma amostra de tamanho n, terá distribuição normal aproximada, com média XXE X e variância 2 2 X X n . Assim, a variável Z definida a seguir tem distribuição aproximadamente normal padrão, ou seja, 37 0,1X X a X X XZ N n . A aproximação é adequada para amostras maiores ou iguais a 30 n 30 . Quanto maior o tamanho da amostra, melhor será a aproximação. Para amostragem sem reposição, em população finita, fazer a correção a seguir, XE X e 1X N n Nn . Se a v.a. X tem distribuição normal tem-se, 2, XXX N 2 2, XXXX N n 0,1XXZ N n Distribuição t de Student – Distribuição amostral da média em pequenas amostras (n < 30) Se a v.a. X tem uma distribuição qualquer, com média X e variância 2 X , então a média amostral x , baseada em uma amostra de tamanho n < 30, terá distribuição aproximada t de Student, ou seja, 2 2, XXX SX t S n ; X X X X Xt SS n , em que S é o desvio padrão amostral. O valor de t associado às probabilidades pode ser obtido na tabela t de Student, em função do número de graus de liberdade v, sendo v = n – 1gl. Exemplo de uso da tabela. a) se v = 10, P t 1,093 b) se n = 16, P 1,34 t 2,131 c) se v = 20, P t 2,086 d) se n = 17, P 1,071 t 1,071 Exemplo 2. Encontre os valores de to: a) P(t > t0) = 0,10; com v = 13 b) P( t < t0) = 0,95 ; com v = 15 c) P( t0 < t < - 1,761) = 0,045; com n = 15 38 Distribuição amostral da diferença entre médias (amostras grandes 1 2n e n 30 ) Considerando duas variáveis aleatórias: - População 1: 1X com média X1 e variância 2 X1 , amostra de tamanho 1n . - População 2: 2X com média X2 e variância 2 X 2 , amostra de tamanho 2n . A distribuição amostral da diferença entre as médias, 1 2x x é, 1 2 2 2 2 1 2 1 21 2 1 2 X xX XX Xx x N n n - , ; 1 2 1 2 2 2 1 2 0,1X X a x x Z N n n . Exemplo: Um tratamento químico A garante duração média de 1400h para um peça, com desvio padrão de 200h.Um tratamento B garante duração média de 1200h com desvio padrão de 100h. Se forem amostradas 125 unidades de peças de cada tratamento, determine as probabilidades. a) de um elemento de cada tratamento durar mais que 1600h. b) da média da amostra A durar mais que 1420h. c) de os elementos da amostra A terem vida média superior aos de B em pelo menos 160h. Distribuição amostral da variância – Distribuição qui-quadrado 2 Se 2S é a variância de uma amostra aleatória (aa) de tamanho n, retirada de uma população normal, com variância 2 então a estatística 2 tem distribuição qui-quadrado com v = n-1 graus de liberdade (gl), sendo, 2 2 2 (n 1)S e 2 2P . A distribuição 2 não é simétrica e parte sempre da origem. Exemplo de uso da tabela. a) se n = 12, 2P 17, 275 b) se v = 3, 2P 11,345 39 Exemplo: Uma máquina está regulada para empacotar um produto com média de 500g e desvio padrão de 10g. Em uma amostra de 16 pacotes, qual a probabilidade da variância ser, a) maior que 48,407? b) menor que 121,63? Distribuição amostral de duas variâncias – Distribuição F – Snedecor. Se 21S e 2 1S são variâncias de amostras aleatórias independentes, de tamanhos 1n e 2n , retiradas de populações normais, com variâncias 21 e 2 2 , então a estatística F tem distribuição F – Snedecor, com 1 1 1v n e 2 2 1v n graus de liberdade, sendo, 2 1 2 2 2 1 1 2 2 2 2 2 1 2 2 2 S SF S S e 1 2P F F (v , v ) (área acima) Se 1 2F (v , v ) é o valor de F com 1v e 2v gl, (valor que deixa uma área acima dele), então, 1 1 2 2 1 1F (v , v ) F (v , v ) ( valor que deixa uma área (1 ) acima dele). A distribuição F não é simétrica e parte sempre da origem. Para cada probabilidade existe uma tabela. Exemplo de uso da tabela. a) sendo 1 9v e 2 15v P F 3,12 0,025 b) sendo 1 13n e 2 7n P F 4,0 1 P F 4,0 1 0,05 0,95 Exemplo. Se 21S e 2 1S representam variâncias de amostras aleatórias de tamanhos 1 21n e 2 31n , cujas populações têm variâncias 21 35 e 2 2 25 , encontre. a) 2 1 2 2 SP 2,702 S b) 2 1 2 2 SP 0,594 3,094 S 40 Distribuição amostral da proporção Considere uma população com N elementos, dos quais, B são portadores de uma característica e N-B são não portadores. A proporção de elementos portadores da característica na população é Bp N . Retirando-se umaamostra aleatória de tamanho n, e sendo Y o número de indivíduos portadores da característica na amostra, Y tem distribuição binomial com probabilidade de sucesso p. Usando a aproximação normal para a binomial, a proporção pˆ de indivíduos com a característica na amostra terá distribuição aproximadamente normal, ˆ 2 ˆ (1 )ˆ , pp p pp N p n e a estatística ˆ ˆ ˆ ˆ ^ 0,1 (1 ) p a p p p pZ N p p n Exemplo. Suponha que 30% dos alunos de um curso da ufu sejam mulheres. Em uma amostra aleatória de 10 alunos desse curso, calcula-se a proporção pˆ de mulheres. Calcule a probabilidade de que pˆ seja diferente de p em pelo menos 0,01. R: 0,056 Determinação do tamanho da amostra Suponha que a média populacional esteja sendo estimada por x e que o tamanho da amostra deve ser determinado de forma que o erro de estimação seja igual a um valor pré-fixado , com confiança dada. Assim, deseja-se determinar n tal que P x O valor de n encontrado é 2 2 2 Z n . A variância 2 pode ser estimada com uma amostra piloto. Exemplo. Suponha que uma amostra piloto de n = 10 seja extraída de uma população, fornecendo x 15 e 2S 16 . Determine o tamanho da amostra para que se tenha 0,5 e 0,95 . 41 Teoria da estimação A teoria da estimação baseia-se na estimação por ponto e estimação intervalar. Estimação por ponto (estimação pontual): um único valor numérico é usado como estimativa pontual do parâmetro populacional. Um estimador, qˆ , do parâmetro q é uma função qualquer dos elementos da amostra. Estimativa é o valor numérico assumido pelo estimador quando os valores observados são considerados. Assim, n i i X X n , é um estimador da média populacional m , e 50 cmX é uma estimativa da média populacional. Estimação intervalar (intervalos de confiança): Um intervalo de valores é usado para estimar o parâmetro populacional desconhecido. Atribui-se uma confiança (ou probabilidade) de que o verdadeiro valor do parâmetro esteja contido nesse intervalo, que é determinado com base na distribuição amostral do estimador. Intervalos de confiança (IC) Com uma confiança 1 determina-se um limite inferior e um limite superior entre os quais se espera que o verdadeiro valor do parâmetro esteja contido. Intervalo de confiança para a média populacional . Estima-se com uma confiança 1 que esteja contida no intervalo ;x e x e , ou seja, 1P x e x e . Para amostras grandes 30n : 2 2 2 IC ;(1 ) ; S S Se Z x Z x Z n n n . O tamanho da amostra para se estimar com uma confiança dada e um erro prefixado é: 2 2 0 Z S n e 0 01 nn n N . Para amostras pequenas 30n : 2 2 2 IC ; (1 ) ; S S Se t x t x t n n n . Dimensionamento da amostra: 2 2 0 t S n e 0 01 nn n N . 42 Exemplos 1. A concentração de zinco em uma amostra de material de36 locais diferentes é 2,6 gramas por mililitro com desvio padrão de 0,3 gramas. a) Determine intervalos de confiança de 95% e 99% para a verdadeira concentração média de zinco. b) Se desejamos estar 95% confiantes de que a estimativa de esteja distante por menos de 0,05, qual deve ser o tamanho da amostra.? 2. Os conteúdos de ácido sulfúrico em 7 contêineres similares são: 9,8; 10,2;10,4; 9,8; 10; 10,2; 9,6, em litros. Determine um IC de 95% de confiança para a verdadeira média de todos os contêineres. Intervalo de Confiança para diferença entre duas médias (amostras independentes): Amostras grandes , A Bn n 30 Estima-se com uma confiança 1 que A B esteja contida no intervalo ;A B A Bx x e x x e , ou seja, 1A B A B A BP x x e x x e . 2 2 2 A B A B e Z n n e A BX X são médias amostrais, isto é, são as estimativas pontuais das médias das populações, e A B respectivamente; e A B 2 2s s as variâncias populacionais e A Bn n tamanho das amostras retiradas das populações a e b, respectivamente; Se as variâncias populacionais forem desconhecidas, podem ser substituídas pelas variâncias amostrais. Amostras pequenas , A Bn n 30 (variâncias populacionais iguais, desconhcecidas) Sendo as populações homocedásticas A B2 2 2s s s , assim, e A BS S2 2 são duas estimativas para um mesmo parâmetro 2s então o intervalo de confiança para a diferença entre duas médias é dado por: 2; 2 100(1 )% 1 1: A BA B A B pn n A B X X t SIC n n com 2ta com 2A Bv n n graus de liberdade em que: 43 A A B B p A B n S n S S n n 2 21 1 2 . Intervalo de Confiança para proporção (amostras grandes n>30): 2 100(1 )% ˆ ˆˆ: pqP p zIC n Intervalo de Confiança para a diferença entre duas proporções 2 100(1 )% ˆ ˆ ˆ ˆˆ ˆ: A A B BA B A B A B p q p qP P p p zIC n n Regras de decisão envolvendo Intervalo de Confiança (IC) para diferença entre duas médias ou duas proporções. i) Se o IC incluir o zero, então, A B ou A Bp p . ii) Se os extremos do intervalo forem negativos, então, A B ou A Bp p . iv) Se os extremos do intervalo forem positivos, então, A B ou A Bp p . Exemplos. 1) Dois motores A e B foram comparados. O motor A, em 50 experimentos, apresentou milhagem média de 36 milhas/galão de combustível, com desvio padrão de 6 milhas. O motor B, em 75 experimentos apresentou milhagem média de 42 milhas/galão, com desvio padrão de 8. Determine um intervalo de confiança de 96% para B A . Decida com base no IC se existe diferença entre as médias. 2) Um novo processo de fabricação de um componente está sendo testado e comparado com o antigo. No antigo processo, 75 de 1500 itens são considerados defeituosos. No novo processo, 80 de 2000 itens são considerados defeituosos. a) Determine um IC de 90% para a proporção de defeituosos no antigo processo. b) Determine um IC de 90% para a proporção de defeituosos no novo processo. c) Determine um IC de 90% para a real diferença na proporção de defeituosos entre o antigo processo e o novo processo, e decida se o antigo processo deve ser substituído pelo novo. 44 Intervalo de confiança para variância ( 2 ) de uma população normal 2 2 2 2 2 ; 1 1 ; 1 2 2 1 1 ;(1 ) : ; v n v n n S n S IC ; considerando uma amostra de tamanho n. Exemplo Sabe-se que o tempo de vida de certo aparelho tem distribuição aproximadamente normal. Uma amostra de 25 aparelhos forneceu uma média de 500 horas e desvio padrão de 50 horas. Construa um intervalo com confiança de 98% para 2 . R: (1,396; 5,527) Intervalo de confiança para a razão entre duas variâncias 2 21 2 . Se 21S e 2 2S são as variâncias de amostras aleatórias de tamanhos n1 e n2, respectivamente, provenientes de duas populações normais independentes, com variâncias desconhecidas 21 e 2 2 , então um intervalo de confiança de 100(1 - α)% para o quociente (razão) de variâncias é dado por: 2 1 1 2 2 2 2 2 1 1 1 2 2; , 2 2 2 22; , 1;(1 ) : ; v v v v S SIC F S F S Regra de decisão envolvendo o intervalo de confiança (IC) para o quociente 2 21 2 : 1º) Se IC inclui 1 em sua extensão, então, estatisticamente 2 21 2 . 2º) Se IC > 1, então, estatisticamente 2 21 2 . 3º) Se IC < 1, então, estatisticamente 2 21 2 . Exemplo 1: De duas populações normais levantaram-se amostras de tamanho 9 e 11 respectivamente, obtendo-se 2 21 27,14 e 3,21S S . Construa um intervalo de confiança para o quociente das variâncias das duas populações ao nível de significância de 10% e verifique se as variâncias populacionais podem ser consideradas estatisticamente iguais. (0,72; 7,44) Exemplo 2: Uma companhia fabrica propulsores para uso em motores de turbinas de avião. Uma das operações envolve esmerilhar o acabamento de uma superfície particular para um componente de liga de titânio. Dois processos diferentes para esmerilhar podem ser usados, podendo produzir peças com iguais rugosidades médias na superfície. Uma amostra aleatória de 1 11n peças, proveniente do primeiro processo, resulta em um desvio padrão de 1 5,1S micro polegadas. Uma amostra aleatória de 2 16n peças, proveniente do segundo processo, resulta em um desvio padrão de 2 4,7S micro polegadas. Considerando que os dois processos sejam independentes e que a rugosidade na superfície seja normalmente distribuída, encontre um intervalo de confiança de 90% para a razão de duas variâncias. Existe diferença na variabilidade da rugosidade da superfície para os dois processos? R: (0,46; 3,35). 45 Teoria da decisão Teste de Hipóteses O teste de hipótese é uma regra de decisão para que permita aceitar ou rejeitar uma hipótese estatística, com base nos dados amostrais. O objetivo é verificar se os dados amostrais trazem evidência que apóiem ou não uma hipótese formulada. Definições Hipótese estatística: suposição quanto ao valor de um parâmetro populacional, ou quanto à natureza da distribuição de probabilidade de uma variável populacional. Exemplos: O peso médio é 50. ( 50) O número de pacientes atendidos segue uma distribuição de Poisson. A proporção de eleitores favoráveis a um candidato é 0,70. ( 0,70)p Tipos de Hipóteses a) Hipótese nula ou de nulidade 0H : geralmente é uma igualdade ou afirmação positiva com relação ao parâmetro populacional. b) Hipótese alternativa aH ou 1H : afirmação que geralmente envolve a desigualdade e contradiz 0H . Com base em 1H define-se a região crítica (RC) do teste ou região de rejeição de 0H (RR 0H ). Tipos de testes Supondo que o parâmetro de interesse seja a média (testar o valor 50kg ) a) Teste de hipótese bilateral 0 1 : 50 : 50 H H b) Teste de hipótese unilateral à esquerda 0 1 : 50 : 50 H H c) Teste de hipótese unilateral à direita 0 1 : 50 : 50 H H Tipos de erros a) Erro tipo I: Rejeitar uma hipótese nula quando ela é verdadeira. A probabilidade do erro tipo I é denotada por (nível de significância) b) Erro tipo II: Aceitar uma hipótese nula quando ela é falsa. A probabilidade do erro tipo II é denotada por . 46 Regra de decisão: Se o valor calculado da estatística do teste estiver na região crítica, deve-se rejeitar a hipótese nula. Se o valor calculado da estatística estiver na região de aceitação de H0, não se pode rejeitar a hipótese nula. Testes de hipóteses para a média a) Teste de hipótese para média μ de uma população Normal. H H 0 0 1 0 : : ou H H 0 0 1 0 : : ou H H 0 0 1 0 : : ; Estatística do teste : calc XZ n 0 Variância desconhecida: usar o desvio padrão amostral. População não normal i) amostras grandes ( 30)n usar distribuição Z. ii) amostras pequenas ( 30)n usar distribuição t de Student. Exemplo 1. Uma fábrica anuncia que o índice de nicotina dos cigarros da marca X apresenta-se abaixo de 26 mg por cigarro. Um laboratório realiza 10 análises do índice obtendo: 26, 24, 23, 22, 28, 25, 27, 26, 28, 24. Sabe-se que o índice de nicotina dos cigarros da marca X se distribui normalmente com variância 5,36 mg2. Pode-se aceitar a afirmação do fabricante, ao nível de 5%? Teste de hipótese para diferença entre médias de populações Normais com variâncias populacionais conhecidas. Estatística do teste: 1 2 1 2 2 2 1 2 1 2 calc X X Z n n . Variância desconhecida usar S. 0 1 2 1 1 2 : : H H ou 0 1 2 1 1 2 : : H H ou 0 1 2 1 1 2 : : H H Amostra pequena (n1, n2 ≤ 30) e variâncias populacionais iguais: 1 2 1 2 c p 1 2 (X X ) ( )t s 1 / n 1 / n ; A A B B p A B n S n S S n n 2 21 1 2 ; 1 2v n n 2 47 Teste de hipótese para a proporção Exemplo 2. Um fabricante de lentes intra-oculares está qualificando uma nova máquina de moagem. Ele qualificará a máquina se a porcentagem de lentes polidas que contenha defeitos na superfície não exceder 2%. Uma amostra aleatória de 250 lentes contém seis lentes defeituosas. Formule e teste a hipótese ao nível de 5% de significância. Teste de hipótese para a diferença entre duas médias. Exemplo 3. Ao estudar os efeitos de certa anomalia na estatura de recém-nascidos do sexo feminino, verificou-se, numa amostra de 30 crianças com anomalia, estatura média de 46,8 cm e desvio padrão de 3,44 cm e de 50 crianças normais, estatura média de 48,0 cm e desvio padrão de 2,99 cm. Teste a hipótese que a média dos anômalos e estatisticamente igual à média dos normais. Use nível de significância de 5%. Teste não paramétrico: Teste de qui-quadrado (χ2) O teste de χ2 mede a discrepância existente entre freqüências observadas e freqüências esperadas em um conjunto de dados, podendo ser utilizado como teste de aderência ou de independência Teste de aderência: é utilizado para verificar se as diferenças entre as freqüências esperadas e observadas são estatisticamente significativas. Procedimento: a) determinar o modelo teórico b) calcular as freqüências esperadas (fe) para cada classe. c) Comparar as freqüências esperadas e observadas (fo) com a estatística do teste: i i i 2 k o e2 c i 1 e f f f ; k é o número de classes, o número de graus de liberdade é v = k-1. Regra de decisão: Se 2 2, c v deve-se rejeitar H0 (o modelo teórico não se ajusta à distribuição observada). Teste de independência 48 H0: variável linha independe da variável coluna H1: variável linha e coluna são dependentes A estatística do teste é a mesma 2c , e a frequência esperada de cada classe é calculada por: e (total da linha)(total da coluna)f total . O número de graus de liberdade é v = (h-1)(k-1), sendo h o número de linhas e k o número de colunas. Exemplo 4. Verificar se a opinião dos moradores de uma cidade quanto a uma nova política de saúde é diferente, em várias classes sociais, ou seja, verificar se a opinião é dependente da classe social. Foi levantada uma amostra aleatória de 1000 pessoas estratificadas por classe a seguir: opinião classes baixa média alta total a favor 182 213 203 598 contra154 138 110 402 total 336 351 313 1000 49 REGRESSÃO LINEAR SIMPLES E CORRELAÇÃO Em problemas de engenharia e ciências, frequentemente existe interesse em encontrar modelos que permitam explorar a relação entre duas ou mais variáveis. A análise de regressão e correlação é uma técnica utilizada para esse fim. Na análise de regressão e correlação tem-se a classificação: - Análise de correlação; - Análise de regressão: Regressão Linear Simples; Regressão Linear Múltipla; Regressão não Linear; Com o objetivo de investigar a presença ou ausência de relação linear entre as variáveis, tem-se os passos: a) Inspeção visual: diagrama de dispersão b) Quantificando a força dessa relação: coeficiente de correlação. c) Explicitando a forma dessa relação: ajuste de uma reta de regressão. Análise de correlação: Verificar evidências de correlação entre as variáveis, e tentar medir sua intensidade (“força”). O diagrama de dispersão nos possibilita observar os dados graficamente e tirar conclusões prévias sobre a possível relação entre as variáveis. Exemplos: X idade de um automóvel e Y o seu valor de revenda. X temperatura ambiente e Y consumo de cerveja Exemplos de diagramas de dispersão e tipos de correlação: Coeficiente de correlação linear de Pearson O coeficiente de correlação mede o grau de associação linear entre duas variáveis, x e y, ou seja, mede a força e a direção do relacionamento linear entre as duas variáveis: O estimador do coeficiente de correlação linear populacional de Pearson é o coeficiente de correlação linear amostral, denotado por r (- 1 r +1). r = - 1: correlação linear negativa perfeita (reta decrescente). r = 1: correlação linear positiva perfeita (reta crescente). r = 0: não há correlação linear. O valor do coeficiente de correlação pode ser calculado por: SPxyr Sxx Syy ; em que, 50 1 1 1 n n i in i i i i i x y SPxy x y n ; 2 12 1 n in i i i x Sxx x n ; 2 12 1 n in i i i y Syy y n MODELO DE REGRESSÃO LINEAR SIMPLES Quando existe uma relação linear entre uma variável dependente (variável resposta) e uma variável independente (preditora ou explicativa), ajusta-se um modelo de regressão linear simples. Caso exista uma relação linear entre uma variável dependente e duas ou mais variáveis independentes, ajusta-se um modelo de regressão linear múltipla. Havendo relação linear entre as variáveis, o modelo de regressão linear tem o objetivo de descrever essa relação, podendo ser usado para fazer inferências sobre valores não observados. A estimação (previsão) de valores de y não deve ser feita para valores de x que estejam fora do intervalo considerado na regressão. O modelo estatístico de uma regressão linear simples é: 0 1i i iy xb b e iy : representa o i-ésimo valor observado; ix : representa a variável independente, i = 1, 2, ..., n; i : é o erro não observável associado a i-ésima observação; 0 1 e : são os parâmetros do modelo, que são o intercepto ou coeficiente linear e o coeficiente angular de regressão. Ao estabelecer o modelo de regressão linear simples, pressupomos que: i) A relação entre x e y é linear; ii) Os valores de x são fixos, isto é, x não é uma variável aleatória; iii) A média do erro é zero, isto é, 0, 1,2, , iE i n ; iv) Para um dado valor de x, a variância do erro é sempre constante, isto é, 2 2 , 1,2, ,i iV E i n v) os erros são independentes e tem distribuição Normal Estimação dos parâmetros: Método dos mínimos quadrados A reta que apresenta o melhor ajuste aos dados é aquela que minimiza a soma dos quadrados dos desvios entre os valores observados e os previstos pela própria reta (minimização dos quadrados dos resíduos). Equação da reta de regressão estimada: 0 1i iy b b x b1, inclinação da reta na amostra e pode ser usada para estimar 1. b0, intercepto do eixo Y na amostra e pode ser usado para estimar 0. Os estimadores de mínimos quadrados para 0 1 e são, respectivamente: 0 0 1 ˆ ˆb y x e 1 1ˆ SPxyb Sxx 51 Interpretação do coeficiente da regressão linear simples: Na regressão linear simples, interpreta-se 1ˆ como uma estimativa da alteração em y correspondente à alteração de uma unidade na variável independente. Exemplo 1: Com os dados a seguir, desenvolva uma equação de regressão estimada que possa ser usada para prever o custo total de determinado volume de produção. Volume de produção (unidades) Custos totais 400 4.000 450 5.000 550 5.400 600 5.900 700 6.400 750 7.000 Teste de significância da regressão linear simples A significância da regressão (do parâmetro 1 ) pode ser testada por meio da Análise de Variância (ANAVA). O objetivo é determinar se existe uma relação linear entre a variável de resposta y e a variável regressora x. Nessas, condições a hipótese testada é: H0: β1 = 0 H1: β1 ≠ 0 Se H0 for rejeitada, o teste nos dá evidências estatísticas para concluirmos que o parâmetro β1 não é igual a zero e, assim, a relação entre y e a variável independente x é significativa. Mas, se H0 não puder ser rejeitada, não se pode concluir que existe uma relação significativa. O procedimento da análise de variância é descrito a seguir, sendo p o número de parâmetros do modelo, n o número de observações da variável resposta (variável dependente), FV fontes de variação, GL graus de liberdade, SQ soma de quadrados, QM quadrado médio. Tabela 1 – Esquema da Análise de Variância de um modelo de regressão linear simples. FV GL SQ QM Fc Regressão p – 1 = 1 SQReg SQReg/( p - 1 ) = QMReg QMReg/QME Erro n – p = n - 2 SQErro SQErro/(n - 2)= QME Total n - 1 SQTotal Relação entre as somas de quadrados : SQTotal = SQReg + SQErro 52 22 2 1 1 ( ) n n i i i i i y SQTotal y y y Syy n ; 2 2 1 ˆRe ( ) n i i SPxy SQ g y y Sxx ; 2 1 ˆ( ) n i i i SQErro y y = SQTotal – SQReg Regra de decisão do teste. Critério do valor crítico: Rejeita-se H0 se Fc ≥ Fα em que Fα é obtido na tabela da distribuição F com 1 grau de liberdade no numerador e n – 2 graus de liberdade no denominador. Coeficiente de determinação (r2): porcentagem da variação total que é “explicada” pela regressão. 2 ReSQ gr SQtotal ; 20 1r Teste de hipótese para os parâmetros da regressão 0 1 e Outra forma de testar a significância da regressão é por meio do teste de hipótese do coeficiente angular 1 . A hipótese nula H0: β1 = 0 contra H1: β1 ≠ 0, é testada usando a distribuição t com n - 2 graus de liberdade. Estatística do teste: 1ˆct QME Sxx b . Pode-se testar também o parâmetro β0. Mas, o fato de β0 ser significativo não implica que existirá uma relação linear significativa entre x e y. Estatística do teste: 0 2 1 ˆ c n i i t QME x nSxx b Hipóteses: 0 0 1 0 : 0 : 0 H H b b Regra de Decisão: Rejeita-se H0 se 2; 2c nt t a ou 2; 2c nt t a (se tc pertencer a região crítica). Teste de Hipóteses para a correlação linear 21 2 c rt r n 0 1 : 0 : 0 H H r r Regra de decisão: rejeitar a hipótese nula ρ = 0 se o valor absoluto da estatística de teste excede os valores críticos (Tabela de t com n - 2 gl). Exemplo 2. Testar a significância da regressão estabelecida no exemplo 1.
Compartilhar