Baixe o app para aproveitar ainda mais
Prévia do material em texto
Universidade de São Paulo Faculdade de Zootecnia e Engenharia de Alimentos Departamento de Ciências Básicas Cx. Postal 23, CEP:13630-970 - Pirassununga - SP - Fone: (019) 3565-4143 ou 3565-4117 - FAX: (019) 561-8606 APOSTILA DE ESTATÍSTICA II Prof. Dr. César Gonçalves de Lima E_mail: cegdlima@usp.br Pirassununga - SP 2002 Material elaborado pelo Prof. Dr. César Gonçalves de Lima <cegdlima@usp.br> 1 SUMÁRIO Página 1. Introdução à Inferência Estatística ............................................................................................... 2 1.1. Como selecionar uma amostra ................................................................................................. 2 1.2. Outras técnicas de Amostragem ............................................................................................... 3 1.3. Definições iniciais .................................................................................................................... 3 1.4. Distribuições amostrais ............................................................................................................ 4 1.5. A distribuição amostral da média .............................................................................................. 4 1.6. A distribuição amostral da proporção ....................................................................................... 5 2. Algumas distribuições importantes ............................................................................................. 7 2.1. A distribuição de Qui-quadrado ................................................................................................ 7 2.2. A distribuição t-Student ............................................................................................................ 8 2.3. A distribuição F-Snedecor ....................................................................................................... 9 3. Estimação .................................................................................................................................. 10 3.1. Características de um bom estimador por ponto ........................................................................ 11 3.2. Estimação por intervalo ............................................................................................................ 11 3.2.1. Intervalo de confiança para a média populacional ................................................................. 11 3.2.2. Intervalo de confiança para a proporção ................................................................................. 13 4. Testes de hipóteses ...................................................................................................................... 14 4.1. Procedimentos básicos para a construção de um teste de hipóteses ............................................ 17 4.2. Teste sobre a média de uma distribuição normal quando a variância é conhecida ...................... 18 4.3. Nível descritivo do teste ........................................................................................................... 19 4.4. Teste de hipóteses para a proporção .......................................................................................... 20 5. Outros testes de hipóteses ............................................................................................................ 20 5.1. Teste sobre a média de uma distribuição normal quando a variância é desconhecida ................. 20 5.2. Teste para a variância de uma distribuição normal ................................................................... 21 5.3. Comparação das variâncias de duas populações normais ........................................................... 22 5.4. Comparações das médias de duas populações normais .............................................................. 24 5.4.1. Comparações das médias de duas populações normais quando as variâncias são desco- nhecidas, mas iguais .............................................................................................................. 24 5.4.2. Comparações das médias de duas populações normais quando as variâncias são desco- nhecidas e diferentes ............................................................................................................. 26 5.4.3. Comparações das médias de duas populações normais quando as observações são parea- das ........................................................................................................................................ 27 6. Correlação e regressão linear simples .......................................................................................... 28 6.1. Correlação linear de Pearson .................................................................................................... 29 6.2. Regressão linear simples .......................................................................................................... 31 6.2.1. O modelo para regressão linear simples ................................................................................. 32 6.2.2. Sobre os estimadores dos parâmetros da regressão ................................................................. 35 7. Testes de qui-quadrado ................................................................................................................ 37 7.1. Teste de aderência, ajustamento ou adequação de um modelo ................................................... 37 7.2. Testes em tabelas de contingência ............................................................................................ 39 7.2.1. Teste de homogeneidade ....................................................................................................... 39 7.2.2. Teste de Independência ......................................................................................................... 40 Distribuições de probabilidades ....................................................................................................... 42 Tábua I: Normal padrão .................................................................................................................. 43 Tábua II: Qui-quadrado ................................................................................................................... 44 Tábua III: t de Student .................................................................................................................... 45 Tábua IV: F-Snedecor ..................................................................................................................... 46 Revisão de somatórios .................................................................................................................... 47 Exercícios propostos ....................................................................................................................... 49 Bibliografia recomendada ............................................................................................................... 54 Material elaborado pelo Prof. Dr. César Gonçalves de Lima <cegdlima@usp.br> 2 1. INTRODUÇÃO À INFERÊNCIA ESTATÍSTICA Nas aulas anteriores (Estatística I) aprendemos como resumir descritivamente uma massa de dados (através de medidas de tendência central, dispersão, assimetria e curtose), como apresentar esses resultados (através de gráficos e tabelas) e conhecemos alguns modelos probabilísticos (binomial, Poisson e normal) usados para descrever fenômenos comuns em nossa área de atuação. A partir de agora, veremos como reunir todas essas informações com o intuito de estudar um ramo bastante importante da Estatística, conhecido como Inferência Estatística, que estuda como fazer afirmações sobre certas características de uma população, baseando-se em resultados obtidos em uma amostra. Neste contexto, entende-se por população qualquerconjunto de indivíduos ou objetos que têm pelo menos uma variável comum observável e por amostra, qualquer subconjunto da população. Exemplo 1.1 Consideremos uma pesquisa feita para estudar o ganho de peso dos bovinos de corte de um rebanho de 700 animais. Selecionamos uma amostra de 40 animais e anotamos os seus pesos no início e no final de um determinado mês. A partir desses dados calculamos os ganhos de peso. Neste caso a população é formada pelos 700 animais e a amostra pelos 40 animais selecionados. Na verdade, como estamos interessados no ganho de peso, a população é formada pelos ganhos de peso dos 700 animais e a amostra pelos ganhos de peso dos 40 animais selecionados. Estudando a distribuição dos ganhos de peso da amostra, esperamos que esta reflita a distribuição dos ganhos de peso do plantel. Com os dados em mãos, podemos estar interessados, simplesmente, em estimar o ganho de peso médio dos bovinos de corte ou então, em testar se o ganho de peso médio desses bovinos, neste particular mês, foi superior a 10kg. A solução desses problemas será tratada com detalhes nas próximas aulas sobre Estimação de Parâmetros e Testes de Hipóteses, respectivamente. 1.1 COMO SELECIONAR UMA AMOSTRA As observações colhidas numa amostra são tão mais informativas quanto mais conhecemos sobre a população de onde a amostra foi retirada. Por exemplo, para selecionarmos 40 animais de um lote de 700, devemos conhecer algumas características desses animais (raça, sexo, idade etc.) que podem influenciar nos resultados da variável em estudo. A maneira de se obter uma amostra é tão importante e existem tantas formas de fazê-la, que esses procedimentos constituem uma especialidade dentro da Estatística, conhecida como Técnicas de Amostragem. Distinguiremos dois tipos de amostragem: a probabilística e a não-probabilística. A amostra- gem será chamada de probabilística se todos os elementos da população tiverem probabilidades co- nhecidas e diferentes de zero, de fazer parte da amostra; caso contrário, a amostragem será chamada de não-probabilística. A amostragem probabilística implica um sorteio com regras bem determinadas, cuja realização somente será possível se a população em estudo for finita e totalmente acessível. As técnicas de Inferência Estatística pressupõem que as amostras utilizadas no estudo sejam probabilísticas, o que muitas vezes não se pode conseguir. Nesses casos, o bom senso deverá indicar quando o processo de amostragem, mesmo não sendo probabilístico, pode ser, para efeitos práticos, considerado como tal. O caso mais simples de amostragem probabilística é chamado de Amostragem Casual Sim-ples ou Aleatória, onde se atribui a cada elemento da população a mesma probabilidade de seleção, ou seja, a mesma chance de fazer parte da amostra. Podemos obter uma amostra casual simples (a.c.s.) escrevendo o nome de cada elemento da população num cartão, misturando-os numa urna e sorteando tantos cartões quantos forem os elementos que desejamos na amostra. O sorteio poderá ser feito com reposição (o cartão sorteado volta à urna antes do próximo sorteio) ou sem reposição (o cartão sorteado não volta mais à urna). Se a população for muito numerosa, podemos utilizar uma tabela de números aleatórios para facilitar o sorteio. Se estivermos interessados em sortear uma amostra casual simples de n elementos de uma população finita de tamanho N, o número de amostras possíveis será igual a (N)n se o processo de Material elaborado pelo Prof. Dr. César Gonçalves de Lima <cegdlima@usp.br> 3 retirada for com reposição, e n N se o processo de retirada for sem reposição. A relação n/N é chamada fração de amostragem. 1.2.. OUTRAS TÉCNICAS DE AMOSTRAGEM Amostragem Sistemática: é utilizada quando os elementos da população apresentam-se ordenados e a retirada dos elementos da amostra é feita periodicamente. Por exemplo, de um rebanho de N = 700 bovinos de corte, cujos dados estão registrados em fichas numeradas de 001 a 700, podemos retirar uma amostra de n = 10 animais utilizando o seguinte procedimento: i) sorteamos um número de 1 a 70 (note que 700/10=70), que corresponderá ao número da ficha do primeiro animal que fará parte da amostra; ii) as demais fichas (animais) serão retiradas, periodicamente, de 70 em 70. Amostragem por Conglomerados: é utilizada quando a população apresenta uma subdi- visão natural em pequenos grupos ou conglomerados. Para retirarmos uma amostra, sorteamos um número suficiente de conglomerados e os seus elementos constituirão a amostra. Neste caso, as unidades de amostragem são os conglomerados e não os elementos individuais da população. Este tipo de amostragem é adotado por motivos de ordem prática e econômica. Amostragem Estratificada: é utilizada quando a população pode ser dividida em dife- rentes subpopulações ou estratos, sendo razoável supor que a variável de interesse apresenta um comportamento bastante diverso de estrato para estrato e um comportamento razoavelmente homogê- neo dentro de cada estrato. Neste caso, se o sorteio dos elementos da amostra não considerar tais estratos, pode ocorrer que os diversos estratos não sejam convenientemente representados na amostra, a qual estaria mais influenciada pelas características da variável nos estratos mais favorecidos pelo sorteio. A amostragem estratificada consiste em especificar quantos elementos da amostra serão retirados de cada estrato. Geralmente são considerados três tipos de amostragem estratificada: a uniforme, a proporcional e a ótima. Na amostragem uniforme, sorteia-se igual número de elementos em cada estrato; na proporcional, o número de elementos sorteados em cada estrato é proporcional ao número de elementos existentes no estrato e na amostragem ótima, em cada estrato, retiramos um número de elementos proporcional ao número de elementos do estrato e também à variabilidade da variável de interesse no estrato, medida por seu desvio padrão. Para maiores detalhes sobre estas e outras técnicas de amostragem consulte, por exemplo: COCHRAN, W.G. Técnicas de Amostragem, Fundo de Cultura, Rio de Janeiro, 1955. 1.3. DEFINIÇÕES INICIAIS Para facilitar a linguagem usada, iremos diferenciar as características da amostra e da população. Chamaremos de parâmetro qualquer medida usada para descrever uma característica da população e de estatística, qualquer medida usada para descrever uma característica da amostra, ou seja, qualquer função dos elementos da amostra. Geralmente, usamos letras gregas minúsculas para simbolizar os parâmetros e letras do nosso alfabeto para as estatísticas, como por exemplo: Descrição Parâmetro(população) Estatística (amostra) Número de elementos N n Média µ X Variância σ2 S2 Desvio padrão σ S Coeficiente de correlação ρ(X,Y) r(X,Y) Material elaborado pelo Prof. Dr. César Gonçalves de Lima <cegdlima@usp.br> 4 1.4 DISTRIBUIÇÕES AMOSTRAIS Já sabemos que o problema básico da Inferência Estatística consiste em se fazer uma afirmação sobre parâmetros através de resultados obtidos na amostra. Suponhamos que o interesse esteja em fazer afirmações sobre um parâmetro θ (média, mediana, variância ou coeficiente de correlação, por exemplo) de uma certa população representada pela v.a. X. Desta população, sorteamos, com reposição, uma a.c.s. de n elementos e a nossa decisão sobre θ será baseada na estatística T = f(X 1 , X 2 , ...,X n ), que é uma função dos valores amostrais (X 1 ,X 2 ,...,X n ). Colhida uma amostra particular x1, x2, ..., xn calculamos o valor da estatística T (t1, por exemplo) e baseado neste valor faremos uma afirmação (ou inferência) sobre o parâmetro θ. A afirmação sobre o parâmetro θ será melhor compreendida se soubermos o que acontece com a estatística T quando retiramos todas as possíveis amostras de tamanho n da população, de acordo com o plano amostral adotado. Adistribuição dos possíveis valores da estatística T é chamada de distribuição amostral ou por amostragem da estatística T e desempenha um papel fundamental na teoria usada na Inferência Estatística. O procedimento utilizado para a obtenção da distribuição amostral da estatística T pode ser resumido da seguinte maneira: i) Da população X, estamos interessados no parâmetro θ. ii) De acordo com um certo procedimento de amostragem, retiramos todas as amostras de tamanho n da população X. iii) Para cada amostra (Xi1, Xi2, ...,Xin) calculamos o valor ti da estatística T, i = 1, 2, ... iv) Os valores ti formam uma nova população cuja distribuição de probabilidades recebe o nome de distribuição amostral da estatística T. 1.5. A DISTRIBUIÇÃO AMOSTRAL DA MÉDIA Consideremos uma população identificada pela v.a. X, cuja média µ = E(X) e variância σ2 = Var(X) são conhecidas. Exemplo 1.2. Consideremos, sem perda de generalidade, a população X = {4, 10, 16} com N = 3 elementos, média µ = 10 e variância σ2 = 24. Para cada uma das 32 = 9 amostras de tamanho n = 2, retiradas, com reposição, da população X, vamos calcular a média e a variância amostrais utilizando os seguintes estimadores: X = ∑ = n 1i iX n 1 e S2 = ∑ − − = n 1i 2 i )XX()1n( 1 e obtemos: Amostra X S2 (4; 4) 4 0 (4; 10) 7 18 (4; 16) 10 72 (10; 4) 7 18 (10; 10) 10 0 (10; 16) 13 18 (16; 4) 10 72 (16; 10) 13 18 (16; 16) 16 0 Utilizando esses resultados, construímos a distribuição de probabilidades da estatística X : x 4 7 10 13 16 P( X = x ) 1/9 2/9 3/9 2/9 1/9 e baseada nesta distribuição de probabilidades, temos que: Material elaborado pelo Prof. Dr. César Gonçalves de Lima <cegdlima@usp.br> 5 E( X ) = 4.(1/9) + ... + 16.(1/9) = 10 ⇒ E( X ) = 10 E( 2X ) = 4 .(1/9) + ... + 16 .(1/9) = 112 ⇒ Var( X ) = 112 - (10)2 = 12 ⇒ Var( X ) = 12 ou seja, que E( X ) = µ = 10 Var( X ) = σ2/n = 24/2 = 12 Observe que as diversas amostras produzem estimativas diferentes da média e da variância populacio- nais. Esta flutuação das médias amostrais ( X ) em torno da média populacional (µ) pode ser quantifi- cada através da variância da média amostral , Var( X ). Esses resultados numéricos obtidos indepen- dem da distribuição da v.a. X e podem ser generalizados no seguinte teorema: Teorema 1. Seja X uma população com média µ e variância σ2 e seja (X1, ..., Xn) uma a.c.s. de tamanho n retirada desta população. Então, E( X ) = µ e Var( X ) = σ2/n. Precisamos determinar agora qual é o modelo probabilístico da curva referente à distribuição de X. A obtenção dessa informação exige recursos matemáticos que estão fora dos objetivos deste curso. Apresentaremos, somente, os resultados mais importantes. Primeiramente, se X é uma v.a. com distribuição normal de média µ e variância σ2, pode-se demonstrar que a distribuição da estatística X também será normal de mesma média, µ, mas com variância σ2/n, isto é: X ~ N(µ, σ2) ⇒ X ~ N(µ, σ2/n) No caso mais geral, onde a distribuição da v.a. X não é normal ou é desconhecida, devemos usar os resultados do importante teorema apresentado a seguir. Teorema 2. Para amostras casuais simples de tamanho n retiradas de qualquer população com média µ e variância σ2, a distribuição amostral da média aproxima-se de uma distribuição normal com média µ e variância σ2/n, quando n tende para infinito. (Teorema do Limite Central). A rapidez dessa convergência depende da distribuição da população da qual a amostra é retirada: se a distribuição for simétrica e unimodal a convergência é bastante rápida. Para amostras com mais de 30 elementos, a aproximação pela distribuição normal pode ser considerada boa. Um outro resultado bastante interessante e que será utilizado freqüentemente nas próximas aulas está apresentado no seguinte corolário: Corolário 1: Se (X1, X2, ...,Xn) é uma a.c.s. de tamanho n da população X que tem média µ e variância σ2, então a variável Z = n X 2σ µ− ~ N(0, 1) quando n tende para infinito. 1.6 A DISTRIBUIÇÃO AMOSTRAL DA PROPORÇÃO Consideremos agora uma população em que a proporção de elementos portadores de uma certa característica é p. Por exemplo: a proporção de funcionários da lavoura que tem curso colegial completo; a proporção de eleitores de um determinado candidato; a proporção de animais com determinada doença etc.. Em qualquer um dos exemplos, cada elemento da população pode assumir dois valores: X = aacterístic tem a caremento não0, se o el rística a caracteemento tem1, se o el Material elaborado pelo Prof. Dr. César Gonçalves de Lima <cegdlima@usp.br> 6 onde ter a característica significa “ter o curso colegial completo”, ou “ser eleitor de um determinado candidato”, ou mesmo “ter uma determinada doença”. Assumindo que P(X=1) = p e P(X=0) = 1-p, temos: E(X) = 1.(p) + 0.(1-p) = p ⇒ E(X) = p E(X2) = 1.(p) + 0.(1-p) = p Var(X) = p - (p)2 = p(1-p) ⇒ Var(X) = p(1-p) Retirada uma a.c.s., com reposição, de n elementos da população X, indicamos por Sn o total de indivíduos portadores da característica na amostra. Já sabemos que Sn ~ B(n; p), isto é, Sn tem distribuição binomial de parâmetros n e p. Definindo � pcomo sendo a proporção (ou freqüência relativa) de indivíduos que têm a característica na amostra, isto é pˆ = Sn /n, a distribuição amostral de pˆ apresenta probabilidades iguais às probabilidades da distribuição de Sn, embora os valores assumi- dos por pˆ e Sn sejam diferentes. Então: E( pˆ ) = p e Var( pˆ ) = p(1-p)/n (Note a analogia de �pcom X ...) Para n grande, usando o Teorema do Limite Central, concluímos que pˆ ~ N(p; p(1-p)/n) e Z = n )p1(p ppˆ − − ~ N(0; 1) Exemplo 1.3 Foi sorteada uma amostra de 500 coelhos de uma granja e os animais foram inspecionados com respeito à presença de sarna de focinho e patas. Para estimar a "proporção de animais com sarna de focinho e patas", usamos a estatística pˆ = nSn onde Sn corresponde ao número de animais com sarna de focinho e patas e n ao número total de coelhos na amostra. Se Sn = 300 coelhos têm sarna de focinho e patas, uma estimativa da proporção de coelhos portadores de sarna, nessa granja, é �p= 300/500 = 0,60 e uma estimativa da variância dessa proporção é 0,60*0,40/500 = 0,00048. Enfim, além da média X e da proporção pˆ , podemos estudar a distribuição amostral de qual- quer estatística T = f(X1, X2, ...,Xn), mas quanto mais complexa for esta função f(.), mais difícil será a derivação matemática das propriedades da estatística T. Material elaborado pelo Prof. Dr. César Gonçalves de Lima <cegdlima@usp.br> 7 2 ALGUMAS DISTRIBUIÇÕES IMPORTANTES Agora, conheceremos outras distribuições de probabilidades que serão usadas em alguns testes de hipóteses e na construção de alguns intervalos de confiança bastante úteis em situações práticas. De cada distribuição serão conhecidas algumas características principais, como o gráfico, a média, a variância e os procedimentos usados no cálculo de probabilidades usando as Tábuas apresentadas no final da apostila. Também serão informadas as situações mais comuns onde essas distribuições são aplicadas. 2.1 DISTRIBUIÇÃO DE QUI-QUADRADO (χχ2) Definição 2.1 Seja {Z1, ..., Zν} uma amostra aleatória de n elementos retirada de uma distri- buição normal padronizada N(0; 1). Então, a variável Q = 21Z + ... + 2Zν = ∑ν =1i 2 iZ tem dis- tribuição qui-quadrado com ν graus de liberdade (gl), isto é, Q ~ 2 )(νχ . Pode-se provar que E(Q) = ν e Var(Q) = 2ν. O número de graus de liberdade (ν) refere-se ao número de variáveis normais independentes Z i , ao quadrado, que compõem a variável Q. A Figura 1 apresenta o gráfico da distribuição qui-quadrado com ν = 5 gl é: Figura 1 - Distribuição qui-quadrado com 5 g.l. A distribuição Qui-quadradotem diversas aplicações em Estatística e para o cálculo de proba- bilidades usaremos a Tábua II, que fornece os valores críticos qc tais que P(Q > qc) = p, para alguns valores de p e de ν. Por exemplo, se Q ~ 2 )10(χ e procuramos o valor crítico, qc, tal que 0,05 = P(Q > qc), iremos encontrá-lo na interseção da linha correspondente a ν = 10gl e da coluna correspondente a p = 0,05, ou seja, q c = 18,307. De modo análogo, se procuramos qc tal que P(Q > qc) = 0,95, iremos encontrar o valor 3,940. Esses resultados estão representados na Figura 2. PROBABILIDADE p ν ... 0,100 0,05 0,04 ... ... ... ... ↓ ... ... 10 ... 15,987 → 18,307 19,021 ... ... ... ... ... ... ... Material elaborado pelo Prof. Dr. César Gonçalves de Lima <cegdlima@usp.br> 8 Figura 2 - Valores críticos bilaterais da distribuição χ ( )10 2 para 1-α = 90% Uma estatística importante que será utilizada na construção de Intervalos de Confiança e nos Testes de Hipóteses sobre a variância de uma população normal é ∑ = − σ n 1i 2 i XX = ( )∑ = − σ n 1i 2 i2 XX1 = 2 2S)1n( σ − ~ 2 )1n( −χ 2.2 DISTRIBUIÇÃO t DE STUDENT É uma das mais importantes distribuições usadas na inferência estatística sobre médias de populações normais. Definição 2.2 Sejam as variáveis Z ~ N(0,1) e Q ~ 2 )(νχ , independentes. Então, a variável T= νQ Z tem distribuição t de Student com ν graus de liberdade. Pode-se provar que E(T) = 0 e Var(T) = ( )2−νν . O gráfico da distribuição t- Student é muito parecido com o da distribuição N(0; 1), sendo o primeiro apenas um pouco mais achatado que o segundo. Quando o número de graus de liberdade é grande, os gráficos das distribuições Normal e t- Student são praticamente iguais. O gráfico da distribuição t-Student com ν = 12 gl está apresentado na Figura 3. Figura 3 - Gráfico da distribuição t-Student com ν = 12 graus de liberdade Material elaborado pelo Prof. Dr. César Gonçalves de Lima <cegdlima@usp.br> 9 A Tábua III fornece valores críticos tc tais que P(T > tc) = p, para alguns valores de p e de ν. Por exemplo, se T ~ t(12) e p = 0,025, o valor tc = 2,179 será encontrado na interseção da linha corres- pondente a 12 gl e da coluna correspondente à probabilidade p = 0,025. PROBABILIDADE p ν ... 0,030 0,025 0,020 ... ... ... ... ↓ ... ... 12 ... 2,076 → 2,179 2,303 ... ... ... ... ... ... ... Quando o número de graus de liberdade da distribuição t-Student é grande, podemos usar a Tábua I da distribuição N(0,1) para obter os valores críticos tc. Uma estatística importante que será usada na construção de Intervalos de Confiança e nos testes de hipóteses sobre médias de populações normais é: T = n S X 2 µ− ~ t(n-1) , ou seja, tem distribuição t-Student com ν = n-1 graus de liberdade. 2.3 DISTRIBUIÇÃO F DE SNEDECOR Essa distribuição é bastante usada na comparação de variâncias de duas populações com distri- buição normal. Definição 2.3. Sejam as v.a. U ~ 2 1ν χ e V ~ 2 2ν χ , independentes. Então a variável F = 2 1 V U ν ν tem distribuição F de parâmetros ν1 e ν2 onde os parâmetros ν1 e ν2 correspondem, respectivamente, ao número de graus de liberdade do numerador e do denominador da variável F. Pode-se provar que: E(F) = 22 2 −ν ν e Var(F) = ( )( ) ( )42 22 2 2 21 21 2 2 −ν−νν −ν+νν . A Figura 4 apresenta o gráfico da distribuição F(ν1 = 10; ν2 = 12) Figura 4 - Gráfico da distribuição F(10; 12). Material elaborado pelo Prof. Dr. César Gonçalves de Lima <cegdlima@usp.br> 10 Os valores críticos fc tais que P(F > fc) = 0,05, para alguns valores de ν1 e ν2 podem ser encontrados na Tábua IV. Por exemplo, para uma variável com distribuição F(10,12), o valor 2,75 é encontrado na interseção da linha correspondente a ν2=12gl (denominador) e ν1=10 gl (numerador): ν1 GRAUS DE LIBERDADE DO NUMERADOR ν2 ... 9 10 12 ... ... ... ... ↓ ... ... 12 ... 2,80 → 2,75 2,69 ... ... ... ... ... ... ... Com a Tábua IV podemos também encontrar os valores críticos tais que P(F < fc) = 0,05 usando a identidade F(ν1; ν2) = ( )12 ;F 1 νν . Por exemplo, se F ~ F(10; 12) e estamos interessados no valor crítico inferior, fc, que P(F < fc) = 0,05, devemos primeiramente procurar o valor crítico na inter- seção da linha correspondente a (ν2 =) 10 gl com a coluna correspondente a (ν1 =) 12 gl. A partir deste valor (2,91), obtemos o valor crítico de interesse fazendo: fc = 1/2,91 = 0,34. Uma estatística importante que será utilizada na construção de Intervalos de Confiança para o quociente de duas variâncias e nos testes de hipóteses envolvendo as variâncias de duas populações normais é: F = 2 2 2 1 S S ~ F(n1-1; n2-1) ou seja, tem distribuição F-Snedecor com ν1 = (n1-1) e ν2 = (n2-1) graus de liberdade, onde n1 e n2 são os tamanhos das amostras retiradas das populações 1 e 2, respectivamente, cujos resultados são utilizados no cálculo das estimativas das variâncias 21S e 2 2S . 3 ESTIMAÇÃO Na produção de generalizações sobre a população com base em resultados obtidos de uma amostra, estão envolvidos a estimação e o teste de hipóteses sobre parâmetros. Basicamente, a estimação de parâmetros pode ser feita de duas maneiras: por ponto e por intervalo. Par a obtenção de bons estimadores pontuais, existem alguns métodos como: o Método dos Mínimos Quadrados, o Método da Máxima Verossimilhança, o Método dos Momentos etc. No entanto, estes métodos não serão apresentados com detalhes nesta apostila, podendo ser encontrados em outros textos básicos de Inferência Estatística (ver a bibliografia sugerida no final da apostila). Exemplo 3.1 A cada eleitor de uma amostra de 500 eleitores é feita uma pergunta a respeito da eleição de um determinado candidato. A resposta à pergunta poderá ser sim (favorável) ou não (contrário à eleição do candidato). A estimação da proporção (p) de eleitores favoráveis à eleição do candidato é feita utilizando-se o estimador pˆ = (número de eleitores favoráveis à eleição)/(número de eleitores na amostra) Deste modo, se 320 eleitores responderam sim à pergunta, uma estimativa da proporção de eleitores favoráveis à eleição do candidato é � p= 320/500 = 0,64 = 64%. Dúvidas: Será que pˆ é um bom estimador de p? Será que pˆ proporciona boas estimativas de p? Para responder a estas (e outras) perguntas iremos conhecer as características de um bom estimador por ponto, que serão apresentadas a seguir. Material elaborado pelo Prof. Dr. César Gonçalves de Lima <cegdlima@usp.br> 11 3.1 CARACTERÍSTICAS DE UM BOM ESTIMADOR POR PONTO Os estimadores por ponto ou pontuais são assim denominados porque especificam um único valor para o parâmetro. Em algumas situações podemos estar interessados em saber se um estimador tem boas qualidades; já em outras, podemos ter mais de um estimador para o mesmo parâmetro e desejamos escolher o melhor deles. Neste caso o julgamento pode ser feito analisando as seguintes propriedades desses estimadores: i) T é um estimador justo, não viesado ou não tendencioso do parâmetro θ se E(T) = θ. ii) T é um estimador consistente do parâmetro θ se for justo e se Var(T)lim n ∞→ = 0. iii) Se T1 e T2 são dois estimadores justos do parâmetro θ e ainda Var(T1) < Var(T2), então T1 é dito ser mais eficiente que o estimador T2. Dos estimadores que já conhecemos, pode-se provar que X e pˆ são estimadores justos e con- sistentes dos parâmetros µ e p, respectivamente. Um estimador não viesado e consistente para a vari- ância populacional σ2 é: S2 = ( )∑ = − − n 1i 2 i XX 1)(n 1 = − ∑ ∑ = = n 1i 2 n 1i i 2 i n X - X 1)(n 1 (para maiores detalhes,ver FONSECA & MARTINS, 1982, pg.155-157) 3.2 ESTIMAÇÃO POR INTERVALO A estimativa por ponto de um parâmetro θ é bastante útil, embora não dê qualquer indicação da precisão a ela associada. É desejável que uma estimativa por ponto esteja acompanhada por alguma medida do erro da estimativa. Por exemplo, uma estimativa pontual pode ser acompanhada de algum intervalo a respeito dessa estimativa, juntamente com alguma medida de segurança ou de confiança de que o verdadeiro valor do parâmetro caia neste intervalo. Nesta situação, estamos falando da estima- ção de parâmetros por intervalo. O estimador por intervalo que tem associada uma probabilidade, recebe o nome de Intervalo de Confiança (I.C.). Os limites inferior e superior desse intervalo são chamados de limites (inferior e superior) de confiança. A probabilidade de que o I.C. contenha o verdadeiro valor do parâmetro θ é chamada de Coeficiente de Confiança e é denotada pela letra grega γ (gama). A amplitude de um I.C. é calculada fazendo-se a diferença entre os dois limites de confiança (superior e inferior). Nosso objetivo é encontrar um estimador por intervalo que produza intervalos pequenos, se possível, e incluam o verdadeiro valor do parâmetro θ com uma confiança (γ) alta. 3.2.1 INTERVALO DE CONFIANÇA PARA A MÉDIA POPULACIONAL Já sabemos que se uma variável aleatória X tem distribuição N(µ; σ2), a média X obtida a partir de uma amostra de tamanho n tem distribuição N(µ; σ2/n ) e a variável Z = n X 2σ µ− ~ N(0, 1). Material elaborado pelo Prof. Dr. César Gonçalves de Lima <cegdlima@usp.br> 12 Fixando uma probabilidade γ, iremos considerar um intervalo simétrico em relação à origem, tal que γ = P(-zc< Z < zc), onde zc (ver Figura 5) pode ser obtido da Tábua I e o seu valor depende exclusiva- mente da confiança (γ) que desejamos na estimativa por intervalo. Então: Figura 5 - Distribuição normal padrão γ = cc ≤µ−≤− σ z n X zP 2 = +≤µ≤− σσ n zX n zXP cc e o I.C. para a média populacional, µ, com um coeficiente de confiança γ, é I.C.(µ; 100γ%) = +− σσ n zX; n zX cc e dizemos que este intervalo contem o verdadeiro valor da média populacional com uma confiança de 100γ%. Note que este I.C. é centrado na média X e a sua amplitude é igual a 2 n z � c . O coeficiente de confiança (γ) deve ser entendido da seguinte maneira: “se a partir de K amostras independentes de tamanho n, calculamos K intervalos de confiança (diferentes) para a média µ, pelo menos K*γ desses intervalos deverão cobrir (incluir) o verdadeiro valor de µ”. Exemplo 3.2 Sabemos que o peso de bovinos Nelore aos 210 dias de idade tem distribuição normal com variância 400kg2. Baseado numa amostra de 30 animais, com peso médio de 186kg: a) construir um I.C. para o peso médio (populacional) desses bovinos com um coeficiente de confiança γ = 0,95; b) idem, para γ = 0,99; c) calcular a confiança que se tem na afirmação de que o verdadeiro peso médio desses bovinos é [180; 192] kg. Resolução: (a) Da Tábua I, o valor de zc, tal que 0,95 = P(-zc < Z < zc) é zc = 1,96. Com os valores amostrais e a fórmula acima definida calcular os limites de confiança: 0,95 = +≤µ≤− 30 2096,1186 30 2096,1186P ⇒ I.C.(µ; γ=95%) = [ ]3,16178,84; 19 kg, ou seja, este intervalo (de amplitude 14,32kg) contem o verdadeiro valor do peso médio dos bezerros com 95% de confiança. (b) 0,99 = P(-zc < Z < zc) ⇒ zc = 2,58. Assim, o I.C.(µ; γ=99%) = [176,58; 195,42] kg, contem o verdadeiro valor do peso médio dos bezerros, com uma confiança de 99%. (c) a amplitude do I.C.(µ) é 192−180 = 12kg ⇒ 12 = 2. zc 20 30 ⇒ zc = 1,64 ⇒ γ = P(-1,64<Z<1,64) = 2P(0<Z<1,64) = 2(0,4495) = 0,8990, ou seja, é de 89,9% a confiança na afirmação de que o verda- deiro peso médio dos bezerros está contido no intervalo [180; 192]kg. Material elaborado pelo Prof. Dr. César Gonçalves de Lima <cegdlima@usp.br> 13 Geralmente não conhecemos a variância populacional (σ2) e neste caso precisamos estimá-la com base em dados de uma amostra representativa da população, usando um bom estimador como S2, por exemplo. Quando o tamanho da amostra é relativamente grande (n>30), o Teorema do Limite Central garante que a v.a. T = n S X 2 µ− ~ N(0; 1) e neste caso, o I.C.(µ) é calculado através de: I.C.(µ; 100γ%) = +− n S zX; n S zX cc Quando o tamanho da amostra é pequeno, não podemos usar o Teorema do Limite Central e a estatística T, definida anteriormente, não tem distribuição N(0; 1), mas sim, distribuição t-Student com ν = n−1 graus de liberdade. Esta nova distribuição de probabilidades tem um único parâmetro, ν, chamado número de graus de liberdade. Por exemplo, vamos encontrar o valor crítico tc = 2,093, tal que γ = 0,95 = P(-tc <T< tc) e T~t(19), na interseção da linha correspondente a ν = 19g.l. e coluna correspondente a p = 0,025 (ver Figura 6). Verifique que na Tábua III tc = 1,729 para γ = 90% e tc = 2,861 para γ = 99%. Figura 6 - Distribuição t(19) Fixado um valor para o coeficiente de confiança (γ) e obtido o valor crítico, tc, na Tábua III, o I.C.(µ, 100γ%) é calculado através da fórmula: I.C.(µ; 100γ%) = +− n S t X; n S t X cc Exemplo 3.3. Dez animais foram alimentados com uma certa ração durante 15 dias e verificou-se que os ganhos de peso foram: 2,71; 2,93; 3,10; 3,12; 3,23; 3,76; 3,89; 4,01; 4,16 e 4,23 kg. Construir um intervalo de confiança para o ganho médio de peso com γ = 0,90. Resolução: • uma estimativa da variância populacional é s2 = − − 10 )14,35(2546,126)110( 1 2 = 0,3081. • da Tábua III, com γ = 0,90 e 9 g.l. obtemos tc = 1,833; da amostra temos x = 3,51 e então: • I.C.(µ; γ=90%) = 3,51 ± 1,833 10 3081,0 = 3,51 ± 0,32 = [3,19; 3,83] kg, ou seja, este intervalo contem o verdadeiro valor do ganho de peso médio com 90% de confiança. 3.2.2 INTERVALO DE CONFIANÇA PARA A PROPORÇÃO Fixando-se um coeficiente de confiança γγ e obtendo-se o respectivo valor zc da Tábua I, o intervalo de confiança para a proporção de sucessos, p, é obtido por: I.C.(p; 100γ%) = [ ] np)p(1zpˆ ; np)p(1zpˆ cc −+−− onde � p= (número de sucessos)/(número de tentativas) é uma estimativa da proporção p, calculada a partir dos n valores amostrais. Material elaborado pelo Prof. Dr. César Gonçalves de Lima <cegdlima@usp.br> 14 Porém, na maioria das vezes, o valor do parâmetro p não é conhecido, impossibilitando o uso desta última fórmula. As possíveis soluções para este problema são: (a) no caso de grandes amostras, substituir na fórmula o valor de p pelo valor de sua estimativa �p , calculada a partir dos resultados amostrais (b) no caso de pequenas amostras, usar a fórmula do Intervalo de Confiança Conservativo para a proporção, que está baseada no fato de que o produto p(1-p) ≤ 0,25, cuja fórmula é: IC*(p; 100γ%) = [ ]n/25,0zpˆn/25,0zpˆ cc +− ; Exemplo 3.4 Construir um IC para a proporção de eleitores favoráveis ao candidato X, com um coeficiente de confiança de γ = 0,99, sabendo-se que de uma pesquisa eleitoral envolvendo uma amostra de 1000 eleitores, somente 248 foram favoráveis à sua eleição. Resolução: • na amostra: pˆ = 248/1000 = 0,248 é a proporção de eleitores favoráveis ao candidato X; • γ = 0,99 = P(-zc ≤ Z ≤ zc) ⇒ zc = 2,58 • como n = 1000 é grande, I.C.(p; 99%) = 0,248 ± 2,58 1000)248,01(248,0 − = 0,248 ± 0,035 = [0,213; 0,283], ou seja, este intervalo (amplitude 0,07) contem a verdadeira proporção de eleitores favoráveis à eleição do candidato X com uma confiança de 99%. • se resolvêssemos construir um I.C. Conservativo para a proporção, teríamos: IC*(p; 99%) =0,248 ± 2,58 100025,0 = 0,248 ± 0,041 = [0,207; 0,289], que tem uma amplitude de 0,082 unidades. 4. TESTES DE HIPÓTESES Outro problema fundamental da Inferência Estatística envolve a execução de testes de hipóteses sobre o valor de parâmetros de interesse de uma população de estudo. Se conhecemos todos os elementos da população (o que é bem pouco provável...) também deveremos conhecer o verdadeiro valor de um particular parâmetro de interesse e não precisaremos estimá-lo nem testar hipóteses sobre o seu valor. Porém, na maioria das vezes, não teremos acesso a todos os elementos da população e as nossas conclusões deverão ser baseadas em resultados obtidos de uma amostra representativa da população. Para resolver este problema, buscaremos definir algumas ferramentas estatísticas que permitam validar ou refutar uma hipótese sobre algum parâmetro (desconhecido) de interesse. O procedimento básico para a execução de um teste de hipótese sobre a média (µ) de uma população normal cuja variância (σ2) é conhecida, será introduzido através do Exemplo 3.1. Exemplo 4.1 Está sendo realizado um leilão de bezerros Nelore com idade de 210 dias, aproximadamente. Os bezerros são procedentes de duas grandes fazendas: FAZ-1 e FAZ-2. Sabe-se que os animais da FAZ-1 têm peso médio de 145kg e desvio padrão de 12kg, enquanto os animais da FAZ-2 têm peso médio de 155kg e desvio padrão de 20kg. Um lote desses animais, de procedência ignorada, vai para leilão a um preço convidativo e um comprador leigo, para fazer ou não uma oferta, precisa conhecer a procedência dos animais. O edital do leiloeiro informa que um pouco antes do leilão será divulgado o peso médio ( x ) de um lote de 25 animais. Com base neste valor, que regra de decisão o comprador deve usar para saber se o lote de animais que vai para leilão é da FAZ-1 ou da FAZ-2 ? Uma resposta imediata é a de considerar que os animais são da FAZ-1 se o valor de x estiver “próximo” de 145, e da FAZ-2 se o valor de x estiver “próximo” de 155. Podemos definir a seguinte regra de decisão: Material elaborado pelo Prof. Dr. César Gonçalves de Lima <cegdlima@usp.br> 15 Se x < 150, os animais são da FAZ-1 e se x ≥ 150, os animais são da FAZ-2 Suponhamos que o comprador seja informado que x = 148kg. Então, de acordo com a regra de decisão adotada, ele conclui que o lote de animais é procedente da FAZ-1. Porém, ficam algumas dúvidas sobre esta decisão: • Será que o comprador pode estar enganado quanto à procedência dos animais? • É possível que o peso médio de um lote de 25 animais da FAZ-2 seja igual a 148kg? • É possível que o peso médio de um lote de 25 animais da FAZ-1 seja superior a 150kg? Note que estas dúvidas sobre a real procedência dos animais continuariam existindo mesmo se o peso médio da amostra de 25 animais fosse igual a 154kg, ao invés de 148kg... Estudemos os dois tipos de erro que o comprador pode cometer ao tomar uma decisão numerando-os para facilitar a linguagem: Erro tipo I: concluir que os animais são da FAZ-1, quando na verdade são da FAZ-2. Isto acontece quando a amostra de 25 animais da FAZ-2 apresenta x < 150. Erro tipo II: concluir que os animais são da FAZ-2, quando na verdade são da FAZ-1. Isto acontece quando a amostra de 25 animais da FAZ-1 apresenta x ≥ 150. De forma análoga, vamos definir também duas hipóteses numeradas: H0: os animais são da FAZ-2, ou seja, o peso dos animais tem uma distribuição com média µ2 = 155kg e desvio padrão σ2 = 20kg. H1: os animais são da FAZ-1, ou seja, o peso dos animais tem uma distribuição com média µ1 = 145kg e desvio padrão σ1 = 12kg. Indiquemos por R.C. (Região Crítica) a região correspondente aos valores de X iguais ou inferiores a 150, que nos levam a rejeitar a hipótese H0, ou seja, RC = { X ∈ R: X < 150}. Com esta notação, a probabilidade de cometer cada um dos erros pode ser escrita como: P(Erro tipo I) = P( X ∈ RC | H0 é verdadeira) = α P(Erro tipo II) = P( X ∉ RC | H1 é verdadeira) = β Supondo que o peso dos bezerros Nelore tem distribuição normal e que a hipótese H0 é verda- deira (os animais são da FAZ-2), X ~ N(155; 16). Assim, a probabilidade de cometer o erro do tipo I é igual a: α = P(Erro tipo I) = P ( )6) ~ N(155,1X150 | X < = P − < 16 155150Z = P(Z < -1,25) = 0,10565 Assumindo que a hipótese H1 é verdadeira, X ~ N(145; 5,76) e a probabilidade de cometer o erro do tipo II é igual a: β = P(Erro II) = P ( ))5,76 ~ N(145; X50 | 1X ≥ = P −≥ 76,5 145150Z = P(Z ≥ 2,08) = 0,01876 Resumindo, temos: ORIGEM REAL DOS ANIMAIS DECISÃO FAZ-1 FAZ-2 os animais são da FAZ-1 sem erro Erro tipo I (α = 10,56%) os animais são da FAZ-2 Erro tipo II (β = 1,88%) sem erro Material elaborado pelo Prof. Dr. César Gonçalves de Lima <cegdlima@usp.br> 16 De acordo com a regra de decisão adotada o comprador estará cometendo o Erro tipo I com maior probabilidade (α = 10,56%) que o Erro tipo II (β = 1,88%). De certo modo, a regra de decisão estipulada parece privilegiar a afirmação de que os animais são originários da FAZ-1. Em relação ao mecanismo dos erros, vale observar que: i) o tamanho dos erros tipo I e II depende exclusivamente da regra de decisão adotada, que por sua vez está diretamente relacionada com a região crítica do teste; ii) para cada regra de decisão adotada, teremos outros valores de α e β; se escolhermos um valor para X <150, o valor de α diminuirá, enquanto que o valor de β aumentará. Se, ao contrário, escolher-mos um valor para X > 150, a probabilidade β diminuirá mas α aumentará. iii) existe um ponto X em que os valores de α e β são iguais. Com os dados deste exemplo, este ponto é X = 148,75 e os valores de α e β são iguais a 5,94% (Verifique este resultado, como exer-cício!!). iv) no caso geral, onde a hipótese alternativa H1 corresponde a uma desigualdade, o valor de β não pode ser calculado porque não temos um único valor alternativo para µ. v) os erros envolvidos num teste de hipótese podem ser generalizados como: Erro tipo I: consiste em rejeitar H0 quando H0 é verdadeira Erro tipo II: consiste em aceitar H0 quando H1 é verdadeira Para testarmos uma hipótese qualquer, é mais comum fixarmos um valor para α (nível de significância do teste) e encontrarmos a regra de decisão que irá corresponder a P(Erro I) = α. Por exemplo, fixando-se α = 5% (o que é bastante comum!) tem-se: α = 0,05 = P ( ))~ N(155,16X: xX c< = P(Z < -1,645) ⇒ -1,645 = 16 155x c − ⇒ cx = 148,42kg onde cx é o valor médio crítico, ao nível de 5% de significância. Neste caso, a regra de decisão pode ser escrita como: "Se X < 148,42 kg concluímos que os animais são da FAZ-1 e se X ≥ 148,42 kg, concluímos que os animais são da FAZ-2" Fixando-se α = 5%, β = P(Erro do tipo II) = P ( ); 5,76)145(N~X:42,148X ≥ = P(Z ≥ 1,425) = 0,0793. Na Figura 7 estão apresentados os valores das probabilidades de ocorrência dos erros dos tipos I e II. Figura 7 - Identificação das probabilidades α e β. A especificação da hipótese alternativa H1 depende do grau de informação que temos sobre o problema. A seguir serão apresentadas duas outras situações que ocorrem freqüentemente na prática e as respectivas hipóteses alternativas e regiões críticas associadas. Material elaborado pelo Prof. Dr. César Gonçalves de Lima <cegdlima@usp.br> 17 Situação 1: suponhamos que os animais possam vir de muitas outras fazendas alem da FAZ- 2 e que o interesse do comprador continua sendo por animais da FAZ-2, porque aos 210 dias esses animais têm um peso médio nunca inferior ao dos animais das outras fazendas. Neste caso, só iremos desconfiar que os animais não são da FAZ-2 se o peso médio dos animais for bem inferior a 155 kg. Neste caso as hipóteses nula e alternativa são, respectivamente: H0: os animais são da FAZ-2, ou µ = 155kg; H1: os animaisnão são da FAZ-2, ou µ < 155kg e a regra de decisão, pode ser escrita como: "Se X ≥ cx concluímos que os animais são da FAZ-2, mas se X < cx concluímos que os animais não são da FAZ-2." Se, por exemplo, fixarmos α = 5%, o valor crítico xc é obtido fazendo-se: 0,05 = P( X < cx | X ~ N(155; 16) = P(Z < -1,65) ⇒ -1,65 = 16 155x c − ⇒ cx = 148,40 kg a região crítica fica: RC = { x ∈R: x <148,40} e concluiremos que os animais são da FAZ-2, ao nível de significância de 5%, somente se x ≥ 148,40kg. Situação 2: suponhamos agora que não exista razão para o comprador acreditar que a FAZ-2 é melhor, ou seja, existem algumas fazendas melhores e outras piores que a FAZ-2. Porém, o comprador continua interessado nos animais desta fazenda. Neste caso, somente iremos desconfiar que os animais não são da FAZ-2, quando o peso médio deles for muito diferente (muito abaixo ou muito acima) de 155 kg. Neste caso, as hipóteses são escritas como: H0: os animais são da FAZ-2, ou µ = 155kg; H1: os animais não são da FAZ-2, ou µ ≠ 155kg e a regra de decisão, pode ser escrita como: "Se 1c x ≤ X ≤ 2c x concluímos que os animais são da FAZ-2, mas, se X < 1c x ou X > 2c x concluímos que os animais não são da FAZ-2." Se fixarmos α = 5%, existirão muitos valores críticos, 1c x e 2c x , que satisfazem a condição acima, mas daremos preferência aos valores críticos que são simétricos à média X . Então: 0,05 = P( X < 1c x ou X > 2c x | ~ X ~ N(155,16) = P(Z < -1,96 ou Z > 1,96) -1,96 = 16 155x 1c − ⇒ 1c x = 147,16kg 1,96 = 16 155x 2c − ⇒ 2c x = 162,84kg e a região crítica fica: RC = { x ∈ R | x < 147,16 ou x >162,84} e concluiremos que os animais são da FAZ-2, ao nível de significância de α = 5%, somente se 147,16 ≤ x ≤ 162,84kg. 4.1 PROCEDIMENTOS BÁSICOS PARA A CONSTRUÇÃO DE UM TESTE DE HI- PÓTESE Os procedimentos básicos para a construção de um teste de hipótese sobre o valor de um parâmetro genérico θ podem ser enumerados da seguinte maneira: i) Fixe a hipótese que será colocada à prova, H0: θ = θ0 (hipótese da nulidade), bem como a hipótese alternativa, H1, que será considerada verdadeira se H0 for rejeitada: Material elaborado pelo Prof. Dr. César Gonçalves de Lima <cegdlima@usp.br> 18 H1: θ ≠ θ0 (hipótese bilateral ou bicaudal), ou H1: θ > θ0 (hipótese unilateral à direita), ou H1: θ < θ0 (hipótese unilateral à esquerda). Quanto à escolha das hipóteses, FONSECA & MARTINS (1982) afirmaram que “a hipótese H1 geralmente representa a suposição que o pesquisador quer provar, sendo H0 formulada com o expresso propósito de ser rejeitada. Esse procedimento é conveniente, pois o equívoco de erroneamente rejeitar H0 é considerado mais sério do que o equívoco de erroneamente aceitar H1” ii) Use a teoria estatística e as informações disponíveis, para decidir qual o estimador de θ será usado para julgar H0. Por exemplo, se o parâmetro em estudo for µ, o estimador a ser usado é X . iii) Fixe α = P(Erro tipo I) e, assumindo que a hipótese H0 é verdadeira, construa a região crítica (R.C.) do teste. iv) Use as informações fornecidas pela amostra, para encontrar o valor da estatística θˆ que definirá a decisão. v) Se o valor da estatística calculada na amostra pertencer à R.C. rejeite a hipótese H0 ao nível de significância fixado e aceite a hipótese H1 como verdadeira; se o valor da estatística não pertencer à R.C., aceite a hipótese H0 como verdadeira. 4.2 TESTE SOBRE A MÉDIA DE UMA POPULAÇÃO NORMAL QUANDO A VA- RIÂNCIA É CONHECIDA Usando os procedimentos apresentados na seção 4.1, vamos formalizar o teste sobre a média µ de uma população normal cuja variância σ2 é conhecida (situação que na prática é uma situação pouco comum!!). Exemplo 4.2 O peso ao desmame de bezerros Nelore do Campus tem um desvio padrão de 12 kg. Com o objetivo de testar a hipótese de que o peso médio dos bezerros é igual a 220 kg, sorteou- se uma amostra de 80 animais obtendo-se x = 216kg. Ao nível de significância de 5%, podemos con- firmar a hipótese feita? Resolução: • X = "peso ao desmame de bezerros Nelore", X ~ N(220,144) Obs: como não temos qualquer informação sobre o "sinal" da hipótese alternativa, optamos pela hipótese bilateral. O resultado x = 216kg, que é ocasionalmente menor que 220kg, não deve influ- enciar a escolha da hipótese alternativa. H0: µ = 220 (o peso médio ao desmame é 220 kg) H1: µ ≠ 220 (o peso médio ao desmame não é 220 kg) • estimador: X , que sob H0, tem distribuição N(220; 144/80), ou seja, X ~ N(220; 1,80) Figura 8. Valores críticos da distribuição normal reduzida para α = 5%. ⇒ -1,96 = 80,1 220x 1c − ⇒ xc1= 217,37kg ⇒ 1,96 = 80,1 220x 2c − ⇒ xc1= 222,63 kg Material elaborado pelo Prof. Dr. César Gonçalves de Lima <cegdlima@usp.br> 19 • α = 0,05 = P ( )80)~N(220; 1,X|xXou xX 21 cc >< ⇒ R.C. = { x ∈ R: x < 217,37 ou x > 222,63} • como x = 216 kg ∈ R.C., rejeitamos a hipótese H0 ao nível de significância de 5% e concluímos que o peso médio ao desmame dos bezerros Nelore não é igual a 220kg. Uma maneira alternativa de realizar este teste de hipótese consiste em escrever a região crítica em função da v.a. padronizada Z e calcular, com base na média amostral e supondo que a hipótese H0 é verdadeira, um valor zcalc. Posteriormente, verificamos se este valor pertence ou não à R.C. e tiramos a conclusão sobre o teste de hipótese. Com os dados do Exemplo 3.2, ficaríamos com RC = {z ∈ R: |z| > 1,96} e zcalc = 80,1 220216 − = -2,98, concluindo (mais uma vez, é claro!) que a hipótese H0 deve ser rejeitada, pois zcalc ∈ R.C. ao nível de 5% de significância. 4.3. NÍVEL DESCRITIVO DO TESTE O procedimento usual de teste de hipóteses é baseado na adoção de um critério ou regra de decisão, de tal modo que α = P(Erro tipo I) não exceda um valor pré-fixado. Porem, na maioria das vezes, a escolha de α é arbitrária. Um procedimento alternativo consiste em calcular o “menor nível de significância para o qual a hipótese H0 é rejeitada, baseado nos resultados amostrais”. Este valor é chamado nível descritivo do teste e será denotado por � α (ou “p-value”). Os passos usados neste procedimento alternativo são bastante parecidos com os do procedi- mento clássico, sendo que a principal diferença consiste em não construir uma região crítica para o teste. Ao invés disto, calculamos a probabilidade de ocorrerem valores da estatística mais favoráveis à rejeição da hipótese H0 que o valor observado. Agindo dessa maneira, se �α for um valor pequeno, rejeitamos a hipótese H0 a este nível de significância (no mínimo) e assumimos que a hipótese H1 é verdadeira; caso contrário, aceitamos que a hipótese H0 é verdadeira. Podemos considerar como pequeno um nível descritivo de até 5%. Exemplo 4.3. Sabe-se através de pesquisas, que o desvio padrão da produção leiteira de uma certa raça, no Brasil, é 2,3 kg/vaca/dia. Desejando-se testar a afirmação que a produção média do rebanho leiteiro de um certo pecuarista é superior a 6,0 kg/vaca/dia, foi sorteada uma amostra de 36 vacas, que forneceu uma média de 6,7 kg/vaca/dia. Com base neste resultado, pede-se: a) calcular o nível descritivo do teste e concluir se a afirmação do pecuarista está correta; b) usando o procedimento clássico, testar se a afirmação do pecuarista está correta, para α = 5% e para α = 1%. Resolução: • as hipóteses envolvidas no teste são: H0: µ = 6,0 (a afirmação do pecuarista não está confirmada) H1: µ > 6,0 (a afirmação do pecuarista está confirmada) • informações: x = 6,7, σ = 2,3 e n = 36 • o cálculo de � α envolve o cálculo da probabilidade de ocorrerem valores de X favoráveis ao pecua- rista, ou seja, valores que nos levem a rejeitar H0, baseado na informação da amostra:αˆ = P( X > 6,7) = P − > 36 3,2 67,6Z = P(Z >1,83) = 0,0336 e concluímos que a afirmação do pecuarista somente estará correta se assumirmos um nível de significância igual ou superior a 3,36%. • para α = 5%, a RC(5%) = {z ∈ R: z > 1,65} e para α = 1%, a RC(1%) = {z ∈ R: z > 2,33}. Como o valor zcalc = 1,83 pertence à RC(5%) mas não pertence à RC(1%), a hipótese H0 deverá ser rejeita- da se assumirmos α = 5%, mas deverá ser aceita se assumirmos α = 1%. Material elaborado pelo Prof. Dr. César Gonçalves de Lima <cegdlima@usp.br> 20 4.4. TESTE DE HIPÓTESE PARA A PROPORÇÃO A seguir, apresentaremos, através de um exemplo, a construção de um teste de hipótese para a proporção de sucessos, baseada no roteiro descrito na seção 3.1. Exemplo 4.4. O consumidor de uma certa vacina acusou o laboratório fabricante, dizendo que "mais de 3% das suas vacinas estão vencidas". Para confirmar (ou não) sua acusação, ele usou uma amostra de n = 80 vacinas, das quais k = 4 estavam vencidas. Com base nestes resultados, pede- se: a) O que podemos concluir sobre a acusação do consumidor, ao nível α = 0,06? b) Calcular o nível descritivo do teste e concluir sobre a rejeição da hipótese H0. Resolução: (a) • H0: p = 0,03 (hipótese do fabricante) H1: p > 0,03 (hipótese do consumidor) • sob H0, pˆ = n k ~ N − 80 )03,01(03,0 ;03,0 ou pˆ ~ N(0,03; 0,000364) • fixando α = 0,06 e assumindo H0 verdadeira, obtemos RC = {z ∈ R | z > 1,560} • da amostra: pˆ = 4/80 = 0,05 ⇒ sob H0: zcalc = 000364,0 03,005,0 − = 1,05 • como zcalc ∉ RC, não rejeitamos H0 e concluímos que o consumidor não pôde confirmar a sua acusação, ao nível de significância α = 0,06. (b) • αˆ = P(p > 0,05) = P(Z > zcalc) = P(Z >1,05) = 0,5 - 0,35314 = 0,147 = 14,7%, ou seja, o consumidor somente conseguirá confirmar sua acusação, usando os resultados dessa amostra, se assumir um nível de significância α ≥ 14,7% (que é um valor muito alto...). 5. OUTROS TESTES DE HIPÓTESES Baseados nas distribuições de probabilidades Qui-quadrado, t-Student e F-Snedecor nós defi- niremos alguns testes de hipóteses envolvendo média e variância de uma ou duas populações normais. 5.1. TESTE SOBRE A MÉDIA DE UMA DISTRIBUIÇÃO NORMAL QUANDO A VARIÂNCIA POPULACIONAL É DESCONHECIDA Quando a variância σ2 de uma população X ~ N(µ; σ2) é desconhecida, podemos estimá-la através do estimador S2, já definido anteriormente. Porém, quando a estimativa está baseada numa amostra de tamanho “pequeno”, a estatística T = nS x 2 0µ− não tem distribuição N(0; 1), mas sim t(n-1). Baseado no roteiro apresentado na seção 3.1 e nesta estatística T, iremos apresentar o teste para a média de uma população normal, quando a variância é desconhecida, através do Exemplo 5.1. Exemplo 5.1. As mudanças observadas no teor de colesterol do sangue de coelhos após o tratamento com um novo produto, foram medidas em 15 coelhos, cujos resultados foram: 17; 18; 22; 20; 23; 22; 21; 19; 21; 24; 22; 17; 19; 19 e 20 mg/100ml. Podemos afirmar que a mudança média no teor de colesterol foi inferior a 21 mg/100ml, ao nível de significância α = 0,05? Material elaborado pelo Prof. Dr. César Gonçalves de Lima <cegdlima@usp.br> 21 Resolução: • X: "mudança no teor de colesterol no sangue de coelhos", X ~ N(µ; σ2). • hipóteses: H0 : µ = 21 vs. H1 : µ < 21 • estatística do teste: T = 15 S 21X 2 − , que sob H0, tem distribuição t(14) • fixado α = 0,05 e assumindo H0 como verdadeira, obtemos a região crítica do teste fazendo: 0,05 = P( ( )X xc< = P( )T tc< ⇒ t c = -1,761 (Tábua III) ⇒ RC = {t ∈ R: t < -1,761} Figura 9 - Valor crítico da distribuição t(14) e α = 5% • com os dados da amostra de n = 15 animais obtemos: x = ∑ = 15 1i ix15 1 = 15 304 = 20,27 mg/100ml e s2 = ( )∑ = − 15 1i 2 i 27,20x14 1 = 4,4952 • calculamos tcalc = 15 4952,4 2127,20 − = -1,33 e verificamos se este valor pertence ou não à RC; • como tcalc = -1,33 ∉ RC, não rejeitamos H0 e concluímos, ao nível α = 5%, que a mudança no teor de colesterol do sangue de coelhos não foi inferior a 21 mg/100ml. • um intervalo de confiança para a média com γ = 95% de confiança é obtido fazendo: I.C.(µ; 100γ%) = +− 15 2,1202 2,14; 20,27 15 2,1202 2,1420,27 = [19,10; 21,44] mg/100ml. 5.2 TESTE PARA A VARIÂNCIA DE UMA DISTRIBUIÇÃO NORMAL Agora estamos interessados em testar hipóteses sobre a variância (σ2) de uma população normal que, como sabemos, mede a dispersão dos dados em relação à média populacional. O teste é baseado na distribuição de qui-quadrado. Resumidamente temos: 1) Hipóteses: H0 : σ2 = 20σ H1 : σ2 ≠ 20σ (ou H1 : σ2 σ< 20σ ou H1: σ2 > 20σ ) 2) Estatística do teste: Q = 2 0 2S)1n( σ − , que sob H0, tem distribuição χ ( )n−1 2 3) Fixado um nível de significância, α, a região crítica para o teste bilateral é: R.C. = { }2221 � ou Q�Q >< onde 21χ e 22χ são os valores críticos obtidos da Tábua II, tais que 1-α = P( 21χ < Q < 22χ ). Figura 10 - Valores críticos do teste bilateral ao nível α. Material elaborado pelo Prof. Dr. César Gonçalves de Lima <cegdlima@usp.br> 22 4) Com os dados da amostra e assumindo que a hipótese H0 é verdadeira, calculamos S2 e o valor da estatística: Qcalc = 2 0 2S)1n( σ − . 5) Se Qcalc ∈ R.C. rejeitamos a hipótese H0 e concluímos que a hipótese H1 é verdadeira, ao nível de significância α; se Qcalc ∉ R.C., a hipótese H0 não deverá ser rejeitada. 6) Para calcularmos um intervalo de confiança para a variância populacional de tamanho γ = 1-α usamos a expressão: I.C.(σ2; 100γ%) = −− χχ 21 2 2 2 2 S)1n( ; S)1n( Exemplo 5.2. Um fabricante de um tipo de aço especial afirma que seu produto tem um severo controle de qualidade, traduzido pelo desvio padrão da resistência à tensão não superior a 5 kg/cm. Um comprador querendo testar essa informação, tomou uma amostra de 11 cabos e submeteu- os a um teste de tensão, obtendo x = 263 e s2 = 30. Esses resultados trazem alguma evidência contrária a afirmação do fabricante, ao nível α = 0,10? Resolução: • hipóteses: H0 : σ2 = 25 (hipótese do fabricante) H1 : σ2 > 25 (hipótese do comprador) • estatística do teste: Q = 25 S)111( 2− , que sob H0 tem distribuição χ( )102 . • da Tábua II, com α = 0,10 e ν = 10 g.l. obtemos: qc = 15,987 ⇒ RC= {χ2 ∈ R: χ2 > 15,987} • da amostra temos que s2 = 30 e Qcalc = 25 30)111( − = 12. • conclusão: como Qcalc = 12 ∉ RC, não rejeitamos H0 e concluímos, ao nível α = 0,10, que o desvio padrão da resistência à tensão não é superior a 5 kg/cm, não trazendo evidência contrária à afirmação do fabricante. • I.C.(σ2; γ = 90%) = −− 940,3307,18 30)111( ; 30)111( = [ ]14,76;39,16 (kg/cm)2 ou seja, este intervalo contem o verdadeiro valor da variância da resistência à tensão, com 90% de confiança. 5.3. COMPARAÇÃO DAS VARIÂNCIAS DE DUAS POPULAÇÕES NORMAIS Agora, o nosso problema envolve duas populações normais e independentes: X1 ~ N(µ1; σ12 ) e X2 ~ N(µ2; σ22 ), das quais retiramos amostras de tamanhos n1 e n2, respectivamente, com o objetivo de comparar suas variâncias. Como o teste é baseado na distribuição F-Snedecor, temos uma restrição na escolha do nível de significância para o teste: somente encontraremos valores críticos tabelados (Tábua IV) para testes unilaterais com α = 0,05 ou bilaterais com α = 0,10. O procedimento básico para a execução do teste de hipóteses comparando variâncias de duas populações normais envolve: 1) Hipóteses: H0: 21σ = 22σ = σ2 H1: 21σ ≠ 2 2σ ou H1: 2 1σ > 2 2σ ou H1: 2 1σ < 2 2σ Material elaborado pelo Prof. Dr. César Gonçalves de Lima<cegdlima@usp.br> 23 2) Estatística do teste: F = 2 2 2 1 S S que, sob H0, tem distribuição F(n1-1,n2-1), onde 21S e 22S são as vari- âncias das amostras de tamanho n1 e n2, retiradas das populações X1 e X2, respectivamente. 3) Para facilitar a construção da região crítica para o teste bilateral (α = 0,10) ou para o teste unilate- ral (α = 0,05) tomaremos o cuidado de colocar no numerador da estatística F a maior das duas variâncias amostrais. Na Tábua IV obtemos o valor crítico fc, com ν1 = (n1 -1) e ν2 = (n2 -1) graus de liberdade, tal que 0,05 = P(F > fc) e então escrevemos R.C. = {F ∈ R: F > fc}, mesmo se a hipótese alternativa for bilateral. 4) Com as variâncias amostrais, 21s e 22s , calculamos Fcalc = 2 2 2 1 s s (por conveniência, colocamos no numerador a maior das variâncias amostrais, ou seja, 21s > 22s ). 5) Conclusão: se Fcalc ∈ RC rejeitamos H0 (ao nível de significância α) e aceitamos H1 como verdadei- ra; se Fcalc ∉ RC, aceitamos H0 como verdadeira. Feito o teste e não rejeitada a hipótese de igualdade das variâncias, podemos calcular uma estimativa para a variância comum às duas populações, combinando as duas estimativas através da fórmula: 2 comumS = )2nn( S)1n(S)1n( 21 2 22 2 11 −+ −+− Exemplo 5.3. Num experimento com frangos de corte alojados em boxes com 10 aves foram comparadas duas rações (A e B). Avaliou-se o peso médio (em kg) das aves aos 49 dias de idade. Os resultados encontrados foram os seguintes: Ração A 2,10 2,34 2,24 2,07 2,10 2,03 2,20 Ração B 1,89 1,92 1,85 1,82 1,96 1,94 Baseado nesses dados, podemos afirmar, ao nível de significância α = 10%, que os pesos dos dois grupos de aves são igualmente homogêneos? Ou seja, que têm variâncias iguais ? Resolução: • hipóteses: H0: 2 1σ = 2 2σ = σ 2 vs. H1: 21σ ≠ 2 2σ • estatística do teste: F = 2 2 2 1 S S , que sob H0, tem distribuição F(6; 5). • fixando α = 0,10, da Tábua IV temos fc = 4,95 ⇒ RC = {F ∈ R: F > 4,95} • 2 1s = 0,0121 e 2 2s = 0,0029 ⇒ Fcalc = 0,0121/0,0029 = 4,17 e como Fcalc = 4,17 ∉ RC, não rejeita- mos H0 e concluímos, ao nível α = 10%, que as variâncias dos pesos dos dois grupos de frangos de corte são iguais. • uma estimativa da variância (comum) dos pesos dos dois grupos de frangos de corte é: 2 comums = )267( 0029,0)16(0121,0)17( −+ ∗−+∗− = 0,0079 kg2 Material elaborado pelo Prof. Dr. César Gonçalves de Lima <cegdlima@usp.br> 24 5.4 COMPARAÇÕES DAS MÉDIAS DE DUAS POPULAÇÕES NORMAIS Desejamos comparar as médias de duas populações: X1 ~ N(µ1; σ12 ) e X2 ~ N(µ2; σ22 ), cujas variâncias podem ser conhecidas ou não. As hipóteses envolvidas nas comparações entre as médias podem ser escritas como: H0: µ1 = µ2 (ou H0: µ1 - µ2 = 0) H1: µ1 ≠ µ2 (ou H0: µ1 - µ2 ≠ 0) (hipótese bilateral) ou H1: µ1 > µ2 (ou H0: µ1 - µ2 > 0) (hipótese unilateral à direita) ou H1: µ1 < µ2 (ou H0: µ1 - µ2 < 0) (hipótese unilateral à esquerda) A partir de amostras independentes de n1 elementos da população X1 e de n2 elementos da população X2, podemos estimar a média e a variância (se esta for desconhecida) de cada população usando os estimadores X e 2S , já conhecidos. De estudos anteriores, também já sabemos que: a) ( )21 XXE − = E ( )1X - E ( )2X = µ1 - µ2 b) Var ( )21 XX − = Var ( )1X + Var ( )2X - 2∗Cov ( )21 X;X = 1 2 1 n σ + 2 2 2 n σ - 2∗Cov ( )21 X;X Quando as populações X1 e X2 são independentes ( )0)X;X(Cov 21 = e as variâncias 21σ e 22σ são conhecidas, a estatística definida por Z = ( ) ( ) 2 2 2 1 2 1 2121 nn XX σσ µµ + −−− tem distribuição N(0; 1) e deve ser utilizada nas comparações envolvendo as médias de duas popula- ções normais. Um intervalo de confiança para a diferença entre as médias pode ser obtido através da expressão: I.C.( µ1 - µ2; 100∗γ%) = ( ) ( ) σ + σ +− σ + σ −− 2 2 2 1 2 1 c21 2 2 2 1 2 1 c21 nn zXX; nn zXX onde zc é o valor crítico obtido na Tábua I, tal que γ = P(-zc < Z < zc). Porém, é mais comum desconhecermos tanto as médias quanto as variâncias populacionais e antes de compararmos as médias, precisamos saber se as variâncias das duas populações podem ser consideradas iguais ou não. Se ainda não temos esta informação, podemos obtê-la através do teste apresentado na seção 5.3. Em uma outra situação bastante comum, precisaremos comparar as médias de duas populações que não são independentes, caso em que são feitas observações de uma variável resposta nos mesmos indivíduos ou em pares deles, em duas situações diferentes. 5.4.1 COMPARAÇÕES ENTRE AS MÉDIAS DE DUAS POPULAÇÕES NORMAIS QUANDO AS VARIÂNCIAS SÃO DESCONHECIDAS, MAS IGUAIS Caso a hipótese de igualdade das variâncias seja aceita, a estatística do teste usado para com- parar as médias de duas populações normais é: Material elaborado pelo Prof. Dr. César Gonçalves de Lima <cegdlima@usp.br> 25 T = ( ) ( ) + −−− µµ 21 2 comum 2121 n 1 n 1S XX onde 2comumS é a estimativa da variância comum das duas populações. Sob H0: µ1 = µ2, a estatística T tem distribuição t-Student com (n1 + n2 - 2) graus de liberdade. Um intervalo de confiança para a diferença entre as médias, µ1 e µ2, pode ser obtido através da expressão: I.C.( µ1 - µ2; 100∗γ%) = ( ) ( ) ++− +−− 21 2 comumc21 21 2 comumc21 n 1 n 1StXX; n 1 n 1StXX onde tc é o valor crítico obtido na Tábua I, tal que γ = P(-tc < T < tc). Exemplo 5.4 Duas soluções químicas, Q1 e Q2, vão ser avaliadas quanto ao valor do pH. A análise de 21 amostras da solução Q1 acusou um pH médio de 7,68 e desvio padrão 0,016, enquanto que a análise de 31 amostras de Q2 acusou pH médio de 7,23 e desvio padrão 0,022. Ao nível α = 1% de significância, podemos afirmar que as duas soluções têm pH médios iguais? Resolução: (a) comparação das variâncias: • hipóteses: H0: 2 1σ = 2 2σ = σ 2 vs. H1: 21σ ≠ 2 2σ • estatística do teste: F = 2 1 2 2 S S , que sob H0, tem distribuição F com ν1 = 31-1 = 30 e ν2 = 21-1 = 20 graus de liberdade. • fixando alfa = 0,10, da Tábua IV, fc = 2,04 ⇒ RC = {F ∈ R: F > 2,04} • das amostras: Fcalc = (0,022)2/(0,016)2 = 1,89 e como Fcalc = 1,89 ∉ RC, não rejeitamos H0 e con- cluímos, α = 10%, que as variâncias dos pH’s das duas soluções podem ser considerados iguais. • uma estimativa da variância comum do pH das duas soluções é: 2 comums = ( ) ( ) )22131( 016,0)121(022,0)131( 22 −+ ∗−+∗− = 0,00039 (b) comparação das médias: • hipóteses: H0: µ1 = µ2 vs. H1: µ1 ≠ µ2 • estatística T = ( ) + −− 31 1 21 1S 0XX 2 comum 21 , que sob H0, tem distribuição t(50). • fixando α = 0,01, da Tábua III, obtemos tc = 2,678 ⇒ R.C. = {t ∈ R: t < -2,678 ou t > 2,678} • das amostras: Tcalc = ( ) + −− 31 1 21 100039,0 023,768,7 = 00558,0 45,0 = 80,645 • como Tcalc = 80,645 ∈ R.C., rejeitamos a hipótese de igualdade dos pH’s médios e concluímos, ao nível α = 1%, que os pH’s médios das duas soluções são diferentes. Material elaborado pelo Prof. Dr. César Gonçalves de Lima <cegdlima@usp.br> 26 • o intervalo: I.C.(µ1-µ2; 99%) = (7,68 - 7,23) ± 2,678∗ + 31 1 21 100039,0 = [ ]465,0;435,0 , contem a real diferença entre os pH's médios das duas soluções, com uma confiança de 99%. 5.4.2 COMPARAÇÕES ENTRE AS MÉDIAS DE DUAS POPULAÇÕES NORMAIS QUANDO AS VARIÂNCIAS SÃO DESCONHECIDAS E DIFERENTES Caso a hipótese de igualdade das variâncias seja rejeitada,não existe um teste exato para comparar as médias das populações normais, mas de variâncias diferentes e desconhecidas. Este problema pode ser contornado utilizando-se a estatística T* = ( ) ( ) + −−− µµ 2 2 2 1 2 1 2121 n S n S XX que tem distribuição aproximada t-Student com ν graus de liberdade, onde ν é calculado por: ν = 1n n s 1n n s n s n s 2 2 2 2 2 1 2 1 2 1 2 2 2 2 1 2 1 − + − + (Fórmula de Sattertweit) Um intervalo de confiança aproximado para a diferença entre as médias, µ1 e µ2, pode ser obtido através da expressão: I.C.*( µ1 -µ2; 100∗γ%) = ( ) ( ) ++−+−− ∗∗ 2 2 2 1 2 1 c21 2 2 2 1 2 1 c21 n S n S tXX; n S n S tXX onde ∗ct é o valor crítico obtido na Tábua III, tal que γ = P(- ∗ct < T*< ∗ct ), com T* ~ t(ν) e ν é calcula- do usando-se a Fórmula de Sattertweit. Exemplo 5.5. Queremos testar se os dois tipos de vigas de aço, A e B, têm a mesma resis- tência média (em t/cm2), ao nível α = 5% de significância. Avaliando-se 15 vigas do tipo A e 20 vigas do tipo B, os resultados foram: Viga amostra média variância A 15 70,5 81,6 B 20 84,3 246,3 Resolução: (a) comparação das variâncias: H0: 21σ = 22σ = σ2 vs. H1: 21σ ≠ 22σ • F = 2 A 2 B S S , que sob H0, tem distribuição F(19; 14) ⇒ fixando alfa = 0,10, da Tábua IV, fc = 2,40 ⇒ RC = {F ∈ R: F > 2,40} • das amostras: Fcalc = 246,3/81,6 = 3,02 ∈ RC, rejeitamos H0 e concluímos, ao nível α = 10%, que as variâncias das resistências dos dois tipos de vigas são diferentes. Material elaborado pelo Prof. Dr. César Gonçalves de Lima <cegdlima@usp.br> 27 (b) comparação das médias: H0: µ1 = µ2 vs. H1: µ1 ≠ µ2 • como as variâncias populacionais foram consideradas diferentes, a estatística do teste (aproximado) é T* = ( ) + −− 20 S 15 S 0XX 2 2 2 1 21 , que sob H0 tem distribuição t(ν), onde ν = 095893,10 240025,315 ≅ 31 g.l ⇒ da Tábua III tc∗ = 2,042 ⇒ RC = { T*∈ R: T* > 2,042} • ∗ calcT = + −− 20 3,246 15 6,81 0)3,845,70( = 2137,4 8,13− = -3,28 ∈ R.C. ⇒ rejeitamos a hipótese de igualdade resistên- cias médias e concluímos, α = 5% que as resistências médias das vigas A e B são diferentes. • I.C.(µ1-µ2; 95%) = (70,5 - 84,3) ± 2,042 + 20 3,246 15 6,81 = -13,8 ± 8,60 = [ ]5,222,4; −− t/cm2. 5.4.3 COMPARAÇÕES ENTRE AS MÉDIAS DE DUAS POPULAÇÕES NORMAIS QUANDO AS OBSERVAÇÕES SÃO PAREADAS Muitas vezes a comparação de médias de duas populações normais pode ser prejudicada pela ação de fatores externos que não podem ser controlados. Por exemplo, um tratamento com suple- mentação de alfafa (Trat-A) usado na alimentação de coelhos pode ser considerado melhor que um tratamento sem suplementação (Trat-B), somente porque os animais escolhidos para receber o Trat- A têm maior facilidade em ganhar peso que os animais escolhidos para receber o Trat-B e não porque a suplementação melhora o desempenho. Este problema pode ser contornado utilizando-se um artifício que consiste em coletar as observações da variável resposta em pares de indivíduos que sejam bastante homogêneos em todos os sentidos, exceto no que diz respeito àquele fator (ou tratamento) que desejamos comparar. No exemplo da suplementação de alfafa em coelhos, nós podemos utilizar pares de coelhos semelhantes quanto a raça, filiação, peso inicial, sexo e idade. Um dos coelhos de cada par recebe o Trat-A e o outro recebe o Trat-B. Com isso, conseguimos um maior controle de fatores secundários que podem influenciar os resultados da comparação das médias. Um outro artifício utilizado nessas situações, consiste em fazer observações da variável antes e depois da aplicação do tratamento, nos mesmos indivíduos. Para a comparação das médias das duas populações X ~ N(µX; 2Xσ ) e Y ~ N(µY; 2Yσ ), serão utilizados n pares de valores (Xi; Yi), para i = 1, 2, 3, ..., n. Definimos uma nova variável D = X - Y e, consequentemente, teremos uma amostra de n diferenças D1, D2 , ..., Dn que serão utilizadas na comparação das médias das duas populações. Supondo que a variável D =X − Y tenha distribuição N(µD; 2Dσ ), segue que D ~ N ( )n; 2DD σµ , onde 2Dσ pode ser estimada utilizando-se o estimador justo 2 DS = ( )∑ − − 2 i DD1n 1 . Como µD = E(X − Y) = E(X) − E(Y) = µX − µY, qualquer hipótese feita sobre o parâmetro µD corresponde a uma hipótese feita sobre as médias das populações X e Y. Por exemplo, as hipóteses Ho: µX = µY e H1: µX > µY correspondem às hipóteses Ho: µD = 0 e H1: µD > 0, respectivamente. Deste modo, as hipóteses a serem testadas podem ser escritas como Ho: µD = µ* (onde µ* é um valor qualquer) H1: µD ≠ µ* ou H1: µD > µ* ou H1: µD < µ* e a estatística do teste é T = n S D 2 D Dµ− , que sob Ho: µD = µ*, tem distribuição t(n-1). Material elaborado pelo Prof. Dr. César Gonçalves de Lima <cegdlima@usp.br> 28 Um intervalo de confiança para a diferença de médias µd = µX − µY, com uma confiança γ pode ser obtido através de: I.C.(µd; 100∗γ%) = +− n StD; n StD 2 D c 2 D c onde tc é o valor crítico obtido da Tabela III, tal que P(-tc < T < tc) = γ, com T ~ t(n-1). Exemplo 5.6. Com o objetivo de testar (α = 5%) se a suplementação de alfafa aumenta o ganho médio de peso de coelhos em mais de 0,10kg, foram utilizados 8 pares de coelhos, cujos resul- tados foram: Par no 1 2 3 4 5 6 7 8 X (com) 0,72 0,90 0,67 0,83 0,67 0,93 0,80 0,75 Y (sem) 0,32 0,49 0,51 0,45 0,70 0,52 0,35 0,60 D = X − Y 0,40 0,41 0,16 0,38 -0,03 0,41 0,45 0,15 Resolução: • hipóteses: H0: µD = 0,10 vs. H1: µD > 0,10, com D = X - Y. • estatística: T = 8 S 10,0D 2 D − , que sob H0, tem distribuição t(7). • da Tábua III, para α = 5% = P(T > tc), tc = 1,895 ⇒ R.C. = {t ∈ R: t > 1,895}. • das amostras: d = 0,29 e sD2 = 0,0305 ⇒ tcalc = 8 0305,0 10,029,0 − = 3,08 ∈ R.C.⇒ rejeitamos a hipótese H0 e concluímos, ao nível de 5% de significância, que a suplementação de alfafa aumenta o ganho médio de peso de coelhos em mais de 0,10kg. • I.C.(µD; 90%) = ∗+∗− 8 0305,0895,119,0;8 0305,0895,119,0 = [ ]307,0;073,0 kg, ou seja, este intervalo contem o verdadeiro aumento de ganho médio de peso de coelhos resultante da su- plementação com alfafa, com uma confiança de 90%. 6 CORRELAÇÃO E REGRESSÃO LINEAR SIMPLES Um problema freqüentemente encontrado na prática é o da determinação do valor de uma grandeza, partindo do conhecimento do valor de outras, ou porque estas últimas são de mais fácil medida, ou porque estas antecedem no tempo à primeira. Em qualquer dos casos, são utilizadas fórmulas (ou modelos) para relacionar os valores desconhecidos e conhecidos das diversas grandezas. Algumas destas fórmulas resultam do emprego do método dedutivo a uma série de postulados e definições, como por exemplo, as de geometria ou da mecânica racional. Outras resultam apenas da observação. Por exemplo: a partir de vários valores simultâneos da altura pluviométrica de um rio e sua vazão, estabelecemos uma expressão (um modelo), relacionando as duas grandezas. As fórmulas obtidas dedutivamente são ditas teóricas e as que resultam indutivamente das observações são ditas empíricas. A Análise de Regressão é um método para o estabelecimento de fórmulas empíricas. Um outro problema bastante freqüente é simplesmente verificarmos se duas grandezas se relacionam entre si. Ao invés de procurarmos estabelecer modelos, buscamos quantificar o grau de relacionamento entre elas. Material elaborado pelo Prof. Dr. César Gonçalves de Lima
Compartilhar