Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 CAPÍTULO 7 - DISTRIBUIÇÃO AMOSTRAIS E ESTIMAÇÃO DE PARÂMETROS Estatística Indutiva - Fornece procedimentos formais para tirar conclusões sobre uma população, a partir de uma amostra. Parâmetros - Alguma medida descritiva (média, variância, proporção etc..) dos valores x1, x2, x3,.....,xn associados à população. Estatística - Alguma medida descritiva (média, variância, proporção etc..) dos valores x1, x2,.....,xn associa à amostra. Considere uma amostragem aleatória simples, qualquer medida associada à amostra (estatística) é uma variável aleatória, devido à aleatoriedade introduzida na amostragem. Uma estatística é uma variável aleatória e sua distribuição de probabilidade é chamada distribuição amostral. 1 - Distribuição amostral da média - Seja uma amostra aleatória simples {x1, x2,.....,xn} e a estatística x . A distribuição da média amostral apresenta as seguintes propriedades: a) O valor esperado da média amostral é igual à média da população: E ( x ) = . b) A variância da média amostral é inferior à variância populacional ( 2 ) e a relação é dada por: V( x ) = 2 /n; se a amostragem for com reposição, ou N grande e até infinito. V( x ) = ) 1N nN ( n 2 ; se a amostragem for sem reposição e N pequeno ou N < 20n. c) Teorema do limite central. Quando amostra for grande, a distribuição da média segue a distribuição normal. 2 - Distribuição amostral da proporção O estudo da proporção dos elementos que tem certo atributo A, segue as seguintes propriedades: a) O valor esperado da proporção amostral é igual à proporção da população: E ( P ^ ) = p. b) A variância da proporção amostral é dada por: V( P ^ ) = n pp )1( ; se a amostragem for com reposição, ou N grande e até infinito. V( P ^ ) = ) 1N nN ( n )p1(p ; se a amostragem for sem reposição e N pequeno, N<20n. Estimação dos parâmetros: Intervalo de Confiança (I.C.) Estimação dos parâmetros - Uma estatística T é uma função dos elementos da amostra, isto é T = f (x1, x2,....,,xn}. Quando ela é usada para avaliar certo parâmetro , é também chamada de estimador de . Propriedades de um estimador – T é um estimador não viesado (não tendencioso) de um parâmetro se e só se E(T) = . Introdução - Trata-se de uma técnica para fazer inferência estatística, ou seja, a partir de um intervalo de confiança, construído com os elementos amostrais, pode-se inferir sobre um parâmetro populacional. A construção de intervalos de confiança fundamenta-se nas distribuições amostrais. Se a partir de uma amostra procura-se obter um Intervalo de Confiança 21 ˆˆ 1 - com probabilidade de conter o verdadeiro parâmetro populacional. 2 Quando se diz que o Intervalo de Confiança contém o verdadeiro parâmetro populacional com uma probabilidade 1 - (nível de confiança), será o nível de significância, ou seja, o erro que está se cometendo ao afirmar-se que o parâmetro estimado 1ˆˆ 21 . Esta técnica diferencia-se da estimação “por ponto” onde se calcula um único valor (estimativa) para o parâmetro populacional. 1. Intervalo de Confiança para Proporção ou Probabilidade P Quando n > 30. Vimos que P ~ N (p; pq/n), logo . n )p1(p Pp Z ^^ ^ O denominador da fórmula é o desvio padrão da distribuição amostral de P, ou seja, é o erro padrão da proporção. Portanto, o intervalo para um nível será: Então: 1Z n )p1(p Pp ZP1ZZZP 2 ^^ ^ 222 Para obter o intervalo acima é necessário o valor de “p” que é desconhecido. Como estamos admitindo n > 30 pode-se substituir e encontrar: 1 n )p1(p Zp P n )p1(p ZpP ^^ 2 ^ ^^ 2 ^ resumindo temos: IC (P, 1-α) = [ ^ p n )p1(p z ^^ 2 ] 2. Intervalo de Confiança para média populacional (Conhece variância populacional) Neste caso, não precisa calcular a estimativa da variância a partir da amostra. Trabalha-se então com a distribuição “z”, isto é: /2 /2 1 - 2 Z 2 Z Z /2 /2 1 - 2 Z 2 Z Z 3 P [ z n x z ] = 1- 1] n .zx n .zx[P 22 ; resumindo temos: IC ( , 1-α) = [ x n z 2 ] 3. Intervalo de Confiança para a Média Populacional (Não conhece variância populacional) Neste caso, precisa-se calcular a estimativa da variância a partir da amostra. Trabalha-se então com a distribuição “t” de Student, com (n – 1) graus de liberdade, isto é: n s x t , com (- t + ) O gráfico da função densidade da variável “t” de Student é simétrico e tem a forma da normal. Logo, o intervalo de confiança para um nível de significância ou erro é: 2 t Portanto: 1] n s .tx n s .tx[P 22 Valor do teste t tabelado: 2 ;1( 2 nt ); Resumindo temos: ].[)1,( 2 n s txIC ATIVIDADE 7A – Distribuição amostral das médias e da proporção 1) pg173 - Seja a população dos 4 ônibus e a variável X = número de vezes que o ônibus teve um defeito grave. Se um ônibus teve 2 defeitos graves, o outro 3, o outro 4, e o último 5 defeitos graves. A variável X = {2, 3, 4, 5}. Construir a distribuição amostral da média amostral, considerando uma Amostragem aleatória simples, com n=2 elementos, extraída com reposição. Determine: a) valor esperado e a variância da distribuição de X. b) valor esperado e a variância da média amostral (Propriedades). c) refaça o item a e b com reposição 2) pg171 - Em um estudo sobre emissões de CO2, definiu-se uma população composta de 4 ônibus de uma companhia de transporte urbano. Dos 4 ônibus, 1 apresentava alto índice de emissão de CO2, e os outros dentro de padrão. Assim a população é descrita por {1, 0, 0, 0}. O parâmetro de interesse é a proporção de veículos fora do padrão. Determine: a) a proporção populacional. /2 /2 1 - - 2 t + 2 t 2 t 4 b) se for retirada uma A.S.A., com reposição de tamanho n=2, qual a proporção P, de veículos fora dos padrões na amostra? P – Distribuição amostral da proporção. 3) pg174 – Num estudo sobre consumo de combustível definiu-se uma população composta por 4 ônibus de uma pequena companhia de transporte urbano. Os consumos dos ônibus (Km/l), em condições padrões de teste, eram [3,5; 3,6; 4; 4,2]. Uma amostra de dois elementos será sorteada, com reposição. Verifique todas as amostras possíveis e, em seguida, construa a distribuição amostral para o consumo médio da amostra. a) Calcule o valor esperado b) Verifique as 3 propriedades. c) Refaça retirando as amostras sem reposição ATIVIDADE 7B – Intervalos de Confiança para proporção e para médias 1) Demonstrar o desenvolvimento das fórmulasdo Intervalo de Confiança para a proporção. 2)pg185- Ache os valores críticos para z (Normal padrão) nos intervalos de confiança que corresponde ao nível de confiança: 80%, 90%; 95% ; 98%; 99% , 99,5%; 99.8%. 3)pg186- Na avaliação de dois sistemas computacionais, A e B, foram selecionadas 400 cargas de trabalho – supostamente uma amostra aleatória da infinidade de cargas de trabalho que poderiam ser submetidas a esses sistemas. O sistema A foi melhor que o B em 60% dos casos. Construir o IC para proporção (proporção que o sistema A foi melhor que o B) usando nível de significância de 95% e 99%. Discuta o que ocorre com I.C. quando aumenta o nível de confiança. Por que? 4) Considere sua sala de aula uma amostra aleatória do Curso da Ciência da Computação. a)Estimar a proporção amostral de mulheres da sua sala de aula. b)Construir o Intervalo de Confiança para a verdadeira proporção populacional de mulheres do Curso da Ciência da Computação. Adote o nível de significância de 10%. 5) Demonstrar o desenvolvimento das fórmulas do Intervalo de Confiança para: a) média (quando conhece a variância: tabela normal padrão); b) média (quando desconhece a variância: tabela t de Student). 6) pg188 - Em uma indústria de cerveja, a quantidade de cerveja inserida em latas tem se comportado como uma variável aleatória com média de 350 ml e desvio padrão 3 ml. Detectado problemas na linha de produção, suspeita-se que houve alteração na média. Retirou-se uma amostra de 20 latas e obteve média 346 ml. Construa um I.C. para o novo valor da quantidade média de cerveja inserida em latas, com nível de confiança de 95%, supondo não alteração no desvio padrão do processo. 7) Ache na tabela t de Student, o valor crítico utilizado no intervalo de confiança (bilateral), conhecendo o “n” amostral e o nível de confiança. 99%; n=28 98%; n= 38 95 %; n= 22 90 %; n= 50 99%; n=43 98%; n= 20 95% ; n= 45 90 %; n= 60 8) pg190 - Deseja-se avaliar a dureza esperada μ do aço produzido sob um novo processo de têmpera. Uma amostra de dez corpos de prova de aço produziu os seguintes resultados, em HRc: {36.4, 35.7, 37.2, 36.5, 34.9, 35.2, 36.3, 35.8, 36.6, 36.9}. Construir o Intervalo de confiança para a verdadeira média com nível de significância de 5%. 9) pg195 - Sob condições normais, realizaram-se dez observações sobre o tempo de resposta de uma consulta a certo banco de dados. Os resultados, em segundos, foram os seguintes: [28, 35, 43, 23, 62, 38, 34, 27, 32, 37]. Construir IC para o verdadeiro tempo médio de uma consulta sob as condições normais. Adote alfa 1%. 5 10) pg195- Fixados certos parâmetros de entrada, o tempo de execução de um algoritmo foi medido 12 vezes, obtendo-se os seguintes resultados [15,12,14,15,16,14,16,13,14,11,15,13] (em minutos). Apresente o Intervalo de 95% confiança para o tempo médio de execução do algoritmo. ATIVIDADE 8 - Testes de hipóteses Decisões Estatísticas Na prática somos chamados com muita frequência a tomar decisões acerca de populações, baseados nas informações das amostras. Essas decisões são denominadas decisões estatísticas. Pode-se desejar decidir, com base em dados amostrais, se um novo soro é realmente eficaz na cura de uma doença, se um processo educacional é melhor do que outro, se certa moeda é viciada e outras. Hipótese Estatística - A Hipótese Estatística é uma suposição ou afirmação relativa a uma ou mais populações, que pode ser verdadeira ou falsa. Testes de Hipótese - Consiste em decidir se a hipótese é verdadeira ou falsa. Assim, através de uma amostra testaremos à hipótese formulada e concluiremos se ela deve ser rejeitada ou aceita. As Hipóteses A hipótese lançada para ser rejeitada ou aceita é chamada de hipótese nula, denotada por Ho. A rejeição de Ho leva a aceitação de uma hipótese alternativa, representada por H1. A hipótese H1 é formulada em termos de desigualdades (≠, >, <) Erros do Tipo I e II - Se uma hipótese for rejeitada quando deveriam ser aceita, diz-se que foi cometido um erro do Tipo I. Se, por outro lado, for aceita uma hipótese que deveria ser rejeitada, diz-se que foi cometido um erro Tipo II. Em ambos os casos ocorreram uma decisão errada ou um erro de julgamento. Nível de Significância - Ao testar uma hipótese estabelecida, a probabilidade máxima com a qual estaremos dispostos a correr o risco de um erro Tipo I é denominada nível de significância do teste. Essa probabilidade, representada frequentemente por , é geralmente especificada antes da extração de quaisquer amostras, de modo que os resultados obtidos não influenciem a escolha. Se, por exemplo, é escolhido um nível de significância 5%, no planejamento de um teste de hipótese, há então cerca de 5 chances em 100, de a hipótese ser rejeitada, quando deveria ser aceita, isto é, há uma confiança de cerca de 95% de que se tome uma decisão acertada. Tipos de Testes de Hipóteses 8A) Teste para a proporção – Abordagem clássica 1 a ) Formulação das hipóteses Ho: p = p0 vs H1: 2 a ) Nível de significância Normalmente adota-se um valor de ( entre 1% a 10%). Estabelecer os valores críticos 1 - Z 1 - /2 /2 1 - -Z/2 Z/2 -Z (a) (b) ( c ) p p0 (a) –Teste bilateral p > p0 (b) – Teste unilateral a direita p < p0 (c) - Teste unilateral a esquerda 6 3 a ) )p1.(p.n np'y Z 00 0 cal 4 a ) Conclusão: Abordagem clássica a) Se 22 ZZZ cal Aceita-se Ho b) Se ZZ cal Rejeita-se Ho c) Se ZZ cal Rejeita-se Ho. Abordagem do p valor: Se p > ; Aceita-se Ho Se p ; Rejeita-se Ho 8B) Teste para a Média ( conhece 2 ) 0 (a) T. bilateral 1 a ) Formulação das hipóteses Ho: = 0 vs H1: 2 a ) Nível de significância - Normalmente adota-se um valor de entre 1% a 10%. Estabelecer os valores críticos – Normal padrão 3 a ) Cálculo da variável teste n).x 0(Z 4 a ) Conclusão: Idem ao teste de Proporção 8C) Teste para a Média (Não conhece 2 ) 1 a ) Formulação das hipóteses Ho: = 0 vs H1: 2 a ) Nível de significância - Normalmente adota-se um valor de entre 1% a 10%. Estabelecer os valores críticos Variável “t” tabelada- Teste bilateral: 2 t (n – 1; 2 ) e Teste Unilateral: t(n – 1; ) 0 (a) T. bilateral > 0 (b) T. unilateral à direita < 0 (c) T. unilateral à esquerda < (c) 1 - t 1 - /2 /2 1 - 2 t 2 t - t (a) (b) (c) y = num.elementos c/ atributos atributo y’= y+0,5 se y < np0 e y’=y-0,5 se y > np0 po = valor de Ho n = tamanho da amostra > 0 (b) T. Unilateral à direita 0 < 0 (c) T. Unilateral à esquerda Unilateral direita 7 3 a ) Cálculo da variável teste s nx tcal )( 0 4 a ) Conclusão: a) Se 22 ttt cal Aceita-se Ho b) Se ttcal Rejeita-se Ho c) Se ttcal Rejeita-se Ho. 8D) Teste para Variância - Quando há interesse em verificar possíveis alterações na variabilidade. 1 a ) Formulação das hipóteses - Ho: 2 = 2 o vs H1: 2 2 0 2 > 2 0 (u.d) ou 2 < 2 0 (u.e) 2 a ) Nível de significância e Valores críticos: tabela qui-quadrado Bilateral: 2 sup (n – 1; /2); 2 inf (n – 1; 1 - /2) e Unilateral : );1n(2sup ; )1;1n(2inf 3 a ) Cálculo da variável teste: 2 calc ou q 2 = 0 2)1( sn 4 a ) Conclusão: Aceitação ou rejeição de Ho. ATIVIDADE 8 - Testes de hipóteses para uma amostra –pg198 1) Defina o erro tipo I e erro tipo II num teste de hipótese. 2) pg199 - Escreva as hipóteses abaixo em termos de parâmetros populacionais; a) a média dos tempos de resposta do equipamento com o processador A é diferente da média dos tempos de resposta do equipamento com o processador B; b) a média dos valores da resistência do concreto com a dosagem d2 de cimento é maior que a média dos valores da resistência do concreto com a dosagem d1. c) a média das vendas depois da campanha publicitária é maior que a média das vendas antes da campanha publicitária; d) a proporção de reclamações após a realização do programa de melhoria de qualidade é menor do que antes da realização do programa; e) crie uma hipótese, dentro de sua área de estudo, em termos de proporção. f) crie uma hipótese, dentro de sua área de estudo, em termos de média. Tabela normal padrão 3) pg 215 - Para um teste bilateral, encontre somente o valor crítico da normal padrão: Considere o nível de significância [0,20; 0,10; 0,05; 0,02; 0,01; 0,005] Para um teste unilateral à direita, encontre o valor crítico da normal padrão: Considere alfa [0,20; 0,10; 0,05; 0,02; 0,01; 0,005 ] Para um teste unilateral à esquerda, encontre o valor crítico da normal padrão: Considere alfa [0,20; 0,10; 0,05; 0,02; 0,01; 0,005] 4) Encontre o p-valor para o teste de hipótese: a- Unicaudal à esquerda com estatística de teste z = -2,23. b- Unicaudal à esquerda com estatística de teste z = -1,62. c- Bicaudal com estatística de teste z = 2,14 d- Bicaudal com estatística de teste z = 2,31 e- Unicaudal à direita com estatística de teste z = 2,16. x = média amostral 0 = valor da hipótese nula s = desvio-padrão amostral n = tamanho da amostra 8 f- Unicaudal à direita com estatística de teste z = 1,48. Teste de hipótese para proporção 5) pg215 - Uma empresa retira periodicamente amostras aleatórias de 500 peças da linha de produção para análise de qualidade para verificar se tem ou não defeito. O processo produtivo não aceita evidência de mais de 1,5% de peças defeituosas. Na última amostra apareceram 9 peças com defeitos. a- Testar a hipótese dos defeitos serem superiores a 1,5% . Adote alfa 5%. b- Testar a hipótese dos defeitos serem diferentes de 1,5%. Adote alfa 5%. c- Realize a abordagem do p valor para os itens a e b. 6) pg217 - Um fabricante garante que 90% de seus itens estão dentro das especificações. Um comprador examinou uma amostra de 50 itens e verificou que apenas 84% estavam dentro das especificações. Há evidência que o nível de qualidade é menor do que o alegado pelo fabricante? Adote alfa 1%. Encontre o p-valor. Teste de hipótese para média (conhece a variabilidade) 7) pg218 - Na indústria cerâmica, avalia-se sistematicamente a resistência de amostras de massas de cerâmicas, após o processo de queima. Dessas avaliações, sabe-se que certo tipo de massa tem resistência mecânica aproximadamente normal, com média 53 Mpa e a variância de 16 Mpa 2 . Após a troca de alguns fornecedores de matérias primas, deseja-se verificar se houve alteração na qualidade. Uma amostra de 15 corpos de prova de massa de cerâmica acusou média de igual a 50 Mpa. Qual é a conclusão ao nível de significância de 1%? Realize um teste bilateral. Faça abordagem clássica e abordagem do p-valor. 8) Em um anúncio, a Computec afirma que a média do tempo de entrega de suas mercadorias é menor que 30 minutos, com desvio padrão populacional de 3,5 minutos. Uma seleção aleatória de 36 tempos de entrega apresentou média amostral de 28,5 minutos. Há evidência suficiente para apoiar a afirmação com nível de significância de 1%. Adote alfa 5%. Faça abordagem do p-valor. Tabela t de Student 9) Calcule o valor crítico da tabela t de Student para um teste: Bilateral n=15 e nível de significância de 10%; 5% e 1%. Unilateral n=18 e nível de significância de 10%; 5% e 1%. (Un. à direita e a esquerda) 10) Encontre o p-valor para o teste de hipótese: a- Unicaudal à esquerda com estatística de teste t = -2,45 e n=10. b- Unicaudal à esquerda com estatística de teste t = -1,45 e n=12. c- Bicaudal com estatística de teste t = 2,95 e n=20. d- Bicaudal com estatística de teste t = 1.28 e n= 30. e- Unicaudal à direita com estatística de teste t = 2,74 e n= 60. f- Unicaudal à direita com estatística de teste t = 1,36 e n= 150. Teste de hipótese para média (desconhece a variabilidade) 11) pg220 - O tempo para transmitir 10 MB em determinada rede de computadores varia segundo um modelo normal, com média de 7,4 seg. Depois de algumas mudanças na rede, acredita-se numa redução no tempo de transmissão de dados, além da alteração na variabilidade. Foram realizados 10 ensaios independentes com um arquivo de 10 MB e foram anotados os tempos de transmissão, em segundos { 6,8 7,1 5,9 7,5 6,3 6,9 7,2 7,6 6,6 6,3 }. Há evidência de que o tempo médio de transmissão foi reduzido? Nível de significância de 5% e faça a abordagem clássica e abordagem do p-valor. 12) pg229 – Padrões técnicos exigem que o nível de ruído em CPDs seja de, no máximo, 70dB. Foram analisados 16 CPDs de várias organizações, obtendo-se os seguintes valores máximos de ruído: [78, 73, 68, 65, 72, 64, 77, 80, 82, 78, 65, 72, 61, 79, 58, 65]. a-calcule a intensidade de ruído médio e desvio padrão para os 16 CPDs. b-Suponha que os 16 CPDs analisados são uma amostra aleatória de CPDs do país. Para verificar se na média os CPDs atendem aos padrões técnicos, como vc construiria as hipóteses? 9 c-A intensidade de ruído médio dos CPDs nos horários críticos é superior ao especificado? Use o nível de confiança de 95%. Tabela qui-quadrado 13) Calcule os valores críticos do teste qui-quadrado (Teste para 1 amostra): a- Teste bicaudal: alfa =10% , n = 16 b- Teste bicaudal: alfa =10% , n = 29 c- Teste unicaudal á direita: alfa =5% , n = 27 d- Teste unicaudal á direita: alfa =10% , n = 10 e- Teste unicaudal á esquerda: alfa = 1% , n = 7 f- Teste unicaudal á esquerda: alfa = 5% , n = 24 Teste de hipótese para variância 14) pg222 (continuação do exercicio11)- O tempo para transmitir 10 MB em determinada rede de computadores varia segundo um modelo normal, com média de 7,4 segundos e variância de 1.3 Seg 2 . Existe evidência suficiente de que as mudanças na rede de computadores alteraram a variabilidade no tempo de transmissão de dados? Use o nível de confiança de 95%. 15) pg223- Usuários de uma rede de transmissão de energia elétrica tem reclamado da alta variação na tensão (desvio padrão de 12 V). A empresa encarregada da transmissão de energia elétrica na região instalou novos transformadores. O desvio padrão calculado sob 30 observações independentes foi de 8 V e a distribuição de frequências dos valores da amostra sugere uma distribuição normal. Há evidência da redução na variação da tensão? Use alfa 5%. Aula 9A - Teste t para amostras pareadas ou independentes - 2 amostras Comparação de 2 médias – Caso com 2 amostras. 9a) Teste t para duas amostras pareadas O teste t é apropriado para comparar 2 conjuntos de dados quantitativos, em termos de seus valores médios. 1 a ) Hipóteses : H0: 21 vs H1: 21 ; 21 ou 21 1 - valor esperado da resposta do tratamento 1 2 - valor esperado da resposta do tratamento 2 2 a ) Nível de significância e Valores críticos: bilateral t(n-1; 2 ) e unilateral t(n-1; ) 3 a ) Variável teste t = ds nd onde n: tamanho da amostra; d : média das diferenças observadas (d = x2 – x1 ) e sd: desvio padrão das diferenças. 4 a ) Conclusão: a) Se 22 ttt cal Aceita-se Ho b) Se ttcal Rejeita-se Ho c) Se ttcal Rejeita-se Ho. 9b) Teste t para duas amostras independentes A formação de pares de elementos similares nem sempre é viável. Uma alternativa é considerar duas amostras independentes. Grupos com número de elementos iguais n 1= n2 Suposição básica: As observações são independentes Os dois grupos provêm de distribuições normais Os dois grupos possuem a mesma variância. 10 (a) 21 1 a ) Hipóteses : H0: 21 vs H1: (b) 21 (c) 21 2 a ) Nível de significância e Valores críticos: bilateral t(n1+n2-2; 2 ) e unilateral t (n1+n2-2; ) 3 a ) Variável teste t = 2 a 21 S2 n )xx( onde a variância agregada: Sa 2 = 2 SS 22 2 1 n: tamanho da amostra; 1x : média do grupo1; 2x : média do grupo2; Sa 2 : variância comum (agregada) dos dois grupos. 4 a ) Conclusão: regra habitual da distribuição t de Student. Grupos com número de elementos diferentes n1 n2 Idem ao procedimento acima, altera o item 3 com a seguinte fórmula; 3 a ) Variável teste t = 21 a 21 n 1 n 1 S xx onde a variância comum S 2nn S)1n(S)1n( 21 2 22 2 112 a 9c - Comparação de 2 variâncias - Teste F para duas variâncias Suponha que queremos comparar duas populações, supostamente com distribuições normais, têm a mesma variância. Formulam-se as hipóteses: 1 a ) Ho: 2 2 2 1 vs H1: 2 2 2 1 (teste bilateral) ou 2 2 2 1 2 2 2 1 ; (teste unilateral) onde 1var:21 populaçãodaiância 2var:22 populaçãodaiância . 2 a ) Nível de significância e os valores críticos: Bilateral: Fsup ( gl1= n1 -1; gl2= n2 -1; 2 ) e Finf ( gl1= n1 -1; gl2 = n2 -1; 1- 2 ) = Finf = );( 1 12 ) 2 ( glglF Unilateral: Finf [(1- ) (gl1; gl2)] ou Fsup [ (gl1; gl2)] 3 a )Estatística teste: f = 2 2 2 1 s s onde si 2 são as variâncias das amostras 1 e 2. Condição da amostra 1 ser maior que amostra 2 (maior variância posicionada no numerador). 4 a )Conclusão: Rejeita-se Ho: Para teste unilateral esquerda, fcalc < F(1- ) (gl1 gl2) Para teste unilateral direita, fcalc > F (gl1; gl2) Para teste bilateral, fcalc < F(1- 2 ) (gl1; gl2) e fcalc > F 2 (gl1; gl2) Obs: F(1- 2 ) (gl1; gl2) = );( 1 12) 2 ( glglF 11 Aula 9B - Comparação de várias médias Geralmente este delineamento é usado quando é classificado segundo um único critério, chamado tratamento. Este delineamento é utilizado quando as unidades experimentais (parcelas) são similares. Os tratamentos são diferentes???? Assim usa-se um processo aritmético para decompor as variações, que é chamado de Análise de Variância (ANOVA). Todo delineamento experimental possui um modelo matemático necessário para podermos efetuar a análise de variância do experimento. E, para a validade da análise de variância deve-se considerar o seu modelo matemático além de algumas pré-suposições básicas para se fazer a análise dos dados. Algumas suposições básicas que se deve admitir para a validade da análise de variância: Deve-se considerar independência entre tratamentos e entre parcelas do mesmo tratamento; As j observações por tratamento são normais de média mi e mesma variância 2 , ou seja, X i j ~ N ( , 2 ). As variâncias populacionais devem ser iguais nos g grupos. Para o delineamento inteiramente casualizado o modelo matemático é: yij = + ti + eij com i = 1,2,............ g; j = 1,2,................. n; onde: yij = valor observado na parcela que recebeu o tratamento i na repetição j; ti = efeito do tratamento aplicado na parcela; = média global resposta; eij = efeito dos fatores não controlados, ou seja, o efeito do erro experimental; Quadro de Dados Tratamentos Repetições T 1 T2 ... Tg 1 y11 y21 ... yg1 2 y12 y22 ... yg2 ... ... ... ... ... n y1n y2n ... ygn Soma y1. y2. ... yg. y..= i iy Médias y 1. y 2. ... y g. i iy g y 1 .. Para realizar o Teste de hipótese: i) Testar as hipóteses H0: As médias dos tratamentos são iguais (H0: )....21 g H1: Pelo menos uma das médias difere das demais. ( jiH :1 para algum i≠j) ii) Nível de significância e estabelecer o valor crítico: (F de Snedecor) iii) Teste Fcalc Construiremos o seguinte quadro de análise de variância: ANOVA Fonte de Variação Graus de Liberdade Somas de Quadrados Quadrados Médios Fcalc Ftab Tratamentog – 1 SQT QMT QMT/QMR [(g – 1), (N-g)] Resíduo (R) N – g SQR QMR Total (To) N – 1 SQTo 12 Soma de Quadrados gn 2 2 ij ; N ..y ySQTo g i i N y n y SQT 1 22 .. ; SQR = SQTo – SQT Quadrados Médios 1g SQT QMT ; )gN( SQR QMR Estatística Fcalc: QMR QMT Fcalc Valor tabelado - Ftab [(glT; glR)] iv) Conclusão: Assim se Fcalc > Ftab Rejeita-se Ho, isto é, pelo menos umas das médias diferem entre si. As médias aritméticas de cada grupo servem como uma estimativa pontual da resposta esperada de cada tratamento. Para detectar qual média difere das demais, existem diversos testes (Tukey, Schefée, Duncan..), mas uma opção rápida é construir o intervalo de confiança para verificar se realmente há diferença entre as médias. IC ( n QMR tyii 2 )1, onde o valor tabela: t (N-g; 2 ) AMOSTRAS EM BLOCOS Considere que as unidades experimentais são agrupadas em blocos, de tal forma que todos os g tratamentos sejam realizados em cada bloco. Cada observação Yij é influenciada pelo efeito do tratamento, efeito do bloco e o efeito aleatório. Assim: Yij = + ti + Bj + eij Os cálculos de uma ANOVA num projeto em blocos, considerando em cada bloco uma observação de cada tratamento (blocos completos não replicados), donde o número total de observações é dado por N = gh. i) Testar as hipóteses H0: As médias dos tratamentos são iguais H1: Pelo menos uma das médias difere das demais ii) Nível de significância e valor crítico: F de Snedecor iii) Estatística teste: Fcalc ANOVA - Construiremos o seguinte quadro de análise de variância: ANOVA Fonte de Variação Graus de Liberdade Somas de Quadrados Quadrados Médios Fcalc Ftab Tratamento g – 1 SQT SQT/g-1 QMT/QMR [(glt; glR)] Bloco h – 1 SQB SQB / h-1 Resíduo (Erro) (g-1)(h-1) SQR SQR / (g-1)(h-1) Total (To) N – 1 SQTo 1- tabF 13 SQTo = g i h j ij N y y 1 1 2 2 .. ; SQT = g i i N y h y 1 22 .. ; SQB = h 1j 22 j N ..y g .y SQR= SQTo – SQT - SQB iv) Conclusão: Assim se Fcalc > Ftab Rejeita-se Ho, isto é, pelo menos umas das médias diferem entre si. Construir o intervalo de confiança para detectar onde há diferença significativa das médias. ATIVIDADE 9 A - Teste t para amostras pareadas ou independentes Teste t para duas amostras pareadas 1) pg235 - Seja o problema de verificar se um novo algoritmo de busca em um banco de dados é mais rápido que o algoritmo atualmente usado. Para fazer a comparação dos dois algoritmos, planeja-se realizar uma amostra aleatória de dez buscas experimentais (ensaios). Em cada ensaio, uma dada busca é realizada pelos dois algoritmos e o tempo de resposta de cada algoritmo anotado. Testar se o tempo do algoritmo novo superou do algoritmo antigo? a) Adote alfa 1%. b) Faça a discussão com alfa 5%. c) Abordagem do p-valor. Ensaio Tempo de respostas (segundos) Novo X1 Antigo X2 Diferença X2 – X1 1 22 25 3 2 21 28 7 3 28 26 -2 4 30 36 6 5 33 32 -1 6 33 39 6 7 26 28 2 8 24 33 9 9 31 30 -1 10 22 27 5 2) pg245 - Num planejamento tipo antes e depois, observou a venda mensal de determinado produto em 12 lojas sem oferecer brinde. Depois, passou-se a oferecer um brinde e voltou-se avaliar a venda mensal deste produto nas 12 lojas. O valor da diferença Di foi: { 7, 10, 5, -2, 9, 0, 3, -4, 8, 9, 1, 3}. Os dados mostram evidência suficiente para se afirmar que a oferta do brinde aumenta as vendas? Use nível de significância de 5%. Abordagem p-valor. 3)pg245 - Para avaliar o efeito de um brinde nas vendas de determinado produto, planeja-se comparar as vendas em lojas que vendem o produto com brinde, com lojas que vendem sem brinde. As lojas foram agrupadas em pares, de tal forma que os pares são o mais similares possíveis. Em cada par de lojas, uma passou a oferecer brinde e a outra não. Os dados da tabela, mostram evidência suficiente para se afirmar que a oferta do brinde aumenta as vendas? Alfa 5%. Par de loja Vendas sem brinde Vendas com brinde 1 33 43 2 43 39 3 26 33 4 19 32 5 37 43 6 27 46 14 Teste t para duas amostras independentes 4) pg238 - Testar a hipótese se nos dez ensaios com cada catalizador verificou que os catalizadores A e B têm efeitos diferentes no rendimento de certa reação química. Confirme com alfa 5%, faça a abordagem do p-valor. Rendimento ( % ) de uma reação química em função do catalizador utilizado. Cat A 45 51 50 62 43 42 53 50 48 55 Cat B 45 35 43 59 48 45 41 43 49 39 5) pg244 - Uma empresa de cerveja estuda a possibilidade de alterar o rótulo de sua marca com cores mais vivas. Enlatou a cerveja com rótulo novo e tradicional. A pesquisa foi feita em 8 estabelecimentos comerciais. Por sorteio em 4 adotou-se o rótulo tradicional e nos outros 4 o rótulo novo. Avaliou-se a quantidade vendida em milhares de unidades. R trad: {6,5,2,2 } e R novo: { 4,9,5,6}. Verifique se a média de vendas é maior com rótulo novo; use alfa 5%. Teste t para duas amostras independentes ( n1 ≠ n2) 6) pg246 - Na comparação de duas topologias de rede de computadores, C1 e C2, avaliou-se o tempo de transmissão de pacotes de dados entre duas máquinas. Foram realizados 32 ensaios em C1 e 24 ensaios em C2, como mostra os dados abaixo: Topologia Tempo (em décimos de segundo) Média Variância C1 9, 12, 10, 12, 11, 9, 8, 12, 13, 9, 13, 8, 17, 9, 9, 8, 9, 8, 14, 8, 8, 8, 8, 13, 10, 10, 15, 13, 13, 12, 14, 8 10,625 6,371 C2 14, 15, 8, 13, 16, 12, 14, 17, 14, 10, 13, 12, 13, 14, 10, 15, 12, 17, 16, 12, 15, 13, 14, 14 13,458 4,781 Existe diferença significativa entre o tempo médio de transmissão nas 2 topologias? Utilização da Tabela F 7) Encontre os valores críticos utilizando a tabela F. a- Teste unicaudal á direita: alfa =5% , n1 = n2 = 27 b- Teste unicaudal á direita: alfa =5% , n1 = 8 e n2= 10 c- Teste unicaudal á esquerda: alfa = 5% , n1 = n2 = 7 d- Teste unicaudal á esquerda: alfa = 5% , n1 = 21 e n2= 31 e- Teste bicaudal: alfa =10% , n1 = n2 = 20 f- Teste bicaudal: alfa =10% , n1 = 8 e n2= 10. 8) pg248 – (Exercício 4) Verificamos que não há evidências de que os catalisadores A e B tenham efeitos médios diferentes no rendimento de certa reação química. Vamos verificar, agora, se eles produzem efeitos diferentes nas variâncias. Use alfa 10%. Didaticamente: delimitar a região crítica para os 2 casos do teste unilateral. ATIVIDADE 9B - Teste para k médias – (mais de 2 amostras) 1) pg252 - Considere o problema de comparar 3 tipos de rede de computadores, C1, C2, C3, em termos do tempo médio de transmissão de pacotes de dados entre duas máquinas. Realizou-se um experimento com oito replicações com cada tipo de rede, aleatorizando a ordem de 24 ensaios e mantendo fixo fatores controláveis. a- Testar a hipótese do tempo médio de transmissão ser iguais para os três tipos de redes. Alfa 5%. b- Apresentar graficamente os intervalos de confiança. 15 Tipo de rede replicações REDE C1 REDE C2 REDE C3 1 7,2 7,8 6,3 2 9,3 8,2 6,0 3 8,7 7,1 5,3 4 8,9 8,65,1 5 7,6 8,7 6,2 6 7,2 8,2 5,2 7 8,8 7,1 7,2 8 8,0 7,8 6,8 Soma 65,7 63,5 48,1 Média 8,21 7,94 6,01 2) pg265 - Com o objetivo de comparar 3 tipos de cimento em termos da resistência à compressão do concreto, foi realizado um experimento completamente aleatorizado, com 5 corpos de prova de cada tipo de cimento. Os resultados foram os seguintes: Tipo de cimento replicações C1 C2 C3 1 9 20 10 2 12 21 9 3 10 23 12 4 8 17 20 5 15 30 11 a- Testar a hipótese da resistência media serem iguais para os três tipos de cimento. Alfa 5%. b- Apresentar graficamente os intervalos de confiança. 3) pg257 - Seja o problema comparar 3 algoritmos de busca em um banco de dados. No experimento com 6 buscas experimentais, sendo que em cada uma é sorteado um n. aleatório que indica o registro do banco de dados a ser localizado. Em cada um dos seis processos de busca, são usados 3 algoritmos em estudo, mas sob mesmas condições. São anotados os tempos de resposta ao usuário. a- Testar se os 3 algoritmos são igualmente rápidos. Adote alfa 5%.b- Construir os intervalo de confiança. Algoritmo de busca Blocos A1 A2 A3 1 8,3 8,1 9,2 2 9,4 8,9 9,8 3 9,1 9,3 9,9 4 9,9 9,6 10,3 5 8,2 8,1 8,9 6 10,9 11,2 13,1 Soma 55,8 55,2 61,2 Média 9,43 9,2 10,2 4) pg267 - Para comparar a absorção de água de 4 tipos de massa cerâmica, analisaram-se corpos de prova de 3 fornadas. Em cada fornada (bloco) era analisado um corpo de prova de cada tipo de massa cerâmica. Os resultados (porcentagem de absorção de água) foram: Fornada Massa Cerâmica C1 C2 C3 C4 1 1,2 1,5 1,1 2,1 2 2,1 2,1 1,3 2,7 3 1,5 1,9 1,3 2,4 Os dados mostram evidência suficiente para garantir diferença na porcentagem esperada de absorção de água nos 4 tipos de massa cerâmica? Use nível de confiança de 95%. 16 ####################################### # CAPÍTULO 7 - ATIV.7B #--------------------------------------------------------- # Valores críticos da tabela z - pg185 #-------------------------------------------------------- ############### #EXERCÍCIO 2 ############### # a)cálculo do z com alfa 20% qnorm(c(0.10), mean=0, sd=1, lower.tail=TRUE) #L Inferior qnorm(c(0.10), mean=0, sd=1, lower.tail=FALSE) #L.superior qnorm(c(0.10, 0.90), mean=0, sd=1, lower.tail=TRUE) #ambos limites # b)cálculo do z com alfa 10% qnorm(c(0.05), mean=0, sd=1, lower.tail=TRUE) #L Inferior qnorm(c(0.05), mean=0, sd=1, lower.tail=FALSE) #L.superior qnorm(c(0.05, 0.95), mean=0, sd=1, lower.tail=TRUE) #ambos limites # c)cálculo do z com alfa 5% qnorm(c(0.025), mean=0, sd=1, lower.tail=TRUE) qnorm(c(0.975), mean=0, sd=1, lower.tail=TRUE) qnorm(c(0.025,0.975), mean=0, sd=1, lower.tail=TRUE) # d) alpha - 2% qnorm(c( ), mean=0, sd=1, lower.tail=TRUE) qnorm(c( ), mean=0, sd=1, lower.tail=TRUE) qnorm(c( , ), mean=0, sd=1, lower.tail=TRUE) # e) alpha - 1% qnorm(c(0.005), mean=0, sd=1, lower.tail=TRUE) qnorm(c(0.995), mean=0, sd=1, lower.tail=TRUE) qnorm(c(0.005,0.995), mean=0, sd=1, lower.tail=TRUE) # f) alpha - 0.5% qnorm(c( ), mean=0, sd=1, lower.tail=TRUE) qnorm(c( ), mean=0, sd=1, lower.tail=TRUE) qnorm(c( , ), mean=0, sd=1, lower.tail=TRUE) # g) alpha - 0.2% (Bilateral) qnorm(c( ), mean=0, sd=1, lower.tail=TRUE) qnorm(c( ), mean=0, sd=1, lower.tail=TRUE) qnorm(c( , ), mean=0, sd=1, lower.tail=TRUE) ############### #EXERCÍCIO 3 ############### #----------------------------------------------------- # Intervalos de confiança para proporção (p) # PROGRAMANDO NO R -Ativ 7B - pg 186 #----------------------------------------------------- ### para alfa 5% n=400; n p=0.60; p q=0.40; q 17 ep = sqrt((p*q)/n) ; ep z = qnorm(c(0.025, 0.975), mean=0, sd=1, lower.tail=TRUE);z erroamostral = z*ep; erroamostral ICP = c(p+z*ep);ICP ### para alfa 1% ep = sqrt((p*q)/n) ; ep z = qnorm(c( , ), mean=0, sd=1, lower.tail=TRUE);z erroamostral = z*ep; erroamostral ICP = c(p+z*ep);ICP #-------------------------------------------- # Ex3- Forma direta no R #-------------------------------------------- prop.test(240, 400, conf.level=0.95) #alfa 5% prop.test(240, 400, conf.level=0.99) #alfa 1% ################ #EXERCÍCIO 4 ###############------------------------------ # Intervalos de confiança para proporção (p) #-------------------------------------------- # Número de mulheres na sala de aula #-------------------------------------------- ################# #EXERCÍCIO 6 #################--------------------------------------------------------------- # Intervalos de confiança para média (z)- conhece a variabilidade pg188 # Quantidade de cerveja inserida em latas #-------------------------------------------------------------------------------------- #alfa = 5% n = 20; n media = 346; media dp = 3; dp z=qnorm(c(0.025, 0.975), mean=0, sd=1, lower.tail=TRUE);z erroamostral = (z*dp/sqrt(n)); erroamostral ICM = (media+ erroamostral) ; ICM #---------------------------------------------------------------------------------------- 18 ################ # EXERCÍCIO 7 ################---------------------------------------- # Valores da tabela t de Student (t) #--------------------------------------------------------------- #a) alfa = 1% n=28; n t = qt (c(0.005, 0.995), df = n-1, lower.tail=TRUE); t #---------------------------------------------------------------- #b) alfa = 1% n=43; n t = qt (c(0.005, 0.995), df = n-1, lower.tail=TRUE); t #--------------------------------------------------------------- #c) alfa = 2% t = qt (c(0.01, 0.99), df = 37, lower.tail=TRUE); t #---------------------------------------------------------------- #d) alfa = 2% n= ;n t = qt (c( , ), df = n-1, lower.tail=TRUE); t #----------------------------------------------------------------- #e) alfa = 5% n= ;n t = qt(c( , ), df = n-1, lower.tail=TRUE); t #----------------------------------------------------------------- #f) alfa = 5% n= ;n t = qt (c( , ), df = n-1, lower.tail=TRUE); t #ou t = qt (c(0.025, 0.975), df = 44, lower.tail=TRUE); t #---------------------------------------------------------- #g) alfa = 10% n= 50 ;n t = qt (c(0.05,0.95), df = n-1, lower.tail=TRUE); t #ou t = qt (c(0.05, 0.95), df = 49, lower.tail=TRUE); t #---------------------------------------------------------- #h) alfa = % t = qt (c( , ), df = , lower.tail=TRUE); t #################### #EXERCÍCIO 8 ####################----------------- #Ativ. 7B - Dureza do aço - pg190 #---------------------------------------------- x= c(36.4,35.7,37.2,36.5,34.9,35.2,36.3,35.8,36.6,36.9) sum(x*x) n = 10 ; n 19 M = mean (x); M DP = sd(x) ; DP ep = (DP/sqrt(n)); ep t = qt (c(0.025, 0.975), df = n-1, lower.tail=TRUE); t ea = t*ep ; ea ICM = (M + t*ep); ICM #--------------------------- # forma direta #--------------------------- summary(x) sd(x) t.test(x, conf.level=0.95) ---------------------------- #################EXERCÍCIO 9 ################------------------------------------------------------------------ # Intervalo de confiança para média (desconhece a variabilidade) #----------------------------------------------------------------------------------------- # Ativ7B - pg 195 - TEMPO DE RESPOSTA A UM BANCO DE DADOS #------------------------------------------------------------------------------------------- # alfa 1% x= c(28,35,43,23,62,38,34,27,32,37) n = 10 ; n M = mean (x); M DP = sd(x) ; DP ep = (DP/sqrt(n)); ep t = qt (c(0.005, 0.995), df = n-1, lower.tail=TRUE); t ea = t*ep ; ea ICM = (M + t*ep); ICM #--------------------------- # forma direta #--------------------------- summary(x) sd(x) t.test(x, conf.level=0.99) ---------------------------- ################# #EXERCÍCIO 10 #################---------------------------------------------------------------------- # Ativ7B - TEMPO DE EXECUÇÃO DE UM ALGORITMO # pg 195 - Intervalos de confiança para média (desconhece a variabilidade) #---------------------------------------------------------------------------------------------- y=c(15,12,14,15,16,14,16,13,14,11,15,13) #alfa = 5% ???? 20 #--------------------------- # forma direta #--------------------------- ????? ############### # CAPÍTULO 8 ############### ###############---------------------------------------------------- #EXERCÍCIO 3 - Valores críticos da tabela z - pg215 ###############---------------------------------------------------- #alpha - 20% qnorm(c(0.10,0.90), mean=0, sd=1, lower.tail=TRUE) #bilateral #alpha - 10% qnorm(c( , ), mean=0, sd=1, lower.tail=TRUE) #bilateral #alpha - 5% qnorm(c(0.025,0.975), mean=0, sd=1, lower.tail=TRUE) #bilateral #alpha - 2% qnorm(c(0.01,0.99), mean=0, sd=1, lower.tail=TRUE) #bilateral #alpha - 1% qnorm(c( , ), mean=0, sd=1, lower.tail=TRUE) #bilateral #alpha - 0.5% qnorm(c(0.0025,0.9975), mean=0, sd=1, lower.tail=TRUE) #bilateral #--------------------------------------------------------------------------------------- #alpha - 20% qnorm(c(0.80), mean=0, sd=1, lower.tail=TRUE) #unilateral à direita #alpha - 10% qnorm(c(0.9), mean=0, sd=1, lower.tail=TRUE) #unilateral à direita #alpha - 5% qnorm(c( ), mean=0, sd=1, lower.tail=TRUE) #unilateral à direita #alpha - 2.5% qnorm(c( ), mean=0, sd=1, lower.tail=TRUE) #unilateral à direita #alpha - 1% qnorm(c(0.99), mean=0, sd=1, lower.tail=TRUE) #unilateral à direita 21 #alpha - 0.5% qnorm(c( ), mean=0, sd=1, lower.tail=TRUE) #unilateral à direita #alpha - 0.25% qnorm(c(0.9975), mean=0, sd=1, lower.tail=TRUE) #unilateral à direita #--------------------------------------------------------------------------------------------- #alpha - 20% qnorm(c(0.20), mean=0, sd=1, lower.tail=TRUE) #unilateral à esquerda #alpha - 10% qnorm(c(0.1), mean=0, sd=1, lower.tail=TRUE) #unilateral à esquerda #alpha - 5% qnorm(c( ), mean=0, sd=1, lower.tail=TRUE) #unilateral à esquerda #alpha - 2.5% qnorm(c(0.025), mean=0, sd=1, lower.tail=TRUE) #unilateral à esquerda #alpha - 1% qnorm(c( ), mean=0, sd=1, lower.tail=TRUE) #unilateral à esquerda #alpha - 0.5% qnorm(c(0.005), mean=0, sd=1, lower.tail=TRUE) #unilateral à esquerda #alpha - 0.25% qnorm(c( ), mean=0, sd=1, lower.tail=TRUE) #unilateral à esquerda #---------------------------------------------------------------------------------------------------- ################# #EXERCÍCIO 5 #################--------------------------------------------------------------------------- # Ativ 8 - pg 215 – teste de hipótese para proporção #-------------------------------------------------------------------------------------------------- prop.test (9,500, p=0.015, alternative = c("greater"), conf.level = 0.95, correct = T) #------------------------------------------------------------------------------------------- # Forma direta - pacote exigido para análise {corpora} #------------------------------------------------------------------------------------------ Require (corpora) z.score.pval (9, 500, p = 0.015, correct = TRUE, alternative = c("greater")) #------------------------------------------------------------------------------------------ ############## #EXERCÍCIO 6 ############## ????? 22 ############## #EXERCÍCIO 7 ############## #----------------------------------------------------- # Teste para média (conhece VAR) # Indústria de cerâmica - pg 218 #----------------------------------------------------- # Hipóteses #---------------- H0: U=53 seg H1: U#53 #----------------------------------------- # Alfa: 5% - valores críticos: ztab #----------------------------------------- ztab = qnorm(c(0.025,0.975),mean=0,sd=1,lower.tail=TRUE) ztab #----------- # Zcalc #---------- MP= 53; MP #Media Populacional ma = 50; ma #Media amostral var = 16; var #Variancia Populacional dp = 4; dp n=15; n zcalc= ((ma-MP)*sqrt(n))/dp; zcalc #---------------------------- #conclusão: rejeita-se H0 #------------------------------ ############## #EXERCÍCIO 9 ############## #----------------------------------------------------------------------------------------- # tabela t Student - Default para uso da tabela #------------------------------------------------------------------------------------------- n= length(x); n # sendo x dados amostrais qt (c(0.025, 0.975), df = n-1, lower.tail=TRUE) #bilateral qt (c(0.975), df = n-1, lower.tail=TRUE); ttab #Unilateral à direita qt (c(0.025), df = n-1, lower.tail=TRUE) #Unilateral à esquerda #--------------------------------------------------------------------------------------------- t1= qt(c(0.05, 0.950), df = 14, lower.tail=TRUE);t1 #bil. t2= qt(c(0.025,0.975), df = 14, lower.tail=TRUE);t2 #bil. t3= qt(c(0.005,0.995), df = 14, lower.tail=TRUE);t3 #bil. #---------------------------------------------------------------------------------------------- t4= qt(c(0.950), df = 17, lower.tail=TRUE);t4 #un dir. t5= qt(c(0.975), df = 17, lower.tail=TRUE);t5 #un dir. t6= qt(c(0.995), df = 17, lower.tail=TRUE);t6 #un dir. #---------------------------------------------------------------------------------------------- t7= qt(c(0.05), df = 17, lower.tail=TRUE);t7 #un esq. t8= qt(c(0.025), df = 17, lower.tail=TRUE);t8 #un esq. t9= qt(c(0.005), df = 17, lower.tail=TRUE);t9 #un esq. #----------------------------------------------------------------------------------------------- 23 ############## #EXERCÍCIO 11 ############## #------------------------------------------------------------ # Teste para média ( não conhece var)pg-220 #----------------------------------------------------------- # Hipóteses #-------------- H0: U = 7.4 seg H1: U < 7.4 #------------------------------ # Alfa: 1% - valor crítico #--------------------------------- ttab= qt(c(0.01,0.99),df=9,lower.tail=TRUE) ttab #--------- #tcalc #---------- MP = 7.4; MP n=10; n x = c(6.8,7.1, 5.9, 7.5, 6.3, 6.9, 7.2, 7.6, 6.6,6.3) Ma= mean(x); Ma Dp= sd(x); Dp sum(x) sum(x^2) tcalc= ((Ma-MP)*sqrt(n))/Dp; tcalc #------------------------------- #Conclusão: Rejeita-se H0 #------------------------------- #-------------------------------------------------------------------------------------- # Forma direta #-------------------------------------------------------------------------------------- t.test(x, m= Media H0, conf.level=1-alfa, alternative = c("less"....)) #Teste de Normalidade shapiro.test(x) #-------------------------------------------------------------------------------------- # Solução t.test(x, m=7.4, conf.level=0.01,alternative = c("less")) #--------------------------------------------------------------------------------------- ############## #EXERCÍCIO 12 ############## #----------------------------------------------------------------------------------------------- # Teste de Hipótese p/ Média (desconhece variância populacional) – pg229 # ------------------------------------------------------------------------------------------------ # t.test(x, m= Media H0, conf.level=1-alfa) # Default do teste 24 #--------------------------- # Estatística descritiva #--------------------------- x=c(78,73,68,65,72,64,77,80,82,78,65,72,61,79,58,65) summary(x) mean(x) var(x) sd(x) shapiro.test(x) # pressuposto do teste de média #----------------------- # Teste de hipótese #---------------------- #bilateral tcalc= t.test(x, m=70, conf.level=0.95); tcalc #unilateral à direita tcalc= t.test(x, m=70, conf.level=0.95, alternative=c("greater")); tcalc #--------------------------------------------------------------- # Valor crítico - tabela t Student #-------------------------------------------------------------- n= length(x); n # sendo x dados amostrais ttab = qt (c(0.95), df = n-1, lower.tail=TRUE); ttab #Unilateral a direita ttab = qt (c(0.025, 0.975), df = n-1, lower.tail=TRUE);ttab #bilateral #----------------------------------------------------------- ############## #EXERCÍCIO 13 ############## #BICAUDAL qtab = qchisq(c(0.05,0.95), df=15, lower.tail=T);qtab qtab = qchisq(c(0.05,0.95), df=28,lower.tail=T);qtab #UNICAUDAL À DIREITA qtab = qchisq(c(0.05), df=26, lower.tail=F);qtab qtab = qchisq(c(0.95), df=26, lower.tail=TRUE);qtab qtab = qchisq(c(0.90), df=9, lower.tail=F);qtab qtab = qchisq(c(0.10), df=9, lower.tail=T);qtab #UNICAUDAL À ESQUERDA qtab = qchisq(c(0.99), df=6, lower.tail=F);qtab qtab = qchisq(c(0.01), df=6, lower.tail=T);qtab qtab = qchisq(c(0.95), df=23, lower.tail=F);qtab qtab = qchisq(c(0.05), df=23, lower.tail=T);qtab #------------------------------------------------------------------------- 25 ############## #EXERCÍCIO 14 ############## #------------------------------------------- # teste para variância - pg-222 #------------------------------------------- #----------------------- # hipóteses #------------------------ # Ho : Var= 1.3 vs H1 : Var # 1.3 (bilateral) #-------------------------------------------------------------------- # valor crítico – qui quadrado tabelado - alfa = 5% #-------------------------------------------------------------------- qtab = qchisq(c(0.025,0.975), df=9, lower.tail=TRUE);qtab # OUTRAS OPÇÕES qtab = qchisq(c(0.05), df=9, lower.tail=TRUE);qtab # 3.33 qtab = qchisq(c(0.95), df=9, lower.tail=TRUE);qtab # 16.9 qtab = qchisq(c(0.95), df=9, lower.tail=FALSE);qtab # 3.33 qtab = qchisq(c(0.05), df=9, lower.tail=FALSE);qtab # 16.9 #------------------------------ # estatística teste #----------------------------- n= 10 ;n gl = 9 ; gl va = 0.304 ; va VP = 1.3 ; VP qcalc = (n-1)*va / VP; qcalc #--------------------------------- # conclusão : Rejeita-se Ho #-------------------------------- ############## #EXERCÍCIO 15 ##############------------------------- # teste para variância - pg-223 #------------------------------------------- #hipóteses #--------------- #Ho : Var = 144 vs H1 : Var # 144 OU Var <144 #----------------------------------- # valor crítico - alfa = 5% #------------------------------------ qtab = qchisq(c(0.025,0.975), df=29, lower.tail=TRUE);qtab # VALORES CRÍTICOS (16.04 ; 45.7) 26 #------------------------------ # OUTRAS OPÇÕES #------------------------------- qtab = qchisq(c(0.05),df=29, lower.tail=TRUE);qtab # 17.7 qtab = qchisq(c(0.95),df=29, lower.tail=TRUE);qtab # 42.5 qtab = qchisq(c(0.95),df=29, lower.tail=FALSE);qtab # 17.7 qtab = qchisq(c(0.05),df=29, lower.tail=FALSE);qtab # 42.5 #------------------------------ # estatística teste #-------------------------------- n= ;n gl = ; gl dp = ; dp va = ;va VP = ; VP qcalc = ; qcalc #--------------------------------------------- # conclusão : ??? #---------------------------------------------- ######################## # CAPÍTULO 9A ######################## ################ #EXERCÍCIO 1 ################---------------------------------------------------------------------- #TESTE T PAREADO - pg 236; Algoritmo X2= Antigo e X1= Novo #------------------------------------------------------------------------------------------ #Obs: t.test (X2, X1, d=X2-X1) #------------------ # 1-Hipoteses #------------------- Ho: Media Antigo = Media Novo; Ud =0 H1: Media Antigo > Media Novo; Ud >0 #--------------------------------------- # 2- Valor crítico - alfa 5% #----------------------------------------- # Unilateral a direita [Antigo > Novo] ttab = qt(c(0.99),df=9,lower.tail= TRUE);ttab ttab = qt(c(0.95),df=9,lower.tail= TRUE);ttab #------------------------------------------------------------------- # 3 – Estatística teste: Tcalc - Conjunto de dados #------------------------------------------------------------------- A = c(22,21,28,30,33,33,26,24,31,22) N = c(25,28,26,36,32,39,28,33,30,27) n = 10 ;n d = N-A ;d #diferença= x2-x1 27 Dm = mean(d) ; Dm #Dm= media da diferença dp = sd(d) ; dp # desvio padrão da dif. tcalc= Dm*sqrt(n)/dp ; tcalc #------------------------------------ # Conclusão - Rejeita-se H0 #-------------------------------------- #------------------------------------------------------- # Forma direta no R - pg 236 #------------------------------------------------------- # H1: Unilateral à direita t.test(N,A,alternative='greater',conf.level=.95,paired=TRUE) # H1: Unilateral à esquerda t.test(N,A, alternative='less',conf.level=.95,paired=TRUE) # H1: Bilateral t.test(N,A, alternative='two.sided',conf.level=.95,paired=TRUE) ################ #EXERCÍCIO 2 ################------------------------- # Teste T pareado - pg 245 #----------------------------------------------- # 1-Hipoteses Ho: Media D=Media A # H1: Media D>Media A #------------------------------------------------ #-------------------------------------------------------------# 2- valor crítico - alfa 5% - Unilateral a direita #------------------------------------------------------------- ttab = qt(c(0.95),df=11,lower.tail= TRUE) ttab #------------------------------------- # 4 – Estatística teste - Tcalc #-------------------------------------- d = c(7,10,5,-2,9,0,3,-4,8,9,1,3);d sum(d) sum(d^2) n = 12 ;n Dm = mean(d) ; Dm #Dm= media da diferença dp = sd(d) ; dp # desvio padrão da dif. var(d) tcalc= Dm*sqrt(n)/dp ; tcalc #----------------------------------- # Conclusão - Rejeita-se H0 #------------------------------------ 28 #-------------------------------------------------------- # Forma direta no R - #--------------------------------------------------------- #somente se conhecermos a amostra (conjunto de dados) # H1: Unilateral a direita t.test ( N,A , alternative='greater', conf.level=.95, paired=TRUE) #-------------------------------------------------------------------------------- ################ #EXERCÍCIO 3 ################ #------------------- # 1-Hipoteses #------------------- Ho: Media CB = Media SB H1: Media CB > Media SB #---------------------------------------- # 2- Valor crítico - alfa 5% #----------------------------------------- # Unilateral a direita #------------------------------------------ ttab = qt(c(0.95),df=5,lower.tail= TRUE) ttab #----------------------------- # estatística teste – Tcalc #-------------------------------- CB=c(43,39,33,32,43,46) SB=c(33,43,26,19,37,27) d = CB-SB;d ... #-------------------------------- # Conclusão - Rejeita-se H0 #--------------------------------- #--------------------------------------------------------------------------------- # Forma direta no R #--------------------------------------------------------------------------------- #somente se conhecermos a amostra dos dados "Antes e depois" # H1: Unilateral à direita t.test (CB, SB, alternative ='greater', conf.level=.95, paired=TRUE) #--------------------------------------------------------------------------------- 29 ################ #EXERCÍCIO 4 ################------------------------------------------------ # Teste T (2 amostras independentes) com n1=n2 - pg238 #--------------------------------------------------------------------- # Catalisador A e Catalisador B #---------------- # 1-Hipoteses #--------------- # Ho: Media CA = Media CB # H1: Media CA # Media CB (bilateral) #------------------------------------------ # 2- Valor crítico - alfa 5% #------------------------------------------- # Bilateral gl=10+10-2 = 18 ttab = qt(c(0.025,0.975),df=18,lower.tail= TRUE) ttab #----------------------------------- # 4 – Estatística teste – Tcalc #------------------------------------ CA = c(45,51,50,62,43,42,53,50,48,55) CB = c(45,35,43,59,48,45,41,43,49,39) n = 10 ;n varA = var(CA) ; varA varB = var(CB) ; varB vag = (varA+varB)/2 #variância agregada vag MediaA= mean (CA); MediaA MediaB= mean (CB); MediaB tcalc = (MediaA-MediaB)*sqrt(n/(2*vag)) tcalc #------------------------------------ # 5- Conclusão - aceita-se H0 #------------------------------------ #------------------------------------ # Forma direta no R – Default #------------------------------------ # Teste T amostras independentes # H1: Bilateral t.test(CA,CB, alternative='two.sided',conf.level=.95,paired=FALSE) #outras opções # H1: Unilateral a direita t.test(CA,CB, alternative='greater',conf.level=.95,paired=TRUE) # H1: Unilateral a esquerda t.test(CA,CB, alternative='less',conf.level=.95,paired=TRUE) 30 ################ #EXERCÍCIO 6 ################ #------------------------------------------------------------------------------------------- # TESTE T (2 amostras independentes com n1 ≠ n2) - pg246 # duas topologias de rede de computadores #-------------------------------------------------------------------------------------------- #------------------ # 1) Hipóteses #------------------- # Ho: U1=U2 ou H1: U1 ≠ U2 (bilateral) C1 = c(9,12,10,12,11,9,8,12,13,9,13,8,17,9,9,8,9,8,14,8,8,8,8,13,10,10, 15,13,13,12,14,8) C2 = c(14,15,8,13,16,12,14,17,14,10,13,12,13,14,10,15,12,17,16,12,15,13,14,14) n1=length(C1); n1 n2=length(C2); n2 #--------------------------------------------------------------------- #pressupostos para teste t para 2 amostras independentes # a- Observações independentes # b- Os dois conjuntos provir de populações normais # c- as variâncias populacionais iguais nos dois conjuntos #--------------------------------------------------------------------- boxplot(C1,C2) # teste da normalidade; H0: Normalidade dos dados shapiro.test(C1) shapiro.test(C2) #--------------------------------------------- # teste para comparar 2 variâncias; # H0: homogeneidade das variâncias #---------------------------------------------- var.test(C1,C2, alternative=c('two.sided'),conf.level=0.95) #------------------------------------------------------------------ # 2) Valor crítico / bilateral / ttab(n1+n2-2; alfa/2) #------------------------------------------------------------------ ttab = qt(c(0.025,0.975),df=54,lower.tail= TRUE);ttab #--------------------------------------- # 3) estatística teste -forma direta #--------------------------------------- t.test(C1,C2,alternative=c("two.sided"),paired=F,var.equal=T,conf.level=0.95) #-------------------------------- # programando os cálculos #------------------------------- MediaC1 = (round(mean(C1),2)); MediaC1 MediaC2 = (round(mean(C2),2)); MediaC2 31 n1 n2 varC1 = (round(var(C1),2)) ; varC1 varC2 = (round(var(C2),2)) ; varC2 vag = (((n1-1)*varC1) + ((n2-1)*varC2))/(n1+n2-2) ; vag vag sdag = round(sqrt(vag),2); sdag tcalc = (MediaC1-MediaC2)/(sdag*(sqrt(1/n1)+(1/n2))); tcalc #-------------------------------------------------------------- # 4) Conclusão: Rejeita-se Ho. #-------------------------------------------------------------- #---------------------------------------------------------------------------------- # DEFAULT DO TESTE PARA 2 AMOSTRAS INDEPENDENTES # Forma direta no R #---------------------------------------------------------------------------------- # H1: Bilateral t.test(C1,C2, alternative='two.sided',conf.level=.95, paired=FALSE) # H1: Unilateral a direita t.test(C1,C2, alternative='greater', conf.level=.95, paired=TRUE) # H1: Unilateral a esquerda t.test(C1,C2, alternative='less', conf.level=.95, paired=TRUE) #---------------------------------------------------------------------------------- ################ #EXERCÍCIO 7 ################ #------------------------------------------------ # TABELA F DE SNEDECOR #------------------------------------------------ a= qf(0.05,26,26,lower.tail=F); a #unil.direita b= qf(0.05,7 ,9 ,lower.tail=F); b c= qf(c(0.95), df1=6, df2=6, lower.tail=F); c #unil.esquerda d= qf(c(0.95), df1=20,df2=30, lower.tail=F); d e= qf(c(0.95,0.05), df1=19,df2=19, lower.tail=F); e #bilateral f= qf(c(0.95,0.05), df1=7,df2=9, lower.tail=F); f #----------------------------------------------------------32 ################ #EXERCÍCIO 8 ################ #---------------------------------------------------------------------------------------- # DEFAULT DO TESTE PARA DUAS VARIÂNCIAS # teste de hipótese para comparar 2 variâncias ou # Ho: homogeneidade das variâncias (Homogeneidade das variâncias) #----------------------------------------------------------------------------------------- # C1 = variância do grupo1 # C2 = variância do grupo2 #Obs: maior variância no grupo1 var.test(C1,C2, alternative=c('two.sided'), conf.level=0.95) #----------------------------------------------------------------- # teste para duas variâncias - 2 catalisadores - pg248 #--------------------------------------------------------------- Ca = c(45,51,50,62,43,42,53,50,48,55) Cb = c(45,35,43,59,48,45,41,43,49,39) var(Ca) var(Cb) #obs: var(Cb) > var(Ca) var.test(Cb,Ca, alternative=c('two.sided'),conf.level=0.90) #bilateral Ftab = qf(c(0.05,0.95), df1=9,df2=9, lower.tail=T); Ftab #################### #CAPÍTULO 9B #################### ################################################################# #Exercício 1 - Experimento Inteiramente Casualizado pg- 252 ################################################################## # Comparação de 3 médias - 3 configurações de rede # Variável: Tempo de transmissão de dados# #---------------------------------------- # Forma direta no R #---------------------------------------- TA= c(7.2,9.3,8.7,8.9,7.6,7.2,8.8,8) TB= c(7.8,8.2,7.1,8.6,8.7,8.2,7.1,7.8) TC= c(6.3,6,5.3,5.1,6.2,5.2,7.2,6.8) y = matrix(c(TA,TB,TC), 24,1) y tr = data.frame(trat=rep(1:3,each=8),resp=y) tr attach(tr) names(tr) trat=as.factor(trat) mean(TA) mean(TB) mean(TC) (anava =(lm(resp~trat))) anova (anava) 33 #---------------------------------------------------- #Verificando os pressupostos do modelo #---------------------------------------------------- # 1) Para verificarmos se as variâncias são homogêneas #---------------------------------------------------- bartlett.test(resp, trat) #------------------------------------------------- # 2) Para verificarmos se os ERROS têm distribuição # normal: Gráfico do QQPlot ou Teste de Shapiro #------------------------------------------------- shapiro.test(anava$res) ##----------------------------------------- # INTERVALO DE CONFIANÇA #------------------------------------------ icconf = predict(anava, interval="confidence") ; icconf #OU N=24 g=3 n=8 gl=N-g; gl Ttab=qt(c(0.025,0.975),df=gl,lower.tail=T) ; Ttab QMRes= cbind(anova(lm(resp~trat))[2,3]); QMRes #Intervalos de confiança ICM1 = mean(TA)+ (Ttab *(sqrt(QMRes/n))) ; ICM1 ICM2 = mean(TB)+ (Ttab *(sqrt(QMRes/n))) ; ICM2 ICM3 = mean(TC)+ (Ttab *(sqrt(QMRes/n))) ; ICM3 ####################### #EXERCÍCIO 2 ####################### rm(list=ls()) # limpar memória # Ler os dados - opção 2 C1= c(9,12,10,8,15) C2= c(20,21,23,17,30) C3= c(10,9,12,20,11) y = matrix(c(C1,C2,C3), 15,1) y tr = data.frame(tra=rep(1:3,each=5),respos=y) tr attach(tr) names(tr) trat=as.factor(tra) mean(C1) mean(C2) mean(C3) ??????? 34 ##################################### # ENSAIO EM BLOCOS CASUALIZADOS ##################################### # EXERCÍCIO - 3 ################# rm(list=ls()) busca = c(8.3,9.4,9.1,9.9,8.2,10.9,8.1,8.9,9.3,9.6,8.1,11.2,9.2,9.8,9.9,10.3,8.9,13.1) exe = data.frame(Trat=factor(rep(1:3, each=6)), Blocos=factor(rep(1:6, 3)), resp=busca) exe attach(exe) Trat = as.factor(Trat) Blocos = as.factor(Blocos) #---------------- # cálculos #---------------- (mediag = mean(busca)) (mediast = tapply(busca, Trat, mean)) (mediasb = tapply(busca, Blocos, mean)) (qsoma = tapply(busca, Trat, sum)^2) (qsoma = tapply(busca, Blocos, sum)^2) (somaq = tapply(busca^2, Trat, sum)) somaq =524.12+514.52+635.6 ; somaq corr = ((172.2)^2)/18; corr #------------------------------------ #ANOVA #----------------------------------- anava.bl = aov(busca~Trat+Blocos) anova(anava.bl) #------------------------------------------------------------------ # Para verificarmos se as variâncias são homogêneas - #------------------------------------------------------------------ bartlett.test(busca, Trat) bartlett.test(busca, Blocos) #------------------------------------------------------------ # Para verificarmos se os ERROS têm distribuição # normal: Gráfico do QQPlot e Teste de Shapiro #------------------------------------------------------------- par(mai=c(1,1,.3,.2)) plot(anava.bl, which=c(2:2), pch=19, col='red', las=1) shapiro.test(anava.bl$res) #------------------------------------------------------------ 35 ######################## #EXERCÍCIO 4 ######################## #---------------------------------------------------------- # ENSAIO EM BLOCOS CASUALIZADOS pg267 - #----------------------------------------------------------- rm(list=ls()) busca = c(1.2,2.1,1.5,1.5,2.1,1.9,1.1,1.3,1.3,2.1,2.7,2.4) exe=data.frame(Trat=factor(rep(1:4,each=3)),Blocos=factor(rep(1:3,4)),resp=busca) exe attach(exe) Trat = as.factor(Trat) Blocos = as.factor(Blocos) ??????? #---------------------------------------------------------------------- # FIM FIM FIM #----------------------------------------------------------------------
Compartilhar