Baixe o app para aproveitar ainda mais
Prévia do material em texto
Elaboração: Antônio Édson Corrente INFERENCIA ESTATÍSTICA; TEORIA DA DECISÃO. 1 INFERÊNCIA ESTATÍSTICA APLICADA A inferência é o processo de generalização e de projeções realizadas a partir da amostra por meio de Estimativas, Intervalos de Confiança e de Teste de Hipótese. A idéia é calcular as medidas em uma amostra selecionada aleatoriamente com critérios científicos e aplicar as técnicas nessa amostra para então projetar os resultados para a população. Com as estatísticas amostrais ganhamos tempo, precisão, agilidade, avaliando também as relações e tendências futuras a partir do conhecimento do comportamento de uma população. As técnicas da Inferência Estatística possibilitam concluir ou tomar decisões sobre a população com base em uma amostra dessa população. 1. TEORIA DA DECISÃO O objetivo principal da engenharia é atingir a eficácia, assim, o processo de gestão de um engenheiro tem êxito ao atingir metas definidas no planejamento. Se Considerarmos que um experimento é um investimento de recursos escassos e que todo investimento visa adicionar valor aos recursos consumidos inicialmente, assim, conclui-se que um processo gerencial é excelente na medida em que as decisões tomadas conduzem a minimização do custo e a maximização das receitas. Muitas vezes o Engenheiro (pesquisador) tem alguma ideia, ou suposição, sobre o comportamento de uma variável, ou de uma possível associação entre variáveis. Neste caso, o planejamento da pesquisa deve ser de tal forma que permita, com os dados amostrais, possam testar a veracidade de suas ideias sobre a população em estudo. Adotamos que a população seja o mundo real e as ideias sejam as hipóteses de pesquisa, que podem ser testadas por técnicas estatísticas denominadas de teste de hipóteses ou testes de significância. Testes de Hipótese: verificação de hipóteses sobre a população, mediante critérios estatísticos. Regra de Decisão: procedimento pelo qual se opta por rejeitar ou não rejeitar a hipótese de nulidade. Elaboração: Antônio Édson Corrente INFERENCIA ESTATÍSTICA; TEORIA DA DECISÃO. 2 Erros Associados: ERRO TIPO I: Consiste em rejeitar Ho , dado que Ho é verdadeira. ERRO TIPO II: Consiste em aceitar Ho , dado que Ho é falsa. Nível de significância (): consiste no valor da probabilidade de se cometer um Erro tipo I. Poder do teste (1 - ): consiste na probabilidade de rejeição de 0H , quando de fato ela é falsa. Ho = hipótese nula: É formulada sobre o valor já estabelecido, ou seja, sobre o comportamento médio conhecido. 0 Ho Ha = hipótese alternativa: É formulada a partir da mudança que queremos verificar. 0 Ha Teste unilateral direito 0 Ha Teste unilateral esquerdo 0 Ha Teste bilateral (direito e esquerdo) Região Crítica: Região crítica (região de rejeição): é o conjunto de todos os valores da estatística de teste que leva à rejeição da 0H . RA: Região de Aceitação de Ho. RC: Região Critica (Região de rejeição de Ho). Valor crítico (valor tabelado): é o valor que separa a região crítica dos valores da estatística de teste que não levam à rejeição da 0H . Estatística de teste (valor calculado): é uma estatística amostral baseada nos dados amostrais. Elaboração: Antônio Édson Corrente INFERENCIA ESTATÍSTICA; TEORIA DA DECISÃO. 3 Testes: Bilateral, Unilateral Esquerdo, Unilateral Direito. Rejeita-se 0H , se o valor calculado está na região de rejeição (área pintada dos gráficos abaixo), porque isto indica uma discrepância significativa entre 0H e os dados amostrais. 1.1 TESTE PARA UMA MÉDIA O teste de hipótese deve ser aplicado aos valores amostrais para, verificarmos se as diferenças observadas são significativas e se os mesmos podem ser projetados para a população. Parâmetros para o Teste para a média: Cálculo da estatística de teste Quando conhecemos x o valor calculado é dado por: n x Z x cal 0 O Valor tabelado é dado por: 2/ZZtab : valor da distribuição normal com nível 2 de significância para um teste bilateral Elaboração: Antônio Édson Corrente INFERENCIA ESTATÍSTICA; TEORIA DA DECISÃO. 4 Quando desconhecemos x e n < 30 o valor calculado é dado por: n S x t x cal 0 O Valor tabelado é dado por: 1 2/ ntab tt : valor da distribuição t com nível de significância e n-1 graus de liberdade Exemplo 1: A Tensão de ruptura dos cabos produzidos por um fabricante, apresenta a média de 1800 kg e o desvio padrão de 100 kg. Mediante nova técnica no processo de fabricação, proclamou-se que a tensão de ruptura pode ter aumentado. Para testar essa declaração, ensaiou-se uma amostra de 50 cabos, tendo-se determinado à tensão média de ruptura de 1850 kg. Pode-se confirmar a declaração ao nível de significância de 5%. Exercício: Exemplo 2: Os sistemas de escapamentos de uma aeronave funcionam devido a um propelente sólido. A taxa de queima desse propelente é uma característica importante do produto. As especificações requerem que a taxa média de queima tem de ser μ = 50 cm/s. Sabendo-se que o desvio padrão da taxa de queima é σ= 2 cm/s. O engenheiro experimentalista decide ao nível de α = 5% testar a hipótese de a taxa média de queima exceda a especificada. Ele seleciona uma amostra aleatória de n = 25 e obtém uma taxa média amostral de queima de scmx /3,51 . Que conclusões poderiam ser retiradas? 1.2 TESTE PARA COMPARAÇÃO DE DUAS MÉDIAS 1.2.1 Amostras Dependentes Duas amostras são ditas dependentes quando ambas provem de uma mesma população. E apresenta as características: a) Se uma amostra tem relação com a outra b) Também chamadas de amostras emparelhadas Elaboração: Antônio Édson Corrente INFERENCIA ESTATÍSTICA; TEORIA DA DECISÃO. 5 Estatística de Teste (valor calculado): n S d t d d cal em que: d : média das diferenças d para a população. d : valor médio das diferenças d para os dados amostrais. dS : desvio-padrão das diferenças d para os dados amostrais. n : número de pares na amostra. Valor tabelado: 1 2/ ntab tt : valor da distribuição t com nível de significância e n-1 graus de liberdade Exemplo: Dois catalisadores estão sendo analisados para determinar como eles afetam o rendimento médio de um processo químico. Especificamente, o catalisador 1 esta corretamente em uso, mas o catalisador 2 é aceitável. Uma vez que o catalisador 2 é mais barato, ele deve ser adotado, desde que ele não mude o rendimento do processo. Um teste feito em uma planta piloto resultou nos dados amostrados da tabela a seguir: Número da Observação Catalisador 1 Catalisador 2 1 2 3 4 5 6 7 8 91,50 94,18 92,18 95,39 91,79 89,07 94,72 89,21 89,19 90,95 90,46 93,21 97,19 97,04 91,07 92,75 Fonte: Montgomery. Ao nível de %5 testa a hipótese de que há alguma diferença entre os rendimentos médios. 1.2,2 Amostras Independentes Duas amostras são independentes se a amostra extraída de uma das populações não tem qualquer relação com a amostra extraída da outra população 1.2.2.1 Teste para comparação de duas médias – Amostras independentes e grandes Os tamanhos das duas amostras são grandes: n1≥30 e n2≥30 Elaboração: Antônio Édson Corrente INFERENCIA ESTATÍSTICA; TEORIA DA DECISÃO. 6 Estatística de Teste (valor calculado): 22 2 1 2 1 2121 )()( nn xx Zcal em que: 1 e 2: desvio padrão populacional das amostras 1 e 2. Caso não for conhecido podem ser substituídos por S1 e S2. Valor tabelado: 2/ZZtab : valor da distribuição normal com nível 2 de significância para um teste bilateral Exemplo: 1. Um estudo com a finalidade de comprovar o tempo de vida médio em horas de dois tipos diferentes de lâmpadas. Os resultados do estudo estão dispostos abaixo. Parâmetros Lâmpada ambiental Lâmpada tradicional Média (horas) 1250 1305 Desvio Padrão (horas) 55 65 n 75 75 FONTE: SPIEGEL e STEPHENS Teste ao nível de significância = 5% de que o tempo de vida médio das lâmpadas tradicionais são superiores aos das lâmpadas ambientais (Ho = 2x - 1x =0 versos Ha = 2x - 1x >0 e conclua. 1.2.2.2 Teste para comparação de duas médias – Amostras independentes e pequenas Pelo menos uma das amostras é pequena n < 30 Existem três casos: Caso 1: os valores de ambas as variâncias populacionais são conhecidas (raramente ocorre) Caso 2: as duas populações parecem ter variâncias iguais Caso 3: as duas populações parecem ter variâncias diferentes Elaboração: Antônio Édson Corrente INFERENCIA ESTATÍSTICA; TEORIA DA DECISÃO. 7 Estatística de teste Caso 1 Variâncias populacionais conhecidas Caso 2 As duas variâncias populacionais parecem iguais Caso3 As duas variâncias populacionais parecem desiguais 2 2 2 1 2 1 2121 )()( n S n S xx Zcal 2 2 1 2 2121 )()( n S n S xx t pp cal em que: )1()1( .1.1 21 2 22 2 112 nn SnSn S p 2 2 2 1 2 1 2121 )()( n S n S xx tcal Valor tabelado* 2/ZZtab : valor da distribuição normal com nível de significância ou 2 2/ 21 nntab tt : valor da distribuição t com nível 2 de significância e 221 nn graus de liberdade 2 2/ 21 nntab tt : valor da distribuição t com nível 2 de significância e 221 nn graus de liberdade gl tab tt 2/ : valor da distribuição t com nível de significância e gl de liberdade, em que: gl: menor entre 11 n e 12 n ou 11 2 2 2 2 2 1 2 1 2 1 2 2 2 1 2 1 n n S n n S n S n S gl Nota: * considerando-se um teste bilateral, caso o teste é unilateral considera-se nível de significância. Exemplo: Na tabela abaixo estão relacionados os conteúdos de alcatrão, nicotina e monóxido de carbono em uma amostra aleatória de cigarros tamanho padrão, com filtro e sem filtro. Todas as medidas são em miligramas. 1) VARIÂNCIAS IGUAIS - No nível de 0,05 de significância, teste a afirmação de que a quantidade média de nicotina em cigarros tipo king-size sem filtro é maior do que à quantidade média de nicotina presente em cigarros com filtro. Elaboração: Antônio Édson Corrente INFERENCIA ESTATÍSTICA; TEORIA DA DECISÃO. 8 2) VARIÂNCIAS DESIGUAIS - No nível de 0,05 de significância, teste a afirmação de que a quantidade média de alcatrão em cigarros sem filtro é maior do que a quantidade média de alcatrão presente em cigarros com filtro. Tabela 1 – Alcatrão, Nicotina e Monóxido de Carbono em Cigarros (miligramas). Com filtro Sem filtro Alcatrão Nicotina CO Alcatrão Nicotina CO 16 1,2 14 23 1,6 14 15 1,3 12 23 1,9 15 16 1,1 14 24 1,6 17 14 1,1 16 26 1,8 17 16 1,0 15 25 1,7 16 2 0,1 2 26 1,7 16 16 1,1 14 21 1,4 14 18 1,0 16 24 1,5 16 10 0,8 11 14 1,0 13 12 0,9 13 11 0,8 12 14 1,0 13 13 1,0 12 13 1,0 13 13 0,9 14 16 1,2 14 16 1,1 14 8 0,1 9 16 1,2 17 11 0,9 12 Fonte: Federal Trade Commission. VARIÃNCIAS IGUAIS OU DIFERENTES? Regra Prática Regra prática para estabelecer se as variâncias de duas populações são iguais. Comparam-se as variâncias de duas amostras; se a maior variância for igual até 4 vezes a menor, admite-se que as duas populações têm variâncias iguais. Por exemplo, se as amostras têm variâncias: 64,1521 S 80,622 S tem-se que 43,2 80,6 64,15 2 2 2 1 S S , assim é razoável admitir que as variâncias são iguais. Elaboração: Antônio Édson Corrente INFERENCIA ESTATÍSTICA; TEORIA DA DECISÃO. 9 2.1 Estatística Experimental É a parte da Estatística que se preocupa em obter conclusões a partir de dados experimentais. Um experimento permite a coleta das observações sob condições determinadas. (Tratamento previamente planejado, que segue determinados princípios básicos, no qual se faz comparação dos efeitos dos tratamentos). Abaixo seguem alguns conceitos básicos: Planejamento de experimentos No estudo experimental manipula-se de forma planejada certas variável independente ou fatores (A, B, C,...) para verificar o efeito que esta manipulação provoca numa certa variável dependente ou resposta Y. Uma empresa de informática quer verificar o tipo de equipamento adequado ao usuário. A resposta Y pode ser o tempo de resposta e os fatores podem ser: – o processador (A); – a quantidade de memória RAM (B); – a quantidade de memória fixa (C) e – o tipo de carga de trabalho a ser executada (D). Uma empresa de engenharia quer verificar se o aumentando a dosagem de cimento, aumenta-se a resistência do concreto? Estratégias no planejamento de experimentos • reconhecer, estabelecer e delimitar claramente o problema; • identificar os possíveis fatores que podem afetar o problema em estudo; • verificar quais fatores que poderão ser mantidos fixos e, portanto, não terão os seus efeitos avaliados no estudo experimental; • Identificar, para cada fator, o intervalo de variação e os níveis que entrarão no estudo; • escolher um projeto experimental adequado, isto é, saber como combinar os níveis dos fatores de forma que se possa resolver o problema proposto com o menor custo possível; Elaboração: Antônio Édson Corrente INFERENCIA ESTATÍSTICA; TEORIA DA DECISÃO. 10 • escolher a resposta adequada, ou seja, a variável Y que mede adequadamente o resultado (a qualidade, o desempenho, etc.) do processo e • o planejamento de como será a análise dos dados do experimento. Abaixo seguem alguns conceitos básicos: Variável resposta: é a variável a ser medida ou avaliada. Tratamento: é utilizado para caracterizar tipos ou níveis de um fator. Exemplo: Tratamento 1 - medicamento A Tratamento 2 - medicamento B Tratamento 3 - medicamento C Unidade experimental (parcela): onde é aplicado um tratamento. Ex. uma pessoa, um animal, uma planta, etc. 2.2 Princípios Básicos da Experimentação Repetição: todo experimento deve ter repetição de tratamentos. (a idéia, em experimentação, é comparar grupos, não apenas unidades, quanto mais homogêneo o material experimental, menor é o número de repetições necessárias para o efeito do tratamento) Aleatorização: a distribuição das parcelas na área experimental deve ser feita através de algum processo de casualização (sorteio). (validade das estimativas) 2.3 Análise de Variância (ANOVA) É uma técnica proposta por Fisher (1890-1962), utilizada paracomparar as médias de várias amostras ao mesmo tempo. Consiste em comparar a variação devido aos tratamentos com a variação devido ao acaso ou resíduo. Seja um experimento com I tratamentos com J repetições. Yi é a variável resposta ijy representa os dados observados Elaboração: Antônio Édson Corrente INFERENCIA ESTATÍSTICA; TEORIA DA DECISÃO. 11 Repetições T R A T 1 2 ... J 1 11x 12x ... Jx1 1T 2 21x 22x ... Jx2 2T 3 31x 31x ... Jx3 3T I 1Ix 2Ix ... IJx IT Hipóteses para o Teste F Ho= Fcal = 0: Não existe diferença significativa entre os efeitos dos tratamentos. Ha= Fcal >0: Existe, pelo menos, uma diferença significativa entre os efeitos dos tratamentos. Quadro de ANAVA de um Experimento Inteiramente Casualizado - DIC FONTES DE VARIAÇÃO GL SQ QM FC P Entre os tratamentos (Tratamentos) k – 1 SQT QMT Fcalc Dentro de tratamentos (Resíduos) n - k SQR QMR TOTAL n - 1 SQ GERAL ----- ----- --- Seja : k = número de tratamentos. r = número de repetições de cada um dos tratamentos. rkn . SQ: Soma de quadrados. QM: Quadrados médios. SQT: Soma de Quadrados Total (Tratamentos). SQR: Soma de Quadrados Residual. SQG: Somatório Quadrático Geral. n i i i n x xSQG 1 2 2 )( n x r t SQT i n i i 2 1 2 )( SQTSQGSQR 1 k SQT QMT kn SQR QMR QMR QMT Fcalculado gladordenoknnumeradorkFFtabela ;min)(;)1( Elaboração: Antônio Édson Corrente INFERENCIA ESTATÍSTICA; TEORIA DA DECISÃO. 12 2.4 Teste de Comparação entre Médias de Tratamentos Se H0 for rejeitada, ou seja, se pelo menos um tratamento difere dos demais, então o interesse é identificar qual é este(s) tratamento(s). Existem vários testes de comparação múltipla entre médias: Tukey, Scheffé, SNK, Duncan quando os tratamentos são fatores qualitativos e análise de regressão quando os tratamentos são fatores quantitativos. 2.4.1 Teste de Tukey É um teste de comparação múltipla entre as médias dos tratamentos tomadas duas a duas r sQM qdms Re em que: dms = diferença mínima significativa. q : valor tabelado, com os parâmetros , número de tratamentos e grau de liberdade do resíduo. QMRes: quadrado médio do resíduo da ANAVA Exemplo: Um experimento foi feito para determinar se quatro temperaturas específicas de queima afetam a densidade de certo tipo de tijolo. Temperatura (0F) 100 125 150 175 Densidade 21,8 21,9 21,7 21,6 21,7 21,7 21,4 21,5 21,5 21,4 21,9 21,8 21,8 21,6 21,5 21,9 21,7 21,8 21,7 21,6 Fonte: Montgomery. a) Apresente as hipóteses da ANOVA. b) Interprete o resultado da Análise de Variância ao nível de 5% de significância. c) Se necessário faça o Teste de Tukey e interprete os resultados.
Compartilhar