Prévia do material em texto
Engenharias - Disciplina: Estatística e experimentos Professor: Valdeon Sozo Introdução a estatística Análise de dados Erros e Probabilidades Correlação e regressão Análise de variância Intervalo de confiança Experimentos Teste de hipóteses Definições Tipos de testes de hipóteses Aplicações práticas Engenharias - Disciplina: Estatística e experimentos Professor: Valdeon Sozo Definições Teste de hipóteses É um meio de “medir” a probabilidade das diferenças entre os grupos serem ao acaso É um teste hipóteses, onde: Hipótese nula – H0 Não há efeito de um tratamento, não há diferença entre grupos, etc Hipótese alternativa – H1 Existe efeito do tratamento, existe diferença... Hipótese alternativa pode ser: Bicaudal ou bilateral: (...é diferente...) Unicaudal ou unilateral: (...é maior... ou ... é menor...) Engenharias - Disciplina: Estatística e experimentos Professor: Valdeon Sozo Formulação da Hipótese Alternativa (H1) Teste de hipóteses Possíveis Hipóteses Alternativas – H1 H1: μ > μ 0 Onde deseja-se verificar um hipotético aumento do parâmetro em questão. Chamado de teste unilateral superior (upper-tailed test ). Ex: Verificar se uma ação resultou em aumento de vendas. H1: μ < μ0 Onde deseja-se verificar um hipotético decréscimo do parâmetro em questão Chamado de teste unilateral inferior (lower-tailed test). Ex: Verificar se uma ação redução de problemas de campo teve êxito. H1: μ ≠ μ 0 Onde deseja-se verificar a hipotético diferença entre os valores em análise. Chamado de teste bilateral inferior (two-tailed test). Ex: Verificar se algum tratamento teve algum efeito, seja benéfico ou danoso. Obs: μ0 é a referência ou valor com o qual os dados analisados serão comparados. A hipótese alternativa pode assumir uma de três formas, pois pode-se acreditar que o parâmetro em questão aumentou, diminuiu ou mudou. * Bilateral = bicaudal; * Unilateral = unicaudal Definições Engenharias - Disciplina: Estatística e experimentos Professor: Valdeon Sozo Calcula-se a estatística (teste) – mede o desvio dos dados ao que esperaríamos se H0 for verdadeira; Calcula-se a confiabilidade (valor P) – a probabilidade de obter o valor do teste ≥ ao encontrado se H0 for verdadeira; Interpretação: dados são consistentes com H0 ou contra H0; Decisão: Aceita-se H0 Rejeita-se H0 e aceita-se H1 O Valor p é uma referência para a decisão e o valor crítico de p é α, geralmente α = 0,05 (ou 5%) resultando em um grau de confiança de 95%. Se p-valor > α, aceita-se H0 Se p-valor < α, rejeita-se H0 e aceita-se H1 Teste de hipóteses Obs: : Nível de significância estatística adotado. De forma geral são utilizados um Grau ou Nível de Confiança = 95% que corresponde a um Nível de Significância = 5%. O grau de confiança é habitualmente escrito como 1 – α P-valor: Uma definição alternativa do valor-p é o menor nível de significância em que ainda podemos rejeitar H0. Definições Procedimentos: Engenharias - Disciplina: Estatística e experimentos Professor: Valdeon Sozo Teste de hipóteses Possíveis erros de decisão: Definições Sob a perspectiva da H1:Sob a perspectiva da H0: H0 Erro Tipo I: Rejeitar a hipótese H0 quando ela é verdadeira. Erro Tipo II: Aceitar a hipótese H0 quando deveria ser rejeitada. H0 H1 Erro Tipo I: Aceitar a hipótese H1 quando deveria ser rejeitada. Erro Tipo II: Rejeitar a hipótese H1 quando ela é verdadeira. H1 ou Engenharias - Disciplina: Estatística e experimentos Professor: Valdeon Sozo Teste de hipóteses Erro Tipo I: Também chamado de resultado “falso positivo”, pois concluímos incorretamente que a hipótese alternativa (H1) é verdadeira quando na verdade não é. Erro Tipo II: Também chamado de resultado “falso negativo” (como concluímos incorretamente que a hipótese alternativa (H1) é falsa quando na verdade não é) Sob a perspectiva da H1: Erro Tipo I: Rejeitar a hipótese H0 qual ela é verdadeira. Erro Tipo II: Não rejeitar a hipótese H0 quando deveria ser rejeitada. Sob a perspectiva da H0: Possíveis erros de decisão, em outras palavras: Definições Engenharias - Disciplina: Estatística e experimentos Professor: Valdeon Sozo Teste de hipóteses Erros Tipo I e II versus níveis de significância Definições Probabilidade de ocorrer o Erro Tipo I É expresso por α (ou nível de significância adotado no teste) Probabilidade de ocorrer o Erro Tipo II É expresso por e é inversamente proporcional a α Ex: α => Probabilidade de concluir que um tratamento é eficaz, quando na verdade não é. => Probabilidade de concluir que um tratamento não é eficaz, quando na verdade é. Obs: Nos testes de hipóteses, somente temos a opção de variar valores de α, pois β depende de vários fatores, tais como: o tamanho da amostra, o próprio α e a hipótese alternativa (que pode assumir 3 formatos) O motivo mais comum para um erro do Tipo II é um pequeno tamanho de amostra. Engenharias - Disciplina: Estatística e experimentos Professor: Valdeon Sozo Erros Tipo I e II versus níveis de significância Teste de hipóteses Testes de significância costumam usar um nível de significância de alpha (α = 0,05 ou 5%) mas em alguns casos faz sentido usar outros níveis de significância. Mudar α afeta as probabilidades dos erros Tipo I e Tipo II. Definições α e Erro Tipo I (rejeitamos uma hipótese nula verdadeira) Valores mais baixos de α tornam mais difícil rejeitar a hipótese nula, então escolher valores mais baixos de α pode reduzir a probabilidade de erros Tipo I. Porém, quando usamos valores mais baixos de α, podemos aumentar a probabilidade de um erro Tipo II. α e Erro Tipo II (aceitamos uma hipótese nula fala) Um erro Tipo II é quando não rejeitamos uma hipótese nula falsa. Com valores mais altos de α podemos reduzir a probabilidade de um erro Tipo II, pois tornam mais fácil rejeitar a hipótese nula. α Erros Tipo I α Erros Tipo II Engenharias - Disciplina: Estatística e experimentos Professor: Valdeon Sozo Situações envolvendo erros Tipo I e II: Exemplo Teste de hipóteses Qual seria a consequência de um erro Tipo I nesse cenário? 1) A academia fecha a piscina quando ela precisa ser fechada. 2) A academia fecha a piscina quando ela não precisaria ser fechada. 3) A academia não fecha a piscina quando ela precisaria ser fechada. Os funcionários de uma academia fazem um teste de qualidade de água diário na piscina. Se o nível de contaminantes for muito alto, eles fecham temporariamente a piscina para realizar um tratamento da água. Nós podemos definir as hipóteses para o teste como: HO: a qualidade da água é aceitável H1: a qualidade da água não é aceitável. Engenharias - Disciplina: Estatística e experimentos Professor: Valdeon Sozo Teste de hipóteses Os funcionários de uma academia fazem um teste de qualidade de água diário na piscina. Se o nível de contaminantes for muito alto, eles fecham temporariamente a piscina para realizar um tratamento da água. Nós podemos definir as hipóteses para o teste como: HO: a qualidade da água é aceitável H1: a qualidade da água não é aceitável. Qual seria a consequência de um erro Tipo II nesse cenário? 1) A academia fecha a piscina quando ela precisa ser fechada. 2) A academia fecha a piscina quando ela não precisaria ser fechada. 3) A academia não fecha a piscina quando ela precisaria ser fechada. Situações envolvendo erros Tipo I e II: Exemplo Engenharias - Disciplina: Estatística e experimentos Professor: Valdeon Sozo Teste de hipóteses Os funcionários de uma academia fazem um teste de qualidade de água diário na piscina. Se o nível de contaminantes for muito alto, eles fecham temporariamente a piscina para realizar um tratamento da água. Nós podemos definir as hipóteses para o teste como: HO: a qualidade da água é aceitável H1: a qualidade da água não é aceitável. Em termos de segurança, qual erro tem consequências mais perigosas nesse cenário? Tipo I: A consequência aqui é que a piscina é fechada para tratamento quandoisso não seria necessário. Tipo II: A consequência aqui é que as pessoas irão nadar em água contaminada. Situações envolvendo erros Tipo I e II: Exemplo Engenharias - Disciplina: Estatística e experimentos Professor: Valdeon Sozo Teste de hipóteses Os funcionários de uma academia fazem um teste de qualidade de água diário na piscina. Se o nível de contaminantes for muito alto, eles fecham temporariamente a piscina para realizar um tratamento da água. Nós podemos definir as hipóteses para o teste como: HO: a qualidade da água é aceitável H1: a qualidade da água não é aceitável. Que nível de significância () deve ser usado para reduzir a probabilidade de um erro perigoso? = 1% = 5% = 10% Usar um nível de significância maior aumenta a probabilidade de um erro Tipo I, mas diminui a probabilidade de um erro Tipo II (que é mais perigoso nesse cenário). Outra alternativa para reduzir o Erro Tipo II é aumentar o tamanho da amosta! Situações envolvendo erros Tipo I e II: Exemplo Engenharias - Disciplina: Estatística e experimentos Professor: Valdeon Sozo A importância da análise de variabilidade: Definições Teste de hipóteses Engenharias - Disciplina: Estatística e experimentos Professor: Valdeon Sozo Amostras dependentes x independentes Duas amostras são dependentes quando se originam da mesma unidade de observação, como por exemplo, situações de “antes e depois”. O emparelhamento é determinado pelo projeto do experimento. Não tem nada a ver com os valores ou com os dados, mas sim com a maneira como os valores são obtidos. As amostras são dependentes quando existe uma ligação natural entre uma observação num conjunto de medições e uma observação particular no outro conjunto de medições. A melhor maneira de determinar se os dados são dependentes é identificar o link natural entre as duas medições. (Procure o link!) Quando as medições são emparelhadas, o emparelhamento deve ser refletido na análise. Os dados não podem ser analisados como amostras independentes. Definições Teste de hipóteses Engenharias - Disciplina: Estatística e experimentos Professor: Valdeon Sozo Introdução a estatística Análise de dados Erros e Probabilidades Correlação e regressão Análise de variância Intervalo de confiança Experimentos Teste de hipóteses Definições Tipos de testes de hipóteses Aplicações práticas Engenharias - Disciplina: Estatística e experimentos Professor: Valdeon Sozo Tipos de testes Teste de hipóteses Para testar as hipotéticas diferenças entre médias, utiliza-se o conceito de intervalo de confiança, o qual toma como base o Teorema do Limite Central. Os Intervalo de Confiança (IC) para a Média são: Para calcular este IC seria necessário conhecer o desvio padrão da população (σ) que geralmente é desconhecido. Desta forma, utiliza-se para os testes de hipóteses a Distribuição t, que utiliza o desvio padrão da amostra (s) em vez do desvio padrão da população (σ). Ou para obtenção dos valores da estatística t: é uma distribuição t de Student (ou simplesmente distribuição t) com n − 1 graus de liberdade Engenharias - Disciplina: Estatística e experimentos Professor: Valdeon Sozo Tipos de testes Teste de hipóteses Engenharias - Disciplina: Estatística e experimentos Professor: Valdeon Sozo Introdução a estatística Análise de dados Erros e Probabilidades Correlação e regressão Análise de variância Intervalo de confiança Experimentos Teste de hipóteses Definições Tipos de testes de hipóteses Aplicações práticas Engenharias - Disciplina: Estatística e experimentos Professor: Valdeon Sozo Exercício I Após ter efetuado uma melhoria em um determinado processo produtivo você precisa certificar-se se sua alteração esta sendo estatisticamente significativa. Usando os dados ao lado, selecione a técnica estatística adequada para validar se a melhoria implementada realmente surtiu efeito positivo, ou seja, se a variável resposta realmente teve aumento. Considere um nível de confiança de 95%. Aplicações práticas Teste de hipóteses Engenharias - Disciplina: Estatística e experimentos Professor: Valdeon Sozo Exercício I: solução (usando suplementos do Excel) Utilizando o Excel: Obs: Assume-se que os dados são normalmente distribuídos. Neste caso, rejeita-se aceita H0 ou seja: a media dos dois estados do processo (atual e melhorado) não são iguais, o que denota que as melhorias realizadas FORAM significativas! Aplicações práticas Teste de hipóteses A normalidade dos dados é verificada com base na diferença dos dados, ou seja, Antes x Depois, Anterior x Posterior, Antes da Melhoria x Depois da melhoria .... Critério: Se p-valor > α, aceita-se H0 ----------------------> As médias dos processo seriam iguais Se p-valor < α, rejeita-se H0 e aceita-se H1 ----> A média do processo melhorado é maior Hipótese alternativa : Unicaudal ou unilateral: ou seja, processo melhorado seria melhor que o atual! Engenharias - Disciplina: Estatística e experimentos Professor: Valdeon Sozo Exercício I: solução (uso de fórmulas do Excel) Aplicações práticas Teste de hipóteses Engenharias - Disciplina: Estatística e experimentos Professor: Valdeon Sozo Exercício I: solução (uso de fórmulas) Aplicações práticas Teste de hipóteses Hipótese alternativa : Unicaudal ou unilateral: ou seja, processo melhorado seria melhor que o atual! Engenharias - Disciplina: Estatística e experimentos Professor: Valdeon Sozo Exercício II Dois grupos independentes mas que realizam atividades equivalentes tem apresentado resultados diferentes em suas avaliações. Usando os dados ao lado que ilustram a performance dos grupos por meio de suas avaliações, selecione a técnica estatística adequada para averiguar se realmente a performance dos grupos é diferente. Considere um nível de confiança de 95%. Aplicações práticas Teste de hipóteses Engenharias - Disciplina: Estatística e experimentos Professor: Valdeon Sozo Exercício II: solução (usando suplementos do Excel) Utilizando o Excel: Obs: Assume-se que os dados são normalmente distribuídos. Neste caso, aceita-se H0 ou seja: a media dos dois grupos são iguais, o que não demonstra a diferença na performance dos grupos observados. Aplicações práticas Teste de hipóteses A normalidade dos dados é verificada com base nos dados inseridos. Hipótese alternativa : Bicaudal ou bilateral: ou seja, os grupos produzem resultados diferentes Critério: Se p-valor > α, aceita-se H0 ------------------> Em média, os dois grupos produzem os mesmos resultados. Se p-valor < α, rejeita-se H0 e aceita-se H1 ---> Em média, os dois grupos produzem resultados diferentes. Engenharias - Disciplina: Estatística e experimentos Professor: Valdeon Sozo Exercício II: solução: refletindo sobre a hipótese alternativa!!! Aplicações práticas Teste de hipóteses Porém, deveríamos investigar também sob uma diferente perspectiva! Quando analisamos sob perspectivas de: “menor que ou maior que”, nosso “poder” do teste aumenta, ou seja, por meio de testes unilaterais! H0 aceita, ou seja, os grupos seriam iguais! H0 rejeitada, ou seja: grupo 2 tem resultados inferiores. Com teste unilateral: Engenharias - Disciplina: Estatística e experimentos Professor: Valdeon Sozo Exercício II: solução: refletindo sobre a hipótese alternativa!!! Aplicações práticas Teste de hipóteses Engenharias - Disciplina: Estatística e experimentos Professor: Valdeon Sozo Exercício II: solução: realizando o teste unilateral (uso de fórmulas do Excel) Aplicações práticas Teste de hipóteses Engenharias - Disciplina: Estatística e experimentos Professor: Valdeon Sozo Exercício II: solução unilateral (uso de fórmulas) Aplicações práticas Teste de hipóteses Formulas para dados independentes, mas com n1 = n2. Engenharias - Disciplina: Estatística e experimentos Professor: Valdeon Sozo Exercício III Visando aprimorar o nível de atendimento a consumidores, uma das células de atendimentorecebeu uma melhoria no processo e os dados de satisfação do consumidor antes e depois da melhoria ser implementada são ilustrados ao lado. Verifique estatisticamente com 95% de confiança, se a melhoria de fato surtiu efeito na satisfação do consumidor. Obs: Escala de avaliação: 1 = Péssimo .... 10 = Excelente. Aplicações práticas Teste de hipóteses Engenharias - Disciplina: Estatística e experimentos Professor: Valdeon Sozo Exercício III: solução Aplicações práticas Teste de hipóteses Solução passo a passo: - Verifique a normalidade dos dados. Analisando pelo teste de Anderson-Darling, observa-se não normalidade dos dados. - O teste de Wilcoxon é utilizado em situações onde os dados não são normais. A normalidade será averiguada na diferença dos dados ou seja, comparando-se "antes x depois". Veja os valores na coluna "Diferença". - Hipóteses: H0: A variação da satisfação do consumidor no processo melhorado x processo atual é menor ou igual a zero. H1: A variação da satisfação do consumidor no processo melhorado x processo atual é maior que zero - Utilizando a função criada nesta planilha: WilcoxonSigned( ) selecione os dados das duas colunas dos dados. A função após a seleção ficará assim =WilcoxonSigned($D$8:$D$48;$E$8:$E$48) - Decisão: Se o valor obtido pela função "WilcoxonSigned" >= 5% aceita-se H0 Se o valor obtido pela função "WilcoxonSigned" < 5% rejeita-se H0 e aceita-se H1 Neste caso: como o valor do Tese de WilcoxonSigned = 0,00073, ou seja, inferior a 5%, aceita-se H1. Isto significa que a melhoria realizada no processo de atendimento resultou numa melhor satisfação ao consumidor. Engenharias - Disciplina: Estatística e experimentos Professor: Valdeon Sozo Introdução a estatística Análise de dados Erros e Probabilidades Correlação e regressão Análise de variância Intervalo de confiança Experimentos Teste de hipóteses Definições Tipos de testes de hipóteses Aplicações práticas