Baixe o app para aproveitar ainda mais
Prévia do material em texto
Universidade Federal do Rio Grande do Norte Centro de Tecnologia - CT Departamento de Engenharia de Produção ESTATÍSTICA PARA ENGENHARIA DE PRODUÇÃO Prof. Luciano Queiroz Natal/RN 03/04/14 Sumário Correlação Regressão Correlação e pontos atípicos Os pontos atípicos, dependendo da sua localização, podem afetar bastante o valor da correlação entre duas variáveis quantitativas; A seguir são apresentadas situações baseadas no exemplo ao lado que ilustram essa característica. Efeito dos pontos atípicos no r Conclusão A correlação não é robusta (resistente) a pontos atípicos! Se o ponto atípico estiver na mesma direção da nuvem de pontos a correlação tende a aumentar; À medida que o ponto atípico se afasta da nuvem de pontos, não estando na mesma direção da mesma, a correlação diminui consideravelmente. Observação Ficar atento a estudos cujos resultados são baseados em médias, pois os seus resultados não podem, na maioria dos casos, ser aplicados aos indivíduos; Exemplo: As observações a seguir referem-se aos dados de 16 empregados de uma certa empresa. Dados dos 16 empregados Dados brutos × média dos dados Conclusão As correlações são diferentes; A interpretação também é diferente: Nos dados brutos a correlação é entre as variáveis renda e idade; No outro caso a correlação é entre a variável renda média por idade e a variável idade. Regressão Modelo matemático Um modelo matemático é uma expressão matemática (equação) que descreve o comportamento de variáveis, destacando os seus aspectos mais relevantes ou essenciais. Exemplos Peso = massa × gravidade Velocidade = velo. inicial + aceleração × tempo Observação Fato: Todo modelo é uma aproximação da realidade! Consequência: Todos os modelos são incorretos, mas alguns são úteis! Observação Modelo estatístico geral X1 = uma ou mais variáveis (fatores) cujos valores sabemos e desejamos estudar os seus efeitos na resposta Y; X2 = variáveis adicionais que podem afetar os resultados, mas que sabemos muito pouco ou nada. Incorpora todas as fontes de variação no estudo. Por exemplo: medição, fatores ou variáveis não consideradas, diferenças entre unidades experimentais e/ou unidades observacionais, distúrbios em geral no processo. Modelo de regressão linear Observação Modelo estatístico geral Tipicamente os εi’s são variáveis aleatórias não correlacionadas com média zero e variância constante 𝜎². Modelo de regressão linear simples – ilustração e interpretação Por que linear? A palavra linear refere-se aos parâmetros no modelo de regressão linear e não às variáveis. Gráfico de dispersão com a reta de regressão estimada pelo MQM Gráfico de dispersão com a reta de regressão estimada pelo MQM Entendendo os resíduos observados Resíduos estimados observados Definição em regressão Há dois tipos de pontos atípicos: Ponto influente é aquele que se removido altera substancialmente o resultado da regressão; Outlier é aquele que se distancia da nuvem de pontos e apresenta resíduo bastante grande, em valor absoluto. Observação: nem todo o outlier é um ponto influente e vice-versa! Exemplo de outlier, mas não ponto influente Exemplo de ponto influente, mas não outlier Exemplo de ponto influente e outlier Voltando aos resíduos Como fazer análise dos resíduos? Através dos gráficos dos resíduos Resíduos × preditos; Verificar se há um comportamento aleatório em torno do zero; Verificar se a variação é constante; Resíduos × a ordem de obtenção; Verificar se há efeito no tempo. Histograma dos resíduos; Verificar a forma da distribuição. Através dos gráficos dos resíduos Gráfico de probabilidade normal; Verificar se a distribuição dos dados é normal. Para fazer inferência com os parâmetros, modelo, predições etc. Testes de Shapiro-Wilk, Kolmogorov- Smirnov etc.; Verificar se a distribuição dos dados é normal. E qualquer outra forma útil para se tirar conclusões. Características de “bons” resíduos Os resíduos devem ter média (esperança) zero; A esperança zero indica que não houve, em média, subestimação nem superestimação dos valores ajustados. Os resíduos devem ter uma variação constante; Se a variância dos resíduos não for constante indicará inadequação do modelo postulado; Os resíduos devem ser não correlacionados. Se houver correlação entre os resíduos indicará também inadequação do modelo postulado; Modelo de regressão nas condições de Gauss-Markov (GM) As condições de Gauss-Markov em regressão refletem exatamente o que se considera um ajuste do modelo adequado aos dados e, portanto, a obtenção de resíduos “bem comportados”. Em outras palavras, resíduos centrados no zero com variância constante e não correlacionados. Modelo de regressão com distribuição normal Se os resíduos são não correlacionados com distribuição conjunta normal, implica que os resíduos são independentes! Modelo de regressão com distribuição normal Observação Por que o gráfico dos resíduos estimados é feito com os valores estimados no eixo das abscissas e não com os valores observados? Resposta: Por que os resíduos são não correlacionados com os valores estimados. Portanto, se houver algum padrão não será devido à correlação que existiria entre os resíduos e os valores ajustados.
Compartilhar