Baixe o app para aproveitar ainda mais
Prévia do material em texto
Aula 5: Estatística. Diagrama de Dispersão e Correlação Até o momento, os estudos realizados envolviam somente uma variável, isto é, se o estudo em questão era a altura do aluno, analisamos através da média, do desvio padrão, etc, as características da distribuição de altura dos alunos. Frequentemente, porém, existem casos em que é necessário analisar a relação entre duas variáveis, como por exemplo, a relação entre a altura e o peso dos alunos, em que queremos saber se um aluno alto tem, em geral, peso maior ou menor e , se existe tal relação, analisar qual o tipo de relação existente. Quando temos duas variáveis, representamo-las por x e y, em que x é geralmente a variável controlável e y é a variável não controlável. A tabela abaixo ilustra alguns exemplos de duas variáveis. X (variável controlável) Y (variável não controlável) Preço do produto Quantidade de produto vendido Dose de um remédio Temperatura do corpo Horas de estudo Nota da prova Nesse tipo de estudo os dados estão sempre em pares e são representados por (x, y). Cada dado corresponde a uma amostra unitária, ou seja, se tivermos n amostras unitárias, teremos n pares (x, y). Por exemplo, se n = 5, teremos os pares: (x1, y1) , (x2, y2), (x3, y3), (x4, y4) e (x5, y5). É importante estar ciente de que a troca de um elemento di oara (x, y) por outro elemento de um outro par implicará em erro de análise. Por exemplo, se tivermos duas amostras unitárias (x1, y1) e (x2, y2), não podemos trocá-las por (x1, y2) , (x2, y1), pois estaremos trocando valores entre amostras diferentes. Diagrama de Dispersão Uma análise preliminar para verificar a existência de relação entre duas variáveis pode ser feita pelo diagrama de dispersão. O diagrama de dispersão é construído em um sistema de eixos cartesianos, onde o eixo horizontal é o eixo da variável x e o eixo vertical é o eixo da variável y, e no qual cada dado (x, y) corresponderá a um ponto. Como exemplo, vamos utilizar os dados da tabela abaixo para construirmos um diagrama de dispersão. Observe que os pontos do diagrama de dispersão apresentam certo comportamento. Correlação O diagrama de dispersão geralmente indica a existência de relação entre as variáveis e também sugere o tipo de relação que melhor se adapta aos dados. Analisando o diagrama de dispersão da figura acima podemos perceber que existe uma relação entre as variáveis, pois os valores de y dos pontos crescem com o aumento dos valores de x. Vale observar, também, que nem todos os pontos obedecem a esta relação, mas que a maioria dos pontos segue este comportamento. Dizemos que existe uma correlação quando duas variáveis estão ligadas por uma relação. Quando o comportamento dos pontos do diagrama de dispersão for tal que os valores de y crescem com os valores de x, dizemos que existe uma correlação positiva. Se o comportamento for o inverso, isto é, o valor de y decresce com o aumento de x, dizemos que existe uma correlação negativa. Quando não há correlação, as duas variáveis são independentes e, neste caso, os pontos do diagrama de dispersão ficam espalhados aleatoriamente, sem nenhum padrão de comportamento. Coeficiente de Correlação Linear O coeficiente de correlação linear (r) a ser estudado é dado por: Onde: n é o número de dados e xi e yi são os valores dos pontos (xi, yi). O coeficiente de correlação tem um valor limitado entre -1 e 1, ou seja, -1 r 1. O valor de r indica o grau de correlação linear existente entre as duas variáveis e o seu sinal indica o tipo de correlação: negativa (r < 0) ou positiva (r > 0). No caso em que r = -1 ou r = 1, a correlação linear é dita perfeita. Outros casos que merecem atenção são aqueles em que o coeficiente de correlação linear é próximo ou igual a zero. Neste caso, podem ocorrer duas situações possíveis: não há correlação ou a correlação linear não é adequada, isto é, apesar de existir correlação, esta não é linear. Regressão Linear Simples O objetivo aqui é encontrar um método de obtenção da equação de uma reta que se ajusta melhor ao conjunto de pares (x, y) dos dados. Equação da Reta Uma reta é descrita matematicamente por: Y = a + b*X, onde: a é chamado coeficiente linear e b é chamado de coeficiente angular. Regressão Linear Simples A regressão consiste em determinar uma função que melhor se ajusta aos pontos do diagrama de dispersão. Neste livro estudaremos somente a regressão linear simples que trata do ajuste de uma reta do tipo y = a + b*x aos pontos do diagrama de dispersão. Um dos principais usos da regressão é na realização de previsões de resultados. A regressão linear simples consiste em determinar os valores dos coeficientes linear a e angular b da equação de uma reta, a partir dos dados experimentais. As expressões matemáticas utilizadas para determinar os valores de a e b são obtidas por um método denominado Método dos Mínimos Quadrados que não será apresentado, aqui, por necessitar de cálculos um pouco mais avançados. Os coeficientes a e b são dados pelas seguintes expressões: Onde: n é o número de dados e xi e yi são as coordenadas do ponto (xi, yi). OBS: Como o coeficiente a depende do valor de b, devemos calcular inicialmente o coeficiente b. Ex: Exemplificaremos os cálculos utilizando os dados da tabela abaixo: Portanto Y = 0,3052+1,9035X. Exercícios: 1 – Um pesquisador sabe que existe uma relação linear entre a temperatura T do tanque e a taxa de produção de um determinado produto y. o pesquisador realizou 10 experimentos variando a temperatura de 5 em 5 graus Celsius e obteve a seguinte tabela de dados: T (º C) 50 55 60 65 70 75 80 85 90 95 y(Kg/l) 50,4 55,8 61,2 67,1 70,5 77,1 81,2 85,9 92,4 98,1 Monte o diagrama de dispersão calcule o coeficiente de correlação linear, e obtenha a equação de regressão que melhor se ajusta aos dados. Qual será o valor da produção para uma temperatura de 72º C 2 – Um pesquisador realizou seis experimentos para analisar a relação entre o tempo de exposição de um material à luz e o tempo de vida desse material, e obteve os seguintes dados: Tempo de Exposição (horas) Tempo de Vida (dias) 0,0 30 5,0 24 10,0 20,5 15,0 16,5 20,0 13,1 25,0 8,0 Monte o diagrama de dispersão calcule o coeficiente de correlação linear, e obtenha a equação de regressão que melhor se ajusta aos dados. Estime o tempo de vida se o tempo de exposição for 25% maior do que o a média do tempo dos seis experimentos. 3 – O gerente de uma loja recebeu a informação de que o seu lucro estaria relacionado diretamente com a quantidade de produtos distintos que a loja possui. Para analisar esta informação, o gerente coletou os seguintes dados: Quantidade de Produtos Lucro ($ 1000) 20 11,5 30 12,2 40 15,2 50 24,1 60 25,2 70 26,8 Faça um diagrama de dispersão. Analise se o diagrama confirma a informação recebida pelo gerente. Calcule o coeficiente de correlação linear, como você classifica a correlação (forte, fraca, ou inexistente). Monte a equação de regressão e estime o lucro para 42 produtos diferentes. 4 – Uma imobiliária quer saber a relação existente entre o investimento em propaganda e o número de clientes que recebem diariamente. Para isso coletou os seguintes dados. Investimento ($ 1000) Número de Clientes 10 15 12 18 14 20 16 26 18 29 20 35 Monte o diagrama de dispersão calcule o coeficiente de correlação linear, e obtenha a equação de regressão que melhor se ajusta aos dados. Calcule a diferença entre o número de clientes que comparecem a Imobiliária quando foi investido $17.000 e $21.000. _1272039490.unknown _1272040803.unknown _1272042483.unknown _1272043394.unknown _1272041015.unknown _1272039509.unknown _1272038990.unknown
Compartilhar