Baixe o app para aproveitar ainda mais
Prévia do material em texto
�PAGE \* MERGEFORMAT�1� UNIVERSIDADE ESTÁCIO DE SÁ Curso: Administração de Empresas Disciplina: Analise de Estatística Correlação e Regressão Linear - Período; Quarto (4º) sala 1005 CORRELAÇÃO E REGREÇÃO LINEAR COMPONENTES DA EQUIPE: Ana Nery Silva Santos – Matricula: 201408100118 Adailton de Jesus Silva de Azevedo- Matricula: 201403101302 Cizino Morais Rabelo- 201402072007 Carlos Francyclea Cutrim Costa de França-201408128543 Valeria São Luís 2016 Sumário 31 - INTRODUÇÃO � 31.1 – Correlação � 31.2 O Coeficiente de Correlação � 31.4 – Coeficiente de Correlação � 42 - Regressão � 44 - REFERENCIAS BIBLIOGRAFICAS � 5Anexo I � 51. APÊNDICES � 5Apresentação: � 6ETAPAS � 6ETAPAS I - Coleta dos Dados - 10 Horas � 71. A venda de produtos tem relação com as visitas realizadas pelos vendedores aos seus clientes? � 72. O número de acidentes verificados nas instalações de uma empresa tem relação com o número de horas de treinamentos preventivos? � 73. Existe relação entre LDL colesterol e triglicérides? � 8ETAPA II - Aplicação das técnicas estatísticas - 15 horas � 81. Diagrama de dispersão � 92. Medir a intensidade da relação por meio do coeficiente de correlação linear, cuja fórmula é � 103. Realizar o teste de hipótese para verificar se a relação linear é significativa. � 114. Caso a relação linear seja significativa, encontrar a equação de regressão e o coeficiente de determinação. � 115. Fazer previsão para algum valor atribuído para x, lembrando que o aluno deve ter o � 11cuidado na escolha do valor de x, de modo que não haja extrapolação. � 116. Construir novamente o diagrama de dispersão, apresentado a reta de regressão e o coeficiente de determinação. � � 1 - INTRODUÇÃO 1.1 – Correlação Ao se estudar uma variável o interesse eram as medidas de tendência central, dispersão, assimetria, etc. Com duas ou mais variáveis além destas medidas individuais também é de interesse conhecer se elas têm algum relacionamento entre si, isto é, se valores altos (baixos) de uma das variáveis implicam em valores altos (ou baixos) da outra variável. Por exemplo, pode-se verificar se existe associação entre professores e alunos. Numa relação experimental os valores de uma das variáveis são controlados pela atribuição. No relacionamento correlacional, por outro lado, não se tem nenhum controle sobre as variáveis sendo estudadas. Elas são observadas como ocorrem no ambiente natural, sem nenhuma interferência, isto é, as duas variáveis são aleatórias. Assim a diferença entre as duas situações é que na experimental, nós atribuímos valores ao acaso de uma forma não tendenciosa e na outra a atribuição é feita pela natureza. Frequentemente é necessário estudar o relacionamento entre duas ou mais variáveis. Ao estudo do relacionamento entre duas ou mais variáveis denominamos de correlação e regressão. Se o estudo tratar apenas de duas variáveis tem-se a correlação e a regressão simples, se envolver mais do que duas variáveis, tem-se a correlação e a regressão múltiplas. A regressão e a correlação tratam apenas do relacionamento do tipo linear entre duas variáveis. A análise de correlação fornece um número que resume o grau de relacionamento linear entre as duas variáveis. Já a análise de regressão fornece uma equação que descreve o comportamento de uma das variáveis em função do comportamento da outra variável. 1.2 O Coeficiente de Correlação Apesar do diagrama de dispersão nos fornece uma ideia do tipo e extensão do relacionamento entre duas variáveis X e Y, seria altamente desejável ter um número que medisse esta relação. Esta medida existe e é denominada de coeficiente de correlação. Quando se está trabalhando com amostras o coeficiente de correlação é indicado pela letra que é, por sua vez, uma estimativa do coeficiente de correlação populacional: (rô). 1.4 – Coeficiente de Correlação O coeficiente de correlação pode variar de –1,00 a + 1,00, com um coeficiente de +1, indicando uma correlação linear positiva perfeita. Neste caso, as duas variáveis serão exatamente iguais em termos de escores padronizados z, isto é, um elemento apresentando. Um escore padronizado de 1,5 em uma das variáveis vai apresentar o mesmo escorepadronizado na outra variável. Um coeficiente de correlação de –1, indica correlação linear perfeita negativa, com os escores padronizados exatamente iguais em valores absolutos, diferindo apenas no sinal. Uma correlação de +1 ou –1 é raramente observado. O mais comum é que o coeficiente fique situado no intervalo entre estes dois valores. Um coeficiente de correlação “0”, significa que não existe um relacionamento linear entre as duas variáveis. 2 - Regressão Em estatística, regressão é uma técnica que permite explorar e inferir a relação de uma variável dependente (variável de resposta) com variáveis independentes específicas (variáveis explicatórias). A análise da regressão pode ser usada como um método descritivo da análise de dados (como, por exemplo, o ajustamento de curvas) sem serem necessárias quaisquer suposições acerca dos processos que permitiram gerar os dados. Regressão designa também uma equação matemática que descreva a relação entre duas ou mais variáveis. Em estatística ou economia regressão linear é um método para se estimar a condicional (valor esperado) de uma variável y, dados os valores de algumas outras variáveis x. A regressão, em geral, trata da questão de se estimar um valor condicional esperado. A regressão linear é chamada "linear" porque se considera que a relação da resposta às variáveis é uma função linear de alguns parâmetros. Os modelos de regressão que não são uma função linear dos parâmetros se chamam modelos de regressão não-linear. Sendo uma das primeiras formas de análise regressiva a ser estudada rigorosamente, e usada extensamente em aplicações práticas. Isso acontece porque modelos que dependem de forma linear dos seus parâmetros desconhecidos, são mais fáceis de ajustar que os modelos não-lineares aos seus parâmetros, e porque as propriedades estatísticas dos estimadores resultantes são fáceis de determinar. 4 - REFERENCIAS BIBLIOGRAFICAS https://www.eecis.udel.edu/~portnoi/classroom/prob_estatistica/2006_2/lecture PESQUISADO DIA: 08 de Junho de 2016 Anexo I 1. APÊNDICES Todos os documentos elaborados pelo autor e que servem para complementar as informações fornecidas no corpo do trabalho podem ser colocados em apêndices (fotos, tabelas, quadros para coleta de dados, rotinas utilizadas para análise dos dados). Análise de dados utilizando as técnicas de Correlação e Regressão Linear Simples Objetivo Analisar conjuntamente duas variáveis quantitativas; Verificar se existe algum tipo de relacionamento entre duas variáveis quantitativas e, caso exista, qual é o tipo de relação; Medir a intensidade do relacionamento, caso ele seja linear; Realizar um teste de hipótese para determinar se há ou não uma relação linear significativa entre duas variáveis quantitativas; Havendo uma relação linear significativa, descrever esta relação por meio da equação de regressão; Utilizar a equação de regressão para fazer previsões. Competências / Habilidades As atividades propiciarão ao aluno: Aplicar os conceitos teóricos abordados em sala de aula em um conjunto de dados (real ou fictício); Utilizar as ferramentas de análise de correlação e regressão disponíveis no Excel; Desenvolver a capacidade de elaborar um relatório descrevendo: objetivo do estudo, coleta dos dados, metodologia aplicada, resultados obtidos e conclusão. Desenvolvimento Apresentação: As atividades aqui propostas têm como objetivo o estímulo à autoaprendizagem, permitindo ao discente participar de todas as etapas necessárias para a aplicação dastécnicas de correlação e regressão, visando à ampliação da percepção de como conduzir uma análise estatística e de como apresentar os resultados obtidos. A atividade será desenvolvida em duas etapas distintas, com um produto final. I. Etapa - Coleta dos dados II. Etapa - Aplicação das técnicas estatísticas Produto Final - Elaboração de um relatório estatístico. ETAPAS ETAPAS I - Coleta dos Dados - 10 Horas Nesta etapa, o aluno terá que fazer o levantamento dos dados amostrais em pares, pois a atividade proposta envolve a resposta de duas variáveis para cada elemento da amostra. Por exemplo: investimento com propaganda e vendas, preço de pacotes de turismo e adesão de turistas, notas na disciplina de cálculo e notas na disciplina de estatística, receita anual e lucro anual de uma empresa, entre outros. Para a utilização da técnica de Regressão Linear Simples, a distinção entre a variável independente (X) e a variável dependente (Y) é essencial. Então, os dados estarão dispostos em uma tabela com a seguinte estrutura: X (NÚMEROS DE ALUNOS) Y (NÚMEROS DE PROFESSORES) 8 4 10 5 18 9 42 21 44 22 60 60 Como o objetivo é a aplicação de técnicas utilizadas para relações lineares, vamos trabalhar com dados em que haja um relacionamento linear entre as variáveis selecionadas para o estudo. Caso isto não aconteça, será necessário fazer outra coleta de dados. Como sugestão, pode-se coletar dados para responder as seguintes perguntas: 1. A venda de produtos tem relação com as visitas realizadas pelos vendedores aos seus clientes? Vendedor Vendedor Visitas Realizadas no mês Vendas no Mês 1 40 140 2 102 330 3 65 185 10 51 140 2. O número de acidentes verificados nas instalações de uma empresa tem relação com o número de horas de treinamentos preventivos? Número de horas de treinamento Número de acidentes 14 49 12 52 18 45 28 44 3. Existe relação entre LDL colesterol e triglicérides? LDL colesterol Triglicérides 125 140 140 170 195 480 220 530 Caso o aluno esteja no mercado de trabalho e, se for possível utilizar informações do seu ambiente profissional, o estudo poderá ser feito com dados reais. Observação: Analisar atentamente os dados, para a escolha correta da variável independente (X) e variável dependente (Y). ETAPA II - Aplicação das técnicas estatísticas - 15 horas Nesta etapa, o aluno aplicará as técnicas de análise de correlação e regressão linear simples com os dados coletados. É imprescindível a leitura do Capítulo 3: Correlação e egressão Linear Simples, do livro didático Análise Estatística. 1. ed. Rio de Janeiro: Editora da Universidade Estácio de Sá, 2015. É muito importante que o aluno consiga identificar a ordem natural das técnicas a serem aplicadas: 1. Diagrama de dispersão Diagrama de dispersão, para visualização de uma possível relação linear (que é o interesse da atividade). Neste diagrama, os pares ordenados representam pontos em um plano ordenado. A variável X é representada no eixo das abscissas (horizontal) e a variável Y no eixo das ordenadas (vertical). 2. Medir a intensidade da relação por meio do coeficiente de correlação linear, cuja fórmula é Nº alunos (x) Nº professores (y) X . Y X2 Y2 8 4 32 64 16 10 5 50 100 25 18 9 162 324 81 42 21 882 1764 441 44 22 968 1936 484 60 30 1800 3600 900 ∑=182 ∑=91 ∑=3894 ∑=7788 ∑=1947 R= 6(3894) – (182) . (91)______ Ѵ6(7788)-(182)2. Ѵ6(1947)-(91)2 => R= 23.364-16562 Ѵ46728-33124. Ѵ11632-2881 => R= 6802______ Ѵ13604. Ѵ3401 => R= 6802 (116,6366).(58,31809) => R= 6802 6801,994 => R= 1 (perfeitamente correlacionado) 3. Realizar o teste de hipótese para verificar se a relação linear é significativa. t= _RAA Ѵ1-r2 N-2 t= 1 Ѵ1-12 6-2 t= 1 Ѵ0 4 t=0 Não Há correlação significativa Seguir o passo a passo descrito no item 3.3 do livro didático. 4. Caso a relação linear seja significativa, encontrar a equação de regressão e o coeficiente de determinação. Em que: E Y=0,05x Não Há correlação significativa 5. Fazer previsão para algum valor atribuído para x, lembrando que o aluno deve ter o cuidado na escolha do valor de x, de modo que não haja extrapolação. X=1000 Y=0,5x Y=0,5.1000 Y=500 professores. X=250 Y=0,5.X Y= 0,5 . 250 Y=125 6. Construir novamente o diagrama de dispersão, apresentado a reta de regressão e o coeficiente de determinação. [Capture a atenção do leitor com uma ótima citação do documento ou use este espaço para enfatizar um ponto-chave. Para colocar essa caixa de texto em qualquer lugar na página, basta arrastá-la.]
Compartilhar