Buscar

CORRELAÇÃO E REGRESSÃO

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 8 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 8 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

ATIVIDADE: CORRELAÇÃO E REGRESSÃO
Disciplina: ESTATÍSCA APLICADA
Professor: Carlos Ramalho
Charles Eduardo Pereira – matrícula 113000042
Curso: Administração
Erick Martins Cormack – matrícula 113000452
Curso: Administração
CORRELAÇÃO
Ao se estudar uma variável o interesse eram as medidas de tendência central, dispersão, assimetria, etc. Com duas ou mais variáveis além destas medidas individuais também é de interesse conhecer se elas têm algum relacionamento entre si, isto é, se valores altos (baixos) de uma das variáveis implicam em valores altos (ou baixos) da outra variável. Por exemplo, pode-se verificar se existe associação entre a taxa de desemprego e a taxa de criminalidade em uma grande cidade, entre verba investida em propaganda e retorno nas vendas, etc.
A associação entre duas variáveis poder ser de dois tipos: correlacional e experimental. Numa relação experimental os valores de uma das variáveis são controlados pela atribuição ao acaso do objeto sendo estudado e observando o que acontece com os valores da outra variável. Por exemplo, pode-se atribuir dosagens casuais de uma certa droga e observar a resposta do organismo; pode-se atribuir níveis de fertilizante ao acaso e observar as diferenças na produção de uma determinada cultura.
No relacionamento correlacional, por outro lado, não se tem nenhum controle sobre as variáveis sendo estudadas. Elas são observadas como ocorrem no ambiente natural, sem nenhuma interferência, isto é, as duas variáveis são aleatórias. Assim a diferença entre as duas situações é que na experimental nós atribuímos valores ao acaso de uma forma não tendenciosa e na outra a atribuição é feita pela natureza.
Frequentemente é necessário estudar o relacionamento entre duas ou mais variáveis. Ao estudo do relacionamento entre duas ou mais variáveis denominamos de correlação e regressão. Se o estudo tratar apenas de duas variáveis tem-se a correlação e a regressão simples, se envolver mais do que duas variáveis, tem-se a correlação e a regressão múltiplas. A regressão e a correlação tratam apenas do relacionamento do tipo linear entre duas variáveis.
A análise de correlação fornece um número que resume o grau de relacionamento linear entre as duas variáveis. Já a análise de regressão fornece uma equação que descreve o comportamento de uma das variáveis em função do comportamento da outra variável.
O COEFICIENTE DE CORRELAÇÃO
Apesar do diagrama de dispersão nos fornecer uma ideia do tipo e extensão do relacionamento entre duas variáveis X e Y, seria altamente desejável ter um número que medisse esta relação. Esta medida existe e é denominada de coeficiente de correlação. Quando se está trabalhando com amostras o coeficiente de correlação é indicado pela letra r que é, por sua vez, uma estimativa do coeficiente de correlação populacional: (rol).
O coeficiente de correlação pode variar de –1,00 a + 1,00, com um coeficiente de +1, indicando uma correlação linear positiva perfeita. Neste caso, as duas variáveis serão exatamente iguais em termos de escores padronizados z, isto é, um elemento apresentando um escore padronizado de 1,5 em uma das variáveis vai apresentar o mesmo escore padronizado na outra variável. Um coeficiente de correlação de –1, indica correlação linear perfeita negativa, com os escores padronizados exatamente iguais em valores absolutos, diferindo apenas no sinal. Uma correlação de +1 ou –1 é raramente observado. O mais comum é que o coeficiente fique situado no intervalo entre estes dois valores. Um coeficiente de correlação “0”, significa que não existe um relacionamento linear entre as duas variáveis.
CORRELAÇÃO LINEAR SIMPLES
Conceito: a correlação expressa à relação entre duas ou mais variáveis. Se duas ou mais variáveis variam concomitantemente, diz-se que estão correlacionadas. 
Exemplo: 
A estatura de uma pessoa e o seu peso. Para uma estatura maior corresponde, em geral, a um peso maior. Dizemos, por isso, que entre as variáveis peso e estatura existe correlação. 
 
CORRELAÇÃO POSITIVA, NEGATIVA E CURVILÍNEA
a) Correlação positiva: valores elevados de uma variável correspondem a valores elevados da outra. Exemplo peso e altura 
b) Correlação negativa: valores elevados de uma variável correspondem a valores baixos da outra e vice-versa. Exemplo: reprovações e nível de escolaridade. 
c) Correlação curvilínea: começa negativa e termina positiva ou vice-versa. Exemplo: tamanho da família e situação sócio econômica.
COEFICIENTE DE CORRELAÇÃO (C)
Expressa numericamente a força e o sentido da correlação. Os coeficientes oscilam entre -1 e 1.
C = - 1 → correlação negativa perfeita 
-1 < C < - 0,6 → correlação negativa forte 
-0,6 < C < - 0,3 → correlação negativa moderada 
-0,3 < C < 0,0 → correlação negativa fraca 
0,0 < C < 0,3 → correlação positiva fraca
0,3 < C < 0,6 → correlação positiva moderada 
0,6 < C < 1 → correlação positiva forte 
C = 1 → correlação positiva perfeita
onde  e  são os valores medidos de ambas as variáveis. Para além disso
e
 são as médias aritméticas de ambas as variáveis.
A análise correlacional indica a relação entre 2 variáveis lineares e os valores sempre serão entre +1 e -1. O sinal indica a direção, se a correlação é positiva ou negativa, e o tamanho da variável indica a força da correlação.
REGRESSÃO
Em estatística, regressão é uma técnica que permite explorar e inferir a relação de uma variável dependente (variável de resposta) com variáveis independentes específicas (variáveis explicatórias). A análise da regressão pode ser usada como um método descritivo da análise de dados (como, por exemplo, o ajustamento de curvas) sem serem necessárias quaisquer suposições acerca dos processos que permitiram gerar os dados.Regressão designa também uma equação matemática que descreva a relação entre duas ou mais variáveis.
O método de estimação mais amplamente utilizado é o método dos mínimos quadrados ordinários. Os principais problemas que devem ser enfrentados em uma regressão são: multicolinearidade, heteroscedasticidade, autocorrelação, endogeneidade e atipicidade.
REGRESSÃO LINEAR
Exemplo de regressão linear.
Em estatística ou econometria, regressão linear é um método para se estimar a condicional (valor esperado) de uma variável y, dados os valores de algumas outras variáveis x.
A regressão, em geral, trata da questão de se estimar um valor condicional esperado.
A regressão linear é chamada "linear" porque se considera que a relação da resposta às variáveis é uma função linear de alguns parâmetros. Os modelos de regressão que não são uma função linear dos parâmetros se chamam modelos de regressão não-linear. Sendo uma das primeiras formas de análise regressiva a ser estudada rigorosamente, e usada extensamente em aplicações práticas. Isso acontece porque modelos que dependem de forma linear dos seus parâmetros desconhecidos, são mais fáceis de ajustar que os modelos não-lineares aos seus parâmetros, e porque as propriedades estatísticas dos estimadores resultantes são fáceis de determinar.
EQUAÇÃO DA REGRESSÃO LINEAR
Para se estimar o valor esperado, usa-se de uma equação, que determina a relação entre ambas as variáveis.
Em que:  - Variável explicada (dependente); é o valor que se quer atingir;
 - É uma constante, que representa a interceptação da reta com o eixo vertical;
 - É outra constante, que representa o declive da reta;
 - Variável explicativa (independente), representa o factor explicativo na equação;
 - Variável que inclui todos os factores residuais mais os possíveis erros de medição. O seu comportamento é aleatório, devido à natureza dos factores que encerra. Para que essa fórmula possa ser aplicada, os erros devem satisfazer determinadas hipóteses, que são: serem variáveis normais, com a mesma variância  (desconhecida), independentes e independentes da variável explicativa X.
Cálculo dos fatores  e 
   
Definindo temos que  e  serelacionam por:
Desenvolvimento
Estas fórmulas podem ser desenvolvidas a partir da definição de mínimos quadrados
O objectivo é determinar  e  de forma que a soma dos quadrados dos erros seja mínima, ou seja, devemos minimizar
Desenvolvendo este quadrado e eliminando os termos constantes (ou seja, aqueles que não têm termos em  e , chega-se a:
A partir desse ponto, pode-se resolver usando-se cálculo (tomando as derivadas parciais, etc), ou através de uma transformação de coordenadas:
Ou
Transformando a expressão a ser minimizada em:
Esta expressão se separa na soma de duas expressões quadráticas independentes, que podem ser minimizadas usando matemática elementar:
Cujos valores minimizadores são:
Ajuste de Curvas é um conjunto de técnicas numéricas que tem como objetivo ajustar 
curvas a um conjunto de dados para se obter estimativas intermediárias. As técnicas 
comumente utilizadas são: 
Regressão: aplicada nos casos dos dados possuírem erros significativos.
A curva obtida não intercepta, necessariamente, todos os pontos. 
 Interpolação: aplicada nos casos dos dados serem bastante precisos. A 
curva obtida deve interceptar todos os pontos.
ANÁLISE DE VARIÂNCIA
Uma análise de variância visa fundamentalmente verificar se existe uma diferença significativa entre as médias e se os fatores exercem influência em alguma variável dependente. Dessa forma, permite que vários grupos sejam comparados a um só tempo, esses fatores podem ser de origem qualitativa ou quantitativa, mas a variável dependente deverá necessariamente ser contínua. O teste é paramétrico (a variável de interesse deve ter distribuição normal) e os grupos tem que ser independentes.
PROPRIEDADES
Por se tratar de um teste bastante difundido, inúmeros softwares estatísticos e planilhas eletrônicas possuem o procedimento para ser aplicado automaticamente.
Considerando uma variável de interesse com média μ e variância  temos dois estimadores da variância:
 = dispersão entre os grupos (B ~ between) e  = dispersão dentro dos grupos (W ~ within)
O teste é aplicado com:
Com  graus de liberdade no numerador e  no denominador. Sendo K o número de fatores ou grupos e N o número de observações, e  = () + ().

Outros materiais