Buscar

Tarefa 2 (2)

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 24 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 24 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 24 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Disciplina: Economia Gerencial
Identificação da tarefa: Tarefa 2. Envio de arquivo (Unidade 2)
Pontuação: 20 pontos
Tarefa 2
Em nossa disciplina, a Unidade 2 aborda as técnicas quantitativas econômicas, incluindo a econometria, chamada ciência social na qual ferramentas de teoria econômica, matemática e inferência estatística são aplicadas à análise de fenômenos econômicos. Vimos ainda que através de uma equação de regressão, no caso da correlação, podemos estimar um valor intermediário para variáveis exploratórias, o que pode ser muito útil para a tomada de decisões de produção.
Portanto, vamos colocar em prática esse conceito: suponha que a empresa Cayro produz camisetas personalizadas, de acordo com a tabela 1:
Tabela 1: Custos de Produção da Empresa Cayro
	Custos de Produção de Camisetas
	Quantidade (x)
	Custos(Y)
	100
	1000
	110
	1150
	120
	1200
	130
	1300
	140
	1390
	150
	1400
Fonte: a autora.
Que gerou o gráfico 1:
Gráfico 1: Diagrama de Dispersão dos Custos de Produção
Fonte: a autora.
De acordo com os dados, responda:
a) Existe correlação entre a quantidade produzida e o custo?
b) Se existe correlação entre a quantidade produzida e o custo, determine o valor estimado para a produção de 160 unidades, de acordo com a equação de correlação, que se apresenta no gráfico 1. Apresente os cálculos.
Bom trabalho!
UNIDADE 2 | CAPÍTULO 1
TÉCNICAS QUANTITATIVAS DE REGRESSÃO E CORRELAÇÃO, CÁLCULO LAGRANGIANO
1
ECONOMETRIA
A econometria, de acordo com Gujarat (2006), é uma ciência social na qual ferramentas de teoria econômica, matemática e inferência estatística são aplicadas à análise de fenômenos econômicos.
A econometria, dizem Malbouisson e Tiryaki (2019), adapta os métodos matemáticos e estatísticos aos problemas econômicos, de modo a proporcionar medidas científicas das relações econômicas, as quais incluem elementos aleatórios na análise, fornecendo estimativas dos parâmetros das variáveis econômicas analisadas para eventual uso na política econômica e para projetar valores futuros dessas variáveis (inflação, crescimento, desemprego, juros, câmbio, comércio exterior etc.). Assim sendo, os métodos econométricos permitem a avaliação casual entre duas variáveis, levando em consideração outras formas que são importantes para o estudo em questão.
A econometria, de acordo com Gujarati (2006), pode ser dividida em duas categorias amplas: econometria teórica e econometria aplicada. E cada categoria pode abordar a disciplina segundo as tradições clássica e bayesiana.
As estatísticas descritivas, de acordo com diz Malbouisson e Tiryaki (2019), referem-se a uma população univariada. Entretanto, o objetivo fundamental do pesquisador é identificar uma relação causal de interesse. Portanto, é comum trabalhar com uma população bivariada ou multivariada. Nesse caso, duas perguntas devem ser respondidas:
· Existe alguma associação entre as variáveis e, caso positivo, qual a extensão desta associação?
· Existe alguma relação causal entre algumas dessas variáveis e, caso positivo, qual a extensão e direção da causalidade?
A primeira pergunta é respondida por meio da análise de correlação, e a segunda requer o uso de métodos econométricos.
Variáveis
Variáveis podem, de modo geral, ser classificadas em quantitativas e qualitativas. As variáveis quantitativas podem ser contínuas ou discretas. As qualitativas em nominais ou categóricas e ordinais, ou ainda variáveis dummy. Para Malbouisson e Tiryaki (2019), as variáveis nominais ou categóricas são utilizadas para converter aspectos qualitativos em escala numérica, como, por exemplo, a codificação numérica do estado civil dos indivíduos da amostra pode ser classificada em 1 para solteiros, 2 para casados, 3 para separados, 4 para viúvos.
A variável dummy é binaria (0,1) e pode ser criada para discriminar períodos anteriores ao evento estudado, atribuindo o valor zero para o período anterior ao evento e o valor 1 para o período posterior ao evento, como, por exemplo, uma mudança na legislação, pode-se criar uma variável dummy zero para antes da mudança da legislação e um valor 1 para o período posterior à mudança. Caso se acredite que um evento fora do comum ficou restrito a um período, é possível criar uma variável dummy atribuindo o valor de 1 apenas para o período do evento, e zero para as demais observações. Por exemplo, um temporal danifica uma importante estrada, dificultando o escoamento de produção, mas os trabalhos de recuperação são concluídos em um mês, nesse caso, a variável será criada apenas para o período de um mês. Um tipo de dummy frequentemente utilizado em economia são as dummy sazonais, quando o pesquisador trabalha com observações mensais ou trimestrais dos dados. Essa variável dummy é criada para capturar variações regulares que ocorrem em dados de algumas estatísticas econômicas ao longo do ano, como o Natal, que impacta em variáveis como produto interno bruto, índices de preço e emprego (MALBOUISSON; TIRYAKI, 2017).
Ainda para esses autores, a variável dummy também pode ser associada à dimensão temporal de dados, é a chamada dummy temporal. Ao inferir estatisticamente essas variáveis, pode-se utilizá-las para capturar tendências, como a renda e o consumo do país ao longo do tempo. Se o pesquisador, estiver trabalhando com dados anuais entre 2000 e 2019 a variável dummy temporal pode ser especificada das seguintes formas: T = 2000, 2001, 2002, ..., 2019 ou T = 1,2,3, ..., 20, porém, esse tipo de variável temporal, recentemente tem sido substituída por modelos específicos para lidar com variáveis que exibem tendências temporais. Logo, as três versões de dummy geram resultados semelhantes, sendo que a segunda é a mais utilizada.
Dados
Em econometria, afirmam Malbouisson e Tiryaki (2019), os dados são organizados na forma de tabelas, utiliza-se a expressão matriz de dados para representar a coleção de dados que estão sendo usados para a inferência estatística. O pesquisador pode trabalhar com três tipos de dados: cross-section, séries temporais e dados em painel. Nos três casos, os dados são organizados sob a forma de matrizes. Trabalha-se com dados em cross-section sempre que se tem observações para várias unidades individuais (pessoas, empresas, municípios, estados e países). São exemplos de dados cross-section os obtidos pelo IBGE em um determinado ano ou dados de balanços patrimoniais de empresas para um determinado ano ou trimestre.
As séries temporais envolvem a organização de dados de diversas variáveis ao longo do tempo, para uma única unidade individual. Já os dados em painel, também chamados de dados longitudinais, são estruturados com observação de variáveis de diferentes unidades em cross-section ao longo de um mesmo período de tempo, sendo que se tem mais de uma observação temporal por uma unidade de cross-section. A tabela 1 é exemplo de dados em painel e apresenta os dados de desempenho escolar de um mesmo conjunto de indivíduos durante um período fixo.
Tabela 1. Exemplo de dados em painel.
	ALUNO
	PERÍODO
	DESEMPENHO EM MATEMÁTICA (MÉDIA FINAL)
	DESEMPENHO EM PORTUGUÊS (MÉDIA FINAL)
	Cayro
	2017
	5,5
	7,0
	Cayro
	2018
	8,5
	6,5
	Cayro
	2019
	7,5
	8,0
	Maya
	2017
	7,0
	8,5
	Maya
	2018
	8,5
	7,5
	Maya
	2019
	9,5
	8,5
	Zyva
	2017
	6,5
	5,5
	Zyva
	2018
	8,5
	7,5
	Zyva
	2019
	9,5
	8,5
Fonte: elaborada pela autora.
A estrutura dos dados afeta a forma como a análise econométrica é conduzida. Enquanto a análise de dados em cross-section envolve menos problemas de especificação, as séries temporais e dados em painel requerem procedimentos mais específicos, quando se quer, por exemplo, determinar o grau de associação entre variáveis.
Diagrama de dispersão
A correlação entre variáveis pode ser analisada usando gráficos de dispersão e cálculos de coeficiente de correlação. Os gráficos de dispersão permitem a visualização de aspectos a serem analisados, tais como a positividade ou negatividade (positiva ou negativa), entre as variáveis, a robustez dessa associação e sua linearidade. Enquanto o coeficiente decorrelação nos permite avaliar apenas o tipo de correlação e sua robustez, porém, com maior precisão.
A observação do diagrama de dispersão, diz Moore e Mccabe (2002), é a forma mais simples que se pode utilizar para estabelecer o comportamento conjunto de duas variáveis quantitativas, por isso, é uma das metodologias utilizadas na gestão de uma empresa. Ao criar um modelo inicial, fica mais fácil utilizá-lo para se certificar de novas hipóteses que envolvem o negócio.
Os gráficos ou diagramas de dispersão, também chamados scatter plots, apresentam a ilustração gráfica de pares de variáveis, sem que a dimensão temporal seja explicitamente exposta. No caso de dados cross-section, cada ponto em um gráfico de dispersão mostra os valores das duas variáveis estudadas para uma determinada unidade individual de cross-section. No caso de séries temporais, cada ponto no gráfico de dispersão mostra os valores das duas variáveis em um determinado ponto no tempo. Por fim, no caso de dados em painel, cada ponto no gráfico mostra os valores das duas variáveis em um determinado ponto no tempo, para cada unidade de cross-section (MALBOUISSON; TIRYAKI, 2019).
Portanto, diz Costa Neto (2002), o diagrama de dispersão utiliza o sistema de coordenadas cartesianas em que são representadas, primeiramente uma das variáveis no eixo das abscissas (variável x) e a outra variável no eixo das ordenadas (variável y). Os valores das variáveis são marcados sob os respectivos eixos e assim marca-se um ponto para cada par de valores.
Para Moore e McCabe (2002), quando se espera que uma variável x possa explicar uma variável y, ou mesmo causar mudanças nela, dizemos que x é uma variável explanatória e que y é uma variável-resposta.
Em econometria, diz Malbouisson e Tiryaki (2017), dá-se o nome de variável dependente àquela que se quer explicar, variáveis independentes ou regressores, a todos os fatores relevantes, inclusive o fator que é o objeto de estudos, e de variáveis de controle, ao conjunto das variáveis independentes que são relevantes, mas serão mantidas fixas. Se, por exemplo, um pesquisador deseja determinar a relação entre a importância do nível educacional com a determinação salarial, mesmo que o foco da pesquisa seja verificar a importância do nível educacional para o nível de salários, seria necessário controlar outros aspectos de reconhecida importância, tais como, gênero, raça e experiência, entre outras variáveis. Nesse caso, o nível educacional e as variáveis de controle, por sua vez, representam o conjunto das variáveis independentes.
O exemplo a seguir apresenta uma tabela com os dados relativos a uma pesquisa de satisfação de clientes em banco. Deseja-se saber se existe correlação entre o tempo de espera na fila para ser atendido e a satisfação do cliente com o banco. Nesse caso, temos duas variáveis. A variável x é o tempo de espera (variável explanatória) e a variável y é a nota (variável-resposta), de 0 a 10, dada pelo cliente pelo atendimento. Os resultados das respostas de 10 clientes são assim representadas.
Tabela 2. Tabela de dados.
	CLIENTE
	TEMPO DE ESPERA (X)
	NOTA (Y)
	1
	15
	7
	2
	20
	6
	3
	32
	5
	4
	12
	8
	5
	10
	9
	6
	35
	4
	7
	19
	8
	8
	18
	6
	9
	8
	10
	10
	25
	6
Fonte: elaborada pela autora.
O gráfico 1 apresenta o diagrama de dispersão dos dados da tabela:
Gráfico 1. Diagrama de dispersão referente à tabela 1.
Fonte: elaborada pela autora.
Basta observar o gráfico de dispersão, para que se possa entender a correlação entre o tempo de espera e os resultados de satisfação do cliente, porque, obviamente, quanto maior o tempo, menor a nota recebida, portanto, aparentemente, a variável-resposta ‘nota’ (y) existe em função da variável explanatória tempo de espera (x).
Portanto, para examinar um diagrama de dispersão, devemos procurar padrão geral e desvios acentuados em relação a ele. O padrão geral pode ser descrito pela forma, direção e força do relacionamento.
Um tipo importante de desvio é o outlier, que é um valor individual que se situa fora do padrão global da relação.
Correlação
Correlação é uma medida estatística que testa a relação entre duas variáveis. Talvez seja uma das medidas mais importantes, pois variáveis próximas podem ser correlacionadas, para que possamos fazer previsões a seu respeito.
O diagrama de dispersão nos dá uma boa ideia a respeito da correlação, isto é, se existe e qual o tipo de correlação.
Na linguagem estatística, de acordo com Braule (2001), se houver uma correlação entre duas variáveis, elas quase sempre podem seguir a mesma direção e, então, estarão em uma direção positiva ou podem ser opostas, o que significa uma correlação negativa.
Assim, quando dizemos que existe correlação entre a variável quantidade de pais desempregados e a variável evasão escolar, pode-se dizer que existe uma correlação linear positiva, pois as duas variáveis seguem em mesma direção, isto é, quanto maior a quantidade de pais desempregados, maior será a evasão nas escolas. Já a correlação entre a variável quantidade de efetivo policial em determinada cidade e a variável ocorrência de delitos na mesma cidade é uma correlação linear negativa, pois as duas seguem em direções opostas, quanto maior o efetivo policial, menor será a quantidade de delitos.
Portanto, em cada caso, temos diagramas de dispersão diferentes, que representam o tipo de correlação e a intensidade da correlação. A figura 1 apresenta exemplos desses diagramas de dispersão e suas definições.
Figura 1. Diagramas de dispersão de tipos de correlação.
Fonte: elaborada pela autora.
Coeficiente de correlação
A correlação mede a direção da intensidade de uma relação linear entre duas variáveis quantitativas, e costuma ser representada por r.
Embora o diagrama de dispersão seja de grande importância, não nos fornece, com precisão a intensidade da correlação entre as variáveis, ou seja, o grau de aderência entre as séries.
Para isso, temos algumas expressões matemáticas que nos ajudam a determinar qual o grau de correlação entre as variáveis. De acordo com os dados que temos sobre as variáveis, podemos utilizar algumas fórmulas.
Assim sendo, se temos dados sobre as variáveis x e y para n indivíduos, as médias e os desvios padrão das duas variáveis sãoe sx, para os valores de x ee sy, para os valores de y, a correlação r entre x e y é dada por:
Onde:
· r = correlação;
· n = tamanho da amostra (número de observações);
· Σ = soma de todos esses termos para todos os indivíduos;
· x e y são variáveis para n indivíduos;
·   são as respectivas médias;
· sx sy são os respectivos desvios padrão.
Porém, o coeficiente de correlação de Pearson é a medida mais utilizada para a verificação preliminar da relação entre duas variáveis, pois considera apenas os dados das variáveis em questão.
Portanto, quando temos apenas dados variáveis e, com o aprimoramento da expressão anterior, podemos derivar a fórmula para calcular o coeficiente de correlação linear direta de Pearson, que é a fórmula mais usada, dada por:
Onde:
· n = tamanho da amostra (número de observações);
· Σ = soma de todos esses termos para todos os indivíduos;
· x e y são variáveis para n indivíduos.
O resultado da fórmula, r nos mostra se existe ou não correlação entre as variáveis e qual é a intensidade dessa correlação.
De acordo com Vieira (2008), o valor de r deve estar no intervalo numérico de -1 a 1, isto é [-1,1] e sua análise é a seguinte:
· Se a correlação entre duas variáveis é perfeita e positiva, então r = +1.
· Se a correlação entre duas variáveis é perfeita e negativa, então r = -1.
· Se não há correlação entre as variáveis, então r = 0.
· Para se ter correlação é necessário que 0,6 ≤ |r | ≤1.
· Se 0,3 < |r| < 0,6 há correlação relativamente fraca entre as variáveis.
· Se 0 < |r| < 0,3, a correlação é muito fraca e, praticamente nada se pode concluir sobre a relação entre as variáveis em estudo.
Isto é, quanto mais o valor de r se aproxima do 1 ou -1, mais forte é a correlação.
Anteriormente, fizemos o diagrama de dispersão com os dados relativos a umapesquisa de satisfação de clientes em banco. Aparentemente, pelo diagrama, existe correlação entre as variáveis em questão, como temos apenas os dados da pesquisa, vamos utilizar a fórmula de correlação linear de Pearson para vermos qual é a intensidade dessa correlação.
Na tabela 3, estão representados os dados da pesquisa e o acréscimo das colunas que nos darão os somatórios necessários à fórmula.
Tabela 3. A tabela 2 acrescida das colunas necessárias à fórmula de Pearson.
	CLIENTE
	TEMPO DE ESPERA (XI)
	NOTA (YI)
	XIYI
	XI²
	YI²
	1
	15
	7
	105
	225
	49
	2
	20
	6
	120
	400
	36
	3
	32
	5
	160
	1024
	25
	4
	12
	8
	96
	144
	64
	5
	10
	9
	90
	100
	81
	6
	35
	4
	140
	1225
	16
	7
	19
	8
	152
	361
	64
	8
	18
	6
	108
	324
	36
	9
	8
	10
	80
	64
	100
	10
	25
	6
	150
	625
	36
	Total
	194
	69
	1201
	4492
	507
Fonte: elaborada pela autora.
Já temos os dados necessários para a fórmula, então, vamos substituí-los. Note que vamos utilizar apenas os totais, que são os somatórios (Σ).
Dados: n = 10,
Portanto, pelo valor do coeficiente de correlação (r), podemos confirmar o que foi apresentado no diagrama de dispersão, com r- 0,92, temos uma forte correlação negativa entre as variáveis tempo de espera na fila e a nota dada pelo cliente. O coeficiente de correlação é negativo, porque quanto maior o tempo de espera, menor a nota. As variáveis são opostas, então, é esperada uma correlação negativa.
Regressão linear
Como já vimos, os dados da tabela formam uma nuvem de dispersão, temos inclusive o resultado da correlação entre os dados. Porém, se existe correlação, pode-se criar a relação existente entre as variáveis para que se possa fazer previsões sobre valores interpolares aos dados obtidos.
Esses valores são obtidos por meio da equação da reta de regressão que se pode calcular com a variável y em função de x, portanto, por meio da reta de regressão, pode-se estimar que, por exemplo, quando o tempo de espera for de 14 minutos, qual nota será atribuída pelo cliente.
Para isso, criamos a equação da reta de regressão, que nada mais é do que a equação da reta que supostamente se apresenta no diagrama de dispersão.
Gráfico 2. Diagrama de dispersão com a reta de regressão.
Fonte: elaborada pela autora.
Matematicamente, se existe uma reta em um sistema de coordenadas cartesianas com os pares (x,y), existe uma função linear de equação do tipo: y = ax + b (forma genérica da função de primeiro grau) que a gerou, nesse caso, chamamos a de coeficiente angular e b de coeficiente linear, isto quer dizer que, a determina a inclinação da reta e b determina o ponto de encontro da reta com o eixo y.
A reta de regressão é gerada por pontos do diagrama de dispersão, e sua equação é chamada de equação de regressão: y = a + bx, onde a e b são chamados parâmetros, assim temos as seguintes expressões para a equação de regressão:
Equação de regressão: y = a + bx
Onde:
· n = número de pares (x,y) observados (tamanho da amostra);
· Σ(x. y) somatório dos produtos x.y;
· Σx soma dos valores de x;
· Σy soma dos valores de y;
· Σx2 soma dos quadrados dos valores de x.
Agora, nos resta fazer a equação de regressão para o nosso exemplo, lembramos que a tabela 3 apresenta os valores necessários para encontrarmos os parâmetros a e b.Assim temos:
Dados: n = 10,
Devemos primeiro encontrar o valor de b, pois é utilizado na fórmula para o a:
· Temos: y = a + bx
· Cálculo de b:
Cálculo de a:
Temos, então: a = 10,565 e b = -0,1889.
Logo, a equação de regressão pelos mínimos quadrados é dada por:
y = a + bx
y= 10,565 – 0,1889x
Podemos agora estimar, por meio da equação de regressão, um valor intermediário para a nossa variável x, que chamamos de variável exploratória, e encontramos uma estimativa para y que é a nossa variável-resposta, isto é, podemos estimar valores para y, explorando valores para a variável x.
No nosso exemplo, a variável exploratória é relativa ao tempo de espera na fila do banco e a variável-resposta é a nota dada pelo cliente pelo atendimento.
Vamos supor, então, que o cliente espera na fila para ser atendido por 16 minutos (x) pois esse é um valor que não apareceu na tabela, qual seria, então, a nota que seria dada, com esse tempo de espera.
Como já temos a equação de regressão, basta substituir o valor de x na equação, e o valor de y será a variável-resposta para a variável exploratória com valor 16 minutos.
Assim temos: para x = 16 minutos
· y = 10,565 – 0,1889x
· y = 10,565 – 0,1889.(16)
· y = 10,565 – 3,0224
· y = 7,54
Logo, para um tempo de espera de 16 minutos (x) na fila do banco, a nota estimada do cliente seria de 7,54 (y).
Porém, pode-se se considerar, na maioria das vezes, que a relação entre as variáveis x e y não é exata (ou determinística), pois y também pode ser afetado por outros fatores além de x, para esses casos, o modelo de regressão simples apresenta o termo de erro ou perturbação definido por u, que reúne todos os demais fatores que podem afetar a variável y e não são incluídos explicitamente na equação de regressão, e a inclusão desse termo de erro define a relação entre x e y como estocástica.
Para Malbouisson e Tiryaki (2019), a análise econômica fornece alguns exemplos de relações bivariadas entre variáveis, tais como: consumo e renda, salários e educação, taxas de inflação e desemprego, desempenho escolar e tamanho da classe. O modelo mais popular para estudar a relação entre duas variáveis é o modelo de regressão linear clássico, no qual os parâmetros de interesse são estimados a partir da minimização da soma dos quadrados dos resíduos. Esses estimadores são conhecidos como estimadores de mínimos quadrados ordinários (MQO).
A identificação de uma relação de causalidade entre duas variáveis de interesse, ou entre um conjunto de variáveis e um determinado fenômeno de interesse, representado por meio de uma variável, pode ser representada em termos de uma equação na qual o fenômeno que queremos analisar (y) é a função de uma variável (x) e um termo de perturbação (u), considerado pela MQO como constante, nossa equação de regressão linear passa a ser:
y = f(x) + u
y= a + bx +u
Onde:
· y = variável dependente (fenômeno que desejamos observar);
· x = variável explicativa (que provoca a variação de y);
· b = coeficiente de relação de causalidade (matematicamente chamado de coeficiente angular) ou, parâmetro de inclinação que quantifica o impacto da variável x sobre a variável y, quando há causalidade de x para y;
· u = termo de erro ou perturbação.
O estimador MQO nos permite conhecer a elasticidade de resposta da variável dependente em relação a variável independente, ao mesmo tempo em que nos permite fazer previsões do valor esperado da variável dependente, dado um valor específico da variável explicativa. A interpretação do coeficiente b, para Wooldridge (2011), é feita considerando a hipótese ceteris paribus: supomos que todos os demais fatores que poderiam afetar o desempenho, que estão contidos no termo de erro (u) permanecem fixos. Isso decorre da hipótese de que os demais fatores não observáveis contido em u, não estão correlacionados com as variáveis explicativas. Ou seja, o valor médio dos fatores não observáveis é o mesmo para todos os valores da variável explicativa, e que a média comum é, necessariamente, igual à média de u ao longo de toda a população, onde temos: E = (u/x) = 0, assim sendo, voltamos à equação inicial, onde temos y = a + bx, pois y = a + bx + 0.
Análise de correlação e regressão
Duas variáveis medidas sobre as mesmas condições são ditas associadas, diz Moore e McCabe (2002), se determinados valores de uma variável tendem a ocorrer com maior frequência, juntamente com os valores da outra variável.
Porém, ainda para Moore e McCabe (2002), quando examinamos a relação entre duas variáveis, torna-se importante saber se o objetivo é apenas explorar a natureza da relação ou se é necessário mostrar que uma das variáveis pode explicar as variações na outra e, nesse caso, algumas variáveis são variáveis-reposta e outra são variáveis explanatórias. Assim sendo, temos umavariável-resposta que mede o resultado de um estudo e uma variável explanatória que explica as variáveis-resposta ou causa modificações nelas.
Como já vimos anteriormente, as variáveis explanatórias costumam ser chamadas de variáveis independentes, enquanto as variáveis-resposta são consideradas variáveis dependentes, portanto, pode-se dizer que as variáveis-resposta dependem das variáveis explanatórias.
Portanto, Gujarati (2006) afirmou que a análise de regressão visa estudar a dependência entre a variável dependente e uma ou mais variáveis (variáveis exploratórias), a fim de estimar ou prever o valor médio da primeira variável (população), expressando-a em valores conhecidos ou fixos (em amostras repetidas).
Segundo Moore e McCabe (2002), a maioria dos estudos estatísticos examina dados sobre mais de uma variável. A análise estatística de dados de diversas variáveis se estrutura nos recursos utilizados para o estudo de variáveis individuais. Os princípios que orientam os trabalhos são, basicamente: iniciar o trabalho com uma apresentação gráfica, e em seguida acrescentar resumos numéricos, procurar padrões gerais e desvios em relação a eles e, finalmente, quando o padrão geral é muito regular, utilizar um modelo matemático compacto para descrevê-lo.
A análise de correlação, diz Gujarati (2006), está estreitamente relacionada à análise de regressão, porém, conceitualmente muito diferente, pois o principal objetivo da análise de correlação é medir a força ou o grau de associação linear entre duas variáveis, por meio do coeficiente de correlação. Na análise de regressão, essa medida não é necessidade prioritária, pois antes se tenta estimar ou prever o valor médio de uma variável com base nos valores fixos de outras variáveis, tentando, assim, prever valores de uma variável sabendo o valor de outra.
Ainda para Gujarati (2006), na análise de regressão, assumindo que a variável dependente é estatística, aleatória ou estocástica, ou seja, tem uma distribuição de probabilidade, há assimetria na maneira como a variável dependente é processada e explorada. Por outro lado, considera-se que a variável exploratória tenha valor fixo (em amostras repetidas). Na análise de correlação não há diferença entre variáveis dependente e exploratória, trata-se quaisquer duas variáveis simetricamente, e, além disso, pressupõe-se que as duas variáveis sejam aleatórias. Portanto, a maior parte da teoria da correlação se embasa na premissa do caráter aleatório das variáveis, enquanto boa parte da teoria da regressão está condicionada à premissa de que a variável dependente é estocástica, mas as variáveis aleatórias são fixas ou não estocásticas.
Na prática, o objetivo da análise de regressão é estimar o valor médio da variável dependente com base no valor conhecido ou fixado das variáveis exploratórias, e o sucesso dessa análise depende da disponibilidade de dados adequados, que, geralmente, podem ser usados para pesquisas, especialmente no campo das ciências sociais.
Para Crespo (1993), é possível dizer, então, que a análise de regressão visa descrever a relação entre duas variáveis a partir de n observações por meio de um modelo matemático.
Elasticidade
Segundo Mendes (2009), a elasticidade é uma medida de resposta usada para comparar a variação percentual da variável dependente (y) devido à variação percentual da variável explicativa (x). Portanto, desde que haja duas variáveis inter-relacionadas, a elasticidade pode ser calculada.
Portanto, a elasticidade mede a variação proporcional em uma variável em resposta a uma variação proporcional em outra variável. O cálculo da elasticidade é dado pela expressão matemática:
Onde:
· E = elasticidade;
· Δy = mudança em y;
· Δx = mudança em x.
Portanto, a elasticidade é a inclinação da função transformada.
Entre as principais variáveis que determinam a quantidade de produtos (Qd) que os consumidores comprarão, destacam-se: análise do preço do produto (P), renda do consumidor (Y), quantidade do consumidor (N) e preço do produto substituto (Ps), preço complementar do produto (Pc), gostos e preferências do consumidor (G) e publicidade (A). Portanto, alterações em uma ou mais variáveis afetarão o nível de consumo do produto. A curva de demanda pode ser expressa como:
Onde, a barra “/” significa que as variáveis que ficam à sua direita se mantêm constantes, ou seja, pelo menos no momento em quem se está fazendo a análise, elas não podem variar. Para medir a variação na quantidade, devido a variação em uma dessas variáveis, utiliza-se o conceito de elasticidade.
A forma da elasticidade é extremamente útil em economia, em especial, porque contorna dois tipos de problemas oriundos das diferentes unidades de medida com que os bens são medidos. Portanto, dependendo da unidade de medida, a inclinação da curva pode ser maior ou menor, razão pela qual não faz sentido comparar o desvio da demanda por produtos (como arroz) com o desvio do equipamento celular e não pode constituir um indicador apropriado. Procure a sensibilidade da quantidade às mudanças nos preços dos produtos. A elasticidade evita esse problema porque, em sua fórmula, compara apenas a alteração percentual entre duas variáveis.
Teste dos multiplicadores de Lagrange – Teste LM
O método dos multiplicadores de Lagrange, diz Jacques (2010), pode ser utilizado para resolver problemas de otimização restringida, pois com ele pode-se manipular, com facilidade, restrições não lineares e problemas que envolvem mais de duas variáveis, proporcionando, ainda, informações adicionais úteis ao resolver problemas econômicos.
Vimos, na prática, que por meio da correlação entre duas variáveis pode ser criada uma função matemática, chamada função de regressão. Portanto, matematicamente, se temos um gráfico, existe uma função geradora, seja ela linear, ou não linear, como a curva de demanda, isto é, todo gráfico matemático é resultado de uma função matemática.
No nosso exemplo, a função de regressão é linear, porém, pode-se perceber que é uma função aproximada, já que existem alguns pontos que estão fora da reta. Isso pode ser um problema, porque essas medidas são importantes na tomada de decisões, portanto, esses problemas devem ser minimizados.
Na curva, esses pontos, que estão fora, são matematicamente chamados de valores máximo e mínimo e, estatisticamente, são chamados de outliers, e o coeficiente de correlação de Pearson é sensível à presença desses valores. Portanto, o pesquisador precisa verificar a presença desses pontos, seja visualmente, por meio da inspeção dos gráficos de dispersão ou por meio da utilização de testes apropriados.
Também vimos que podemos usar estimadores de mínimos quadrados ordinários (MQO) para tentar minimizar os efeitos de variáveis aleatórias.
O teste multiplicador de Lagrange de Breush e Pagan, desenvolvido em 1980 é baseado na afirmação de que as estimativas de mínimos quadrados sob uma determinada hipótese (H0) podem ser obtidas minimizando a função matemática de Lagrange.
O teste LM examina se os componentes da variância específica das unidades individuais ou das unidades temporais são zero, ou seja, a hipótese nula é definida como. Sendo rejeitada a hipótese nula, pode-se concluir que o modelo de efeitos aleatórios lida com a heterogeneidade melhor que o MQO.
Os estimadores de efeitos fixos e de efeitos aleatórios, afirmam Malbouisson e Tiryaki (2019), presumem ausência de correlação contemporânea entre os resíduos, ou seja, presumem que os resíduos de uma unidade de cross-section não são correlacionadas com os resíduos das demais unidades de cross-section.
A correlação dos resíduos pode ser resultado da omissão de efeitos comuns, efeitos espaciais ou como resultados de interações n contexto de redes socioeconômicas. O problema pode ser ainda mais grave se o fator que está gerando a dependência é correlacionado com as variáveis independentes. Existem diversos testes que podem ser utilizados para verificar a presença de dependência em cross-section. O teste multiplicador de Lagrange (ML) é utilizado paraverificar essa possibilidade, embora seja apropriado quando T > N, porque tende a regeitar, exageradamente a hipótese nula uando T < N ou N > T.
Para fazer o cálculo da estatística ML, estima-se MQO com cada unidade de cross-section separadamente, obtêm-se os resíduos de cada equação estimada e calculam-se os coeficientes de correlação entre os resíduos. A seguinte expressão apresenta a Estatística MLBP.
Onde:é o coeficiente de correlação cruzada entre os resíduos associados a cada unidade de cross-section que são obtidos por meio da expressão:
Onde: eij é o resíduo da equação estimada e os subscritos i e j indexam as unidades de cross-section individuais temporais, respectivamente.
A hipótese nula do teste é de ausência de dependência em cross-section e a estatística tem distribuição Qui-Quadrado com grau de liberdade dado por N(N-1)/2.
A vantagem do teste dos multiplicadores de Lagrange é que pode ser utilizado para tratar modelos de regressão linear ou não, pois, apresenta a função de medir a utilidade marginal, sendo a utilidade resultante incrementada com o pequeno aumento da variável.
A curva de demanda, diz Pindyck e Rubinfeld (2010), baseia-se na premissa de que os consumidores maximizam a utilidade sujeita a uma restrição orçamentária. Para cada consumidor, pode ser definida uma função utilidade que associa certo nível de utilidade a cada cesta de mercado que ele possa consumir. A utilidade marginal das mercadorias é definida como a mudança na utilidade total devido a um aumento no consumo de mercadorias em uma unidade.
Suponhamos que uma função de utilidade genericamente chamada U(X,Y) que provém de uma expressão matemática, onde o nível de utilidade é uma função do aumento do consumo, a utilidade marginal diminui com o consumo. Quando existem duas mercadorias X e Y, o problema de otimização do consumidor pode ser expresso como: Maximizar U(X,Y), sujeito a restrições de que toda a renda seja despendida com as duas mercadorias, assim temos:
PxX + PyY=I ou ainda PxX + PyY - I= 0
Pindyck e Rubienfeld (2010) afirmam que, nesse caso, U (X,Y) é a função de utilidade, X e Y são a quantidade das duas mercadorias compradas pelos consumidores, Px e Py são os preços das mercadorias, e I a renda. Para determinar as necessidades individuais dos consumidores dessas duas mercadorias, escolhemos o valor de X e Y para maximizar U (X,Y), que depende de PxX + PyY = I. Quando o formato específico da função de utilidade é conhecido, ele pode ser calculado de forma que determine diretamente as necessidades do consumidor relacionadas a X e Y, mas mesmo se escrevermos a função utilidade na forma geral U (X,Y), essa otimização de restrição técnica pode ser usada para descrever as condições que os consumidores devem ocupar ao maximizar a utilidade.
Nesse caso, para Pindyck e Rubienfeld (2010), o método dos multiplicadores de Lagrange pode ser utilizado para maximizar ou minimizar funções sujeitas a restrições pelas equações dadas acima. Assim temos:
· Escrevemos o lagrangiano para o problema, que nada mais é que a função a ser maximizada ou minimizada, mais uma variável escalar (número) que chamaremos de λ (letra grega lambda). Esse escalar é denominado multiplicador de Lagrange que irá multiplicar a restrição, então o lagrangiano será, partindo-se a equação genérica dada anteriormente:
Nesse caso, a função de utilidade está sendo maximizada e a restrição é a restrição orçamentária do consumidor. Note que escrevemos a restrição orçamentária como PxX + PyY – I =0, isto é, como uma soma de termos iguais a zero, essa soma é inserida, então no lagrangiano.
· Por meio do cálculo diferencial, utilizando a diferenciação do lagrangiano, se atribuirmos valores para X e Y que satisfazem a equação de restrição orçamentária, o segundo termo da equação será igual a zero, e a maximização será equivalente à maximização de U(X,Y). Diferenciando π em relação a X, Y e λ e, em seguida, igualando as derivadas a zero, se alcança as condições necessárias para a obtenção de um máximo.
· Resolvendo as equações resultantes dessas derivações chega-se a três equações que podem ser escritas da seguinte forma:
UMX = λPX
UMY = λPY
PXX + PYY = I
Onde, UM é a abreviação da utilidade marginal, ou seja, a variação da utilidade ocasionada por um pequeno aumento no consumo da mercadoria X, que também pode ser escrita na forma de derivação como:
Podemos, então, resolver essas três equações para as três variáveis. Os valores resultantes para X e Y são as soluções para o problema de otimização do consumidor, isto é, são as quantidades que maximizam sua utilidade.
Exemplo teste dos multiplicadores de lagrange
Enunciado:Um produtor monopolista de dois bens, B1 e B2, tem uma função custo total comum definida por CT = 10Q1 + Q1Q2 + 10Q2, onde Q1 e Q2 indicam as quantidades de B1 e B2, respectivamente. As equações de demanda são dadas por P1 = 50 – Q1 + Q2 e P2 = 30 + 2Q1 – Q2, quando P1 e P2 exibem os preços correspondentes. Se a empresa for contratada para produzir um total de 15 bens, qual será o lucro máximo? Se a cota de produção aumentar em 1 unidade, qual será o novo lucro ótimo?(modificado de JACQUES, 2010)
Obs.:Para resolução desse exercício, é interessante que você relembre algumas derivadas básicas.
Solução:
Dados:
· Função de custo total: 
· Equações de demanda: 
· Lucro máximo: para um total de 15 bens (B1 e B2)?
· Novo Lucro para produção aumentada em 1 unidade?
Passo 1: Escrever expressões para a função objetivo e para a restrição (RT). A função objetivo é o lucro e é dada por: π = RT - CT
E a função genérica dada no enunciado é:
Para obter uma expressão para RT, precisamos utilizar as equações da demanda, assim temos:
Temos ainda que: RT = RT1 + RT2
Substituindo RT1 E RT2 em RT, temos:
Como π = RT - CT
Então temos a função lagrangiano de lucro máximo:
· 
· 
· 
Cálculo da restrição: Sabe-se que a empresa produz 15 bens no total, então temos:
Passo 2: Determinação da função lagrangiana:
Determinação do o sistema de derivação:
O sistema de equações pode ser resolvido pelo método que desejar, como as duas primeiras equações possuem valores simétricos, o método da adição parece a opção mais fácil. Portanto, vamos somar as equações (1) e (2):
Substituindo λ nas equações (1), temos as equações (4) que poderá formar um novo sistema com a equação (3) e resolvendo esse novo sistema determinaremos os valores de Q1 e Q2:
Substituindo Q1 em (4), temos:
Substituindo-se Q2 em (3), temos:
Substituindo-se Q1 =10 e Q2 =5 na equação de π, determinamos o lucro máximo, assim temos:
R1: Portanto, temos resposta à primeira pergunta do problema: O lucro máximo, se a empresa for contratada para produzir um total de 15 bens, é de R$ 475,00.
Agora, vamos calcular o novo lucro ótimo se a cota de produção aumentar em 1 unidade.
Para tanto, temos duas opções, repetimos todos os cálculos anteriores e aumentamos 1 à cota dos 15 bens, passando para 16, ou baseados no valor do multiplicador de Lagrange λ, substituindo, em sua equação, a cota de produção 15 por uma nova variável, D, por exemplo.
Ou seja, a interpretação do valor de λ aplica-se quase que genericamente, pois dada uma função objetivo f (x,y) e a restrição U (x,y) – D, o valor de λ dá a variação aproximada do valor ótimo de f devido a ١ unidade de aumento em D.
Assim, a nossa função lagrangiana ficará:
Agora, temos uma função de 4 variáveis. Se derivarmos a função, parcialmente em relação a D, a função passa a ser:
Note que essa função é igual à função de lucro máximo. O valor multiplicador de Lagrange encontrado representa a variação do lucro devido a 1 unidade de aumento na cota de produção, como λ = 30, então, teremos um aumento de 30 ao resultado da função de lucro máximo, que foi de 475.
Assim temos: 475 + 30 = 505, e com isso, repondemos a segunda questão do problema.
R2: O novo lucro ótimo se a cota de produção aumentar em 1 unidade será de R$ 505,00.
Custos de Produção da Empresa Cayro
Custos(Y)	
100	110	120	130	140	150	1000	1150	1200	1300	1390	1400	Quantidade
Custo

Outros materiais