Text Material Preview
ATIVIDADE 2 – ECONOMETRIA IBMR Suponha a existência de um conjunto de dados ( X, Y) obtidos por meio de uma coleta amostral baseada em um experimento aleatório simples. Tal conjunto é construído a partir do quadro a seguir. Fonte: Elaborado pelo autor, 2021. Considerando essas informações, analise as afirmativas a seguir. I. O coeficiente angular é igual a -0,163. II. O coeficiente linear é igual a 182,19. III. A razão entre o coeficiente angular e o coeficiente linear é igual a -0,0054. IV. O produto entre os coeficientes da regressão é igual a -58,16. Está correto apenas o que se afirma em: II, III e IV. II e IV. I e III. I, II e III. I e IV. Resposta correta: a primeira afirmativa está incorreta, pois o coeficiente angular deve ser calculado a partir da média de X, que é igual a 134, e da média de Y, que é igual a 139. Portanto, na equação do coeficiente angular, temos: . A segunda afirmativa está correta, pois a partir do cálculo do coeficiente angular, cria-se o coeficiente linear: . A terceira afirmativa está incorreta, pois a razão entre o coeficiente b e o coeficiente a é igual a: . A quarta afirmativa, por fim, está correta, pois o produto entre os coeficientes é igual a: Um nutricionista deseja avaliar as possíveis relações entre quadros de hiperglicemia e hipernatremia, de modo a verificar se um aumento na taxa de glicose no sangue ( X) é capaz de gerar um aumento nos níveis de sódio ( Y) no organismo. Para isso, será necessário criar um modelo econométrico que apresente os padrões de associação entre essas variáveis, demonstrando relações entre uma variável independente e uma variável dependente, da seguinte forma: Fonte: Elaborado pelo autor, 2021. Assim, com a criação do modelo econométrico, o nutricionista poderá inferir a possibilidade de obter uma taxa de glicose e, a partir da referida taxa, estimar o nível de sódio no organismo da pessoa. Assim sendo, se um paciente der entrada em uma emergência com um nível de glicose de 706, espera-se que o volume de sódio seja igual a 151,2. 150,7. 152,9. 154,1. 150,1. Resposta correta: para uma média de X igual a 343,8 e uma média de Y igual a 145,7, cria-se o seguinte coeficiente angular: . Assim, o coeficiente linear será igual a: , de modo que o modelo econométrico será dado por: . Logo, se o paciente apresentar um nível de glicose de 706, o volume de sódio estimado será igual a: . Considere a existência de um conjunto de dados ( X, Y) construído a partir do quadro a seguir. Fonte: Elaborado pelo autor, 2021. Calcule o coeficiente linear e o coeficiente angular. 10,76 e -0,14. -9,77 e 0,13. 10,12 e - 0,08. 9,77 e -0,13. -10,12 e 0,08. Resposta correta: nesta questão, deve-se obter, primeiramente, o coeficiente angular (b) de acordo com a fórmula: . Assim, elaborando os dados a partir do próprio quadro apresentado, pode-se calcular os desvios médios de X e de Y, e, consequentemente, os elementos de cálculo para o coeficiente. A média de X é igual a 14 e a média de Y é igual a 9, de modo que: . Logo, o coeficiente angular é igual a: Considere a existência de um conjunto de dados relacionados a duas variáveis (X,Y), expressos por {(0,2), (1,4), (2,6), (6,3), (6,5)}. Esses dados fazem parte de uma amostra colhida aleatoriamente a partir de uma determinada população, a fim de que se possa investigar a associação específica entre essas variáveis. Com base nessas informações, o valor da covariância entre tais variáveis será igual a: 0,625. 5,32. 2,45. 11,40. 1,60. Resposta correta: observe que a covariância é expressa da seguinte forma: . Sabendo que a média de X é igual a , e que a média de Y é igual a , tem-se o seguinte para : . Suponha que um estatístico precisa criar um modelo econométrico que deva relacionar o gasto calórico ( Y), em quilocalorias (kcal), de um grupo de indivíduos que pratica atividades de caminhada, percorrendo diariamente uma distância ( X) em quilômetros (km). Esse rendimento é apresentado da seguinte forma: Fonte: Elaborado pelo autor, 2021. O estatístico quer usar esse modelo econométrico para avaliar, junto a outros praticantes de caminhada, o gasto calórico esperado para cada caminhante. Não há gasto calórico negativo para essa situação, logo, se for necessário, o valor gasto será aproximado para zero. Diante dessas informações, analise as afirmativas a seguir. I. A cada variação de quilômetro caminhado, espera-se que o caminhante gaste 32,47 kcal. II. Se o caminhante registrar um rendimento de 24 km, seu gasto calórico estimado será igual a 1.090,5 kcal. III. Se o rendimento do caminhante for igual a 42 km, espera-se que ele gaste 1.607,62 kcal. IV. Se um caminhante andar 1,5 km, o gasto calórico previsto será igual a 9,49 kcal. Está correto apenas o que se afirma em: I, II e III. III e IV. II e IV. I, III e IV. I e II. Resposta correta: a primeira afirmativa está incorreta. Para entendê-la, é preciso criar o modelo econométrico. Assim, para um valor médio de X igual a 25,37 e um valor de Y igual a 951,4, o coeficiente angular é igual a: . Da mesma forma, o coeficiente linear é igual a: . Assim, o modelo econométrico é igual a: . Logo, a cada quilômetro percorrido, o caminhante deverá gastar 39,46 kcal. A segunda afirmativa está incorreta, pois se o rendimento é de 24 km, pelo modelo, o gasto calórico será igual a: . A terceira afirmativa está correta, pois para um rendimento de 42 km, tem-se um gasto de: . A quarta afirmativa está correta, haja vista que, pelo modelo econométrico, o gasto calórico será igual a: O desenvolvimento dos modelos de regressão linear se baseia em procedimentos estatísticos que demonstram a possibilidade de associação específica entre variáveis independentes e uma variável dependente. Nesse caso, a regressão linear simples está embasada em um modelo bidimensional, considerando duas variáveis. Esse modelo aprofunda mecanismos comuns à análise de estatística descritiva, como o coeficiente de correlação de Pearson, que também analisa as associações entre variáveis. Diante disso, sobre esses modelos, é correto afirmar que: a estatística qui-quadrado é necessária para calcular testes de hipótese de significância relativos à análise dos coeficientes de correlação. o modelo de regressão linear simples demonstra que a variação da variável dependente influencia a variabilidade da variável independente. em um modelo econométrico, os resíduos produzidos geram erros amostrais cuja média é um valor real e diferente de zero. um coeficiente de correlação igual a -0,65 demonstra uma correlação mais forte do que um conjunto que apresente um coeficiente igual a +0,15. a covariância é calculada a partir da somatória do produto dos desvios-padrão, o qual é dividido pelo número de graus de liberdade. Resposta correta: o coeficiente de correlação de Pearson destaca a existência de uma associação entre variáveis que pressupõe uma correlação mais forte quanto mais se aproxima de 1 o valor absoluto do coeficiente. Desse modo, se um coeficiente tem um valor igual a - 0,83, seu valor absoluto é maior do que um coeficiente igual a 0,45, ou seja, a correlação do primeiro indicador é mais forte, ainda que negativa e inversamente proporcional. O indicador de correlação é criado a partir da covariância, que é elaborada pela razão entre a somatória do produto dos desvios médios e o número n de pares ordenados que compõe a amostra. Tal indicador, isto é, o coeficiente de Pearson, é usado para a criação de testes de hipótese que usam a estatística t de Student para a avaliação da significância da correlação. No entanto, o coeficiente apresenta limitações que reduzem a sensibilidade do indicador em captar tendências, ou seja, é impossível saber, com esse indicador, quais serão os valores esperados para a variação dos elementos da variáveldependente. Assim, cria-se um modelo econométrico de regressão linear, o qual se baseia em algumas hipóteses, entre elas, o fato de a média dos erros amostrais ser igual a zero e de a variação da variável independente não ser explicada pela variação da variável dependente. Considere a existência de um conjunto de dados relativos a duas variáveis, expressos por ( X, Y). Esse conjunto, denominado conjunto E, está estruturado da seguinte forma: E = {(0,-2), (-1,3), (2,-4), (-3,2), (1,6), (4,7)}. O conjunto foi extraído de uma população por meio de uma amostragem aleatória simples, e deseja-se verificar, por meio de um teste de hipótese, a possibilidade de ocorrer uma relação direta entre a variação de Y como resultado da variação de X, ao nível de significância de 5%. A partir dessas informações, é correto afirmar que a estatística t relativa ao teste será igual a: 0,427, devendo-se rejeitar a hipótese nula. 0,817, devendo-se rejeitar a hipótese alternativa. 4,182, devendo-se aceitar a hipótese nula. 2,879, devendo-se aceitar a hipótese alternativa. 1,643, devendo-se aceitar a hipótese nula. Resposta correta: para responder a esta pergunta, é preciso, primeiramente, extrair o coeficiente de correlação. Assim, sabendo que a média de X é igual a 0,5, com um desvio-padrão de 2,22, e que a média de Y é igual a 2, com um desvio- padrão de 3,96, a covariância será igual a 1,83, de modo que o coeficiente de correlação será: . Ao testar a significância do coeficiente, observa-se que: . Sabe-se que o valor crítico da estatística t de Student relativa a graus de liberdade, com um nível de significância de 5%, é igual a 2,78. Como a estatística t relativa ao teste não pertence à região crítica, deve-se rejeitar a hipótese nula de que as duas variáveis estão correlacionadas Considere a seguinte situação-problema: um aluno tem dois conjuntos de dados. O conjunto A tem as variáveis (X,Y) relacionadas à distribuição {(0,6), (3,4), (4,7), (5,7)}. O conjunto B, por sua vez, apresenta uma distribuição (X, Y) dada por {(5,8), (4,9), (7,11), (4,12)}. Com isso, ele deseja investigar as relações de associação entre variáveis por meio da criação de coeficientes de covariância. Com base nessas informações, analise as afirmativas a seguir. I. O valor da covariância de A é igual a 0,75. II. A razão entre as covariâncias de B e A é igual a 0,33. III. A covariância do conjunto B é igual a 0,33. IV. O produto entre as covariâncias desses conjuntos é igual a 3,0. Está correto apenas o que se afirma em: III e IV. I e II. I e IV. II, III e IV. I, II e III. Resposta: observe que a covariância é calculada por meio da razão entre a somatória dos produtos dos desvios médios e o número de pares ordenados da amostra. Assim, a covariância do conjunto A é igual a 0,75, demonstrando que a primeira afirmativa está correta. A segunda afirmativa também está correta, pois a covariância do conjunto B é igual a 0,25 e, consequentemente, a razão entre as covariâncias de B e de A é igual a 0,33. O fato de Cov(B) ser igual a 0,25 demonstra que a terceira afirmativa está incorreta. Por fim, a quarta afirmativa está incorreta, pois o produto entre as covariâncias é igual a 0,1875. No filme O resgate do soldado Ryan, de Steven Spielberg (1998), um dos personagens avisa aos soldados, antes do desembarque na praia Omaha, no dia D (06/06/1944), que eles devem manter distância entre si para evitar a morte por tiros de metralhadora. Um atirador pode ser atraído por um grupo de soldados, de modo que o personagem adverte: “cinco homens é uma chance de ouro; um homem é perder munição”. O RESGATE do soldado Ryan. Direção de: Steven Spielberg. Universal City: Amblin Entertainment, 1998. 1 DVD (169 min), son., color. Diante disso, considere que um pelotão de metralhadores avaliou o desempenho de cada membro da unidade em atingir seus alvos. Assim, foram apresentados o número de tiros ( X) necessário para atingir, com força letal, um número ( Y) de soldados, de acordo com o quadro a seguir. Fonte: Elaborado pelo autor, 2021. Diante desse contexto, se houver um ataque no qual 250 soldados inimigos devam ser neutralizados com munição letal, com uma reserva adicional de 10%, o número mínimo de balas a solicitar será igual a: 3.723. 4.412. 2.319. 2.458. 2.976. Resposta correta: o quadro apresenta a demanda da criação do modelo de regressão simples baseado em uma média de X igual a 164,25 e em uma média de Y igual a 11,15. A partir dessas informações, calcula-se o coeficiente angular: . Na sequência, encontra-se o coeficiente linear: . Portanto, o modelo é expresso por: . Assim sendo, para um número estimado , deve- se calcular X, de modo que: . Uma reserva de 10% adicional seria igual a . Logo, a soma total é igual a: , que é aproximadamente igual a 2.976 balas. Os elementos teóricos do modelo econométrico de regressão linear simples devem ser compreendidos a fim de estruturar uma síntese sobre a estimação e a inferência de dados sobre a tendência de variação dessas variáveis. A análise bidimensional presta-se, portanto, a compreender de que modo a relação entre uma variável independente afeta uma variável dependente, criando linhas de tendência e retas de regressão a partir de valores estimados e eventuais discrepâncias de valores reais. Desse modo, considerando as hipóteses relativas ao modelo de regressão linear, analise as afirmativas a seguir. I. A variância concernente a cada elemento relacionado à variável independente é constante e igual a . II. Há uma relação de dependência entre os resíduos, determinando correlação positiva na sua distribuição. III. Os resíduos, ou erros amostrais, diferem de uma distribuição normal, pois são independentes e com soma igual a zero. IV. O modelo de regressão é criado por meio de uma equação que gera uma tendência linear para uma série de dados esperados. Está correto apenas o que se afirma em: I, II e IV. III e IV. I e IV. II e III. I, II e III. Resposta correta: a primeira afirmativa está correta, pois o modelo de regressão linear é formado a partir de uma estimação linear de valores esperados por meio da tendência de variação dos dados da variável dependente. Desse modo, cada valor estimado está relacionado a um valor real, e a variância desses dados é constante e igual a . A segunda afirmativa está incorreta, pois os resíduos são independentes entre si, inexistindo correlação entre eles. A terceira afirmativa está incorreta, pois os resíduos apresentam uma distribuição que tende a ser normal, com ocorrência mais significativa em torno de um valor médio relativo aos resíduos de cada modelo. A quarta afirmativa está correta, visto que a regressão linear simples é viabilizada por meio de uma equação que permite criar uma reta de regressão, demonstrando uma série de valores esperados a partir da tendência de variação dos valores reais.