Baixe o app para aproveitar ainda mais
Prévia do material em texto
Instalação do R Uso básico do R Econometria com o auxílio do R Econometria I Mínimos �adrados Ordinários Frederico Uchôa FCE/UFBA 22 de fevereiro de 2021 ECOA93 Frederico Uchôa 1 / 62 Instalação do R Uso básico do R Econometria com o auxílio do R Instalação do R • O R pode ser baixado nos endereços: • Para quem Linux: • https://cloud.r-project.org/bin/linux/ • Para quem (Mac) OS X: • https://cloud.r-project.org/bin/macosx/ • Para quem Windows: • https://cloud.r-project.org/bin/windows/ ECOA93 Frederico Uchôa 2 / 62 https://cloud.r-project.org/bin/linux/ https://cloud.r-project.org/bin/macosx/ https://cloud.r-project.org/bin/windows/ Instalação do R Uso básico do R Econometria com o auxílio do R Instalação do R • Depois de instalado o R já pode ser excutado. • O terminal deve ter uma aparência similar a da figura abaixo Figura 1: Terminal de comandos do R ECOA93 Frederico Uchôa 3 / 62 Instalação do R Uso básico do R Econometria com o auxílio do R Uso básico do R • R tem uma interface de linha de comando e executa comandos simples. • As linhas de comando são marcadas com o símbolo >, chamado de prompt. • Se você digitar um comando e pressionar enter o programa irá avaliá-lo e imprimir o resultado. • Por exemplo, as operações de adição, subtração, multiplicação, divisão e exponenciação são efetuadas do seguinte modo: ECOA93 Frederico Uchôa 4 / 62 Instalação do R Uso básico do R Econometria com o auxílio do R Uso básico do R 2 + 2 ## [1] 4 2 - 2 ## [1] 0 2 * 2 ## [1] 4 2 / 2 ## [1] 1 2 ^ 2 ## [1] 4 ECOA93 Frederico Uchôa 5 / 62 Instalação do R Uso básico do R Econometria com o auxílio do R Uso básico do R • Comparações são feitas com os operadores == <> <=> =. • Como resultado obtêm-se um valor lógico TRUE ou FALSE. • Observe que a comparação de igualdade é feita com o duplo igual ==. • Por exemplo, se perguntamos se 2× 2 é igual a 4 a resposta é positiva, mas se perguntamos se 2× 2 é maior que 4 a resposta é negativa 2 * 2 == 4 ## [1] TRUE 2 * 2 > 4 ## [1] FALSE ECOA93 Frederico Uchôa 6 / 62 Instalação do R Uso básico do R Econometria com o auxílio do R Uso básico do R • Podemos adicionar comentários ao nosso código usando o caractere #. • É útil documentar nosso código dessa maneira para que outras pessoas (e nós na próxima vez que o lermos) tenhamos mais facilidade para acompanhar o que o código está fazendo. • Podemos criar uma nova variável atribuindo um valor a ela usando <- ou =. • Observe que o sinal de igual é usado para atribuição de valor a varável. • Os nomes das variáveis não podem conter espaços, mas podem conter pontos. ECOA93 Frederico Uchôa 7 / 62 Instalação do R Uso básico do R Econometria com o auxílio do R Uso básico do R • Por exemplo, para configurar um vetor denominado x com, digamos, em cinco números, 1, 2, 3, 4 e 5. • Vetores podem ser criados com c() que significa “combinar”. Por exemplo c(1,2,3,4,5). • Usamos o comando: x <- c(1, 2, 3, 4, 5) # ou equivalentemente x = c(1, 2, 3, 4, 5) ECOA93 Frederico Uchôa 8 / 62 Instalação do R Uso básico do R Econometria com o auxílio do R Uso básico do R • Depois de criada a variável podemos imprimir o seu valor digitando o nome dessa variável e pressionando enter. • Via de regra, o R imprimirá no console qualquer objeto retornado por uma função ou operação, a menos que o atribuamos a uma variável. • Vejamos o que guardamos em x x ## [1] 1 2 3 4 5 ECOA93 Frederico Uchôa 9 / 62 Instalação do R Uso básico do R Econometria com o auxílio do R Uso básico do R • Podemos fazer operações aritméticas com variáveis (obviamente se forem numéricas). • Por exemplo, podemo multiplicar a variável x, que é um vetor, por um escalar, digamos 10. • Ou podemos somar x com x x * 10 ## [1] 10 20 30 40 50 x + x ## [1] 2 4 6 8 10 ECOA93 Frederico Uchôa 10 / 62 Instalação do R Uso básico do R Econometria com o auxílio do R Uso básico do R • O valor armazenado no vetor pode ser alterado, podemos remover itens ou adicionar novos valores. • Cada item no vetor tem uma posição, o 1 está na posição 1, o 2 está na posição 2 e assim em diante. • Por exemplo, para remover o 1 (que está na primeira posição) fazemos x[-1]. • E para imprimir apenas o 4 (que está na quarta posição) fazemos x[4]. • Para acrescentar o número 6 no final do vetor fazemos c(x,6). x[-1] ## [1] 2 3 4 5 x[4] ## [1] 4 c(x,6) ## [1] 1 2 3 4 5 6 ECOA93 Frederico Uchôa 11 / 62 Instalação do R Uso básico do R Econometria com o auxílio do R Uso básico do R • Sequências de números podem ser criadas usando : • Por exemplo, o mesmo vetor x poderia ter sido criado usando x <- 1:5 # e se imprimirmos x temos x ## [1] 1 2 3 4 5 # Ou ainda x <- 5:1 x ## [1] 5 4 3 2 1 ECOA93 Frederico Uchôa 12 / 62 Instalação do R Uso básico do R Econometria com o auxílio do R Uso básico do R • No entanto, se quisermos produzir sequências mais interessantes devemos usar a função seq que permite construir sequências mais gerais. • Para criar uma sequência de um a dez em intervalos de 2 podemos fazer o seguinte seq(from = 1, to = 10, by = 2) ## [1] 1 3 5 7 9 ECOA93 Frederico Uchôa 13 / 62 Instalação do R Uso básico do R Econometria com o auxílio do R Uso básico do R • A função rep(x, times = y) repete y vezes os valores de x. • E ainda a função sample(x, size = 1, replace = FALSE) que seleciona uma amostra, com reposição (replace = TRUE) ou não (replace = FALSE), de x com tamanho size, por exemplo, # Repete o número 2 cinco vezes rep(2, times = 5) ## [1] 2 2 2 2 2 # sample(c(1,2,3,4,5), size = 5, replace = FALSE) ## [1] 3 2 1 5 4 # sample(c(1,2,3,4,5), size = 5, replace = TRUE) ## [1] 5 4 4 3 5 ECOA93 Frederico Uchôa 14 / 62 Instalação do R Uso básico do R Econometria com o auxílio do R Uso básico do R • Também é possível gerar sequências de números aleatórios. • A função runif gera uma sequência entre 0 e 1 com distribuição uniforme. • A função rnorm gera uma sequência de números pseudo aleatórios normalmente distribuídos com média (mean) 0 e desvio padrão (sd) 1. # Uniforme runif(10, min = 0, max = 1) ## [1] 0.19621373 0.45701753 0.64219090 0.56452238 0.85163619 0.37621380 0.57813094 0.80370893 0.04381961 0.71351330 # Normal padrão rnorm(10, mean = 0, sd = 1) ## [1] 0.22916172 0.03273154 -0.04489887 0.90542727 1.27333462 -0.85907097 -1.26924610 -0.21843360 -0.72591128 0.24007768 ECOA93 Frederico Uchôa 15 / 62 Instalação do R Uso básico do R Econometria com o auxílio do R Econometria com o auxílio do R • Para nos familiarizarmos um pouco mais com essas matrizes vamos obtê-las no R usando o comando de multiplicação de matrizes %*%. • Para obter matrizes de dados hipotéticos vamos criá-los com os comandos que vimos anteriormente. • Digamos que nossa amostra é tamanho n, logo podemos fazer, por exemplo, n = 10 X = runif(n) y = rnorm(n) X ## [1] 0.10107314 0.66375817 0.29039832 0.07139128 0.94640802 0.20194307 0.57648852 0.72472646 0.06379118 0.49940967 y ## [1] -0.14592534 -1.09774363 -0.12338360 -2.11843986 1.08515728 1.08122613 0.08402514 0.89850203 0.73430884 0.71644668 ECOA93 Frederico Uchôa 16 / 62 Instalação do R Uso básico do R Econometria com o auxílio do R Econometria com o auxílio do R • Vamos supor que nosso modelo tem constante tal que β = (β0, β1). • A primeira coisa que precisamos fazer é criar um vetor de 1‘s que servirá para estimarmos a constante. • Usando o comando rep criamos esse vetor de tamanho n = 10 da seguinte maneira constant = rep(1, times = n) constant ## [1] 1 1 1 1 1 1 1 1 1 1 ECOA93 Frederico Uchôa 17 / 62 Instalação do R Uso básico do R Econometria com o auxílio do R Econometria com o auxílio do R • Em seguida, vamos juntar o vetor da constante com os dados criados para a variável X . • Isso é feito com o auxílio do comando cbind que serve para fazer a junção, lado a lado (por colunas), de duas matrizes (o comando rbind faz a junção por linhas). X = cbind(constant, X) X ## constant X ## [1,] 1 0.10107314 ## [2,] 1 0.66375817## [3,] 1 0.29039832 ## [4,] 1 0.07139128 ## [5,] 1 0.94640802 ## [6,] 1 0.20194307 ## [7,] 1 0.57648852 ## [8,] 1 0.72472646 ## [9,] 1 0.06379118 ## [10,] 1 0.49940967 ECOA93 Frederico Uchôa 18 / 62 Instalação do R Uso básico do R Econometria com o auxílio do R Econometria com o auxílio do R • Observe que agora o R nos apresenta X na forma de uma matriz enquanto antes tínhamos um vetor. • De posse das matrizes que precisávamos podemos agora aplicar o estimador de Mínimos �adrados Ordinários (MQO) para obter β̂. • O método de MQO ajustará a reta que apresentar as menores distâncias quadráticas entre os valores observados e a reta. • Em outras palavras, o estimador de MQO minimiza o valor da função do erro quadrático. ECOA93 Frederico Uchôa 19 / 62 Instalação do R Uso básico do R Econometria com o auxílio do R Uso básico do R • Vejamos: betahat = solve(t(X)%*%X)%*%t(X)%*%y betahat ## [,1] ## constant -0.3421327 ## X 1.0956937 ECOA93 Frederico Uchôa 20 / 62 Instalação do R Uso básico do R Econometria com o auxílio do R Econometria com o auxílio do R • Dois novos comandos foram usados. • O primeiro (solve(‘args’)) estamos usando para inverter a matriz, mas, na verdade, é usado para resolver equações do tipo a %*% x = b para x em que b pode ser tanto um vetor quanto uma matriz. • O segundo (t(‘args’)) devolve a transposta da matriz de interesse. • Vamos agora fazer uso da matriz de aniquilação para obter o vetor de resíduos, mas antes precisamos criar a matriz identidade I. ECOA93 Frederico Uchôa 21 / 62 Instalação do R Uso básico do R Econometria com o auxílio do R Econometria com o auxílio do R • O comando diag(n) nos devolve uma matriz identidade de ordem n. • Temos então: I = diag(n) P = X%*%solve(t(X)%*%X)%*%t(X) M = I - P uhat = M%*%y uhat ## [,1] ## [1,] 0.08546221 ## [2,] -1.48288653 ## [3,] -0.09943846 ## [4,] -1.85453010 ## [5,] 0.39031674 ## [6,] 1.20209113 ## [7,] -0.20549695 ## [8,] 0.44655657 ## [9,] 1.00654599 ## [10,] 0.51137940 ECOA93 Frederico Uchôa 22 / 62 Instalação do R Uso básico do R Econometria com o auxílio do R Econometria com o auxílio do R • Agora que já temos o vetor de resíduos podemos pensar em testar hipóteses. • Até aqui partimos de um modelo no qual β é desconhecido e, portanto, não temos como saber se podemos ou não confiar em nossa estimativa de β. • Vamos gerar um modelo no qual β é conhecido a priori (assim teremos como determinar a qualidade das nossas estimativas). • Faremos isso assumindo que β0 = 1.0 e β1 = 1.0. ECOA93 Frederico Uchôa 23 / 62 Instalação do R Uso básico do R Econometria com o auxílio do R Econometria com o auxílio do R n = 50 beta = cbind(1.0, 0.0) X = cbind(1, runif(n)) y = X%*%t(beta) + rnorm(n) betahat = solve(t(X)%*%X)%*%t(X)%*%y betahat ## [,1] ## [1,] 1.1570424 ## [2,] -0.3086594 ECOA93 Frederico Uchôa 24 / 62 Instalação do R Uso básico do R Econometria com o auxílio do R Econometria com o auxílio do R • O primeiro dos valores reportados é a estimativa da constante e o segundo a estimativa do coeficiente de inclinação da reta ajustada. • Sabemos que o estimador de MQO é, sob as suposições usuais, não enviesado e consistente. • Além disso, é importante que o estimador tenha consistência, isto é, a distribuição do estimador se torna mais concentrada ao redor do parâmetro populacional a medida que o tamanho da amostra aumenta. • Se isso é verdade, quando o tamanho da amostra n tende para infinito, a distribuição do estimador é centrada no parâmetro populacional. ECOA93 Frederico Uchôa 25 / 62 Instalação do R Uso básico do R Econometria com o auxílio do R Econometria com o auxílio do R • Podemos realizar um experimento controlado para enteder o que significam essas propriedades do estimador de MQO. • Para fazer esse experimento precisamos usar mais algumas das funcionalidades do R, especificamente aquelas que nos permitem repetir determinado procedimento um grande número de vezes. • Não veremos com detalhes esse tema no curso, mas vamos usar algumas noções básicas que nos serão bastantes úteis. • O comando for é usado para realizar uma operação repetidas vezes. ECOA93 Frederico Uchôa 26 / 62 Instalação do R Uso básico do R Econometria com o auxílio do R Econometria com o auxílio do R • Funciona, basicamente, da seguinte maneira: for(i in 1:n)‘...’, isto é, para cada valor i o R vai calcular os comandos que estão entre as chaves no que é conhecido como ‘looping’. • O termo i in 1:n significa que i será repetido de i = 1 até 1 = n. • Assim, dado que 1:n, na primeira rodada i será igual a 1, na segunda i = 2, e assim por diante até i = n. • O comando matrix(‘args’) será usado para criar uma matriz que servirá para guardar os valores estimados de β. ECOA93 Frederico Uchôa 27 / 62 Instalação do R Uso básico do R Econometria com o auxílio do R Econometria com o auxílio do R betahats = matrix(0, 1000, 2) for(i in 1:1000){ y <- X%*%t(beta) + rnorm(n) betahats[i,] <- solve(t(X)%*%X)%*%t(X)%*%y } mean(betahats[,1]) ## [1] 0.9953599 mean(betahats[,2]) ## [1] -0.004847005 ECOA93 Frederico Uchôa 28 / 62 Instalação do R Uso básico do R Econometria com o auxílio do R Econometria com o auxílio do R • O comando mean(‘args’), última linha do código acima, nos informa que a média dessas estimativas é bastante próxima dos verdadeiros valores ou, em termos estatísticos, que o estimador de MQO é não enviesado. • Na verdade, o que estamos vendo aqui é que se repetirmos esse processo infinitas vezes a média das estimativas convergirá para 1, que é o verdadeiro valor de β (tente com 100000) e isso não depende do tamanho da amostra. ECOA93 Frederico Uchôa 29 / 62 Instalação do R Uso básico do R Econometria com o auxílio do R Econometria com o auxílio do R • De, fato sob se mantidos os pressupostos básicos, os estimadores obtidos pelo método de MQO serão os Melhores Estimadores Lineares Não Viesados (MELNV, ou BLUE – Best Linear Unbiased Estimator). • E como será a distribuição de β̂’s? • Para ter uma ideia a maneira mais fácil é obter um histograma dessas estimativas. • Isso é feito com comando hist(betahats[,2]) que usaremos para exibir a distribuição das estimativas de β1. ECOA93 Frederico Uchôa 30 / 62 Instalação do R Uso básico do R Econometria com o auxílio do R Econometria com o auxílio do R betahats[, 2] D en si ty −1.5 −1.0 −0.5 0.0 0.5 1.0 1.5 0. 0 0. 2 0. 4 0. 6 0. 8 Figura 2: Histograma das estimativas de β̂2. ECOA93 Frederico Uchôa 31 / 62 Instalação do R Uso básico do R Econometria com o auxílio do R Econometria com o auxílio do R • A ideia de consistência é, geralmente, um pouco difícil de entender por que na prática o tamanho da amostra é fixo. • Consistência é uma consideração que devemos fazer imaginando que o tamanho da amostra torna-se infinitamente grande, isto é, se para amostras cada vez maiores o estimador converge em probabilidade para o parâmetro populacional (caso contrário devemos concluir que esse estimador não é consistente). • Mas com a ajuda do R podemos ver o que esse conceito nos diz. ECOA93 Frederico Uchôa 32 / 62 Instalação do R Uso básico do R Econometria com o auxílio do R Econometria com o auxílio do R • Observe que na Figura 3 usamos diferentes tamanhos amostrais e a densidade está cada vez mais próxima de zero (verdadeiro valor de β2), o que significa que o estimador é, de fato consistente. • Faça, como exercício, para uma amosta de tamanho 1000. • Para obter a densidade use algo do tipo plot(density(betahats[,2]) e veja o que acontece. ECOA93 Frederico Uchôa 33 / 62 Instalação do R Uso básico do R Econometria com o auxílio do R Econometria com o auxílio do R 0 1 2 −4 −2 0 2 4 Estimativas D en si da de s colour n = 10 n = 100 n = 50 n = 500 Figura 3: Densidades das estimativas de MQO de β2 para diferentes tamanhos amostrais (n = 10, n = 50, n = 100 e n = 500) ECOA93 Frederico Uchôa 34 / 62 Instalação do R Uso básico do R Econometria com o auxíliodo R Econometria com o auxílio do R • Será que essa distribuição é normal? Vejamos: require(moments) ## Loading required package: moments # Assimetria skewness(betahats[,2]) ## [1] 0.0320196 # Curtose kurtosis(betahats[,2]) ## [1] 2.912164 ECOA93 Frederico Uchôa 35 / 62 Instalação do R Uso básico do R Econometria com o auxílio do R Econometria com o auxílio do R • O comando skewness(‘args’) nos diz que a assimetria igual é próxima de 0 e a curtose (kurtosis(‘args’)) próxima de 3, o que nos fornece um forte indício de normalidade dessa distribuição. • Como exercício, faça o teste de Jarque-Bera e verifique. • Note também que usamos um comando novo require(‘args’) que serve para carregar pacotes adicionais. • �ando instalamos o R apenas as configurações mínimas para seu funcionamento básico são incluídas no programa, ou seja, os pacotes que vêm fazem parte da instalação ‘base’. • Para realizar tarefas mais complicadas e interessantes pode ser necessário instalar pacotes (packages) adicionais. ECOA93 Frederico Uchôa 36 / 62 Instalação do R Uso básico do R Econometria com o auxílio do R Econometria com o auxílio do R • Para instalar um pacote use o comando install.packages(‘nome do pacote’). • Uma lista de servidores aparecerá e você deve escolher um deles. • Em seguida, uma lista com uma grande quantidade de pacotes está disponível. • Clique no pacote que deseja e ele será instalado (se tudo correr bem). • Feito isso, para usar o pacote instalado é preciso carregá-lo usando o comando require(‘args’) ou library(‘args’). • E foi exatamente isso que fizemos ao carregar o pacote require(moments). ECOA93 Frederico Uchôa 37 / 62 Instalação do R Uso básico do R Econometria com o auxílio do R Econometria com o auxílio do R • Feito isso, a próxima questão é a seguinte: será que podemos confiar nessas estimativas? Será que podemos dizer que nossas estimativas realmente importam? • Para responder essa questão vamos manter, a principio, a suposições de que E (u | X) = 0 e Var (u | X) = σ2I. • Nesse caso o estimador da matriz de covariâncias, já que mantida a suposição usual de homoscedasticidade, é dado por σ̂2 n− k (X ′X)−1, em que σ̂2 = û′û, n é o número de observações e k o número de parâmetros. • Agora podemos inferir sobre a validade da estimativa β̂, ou seja, podemos testar, por exemplo, a hipótese de que β̂0 6= 0 ou ainda β̂1 6= 0. ECOA93 Frederico Uchôa 38 / 62 Instalação do R Uso básico do R Econometria com o auxílio do R Econometria com o auxílio do R • Vejamos como testar essas hipóteses set.seed(1234) n = 10 k = 2 beta = cbind(1.0, 0.0) X = cbind(1, runif(n)) y = X%*%t(beta) + rnorm(n) betahat = solve(t(X)%*%X)%*%t(X)%*%y betahat ## [,1] ## [1,] 0.7401313 ## [2,] -0.1428783 ECOA93 Frederico Uchôa 39 / 62 Instalação do R Uso básico do R Econometria com o auxílio do R Econometria com o auxílio do R uhat = M%*%y uhat ## [,1] ## [1,] 0.56461369 ## [2,] -0.02841287 ## [3,] -0.32395558 ## [4,] -0.53162422 ## [5,] -0.09869282 ## [6,] -0.33119477 ## [7,] -0.52770995 ## [8,] -0.17707582 ## [9,] 0.09069837 ## [10,] 1.36335397 ECOA93 Frederico Uchôa 40 / 62 Instalação do R Uso básico do R Econometria com o auxílio do R Econometria com o auxílio do R shat = (t(uhat)%*%uhat)/(n - k) shat ## [,1] ## [1,] 0.3754239 covhat = as.numeric(shat)*solve(t(X)%*%X) covhat ## [,1] [,2] ## [1,] 0.1696737 -0.2700821 ## [2,] -0.2700821 0.5520595 ECOA93 Frederico Uchôa 41 / 62 Instalação do R Uso básico do R Econometria com o auxílio do R Econometria com o auxílio do R tb0 = betahat[1]/sqrt(covhat[1,1]) tb0 ## [1] 1.796807 tb1 = betahat[2]/sqrt(covhat[2,2]) tb1 ## [1] -0.1922974 tcrit = qt(0.975, df = (n - k)) tcrit ## [1] 2.306004 abs(tb0) > tcrit ## [1] FALSE abs(tb1) > tcrit ## [1] FALSE ECOA93 Frederico Uchôa 42 / 62 Instalação do R Uso básico do R Econometria com o auxílio do R Econometria com o auxílio do R • Denominamos de covhat a matriz de covariâncias, tb0 a estatística de teste para β̂0 e tb1 para β̂1. • Da diagonal principal da matriz de covariâncias obtemos os desvios-padrão de interesse, associados a τ = β̂0 e β̂1. • A estatística de teste é dada por β̂i√ v̂ar ( β̂i ) , tem distribuição t−Student e n− k graus de liberdade. SobH0 não podemos rejeitar a hipótese de que o valor estimado é zero e, de modo oposto, rejeitamos a hipótese nula se τ > tα/2,n−k . • Com essas informações, devemos acreditar nas nossas estimativas? ECOA93 Frederico Uchôa 43 / 62 Instalação do R Uso básico do R Econometria com o auxílio do R Econometria com o auxílio do R • A regra de decisão nos diz que devemos comparar nossas estatística de teste com um valor crítico. • Vamos obter esse valor crítico usando o comando qt(‘args’) que reporta o quantil de interesse das distribuição t−Student. • Se valor da comparação abs(tb) > tcrit é verdadeiro (FALSE) não devemos rejeitar a hipótese nula. • Se você chegou até aqui saiba que não será possível repetir todos esses passos quando quiser fazer uma regressão simples. • O R tem um comando que automatiza esses procedimentos e para usá-lo basta fazer: ECOA93 Frederico Uchôa 44 / 62 Instalação do R Uso básico do R Econometria com o auxílio do R Econometria com o auxílio do R reg = lm(y ~ X[,2]) summary(reg) ## ## Call: ## lm(formula = y ~ X[, 2]) ## ## Residuals: ## Min 1Q Median 3Q Max ## -0.7372 -0.4189 -0.2076 0.2832 1.2928 ## ## Coefficients: ## Estimate Std. Error t value Pr(>|t|) ## (Intercept) 0.7401 0.4539 1.631 0.142 ## X[, 2] -0.1429 0.8187 -0.175 0.866 ## ## Residual standard error: 0.6751 on 8 degrees of freedom ## Multiple R-squared: 0.003793,Adjusted R-squared: -0.1207 ## F-statistic: 0.03046 on 1 and 8 DF, p-value: 0.8658 ECOA93 Frederico Uchôa 45 / 62 Instalação do R Uso básico do R Econometria com o auxílio do R Econometria com o auxílio do R • O comando lm(‘args’) roda a regressão e armazena na variável reg. • Já o comando summary(‘args’) serve para exibir os resultados de modo mais completo e amigável. • Observe que os resultados apresentados pelo R incluem uma coluna com o p−valor (Pr(>|t|)). • Com isso, temos uma forma mais compacta e prática de decidir se devemos ou não rejeitar a hipótese nula. ECOA93 Frederico Uchôa 46 / 62 Instalação do R Uso básico do R Econometria com o auxílio do R Econometria com o auxílio do R • Podemos exibir o p−valor, das nossas estimativas fazendo 2*pt(-abs(tb0), df = (n - k)) ## [1] 0.1100888 2*pt(-abs(tb1), df = (n - k)) ## [1] 0.8523009 ECOA93 Frederico Uchôa 47 / 62 Instalação do R Uso básico do R Econometria com o auxílio do R Econometria com o auxílio do R • O comando pt(‘args’) foi usado para gerar a função de distribuição desejada. • Vamos seguir um pouco mais adiante. • �ando realizamos testes de hipótese devemos estar cientes de que nenhum teste é 100% certo. • Como todo procedimento baseado em probabilidades, sempre há uma chance de errarmos nas nossas conclusões. ECOA93 Frederico Uchôa 48 / 62 Instalação do R Uso básico do R Econometria com o auxílio do R Econometria com o auxílio do R • Felizmente, podemos saber quais são as chances de cometermos dois erros nessa etapa que são inversamente relacionados: tipo I e tipo II. • O Erro tipo I ocorre quando a hipótese nula é verdadeira, mas é rejeitada. • A probabilidade de cometer esse tipo de erro é comumente indicada pela letra α, que, por sua vez, nada mais é o que o nível de significância que você definiu para seu teste de hipóteses. • Por exemplo, se α− 0.05 estamos aceitando uma chance de 5% (5 a cada 100) de cometermos um erro ao rejeitar a hipótese nula. ECOA93 Frederico Uchôa 49 / 62 Instalação do R Uso básico do R Econometria com o auxílio do R Econometria com o auxílio do R • Se quiser reduzir este risco, será preciso usar um valor ainda menor de α. Isso, porém, tem um custo. • Ao diminuir o valor de α as chances de detectarmos uma diferença rejeitarmos corretamente a hipótese nula diminuem, o que dá origem ao erro tipoII. • O erro tipo II ocorre quando a hipótese nula não é verdadeira, mas não a rejeitamos. • A probabilidade de cometermos esse erro é comumente indicada pela letra β (não confunda com o β da regressão). ECOA93 Frederico Uchôa 50 / 62 Instalação do R Uso básico do R Econometria com o auxílio do R Econometria com o auxílio do R • E a probabilidade de cometermos o erro Tipo II é igual a 1− β, que o valor da potência do teste. • A probabilidade de cometer um erro do tipo I é chamada de tamanho do teste, enquanto que a probabilidade de não cometer um erro do tipo II de poder do teste. • O poder do teste, isto é, a capacidade que o teste tem de rejeitar corretamente a hipótese nula pode ser melhorado se o teste tiver potência suficiente. • Uma maneira de ajudar nessa missão, e diminuir as chances do erro tipo II, é garantir que o tamanho da amostra seja grande o suficiente. ECOA93 Frederico Uchôa 51 / 62 Instalação do R Uso básico do R Econometria com o auxílio do R Econometria com o auxílio do R • O tamanho empírico do teste e pode ser calculado por meio de um experimento de de Monte-Carlo, isto é, por meio da geração de um grande número de amostras sob a hipótese nula. • Com isso podemos responder a seguinte pergunta: será que nosso teste é confiável? • Se for então o número de vezes em que devemos errar deve ser próximo do nível de nível de significância adotado. • Logo, ao fixar um nível de significância de 5% estamos afirmando que em apenas 5% das vezes rejeitaremos a hipótese nula quando, na verdade, não devíamos. ECOA93 Frederico Uchôa 52 / 62 Instalação do R Uso básico do R Econometria com o auxílio do R Econometria com o auxílio do R • Vejamos se isso ocorre com o nosso teste: nrep = 5000 betahats = matrix(0, nrep, 2) varhats = matrix(0, nrep, 2) tbs = matrix(0, nrep, 2) X = cbind(1, runif(n)) ECOA93 Frederico Uchôa 53 / 62 Instalação do R Uso básico do R Econometria com o auxílio do R Econometria com o auxílio do R for(i in 1:nrep){ y = X%*%t(beta) + rnorm(n) betahats[i,] = solve(t(X)%*%X)%*%t(X)%*%y uhat = y - X%*%betahats[i,] shat = (t(uhat)%*%uhat)/(n - k) varhats[i,1] = (as.numeric(shat)*solve(t(X)%*%X))[1,1] varhats[i,2] = (as.numeric(shat)*solve(t(X)%*%X))[2,2] tbs[i,1] = ((betahats[i,1] - 1.0)/sqrt(varhats[i,1])) tbs[i,2] = ((betahats[i,2] - 0.0)/sqrt(varhats[i,2])) } ECOA93 Frederico Uchôa 54 / 62 Instalação do R Uso básico do R Econometria com o auxílio do R Econometria com o auxílio do R # Média das estimativas de beta0 mean(betahats[,1]) ## [1] 1.009554 # Média das estimativas de beta1 mean(betahats[,2]) ## [1] -0.01542628 # Poder do teste para beta0 (sum(abs(tbs[,1]) > tcrit)/nrep)*100 ## [1] 5.54 # Poder do teste para beta1 (sum(abs(tbs[,2]) > tcrit)/nrep)*100 ## [1] 5.1 ECOA93 Frederico Uchôa 55 / 62 Instalação do R Uso básico do R Econometria com o auxílio do R Econometria com o auxílio do R • É fácil verificar que nosso teste tem um percentual de rejeições muito próximo do nível de confiança especificado (5%). • Isto significa que esse teste, caso as suposições se mantenham, é confiável. • E se aumentarmos o número de repetições do experimento? • E se aumentarmos o tamanho da amostra? O que acontece? �ais são as mudanças observadas nos resultados? O isso nos diz? ECOA93 Frederico Uchôa 56 / 62 Instalação do R Uso básico do R Econometria com o auxílio do R Econometria com o auxílio do R • Vejamos um exemplo com a redução da pobreza que é um dos mais importantes Objetivos de Desenvolvimento do Milênio. • �ais são os apectos sócio–econômicos que influenciarão a redução da pobreza nas décadas seguintes? • Vamos começar nossa investigação analisando a equação log ( pobt pobt−1 ) = log (pobt−1) + u, em que estamos relacionado o a taxa de redução na pobreza entre os períodos t e t − 1 a taxa de pobreza em t − 1. ECOA93 Frederico Uchôa 57 / 62 Instalação do R Uso básico do R Econometria com o auxílio do R Econometria com o auxílio do R • Vamos começar carregando os dados e dando uma olhada nas primeiras linhas do arquivo • Para tanto usamo os comandos: ### data = read.csv('Poverty_Ineq_Data.csv', sep = ',', header = T, stringsAsFactors = FALSE) ### head(data) ## i pov pov1960 gdp inc gini k h ill pop prur ## 1 1047 -2.538409 0.78413 4.094 290.960 0.61566 2.395 2.75521 0.22727 2055 0.61265 ## 2 1048 -2.119224 0.68254 4.298 187.751 0.38422 1.184 2.40703 0.25689 12592 0.61206 ## 3 1049 -1.093967 0.70227 2.091 260.072 0.54025 2.220 2.30930 0.36311 23991 0.61190 ## 4 1050 -1.394896 0.64452 3.455 317.346 0.54811 2.776 3.37503 0.33666 32685 0.61043 ## 5 1051 -1.741857 0.60995 2.450 273.246 0.43877 1.787 3.16908 0.42142 11170 0.61218 ## 6 1052 -2.003344 0.72937 3.978 316.259 0.45772 1.599 3.36858 0.32723 6397 0.61169 ECOA93 Frederico Uchôa 58 / 62 Instalação do R Uso básico do R Econometria com o auxílio do R Econometria com o auxílio do R • Agora, vamos rodar nossa regressão. ### reg = lm(pov ~ log(pov1960), data) ### summary(reg) ## ## Call: ## lm(formula = pov ~ log(pov1960), data = data) ## ## Residuals: ## Min 1Q Median 3Q Max ## -3.2996 -0.4787 0.1310 0.5198 3.2225 ## ## Coefficients: ## Estimate Std. Error t value Pr(>|t|) ## (Intercept) -1.20969 0.02800 -43.20 <2e-16 *** ## log(pov1960) 1.78916 0.07905 22.63 <2e-16 *** ## --- ## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 ## ## Residual standard error: 0.6975 on 2275 degrees of freedom ## Multiple R-squared: 0.1838,Adjusted R-squared: 0.1834 ## F-statistic: 512.3 on 1 and 2275 DF, p-value: < 2.2e-16 ECOA93 Frederico Uchôa 59 / 62 Instalação do R Uso básico do R Econometria com o auxílio do R Econometria com o auxílio do R • Analise os resultados que obtivemos. • Será que podemos melhorá-los? • A ausência de varíaveis importantes pode causar problemas. • Vamos adicionar outra variáveis explicativas para ver o que acontece. ECOA93 Frederico Uchôa 60 / 62 Instalação do R Uso básico do R Econometria com o auxílio do R Econometria com o auxílio do R ### reg = lm(pov ~ log(pov1960) + ill, data) ### summary(reg) ## ## Call: ## lm(formula = pov ~ log(pov1960) + ill, data = data) ## ## Residuals: ## Min 1Q Median 3Q Max ## -3.14842 -0.33979 0.07172 0.40548 1.50659 ## ## Coefficients: ## Estimate Std. Error t value Pr(>|t|) ## (Intercept) -3.38537 0.06918 -48.933 <2e-16 *** ## log(pov1960) -0.18049 0.08769 -2.058 0.0397 * ## ill 3.36100 0.10082 33.336 <2e-16 *** ## --- ## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 ## ## Residual standard error: 0.5718 on 2274 degrees of freedom ## Multiple R-squared: 0.4517,Adjusted R-squared: 0.4512 ## F-statistic: 936.8 on 2 and 2274 DF, p-value: < 2.2e-16 ECOA93 Frederico Uchôa 61 / 62 Instalação do R Uso básico do R Econometria com o auxílio do R Econometria com o auxílio do R ### reg = lm(pov ~ log(pov1960) + ill + prur, data) ### summary(reg) ## ## Call: ## lm(formula = pov ~ log(pov1960) + ill + prur, data = data) ## ## Residuals: ## Min 1Q Median 3Q Max ## -2.8401 -0.3207 0.0666 0.3645 1.4700 ## ## Coefficients: ## Estimate Std. Error t value Pr(>|t|) ## (Intercept) -4.45287 0.08940 -49.81 < 2e-16 *** ## log(pov1960) -0.57332 0.08544 -6.71 2.45e-11 *** ## ill 3.10422 0.09588 32.38 < 2e-16 *** ## prur 1.88625 0.10845 17.39 < 2e-16 *** ## --- ## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 ## ## Residual standard error: 0.5373 on 2273 degrees of freedom ## Multiple R-squared: 0.5161,Adjusted R-squared: 0.5155 ## F-statistic: 808.2 on 3 and 2273 DF, p-value: < 2.2e-16 ECOA93 Frederico Uchôa 62 / 62 Instalação do R Uso básico do R Econometria com o auxílio do R
Compartilhar