Baixe o app para aproveitar ainda mais
Prévia do material em texto
09/07/2022 17:03 UNINTER https://univirtus.uninter.com/ava/web/roa/ 1/14 ESTATÍSTICA APLICADA AULA 1 Prof. Tiago Claudino Barbosa 09/07/2022 17:03 UNINTER https://univirtus.uninter.com/ava/web/roa/ 2/14 CONVERSA INICIAL INTRODUÇÃO À ESTATÍSTICA Nossa aula busca introduzir conceitos básicos da estatística e mostrar seu imenso potencial de uso na economia e áreas correlatas. Os esforços de aprendizado serão direcionados para e entendimento: (i) do objeto de estudo da estatística e dos seus principais objetivos enquanto ciência aplicada; (ii) de alguns conceitos iniciais aplicados em diversas técnicas estatísticas; (iii) da importância do uso de amostras e da forma de coleta dos dados a serem analisados; (iv) de algumas formas de se resumir grandes conjuntos de dados; (v) de algumas das principais aplicações da estatística na economia. CONTEXTUALIZANDO Em um ano, qual o efeito de um aumento nos gastos do governo na taxa de desemprego no Brasil? Qual o impacto no salário de se ter cursado ensino superior? Esse impacto difere entre os países e regiões e, se sim, por que? Qual o perfil médio e os desejos do público-alvo da minha empresa? Qual a taxa de defeito nas peças que saem da minha linha de produção? Qual a previsão do crescimento do meu mercado nos próximos cinco anos? Essas e outras perguntas de relevância econômica, política e social são respondidas pela estatística. A teoria econômica provê explicações teóricas para o comportamento e a relação entre variáveis econômicas e variáveis do contexto social, porém a verificação empírica dessas teorias e a aplicação para casos concretos dependem da existência de dados adequados e do emprego de técnicas estatísticas. O objetivo desta disciplina é mostrar a base da estatística e suas técnicas, que serão aprofundadas na disciplina de econometria do quarto ano. Os tópicos serão apresentados de forma 09/07/2022 17:03 UNINTER https://univirtus.uninter.com/ava/web/roa/ 3/14 sucinta e introdutória, sendo possível que os alunos se aprofundem em temas de seu interesse ao lerem a bibliografia recomendada. TEMA 1 – O QUE É E PARA QUE SERVE A ESTATÍSTICA? O que é a estatística e qual a sua importância para a economia e áreas correlatas? Essas duas perguntas serão exploradas na aula de hoje. É possível adiantar que a estatística tem um papel central dentro da ciência econômica, ajudando a transpor os modelos teóricos da economia para a análise de situações empíricas do mundo real. As técnicas estatísticas ajudam os economistas a balizar suas previsões sobre o futuro, a testar hipóteses sobre o comportamento dos atores econômicos e suas relações e a estimar a direção e a força das relações entre variáveis econômicas e entre variáveis econômicas e outros fatores do contexto social, como variáveis políticas e sociais (Hoffman, 2006). A importância da estatística é tão grande que uma nova disciplina emergiu dentro da economia através da junção de teoria econômica, modelos matemáticos baseados nessas teorias e uso de técnicas estatísticas para a análise de dados empíricos – a econometria, que será ensinada no último ano do nosso curso. A nossa disciplina de Estatística Aplicada visa ensinar os conceitos e técnicas básicas da estatística utilizados pelos economistas em uma variedade de situações práticas. Os conceitos a serem ensinados não só formam a base para o entendimento da disciplina de Econometria, mas são fundamentais para o aguçamento do senso crítico, para o entendimento de notícias e informações científicas diversas e para a aplicação de conceitos e técnicas para a resolução de problemas que economistas enfrentam no seu trabalho em empresas, governos, entidades sem fins lucrativos ou em seus empreendimentos pessoais. Para iniciarmos nossa jornada, devemos primeiro entender o que é a estatística e quais os objetivos de suas duas principais áreas. “Estatística é a ciência que coleta, organiza, analisa e interpreta dados para a tomada de decisão” (Larson; Farber, 2010, p.3). É aplicada em diversos campos do conhecimento e da ação humana que envolvam dados e decisões, sejam de ordem científica, tecnológica, empresarial, produtiva, comercial, de gestão pública, entre outros. 09/07/2022 17:03 UNINTER https://univirtus.uninter.com/ava/web/roa/ 4/14 A matéria-prima da estatística são os dados, que podem ser quantitativos ou qualitativos. Para que esses dados forneçam informações relevantes para situações do mundo real, eles devem ser organizados e analisados com técnicas adequadas. Esse processo de transformação de conjuntos de dados brutos em informações úteis para a tomada de decisão no mundo real é o objetivo principal da estatística. Para a realização desse objetivo, a estatística é dividida em duas partes. A estatística descritiva que tem por objetivo apresentar, organizar e descrever um conjunto de dados de forma sucinta, e a inferência estatística se refere a técnicas que permitem generalizações (inferências), que podem ser feitas sobre características de uma população a partir de amostras e informações incompletas (Hoffman, 2006). Dessa forma, a essência da inferência estatística é aprender algo sobre uma população de interesse a partir da coleta e análise de dados de uma parte menor de seus membros (amostras) (Triola, 2006). Os tópicos abordados nas próximas seções devem tornar esses conceitos mais claros. TEMA 2 – CONCEITOS INICIAIS Alguns conceitos iniciais são necessários para se entender os objetivos e potenciais da estatística. O quadro 1 apresenta uma parte desses conceitos iniciais, sendo os demais conceitos iniciais apresentados em conteúdos posteriores. Quadro 1 – Alguns conceitos básicos da estatística CONCEITO DEFINIÇÃO EXEMPLO Dado Dados são observações coletadas. Altura de estudantes de uma escola, cotações de uma moeda ao longo de um ano. Dado quantitativo Observação numérica representando contagens ou medidas. Peso de latas de refrigerantes produzidas em uma fábrica, lucro de empresas de um determinado país em um ano. Dado qualitativo Observações que podem ser separadas em diferentes categorias conforme alguma característica não numérica. Cores dos carros vendidos por uma concessionária, voto no candidato X em uma eleição, cidade de origem dos funcionários de uma empresa. Variável Um atributo do objeto de estudo considerado que tenha variação. Renda per capita da população de um país, altura de adultos de um país. 09/07/2022 17:03 UNINTER https://univirtus.uninter.com/ava/web/roa/ 5/14 Variável aleatória Variável cujos valores provém de um processo aleatório. Resultado do lançamento de um dado ou de uma moeda. População Coleção completa de todos os elementos a serem estudados. Todos os habitantes do Brasil no caso do Censo Demográfico. Parâmetro Medida numérica que descreve alguma característica da população. Proporção de todos os brasileiros que estão em situação de extrema pobreza. Censo Coleta de dados sobre todos os membros de uma população. Censo Demográfico realizado no Brasil a cada dez anos. Amostra Subconjunto de membros selecionados de uma população. Pesquisa de intenção de votos para uma eleição. Estatística Medida numérica que descreve alguma característica de uma amostra. Proporção de eleitores que pretendem votar no candidato A, salário médio de pessoas que se formaram no curso X. Inferência Estatística Generalização sobre algum parâmetro da população de interesse com base em uma estatística obtida de uma amostra dessa população. Projeção da provável vitória de um candidato que tenha obtido intenções de voto muito maiores que outros candidatos em uma amostra. Fonte: Elaborado com base em Triola, 2006. A aplicação desses conceitos em casos práticos deve ser bem demarcada no tempo e no espaço. Por exemplo, se quisermos analisar a distribuição de renda em um determinado território, é preciso demarcar bem qual é esse territórioe a que período do tempo os dados se referem. A distribuição de renda do Brasil em 2018, por exemplo, é diferente da de 2019, e as distribuições de renda das regiões e estados brasileiros também se diferem entre si. Para um melhor entendimento dos conceitos, leia os casos hipotéticos abaixo. Suponha que desejamos saber o desempenho acadêmico de uma escola. Como se trata de uma população de estudantes relativamente pequena, a escola resolve realizar um teste com todos os estudantes (censo). A pontuação no teste dos alunos é a variável de interesse, e o desempenho médio dos alunos é o parâmetro que mede o desempenho acadêmico da escola. É importante assinalar que os resultados refletem o desempenho dessa escola específica em um momento do tempo específico, não podendo ser generalizado para outros contextos. Agora, suponha que desejamos saber qual candidato a uma eleição provavelmente será o vencedor e qual a proporção da população votante de um território (população) que vai votar em 09/07/2022 17:03 UNINTER https://univirtus.uninter.com/ava/web/roa/ 6/14 cada candidato (parâmetro). Como a população é grande, foi decidido realizar uma amostra aleatória com dois mil eleitores. A variável de interesse é a intenção de voto na eleição específica. As proporções de intenção de voto para cada candidato obtidas na amostra são as estatísticas, a partir das quais a aplicação de técnicas estatísticas permite a estimação do parâmetro, chegando-se a conclusões prováveis sobre qual a proporção de votos que cada candidato vai ter na eleição e, logo, qual o provável vencedor, a chamada inferência estatística. Um melhor entendimento das formas de se obter amostras é o nosso próximo tópico. TEMA 3 – AMOSTRAGEM A melhor forma de se conhecer os atributos de uma população seria realizar um censo, no qual todos os membros da população têm seus dados coletados, porém isso nem sempre é viável ou prático. Por exemplo, se quisermos saber a opinião de todos os milhões de brasileiros em idade de votar sobre a aprovação de uma nova lei qualquer, teríamos que realizar um censo que abordasse todos os brasileiros dentro de um espaço curto de tempo, de cidadãos que habitam as grandes metrópoles às comunidades indígenas e ribeirinhas da Amazônia. Isso se tornaria inviável em termos logísticos, técnicos e financeiros, ainda mais se considerarmos que se trata de uma questão pontual. O Brasil realiza, a cada dez anos em média, o Censo Demográfico para a coleta de dados diversos sobre a população brasileira. Esse censo exige elevados recursos e planejamento a longo prazo, e, mesmo assim, falha em capturar informações de todos os cidadãos brasileiros. Muitos não respondem a pesquisa por não estarem em casa no momento em que o recenseador chega para a coleta de dados, por não terem residência fixa, entre outros motivos diversos. Mesmo que sua cobertura seja incompleta, ela pode ser considerada razoável para a maioria das questões. Contudo, por ser realizado a cada dez anos, os dados podem ficar desatualizados nesse meio tempo. Um dado como a taxa de desemprego em 2010 não diz muito sobre o desemprego no Brasil em 2019, ainda mais considerando que essa é uma variável conjuntural que flutua muito de um ano para o outro ou mesmo dentro de um mesmo ano. Há ainda outras questões. Por exemplo, se quisermos avaliar a resistência mecânica de uma peça de nossa linha de produção, teremos que utilizar testes que levem essas peças ao seu limite, ou seja, 09/07/2022 17:03 UNINTER https://univirtus.uninter.com/ava/web/roa/ 7/14 à destruição. Realizar um censo para mensurar a resistência de todas as peças tornaria a linha de produção insustentável. Dadas essas dificuldades para a realização de censos, é possível utilizar amostras, que são subconjuntos da população de interesse, para se estimar algum atributo sobre a população. Há diversas formas de se obter uma amostra, mas a que possui as melhores propriedades e a mais utilizada em análises estatísticas são as amostras aleatórias. Em uma amostra aleatória, todos os membros da população têm a mesma chance de serem selecionados para a amostra (Triola, 2006). Um dos riscos de se utilizar uma amostra é que ela pode não ser representativa da população de interesse, gerando, assim, resultados distorcidos. Uma amostra ruim pode ser pior do que não ter amostra nenhuma. Uma amostra representativa é uma que não tenha vieses de seleção, que são direcionamentos que fazem com que determinados membros de uma população tenham maior chance de serem selecionados ou excluídos de uma amostra. Ao aparecerem em maior ou menor frequência que a parte da população de interesse, eles fazem a amostra ter uma composição diferente, gerando resultados não representativos. Nesse contexto, se quisermos saber qual a renda média das famílias da cidade de São Paulo, não podemos coletar dados somente de pessoas que trabalham na Avenida Faria Lima, conhecida por ser um polo financeiro e uma região de renda elevada. Uma estatística baseada somente em indivíduos dessa região não seria capaz de estimar a renda média de São Paulo, pois seria distorcida por não incorporar pessoas que habitam regiões mais periféricas e de menor renda. A amostra deve sim abarcar pessoas que habitam a região da Faria Lima, mas também pessoas das outras regiões da cidade. A aleatoriedade garante a redução do risco de vieses ao fazer com que todos os segmentos tenham a mesma probabilidade de serem incluídos na amostra. Há ainda riscos de distorções na composição da amostra devido ao acaso, mas são bem baixos. Especialmente em grandes amostras, a aleatoriedade é a melhor maneira de garantir a minimização desses riscos. Nosso próximo tópico mostra algumas formas de organização e resumo de conjuntos de dados. TEMA 4 – DISTRIBUIÇÃO DE FREQUÊNCIA E GRÁFICOS 09/07/2022 17:03 UNINTER https://univirtus.uninter.com/ava/web/roa/ 8/14 Os conjuntos de dados têm algumas propriedades que nos permitem entender seu comportamento e características gerais. Uma dessas propriedades é a distribuição dos dados, que se refere à forma com que os dados são distribuídos ao longo da escala da variável analisada (Triola, 2006). Os valores dos dados podem se concentrar próximos a um ou mais pontos específicos, e há formas de se observar isso visualmente por meio de tabelas e gráficos. Uma forma eficiente de se organizar os dados e entender como eles se distribuem é por meio da construção de tabelas, como a distribuição de frequência, que é uma tabela que divide os valores individualmente ou em classes de valores e reporta a frequência que aqueles valores aparecem no conjunto (Pinheiro et al., 2009). Os procedimentos para a elaboração de uma distribuição de frequência são: (i) organizar os dados em ordem crescente; (ii) definir a amplitude dos valores ao subtrair do valor máximo o valor mínimo; (iii) definir o número de intervalos a serem feitos, em geral de mesma amplitude, e os valores dos seus limites superiores e inferiores; (iii) colocar a frequência de aparecimento no conjunto de dados de valores por intervalo. Atualmente, qualquer software estatístico realiza isso automaticamente, logo devemos focar na interpretação dos resultados. Utilizamos um exemplo real de uma variável econômica de alta relevância para ilustrar esse conceito. A tabela 1 mostra o valor da renda familiar per capita média dos 26 estados brasileiros e do Distrito Federal em 2019. Os dados foram obtidos da Pesquisa Nacional por Amostra de Domicílios (PNAD), que coleta periodicamente dados representativos das unidades federativas do país sobre mercado de trabalho e outras variáveis socioeconômicas. Os valores foram arredondados. Tabela 1 – Renda familiar per capita das unidades federativas do Brasil – em R$ Unidade Federativa Renda per capita familiar - em R$ Rondônia 1.111 Acre 890 Amazonas 838 Roraima 1.050 Pará 795 Amapá 874 09/07/2022 17:03 UNINTER https://univirtus.uninter.com/ava/web/roa/ 9/14 Tocantins1.038 Maranhão 637 Piauí 831 Ceará 939 Rio Grande do Norte 1.042 Paraíba 909 Pernambuco 954 Alagoas 729 Sergipe 970 Bahia 912 Minas Gerais 1.331 Espírito Santo 1.440 Rio de Janeiro 1.809 São Paulo 1.889 Paraná 1.586 Santa Catarina 1.709 Rio Grande do Sul 1.812 Mato Grosso do Sul 1.491 Mato Grosso 1.361 Goiás 1.284 Distrito Federal 2.599 Fonte: IBGE, 2021. A renda familiar per capita é um indicador do grau de desenvolvimento econômico e acesso a consumo de uma região. Quanto maior, melhor. Os dados das unidades federativas brasileiras indicam uma forte variação da renda per capita familiar entre as regiões do país, algumas com renda muito mais elevada do que outros. 09/07/2022 17:03 UNINTER https://univirtus.uninter.com/ava/web/roa/ 10/14 Nossa variável de interesse X é a renda familiar per capita das unidades federativas do Brasil. O menor valor (R$637) pertence ao estado do Maranhão, e o maior (R$ 2.599), ao Distrito Federal. Em 2019, a diferença entre a unidade de maior e menor renda foi de R$ 1.961. Arredondando esse valor para R$ 2.000, pode-se dividir os dados em cinco intervalos de igual tamanho de R$ 400. A tabela seguinte apresenta a distribuição de frequência. Tabela 2 – Distribuição de frequência da renda familiar per capita das unidades federativas brasileiras (em R$) Faixa de renda – R$ Frequência Frequência relativa 600-999 12 44,4% 1.000-1.399 7 25,9% 1.400-1.799 4 14,8% 1.800-2.199 3 11,1% 2.200-2.600 1 3,7% Fonte: Elaborada com base em IBGE, 2021. A tabela mostra tanto a frequência absoluta (numérica) quanto relativa (em percentual) das faixas de renda familiar per capita das unidades federativas brasileiras. Enquanto, na tabela 1, com 27 linhas, é difícil ter uma visão de como os dados se distribuem, na tabela de frequência, é possível ver de forma sucinta que quase metade dos estados tem uma renda per capita relativamente baixa, de menos de R$ 1.000, e mais de 70% tem renda per capita inferior a R$ 1.400. Uma outra forma de sintetizar os dados e mostrar como eles se distribuem é construindo gráficos, dos quais o mais usual é o histograma. Um histograma é um gráfico de barras no qual o eixo horizontal representa intervalos de valores da variável de interesse X e o vertical, a frequência que esses valores aparecem no conjunto de dados analisado. A altura das barras é proporcional à frequência de aparecimento dos dados, e as barras são construídas adjacentes umas às outras (Triola, 2006). É basicamente a representação visual da tabela de distribuição de frequência. As barras em geral possuem a mesma largura, representando intervalos de valores de igual magnitude. O gráfico 1 é um histograma dos dados de renda familiar per capita das unidades federativas brasileiras em 2019. 09/07/2022 17:03 UNINTER https://univirtus.uninter.com/ava/web/roa/ 11/14 Gráfico 1 – Histograma da renda familiar per capita das unidades federativas do Brasil – em R$ Fonte: Elaborado com base em IBGE, 2021. Os dados refletem o mesmo padrão expresso na tabela de frequência acima: a maioria das unidades federativas brasileiras tem renda per capita relativamente baixa, abaixo de R$ 1,4 mil. Apresentadas essas formas de se visualizar a distribuição dos dados de um conjunto, o próximo tópico mostra alguns dos usos possíveis da estatística na economia. TEMA 5 – EXEMPLOS DE USO NA ECONOMIA As possibilidades de uso da estatística e da disciplina derivada de econometria pelos economistas e profissionais de áreas correlatas são diversas. Elas são disciplinas instrumentais, que ajudam os estudantes e profissionais formados a aplicarem os conhecimentos teóricos adquiridos nas disciplinas de economia a problemas do mundo real. O quadro 2 mostra algumas das aplicações da estatística na economia e exemplos. Quadro 2 – Alguns dos usos da estatística na economia TIPO DE USO EXEMPLO Definição e mensuração de variáveis econômicas PIB, taxa de inflação, distribuição de renda. 09/07/2022 17:03 UNINTER https://univirtus.uninter.com/ava/web/roa/ 12/14 Indicações do estado atual da economia Taxa de crescimento econômico, taxa de desemprego. Previsões sobre variáveis econômicas e financeiras Valor futuro de uma ação; expectativa de crescimento do PIB no próximo ano. Avaliação do impacto de políticas Quanto um aumento de 1% nos gastos públicos hoje vai impactar no PIB do próximo ano? Estimação da relação entre variáveis Quanto o aumento de 1% no preço do meu produto vai impactar na quantidade vendida? Planejamento empresarial Qual o perfil e os desejos do público consumidor da minha marca? Fonte: Barbosa, 2021 Como visto, o potencial de uso da estatística para economistas é imenso. Mais adiante, vamos aprofundar o entendimento dos conceitos e técnicas. TROCANDO IDEIAS Em um fórum de discussão, discuta as limitações e os problemas de se utilizar amostras não aleatórias e não representativas das populações que se deseja analisar. NA PRÁTICA A lição proposta é acessar o site que roda online e gratuitamente o software estatístico Statdisk e construir um histograma dos dados a seguir. Suponha que os dados fictícios representam a renda familiar per capita de 12 pessoas selecionadas aleatoriamente de seu bairro. X – Renda familiar per capita 1000 1100 950 1200 1300 09/07/2022 17:03 UNINTER https://univirtus.uninter.com/ava/web/roa/ 13/14 1450 1325 2000 1600 1900 1875 2100 Passos para a realização da atividade: 1. Acesse o site do Statdisk (<https://www.statdisk.com/accounts/login/?next=/>); 2. Inscreva-se com sua conta Google ou outra; 3. O programa vai abrir sua página inicial com uma planilha vazia; 4. Copie e cole os doze dados acima na primeira célula da planilha em branco; 5. Após colar, clique em Data na barra superior e na opção Histogram; 6. Após abrir a janela, clique em Select Column e coloque a opção 1; 7. Clique em Plot ao final da página; 8. O histograma dos dados será gerado à esquerda, então analise-o. Caso não disponha de um computador ou não consiga realizar a lição proposta, construa um histograma à mão. Lembre-se que é preciso: (i) organizar os dados em ordem crescente; (ii) calcular a amplitude dos valores subtraindo do valor máximo o valor mínimo; (iii) dividir o valor da amplitude em intervalos de igual tamanho, no caso três intervalos são suficientes; (iv) contar a frequência de ocorrência dos valores; (v) desenhar o gráfico a partir desses dados. FINALIZANDO Nesta aula, realizamos uma introdução à estatística, seus conceitos básicos e seu potencial de uso na economia. Aprendemos também algumas formas de organizar e visualizar grandes conjuntos de dados de forma resumida. É importante um entendimento adequado desses tópicos, porque a estatística é uma disciplina cumulativa, logo cada conteúdo tem relação com conteúdos anteriores. https://www.statdisk.com/accounts/login/?next=/ 09/07/2022 17:03 UNINTER https://univirtus.uninter.com/ava/web/roa/ 14/14 REFERÊNCIAS HOFFMAN, R. Introdução. In: _____. Estatística para economistas. 4. ed. São Paulo: Cengage Learning, 2006, p. XIII-XIV. IBGE. PNAD – Pesquisa Nacional por Amostra de Domicílios – 2021. Disponível em: <https://www.ibge.gov.br/estatisticas/sociais/rendimento-despesa-e-consumo/9127-pesquisa- nacional-por-amostra-de-domicilios.html?=&t=o-que-e>. Acesso em 29 out. 2021. LARSON, R.; FARBER, B. Introdução à Estatística. In:__ Estatística Aplicada. 4. ed. São Paulo: Pearson Prentice Hall, 2010, p. 2-30. PINHEIRO, J. I. D.; DA CUNHA, S. B.; CARVAJAL, S. R.; GOMES, G. C. Análise exploratória para uma variável. In:__ Estatística Básica: a arte de trabalha com dados. São Paulo: Elsevier, 2009, p. 11-51. TRIOLA, M. F. Introdução à Estatística. In: _____. Estatística Elementar. 10. ed. Boston: Pearson Prentice Hall, 2006, p. 2-39.
Compartilhar