Baixe o app para aproveitar ainda mais
Prévia do material em texto
Lesson 1 of 5 Objetivos UNIDADE 4. Construção de índices Marco Sandrini OBJETIVOS DA UNIDADE • Levar o aluno a coletar dados para pesquisa de forma correta para produção de dados que retratem a realidade do evento; • Fazer a correlação entre os índices encontrados; • Ser capaz de aplicar medidas qualitativas e quantitativas do evento; • Desenvolver medidas de variação de índices; • Interpretar as relações entre os índices. TÓPICOS DE ESTUDO Clique nos botões para saber mais Números índices – // Construção de índices simples e compostos // Mudança de base de um número índice Índice de preço ao consumidor – // Deflação // Regressão e correlação Teoria da correlação – // Medidas de correlação // Mínimos quadrados // Erro padrão // Variação explicada e não explicada Equação de regressão – // Diagrama de dispersão // Análise de correlação e regressão Lesson 2 of 5 Números índices Você já deve ter ouvido falar ou leu em algum artigo sobre o tal “índice de preço ao consumidor”. Vamos agora, de um modo prático, desvendar esse notável valor e seus agregados, através do estudo dos números índices. Os números índices são muito usados em estatística, por serem medidas que vários ramos da Economia usam para comparar algumas variáveis, para que possamos obter uma análise comparativa delas. São muito usadas por engenheiros, economistas e administradores. Temos de destacar a importância que essas medidas representam no dia a dia das pessoas e nos lugares em que são usados. Teremos como base os números índices de Índice de Laspeyres, Paasche e Fisher, que são os mais utilizados. Essa comparação e análise são demonstradas em porcentagem, mostrando as variações significativas ocorridas ao longo do tempo. Por exemplo: o valor de mercado de um carro hoje em comparação ao preço de seis meses atrás. Por meio dos números índices, podemos fazer análises e comparações entre variáveis importantes na Economia, como as relacionadas aos preços e qualidade de matérias-primas, preços de artigos prontos, quantidade de produtos, valor de um certo produto no atacado e no varejo, valor relativo de produção, entre outras. No Gráfico 1, podemos ver um exemplo de comparação da quantidade de habitantes de uma certa província, que vivem na capital ou ao seu redor. Os principais índices financeiros brasileiros são: Balança Comercial, BTNF, Caderneta de Poupança, Dólar, Euro, Risco País, FGTS, ICV, IGP-DI, IGP-M, INCC-DI, INPC, IPC-DI, IPCA, Salário Mínimo, Taxa Selic, TJLP, TR, entre outros. Existem três classificações de números índices: índice de preço, quantidade e valor. Os números índices, como veremos a seguir, dividem-se em números índices simples, para o estudo de apenas um produto, e números índices compostos, para o estudo de mais de um produto. CONSTRUÇÃO DE ÍNDICES SIMPLES E COMPOSTOS Números índices demonstram a variação de um só produto ou outro tipo de variável durante dois ou mais períodos. Calculamos a razão do preço, quantidade ou valor em espaço de tempo determinado para o correspondente preço, quantidade ou valor. Não podemos esquecer de levar em consideração a principal limitação dos índices simples, que são os tópicos isolados, sobre os quais precisamos calcular variações para um grupo em sua totalidade. Apenas um item é levado em consideração, por exemplo, a análise de inflação de um produto em um determinado espaço de tempo. Vamos trabalhar com número índice composto quando um grupo de itens é avaliado no mesmo espaço de tempo. Como exemplo, a variação de preços dos aluguéis em um ano, ou alguma outra variação geral de um grupo de itens cujos valores podem aumentar, diminuir ou permanecer estáveis. São eles: • 1 Índice de preço; • 2 Índice de quantidade; • 3 Índice de valor. Índices de preços são relacionados com o preço de um produto em uma determinada data (época dada), em comparação com o preço do mesmo produto em uma outra data (época básica). O índice de quantidade é o que usamos para fazer as comparações entre as quantidades produzidas, vendidas ou consumidas. Esse índice é um demonstrativo das alterações dos preços em relação às quantidades em datas diferentes. Para tal cálculo, teremos os seguintes dados: Clique nos botões para saber mais 0 – Época básica ou época de referência. t – Época atual dada no problema. P0 – Preço do produto no tempo inicial “0”. Pt – Preço do produto no tempo solicitado “t”. Q0 – Quantidade do produto no tempo inicial “0”. Qt – Quantidade do produto no tempo solicitado “t”. V0 – P0 x Q0. Valor do produto no tempo inicial “t”. Vt – Pt x Qt. Valor do produto no tempo solicitado “t”. // Exemplo relativo a preço O valor de uma caneta, em 1999, era de R$ 1,20, e em 2000 subiu para R$ 1,38. Tendo por base o ano 1999, calcule o valor relativo em 2000. Solução: O ano base sempre corresponderá ao índice igual a 100. Os demais apresentarão, portanto, valores que flutuaram em torno de 100. Período base (0) = 1999 Período atual (t) = 2000 Analisamos esse resultado do seguinte modo: em 2000 houve um aumento de 15% (115-100) no preço do artigo, com relação ao preço do mesmo artigo em 1999. Se P2000 = 1,02 (1,30 – 1,28) e P1999 = 1,20, o preço relativo seria: Nesse caso, em 2000 o preço da caneta teria apresentado um valor 15% (85-100) inferior ao ano de 1999. // Exemplo relativo à quantidade A Companhia Siderúrgica Nacional (CSN) produziu 46 toneladas de aço em 1999 e 69 toneladas em 2000. Tomando-se como base a quantidade relativa de 1999, qual será a quantidade relativa a 2000? No ano de 2000, a CSN aumentou a produção em 50% (150-100) em relação a 1999. // Exemplo relativo a valor Certa rede de acessórios para motos vendeu, em 2000, 1000 capacetes de fibra de carbono reforçada ao preço unitário de R$ 500,00. Em 2001, vendeu 800 unidades do mesmo capacete ao preço unitário de R$ 600,00. O valor relativo da venda em 2001 foi de: Então, em 2001 o valor das vendas foi 4% (96-100) inferior ao de 2000. // Veja quais os principais índices brasileiros Clique nos botões para saber mais IPC – Índice de Preços ao Consumidor. ICV/Dieese – Elaborado pelo Departamento Intersindical de Estatística e Estudos Socioeconômicos. Mede a variação de aproximadamente 350 produtos, pesquisados em famílias paulistanas com renda mensal de um a 30 salários mínimos. IPCA – Índice de Preços ao Consumidor Ampliado – Mede o preço médio de bens de consumo e serviços, e reflete o custo de vida de famílias com renda mensal de um a 40 salários mínimos. INPC – Índice Nacional de Preços ao Consumidor – É calculado com base nos preços de 11 regiões metropolitanas. IPA – Índice de Preços por Atacado – Utiliza, para cálculo, 430 produtos com preços atualizados mensalmente. IGP – Índice Geral de Preços – É calculado pela FGV (Fundação Getúlio Vargas), e utiliza bens e serviços. MUDANÇA DE BASE DE UM NÚMERO ÍNDICE Qualquer número índice possui uma data base que servirá de ponto de partida para medirmos a variação de um certo período. Quando queremos trabalhar com bases diferentes, temos que primeiramente igualar esses índices a mesma base, isto é, para utilizá-los corretamente, temos que deixar as bases compatíveis. Portanto, podemos dizer que a finalidade de uma mudança de base é deixá-las em um mesmo padrão, para que possamos trabalhar com os índices de uma forma adequada. Para mudarmos números índices de uma base (a) para uma nova base (b), devemos fazer a aplicação de uma regra de três simples, ou seja, dividindo-se o número índice da série atual pelo número índice relativo a nova data. O procedimento, para simplificar seu entendimento, também pode ser realizado dividindo toda a série de números índices originais pelo número índice da nova base escolhida. No exemplo a seguir, tendo como base o ano de 2013, vamosmudar os índices da Tabela 1. Para o ano de 2011, teremos: novo índice = (100/113,86) x 100 = 87,83 Para o ano de 2012, teremos: novo índice = (109/113,86) x 100 = 95,84 Para o ano de 2013, teremos: novo índice = (113,86/113,86) x 100 = 100 Para o ano de 2014, teremos: novo índice = (116,69/113,86) x 100 = 102,49 Para o ano de 2015, teremos: novo índice = (126,53/113,86) x 100 = 111,13 Para o ano de 2016, teremos: novo índice = (133,20/113,86) x 100 = 116,99 Lesson 3 of 5 Índice de preço ao consumidor Em nosso dia a dia, lidamos com muitas diferenças de preços de vários produtos mas, além disso, com as diferenças de preço de um mesmo produto também, fato já consagrado em nossa economia. Para tentar frear um pouco essa desigualdade, foi criado um índice que teria como finalidade a harmonização de preços em todo país. Infelizmente, é sabido que tal objetivo nunca foi totalmente alcançado. CITANDO “O Sistema Nacional de Índices de Preços ao Consumidor – SNIPC produz contínua e sistematicamente o Índice Nacional de Preços ao Consumidor Amplo – IPCA que tem por objetivo medir a inflação de um conjunto de produtos e serviços comercializados no varejo, referentes ao consumo pessoal das famílias. Esta faixa de renda foi criada com o objetivo de garantir uma cobertura de 90% das famílias pertencentes às áreas urbanas de cobertura do Sistema Nacional de Índices de Preços ao Consumidor – SNIPC. Esse índice de preços tem como unidade de coleta estabelecimentos comerciais e de prestação de serviços, concessionárias de serviços públicos e internet e sua coleta estende-se, em geral, do dia 01 a 30 do mês de referência. Atualmente, a população-objetivo do IPCA abrange as famílias com rendimentos de 1 a 40 salários mínimos, qualquer que seja a fonte, residentes nas áreas urbanas das regiões de abrangência do SNIPC, as quais são: regiões metropolitanas de Belém, Fortaleza, Recife, Salvador, Belo Horizonte, Vitória, Rio de Janeiro, São Paulo, Curitiba, Porto Alegre, além do Distrito Federal e dos municípios de Goiânia e Campo Grande.” Fonte: IBGE. Acesso em: 07/03/2019. Já que sabemos um pouco mais sobre o que é IPCA, veja como ele influi em sua vida e no seu bolso. Tal índice mostra a variação de preços de mercado ao consumidor final. Tendo todos esses parâmetros em mãos, o Banco Central, em conjunto com o Conselho Monetário Nacional, tenta verificar se o custo de vida tem aumentado e se os governantes atingiram as metas de inflação predeterminadas. Com tudo isso, diversos investimentos podem ter seus rendimentos atrelados a esse índice, assim como alguns títulos, que têm seus rendimentos de acordo com a variação do IPCA somados a uma taxa prefixada. Suas contas também podem ser afetadas. O comércio e serviços, de um modo geral, reajustam seus preços com base na alta do índice e até mesmo contratos de aluguel podem ser reajustados pela variação do IPCA. Por esse motivo, é importantíssimo entender o que é IPCA, como ele afeta seu orçamento e o modo como você deve gerir seu dinheiro. DEFLAÇÃO Quando recebemos a notícia de que a inflação caiu, todos ficam contentes achando que esse fatídico índice está sob controle. Por isso, quando há a diminuição de preços, a impressão é de que a economia está melhor, e que podemos consumir mais. Porém, quando a deflação dura muito tempo, precisamos ficar em alerta. EXPLICANDO “A deflação acontece quando os preços dos produtos e serviços que circulam na economia caem. Ela pode ser pontual ou acontecer por um período mais longo. Como um termômetro que mede a temperatura do corpo, a deflação pode sinalizar que algo não vai bem na economia e que é preciso fazer um diagnóstico.” Fonte: G1, 2017. A deflação acontece quando os preços de produtos e serviços caem em determinado período. É um movimento contrário ao da inflação, quando os preços sobem. Quando os preços caem muito, as pessoas param de consumir, esperando que seu dinheiro valorize em um curto espaço de tempo. A recessão é um dos principais motivos da deflação prolongada. Quando consumimos menos, compramos menos, fazendo com que as empresas abaixem os preços. A deflação é tão ruim, ou de certa forma, até pior que a inflação alta quando isso se transforma em uma tendência. É simples explicar: quando os preços caem muito, deixamos de consumir, acreditando que o dinheiro valerá mais no futuro. Esse fato gera uma nova queda de preços, estagnando as vendas e puxando a economia para baixo. Fonte: Wikimedia Commons. Acesso em: 08/03/2019. Recessão nos EUA derrubou os preços e gerou uma massa de desempregados. Fonte: Wikimedia Commons. Acesso em: 01/03/2019. EXPLICANDO Economistas afirmam que é necessário um tempo mínimo de um ano para o processo deflacionário. Para que esse processo ocorra, a queda nos preços precisa acontecer de forma geral e em vários itens, sequencialmente, não apenas em um ou outro mês. REGRESSÃO E CORRELAÇÃO A regressão linear é assim chamada porque consideramos que a relação entre as variáveis é uma função linear. É uma das formas primordiais de análise regressiva e usada em aplicações práticas. Este estudo acontece porque modelos dependentes de forma linear dos seus valores desconhecidos são mais fáceis de ajustar aos seus parâmetros do que os modelos não lineares, e as propriedades estatísticas dos valores resultantes são bem mais fáceis de serem determinadas. Observe o Gráfico 3: Esse gráfico é uma reta linear que demonstra a regressão entre dados de certos valores “X” com dados de valores “Y”. Por sua vez, a correlação “r”, em probabilidade e estatística, é a correlação, dependência ou associação a qualquer relacionamento estatístico entre duas variáveis. A correlação deve ser a relação dentro de um amplo rol de relações estatísticas, que possa envolver a dependência entre duas variáveis. Devemos levar muito a sério alguns conceitos na correlação, como: • A correlação sempre terá um valor entre 1 e -1; • A correlação positiva indica que as variáveis se movem juntas; • A correlação próxima a zero indica que as variáveis não estão relacionadas; • A correlação negativa mostra que as variáveis têm direção oposta. Podemos ter dois tipos de correlação: linear, quando é possível inserir uma reta entre as observações; ou não linear, quando não é possível inserir uma reta entre as observações. Observe alguns tipos de gráficos de correlação. Agora, vamos aprender como calcular o valor de “r”. Esse coeficiente serve apenas para padrões lineares: Vamos a um exemplo. A Tabela 2 a seguir nos permite observar os parâmetros de uma pesquisa com 10 famílias de uma certa comunidade. Agora, vamos calcular o coeficiente de correlação linear entre a renda familiar e a poupança. Chamaremos a renda de “Y” e a poupança de “X”, e calcularemos seus quadrados e o produto XY. X2 Y2 XY 16 100 40 79 225 105 25 144 60 400 4.900 1.400 400 6.400 1.600 900 10.000 3.00 64 400 160 64 900 240 9 100 30 225 3.600 900 • Calculando a somatória de “Y” = ƩY= 407 • Calculando a somatória de “X” = ƩX= 120 • Calculando a somatória de “Y²” = ƩY² = 26769 • Calculando a somatória de “X²” = ƩX²= 2152 Agora, usando a fórmula: R = (10 . 7535) – (120 . 407) = 0,9835 Podemos concluir, assim, que há uma grande correlação linear entre os valores e o sinal mostra que as variáveis andam no mesmo sentido. Lesson 4 of 5 Teoria da correlação Quando falamos da distribuição de valores de uma única variável, temos o objetivo de calcular as medidas de tendência central e variação. Mas,se levarmos em consideração duas ou mais variáveis, teremos uma nova questão a resolver, que diz respeito à relação entre elas. Em grande parte das pesquisas estatísticas, temos como meta estabelecer a existência ou não de relações entre uma ou mais variáveis. Apenas como exemplo, é deste modo que se realizam estudos para prever vendas futuras de um produto em relação a seu preço, ou a despesa de uma família com a escola e materiais escolares em relação à sua renda, ou o consumo de energia elétrica em uma casa em relação à quantidade de moradores etc. O melhor, ou ideal, seria que conseguíssemos estabelecer uma quantidade em relação de outra, mas é quase impossível. Na grande parte dos casos, devemos contentar-nos com a predição de médias, ou valores esperados. Deste modo, quando levarmos em consideração variáveis como massa corporal e altura, tabagismo e incidência de câncer, procuramos verificar se há alguma relação entre as variáveis de cada um dos itens e o grau dessa relação. A meta do estudo da correlação é a determinação do grau de relacionamento entre duas observações. A correlação mostra a intensidade, ou grau, de relação entre duas variáveis; a regressão nos dá uma equação que mostra o relacionamento em parâmetros matemáticos. MEDIDAS DE CORRELAÇÃO // Coeficiente de Correlação de Pearson O coeficiente de Pearson (r), também chamado de correlação linear ou “r” de Pearson, é o grau de relação entre duas variáveis quantitativas e mostra o nível de correlação entre -1 e 1. Quando o coeficiente de correlação se aproxima de 1, temos um aumento de uma variável, consequentemente o aumento da outra também, portanto, existe uma relação linear positiva. Porém, quando o coeficiente se aproxima de -1, podemos dizer que as variáveis são correlacionadas, então, nesse caso, quando o valor de uma variável aumenta, o da outra diminui. Tal fato é chamado de correlação inversa ou negativa. Quando temos um coeficiente de correlação próximo de zero, ele nos indica que não há relação entre as duas variáveis, e quanto mais eles se aproximam de 1 ou -1, mais forte é a relação. // Coeficiente de Correlação de Spearman Determinado pela letra grega rho (ρ), o coeficiente de Spearman é uma medida de correlação sem parâmetros, sendo avaliada no intervalo entre -1 e 1. De modo contrário do coeficiente de Pearson, o coeficiente de Spearman não tem como finalidade que a relações entre as variáveis sejam lineares, nem quantitativas, podendo ser utilizadas para verificar a relação entre variáveis medidas no parâmetro ordinal. // Coeficiente de Correlação de Kendall Representada pela letra grega tau (τ), o coeficiente de Kendall é uma medida que relaciona as variáveis ordinais. Uma das vantagens do coeficiente de Kendall em relação ao coeficiente de Spearman é que este pode ser usado para um coeficiente de correlação parcial. MÍNIMOS QUADRADOS Muitas vezes, é possível termos uma relação linear entre duas grandezas, sendo a aplicação do método dos mínimos quadrados uma tentativa de termos uma reta que pode ser relacionada aos dados obtidos. Na teoria, é um procedimento que tenta achar o mínimo de uma função de duas variáveis (coeficiente linear e angular da reta) elaborada do início da distância entre os pontos experimentais e os pontos de uma reta. CURIOSIDADE Segundo Oliveira Filho (2018), em 1809, Carl Friedrich Gauss (1777-1855) publicou um artigo demonstrando que a melhor maneira de determinar um parâmetro desconhecido de uma equação de condições é minimizando a soma dos quadrados dos resíduos, mais tarde chamado de mínimos quadrados por Adrien-Marie Legendre (1752-1833). Em abril de 1810, Pierre-Simon Laplace (1749-1827) apresenta no memoir da Academia de Paris a generalização de problemas com vários parâmetros desconhecidos. Um estudo de mínimos quadrados sempre é iniciado com a simplificação da soma: S = Ʃn ( y0 – yi)² em que: • yoi = valores observados de y • yi = valores calculados de y Sendo assim, os mínimos quadrados servem para minimizar os quadrados dos restos. Os restos podem ser normatizados pela quantidade de pontos ou pela soma dos pesos utilizados. // Método dos mínimos quadrados Podemos aplicar este estudo no caso da regressão linear, em que adaptamos pontos obtidos e valores dados a uma reta, que será a reta que diminui a soma quadrática das diferenças entre os valores conhecidos e os valores da reta. Neste caso, tentamos encontrar a função do tipo a + bx, que é a reta que melhor representa os valores dados. Podemos pensar também em outro caso. Apesar de conhecermos a função, não apenas em alguns pontos, mas em todo seu intervalo, teremos como objetivo aproximar essa função de outras funções de uma outra classe, que seja melhor para desenvolver nosso trabalho. Por exemplo: Vamos calcular a melhor reta que se aproxime da função sin(x) no intervalo [0, 1] ... Vamos considerar um conjunto de pontos x0 a xn relacionando, respectivamente, os valores f(x0) a f(xn). Devemos agora considerar uma classe de funções, dentre as quais vamos encontrar a que melhor se aproxima daquele conjunto de valores, nos pontos dados. g(x) = a0f0(x) + ... + amfm(x) Sendo que f0 e fm são funções independentes. Determinando os parâmetros a0 a am sendo que a soma quadrática das diferenças entre os f(xi) e os g(xi) seja mínima. Introduzir a distância || f – g ||em que || u ||2 = Ʃn u(xi)2 i = 0 que está relacionada ao produto interno (u, v) = Ʃn u(xi) v(xi) i = 0 A regra e o produto interno estão definidos para funções que podem assumir qualquer valor nos pontos dados. Devemos trabalhar com essas ideias, pois o que vamos ver em seguida será o mesmo do caso contínuo, apenas trocando a regra e o produto interno. Estudaremos apenas os somatórios, pois o caso de integral é baseado no estudo integrais e derivadas, não abordados aqui. Pretendemos encontrar apenas os parâmetros a0 , ... , an que minimizem a distância entre f e g. Q = || f – g ||2 = (f – g , f – g) ERRO PADRÃO Quando temos qualquer amostra de tamanho n, calculamos a média aritmética. Se fizermos uma outra amostra aleatória, a média aritmética calculada será diferente da média anterior. Devemos calcular a variabilidade das médias através de seu erro padrão, assim, o erro padrão mede a precisão da média populacional. Para isso, usamos a seguinte fórmula: Em que: • Sx = erro padrão • S = desvio padrão • n = tamanho da amostra // Exemplo Em uma população estudada, calculamos um desvio padrão de 2,84 com uma amostra aleatória de 70 elementos. Se houver, qual será o erro padrão? Resolução: Este valor indica que a média pode variar 0,3394 para mais ou para menos. // Exemplo Ao obtermos um desvio padrão de 1,32 usando uma amostra aleatória contendo 121 elementos, com a média dessa amostra precisando ser de 6,25, devemos calcular o valor mais provável da média dos dados da pesquisa. Resolução: Primeiro calculamos o erro padrão: O valor mais provável é dado por: Ẍ = 6,25 ± 0,12 VARIAÇÃO EXPLICADA E NÃO EXPLICADA Toda variação explicada é igual a soma dos quadrados dos desvios explicados, isto é, ∑(yî – y̅)². Toda variação não explicada é igual a soma dos quadrados dos desvios não explicados, ou seja, ∑ei² = ∑(yi – ŷi)² = sq(â,b̂). Lesson 5 of 5 Equação da regressão Para se estimar o valor esperado, usa-se uma equação, que determina a relação entre ambas as variáveis. Y = α + βx + ε Em que: Y = Variável explicada; representa o que o modelo quer prever. α = Constante, que representará a interceptação da reta com o eixo vertical. βx = Representa a inclinação (coeficiente angular) em relação à variável independente “x”. x = Variável explicativa (independente); ε = Representa todos os fatores residuais mais os possíveis erros. O comportamento desse dado é aleatório. Paraque possamos usar essa fórmula, os erros devem satisfazer todas as hipóteses predeterminadas, assim como também terem distribuição normal determinadas. Mas, primeiro, vamos encontrar “r”: Exemplo: Com o passar do tempo, o desenvolvimento corporal do ser humano atinge seu auge com uma certa idade. A partir de uma certa etapa de nossa vida, infelizmente nosso corpo começa a mostrar sinais de desgaste. Selecionamos 18 mulheres, com idade entre 40 e 79 anos, e observamos em cada uma delas a idade (X) e a massa muscular (Y). Observamos no Gráfico 9 que há uma grande relação linear decrescente entre as variáveis, pois quando a massa muscular das pessoas diminui, a idade aumenta. Calcularemos, agora, o coeficiente de correlação linear entre X e Y. Chamamos as variáveis: Y = Massa Muscular e X = Idade n = 18 Se observarmos o resultado, notamos que temos uma grande correlação linear entre as variáveis. Percebemos que quando uma variável aumenta (idade), a outra diminui (massa), fato demonstrado pelo gráfico. Vamos encontrar uma reta de regressão que simbolize a relação entre as variáveis Y: massa muscular (dependente); e X: idade (independente). Portanto, a reta de regressão encontrada entre as variáveis (Y) em função (X) é Y = 148,218 – 1,027X Levando em consideração a reta encontrada, calcule a massa muscular média de mulheres com 50 anos. Y = α + βx + ε Y50 = β0 + β1X = 148,218 – 1,027(50) = 96,868 DIAGRAMA DE DISPERSÃO O diagrama de dispersão é uma ferramenta que tem grande importância para resolver possíveis problemas, mensurando a relação entre duas variáveis quantitativas, e variáveis que podem ser medidas e contadas. O diagrama de dispersão pode ser chamado de gráfico de dispersão, sendo uma das ferramentas que compõem a qualidade. É elaborado no plano cartesiano, relacionando a causa e efeito. Portanto, com esses dados relacionados, será possível estabelecer se neste tipo de gráfico há ou não uma relação de causa e efeito entre suas variáveis estudadas. Temos cinco tipos de correlações. Figura 1 correlação positiva Figura 2 correlação negativa Figura 3 correlação perfeita Figura 4 correlação forte Figura 5 correlação fraca Vamos usar um diagrama para poder observar se as duas variáveis estão relacionadas. Sendo assim, é possível medir a intensidade do relacionamento entre essas duas variáveis. EXPLICANDO Como montar um diagrama: 1º passo: determine e colete os dados que vão ser analisados, para a verificação da relação entre eles. 2º passo: aqui, é necessário construir os eixos vertical e horizontal do gráfico, sendo colocada a variável causa na horizontal e, na vertical, a variável efeito. 3º passo: esse passo deixa o gráfico mais completo. Coloque os dados complementares, como o nome dessas variáveis, o período da coleta etc. 4º passo: com esses dados e com o gráfico criado, una o “útil ao agradável” e ponha os dados no diagrama. 5º passo: chegamos ao último passo. Ele se dá com a análise dos dados e a procura da raiz do problema. O diagrama é uma importante ferramenta, porém, é preciso ter alguns cuidados! Lembre-se sobre a importância do uso do diagrama de dispersão no meio produtivo. Ele visa relacionar e analisar as variáveis de causa e efeito, sempre procurando enxergar o que há de errado com a produção. Para demostrar o conceito estudado, o Gráfico 11 é um diagrama que está relacionando notas de matemática (eixo horizontal) e notas de português (eixo vertical). Os pontos retratam um aluno específico, e mostra os valores das duas variáveis. Vamos ver as notas de Júlia. Sua nota de português é 9,5 (eixo vertical) e sua nota de matemática é 9,0 (eixo horizontal). Percebemos uma associação positiva entre as variáveis, no caso de Júlia (coordenadas 6;3). Ou seja, alunos com notas mais altas em matemática também tendem a ter notas mais altas em português. Obviamente, essa associação não é perfeita, mas é forte. ANÁLISE DE CORRELAÇÃO E REGRESSÃO Durante nosso estudo em estatística, vamos nos deparar com situações nas quais teremos de analisar o comportamento conjunto de uma ou mais variáveis. Em muitos casos, a explicação de um estudo de interesse pode estar correlacionado a vários fatores (variáveis) que influenciam de certo modo na ocorrência deste fenômeno. O desenvolvimento de duas variáveis quantitativas pode ser constatado através do gráfico de dispersão. Ao analisarmos dados que apresentam a existência de uma relação real entre duas variáveis, temos que achar uma função matemática que mostre esse relacionamento, ou seja, uma equação de regressão. Ao observarmos uma relação entre duas variáveis X e Y, devemos ter uma função que explique uma grande parte da variação de Y por X. Contudo, parte da variação de Y que X não explica será relacionada ao acaso, ou seja, a um erro qualquer. Estudando a variação de uma variável Y em função de uma variável X, dizemos que Y é a variável dependente e que X é a variável explanatória (ou independente). Se faz necessário algumas observações funcionais. • Em qualquer modelo de regressão linear, não teremos respostas exatas. Deste modo, para um determinado valor de x, espera-se uma média. • Quando fazemos a estimativa de uma variável com base em valores conhecidos da outra, essa estimativa deve ser cautelosa! Não podemos fazer qualquer levantamento dessa reta usando valores fora do contexto de dados. O grande erro de fazer qualquer levantamento fora do contexto é que a mesma relação pode não mais existir. • A ocorrência de uma correlação nada fala sobre a natureza da relação que possa existir entre as variáveis. Ao estudarmos o coeficiente de correlação, devemos saber que um valor grande de R não deve significar que X seja responsabilidade de Y ou vice-versa. O estudo da regressão indica apenas o nível de relacionamento matemático, se é que no exemplo estudado tenha algum. Para termos uma lógica de qualquer relação, teremos de estudar teorias externas não pertencentes à Estatística. Após toda leitura e entendimento que fizemos até agora, devemos saber que em n pontos observados, é teoricamente possível usarmos uma grande variedade de curvas. Como já vimos, o modelo linear nem sempre é o melhor; a representação gráfica dos dados às vezes demonstra que estes dados são melhores representados por curvas do que por uma reta. Então, é de suma importância que, em primeiro lugar, escolhamos o modelo que melhor se adapta ao nosso trabalho. Após a escolha do melhor modelo, outro fator importante da análise é o número de variáveis com o qual estamos trabalhando. Em muitos trabalhos, em vez de ser considerada somente uma variável independente, é de muita importância estudar a relação entre uma variável e um conjunto de variáveis. Agora é a hora de sintetizar tudo o que aprendemos nessa unidade. Vamos lá?! SINTETIZANDO É necessário um estudo acurado quando estamos lidando com as relações entre os dados de nossa pesquisa. É, então, de grande valia o bom conhecimento dos métodos e cálculos a serem usados nesse relacionamento. Na correlação e na regressão, devemos nos atentar aos cálculos matemáticos para que não sejamos surpreendidos por resultados não satisfatórios, por cálculos errados. Lembre-se sempre: a representação gráfica de um conjunto de dados nada mais é que a apresentação dos valores em um plano cartesiano, mas, o modelo escolhido deve ser representativo em relação ao que está acontecendo na prática. Por fim, essa análise de correlação deve ser uma ferramenta importante para os diferentes estudos, sendo uma das etapas para utilizarmos várias técnicas de análise em nosso trabalho. Se faz necessário destacar que dentre os principais modos operacionais que utilizam o coeficiente de correlação, estão a análise do comportamento das variáveis e a análise da função matemática quemostra essa relação. Neste trabalho apresentamos os métodos de análise de correlação, usando variáveis medidas. Os coeficientes de correlação simples utilizados foram: coeficiente linear de Pearson, coeficiente de relação real entre duas variáveis, coeficiente de correlação de Spearman e coeficiente de correlação de Kendall. Aproveite bem seus conhecimentos para desenvolver um ótimo trabalho, lembrando sempre que a Estatística é uma ferramenta para tornar nossa vida mais segura e confiável. Felicidades. VIDEOAULA REFERÊNCIAS BIBLIOGRÁFICAS BONJORNO, J. Matemática fundamental. São Paulo: FTD, 2008. BUSSAB, W.; MORETTIN, P. A. Estatística Básica. São Paulo: Saraiva, 2002. CENTURION, M. Conteúdo e metodologia da matemática. São Paulo: Scipione, 1994. EVES, H. Introdução à história da matemática. Trad. Hygino H. Domingues. Campinas: Ed. Unicamp, 2004. G1. Entenda o que é deflação e quando ela é um problema para a economia. 2017. Disponível em: <https://g1.globo.com/economia/noticia/entenda-o-que-e-deflacao-e-por-que- ela-e-um-problema-para-a-economia.ghtml>. Acesso em: 07/03/2019. IBGE - Instituto Brasileiro de Geografia e Estatística. Índice Nacional de Preços ao Consumidor Amplo - IPCA. Disponível em: <https://www.ibge.gov.br/estatisticas- novoportal/economicas/precos-e-custos/9256-indice-nacional-de-precos-ao-consumidor- amplo.html?=&t=o-que-e>. Acesso em: 07/03/2019. OLIVEIRA FILHO, K. S. Mínimos quadrados. 2018. Disponível em: <http://astro.if.ufrgs.br/minq/>. Acesso em: 07/03/2019. https://g1.globo.com/economia/noticia/entenda-o-que-e-deflacao-e-por-que-ela-e-um-problema-para-a-economia.ghtml https://g1.globo.com/economia/noticia/entenda-o-que-e-deflacao-e-por-que-ela-e-um-problema-para-a-economia.ghtml https://www.ibge.gov.br/estatisticas-novoportal/economicas/precos-e-custos/9256-indice-nacional-de-precos-ao-consumidor-amplo.html?=&t=o-que-e https://www.ibge.gov.br/estatisticas-novoportal/economicas/precos-e-custos/9256-indice-nacional-de-precos-ao-consumidor-amplo.html?=&t=o-que-e https://www.ibge.gov.br/estatisticas-novoportal/economicas/precos-e-custos/9256-indice-nacional-de-precos-ao-consumidor-amplo.html?=&t=o-que-e http://astro.if.ufrgs.br/minq/
Compartilhar