Buscar

unidade 4 estatística

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 28 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 28 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 28 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Lesson 1 of 5 
Objetivos 
UNIDADE 4. 
Construção de índices 
Marco Sandrini 
OBJETIVOS DA UNIDADE 
• Levar o aluno a coletar dados para pesquisa de forma correta para produção de 
dados que retratem a realidade do evento; 
• Fazer a correlação entre os índices encontrados; 
• Ser capaz de aplicar medidas qualitativas e quantitativas do evento; 
• Desenvolver medidas de variação de índices; 
• Interpretar as relações entre os índices. 
TÓPICOS DE ESTUDO 
Clique nos botões para saber mais 
Números índices 
– 
// Construção de índices simples e compostos 
// Mudança de base de um número índice 
Índice de preço ao consumidor 
– 
// Deflação 
// Regressão e correlação 
Teoria da correlação 
– 
// Medidas de correlação 
// Mínimos quadrados 
// Erro padrão 
// Variação explicada e não explicada 
Equação de regressão 
– 
// Diagrama de dispersão 
// Análise de correlação e regressão 
 
Lesson 2 of 5 
Números índices 
 
Você já deve ter ouvido falar ou leu em algum artigo sobre o tal “índice de preço ao 
consumidor”. Vamos agora, de um modo prático, desvendar esse notável valor e seus agregados, 
através do estudo dos números índices. 
Os números índices são muito usados em estatística, por serem medidas que vários ramos da 
Economia usam para comparar algumas variáveis, para que possamos obter uma análise 
comparativa delas. São muito usadas por engenheiros, economistas e administradores. Temos de 
destacar a importância que essas medidas representam no dia a dia das pessoas e nos lugares em 
que são usados. Teremos como base os números índices de Índice de Laspeyres, Paasche e 
Fisher, que são os mais utilizados. Essa comparação e análise são demonstradas em 
porcentagem, mostrando as variações significativas ocorridas ao longo do tempo. Por exemplo: 
o valor de mercado de um carro hoje em comparação ao preço de seis meses atrás. 
Por meio dos números índices, podemos fazer análises e comparações entre variáveis 
importantes na Economia, como as relacionadas aos preços e qualidade de matérias-primas, 
preços de artigos prontos, quantidade de produtos, valor de um certo produto no atacado e no 
varejo, valor relativo de produção, entre outras. No Gráfico 1, podemos ver um exemplo de 
comparação da quantidade de habitantes de uma certa província, que vivem na capital ou ao seu 
redor. 
 
 
Os principais índices financeiros brasileiros são: Balança Comercial, BTNF, Caderneta de 
Poupança, Dólar, Euro, Risco País, FGTS, ICV, IGP-DI, IGP-M, INCC-DI, INPC, IPC-DI, 
IPCA, Salário Mínimo, Taxa Selic, TJLP, TR, entre outros. 
Existem três classificações de números índices: índice de preço, quantidade e valor. Os números 
índices, como veremos a seguir, dividem-se em números índices simples, para o estudo de 
apenas um produto, e números índices compostos, para o estudo de mais de um produto. 
CONSTRUÇÃO DE ÍNDICES SIMPLES E COMPOSTOS 
 
Números índices demonstram a variação de um só produto ou outro tipo de variável durante dois 
ou mais períodos. Calculamos a razão do preço, quantidade ou valor em espaço de tempo 
determinado para o correspondente preço, quantidade ou valor. Não podemos esquecer de levar 
em consideração a principal limitação dos índices simples, que são os tópicos isolados, sobre os 
quais precisamos calcular variações para um grupo em sua totalidade. Apenas um item é levado 
em consideração, por exemplo, a análise de inflação de um produto em um determinado espaço 
de tempo. 
Vamos trabalhar com número índice composto quando um grupo de itens é avaliado no mesmo 
espaço de tempo. Como exemplo, a variação de preços dos aluguéis em um ano, ou alguma 
outra variação geral de um grupo de itens cujos valores podem aumentar, diminuir ou 
permanecer estáveis. São eles: 
• 1 
Índice de preço; 
• 2 
Índice de quantidade; 
• 3 
Índice de valor. 
Índices de preços são relacionados com o preço de um produto em uma determinada data (época 
dada), em comparação com o preço do mesmo produto em uma outra data (época básica). O 
índice de quantidade é o que usamos para fazer as comparações entre as quantidades produzidas, 
vendidas ou consumidas. Esse índice é um demonstrativo das alterações dos preços em relação 
às quantidades em datas diferentes. Para tal cálculo, teremos os seguintes dados: 
Clique nos botões para saber mais 
0 
– 
Época básica ou época de referência. 
t 
– 
Época atual dada no problema. 
P0 
– 
Preço do produto no tempo inicial “0”. 
Pt 
– 
Preço do produto no tempo solicitado “t”. 
Q0 
– 
Quantidade do produto no tempo inicial “0”. 
Qt 
– 
Quantidade do produto no tempo solicitado “t”. 
V0 
– 
P0 x Q0. Valor do produto no tempo inicial “t”. 
Vt 
– 
Pt x Qt. Valor do produto no tempo solicitado “t”. 
 
 
 
// Exemplo relativo a preço 
O valor de uma caneta, em 1999, era de R$ 1,20, e em 2000 subiu para R$ 1,38. Tendo por base 
o ano 1999, calcule o valor relativo em 2000. 
Solução: 
O ano base sempre corresponderá ao índice igual a 100. Os demais apresentarão, portanto, 
valores que flutuaram em torno de 100. 
Período base (0) = 1999 
Período atual (t) = 2000 
 
Analisamos esse resultado do seguinte modo: em 2000 houve um aumento de 15% (115-100) no 
preço do artigo, com relação ao preço do mesmo artigo em 1999. 
Se P2000 = 1,02 (1,30 – 1,28) e P1999 = 1,20, o preço relativo seria: 
 
Nesse caso, em 2000 o preço da caneta teria apresentado um valor 15% (85-100) inferior ao ano 
de 1999. 
// Exemplo relativo à quantidade 
A Companhia Siderúrgica Nacional (CSN) produziu 46 toneladas de aço em 1999 e 69 
toneladas em 2000. Tomando-se como base a quantidade relativa de 1999, qual será a 
quantidade relativa a 2000? 
 
 
No ano de 2000, a CSN aumentou a produção em 50% (150-100) em relação a 1999. 
// Exemplo relativo a valor 
Certa rede de acessórios para motos vendeu, em 2000, 1000 capacetes de fibra de carbono 
reforçada ao preço unitário de R$ 500,00. Em 2001, vendeu 800 unidades do mesmo capacete 
ao preço unitário de R$ 600,00. O valor relativo da venda em 2001 foi de: 
 
Então, em 2001 o valor das vendas foi 4% (96-100) inferior ao de 2000. 
// Veja quais os principais índices brasileiros 
Clique nos botões para saber mais 
IPC 
– 
Índice de Preços ao Consumidor. 
ICV/Dieese 
– 
Elaborado pelo Departamento Intersindical de Estatística e Estudos Socioeconômicos. 
Mede a variação de aproximadamente 350 produtos, pesquisados em famílias 
paulistanas com renda mensal de um a 30 salários mínimos. 
IPCA 
– 
Índice de Preços ao Consumidor Ampliado – Mede o preço médio de bens de consumo 
e serviços, e reflete o custo de vida de famílias com renda mensal de um a 40 salários 
mínimos. 
INPC 
– 
Índice Nacional de Preços ao Consumidor – É calculado com base nos preços de 11 
regiões metropolitanas. 
IPA 
– 
Índice de Preços por Atacado – Utiliza, para cálculo, 430 produtos com preços 
atualizados mensalmente. 
IGP 
– 
Índice Geral de Preços – É calculado pela FGV (Fundação Getúlio Vargas), e utiliza 
bens e serviços. 
MUDANÇA DE BASE DE UM NÚMERO ÍNDICE 
Qualquer número índice possui uma data base que servirá de ponto de partida para medirmos a 
variação de um certo período. Quando queremos trabalhar com bases diferentes, temos que 
primeiramente igualar esses índices a mesma base, isto é, para utilizá-los corretamente, temos 
que deixar as bases compatíveis. Portanto, podemos dizer que a finalidade de uma mudança de 
base é deixá-las em um mesmo padrão, para que possamos trabalhar com os índices de uma 
forma adequada. 
Para mudarmos números índices de uma base (a) para uma nova base (b), devemos fazer a 
aplicação de uma regra de três simples, ou seja, dividindo-se o número índice da série atual pelo 
número índice relativo a nova data. O procedimento, para simplificar seu entendimento, também 
pode ser realizado dividindo toda a série de números índices originais pelo número índice da 
nova base escolhida. No exemplo a seguir, tendo como base o ano de 2013, vamosmudar os 
índices da Tabela 1. 
 
Para o ano de 2011, teremos: novo índice = (100/113,86) x 100 = 87,83 
Para o ano de 2012, teremos: novo índice = (109/113,86) x 100 = 95,84 
Para o ano de 2013, teremos: novo índice = (113,86/113,86) x 100 = 100 
Para o ano de 2014, teremos: novo índice = (116,69/113,86) x 100 = 102,49 
Para o ano de 2015, teremos: novo índice = (126,53/113,86) x 100 = 111,13 
Para o ano de 2016, teremos: novo índice = (133,20/113,86) x 100 = 116,99 
 
 
 
Lesson 3 of 5 
Índice de preço ao consumidor 
 
Em nosso dia a dia, lidamos com muitas diferenças de preços de vários produtos mas, além 
disso, com as diferenças de preço de um mesmo produto também, fato já consagrado em nossa 
economia. Para tentar frear um pouco essa desigualdade, foi criado um índice que teria como 
finalidade a harmonização de preços em todo país. Infelizmente, é sabido que tal objetivo nunca 
foi totalmente alcançado. 
 
CITANDO 
“O Sistema Nacional de Índices de Preços ao Consumidor – SNIPC produz contínua e 
sistematicamente o Índice Nacional de Preços ao Consumidor Amplo – IPCA que tem 
por objetivo medir a inflação de um conjunto de produtos e serviços comercializados 
no varejo, referentes ao consumo pessoal das famílias. Esta faixa de renda foi criada 
com o objetivo de garantir uma cobertura de 90% das famílias pertencentes às áreas 
urbanas de cobertura do Sistema Nacional de Índices de Preços ao Consumidor – 
SNIPC. 
Esse índice de preços tem como unidade de coleta estabelecimentos comerciais e de 
prestação de serviços, concessionárias de serviços públicos e internet e sua coleta 
estende-se, em geral, do dia 01 a 30 do mês de referência. 
Atualmente, a população-objetivo do IPCA abrange as famílias com rendimentos de 1 
a 40 salários mínimos, qualquer que seja a fonte, residentes nas áreas urbanas das 
regiões de abrangência do SNIPC, as quais são: regiões metropolitanas de Belém, 
Fortaleza, Recife, Salvador, Belo Horizonte, Vitória, Rio de Janeiro, São Paulo, 
Curitiba, Porto Alegre, além do Distrito Federal e dos municípios de Goiânia e Campo 
Grande.” Fonte: IBGE. Acesso em: 
07/03/2019. 
Já que sabemos um pouco mais sobre o que é IPCA, veja como ele influi em sua vida e no seu 
bolso. Tal índice mostra a variação de preços de mercado ao consumidor final. Tendo todos 
esses parâmetros em mãos, o Banco Central, em conjunto com o Conselho Monetário Nacional, 
tenta verificar se o custo de vida tem aumentado e se os governantes atingiram as metas de 
inflação predeterminadas. Com tudo isso, diversos investimentos podem ter seus rendimentos 
atrelados a esse índice, assim como alguns títulos, que têm seus rendimentos de acordo com a 
variação do IPCA somados a uma taxa prefixada. 
Suas contas também podem ser afetadas. O comércio e serviços, de um modo geral, reajustam 
seus preços com base na alta do índice e até mesmo contratos de aluguel podem ser reajustados 
pela variação do IPCA. Por esse motivo, é importantíssimo entender o que é IPCA, como ele 
afeta seu orçamento e o modo como você deve gerir seu dinheiro. 
DEFLAÇÃO 
Quando recebemos a notícia de que a inflação caiu, todos ficam contentes achando que esse 
fatídico índice está sob controle. Por isso, quando há a diminuição de preços, a impressão é de 
que a economia está melhor, e que podemos consumir mais. Porém, quando a deflação dura 
muito tempo, precisamos ficar em alerta. 
 
EXPLICANDO 
“A deflação acontece quando os preços dos produtos e serviços que circulam na 
economia caem. Ela pode ser pontual ou acontecer por um período mais longo. Como 
um termômetro que mede a temperatura do corpo, a deflação pode sinalizar que algo 
não vai bem na economia e que é preciso fazer um diagnóstico.” 
Fonte: G1, 2017. 
A deflação acontece quando os preços de produtos e serviços caem em determinado período. É 
um movimento contrário ao da inflação, quando os preços sobem. Quando os preços caem 
muito, as pessoas param de consumir, esperando que seu dinheiro valorize em um curto espaço 
de tempo. A recessão é um dos principais motivos da deflação prolongada. Quando consumimos 
menos, compramos menos, fazendo com que as empresas abaixem os preços. 
A deflação é tão ruim, ou de certa forma, até pior que a inflação alta quando isso se transforma 
em uma tendência. É simples explicar: quando os preços caem muito, deixamos de consumir, 
acreditando que o dinheiro valerá mais no futuro. Esse fato gera uma nova queda de preços, 
estagnando as vendas e puxando a economia para baixo. 
 
 
Fonte: Wikimedia Commons. Acesso em: 08/03/2019. 
 
 
Recessão nos EUA derrubou os preços e gerou uma massa de desempregados. 
Fonte: Wikimedia Commons. Acesso em: 01/03/2019. 
 
EXPLICANDO 
Economistas afirmam que é necessário um tempo mínimo de um ano para o processo 
deflacionário. Para que esse processo ocorra, a queda nos preços precisa acontecer de 
forma geral e em vários itens, sequencialmente, não apenas em um ou outro mês. 
REGRESSÃO E CORRELAÇÃO 
A regressão linear é assim chamada porque consideramos que a relação entre as variáveis é uma 
função linear. É uma das formas primordiais de análise regressiva e usada em aplicações 
práticas. Este estudo acontece porque modelos dependentes de forma linear dos seus valores 
desconhecidos são mais fáceis de ajustar aos seus parâmetros do que os modelos não lineares, e 
as propriedades estatísticas dos valores resultantes são bem mais fáceis de serem determinadas. 
Observe o Gráfico 3: 
 
 
Esse gráfico é uma reta linear que demonstra a regressão entre dados de certos valores “X” com 
dados de valores “Y”. Por sua vez, a correlação “r”, em probabilidade e estatística, é a 
correlação, dependência ou associação a qualquer relacionamento estatístico entre duas 
variáveis. A correlação deve ser a relação dentro de um amplo rol de relações estatísticas, que 
possa envolver a dependência entre duas variáveis. Devemos levar muito a sério alguns 
conceitos na correlação, como: 
• A correlação sempre terá um valor entre 1 e -1; 
• A correlação positiva indica que as variáveis se movem juntas; 
• A correlação próxima a zero indica que as variáveis não estão relacionadas; 
• A correlação negativa mostra que as variáveis têm direção oposta. 
Podemos ter dois tipos de correlação: linear, quando é possível inserir uma reta entre as 
observações; ou não linear, quando não é possível inserir uma reta entre as observações. 
Observe alguns tipos de gráficos de correlação. 
 
 
 
 
Agora, vamos aprender como calcular o valor de “r”. Esse coeficiente serve apenas para padrões 
lineares: 
 
Vamos a um exemplo. A Tabela 2 a seguir nos permite observar os parâmetros de uma pesquisa 
com 10 famílias de uma certa comunidade. 
 
Agora, vamos calcular o coeficiente de correlação linear entre a renda familiar e a poupança. 
Chamaremos a renda de “Y” e a poupança de “X”, e calcularemos seus quadrados e o produto 
XY. 
X2 Y2 XY 
16 100 40 
79 225 105 
25 144 60 
400 4.900 1.400 
400 6.400 1.600 
900 10.000 3.00 
64 400 160 
64 900 240 
9 100 30 
225 3.600 900 
• Calculando a somatória de “Y” = ƩY= 407 
• Calculando a somatória de “X” = ƩX= 120 
• Calculando a somatória de “Y²” = ƩY² = 26769 
• Calculando a somatória de “X²” = ƩX²= 2152 
Agora, usando a fórmula: 
 
R = (10 . 7535) – (120 . 407) = 0,9835 
Podemos concluir, assim, que há uma grande correlação linear entre os valores e o sinal mostra 
que as variáveis andam no mesmo sentido. 
 
 
Lesson 4 of 5 
Teoria da correlação 
 
Quando falamos da distribuição de valores de uma única variável, temos o objetivo de calcular 
as medidas de tendência central e variação. Mas,se levarmos em consideração duas ou mais 
variáveis, teremos uma nova questão a resolver, que diz respeito à relação entre elas. 
Em grande parte das pesquisas estatísticas, temos como meta estabelecer a existência ou não de 
relações entre uma ou mais variáveis. Apenas como exemplo, é deste modo que se realizam 
estudos para prever vendas futuras de um produto em relação a seu preço, ou a despesa de uma 
família com a escola e materiais escolares em relação à sua renda, ou o consumo de energia 
elétrica em uma casa em relação à quantidade de moradores etc. 
 
O melhor, ou ideal, seria que conseguíssemos 
estabelecer uma quantidade em relação de 
outra, mas é quase impossível. Na grande parte 
dos casos, devemos contentar-nos com a 
predição de médias, ou valores esperados. 
Deste modo, quando levarmos em consideração variáveis como massa corporal e altura, 
tabagismo e incidência de câncer, procuramos verificar se há alguma relação entre as variáveis 
de cada um dos itens e o grau dessa relação. A meta do estudo da correlação é a determinação do 
grau de relacionamento entre duas observações. A correlação mostra a intensidade, ou grau, de 
relação entre duas variáveis; a regressão nos dá uma equação que mostra o relacionamento em 
parâmetros matemáticos. 
MEDIDAS DE CORRELAÇÃO 
// Coeficiente de Correlação de Pearson 
O coeficiente de Pearson (r), também chamado de correlação linear ou “r” de Pearson, é o grau 
de relação entre duas variáveis quantitativas e mostra o nível de correlação entre -1 e 1. 
Quando o coeficiente de correlação se aproxima de 1, temos um aumento de uma variável, 
consequentemente o aumento da outra também, portanto, existe uma relação linear positiva. 
Porém, quando o coeficiente se aproxima de -1, podemos dizer que as variáveis são 
correlacionadas, então, nesse caso, quando o valor de uma variável aumenta, o da outra diminui. 
Tal fato é chamado de correlação inversa ou negativa. 
Quando temos um coeficiente de correlação próximo de zero, ele nos indica que não há relação 
entre as duas variáveis, e quanto mais eles se aproximam de 1 ou -1, mais forte é a relação. 
 
// Coeficiente de Correlação de Spearman 
Determinado pela letra grega rho (ρ), o coeficiente de Spearman é uma medida de correlação 
sem parâmetros, sendo avaliada no intervalo entre -1 e 1. De modo contrário do coeficiente de 
Pearson, o coeficiente de Spearman não tem como finalidade que a relações entre as variáveis 
sejam lineares, nem quantitativas, podendo ser utilizadas para verificar a relação entre variáveis 
medidas no parâmetro ordinal. 
 
 
// Coeficiente de Correlação de Kendall 
Representada pela letra grega tau (τ), o coeficiente de Kendall é uma medida que relaciona as 
variáveis ordinais. Uma das vantagens do coeficiente de Kendall em relação ao coeficiente de 
Spearman é que este pode ser usado para um coeficiente de correlação parcial. 
MÍNIMOS QUADRADOS 
 
Muitas vezes, é possível termos uma relação linear entre duas grandezas, sendo a aplicação do 
método dos mínimos quadrados uma tentativa de termos uma reta que pode ser relacionada aos 
dados obtidos. Na teoria, é um procedimento que tenta achar o mínimo de uma função de duas 
variáveis (coeficiente linear e angular da reta) elaborada do início da distância entre os pontos 
experimentais e os pontos de uma reta. 
 
CURIOSIDADE 
Segundo Oliveira Filho (2018), em 1809, Carl Friedrich Gauss (1777-1855) publicou 
um artigo demonstrando que a melhor maneira de determinar um parâmetro 
desconhecido de uma equação de condições é minimizando a soma dos quadrados dos 
resíduos, mais tarde chamado de mínimos quadrados por Adrien-Marie Legendre 
(1752-1833). Em abril de 1810, Pierre-Simon Laplace (1749-1827) apresenta no 
memoir da Academia de Paris a generalização de problemas com vários parâmetros 
desconhecidos. 
Um estudo de mínimos quadrados sempre é iniciado com a simplificação da soma: 
S = Ʃn ( y0 – yi)² 
em que: 
• yoi = valores observados de y 
• yi = valores calculados de y 
Sendo assim, os mínimos quadrados servem para minimizar os quadrados dos restos. Os restos 
podem ser normatizados pela quantidade de pontos ou pela soma dos pesos utilizados. 
 
 
// Método dos mínimos quadrados 
Podemos aplicar este estudo no caso da regressão linear, em que adaptamos pontos obtidos e 
valores dados a uma reta, que será a reta que diminui a soma quadrática das diferenças entre os 
valores conhecidos e os valores da reta. 
 
 
Neste caso, tentamos encontrar a função do tipo a + bx, que é a reta que melhor representa os 
valores dados. Podemos pensar também em outro caso. Apesar de conhecermos a função, não 
apenas em alguns pontos, mas em todo seu intervalo, teremos como objetivo aproximar essa 
função de outras funções de uma outra classe, que seja melhor para desenvolver nosso trabalho. 
Por exemplo: 
Vamos calcular a melhor reta que se aproxime da função sin(x) no intervalo [0, 1] ... 
 
 
Vamos considerar um conjunto de pontos x0 a xn relacionando, respectivamente, os valores f(x0) 
a f(xn). Devemos agora considerar uma classe de funções, dentre as quais vamos encontrar a que 
melhor se aproxima daquele conjunto de valores, nos pontos dados. 
g(x) = a0f0(x) + ... + amfm(x) 
Sendo que f0 e fm são funções independentes. 
Determinando os parâmetros a0 a am sendo que a soma quadrática das diferenças entre os f(xi) e 
os g(xi) seja mínima. 
Introduzir a distância || f – g ||em que 
|| u ||2 = Ʃn u(xi)2 
i = 0 
que está relacionada ao produto interno 
 
(u, v) = Ʃn u(xi) v(xi) 
i = 0 
A regra e o produto interno estão definidos para funções que podem assumir qualquer valor nos 
pontos dados. Devemos trabalhar com essas ideias, pois o que vamos ver em seguida será o 
mesmo do caso contínuo, apenas trocando a regra e o produto interno. 
Estudaremos apenas os somatórios, pois o caso de integral é baseado no 
estudo integrais e derivadas, não abordados aqui. 
Pretendemos encontrar apenas os parâmetros a0 , ... , an que minimizem a distância entre f e g. 
Q = || f – g ||2 = (f – g , f – g) 
 
ERRO PADRÃO 
Quando temos qualquer amostra de tamanho n, calculamos a média aritmética. Se fizermos uma 
outra amostra aleatória, a média aritmética calculada será diferente da média anterior. Devemos 
calcular a variabilidade das médias através de seu erro padrão, assim, o erro padrão mede a 
precisão da média populacional. Para isso, usamos a seguinte fórmula: 
 
Em que: 
• Sx = erro padrão 
• S = desvio padrão 
• n = tamanho da amostra 
// Exemplo 
Em uma população estudada, calculamos um desvio padrão de 2,84 com uma amostra aleatória 
de 70 elementos. Se houver, qual será o erro padrão? 
Resolução: 
 
Este valor indica que a média pode variar 0,3394 para mais ou para menos. 
// Exemplo 
Ao obtermos um desvio padrão de 1,32 usando uma amostra aleatória contendo 121 elementos, 
com a média dessa amostra precisando ser de 6,25, devemos calcular o valor mais provável da 
média dos dados da pesquisa. 
 Resolução: 
Primeiro calculamos o erro padrão: 
 
O valor mais provável é dado por: 
Ẍ = 6,25 ± 0,12 
VARIAÇÃO EXPLICADA E NÃO EXPLICADA 
Toda variação explicada é igual a soma dos quadrados dos desvios explicados, isto é, 
∑(yî – y̅)². 
Toda variação não explicada é igual a soma dos quadrados dos desvios não explicados, ou seja, 
∑ei² = ∑(yi – ŷi)² = sq(â,b̂). 
 
 
 
Lesson 5 of 5 
Equação da regressão 
Para se estimar o valor esperado, usa-se uma equação, que determina a relação entre ambas as 
variáveis. 
Y = α + βx + ε 
Em que: 
Y = Variável explicada; representa o que o modelo quer prever. 
α = Constante, que representará a interceptação da reta com o eixo vertical. 
βx = Representa a inclinação (coeficiente angular) em relação à variável independente “x”. 
x = Variável explicativa (independente); 
ε = Representa todos os fatores residuais mais os possíveis erros. O comportamento desse dado é 
aleatório. Paraque possamos usar essa fórmula, os erros devem satisfazer todas as hipóteses 
predeterminadas, assim como também terem distribuição normal determinadas. 
Mas, primeiro, vamos encontrar “r”: 
 
Exemplo: 
Com o passar do tempo, o desenvolvimento corporal do ser humano atinge seu auge com uma 
certa idade. A partir de uma certa etapa de nossa vida, infelizmente nosso corpo começa a 
mostrar sinais de desgaste. 
Selecionamos 18 mulheres, com idade entre 40 e 79 anos, e observamos em cada uma delas a 
idade (X) e a massa muscular (Y). 
 
 
 
Observamos no Gráfico 9 que há uma grande relação linear decrescente entre as variáveis, pois 
quando a massa muscular das pessoas diminui, a idade aumenta. 
Calcularemos, agora, o coeficiente de correlação linear entre X e Y. Chamamos as variáveis: Y 
= Massa Muscular e X = Idade n = 18 
 
Se observarmos o resultado, notamos que temos uma grande correlação linear entre as variáveis. 
Percebemos que quando uma variável aumenta (idade), a outra diminui (massa), fato 
demonstrado pelo gráfico. 
Vamos encontrar uma reta de regressão que simbolize a relação entre as variáveis Y: massa 
muscular (dependente); e X: idade (independente). 
 
Portanto, a reta de regressão encontrada entre as variáveis (Y) em função (X) é 
Y = 148,218 – 1,027X 
Levando em consideração a reta encontrada, calcule a massa muscular média de mulheres com 
50 anos. 
Y = α + βx + ε 
Y50 = β0 + β1X = 148,218 – 1,027(50) = 96,868 
DIAGRAMA DE DISPERSÃO 
O diagrama de dispersão é uma ferramenta que tem grande importância para resolver possíveis 
problemas, mensurando a relação entre duas variáveis quantitativas, e variáveis que podem ser 
medidas e contadas. O diagrama de dispersão pode ser chamado de gráfico de dispersão, sendo 
uma das ferramentas que compõem a qualidade. É elaborado no plano cartesiano, relacionando a 
causa e efeito. Portanto, com esses dados relacionados, será possível estabelecer se neste tipo de 
gráfico há ou não uma relação de causa e efeito entre suas variáveis estudadas. Temos cinco 
tipos de correlações. 
 
Figura 1 correlação positiva 
 
Figura 2 correlação negativa 
 
Figura 3 correlação perfeita 
 
Figura 4 correlação forte 
 
Figura 5 correlação fraca 
 
Vamos usar um diagrama para poder observar se as duas variáveis estão relacionadas. Sendo 
assim, é possível medir a intensidade do relacionamento entre essas duas variáveis. 
 
EXPLICANDO 
Como montar um diagrama: 
1º passo: determine e colete os dados que vão ser analisados, para a verificação da 
relação entre eles. 
2º passo: aqui, é necessário construir os eixos vertical e horizontal do gráfico, sendo 
colocada a variável causa na horizontal e, na vertical, a variável efeito. 
3º passo: esse passo deixa o gráfico mais completo. Coloque os dados 
complementares, como o nome dessas variáveis, o período da coleta etc. 
4º passo: com esses dados e com o gráfico criado, una o “útil ao agradável” e ponha os 
dados no diagrama. 
5º passo: chegamos ao último passo. Ele se dá com a análise dos dados e a procura da 
raiz do problema. 
O diagrama é uma importante ferramenta, porém, é preciso ter alguns cuidados! 
Lembre-se sobre a importância do uso do diagrama de dispersão no meio produtivo. 
Ele visa relacionar e analisar as variáveis de causa e efeito, sempre procurando 
enxergar o que há de errado com a produção. 
 
 
Para demostrar o conceito estudado, o Gráfico 11 é um diagrama que está relacionando notas de 
matemática (eixo horizontal) e notas de português (eixo vertical). Os pontos retratam um aluno 
específico, e mostra os valores das duas variáveis. Vamos ver as notas de Júlia. Sua nota de 
português é 9,5 (eixo vertical) e sua nota de matemática é 9,0 (eixo horizontal). Percebemos 
uma associação positiva entre as variáveis, no caso de Júlia (coordenadas 6;3). Ou seja, alunos 
com notas mais altas em matemática também tendem a ter notas mais altas em português. 
Obviamente, essa associação não é perfeita, mas é forte. 
 
 
 
ANÁLISE DE CORRELAÇÃO E REGRESSÃO 
Durante nosso estudo em estatística, vamos nos deparar com situações nas quais teremos de 
analisar o comportamento conjunto de uma ou mais variáveis. Em muitos casos, a explicação de 
um estudo de interesse pode estar correlacionado a vários fatores (variáveis) que influenciam de 
certo modo na ocorrência deste fenômeno. O desenvolvimento de duas variáveis quantitativas 
pode ser constatado através do gráfico de dispersão. 
Ao analisarmos dados que apresentam a existência de uma relação real entre duas variáveis, 
temos que achar uma função matemática que mostre esse relacionamento, ou seja, uma equação 
de regressão. Ao observarmos uma relação entre duas variáveis X e Y, devemos ter uma função 
que explique uma grande parte da variação de Y por X. Contudo, parte da variação de Y que X 
não explica será relacionada ao acaso, ou seja, a um erro qualquer. Estudando a variação de uma 
variável Y em função de uma variável X, dizemos que Y é a variável dependente e que X é a 
variável explanatória (ou independente). Se faz necessário algumas observações funcionais. 
• Em qualquer modelo de regressão linear, não teremos respostas exatas. Deste 
modo, para um determinado valor de x, espera-se uma média. 
• Quando fazemos a estimativa de uma variável com base em valores conhecidos 
da outra, essa estimativa deve ser cautelosa! Não podemos fazer qualquer 
levantamento dessa reta usando valores fora do contexto de dados. O grande 
erro de fazer qualquer levantamento fora do contexto é que a mesma relação 
pode não mais existir. 
• A ocorrência de uma correlação nada fala sobre a natureza da relação que possa 
existir entre as variáveis. Ao estudarmos o coeficiente de correlação, devemos 
saber que um valor grande de R não deve significar que X seja responsabilidade 
de Y ou vice-versa. O estudo da regressão indica apenas o nível de 
relacionamento matemático, se é que no exemplo estudado tenha algum. Para 
termos uma lógica de qualquer relação, teremos de estudar teorias externas não 
pertencentes à Estatística. 
Após toda leitura e entendimento que fizemos até agora, devemos saber que em n pontos 
observados, é teoricamente possível usarmos uma grande variedade de curvas. Como já vimos, o 
modelo linear nem sempre é o melhor; a representação gráfica dos dados às vezes demonstra 
que estes dados são melhores representados por curvas do que por uma reta. Então, é de suma 
importância que, em primeiro lugar, escolhamos o modelo que melhor se adapta ao nosso 
trabalho. Após a escolha do melhor modelo, outro fator importante da análise é o número de 
variáveis com o qual estamos trabalhando. Em muitos trabalhos, em vez de ser considerada 
somente uma variável independente, é de muita importância estudar a relação entre uma variável 
e um conjunto de variáveis. 
 
Agora é a hora de sintetizar tudo o que 
aprendemos nessa unidade. Vamos lá?! 
SINTETIZANDO 
É necessário um estudo acurado quando estamos lidando com as relações entre os dados de 
nossa pesquisa. É, então, de grande valia o bom conhecimento dos métodos e cálculos a serem 
usados nesse relacionamento. 
Na correlação e na regressão, devemos nos atentar aos cálculos matemáticos para que não 
sejamos surpreendidos por resultados não satisfatórios, por cálculos errados. Lembre-se sempre: 
a representação gráfica de um conjunto de dados nada mais é que a apresentação dos valores em 
um plano cartesiano, mas, o modelo escolhido deve ser representativo em relação ao que está 
acontecendo na prática. Por fim, essa análise de correlação deve ser uma ferramenta importante 
para os diferentes estudos, sendo uma das etapas para utilizarmos várias técnicas de análise em 
nosso trabalho. 
Se faz necessário destacar que dentre os principais modos operacionais que utilizam o 
coeficiente de correlação, estão a análise do comportamento das variáveis e a análise da função 
matemática quemostra essa relação. 
Neste trabalho apresentamos os métodos de análise de correlação, usando variáveis medidas. Os 
coeficientes de correlação simples utilizados foram: coeficiente linear de Pearson, coeficiente de 
relação real entre duas variáveis, coeficiente de correlação de Spearman e coeficiente de 
correlação de Kendall. 
Aproveite bem seus conhecimentos para desenvolver um ótimo trabalho, lembrando sempre que 
a Estatística é uma ferramenta para tornar nossa vida mais segura e confiável. Felicidades. 
VIDEOAULA 
REFERÊNCIAS BIBLIOGRÁFICAS 
BONJORNO, J. Matemática fundamental. São Paulo: FTD, 2008. 
BUSSAB, W.; MORETTIN, P. A. Estatística Básica. São Paulo: Saraiva, 2002. 
CENTURION, M. Conteúdo e metodologia da matemática. São Paulo: Scipione, 1994. 
EVES, H. Introdução à história da matemática. Trad. Hygino H. Domingues. Campinas: Ed. 
Unicamp, 2004. 
G1. Entenda o que é deflação e quando ela é um problema para a economia. 2017. 
Disponível em: <https://g1.globo.com/economia/noticia/entenda-o-que-e-deflacao-e-por-que-
ela-e-um-problema-para-a-economia.ghtml>. Acesso em: 07/03/2019. 
IBGE - Instituto Brasileiro de Geografia e Estatística. Índice Nacional de Preços ao Consumidor 
Amplo - IPCA. Disponível em: <https://www.ibge.gov.br/estatisticas-
novoportal/economicas/precos-e-custos/9256-indice-nacional-de-precos-ao-consumidor-
amplo.html?=&t=o-que-e>. Acesso em: 07/03/2019. 
OLIVEIRA FILHO, K. S. Mínimos quadrados. 2018. Disponível em: 
<http://astro.if.ufrgs.br/minq/>. Acesso em: 07/03/2019. 
 
https://g1.globo.com/economia/noticia/entenda-o-que-e-deflacao-e-por-que-ela-e-um-problema-para-a-economia.ghtml
https://g1.globo.com/economia/noticia/entenda-o-que-e-deflacao-e-por-que-ela-e-um-problema-para-a-economia.ghtml
https://www.ibge.gov.br/estatisticas-novoportal/economicas/precos-e-custos/9256-indice-nacional-de-precos-ao-consumidor-amplo.html?=&t=o-que-e
https://www.ibge.gov.br/estatisticas-novoportal/economicas/precos-e-custos/9256-indice-nacional-de-precos-ao-consumidor-amplo.html?=&t=o-que-e
https://www.ibge.gov.br/estatisticas-novoportal/economicas/precos-e-custos/9256-indice-nacional-de-precos-ao-consumidor-amplo.html?=&t=o-que-e
http://astro.if.ufrgs.br/minq/

Continue navegando