unidade 4 estatística

•

UNINASSAU

Pollyana Ottwil

22/11/2020

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 28 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 28 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 9, do total de 28 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Contabilidade Geral

95.937 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

Lesson 1 of 5
Objetivos
UNIDADE 4.
Construção de índices
Marco Sandrini
OBJETIVOS DA UNIDADE
• Levar o aluno a coletar dados para pesquisa de forma correta para produção de
dados que retratem a realidade do evento;
• Fazer a correlação entre os índices encontrados;
• Ser capaz de aplicar medidas qualitativas e quantitativas do evento;
• Desenvolver medidas de variação de índices;
• Interpretar as relações entre os índices.
TÓPICOS DE ESTUDO
Clique nos botões para saber mais
Números índices
–
// Construção de índices simples e compostos
// Mudança de base de um número índice
Índice de preço ao consumidor
–
// Deflação
// Regressão e correlação
Teoria da correlação
–
// Medidas de correlação
// Mínimos quadrados
// Erro padrão
// Variação explicada e não explicada
Equação de regressão
–
// Diagrama de dispersão
// Análise de correlação e regressão

Lesson 2 of 5
Números índices

Você já deve ter ouvido falar ou leu em algum artigo sobre o tal “índice de preço ao
consumidor”. Vamos agora, de um modo prático, desvendar esse notável valor e seus agregados,
através do estudo dos números índices.
Os números índices são muito usados em estatística, por serem medidas que vários ramos da
Economia usam para comparar algumas variáveis, para que possamos obter uma análise
comparativa delas. São muito usadas por engenheiros, economistas e administradores. Temos de
destacar a importância que essas medidas representam no dia a dia das pessoas e nos lugares em
que são usados. Teremos como base os números índices de Índice de Laspeyres, Paasche e
Fisher, que são os mais utilizados. Essa comparação e análise são demonstradas em
porcentagem, mostrando as variações significativas ocorridas ao longo do tempo. Por exemplo:
o valor de mercado de um carro hoje em comparação ao preço de seis meses atrás.
Por meio dos números índices, podemos fazer análises e comparações entre variáveis
importantes na Economia, como as relacionadas aos preços e qualidade de matérias-primas,
preços de artigos prontos, quantidade de produtos, valor de um certo produto no atacado e no
varejo, valor relativo de produção, entre outras. No Gráfico 1, podemos ver um exemplo de
comparação da quantidade de habitantes de uma certa província, que vivem na capital ou ao seu
redor.

Os principais índices financeiros brasileiros são: Balança Comercial, BTNF, Caderneta de
Poupança, Dólar, Euro, Risco País, FGTS, ICV, IGP-DI, IGP-M, INCC-DI, INPC, IPC-DI,
IPCA, Salário Mínimo, Taxa Selic, TJLP, TR, entre outros.
Existem três classificações de números índices: índice de preço, quantidade e valor. Os números
índices, como veremos a seguir, dividem-se em números índices simples, para o estudo de
apenas um produto, e números índices compostos, para o estudo de mais de um produto.
CONSTRUÇÃO DE ÍNDICES SIMPLES E COMPOSTOS

Números índices demonstram a variação de um só produto ou outro tipo de variável durante dois
ou mais períodos. Calculamos a razão do preço, quantidade ou valor em espaço de tempo
determinado para o correspondente preço, quantidade ou valor. Não podemos esquecer de levar
em consideração a principal limitação dos índices simples, que são os tópicos isolados, sobre os
quais precisamos calcular variações para um grupo em sua totalidade. Apenas um item é levado
em consideração, por exemplo, a análise de inflação de um produto em um determinado espaço
de tempo.
Vamos trabalhar com número índice composto quando um grupo de itens é avaliado no mesmo
espaço de tempo. Como exemplo, a variação de preços dos aluguéis em um ano, ou alguma
outra variação geral de um grupo de itens cujos valores podem aumentar, diminuir ou
permanecer estáveis. São eles:
• 1
Índice de preço;
• 2
Índice de quantidade;
• 3
Índice de valor.
Índices de preços são relacionados com o preço de um produto em uma determinada data (época
dada), em comparação com o preço do mesmo produto em uma outra data (época básica). O
índice de quantidade é o que usamos para fazer as comparações entre as quantidades produzidas,
vendidas ou consumidas. Esse índice é um demonstrativo das alterações dos preços em relação
às quantidades em datas diferentes. Para tal cálculo, teremos os seguintes dados:
Clique nos botões para saber mais
0
–
Época básica ou época de referência.
t
–
Época atual dada no problema.
P0
–
Preço do produto no tempo inicial “0”.
Pt
–
Preço do produto no tempo solicitado “t”.
Q0
–
Quantidade do produto no tempo inicial “0”.
Qt
–
Quantidade do produto no tempo solicitado “t”.
V0
–
P0 x Q0. Valor do produto no tempo inicial “t”.
Vt
–
Pt x Qt. Valor do produto no tempo solicitado “t”.

// Exemplo relativo a preço
O valor de uma caneta, em 1999, era de R$ 1,20, e em 2000 subiu para R$ 1,38. Tendo por base
o ano 1999, calcule o valor relativo em 2000.
Solução:
O ano base sempre corresponderá ao índice igual a 100. Os demais apresentarão, portanto,
valores que flutuaram em torno de 100.
Período base (0) = 1999
Período atual (t) = 2000

Analisamos esse resultado do seguinte modo: em 2000 houve um aumento de 15% (115-100) no
preço do artigo, com relação ao preço do mesmo artigo em 1999.
Se P2000 = 1,02 (1,30 – 1,28) e P1999 = 1,20, o preço relativo seria:

Nesse caso, em 2000 o preço da caneta teria apresentado um valor 15% (85-100) inferior ao ano
de 1999.
// Exemplo relativo à quantidade
A Companhia Siderúrgica Nacional (CSN) produziu 46 toneladas de aço em 1999 e 69
toneladas em 2000. Tomando-se como base a quantidade relativa de 1999, qual será a
quantidade relativa a 2000?

No ano de 2000, a CSN aumentou a produção em 50% (150-100) em relação a 1999.
// Exemplo relativo a valor
Certa rede de acessórios para motos vendeu, em 2000, 1000 capacetes de fibra de carbono
reforçada ao preço unitário de R$ 500,00. Em 2001, vendeu 800 unidades do mesmo capacete
ao preço unitário de R$ 600,00. O valor relativo da venda em 2001 foi de:

Então, em 2001 o valor das vendas foi 4% (96-100) inferior ao de 2000.
// Veja quais os principais índices brasileiros
Clique nos botões para saber mais
IPC
–
Índice de Preços ao Consumidor.
ICV/Dieese
–
Elaborado pelo Departamento Intersindical de Estatística e Estudos Socioeconômicos.
Mede a variação de aproximadamente 350 produtos, pesquisados em famílias
paulistanas com renda mensal de um a 30 salários mínimos.
IPCA
–
Índice de Preços ao Consumidor Ampliado – Mede o preço médio de bens de consumo
e serviços, e reflete o custo de vida de famílias com renda mensal de um a 40 salários
mínimos.
INPC
–
Índice Nacional de Preços ao Consumidor – É calculado com base nos preços de 11
regiões metropolitanas.
IPA
–
Índice de Preços por Atacado – Utiliza, para cálculo, 430 produtos com preços
atualizados mensalmente.
IGP
–
Índice Geral de Preços – É calculado pela FGV (Fundação Getúlio Vargas), e utiliza
bens e serviços.
MUDANÇA DE BASE DE UM NÚMERO ÍNDICE
Qualquer número índice possui uma data base que servirá de ponto de partida para medirmos a
variação de um certo período. Quando queremos trabalhar com bases diferentes, temos que
primeiramente igualar esses índices a mesma base, isto é, para utilizá-los corretamente, temos
que deixar as bases compatíveis. Portanto, podemos dizer que a finalidade de uma mudança de
base é deixá-las em um mesmo padrão, para que possamos trabalhar com os índices de uma
forma adequada.
Para mudarmos números índices de uma base (a) para uma nova base (b), devemos fazer a
aplicação de uma regra de três simples, ou seja, dividindo-se o número índice da série atual pelo
número índice relativo a nova data. O procedimento, para simplificar seu entendimento, também
pode ser realizado dividindo toda a série de números índices originais pelo número índice da
nova base escolhida. No exemplo a seguir, tendo como base o ano de 2013, vamosmudar os
índices da Tabela 1.

Para o ano de 2011, teremos: novo índice = (100/113,86) x 100 = 87,83
Para o ano de 2012, teremos: novo índice = (109/113,86) x 100 = 95,84
Para o ano de 2013, teremos: novo índice = (113,86/113,86) x 100 = 100
Para o ano de 2014, teremos: novo índice = (116,69/113,86) x 100 = 102,49
Para o ano de 2015, teremos: novo índice = (126,53/113,86) x 100 = 111,13
Para o ano de 2016, teremos: novo índice = (133,20/113,86) x 100 = 116,99

Lesson 3 of 5
Índice de preço ao consumidor

Em nosso dia a dia, lidamos com muitas diferenças de preços de vários produtos mas, além
disso, com as diferenças de preço de um mesmo produto também, fato já consagrado em nossa
economia. Para tentar frear um pouco essa desigualdade, foi criado um índice que teria como
finalidade a harmonização de preços em todo país. Infelizmente, é sabido que tal objetivo nunca
foi totalmente alcançado.

CITANDO
“O Sistema Nacional de Índices de Preços ao Consumidor – SNIPC produz contínua e
sistematicamente o Índice Nacional de Preços ao Consumidor Amplo – IPCA que tem
por objetivo medir a inflação de um conjunto de produtos e serviços comercializados
no varejo, referentes ao consumo pessoal das famílias. Esta faixa de renda foi criada
com o objetivo de garantir uma cobertura de 90% das famílias pertencentes às áreas
urbanas de cobertura do Sistema Nacional de Índices de Preços ao Consumidor –
SNIPC.
Esse índice de preços tem como unidade de coleta estabelecimentos comerciais e de
prestação de serviços, concessionárias de serviços públicos e internet e sua coleta
estende-se, em geral, do dia 01 a 30 do mês de referência.
Atualmente, a população-objetivo do IPCA abrange as famílias com rendimentos de 1
a 40 salários mínimos, qualquer que seja a fonte, residentes nas áreas urbanas das
regiões de abrangência do SNIPC, as quais são: regiões metropolitanas de Belém,
Fortaleza, Recife, Salvador, Belo Horizonte, Vitória, Rio de Janeiro, São Paulo,
Curitiba, Porto Alegre, além do Distrito Federal e dos municípios de Goiânia e Campo
Grande.” Fonte: IBGE. Acesso em:
07/03/2019.
Já que sabemos um pouco mais sobre o que é IPCA, veja como ele influi em sua vida e no seu
bolso. Tal índice mostra a variação de preços de mercado ao consumidor final. Tendo todos
esses parâmetros em mãos, o Banco Central, em conjunto com o Conselho Monetário Nacional,
tenta verificar se o custo de vida tem aumentado e se os governantes atingiram as metas de
inflação predeterminadas. Com tudo isso, diversos investimentos podem ter seus rendimentos
atrelados a esse índice, assim como alguns títulos, que têm seus rendimentos de acordo com a
variação do IPCA somados a uma taxa prefixada.
Suas contas também podem ser afetadas. O comércio e serviços, de um modo geral, reajustam
seus preços com base na alta do índice e até mesmo contratos de aluguel podem ser reajustados
pela variação do IPCA. Por esse motivo, é importantíssimo entender o que é IPCA, como ele
afeta seu orçamento e o modo como você deve gerir seu dinheiro.
DEFLAÇÃO
Quando recebemos a notícia de que a inflação caiu, todos ficam contentes achando que esse
fatídico índice está sob controle. Por isso, quando há a diminuição de preços, a impressão é de
que a economia está melhor, e que podemos consumir mais. Porém, quando a deflação dura
muito tempo, precisamos ficar em alerta.

EXPLICANDO
“A deflação acontece quando os preços dos produtos e serviços que circulam na
economia caem. Ela pode ser pontual ou acontecer por um período mais longo. Como
um termômetro que mede a temperatura do corpo, a deflação pode sinalizar que algo
não vai bem na economia e que é preciso fazer um diagnóstico.”
Fonte: G1, 2017.
A deflação acontece quando os preços de produtos e serviços caem em determinado período. É
um movimento contrário ao da inflação, quando os preços sobem. Quando os preços caem
muito, as pessoas param de consumir, esperando que seu dinheiro valorize em um curto espaço
de tempo. A recessão é um dos principais motivos da deflação prolongada. Quando consumimos
menos, compramos menos, fazendo com que as empresas abaixem os preços.
A deflação é tão ruim, ou de certa forma, até pior que a inflação alta quando isso se transforma
em uma tendência. É simples explicar: quando os preços caem muito, deixamos de consumir,
acreditando que o dinheiro valerá mais no futuro. Esse fato gera uma nova queda de preços,
estagnando as vendas e puxando a economia para baixo.

Fonte: Wikimedia Commons. Acesso em: 08/03/2019.

Recessão nos EUA derrubou os preços e gerou uma massa de desempregados.
Fonte: Wikimedia Commons. Acesso em: 01/03/2019.

EXPLICANDO
Economistas afirmam que é necessário um tempo mínimo de um ano para o processo
deflacionário. Para que esse processo ocorra, a queda nos preços precisa acontecer de
forma geral e em vários itens, sequencialmente, não apenas em um ou outro mês.
REGRESSÃO E CORRELAÇÃO
A regressão linear é assim chamada porque consideramos que a relação entre as variáveis é uma
função linear. É uma das formas primordiais de análise regressiva e usada em aplicações
práticas. Este estudo acontece porque modelos dependentes de forma linear dos seus valores
desconhecidos são mais fáceis de ajustar aos seus parâmetros do que os modelos não lineares, e
as propriedades estatísticas dos valores resultantes são bem mais fáceis de serem determinadas.
Observe o Gráfico 3:

Esse gráfico é uma reta linear que demonstra a regressão entre dados de certos valores “X” com
dados de valores “Y”. Por sua vez, a correlação “r”, em probabilidade e estatística, é a
correlação, dependência ou associação a qualquer relacionamento estatístico entre duas
variáveis. A correlação deve ser a relação dentro de um amplo rol de relações estatísticas, que
possa envolver a dependência entre duas variáveis. Devemos levar muito a sério alguns
conceitos na correlação, como:
• A correlação sempre terá um valor entre 1 e -1;
• A correlação positiva indica que as variáveis se movem juntas;
• A correlação próxima a zero indica que as variáveis não estão relacionadas;
• A correlação negativa mostra que as variáveis têm direção oposta.
Podemos ter dois tipos de correlação: linear, quando é possível inserir uma reta entre as
observações; ou não linear, quando não é possível inserir uma reta entre as observações.
Observe alguns tipos de gráficos de correlação.

Agora, vamos aprender como calcular o valor de “r”. Esse coeficiente serve apenas para padrões
lineares:

Vamos a um exemplo. A Tabela 2 a seguir nos permite observar os parâmetros de uma pesquisa
com 10 famílias de uma certa comunidade.

Agora, vamos calcular o coeficiente de correlação linear entre a renda familiar e a poupança.
Chamaremos a renda de “Y” e a poupança de “X”, e calcularemos seus quadrados e o produto
XY.
X2 Y2 XY
16 100 40
79 225 105
25 144 60
400 4.900 1.400
400 6.400 1.600
900 10.000 3.00
64 400 160
64 900 240
9 100 30
225 3.600 900
• Calculando a somatória de “Y” = ƩY= 407
• Calculando a somatória de “X” = ƩX= 120
• Calculando a somatória de “Y²” = ƩY² = 26769
• Calculando a somatória de “X²” = ƩX²= 2152
Agora, usando a fórmula:

R = (10 . 7535) – (120 . 407) = 0,9835
Podemos concluir, assim, que há uma grande correlação linear entre os valores e o sinal mostra
que as variáveis andam no mesmo sentido.

Lesson 4 of 5
Teoria da correlação

Quando falamos da distribuição de valores de uma única variável, temos o objetivo de calcular
as medidas de tendência central e variação. Mas,se levarmos em consideração duas ou mais
variáveis, teremos uma nova questão a resolver, que diz respeito à relação entre elas.
Em grande parte das pesquisas estatísticas, temos como meta estabelecer a existência ou não de
relações entre uma ou mais variáveis. Apenas como exemplo, é deste modo que se realizam
estudos para prever vendas futuras de um produto em relação a seu preço, ou a despesa de uma
família com a escola e materiais escolares em relação à sua renda, ou o consumo de energia
elétrica em uma casa em relação à quantidade de moradores etc.

O melhor, ou ideal, seria que conseguíssemos
estabelecer uma quantidade em relação de
outra, mas é quase impossível. Na grande parte
dos casos, devemos contentar-nos com a
predição de médias, ou valores esperados.
Deste modo, quando levarmos em consideração variáveis como massa corporal e altura,
tabagismo e incidência de câncer, procuramos verificar se há alguma relação entre as variáveis
de cada um dos itens e o grau dessa relação. A meta do estudo da correlação é a determinação do
grau de relacionamento entre duas observações. A correlação mostra a intensidade, ou grau, de
relação entre duas variáveis; a regressão nos dá uma equação que mostra o relacionamento em
parâmetros matemáticos.
MEDIDAS DE CORRELAÇÃO
// Coeficiente de Correlação de Pearson
O coeficiente de Pearson (r), também chamado de correlação linear ou “r” de Pearson, é o grau
de relação entre duas variáveis quantitativas e mostra o nível de correlação entre -1 e 1.
Quando o coeficiente de correlação se aproxima de 1, temos um aumento de uma variável,
consequentemente o aumento da outra também, portanto, existe uma relação linear positiva.
Porém, quando o coeficiente se aproxima de -1, podemos dizer que as variáveis são
correlacionadas, então, nesse caso, quando o valor de uma variável aumenta, o da outra diminui.
Tal fato é chamado de correlação inversa ou negativa.
Quando temos um coeficiente de correlação próximo de zero, ele nos indica que não há relação
entre as duas variáveis, e quanto mais eles se aproximam de 1 ou -1, mais forte é a relação.

// Coeficiente de Correlação de Spearman
Determinado pela letra grega rho (ρ), o coeficiente de Spearman é uma medida de correlação
sem parâmetros, sendo avaliada no intervalo entre -1 e 1. De modo contrário do coeficiente de
Pearson, o coeficiente de Spearman não tem como finalidade que a relações entre as variáveis
sejam lineares, nem quantitativas, podendo ser utilizadas para verificar a relação entre variáveis
medidas no parâmetro ordinal.

// Coeficiente de Correlação de Kendall
Representada pela letra grega tau (τ), o coeficiente de Kendall é uma medida que relaciona as
variáveis ordinais. Uma das vantagens do coeficiente de Kendall em relação ao coeficiente de
Spearman é que este pode ser usado para um coeficiente de correlação parcial.
MÍNIMOS QUADRADOS

Muitas vezes, é possível termos uma relação linear entre duas grandezas, sendo a aplicação do
método dos mínimos quadrados uma tentativa de termos uma reta que pode ser relacionada aos
dados obtidos. Na teoria, é um procedimento que tenta achar o mínimo de uma função de duas
variáveis (coeficiente linear e angular da reta) elaborada do início da distância entre os pontos
experimentais e os pontos de uma reta.

CURIOSIDADE
Segundo Oliveira Filho (2018), em 1809, Carl Friedrich Gauss (1777-1855) publicou
um artigo demonstrando que a melhor maneira de determinar um parâmetro
desconhecido de uma equação de condições é minimizando a soma dos quadrados dos
resíduos, mais tarde chamado de mínimos quadrados por Adrien-Marie Legendre
(1752-1833). Em abril de 1810, Pierre-Simon Laplace (1749-1827) apresenta no
memoir da Academia de Paris a generalização de problemas com vários parâmetros
desconhecidos.
Um estudo de mínimos quadrados sempre é iniciado com a simplificação da soma:
S = Ʃn ( y0 – yi)²
em que:
• yoi = valores observados de y
• yi = valores calculados de y
Sendo assim, os mínimos quadrados servem para minimizar os quadrados dos restos. Os restos
podem ser normatizados pela quantidade de pontos ou pela soma dos pesos utilizados.

// Método dos mínimos quadrados
Podemos aplicar este estudo no caso da regressão linear, em que adaptamos pontos obtidos e
valores dados a uma reta, que será a reta que diminui a soma quadrática das diferenças entre os
valores conhecidos e os valores da reta.

Neste caso, tentamos encontrar a função do tipo a + bx, que é a reta que melhor representa os
valores dados. Podemos pensar também em outro caso. Apesar de conhecermos a função, não
apenas em alguns pontos, mas em todo seu intervalo, teremos como objetivo aproximar essa
função de outras funções de uma outra classe, que seja melhor para desenvolver nosso trabalho.
Por exemplo:
Vamos calcular a melhor reta que se aproxime da função sin(x) no intervalo [0, 1] ...

Vamos considerar um conjunto de pontos x0 a xn relacionando, respectivamente, os valores f(x0)
a f(xn). Devemos agora considerar uma classe de funções, dentre as quais vamos encontrar a que
melhor se aproxima daquele conjunto de valores, nos pontos dados.
g(x) = a0f0(x) + ... + amfm(x)
Sendo que f0 e fm são funções independentes.
Determinando os parâmetros a0 a am sendo que a soma quadrática das diferenças entre os f(xi) e
os g(xi) seja mínima.
Introduzir a distância || f – g ||em que
|| u ||2 = Ʃn u(xi)2
i = 0
que está relacionada ao produto interno

(u, v) = Ʃn u(xi) v(xi)
i = 0
A regra e o produto interno estão definidos para funções que podem assumir qualquer valor nos
pontos dados. Devemos trabalhar com essas ideias, pois o que vamos ver em seguida será o
mesmo do caso contínuo, apenas trocando a regra e o produto interno.
Estudaremos apenas os somatórios, pois o caso de integral é baseado no
estudo integrais e derivadas, não abordados aqui.
Pretendemos encontrar apenas os parâmetros a0 , ... , an que minimizem a distância entre f e g.
Q = || f – g ||2 = (f – g , f – g)

ERRO PADRÃO
Quando temos qualquer amostra de tamanho n, calculamos a média aritmética. Se fizermos uma
outra amostra aleatória, a média aritmética calculada será diferente da média anterior. Devemos
calcular a variabilidade das médias através de seu erro padrão, assim, o erro padrão mede a
precisão da média populacional. Para isso, usamos a seguinte fórmula:

Em que:
• Sx = erro padrão
• S = desvio padrão
• n = tamanho da amostra
// Exemplo
Em uma população estudada, calculamos um desvio padrão de 2,84 com uma amostra aleatória
de 70 elementos. Se houver, qual será o erro padrão?
Resolução:

Este valor indica que a média pode variar 0,3394 para mais ou para menos.
// Exemplo
Ao obtermos um desvio padrão de 1,32 usando uma amostra aleatória contendo 121 elementos,
com a média dessa amostra precisando ser de 6,25, devemos calcular o valor mais provável da
média dos dados da pesquisa.
Resolução:
Primeiro calculamos o erro padrão:

O valor mais provável é dado por:
Ẍ = 6,25 ± 0,12
VARIAÇÃO EXPLICADA E NÃO EXPLICADA
Toda variação explicada é igual a soma dos quadrados dos desvios explicados, isto é,
∑(yî – y̅)².
Toda variação não explicada é igual a soma dos quadrados dos desvios não explicados, ou seja,
∑ei² = ∑(yi – ŷi)² = sq(â,b̂).

Lesson 5 of 5
Equação da regressão
Para se estimar o valor esperado, usa-se uma equação, que determina a relação entre ambas as
variáveis.
Y = α + βx + ε
Em que:
Y = Variável explicada; representa o que o modelo quer prever.
α = Constante, que representará a interceptação da reta com o eixo vertical.
βx = Representa a inclinação (coeficiente angular) em relação à variável independente “x”.
x = Variável explicativa (independente);
ε = Representa todos os fatores residuais mais os possíveis erros. O comportamento desse dado é
aleatório. Paraque possamos usar essa fórmula, os erros devem satisfazer todas as hipóteses
predeterminadas, assim como também terem distribuição normal determinadas.
Mas, primeiro, vamos encontrar “r”:

Exemplo:
Com o passar do tempo, o desenvolvimento corporal do ser humano atinge seu auge com uma
certa idade. A partir de uma certa etapa de nossa vida, infelizmente nosso corpo começa a
mostrar sinais de desgaste.
Selecionamos 18 mulheres, com idade entre 40 e 79 anos, e observamos em cada uma delas a
idade (X) e a massa muscular (Y).

Observamos no Gráfico 9 que há uma grande relação linear decrescente entre as variáveis, pois
quando a massa muscular das pessoas diminui, a idade aumenta.
Calcularemos, agora, o coeficiente de correlação linear entre X e Y. Chamamos as variáveis: Y
= Massa Muscular e X = Idade n = 18

Se observarmos o resultado, notamos que temos uma grande correlação linear entre as variáveis.
Percebemos que quando uma variável aumenta (idade), a outra diminui (massa), fato
demonstrado pelo gráfico.
Vamos encontrar uma reta de regressão que simbolize a relação entre as variáveis Y: massa
muscular (dependente); e X: idade (independente).

Portanto, a reta de regressão encontrada entre as variáveis (Y) em função (X) é
Y = 148,218 – 1,027X
Levando em consideração a reta encontrada, calcule a massa muscular média de mulheres com
50 anos.
Y = α + βx + ε
Y50 = β0 + β1X = 148,218 – 1,027(50) = 96,868
DIAGRAMA DE DISPERSÃO
O diagrama de dispersão é uma ferramenta que tem grande importância para resolver possíveis
problemas, mensurando a relação entre duas variáveis quantitativas, e variáveis que podem ser
medidas e contadas. O diagrama de dispersão pode ser chamado de gráfico de dispersão, sendo
uma das ferramentas que compõem a qualidade. É elaborado no plano cartesiano, relacionando a
causa e efeito. Portanto, com esses dados relacionados, será possível estabelecer se neste tipo de
gráfico há ou não uma relação de causa e efeito entre suas variáveis estudadas. Temos cinco
tipos de correlações.

Figura 1 correlação positiva

Figura 2 correlação negativa

Figura 3 correlação perfeita

Figura 4 correlação forte

Figura 5 correlação fraca

Vamos usar um diagrama para poder observar se as duas variáveis estão relacionadas. Sendo
assim, é possível medir a intensidade do relacionamento entre essas duas variáveis.

EXPLICANDO
Como montar um diagrama:
1º passo: determine e colete os dados que vão ser analisados, para a verificação da
relação entre eles.
2º passo: aqui, é necessário construir os eixos vertical e horizontal do gráfico, sendo
colocada a variável causa na horizontal e, na vertical, a variável efeito.
3º passo: esse passo deixa o gráfico mais completo. Coloque os dados
complementares, como o nome dessas variáveis, o período da coleta etc.
4º passo: com esses dados e com o gráfico criado, una o “útil ao agradável” e ponha os
dados no diagrama.
5º passo: chegamos ao último passo. Ele se dá com a análise dos dados e a procura da
raiz do problema.
O diagrama é uma importante ferramenta, porém, é preciso ter alguns cuidados!
Lembre-se sobre a importância do uso do diagrama de dispersão no meio produtivo.
Ele visa relacionar e analisar as variáveis de causa e efeito, sempre procurando
enxergar o que há de errado com a produção.

Para demostrar o conceito estudado, o Gráfico 11 é um diagrama que está relacionando notas de
matemática (eixo horizontal) e notas de português (eixo vertical). Os pontos retratam um aluno
específico, e mostra os valores das duas variáveis. Vamos ver as notas de Júlia. Sua nota de
português é 9,5 (eixo vertical) e sua nota de matemática é 9,0 (eixo horizontal). Percebemos
uma associação positiva entre as variáveis, no caso de Júlia (coordenadas 6;3). Ou seja, alunos
com notas mais altas em matemática também tendem a ter notas mais altas em português.
Obviamente, essa associação não é perfeita, mas é forte.

ANÁLISE DE CORRELAÇÃO E REGRESSÃO
Durante nosso estudo em estatística, vamos nos deparar com situações nas quais teremos de
analisar o comportamento conjunto de uma ou mais variáveis. Em muitos casos, a explicação de
um estudo de interesse pode estar correlacionado a vários fatores (variáveis) que influenciam de
certo modo na ocorrência deste fenômeno. O desenvolvimento de duas variáveis quantitativas
pode ser constatado através do gráfico de dispersão.
Ao analisarmos dados que apresentam a existência de uma relação real entre duas variáveis,
temos que achar uma função matemática que mostre esse relacionamento, ou seja, uma equação
de regressão. Ao observarmos uma relação entre duas variáveis X e Y, devemos ter uma função
que explique uma grande parte da variação de Y por X. Contudo, parte da variação de Y que X
não explica será relacionada ao acaso, ou seja, a um erro qualquer. Estudando a variação de uma
variável Y em função de uma variável X, dizemos que Y é a variável dependente e que X é a
variável explanatória (ou independente). Se faz necessário algumas observações funcionais.
• Em qualquer modelo de regressão linear, não teremos respostas exatas. Deste
modo, para um determinado valor de x, espera-se uma média.
• Quando fazemos a estimativa de uma variável com base em valores conhecidos
da outra, essa estimativa deve ser cautelosa! Não podemos fazer qualquer
levantamento dessa reta usando valores fora do contexto de dados. O grande
erro de fazer qualquer levantamento fora do contexto é que a mesma relação
pode não mais existir.
• A ocorrência de uma correlação nada fala sobre a natureza da relação que possa
existir entre as variáveis. Ao estudarmos o coeficiente de correlação, devemos
saber que um valor grande de R não deve significar que X seja responsabilidade
de Y ou vice-versa. O estudo da regressão indica apenas o nível de
relacionamento matemático, se é que no exemplo estudado tenha algum. Para
termos uma lógica de qualquer relação, teremos de estudar teorias externas não
pertencentes à Estatística.
Após toda leitura e entendimento que fizemos até agora, devemos saber que em n pontos
observados, é teoricamente possível usarmos uma grande variedade de curvas. Como já vimos, o
modelo linear nem sempre é o melhor; a representação gráfica dos dados às vezes demonstra
que estes dados são melhores representados por curvas do que por uma reta. Então, é de suma
importância que, em primeiro lugar, escolhamos o modelo que melhor se adapta ao nosso
trabalho. Após a escolha do melhor modelo, outro fator importante da análise é o número de
variáveis com o qual estamos trabalhando. Em muitos trabalhos, em vez de ser considerada
somente uma variável independente, é de muita importância estudar a relação entre uma variável
e um conjunto de variáveis.

Agora é a hora de sintetizar tudo o que
aprendemos nessa unidade. Vamos lá?!
SINTETIZANDO
É necessário um estudo acurado quando estamos lidando com as relações entre os dados de
nossa pesquisa. É, então, de grande valia o bom conhecimento dos métodos e cálculos a serem
usados nesse relacionamento.
Na correlação e na regressão, devemos nos atentar aos cálculos matemáticos para que não
sejamos surpreendidos por resultados não satisfatórios, por cálculos errados. Lembre-se sempre:
a representação gráfica de um conjunto de dados nada mais é que a apresentação dos valores em
um plano cartesiano, mas, o modelo escolhido deve ser representativo em relação ao que está
acontecendo na prática. Por fim, essa análise de correlação deve ser uma ferramenta importante
para os diferentes estudos, sendo uma das etapas para utilizarmos várias técnicas de análise em
nosso trabalho.
Se faz necessário destacar que dentre os principais modos operacionais que utilizam o
coeficiente de correlação, estão a análise do comportamento das variáveis e a análise da função
matemática quemostra essa relação.
Neste trabalho apresentamos os métodos de análise de correlação, usando variáveis medidas. Os
coeficientes de correlação simples utilizados foram: coeficiente linear de Pearson, coeficiente de
relação real entre duas variáveis, coeficiente de correlação de Spearman e coeficiente de
correlação de Kendall.
Aproveite bem seus conhecimentos para desenvolver um ótimo trabalho, lembrando sempre que
a Estatística é uma ferramenta para tornar nossa vida mais segura e confiável. Felicidades.
VIDEOAULA
REFERÊNCIAS BIBLIOGRÁFICAS
BONJORNO, J. Matemática fundamental. São Paulo: FTD, 2008.
BUSSAB, W.; MORETTIN, P. A. Estatística Básica. São Paulo: Saraiva, 2002.
CENTURION, M. Conteúdo e metodologia da matemática. São Paulo: Scipione, 1994.
EVES, H. Introdução à história da matemática. Trad. Hygino H. Domingues. Campinas: Ed.
Unicamp, 2004.
G1. Entenda o que é deflação e quando ela é um problema para a economia. 2017.
Disponível em: <https://g1.globo.com/economia/noticia/entenda-o-que-e-deflacao-e-por-que-
ela-e-um-problema-para-a-economia.ghtml>. Acesso em: 07/03/2019.
IBGE - Instituto Brasileiro de Geografia e Estatística. Índice Nacional de Preços ao Consumidor
Amplo - IPCA. Disponível em: <https://www.ibge.gov.br/estatisticas-
novoportal/economicas/precos-e-custos/9256-indice-nacional-de-precos-ao-consumidor-
amplo.html?=&t=o-que-e>. Acesso em: 07/03/2019.
OLIVEIRA FILHO, K. S. Mínimos quadrados. 2018. Disponível em:
<http://astro.if.ufrgs.br/minq/>. Acesso em: 07/03/2019.

https://g1.globo.com/economia/noticia/entenda-o-que-e-deflacao-e-por-que-ela-e-um-problema-para-a-economia.ghtml
https://g1.globo.com/economia/noticia/entenda-o-que-e-deflacao-e-por-que-ela-e-um-problema-para-a-economia.ghtml
https://www.ibge.gov.br/estatisticas-novoportal/economicas/precos-e-custos/9256-indice-nacional-de-precos-ao-consumidor-amplo.html?=&t=o-que-e
https://www.ibge.gov.br/estatisticas-novoportal/economicas/precos-e-custos/9256-indice-nacional-de-precos-ao-consumidor-amplo.html?=&t=o-que-e
https://www.ibge.gov.br/estatisticas-novoportal/economicas/precos-e-custos/9256-indice-nacional-de-precos-ao-consumidor-amplo.html?=&t=o-que-e
http://astro.if.ufrgs.br/minq/