Buscar

04_Estatistica

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 55 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 55 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 55 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Es
ta
tí
st
ic
a
Estatística descritiva .......................................................................................................................01 
Média, moda, mediana e desvio padrão ........................................................................................16 
Probabilidade e distribuições de probabilidade ..............................................................................20 
Inferência: estimação pontual e intervalar e testes de hipóteses ...................................................27 
Predição: abordagens; séries temporais; regressão linear simples e múltipla ..............................37 
Regressão logística ........................................................................................................................48 
Exercícios .......................................................................................................................................51
Gabarito ..........................................................................................................................................54
Receita Federal do Brasil
Analista-Tributário
Estatística
1743257 E-book gerado especialmente para DIOVANI SIQUEIRA CALENZANI
1
Estatística descritiva
ESTATÍSTICA DESCRITIVA
O objetivo da Estatística Descritiva é resumir as principais características de um conjunto de dados 
por meio de tabelas, gráficos e resumos numéricos. 
A estatística torna-se a cada dia uma importante ferramenta de apoio à decisão. Resumindo: é um 
conjunto de métodos e técnicas que auxiliam a tomada de decisão sob a presença de incerteza.
Estatística descritiva (Dedutiva)
O objetivo da Estatística Descritiva é resumir as principais características de um conjunto de dados 
por meio de tabelas, gráficos e resumos numéricos. Fazemos uso de:
Tabelas de frequência - Ao dispor de uma lista volumosa de dados, as tabelas de frequência servem 
para agrupar informações de modo que estas possam ser analisadas. As tabelas podem ser de frequên-
cia simples ou de frequência em faixa de valores.
Gráficos - O objetivo da representação gráfica é dirigir a atenção do analista para alguns aspectos 
de um conjunto de dados. Alguns exemplos de gráficos são: diagrama de barras, diagrama em setores, 
histograma, boxplot, ramo-e-folhas, diagrama de dispersão, gráfico sequencial.
Resumos numéricos - Por meio de medidas ou resumos numéricos podemos levantar importantes 
informações sobre o conjunto de dados tais como: a tendência central, variabilidade, simetria, valores 
extremos, valores discrepantes, etc.
Estatística inferencial (Indutiva)
Utiliza informações incompletas para tomar decisões e tirar conclusões satisfatórias. O alicerce das 
técnicas de estatística inferencial está no cálculo de probabilidades. Fazemos uso de:
Estimação - A técnica de estimação consiste em utilizar um conjunto de dados incompletos, ao qual 
iremos chamar de amostra, e nele calcular estimativas de quantidades de interesse. Estas estimativas 
podem ser pontuais (representadas por um único valor) ou intervalares.
Teste de Hipóteses - O fundamento do teste estatístico de hipóteses é levantar suposições acerca de 
uma quantidade não conhecida e utilizar, também, dados incompletos para criar uma regra de escolha.
População e amostra
1743257 E-book gerado especialmente para DIOVANI SIQUEIRA CALENZANI
2
População: é o conjunto de todas as unidades sobre as quais há o interesse de investigar uma ou 
mais características.
Variáveis e suas classificações
Qualitativas – quando seus valores são expressos por atributos: sexo (masculino ou feminino), cor da 
pele, entre outros. Dizemos que estamos qualificando.
Quantitativas – quando seus valores são expressos em números (salários dos operários, idade dos 
alunos, etc). Uma variável quantitativa que pode assumir qualquer valor entre dois limites recebe o nome 
de variável contínua; e uma variável que só pode assumir valores pertencentes a um conjunto enumerá-
vel recebe o nome de variável discreta.
Fases do método estatístico
- Coleta de dados: após cuidadoso planejamento e a devida determinação das características mensu-
ráveis do fenômeno que se quer pesquisar, damos início à coleta de dados numéricos necessários à sua 
descrição. A coleta pode ser direta e indireta.
- Crítica dos dados: depois de obtidos os dados, os mesmos devem ser cuidadosamente criticados, 
à procura de possível falhas e imperfeições, a fim de não incorrermos em erros grosseiros ou de certo 
vulto, que possam influir sensivelmente nos resultados. A crítica pode ser externa e interna.
- Apuração dos dados: soma e processamento dos dados obtidos e a disposição mediante critérios de 
classificação, que pode ser manual, eletromecânica ou eletrônica.
- Exposição ou apresentação de dados: os dados devem ser apresentados sob forma adequada (tabe-
las ou gráficos), tornando mais fácil o exame daquilo que está sendo objeto de tratamento estatístico.
- Análise dos resultados: realizadas anteriores (Estatística Descritiva), fazemos uma análise dos resul-
tados obtidos, através dos métodos da Estatística Indutiva ou Inferencial, que tem por base a indução ou 
inferência, e tiramos desses resultados conclusões e previsões.
Censo
É uma avaliação direta de um parâmetro, utilizando-se todos os componentes da população.
Principais propriedades:
- Admite erros processual zero e tem 100% de confiabilidade;
- É caro;
- É lento;
- É quase sempre desatualizado (visto que se realizam em períodos de anos 10 em 10 anos);
- Nem sempre é viável.
Dados brutos: é uma sequência de valores numéricos não organizados, obtidos diretamente da obser-
vação de um fenômeno coletivo.
Rol: é uma sequência ordenada dos dados brutos.
Tabelas de frequência
 A partir dos dados brutos, podemos agrupar os valores de uma variável quantitativa ou qualitativa e 
construir a chamada tabela de frequências. As tabelas de frequências podem ser simples ou por faixas 
de valores, dependendo da classificação da variável.
1743257 E-book gerado especialmente para DIOVANI SIQUEIRA CALENZANI
3
Tabela de frequência simples
São adequadas para resumir observações de uma variável qualitativa ou quantitativa discreta, desde 
que esta apresente um conjunto pequeno de diferentes valores. Exemplo:
A variável estado civil é qualitativa nominal e no levantamento feito nos 385 indivíduos apareceram 
respostas que foram agrupadas em 5 níveis (categorias) para esta variável: Solteiro, Casado, Divorciado, 
Viúvo e Outro. A construção da tabela de frequência simples, neste caso, resume os dados brutos pela 
contagem de vezes (frequência absoluta) que uma determinada categoria foi observada.
Tabelas de frequências em faixas de valores
Para agrupar dados de uma variável quantitativa contínua ou até mesmo uma variável quantitativa dis-
creta com muitos valores diferentes, a tabela de frequências simples não é mais um método de resumo, 
pois corremos o risco de praticamente reproduzir os dados brutos.
Utilizando este procedimento, devemos tomar cuidado pois ao contrário da tabela de frequência sim-
ples, não é mais possível reproduzir a lista de dados a partir da organização tabular. Em outras palavras, 
estamos perdendo informação ao condensá-las.
Exemplo: A tabela traz dados sobre as horas semanais de atividades físicas dos 50 estudantes que 
participaram do levantamento sobre hábitos de lazer.
O resumo da tabela é feito mediante a construção de 6 intervalos de comprimento igual a 2 horas e 
posteriormente a contagem de indivíduos com valores identificados ao intervalo. Um indivíduo que gastou 
6 horas semanais de exercício será contado no quarto intervalo (6|–8) que inclui o valor 6 e exclui o valor 
8.
Para acharmos esses valores vamos fazer uso das seguintes informações:
- Determinar a quantidade de classes(k)
1743257 E-book gerado especialmente para DIOVANI SIQUEIRA CALENZANI
4
- Calcular a amplitude das classes(h):
**Calcule a amplitude do conjunto de dados: L = xmáx–xmín
**Calculea amplitude (largura) da classe: h = L / k
Arredonde convenientemente
- Calcular os Limites das Classes
- Limite das classes
Utilize a notação: [x,y) –intervalo de entre x (fechado) até y (aberto)
Frequentemente temos que “arredondar “a amplitude das classes e, consequentemente, arredondar 
também os limites das classes. Como sugestão, podemos tentar, se possível, um ajuste simétrico nos 
limites das classes das pontas nas quais, usualmente, a quantidade de dados é menor.
- Ponto médio das classes
xk= (Lsuperior–Linferior) / 
DISTRIBUIÇÃO DE FREQUÊNCIA
Frequência absoluta e Histograma1
Quando trabalhamos com um grande quantitativo de dados, passamos a trabalhar com os dados agru-
pados. Então fazemos uso das tabelas de distribuição de frequência, entre outros recursos que facilitarão 
a compreensão dos dados.
Na distribuição de frequência listamos todos os valores coletados, um em cada linha, marcam‐se as 
vezes em que eles aparecem, incluindo as repetições, e conta‐se a quantidade de ocorrências de cada 
valor. Por este motivo, tabelas que apresentam valores e suas ocorrências denominam‐se distribuição de 
frequências.
O termo “frequência” indica o número de vezes que um dado aparece numa observação estatística. 
Exemplo:
Um professor organizou os resultados obtidos em uma prova com 25 alunos da seguinte forma:
1 Associação Educacional Dom Bosco - Estatística e probabilidade - Uanderson Rebula de Olivei-
ra
1743257 E-book gerado especialmente para DIOVANI SIQUEIRA CALENZANI
5
Vamos organizá‐los de modo que a consulta a eles seja simplificada. Então, faremos a distribuição de 
frequência destas notas, por meio da contagem de dados, que podemos chamar de frequência de dados 
absolutos.
Esta forma de organizar dados é conhecida como distribuição de frequência, e o número de vezes que 
um dado aparece é chamado de frequência absoluta. O somatório SEMPRE é a quantidade de dados 
apresentados, que neste é 25.
Quando os dados numéricos são organizados, eles geralmente são ordenados do menor para o maior, 
divididos em grupos de tamanho razoável e, depois, são colocados em gráficos para que se examine sua 
forma, ou distribuição. Este gráfico é chamado de Histograma. Um histograma é um gráfico de colunas 
juntas. Em um histograma não existem espaços entre as colunas adjacentes, como ocorre em um gráfico 
de colunas. No exemplo, a escala horizontal (→) representa as notas e a escala vertical (↑) as frequên-
cias. Os gráficos são a melhor forma de apresentação dos dados.
Em Estatística não trabalhamos somente com frequência absoluta (f), mas também com outros tipos 
de frequências, que são: frequência relativa (fr), frequência absoluta acumulada (Fa) e frequência relativa 
cumulada (FRa).
Frequência Relativa fr (%)
Representado por fr(%), significa a relação existente entre a frequência absoluta f e a soma das fre-
quências ∑f. É a porcentagem (%) do número de vezes que cada dado aparece em relação ao total.
1743257 E-book gerado especialmente para DIOVANI SIQUEIRA CALENZANI
6
Frequência Absoluta Acumulada Fa
Representado por Fa, significa a soma das frequências absolutas até o elemento analisado.
Frequência Relativa Acumulada FRa (%)
Representado por FRa (%), significa a soma das frequências relativas fr(%) até o elemento analisa-
do.
Observe que os valores ao lado, deverão coincidir.
Agrupamento em Classes
Em uma distribuição de frequência, ao se trabalhar com grandes conjuntos de dados e com valores 
dispersos, podemos agrupá-los em classes. Isso torna muito fácil a compreensão dos dados e uma me-
lhor visualização dos mesmos.
1743257 E-book gerado especialmente para DIOVANI SIQUEIRA CALENZANI
7
Se um conjunto de dados for muito disperso, uma representação melhor seria através do agrupamento 
dos dados com a construção de classes de frequência. Caso isso não ocorresse, a tabela ficaria muito 
extensa. 
Exemplo: Um radar instalado em uma rodovia registrou a velocidade (em Km/h) de 40 veículos.
Montando a tabela de distribuição de frequência temos:
É fácil ver que a distribuição de frequências diretamente obtida a partir desses dados é dada uma 
tabela razoavelmente extensa.
1743257 E-book gerado especialmente para DIOVANI SIQUEIRA CALENZANI
8
A distribuição em” classes” é como se fosse uma compressão dos dados. Imagine se fizéssemos uma 
distribuição de frequência de todas velocidades (de 70 a 128). A tabela ficaria imensa! Por este motivo 
existe a distribuição de frequência com classes.
Como criar uma Distribuição de Frequência com classes
Partindo dos dados anteriores teremos: 
- Calcule a quantidade de classes (i), pela raiz da quantidade de dados. São 40 veículos. Então:
√40 = 6,3 ≈ i = 6 classes.
- Calcule a amplitude de classe (h) que é o tamanho da classe, sendo:
O maior valor (128) e o Menor valor (70) são obtidos da lista dos registros das velocidades dos 40 
veículos.
- Montar as classes a partir do Menor valor (70), somando com a amplitude de classe (10) até que se 
chegue na 6ª classe, assim:
Com isso termos os dados distribuídos da seguinte forma:
Tipos de intervalos de classe
No Brasil usa‐se o intervalo ├ (Resolução 866/66 do IBGE). Já na literatura estrangeira utiliza‐se co-
mumente com intervalo fechado.
1743257 E-book gerado especialmente para DIOVANI SIQUEIRA CALENZANI
9
Conceitos importantes
Limites de classe ‐ São os valores extremos de cada classe. No exemplo 70 ├ 80, temos que o limite 
inferior é 70 e o limite superior 80.
Amplitude total da distribuição (AT) – É a diferença entre o limite superior da última classe e o limite 
inferior da primeira classe, no exemplo 130 – 70 = 60.
Amplitude amostral (AA) – É a diferença entre o valor máximo e o valor mínimo da amostra, no exem-
plo 128 – 70 = 58.
A seguir estão as distribuições de frequências absoluta f, relativa fr(%), absoluta acumulada Fa e rela-
tiva acumulada FRa(%), bem como o Histograma desta distribuição.
Podemos representar os dados através de outras formas gráficas, vejamos:
Polígono de frequência – É um gráfico em linha que representa os pontos centrais dos intervalos de 
classe. Para construir este gráfico, você deve calcular o ponto central de classe (xi), que é o ponto que 
divide o intervalo de classe em duas partes iguais. Por exemplo, a velocidade dos veículos da 1ª classe 
pode ser representada por 70 + 80/2 = 75Km/h.
A construção de um polígono de frequências é muito simples. Primeiro, construímos um histograma; 
depois marcamos no “telhado” de cada coluna o ponto central e unimos sequencialmente esses pon-
tos.
Ogiva – Conhecida também por polígono de frequência acumulada. É um gráfico em linha que repre-
senta as frequências acumuladas (Fa), levantada nos pontos correspondentes aos limites superiores dos 
intervalos de classe. Para construí‐la, você deve elaborar o histograma de frequência f em uma escala 
menor, considerando o último valor a frequência acumulada da última classe, no caso, 40.
1743257 E-book gerado especialmente para DIOVANI SIQUEIRA CALENZANI
10
Gráficos
O objetivo da representação gráfica é dirigir a atenção do analista para alguns aspectos de um con-
junto de dados. Alguns exemplos de gráficos são: diagrama de barras, diagrama em setores, histograma, 
entre outros.
- Gráfico de Barras: Para construir um gráfico de barras, representamos os valores da variável no 
eixo das abscissas e suas as frequências ou porcentagens no eixo das ordenadas. Para cada valor da 
variável desenhamos uma barra com altura correspondendo à sua frequência ou porcentagem. Este tipo 
de gráfico é interessante para as variáveis qualitativas ordinais ou quantitativas discretas, pois permite 
investigar a presença de tendência nos dados. Exemplo:
- Diagrama Circular ou setores: Para construir um diagrama circular ou gráfico de pizza, repartimos um 
disco em setores circulares correspondentes às porcentagens de cada valor (calculadas multiplicando-se 
a frequência relativa por 100). Este tipo de gráfico adapta-se muito bem para as variáveisqualitativas 
nominais. Exemplo:
- Histograma: O histograma consiste em retângulos contíguos com base nas faixas de valores da va-
riável e com área igual à frequência relativa da respectiva faixa. Desta forma, a altura de cada retângulo 
é denominada densidade de frequência ou simplesmente densidade definida pelo quociente da área pela 
amplitude da faixa. Alguns autores utilizam a frequência absoluta ou a porcentagem na construção do 
histograma, o que pode ocasionar distorções (e, consequentemente, más interpretações) quando ampli-
tudes diferentes são utilizadas nas faixas. Exemplo:
Gráfico de Linha ou Sequência: Adequados para apresentar observações medidas ao longo do tempo, 
enfatizando sua tendência ou periodicidade. Exemplo:
Polígono de Frequência: semelhante ao histograma, mas construído a partir dos pontos médios das 
classes. Exemplo:
1743257 E-book gerado especialmente para DIOVANI SIQUEIRA CALENZANI
11
Gráfico de Ogiva: apresenta uma distribuição de frequências acumuladas, utiliza uma poligonal ascen-
dente utilizando os pontos extremos.
- Pictogramas
Desenhos ilustrativos
- Cartograma: é uma representação sobre uma carta geográfica. Este gráfico é empregado quando 
o objetivo é de figurar os dados estatísticos diretamente relacionados com áreas geográficas ou políti-
cas.
1743257 E-book gerado especialmente para DIOVANI SIQUEIRA CALENZANI
12
Resumos numéricos 
Por meio de medidas ou resumos numéricos podemos levantar importantes informações sobre o con-
junto de dados tais como: a tendência central, variabilidade, simetria, valores extremos, valores discre-
pantes, etc. Aqui serão apresentadas 3 classes de medidas:
• Tendência Central
• Dispersão (Variabilidade)
• Separatrizes 
Tendência central
As medidas de tendência central indicam, em geral, um valor central em torno do qual os dados estão 
distribuídos. Vejamos:
Média Aritmética
Ela se divide em:
- Simples: é a soma de todos os seus elementos, dividida pelo número de elementos n.
Para o cálculo: Se x for a média aritmética dos elementos do conjunto numérico A = {x1; x2; x3; ...; xn}, 
então, por definição:
- Ponderada: é a soma dos produtos de cada elemento multiplicado pelo respectivo peso, dividida pela 
soma dos pesos. Para o cálculo
Vantagens:
- No cálculo da média participam todos os valores observados.
1743257 E-book gerado especialmente para DIOVANI SIQUEIRA CALENZANI
13
- É uma medida de fácil interpretação e presta-se muito bem a tratamentos estatísticos adicionais.
- É uma medida que sempre existe e é rígida e unicamente determinada.
- É um valor típico de um conjunto de dados, podendo substituir todos os valores de um conjunto sem 
alterar o total.
- É o ponto de equilíbrio de uma distribuição, sendo tão mais eficiente quanto mais simétrica for a dis-
tribuição dos valores ao seu redor.
Desvantagem:
- É uma medida altamente influenciada por valores discrepantes (não resistente).
Mediana
A mediana observada mdobs é o valor central em um conjunto de dados ordenados. Pela mediana o 
conjunto de dados é dividido em duas partes iguais sendo metade dos valores abaixo da mediana e, a 
outra metade, acima. 
Vamos denominar mdobs o valor da mediana observado em um conjunto de dados. Repare que para 
encontrar um número que divida os n dados ordenados em duas partes iguais devem ser adotados dois 
procedimentos:
1) Para um conjunto com um número n (ímpar) de observações, a mediana é o valor na posição 
n+1/2.
2) Para um conjunto com um número n (par) de observações a mediana é a media aritmética dos valo-
res nas posições n/2 e n/2 + 1.
Vantagens:
- Define exatamente o centro de uma distribuição, mesmo quando os valores se distribuem assimetri-
camente em torno da média.
- Pode ser determinada mesmo quando não se conhece todos os valores do conjunto de dados.
- É uma medida que sempre existe e é única. 
- Esta medida pode ser utilizada para definir o meio de um número de objetos, propriedades ou quali-
dades que possam de alguma forma ser ordenados.
- É uma medida resistente, ou seja, não sofre influência de valores discrepantes.
Desvantagem:
- É uma medida que não se presta a cálculos matemáticos.
1743257 E-book gerado especialmente para DIOVANI SIQUEIRA CALENZANI
14
Moda
A moda, é o valor que aparece com maior frequência, ou seja, podemos dizer que é o termo que está 
na “moda”.
Vantagens:
- É uma medida que têm existência real dentro do conjunto de dados e em grande número de ve-
zes.
- Não exige cálculo, apenas uma contagem.
- Pode ser determinada também para variáveis qualitativas nominais.
Desvantagens:
- É uma medida que não se presta a cálculos matemáticos.
- Deixa sem representação todos os valores do conjunto de dados que não forem iguais a ela.
Medidas de variação ou dispersão
As medidas de variação ou dispersão complementam as medidas de localização ou tendência central, 
indicando quanto as observações diferem entre si ou o grau de afastamento das observações em relação 
à média.
As medidas de variação mais utilizadas são: a amplitude total, a variância, o desvio padrão e o coefi-
ciente de variação.
Amplitude total
A amplitude total, denotada por at, fornece uma ideia de variação e consiste na diferença entre o maior 
valor e o menor valor de um conjunto de dados. Assim, temos:
at = ES - EI
onde:
ES: extremo superior do conjunto de dados ordenado;
EI: extremo inferior do conjunto de dados ordenado.
A amplitude total é uma medida pouco precisa, uma vez que utiliza apenas os dois valores mais extre-
mos de um conjunto de dados. Também por esta razão é extremamente influenciada por valores discre-
pantes. É utilizada quando apenas uma ideia rudimentar da variabilidade dos dados é suficiente.
Variância
A variância, denotada por s² , é a medida de dispersão mais utilizada, seja pela sua facilidade de com-
preensão e cálculo, seja pela possibilidade de emprego na inferência estatística. A variância é definida 
como sendo a média dos quadrados dos desvios em relação à média aritmética. Assim, temos:
onde:
n −1: é o número de graus de liberdade ou desvios independentes.
1743257 E-book gerado especialmente para DIOVANI SIQUEIRA CALENZANI
15
A utilização do denominador n −1, em vez de n, tem duas razões fundamentais:
Propriedades matemáticas da variância
1ª propriedade: A variância de um conjunto de dados que não varia, ou seja, cujos valores são uma 
constante, é zero.
2ª propriedade: Se somarmos uma constante c a todos os valores de um conjunto de dados, a variân-
cia destes dados não se altera.
3ª propriedade: Se multiplicarmos todos os valores de um conjunto de dados por uma constante c, a 
variância destes dados fica multiplicada pelo quadrado desta constante.
Desvantagens da variância:
− Como a variância é calculada a partir da média, é uma medida pouco resistente, ou seja, muito in-
fluenciada por valores discrepantes.
− Como a unidade de medida fica elevada ao quadrado, a interpretação da variância se torna mais 
difícil.
Desvio Padrão
O desvio padrão, denotado por s, surge para solucionar o problema de interpretação da variância e é 
definido como a raiz quadrada positiva da variância. Assim, temos:
Coeficiente de Variação
O coeficiente de variação, denotado por CV, é a medida mais utilizada quando existe interesse em 
comparar variabilidades de diferentes conjuntos de dados. Embora esta comparação possa ser feita 
através de outras medidas de variação, nas situações em que as médias dos conjuntos comparados são 
muito desiguais ou as unidades de medida são diferentes, devemos utilizar o CV.
O coeficiente de variação é definido como a proporção da média representada pelo desvio padrão e 
dado por:
1743257 E-book gerado especialmente para DIOVANI SIQUEIRA CALENZANI
16
Separatrizes
As medidas separatrizes delimitam proporções de observações de uma variável ordinal. Elas estabe-
lecem limites para uma determinada proporção 0≤p≤1 de observações. São medidas intuitivas, de fácil 
compreensão e frequentemente resistentes.Como a mediana divide o conjunto em duas metades, é razoável pensar numa medida separatriz que 
efetue uma divisão adicional: dividir cada metade em duas metades. Essas medidas separatrizes são 
denominadas quartis.
Quartis
Os quartis, representados por Qi, onde i = 1, 2 e 3, são três medidas que dividem um conjunto de da-
dos ordenado em quatro partes iguais. São elas:
− Primeiro quartil (Q1): 25% dos valores ficam abaixo e 75% ficam acima desta medida.
− Segundo quartil (Q2): 50% dos valores ficam abaixo e 50% ficam acima desta medida. O segundo 
quartil de um conjunto de dados corresponde à mediana (Q2 = Md).
− Terceiro quartil (Q3): 75% dos valores ficam abaixo e 25% ficam acima desta medida.
Observa-se facilmente que o primeiro quartil é o percentil 0,25, a mediana é o percentil 0,5 e o tercei-
ro quartil é o percentil 0,75. O processo para obtenção dos quartis, da mesma forma que o da mediana, 
consiste em, primeiramente, ordenar os dados e, em seguida, determinar a posição (p) do quartil no 
conjunto de dados ordenado.
Média, moda, mediana e desvio padrão
Média aritmética de um conjunto de números é o valor que se obtém dividindo a soma dos elementos 
pelo número de elementos do conjunto.
Representemos a média aritmética por .
A média pode ser calculada apenas se a variável envolvida na pesquisa for quantitativa. Não faz senti-
do calcular a média aritmética para variáveis quantitativas. 
Na realização de uma mesma pesquisa estatística entre diferentes grupos, se for possível calcular a 
média, ficará mais fácil estabelecer uma comparação entre esses grupos e perceber tendências.
Considerando uma equipe de basquete, a soma das alturas dos jogadores é:
1,85 + 1,85 + 1,95 + 1,98 + 1,98 + 1,98 + 2,01 + 2,01+2,07+2,07+2,07+2,07+2,10+2,13+2,18 = 30,
Se dividirmos esse valor pelo número total de jogadores, obteremos a média aritmética das alturas:
1743257 E-book gerado especialmente para DIOVANI SIQUEIRA CALENZANI
17
A média aritmética das alturas dos jogadores é 2,02m.
Média Ponderada 
A média dos elementos do conjunto numérico A relativa à adição e na qual cada elemento tem um “de-
terminado peso” é chamada média aritmética ponderada.
Mediana (Md)
Sejam os valores escritos em rol: x1 , x2 , x3 , ... xn
Sendo n ímpar, chama-se mediana o termo xi tal que o número de termos da sequência que precedem 
xi é igual ao número de termos que o sucedem, isto é, xi é termo médio da sequência (xn) em rol.
Sendo n par, chama-se mediana o valor obtido pela média aritmética entre os termos xj e xj +1, tais 
que o número de termos que precedem xj é igual ao número de termos que sucedem xj +1, isto é, a me-
diana é a média aritmética entre os termos centrais da sequência (xn) em rol.
Exemplo 1:
Determinar a mediana do conjunto de dados:
{12, 3, 7, 10, 21, 18, 23}
Solução:
Escrevendo os elementos do conjunto em rol, tem-se: (3, 7, 10, 12, 18, 21, 23). A mediana é o termo 
médio desse rol. Logo: Md=
Resposta: Md=12.
Exemplo 2:
Determinar a mediana do conjunto de dados:
{10, 12, 3, 7, 18, 23, 21, 25}.
Solução: 
Escrevendo-se os elementos do conjunto em rol, tem-se:
(3, 7, 10, 12, 18, 21, 23, 25). A mediana é a média aritmética entre os dois termos centrais do rol. 
Logo: 
Resposta: Md=15 
Moda (Mo)
Num conjunto de números: x1 , x2 , x3 , ... xn, chama-se moda aquele valor que ocorre com maior 
frequência.
Observação:
A moda pode não existir e, se existir, pode não ser única.
Exemplo 1:
O conjunto de dados 3, 3, 8, 8, 8, 6, 9, 31 tem moda igual a 8, isto é, Mo=8.
1743257 E-book gerado especialmente para DIOVANI SIQUEIRA CALENZANI
18
Exemplo 2: 
O conjunto de dados 1, 2, 9, 6, 3, 5 não tem moda.
Medidas de dispersão
Duas distribuições de frequência com medidas de tendência central semelhantes podem apresentar 
características diversas. Necessita-se de outros índices numéricas que informem sobre o grau de disper-
são ou variação dos dados em torno da média ou de qualquer outro valor de concentração. Esses índices 
são chamados medidas de dispersão.
Variância 
Há um índice que mede a “dispersão” dos elementos de um conjunto de números em relação à sua 
média aritmética, e que é chamado de variância. Esse índice é assim definido:
Seja o conjunto de números x1 , x2 , x3 , ... xn, tal que é sua média aritmética. Chama-se variância desse con-
junto, e indica-se por , o número:
Isto é:
E para amostra
Exemplo 1:
Em oito jogos, o jogador A, de bola ao cesto, apresentou o seguinte desempenho, descrito na tabela 
abaixo:
JOGO NÚMERO DE PONTOS
1 22
2 18
3 13
4 24
5 26
6 20
7 19
8 18
a) Qual a média de pontos por jogo?
b) Qual a variância do conjunto de pontos?
1743257 E-book gerado especialmente para DIOVANI SIQUEIRA CALENZANI
19
Solução:
a) A média de pontos por jogo é:
b) A variância é:
Desvio médio
Definição
Medida da dispersão dos dados em relação à média de uma sequência. Esta medida representa a 
média das distâncias entre cada elemento da amostra e seu valor médio.
Desvio padrão
Definição
Seja o conjunto de números x1 , x2 , x3 , ... xn, tal que é sua média aritmética. Chama-se desvio padrão desse 
conjunto, e indica-se por , o número:
Isto é:
Exemplo:
As estaturas dos jogadores de uma equipe de basquetebol são: 2,00 m; 1,95 m; 2,10 m; 1,90 m e 2,05 
m. Calcular:
a) A estatura média desses jogadores.
b) O desvio padrão desse conjunto de estaturas.
1743257 E-book gerado especialmente para DIOVANI SIQUEIRA CALENZANI
20
Solução:
Sendo a estatura média, temos:
Sendo o desvio padrão, tem-se:
Probabilidade e distribuições de probabilidade
A teoria da probabilidade permite que se calcule a chance de ocorrência de um número em um experi-
mento aleatório.
Elementos da teoria das probabilidades
- Experimentos aleatórios: fenômenos que apresentam resultados imprevisíveis quando repetidos, 
mesmo que as condições sejam semelhantes.
- Espaço amostral: é o conjunto U, de todos os resultados possíveis de um experimento aleatório.
- Evento: qualquer subconjunto de um espaço amostral, ou seja, qualquer que seja E Ì U, onde E é o 
evento e U, o espaço amostral.
Experimento composto
Quando temos dois ou mais experimentos realizados simultaneamente, dizemos que o experimento é 
composto. Nesse caso, o número de elementos do espaço amostral é dado pelo produto dos números de 
elementos dos espaços amostrais de cada experimento.
n(U) = n(U1).n(U2)
1743257 E-book gerado especialmente para DIOVANI SIQUEIRA CALENZANI
21
Probabilidade de um evento
Em um espaço amostral U, equiprobabilístico (com elementos que têm chances iguais de ocorrer), 
com n(U) elementos, o evento E, com n(E) elementos, onde E Ì U, a probabilidade de ocorrer o evento E, 
denotado por p(E), é o número real, tal que:
Onde,
n(E) = número de elementos do evento E.
n(S) = número de elementos do espaço amostral S.
Sendo 0 ≤ P(E) ≤ 1 e S um conjunto equiprovável, ou seja, todos os elementos têm a mesma “chance 
de acontecer.
Atenção!!!
As probabilidades podem ser escritas na forma decimal ou representadas em porcentagem. 
Assim: 0 ≤ p(E) ≤ 1, onde:
p(∅) = 0 ou p(∅) = 0%
p(U) = 1 ou p(U) = 100%
Exemplo: (Pref. Niterói – Agente Fazendário – FGV) O quadro a seguir mostra a distribuição das ida-
des dos funcionários de certa repartição pública:
Faixa de idades (anos) Número de funcionários
20 ou menos 
De 21 a 30 
De 31 a 40 
De 41 a 50 
Mais de 50 
Escolhendo ao acaso um desses funcionários, a probabilidade de que ele tenha mais de 40 anos é:
(A) 30%;
(B) 35%;
(C) 40%;
(D) 45%;
(E) 55%.
Resolução:
O espaço amostral é a soma de todos os funcionário:
2 + 8 + 12 + 14 + 4 = 
O número de funcionário que tem mais de 40 anos é: 14 + 4 = 
Logo a probabilidade é:
Resposta: D.
1743257 E-book gerado especialmente para DIOVANI SIQUEIRA CALENZANI22
Probabilidade da união de eventos
Para obtermos a probabilidade da união de eventos utilizamos a seguinte expressão:
Quando os eventos forem mutuamente exclusivos, tendo A ∩ B = Ø, utilizamos a seguinte equação:
Probabilidade de um evento complementar
É quando a soma das probabilidades de ocorrer o evento E, e de não ocorrer o evento E (seu comple-
mentar, Ē) é 1.
Probabilidade condicional
Quando se impõe uma condição que reduz o espaço amostral, dizemos que se trata de uma probabili-
dade condicional.
Sejam A e B dois eventos de um espaço amostral U, com p(B) ≠ 0. Chama-se probabilidade de A con-
dicionada a B a probabilidade de ocorrência do evento A, sabendo-se que já ocorreu ou que vai ocorrer o 
evento B, ou seja:
Podemos também ler como: a probabilidade de A “dado que” ou “sabendo que” a probabilidade de 
B.
- Caso forem dois eventos simultâneos (ou sucessivos): para se avaliar a probabilidade de ocorrem 
dois eventos simultâneos (ou sucessivos), que é P (A ∩ B), é preciso multiplicar a probabilidade de 
ocorrer um deles P(B) pela probabilidade de ocorrer o outro, sabendo que o primeiro já ocorreu P (A | B). 
Sendo:
- Se dois eventos forem independentes: dois eventos A e B de um espaço amostral S são independen-
tes quando P(A|B) = P(A) ou P(B|A) = P(B). Sendo os eventos A e B independentes, temos:
P (A ∩ B) = P(A). P(B)
Lei Binomial de probabilidade
A lei binominal das probabilidades é dada pela fórmula:
1743257 E-book gerado especialmente para DIOVANI SIQUEIRA CALENZANI
23
Sendo:
n: número de tentativas independentes;
p: probabilidade de ocorrer o evento em cada experimento
(sucesso);
q: probabilidade de não ocorrer o evento (fracasso); q = 1 - p
k: número de sucessos.
A lei binomial deve ser aplicada nas seguintes condições:
- O experimento deve ser repetido nas mesmas condições as n vezes.
- Em cada experimento devem ocorrer os eventos E e .
- A probabilidade do E deve ser constante em todas as n vezes.
- Cada experimento é independente dos demais.
Exemplo:
Lançando-se um dado 5 vezes, qual a probabilidade de ocorrerem três faces 6?
Resolução:
n: número de tentativas ⇒ n = 
k: número de sucessos ⇒ k = 
p: probabilidade de ocorrer face 6 ⇒ p = 1/
q: probabilidade de não ocorrer face 6 ⇒ q = 1- p ⇒ q = 5/
Axiomas
Na matemática, um axioma é uma hipótese inicial de qual outros enunciados são logicamente deri-
vados. Pode ser uma sentença, uma proposição, um enunciado ou uma regra que permite a construção 
de um sistema formal. Diferentemente de teoremas, axiomas não podem ser derivados por princípios 
de dedução e nem são demonstráveis por derivações formais, simplesmente porque eles são hipóteses 
iniciais. Isto é, não há mais nada a partir do que eles seguem logicamente (em caso contrário eles seriam 
chamados teoremas). Em muitos contextos, “axioma”, “postulado” e “hipótese” são usados como sinôni-
mos. Como foi visto na definição, um axioma não é necessariamente uma verdade auto evidente, mas 
apenas uma expressão lógica formal usada em uma dedução, visando obter resultados mais facilmente. 
Axiomatizar um sistema é mostrar que suas inferências podem ser derivadas a partir de um pequeno e 
bem-definido conjunto de sentenças. Isto não significa que elas possam ser conhecidas independente-
mente, e tipicamente existem múltiplos meios para axiomatizar um dado sistema (como a aritmética). A 
matemática distingue dois tipos de axiomas: axiomas lógicos e axiomas não-lógicos.
Distribuições
A distribuição da probabilidade é uma função que determina probabilidades para eventos ou proposi-
ções. Para qualquer conjunto de eventos ou proposições existem muitas maneiras de determinar proba-
bilidades, de forma que a escolha de uma ou outra distribuição é equivalente a criar diferentes hipóteses 
1743257 E-book gerado especialmente para DIOVANI SIQUEIRA CALENZANI
24
sobre os eventos ou proposições em questão. Há várias formas equivalentes de se especificar uma dis-
tribuição de probabilidade. Talvez a mais comum é especificar uma função densidade da probabilidade. 
Daí, a probabilidade de um evento ou proposição é obtida pela integração da função densidade.
A função distribuição pode ser também especificada diretamente. Em uma dimensão, a função distri-
buição é chamada de função distribuição cumulativa. As distribuições de probabilidade também podem 
ser especificadas via momentos ou por funções características, ou por outras formas. Uma distribuição 
é chamada de distribuição discreta se for definida em um conjunto contável e discreto, tal como o sub-
conjunto dos números inteiros; ou é chamada de distribuição contínua se tiver uma função distribuição 
contínua, tal como uma função polinomial ou exponencial. A maior parte das distribuições de importância 
prática são ou discretas ou contínuas, porém há exemplos de distribuições que não são de nenhum des-
ses tipos.
Dentre as distribuições discretas importantes, pode-se citar a distribuição uniforme discreta, a distri-
buição de Poisson, a distribuição binomial, a distribuição binomial negativa e a distribuição de Maxwell-
-Boltzmann. Dentre as distribuições contínuas, a distribuição normal, a distribuição gama, a distribuição t 
de Student e a distribuição exponencial.
Distribuição Binomial
Em teoria das probabilidades e estatística, a distribuição binomial é a distribuição de probabilidade dis-
creta do número de sucessos numa sequência de n tentativas tais que as tentativas são independentes; 
cada tentativa resulta apenas em duas possibilidades, sucesso ou fracasso (a que se chama de tentativa 
de Bernoulli); a probabilidade de cada tentativa, p, permanece constante.
Função de probabilidade: Se a variável aleatória X que contém o número de tentativas que resultam 
em sucesso tem uma distribuição binomial com parâmetros n e p escrevemos X ~ B(n, p). A probabilida-
de de ter exatamente k sucessos é dado pela função de probabilidade:
para e onde é uma combinação.
Através do desenvolvimento do binômio e algumas operações com expoentes e fatoriais, é possível 
demonstrar que:
Exemplo: Três dados comuns e honestos serão lançados. A probabilidade de que o número 6 seja 
obtido mais de uma vez é: A probabilidade de que seja obtido 2 vezes mais a probabilidade de que seja 
obtido 3 vezes. Usando a distribuição binomial de probabilidade:
Acha-se a probabilidade de que seja obtido 2 vezes:
1743257 E-book gerado especialmente para DIOVANI SIQUEIRA CALENZANI
25
Agora a probabilidade de que seja obtido 3 vezes:
Assim, a resposta é:
Valor esperado e variância: Se a X ~ B(n, p) (isto é, X é uma variável aleatória binomialmente distribui-
da), então o valor esperado de X é
e a variância é
1743257 E-book gerado especialmente para DIOVANI SIQUEIRA CALENZANI
26
Exemplo: Seja X uma variável aleatória que contém o número de caras saídas em 12 lançamentos de 
uma moeda honesta. A probabilidade de sair 5 caras em 12 lançamentos, P(X=5), é dada por:
Distribuição Normal
A distribuição normal é uma das mais importantes distribuições da estatística, conhecida também 
como Distribuição de Gauss ou Gaussiana. Foi primeiramente introduzida pelo matemático Abraham de 
Moivre. Além de descrever uma série de fenômenos físicos e financeiros, possui grande uso na estatísti-
ca inferencial. É inteiramente descrita por seus parâmetros de média e desvio padrão, ou seja, conhecen-
do-se estes consegue-se determinar qualquer probabilidade em uma distribuição Normal.
Um interessante uso da Distribuição Normal é que ela serve de aproximação para o cálculo de outras 
distribuições quando o número de observações fica grande. Essa importante propriedade provém do 
Teorema do Limite Central que diz que “toda soma de variáveis aleatórias independentes de média finita 
e variância limitada é aproximadamente Normal, desde que o número de termos da soma seja suficiente-
mente grande” (ver o teorema para um enunciado mais preciso).
A distribuição normal foi introduzida pela primeira vez por Abraham de Moivre em um artigo noano 
1733, que foi reproduzido na segunda edição de seu The Doctrine of Chances (1738) no contexto da 
aproximação de distribuições binomiais para grandes valores de n. Seu resultado foi estendido por Lapla-
ce, em seu livro Analytical Theory of Probabilities (1812), e agora é chamado o teorema de Moivre-Lapla-
ce.
Laplace usou a distribuição normal na análise de erros de experimentos. O importante método dos 
mínimos quadrados foi introduzido por Legendre, em 1805. Gauss, que alegou ter usado o método des-
de 1794, justifica-o rigorosamente em 1809 assumindo uma distribuição normal para os erros. O fato de 
muitas vezes esta distribuição ser chamado de distribuição gaussiana pode ser um exemplo de Stigler’s 
Law.
O nome “curva em forma de sino” ou “curva de sino” remonta a Esprit Jouffret que primeiro utilizou o 
termo “superfície de sino” em 1872 para um normal bivariada com componentes independentes (atentar 
que nem toda curva de sino é uma gaussiana). O nome “distribuição normal”, foi inventado independente-
mente por Charles S. Peirce, Francis Galton e Wilhelm Lexis, por volta de 1875.
Função de densidade de probabilidade: A função densidade de probabilidade da distribuição normal com média 
e variância (de forma equivalente, desvio padrão ) é assim definida,
Se a variável aleatória segue esta distribuição escreve-se: ~ . Se e , a distribuição é 
chamada de distribuição normal padrão e a função de densidade de probabilidade reduz-se a,
1743257 E-book gerado especialmente para DIOVANI SIQUEIRA CALENZANI
27
Propriedades: Sejam a e b constantes conhecidas.
- Se X segue uma distribuição normal, ~ , então ~ . 
- Se X e Y são variáveis aleatórias independentes que seguem distribuição normal, então a soma U = 
X + Y, a diferença V = X - Y ou qualquer combinação linear W = a X + b Y também são variáveis aleató-
rias com distribuição normal. 
- É fácil construir exemplos de distribuições normais X e Y dependentes (mesmo com correlação zero) 
cuja soma X + Y não é normal. Por exemplo, seja X uma distribuição normal padrão (média 0 e variância 
1), então fixando-se um número real positivo a, seja Ya definida como X sempre que |X| < a e -X sempre 
que |X| ≥ a. Obviamente, Ya também é uma normal e X + Ya é uma variável aleatória que nunca pode 
assumir valores de módulo acima de 2 a (ou seja, não é normal). Quando a é muito pequeno, X e Y são 
praticamente opostas, e sua correlação é próxima de -1. Quando a é muito grande, X e Y são pratica-
mente idênticas, e sua correlação é próxima de 1. Como a correlação entre X e Ya varia continuamente 
com a, existe um valor de a para o qual a correlação é zero.
- A soma de uma grande quantidade de variáveis aleatórias (com algumas restrições) tende a uma 
distribuição normal - o significado mais preciso disto é o Teorema do Limite Central. 
- A distribuição normal é infinitamente divisível, no seguinte sentido: se X é uma variável aleatória que segue 
uma distribuição normal e n é um número natural, então existem n variáveis aletórias , inde-
pendentes e identicamente distribuídas, tal que
Inferência: estimação pontual e intervalar e testes de hipóteses
ESTIMAÇÃO PONTUAL
Estimador pontual Θ^ : Função dos valores x1, x2, … , xn da amostra multidimensional X1,X2, … ,Xn 
que, se tiver um dado conjunto de propriedades, dá um valor aproximado Θ^ para um parâmetro Θ da 
distribuição da população. Exemplos:
- A média amostral é um estimador da média populacional
- A variância amostral é um estimador da variância da população
Parte superior do formulário
Parte inferior do formulário
Propriedades Desejáveis dos Estimadores Pontuais
1743257 E-book gerado especialmente para DIOVANI SIQUEIRA CALENZANI
28
Estimador Não-enviesado (centrado/sem distorção): Enviesamento do estimador Θ^ = E(Θ^) - Θ Quan-
do o Enviesamento = 0 , o estimador diz-se não-enviesado.
- Média Amostral: E(X~) = E(X) = μX
- A média amostral é um estimador sempre não-enviesado do valor esperado, qualquer que seja a 
distribuição populacional.
- Desvio Quadrático Médio Amostral (DQM) = (N-1)/M . σX2 ≠ σX
- O DQM é um estimador sempre enviesado, de enviesamento = - σX2 / N
- Variância Amostral: S2 = 1/(N-1) . ∑ n=1 → N (Xn - X~)2 = N/(N-1) . DQM = σX
- A variância amostral é um estimador sempre não-enviesado da variância populacional, qualquer que 
seja a distribuição populacional.
Estimador Eficiente
- Um estimador é tanto “melhor” quanto menor for a sua variância.
- O estimador Θ^1 é melhor do que o estimador Θ^
Exemplo:
- Variância da média amostral = σX
- Variância da mediana amostral = σX2 * π/
A média amostral é um melhor estimador, pois tem a menor variância (é mais eficiente) 
- Eficiencia = E [ (Θ^ - Θ)2 ] = σΘ^2 + (EnviesamentoΘ^)
Estimador Consistente
Um estimador diz-se consistente quando, para qualquer δ > 0 , limn→oo P[|Θ^ - Θ| < δ] = 1 ;isto é, 
quando a dimensão da amostra tende para o infinito, o estimador consistente concentra se sobre o seu 
alvo tomando o valor do parâmetro estimado.
Por outro lado, se uma das duas seguintes condições(condições suficientes) se verificar, o estimador é 
consistente: 
- limn→oo (μΘ^ - Θ) = 0 e limn→oo σΘ^2 = 0 
- limn→oo E[(Θ^ - Θ)2] = 
Existem dois tipos de estimativas que podemos obter a partir de uma amostra aleatória:
Estimativa pontual: Fornecem como estimativa um único valor numérico para o parâmetro de interes-
se
Estimativa intervalar: Fornece um intervalo de valores “plausíveis” para o parâmetro de interesse.
Por serem variáveis aleatórias, os estimadores pontuais possuem uma distribuição de probabilidade 
(distribuições amostrais). Com isso, podemos apresentar uma estimativa mais informativa para o parâme-
tro de interesse, que inclua uma medida de precisão do valor obtido → estimativa intervalar ou intervalo 
de confiança.
Os intervalos de confiança são obtidos a partir da distribuição amostral de seus estimadores.
1743257 E-book gerado especialmente para DIOVANI SIQUEIRA CALENZANI
29
INTERVALO DE CONFIANÇA
Um intervalo de confiança (IC) é um intervalo estimado de um parâmetro de interesse de uma população. 
Em vez de estimar o parâmetro por um único valor, é dado um intervalo de estimativas prováveis. O quanto 
estas estimativas são prováveis será determinado pelo coeficiente de confiança , para .
Intervalos de confiança são usados para indicar a confiabilidade de uma estimativa. Por exemplo, um 
IC pode ser usado para descrever o quanto os resultados de uma pesquisa são confiáveis. Sendo todas 
as estimativas iguais, uma pesquisa que resulte num IC pequeno é mais confiável do que uma que resul-
te num IC maior.
Se e são estatísticas (isto é, funções da amostra) cuja distribuição de probabilidade dependa do parâ-
metro , e 
então o intervalo aleatório é um intervalo de confiança com nível para . Portanto, po-
demos interpretar o intervalo de confiança como um intervalo que contém os valores “plausíveis” que o pa-
râmetro pode assumir. Assim, a amplitude do intervalo está associada a incerteza que temos a respeito do 
parâmetro.
Considere uma amostra aleatória retirada de uma população com distribuição que 
depende do parâmetro . Por exemplo, tomamos uma amostra aleatória com distribuição 
normal com média desconhecida e desvio padrão conhecido . Para propormos um intervalo de con-
fiança para o parâmetro , vamos introduzir o conceito de quantidade pivotal. Uma função da amostra 
 e do parâmetro cuja distribuição de probabilidade não depende do parâmetro é denomi-
nada quantidade pivotal. Desta forma, dado o nível de confiança , tomamos 
Se a quantidade pivotal for inversível, podemos resolver a inequação acima em relação a e obter um 
intervalo de confiança.
Motivação
Suponha que queiramos estimar a média de uma população com distribuição normal com variância 
 conhecida. O estimador de máxima verossimilhança para a média populacional é dado pela média amos-
tral de uma amostra de tamanho . Assim, temos a seguinte quantidade pivotal . 
Para interpretar o intervalode confiança da média, assumimos que os valores foram amostrados de for-
ma independente e aleatória de um população com distribuição normal com média e variância . Dado 
que estas suposições são válidas, temos 95% de “chance” do intervalo conter o verdadeiro valor da média 
populacional. Em outras palavras, se produzirmos diversos intervalos de confiança provenientes de diferentes 
amostras independentes de mesmo tamanho, podemos esperar que aproximadamente 95% destes intervalos 
devem conter o verdadeiro valor da média populacional.
1743257 E-book gerado especialmente para DIOVANI SIQUEIRA CALENZANI
30
TESTES DE HIPÓTESES
As hipóteses a serem testadas, retirar as amostras das populações a serem estudadas, calcular as 
estatísticas delas e, por fim, determinar o grau de aceitação de hipóteses baseadas na teoria de decisão, 
ou seja, se uma determinada hipótese será validada ou não.
Para decidir se uma hipótese é verdadeira ou falsa, ou seja, se ela deve ser aceita ou rejeitada, consi-
derando uma determinada amostra, precisamos seguir uma série de passos: 
1) Definir a hipótese de igualdade (H0) e a hipótese alternativa (H1) para tentar rejeitar H0 (possíveis 
erros associados à tomada de decisão).
2) Definir o nível de significância (α).
3) Definir a distribuição amostral a ser utilizada.
4) Definir os limites da região de rejeição e aceitação.
5) Calcular a estatística da distribuição escolhida a partir dos valores amostrais obtidos e tomar a deci-
são.
1) Formular as hipóteses (Ho e H1).
Primeiramente, vamos estabelecer as hipóteses nula e alternativa. Para exemplificar, você deve con-
siderar um teste de hipótese para uma média. Então, a hipótese de igualdade é chamada de hipótese de 
nulidade ou Ho. Suponha que você queira testar a hipótese de que o tempo médio de ligações é igual a 
50 segundos. Então, esta hipótese será simbolizada da maneira apresentada a seguir:
Ho: μ = 50 (hipótese de nulidade)
Esta hipótese, na maioria dos casos, será de igualdade. Se você rejeitar esta hipótese, vai aceitar, 
neste caso, outra hipótese, que chamamos de hipótese alternativa. Este tipo de hipótese é simbolizado 
por H1 ou Ha.
2) Definir o nível de significância.
O nível de significância de um teste é dado pela probabilidade de se cometer erro do tipo I (ocorre 
quando você rejeita a hipótese Ho e esta hipótese é verdadeira). Com o valor desta probabilidade fixada, 
você pode determinar o chamado valor crítico, que separa a chamada região de rejeição da hipótese Ho 
da região de aceitação da hipótese Ho.
1743257 E-book gerado especialmente para DIOVANI SIQUEIRA CALENZANI
31
3) Definir a distribuição amostral a ser utilizada.
A estatística a ser utilizada no teste, você definira em função da distribuição amostral a qual os dados 
seguem. Se você fizer um teste de hipótese para uma média ou diferença entre médias, utilize a distri-
buição de Z ou t de Student. Outro exemplo é se você quiser comparar a variância de duas populações, 
então deverá trabalhar com a distribuição F, ou seja, da razão de duas variâncias.
4) Definir os limites da região de rejeição.
Os limites entre as regiões de rejeição e aceitação da hipótese Ho, você definirá em função do tipo 
de hipótese H1, do valor de (nível de significância) e da distribuição amostral utilizada. Considerando 
um teste bilateral, você terá a região de aceitação (não-rejeição) com uma probabilidade de 1- α e uma 
região de rejeição com probabilidade α (α/2 + α/2).
Através da amostra obtida, você deve calcular a estimativa que servirá para aceitar ou rejeitar a hipó-
tese nula.
5) Tomar a decisão.
Para tomar a decisão, você deve calcular a estimativa do teste estatístico que será utilizado para rejei-
tar ou não a hipótese Ho. A estrutura deste cálculo para a média de forma generalista é dada por:
Podemos exemplificar pela distribuição de Z, que será:
Se o valor da estatística estiver na região crítica (de rejeição), rejeitar Ho; caso contrário, aceitar H0. 
O esquema a seguir mostra bem a situação de decisão.
1743257 E-book gerado especialmente para DIOVANI SIQUEIRA CALENZANI
32
Teste de hipótese para média populacional
Quando você retira uma amostra de uma população e calcula a média desta amostra, é possível verifi-
car se a afirmação sobre a média populacional é verdadeira. Para tanto, basta verificar se a estatística do 
teste estará na região de aceitação ou de rejeição da hipótese Ho. Aqui você tem três situações distin-
tas:
1ª) se o desvio-padrão da população é conhecido ou a amostra é considerada grande (n >30), a distri-
buição amostral a ser utilizada será da Normal ou Z e a estatística-teste que você utilizará será:
Onde x: média amostral; μ: média populacional; σ: desvio padrão populacional e n: tamanho da amos-
tra.
2ª) agora, se você não conhecer o desvio-padrão populacional e a amostra for pequena, então, a dis-
tribuição amostral a ser utilizada será a t de Student, e a estatística teste será:
Onde x: média amostral; μ: média populacional; s: desvio-padrão amostral e n: tamanho da amos-
tra.
1. Estabelecer as hipóteses:
Fixamos H0: μ = μ0. Dependendo da informação que fornece o problema que estivermos estudando, a 
hipótese alternativa pode ter uma das três formas abaixo:
H1: μ ≠ μ0 (teste bilateral);
H1: μ > μ0 (teste unilateral à direita);
H1: μ < μ0 (teste unilateral à esquerda).
2. Fixar o nível de significância α.
3. Determinar a região crítica.
Se o teste é bilateral, determinamos os pontos críticos e tais que a 
partir da distribuição t de Student com n-1 graus de liberdade.
1743257 E-book gerado especialmente para DIOVANI SIQUEIRA CALENZANI
33
Se o teste é unilateral, determinamos o ponto crítico tal que .
Se o teste é unilateral à esquerda, determinamos o ponto tal que . 
1743257 E-book gerado especialmente para DIOVANI SIQUEIRA CALENZANI
34
4. Calcular, sob a hipótese nula, o valor:
Onde:
: valor da média amostral.
μ0: valor da média populacional sob a hipótese nula.
s: valor do desvio padrão amostral.
n: tamanho da amostra.
5. Critério: 
Teste bilateral: se ou se , rejeitamos H0. Caso contrário, aceitamos H0.
Teste unilateral à direita: se , rejeitamos H0. Caso contrário, aceitamos H0.
Teste unilateral à esquerda: se , rejeitamos H0. Caso contrário, aceitamos H0.
6. O p-valor no teste bilateral é dado por 
 
Se o teste é unilateral à direita, o p-valor é dado por 
e, se o teste é unilateral à esquerda, o p-valor é dado por
7. O intervalo de confiança é dado por
se o teste é bilateral. Se o teste é unilateral à direita, então o intervalo de confiança para o parâmetro 
μ é dado por
e, se o teste é unilateral à esquerda, então o intervalo de confiança para o parâmetro μ é dado por
1743257 E-book gerado especialmente para DIOVANI SIQUEIRA CALENZANI
35
Teste de hipóteses. Formalmente, o valor-p é definido como a probabilidade de se obter uma estatís-
tica de teste igual ou mais extrema quanto àquela observada em uma amostra, assumindo verdadeira a 
hipótese nula.
Teste de hipótese para a razão de duas variâncias.
Este teste de hipótese é utilizado para saber se duas variâncias populacionais são estatisticamente 
iguais ou se uma é maior do que a outra. Então, utilizando a distribuição F, poderemos formular o teste 
de hipótese da razão entre duas variâncias e chegar à conclusão baseados apenas nas estimativas cal-
culadas a partir das amostras. As hipóteses Ho e H1 serão:
A maior variância amostral encontrada será chamada de S12 (proveniente de uma amostra de tama-
nho n1), e a menor variância amostral será chamada S22 (proveniente de amostra de tamanho n2).
Teste de Student
É um teste de hipótese que usa conceitos estatísticos para rejeitar ou não uma hipótese nula quando 
a estatística de teste (t) segue uma distribuição t de Student.
Teste t pode ser conduzido para:
- Comparar uma amostra com uma população
- Comparar duas amostras pareadas
- Comparar duas amostras independentes
Se a variável de interesse segue uma distribuição próxima deuma curva normal em ambas popula-
ções:
uma distribuição t Student com n1+ n2-2 graus de liberdade.
Teste do qui quadrado2
Este teste objetiva verificar se a frequência absoluta observada de uma variável é significativamente 
diferente da distribuição de frequência absoluta esperada.
Teste do qui quadrado para uma amostra
Aplica-se quando se quer estudar a dependência entre duas variáveis, através de uma tabela de dupla 
entrada ou também conhecida como tabela de contingência.
Condições para a execução do teste
Exclusivamente para variáveis nominais e ordinais;
2 “Teste do qui quadrado” em Só Matemática. Virtuous Tecnologia da Informação, 1998-2020. Con-
sultado em 16/04/2020. Disponível na Internet em https://www.somatematica.com.br
1743257 E-book gerado especialmente para DIOVANI SIQUEIRA CALENZANI
36
Observações independentes;
Não se aplica se 20% das observações forem inferiores a 
Não pode haver frequências inferiores a 1;
Nos dois últimos casos, se houver incidências desta ordem, aconselha-se agrupar os dados segundo 
um critério em específico.
Procedimento para a execução do teste
1. Determinar H0. Será a negativa da existência de diferenças entre a distribuição de frequência ob-
servada e a esperada;
2. Estabelecer o nível de significância (µ );
3. Determinar a região de rejeição de H0. Determinar o valor dos graus de liberdade (φ), sendo K – 1 
(K = número de categorias). Encontrar, portanto, o valor do Qui-quadrado tabelado;
4. Calcular o Qui Quadrado, através da fórmula:
Sendo o Qui Quadrado calculado, maior do que o tabelado, rejeita-se H0 em prol de H1.
Exemplo: Um vendedor trabalhou comercializando um produto em sete bairros residenciais de uma 
mesma cidade em um mesmo período do ano.
Seu gerente decidiu verificar se o desempenho do vendedor oscilava em virtude do bairro trabalhado, 
ou seja, se as diferenças eram significativas nos bairros trabalhados.
A partir deste estudo o gerente poderia então elaborar uma estratégia comercial para cada bairro ou 
manter uma para todos.
H0: não há diferenças significativas entre os bairros
H1: as diferenças observadas para os bairros 3 e 4 são significativamente diferentes para melhor em 
relação aos demais bairros.
µ = 0,
g.l = 5 – 1 = 4, onde Qui quadrado tabelado é igual a 9,49.
Χ2 = (9-16)2 + (11 – 16) 2 + (25-16) 2 + (20 – 16) 2 + (15 – 16) 2/
Χ2 = 72 + 52 +92 + 42 + 12= 172/16 = 10,
1743257 E-book gerado especialmente para DIOVANI SIQUEIRA CALENZANI
37
Conclui-se que o Qui quadrado calculado (10,75) é maior do que o tabelado (9,49), rejeita-se H0 em 
prol de H1.
Portanto há diferença significativa, ao nível de 0,05, para os bairros 3 e 4. Face ao cálculo o gerente 
deve elaborar uma estratégia comercial para cada bairro.
Predição: abordagens; séries temporais; regressão linear simples e múltipla
CORRELAÇÃO (R)
Para FARBER (2009) correlação é uma medida da força e direção de uma relação entre duas variá-
veis.
- A amplitude do coeficiente de correlação é -1 para 1.
- Mais próximo de zero não há correlação linear.
Coeficiente de determinação
O coeficiente de r2 é a relação da variação explicada com variação total é dado por:
- Variação explicada é a soma dos quadrados das diferenças entre cada valor de y previsto e a
média de y.
- Variação total é a soma dos quadrados das diferenças entre cada valor de y e a média de y.
Em síntese temos: Correlação linear simples é uma técnica usada para analisar a relação entre duas 
variáveis.
Os pontos grafados, que são vistos em conjunto, formam uma elipse (trajetória, distribuição dos pon-
tos) em diagonal. Podemos imaginar que, quanto mais fina for a elipse, mais ela se aproximará de uma 
reta.
Dizemos então, que a correlação de forma elíptica tem como “imagem” uma reta, sendo, por isso, de-
nominada correlação linear. Podemos vê isso no exemplo a seguir. 
1743257 E-book gerado especialmente para DIOVANI SIQUEIRA CALENZANI
38
Assim, uma correlação é: 
Coeficiente de correlação ou coeficiente de Pearson é uma medida do grau de relação entre duas 
variáveis.
Onde: 
r = coeficiente de correlação e 
n = tamanho da amostra.
Exemplo: Uma amostra formada por 8 alunos de uma classe, pelo número de horas de estudo (x) e as 
notas obtidas (y), calcule o coeficiente de correlação r:
1743257 E-book gerado especialmente para DIOVANI SIQUEIRA CALENZANI
39
O coeficiente de correlação r = 0,975 indica que o grau de relação entre as duas variáveis é “Muito 
forte”, além de ser “Positiva” (pois x aumenta, y também aumenta). 
O grau de relação r pode variar de -1 até +1:
O fato de duas variáveis serem fortemente correlacionadas não implica uma relação de causa e efeito 
entre elas. 
SÉRIE TEMPORAL 
É um conjunto de observações sobre uma variável, ordenado no tempo”, e registrado em períodos 
regulares. Podemos enumerar os seguintes exemplos de séries temporais: temperaturas máximas e 
mínimas diárias em uma cidade, vendas mensais de uma empresa, valores mensais do IPC-A, valores 
de fechamento diários do IBOVESPA, resultado de um eletroencefalograma, gráfico de controle de um 
processo produtivo.
A suposição básica que norteia a análise de séries temporais é que há um sistema causal mais ou 
menos constante, relacionado com o tempo, que exerceu influência sobre os dados no passado e pode 
continuar a fazê-lo no futuro. Este sistema causal costuma atuar criando padrões não aleatórios que po-
dem ser detectados em um gráfico da série temporal, ou mediante algum outro processo estatístico.
O objetivo da análise de séries temporais é identificar padrões não aleatórios na série temporal de 
uma variável de interesse, e a observação deste comportamento passado pode permitir fazer previsões 
sobre o futuro, orientando a tomada de decisões.
Vamos ver o gráfico (passageiros transportados) de uma série temporal.
Que padrões não aleatórios podemos identificar na figura 1?
1743257 E-book gerado especialmente para DIOVANI SIQUEIRA CALENZANI
40
- observe que há uma tendência crescente no número de passageiros transportados (ou pelo menos 
havia antes de 11 de setembro de 2001...).
- há uma sucessão regular de “picos e vales” no número de passageiros transportados, isso deve ser 
causado pelas oscilações devido a feriados, períodos de férias escolares, etc., que estão geralmente 
relacionados às estações do ano, e que se repetem todo ano (com maior ou menor intensidade).
Em outras palavras, identificamos dois padrões que podem tornar a ocorrer no futuro: crescimento no 
número de passageiros transportados, flutuações sazonais. Tais padrões poderiam ser incorporados a 
um modelo estatístico, possibilitando fazer previsões que auxiliarão na tomada de decisões.
Modelo de séries temporais
Segundo o modelo clássico todas as séries temporais são compostas de quatro padrões:
- tendência (T), que é o comportamento de longo prazo da série, que pode ser causada pelo cresci-
mento demográfico, ou mudança gradual de hábitos de consumo, ou qualquer outro aspecto que afete a 
variável de interesse no longo prazo;
- variações cíclicas ou ciclos (C), flutuações nos valores da variável com duração superior a um ano, 
e que se repetem com certa periodicidade2, que podem ser resultado de variações da economia como 
períodos de crescimento ou recessão, ou fenômenos climáticos como o El Niño (que se repete com pe-
riodicidade superior a um ano);
- variações sazonais ou sazonalidade (S), flutuações nos valores da variável com duração inferior a 
um ano, e que se repetem todos os anos, geralmente em função das estações do ano (ou em função de 
feriados ou festas populares, ou por exigências legais, como o período para entrega da declaração de 
Imposto de Renda); se os dados forem registrados anualmente NÃO haverá influência da sazonalidade 
na série3;
- variações irregulares (I), que são as flutuações inexplicáveis, resultado de fatos fortuitos e inespera-
dos como catástrofes naturais, atentados terroristas como o de 11 de setembro de 2001, decisões intem-
pestivasde governos, etc.
Exemplo:
Tendência: É a reta que parte de um valor inicial até o valor final.
Variação Cíclica: É a curva que oscila de período a período em torno da tendência.
Variação Sazonal: É a oscilação que ocorre em torno da cíclica, ao qual pode ser ou não de forma 
periódica. 
G r á fic o 1 – C a p . 1 1 
 
Modelo aditivo: um modelo aditivo se no decorrer do tempo, a Variação Cíclica não se altera em torno 
da tendência, ou seja permanece constante, tal qual a figura ilustrativa.
1743257 E-book gerado especialmente para DIOVANI SIQUEIRA CALENZANI
41
Se traçasse as retas pelos valores máximos e pelos valores mínimos estas seriam paralelas entre sí e 
com a reta de tendência.
O Seu modelo Matemático é: Y = T + S + C + I.
Modelo Multiplicativo: diz se ter um modelo multiplicativo se no decorrer do tempo, a Variação Cíclica 
se altera em torno da tendência, tal qual a figura: 
No caso Multiplicativo, as retas pelos valores máximos e pelos valores mínimos são inclinadas com 
relação à reta de tendência.
Seu Modelo Matemático é: Y = T x S x C x I.
Obtenção da Tendência
A tendência descreve o comportamento da variável retratada na série temporal no longo prazo. Há três 
objetivos básicos na sua identificação: avaliar o seu comportamento para utilizá-lo em previsões, remo-
vê-la da série para facilitar a visualização das outras componentes, ou ainda identificar o nível da série (o 
valor ou faixa típica de valores que a variável pode assumir, se não for observado comportamento cres-
cente ou decrescente no longo prazo). A obtenção da tendência pode ser feita de três formas: através de 
um modelo de regressão (como o modelo linear - reta), através de médias móveis, ou através de ajuste 
exponencial (que não deixa de ser uma média móvel).
Obtenção da tendência linear
Para encontrar a função que fornece o valor da tendência em cada tempo, usa um dos modelos:
 I. Método dos Mínimos Quadrados
 II . Método das médias móveis;
I. Método dos Mínimos Quadrados
Este Método consiste em ajustar uma curva aos dados originais conforme os modelos matemáticos 
referente a Regressão e Correlação.
 O cuidado é o de atribui um valor para indicar o início da contagem do tempo.
As curvas mais usuais são: 
 01. A Reta;
 02. A Logarítmica;
1743257 E-book gerado especialmente para DIOVANI SIQUEIRA CALENZANI
42
 03. A Exponencial.
Para o caso linear, a reta de tendência será: T = a + b x t
Onde:
T é o valor da tendência, 
t é o valor do tempo, 
b é o coeficiente angular da reta (se positivo indica tendência crescente, se negativo a tendência é 
decrescente) e 
a é o coeficiente linear da reta. 
As equações dos coeficientes estão expressas a seguir.
Onde 
yi é um valor qualquer da variável registrada na série temporal, 
ti é o período associado a yi, e n é o número de períodos da série. 
Para encontrar os coeficientes basta calcular os somatórios (tal como em análise de regressão linear 
simples).
Exemplo:
 Os dados a seguir apresentam o patrimônio líquido (em milhões de reais) de um banco de 1985 
a 1995. Supondo que o modelo linear seja apropriado para descrever a tendência da série, encontre 
os coeficientes da reta de mínimos quadrados. Faça a previsão de tendência para os anos de 1996 e 
1997.
Ano Patrimônio (R$ 
1.000.000)
1985 30
1986 32
1987 32
1988 35
1989 37
1990 38
1991 42
1992 41
1993 44
1994 46
1995 47
1743257 E-book gerado especialmente para DIOVANI SIQUEIRA CALENZANI
43
A variável dependente é o saldo de vendas: será o Y. Há 11 períodos: n = 11. O próximo passo é en-
contrar os somatórios necessários para obter os coeficientes. Mas ao invés de usarmos os anos, o que 
poderia complicar nossos cálculos, vamos trabalhar com períodos, sendo 1985 o período 1, 1986 o 2 e 
assim por diante. A tabela ficaria então (já incluindo as colunas t x y e t2):
Substituindo os valores nas equações:
Então a equação de tendência é: T = 27,96 + 1,76 x t
O ano de 1996 corresponderá ao período 12, e 1997 ao período 13 da série temporal. Substituindo 
estes valores na equação acima:
T1996 = 27,96 + (1,76 x 12) = 49,
T1997 = 27,96 + (1,76 x 13) = 50,
Podemos então apresentar um gráfico (feito no Microsoft Excel) da série original, a reta de tendência e 
a projeção para os anos de 1996 e 1997.
II. Método das médias móveis.
Este método consiste em:
 01. Definir o número de agrupamentos, digamos k, de valores sequenciais que comporão cada mé-
dia;
1743257 E-book gerado especialmente para DIOVANI SIQUEIRA CALENZANI
44
 02. Calcular médias dos k valores a partir do: 10 valor; depois a partir do 2o, do 3o, etc. 
 Atribuição: Existem 2 situações possíveis sobre o valor de k, PAR ou IMPAR, com isto considera a 
primeira média móvel acordo com a posição: 
 Posição do Elemento Que Será Atribuído à 1a Média 
Valor de K Par Impar 
Posição 2
k 
2
1k + 
 
Exemplo:
Encontre as médias móveis dos dados da Tabela 1, tomando k = 7.
Considere as Variáveis: 
x: “Época, tendo dia 30 de junho como origem” 
y: “Número de Unidades Ocupadas”
Dados originais são: 
Período 
 
Dia da Semana 
Segunda Terça Quarta Quinta Sexta Sábado Dom. 
03 a 09* 46 48 53 55 41 26 20 
10 a 16* 38 51 49 40 34 29 18 
17 a 23* 39 51 51 48 33 23 19 
24 a 30* 38 49 48 40 34 28 16 
31 a 06** 36 42 26 45 41 22 20 
07 a 13** 42 45 45 51 33 19 19 
14 a 20** 35 50 47 59 47 21 21 
21 a 27** 37 44 46 44 26 18 16 
 
Médias Móveis com 7 períodos sequenciais:
Dados originais são: 
Período 
 
Dia da Semana 
Segunda Terça Quarta Quinta Sexta Sábado Dom. 
03 a 09* 46 48 53 55 41 26 20 
10 a 16* 38 51 49 40 34 29 18 
17 a 23* 39 51 51 48 33 23 19 
24 a 30* 38 49 48 40 34 28 16 
31 a 06** 36 42 26 45 41 22 20 
07 a 13** 42 45 45 51 33 19 19 
14 a 20** 35 50 47 59 47 21 21 
21 a 27** 37 44 46 44 26 18 16 
 
Médias Móveis:
 
Primeira Média 
Móvel 
 
29,41
7
20264155534846
y1 =
++++++
= 
Segunda Média 
Móvel 
 
14,40
7
38202641555348
y 2 =
++++++
= 
Terceira Média 
Móvel 
 
57,40
7
51382026415553
y 3 =
++++++
= 
Etc. • • • 
 
E o quadro completo de médias móveis é:
1743257 E-book gerado especialmente para DIOVANI SIQUEIRA CALENZANI
45
Dia 3 4 5 6 7 8 9 
Ocupação 46 48 53 55 41 26 20 
Média Móvel - - - 41,29 40,14 40,57 40,00 
 
Dia • • • 54 55 56 57 58 
Ocupação • • • 46 44 26 18 16 
Média Móvel • • • 33,71 33,00 - - - 
 
Por este exemplo percebe-se que: 
a) A primeira média móvel refere-se ao dia 6 de julho (x = 6)
b) A segunda média móvel refere-se ao dia 7 de julho (x = 7)
c) A última média móvel refere-se ao dia 24 de agosto (x = 55)
Ajuste Exponencial
O ajuste exponencial é uma outra forma de obter a tendência de uma série temporal.
Apresenta algumas vantagens em relação às médias móveis:
- permite realizar previsões de curto prazo (para o período seguinte da série), o que não é possível por 
médias móveis.
- leva em conta todos os valores previamente observados ao período sob análise, e não somente 
os
“mais próximos” dele, como ocorre nas médias móveis.
Na realidade o ajuste exponencial fornece uma média móvel exponencialmente ponderada ao longo 
da série temporal: ou seja, cada previsão ou valor ajustado depende de todos os valores prévios. Os 
pesos designados para os valores observados decrescem ao longo do tempo, ou seja, o valor observado 
mais recentemente recebe o maior peso, o valor anterior o segundo maior e o valor observado inicial-
mente recebe o menor peso: isso é bom senso, imagina-se que os dados mais recentes devam ter mais 
influência nas previsões do que os mais antigos. O ajuste exponencial é uma das ferramentas disponí-
veis no suplemento Análise de Dados do Microsoft Excel.
Para realizar o ajuste exponencial basta aplicar a seguinte fórmula para um período de tempo i qual-
quer:
Onde:
i - um período de tempo qualquer;
Yi - valor da série original no período i;
Ei- valor da série exponencialmente ajustada no período i;
Ei-1 - valor da série exponencialmente ajustada no período i - 1 (período anterior);
W - constante de regularização ou coeficiente de ajuste (0 < W < 1);
1743257 E-book gerado especialmente para DIOVANI SIQUEIRA CALENZANI
46
Considera-se que o primeiro valor da série original será igual ao primeiro valor ajustado, isto significa 
que o ajuste realmente começa a partir do segundo período da série. Como cada valor ajustado leva em 
conta o valor ajustado imediatamente anterior (multiplicado pela constante de regularização) teoricamen-
te todos os valores prévios da série contribuem para o valor ajustado.
A escolha da constante de regularização W é crucial para o ajuste exponencial, mas é um processo 
subjetivo. Não obstante, é possível estabelecer uma regra de escolha:
- se o interesse é simplesmente obter a tendência, eliminando o efeito das outras componentes, o 
valor de W deverá ser próximo de zero;
- se houver interesse, porém, em realizar previsão com a série é recomendável que o valor de W seja 
mais próximo de 1, de maneira a refletir melhor o comportamento da série no curto prazo.
Exemplo:
Faça o ajuste exponencial da série de vendas do Exemplo 4.2 (usando W = 0,25; W = 0,5; W = 0,75 e 
W = 0,10). Construa um gráfico conjunto da série original com os quatro ajustes.
Vamos demonstrar os cálculos para W = 0,25.
Vamos considerar que o primeiro valor da série, Y1970, será igual ao primeiro valor ajustado, 
E1970.
Podemos então realizar o ajuste para o ano de 1971:
Para o ano de 1972:
O processo segue até o final da série. De maneira análoga podemos obter o ajuste para W = 0,5 e
W = 0,75. 
O gráfico é mostrado abaixo:
1743257 E-book gerado especialmente para DIOVANI SIQUEIRA CALENZANI
47
Quanto menor o valor de W mais “alisada” é a série, com as variações de curto prazo sendo amortiza-
das, possibilitando visualizar o comportamento de longo prazo da série, seja ele crescente/decrescente 
ou estacionário: para W = 0,1 é fácil perceber uma tendência crescente nas vendas, mas que parece 
estar se estabilizando. À medida que o valor de W aproxima-se de 1 o ajuste exponencial torna-se mais 
próximo da série original, o que pode ser útil na previsão para o ano de 1993.
Regressão Múltipla
A regressão múltipla é o método de análise apropriado quando o problema envolve uma única variável 
(métrica) dependente que se presume estar relacionada com uma ou mais (também métricas) variáveis 
independentes. O objetivo da análise de regressão é prever as mudanças na variável dependente em 
resposta às mudanças que ocorrem nas várias variáveis independentes. Este objetivo é quase sempre 
alcançado através do método dos mínimos quadrados.
( ) ( )ão métricamétrica, nmétrico
XXXXY n
 
... 3211 ++++=
Abordagem: método que relaciona uma única VD métrica a duas ou mais VI´s métricas ou não métri-
cas adequadamente transformadas em métricas.
Objetivo: examinar a relação entre uma VD e duas ou mais VI´s.
Passos: 
- definir se o objetivo é de previsão ou de explicação
- selecionar VD e VI´s 
- obter um tamanho de amostra adequado
- Verificar normalidade, linearidade, homoscedasticidade e independência dos termos de erro
- estimação do modelo de regressão
- avaliação do ajuste do modelo
- interpretação e validação dos resultados.
1743257 E-book gerado especialmente para DIOVANI SIQUEIRA CALENZANI
48
Análise Discriminante
Se a única variável dependente for dicotômica (por exemplo: homem-mulher) ou categórica (por exem-
plo: alto, médio, baixo) e desta forma qualitativa, a técnica multivariada apropriada é a análise discri-
minante. Assim como na regressão múltipla as variáveis independentes são por hipótese quantitativas. 
A análise discriminante é útil em situações onde a amostra total pode ser dividida em grupos baseados 
na variável dependente caracterizando várias classes conhecidas. O principal objetivo da análise dis-
criminante é entender diferenças entre grupos e prever a probabilidade de que uma entidade (indivíduo 
ou objeto) pertença a uma classe em particular ou grupo baseado nas várias variáveis independentes. 
Por exemplo, a análise discriminante pode ser usada para diferenciar inovadores de não-inovadores de 
acordo com seus perfis demográficos e psicográficos. Uma outra aplicação inclui distinguir grande consu-
midores de pequenos consumidores de um determinado produto, homens de mulheres e créditos bons de 
créditos ruins, etc. Até a receita federal americana utiliza a análise discriminante para comparar o paga-
mento de impostos de renda de locais selecionados com um contribuinte hipotético e para identificar os 
retornos mais promissores e as áreas de auditoria.
Análise de variância multivariada
Análise de variância multivariada ou MANOVA (Multivariate Analysis of Variance) é uma técnica es-
tatística que pode ser utilizada para explorar simultaneamente o relacionamento entre várias variáveis 
categóricas independentes (normalmente referenciadas como tratamentos) e duas ou mais variáveis de-
pendentes métricas. Como tal ela representa uma extensão da análise de variância univariada ou ANO-
VA (Analysis of Variance). A análise multivariada de covariância ou MANCOVA (Multivariate Analysis of 
Covariance) também pode ser usada em conjunto com a MANOVA para remover, após o experimento, o 
efeito de qualquer variável independente não controlável sobre as variáveis dependentes. O procedimen-
to é semelhante ao usado na avaliação do coeficiente de correlação parcial bivariado. A MANOVA é útil 
quando o pesquisador projeta uma situação experimental (manipulação de várias variáveis não-métricas 
ou tratamentos) para testar hipóteses com respeito a variância em grupos de resposta em duas ou mais 
variáveis dependentes métricas.
Regressão logística
REGRESSÃO LOGÍSTICA3 
Conhecida como Logit, é uma técnica de modelagem utilizada para lidar com variáveis binárias (0 ou 
1). Para responder a questões como “qual o salário de um indivíduo, dado seus anos de estudos”, “qual o 
valor de uma casa, dadas suas características”, a regressão linear é suficiente. Entretanto, se quisermos 
responder a questões como “o indivíduo vai pagar uma dívida?”, “o consumidor vai comprar determinado 
produto?”, i.e., perguntas de sim (=1) ou não (=0), aí faz sentido usar outro modelo, dentre as diversas 
possibilidades temos a regressão logística.
Regressão Logística, também chamada de Logit, é uma técnica de modelagem utilizada para lidar com 
variáveis binárias (0 ou 1). Para responder a questões como “qual o salário de um indivíduo, dado seus 
anos de estudos”, “qual o valor de uma casa, dadas suas características”, a regressão linear é suficiente. 
3 Disponível em https://estatsite.com.br/2018/08/29/regressao-logistica-conceitos-e-formula/ Aces-
so em 07.12.2022
1743257 E-book gerado especialmente para DIOVANI SIQUEIRA CALENZANI
49
Entretanto, se quisermos responder a questões como “o indivíduo vai pagar uma dívida?”, “o consumi-
dor vai comprar determinado produto?”, i.e., perguntas de sim (=1) ou não (=0), aí faz sentido usar outro 
modelo, dentre as diversas possibilidades temos a regressão logística.
Por que não usar a regressão linear com variáveis binárias? Esta pergunta é comum e temos como 
principal resposta está nas premissas assumidas:
- Primeiro, veja que a premissa da regressão linear é que exista uma relação linear entre a variável 
resposta e as variáveis explicativas. Para o caso de variáveis binárias, principalmente quando temos uma 
variável explicativa contínua, essa premissa será violada;
- Os valores projetados por um modelo de regressão linear podem ser superiores a 1 ou inferiores a 
0;
- A premissa de variância constante dos resíduos é violada.
Regressão logística é um algoritmo de classificação. Um exemplo clássico é o modelo para inadim-
plência, que deve prever se um indivíduo vai pagar ou não a sua dívida. Outro exemplo, bastante utiliza-
do nos cursos em que se utiliza o

Continue navegando