Buscar

EBook_ Fundamentos_Estatística

Prévia do material em texto

FUNDAMENTOS DE ESTATÍSTICA
Jeronimo Flores
2FUNDAMENTOS DE ESTATÍSTICA
SUMÁRIO
CENTRO UNIVERSITÁRIO UNIFTEC
Rua Gustavo Ramos Sehbe n.º 107. 
Caxias do Sul/ RS 
REITOR
Claudino José Meneguzzi Júnior
PRÓ-REITORA ACADÊMICA
Débora Frizzo
PRÓ-REITOR ADMINISTRATIVO
Altair Ruzzarin
DIRETORA DE EDUCAÇÃO A DISTÂNCIA (NEAD)
Lígia Futterleib
Desenvolvido pelo Núcleo de Educação a 
Distância (NEAD)
Designer Instrucional 
Sabrina Maciel
Diagramação, Ilustração e Alteração de Imagem
Darlan Scheid, Igor Zattera
Revisora
Ana Clara Garcia
INTRODUÇÃO À ESTATÍSTICA 3
NOÇÕES FUNDAMENTAIS 4
ESTATÍSTICA DESCRITIVA 5
AMOSTRAGEM 9
DISTRIBUIÇÃO DE FREQUÊNCIA 13
ATIVIDADE 17
ESTATÍSTICA BÁSICA 19
MEDIDAS ESTATÍSTICAS 20
REGRESSÃO LINEAR SIMPLES 30
INTERVALO DE CONFIANÇA 33
ATIVIDADE 35
GABARITOS 36
REFERÊNCIAS 38
3FUNDAMENTOS DE ESTATÍSTICA
INTRODUÇÃO À 
ESTATÍSTICA
A estatística é um ramo da Matemática que 
se propõe a coletar, organizar, sistematizar, 
descrever, analisar e interpretar dados para 
o auxílio no processo de tomada de decisão 
A estatística vem sendo utilizada há séculos. Na bíblia 
Sagrada existem relatos de história de contagem de pessoas 
com finalidades militares e de cobrança de impostos. 
 Você se considera uma pessoa azarada? A fila em que 
você está no supermercado sempre anda mais devagar? Ou 
sempre chove quando você esquece o guarda-chuva? A maior 
parte dos fenômenos que as pessoas atribuem à “sorte” ou ao 
“azar” podem ser calculados, medidos e mesmo previstos por 
meio de procedimentos estatísticos. 
4FUNDAMENTOS DE ESTATÍSTICA
 Podemos dividir a estatística em 
três grandes áreas: a estatística descriti-
va, a estatística inferencial e a estatística 
probabilística. Na estatística descritiva, os 
procedimentos resumem-se a descrever os 
dados, o que exige organização, síntese e 
apresentação. Na estatística inferencial, 
procuramos generalizar um fenômeno a 
partir do estudo com uma fração ou pedaço 
dele. Já, na estatística probabilística mede 
as tendências de um fenômeno aconte-
cer, partindo de observações preliminares 
(CORREA, 2003).
NOÇÕES FUNDAMENTAIS 
Neste item iremos estudar alguns 
conceitos e ideias que serão de suma im-
portância para o nosso sucesso na disci-
plina. Como: 
• Variável: uma característica que 
pode assumir distintos valores, de acordo 
com os sujeitos e o contexto (CORREA, 
2003). Por exemplo: o crescimento de uma 
planta, a distância que o vendedor percorre 
com o carro da empresa, o desgaste de 
uma peça, etc; 
• População: é o conjunto formado 
por elementos que tenham pelo menos uma 
variável comum (MORETTIN, 2010); 
• Amostra: após a população ser de-
finida, um subconjunto ou “recorte” dessa 
será a amostra. Utiliza-se n para indicar 
o número que foi amostrado (MORET-
TIN, 2010); 
• Amostragem: é o processo utili-
zado para a composição da amostra (MO-
RETTIN, 2010); 
• Dados brutos: são os dados na 
forma com que foram coletados, sem qual-
quer tratamento matemático. (CORREA, 
2003);
• Frequência: é o número de vezes 
que um fenômeno se repete (CORREA, 
2003);
• Rol: É a organização dos dados 
brutos na forma crescente ou decrescente 
(CORREA, 2003); 
• Parâmetro: é uma medida utiliza-
da para descrever as características de uma 
população de forma numérica. A média 
e a variância são exemplos de parâmetros 
(MORETTIN, 2010);
• Censo: é uma pesquisa em que a 
população é igual à amostra (CORREA, 
2003). O IBGE se propõe a fazer um censo 
da população brasileira, ou seja, entrevistar 
todos os habitantes do país. 
Vamos exemplificar:
5FUNDAMENTOS DE ESTATÍSTICA
Refletindo
Você trabalha no restaurante de 
uma empresa onde, diariamente, 
almoçam 300 funcionários. O seu 
interesse é mudar o cardápio, mas 
não tem certeza se irão aprovar. 
Você não tem tempo nem recursos 
para fazer um almoço para todos. 
Assim, sorteia 30 pessoas, faz um 
almoço teste e pede para que eles 
atribuam uma nota de zero a dez 
ao cardápio. Para estimar uma nota 
geral, faz-se uma média das notas. 
Assim, temos:
População: 300 pessoas
Amostra: 30 pessoas
Amostragem: sorteio 
Parâmetro: média 
ESTATÍSTICA DESCRITIVA
A estatística descritiva visa descrever 
os fenômenos. Assim, gráficos, tabelas 
e histogramas são valiosos para que isto 
seja possível. 
TABELAS 
Tabelas podem ser muito úteis no 
processo de organização, sistematização 
e apresentação dos dados. A maior parte 
das tabelas apresentam as variáveis e a 
sua frequência. Uma tabela pode ser de 
entrada simples, quando conter apenas 
uma variável ou de entrada dupla quanto 
conter mais de uma. 
Vale a pena lembrar que a estatística 
descritiva parte de um processo de conta-
gem. Você conta algo, para posteriormen-
te seguir com os demais processos. Por 
exemplo, verificou-se a distância que o 
vendedor da empresa em que você trabalha 
anda com o carro da empresa. 
Dia Distância (Km)
Segunda-feira 80
Terça-feira 75
Quarta-feira 120
Quinta-feira 100
Sexta-feira 84
Sábado 67
Distância
6FUNDAMENTOS DE ESTATÍSTICA
Considerando, unicamente, os nú-
meros 80, 75, 120, 100, 84 e 67 pode-
mos dizer que temos os dados brutos da 
distância percorrida. No momento em 
que eles forem organizados seguindo um 
padrão matemático: 67, 75, 80, 84, 100 e 
120 temos um rol. 
Outro conceito importante é o de 
amplitude total (h). 
Assim, podemos dizer que a am-
plitude total da distância percorrida pelo 
vendedor é dada por h= 120 -67 h= 53 km.
 Quando o nosso processo de conta-
gem exigir a consideração de mais de uma 
variável significativa, podemos montar 
uma tabela de entrada dupla. Por exemplo, 
você foi responsabilizado para verificar 
se os funcionários da empresa desejam 
realizar horas extras. A sua experiência 
Amplitude, refere-se ao tamanho, ou 
seja, o maior valor menos o menor.
anterior, indica que homens e mulheres tem opiniões diferentes a respeito desse as-
sunto. Então, a tabela é organizada com as variáveis “homens” e “mulheres”. 
GRÁFICOS 
 Gráficos, além de fornecerem a organização dos dados, são excelentes para 
apresentações e palestras, pois produzem um efeito visual interessante e revelam o 
comportamento do fenômeno. Entretanto, são necessários alguns cuidados na sua 
elaboração, dentre os quais destacamos: veracidade, clareza e simplicidade. Lembre-
-se que os gráficos podem ser apresentados para pessoas que não conhecem a sua 
pesquisa, logo, eles precisam fornecer uma ideia do que aconteceu. 
Interesse em realizar 
horas extras
Homens Mulheres Total
Não 16 35 51
Sim 45 5 50
Total 61 40 101
Entrada dupla
7FUNDAMENTOS DE ESTATÍSTICA
Gráfico em colunas
Observe que o gráfico a seguir, 
apesar de representar o fenômeno, pode 
conter problemas para uma apresentação. 
Veja que alguns vendedores não tem a sua 
venda indicada, levando o leitor a precisar
supor o valor exato da venda. Além dis-
so, seria necessário especificar o período 
para termos uma noção de como as vendas 
aconteceram. 
Assemelha-se ao gráfico em colu-
nas, porém, os retângulos são dispostos 
horizontalmente (CORREA, 2003, p.25). 
A escolha do modelo depende exclusi-
vamente do interesse e da preferência de 
quem fez o gráfico, pois são representações 
muito similares.
Entenda mais sobre os tipos de gráficos:
Ainda sobre Gráfico em barras:
O gráfico a seguir indica as vendas dos repre-
sentantes comerciais da empresa “Sul Metais” Ltda. 
Vendas Vendas
O gráfico a seguir indica as vendas dos repre-
sentantes comerciais da empresa “Sul Metais” Ltda. 
8FUNDAMENTOS DE ESTATÍSTICA
Gráfico em setores
 É o famoso gráfico em “pizza”. 
Consiste em repartir um círculo em vários 
setores ou fatias. Utilizamos principalmen-
te quando queremos comparar os valores 
encontrados com o total (CORRREA, 
2005, p.25). Esse gráfico produz um bom 
aspecto visual, sendo muito utilizado em 
apresentações. 
Exemplo: 
O gráfico abaixo revela os gastos 
com papel em um escritório de uma de-
terminada empresa.O gráfico, apesar de produzir um 
bom efeito visual, também apresenta al-
gumas limitações. Por exemplo, observe a 
quantia de tons de azul e roxo utilizadas, 
o que pode confundir o leitor. Mesmo 
que tenhamos uma legenda, pois ela não 
indica exatamente em que local está o mês 
inicial, podendo causar uma certa confu-
são. Dessa forma, é possível dizermos que 
ele falha no aspecto clareza. Sobretudo, 
para apresentações, devemos estar muito 
atentos ao modo pelo qual as pessoas irão 
entende-lo.
Gráfico em linhas
Constitui uma aplicação do processo 
de representação das funções num sistema 
de coordenadas cartesianas (CORREA, 
2003, p.24). São bastante úteis quando 
almejamos visualizar a variação de um 
fenômeno, por exemplo, as vendas da em-
presa, subiram, baixaram e mantiveram-se 
constantes. Comparações entre dois fenô-
menos também são interessantes. 
Gastos de papel no Escritório
9FUNDAMENTOS DE ESTATÍSTICA
Exemplo: 
O gráfico a seguir indica as vendas 
de João Carlos durante os primeiros meses 
do ano de 2016.
Perceba que com esse tipo de 
gráfico é possível observar com clareza 
os períodos de queda e de crescimento 
nas vendas do representante. 
AMOSTRAGEM
Podemos entender a população 
como a totalidade dos sujeitos envolvidos 
na pesquisa. A amostra é um “recorte” 
dessa população. A amostragem é a forma 
como efetuamos esse “recorte”.
Veja as classificações de amostra-
gem! 
Existem outros tipos de gráficos que 
devem ser usados, de acordo com 
a necessidade do pesquisador, mas, 
sobretudo, com o uso do bom senso. 
Amostragem é a forma ou técnica 
utilizada para compormos a amostra. 
10FUNDAMENTOS DE ESTATÍSTICA
AMOSTRAGENS PROBABILÍSTICAS
São técnicas que envolvem elemen-
tos estatísticos durante a composição da 
amostra. Aqui, procuramos eliminar o 
viés da aleatoriedade. 
Amostragem aleatória simples
 Nesse processo, precisamos identifi-
car todos os elementos da população, sele-
cionando a amostra a partir de um sorteio. 
É imprescindível que todos os elementos 
da população tenham a mesma chance de 
pertencerem à amostra (BARBETTA, 
2002). Para isso, é muito importante a 
realização de um sorteio honesto. Uma boa 
ideia é a utilização de geração de números 
aleatórios. Na planilha eletrônica, você 
pode utilizar o comando ALEATÓRIO-
ENTRE. Por exemplo, você deseja sortear 
um número aleatório entre 1 e 120. Basta 
digitar “=ALEATÓRIOENTRE(1;120)”. 
Amostragem sistemática
É similar à amostragem aleatória 
simples, sendo utilizada quando almeja-
mos compor a amostra a partir de ciclos. 
É necessário ordenar os elementos, for-
necendo uma cobertura mais ampla do 
fenômeno (BARBETTA, 2002). 
1) Numerar aleatoriamente os fun-
cionários.
2) Construir um intervalo de seleção 
(K), dividindo-se o número da população 
(N) pelo da amostra (n):
 
3) Sortear um funcionário aleatoria-
mente entre 1 e 6. Suponha que o número 
sorteado foi 5. O primeiro funcionário da 
amostra será “Alfredo”. Os demais serão 
obtidos a partir do intervalo de seleção, 
sendo adicionados 6. Assim, iremos en-
trevistar: 5) Alfredo 11) Monique 17) 
Dener 23) Jaqueline 29) Sinara 
Exemplo: A construtora “JBF cons-
truções” tem 30 funcionários e deseja en-
trevistar 5 deles em relação às condições 
de segurança no trabalho. A amostragem 
será a sistemática. Vamos aos passos:
1) Beto 7) Cristiane 13) Alexandre 19) Andrei 25) Marcelo
2) Marilene 8) Daniel 14) Bruna 20) Débora 26) Tiago
3) Carlos 9) Márcio 15) Gláucia 21) Janice 27) Ana Paula
4) Ângela 10) Simone 16) Ivo 22) Marluce 28) Max
5) Alfredo 11) Monique 17) Dener 23) Jaqueline 29) Sinara
6) Vicente 12) Maicon 18) João 24) Patrícia 30) Marília
K= N/n K= 30/5 K=6 
Este número sempre deve ser 
arredondado.
11FUNDAMENTOS DE ESTATÍSTICA
Amostragem estratificada
Consiste em dividir a população em 
grupos, denominados estratos, que devem 
ser homogêneos em relação às característi-
cas das variáveis de estudo (BARBETTA, 
2002). 
Perceba que essa técnica de amos-
tragem “varreu” todos os estratos consi-
derados, já, com outra técnica, isso não 
seria possível.
Amostragem por conglomerados
 Nesse tipo de amostragem, elege-
mos conglomerados da população, que 
consistem em agrupamentos da população. 
Após selecionados os conglomerados, um 
deles é sorteado por amostragem aleató-
ria simples e todos os elementos dele são 
analisados. 
1) Indústrias 
2) Comércio
3) Instituições de Ensino Superior
4) Empresas de Consultoria 
Realizamos um sorteio aleatório 
entre os números 1 e 4. Suponha que o 
número 2 foi sorteado. Assim, precisa-
mos entrevistar todos os administradores 
que trabalham no comércio na cidade de 
Caxias do Sul. 
Amostragens não probabilísticas
 Em muitas situações não é possível 
conhecer a priori, a probabilidade de um 
elemento da população pertencer à amos-
tra. Em outras, é muito difícil numerar-se 
toda a população (BARBETTA, 2002). 
Exemplo: Para eleger um represen-
tante para o sindicato, do qual a sua em-
presa é filiado, foi realizada uma pesquisa 
em relação ao estilo de liderança que os 
funcionários preferem. Você decidiu en-
trevistar 20%, e percebeu que cada função 
pode ter uma opinião diferente. Assim, 
foi feita uma amostragem estratificada, 
considerando que na empresa tem 10 me-
cânicos, 10 auxiliares de escritório e 30 
operários. Componha a amostra:
A composição dos estratos deve 
considerar a realidade do cenário 
pesquisado, bem como os valores da 
amostra devem ser arredondados. 
Função População Amostra
Mecânico 10 2
Auxiliar de 
escritório
10 2
Operário 30 6
Total 50 10
Exemplo: Desejamos pesquisar a sa-
tisfação de administradores de empresa na 
cidade de Caxias do Sul, e utilizamos a 
amostragem por conglomerados. Inicial-
mente, devemos compor os conglomera-
dos, que são os possíveis “lugares” em que 
estão os administradores. Vamos supor:
12FUNDAMENTOS DE ESTATÍSTICA
Exemplo: Em uma pesquisa sobre a 
saúde dos peixes em um rio, não é possível 
determinarmos nem fazermos a numeração 
da população. Nesses casos, utilizamos as 
amostragens não probabilísticas. 
Amostragem a esmo
Como o nome sugere, consiste em 
escolher a esmo, sem um critério matemá-
tico previsto anteriormente. Nesse caso, 
contamos com o acaso para escolhermos 
os representantes da população. 
Amostragem intencional
Pode ser utilizada quando o pes-
quisador visa uma determinada caracte-
rística dentro da população. É um tipo de 
pesquisa bastante utilizada no mercado 
consumir, pois visa um determinado tipo 
ou perfil de cliente. 
Amostragem por cotas
Assemelha-se à amostragem estra-
tificada, também trabalhando com sub-
conjuntos, em que a população é dividida. 
Seleciona-se para participar da amostra 
uma cota de cada subgrupo, sendo pro-
porcional ao seu tamanho. Entretanto a 
seleção não tem a necessidade de ser ale-
atória (BARBETTA, 2002). 
Exemplo: Uma empresa deseja pro-
mover um estudo sobre o “peso” dos seus 
funcionários. Levou-se em conta o sexo 
e a idade. Como não era possível obrigar 
todos os funcionários a realizar o exame, a 
instituição chegou aos seguintes números 
de entrevistados:
Exemplo: Queremos testar a resis-
tência de parafusos ao calor. Temos 5.000 
parafusos e queremos analisar 250. Seria 
inviável numerar os parafusos e utilizar a 
amostragem aleatória simples, por exem-
plo. Assim, sorteamos os 250 parafusos 
ao acaso ou a esmo, que justifica o nome 
da técnica.
Exemplo: Você trabalha no setor de 
qualidade de uma empresa que manufatura 
tabaco, e almeja conferir a satisfação sobre 
uma nova marca de cigarro disponível no 
mercado. Assim, devem ser entrevistados, 
intencionalmente, fumantes. Uma amos-
tragem composta de outra forma, além de 
poder formar uma amostra pequena, pode 
causar uma série de constrangimentos para 
o pesquisador. 
Sexo Mais de 40 anos
Menos de 40 
anos
Masculino 48% 14%
Feminino 26% 12%
13FUNDAMENTOS DE ESTATÍSTICA
Perceba que um dos estratos (mas-
culina com mais de 40 anos) foi de certaforma privilegiado, com um percentual 
maior de entrevistas, o que pode “conta-
minar” a pesquisa.
DISTRIBUIÇÃO DE 
FREQUÊNCIA 
Podemos entender a frequência 
como o número de vezes que um fenô-
meno se repete. 
Uma distribuição de frequência é 
uma tabela na qual os possíveis valores de 
uma variável se encontram agrupados em 
classes, registrando-se o número de valores 
observados em cada classe (KAZMIER, 
1982, p.8). 
Em pesquisas eleitorais são utilizadas 
amostragens por cotas. Consideram-
se sexo, escolaridade e renda, por 
exemplo.
DISTRIBUIÇÃO DE FREQUÊNCIA SEM 
AGRUPAR DADOS 
A distribuição de frequência sem 
agrupar dados é feita, a partir da obser-
vação do número de acontecimentos em 
determinados intervalos de uma amostra.
Podemos organizar estes dados 
considerando o número de funcioná-
rios que faltou e o número de vezes 
que isto ocorreu (frequência absoluta).
Exemplo: O departamento pessoal da 
empresa “PL Calçados” efetuou um levan-
tamento dos funcionários que estiveram 
ausentes no decorrer de dois anos.
Jan. Fev. Mar. Abr. Mai. Jun. Jul. Ago. Set. Out. Nov. Dez.
Ano 1 6 7 1 6 9 2 7 9 1 8 10 9
Ano 2 8 8 5 1 7 4 10 9 4 10 6 10
Funcionários ausentes
Número de funcionários que faltaram Número de meses (frequência)
1 3
2 1
4 2
5 1
6 3
7 3
8 3
9 4
10 4
 Total: 52
Distribuição de frequência
A tabela ao lado é 
denominada distribuição 
de frequência, sem 
agrupar dados.
14FUNDAMENTOS DE ESTATÍSTICA
DISTRIBUIÇÃO DE FREQUÊNCIA COM 
DADOS AGRUPADOS 
Uma distribuição de frequência com 
dados agrupados consiste em realizar agru-
pamentos, sendo muito utilizada quando 
temos muitas informações. No entanto, 
a construção desses grupos exige proce-
dimentos matemáticos e o conhecimento 
de alguns conceitos: 
• Classes (k): são os grupos que serão 
formados;
• Amplitude do intervalo de classe 
(h): é o tamanho da classe;
• Intervalo de classe: são os limites 
da classe. Temos o limite inferior e o su-
perior;
• Ponto médio do intervalo de clas-
se (xi): é o limite superior mais o limite 
inferior dividido por dois; 
• Frequência absoluta (fi): são os 
números de observações dos elementos 
de uma determinada classe;
• Frequência relativa (fr): é a pro-
porção que a frequência absoluta da classe 
ocupa em relação ao total. Ela é obtida a 
partir da divisão da frequência absoluta 
pelo total; 
• Frequência percentual (fp): indica 
o percentual que cada classe ocupa em 
relação ao todo. É obtida a partir da mul-
tiplicação da frequência relativa por cem; 
• Frequência acumulada (fa): é a 
soma da frequência absoluta da classe 
com a da classe anterior. É comumente 
utilizada quando queremos ter uma ideia 
de várias classes conjuntamente; 
• Frequência acumulada percentual 
(fap): é a soma da frequência percentual 
da classe com a da classe anterior. É co-
mumente utilizada quando queremos ter 
uma ideia de várias classes juntamente. 
Veremos, a seguir, como compor 
cada um desses elementos em uma pes-
quisa: 
Exemplo: O rol a seguir indica a qui-
lometragem mensal que um vendedor fez 
com o veículo da empresa em um deter-
minado período. Faça a distribuição de 
frequência utilizando dados agrupados 
por intervalos de classes, siga os passos:
1) Estimar o número de classe. 
Utilizamos a fórmula de Sturges:
Importante: Explore a sua calcula-
dora! Em algumas basta digitar a fórmula, 
em outras você precisa calcular o log pri-
meiro, multiplicar por 3,3 e, por último, 
somar um.
Vamos considerar que a nossa amos-
tra tem 30 elementos, então n=30. 
550 580 615 630 650 700 780 805 830 850
865 900 925 940 950 955 970 980 1000 1100
1150 1150 1300 1350 1500 2000 2500 2800 2950 3000
Distância (Km) percorrida pelo vendedor
k=1+3,3logn
15FUNDAMENTOS DE ESTATÍSTICA
Logo: 
k=1+3,3logn
k=1+3,3log30
k=1+3,3.1,47
k=5,87 aproximadamente 6 classes
2) Estimar a amplitude de cada 
classe. 
h= (3000-550)/6
h=408,33 
Importante: a amplitude de classe 
é o único caso que devemos arredondar 
“para cima”, sempre, pois caso contrário, o 
último valor da tabela pode não se encai-
xar na distribuição de frequência. Assim, 
h = 409. 
3) Montar a tabela com a frequ-
ência absoluta. 
Para isso, partimos do primeiro valor 
do rol (ver tabela 5), ou seja 550. Este será 
o limite inferior da primeira classe. Para 
encontrarmos o limite superior, somamos 
550 com 409, que é a amplitude do inter-
valo, resultando em 959. A segunda classe 
começará com 959, que será somado com 
409. O processo segue até alcançarmos 6 
classes, conforme a tabela a seguir. Para 
encontrar a frequência absoluta, voltamos 
para a tabela 5 e contamos quantos ele-
mentos pertencem à cada classe. Perceba 
que existem 16 eventos entre 550 e 959: 
4) Frequência relativa. 
Basta dividir cada um dos valores da 
frequência absoluta pelo total, ou seja 30.
 h= [maior valor]-[menor valor] 
 número de classes desejadas
Distância Frequência absoluta (fi)
550 |–959 16
959 |– 1368 8
1368 |– 1777 1
1777 |– 2186 1
2186 |– 2595 1
2595 |–3004 3
TOTAL 30
Distribuição de frequência
Distância fi fr
550 |–959 16 16/30 : 0,53
959 |– 1368 8 8/30: 0,27
1368 |– 1777 1 1/30: 0,033
1777 |– 2186 1 1/30: 0,033
2186 |– 2595 1 1/30: 0,033
2595 |–3004 3 3/30: 0,1
TOTAL 30 Aprox.1
Distribuição de frequência
16FUNDAMENTOS DE ESTATÍSTICA
5) Frequência percentual. 
Basta multiplicar a frequência rela-
tiva por 100.
6) Frequência acumulada e frequ-
ência acumulada percentual.
7) Estimar o ponto médio. 
Em muitas situações 
é necessário sabermos o 
ponto médio de cada clas-
se. Logo, temos:
Distância fi fr fp
550 |–959 16 16/30 : 0,53 53%
959 |– 1368 8 8/30: 0,27 27%
1368 |– 1777 1 1/30: 0,033 3,3%
1777 |– 2186 1 1/30: 0,033 3,3%
2186 |– 2595 1 1/30: 0,033 3,3%
2595 |–3004 3 3/30: 0,1 10%
TOTAL 30 Aprox.1 Aprox. 100%
Distribuição de frequência
Distância fi fr fp fa fap
550 |–959 16 16/30 : 0,53 53% 16 53%
959 |– 1368 8 8/30: 0,27 27% 16+8: 24 80%
1368 |– 1777 1 1/30: 0,033 3,3% 24+1: 25 83,3%
1777 |– 2186 1 1/30: 0,033 3,3% 25+1: 26 86,6%
2186 |– 2595 1 1/30: 0,033 3,3% 26+1: 27 89,9%
2595 |–3004 3 3/30: 0,1 10% 27+3: 30 99,9%
TOTAL 30 Aprox.1 Aprox. 100%
Distribuição de frequência
Distância fi fr fp fa fap p.m.
550 |–959 16 16/30 : 0,53 53% 16 53% 754,5
959 |– 1368 8 8/30: 0,27 27% 16+8: 24 80% 1163,5
1368 |– 1777 1 1/30: 0,033 3,3% 24+1: 25 83,3% 1572,5
1777 |– 2186 1 1/30: 0,033 3,3% 25+1: 26 86,6% 1981,5
2186 |– 2595 1 1/30: 0,033 3,3% 26+1: 27 89,9% 2390,5
2595 |–3004 3 3/30: 0,1 10% 27+3: 30 99,9% 2799,5
TOTAL 30 Aprox.1 Aprox. 100%
Distribuição de frequência
Classe 1: (550 + 959) /2 = 754,5 
Classe 2: (959+1368) /2 = 1163,5 
Classe 3: (1368+1777) /2 = 1572,5
Classe 4: (1777+ 2186) /2 = 1981,5
Classe 5: (2186+2595) /2 = 2390,5
Classe 6: (2595+3004)/ 2 = 2799,5
17FUNDAMENTOS DE ESTATÍSTICA
ATIVIDADE
1) Uma franquia de lojas insta-
lou algumas representações em diversas 
regiões do Rio Grande do Sul. Com o 
fim de conferir a satisfação dos clientes, 
resolveu entrevistar 7% desses de cada 
região. Então, vamos completar a tabela 
a seguir, indicando a amostra e o número 
da amostra. Obs. O número da amostra é 
a amostra, porém arredondada. 
2) O número de produtos que os 
clientes trocam em uma loja foram regis-
trados na tabela que segue:
Vamos construir uma distribuição 
de frequência, sem agrupar dados:
3) Os funcionários da empresa 
“123 Testes Informática” estavam re-
clamando do tempo de reuniões. Para 
verificar se a reclamação procedia, foi re-
alizado um estudo, no qual se controlou 
o tempo das reuniões em minutos, que 
foram organizados na tabela que segue:
Construa uma tabela de distribui-
ção de frequência com dados agrupados 
por classes. Considere a frequência ab-
soluta, frequência relativa, frequência 
percentual, frequência acumulada efre-
quência acumulada percentual.
Região Clientes Amostra
Número de 
amostra
Metropolitana 690
Serra 380
Campanha 160
Litoral 280
Casacos Camisetas Camisas Meias Sapatos Cintos
8 5 0 5 7 4
7 4 1 4 8 3
6 3 4 2 6 2
Segunda Terça Quarta Quinta
45 52 70 58
50 51 46 63
42 44 59 54
41 40 64 60
18FUNDAMENTOS DE ESTATÍSTICA
4) Observe um estrato de uma tabela extraída do site do 
IBGE:
Construa um gráfico de setores, preferencialmente, uti-
lizando planilhas eletrônicas.
5) João Oliveira, o gerente da empresa onde você 
trabalha, recebeu um e-mail com o seguinte conteúdo: 
Seu João. O Ricardo rodou 344 km e vendeu R$ 456,00, en-
quanto o Bruno rodou apenas 124 km e vendeu R$540,00. Só não 
entendi o Gilmar que rodou 1389 km e vendeu apenas R$123,00. 
Por outro lado, a Marisa, que preferiu ficar na empresa e trabalhar 
por telefone, conseguiu vender R$560,00. Acho que está na hora de 
tomarmos algumas decisões.
Att
Vinicius Araújo
Construa uma tabela de entrada dupla com os dados en-
volvidos no e-mail recebido pelo gerente da situação anterior.
Segmento Número de empresas
Fabricação de produtos alimentícios 6.839
Fabricação de bebidas 551
Fabricação de produtos do fumo 42
Fabricação de produtos têxteis 2.206
Confecção de artigos do vestuário e 
acessórios
8 939
Empresas que não apresentaram ações de inovações organizacionais e 
marketing no Brasil entre 2006 e 2008.
19FUNDAMENTOS DE ESTATÍSTICA
ESTATÍSTICA 
BÁSICA 
Neste capítulo, iremos começar a analisar 
e interpretar os dados. Para isso, faremos 
uso de distintas técnicas de estatística que 
irão auxiliar-nos no processo de tomada de 
decisões. 
Em nossa atuação, seja pro-
fissional, ou pessoal, faz com que 
nos deparemos constantemente 
com fenômenos. Muitas vezes, 
atribuímos a sua existência à ca-
sualidade, em outros casos, procu-
ramos compreendê-los. Essa com-
preensão passa pelo entendimento 
de suas causas e de seus efeitos, que 
podem ser vinculados a números, 
Existem vários 
recursos 
matemáticos que 
podem nos auxiliar 
a ler, interpretar e 
até mesmo prever o 
mundo.
20FUNDAMENTOS DE ESTATÍSTICA
que a partir daí podem ser interpretados à 
luz de procedimentos estatísticos. Tais téc-
nicas podem ser usadas tanto na empresa, 
quanto em situações do cotidiano, para que 
possamos tomar decisões fundamentadas 
em padrões anteriormente observados.
MEDIDAS ESTATÍSTICAS 
MEDIDAS DE TENDÊNCIA CENTRAL 
Como vimos no último capítulo, os 
dados obtidos em uma pesquisa podem 
ser apresentados em gráficos ou tabelas. 
Entretanto, um fenômeno pode ser repre-
sentado por meio de uma única quantia, 
denominada medida de tendência central. 
As principais são a média, a moda e a 
mediana. 
Média Aritmética 
É um número que representa um 
fenômeno. Kazmier (1982, p. 29) define a 
média aritmética como “a soma dos valores 
do grupo de dados divididos pelo número 
de valores”. Usamos a média aritmética 
em diversas situações do nosso cotidiano, 
como quando queremos projetar uma situ-
ação intermediária. Por exemplo, se você 
faz duas provas valendo 10 pontos cada 
uma, e tira 6 na primeira e 8 na segunda, 
qual foi a sua média? Não foi 7? E como 
chegamos a esse resultado? Somamos 6 
com 8 e dividimos por 2, não é verdade? 
Para dados não agrupados:
A tabela que segue indica o lucro da 
“KouroteK calçados”. Faça a média:
Média: 120.000/6 = R$ 20.000,00 
 
Meses Venda (R$)
Janeiro 22.000
Fevereiro 18.000
Março 10.000
Abril 26.000
Maio 14.000
Junho 30.000
Total 120.000
Média aritmética
Observe que basta somar os va-
lores e dividir pelo número de eventos.
21FUNDAMENTOS DE ESTATÍSTICA
Para dados agrupados por inter-
valo de classe: 
Quando nossos dados estão agru-
pados por intervalo de classe, devemos 
considerar seus pontos médios e as suas 
frequências absolutas. 
Exemplo: Segundo a tabela a seguir, 
o estoque de uma loja tem os seus valo-
res organizados por intervalo de classes. 
Agora, encontre a média aritmética: 
Perceba que estimamos o ponto 
médio (xi) e multiplicamos esse pela fre-
quência absoluta (fi). Os valores de cada 
classe devem ser somados e divididos pela 
soma da frequência absoluta. A fórmula 
que resume esse processo é:
Média: 24.340 = R$ 24,34 
1.000
Média ponderada
A média ponderada é uma média 
aritmética que é utilizada quando cada 
elemento tem um peso distinto em relação 
ao total. Assim, este recurso será utilizado 
quando ocorrer representatividade distinta 
dentre o do grupo (KAZMIER, 1982). 
Exemplo: Na empresa em que você 
trabalha existe o seguinte quadro fun-
cional: 
A primeira coisa que devemos fazer 
é estimar o valor total do salário de cada 
um dos estratos: 
Assim:Preço unitário 
(R$)
Quantidade 
(fi)
Ponto 
médio (xi)
Total da classe 
(xifi)
18,00 |– 20,00 120 19 19.120= 2280
20,00 |– 22,00 150 21 21.150= 3150
22,00 |– 24,00 180 23 23.180= 4140
24,00 |– 26,00 200 25 25.200= 5000
26,00 |– 28,00 190 27 27.190=5130
28,00 |– 30,00 160 29 29.160=4640
n=6 1000 24340
Média: ∑xi.fi 
 ∑fi 
Média com dados agrupados
Função Número Salário
Gerente 2 R$ 10.000,00
Engenheiros 6 R$ 9.000,00
Operários 20 R$ 1.500,00
Estagiários 16 R$ 850,00
n=4 44
Média ponderada
Gerentes: 2 x 10.000 = R$ 20.000,00 
Engenheiros: 6 x 9.000 = R$ 
54.000,00
Operários: 20 x 1.500 = R$ 30.000,00
Estagiários: 16 x R$ 850,00 = R$ 
13.600,00
22FUNDAMENTOS DE ESTATÍSTICA
Desse modo, podemos concluir que o total 
que a empresa investe em salários é R$ 
117.600,00. Esse investimento deve ser 
repartido entre 44 funcionários, ou seja: 
Média: 117.600 = aprox.R$ 2.672,72 
...................44
Mediana
Podemos entender a mediana com 
o valor que está no centro ou no meio de 
um intervalo de dados. Para localizá-la é 
importante que os dados estejam no for-
mato de um rol, um seja, organizados de 
maneira crescente ou decrescente (KAZ-
MIER, 1982). 
Para dados não agrupados: 
Basta construir o rol e localizar o 
valor do meio: 
Exemplos: 
i) Um vendedor fez a seguinte quilo-
metragem durante a semana, utilizando o 
carro da empresa: 150, 110, 200, 80, 130. 
Iniciamos construindo um rol: 80, 
110, 130, 150, 200
A mediana será 130, pois está exa-
tamente no meio do rol.
ii) Uma loja vendeu o seguinte nú-
mero de peças durante a semana: 45, 80, 
45, 130, 175, 90.
Rol: 45, 45, 80, 90, 130, 175.
Perceba que não temos um termo 
que divida o rol ao meio.
Então fazemos a média aritmética 
dos dois termos centrais:
Para dados agrupados: 
A mediana para dados agrupados 
exige um pouco mais de trabalho manual, 
por isso precisamos estar atentos para não 
perdermos nenhum valor. Devemos seguir 
a fórmula: 
Observe: A média aritmética é uma 
medida que sempre é atraída para os 
“outliers”, que são os valores atípicos 
que se afastam em demasia do 
padrão. Assim, olhar um fenômeno 
somente a partir da média aritmética, 
pode, de certa forma, “maquiá-lo”. 
Recomenda-se que ela seja utilizada 
conjuntamente com as outras 
medidas que veremos na sequência.
23FUNDAMENTOS DE ESTATÍSTICA
Não se assuste! Se você “traduzir” a 
fórmula corretamente e montar uma 
tabela para a sua organização, não 
haverá problemas!
Vamos traduzir a fórmula, ou seja, 
compreender o que cada letra ou abreviatu-
ra significa, para que possamos identificar 
os elementos em nossos exercícios. 
li = limite inferior 
n/2= total da frequência absoluta 
dividido por 2
facant = frequência acumulada an-
terior
fi = frequência absoluta da classe
h = amplitude do intervalo de classe
24FUNDAMENTOS DE ESTATÍSTICA
Exemplo: O estoque de uma loja tem 
os seus valores organizados por intervalo 
de classes. De acordo com a tabela a seguir, 
encontre a mediana:
Passo 1: Determinar a classe em que 
está localizado o valor da mediana. Isso é 
feito dividindo o número da amostra por 
2, e identificando, a partir da frequência 
acumulada, em qual classe ele se encontra. 
Percebaque na classe destacada em 
vermelho, quando olhamos para a frequ-
ência acumulada, ela vai do 450 ao 650. 
Ou seja, o número 500 estará entre esses 
valores. 
Passo 2: identificar os demais ele-
mentos da fórmula.
li = 24. Perceba que na classe des-
tacada em vermelho o limite inferior é 
24. 
fi = 200. Perceba na classe destacada 
em vermelho que a frequência absoluta é 
200.
facant = 450. Perceba na classe des-
tacada em vermelho que a frequência acu-
mulada da classe anterior é 450. 
h=2. Perceba que a amplitude de 
todos intervalos de classe é 2. 
 Passo 3: Aplicar a fórmula.
Med: 24 + ((500-450)/200).2
Med: 24 +0, 25.2 
Med: 24,5
Preço unitário 
(R$)
Quantidade (fi) Fa
18,00 |– 20,00 120 120
20,00 |– 22,00 150 270
22,00 |– 24,00 180 450
24,00 |– 26,00 200 650
26,00 |– 28,00 190 840
28,00 |– 30,00 160 1000
N 1000
Mediana
Observe: A mediana sempre depende 
da frequência acumulada. Caso você 
não lembre como ela é feita, volte 
nessa apostila ou consulte o seu 
professor.
25FUNDAMENTOS DE ESTATÍSTICA
Moda
Em nosso cotidiano, dizer que al-
guma coisa está na moda, normalmente 
se relaciona com aquilo que a maioria das 
pessoas estão usando, tem ou querem. Em 
estatística, o significado é similar. Pode-
mos entender a moda como o fenômeno 
que ocorre com maior frequência. 
Para dados não agrupados: 
Basta observar o que mais se repete. 
Exemplo: Carlos é um representante 
comercial de uma certa marca de colchões, 
e obteve os seguintes resultados como ven-
das: 
Março: 5 unidades
Abril: 6 unidades
Maio: 8 unidades
Junho: 2 unidades 
Julho: 8 unidades 
Agosto: 8 unidades 
Setembro: 9 unidades
Outubro: 8 unidades 
Qual foi a moda?
A moda foi 8, pois é o número com 
maior frequência, ou seja, o número que 
aparece mais vezes. 
Para dados agrupados sem inter-
valo de classe: 
Para fazer um plano preventivo de 
manutenção, foi realizada uma pesquisa 
em relação ao número de peças que que-
bram em uma empresa em determinado 
período. Qual é a moda?
Basta olharmos para o valor, que 
temos a maior frequência absoluta, ou seja, 
Moda = 3. Com isso, concluímos que o 
mais comum de acontecer é a quebra de 
3 peças no período considerado.
Para dados agrupados com inter-
valo de classe:
Utilizamos a seguinte fórmula: 
Número de peças
Número de vezes que 
aconteceu (fi)
0 0
1 18
2 25
3 32
4 23
5 13
Moda
26FUNDAMENTOS DE ESTATÍSTICA
Traduzindo a fórmula: 
li = fronteira inferior da classe que 
contem a moda (classe modal).
d1= diferença entre a frequência 
da classe modal e a frequência da classe 
anterior.
d2 = diferença entre a frequência 
da classe modal e a frequência da classe 
posterior.
i = amplitude do intervalo de classe.
Exemplo: O estoque de uma loja tem 
os seus valores organizados por intervalo 
de classes, conforme a tabela abaixo. En-
contre a moda:
Passo 1: identificar a classe modal. 
A Classe 24 I- 26 é a classe modal, pois 
apresenta maior frequência absoluta. 
Passo 2: encontrar o d1 e d2. 
 d1 : 200 -180 = 20 
d2: 200-190 = 10 
Passo 3: aplicar a fórmula.
MEDIDAS DE VARIABILIDADE 
Medidas de variabilidade medem a 
oscilação de um fenômeno, ou seja, quanto 
se dispersam quando comparadas à média. 
As principais medidas são a variância e o 
desvio padrão. 
Variância
A variância representa a dispersão 
de uma variável em relação à sua média.
 
Nada de pânico! Basta traduzir a 
fórmula e organizar os dados que não 
teremos problemas. 
Observe: A classe modal é aquela 
que apresenta a maior frequência 
absoluta.
Preço unitário 
(R$)
Quantidade (fi)
18,00 |– 20,00 120
20,00 |– 22,00 150
22,00 |– 24,00 180
24,00 |– 26,00 200
26,00 |– 28,00 190
28,00 |– 30,00 160
N 1000
Moda
27FUNDAMENTOS DE ESTATÍSTICA
Para dados não agrupados
Exemplo: Na loja “123 Eletrodomés-
ticos” trabalham dois vendedores, Adriano 
e Daiane, que tiverem os seguintes desem-
penhos de vendas:
Adriano: 
Daiane:
Lembre-se que dissemos anterior-
mente que a média pode maquiar o fe-
nômeno. 
Média de Adriano: 30/5 = 6 ele-
trodomésticos.
Média de Daiane: 30/5 = 6 eletro-
domésticos. 
Mesmo que ambos os vendedores 
tenham obtido a mesma média, não po-
demos dizer que são vendedores iguais, 
pois Adriano tende a ter oscilações nas 
suas vendas, enquanto Daiane é mais cons-
tante. Para medir essas variações podemos 
utilizar a variância. 
Vamos aos passos!!
Passo 1: determinar a média arit-
mética (µ) da sequência;
Passo 2: determinar as diferenças 
entre a média e cada elemento da sequ-
ência. (fi-µ);
Passo 3: elevar ao quadrado e somar 
os valores encontrados no passo 2. ∑(fi-µ)²;
Passo 4: dividir o resultado do passo 
4 pelo número de eventos do conjunto.
Esses passos podem ser sintetizados 
com as fórmulas:
• Para população:
• Para a amostra:
Exemplo: Adriano vendeu os seguin-
tes eletrodomésticos durante a semana: 
10, 2, 8, 3 e 7. Calcule a variância de suas 
vendas: 
Calculando a média = (10+2+8+3+7)/ 
5 = 30/5 = 6 
Segunda Terça Quarta Quinta Sexta
10 2 8 3 7
Variância
Segunda Terça Quarta Quinta Sexta
6 6 6 6 6
Variância
Observe: Desenvolva todos os passos 
completando uma tabela. Quando ela 
estiver completa troque os valores 
para a fórmula. 
28FUNDAMENTOS DE ESTATÍSTICA
Organizando a tabela: 
Lembre-se que estamos trabalhando 
com todas as vendas de Adriano, então de-
vemos considerar a fórmula da população:
 
O numerador da fórmula foi gerado 
a partir da tabela, e o denominador n é 5, 
pois o vendedor fez 5 vendas. 
Com dados agrupados por inter-
valos de classe: 
A variância com dados agrupados 
pode ser um pouco trabalhosa. Você vai 
precisar organizar, muito bem, uma tabela 
com os dados e seguir os passos abaixo: 
Passo 1: determinar o ponto médio 
de cada intervalo de classe (xi); 
Passo 2: elevar cada ponto médio 
ao quadrado (xi²); 
Passo 3: multiplicar cada xi² pela 
frequência da classe fi correspondente;
Passo 4: calcular a média aritmética 
considerando que os dados estão agrupa-
dos. 
Construímos uma tabela e aplica-
mos os dados em uma das fórmulas: 
fi (fi-µ) (fi-µ)²
10 10 - 6 = 4 4 x 4 = 16
2 2 – 6= - 4 (-4) x (-4) = 16
8 8 - 6 = 2 2 x 2 = 4
3 6 - 3 =- 3 (-3) x (-3) = 9
7 7 - 6 = 1 1x 1 = 1
∑= 46
Adriano
Variância
29FUNDAMENTOS DE ESTATÍSTICA
• Para população:
• Para a amostra:
Exemplo: O número de produtos ven-
didos por uma loja está representado por 
uma distribuição de frequência conforme 
a tabela que segue. Calcule a variância: 
A tabela precisa ser ajustada em 
acordo com os passos descritos anterior-
mente. Chegamos no seguinte resultado:
Vamos nos recordar que a média 
aritmética para dados agrupados é cal-
culada por:
Assim, a média será Média: 3232/80 
= 40, 4. Também vamos considerar que 
estamos trabalhando com todas as vendas 
da loja em um dado período, então será 
utilizada a fórmula da população:
Desvio Padrão 
A resolução do último exemplo, le-
va-nos a perceber que a variância é uma 
medida que permanece elevada ao quadra-
do. Em situações práticas pode ser difícil 
imaginarmos essa situação. Por isso, nor-
malmente se utiliza o desvio padrão. Se-
gundo Youssef, Soares e Fernandes (2004, 
p.257) “o desvio padrão pode ser obtido 
diretamente da variância, extraindo-se a 
raiz quadrada do valor encontrado”. Ele 
informa a dispersão dos dados em relação 
Produtos fi
2 |− 14 13
14 |− 26 9
26 |− 38 8
38 |− 50 23
50 |− 62 15
62 |− 74 10
78 |− 86 2
Variância
Classe xi fi xifi xi² xi²fi
2 |− 14 8 13 104 64 832
14 |− 26 20 9 180 400 3600
26 |− 38 32 8 256 1024 8192
38 |− 50 44 23 1012 1936 44528
50 |− 62 56 15 840 3136 47040
62 |− 74 68 10 680 4624 46240
74 |− 86 80 2 160 6400 12800
∑ 80 3232 163232
Variância
30FUNDAMENTOS DE ESTATÍSTICA
à média, porém parece nos dar suma di-
mensão mais exata.
Exemplo: Pense nos dados do último 
exemplo. Considerando que a variância 
foi σ²= 408,24, o desvio padrão será DP: 
√408,24 ou seja DP: aprox. 20,20. 
Issosignifica que o fenômeno está 
se afastando da média 20,20 unidades, 
seja para mais, seja para menos. 
COEFICIENTE DE VARIAÇÃO (V)
Para Kazmier (1982, p.52) “o coefi-
ciente de variação V, indica a magnitude 
relativa do desvio padrão quando com-
parado com a média da distribuição das 
medidas”. 
 V: Coeficiente de variação
 σ: Desvio Padrão
 µ: Média 
Exemplo: O preço médio diário das 
ações de uma empresa A durante um certo 
período do mês foi de R$150,00, com um 
desvio padrão de R$5,00. A empresa B 
teve o preço médio R$ 50,00 no mesmo 
período, com desvio padrão de R$3,00.
Empresa A: 
V= σ/µ V= 5/150= 0,033
Empresa B:
V= σ/µ v= 3/50= 0,060
Kazmier (1982) esclarece que em 
termos de comparação absoluta, a empresa 
A teve uma maior variação, pois seu des-
vio padrão é maior. No entanto, quando 
pensamos em relação ao preço, podemos 
perceber que o preço das ações da empresa 
B é quase duas vezes mais variável quando 
comparado a empresa A.
REGRESSÃO LINEAR SIMPLES 
A regressão linear tem o objetivo 
de verificar a existência de relações entre 
as variáveis. Barbetta (2002) considera 
que existe uma correlação direta entre 
duas variáveis, isso acontece quando elas 
caminham no mesmo sentido. Por exem-
plo: peso e altura pode ser um exemplo de 
correlação direta entre variáveis, pois es-
pera-se que um sujeito mais alto seja mais 
pesado. Já, a correlação inversa, ocorre 
quando elas caminham em sentido opos-
to. Por exemplo: No Brasil, a renda e o 
número de filhos por família apresentam 
uma correlação inversa, pois de um modo 
geral, quando menor a renda maior o nú-
mero de filhos. 
Chamamos o x de variável indepen-
dente, pois é o próprio fenômeno e não 
31FUNDAMENTOS DE ESTATÍSTICA
depende de outros fatos. Já o y é chamado 
de variável dependente, pois depende do x. 
O processo consiste em obter uma equação 
que explique o comportamento de uma 
variável em relação a outra. 
EQUAÇÃO DA RETA 
Consiste em encontrar uma equação 
de uma reta que explique o comportamen-
to das variáveis. 
Diagrama de dispersão 
Consiste em representar as variáveis 
em um plano cartesiano por pontos com 
coordenadas (x,y), em que x é a variável 
observada e y o correspondente (BAR-
BETTA, 2002). Quanto mais os pontos 
estiverem concentrados em torno de uma 
reta, mais correlação existe entre as va-
riáveis. 
Exemplos: 
i) O gráfico a seguir indica as vendas 
(em cruzeiros) de uma empresa durante 
um período:
Observe que o gráfico se aproxima 
de uma reta, o que indica uma forte cor-
relação entre as variáveis. A reta crescente 
indica que a correlação é direta, ou seja, 
quanto mais aumentam os anos, mais au-
mentam as vendas da empresa. 
ii) O gráfico que segue, demonstra 
o resultado de uma pesquisa em que foram 
consideradas a idade e a massa muscular 
de um grupo de pessoas:
Perceba que mesmo que não forme 
uma reta perfeita, os dados se concentram 
em torno de uma linha imaginária, indi-
cando que existe correlação. Como a linha 
é decrescente, a correlação é inversa, ou 
seja, quanto mais a idade aumenta, mais 
a massa muscular diminui. 
32FUNDAMENTOS DE ESTATÍSTICA
iii) O gráfico abaixo demonstra o 
resultado de uma pesquisa em que foram 
considerados a idade e o tempo de leitura:
Perceba que o fenômeno fica dis-
perso, não se concentrando em torno de 
uma reta. Isto significa que não existe 
correlação entre as variáveis, ou seja, a 
idade não interfere no tempo de leitura.
COEFICIENTE DE CORRELAÇÃO 
A correlação entre duas variáveis 
pode ser medida a partir de um número 
(coeficiente de Pearson), o qual indica em 
que nível a correlação ocorre. O coeficiente 
ocorre entre -1 e 1, sendo: 
0: nula
Entre 0,10 e 0,29 : pequena 
Entre 0,40 e 0,60 : moderada
Entre 0,70 e 0,90: forte 
Maior que 0,90: muito forte
R > 0 correlação direta
R=0 correlação nula
R< 0 correlação inversa
Fórmula:
Exemplo: Em uma certa cidade, foi 
realizado um estudo, visando compreen-
der a saúde das pessoas. Os entrevistados 
tinham entre 5 e 50 anos de idade. Foram 
considerados o nível de HDL (colesterol 
bom) no sangue e as horas de exercícios 
semanais. Chegou-se aos seguintes re-
sultados: 
Existe correlação entre as variáveis? 
Em que nível?
Primeiro passo: ajustar a tabela 
montando as colunas x.y, x² e y²
HDL Horas de Exercícios
40 0
50 2
55 3
60 4
65 6
x y x,y x² y²
40 0 0 1.600 0
50 2 100 2.500 4
55 3 165 3.025 9
60 4 240 3.600 16
65 6 390 4.225 36
Soma 270 15 895 14.950 65
33FUNDAMENTOS DE ESTATÍSTICA
Segundo passo: aplicar a fórmula. 
Existe uma relação muito forte en-
tre as horas de exercício e o aumento do 
“colesterol bom”. 
r= 0,98
O coeficiente de Pearson indicou 
que existe uma correlação muito forte e 
direta entre as duas variáveis, os seja, quan-
to mais exercícios a pessoa praticar, maior 
será o seu “colesterol bom”.
INTERVALO DE CONFIANÇA 
O intervalo de confiança é uma es-
timativa de parâmetro. Assim, podemos 
estimar um intervalo no qual existe a pro-
babilidade de um fenômeno ocorrer. 
Exemplo: Para estimar o tempo mé-
dio em uma consulta, foram amostrados 
64 pacientes. Essa amostra indicou um 
tempo médio de 10 minutos, com desvio 
padrão de 3 minutos. Com base nisso, qual 
é o tempo médio de atendimento, com um 
nível de confiança de 90%?
Temos: 
Vamos aplicar um teste T!
n= 64
Média: 10
S: 3
34FUNDAMENTOS DE ESTATÍSTICA
Da seguinte forma, será usada a ta-
bela t que consta no final da apostila, siga 
os passos:
Passo 1: Pegue a sua tabela. Quere-
mos um nível de confiança de 90%, temos 
uma margem de erro de 10%, sendo 5% 
em cada cauda. Procuramos na tabela z, 
um valor que resulte em 0,05 (5%). O valor 
é -1,64. 
Passo 2: Estimar a margem de erro.
Passo 3: Aplicar a fórmula.
Média x ± z margem de erro
Passo 4: Construir o intervalo. 
Limite superior: 10+ 0,615 = 10,615
Limite inferior: 9,385 
[9,385; 10,615] Isso significa que 
se formos a esse médico, temos 90% de 
chance de ficarmos entre 9,38 minutos e 
10,61 minutos na consulta. 
TESTE DE HIPÓTESES 
Uma hipótese é uma afirmação so-
bre uma determinada população. Os testes 
de hipóteses visam confirmar ou refutar 
tais afirmações. 
Ho (hipótese nula) 
H1 (hipótese alternativa) 
É importante que as hipóteses sejam 
contrárias. 
Vamos a mais um exemplo:
Um fabricante de refrigerantes afir-
ma que os frascos de dois litros dos seus 
produtos contem, no mínimo, uma média 
de 1,99 litros do produto. Uma amostra 
de frascos de dois litros foi selecionada e o 
conteúdo avaliado com o fim de testar-se 
a afirmação do fabricante. Nesse caso, a 
construção das hipóteses parte da afir-
mação do fabricante, considerando ser ela 
verdadeira. Assim, teríamos as seguintes 
hipóteses: 
H0 : µ ≥ 1,99 H1: µ< 1,99
Caso os resultados da amostra indi-
carem que H0 não possam ser regeitadas, 
a afirmação do fabricante não será con-
testada. Por outro lado, se H0 pode ser 
rejeitada, afirmamos que H1: µ< 1,99 é 
verdadeiro, o que evidencia que a infor-
mação do fabricante é incorreta. 
Em uma situação prática, os resulta-
dos do teste de hipóteses podem ser utili-
zados diretamente no processo de tomada 
de decisão. No exemplo anterior, poderiam 
ser revistos os processos de envasamento 
do refrigerante.
ME: S / √n 
35FUNDAMENTOS DE ESTATÍSTICA
ATIVIDADE
1) O automóvel da empresa rodou 
as seguintes quilometragens. Encontre a 
mediana:
2) Na disciplina de estatística, o 
professor realizou 10 avaliações. Ana teve 
as seguintes notas: 2, 3, 3, 4, 5, 6, 7, 8, 9 
e 10. Encontre a variância:
3) A tabela abaixo traz o tamanho 
dos bebês em uma determinada materni-
dade. Encontre a mediana:
4) Observe a relação entre o preço 
da venda de passagens e a demanda:
Encontre o coeficiente de correlação 
de Pearson e interprete o resultado:
5) Uma pesquisa em 17 cinemas de 
São Paulo, indicou que o ingresso custava 
em média R$ 5,50 com desvio padrão de 
R$ 0,50. Determine: o erro máximo com 
intervalo de confiança de 95%. A estimati-
va de preço médiocom 95% de confiança:
 
Seg Ter Qua Qui Sex Sáb Seg Ter Qua Qui
126 128 134 135 138 131 139 132 138 136
Tamanho
Frequência 
absoluta
50 I- 54 4
54 I- 58 9
58 I- 62 11
62 I- 66 8
66 I- 70 5
70 I- 74 3
Preço 33 25 24 18 12 10 8 4
Demanda 300 400 500 600 700 800 900 1000
36FUNDAMENTOS DE ESTATÍSTICA
GABARITOS
CAP 1. 
1) 2) 
3)
4) 
5) 
CAP 11. 
1) 134,5 
2) 6,81 
Região Clientes Amostra
Número da 
amostra
Metropolitana 690 48,3 48
Serra 380 26,6 27
Campanha 160 11,2 11
Litoral 280 19,6 20
Peças fi
0 1
1 1
2 2
3 2
4 4
5 2
6 2
7 2
8 2
Classe
Frequência 
absoluta (fi)
Frequência 
relativa (fr)
Frequência 
percentual 
(fp)
Frequência 
acumulada 
(fa)
Frequência 
acumulada 
percentual (fap)
40 I – 46 5 0,3124 31,24% 5 31,24%
46 I – 52 3 0,1875 18,75% 8 49,99%
52 I – 58 2 0,125 12,5% 10 62,49%
58 I – 64 4 0,25 25% 14 87,49%
64 I - I 70 2 0,125 12,5% 16 99,99%
Total 16 0,9999 99,99%
Vendedor Km R$
Ricardo 344 456
Bruno 124 540
Gilmar 1389 123
Marisa 0 560
Total 468 1556
Obs. As cores, a 
disposição da legenda 
e o título podem 
alterar. Observar a 
relação entre a tabela 
e o gráfico.
37FUNDAMENTOS DE ESTATÍSTICA
TABELAS
Distribuição T de Student Tabela de distribuição normal reduzida
38FUNDAMENTOS DE ESTATÍSTICA
39FUNDAMENTOS DE ESTATÍSTICA
REFERÊNCIAS
BARBETTA, P. A. Estatística Aplicada às Ciências Sociais. 5.a ed. 
Florianópolis: Editora da UFSC, 2002. 
CORREA, S.M.B.B Probabilidade e Estatística. 2.a ed. Belo Horizonte: 
PUC Minas Virtual, 2003. 
KAZMIER, Leonard J. Estatística aplicada à Economia e Adminis-
tração. São Paulo: Makron Books, 2004.
MORETTIN, L.G. Estatística Básica. Probabilidade e inferência. 
Volume único. São Paulo: Pearson Prentice Hall, 2010. 
YOUSSEF, A. N., SOARES, E. e FERNANDEZ, V. P. Matemática 
de olho no mundo do trabalho. São Paulo: Scipione, 1ª ed. 2004.
	Introdução à Estatística
	NOÇÕES FUNDAMENTAIS 
	ESTATÍSTICA DESCRITIVA
	AMOSTRAGEM
	Distribuição de frequência 
	ATIVIDADE
	Estatística Básica 
	MEDIDAS ESTATÍSTICAS 
	REGRESSÃO LINEAR SIMPLES 
	ATIVIDADE
	GABARITOS
	REFERÊNCIAS

Continue navegando

Outros materiais