Buscar

Apostila Estatística

Prévia do material em texto

Estatística
Regina Maria Sigolo Bernardinelli
Adaptada por Antonio Fernando Silveira Alves / 
Revisada por Sandra Regina Leme Forster
É com satisfação que a Unisa Digital oferece a você, aluno(a), esta apostila de Estatística, parte in-
tegrante de um conjunto de materiais de pesquisa voltado ao aprendizado dinâmico e autônomo que a 
educação a distância exige. O principal objetivo desta apostila é propiciar aos(às) alunos(as) uma apresen-
tação do conteúdo básico da disciplina.
A Unisa Digital oferece outras formas de solidificar seu aprendizado, por meio de recursos multidis-
ciplinares, como chats, fóruns, aulas web, material de apoio e e-mail.
Para enriquecer o seu aprendizado, você ainda pode contar com a Biblioteca Virtual: www.unisa.br, 
a Biblioteca Central da Unisa, juntamente às bibliotecas setoriais, que fornecem acervo digital e impresso, 
bem como acesso a redes de informação e documentação.
Nesse contexto, os recursos disponíveis e necessários para apoiá-lo(a) no seu estudo são o suple-
mento que a Unisa Digital oferece, tornando seu aprendizado eficiente e prazeroso, concorrendo para 
uma formação completa, na qual o conteúdo aprendido influencia sua vida profissional e pessoal.
A Unisa Digital é assim para você: Universidade a qualquer hora e em qualquer lugar!
Unisa Digital
APRESENTAÇÃO
SUMÁRIO
INTRODUÇÃO ............................................................................................................................................... 5
1 NOÇÕES BÁSICAS ................................................................................................................................. 7
1.1 Arredondamento de Dados .................................................................................................................................... 8
1.2 População e Amostra ................................................................................................................................................ 9
1.3 Resumo do Capítulo ................................................................................................................................................11
1.4 Atividades Propostas...............................................................................................................................................12
2 ORGANIZAÇÃO DE DADOS .......................................................................................................... 13
2.1 Tipos de Variáveis .....................................................................................................................................................13
2.2 Distribuição de Frequências .................................................................................................................................16
2.3 Resumo do Capítulo ................................................................................................................................................19
2.4 Atividades Propostas...............................................................................................................................................20
3 GRÁFICOS ESTATÍSTICOS ............................................................................................................... 23
3.1 Gráfico de Setores ou Disco ou Pizza ou Diagrama Circular .....................................................................23
3.2 Gráfico de Colunas ou Barras ...............................................................................................................................24
3.3 Histograma .................................................................................................................................................................25
3.4 Polígono de Frequências .......................................................................................................................................25
3.5 Resumo do Capítulo ................................................................................................................................................26
3.6 Atividades Propostas...............................................................................................................................................27
4 MEDIDAS ................................................................................................................................................... 29
4.1 Medidas de Posição .................................................................................................................................................29
4.2 Medidas de Dispersão ............................................................................................................................................33
4.3 Resumo do Capítulo ................................................................................................................................................37
4.4 Atividades Propostas...............................................................................................................................................37
5 PROBABILIDADES ............................................................................................................................... 41
5.1 Fenômeno Determinístico ....................................................................................................................................41
5.2 Fenômeno Aleatório ou Probabilístico .............................................................................................................41
5.3 Espaço Amostral (S) .................................................................................................................................................42
5.4 Evento (E).....................................................................................................................................................................42
5.5 Probabilidade ............................................................................................................................................................42
5.6 Propriedades ..............................................................................................................................................................42
5.7 Variável Aleatória Discreta .....................................................................................................................................43
5.8 Função Discreta de Probabilidade .....................................................................................................................43
5.9 Variável Aleatória Contínua ..................................................................................................................................44
5.10 Função Contínua de Probabilidade .................................................................................................................44
5.11 Resumo do Capítulo .............................................................................................................................................44
5.12 Atividades Propostas ............................................................................................................................................45
6 VARIÁVEIS ALEATÓRIAS CONTÍNUAS ................................................................................... 47
6.1 Modelo Normal ou Distribuição Normal..........................................................................................................47
6.2 Resumo do Capítulo ................................................................................................................................................49
6.3 Atividades Propostas...............................................................................................................................................50
7 ESTIMAÇÃO .............................................................................................................................................51
7.1 Estimação por Intervalo .........................................................................................................................................51
7.2 Resumo do Capítulo ................................................................................................................................................57
7.3 Atividades Propostas...............................................................................................................................................58
8 CORRELAÇÃO ......................................................................................................................................... 59
8.1 Correlação Linear Simples .....................................................................................................................................59
8.2 Resumo do Capítulo ................................................................................................................................................64
8.3 Atividades Propostas...............................................................................................................................................64
RESPOSTAS COMENTADAS DAS ATIVIDADES PROPOSTAS ..................................... 69
REFERÊNCIAS ............................................................................................................................................. 77
Unisa | Educação a Distância | www.unisa.br
5
Prezado(a) aluno(a), esta apostila reúne os principais tópicos de Estatística, de forma condensada 
e objetiva, com a finalidade de orientá-lo(a), aluno(a) do Curso de Ensino a Distância (EaD), no desen-
volvimento do conteúdo desta disciplina.
Em sua elaboração, não tive a pretensão de demonstrar as diversas fórmulas matemáticas nela 
existentes, mas de mostrar suas aplicações nos diversos assuntos abordados. É, portanto, um guia indis-
pensável para acompanhar as aulas web.
A disciplina de Estatística tem por objetivo fornecer ao(à) aluno(a) subsídios que o(a) auxiliem nas 
demais disciplinas do Curso de EaD, bem como desenvolver-lhe a capacidade de utilizar os diversos 
métodos estatísticos e o raciocínio necessário para a interpretação e análise de pesquisas na área a que 
se destina.
Profa. Regina Maria Sigolo Bernardinelli
INTRODUÇÃO
Unisa | Educação a Distância | www.unisa.br
7
1 NOÇÕES BÁSICAS
Prezado(a) aluno(a), você conhece a origem 
da palavra ‘estatística’? Conhece algumas aplica-
ções desta ciência? Vamos iniciar este texto abor-
dando esses pontos.
A palavra ‘estatística’, de origem latina, sig-
nificou por muito tempo “ciência dos negócios 
do Estado”. Os que governavam, sentindo neces-
sidade de informações, organizavam departamen-
tos, que tinham a responsabilidade de fazer essas 
investigações.
As sociedades modernas acumulam grande 
quantidade de dados numéricos relativos a even-
tos sociais, econômicos, científicos, esportivos etc. 
Desse modo, notamos que o uso da pesquisa é 
bastante comum nas várias atividades humanas.
Exemplos:
1. O índice de analfabetismo no Brasil;
2. A mortalidade infantil no Nordeste bra-
sileiro;
3. A porcentagem de crianças vacinadas na 
última campanha de vacinação;
4. A pesquisa realizada pelas indústrias, en-
tre os consumidores, para o lançamento 
de um novo produto;
5. As pesquisas eleitorais, fornecendo ele-
mentos para que os candidatos direcio-
nem suas campanhas;
6. As pesquisas utilizadas pelas emissoras 
de TV, mostrando a preferência dos es-
pectadores, para organizar sua progra-
mação.
 
Você deve saber que a realização de uma pes-
quisa envolve muitas etapas, tais como: a escolha 
da amostra, a coleta e a organização dos dados, o 
resumo e a apresentação desses dados e, também, 
a interpretação dos resultados para a obtenção de 
conclusões e tomada de decisões razoáveis. Todas 
essas etapas são trabalhadas com métodos cientí-
ficos pela Estatística. 
O tratamento estatístico de um conjunto de 
dados pode envolver dois processos distintos, isto 
é, a descrição dos dados e o estabelecimento de 
conclusões sobre a população a partir dos dados 
obtidos por amostragem. 
Para tanto, temos:
ƒƒ Estatística descritiva: utiliza métodos 
numéricos e gráficos para mostrar os 
padrões de comportamento dos dados, 
DicionárioDicionário
A palavra ‘estatística’ surge da expressão em latim 
statisticum collegium ou palestra sobre os assun-
tos do Estado, de onde surgiu a palavra em língua 
italiana statista, que significa “homem de estado”, 
ou político, e a palavra alemã Statistik, designando 
a análise de dados sobre o Estado. A palavra ad-
quiriu um significado de coleta e classificação de 
dados, no início do século 19.
Fonte: http://pt.wikiversity.org
AtençãoAtenção
O tratamento estatístico pode envolver a 
descrição dos dados e o estabelecimento 
de conclusões a partir da amostragem.
Regina Maria Sigolo Bernardinelli
Unisa | Educação a Distância | www.unisa.br
8
para resumir a informação contida nes-
ses dados e para apresentar a informação 
de forma conveniente;
ƒƒ Inferência estatística: utiliza dados de 
amostras para obter estimativas sobre a 
população.
1.1 Arredondamento de Dados
Como na maioria das vezes, os dados dispo-
níveis não são números inteiros, para efetuar os cál-
culos estatísticos, é necessário efetuar o arredon-
damento desses dados. A seguir, apresentamos os 
critérios utilizados para efetuar o arredondamento.
De acordo com o Instituto Brasileiro de Ge-
ografia e Estatística (IBGE)2, o arredondamento é 
feito da seguinte forma:
a. Quando o primeiro algarismo a ser aban-
donado é 0, 1, 2, 3 ou 4, fica inalterado o 
último algarismo a permanecer.
Exemplo: aproximação de uma casa 
decimal: 53,24 passa a 53,2.
b. Quando o primeiro algarismo a ser aban-
donado é 6, 7, 8 ou 9, aumenta-se em 
uma unidade o algarismo a permanecer.
Exemplos: aproximação de uma casa 
decimal: 42,87 passa a 42,9;
 25,08 passa a 25,1;
 53,99 passa a 54,0.
c. Quando o primeiro algarismo a ser aban-
donado é 5, há duas soluções:
ƒƒ se ao 5 seguir, em qualquer casa, um 
algarismo diferente de zero, aumen-
ta-se uma unidade ao algarismo a 
permanecer.
Exemplos: aproximação de uma casa 
decimal: 2,352 passa a 2,4;
25,6501 passa a 25,7;
76,25002 passa a 76,3.
ƒƒ se o 5 for o último algarismo ou se 
ao 5 só se seguirem zeros, o último 
Saiba maisSaiba mais
A Estatística é uma área do conhecimento que utiliza teorias probabilísticas para explicação de eventos, 
estudos e experimentos. Tem por objetivo obter, organizar e analisar dados, determinar as correlações 
que apresentem, tirando delas suas consequências para descrição e explicação do que passou e pre-
visão e organização do futuro. Em suma, estatística é a ciência que estuda os dados. Dentro dela, exis-
tem duas subdivisões: a estatística descritiva (que estuda métodos e ferramentas de coleta de dados e 
modelos matemáticos para descrevê-los e interpretá-los) e a estatística inferencial (sistemas e técnicas 
utilizadas para tomar boas decisões baseadas nos dados).
A estatística é também uma ciência e prática de desenvolvimento de conhecimento humano através 
do uso de dados empíricos. Baseia-se na teoria estatística, um ramo da matemática aplicada. Na teoria 
estatística, a aleatoriedade e incerteza são modeladas pela teoria da probabilidade. Algumas práticas 
estatísticas incluem, por exemplo, o planejamento, a sumarização e a interpretação de observações. 
Porque o objetivo da estatística é a produção da “melhor” informação possível a partir dos dados dispo-
níveis, alguns autores sugerem que a estatística é um ramo da teoria da decisão.
Fonte: http://pt.wikiversity.org
2 Em conformidade com a Resolução nº 886/66 da Fundação IBGE, Adaptado de CRESPO, 1991.Estatística
Unisa | Educação a Distância | www.unisa.br
9
algarismo a ser conservado só será 
aumentado de uma unidade se for 
ímpar.
Exemplos: aproximação de uma casa 
decimal: 24,75 passa a 24,8;
 24,65 passa a 24,6;
 24,75000 passa a 24,8;
 24,6500 passa a 24,6.
Prezado(a) aluno(a), para iniciar o estudo da 
Estatística, é necessário que você conheça, com-
preenda e se aproprie do significado de alguns ter-
mos que serão utilizados.
Analise cuidadosamente cada termo defini-
do a seguir.
População
É o conjunto de todos os elementos envolvi-
dos no fenômeno a ser estudado.
Amostra
É o conjunto de elementos retirados da po-
pulação para a realização do estudo. É, portanto, 
um subconjunto da população.
Exemplos:
1. Queremos obter informações sobre a 
audiência de certo programa de TV, na 
Grande São Paulo:
População: é o conjunto de todos os domi-
cílios da Grande São Paulo que possuem TV;
Amostra: é o conjunto dos domicílios que 
serão visitados.
2. Estudar a procedência dos candidatos a 
uma determinada universidade:
População: conjunto de todos os candida-
tos à referida universidade;
Amostra: conjunto dos candidatos que se-
rão entrevistados.
3. Queremos fazer um estudo sobre a ida-
de dos alunos do curso de Publicidade 
e Propaganda de uma determinada uni-
versidade:
População: todos os alunos do curso de Pu-
blicidade e Propaganda;
Amostra: uma classe do primeiro ano do 
curso de Publicidade e Propaganda.
 
Quando são obtidos dados de toda uma po-
pulação, dizemos que foi feito um recenseamento e 
a este conjunto de dados damos o nome de censo.
Quando os dados são obtidos de parte da po-
pulação, foi feita uma amostragem.
A Escolha da Amostra 
Os métodos de escolha da amostra devem 
garantir a representatividade do grupo. É neces-
sário escolher, no mínimo, 10% do número total 
dos elementos da população e garantir, por meio 
de um critério de seleção, que nenhum elemento 
tenha maior chance de ser escolhido do que outro. 
Desse modo, podemos recorrer a diferentes formas 
de amostragem: amostragem aleatória simples, 
amostragem sistemática e amostragem estrati-
ficada proporcional.
1.2 População e Amostra
AtençãoAtenção
Os métodos de escolha da amostra devem 
garantir a representatividade do grupo.
Regina Maria Sigolo Bernardinelli
Unisa | Educação a Distância | www.unisa.br
10
Vejamos o procedimento através de dois 
exemplos:
Exemplo 1: suponhamos uma pesquisa so-
bre o nível de escolaridade de um grupo de oito-
centas pessoas. Vamos escolher uma amostra com, 
no mínimo, oitenta pessoas (10% de 800), selecio-
nadas através de:
a. Amostragem aleatória simples: em 
primeiro lugar, elaboramos uma lista 
com os oitocentos nomes dos elemen-
tos da população numerados de 1 a 800, 
para serem submetidos a um sorteio. 
Bolas ou cartões, também numerados 
de 1 a 800, são colocados em uma urna e 
bem misturados. Em cada etapa do sor-
teio, todo número ainda não escolhido 
tem a mesma probabilidade de ser sor-
teado. Esse processo não é muito prático 
para grandes populações, quando pode-
mos então trabalhar com uma 
numeração de 0 a 9, sorteando 
os números por meio de blocos 
de três algarismos e tomando o cuidado 
de repor na urna todo algarismo dela 
retirado. Como temos dez algarismos, 
cada um deles tem de probabilidade de 
aparecer em determinada posição. Sem-
pre que um bloco de algarismos indicar 
um elemento já selecionado, ou um ele-
mento que não exista na população, será 
descartado.
1
10
Suponhamos que os seguintes algarismos foram obtidos no sorteio:
2 4 3 5 6 4 7 2 0 0 3 5 8 1 1 0 0 5
1 9 8 6 4 3 5 2 4 7 8 9 7 7 6 5 4 2
2 3 0 1 2 1 1 6 7 8 9 1 0 3 4 5 6 7
2 2 8 8 1 9 0 0 6 0 7 2 1 0 5 6 4 3
Agrupando-os em blocos de três, teremos os números:
 243 564 720 035 811 005 198 643 524 789 776 542 230
 121 167 891 034 567 228 819 006 072 105 643. 
Observem que devemos descartar 811, 891 e 819, porque não pertencem à população, e 643, por-
que já foi selecionado.
Continuamos o sorteio, até completarmos os 80 elementos da amostra.
b. Amostragem sistemática: sorteamos um número de 1 a 10, ao acaso. Supondo que tenha 
sido obtido o número 6, ele será o primeiro elemento da amostra e os demais serão determi-
nados em intervalos de dez unidades. Nossa amostra, então, será:
6 16 26 36 46 56 66 76 86 96 106 . . . 796
Este tipo de amostragem é simples de ser realizado e aconselhável no caso de amostras muito 
grandes. 
Estatística
Unisa | Educação a Distância | www.unisa.br
11
1.3 Resumo do Capítulo
Exemplo 2: na escola Sapequinha, quer fazer-se um estudo sobre o peso dos alunos de 7 anos de 
idade. Existem 120 crianças na faixa de 7 anos de idade, distribuídas em cinco classes, do seguinte modo: 
a primeira série A tem 20 alunos com 7 anos, a primeira B tem 15, a C tem 35, a D, 30 e a E tem 20. Vamos 
escolher uma amostra com, no mínimo, 12 crianças (10% de 120), selecionadas através de:
c. Amostragem estratificada proporcional: sorteamos os nomes das crianças em quantidades 
proporcionais ao número de crianças com 7 anos de cada classe, que constituem os estratos 
da amostra. Vamos, agora, determinar a porcentagem de crianças com 7 anos, em cada classe, 
em relação à população (120 crianças):
De modo análogo, determinamos as porcentagens para as classes C, D e E, obtendo:
C: c = 29,2% D: d = 25% E: e = 16,7%
Para calcularmos quantas crianças de cada classe serão sorteadas, para uma amostra de 12 crian-
ças, fazemos:
A: 16,7% de 12 = 16,7/100 . 12 = 0,167 . 12 = 2,004 = 2
B: 12,5% de 12 = 0,125 . 12 = 1,5 = 2
C: 29,2% de 12 = 0,292 . 12 = 3,504 =3 (nesse caso, arredondamos para 3, ao invés de 4, porque o 
total de crianças da amostra é 12)
D: 25% de 12 = 0,25 . 12 = 3
E: 16,7% de 12 = 0,167 . 12 = 2,004 = 2
Desse modo, obtivemos a quantidade de elementos de cada estrato e o total da amostra.
Prezado(a) aluno(a), vimos neste capítulo que a palavra ‘estatística’, de origem latina, significou por 
muito tempo “ciência dos negócios do Estado”. Estudamos também que a Estatística Descritiva utiliza 
métodos numéricos e gráficos para mostrar os padrões de comportamento dos dados, para resumir 
a informação contida nesses dados e para apresentar a informação de forma conveniente, e que a In-
ferência Estatística utiliza dados de amostras para obter estimativas sobre a população. Aprendemos 
ainda sobre arredondamentos e amostra.
Vamos, agora, avaliar a sua aprendizagem.
Regina Maria Sigolo Bernardinelli
Unisa | Educação a Distância | www.unisa.br
12
1.4 Atividades Propostas
1. Faça o arredondamento dos seguintes números para uma casa decimal:
a. 2,36.
b. 3,57.
c. 4,62.
d. 8,81.
e. 4,451.
f. 5,501.
g. 5,55.
h. 5,65.
2. Arredonde cada um dos numerais abaixo, conforme a precisão pedida.
a. para o décimo mais próximo:
23,40 234,7832 45,09
48,85002 78,85 12,35
120,4500 129,98 199,97
b. para o centésimo mais próximo:
46,727 28,255 299,951
253,65 123,842 37,485
c. para a unidade mais próxima:
26,6 128,5 68,2
67,5 49,98 39,49
d. para a dezena mais próxima:
42,3 59 446,4
265,31 265,0 265
295 302,7 2995,000
Unisa | Educação a Distância | www.unisa.br
13
2 ORGANIZAÇÃO DE DADOS
Prezado(a) aluno(a), falaremos agora sobre a 
organização de dados. Vamos lá!
Dado um conjunto de dados, vamos estudar 
como devemos “tratar” os valores, numéricos ou 
não, a fim de extrairinformações a respeito de uma 
ou mais características de interesse.
Suponhamos, por exemplo, que um questio-
nário foi aplicado a alunos do 1º ano de uma escola 
fornecendo as seguintes informações:
ƒƒ Id: identificação do aluno;
ƒƒ Turma: A ou B;
ƒƒ Sexo: Feminino (F) ou Masculino (M);
ƒƒ Idade: em anos;
ƒƒ Alt: altura em metros;
ƒƒ Peso: em quilogramas;
ƒƒ Filhos: nº de filhos na família;
ƒƒ Fuma: hábito de fumar: Sim (S) ou Não 
(N);
ƒƒ Toler: tolerância ao cigarro: (I) Indiferen-
te; (P) incomoda Pouco; (M) incomoda 
Muito;
ƒƒ Exerc.: horas de atividade física, por se-
mana;
ƒƒ Cine: nº de vezes que vai ao cinema por 
semana;
ƒƒ Op Cine: opinião a respeito das salas de 
cinema na cidade: (B) regular a Boa; (M) 
Muito boa;
ƒƒ TV: horas gastas assistindo à TV, por se-
mana;
ƒƒ Op TV: opinião a respeito da qualidade 
da programação na TV: (R) ruim; (M) mé-
dia; (B) boa; (N) não sabe.
O conjunto de informações, após a tabulação 
do questionário ou pesquisa de campo, é denomi-
nado tabela de dados brutos e contém os dados 
da maneira que foram coletados inicialmente (Ta-
bela 1).
Cada uma das características perguntadas 
aos alunos, como o peso, a idade, a altura etc., é 
denominada variável e, como podemos observar, 
tem naturezas diferentes quanto aos possíveis va-
lores que podem assumir.
2.1 Tipos de Variáveis
Existem dois tipos de variáveis: qualitativas 
(variáveis não numéricas) e quantitativas (variá-
veis numéricas). 
Variáveis qualitativas 
Seus valores representam uma qualidade (ou 
atributo) do indivíduo pesquisado.
Regina Maria Sigolo Bernardinelli
Unisa | Educação a Distância | www.unisa.br
14
Exemplos: sexo, turma, estado civil, grau de 
instrução, hábito de fumar etc. 
Entre as variáveis qualitativas, ainda existem 
dois tipos:
a. Variável qualitativa nominal: não exis-
te ordenação em seus possíveis resulta-
dos. Exemplos: sexo, turma, hábito de 
fumar;
b. Variável qualitativa ordinal: existe cer-
ta ordem em seus possíveis resultados. 
Exemplos: tamanho (P, M, G), classe social 
(baixa, média, alta), grau de instrução (1º 
grau, 2º grau, grau superior), estado civil.
Variáveis quantitativas
 
Seus valores são numéricos e resultantes de 
uma contagem ou mensuração.
Exemplos: número de filhos, salário, peso, 
altura etc.
Entre as variáveis quantitativas, ainda exis-
tem dois tipos:
a. Variáveis quantitativas discretas: seus 
possíveis valores formam um conjunto 
finito ou enumerável de números que 
resultam frequentemente de uma con-
tagem. Exemplos: número de filhos, ida-
de (em anos), cine (número de vezes que 
vai ao cinema por semana);
b. Variáveis quantitativas contínuas: 
seus possíveis valores formam um inter-
valo de números reais que resultam, nor-
malmente, de uma mensuração. Exem-
plos: peso, altura, salário.
AtençãoAtenção
A Estatística permite que dados quali-
tativos sejam apresentados de maneira 
quantitativa.
Saiba maisSaiba mais
Por exemplo, a variável idade, medida em anos completos, é quantitativa (contínua); mas, se 
for informada apenas a faixa etária (0 a 5 anos, 6 a 10 anos etc.), é qualitativa (ordinal). Outro 
exemplo é o peso dos lutadores de boxe, uma variável quantitativa (contínua), se trabalhamos 
com o valor obtido na balança, mas qualitativa (ordinal) se o classificarmos nas categorias do 
boxe (peso-pena, peso-leve, peso-pesado etc.). 
Outro ponto importante é que nem sempre uma variável representada por números é quanti-
tativa. O número do telefone de uma pessoa, o número da casa, o número de sua identidade. 
Às vezes o sexo do indivíduo é registrado na planilha de dados como 1 se macho e 2 se fêmea, 
por exemplo. Isso não significa que a variável sexo passou a ser quantitativa! 
Exemplo dos ursos marrons:
Num levantamento de dados de uma amostra da população de ursos marrons coletados nos 
EUA, teremos como qualitativas as variáveis sexo (nominal) e mês da observação (ordinal); são 
quantitativas contínuas: idade, comprimento da cabeça, largura da cabeça, perímetro do pes-
coço, perímetro do tórax, altura e peso. 
Estatística
Unisa | Educação a Distância | www.unisa.br
15
Figura 1 – Classificação de uma variável.
ESqUEMA
Id Turma Sexo Idade Alt Peso Filho Fuma Toler Exerc Cine Op Cine TV OpTV
1 A F 17 1,60 60,5 2 Não P 0 1 B 16 R 
2 A F 18 1,69 55,0 1 Não M 0 1 B 7 R
3 A M 18 1,85 72,8 2 Não P 5 2 M 15 R
4 A M 25 1,85 80,9 2 Não P 5 2 B 20 R
5 A F 19 1,58 55,0 1 Não M 2 2 B 5 R
6 A M 19 1,76 60,0 3 Não M 2 1 B 2 R
7 A F 20 1,60 58,0 1 Não P 3 1 B 7 R
8 A F 18 1,64 47,0 1 Sim I 2 2 M 10 R
9 A F 18 1,62 57,8 3 Não M 3 3 M 12 R
10 A F 17 1,64 58,0 2 Não M 2 2 M 10 R
11 A F 18 1,72 70,0 1 Sim I 10 2 B 8 N
12 A F 18 1,66 54,0 3 Não M 0 2 B 0 R
13 A F 21 1,70 58,0 2 Não M 6 1 M 30 R
14 A M 19 1,78 68,5 1 Sim I 5 1 M 2 N
15 A F 18 1,65 63,5 1 Não I 4 1 B 10 R
16 A F 19 1,63 47,4 3 Não P 0 1 B 18 R
17 A F 14 1,82 66,0 1 Não P 3 1 B 10 N
18 A M 18 1,80 85,2 2 Não P 3 4 B 10 R
19 A F 20 1,60 54,5 1 Não P 3 2 B 5 R
20 A F 18 1,68 52,5 3 Não M 7 2 B 14 M
21 A F 21 1,70 60,0 2 Não P 8 2 B 5 R
22 A F 18 1,65 58,5 1 Não M 0 3 B 5 R
23 A F 18 1,57 49,2 1 Sim I 5 4 B 10 R
24 A F 20 1,55 48,0 1 Sim I 0 1 M 28 R
25 A F 20 1,69 51,6 2 Não P 8 5 M 4 N
26 A F 19 1,54 57,0 2 Não I 6 2 B 5 R
27 B F 23 1,62 63,0 2 Não M 8 2 M 5 R
28 B F 18 1,62 52,0 1 Não P 1 1 M 10 R
29 B F 18 1,57 49,0 2 Não P 3 1 B 12 R
30 B F 25 1,65 59,0 4 Não M 1 2 M 2 R
Tabela 1 – Informações de questionário estudantil – Dados brutos.
Regina Maria Sigolo Bernardinelli
Unisa | Educação a Distância | www.unisa.br
16
Id Turma Sexo Idade Alt Peso Filho Fuma Toler Exerc Cine Op Cine TV OpTV
31 B F 18 1,61 52,0 1 Não P 2 2 M 6 N
32 B M 17 1,71 73,0 1 Não P 1 1 B 20 R
33 B F 17 1,65 56,0 3 Não M 2 1 B 14 R
34 B F 17 1,67 58,0 1 Não M 4 2 B 10 R
35 B M 18 1,73 87,0 1 Não M 7 1 B 25 B
36 B F 18 1,60 47,0 1 Não P 5 1 M 14 R
37 B M 17 1,70 95,0 1 Não P 10 2 M 12 N
38 B M 21 1,85 84,0 1 Sim I 6 4 B 10 R
39 B F 18 1,70 60,0 1 Não P 5 2 B 12 R
40 B M 18 1,73 73,0 1 Não M 4 1 B 2 R
41 B F 17 1,70 55,0 1 Não I 5 4 B 10 B
42 B F 23 1,45 44,0 2 Não M 2 2 B 25 R
43 B M 24 1,76 75,0 2 Não I 7 0 M 14 N
44 B F 18 1,68 55,0 1 Não P 5 1 B 8 R
45 B F 18 1,55 49,0 1 Não M 0 1 M 10 R
46 B F 19 1,70 50,0 7 Não M 0 1 B 8 R
47 B F 19 1,55 54,5 2 Não M 4 3 B 3 R
48 B F 18 1,60 50,0 1 Não P 2 1 B 5 R
49 B M 17 1,80 71,0 1 Não P 7 0 M 14 R
50 B M 18 1,83 86,0 1 Não P 7 0 M 20 B
A partir da tabela de dados brutos (Tabela 
1), vamos construir uma nova com as informações 
resumidas, para cada variável, denominada tabela 
de frequência, que conterá os valores da variável 
e suas respectivas contagens, as quais são denomi-
nadas frequências absolutas ou, simplesmente, 
frequências.
No caso de variáveis qualitativas ou quantita-
tivas discretas, a tabela de frequência consiste em 
listar os valores possíveis da variável, numéricos ou 
não, e fazer a contagem na tabela de dados brutos 
do número de suas ocorrências.
Notação: 
Para efeito de comparação com outros gru-
pos ou conjuntos de dados, é conveniente traba-
lharmos com a frequência relativa, definida por
2.2 Distribuição de Frequências
Estatística
Unisa | Educação a Distância | www.unisa.br
17
Note que, para variáveis cujos valores possuem ordenação natural (qualitativas ordinais e quanti-
tativas em geral), incluímos na tabela de frequência uma coluna contendo as frequências acumuladas 
(fac), quando o número de valores i for maior do que 2. A frequência acumulada até certo valor é obtida 
pela soma das frequências de todos os valores da variável menores ou iguais ao valor considerado.
ƒƒ Tabela de Frequência para a Variável Toler (extraída da Tabela 1)
Tabela 3 – Variável Toler.Exemplos
ƒƒ Tabela de Frequência para a Variável Sexo (extraída da Tabela 1)
Tabela 2 – Variável Sexo.
Sexo: variável qualitativa nominal.
Toler: variável qualitativa ordinal.
A variável Peso, classificada como quantita-
tiva contínua, apresenta valores que podem ser 
qualquer número real num certo intervalo.
Pela Tabela 1, verificamos que os valores 
variam entre 44,0 kg e 95,0 kg e, como existe um 
grande número de valores diferentes, vamos cons-
truir faixas ou classes de valores e contar o núme-
ro de ocorrências em cada faixa.
Não existe uma regra formal para determinar 
o número de faixas ou classes a serem utilizadas. 
Entretanto, deve-se observar que, com um pe-
queno número de classes, perde-se informação e, 
com um número grande de classes, o objetivo de 
resumir os dados fica prejudicado. No geral, é con-
veniente trabalharmos com 5 a 8 faixas de mesma 
amplitude, devendo ressaltar que faixas de tama-
nho desigual podem ser convenientes para repre-
sentar valores nas extremidades da tabela.
Para a variável Peso, usaremos faixas de am-
plitude 10 e iniciaremos com 40,0 kg.
Regina Maria Sigolo Bernardinelli
Unisa | Educação a Distância | www.unisa.br
18
ƒƒ Tabela de Frequência para a Variável Peso (extraída da Tabela 1)
Tabela 4 – Variável Idade.
Peso: variável quantitativa contínua.
Observe, pela fac, que 76% dos alunos pesam menos que 70,0 kg e 100 – 88 = 12% têm peso maior 
ou igual a 80,0 kg.
Na Tabela 5, temos 6 faixas ou classes ou intervalos. Consideremos, por exemplo, a 1ª classe ou 
intervalo: 40,0 ├─ 50,0, onde temos:
Limite inferior (li): 40,0 
Ponto Médio (PM) = 
Limite superior (ls): 50,0 
Amplitude ou tamanho do intervalo (h): h = ls – li; (h = 50,0 – 40,0 = 10,0)
O símbolo ├─ indica que o intervalo é fechado à esquerda e aberto à direita (40,0 faz parte dessa 
classe, mas 50,0 não; 50,0 está na 2ª classe).
Na Tabela 1, a variável TV (quantitativa discreta) tem valores inteiros entre 0 e 30 e uma tabela re-
presentando tais valores e respectivas frequências seria muito extensa e pouco prática. Por esse motivo, 
trataremos essa variável como quantitativa contínua, criando, por exemplo, faixas de amplitude 6 para 
representar seus valores.
Estatística
Unisa | Educação a Distância | www.unisa.br
19
ƒƒ Tabela de Frequência para a Variável TV (extraída da Tabela 1)
Tabela 5 – Variável TV.
TV: variável quantitativa discreta, que foi “tratada” como contínua.
Observe que, na última classe, o intervalo é fechado à esquerda e à direita, incluindo, portanto, o 
valor 30 e não tendo, assim, que abrir mais uma classe por causa de um único valor. Outra sugestão seria 
usar uma amplitude maior nessa última classe, por exemplo, 24 ├─ 36, que inclui o valor 30.
Saiba maisSaiba mais
Frequência Absoluta (ni ) - é o número de vezes que o valor de determinada variável é observado
Frequência Absoluta Acumulada (fac)- é a soma das frequências absolutas anteriores com a frequência abso-
luta deste valor.
 
Frequência Relativa (fi) - é o quociente entre a frequência absoluta do valor da variável e o número total de 
observações.
Frequência Relativa Acumulada (fac %) - é a soma das frequências relativas anteriores com a frequência rela-
tiva desse valor.
fac% =
n
i=1
fi∑
2.3 Resumo do Capítulo
Prezado(a) aluno(a), neste capítulo estudamos sobre variáveis e suas frequências. O conjunto de 
informações, após a tabulação do questionário ou pesquisa de campo, é denominado de tabela de dados 
brutos. Cada uma das características perguntadas aos alunos tais como, o peso, a idade, a altura etc., é 
denominada de variável, e, como podemos observar, possuem naturezas diferentes quanto aos possíveis 
valores que podem assumir, sendo classificadas como variáveis qualitativas (nominal e ordinal) ou variá-
veis quantitativas (continuas e discretas).
Vamos, agora, avaliar a sua aprendizagem.
Regina Maria Sigolo Bernardinelli
Unisa | Educação a Distância | www.unisa.br
20
1. Monte a tabela com as distribuições de frequência da variável Idade de acordo com os dados 
da Tabela 1.
2. Na Escola São Leopoldo, para estudar a preferência em relação a refrigerantes, sortearam-se 
150 estudantes, entre os 1.000 matriculados. Responda:
a. Qual é a população envolvida na pesquisa?
b. Que tipo de amostragem foi utilizado e qual é a amostra considerada?
3. A população envolvida em uma pesquisa sobre a incidência de cárie dentária em escolares da 
cidade de Morro Grande é apresentada na Tabela 6.
Tabela 6 – Incidência de cárie em escolares.
Baseando-se nesses dados, estratifique uma amostra com 200 elementos.
4. Em uma cidade com 30.000 habitantes, deseja-se fazer uma pesquisa sobre a preferência por 
tipo de lazer entre pessoas de 20 anos de idade, levando em conta o sexo a que pertencem.
a. Qual a população envolvida na pesquisa?
b. Supondo que, na cidade, haja 5.500 mulheres e 6.000 homens com 20 anos, determine 
uma amostra com 1.200 pessoas.
5. Em uma fábrica, foram testadas 400 lâmpadas; a duração delas aparece na distribuição por 
frequência da Tabela 7:
2.4 Atividades Propostas
Estatística
Unisa | Educação a Distância | www.unisa.br
21
Tabela 7 – Duração de lâmpadas.
a. Complete a tabela dada com as demais colunas que você conhece.
b. Qual a amplitude de cada classe?
c. Qual o limite inferior da 3ª classe?
d. Qual o limite superior da 8ª classe?
e. Qual o ponto médio da 5ª classe?
f. Qual a frequência relativa da 6ª classe?
g. Qual a porcentagem de lâmpadas com durabilidade máxima de 500 horas?
h. Qual a porcentagem de lâmpadas com durabilidade de 900 horas ou mais?
Unisa | Educação a Distância | www.unisa.br
23
Prezado(a) aluno(a), neste capítulo, iremos 
estudar sobre gráficos. A organização dos dados 
em tabelas de frequência proporciona um meio 
eficaz de estudo do comportamento de caracterís-
ticas de interesse.
Muitas vezes, a informação contida nas ta-
belas pode ser mais facilmente visualizada através 
de gráficos. Vamos definir quatro tipos básicos de 
gráficos: setores ou pizza, colunas ou barras, his-
tograma e polígono de frequências.
3 GRÁFICOS ESTATÍSTICOS
3.1 Gráfico de Setores ou Disco ou Pizza ou Diagrama Circular
Adapta-se muito bem às variáveis qualitati-
vas, mas também pode ser usado para as variáveis 
quantitativas discretas.
Fazendo uso do computador para o traça-
do do gráfico, basta conhecer as porcentagens de 
cada valor da variável. Se, ao contrário, formos tra-
çar o gráfico com o auxílio de compasso e transferi-
dor, precisamos determinar a medida em graus de 
cada setor correspondente aos valores da variável, 
lembrando que o disco todo mede 360°.
Exemplo: gráfico de setores para a variável Toler (Tabela 3):
I: 20% P:42% M: 38%
Procedemos de maneira análoga para os valores de P e M.
AtençãoAtenção
A utilização de tabelas e gráficos são frequentes na Estatística. As tabelas servem para orga-
nizar e tabular os dados, já os gráficos transmitem as informações com clareza e transparên-
cia, contribuindo para uma leitura objetiva. 
Regina Maria Sigolo Bernardinelli
Unisa | Educação a Distância | www.unisa.br
24
Gráfico 1 – Setores.
3.2 Gráfico de Colunas ou Barras
Adapta-se melhor às variáveis discretas ou 
qualitativas ordinais.
Utiliza o plano cartesiano com os valores da 
variável no eixo das abscissas e as frequências ou 
porcentagens no eixo das ordenadas.
Exemplo: gráfico de colunas para a variável Idade (Tabela 4):
Gráfico 2 – Colunas.
Estatística
Unisa | Educação a Distância | www.unisa.br
25
3.3 Histograma
3.4 Polígono de Frequências
É utilizado para variáveis quantitativas contí-
nuas.
Consiste em retângulos contíguos ou adja-
centes, nos quais a base, colocadano eixo das abs-
cissas, corresponde aos intervalos das classes e a 
altura, colocada no eixo das ordenadas, é dada pela 
frequência absoluta ou relativa das classes.
Observação: A área de um histograma é 
proporcional à soma das frequências absolutas. No 
caso de trabalharmos com as frequências relativas, 
a área será igual à constante de proporcionalidade.
Exemplo: histograma para a variável Peso (Tabela 5):
Gráfico 3 – Histograma.
DicionárioDicionário
Um histograma é uma representação gráfica da distribuição de frequências de uma massa de 
medições, normalmente um gráfico de barras verticais.
O histograma é um gráfico composto por retângulos justapostos em que a base de cada um 
deles corresponde ao intervalo de classe e a sua altura à respectiva frequência. A construção 
de histogramas tem caráter preliminar em qualquer estudo e é um importante indicador da 
distribuição de dados. 
É também utilizado para variáveis quantitati-
vas contínuas.
Para construir o polígono de frequências, ad-
mitem-se, como representantes de cada classe, os 
pontos médios de cada intervalo que as definem. 
Após obter os pontos (ponto médio, frequência 
correspondente) em relação a cada intervalo, estes 
são ligados entre si por meio de segmentos de re-
tas, sendo que o primeiro e o último são ligados ao 
eixo das abscissas, na metade de classes hipotéti-
cas, imediatamente anterior à primeira e posterior 
à última.
Regina Maria Sigolo Bernardinelli
Unisa | Educação a Distância | www.unisa.br
26
Exemplo: polígono de frequências para a variável Peso (Tabela 5):
Gráfico 4 – Polígono de frequências.
Saiba maisSaiba mais
Você poderá obter esses gráficos, utilizando o Excel.
Abaixo segue o link onde você poderá obter informações, caso ainda não as saiba, de quais gráficos são possíveis cons-
truir com o Excel e como construí-los.
Porém é importante você observar que essa é apenas uma dica. 
O fato de poder utilizar o Excel para a construção de gráficos não o exime do dever de saber construir esses gráficos 
manualmente, ou seja, sem o auxílio desta ferramenta, pois certamente você precisará desenvolver essas atividades nas 
avaliações presenciais.
Confira as dicas em: 
http://office.microsoft.com/pt-br/excel-help/tipos-de-graficos-disponiveis-HA001233737.aspx.
3.5 Resumo do Capítulo
Prezado(a) aluno(a), muitas vezes, a informação contida nas tabelas pode ser mais facilmente vi-
sualizada através de gráficos. Nesse sentido, definimos, neste capítulo, quatro tipos básicos de gráficos: 
setores ou pizza, colunas ou barras, histograma e polígono de frequências. E, por fim, vimos que o histo-
grama é utilizado para variáveis quantitativas contínuas.
Vamos, agora, avaliar a sua aprendizagem.
Estatística
Unisa | Educação a Distância | www.unisa.br
27
3.6 Atividades Propostas
1. Com relação às variáveis: Turma, Alt, Filhos, Fuma, Exerc, Cine, Op Cine, Op TV, da Tabela 1: 
a. Classifique essas variáveis.
b. Faça a distribuição de frequência para cada uma delas. 
c. A variável Exerc poderia ser tratada de forma diferente com relação à sua classificação? 
Justifique sua resposta e, em caso afirmativo, construa a nova distribuição de frequência.
d. Construa os gráficos que melhor se adaptam a cada uma das variáveis apresentadas.
2. Quinze pacientes de uma clínica de ortopedia foram entrevistados quanto ao número de me-
ses previstos de fisioterapia, se haverá (S) ou não (N) sequelas após o tratamento e o grau de 
complexidade da cirurgia realizada: alto (A), médio (M) ou baixo (B). Os dados são apresenta-
dos na Tabela 8: 
Tabela 8 – Levantamento em clínica de ortopedia.
a. Classifique cada uma das variáveis.
b. Para cada variável, construa a tabela de frequência e faça uma representação gráfica.
c. Para o grupo de pacientes que não ficaram com sequelas, faça um gráfico de barras para 
a variável Fisioterapia. Você acha que essa variável se comporta de modo diferente nesse 
grupo?
3. Os dados da Tabela 9 referem-se ao salário (em salários-mínimos) de 20 funcionários admi-
nistrativos em uma indústria.
Tabela 9 – Salários de funcionários administrativos (em salários-mínimos).
a. Construa uma tabela de frequência agrupando os dados em intervalos de amplitude 2, a 
partir de 1.
b. Construa o histograma.
Regina Maria Sigolo Bernardinelli
Unisa | Educação a Distância | www.unisa.br
28
4. Um grupo de estudantes do ensino médio foi submetido a um teste de Matemática resultan-
do em:
Tabela 10 – Teste de Matemática.
a. Construa o histograma.
b. Se a nota mínima para aprovação é 5, qual será a porcentagem de aprovação?
Unisa | Educação a Distância | www.unisa.br
29
4 MEDIDAS
Prezado(a) aluno(a), agora falaremos sobre 
medidas. 
Nosso interesse é caracterizar o conjunto de 
dados através de medidas que resumam a informa-
ção, por exemplo, representando a tendência cen-
tral dos dados ou a maneira pela qual esses dados 
estão dispersos.
4.1 Medidas de Posição
Se estivermos numa parada de ônibus e nos 
pedirem alguma informação sobre a demora em 
passar um determinado ônibus, ninguém imagina 
que poderíamos dar como resposta uma tabela de 
frequências que coletamos no último mês. Quem 
perguntou deseja uma resposta breve e rápida, 
que sintetize a informação que dispomos, e não 
uma completa descrição dos dados. É para isso que 
servem as medidas de posição.
Medidas de Posição para um Conjunto de Dados
Seja uma variável X, com observações repre-
sentadas por 
Média Aritmética ou, Simplesmente, Média ( )
É a soma dos valores da variável dividida pelo 
número total de observações.
Exemplo: calcular a média aritmética dos va-
lores: 9, 12, 8, 6, 14, 11, 5.
Para calcularmos a média quando os dados 
estão agrupados em classes, representamos todos 
os valores de cada classe pelo ponto médio da clas-
se (visto no capítulo 2).
Mediana (md)
É o valor da variável que ocupa a posição cen-
tral dos dados ordenados. 
Para o cálculo da mediana, temos duas consi-
derações a fazer:
a. o número de observações (n) é ímpar: 
a mediana será o valor da variável que 
ocupa a posição de ordem .
AtençãoAtenção
As medidas de posição ou medidas de 
tendência central para um conjunto de 
dados qualquer (população ou amostra) 
são: a média, a mediana e a moda.
Regina Maria Sigolo Bernardinelli
Unisa | Educação a Distância | www.unisa.br
30
Exemplo: calcular a mediana dos valores: 
9, 12, 8, 6, 14, 11, 5.
Em primeiro lugar, vamos montar o Rol, ou 
seja, organizar os dados em ordem crescente: 
5, 6, 8, 9, 11, 12, 14
Observe que n = 7 (ímpar) 
Logo, a medida será dada pelo elemento que 
divide o Rol em duas partes iguais.
b. o número de observações (n) é par: não 
existe, portanto, um valor que ocupe o 
centro; convencionou-se que a mediana 
será a média aritmética dos valores que 
ocupam as posições de ordem 
Exemplo: calcular a mediana dos valores já 
ordenados: 6, 8, 9, 11, 12, 14.
n = 6 (par) 
A mediana será dada pela média aritmética 
entre o 3º e 4º elementos da sequência:
Para calcularmos a mediana quando os da-
dos estão agrupados em classes, não levamos em 
consideração se n é par ou ímpar e procedemos do 
seguinte modo:
1º) Calcula-se ;
2º) Pela frequência acumulada, identifica-se a 
classe que contém a mediana;
3º) Aplica-se a fórmula: 
onde:
limd = limite inferior da classe md
n = nº total de elementos da amostra
fac = frequência acumulada da classe ante-
rior à classe md
h = amplitude da classe md
nimd = frequência da classe md
Moda (mo)
É o valor da variável mais frequente da distri-
buição.
Exemplo: calcular a moda para o seguinte 
conjunto de dados: 
65, 87, 49, 58, 65, 65, 67, 83, 87, 79, 87.
Observe que, mo = 65 (aparece 3 vezes) e mo 
= 87 (aparece 3 vezes).Temos então duas modas, portanto a distri-
buição é bimodal. Quando a distribuição não apre-
sentar moda, será chamada amodal; se tiver uma 
só moda, recebe o nome de unimodal e, se apre-
sentar várias modas, será multimodal.
Para calcularmos a moda quando os dados 
estão agrupados em classes, usaremos o seguinte 
processo:
DicionárioDicionário
Rol é a sequência de dados obtida após a ordena-
ção dos dados (crescente ou decrescente).
Estatística
Unisa | Educação a Distância | www.unisa.br
31
1º) Identifica-se a classe modal (a que possuir 
maior frequência);
2º) Aplica-se a fórmula: 
onde:
limo = limite inferior da classe modal
 = diferença entre a frequência da classe 
modal e a imediatamente anterior
 = diferença entre a frequência da classe 
modal e a imediatamente posterior
h = amplitude da classe modal
Exemplos:
1. Calcule média, mediana e moda para a variável Idade (Tabela 11) (Ver Tabela 23):
Tabela 11 – Variável Idade.
n = 50 é par, portanto, a mediana será a média aritmética dos dois valores centrais 
Pela fac, observamos que o valor da frequência acumulada até 18 é igual a 31 e, portanto, o 25º 
elemento é igual ao 26º elemento e ambos correspondem ao valor da variável igual a 18
Para o cálculo de mo, olhamos a maior frequência (22), que corresponde à idade de 18 anos.
2. Calcule média, mediana e moda para a variável Peso (Tabela 12) (Ver Tabela 4):
Regina Maria Sigolo Bernardinelli
Unisa | Educação a Distância | www.unisa.br
32
Pela fac (30), a 2ª classe contém a mediana, isto é, o intervalo 50,0 ├─ 60,0.
Tabela 12 – Variável Peso.
Saiba maisSaiba mais
As medidas de posição podem ser utilizadas em conjunto para auxiliar a análise dos dados, mas existem situações 
em que uma pode ser mais conveniente do que a outra. Por exemplo, quando existe um ou mais valores muito discre-
pantes, a média é muito influenciada por este valor e se torna inadequada para representar o conjunto de dados, sendo 
melhor trabalhar com a mediana. Por outro lado, para conjuntos de dados muito numerosos, a ordenação é custosa e 
a mediana se torna difícil de calcular.
Estatística
Unisa | Educação a Distância | www.unisa.br
33
Prezado(a) aluno(a), como visto, efetuar uma 
análise dos dados, utilizando-se somente as medi-
das de posição, pode levar-nos a conclusões equi-
vocadas. Para nos auxiliar na tarefa da análise de 
dados, utilizaremos também as medidas de disper-
são.
Observe o exemplo a seguir.
Um bairro nobre da capital paulista inclui 
uma das maiores favelas de São Paulo. O que pode-
mos dizer da renda média do bairro? Certamente, 
os altos rendimentos de alguns residentes serão 
suficientes para fazer a média atingir um patamar 
comparável às melhores economias do mundo, 
porém a discrepância entre os diversos valores 
deve ser muito grande. O que podemos estar es-
quecendo é a variabilidade dos valores da variável 
e isso não é captado pela média, mas pelas medi-
das de dispersão.
As medidas de dispersão ou de variabili-
dade servem para quantificar a variabilidade dos 
valores da variável, isto é, a dispersão dos dados, ou 
a forma como os valores de cada conjunto se espa-
lham ao redor das medidas de tendência central. 
4.2 Medidas de Dispersão
Medidas de Dispersão para um Conjunto de Dados 
Sejam os valores assumidos por uma variável X.
Consideremos, por exemplo, as séries:
A: 10, 10, 11, 12, 12, 13, 14, 14, 14, 15 com = 12,5 e md = 12,5
B: 7, 7, 8, 9, 12, 13, 13, 16, 17, 23 com = 12,5 e md = 12,5
Observamos que essas séries não são homogêneas, apesar de ambas terem o mesmo valor para a 
média e a mediana. É preciso, pois, calcular as constantes de dispersão, que medem os afastamentos dos 
valores dessas séries em torno do valor central.
Entre as medidas de dispersão ou de variabilidade mais usadas, temos: amplitude total, variân-
cia, desvio padrão e coeficiente de variação.
Amplitude total (R) 
É a diferença entre o maior e o menor valor de um conjunto de dados.
Exemplos:
Para a série A: R = 15 – 10 = 5.
Para a série B: R = 23 – 7 = 16.
Regina Maria Sigolo Bernardinelli
Unisa | Educação a Distância | www.unisa.br
34
A utilização da amplitude total como medida de dispersão é muito limitada, pois só leva em consi-
deração dois valores de todo o conjunto de dados. 
Variância ( )
 
Para medir a dispersão dos valores de uma variável em torno da média, é interessante estudar o 
comportamento dos desvios de cada valor em relação à média, isto é, . Na determinação de cada 
desvio id , estaremos medindo a dispersão entre cada ix e a média x . Porém, se somarmos todos os 
desvios, teremos 0)xx(d
n
1i
i
n
1i
i =−= ∑∑
==
. Para contornar o problema, resolveu-se considerar o quadrado 
de cada desvio 2i )xx( − . Assim, defini-se:
Variância é a média aritmética dos quadrados dos desvios.
A seguir, estão outras fórmulas que podem ser usadas para facilitar o cálculo da variância popula-
cional e amostral.
2
N
1i
2
i
2 x
N
1
µ−=σ ∑
=
 (dados não agrupados) ∑
=
−=
n
1i
22
i
2 )x(x
n
1S (dados não agrupados) 
∑
=
µ−⋅=σ
N
1i
22
ii
2 )xn(
N
1
 (dados agrupados) ∑
=
−⋅=
n
1i
22
ii
2 )x()xn(
n
1S (dados agrupados)
Estatística
Unisa | Educação a Distância | www.unisa.br
35
Exemplos:
Desvio padrão ( )
 
O desvio padrão é a raiz quadrada da variância.
É assim definido para que a unidade original da variável, se houver, seja mantida, pois, pela fórmula 
do cálculo da variância, a unidade é elevada ao quadrado.
2σ=σ (desvio padrão populacional)
2SS = (desvio padrão amostral)
Exemplos:
Para a série A: 
Para a série B: 
Observação: O desvio padrão define, em torno da média populacional ou amostral, um intervalo 
[μ – σ, μ + σ ] ou [ Sx,Sx +− ] de amplitude 2σ ou 2S, respectivamente, chamado zona de normalidade.
Coeficiente de variação (CV) 
O coeficiente de variação é uma medida relativa da dispersão que serve para comparar o grau de 
concentração em torno da média de conjuntos de dados distintos.
Exemplos:
Para a série A: 
Para a série B: 
Vemos, portanto, que há maior variação na série B do que na A, pois o CV, na série B, é bem maior 
que na série A.
Regina Maria Sigolo Bernardinelli
Unisa | Educação a Distância | www.unisa.br
36
Exemplos:
1. Calcule amplitude total, variância, desvio padrão e coeficiente de variação para a variável Ida-
de (Tabela 13) (Ver Tabela 11):
Tabela 13 – Variável Idade.
R = 25 – 17 = 8 (amplitude total)
2. Calcule amplitude total, variância, desvio padrão e coeficiente de variação para a variável Peso 
(Tabela 14) (Ver Tabela 12):
Tabela 14 – Variável Peso.
Estatística
Unisa | Educação a Distância | www.unisa.br
37
4.4 Atividades Propostas
 
4.3 Resumo do Capítulo
Prezado(a) aluno(a), vimos neste capítulo que as medidas de posição ou medidas de tendência 
central para um conjunto de dados qualquer (população ou amostra) são: a média, a mediana e a moda. 
Também foram apresentadas as medidas de dispersão. Entre as medidas de dispersão ou de variabilida-
de mais usadas, temos: amplitude total, variância, desvio padrão e coeficiente de variação, que comple-
mentarão as informações necessárias para a análise dos dados.
Vamos, agora, avaliar a sua aprendizagem.
1. Vinte e cinco residências de certo bairro foram sorteadas e visitadas por um entrevistador, 
que, entre outras questões, perguntou sobre o número de televisores. 
Os dados foram os seguintes: 
2, 2, 2, 3, 1, 2, 1, 1, 1, 1, 0, 1, 2, 2, 2, 2, 3, 1,1, 3, 1, 2, 1, 0 e 2.
Organize os dados numa tabela de frequência e determine todas as medidas de posição e de 
dispersão.
2. Num experimento, 15 coelhos foram alimentados com uma nova ração e seu peso avaliado 
no fim de um mês. 
Os dados referentes ao ganho de peso (em quilogramas) foram os seguintes:
1,5; 1,6; 2,3; 1,7; 1,5; 2,0; 1,5; 1,8; 2,1; 2,1; 1,9; 1,8; 1,7; 2,5 e 2,2.
Regina Maria Sigolo Bernardinelli
Unisa | Educação a Distância | www.unisa.br
38
a. Utilizando os dados brutos, determine as medidas de posição e de dispersão desse con-
junto.
b. Organize uma tabela de frequência com faixas de amplitude 0,2 a partir de 1,5.
c. Calcule, a partir da tabela de frequência e com o ponto médio como representante de cada 
faixa, as medidas de posição e de dispersão. Comente as diferenças encontradas com o 
item (a).
d. Se ao invés de 15, fossem 500 coelhos, qual seria o procedimento mais conveniente: o de 
(a) ou o de (c)? Justifique. 
3. As pulsações de 10 estudantes no início de uma prova de Estatística foram as seguintes (em 
batimentos por minuto): 80, 91, 84, 86, 93, 88, 80, 89, 85 e 86. Calcule as medidas de posição e 
de dispersão desse conjunto de dados.
4. Num estudo sobre consumo de combustível, 200 automóveis do mesmo ano e modelo tive-
ram o seu consumo observado durante 1000 quilômetros. A informação obtida é apresentada 
na Tabela 15, em km/litro.
Tabela 15 – Consumo de combustível.
Determine as medidas de posição e de dispersão do consumo.
5. Se a média das alturas de um grupo de pessoas é 175 cm e o desvio padrão é 20 cm, uma pes-
soa com estatura de 150 cm está dentro da normalidade? Por quê?
6. Numa escola, duas turmas conseguiram os seguintes resultados:
Responda: 
a. Qual a turma mais homogênea? Por quê?
b. Um aluno com média 40 é considerado normal na turma A? E na turma B? Por quê?
Estatística
Unisa | Educação a Distância | www.unisa.br
39
7. Na aplicação de um teste de motricidade, conseguiram-se os resultados da Tabela 16. 
Tabela 16 – Motricidade.
Responda:
a. Qual é a média aritmética?
b. Qual é o desvio padrão?
c. Qual a zona considerada de normalidade?
d. Uma criança que obteve 28 pontos é considerada com motricidade normal? Por quê?
8. Na pesagem de 20 crianças de quinta série, obtiveram-se os seguintes resultados, em kg:
38 40 45 42 45 40 43 38
45 45 40 41 41 38 46 32
48 46 42 43 44 50 38 40
Nesse grupo de crianças, um menino com 35 kg seria considerado com peso normal? Por quê?
Unisa | Educação a Distância | www.unisa.br
41
5 PROBABILIDADES
Prezado(a) aluno(a), neste capítulo, não será 
efetuado um estudo completo sobre a teoria das 
probabilidades, mas serão apresentados alguns 
conceitos que serão necessários para o estudo da 
Estatística e aplicados posteriormente.
5.1 Fenômeno Determinístico
É aquele em que repetindo um experimen-
to, nas mesmas condições, o resultado esperado é 
sempre o mesmo.
Exemplo: se um corpo percorre uma distân-
cia de 120 km, com velocidade média de 60 km/h, 
podemos determinar, pelas leis da Física, que ele 
gastará 2 horas para percorrer o referido espaço e 
isso sempre ocorrerá, desde que sejam mantidas as 
mesmas condições.
5.2 Fenômeno Aleatório ou Probabilístico
É aquele cujo resultado não pode ser previsto 
com certeza, ainda que mantidas as mesmas con-
dições de realização.
Exemplo: no lançamento de um dado, não 
podemos dizer, com certeza, qual será o resultado. 
Só podemos saber que é provável que ocorra o re-
sultado 1 ou 2 ou 3 ou 4 ou 5 ou 6.
Veremos que modelos podem ser estabele-
cidos para quantificar as incertezas das diversas 
ocorrências.
AtençãoAtenção
A maioria dos fenômenos tratada pela Es-
tatística é de natureza aleatória ou proba-
bilística. Observe que durante a escolha 
da amostra, temos um fenômeno proba-
bilístico.
Regina Maria Sigolo Bernardinelli
Unisa | Educação a Distância | www.unisa.br
42
5.3 Espaço Amostral (S)
É o conjunto de todos os resultados possíveis de certo fenômeno aleatório.
5.4 Evento (E)
É um subconjunto do espaço amostral.
Exemplo: lançamos uma moeda duas vezes. 
Se C indica cara e R, coroa, temos:
S = {(C, C); (C, R); (R, C); (R, R)} (espaço amos-
tral)
 Seja o evento “obtenção de faces iguais”, te-
mos: E = {(C, C); (R, R)} (evento)
Seja o evento “obtenção de cara no 1º lança-
mento”, temos: E = {(C, C); (C, R)} (evento)
Exemplo: um experimento consiste em re-
tirar uma lâmpada de um lote e medir seu tempo 
de vida antes de se queimar. Um espaço amostral 
conveniente é: S = {t: t ≥ 0}, isto é, o conjunto de to-
dos os números reais não negativos. Seja o evento 
“o tempo de vida da lâmpada é inferior a 20 horas”, 
temos: E = {t: 0 ≤ t < 20}. Este é um exemplo de es-
paço amostral contínuo, enquanto os outros ante-
riores são discretos.
5.5 Probabilidade
É a relação entre o número de possíveis resul-
tados de E e todos os possíveis resultados do expe-
rimento. Indicamos: P(E).
No caso dos dois eventos anteriores,
P(E) = 
2
1
4
2
= .
5.6 Propriedades
Sendo o modelo probabilístico um modelo 
teórico para as frequências relativas, podemos ve-
rificar algumas das propriedades a seguir:
ƒƒ Como toda frequência relativa é um nú-
mero entre 0 e 1, temos que: 0 ≤ P(E) ≤ 1, 
para qualquer evento E;
ƒƒ Considerando o espaço todo S e o con-
junto vazio como eventos, temos:
P(S) = 1 (evento certo) e 
P(Ø) = 0 (evento impossível)
Estatística
Unisa | Educação a Distância | www.unisa.br
43
5.7 Variável Aleatória Discreta
Uma quantidade X, associada a cada possível resultado do espaço amostral S, é denominada vari-
ável aleatória discreta se assume valores num conjunto enumerável de pontos do conjunto real, com 
certa probabilidade de ocorrência.
Saiba maisSaiba mais
Um pouco de História
Os primeiros estudos envolvendo probabilidades foram motivados pela análise de jogos de azar. Sabe-se que um 
dos primeiros matemáticos que se ocupou com o cálculo das probabilidades foi Cardano (1501-1576). Data dessa época 
a expressão que utilizamos até hoje para o cálculo da probabilidade de um evento (número de casos favoráveis dividido 
pelo número de casos possíveis).
Com Fermat (1601-1665) e Pascal (1623-1662), a teoria das probabilidades começou a evoluir e ganhar mais 
consistência, passando a ser utilizada em outros aspectos da vida social, como, por exemplo, auxiliando na descoberta 
da vacina contra a varíola no século XVIII.
Atualmente, a teoria das probabilidades é muito utilizada em outros ramos da Matemática (como o Cálculo e a 
Estatística), da Biologia (especialmente nos estudos da Genética), da Física (como na Física Nuclear), da Economia, da 
Sociologia etc.
5.8 Função Discreta de Probabilidade
A função que atribui a cada valor 
n321 x,,x,x,x  da variável aleatória X sua pro-
babilidade de ocorrência n321 p,,p,p,p  , res-
pectivamente, é denominada função discreta de 
probabilidade ou, simplesmente, função de pro-
babilidade.
Notação: 
,3,2,1i,p)xX(P)x(p iii ====
ou, ainda,
 
 
Uma função de probabilidade satisfaz: 
∑ =≤≤ 1pe1p0 ii .
Regina Maria Sigolo Bernardinelli
Unisa | Educação a Distância | www.unisa.br
44
5.9 Variável Aleatória Contínua
Uma quantidade X, associada a cada possível 
resultado do espaço amostral S, é denominada va-
riável aleatória contínua se assume valores num 
intervalo do conjunto dos números reais, com cer-
ta probabilidade de ocorrência.
Exemplos: renda, salário, tempo de uso de 
um equipamento, área atingida por certa praga 
agrícola.
5.10 Função Contínua de Probabilidade
Função contínua de probabilidade ou fun-
ção densidade de probabilidade para uma vari-
ável aleatória contínua X é toda função f (X) que 
satisfaz a duas condições:a. f (X) ≥ 0, para todo X ( , )∈ −∞ + ∞ ;
b. a área definida por f (X) é igual a 1.
5.11 Resumo do Capítulo
Prezado(a) aluno(a), neste capítulo, apresentamos alguns conceitos fundamentais sobre Probabili-
dade, entre eles a definição de Espaço Amostral (S), Evento (E), Probabilidade, Variável Aleatória Discreta, 
Função Discreta de Probabilidade, Variável Aleatória Contínua e Função Contínua de Probabilidade.
O cálculo das probabilidades pertence ao campo da Matemática, entretanto a maioria dos fenôme-
nos de que trata a Estatística são de natureza aleatória ou probabilística. O conhecimento dos aspectos 
fundamentais do cálculo das probabilidades é uma necessidade essencial para o estudo da Estatística 
Indutiva ou Inferência.
Vamos, agora, avaliar a sua aprendizagem.
Estatística
Unisa | Educação a Distância | www.unisa.br
45
5.12 Atividades Propostas
1. Um número é escolhido ao acaso entre os 50 inteiros compreendidos entre 1 e 50. Qual a pro-
babilidade do número:
a. Ser múltiplo de 9?
b. Ser múltiplo de 3 e de 4?
c. Ser múltiplo de 3 ou de 4?
d. Ser um número primo?
2. Numa caixa estão guardadas peças nas cores e formatos conforme a tabela abaixo:
 
Ao sortear-se ao acaso uma das peças, qual a probabilidade de ocorrer uma peça:
a. Circular Amarela?
b. Retangular?
c. Não Triangular?
Unisa | Educação a Distância | www.unisa.br
47
6 VARIÁVEIS ALEATÓRIAS CONTÍNUAS
Entre os principais modelos teóricos para 
variáveis aleatórias contínuas, estudaremos o 
modelo normal, pois vários fenômenos, como es-
tatura, QI, orientação política, desgaste dos pisos 
etc., aproximam-se, na prática, muito bem desse 
modelo.
6.1 Modelo Normal ou Distribuição Normal
Dizemos que uma variável aleatória contínua X tem distribuição normal com parâmetros , respec-
tivamente a média e a variância da distribuição, –∞ < μ < +∞ e 0 < σ2 < +∞, se a sua função densidade 
de probabilidade é dada por: 
, para –∞ < X < +∞
AtençãoAtenção
A função densidade de probabilidade é dada por:
, para –∞ < X < +∞
Notação: X ~ N(μ, σ2) significa: X tem distribuição normal com parâmetros μ e σ2.
Gráfico 5 – Curva normal.
Regina Maria Sigolo Bernardinelli
Unisa | Educação a Distância | www.unisa.br
48
Saiba maisSaiba mais
Modelo Normal
O modelo normal, ou Gaussiano, é certamente o mais importante dos modelos para variáveis aleatórias contínu-
as. Isto se justifica pelo grande número de aplicações que a utilizam e pela sua capacidade de aproximar outros modelos. 
Nesta distribuição, a média, mediana e moda são valores coincidentes. 
O cálculo de probabilidades na distribuição normal é feito mediante o conhecimento da média e desvio padrão 
da variável aleatória. Dada a importância desta distribuição, estas duas medidas são consideradas as mais importantes 
para verificar tendência central e dispersão, respectivamente.
Observando-se o gráfico, temos: 
a. f (X) é simétrica em relação a μ, isto é, f (μ + X ) = f (μ – X ), para todo X, –∞ < X < +∞;
b. f (X) 0 quando X ±∞;
c. o valor máximo de f ( X ) se dá para X = μ, isto é, a curva normal é unimodal e média (μ), me-
diana (Md) e moda (Mo) coincidem;
d. E (X) = μ (valor esperado ou média);
e. Var (X) = σ2 (variância);
f ( X ) 0 quando X→ → ±∞f ( X ) 0 quando X→ → ±∞
Como calcular P (a ≤ X ≤ b)?
Gráfico 6 – Probabilidade.
As probabilidades para o modelo normal são calculadas com o auxílio de tabelas e, para evitarmos 
a multiplicação desnecessária de tabelas para cada par de valores (μ, σ2), utiliza-se uma transformação 
que conduz sempre ao cálculo de probabilidades com uma variável de parâmetros (0, 1), isto é, μ = 0 
(média) e σ² = 1 (variância).
Desse modo, se X ~ N(μ, σ2) , definimos uma nova variável 
σ
µ−
=
XZ , para qual se demonstra que 
μ ( Z ) = 0 e σ2 ( Z ) = 1.
Logo Z ~ N(μ, σ2) e é denominada Normal padrão ou Normal reduzida.
Estatística
Unisa | Educação a Distância | www.unisa.br
49
6.2 Resumo do Capítulo
Agora, para calcularmos P ( a ≤ X ≤ b), fazemos a seguinte transformação:
P ( a ≤ X ≤ b) = )bZa(P
σ
µ−
≤≤
σ
µ−
,
onde X ~ N(μ, σ²).
Portanto, quaisquer que sejam os valores de μ e σ, utilizamos a normal padrão para obter proba-
bilidades com a distribuição normal.
Os valores P ( 0 ≤ Z ≤ z ), z ≥ 0 são tabelados.
Pela simetria da curva normal, podemos calcular valores de probabilidades em outros intervalos e, 
também, temos que a probabilidade de estar à direita (ou à esquerda) de zero é 0,5. Como a probabilida-
de é sempre um número compreendido entre 0 e 1, a tabela contém apenas a parte decimal.
DicionárioDicionário
Simetria
Matemática: disposição de duas figuras que se correspondem ponto por ponto de tal sorte que os dois pontos corres-
pondentes de uma e da outra estejam a igual distância de um ponto, de uma reta ou de um plano dado.
Eixo de simetria, reta comum a todos os planos de simetria.
Note que temos um eixo central na curva normal. 
Se pegarmos um ponto pertencente à curva normal à direita do eixo central, teremos um ponto correspondente à es-
querda deste eixo que estará à mesma distância do eixo central.
Gráfico 7 – Normal padrão ou normal reduzida.
Prezado(a) aluno(a), neste capítulo, vimos como criar um modelo probabilístico e o que é uma fun-
ção densidade de probabilidade.
De modo geral, podemos dizer que as variáveis aleatórias, cujos valores resultam de mensurações 
ou medições, são variáveis aleatórias contínuas.
A construção de modelos probabilísticos para variáveis aleatórias contínuas envolve a ideia da ge-
 
0 -1 1 
f ( Z ) 
Z 
Regina Maria Sigolo Bernardinelli
Unisa | Educação a Distância | www.unisa.br
50
neralização do histograma, fazendo o número de classes e o número de valores tenderem para o infinito, 
que significa construir intervalos de classes extremamente pequenos, ínfimos.
Observe que a forma do histograma sofre uma modificação, passando a apresentar uma curva sua-
ve, ou seja, uma linha contínua, como visto no Gráfico 5. Esta curva contínua é a representação gráfica de 
uma função da variável aleatória X, chamada de função densidade de probabilidade.
Vamos, agora, avaliar a sua aprendizagem. 
6.3 Atividades Propostas
1. As alturas de 10.000 alunos têm distribuição aproximadamente normal, com média 170 cm e 
desvio padrão 5 cm. Qual a probabilidade de termos: 
a. Alunos com alturas entre 165 cm e 170 cm.
b. Entre 165 cm e 180 cm.
c. Entre 168 cm e 185 cm.
d. Menores que 160 cm.
e. Maiores que 180 cm.
f. Qual o número esperado de alunos com altura superior a 165 cm?
2. Suponha um consultor investigando o tempo que os trabalhadores de uma fábrica levam para 
montar determinada peça. 
Suponha que análises da linha de produção tenham calculado um tempo médio de 75 segun-
dos e desvio padrão de 6 segundos.
O que isso significa graficamente?
Ainda na Escala de X, o tempo central é a média de 75 segundos.
Na Escala de Z, a média é 0 e os intervalos têm como base o desvio padrão. Mas, assim como X, 
a variável Z é contínua.
Pergunta: Como 87, na Escala de X, pode ser relacionado a 2σ, na Escala de Z?
3. Suponha, agora, que o consultor queira saber qual a probabilidade de um trabalhador levar um 
tempo entre 75 e 81 segundos para montar uma peça, ou seja, P(75≤X≤81).
Unisa | Educação a Distância | www.unisa.br
51
7 ESTIMAÇÃO
7.1 Estimação por Intervalo
A estimação faz parte da Inferência Estatísti-
ca, que tem por objetivo fazer generalizações sobre 
uma população com base em dados de uma amos-
tra.
A estimação por ponto não permite julgar 
qual a possível magnitude do erro que estamos co-
metendo ao substituir o parâmetro por um único 
valor. Daí surge a ideia de construir intervalos de 
confiança, que são baseados na distribuição amos-
tral do estimadorpontual, incorporando à estimati-
va pontual do parâmetro informações a respeito de 
sua variabilidade.
Um intervalo de confiança é determinado 
por dois valores, que são os seus limites, chamados 
“limites de confiança”, que com certa probabili-
dade incluem o verdadeiro valor do parâmetro da 
população.
Logo, a estimação por intervalo consiste na 
fixação de dois valores tais que γ seja a probabilida-
de de que o intervalo, por eles determinado, conte-
nha o verdadeiro valor do parâmetro.
Prezado(a) aluno(a), neste capítulo iremos 
abordar aspectos relacionados à Inferência Estatís-
tica.
Até o presente momento, você aprendeu a 
descrever uma amostra por meio de medidas de 
tendência central e medidas de dispersão, que 
compõem a Estatística Descritiva. A partir de ago-
ra, você irá aprender a utilizar a Inferência Estatís-
tica para inferir indutivamente propriedades de 
uma população, com base nos resultados obtidos 
com uma amostra.
A Inferência Estatística nos permitirá tomar 
decisões sobre populações com base nas informa-
ções obtidas em amostras das mesmas. Por exem-
plo, com base nos dados amostrais, podemos de-
cidir se uma determinada droga é eficiente para o 
tratamento de uma doença entre outros.
Existem dois tipos de estimação: por ponto e 
por intervalo.
Na estimação por ponto, é proposto um úni-
co valor para substituir o parâmetro (dado da 
população). Assim, o estimador por ponto da mé-
dia aritmética populacional μ é a média aritméti-
ca amostral x ; o estimador por ponto da variância 
populacional σ² é a variância amostral S².
DicionárioDicionário
Inferir: Tirar uma conclusão a partir de um fato, de 
um princípio. Concluir, deduzir.
AtençãoAtenção
A estimação faz parte da Inferência Esta-
tística, que tem por objetivo fazer gene-
ralizações sobre uma população com 
base em dados de uma amostra.
Regina Maria Sigolo Bernardinelli
Unisa | Educação a Distância | www.unisa.br
52
γ é chamado de coeficiente de confiança ou nível de confiabilidade.
1 – γ é o nível de significância ou nível de incerteza ou, ainda, grau de desconfiança.
Portanto, a partir de informação de amostra, devemos calcular os limites de um intervalo, que, em 
γ % dos casos, inclua o valor do parâmetro a estimar e, em (1 – γ)% dos casos, não inclua o valor do parâ-
metro.
Intervalo de Confiança (IC) para a Média Populacional (Variância Conhecida)
Consideremos, inicialmente, o intervalo de confiança para a média μ (desconhecida) de certa po-
pulação normal, com variância conhecida σ². Supondo uma amostra X de tamanho n, com valores X1, X2, 
..., Xn, temos que Xonde,)n
,(N~X
2σ
µ é a média amostral.
Fixado um valor γ tal que 0 < γ <1, definimos o intervalo de confiança para μ, com coeficiente de 
confiança γ, como:
IC (μ , γ ) = X
2
X
2
X
2
X
2
.zX.zX.zX;.zX σ+≤µ≤σ−=








σ+σ− γγγγ , onde: X é a média amostral.
2
z γ é obtido da tabela da normal padrão, localizando o valor de 2
γ
 no corpo da tabela e obtendo o 
valor 
2
z γ nas margens correspondentes.
nX
σ
=σ é o desvio padrão da média amostral.
Os “limites de confiança” citados anteriormente são os números obtidos por 
X
2
X
2
.zXe.zX σ+σ− γγ .
A expressão IC (μ , γ) envolve a quantidade X , que é uma variável aleatória e, sendo assim, o inter-
valo obtido também é aleatório, com probabilidade γ de conter o verdadeiro valor da média populacio-
nal μ.
Assim, uma interpretação conveniente para o intervalo de confiança é: se obtivermos várias 
amostras de mesmo tamanho e, para cada uma delas, calcularmos os correspondentes intervalos 
de confiança com coeficiente de confiança γ, esperamos que a proporção de intervalos que conte-
nham o valor de μ seja igual a γ.
Exemplo:
Suponha que os comprimentos de jacarés adultos de certa raça sigam o modelo normal com mé-
dia μ desconhecida e variância igual a 0,01 m². Uma amostra de dez animais foi sorteada e forneceu mé-
dia 1,69 m. Desejamos uma estimativa para o parâmetro desconhecido μ, com coeficiente de confiança 
de 95%.
Identificando os dados do problema, temos: σ² = 0,01; n = 10; X = 1,69; γ = 95%; 
Estatística
Unisa | Educação a Distância | www.unisa.br
53
)
n
,(N~X
2σ
µ
IC (μ , γ ) = [ ].zX;.zX X
2
X
2
σ+σ− γγ
IC (μ , 95% ) = [ 1,63 ; 1,75 ]
Concluindo, podemos dizer que, em 100 intervalos construídos, 95 contêm a verdadeira média e, 
de modo geral, admitimos que o intervalo calculado é um dos que contém a verdadeira média μ. Por essa 
razão, além de informar o intervalo obtido, devemos também fornecer o índice de confiança utilizado.
Observações: 
ƒƒ A amplitude do intervalo de confiança é dada pela diferença entre o extremo superior e infe-
rior, isto é, X
2
X
2
X
2
.z2).zX(.zX σ=σ−−σ+ γγγ
ƒƒ A semiamplitude, ou seja, 
X
2
.z σγ nos fornece o erro envolvido na estimação;
ƒƒ Se a população for finita e de tamanho N conhecido e se a amostra de tamanho n dela retirada 
for sem reposição, então: 
1N
nN.
nX −
−σ
=σ
Exemplo:
De uma população de 1000 elementos com distribuição aproximadamente normal com σ² = 400, 
tira-se uma amostra de 25 elementos, obtendo-se = 150. Fazer um IC para μ, ao nível de 5%. 
Identificando os dados do problema, temos: N = 1000; σ² = 400; n = 25; = 150; 1 – γ = 5%.150X =
150X =
Regina Maria Sigolo Bernardinelli
Unisa | Educação a Distância | www.unisa.br
54
Esquema para melhor compreensão
Estatística
Unisa | Educação a Distância | www.unisa.br
55
Figura 2 – Intervalo de Confiança – Média Populacional.
Intervalo de Confiança para a Proporção
 
Quando o tamanho da amostra ( n ) for grande, temos: , onde pˆ é a proporção amos-
tral e q = 1 – p. Consideramos uma amostra grande quando n > 30.
 Fixado um valor γ tal que 0 < γ <1, definimos o intervalo de confiança para p, com coeficiente de 
confiança γ, como:
IC (p , γ ) = [ ].zpˆ;.zpˆ pˆ
2
pˆ
2
σ+σ− γγ = 
 
 , onde:
pˆ é a proporção amostral.
2
z γ é obtido da tabela da normal padrão, localizando o valor de 2
γ
 no corpo da tabela e obtendo o 
valor 
2
z γ nas margens correspondentes.
n
qˆ.pˆ
pˆ =σ é o desvio padrão da proporção amostral, com pˆ1qˆ −= .
Exemplo:
Suponha que, em n = 400 provas, obtemos k = 80 sucessos. Vamos obter um intervalo de confiança 
para p, com coeficiente de confiança γ = 90%.
Identificando os dados do problema, temos: 
 
 
n = 400; γ = 90% 
pˆ
2
pˆ
2
.zpˆp.zpˆ σ+≤≤σ− γγ
Regina Maria Sigolo Bernardinelli
Unisa | Educação a Distância | www.unisa.br
56
IC (p , 90%) = [0,2 – 1,64 . 0,02 ; 0,2 + 1,64 . 0,02]
IC (p , 90%) = [ 0,167 ; 0,233 ]
Observação: Para a proporção, o erro envolvido na estimação é dado por: pˆ
2
.z σγ
Intervalo de Confiança (IC) para a Média Populacional (Variância Desconhecida)
Para estimarmos a média de uma população normal com variância desconhecida, quando o tama-
nho (n) da amostra for grande, n > 30, substituímos σ² pela variância amostral S2 e usamos a distribuição 
normal.
Fixado um valor γ tal que 0 < γ <1, definimos o intervalo de confiança para μ, com coeficiente de 
confiança γ, como:
IC (μ , γ ) = [ ].zX;.zX X
2
X
2
σ+σ− γγ , onde:
X é a média amostral.
2
z γ é obtido da tabela da normal padrão, localizando o valor de 2
γ
 no corpo da tabela e obtendo o 
valor 
2
z γ nas margens correspondentes.
n
S
X =σ é o desvio padrão da média amostral, com 
Exemplo:
1. De uma população normal com parâmetros desconhecidos, tiramos uma amostra de tama-
nho 100, obtendo-se 112X = e S = 11. Fazer

Outros materiais

Materiais relacionados

Perguntas relacionadas

Materiais recentes

Perguntas Recentes