Buscar

Apostila de Estatística Básica - GeoBach

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 133 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 133 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 133 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

NOTAS DE AULA: ESTATI´STICA
BA´SICA
Curso: Geografia Bacharelado
Profs. Fla´vio Bittencourt/Adriana Dias
UNIFAL-MG / ALFENAS
2014
SUMA´RIO
LISTA DE TABELAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . i
LISTA DE FIGURAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ii
1 SOMATO´RIO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1 I´ndices ou notac¸a˜o por ı´ndices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Notac¸a˜o de somato´rio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.3 Propriedades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.4 Somato´rios mais usados na Estat´ıstica . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.5 Exerc´ıcios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
2 INTRODUC¸A˜O . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
3 ALGUMAS DEFINIC¸O˜ES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
3.1 Varia´vel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
3.1.1 Varia´veis qualitativas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
3.1.2 Varia´veis quantitativas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
3.1.3 Varia´veis independentes e dependentes . . . . . . . . . . . . . . . . . . . . . . . . . . 5
3.2 Dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
3.3 Populac¸a˜o . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
3.4 Censo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
3.5 Amostra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
3.6 Paraˆmetro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
3.7 Estimador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
3.8 Estimativa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
3.9 Exerc´ıcios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
4 ESTATI´STICA DESCRITIVA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
4.1 Apresentac¸a˜o dos dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
4.1.1 Tabelas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
4.1.2 Construc¸a˜o de tabelas de distribuic¸a˜o de frequeˆncias . . . . . . . . . . . . . . . . . . 13
4.1.3 Tipos de distribuic¸a˜o de frequeˆncias . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
4.1.4 Exerc´ıcios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
4.1.5 Gra´ficos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
4.1.6 Exerc´ıcios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
4.2 Medidas Estat´ısticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
4.2.1 Medidas de Tendeˆncia Central . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
4.2.2 Exerc´ıcios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
4.2.3 Medidas Separatrizes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
4.2.4 Exerc´ıcios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
4.2.5 Medidas de Variabilidade (Dispersa˜o) . . . . . . . . . . . . . . . . . . . . . . . . . . 35
4.2.6 Exerc´ıcios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
5 PROBABILIDADE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
5.1 Definic¸o˜es . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
5.1.1 Experimento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
5.1.2 Experimento determin´ıstico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
5.1.3 Experimento aleato´rio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
5.1.4 Espac¸o amostral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
5.1.5 Evento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
5.2 Probabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
5.2.1 Probabilidade a priori . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
5.2.2 Probabilidade a posteriori . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
5.2.3 Importante saber! . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
5.3 Probabilidade condicional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
5.3.1 Exerc´ıcios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
5.4 Regra do produto e independeˆncia de eventos . . . . . . . . . . . . . . . . . . . . . . . 47
5.5 Independeˆncia de treˆs ou mais eventos . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
5.6 Ensaios de Bernoulli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
5.6.1 Exerc´ıcios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
5.6.2 Exerc´ıcios extras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
6 DISTRIBUIC¸A˜O DE PROBABILIDADE . . . . . . . . . . . . . . . . . . . . . . . . . . 55
6.1 Varia´vel aleato´ria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
6.2 Distribuic¸a˜o de probabilidade ou func¸a˜o de probabilidade . . . . . . . . . . . . . . . . 56
6.2.1 Propriedades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
6.2.2 Me´dia e variaˆncia de uma varia´vel aleato´ria discreta . . . . . . . . . . . . . . . . . . 57
6.2.3 Distribuic¸a˜o binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
6.2.4 Distribuic¸a˜o Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
6.2.5 Exerc´ıcios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
6.3 Distribuic¸a˜o normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
6.3.1 Ca´lculo de probabilidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
6.3.2 Condic¸o˜es para que uma func¸a˜o seja func¸a˜o densidade de probabilidade . . . . . . . 63
6.3.3 A distribuic¸a˜o normal: informac¸o˜es adicionais . . . . . . . . . . . . . . . . . . . . . . 63
6.3.4 Ca´lculo de probabilidades de varia´veis normais . . . . . . . . . . . . . . . . . . . . . 64
6.3.5 Distribuic¸a˜o normal padronizada ou distribuic¸a˜o normal padra˜o . . . . . . . . . . . 64
6.3.6 Exerc´ıcios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
7 AMOSTRAGEM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
7.1 Importaˆncia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
7.2 Nu´meros aleato´rios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
7.3 Tipos de amostragem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
7.3.1 Amostragem na˜o probabil´ıstica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
7.3.2 Amostragem probabil´ıstica . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . 72
7.4 Exerc´ıcios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
8 TEORIA DA ESTIMAC¸A˜O . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
8.1 Introduc¸a˜o . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
8.2 Distribuic¸a˜o de amostragem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
8.2.1 Distribuic¸a˜o amostral das me´dias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
8.2.2 Teorema do Limite Central . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
8.2.3 Distribuic¸a˜o amostral das proporc¸o˜es . . . . . . . . . . . . . . . . . . . . . . . . . . 83
8.2.4 Exerc´ıcios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
8.3 Estimac¸a˜o pontual . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
8.4 Estimac¸a˜o intervalar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
8.4.1 Intervalo de confianc¸a para a me´dia µ de uma populac¸a˜o normal com variaˆncia po-
pulacional σ2 conhecida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
8.4.2 Intervalo de confianc¸a para a me´dia µ de uma populac¸a˜o normal com variaˆncia po-
pulacional σ2 desconhecida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
8.4.3 Intervalo de confianc¸a para uma proporc¸a˜o . . . . . . . . . . . . . . . . . . . . . . . 89
8.4.4 Determinac¸a˜o do tamanho amostral . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
8.4.5 Exerc´ıcios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
9 TEORIA DA DECISA˜O . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
9.1 Introduc¸a˜o . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
9.2 Erros envolvidos num teste de hipo´tese . . . . . . . . . . . . . . . . . . . . . . . . . . 93
9.3 Mecaˆnica operacional dos testes de hipo´teses . . . . . . . . . . . . . . . . . . . . . . . 94
9.4 Teste de hipo´teses para uma me´dia de uma populac¸a˜o normal quando a variaˆncia
populacional for desconhecida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
9.4.1 Exerc´ıcios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
9.5 Teste de hipo´teses para proporc¸o˜es . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
9.5.1 Exerc´ıcios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
9.6 Teste de hipo´teses para comparac¸a˜o das variaˆncias de duas populac¸o˜es normais . . . . 98
9.7 Teste de hipo´teses para duas me´dias de populac¸o˜es normais com variaˆncias populaci-
onais desconhecidas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
9.7.1 Testes de hipo´teses para duas me´dias, sendo σ21 = σ
2
2 = σ
2 . . . . . . . . . . . . . . . 100
9.7.2 Testes de hipo´teses para duas me´dias, sendo σ21 6= σ22 . . . . . . . . . . . . . . . . . . 101
9.7.3 Exerc´ıcios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
10TESTES QUI-QUADRADO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
10.1Teste de Adereˆncia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
10.2Teste de Independeˆncia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
10.3Teste de Homogeneidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
10.3.1Exerc´ıcios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
11CORRELAC¸A˜O LINEAR E REGRESSA˜O LINEAR SIMPLES . . . . . . . . . . . . . 111
11.1Diagrama de dispersa˜o . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
11.2Coeficiente de Correlac¸a˜o Linear . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
11.3Regressa˜o Linear Simples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
11.3.1Exerc´ıcios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
12Tabelas de distribuic¸o˜es de probabilidade teo´ricas . . . . . . . . . . . . . . . . . . . . . 120
REFEREˆNCIAS BIBLIOGRA´FICAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
LISTA DE TABELAS
1 Rede rodovia´ria federal policiada. Brasil, 2005 a 2010 . . . . . . . . . . . . . . . 10
2 Internac¸o˜es por acidente de traˆnsito segundo a Unidade de Federac¸a˜o, faixa eta´ria
de 25 a 29 anos, nov-2013 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
3 Pessoas envolvidas em acidente de traˆnsito segundo o estado f´ısico, Brasil, 2010 . 11
4 Acidentes de traˆnsito segundo o tipo. Brasil, 2008 a 2010* . . . . . . . . . . . . . 11
5 Nu´mero de filhos de 50 casais entrevistados numa fila de um PSF, Cidade Gama,
abril-maio de 2010* . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
6 Nu´mero de jogos das 116 edic¸o˜es do Campeonato Carioca de futebol . . . . . . . 12
7 Altura de estudantes do ensino me´dio da Escola EST, 2010 . . . . . . . . . . . . 12
8 Nu´mero de filhos de 50 casais entrevistados numa fila de um PSF, Cidade Gama,
abril-maio de 2010* . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
9 Taxa de urbanizac¸a˜o municipal (em porcentagem) do estado de Minas Gerais, 2010 16
10 Valores relativos de taxa de urbanizac¸a˜o municipal (em porcentagem) do estado
de Minas Gerais, em 94 munic´ıpios, 2010 . . . . . . . . . . . . . . . . . . . . . . . 17
11 Nu´mero de cartas entregues, diariamente, em um edif´ıcio residencial, durante 60
dias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
12 Nu´mero de cartas entregues, diariamente, em um edif´ıcio residencial, durante 60
dias e o ponto me´dio das classes . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
13 Notas dos treˆs alunos em quatro provas de determinada disciplina e suas respec-
tivas me´dias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
14 Nu´mero de cartas entregues, diariamente, em um edif´ıcio residencial, durante 60
dias e ca´lculos preliminares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
15 Pacientes com diabetes em Minas Gerais, segundo o sexo, no per´ıodo de janeiro
a junho de 2009 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
16 Ta´bua de nu´meros aleato´rios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
17 Divisa˜o de 500 pessoas em observac¸a˜o em um hospital em estratos e tamanho de
estratos e amostras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
18 Divisa˜o de 1000 pessoas em observac¸a˜o em um hospital em estratos e tamanho
de estratos e amostras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
20 Todas as amostras e me´dias amostrais de tamanho n = 2 . . . . . . . . . . . . . 81
21 Todas as k amostras de tamanho n e proporc¸o˜es pˆi . . . . . . . . . . . . . . . . . 83
22 Probabilidades (α) da distribuic¸a˜o normal padronizada . . . . . . . . . . . . . . . 120
23 Valores do quantil t segundo os graus de liberdade (gl) e probabilidades α . . . . 121
24 Valores do quantil χ2 segundo os graus de liberdade (gl) e probabilidades α . . . 122
25 Valores do quantil F segundo os graus de liberdade do numerador (v1) e graus de
liberdade do denominador (v2) e probabilidade 5% . . . . . . . . . . . . . . . . . 123
i
LISTA DE FIGURAS
1 Classificac¸a˜o das varia´veis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2 Relac¸a˜o entre varia´veis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
3 Dados parciais da pesquisada empresa . . . . . . . . . . . . . . . . . . . . . . . . 8
4 Rede rodovia´ria federal policiada. Brasil, 2005 a 2010 . . . . . . . . . . . . . . . . . . 19
5 Internac¸o˜es por acidente de traˆnsito segundo a Unidade de Federac¸a˜o, faixa eta´ria de 25
a 29 anos, nov-2013 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
6 Nu´mero de pessoas envolvidas em acidentes de traˆnsito segundo o estado f´ısico. Brasil,
2010 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
7 Internac¸o˜es por acidente de tra˜nsito segundo a Unidade de Federac¸a˜o, faixa eta´ria de 25
a 29 anos, nov-2013 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
8 Taxa de urbanizac¸a˜o municipal (em porcentagem) do estado de Minas Gerais, 2010 . . . 22
9 Taxa de urbanizac¸a˜o municipal (em porcentagem) do estado de Minas Gerais, 2010 . . . 22
10 Tipos de frequeˆncias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
11 Relac¸a˜o entre me´dia, mediana e moda . . . . . . . . . . . . . . . . . . . . . . . . 29
12 Boxplot: modelo e nomes das partes . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
13 Boxplot: distribuic¸a˜o do nu´mero de filhos por casal: Amostra A e Amostra B . . . . . . 36
14 Distribuic¸o˜es normais com diferentes valores para µ e σ . . . . . . . . . . . . . . 62
15 Exemplo de P (a < X < b) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
16 Curva normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
17 P (X > 190) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
18 P (Z > 2) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
19 Valor tabelado para P (Z > 2): a´rea sob a curva para Z > 2 . . . . . . . . . . . . 66
20 P (−1,6 < Z < 0,1) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
21 P (Z > 0,2) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
22 P (Z < 1) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
23 P (−1,6 < Z < 0,2) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
24 P (0 < Z < 1,2) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
25 Esquematizac¸a˜o do processo de amostragem . . . . . . . . . . . . . . . . . . . . . 70
26 Esquematizac¸a˜o da amostragem por conglomerado . . . . . . . . . . . . . . . . . 74
27 Esquematizac¸a˜o da amostragem estratificada . . . . . . . . . . . . . . . . . . . . 75
28 Charge sobre amostragem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
29 Gra´fico dos valores populacionais . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
30 Gra´fico da distribuic¸a˜o das me´dias . . . . . . . . . . . . . . . . . . . . . . . . . . 81
31 Distribuic¸a˜o de probabilidade da populac¸a˜o e distribuic¸o˜es amostrais para dife-
rentes n . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
32 A´rea entre −1,96 e 1,96 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
33 Regio˜es cr´ıticas conforme H1 : µ 6= µ0; H1 : µ > µ0 ou H1 : µ < µ0 . . . . . . . . 95
34 Regio˜es cr´ıticas conforme H1 : p 6= p0; H1 : p > p0 ou H1 : p < p0 . . . . . . . . . 97
35 Regia˜o cr´ıtica conforme H1 : σ
2
M > σ
2
m . . . . . . . . . . . . . . . . . . . . . . . . 99
36 Regia˜o cr´ıtica conforme H1 : µ1 − µ2 6= 0 . . . . . . . . . . . . . . . . . . . . . . . 100
37 Regia˜o cr´ıtica conforme H1 : µ1 − µ2 6= 0 . . . . . . . . . . . . . . . . . . . . . . . 102
38 Conjunto de dados de I´ris de Fisher . . . . . . . . . . . . . . . . . . . . . . . . . 111
39 Diagrama de dispersa˜o: n´ıvel de colesterol e n´ıvel de triglicer´ıdeos . . . . . . . . 113
40 Gra´fico das varia´veis X e Y . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
41 Diagrama de dispersa˜o e gra´fico da equac¸a˜o ajustada . . . . . . . . . . . . . . . . 116
42 Gra´ficos referentes ao exerc´ıcio . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
ii
Estat´ıstica Ba´sica 1 SOMATO´RIO
1 SOMATO´RIO
1.1 I´ndices ou notac¸a˜o por ı´ndices
O s´ımbolo xi (leia-se x ı´ndice i) representa qualquer um dos n valores, x1, x2, x3, . . . , xn
assumidos pela varia´vel X, na amostra ou no conjunto de dados. Evidentemente pode ser usada
qualquer outra letra ale´m de i.
1.2 Notac¸a˜o de somato´rio
O s´ımbolo
n∑
i=1
xi e´ usado para representar a soma de todos os valores de xi desde i = 1
ate´ i = n, ou seja:
n∑
i=1
xi = x1 + x2 + · · ·+ xn
Exemplo: Considere a varia´vel X = {1, 0, − 1, 2, 1}, cada valor (ou elemento) de X
corresponde, respectivamente, a x1, x2, x3, x4, x5. Enta˜o:
i.
3∑
i=1
xi = x1 + x2 + x3 = 1 + 0 + (−1) = 0
ii.
5∑
i=1
xi = x1 + x2 + x3 + x4 + x5 = 1 + 0 + (−1) + 2 + 1 = 3
iii.
5∑
i=3
xi = x3 + x4 + x5 = −1 + 2 + 1 = 2
iv.
5∑
i=1
i 6=3, 4
xi = x1 + x2 + x5 = 1 + 0 + 1 = 2
1.3 Propriedades
Sejam: a, b e k constantes; X e Y varia´veis e xi e yi os valores que as varia´veis X e Y
assumem, enta˜o:
(P1) Somato´rio de uma constante vezes uma varia´vel e´ igual a` constante vezes o somato´rio da
varia´vel:
n∑
i=1
axi = ax1 + ax2 + ax3 + ...+ axn = a
n∑
i=1
xi
(P2) Somato´rio de uma constante e´ igual ao nu´mero de termos vezes a constante:
n∑
i=1
k = k · k · k . . . k · k︸ ︷︷ ︸
(n−1+1 ) vezes
= n · k
n∑
i=a
k = k · k · k . . . k · k︸ ︷︷ ︸
(n−a+1 ) vezes
= (n− a+ 1) · k
UNIFAL-MG/Alfenas Profs. Fla´vio Bittencourt/Adriana Dias 1
Estat´ıstica Ba´sica 1 SOMATO´RIO
(P3) Somato´rio de uma soma e´ igual a` soma dos somato´rios:
n∑
i=1
(axi ± byi) = a
n∑
i=1
xi ± b
n∑
i=1
yi
(P4) Somato´rios de um produto de varia´veis e´ igual ao produto dos somato´rios destas varia´veis:
n∑
i=1
m∑
j=1
xiyj =
n∑
i=1
xi ×
m∑
j=1
yj
E´ importante lembrar que:
n∑
i=1
xiyi 6=
n∑
i=1
xi ×
n∑
i=1
yi
n∑
i=1
(
xi
yi
)
6=
n∑
i=1
xi
n∑
i=1
yi
(
n∑
i=1
xi
)2
6=
n∑
i=1
x2i
1.4 Somato´rios mais usados na Estat´ıstica
i.
n∑
i=1
xi = x1 + x2 + ...+ xn, soma simples
ii.
n∑
i=1
x2i = x
2
1 + x
2
2 + ...+ x
2
n, soma de quadrados
iii.
(
n∑
i=1
xi
)2
= (x1 + x2 + ...+ xn)
2, quadrado da soma
iv.
n∑
i=1
xiyi = x1y1 + x2y2 + ...+ xnyn, soma de produtos
v.
n∑
i=1
xi
n∑
i=1
yi = (x1 + x2 + ...+ xn) (y1 + y2 + ...+ yn), produto da soma.
Observac¸a˜o: quando o somato´rio na˜o apresentar ı´ndices efetua-se a soma de todos os
elementos: ∑
x =
n∑
i=1
xi
1.5 Exerc´ıcios
1. Desenvolver os termos de cada uma das seguintes somas:
2 Profs. Fla´vio Bittencourt/Adriana Dias UNIFAL-MG/Alfenas
Estat´ıstica Ba´sica 2 INTRODUC¸A˜O
a)
6∑
i=1
xi
b)
4∑
i=1
(yi − 3)2
c)
N∑
i=1
a
d)
n∑
i=a
b
e)
5∑
k=1
fkxk
f)
3∑
j=1
(xj − a)
2. Indicar, por meio da notac¸a˜o de somato´rio, cada uma das expresso˜es seguintes:
a) x21 + x
2
2 + x
2
3 + ...+ x
2
10
b) (x1 + y1) + (x2 + y2) + ...+ (x8 + y8)
c) f1x
3
1 + f2x
3
2 + f3x
3
3 + ...+ f20x
3
20
d) (y21 − 1)2 + (y22 − 1)2 + . . .+ (y212 − 1)2
e) (x1 − 1) + (x2 − 2)2 + (x3 − 3)3 + . . .+ (xn − n)n
3. As varia´veis, X e Y , assumem os valores: x1 = 2; x2 = 4; x3 = −5; x4 = −8 e
y1 = −3; y2 = −8; y3 = 10; y4 = 6, respectivamente. Calcular:
a)
∑
x
b)
∑
y
c)
∑
xy
d)
∑
x2
e)
∑
y2
f)
∑
x
∑
y
g)
∑
xy2
h)
∑
(x+ y)(x− y)
4. Dados os valores das varia´veis: X = {2, 4, 4, 3, 2}, Y = {1, 2, 3, 6, 7}, obtenha:
a)
4∑
i=1
xi
b)
5∑
i=1
yi
c)
5∑
i=1
4x2i
d)
5∑
i=1
xiyi
e)
5∑
i=1
(3xi + 2yi)
f)
4∑
i=2
xiyi +
5∑
i=1
y2i
5. Na Estat´ıstica usa-se comfrequeˆncia calcular a me´dia e a variaˆncia amostral, representadas
na forma de somato´rios por: x¯ =
n∑
i=1
xi
n
e s2 =
1
n− 1

n∑
i=1
x2i −
(
n∑
i=1
xi
)2
n
, respectivamente,
sendo n uma constante que representa o nu´mero de elementos (ou dados, ou observac¸o˜es) de
um conjunto qualquer ou de uma varia´vel. Considere os valores assumidos por uma varia´vel X
qualquer: X = {2, 4, 5, 6, 1, 6}; calcule a me´dia e a variaˆncia.
6. a) Usando os valores da varia´vel X do exerc´ıcio anterior demonstre numericamente que
n∑
i=1
(xi − x¯) = 0. b) Use as propriedades de somato´rio, lembre-se que x¯ e´ uma constante, para
demonstrar algebricamente que
n∑
i=1
(xi − x¯) = 0.
2 INTRODUC¸A˜O
A Estat´ıstica como cieˆncia somente se estruturou no se´culo passado, sendo uma ferra-
menta indispensa´vel na vida moderna. Hoje, cada vez mais pessoas encontram-se expostas a ela
em maior ou menor intensidade.
E´ a cieˆncia que se ocupa da organizac¸a˜o, descric¸a˜o, ana´lise e interpretac¸a˜o de dados.
a) no plural (estat´ısticas), indica qualquer colec¸a˜o consistente de dados nume´ricos reunidos com
a finalidade de fornecer informac¸o˜es acerca de uma atividade qualquer. Por exemplo, estat´ıs-
ticas demogra´ficas referem-se a dados nume´ricos sobre nascimentos, falecimentos, matrimoˆnios,
UNIFAL-MG/Alfenas Profs. Fla´vio Bittencourt/Adriana Dias 3
Estat´ıstica Ba´sica 3 ALGUMAS DEFINIC¸O˜ES
desquites, etc.
b) no singular (estat´ıstica), indica um corpo de te´cnicas, ou ainda uma metodologia te´cnica
desenvolvida para a coleta, a classificac¸a˜o, a apresentac¸a˜o, a ana´lise, a interpretac¸a˜o de dados
quantitativos e a utilizac¸a˜o desses dados para a tomada de deciso˜es.
Qualquer cieˆncia experimental na˜o pode prescindir das te´cnicas proporcionadas pela
Estat´ıstica. Nos diversos ramos do conhecimento ha´ necessidade de um instrumental que se
preocupa com o tratamento quantitativo dos fenoˆmenos de massa ou coletivos, cuja mensurac¸a˜o
e ana´lise requerem um conjunto de observac¸o˜es de fenoˆmenos ou particulares.
3 ALGUMAS DEFINIC¸O˜ES
3.1 Varia´vel
As varia´veis sa˜o as caracter´ısticas pesquisadas ou registradas. E´ por meio das varia´-
veis que se torna poss´ıvel descrever o fenoˆmeno. As varia´veis sa˜o caracter´ısticas que podem ser
observadas ou medidas em cada elemento pesquisado (seja por censo ou por amostragem, le-
vantamento ou experimento), sob as mesmas condic¸o˜es. Para cada varia´vel, para cada elemento
pesquisado, em um dado momento, ha´ apenas um resultado poss´ıvel.
As varia´veis podem ser basicamente classificadas de acordo com o seu n´ıvel de mensu-
rac¸a˜o (o quanto de informac¸a˜o cada varia´vel apresenta) e seu n´ıvel de manipulac¸a˜o (como uma
varia´vel relaciona-se com as outras no estudo).
3.1.1 Varia´veis qualitativas
Tambe´m denominadas de varia´veis catego´ricas, sa˜o aquelas cujas realizac¸o˜es sa˜o atri-
butos (categorias) do elemento pesquisado, como sexo, grau de instruc¸a˜o, espe´cie. Estas podem
ser nominais ou ordinais. As varia´veis nominais podem ser medidas apenas em termos de quais
itens pertencem a diferentes categorias, mas na˜o pode quantificar nem mesmo ordenar tais ca-
tegorias. Por exemplo, pode se dizer que dois indiv´ıduos sa˜o diferentes em termos da varia´vel
A (sexo, por exemplo), mas na˜o se pode dizer qual deles “tem mais” da qualidade representada
pela varia´vel. Exemplos t´ıpicos de varia´veis nominais sa˜o: sexo, naturalidade, etnia etc.
As varia´veis ordinais permitem ordenar os itens medidos em termos de qual tem menos
e qual tem mais da qualidade representada pela varia´vel, mas ainda na˜o permitem que se diga
“o quanto mais”. Um exemplo t´ıpico de uma varia´vel ordinal e´ o status so´cio-econoˆmico das
famı´lias residentes em uma localidade: sabe-se que me´dia-alta e´ mais “alta” do que me´dia, mas
na˜o se pode dizer, por exemplo, que e´ 20% mais alta. A pro´pria distinc¸a˜o entre mensurac¸a˜o
nominal, ordinal e intervalar representa um bom exemplo de uma varia´vel ordinal. Pode-se dizer
que uma medida nominal proveˆ menos informac¸a˜o do que uma medida ordinal, mas na˜o se pode
dizer “quanto menos” ou como esta diferenc¸a se compara a` diferenc¸a entre mensurac¸a˜o ordinal
e quantitativa.
3.1.2 Varia´veis quantitativas
Sa˜o aquelas cujas realizac¸o˜es sa˜o nu´meros resultantes de contagem ou mensurac¸a˜o,
como nu´mero de filhos, nu´mero de visitantes, velocidade em km/h, peso, altura, etc. As varia´veis
quantitativas sa˜o discretas ou cont´ınuas. As varia´veis quantitativas discretas sa˜o aquelas que
podem assumir apenas alguns valores nume´ricos que geralmente podem ser listados (nu´mero
de filhos, nu´mero de acidentes). As varia´veis quantitativas cont´ınuas sa˜o aquelas que podem
assumir qualquer valor em um intervalo (velocidade, peso, altura).
Muitos pesquisadores preferem as varia´veis quantitativas por acharem que estas conteˆm
mais informac¸o˜es do que as qualitativas. Observe os seguintes exemplos: quando a varia´vel
distaˆncia de uma localidade e´ descrita em termos de “longe” e “perto”, sabemos que longe e´
mais distante que perto, mas na˜o temos ide´ia de qua˜o mais distante; se, contudo, descreve-se
4 Profs. Fla´vio Bittencourt/Adriana Dias UNIFAL-MG/Alfenas
Estat´ıstica Ba´sica 3 ALGUMAS DEFINIC¸O˜ES
a distaˆncia de forma nume´rica, medida em metros, e uma localidade dista de um ponto de
refereˆncia 600 metros e outra dista 400, na˜o so´ sabemos que a segunda e´ mais perto do que a
primeira, mas sa˜o 200 metros mais perto.
E´ importante ressaltar que a forma como a varia´vel esta´ sendo medida definira´ o seu
n´ıvel de mensurac¸a˜o. Por exemplo, a varia´vel velocidade de um carro; se definirmos velocidade
como resultado de uma medic¸a˜o por meio de radar resultando em um valor em km/h, trata-se
de uma varia´vel quantitativa cont´ınua; se, pore´m, definirmos a velocidade como resultado de
uma medic¸a˜o em que algue´m declara a velocidade como “baixa”, “me´dia” ou “alta”, ela passa ser
qualitativa ordinal.
Esquematicamente a classificac¸a˜o das varia´veis segundo o n´ıvel de mensurac¸a˜o pode ser
visualizada na Figura 1.
FIGURA 1 Classificac¸a˜o das varia´veis
3.1.3 Varia´veis independentes e dependentes
Uma outra forma de classificar as varia´veis refere-se ao n´ıvel de manipulac¸a˜o: varia´veis
independentes e dependentes, Figura 2.
FIGURA 2 Relac¸a˜o entre varia´veis
As varia´vies independentes sa˜o aquelas que sa˜o manipuladas, enquanto que as depen-
dentes sa˜o apenas medidas ou registradas (como manipulac¸a˜o das varia´veis independentes). Esta
distinc¸a˜o confunde muitas pessoas que dizem que“todas as varia´veis dependem de alguma coisa”.
Entretanto, uma vez que se esteja acostumado a esta distinc¸a˜o ela se torna indispensa´vel.
As varia´veis independentes sa˜o aquelas que podem influenciar os valores das varia´veis
dependentes. Somente a realizac¸a˜o do estudo vai permitir verificar se ha´ realmente tal influeˆncia
e, somente, poderemos afirmar que a varia´vel independente e´ a causa da varia´vel dependente
assumir determinado resultado se o estudo for um experimento (pesquisa experimental).
Os termos varia´vel dependente e independente aplicam-se principalmente a` pesquisa
experimental, onde algumas varia´veis sa˜o manipuladas, e neste sentido sa˜o “independentes” dos
padro˜es de reac¸a˜o inicial, intenc¸o˜es e caracter´ısticas das unidades experimentais. Espera-se que
outras varia´veis sejam “dependentes” da manipulac¸a˜o ou das condic¸o˜es experimentais. Ou seja,
UNIFAL-MG/Alfenas Profs. Fla´vio Bittencourt/Adriana Dias 5
Estat´ıstica Ba´sica 3 ALGUMAS DEFINIC¸O˜ES
elas dependem “do que as unidades experimentais fara˜o” em resposta.
3.2 Dados
Sa˜o os valores ou fenoˆmenos obtidos na mensurac¸a˜o ou observac¸o˜es de alguma varia´vel
em estudo. Logo, os dados podem ser qualitativos (nominaisou ordinais) ou quantitativos
(discretos ou cont´ınuos) e independentes ou dependentes. Por exemplo, se a varia´vel estudada
for sexo de indiv´ıduos que visitam um santua´rio, os dados sa˜o, masculino, masculino, feminino,
feminino etc.
Outro exemplo: considerando que a varia´vel estudada seja nu´mero de filhos de um
grupo de 20 casais, as respostas obtidas, 0, 2, 3, 1, 2, 0, ... sa˜o os dados, e neste caso, os
dados sa˜o discretos. Considerando altura dos estudantes desta sala de aula, os dados obtidos
sa˜o denominados cont´ınuos, pois alguns valores podem ser: 1,59m, 1,75m, 1,80m etc.
3.3 Populac¸a˜o
Os dados sa˜o coletados para estudar uma ou mais caracter´ısticas de uma populac¸a˜o
de interesse. Populac¸a˜o e´ o conjunto de medidas da(s) caracter´ıstica(s) de interesse em todos
os elementos que a(s) apresenta(m). Se, por exemplo, estamos avaliando as opinio˜es de eleito-
res sobre os candidatos a presidente, a populac¸a˜o da pesquisa seria constitu´ıda pelas opinio˜es
declaradas pelos eleitores em questa˜o.
3.4 Censo
E´ o exame completo de todas as unidades ou elementos que compo˜em uma populac¸a˜o.
O IBGE (Instituto Brasileiro de Geografia e Estat´ıstica) realiza o Censo Demogra´fico a cada
dez anos, onde sa˜o reunidas informac¸o˜es sobre toda a populac¸a˜o brasileira. O primeiro Censo
aconteceu em 1872 e recebeu o nome de Recenseamento da Populac¸a˜o do Impe´rio do Brasil e o
mais recente foi o Censo 2010
Os resultados do Censo Demogra´fico sa˜o importantes para a sociedade ter informac¸o˜es
atualizadas sobre a populac¸a˜o e para o governo planejar suas ac¸o˜es de forma mais adequada.
E´ importante ressaltar que o censo de uma populac¸a˜o muito grande (ou infinita), pode
ser ta˜o inu´til quanto invia´vel, especialmente se o estudo for muito demorado. Nesses casos, a
populac¸a˜o pode modificar-se ta˜o significativamente enquanto ele estiver sendo realizado com
acre´scimos, eliminac¸o˜es e mudanc¸as nas posic¸o˜es geogra´ficas dos indiv´ıduos que ha´ grandes pos-
sibilidades de alguns elementos particulares serem considerados mais de uma vez (ou nenhuma),
tornando quase imposs´ıvel a interpretac¸a˜o exata dos resultados finais.
3.5 Amostra
Como o interesse maior esta´ na populac¸a˜o o ideal seria pesquisar toda a populac¸a˜o, em
suma, realizar um censo. Contudo, por razo˜es econoˆmicas ou pra´ticas (para obter rapidamente
a informac¸a˜o ou evitar a extinc¸a˜o ou exausta˜o da populac¸a˜o) nem sempre e´ poss´ıvel realizar um
censo.
Quando esse e´ o caso, e´ prefer´ıvel conhecer a populac¸a˜o a partir de uma parte dela
(amostra). Uma amostra da populac¸a˜o e´ um subconjunto finito e representativo da populac¸a˜o.
Uma das principais subdiviso˜es da Estat´ıstica e´ a amostragem, que reu´ne os me´todos
necessa´rios para coletar adequadamente amostras representativas e suficientes para que os resul-
tados obtidos possam ser generalizados para a populac¸a˜o de interesse. A vantagem do processo
de amostragem em relac¸a˜o ao censo e´ o menor custo e tempo para a operac¸a˜o ale´m de melhor
investigac¸a˜o dos elementos observados.
6 Profs. Fla´vio Bittencourt/Adriana Dias UNIFAL-MG/Alfenas
Estat´ıstica Ba´sica 3 ALGUMAS DEFINIC¸O˜ES
3.6 Paraˆmetro
E´ uma constante que caracteriza uma populac¸a˜o. Sa˜o exemplos de paraˆmetros:
• µ: me´dia populacional
• σ2: variaˆncia populacional
• σ: desvio padra˜o populacional
• p: proporc¸a˜o populacional
• etc.
3.7 Estimador
E´ uma expressa˜o alge´brica (fo´rmula) utilizada para obter um valor aproximado de um
paraˆmetro. Sa˜o exemplos de estimadores:
• x¯ =
n∑
i=1
xi
n
: me´dia amostral
• s2 = 1
n− 1

n∑
i=1
x2i −
(
n∑
i=1
xi
)
n
: variaˆncia amostral
• s =
√
s2: desvio padra˜o amostral
• pˆ = y
n
: proporc¸a˜o amostral, em que y representa o nu´mero de sucessos em uma amostra
de tamanho n
• etc.
3.8 Estimativa
E´ o valor nume´rico de um estimador. E´ determinada usando os dados amostrais.
Exemplo: O objetivo de uma pesquisa e´ conhecer o consumo me´dio semanal de tinta
das impressoras do ICEx em um dado ano.
Varia´vel: Consumo semanal de tinta das impressoras do ICEx
Populac¸a˜o: Todos os consumos semanais de tinta das impressoras do ICEx de um ano: N = 52
registros de consumo
Paraˆmetro: Consumo me´dio semanal de tinta das impressoras: µ
Amostra: parte da populac¸a˜o: alguns registros de consumos, por exemplo n = 20 consumos
Estimador: x¯ =
n∑
i=1
xi
n
Estimativa: 1,5 L de tinta por semana.
3.9 Exerc´ıcios
1. Uma empresa quer conhecer o perfil dos seus 474 funciona´rios para responder a`s seguintes
perguntas:
- Identificar se ha´ predominaˆncia masculina ou feminina
UNIFAL-MG/Alfenas Profs. Fla´vio Bittencourt/Adriana Dias 7
Estat´ıstica Ba´sica 3 ALGUMAS DEFINIC¸O˜ES
- Mensurar a qualificac¸a˜o do pessoal (pelos anos de escolaridade)
- Verificar como esta´ o turnover: avaliando as idades, tempo de servic¸o e experieˆncia pre´via do
pessoal
Para tanto dispo˜e dos seguintes dados, parcialmente apresentados na Figura 3:
FIGURA 3 Dados parciais da pesquisa da empresa
a) Identificar os n´ıveis de mensurac¸a˜o das 9 varia´veis:
- Sexo (SEXO)
- Idade em anos completos (IDADE)
- Anos de educac¸a˜o completos (ANOSEDUC)
- Func¸a˜o: servic¸os gerais, escrito´rio, gereˆncia (FUNCAO)
- Sala´rio atual mensal (SALARIOA)
- Sala´rio inicial mensal (SALARIOI)
- Anos de servic¸o em anos (ANOSSERV)
- Experieˆncia pre´via em anos (EXPERPR)
- Nacionalidade (NACIONAL)
b) Ha´ interesse em obter suma´rios descrevendo:
- as func¸o˜es exercidas de acordo com o sexo do funciona´rio
- os sala´rios atuais em func¸a˜o do sexo do funciona´rio
- os sala´rios atuais em func¸a˜o dos anos de educac¸a˜o do funciona´rio
Quais sa˜o as varia´veis independentes e dependentes em cada caso?
2. Observando a varia´vel relacione o tipo de dado que pode ser obtido assinalando com um “X”
a respectiva coluna.
8 Profs. Fla´vio Bittencourt/Adriana Dias UNIFAL-MG/Alfenas
Estat´ıstica Ba´sica 4 ESTATI´STICA DESCRITIVA
Varia´vel
Dado
Qualitativo Quantitativo
Nominal Ordinal Discreto Cont´ınuo
Cor da pele
Idade em anos
Grau de instruc¸a˜o
Renda familiar
Nu´mero de filhos de um grupo de casais
Classe social (A, B, C, ...)
Sexo
Nu´mero de moradores de uma casa
Nu´mero de faltas em uma disciplina
Estado civil
Religia˜o
Nu´mero de gols de um time em um campeonato
Altura de um grupo de pessoas
Temperatura corporal
Distaˆncia percorrida por um maratonista
Volume de reservato´rios de usinas
Nu´mero de calouros de uma universidade
Profissa˜o
4 ESTATI´STICA DESCRITIVA
A estat´ıstica descritiva e´ um ramo da estat´ıstica que se ocupa da organizac¸a˜o, apresen-
tac¸a˜o e descric¸a˜o de um conjunto de dados sem tirar quaisquer concluso˜es ou infereˆncias sobre
um grupo maior.
Neste cap´ıtulo sera˜o mostrados exemplos de tabelas e gra´ficos que podera˜o representar,
objetivamente, as informac¸o˜es e caracter´ısticas de uma varia´vel e, posteriormente, medidas esta-
t´ısticas que podem representar uma amostra: medidas de posic¸a˜o, separatrizes e variabilidade.
4.1 Apresentac¸a˜o dos dados
4.1.1 Tabelas
A tabela e´ uma ferramenta que tem por objetivo demonstrar o comportamento de
varia´vel(is) para facilitar a compreensa˜o do fenoˆmeno sem muito esforc¸o.
Uma tabela deve ser composta basicamente por:
• cabec¸alho
• corpo
• rodape´
O cabec¸alho deve conter informac¸o˜es que respondam a`s perguntas:
• o que esta´ representando?
• onde ocorreu?
• quando ocorreu?
UNIFAL-MG/Alfenas Profs. Fla´vio Bittencourt/Adriana Dias 9
Estat´ıstica Ba´sica 4 ESTATI´STICA DESCRITIVA
O corpo e´ representado por colunas e subcolunas dentro das quais sera˜o registrados os
dados e informac¸o˜es.
O rodape´ (nem sempre necessa´rio) e´ reservado para notas e identificac¸a˜o dos dados.De acordo com o crite´rio de organizac¸a˜o dos dados, as tabelas classificam-se em:
Se´rie temporal
Tambe´m chamada de se´rie cronolo´gica, se´rie evolutiva ou histo´rica. E´ a se´rie em que
os dados sa˜o observados de acordo com o tempo em que ocorrem, permanecendo constantes o
local e o fenoˆmeno. Exemplo:
TABELA 1 Rede rodovia´ria federal policiada. Brasil, 2005 a 2010
Ano Rede rodovia´ria
2005 56.097
2006 57.352
2007 57.352
2008 57.352
2009 66.984
2010 64.124
Fonte: DNIT. Dispon´ıvel em: http://www.dnit.gov.br/rodovias/operacoes-rodoviarias/estatisticas-de-
acidentes/anuario-2010.pdf
* Informac¸o˜es parciais
Se´rie geogra´fica
Tambe´m chamada de se´rie de localizac¸a˜o, se´rie regional ou se´rie territorial. E´ a se´rie
em que os dados sa˜o observados de acordo com a localidade em que ocorreram, permanecendo
constantes a e´poca e o fenoˆmeno. Exemplo:
TABELA 2 Internac¸o˜es por acidente de traˆnsito segundo a Unidade de Federac¸a˜o, faixa eta´ria
de 25 a 29 anos, nov-2013
Regia˜o Nu´mero de internac¸o˜es
Sudeste 144
Nordeste 94
Centro-Oeste 10
Sul 9
Norte 4
Fonte: Ministe´rio da Sau´de. Dispon´ıvel em: http://www.datasus.gov.br
Se´rie espec´ıfica ou catego´rica
E´ a se´rie em que os dados sa˜o agrupados de acordo com categorias ou espe´cies, perma-
necendo constantes a e´poca e o local. Exemplo:
10 Profs. Fla´vio Bittencourt/Adriana Dias UNIFAL-MG/Alfenas
Estat´ıstica Ba´sica 4 ESTATI´STICA DESCRITIVA
TABELA 3 Pessoas envolvidas em acidente de traˆnsito segundo o estado f´ısico, Brasil, 2010
Estado f´ısico Nu´mero de pessoas
Ileso 594.818
Leso˜es leves 75.044
Leso˜es graves 27.852
Morto 8.616
Na˜o informado 14.968
Fonte: DNIT. Dispon´ıvel em: http://www.dnit.gov.br/rodovias/operacoes-rodoviarias/estatisticas-de-
acidentes/anuario-2010.pdf
* Informac¸o˜es parciais
Se´rie de dupla entrada
E´ a se´rie que e´ constitu´ıda da conjugac¸a˜o ou junc¸a˜o de uma ou mais se´ries. E´ u´til para
mostrar dois ou mais tipos de varia´veis em relac¸a˜o a um item. Deve ser lida na vertical e na
horizontal simultaneamente para que as linhas e as colunas sejam relacionadas.
TABELA 4 Acidentes de traˆnsito segundo o tipo. Brasil, 2008 a 2010*
Tipo
Ano
2008 2009 2010
Choque com objeto fixo 11.342 16.835 19.222
Capotagem 3.967 4.273 4.513
Atropelamento 5.403 5.659 6.486
Atropelamento de animal 3.886 3.765 4.286
Choque com ve´ıculo estacionado 1.091 1.280 1.886
Colisa˜o traseira 37.872 44.726 51.355
Colisa˜o frontal 4.469 4.864 5.312
Queda de ve´ıculo 3.114 4.692 5.338
Fonte: DNIT. Dispon´ıvel em: http://www.dnit.gov.br/rodovias/operacoes-rodoviarias/estatisticas-de-
acidentes/anuario-2010.pdf
* Informac¸o˜es parciais
Distribuic¸a˜o de frequeˆncia
E´ a se´rie estat´ıstica em que os dados quantitativos ou dados qualitativos sa˜o agrupados
segundo suas respectivas frequeˆncias. Tem como objetivo fornecer uma boa visualizac¸a˜o do
comportamento dos dados. E´ usada, tambe´m para discriminar a distribuic¸a˜o de probabilidade
de uma amostra (ou populac¸a˜o). Tem-se dois tipos: distribuic¸a˜o de frequeˆncia para dados
discretos e para dados cont´ınuos.
Distribuic¸a˜o de frequeˆncia para dados discretos
E´ uma se´rie que possui uma coluna para as classes e outra coluna para as frequeˆncias.
As classes (1a coluna da tabela) sa˜o formadas por nu´meros inteiros, na˜o possuem diviso˜es,
representam o valor observado na varia´vel estudada. As frequeˆncias representam o nu´mero de
vezes que o valor da classe aparece no conjunto de dados.
Pore´m, quando temos uma varia´vel quantitativa discreta que apresenta muitas observa-
c¸o˜es, levando a um nu´mero grande de classes, e´ mais racional considera´-la como varia´vel cont´ınua
e realizar o agrupamento dos valores em va´rios intervalos de classe.
Nas Tabelas 5 e 6 esta˜o apresentadas exemplos de tabelas de distribuic¸a˜o de frequeˆncias
para varia´veis quantitativas discretas.
UNIFAL-MG/Alfenas Profs. Fla´vio Bittencourt/Adriana Dias 11
Estat´ıstica Ba´sica 4 ESTATI´STICA DESCRITIVA
TABELA 5 Nu´mero de filhos de 50 casais entrevistados numa fila de um PSF, Cidade Gama,
abril-maio de 2010*
Nu´mero de Filhos Nu´mero de Casais
0 6
1 16
2 9
3 8
4 3
5 3
6 3
7 2
Total 50
* Dados fict´ıcios
TABELA 6 Nu´mero de jogos das 116 edic¸o˜es do Campeonato Carioca de futebol
Classes de jogos Nu´mero de edic¸o˜es
86 ` 94 12
94 ` 102 11
102 ` 110 8
110 ` 118 10
118 ` 126 24
126 ` 134 25
134 ` 142 15
142 ` 150 11
Total 116
* Dados fict´ıcios
Distribuic¸a˜o de frequeˆncia para dados cont´ınuos
Nesta se´rie as classes (1a coluna da tabela) sa˜o formadas por intervalos de valores
agrupados definidos de alguma forma. As frequeˆncias representam o nu´mero de valores que
esta˜o compreendidos em cada intervalo (classe). A construc¸a˜o desta tabela na˜o e´ padronizada, a
maioria das vezes fica a cargo do pesquisador (pela experieˆncia) do que por meio de algoritmos.
Exemplo:
TABELA 7 Altura de estudantes do ensino me´dio da Escola EST, 2010
Classes de alturas (m) Nu´mero de estudantes
1,68 ` 1,71 7
1,71 ` 1,74 28
1,74 ` 1,77 33
1,77 ` 1,80 14
1,80 ` 1,83 24
1,83 ` 1,86 17
1,86 ` 1,89 2
1,89 ` 1,92 5
1,92 ` 1,95 0
1,95 ` 1,98 1
1,98 ` 2,01 1
Total 132
Fonte: Dados fict´ıcios
12 Profs. Fla´vio Bittencourt/Adriana Dias UNIFAL-MG/Alfenas
Estat´ıstica Ba´sica 4 ESTATI´STICA DESCRITIVA
4.1.2 Construc¸a˜o de tabelas de distribuic¸a˜o de frequeˆncias
Uma distribuic¸a˜o de frequeˆncias e´ a disposic¸a˜o dos valores observados com as respectivas
frequeˆncias. O nu´mero de observac¸o˜es ou repetic¸o˜es de um valor ou de uma modalidade, em um
levantamento qualquer, e´ chamado frequeˆncia desse valor ou dessa modalidade. Uma tabela de
frequeˆncias e´ uma tabela onde se procura fazer corresponder os valores observados (que podem
estar agrupados em intervalos ou na˜o) da varia´vel em estudo e as respectivas frequeˆncias.
Quando a varia´vel for discreta
Quando a varia´vel for discreta e houver poucas categorias ou poucos valores desde que
na˜o sejam muito diversos, pode-se confeccionar a tabela usando os pro´prios valores observados
como classes.
Exemplo: Numa fila de um PSF da cidade Gama foram entrevistados 50 casais durante
os meses abril e maio de 2010 (dados fict´ıcios). O objetivo da pesquisa era descobrir o nu´mero de
filhos por casal. O resultado da pesquisa esta´ apresentado abaixo, sendo os dados apresentados
conforme foram coletados (dados brutos), seguindo-se pelas linhas como se leˆ um livro.
2 3 0 2 1 1 1 3 2 5
6 1 1 4 0 1 5 6 0 2
1 4 1 3 1 7 6 2 0 1
3 1 3 5 7 1 3 1 1 0
3 0 4 1 2 2 1 2 3 2
Os dados como sa˜o apresentados anteriormente sa˜o denominados de dados brutos,
ou seja, sa˜o aqueles que na˜o foram numericamente organizados, esta˜o na forma como foram
coletados.
Para iniciar a tabulac¸a˜o e´ necessa´rio ordenar os dados, em ordem crescente ou decres-
cente. Os dados ordenados sa˜o chamados de rol. Assim, para os dados anteriores:
0 0 0 0 0 0 1 1 1 1
1 1 1 1 1 1 1 1 1 1
1 1 2 2 2 2 2 2 2 2
2 3 3 3 3 3 3 3 3 4
4 4 5 5 5 6 6 6 7 7
Por ter poucas categorias e na˜o ter valores diversos pode-se agrupar os dados de acordo
com a frequeˆncia, conforme e´ apresentado na Tabela 8:
TABELA 8 Nu´mero de filhos de 50 casais entrevistados numa fila de um PSF, Cidade Gama,
abril-maio de 2010*
Nu´mero de Filhos Nu´mero de Casais
0 6
1 16
2 9
3 8
4 3
5 3
6 3
7 2
Total 50
* Dados fict´ıcios
UNIFAL-MG/Alfenas Profs. Fla´vio Bittencourt/Adriana Dias 13
Estat´ıstica Ba´sica 4 ESTATI´STICA DESCRITIVA
Quando a varia´vel for cont´ınua ou discreta
Quando a varia´vel objeto de estudo for cont´ınua, recomenda-se agrupar os valores
observados em classes. Pode acontecer de a varia´vel ser discreta, mas o nu´mero de valores
observados ser muito grande ou estes valores apresentarem muito diversos. O agrupamento
evitatabelas com grande extensa˜o, a na˜o interpretac¸a˜o dos valores do fenoˆmeno e, tambe´m,
classes com valores nulos.
Na˜o existe uma regra u´nica para construc¸a˜o da tabela de distribuic¸a˜o de frequeˆncia,
mas e´ importante que a distribuic¸a˜o conte com um nu´mero adequado de classes. Se o nu´mero
de classes for excessivamente pequeno acarretara´ perda de detalhe e pouca informac¸a˜o se podera´
extrair da tabela. Por outro lado, se for utilizado um nu´mero excessivo de classes, havera´ alguma
classe com frequeˆncia nula ou muito pequena, na˜o atingindo o objetivo de classificac¸a˜o que e´
tornar o conjunto de dados supervisiona´veis.
Procedimentos que sera˜o adotados para construc¸a˜o de uma tabela de distribuic¸a˜o de
frequeˆncias para varia´veis cont´ınuas:
• Ordenar os valores
• Determinar o nu´mero de classes1 k:
a) k entre 5 e 20 classes, conforme a familiaridade do pesquisador com os dados;
b) k = 1 + 3,222× log n, em que n representa o nu´mero de dados;
c) k =
√
n quando n ≤ 100 e k = 5× log n quando n > 100, sendo n o nu´mero de dados2.
• Determinar o intervalo das classes c:
Se adotar as duas u´ltimas maneiras de determinar k, c e´ dado por:
c =
A
k − 1
Em que:
c: e´ o intervalo ou amplitude da classe;
A: amplitude total, dada pela diferenc¸a entre a maior e menor observac¸o˜es;
k: nu´mero de classes.
• Determinar o limite inferior da primeira classe LI1:
LI1 = menor observac¸a˜o− c
2
• Determinar o limite superior da primeira classe LS1:
LS1 = LI1 + c
• Determinar os demais limites das outras classes (ate´ a classe k):
LI2 = LS1 LS2 = LI2 + c
LI3 = LS2 LS3 = LI3 + c
LI4 = LS3 LS4 = LI4 + c
...
...
LIk = LSk−1 LSk = LIk + c
1 Na˜o existe um consenso sobre como determinar o nu´mero de classes e o intervalo das classes, cada autor usa o
que acha melhor 2 Esta sera´ a fo´rmula adotada em todas as situac¸o˜es
14 Profs. Fla´vio Bittencourt/Adriana Dias UNIFAL-MG/Alfenas
Estat´ıstica Ba´sica 4 ESTATI´STICA DESCRITIVA
Exemplo: Considere a varia´vel quantitativa cont´ınua “Taxa de urbanizac¸a˜o municipal
(em porcentagem) do estado de Minas Gerais, 2010”.
8 24 46 13 38 54 44 20 17 14
18 15 30 24 20 8 24 18 9 10
38 79 15 62 23 13 62 18 8 22
11 17 9 35 23 22 37 36 8 13
10 6 92 16 15 23 37 36 8 13
44 17 9 30 26 18 37 43 14 9
28 41 42 35 35 42 71 50 52 17
19 7 28 23 29 29 58 77 72 34
12 40 25 7 32 34 22 7 44 15
9 16 31 30
* Dados fict´ıcios
Os dados anteriores sa˜o brutos. Portanto, e´ necessa´rio ordena´-los (rol) de alguma forma.
Assim:
6 6 7 7 7 8 8 8 8 9
9 9 9 9 10 10 11 12 13 13
13 13 14 14 14 15 15 15 15 16
16 17 17 17 17 18 18 18 18 19
20 20 22 22 22 23 23 23 23 24
24 24 25 26 28 28 29 29 30 30
30 31 32 34 34 34 35 35 35 36
37 37 38 38 40 41 42 42 43 44
44 44 46 50 52 54 58 62 62 71
72 77 79 92
Agora, calcula-se o nu´mero de classes:
k =
√
94 = 9,69
Como k representa o nu´mero de classes, logo tem que ser um valor inteiro, assim sera´
adotado k = 9, mas poderia ser k = 10. Como k = 9 sabe-se que a tabela de distribuic¸a˜o de
frequeˆncias tem 9 classes, ou seja, 9 intervalos de valores.
O tamanho de cada intervalo, amplitiude da classe, e´ dado por c, assim:
c =
A
k − 1 =
92− 6
9− 1 = 10,75
Como os valores (dados) sa˜o nu´meros inteiros na˜o justifica trabalhar com casas decimais,
assim adotar-se-a´ c = 11, por convenieˆncia, podendo ser adotado c = 10 desde de que ao final
da construc¸a˜o da tabela se observe que todos os valores foram agrupados nas k = 9 ou k = 10
classes.
O pro´ximo ca´lculo e´ a determinac¸a˜o dos limites de cada classe. O limite inferior da
primeira classe LI1 e´ determinado por:
LI1 = menor observac¸a˜o− c
2
Logo,
LI1 = 6− 11
2
= 0,5
O limite superior da primeira classe LS1 e´ calculado por:
LS1 = LI1 + c
UNIFAL-MG/Alfenas Profs. Fla´vio Bittencourt/Adriana Dias 15
Estat´ıstica Ba´sica 4 ESTATI´STICA DESCRITIVA
LS1 = 0,5 + 11 = 11,5
Os demais limites ate´ a 9a classe, sa˜o:
Classe Limite inferior Limite superior
2a
LI2 = LS1 LS2 = LI2 + c
LI2 = 11,5 LS2 = 11,5 + 11 = 22,5
3a
LI3 = LS2 LS3 = LI3 + c
LI3 = 22,5 LS3 = 22,5 + 11 = 33,5
4a
LI4 = LS3 LS4 = LI4 + c
LI4 = 33,5 LS4 = 33,5 + 11 = 44,5
5a
LI5 = LS4 LS5 = LI5 + c
LI5 = 44,5 LS5 = 44,5 + 11 = 55,5
6a
LI6 = LS5 LS6 = LI6 + c
LI6 = 55,5 LS6 = 55,5 + 11 = 66,5
7a
LI7 = LS6 LS7 = LI7 + c
LI7 = 66,5 LS7 = 66,5 + 11 = 77,5
8a
LI8 = LS7 LS8 = LI8 + c
LI8 = 77,5 LS8 = 77,5 + 11 = 88,5
9a
LI9 = LS8 LS9 = LI9 + c
LI9 = 88,5 LS9 = 88,5 + 11 = 99,5
Apo´s realizar todas as operac¸o˜es, monta-se a tabela de distribuic¸a˜o de frequeˆncias. Para
isto apo´s montar as classes volta-se aos dados e verifica-se quantos valores (frequeˆncias) esta˜o
em cada classe. O resultado de toda esta operac¸a˜o e´ apresentado na Tabela 9.
TABELA 9 Taxa de urbanizac¸a˜o municipal (em porcentagem) do estado de Minas Gerais, 2010
Taxas Nu´mero de munic´ıpios
0,5 ` 11,5 17
11,5 ` 22,5 28
22,5 ` 33,5 18
33,5 ` 44,5 19
44,5 ` 55,5 04
55,5 ` 66,5 03
66,5 ` 77,5 03
77,5 ` 88,5 01
88,5 ` 99,5 01
Total 94
Fonte: Dados fict´ıcios
4.1.3 Tipos de distribuic¸a˜o de frequeˆncias
Numa tabela de distribuic¸a˜o de frequeˆncias as frequeˆncias podem ser:
Tipos de frequeˆncias

Simples
{
Absolutas
Relativas
Acumuladas

Crescentes
{
Absolutas
Relativas
Decrescentes
{
Absolutas
Relativas
Distribuic¸a˜o de frequeˆncias simples
a) Frequeˆncia simples absoluta: e´ o nu´mero de repetic¸o˜es de um valor individual
ou de uma classe de valores da varia´vel estudada. Exemplo: Na Tabela 9 cada frequeˆncia fi,
i = 1, . . . , 9, representa o nu´mero de valores que esta˜o em cada classe.
16 Profs. Fla´vio Bittencourt/Adriana Dias UNIFAL-MG/Alfenas
Estat´ıstica Ba´sica 4 ESTATI´STICA DESCRITIVA
b) Frequeˆncia simples relativa: representa a proporc¸a˜o de observac¸o˜es de um valor
individual ou de uma classe em relac¸a˜o ao nu´mero total de observac¸o˜es. Para calcular a frequeˆn-
cia relativa basta dividir a frequeˆncia absoluta da classe ou do valor individual pelo nu´mero total
de observac¸o˜es. E´ um valor importante para comparac¸o˜es.
fri =
fi
n
Em que:
fri: frequeˆncia simples relativa da classe i, i = 1, . . . , k;
fi: frequeˆncia simples absoluta da classe i, i = 1, . . . , k;
n: nu´mero de observac¸o˜es.
Exemplo: Com os dados obtidos na Tabela 9 tem-se a seguinte tabela de distribuic¸a˜o
de frequeˆncias relativas:
TABELA 10 Valores relativos de taxa de urbanizac¸a˜o municipal (em porcentagem) do estado de
Minas Gerais, em 94 munic´ıpios, 2010
Taxas Nu´mero de munic´ıpios
0,5 ` 11,5 0,1809
11,5 ` 22,5 0,2979
22,5 ` 33,5 0,1915
33,5 ` 44,5 0,2021
44,5 ` 55,5 0,0426
55,5 ` 66,5 0,0319
66,5 ` 77,5 0,0319
77,5 ` 88,5 0,0106
88,5 ` 99,5 0,0106
Total 1,0000
Fonte: Dados fict´ıcios
Cada frequeˆncia relativa foi calculada por:
fr1 =
17
94
= 0,1809
fr2 =
28
94
= 0,2979
fr3 =
18
94
= 0,1915
fr4 =
19
94
= 0,2021
fr5 =
04
94
= 0,0505
fr6 =
03
94
= 0,0319
fr7 =
03
94
= 0,0319
fr8 =
01
94
= 0,0106
fr9 =
01
94
= 0,0106
Para expressar os resultados em termos percentuais, multiplica-se o quociente obtido
por 100:
fpi = fri × 100%
Importante: para fins de ana´lises matema´ticas todas as observac¸o˜es contidas num
intervalo de classe sera˜o consideradas iguais ao ponto me´dio da classe. Essa hipo´tese e´ a hipo´tese
tabular ba´sica (HTB). O ponto me´dio da classe i e´ dado por:
X¯i =
LIi + LSi
2
Em que:
UNIFAL-MG/Alfenas Profs. Fla´vio Bittencourt/Adriana Dias 17
Estat´ıstica Ba´sica 4 ESTATI´STICA DESCRITIVA
X¯i: e´ o ponto me´dio da classe i;
LIi e LSi: sa˜o, respectivamente, o limite inferior e superior da classe i.
4.1.4 Exerc´ıcios
1. No Pronto Socorro da Santa Casa (2012), foi contabilizadoo nu´mero de pessoas que foram
atendidas na emergeˆncia por acidente de carro em 20 grupos de 100 pessoas cada. Os dados
obtidos foram: 9, 10, 10, 8, 12, 11, 8, 11, 7, 9, 10, 10, 9, 11, 9, 10, 10, 10, 9, 10. Construa uma
tabela de distribuic¸a˜o de frequeˆncias.
2. Dez alunos da UNIFAL-MG/Alfenas (2014/1) foram selecionados e se submeteram a um
exame de sangue apresentando os seguintes valores de glicemia em mg/dL: 80, 60, 68, 79, 62,
76, 70, 78, 78, 77. Monte uma tabela de distribuic¸a˜o de frequeˆncias.
3. Foi realizada uma pesquisa a qual tinha por objetivo conhecer a altura dos estudantes do
sexo masculino (em metros) da Faculdade X, 2010. Os dados sa˜o os apresentados abaixo:
1,70 1,71 1,72 1,73 1,74 1,75 1,76 1,77 1,78 1,79 1,80 1,80 1,83 1,85 1,95
1,70 1,71 1,72 1,73 1,74 1,75 1,76 1,77 1,78 1,79 1,80 1,80 1,83 1,85 2,00
1,70 1,71 1,72 1,73 1,74 1,75 1,76 1,77 1,78 1,80 1,80 1,82 1,83 1,85
1,70 1,72 1,72 1,73 1,75 1,75 1,76 1,77 1,78 1,80 1,80 1,82 1,84 1,86
1,70 1,72 1,72 1,73 1,75 1,75 1,76 1,78 1,78 1,80 1,80 1,82 1,84 1,87
1,70 1,72 1,72 1,74 1,75 1,75 1,76 1,78 1,79 1,80 1,80 1,82 1,84 1,90
1,70 1,72 1,73 1,74 1,75 1,75 1,76 1,78 1,79 1,80 1,80 1,83 1,85 1,90
1,71 1,72 1,73 1,74 1,75 1,75 1,76 1,78 1,79 1,80 1,80 1,83 1,85 1,90
1,71 1,72 1,73 1,74 1,75 1,75 1,77 1,78 1,79 1,80 1,80 1,83 1,85 1,90
1,71 1,72 1,73 1,74 1,75 1,75 1,77 1,78 1,79 1,80 1,80 1,83 1,85 1,90
Monte uma tabela com a distribuic¸a˜o de frequeˆncias absolutas, relativas e percentuais.
4.1.5 Gra´ficos
A representac¸a˜o gra´fica e´ outro recurso que tem por objetivo dar uma ideia, a mais
imediata poss´ıvel, dos dados nume´ricos, proporcionando maior facilidade de compreensa˜o deles,
para chegar a concluso˜es sobre o comportamento do fenoˆmeno em estudo.
Um gra´fico deve ter, dentre outras, as seguintes caracter´ısticas:
- Clareza: possibilita a leitura e interpretac¸o˜es correta dos valores do fenoˆmeno;
- Simplicidade: possibilita a ana´lise ra´pida do fenoˆmeno observado. Evita-se perder com parti-
cularidades sem importaˆncia;
- Veracidade: indispensa´vel, pois, se o gra´fico na˜o representar uma realidade, perde sua finali-
dade.
Classificac¸a˜o quanto a` forma:
a) Diagramas: gra´ficos geome´tricos dispostos em duas dimenso˜es. Sa˜o mais usados na repre-
sentac¸a˜o de se´ries estat´ısticas.
b) Cartogramas: e´ a representac¸a˜o sobre uma carta geogra´fica, sendo muito usado na Geografia,
Histo´ria e Demografia.
c) Estereogramas: representam volumes e sa˜o apresentados em treˆs dimenso˜es.
d) Pictogramas: a representac¸a˜o gra´fica que consta de figuras representativas do fenoˆmeno.
Desperta logo a atenc¸a˜o do pu´blico.
Classificac¸a˜o quanto ao objetivo:
a) Gra´ficos de informac¸a˜o - o objetivo e´ proporcionar uma visualizac¸a˜o ra´pida e clara da in-
tensidade das categorias ou dos valores relativos ao fenoˆmeno. Sa˜o gra´ficos tipicamente
expositivos, devendo ser o mais completo poss´ıvel, dispensando comenta´rios explicativos.
18 Profs. Fla´vio Bittencourt/Adriana Dias UNIFAL-MG/Alfenas
Estat´ıstica Ba´sica 4 ESTATI´STICA DESCRITIVA
Caracter´ısticas:
- deve conter t´ıtulo em letra de forma;
- as legendas podem ser omitidas, desde que as informac¸o˜es presentes possibilitem a inter-
pretac¸a˜o do gra´fico.
b) Gra´ficos de ana´lise - estes gra´ficos fornecem informac¸o˜es importantes na fase de ana´lise dos
dados, sendo tambe´m informativos. Os gra´ficos de ana´lise, geralmente, veˆm acompanhados
de uma tabela e um texto onde se destacam os pontos principais revelados pelo gra´fico ou
pela tabela.
Gra´fico em linha
Os gra´ficos lineares sa˜o usados frequentemente para a representac¸a˜o de se´ries temporais.
Para constru´ı-lo, basta marcar os pontos e uni-los por meio de segmentos de reta, formando uma
poligonal. Considerando os dados apresentados na Tabela 1, pode-se representa´-los graficamente
segundo a Figura 4:
FIGURA 4 Rede rodovia´ria federal policiada. Brasil, 2005 a 2010
Gra´fico em colunas
Os gra´ficos em colunas tornam poss´ıveis as comparac¸o˜es das grandezas, representando-
as por meio de retaˆngulos de mesma base e alturas proporcionais a`s respectivas grandezas. Estes
gra´ficos sa˜o mais utilizados, quando as inscric¸o˜es a serem inseridas sob os retaˆngulos forem curtas.
As orientac¸o˜es para construc¸a˜o de um gra´fico em colunas sa˜o:
a) os retaˆngulos so´ diferem no comprimento, e na˜o na base, a qual e´ atribu´ıda;
b) os retaˆngulos devem ser separados por espac¸os, um dos outros, sendo estes todos iguais, mas
na˜o devem ser menores do que a metade da base dos retaˆngulos;
c) os retaˆngulos devem ser desenhados, observando-se a ordem de grandeza, para facilitar
a leitura e a ana´lise comparativa dos valores. Entretanto, se a se´rie representada for
temporal, os dados a serem dispostos no eixo horizontal devem ser colocados em ordem
crescente de tempo.
Observac¸a˜o: O espac¸o entre as colunas pode variar de 1/3 a 2/3 do tamanho da base da coluna.
As informac¸o˜es apresentadas na Tabela 2 podem ser visulizadas na Figura 5:
UNIFAL-MG/Alfenas Profs. Fla´vio Bittencourt/Adriana Dias 19
Estat´ıstica Ba´sica 4 ESTATI´STICA DESCRITIVA
0
20
40
60
80
100
120
140
160
Sudeste Nordeste Centro-Oeste Sul Norte
N
ú
m
e
ro
 d
e
 in
te
rn
aç
õ
e
s
Regiões
FIGURA 5 Internac¸o˜es por acidente de traˆnsito segundo a Unidade de Federac¸a˜o, faixa eta´ria de 25 a
29 anos, nov-2013
Gra´fico em barras
Os gra´ficos em barras teˆm a mesma finalidade que os gra´ficos em colunas, sendo prefer´ı-
veis estes, quando as inscric¸o˜es a serem inseridas forem longas. Sa˜o mais usados para representar
se´ries espec´ıficas, com uma u´nica diferenc¸a que e´ a posic¸a˜o em que esta˜o dispostos os retaˆngu-
los, na horizontal. As alturas dos retaˆngulos sa˜o iguais e arbitra´rias e os comprimentos sa˜o
proporcionais aos respectivos dados.
As barras devem ser separadas uma das outras pelo mesmo espac¸o de forma que as
inscric¸o˜es identifiquem as diferentes barras. O espac¸o entre as barras pode ser a metade (1/2)
ou dois terc¸os (2/3) de suas larguras.
As barras devem ser colocadas em ordem de grandeza de forma decrescente para facilitar
a comparac¸a˜o dos valores. A categoria“outros” (quando existir) e´ representada na barra inferior,
mesmo que o seu comprimento exceda o de alguma outra.
Os dados da Tabela 3 sa˜o apresentados graficamente como pode ser visualizado na
Figura 6:
Le
sõ
es
 
le
v
es
Le
sõ
es
 
gr
av
es
N
ão
 
in
fo
rm
ad
o
M
o
rt
o
Estado físico
0
10
0.
00
0
20
0.
00
0
30
0.
00
0
40
0.
00
0
50
0.
00
0
60
0.
00
0
70
0.
00
0
Ile
so
Le
sõ
es
 
le
v
es
N
úm
er
o
 
de
 
pe
ss
o
a
s
FIGURA 6 Nu´mero de pessoas envolvidas em acidentes de traˆnsito segundo o estado f´ısico. Brasil, 2010
20 Profs. Fla´vio Bittencourt/Adriana Dias UNIFAL-MG/Alfenas
Estat´ıstica Ba´sica 4 ESTATI´STICA DESCRITIVA
Gra´fico em setores
E´ a representac¸a˜o gra´fica de uma se´rie estat´ıstica em um c´ırculo de raio qualquer, por
meio de setores com aˆngulos centrais proporcionais a`s ocorreˆncias. Para constru´ı-lo, parte-se
do princ´ıpio de que o nu´mero total de valores observados corresponde ao total de graus de uma
circunfereˆncia: 360o. A a´rea do c´ırculo sera´ esta˜o dividida em setores proporcionais aos valores
da se´rie. Essa divisa˜o se faz por meio de uma regra de treˆs simples. Com o aux´ılio de um
transferidor, efetua-se a marcac¸a˜o dos aˆngulos correspondentes a cada divisa˜o.
E´ utilizado quando se pretende comparar cada valor da se´rie com o total. O gra´fico
em setores representa valores absolutos ou porcentagens complementares. As se´ries geogra´ficas,
espec´ıficas e as categorias em n´ıvel nominal sa˜o mais representadasem gra´ficos de setores, desde
que na˜o apresentem muitas parcelas (no ma´ximo sete).
Os dados da Tabela 2 tambe´m podem ser representados por meio do gra´fico de setores
(Figura 7):
144; 55%
94; 36%
10; 4%
9; 3% 4; 2%
Sudeste Nordeste
Centro-Oeste Sul
Norte
FIGURA 7 Internac¸o˜es por acidente de tra˜nsito segundo a Unidade de Federac¸a˜o, faixa eta´ria de 25 a
29 anos, nov-2013
Histograma e pol´ıgono de frequeˆncias
HISTOGRAMA
Sa˜o gra´ficos de superf´ıcies utilizados para representar distribuic¸o˜es de frequeˆncias com
dados agrupados em classes. O histograma e´ composto por retaˆngulos (denominados ce´lulas),
cada um deles representando um conjunto de valores pro´ximos (as classes). A largura da base de
cada ce´lula deve ser proporcional a` amplitude do intervalo da classe que ela representa e a a´rea
de cada ce´lula deve ser proporcional a` frequeˆncia da mesma classe. Se todas as classes tiverem
igual amplitude, enta˜o as alturas dos retaˆngulos sera˜o proporcionais a`s frequeˆncias das classes
que eles representam.
Exemplo: A Tabela 9 e´ uma tabela de distribuic¸a˜o de frequeˆncias, o histograma refe-
rente a ela esta´ representado na Figura 8:
UNIFAL-MG/Alfenas Profs. Fla´vio Bittencourt/Adriana Dias 21
Estat´ıstica Ba´sica 4 ESTATI´STICA DESCRITIVA
FIGURA 8 Taxa de urbanizac¸a˜o municipal (em porcentagem) do estado de Minas Gerais, 2010
POLI´GONO DE FREQUEˆNCIAS
E´ o gra´fico feito ligando-se, por meio de segmentos de retas, os pontos correspondentes
aos pontos me´dios das classes com suas respectivas frequeˆncias. No in´ıcio e no fim do gra´fico
ligamos os pontos nas extremidades dos retaˆngulos para o gra´fico na˜o ficar “voando”.
Exemplo: Do histograma apresentado na Figura 8, o respectivo pol´ıgono de frequeˆncias
e´ o apresentado na Figura 9:
FIGURA 9 Taxa de urbanizac¸a˜o municipal (em porcentagem) do estado de Minas Gerais, 2010
Tipos de curvas de frequeˆncias
Curvas de frequeˆncia aparecem, na pra´tica, sob diversas formas caracter´ısticas, como
as indicadas na Figura 10:
a) Curvas de frequeˆncia sime´trica ou em forma de sino: caracterizam-se pelo fato das ob-
servac¸o˜es equidistantes do ponto central ma´ximo ter a mesma frequeˆncia. Um exemplo
importante e´ a curva normal, Figura 10a.
b) Curvas moderadamente assime´tricas: nestas a cauda da curva de um lado da ordenada
ma´xima e´ mais longa do que do outro. Se o ramo mais alongado fica a` direita, a curva e´
dita assime´trica a` direita, ou assime´trica positiva, exemplo a Figura 10b1. Enquanto que,
se ocorre o inverso, diz-se que a curva e´ assime´trica a` esquerda, ou assime´trica negativa,
Figura 10b2.
c) Curva em forma de J, ou em J invertido: o ponto de ordenada ma´xima ocorre em uma das
extremidades, Figuras 10c1 e c2, respectivamente.
22 Profs. Fla´vio Bittencourt/Adriana Dias UNIFAL-MG/Alfenas
Estat´ıstica Ba´sica 4 ESTATI´STICA DESCRITIVA
a b1 b2 c1
c2 d e f
FIGURA 10 Tipos de frequeˆncias
d) Curva em forma de U: a curva possui ordenadas ma´ximas em ambas as extremidades:
Figura 10d.
e) Curva de frequeˆncia bimodal: nesta curva ha´ dois ma´ximos (duas modas), Figura 10e
f) Curva de frequeˆncia multimodal: teˆm mais de dois ma´ximos, Figura 10f.
4.1.6 Exerc´ıcios
1. Para os dados dos vinte grupos de pessoas atendidas na emergeˆncia por acidente de carro do
exerc´ıcio da sec¸a˜o 4.1.4 construa o gra´fico de colunas e o gra´fico de barras.
2. Para dos dados dos dez alunos do exerc´ıcio da sec¸a˜o 4.1.4 construa o histograma e o pol´ıgono
de frequeˆncia para os dados percentuais.
3. Para os dados de altura dos estudantes do sexo masculino (em metros) da Faculdade X, 2010,
apresentados no exerc´ıcio da sec¸a˜o 4.1.4, confeccione:
a) histograma
b) pol´ıgono de frequeˆncia
4.2 Medidas Estat´ısticas
4.2.1 Medidas de Tendeˆncia Central
Os valores que em estat´ıstica caracterizam os valores me´dios sa˜o chamados de medidas
de tendeˆncia central. Entre as principais medidas de tendeˆncia central destacam-se a me´dia
aritme´tica, a moda e a mediana.
Me´dia
A mais importante medida de locac¸a˜o e´ a me´dia aritme´tica. E´ um conceito, sem du´vida,
bastante familiar. Por exemplo, a altura me´dia de um grupo de estudantes, ou a temperatura
me´dia em uma cidade em determinado dia, ou a nota me´dia de uma turma de 30 alunos.
A me´dia aritme´tica de um conjunto de n observac¸o˜es x1, x2, . . . , xn e´ o quociente da
divisa˜o de n pela soma dos valores dessas observac¸o˜es. E´ denotada por x¯ (leia-se x barra):
x¯ =
n∑
i=1
xi
n
=
x1 + x2 + ...+ xn
n
Em que:
xi: indica a observac¸a˜o de ordem i, i = 1, 2, 3, . . . , n.
UNIFAL-MG/Alfenas Profs. Fla´vio Bittencourt/Adriana Dias 23
Estat´ıstica Ba´sica 4 ESTATI´STICA DESCRITIVA
Exemplo: dados os pesos, em quilos, de 10 rece´m-nascidos: 3,3; 3,1; 2,8; 2,7; 2,9; 3,1;
3,2; 3,0; 3,5; 3,4 o peso me´dio sera´:
x¯ =
3,3 + 3,1 + 2,8 + 2,7 + 2,9 + 3,1 + 3,2 + 3,0 + 3,5 + 3,4
10
=
31,0
10
= 3,1
kg
Me´dia Ponderada
Em algumas situac¸o˜es, os nu´meros que se quer sintetizar teˆm graus de importaˆncia
diferentes. Estes graus de importaˆncia sa˜o considerados na hora de calcular a me´dia. Recebem
o nome de pesos.
A me´dia ponderada dos nu´meros x1, x2, . . . , xn, com pesos p1, p2, ..., pn, representada
por x¯p, e´ definida como:
x¯p =
n∑
i=1
xipi
n∑
i=1
pi
=
x1p1 + x2p2 + ...+ xnpn
p1 + p2 + ...+ pn
A me´dia aritme´tica pode ser considerada como uma me´dia ponderada em que os pesos
sa˜o todos iguais a 1.
Exemplo 1: a nota final do sistema acadeˆmico e´ calculado por meio de uma me´dia
ponderada dada por:
Mfinal =
n∑
i=1
Notai
Maxi
× Pesoi
n∑
i=1
Pesoi
× 10
Em que:
Mfinal: e´ a me´dia final do aluno na disciplina;
Notai: e´ a nota atribu´ıda para cada avaliac¸a˜o da disciplina;
Maxi: e´ o valor ma´ximo da avaliac¸a˜o;
Pesoi: e´ a ponderac¸a˜o da nota em relac¸a˜o a`s demais.
Exemplo 2: Considere 5 provas aplicadas as quais possuem os seguintes pesos, respec-
tivamente: 1, 2, 3, 4 e 5. Um determinado aluno conseguiu as seguintes notas ordenadas: 40,
50, 80, 90 e 20. A sua me´dia e´ calculada por:
x¯p =
5∑
i=1
pixi
n∑
i=1
pi
=
p1x1 + p2x2 + ...+ p5x5
p1 + p2 + ...+ p5
=
1 · 40 + 2 · 50 + 3 · 80 + 4 · 90 + 5 · 20
1 + 2 + 3 + 4 + 5
= 56 pontos
Ao calcular uma me´dia para dados distribu´ıdos numa tabela de distribuic¸a˜o de frequeˆn-
cias (dados agrupados) usa-se a me´dia ponderada. Para calcular a me´dia quando os dados esti-
verem agrupados (tabela de distribuic¸a˜o de frequeˆncias) e se as classes forem formadas por
intervalos e´ necessa´rio calcular o ponto me´dio X¯i de cada classe. As frequeˆncias fi funcionam
como pesos e os pontos me´dios X¯i’s representam os valores que a varia´vel assume (hipo´tese
tabular ba´sica).
Considere um experimento em que durante 60 dias anotou-se o nu´mero de cartas en-
tregues, diariamente, em um edif´ıcio residencial. Os resultados sa˜o os apresentados a seguir.
Calcule a me´dia de cartas entregues no condomı´nio.
24 Profs. Fla´vio Bittencourt/Adriana Dias UNIFAL-MG/Alfenas
Estat´ıstica Ba´sica 4 ESTATI´STICA DESCRITIVA
TABELA 11 Nu´mero de cartas entregues, diariamente, em um edif´ıcio residencial, durante 60
dias
Nu´mero de cartas entregues por dia Nu´mero de dias
20 ` 30 05
30 ` 40 09
40 ` 50 20
50 ` 60 18
60 ` 70 08
Total 60
Nesta situac¸a˜o e´ necessa´rio calcular o ponto me´dio de cada classe, lembre-se que o ponto
me´dio da classe i e´ dado por:
X¯i =
LIi + LSi
2
A Tabela 12 ira´ apresentar mais uma coluna referente aos pontos me´dios das classes para facilitar
os ca´lculos:
TABELA 12 Nu´mero de cartas entregues, diariamente, em um edif´ıcio residencial, durante 60
dias e o ponto me´dio das classes
Nu´mero de cartas entregues por dia Ponto me´dio X¯i das classes Nu´mero de dias fi20 ` 30 25 05
30 ` 40 35 09
40 ` 50 45 20
50 ` 60 55 18
60 ` 70 65 08
Total 60
Assim, o nu´mero me´dio de cartas entregues diariamente e´ dado por:
x¯ =
k∑
i=1
fi × X¯i
k∑
i=1
fi
=
5∑
i=1
fi × X¯i
5∑
i=1
fi
=
f1 · X¯1 + f2 · X¯2 + f3 · X¯3 + f4 · X¯4 + f5 · X¯5
f1 + f2 + f3 + f4 + f5
=
25 · 5 + 35 · 9 + 45 · 20 + 55 · 18 + 65 · 8
5 + 9 + 20 + 18 + 8
= 47,5 cartas/dia
Propriedade da me´dia
Dentre outras:
• A soma alge´brica dos desvios de um conjunto de valores em relac¸a˜o a` me´dia aritme´tica e´
zero:
n∑
i=1
(xi − x¯) = 0
UNIFAL-MG/Alfenas Profs. Fla´vio Bittencourt/Adriana Dias 25
Estat´ıstica Ba´sica 4 ESTATI´STICA DESCRITIVA
• A soma alge´brica dos quadrados dos desvios de um conjunto de valores em relac¸a˜o a` me´dia
aritme´tica e´ mı´nima:
D =
n∑
i=1
(xi − x¯)2
Vantagens do emprego da me´dia
• Como se faz uso de todos os dados para o seu ca´lculo e´ determinada com precisa˜o mate-
ma´tica;
• E´ determinada quando somente o valor total e o nu´mero de elementos forem conhecidos.
Desvantagens do emprego da me´dia
• Na˜o pode ser empregada para dados qualitativos;
• E´ influenciada por valores extremos, podendo, em alguns casos, na˜o representar a se´rie;
• Em distribuic¸o˜es de frequeˆncias em que o limite inferior da primeira classe e/ou o limite
superior da u´ltima classe na˜o forem definidos, a me´dia na˜o podera´ ser calculada.
Moda
Como o pro´prio nome indica, e´ o valor que ocorre com maior frequeˆncia em um conjunto
de valores. Em outras palavras, e´ o valor que esta´ na moda.
As distribuic¸o˜es que apresentam uma moda u´nica sa˜o chamadas de unimodais; quando
apresentam duas modas, bimodais e mais de duas modas, multimodais. Existem ainda distri-
buic¸o˜es que na˜o apresentam nenhuma moda: sa˜o chamadas de amodais.
Exemplo: Calcule a moda dos seguintes conjuntos de dados:
a) 39; 52; 40; 45; 46; 55; 48; 40; 43; 47; 44
mo = 40
b) 2,4; 1,2; 1,4; 2,4; 1,1; 1,8; 1,9; 1,4; 1,8; 3,2; 2,4; 2,2; 2,4; 1,8; 3,6; 1,8; 1,2; 2,4; 2,0; 3,4
mo = 2,4
c) 1, 1, 2, 2, 3, 3
mo = @ (na˜o tem moda)
d) 100, 121, 202, 1022, 1500
mo = @ (na˜o tem moda)
Moda para dados agrupados
Quando os dados esta˜o agrupados em distribuic¸o˜es de frequeˆncias em que as classes
na˜o sa˜o formadas por intervalos, na˜o existe uma fo´rmula matema´tica para o ca´lculo da moda,
ficando pois, a cargo do pesquisador identificar o elemento que apresentar o maior nu´mero de
ocorreˆncias. Esse valor sera´ o valor modal.
Para dados agrupados em distribuic¸a˜o de frequeˆncias cujas classes sa˜o formadas por
intervalos, o me´todo mais empregado para o ca´lculo da moda e´ o me´todo de Czuber, cuja fo´rmula
e´ definida por:
mo = LImo +
(
∆1
∆1 + ∆2
)
Cmo
Em que: LImo: limite inferior da classe modal;
∆1: diferenc¸a entre a frequeˆncia absoluta da classe modal e a classe anterior;
∆2: diferenc¸a entre a frequeˆncia absoluta da classe modal e a classe posterior;
Cmo: amplitude da classe modal.
26 Profs. Fla´vio Bittencourt/Adriana Dias UNIFAL-MG/Alfenas
Estat´ıstica Ba´sica 4 ESTATI´STICA DESCRITIVA
Exemplo: Durante 60 dias anotou-se o nu´mero de cartas entregues, diariamente, em
um edif´ıcio residencial. Os resultados foram apresentados na Tabela 11. Calcule o valor mais
frequente, ou seja, o nu´mero modal de cartas entregues.
Soluc¸a˜o:
A classe de maior frequeˆncia e´ a 3a classe.
O limite inferior da classe modal e´ igual 40
A diferenc¸a entre a frequeˆncia absoluta da classe modal e a classe anterior e´: 20− 9 = 11
A diferenc¸a entre a frequeˆncia absoluta da classe modal e a classe posterior e´: 20− 18 = 2
A amplitude da classe modal e´: 50− 40 = 10
Substituindo estes valores na fo´rmula abaixo,
mo = LImo +
(
∆1
∆1 + ∆2
)
Cmo = 40 +
(
11
11 + 2
)
10 = 48,46 cartas
Vantagens do emprego da moda
• E´ de uso pra´tico. Exemplificando: os empregados geralmente adotam a refereˆncia modal
de sala´rio, ou seja, o sala´rio pago por muitos outros empregados. Tambe´m, carros e roupas
sa˜o produzidos tomando como refereˆncia o tamanho modal;
• A moda geralmente e´ um valor verdadeiro e, por conseguinte, pode mostrar-se mais real e
coerente.
Desvantagens do emprego da moda
• Na˜o inclui todos os valores de uma distribuic¸a˜o;
• Mostra-se ineficiente quando a distribuic¸a˜o e´ largamente dispersa.
Mediana
Sejam x1 ≤ x2 ≤ . . . ≤ xn os n valores ordenados de uma varia´vel qualquer. A
mediana e´ o valor que centra a distribuic¸a˜o do conjunto de valores, ou seja, que divide este
conjunto de valores ordenados em duas partes de frequeˆncias iguais.
Para dados na˜o agrupados a mediana e´ um valor que se localiza por:
md =

Nu´mero ı´mpar de dados : x(n+12 )
Nu´mero par de dados :
x(n2 )
+ x(n2 +1)
2
Em que:
x(n+12 )
: e´ o elemento (valor) que ocupa a n+12 -e´sima posic¸a˜o no conjunto ordenado dos dados;
x(n2 )
: e´ o elemento (valor) que ocupa a n2 -e´sima posic¸a˜o no conjunto ordenado dos dados;
x(n2 +1)
: e´ o elemento (valor) que ocupa a
(
n
2 + 1
)
-e´sima posic¸a˜o no conjunto ordenado dos dados.
Exemplo: Calcule a mediana dos seguintes conjuntos de dados:
a) 39; 52; 40; 45; 46; 55; 48; 40; 43; 47; 44
1o) Ordene os dados: 39; 40; 40; 43; 44; 45; 46; 47; 48; 52; 55
2o) Como ha´ nu´mero ı´mpar de dados, a mediana e´ encontrada por:
x(n+12 )
= x( 11+12 )
= x(6) = 45
b) 2,4; 1,2; 1,4; 2,4; 1,1; 1,8; 1,9; 1,4; 1,8; 3,2; 2,4; 2,2; 2,4; 1,8; 3,6; 1,8; 1,2; 2,4; 2,0; 3,4
1o) Ordene os dados: 1,1; 1,2; 1,2; 1,4; 1,4; 1,8; 1,8; 1,8; 1,8; 1,9; 2,0; 2,2; 2,4; 2,4; 2,4; 2,4; 2,4;
UNIFAL-MG/Alfenas Profs. Fla´vio Bittencourt/Adriana Dias 27
Estat´ıstica Ba´sica 4 ESTATI´STICA DESCRITIVA
3,2; 3,4; 3,6
2o) Como ha´ nu´mero par de dados, a mediana e´ encontrada por:
x(n2 )
+ x(n2 +1)
2
=
x( 202 )
+ x( 202 +1)
2
=
x(10) + x(11)
2
=
1,9 + 2,0
2
= 1,95
Para dados agrupados a mediana e´ calculada por:
md = LImd +
[ n
2 − FA
Fmd
]
Cmd
Em que:
LImd: limite inferior da classe mediana;
FA: frequeˆncia acumulada das classes anteriores a` classe mediana;
Fmd: frequeˆncia absoluta da classe mediana;
Cmd: amplitude da classe mediana.
Exemplo: Considerando os dados apresentados na Tabela 11, calcule a mediana.
Soluc¸a˜o:
n = 60.
O limite inferior da classe mediana e´: 40, pois sa˜o 60 dias (ou seja 60 observac¸o˜es). Assim a
mediana esta´ entre o dia 30 e o dia 31. Observa-se que os dias 30 e 31 esta˜o na 3a classe e,
portanto, o limite inferior da 3a classe e´ 40.
A frequeˆncia absoluta da classe mediana e´: 20
A frequeˆncia acumulada das classes anteriores a` classe mediana (1a e 2a classes) e´: 5 + 9 = 14.
A amplitude da classe mediana e´: 50− 40 = 10.
Substituindo estes valores na fo´rmula abaixo,
md = LImd +
[ n
2 − FA
Fmd
]
Cmd = 40 +
[
60
2 − 14
20
]
10 = 48 cartas
Propriedades da me´dia, moda e mediana
Sejam X e Y duas varia´veis e k uma constante qualquer.
• Se X = Y ± k, enta˜o:
x¯ = y¯ ± k mo(x) = mo(y)± k md(x) = md(y)± k
• Se X = Y · k, enta˜o:
x¯ = y¯ · k mo(x) = mo(y) · k md(x) = md(y) · k
Relac¸a˜o entre me´dia, moda e mediana
A melhor medida de tendeˆncia central de um conjunto de dados depende frequentemente
do modo pelo qual os valores esta˜o distribu´ıdos:
Se sa˜o sime´tricos e unimodais: a me´dia, a mediana e a moda deveriam ser aproxima-
damente as mesmas (Figura 11a).
Se sa˜o sime´tricos e bimodais: a me´dia e a mediana seriam, mais uma vez, aproximada-
mente as mesmas. Nesse caso a me´dia e a mediana estariam entre os dois picos e seria, portanto,
uma medida improva´vel de ocorrer. Indica que os seus dados possuem dois subgrupos distin-
tos que diferem na caracter´ıstica medida; nessa situac¸a˜o seria melhor adotar as duas modas ou
tratar os dois subgrupos separadamente. Exemplo: Figura 10e.
28 Profs. Fla´vio

Outros materiais

Outros materiais