Buscar

Agrometerologia

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 156 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 156 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 156 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

GES101 - Estatística
Resumo do Livro Estatística Básica. Ed. 2
DANIEL FURTADO FERREIRA
UNIVERSIDADE FEDERAL DE LAVRAS
REITOR: José Roberto Soares Scolforo
VICE-REITOR: Édila Vilela de Resende Von Pinho
Diretoria Executiva
Renato Paiva (Diretor)
Conselho Editorial
Renato Paiva (Presidente)
Brígida de Souza
Flávio Meira Borém
Joelma Pereira
Luiz Antônio Augusto Gomes
GES101 - Estatística
Resumo do Livro Estatística Básica. Ed. 2
DANIEL FURTADO FERREIRA
Lavras - MG
© 2013 by Daniel Furtado Ferreira, 1a edição: 2013. 2a edição ampliada e revisada
Nenhuma parte desta publicação pode ser reproduzida, por qualquer meio ou forma, sem a autorização escrita
e prévia dos detentores do copyright.
Direitos de publicação reservados à Editora UFLA.
Impresso no Brasil - ISBN:
Editora UFLA
Campus Histórico - Caixa Postal 3037
37200-000 - Lavras - MG.
Tel: (35) 3829-1115 - Fax: (35) 3829-1551
E-mail: comercial.editora@editora.ufla.br - editora@editora.ufla.br
Homepage: www.editora.ufla.br
Projeto Gráfico: Daniel Furtado Ferreira
Secretaria: Mariana Coelho Alonso
Revisão de Texto:
Revisão de Referências Bibliográficas:
Editoração Eletrônica: Daniel Furtado Ferreira
Marketing e Comercialização: Quele Pereira de Gois
Capa: Daniel Furtado Ferreira
Ficha Catalográfica Preparada pela Divisão de Processos Técnicos
da Biblioteca da UFLA
Ferreira, Daniel Furtado.
Fundamentos de Matemática Estatística / Daniel Furtado Ferreira. – 2. ed.
Lavras : Ed. UFLA, 2013.
156 p. : il.
Bibliografia.
ISBN
1. Estatística. 2. Função geradora de momentos.
3. Probabilidades. 4. Distribuições multivariadas. 5. Função de
Distribuição. 6. Métodos de Estimação. I. Título.
CDD - 519.535
Sumário
Lista de Tabelas 8
Lista de Figuras 10
1 Introdução à Estatística 13
1.1 Tipos de Dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.2 População e Amostra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.3 Amostras Aleatórias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2 Estatística Descritiva 15
2.1 Coleta, Organização e Apresentação de Dados . . . . . . . . . . . . . . . . . . . 15
2.2 Medidas de tendência central . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.2.1 Média aritmética . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.2.2 Mediana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.2.3 Outras medidas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.3 Medidas de dispersão ou de variabilidade . . . . . . . . . . . . . . . . . . . . . 32
2.3.1 Amplitude . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
2.3.2 Variância . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
2.3.3 Desvio padrão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
2.3.4 Coeficiente de variação . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
2.3.5 Erro padrão da média . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
2.4 Estatísticas descritivas da distribuição . . . . . . . . . . . . . . . . . . . . . . . 36
2.4.1 Procedimentos gráficos . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
2.4.2 Momentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
2.4.3 Coeficiente de assimetria . . . . . . . . . . . . . . . . . . . . . . . . . . 37
2.4.4 Coeficiente de curtose . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
3 Amostragem 41
3.1 Amostragem probabilística e não probabilística . . . . . . . . . . . . . . . . . . . 41
3.2 Principais processos de amostragem probabilística . . . . . . . . . . . . . . . . . 42
3.2.1 Amostragem casual simples . . . . . . . . . . . . . . . . . . . . . . . . 42
3.2.2 Amostragem estratificada . . . . . . . . . . . . . . . . . . . . . . . . . . 43
3.2.3 Amostragem sistemática . . . . . . . . . . . . . . . . . . . . . . . . . . 47
3.2.4 Amostragem por conglomerado . . . . . . . . . . . . . . . . . . . . . . 47
4 Cálculo de Probabilidades e Suas Leis 49
4.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
4.2 Espaço Amostral e Eventos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
4.3 Definições de Probabilidade Não-Axiomáticas . . . . . . . . . . . . . . . . . . . . 51
4.4 Definições Axiomáticas de Probabilidades . . . . . . . . . . . . . . . . . . . . . 52
4.5 Propriedades das Probabilidades . . . . . . . . . . . . . . . . . . . . . . . . . . 53
4.6 Probabilidades Condicionais . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
4.7 Independência . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
4.8 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
5 Variáveis Aleatórias e Distribuição de Probabilidades 59
5.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
5.2 Definições Variáveis Aleatórias . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
5.3 Variáveis Aleatórias Discretas: Definição e Distribuição . . . . . . . . . . . . . 60
5.3.1 Exemplos de Distribuições de Variáveis Aleatórias Discretas . . . . . . . 63
5.4 Variáveis Aleatórias Contínuas: Definição e Distribuição . . . . . . . . . . . . . 68
5.4.1 Exemplos de Distribuições de Variáveis Aleatórias Contínuas . . . . . . 69
5.5 Função de Distribuição de Probabilidade . . . . . . . . . . . . . . . . . . . . . . 73
5.6 Distribuição Normal e Aproximação Normal da Binomial e Poisson . . . . . . . 74
5.7 Esperança Matemática e Suas Leis . . . . . . . . . . . . . . . . . . . . . . . . . 87
5.7.1 Definições Básicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
5.7.2 Exemplos para Variáveis Aleatórias Discretas . . . . . . . . . . . . . . . 89
5.7.3 Exemplos para Variáveis Aleatórias Contínuas . . . . . . . . . . . . . . . 91
5.8 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
6 Distribuições Amostrais 95
6.1 Distribuição amostral da média . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
6.2 Distribuição de Amostragem da Normal . . . . . . . . . . . . . . . . . . . . . . . 101
6.2.1 Média Amostral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
6.2.2 Distribuição Qui-quadrado . . . . . . . . . . . . . . . . . . . . . . . . . . 101
6.2.3 Distribuição F . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
6.2.4 Distribuição t de Student . . . . . . . . . . . . . . . . . . . . . . . . . . 105
6.3 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
7 Teoria da Estimação 111
7.1 Propriedades dos Estimadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
7.2 Estimação por intervalo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
7.3 Intervalo de confiança para a média de uma população normal . . . . . . . . . . 116
7.4 Dimensionamento de Amostras . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
7.5 Intervalos de Confiança Para Proporções Binomiais . . . . . . . . . . . . . . . . 120
7.6 Dimensionamento de Amostras para Estimar Proporções Binomiais . . . . . . . . 121
7.7 Inferências sobre variância e desvio padrão . . . . . . . . . . . . . . . . . . . . 123
7.8 Estimação da diferença de duas médias populacionais normais . . . . . . . . . . 124
8 Teoria da Decisão Estatística 131
8.1 Introdução aos testes estatísticos de hipóteses . . . . . . . . . . . . . . . . . . . . 131
8.1.1 Testes de hipótese sobre a média de uma população normal . . . . . . . . 139
8.1.2 Apresentação de resultados . . . . . . . . . . . . . . . . . . . . . . . . . 143
8.1.3 Dimensionamento de amostras . . . . . . . . . . . . . . . . . . . . . . . 144
Referências Bibliográficas 153
Índice Remissivo 155
Lista de Tabelas
2.1 Dados brutos obtidos numa amostra de 14 plantas da geração F2 do cruzamento de
uma planta de ervilha com sementes amarelas e lisas (AL) com outra de sementes
verdes erugosas (V R). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.2 Dados brutos da produção de grãos em g/planta obtidos numa amostra de n = 20
plantas de feijão da geração F2 dos cruzamentos das cultivares Flor de Maio e Carioca. 16
2.3 Dados brutos referentes ao número de ovos danificados em uma inspeção feita em
30 embalagens, de uma dúzia cada, em um carregamento para o mercado municipal
de Lavras proveniente de uma cidade distante. . . . . . . . . . . . . . . . . . . . 16
2.4 Dados elaborados obtidos numa amostra de 14 plantas da geração F2 do cruzamento
de uma planta de ervilha com sementes amarelas e lisas (AL) com outra de sementes
verdes e rugosas (V R). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.5 Dados elaborados da produção de grãos em g/planta obtidos numa amostra de
n = 20 plantas de feijão da geração F2 do cruzamento das cultivares Flor de Maio
e Carioca. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.6 Dados elaborados referentes ao número de ovos danificados em uma inspeção
feita em 30 embalagens de uma dúzia cada em um carregamento para o mercado
municipal de Lavras proveniente de uma cidade distante. . . . . . . . . . . . . . 17
2.7 Classes fenotípicas e suas respectivas frequências obtidas em uma amostra de
14 plantas da geração F2 do cruzamento de uma planta de ervilha com sementes
amarelas e lisas (AL) com outra de sementes verdes e rugosas (V R). . . . . . . . 18
2.8 Número de ovos danificados por dúzia, e as frequências, para cada valor de X
(xi), obtidas em uma inspeção feita em 30 embalagens de uma dúzia cada, em um
carregamento para o mercado municipal de Lavras, proveniente de uma cidade
distante. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.9 Critério empírico para determinar o número de classes (k) em função do tamanho
amostral (n). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.10 Distribuição de frequências das produções de grãos em g/planta obtidas numa
amostra de n = 20 plantas de feijão da geração F2 do cruzamento das cultivar Flor
de Maio e Carioca. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.11 Distribuição de frequências acumuladas das produções de grãos em g/planta obtidas
numa amostra de n = 20 plantas de feijão da geração F2 do cruzamento das
cultivares Flor de Maio e Carioca. . . . . . . . . . . . . . . . . . . . . . . . . . . 21
5.1 Probabilidades α da distribuição normal-padrão N(0, 1), para valores do quantil
Zα padronizado, de acordo com a seguinte afirmativa probabilística: P (0 < Z <
Zα) = α. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
8.1 Erros tipo I e II e as decisões tomadas corretamente para os testes de hipóteses com
suas respectivas probabilidades associadas entre parênteses. . . . . . . . . . . . . 134
8.2 Produtividade média diária de leite em kg para três diferentes raças de bovinos aos
6 anos de idade com os respectivos erros padrões (EP). . . . . . . . . . . . . . . 144
Lista de Figuras
2.1 Gráfico de setores (a) e gráfico de colunas (b) mostrando formas alternativas para
representar as classes fenotípicas da segregação F2 do cruzamento de plantas de
ervilha de sementes amarelas e lisas com plantas de ervilha de sementes verdes e
rugosas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.2 Histograma e polígono de frequências das produções de grãos em g/planta obtidas
numa amostra de n = 20 plantas de feijão da geração F2 do cruzamento das
cultivares Flor de Maio e Carioca. . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.3 Ogivas das produções de grãos em g/planta obtidas numa amostra de n = 20 plantas
de feijão da geração F2 do cruzamento das cultivares Flor de Maio e Carioca. . . . 21
2.4 Formas das distribuições de frequência em situações reais: (a) distribuição em
forma de U; (b) distribuição em forma de J invertido; (c) distribuição em forma de
sino simétrica; (d) distribuição assimétrica à direita; e (e) distribuição assimétrica à
esquerda. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
2.5 Formas das distribuições de frequência quanto ao grau de achatamento mostrando
as curvas leptocúrticas, mesocúrticas e platicúrticas. . . . . . . . . . . . . . . . . 39
3.1 Dois tipos de amostragem sistemática bidimensional mostrando a) gride quadrado
alinhado e b) gride quadrado não-alinhado. . . . . . . . . . . . . . . . . . . . . 47
5.1 Densidades de três distribuições normais com os seguintes parâmetros: (a) µ = 10
e σ2 = 1 ; (b) µ = 10 e σ2 = 6 ; e (c) µ = 25 e σ2 = 4. . . . . . . . . . . . . . . 75
5.2 Função de distribuição de probabilidade acumulada normal representando uma
função monótona crescente. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
5.3 As áreas hachuradas representam as probabilidades associada à Tabela 5.1, em que
P (0 < Z < z). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
5.4 Distribuição binomial para (a) n = 3, (b) n = 5, (c) n = 15 e (d) n = 20, com
probabilidade de sucesso p = 1/2. . . . . . . . . . . . . . . . . . . . . . . . . . 84
5.5 Distribuição binomial para (a) n = 3, (b) n = 5, (c) n = 15 e (d) n = 20, com
probabilidade de sucesso p = 1/4. . . . . . . . . . . . . . . . . . . . . . . . . . 85
6.1 Esquema da obtenção da distribuição amostral das médias amostrais X̄ a partir de
todas as k amostras de tamanho n retiradas de uma população qualquer, de tamanho
N , com média µ e variância σ2. . . . . . . . . . . . . . . . . . . . . . . . . . . 99
6.2 Distribuição qui-quadrado ilustrando o significado de χ2t para um determinado
valor da probabilidade α e dos graus de liberdade ν considerando a afirmativa
probabilística P (χ2 > χ2t ) = α. . . . . . . . . . . . . . . . . . . . . . . . . . . 104
6.3 Distribuição F ilustrando o significado do valor tabelado Ft para determinado valor
de α, dados os valores ν1 e ν2, considerando o enunciado probabilístico P (F > Ft)
= α. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
6.4 Funções densidades t de Student para ν = 1, 5, e 20 juntamente com a função
densidade da normal padrão, N(0, 1). . . . . . . . . . . . . . . . . . . . . . . . 107
6.5 Distribuição t, na qual se ilustra o significado do quantil superior tα para determi-
nados valores de 0 < α < 1 e ν > 0, considerando o enunciado probabilístico
P (t > tα) = α. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
8.1 Regiões críticas ou regiões de rejeição de H0 (RRH0) (hachuradas) e regiões de
não rejeição da hipótese nula (RNRH0) em função dos tipos de hipóteses testadas. 141
8.2 Regiões críticas (hachuradas) delimitadas por µc1 e µc2 de um teste bilateral de uma
hipótese de nulidade (H0 : µ = µ0) para o valor nominal da significância igual a α. 145
8.3 Poder do teste representado pela áreamarcada sobH0 : µ = µ0 falsa e considerando
um teste cujo valor nominal da significância é igual a α. . . . . . . . . . . . . . . 146
1
Introdução à Estatística
A investigação científica em muitas áreas se depara com a necessidade da coleta de dados de um
fenômeno a ser estudado. Esses dados possuem uma característica comum a inúmeros conjuntos
extraídos das mais diferentes áreas da investigação científica que é a variabilidade. Esta característica
tem diferentes origens e apresenta-se como a principal razão para a existência da estatística. A
variabilidade é estudada pelos estatísticos por meio dos modelos denominados probabilísticos. Os
dados possuem outra característica que é o seu tipo.
Uma característica medida em diferentes elementos ou entidades biológicas apresenta diferentes
valores de elemento para elemento e é conhecida como variável. A estatística neste livro será
usada para descrever os procedimentos de coletar, organizar, analisar e apresentar os resultados da
manipulação dos dados provenientes das investigaçõescientíficas.
O ramo da estatística que lida com a organização, o resumo e a apresentação dos dados é
denominado de estatística descritiva. A possibilidade de generalizar os resultados obtidos de certos
dados para um contexto maior pertence à parte da estatística conhecida como inferência estatística
ou estatística indutiva.
1.1 Tipos de Dados
Os dados coletados na investigação científica podem ser classificados como qualitativos ou
quantitativos. As variáveis ou dados qualitativos podem ser classificados ainda como nominais, para
os quais não existe nenhuma ordenação nas suas possíveis realizações, ou como ordinais, para as
quais os seus possíveis resultados podem ser ordenados por algum critério específico. Constitui-se
em um exemplo de dados nominais a classificação da cor da flor de uma espécie que pode ser
branca, violeta e vermelha. Já a variável altura de plantas, que pode assumir as classificações baixa,
média e alta, sendo um exemplo de dados qualitativos ordinais.
Fundamentos de Matemática Estatística Ferreira, D.F.
14 Introdução à Estatística
As variáveis quantitativas, ao contrário das qualitativas que apresentam as qualidades (ou
atributos) de um elemento pesquisado, representam as possíveis realizações como números,
resultantes de uma contagem ou mensuração. Portanto, seus valores representam um subconjunto
dos reais.
Essas variáveis podem ser divididas em dois tipos: (a) variáveis quantitativas discretas, cujas
possíveis realizações formam um conjunto finito ou enumerável de números, o qual é resultante,
geralmente, de contagem. (b) variáveis quantitativas contínuas, cujos possíveis valores formam
um intervalo de números reais resultantes, em geral, de mensurações. São exemplos de variáveis
contínuas: o peso de animais, o volume de árvores, o diâmetro de colmo de plantas de milho, o
peso de matéria verde ou de matéria seca de uma leguminosa, entre outros.
1.2 População e Amostra
A análise estatística é fundamentada na possibilidade de se obter conclusões sobre um grupo de
medidas de uma variável que está sendo estudada. O conjunto total de medidas, sobre o qual se
deseja retirar conclusões, é denominado de população. Um subconjunto de todas as medidas dessa
população é conhecido como amostra. Pelas conclusões obtidas na amostra, é possível realizar uma
extrapolação para as características da população da qual a amostra foi obtida.
Tem-se por objetivo na inferência estatística a realização de afirmações válidas sobre uma dada
característica da população, de interesse do investigador, com base nas informações colhidas dessa
população que foi amostrada.
Muitas formas de descrever as características de uma população existem e são baseadas em
medidas de tendência central, de dispersão ou de variação. Os valores das medidas de posição ou
de dispersão são denominados de parâmetros, se eles se referirem a quantidades populacionais. Se
essas quantidades se referem aos valores de uma amostra, então, são denominadas estimativas e as
expressões matemáticas, que são funções das mensurações amostrais, estimadores ou estatísticas.
Nas convenções estatísticas, parâmetros são representados por letras gregas e estatísticas amostrais,
por letras latinas. Também, são utilizados os símbolosN e n, para definir o tamanho de populações
finitas e para representar o tamanho da amostra, respectivamente.
1.3 Amostras Aleatórias
Para a validade das conclusões que são feitas a respeito da população, em razão das inúmeras
maneiras existentes de se extraírem as amostras de uma população, é necessário que as amostras
sejam aleatórias. Para amostrar a população aleatoriamente é necessário que cada membro da
população tenha probabilidade conhecida e não nula de ser sorteado e que os elementos sejam
independentemente selecionados. Em outras palavras, além de cada indivíduo possuir chance não
nula de pertencer à amostra, a seleção de um deles, de forma alguma, irá influenciar a seleção de
outro. Isso, em geral, é conseguido por meio de sorteio.
Ferreira, D.F. Fundamentos de Matemática Estatística
2
Estatística Descritiva
A parte da estatística que lida com a organização, resumo e apresentação de dados é denominada
de estatística descritiva. O investigador, ao fazer tais análises, pode estar usando dados provenientes
de uma população finita ou de uma amostra aleatória. Essa caracterização e apresentação de dados
de uma forma resumida e elucidativa são referidas por Tukey (1977) como análise exploratória de
dados.
Estas técnicas visam, dentre outros objetivos, à detecção de padrões de interesse nos dados e a
sua representação. A forma de tratar os dados de uma investigação científica nessa fase exploratória
depende da natureza desses dados: qualitativos (nominais ou ordinais) ou quantitativos (discretos
ou contínuos). De maneira geral, a apresentação dos dados pode ser feita por tabelas, gráficos e
medidas descritivas de posição, de dispersão e da natureza da distribuição de frequência.
2.1 Coleta, Organização e Apresentação de Dados
As mensurações que são realizadas em uma característica de interesse na população ou na
amostra possuem uma característica fundamental denominada de variação. Esses dados são
chamados de variáveis aleatórias, que são representadas, geralmente, pelas letras X , Y ,W e Z,
maiúsculas. As realizações (valores) dessas variáveis em um dado elemento da população são
representadas pelas respectivas letras minúsculas: x, y, w e z.
As representações descritivas de tais dados dependem da natureza (tipo) da variável que está
sendo tratada. A partir da coleta, tem-se as seguintes nomenclaturas para cada etapa.
a) Dados brutos: são os dados coletados sem que haja algum tipo de tratamento nos mesmos,
como ordenação ou qualquer tipo de arranjo sistemático.
Um exemplo em que uma geração genética denominada F2 foi obtida do cruzamento de plantas
de ervilhas. O genitor feminino apresentava sementes amarelas e lisas e o genitor masculino
Fundamentos de Matemática Estatística Ferreira, D.F.
16 Estatística Descritiva
sementes verdes e rugosas.
As siglas AL, AR, VL e VR significam plantas com sementes amarelas ou verdes, primeira letra
(A ou V) e sementes lisas ou rugosas, segunda letra (L ou R). Esse exemplo é um caso típico de
dados qualitativos nominais.
Tabela 2.1. Dados brutos obtidos numa amostra de 14 plantas da geração F2 do cruzamento de uma
planta de ervilha com sementes amarelas e lisas (AL) com outra de sementes verdes e
rugosas (V R).
AL AL V L AL AR V L V R
AL V L AL AL AR AR AL
Um segundo exemplo, agora de dados quantitativos contínuos, refere-se a uma amostra de
n = 20 plantas de uma geração F2 originária do cruzamento das cultivares Flor de Maio e
Carioca. Esses dados referem-se à produção de grãos em g/planta e estão apresentados na Tabela
2.2.
Tabela 2.2. Dados brutos da produção de grãos em g/planta obtidos numa amostra de n = 20
plantas de feijão da geração F2 dos cruzamentos das cultivares Flor de Maio e Carioca.
3,65 21,26 3,87 24,57 1,38
5,67 9,79 12,56 4,54 6,79
13,19 4,14 3,78 15,60 6,23
12,13 17,12 19,68 5,64 8,21
Finalmente, o terceiro exemplo, em que o investigador fez a coleta dos dados e não os organizou
ainda, refere-se a dados quantitativos discretos da contagem de ovos danificados. No mercado
municipal da cidade de Lavras, ao chegar um carregamento de ovos de uma cidade distante,
os lojistas fizeram uma amostragem e inspecionaram 30 dúzias anotando o número de ovos
danificados em cada uma delas. Os resultados do número de ovos danificados em cada dúzia
(embalagem) estão apresentados na Tabela 2.3.
Tabela 2.3. Dados brutos referentes ao número de ovos danificados em uma inspeção feita em 30
embalagens, de uma dúzia cada, em um carregamento para o mercado municipal de
Lavras proveniente de uma cidade distante.
0 0 1 1 1
3 0 0 0 0
2 3 3 0 0
1 5 4 1 2
2 1 1 1 0
0 0 0 1 0
Essa representação dos dados: pouco informativa.
b) Dados elaborados: consiste em ordenar os dados em uma sequência crescente ou decrescente
ou agrupá-los quanto as suas categoriasou atributos. As Tabelas 2.4, 2.5 e 2.6 contêm os
dados das Tabelas 2.1, 2.2 e 2.3, respectivamente, nessa nova organização. Na Tabela 2.4 são
apresentados os atributos agrupados por tipos, das respectivas plantas que os possuem.
Ferreira, D.F. Fundamentos de Matemática Estatística
2.1 Coleta, Organização e Apresentação de Dados 17
Tabela 2.4. Dados elaborados obtidos numa amostra de 14 plantas da geração F2 do cruzamento
de uma planta de ervilha com sementes amarelas e lisas (AL) com outra de sementes
verdes e rugosas (V R).
AL AL AL AL AL AL AL
AR AR AR V L V L V L V R
Na Tabela 2.5, encontram se os dados da produção de grãos em g/planta ordenados de forma
crescente por coluna. É interessante observar que essa representação facilita a obtenção de
algumas características desses dados de imediato, quais sejam, a menor produtividade (1,38 g) e
a maior produtividade (24,57 g).
Tabela 2.5. Dados elaborados da produção de grãos em g/planta obtidos numa amostra de n = 20
plantas de feijão da geração F2 do cruzamento das cultivares Flor de Maio e Carioca.
1,38 4,14 6,23 12,13 17,12
3,65 4,54 6,79 12,56 19,68
3,78 5,64 8,21 13,19 21,26
3,87 5,67 9,79 15,60 24,57
Finalmente, na Tabela 2.6, estão apresentados os dados do número de ovos danificados na
amostra de 30 dúzias do carregamento. É importante salientar que essas representações não são,
ainda, a melhor forma de apresentar os dados.
Tabela 2.6. Dados elaborados referentes ao número de ovos danificados em uma inspeção feita em
30 embalagens de uma dúzia cada em um carregamento para o mercado municipal de
Lavras proveniente de uma cidade distante.
0 0 0 1 2
0 0 1 1 3
0 0 1 1 3
0 0 1 1 3
0 0 1 2 4
0 0 1 2 5
Há ainda possibilidade e necessidade de resumir os dados, sem perda de muita informação
contida neles. Sendo assim, para os dados qualitativos nominais e para os quantitativos discretos,
percebe-se que estes podem ser resumidos agrupando suas categorias e apresentando os resultados
obtidos em tabelas ou gráficos. Os dados qualitativos nominais das classes fenotípicas das sementes
de ervilhas estão apresentados na Tabela 2.7 e na Figura 2.1 (a) e (b).
Na Tabela 2.8, estão apresentados os dados referentes ao número de ovos danificados em uma
inspeção feita em n = 30 embalagens de uma dúzia cada, em um carregamento para o mercado
municipal de Lavras. Esses dados podem ser agrupados de uma forma similar aos dados da ervilha
por existir apenas 6 categorias definidas (0, 1, · · · , 5). Representações gráficas similares à realizada
para os dados da Tabela 2.7, Figuras 2.1 (a) e (b), podem ser realizadas nesse caso também, mas
não estão apresentadas aqui.
Ao se lidar com os dados quantitativos apresentados na Tabela 2.5, verifica-se que não é possível
Fundamentos de Matemática Estatística Ferreira, D.F.
18 Estatística Descritiva
Tabela 2.7. Classes fenotípicas e suas respectivas frequências obtidas em uma amostra de 14 plantas
da geração F2 do cruzamento de uma planta de ervilha com sementes amarelas e lisas
(AL) com outra de sementes verdes e rugosas (V R).
Classe Fenotípica Frequências (Fi)
AL 7
AR 3
VL 3
VR 1
V R
7 . 1 4 %
V L
2 1 . 4 3 %
A R
2 1 . 4 3 %
A L
5 0 % A L A R V L V R0
1
2
3
4
5
6
7
��
�	�

�
���
�������
(a) (b)
Figura 2.1. Gráfico de setores (a) e gráfico de colunas (b) mostrando formas alternativas para
representar as classes fenotípicas da segregação F2 do cruzamento de plantas de ervilha
de sementes amarelas e lisas com plantas de ervilha de sementes verdes e rugosas.
efetuar o mesmo tipo de tratamento dispensado aos dados qualitativos e aos dados quantitativos
discretos. Para resolver o problema de apresentar a distribuição de dados quantitativos contínuos
de uma forma resumida e manter o máximo da informação contida nela, será realizada o que
denomina-se de distribuição de frequências. Nesse tipo de representação, os dados quantitativos
contínuos são agrupados em classes de valores, sendo computadas as respectivas frequências de
cada uma. O grande problema dessa representação é definir o número de classes ideal para agrupar
um conjunto de dados de uma amostra. Uma má definição trará como consequências deficiências
na representatividade dessa amostra e caracterização incorreta da natureza da distribuição e das
medidas de posição e dispersão. A seguir, são descritos os principais passos para se obter uma
distribuição de frequências, ilustrando-os com os dados do exemplo apresentado na Tabela 2.5.
Tabela 2.8. Número de ovos danificados por dúzia, e as frequências, para cada valor de X
(xi), obtidas em uma inspeção feita em 30 embalagens de uma dúzia cada, em um
carregamento para o mercado municipal de Lavras, proveniente de uma cidade distante.
Número de ovos quebrados (xi) Frequências (Fi)
0 13
1 9
2 3
3 3
4 1
5 1
Ferreira, D.F. Fundamentos de Matemática Estatística
2.1 Coleta, Organização e Apresentação de Dados 19
A primeira pergunta que deve ser respondida é de qual deve ser o número de classes (k) que
são formadas para sumariar os dados. Um critério empírico para isso baseia-se numa função do
tamanho amostral. Este critério está apresentado na Tabela 2.9.
Tabela 2.9. Critério empírico para determinar o número de classes (k) em função do tamanho
amostral (n).
Tamanho da amostra (n) Número de classes (k)
Até 100
√
n (inteiro mais próximo)
Acima de 100 5 log10(n) (inteiro mais próximo)
Em seguida computa-se a amplitude total A por:
A = X(n) −X(1). (2.1.1)
A representação X(i), que aparece em 2.1.1, em que o índice se encontra dentro de parênteses,
refere-se ao valor da variável X cuja ordem na amostra ordenada de forma crescente é igual a i.
Essas estatísticas são chamadas de estatísticas de ordem. Assim, X(1) é a estatística de ordem do
menor valor e X(n) é a do maior.
Para o exemplo, tem-se:
A = X(n) −X(1) = 24,57− 1,38 = 23,19.
Aplicando uma das fórmulas empíricas na Tabela 2.9, é possível determinar o número de classes,
que é k =
√
20 = 4,47 ≈ 4.
O próximo passo consiste em determinar a amplitude de uma classe específica, que é representada
por c. Por construção, considera-se que todas as classes têm a mesma amplitude. Dessa forma, a
regra para determinar a amplitude de classe c é dada por:
c =
A
k − 1
(2.1.2)
A razão para que o denominador da divisão seja k − 1 ao invés de k é explicada por uma
correção que é feita no limite inferior da primeira classe, considerando-se um valor menor queX(1).
Essa correção é justificada pela suposição de que a amostra de tamanho n tem grande chance de não
conter o valor mínimo da população. Para o exemplo, c = 7,73. Com base nisso, o limite inferior
da primeira classe (LI1) é definido por:
LI1 = X(1) −
c
2
, (2.1.3)
que para o exemplo é LI1 = −2,49.
O limite superior da primeira classe é então obtido somando-se, ao limite inferior dessa classe,
a amplitude de classe. O limite inferior da segunda classe é igualado ao limite superior da primeira
classe. O limite superior dessa classe é obtido somando-se a amplitude de classe ao limite inferior.
Fundamentos de Matemática Estatística Ferreira, D.F.
20 Estatística Descritiva
O processo é repetido para formar as demais classes, devendo ser interrompido quando a última
classe (k) for formada. Em seguida, são computadas as frequências dos indivíduos pertencentes a
cada classe (Fi, i = 1, 2, · · · , k) inspecionando-se os dados elaborados. As frequências relativas
(Fri) e percentuais (Fpi) são computadas e apresentadas na chamada tabela de distribuição de
frequências. Os resultados da distribuição de frequência dos dados da Tabela 2.5 estão apresentados
na Tabela 2.10. O símbolo `, usado para representar as classes, indica que o limite inferior, caso
ocorra na amostra, deverá ser computado para a classe atual e que o limite superior, caso ocorra,
deve ser computado para a classe seguinte. O ponto médio da classe i (X̄i) é calculado pela média
dos limites de classe.
Tabela 2.10. Distribuição de frequências das produções de grãos em g/planta obtidas numa amostra
de n = 20 plantas de feijão dageração F2 do cruzamento das cultivar Flor de Maio e
Carioca.
Classes de peso x̄i Fi Fri Fpi(%)
−2,49 ` 5,25 1,38 6 0,30 30
5,25 ` 12,98 9,11 8 0,40 40
12,98 ` 20,71 16,84 4 0,20 20
20,71 ` 28,44 24,57 2 0,10 10
A representação gráfica dos dados apresentados na Tabela 2.10 é feita por meio do histograma e
polígono de frequências. O histograma é um gráfico de colunas cujas bases são proporcionais aos
intervalos de classe, e a altura a uma medida denominada densidade (f ), que é dada por: fi = Fi/ci.
No caso de amplitudes de classes iguais, o valor de c é constante para todas as classes, podendo
ser ignorado na construção do histograma. O polígono de frequências, por sua vez, é uma linha
poligonal que liga os pontos médios das classes nas ordenadas correspondentes às suas densidades
ou a suas frequências. O polígono de frequências e o histograma para os dados da Tabela 2.5 estão
apresentados na Figura 2.2.
- 1 4 . 0 8 - 6 . 3 5 1 . 3 8 9 . 1 1 1 6 . 8 4 2 4 . 5 7 3 2 . 3 0 4 0 . 0 3
0
1
2
3
4
5
6
7
8
9
������
����
�����
����
���������	��
���
��
���
�	
��������
��������
��������
Figura 2.2. Histograma e polígono de frequências das produções de grãos em g/planta obtidas numa
amostra de n = 20 plantas de feijão da geração F2 do cruzamento das cultivares Flor de
Maio e Carioca.
Outro tipo de representação dos dados contínuos é o do acúmulo das frequências para uma
Ferreira, D.F. Fundamentos de Matemática Estatística
2.1 Coleta, Organização e Apresentação de Dados 21
leitura rápida da proporção de dados que superam um determinado valor ou de quantos são inferiores
a este valor. Esse tipo de representação é denominado de distribuição de frequências acumuladas,
cujas representações gráficas correspondentes são denominadas de ogivas. Para construção dessa
distribuição, tomam-se os limites de classes e avaliam-se as quantidades acumuladas de elementos
amostrais que superam ou que são inferiores a esses limites. Na Tabela 2.11 estão apresentadas as
distribuições de frequências acumuladas dos dados de produtividades em g/plantas da Tabela 2.5.
A representação das frequências acumuladas está na Figura 2.3.
Tabela 2.11. Distribuição de frequências acumuladas das produções de grãos em g/planta obtidas
numa amostra de n = 20 plantas de feijão da geração F2 do cruzamento das cultivares
Flor de Maio e Carioca.
Limites (xi) FC(X < xi) FC(X ≥ xi)
−2,49 0 20
5,25 6 14
12,98 14 6
20,71 18 2
28,44 20 0
- 2 . 4 9 5 . 2 4 1 2 . 9 7 2 0 . 7 0 2 8 . 4 3
0
2
4
6
8
1 0
1 2
1 4
1 6
1 8
2 0
2 2
2 4
���
���
��
�
�
���
	�
���
�
P r o d u t i v i d a d e s ( g / p l a n t a )
 F C ( X < x i )
 F C ( X > x i )
Figura 2.3. Ogivas das produções de grãos em g/planta obtidas numa amostra de n = 20 plantas de
feijão da geração F2 do cruzamento das cultivares Flor de Maio e Carioca.
Fundamentos de Matemática Estatística Ferreira, D.F.
22 Estatística Descritiva
2.2 Medidas de tendência central
Pela concentração de dados de um conjunto de mensurações nas proximidades de alguns valores,
verifica-se que esses valores podem ser usados para representar todos os dados. Em outras palavras,
é possível afirmar que alguns valores podem ser representantes do conjunto de mensurações. Eles
são denominados de medidas de posição ou medidas de tendência central. A escolha de um tipo de
medida de posição depende principalmente da natureza da distribuição das mensurações, do tipo de
dado e das propriedades dos valores escolhidos. O termo medida de posição é usado para indicar,
ao longo da escala de medidas, onde a amostra ou população está locada.
Entre os vários tipos de medidas de posição destacam-se a média, a mediana e a moda. Outros
tipos, menos comuns, eventualmente são usados. Esses parâmetros são úteis por descreverem
propriedades da população. Nesta seção, serão discutidos tais parâmetros e os seus estimadores.
2.2.1 Média aritmética
A medida de posição mais comum, utilizada de forma intensa e extensiva, é a média aritmética,
geralmente denominada simplesmente por média. O conceito de média aritmética é familiar e
poderia se dizer, até mesmo, intuitivo: a média é a soma de todas as observações dividida pelo
número de dados envolvidos.
Cada variável na população será referenciada pelo valor Xi (leia-se X índice i). Então, a
primeira medida será X1; a segunda X2; a terceira X3; e assim sucessivamente. O subscrito i terá
uma amplitude de valores de 1 a N , o número total de valores da população, considerada finita.
Para indicar a soma dos valores de um conjunto de dados de uma forma concisa, será usada
a notação de somatório, representada pela letra maiúscula sigma (Σ), acompanhada do índice de
variação dos elementos que deverão ser somados:
N∑
i=1
Xi = X1 +X2 + · · ·+XN (2.2.1)
A média de uma população é representada pela letra grega minúscula µ, sendo definida para
populações finitas por:
µ =
N∑
i=1
Xi
N
=
X1 +X2 + · · ·+XN
N
(2.2.2)
O mais eficiente, não viesado e consistente estimador da média populacional é a média amostral,
representada por X̄ (leia-se X barra). O tamanho amostral será representado por n. A média
amostral (X̄) é definida por:
X̄ =
n∑
i=1
Xi
n
=
X1 +X2 + · · ·+Xn
n
(2.2.3)
Para os dados agrupados em uma tabela de distribuição de frequência, como por exemplo, os
Ferreira, D.F. Fundamentos de Matemática Estatística
2.2 Medidas de tendência central 23
dados da Tabela 2.10, a média deve ser obtida ponderando-se o valor médio da classe pela sua
respectiva frequência:
X̄ =
k∑
i=1
FiX̄i
n
(2.2.4)
em que X̄i é o ponto médio e Fi é a frequência da classe i, para i = 1, 2, · · · , k; e k é o número de
classes.
O estimador da média, considerando dados quantitativos discretos, é dado por:
X̄ =
k∑
i=1
FiXi
n
, (2.2.5)
em que k representa o número de categorias apresentadas pela variável discreta.
Tipicamente, para os dados da Tabela 2.8, pode-se verificar que o estimador 2.2.5 deve ser
usado. Nesse caso, k refere-se ao número de categorias, ou atributos, ou valores que os dados
podem ser classificados e Fi a frequência de cada uma dessas categorias. Para o exemplo dos dados
da Tabela 2.8, os valores de Xi variam de 0 a 5 ovos quebrados, tendo, portanto, 6 valores ou
categorias. Nesse caso, o valor de i é igual a 1 para o valor deX igual a 0, 2 para o valor 1, e assim
sucessivamente. Logo, X1 = 0, X2 = 1, e assim sucessivamente até X6 = 5, cujas frequências
são F1 = 13, F2 = 9 até F6 = 1.
Exemplo 2.1: Cálculo da média
Ilustrar o cálculo da média para os dados da Tabela 2.2 e 2.10 usando as expressões 2.2.3 e
2.2.4. Qual é a estimativa mais precisa? Qual é a razão da diferença entre elas?
Dados brutos da Tabela 2.2:
X̄ =
3,65 + 5,67 + · · ·+ 8,21
20
=
199,8
20
= 9,99
Dados agrupados da Tabela 2.10:
X̄ =
1,38× 6 + 9,11× 8 + 16,84× 4 + 24,57× 2
20
=
197,66
20
= 9,883
A estimativa mais precisa é obviamente a primeira, uma vez que, no segundo caso, os
pontos médios das classes, obtidos pela média dos limites dessas classes, foram usados
para representá-las. Essa é a principal razão da diferença e é conhecida como hipótese
tabular básica (HTB). Apesar das diferenças que foram encontradas, é possível utilizar o
estimador de dados agrupados em distribuições de frequências na ausência dos dados brutos
ou elaborados, uma vez que a perda de precisão, na maioria das situações, é considerada
desprezível.
Fundamentos de Matemática Estatística Ferreira, D.F.
24 Estatística Descritiva
A média possui as seguintes propriedades:
i) A soma dos desvios em relação à média é igual a zero para qualquer amostra:
n∑
i=1
(Xi − X̄) = 0
Demonstração:
n∑
i=1
(Xi − X̄) =
n∑
i=1
Xi −
n∑
i=1
X̄ =
n∑
i=1
Xi − nX̄.
Substituindo a definição da média amostral definida em 2.2.3 nessa expressão tem-se:
n∑
i=1
(Xi − X̄) =
n∑
i=1
Xi −
n
n∑
i=1
Xi
n
=
n∑
i=1
Xi −
n∑
i=1
Xi = 0 c.q.d.
ii) A soma de quadrados de desvios em relação a uma constante arbitrária A, qualquer, será um
valor mínimo se A = X̄ .
Fazendo:
D =
n∑
i=1
(Xi −A)2
Expandindo o somatório e derivandoD em relação a A tem-se:
D =
n∑
i=1
(Xi −A)2 =
n∑
i=1
(X2i − 2AXi +A2)
=
n∑
i=1
X2i −
n∑
i=1
2AXi +
n∑
i=1
A2
=
n∑
i=1
X2i − 2A
n∑
i=1
Xi + nA
2
dD
dA
= −2
n∑
i=1
Xi + 2nA
Igualando a derivada a zero, e resolvendo em relação a A, tem-se:
dD
dA
= −2
n∑
i=1
Xi + 2nA = 0
2nA = 2
n∑
i=1
Xi
Ferreira, D.F. Fundamentos de Matemática Estatística
2.2 Medidas de tendência central 25
A =
n∑
i=1
Xi
n
= X̄
O ponto ótimo, obtido igualando a derivada primeira a zero, pode ser de máximo, de mínimo
ou de inflexão. Para certificar-se de que o valor de D é um valor mínimo, quando A é igual à
média amostral, basta mostrar que a segunda derivada é positiva. A segunda derivada deD em
relação a A é dada por:
d2D
dA2
= 2n > 0
ou seja, a segunda derivada para qualquer tamanho de amostra será positiva.
iii) A soma ou subtração de uma constante (k) aos dados altera a média de tal forma que a nova
média é igual a média dos dados originais adicionada ou subtraída pela constante.
Sejam os novos dados obtidos pela adição ou subtração da constante k (Yi = Xi ± k) e a
média da amostra original dada por X̄ =
∑n
i=1Xi/n, então a nova média será
Ȳ =
n∑
i=1
Yi
n
=
n∑
i=1
(Xi ± k)
n
=
=
n∑
i=1
Xi
n
±
n∑
i=1
k
n
= X̄ ± nk
n
= X̄ ± k c.q.d.
iv) A multiplicação dos dados ou divisão por uma constante (k) aos dados altera a média de tal
forma que a nova média é igual a média dos dados originais multiplicada ou dividida pela
constante.
Sejam os novos dados obtidos pela multiplicação da constante k, com k ∈ R, ou seja, Yi = kXi
e a média da amostra original dada por X̄ =
∑n
i=1Xi/n, então a nova média será
Ȳ =
n∑
i=1
Yi
n
=
n∑
i=1
(kXi)
n
=
k
n∑
i=1
Xi
n
= kX̄ c.q.d.
v) A média é influenciada por valores extremos. A média tenderá a ser grande, se existirem alguns
poucos valores que são maiores que a maioria das mensurações realizadas, ou a ser pequena,
se existirem na amostra alguns poucos valores menores que a maioria das mensurações.
2.2.2 Mediana
A mediana é uma medida típica de tendência central, sendo definida em um conjunto de dados
ordenados como o valor central, ou seja, o valor para o qual há o mesmo número de mensurações
que o superam quanto são superados por ele. A mediana amostral (md) é o melhor estimador da
mediana populacional (µd). Nas distribuições simétricas, a mediana também é um estimador não
Fundamentos de Matemática Estatística Ferreira, D.F.
26 Estatística Descritiva
viciado e consistente da média µ, embora não seja tão eficiente como X̄ .
Para a estimação da mediana, é necessário ordenar-se os dados e obter os dados elaborados.
Essa ordem pode ser crescente ou decrescente, embora, no presente trabalho, sejam consideradas
somente as ordens crescentes. O estimador da mediana populacional (µd) é dado por:
md =

X(n+12 )
se n for ímpar
X(n2 )
+X(n+22 )
2
se n for par
(2.2.6)
Para estimar a mediana a partir dos dados arranjados em uma tabela de distribuição de
frequências; é necessário definir a classe mediana e em seguida encontrar a mediana interpolando
os resultados. A posição mediana é obtida acumulando-se frequências das classes 1, 2, etc., até
encontrar o valor que seja igual ou imediatamente superior a n/2. Para ilustrar o processo, os dados
da Tabela 2.10 foram considerados. O valor de n é igual a 20, e n/2 é igual a 10. A frequência da
classe 1 é igual a 6, valor inferior a 10; a frequência acumulada das classes 1 e 2 é igual a 14, que
supera 10. Logo, a classe 2 é considerada a classe mediana. Sendo encontrada a classe mediana, o
estimador da mediana populacional é dado por:
md = LImd +
0,5n− Fc
Fmd
cmd (2.2.7)
em que LImd, Fmd e cmd referem-se ao limite inferior, frequência e amplitude de classe da classe
mediana; Fc é a frequência acumulada das classes anteriores à classe mediana. Se a primeira classe
for a classe mediana, Fc será igual a 0.
A mediana é um estimador menos informativo que a média, pois só considera os postos
(posições) das observações e não os valores, como faz a média. No entanto, a mediana pode, em
algumas ocasiões, ser mais vantajosa que a média pelo fato de não ser afetada pelos extremos.
Assim, se as distribuições são assimétricas, a mediana pode ser uma melhor medida de tendência
central.
Exemplo 2.2: Mediana
Calcular a mediana dos dados das Tabelas 2.5, 2.8 e 2.10.
Dados da Tabela 2.5: n = 20 (par)
md =
X(n2 )
+X(n+22 )
2
=
X(10) +X(11)
2
=
6,79 + 8,21
2
= 7,50 g/planta
Dados da Tabela 2.8: n = 30 (par)
md =
X(n2 )
+X(n+22 )
2
=
X(15) +X(16)
2
=
1 + 1
2
= 1 ovo quebrado/dúzia
Verifica-se na Tabela 2.10: n = 20; posição mediana n/2 = 10; classe mediana é a 2a.
Ferreira, D.F. Fundamentos de Matemática Estatística
2.2 Medidas de tendência central 27
Logo,
md = LImd +
0,5n− Fc
Fmd
cmd = 5,25 +
10− 6
8
× 7,73 = 9,115 g/planta
A mediana possui as seguintes propriedades:
i) A soma dos módulos dos desvios em relação a uma constante arbitrária A, qualquer, será um
valor mínimo se A = md.
D =
n∑
i=1
|Xi −A| será um ponto de mínimo se A = md.
A prova dessa afirmativa é dada a seguir. Pode-se escrever D com uso da função indicadora,
IB(x), que retorna 1, se x ∈ B e 0, caso contrário, por
D =
n∑
i=1
|Xi −A| =
n∑
i=1
[
(Xi −A)I(A,∞)(Xi −A)− (Xi −A)I(−∞,A](Xi −A)
]
.
Assim, a derivada de primeira ordem de D em relação a A é
dD
dA
=
n∑
i=1
[
−I(A,∞)(Xi −A) + I(−∞,A](Xi −A)
]
.
Portanto, fazendo dD/dA = 0, temos
−
n∑
i=1
I(A,∞)(Xi −A) +
n∑
i=1
I(−∞,A](Xi −A) =0
−n+ + n− =0
n− =n+,
em que n− e n+ são o número de valoresXi’s inferiores e superiores a A, respectivamente, na
amostra de tamanho n.
Essa igualdade só ocorrerá, no caso de n par, se A for um valor entre X(n/2) e X((n+2)/2).
Logo, a escolha natural de A é
A =md =
X(n2 )
+X(n+22 )
2
.
Por outro lado, se n for ímpar, n− = n+ se A for igual a
A =md = X(n+12 )
,
ficando completa a prova.
Fundamentos de Matemática Estatística Ferreira, D.F.
28 Estatística Descritiva
ii) A soma ou subtração de uma constante (k) aos dados altera a mediana de tal forma que a nova
mediana é igual a mediana dos dados originais adicionada ou subtraída pela constante.
Seja o i-ésimo novo dado amostral dado por Yi = Xi ± k, então
mdY = mdX ± k
iii) A multiplicação dos dados ou divisão por uma constante (k) aos dados altera a mediana de tal
forma que a nova mediana é igual a mediana dos dados originais multiplicada ou dividida pela
constante.
Sejam os novos dados obtidos pela adição ou subtração da constante k (Yi = kXi, com k ∈ R)
e a mediana da amostra original dada pormdX , então a nova mediana será
mdY = kmdX
iv) A mediana não é influenciada por valores extremos.
2.2.3 Outras medidas
Outras medidas de posição podem ser destacadas. Embora essas medidas sejam de uso menos
frequente, elas são abordadas por apresentarem relevâncias em situações específicas e por, nessas
ocasiões, se apresentarem como as medidas mais apropriadas para serem usadas. A moda é uma
dessas medidas típicas de tendência central, sendo definida de uma forma mais grosseira em um
conjunto de dados como o valor mais frequente. Uma melhor definição poderia ser dada por aquele
valor da variável em que há a mais densa concentração de valores na sua proximidade. A moda
amostral (mo) é o melhor estimador da moda populacional (µo). O processo de estimação da moda
de uma variável aleatória não é uma questão simples de ser respondida e depende da natureza dos
dados.
Para dados qualitativos nominais ou ordinais e para dados quantitativos discretos a definição de
moda, valor mais frequente da amostra, é usada para a estimação da moda populacional. Assim
aquele valor que mais se repete (mais frequente) na amostra será considerado como a moda amostral
dos dados. Naturalmente, é fácil perceber que um conjunto de dados desse tipo pode ter mais de
uma moda, ou até mesmo não apresentar moda, uma vez que nenhum valor se repete. Para ilustrar
o conceito de moda apresentado, considerar os dados da Tabela 2.7 e 2.8. A moda do primeiro
conjunto é o fenótipo “Amarelae Lisa”, pois apresenta a maior frequência (7) quando comparada
com as frequências das demais classes. Para o segundo conjunto de dados a moda é igual a 0, uma
vez que esse valor ocorreu em 13 das 30 embalagens, sendo o de maior frequência.
Para dados quantitativos contínuos, a definição de moda como o valor mais frequente de uma
amostra se torna inadequada. Nesse contexto, uma estimação da densidade dos valores da variável
sob estudo é necessária. Existem na literatura vários métodos de se estimarem densidades. Dentre
eles pode-se citar o histograma (polígono de frequências) e o estimador de “kernel”. O primeiro é
mais simples e foi apresentado na seção 2.1. Dessa forma, pode se definir a moda como o valor de
Ferreira, D.F. Fundamentos de Matemática Estatística
2.2 Medidas de tendência central 29
maior densidade, ou seja, a moda seria aquele valor da distribuição cuja frequência seria máxima,
ou ainda o ponto de máximo do polígono de frequências. Para encontrar tal valor pode-se utilizar
um estimador apropriado usando esse conceito e considerando a influência das classes vizinhas à
classe que a moda pertence.
Para estimar a moda é preciso, inicialmente, mencionar que a classe modal da distribuição
de frequências, classe na qual a moda está inserida, é aquela de maior frequência dentre todas
as classes. Se todas as classes tiverem as mesmas frequências, a distribuição não terá moda. Se
duas ou mais classes apresentarem frequências mais elevadas e idênticas, então a distribuição será
multimodal (bimodal, trimodal, etc.). O estimador da moda é dado por:
mo = LImo +
∆1
∆1 + ∆2
cmo (2.2.8)
em que LImo e cmo são o limite inferior e a amplitude da classe modal; ∆1 e ∆2 são as diferenças
entre as frequências da classe modal e da imediatamente inferior e da imediatamente posterior,
respectivamente.
A principal ideia desse estimador é apresentar uma medida que considera a classe de maior
frequência e ainda considera a influência da frequência das classes vizinhas. Se as classes anterior e
posterior à classe modal tiverem a mesma frequência, então a moda será o ponto médio da classe;
caso contrário, a moda tenderá para o limite inferior ou superior da classe modal à medida que o
valor da frequência da classe anterior for maior que a da posterior ou frequência da classe posterior
for maior que a da anterior, respectivamente.
E
D
C
B
A
∆
2
∆
1
m o L S m oL I m o
Exemplo 2.3: Moda
Estimar a moda para os dados da Tabela 2.10 usando a expressão 2.2.8.
A classe modal é a segunda, pois sua frequência (8) é a maior de todas as classes. Assim, a
moda pertence à segunda classe. Os valores necessários para utilizar a expressão 2.2.8 são:
∆1 = 8− 6 = 2; ∆2 = 8− 4 = 4; LImo = 5,25; e cmo = 12,98− 5,25 = 7,73, logo,
mo = LImo +
∆1
∆1 + ∆2
cmo = 5,25 +
2
2 + 4
× 7,73 = 7,8267
Fundamentos de Matemática Estatística Ferreira, D.F.
30 Estatística Descritiva
A moda possui as seguintes propriedades:
i) A soma ou subtração de uma constante (k) aos dados altera a moda de tal forma que a nova
moda é igual a moda dos dados originais adicionada ou subtraída pela constante. Sejam os
novos dados obtidos pela adição ou subtração da constante k (Yi = Xi ± k) e a moda da
amostra original dada pormoX , então a nova moda será
moY = moX ± k
ii) A multiplicação dos dados ou divisão por uma constante (k) aos dados altera a moda de tal
forma que a nova moda é igual a moda dos dados originais multiplicada ou dividida pela
constante. Sejam os novos dados obtidos pela multiplicação da constante k (Yi = kXi) e a
moda da amostra original dada pormoX , então a nova moda será
moY = kmoX , k ∈ R
A média geométrica (X̄G), outra medida de posição, é definida como sendo a raiz n-ésima do
produto dos n dados amostrais. O estimador dessa média é dado por:
X̄G =
n
√
X1 ×X2 × · · · ×Xn = n
√√√√ n∏
i=1
Xi; Xi > 0,∀ i = 1,2, · · · , n (2.2.9)
em que o símbolo
∏
(letra grega maiúscula pi) significa “tomar o produto de”, que é análogo ao
significado de Σ, “tomar a soma de”. Esse símbolo é conhecido por produtório.
A tomada de logaritmos pode evitar problemas computacionais de se ter que trabalhar com
números de elevada magnitude. A expressão alternativa para o cálculo da média geométrica
apresentada em 2.2.9, considerando o uso do logaritmo neperiano (ln), cuja base é o número
neperiano e (2,71828 · · · ), é dada por:
X̄G = exp
[
ln(X1) + ln(X2) · · · ln(Xn)
n
]
= exp

n∑
i=1
ln(Xi)
n
 ; Xi > 0,∀ i = 1,2, · · · , n. (2.2.10)
A média geométrica é apropriada para calcular médias de razões, de taxas de variações, de
índices econômicos e de taxa de crescimento de microorganismos. Para dados agrupados o estimador
é dado por:
X̄G = exp

k∑
i=1
Fi ln(X̄i)
n
 ; X̄i > 0, ∀ i = 1,2, · · · , k (2.2.11)
Ferreira, D.F. Fundamentos de Matemática Estatística
2.2 Medidas de tendência central 31
A média harmônica, que é obtida tomando-se o recíproco da média aritmética dos recíprocos,
representa outra medida de tendência central, dada por:
X̄H =
1
1
n
n∑
i=1
1
Xi
=
n
n∑
i=1
1
Xi
(2.2.12)
A relação entre a média, média geométrica e média harmônica é dada por: X̄H ≤ X̄G ≤ X̄ . A
igualdade só se verifica quando todos os valores da amostra forem iguais. Para dados agrupados, o
estimador da média harmônica é dado por:
X̄H =
1
1
n
k∑
i=1
Fi
X̄i
=
n
k∑
i=1
Fi
X̄i
(2.2.13)
Fundamentos de Matemática Estatística Ferreira, D.F.
32 Estatística Descritiva
2.3 Medidas de dispersão ou de variabilidade
As diferenças observadas entre os elementos de uma amostra ou população definem o que
os estatísticos chamam de variabilidade ou dispersão do conjunto de mensurações. Se aplicadas
em uma população, são conhecidas por parâmetros de dispersão da população e, se aplicadas em
amostras, são denominadas de estimadores de dispersão.
As medidas de posição são importantes para caracterizar um conjunto de mensurações, mas
não são suficientes para caracterizar completamente a distribuição dos dados. Para enfatizar a
deficiência das medidas de posição são considerados 3 conjuntos de dados, relativos à produtividade
de 3 variedades de milho em t/ha. O conjunto A é relativo a um híbrido simples, o B, a um híbrido
triplo e o C, a uma variedade de polinização aberta.
A B C
4,27 3,44 1,27
4,60 3,76 3,30
4,72 4,55 3,50
4,95 4,86 5,25
4,99 5,30 5,44
5,17 5,42 5,51
5,21 5,81 5,72
5,42 5,89 6,04
5,63 5,94 6,39
6,00 5,99 8,54
X̄A = 5,096 X̄B = 5,096 X̄C = 5,096
Os três tipos de milho apresentaram a mesma média (5,096 t/ha) para as três variedades de
milho. É fácil para o leitor perceber, com uma inspeção mais criteriosa, que os conjuntos diferem
de forma razoável um do outro. O conjunto A, por se tratar de um tipo de milho em que não existem
variações genéticas entre as plantas, apresentou uma menor dispersão de valores em torno do valor
central (5,096), sendo seguido pelo híbrido triplo (B) e pela cultivar de polinização aberta (C).
2.3.1 Amplitude
A diferença entre a maior e a menor observação é denominada de amplitude (A), equação 2.1.1.
Essa medida de dispersão é bastante simples, fácil de ser obtida e de ser calculada, no entanto,
ela é uma pobre medida da dispersão por não considerar todas as mensurações, levando em conta
apenas os valores extremos (mínimo e máximo). Além disso, como é improvável que uma amostra
contenha os valores mínimo e máximo da população, a amplitude geralmente subestima a amplitude
populacional, sendo um estimador viesado e ineficiente. Deve ser considerada, ainda, a influência
negativa de possíveis “outliers”, que são mensurações discrepantes, no estimador da amplitude. A
mediana possui a mesma unidade de cada uma das mensurações amostrais individuais. O estimador
para dados em distribuições de frequências é dado por:
A = X̄k − X̄1 (2.3.1)
Ferreira, D.F. Fundamentos de Matemática Estatística
2.3 Medidas de dispersão ou de variabilidade 33
Apesar das limitações dessa medida de dispersão, a amplitude é usada para se ter uma indicação
rápida e fácil da variabilidadeem diversas áreas. Para as cultivares de milhoA,B eC anteriormente
apresentadas, as amplitudes foram 1,73 t/ha, 2,55 t/ha e 7,27 t/ha, respectivamente.
2.3.2 Variância
Outra forma de contornar o problema de a soma dos desvios, em relação à média aritmética, ser
sempre igual a zero é usar a soma de quadrados de desvios. A variância populacional é definida
dividindo-se a soma de quadrados de desvios pelo tamanho da população. A variância pode ser
considerada como um valor médio dos desvios ao quadrado, portanto, sendo conhecida, também,
por quadrado médio. As expressões apresentadas na sequência consideram populações finitas de
tamanho N . O símbolo usado para sua representação está consagrado na literatura estatística,
que é dado pela letra grega minúscula sigma, tomada ao quadrado (σ2). A definição da variância
populacional é:
σ2 =
SQP
N
=
N∑
i=1
(Xi − µ)2
N
(2.3.2)
A variância amostral (S2) poderia ser definida da mesma forma que a variância populacional,
substituindo-se N por n e µ por X̄ . Isso, no entanto, não é feito, pois divide-se por n− 1 e não por
n a soma de quadrados de desvios. O estimador da variância populacional é dado por:
S2 =
SQ
n− 1
=
n∑
i=1
(Xi − X̄)2
n− 1
(2.3.3)
em que quantidade n− 1, usada como divisora, é conhecida como graus de liberdade.
As expressões 2.3.2 e 2.3.3 são pouco usadas para o cálculo da variância. As expressões
equivalentes comumente usadas são:
σ2 =
1
N

N∑
i=1
X2i −
(
N∑
i=1
Xi
)2
N
 (2.3.4)
e
S2 =
1
n− 1

n∑
i=1
X2i −
(
n∑
i=1
Xi
)2
n
 . (2.3.5)
O estimador da variância populacional, em dados agrupados em distribuições de frequência, é
Fundamentos de Matemática Estatística Ferreira, D.F.
34 Estatística Descritiva
dado por:
S2 =
1
n− 1

k∑
i=1
FiX̄
2
i −
(
k∑
i=1
FiX̄i
)2
n
 (2.3.6)
A unidade da variância não é a mesma de cada mensuração. A variância tem a propriedade de
não se alterar quando os dados são adicionados ou subtraídos de uma constante, mas, quando esses
dados são multiplicados ou divididos por essa constante, a variância do novo conjunto é igual à
variância do conjunto original multiplicada ou dividida pela constante ao quadrado.
2.3.3 Desvio padrão
O desvio padrão é definido tomando-se a raiz quadrada da variância. Dessa forma o desvio
padrão é expresso na mesma unidade dos dados, sendo preferido pelos investigadores, por ser mais
fácil de interpretar. O desvio padrão populacional (σ) para populações finitas é definido por:
σ =
√√√√√√√√√√
1
N

N∑
i=1
X2i −
(
N∑
i=1
Xi
)2
N
 (2.3.7)
O estimador amostral do desvio padrão populacional σ é um estimador viesado, embora seja
derivado de um estimador não-viesado, sendo obtido pela simples extração da raiz quadrada da
variância amostral. O estimador do desvio padrão populacional é dado por:
S =
√√√√√√√√√√
1
n− 1

n∑
i=1
X2i −
(
n∑
i=1
Xi
)2
n
. (2.3.8)
Para os dados agrupados, o estimador do desvio padrão é:
S =
√√√√√√√√√√
1
n− 1

k∑
i=1
FiX̄2i −
(
k∑
i=1
FiX̄i
)2
n
. (2.3.9)
O desvio padrão, da mesma forma que a variância, não é afetado pela soma ou subtração de uma
constante aos dados. No entanto, ele se altera quando os dados são multiplicados ou divididos por
uma constante. Nesse caso, o novo desvio padrão será igual ao desvio padrão original multiplicado
ou dividido pela constante. Quando o desvio padrão é pequeno, próximo de zero, existirá uma
Ferreira, D.F. Fundamentos de Matemática Estatística
2.3 Medidas de dispersão ou de variabilidade 35
grande concentração dos dados em torno da média. Por outro lado, se o desvio padrão for grande os
valores não se concentrarão com tal intensidade em torno da média.
2.3.4 Coeficiente de variação
O desvio padrão e a variância são medidas da variabilidade absoluta dos dados. Essas medidas
são dependentes da grandeza, escala ou unidade de medida empregada para mensurar os dados.
Conjuntos de dados com diferentes unidades de medida não podem ter suas dispersões comparadas
pela variância ou pelo desvio padrão. Mesmo para uma única unidade, se os conjuntos possuem
médias de diferentes magnitudes, suas variabilidades não podem ser comparadas por essas medidas
de dispersão apresentadas. Uma medida da variabilidade relativa é dada pelo coeficiente de variação
(CV ). O coeficiente de variação populacional (CVp) é dado por:
CVp =
σ
µ
× 100% (2.3.10)
O estimador do coeficiente de variação populacional é dado por:
CV =
S
X̄
× 100% (2.3.11)
O coeficiente de variação é a expressão do desvio padrão como porcentagem da média do
conjunto amostral de dados. É uma medida adimensional da variabilidade, ou seja, não possui
unidade de medida.
Exemplo 2.4: Medida de variabilidade relativa
A média e o desvio padrão da produtividade de duas cultivares de milho são: X̄A = 4,0 t/ha
e SA = 0,8 t/ha para a variedade de polinização aberta A e X̄B = 8,0 t/ha e SB = 1,2 t/ha
para o híbrido simples B. Qual das cultivares possui maior uniformidade de produção?
Se, ao inspecionar as estatísticas, apresentadas você fosse induzido a responder que a
variedade de polinização aberta A seria a que possui maior uniformidade e que a razão seria
o menor desvio padrão apresentado por ela (0,8 t/ha), você teria provavelmente cometido um
erro. O fundamento usado aqui para comparar a variabilidade das cultivares não foi correto,
uma vez que o desvio padrão é uma medida de variabilidade absoluta. Embora as unidades
não sejam diferentes, as médias das amostras o são. O procedimento adequado seria o de
estimar o CV para ambas as cultivares e compará-los. Os coeficientes de variação são:
CVA =
SA
X̄A
× 100 = 0,8
4,0
× 100 = 20%
CVB =
SB
X̄B
× 100 = 1,2
8,0
× 100 = 15%
É fácil observar que o milho híbrido simples (B) é o mais uniforme, pois possui um menor
CV do que o da variedade de polinização aberta (A). A genética explica isso, pois todas as
plantas de um milho híbrido simples têm a mesma constituição genotípica, o que não ocorre
para a variedade de polinização aberta.
Fundamentos de Matemática Estatística Ferreira, D.F.
36 Estatística Descritiva
2.3.5 Erro padrão da média
Para definir o erro padrão da média suponha que amostras aleatórias de tamanho n são retiradas
de uma população e que em cada amostra seja estimada a média. Se for computado o desvio padrão
da população formada por todas as estimativas de médias obtidas, o valor encontrado é conhecido
como erro padrão da média. O erro padrão da média (σX̄ ) é dado pela razão entre o desvio padrão
populacional e a raiz do tamanho da amostra por:
σX̄ =
σ√
n
(2.3.12)
As razões da necessidade de um estimador do erro padrão da média são: a) não se conhece,
em geral, o desvio padrão populacional; b) na maioria das situações reais não é possível retirar
todas as amostras de uma população; e c) em geral, apenas uma amostra é extraída da população. O
estimador desse parâmetro é dado por:
SX̄ =
S√
n
(2.3.13)
O erro padrão da média é uma medida da dispersão das médias amostrais em torno da média
da população. É fácil perceber que quanto menor for o seu valor, mais provável será a chance de
obter a média da amostra nas proximidades da média da população, e quanto maior for, menos
provável se torna esse evento. Assim, o erro padrão da média é um estimador da precisão da
estimativa de uma média populacional. Gomes (1991, 2000) propõe uma medida relativa dessa
variabilidade das médias amostrais em torno da média populacional. Essa medida de variabilidade
relativa foi denominada aqui por coeficiente de precisão e por Gomes (1991) por índice de variação.
O coeficiente de precisão (CP ) é definido por:
CP =
SX̄
X̄
× 100% (2.3.14)
A importância do erro padrão da média na inferência estatística será evidente para o leitor
nos Capítulos relacionados à estimação e testes de hipóteses sobre médias. O erro padrão é uma
característica de todo estimador. Todo estimador possui um erro padrão peculiar definido pelo
desvio padrão da distribuição amostral de todas as estimativas obtidasdas possíveis amostras, de
tamanho n, extraídas da população de referência.
2.4 Estatísticas descritivas da distribuição
As medidas de posição e de dispersão fornecem importantes informações de locação e de
variabilidade da distribuição de referência. Os procedimentos gráficos também são importantes
descritores da distribuição. A forma da distribuição dos dados é extremamente importante na
estatística. Os estatísticos constroem modelos para dados, como já foi discutido anteriormente, e
esses modelos servirão de base para a inferência. Os estatísticos constroem modelos para dados,
como já foi discutido anteriormente, e esses modelos servirão de base para a inferência. Esses,
por sua vez, possuem diferentes formas, tornando essencial para os estatísticos e investigadores
Ferreira, D.F. Fundamentos de Matemática Estatística
2.4 Estatísticas descritivas da distribuição 37
determinarem a forma da distribuição dos dados amostrais, para realizarem escolhas acertadas do
modelo probabilístico ou daquele modelo que mais se aproxima da realidade.
2.4.1 Procedimentos gráficos
Os procedimentos gráficos apresentados na seção 2.1 também são importantes informantes
da distribuição. A forma da distribuição dos dados é extremamente importante na estatística. Os
estatísticos constroem modelos para dados, como já foi discutido anteriormente, e esses modelos
servirão de base para a inferência.
Vários métodos e procedimentos na literatura existem para estimar a forma da distribuição
amostral. Os histogramas e polígonos de frequências são os mais comuns e simples de implementar
(Silverman, 1990; Härdle e Simar, 2003). As distribuições podem ter várias formas, dentre as
quais, algumas estão apresentadas na Figura 2.4. É importante salientar que a forma de sino
simétrica (Figura 2.4 (c)) está relacionada com a forma do mais notável modelo probabilístico.
Esse é denominado de modelo normal de probabilidade ou modelo Gaussiano. Convém salientar
que a distribuição apresentada 2.4 (a) é também simétrica, e que as distribuições 2.4 (b) e (d) são
assimétricas à direita.
2.4.2 Momentos
Os momentos populacionais centrados na média (µr) são definidos na sequência. O coeficiente
r da expressão é a ordem do momento. Assim, para r = 1 tem-se o momento de primeira ordem, o
qual é sempre igual a zero; para r = 2, o momento de ordem 2, que é a variância da população;
para r = 3, o momento de assimetria de ordem 3; para r = 4, o momento de curtose de ordem 4; e
assim por diante. É conveniente salientar que a definição de momento populacional dada por:
µr =
N∑
i=1
(Xi − µ)r
N
, (2.4.1)
refere-se à população finita.
O estimador amostral (mr) para o momento centrado de ordem r é dado por:
mr =
n∑
i=1
(Xi − X̄)r
n
. (2.4.2)
2.4.3 Coeficiente de assimetria
O coeficiente de assimetria populacional (
√
β1) é uma forma padronizada do estimador do
momento de assimetria (r = 3). Seu estimador (
√
b1) é dado pela razão do momento amostral de
ordem 3 pelo de ordem 2, na potência de 3/2, da seguinte forma:√
b1 =
m3
(m2)
3
2
(2.4.3)
As populações cuja distribuição é simétrica apresentam valor do coeficiente de assimetria nulo,
Fundamentos de Matemática Estatística Ferreira, D.F.
38 Estatística Descritiva
 
(a) (b)
 
(c) (d)
 
(e)
Figura 2.4. Formas das distribuições de frequência em situações reais: (a) distribuição em forma de
U; (b) distribuição em forma de J invertido; (c) distribuição em forma de sino simétrica;
(d) distribuição assimétrica à direita; e (e) distribuição assimétrica à esquerda.
ou seja,
√
β1 = 0 (Figura 2.4 (c)). As distribuições assimétricas à direita (assimetria positiva)
apresentam
√
β1 > 0 (Figura 2.4 (d)), e as assimétricas à esquerda (assimetria negativa) apresentam√
β1 < 0 (Figura 2.4 (e)).
2.4.4 Coeficiente de curtose
O grau de achatamento de uma distribuição é denominado de curtose. É fácil de perceber,
pela própria definição, que a curtose de uma distribuição deve ser analisada considerando-se
alguma referência. Como já se comentou anteriormente, a distribuição normal de probabilidade é
considerada a distribuição de referência. A distribuição normal possui coeficiente de curtose igual
a 3. Para medir a curtose, define-se o estimador (b2) do coeficiente de curtose por:
b2 =
m4
m22
. (2.4.4)
Ferreira, D.F. Fundamentos de Matemática Estatística
2.4 Estatísticas descritivas da distribuição 39
Na Figura 2.5 foram ilustrados os três tipos de curvas quanto ao grau de achatamento.
xµ
Mesocúrtica
Platicúrtica
Leptocúrtica
Figura 2.5. Formas das distribuições de frequência quanto ao grau de achatamento mostrando as
curvas leptocúrticas, mesocúrticas e platicúrticas.
As distribuições que possuem valor de curtose igual a 3 são denominadas mesocúrticas. Aquelas
que possuem β2 > 3 são denominadas de leptocúrticas e as que possuem β2 < 3 são as platicúrticas.
As distribuições leptocúrticas são aquelas que possuem uma concentração de valores (mensurações)
próxima ao valor central maior que a da distribuição normal (mesocúrtica). Nas distribuições
platicúrticas, por sua vez, ocorre o contrário, ou seja, uma menor concentração de valores em torno
do centro da distribuição.
Fundamentos de Matemática Estatística Ferreira, D.F.
3
Amostragem
A realização de pesquisas é baseada em questões relativas às tomadas de observações da
realidade, ou seja, obter uma amostra dessa realidade. A busca de delineamentos adequados
para assegurar o valor científico das informações e conclusões aventadas é sempre realizada
pelos cientistas. O delineamento é o plano estratégico de observação da realidade. A validade é
assegurada pela aleatorização, ou seja, alocação aleatória das variáveis independentes às unidades
experimentais.
Os levantamentos por amostragem têm a finalidade de reproduzir a realidade estudada. Esses
levantamentos se aplicam ao conjunto real composto de elementos, denominado de população de
estudo. Os elementos podem ser seres humanos, árvores, domicílios, animais, áreas ou objetos. Os
dados são coletados em amostras da população de estudo e as medidas calculadas (estimativas)
passam a ser as informações disponíveis para os valores populacionais desconhecidos (parâmetros).
Numa fase inicial dos levantamentos amostrais é necessário formular o problema e aventar
hipóteses sobre o objeto de estudo ou expectativas sobre os possíveis resultados. Ainda nessa fase
inicial, o investigador deve definir a população de estudo, parte identificável e acessível da população
objeto, os objetivos e as variáveis observadas. Numa segunda etapa é realizado o planejamento,
elaborando o plano de amostragem ou determinando o caminho a ser percorrido para atingir os
objetivos propostos.
3.1 Amostragem probabilística e não probabilística
Os levantamentos por amostragem permitem obter informações a respeito de valores populacio-
nais desconhecidos, por meio da observação de apenas uma parte (amostra) do universo de estudo
(população). Os elementos da população são as unidades de observação e de análise. O conceito de
população do ponto de vista matemático é dado pelo conjunto de elementos que possuem ao menos
Fundamentos de Matemática Estatística Ferreira, D.F.
42 Amostragem
uma característica comum. Na prática, esse conjunto de elementos deve ser definido considerando,
ainda, sua localização no espaço e no tempo. A unidade amostral é a mesma unidade de observação
e de análise, sendo a menor parte distinta da população.
Dentre os vários processos existentes para a obtenção de amostras, a amostragem probabilística
caracteriza-se por garantir, a priori, que todo elemento pertencente ao universo de estudo possua
probabilidade, conhecida e diferente de zero, de pertencer à amostra sorteada. A identificação,
direta ou indireta, dos elementos e o uso de sorteio fundamentam as propriedades matemáticas desse
tipo de processo. Se por qualquer razão, alguns elementos da população não puderem pertencer à
amostra sorteada, a amostragem é dita não probabilística.
Alguns tipos de amostragem não probabilísticospodem ser empregados quando a população de
estudo não é totalmente acessível, quando a amostragem é realizada a esmo, ou seja, sem sorteio, e
quando a população é formada de material contínuo (líquido ou gás), em que o uso de sorteio não é
possível.
3.2 Principais processos de amostragem probabilística
Vários processos de amostragem probabilística existem e alguns deles são descritos a seguir.
3.2.1 Amostragem casual simples
A amostragem casual simples é o processo de amostragem probabilística na qual, qualquer
combinação dos n elementos da amostra, retirada dos N elementos populacionais que compõem a
população, tem igual probabilidade de vir a ser sorteada (Cochran, 1977). O número possível de
amostras de tamanho n que podem ser retiradas de uma população de tamanho N é dado por:
C
n
N =
(
N
n
)
=
N !
n!(N − n)!
Nesse tipo de amostragem cada uma dessas combinações tem chance de 1/CnN de ser retirada.
Se os elementos amostrados da população são removidos para as sucessivas retiradas subse-
quentes, esse método é denominado de amostragem simples ao acaso sem reposição. Se por outro
lado os elementos populacionais são repostos após uma retirada, a amostragem é dita com reposição.
À primeira vista, e intuitivamente, pode-se deduzir que não é muito vantajoso que um mesmo
elemento apareça duas, três ou mais vezes na amostra. Se a população é muito grande os tipos de
amostragem, com ou sem reposição, não apresentam grandes diferenças.
O processo de sorteio de uma amostra aleatória simples pode ser feito por meio de tabelas
de números aleatórios, sorteio por funções de geradores de números aleatórios em programas de
computadores, por uso de bolas enumeradas em urnas ou papéis enumerados em algum tipo de
recipiente.
A população submetida a esse tipo de amostragem é, em geral, finita, cujos elementos possam
ser identificados em uma listagem enumerada. Outra característica exigida para que haja sucesso da
amostragem, ou seja, para que estimativas fidedignas dos parâmetros populacionais possam ser
obtidas, refere-se a uma homogeneidade entre os elementos dessa população. Essa homogeneidade
interna da população é um tanto quanto difícil de ser caracterizada nas situações práticas com que o
Ferreira, D.F. Fundamentos de Matemática Estatística
3.2 Principais processos de amostragem probabilística 43
investigador se depara.
3.2.2 Amostragem estratificada
O sistema de obtenção de amostras em que a população de N elementos é previamente
dividida em grupos mutuamente exclusivos, denominados de estratos, e dentro dos quais são
sorteadas amostras casuais simples de tamanho nh, chama-se amostragem estratificada aleatória,
ou simplesmente amostragem estratificada (Cochran, 1977). As subpopulações ou estratos são
subdivididos previamente em grupos de tamanhos N1, N2, N3, · · · , NL unidades, mutuamente
exclusivos, de tal sorte queN =
∑L
h=1Nh. Após os estratos terem sido identificados, uma amostra
casual simples é retirada de cada estrato, cujos tamanhos são n1, n2, n3, · · · , nL, considerando
n =
∑L
h=1 nh.
Uma das principais razões para se usar a estratificação fundamenta-se na premissa de que esse
processo leva a um ganho de precisão na estimação de parâmetros da população. Isso realmente
ocorre, pois é possível subdividir uma população heterogênea em subpopulações internamente
homogêneas.
As notações que estão sendo empregadas até o momento usam o índice h para identificar um
estrato e o índice i para definir um elemento dentro de um estrato. Assim,Nh e nh são os tamanhos
do estrato h populacional e amostral, respectivamente; Xhi é o valor da observação i no estrato h.
Será considerado, também, que fh = nh/Nh representa a fração amostral.
A média e a variância populacional do estrato h são definidas por:
µh =
Nh∑
i=1
Xhi
Nh
(3.2.1)
e
σ2h =
1
Nh

Nh∑
i=1
X2hi −
(
Nh∑
i=1
Xhi
)2
Nh
 . (3.2.2)
Os estimadores da média e da variância do estrato h são dados por:
X̄h =
nh∑
i=1
Xhi
nh
(3.2.3)
e
S2h =
1
nh − 1

nh∑
i=1
X2hi −
(
nh∑
i=1
Xhi
)2
nh
 . (3.2.4)
Fundamentos de Matemática Estatística Ferreira, D.F.
44 Amostragem
Finalmente, é possível apresentar o estimador da média populacional global. Dois estimadores
distintos podem ser utilizados. O primeiro, e mais geral, estimador da média populacional é a
média ponderada das médias dos L estratos populacionais. Os pesos são os tamanhos dos estratos
populacionais. Esse estimador é dado por:
X̄est =
L∑
h=1
NhX̄h
N
. (3.2.5)
O segundo estimador é praticamente igual ao primeiro, diferenciando apenas nos pesos utilizados,
que agora são os tamanhos dos estratos amostrais. O segundo estimador da média populacional é
dado por
X̄ =
L∑
h=1
nhX̄h
n
. (3.2.6)
Os estimadores 3.2.5 e 3.2.6 são equivalentes quando a fração amostral de cada estrato é
equivalente à fração populacional de cada estrato, ou seja, quando
nh
n
=
Nh
N
ou
nh
Nh
=
n
N
.
Esse tipo de amostragem estratificada em que a fração amostral é igual em todos os estratos
é conhecido como alocação proporcional ou partilha proporcional. No exemplo 3.1 relativo à
amostragem estratificada proporcional ilustram-se as etapas desse processo. Em cada estrato, após
a definição do seu tamanho amostral, realiza-se uma amostragem simples ao acaso.
Exemplo 3.1: Amostragem estratificada proporcional
Ilustrar o procedimento de amostragem estratificada proporcional em uma população fictícia
de uma região, cujo interesse era obter informações sobre parâmetros de tecnologia dos
produtores agrícolas da região. Usou-se para a estratificação o tamanho das propriedades
por inferir que essa seria uma variável que estaria estreitamente relacionada com as variáveis
de tecnologia usada pelos agricultores da região estudada. Os estratos populacionais em
classe de áreas com o número de agricultores de cada uma dessas classes de área de suas
propriedades rurais em ha são relacionados a seguir. Os tamanhos de amostra necessários
foram obtidos seguindo a proporcionalidade de cada fração amostral para todos os estratos e
estão apresentados juntamente com as demais informações comentadas. A expressão para se
obter os tamanhos de amostra de cada estrato está apresentada a seguir, considerando uma
amostra de n = 50 propriedades.
nh =
Nh
N
× n
Ferreira, D.F. Fundamentos de Matemática Estatística
3.2 Principais processos de amostragem probabilística 45
Estratos Número de propriedades Tamanho amostral
(áreas em ha) Nh nh
0 ` 2 500 25
2 ` 5 320 16
5 ` 10 100 5
10 ` 20 50 3
20 ` 40 30 1
Totais 1.000 50
Assim, para ilustrar, o tamanho amostral do estrato 1 (propriedades com áreas entre 0 e 2
ha), foi determinado por
n1 =
N1
N
× n = 500
1.000
× 50 = 25.
Os demais estratos da amostra foram dimensionados de forma similar. Determinados valores
tiveram que ser arredondados, uma vez que o tamanho amostral de cada estrato deve ser
um número inteiro. O valor de f , fração amostral, é n/N = 0,05. Desde que o tamanho
de cada estrato ficou estabelecido, h = 1, 2, · · · , 5 , o próximo passo pode ser realizado.
Com a listagem dos produtores de cada um deles, realiza-se um sorteio simples ao acaso
conforme descrito na seção 3.2.1.
Outro tipo de amostragem estratificada que pode ser considerado é o da alocação uniforme ou
da partilha uniforme. Nesse tipo de alocação o tamanho de cada estrato amostral é o mesmo. Essa
alocação é raramente usada, devendo ser recomendada apenas para situações em que os estratos
populacionais forem uniformes em tamanho. Nesse caso, os tamanhos dos estratos da amostra são
dados por:
nh =
n
L
.
Um terceiro tipo de alocação ou partilha é a alocação ótima ou partilha ótima. Nesse tipo
de partilha é necessário conhecer o tamanho e o desvio padrão de cada estrato populacional. A
partilha ótima foi desenvolvida com a finalidade de alocar elementos para cada um dos L estratos
de tal sorte que se minimizariam o custo e a variância da estimativa da média populacional. Se
o custo da amostragem de cada elemento nos diferentes estratos for o mesmo,

Outros materiais