Buscar

Estatística Descritiva-Aula

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 97 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 97 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 97 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Universidade Federal do Espírito Santo
Centro de Ciências Agrárias
Depto de Engenharia Rural
Profa. Gisele Rodrigues Moreira
Enga. Agrônoma
Dra. Genetica e Melhoramento
E-mail: gisele.moreira@ufes.br
giselemoreira.webnode.com
IMPORTÂNCIA DA ESTATÍSTICA E 
CONCEITOS BÁSICOS
 ESTATÍSTICA DESCRITIVA
Estatística descritiva ou análise exploratória dos 
dados:
Parte da estatística que lida com a organização, 
resumo e apresentação de dados por meio de 
uso de tabelas, de gráficos e de medidas de 
posição, dispersão e pela natureza da 
distribuição em que ocorrem.
INTRODUÇÃO
2
INTRODUÇÃO
ETAPAS:
1a - Coleta ou levantamento dos dados;
2a - Organização dos dados;
3a – Apresentação e representação dos dados.
Apresentação em tabelas e gráficos
Medidas de posição ou tendência central
Medidas de dispersão ou variabilidade
 Estatísticas descritivas de distribuição
3
• TIPOS DE VARIÁVEIS
Qualitativa Quantitativa
Nominal
(classificação)
Ordinal
(ordenadação)
Discreta
(contagem) 
Contínua
(mensuração)
Fator RH (RH+ e 
RH-)
Comportamento de 
um animal 
(submisso, neutro 
ou agressivo)
Número de 
folhas por 
planta
Altura de 
plantas
COLETA DOS DADOS
4
Importante:
A forma que os dados são coletados, e os 
procedimentos para organizá-los e apresentá-
los depende do tipo de variável!!!!!!!
5
• Dados brutos  forma sem ordenação e sem 
nenhum tipo de arranjo sistemático
• Dados elaborados  forma ordenada e com 
algum tipo de arranjo sistemático (seqüência 
crescente, decrescente, ou outra)
ORGANIZAÇÃO DOS DADOS
6
Dados brutos –
Variável quantitativa contínua
Dados referentes ao teor de trióxido de enxofre 
em exemplares de certo tipo de pó
14,4 14,7 14,8 15,3 14,1 15,6 16,1 17,3 16,6
14,6 14,8 15,2 15,5 14,3 15,9 16,5 22,4 17,2
14,4 14,7 14,9 15,3 14,2 15,7 16,2 17,3 17,2
14,4 14,8 15,0 15,4 14,3 15,9 16,4 21,9 17,2
14,4 14,8 15,0 15,4 14,3 15,7 16,4 17,8 17,2
7
Dados elaborados –
Variável quantitativa contínua
Dados referentes ao teor de trióxido de enxofre 
(em %) em 45 exemplares de certo tipo de pó
14,1 14,4 14,7 14,8 15,3 15,6 16,1 16,6 17,3
14,2 14,4 14,7 14,9 15,3 15,7 16,2 17,2 17,3
14,3 14,4 14,8 15,0 15,4 15,7 16,4 17,2 17,8
14,3 14,4 14,8 15,0 15,4 15,9 16,4 17,2 21,9
14,3 14,6 14,8 15,2 15,5 15,9 16,5 17,2 22,4
8
• Tabelas
• Gráficos
• Histograma e Polígono de frequência
APRESENTAÇÃO DOS DADOS
9
TABELA
 Objetiva resumir, com certo formalismo, um
conjunto de observações.
 Permitem totalizar linhas e colunas e
estabelecer proporções em várias direções,
conforme a necessidade do estudo.
OBS: Os quadros NÃO resumem 
informações, apenas as registram. Logo, as 
informações nos quadros não se relacionam 
entre si!!!!
10
CARACTERÍSTICAS DE UMA TABELA:
Ver “Normas Tabulares” (IBGE, 1993)
11
Sucessão de dados “estatísticos” 
referentes a qualquer variável.
Pode ser de quatro tipos:
- Série temporal, histórica ou cronológica
(época a que se refere o fenômeno analisado)
- Série geográfica, territorial ou de 
localidade
(onde o fenômeno ocorre)
- Série específica ou categórica
(o fenômeno que é descrito)
- Série mista
Série estatística
12
Ano Número de alfabetizados
2000 93.839.744
2010 147.385.581
Tabela 1. Número de alfabetizados com idade de 10 ou
mais anos, nos censos de 2000 e 2010.
Fonte: IBGE, censos demográficos 2000 e 2010
Série temporal, histórica ou cronológica
13
Situação de 
domicílio
Número de alfabetizados
Urbana 128.091.166
Rural 19.294.415
Fonte: IBGE, censo demográfico 2010
Série geográfica, territorial ou de localidade
Tabela 2. Número de alfabetizados, na idade de 10 anos
ou mais, por situação de domicílio, de acordo
com o censo brasileiro de 2010.
14
Série específica ou categórica
Gênero Número de alfabetizados
Homens 71.361.117
Mulheres 76.024.464
Tabela 3. Número de alfabetizados, segundo o gênero,
na idade de 10 anos ou mais, de acordo com
o censo brasileiro de 2010.
Fonte: IBGE, censo demográfico 2010
15
Série temporal, histórica ou cronológica 
Série geográfica, territorial ou de localidade 
Série específica ou categórica 
Série mista
16
Gênero 2000 2010
Homem 45.990.282 71.361.117
Mulher 47.849.462 76.024.464
Tabela 4. Número de alfabetizados, segundo o gênero,
na idade de 10 anos ou mais, de acordo com o
censo brasileiro de 2000 e 2010.
Série mista
Fonte: IBGE, censos demográficos 2000 e 2010
17
São tabelas onde se procura 
corresponder os valores observados da 
variável em estudo com as respectivas 
freqüências.
Tabelas de distribuição de frequências
18
Tipos:
 Tabela de distribuição de frequências
DISCRETA ou PONTUAL  dados
quantitativos discretos
 Tabela de distribuição de frequências
INTERVALAR  dados quantitativos
contínuos
19
20
Tabela de distribuição de freqüências –
DISCRETA OU PONTUAL
EXEMPLO: Supondo que desejamos apresentar,
em uma tabela de distribuição de frequências
pontual, os dados hipotéticos de valores da
variável “número de animais contaminados por
determinada doença”, obtidos a partir de 20
propriedades rurais, quais sejam:
0 0 0 0 1
1 1 1 1 1
1 2 2 2 2
2 3 3 4 5
21
Tabela de distribuição de freqüências –
DISCRETA OU PONTUAL
EXEMPLO:
10 PASSO: Obter as frequências absolutas 
(Fi) - dadas pela contagem do 
número de ocorrência de cada 
resultado.
0 0 0 0 1
1 1 1 1 1
1 2 2 2 2
2 3 3 4 5
0 → 4
1 → 7
2 → 5
3 → 2
4 → 1
5 → 1
21
22
20 PASSO: Obter as demais frequências: 
- frequência relativa (Fri), 
- frequência relativa percentual (Fpi%), 
- frequência acumulada (Fci) e
- frequência acumulada percentual 
(Fci%)
30 PASSO: Montar a tabela de distribuição de 
frequências.
22
23
Tabela de distribuição de frequências – DISCRETA OU PONTUAL
No animais 
contaminados
Fi Fri Fpi (%) Fci Fci (%)
0 4 0,20 20 4 20
1 7 0,35 35 11 55
2 5 0,25 25 16 80
3 2 0,10 10 18 90
4 1 0,05 5 19 95
5 1 0,05 5 20 100
Total (n) 20 1,00 100 - -
Tabela 5. Tabela de distribuição de frequências pontual para o 
número de animais contaminados para um grupo de 20 
propriedades.
23
24
EXEMPLO: Sejam os dados referentes ao teor
de trióxido de enxofre (em %) em 45
exemplares de certo tipo de pó:
14,1 14,4 14,7 14,8 15,3 15,6 16,1 16,6 17,3
14,2 14,4 14,7 14,9 15,3 15,7 16,2 17,2 17,3
14,3 14,4 14,8 15,0 15,4 15,7 16,4 17,2 17,8
14,3 14,4 14,8 15,0 15,4 15,9 16,4 17,2 21,9
14,3 14,6 14,8 15,2 15,5 15,9 16,5 17,2 22,4
Tabela de distribuição de frequências –
CONTÍNUA OU INTERVALAR
25
EXEMPLO:
10 PASSO: número de classes: k = 7
20 PASSO: amplitude de classe: c = 1,4
30 PASSO: limite inferior da primeira classe: 
Li1a = 13,4
40 PASSO: obter as frequências absolutas (Fi)
- dadas pela contagem do número de 
ocorrência de resultado em cada classe.
Tabela de distribuição de frequências –
CONTÍNUA OU INTERVALAR
26
FÓRMULAS:
745 classes de Número  nk
1 que Em
4,1
17
1,144,22
1
 classe de oCompriment
 - X XA 
k
A
c
n






4,13
2
4,1
1,14
2
2
 classe primeira dainferior Limite
11
11


c
XLi
c
XLi
a
a
1ª classe: 13,4 ├ 14,8
2ª classe: 14,8 ├ 16,2
3ª classe: 16,2 ├ 17,6
4ª classe: 17,6 ├ 19,0
5ª classe: 19,0 ├ 20,4
6ª classe: 20,4 ├ 21,8
7ª classe: 21,8 ├ 23,2
Obtenção das classes:
Se, K é igual a 7, então são sete classes. 
O limite inferior da primeira classe começa é o valor 13,4 (LI1a). 
E, cada classe tem o comprimento (c) de 1,4.
27
28
40 PASSO: Obteras frequências absolutas (Fi)
- dadas pela contagem do número de 
ocorrência de resultado em cada 
classe
14,1 14,4 14,7 14,8 15,3 15,6 16,1 16,6 17,3
14,2 14,4 14,7 14,9 15,3 15,7 16,2 17,2 17,3
14,3 14,4 14,8 15,0 15,4 15,7 16,4 17,2 17,8
14,3 14,4 14,8 15,0 15,4 15,9 16,4 17,2 21,9
14,3 14,6 14,8 15,2 15,5 15,9 16,5 17,2 22,4
1ª classe: 13,4 ├ 14,8 → 12
2ª classe: 14,8 ├ 16,2 → 19
3ª classe: 16,2 ├ 17,6 → 11
4ª classe: 17,6 ├ 19,0 → 1
5ª classe: 19,0 ├ 20,4 → 0
6ª classe: 20,4 ├ 21,8 → 0
7ª classe: 21,8 ├ 23,2 → 2
29
30
50 PASSO: Obter as demais frequências: 
- frequência relativa (Fri), 
- frequência relativa percentual 
(Fpi%), 
- frequência acumulada (Fci) e
- frequência acumulada percentual 
(Fci%)
60 PASSO: Montar a tabela de distribuição de 
frequências.
30
31
Classes Fi Fri Fpi% Fci Fci%
13,4 ├ 14,8 12 0,27 27 12 27
14,8 ├ 16,2 19 0,43 43 31 70
16,2 ├ 17,6 11 0,24 24 42 94
17,6 ├ 19,0 1 0,02 2 43 96
19,0 ├ 20,4 0 0 0 43 96
20,4 ├ 21,8 0 0 0 43 96
21,8 ├ 23,2 2 0,04 4 45 100
Total 45 1,0 100 - -
Tabela 6. Tabela de distribuição de frequências intervalar
do teor de trióxido de enxofre (em %) em
exemplares de certo tipo de pó
31
32
EXERCÍCIO
Classes Fi Fri Fpi% Fci Fci%
150 ├ 158 7
158 ├ 166 5
166 ├ 174 10
174 ├ 182 12
182 ├ 190 5
190 ├ 198 1
Total 40 1,00 100 - -
Tabela 7. Altura (cm) de 40 alunos do curso de Estatística
da UFES (dados hipotéticos)
32
33
EXERCÍCIO - resposta
Classes Fi Fri Fpi% Fci Fci%
150 ├ 158 7 0,18 18 7 18
158 ├ 166 5 0,12 12 12 30
166 ├ 174 10 0,25 25 22 55
174 ├ 182 12 0,31 31 34 86
182 ├ 190 5 0,12 12 39 98
190 ├ 198 1 0,02 2 40 100
Total 40 1,00 100 - -
Tabela 8. Altura (cm) de 160 alunos do curso de
Estatística da UFES (dados hipotéticos)
33
Possibilita rápida impressão 
visual da distribuição dos valores ou 
das freqüências observadas.
GRÁFICO
34
Tipos de gráficos
 de barras verticais (ou colunas)
 de barras horizontais
 de linhas
 de setores (ou pizza)
 Etc. (Excel Inserir  Gráfico) 
 Histograma e polígono de frequências
35
GRÁFICO DE BARRAS VERTICAIS (OU 
COLUNAS)
Usado para apresentar variáveis
qualitativas (nominais ou ordinais). Ou
seja, é usado para comparar valores em
diversas categorias.
36
Ex: GRÁFICO DE BARRAS VERTICAIS
Fonte: VIEIRA, S. Introdução à Bioestatística. 4 ed. Elsevier, 2008.
0
10
20
30
40
50
60
70
Sim Em parte Não Sem resposta
Figura 1. Resposta de 100 pessoas submetidas a uma
cirurgia estética reparadora quando perguntadas
se consideravam que a cirurgia plástica havia
melhorado a aparência delas.
Resposta
F
re
q
u
ê
n
c
ia
 r
e
la
ti
v
a
 p
e
rc
e
n
tu
a
l
37
38
0
1
2
3
4
5
6
7
8
0 1 2 3 4 5
F
re
q
u
ê
n
c
ia
nº de animais contaminados
Figura 2. Gráfico de distribuição de frequências
pontual para o número de animais contaminados
para um grupo de 20 propriedades.
GRÁFICO DE COLUNAS MÚLTIPLO
Figura 3. Dívida externa de Portugal durante os anos de 2003 –
2008 (milhões de euros).
39
GRÁFICO DE BARRAS HORIZONTAIS
Também usado para apresentar variáveis
qualitativas (nominais ou ordinais), porém
são o melhor tipo para comparar múltiplos
valores categóricos.
40
Ex: GRÁFICO DE BARRAS HORIZONTAL
Figura 4. Setores participantes de carteiras de crédito e
seus respectivos percentuais.
41
Fonte: http://edicaodigital.folha.com.br
GRÁFICO DE LINHAS
Usado para exibir tendências ao longo do
tempo tanto para variáveis qualitativas e
quantitativas.
42
Ex: GRÁFICO DE LINHAS
Figura 5. Ocorrência da Síndrome de Down em seres humanos de acordo
com a idade da mãe.
Fonte: ENADE , 2009 – Biomedicina 
43
Figura 6. Área colhida de soja do Brasil, Argentina e Estados Unidos.
Fonte: Ministério da agricultura, Pecuária e Abastecimento
(http://www.agricultura.gov.br)
GRÁFICO DE LINHAS
44
GRÁFICO DE SETORES OU PIZZA
Especialmente usado para apresentar
variáveis qualitativas nominais, de modo
que os valores podem ser somados ou
quando existe apenas uma série de dados e
todos os valores são positivos.
45
Figura 7. Casos de intoxicação humana (%) por animal
peçonhento, ocorridos no Brasil em 2005, de acordo
com o animal.
Ex: GRÁFICO DE SETORES OU PIZZA
19,71%
20,91%
24,67%
34,71% Aranha
Serpente
Outros animais
Escorpião
Fonte: VIEIRA, S. Introdução à Bioestatística. 4 ed. Elsevier, 2008.
46
Usados para dados quantitativos contínuos
apresentados em tabelas de distribuição de 
frequência intervalar.
Histograma e polígono de frequência
IMPORTÂNCIA: 
Verificar a forma de distribuição dos dados
47
Gráfico de coluna utilizado para representar 
distribuições de freqüências com dados 
agrupados em classes. Especialmente indicado 
para dados em tabelas de distribuição de 
frequência intervalar.
48
Gráfico obtido pela união de pontos dos
lados superiores dos retângulos de um
histograma por meio de segmentos de reta
consecutivos.
49
HISTOGRAMA E POLÍGONO DE FREQÜÊNCIA
Figura 8. Histograma e polígono de frequência.
50
51
EXERCÍCIO: Obter o histograma e o polígono de frequência a 
partir dos dados agrupados na Tabela de distribuição de 
frequências INTERVALAR abaixo:
iX
Classes Fi Fri Fpi% Fci Fci%
13,4 ├ 14,8 12 0,28 28 12 28
14,8 ├ 16,2 19 0,42 42 31 70
16,2 ├ 17,6 11 0,24 24 42 94
17,6 ├ 19,0 1 0,02 2 43 96
19,0 ├ 20,4 0 0 0 0 0
20,4 ├ 21,8 0 0 0 0 0
21,8 ├ 23,2 2 0,04 4 45 100
Total 45 1,0 100 - -
Tabela 6. Tabela de distribuição de frequências intervalar do teor de trióxido de
enxofre (em %) em exemplares de certo tipo de pó
51
0
2
4
6
8
10
12
14
16
18
20
13,4 ├
14,8
14,8 ├
16,2 
16,2 ├
17,6
17,6 ├
19,0
19,0 ├
20,4 
20,4 ├
21,8 
21,8 ├
23,2 
Figura 9. Histograma para o teor de trióxido em exemplares
de certo tipo de pó.
Fi
Classes
52
0
2
4
6
8
10
12
14
16
18
20
14,1 15,5 16,9 18,3 39,4 21,1 22,5? ?
Figura 10. Polígono de frequência para o teor de trióxido em
exemplares de certo tipo de pó.
Fi
Pontos médios das classes
53
0
2
4
6
8
10
12
14
16
18
20
14,1 15,5 16,9 18,3 39,4 21,1 22,5
Figura 11. Polígono de frequência para o teor de trióxido em
exemplares de certo tipo de pó.
23,912,7
Fi
Pontos médios das classes
54
0
2
4
6
8
10
12
14
16
18
20
13,4 ├
14,8
14,8 ├
16,2 
16,2 ├
17,6
17,6 ├
19,0
19,0 ├
20,4 
20,4 ├
21,8 
21,8 ├
23,2 
Figura 12. Histograma e polígono de freqüência para o teor
de trióxido em exemplares de certo tipo de pó.
Histograma
Polígono de frequência
Fi
Classes
55
EXERCÍCIO
Figura 13. Variação de anticorpos para a doença X em relação a uma corte 
populacional específica (área endêmica). (ENADE 2010 – Biomedicina)
56
(A)
(B)
(C)
(D)
(E)
Resposta: B
57
MEDIDAS DE POSIÇÃO OU TENDÊNCIA 
CENTRAL
Objetivos:
• representar o ponto central de um conjunto 
de dados (média, mediana e moda), 
• estabelecer em torno de que valores 
representativos os dados se distribuem, 
• dividir o conjunto de dados em partes iguais 
(separatrizes  mediana).
58
MEDIDAS DE POSIÇÃO OU TENDÊNCIA CENTRAL
 Média aritmética
 Mediana
 Moda
OBS.: Serão apresentados nesta aula apenas os cálculos para a
média aritmética, a mediana e a moda em grupamento simples,
mas há casos em que se obtém estas medidas a partir dos
dados agrupadosem tabelas de distribuição de frequências
pontual ou intervalar.
59
Média aritmética 
n
XXXX
n
X
X n
n
i
i 


 ...3211
 Conceito: Soma das observações 
dividida pelo número delas.
60
Média aritmética 
Ex: Determinar a média aritmética simples do 
seguinte conjunto de valores: 7, 9, 10, 14, 15 e 17.
12
6
17151410971 




n
X
X
n
i
i
61
Média aritmética 
Conjunto de valores: 7, 9, 10, 14, 15 e 17.
12X
7 9 10
14 15 17
62
Mediana
• Conceito: É o valor que ocupa a posição 
central da série de dados, quando estes são 
colocados em ordem crescente ou 
decrescente.
63
Mediana
)
2
1
(
nX
2
)
2
2
()
2
(
 nn XX
Md =
Se n for PAR
Se n for ÍMPAR
64
Mediana
12
2
1410
22
logo ,
2
43
)
2
26
()
2
6
(
)
2
2
()
2
(









XX
XX
XX nn
Ex: Determinar a mediana do seguinte conjunto de 
valores: 7, 9, 10, 14, 15 e 17.
Como n = 6  PAR, a mediana é dada por: 
65
Moda
• Conceito: É o resultado que ocorre com 
maior freqüência numa série de dados.
Tabela 10. Distribuição de frequências pontual para a variável nota da 1ª 
prova de estatística.
Unimodal
Mo = 6,5
66
Moda
67
IMPORTANTE:
Uso da média, mediana e moda para cada 
tipo de variável:
A média só pode ser calculada para variáveis 
quantitativas. 
Para as variáveis qualitativas nominais 
somente podemos trabalhar com a moda. 
Para as variáveis qualitativas ordinais, além da 
moda, podemos trabalhar com a mediana. 
68
EXERCÍCIO
Classe fenotípica Frequência absoluta (Fi)
AL 7
AR 3
VL 3
VR 1
Calcule: média aritmética e a moda (classifique)
Tabela. Distribuição de frequências pontual para a variável cor e
textura da semente de ervilha referente à análise da
geração F2 do cruzamento de uma planta de ervilha com
sementes amarelas e lisas (AL) com outras verdes e
rugosas (VR).
69
EXERCÍCIO - resposta
14
1337
14
14
1 VRVLARAL
X
X i
i




Média aritmética
Moda
A classe que possui maior frequência é AL (Fi = 7),
Assim Mo = AL; Unimodal
Como a variável é qualitativa nominal não tem
como calcular a média, pois não tem como
proceder o cálculo.
70
MEDIDAS DE DISPERSÃO E 
VARIABILIDADE
Objetivos:
 quantificar a dispersão dos dados em torno 
do ponto central, 
 Caracterizar e diferenciar a dispersão 
espacial dos dados.
71
MEDIDAS DE DISPERSÃO E VARIABILIDADE
• Amplitude total
• Variância
• Desvio padrão
• Desvio médio
• Coeficiente de variação
• Erro padrão da média
72
Amplitude total
• Conceito: Diferença entre a maior e a 
menor observação. 
Exemplo: produção leiteira (Litros/animal/dia) 
10,2 10,5 11,5 11,9 12,7 12,6 12,9
A = 12,9 – 10,2 = 2,7 l/a/d
1XXA n 
73
Desvio médio
• Conceito: Média dos desvios absolutos em 
relação à média (ou mediana), da amostra. 
n
XX
n
i
i
X



 1ˆ
74
Suponha que tenham sido encontrados os
seguintes valores de alturas de planta, em cm:
208 203 202 200 198 197 192
200cm aritméticaMédia
Em que,
Xi = valores ou dados observados
m = média verdadeira dos dados
ei = desvios em relação a média
xi = m + ei
75
203
208
198
200
202
192
197
200X
e1 = 8
e2 = 3
e3 = 2
e4 = 0
e5 = -2
e6 = -3
e7 = -8
mˆ X eˆ ii 
Obtenção dos desvios (ei):
0)( 
1


XX
n
i
i
76
Desvio médio
n
XX
n
i
i
X



 1ˆ
0)( 
1


XX
n
i
i
Módulo da soma dos desvios
Número de elementos da amostra
77
Exemplo: Considerando os valores de alturas
de planta, em cm:
208 203 201 200 198 197 192
cm 71,3ˆ
7
)200192(...)200203()200208(
ˆ
)(
ˆ 1







X
X
n
i
i
X n
XX



78
Variância
• Conceito: Dispersão dos valores em torno 
da média, ou seja, a média dos quadrados 
das diferenças dos valores em relação à sua 
média (Quadrado médio). 
1
)(
ˆ 1
2
2





n
XX
n
i
i

79
1
)(
ˆ 1
2
2





n
XX
n
i
i
0)(
1


XX
n
i
i
Soma de quadrados dos desvios
Graus de liberdade
Variância
Variância
1
)(
ˆ 1
2
2





n
XX
n
i
i

1
)(
ˆ 1
1
2
2
2







n
n
X
X
n
i
n
i
i
i

81
Exemplo: Considerando novamente os
seguintes valores de alturas de planta, em cm:
208 203 201 200 198 197 192
22
2
222
2
7
1
7
1
2
2
2
cm 67,25ˆ
6
7
)192...203208(
)192...203208(
ˆ
17
7
)(
ˆ













 i
i
i
i
X
X
Desvio padrão
• Conceito: É a raiz quadrada da variância. 
2ˆˆ  
Tem a vantagem, em relação à 
variância de estar na mesma unidade 
dos dados originais!
83
Exemplo: Alturas de planta, em cm:
208 203 201 200 198 197 192
22 cm 67,25ˆ Variância 
cm 07,567,25ˆ padrão Desvio 2  
84
203
208
198
200
202
192
197
200X
07,5200ˆ200ˆ  X
A dispersão em torno da média é de 5,07 cm a mais que a 
média e 5,07 a menos, em média. Ou seja, os valores de 
altura de planta dispersam em torno de 194,93 cm e 205,07 
cm em torno da medida de posição.
07,5ˆ 
07,5ˆ 
85
Coeficiente de variação
• Conceito: Medida da variabilidade relativa 
de uma amostra ou população. 
100.
ˆ
%
X
CV


VANTAGEM: Medida adimensional!! 
Compara conjunto de dados com diferentes
unidades de medida e,ou médias com diferentes
magnitudes e única unidade.
86
 22 // 2,1ˆ diaanimalleite
)//( 1,12,1ˆ diaanimalleite
Exemplo:
Variável X: produção leiteira (litros/animal/dia) 
X = 10,2 10,5 11,5 11,9 12,7 12,6 12,9
Variável Y: Alturas de planta (cm)
Y = 208 203 201 200 198 197 192
%32,9%
100.
8,11
1,1
%


X
X
CV
CV
%54,2%
100.
200
07,5
%


Y
Y
CV
CV
A variável Y possui menor variabilidade, pois possui menor CV%.
87
Erro padrão da média
• Conceito: Medida de dispersão das médias 
amostrais em torno da média da população.
n
X


ˆ
ˆ 
É um estimador da precisão da estimativa de 
uma média populacionall!!
88
Erro padrão da média
n
n
n
n
n
n
N
5 Amostras (n)
Amostra 1 
Amostra 2 
…
Amostra 5 
1X
2X
5X
ˆ
5
ˆ
ˆ

 X
89
Exemplo: Alturas de planta, em cm:
208 203 201 200 198 197 192
cm
n
X
X
92,1
7
07,5
ˆ
ˆ
ˆ





Quanto menor o valor do erro padrão da média, mais 
provável será a chance de se obter a média amostral 
nas proximidades da média populacional!!
90
ESTATÍSTICAS DESCRITIVAS DE 
DISTRIBUIÇÃO
 Coeficiente de assimetria
 Coeficiente de curtose
91
Coeficiente de assimetria
• Conceito: Mede a simetria ou assimetria de 
uma distribuição.
- Se As  0  a distrib. será Assimétrica Positiva;
- Se As = 0  a distrib. será Simétrica;
- Se As  0  a distrib. será Assimétrica Negativa.
ˆ
oMXAs


ˆ
)(3 dMXAs


92
ASSIMETRIA
93
Distribuição simétrica
Distrib. Assimétrica positiva Distrib. assimétrica negativa
94
Coeficiente de curtose
• Conceito: Mede o grau de achatamento de 
uma distribuição.
95
Coeficiente de curtose
= 0,263  mesocúrtica (distribuição normal)
> 0,263  leptocúrtica
<0,263  platicúrtica
)3)(2(
)1(3
ˆ)3)(2)(1(
)1( 2
1
4
















 



 nn
nXX
nnn
nn n
i
i

96
FIM
Literatura recomendada:
DEVORE, J. L. Probabilidade e estatísitica para
engenharia e ciências. 6.ed. São Paulo: Cengage
Learning, 2011. 692p.
MONTGOMERY, Douglas C.; RUNGER, George C.
Estatística aplicada e probabilidade para
engenheiros. 2. ed. Rio de Janeiro: LTC, 2003. xii,
463 p.
TOLEDO, G.L. & OVALLE, I.I. Estatística básica. 2.ed.
São Paulo: Atlas, 1982. 459p.
TRIOLA, Mario F. Introdução à estatística. 10. ed. Rio
de Janeiro: LTC, 2008. xxvi, 696 p.
97

Outros materiais

Outros materiais