Buscar

Introdução à Estatística Aplicada à Climatologia

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 20 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 20 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 20 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Universidade de São Paulo 
Disciplina: Climatologia II – ACA 0226 
 
 
 
 
 
 
 
 
 
 
 
 
Introdução à Estatística Aplicada à Climatologia 
 
Parte I – Estatística Descritiva 
 
 
Projeto PAE 
 
Bolsista: Michelle S. Reboita 
 
 
 
 
 
 
 
São Paulo, 2005.
 
Projeto PAE – Bolsista: Michelle S. Reboita 
2 
Sumário 
 
 
1 Introdução ......................................................................... 3 
2 Sobre a Estatística ............................................................... 3 
2.1 Um Pouco da História da Estatística.......................................................................... 3 
2.2 Definição........................................................................................................................... 3 
2.3 Conceitos Importantes .................................................................................................. 3 
População:.................................................................................................................................. 3 
Amostra: ................................................................................................................................... 4 
3 Distribuição de Freqüências ...................................................... 4 
3.1 Metodologia para a Elaboração de uma Distribuição de Freqüências................. 5 
4 Medidas de Posição ou Tendência Central ....................................... 7 
4.1 Média ................................................................................................................................. 8 
4.2 Mediana ............................................................................................................................. 9 
4.3 Moda................................................................................................................................... 9 
4.4 Ponto Médio.....................................................................................................................10 
5 Medidas de Dispersão ou de Variabilidade ..................................... 10 
5.1 Amplitude Total.............................................................................................................. 11 
5.2 Desvio-Padrão ................................................................................................................. 11 
5.3 Variância...........................................................................................................................14 
6 Assimetria ........................................................................ 14 
7 Curtose............................................................................ 15 
8 Separatrizes...................................................................... 16 
9 Referências .......................................................................20 
10 Exercício ..........................................................................20 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Projeto PAE – Bolsista: Michelle S. Reboita 
3 
1 Introdução 
 
 Os métodos e técnicas estatísticas são utilizados em Climatologia basicamente 
para analisarem o tempo passado com o objetivo de inferir sobre o provável 
comportamento, no futuro, de alguma variável. 
A aplicação de técnicas estatísticas a dados meteorológicos tem a vantagem de 
compactar o enorme volume de dados, medidos numa estação, em uma simples tabela 
ou uma equação, capaz de sumariar todas as informações de modo a facilitar as 
inferências sobre os dados (Assis et al, 1996). 
 
2 Sobre a Estatística 
 
2.1 Um Pouco da História da Estatística 
 
 Conforme descrito em Silva (1998), a estatística é uma ciência que surgiu na 
Antigüidade e se desenvolveu paralelamente à própria civilização humana. 
 Há mais de 3.000 anos a.C., os antigos egípcios deixaram dados estatísticos 
sobre seus povos gravados em monumentos históricos daquela época, principalmente 
nas famosas pirâmides. Além deles, os chineses realizaram um censo demográfico no 
ano 2.275 a.C. e, bem mais tarde, os romanos no ano 556 a.C., também realizaram 
trabalho bastante semelhante. 
 Nessas épocas, os censos concentravam-se basicamente no levantamento do 
número de habitantes, nascimentos, óbitos e forças guerreiras, pois seus objetivos 
eram voltados a fornecer dados confiáveis aos então governantes. 
 Na era Cristã, principalmente no primeiro milênio, houve também diversos 
censos demográficos, notadamente em Israel e alguns países do ocidente. 
 Entretanto, a partir do século XVI, a estatística começou a ganhar importância, 
passando a ser estudada por matemáticos e filósofos e, conseqüentemente, foi 
introduzida nos currículos das universidades. 
 
2.2 Definição 
 
 A estatística é uma coleção de métodos para planejar experimentos, obter 
dados e organiza-los, resumi-los, analisá-los, interpretá-los e deles extrair conclusões 
(Triola, 1998). 
 
2.3 Conceitos Importantes 
 
Na estatística os termos população e amostra são muito utilizados, portanto é 
necessário conhecer seus significados. 
 
População: é uma coleção completa de todos os elementos a serem estudados. Ex: 
conhecer a altura de todos os habitantes do Brasil. 
 
Projeto PAE – Bolsista: Michelle S. Reboita 
4 
 
Amostra: é uma subcoleção de elementos extraídos de uma população. Ex: conhecer a 
altura de um conjunto de habitantes do Brasil. 
 
 Quando o estudo trata-se de dados meteorológicos, temos em mãos uma 
amostra, pois não conhecemos a população, devido não haver o registro contínuo dos 
dados deste a origem do planeta. 
 É importante determinar se um conjunto de dados trata-se de uma amostra ou 
de uma população, pois a metodologia de análise muitas vezes é diferente e, também, 
as conclusões a que devemos chegar. Quando trabalhamos com amostras, os 
resultados obtidos nos cálculos estatísticos são utilizados para fazer inferências 
(generalizações) sobre a população. Vejamos um exemplo: selecionamos os dados 
horários de temperatura do ar do verão de 2004 medidos numa cidade X, com isto 
teremos uma amostra. Calculamos a média aritmética deste conjunto, a partir do 
resultado obtido podemos inferir que a média da temperatura daquela cidade no verão 
(no caso todos os verões - população) corresponde àquele determinado valor. 
 
3 Distribuição de Freqüências 
 
Quando estamos trabalhando com estatística, normalmente, precisamos manipular 
grande quantidade de dados. Entretanto, estes devem ser organizados de tal forma a 
facilitar o trabalho do investigador do fenômeno. Se possuímos um conjunto de dados, 
por exemplo, de temperaturas médias diárias da estação do IAG (localizada em Água 
Funda, São Paulo) do mês de dezembro de 2004, devemos dispô-los de forma que 
consigamos extrair de maneira fácil informações como: maior temperatura e menor, 
quantos dias tiveram temperaturas acima ou abaixo de um determinado valor, etc. 
Para tanto, é elaborado uma distribuição de freqüências. 
 A distribuição de freqüências é uma tabela que relaciona categorias ou classes 
de valores, juntamente com contagens ou freqüências do número de valores que se 
enquadram em cada categoria (Triola, 1998). A distribuição de freqüências pode ser 
representada através de um histograma, que é um gráfico cujas bases são os limites 
das classes e as alturas são as freqüências. 
 Abaixo temos uma distribuição de freqüências (tabela 1) juntamente com um 
histograma (figura 1) da temperatura média diária do mês de dezembro de 2004 da 
estação do IAG. Na tabela o símbolo indica que o limite de classe inclui o valor da 
esquerda e exclui o da direita. 
 
 
 
 
 
 
 
 
Projeto PAE – Bolsista: Michelle S. Reboita 
5 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
3.1 Metodologia para a Elaboração de uma Distribuição de FreqüênciasDe posse de um conjunto de dados, neste caso, de dados de temperatura média 
diária do mês de dezembro de 2004 da estação do IAG (tabela 2), devemos seguir 
alguns passos para a construção de uma distribuição de freqüências. 
 
Tabela 2. Dados de temperatura média diária do mês de dezembro de 2004 da 
estação do IAG. 
 
Dia Temperatura (ºC) Dia Temperatura (ºC) 
1 18,9 17 21,5 
2 18,7 18 20,8 
3 18,4 19 22,4 
4 23,2 20 23,7 
5 22,3 21 18,3 
6 22 22 16,1 
7 22,4 23 17,2 
8 23 24 19,8 
9 20,9 25 22,6 
10 18,3 26 21,2 
11 17,5 27 21,2 
12 18 28 20,1 
13 19,1 29 21,4 
14 18,9 30 22,2 
15 20 31 23,2 
16 25,1 
 
 
 
Intervalos de Classe Freqüências 
16.1 17.8 3 
17.8 19.5 8 
19.5 21.2 7 
21.2 22.9 8 
22.9 24.6 4 
24.6 26.3 1 
Tabela 1. Distribuição de 
freqüências da temperatura média 
diária do mês de dezembro de 2004 
da estação do IAG. 
Figura 1. Histograma de freqüências. 
 
Projeto PAE – Bolsista: Michelle S. Reboita 
6 
Passo 1: Ordenar os elementos dos dados brutos em ordem crescente, indicando a 
freqüência absoluta de cada elemento. 
 
Dados brutos: dados que ainda não foram numericamente organizados. São as 
observações. 
Freqüência absoluta: número de vezes que um valor aparece num conjunto de 
dados. 
 
Tabela 3. Dados brutos dispostos em ordem crescente com as respectivas 
freqüências. 
 
Temperatura Freqüências 
16,1 1 
17,2 1 
17,5 1 
18 1 
18,3 2 
18,4 1 
18,7 1 
18,9 2 
19,1 1 
19,8 1 
20 1 
20,1 1 
20,8 1 
20,9 1 
21,2 2 
21,4 1 
21,5 1 
22 1 
22,2 1 
22,3 1 
22,4 2 
22,6 1 
23 1 
23,2 2 
23,7 1 
25,1 1 
 
 
Passo 2: Determinar o número de intervalos de classe (K). O número de intervalos de 
classe é obtido pela regra de Sturges (Crespo, 1997): 
 
K = 1+3,3 (log10 n) (1) 
 
onde n é o número total de elementos do conjunto de dados. 
 
Projeto PAE – Bolsista: Michelle S. Reboita 
7 
K = 1+3,3 (log10 31) 
K = 1+3,3 (1,49) 
K = 5,9 ≅≅≅≅ 6 
 
 Portanto, a distribuição de freqüências será constituída de 6 intervalos de 
classe. 
 
Passo 3: Determinar a amplitude dos intervalos de classe (h): 
 ( )[ ]
k
1xx
h imínimáx
−−
= (2) 
 
onde K é o número de intervalos de classe e ximáx e ximín são respectivamente o maior e 
o menor valor do conjunto de dados. 
 
( )[ ]
6
116,11,25h −−= 
h ≅ 1,7 
 
 Após a obtenção da amplitude dos intervalos de classe (passo 3), basta 
organizar os dados conforme a distribuição de freqüências apresentada na tabela 1. 
Para tanto, se pega o menor valor do conjunto de dados e soma-se a amplitude dos 
intervalos de classe. Então, o primeiro intervalo da distribuição de freqüências vai do 
menor valor do conjunto até a soma deste com o valor da amplitude dos intervalos de 
classe. Após verifica-se quantos elementos (freqüências) encontram-se neste 
intervalo. Este procedimento é feito tantas vezes conforme indica o cálculo do número 
de intervalos de classe. Também pode ser elaborado o histograma da distribuição de 
freqüências (figura 1). 
 
4 Medidas de Posição ou Tendência Central 
 
Normalmente, quando estamos estudando um fenômeno, seja ele de qualquer 
natureza, é basicamente impossível manipularmos todos os elementos da seqüência de 
dados, a não ser que a quantidade seja pequena. Entretanto, é importante sabermos 
onde os valores da seqüência se concentram, facilitando assim a análise. A estatística, 
por sua vez, fornece medidas que podem caracterizar o comportamento dos elementos 
de uma série. Essas medidas são chamadas de medidas de posição ou de tendência 
central, que na prática, possibilitam determinar um valor compreendido entre o menor 
e o maior valor da série numérica, ou seja, o valor localizado no centro ou no meio de 
um conjunto de dados. 
Há diferentes maneiras de definir o centro de um conjunto de dados, assim, há 
diferentes definições de medidas de tendência central como: média, mediana, moda e 
ponto médio. 
 
Projeto PAE – Bolsista: Michelle S. Reboita 
8 
4.1 Média 
 
Média Aritmética: a média aritmética de um conjunto de dados é o valor obtido 
somando-se todos os elementos do conjunto e dividindo-se a soma pelo número total 
de elementos. Observe: 
 
n
x
x i∑= (3) 
 
onde x é a média aritmética, xi os dados do conjunto amostral e n o número de 
valores. 
 A média aritmética calculada para os dados fornecidos na tabela 1 corresponde 
a: 
31
2,232,22...7,189,18x ++++= 
 
C59,20x 0= 
 
 Observação: quando ao invés de x , que denota a média aritmética de uma 
amostra, temos µ significa que a média aritmética é de uma população. 
A média aritmética depende de todos os valores da série e qualquer alteração 
de um deles altera seu valor. Esta medida é influenciada por valores extremos, 
podendo, em alguns casos, não representar a série. Além da média aritmética, há a 
média harmônica, geométrica e quadrática. 
 
Média Harmônica: costuma ser usada como medida de tendência central para 
conjuntos de dados que consistem em taxas de variação, como por exemplo 
velocidades. Obtém-se a média harmônica dividindo-se o número n de valores pela 
soma dos inversos de todos os valores. Portanto, é expressa como (Triola, 1998): 
 
∑
=
ix
1
nx 
(4) 
 
 Para os dados da tabela 1, temos a média harmônica igual a: 
 
2,23
1
2,22
1...
7,18
1
9,18
1
31x
++++
= 
 
C36,20x 0= 
 
 
Projeto PAE – Bolsista: Michelle S. Reboita 
9 
Média Geométrica: é usada na administração e na economia para achar taxas médias 
de variação, de crescimento, ou razões médias. Dados n valores (todos positivos), a 
média aritmética é a raiz nma do seu produto (Triola, 1998). Por exemplo, determina-se 
a média geométrica de 2, 4, 10 multiplicando-se os três valores – o que dá 80, e 
tomando-se a raiz cúbica do resultado (porque há três valores). O resultado é 4,3. 
Desta forma para os dados da tabela 1, temos: 
 
31 2,23*2,22*...*7,18*9,18x = 
 
C48,20x 0= 
 
Média Quadrática: é utilizada em geral em experimentos físicos. Em sistemas de 
distribuição de energia, por exemplo, as tensões e correntes são em geral dadas em 
termos de sua média quadrática. Obtém-se a média quadrática de um conjunto de 
valores elevando-se cada um ao quadrado, somando-se os resultados, dividindo-se o 
total pelo número n de valores e tomando-se a raiz quadrada do resultado (Triola, 
1998). Por exemplo, a média quadrática de 2, 4, 10 é 6,3. Agora calculando-se para os 
dados da tabela 1, temos: 
 
n
x
x
2
i∑
= (5) 
 
31
)2,23()2,22(...)7,18()9,18(x
2222 ++++
= 
 
C71,20x 0= 
 
4.2 Mediana 
 
 A mediana é o elemento que ocupa a posição central de uma série de dados. Para 
encontrá-la os dados devem estar dispostos em ordem crescente ou decrescente. Se a 
série tiver um número ímpar de dados o valor que estiver ocupando o meio da série 
será a mediana. Se tiver um número par de dados deve-se extrair a média aritmética 
dos dois valores centrais, uma vez que, o valor correspondente a mediana acha-se 
entre eles. 
 A mediana dos dados fornecidos na tabela 1 corresponde a 20,9ºC. 
 
4.3 Moda 
 
 A moda é o valor que ocorre com maior freqüência em uma série de dados. Pode 
ser identificada apenas observando-se a série nos casos de dados não agrupados. 
Quando a série possuir dois valores com a mesma freqüência máxima, cada um deles é 
 
Projeto PAE – Bolsista: Michelle S. Reboita 
10 
uma moda, e o conjunto diz-se bimodal. Se mais de dois valores ocorrerem com a 
mesma freqüência máxima, o conjunto é multimodal. Quando nenhum valor é repetido, 
o conjunto não tem moda. 
 A série de dados fornecida na tabela 1 é multimodal, pois cinco valores (18,3; 
18,9; 21,2; 22,4 e 23,2) aparecem com a mesma freqüência máxima. 
 
4.4 Ponto MédioO ponto médio é o valor que está a meio caminho entre o maior e o menor valor 
da série de dados. Para obtê-lo, somamos esses valores extremos e dividimos o 
resultado por 2, como na expressão a seguir (Triola, 1998): 
 
2
valormenorvalormaiorPM += (6) 
 
 O ponto médio dos dados da tabela 1 é: 
 
2
1,251,16PM += 
 
PM = 20,6º C 
 
5 Medidas de Dispersão ou de Variabilidade 
 
Vimos anteriormente que um conjunto de valores pode ser convenientemente 
sintetizado, por meio de procedimentos matemáticos, em poucos valores 
representativos – média, mediana e moda. Tais valores podem servir de comparação 
para dar a posição de qualquer elemento do conjunto. 
Não é o bastante dar uma das medidas de posição para caracterizar 
perfeitamente um conjunto de valores, pois, mesmo sabendo, por exemplo, que a 
temperatura média de duas cidades é a mesma, e igual a 24ºC, ainda assim somos 
levados a pensar a respeito do clima dessas cidades. Em uma delas a temperatura 
poderá variar entre limites de muito calor e de muito frio e, haver, ainda, uma 
temperatura média de 24ºC. A outra poderá ter uma variação pequena de 
temperatura, mas mantendo uma média de 24ºC. 
Vemos, então, que a média – ainda que considerada como um número que tem a 
faculdade de representar uma série de valores – não pode, por si mesma, destacar o 
grau de homogeneidade ou heterogeneidade que existe entre os valores que compõem 
um conjunto. 
Consideremos os seguintes conjuntos de valores das variáveis x, y e z: 
 
X: 70, 70, 70, 70, 70 
Y: 68, 69, 70, 71, 72 
Z: 5, 15, 50, 120, 160 
 
Projeto PAE – Bolsista: Michelle S. Reboita 
11 
 Calculando a média aritmética de cada um desses conjuntos, obtemos: 
 
70
5
350
n
x
x i === ∑ 
70
5
350
n
y
y i === ∑ 
70
5
350
n
z
z i === ∑ 
 
Vemos, então, que os três conjuntos apresentam a mesma média aritmética: 70. 
 Entretanto, é fácil notar que o conjunto x é mais homogêneo que os conjuntos y 
e z, já que todos os valores são iguais a média. 
 O conjunto y, por sua vez, é mais homogêneo que o conjunto z, pois há menor 
diversificação entre cada um de seus valores e a média é representativa. 
 Chamando de dispersão ou de variabilidade a maior ou menor diversificação dos 
valores de uma variável em torno de um valor de tendência central tomado como ponto 
de comparação, podemos dizer que o conjunto x apresenta dispersão ou variabilidade 
nula e que o conjunto y apresenta uma distribuição ou variabilidade menor que o 
conjunto z. 
 Portanto, para qualificar os valores de uma dada variável, ressaltando a maior ou 
menor dispersão ou variabilidade entre esses valores e a sua medida de posição, a 
Estatística recorre às medidas de dispersão ou de variabilidade. Dessas medidas, 
serão descritas a amplitude total, o desvio-padrão e a variância. 
 
5.1 Amplitude Total 
 
A amplitude total de um conjunto de dados é a diferença entre o maior e o menor 
valor deste. Para calculá-la, basta subtrair o menor valor do maior. 
 
mínmáx xxAT −= (7) 
 
 Quanto maior a amplitude total de um conjunto de dados, maior é a dispersão ou 
variabilidade dos valores. 
 A amplitude total observada nos dados da tabela 1 é: 
 
AT = 25,1 – 16,1 = 9º C 
 
5.2 Desvio-Padrão 
 
 A amplitude total é uma medida instável, pois se deixa influenciar pelos valores 
extremos, que são, na sua maioria, devidos ao acaso. 
 O desvio-padrão e a variância são medidas que fogem a essa falha, pois levam 
em consideração a totalidade dos valores da variável em estudo, o que faz delas 
 
Projeto PAE – Bolsista: Michelle S. Reboita 
12 
índices de variabilidade bastante estáveis e, por isso mesmo, os mais geralmente 
empregados. Assim, pode-se definir o desvio-padrão como uma medida da magnitude 
do espalhamento ou dispersão dos dados em relação à média da série. 
 
 A expressão para o cálculo do desvio-padrão amostral (s) é: 
 
( )2i
1n
xxs
−
−
= (8) 
 
onde xi é cada elemento do conjunto de dados, x é a média do conjunto e n é o 
número total de elementos deste. 
 
Já para o desvio-padrão populacional (σ) a expressão é: 
 
( )2i
N
x µ−
=σ (9) 
 
onde xi é cada elemento da população, µ e N são respectivamente a média e o número 
total de elementos da população. 
 
Observa-se que para a população x é substituído por µ e n-1 por N. 
 Em geral, a finalidade do cálculo de uma estatística amostral (como a média, o 
desvio-padrão ou a variância) é estimar o parâmetro populacional correspondente. Se 
extrairmos muitas amostras de uma população que tem média m, calcularmos as médias 
amostrais x e se tomarmos as médias de todas as estimativas de m, veremos que essa 
média fica muito próxima de m. Entretanto, se calculássemos a variância de cada 
amostra pela fórmula: 
 
( )
n
xx 2∑ − 
 
e tomássemos a média de todas essas supostas estimativas de σ2, provavelmente 
obteríamos uma média inferior a σ2. Teoricamente, mostra-se que podemos compensar 
essa desvantagem dividindo por n-1 em vez de n na fórmula de s2. 
 Uma regra que auxilia na interpretação do valor de um desvio-padrão é a regra 
empírica, aplicável somente a conjuntos de dados aproximadamente em forma de sino, 
conforme a figura 2. Essa figura mostra como a média e o desvio-padrão estão 
relacionados com a proporção dos dados que se enquadram em determinados limites. 
Assim é que, com uma distribuição em forma de sino, temos 95% dos seus valores a 
menos de dois desvios-padrão da média. A regra empírica costuma a ser designada 
abreviadamente como a regra 68-95-99. 
 A regra 68-95-99 diz que: 
 
 
Projeto PAE – Bolsista: Michelle S. Reboita 
13 
a. cerca de 68% dos valores estão a menos de 1 desvio-padrão a contar da média; 
b. cerca de 95% dos valores estão a menos de 2 desvios-padrão a contar da média; 
c. cerca de 99,7% dos valores estão a menos de 3 desvios-padrão a contar da média. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Figura 2. Relação entre o desvio-padrão e a curva normal. 
 
Na figura abaixo foi plotada a média (20,6º C), a média acrescida de mais um 
desvio-padrão e a média descontada de um desvio-padrão da série de dados de 
temperatura média diária do mês de dezembro de 2004 da estação do IAG, com o 
objetivo de mostrar que uma grande porcentagem (cerca de 68%) dos dados ficam 
entre os limites da média somada e diminuída de um desvio-padrão. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Figura 3. Temperatura média diária do mês de dezembro de 2004 da estação do IAG 
(São Paulo), juntamente com a média da série e a média acrescida e diminuída de um 
desvio-padrão. Os dados em análise possuem desvio-padrão igual a ±2.2. 
 
 
Projeto PAE – Bolsista: Michelle S. Reboita 
14 
5.3 Variância 
 
A variância é uma medida estatística da dispersão dos dados em torno da média de 
um conjunto de dados. É obtida quando não extraímos a raiz quadrada do desvio-
padrão. A variância amostral é definida como: 
 
( )
1n
xx
s
2
i2
−
−
=
∑
 
(10) 
 
já a variância populacional é: 
 
( )
N
x 2i2 ∑ µ−
=σ (11) 
 
 A variância obtida através dos dados da tabela 1 é 4,86º C. 
 
A variância também é denominada de segundo momento, sendo: 
 
( )
n
xxm
2
i
2
−Σ
= (12) 
 
6 Assimetria 
 
A assimetria é o grau de deformação de uma curva de freqüências. Uma 
distribuição de freqüência é simétrica, ou seja, que apresenta um gráfico cuja as duas 
caudas possuem a mesma configuração (figura 4 a), quando a média, a mediana e a 
moda da série forem iguais. A distribuição de freqüência também pode ser 
assimétrica positiva (figura 4 b) e assimétrica negativa (figura 4 c), a primeira possui 
uma cauda mais alongada à direita e ocorre quando a média da sériefor maior que a 
moda e a segunda apresenta uma cauda mais alongada à esquerda e ocorre quando 
média da série for menor que a moda. 
 
 
 
 
 
 
 
 
 
 
 
 
a) 
b) c) 
Figura 4. Representação 
esquemática da assimetria. 
 
Projeto PAE – Bolsista: Michelle S. Reboita 
15 
A assimetria pode ser obtida pelo coeficiente de assimetria (A) que é uma 
medida adimensional, observe: 
 
s
MoxA −= (13) 
 
onde Mo é a moda da série. 
 
 Desde que a moda é de difícil estimativa, o coeficiente de assimetria é obtido, 
com boa aproximação, pela seguinte relação: x – Mo = 3(x – Me), onde Me é a 
mediana. Assim: 
 
( )
s
Mex3A −= (14) 
 
Mas, a medida de assimetria mais utilizada é dada pelo terceiro momento (m3) 
centrado na média, ou seja: 
 
3
3
s
mA = (15) 
 
onde: 
 
( )
n
xxm
3
i
3
−Σ
=
 
 
(16) 
 
sendo xi é cada elemento do conjunto de dados, x a média e n o número de elementos 
do conjunto (Assis, 1996). 
 
A distribuição será simétrica quando A = 0, se A for maior que zero a 
assimetria é positiva e se A for menor que zero a assimetria é negativa. 
 
 Utilizando a expressão 15 para calcular o coeficiente de assimetria dos dados 
fornecidos na tabela 1, obtemos A = -0,08 que corresponde a uma assimetria negativa, 
ou seja, a distribuição possui cauda mais alongada a esquerda. Entretanto, se 
fossemos apenas observar a figura 1 não conseguiríamos extrair esta informação 
facilmente devido a forma do histograma. 
 
7 Curtose 
 
A curtose é o grau de achatamento de uma distribuição em relação a uma 
distribuição padrão, denominada curva normal. 
 
Projeto PAE – Bolsista: Michelle S. Reboita 
16 
 A distribuição que apresenta uma curva de freqüências mais fechada que a 
normal, é denominada leptocúrtica (figura 5 a). Quando a curva de freqüência é mais 
aberta que a normal recebe o nome de platicúrtica (figura 5 b) e a curva normal é 
denominada de mesocúrtica (figura 5 c). 
 
 
 
 
 
Figura 5. Representação esquemática da curtose. 
 
A curtose (C) é definida pelo quarto momento (m4) dividido pelo o desvio-padrão 
da série elevado a quarta potência ( 4s ): 
 
4
4
s
mC = (17) 
 
onde o quarto momento é dado por: 
 
 
( )
n
xxm
4
i
4
−Σ
=
 
 
onde xi é cada elemento do conjunto de dados, x a média e n o número de elementos 
da série (Assis, 1996). 
 
A curtose é denominada mesocúrtica quando C=3, neste caso, tem-se uma curva 
normal. Se C>3, a curva de freqüência é mais fechada que a curva normal, ou seja 
possui um pico e recebe a denominação de leptocúrtica. Se C<3, a curva de freqüência 
é mais achatada que a curva normal, sendo chamada de platicúrtica. 
A curtose calculada para os dados da tabela 1 foi C = 2,2, portanto C<3 e a curva 
de freqüência é mais achatada que a curva normal. 
 
8 Separatrizes 
 
 A mediana caracteriza uma série de valores devido à sua posição central. No 
entanto, ela apresenta uma outra característica, tão importante quanto a primeira: ela 
separa a série em dois grupos que apresentam o mesmo número de valores. Assim, 
além das medidas de posição mencionadas há outras que, consideradas 
individualmente, não são medidas de tendência central, mas estão ligadas à mediana 
relativamente à sua segunda característica, já que se baseiam na sua posição na série. 
a) b) c) 
 
Projeto PAE – Bolsista: Michelle S. Reboita 
17 
Essa medidas denominadas de quantis ou fractis, são juntamente com a mediana, 
conhecidas pelo nome genérico de separatrizes. 
O quantil, por sua vez, é o nome genérico para outras medidas, como as que 
dividem o conjunto de dados em 4, 10 ou 100 partes, por exemplo. Estas são 
denominadas de quartil, decil e percentil, respectivamente. 
Os três quartis Q1, Q2 e Q3 dividem o conjunto dos dados em quatro 
subconjuntos de tal forma que 25% dos elementos situam-se abaixo do Q1; 25% entre 
Q1 e Q2; 25% entre Q2 e Q3 e 25% acima de Q3, sendo que Q2 corresponde a mediana. 
Os decis dividem o conjunto de dados em 10 partes iguais. Os nove decis D1, D2, 
D3,..., D9 são tais que 10% dos elementos situam-se abaixo de D1, 10% entre D1 e D2 e 
assim por diante. A mediana é o quinto decil. 
Os percentis dividem o conjunto dos dados ordenados em 100 partes iguais. A 
mediana é o qüinquagésimo percentil. 
 
Procedimento para obtenção dos quantis (Xavier et al., 2002): 
 
1. dispor os dados em ordem crescente; 
2. colocar um número de ordem para cada valor (i=1, ..., i=N); 
3. para cada valor determinar a ordem quantílica: Pi=i/(N+1), onde N é o número de 
elementos da série; 
4. finalmente, para calcular o quatil Q(P) para uma ordem quantílica Pi qualquer, segue-
se: 
a) se P coincidir com algum Pi já obtido, então: Q(P)=Q(Pi)=yi 
b) se P não coincidir, haverá um índice i tal que Pi<P<Pi+1, onde Q(P) será obtido por 
interpolação, onde: Q(P)=yi+{[P-Pi]/[Pi+1-Pi]}*[yi+1-yi] 
 
Exemplo 1: Extraído de Xavier et al. (2002). 
 
Considere os dados: 
 
104 5 43 123 58 63 12 71 32 
 
com N=9 observações. Determine o quartil inferior Q(0,25) e o superior Q(0,75) e o 
primeiro tercil Q(0,333): 
 
i 1 2 3 4 5 6 7 8 9 
y 5 12 32 43 58 63 71 104 123 
1/10 2/10 3/10 4/10 5/10 6/10 7/10 8/10 9/10 
Pi=i/(N+1) 0,10 0,20 0,30 0,40 0,50 0,60 0,70 0,80 0,90 
 
 O esquema considerado acima faz atribuir a cada valor de yi a “ordem 
quantílica” dada pela expressão: 
 
Projeto PAE – Bolsista: Michelle S. Reboita 
18 
Pi=i/(N+1) onde i = 1, 2, ..., N 
 
 No caso, as ordens quantílicas obtidas foram 0,10 = 10%; 0,20 = 20%; 0,30 = 
30%; 0,40 = 40%; 0,50 = 50%; 0,60 = 60%; 0,70 = 70%; 0,80 = 80% e 0,90 = 90%. 
Segue-se que os yi correspondentes serão os decis, entre os quais está a mediana que 
corresponde à ordem quantílica P = 0,50 = 50%. 
 
Como faremos para calcular o quartil inferior Q(0,25) e o quartil superior 
Q(0,75)? 
 
Q(0,25) é o quantil que corresponde à ordem quantílica P = 0,25, portanto, 
equidistante dos decis correspondentes as ordens quantílicas 0,20 e 0,30. Assim: 
 
Q(0,25)=[Q(0,20)+Q(0,30)]=(12+32)/2=22 
 
Q(0,75)=[Q(0,70)+Q(0,80)]=(71+104)/2=87,5 
 
O primeiro tercil está entre 30% e 40%, cujos quantis respectivos são 32 e 43, 
portanto: 
Q(P)=yi+{[P-Pi]/[Pi+1-Pi]}*[yi+1-yi] 
Q(33,3%)=32+{[33,3-30]/40,0-30,0]}*[43-32] 
=32+(3,3/10,0)*11 
=32+0,33*11 
=35,63 
 
Exemplo 2: Extraído de Assis et al. (1996). 
 
Dada a tabela: 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Projeto PAE – Bolsista: Michelle S. Reboita 
19 
Tabela 4: Totais anuais de chuva de Pelotas, RS, ordenados em forma crescente. 
 
i Pi=i/(N+1) Yi i Pi=i/(N+1) Yi i Pi=i/(N+1) Yi i Pi=i/(N+1) Yi 
1 0,010 680 26 0,257 1099 51 0,505 1298 76 0,752 1443 
2 0,020 689 27 0,267 1110 52 0,515 1300 77 0,762 1455 
3 0,030 832 28 0,277 1112 53 0,525 1305 78 0,772 1496 
4 0,040 856 29 0,287 1114 54 0,535 1307 79 0,782 1501 
5 0,050 857 30 0,297 1137 55 0,545 1311 80 0,792 1510 
6 0,059 864 31 0,307 1138 56 0,554 1320 81 0,802 1510 
7 0,069 885 32 0,317 1144 57 0,564 1321 82 0,812 1535 
8 0,079 890 33 0,327 1153 58 0,574 1323 83 0,822 1539 
9 0,089 890 34 0,337 1160 59 0,584 1326 84 0,832 1543 
10 0,099 919 35 0,347 1166 60 0,594 1330 85 0,842 1555 
11 0,109 923 36 0,356 1178 61 0,604 1331 86 0,851 1582 
12 0,119 926 37 0,366 1179 62 0,614 1334 87 0,861 1605 
13 0,129 931 38 0,376 1191 63 0,624 1342 88 0,871 1654 
14 0,139 952 39 0,386 1198 64 0,634 1344 89 0,881 1656 
15 0,149 973 40 0,396 1212 65 0,644 1350 90 0,891 1694 
16 0,158 982 41 0,406 1220 66 0,653 1352 91 0,901 1695 
17 0,168 998 42 0,416 1225 67 0,663 1355 92 0,911 1718 
18 0,178 1004 43 0,426 1232 68 0,673 1360 93 0,921 1724 
19 0,188 1011 44 0,436 1237 690,683 1361 94 0,931 1746 
20 0,198 1040 45 0,446 1255 70 0,693 1372 95 0,941 1778 
21 0,208 1048 46 0,455 1258 71 0,703 1373 96 0,950 1780 
22 0,218 1049 47 0,465 1265 72 0,713 1377 97 0,960 1815 
23 0,228 1054 48 0,475 1270 73 0,723 1390 98 0,970 1945 
24 0,238 1066 49 0,485 1271 74 0,733 1423 99 0,980 1995 
25 0,248 1090 50 0,495 1297 75 0,743 1435 100 0,990 2338 
 
 Para se encontrar os quartis divide-se o N+1 por 4; para os decis divide-se N+1 
por 10 e para os percentis divide-se o N+1 por 100. 
 Na tabela acima, o primeiro quartil é o valor da série ordenada cuja posição é 
(N+1)/4 = 101/4 = 25,25 que corresponde a um valor de chuva entre 1.090 e 1.099 mm; 
a mediana, o segundo quartil, é encontrada por 2(N+1)/4 = 202/4 = 50,5, ou seja, o 
valor de chuva correspondente a 1.298 mm; o terceiro quartil é o 75º valor da série 
ordenada, ou seja, 3(N+1)/4 = 75,75, sendo o valor de chuva entre 1.443 e 1.455 mm. 
 O primeiro decil corresponde a (N+1)/100 = 101/100 = 1,01, que corresponde a 
um valor de chuva compreendido entre 680 e 689 mm. Por interpolação linear obtém-
se o valor exato do primeiro decil multiplicando-se 0,01 pela diferença entre os 
valores da décima e nona observação e somando-se esse resultado ao valor da nona 
observação. Assim: 
 
680+0,01(689-680) = 680,1 mm 
 
 
 
 
Projeto PAE – Bolsista: Michelle S. Reboita 
20 
9 Referências 
 
ASSIS, F. N., et al, 1996. Aplicações de Estatística à Climatologia. Ed. Universitária, 
UFPEL, Pelotas, RS. 
 
CRESPO, A. A., 1997. Estatística Fácil. 15º Ed., Saraiva, São Paulo, SP. 
 
SILVA, N. P., 1998. Estatística Auto-Explicativa. Ed. Érica, São Paulo, SP. 
 
TRIOLA, M. F., 1998. Introdução à Estatística. 7º Ed., LTC, Rio de Janeiro, RJ. 
 
XAVIER, T. M. B. S., SILVA, J. F. e REBELLO, E. R. G., 2002. A Técnica dos Quantis. 
Thesaurus, Brasília. 
 
10 Exercício 
 
Dada a série de temperatura média diária do mês de dezembro de 2000 da estação 
meteorológica situada na cidade do Rio Grande, RS, faça: 
 
1. a distribuição e o histograma de freqüências; 
2. calcule as medidas de tendência central; 
3. calcule as medidas de dispersão; 
4. calcule o coeficiente de assimetria e curtose e 
5. compare os resultados obtidos com este conjunto de dados com os da estação do 
IAG. 
 
Dia Temperatura do Ar (ºC) Dia Temperatura do Ar (ºC) 
1 18.76 17 19.64 
2 20.5 18 22.74 
3 21.06 19 20.02 
4 20.66 20 18.86 
5 18.56 21 21.02 
6 22.28 22 22.34 
7 25.38 23 21.26 
8 25.9 24 21.32 
9 25.86 25 25.42 
10 20.52 26 28.94 
11 23.8 27 22.04 
12 24.72 26 21.92 
13 25.5 29 23.06 
14 23.22 30 21.36 
15 23.12 31 20.94 
16 17.84

Outros materiais