Buscar

Apostila de Estatistica Aplicada a Meteorologia.

Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original

UNIVERSIDADE FEDERAL DE ALAGOAS
INSTITUTO DE CIÊNCIAS ATMOSFERICAS – ICAT
CURSO DE METEOROLOGIA
PROFESSOR ROSIBERTO SALUSTIANO
ESTASTÍSTICA APLICADA A METEOROLOGIA
MACEIÓ, 2014.
ÍNDICE
1. ESTATÍSTICA BÁSICA............................................................................3
2. DISTRIBUIÇÃO DE FREQÜÊNCIA........................................................6
3. MEDIDAS DE TENDÊNCIA CENTRAL..................................................9
4. MEDIDAS DE DISPERÇÃO....................................................................16
5. REGRECÃO LINEAR.............................................................................19
6. PROBABILIDADE...................................................................................22
6.1 Exercício Resolvidos de Probabilidade...................................................25
7. DISTRIBUIÇÃO DE PROBABILIDADE................................................27
ESTATÍSTICA BÁSICA
A aplicação de técnicas estatísticas a dados meteorológicos tem a vantagem de compactar o enorme volume de dados, medidos numa estação, em uma simples tabela ou uma equação, capaz de somar todas as informações de modo a facilitar as analises sobre os dados.
Estatística pode ser: Descritiva (organização e discussão dos dados)
Indutiva (analise e interpretação) 
Variáveis: De acordo com o nível de mensuração, os fenômenos ao serem medidos, resultam em variáveis que podem ser classificadas em qualitativas e quantitativas. Esquematicamente tem-se:
Variável:
Qualitativa nominal e ordinal
Quantitativa contínua e discreta
Variável qualitativa – As variáveis são qualitativas quando resultar de uma classificação por tipos ou atributos. Exemplos podem ser vistos no quadro 1.
Quadro 1 – Exemplos de variável qualitativa (Schmildt, 2007).
	População
	Variável
	Opções para a variável
	Todos os funcionários de um hospital
	Tipo sanguíneo
	A, B, AB, O
	Candidatos a um exame vestibular em enfermagem
	Sexo
	Masculino ou feminino
	Enfermeiros de um hospital
	Insalubridade
	Recebi, não recebe
	Idosos vivendo com a família
	
Enfermeiro particular
	
Possui, não possui
Variável nominal - Ex: sexo (masculino, feminino), hábito de fumar (fumante, não fumante), sobrepeso (sim, não). Não existe ordem entre as categorias e suas representações, se numéricas, são destituídas de significado numérico; Ex: sexo masculino = 1, sexo feminino = 2. Os valores 1 e 2 são apenas rótulos.
Variável ordinal – é quando os dados podem ser distribuídos em categorias mutuamente exclusivas que têm ordenação natural. Assim, o grau de instrução é uma variável ordinal porque as pessoas podem ser distribuídas em categorias mutuamente exclusivas, na seguinte ordem: ensino fundamental, ensino médio, ensino superior. Também são ordinais, as variáveis status social e estágio da doença.
Ex: nível socioeconômico (A, B, C e D; onde A representa maior poder aquisitivo); Ex: nível de retinol sérico (alto, aceitável, baixo, deficiente) onde alto: maior ou igual a 50,0 μg/dl; aceitável: 20,0 a 49,9 μg/dl, baixo: 10,0 a 19,9 μg/dl e deficiente: menor ou igual a 10,0 μg/dl.
Variável quantitativa – Quando as características são quantitativas, os valores são expressos em números. Mas atenção. Nem sempre que se expressa em números, os dados são quantitativos. Ex: Consideremos os funcionários de um hospital. Sendo avaliados os tipos sanguíneos, trata-se de característica qualitativa. No entanto, para representar cada tipo sanguíneo, podemos usar números (1 - A; 2 - B; 3 - AB; 4 - O). Nesse caso, o número é apenas um código para o tipo sanguíneo e pode ser útil em alguns casos para registro em planilhas eletrônicas a fim de se fazer análise estatística. As variáveis quantitativas podem ser discretas ou contínuas. Os quadros 2 e 3 apresentam exemplos de variáveis discretas e contínuas respectivamente.
Quadro 2 – Exemplos de variáveis quantitativas discretas (Schmildt, 2007).
	População
	Variável
	Possíveis valores p/ a variável
	Enfermeiros de um hospital
	Números de filhos
	0, 1, 2, 3, 4, 5,... Filhos
	Escolas de enfermagem do sudeste brasileiro
	Produção científica 
	0, 1, 2, 3, 4,... Trabalhos por escolas
	Escolas de enfermagem do sudeste brasileiro
	Número de professores
	0, 1, 2, 3, 4,..., 15,... Professores por escolas 
	Hospitais do Norte do Espírito Santo
	Número de enfermeiros por hospital
	0, 1, 2, 3, 4,..., 10,... Enfermeiros por hospital
Quadro 3 – Exemplos de variáveis quantitativas contínuas (Schmildt, 2007).
	População
	Variável aleatória (x)
	Possíveis valores p/ a V.A.
	Enfermeiros no Brasil
	Salário bruto mensal (R$)
	R$ 2003,52; R$3000,00...
	Enfermeiros de um hospital
	Anos de trabalhos
	1; 1,5; 1,6; 15,3; 20,5...
	Médicos no Espírito Santo
	Experiência de trabalho no SUS, em anos
	0,2; 2,3; 3,0; 5,2;...
	Enfermeiros em São Mateus
	Idade em anos
	25; 27,4; 30,2;...
Amostra: É uma parcela da população convenientemente escolhida
Amostragem: É o processo de seleção da amostra. 
Pode ser:
• Probabilística - cada unidade amostral tem probabilidade conhecida e diferente de zero de pertencer à amostra. É usada alguma forma de sorteio para a obtenção da amostra.
• Não probabilística - não se conhece a probabilidade de cada unidade amostral pertencer à amostra. Algumas unidades terão probabilidade zero de pertencer à amostra. Ex: amostragem intencional; por voluntários; acesso mais fácil; por quotas.
Tipos de amostragem probabilística
• aleatória simples (com e sem reposição)
• sistemática
• com partilha proporcional ao tamanho do estrato
• por conglomerado
Amostragem aleatória simples (AAS): É o processo de amostragem onde qualquer subconjunto de n elementos diferentes de uma população de N elementos têm mesma probabilidade de ser sorteado. Tamanho da população: N; tamanho da amostra: n; fração global de amostragem ou probabilidade de sortear um indivíduo = n / N. Utilização de programas computacionais.
Amostragem sistemática: Utiliza-se a ordenação natural dos elementos da população (prontuários, casa, ordem de nascimento). Intervalo de amostragem k = N / n, onde N= tamanho da população e n = tamanho da amostra.
Amostragem por conglomerado: É o processo no qual os elementos da população são reunidos em grupos que constituem a unidade amostral e, por sua vez, alguns destes são sorteados para comporem a amostra. Se o interesse residir no sorteio de escolares, em um processo de amostragem por conglomerados, seria possível sortear escolas (unidade amostral) e considerar todos os alunos destas para comporem a amostra.
Estimativa: Valor do estimador calculado em uma amostra. Estima o valor do parâmetro. 
Ex: Peso médio ao nascer, calculado em uma amostra de 120.000 crianças nascidas no Município de São Paulo no ano de 2000: média amostral x = 3000g.
População (ou Universo): é a totalidade dos itens ou objetos considerados. É o conjunto de todos os elementos de interesse em um determinado estudo.
Rol: é a organização dos dados de forma ordenada, normalmente na ordem crescente de grandeza. Freqüências – com que freqüência aparece determinado valor de uma variável. Essa pode ser absoluta, relativa, porcentual e acumulativa.
Estatística Indutiva ou Inferência Estatística: é a parte que, baseando-se em resultados de uma amostra, procura inferir ou tirar conclusões para o comportamento da população, dando a precisão dos resultados e com que probabilidade se pode confiar neles.
Bioestatística: Estatística aplicada às ciências biológicas
2. DISTRIBUIÇÃO DE FREQUÊNCIA
A distribuição de freqüências é uma tabela que relaciona categorias ou classes
de valores, juntamente com contagens ou freqüências do número de valores que se enquadram em cada categoria (Triola, 1998). A distribuição de freqüências pode ser representada através de um histograma, que é um gráfico cujas
bases são os limites das classes e as alturas são as freqüências. Quando a variável é quantitativa contínua, a melhor forma de apresentá-la em tabelas é utilizando intervalos de valores denominados intervalos de classe.
Regras:
	N (número de elementos)
	Número de classe mínima
	Número de classe máxima
	Até 50
	5
	10
	100
	8
	16
	200
	10
	20
	300
	12
	24
	500
	15
	30
	1000 ou mais
	20
	40
*Uma outra regra é: se N ≤ 25 → número de classe = 5
se N > 25 → número de classe = 
Onde: N = número total de dados ou Ʃf
LIMITE DE CLASSE (Limite superior “Li”, Limite inferior “li”): 
São os valores extremos de cada classe.
AMPLITUDE DE CLASSE (h): 
É a diferença do limite superior com o limite inferior 
h = Li-li
PONTO MÉDIO DA CLASSE (x):
É o limite superior somado com o limite inferior e dividido por 2.
X = + 
FREQÜÊNCIA RELATIVA (fr): 
É a freqüência de cada classe dividida pela freqüência total.
fr = 
onde:
 f = frequêcia de cada classe
F = freqüência total ou ∑f
FREQÜÊNCIA ACUMULADA (fa): 
É a freqüência total de todos os valores inferiores ao limite superior em um dado intervalo.
FREQÜÊNCIA RELATIVA ACUMULA (fr, a):
 É a freqüência relativa total de todos os valores inferiores ao limite superior em um dado intervalo.
fr, a = 
Exemplo: Dados da temperatura horária na cidade de Maceió AL no dia 26/03/2012.
Fonte: INMET
	Hora UTC
	Temperatura (C)
	00
	25.1
	01
	25.1
	02
	25.1
	03
	24.4
	04
	24.2
	05
	23.4
	06
	22.7
	07
	22.8
	08
	22.2
	09
	22.5
	10
	24.8
	11
	27.0
	12
	27.9
	13
	28.8
	14
	29.4
	15
	30.0
	16
	29.6
	17
	29.8
	18
	29.6
	19
	28.0
	20
	26.9
	21
	26.2
	22
	25.9
	23
	25.6
TABELA 1:
	Intervalo de classe (°C)
	x
	f
	fr
	fa
	fr,a
	22― 24
	23
	5
	0.208
	5
	0.208
	24 ― 26
	25
	8
	0.333
	13
	0.541
	26 ― 28
	27
	4
	0.166
	17
	0.707
	28 ― 30
	29
	6
	0.250
	23
	0.957
	30 ― 32
	31
	1
	0.041
	24
	1
	∑
	
	24
	1
	24
	1
 3. MEDIDAS DE TENDÊNCIA CENTRAL
São medidas que na prática, possibilitam determinar um valor compreendido entre o menor e o maior valor da série numérica, ou seja, o valor localizado no centro ou no meio de um conjunto de dados. Há diferentes maneiras de definir o centro de um conjunto de dados, assim, há diferentes definições de medidas de tendência central como: média, mediana, moda e ponto médio.
QUARTIS
Dividem (separam) uma Distribuição de Freqüência em 4 partes iguais.
No 1º Quartil (Q1), 25% dos elementos estarão abaixo dele e 75%, acima.
No 2º Quartil (Q2), 50% dos elementos estarão abaixo dele e 50%, acima.
Observe então que o 2º Quartil é igual à Mediana.
No 3º Quartil (Q3), 75% dos elementos estarão abaixo dele e 25%, acima.
Fórmulas para cálculo dos Quartis:
onde:
	
li = limite inferior da classe 
N = números de dados
i = é o número do quartil desejado
∑fi= soma das freqüências anteriores à classe qi
h = amplitude da classe
fqi = freqüência da classe qi
DECIS:
Dividem uma Distribuição de freqüência em 10 partes iguais.
No 1º Decil (D1), 10% dos elementos estarão abaixo dele e 90%, acima.
No 2º Decil (D2), 20% dos elementos estarão abaixo dele e 80%, acima.
No 3º Decil (D3), 30% dos elementos estarão abaixo dele e 70%, acima, e assim por diante.
Fórmula para cálculo dos Decis:
 = * h
onde:
	
li = limite inferior da classe 
N = números de dados
i = é o número decil desejado
∑fi= soma das freqüências anteriores à classe di
h = amplitude da classe
fdi = freqüência da classe di
PERCENTIS
Dividem uma Distribuição de freqüência em 100 partes iguais. 
Então:
No 1º Percentil (P1), 1% dos elementos estarão abaixo dele e 99% estarão acima.
No 2º Percentil (P2), 2% dos elementos estarão abaixo dele e 98% estarão acima.
No 3º Percentil (P3), 3% dos elementos estarão abaixo dele e 97% estarão acima.
No 99º Percentil (P99), 99% dos elementos estarão abaixo dele e 1% estarão acima, e assim por diante.
Fórmula para cálculo dos percentis:
 = li * h
onde:
	
li = limite inferior da classe 
N = números de dados
i = é o número do percentil desejado
∑fi= soma das freqüências anteriores à classe Pi
h = amplitude da classe
fpi = freqüência da classe Pi
Obs: Para achar a classe do percentil, decil ou quartil na tabela de distribuição de frequência:
Classe Percentil: = frequência acumulada da classe do percentil
Classe Decil: = frequência acumulada da classe do decil
Classe Quartil: = frequência acumulada da classe do quartil
Onde:
N = número de dados da amostra
 = percentil desejado
 = decil desejado
= quartil desejado
 i = é o número do quartil, decil ou percentil desejado
MÉDIA ARITIMETICA ():
A média aritmética de um conjunto de dados é o valor obtido somando-se todos os elementos do conjunto e dividindo-se a soma pelo número total de elementos.
 = 
Para dados agrupados:
= *
onde:
 N = números de dados
 F = frequêcia total (F = N)
 f = frequência de cada classe
X = ponto médio de cada classe 
MEDIANA (M):
É definida como o valor central ou a média aritmética dos dois valores centrais de um conjunto de dados.
Ex: 1, 4, 5, 7, 8 → M = 5; 
1, 4, 5, 7, 8, 9 → M = 6, pois 5+7 = 12/2= 6
Para dados agrupados:
M = l i+( )* h
onde: 
li = limite inferior da classe mediana
F = frequecia total
∑ fi = soma das frequências das classes inferiores a da classe mediana
fmed = frequência da classe mediana
h = amplitude da classe
Obs: a classe mediana será a primeira classe onde a freqüência acumulada (fa) apresentar um valor maior ou igual a N/2. 
MODA (M0):
É o valor que ocorre com maior freqüência.
Ex: 1, 4, 8, 10, 10, 11 → M0 = 10
1, 4, 8, 10, 11 → Amodal (não existe Moda)
2, 2, 4, 4, 6, 2, 4 → M0 = 2 e 4 (Bimodal)
Para dados agrupados:
M0 = li +() * h
Onde: 
li = limite inferior da classe modal 
∆1 = excesso da frequência da classe modal imediatamente inferior (diferença da freqüência da classe modal com a freqüência da classe anterior)
 ∆2 = excesso da frequência da classe modal imediatamente superior (diferença da freqüência da classe modal com a freqüência da classe posterior)
 h = amplitude da classe
Obs: a classe modal é aquela onde a freqüência apresenta o maior valor.
PONTO MÉDIO (X):
O ponto médio é o valor que está a meio caminho entre o maior e o menor valor da série de dados. Para obtê-lo, somamos esses valores extremos e dividimos o resultado por 2, como na expressão a seguir (Triola, 1998):
 + = X
Ex: 3, 4, 5, 7, 9, 11 → X = 7, pois 3+11 = 14 / 2 = 7
Exemplo: umidade relativa do ar horária na cidade de Coruripe AL nos dias 25 e 26 de março de 2012.
Fonte: INMET
	Hora UTC dia
25/03/2012
	Umidade Relativa
do ar (%)
	
	Hora UTC dia
26/03/2012
	Umidade relativa
do ar (%)
	00
	83
	
	00
	78
	01
	85
	
	01
	80
	02
	85
	
	02
	79
	03
	85
	
	03
	81
	04
	86
	
	04
	82
	05
	84
	
	05
	84
	06
	83
	
	06
	84
	07
	83
	
	07
	85
	08
	82
	
	08
	85
	09
	82
	
	09
	86
	10
	78
	
	10
	81
	11
	69
	
	11
	73
	12
	66
	
	12
	54
	13
	66
	
	13
	54
	14
	66
	
	14
	47
	15
	60
	
	15
	53
	16
	62
	
	16
	54
	17
	60
	
	17
	46
	18
	62
	
	18
	51
	19
	67
	
	19
	60
	20
	72
	
	20
	67
	21
	76
	
	21
	74
	22
	77
	
	22
	78
	23
	79
	
	23
	80
TABELA 2:
	Intervalo de
classe (%)
	 x
	 f
	fa
	f.x
	fr
	fr,a
	44 ― 50
	47
	2
	2
	94
	0.041
	0.041
	50 ― 56
	53
	5
	7
	265
	0.104
	0.145
	56 ― 62
	59
	3
	10
	177
	0.062
	0.207
	62 ― 68
	65
	7
	17
	455
	0.145
	0.352
	68 ― 74
	71
	3
	20
	213
	0.062
	0.414
	74 ― 80
	77
	8
	28
	616
	0.166
	0.580
	80 ― 96
	83
	18
	46
	1494
	0.357
	0.955
86 ― 92
	89
	2
	48
	178
	0.041
	1
	∑
	
	48
	48
	3492
	1
	1
1º QUARTIL DE ACORDO COM A TABELA 2:
 = 62+ ( ) * 6
 = 63,7%
8º DECIL DE ACORDO COM A TABELA 2:
 = li + ) * h
 = 80 + ( ) * 6
 = 83,4%
55º PERCENTIL DE ACORDO COM A TABELA 2:
 = 74+ ( ) * 6
 = 78,8%
MÉDIA DE ACORDO COM A TABELA 2:
 = * 3492
 = 72%
MEDIANA DE ACORDO COM A TABELA 2:
M = 74+ (* 6
 M = 77%
 MODA DE ACORDO COM A TABELA 2:
M0 = 80 + () * 6
 M0 = 82%
PONTO MÉDIO DE ACORDO COM A TABELA 2:
Maior valor = 86
Menor valor = 46
PM = 
 PM = 66
4. MEDIDAS DE DISPERSÃO
São medidas estatísticas responsáveis pela variação ou dispersão de uma série.
VARIÂNCIA (S²):
S² = *
Onde:
X = ponto médio
 = média
N = número total de dados
Para dados agrupados:
S² = * ∑f(x – )²
DESVIO PADRÃO(S):
S = 
COEFICIENTE DE VARIAÇÃO (CV):
Expressa a relação percentual entre o desvio padrão e a média.
Cv = 100 * (%)
ERRO PADRÃO DA MÉDIA (S()):
S( ) = 
 
Exemplo: dados da direção do vento na cidade de Maceió do dia 20 de março de 2012.
Fonte: INMET
	Hora UTC
20/03/2012
	Direção do
vento
	00
	90°
	01
	94°
	02
	98°
	03
	92°
	04
	88°
	05
	82°
	06
	2°
	07
	334°
	08
	334°
	09
	288°
	10
	28°
	11
	51°
	12
	98°
	13
	83°
	14
	80°
	15
	95°
	16
	84°
	17
	102°
	18
	87°
	19
	78°
	20
	83°
	21
	81°
	22
	91°
	23
	86°
TABELA 3:
	 Intervalo de classe (em graus)
	
 x
	
 f
	
f.x
	
 (x―)
	 f(x―)
	
(x―)²
	
f(x―)²
	0 ― 70
	35
	3
	105
	-87.5
	-262.5
	7656.6
	22968.8
	 70 ― 140
	105
	18
	1890
	-17.5
	-315
	306.6
	5512.5
	140 ― 210 
	175
	0
	0
	52.5
	0
	2756.6
	0
	210 ― 280
	245
	0
	0
	122.5
	0
	15006.6
	0
	280 ― 350
	315
	3
	945
	192.5
	577.5
	37056.6
	111168.8
	∑
	
	24
	2940
	262.5
	0
	62781.6
	139650
MÉDIA DE ACORDO COM A TABELA 3:
 = *
 = * 2940
 = 122,5°
VARIÂNCIA DE ACORDO COM A TABELA 3:
S² = *
S² = * 139650
 S² = 6071,7
DESVIO PADRÃO DE ACORDO COM A TABELA 3:
S = 
S = 
 S = 77, 9°
COEFICIENTE DE VARIAÇÃO DE ACORDO COM A TABELA 3:
Cv = 100 *(%)
Cv = 100 * 
Cv = 63,3%
ERRO PADRÃO DA MÉDIA DE ACORDO COM A TABELA 3:
S() = 
S() = 
 S() = 15,9°
5. REGRESSÃO LINEAR
Análise de regressão é uma metodologia estatística que utiliza a relação entre duas ou mais variáveis quantitativas (ou qualitativas) de tal forma que uma variável (y) pode ser predita a partir da outra variável (x). 
Ex: A população de bactérias pode ser predita a partir da relação entre população e o tempo de armazenamento.
MÉTODO DOS MÍNIMOS QUADRADOS
É o método de computação matemática pelo qual se define a curva de regressão. Esse método definirá uma reta que minimizará a soma das distâncias ao quadrado entre os pontos plotados (X, Y) e a reta (X’,Y’). Pelo método dos mínimos quadrados se calcula os parâmetros “a“ e “b” da reta que minimizam estas distâncias ou as diferenças (ou o erro) entre Y e Y’. Esta reta é chamada de curva de regressão.
= y estimado
ŷ = a + b*xʹ
Onde: 
a = , ou 
b = *
ŷ = a+ b (x – )
COEFICIENTE DE CORRELAÇÃO LINEAR
O coeficiente de correlação de Pearson é uma medida do grau de relação linear entre duas variáveis quantitativas. Este coeficiente varia entre os valores -1 e 1. O valor 0 (zero) significa que não há relação linear, o valor 1 indica uma relação linear perfeita e o valor -1 também indica uma relação linear perfeita mas inversa, ou seja quando uma das variáveis aumenta a outra diminui. Quanto mais próximo estiver de 1 ou -1, mais forte é a associação linear entre as duas variáveis.O coeficiente de correlação de Pearson é normalmente representado pela letra r e a sua fórmula de cálculo é:
 Exemplo: experimento agrometerológico durante o período de 2002 a 2010.
	x (anos)
	2002
	2004
	2006
	2008
	2010
	y (produção de feijão em toneladas)
	6.0
	7.5
	9.0
	11.5
	13.0
TABELA 4:
	 x
	 y
	 x―
	(x―)²
	y(x―)
	(y―)
	(y―)²
	(y―).(x―)
	2002
	6.0
	-4
	16
	-24
	-3.4
	11.56
	13.6
	2004
	7.5
	-2
	4
	-15
	-1.9
	3.61
	3.8
	2006
	9.0
	0
	0
	0
	-0.4
	0.16
	0
	2008
	11.5
	2
	4
	23
	2.1
	4.41
	4.2
	2010
	13.0
	4
	16
	52
	3.9
	12.96
	14.4
	∑
	47.0
	0
	40
	36
	
	32.7
	36
MÉDIA DE X DE ACORDO COM A TABELA 4:
 = 
 = 2006
CÁLCULO DOS MÍNIMOS QUADRADOS DE ACORDO COM A TABELA 4:
a = = Média de y
a = 
a= 
 a = 9,4
b = 
 b = 0,9
ŷ = a + b (x –)
 ŷ = 9,4 + 0,9 (x – 2006)
ESTIMATIVA DO VALOR DA PRODUÇÃO DO FEIJÃO PARA 2007 E PARA 2011:
Y ESTIMADO PARA 2007
ŷ = 9,4 + 0,9 (2007 – 2006)
 ŷ = 10,3 t
Y ESTIMADO PARA 2011
ŷ = 9,4 + 0,9 (2011 – 2006)
ŷ = 9,4 + 4,5
 ŷ = 13,9 t
6. PROBABILIDADE:
È um conceito filosófico e matemático que permite a quantificação da
Incerteza e da aleatoriedade e usada para a realização de previsões ou para a orientação de intervenções. É aquilo que torna possível se lidar de forma racional com problemas envolvendo o imprevisível.
Algumas Propriedades: 
P(Ø) = 0
P(A) + P(Ā) = 1
P(B) = P(B∩A) + P(B∩Ā)
P(AUB) = P(A) + P(B) - P(A∩B)
P(AUBUC) = P(A) + P(B) + P(C) - P(A∩B) - P(A∩C) - P(B∩C) + P(A∩B∩C)
Experimento Aleatório: 
É todo experimento que produz resultados imprevisíveis, dentre os possíveis, mesmo quando repetido em semelhantes condições.
 Ex: No lançamento de um dado, pode-se obter os resultados 1, 2, 3, 4 ,5 e 6, ou seja, o resultado é incerto.
Espaço Amostral: 
É o conjunto de todos os resultados possíveis de um determinado
experimento aleatório. É Indicado pela letra S.
Ex:
Lançamento de um dado: S = {1, 2, 3, 4, 5, 6, }
Lançamento de uma moeda: S = {cara, coroa}
Sexo de um recém-nascido: S = {masculino, feminino}
Evento: 
É todo subconjunto do espaço amostral relacionado a um experimento aleatório.
Considere o experimento aleatório, do lançamento de um dado: S = {1, 2, 3, 4, 5, 6},
Ex:
A: Um número par , A = {2, 4, 6}
B: Um número par e primo, B = {2} ( evento simples ou elementar)
C: Um número maior que 6, C = Ø (evento impossível)
D: Um número menor que 7, D = {1,2,3,4,5,6} (evento certo), D = S
E: Um número menor ou igual 4, E = { 1,2,3,4} 
F: um número maior ou igual a 4, F = { 4,5,6}
Obs.: EUF = S , logo, E e F são chamados de eventos exclusivos.
Regra da Multiplicação:
A probabilidade de dois eventos acontecerem (A e B) em seqüência é dado por:
P(A e B) = P(A) . P(B/A)
Se dois eventos A e B são independente pode-se fazer a simplificação:
P(A e B) = P(A) . P(B)
Ex:
A probabilidade de um salmão atravessar uma barragem é de 0,85. A probabilidade de três salmões atravessarem a barragem é:
P(A, B e C) = P(A).P(B).P(C)
P(S) = 0,85 .0,85 . 0,85 = 0,61 → 61%
Probabilidade da União de Dois Eventos: 
Se A e B são dois eventos do mesmo espaço amostral S, então:
P(A U B) = P(A) + P(B) – P (A∩B)
Se A∩B = Ø, teremos:
P(AUB) = P(A) + P(B)
Probabilidade de Um Evento em um Espaço Amostral Finito: 
Seja S um espaço amostral equiprovável e A um de seus eventos. Denomina-se
Probabilidade do evento A o número P(A) tal que:
P(A) = n(A) / n(S)
Onde: n(A) = nº de elementos do evento A e n(S) = nº de elementos do espaço amostral 
S.
Probabilidade Condicional:
Muitas vezes o fato de ficarmos sabendo que certo evento ocorreu faz
com que se modifique a probabilidade que atribuímos a outro evento.A Probabilidade Condicional é a probabilidade de ocorrência de um evento quando se dispõe da informação que um outro evento ocorreu.
P(A\B) = Probabilidade do evento A ocorrer sabendo-se que o evento B ocorreu.
P(A\ B) = P(A∩B) / P(B)
Regra do produto: P(A∩B) = P(A / B) .P(B)
Ex4: Duas cartas são retiradas em sequência de um baralho. Determine a probabilidade da segunda
carta ser uma dama, dado que a primeira carta foi um rei e não foi recolocada.
P(Da/Rei) = = 0,08 = 8%
Probabilidade Subjetiva:
É a probabilidade de que um particular evento ocorra atribuído por um indivíduo e baseada em um conjunto de informação disponível.
Ex: Estimar a probabilidade de que o time de futebol da Ponte Preta disputara a final do campeonato nacional;
Eventos Dependentes e Independentes: 
Dois ventos são independentes se a ocorrência do evento “A”não interferir na ocorrência do evento “B”.
P(‘B/A) = P(‘B) ou P(A/B) = P(A)
Obs. Os eventos que não são independentes são necessariamente dependentes.
P(B) = P(B/A) → independente
Ex
:jogar uma moeda, obter cara (A) então jogar um dado com 6 faces e obter (B)
P(6/ca) = 1/6 e P(6) = 1/6
P(B) # P(B/A) → dependente
Ex: Selecionar um rei de um baralho comum (B) não recolocado, e selecionar uma dama do baralho (A)
P(A/B) = 4/51 e P(A) 4/52 
6.1 EXERCÍCIOS RESOLVIDOS DE PROBABILIDADE
Exemplo 1: São jogados uma moeda e um dado . Qual a probabilidade de sair cara 6?
P(A e B) = P(moeda) * P(dado) = * = = 0,08 = 8%
Exemplo 2: A probabilidade de um salmão atravessar uma barragem é de 0,85. Determine a probabilidade de três salmões atravessarem a barragem?
P(A, B e C) = P(A) * P(B) * P(C)
P(A, B e C) = 0,85 * 0,85 * 0,85 = 0,614 = 61,4%
Exemplo 3: Retira-se uma carta de um baralho completo de 52 cartas. Qual a probabilidade de sair um rei ou uma carta de espada?
P(A U B) = P(A)+P(B) – P(A∩B)
P(Rei) = 
P(Espada) = 
P(Rei∩Espada) = 
P(AUB) = + + = = = 0,3 = 30%
Exemplo4: Duas cartas são retiradas em sequência de um baralho. Determine a probabilidade da segunda carta ser uma dama, dado que a primeira carta foi um rei e não foi recolocada.
P(Da/Rei) = = 0,08 = 8%
 Exemplo 5: Um grupo de 50 moças é classificado de acordo com a cor dos cabelos, e dos olhos de cada moça, segundo a tabela:
	
	Olhos azuis
	Cabelos castanhos
	Loira
	17
	09
	Morena
	04
	14
	Ruiva
	03
	03
Determine a probabilidade de ter:
Morena de olhos azuis?
P(M∩A) = 
Morena ou ter olhos azuis?
P(MUA) = P(M) + P(A) – P(M∩A) = + - = = 0,76 = 76%
Exemplo 6: A tabela abaixo mostra o resultado no qual pesquisadores examinaram o QI de 102 criança e a presença de um gene específico nela. 
	
	Presença do gene
	Não pres. do gene
	Total 
	QI alto
	33
	19
	52
	QI normal
	39
	11
	50
	Total 
	72
	30
	102
Qual a probabilidade de ter uma criança com QI alto, dado que ela tem o gene?
P(QI alto/P.gene) = = 0,458 = 45,8%
Determine a probabilidade da criança não ter o gene.
P(Não P.gene) = = 0,294 = 29,4%
Determine a probabilidade da criança não ter o gene, dado que ela tem QI normal.
P(Não gene/ QI normal) = = 0,22 = 22%
Exemplo 7: Um banco de sangue cataloga os tipos sanguíneos e o fator Rh positivo e negativo dos doadores de sangue durante 5 dias.
	
	O
	A
	B
	AB
	Total 
	Positivo 
	156
	139
	37
	12
	344
	Negativo 
	28
	25
	8
	4
	65
	Total 
	184
	164
	45
	16
	409
Qual a probabilidade de ter um doador tipo sanguíneo O ou A?
P(OUA) = P(A) + P(O) = + = = 0,85 = 85%	
Qual probabilidade de ter um doador do tipo B ou Rh negativo?
P(BURh-) = P(B) + P(Rh-) – P(B∩Rh-) = + - = = 0,25 = 25%
Qual a probabilidade do tipo sanguíneo AB, dado o Rh+
P(AB/ Rh+) = = 0, 035 = 3,5%
7. DISTRIBUIÇÃO DE PROBABILIDADE
Um erro muito comum em análise de dados climatológicos é desprezar as características da distribuição de probabilidades mais adequada para os dados em estudo. O mais freqüente é adotar-se a distribuição normal, o que pode resultar, se os dados não seguem essa distribuição, em conclusões erradas. 
	A distribuição de probabilidades associa uma probabilidade a cada resultado numérico de um experimento, ou seja, dá a probabilidade de cada valor de uma variável aleatória. Por exemplo, no lançamento de um dado cada face tem a mesma probabilidade de ocorrência que é 1/6. Como os valores das distribuições de probabilidades são probabilidades, e como as variáveis aleatórias devem tomar um de seus valores, temos as duas regras a seguir que se aplicam a qualquer distribuição de probabilidades: 
1. A soma de todos os valores de uma distribuição de probabilidades deve ser igual a 1
2. A probabilidade de ocorrência de um evento deve ser maior do que zero e menor do que 1
	No exemplo do lançamento de um dado, como todas as faces têm a mesma probabilidade de ocorrência que é 1/6 ao somá-las obtemos o valor 1, que corresponde a primeira regra citada acima. O valor 1/6 é maior do que zero e menor do que 1, assim satisfaz a segunda regra acima.
A distribuição de probabilidades pode ser representada por um histograma de probabilidades. Este se assemelha ao histograma de freqüências, entretanto a escala vertical representa probabilidades, em lugar das freqüências relativas. O histograma de probabilidades nos permite visualizar a forma da distribuição. 
VARIÁVEL ALEATÓRIA
A variável aleatória é uma variável que tem um valor único (determinado aleatoriamente) para cada resultado de um experimento. A palavra aleatória indica que em geral só conhecemos aquele valor depois do experimento ser realizado.
Exemplos de variáveis aleatórias:
 Número de alunos que não compareceram a aula de estatística num determinado dia;
Altura de um adulto do sexo masculino selecionado aleatoriamente.
 	As variáveis aleatórias também podem ser discretas ou contínuas:
Variável aleatória discreta: é aquela que assume valores inteiros e finitos.
Variável aleatória contínua: é aquela que pode assumir inúmeros valores num intervalo de números reais e é medida numa escala contínua. 
ASSIMETRIA
 	A assimetria é o grau de deformação de uma curva de frequências. Uma distribuição de frequência é simétrica, ou seja, que apresenta um gráfico cuja as duas caudas possuem a mesma configuração, quando a média, a mediana e a moda da série forem iguais. A distribuição de frequência também pode ser assimétrica positiva e assimétrica negativa, a primeira possui uma cauda mais alongada à direita e ocorre quando a média da série for maior que a moda e a segunda apresenta uma cauda mais alongada à esquerda e ocorre quando média da série for menor que a moda.
Figura 1: formas de Assimetria
	
A assimetria pode ser obtida pelo coeficiente de assimetria (A) que é uma medida adimensional, observe:
A = - 
Onde:
M0 = moda
 = media
S = desvio padrão
CURTOSE
 	A curtose é o grau de achatamento de uma distribuição em relação a uma distribuição padrão, denominada curva normal.
A curtose é denominada Mesocúrtica quando K = 3, neste caso, tem-se uma curva normal. Se K > 3, a curva de freqüência é mais fechada que a curva normal, ou seja, possui um pico e recebe a denominação de Leptocúrtica. Se K< 3, a curva de freqüência é mais achatada que a curva normal, sendo chamada de Platicúrtica
A curtose (K) é definida pelo quarto momento (m4) dividido pelo o desvio-padrão da série elevado a quarta potência (s 4 ):
K= 
onde o quarto momento é dado por:
M4 = 
DISTRIBUIÇÕES CONTÍNUAS
	A maioria das variáveis atmosféricas podem assumir valores contínuos. A temperatura, a precipitação, a altura geopotencial, a velocidade do vento, e outras quantidades não estão restritas a valores inteiros de unidades físicas em que são medidas. Embora a natureza da medição e os sistemas de relatos é tal que as medidas atmosféricas são arredondadas para valores discretos, mas o conjunto de valores observados normalmente é grande o suficiente para que a maioria das variáveis possam ainda ser tratadas como quantidades contínuas. 
Há muitas distribuições teóricas contínuas. Algumas das mais usadas em ciências atmosféricas são: Distribuição Normal, Distribuição Gamma, e Distribuição Exponencial. 
Distribuição Normal
	É a distribuição de probabilidade contínua mais importante e mais utilizada,
geralmente citada como curva normal ou curva de Gauss. Sua importância em análise matemática resulta do fato de que muitas técnicas estatísticas, como análise de variância, de regressão e alguns testes de hipótese, assumem e exigem a normalidade dos dados. 
	A distribuição normal é uma distribuição de dois parâmetros (média) e (desvio-padrão). A distribuição normal é simplesmente uma forma de descrever o quão provável são os vários resultados de um processo. É geralmente apresentada na forma de gráfico. 
Ex: considere os seguintes dados relativos às alturas de um grupo de 500 crianças de oito anos de idade.
	Intervalo de classes (Altura em cm)
	Frequência
	100 – 110
	20
	110 – 120
	48
	120 – 130
	100
	130 – 140
	170
	140 – 150
	98
	150 – 160
	44
	160 – 170
	20
Exemplo em relação ao gráfico:
Qual a probabilidade de 20 crianças das 500 terem mais de 160 cm de altura?
R: P(c) = 20/500 = 0,04 = 4%.
Se uma amostra de dados tem realmente distribuição normal a seguinte relação é válida: A = 0 e K = 3. A curtose da distribuição normal é igual a 3 e a assimetria é nula.
	O histograma de freqüências da distribuição normal tem a forma de sino, Com a média constante e a variância variável, o gráfico da curva normal assume diferentes formas de sino: de alongada a achatada. 
Distribuição Gamma
Muitas variáveis atmosféricas possuem assimetria positiva, ou seja, são distorcidas à direita. Freqüentemente a distorção ocorre quando há um limite físico à esquerda que é relativamente próximo a variação dos dados. Exemplos comuns desta situação são as quantias de precipitação e a velocidade do vento que são fisicamente não negativas. Há uma variedade de distribuições contínuas que são limitas à esquerda por zero. Entretanto, a distribuição Gamma é comumente usada para representar dados de precipitação. 
Distribuição Exponencial
A distribuição exponencial é geralmente aplicada a dados com forte assimetria como aqueles cujo histograma tem a forma de J invertido.

Teste o Premium para desbloquear

Aproveite todos os benefícios por 3 dias sem pagar! 😉
Já tem cadastro?

Outros materiais