Baixe o app para aproveitar ainda mais
Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original
UNIVERSIDADE FEDERAL DE ALAGOAS INSTITUTO DE CIÊNCIAS ATMOSFERICAS – ICAT CURSO DE METEOROLOGIA PROFESSOR ROSIBERTO SALUSTIANO ESTASTÍSTICA APLICADA A METEOROLOGIA MACEIÓ, 2014. ÍNDICE 1. ESTATÍSTICA BÁSICA............................................................................3 2. DISTRIBUIÇÃO DE FREQÜÊNCIA........................................................6 3. MEDIDAS DE TENDÊNCIA CENTRAL..................................................9 4. MEDIDAS DE DISPERÇÃO....................................................................16 5. REGRECÃO LINEAR.............................................................................19 6. PROBABILIDADE...................................................................................22 6.1 Exercício Resolvidos de Probabilidade...................................................25 7. DISTRIBUIÇÃO DE PROBABILIDADE................................................27 ESTATÍSTICA BÁSICA A aplicação de técnicas estatísticas a dados meteorológicos tem a vantagem de compactar o enorme volume de dados, medidos numa estação, em uma simples tabela ou uma equação, capaz de somar todas as informações de modo a facilitar as analises sobre os dados. Estatística pode ser: Descritiva (organização e discussão dos dados) Indutiva (analise e interpretação) Variáveis: De acordo com o nível de mensuração, os fenômenos ao serem medidos, resultam em variáveis que podem ser classificadas em qualitativas e quantitativas. Esquematicamente tem-se: Variável: Qualitativa nominal e ordinal Quantitativa contínua e discreta Variável qualitativa – As variáveis são qualitativas quando resultar de uma classificação por tipos ou atributos. Exemplos podem ser vistos no quadro 1. Quadro 1 – Exemplos de variável qualitativa (Schmildt, 2007). População Variável Opções para a variável Todos os funcionários de um hospital Tipo sanguíneo A, B, AB, O Candidatos a um exame vestibular em enfermagem Sexo Masculino ou feminino Enfermeiros de um hospital Insalubridade Recebi, não recebe Idosos vivendo com a família Enfermeiro particular Possui, não possui Variável nominal - Ex: sexo (masculino, feminino), hábito de fumar (fumante, não fumante), sobrepeso (sim, não). Não existe ordem entre as categorias e suas representações, se numéricas, são destituídas de significado numérico; Ex: sexo masculino = 1, sexo feminino = 2. Os valores 1 e 2 são apenas rótulos. Variável ordinal – é quando os dados podem ser distribuídos em categorias mutuamente exclusivas que têm ordenação natural. Assim, o grau de instrução é uma variável ordinal porque as pessoas podem ser distribuídas em categorias mutuamente exclusivas, na seguinte ordem: ensino fundamental, ensino médio, ensino superior. Também são ordinais, as variáveis status social e estágio da doença. Ex: nível socioeconômico (A, B, C e D; onde A representa maior poder aquisitivo); Ex: nível de retinol sérico (alto, aceitável, baixo, deficiente) onde alto: maior ou igual a 50,0 μg/dl; aceitável: 20,0 a 49,9 μg/dl, baixo: 10,0 a 19,9 μg/dl e deficiente: menor ou igual a 10,0 μg/dl. Variável quantitativa – Quando as características são quantitativas, os valores são expressos em números. Mas atenção. Nem sempre que se expressa em números, os dados são quantitativos. Ex: Consideremos os funcionários de um hospital. Sendo avaliados os tipos sanguíneos, trata-se de característica qualitativa. No entanto, para representar cada tipo sanguíneo, podemos usar números (1 - A; 2 - B; 3 - AB; 4 - O). Nesse caso, o número é apenas um código para o tipo sanguíneo e pode ser útil em alguns casos para registro em planilhas eletrônicas a fim de se fazer análise estatística. As variáveis quantitativas podem ser discretas ou contínuas. Os quadros 2 e 3 apresentam exemplos de variáveis discretas e contínuas respectivamente. Quadro 2 – Exemplos de variáveis quantitativas discretas (Schmildt, 2007). População Variável Possíveis valores p/ a variável Enfermeiros de um hospital Números de filhos 0, 1, 2, 3, 4, 5,... Filhos Escolas de enfermagem do sudeste brasileiro Produção científica 0, 1, 2, 3, 4,... Trabalhos por escolas Escolas de enfermagem do sudeste brasileiro Número de professores 0, 1, 2, 3, 4,..., 15,... Professores por escolas Hospitais do Norte do Espírito Santo Número de enfermeiros por hospital 0, 1, 2, 3, 4,..., 10,... Enfermeiros por hospital Quadro 3 – Exemplos de variáveis quantitativas contínuas (Schmildt, 2007). População Variável aleatória (x) Possíveis valores p/ a V.A. Enfermeiros no Brasil Salário bruto mensal (R$) R$ 2003,52; R$3000,00... Enfermeiros de um hospital Anos de trabalhos 1; 1,5; 1,6; 15,3; 20,5... Médicos no Espírito Santo Experiência de trabalho no SUS, em anos 0,2; 2,3; 3,0; 5,2;... Enfermeiros em São Mateus Idade em anos 25; 27,4; 30,2;... Amostra: É uma parcela da população convenientemente escolhida Amostragem: É o processo de seleção da amostra. Pode ser: • Probabilística - cada unidade amostral tem probabilidade conhecida e diferente de zero de pertencer à amostra. É usada alguma forma de sorteio para a obtenção da amostra. • Não probabilística - não se conhece a probabilidade de cada unidade amostral pertencer à amostra. Algumas unidades terão probabilidade zero de pertencer à amostra. Ex: amostragem intencional; por voluntários; acesso mais fácil; por quotas. Tipos de amostragem probabilística • aleatória simples (com e sem reposição) • sistemática • com partilha proporcional ao tamanho do estrato • por conglomerado Amostragem aleatória simples (AAS): É o processo de amostragem onde qualquer subconjunto de n elementos diferentes de uma população de N elementos têm mesma probabilidade de ser sorteado. Tamanho da população: N; tamanho da amostra: n; fração global de amostragem ou probabilidade de sortear um indivíduo = n / N. Utilização de programas computacionais. Amostragem sistemática: Utiliza-se a ordenação natural dos elementos da população (prontuários, casa, ordem de nascimento). Intervalo de amostragem k = N / n, onde N= tamanho da população e n = tamanho da amostra. Amostragem por conglomerado: É o processo no qual os elementos da população são reunidos em grupos que constituem a unidade amostral e, por sua vez, alguns destes são sorteados para comporem a amostra. Se o interesse residir no sorteio de escolares, em um processo de amostragem por conglomerados, seria possível sortear escolas (unidade amostral) e considerar todos os alunos destas para comporem a amostra. Estimativa: Valor do estimador calculado em uma amostra. Estima o valor do parâmetro. Ex: Peso médio ao nascer, calculado em uma amostra de 120.000 crianças nascidas no Município de São Paulo no ano de 2000: média amostral x = 3000g. População (ou Universo): é a totalidade dos itens ou objetos considerados. É o conjunto de todos os elementos de interesse em um determinado estudo. Rol: é a organização dos dados de forma ordenada, normalmente na ordem crescente de grandeza. Freqüências – com que freqüência aparece determinado valor de uma variável. Essa pode ser absoluta, relativa, porcentual e acumulativa. Estatística Indutiva ou Inferência Estatística: é a parte que, baseando-se em resultados de uma amostra, procura inferir ou tirar conclusões para o comportamento da população, dando a precisão dos resultados e com que probabilidade se pode confiar neles. Bioestatística: Estatística aplicada às ciências biológicas 2. DISTRIBUIÇÃO DE FREQUÊNCIA A distribuição de freqüências é uma tabela que relaciona categorias ou classes de valores, juntamente com contagens ou freqüências do número de valores que se enquadram em cada categoria (Triola, 1998). A distribuição de freqüências pode ser representada através de um histograma, que é um gráfico cujas bases são os limites das classes e as alturas são as freqüências. Quando a variável é quantitativa contínua, a melhor forma de apresentá-la em tabelas é utilizando intervalos de valores denominados intervalos de classe. Regras: N (número de elementos) Número de classe mínima Número de classe máxima Até 50 5 10 100 8 16 200 10 20 300 12 24 500 15 30 1000 ou mais 20 40 *Uma outra regra é: se N ≤ 25 → número de classe = 5 se N > 25 → número de classe = Onde: N = número total de dados ou Ʃf LIMITE DE CLASSE (Limite superior “Li”, Limite inferior “li”): São os valores extremos de cada classe. AMPLITUDE DE CLASSE (h): É a diferença do limite superior com o limite inferior h = Li-li PONTO MÉDIO DA CLASSE (x): É o limite superior somado com o limite inferior e dividido por 2. X = + FREQÜÊNCIA RELATIVA (fr): É a freqüência de cada classe dividida pela freqüência total. fr = onde: f = frequêcia de cada classe F = freqüência total ou ∑f FREQÜÊNCIA ACUMULADA (fa): É a freqüência total de todos os valores inferiores ao limite superior em um dado intervalo. FREQÜÊNCIA RELATIVA ACUMULA (fr, a): É a freqüência relativa total de todos os valores inferiores ao limite superior em um dado intervalo. fr, a = Exemplo: Dados da temperatura horária na cidade de Maceió AL no dia 26/03/2012. Fonte: INMET Hora UTC Temperatura (C) 00 25.1 01 25.1 02 25.1 03 24.4 04 24.2 05 23.4 06 22.7 07 22.8 08 22.2 09 22.5 10 24.8 11 27.0 12 27.9 13 28.8 14 29.4 15 30.0 16 29.6 17 29.8 18 29.6 19 28.0 20 26.9 21 26.2 22 25.9 23 25.6 TABELA 1: Intervalo de classe (°C) x f fr fa fr,a 22― 24 23 5 0.208 5 0.208 24 ― 26 25 8 0.333 13 0.541 26 ― 28 27 4 0.166 17 0.707 28 ― 30 29 6 0.250 23 0.957 30 ― 32 31 1 0.041 24 1 ∑ 24 1 24 1 3. MEDIDAS DE TENDÊNCIA CENTRAL São medidas que na prática, possibilitam determinar um valor compreendido entre o menor e o maior valor da série numérica, ou seja, o valor localizado no centro ou no meio de um conjunto de dados. Há diferentes maneiras de definir o centro de um conjunto de dados, assim, há diferentes definições de medidas de tendência central como: média, mediana, moda e ponto médio. QUARTIS Dividem (separam) uma Distribuição de Freqüência em 4 partes iguais. No 1º Quartil (Q1), 25% dos elementos estarão abaixo dele e 75%, acima. No 2º Quartil (Q2), 50% dos elementos estarão abaixo dele e 50%, acima. Observe então que o 2º Quartil é igual à Mediana. No 3º Quartil (Q3), 75% dos elementos estarão abaixo dele e 25%, acima. Fórmulas para cálculo dos Quartis: onde: li = limite inferior da classe N = números de dados i = é o número do quartil desejado ∑fi= soma das freqüências anteriores à classe qi h = amplitude da classe fqi = freqüência da classe qi DECIS: Dividem uma Distribuição de freqüência em 10 partes iguais. No 1º Decil (D1), 10% dos elementos estarão abaixo dele e 90%, acima. No 2º Decil (D2), 20% dos elementos estarão abaixo dele e 80%, acima. No 3º Decil (D3), 30% dos elementos estarão abaixo dele e 70%, acima, e assim por diante. Fórmula para cálculo dos Decis: = * h onde: li = limite inferior da classe N = números de dados i = é o número decil desejado ∑fi= soma das freqüências anteriores à classe di h = amplitude da classe fdi = freqüência da classe di PERCENTIS Dividem uma Distribuição de freqüência em 100 partes iguais. Então: No 1º Percentil (P1), 1% dos elementos estarão abaixo dele e 99% estarão acima. No 2º Percentil (P2), 2% dos elementos estarão abaixo dele e 98% estarão acima. No 3º Percentil (P3), 3% dos elementos estarão abaixo dele e 97% estarão acima. No 99º Percentil (P99), 99% dos elementos estarão abaixo dele e 1% estarão acima, e assim por diante. Fórmula para cálculo dos percentis: = li * h onde: li = limite inferior da classe N = números de dados i = é o número do percentil desejado ∑fi= soma das freqüências anteriores à classe Pi h = amplitude da classe fpi = freqüência da classe Pi Obs: Para achar a classe do percentil, decil ou quartil na tabela de distribuição de frequência: Classe Percentil: = frequência acumulada da classe do percentil Classe Decil: = frequência acumulada da classe do decil Classe Quartil: = frequência acumulada da classe do quartil Onde: N = número de dados da amostra = percentil desejado = decil desejado = quartil desejado i = é o número do quartil, decil ou percentil desejado MÉDIA ARITIMETICA (): A média aritmética de um conjunto de dados é o valor obtido somando-se todos os elementos do conjunto e dividindo-se a soma pelo número total de elementos. = Para dados agrupados: = * onde: N = números de dados F = frequêcia total (F = N) f = frequência de cada classe X = ponto médio de cada classe MEDIANA (M): É definida como o valor central ou a média aritmética dos dois valores centrais de um conjunto de dados. Ex: 1, 4, 5, 7, 8 → M = 5; 1, 4, 5, 7, 8, 9 → M = 6, pois 5+7 = 12/2= 6 Para dados agrupados: M = l i+( )* h onde: li = limite inferior da classe mediana F = frequecia total ∑ fi = soma das frequências das classes inferiores a da classe mediana fmed = frequência da classe mediana h = amplitude da classe Obs: a classe mediana será a primeira classe onde a freqüência acumulada (fa) apresentar um valor maior ou igual a N/2. MODA (M0): É o valor que ocorre com maior freqüência. Ex: 1, 4, 8, 10, 10, 11 → M0 = 10 1, 4, 8, 10, 11 → Amodal (não existe Moda) 2, 2, 4, 4, 6, 2, 4 → M0 = 2 e 4 (Bimodal) Para dados agrupados: M0 = li +() * h Onde: li = limite inferior da classe modal ∆1 = excesso da frequência da classe modal imediatamente inferior (diferença da freqüência da classe modal com a freqüência da classe anterior) ∆2 = excesso da frequência da classe modal imediatamente superior (diferença da freqüência da classe modal com a freqüência da classe posterior) h = amplitude da classe Obs: a classe modal é aquela onde a freqüência apresenta o maior valor. PONTO MÉDIO (X): O ponto médio é o valor que está a meio caminho entre o maior e o menor valor da série de dados. Para obtê-lo, somamos esses valores extremos e dividimos o resultado por 2, como na expressão a seguir (Triola, 1998): + = X Ex: 3, 4, 5, 7, 9, 11 → X = 7, pois 3+11 = 14 / 2 = 7 Exemplo: umidade relativa do ar horária na cidade de Coruripe AL nos dias 25 e 26 de março de 2012. Fonte: INMET Hora UTC dia 25/03/2012 Umidade Relativa do ar (%) Hora UTC dia 26/03/2012 Umidade relativa do ar (%) 00 83 00 78 01 85 01 80 02 85 02 79 03 85 03 81 04 86 04 82 05 84 05 84 06 83 06 84 07 83 07 85 08 82 08 85 09 82 09 86 10 78 10 81 11 69 11 73 12 66 12 54 13 66 13 54 14 66 14 47 15 60 15 53 16 62 16 54 17 60 17 46 18 62 18 51 19 67 19 60 20 72 20 67 21 76 21 74 22 77 22 78 23 79 23 80 TABELA 2: Intervalo de classe (%) x f fa f.x fr fr,a 44 ― 50 47 2 2 94 0.041 0.041 50 ― 56 53 5 7 265 0.104 0.145 56 ― 62 59 3 10 177 0.062 0.207 62 ― 68 65 7 17 455 0.145 0.352 68 ― 74 71 3 20 213 0.062 0.414 74 ― 80 77 8 28 616 0.166 0.580 80 ― 96 83 18 46 1494 0.357 0.955 86 ― 92 89 2 48 178 0.041 1 ∑ 48 48 3492 1 1 1º QUARTIL DE ACORDO COM A TABELA 2: = 62+ ( ) * 6 = 63,7% 8º DECIL DE ACORDO COM A TABELA 2: = li + ) * h = 80 + ( ) * 6 = 83,4% 55º PERCENTIL DE ACORDO COM A TABELA 2: = 74+ ( ) * 6 = 78,8% MÉDIA DE ACORDO COM A TABELA 2: = * 3492 = 72% MEDIANA DE ACORDO COM A TABELA 2: M = 74+ (* 6 M = 77% MODA DE ACORDO COM A TABELA 2: M0 = 80 + () * 6 M0 = 82% PONTO MÉDIO DE ACORDO COM A TABELA 2: Maior valor = 86 Menor valor = 46 PM = PM = 66 4. MEDIDAS DE DISPERSÃO São medidas estatísticas responsáveis pela variação ou dispersão de uma série. VARIÂNCIA (S²): S² = * Onde: X = ponto médio = média N = número total de dados Para dados agrupados: S² = * ∑f(x – )² DESVIO PADRÃO(S): S = COEFICIENTE DE VARIAÇÃO (CV): Expressa a relação percentual entre o desvio padrão e a média. Cv = 100 * (%) ERRO PADRÃO DA MÉDIA (S()): S( ) = Exemplo: dados da direção do vento na cidade de Maceió do dia 20 de março de 2012. Fonte: INMET Hora UTC 20/03/2012 Direção do vento 00 90° 01 94° 02 98° 03 92° 04 88° 05 82° 06 2° 07 334° 08 334° 09 288° 10 28° 11 51° 12 98° 13 83° 14 80° 15 95° 16 84° 17 102° 18 87° 19 78° 20 83° 21 81° 22 91° 23 86° TABELA 3: Intervalo de classe (em graus) x f f.x (x―) f(x―) (x―)² f(x―)² 0 ― 70 35 3 105 -87.5 -262.5 7656.6 22968.8 70 ― 140 105 18 1890 -17.5 -315 306.6 5512.5 140 ― 210 175 0 0 52.5 0 2756.6 0 210 ― 280 245 0 0 122.5 0 15006.6 0 280 ― 350 315 3 945 192.5 577.5 37056.6 111168.8 ∑ 24 2940 262.5 0 62781.6 139650 MÉDIA DE ACORDO COM A TABELA 3: = * = * 2940 = 122,5° VARIÂNCIA DE ACORDO COM A TABELA 3: S² = * S² = * 139650 S² = 6071,7 DESVIO PADRÃO DE ACORDO COM A TABELA 3: S = S = S = 77, 9° COEFICIENTE DE VARIAÇÃO DE ACORDO COM A TABELA 3: Cv = 100 *(%) Cv = 100 * Cv = 63,3% ERRO PADRÃO DA MÉDIA DE ACORDO COM A TABELA 3: S() = S() = S() = 15,9° 5. REGRESSÃO LINEAR Análise de regressão é uma metodologia estatística que utiliza a relação entre duas ou mais variáveis quantitativas (ou qualitativas) de tal forma que uma variável (y) pode ser predita a partir da outra variável (x). Ex: A população de bactérias pode ser predita a partir da relação entre população e o tempo de armazenamento. MÉTODO DOS MÍNIMOS QUADRADOS É o método de computação matemática pelo qual se define a curva de regressão. Esse método definirá uma reta que minimizará a soma das distâncias ao quadrado entre os pontos plotados (X, Y) e a reta (X’,Y’). Pelo método dos mínimos quadrados se calcula os parâmetros “a“ e “b” da reta que minimizam estas distâncias ou as diferenças (ou o erro) entre Y e Y’. Esta reta é chamada de curva de regressão. = y estimado ŷ = a + b*xʹ Onde: a = , ou b = * ŷ = a+ b (x – ) COEFICIENTE DE CORRELAÇÃO LINEAR O coeficiente de correlação de Pearson é uma medida do grau de relação linear entre duas variáveis quantitativas. Este coeficiente varia entre os valores -1 e 1. O valor 0 (zero) significa que não há relação linear, o valor 1 indica uma relação linear perfeita e o valor -1 também indica uma relação linear perfeita mas inversa, ou seja quando uma das variáveis aumenta a outra diminui. Quanto mais próximo estiver de 1 ou -1, mais forte é a associação linear entre as duas variáveis.O coeficiente de correlação de Pearson é normalmente representado pela letra r e a sua fórmula de cálculo é: Exemplo: experimento agrometerológico durante o período de 2002 a 2010. x (anos) 2002 2004 2006 2008 2010 y (produção de feijão em toneladas) 6.0 7.5 9.0 11.5 13.0 TABELA 4: x y x― (x―)² y(x―) (y―) (y―)² (y―).(x―) 2002 6.0 -4 16 -24 -3.4 11.56 13.6 2004 7.5 -2 4 -15 -1.9 3.61 3.8 2006 9.0 0 0 0 -0.4 0.16 0 2008 11.5 2 4 23 2.1 4.41 4.2 2010 13.0 4 16 52 3.9 12.96 14.4 ∑ 47.0 0 40 36 32.7 36 MÉDIA DE X DE ACORDO COM A TABELA 4: = = 2006 CÁLCULO DOS MÍNIMOS QUADRADOS DE ACORDO COM A TABELA 4: a = = Média de y a = a= a = 9,4 b = b = 0,9 ŷ = a + b (x –) ŷ = 9,4 + 0,9 (x – 2006) ESTIMATIVA DO VALOR DA PRODUÇÃO DO FEIJÃO PARA 2007 E PARA 2011: Y ESTIMADO PARA 2007 ŷ = 9,4 + 0,9 (2007 – 2006) ŷ = 10,3 t Y ESTIMADO PARA 2011 ŷ = 9,4 + 0,9 (2011 – 2006) ŷ = 9,4 + 4,5 ŷ = 13,9 t 6. PROBABILIDADE: È um conceito filosófico e matemático que permite a quantificação da Incerteza e da aleatoriedade e usada para a realização de previsões ou para a orientação de intervenções. É aquilo que torna possível se lidar de forma racional com problemas envolvendo o imprevisível. Algumas Propriedades: P(Ø) = 0 P(A) + P(Ā) = 1 P(B) = P(B∩A) + P(B∩Ā) P(AUB) = P(A) + P(B) - P(A∩B) P(AUBUC) = P(A) + P(B) + P(C) - P(A∩B) - P(A∩C) - P(B∩C) + P(A∩B∩C) Experimento Aleatório: É todo experimento que produz resultados imprevisíveis, dentre os possíveis, mesmo quando repetido em semelhantes condições. Ex: No lançamento de um dado, pode-se obter os resultados 1, 2, 3, 4 ,5 e 6, ou seja, o resultado é incerto. Espaço Amostral: É o conjunto de todos os resultados possíveis de um determinado experimento aleatório. É Indicado pela letra S. Ex: Lançamento de um dado: S = {1, 2, 3, 4, 5, 6, } Lançamento de uma moeda: S = {cara, coroa} Sexo de um recém-nascido: S = {masculino, feminino} Evento: É todo subconjunto do espaço amostral relacionado a um experimento aleatório. Considere o experimento aleatório, do lançamento de um dado: S = {1, 2, 3, 4, 5, 6}, Ex: A: Um número par , A = {2, 4, 6} B: Um número par e primo, B = {2} ( evento simples ou elementar) C: Um número maior que 6, C = Ø (evento impossível) D: Um número menor que 7, D = {1,2,3,4,5,6} (evento certo), D = S E: Um número menor ou igual 4, E = { 1,2,3,4} F: um número maior ou igual a 4, F = { 4,5,6} Obs.: EUF = S , logo, E e F são chamados de eventos exclusivos. Regra da Multiplicação: A probabilidade de dois eventos acontecerem (A e B) em seqüência é dado por: P(A e B) = P(A) . P(B/A) Se dois eventos A e B são independente pode-se fazer a simplificação: P(A e B) = P(A) . P(B) Ex: A probabilidade de um salmão atravessar uma barragem é de 0,85. A probabilidade de três salmões atravessarem a barragem é: P(A, B e C) = P(A).P(B).P(C) P(S) = 0,85 .0,85 . 0,85 = 0,61 → 61% Probabilidade da União de Dois Eventos: Se A e B são dois eventos do mesmo espaço amostral S, então: P(A U B) = P(A) + P(B) – P (A∩B) Se A∩B = Ø, teremos: P(AUB) = P(A) + P(B) Probabilidade de Um Evento em um Espaço Amostral Finito: Seja S um espaço amostral equiprovável e A um de seus eventos. Denomina-se Probabilidade do evento A o número P(A) tal que: P(A) = n(A) / n(S) Onde: n(A) = nº de elementos do evento A e n(S) = nº de elementos do espaço amostral S. Probabilidade Condicional: Muitas vezes o fato de ficarmos sabendo que certo evento ocorreu faz com que se modifique a probabilidade que atribuímos a outro evento.A Probabilidade Condicional é a probabilidade de ocorrência de um evento quando se dispõe da informação que um outro evento ocorreu. P(A\B) = Probabilidade do evento A ocorrer sabendo-se que o evento B ocorreu. P(A\ B) = P(A∩B) / P(B) Regra do produto: P(A∩B) = P(A / B) .P(B) Ex4: Duas cartas são retiradas em sequência de um baralho. Determine a probabilidade da segunda carta ser uma dama, dado que a primeira carta foi um rei e não foi recolocada. P(Da/Rei) = = 0,08 = 8% Probabilidade Subjetiva: É a probabilidade de que um particular evento ocorra atribuído por um indivíduo e baseada em um conjunto de informação disponível. Ex: Estimar a probabilidade de que o time de futebol da Ponte Preta disputara a final do campeonato nacional; Eventos Dependentes e Independentes: Dois ventos são independentes se a ocorrência do evento “A”não interferir na ocorrência do evento “B”. P(‘B/A) = P(‘B) ou P(A/B) = P(A) Obs. Os eventos que não são independentes são necessariamente dependentes. P(B) = P(B/A) → independente Ex :jogar uma moeda, obter cara (A) então jogar um dado com 6 faces e obter (B) P(6/ca) = 1/6 e P(6) = 1/6 P(B) # P(B/A) → dependente Ex: Selecionar um rei de um baralho comum (B) não recolocado, e selecionar uma dama do baralho (A) P(A/B) = 4/51 e P(A) 4/52 6.1 EXERCÍCIOS RESOLVIDOS DE PROBABILIDADE Exemplo 1: São jogados uma moeda e um dado . Qual a probabilidade de sair cara 6? P(A e B) = P(moeda) * P(dado) = * = = 0,08 = 8% Exemplo 2: A probabilidade de um salmão atravessar uma barragem é de 0,85. Determine a probabilidade de três salmões atravessarem a barragem? P(A, B e C) = P(A) * P(B) * P(C) P(A, B e C) = 0,85 * 0,85 * 0,85 = 0,614 = 61,4% Exemplo 3: Retira-se uma carta de um baralho completo de 52 cartas. Qual a probabilidade de sair um rei ou uma carta de espada? P(A U B) = P(A)+P(B) – P(A∩B) P(Rei) = P(Espada) = P(Rei∩Espada) = P(AUB) = + + = = = 0,3 = 30% Exemplo4: Duas cartas são retiradas em sequência de um baralho. Determine a probabilidade da segunda carta ser uma dama, dado que a primeira carta foi um rei e não foi recolocada. P(Da/Rei) = = 0,08 = 8% Exemplo 5: Um grupo de 50 moças é classificado de acordo com a cor dos cabelos, e dos olhos de cada moça, segundo a tabela: Olhos azuis Cabelos castanhos Loira 17 09 Morena 04 14 Ruiva 03 03 Determine a probabilidade de ter: Morena de olhos azuis? P(M∩A) = Morena ou ter olhos azuis? P(MUA) = P(M) + P(A) – P(M∩A) = + - = = 0,76 = 76% Exemplo 6: A tabela abaixo mostra o resultado no qual pesquisadores examinaram o QI de 102 criança e a presença de um gene específico nela. Presença do gene Não pres. do gene Total QI alto 33 19 52 QI normal 39 11 50 Total 72 30 102 Qual a probabilidade de ter uma criança com QI alto, dado que ela tem o gene? P(QI alto/P.gene) = = 0,458 = 45,8% Determine a probabilidade da criança não ter o gene. P(Não P.gene) = = 0,294 = 29,4% Determine a probabilidade da criança não ter o gene, dado que ela tem QI normal. P(Não gene/ QI normal) = = 0,22 = 22% Exemplo 7: Um banco de sangue cataloga os tipos sanguíneos e o fator Rh positivo e negativo dos doadores de sangue durante 5 dias. O A B AB Total Positivo 156 139 37 12 344 Negativo 28 25 8 4 65 Total 184 164 45 16 409 Qual a probabilidade de ter um doador tipo sanguíneo O ou A? P(OUA) = P(A) + P(O) = + = = 0,85 = 85% Qual probabilidade de ter um doador do tipo B ou Rh negativo? P(BURh-) = P(B) + P(Rh-) – P(B∩Rh-) = + - = = 0,25 = 25% Qual a probabilidade do tipo sanguíneo AB, dado o Rh+ P(AB/ Rh+) = = 0, 035 = 3,5% 7. DISTRIBUIÇÃO DE PROBABILIDADE Um erro muito comum em análise de dados climatológicos é desprezar as características da distribuição de probabilidades mais adequada para os dados em estudo. O mais freqüente é adotar-se a distribuição normal, o que pode resultar, se os dados não seguem essa distribuição, em conclusões erradas. A distribuição de probabilidades associa uma probabilidade a cada resultado numérico de um experimento, ou seja, dá a probabilidade de cada valor de uma variável aleatória. Por exemplo, no lançamento de um dado cada face tem a mesma probabilidade de ocorrência que é 1/6. Como os valores das distribuições de probabilidades são probabilidades, e como as variáveis aleatórias devem tomar um de seus valores, temos as duas regras a seguir que se aplicam a qualquer distribuição de probabilidades: 1. A soma de todos os valores de uma distribuição de probabilidades deve ser igual a 1 2. A probabilidade de ocorrência de um evento deve ser maior do que zero e menor do que 1 No exemplo do lançamento de um dado, como todas as faces têm a mesma probabilidade de ocorrência que é 1/6 ao somá-las obtemos o valor 1, que corresponde a primeira regra citada acima. O valor 1/6 é maior do que zero e menor do que 1, assim satisfaz a segunda regra acima. A distribuição de probabilidades pode ser representada por um histograma de probabilidades. Este se assemelha ao histograma de freqüências, entretanto a escala vertical representa probabilidades, em lugar das freqüências relativas. O histograma de probabilidades nos permite visualizar a forma da distribuição. VARIÁVEL ALEATÓRIA A variável aleatória é uma variável que tem um valor único (determinado aleatoriamente) para cada resultado de um experimento. A palavra aleatória indica que em geral só conhecemos aquele valor depois do experimento ser realizado. Exemplos de variáveis aleatórias: Número de alunos que não compareceram a aula de estatística num determinado dia; Altura de um adulto do sexo masculino selecionado aleatoriamente. As variáveis aleatórias também podem ser discretas ou contínuas: Variável aleatória discreta: é aquela que assume valores inteiros e finitos. Variável aleatória contínua: é aquela que pode assumir inúmeros valores num intervalo de números reais e é medida numa escala contínua. ASSIMETRIA A assimetria é o grau de deformação de uma curva de frequências. Uma distribuição de frequência é simétrica, ou seja, que apresenta um gráfico cuja as duas caudas possuem a mesma configuração, quando a média, a mediana e a moda da série forem iguais. A distribuição de frequência também pode ser assimétrica positiva e assimétrica negativa, a primeira possui uma cauda mais alongada à direita e ocorre quando a média da série for maior que a moda e a segunda apresenta uma cauda mais alongada à esquerda e ocorre quando média da série for menor que a moda. Figura 1: formas de Assimetria A assimetria pode ser obtida pelo coeficiente de assimetria (A) que é uma medida adimensional, observe: A = - Onde: M0 = moda = media S = desvio padrão CURTOSE A curtose é o grau de achatamento de uma distribuição em relação a uma distribuição padrão, denominada curva normal. A curtose é denominada Mesocúrtica quando K = 3, neste caso, tem-se uma curva normal. Se K > 3, a curva de freqüência é mais fechada que a curva normal, ou seja, possui um pico e recebe a denominação de Leptocúrtica. Se K< 3, a curva de freqüência é mais achatada que a curva normal, sendo chamada de Platicúrtica A curtose (K) é definida pelo quarto momento (m4) dividido pelo o desvio-padrão da série elevado a quarta potência (s 4 ): K= onde o quarto momento é dado por: M4 = DISTRIBUIÇÕES CONTÍNUAS A maioria das variáveis atmosféricas podem assumir valores contínuos. A temperatura, a precipitação, a altura geopotencial, a velocidade do vento, e outras quantidades não estão restritas a valores inteiros de unidades físicas em que são medidas. Embora a natureza da medição e os sistemas de relatos é tal que as medidas atmosféricas são arredondadas para valores discretos, mas o conjunto de valores observados normalmente é grande o suficiente para que a maioria das variáveis possam ainda ser tratadas como quantidades contínuas. Há muitas distribuições teóricas contínuas. Algumas das mais usadas em ciências atmosféricas são: Distribuição Normal, Distribuição Gamma, e Distribuição Exponencial. Distribuição Normal É a distribuição de probabilidade contínua mais importante e mais utilizada, geralmente citada como curva normal ou curva de Gauss. Sua importância em análise matemática resulta do fato de que muitas técnicas estatísticas, como análise de variância, de regressão e alguns testes de hipótese, assumem e exigem a normalidade dos dados. A distribuição normal é uma distribuição de dois parâmetros (média) e (desvio-padrão). A distribuição normal é simplesmente uma forma de descrever o quão provável são os vários resultados de um processo. É geralmente apresentada na forma de gráfico. Ex: considere os seguintes dados relativos às alturas de um grupo de 500 crianças de oito anos de idade. Intervalo de classes (Altura em cm) Frequência 100 – 110 20 110 – 120 48 120 – 130 100 130 – 140 170 140 – 150 98 150 – 160 44 160 – 170 20 Exemplo em relação ao gráfico: Qual a probabilidade de 20 crianças das 500 terem mais de 160 cm de altura? R: P(c) = 20/500 = 0,04 = 4%. Se uma amostra de dados tem realmente distribuição normal a seguinte relação é válida: A = 0 e K = 3. A curtose da distribuição normal é igual a 3 e a assimetria é nula. O histograma de freqüências da distribuição normal tem a forma de sino, Com a média constante e a variância variável, o gráfico da curva normal assume diferentes formas de sino: de alongada a achatada. Distribuição Gamma Muitas variáveis atmosféricas possuem assimetria positiva, ou seja, são distorcidas à direita. Freqüentemente a distorção ocorre quando há um limite físico à esquerda que é relativamente próximo a variação dos dados. Exemplos comuns desta situação são as quantias de precipitação e a velocidade do vento que são fisicamente não negativas. Há uma variedade de distribuições contínuas que são limitas à esquerda por zero. Entretanto, a distribuição Gamma é comumente usada para representar dados de precipitação. Distribuição Exponencial A distribuição exponencial é geralmente aplicada a dados com forte assimetria como aqueles cujo histograma tem a forma de J invertido.
Compartilhar