Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 Bioestatística Isadora Lessa Chaves Notas de Aula da Prof. Isabel Cristina Distribuição Normal Relembrando a matéria Experimento aleatório: são aqueles para os quais não conseguimos determinar o que vai acontecer, mas o que pode acontecer O conjunto dos resultados possíveis de um experimento aleatório é chamado de espaço amostral (Ω) Um evento é qualquer subconjunto de Ω Podemos calcular a probabilidade da ocorrência de um evento de várias formas, a mais utilizada é a abordagem frequentista Uma variável aleatória é uma variável cujo valor é um resultado numérico (pode ser o código de alguma característica) de um experimento aleatório Uma variável aleatória discreta é aquela que pode assumir um número finito de resultado, sejam eles numéricos ou não numéricos Um modelo probabilístico discreto é uma lei que permite determinar as probabilidades de cada valor assumido por uma variável aleatória discreta Em um modelo probabilístico discreto temos os valores que a variável pode assumir e a probabilidade de cada um deles sendo que a soma das probabilidade tem que ser igual a 1 Modelos Probabilísticos Contínuos São as leis que permitem calcular a probabilidade de resultados obtidos pro variáveis aleatórias continuas Não é possivel calcular uma probabilidade para cada valor possivel assumido por uma variável como esta, pois uma variável continua pode assumir um número infinito de valores. Sendo assim a probabilidade de ocorrência de cada valor em particular ela seria igual a zero. É possivel calcular a probabilidade da variável pertencer a determinado intervalo, como P (1,5< X <1,7), P (X < 0), etc. curva de densidade | | Uma curva de densidade é uma curva ou função que “suaviza” o desenho de um histograma (com densidade no eixo das ordenadas). Outras características desse tipo de curva são: Está sempre sobre o eixo horizontal ou acima dele (não existe densidade negativa) A área sob a curva é exatamente igual a 1 Desenha o histograma por densidades no eixo das ordenadas para que garanta essa área. A área total sob a curva descreve a probabilidade de uma variável aleatória continua pertencer ao conjunto de valores apresentados no eixo das abscissas. Assim, para calcular a probabilidade da variável pertencer a um intervalo especifico, basta calcular a área sob a curva para o intervalo desejado Distribuição Normal ou Gaussiana A função de densidade f(x) que define a curva normal tem as seguintes características: Se X ~ N (µ, σ2), então 𝑓(𝑥) = 1 √2𝜋𝜎2 𝑒 − (𝑥−𝜇)2 2𝜎2 , 𝑥 ∈ ℝ, 𝜇 ∈ ℝ, 𝜎2 > 0 Essa formula tem a função de suavizar o histograma ~ : tem/segue a distribuição normal µ é a média e σ2 é a variância da distribuição f(x) ≥ 0 e a total sob a curva é 1 Variável aleatória continua: é aquela em que os resultados que ela pode assumir estão em um intervalo dos números reais Ex.: X = altura de um adulto. Essa variável pode assumir qualquer valor no intervalo [1; 2] 2 Bioestatística Isadora Lessa Chaves Notas de Aula da Prof. Isabel Cristina Tem forma de sino e é simétrica em torno da média µ O parâmetro µ determina onde está centrada a curva Curvas normais: 𝜇1 < 𝜇2 𝑒 𝜎1 2 = 𝜎2 2 → se a média for menor e as duas curvas tiverem a mesma variância, elas possuem o tamanho do sino igual, porem se desloca para a esquerda do eixo cartesiano A forma do sino (mais achatado ou alongado) será determinada pela variância Curvas normais: 𝜇1 = 𝜇2 𝑒 𝜎1 2 < 𝜎2 2 → se as curvas possuem a mesma media terão o mesmo parâmetro de centro. A variância da curva preta é menor que a da azul, sendo assim a preta está mais concentrada em torno da média e a azul tem uma dispersão maior Para cada combinação se µ e σ2, existe uma curva diferente Curva normal: 𝜇1 < 𝜇2 𝑒 𝜎1 2 < 𝜎2 2 → a curva preta possui variância e media menor sendo mais deslocada para a esquerda e mais alongada. Já a curva azul possui media e variância maior estando mais deslocada para a direita e mais achatada A distribuição normal é bastante utilizada para descrever o comportamento de variáveis porque: Assume que a possibilidade de uma variável aleatória contínua assumir um valor próximo à média é grande (a curva é concentrada em torno da media) Valores muito distantes da media, para mais ou para menos, são improváveis Quanto mais distante um possível valor estiver da media, menor probabilidade ele terá, Essa “distância” em relação à média é determinada pela variância. Portanto, é uma distribuição flexível a mudanças nos dois parâmetros. Calculo de probabilidades | | O fato de a curva normal ser simétrica em torno da media µ significa que P (X < µ - a) = P (X > µ +a). Para qualquer distribuição normal N (µ, σ2), a área entre intervalos simétricos é fixa. Consideremos uma variável aleatória X com N (µ, σ2), ou seja, X ~ N (µ, σ2). A probabilidade de X estar no intervalo [a, b], P (a < X < b), é a área sob a curva normal entre a e b Porém, para cada combinação que tivermos de (µ, σ2), teremos uma curva diferente. E as curvas de parâmetros diferentes terão áreas diferentes. 3 Bioestatística Isadora Lessa Chaves Notas de Aula da Prof. Isabel Cristina Exemplos: DISTRIBUICAO NORMAL PADRAO | | O cálculo de probabilidades para a distribuição Normal é feito com o auxílio de uma tabela Como não é viável termos uma tabela Normal para cada combinação possivel de µ e σ2, utilizamos somente a tabela da distribuição Normal Padrão, que é a Normal com média 0 e variância 1. N(0,1). Chamamos de Z a variável Normal Padrão. Assim Z ~N (0,1) Dada uma variável aleatória X com distribuição Normal qualquer, ou seja X~N (c), podemos transformá-la na variável Z ~ N (0,1), em um processo chamado padronização: 𝑍 = 𝑋 − 𝜇 𝜎 E a partir da tabela da variável Z podemos calcular qualquer probabilidade desejada. Em uma distribuição com média 0 e variância 1, a média vai ser 0. Os valores negativos são aqueles que estão a esquerda da média e os valores positivos estão a direita o A tabela tem valores de probabilidade do tipo P (Z<z) (ou seja, áreas à esquerda ou abaixo de um determinado valor), para z ≤ 0 (z negativo) Linha: parte inteira e primeira casa decimal de z Coluna: segunda casa decimal de z o A tabela tem valores de probabilidade do tipo P (Z<z) (ou seja, áreas à esquerda ou abaixo de um determinado valor), para z ≥0 (z positivo) Linha: parte inteira e primeira casa decimal de z Coluna: segunda casa decimal de z Exemplos: Em todos os exemplos vale ressaltar que a tabela só nos da probabilidade relativas a áreas à esquerda 4 Bioestatística Isadora Lessa Chaves Notas de Aula da Prof. Isabel Cristina ___________________________________________ ___________________________________________ Observação desse exemplo: Para a variável continua não faz diferença o limite e intervalo, pois calcula-se a probabilidade da mesma forma independente de ser intervalo aberto ou fechado DISTRIBUICAO NORMAL qualquer | | O objetivo agora é utilizar a tabela normal padrão para calcular probabilidade para uma variável X ~N (µ, σ2). Já falamos que a variável normal padrão Z pode ser obtida através da padronização de X. Assim, se eu desejo calcular a probabilidade P (a < X ≤ b): 𝑃 (𝑎 < 𝑋 ≤ 𝑏) = 𝑃 ( 𝑎 − 𝜇 𝜎 < 𝑋 − 𝜇 𝜎 ≤ 𝑏 − 𝜇 𝜎 ) 5 Bioestatística Isadora Lessa Chaves Notas de Aula da Prof. Isabel Cristina ≡ 𝑃 ( 𝑎 − 𝜇 𝜎 < 𝑍 ≤ 𝑏 − 𝜇 𝜎 ) Porque Z= 𝑋−𝜇 𝜎 .De modo que calcular P (a < X ≤ b) equivale a calcular P ( 𝑎− 𝜇 𝜎 < 𝑍 ≤ 𝑏− 𝜇 𝜎 ); e probabilidade de Z conseguimos calcular com a tabela normal padrão. Exemplo: !!! CALCULO DE PERCENTIS | | O percentil de ordem k% é o valor da distribuição normal padrão que deixa uma área k abaixo dele, ou seja, é um valor z tal que P (Z<z) = k Para encontrar o percentil de ordem k% na tabela normal padrão é preciso encontrar a probabilidade referente à ordem do percentil no corpo da tabela e “montar” o valor “z” a partir das marginais de linha e coluna da tabela Vale observar se o percentil é de ordem menor ou maior que 50%, pois: Se for menor a 50%: procurar a probabilidade na parte negativa da tabela normal padrão Se for maior a 50%: procurar a probabilidade na parte positiva da tabela normal padrão Se for igual a 50%: pode-se procurar tanto na parte negativa quanto na parte positiva da tabela normal padrão Exemplos: Percentil de ordem 2,5% Percentil de ordem 99%
Compartilhar