Baixe o app para aproveitar ainda mais
Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original
* * * Aula 4 Estatística Conteúdo da aula: Análise estatística dos dados Média, desvio padrão, histogramas Como analisar um conjunto de dados? * * * * * * * * * ESTATÍSTICA É uma coleção de métodos para: • planejar experimentos, • obter dados, • organizar, • resumir, • analisar • concluir sobre as informações coletadas * * * ESTATÍSTICA desempenha um papel crucial nas diversas fases da pesquisa científica * * * * * * POPULAÇÃO E AMOSTRA POPULAÇÃO => PARÂMETRO: = PARÂMETRO: é uma medida numérica que descreve uma característica da população AMOSTRA => ESTATÍSTICA =ESTATÍSTICA: é uma medida numérica que descreve uma característica da amostra * * * Variável é o conjunto de resultados possíveis de um fenômeno. é a característica ou propriedade da população que está sendo medida. Ex.: • População: gatos atendidos em clinicas Variável: raça dos animais. • População: alunos da graduação veterinária Variável: sexo • População: animais da raça Nelore do Triângulo Variável: peso * * * QUANTITATIVAS DISCRETAS: • quando os valores podem assumir apenas determinados valores e resultam de uma contagem. • O conjunto de valores possíveis que a variável pode assumir é finito ou infinitos enumerável. Ex: • número de animais atendidos em um hospital veterinário • número de animais assintomáticos QUANTITATIVAS CONTÍNUAS • quando os valores podem assumir pertence ao conjunto dos números reais. Podem assumir qualquer valor. • Obtido por medição. Ex; • peso de um animal • altura • tempo de vôo entre duas cidades • peso * * * Ao realizar uma medida e obter um resultado Temos que garantir a reprodutibilidade Todas as informações devem ser fornecidas para que outro experimentador confirme (reproduza) Conjunto de medidas e resultado Instrumento usado Condições externas (T, P, umidade, etc...) Tipo de análise feita com os dados * * * É fundamental que você saiba: construir tabelas apresentando seus dados construir gráficos apresentando seus dados Analisar os gráficos para obter resultados * * * Probabilidades e distribuições Podemos prever o resultado ao jogar um dado? Esse é um fenômeno aleatório Resultados (1, 2, 3, 4, 5, 6) definem um evento Todos ao valores têm a mesma probabilidade de ocorrer (se o dado não for viciado) Não!!!!!! Queremos desenvolver um tratamento de dados que permita a partir de um conjunto de dados prever comportamentos gerais * * * Observação repetida de uma grandeza (Y) forma um conjunto com n valores (yi) a partir dos quais podemos determinar: - Quantas vezes ni um determinado valor yi ocorreu, ao se realizar n observações de Y - A distribuição de freqüências: fi = ni/n Exemplo: joga-se um dado (30 vezes) = no total de eventos No de vezes que deu 1 = 3 Então fi = ni/n = 3/30 = 1/10 * * * Se n ∞ espera-se que essa fração seja igual à probabilidade de ocorrência do evento yi P(yi) = lim ni/n = lim fi Se todos os eventos são equiprováveis então: P = P1 = 1/n Na prática não temos n = ∞; usamos a aproximação para n grande No caso do dado (apara qualquer número): P = 1/6 ~0,17 ~17% * * * Algumas propriedades Probabilidade que ocorram 2 eventos gi ou gj na observação do mesmo processo é a soma das probabilidades de que cada evento cocorra Pi ou Pj = Pi + Pj EX: P de que ocorra 4 ou 6 no lançamento de um dado: P4 = 1/6 ; P6 = 1/6 ; P4ou6 = 1/6 + 1/6 = 2/6 = 1/3 * * * E se observarmos dois eventos independentes? Como obter P? Considere dois eventos g e h Pi de que observe os valores gi com pi Pj de que observe os valores hi com qi Piej= pi.qi EX: lançar um dado e tirar 4 e jogar uma moeda e obter cara pi = 1/6 qi = 1/2 pi . qi = 1/6 . ½ = 1/12 (~8,3%) * * * Distribuição de variável discreta Processos aleatórios = resultado pode ser descrito quantitativamente (y) Resultados possíveis para Y = conjunto de valores (yi) Valores bem definidos Variável é discreta Cada valor de yi tem P(yi) de ocorrer O conjunto de m valores P(yi) para todos os valores possíveis é definido como: Distribuição de probabilidade (para y) Propriedade: * * * Exemplo: lançamento de um dado i = 1..6 yi = 1, 2, 3, 4, 5, 6 P(yi) = 1/6 * * * Dado um conjunto de dados temos distribuição de freqüências Que podemos visualizar num gráfico = Histograma Função que ajusta nesse gráfico: binomial Estudar Vuolo capitulo 1 * * * Mas e se a variável for contínua? Variável contínua: processo aleatório que pode resultar em um número muito grande de valores possíveis (y1, y2, y3,... yn) Como fazer a distribuição das probabilidades P(yi)? Como fazer a distribuição das freqüências f(yi)? SOLUÇÃO: redefinir a ocorrência de um evento Em outras palavras: vamos adotar um intervalo de valores e não um valor apenas) Ocorre um evento yi se o resultado do processo é uma quantidade yj contida num intervalo Dy * * * Na prática: Temos um no limitado (finito) de observações NÃO sabemos o valor da média e do desvio padrão (queremos descobrir) Agrupamos os valores observados em intervalos Dy Assumimos que em cada Dy, P de ocorrência é constante RESULTADO = Histograma Os valores P(yi), f(yi) para cada yi são apresentados por barras paralelas ao eixo y Mas como escolher Dy? * * * Mas que informação podemos obter do histograma? * * * * * * Distribuição gaussiana * * * e s mede a meia largura a uma altura de 1/e. Gaussiana Uma função gaussiana é definida como: * * * Na teoria de probabilidades, a distribuição gaussiana é dada por: m = média s = desvio padrão s2 = variância x = variável * * * * * * * * * Mas o que isso quer dizer? * * * Mas o que isso quer dizer? Qual dessas distribuições gaussianas preferimos? Em qual delas os pontos se afastam mais da média? Como podemos “medir” esse afastamento?
Compartilhar