Buscar

Wilton-aula4_Estatistica

Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original

*
*
*
Aula 4 
Estatística
Conteúdo da aula:
Análise estatística dos dados
Média, desvio padrão, histogramas
Como analisar um conjunto de dados?
*
*
*
*
*
*
*
*
*
ESTATÍSTICA
É uma coleção de métodos para:
• planejar experimentos,
• obter dados,
• organizar,
• resumir,
• analisar
• concluir sobre as informações coletadas
*
*
*
ESTATÍSTICA
desempenha um papel crucial nas diversas fases da pesquisa científica
*
*
*
*
*
*
POPULAÇÃO E AMOSTRA
POPULAÇÃO => PARÂMETRO:
= PARÂMETRO: é uma medida numérica que descreve uma característica da população
AMOSTRA => ESTATÍSTICA
=ESTATÍSTICA: é uma medida numérica que descreve uma característica da amostra
*
*
*
Variável
 é o conjunto de resultados possíveis de um fenômeno.
 é a característica ou propriedade da população que está sendo medida.
 Ex.:
• População: gatos atendidos em clinicas
Variável: raça dos animais.
• População: alunos da graduação veterinária
Variável: sexo
• População: animais da raça Nelore do Triângulo
Variável: peso
*
*
*
QUANTITATIVAS DISCRETAS:
• quando os valores podem assumir apenas determinados valores e resultam de uma contagem.
• O conjunto de valores possíveis que a variável pode assumir é finito ou infinitos enumerável.
Ex:
• número de animais atendidos em um
hospital veterinário
• número de animais assintomáticos
 QUANTITATIVAS CONTÍNUAS
• quando os valores podem assumir pertence ao conjunto dos números reais. Podem assumir qualquer valor.
• Obtido por medição.
Ex;
• peso de um animal
• altura
• tempo de vôo entre duas cidades
• peso
*
*
*
Ao realizar uma medida e obter um resultado
Temos que garantir a reprodutibilidade
Todas as informações devem ser fornecidas para que outro experimentador confirme (reproduza)
Conjunto de medidas e resultado
Instrumento usado
Condições externas (T, P, umidade, etc...)
Tipo de análise feita com os dados
*
*
*
É fundamental que você saiba:
 construir tabelas apresentando seus dados
construir gráficos apresentando seus dados
Analisar os gráficos para obter resultados
*
*
*
Probabilidades e distribuições
Podemos prever o resultado ao jogar um dado?
Esse é um fenômeno aleatório
Resultados (1, 2, 3, 4, 5, 6) definem um evento
Todos ao valores têm a mesma probabilidade de ocorrer (se o dado não for viciado)
Não!!!!!!
Queremos desenvolver um tratamento de dados que permita a partir de um conjunto de dados prever comportamentos gerais 
*
*
*
Observação repetida de uma grandeza (Y)
forma um conjunto com n valores (yi) a partir dos quais podemos determinar:
- Quantas vezes ni um determinado valor yi ocorreu, ao se realizar n observações de Y
- A distribuição de freqüências: fi = ni/n
Exemplo: joga-se um dado (30 vezes) = no total de eventos
No de vezes que deu 1 = 3
Então fi = ni/n = 3/30 = 1/10 
*
*
*
Se n ∞ espera-se que essa fração seja igual à probabilidade de ocorrência do evento yi
P(yi) = lim ni/n = lim fi
Se todos os eventos são equiprováveis então:
P = P1 = 1/n
Na prática não temos n = ∞; usamos a aproximação para n grande 
No caso do dado (apara qualquer número):
 P = 1/6 ~0,17 ~17%
*
*
*
Algumas propriedades
Probabilidade que ocorram 2 eventos gi ou gj na observação do mesmo processo é a soma das probabilidades de que cada evento cocorra
Pi ou Pj = Pi + Pj
EX: P de que ocorra 4 ou 6 no lançamento de um dado:
P4 = 1/6 ; P6 = 1/6 ; P4ou6 = 1/6 + 1/6 = 2/6 = 1/3
*
*
*
E se observarmos dois eventos independentes? Como obter P?
Considere dois eventos g e h 
Pi de que observe os valores gi com pi
Pj de que observe os valores hi com qi
Piej= pi.qi
EX: lançar um dado e tirar 4 e jogar uma moeda e obter cara
pi = 1/6
qi = 1/2
pi . qi = 1/6 . ½ = 1/12 (~8,3%)
*
*
*
Distribuição de variável discreta
Processos aleatórios = resultado pode ser descrito quantitativamente (y)
Resultados possíveis para Y = conjunto de valores (yi) 
Valores bem definidos 
Variável é discreta
Cada valor de yi tem P(yi) de ocorrer
O conjunto de m valores P(yi) para todos os valores possíveis é definido como:
Distribuição de probabilidade (para y)
Propriedade: 
*
*
*
Exemplo: lançamento de um dado
i = 1..6
yi = 1, 2, 3, 4, 5, 6
P(yi) = 1/6 
*
*
*
Dado um conjunto de dados
temos distribuição de freqüências
Que podemos visualizar num gráfico = Histograma
Função que ajusta nesse gráfico: binomial
Estudar Vuolo capitulo 1 
*
*
*
Mas e se a variável for contínua?
Variável contínua: processo aleatório que pode resultar em um número muito grande de valores possíveis (y1, y2, y3,... yn)
Como fazer a distribuição das probabilidades P(yi)?
Como fazer a distribuição das freqüências f(yi)?
SOLUÇÃO: redefinir a ocorrência de um evento 
Em outras palavras: vamos adotar um intervalo de valores e não um valor apenas)
Ocorre um evento yi se o resultado do processo é uma quantidade yj contida num intervalo Dy
*
*
*
Na prática:
Temos um no limitado (finito) de observações
NÃO sabemos o valor da média e do desvio padrão (queremos descobrir)
Agrupamos os valores observados em intervalos Dy
Assumimos que em cada Dy, P de ocorrência é constante
RESULTADO = Histograma
Os valores P(yi), f(yi) para cada yi são apresentados por barras paralelas ao eixo y 
Mas como escolher Dy?
*
*
*
Mas que informação podemos obter do histograma?
*
*
*
*
*
*
Distribuição gaussiana
*
*
*
e s mede a meia largura a uma altura de 1/e. 
Gaussiana 
Uma função gaussiana é definida como: 
*
*
*
Na teoria de probabilidades, a distribuição gaussiana é dada por:             
m = média
s = desvio padrão
s2 = variância
x = variável
*
*
*
*
*
*
*
*
*
Mas o que isso quer dizer?
*
*
*
Mas o que isso quer dizer?
Qual dessas distribuições gaussianas preferimos?
Em qual delas os pontos se afastam mais da média?
Como podemos “medir” esse afastamento?

Teste o Premium para desbloquear

Aproveite todos os benefícios por 3 dias sem pagar! 😉
Já tem cadastro?

Outros materiais