Buscar

aula12 estatistica

Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original

Clique para editar o estilo do título mestre
Clique para editar o estilo do subtítulo mestre
*
*
*
ESTATÍSTICA
BÁSICA
*
*
*
Conteúdo (mínimo)
Medidas de posição central (média, moda)
Medidas de dispersão (variância, DP)
Tipos de dados (categóricos, contínuos)
*
*
*
Variável X 
(ex. tamanho de corpo, luminosidade, peso)
2.5, 16, 9, 5, 3.2, 4.7, 10, 13, 22, 0.12, 25, 17, 52, 8.1, 21, 182, 1.25, 0.156, 1.85, 45
Como resumir a informação nesse 
conjunto de dados de forma eficiente?
*
*
*
X = 2.5, 16, 9, 5, …
*
*
*
*
*
*
*
*
*
Média aritmética
*
*
*
Quando a média não funciona?
*
*
*
O que fazer?
Eliminar os dados que não gostamos?
Usar dados brutos?
Usar outra medida para resumir os dados?
*
*
*
Moda
O valor mais freqüente
*
*
*
*
*
*
Qual medida de tendência central devo usar?
Depende…
Sempre plotar os dados
Sempre plotar os dados
Além disso, nunca esqueça de plotar os dados!!!!
*
*
*
Exercício 1
Calcular média, moda e mediana deste conjunto de dados:
 1, 8, 4, 2, 2, 3, 1, 7, 3, 5, 3
Lembrete:
Para amostras de número N ímpar a mediana será o valor da variável que ocupa o posto de ordem N +1
 			 2
Para amostras de número N par a mediana será a média aritmética dos valores que ocupam os postos de ordem N e N +2 
 	 	 2 2
Clique para editar o estilo do título mestre
Clique para editar o estilo do subtítulo mestre
*
*
*
Tutorial 1
Estatística descritiva usando Statistica
*
*
*
*
*
*
Usar só a média não dá idéia da variabilidade nos dados
Medidas de dispersão:
Variância 
Desvio-padrão 
Coeficiente de variação
*
*
*
Relembrando…
*
*
*
Relembrando…
*
*
*
Média aritmética
Relembrando…
*
*
*
*
*
*
Calcular a média
*
*
*
Subtrair a média de cada valor individual – desvios da média
*
*
*
Subtrair a média de cada valor individual – desvios da média
*
*
*
Fazer a média do quadrado dos desvios = variância
*
*
*
Variância
*
*
*
Explicação intuitiva da variância
Variância mede o quanto dados tirados independentemente serão parecidos. Se a variância é grande, dois valores medidos independentemente não necessariamente serão próximos. Por outro lado, se a variância é pequena, esses dois valores serão similares.
*
*
*
Desvio padrão
Erro padrão
*
*
*
Exercício 1
Calcular variância, desvio padrão e erro padrão dos dados abaixo
 1, 8, 4, 2, 2, 3, 1, 7, 3, 5, 3
Lembrete:
*
*
*
Tipos de dados
Categóricos não ordenados: azul, verde, amarelo
Categóricos ordenados: classe baixa, média, alta
Contínuos: tamanho de corpo
*
*
*
Distribuições estatísticas I –
A distribuição normal
*
*
*
É uma das distribuições mais comuns. De onde ela vem?
- Quando uma variável é influenciada por uma variedade de fatores que agem aditivamente, a distribuição dessa variável geralmente é normal ou Gaussiana
- Boa parte da “estatística paramétrica” é baseada nessa distribuição
*
*
*
Medidas de associação entre variáveis
Correlação
Mede o quanto duas variáveis são interdependentes (covariam) (ex.: altura e peso em humanos)
Não afirma nada sobre causa e efeito
Regressão
Mede o quanto uma variável é influenciada por outra variável independente (ex.: a influência da temperatura no crescimento de Limnoperna – é possível que a temperatura influencie o crescimento, mas é improvável que o crescimento de Limnoperna afete a temperatura ambiente!)
*
*
*
Relembrando da variância
*
*
*
*
*
*
Imaginemos 2 variáveis
*
*
*
Imaginemos 2 variáveis
*
*
*
Explicação intuitiva da Covariância
Vimos que a variância mede o quanto dados tirados independentemente serão parecidos. 
Um argumento semelhante pode ser feito para covariância. Se a covariância entre X e Y é grande, se sabemos um valor de X1, teremos uma boa idéia de que valor apareceria para Y1
*
*
*
*
*
*
Uso da covariância
Se temos:
*
*
*
Outra medida interessante:
O rXY mede o grau de associação entre variáveis X e Y.
Se elevamos o valor de rXY ao quadrado, temos o coeficiente de determinação
r2 mede a percentagem que a variação de uma variável é explicada pela variação na outra.
Clique para editar o estilo do título mestre
Clique para editar o estilo do subtítulo mestre
*
*
*
Tutorial 2
Correlação usando Statistica
*
*
*
Regressão linear
Mede o quanto uma variável é influenciada por outra variável independente
Gera uma equação que descreve essa relação
*
*
*
Importante
Correlação  regressão!!
Não olhe somente o valor de p!!!
*
*
*
P significativo, r2 baixo…
*
*
*
*
*
*
*
*
*
O que afinal é o valor de p?
Um enunciado de um experimento poderia ser formulado assim:
H0: Um novo inseticida XXX NÃO afeta a mortalidade de moscas expostas topicamente.
H1: A taxa de mortalidade de moscas é alterada após exposição ao inseticida XXX
*
*
*
O que afinal é o valor de p?
p = probabilidade da H0 ser verdadeira
p = probabilidade 	de obter dados tão ou mais diferentes da H0 como os obtidos nos experimentos se Ho é verdadeira
*
*
*
Exemplo
Alguém entrou no laboratório e trocou o inseticida por água. Portanto XXX é inútil (Ho é verdadeira, não há efeito)
Observamos uma diferença média de 2.4 dias na sobrevivência das moscas expostas ou não a XXX 
p é a probabilidade de observarmos a diferença de 2.4 dias se H0 é verdadeira.
Se p é muito baixo, rejeitamos H0

Teste o Premium para desbloquear

Aproveite todos os benefícios por 3 dias sem pagar! 😉
Já tem cadastro?

Outros materiais