Buscar

Estatistica para Biologia

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 44 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 44 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 44 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Discreta: Idade
Quantitativas
Contínua: Peso
Nominal: Cidade
Qualitativas
Ordinal: Grau escolaridade
Variáveis
MEDIDAS ASSOCIADAS A VARIÁVEIS 
QUANTITATIVAS
1 - MEDIDAS DE POSIÇÃO
• Moda
Realização mais frequente
• Mediana
Realização que ocupa posição central da série de 
observações
• Média Aritmética
Soma das observações dividida pelo número de observações
x fx(x)Me ou x
n
1
 (x)Me i
n
1 i
i
n
1 i
i  

MEDIDAS ASSOCIADAS A 
VARIÁVEIS QUANTITATIVAS
2 - MEDIDAS DE DISPERSÃO
• Desvio Médio
• Variância
• Desvio Padrão
n/xx)x(DM
n
1i
i


  




n
1i
)x(Vif
2
)xix(n/
n
1i
2
xix)x(VAR
)x()x(VAR)x(DP 
MEDIDAS ASSOCIADAS A 
VARIÁVEIS QUANTITATIVAS
OUTRAS MEDIDAS
•Extremos
•Quartis, Decis, Percentis
São chamadas estatísticas de ordem.
Uma medida resistente é aquela pouco afetada 
por mudanças de uma pequena porção de 
dados
Ex.: A) 5 7 8 10 12 15
Média= 9,5 Mediana= 9 Desvio Padrão= 3,62
B) 5 7 8 10 12 150 outlier
Média= 32 Mediana= 9 Desvio Padrão= 57,86
MEDIDAS ASSOCIADAS A 
VARIÁVEIS QUANTITATIVAS
Medidas de Dependência
• Variáveis Quantitativas
X Y
12 7,2
16 7,4
18 7,0
20 6,5
28 6,6
30 6,7
40 6,0
48 5,6
50 6,0
54 5,5
0
1
2
3
4
5
6
7
8
0 10 20 30 40 50 60
X - Renda bruta mensal em SM
Y - % Renda gasta com assistência médica
• Coeficiente de Correlação
Medidas de Dependência
 
 
 
 





 
 y
yy
x
xx
n
1
)y,x(corr i
n
1i
i
)yny()xnx(
yxnyx
22
i
22
i
ii





valoresdeNºn
1y)corr(x,1


Variável Aleatória Discreta
EXEMPLO:
Duas extrações sem reposição em uma urna contendo 
2 bolas brancas e 3 bolas vermelhas.
X = V.A. nº de bolas vermelhas
2/5
1/4 B
B
3/4
V
3/5
V
V
B2/4
2/4
Resultados Probabilidade X
BB
BV
VB
VV
1/10
3/10
3/10
3/10
0
1
1
2
xi 0 1 2
p(xi) 1/10 6/10 3/10
Valor Esperado V.A. Discreta
DENOMINAÇÕES: Valor Esperado, Valor Médio ou 
Esperança Matemática
     ii
n
i
xXPxXEX  

.
1

        ii
n
i
xXPXExXVX  

2
1
2
Variância
Modelos Probalísticos
1) Distribuição de Bernoulli (Discreta)
X assume somente dois valores: o valor 1 se 
ocorresse sucesso e ZERO se ocorresse fracasso
x 0 1
p(x) 1-p p
 
   p1pXV
pXE


Modelos Probalísticos
2) Distribuição Binomial (Discreta)
Número de sucessos (k) em uma amostra de tamanho n .
A amostra é um conjunto de repetições de Bernoulli 
independentes, onde a probabilidade de sucesso = p   
 
   p1p.nXV
p.nXE
kn
F...FFF
k
S...SSS
p1pkXP
knk
n
k












 
Modelos Probabilísticos
3) Distribuição Normal (Contínua)
Definição
X ~ N ( , 2 ) 
 


 

xe
2
1
)x(f
2
2
2
x
 
x
f(x)
0


  
 
Distribuição Normal
Momentos 
    2XVXE 
Propriedades
• f(x) é simétrica ao redor de x =
• x = é o ponto máximo de f(x)
• e são pontos de inflexão de f(x)
• f(x)  0 quando x 


 

Distribuição Normal
Conseqüências



X
Z
~ N (0,1), Z é tabelado
Ex.: X ~ N ( = 3, =16)
então
  




 





4
35
4
3X
4
32
P5X2P
   
2902,01915,00987,0
5,0Z0P0Z25,0P
2
1
Z
4
1
P









        nXPnXPxfxf 
 2,~Se NX


2

Inferência Estatística
Objetivo:
Fazer afirmações sobre as características de uma população,
baseadas em resultados de uma amostra
Motivação:
É muito dispendioso analisar toda a população
Inferência Estatística
Problemas Básicos:
Teste de Hipótese ou Estimação
Exemplo:
Lança-se uma moeda 50 vezes e obtém-se 36 caras
Teste de Hipótese:
A moeda é equilibrada (P=1/2) ou não?
Estimação:
Qual o valor de P, caso a moeda não seja equilibrada?
Inferência Estatística
Como selecionar uma amostra? Amostragem
 Probabilística
Utiliza mecanismos aleatórios de seleção de elementos da amostra,
atribuindo a cada um deles uma probabilidade a priori
Exemplo: amostra casual simples (todos os elementos possuem a mesma
probabilidade)
Vamos assumir que a amostra é sempre aleatória simples com reposição,
que implica em independência entre os elementos
 Intencional
Elementos selecionados com auxílio de especialistas
 Com Voluntários
Os elementos se oferecem como voluntários (teste de remédios)
Inferência Estatística
Amostragem
Estatística
É uma característica da amostra onde: 
  amostrada variância 
1-
1
amostrada média 
1
:.
,,
1
22
1
21







n
i
i
n
i
i
n
xx
n
S
x
n
X
Ex
xxxfT 
Inferência Estatística
Diferenciação de Notação 
Amostra X População
Característica Amostra População
Média
Variância
No de Elementos
Proporção PP
Nn
S
X
ˆ
22 

Inferência Estatística
Distribuição Amostral
Propriedade Básica
Os elementos da amostra possuem a mesma distribuição dos
elementos da população.
Distribuição Amostral da Média
   
    2
2
21







i
i
n
XVsendo
n
XV
XEsendoXE
n
XXX
X

Onde possui Distribuição Normal se n for suficientemente grande
X
Inferência Estatística
Teorema Central do Limite
A soma de variáveis aleatórias independentes e identicamente
distribuídas (com média µ e desvio padrão σ) possui Distribuição
Normal (com média nµ e desvio padrão σ ) quando o número de
variáveis aleatórias é muito grande,
Exemplo:
Se o valor médio de uma indenização é $ 400 e o desvio 
padrão $1.000, calcule a probabilidade de que a soma de 85 
indenizações, independentes uma da outra, seja superior a 
$ 49.000.
Solução:
30n
n
000.3440085 n 220.985000.1 n
%15,5)63,1(1)
220.9
000.34000.49
(1)000.49( 

 ZPZPSP
Inferência Estatística
Distribuição Amostral da Média
Propriedades
 
 nNX
N
n
X
Z
/,0~
1,0~
/
2




I -
II -
Inferência Estatística
Distribuição Amostral da Média
Exemplo 
 
    
    %9522502498
1,500~ Logo
pesados são pacotes os e 100 amostra uma se-Tira
100,500 ~ onde
máquina uma por enchidos pacotes de peso ..
2





ZPXP
XVXENX
n
NX
AVX

Logo, caso os 100 pacotes apresentem uma média fora
desse intervalo, é bem provável que a máquina esteja
desregulada.
Inferência Estatística
Distribuição Amostral da Proporção
A proporção de elementos portadores de uma certa 
característica é P
 PnBINSSP
P
XXXS
S
X
nn
nn
n
,~e/nˆ
 amostra.na 
ticacaracterísda portadores elementos de Proporçãoˆ
amostra na 
tica caracterísda portadores indivíduos de Total - 
contrário caso 0
ticacaracterísa possui elemento o se 1
21








Inferência Estatística
Distribuição Amostral da Proporção
   
       
n
PP
n
PPn
SV
n
PV
P 
n
nP
 
n
SE
 PE
n
n





111ˆ
ˆ
22
Onde possui DistribuiçãoNormal se n for suficientemente 
grande
Pˆ
Inferência Estatística
Determinação do Tamanho de uma 
Amostra
Exemplo: Suponha que em uma população no mínimo 60% 
das pessoas preferema a marca A. Se quisermos que o erro 
amostral de seja menor do que 0,03, com probabilidade 
maior do que 95%, então o tamanho da amostra será:
Pˆ
 nNX /,0~ 2   )( XP


Z
n

2
22

 Z
n 
024.1
)03,0(
)4,0)(6,0()96,1(
2
2
n
Estimação
Propriedades dos Estimadores
1) Estimador Não Viciado
A média do estimador é igual ao próprio parâmetro
Exemplo:
O estimador é não viciado, pois:
     


i
n
XEsendoXE
n
XXX
X
21
X
Estimação
Propriedades dos Estimadores
1) Estimador Não Viciado
O estimador é viciado, pois
Pode-se demonstrar, então, que o estimador 
é não viciado
2
1
2 )(
1
ˆ XX
n
n
i
i  


2
1
2 )(
1
1
XX
n
S
n
i
i 

 

22 1)ˆ( 
n
n
E


Estimação
Propriedades dos Estimadores
2) Estimador Consistente
Quando o número de observações tende para infinito, a 
variância do Estimador tende para zero
Exemplo:
O estimador é consistente, pois
    2
2
  iXVsendo
n
XV
n
XXX
X n


21
Estimação
Propriedades dos Estimadores
3) Estimador Eficiente
Um estimador é mais eficiente quando a sua variância é inferior 
à de outro estimador
Estimação
Intervalos de Confiança
O uso de um estimador pontual T de um parâmetro não 
permite determinar a magnitude do erro. Para tal são 
construídos intervalos de confiança com coeficiente de 
segurança baseados na distribuição amostral do estimador 
pontual. Ou seja:
E o intervalo de confiança é denotado da seguinte forma:


  )( 21 ttP
 21 ,);( ttIC 
Estimação
Intervalos de Confiança
IC para a média µ
Sabemos que: 
Ou seja,
 1,0~
/
N
n
X
Z



 nNX /,0~ 2


 








 )(
/
)( z
n
X
zP
    nzXnzXP /)(/)(
Inferência Estatística
IC para a média µ
Exemplo: Seja a máquina do exemplo anterior desregulada e com a
mesma variância. Em uma amostra de n=100 observou-se = 450.
Qual o intervalo de valores para a média com 90% de probabilidade?
   
 
  %90645,1450645,1450
%90645,1645,1
1,0~1,0~
/
1/101002











P
XP
NXN
n
X
n
Logo µ estará entre 448,4 e 451,6 com 90% de probabilidade
Intervalos de Confiança
X
Estimação
Intervalos de Confiança
IC para a proporção P
Sabemos que possui Distribuição Normal se n for 
suficientemente grande e que: 
Ou seja,
Onde P pode ser substituído pela sua estimativa 
  PPE ˆ
Pˆ
   
n
PP
PV


1ˆ
 











 )(
/)1(
ˆ
)( z
npp
PP
zP
    nppzPPnppzPP /)1()(ˆ/)1()(ˆ
Pˆ
Inferência Estatística
IC para a proporção P
Exemplo: Numa pesquisa de mercado, n = 400 pessoas foram
entrevistadas sobre determinado produto, e 60% delas preferiram a
marca A. Dado um coeficiente de confiança de 95%, determine um
intervalo de confiança para a proporção da população P.
Sabemos que
96,1)( z
Logo P estará entre 0,552 e 0,648 com 95% de probabilidade
Intervalos de Confiança
6,0ˆ P 95,0
  95,0400/4,06,096,16,0400/4,06,096,16,0  PP
  95,0648,0552,0  PP
Estimação
Erro Padrão de Estimação 
O erro padrão de um estimador T corresponde à raiz quadrada 
da variância de T, ou seja, 
Ex:
Podemos usar no lugar do o desvio padrão amostral S e no 
lugar de P o estimador amostral 
)()( TVARTEP 
n
XEP

)(
n
PP
PEP
)1(
)ˆ(


Pˆ

Testes de Hipóteses
Objetivo
O objetivo de um teste de hipótese é fornecer uma metodologia 
que nos permita verificar se os dados amostrais trazem 
evidências que apóiem ou não uma hipótese formulada.
Normalmente se testa a hipótese para um parâmetro 
populacional
Testes de Hipóteses
Procedimento Geral
Existe uma variável X associada a dada população e tem-se 
uma hipótese sobre determinado parâmetro dessa 
população. Por exemplo, afirmamos que o verdadeiro valor 
de é . Colhe-se uma amostra aleatória de elementos 
dessa população, e com ela deseja-se comprovar ou não tal 
hipótese ( ), chamada de hipótese nula.
Em seguida formula-se uma hipótese alternativa, a qual será 
considerada aceitável, caso a hipótese nula seja rejeitada. 
Exemplos: ou ou 

0

00 :  H
01 :  H01 :  H 01 :  H
Testes de Hipóteses
Erros no Teste de Hipótese 
Erro tipo I: Rejeitar a hipótese nula quando essa é verdadeira.
Erro tipo II: não rejeitar a hipótese nula, quando ela é falsa
)/( 00 verdadeiraéHHrejeitarP
)/( 00 falsaéHHrejeitarP
Testes de Hipóteses
Passos Para a Construção
1) Fixar a hipótese nula e a alternativa
2) Decidir qual estimador será usado par testar a hipótese 
nula
3) Definir a probabilidade do erro tipo I e utilizar este 
valor para construir uma região crítica (regra de decisão)
4) Usar as observações da amostra para calcular o valor da 
estatística do teste
5) Se o valor da estatística calculado com os dados da 
amostra não pertencer à região crítica, não rejeite 

0H
1H
Testes de Hipóteses
Exemplo Teste da Média com Variância 
Conhecida
Uma máquina de encher pacotes de café enche-os de acordo
com uma distribuição Normal com e variância igual a
. Desejamos, periodicamente, colher uma amostra de 16 pacotes
e verificar se a produção está sob controle, isto é, se ou
não. Se uma dessas amostras apresentar uma média ,
você pararia ou não a produção para regular a máquina, dado
que ?
g500 2400g
g500
gx 492
%1
gH
gH
500:
500:
1
0




Testes de Hipóteses
Exemplo Teste da Média com Variância 
Conhecida
, logo a média de 16 pacotes terá distribuição:
onde
A região crítica para não aceitar a hipótese nula é seguinte:
Sendo:
Logo, e e a hipótese nula não é rejeitada, pois a
média observada 492 não pertence à região crítica. Ou seja, o desvio
da méda da amostra para a média proposta pela hipótese nula pode
ser considerado como devido apenas ao sorteio aleatório dos
pacotes.
)2516/400,500(~ 2  NX
4002 
)1,0(~
5
500
N
X 
}{ 21 cc xxouxxRC 
X
58,25/)500( 1 cx
1,4871 cx 9,5122 cx
58,25/)500( 2 cx
Testes de Hipóteses
Exemplo Teste Para Proporção
Uma estação de TV afirma que 60% dos televisores estavam ligados
no seu programa de Segunda Feira. Uma estação competidora deseja
contestar essa afirmação e decide usar uma amostra de 200 famílias
e observou que 104 famílias estavam assistindo ao programa. Você
afirmaria que a audiênica é realmente de 60%, dado que .
Neste caso, a hipótese nula é a seguinte:
Se esta hipótese não for verdadeira, espera-se uma proporção menor.
A estação divulgaria o máximo possível, logo a hipótese alternativa é:
%5
60,0:0 pH
60,0:1 pH
Testes de Hipóteses
Exemplo Teste para Proporção
A proporção obtida de 200 famílias possui distribuição distribuição:
onde
A região crítica para não aceitar a hipótese nula é seguinte:
Sendo:
Logo, e a hipótese nula é rejeitada, pois a proporção que
foi observada pertenceà região crítica. Ou seja,
há evidências que a audiência do programa de Segunda Feira não foi
de 60% e sim inferior.
)0012,0200/4,06,0,6,0(~ˆ 2  Np
)1,0(~
0012,0
6,0ˆ
N
p 
}ˆˆ{ cppRC 
pˆ
645,10012,0/)6,0ˆ( cp
544,0ˆ cp
52,0200/104ˆ p

Outros materiais