Buscar

Aula_Prtica_2_-_Estatstica_Aplicada_s_Cincias_Sociais_e_Amb_-_Prof_Daniel_de_Christo

Prévia do material em texto

1
Estatística Aplicada às 
Ciências Sociais e Ambientais
Aula Prática Interativa 2
Prof. Daniel de Christo
CST em Gestão Ambiental
� Conjunto de elementos ou 
informações que compartilha 
uma característica
• Finita: passível de contagem
• Infinita: impossível de 
contagem
• Exemplo: população finita, mas 
muito grande
População
� Subconjunto de uma população
� Representativa 
� Qualitativa e quantitativa
• Suficientemente grande
• Elementos aleatórios
� Evitar tendenciosidades
Amostra
� Processo de obtenção da amostra 
de uma população
� Vantagens:
• menor custo
• resultado mais rápido
• objetivos amplos
• dados confiáveis
Amostragem
� Quando a amostragem é 
imprescindível:
• população muito grande
• testes destrutivos
• novas drogas, técnicas etc. 
• população hipotética
� Amostra Casual Simples
• Elementos aleatórios
� Amostra Sistemática
• Escolha por um sistema
� Amostra Estratificada
• Subpopulações/estratos
� Amostra de Conveniência
• Únicos elementos disponíveis
Técnicas de Amostragem
2
• Qualitativas: nominais ou 
ordinais
• Quantitativas: contínuas ou 
discretas
� Variável: é toda e qualquer 
característica que, quando 
observada em uma situação 
experimental, pode variar de 
um indivíduo para o outro
� Fontes de variação
• Fatores biológicos
• Condições e métodos de 
medição
• Variação aleatória 
� Impossível de ser explicada
� Levantamento de dados
• Coleta de dados para descrição 
e análise de uma população 
• Planejado no delineamento do 
experimento 
• Falhas: invalidação do 
experimento 
� Tipos de levantamento:
1. levantamento contínuo
�Registro Civil
2. levantamento periódico
�Recenseamento no Brasil
3. levantamento ocasional
�Pesquisas de opinião
� Apuração dos dados
• Etapa seguinte ao levantamento
• Determinar a frequência
• Distribuição de frequências
� Determinação das classes
• Algumas variáveis: difícil
�Complexidade, participar de 
várias classes, elevado número 
de classes
Tabulação
� Tabelas: ordenar e resumir dados
• Facilitar a análise e conclusão 
� Autossuficiente
• Significado próprio
• Fácil interpretação
� Seguir normas técnicas 
• ABNT, IBGE, e outras
3
Medidas de Tendência 
Central
� Determinação do centro de 
distribuição de uma variável 
� Descrevem diferentes 
propriedades da distribuição de 
uma variável 
� Média aritmética
• Representada:
x = ΣΣΣΣ x . f
n
• “xis barra” ou média amostral
• µ (mü): média populacional
• Moda (Mo) ou “Norma”:
corresponde ao valor de maior 
frequência
� Média ponderada
• Valores observados com peso ou 
relevância diferente
• Aplicar frequências hipotéticas 
para substituir os pesos 
� Mediana
• Valor central de uma distribuição 
ordenada (ordem crescente ou 
decrescente)
� Medidas de dispersão
• Centro de distribuição de uma 
variável: não é suficiente para 
caracterizar a amostra 
� Amplitude de variação
• É a diferença entre os valores 
extremos de uma distribuição
� Variância
• Utiliza todos os valores de uma 
distribuição
• s2 = é a média dos quadrados 
dos desvios da amostra
• Desvio: diferença entre o valor 
observado e a média aritmética 
da distribuição 
• σσσσ2 (sigma) = para população
� s2 = ΣΣΣΣ (xi - x)2 . Fi
n
� Desvio padrão
• Indica a variação em torno da 
média
• Desvio padrão = √√√√ s2 = s
4
� Coeficiente de Variação de 
Pearson 
• Medida de variabilidade relativa
• Permite comparar a 
variabilidade de duas 
distribuições
• V ou CV = 
s
x
� Probabilidade condicional: é 
a P de ocorrer um determinado 
evento sob uma dada condição
� Exemplo: ao jogar um dado, qual 
a chance de sortear o no “2” 
sabendo que ocorreu um no par? 
� P = 1 / 3 = 0,33 ou 33%
� P (AB) = P(A) sob a condição de 
ter ocorrido B
� Lei das P Independentes
• A Probabilidade de dois 
eventos independentes 
ocorrerem simultaneamente é 
igual ao produto das P dos 
eventos ocorrerem isoladamente
• P (A e B) = P(A).P(B)
• Também chamada Teorema 
do Produto
� Teorema da Soma
• A P de ocorrer o evento A ou B 
é igual P(A) + P(B) 
• Exemplo 1: urna com 5 bolas
• 2 brancas, 1 vermelha e
1 azul
• P de sortear 1 bola colorida? 
(vermelha ou azul)
• P(v)=1/5 ; P(a)=1/5
• P(v) + P(a) = _2_
5
Distribuição Normal/Gauss
� Variável aleatória: 
• variação ao acaso
• exemplos: peso de cobaias, 
gêmeos monozigóticos etc.
� Distribuição típica ou 
Distribuição normal
• Curva/forma de “sino” simétrica 
em torno da média µµµµ (mi)
5
� Características da Distribuição 
Normal
• Pode assumir qualquer valor real
• Área da curva = 1; P da variável 
assumir qualquer valor real
� Características
• Valores maiores e menores que 
a média ocorrem com igual P
• Média (µµµµ) variância (σσσσ2)
• Distribuição normal reduzida:
�média (µµµµ) = 0
�variância (σσσσ2) = 1 área da 
curva = 1 ���� tabelas
Testes de Hipóteses
� Inferência = amostra �
população
� Testes estatísticos: auxílio
� Procedimentos básicos
1. levantamento de dados
2. formular as H0 e H1
3. nível de significância (α)
4. escolher o teste
5. teste = valor numérico
Teste de χχχχ2 (Qui Quadrado)
1. χχχχ2 para aderência:
• verificar se uma distribuição está 
de acordo com uma teoria
2. χχχχ2 para independência:
• verificar se duas populações têm 
a mesma proporção de indivíduos 
com uma característica
� Teste t para observações
• Independentes: comparação 
das médias de duas populações
� Teste t para observações
• Pareadas: estudar uma variável 
com observações pareadas
�Gêmeos monozigóticos
�Mesmo indivíduo: duas 
regiões; antes e após
� Interpretação:χχχχ2 ou Teste t
• Valor calculado ≥≥≥≥ valor da 
tabela
• Rejeita–se H0 ; diferença é 
significativa ; (aceita H1 )
• Valor calculado ≤ valor da 
tabela = rejeita H1 ; diferença 
não é significativa (aceita H0 )
6
Teste Tukey
� Teste para comparação de médias
� Aplicar o teste quando há mais de 
dois tratamentos ou populações
� Muito utilizado, bastante rigoroso 
e fácil aplicação; Diferença Mínima 
Significativa (DMS) 
� Testar toda e qualquer diferença 
entre médias de tratamento
Testes Não Paramétricos
� Dados não atendem às exigências: 
distribuição diferente, 
heterogeneidade etc.
� Desvantagens: menor eficiência 
quando as exigências são 
atendidas, tamanho amostral 
maior, menos informações 
extraídas do experimento, análise 
mais tediosa
� Dados não atendem às exigências: 
distribuição diferente, 
heterogeneidade etc.
� Desvantagens: menor eficiência 
quando as exigências são 
atendidas, tamanho amostral 
maior, menos informações 
extraídas do experimento, análise 
mais tediosa

Continue navegando