Buscar

Aula 1 Descritiva I

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 28 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 28 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 28 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Estatística DescritivaEstatística Descritiva
(I)(I)
1
O que é Estatística
• Origem relacionada com a coleta e construção de tabelas de dados
para o governo.
• A situação evoluiu: a coleta de dados representa somente um dos
aspectos da Estatística.
• No século XIX, o desenvolvimento do cálculo de probabilidade e
outras metodologias matemáticas, tais como a técnica de Mínimos
Quadrados, foram fundamentais para o desenvolvimento da Estatística.
2
• No século XX a Estatística desenvolve-se como uma área específica
do conhecimento a partir do desenvolvimento da Inferência Estatística,
metodologia que faz uso da Teoria das Probabilidades e com ampla
aplicação em ciências experimentais.
• A Estatística hoje consiste em uma metodologia científica para
obtenção, organização e análise de dados oriundos das mais variadas
áreas das ciências experimentais, cujo objetivo principal é auxiliar a
tomada de decisões em situações de incerteza.
População
Características
Amostra
Técnicas de amostragem
Análise
descritiva
Estatística
3
Informações contidas
nos dados
Conclusões
sobre as
características
da população
descritiva
Inferência
estatística
Amostragem
Associada à coleta de dados, a tecnologia da amostragem
desenvolve técnicas para obtenção de amostras da população de
interesse de forma conveniente e informativa. As amostras que
consideraremos neste curso são do tipo probabilístico, em que
cada indivíduo da população pode ou não fazer parte da amostra
com a mesma probabilidade que os demais.
4
com a mesma probabilidade que os demais.
Exemplos de usoExemplos de uso:
• Pesquisas de mercado
• Pesquisas de opinião pública
• Ensaios clínicos
• Controle de qualidade
Estatística Descritiva
A disponibilidade de uma grande quantidade de dados e de
Etapa inicial da análise utilizada para descrever, organizar
e resumir os dados coletados.
5
A disponibilidade de uma grande quantidade de dados e de
métodos computacionais eficientes tem revigorado esta área
da Estatística.
Probabilidade
A Teoria das Probabilidades propicia a modelagem
matemática de fenômenos aleatórios, em que está presente a
incerteza. É uma ferramenta fundamental para a Inferência
Estatística.
6
Inferência Estatística
Conjunto de técnicas que permite, a partir de dados
amostrais, tirar conclusões sobre a população de interesse,
com um controle probabilístico sobre a confiabilidade de
tais inferências.
Exemplo 1: 
Numa pesquisa eleitoral, um instituto de pesquisa tem como
objetivo prever o resultado da eleição, utilizando uma
amostra da população.
7
Considere o Candidato “A”:
Denomine por p a proporção de pessoas na população 
que votarão em “A” na eleição.
Denomine por p a proporção de pessoas no^
8
^EstimaçãoEstimação:: Podemos usar o valor de p para estimar
a proporção p da população.
Denomine por p a proporção de pessoas no
levantamento amostral de opinião que expressam
intenção de voto em “A”.
^
Pesquisa DataFolha
O quadro, apresentado a seguir, refere-se à intenção de
Em anos de eleições, os institutos de pesquisa de opinião
colhem periodicamente amostras de eleitores para obter as
estimativas de intenção de voto da população. As estimativas
são fornecidas com um valor e uma margem de erro.
9
O quadro, apresentado a seguir, refere-se à intenção de
voto para presidente do Brasil para o primeiro turno das
eleições de 2014. A resposta foi estimulada e única.
Pergunta realizada: Se a eleição para presidente fosse
hoje e os candidatos fossem estes, em quem o(a) Sr.(Sra)
votaria?
Intenção de voto para presidente do Brasil, 1º Turno – 2014 
10
Pesquisa DataFolha, em % do total de votos.
5.377 eleitores - Margem de erro de 2% com 95% de confiança.
Estatística Descritiva
O que fazer com as observações que 
coletamos?
11
Resumo dos dados = Estatística descritiva
Primeira Etapa:
NOMINALNOMINAL sexo, cor dos olhos
Variável: 
Qualquer característica associada a uma população.
Classificação das variáveis:
12
QUALITATIVAQUALITATIVA
QUANTITATIVAQUANTITATIVA
NOMINALNOMINAL
ORDINALORDINAL
CONTÍNUACONTÍNUA
DISCRETADISCRETA
peso, altura, salário, idade
número de filhos, número de carros
sexo, cor dos olhos
classe social, grau de instrução
User
Typewriter
Não há ordem entre as opções
User
Typewriter
Existe ordem entre cada opção
User
Typewriter
Opções que são medidas
User
Typewriter
Opções que são contadas
Variáveis Quantitativas
Mínimo, Máximo, Moda, Média, Mediana, Percentis
MEDIDAS DE POSIÇÃO:
13
Amplitude, Distância Interquartil, Variância, 
Desvio Padrão, Coeficiente de Variação.
MEDIDAS DE DISPERSÃO: 
• Máximo (max): é o maior valor observado
• Mínimo (min): é o menor valor observado
• Moda (mo): é o valor (ou atributo) que ocorre com a 
maior frequência.
Medidas de Posição
14
Dados: 4, 5, 4, 6, 5, 8, 4
mo = 4max = 8 min = 4
n
x
n
xxxx
x
n
i
i
n
å
==

= 1321
...
• Média:
15
Dados: 2, 5, 3, 7, 8
 5
5
87352
=

=x
• Mediana:
A mediana é o valor da variável que ocupa a posição
central de um conjunto de n dados ordenados.
2
 Posição (ordem) da mediana: n+1
16
2
 Posição (ordem) da mediana: n+1
Exemplos:
Dados: 2, 6, 3, 7, 8
Dados ordenados: 2 3 6 7 8 
 n = 5 (ímpar)
Posição da Mediana 
 ordem: 5+1 = 3o.
2
 Md=6
17
Md = (4 + 6) / 2 = 5
Dados: 4, 8, 2, 1, 9, 6  n = 6 (par)
Dados ordenados: 1 2 4 6 8 9

Md
 6+1 = 3,5o.
2
O percentil de ordem pp 100100 (0 < pp < 1), em um
conjunto de dados de tamanho nn, é o valor da variável
que ocupa a posição pp  (nn + 1) do conjunto de dados
ordenados.
Percentil:
percentil 50 = mediana ou segundo quartil (Md)
Casos particulares:
18
percentil 50 = mediana ou segundo quartil (Md)
percentil 25 = primeiro quartil (Q1)
percentil 75 = terceiro quartil (Q3)
percentil 10 = primeiro decil
Md = 3,05 Q1 = 2,05 Q3 = 4,9
Dados:Dados: 1,9 2,0 2,1 2,5 3,0 3,1 3,3 3,7 6,1 7,7  n=10
Posição de Md: 0,5(n+1)= 0,511= 5,5
Posição de Q1: 0,25 (11) = 2,75
Posição de Q3: 0,75 (11) = 8,25
 Md = (3 + 3,1)/2 = 3,05
 Q1=( 2+2,1)/2=2,05
 Q3=(3,7+6,1)/2=4,9
19
Md = 5,3 Q1 = 1,7 Q3 = 12,9
Dados:Dados: 0,9 1,0 1,7 2,9 3,1 5,3 5,5 12,2 12,9 14,0 33,6
 n=11
Observação: os softwares utilizam fórmulas de cálculo de 
percentis um pouco diferentes e, assim, podem fornecer
valores um pouco diferentes.
Grupo 1: 3,4,5,6,7Grupo 1: 3,4,5,6,7 Grupo 2: 1, 3, 5, 7, 9Grupo 2: 1, 3, 5, 7, 9 Grupo 3: 5,5,5,5,5Grupo 3: 5,5,5,5,5
Exemplo 2: Considere as notas de um teste de 3 grupos de alunos.
GG 11
* * * * *
GG 22
* * * * *
20
GG 22
GG 33
*
*
*
*
*
0 105
e md1= md2= md3 = 5Temos: x1 = x2 = x3 = 5
__ __ __
Medidas de Dispersão
Finalidade: encontrar um valor que resuma a 
variabilidade de um conjunto de dados.
•• AmplitudeAmplitude ((AA))::
A = máx - min
21
Para os grupos anteriores, temos:
Grupo 1, A = 4
Grupo 2, A = 8
Grupo 3, A = 0
A = máx - min
DadosDados:: 1,9 2,0 2,1 2,5 3,0 3,1 3,3 3,7 6,1 7,7
• Distância Interquartil:
É a diferença entre o terceiro quartil e o primeiro
quartil, ou seja, QQ33 -- QQ11..
22
Q1 = 2,05 e Q3= 4,9
Q3 - Q1 = 4,9 - 2,05 = 2,85
User
Typewriter
Problema: Não leva em conta os dados que estão fora dos quartis do meio. Se algum dado esta nos 25% iniciais ou nos 25% finais, ele não será considerado.
1
)(
1
)(...)()(
 Variância 1
2
22
2
2
12
-
-
=
-
---
==
å
=
n
xx
n
xxxxxx
s
n
i
i
n
• Variância:
•Desvio padrão:
23
Variância padrão Desvio == s
• Desvio padrão:
User
Typewriter
Problema: Não costuma ter uma unidade realista. Exemplo: (Kg)²
User
Typewriter
--> Por esse motivo, usa-se com mais frequencia a ferramenta de Desvio Padrão, pois é raíz da Variânça, corrigindo o problema da unidade.
Cálculo para os grupos:
4
GG11: s2 =(3-5)2+ (4-5)2+ (5-5)2+ (6-5)2+ (7-5)2
 s = 1,58 s2 = 10/4= 2,5
24
G3: s2 = 0  s = 0
GG22: s2 = 10  s = 3,16
Fórmulas alternativas para a Variância:
S2 =
X
i
2
i=1
n
å -nX
2
(n-1)
=
X
i
2
i=1
n
å -
1
n
X
i
i=1
n
å
æ
è
çç
ö
ø
÷÷
2
(n-1)
25
Em G1: Xi
2 = 9 + 16 + 25 + 36 +49 = 135
4
 S2 = 135 - 5(5)2 = 2,5
- é uma medida de dispersão relativa
- elimina o efeito da magnitude dos dados
- exprime a variabilidade em relação à média
s
• Coeficiente de Variação (CV)
26
%100=
x
s
CV
Altura 1,50m 0,05m 3,3%
Peso 50 kg 3,5kg 7%
Média
Desvio
Padrão 
Coef. de 
Variação
Altura e peso de alunos
Exemplo 3:
27
Peso 50 kg 3,5kg 7%
Conclusão: Os alunos são, aproximadamente, duas
vezes mais dispersos quanto ao peso do que quanto à
altura.
Desvio
padrão
Coef. de
variaçãoMédia
Recém-nascidos 50 6 12%
Altura (em cm) de uma amostra de recém-
nascidos e de uma amostra de adolescentes
Exemplo 4:
28
Conclusão: Em relação às respectivas médias,
as alturas dos adolescentes e dos recém-
nascidos apresentam variabilidades
semelhantes.
Recém-nascidos 50 6 12%
Adolescentes 160 16 10%
User
Typewriter
CONFERIR EXERCICIOS DE AULA PARA PROPRIEDADES

Outros materiais