Buscar

Introdução à Estatística Aplicada

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 55 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 55 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 55 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Unidade I
ESTATÍSTICA APLICADA 
Profa. Ana Carolina Bueno
Estatística
 Interpretar processos em que há 
variabilidade.
 “Estatísticas” indica qualquer coleção de 
dados quantitativos, ou ainda, ramo da 
matemática que trata da coleta, da análise, 
da interpretação e da apresentação de 
massa de dados numéricos.
 “Estatística” é um conjunto de métodos 
e processos quantitativos que serve para 
estudar e medir os fenômenos coletivos.
Áreas da estatística
 Estatística descritiva: descreve e analisa 
determinada população, utilizando 
métodos numéricos e gráficos, para se 
determinarem padrões, em um conjunto 
de dados e, assim, apresentar a 
informação.
 Estatística inferencial: conjunto de 
métodos para a tomada de decisões, nas 
situações em que há incerteza, variações 
ou outras generalizações acerca de um 
conjunto maior de dados.
Classificação dos dados
Dados
Qualitativos
Quantitativos
Discretos
Contínuos
Classificação dos dados
Elementos da estatística
 População
 Amostra
 Amostragem
 Amostragem simples
Elementos da estatística
 Amostragem sistemática
 Amostragem estratificada
Formas iniciais de tratamento de 
dado 
A tabela mostra uma pesquisa sobre o 
número de filhos por funcionário de uma 
certa empresa:
 Dados Brutos
 Rol
0 2 1 2 3 5 2 0 2 1
2 0 0 1 1 2 3 3 1 2
0 0 0 0 1 1 1 1 1 2
2 2 2 2 2 2 3 3 3 5
Séries estatísticas
 Uma série estatística se define como 
qualquer tabela na qual haja distribuição 
de um conjunto de dados estatísticos 
destinados a uma mesma ordem de 
classificação: quantitativa.
Séries estatísticas
Séries homógradas: em que há variação 
discreta ou descontínua na variável descrita.
 Série temporal
 Série geográfica
 Série específica
Séries heterógradas: são aquelas nas quais
o fenômeno/fato apresenta gradações
ou subdivisões.
 Distribuição de frequências
Distribuição de frequências
 Organiza os dados de acordo com as 
ocorrências dos diferentes resultados 
observados.
 Apresentada em tabela ou gráfico.
 Tabela: apresenta de forma resumida um 
conjunto de dados.
 Tabelas de Frequência 
 Tabelas de Frequência Relativas
 Tabelas de Frequência Acumuladas
Tabelas
Interatividade
São dados os seguintes experimentos:
I. Lançar uma moeda cinco vezes e observar o número 
de caras.
II. Numa linha de produção, observar dez itens, tomados 
ao acaso, e verificar quantos estão defeituosos.
III. Verificar o tempo que internautas ficam em site de 
reportagem.
IV. Em uma realização de projeto, verificar a porcentagem 
do término do projeto após 6 meses.
Quais dos itens acima terão eventos classificados como 
variáveis aleatórias discretas?
a) I, II.
b) I, IV.
c) II, IV.
d) III.
e) I, II, III, IV.
Resposta
São dados os seguintes experimentos:
I. Lançar uma moeda cinco vezes e observar o número 
de caras.
II. Numa linha de produção, observar dez itens, tomados 
ao acaso, e verificar quantos estão defeituosos.
III. Verificar o tempo que internautas ficam em site de 
reportagem.
IV. Em uma realização de projeto, verificar a porcentagem 
do término do projeto após 6 meses.
Quais dos itens acima terão eventos classificados como 
variáveis aleatórias discretas?
a) I, II.
b) I, IV.
c) II, IV.
d) III.
e) I, II, III, IV.
Distribuição de frequências
 Gráficos: são usados para visualizar facilmente 
a natureza da distribuição dos dados.
 Um gráfico é uma figura constituída a partir de 
uma tabela, pois é quase sempre possível locar 
um dado tabulado num gráfico.
 Colunas
 Barras
 Linhas
 Setores
 Dispersão
 Histograma
 Polígono de frequência
 Etc.
Gráfico em colunas
Gráfico em barras
Gráfico em linhas
Gráfico em setores
 Total __________360º
 Parte___________ xº
Diagrama de dispersão
TAXA DE ANALFABETISMO (%)
T
A
X
A
 D
E
 C
R
E
S
C
IM
E
N
T
O
D
E
M
O
G
R
Á
F
IC
O
 (
%
)
Histograma
0
2
4
6
8
10
12
148. 152. 156. 160. 164. 168. 172. 176.
Nú
m
er
o d
e 
alu
no
s
estatura
Estatura de 40 alunos
Polígono de frequência
0
2
4
6
8
10
12
148. 152. 156. 160. 164. 168. 172. 176.
Nú
me
ro
 de
 al
un
os
Estatura
Estatura de 40 alunos
Medidas de tendência central
 Como podemos 
descrever estes 
dados?
 Como podemos 
resumir estes dados?
 Média
 Mediana
 Moda
0
2
4
6
8
10
12
148. 152. 156. 160. 164. 168. 172. 176.
Nú
me
ro
 de
 al
un
os
Estatura
Estatura de 40 alunos
Estatura Xi Fi
150  154 152 4
154  158 156 9
158  162 160 11
162 166 164 8
166  170 168 5
170  174 172 3
Total 40
Média
 É a soma dos valores de todas as 
observações dividida pelo número 
de observações envolvidas. 
 Vantagem: leva em conta todos os 
valores no seu cálculo.
Número de filhos – média 
0 0 0 0 1 1 1 1 1 2
2 2 2 2 2 2 3 3 3 5
Nº de filhos fi
0 4
1 5
2 7
3 3
4 0
5 1
Total 20
X =
0 . 4 + 1 . 5 + 2 . 7 + 3 . 3 + 4 . 0 + 5 . 1
20
X =
0 + 5 + 14 + 9 + 0 + 5
20
X =
33
20
X = 1, 65
Média ponderada
 Um aluno fez um teste (peso 1) e duas 
provas (peso 2), tirando 8 no teste, 5 na 
primeira prova e 6 na segunda prova. 
 A sua média (ponderada) será 
 Se o teste e a prova tivessem o mesmo 
peso (e não importa qual o valor do peso, 
importa apenas a relação entre os pesos), 
a média seria, aproximadamente, 6,33.
 
Interatividade
Em um levantamento realizado em maio, com os 
134 funcionários da empresa XK, em relação a 
variável expressa em unidades monetárias (u.m.), 
obteve-se a tabela abaixo. Determine a média.
a) 3 salários. 
b) 4 salários.
c) 5 salários.
d) 6 salários.
e) 7 salários.
Salário Nº de funcionários
3 32
5 34
7 40
9 28
Resposta
d) 6 salários
Média
Salário Nº de funcionários Xifi
3 32 3x32 = 96
5 34 5x34 = 170
7 40 7x40 = 280
9 28 9x28 = 252
saláriosx 95,5
134
798
134
25228017096



Mediana (Md)
 Divide uma série ordenada de dados em 
duas partes iguais. Ocupa a posição 
central. Não é afetada por valores 
extremos.
 A amostra pode ter número ímpar de 
elementos ou número par de elementos.
 Calcular a posição da mediana com a 
formula a seguir: 
 Posição mediana = (n + 1)/2.
Mediana – nº ímpar de elementos
 Um conjunto de dados indica o salário 
de funcionários de uma empresa xi = {6, 
9, 3, 5, 2, 9, 5, 5, 8, 7, 1, 7, 2}, em que n = 
13. 
 Rol - {1, 2, 2, 3, 5, 5, 5, 6, 7, 7, 8, 9, 9}
 Posição mediana = (n+1)/2
 Posição mediana = (13+1)/2 = 7 (indica a 
posição)
 Então
 Md = 5
Mediana – nº par de elementos
 Exemplo: número de filhos
 Posição mediana = (20 + 1) / 2 = 10,5
 Então:
 Md = (2 + 2)/2 = 2 filhos
0 0 0 0 1 1 1 1 1 2
2 2 2 2 2 2 3 3 3 5
Moda (Mo)
 Um conjunto de dados ao dado que 
ocorre com maior frequência. A moda 
não é afetada por valores extremos. É 
utilizada para fins descritivos apenas, 
uma vez que é, dentre as medidas de 
tendência, a mais variável de amostra 
para amostra.
 Uma moda: unimodal
 Duas modas: bimodal
 Mais de duas modas: multimodal
 Nenhuma moda: amodal
Número de filhos – moda 
 Mo = 2 filhos (unimodal)
0 0 0 0 1 1 1 1 1 2
2 2 2 2 2 2 3 3 3 5
Nº de 
filhos
fi
0 4
1 5
2 7
3 3
4 0
5 1
Total 20
Medidas de dispersão
 Medidas quemostram a dispersão dos dados 
em torno da tendência central.
 A variação se refere a quanto os valores 
podem diferir entre si e pode ser medida por 
números específicos.
 Os números relativamente próximos uns 
dos outros têm baixas medidas de variação, 
enquanto os valores mais dispersos têm maior 
medida de variação.
0
2
4
6
8
10
12
148. 152. 156. 160. 164. 168. 172. 176.
Nú
me
ro
 de
 al
un
os
Estatura
Estatura de 40 alunos
Medidas de dispersão
 Amplitude
Amplitude Total = Valor máximo – Valor mínimo
 Variância
 Desvio padrão
 Coeficiente de variação
100
x
s
CV
Amplitude – número de filhos
 Amplitude Total = Valor máximo – Valor mínimo
 Amplitude Total = 5 – 0 = 5
Nº de 
filhos
fi
0 4
1 5
2 7
3 3
4 0
5 1
Total 20
Variância – número de filhos
0 0 0 0 1 1 1 1 1 2
2 2 2 2 2 2 3 3 3 5
 
 
 
 
 
 
Número de filhos
Variância (s²)
Nº de filhos fi
0 4 (-1,65)² = 2,72 2,724 = 10,88
1 5 (-0,65)² = 0,42 0,425 = 2,10 
2 7 0,35² = 0,12 0,12  7 = 0,84 
3 3 1,35² = 1,82 1,82  3 = 5,46 
4 0 2,35² = 5,52 5,52  0 = 0 
5 1 3,35² = 11,22 11,22  1 = 11,22 
Total 20  = 30,50 
 
 
Número de filhos – desvio padrão 
(s) 
 
 
Interatividade
Dada a tabela do número de erros de impressão 
da primeira página de um jornal durante 50 dias, 
assinale a alternativa correta.
a) O tamanho da amostra é igual a 52. 
b) A média é igual a 10,5 erros.
c) O desvio padrão é igual a 17,3 erros.
d) O desvio padrão é igual a 4,2 erros.
e) A variância é igual a 4 erros².
Erros fi xi . fi (xi – x)² * fi
7 11 7 x 11 = 77 (7 – 12,7)² x 11 = 357,4
11 14 11 x 14 = 154 (11 – 12,7)² x 14 = 40,5
15 14 15 x 14 = 210 (15 – 12,7)² x 14 = 74,1
19 9 19 x 9 =171 (19 – 12.7)² x 9 = 357,2
48  = 612  = 829,2
Resposta
a) O tamanho da amostra é igual a 52. 
b) A média é igual a 10,5 erros.
c) O desvio padrão é igual a 17,3 erros.
d) O desvio padrão é igual a 4,2 erros.
e) A variância é igual a 4 erros².
Erros fi xi . fi (xi – x)² * fi
7 11 7 x 11 = 77 (7 – 12,7)² x 11 = 357,4
11 14 11 x 14 = 154 (11 – 12,7)² x 14 = 40,5
15 14 15 x 14 = 210 (15 – 12,7)² x 14 = 74,1
19 9 19 x 9 =171 (19 – 12.7)² x 9 = 357,2
48  = 612  = 829,2
Coeficiente de variação (CV)
 O coeficiente de variação é a razão entre 
o desvio padrão e a média. O resultado é 
multiplicado por 100, para que o coeficiente 
de variação seja dado
em porcentagem.
 O coeficiente de variação mede a dispersão 
em relação à média, comparando dois 
conjuntos de dados diferentes.
100
x
s
CV
Coeficiente de variação
 Idade
 Estatura
100
x
s
CV
100
65,1
23,1
CV %55,74CV
100
161
57,5
CV %46,3CV
Exemplo
Considere uma população de 40 profissionais 
liberais que foram questionados sobre o 
número de revistas e/ou jornais que eles são 
assinantes. Obteve-se os seguintes dados:
2 0 4 3 1 2 3 0 2 1
3 1 2 4 4 0 3 2 1 3
2 1 3 0 2 3 2 1 2 3
4 1 2 2 1 3 3 0 2 0
Exemplo
 Rol
Nº de publicações Nº de profissionais
0 6
1 8
2 12
3 10
4 4
0 0 0 0 0 0 1 1 1 1
1 1 1 1 2 2 2 2 2 2
2 2 2 2 2 2 3 3 3 3
3 3 3 3 3 3 4 4 4 4
Exemplo – gráfico 
0
2
4
6
8
10
12
14
1 2 3 4 5
Nº
 de
 pr
of
iss
ion
ais
Nº de publicações
Nº de assinantes
0 1 2 3 4
Exemplo – média e moda
 Média = 1,95 publicação
 Moda
 Mo = 2 publicações
Nº de publicações Nº de profissionais xi.fi
0 6 0x6 = 0
1 8 1x8 = 8
2 12 2x12 = 24
3 10 3x10 = 30
4 4 4x4 = 16
Total 40 (xifi) = 78
95,1
40
78
40
16302480


x
Exemplo – mediana
 Mediana
 Posição: (40 + 1)/2 = 20,5
 Então,
 Md = (2 + 2)/2 = 2 publicações
0 0 0 0 0 0 1 1 1 1
1 1 1 1 2 2 2 2 2 2
2 2 2 2 2 2 3 3 3 3
3 3 3 3 3 3 4 4 4 4
Exemplo – amplitude 
 Amplitude Total = Valor máximo – Valor mínimo
 Amplitude Total = 4 – 0 = 4
Nº de publicações Nº de profissionais
0 6
1 8
2 12
3 10
4 4
Exemplo – variância 
 Sabendo que a média é 1,95 publicações
Nº de publicações Nº de profissionais (xi – x)².fi
0 6 (0 – 1,95)²  6 
= 22,82
1 8 (1 – 1,95)²  8 
= 7,22
2 12 (2 – 1,95)²  12 
= 0,03
3 10 (3 – 1,95)²  10 
= 11,03
4 4 (4 – 1,95)²  4 
= 16,81
Total 40  = 57,91
 
²45,1
40
91,57
²
2
publicação
n
xx
s 


Exemplo – desvio padrão 
 Sabendo que a média é 1,95 publicações
Nº de publicações Nº de profissionais (xi – x)².fi
0 6 (0 – 1,95)²  6 
= 22,82
1 8 (1 – 1,95)²  8 
= 7,22
2 12 (2 – 1,95)²  12 
= 0,03
3 10 (3 – 1,95)²  10 
= 11,03
4 4 (4 – 1,95)²  4 
= 16,81
Total 40  = 57,91
publicaçãos 20,145,1 
Exemplo – coeficiente de variação
 Um CV igual a 61,54% indica que a 
dispersão dos dados em relação à média 
é muito grande, ou seja, a dispersão 
relativa é alta.
%54,61100
95,1
2,1
CV
Interatividade
 É dada uma tabela de uma 
amostra das notas dos alunos 
da disciplina de estatística.
I. A amostra tem 5 alunos.
II. A média da nota é igual a 3.
III. A moda da nota é igual a 6,5.
IV. A variância não pode ser usada como parâmetro 
para medir a variabilidade dos dados.
Assinale a alternativa com as afirmações incorretas.
a) I.
b) II. 
c) III e IV.
d) I, II e IV.
e) I, II, III e IV.
Nota Alunos
6,3 2
8,4 3
5,3 2
9,5 3
6,5 5
Resposta
d) I, II e IV (alternativas 
incorretas).
I. A amostra tem 5 
alunos.
II. A média da nota é igual 
a 3.
III. A moda da nota é igual 
a 6,5.
IV. A variância não pode 
ser usada como 
parâmetro para medir 
a variabilidade dos 
dados.
Nota Alunos xifi
6,3 2 12,6
8,4 3 25,2
5,3 2 10,6
9,5 3 28,5
6,5 5 32,5
Total 15 109,43,7
15
4,109
x
ATÉ A PRÓXIMA!

Outros materiais