Buscar

Introdução à Estatística Descritiva

Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original

Prof.: Duarte
Aula 7
I – Introdução
O termo Estatística provém da palavra Estado e foi utilizado originalmente para denominar levantamentos de dados, cuja finalidade era orientar o Estado em suas decisões.
É uma ciência que se preocupa com o planejamento de uma pesquisa, envolvendo desde a forma de coleta das observações, obtidas em experimentos ou levantamentos, até a maneira como será feita a organização, a descrição, o resumo dos dados, a avaliação e afirmação sobre características de interesse do pesquisador.
Conceitos
População é o conjunto de todos os itens que interessam ao estudo de um fenômeno coletivo segundo alguma característica.
Exemplos: 
– A população de todos estudantes de Engenharia da Unisanta.
– A população de todos os torcedores do Santos.
– A população de todos eleitores do estado de São Paulo.
Conceitos
Amostra é qualquer subconjunto não vazio de uma população.
Exemplos: 
– Estudantes de Engenharia da Unisanta que fazem Engenharia Civil.
– Torcedores do Santos com mais de 30 anos.
– Eleitores do estado de São Paulo que votam em Santos.
Parâmetro é uma característica numérica estabelecida para toda a população.
Conceitos
Quando vamos estudar um fenômeno coletivo podemos optar entre os seguintes processos estatísticos: Censo e Estimação.
Censo é uma avaliação direta de um parâmetro utilizando-se todos os componentes da população.
Estimação é uma avaliação indireta de um parâmetro com base em uma característica numérica de uma amostra através do cálculo de probabilidades.
Conceitos
Dados estatísticos são os valores numéricos resultantes de um censo ou de uma estimação.
A Estatística utiliza métodos racionais para a obtenção de informações a respeito de um fenômeno coletivo, além de obter conclusões válidas para o fenômeno e permite a tomada de decisões, a partir dos dados estatísticos observados. Dessa forma, a Estatística pode ser dividida em duas áreas: 
Conceitos
a) Estatística Descritiva é o ramo da estatística que envolve a organização, o resumo e a representação de dados;
b) Estatística Indutiva é o ramo da estatística que envolve o uso de uma amostra para chegar a conclusões sobre uma população. 
II – Estatística Descritiva
A Estatística Descritiva tem as seguintes etapas:
a) Obtenção dos dados estatísticos;
b) Organização dos dados;
c) Redução dos dados;
d) Representação dos dados;
e) Obtenção de informações que auxiliam na descrição do fenômeno observado.
II – Estatística Descritiva
Quando fazemos n observações diretas em um fenômeno coletivo ou observamos as respostas a uma pergunta em uma coleção de n questionários, obtemos uma sequência x1, x2, ... , xn de n valores, que são denominados dados brutos.
A característica X observada num fenômeno coletivo se chama a variável que está sendo estudada. Dessa forma, os dados brutos podem ser representados na forma: X: x1, x2, ... , xn.
Quando ordenamos na forma crescente ou decrescente os dados brutos, essa ordenação passa a se chamar rol.
Exercício 1
Na P1 um aluno obteve as seguintes notas: 
4 ; 8 ; 5 ; 6 ; 3 ; 4. 
A variável X representa a nota bimestral desse aluno e pode ser apresentada na forma: 
X: 4 ; 8 ; 5 ; 6 ; 3 ; 4 (dados brutos).
Para obtermos o rol devemos colocar os dados brutos em ordem crescente ou decrescente. Para o caso crescente temos:
X: 3 ; 4 ; 4 ; 5 ; 6 ; 8 (rol).
Variável Discreta e Contínua
Quando o número de elementos distintos de uma série de dados brutos for pequeno dizemos que a variável X é discreta, como no caso do exemplo visto no slide anterior. Quando o número de elementos distintos de uma série estatística for grande dizemos que a variável é contínua como, por exemplo, a população de todos os alunos da UNISANTA.
1 – Variáveis discretas
A frequência simples (fi) de um elemento de uma série estatística é o número de vezes que esse elemento figura no conjunto de dados. Utilizando a noção de frequência simples podemos reduzir o número de elementos com os quais devemos trabalhar.
Exercício 2
A sequência a seguir representa a observação do número de acidentes diários na rodovia M durante 20 dias:
X: 0, 2, 0, 1, 1, 0, 0, 0, 3, 2, 1, 0, 1, 2, 0, 1, 3, 2, 2, 0 
O rol então será: 
X: 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 3, 3
Exercício 2
Temos:
x1 = 0 com frequência 
x2 = 1 com frequência 
x3 = 2 com frequência
x4 = 3 com frequência 
f1 = 8; 
f2 = 5; 
f3 = 5; 
f4 = 2. 
xi
fi
0
1
2
3
S
Agora vamos fazer a tabela de distribuição de frequência da variável X.
Com essa tabela, podemos obter algumas informações adicionais e úteis para compreensão da série estatística.
X: 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 3, 3
8
5
5
2
20
Obs.: o número de dados estatísticos será chamado de n e é igual a Sfi.
Frequências 
A frequência simples relativa de um elemento (distinto) xi de uma série com n = f1 + f2 + ... + fn (número de dados estatísticos) elementos é a fração fri definida por: 
A frequência acumulada simples Fi é a soma, definida por:
A frequência acumulada relativa Fri definida por: 
Obs.: As frequências relativas são dadas em porcentagem.
Exercício 3
Considere a tabela de distribuição de frequência dos salários de 25 funcionários de uma empresa: 
xi
fi
1000
3
2000
7
3000
8
4000
6
5000
1
S
25
x1 = 1000 Þ 
x2 = 2000 Þ 
x3 = 3000 Þ 
x4 = 4000 Þ 
x5 = 5000 Þ 
Vamos calcular as frequências simples relativas.
Exercício 3
Agora vamos calcular as frequências acumuladas simples.
xi
fi
1000
3
2000
7
3000
8
4000
6
5000
1
S
25
Exercício 3
Vamos calcular as frequências acumuladas relativas.
xi
fi
1000
3
2000
7
3000
8
4000
6
5000
1
S
25
Exercício 3
Tabela completa da distribuição das frequências:
xi
fi
fri(%)
Fi
Fri(%)
1000
3
2000
7
3000
8
4000
6
5000
1
S
25
#
#
12
28
32
24
4
100
3
10
18
24
25
12
40
72
96
100
Exercício 3
Tabela completa da distribuição das frequências:
xi
fi
fri(%)
Fi
Fri(%)
1000
3
12
3
12
2000
7
28
10
40
3000
8
32
18
72
4000
6
24
24
96
5000
1
4
25
100
S
25
100
#
#
Salário recebido pelo funcionário
Número de funcionários que recebem R$ 3000,00
Esses 8 funcionários representam 32% do total de funcionários
Total de funcionários que recebem salários até R$ 3000,00 
Esses 18 funcionários representam 72% do total de funcionários
Representações Gráficas
Podemos representar graficamente uma distribuição de frequências através de um Gráfico de Colunas, Gráfico de Barras ou Gráfico de Setores Circulares. 
Para exemplificar vamos supor que um dado é lançado 500 vezes e, em cada lançamento, foi anotado o número apresentado na face superior, obtendo-se a tabela:
Representações Gráficas
Face
Frequência absoluta(fi)
Frequência relativa(fr)
1
100
20%
2
75
15%
3
150
30%
4
50
10%
5
100
20%
6
25
5%
Σ
500
100%
a – Gráfico de Colunas
É um conjunto de hastes, representadas em um sistema de coordenadas cartesianas que tem por base os valores distintos da série estatística (xi) e por altura, valores proporcionais às frequências simples correspondentes destes elementos (fi).
a – Gráfico de Colunas
150
1
2
3
25
4
5
6
50
75
100
xi
fi
Face
( fi)
( fr)
1
100
20%
2
75
15%
3
150
30%
4
50
10%
5
100
20%
6
25
5%
Σ
500
100%
b – Gráfico de Barras
É igual ao Gráfico de Colunas com a inversão dos eixos, ou seja, as barras serão horizontais. 
Face
( fi)
( fr)
1
100
20%
2
75
15%
3
150
30%
4
50
10%
5
100
20%
6
25
5%
Σ
500
100%
3 – Gráfico de Setores Circulares
As áreas dos setores circulares são proporcionais as frequências relativas.
Face 1 = 360º x 
Face 2 = 360º x
Face 3 = 360º x
Face 4 = 360º x
Face 5 = 360º x
Face 6 = 360º x
0,20 =
72o
54o
108o
36o
72o
18o
0,15 =
0,30 =
0,10 =
0,20 =
0,05 =
Face
( fi)
( fr)
1
100
20%
2
75
15%
3
150
30%
4
50
10%
5
100
20%
6
25
5%
Σ
500
100%
Medidas de Tendência Central
Para efeito de análise da distribuição de frequências consideramos as medidas de tendência central. 
As mais importantes são: a média aritmética, a mediana e a moda.
Medidas de Tendência Central
Se x1, x2, ... ,xn são os distintos valores de uma variável X com frequências simples respectivamente, f1, f2, ... , fn e n = f1 + f2 + ... + fn , então a média aritmética vale:
a – Média Aritmética
Medidas de Tendência Central
A moda MO corresponde ao valor xi cuja frequência fi é o maior valor entre as frequências. Eventualmente pode haver mais de um valor para a moda.
b – Moda (MO)
Medidas de Tendência Central
A mediana MD é o termo que divide os dados estatísticos em duas partes iguais. Se Sfi (número de dados estatísticos) for impar a mediana é xi correspondente a fi do meio, se Sfi for par somam-se os dois xi dos dois termos centrais e dividimos por 2.
c – Mediana (MD)
Impar, qual o termo do meio?
Par, qual os termos centrais?
3
3 e 4
1
2
3
4
5
1
2
3
4
5
6
Exercício 4
 Considere a série do número de gols marcados por dez times em um turno de um campeonato X: 10, 11, 11, 11, 11, 13, 13, 13, 15, 15. Calcule m , MO e MD. 
xi
fi
Fi
xi. fi
10
11
13
15
S
#
1
4
3
2
10
10
44
39
30
123
1
5
8
10
Maior frequência é 4 Þ 
A soma dos fi é par. Os dois termos centrais são Fi = 5, que se encontra em xi = 11, e o Fi = 6, que se encontra em xi = 13.
Exercício 5
Considere a série do número de tiros acertados no alvo por 25 atiradores: X: 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 4, 4, 4, 4, 4, 4, 4, 4, 6, 6, 6, 6, 6, 6, 7. Calcule m, MO e MD.
xi
fi
Fi
xi. fi
2
3
4
6
7
S
#
3
7
8
6
1
25
6
21
32
36
7
102
Maior frequência 8 Þ
Como a soma dos fi é ímpar pegamos o termo do meio, que é Fi = 13. O xi neste caso é . 
4
3
10
18
24
25
Exercício 6
A distribuição de frequências para a série representativa da idade de 50 estagiários de uma empresa:
X: 	17 17 17 18 18 18 18 18 18 18
 	18 18 18 18 18 18 18 18 18 18
 	18 19 19 19 19 19 19 19 19 19
 	19 19 19 19 19 19 19 19 20 20
 	20 20 20 20 20 20 21 21 21 21
xi
fi
17
18
19
20
21
S
3
18
17
8
4
50
Construa a tabela das distribuições, calcule as m, MO e MD e construa o gráfico de colunas.
Idade (anos)
xi
node estagiários
fi
fri(%)
Fi
Fri(%)
xi.fi
17
18
19
20
21
S
#
#
38
Exercício 6
3
18
17
8
4
50
6
36
34
16
8
100
3
21
46
50
6
42
76
92
100
51
324
323
160
84
942
Lendo a linha de 19 anos:
Número de estagiários tem 19 anos;
Os estagiários com 19 anos são 34% do total;
Número de estagiários quem tem até 19 anos;
Os estagiários com até 19 anos são 76% do total.
84
38
Idade (anos)
xi
node estagiários
fi
fri(%)
Fi
Fri(%)
xi.fi
17
18
19
20
21
S
#
#
Exercício 6
Maior frequência 18 Þ
Termos centrais 25 e 26.
3
18
17
8
4
50
6
36
34
16
8
100
3
21
46
50
6
42
76
92
100
51
324
323
160
942
Exercício 6
xi
fi
17
18
19
20
21
S
3
18
17
8
4
50
17
18
19
20
21
xi
3
4
8
17
18
fi
Gráfico de colunas.

Teste o Premium para desbloquear

Aproveite todos os benefícios por 3 dias sem pagar! 😉
Já tem cadastro?

Outros materiais

Outros materiais