Buscar

FUNDAMENTOS DE ESTATiSTICA

Prévia do material em texto

Análise exploratória
O sigma (S) significa “somatório definido” de vários números na matemática. 
Essa notação é usada para abreviar a indicação de grandes somas.
Exemplo 1: Se uma variável “x” conter os valores 2, 4, 6 e 10 poderemos
expressar a soma dessas variáveis da seguinte forma:
x: 2, 4, 6, 10
Sx = 2 + 4 + 6 + 10 = 22
Exemplo 2: 
y: 3, 5, 2, 8
Sy = 3 + 5 + 2 + 8 = 18
Análise exploratória
Inserindo índices
A notação a seguir representa o somatório de n valores ordenados variando de i = 1 
até n, em que 1 representa o limite inferior da série e n o limite superior. Neste 
caso, a letra i representa o índice ou posição do valor dentro da série.
Exemplo 3 Exemplo 4 Exemplo 5
x: 2, 4, 5, 7 x: 2, 4, 5, 7 x: 2, 4, 5, 7
4 4 4
S xi = 2 + 4 + 5 + 7 = 18 S xi = 5 + 7 = 12 S x2 = 72 = 49 
i = 1 i = 3 i = 4 
Análise exploratória
MÉDIA ARITMÉTICA SIMPLES
S pi
x ̄ = _____ = 
n 
Exemplo 6 p: 2, 4, 6
Iniciar somando todos os elementos da série. S pi = 2 + 4 + 6 = 12
Agora, substitua na fórmula:
12
x ̄ = _____ = 4
3
O objetivo da média aritmética é o valor médio de uma 
série. Para representar a média aritmética usamos o 
seguinte símbolo: x ̄
Análise exploratória
MÉDIA ARITMÉTICA SIMPLES
Exemplo 7 p: 2, 4, 6
3
Ache a média a partir de: S pi
i = 2 
Iniciar somando todos os elementos da série. S p2 = 4 + 6 = 10
Agora, substitua na fórmula:
10
x ̄ = _____ = 5
2
Análise exploratória
MÉDIA ARITMÉTICA SIMPLES
Artigos científicos publicados
Professor Silas
Análise exploratória
MEDIANA
O objetivo da mediana é calcular o valor central da série. Para calcular a resolução da 
mediana é preciso primeiro colocar os números em sequência, depois observar se o 
número de elementos da série é par ou ímpar. 
Se o número de elementos for ímpar, o valor da mediana é o número central da sequência, 
para encontrar este número você irá usar a seguinte fórmula: 
(n + 1)/2, onde n é o número de elementos da série.
Se o número de elementos for par, o valor da mediana são os dois números centrais da 
sequência, para encontrar este número você irá usar as seguintes fórmulas: 
n/2 e n/2 +1, onde n é o número de elementos da série. Com os números que ocupam 
estas posições você irá calcular a média para obter o resultado. 
Análise exploratória
MEDIANA
Exemplo 8:
Para o cálculo da mediana do conjunto de valores (n = 8) x = {5, 7, 8, 11, 12, 13, 14, 15}
Observem que o conjunto é par, por isso, só precisamos dos dois elementos centrais para 
achar a mediana, basta soma-los e dividir por 2.
Análise exploratória
MEDIANA
Exemplo 9:
Determinar a mediana da seguinte sequência: 25, 10, 15, 5, 20.
Primeiro, colocar os números na sequência: 5, 10, 15, 20, 25.
Observe que a sequência tem cinco elementos, portanto o número de elementos é ímpar. 
Para calcular a mediana você usará:
(n + 1)/2 = (5 + 1)/2 = 3 ------ olhando a sequência, a mediana é o número 
que ocupa a posição 3, que é o 15.
Análise exploratória
MEDIANA
Exemplo 10:
Determinar a mediana da seguinte sequência: 10, 15, 5, 20.
Primeiro, colocar os números na sequência: 5, 10, 15, 20.
Observe que a sequência tem quatro elementos, portanto o número de elementos é par. 
Para calcular a mediana você usará:
(n / 2) = (4 /2) = 2 ------ a mediana é o número que está entre o segundo 
(n / 2) + 1 = (4 / 2) + 1 = 3 e o terceiro número da sequência, para acha-lo
é só ver a média deles.
x̄ = (10 + 15) / 2 = 12,5.
Análise exploratória
MODA
O objetivo da moda é descobrir o valor da maior frequência de uma série. 
Para calcular a moda, você deverá observar qual é o elemento que se repete mais 
vezes. 
Exemplo 11:
Determinar a moda da seguinte sequência: 13, 10, 9, 7, 10, 13, 10. 
Primeiro, deixar os números na sequência: 7, 9, 10, 10, 10, 13, 13. 
O elemento que se repete mais vezes é o 10, portanto: 
mo = 10 
Análise exploratória
MODA
Exemplo 12:
Determinar a moda da seguinte sequência: 1, 4, 3, 7, 3, 4, 2. 
Primeiro, deixar os números na sequência: 1, 2, 3, 3, 4, 4, 7. 
Neste caso, os elementos que se repetem mais vezes são 3 e 4, portanto: 
mo = 3 e mo = 4
Análise exploratória
MEDIDAS DE DISPERSÃO
Muitas vezes, a média não é suficiente para avaliar um conjunto de dados. Por
exemplo, quando se fala em um grupo de homens com idade média de 18 anos.
Esse dado, sozinho, não significa muito: pode ser que no grupo, muitos homens
tenham 38 anos, e outros tantos sejam adolescentes de 14 anos.
É importante, então, conhecer outra medida, a da diferença (dispersão) que existe
entre a média e os valores do conjunto.
Amplitude
A amplitude (A) total, ou como também é chamada, o range, é a diferença entre o 
maior e o menor valor do conjunto de dados. A amplitude da distribuição de uma 
variável x com extremos inferior (xn) e superior (x1) é dada por:
A = xn – x1
Análise exploratória
MEDIDAS DE DISPERSÃO
Amplitude
Suponha que, em um terminal rodoviário 
urbano, é computado o número de pessoas 
que utilizam três linhas de ônibus e que os 
embarques ocorrem de hora em hora. A 
tabela apresenta os registros de embarques 
em um período de 13 horas.
Primeiro, ordene os números da linha 1. Fica 
5 7 8 9 10 14 18 35 44 44 50 65 70
Aplique a equação A = xn – x1, como n = 13, 
temos que A = x13 – x 1 = 70 – 5, assim a linha 
1 apresenta uma amplitude A = 65 
embarques.
Análise exploratória
MEDIDAS DE DISPERSÃO
Variância – Representa a média dos desvios quadráticos de um conjunto de dados em 
relação à média. Para o cálculo da variância, primeiramente calcule os desvios quadráticos de 
cada um dos valores em relação a um valor central, ou seja, a distância de cada elemento em 
relação à media do conjunto.
Onde: x1, x2, x3 até xn, são os dados da sequência e x ̄ é a média dos dados.
Exemplo 13: X: 2, 4, 6 -------- a média é (2 + 4 + 6)/3 = 4
Desvios quadráticos = (x1 – x ̄ )
2 = (2 – 4)2 + (4 – 4)2 + (6 – 4)2 = 4 + 0 + 4 = 8
Substituir na fórmula da variância, fica 8/3 = 2,66
Análise exploratória
MEDIDAS DE DISPERSÃO
Desvio padrão
O desvio padrão é o resultado da raiz quadrada
da variância e, no caso da população, 
é representado pela letra grega sigma (s).
Exemplo 14: Retomando o exercício anterior. 
X: 2, 4, 6 - a média é (2 + 4 + 6)/3 = 4
Desvios quadráticos = (x1 – x ̄ )
2 = (2 – 4)2 + (4 – 4)2 + (6 – 4)2 = 4 + 0 + 4 = 8
Substituir na fórmula da variância, fica 8/3 = 2,66
O desvio padrão é dado por: s = Ps2 = P2,66 = 1,63
Conclusão: a média dos dados é 4, e a variação média é de 1,63.

Continue navegando