Baixe o app para aproveitar ainda mais
Prévia do material em texto
Análise exploratória O sigma (S) significa “somatório definido” de vários números na matemática. Essa notação é usada para abreviar a indicação de grandes somas. Exemplo 1: Se uma variável “x” conter os valores 2, 4, 6 e 10 poderemos expressar a soma dessas variáveis da seguinte forma: x: 2, 4, 6, 10 Sx = 2 + 4 + 6 + 10 = 22 Exemplo 2: y: 3, 5, 2, 8 Sy = 3 + 5 + 2 + 8 = 18 Análise exploratória Inserindo índices A notação a seguir representa o somatório de n valores ordenados variando de i = 1 até n, em que 1 representa o limite inferior da série e n o limite superior. Neste caso, a letra i representa o índice ou posição do valor dentro da série. Exemplo 3 Exemplo 4 Exemplo 5 x: 2, 4, 5, 7 x: 2, 4, 5, 7 x: 2, 4, 5, 7 4 4 4 S xi = 2 + 4 + 5 + 7 = 18 S xi = 5 + 7 = 12 S x2 = 72 = 49 i = 1 i = 3 i = 4 Análise exploratória MÉDIA ARITMÉTICA SIMPLES S pi x ̄ = _____ = n Exemplo 6 p: 2, 4, 6 Iniciar somando todos os elementos da série. S pi = 2 + 4 + 6 = 12 Agora, substitua na fórmula: 12 x ̄ = _____ = 4 3 O objetivo da média aritmética é o valor médio de uma série. Para representar a média aritmética usamos o seguinte símbolo: x ̄ Análise exploratória MÉDIA ARITMÉTICA SIMPLES Exemplo 7 p: 2, 4, 6 3 Ache a média a partir de: S pi i = 2 Iniciar somando todos os elementos da série. S p2 = 4 + 6 = 10 Agora, substitua na fórmula: 10 x ̄ = _____ = 5 2 Análise exploratória MÉDIA ARITMÉTICA SIMPLES Artigos científicos publicados Professor Silas Análise exploratória MEDIANA O objetivo da mediana é calcular o valor central da série. Para calcular a resolução da mediana é preciso primeiro colocar os números em sequência, depois observar se o número de elementos da série é par ou ímpar. Se o número de elementos for ímpar, o valor da mediana é o número central da sequência, para encontrar este número você irá usar a seguinte fórmula: (n + 1)/2, onde n é o número de elementos da série. Se o número de elementos for par, o valor da mediana são os dois números centrais da sequência, para encontrar este número você irá usar as seguintes fórmulas: n/2 e n/2 +1, onde n é o número de elementos da série. Com os números que ocupam estas posições você irá calcular a média para obter o resultado. Análise exploratória MEDIANA Exemplo 8: Para o cálculo da mediana do conjunto de valores (n = 8) x = {5, 7, 8, 11, 12, 13, 14, 15} Observem que o conjunto é par, por isso, só precisamos dos dois elementos centrais para achar a mediana, basta soma-los e dividir por 2. Análise exploratória MEDIANA Exemplo 9: Determinar a mediana da seguinte sequência: 25, 10, 15, 5, 20. Primeiro, colocar os números na sequência: 5, 10, 15, 20, 25. Observe que a sequência tem cinco elementos, portanto o número de elementos é ímpar. Para calcular a mediana você usará: (n + 1)/2 = (5 + 1)/2 = 3 ------ olhando a sequência, a mediana é o número que ocupa a posição 3, que é o 15. Análise exploratória MEDIANA Exemplo 10: Determinar a mediana da seguinte sequência: 10, 15, 5, 20. Primeiro, colocar os números na sequência: 5, 10, 15, 20. Observe que a sequência tem quatro elementos, portanto o número de elementos é par. Para calcular a mediana você usará: (n / 2) = (4 /2) = 2 ------ a mediana é o número que está entre o segundo (n / 2) + 1 = (4 / 2) + 1 = 3 e o terceiro número da sequência, para acha-lo é só ver a média deles. x̄ = (10 + 15) / 2 = 12,5. Análise exploratória MODA O objetivo da moda é descobrir o valor da maior frequência de uma série. Para calcular a moda, você deverá observar qual é o elemento que se repete mais vezes. Exemplo 11: Determinar a moda da seguinte sequência: 13, 10, 9, 7, 10, 13, 10. Primeiro, deixar os números na sequência: 7, 9, 10, 10, 10, 13, 13. O elemento que se repete mais vezes é o 10, portanto: mo = 10 Análise exploratória MODA Exemplo 12: Determinar a moda da seguinte sequência: 1, 4, 3, 7, 3, 4, 2. Primeiro, deixar os números na sequência: 1, 2, 3, 3, 4, 4, 7. Neste caso, os elementos que se repetem mais vezes são 3 e 4, portanto: mo = 3 e mo = 4 Análise exploratória MEDIDAS DE DISPERSÃO Muitas vezes, a média não é suficiente para avaliar um conjunto de dados. Por exemplo, quando se fala em um grupo de homens com idade média de 18 anos. Esse dado, sozinho, não significa muito: pode ser que no grupo, muitos homens tenham 38 anos, e outros tantos sejam adolescentes de 14 anos. É importante, então, conhecer outra medida, a da diferença (dispersão) que existe entre a média e os valores do conjunto. Amplitude A amplitude (A) total, ou como também é chamada, o range, é a diferença entre o maior e o menor valor do conjunto de dados. A amplitude da distribuição de uma variável x com extremos inferior (xn) e superior (x1) é dada por: A = xn – x1 Análise exploratória MEDIDAS DE DISPERSÃO Amplitude Suponha que, em um terminal rodoviário urbano, é computado o número de pessoas que utilizam três linhas de ônibus e que os embarques ocorrem de hora em hora. A tabela apresenta os registros de embarques em um período de 13 horas. Primeiro, ordene os números da linha 1. Fica 5 7 8 9 10 14 18 35 44 44 50 65 70 Aplique a equação A = xn – x1, como n = 13, temos que A = x13 – x 1 = 70 – 5, assim a linha 1 apresenta uma amplitude A = 65 embarques. Análise exploratória MEDIDAS DE DISPERSÃO Variância – Representa a média dos desvios quadráticos de um conjunto de dados em relação à média. Para o cálculo da variância, primeiramente calcule os desvios quadráticos de cada um dos valores em relação a um valor central, ou seja, a distância de cada elemento em relação à media do conjunto. Onde: x1, x2, x3 até xn, são os dados da sequência e x ̄ é a média dos dados. Exemplo 13: X: 2, 4, 6 -------- a média é (2 + 4 + 6)/3 = 4 Desvios quadráticos = (x1 – x ̄ ) 2 = (2 – 4)2 + (4 – 4)2 + (6 – 4)2 = 4 + 0 + 4 = 8 Substituir na fórmula da variância, fica 8/3 = 2,66 Análise exploratória MEDIDAS DE DISPERSÃO Desvio padrão O desvio padrão é o resultado da raiz quadrada da variância e, no caso da população, é representado pela letra grega sigma (s). Exemplo 14: Retomando o exercício anterior. X: 2, 4, 6 - a média é (2 + 4 + 6)/3 = 4 Desvios quadráticos = (x1 – x ̄ ) 2 = (2 – 4)2 + (4 – 4)2 + (6 – 4)2 = 4 + 0 + 4 = 8 Substituir na fórmula da variância, fica 8/3 = 2,66 O desvio padrão é dado por: s = Ps2 = P2,66 = 1,63 Conclusão: a média dos dados é 4, e a variação média é de 1,63.
Compartilhar