Buscar

AULA+ESTATÍSTICA+DESCRITIVA

Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original

*
*
NOTAÇÃO
Range (amplitude)
Notações Estatísticas
*
Sínteses Numéricas
*
Obs.:  A média nos dá uma idéia de onde os valores do meu conjunto de 	dados tende a se concentrar.
Medidas de Posição – Tendência Central
Média aritmética
*
Média aritmética
Exercício : Um estudante fez quatro provas e obteve as notas 89, 94, 95 e 86, a sua nota média é:
Medidas de Posição – Tendência Central
*
É a mais importante das medidas de tendência central;
A média de um conjunto de números pode ser sempre calculada;
Para um dado conjunto de números, a média é única;
É sensível (ou afetada) a todos os valores do conjunto. Assim se um valor se modifica, a média também se modifica;
Somando-se ou reduzindo-se uma constante a cada valor do conjunto, a média ficará aumentada ou reduzida dessa constante: µ(x ± k) = µ (x) ± k;
Multiplicando-se ou dividindo-se cada valor do conjunto por uma constante, a média ficará multiplicada ou reduzida por essa constante: µ(x .\ k) = µ (x) .\ k 
Medidas de Posição – Tendência Central
*
Foi introduzida recentemente nos estudos estatísticos;
Se obtém eliminando do conjunto de dados os “m” maiores e os “m” menores valores; 
No conjunto de dados abaixo, calcular a média aparada, com m =2
1, 2, 6, 7, 6, 8, 10, 8, 12, 23, 25, 8, 9, 7, 11, 12, 13, 10, 8, 9, 7, 12, 12, 10, 9, 11,7, 8, 6, 8, 9, 10, 11, 8, 7, 11, 12, 6, 10, 9, 7, 8, 10, 6, 7, 12, 8, 9, 10,
Normalmente m correspondente: 2,5% a 5% dos valores observados;
Na verdade o que se está fazendo é eliminando os valores extremos superiores e inferiores (valores discrepantes - outliers);
Medidas de Posição – Tendência Central
*
A média aritmética de todos os valores é = 9,29
Excluindo os dois menores e dois maiores valores (1, 2, 23 e 25), a média aparada é = 8,98
Medidas de Posição – Tendência Central
*
Cada elemento do conjunto pode ter importância diferente (peso). Neste caso o cálculo da média deve levar em conta os pesos desiguais de cada elemento.
Exercício : O colégio definiu que as provas mensais teriam peso de 30% e a prova final teria peso de 40% no cálculo dos rendimentos dos alunos. Veja o quadro abaixo e calcule a média do aluno.
 
Medidas de Posição – Tendência Central
*
Medidas de Posição – Tendência Central
*
A Mediana de um conjunto de valores é o valor do meio desse conjunto, quando estes estão em ordem crescente.
Divide um conjunto de dados ordenados em dois grupos iguais. 
Valor central = mediana
Medidas de Posição – Tendência Central
*
 Mediana 
 Conjunto de valores pares ( n = par)
+
 =
valor
n/2
(n / 2) + 1
valor
)
(
/ 2
Conjunto de valores impares (n = impar)
exemplo
= (valor 4/2 + valor (4/2 + 1))/2 
5, 7, 10, 11
n = 4 
exemplo
Medidas de Posição – Tendência Central
*
Exercício: Calcular a mediana das medidas de um conjunto de eixo:
 (3,0 ; 2,8 ; 2,9 ; 3,3 ; 3,5 ; 3,1 ; 3,2 ; 3,0 ; 3,4 ; 2,7)
 (2,7 ; 2,8 ; 2,9 ; 3,0 ; 3,0 ; 3,1 ; 3,2 ; 3,3 ; 3,4 ; 3,5)
Interpretação do resultado: 50% dos dados brutos são valores menores ou iguais a 3,05 e 50% desses são valores maiores ou iguais a 3,05.
Medidas de Posição – Tendência Central
 Mediana 
*
Salário dos funcionários de um restaurante
200, 250, 250, 300, 450, 460, 510
A média de 345,7 sintetiza razoavelmente o conjunto de dados (salários)
 Nos dois casos a mediana é 300. Para o segundo caso a mediana representa melhor o conjunto de dados.
 Num conjunto de dados fortemente desviado, a mediana é uma medida mais representativa (distribuição de rendas, folha de pagamentos)
Medidas de Posição – Tendência Central
*
A Moda de um conjunto de valores é o valor que apresenta maior freqüência em um conjunto de observações.
É o valor ou classe de maior freqüência num conjunto de dados.
 pode não existir
 pode não ser única
Medidas de Posição – Tendência Central
*
COMPARAÇÃO
Medidas de Posição – Tendência Central
*
Resposta: (média = 1,33) (mediana = 1) (moda =1).
Medidas de Posição – Tendência Central
*
A variabilidade de B é maior que de A
=
+
Medidas de Dispersão
*
Amplitude, range ou intervalo
É expresso pela diferença entre o maior e o menor valor num grupo, ou pela identificação desses dois números.
(1 ; 5 ; 7 ; 13)
(14 ; 3 ; 17 ; 4 ; 8 ; 73 ; 36 ; 48)
(3,2 ; 4,7 ; 5,6 ; 2,1 ; 1,9 ; 10,3) 
13 – 1 = 12
73 – 3 = 70
10,3 – 1,9 = 8,4
de 1 a 13
de 3 a 73
de 1,9 a 10,3
Medidas de Dispersão
*
Amplitude, range ou intervalo
•
•
•
•
•
•
•
•
LIMITAÇÃO: só leva em conta os dois valores extremos do conjunto, nada informando sobre os outros valores.
distribuição uniforme – o intervalo é uma boa medida
é uma medida apenas razoável
é uma medida ruim da dispersão
Medidas de Dispersão
*
Desvio médio absoluto 
DMA é fácil de entender e calcular
mas é pouco usado como medida de dispersão
outras medidas apresentam propriedades matemáticas mais interessantes
Medidas de Dispersão
*
Exercício: Calcule o DMA do conjunto de dados 2, 4, 6, 8, 10. Calcular o desvio médio.
Desvio médio absoluto 
Medidas de Dispersão
*
Variância
A Variância é uma medida de dispersão muito utilizada.
 
Medidas de Dispersão
*
Variância
Exercício: Calcule a variância da amostra 2, 4, 6, 8, 10. 
A média desse conjunto é 6.
Medidas de Dispersão
*
Desvio padrão
O desvio padrão é mais comumente usado porque se apresenta na mesma unidade da variável em análise. Assim, se a unidade da variável for mm, o desvio padrão também será mm.
Isso não acontece com a variância. 
É a raiz quadrada da variância.
Medidas de Dispersão
*
Desvio padrão
O desvio padrão é a medida de dispersão mais usada. Quanto maior é o desvio padrão maior é a dispersão dos dados em torno da média.
Medidas de Dispersão
*
Coeficiente de variação
É a relação entre o desvio padrão e a média do conjunto de dados.
Nos dá a idéia do tamanho do desvio padrão em relação à média.
Uma pequena dispersão absoluta pode ser na verdade considerável quando comparada com os valores da variável
amostra
população
Medidas de Dispersão
*
Exemplo: Calcular o desvio-padrão da amostra representada por: 1, 2, 4, 5, 7.
Médias e Desvio-padrão - Exemplos
		i
		Xi
		(Xi - 
)
		(Xi - 
)2
		1
		1
		(1 – 3,8) = -2,8
		(-2,8)2 = 7,84
		2
		2
		(2 – 3,8) = -1,8
		(-1,8)2 = 3,24
		3
		4
		(4 – 3,8) = 0,2
		(0,2)2 = 0,04
		4
		5
		(5 – 3,8) = 1,2
		(1,2)2 = 1,44
		5
		7
		(7 – 3,8) = 3,2
		(3,2)2 = 10,24
		
		
 = 3,8
		
		
_1131695770.unknown
_1131696266.unknown
_1131695747.unknown
*
Logo :
Médias e Desvio-padrão - Exemplos
		i
		Xi
		(Xi - 
)
		(Xi - 
)2
		1
		1
		(1 – 3,8) = -2,8
		(-2,8)2 = 7,84
		2
		2
		(2 – 3,8) = -1,8
		(-1,8)2 = 3,24
		3
		4
		(4 – 3,8) = 0,2
		(0,2)2 = 0,04
		4
		5
		(5 – 3,8) = 1,2
		(1,2)2 = 1,44
		5
		7
		(7 – 3,8) = 3,2
		(3,2)2 = 10,24
		
		
 = 3,8
		
		
_1131695770.unknown
_1131696266.unknown
_1131695747.unknown
*
Exercício 1: Vamos supor que eu quero comprar uma lâmpada para a minha casa e quero que ela dure pelo menos 700 h. Eu solicito a dois fabricantes o tempo de vida útil de suas lâmpadas e eles me fornecem os seguintes dados: 
Supondo que as duas lâmpadas custam o mesmo valor, qual delas eu deveria comprar? 
Médias e Desvio-padrão - Exercícios
		Fabricante A (h)
		Fabricante B (h)
		730
		1000
		710
		687
		705
		700
		720
		850
		765
		587
		750
		710
*
Para chegarmos à uma conclusão é necessário calcularmos o tempo de vida útil médio para cada fabricante e saber qual é variabilidade
dos dados.
Critério de escolha: tempo de vida útil = média  desvio-padrão
Médias e Desvio-padrão - Exercícios
		Fabricante A (h)
		Fabricante B (h)
		730
		1000
		710
		687
		705
		700
		720
		850
		765
		587
		750
		710
*
Fabricante A : 730 ± 23,45 h
Fabricante A:[706,55 – 753,45= -46,9]
Fabricante B : 755,67 ± 146,25 h
Fabricante B : [609,42 – 901,92= -292,5]
Conclusão : Escolheria o fabricante A.
Médias e Desvio-padrão - Exercícios
*
Exercício 2: Um comerciante está interessado em comprar 100 garrafas de cachaça para o seu estabelecimento. No entanto, como é de preferência de sua clientela, é necessário que a cachaça escolhida apresente um teor alcoólico de no mínimo 33% em volume. Ele consultou alguns fornecedores e obteve as seguintes informações:
Na sua opinião, qual deveria ser a marca escolhida pelo comerciante?
Médias e Desvio-padrão - Exercícios
Teor alcoólico de três tipos de aguardente pesquisadas.
		Marca A (R$ 3,50/l)
		Marca B (R$ 4,10/l)
		Marca C (R$ 3,65/l)
		38,7
		35,7
		38,7
		33,5
		36,4
		33,5
		32,5
		35,9
		34,5
		31,2
		33,2
		34,2
		35,9
		34,1
		35,9
*
Marca A: 34,36 ± 2,97 [31,39–37,33=-5,94]
Marca B: 35,06 ± 1,35 [33,71–36,41=-2,7]
Marca C:35,36 ± 2,06  [33,3–37,42=-4,12]
As marcas B e C atendem ao requisito (>33%),no entanto escolheria a marca C pelo preço. Assim, teria um economia de R$ 45,00!
Médias e Desvio-padrão - Exercícios
Teor alcoólico de três tipos de aguardente pesquisadas.
		Marca A (R$ 3,50/l)
		Marca B (R$ 4,10/l)
		Marca C (R$ 3,65/l)
		38,7
		35,7
		38,7
		33,5
		36,4
		33,5
		32,5
		35,9
		34,5
		31,2
		33,2
		34,2
		35,9
		34,1
		35,9
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*

Teste o Premium para desbloquear

Aproveite todos os benefícios por 3 dias sem pagar! 😉
Já tem cadastro?

Outros materiais