Buscar

Aula 1 Estatística Básica 2017

Prévia do material em texto

*
Módulo 1
Estatística 
Básica
*
Pesquisa Científica
Busca entender o objeto. Desenvolve ideias e percepções. 
Ajuda a formular hipóteses.
Descreve em que circunstância ou com que frequência algo ocorre. 
Avalia a relação entre 2 fatos
Busca esclarecer relações do tipo causa- efeito entre duas variáveis
*
Conceito de Estatística
Estatística 
Conjunto de técnicas destinadas ao estudo quantitativo de fenômenos coletivos e empiricamente observáveis.
Dado Estatístico 
Número que mede a intensidade ou a característica do fenômeno coletivo que está sendo estudado. 
Finalidade da Estatística
▪ Desenvolver métodos e técnicas p/ coleta, organização, análise e interpretação de dados;
▪ Fornecer métodos para inferir conclusões sobre um universo maior a partir das observações de um fenômeno particular.
*
Conceito de Estatística: tipos
Estatística Descritiva 
	Busca descrever a realidade. Usa técnicas para 	organizar e 	sintetizar os dados observáveis dessa 	realidade.
Estatística Inferencial ou Indutiva 
	Busca inferir, induzir ou estimar sobre a característica do 	todo (a população) com base nos dados da parte (amostra). 	Usa técnicas para generalizar um fato particular tendo como 	referência uma amostra
*
Conceito de Estatística
Inferência
Método para tirar conclusão sobre um fenômeno através de repetidas observações, mantendo sempre as mesmas condições. Processo mental para chegar a uma conclusão a partir de premissas(suposições).
Incerteza
Como não é possível controlar todos os fatores que influem na observação de um fenômeno estatístico há sempre um grau de incerteza sobre a veracidade dos resultados coletados. 
Probabilidade
Por isso as inferências estatísticas são sempre incertas, com uma margem de erro, portanto probabilísticas
*
Probabilidade Conceito
Probabilidade é a nossa incerteza sobre ocorrência de um evento quando não se tem conhecimento completo das circunstâncias que o causam.
Probabilidade é a possibilidade que existe entre várias de um fato ou fenômeno acorrer. 
A Probabilidade tem a função mostrar a chance de ocorrência de um evento. 
A Probabilidade é o ato de atribuirmos pesos aos eventos. 
*
Probabilidade
Baralho
52 
Cartas
Qual a probabilidade
de tirar
1 Az?
*
Teoria da Probabilidade 
A estatística é uma ciência sobre a incerteza. Se baseia inteiramente na Teoria da Probabilidade (da ocorrência de um fenômeno).
Probabilidade Estatística
É a afirmação sobre a possibilidade ou probabilidade de um fenômeno ocorrer, desde que satisfeitas um conjunto de condições teóricas.
Fenômenos aleatórios
São o objeto de estudo da estatística, e se referem a todos fenômenos observáveis na natureza.
Conceito de Probabilidade 
*
Fenômenos Aleatórios
*
Fenômenos Aleatórios
*
Fenômenos Aleatórios
Características dos Fenômenos Aleatórios
▪ Repetição.
▪ Variabilidade.
▪ Não há previsibilidade sobre a variação futura.
Frequência de um Fenômeno Aleatório
	Quando um determinado fenômeno ocorre repetidas vezes, diz-se que existe uma regularidade de ocorrências ou frequência.
*
População e Amostra
*
População e Amostra Estatística
População de uma Variável 
É o universo de todas as ocorrências possíveis de um fenômeno aleatório. A população é o conjunto total de dados de uma realidade.
Amostra
É um subconjunto da população. Representa uma parte dos dados da população.
*
População e Amostra Estatística
*
População e Amostra Estatística
*
Levantamento de dados
É o procedimentos de fazer observações de algum fenômeno da população. Como é impossível levantar todos os dados de uma população, coletamos parte desta informação: amostra. 
Objetivo da Estatística
Levantar dados amostrais para concluir (inferir ou generalizar) sobre as características da realidade mais ampla: população.
Indução Estatística
Processo pelo qual assumimos que os dados da amostra são iguais ao de toda população. Essa generalização é feita através do cálculo das probabilidades.
População e Amostra Estatística
*
Amostra
*
Amostragem 
*
Amostragem
Seleção da Amostra
As amostras devem se escolhidas de modo a permitir calcular a probabilidade de ocorrência de um evento. 
Amostra Representativa
É aquela que tem as mesmas características da população de onde foi retirada
Amostra Probabilística
É aquela cujo processo de amostragem permite atribuir a cada elemento da amostra uma probabilidade semelhante à da população.
Amostragem Aleatória
É aquela em que cada elemento da população tem chance igual de ser selecionado no levantamento dos dados.
*
Amostragem: Tipos
Amostragem casual simples com reposição
Os elementos da população entram mais de uma vez na amostra.
Amostragem casual simples sem reposição
Os elementos da população só podem entrar uma vez na amostra
Amostragem sistemática:
		Seleção da amostra com base num critério: Um em cada dez.
Amostragem por conglomerados: 
	 A amostra é selecionada por sorteio da área a ser pesquisada
Amostra estratificada ou em estágios múltiplos:
	 A amostra é dividida em grupos e selecionada por etapas dentro de cada grupo: cidade/bairro/quadra
*
Amostragem
*
Amostragem
*
Experimentação
*
Experimento e Variável
Experimento – É a observação sistemática de um fenômeno (evento aleatório) qualquer da população.
Variável – É o valor que o fenômeno assume, em um experimento qualquer. 
Domínio da Variável – São todos os valores possíveis que um fenômeno pode assumir em um experimento. 
*
	Experimento	 	 Variável Domínio da Variável
	Lançar 1 dado	 	
	Lançar 1 moeda	
Experimento e Variável
Cara Coroa
1,2,3,4,5,6
*
Experimento e Variável
*
Variável Qualitativa (Atributo) 
	– a qualidade assumida pelo evento (fenômeno).
Ex: O que Vc acha do transporte público em SP 		bom, ruim, regular
Variável: Tipologia
Variável Quantitativa
– a medida da variação de um evento (fenômeno)
Ex: Qual é a idade média dos alunos da FAU
23, 24, 25
*
Variável: Tipologia
Variável Quantitativa Contínua – aquela que pode assumir qualquer valor numa escala de valores (teoricamente infinitos valores): Altura da pessoas.
Variável Quantitativa Discreta – aquela cujos valores possíveis são números inteiros (contagem): No. de alunos numa sala.
Variável Dependente – aquela cujos valores depende dos valores de outra variável: em matemática se expressa por uma relação funcional (função)
	y = f (x)
y = variável dependente
x = variável independente
*
Variáveis contínuas e discretas
*
Escalas de medidas de uma Variável
Escala nominal quando as observações de uma variável são apenas etiquetas para identificar, dar um nome, um atributo de cada observação. Exemplos de variáveis de escalas nominais: sexo/religião/estado civil. Aqui os valores não possuem ordem intrínseca.
Escala ordinal quando os dados têm propriedades nominais e podem ser usados para ordenar as observações nessa variável. Um exemplo de uma escala ordinal é a utilizada em questionários de satisfação ou de avaliação da qualidade. Exemplo: Transporte – (Bom) (Razoável) (Ruim). Aqui os valores possuem uma ordem intrínseca
*
Escalas de medida de uma variável
Escala de razão – quando os dados têm propriedades intervalares e faz sentido dividir duas observações. Exemplo: As variáveis distância, peso, comprimento e tempo medem-se através de escalas de razão, exigindo sempre um ‘zero’ que representa a não existência de valor. Aqui os valores numéricos possuem ordem e diferenças têm significado
Escala de intervalos - quando os dados têm propriedades ordinais e o intervalo entre as observações pode ser expresso em termos de uma unidade fixa de medida. Exemplo: A temperatura é um exemplo de variável que usa uma escala intervalar de medição. Aqui os valores numéricos possuem ordem e diferenças têm significado.*
ESTATÍSTICA DESCRITIVA
*
Amostra : Classificação e Caracterização 
Distribuição das Freqüências
Medidas de Tendência Central
Medidas de Variabilidade
Medidas de Proporcionalidade ou Relativas
*
Distribuição de Frequência
Variável discreta
Frequência – é a quantidade de vezes que a variável (evento) ocorre . Em outras palavras, é a quantidade de vezes em que o atributo de qualidade aparece. Exemplo: Experimento avaliação do Transporte: (bom) (regular) (ruim). 
Intervalo de Classe de uma variável discreta: São os atributos variáveis de qualidade atribuídos à variável. Os intervalos são os próprios atributos. Exemplo: o atributo (bom) é em si mesmo uma classe da variação qualitativa.
Limites de Classe – Não existem há limites de classe. 
*
Distribuição de Frequência
Variável Contínua
Frequência – é a quantidade de vezes que a variável (evento) ocorre . Em outras palavras: a frequência é nº de vezes em que a variável assume um certo valor. 
Intervalo de Classe : É obtido dividindo o conjunto de valores assumidos pela variável em intervalos de classe e indicando a frequência dos valores observados para cada intervalo.
Limites de Classe – É o intervalo entre o valor máximo e mínimo de uma variável dentro de uma classe. A cada intervalo de classe estão associados os limites de classe (valores extremos) e o ponto médio.
*
Frequência de uma Variável
Pesquisa realizada com os 200 alunos de uma universidade buscava identificar as preferências por esportes. Foram fornecidas as seguintes de opções esportivas: futebol, vôlei, basquete, natação, tênis e ciclismo. Observe os resultados:
*
Distribuição de Frequência
Amplitude Total de uma série – É a extensão de variação total da variável: A diferença entre valor maior da última classe e o menor valor da primeira classe. 
Amplitude de Classe – É a diferença entre o valor máximo e mínimo da variável dentro da classe.
Ponto Médio de Intervalo de Classe = valor médio	
			limite inferior + limite superior		 				 2	
*
Distribuição de Frequência
Variável: Quantidade de $ no bolso
Gráf2
		6		15		25		26		19		7
26
251
26
A
B
C
D
E
D
Intervalos de Classe
16
Plan1
		
		Variaveis		Frequência
		1		2
		2		4
		3		7
		4		8
		5		9
		6		16
		7		16
		8		10
		9		9
		10		7
		11		4
		12		3
		
		Intervalos		Frequência
		A		6
		B		15
		C		25
		D		26
		E		19
		D		7
		
		Variaveis		Intervalos		Frequência
		1 2		A		6
		3 4		B		15
		5 6		C		25
		7 8		D		26
		9 1		E		19
		11 12		D		7
Plan1
		0
		0
		0
		0
		0
		0
Intervalos de Classe
Plan2
		0		0		0		0		0		0
A
B
C
D
E
D
Intervalos de Classe
Plan3
		
		
*
Distribuição de Frequência
Frequência Absoluta – 	Valor total das observações
Frequência Relativa – 	Valor porcentual das observações
Frequência Acumulada – 	Somatória das frequências de todos intervalos
 
*
 Histograma
Histograma: Gráfico das distribuições das frequências de uma variável.
Gráfico de Barras (Histograma) – Gráfico de retângulos, diagrama de colunas; gráfico de áreas.
Histograma – As frequências dos fenômenos são proporcionais à superfície de cada retângulo que as representam. Para intervalos de mesma amplitude as frequências serão proporcionais às alturas
*
Processo de Elaboração do Histograma 
	
• Organizar os dados em ordem crescente;
• Determinar a amplitude total;
• Dividir a amplitude total em um nº adequado de intervalos de preferência com a mesma amplitude;
• O número mínimo de intervalos é 5, número máximo 20;
• Quando possível os pontos médios dos intervalos devem coincidir com os valores realmente observados
Distribuição de Frequência
Histograma
*
Distribuições Simétricas e Assimétricas - Os histogramas podem apresentar distribuição simétricas ou assimétricas. Indicadas nos slides a seguir,
Polígono de Frequências – Unindo-se os valores médios dos intervalos de classe, o histograma se transforma num polígono de frequências. Pode-se então comparar este polígono com uma curva teórica (Normal).
Distribuição de Frequência 
Histograma
*
Plan1
		
				GRÁFICO DE FREQUÊNCIAS: Histograma
		
		
		
		
		
		
																Variaveis		Frequência
																1		4
																2		6
																3		16
																4		8
																5		7
																6		2
		
		
		
		
		
		
		
		HISTOGRAMA E POLÍGONO DE FREQUÊNCIA
		
		
		
		
		
		
		40-45		10
		45-50		15
		50-55		18
		55-60		22
		60-65		35
		65-70		42
		70-75		32
		75-80		18
		89-85		10
		85-90		6
		Total		208
Plan1
		
Categorias
Frequências
Plan2
		
Plan3
		
*
simétrico
Plan1
				GRÁFICO DE FREQUÊNCIAS: Histograma
		
		
		
		
		
																Variaveis		Frequência
																1		4
																2		6
																3		16
																4		8
																5		7
																6		2
		
		
		
		
		
		
		
		HISTOGRAMA E POLÍGONO DE FREQUÊNCIA
		
		
		
		
		
		
		40-45		10
		45-50		15
		50-55		18
		55-60		22
		60-65		35
		65-70		42
		70-75		32
		75-80		18
		89-85		10
		85-90		6
		Total		208
Plan1
		
Categorias
Frequências
Histograma
Plan2
		
Plan3
		
*
assimétrico
Plan1
				GRÁFICO DE FREQUÊNCIAS: Histograma
		
		
		
		
		
																Variaveis		Frequência
																1		4
																2		6
																3		16
																4		8
																5		7
																6		2
		
		
		
		
		
		
		
		HISTOGRAMA E POLÍGONO DE FREQUÊNCIA
		
		
		
		
		
		
		40-45		10
		45-50		15
		50-55		18
		55-60		22
		60-65		35
		65-70		42
		70-75		32
		75-80		18
		89-85		10
		85-90		6
		Total		208
		
		
		
		
		
		
		
		
		
		HISTOGRAMA E POLÍGONO DE FREQUÊNCIA
						Assimétrico à esquerda
		
		
		
		
		40-45		35
		45-50		42
		50-55		32
		55-60		24
		60-65		20
		65-70		17
		70-75		15
		75-80		10
		89-85		10
		85-90		6
		Total		208
Plan1
		
Categorias
Frequências
Histograma
Plan2
		
Plan3
		
		
*
assimétrico
Plan1
				GRÁFICO DE FREQUÊNCIAS: Histograma
		
		
		
		
		
																Variaveis		Frequência
																1		4
																2		6
																3		16
																4		8
																5		7
																6		2
		
		
		
		
		
		
		
		HISTOGRAMA E POLÍGONO DE FREQUÊNCIA
		
		
		
		
		
		
		40-45		10
		45-50		15
		50-55		18
		55-60		22
		60-65		35
		65-70		42
		70-75		32
		75-80		18
		89-85		10
		85-90		6
		Total		208
		
		
		
		
		
		
		
		
		
		HISTOGRAMA E POLÍGONO DE FREQUÊNCIA
						Assimétrico à esquerda
		
		
		
		
		40-45		35
		45-50		42
		50-55		32
		55-60		24
		60-65		20
		65-70		17
		70-75		15
		75-80		10
		89-85		10
		85-90		6
		Total		208
		
		
		
		
		
		
		HISTOGRAMA E POLÍGONO DE FREQUÊNCIA
						Assimétrico à direita
		
		
		
		
		
		
		
		40-45		5
		45-50		8
		50-55		12
		55-60		15
		60-65		17
		65-70		21
		70-75		24
		75-80		29
		89-85		42
		85-90		35
		Total		173
Plan1
		4
		6
		16
		8
		72
Categorias
Frequências
Histograma
Plan2
		
Plan3
		
		
		
*
Medidas de Ordenamento ou Posição
*
Medidas de Tendência Central
Valores Centrais ou Médias de uma Amostra – Valores que indicam posição de centralidade, ou o ponto central da distribuição.
Média Aritmética Simples – Quociente da soma dos valores observados, pelo número total de valores.
		α = Σ xi	i = 1.....n
 n
*
Medida de Tendência Central
Levantamento
do peso 
dos alunos 
da classe
*
Medidas de Tendência Central
Média Aritmética Ponderada - Quando há valores que se repetem ou ocorrem com mais frequência que outros.
α = Σ xi . fi 
		 Σ fi 
Ex: α = 48.2 + 51.3 + 55.5 + 58.4 + 60.1 = 54,4
 15
Utilização: média de cálculo mais fácil. Valor médio significativo por incluir todos os valores observados. Usada em estatística para o cálculo do desvio padrão. Em probabilidade esta média é chamada Esperança Matemática.
*
Medidas de Tendência Central
Mediana – Medida de posição. A mediana é o valor que ocupa a posição central (meio) da distribuição.
Série de valores com nº impar de termos
Mediana = n + 1 /2
Nº de termos 7 
Md = 7+1 = 8 / 2 = 4 (mediana é o 4º termo)
Ex: 5, 7, 8, 11, 12, 13, 14 (7 termos) → Md = 11
Série de valores com nº par de termos 
Mediana = n /2 + 1 e 
Mediana = n /2		
Nº de termos 8 
Md = 8/2 = 4 (mediana entre o 4º e 5 º termo)
Md = 8/2+1 = 5
Ex: 5, 7, 8, 11, 12; 13, 14, 15; (8 termos) → Md = 11+12 / 2 = 11,5
Utilização: |A mediana é usada quando a distribuição apresenta resultados extremos muito discrepantes. A mediana não sofre a influência de valores extremos
*
Medidas de Tendência Central
Moda – Valor dominante de uma distribuição. 
Numa série são os valores que ocorrem com a maior freqüência. 
Um conjunto de valores pode apresentar mais de uma moda: plurimodal.
	
	Ex: 48, 49, 50, 50 50, 55, 58, 59, 60 → M = 50
	
	Ex: 4, 5, 6, 4, 5, 7, 4, 8, 5, 10 → M = 4 e 5 (plurimodal)
*
Medidas de Dispersão
*
Mediadas de Variabilidade
Índices que indicam o grau de concentração ou dispersão de uma distribuição em torno da média.
Principais índices de variabilidade:
Amplitude total
Desvio médio
Variância
Desvio padrão
Amplitude Total (Intervalo Total) - É a diferença entre o maior e o menor valor de uma série.
Ex: 48, 48 49,49,49,55,55,55,55,55,58,58,58,58,59,60 
→ A = 60 - 48 = 12
*
Medidas de Variabilidade
Desvio Médio – Média aritmética dos afastamentos (ou desvios), tomados em valor absoluto, entre cada valor e a média aritmética.
DM = Σ │di . fi │			sendo di = │xi - α │
		 Σ fi			sendo α = média aritmética
Ex: dm = (48 – 54,4).2 + (51-54,4).3 + (55-54,4).5 + (58-54,4).4 + (60-54,4).1
 15
	 
	 dm = 12,8 + 10,2 + 3,0 + 14,4 + 5,6
			 15
	 dm = 3,07
Utilização: Indica o quanto, em média, os valores se afastam do ponto central (média) 	 	 numa distribuição do tipo Curva de Gaus
 
*
Medidas de Variabilidade
Variância – Considerando-se uma amostra de dados, cada dado isolado pode ter um desvio (dispersão) em relação à média da amostra. Essa dispersão é a diferença entre o valor individual e a média da amostra de dados. Para se avaliar o grau de dispersão de toda a amostra de dados utiliza-se a variância que é a somatória dos desvios elevada ao quadrado dividida pelo tamanho da amostra, menos 1.
s2 = Σ (xi – α)2 • fi 
	Σ fi – 1
Exemplo: 	s2 = 81,92 + 34,68 + 1,80 + 51,84 + 31,36
 14
S2 = 14,4
*
Medidas de Variabilidade
Desvio padrão – afastamento quadrático médio ou afastamento padrão. É a raiz quadrada da variância.
Desvio padrão dos dados isolados ponderados com freqüências distintas:
s2 = √ Σ (xi – α)2 • fi 
		 Σ fi – 1
Exemplo: 	s2 = 81,92 + 34,68 + 1,80 + 51,84 + 31,36
 14
s = √ 14,4 = 3,79
Utilização: é a medida mais usada para mensurar a variabilidade de um conjunto de dados. Usado principalmente na distribuição normal de dados. 
*
O histograma de Densidades
 
Peso, em kg, de 1000 pessoas adultas selecionadas ao acaso em uma população
*
Distribuição dos valores da variável aleatória X.
Distribuição de probabilidades de X 
X: peso, em kg, de uma pessoa adulta escolhida ao acaso da população.
A curva contínua da figura denomina-se Curva Normal
*
Curva de Gauss
Distribuição Normal
 
*
Curva de Gauss
Distribuição Normal
-1s → 1s 
68, 27 % dos casos estão incluídos entre M–1s e M+1s 
-2s → 2s
95,45 % dos casos estão incluídos entre M–2s e M+2s
-3s → 3s
99,73 % dos casos estão incluídos entre M–3s e M+3s
*
Curva de Gauss
Distribuição Normal

Outros materiais

Perguntas Recentes