Buscar

Estatística Basica

Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original

*
*
*
Estatística 
Prof. Gerson L. Bassani
*
*
*
Programa
Competências:
Aplicar fundamentos básicos de estatística na interpretação de dados relacionados a área de alimentos.
*
*
*
Programa
Habilidades
Realizar tabelas e gráficos.
Interpretar dados estatísticos relacionados a área de alimentos.
*
*
*
Programa
Conhecimentos
Estatística descritiva: variáveis contínuas e discretas, medidas de tendência central,
Medidas de dispersão.
Erro, precisão e exatidão.
Correlação e Regressão.;
Introdução à amostragem;
Probabilidades;
Distribuições de variáveis contínuas e discretas
*
*
*
Bibliografia
*
*
*
Avaliação
Atitudes
 Responsabilidade, pró-atividade, postura profissional, ética; relacionamento interpessoal; comprometimento
Conhecimentos/habilidades
Duas provas escritas individuais;
Participação na realização dos exercícios em aula.
*
*
*
Aplicações da estatística na indústria
Controle estatístico do processo
Medir e analisar a variação nos processos
Controle estatístico da qualidade
Medir e aprimorar a qualidade dos processos
Inclui CEP e ferramentas da qualidade
*
*
*
O que é estatística?
É a ciência da análise dos dados
Conjunto de instrumentos (ferramentas) para recolher, classificar, apresentar e interpretar conjuntos de dados numéricos.
*
*
*
Métodos estatísticos
Métodos Estatísticos
Estatística Descritiva
Estatística Inferencial
*
*
*
Estatística descritiva
1.	Envolve
Coleta de dados
Caracterização dos dados
Apresentação dos dados
2.	Propósito
Descrever os dados
X = 21,3 S2 = 0,54
*
*
*
Estatística inferencial
Envolve
Estimativas
Teste de hipóteses
Propósito
Tomar decisões baseadas nas características da população
*
*
*
Estatística inferencial
*
*
*
Definições
População (universo)
Todos os itens de interesse
Amostra 
Porção da população
 Parâmetro
Valores singulares existentes na população
 Atributo
Característica qualitativa do dado
Variável
Conjunto de resultados possíveis de um fenômeno
*
*
*
Variáveis
Variáveis
Quantitativas (números)
Qualitativas(atributos)
Nominais
Ordinais
Contínuas
Discretas
*
*
*
Variáveis
*
*
*
Exercício
Classifique as variáveis em qualitativas e quantitativas:
Classifique as variáveis em nominais e ordinais
*
*
*
Exercício
Classifique as variáveis quantitativas em discretas e contínuas:
*
*
*
Tabelas
Título: deve explicar o conteúdo da tabela;
Corpo: números e informações, em linhas e colunas:
a) cabeçalho: indica o que a coluna contém;
b) Coluna indicadora: diz o que a linha contém;
Total: se houver, entre traços horizontais;
Fonte: obrigatória, deve estar no rodapé;
Notas: se tiver, no rodapé.
*
*
*
Tabelas
Escola Z – Quantidade de alunos nas turmas
Fonte: Secretaria – Escola Z 
*
*
*
Tabelas
*
*
*
Distribuição de freqüências
Os dados coletados sem nenhuma organização são chamados de dados brutos;
*
*
*
Distribuição de freqüências
Rol é a organização dos dados em ordem crescente ou decrescente;
*
*
*
Distribuição de freqüências
A tabela de distribuição de freqüências é uma maneira de organizar os dados para facilitar a análise;
Distribuindo-se os dados em classes e contando as observações, tem-se a freqüência de classe;
Os dados agrupados em classes juntamente com a freqüência são a distribuição de freqüência.
*
*
*
Distribuição de freqüência
k = número de classes
Para n<25, usar a fórmula de Sturges:
	k = 1 + 3,3 log n
Para n>25:
 	k = √n
c = amplitude do intervalo de classe
*
*
*
Distribuição de freqüência
Ponto médio da classe:
Os intervalos podem ser:
Abertos: 100 – 200 (os valores não pertencem ao intervalo)
Fechados: 100 |–| 200 (os valores pertencem ao intevalo)
Mistos: 100 |– 200 (um pertence ao intervalo, outro não)
*
*
*
Freqüências absoluta e relativa
Freqüência absoluta: 
número de observações em uma determinada classe ou atributo de uma variável qualitativa.
Freqüência relativa: 
Proporção do número de observações de uma determinada classe em relação ao total de observações.
*
*
*
Exercício
Os dados a seguir apresentam um conjunto de tempos para uma determinada operação. Elabore uma tabela de distribuição de freqüências.
Plan1
		11.2		12.7		5.3		5.6		5.8		5.9		6.0		6.1		6.2		6.2		6.3		6.3		6.3
		11.8		14.9		7.9		8.0		8.0		8.1		8.2		8.3		8.3		8.4		8.5		8.5		8.6
		7.1		7.2		7.2		7.3		7.4		7.5		7.5		7.6		7.6		7.6		7.7		7.7		7.8
		6.4		6.4		6.4		6.5		6.5		6.6		6.7		6.7		6.8		6.8		6.9		6.9		7.0
		7.1		8.7		8.8		8.8		8.9		9.0		9.1		9.2		9.4		10.4		10.8		5.1		5.3
		9.8		9.9		10.0		10.2		10.2		9.4		9.5		9.5		9.6		10.6		10.9		7.8		7.9
*
*
*
Distribuição de freqüência
No excel: função FREQUENCIA
Importante:
O XL seleciona os valores até o número indicado
*
*
*
Distribuição de freqüência
Copie a fórmula até uma casa a mais e press F2
Pressione Shift + Ctrl + Enter
*
*
*
Histograma
Para conhecer as características da distribuição associada a uma população de interesse, retiramos uma amostra e medimos os valores da variável considerada.
O histograma resume as características da distribuição.	
*
*
*
Histograma
É um gráfico de barras justapostas que relaciona os valores da variável de interesse com a freqüência com que eles ocorrem, facilitando a visualização da sua distribuição
*
*
*
Histograma – Como fazer
1. Colete “n” dados (n>50) referentes à variável cuja distribuição será analisada.
2. Determine a amplitude dos dados (R)
3. Estabeleça o nº de classes (k)
4. Determine o intervalo de classe c=R/(k-1), ou c=R/k
5. Construa a tabela de freqüências
6. Construa o diagrama baseado na tabela.
*
*
*
Histogramas no excel
Entre com os dados
Marque o primeiro item
Classifique em ordem crescente
*
*
*
Histogramas no excel
Selecione Ferramentas
Selecione Análise de dados
*
*
*
Histogramas no excel
Escolha Histograma
Clique em OK
*
*
*
Histogramas no excel
Clique em intervalo de entrada
Selecione todos os dados
Escolha intervalo de saída
Especifique a célula inicial
Resultado do gráfico
Clique em OK
*
*
*
Histogramas no excel
*
*
*
Histogramas
*
*
*
Histogramas
*
*
*
Polígono de freqüência
*
*
*
Gráfico de setores
Gráf3
		48.1
		42.4
		29.9
		27.5
		21.1
Faturamento
Plan1
		
		
				Região		Faturamento
				Sul		48.1
				Sudeste		42.4
				Centro-Oeste		29.9
				Nordeste		27.5
				Norte		21.1
Plan1
		
Faturamento
Plan2
		
Faturamento
Plan3
		
Faturamento
Plan4
		
Plan5
		
Plan6
		
Plan7
		
Plan8
		
Plan9
		
Plan10
		
		
		
*
*
*
Gráficos de coluna e de barras
Gráf2
		48.1
		42.4
		29.9
		27.5
		21.1
Faturamento
Plan1
		
		
				Região		Faturamento
				Sul		48.1
				Sudeste		42.4
				Centro-Oeste		29.9
				Nordeste		27.5
				Norte		21.1
Plan1
		0
		0
		0
		0
		0
Faturamento
Plan2
		0
		0
		0
		0
		0
Faturamento
Plan3
		0
		0
		0
		0
		0
Faturamento
Plan4
		
Plan5
		
Plan6
		
Plan7
		
Plan8
		
Plan9
		
Plan10
		
		
		
Gráf1
		48.1
		42.4
		29.9
		27.5
		21.1
Faturamento
Plan1
		
		
				Região		Faturamento
				Sul		48.1
				Sudeste		42.4
				Centro-Oeste		29.9
				Nordeste		27.5
				Norte		21.1
Plan1
		0
0
		0
		0
		0
Faturamento
Plan2
		0
		0
		0
		0
		0
Faturamento
Plan3
		0
		0
		0
		0
		0
Faturamento
Plan4
		
Plan5
		
Plan6
		
Plan7
		
Plan8
		
Plan9
		
Plan10
		
		
		
*
*
*
Conceitos Básicos
Medidas de tendência central
Média Aritmética:
 Quando n cresce, a média da amostra tende para a média da população.
*
*
*
Conceitos Básicos
Medidas de tendência central
No Excel:
=MEDIA(CI:CF)
*
*
*
Conceitos Básicos
Medidas de tendência central
 Mediana (Termo Médio):
 10.0; 10.1; 10.4; 10.6; 10.7; 10.9; 12.2
 
10.0; 10.1; 10.4; 10.6; 10.7; 10.9
 Mediana = (10.4 + 10.6)/2 = 10.5
*
*
*
Conceitos Básicos
Medidas de dispersão
Amplitude:
 10.0; 10.1; 10.4; 10.6; 10.7; 10.9; 12.2
 12.2-10.0 = 2.2
 Desvio-padrão da amostra:
*
*
*
Conceitos Básicos
Medidas de dispersão
No Excel:
=DESVPADA(CI:CF)
Desvio padrão da AMOSTRA
*
*
*
Conceitos Básicos
Medidas de dispersão
Desvio-padrão da população:
*
*
*
Conceitos Básicos
Medidas de dispersão
No Excel:
=DESVPADP(CI:CF)
Desvio padrão da POPULAÇÃO
*
*
*
Conceitos Básicos
Medidas de dispersão
Desvio-padrão da média:
*
*
*
Conceitos Básicos
Medidas de dispersão
 Quando n cresce, o desvio-padrão das médias tende para zero e o desvio-padrão da amostra tende a crescer:
*
*
*
Distribuição Normal
Levando ao limite máximo o número de intervalos e ao limite mínimo o tamanho destes, teremos uma linha contínua
*
*
*
Distribuição Normal
Principais características
A variável x pode assumir qualquer valor real (-∞ a +∞)
Os valores de y são assintóticos em relação ao eixo x
A curva é simétrica, com ponto de inflexão à esquerda em µ-1σ e à direita em µ+1σ 
x
*
*
*
Distribuição Normal
Principais características
 À medida que a curva se afasta da média, aproxima-se cada vez mais do eixo x, mas nunca o toca.
 Os pontos em que a curvatura muda são chamados pontos de inflexão. O gráfico curva-se para baixo entre os pontos de inflexão e, para cima, à esquerda e à direita deles.
x
Ponto de inflexão
Ponto de inflexão
*
*
*
Distribuição Normal
Médias e desvios-padrão
*
*
*
Distribuição Normal
Probabilidades
a
b
a
b
*
*
*
Distribuição Normal
Probabilidades
Cerca de 68% da área está a um desvio padrão da média.
68%
*
*
*
Distribuição Normal
Probabilidades
Curva Normal Reduzida
µ=0
σ=1
*
*
*
Distribuição Normal
Probabilidades – escores z
*
*
*
Distribuição Normal
Transformação para z
E quando o desvio padrão for diferente de 1?
O escore padrão, ou escore z, representa o número de desvios padrão que separa uma variável aleatória x da média. 
valor – média
desvio padrão
*
*
*
Distribuição Normal
Usando o excel
No excel, não precisamos calcular o z, a planilha calcula as áreas diretamente a partir do desvio padrão
*
*
*
Distribuição Normal
Usando o excel
*
*
*
Distribuição Normal
Usando o excel
*
*
*
Distribuição Normal
Usando o excel
*
*
*
Distribuição Normal
Exercícios
*
*
*
Diagrama de dispersão
Gráf2
		10
		11
		15
		16
		19
		21
		22
		23
		24
		23
		25
		26
		28
		29
		26
		27
		29
		24
		32
		31
		35
		34
		33
		35
		36
		34
		32
		38
		39
		41
		40
		42
		43
		45
		46
		47
		44
		49
		48
Variável 1
Variável 2
Aspecto geral do Diagrama de Dispersão
Plan1
		
		
		
		
						1		10
						1.2		11
						1.2		15
						2		16
						2.2		19
						3.1		21
						3.6		22
						3.6		23
						3.6		24
						3.3		23
						3.3		25
						3		26
						4.1		28
						4		29
						4.8		26
						4.8		27
						4.7		29
						4.7		24
						5.1		32
						5.2		31
						5		35
						5.2		34
						6.2		33
						6.2		35
						6.2		36
						6.5		34
						6.6		32
						6		38
						6.2		39
						7		41
						7.3		40
						7.3		42
						8.1		43
						8.3		45
						8.3		46
						8.4		47
						8		44
						9.2		49
						9		48
Plan1
		
Variável 1
Variável 2
Aspecto geral do Diagrama de Dispersão
Plan2
		
Plan3
		
*
*
*
Diagrama de dispersão
A existência de uma correlação entre as variáveis consideradas não implica necessariamente na existência de uma relação de causa e efeito entre x e y. Este resultado apenas indica que existe um relacionamento significativo entre as duas variáveis
Relações estatisticamente significativas entre x e y podem estar presentes sempre que estas variáveis apresentarem um relacionamento monotônico, isto é, a medida que uma variável aumenta a outra variável sempre aumenta ou sempre diminui, devido a atuação de outros fatores
*
*
*
Diagrama de dispersão
Um diagrama de dispersão mostra a direção, a forma e a intensidade da relação entre duas variáveis quantitativas
A correlação é a medida que vamos utilizar para suplementar o gráfico
A correlação mede a intensidade e a direção da relação linear entre duas variáveis quantitativas.
Costuma-se representar a correlação pela letra r
Suponha que tenhamos dados sobre variáveis x e y para n amostras. Os valores para a primeira amostra são x1 e y1, os valores para a segunda amostra são x2 e y2, e assim por diante. 
*
*
*
Padrões de diagramas de dispersão
Elevada correlação positiva
Moderada correlação positiva
*
*
*
Padrões de diagramas de dispersão
Elevada correlação negativa
Moderada correlação negativa
*
*
*
Padrões de diagramas de dispersão
Ausência de correlação
*
*
*
Regressão linear
r = coeficiente de correlação
a = coeficiente angular
b = coeficiente linear
*
*
*
Exercícios – planilha curva P
*
*
*
Diagrama de dispersão
Um valor positivo de r indica associação positiva entre as variáveis, e um valor negativo de r indica uma associação negativa
A correlação r estará sempre entre –1 e 1
Pode ser calculada através de fórmulas específicas ou fornecida por softwares que tenham análise estatística, tais como MS Excel.
*
*
*
Controle por frações defeituosas
 Requisitos:
Amostrar pelo menos 20% do lote.
Exames “não destrutivos”.
Ensaios simples e não onerosos.
Exames rápidos.
*
*
*
Distribuição de Poisson
Para X = 0; 1; 2; 3; ....... n-1; n
a = Média de itens defeituosos na amostra.
e = 2,7183 (base dos logaritmos neperianos).
*
*
*
Distribuição de Poisson
X representa o número de itens defeituosos na amostra.
*
*
*
Distribuição Binomial
Para x = 0; 1; 2; 3; ....... n-1; n:
p + q = 1.
p = probabilidade de ocorrência de itens defeituosos.
q = probabilidade de ocorrência de itens sem defeitos.
*
*
*
Distribuição Binomial
X representa o número de itens defeituosos na amostra.
p + q = 1
*
*
*
Distribuição de Poisson
Se “a” representa a média de itens defeituosos na amostra temos:
P(0) - probabilidade de não existir itens defeituoso na amostra;
P(1) - probabilidade de existir apenas um item defeituoso na amostra;
p(2) - probabilidade de existir apenas dois itens defeituosos na amostra.
*
*
*
Binomial x Poisson
Binomial é exata.
Poisson é uma aproximação.
Poisson tende para binomial quando “a” tende para zero.
exemplo
*
*
*
Distribuição de Poisson
Para a = 1,1 temos:
P(0) = e-a = 0,3329 (x=0)
P(1) = ae-a = 0,3662 (x=1) 
p(2) = (a2e-a)/2! = 0,2014 (x=2)
p(3) = (a3e-a)/3! = 0,0738 (x=3)
P(4) = (a4e-a)/4! = 0,0203 (x=4)
*
*
*
Distribuição Binomial
Para
p = 0,022 e n = 50 temos:
*
*
*
Binomial ou Poisson
P(≤1) = p(0) + p(1)
p(≤1) = 0,3329 + 0,3662 = 0,6991
P(≤2) = p(0) + p(1) + p(2)
P(≤2) = 0,6991 + 0,2014 = 0,9005
P(≤3) = p(0) + p(1) + p(2) + p(3)
P(≤3) = 0,9005 + 0,0738 = 0,9743
*
*
*
Binomial ou Poisson
P(>1) = 1- P(≤1) = 1 - (p(0) + p(1))
P(>1) = 1 - 0,6991 = 0,3009 ou 30,09%
P(>2) = 1- P(≤ 2) = 1 - (p(0) + p(1) + p(2))
P(>2) = 1 - 0,9005 = 0,0995 ou 9,95%
P(>3) = 1 - P(≤3)
P(>3) = 1 - 0,9743 = 0,0257 ou 2,57%
*
*
*
Exercícios
De acordo com certo instituto 25% das televisões são sintonizadas em uma novela chamada Os Mensaleiros do Apocalipse quando esta é exibida. Calcule as probabilidades de, durante a exibição da novela, tomando-se televisões escolhidas aleatoriamente: 
5 entre 15 estejam sintonizadas na novela 
ao menos 5 entre 15 estejam sintonizadas na novela 
no máximo 5 entre 10 esteja sintonizadas na novela 
nenhuma entre 6 estar sintonizada
Um fábrica tem uma média semanal de 0,5 acidentes de trabalho. Determine a probabilidade de que em uma semana qualquer se tenha: 
0 acidentes 
1 acidente 
2 acidentes 
algum acidente
*
*
*
Distribuição Normal
E se a distribuição não for normal???
Amostra 1 – X1
Amostra 2 – X2
Amostra 3 – X3
.
.
.
*
*
*
Distribuição Normal
Distribuição da média amostral
A distribuição da média amostral x, de uma amostra de tamanho n extraída de uma população qualquer, que tem média µ e desvio padrão σ, tem as seguintes características:
Média = E( x )= µ 
Desvio padrão = DP ( x ) = σ/√n
*
*
*
Distribuição normal
Teorema central do limite
A distribuição da média amostral x, de uma amostra de tamanho n extraída de uma população não-normal, com média µ e desvio padrão σ, é aproximadamente normal com média µ e desvio padrão σ/√n. Este resultado significa que:
				é aproximadamente N(0,1).
*
*
*
Distribuição normal
Teorema central do limite
*
*
*
Tamanho da amostra
O erro amostral é dado por
O tamanho da amostra para obter uma média com um erro predeterminado é:
*
*
*
Amostragem
Amostragem sistemática
Amostragem estratificada – proporcional
Aleatória simples
*
*
*
Sistemática
Amostragem
*
*
*
Estratificada
Amostragem
*
*
*
Precisão e Exatidão
*
*
*
Número de classes
Número de valores da tabulação
Número de classes (k)
Abaixo de 50
5 – 7
50 – 100
6 –10
100 – 250
7 – 12
Acima de 250
10 – 20
Calcular a média, para mostrar como os valores se distribuem em torno dela.

Teste o Premium para desbloquear

Aproveite todos os benefícios por 3 dias sem pagar! 😉
Já tem cadastro?

Outros materiais