Buscar

Mat Estatística Aplicada_Material online editado

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 17 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 17 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 17 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

ESTATÍSTICA APLICADA
Tutor: Antonio Viana			Professor da teletrasmitida: Eudes
AULA 1-CONCEITOS INTRODUTÓRIOS
A Estatística é uma parte da Matemática Aplicada que fornece métodos para a coleta, organização, descrição, análise e interpretação de dados e para a utilização dos mesmos na tomada de decisões.
Fases do método estatístico
Coleta de dados: Após cuidadoso planejamento e a devida determinação das características mensuráveis do fenômeno que se quer pesquisar, damos início à coleta dos dados numéricos necessários à sua descrição.
Crítica dos dados: Obtidos os dados, eles devem ser cuidadosamente criticados, à procura de falhas e imperfeições. 
Apuração dos dados: Soma e o processamento dos dados obtidos e a disposição mediante critérios de classificação.
Exposição ou apresentação dos dados Os dados devem ser apresentados sob a forma adequada (tabelas ou gráficos), tornando mais fácil o exame daquilo que está sendo objeto de tratamento estatístico e ulterior obtenção de medidas típicas
Análise dos resultados: O objetivo último da Estatística é tirar conclusões sobre o todo (população) a partir de informações fornecidas por parte representativa do todo (amostra).
Assim, realizadas as 4 fases anteriores (Estatística Descritiva), fazemos uma análise dos resultados obtidos através dos métodos da Estatística Indutiva ou Inferencial, e tiramos desses resultados conclusões e previsões.
População estatística ou universo estatístico: Conjunto de entes portadores de, pelo menos, uma característica comum
Amostra é um subconjunto finito de uma população
Variável: 
É, convencionalmente, o conjunto de resultados possíveis de um fenômeno. Variável é, pelo menos, uma característica que possa ser observada ou medida nos elementos de uma população.
	Quantitativa (Ou atributo)
Expresso por atributos
	Gênero, Sexo, Faixa Etária, Estado civil, Escolaridade
Religião; católico, umbandista, etc
Naturalidade
Cor dos olhos, da pele, do cabelo
	Qualitativa
Expressa em números
	Discretas 
(Intervalo de um número real inteiro, contagens, enumerações, valores inteiros)
Valores de uma moeda R$1, R$5
Sabores de um refresco: manga, limão
Nº de alunes de uma classe
Nº Viagens feitas
Nº de filhos de uma família
	Contínuas
(Medições, valores dentro de intervalos)
Temperatura
Altura, peso, comprimento, espessura, velocidade
Renda R$1.360,00
Idade; 01 ano e 3 meses
Tempo de vôo
Duração de bateria de celular
Técnicas de Amostragem
AULA 2 _TIPOS DE DADOS
Dados brutos são aqueles que ainda não foram numericamente ordenados. Como são dados primariamente levantados ou reunidos, possui uma característica aleatória.
Rol é um arranjo de dados numéricos brutos em ordem crescente ou decrescente de grandeza. 
Frequencias_Elementos de distribuição de frequencias
X = Maior valor observado da variável de freqüências MAX
x = Menor valor observado da variável de freqüências MIN
h= Intervalo de classe
Diferença entre o limite superior e o limite inferior de classe
A= Amplitude 
Diferença entre o limite superior e o limite inferior de classe
AT = Amplitude Total = maior dado – menor dado = 15 – 4 = 11
	4
	6
	6
	10
	12
	12
	13
	13
	14
	14
	15
	15
	16
	19
	19
	20
 AT = 20 - 4
Xi = Ponto médio de classe
Valor representativo da classe
Para obter o ponto médio de uma classe, some os limites superior e inferior e divida por 2
Limite de classe: Valores extremos. 
O limite mínimo de uma classe é denominado “limite inferior” e o máximo, “limite superior”
fri 
Frequência Relativa (%)
Frequência Relativa de um elemento da série – fr
É a divisão da frequência simples de um elemento da série pelo total de elementos da série 
Apresenta a participação percentual do elemento na série.						fri = fi / n
Fi
Frequência Acumulada
Soma das freqüências simples de classe com as freqüências simples da classe antecedente		Fi = f1+f2+f3+f4...fi
Fri
Frequência Acumulada Relativa (%)
Divisão da freqüência acumulada (Fi) da classe pelo total dos elementos				Fri = Fi / n
Elaborando uma tabela de distribuição de freqüências
Transformar os dados em rol
Encontrar a amplitude total
Determinar o número de classes de acordo com o total de observações
	Xi
	fi
	fri
fi/n
	Fi
fi1+ fi2+ fi3+...
	Fri
fi / n
	2
	3
	=3/25 12
	Repete fi 3
	Repete fri 12
	3
	7
	=7/25 28
	=3+7 10 
	12+28 40
	4
	8
	=8/25 32
	=10+8 18
	40+32 72
	6
	6
	=6/25 24
	=18+6 24
	72+24 96
	7
	1
	=1/25 4
	=24+1 25 
	96+4 100 
	
	n= 25
	
	
	
Ponto Médio
	Classe
	Intervalo de classe
	fi
	fri
fi/n
	Fi
fi1+ fi2+ fi3+...
	Fri
fi / n
	1
	2 ___________4
	6
	15
	6
	15
	2
	4 ___________6
	18
	45
	24
	60
	3
	6 ___________8
	10
	25
	34
	85
	4
	8 ___________10
	6
	15
	40
	100
	
	
	n = 40
	
	
	
Limite inferior (lim superior + limite superior) / 2
1ª classe = (4+2) / 2 = 3
4ª classe = (8+10) / 2 = 9
AULA 3 _ MEDIDAS DE TENDÊNCIA CENTRAL
Uma medida de tendência central ou posição de um conjunto de dados mostra o valor em torno do qual se agrupam as observações. Dividem-se em: 
1. Média Aritmética		2. Mediana 		3. Moda
Média Aritmética: Uma média aritmética pode ser Simples, Ponderada ou Agrupada em Classe
Média Aritmética Simples: é média aritmética, ou média, de um conjunto de N números X1, X2, ...., Xn é definido por:
Exemplo: Sabe-se que a produção leiteira diária da vaca A, durante uma semana, foi de 10, 14, 13, 15, 16, 18 e 12 litros, temos, para a produção média da semana:
Média Aritmética Com a Frequência Absoluta: A média é obtida através da multiplicação do valor de cada classe pela frequência simples correspondente
	xi
	fi
	Fi
	fr %
	Fri%
	
	
X= (142x6)+(146x4)+(150x3)+(154x2)+(158x5)= 2984= 149,20
 --------------------------------------------------------- -------
		 20	 20
	142
	6
	6
	30
	30
	
	
	146
	4
	10
	20
	50
	
	
	150
	3
	13
	15
	65
	
	
	154
	2
	15
	10
	75
	
	
	158
	5
	20
	25
	100
	
	
	∑
	20
	-
	100
	-
	
	
Média Aritmética com Dados Agrupados: O modo mais prático de obtenção da média com os dados agrupados é abrir, na tabela, uma coluna correspondente aos produtos xifi:
�����
Média aritmética com a freqüência relativa: A média é obtida através da multiplicação do valor de cada classe pela frequência relativa correspondente
	xi
	fi
	Fi
	fr %
	Fr%
	
	
X= (142 x 0,30)+(146 x 0,20)+(150 x 0,15)+(154 x 0,10)+(158 x 0,25)=
X= 42,60 + 29,20 + 22,50 + 15,40 + 39,50= 149,20
	142
	6
	6
	30
	30
	
	
	146
	4
	10
	20
	50
	
	
	150
	3
	13
	15
	65
	
	
	154
	2
	15
	10
	75
	
	
	158
	5
	20
	25
	100
	
	
	∑
	20
	-
	100
	-
	
	
Média Aritmética Com Intervalos De Classe
Graficamente podemos observar facilmente a moda. O valor modal localiza-se na parte mais alta da curva onde a frequência tem o maior valor.
Moda Com Intervalo De Classe
l* é o limite inferior da classe modal
L* é o limite superior da classe modal
Mediana  é o valor que divide a distribuição em duas partes iguais. Sua fórmula é: 
Mediana Dados Não-agrupados
Dada uma série de valores, como por exemplo: 5, 13, 10, 2, 18, 15, 6, 16, 9
De acordo com a definição de mediana, o primeiro passo a ser dado é ordenar os valores: 2, 5, 6, 9, 10, 13, 15, 16, 18.
Md = 10
Número ímpar: É o valor do item médio ou central.
Ex.:			 4; 7; 8; 9; 12; 13; 17	A mediana é 9.
Número par: Quando os números são pares tem-se dois elementos centrais e a mediana será a média aritmética.
Ex.: 		4; 7; 8; 10;12; 13; 17; 20	A mediana será: (10 + 12) = 22 = 11
2 
Mediana: Dados Agrupados Sem Intervalos De Classe
Identificar a frequência acumulada imediatamente superior à metade da soma das frequências. 
A mediana será aquele valor da variável que corresponde a tal frequência acumulada. 
	Nº de
meninos
	fi
	Fi
	
Sendo: (∑ fi) ÷ 2 = 34 ÷ 2 = 17
Md = 2 meninos
	0
1
2
3
4
	2
6
10
12
4
	2
8
18
30
34
	
	
	∑ = 34
	
	
No caso de existir uma frequência acumulada (F1), tal que: Fi = (∑ f1) ÷ 2
A mediana será dada por:  Md = [(xi + xi + 1)] ÷ 2
	xi
	fi
	Fi
	Sendo: (∑ fi) ÷ 2 = 8 ÷ 2 = 4
Logo: Md = (15 + 16) ÷ 2
= 31 ÷ 2
15,5
Md = 15,5 meninos
	12
14
15
16
17
20
	1
2
1
2
1
1
	1
3
4
6
7
8
	
	 
	∑ = 8
	 
	
Mediana com intervalo de classe
Mediana Para Dados Agrupados
	Salários
	f (nº de
pessoas)
	xi
	Fi
	1º passo : Localizar o ponto que contém a mediana.
n = 40 temos: n/2 = 40:2 = 20 
(Na 3ª classe, temos Fi = 24) 
1º passo: Calcula-se a ordem n/2. 
2º passo: Pela Fi identifica-se a classe que contém a mediana 
(Classe Md = 30 (( 40 ).
3º Passo: utiliza-se a fórmula.
	10 (( 20
	5
	15
	5
	
	20 (( 30
	8
	25
	13
	
	30 (( 40
	11
	35
	24
	
	40 (( 50
	9
	45
	33
	
	50 (( 60
	4
	55
	37
	
	60 (( 70
	3
	65
	40
	
	S
	40
	 
	-----
	
AULA 4 _ MEDIDAS DE ORDENAMENTO E FORMA
Na análise da distribuição de uma variável, há grande interesse de determinarmos qual o valor que divide a distribuição em duas partes iguais, quatro partes iguais, dez partes iguais e cem partes iguais. A estes valores (separatrizes) chamaremos respectivamente de:
Quartil: Denominamos quartis os 3 valores de uma série que a dividem em 4 partes iguais. Há três quartis: o primeiro quartil; o segundo quartil (igual à mediana); o terceiro quartil. Dividem a distribuição em quatro partes iguais. Sua fórmula: 
Qnq  =  X ( nqn / 4 + ½)
_____________________________________________________
0%		25%		50%		75%		100%
			Q1		Q2		Q3		
				 2ºQuartil
				 Mediana
 Sendo que Q2 (segundo quartil) é igual à mediana da série.
Decil: Denominamos quartis os 9 valores de uma série que a dividem em 10 partes iguais. Dividem a distribuição ordenada em dez partes iguais. Sua fórmula é:
Qnq  =  X ( nqn / 10 + ½)  
___________________________________________________________
d1	d2	d3	d4	d5	d6	d7	d8	d9	d10
				 mediana
O quinto decil é igual ao segundo quartil, que por sua vez é igual à mediana.
Percentil: Denominamos percentis os 99 valores que separam uma série em 100 partes iguais.
Dividem a distribuição ordenada em dez partes iguais. Sua fórmula é:
Qnq  =  X ( nqn / 10 + ½)
___________________________________________________________
d1	d2	d3	d4	d5	d6	d7	d8	d9	d10
				 mediana
		 O quinquagésimo centil é igual à mediana.
AULA 5 _ MEDIDAS DE DISPERSÃO
Nem sempre, quando se está estudando um grupo de dados, o conhecimento de um promédio é suficiente para se tirar conclusão a respeito desses dados. É necessário também o conhecimento da variabilidade dos dados. Assim, é que não se justifica calcular a média de um conjunto de dados onde não haja nenhuma variação desses elementos.
Da mesma forma, não ajuda muito o conhecimento da média quando o conjunto de dados tiver uma variação muito grande. A tomada de decisões apenas com a média, por exemplo, de um conjunto de dados é inadequada, uma vez que os dados diferem entre si, em maior ou menor grau.
As medidas de tendência central (Média. Moda e Mediana) fornecem um resumo parcial das informações de um conjunto de dados. A necessidade de uma medida de variação é aparente, para que nos permita, por exemplo, comparar conjuntos diferentes de valores. 
Variância: É a média dos quadrados dos desvios das observações em relação à média da amostra. Pode ser definida como uma medida de dispersão que é o quadrado do desvio padrão, ou se preferir, o desvio padrão é a raiz quadrada da variância.
Habitualmente considera-se uma versão corrigida da variância
Desvio Padrão: O desvio padrão de um conjunto de N números X1, X2, ... A variância não vem representada na mesma unidade das observações. Se tomarmos a raiz quadrada da variância obtemos o desvio padrão que também é uma medida de dispersão e vem na mesma unidade das observações.
Nos programas de estatística e nas máquinas de calcular o que aparece são as versões corrigidas da variância e do desvio padrão. O desvio padrão e a variância podem ser fortemente afetados por erros ou observações muito afastadas
Propriedades do Dp: Somando-se ou subtraindo-se uma constante a cada elemento de um conjunto de números, o desvio padrão não se altera. Multiplicando-se ou dividindo-se cada elemento de um conjunto de números por uma constante, o desvio padrão fica multiplicado ou dividido pela constante.
Amplitude total: A amplitude de uma amostra é a diferença entre o máximo e o mínimo.
Exemplo: Para os valores 40,45,48,52,54,62 e 70, temos que
AT = 70 – 40 = 30
Quanto maior a amplitude total, maior a dispersão ou variabilidade dos valores da variável.
Coeficiente De Variação: Podemos caracterizar a dispersão ou variabilidade dos dados em termos relativos a seu valor médio, medida essa denominada coeficiente de variação (CV). Corresponde à relação entre o desvio padrão sobre a média.
Considere os resultados das medidas das estaturas e dos pesos de um mesmo grupo de indivíduos:
Método prático: Não apenas este método é usualmente mais prático, como também mais preciso 
1º caso: dados não-agrupados
Tomemos como exemplo o conjunto de valores da variável x: 40, 45, 48, 52, 54, 62, 70.
O modo mais prático para se obter o desvio padrão é formar uma tabela com duas colunas: uma para xi e outra para xi²
2º caso: dados agrupados sem intervalos de classe
Como, neste caso, temos a presença de frequências, temos que levá-las em consideração, resultando a fórmula: 
O modo mais prático de obter o desvio padrão é abrir, na tabela dada, uma coluna para os produtos fixi e outra para fixi². 
Logo, considerando os dados da tabela anterior, temos que:
3º caso: dados agrupados com intervalos de classes
AULA 6_ TABELAS E GRÁFICOS
O gráfico estatístico é uma forma de apresentação dos dados estatísticos, cujo objetivo é o de produzir, no investigador ou no público em geral, uma impressão mais rápida e viva do fenômeno em estudo, já que os gráficos falam mais rápido à compreensão que as séries. Os gráficos podem ser classificados quanto á forma e quanto ao uso
Para a elaboração de um gráfico devem ser considerados:
a) Um título geral indicando a situação estudada, época e local;
b) escalas e as respectivas unidades de medida;
c) convenções adotadas;
d) fonte de informação assinalando de onde foram retirados os valores.
Tipos de Gráficos
1. Gráfico de Colunas: Representação por meio de retângulos não-contíguos, dispostos verticalmente; 
Os retângulos possuem a mesma base e as alturas são proporcionais aos respectivos dados;
É usado em séries temporais, específicas ou geográficas.
=> (gráfico de colunas compostas)
2. Gráfico em Barras: Representação por meio de retângulos dispostos horizontalmente; Os retângulos possuem mesma altura e os seus comprimentos são proporcionais aos respectivos dados.
=> (gráfico de colunas compostas)
3. Gráficos em setores: É designado por meio de um círculo, onde cada classe é representado por um setor circular, cujo ângulo é proporcional ao tamanho da amostra. É utilizado quando se deseja mostrar as partes de um todo, ou seja, quando se deseja comparar proporções. 
As áreas dos setores são proporcionais aos dados da série e a área total da circunferência (100%) corresponde a 360º.360o ( 100%
4. Gráfico de linhas
São usados, sobretudo, na representação de séries temporais.
5. Pictogramas
Os símbolos devem ser auto-explicativos;
As diferentes quantidades devem expressar-se mediante maior ou menor número de símbolos;
Estabelecem comparações gerais.
6. Histograma: é um gráfico composto por retângulos justapostos em que a base de cada um deles corresponde ao intervalo de classe e a sua altura à respectiva frequência.
AULA 07 _TÉCNICAS DE AMOSTRAGEM
É uma técnica especial para recolher amostras, que garante, tanto quanto possível, o acaso da escolha.
Dessa forma, cada elemento da população passa a ter a mesma chance de ser escolhido, o que garante à amostra caráter de representatividade. 
Amostragem Aleatória Simples
É equivalente a um sorteio lotérico.Na prática, a amostragem casual ou aleatória simples pode ser realizada enumerando-se a população de 1 a n e sorteando-se por meio de um dispositivo aleatório qualquer k números dessa sequência, os quais corresponderão aos elementos pertencentes à amostra.
Ex.: Obter uma amostra representativa, de 10%, de uma população de 300 alunos de uma escola. 
1º) Numerar os alunos de 1 a 300; 
2º) Escrever os números de 1 a 300 em pedaços de papel e colocá-los em uma urna; 
3º) Retirar 30 pedaços de papel, um a um, da urna, formando a amostra da população. 
Nesta técnica de amostragem, todos os elementos da população têm a mesma probabilidade de serem selecionados.
Amostragem Proporcional Estratificada
Muitas vezes a população se divide em sub-populações (estratos). O sorteio dos elementos da amostra deve levar em consideração tais estratos. Além de considerar a existência de extratos, obtém os elementos da amostra proporcional ao número de elementos dos mesmos
Ex.: Em uma população de 300 alunos, há 180 meninos e 120 meninas. Extraia uma amostra representativa, de 10%, dessa população. 
Nesse exemplo, há uma característica que permite identificar 2 subconjuntos, a característica Sexo. Considerando essa divisão, vamos extrair a amostra da população. 
	Sexo
	População
	Amostra
	Masc
	180
	18
	Fem
	120
	12
	Total
	300
	30
Estatística Inferencial
Inferência estatística é o processo pelo qual estatísticos tiram conclusões acerca da população usando informação de uma amostra. 
Valor esperado de �
A média da variável aleatória de � é o valor esperado de�, ou seja, é a media de todas as médias possíveis para uma amostras de tamanho n de uma população. 
 É importante saber que o valor esperado de � é igual ao valor da média da população ((). 
Assim, temos=>
Não há dúvida de que uma amostra não representa perfeitamente uma população. Ou seja, a utilização de uma amostra implica na aceitação de uma margem de erro que denominaremos ERRO AMOSTRAL.
Erro Amostral é a diferença entre um resultado amostral e o verdadeiro resultado populacional; tais erros resultam de flutuações amostrais aleatórias.
Ocorrem erros não-amostrais quando:
· Os dados amostrais são coletados, registrados ou analisados incorretamente.
· Há uma utilização de um instrumento defeituoso durante a realização de mensurações.
· Um questionário ou formulário possui questões formuladas de modo tendencioso. 
Não podemos evitar a ocorrência do ERRO AMOSTRAL, porém podemos limitar seu valor através da escolha de uma amostra de tamanho adequado. Obviamente, o ERRO AMOSTRAL e o TAMANHO DA AMOSTRA seguem sentidos contrários. Quanto maior o tamanho da amostra, menor o erro cometido e vice-versa.
Erro Padrão Da Média
Quando se obtém uma amostra aleatória de tamanho n, estima-se a média populacional. 
É bastante intuitivo supor que se uma nova amostra aleatória for realizada a estimativa obtida será diferente daquela primeira. 
Desta forma, reconhece-se que as médias amostrais estão sujeitas à variação e formam populações de médias amostrais, quando todas as possíveis amostras são retiradas de uma população. 
O erro padrão analisa a variabilidade de uma média.
Desvio-padrão de �, também denominado erro-padrão da média. 
Caso N ( 30n, usar a fórmula de população infinita.
População Infinita
Quando o valor de N é desconhecido ou muito grande.
 
Se N ( 30n usar Fator de Correção Finita (FCF) 
Desvio-padrão de , também denominado erro-padrão da média. 
População Finita - quando o valor de N é conhecido.
AULA 08 _INTERVALO DE CONFIANÇA
Para compreendermos a aplicação do Intervalo de Confiança, precisamos ter noções sobre a distribuição da curva normal.
Distribuição Normal: Para compreendermos a aplicação do Intervalo de Confiança, precisamos ter noções sobre a Distribuição da Curva Normal.
�
�
Intervalo De Confiança
A média calculada para uma amostra dificilmente será igual à média (real) da população. É possível também, estabelecer um intervalo de confiança (IC) para a média da população. 
O intervalo de confiança da média representa os valores limites, inferior e superior, entre os quais se espera que a “verdadeira” média da população esteja localizada. 
Os intervalos de confiança mais utilizados são os de 90%, , 95% e 99%, seguindo a tabela abaixo:
O intervalo de confiança mais comumente empregado é o de 95% (IC 95%), que indica que, para médias obtidas de diferentes amostras da mesma população, o IC calculado inclua a verdadeira média da população em 95% das vezes
Os modelos de aplicação do Intervalo de Confiança são baseados na premissa de que a distribuição normal pode ser usada com os seguintes dados: sempre a amostra deve ser igual/superior a 30; quando for menor do que 30, o desvio padrão é conhecido.
	Unidades de Desvio Padrão a partir da Média				 Proporção Verificada
				1,64								90%
				1,96								95%
				2,58								99%
O intervalo de confiança é um conjunto de valores dentro do qual a média se situa, sendo que não se pode afirmar exatamente qual é este valor, ou seja, todos têm exatamente a mesma probabilidade de ocorrência.
O intervalo de confiança da média é determinado pela equação:
AULA 9- DISTRIBUIÇÃO NORMAL
Denomina-se distribuição normal reduzida a distribuição normal de média zero e variância. 
As probabilidades associadas à distribuição normal reduzida são facilmente obtidas em tabelas. Daí o interesse em estudar esse tipo particular de distribuição. Veja os exemplos nas telas seguintes! 
A área total sob a curva normal vale 1. 
Isto significa que a probabilidade de ocorrer qualquer valor real é 1. A curva é simétrica em torno da média zero. 
Então a probabilidade de ocorrer valor maior do que zero é 0,5. Mas qual seria a probabilidade de ocorrer valor entre zero e z = 1,25, por exemplo?
Essa probabilidade é encontrada na tabela de distribuição normal. Na primeira coluna da tabela, está o valor 1,2. 
Na primeira linha da tabela, está o valor 5. 
O número 1,2 compõe, com o algarismo 5, o número z = 1,25. No cruzamento da linha 1,2 com a coluna 5, está o número 0,3944. 
Esta é probabilidade de ocorrer valor entre zero e z = 1,25.
Qual é a probabilidade de ocorrer valor maior do que z = 1,25? 
Como a probabilidade de ocorrer valor maior do que zero é 0,5 e a probabilidade de ocorrer valor entre zero e z = 1,25 é 0,3944, a probabilidade pedida é:
0,5 – 0,3944 = 0,1056 ou 10,56%
Como transformar uma normal qualquer em uma normal reduzida 
Para transformar uma curva normal em uma curva normal reduzida, devemos calcular o z equivalente aos limites desejados utilizando a fórmula:
x = ponto que se deseja converter em z 
μ = média da normal original 
σ = desvio padrão da normal original
Ex: A idade de um grupo de 20 pessoas segue uma distribuição normal. A média de idade do grupo é de 60 anos e o desvio-padrão é igual a 4.
Qual a probabilidade de existirem pessoas com idade menor que 60 anos?
Qual a probabilidade de existirem pessoas com idade maior que60 anos?
�
AULA 10 _TESTE DE HIPOTESES
Teste de Hipóteses é um método utilizado para observarmos se determinados dados são compatíveis ou não com alguma hipótese levantada. Este procedimento estatístico tem como base a observação de uma amostra, sendo a teoria de probabilidades utilizada para verificar o comportamento de parâmetros desconhecidos numa população.
O Teste de Hipóteses pode ser feito através de duas formas: Testes paramétricos e Testes não paramétricos ou testes de associação livre
O uso tanto dos testes paramétricos como dos não paramétricos está condicionado à dimensão da amostra e à respectiva distribuição da variável em estudo. 
Testes paramétricos são baseados em parâmetros da amostra, por exemplo, média e desvio padrão.
Testes Não Paramétricos
Envolvem casos em que não podemos supor características da população de onde a amostra foi extraída, como por exemplo, comportamento de distribuição normal. Conheça os principais testes não paramétricos.
Os testes não paramétricos ou testes de distribuição livre, têm a mesma finalidade e se aplicam às mesmas situações que os testes paramétricos. Contudo, os testes de distribuição livre não se apoiam na hipótese de as populações que estão sendo analisadas possuam distribuição normal.
Desta forma, são aplicáveis em uma gama muito maior de casos do que os testes paramétricos. Por outro lado, apesar dessa vantagem, a eficiência dos testes não paramétricos costuma ser menor, de forma que estes acabam sendo aplicados quando se mostra a inviabilidade da aplicação do correspondente teste paramétrico. 
Teste do Qui-Quadrado: utilizado na análise de frequências, no caso de análise de uma característica da amostra.
Teste do Qui-Quadrado para Independência ou Associação: utilizado na análise de frequências, no caso de análise de duas características da amostra.
Teste dos Sinais: utilizado em casos emparelhados, ou seja, submetido a duas medidas.
Teste de Wilcoxon: Analisa os dados emparelhados considerando também  as magnitudes encontradas.
Teste de Mann Whitney: Analisa se dois grupos originam-se de populações com médias diferentes.
Teste da Mediana: Análise de grupos que originam-se de populações com medianas diferentes.
Teste de Kruskal-Wallis: Análise de grupos que originam-se de populações com médias diferentes.
Testes Paramétricos
Nos testes paramétricos, as hipóteses envolvem apenas parâmetros populacionais, como a média, a variância, uma proporção, etc. Além disso, em geral, estes testes comportam uma diversidade de suposições fortes a que o seu emprego deve subordinar-se de que são exemplo:
as observações devem ser extraídas de populações com distribuição especificada;
as variáveis em estudo devem ser medidas em escala intervalar, de modo a que seja possível utilizar operações aritméticas sobre os valores obtidos das amostras (adição, multiplicação, ...), etc.
Testes paramétricos são baseados em parâmetros da amostra, por exemplo, média e desvio padrão. 
Os testes de hipóteses são sempre constituídos por duas hipóteses, a hipótese nula H0 e a hipótese alternativa H1.
• Hipótese existente, ou hipótese a ser testada – H0, que sempre alega a igualdade de um determinado parâmetro. 
• Hipótese alternativa – H1, que sempre alega a desigualdade de um determinado parâmetro.
TESTES DE HIPÓTESES
Ho é chamada de hipótese nula e 
H1 de hipótese alternativa
Em geral, a hipótese nula é feita com base no comportamento passado do produto/processo/serviços, enquanto a hipótese alternativa é formulada em função de alterações / inovações recentes.
Por exemplo, podemos formular a hipótese que a produtividade é diferente de 2,5 peças/hora. Formalmente isso é escrito como:
Ho é chamada de hipótese nula e 
H1 de hipótese alternativa
Para a realização dos testes de hipóteses, temos que obedecer às seguintes etapas:
Formulação do Teste de Hipótese: Hipótese Nula (H0) e Alternativa (H1).
Escolha de Distribuição Normal Adequada.
Selecionar o nível de significância e região crítica do teste.
Estabelecer Regra de Decisão.
Selecionar a amostra, calcular a Estatística de teste e interpretar seus resultados.
Passo 1: Definição da Hipótese: é o estabelecimento das hipóteses: hipótese nula e hipótese alternativa 
Hipótese Nula (Ho): É um valor suposto para um parâmetro. Se os resultados da amostra não forem muito diferentes de Ho, ela não poderá ser rejeitada.
Hipótese Alternativa (H1): É uma hipótese que contraria a hipótese nula, complementar de Ho, Essa hipótese somente será aceita se os resultados forem muito diferentes de Ho. 
Passo 2: Calcular a estatística do Teste: É o valor calculado a partir da amostra, que será usado na tomada de decisão. Uma maneira de tomar-se uma decisão é comparar o valor tabelado com a estatística do teste. Para o caso de testes de médias, a estatística do teste é a variável padronizada Z:
Se α = 10%, uma área de 45% entre a média amostral e o limite inferior do intervalo e outra área de 45% entre a média amostral e o limite superior do intervalo, o que nos fornece uma área total (nível de confiança) de 90%, conforme demonstrado abaixo: 
Se α = 5%, teremos uma área de 47,5% entre a média amostral e o limite inferior do intervalo e outra área de 47,5% entre a média amostral e o limite superior do intervalo, o que nos fornece uma área total (nível de confiança) de 95%, conforme demonstrado abaixo: 
Se α = 1%, teremos uma área de 49,5% entre a média amostral e o limite inferior do intervalo e outra área de 49,5% entre a média amostral e o limite superior do intervalo, o que nos fornece uma área total (nível de confiança) de 99%, conforme demonstrado abaixo:
Passo 3: Regra de Decisão
Aceitar Ho, implica que a hipótese nula não pode ser rejeitada!
Rejeitar Ho implica que temos evidências estatísticas para rejeitá-la.
� EMBED Equation.3 ���
� EMBED Equation.3 ���
� EMBED Equation.3 ���
� EMBED Equation.3 ���
� EMBED Equation.3 ���
� EMBED Equation.3 ���
� EMBED Equation.3 ���
� EMBED PBrush ���
� EMBED PBrush ���
� EMBED Equation.3 ���
� EMBED Equation.3 ���
Qnq = Primeiro, segundo e terceiro quartil (i = 1,2 e 3)
nq = nº do quartil que se quer
X = elemento da série ordenada
n = tamanho da amostra
� EMBED Equation.3 ���
� EMBED Equation.3 ���
� EMBED Equation.3 ���
� EMBED Equation.3 ���
� EMBED Equation.3 ���
� EMBED Equation.3 ���
� EMBED Equation.3 ���
� EMBED Equation.3 ���
� EMBED Equation.3 ���
� EMBED Equation.3 ���
� EMBED Equation.3 ���
� EMBED Equation.3 ���
_1443623668.unknown
_1443624219.unknown
_1443625455.unknown
_1443640139.unknown
_1443642225.unknown
_1443642352.unknown
_1443639924.unknown
_1443624759.unknown
_1443623822.unknown
_1443623933.unknown
_1443623792.unknown
_1443620180.unknown
_1443623654.unknown
_1443618903.unknown
_1443618115.unknown
_1443618453.unknown
_1443618429.unknown
_1443616871.unknown
_1443617066.unknown
_1443616824.unknown

Continue navegando