rsafasfasd

Cálculo I

•
UNICEUB

Rafaella Rosa
19/06/2019
Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original
ANAELENA BRAGANÇA DE MORAES
LUCIANE FLORES JACOBI
ROSELAINE RUVIARO ZANINI
CADERNO DIDÁTICO
	ESTATÍSTICA
Santa Maria
UFSM
2013
Ficha catalográfica elaborada por Rosa Maria Fristsch Feijó CRB-10/662
		 Biblioteca Central – UFSM
Sumário
	
	
	1 - Conceitos Iniciais
	1
	1.1
	Conceito de estatística
	1
	1.2
	Divisão da estatística
	1
	1.3
	População
	2
	1.4
	Amostra
	2
	1.5
	Dados estatísticos
	2
	1.6
	Variável
	2
	1.7
	Níveis de mensuração de uma variável
	3
	1.8
	Arredondamento de dados
	4
	1.9
	Método estatístico
	4
	1.10
	Representação tabular
	5
	1.11
	Séries estatísticas
	6
	1.12
	Representação gráfica
	7
	
	
	
	2 – Distribuições de Freqüências
	10
	1
	Representação de variáveis
	10
	
	1.1 Discretas
	10
	
	1.2 Contínuas
	10
	2
	Alguns conceitos básicos
	10
	
	2.1 Dados brutos
	10
	
	2.2 Rol
	10
	
	2.3 Amplitude total
	10
	
	2.4 Classe
	10
	
	2.5 Limites de classe
	11
	
	2.6 Amplitude de classe
	11
	
	2.7 Ponto médio de classe
	11
	
	2.8 Tipos de freqüências
	11
	
	2.9 Exemplos de distribuições de freqüências
	12
	
	2.10 Gráficos representativos de uma distribuição de freqüências em classes
	12
	
	
	
	3 – Medidas Descritivas
	17
	1
	Introdução
	17
	2
	Medidas de tendência central
	17
	
	2.1 Média aritmética
	17
	
	2.2 Mediana
	18
	
	2.3 Moda
	20
	3
	Separatrizes
	21
	
	3.1 Quartis
	21
	
	3.2 Decis
	23
	
	3.3 Percentis
	23
	4
	Medidas de dispersão
	23
	
	4.1 Amplitude de variação
	24
	
	4.2 Desvio médio
	24
	
	4.3 Soma de quadrados
	25
	
	4.4 Variância
	25
	
	4.5 Desvio padrão
	26
	
	4.6 Coeficiente de variação
	27
	5
	Assimetria e curtose
	27
	
	5.1 Assimetria
	27
	
	5.2 Curtose
	28
	
	
	
	4 – Probabilidade 
	30
	1
	Introdução
	30
	2
	Noções de experimento, espaço amostral e eventos
	30
	
	2.1 Experimento aleatório
	30
	
	2.2 Espaço amostral
	30
	
	2.3 Evento
	30
	3
	Álgebra de eventos
	31
	4
	Conceitos de probabilidade
	31
	
	4.1 Conceito empírico
	32
	
	4.2 Definição clássica de probabilidade
	32
	
	4.3 Definição axiomática
	32
	5
	Probabilidade condicionada
	33
	6
	Independência estatística
	34
	7
	Teorema de Bayes
	34
	8
	Resumo das propriedades do cálculo de probabilidades
	36
	
	
	
	5 – Variáveis Aleatórias
	36
	1
	Noções sobre variáveis aleatórias
	36
	2
	Variáveis aleatórias discretas
	36
	
	2.1 Função de probabilidade
	36
	
	2.2 Valor esperado ou média de uma variável aleatória discreta
	37
	
	2.3 Variância de uma variável aleatória discreta
	37
	3
	Variáveis aleatórias contínuas
	38
	
	3.1 Função densidade de probabilidade
	38
	
	3.2 Valor esperado ou média de uma variável aleatória contínua
	38
	
	3.3 Variância de uma variável aleatória contínua
	39
	4
	Modelos probabilísticos para variáveis aleatórias
	39
	
	4.1 Distribuição binomial
	39
	
	4.2 Distribuição de Poisson
	40
	
	4.3 Distribuição normal
	41
	
	4.4 Distribuição Qui-quadrado (2)
	43
	
	4.5 Distribuição “t” de Student
	44
	
	4.6 Distribuição “F” (Fisher)
	44
	
	
	
	6 – Amostragem
	45
	1
	Introdução
	45
	
	1.1 Definição de amostragem
	45
	
	1.2 Importância da utilização da amostragem
	45
	
	1.3 Situações em que pode não valer à pena a realização de uma amostragem
	46
	
	1.4 Tipos de investigação
	46
	2
	Tipos de amostragem probabilistica
	46
	
	2.1 Amostragem aleatória simples
	46
	
	2.2 Amostragem sistemática
	47
	
	2.3 Amostragem estratificada
	47
	3
	Distribuição por amostragem
	48
	
	3.1 Amostragem com ou sem reposição
	49
	
	3.2 Distribuição amostral das médias
	49
	4
	Determinação do tamanho da amostra
	49
	
	4.1 Para estimar a média populacional
	49
	
	4.2 Para estimar uma proporção populacional
	51
	
	
	
	7 – Estimação de Parâmetros
	52
	1
	Introdução
	52
	2
	Estimativas pontuais e intervalares
	52
	3
	Tipos de intervalos
	52
	
	3.1 Intervalo de confiança para a média 
	52
	
	3.2 Intervalo de confiança para a proporção populacional p
	53
	
	3.3 Intervalo de confiança para a diferença de médias populacionais 1 e 2
	54
	
	3.4 Intervalo de confiança para a diferença de proporções populacionais p1 e p2
	55
	
	
	
	8 – Testes de Hipóteses Paramétricos
	56
	1
	Introdução
	56
	2
	Hipóteses estatísticas
	56
	3
	Testes de hipóteses
	56
	
	3.1 Hipóteses
	56
	
	3.2 Tipos de erros
	56
	
	3.3 Nível de significância do teste
	57
	
	3.4 Graus de liberdade
	57
	
	3.5 Teste bilateral
	57
	
	3.6 Teste unilateral
	57
	
	3.7 Probabilidade exata do teste
	58
	
	3.8 Procedimento para a realização de um teste de hipóteses
	58
	4
	Testes de hipóteses paramétricos
	58
	
	4.1 Teste para uma média com variância populacional 2 conhecida
	58
	
	4.2 Teste para uma média com variância populacional 2 desconhecida
	59
	
	4.3 Teste para a proporção populacional p
	60
	
	4.4 Teste para a diferença entre duas médias populacionais independentes
	60
	
	4.5 Teste para a diferença entre duas amostras dependentes – Teste t pareado
	63
	
	4.6 Teste para a diferença entre duas proporções populacionais p1 e p2
	64
	
	4.7 Teste para a diferença entre duas variâncias
	65
	
	
	
	9 – Análise de Variância – ANOVA
	66
	1
	Introdução
	66
	2
	Pressuposições básicas à aplicação da ANOVA
	66
	3
	ANOVA – Uma classificação: amostras de mesmo tamanho
	66
	4
	ANOVA – Uma classificação: amostras de tamanhos diferentes
	68
	5
	Comparação de médias
	68
	
	5.1 Teste de Tuckey
	68
	
	
	
	10 – Testes de Hipóteses Não-Paramétricos
	70
	1
	Teste de adequação
	70
	2
	Teste qui-quadrado de independência
	71
	3
	Coeficiente de contingência
	72
	
	
	
	11 – Correlação e Regressão Linear Simples
	74
	1
	Análise de correlação linear simples
	74
	
	1.1 Estimativa do coeficiente de correlação
	75
	
	1.2 Teste para o coeficiente de correlação
	75
	2
	Regressão linear simples
	75
	
	2.1 Considerações na análise de regressão
	76
	3
	Teste para verificar a significância da regressão
	78
	4
	Coeficiente de determinação ou explicação
	79
	
	
	
	Referências Bibliográficas
	81
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	Telefone para contato: (055) 3220 8486 sub-ramais 32 ou 33 ou 3220 8612 
Departamento de Estatística – CCNE – UFSM
	http://www.ufsm.br/estat e http://www.ufsm.br/ppgemq 
1 - Conceitos Iniciais
1.1 Conceito de estatística
Existem muitas definições propostas por autores, objetivando estabelecer com clareza o que é estatística, como por exemplo:
	a estatística é um conjunto de métodos destinados a coleta, organização, resumo, apresentação e análise de dados de observação, bem como a tomada de decisões razoáveis baseadas em tais análises;
	a estatística é a matemática aplicada aos dados de observação;
	a estatística é um conjunto de processos ou técnicas empregadas na investigação e análise de fenômenos coletivos ou de massa.
1.2 Divisão da estatística
A estatística divide-se em: 
Estatística geral
Visa elaborar métodos gerais aplicáveis a todas as fases do estudo dos fenômenos de massa. A estatística matemática é a parte da estatística geral que tem por finalidade
o estudo das propriedades matemáticas dos fenômenos de massa e a dedução e demonstração rigorosa dos procedimentos e fórmulas usadas. A estatística geral ainda pode ser dividida em dois grandes campos:
Estatística descritiva
Trata da coleta, da organização, classificação, apresentação e descrição dos dados de observação. Refere-se à maneira de apresentar um conjunto de dados em tabelas e gráficos e à maneira de resumir, através de certas medidas, as informações contidas nestes dados.
Estatística indutiva ou inferencial
Visa tirar conclusões sobre a população a partir de amostras. Refere-se à maneira de estabelecer conclusões para toda uma população quando se observar apenas parte desta população.
Estatística aplicada
É todo o ramo do conhecimento científico que proceda, única ou principalmente, por intermédio da metodologia estatística. Exemplos: Biometria (ciência que trata da mensuração da vida e dos processos vitais), Demografia, Econometria, Psicometria (mensuração da personalidade, do desenvolvimento mental e do comportamento de indivíduos e grupos e seus ajustamentos a mudanças no meio ambiente), Mecânica Estatística, Sociometria (maneira como as pessoas vivem, sua cultura, opiniões e atitudes, assim como o relacionamento de uns com os outros).
Algumas aplicações da estatística
A estatística é uma ciência de múltiplas aplicações e de fundamental importância no campo da investigação científica, sendo de utilização cada vez mais acentuada em qualquer atividade profissional. Então, é razoável que os profissionais de diversas áreas adquiram um mínimo de conhecimento técnico sobre estatística que possibilitem a compreensão de termos como: variabilidade, regressão, correlação, significância, etc. que aparecem com freqüência em artigos de publicações especializadas.
1.3 População
É todo o conjunto de elementos que possuam ao menos uma característica comum observável.
Obs.: elementos = objetos, animais, pessoas, material contínuo (sólido, líquido ou gás).
1.4 Amostra
É uma parte da população, sendo que a mesma deve ser selecionada de acordo com algum critério para que possa ser representativa da população.
1.5 Dados estatísticos
São as características observadas ou medidas nos elementos, sendo que os dados de observação constituem a matéria-prima da estatística. 
1.6 Variável
É um símbolo, como X, Y, Z, ..., que pode assumir resultados de um conjunto, que lhe são atribuídos, conjunto este chamado domínio da variável. Se a variável pode assumir somente um valor, ela é denominada constante.
As variáveis podem ser classificadas em:
	Variáveis qualitativas ou atributos: indica alguma propriedade do fenômeno de observação;
	Variáveis quantitativas discretas: quando podem assumir apenas alguns valores de um conjunto;
	Variáveis quantitativas contínuas: quando podem assumir, teoricamente, qualquer valor de um conjunto.
Exemplo: Classifique as variáveis em qualitativas ou quantitativas (discretas ou contínuas).
	quantidade de alcatrão em cigarros;
	altitude de um avião;
	número de assinantes de um serviço de computador on-line;
	precipitação pluviométrica durante um ano;
	salário dos funcionários de uma empresa;
	gênero dos filhos de casais residentes em uma cidade.
Em geral, as medições dão origem a variáveis contínuas, enquanto que as enumerações ou contagens resultam em variáveis discretas.
Solução: a) Variável quantitativa contínua; b) Variável quantitativa contínua; c) Variável quantitativa discreta; d) Variável quantitativa contínua; e) Variável quantitativa discreta; f) Variável qualitativa.
1.7 Níveis de mensuração de uma variável
Nível de mensuração significa a escala em que foi medida a variável, objeto de investigação. São quatro os níveis de mensuração: nominal, ordinal, intervalar e de razão.
Nível nominal 
A mensuração, em seu mais baixo nível, existe quando números ou outros símbolos são utilizados para classificar um elemento. Estes números ou símbolos constituem uma escala nominal ou classificadora. As únicas estatísticas aplicáveis são: a moda e as freqüências.
Nível ordinal
Pode ocorrer que os elementos em uma categoria de dada escala não sejam apenas diferentes dos elementos de outras categorias da mesma escala, mas que guardem certo tipo de “relação” com eles. Isto é, a variável em estudo é partida em categorias ordenadas em graus convencionados havendo uma relação entre categorias do tipo: “maior do que”. Pode-se calcular a mediana e todas as estatísticas de postos, além da moda e das freqüências.
Nível intervalar
Quando a escala tem todas as características de uma escala ordinal, e, além disso, se conhecem as distâncias entre dois números quaisquer da escala, então se consegue uma mensuração consideravelmente mais forte que a ordinal. Atribui-se à variável um número real, uma unidade constante e comum de mensuração. A unidade de mensuração e o ponto zero são arbitrários. A escala intervalar é a primeira escala verdadeiramente quantitativa. Neste nível todas as estatísticas paramétricas comuns são aplicáveis.
Nível de razão
Quando uma escala tem todas as características de uma escala de intervalos e, além disso, tem um verdadeiro ponto zero como origem, é chamada escala de razão. Como no nível anterior, todas as estatísticas são aplicáveis.
Exemplo: Determine o nível de mensuração mais adequado (nominal, ordinal, intervalar ou razão).
	classificação como acima da média, médio ou abaixo da média para encontros marcados com desconhecidos;
	conteúdo de nicotina (em miligramas) de cigarros;
	números de inscrição do INSS;
	temperaturas (em graus Celsius);
	anos em que ocorreram eleições presidenciais;
	graus finais (A, B, C, D, F) de estudantes de estatística;
	códigos de endereçamento postal (CEP);
	rendas anuais de enfermeiras;
	carros classificados como subcompacto, compacto, intermediário ou grande;
	cores de uma amostra de confetes M&M.
Solução: a) Nível ordinal; b) Nível de razão; c) Nível nominal; d) Nível intervalar; e) Nível intervalar; 
f) Nível ordinal; g) Nível nominal; h) Nível razão; i) Nível ordinal; j) Nível nominal.
1.8 Arredondamento de dados
Arredondar um número significa reduzir a quantidade de algarismos significativos após a vírgula, deste número. O objetivo é reduzir os erros por arredondamento, quando é grande o volume de números a arredondar.
A Portaria 36, de 6 de agosto de 1965 do Instituto Nacional de Pesos e Medidas, estabelece os seguintes critérios para o arredondamento de dados.
Regras de arredondamento
	Quando o primeiro algarismo após aquele que será arredondado for 0, 1, 2, 3, 4, conserva-se o algarismo a ser arredondado e desprezam-se os seguintes;
	Quando o primeiro algarismo após aquele que será arredondado for 6, 7, 8, 9 ou 5, este último seguido de outros algarismos, onde pelo menos, um é diferente de zero, aumenta-se uma unidade no algarismo a ser arredondado e desprezam-se os seguintes;
	Quando o primeiro algarismo após aquele que será arredondado for 5, seguido de zeros, conserva-se o algarismo a ser arredondado se ele for par, ou aumenta-se uma unidade, se ele for ímpar, desprezando os seguintes.
	Par 
	5
	 Ímpar 
	
	
	
	Conserva
	
	Soma uma unidade
	0, 1, 2, 3 ou 4
	
	6, 7, 8, 9 ou 5+
Exemplo: Dado os valores abaixo, fazer o arredondamento para décimo.
	33,5630; b) 9,5194; c) 10,32500; 
d) 63,4850000001; e) 6,7153; f) 0,9880;
Solução: a) 33,56; b) 9,52; c)10,32; d) 63,49; e) 6,72; f) 0,99
1.9 Método estatístico
Quando se pretende empreender um estudo estatístico completo, existem diversas fases do trabalho que devem ser desenvolvidas para se chegar aos resultados finais do estudo.
Fases do método estatístico
	Definição do problema: a primeira fase do trabalho estatístico consiste em uma definição ou formulação correta do problema a ser estudado. Além de considerar detidamente o problema objeto do estudo, o analista deverá examinar outros levantamentos
realizados no mesmo campo e análogos, uma vez que parte da informação de que necessita pode, muitas vezes, ser encontrada nesses últimos.
	Planejamento da pesquisa: o passo seguinte, após a definição do problema, compreende a fase do planejamento, que consiste em se determinar o procedimento necessário para resolver o problema e, em especial, como levantar informações sobre o assunto objeto do estudo. É nessa fase que será escolhido o tipo de levantamento a ser utilizado.
Outros elementos importantes que devem ser tratados nessa mesma fase são o cronograma das atividades, através do qual são fixados os prazos para as várias fases, os custos envolvidos, o exame das informações disponíveis, o delineamento da amostra e a forma como serão escolhidos os dados.
	Coleta ou levantamento dos dados: o terceiro passo é essencialmente operacional, compreendendo a coleta das informações propriamente ditas. Formalmente, a coleta de dados se refere à obtenção, reunião e registro sistemáticos de dados, com um objetivo determinado.
	Crítica e digitação dos dados: antes de começar a analisar os dados, é conveniente que lhes seja dado algum tratamento prévio, a fim de torná-los mais expressivos. È um trabalho de condensação e de tabulação dos dados, que chegam ao analista de forma desorganizada, tornando impossível a tarefa de apreender todo o seu significado pela simples leitura.
	Organização e representação dos dados: a apresentação ou exposição dos dados observados constitui a quinta fase do método estatístico. Há duas formas de apresentação, que não se excluem mutuamente.
	A apresentação tabular é uma apresentação numérica dos dados. Consiste em dispor os dados em linhas e colunas distribuídas de modo ordenado, segundo algumas regras práticas adotadas pelos diversos sistemas estatísticos.
	A apresentação gráfica dos dados numéricos constitui uma apresentação geométrica. Embora a apresentação tabular seja de extrema importância, no sentido de facilitar a análise numérica dos dados, não permite ao analista obter uma visão tão rápida, fácil e clara do fenômeno e sua variação como a conseguida através de um gráfico.
	Análise dos dados e interpretação dos resultados: a última fase do trabalho estatístico é a mais importante e também a mais delicada. Nesta etapa, o interesse maior reside em tirar conclusões que auxiliem o pesquisador a resolver seu problema. A análise dos dados estatísticos está ligada essencialmente ao cálculo de medidas, cuja finalidade principal é descrever o fenômeno. Assim, o conjunto de dados a ser analisado pode ser expresso por números-resumos, as estatísticas, que evidenciam características particulares desse conjunto.
1.10 Representação tabular
Consiste em dispor os dados em linhas e colunas distribuídas de modo ordenado. A elaboração de tabelas deve obedecer às normas editadas pelo Instituto Brasileiro de Geografia e Estatística - IBGE.
Abaixo se apresenta uma tabela esquemática sendo indicados os seus elementos.
Título: O quê; Onde; Quando
	Cabeçalho
	Total
	
Coluna Indicadora
	
Corpo da tabela
	Total
	
 Chama de Rodapé
No rodapé de uma tabela podem aparecer, se necessário: a fonte (entidade responsável pelas informações contidas na tabela), notas (observações gerais sobre a tabela) e/ou chamadas (observações feitas em relação a pontos específicos da tabela sendo os símbolos usados: *, **, ...; ’, ”, ...; i, ii, ... e k).
1.11 Séries estatísticas
Uma série estatística é um conjunto de dados ordenados segundo uma característica comum, sendo apresentadas sob forma de tabela e/ou gráfico.
A classificação de uma série é feita de acordo com a variação de três elementos que a compõem: a espécie (o fenômeno), o local (o lugar onde o fenômeno acontece) e a época (fator temporal ou cronológico a que se refere o fenômeno).
O nome da série depende do(s) elemento(s) que varia(m). Assim, pode-se ter uma série específica, geográfica, temporal, mista ou uma distribuição de freqüências.
Exemplos de séries
Série específica (série simples):
Tabela: Freqüência e porcentagens dos 2.000 empregados da Companhia MB, segundo o grau de instrução.
	Grau de instrução
	Freqüência (ni)
	Porcentagem
	Fundamental
	650
	32,50
	Médio
	1.020
	51,00
	Superior
	330
	16,50
	Total
	2.000
	100,00
	Fonte: Dados hipotéticos
	
Série geográfica-específica (série composta ou mista):
Tabela: Opinião da população, por local de residência, sobre um projeto governamental
	
	Local de residência
	
Total
	Opinião
	Urbano
	Suburbano
	Rural
	A favor
	30
	35
	35
	100
	Contra
	60
	25
	15
	100
	Total
	90
	60
	50
	200
1.12 Representação gráfica
	Um gráfico é toda a forma de representação das séries estatísticas que seja baseada no desenho.
	O gráfico deve ser atraente para cumprir sua finalidade de mostrar resultados e bem construído para permitir a análise do fenômeno exposto. A fim de que isso aconteça, deve-se observar alguns aspectos básicos como: simplicidade, clareza e veracidade.
	Do mesmo modo que nas tabelas estatísticas, nos gráficos, deve-se considerar um título que informe a espécie, o lugar e o tempo do fenômeno representado, bem como a fonte de onde foram coletados os dados expostos.
Gráficos analíticos
		
			Pontos
					
			Linhas		
						 Simples
Classificação				 Barras Sobrepostas
dos gráficos				 	 Justapostas
analíticos
			Superfície		 Simples
					 Colunas Sobrepostas
						 Justapostas
Setores
Exemplos de gráficos
2 – Distribuições de Freqüências
	Uma distribuição de freqüência é uma tabela que reúne o conjunto de dados, conforme as freqüências ou as repetições de seus valores. Esta tabela pode representar os dados em classes ou não, de acordo com a classificação dos dados em discretos ou contínuos. 
1 Representação de variáveis 
1.1 Discretas
	Neste caso, representam-se as observações numa tabela de freqüências, não agrupadas em classes, designadas de séries de magnitude por ponto. É útil quando a série apresenta poucos valores distintos.
1.2 Contínuas
	Neste caso, utiliza-se também a tabela de freqüências, mas sob forma de intervalos, mesmo que isto sacrifique algum detalhe na ordenação de valores individuais. É útil quando a série apresenta muitos valores distintos.
2 Alguns conceitos básicos
2.1 Dados brutos
	São os valores originais conforme eles foram coletados, não estando ainda prontos para análise, pois não estão numericamente organizados ou tabelados.
2.2 Rol
	É uma lista, onde as observações são dispostas em uma determinada ordem: crescente ou decrescente. O objetivo da ordenação é tornar possível a visualização das variações ocorridas, uma vez que os valores extremos são percebidos de imediato, e também facilitar a construção da distribuição de freqüências.
 rol crescente
Xmín Xmáx
2.3 Amplitude total [Simbologia: H, At ou R]
	É a diferença entre o maior e o menor valor observado da variável em estudo: H = Xmáx - Xmín
2.4 Classe 
	É cada um dos grupos ou intervalos de valores em que se subdivide a amplitude total do conjunto de tamanho n.
	Para a determinação do número de classes, existem diversos métodos, dentre os quais destaca-se a regra de Sturges, que estabelece que o número de classes (k) é calculado por: k = 1 + 3,3 log n
O analista deverá ter em mente que a escolha do número de classes dependerá antes da natureza dos dados e da unidade de medida em que eles forem expressos, do que de regras muitas vezes arbitrárias e pouco flexíveis. Recomenda-se considerar 4 k 12.
2.5 Limites de classe
	São os dois valores extremos de cada classe.
	Limite inferior (Lf.): é o menor valor da classe considerada;
	Limite superior (Ls.): é o maior valor da classe considerada.
2.6 Amplitude de classe [Simbologia: h]
	É a diferença entre o limite superior e o limite inferior da classe, ou seja:
	h = Ls – Lf, quando a distribuição
de freqüências já existe; ou 
	h = H/k, para a determinação da amplitude das classes de uma distribuição de freqüências a ser construída.
2.7 Ponto médio de classe [Simbologia: Xi]
É a média aritmética dos limites da classe. É o valor representativo da classe: .
2.8 Tipos de freqüências
	Para construção de uma tabela de distribuição de freqüência é necessário conhecer alguns de seus termos:
Freqüência absoluta [Simbologia: fi]
É o número de observações que aparece em uma classe ou valor individual.
Freqüência relativa [Simbologia: fri]
É o quociente entre a freqüência absoluta e o número total de observações, sendo que:
		
onde: 0 < fr < 1; = 1.
Freqüência acumulada crescente [Simbologia: faci ou Fci]
É a soma de todas as freqüências anteriores com a freqüência do intervalo considerado.
		Exemplos de distribuições de freqüências
Por ponto:
	Valores
	Freqüências(fi)
	10
	7
	15
	12
	20
	14
	25
	8
	30
	10
	Total
	51
Por intervalo:
Preço, em R$, de certo produto
Classes
	Freqüências das classes
Preço (R$)
	fi
	6 ⊢ 8
	2
	
 8 ⊢ 10
	5
	
10 ⊢ 12
	10
	Limites inferiores
12 ⊢ 14
	6
	
14 ⊢ 16
	3
	16 ⊢ 18
	2
	Total
	25
				
Limites superiores
									?
2.10 Gráficos representativos de uma distribuição de freqüências em classes
Histograma
	É um gráfico de colunas justapostas, cujas alturas são proporcionais às freqüências absolutas e cujas bases correspondem ao intervalo de classe da distribuição. 
Polígono de freqüências
	É um gráfico de linha, cujos vértices são proporcionais às freqüências absolutas e correspondem aos pontos médios das classes da distribuição.
Ogiva
	É um gráfico de linha, cujos vértices são proporcionais às freqüências acumuladas e correspondem aos limites inferiores das classes da distribuição.
Exemplo 1: A tabela abaixo apresenta as vendas diárias de um determinado aparelho elétrico, durante um mês, por uma firma comercial. Construa uma distribuição de freqüência por pontos: 14 – 12 – 11 – 13 – 14 – 13 – 12 – 14 – 13 – 14 – 11 – 12 – 12 – 14 – 10 – 13 – 15 – 11 – 15 – 13 – 16 – 17 – 14 – 14.
Solução:
	N° de vendas
	fi
	fri
	Fci
	10
	1
	1
	0,042
	11
	3
	4
	0,125
	12
	4
	8
	0,167
	13
	5
	13
	0,208
	14
	7
	20
	0,292
	15
	2
	22
	0,083
	16
	1
	23
	0,042
	17
	1
	24
	0,042
	
	24
	
	1
O histograma e polígono de freqüência são dados por:
Assim como o gráfico das freqüências acumuladas (agivas):
Exemplo 2: Dado o rol de 50 notas (dadas em créditos), agrupar os elementos em classe e construir os gráficos: 33 – 35 – 35 – 39 – 41 – 41 – 42 – 45 – 47 – 48-50 – 52 – 53 – 54 – 55 – 55 – 57 – 59 - 60 – 60-61 – 64 – 65 – 65 – 65 – 66 – 66 – 66 – 67 – 68-69 – 71 – 73 – 73 – 74 – 74 – 76 – 77 – 77 – 78-80 – 81 – 84 – 85 – 85 – 88 – 89 – 91 – 94 – 97
Solução: Amplitude total (H) H= 97 – 33 = 64
Número de classes (k): k  1 + 3,3 log 50  1 + 3,3 (1,7)  7 classes
Amplitude de classe (h): h  64/7  10
A primeira classe inicia-se por 33. Assim, a distribuição de freqüência será:
	Classes
	fi
	fri
	Fci
	Xi
	33 ⊢ 43
	7
	0,14
	7
	38
	43 ⊢ 53
	5
	0,10
	12
	48
	53 ⊢ 63
	9
	0,18
	21
	58
	63 ⊢ 73
	11
	0,22
	32
	68
	73 ⊢ 83
	10
	0,20
	42
	78
	83 ⊢ 93
	6
	0,12
	48
	88
	93 ⊢103
	2
	0,04
	50
	98
	Total
	50
	1,00
	-
	–
O histograma e o polígono de freqüência para os dados estão a seguir:
Histograma
Polígono de freqüências
Assim como o gráfico das freqüências acumuladas (agiva):
3 – Medidas Descritivas
1 Introdução
A estatística descritiva visa descrever os dados disponíveis da forma mais completa possível sem, no entanto, se preocupar em tirar conclusões sobre um conjunto maior de dados (população). As medidas descritivas básicas mais importantes são as de posição e as de dispersão ou variabilidade.
Classificação das medidas descritivas:
Medidas descritivas 
2 Medidas de tendência central
Quando se trabalha com dados numéricos observa-se uma tendência destes de se agruparem em torno de um valor central. Isto indica que algum valor central é característica dos dados e que o mesmo pode ser usado para descrevê-los e representá-los.
As medidas de tendência central são: média, mediana e moda.
2.1 Média aritmética [Simbologia: ]
	É a mais utilizada das medidas de tendência central para descrever, resumidamente, um conjunto de dados.
Média aritmética para dados não-tabelados
A média aritmética consiste na soma de todas as observações Xi dividida pelo número "n" de observações do grupo.
		
Propriedades da média aritmética:
	A soma dos desvios em relação à média é nula; 
	A média de uma constante é igual à constante; 
	A média do produto de uma constante por uma variável é igual ao produto da constante pela média da variável; 
	A soma dos quadrados dos desvios em relação à média é um mínimo. 
   
Exemplo: Para os dados do Exemplo 1, determinar a média aritmética.
Média aritmética para dados tabelados
Se os dados estiverem agrupados em uma tabela de freqüências, pode-se obter a média aritmética da distribuição, calculando-se:
onde: Xi = ponto médio da classe i;
fi = a freqüência absoluta da classe i.
Exemplo: Para os dados do Exemplo 1 e 2, determinar a média aritmética
.
No exemplo 1: 
No exemplo 2: 
2.2 Mediana [Simbologia: Md ou ]
A mediana divide em duas partes o conjunto das observações ordenadas. Colocando-se os valores em ordem crescente ou decrescente, a mediana é o elemento que ocupa o valor central.
50% Md 50%
 rol crescente
Xmín Xmáx
Mediana para dados não-tabelados
Procedimento no caso de dados brutos:
	Colocam-se os dados em ordem (rol);
	Se o número de elementos "n" for ímpar, a mediana será o elemento central que ocupa a posição do rol;
	Exemplo: Determinar a mediana para os dados do Exemplo 1.
Se "n" for par, a mediana será a média aritmética entre os dois elementos centrais que ocupam as posições e do rol.
Primeiro se faz o rol: 10 – 11 – 11 – 11 – 12 – 12 – 12 – 12 – 13 – 13 – 13 – 13 – 13 – 14 – 14 – 14 – 14 – 14 – 14 – 14 – 15 – 15 – 16 – 17.
Como n = n° par, encontra-se os termo n/2 e n/2 + 1.
 
Os números que ocupam as posições 12° e 13° são os mesmos, então Md = 13.
Mediana para dados tabelados
Procedimento no caso de distribuição por ponto:
	Calcula-se a posição da mediana: PMd = (n par) ou PMd = (n ímpar);
onde:	n=fi = número total de observações;
	PMd = posição da mediana.
	Se “n” é ímpar, a mediana será o valor de Xi correspondente à primeira Fci  PMd;
	Se “n” é par, a mediana será o valor de Xi correspondente à primeira Fci > PMd. Caso Fci = PMd, será a média entre o valor de Xi correspondente a esta Faci e o próximo valor de Xi.
Exemplo: Determinar a mediana para os dados do Exemplo 1.
Solução: Calcula-se PMd, como n = n° par, obtém-se o termo n/2; 
Como a 1ª Fci maior que 12 é 13, a mediana será o Xi correspondente a essa Fci, logo Md = 13.
Procedimento no caso de distribuição por classe:
	Calcula-se a posição da mediana: PMd = ;
	A mediana estará localizada na classe onde, pela primeira vez, Fci  PMd;
	Para encontrar o valor da mediana aplica-se a seguinte fórmula:
	
	onde:
	Li = limite inferior da classe que contém a mediana;
	
	
	Fci = freqüência acumulada da classe anterior à classe que contém a mediana;
	
	h = amplitude da classe que contém a mediana;
	
	fMd = freqüência da classe que contém a mediana.
Exemplo: Determinar a mediana para os dados do Exemplo 2.
Solução: Primeiro se acha em qual classe esta o termo PMd. 
O 25° termo se encontra na 4ª classe, assim
2.3 Moda [Simbologia: Mo ou ]
A moda de um grupo de observações é definida como a medida de freqüência máxima ou é (são) o(s) valor(es) que se repete(m) mais vezes. Pode ser utilizada para dados
qualitativos. 
Moda para dados não-tabelados
A moda será o valor mais freqüente no conjunto de dados, podendo, este mesmo conjunto, possuir mais de uma moda (bimodal ou plurimodal), ou ainda, não apresentar moda (amodal).
Exemplo: Ache as modas dos seguintes conjuntos de dados. a) 5,40 1,10 0,42 0,73 0,48 1,10 b) 27 27 27 55 55 55 88 88 99 c) 1 2 3 6 7 8 9 10
Solução:
	O número 1,10 é a moda porque é o valor que ocorre mais freqüentemente.
	Os números 27 e 55 são ambos, modas porque ocorrem com a mesma maior freqüência. Esse conjunto de dados é bimodal porque tem duas modas.
	Não há moda, porque nenhum valor se repete.
Moda para dados tabelados
Quando a distribuição é por ponto, a determinação da moda é imediata pela simples inspeção da tabela, já que a Mo é o valor de freqüência máxima.
Quando a distribuição de freqüências é por intervalo, pode-se calcular a moda bruta que é o ponto médio da classe de maior freqüência (método rudimentar).
Exemplo: Determinar a moda para os dados do Exemplo 1 e 2.
Solução:
No exemplo 1, a moda é o elemento com a maior freqüência, o 14.
No exemplo 2, a moda é o valor de Xi da classe onde ocorre a maior freqüência, neste caso o 68.
Observações importantes:
Não há regra fixa para se escolher entre a média, a mediana e a moda. Entretanto algumas observações podem ser feitas quanto à utilização das mesmas. 
	A média aritmética é a medida de tendência central mais utilizada, principalmente quando não há valores aberrantes (muito extremos) no conjunto de dados, sendo a medida mais conveniente para cálculos posteriores;
	A mediana deve ser usada, sempre que possível, como medida representativa de distribuições fortemente assimétricas, ou seja, quando os valores extremos do conjunto são muito distantes dos outros, pois o seu valor não é afetado por estes valores;
	A moda é usada quando há interesse em saber o ponto de concentração do conjunto ou o tipo de distribuição que se está analisando, sendo que o seu valor, em se tratando de dados agrupados, é fortemente afetado pela maneira como as classes são constituídas.
3 Separatrizes
São valores de posição, que dividem o rol. As principais medidas separatrizes são: mediana, quartis, decis e centis ou percentis.
3.1 Quartis [Simbologia: Qi]
Os quartis dividem um conjunto de dados em quatro partes iguais. Assim:
0% 25% 50% 75% 100%
|--------------------|--------------------|--------------------|--------------------|
Q1 Q2 =Md Q3
onde:	Q1 = primeiro quartil e separa os primeiros 25% dos 75% restantes;
Q2 = segundo quartil ou mediana e separa o conjunto de dados em 2 partes iguais;
Q3 = terceiro quartil e separa os primeiros 75% dos 25% restantes.
Quartis para dados não-tabelados
Procedimento no caso de dados brutos:
	Colocam-se os dados em ordem (rol);
	Calcula-se a posição do quartil através da fórmula: PQi = i .;
	O quartil será o valor que ocupa, no rol, a posição calculada anteriormente.
Exemplo: Determinar Q1 e Q3 para os dados do Exemplo 1. 
Solução:
Calcula-se a posição do elemento.
O 6° e 18° elementos são Q1 12 e Q3 14 respectivamente.
Quartis para dados tabelados
Procedimento no caso de distribuição por ponto:
	Calcula-se a posição do quartil PQi = i .= i .;
	O quartil será o valor de Xi correspondente à primeira Fci  PQi.
Exemplo: Determinar Q1 e Q3 para os dados do Exemplo 1.
Calcula-se a posição do elemento.
O 6° e 18° elementos são Q1 12 e Q3 14 respectivamente.
Procedimento no caso de distribuição por classe:
	Calcula-se a posição do quartil PQi = i . = i .;
	O quartil estará localizado na classe onde, pela primeira vez, Fci  PQi;
	Para encontrar o valor do quartil aplica-se a seguinte fórmula:
	
	onde:
	Li. = limite inferior da classe que contém o respectivo quartil;
	
	
	Fci = freqüência acumulada da classe anterior à classe que contém o quartil;
	
	h = amplitude da classe que contém o quartil;
	
	
	fQi = freqüência da classe que contém o quartil.
Exemplo: Determinar Q1 e Q3 para os dados do Exemplo 2.
Solução:
No exemplo 2, calcula-se a posição do elemento.
Após verifica-se a classe onde se encontra cada posição. O Q1 encontra-se na 3ª classe e o Q3 encontra-se na 5ªclasse. Assim:
 
3.2 Decis [Simbologia: Di]
São valores que dividem o conjunto das observações em 10 (dez) partes iguais. Para encontrar o valor do decil desejado, procede-se como no caso dos quartis, sendo que para o cálculo da posição do decil, a fórmula será:
PDi = i .= i .
Para encontrar o valor do decil quando os dados estão agrupados em classe, a fórmula será:
3.3 Percentis [Simbologia: Pi]
São valores que dividem o conjunto das observações em 100 partes iguais. Para encontrar o valor do percentil desejado, procede-se como no caso dos quartis, sendo que para o cálculo da posição do percentil, a fórmula será:
		Ppi = i .= i .
Para encontrar o valor do percentil quando os dados estão agrupados em classe, a fórmula será:
4 Medidas de dispersão
As medidas de dispersão visam descrever os dados no sentido de informar o grau de dispersão ou afastamento dos valores observados em torno de um valor central. Elas indicam se um conjunto é homogêneo (pouca ou nenhuma variabilidade) ou heterogêneo (muita variabilidade).
A descrição do conjunto de dados é mais completa quando se considera além de uma medida de tendência central, uma medida de dispersão ou variação, porque é comum encontrar-se séries que, apesar de apresentarem a mesma média, são compostas de maneiras diferentes, o que mostra que as medidas de tendência central são insuficientes para descrever adequadamente uma série estatística.
Algumas medidas de variação são: a amplitude de variação, o desvio médio, a soma de quadrados, a variância, o desvio padrão e o coeficiente de variação.
Classificação das medidas de dispersão:
4.1 Amplitude de variação [Simbologia: H]
É a diferença entre o maior e o menor valor do conjunto, sendo a mais simples das medidas de dispersão, porém de grande instabilidade, porque considera somente os valores extremos do conjunto. Também é chamada de desvio extremo.
H = Xmáx. - Xmín.
Exemplo: Determinar H para os dados do Exemplo 1 e 2.
Solução: Para o exemplo 1: = 17 – 10 = 7
Para o exemplo 2: = 98 – 38 = 60
4.2 Desvio médio [Simbologia: Dm]
É a média aritmética dos valores absolutos dos desvios tomados em relação à média ou à mediana. Considera-se o módulo de cada desvio, , evitando-se, com isso, que . 
Desvio médio para dados não tabelados
 
Desvio médio para dados tabelados
O desvio médio é preferido em relação ao desvio padrão, quando esse for indevidamente influenciado pelos desvios extremos.
Exemplo: Determinar Dm para os dados do Exemplo 1 e 2.
Solução: Para o exemplo 1: 
Para o exemplo 2; 
4.3 Soma de quadrados [Simbologia: SQ]
A soma de quadrados refere-se a soma dos quadrados dos desvios em relação à média:
 
4.4 Variância [Simbologia ]
A variância populacional (2) é a soma de quadrados dividida pelo número de observações N:
Quando a variância é calculada a partir de uma amostra para fins de estimação, o denominador passa a ser (n - 1), o que nos fornece uma estimativa imparcial da variância populacional.
Variância para dados não-tabelados
 = 
O denominador (n - 1) é denominado de "graus de liberdade" dessa estimativa.
Exemplo: Determinar a variância para os dados do Exemplo 1.
Solução: 
Propriedades da variância
	A variância de uma constante é zero;
s2(k) = 0
	A variância da soma ou diferença de uma constante k com uma variável é igual a variância da variável;
s2(k + X) = s2(X)
	A variância da soma de variáveis independentes é igual a soma das variâncias das variáveis;
s2(X + Y) = s2(X) + s2(Y) 
	A variância do produto de uma constante por uma variável é igual ao produto do quadrado da constante pela variância da variável.
s2(k.X) = k2.
Variância para dados
tabelados
s2 = 	 ou 	s2 = 
Exemplo: Determinar a variância para os dados do Exemplo 1 e 2.
Solução: No exemplo 1,
No exemplo 2, 
4.5 Desvio padrão [Simbologia ]
O desvio padrão é uma das medidas mais úteis da variação de um grupo de dados. A vantagem do desvio padrão sobre a variância, é que este permite uma interpretação direta da variação do grupo, pois o mesmo é expresso na mesma unidade em que estão expressas as medidas observadas.
O desvio padrão é a raiz quadrada da variância, então, é calculado por: .
Exemplo: Determinar o desvio padrão amostral para os dados do Exemplo 1 e 2.
Para os dados de medição, especialmente em grandes amostras (n  30), verifica-se que, cerca de 68% das observações estarão entre ; 95% das observações estarão entre e praticamente 100% entre .
Solução: No exemplo 1, .
No exemplo 2, .
4.6 Coeficiente de variação [Simbologia: CV ou CV%]
O coeficiente de variação é uma medida de dispersão relativa, utilizada quando se deseja comparar a variação de conjuntos de dados que apresentem diferentes unidades de medição e ou tamanhos diferentes, pois o coeficiente de variação independe da unidade de medida dos dados. O coeficiente de variação pode também ser expresso como percentagem da média.
 	ou	
Exemplo: Determinar o CV para os dados do Exemplo 1 e 2.
Solução: No exemplo 1, 
No exemplo 2, 
5 Assimetria e curtose
As medidas de assimetria e curtose complementam as medidas de posição e de dispersão no sentido de proporcionar uma descrição e compreensão mais completa das distribuições de freqüências. Estas distribuições não diferem apenas quanto ao valor médio e à variabilidade, mas também quanto a sua forma (assimetria e curtose).
5.1 Assimetria
Assimetria é o grau de desvio, afastamento da simetria ou grau de deformação de uma distribuição de freqüências. Se a curva de freqüências de uma distribuição tem uma "cauda" mais longa à direita da ordenada máxima do que à esquerda, diz-se que a distribuição é desviada para a direita ou que ela tem assimetria positiva. Se ocorrer o inverso, diz-se que ela é desviada para a esquerda ou tem assimetria negativa. 
Os coeficientes de assimetria servem para medir o “grau” de deformação da distribuição.
Coeficiente de assimetria de Pearson [Simbologia: C.A.]
Intensidade da assimetria:
	 < 0,2: simetria;
	0,2 < < 1,0: assimetria fraca;
	 > 1,0: assimetria forte.
Interpretação:
	Coeficiente negativo: distribuição assimétrica negativa (à esquerda), sendo < Md < Mo;
	Coeficiente nulo: distribuição simétrica, sendo = Md = Mo;
	Coeficiente positivo: distribuição assimétrica positiva (à direita), sendo > Md > Mo.
Exemplo: Determinar a assimetria para os dados do Exemplo 1 e 2. 
Solução: No exemplo 1: ; . Os dados apresentam assimetria fraca.
No exemplo 2: ; ; Os dados apresentam simetria.
5.2 Curtose
É o grau de achatamento (afilamento) de uma curva em relação à curva normal, tomada como padrão. 
Uma distribuição pode ser classificada quanto à curtose, como segue:
	Platicúrtica: a curva é mais achatada do que a normal ( ou s grandes);
	Mesocúrtica: a curva é normal ( ou s intermediários);
	Leptocúrtica: a curva é mais alta do que a normal ( ou s pequenos).
Para medir o grau de curtose de uma distribuição, podem-se usar dois tipos de medidas:
Coeficiente centílico de curtose [Simbologia: K]
	
	onde:
	Q1 = o primeiro quartil;
	
	Q3 = o terceiro quartil;
	
	D1 = o primeiro decil;
	
	D9 = o nono decil.
Interpretação:
	K < 0,263 curva leptocúrtica;
	K = 0,263 curva mesocúrtica;
	K > 0,263 curva platicúrtica.
Exemplo: Determinar a curtose para os dados do Exemplo 1 e 2
. 
Solução: No exemplo 1, primeiro se encontra o D1 e D9;
PD1 = 1. = 2,4 ou seja, o D1 = 11;
PD9 = 9. = 21,6 ou seja, o D9 = 15;
Após calcula-se o coeficiente centílico de curtose
, então a curva é leptocúrtica.
No exemplo 2, primeiro se encontra o D9 e D1;
PD1 = 1 . = 5 ou seja, 
PD9 = 9 . = 45 ou seja, 
Após calcula-se o coeficiente centílico de curtose:
, então a curva é leptocúrtica.
4 – Probabilidade
1 Introdução
O trabalho estatístico se desenvolve a partir da observação de determinados fenômenos e emprega dados numéricos relacionados aos mesmos, para tirar conclusões que permitam conhecê-los e explicá-los a ponto de poder, com determinado grau de crença, obter o desenvolvimento teórico do fenômeno. Para tanto é necessário que se formule um modelo que ajude a melhor elucidá-lo.
No campo da estatística, os modelos matemáticos utilizados são denominados, modelos não-determinísticos ou probabilísticos, ou seja, que avaliam com que probabilidade os resultados podem ocorrer.
2 Noções de experimento, espaço amostral e eventos
2.1 Experimento aleatório [Simbologia: E]
É uma das realizações do fenômeno sob observação. Se o fenômeno seguir um modelo não-determinístico, tem-se um experimento aleatório, com as seguintes características:
	O experimento pode ser repetido;
	Embora não seja possível afirmar que resultado em particular ocorrerá, é possível descrever o conjunto de todos os resultados possíveis do experimento;
	À medida que aumenta o número de repetições aparece uma certa regularidade que torna possível a construção de um modelo matemático.
2.2 Espaço amostral [Simbologia: S]
É o conjunto de todos os possíveis resultados de um experimento aleatório. 
	Evento [Simbologia: A, B, C, ...]
É qualquer subconjunto do espaço amostral de um experimento.
Tipos de eventos:
	Eventos mutuamente exclusivos: dois eventos A e B são denominados mutuamente exclusivos, se eles não puderem ocorrer juntos, isto é, AB = ;
	Eventos complementares: são os eventos que se completam em relação ao espaço amostral, isto é, A= S, onde é o evento complementar de A;
	Eventos impossíveis: são eventos que não possuem elementos no espaço amostral, isto é, A =  e P(A) = 0;
	Eventos certos: são eventos que possuem todos os elementos do espaço amostral, isto é, A = S e P(A) = 1;
	Eventos independentes: são eventos que podem ocorrer simultaneamente, isto é, AB  e P(AB) = P(A) . P(B)
	Eventos dependentes: são eventos em que a ocorrência de um deles está condicionada à ocorrência de outro, acontece um evento se o outro já ocorreu, isto é, AB  e P(AB) = P(A) . P(B/A), com P(A) 0.
3 Álgebra de eventos
Podem-se combinar os eventos da mesma maneira que se faz com os conjuntos:
	Se A e B forem dois eventos, A  B significa que A e B ocorrem;
	Se A e B forem dois eventos, A  B significa que A ou B ocorrem
Exemplo: Lance um dado e uma moeda. 
	Construa o espaço amostral
	Enumere os seguintes eventos
A = {coroa, marcado por número par}
B = {cara, marcado por número ímpar}
C = {múltiplos de 3}
	Expresse os eventos
	 
	A ou B ocorrem
	B e C ocorrem
	
	Verifique dois a dois os eventos A, B e C e diga quais são mutuamente exclusivos.
Solução: C = coroa, K = cara:
	S = {(1,C);(2,C);(3,C);(4,C);(5,C);(6,C);(1,K);(2,K);(3,K);(4,K);(5,K);(6,K)};
	A = {(2,C);(4,C);(6,C)};
B = {(1,K);(3,K);(5,K)};
C = {(3,C);(6,C);(3,K);(6,K)}.
	
	= {(1,C);(2,C);(3,C);(4,C);(5,C);(6,C);(2,K);(4,K);(6,K)};
	A  B = {(2,C);(4,C);(6,C);(1,K);(3,K);(5,K)};
	B  C = {(3,K)};
	= {(1,C);(3,C);(5,C);(2,K);(4,K);(6,K)}.
	A  B = , são mutuamente exclusivos;
A  C = {(6,C)}, não são mutuamente exclusivos;
B  C = {(3,K)}, não são mutuamente exclusivos.
4 Conceitos de probabilidade
Interpretação como freqüência relativa, definição clássica e definição axiomática.
O problema fundamental da probabilidade consiste em: “atribuir um número a cada evento A, o qual avaliará as chances de ocorrência de A quando o experimento for realizado”.
4.1 Conceito empírico
É uma interpretação da probabilidade como freqüência relativa.
Repetindo-se um experimento E um grande número de vezes e calculando-se a freqüência relativa do evento A,
obtém-se um número "p" que pode ser tomado como a probabilidade da ocorrência de A, que nesse caso, poderia ser tomada como:
P(A) = 
4.2 Definição clássica de probabilidade
É válida para espaços amostrais finitos e equiprováveis.
Se todos os resultados de um espaço amostral finito forem igualmente prováveis, ou seja, admitindo-se que S possa ser escrito sob a forma S = {a1, a2, .... , ak}, então, a cada evento formado por um resultado simples (ai) associa-se um número "pi", denominado probabilidade de A, que satisfaça as seguintes condições:
	pi  0;
	P(S) = p1 + p2 + .... + pk = ;
	 , já que todos os resultados são igualmente prováveis.
Disto decorre que, para qualquer evento A constituído de r resultados simples, tem-se:
P(A) = r . 1/k = , sendo que:
P(A) = = r / k
Pela definição clássica de probabilidade devida a Laplace: seja E um experimento aleatório que dá origem a k resultados mutuamente excludentes e igualmente possíveis. Seja A um evento constituído por r resultados de E. A probabilidade de ocorrer o evento A é definida como sendo a razão r/k”.
4.3 Definição axiomática
Seja E um experimento e S um espaço amostral associado a E. A cada evento A associa-se um número real representado por P(A) e denominado probabilidade de A, que satisfaça aos seguintes axiomas:
	0  P(A)  1;
	P(S) = 1;
	Se A e B forem eventos mutuamente excludentes, então: P(A  B) = P(A) + P(B);
	Se A1, A2, ... , An,... forem dois a dois eventos mutuamente excludentes, então:
Exemplo: Um lote é formado por 10 peças boas, 4 com defeitos leves e duas com defeitos graves. Uma peça é escolhida ao acaso. Calcule a probabilidade de que: a) ela não tenha defeitos graves; b) ela não tenha defeitos; c) ela seja boa ou tenha defeitos graves.
P(Ai) = P(A1) + P(A2) + ... + P(An) + ...
Solução: Adotando dl = peça com defeito leve; b = peça boa; dg = peça com defeito grave:
	P() = P(dl  b) = P(dl) + P(b) = 10/16 + 4/16 = 14/16; b) P(b) = 10/16; c) P(b  dg) = 10/16 + 2/16 = 12/16.
Teoremas fundamentais:
Teorema 1: se  for um evento (conjunto) vazio, então: P() = 0;
Teorema 2: se for um evento complementar de A, então: P() = 1 - P(A);
Teorema 3: se A e B forem eventos quaisquer, então: P(A  B) = P(A) + P(B) - P(A  B);
Teorema 4: se A e B forem eventos de um espaço amostral S e se A  B, então: P(A)  P (B).
Exemplo: A probabilidade de uma mulher estar viva daqui a 30 anos é 3/4 e de seu marido é 3/5. Calcular a probabilidade de: a) apenas o homem estar vivo; b) somente a mulher estar viva; c) pelo menos um estar vivo; d) ambos estarem vivos.
Solução: Adotando os eventos: M = a mulher estar viva daqui há 30 anos; H = o homem estar vivo daqui há 30 anos. a P(  H) = P() x P(H) = 1/4 x 3/5 = 3/20; b) P(M  ) = P(M) x P() = 3/4 x 2/5 = 6/20; c) P(H  M) = P(H) + P(H) – P(H  M) = 3/5 + 3/4 - 3/5 x 3/4 = 18/20.
5 Probabilidade condicionada
Seja A e B dois eventos associados a um experimento E. Denota-se por P(B/A), a probabilidade do evento B, condicionada a ocorrência do evento A.
Sempre que se calcula a P(B/A), se está, essencialmente, calculando P(B) em relação ao espaço reduzido A e utiliza-se a seguinte fórmula, onde P(A)  0:
P(B/A) = com P(A)  0, pois A já ocorreu.
Pode-se escrever também, através do teorema do produto:
P(AB) = P(A/B) . P(B) e P(BA) = P(B/A) . P(A)
Que representa uma alternativa para o cálculo da probabilidade da interseção de dois eventos.
Exemplo: Uma urna contém cinco bolas pretas, três vermelhas e duas brancas. Foram extraídas 3 bolas sem reposição. Qual a probabilidade de terem sido duas bolas pretas e uma vermelha?
Solução: Sendo os eventos: P = bolas pretas, V = bolas vermelhas e B = bolas brancas;
P(P  P  V) + P(P  V  P) + P(V  P  P) = 
6 Independência estatística
Se a ocorrência ou não do evento A, não afetar a probabilidade de ocorrência do evento B e vice-versa, diz-se que A e B são independentes.
É compreensível que os eventos A e B sejam inteiramente não relacionados. Saber que B ocorreu não fornece qualquer informação sobre a ocorrência de A. De fato, o cálculo seguinte mostra isso:
Se A e B forem independentes, pode-se escrever:
P(A/B) = P(A)		e	P(B/A) = P(B)
Nesse caso, usando-se a expressão anterior para P(AB), tem-se:
P(AB) = P(A/B) . P(B) = P(A) . P(B)
P(AB) = P(B/A) . P(A) = P(A) . P(B)
Chegando-se à condição de independência, na qual A e B serão eventos independentes se e somente se:
P(AB) = P(A) . P(B)
Exemplo: As probabilidades de 3 jogadores marcarem um penalty são respectivamente 2/3 , 4/5 e 7/10.
Se cada um “cobrar” uma única vez, qual a probabilidade de: a) todos acertarem; b) apenas uma certar; c) todos errarem.
Solução: Considerando A o jogador 1 acertar, B o jogador 2 acertar e C o jogador 3 acertar, temos:
	P(A  B  C) = 
	P(A) + P(B ) + P(C) = 
	P() = 
7 Teorema de Bayes
P(B1/A) = ,
onde:	P(A) = P(A/B1) . P(B1) + P(A/B2) . P(B2) + ... + P(A/Bk) . P(Bk) = probabilidade total
P(B1/A) = 
P(B1/A) = 
Generalizando-se essa aplicação para Bi:
onde:	 P(Bi) = probabilidades à priori (conhecidas);
	P(A/ Bi) = probabilidades condicionais (conhecidas);
	P(Bi/A) = probabilidades à posteriori.
Esse resultado é conhecido como teorema de Bayes. É também denominada fórmula da probabilidade das causas ou dos antecedentes. Desde que os Bi`s constituam uma partição do espaço amostral, um e somente um, dos eventos Bi ocorrerá. Portanto, a expressão acima nos dá a probabilidade de um particular Bi dado que o evento A tenha ocorrido. A fim de aplicar esse teorema, deve-se conhecer os valores dos Bi`s, sendo que, se esses valores são desconhecidos, fica impossibilitada a sua aplicação.
Exemplo: Três máquinas, A, B e C produzem respectivamente 0,4, 0,5 e 0,1 do total de peças de uma fábrica. As porcentagens de peças defeituosas nas respectivas máquinas são de 3/100, 5/100 e 2/100. Uma peça é sorteada ao acaso e verifica-se que é defeituosa. Qual a probabilidade de que a peça tenha vindo da máquina B?
Solução: P(A) = 0,4; P(B) = 0,5; P(C) = 0,1;
P(def/A) = ; P(def/B) = ; P(def/C) = ;
Deseja se calcular P(B/def):
	Resumo das propriedades do cálculo de probabilidades
5 – Variáveis Aleatórias
1 Noções sobre variáveis aleatórias
Ao descrever o espaço amostral de um experimento, nem sempre o resultado individual será um número, embora, muitas vezes haja interesse na mensuração de alguma característica e no seu registro numérico. 
Para que seja possível a utilização dos recursos da estatística descritiva, é necessária uma função, que transforme o espaço amostral não-numérico em um espaço amostral numérico. Sendo assim, considerando-se E um experimento e S o espaço amostral associado ao experimento, a função X, que associa a cada elemento s  S, um número real, X(s) é denominada variável aleatória.
Desse modo, tem-se uma função definida no espaço amostral, chamada de variável aleatória.
2 Variáveis aleatórias discretas [Simbologia: VAD]
Seja X uma variável aleatória. Se o número de valores possíveis de X, Rx (contra-domínio de X) for finito ou infinito numerável (números naturais ou inteiros), denomina-se X de variável aleatória discreta.
As variáveis aleatórias discretas surgem, em geral, de medidas de enumeração ou contagem, como por exemplo, número de pontos obtidos em um teste, número de insetos por planta, número de peças boas, número de pessoas que votam, número de erros em contas, etc.
S = { s1, s2, ... , sn } RX
2.1 Função de probabilidade [Simbologia: f(X)]
É a probabilidade de que a variável aleatória assuma o valor x. Se X é uma variável aleatória, a cada possível valor xi de X (x1, x2, x3, ....), associa-se um número p(xi) = P(X = xi), ou ainda, P(X=x1), P(X=x2), P(X= x3), denominado probabilidade de xi. A função que associa probabilidades não-nulas aos possíveis valores da variável aleatória e zero aos demais valores é denominada função de probabilidade.
	X
	x1
	x2
	x3
...
	xn
	P(X)
	p(x1 )
	p(x2)
	p(x3)
	...
	p(xn )
Os números p(xi) devem satisfazer as seguintes condições: p(xi) > 0,  i;  p(xi) = 1.
Representação gráfica: gráfico de bastões
2.2 Valor esperado ou média de uma variável aleatória discreta [Simbologia: E(X) ou (X)]
Se X é uma VAD, define-se valor esperado de X, como: E(X) = 
2.3 Variância de uma variável aleatória discreta [Simbologia: V(X) ou 2]
Se X é uma VAD, define-se a variância de X, como:
V(X) = = onde: E(X2) = 
Exemplo: Para o lançamento de duas moedas determine a distribuição de probabilidades do número de caras e após encontre a E(X) e V(X).
Solução: Fazendo C= cara e K = coroa e sendo x igual ao número de caras obtidas, tem-se: 
S = {(C,C);(C,K);(K,C);(K,K)}
Associando: x = 0 – nenhuma cara; x = 1 – uma cara; e x = 2 – duas caras; tem-se:
	x
	0
	1
	2
	→
	x
	0
	1
	2
	p(x)
	1/4
	2/4
	1/4
	p(x)
	1/4
	1/2
	1/4
Graficamente
E(X) = = cara
V(X) = = cara2
3 Variáveis aleatórias contínuas [Simbologia: VAC]
Seja X uma variável aleatória. Suponha que Rx (contradomínio de X), seja um intervalo ou uma coleção de intervalos. Neste caso, diz-se que X é uma variável aleatória contínua.
As variáveis aleatórias contínuas, geralmente, surgem de dados de medições, como por exemplo, comprimento, peso, altura, temperatura, etc..
3.1 Função densidade de probabilidade [Simbologia: f(X)]
Seja X uma VAC, a função densidade de probabilidade f(x), é uma função que satisfaz as condições:
	f(x)  0,  x  Rx;
	= 1.
Além disso, para qualquer c < d em RX: P(c < X <d) = .
Comentários:
P (c < X < d) representa a área sob a curva da função, f(x) entre X = c e X = d;
P(X = k) = ;
P(c < X < d) = P (c  X  d) = P (c < X  d) = P (c  X < d).
3.2 Valor esperado ou média de uma variável aleatória contínua [Simbologia: E(X) ou (X)]
Se X é uma VAC, o valor esperado de X é definido por:
E(X) = 
3.3 Variância de uma variável aleatória contínua [Simbologia: V(X) ou 2]
Se X é uma VAC, define-se a variância de X, como:
Exemplo: Seja Pede-se: a) encontrar K; b) encontrar P(1≤ x ≤ 2); c) determinar E(X) e V(X);
V(X) = onde: E(X2) = 
Solução: 
a) ;
b) ===
c) E(X) = == == 1,875
V(X) = = - 1,8752 = - 3,515625 = 4,125 – 3,515625 = 0,609375.
4 Modelos probabilísticos para variáveis aleatórias
Os valores possíveis de uma variável aleatória e suas respectivas probabilidades determinam a distribuição de probabilidade da variável aleatória. Algumas, por apresentarem características semelhantes, nos permitem estabelecer um modelo teórico para determinar a solução de certos problemas. Para variáveis aleatórias discretas, os modelos estudados serão: Binomial e Poisson.
4.1 Distribuição binomial
A distribuição binomial tem as seguintes características:
	São realizadas n repetições independentes e do mesmo tipo do experimento E (n ensaios de Bernoulli);
	Cada repetição do experimento E admite apenas 2 resultados: sucesso ou fracasso;
	A probabilidade de sucesso em cada repetição do experimento é sempre igual a p.
Assim, considerando “n” tentativas independentes de um mesmo experimento aleatório, uma particular amostra aleatória conterá k sucessos e (n-k) fracassos, com probabilidades associadas p e q, respectivamente. A probabilidade total será dada por p + q =1.
Como qualquer seqüência com k sucessos e (n-k) fracassos terá a mesma probabilidade de ocorrência, resta-nos saber quantas se pode formar. Para isto calcula-se , que é o número de seqüências possíveis que podem ocorrer.
Definição: A variável aleatória discreta X tem comportamento binomial com “n” repetições de E e probabilidade de sucesso p, cuja função de probabilidade é dada por: 
	
	onde:
	
	
	
	
	k = 0, 1, 2, ..., n;
	
	
	k = 1 . 2 . 3 . ... . k.
A esperança e a variância são dadas por: E(X) = n.p e VAR(X) = n.p.q
Exemplo: Uma moeda não viciada é lançada 8 vezes. Encontre a probabilidade de: a) dar 5 caras; b) pelo menos uma cara; c) no máximo 2 caras.
Notação: X ~ b(n, p)
Solução: Sabe-se que: n = 8, p = 1/2 e q = 1/2. Y = número de caras (sucesso).
	; b) 
c) 
4.2 Distribuição de Poisson
Esta distribuição é muito usada quando se deseja contar o número de eventos de um certo tipo, que ocorrem em um intervalo de tempo, superfície ou volume, como por exemplo: número de falhas em um computador em certo dia; número de chamadas telefônicas durante meio dia; número de relatórios de acidentes enviados a uma seguradora em uma semana, etc..
Sua aplicação aparece freqüentemente em problemas de fila de espera, controle de estoques, controle de qualidade, programação de equipamentos, etc.. O modelo foi desenvolvido pelo matemático francês Poisson.
Definição: A variável aleatória X tem distribuição de Poisson, com parâmetro  > 0, se:
	
	onde:
	 é o número médio de eventos ocorridos no intervalo considerado;
	
	k = 0, 1, 2, 3, .......;
	
	e  2,7183;
	
	k = 1 . 2 . 3 . ... . k.
A esperança e a variância são dadas por: E(X) =  e VAR(X) = 
Notação: X ~ P()
A distribuição binomial pode ser aproximada para a Poisson, com  = n . p, da seguinte forma: quando o tamanho da amostra n é bastante grande (n ) e a probabilidade p é pequena (p  0). Na prática, quando n > 30 e p < 0,05.
A seguir, são apresentados alguns modelos para variáveis aleatórias contínuas.
Exemplo: Em média há 2 chamadas por hora num certo telefone. Calcular a probabilidade de se receber no máximo 3 chamadas em 2 horas e a probabilidade de nenhuma chamada em 90 minutos.
Solução: λ = 2 chamadas/hora.
a) P(X ≤ 3(2h)) = P(X = 0(2h)) + P(X = 1(2h)) + P(X = 2(2h)) + P(X = 3(2h)) =
= = 0,0183 + 0,0732 + 0,1464 + 0,1953 = 0,433.
b) P(X=0(1,5h)) = = 0,0498.
4.3 Distribuição normal
A distribuição normal também é conhecida como distribuição de Gauss. É um dos mais importantes modelos de probabilidade para variáveis aleatórias contínuas, sendo aplicado em inúmeros fenômenos e muito utilizado no desenvolvimento teórico em na área de inferência estatística.
Definição: A variável aleatória contínua X tem distribuição normal, se a função densidade de probabilidade for:
	, 
	onde:
	 = média populacional;
	
	2 = variância populacional.
A esperança ou média e a variância são os parâmetros da distribuição normal, dados por: E(X) =  e VAR(X) = 2.
Notação: X ~ N (, 2)
A distribuição normal tem as seguintes características:
	A curva da distribuição tem forma de sino e é simétrica em relação à média ;
	Na medida em que os pontos se afastam da média , a curva torna-se assintótica, ou seja, ela se aproxima bastante do eixo horizontal, mas não chega a tocá-lo;
	A área total sobre a curva é 1, devido ao fato da mesma ser uma função densidade de probabilidade;
	O ponto máximo da função corresponde à média .
Para calcular uma probabilidade associada à distribuição normal faz-se:
P (a < X < b) = dx 
Para evitar o uso de integrais, os principais valores das probabilidades podem ser encontrados numa tabela da curva normal, construída através de uma padronização.
Esta padronização transforma qualquer valor da variável X numa escala Z, sendo que Z representa número de desvios padrões de afastamento em relação à média.
A fórmula para a padronização de X em Z é: sendo que os valores de Z e suas respectivas áreas de probabilidade estão tabelados.
Exemplo: Um teste padronizado de escolaridade tem distribuição normal com média 100 e desvio padrão 10. Determine a probabilidade de um indivíduo submetido ao teste ter nota: a) maior que 120; b) maior que 80; c) entre 85 e 115; d) maior que 100; e) entre 110 e 120; f) menor que 75 e g) igual a 90.
Solução: a) P(X > 120) = P (Z > Z1) = P(Z > 2) = 0,5 – 0,4772 = 0,0228.
	 P(X > 80) = P (Z > Z1) = P(Z > -2) = 0,5 + 0,4772 = 0,9772.
	 e 
P(75 < X < 115) = P (Z1 < Z < Z2) = P(-1,5 < Z < 1,5) = 0,4332 + 0,4332 = 0,8664.
	 P(X > 80) = P (Z > Z1) = P(Z > 0) = 0,5 +
0,0000 = 0,5000.
	 e 
P(110 < X < 120) = P (Z1 < Z < Z2) = P(1 < Z < 2) = 0,4772 - 0,3413 = 0,1359.
	 P(X < 75) = P (Z < Z1) = P(Z > -2,5) = 0,5 – 0,4938 = 0,0062.
	Não é possível calcular a área sobre um ponto, portanto a probabilidade é zero.
Exemplo: Certo produto tem peso médio de 10g e desvio-padrão 0,5g. É embalado em caixas de 120 unidades que pesam em média 150g e desvio-padrão 8g. Qual a probabilidade de que uma caixa cheia pese mais de 1.370g?
Solução: Peso do produto: μp = 10 e σp = 0,5; Peso da caixa: μc = 150 e σc = 8. A média da caixa cheia é μtotal = 120x10 + 150 = 1350. A variância da caixa cheia é = 120x(0,5)2 + (8)2 = 140,8. Portanto, o desvio-padrão será σtotal = = 11,86 Então: 
P(X > 1.370) = P (Z > Z1) = P(Z > 1,69) = 0,5 – 0,4545 = 0,0455.
4.4 Distribuição Qui - Quadrado (2)
Sejam X1, ....., Xn, variáveis aleatórias independentes, normalmente distribuídas, com média zero e variância 2.
Uma variável aleatória: 2 = X12 + .....+ Xn2, ou seja, a soma quadrática das variáveis normais e independentes, segue a distribuição de Qui-quadrado, com “” graus de liberdade.
Esta distribuição possui aplicações muito importantes em Inferência Estatística, em testes não-paramétricos, testes de aderência e independência, entre outras.
A distribuição Qui-quadrado (2) tem as seguintes características:
	É sempre positiva e assimétrica;
	Para n  , a distribuição Qui-quadrado aproxima-se da normal;
	Para  = 1, a distribuição Qui-quadrado é igual à normal.
A esperança e a variância são dadas por: E(X) =  e VAR(X) = 2
Uso da tabela: o “corpo” da tabela fornece valores de “2”, a partir de uma probabilidade  e do número de graus de liberdade .
Exemplo: Considere uma distribuição Qui-quadrado, com 23 graus de liberdade. Determine: a) a média; b) a variância; c) o desvio-padrão;
Solução: a) Média: μ () = 23; b) Variância: = 2x23 = 46; c) Desvio-padrão:= .
4.5 Distribuição “t” de Student
	A distribuição normal depende de dois parâmetros  e 2, mas muitas vezes, não se conhece a variância da população (2) e as investigações e análises são feitas a partir de amostras, que são extraídas desta população. Nessas condições, o desvio padrão da amostra será um estimador de , e então utiliza-se a distribuição t de Student.
A distribuição “t” de Student tem as seguintes características:
	É usada no caso de pequenas amostras (n<30); a partir de amostras maiores que 30, pode-se usar a distribuição normal, pois ambas tornam-se praticamente iguais;
	Sua curva representativa é semelhante à da normal, sendo simétrica em relação à ordenada máxima, apresentando as extremidades com maior comprimento;
	A área sob a curva da distribuição “t” é igual a 1;
A esperança e a variância são dadas por: E(X) = 0 e VAR(X) = 
Uso da tabela: “corpo” da tabela fornece valores de “t”, a partir de uma probabilidade  e do número de graus de liberdade .
Exemplo: Considere uma distribuição t com parâmetro 23. Determine: a) a média; b) a variância; c) o desvio-padrão.
Solução: Observando na tabela, considerando v = 23 e α =0,05, encontrasse o número 2,3979.
a) A média μ (t23) = 0; b) A variância σ2 (t23) = ; c) O desvio-padrão σ (t23) = ;
4.6 Distribuição “F” (Fisher) 
	Sejam duas amostras independentes, retiradas de populações que seguem a distribuição normal. Se as amostras fornecem variâncias s12 e s22 e deseja-se conhecer a distribuição amostral do quociente entre as mesmas, pode-se utilizar a distribuição F de Snedecor, conhecendo-se os graus de liberdade 1 e 2, respectivamente:
		
	Esta distribuição é usada num dos testes mais importantes em estatística, que é a Análise de Variância. A curva da distribuição tem origem no zero e é assimétrica.
Uso da tabela: na 1a linha encontra-se o número de graus de liberdade do numerador 1 e na 1a coluna, o número de graus de liberdade do denominador 2. No “corpo” da tabela, onde ocorre o cruzamento dos graus de liberdade, está o valor crítico que deixa à sua direita, determinada área .
Para cada valor de  tem-se uma tabela.
Exemplo: Admite uma distribuição F com v1 = 8, v2 = 10 e α = 5%. Determine a média, a variância, o desvio-padrão e a moda.
Solução:
A média é dada por: ;
A variância é dada por: ;
O desvio-padrão é dado por: 
A moda é dada por: 
6 – Amostragem
1 Introdução
Em pesquisas científicas, quando se deseja conhecer características de uma população, é comum se observar apenas uma amostra de seus elementos e, a partir dos resultados dessa amostra, obter valores aproximados, ou estimativas, para as características populacionais de interesse. Esse tipo de pesquisa é usualmente chamado de levantamento por amostragem.
Num levantamento por amostragem, a seleção dos elementos que serão observados, deve ser feita sob uma metodologia adequada, de tal forma que os resultados da amostra sejam representativos de toda a população.
1.1 Definição de amostragem
A amostragem é definida como sendo o processo de seleção de amostra(s) de uma população, podendo ser probabilística ou não-probabilística.
A amostragem é probabilística quando a seleção da amostra é feita de forma aleatória, sendo que cada elemento da população tem uma probabilidade conhecida de participar desta amostra.
A amostragem é não-probabilística quando há uma escolha deliberada dos elementos da amostra. Este tipo de amostragem pode prejudicar a representatividade da mesma em relação à população.
1.2 Importância da utilização da amostragem
Quatro razões para o uso de amostragem em levantamentos de grandes populações:
	Economia: em geral, torna-se bem mais econômico o levantamento de somente uma parte da população;
	Tempo: numa pesquisa eleitoral, faltando três dias para a eleição, não haveria tempo suficiente para pesquisar toda a população de eleitores do país, mesmo que houvesse recursos financeiros em abundância;
	Confiabilidade dos dados: quando se pesquisa um número reduzido de elementos, pode-se dar mais atenção aos casos individuais, evitando erros nas respostas;
	Operacionalidade: é mais fácil realizar operações de pequena escala. Um dos problemas típicos nos grandes censos é o controle dos entrevistadores.
1.3 Situações em que pode não valer à pena a realização de uma amostragem
	População pequena: sob o enfoque de amostragens aleatórias, se a população for pequena, para uma amostra ser capaz de gerar resultados precisos para os parâmetros da população, é necessário que ela seja relativamente grande (em torno de 80% da população);
	Característica de fácil mensuração: talvez a população não seja tão pequena, mas a variável que se quer observar é de tão fácil mensuração, que não compensaria investir num plano de amostragem;
	Necessidade de alta precisão: a cada dez anos o IBGE realiza um censo demográfico para estudar diversas características da população brasileira. Dentre estas características tem-se o parâmetro número de habitantes residentes no país, que é fundamental para um bom planejamento. Desta forma, o parâmetro: número de habitantes precisa ser avaliado com grande precisão e, por isto, se pesquisa toda a população.
Para se construir um plano de amostragem deve-se ter bem definidos: os objetivos da pesquisa, a população a ser amostrada, bem como os parâmetros necessários a serem estimados para que os objetivos da pesquisa sejam alcançados. Num plano de amostragem deve constar a definição da unidade de amostragem, a forma de seleção dos elementos da população e o tamanho da amostra.
1.4 Tipos de investigação
Segundo o critério da participação do investigador:
	Levantamento: observação sem interferência no processo que está ocorrendo;
	Experimento: quando há interferência no processo para verificar como ele ocorre.
Segundo o critério do objetivo:
	Descritivo: apenas para conhecer o universo;
	Analítico: desejando analisar possíveis relações.
Qual o procedimento (método de levantamento) que produzirá os resultados mais precisos e
de um modo mais barato?
2 Tipos de amostragem probabilística
2.1 Amostragem aleatória simples
Para a seleção de uma amostra aleatória simples é necessário ter o conjunto de todos os elementos da população e enumerá-los. Este tipo de amostragem consiste em selecionar a amostra através de um sorteio, sem restrição.
Na amostragem aleatória simples, cada elemento da população tem a mesma probabilidade de pertencer à amostra, sendo que as tabelas de números aleatórios facilitam o processo de seleção dos números que identificarão os elementos que irão compor a amostra. Estas tabelas são formadas por sucessivos sorteios de algarismos do conjunto {0, 1, 2, ..., 9}, com reposição.
Considera-se:	N = número de elementos (tamanho) da população;
n = número de elementos (tamanho) da amostra.
2.2 Amostragem sistemática
Muitas vezes é possível obter uma amostra de características parecidas com a amostra aleatória simples, através do processo de amostragem sistemático, de maneira mais rápida e fácil, desde que a população se encontre, naturalmente, ordenada.
Procedimento:
	Calcula-se o intervalo de amostragem k = N/n, aproximando-o para o inteiro mais próximo;
	Utilizando-se a tabela dos números aleatórios, sorteia-se um número x dentro do primeiro intervalo de amostragem (1 a k);
	A amostra será composta pelos elementos correspondentes aos números x, x + k, x + 2k,..., x + (n-1)k.
2.3 Amostragem estratificada
A técnica da amostragem estratificada consiste em dividir a população em k subgrupos denominados de estratos. Estes estratos devem ser internamente mais homogêneos do que a população toda, com respeito as variáveis em estudo.
Sobre os diversos estratos da população, são realizadas seleções aleatórias, de forma independente. A amostra completa é obtida através da agregação das amostras de cada estrato, considerando-se:
N = N1 + N2 + ... + Nk = 
n = n1 + n2 + ... + nk = 
onde: k = número de estratos.
Amostragem estratificada proporcional
Neste caso particular de amostragem estratificada, a proporcionalidade do tamanho de cada estrato da população é mantida na amostra, pois:
n / N = ni / Ni
Quando, no problema em estudo, são identificados estratos, uma amostra obtida através do processo de amostragem estratificada proporcional tende a gerar resultados mais precisos, quando comparada com uma amostra aleatória simples.
Amostragem estratificada uniforme
A amostragem estratificada uniforme costuma ser usada em situações em que o maior interesse é obter estimativas separadas para cada estrato, quando os estratos têm aproximadamente o mesmo tamanho (N1  N2  ...  Nk), ou ainda, quando se deseja comparar diversos estratos. Sendo assim, seleciona-se a mesma quantidade de elementos em cada estrato, ou seja, n1 = n2 = ... = nk , sendo ni calculado utilizando-se a seguinte fórmula: ni = n / k
Exemplo: Como o objetivo de levantar o estilo de liderança preferido pela comunidade de uma escola, vamos realizar um levantamento por amostragem. A população é a seguinte:
Professores: P1, P2, P3, P4, P5, P6, P7, P8, P9, P10
Servidores: S1, S2, S3, S4, S5, S6, S7, S8, S9, S10
Alunos: A1, A2, A3, A4, A5, A6, A7, A8, A9, A10, A11, A12, A13, A14, A15, A16, A17, A18, A19, A20, A21, A22, A23, A24, A25, A26, A27, A28, A29, A30
Suponha que a preferência quanto ao estilo de liderança possa ser relativamente homogêneo dentro de cada categoria. Identifique quais serão os professores, os servidores e os alunos que farão parte da amostra de tamanho 10 por meio de uma a.a.s. utilizando a 1ª linha da tabela. 
Solução: 50/10 = 5, 20% da população são de professores, 20% de servidores e 60% de alunos, portanto retira-se 2 professores, 2 servidores e 6 alunos. Assim: P3, P4, S9, S6, A7, A20, A12, A28, A19, A9.
3 Distribuição por amostragem
Consideram-se todas as possíveis amostras de tamanho “n” retiradas da população. Para cada amostra calcula-se a estatística de interesse, obtendo-se, desta maneira, uma distribuição desses resultados, originando uma Distribuição por Amostragem. Assim, podem-se obter as distribuições por amostragem da média, da variância, da proporção e de outras estatísticas. 
3.1 Amostragem com ou sem reposição
	Se o processo de retirada for com reposição, = número de amostras de tamanho “n” que poderão ser extraídas da população de tamanho N;
	Se o processo de retirada for sem reposição, o número combinatório = número de amostras de tamanho “n”, que poderão ser extraídas da população de tamanho N.
3.2 Distribuição amostral das médias
Admita-se que todas as amostras possíveis de tamanho “n” são retiradas, sem reposição, de uma população finita de tamanho N.
Se a média e o desvio padrão da distribuição amostral das médias forem designados por , e os valores correspondentes da população o forem por  e , respectivamente, então:
 
Se a população for infinita, ou se a amostragem for tomada com reposição, os resultados anteriores reduzem-se a: 
onde: = erro padrão da distribuição amostral das médias, indicando a dispersão da distribuição, sendo que, quanto maior a amostra, menor é o erro padrão da amostragem.
4 Determinação do tamanho da amostra
Em pesquisas, uma etapa de grande importância é a determinação do tamanho da amostra que será utilizada para o levantamento dos dados.
A determinação do tamanho da amostra depende de três fatores:
	Nível de confiança (1-): o pesquisador é que vai determinar o nível de confiança que deseja;
	Precisão (eo): em toda experimentação ou pesquisa, a utilização da amostragem está condicionada a um erro amostral, que corresponde à diferença entre as estimativas amostrais e os parâmetros populacionais;
	Tipo de investigação: depende das características populacionais a serem investigadas.
Serão apresentadas aqui as fórmulas para o cálculo do tamanho de amostras quando se deseja estimar a média ou a proporção de uma população.
4.1 Para estimar a média populacional
Variância populacional conhecida
	População Infinita
	População Finita
	
	
Exemplo: Que tamanho deve ter uma amostra para que possamos estimar a média da glicemia em pessoas normais, com 99% de confiança, desejando que os limites do intervalo não difiram entre si de mais de 2 mg/100ml e sabendo que o desvio padrão deve estar em torno de 4 mg/100ml.
Solução: peças.
Exemplo: Suponha que a variável escolhida num estudo seja o peso de certa peça e que a população tenha 600 peças. Pelas especificações do produto, o desvio padrão é de 10 Kg. Determine o tamanho de amostra de peças admitindo um nível de confiança de 95% e um erro amostral de 1,5 Kg. 
Solução: peças.
Quando não se conhece o desvio padrão da população, pode-se substituí-lo pelo da amostra, que é obtido através de uma pré-amostra (amostra piloto), de tamanho n1. Assim, tem-se:
Variância populacional desconhecida
	População Infinita
	População Finita
	
	
onde:  = n1 – 1 graus de liberdade.
Considerações após o cálculo do tamanho da amostra:
	Se n < n1, então a pré-amostra (amostra piloto) selecionada, de tamanho n1, foi suficiente para garantir a precisão desejada;
	Exemplo 1: Uma pré-amostra de 20 elementos, retirada ao acaso de uma população aproximadamente normal, apresentou a distribuição de freqüência a seguir. Qual deve ser o tamanho da amostra que avalie a média populacional com erro máximo de 0,5 unidades e = 10%?
	Classes
	fi
	0 |- 2
	1
	2 |- 4
	5
	4 |- 6
	10
	6 |- 8
	3
	8 |- 10
	1
Se n > n1, deve-se completar a pré-amostra, acrescentando elementos até atingir o valor de “n”, que garanta a precisão desejada.
Solução: Calcula-se primeiro a média, a variância para achar o desvio padrão da pré-amostra; 
. 
Exemplo: Para estimar o preço médio, uma amostra de 6 produtos foi retirada, sem reposição, de uma população aproximadamente normal, com 150 produtos e forneceu s2 = R$ 10,00. Qual deve ser o tamanho de uma amostra, para que a estimativa do preço médio forneça um