Resumo ESTATISTICA

•

ESTÁCIO EAD

2

0

2

0

Danilo Antunes

02/11/2017

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 15 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 15 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 9, do total de 15 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Estatística I

56.868 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

Aula 1
Áreas da Estatística:
- Descritiva
- Inferência Estatística (ou indutiva)
- Probabilidade
• Unidades experimentais: É da onde a gente coleta as informações (coleta os dados), não necessariamente a gente vai tá trabalhando com pessoas.
• População: É o conjunto total de unidades experimentais que tem determinada característica que se deseja estudar.
 Unidades experimentais (ou unidades de observação)
 População Amostra
 - Finita
 - Infinita
Amostra é uma parte da população quando não se consegue trabalhar com todas unidades experimentais dessa população, então, a gente retira algumas unidades experimentais para fazer o estudo estatístico.
→ Estudos provenientes da população, as informações numéricas são chamadas de parâmetros.
→ Estudos provenientes da amostra, as informações numéricas são chamadas de estatísticas.
- Estatística Descritiva: 
Pode ser feita tanto de dados populacionais quanto de dados amostrais.
Variável: É uma “característica” de uma unidade experimental.
- Qualitativa (não numérica)
- Quantitativa (numérica)
 Nominal (não segue uma ordem)
Variável Qualitativa 
 Ordinal (possui uma ordem)
 Discreta (valores inteiros)
Variável Quantitativa 
 Contínua (dados provenientes de medidas)
* Técnicas que mais utilizadas para coleta de dados:
Amostragem
- Probabilística (aleatória)
- Não Probabilística (não aleatória)
Amostragem Probabilística:
• aleatória simples
• sistemática
• estratificada (em estratos)
Amostragem não Probabilística:
É uma amostragem a esmo ou sem norma ou uma amostragem intencional
Aula 2
Distribuição de Frequências: São tabelas.
Com as informações em mãos, nós organizamos essas informações através de uma distribuição de frequências. (tabelas)
Rol: É uma sequencia ordenada do conjunto de dados brutos.
	Variável
	Frequência (absoluta)
	Frequência Relativa (%)
	
	
	
	
Total
	
Nº de elementos em estudos
	
100
 
F.R. (%) = x 100
	Variável
	Frequência
	Frequência Relativa (%)
	Fa (acumulada)
	Fra
	
	
	
	
	
	Total
	Nº de elementos em estudos
	100
	
	
Fa = é a soma de cada frequência com as anteriores. A frequência acumulada é necessária no cálculo das medidas separatrizes e no gr´fico ogiva.
Fra = x 100
Intervalos de classes
Quando se trabalha com um conjunto de dados que apresenta um grande número de valores diferentes, é conveniente construir classes ou faixas de valores e contar o número de ocorrências em cada faixa.
 amplitude
lim inferior lim superior
• Para encontrar o número de classes:
k 
 
√
 n 
k → nº de classes
n → nº de observações
Obs.: k não deve ser inferior a 5 e maior que 25. 5 › k ‹ 25
• Para encontrar o tamanho da classe: (qual a amplitude)
h 
 
 
Amplitude da classe é a diferença entre o valor máximo e o mínimo dos dados, dividido pelo número de classes ( k ).
Aula 3 
Medidas Estatísticas
 Média aritmética
- Medidas de Posição Central Moda
 Mediana
- Medidas de Dispersão
 Amplitude total
 Desvio-Padrão
 Variância
 Coeficiente de variação
MÉDIA
x = 
n → nº de dados, observações em estudo (quantidade de elementos)
Mas quando os dados estão dispostos numa tabela a gente pode calcular a média acrescentando uma coluna auxiliar.
Para calcular a média por meio dos dados organizados numa tabela (distribuição de frequências):
	Variável
	Frequência
	Frequência Relativa (%)
	xi x fi
	x
	f
	
	
	
Total
	
Nº de elementos em estudos
	
100
	
média (x) = soma de xi • fi .
 soma da Frequência 
x → variável
f → Frequência 
MODA
É a resposta que aparece com maior frequência no conjunto de dados.
Também pode ser encontrada quando a variável em estudo for qualitativa.
MEDIANA
Quando há um valor muito discrepante, a mediana representa melhor um conjunto de dados. A mediana não é influenciada por valores extremos. 
Tem que ordenar os dados do menor para o maior valor (rol).
A mediana é o valor que divide o conjunto de dados em duas partes exatamente iguais.
• p/ n ímpar:
Md = x
• p/ n par:
Md = Xn / 2 + X n+1 / 2
 2
Aula 4
Medidas de Ordenamento ( ou separatriz)
• Quartis
• Decis 
• Percentis
Não são afetadas por valores extremos.
QUARTIS
Divide a distribuição ordenada em quatro partes iguais.
 25 % 25 % 25 % 25 %
 
 Q1 Q2 Q3
Q2 é a própria mediana.
Fórmula:
Qnq = x[]
X é o valor, é a posição que está o quartil. (Q1, Q2 ou Q3)
nq é o número do quartil que se quer encontrar (1,2 ou 3)
n é o nº de elementos em estudo. (tamanho da amostra)
Q é o quartil que se deseja obter
DERCIS
Dnd = x[]
PERCENTIS
Pnp = x[]
Aula 5
Medidas de Dispersão
Só podem ser calculadas para variáveis quantitativas.
* Amplitude total
* Desvio-Padrão
* Variância
* Coeficiente de variação
AMPLITUDE TOTAL
É a diferença entre o valor máximo com o valor mínimo do conjunto de dados.
R → Amplitude total
R = X
(MÁXIMO)
 - X
(MÍNIMO)
A amplitude não é uma medida muito utilizada, pois só leva em conta dois valores de todo o conjunto de dados e é muito influenciada por valores extremos.
DESVIO-PADRÃO
É a raiz quadrada da variância. 
Para ficar com a mesma unidade do conjunto de dados originais.
S → desvio-padrão
Propriedades do Desvio-Padrão:
• Quando a gente soma ou subtrai uma constante qualquer de todos os valores de um conjunto de dados, a gente vai obter um novo conjunto de dados. O Desvio-Padrão que se obtém desse novo conjunto de dados é igual ao Desvio-Padrão do conjunto de dados anterior.
S
y
 = 
S
xYi = Xi ± c → 
• Multiplicando-se ou Dividindo
S
y
 = c x 
S
xYi = Xi x c → c x Sx Então, 
Yi = Xi ÷ c → Sx Então, Sy = Sx
 c c
Isso só vale se você fizer para todos os elementos do conjunto de dados
VARIÂNCIA
É o valor do Desvio-Padrão elevado ao quadrado.
COEFICIENTE DE VARIAÇÃO
CV = x 100
	Variável (Xi)
	Frequência (fi)
	Xi x fi
	Xi2 x fi
	
	
	
	
	
	
	
	
	
	
	
	
Aula 6
Gráficos
Última aula da estatística descritiva.
Tipos de Gráficos:
- em linhas
- barras ou colunas, setores ou pizza. (Diagramas de área)
- Gráficos para tabelas de intervalos de classes (histograma e polígono de frequências)
Diagrama de Pareto → Quando construímos o gráfico em barras para variáveis qualitativas e as barras são arranjadas em ordem decrescente de altura, a partir da esquerda para direita, com o atributo que ocorre com maior frequência aparecendo em primeiro lugar, denominamos este gráfico de barras de Diagrama de Pareto. É uma das sete ferramentas da qualidade.
Falhas na elaboração de gráficos:
- Gráfico sucata
- Ausência de base relativa.
- Eixo vertical comprimido.
- Ausência do ponto zero.
Aula 7
Inferência Estatística
As técnicas mais importantes e utilizadas da Inferência Estatística são:
- Estimação
- Teste de hipóteses
A inferência estatística é um conjunto de técnicas muito utilizadas em problemas práticos do dia-a-dia.
Conceitos básicos:
• Parâmetro → população µ ou 
• Estimador → amostra µ ou 
• Estimativa ou estatística
• Erro amostral
• Erro não amostral
Estimativa:
- Pontual
- Intervalo de confiança (ou estimativa intervalar)
* Estimativa pontual:
Umúnico valor é usado para estimar um parâmetro populacional.
A média amostral é a melhor estimativa pontual da média populacional. Ou seja, a estimativa pontual é a média amostral.
É a soma de todas as observações ÷ quantidade de observações.
 = ∑ 
Obs.: Letra grega 𝜇 (mi) é um parâmetro para a média populacional. 
A letra grega é sempre população.
𝜇 é a média populacional
 = média amostral 
* Intervalo de confiança:
É uma faixa (ou intervalo) de valores usada para estimar o verdadeiro valor de um parâmetro populacional.
Permite julgar um possível erro que a gente pode tá cometendo.
Distribuição amostral
Teorema do limite central
σMa = 
→ Para uma população infinitamente grande e uma amostragem com reposição.
σ → é o desvio - padrão
Fator de correção:
x √N – n 
 N - 1
Usa esse fator de correção para populações finitas e amostragem sem reposição. Ou seja, tamanho amostral n for maior que 5% do tamanho N da população finita. 
n › 0,05
Erro padrão nada mais é do que a raiz da variância do estimador.
Aula 8
Distribuição Normal
É uma distribuição de probabilidade em estatística. É a distribuição contínua de probabilidade mais importante em estatística.
Quais são os elementos necessários para a construção de um intervalo de confiança. Como se constrói um intervalo de confiança. 
Para se construir um intervalo de confiança a gente precisa de uma quantidade que vem de uma distribuição normal. 
A quantidade de um intervalo de confiança vem de uma tabela de distribuição normal.
O gráfico da distribuição normal é chamado de curva normal, que é uma distribuição em forma de sino.
Na distribuição normal pode ter qualquer valor para a média, mas o desvio-padrão sempre é positivo. O mínimo do desvio-padrão é zero.
A abertura da curva está diretamente relacionada ao desvio-padrão, que é a variabilidade.
Quanto maior o desvio-padrão mais aberta é a curva.
Quanto menor o desvio-padrão mais fechada vai tá a curva. 
Então a curva da distribuição normal depende diretamente da média e do desvio-padrão. 
Média µ e desvio-padrão σ 
Intervalo de confiança
Para levar em conta a variabilidade da média, a gente constrói intervalos de confiança.
Variabilidade está associada ao desvio-padrão e a variância.
Variância = 
Desvio-padrão = 
 
 σ → σ é o desvio padrão populacional
√n
S → S é o desvio padrão amostral
√n
Para construir um intervalo de confiança:
[ x + t . ; x - t . ]
t é o valor tabelado
x é a média
Aula 9
Variável aleatória: é uma variável que tem um único valor numérico, determinado pelo acaso, para cada resultado de algum experimento. Normalmente indicada por letra maiúscula do alfabeto (X, Y, Z, W). Está associada a um experimento.
Distribuição de Probabilidade
É uma tabela, como na estatística descritiva.
Cálculo de probabilidades de uma variável aleatória contínua:
A gente tem que fazer uma transformação na variável. A gente tem uma variável original X, e a gente transforma essa variável numa outra variável Z, com µ = 0 e σ = 1.
Z =
 
X - µ
 
 σ
X → variável original
Z → variável
µ = 0
σ = 1
Com essa transformação a gente consegue usar aquela tabela do intervalo de confiança, para encontrar as probabilidades.
Então, uma variável aleatória que tem µ = 0 e σ = 1, é uma Distribuição Normal Padrão.
Uma vez que cada distribuição normal pode ser transformada em uma distribuição normal padrão, pode-se usar escores z e a curva normal padrão para obter áreas (e portanto probabilidades) sobre qualquer curva normal.