Buscar

Introdução à Estatística

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 22 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 22 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 22 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

ESTATÍSTICA:
· Estatística descritiva ou dedutiva: 
· Objetivo: descrever fatos relacionados a determinado grupo ou população, SEM pretender tirar conclusões de caráter mais genérico. 
· Conjunto de técnicas destinadas a síntese de dados numéricos.
· Está em cargo da coleta, a organização e a descrição dos dados 
· Seu objetivo é apresentar, de forma resumida, um conjunto de observações. 
· Estatística inferencial ou indutiva:
· A análise e a interpretação dos dados ficam a cargo da estatística inferencial
· A partir dela são tomadas decisões sobre uma determinada população
· Permite testar hipóteses a respeito de uma determinada população de interesse
· População: conjunto universo de todos os elementos, com uma característica em comum. 
· Parâmetro: é uma medida numérica que descreve alguma característica de uma população. → está ligado a população
· Amostra: qualquer subconjunto de uma população → precisa ter representatividade da população
· Estimador / Estimativa: uma estatística numérica que descreve alguma característica de uma amostra. → está ligado a amostra
	POPULAÇÃO
	AMOSTRA
	PARÂMETRO
	ESTIMADOR
	Conjunto de todos os elementos
	Subconjunto de uma população
	Medida numérica de uma população
	Medida numérica de uma amostra
PROCESSOS ESTATÍSTICOS: Censo e Estimação
· Censo:
· É a avaliação DIRETA de um parâmetro, através de dados obtidos de uma população.
· Características: É caro, lento, quase sempre desatualizado, admite erro processual zero e a confiabilidade é 100%
· Estimação: 
· É a avaliação INDIRETA de um parâmetro, com base em um estimador obtido por meio de uma amostra.
· Características: é barato, é rápido, admite erro processual positivo, a confiabilidade é menos que 100%
· DADOS ESTATÍSTICOS:
· Coletados através de um processo de seleção aleatória
· Se forem coletados de maneira inadequada → induzem ao erro e tornam-se inúteis
· CLASSIFICAÇÕES:
· Quanto a organização:
· Dados brutos: obtidos diretamente da observação → não estão numericamente organizados
· Rol: são numericamente organizados, de forma crescente ou decrescente
· Quanto ao tipo:
· Dados quantitativos: possuem características numéricas → os dados serão chamados de VARIÁVEIS. Podem ser classificados em:
· Discretos: dados que possuem variáveis que assumem determinados números inteiros. Ex. quantidade de alunos em um curso
· Contínuos: dados que possuem variáveis que podem assumir qualquer valor em intervalo de números. Ex.: altura, peso, salário.
· Dados qualitativos: possuem características não-numéricas → os dados serão chamados de ATRIBUTOS. Podem ser classificados em:
· Dados nominais: são dados categóricos, que consistem em nomes ou rótulos. Não podem ser hierarquizados (tal como do maior para o menor ou vice versa) Ex.: sexo (masculino ou feminino), sondagem (sim, não, indeciso). OBS: Para serem processados esteticamente, são atribuídos valores numéricos a tais atributos.
· Dados ordinais: são dados que dependem de uma avaliação subjetiva. A principal diferença dos nominais é que esses apresentam uma ordem de categoria (podem ser “hierarquizados”). Ex.: “alto, baixo”; “máximo, mínimo”; “satisfeito, insatisfeito, extremamente insatisfeito”; “números de RG”
· TÉCNICAS DE AMOSTRAGEM:
· São métodos para escolhas das amostras dentro das populações
· Tipos de amostras:
· NÃO PROBABILÍSTICA: 
· Não garante que todos os elementos possuam a mesma probabilidade de serem escolhidos
· São os mais comuns, pois a aleatoriedade é mais custosa. Porém a não causalidade cria um viés na pesquisa e pode afetar o resultado
· Ex.: Escolha de um número de 1 a 1000. Caso seja perguntado para alguém da área da saúde, a probabilidade dessa pessoa escolher um número pequeno é maior que a dela escolher um número grande. Logo, os elementos não possuem a mesma probabilidade para serem escolhidos. Tipos de técnica:
· Por julgamento
· Por quórum
· PROBABILÍSTICA: 
· Os elementos da população possuem a mesma probabilidade de serem escolhidos.
· Ex.: Números do sorteio da loteria. As bolas estão todas no mesmo globo e todos possuem a mesma chance de serem escolhidas. Tipos de técnicas:
· Simples
· Sistematizada
· Estratificada
· Por conglomerados
· Tipos:
· Amostragem aleatória simples (AAS):
· Escolha aleatória sem qualquer organização ou critério
· Todos os elementos tem a mesma probabilidade de ocorrer
· Ex.: Escolha das bolas no sorteio da loteria, qualquer um dos números pode sair e não há nenhum critério para essa escolha.
· Amostragem aleatória sistemática (AASist):
· É criado um critério de escolha, porém há aleatoriedade
· É a que possui menor custo, a mais rápida e a que possui maior praticidade
· Apenas o primeiro elemento da amostra é escolhido aleatoriamente, os outros seguem o mesmo padrão de escolha do primeiro.
· Ex.: Sorteio da loteria → no 1º sorteio serão escolhidos números de 1 a 10, no 2º sorteio números de 11 a 20...
· Observe que o 1º sorteio foi criado um critério de escolha aleatório e que os próximos sorteios irão obedecer e o mesmo padrão, criando, assim, um SISTEMA de escolha
· Amostragem Aleatória Estratificada (AAE):
· São escolhidos determinados extratos (gênero, cor, time que torce...). 
· Os estratos devem ser reunidos com características em comum, de modo que sejam mais homogêneos que a população inteira
· É bem mais cara, pois é precisa fazer um estuda preliminar de toda população para, assim, conhece-la e fazer a divisão dos estratos
· Se divide em:
· Simples: não há necessidade de manter a proporção
· Proporcional: há a necessidade de manter a proporção
· Perfeita: são descartados elementos que não possuem interesse no assunto
· Amostragem Aleatória por Conglomerados (AAC):
· Divide-se a população em grupos, porém bem menores que os estratos. 
· Por exemplo, na pesquisa de altura média em Recife, uma forma estratificada seria dividir em bairros de acordo com a classe social. Por conglomerados seria fazer a divisão em pequenos quarteirões.
· Ex.: Brasília possuem 200 quadras, em vez de pesquisar em todas, 1º são escolhidas as quadras que serão entrevistadas (escolha dos conglomerados) para depois fazer a escolha aleatória dos elementos
· É uma técnica simples de se fazer, porém apresenta resultados menos precisos
· OBSERVAÇÃO:
· Amostragem Estratificada X Amostragem por Conglomerados
· Estratificada: a população (por exemplo de uma escola) é dividida em estratos (alunos do 3º, 4º e 7º ano) e são escolhidos alguns elementos dentro de TODOS os estratos através de amostragem aleatória simples. 
· Por conglomerados: a população é dividida em conglomerados e escolhe-se APENAS UM deles para ser a amostragem, ou seja, é a única técnica em que a unidade amostral é o próprio conglomerado.
· Tamanho mínimo de uma amostra:
n = 
n → tamanho da amostra
N → população
No → = 
e → erro em %
Ex.: 
Total de elementos = 220
Erro tolerável = 5%
n = ≈ 141, 9 = 142 (na amostragem sempre arredonda para mais, não importa o valor)
No = = 400
‘
· Distribuição de frequência:
· Representação por meio de tabelas dos dados estatísticos, discretos ou contínuos.
· Objetivo: resumir grande conjunto de dados
· Finalidade: facilitar a construção de gráficos, bem como a compreensão sobre a natureza dos dados
· Frequência simples absoluta (Fi): é o número de vezes que um elemento figura no conjunto de dados.
· Ex.: Dados → 20 alunos do curso e a quantidade de disciplinas que eles estão estudando→ X: {4, 8, 8, 6, 6, 8, 5, 5, 6, 7, 7, 7, 6, 6, 7, 5, 5, 7, 5, 5}
	Nº DE DISCIPLINAS (Xi)
	FREQUÊNCIA ABSOLUTA (Fi)
	4
	1
	5
	6
	6
	5
	7
	5
	8
	3
	TOTAL
	n = ∑ fi = 20
· Frequência Relativa (Fr): é a razão entre a frequência absoluta e no número total (n) de elementos da série.
Fr = → → Fr = ou
	Nº DE DISCIPLINAS (Xi)
	FREQUÊNCIA ABSOLUTA (Fi)
	FREQUÊNCIA RELATIVA (Fr)
	4
	1
	1/20 = 0,05 = 5%
	5
	6
	6/20 = 0,3 = 30%
	6
	5
	5/20 = 0,25 = 25%
	7
	5
	5/20 = 0,25 = 25%
	8
	3
	3/20 = 0,15 = 15%
	TOTAL
	n = ∑ fi = 20
	20/20 = 1 = 100%
· Frequência acumulada (Fac): é o somatório da frequência simples da variável com asfrequências simples dos elementos que o antecedem.
Fac = Fi + Fi (anterior)
	Nº DE DISCIPLINAS (Xi)
	FREQUÊNCIA ABSOLUTA (Fi)
	FREQUÊNCIA RELATIVA (Fr)
	FREQUÊNCIA ACUMULADA (Fac)
	4
	1
	1/20 = 0,05 = 5%
	1
	5
	6
	6/20 = 0,3 = 30%
	7
	6
	5
	5/20 = 0,25 = 25%
	12
	7
	5
	5/20 = 0,25 = 25%
	17
	8
	3
	3/20 = 0,15 = 15%
	20
	TOTAL
	n = ∑ fi = 20
	20/20 = 1 = 100%
	
· Amplitude AMOSTRAL (A): é a diferença entre o maior e o menor valor da amostra. 
A = N máxima – N mínimo
A = 8 – 4 → A = 4.
· Representação de dados EM CLASSE:
· Representação dos dados em forma de intervalos de classes.
· Regra: usado principalmente em dados contínuos.
· Exceção: podem ser aplicados a dados discretos, quando se tratar de várias amostras
· Ex.: Peso de jovens de um bairro
Os que pesam 50kg entram nesse intervalo e os que pesam 55kg não entram
55
50
65
60
60
55
Limite inferior
Limite superior
· Método para determinar o número de classes (a quantidade de intervalos):
K = → onde, “n” é o tamanho da amostra
· Amplitude da CLASSE (intervalo):
A = L superior – L inferior
Ex.: Nº de bibliotecas de 20 bairros
	90
	66
	78
	82
	77
	60
	64
	90
	87
	85
	67
	91
	82
	70
	81
	80
	69
	78
	90
	67
Quantas classes terá o gráfico de distribuição de frequência? Qual o tamanho da amplitude das classes? 
A amostral = N máximo – N mínimo
A amostral = 91 – 60 = 31
K = ≈ 4 classes
A classe = ≈ 8 (em cada classe terão aproximadamente 8 elementos)
· Ponto médio da classe (Pm):
· É a média aritmética entre o limite superior e o inferior
Pm = 
· SIMBOLOGIA:
	
	POPULAÇÃO
	AMOSTRA
	Média
	µ
	
	Variância
	σ2
	S2
	Desvio Padrão
	Σ
	S
	Proporção
	P
	p
· Medidas descritivas:
· Medidas de posição:
· Tendência central: média, moda e mediana
· Separatriz: quartis, decis, porcentis
· Dispersão: variância, desvio padrão, coeficiente de variação
· Assimetria e curtose
· MEDIDAS DE POSIÇÃO:
· Tendência central: média (), moda (Mo), mediana (Me).
· Média aritmética: 
· Sofre influência dos valores extremos
· Pode ser chamada de valor de esperado 
· Sozinha, ela não é suficiente para a tomada de decisões → NÃO representa a realidade
· É importante para calcular o somatório:
∑X = x n, onde X é somatório dos elementos
· Ex. → X: {x1, x2, x3, x4}
 = 
· PROPRIEDADES:
· A soma algébrica dos desvios em relação a média é zero.
d = (x1 - ) + (x2 - ) + (x3 - 
Ex.: X: {1, 2, 3}
Me = = 2
d = (1 – 2) + (2 – 2) + (3 – 1)
d = 0
· Somando-se, subtraindo-se, dividindo-se ou multiplicando-se uma constante a todos os valores de uma variável, a média do conjunto fica aumentada ou diminuída dessa constante.+3
Ex.: X: {4, 5, 6}
Me = = 5
· A média aritmética é atraída pelos valores extremos.
Ex.: X: {2, 4, 6, 8,10} → = 6
Se for acrescentado o elemento zero a essas variáveis, a média tende a se aproximar do número zero
X: {0, 2, 4, 6, 8, 10} → = 5,6
Se for acrescentado o número 12, a média tende a se aproximar do 12
X: {2, 4, 6, 8, 10} → = 6,4
· A média e o desvio padrão possuem a mesma unidade
· Média ponderada:
· Em alguns casos surgem elementos que possuem pesos maiores que outros, daí há a necessidade dessa média
· Ex.:
	Nota na prova
	Peso da matéria
	7
	1
	8
	2
	9
	3
 = = 10
· Mediana:
· OBSERVAÇÃO: Para calcular a mediana os elementos sempre precisam estar EM ROL, nunca podem estar como dados brutos.
· Não sofre influência dos extremos
· Número de elementos é ÍMPAR:
X: {1, 2, 3, 4, 5} → Me = = = 3ª posição
· Número de elementos é PAR:
X: {1, 2, 3, 4, 5, 6}
1º passo: Me = = = 3ª posição
2º passo: = = 3,5
· Moda:
· É o elemento com maior frequência
· Nem sempre irá existir → distribuição amodal
· Amodal → X: {1, 2, 3, 4, 5}
· Modal → X: {1, 2, 2, 2, 3, 4, 5} → Mo = 2
· Bimodal → X: {1, 2, 2, 3, 3, 4, 5} → Mo = 2 e Mo’ = 3
· Multimodal → X: {1, 2, 2, 3, 3, 4, 4, 5, 5, 6}
· OBSERVAÇÃO: dependendo do tipo de variável, a moda pode ser considerada a média daquela distribuição. Ex.: variáveis qualitativas
· Média aritmética, moda e mediana de VALORES CONTÍNUOS (AGRUPADOS):
Ex.:
	Altura (m)
	Fi
	1,5 I─ 1,6
	3
	1,6 I─ 1,7
	4
	1,7 I─ 1,8
	5
	1,8 I─ 1,9
	5
	1,9 I─ 1,9
	3
Qual o valor da média de alturas?
Me = , onde Pm → ponto médio
Pm = 
Pm1 = = 1,55
	Altura (m)
	Fi
	Pm
	1,5 I─ 1,6
	3
	1,55
	1,6 I─ 1,7
	4
	1,65
	1,7 I─ 1,8
	5
	1,75
	1,8 I─ 1,9
	5
	1,85
	1,9 I─ 1,9
	3
	1,95
Média = 
Média = 1,755 m
Qual a mediana dessas alturas?OBESERVAÇÃO:
Os valores sempre precisam estar agrupados em Rol para calcular a mediana
	Altura (m)
	Fi
	Facumulada
	1,5 I─ 1,6
	3
	3
	1,6 I─ 1,7
	4
	7
	1,7 I─ 1,8
	5
	12
	1,8 I─ 1,9
	5
	17
	1,9 I─ 1,9
	3
	20
	
	N = 20
	
1º passo: Encontrar a classe mediana
CLmed = = 20/2 = 10
A 1ª classe vai da primeira pessoa até a terceira
A 2ª classe vai da quarta pessoa até a sétima
A 3ª classe vai da oitava pessoa até a décima segunda → essa é a classe média 
CLmed = 1,7 I─ 1,8
2º passo: Interpolação linearMd
CLmed = 1,7 I─ 1,8Pm 
Fac da mediana = 7 I─ 12
Md = = 
 = 
Md = 1,76m
· Separatriz: quartis, decis e percentis
· O conjunto de dados precisa estar em Rol.
· Quartis:Q1
Q2
Q3
25%
25%
25%
25%
Q3 – Q1 = Intervalo interquartílico
· Decis: 
Q9
Q8
Q7
Q6
Q5
Q4
Q3
Q2
Q1
· Percentis:
P90
P80
P70
P60
P50
P40
P30
P20
P10
100%
90%
80%
70%
60%
50%
40%
30%
20%
10%
· Dispersão: 
· Variância (S2):
S² = → quando for variância amostral o denominador é (n-1)
Ex.: Suponha que X seja uma variável aleatória com valor Esperado 10 e variância 25.
Para que a variável dada por Y = p – qx, com p e q positivos, tenha valor esperado igual a 0 e variância 625, quais os valores de p e q?
	X → média = 10 / variância = 25
	Y → média = 0 / variância = 625
	Y = p – qx
	Média de Y = p – q x Média de X → trocando os valos de X e Y pelas suas respectivas médias, a equação fica inalteradaNa multiplicação ou divisão a variância fica multiplicada ou dividida pelo quadrado do número
	0 = p – q x 10A soma e a subtração não influenciam a variância e nem o desvio padrão
P = 10q
Y = p – qx
Variância de Y = p – q x Variância de X → trocando os valores de X e Y por suas respectivas variâncias, a equação fica inalterada
Variância de Y = q² x Variância de x
25 = q² x 625
Q = 5
P = 10q → P = 55
OBS: Variância é igual a média dos quadrados divido pelo quadrado das médias
	X
	Probabilidade de x
	0
	0,4
	1
	0,2
	2
	0,1
	3
	0,3
Calcule a média e a variância:
	X x P(x)
	X² x P(X)
	0
	0
	0,2
	0,2
	0,2
	0,4
	0,9
	2,7
Média E(x) = ∑ X x P(X) = 1,3
Média dos quadrados E(x²) = ∑ X² x P(X) = 3,3
Variância = Média dos quadrados E(x²) – Quadrado da média [E(x)]²
Var = E(x²) – [E(x)]²
Var = 3,3 – 1,69 = 1,61
· Desvio padrão (S):
 S= 
Desvio padrão = 
· Propriedades:
· Quando somarmos ou subtrairmos uma constante aos valores de uma variável, o desvio padrão e a variância ficam inalterados
· Quando multiplicarmos ou dividirmos todos os valores de uma variável por uma constante, o desvio padrão fica multiplicado ou dividido por essa constante e a variância multiplicado ou dividido pelo quadrado da constante
· Coeficiente de variação (Cv):
Cv = 
· Amplitude (A):
· Assimetria e Curtose:
· Assimetria:
· Corresponde a distribuição dos dados, que podem ser:
· Simétrica: quando existe uma exata repartição de valores em torno do ponto central, ou seja, a média, a mediana e a moda são iguais.
· Assimétrica à direita (positiva):
 > Me > Mo
· Assimétrica à esquerda (negativa):
 < Me < Mo
· Curtose:
· Mesocúrtica: curva normal → K = 0,263
· Leptocúrtica: curva levantada → K < 0,263
· Platicúrtica: curva achatada → K > 0,263
K = 
· DISTRIBUIÇÃO EXPONENCIAL:
· F(x) = α + e-αx
E = 2,7
Variância de x = 
Desvio padrão de x = 
Média de x = Variância = Desvio padrão
A média de x é o inverso de α. Ex.: α = 2 → Média de x = 
· DISTRIBUIÇÃO NORMAL:
· Padronização:
Z= 
· Distribuição binominal:
Média = n x P
P(k) = C(n,k) x Pk x (1-P)n-k 
· Distribuição de Poisson:
P(x) = 
· COVARIÂNCIA E CORRELAÇÃO:
· Covariância:
Cov(x,y) = P(xy) – Px x Py
E(xy) → média dos produtos
Ex x Ey → produtos da média 
· PROPRIEDADES:· Se os valores da variável y tendem a crescer quando os valores de x crescem, então Cov(x,y) > 0 (POSITIVA)
· Se os valores da variável y tendem a diminuir quando os valores de x crescem, então Cov(x,y) < 0 (NEGATIVA)
· A covariância entre x e y é igual a covariância entre y e x
· A Cov(x,x) = var(x)
· A covariância entre uma variável e uma constante é igual a zero → cov(x,k) = 0
· Cov(kx,y) = cov(x,ky) = k x cov(x,y)
· Correlação:
ρ(x,y) = 
σ = desvio padrão
· PROPRIEDADES:
· Variáveis aleatórias independentes:
· X e y são independentes:
P(xy) = Px x Py
Cov(x,y) = 0
ρ(x,y) = 0
· PROBABILIDADE:
· P(AUB) = P(A) + P(B) – P(A∩B)
· P(A) + P() = 1
· → é chamado de complementar, é o que falta para o todo.
· Ex.: P(A) = 1/3 → P() = 2/3
· P(AUB) U P() = 1
· P() = 1 – P(AUB)
· P(A/B) → probabilidade do evento A acontecer sabendo que o B aconteceu → probabilidade condicional
· P(A/B) = 
· Eventos mutuamente excludentes: são eventos que não podem acontecer juntos, o valor da interseção é zero → P(A∩B) = 0
· Eventos independentes: 
· P(A∩B) = P(A) x P(B)
· P(A/B) = P(A)
· Interseção máxima e mínima:
Ex.: P(A) = 0,4
P(B) = 0,9
Interseção máxima = a menor probabilidade (situação em que o P(A) estaria inteiramente dentro do P(B)) = 0,4 = 40%
Interseção mínima = P(A) + P(B) = 130 → a interseção mínima é o valor que passa dos 100%, logo é igual a 30%

Continue navegando