Logo Passei Direto
Buscar

Resumo completo Analise de dados

Ferramentas de estudo

Material
páginas com resultados encontrados.
páginas com resultados encontrados.

Prévia do material em texto

Monica
arrume esse resumo, acrecentando uma legenda clara para as 
formulas, e deixe o resumo o mais entendivel possivel, para alguem 
que nao entende o assunto entender de primeira.
Resumo do PDF: Medidas de Dispersão
O documento aborda as principais medidas de dispersão e medidas 
separatrizes, que são ferramentas estatísticas utilizadas para entender a 
variabilidade de um conjunto de dados. Aqui está um resumo simplificado e 
organizado para facilitar a compreensão.
1. Medidas de Dispersão
As medidas de dispersão indicam o quanto os valores de um conjunto estão 
próximos ou distantes uns dos outros. Elas ajudam a entender a variabilidade dos 
dados.
Amplitude (Range): É a diferença entre o maior e o menor valor de um 
conjunto.
Fórmula: 
Legenda: é a amplitude, é o maior valor e é o menor
valor.
Exemplo: Para o conjunto de dados :
Amplitude 
Desvio Médio Absoluto (DMA): Mede o desvio médio dos valores em relação 
à média, considerando apenas o valor absoluto.
Fórmula: 
Legenda: é o desvio médio absoluto, é o número de valores,
 são os valores do conjunto e é a média dos valores.
Exemplo: Para o conjunto :
Média 
DMA = 
Coeficiente de Variação (CV): Relaciona o desvio padrão à média, permitindo 
comparações entre conjuntos com diferentes unidades.
R = x −max x min
R x max x min
54, 64, 51, 58, 50
R = 64 − 50 = 14
DMA = ∣x −
n
1 ∑i=1
n
i ∣x̄
DMA n
x i x̄
X = (2, 4, 6, 8, 10)
=X̄ 6
 =5
∣2−6∣+∣4−6∣+∣6−6∣+∣8−6∣+∣10−6∣
 =5
12 2.4
Fórmula: 
Legenda: é o coeficiente de variação, é o desvio padrão e é a
média.
Exemplo: Se a média e o desvio padrão :
Variância: Mede a dispersão dos dados em relação à média.
Fórmula Populacional: 
Legenda: é a variância populacional, é o número total de
elementos, são os valores e é a média populacional.
Fórmula Amostral: 
Legenda: é a variância amostral, é o número de elementos da
amostra e é a média amostral.
Desvio Padrão: É a raiz quadrada da variância e mede a dispersão dos dados.
Fórmula Populacional: 
Legenda: é o desvio padrão populacional.
Fórmula Amostral: 
Legenda: é o desvio padrão amostral.
2. Medidas Separatrizes
As medidas separatrizes dividem a sequência de dados em partes iguais, 
permitindo entender melhor a distribuição dos valores.
Quartis: Dividem os dados em quatro partes iguais.
Exemplo: Para o conjunto :
 (primeiro quartil), (mediana), (terceiro quartil).
Quintis: Dividem os dados em cinco partes iguais.
Exemplo: Para o conjunto :
, , .
Decis: Dividem os dados em dez partes iguais.
Exemplo: Para o conjunto :
, , .
CV = ×
μ
σ 100
CV σ μ
μ = 20 σ = 2
CV = ×20
2 100 = 10%
σ =2
 
N
 (x −μ)∑i=1
N
i
2
σ2 N
x i μ
s =2
 
n−1
 (x − )∑
i=1
n
i x̄ 2
s2 n
x̄
σ = σ2
σ
s = s2
s
1, 2, 3, 4, 5, 6, 7, 8, 9
Q =1 3 Q =2 5 Q =3 7
1, 2, 3, 4, 5
Q =1 2 Q =2 3 Q =3 4
1, 2, 3, 4, 5
D =1 1.5 D =2 2.5 D =3 3.5
Percentis: Dividem os dados em cem partes iguais.
Exemplo: Para o conjunto :
, , .
3. Boxplot
Um boxplot é um gráfico que representa a distribuição dos dados, mostrando os 
quartis e os limites superior e inferior.
Cálculo dos Limites:
Limite Inferior: 
Legenda: é o limite inferior, é o primeiro quartil e é o
terceiro quartil.
Limite Superior: 
Legenda: é o limite superior.
Exercícios
Exercício 1: Considerando a variável altura para a turma, vamos calcular a média, 
variância, desvio padrão, mediana e fazer um boxplot.
Dados
Suponha que as alturas (em cm) da turma sejam:
Cálculos
1. Média ( ):
Legenda: é a média das alturas.
2. Variância (Amostral):
Legenda: é a variância amostral das alturas.
1, 2, 3, 4, 5
P =1 1.04 P =2 2.04 P =3 3.04
LI = Q −1 1.5 × (Q −3 Q )1
LI Q 1 Q 3
LS = Q +3 1.5 × (Q −3 Q )1
LS
150, 160, 165, 170, 175, 180
x̄
=x̄ =6
150+160+165+170+175+180
 ≈6
1000 166.67 cm
x̄
s =2
 
n−1
(x − )∑ i x̄ 2
=
 5
(150−166.67) +(160−166.67) +(165−166.67) +(170−166.67) +(175−166.67) +(180−166.67)2 2 2 2 2 2
= 5
(−16.67) +(−6.67) +(−1.67) +(3.33) +(8.33) +(13.33)2 2 2 2 2 2
= ≈5
278.89+44.49+2.79+11.09+69.44+177.69
 ≈5
584.39 116.88
s2
Monica
3. Desvio Padrão (Amostral):
Legenda: é o desvio padrão amostral das alturas.
4. Mediana:
Para o conjunto (6 elementos):
Mediana 
Legenda: é a mediana das alturas.
5. Boxplot:
Quartis:
Limites:
Legenda: e são os limites inferior e superior do boxplot,
respectivamente.
Conclusão
Este resumo fornece uma visão clara e simplificada das medidas de dispersão e 
separatrizes, além de um exercício prático que ilustra como calcular e interpretar 
essas medidas em um conjunto de dados. Se precisar de mais informações ou 
ajuda, fique à vontade para perguntar!
s = ≈s2 ≈116.88 10.81 cm
s
150, 160, 165, 170, 175, 180
Q =2 =2
165+170 167.5 cm
Q 2
Q =1 160
Q =3 175
LI = 160 − 1.5 × (175 − 160) = 160 − 22.5 = 137.5
LS = 175 + 1.5 × (175 − 160) = 175 + 22.5 = 197.5
LI LS
nao, faça o resumo desse novo pdf seguindo todos os passos que eu 
pedi no pdf anteriot, tudo complitinho
Resumo do PDF: Distribuição de Frequências e Gráficos
O documento aborda a distribuição de frequências e a utilização de gráficos 
para a análise exploratória de dados. Este resumo é estruturado para facilitar a 
compreensão, mesmo para aqueles que não têm familiaridade com o assunto.
1. Análise Exploratória dos Dados
A análise exploratória é o primeiro passo na estatística, onde se busca corrigir 
erros e inconsistências nos dados coletados. Os dados devem ser agrupados para 
facilitar sua visualização e compreensão.
2. Distribuição de Frequências
A distribuição de frequência organiza os dados em tabelas e gráficos, 
permitindo uma melhor compreensão das variáveis.
Dados Brutos: Conjunto de dados numéricos obtidos que ainda não foram
organizados.
Rol: Arranjo dos dados brutos em ordem crescente (ou decrescente).
Amplitude (H): Diferença entre o maior e o menor valor observado.
Fórmula: 
Legenda: é a amplitude, é o maior valor e é o menor
valor.
Exemplo de Dados Brutos
Conjunto de dados: {19, 22, 24, 25, 26, 29, 30, 32, 37, 41}
Rol: {19, 22, 24, 25, 26, 29, 30, 32, 37, 41}
Amplitude: 
3. Frequências
Frequência Simples ou Absoluta ( ): Número de vezes que um elemento 
aparece na amostra.
Fórmula: 
Legenda: é a frequência absoluta e é a contagem de cada valor.
Frequência Relativa ( ): Razão entre a frequência absoluta e o total de 
dados.
Fórmula: 
Legenda: é a frequência relativa, é a frequência absoluta e é o
número total de dados.
Exemplo de Frequências
Dados Brutos: {168, 164, 164, 163, 165, 168, 165, 164, 168, 168}
H = x −max x min
H x max x min
H = 41 − 19 = 22
f
f = f ∑i=1
n
i
f f i
fr
fr = 
N
f
fr f N
Frequências:
, 
, 
, 
4. Frequência Acumulada
Frequência Acumulada ( ): Soma das frequências absolutas até um 
determinado valor.
Fórmula: 
Legenda: é a frequência acumulada.
Frequência Acumulada Relativa ( ): Frequência acumulada dividida pela 
frequência total.
Fórmula: 
Legenda: é a frequência acumulada relativa.
Exemplo de Frequência Acumulada
Para os dados brutos {168, 164, 164, 163, 165, 168, 165, 164, 168, 168}:
Frequência acumulada de 164: 
Frequência acumulada de 165: 
Frequência acumulada de 168: 
5. Gráficos Estatísticos
Os gráficos são ferramentas visuais que ajudam a representar os dados de forma 
clara. Os principais tipos de gráficos são:
Histograma: Representa a distribuição de frequências em barras. As áreas dos
retângulos são proporcionais às frequências.
Polígono de Frequência: Gráfico de linha que conecta os pontos médios dos
histogramas.
Gráfico de Barras: Utilizado para dados qualitativos ou não agrupados.
Gráfico de Setores (Pizza): Representa as proporções de um todo.
Box Plot: Mostra a distribuição dos dados com base em quartis.
f(164) = 3 fr(164) = =10
3 0.3
f(165) = 2 fr(165) = =10
2 0.2
f(168) = 4 fr(168) = =10
4 0.4
F
F = f +1 f +2 … + f n
F
Fr
Fr = 
N
F
Fr
F (164) = 1
F (165) = 3
F (168) = 7
Monica
Exemplo de HistogramaPara os dados de diâmetro de peças:
Frequências são representadas em um gráfico de barras, onde cada barra
representa a frequência de um intervalo de diâmetro.
6. Cálculo das Classes
Fórmula de Sturges:
Legenda: é o número de classes e é o número total de observações.
Intervalo da Classe ( ):
Legenda: é o intervalo da classe e é a amplitude.
Exercícios
Exercício 1: Faça a tabela de distribuição e o histograma para os dados da altura 
da turma.
Conclusão
Este resumo fornece uma visão clara e simplificada sobre a distribuição de 
frequências e a utilização de gráficos para a análise de dados. Se precisar de mais 
informações ou ajuda, fique à vontade para perguntar!
k = 1 + 3, 3 ⋅ log (N)10
k N
h
h ≈ 
k
H
h H
coloque a resoluçao dos exercicios
Resumo do PDF: Medidas Estatísticas para Dados Tabelados
O documento aborda as medidas estatísticas aplicadas a dados organizados em 
tabelas. Este resumo é estruturado para facilitar a compreensão dos conceitos e 
métodos apresentados.
1. Medidas Estatísticas Básicas
As principais medidas estatísticas para dados tabelados incluem a média, o desvio 
padrão e a moda.
Média:
Fórmula: 
Legenda: é a média, é a frequência da classe e é o ponto médio
da classe. é o número total de observações.
Desvio Padrão:
Fórmula: 
Legenda: é o desvio padrão, é a frequência da classe, é o ponto
médio da classe e é a média.
Moda:
A classe com a maior frequência é chamada de classe modal. A moda é o
ponto médio dessa classe.
Fórmula: 
Legenda: Onde e são os limites inferior e superior da classe
modal.
2. Métodos para Cálculo da Moda
Método de King: Considera a frequência da classe anterior e da posterior à 
classe modal.
Fórmula: 
Legenda: é o limite inferior da classe modal, é a frequência da
classe modal, e são as frequências das classes adjacentes, e
 é a amplitude da classe.
Método de Czuber: Considera a frequência da classe anterior, da posterior e 
da modal.
Fórmula: 
Legenda: Similar ao método de King, mas com um ajuste adicional para
maior precisão.
3. Cálculo da Mediana
A mediana é o valor que divide o conjunto de dados em duas partes iguais.
Fórmula: 
=x̄ 
N
(f ⋅x )∑ i i
x̄ f i x i
N
s = 
N−1
f (x − )∑ i i x̄ 2
s f i x i
x̄
Moda = 2
L +L 1 2
L 1 L 2
Moda = L +m ⋅(f −f )+(f −f )m m−1 m m+1
f −f m m−1 h
L m f m
f m−1 f m+1
h
Moda = L +m ⋅(f −f )+(f −f )m m−1 m m+1
f −f m m−1 h
=x~ L + ⋅
f
 −F2
N
h
Legenda: é o limite inferior da classe mediana, é a frequência
acumulada da classe anterior, é a frequência da classe mediana e é a
amplitude da classe.
Exemplo de Cálculo da Mediana
Dada uma tabela de frequências de pesos:
Classe: 70-80 kg, Frequência: 20
Frequência acumulada até 70 kg: 9
Cálculo: 
4. Cálculo das Medidas Separatrizes
Para calcular quartis, decis e percentis em tabelas de frequência, o procedimento é 
similar ao da mediana.
Fórmula para Quartis: 
Legenda: é o k-ésimo quartil, é a posição do quartil, é a
frequência acumulada da classe anterior, é a frequência da classe do
quartil e é a amplitude da classe.
Resumo do PDF: Distribuição de Frequências e Gráficos
O documento aborda a distribuição de frequências e a utilização de gráficos 
para a análise exploratória de dados. Este resumo é estruturado para facilitar a 
compreensão, mesmo para aqueles que não têm familiaridade com o assunto.
1. Análise Exploratória dos Dados
A análise exploratória é o primeiro passo na estatística, onde se busca corrigir 
erros e inconsistências nos dados coletados. Os dados devem ser agrupados para 
facilitar sua visualização e compreensão.
2. Distribuição de Frequências
A distribuição de frequência organiza os dados em tabelas e gráficos, 
permitindo uma melhor compreensão das variáveis.
L F
f h
N = 50
=x~ 70 + ⋅20
25−9 10 = 78
Q =k L + ⋅
f
N −Fk h
Q k N k F
f
h
Dados Brutos: Conjunto de dados numéricos obtidos que ainda não foram
organizados.
Rol: Arranjo dos dados brutos em ordem crescente (ou decrescente).
Amplitude (H): Diferença entre o maior e o menor valor observado.
Fórmula: 
Legenda: é a amplitude, é o maior valor e é o menor
valor.
Exemplo de Dados Brutos
Conjunto de dados: {19, 22, 24, 25, 26, 29, 30, 32, 37, 41}
Rol: {19, 22, 24, 25, 26, 29, 30, 32, 37, 41}
Amplitude: 
3. Frequências
Frequência Simples ou Absoluta ( ): Número de vezes que um elemento 
aparece na amostra.
Fórmula: 
Legenda: é a frequência absoluta e é a contagem de cada valor.
Frequência Relativa ( ): Razão entre a frequência absoluta e o total de 
dados.
Fórmula: 
Legenda: é a frequência relativa, é a frequência absoluta e é o
número total de dados.
Exemplo de Frequências
Dados Brutos: {168, 164, 164, 163, 165, 168, 165, 164, 168, 168}
Frequências:
, 
, 
, 
4. Frequência Acumulada
H = x −max x min
H x max x min
H = 41 − 19 = 22
f
f = f ∑i=1
n
i
f f i
fr
fr = 
N
f
fr f N
f(164) = 3 fr(164) = =10
3 0.3
f(165) = 2 fr(165) = =10
2 0.2
f(168) = 4 fr(168) = =10
4 0.4
Frequência Acumulada ( ): Soma das frequências absolutas até um 
determinado valor.
Fórmula: 
Legenda: é a frequência acumulada.
Frequência Acumulada Relativa ( ): Frequência acumulada dividida pela 
frequência total.
Fórmula: 
Legenda: é a frequência acumulada relativa.
Exemplo de Frequência Acumulada
Para os dados brutos {168, 164, 164, 163, 165, 168, 165, 164, 168, 168}:
Frequência acumulada de 164: 
Frequência acumulada de 165: 
Frequência acumulada de 168: 
5. Gráficos Estatísticos
Os gráficos são ferramentas visuais que ajudam a representar os dados de forma 
clara. Os principais tipos de gráficos são:
Histograma: Representa a distribuição de frequências em barras. As áreas dos
retângulos são proporcionais às frequências.
Polígono de Frequência: Gráfico de linha que conecta os pontos médios dos
histogramas.
Gráfico de Barras: Utilizado para dados qualitativos ou não agrupados.
Gráfico de Setores (Pizza): Representa as proporções de um todo.
Box Plot: Mostra a distribuição dos dados com base em quartis.
Exemplo de Histograma
Para os dados de diâmetro de peças:
Frequências são representadas em um gráfico de barras, onde cada barra
representa a frequência de um intervalo de diâmetro.
6. Cálculo das Classes
F
F = f +1 f +2 … + f n
F
Fr
Fr = 
N
F
Fr
F (164) = 1
F (165) = 3
F (168) = 7
Fórmula de Sturges:
Legenda: é o número de classes e é o número total de observações.
Intervalo da Classe ( ):
Legenda: é o intervalo da classe e é a amplitude.
Exercícios e Resoluções
Exercício 1: Calcule a média, desvio padrão e mediana para a tabela de 
frequências de pesos apresentada.
Tabela de Frequências (Exemplo)
Classe (kg) Frequência
40 - 50 1
50 - 60 3
60 - 70 5
70 - 80 20
80 - 90 11
90 - 100 8
100 - 110 2
Passo 1: Calcular a Média
1. Cálculo dos pontos médios ( ):
k = 1 + 3, 3 ⋅ log (N)10
k N
h
h ≈ 
k
H
h H
x i
x =1 =2
40+50 45
x =2 =2
50+60 55
x =3 =2
60+70 65
x =4 =2
70+80 75
x =5 =2
80+90 85
x =6 =2
90+100 95
x =7 =2
100+110 105
2. Cálculo da média:
Passo 2: Calcular o Desvio Padrão
1. Cálculo do desvio padrão: 
Substituindo os valores:
Passo 3: Calcular a Mediana
1. Identificar a classe mediana:
, a classe mediana é a que contém o 25º elemento.
Frequência acumulada até a classe 70-80 kg é 29, portanto a classe
mediana é 70-80 kg.
2. Cálculo da mediana:
, , , 
Conclusão
Este res mo fornece ma isão clara e simplificada sobre as medidas estatísticas
=x̄ 
N
(f ⋅x )∑ i i
N = 50
=x̄ 50
(1⋅45)+(3⋅55)+(5⋅65)+(20⋅75)+(11⋅85)+(8⋅95)+(2⋅105)
=x̄ =50
45+165+325+1500+935+760+210
 =50
2915 58.3
s = 
N−1
f (x − )∑ i i x̄ 2
s =
49
(1(45−58.3) )+(3(55−58.3) )+(5(65−58.3) )+(20(75−58.3) )+(11(85−58.3) )+(8(95−58.3) )+(2(105−2 2 2 2 2 2
N/2 = 25
=x~ L + ⋅f
 −F2
N
h
L = 70 F = 9 f = 20 h = 10
=x~ 70 + ⋅20
25−9 10 = 70 + 8 = 78

Mais conteúdos dessa disciplina