Prévia do material em texto
Dados Absolutos e Relativos
Conceitos
Dados Absolutos
Dados absolutos são valores brutos e não processados que representam a contagem ou medida
exata de algo. Eles não são comparados ou relacionados a outras quantidades. São os valores
'tal como são' no contexto original.
Dados Relativos
Dados relativos são valores que expressam uma relação ou comparação entre duas ou mais
quantidades. Eles são frequentemente apresentados como proporções, percentagens, taxas ou
índices. Os dados relativos fornecem contexto e facilitam a compreensão e a comparação de
informações.
Exemplos
Exemplo de Dados Absolutos:
• Número de alunos: Em uma sala de aula, há 30 alunos.
• Vendas totais: Uma loja vendeu 500 unidades de um produto em um mês.
• Casos de uma doença: Foram registrados 100 novos casos de gripe em uma cidade.
Exemplo de Dados Relativos:
• Porcentagem de alunos: Dos 30 alunos, 60% são meninas (18 meninas).
• Participação de mercado: A loja detém 10% do mercado de vendas desse produto.
• Taxa de incidência: A taxa de incidência de gripe é de 10 casos por 10.000 habitantes na
cidade.
Dados Relativos - Porcentagem
Teoria
• Destacar a participação da parte no todo - Comparativo
Calculos
import pandas as pd
data = {"emprego": ["Administrador_banco_dados", "Programador",
"Arquiteto_redes"],
"florida": [77140,71540,62310],
"nova_jersey": [97350,82080,112840]}
dataset = pd.DataFrame(data)
dataset
{"summary":"{\n \"name\": \"dataset\",\n \"rows\": 3,\n \"fields\":
[\n {\n \"column\": \"emprego\",\n \"properties\": {\n
\"dtype\": \"string\",\n \"num_unique_values\": 3,\n
\"samples\": [\n \"Administrador_banco_dados\",\n
\"Programador\",\n \"Arquiteto_redes\"\n ],\n
\"semantic_type\": \"\",\n \"description\": \"\"\n }\
n },\n {\n \"column\": \"florida\",\n \"properties\":
{\n \"dtype\": \"number\",\n \"std\": 7488,\n
\"min\": 62310,\n \"max\": 77140,\n
\"num_unique_values\": 3,\n \"samples\": [\n 77140,\n
71540,\n 62310\n ],\n \"semantic_type\": \"\",\
n \"description\": \"\"\n }\n },\n {\n
\"column\": \"nova_jersey\",\n \"properties\": {\n
\"dtype\": \"number\",\n \"std\": 15380,\n \"min\":
82080,\n \"max\": 112840,\n \"num_unique_values\": 3,\n
\"samples\": [\n 97350,\n 82080,\n 112840\n
],\n \"semantic_type\": \"\",\n \"description\": \"\"\n
}\n }\n ]\n}","type":"dataframe","variable_name":"dataset"}
# Sum
print(f"Total Florida: {dataset['florida'].sum()}")
print(f"Total Nova Jersey: {dataset['nova_jersey'].sum()}")
Total Florida: 210990
Total Nova Jersey: 292270
# Adding new columns for %
dataset['%_nova_jersey'] = (dataset['nova_jersey'] /
dataset['nova_jersey'].sum()) * 100
dataset['%_florida'] = (dataset['florida'] / dataset['florida'].sum())
* 100
dataset
{"summary":"{\n \"name\": \"dataset\",\n \"rows\": 3,\n \"fields\":
[\n {\n \"column\": \"emprego\",\n \"properties\": {\n
\"dtype\": \"string\",\n \"num_unique_values\": 3,\n
\"samples\": [\n \"Administrador_banco_dados\",\n
\"Programador\",\n \"Arquiteto_redes\"\n ],\n
\"semantic_type\": \"\",\n \"description\": \"\"\n }\
n },\n {\n \"column\": \"florida\",\n \"properties\":
{\n \"dtype\": \"number\",\n \"std\": 7488,\n
\"min\": 62310,\n \"max\": 77140,\n
\"num_unique_values\": 3,\n \"samples\": [\n 77140,\n
71540,\n 62310\n ],\n \"semantic_type\": \"\",\
n \"description\": \"\"\n }\n },\n {\n
\"column\": \"nova_jersey\",\n \"properties\": {\n
\"dtype\": \"number\",\n \"std\": 15380,\n \"min\":
82080,\n \"max\": 112840,\n \"num_unique_values\": 3,\n
\"samples\": [\n 97350,\n 82080,\n 112840\n
],\n \"semantic_type\": \"\",\n \"description\": \"\"\n
}\n },\n {\n \"column\": \"%_nova_jersey\",\n
\"properties\": {\n \"dtype\": \"number\",\n \"std\":
5.262302364974578,\n \"min\": 28.08362130906354,\n
\"max\": 38.60813631231396,\n \"num_unique_values\": 3,\n
\"samples\": [\n 33.3082423786225,\n
28.08362130906354,\n 38.60813631231396\n ],\n
\"semantic_type\": \"\",\n \"description\": \"\"\n }\
n },\n {\n \"column\": \"%_florida\",\n
\"properties\": {\n \"dtype\": \"number\",\n \"std\":
3.5493047637346464,\n \"min\": 29.532205317787575,\n
\"max\": 36.56097445376558,\n \"num_unique_values\": 3,\n
\"samples\": [\n 36.56097445376558,\n
33.90682022844685,\n 29.532205317787575\n ],\n
\"semantic_type\": \"\",\n \"description\": \"\"\n }\
n }\n ]\n}","type":"dataframe","variable_name":"dataset"}
Dados Relativos - Índices
Conceito
um índice é uma medida que sintetiza uma série de dados em um único valor, que geralmente é
expresso como um número relativo a um ponto de referência (base). Índices são usados para
comparar variações ao longo do tempo ou entre diferentes categorias. Eles ajudam a simplificar
informações complexas e a torná-las mais compreensíveis e comparáveis.
Alguns exemplos comuns incluem:
• Índice de Preços ao Consumidor (IPC): Mede a variação média dos preços de um conjunto
de bens e serviços consumidos pelas famílias ao longo do tempo.
• Índice de Massa Corporal (IMC): Usado para classificar o peso de uma pessoa em relação
à sua altura.
• Índice de Gini: Mede o grau de desigualdade na distribuição de renda ou riqueza em uma
população.
Exemplo de Índice
Vamos calcular um índice de salários para cada emprego na Flórida, usando o salário do
'Programador' como base (Índice = 100) para comparação.
programador_florida_salary = dataset[dataset['emprego'] ==
'Programador']['florida'].iloc[0]
dataset['indice_salario_florida'] = (dataset['florida'] /
programador_florida_salary) * 100
display(dataset[['emprego', 'florida', 'indice_salario_florida']])
{"summary":"{\n \"name\": \"display(dataset[['emprego', 'florida',
'indice_salario_florida']])\",\n \"rows\": 3,\n \"fields\": [\n
{\n \"column\": \"emprego\",\n \"properties\": {\n
\"dtype\": \"string\",\n \"num_unique_values\": 3,\n
\"samples\": [\n \"Administrador_banco_dados\",\n
\"Programador\",\n \"Arquiteto_redes\"\n ],\n
\"semantic_type\": \"\",\n \"description\": \"\"\n }\
n },\n {\n \"column\": \"florida\",\n \"properties\":
{\n \"dtype\": \"number\",\n \"std\": 7488,\n
\"min\": 62310,\n \"max\": 77140,\n
\"num_unique_values\": 3,\n \"samples\": [\n 77140,\n
71540,\n 62310\n ],\n \"semantic_type\": \"\",\
n \"description\": \"\"\n }\n },\n {\n
\"column\": \"indice_salario_florida\",\n \"properties\": {\n
\"dtype\": \"number\",\n \"std\": 10.467819570874669,\n
\"min\": 87.09812692200167,\n \"max\": 107.82778864970646,\n
\"num_unique_values\": 3,\n \"samples\": [\n
107.82778864970646,\n 100.0,\n 87.09812692200167\n
],\n \"semantic_type\": \"\",\n \"description\": \"\"\n
}\n }\n ]\n}","type":"dataframe"}
Dados Relativos - Coeficientes
Conceito
Exemplo de Coeficiente (Correlação)
Vamos criar um conjunto de dados hipotético para calcular o coeficiente de correlação entre
'Horas de Estudo' e 'Pontuação no Exame'.
Um coeficiente de correlação varia de -1 a 1, onde:
• 1 indica uma correlação positiva perfeita
•-1 indica uma correlação negativa perfeita
• 0 indica nenhuma correlação linear
data_coef = {
'horas_estudo': [2, 3, 4, 5, 6, 7, 8, 9, 10],
'pontuacao_exame': [50, 55, 60, 65, 70, 75, 80, 85, 90]
}
df_coef = pd.DataFrame(data_coef)
# Calculando o coeficiente de correlação entre 'horas_estudo' e
'pontuacao_exame'
correlation_coefficient =
df_coef['horas_estudo'].corr(df_coef['pontuacao_exame'])
print(f"Coeficiente de Correlação entre Horas de Estudo e Pontuação no
Exame: {correlation_coefficient:.2f}")
Coeficiente de Correlação entre Horas de Estudo e Pontuação no Exame:
1.00
Coeficiente é um valor numérico que expressa a intensidade, direção ou proporção de uma
relação entre variáveis ou a magnitude de um efeito. Coeficientes são frequentemente usados
em análises mais complexas para quantificar a influência de um fator sobre outro.
Exemplos:
• Coeficiente de Correlação: Mede a força e a direção da relação linear entre duas variáveis.
Por exemplo, um coeficiente de correlação de 0.8 entre vendas e publicidade indica uma
forte relação positiva.
• Coeficiente de Regressão: Em um modelo de regressão, indica o quanto a variável
dependente muda para cada unidade de mudança na variável independente.
Dados Relativos - Taxas
Conceito
Uma taxa é uma relação que compara duas quantidades de naturezas diferentes,
frequentemente uma quantidade em relação a uma unidade de tempo ou uma população
específica. Elas são usadas para medir a frequência de ocorrência de um evento ou a velocidade
de uma mudança.
Exemplos:
• Taxa de natalidade: O número de nascimentos por mil habitantes em um determinado
período.
• Taxa de mortalidade: O número de mortes por mil habitantes em um determinado
período.
• Taxa de desemprego: A porcentagem da força de trabalho que está desempregada.
Exemplo de Taxas
Vamos calcular a taxa de desemprego para uma cidade hipotética.
data_taxa = {
'cidade': ['Cidade A', 'Cidade B'],
'populacao_economicamente_ativa': [100000, 150000],
'desempregados': [5000, 7500]
}
df_taxa = pd.DataFrame(data_taxa)
# Calculando a taxa de desemprego
df_taxa['taxa_desemprego'] = (df_taxa['desempregados'] /
df_taxa['populacao_economicamente_ativa']) * 100
display(df_taxa)
{"summary":"{\n \"name\": \"df_taxa\",\n \"rows\": 2,\n \"fields\":
[\n {\n \"column\": \"cidade\",\n \"properties\": {\n
\"dtype\": \"string\",\n \"num_unique_values\": 2,\n
\"samples\": [\n \"Cidade B\",\n \"Cidade A\"\n
],\n \"semantic_type\": \"\",\n \"description\": \"\"\n
}\n },\n {\n \"column\":
\"populacao_economicamente_ativa\",\n \"properties\": {\n
\"dtype\": \"number\",\n \"std\": 35355,\n \"min\":
100000,\n \"max\": 150000,\n \"num_unique_values\": 2,\n
\"samples\": [\n 150000,\n 100000\n ],\n
\"semantic_type\": \"\",\n \"description\": \"\"\n }\
n },\n {\n \"column\": \"desempregados\",\n
\"properties\": {\n \"dtype\": \"number\",\n \"std\":
1767,\n \"min\": 5000,\n \"max\": 7500,\n
\"num_unique_values\": 2,\n \"samples\": [\n 7500,\n
5000\n ],\n \"semantic_type\": \"\",\n
\"description\": \"\"\n }\n },\n {\n \"column\":
\"taxa_desemprego\",\n \"properties\": {\n \"dtype\":
\"number\",\n \"std\": 0.0,\n \"min\": 5.0,\n
\"max\": 5.0,\n \"num_unique_values\": 1,\n \"samples\":
[\n 5.0\n ],\n \"semantic_type\": \"\",\n
\"description\": \"\"\n }\n }\n ]\
n}","type":"dataframe","variable_name":"df_taxa"}
Resumo
Dados Absolutos: São os valores brutos, exatos e não processados. Eles nos dão a medida direta
de algo (ex: 30 alunos, 500 unidades vendidas, 100 casos de gripe).
Dados Relativos: Por outro lado, os dados relativos expressam uma relação ou comparação
entre duas ou mais quantidades, sempre fornecendo um contexto. Eles nos ajudam a entender a
proporção, a mudança ou a intensidade de um fenômeno, em vez do valor bruto. As
porcentagens, índices, coeficientes e taxas são todos tipos de dados relativos, mas com
finalidades distintas:
• Porcentagens: Usadas para expressar uma parte de um todo em relação a 100. São
ideais para mostrar a composição ou participação (ex: 60% dos alunos são
meninas).
• Índices: Sintetizam uma série de dados em um único valor, geralmente comparado
a um ponto de referência (base). São ótimos para observar variações ao longo do
tempo ou comparar categorias complexas (ex: Índice de Preços ao Consumidor
mostra a inflação).
• Coeficientes: Quantificam a intensidade, direção ou proporção de uma relação
entre variáveis. São usados para entender como uma coisa influencia outra (ex:
Coeficiente de correlação entre vendas e publicidade).
• Taxas: Comparam duas quantidades de naturezas diferentes, frequentemente em
relação a uma unidade de tempo ou população. São ideais para medir a frequência
de um evento ou a velocidade de uma mudança (ex: Taxa de natalidade, taxa de
desemprego).
Em resumo, enquanto os dados absolutos são o quê, os dados relativos (porcentagens, índices,
coeficientes, taxas) nos dizem quanto em comparação com algo, como isso muda ou como se
relaciona.
Dados Absolutos e Relativos
Conceitos
Dados Absolutos
Dados Relativos
Exemplos
Dados Relativos - Porcentagem
Teoria
Calculos
Dados Relativos - Índices
Conceito
Exemplo de Índice
Dados Relativos - Coeficientes
Conceito
Exemplo de Coeficiente (Correlação)
Dados Relativos - Taxas
Conceito
Exemplo de Taxas
Resumo