Buscar

Segundo Vanderplas (2016), a análise e o processamento de dados desempenham um papel central na Ciência de Dados, permitindo a extração de insights valiosos a partir de conjuntos de dados complexos. N

Prévia do material em texto

ATIVIDADE 1 – CDAS - VISUALIZAÇÃO DE DADOS - 
53/2023 
ASSESSORIA NOS SEUS TRABALHOS 
 (21) 99887-9815 
 (21) 99887-9815 
 (21) 99887-9815 
Segundo Vanderplas (2016), a análise e o processamento de dados desempenham um 
papel central na Ciência de Dados, permitindo a extração de insights valiosos a partir de 
conjuntos de dados complexos. Nesse contexto, as bibliotecas Numpy, Pandas e Matplotlib 
do Python são ferramentas essenciais, utilizadas por profissionais de Ciência de Dados 
para manipulação, análise e visualização de dados 
 
Fonte: VANDERPLAS, J. Manual de Ciência de Dados do Python: ferramentas essenciais 
para trabalhar com dados. [S. l.]: O'Reilly Media, Inc., 2016. 
 
Numpy é uma biblioteca fundamental para o processamento numérico em Python, que 
oferece uma estrutura de array multidimensional eficiente, juntamente com funções e 
operações matemáticas que permitem realizar cálculos complexos em larga escala. Com o 
Numpy, é possível manipular e transformar dados de forma eficiente, facilitando a 
preparação dos dados para análise. Considere o código a seguir: 
import numpy as np 
import matplotlib.pyplot as plt 
 
idades = np.array([25, 30, 35, 40, 45, 50, 55, 60]) 
salarios = np.array([5000, 6000, 5500, 7000, 6500, 7500, 8000, 
9000]) 
 
media_salarios = np.mean(salarios) 
desvio_padrao_salarios = np.std(salarios) 
 
# Geração do gráfico com Matplotlib 
plt.plot(idades, salarios, marker='o') 
plt.xlabel('Idades') 
 
 
plt.ylabel('Salários') 
plt.title('Relação Idades-Salários') 
plt.grid(True) 
plt.show() 
 
O Gráfico 1 produzido por esse código é um gráfico de linhas construído no Matplolib, uma 
biblioteca de visualização de dados que permite criar uma ampla variedade de gráficos. 
Com o Matplotlib, os cientistas de dados podem comunicar, de forma eficaz, os padrões e 
as tendências identificados durante a análise de dados, fornecendo compreensões visuais 
para os stakeholders. 
 
 
Gráfico 1 - Tendência salarial hipotética com base em idades 
Fonte: o autor. 
Descrição da imagem: trata-se de um gráfico de linhas, com oito posições no eixo X, que 
representa as idades, variando de cinco em cinco, iniciando em 25 e terminando em 60. O 
eixo Y, que representa os salários, tem nove posições, iniciando em 5000 e variando em 
500 até o último valor salarial de 9000. 
 
Observe o código e a saída apresentada por ele. IMPLEMENTE uma solução semelhante 
utilizando a biblioteca Pandas do Python 
 
 
 
 
 
 
 
 
OLÁ! SOMOS A HELP EDUCACIONAL! 
ELABORAMOS ESSE TRABALHO POR UM PREÇO 
ACESSÍVEL. 
ENTRE EM CONTATO CONOSCO 
 (21) 99887-9815

Continue navegando

Outros materiais