Buscar

Exercícios - Ferramentas utilizadas em ciência de dados e Big Data

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Exercícios - Ferramentas utilizadas em ciência de dados 
e Big Data 
 
1. A visualização de dados, também chamada de DataViz, precisa ser muito bem elaborada, 
pois ela é o produto do esforço do cientista de dados. Pensando nisso, entre as bibliotecas 
a seguir, quais têm foco em visualização de dados? 
Você acertou! 
D. Matplotlib e Seaborn. 
Entre as inúmeras bibliotecas existentes para Python, é possível destacar duas que são 
responsáveis por visualização de dados: Matplotlib e Seaborn. 
As alternativas que combinam as bibliotecas Numpy, Pandas, Scikit-learn e Statsmodels estão 
incorretas, pois elas não são essencialmente consideradas para visualizações. As bibliotecas 
Numpy e Pandas são focadas em análise de dados, enquanto as bibliotecas Scikit-learn e 
Statsmodels são utilizadas em aprendizagem de máquina e modelagem estatística. 
 
2. O RStudio é um ambiente de desenvolvimento integrado para a linguagem R. Nele 
há áreas para editor de código, console, histórico, files, plots, packages, help, viewer, etc. O 
que faz a aba packages? 
Você acertou! 
E. Exibe as bibliotecas e a descrição e a versão de cada uma. 
A aba packages é essencial, pois exibe ao desenvolvedor os pacotes disponíveis para 
instalação ou que já estão instalados dentro do RStudio. Nessa aba, também é possível 
verificar uma descrição sucinta sobre cada biblioteca e suas versões, mostrando quais são as 
bibliotecas do usuário e quais são as bibliotecas do sistema. 
É incorreto afirmar que a aba packages é responsável pela verificação de erros de código-
fonte. Os erros gerados ou a execução bem-sucedida de códigos são exibidos no console. 
Também não é papel da aba packages a exibição dos pacotes que serão excluídos no RStudio: 
não há uma ferramenta para isso. Os recursos de ajuda se localizam na aba help. 
 
3. Gráficos são recursos fundamentais em projetos de data science, pois ampliam a 
capacidade de entendimento das pessoas sobre um conjunto de informações. Quais 
características dos dados podem ser identificadas por meio de um gráfico? 
Você acertou! 
A. Padrões entre elementos do dataset. 
Por meio de um gráfico, o público-alvo consegue identificar semelhanças, padrões e até 
mesmo diferenças entre os conjuntos de dados analisados. Além disso, por ser visual, a 
interpretação é facilitada, já que o usuário consegue observar nitidamente a alteração no 
comportamento de determinado elemento. 
Gráficos são resultados de uma visualização de dados e por isso não exibem o conteúdo de 
mensagens de erro, nem linhas de código das linguagens Python, R ou qualquer outra. 
 
4. O desempenho e a vasta gama de bibliotecas faz com que Python seja uma das 
linguagem preferidas por cientistas de dados, sendo amplamente utilizada em todo o 
mundo. Nesse contexto, qual é o propósito da biblioteca Pandas? 
Você acertou! 
C. A biblioteca Pandasapresenta recursos avançados para atuar com análise de dados. 
A biblioteca Pandas é muito poderosa, pois gerencia recursos eficazes para análises de 
dados. Como uma de suas características, podemos destacar a manipulação e importação de 
arquivos Excel dentro de projetos em Python. 
É importante mencionar, todavia, que a biblioteca Pandas não conta com recursos de 
animação e também não há recursos para edição de imagens. Embora seja uma biblioteca 
voltada para análises de dados, o seu propósito não é substituir a linguagem R. A biblioteca 
também não tem recursos de compartilhamento de dados com a linguagem R. 
5. A linguagem R apresenta uma sintaxe bastante simples de ser compreendida e, portanto, 
de fácil aprendizagem para um cientista de dados iniciante. Considerando esse cenário, 
qual é o significado do comando getwd()? 
Você acertou! 
B. Retorna o caminho no qual a linguagem R está sendo executada. 
O comando getwd() retorna o path exato em que se está rodando a linguagem R, ou seja, o 
caminho no qual o processo responsável pela execução da linguagem está sendo executado. 
É inválido, portanto, mencionar que o comando constrói na memória do computador uma 
variável estática ou que gerencia o consumo de memória. Além disso, esse comando não tem 
em sua estrutura a capacidade de retornar a lista de pacotes instalados no RStudio e também 
não exibe mensagens de alerta no console do RStudio.

Continue navegando