Baixe o app para aproveitar ainda mais
Prévia do material em texto
Exercícios - Ferramentas utilizadas em ciência de dados e Big Data 1. A visualização de dados, também chamada de DataViz, precisa ser muito bem elaborada, pois ela é o produto do esforço do cientista de dados. Pensando nisso, entre as bibliotecas a seguir, quais têm foco em visualização de dados? Você acertou! D. Matplotlib e Seaborn. Entre as inúmeras bibliotecas existentes para Python, é possível destacar duas que são responsáveis por visualização de dados: Matplotlib e Seaborn. As alternativas que combinam as bibliotecas Numpy, Pandas, Scikit-learn e Statsmodels estão incorretas, pois elas não são essencialmente consideradas para visualizações. As bibliotecas Numpy e Pandas são focadas em análise de dados, enquanto as bibliotecas Scikit-learn e Statsmodels são utilizadas em aprendizagem de máquina e modelagem estatística. 2. O RStudio é um ambiente de desenvolvimento integrado para a linguagem R. Nele há áreas para editor de código, console, histórico, files, plots, packages, help, viewer, etc. O que faz a aba packages? Você acertou! E. Exibe as bibliotecas e a descrição e a versão de cada uma. A aba packages é essencial, pois exibe ao desenvolvedor os pacotes disponíveis para instalação ou que já estão instalados dentro do RStudio. Nessa aba, também é possível verificar uma descrição sucinta sobre cada biblioteca e suas versões, mostrando quais são as bibliotecas do usuário e quais são as bibliotecas do sistema. É incorreto afirmar que a aba packages é responsável pela verificação de erros de código- fonte. Os erros gerados ou a execução bem-sucedida de códigos são exibidos no console. Também não é papel da aba packages a exibição dos pacotes que serão excluídos no RStudio: não há uma ferramenta para isso. Os recursos de ajuda se localizam na aba help. 3. Gráficos são recursos fundamentais em projetos de data science, pois ampliam a capacidade de entendimento das pessoas sobre um conjunto de informações. Quais características dos dados podem ser identificadas por meio de um gráfico? Você acertou! A. Padrões entre elementos do dataset. Por meio de um gráfico, o público-alvo consegue identificar semelhanças, padrões e até mesmo diferenças entre os conjuntos de dados analisados. Além disso, por ser visual, a interpretação é facilitada, já que o usuário consegue observar nitidamente a alteração no comportamento de determinado elemento. Gráficos são resultados de uma visualização de dados e por isso não exibem o conteúdo de mensagens de erro, nem linhas de código das linguagens Python, R ou qualquer outra. 4. O desempenho e a vasta gama de bibliotecas faz com que Python seja uma das linguagem preferidas por cientistas de dados, sendo amplamente utilizada em todo o mundo. Nesse contexto, qual é o propósito da biblioteca Pandas? Você acertou! C. A biblioteca Pandasapresenta recursos avançados para atuar com análise de dados. A biblioteca Pandas é muito poderosa, pois gerencia recursos eficazes para análises de dados. Como uma de suas características, podemos destacar a manipulação e importação de arquivos Excel dentro de projetos em Python. É importante mencionar, todavia, que a biblioteca Pandas não conta com recursos de animação e também não há recursos para edição de imagens. Embora seja uma biblioteca voltada para análises de dados, o seu propósito não é substituir a linguagem R. A biblioteca também não tem recursos de compartilhamento de dados com a linguagem R. 5. A linguagem R apresenta uma sintaxe bastante simples de ser compreendida e, portanto, de fácil aprendizagem para um cientista de dados iniciante. Considerando esse cenário, qual é o significado do comando getwd()? Você acertou! B. Retorna o caminho no qual a linguagem R está sendo executada. O comando getwd() retorna o path exato em que se está rodando a linguagem R, ou seja, o caminho no qual o processo responsável pela execução da linguagem está sendo executado. É inválido, portanto, mencionar que o comando constrói na memória do computador uma variável estática ou que gerencia o consumo de memória. Além disso, esse comando não tem em sua estrutura a capacidade de retornar a lista de pacotes instalados no RStudio e também não exibe mensagens de alerta no console do RStudio.
Compartilhar