Text Material Preview
Meus Simulados Teste seu conhecimento acumulado Disc.: TÓPICOS DE BIG DATA EM PYTHON Aluno(a): MARIANA DOS REIS VASCONCELOS 202104235119 Acertos: 10,0 de 10,0 06/07/2023 Acerto: 1,0 / 1,0 Em relação ao formato dos dados, selecione a opção correta que corresponde ao formato dos dados de transações bancárias. dados de Internet das Coisas dados semiestruturados dados não estruturados dados estruturados dados de Big Data Respondido em 06/07/2023 19:59:53 Explicação: Os dados de transações bancárias são salvos em tabelas e, portanto, correspondem a dados estruturados, que são típicos de sistemas de transações on line armazenados em banco de dados. As demais alternativas tratam de dados não convencionais que não são armazenados em bancos de dados tradicionais. Acerto: 1,0 / 1,0 (NC-UFPR/2019 - Adaptada) Sobre a IoT (Internet das coisas) e seus blocos básicos de construção, identi�que como verdadeiras (V) ou falsas (F) as seguintes a�rmativas: ( ) Na IoT, os objetos podem prover comunicação entre usuários e dispositivos, viabilizando diversas aplicações, tais como coleta de dados de pacientes e monitoramento de idosos e sensoriamento de ambientes de difícil acesso. ( ) A tecnologia de IoT consiste na coexistência colaborativa de dois componentes: As "coisas" e os protocolos de rede que permitem a sua comunicação. ( ) Protocolos de comunicação: Viabilizam a troca de dados via Internet entre os objetos físicos e outros sistemas. Assinale a alternativa que apresenta a sequência correta, de cima para baixo. V F V Questão1 a Questão2 a https://simulado.estacio.br/alunos/inicio.asp javascript:voltar(); F F F V V F F V V F V F Respondido em 06/07/2023 20:02:58 Explicação: O avanço da tecnologia criou dispositivos e sensores eletrônicos que geram enormes quantidades de dados. Esses equipamentos podem ser utilizados em diversas aplicações, tais como: coleta de dados de pacientes e monitoramento de idosos e sensoriamento de ambientes de difícil acesso. A tecnologia de IoT consiste na coexistência colaborativa de quatro componentes: Objetos físicos (ou "coisas"), Computação, Protocolos de comunicação e Serviços. Acerto: 1,0 / 1,0 Reconhecer os conceitos de Data Lake é fundamental para o pro�ssional de Tecnologia da Informação. Selecione a opção correta a respeito do Data Lake. Aplicam processos de tratamento nos dados. Armazenam os dados de modo e�ciente. Possui alta latência para acesso dos dados. São exclusivos da distribuição Hadoop Apache. Demandam por equipamentos especiais. Respondido em 06/07/2023 20:04:09 Explicação: O Data Lake utiliza um método muito e�ciente para fazer o armazenamento dos dados. Dessa forma ele possui baixa latência para acessar os dados. Além disso, o Data Lake não demanda por equipamentos especiais e não é de uso exclusivo da distribuição Hadoop Apache. Acerto: 1,0 / 1,0 Em relação ao Data Lake, selecione a opção correta que contenha o(s) formato(s) de dados que pode(m) ser armazenado(s) nele. apenas estruturado estruturado e semiestruturado apenas não estruturado apenas tabelas relacionais estruturado, não estruturado e semiestruturado Respondido em 06/07/2023 20:05:18 Explicação: O Data Lake pode armazenar dados estruturados, semiestruturados e não estruturados que correspondem a característica de variedade dos dados que é bem típica de aplicações de Big Data. Questão3 a Questão4 a Acerto: 1,0 / 1,0 Questão5 a Selecione a opção correta que contenha a operação responsável por retornar um subconjunto aleatório dos dados de entrada. �lter sample random mapRandom distinct Respondido em 06/07/2023 20:05:50 Explicação: Gabarito: sample Justi�cativa: A operação responsável por retornar um subconjunto aleatório dos dados é a sample. É uma operação da categoria de transformação, sendo que se encaixa em transformações amplas, pois pode ser necessário realizar movimentações entre as partições. Filter é uma função que retorna um subconjunto de dados em relação a alguma condição imposta, portanto não há aleatoriedade. Random e mapRandom não são funções válidas para o Spark. Distinct retorna um RDD com elementos diferentes de um RDD de entrada. Acerto: 1,0 / 1,0 Os componentes do Spark têm como objetivo facilitar o desenvolvimento de projetos com �nalidades especí�cas. Nesse sentido, selecione a opção que contém o componente responsável por estabelecer uma conexão com o Cluster. Spark.Catalog DataFrame SparkContext SparkSession RDD Respondido em 06/07/2023 20:09:28 Explicação: Gabarito: SparkContext Justi�cativa: O componente responsável por estabelecer uma conexão com o cluster é o SparkContext e pode ser usado para criar RDDs, acumuladores e variáveis de transmissão nesse cluster. O SparkSession, por sua vez, é um ponto de entrada para que o Spark possa trabalhar com RDD, DataFrame e Dataset. O Spark.Catalog é uma interface para gerenciar um catálogo de metadados de entidades relacionais. Acerto: 1,0 / 1,0 Compreender a análise de dados em Python é fundamental para o cientista de dados. Qual o papel do sistema pip da linguagem Python? Biblioteca de Processamento de Linguagem Natural. Gerenciador de espaços virtuais do Python. Motor de Busca da IDE do Python. Gerenciador de Pacotes do Python. Gerenciador de memória do Python. Questão6 a Questão7 a Respondido em 06/07/2023 20:10:03 Explicação: O papel do comando pip é gerenciar os pacotes a serem importados no Python, bem como instalá-los via comando pip install. Gerenciar memória é papel do sistema operacional, não do pip. A função de gerenciar espaços virtuais é atribuída ao venv, o virtualenv. Motor de busca é uma atribuição de IDE, não de linguagem de programação. O processamento de linguagem natural é função de biblioteca, diferente de gerenciamento de pacotes. Acerto: 1,0 / 1,0 Gabriel entrou recentemente em uma empresa de gestão de fundos de investimento. No seu primeiro dia de trabalho, lhe é conferida a tarefa de buscar os relatórios do pessoal da contabilidade para fazer suas análises exploratórias. O departamento de contabilidade extrai os dados de seus relatórios de um SAP que retorna valores brutos de compras, quantidades de produtos etc. Então os contadores organizam, por agregação, informação relevante no relatório em planilhas por eles desenvolvidos. Por questões de acesso e segurança, Gabriel só pode lidar com essas planilhas. Este tipo de coleta feita por Gabriel e pelos Contadores é respectivamente dos tipos: Primária; Primária. Secundária; Primária. Primária; Secundária. Secundária; Secundária. Secundária; Terciária. Respondido em 06/07/2023 20:10:33 Explicação: Gabriel coletará dados gerados a partir de terceiros, enquanto os contadores estão fazendo uma coleta primária direto na fonte dos dados do SAP que, para os �ns desta questão está funcionando como um repositório de dados para eles. Acerto: 1,0 / 1,0 Luís foi contratado recentemente para trabalhar em uma empresa de consultoria de análise de dados. O projeto no qual foi alocado já havia começado, e os colegas de Luís lhe disseram que estavam preparando o conjunto de dados para poder passar os mesmos por um modelo de árvore de decisão. Já que especi�camente os colegas de Luís estão removendo dados faltantes, em qual etapa do processo de KDD, Luís se encontra: Pré-Processamento . Descoberta de Padrões. Avaliação. Transformação de Dados. Coleta de Dados. Respondido em 06/07/2023 20:11:40 Explicação: Luís se encontra na fase que ocorre logo após selecionarmos dados, e antes da transformação do conjunto, que é justamente a fase de pré-processamento ou limpeza dos dados. Questão8 a Questão9 a Acerto: 1,0 / 1,0 Leonardo começou seu trabalho de conclusão de curso. Nesse trabalho, Leonardo quer elaborar um classi�cador de imagem, mas, não sabe se decidir com relação à con�guração das camadas de sua rede neural.É muito comum utilizarmos o conjunto ________ para fazermos o benchmark de modelos de ______________: IRIS; Processamento de Imagens IRIS; Processamento da Linguagem Natural Pizzas; Categorias MNIST; Processamento de Linguagem Natural MNIST; Processamento de Imagens Respondido em 06/07/2023 20:12:04 Explicação: O conjunto MNIST de dígitos escritos a mão é um dos conjuntos mais conhecidos na literatura de aprendizado de máquina. Mas, essa fama não é à toa, pois esse é o conjunto de comparação entre modelos de processamento de imagens, uma vez que uma boa con�guração de rede neural deve ser capaz de reconhecer os dígitos escritos a mão do MNIST. Questão10 a