Baixe o app para aproveitar ainda mais
Prévia do material em texto
18/11/2022 15:38 Estácio: Alunos https://ead.estacio.br/alunos/ 1/5 Meus Simulados Teste seu conhecimento acumulado Disc.: TÓPICOS DE BIG DATA EM PYTHON Aluno(a): NILO SILVA NETO 202012017875 Acertos: 10,0 de 10,0 18/11/2022 Acerto: 1,0 / 1,0 Em relação ao formato dos dados, selecione a opção correta que corresponde ao formato dos dados de transações bancárias. dados de Internet das Coisas dados de Big Data dados semiestruturados dados não estruturados dados estruturados Respondido em 18/11/2022 15:14:32 Explicação: Os dados de transações bancárias são salvos em tabelas e, portanto, correspondem a dados estruturados, que são típicos de sistemas de transações on line armazenados em banco de dados. As demais alternativas tratam de dados não convencionais que não são armazenados em bancos de dados tradicionais. Acerto: 1,0 / 1,0 (NC-UFPR/2019 - Adaptada) Sobre a IoT (Internet das coisas) e seus blocos básicos de construção, identifique como verdadeiras (V) ou falsas (F) as seguintes afirmativas: ( ) Na IoT, os objetos podem prover comunicação entre usuários e dispositivos, viabilizando diversas aplicações, tais como coleta de dados de pacientes e monitoramento de idosos e sensoriamento de ambientes de difícil acesso. ( ) A tecnologia de IoT consiste na coexistência colaborativa de dois componentes: As "coisas" e os protocolos de rede que permitem a sua comunicação. ( ) Protocolos de comunicação: Viabilizam a troca de dados via Internet entre os objetos físicos e outros sistemas. Assinale a alternativa que apresenta a sequência correta, de cima para baixo. V V F F V F F F F V F V Questão1 a Questão2 a https://ead.estacio.br/alunos/inicio.asp javascript:voltar(); 18/11/2022 15:38 Estácio: Alunos https://ead.estacio.br/alunos/ 2/5 F V V Respondido em 18/11/2022 15:23:34 Explicação: O avanço da tecnologia criou dispositivos e sensores eletrônicos que geram enormes quantidades de dados. Esses equipamentos podem ser utilizados em diversas aplicações, tais como: coleta de dados de pacientes e monitoramento de idosos e sensoriamento de ambientes de difícil acesso. A tecnologia de IoT consiste na coexistência colaborativa de quatro componentes: Objetos físicos (ou "coisas"), Computação, Protocolos de comunicação e Serviços. Acerto: 1,0 / 1,0 O Hadoop é uma tecnologia especializada em atender as demandas de Big Data. Selecione a opção correta que contenha a linguagem de programação utilizada para o desenvolvimento e implementação do Hadoop. Python Java Lua Java Script Perl Respondido em 18/11/2022 15:20:05 Explicação: O Hadoop foi desenvolvido usando, originalmente, a linguagem de programação Java na distribuição livre da Apache Foundation. Atualmente, diferentes distribuições do framework estão implementadas em diversas linguagens, entre as quais o Python. Acerto: 1,0 / 1,0 Reconhecer os conceitos de Data Lake é fundamental para o profissional de Tecnologia da Informação. Selecione a opção correta a respeito do Data Lake. Possui alta latência para acesso dos dados. Armazenam os dados de modo eficiente. Demandam por equipamentos especiais. São exclusivos da distribuição Hadoop Apache. Aplicam processos de tratamento nos dados. Respondido em 18/11/2022 15:23:56 Explicação: O Data Lake utiliza um método muito eficiente para fazer o armazenamento dos dados. Dessa forma ele possui baixa latência para acessar os dados. Além disso, o Data Lake não demanda por equipamentos especiais e não é de uso exclusivo da distribuição Hadoop Apache. Acerto: 1,0 / 1,0 Os componentes do Spark têm como objetivo facilitar o desenvolvimento de projetos com finalidades específicas. Selecione a opção que contém o componente do ecossistema do Spark especializado em aplicações de aprendizado de máquina. Questão3 a Questão4 a Questão5 a 18/11/2022 15:38 Estácio: Alunos https://ead.estacio.br/alunos/ 3/5 GraphX Learning MLlib MLSpark RDDs Spark Learning Respondido em 18/11/2022 15:25:08 Explicação: Gabarito: MLlib Justificativa: O componente MLlib é o componente do ecossistema do Spark usado para implementar algoritmos estatísticos e de aprendizado de máquina para simplificar pipelines de aprendizado de máquina em projetos de big data. As opções Spark Learning, GraphX Learning e MLSpark não são componentes válidos do Spark. Os RDDs são componentes para conjunto de dados resilientes. Acerto: 1,0 / 1,0 O paradigma MapReduce é uma estratégia de computação com capacidade de processar grandes conjuntos de dados de maneira distribuída em várias máquinas. Em relação à técnica MapReduce, selecione a opção que é responsável por consolidar os resultados produzidos ao longo do processamento. Processamento Mapeamento Agregação Redução Separação Respondido em 18/11/2022 15:25:43 Explicação: Gabarito: Redução Justificativa: A função de redução agrupa os pares após a fase de embaralhamento concluindo o processamento dos dados. O MapReduce é uma técnica clássica de programação distribuída e é bastante utilizada por diversos frameworks como o Spark, por exemplo. Acerto: 1,0 / 1,0 Dados categóricos são aqueles normalmente expressos por texto, que representam rótulos, nomes e símbolos. Qual tipo de visualização de dados abaixo é recomendado para dados categóricos? Gráfico de Matriz de Dispersão. Gráficos de Barra. Gráfico de Estrela. Gráficos de Linha. Gráfico de Faces de Chernoff. Respondido em 18/11/2022 15:37:33 Explicação: O gráfico de barras mostra as proporções dos dados categóricos assim evidenciando os extratos da amostra. Lembrando que os dados categóricos não se encaixam nos gráficos de dados numéricos, como o de dispersão causando confusão na função de visualização ou quebrando a mesma dependendo da biblioteca escolhida. Questão6 a Questão7 a 18/11/2022 15:38 Estácio: Alunos https://ead.estacio.br/alunos/ 4/5 Acerto: 1,0 / 1,0 Bibliotecas poderosas de análise e manipulação de dados podem ser utilizadas com a linguagem Python. Qual o método utilizado para fazer a junção entre DataFrames no pandas? set_index merge values reset_index sum Respondido em 18/11/2022 15:36:24 Explicação: O método merge é equivalente ao join da SQL que junta dois DataFrames a partir de indexes do mesmo nome, ou de indexes pré-definidos pelo cientista de dados. As demais alternativas não dizem respeito à operação de junção entre DataFrames. Acerto: 1,0 / 1,0 As redes neurais são implementadas em Python através de uma biblioteca de processamento de cálculos em paralelo baseada em grafos. Qual o nome desta biblioteca? Numpy Scipy Pandas Plotly Tensorflow Respondido em 18/11/2022 15:34:01 Explicação: A biblioteca TensorFlow foi criada com a finalidade de processar cálculos de forma paralela, em estruturas de grafos a fim de otimizar estes tipos de processamento, mas, devido à natureza dos modelos conexionistas, tal biblioteca foi redefinida como a principal biblioteca para implementação de redes neurais. Acerto: 1,0 / 1,0 Leonardo começou seu trabalho de conclusão de curso. Nesse trabalho, Leonardo quer elaborar um classificador de imagem, mas, não sabe se decidir com relação à configuração das camadas de sua rede neural. É muito comum utilizarmos o conjunto ________ para fazermos o benchmark de modelos de ______________: Pizzas; Categorias MNIST; Processamento de Imagens IRIS; Processamento de Imagens IRIS; Processamento da Linguagem Natural MNIST; Processamento de Linguagem Natural Respondido em 18/11/2022 15:28:46 Explicação: Questão8 a Questão9 a Questão10 a 18/11/2022 15:38 Estácio: Alunos https://ead.estacio.br/alunos/ 5/5 O conjunto MNIST de dígitos escritos a mão é um dos conjuntos mais conhecidos na literatura de aprendizado de máquina. Mas, essa fama não é à toa, pois esse é o conjunto de comparação entre modelos de processamentode imagens, uma vez que uma boa configuração de rede neural deve ser capaz de reconhecer os dígitos escritos a mão do MNIST. javascript:abre_colabore('38403','299980794','5946949028');
Compartilhar