Baixe o app para aproveitar ainda mais
Prévia do material em texto
Teste de Conhecimento avalie sua aprendizagem TÓPICOS DE BIG DATA EM PYTHON EEX0174_202004242491_TEMAS Aluno: WESLEY ALVES DE OLIVEIRA Matr.: 202004242491 Disc.: TÓP BIG EM PYT 2022.1 EAD (GT) / EX Prezado (a) Aluno(a), Você fará agora seu TESTE DE CONHECIMENTO! Lembre-se que este exercício é opcional, mas não valerá ponto para sua avaliação. O mesmo será composto de questões de múltipla escolha. Após responde cada questão, você terá acesso ao gabarito comentado e/ou à explicação da mesma. Aproveite para se familiarizar com este modelo de questões que será usado na sua AV e AVS. 1. Selecione a opção em que a computação se refere à execução de aplicações e serviços em uma rede distribuída usando recursos virtualizados. Computação de Big Data Computação centralizada Computação de banco de dados Computação em Nuvem Computação Paralela Data Resp.: 19/03/2022 21:28:55 Explicação: As aplicações de computação em nuvem são acessadas por protocolos de Internet e padrões de rede. As demais opções estão erradas, pois nenhuma delas trabalha obrigatoriamente com protocolos de internet. 2. Selecione a opção em que a camada fornece comunicação ponta a ponta nas aplicações de internet das coisas. Camada de enlace de dados Camada de sessão Camada de aplicação Camada lógica Camada de transporte Data Resp.: 19/03/2022 21:28:45 Explicação: A camada de transporte é encarregada pela comunicação ponta a ponta entre as aplicações e oferece confiabilidade, além de garantir que os pacotes serão entregues da mesma forma que o usuário os enviou. Em relação às outras opções, a camada lógica simplesmente não existe. Já a camada de enlace de dados detecta erros e, quando necessário, os corrige. A camada de sessão trata dos processos responsáveis pela transferência de dados. Por fim, a camada de aplicação é responsável pela comunicação fim-a-fim entre processos. 3. O Hadoop é uma tecnologia especializada em atender as demandas de Big Data. Selecione a opção correta que contenha a linguagem de programação utilizada para o desenvolvimento e implementação do Hadoop. Python Perl Java Script Lua Java Data Resp.: 19/03/2022 21:33:39 Explicação: O Hadoop foi desenvolvido usando, originalmente, a linguagem de programação Java na distribuição livre da Apache Foundation. Atualmente, diferentes distribuições do framework estão implementadas em diversas linguagens, entre as quais o Python. 4. O Hadoop é um framework de código aberto voltado para aplicações de Big Data. Neste sentido, selecione a alternativa correta que apresenta um grande desafio no processo de configuração e gerenciamento do Hadoop. Processos de extração, transformação e carregamento dos dados. Mecanismo para melhorar o processamento dos dados. Gerenciamento do armazenamento de dados. Aplicar políticas de segurança. Tratar dados não-estruturados. Data Resp.: 19/03/2022 21:33:07 Explicação: O tratamento da segurança da informação é um grande desafio para o Hadoop, pois o profissional responsável por essa etapa terá que configurar o sistema que, pela natureza dos problemas de Big Data, é uma tarefa complexa. 5. O PySpark caracteriza-se como uma biblioteca Spark responsável por executar programas usando recursos do Apache Spark. Selecione a opção correta que contenha itens que são pré-requisitos de instalação para utilização do PySpark. Hadoop e Spark Java e Python Python e Escala Java e R Casandra e Spark Data Resp.: 19/03/2022 21:29:32 Explicação: Gabarito: Java e Python Justificativa: A utilização do PySpark depende principalmente de três pré-requisitos: instalação e configuração do Java, Python e do Spark. Além disso, é necessário tratar detalhes da plataforma sobre a qual o Spark vai rodar. No caso do Google Colab, é necessário instalar o FindSpark e o próprio PySpark também. 6. O MapReduce é uma técnica clássica de programação e é bastante utilizada por diversos frameworks como o Spark, por exemplo. Em relação à técnica MapReduce, selecione a opção correta. Foi substituída no Spark por acesso direto à memória Consiste em uma técnica de programação sequencial É uma técnica de computação distribuída Só pode ser aplicada para grandes volumes de dados É uma técnica lenta para processamento de grandes volumes de dados Data Resp.: 19/03/2022 21:29:47 Explicação: Gabarito: É uma técnica de computação distribuída Justificativa: O MapReduce é uma técnica de computação distribuída que apesar de clássica ainda é considerada muito eficiente para processamento de grandes volumes de dados. Apesar de ser adequada para projetos de big data, ela também pode ser utilizada para menores volumes, mas não é apropriada para esses casos. 7. A linguagem Python se destaca como intuitiva e de fácil aprendizagem. Analise o código abaixo que apresenta laços condicionais e instruções de repetição. for i in range(10): if (i%2==0): print(i) Qual a saída esperada após a execução do programa? Serão impressos no console os números pares entre 1 e 10. Serão impressos no console os números racionais entre 0 e 9. Serão impressos no console os números pares entre 0 e 9. Serão impressos no console os números ímpares entre 0 e 9. Serão impressos no console os números ímpares entre 0 e 10. Data Resp.: 19/03/2022 21:32:56 Explicação: O constructo de laço que itera sobre uma sequência dos números reais de 0 a 9, e cujo condicional dentro do laço escolhe apenas os números cujo resto de sua divisão por 2 seja 0, condição lógica que define se um número é par ou não. 8. Compreender a análise de dados em Python é fundamental para o cientista de dados. Qual o papel do sistema pip da linguagem Python? Biblioteca de Processamento de Linguagem Natural. Gerenciador de memória do Python. Gerenciador de Pacotes do Python. Motor de Busca da IDE do Python. Gerenciador de espaços virtuais do Python. Data Resp.: 19/03/2022 21:32:32 Explicação: O papel do comando pip é gerenciar os pacotes a serem importados no Python, bem como instalá-los via comando pip install. Gerenciar memória é papel do sistema operacional, não do pip. A função de gerenciar espaços virtuais é atribuída ao venv, o virtualenv. Motor de busca é uma atribuição de IDE, não de linguagem de programação. O processamento de linguagem natural é função de biblioteca, diferente de gerenciamento de pacotes. 9. Qual destes modelos é adequado para um problema de classificação? I - SVM II - Árvore de Decisão III - K-Médias Apenas as opções I e II Apenas as opções I e III Apenas as opções II e III Todas as opções I, II e III Apenas a opção III Data Resp.: 19/03/2022 21:31:23 Explicação: O aprendizado supervisionado contempla duas técnicas de aprendizado de máquina, a regressão e a classificação. Da classificação nossas opções são a árvore de decisão, a SVM, o KNN, as redes neurais entre outras. Mas, o modelo k-médias é uma técnica de aprendizado não supervisionado. 10. As redes neurais são modelos poderosos cujo principal componente onde estão armazenados seus conhecimentos é(são) Camada de Saída Pesos Vieses Função de Ativação Camadas Escondidas Data Resp.: 19/03/2022 21:31:04 Explicação: O conhecimento dos modelos conexionistas é localizado em suas camadas internas ocultas ou escondidas (hidden),pois é lá que se encontram as matrizes de pesos, vieses e funções de ativação que, ao trabalharem juntas, produzem o conhecimento necessário para discriminar novas observações com base em registros passados. Não Respondida Não Gravada Gravada Exercício inciado em 18/03/2022 23:01:20.
Compartilhar