Baixe o app para aproveitar ainda mais
Prévia do material em texto
Disciplina: TÓPICOS DE BIG DATA EM PYTHON AV Aluno: TIAGO JOSE DE LIMA 202004083902 Professor: ROBSON LORBIESKI Turma: 9001 EEX0174_AV_202004083902 (AG) 03/06/2022 10:03:14 (F) Avaliação: 2,0 Nota Partic.: Av. Parcial.: 2,0 Nota SIA: 2,0 pts Estação de trabalho liberada pelo CPF 13936051763 com o token 267030 em 03/06/2022 10:02:28. O aproveitamento da Avaliação Parcial será considerado apenas para as provas com nota maior ou igual a 4,0. 02260 - ANÁLISE DE DADOS EM PYTHON COM PANDAS 1. Ref.: 6076764 Pontos: 0,00 / 1,00 A biblioteca pandas é poderosa e de grande valia para a vida de um cientista de dados. Sobre ela podemos afirmar que: I - O nome Pandas se refere a dados em painel ou panel data II - O DataFrame é o coletivo de listas (lists) III - É possível criarmos DataFrames a partir de praticamente qualquer estrutura de dados, principalmente CSVs, Excels, e JSONsAnalise as frases listadas e assinale a alternativa correta. Apenas II. Apenas II e III. Apenas I e II. Apenas I. Apenas I e III. 2. Ref.: 6076846 Pontos: 0,00 / 1,00 Os dados que, por alguma razão, normalmente interferência humana, não chegam com todos os atributos esperados durante a coleta de dados, são conhecidos como: Faltantes. Enviesados. Nulos. Embaralhados. Corrompidos. 02318 - BIG DATA ANALYTICS 3. Ref.: 6075832 Pontos: 0,00 / 1,00 Luís foi contratado recentemente para trabalhar em uma empresa de consultoria de análise de dados. O projeto no qual foi alocado já havia começado, e os colegas de Luís lhe disseram que estavam preparando o conjunto de dados para poder passar os mesmos por um modelo de árvore de decisão. Já que especificamente os colegas de Luís estão removendo dados faltantes, em qual etapa do processo de KDD, Luís se encontra: Transformação de Dados. Pré-Processamento . Avaliação. Descoberta de Padrões. Coleta de Dados. 4. Ref.: 6075830 Pontos: 0,00 / 1,00 O boom da IA se deve ao surgimento de novas tecnologias e dispositivos que por estarem sempre conectados produzem uma quantidade enorme de dados. Estes dados que alimentam os modelos de aprendizado de máquina também são conhecidos como: Informações. Observações. Conhecimento. Big Data. Dados Faltantes. 02508 - HADOOP E ARMAZENAMENTO DE DADOS 5. Ref.: 6076138 Pontos: 0,00 / 1,00 Em relação aos RDBMS, selecione a opção que apresenta a característica que trata as transações em um banco de dados como uma unidade indivisível. Indivisibilidade. Consistência. Isolamento. Durabilidade. Atomicidade. 6. Ref.: 6075861 Pontos: 0,00 / 1,00 Ser capaz de gerenciar uma infraestrutura complexa é uma habilidade fundamental para o profissional de Tecnologia da Informação. Sendo assim, analise as alternativas e selecione a opção que apresenta o componente responsável por desempenhar o papel de mestre na arquitetura do Hadoop. Replicador NameNode HServerMap Bloco de dados DataNode 02727 - PRINCÍPIOS DE BIG DATA 7. Ref.: 6067294 Pontos: 1,00 / 1,00 Selecione a opção a respeito da computação em nuvem. é uma outra forma de denominar a internet das coisas é uma forma de abstrair serviços da internet das coisas em redes locais distribuídas é um conjunto de tecnologias que disponibilizam sistemas e recursos na internet é a definição para aplicações de Big Data que utilizam os protocolos de internet trata-se da utilização de aplicações com finalidades específicas 8. Ref.: 6067388 Pontos: 0,00 / 1,00 Em relação às aplicações de Internet das coisas, selecione a opção correta sobre os seus objetivos. Aumentar a complexidade do processo de gestão dos dados Melhorar a interatividade com o usuário Obter dados que sirvam como base na tomada de decisão Aumentar a diversidade dos dados Ampliar o volume de dados da aplicação 02729 - PRINCIPIOS DE DESENVOLVIMENTO DE SPARK COM PYTHON 9. Ref.: 6076011 Pontos: 0,00 / 1,00 A escolha adequada de uma linguagem de programação é fundamental para a maximização dos resultados almejados. Nesse sentido, selecione a opção que contém a linguagem de programação mais adequada para desenvolver aplicações para o Spark. R Python Java Script Java Scala 10. Ref.: 6082362 Pontos: 1,00 / 1,00 O MapReduce é uma técnica de computação distribuída considerada extremamente eficiente para o processamento de dados, desempenhando papel fundamental no Spark. Em relação ao MapReduce, selecione a opção correta. A principal característica do MapReduce é a utilização eficiente da memória. Projetos de big data só podem ser tratados por MapReduce. As fases de processamento do MapReduce podem variar de acordo com a aplicação. Pode ser aplicada para projetos que envolvam grandes volumes e variedade de dados. Só é possível utilizar o MapReduce no Spark através do PySpark.
Compartilhar