Prévia do material em texto
23/06/2022 22:50 EPS https://simulado.estacio.br/alunos/ 1/3 ÁLVARO CIRIBELLI BORGES 202003203361 Disciplina: TÓPICOS DE BIG DATA EM PYTHON AV Aluno: ÁLVARO CIRIBELLI BORGES 202003203361 Professor: ROBSON LORBIESKI Turma: 9001 EEX0174_AV_202003203361 (AG) 03/06/2022 15:55:11 (F) Avaliação: 2,0 Av. Parcial.: 2,0 Nota SIA: 2,0 pts Dispositivo liberado pela Matrícula 202003203361 com o token 366277 em 03/06/2022 15:55:04. O aproveitamento da Avaliação Parcial será considerado apenas para as provas com nota maior ou igual a 4,0. 02260 - ANÁLISE DE DADOS EM PYTHON COM PANDAS 1. Ref.: 6076846 Pontos: 0,00 / 1,00 Os dados que, por alguma razão, normalmente interferência humana, não chegam com todos os atributos esperados durante a coleta de dados, são conhecidos como: Embaralhados. Faltantes. Corrompidos. Nulos. Enviesados. 2. Ref.: 6076628 Pontos: 1,00 / 1,00 O seguinte constructo da linguagem Python representa o condicional simples: for if with while else 02318 - BIG DATA ANALYTICS 3. Ref.: 6075830 Pontos: 0,00 / 1,00 O boom da IA se deve ao surgimento de novas tecnologias e dispositivos que por estarem sempre conectados produzem uma quantidade enorme de dados. Estes dados que alimentam os modelos de aprendizado de máquina também são conhecidos como: Educational Performace Solution EPS ® - Alunos javascript:voltar(); javascript:alert('C%C3%B3digo da quest%C3%A3o: 6076846.'); javascript:alert('C%C3%B3digo da quest%C3%A3o: 6076628.'); javascript:alert('C%C3%B3digo da quest%C3%A3o: 6075830.'); javascript:alert('Educational Performace Solution\n\nEPS: M%C3%B3dulo do Aluno\n\nAxiom Consultoria em Tecnologia da Informa%C3%A7%C3%A3o Ltda.') 23/06/2022 22:50 EPS https://simulado.estacio.br/alunos/ 2/3 Informações. Conhecimento. Observações. Dados Faltantes. Big Data. 4. Ref.: 6075828 Pontos: 0,00 / 1,00 Os modelos simbólicos são aqueles que: Se baseiam em táticas de agrupamento por similaridade Se baseiam estritamente em dados e inferências estatísticas em cima deles São aqueles que lidam apenas com problemas numéricos Se baseiam em lógica e regras de inferência para aprender e raciocinar São aqueles que só lidam com problemas categóricos 02508 - HADOOP E ARMAZENAMENTO DE DADOS 5. Ref.: 6076138 Pontos: 0,00 / 1,00 Em relação aos RDBMS, selecione a opção que apresenta a característica que trata as transações em um banco de dados como uma unidade indivisível. Consistência. Atomicidade. Isolamento. Durabilidade. Indivisibilidade. 6. Ref.: 6076199 Pontos: 0,00 / 1,00 O sistema de arquivos distribuídos do Hadoop, conhecido como HDFS, foi idealizado para trabalhar com grandes volumes de dados. Selecione a opção correta que apresenta o paradigma como o HDFS funciona. Mestre e escravo. Centralizado e centralizado. Centralizado e distribuído. Distribuído e centralizado. Distribuído e distribuído. 02727 - PRINCÍPIOS DE BIG DATA 7. Ref.: 6067292 Pontos: 0,00 / 1,00 Em relação à Internet das coisas, selecione a opção correta que relaciona os dispositivos com aos servidores de aplicação. Dispositivos de recepção Redes locais Servidores de banco de dados Tecnologia proprietária Nuvem Educational Performace Solution EPS ® - Alunos javascript:alert('C%C3%B3digo da quest%C3%A3o: 6075828.'); javascript:alert('C%C3%B3digo da quest%C3%A3o: 6076138.'); javascript:alert('C%C3%B3digo da quest%C3%A3o: 6076199.'); javascript:alert('C%C3%B3digo da quest%C3%A3o: 6067292.'); javascript:alert('Educational Performace Solution\n\nEPS: M%C3%B3dulo do Aluno\n\nAxiom Consultoria em Tecnologia da Informa%C3%A7%C3%A3o Ltda.') 23/06/2022 22:50 EPS https://simulado.estacio.br/alunos/ 3/3 8. Ref.: 6067455 Pontos: 0,00 / 1,00 Em relação às redes de Internet das coisas, selecione a opção correta que relaciona os dispositivos entre si. É uma conexão rede a rede São um relacionamento máquina a máquina São um conjunto de sinais São redes locais São interconectados entre si 02729 - PRINCIPIOS DE DESENVOLVIMENTO DE SPARK COM PYTHON 9. Ref.: 6076005 Pontos: 0,00 / 1,00 As bibliotecas são coleções de subprogramas utilizados no desenvolvimento de softwares. Selecione a opção correta que contém o componente do ecossistema do Spark responsável por realizar operações paralelas em grafos. MLlib Spark Core Spark Streaming RDDs GraphX 10. Ref.: 6076009 Pontos: 1,00 / 1,00 A biblioteca Pandas é amplamente utilizada para manipular dados heterogêneos, situação recorrente para aplicações de Big Data. Nesse sentido, selecione a opção que contém a estrutura de dados que possibilita o Cientista de dados atribuir nome para as colunas. RDD PySpark SQL DataFrame numpy.array Educational Performace Solution EPS ® - Alunos javascript:alert('C%C3%B3digo da quest%C3%A3o: 6067455.'); javascript:alert('C%C3%B3digo da quest%C3%A3o: 6076005.'); javascript:alert('C%C3%B3digo da quest%C3%A3o: 6076009.'); javascript:alert('Educational Performace Solution\n\nEPS: M%C3%B3dulo do Aluno\n\nAxiom Consultoria em Tecnologia da Informa%C3%A7%C3%A3o Ltda.')