Baixe o app para aproveitar ainda mais
Prévia do material em texto
Avaliação AV avalie seus conhecimentos Lupa Calc. Notas VERIFICAR E ENCAMINHAR Disciplina: EEX0174 - TÓP BIG EM PYT Período: 2022.3 EAD (GT) Aluno: Matr.: Turma: 9001 Prezado(a) Aluno(a), Responda a todas as questões com atenção. Somente clique no botão FINALIZAR PROVA ao ter certeza de que respondeu a todas as questões e que não precisará mais alterá-las. A prova será SEM consulta. O aluno poderá fazer uso, durante a prova, de uma folha em branco, para rascunho. Nesta folha não será permitido qualquer tipo de anotação prévia, cabendo ao aplicador, nestes casos, recolher a folha de rascunho do aluno. Valor da prova: 10 pontos. 1 ponto 1. Em relação aos formatos que os dados de Big Data, selecione a opção que corresponde a quantidade de formas que podem ser encontrados. (Ref.: 202013190785) 3 2 5 4 6 1 ponto https://simulado.estacio.br/provas_emcasa_linear.asp javascript:voltar(); javascript:diminui(); javascript:aumenta(); javascript:calculadora_on(); javascript:anotar_on(); 2. Em relação às características do processamento de fluxo de dados, selecione a opção correta. (Ref.: 202013190606) O fluxo de dados é intermitente São invariáveis no tempo Sempre são do mesmo tipo São relacionados à aplicações de internet das coisas Representam o estado de um sistema em um dado momento 1 ponto 3. Em relação à fase de mapeamento do Hadoop, selecione a opção correta que apresenta o responsável pela geração de fragmento para os componentes da fase de redução. (Ref.: 202013199539) Particionador. Mapeador. Redutor. Combinador. Leitor de registros. 1 ponto 4. O sistema de arquivos distribuídos do Hadoop, conhecido como HDFS, foi idealizado para trabalhar com grandes volumes de dados. Selecione a opção correta que apresenta o paradigma como o HDFS funciona. (Ref.: 202013199598) Distribuído e distribuído. Mestre e escravo. Centralizado e distribuído. Centralizado e centralizado. Distribuído e centralizado. 1 ponto 5. Selecione a opção correta que contenha a ação responsável por retornar os elementos de um conjunto de dados como um vetor. (Ref.: 202013205765) collect reduce take coalesce join 1 ponto 6. A biblioteca Pandas é amplamente utilizada para manipular dados heterogêneos, situação recorrente para aplicações de Big Data. Nesse sentido, selecione a opção que contém a estrutura de dados que possibilita o Cientista de dados atribuir nome para as colunas. (Ref.: 202013199408) PySpark RDD numpy.array SQL DataFrame 1 ponto 7. A coleta e preparação dos dados para análise no Python são de extrema importância. Os dados secundários são assim definidos devido: (Ref.: 202013200312) A sua baixa qualidade. O fato de terem sido obtidos a partir de terceiros. O fato de virem de uma fonte alternativa não convencional. O fato de requererem muito mais pré-processamento. O fato de ocuparem menos espaço de memória. 1 ponto 8. O seguinte constructo da linguagem Python representa o condicional simples: (Ref.: 202013200027) for else if while with 1 ponto 9. O boom da IA se deve ao surgimento de novas tecnologias e dispositivos que por estarem sempre conectados produzem uma quantidade enorme de dados. Estes dados que alimentam os modelos de aprendizado de máquina também são conhecidos como: (Ref.: 202013199229) Dados Faltantes. Observações. Big Data. Conhecimento. Informações. 1 ponto 10. Os modelos simbólicos são aqueles que: (Ref.: 202013199227) Se baseiam em lógica e regras de inferência para aprender e raciocinar São aqueles que lidam apenas com problemas numéricos Se baseiam em táticas de agrupamento por similaridade São aqueles que só lidam com problemas categóricos Se baseiam estritamente em dados e inferências estatísticas em cima deles VERIFICAR E ENCAMINHAR Legenda: Questão não respondida Questão não gravada Questão gravada https://simulado.estacio.br/provas_emcasa_linear.asp javascript:abre_colabore();
Compartilhar