Buscar

Uma empresa de gestão de transporte de metrô quer aprimorar as linhas que atendem a população, usando para isso Data Science. Querem poder melhorar...

Uma empresa de gestão de transporte de metrô quer aprimorar as linhas que atendem a população, usando para isso Data Science. Querem poder melhorar a previsibilidade de uso das estações e interligações e mudar a programação de trens de acordo com as demandas. Eles possuem uma plataforma de IoT com dados dos trens em funcionamento e toda a operação das linhas, um sistema de cartões que torna possível a identificação dos usuários mais frequentes (não nomes, apenas o código do cartão), um banco de dados relacional que possui a programação dos trens e acesso às informações das catracas com os dados dos cartões. Com base no texto acima e no conteúdo estudado, relacione as ferramentas do ecossistema do Hadoop às situações nas quais podem ser usadas inicialmente para a solução que atenda à empresa (algumas ferramentas podem ter mais de um papel): 1) Sqoop. 2) Spark + MLlib. 3) Kafka + Spark + MLlib. 4) Flume ou Kafka. I. ( ) Entrada de dados não estruturados das Catracas e Trens. II. ( ) Entrada de dados estruturados para planejamento de horários dos trens. III. ( ) Treinamento de Machine Learning identificando o comportamento das estações e destinos dos usuários. IV. ( ) Aplicação dos modelos de Machine Learning na programação dos trens offline. V. ( ) Análise online dos fluxos das catracas para identificar possíveis mudanças de planejamento online. Agora, assinale a alternativa que apresenta a sequência correta: 1, 2, 3, 3, 4. 4, 2, 1, 1, 3. 3, 1, 2, 2, 4 4, 1, 2, 2, 3. 2, 1, 4, 4, 3.

Respostas

User badge image

Ed Verified user icon

A sequência correta é: 4, 1, 2, 2, 3. Explicação: - Sqoop é uma ferramenta usada para importar dados de bancos de dados relacionais para o Hadoop, portanto, é utilizada para entrada de dados estruturados para planejamento de horários dos trens (alternativa 1). - Spark + MLlib é uma ferramenta usada para processamento de dados em larga escala e para treinamento de modelos de Machine Learning, portanto, é utilizada para treinamento de Machine Learning identificando o comportamento das estações e destinos dos usuários (alternativa 3) e aplicação dos modelos de Machine Learning na programação dos trens offline (alternativa 4). - Kafka + Spark + MLlib é uma ferramenta usada para processamento de dados em tempo real e para treinamento de modelos de Machine Learning, portanto, é utilizada para análise online dos fluxos das catracas para identificar possíveis mudanças de planejamento online (alternativa 5). - Flume ou Kafka são ferramentas usadas para ingestão de dados em tempo real, portanto, é utilizada para entrada de dados não estruturados das Catracas e Trens (alternativa 2). Assim, a sequência correta é 4, 1, 2, 2, 3.

0
Dislike0

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Responda

SetasNegritoItálicoSublinhadoTachadoCitaçãoCódigoLista numeradaLista com marcadoresSubscritoSobrescritoDiminuir recuoAumentar recuoCor da fonteCor de fundoAlinhamentoLimparInserir linkImagemFórmula

Para escrever sua resposta aqui, entre ou crie uma conta

User badge image

Continue navegando