Respostas
A sequência correta é: 4, 1, 2, 2, 3. Explicação: - Sqoop é uma ferramenta usada para importar dados de bancos de dados relacionais para o Hadoop, portanto, é utilizada para entrada de dados estruturados para planejamento de horários dos trens (alternativa 1). - Spark + MLlib é uma ferramenta usada para processamento de dados em larga escala e para treinamento de modelos de Machine Learning, portanto, é utilizada para treinamento de Machine Learning identificando o comportamento das estações e destinos dos usuários (alternativa 3) e aplicação dos modelos de Machine Learning na programação dos trens offline (alternativa 4). - Kafka + Spark + MLlib é uma ferramenta usada para processamento de dados em tempo real e para treinamento de modelos de Machine Learning, portanto, é utilizada para análise online dos fluxos das catracas para identificar possíveis mudanças de planejamento online (alternativa 5). - Flume ou Kafka são ferramentas usadas para ingestão de dados em tempo real, portanto, é utilizada para entrada de dados não estruturados das Catracas e Trens (alternativa 2). Assim, a sequência correta é 4, 1, 2, 2, 3.
Responda
Para escrever sua resposta aqui, entre ou crie uma conta