Uma empresa de gestão de transporte de metrô quer aprimorar as linhas que atendem a população, usando para isso Data Science. Querem poder melhorar...

Question

Uma empresa de gestão de transporte de metrô quer aprimorar as linhas que atendem a população, usando para isso Data Science. Querem poder melhorar...

Uma empresa de gestão de transporte de metrô quer aprimorar as linhas que atendem a população, usando para isso Data Science. Querem poder melhorar a previsibilidade de uso das estações e interligações e mudar a programação de trens de acordo com as demandas. Eles possuem uma plataforma de IoT com dados dos trens em funcionamento e toda a operação das linhas, um sistema de cartões que torna possível a identificação dos usuários mais frequentes (não nomes, apenas o código do cartão), um banco de dados relacional que possui a programação dos trens e acesso às informações das catracas com os dados dos cartões. Com base no texto acima e no conteúdo estudado, relacione as ferramentas do ecossistema do Hadoop às situações nas quais podem ser usadas inicialmente para a solução que atenda à empresa (algumas ferramentas podem ter mais de um papel): 1) Sqoop. 2) Spark + MLlib. 3) Kafka + Spark + MLlib. 4) Flume ou Kafka. I. ( ) Entrada de dados não estruturados das Catracas e Trens. II. ( ) Entrada de dados estruturados para planejamento de horários dos trens. III. ( ) Treinamento de Machine Learning identificando o comportamento das estações e destinos dos usuários. IV. ( ) Aplicação dos modelos de Machine Learning na programação dos trens offline. V. ( ) Análise online dos fluxos das catracas para identificar possíveis mudanças de planejamento online. Agora, assinale a alternativa que apresenta a sequência correta: 1, 2, 3, 3, 4. 4, 2, 1, 1, 3. 3, 1, 2, 2, 4 4, 1, 2, 2, 3. 2, 1, 4, 4, 3.

Projetos de Estruturas Metálicas

•

ESTÁCIO

Valdinei Martins

05/03/2024

Ed · Answer

A sequência correta é: 4, 1, 2, 2, 3.

Explicação:
- Sqoop é uma ferramenta usada para importar dados de bancos de dados relacionais para o Hadoop, portanto, é utilizada para entrada de dados estruturados para planejamento de horários dos trens (alternativa 1).
- Spark + MLlib é uma ferramenta usada para processamento de dados em larga escala e para treinamento de modelos de Machine Learning, portanto, é utilizada para treinamento de Machine Learning identificando o comportamento das estações e destinos dos usuários (alternativa 3) e aplicação dos modelos de Machine Learning na programação dos trens offline (alternativa 4).
- Kafka + Spark + MLlib é uma ferramenta usada para processamento de dados em tempo real e para treinamento de modelos de Machine Learning, portanto, é utilizada para análise online dos fluxos das catracas para identificar possíveis mudanças de planejamento online (alternativa 5).
- Flume ou Kafka são ferramentas usadas para ingestão de dados em tempo real, portanto, é utilizada para entrada de dados não estruturados das Catracas e Trens (alternativa 2).

Assim, a sequência correta é 4, 1, 2, 2, 3.

Uma empresa de gestão de transporte de metrô quer aprimorar as linhas que atendem a população, usando para isso Data Science. Querem poder melhorar...

Projetos de Estruturas Metálicas

ESTÁCIO

Respostas

Faça como milhares de estudantes: teste grátis o Passei Direto

Agora você pode testar o

Passei Direto grátis

Responda

Continue navegando

Perguntas relacionadas

Em uma indústria de manufatura dedicada à produção de componentes eletrônicos, a equipe de gestão tem explorado maneiras de aprimorar a tomada de d...

Plano de aula para indivíduo adulto que gostaria de aprimorar suas técnicas de natação para fins de condicionamento físico, sem objetivo competitiv...

A falta de dados para gerar informações e tomadas de decisões pode afetar diretamente a competitividade da empresa. A gestão poderia ser aprimorada...

Registros de log são uma ferramenta fundamental de coleta de informações, análise e resolução de problemas. O Syslog é um padrão criado pela IETF a...

Materiais relacionados