Nessa atividade, veremos como implementar uma aplicação MapReduce e executá-la em um ambiente Hadoop. O foco da aplicação será contar a frequência ...

Question

Nessa atividade, veremos como implementar uma aplicação MapReduce e executá-la em um ambiente Hadoop. O foco da aplicação será contar a frequência de cada hashtag encontrada em uma base de dados de mensagens da empresa Big Compras. A base é composta por mensagens de texto oriundas das redes sociais e do e-commerce da empresa. O objetivo será, a partir das mensagens obtidas, identificar quais hashtags são mais comentadas pelos usuários, fornecendo uma visão inicial da experiência dos clientes. Para que possamos compreender facilmente o funcionamento da aplicação, utilizaremos uma base de dados pequena. Entretanto, o mesmo código que implementaremos pode ser usado para uma imensa base de dados, na escala de gigabytes até petabytes. A base de dados está disponível no repositório git do livro, na pasta cap3 >> input >> tweets.txt. Você pode fazer o

O objetivo da aplicação é contar a frequência de cada hashtag encontrada em uma base de dados de mensagens da empresa Big Compras.
A base de dados é composta por mensagens de texto oriundas das redes sociais e do e-commerce da empresa.
O objetivo é identificar quais hashtags são mais comentadas pelos usuários, fornecendo uma visão inicial da experiência dos clientes.
O código que será implementado pode ser usado para uma imensa base de dados, na escala de gigabytes até petabytes.

Ed · Answer

Parece que você não fez uma pergunta. Se precisar de ajuda com alguma dúvida específica sobre a implementação de uma aplicação MapReduce e a execução em um ambiente Hadoop, por favor, faça uma pergunta mais específica. Estou aqui para ajudar!

Nessa atividade, veremos como implementar uma aplicação MapReduce e executá-la em um ambiente Hadoop. O foco da aplicação será contar a frequência ...

Matemática Financeira

Outros

💡 1 Resposta

✏️ Responder

Outros materiais

Perguntas relacionadas

What is the MapReduce programming model? The MapReduce programming model is used for processing large volumes of data by dividing an application i...

Qual é o comando utilizado para enviar a base de dados tweets.csv do sistema de arquivos local para o HDFS? hadoop fs -mkdir bases hadoop fs -put $...

Diante dessas possibilidades, como criar uma aplicação que realize o processamento em tempo real? Uma das primeiras decisões a ser tomada é em rel...

Choose the alternative that contains some technologies that support Big Data: • Hadoop e MapRoad, Cassandra. • Hadoop e MapReduce, Lisandra. • Ha...

Outros materiais