Nessa atividade, veremos como implementar uma aplicação MapReduce e executá-la em um ambiente Hadoop. O foco da aplicação será contar a frequência ...
Nessa atividade, veremos como implementar uma aplicação MapReduce e executá-la em um ambiente Hadoop. O foco da aplicação será contar a frequência de cada hashtag encontrada em uma base de dados de mensagens da empresa Big Compras. A base é composta por mensagens de texto oriundas das redes sociais e do e-commerce da empresa. O objetivo será, a partir das mensagens obtidas, identificar quais hashtags são mais comentadas pelos usuários, fornecendo uma visão inicial da experiência dos clientes. Para que possamos compreender facilmente o funcionamento da aplicação, utilizaremos uma base de dados pequena. Entretanto, o mesmo código que implementaremos pode ser usado para uma imensa base de dados, na escala de gigabytes até petabytes. A base de dados está disponível no repositório git do livro, na pasta cap3 >> input >> tweets.txt. Você pode fazer o
O objetivo da aplicação é contar a frequência de cada hashtag encontrada em uma base de dados de mensagens da empresa Big Compras. A base de dados é composta por mensagens de texto oriundas das redes sociais e do e-commerce da empresa. O objetivo é identificar quais hashtags são mais comentadas pelos usuários, fornecendo uma visão inicial da experiência dos clientes. O código que será implementado pode ser usado para uma imensa base de dados, na escala de gigabytes até petabytes.
Parece que você não fez uma pergunta. Se precisar de ajuda com alguma dúvida específica sobre a implementação de uma aplicação MapReduce e a execução em um ambiente Hadoop, por favor, faça uma pergunta mais específica. Estou aqui para ajudar!
0
0
✏️ Responder
Para escrever sua resposta aqui, entre ou crie uma conta
Compartilhar