Pergunta 4
Suponha que você é o dono de uma grande empresa online de filmes e projetou utilizar um modelo de filtragem colaborativa. Para fomentar ...
Pergunta 4 Suponha que você é o dono de uma grande empresa online de filmes e projetou utilizar um modelo de filtragem colaborativa. Para fomentar o seu modelo, você adquiriu dados já existentes de três plataformas de avaliação de filmes online (chamadas de A, B e C), em que os usuários acessam e avaliam os filmes que já assistiram. Portanto, você pretende unir os três conjuntos de dados adquiridos para serem utilizados pelo mesmo sistema. Contudo, no sistema A, usuários avaliam os filmes numa escala de 1 a 5 estrelas. Por sua vez, no sistema B, os usuários avaliam os filmes na escala de 1 - 10 e valores decimais (e.g., 7.5) são permitidos. E no sistema C, os usuários avaliam em uma escala de 1 - 100. Você também tem informações suficientes para identificar os usuários/itens de um sistema em outro. Com base nessas informações, qual das alternativas é verdadeira?
Você pode combinar as três bases de dados em uma só, mas você precisa normalizar a escala de ratings (para valores entre 0-1, por exemplo) antes de juntar os dados. Você pode combinar as três bases de dados em uma só e simplesmente aplicar um processo de mean normalization após a junção dos dados para utilizá-los. Assumindo que pelo menos um item ou usuário de um sistema não exista em outro sistema, não é possível combinar as duas bases de dados porque está faltando dados. Não é possível combinar essas três bases de dados. Você precisa implementar um modelo de recomendação para cada uma delas.
Analisando as informações fornecidas, a alternativa correta é:
Você pode combinar as três bases de dados em uma só, mas você precisa normalizar a escala de ratings (para valores entre 0-1, por exemplo) antes de juntar os dados.
0
0
✏️ Responder
Para escrever sua resposta aqui, entre ou crie uma conta
Compartilhar