Logo Passei Direto
Buscar
Considere que você possui um conjunto de dados onde já um campo Idiomas que podem assumir 3 valores: português, espanhol e inglês. Valendo dos seus conhecimentos sobre dados categóricos, uma possível codificação one-hot para este campo seria:

A português (1), espanhol (2), inglês (3)
B português (00), espanhol (10), inglês (11)
C português (000), espanhol (001), inglês (010)
D português (001), espanhol (002), inglês (003)
E português (001), espanhol (010), inglês (100)
User badge image
Questões Para a Compreensão

ano passado

Respostas

User badge image

Ed Verified user icon

ano passado

A codificação one-hot é uma técnica utilizada para representar dados categóricos, onde cada categoria é transformada em uma coluna binária. Para o campo "Idiomas" com os valores "português", "espanhol" e "inglês", a codificação one-hot seria: - português: 1 0 0 - espanhol: 0 1 0 - inglês: 0 0 1 Analisando as opções: A) português (1), espanhol (2), inglês (3) - Isso é uma codificação numérica, não one-hot. B) português (00), espanhol (10), inglês (11) - Isso não representa corretamente a codificação one-hot. C) português (000), espanhol (001), inglês (010) - Isso não é uma representação one-hot. D) português (001), espanhol (002), inglês (003) - Isso também não é one-hot. E) português (001), espanhol (010), inglês (100) - Esta opção representa corretamente a codificação one-hot. Portanto, a alternativa correta é: E) português (001), espanhol (010), inglês (100).

Essa resposta te ajudou?

0
Dislike0
left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar essa resposta. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Ainda com dúvidas?

Envie uma pergunta e tenha sua dúvida de estudo respondida!

Essa pergunta também está no material:

Mais perguntas desse material

De acordo com os seus conhecimentos sobre dados categóricos e one-hot encoding, podemos dizer que uma grande diferença entre representar uma variável categórica por valores numéricos e one-hot encoding é:

A que a primeira representa melhor que segunda
B que a segunda representa melhor que a primeira
C a primeira serve apenas determinados tipos de valores
D a segunda serve apenas para determinados tipos de valores
E a segunda cria variáveis derivadas, aumentando o número de atributos

De acordo com o seu conhecimento do algoritmo k-means e do método do cotovelo para determinar o melhor número de clusters, o valor mais adequado se encontra no intervalo:

A entre 6 e 8
B acima de 10
C abaixo de 2
D entre 2 e 4
E entre 4 e 6

Considerando o texto acima e valendo-se do seu conhecimento sobre aprendizagem de máquina, caso você necessite de um modelo para determinar o preço de um determinado produto, em um ambiente de recursos limitados, sua escolha mais provável seria:

A modelo de Regressão Linear
B rede do tipo LSTM
C rede do tipo CNN

Mais conteúdos dessa disciplina