Buscar

Apol 02


Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 7 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 7 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Continue navegando


Prévia do material em texto

Questão 1/10 - Machine Learning
“Hiperparâmetros são parâmetros de modelos que devem ser definidos antes de treinar o modelo. Para isso existem diferentes técnicas que buscam otimizá-los que resultará uma melhor acurácia em seu modelo.”
Disponível em <https://medium.com>. Acesso em 19/04/2021.
Considerando o texto acima e o seu conhecimento sobre modelos de aprendizagem não superviosionada, em especial o algoritmo k-Means, um exemplo de hiper-parâmetros para esse tipo de modelo, seria:
Nota: 10.0
	
	A
	A quantidade de dados
	
	B
	O número de clusters
Você acertou!
Justificativa:
Número de cluster é um hiperparâmetro de modelos não-supervisionados.
Quantidade de dados não é um hiperparâmetro.
Tamanho do cluster não é um hiperparâmetro que possa ser definido para modelos não supervisionados.
Taxa de erro não é um hiperparâmetro.
A taxa de aprendizado é um hiperparâmetro que determina o tamanho dos incrementos de aprendizagem a cada interação, durante o processo de direcionamento para o valor mínimo da função de custo.
	
	C
	O tamanho do cluster
	
	D
	A taxa de erro
	
	E
	A taxa de aprendizado
Questão 2/10 - Machine Learning
Você foi contratado para o posto de cientista de dados, para compor uma equipe, que atualmente já trabalha com dados, mas não possui experiência em aprendizagem de máquina. Um dos problemas que a equipe estava tentando resolver, se relacionava com um problema de classificação de duas classes (A e B), onde após diversos treinamentos, eles obtiveram dois classificadores: um que predizia a classe A com alta precisão, mas quase sempre errava as predições para a classe B e um segundo que fazia exatamente o oposto. Como o custo para retreinar os classificadores era muito alto, era preciso buscar uma solução.
Utilizando os seus conhecimentos de aprendizagem de máquina você sugeriu que:
Nota: 0.0
	
	A
	treinassem um novo classificador com metade dos dados
	
	B
	utilizassem uma rede neural que seria rápido para treinar
	
	C
	que eles utilizassem um ensemble dos dois classificadores
Justificativa:
Quando temos classificadores que somente apresentam bom desempenho em uma única classe, considerados como classificadores fracos, podemos combiná-los para obter uma classificador forte. Essa combinação recebe o nome de ensemble.
	
	D
	escolhessem aleatoriamente a cada predição
	
	E
	utilizassem regressão linear
Questão 3/10 - Machine Learning
Você foi contratado para o posto de cientista de dados, para compor uma equipe, que atualmente já trabalha com dados, mas não possui experiência em aprendizagem de máquina. Você recebeu um conjunto de dados para utilizar no treinamento de modelos de aprendizagem e foi informado que as etiquetas estava representadas na última coluna dos dados, conforme o exemplo abaixo:
Utilizando os seus conhecimentos de aprendizagem de máquina, durante a etapa de preparação dos dados e treinamento, buscando obter um modelo que possa ser utilizado em ambiente de produção, você:  
Nota: 0.0
	
	A
	utilizou cada linha de dados como vetor de atributos, sem nenhuma alteração
	
	B
	excluiu o primeiro atributo e utilizou a linha dados completa
	
	C
	utilizou os atributos de 1 a 5 como vetor de atributos
Justificativa:
A representação apresentada no texto base, se refere aos dados com a anotação da classe a que pertencem. Assim, a última coluna se refere à categoria das instâncias, não devendo ser utilizada como vetor de atributos.
	
	D
	utilizou apenas o atributo classe como vetor de atributos
	
	E
	substituiu o Atributo 1 pela Classe e utilizou para treinamento
Questão 4/10 - Machine Learning
“Hiperparâmetros são parâmetros de modelos que devem ser definidos antes de treinar o modelo. Para isso existem diferentes técnicas que buscam otimizá-los que resultará uma melhor acurácia em seu modelo.”
Disponível em <https://medium.com>. Acesso em 19/04/2021.
Considerando o texto acima e o seu conhecimento sobre modelos do tipo Perceptron de Múltiplas Camadas, um exemplo de hiper-parâmetros para esse tipo de modelo, seria:
Nota: 0.0
	
	A
	O número de clusters
	
	B
	A quantidade de árvores
	
	C
	A taxa de aprendizado
Justificativa:
Número de cluster é um hiperparâmetro de modelos não-supervisionados. Quantidade de árvores é um hiperparâmetro de modelos baseados em árvores, como random forest. Tipo de dados não é um tipo de hiperparâmetro. A taxa de aprendizado é um hiperparâmetro que determina o tamanho dos incrementos de aprendizagem a cada interação, durante o processo de direcionamento para o valor mínimo da função de custo.
	
	D
	O tipo dos dados
	
	E
	A taxa de erro
Questão 5/10 - Machine Learning
“Hiperparâmetros são parâmetros de modelos que devem ser definidos antes de treinar o modelo. Para isso existem diferentes técnicas que buscam otimizá-los que resultará uma melhor acurácia em seu modelo.”
Disponível em <https://medium.com>. Acesso em 19/04/2021.
Considerando o texto acima e o seu conhecimento sobre modelos do tipo Random Forest, um exemplo de hiper-parâmetros para esse tipo de modelo, seria:
Nota: 10.0
	
	A
	O número de camadas
	
	B
	A quantidade de árvores
Você acertou!
Justificativa:
Hiperparâmetro é uma parâmetro, cujo valor é utilizado para direcionar ou controlar o processo de aprendizagem. No caso dos modelos do tipo Random Forest, diferente dos modelos de redes neurais não possuem número de camadas, número de nós, taxa de aprendizado e de erro. O modelo ter a quantidade de árvores geradas ajustada pelo parâmetro quantidade de árvores.
	
	C
	O número de nós
	
	D
	A taxa de aprendizado
	
	E
	A taxa de erro
Questão 6/10 - Machine Learning
Como um iniciante na área de ciência de dados, você executou o agrupamento de uma massa de dados utilizando o algoritmo k-means. Contudo, você gostaria de ter uma visualização dos agrupamentos obtidos, mas o vetor de atributos de suas instâncias possui dimensão 20, o que impede que você plote um gráfico.
Utilizando o seu conhecimento de aprendizagem de máquina para ter, ainda que aproximada, uma visualização dos dados, você pode:
Nota: 0.0
	
	A
	utilizar um algoritmo k-NN
	
	B
	utilizar apenas 2 características do vetor de atributos
	
	C
	utilizar um método PCA reduzindo para 2 dimensões
Justificativa:
Como o vetor de atributos na situação descrita é muito algo para que se possa obter uma representação gráfica, deve-se utilizar um método de redução de dimensionalidade como o PCA (Principal Component Analysis) para diminuir a quantidade de dimensões para 2.
	
	D
	utilizar uma biblioteca gráfica especializada
	
	E
	plotar apenas os centroides
Questão 7/10 - Machine Learning
Como um iniciante na área de ciência de dados, você executou o agrupamento de uma massa de dados utilizando o algoritmo k-means. Contudo, você gostaria de ter uma visualização dos agrupamentos obtidos, mas o vetor de atributos de suas instâncias possui dimensão 20, o que impede que você plote um gráfico.
Você pediu ajuda a colega mais experiente e ele enviou o seguinte trecho de código:
from sklearn.decomposition import PCA
dados_clientes = carrega_dados()
pca = PCA(n_components=2)
pca.fit(dados_clientes)
Utilizando o seu conhecimento de aprendizagem de máquina, o código enviado irá criar um modelo do tipo PCA e:
Nota: 10.0
	
	A
	reduzir a dimensão dos dados
Você acertou!
Justificativa:
O código apresentado aplica uma redução de dimensionalidade sobre os dados, utilizando o método PCA.
	
	B
	aumentar a dimensão dos dados
	
	C
	duplicar a dimensão dos dados
	
	D
	selecionar uma parte dos dados
	
	E
	excluir uma parte dos dados
Questão 8/10 - Machine Learning
Um colega seu de trabalho necessita executar o treinamento de um modelo de aprendizagem. Para isso ele buscou um enorme dataset na internet, contendo milhares de instâncias. Contudo, ele não encontrou nenhuma informação sobre a qualidade dados ou sobre modelos que tenham sido treinados com esse dataset. Preocupado, ele pediu a sua opinião.
Valendo-se dos seus conhecimento de aprendizagem de máquina você ponderou a respeito e considerou que o melhor a fazer seria:Nota: 10.0
	
	A
	não usar a base de dados e denunciar o site que a forneceu
	
	B
	usar o dataset, pois não havia problemas
	
	C
	usar o dataset apenas para o treinamento e não para os testes
	
	D
	avaliar uma amostra do dataset e executar um treinamento de teste nela
Você acertou!
Justificativa:
Quando se tem uma quantidade de dados muito grande, é aconselhável fazer um processo exploratório sobre esses dados ou em uma amostra deles, para assim poder compreender melhor o conjunto completo.
	
	E
	treinar normalmente, pois quantidade é o que importa para o treinamento
Questão 9/10 - Machine Learning
Você foi contratado para o posto de cientista de dados, para compor uma equipe, que atualmente já trabalha com dados, mas não possui experiência em aprendizagem de máquina. Um das suas primeiras tarefas designadas foi a avaliação de modelos treinados.
As imagens abaixo foram enviadas junto com as informações do primeiro modelo que você deveria avaliar.
Utilizando os seus conhecimentos de aprendizagem de máquina e as informações fornecidas pelas imagens, você deveria informar que:
Nota: 0.0
	
	A
	deveria ser aumentado o número de camadas
	
	B
	não havia dados suficientes para treino
	
	C
	deveria ser utilizando um kNN
	
	D
	o modelo estava pronto para ser colocado em produção
	
	E
	as informações das imagens não estavam em concordância
Justificativa:
O gráfico da direita mostra um modelo com desempenho ruim, pois os pontos estão desalinhados da reta diagonal, enquanto a matrix de confusão mostrada diz respeito a um modelo com um bom desempenho. Onde a quantidade falsos positivos e falsos negativos é baixa.
Questão 10/10 - Machine Learning
Trata-se de um diagrama que mostra um relacionamento hierárquico entre instâncias. Ele é obtido por meio da execução de um algoritmo de agrupamento hierárquico.
Utilizando o seu conhecimento de aprendizagem de máquina, o diagrama citado no texto acima trata-se de:
Nota: 0.0
	
	A
	um gráfico de desempenho
	
	B
	um diagrama de treinamento
	
	C
	um diagrama de teste
	
	D
	um dendrograma
Justificativa:
O diagrama que representa um agrupamento hierárquico recebe o nome de dendrograma.
	
	E
	uma gráfico de inércia