apol 2 tentativa 3 machine learning

•

UNIP

0

Lucília Lima curte o material p ajudar por favor

30/03/2024

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 9 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 9 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 9, do total de 9 páginas

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Machine Learning

1.261 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

Questão 1/10 - Machine Learning
Você foi contratado para o posto de cientista de dados, para compor uma equipe, que atualmente já trabalha com dados, mas não possui experiência em aprendizagem de máquina. Um das suas primeiras tarefas designadas foi a avaliação de modelos treinados.
A imagem abaixo foi enviada junto com as informações do primeiro modelo que você deveria avaliar.
Utilizando os seus conhecimentos de aprendizagem de máquina e as informações fornecidas pelo gráfico, você informou que o modelo treinado:
Nota: 10.0
	
	A
	deveria ser retreinado para predizer corretamente das as instâncias de treino
	
	B
	não tinha dados suficientes para treino
	
	C
	deveria ser substituído por um kNN
	
	D
	estava pronto para ser colocado em produção
Você assinalou essa alternativa (D)
Você acertou!
Justificativa:
Quando analisamos visualmente o desempenho de um modelo como descrito no texto base, quanto mais alinhados com a reta diagonal, melhor pode ser considerado o desempenho do modelo.
	
	E
	apresentava um desempenho ruim e deveria ser retreinado
Questão 2/10 - Machine Learning
“Criada nos anos 1960, a tecnologia que usa computadores e algoritmos para reconhecer rostos humanos ganhou escala há pelo menos uma década, muito graças ao avanço das redes sociais e da internet. Com milhares de pessoas disponibilizando voluntariamente suas fotos na internet, existe hoje um banco de dados com bilhões de imagens que servem para treinar redes de inteligência artificial a detectar e reconhecer rostos.”
Disponível em <https://revistagalileu.globo.com/>. Acesso em 19/04/2021
O texto acima faz referência a redes de inteligência artificial para detectar rostos, de acordo com os seus conhecimentos sobre redes neurais os tipos de redes neurais utilizadas para reconhecimento de imagem são as redes:
Nota: 10.0
	
	A
	do tipo RNN
	
	B
	do tipo CNN
Você assinalou essa alternativa (B) Você acertou! Justificativa:
As redes do tipo CNN são redes especializadas para lidar com imagens, inclusive em tarefas como reconhecimento de imagens. Redes do tipo RNN são utilizadas para lidar com dados sequenciais, em geral texto. Redes do tipo MLP (Multilayer Perceptron) são redes neurais de propósito geral e, assim como o k-NN, não são comumente utilizadas para trabalhar com imagens.
	
	C
	do tipo k-NN
	
	D
	do tipo MLP
	
	E
	nenhuma das anteriores
Questão 3/10 - Machine Learning
O termo one-hot descreve um grupo de bits onde apenas um dos bits é 1 (um) e todos os demais 0 (zero). Em aprendizagem de máquina, existe um método chamado one-hot enconding que é utilizada para lidar com dados categóricos.”
Considere que você possui um conjunto de dados onde já um campo Idiomas que podem assumir 3 valores: português, espanhol e inglês. Valendo dos seus conhecimentos sobre dados categóricos, uma possível codificação one-hot para este campo seria:
Nota: 10.0
	
	A
	português (1), espanhol (2), francês (3)
	
	B
	português (00), espanhol (10), francês (11)
	
	C
	português (000), espanhol (001), francês (010)
	
	D
	português (001), espanhol (002), francês (003)
	
	E
	português (001), espanhol (010), francês (100) Você assinalou essa alternativa (E) Você acertou! Justificativa:
Como se trata de 3 valores possíveis e a codificação one-hot exige que somente uma posição do valor seja igual a 1, logo a opção 001,010,100 seria a escolha correta.
Questão 4/10 - Machine Learning
Você foi contratado para o posto de cientista de dados, para compor uma equipe, que atualmente já trabalha com dados, mas não possui experiência em aprendizagem de máquina. Um das suas primeiras tarefas designadas, foi a explanação de trechos de códigos em linguagem relacionados ao treinamento de modelos de aprendizagem de máquina.
Um dos trechos que a equipe gostaria de compreender se refere a uma troca de códigos, onde o código:
mlp_clf = MLPClassifier(warm_start=True, max_iter=500,                                                                                                         hidden_layer_sizes=(100,))
Foi substituído por:
            mlp_clf = MLPClassifier(warm_start=True, max_iter=500,
                                                         hidden_layer_sizes=(50,50))
De acordo com os seus conhecimentos de  aprendizagem de máquina, a substituição de código foi feita para:
Nota: 0.0Você não pontuou essa questão
	
	A
	alterar o tipo do classificador
	
	B
	aumentar a quantidade de camadas da rede
Justificativa:
O parâmetro hidden_layer_sizes é uma tupla na qual cada elemento indica a quantidade de neurônios em cada camada. Como o código apresentado o número de elementos aumenta, a quantidade de camadas da rede também.
	
	C
	diminuir a quantidade de camadas da rede
Você assinalou essa alternativa (C)
	
	D
	estabilizar as camadas da rede
	
	E
	aumentar o número de nós da rede
Questão 5/10 - Machine Learning
Você recebeu um grande conjunto de dados para realizar o treinamento de um modelo de aprendizagem, porém durante o processo de exploração dos dados, você percebeu que havia uma enorme discrepância entre os valores absolutos de alguns atributos.
Valendo-se dos seus conhecimento de aprendizagem de máquina, para evitar que essas discrepâncias prejudiquem o desempenho do seu modelo, você deverá executar nos dados um processo de :
Nota: 10.0
	
	A
	separação
	
	B
	identificação
	
	C
	normalização
Você assinalou essa alternativa (C)
Você acertou!
Justificativa:
Quando os valores absolutos os atributos apresentam grandes discrepâncias é necessário fazer um processo de normalização, para assim evitar que essas diferenças de magnitude prejudiquem o processo de aprendizagem.
	
	D
	limpeza
	
	E
	redução
Questão 6/10 - Machine Learning
Você foi contratado para o posto de cientista de dados, para compor uma equipe, que atualmente já trabalha com dados, mas não possui experiência em aprendizagem de máquina. Um das suas primeiras tarefas designadas, foi a tradução de trechos de códigos em linguagem relacionados ao treinamento de modelos de aprendizagem de máquina.
Um dos trechos que a equipe gostaria de compreender se refere ao seguinte código:
from sklearn.neural_network import MLPClassifier
X_treino_std, y_treino = carrega_dados_treino()
mlp_clf = MLPClassifier(warm_start=True, max_iter=500,                                                                                                       hidden_layer_sizes=(100,))
mlp_clf.fit(X_treino_std, y_treino)
De acordo com os seus conhecimentos de  aprendizagem de máquina, o código acima executa:
Nota: 10.0
	
	A
	um processo de treinamento dos dados
Você assinalou essa alternativa (A)
Você acertou!
Justificativa:
O código apresentado cria um modelo do tipo Multilayer Perceptron e execute o processo de treinamento do modelo por meio da chamada do método fit.
	
	B
	um processo de predição
	
	C
	um processo de normalização dos dados
	
	D
	um processo de expansão dos dados
	
	E
	não faz nada e pode ser comentado
Questão 7/10 – Machine Learning
Você necessita executar o treinamento de um modelo de aprendizagem. Sabendo que é preciso dividir os dados em treinamento e em testes, você resolve utilizar uma proporção que é bastante utilizada e recomendada, na qual se fornece mais dados para treino que para testes.
Valendo-se dos seus conhecimento de aprendizagem de máquina, para conseguir executar o treinamento do modelo você deverá:
Nota: 10.0
	
	A
	utilizar uma estratégia de validação cruzada
	
	B
	utilizar os dados na proporção 80-20
Você assinalou essa alternativa (B)
Você acertou!
Justificativa:
A proporção 80% para treino e 20% para testes é comumente utilizada no processo de separação dos dados. Sendo inclusive recomendada, ainda que não seja a única forma de particionar os dados.
	
	C
	utilizar os dados na proporção 50-50
	
	D
	treinar e testar com os mesmos dados
	
	E
	utilizar todos os dados para treino e não testar
· 
Questão 8/10 - Machine Learning
Os modelos de regressão linear apresentam uma característica de não permitir calcular o número de errode acertos, pois os valores obtidos no processo de predição diferem de forma diferente dos valores reais. Assim, utilizar métodos como matriz de confusão, não é possível.
Considerando o texto acima e valendo-se do seu conhecimento sobre aprendizagem de máquina,  uma medida que pode ser utilizada para avaliar a qualidade do modelo de regressão linear é o :
Nota: 10.0
	
	A
	coeficiente de erros
	
	B
	coeficiente de inércia
	
	C
	taxa de acertos
	
	D
	taxa de erros
	
	E
	coeficiente de determinação
Você assinalou essa alternativa (E)
Você acertou!
Justificativa:
Os modelos de regressão linear treinados, não devolvem um valor discreto, assim não é possível comparar o resultado da predição de forma direta com os dados anotados, mas sim a diferença do valor obtido para o valor real. Dessa maneira, a qualidade do modelo deve ser medida por uma outra técnica que considere o quão próximo das predições estão dos valores reais. Para isso, deve-se utilizar o coeficiente de determinação do modelo.
Questão 9/10 - Machine Learning
Como um iniciante na área de ciência de dados, você recebeu uma tarefa de agrupar um conjunto de dados de pessoas, utilizando um algoritmo de agrupamento. Você executou a separação utilizando um tutorial de internet, mas os resultados não foram satisfatórios. Buscando melhorar os resultados você pediu ajuda a um expert que lhe disse apenas o seguinte: “Altere o seu k-means para usar Manhattan ou Mahalanobis”.
De acordo com o seu conhecimento do algoritmo k-means, o expert estava sugerindo que você:
Nota: 10.0
	
	A
	utilizasse outro algoritmo
	
	B
	utilizasse métricas de distância diferentes
Você assinalou essa alternativa (B)
Você acertou!
Justificativa:
Manhattan e Mahalanobis se referem a dois tipos distintos de métricas de distância.
	
	C
	utilizasse uma outra linguagem de programação
	
	D
	utilizasse um método supervisionado
	
	E
	utilizasse um framework
Questão 10/10 - Machine Learning
Os modelos de regressão logística e regressão linear, apresentam semelhanças, além do nome. No entanto, utilizam funções diferentes para obtenção dos valores, apresentando outras diferenças entre si que determinam os diferentes uso para os quais os modelos podem ser aplicados.
Considerando o texto acima e valendo-se do seu conhecimento sobre aprendizagem de máquina,  de maneria simplificada podemos dizer que a principal diferença entre os modelos é:
Nota: 10.0
	
	A
	o tipo treinamento
	
	B
	a predição de valores contínuos e discretos
Você assinalou essa alternativa (B)
Você acertou!
Justificativa:
A regressão logística realiza a predição de valores discretos, em intervalos determinados. Enquanto a regressão linear realiza a predição de valores contínuos.
	
	C
	vetores de atributos com tamanhos distintos
	
	D
	as categorias utilizadas
	
	E
	o número de categorias