Machine Learning I - Classificação e Regressão - AV2

•

Uniasselvi

0

Adjalma Aguiar

30/11/2022

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 5 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Machine Learning

1.325 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

O Scikit-Learn é uma biblioteca para Python que oferece uma grande variedade de métodos de aprendizado de máquina, tanto nas áreas de aprendizado supervisionado quanto em aprendizado não supervisionado. Sobre o Scikit-Learn e sua implementação, analise as afirmações a seguir: ( ) Ao utilizar from sklearn. import estará sendo importado do scikit-learn o método e seus recursos poderão ser utilizados. ( ) x = LinearRegression() é uma instância de uma rede neural. ( ) O comando train é utilizado para ajustar os dados e fazer com que o método aprenda. ( ) O comando predict permite utilizar o método para predição. Assinale a alternativa que apresenta a sequência CORRETA: FONTE: MASIERO, Andrey Araujo; FERREIRA, Leonardo Anjoletto; AQUINO, Plinio Thomaz. Algoritmos de clusterização e python científico apoiando modelagem de usuário. Livro dos Tutoriais do sobre Fatores Human, p. 42, 2012.
A
F - V - F - V.
B
F - V - V - F.
C
V - F - F - V.
D
V - F - F - F.
2A distância euclidiana é uma das medidas de dissimilaridade entre comunidades mais utilizada na prática. Assim, quanto menor o valor da distância euclidiana entre dois objetos, mais próximas elas se apresentam em termos de parâmetros quantitativos. Considere a fórmula da distância euclidiana apresentada em anexo e classifique V para as sentenças verdadeiras e F para as falsas: ( ) Xi representa um determinado objeto (dentro de X) sob qual se calculará a distância. ( ) Yi representa um determinado objeto (dentro de Y) sob qual se calculará a distância. ( ) i=o significa que haverá uma iteração terminando em 0. ( ) n representa o número de objetos que serão iterados. Assinale a alternativa que apresenta a sequência CORRETA:
A
V - F - V - F.
B
F - V - F - V.
C
V - F - F - V.
D
V - V - F - V.
3A classificação é uma tarefa de machine learning que tem por objetivo classificar itens de dados em uma entre diversas classes previamente definidas, com base em propriedades comuns, entre um conjunto de objetos no banco de dados. Sobre a saída de um classificador binário analise os exemplos que se encaixam nesse tipo assinalando-os com V ou F. ( ) Reconhecer como "positivo" ou "negativo". ( ) Diagnosticar se um paciente tem determinada doença. ( ) Classificar um texto em 20 tipos de categorias. ( ) Determinar se uma foto contém um item específico ou não. Assinale a alternativa que apresenta a sequência CORRETA: FONTE: MAXIMO, Fernando Attique; OLIVEIRA, SR de M.; LOPES-ASSAD, Maria Leonor. Avaliação de métodos de seleção de atributos para classificação de solos. In: Embrapa Informática Agropecuária-Artigo em anais de congresso (ALICE). In: CONGRESSO BRASILEIRO DE AGROINFORMÁTICA, 6., 2007, São Pedro, SP. Anais... Campinas: Embrapa Informática Agropecuária, 2007.
A
V - F - V - F.
B
V - V - F - V.
C
F - F - V - V.
D
F - V - V - F.
4A regressão logística é um classificador linear, membro do conjunto de modelos de regressão linear chamado Modelos Lineares Generalizados, utilizado para o desenvolvimento dos mais diversos tipos de previsões com machine learning. Assumindo que os dados de um dataset qualquer já foram carregados nas variáveis de treino e teste: X_train, X_test, y_train, y_test, sobre a implementação da Regressão Logística com o scikit-learn, e para que o método seja executado com êxito, ordene os itens a seguir: I- from sklearn.linear_model import LogisticRegression II- classificador_RLog = LogisticRegression(random_state=0) III- print('A acurácia da Regressão Logistíca na base de treino é: {:.2f} '.format(classificador_RLog.score(X_train_normalizado,y_train))) IV- classificador_RLog.fit(X_train_normalizado, y_train) Assinale a alternativa que apresenta a sequência CORRETA:
A
IV - II - III - I.
B
I - II - III - IV.
C
IV - III - II - I.
D
I - II - IV - III.
5Uma das bases de dados mais utilizadas para estudos de machine learning é o conjunto de dados Iris, no qual a partir de um conjunto de dados sobre flores, é possível realizar sua classificação. Acerca do conjunto de dados Iris e o campo que representa seu rótulo em uma tarefa de classificação, assinale a alternativa CORRETA:
A
SepalLengthCm.
B
Species.
C
Id.
D
PetallLengthCm.
6A ideia básica do algoritmo dos K-vizinhos mais próximos é determinar a categoria de um determinado objeto com base em similaridades entre os documentos no espaço. Para calcular a similaridade, usa-se uma métrica de distância. Na imagem anexa, o ponto vermelho representa um novo objeto que não se sabe a classe. Com base na imagem e na execução do KNN, classifique V para as sentenças verdadeiras e F para as falsas: ( ) Considerando que K = 3, o ponto será na Classe B. ( ) Considerando que K = 5, o ponto será na Classe B. ( ) Considerando que K = 6, o ponto será na Classe A. ( ) Considerando que K = 7, o ponto será na Classe A. Assinale a alternativa que apresenta a sequência CORRETA:
A
V - F - F - V.
B
V - F - V - V.
C
F - V - F - V.
D
F - V - V - F.
7O scikit-learn é uma biblioteca de Python que possui várias implementações de algoritmos de aprendizado de máquina, tais como de regressão, classificação e agrupamento. Foi projetado para facilitar o uso do aprendizado de máquina através de uma linguagem simplificada. Assumindo que os dados de um dataset qualquer já foram carregados nas variáveis de treino e teste: X_train, X_test, y_train, y_test. Sobre a implementação do Naive Bayes com o scikit-learn, para que o comando seja executado com êxito, ordene os itens a seguir: I- print('A acurácia do Naive Bayes na base de treino é: {:.2f} '.format(classificador_NB.score(X_train_normalizado, y_train))) II- classificador_NB = MultinomialNB() III- classificador_NB.fit(X_train_normalizado, y_train) IV- from sklearn.naive_bayes import MultinomialNB Assinale a alternativa que apresenta a sequência CORRETA: FONTE: COSTA, Axel Vieira Gomes et al. Classificador de fake news utilizando um modelo de aprendizado de máquina com técnicas de processamento de linguagem natural. 2020. Disponível em: https://repositorio.ufersa.edu.br/handle/prefix/5851. Acesso em: 13 abr. 2021.
A
I - II - III - IV.
B
IV - III - II - I.
C
IV - II - III - I.
D
I - III - IV - II.
8O classificador Naïve Bayes é construído utilizando dados de treinamento para estimar a probabilidade de um documento pertencer a uma classe. O teorema de Bayes, mostrado em anexo, é utilizado para estimar estas probabilidades. Sobre a fórmula, classifique V para as sentenças verdadeiras e F para as falsas: ( ) P (x) é a probabilidade original do preditor. ( ) P (c l x) é a probabilidade posterior da classe (c, alvo) dado preditor (x, atributos). ( ) x é o conjunto de dados. ( ) P(C) é a probabilidade original da classe. Assinale a alternativa que apresenta a sequência CORRETA: FONTE: OLIVEIRA, G. L.; NETO, M. G. M. Expertext: Uma ferramenta de combinação de múltiplos classificadores naive bayes. Anales de la 4ª Jornadas Iberoamericanas de Ingeniería de Software e Ingeniería de Conocimiento. Madrid, v. 1, p. 317-32, 2004.
A
V - F - F - F.
B
V - V - V - V
C
F - F - F - F.
D
F - V - V - V.
9Os métodos de classificação baseados em distância consideram proximidade entre dados em relação ao espaço cartesiano. Esse tipo de método considera que dados similares tendem a estar em uma mesma região no espaço de entrada. Sobre os elementos que compõem a classificação, baseados em distância, associe os itens, utilizando o código a seguir: I- Similaridade. II- Dissimilaridade. III- Minkowski. IV- Euclidiana. ( ) Um tipo de proximidade na qual quanto maior o valor observado, mais parecidos são os objetos. Por exemplo, o coeficiente de correlação. ( ) Um tipo de proximidade na qual quanto maior o valor observado, menos parecidos (mais dissimilares) serão os objetos. ( ) É uma das medidas de dissimilaridade entre comunidades mais utilizadas na prática. Quanto menor o valor da distância euclidiana entre dois objetos, mais próximas elas se apresentam em termos de parâmetros quantitativos por classe; logo, quanto menor a distância euclidiana, maior a eficiência do procedimento. ( ) É uma generalização da distância euclidiana,em que r é um parâmetro, n é o número de dimensões (atributos) e pk e qk são, respectivamente, os k-ésimos atributos (componentes) dos objetos de dados p e q. Assinale a alternativa que apresenta a sequência CORRETA:
A
I - II - III - IV.
B
I - II - IV - III.
C
IV - III - I - II.
D
IV - III - II - I.
10Esse tipo de método é considerado do tipo aprendizado preguiçoso, pois só olha os dados de treinamento quando precisa classificar um novo objeto. A partir de um novo objeto, de suas características, dispostas no espaço cartesiano, um novo objeto será classificado. Sobre o tipo de método de aprendizado de máquina a que o texto se refere, assinale a alternativa CORRETA:
A
Métodos Baseados em Distância.
B
Métodos Probabilísticos.
C
Redes Neurais.
D
Máquinas de Vetores de Suporte.