Métricas e Métodos de Classificação

•

UNIASSELVI IERGS

0

Matheus Ramos

15/05/2023

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 5 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Machine Learning

1.306 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

15/05/2023, 18:29 Avaliação II - Individual
about:blank 1/5
Prova Impressa
GABARITO | Avaliação II - Individual (Cod.:829246)
Peso da Avaliação 1,50
Prova 62951517
Qtd. de Questões 10
Acertos/Erros 9/1
Nota 9,00
A classificação, também denominada de categorização, é a atividade de rotular dados com suas 
respectivas categorias temáticas, a partir de um conjunto de dados predefinidos. Os métodos de 
classificação podem ser de aprendizado on-line ou off-line, de acordo com a capacidade de construir 
e atualizar do classificador. Sobre as métricas de classificação, classifique V para as sentenças 
verdadeiras e F para as falsas: 
( ) A precisão é a porcentagem de amostras classificadas como pertencentes à classe positiva e que 
realmente fazem parte de tal classe.
( ) A revocação, também chamada de sensibilidade ou recall, é uma métrica que, entre todas as 
situações de classe positiva como valor esperado, indica quantas estão corretas.
( ) Os verdadeiros negativos são baseados na classificação correta da classe negativa.
( ) A revocação é a porcentagem de amostras classificadas como pertencentes à classe positiva e que 
realmente fazem parte de tal classe.
Assinale a alternativa que apresenta a sequência CORRETA:
A V - V - V - F.
B V - F - V - F.
C F - V - V - F.
D F - V - F - V.
Esse tipo de método é considerado do tipo aprendizado preguiçoso, pois só olha os dados de 
treinamento quando precisa classificar um novo objeto. A partir de um novo objeto, de suas 
características, dispostas no espaço cartesiano, um novo objeto será classificado. Sobre o tipo de 
método de aprendizado de máquina a que o texto se refere, assinale a alternativa CORRETA:
A Métodos Baseados em Distância.
B Máquinas de Vetores de Suporte.
C Redes Neurais.
D Métodos Probabilísticos.
O SVM é uma técnica de Aprendizagem de Máquina desenvolvida por Vapnik em 1995, que é 
fundamentada na Teoria de Aprendizado Estatístico e utilizada para a classificação de dados. 
 VOLTAR
A+ Alterar modo de visualização
1
2
3
15/05/2023, 18:29 Avaliação II - Individual
about:blank 2/5
Assumindo que os dados de um dataset qualquer já foram carregados nas variáveis de treino e teste: 
X_train, X_test, y_train, y_test, sobre a implementação do SVM com o scikit-learn e para que o 
método seja executado com êxito, ordene os itens a seguir:
I- print('A acurácia do SVM na base de treino é: {:.2f} '.for-
mat(classificador_SVM.score(X_train_normalizado, y_train)))
II- classificador_SVM.fit(X_train_normalizado, y_train)
III- classificador_SVM = svm.SVC()
IV- from sklearn import svm
 
Assinale a alternativa que apresenta a sequência CORRETA:
FONTE: DOSCIATTI, Mariza Miola; FERREIRA, L. P. C.; PARAISO, E. C. Identificando emoções 
em textos em português do Brasil usando máquina de vetores de suporte em solução multiclasse. 
ENIAC-Encontro Nacional de Inteligência Artificial e Computacional. Fortaleza, Brasil, 2013.
A I - II - III - IV.
B IV - II - III - I.
C IV - III - II - I.
D IV - II - I - III.
Os métodos de classificação baseados em distância consideram proximidade entre dados em 
relação ao espaço cartesiano. Esse tipo de método considera que dados similares tendem a estar em 
uma mesma região no espaço de entrada. Sobre os elementos que compõem a classificação, baseados 
em distância, associe os itens, utilizando o código a seguir:
I- Similaridade.
II- Dissimilaridade.
III- Minkowski.
IV- Euclidiana.
( ) Um tipo de proximidade na qual quanto maior o valor observado, mais parecidos são os objetos. 
Por exemplo, o coeficiente de correlação.
( ) Um tipo de proximidade na qual quanto maior o valor observado, menos parecidos (mais 
dissimilares) serão os objetos.
( ) É uma das medidas de dissimilaridade entre comunidades mais utilizadas na prática. Quanto 
menor o valor da distância euclidiana entre dois objetos, mais próximas elas se apresentam em termos 
de parâmetros quantitativos por classe; logo, quanto menor a distância euclidiana, maior a eficiência 
do procedimento.
( ) É uma generalização da distância euclidiana, em que r é um parâmetro, n é o número de 
dimensões (atributos) e pk e qk são, respectivamente, os k-ésimos atributos (componentes) dos 
objetos de dados p e q.
Assinale a alternativa que apresenta a sequência CORRETA:
A I - II - III - IV.
B I - II - IV - III.
C IV - III - II - I.
4
15/05/2023, 18:29 Avaliação II - Individual
about:blank 3/5
D IV - III - I - II.
Em sua definição, um problema de classificação, supervisionado, é um programa de computador 
que recebe amostras (entradas) e respostas esperadas (saídas) para elas, e gera uma hipótese genérica 
capaz de mapear as entradas para as saídas corretas. Sobre o modo de aprendizado dos algoritmos de 
classificação, assinale a alternativa CORRETA:
FONTE: VON LOCHTER, Johannes. Máquinas de classificação para detectar polaridade de 
mensagens de texto em redes sociais. 2015. Disponível em: https://1library.org/document/zwvlopgq-
maquinas-classificacao-detectar-polaridade-mensagens-texto-redes-sociais.html. Acesso em: 13 abr. 
2021.
A Semi-supervisionado.
B Supervisionado.
C Não supervisionado.
D Por esforço.
O scikit-learn é uma biblioteca de Python que possui várias implementações de algoritmos de 
aprendizado de máquina, tais como de regressão, classificação e agrupamento. Foi projetado para 
facilitar o uso do aprendizado de máquina através de uma linguagem simplificada. Assumindo que os 
dados de um dataset qualquer já foram carregados nas variáveis de treino e teste: X_train, X_test, 
y_train, y_test. Sobre a implementação do Naive Bayes com o scikit-learn, para que o comando seja 
executado com êxito, ordene os itens a seguir: 
I- print('A acurácia do Naive Bayes na base de treino é: {:.2f} 
'.format(classificador_NB.score(X_train_normalizado, y_train)))
II- classificador_NB = MultinomialNB()
III- classificador_NB.fit(X_train_normalizado, y_train)
IV- from sklearn.naive_bayes import MultinomialNB
Assinale a alternativa que apresenta a sequência CORRETA:
FONTE: COSTA, Axel Vieira Gomes et al. Classificador de fake news utilizando um modelo de 
aprendizado de máquina com técnicas de processamento de linguagem natural. 2020. Disponível em: 
https://repositorio.ufersa.edu.br/handle/prefix/5851. Acesso em: 13 abr. 2021.
A IV - III - II - I.
B I - III - IV - II.
C I - II - III - IV.
D IV - II - III - I.
5
6
15/05/2023, 18:29 Avaliação II - Individual
about:blank 4/5
Uma das bases de dados mais utilizadas para estudos de machine learning é o conjunto de dados 
Iris, no qual a partir de um conjunto de dados sobre flores, é possível realizar sua classificação. 
Acerca do conjunto de dados Iris e o campo que representa seu rótulo em uma tarefa de classificação, 
assinale a alternativa CORRETA:
A SepalLengthCm.
B PetallLengthCm.
C Species.
D Id.
A classificação é uma tarefa de machine learning que tem por objetivo classificar itens de dados 
em uma entre diversas classes previamente definidas, com base em propriedades comuns, entre um 
conjunto de objetos no banco de dados. Sobre a saída de um classificador binário analise os exemplos 
que se encaixam nesse tipo assinalando-os com V ou F. 
( ) Reconhecer como "positivo" ou "negativo".
( ) Diagnosticar se um paciente tem determinada doença.
( ) Classificar um texto em 20 tipos de categorias.
( ) Determinar se uma foto contém um item específico ou não.
Assinale a alternativa que apresenta a sequência CORRETA:
FONTE: MAXIMO, Fernando Attique; OLIVEIRA, SR de M.; LOPES-ASSAD, Maria Leonor. 
Avaliação de métodos de seleção de atributos para classificação de solos. In: Embrapa Informática 
Agropecuária-Artigo em anais de congresso (ALICE). In: CONGRESSO BRASILEIRO DE 
AGROINFORMÁTICA, 6., 2007, São Pedro, SP. Anais... Campinas: Embrapa Informática 
Agropecuária, 2007.
A F - V - V - F.
B V - F - V - F.
C V - V - F - V.
D F - F - V - V.
A regressão logística é um classificador linear, membro do conjunto de modelos de regressãolinear chamado Modelos Lineares Generalizados, utilizado para o desenvolvimento dos mais diversos 
tipos de previsões com machine learning. Assumindo que os dados de um dataset qualquer já foram 
carregados nas variáveis de treino e teste: X_train, X_test, y_train, y_test, sobre a implementação da 
7
8
9
15/05/2023, 18:29 Avaliação II - Individual
about:blank 5/5
Regressão Logística com o scikit-learn, e para que o método seja executado com êxito, ordene os 
itens a seguir:
I- from sklearn.linear_model import LogisticRegression
II- classificador_RLog = LogisticRegression(random_state=0)
III- print('A acurácia da Regressão Logistíca na base de treino é: {:.2f} 
'.format(classificador_RLog.score(X_train_normalizado,y_train)))
IV- classificador_RLog.fit(X_train_normalizado, y_train)
 
Assinale a alternativa que apresenta a sequência CORRETA:
A I - II - IV - III.
B IV - II - III - I.
C IV - III - II - I.
D I - II - III - IV.
A distância euclidiana é uma das medidas de dissimilaridade entre comunidades mais utilizada 
na prática. Assim, quanto menor o valor da distância euclidiana entre dois objetos, mais próximas 
elas se apresentam em termos de parâmetros quantitativos. Considere a fórmula da distância 
euclidiana apresentada em anexo e classifique V para as sentenças verdadeiras e F para as falsas:
( ) Xi representa um determinado objeto (dentro de X) sob qual se calculará a distância.
( ) Yi representa um determinado objeto (dentro de Y) sob qual se calculará a distância.
( ) i=o significa que haverá uma iteração terminando em 0.
( ) n representa o número de objetos que serão iterados.
Assinale a alternativa que apresenta a sequência CORRETA:
A V - F - V - F.
B F - V - F - V.
C V - V - F - V.
D V - F - F - V.
10
Imprimir