Buscar

AS_Algoritmos e Estrutura de Dados

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 3, do total de 40 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 6, do total de 40 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 9, do total de 40 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Prévia do material em texto

PERGUNTA 1 
1. Analise as afirmativas: 
 
I - Minerar dados é o processo de descobrir 
informações relevantes como padrões, associações, 
mudanças, anomalias e estruturas, em grandes 
quantidades de dados armazenados em bancos de 
dados; 
II - A mineração de dados serve única e 
exclusivamente para o reconhecimento de outliers e 
classificação de instâncias; 
III - Estimação de valores, detecção de outliers e 
agrupamento de instâncias são algumas das técnicas 
de análise e reconhecimento de padrões; 
 
Selecione a correta alternativa quanto às afirmativas: 
 
 a. I – incorreta, II – incorreta e III - incorreta. 
 b. I – correta, II – correta e III - incorreta. 
 c. I – incorreta, II – correta e III - correta. 
 d. I – correta, II – incorreta e III - correta. 
 e. I – correta, II – correta e III - correta. 
0,25 pontos 
PERGUNTA 2 
1. Analise as afirmativas: 
 
I - A abrangência de uma regra constitui-se no 
número de instâncias que são preditas corretamente; 
II - É conhecida como a precisão da regra associativa; 
III - Tem o objetivo de encontrar regras associativas 
em grandes e complexas bases de dados; 
 
Selecione a correta alternativa que traz o correto 
relacionamento entre uma definição e sua técnica: 
 a. 
I – algoritmo apriori, II – confiança e III – 
suporte. 
 b. 
I – confiança , II – algoritmo apriori e III – 
suporte. 
 c. 
I – suporte , II – algoritmo apriori e III – 
confiança. 
 d. 
I – confiança , II – suporte e III – algoritmo 
apriori. 
 e. 
I – suporte , II – confiança e III – algoritmo 
apriori. 
0,25 pontos 
PERGUNTA 3 
1. Selecione a alternativa que traz o nome da técnica ou 
característica definida por: representam um padrão de 
relacionamento entre itens de dados no domínio da 
aplicação, que ocorrem com uma determinada 
frequência nas bases de dados. 
 a. clustering. 
 b. regra de associação. 
 c. outlier. 
 d. classificador. 
 e. padrão. 
0,25 pontos 
PERGUNTA 4 
1. Analise a seguinte afirmativa e assinale a alternativa 
que traz o conceito abordado: Fornece percepções dos 
dados corporativos, descobrindo padrões e 
relacionamentos ocultos em grandes bancos de dados 
e inferindo regras a partir deles para prever 
comportamentos futuros. Esses modelos e regras 
podem, então, ser utilizados para guiar processos de 
decisão e prever o efeito dessas decisões. 
 a. conceito de data mining. 
 b. conceito de ETL. 
 c. conceito de BI. 
 d. conceito de data warehouse 
 e. conceito de modelagem dimensional. 
 
PERGUNTA 1 
1. De acordo com a descrição do processo KDD, 
selecione a alternativa que traz a fase do processo 
KDD que se relaciona com a execução efetiva dos 
algoritmos e técnicas análise de dados e 
reconhecimento de padrões. 
 a.(errado) Interpretação e avaliação. 
 b. Transformação. 
 c. Seleção de dados 
 d. Mineração de dados. 
 e. Pré-processamento. 
0,25 pontos 
PERGUNTA 2 
1. Analise a afirmativa: 
 
O objetivo da função é fazer a poda do conjunto de 
itens candidatos, usando o princípio de que cada 
subconjunto de um conjunto de itens frequentes 
também deve ser frequentes. 
 
Selecione a alternativa que traz o nome da função 
definida na afirmativa. 
 a. função kmeans. 
 b. função apriori-gen. 
 c. função apriori. 
 d. função classify. 
 e. função outlier. 
0,25 pontos 
PERGUNTA 3 
1. Selecione a alternativa que traz o nome da técnica ou 
característica definida por: representam um padrão de 
relacionamento entre itens de dados no domínio da 
aplicação, que ocorrem com uma determinada 
frequência nas bases de dados. 
 a. regra de associação. 
 b. classificador. 
 c. outlier. 
 d. clustering. 
 e. padrão. 
0,25 pontos 
PERGUNTA 4 
1. Assinale a alternativa que traz a definição mais 
adequada ao KDD. 
 a. processo de definição dos objetivos de 
um projeto de BI. 
 b. etapa do processo de BI que serve para a 
interpretação e avaliação dos dados. 
 c. é um processo utilizado para 
transformar dados em conhecimento. 
 d. são sistemas que atuam no nível 
operacional diário dentro das 
organizações. 
 e. são sistemas que atuam no nível tático, 
gerando relatórios específicos por áreas 
gerenciais. 
 
PERGUNTA 1 
1. Assinale a alternativa que traz a definição de 
mineração de dados. 
 a. é o processo de modelagem de dados 
tradicional que se aplica aos projetos de 
BI; 
 b. facilita o formato de visualização dos 
dados. 
 c. consolida e padroniza estas informações, 
de modo que elas possam ser usadas por 
toda a empresa para análise gerencial e 
tomada de decisões. 
 d. é um conceito de utilização de banco de 
dados que armazena dados correntes e 
históricos de potencial interesse para os 
tomadores de decisão de toda a empresa. 
 e. é o processo de descobrir informações 
relevantes, como padrões, associações, 
mudanças, anomalias e estruturas em 
grandes quantidades de dados 
armazenados em bancos de dados, 
depósitos de dados ou outros depósitos 
de informação. 
0,25 pontos 
PERGUNTA 2 
1. Analise as afirmativas: 
 
I - A abrangência de uma regra constitui-se no 
número de instâncias que são preditas corretamente; 
II - É conhecida como a precisão da regra associativa; 
III - Tem o objetivo de encontrar regras associativas 
em grandes e complexas bases de dados; 
 
Selecione a correta alternativa que traz o correto 
relacionamento entre uma definição e sua técnica: 
 a. I – suporte , II – algoritmo apriori e III – 
confiança. 
 b. I – algoritmo apriori, II – confiança e III 
– suporte. 
 c. I – confiança , II – algoritmo apriori e III 
– suporte. 
 d. I – confiança , II – suporte e III – 
algoritmo apriori. 
 e. I – suporte , II – confiança e III – 
algoritmo apriori. 
0,25 pontos 
PERGUNTA 3 
1. Selecione a alternativa que traz o nome da técnica ou 
característica definida por: representam um padrão de 
relacionamento entre itens de dados no domínio da 
aplicação, que ocorrem com uma determinada 
frequência nas bases de dados. 
 a. classificador. 
 b. padrão. 
 c. outlier. 
 d. clustering. 
 e. regra de associação. 
0,25 pontos 
PERGUNTA 4 
1. Analise as afirmativas: 
 
I - Eu quero encontrar relacionamentos entre ações ou 
itens; 
II - Eu desejo agrupar item dadas as suas 
similaridades; 
III - Eu quero encontrar o relacionamento ou valor 
específico de uma variável dada uma entrada; 
 
Selecione a correta alternativa que traz o correto 
relacionamento entre uma necessidade e sua técnica 
associada: 
 a. I – estimação de valores ou regressão, II 
– classificação e III – regras de 
associação. 
 b. I – regras de associação , II – 
clustering e III – estimação de valores 
ou regressão. 
 c. I – regras de associação , II – clustering 
e III – classificação. 
 d. I – detecção de outlier, II – clustering e 
III – estimação de valores ou regressão. 
 e. I – regras de associação , II – 
classificação e III – estimação de valores 
ou regressão. 
 
 
PERGUNTA 1 
1. Analise as afirmativas: 
 
I - uma medida de similaridade ou dissimilaridade 
expressa em valor real a similaridade ou a diferença 
entre dois vetores ou instância; 
II - A distância de Mahalanobis foi introduzida em 
1936 pelo matemático indiano Prasanta Chandra 
Mahalanobis. Essa medida se baseia nas correlações 
entre as variáveis; 
III - A distância Euclidiana é uma forma de geometria 
que se baseia na soma das diferenças absolutas de 
todas as coordenadas entre um ponto e outro, em 
outras palavras assemelha-se à distância calculada em 
um software de GPS; 
 
Selecione a correta alternativa quanto às afirmativas: 
 a. I – correta, II – correta e III - 
incorreta. 
 b. I – incorreta, II – incorreta e III - 
incorreta. 
 c. I – correta, II – incorreta e III - correta. 
 d. I – correta, II – correta e III - correta. 
 e. I – incorreta, II – correta e III - correta. 
0,25 pontos 
PERGUNTA 2 
1. Analise as afirmativas: 
 
I - A detecção de outlierstem importantes aplicações 
para detecção de fraudes em cartões de crédito, 
fraudes em sistemas de telecomunicações, detecção de 
falhas, redes de sensores, detecção de intrusos, 
detecção de spam em emails, diagnósticos médicos ou 
aplicações em marketing; 
II - uma anomalia ou um outlier, ocorre quando uma 
instância ou conjunto de instâncias são consideradas 
diferentes do restante do conjunto de dados.; 
III - Há três tipos de técnicas elencadas na literatura 
para a detecção de outliers: técnicas baseadas em 
distância, baseadas em densidade ou baseadas em 
estatísticas; 
 
Selecione a correta alternativa quanto às afirmativas: 
 a. I – incorreta, II – correta e III - correta. 
 b. I – incorreta, II – incorreta e III - 
incorreta. 
 c. I – correta, II – correta e III - incorreta. 
 d. I – correta, II – incorreta e III - correta. 
 e. I – correta, II – correta e III - correta. 
0,25 pontos 
PERGUNTA 3 
1. Analise as afirmativas: 
 
I - Escolhe aleatoriamente a quantidade de grupos ou 
clusters nos quais se deseja agrupar os objetos; 
II - Recebe como parâmetro a quantidade de grupos 
ou clusters nos quais se deseja agrupar os objetos; 
III - Utiliza medidas de similaridade entre os objetos; 
 
Selecione a correta alternativa quanto às afirmativas 
relacionadas ao algoritmo kmeans: 
 a. I – correta, II – correta e III - incorreta. 
 b. I – incorreta, II – correta e III - 
correta. 
 c. I – correta, II – incorreta e III - correta. 
 d. I – incorreta, II – incorreta e III - 
incorreta. 
 e. I – correta, II – correta e III - correta. 
0,25 pontos 
PERGUNTA 4 
1. Selecione a alternativa que traz uma correta definição 
de algoritmos de clustering. 
 a. Utilizado para se compreender quais são 
as características que melhor definem o 
comportamento de uma espécie. 
 b. Geram regras de associação que 
demonstram a presença de um 
determinado conjunto que implica na 
presença de algum outro conjunto 
distinto de itens 
 c. Os algoritmos de Clustering são 
métodos de aprendizado não 
supervisionados usados para a criação 
de grupos homogêneos, dado um 
conjunto de dados com base em sua 
estrutura interna. 
 d. Comumente aplicado em análise de 
operações de compras com cartão de 
crédito, onde se percebem caso ocorram 
fraudes. 
 e. Comumente utilizada para a 
classificação de clientes mediante ao 
perfil de compra e crédito. 
 
 
PERGUNTA 1 
1. Analise as afirmativas: 
 
I - Clustering é um método frequentemente usado 
para análise exploratória dos dados, onde não há 
estimativas de quaisquer valores ou agrupamentos, as 
criações dos grupos ocorrem apenas se encontrando a 
semelhança entre os dados e agrupando-os em grupos 
ou clusters; 
II - Pode-se usar o método de clustering para realizar 
segmentação de clientes para permitir programas de 
marketing direcionados ou especiais; 
III - As técnicas de clustering não podem ser 
utilizadas para criar agrupamentos de documentos 
dada a natureza desestruturada dos textos; 
 
Selecione a correta alternativa quanto às afirmativas: 
 a. I – correta, II – correta e III - 
incorreta. 
 b. I – incorreta, II – correta e III - 
correta. 
errado 
c. I – correta, II – incorreta e III - 
correta. 
 d. I – incorreta, II – incorreta e III - 
incorreta. 
 e. I – correta, II – correta e III - 
correta. 
0,25 pontos 
PERGUNTA 2 
1. Analise as afirmativas: 
 
I - A detecção de outliers tem importantes aplicações 
para detecção de fraudes em cartões de crédito, 
fraudes em sistemas de telecomunicações, detecção de 
falhas, redes de sensores, detecção de intrusos, 
detecção de spam em emails, diagnósticos médicos ou 
aplicações em marketing; 
II - uma anomalia ou um outlier, ocorre quando uma 
instância ou conjunto de instâncias são consideradas 
diferentes do restante do conjunto de dados.; 
III - Há três tipos de técnicas elencadas na literatura 
para a detecção de outliers: técnicas baseadas em 
distância, baseadas em densidade ou baseadas em 
estatísticas; 
 
Selecione a correta alternativa quanto às afirmativas: 
errado 
a. I – correta, II – incorreta e III - 
correta. 
 b. I – correta, II – correta e III - 
correta. 
 c. I – correta, II – correta e III - 
incorreta. 
 d. I – incorreta, II – correta e III - 
correta. 
 e. I – incorreta, II – incorreta e III - 
incorreta. 
0,25 pontos 
PERGUNTA 3 
1. Selecione a alternativa que traz uma correta definição 
de algoritmos de clustering. 
 a. Os algoritmos de Clustering são 
métodos de aprendizado não 
supervisionados usados para a criação 
de grupos homogêneos, dado um 
conjunto de dados com base em sua 
estrutura interna. 
 b. Comumente utilizada para a 
classificação de clientes mediante ao 
perfil de compra e crédito. 
 c. Utilizado para se compreender quais são 
as características que melhor definem o 
comportamento de uma espécie. 
 d. Geram regras de associação que 
demonstram a presença de um 
determinado conjunto que implica na 
presença de algum outro conjunto 
distinto de itens 
 e. Comumente aplicado em análise de 
operações de compras com cartão de 
crédito, onde se percebem caso ocorram 
fraudes. 
0,25 pontos 
PERGUNTA 4 
1. Analise as afirmativas: 
 
I - Escolhe aleatoriamente a quantidade de grupos ou 
clusters nos quais se deseja agrupar os objetos; 
II - Recebe como parâmetro a quantidade de grupos 
ou clusters nos quais se deseja agrupar os objetos; 
III - Utiliza medidas de similaridade entre os objetos; 
 
Selecione a correta alternativa quanto às afirmativas 
relacionadas ao algoritmo kmeans: 
 a. I – correta, II – incorreta e III - correta. 
 b. I – incorreta, II – incorreta e III - 
incorreta. 
 c. I – correta, II – correta e III - incorreta. 
 d. I – correta, II – correta e III - correta. 
 e. I – incorreta, II – correta e III - 
correta. 
 
 
PERGUNTA 1 
1. Analise as afirmativas: 
 
I - Escolhe aleatoriamente a quantidade de grupos ou 
clusters nos quais se deseja agrupar os objetos; 
II - Recebe como parâmetro a quantidade de grupos 
ou clusters nos quais se deseja agrupar os objetos; 
III - Utiliza medidas de similaridade entre os objetos; 
 
Selecione a correta alternativa quanto às afirmativas 
relacionadas ao algoritmo kmeans: 
 a. I – correta, II – correta e III - incorreta. 
 b. I – correta, II – incorreta e III - correta. 
 c. I – correta, II – correta e III - correta. 
 d. I – incorreta, II – correta e III - 
correta. 
 e. I – incorreta, II – incorreta e III - 
incorreta. 
0,25 pontos 
PERGUNTA 2 
1. Analise as afirmativas: 
 
I - A detecção de outliers tem importantes aplicações 
para detecção de fraudes em cartões de crédito, 
fraudes em sistemas de telecomunicações, detecção de 
falhas, redes de sensores, detecção de intrusos, 
detecção de spam em emails, diagnósticos médicos ou 
aplicações em marketing; 
II - uma anomalia ou um outlier, ocorre quando uma 
instância ou conjunto de instâncias são consideradas 
diferentes do restante do conjunto de dados.; 
III - Há três tipos de técnicas elencadas na literatura 
para a detecção de outliers: técnicas baseadas em 
distância, baseadas em densidade ou baseadas em 
estatísticas; 
 
Selecione a correta alternativa quanto às afirmativas: 
 a. I – incorreta, II – correta e III - 
correta. 
 b. I – incorreta, II – incorreta e III - 
incorreta. 
 c. I – correta, II – correta e III - 
incorreta. 
errado 
d. I – correta, II – incorreta e III - 
correta. 
 e. I – correta, II – correta e III - 
correta. 
0,25 pontos 
PERGUNTA 3 
1. Analise as afirmativas: 
 
I - Escolhe aleatoriamente a quantidade de grupos ou 
clusters nos quais se deseja agrupar os objetos; 
II - Recebe como parâmetro a quantidade de grupos 
ou clusters nos quais se deseja agrupar os objetos; 
III - Utiliza medidas de similaridade entre os objetos; 
 
Selecione a correta alternativa quanto às afirmativas 
relacionadas ao algoritmo kmeans: 
 a. I – correta,II – incorreta e III - correta. 
 b. I – incorreta, II – correta e III - 
correta. 
 c. I – correta, II – correta e III - incorreta. 
 d. I – incorreta, II – incorreta e III - 
incorreta. 
 e. I – correta, II – correta e III - correta. 
0,25 pontos 
PERGUNTA 4 
1. Analise as afirmativas: 
 
I - As medidas de "similaridade" não são boas para o 
uso em algoritmos de clustering; 
II - A distância (um inverso de semelhança) entre os 
pontos dentro de um cluster é sempre menor do que a 
distância entre pontos em um cluster diferente; 
III - A escolha do tipo de medida de distância é 
importante para a execução dos algoritmos de usam 
medidas de similaridades; 
 
Selecione a correta alternativa quanto às afirmativas: 
 a. I – incorreta, II – incorreta e III - 
incorreta. 
 b. I – correta, II – incorreta e III - 
correta. 
errado 
c. I – correta, II – correta e III - 
correta. 
 d. I – correta, II – correta e III - 
incorreta. 
 e. I – incorreta, II – correta e III - 
correta. 
 
PERGUNTA 1 
1. Analise as afirmativas quanto ao processo de seleção 
de feições: 
 
I - O tf define a importância de uma palavra em um 
documento; 
II - Todos os termos que possuem valores de tf altos 
são importantes para todo o conjunto de documentos; 
III - Com os pesos de TF/IDF de cada palavra 
definidos pode-se fazer um ranqueamento das 
palavras que definem a importância de cada termo no 
conjunto total de documentos; 
 
Selecione a correta alternativa quanto às afirmativas: 
 a. I – correta, II – correta e III - correta. 
 b. I – incorreta, II – incorreta e III - incorreta. 
 c. I – correta, II – incorreta e III - correta. 
 d. I – incorreta, II – correta e III - correta. 
 e. I – correta, II – correta e III - incorreta. 
0,25 pontos 
PERGUNTA 2 
1. Analise as afirmativas quanto ao processo de extração 
e seleção de feições: 
 
I - O coeficiente de jaccard pode ser utilizado no 
processo de word stemming; 
II - Após a aplicação do processo de extração de 
feições é aplicado o processo de seleção de feições, 
que define a importância de cada termo para um 
documento ou para um dado conjunto de documentos; 
III - Todos os termos que permaneceram na 
representação dos documentos ou extração de feições 
agregam conhecimento; 
 
Selecione a correta alternativa quanto às afirmativas: 
 a. I – correta, II – correta e III - incorreta. 
 b. 
I – incorreta, II – incorreta e III - 
incorreta. 
 ERRADAc. 
I – correta, II – incorreta e III - 
correta. 
 d. I – incorreta, II – correta e III - correta. 
 e. I – correta, II – correta e III - correta. 
0,25 pontos 
PERGUNTA 3 
1. Analise as afirmativas: 
 
I - processo de análise de textos possui inúmeras 
fases, que dado o tipo de projeto e tipo de tecnologia 
de processamento de textos fará com que algumas das 
fases sejam agrupadas; 
II - O processo de categorização de documentos é 
uma subárea da mineração em textos; 
III - O processo de remoção de palavras não é uma 
fase do processo de categorização de documentos; 
 
Selecione a correta alternativa quanto às afirmativas: 
 a. I – correta, II – correta e III - incorreta. 
 b. I – incorreta, II – correta e III - correta. 
 ERRADAc. 
I – correta, II – correta e III - 
correta. 
 d. I – correta, II – incorreta e III - correta. 
 e. 
I – incorreta, II – incorreta e III - 
incorreta. 
0,25 pontos 
PERGUNTA 4 
1. Analise as afirmativas quanto ao processo de extração 
de feições: 
 
I - O conjunto de palavras obtidos com a aplicação do 
passo de transformação é submetido a um processo de 
remoção de palavras, no qual são removidas palavras 
que não possuem importância no texto, chamadas na 
literatura como stop words; 
II - As palavras restantes passam por um processo 
mencionado na literatura como word stemming, que 
tem por objetivo remover variações de um mesmo 
termo, como por exemplo conjugações verbais.; 
III - Os documentos não precisam ser transformados 
em texto plano e dividido em palavras individuais 
para a análise; 
 
Selecione a correta alternativa quanto às afirmativas: 
 a. I – correta, II – correta e III - correta. 
 b. I – correta, II – correta e III - incorreta. 
 c. I – incorreta, II – incorreta e III - incorreta. 
 d. I – incorreta, II – correta e III - correta. 
 e. I – correta, II – incorreta e III - correta. 
 
 
PERGUNTA 1 
1. Analise as afirmativas: 
 
I - processo de análise de textos possui inúmeras 
fases, que dado o tipo de projeto e tipo de tecnologia 
de processamento de textos fará com que algumas das 
fases sejam agrupadas; 
II - O processo de categorização de documentos é 
uma subárea da mineração em textos; 
III - O processo de remoção de palavras não é uma 
fase do processo de categorização de documentos; 
 
Selecione a correta alternativa quanto às afirmativas: 
 a. I – correta, II – correta e III - incorreta. 
 b. I – correta, II – incorreta e III - correta. 
 c. I – correta, II – correta e III - correta. 
 d. I – incorreta, II – correta e III - correta. 
 e. I – incorreta, II – incorreta e III - incorreta. 
0,25 pontos 
PERGUNTA 2 
1. Analise as afirmativas quanto ao processo de 
Conversão de documentos e remoção de palavras: 
 
I - As diversas fontes de dados deverão ser 
trabalhadas de maneira genérica, para não impactar o 
processo de importação de textos; 
II - Dados de redes sociais, dados da WEB, Blogs, 
fóruns em sistemas específicos, bases de e-mails são 
exemplos de fontes de dados em análise de textos; 
III - Ao se trabalhar com diversas fontes de dados de 
Big Data, o processo inicial de requisição de dados 
poderá variar bastante, dependendo do tipo de fonte 
de dados; 
 
Selecione a correta alternativa quanto às afirmativas: 
 a. I – correta, II – correta e III - correta. 
 b. I – incorreta, II – incorreta e III - incorreta. 
 c. I – incorreta, II – correta e III - correta. 
 d. I – correta, II – correta e III - incorreta. 
 e. I – correta, II – incorreta e III - correta. 
0,25 pontos 
PERGUNTA 3 
1. Analise as afirmativas quanto ao processo de extração 
de feições: 
 
I - O processo de extração de feições agrupa os passos 
de conversão de documentos, remoção de palavras e 
desambiguação; 
II - Este processo pretende determinar as palavras que 
caracterizam ou que possuem maior importância em 
um dado documento; 
III - Após o processo de extração de feições a 
dimensionalidade do documento não possuirá relação 
com a quantidade de palavras; 
 
Selecione a correta alternativa quanto às afirmativas: 
 a. I – correta, II – incorreta e III - correta. 
 b. I – incorreta, II – incorreta e III - incorreta 
 c. I – incorreta, II – correta e III - correta. 
 d. I – correta, II – correta e III - correta. 
 e. I – correta, II – correta e III - incorreta. 
0,25 pontos 
PERGUNTA 4 
1. Analise as afirmativas quanto ao processo de seleção 
de feições: 
 
I - O tf define a importância de uma palavra em um 
documento; 
II - Todos os termos que possuem valores de tf altos 
são importantes para todo o conjunto de documentos; 
III - Com os pesos de TF/IDF de cada palavra 
definidos pode-se fazer um ranqueamento das 
palavras que definem a importância de cada termo no 
conjunto total de documentos; 
 
Selecione a correta alternativa quanto às afirmativas: 
 a. I – correta, II – incorreta e III - correta. 
 b. I – correta, II – correta e III - correta. 
 c. 
I – incorreta, II – incorreta e III - 
incorreta. 
 d. I – incorreta, II – correta e III - correta. 
 ERRADOe. 
I – correta, II – correta e III - 
incorreta. 
 
PERGUNTA 1 
1. Analise as afirmativas quanto ao processo de seleção 
de feições: 
 
I - O tf define a importância de uma palavra em um 
documento; 
II - Todos os termos que possuem valores de tf altos 
são importantes para todo o conjunto de documentos; 
III - Com os pesos de TF/IDF de cada palavra 
definidos pode-se fazer um ranqueamento das 
palavras que definem a importânciade cada termo no 
conjunto total de documentos; 
 
Selecione a correta alternativa quanto às afirmativas: 
 a. I – correta, II – correta e III - incorreta. 
 b. I – correta, II – incorreta e III - correta. 
 c. I – correta, II – correta e III - correta. 
 d. I – incorreta, II – incorreta e III - incorreta. 
 e. I – incorreta, II – correta e III - correta. 
0,25 pontos 
PERGUNTA 2 
1. Analise as afirmativas quanto ao processo de extração 
de feições: 
 
I - O conjunto de palavras obtidos com a aplicação do 
passo de transformação é submetido a um processo de 
remoção de palavras, no qual são removidas palavras 
que não possuem importância no texto, chamadas na 
literatura como stop words; 
II - As palavras restantes passam por um processo 
mencionado na literatura como word stemming, que 
tem por objetivo remover variações de um mesmo 
termo, como por exemplo conjugações verbais.; 
III - Os documentos não precisam ser transformados 
em texto plano e dividido em palavras individuais 
para a análise; 
 
Selecione a correta alternativa quanto às afirmativas: 
 a. I – incorreta, II – incorreta e III - incorreta. 
 b. I – correta, II – incorreta e III - correta. 
 c. I – incorreta, II – correta e III - correta. 
 d. I – correta, II – correta e III - correta. 
 e. I – correta, II – correta e III - incorreta. 
0,25 pontos 
PERGUNTA 3 
1. Analise as afirmativas quanto ao processo de seleção 
de feições: 
 
I - O método comumente utilizado para o esse 
processo é o TF/IDF; 
II - TF refere-se à frequência do termo; 
III - IDF refere-se à inversa da frequência do 
documento; 
 
Selecione a correta alternativa quanto às afirmativas: 
 a. I – incorreta, II – incorreta e III - incorreta. 
 b. I – incorreta, II – correta e III - correta. 
 c. I – correta, II – correta e III - correta. 
 d. I – correta, II – incorreta e III - correta. 
 e. I – correta, II – correta e III - incorreta. 
0,25 pontos 
PERGUNTA 4 
1. Analise as afirmativas quanto ao processo de 
Conversão de documentos e remoção de palavras: 
 
I - Como exemplo, pode-se pensar no resgate de 
dados de postagens em Blogs, onde cada postagem, 
deverá ser inicialmente trabalhada para se remover as 
TAGs HTML, de modo a deixar tudo com texto 
plano, etiquetadas com características de autor e 
informações temporais.; 
II - A separação em pastas dos dados iniciais poderá 
influenciar o resultado e deverá ser feito de acordo 
com a análise que se requer; 
III - A análise não requer se etiquetar o dado com 
fonte de origem ou autor, o agrupamento dos 
documentos, seja por data, autor ou origem poderão 
alterar grandemente o resultado da análise de textos e 
isso deve variar também de acordo com o projeto e 
tecnologia. 
 
Selecione a correta alternativa quanto às afirmativas: 
 a. I – correta, II – correta e III - incorreta. 
 b. I – incorreta, II – incorreta e III - incorreta. 
 c. I – correta, II – correta e III - correta. 
 d. I – incorreta, II – correta e III - correta. 
 e. I – correta, II – incorreta e III - correta. 
 
PERGUNTA 1 
1. Analise as afirmativas: 
 
I - Verdadeiro positivo (TP - true positive): trata-se do 
número de pontos classificados incorretamente como 
positivos; 
II - Falso positivo (FP - false positive): o número de 
pontos classificados como negativo, porém é positivo 
para a dada classe; 
III - Falso negativo (FN - false negative): o número de 
pontos classificado como positivo para uma dada 
classe, porém ele deveria ser negativo; 
 
Selecione a correta alternativa quanto às afirmativas: 
 a. I – incorreta, II – incorreta e III - incorreta. 
 b. I – incorreta, II – correta e III - correta. 
 c. I – correta, II – incorreta e III - correta. 
 d. I – correta, II – correta e III - incorreta. 
 e. I – correta, II – correta e III - correta. 
0,25 pontos 
PERGUNTA 2 
1. Analise as afirmativas: 
 
I - A predição numérica ou regressão é definida como 
uma técnica para se prever valores numéricos a partir 
de uma dada entrada; 
II - Para se prever uma variável dependente a partir de 
uma outra independente usando a regressão linear, se 
faz necessário determinar a equação da reta de 
regressão que melhor modela os dados; 
III - As técnicas de regressão não podem ser utilizadas 
para a predição dos valores; 
 
Selecione a correta alternativa quanto às afirmativas: 
 a. I – correta, II – incorreta e III - correta. 
 b. I – incorreta, II – incorreta e III - incorreta. 
 c. I – incorreta, II – correta e III - correta. 
 d. I – correta, II – correta e III - incorreta. 
 e. I – correta, II – correta e III - correta. 
0,25 pontos 
PERGUNTA 3 
1. Analise as afirmativas: 
 
I - Em (DOUGHERTY, 2012) é citado que, para se 
dividir objetos em classes é necessário observar as 
características dos objetos, verificar quais 
características discriminam melhor as classes e a 
partir delas iniciar o processo de classificação; 
II - São exemplos de algoritmos de classificação: 
classificadores probabilísticos, classificadores 
baseados na teoria de decisão de Bayes, 
classificadores lineares baseados em funções de 
probabilidade; 
III - São exemplos de algoritmos de classificação: 
classificadores baseados em rede neurais, métodos 
estocásticos, classificadores polinomiais; 
 
Selecione a correta alternativa quanto às afirmativas: 
 a. 
I – incorreta, II – incorreta e III - 
correta. 
 b. I – correta, II – correta e III - incorreta. 
 ERRADOc. 
I – correta, II – incorreta e III - 
correta. 
 d. I – correta, II – correta e III - correta. 
 e. I – incorreta, II – correta e III - correta. 
0,25 pontos 
PERGUNTA 4 
1. Analise as afirmativas: 
 
I - Para a criação de classificadores se deve 
incialmente passar por uma etapa de treinamento; 
II - Na etapa inicial é criado um conjunto de 
treinamento, onde se conhece a quais classes essas 
instâncias de treinamento pertencem; 
III - Após a etapa de treinamento o classificador 
poderá associar novas instâncias a essas classes 
inicialmente impostas a ele; 
 
Selecione a correta alternativa quanto às afirmativas: 
 a. I – incorreta, II – correta e III - correta. 
 b. I – incorreta, II – incorreta e III - correta. 
 c. I – correta, II – correta e III - correta. 
 d. I – correta, II – incorreta e III - correta. 
 e. I – correta, II – correta e III - incorreta.

Outros materiais