Baixe o app para aproveitar ainda mais
Prévia do material em texto
19/06/2022 17:05 Teste: AO2 https://famonline.instructure.com/courses/20486/quizzes/91084/take 1/12 AO2 Iniciado: 19 jun em 15:47 Instruções do teste Importante: Caso você esteja realizando a atividade através do aplicativo "Canvas Student", é necessário que você clique em "FAZER O QUESTIONÁRIO", no final da página. 0,6 ptsPergunta 1 Considere a seguinte distribuição conjunta de probabilidade: Fonte: LORENA, A. C., FARIA, F. A. Representação do Conhecimento – Lidando com incerteza. Notas de aula. UNIFESP (São Paulo), 2015. Avalie as seguintes afirmações a respeito da distribuição de probabilidade anterior. I. P(cárie) = 0,25; II. P(cárie ˅ dor de dente) = 0,28; III. P(cárie | dor de dente) = 0,60; IV. P(extração) = 0,4. É correto o que se afirma apenas em: A+ A A- 19/06/2022 17:05 Teste: AO2 https://famonline.instructure.com/courses/20486/quizzes/91084/take 2/12 II e III, apenas. III e IV, apenas. II e IV, apenas. I e II, apenas. I e III, apenas. 0,6 ptsPergunta 2 Leia o texto a seguir: “O algoritmo k-médias toma como entrada o parâmetro k, correspondente ao número de grupos desejados, e particiona o conjunto de n objetos em k grupos, de forma que a similaridade intragrupo seja alta e a similaridade intergrupo seja baixa. A similaridade intragrupo é avaliada considerando o valor médio dos objetos em um grupo, que pode ser visto como o seu centro de gravidade ou centroide.” Fonte: CASTRO, L. N.; FERRARI, D. G. Introdução à mineração de dados: conceitos básicos, algoritmos e aplicações. São Paulo: Saraiva, 2016. p. 116. Considere as seguintes descrições a respeito da tarefa de agrupamento, mais especificamente ao algoritmo k-médias. I. A detecção de agrupamentos é uma tarefa de aprendizado preditiva também conhecida como clustering. Nesse caso, as técnicas utilizadas são, comumente, relativas ao aprendizado supervisionado, ou seja, o conjunto de dados não possui rótulos e o aprendizado usa apenas os atributos preditivos; II. Os algoritmos para tarefas preditivas produzem modelos a partir de um processo de treinamento que utiliza todo o conjunto de dados disponível. O objetivo é organizar os dados rotulados em grupos de acordo com uma medida de similaridade ou correlação; III. Um grupo é um conjunto de objetos similares (homogêneos) e os objetos que pertencem a grupos diferentes são não similares (heterogêneos). O principal A+ A A- 19/06/2022 17:05 Teste: AO2 https://famonline.instructure.com/courses/20486/quizzes/91084/take 3/12 I e II, apenas. I e III, apenas. I e IV, apenas. II e III, apenas. III e IV, apenas. objetivo do agrupamento é maximizar a homogeneidade interna nos grupos e a heterogeneidade entre os grupos. IV. Dependendo do atributo selecionado, poderemos ter diferentes grupos. Nesse contexto, a detecção de agrupamentos poderá resultar em diferentes quantidades de grupos e em composições, também diferentes, para cada grupo obtido. É correto apenas o que se afirma em: 0,6 ptsPergunta 3 a transformação, a mineração e a avaliação dos dados. a análise descritiva, a associação e a detecção de anomalias nos dados. Leia o texto abaixo: A mineração de dados é parte integrante de um processo mais amplo, conhecido como descoberta de conhecimento em bases de dados (knowledge discovery in databases, ou KDD) [...] A preparação ou pré-processamento de dados é uma das partes principais do KKD, e correspondem as etapas anteriores à mineração que visam preparar os dados para uma análise eficiente e eficaz. (Fonte: DE CASTRO, L. N. Introdução à mineração de dados: conceitos básicos, algoritmos e aplicações. São Paulo: Saraiva, 2016.) A preparação ou pré-processamento de dados inclui A+ A A- 19/06/2022 17:05 Teste: AO2 https://famonline.instructure.com/courses/20486/quizzes/91084/take 4/12 o agrupamento e a associação dos dados. a limpeza, a integração, a seleção ou redução e a transformação dos dados. a análise descritiva, o agrupamento e a predição dos dados. 0,6 ptsPergunta 4 Avalie o diagrama a seguir: Fonte: JANOS, M. 3 Dimensões Inteligência Artificial nas Empresas, 2020. Disponível em: https://www.3dimensoes.com.br/post/overfitting-e-underfitting. Acesso em: 07 out. 2020. Sobre a tarefa de regressão linear, o diagrama descreve exemplos de funções aprendidas a partir da análise de dados. Nesse contexto, selecione a alternativa A+ A A- 19/06/2022 17:05 Teste: AO2 https://famonline.instructure.com/courses/20486/quizzes/91084/take 5/12 Overfitting é o nome que se dá quando há muitas variáveis independentes no conjunto de dados. Interfitting é o nome que se dá quando há uma correlação forte entre os valores das variáveis independentes e as dependentes. Subfitting é o nome que se dá quando há poucas variáveis independentes no conjunto de dados. Superfitting é o nome que se dá quando há muito ajuste dos dados pela curva da função aprendida. Underfitting é o nome que se dá quando há pouco ajuste dos dados pela curva da função aprendida. correta, dentre as disponíveis abaixo, sobre o ajustamento de funções lineares aos dados. 0,6 ptsPergunta 5 Leia o texto a seguir: “Essas funções são baseadas em critérios que avaliam o quão bom cada atributo é no papel de dividir o conjunto de dados, considerando a distribuição de classes presentes no conjunto. [...] O índice Gini usa um critério baseado em impureza para analisar as diferenças entre as distribuições de probabilidade dos valores dos atributos de classe.” Fonte: DA SILVA, L. A.; PERES, S. M.; BOSCARIOLI, C. Introdução à Mineração de Dados Com aplicações em R. Rio de Janeiro: Elsevier, 2016. p. 104. Avalie as seguintes asserções e a relação proposta entre elas. I. A escolha de um atributo para dividir um conjunto de dados pode ser feita com a utilização do índice Gini, quanto menor for o valor calculado mais puras serão as partições; A+ A A- 19/06/2022 17:05 Teste: AO2 https://famonline.instructure.com/courses/20486/quizzes/91084/take 6/12 As asserções I e II são proposições verdadeiras, mas a II não é uma justificativa da I. As asserções I e II são ambas proposições falsas. As asserções I e II são proposições verdadeiras, e a II é uma justificativa da I. A asserção I é uma proposição falsa, e a II é uma proposição verdadeira. A asserção I é uma proposição verdadeira, e a II é uma proposição falsa. PORQUE II. O índice Gini calcula a proporção de classes diferentes em uma partição e quanto maior for a heterogeneidade da partição, tanto maior será o valor do índice. A respeito dessas asserções, assinale a opção correta: 0,6 ptsPergunta 6 Leia o texto a seguir: “As funcionalidades da mineração de dados são usadas para especificar os tipos de informações a serem obtidas nas tarefas de mineração. [...] Em muitos casos, o usuário não tem ideia do tipo de conhecimento contido nos dados ou como usá- lo para gerar modelos preditivos, [...]” Fonte: CASTRO, L. N.; FERRARI, D. G. Introdução à mineração de dados: conceitos básicos, algoritmos e aplicações. São Paulo: Saraiva, 2016. p. 7. Considere as seguintes descrições a respeito das tarefas de Mineração de Dados: A+ A A- 19/06/2022 17:05 Teste: AO2 https://famonline.instructure.com/courses/20486/quizzes/91084/take 7/12 I e II, apenas. III e IV, apenas. I e IV, apenas. II e III, apenas. I e III, apenas. I. A análise descritiva tem por objetivo medir, explorar e descrever características intrínsecas aos dados. II. A predição tem por objetivo produzir modelos para avaliar a classe ou valor de um objeto rotulado. III. A análise de grupos tem por objetivo separar um conjunto de objetos em grupos, a partir da aprendizagem supervisionada. IV. A associação tem por objetivo encontrar relações entre os atributos em uma base de dados transacional. É correto o que se afirma apenas em: 0,6 ptsPergunta 7 Leia o texto abaixo: O processo de mineração corresponde à extração de minerais valiosos, como ouro e pedraspreciosas, a partir de uma mina. Uma característica importante desses materiais é que, embora não possam ser cultivados ou produzidos artificialmente, existem de maneira implícita e muitas vezes desconhecida em alguma fonte, podendo ser extraídos. Esse processo requer acesso à mina, o uso de ferramentas adequadas de mineração, a extração dos minérios propriamente dita e o seu posterior preparo para comercialização. Fonte: DE CASTRO, L. N. Introdução à mineração de dados: conceitos básicos, algoritmos e aplicações. São Paulo: Saraiva, 2016. A+ A A- 19/06/2022 17:05 Teste: AO2 https://famonline.instructure.com/courses/20486/quizzes/91084/take 8/12 O termo mineração de dados é uma alusão ao processo de extração de minerais, uma vez que se explora um algoritmo (mina) usando banco de dados (ferramentas) adequados para obter conhecimento (minerais preciosos). O termo mineração de dados é uma alusão ao processo de extração de minerais, uma vez que se explora uma base de dados (mina) usando algoritmos (ferramentas) adequados para obter conhecimento (minerais preciosos). O termo mineração de dados é uma alusão ao processo de extração de minerais, uma vez que se explora um conhecimento(mina) usando algoritmos (minerais preciosos) adequados para obter base de dados (ferramentas). O termo mineração de dados é uma alusão ao processo de extração de minerais, uma vez que se explora o conhecimento (mina) usando banco de dados (ferramentas) adequados para obter ferramentas (minerais preciosos). O termo mineração de dados é uma alusão ao processo de extração de minerais, uma vez que se explora uma base de dados (mina) usando algoritmos (minerais preciosos) adequados para obter conhecimento (ferramentas). Considerando as informações apresentadas, assinale a opção correta. 0,6 ptsPergunta 8 Leia o texto a seguir: “O valor de um atributo de um dado objeto é uma medida da quantidade daquele atributo, a qual pode ser numérica ou categórica. Os atributos numéricos podem assumir quaisquer valores numéricos [...] ao passo que as quantidades categóricas assumem valores correspondentes a símbolos distintos.” Fonte: CASTRO, L. N.; FERRARI, D. G. Introdução à mineração de dados: conceitos básicos, algoritmos e aplicações. São Paulo: Saraiva, 2016. p. 30. Avalie as seguintes asserções e a relação proposta entre elas. I. Os atributos numéricos discretos têm seus valores obtidos a partir de processos de medição e os atributos contínuos têm seus valores obtidos a partir de A+ A A- 19/06/2022 17:05 Teste: AO2 https://famonline.instructure.com/courses/20486/quizzes/91084/take 9/12 As asserções I e II são proposições verdadeiras, e a II é uma justificativa da I. As asserções I e II são ambas proposições falsas. A asserção I é uma proposição falsa, e a II é uma proposição verdadeira. A asserção I é uma proposição verdadeira, e a II é uma proposição falsa. As asserções I e II são proposições verdadeiras, mas a II não é uma justificativa da I. processos de contagem. PORQUE II. Os valores numéricos discretos pertencem ao conjunto dos números naturais e os valores numéricos contínuos pertencem ao conjunto dos números reais. A respeito dessas asserções, assinale a opção correta: 0,6 ptsPergunta 9 Leia o texto a seguir: “O pré-processamento, também conhecido como preparação da base de dados, manipula e transforma os dados brutos de maneira que o conhecimento neles contido possa ser mais fácil e corretamente obtido. A melhor maneira de se pré- processar os dados depende de três fatores centrais: os problemas existentes na base, quais respostas pretende-se obter e como funcionam as técnicas de mineração.” Fonte: CASTRO, L. N.; FERRARI, D. G. Introdução à mineração de dados: conceitos básicos, algoritmos e aplicações. São Paulo: Saraiva, 2016. p. 34. A+ A A- 19/06/2022 17:05 Teste: AO2 https://famonline.instructure.com/courses/20486/quizzes/91084/take 10/12 A limpeza cuida de permitir que métodos que trabalham apenas com atributos nominais possam ser empregados. A integração cuida da união de múltiplas fontes de dados. A redução cuida da diminuição da base de dados. A transformação cuida da padronização do formato dos dados. A discretização cuida da atribuição de valores ausentes, da remoção de ruídos e de corrigir inconsistências. A limpeza cuida de permitir que métodos que trabalham apenas com atributos nominais possam ser empregados. A integração cuida da diminuição da base de dados. A redução cuida da união de múltiplas fontes de dados. A transformação cuida da padronização do formato dos dados. A discretização cuida da atribuição de valores ausentes, da remoção de ruídos e de corrigir inconsistências. A limpeza cuida da diminuição da base de dados. A integração cuida da padronização do formato dos dados. A redução cuida da união de múltiplas fontes de dados. A transformação cuida de permitir que métodos que trabalham apenas com atributos nominais possam ser empregados. A discretização cuida da atribuição de valores ausentes, da remoção de ruídos e de corrigir inconsistências. A limpeza cuida da padronização do formato dos dados. A integração cuida da diminuição da base de dados. A redução cuida da união de múltiplas fontes de dados. A transformação cuida de permitir que métodos que trabalham apenas com atributos nominais possam ser empregados. A discretização cuida da atribuição de valores ausentes, da remoção de ruídos e de corrigir inconsistências. A limpeza cuida da atribuição de valores ausentes, da remoção de ruídos e de corrigir inconsistências. A integração cuida da união de múltiplas fontes de dados. A redução cuida da diminuição da base de dados. A transformação cuida da padronização do formato dos dados. A discretização cuida de permitir que métodos que trabalham apenas com atributos nominais possam ser empregados. Qual alternativa descreve corretamente as principais tarefas de pré- processamento? 0,6 ptsPergunta 10 Leia o texto abaixo: Árvore de decisão é uma das técnicas mais populares de mineração de dados. Mais comumente usada para resolver a tarefa de classificação de dados, a árvore de decisão consiste em uma coleção de nós internos e nós folhas, organizados em um modelo hierárquico (da mesma forma que se organizam as estruturas de dados do tipo árvore). No contexto da resolução da tarefa de classificação, uma A+ A A- 19/06/2022 17:05 Teste: AO2 https://famonline.instructure.com/courses/20486/quizzes/91084/take 11/12 A construção da árvore é realizada por meio de um algoritmo que não precisa analisar os atributos descritivos do conjunto de dados previamente rotulado, consistindo apenas no processo de aprendizado do modelo classificador. Os nós internos da árvore (tipo de prato) dizem respeito a atributos prescritivos de uma ocasião em que alguém está no restaurante para realizar uma refeição. Cada nó folha (temperatura) representa uma decisão sugerida pelo modelo classificador para a ocasião, sugestão esta, presente no atributo rótulo do conjunto de dados usado para induzir o modelo. A árvore de decisão está classificando as ocasiões em: apropriadas para consumo de pratos no jantar ou inapropriadas para consumo de pratos no jantar. Segundo o modelo representado pela árvore, se a ocasião se refere à temperatura árvore de decisão representa o modelo capaz de guiar a tomada de decisão sobre a determinação da classe à qual um exemplar pertence. A figura abaixo traz um exemplo de um modelo classificador hipotético, na forma de uma árvore de decisão, para escolha de pratos em um restaurante. Fonte: SILVA, L. A. Introdução à mineração de dados: com aplicações em R. Rio de Janeiro: Elsevier, 2016. Considerando as informações apresentadas, assinale a opção correta. A+ A A- 19/06/2022 17:05 Teste: AO2 https://famonline.instructure.com/courses/20486/quizzes/91084/take 12/12 Salvo em 17:04 alta e à hora do jantar, deve-se optar por um prato frio. Enviar teste A+ A A-
Compartilhar