Baixe o app para aproveitar ainda mais
Prévia do material em texto
03/03/2024, 12:13 Atividade Objetiva 3: 04 - Modelagem e Preparação de Dados para Aprendizado de Máquina (2023) https://pucminas.instructure.com/courses/146797/quizzes/384310 1/4 Atividade Objetiva 3 Entrega Sem prazo Pontos 15 Perguntas 5 Limite de tempo Nenhum Tentativas permitidas Sem limite Histórico de tentativas Tentativa Tempo Pontuação MAIS RECENTE Tentativa 1 15 minutos 12 de 15 As respostas corretas estão ocultas. Pontuação desta tentativa: 12 de 15 Enviado 3 mar em 12:12 Esta tentativa levou 15 minutos. Pergunta 1 3 / 3 pts Apenas em (1) e (2) Somente em (1) Apenas em (2) e (3) Apenas em (1) e (3) Fazer o teste novamente O pré-processamento da base de dados busca adequar o conjunto de dados para serem aplicados aos algoritmos de Aprendizado de máquina. Avalie as afirmações a seguir: 1. Todos os atributos do conjunto de dados precisam ser codificados e transformados de forma que possam servir de entrada para os algoritmos de Mineração de Dados. 2. Normalmente quando se deseja aplicar uma medida de dissimilaridade (por exemplo, cálculo da distância euclideana) é necessária a transformação ou mudanças de escala dos atributos. Isto para garantir que não existam atributos com maior significado que outras. 3. A melhor forma de transformar os dados é verificar quais requisitos a solução precisa atender e quais são os requisitos que a técnica de mineração de dados impõe. É correto o que se afirma em: https://pucminas.instructure.com/courses/146797/quizzes/384310/history?version=1 https://pucminas.instructure.com/courses/146797/quizzes/384310/take?user_id=271431 03/03/2024, 12:13 Atividade Objetiva 3: 04 - Modelagem e Preparação de Dados para Aprendizado de Máquina (2023) https://pucminas.instructure.com/courses/146797/quizzes/384310 2/4 IncorretaPergunta 2 0 / 3 pts Eliminar registros se: Valor atributo < Média - 2*Desvio-padrão. Eliminar registros se: Valor atributo > Média + 2*Desvio-padrão. Eliminar registros se: Valor atributo > Média + 2*Desvio-padrão ou Valor atributo < Média - 2*Desvio-padrão. Eliminar registros se: Valor atributo > Média + 1*Desvio-padrão ou Valor atributo < Média - 1*Desvio-padrão. Pergunta 3 3 / 3 pts Durante a preparação de dados podem existir valores “outliers”. Caso nosso objetivo NÂO seja minerar eventos raros e considerando uma variável com GRANDE VARIABILIDADE (desvio padrão alto) a prática mostra que a eliminação de outliers pode seguir as seguintes regras: 1. Eliminar registros se: Valor atributo > Média + 3*Desvio-padrão ou Valor atributo < Média - 3*Desvio-padrão. 2. Eliminar registros se: Valor atributo > Média + 1*Desvio-padrão ou Valor atributo < Média - 1*Desvio-padrão. 3. Eliminar registros se: Valor atributo > Média + 2*Desvio-padrão. 4. Eliminar registros se: Valor atributo < Média - 2*Desvio-padrão. É correto o que se afirma em: Uma base de dados é considerada desbalanceada se existe nela objetos (instâncias) pertencentes a uma classe, em menor número em relação à outra. Avalie as afirmações a seguir: 1. De acordo com a literatura pode ser considerado base desbalanceada se a relação do número de objetos das classes são da ordem de 1:10. 2. O desbalanceamento nas bases de dados pode ocorrer por motivos intrínsecos devido à própria natureza do problema. Por exemplo, em detecção de fraudes, existem poucas instâncias (pessoas) que cometem fraudes em relação às outras. 3. O desbalanceamento nas bases de dados pode ocorrer por motivos não intrínsecos devido ao limitado processo da coleta de dados, por razões econômicas ou de privacidade. Uma alternativa é inserir novas instâncias para diminuir o desbalanceamento. 03/03/2024, 12:13 Atividade Objetiva 3: 04 - Modelagem e Preparação de Dados para Aprendizado de Máquina (2023) https://pucminas.instructure.com/courses/146797/quizzes/384310 3/4 Apenas (2), (3) e (4) Apenas (2) e (3) Apenas (1) e (2) Apenas (3) e (4) Pergunta 4 3 / 3 pts Todas estão corretas Apenas (1), (2) e (4) Apenas (1) e (4) Apenas (2) e (4) Pergunta 5 3 / 3 pts 4. Quando a base de dados é desbalanceada é necessário aplicar métodos para equilibrar a quantidade de objetos de cada classe. Se não for feito isto, o modelo pode apresentar comportamento polarizado. É correto o que se afirma em: Durante a preparação de dados a aplicação de técnicas de discretização possuem algumas vantagens e desvantagens. Avalie as afirmações a seguir: 1. Os Algoritmos de aprendizado de máquina, como redes neurais artificiais e SVM são capazes de lidar com dados contínuos, porém são menos eficientes para interpretabilidade dos resultados. 2. O processo de discretização também pode ser entendido como uma técnica para redução de dados a qual facilita a interpretabilidade dos resultados. 3. O processo de discretização pode acarretar perda de informação. Isso pelo fato de que o intervalo de discretização pode esconder “insights” interessantes. 4. Reduzir a perda de informação é o principal objetivo quando aplicamos técnicas de discretização. É correto o que se afirma em: As técnicas de discretização podem ser classificadas sobre vários aspectos: Supervisionadas e Não supervisionadas e pelo método utilizado, Direto e Incremental. Avalie as afirmações a seguir: 03/03/2024, 12:13 Atividade Objetiva 3: 04 - Modelagem e Preparação de Dados para Aprendizado de Máquina (2023) https://pucminas.instructure.com/courses/146797/quizzes/384310 4/4 Todas estão corretas Apenas (2) e (3) Apenas (1) e (2) Apenas (3) e (4) Pontuação do teste: 12 de 15 1. A discretização Supervisionada não leva em consideração a informação dos grupos a que pertencem as instâncias de treinamento. 2. A discretização Não supervisionada leva em conta os grupos a que pertencem as instâncias no conjunto de treinamento. 3. Os métodos de discretização diretos dividem os valores do atributo em um número de intervalos previamente definido pelo usuário. 4. Os métodos incrementais para a discretização de atributos é realizado iterativamente até que um critério de parada seja alcançado. É correto o que se afirma em:
Compartilhar