Logo Passei Direto
Buscar

Mineração de Dados - COM360 - Semana 2 - Atividade Avaliativa

User badge image
Ninjaboy

em

Ferramentas de estudo

Questões resolvidas

A normalização é um processo de transformação de dados que tem como objetivo torná-los mais adequados para a aplicação de algoritmos de mineração, tais como redes neurais artificiais ou métodos baseados em distância. A normalização pode ser necessária por diversos motivos, como prevenir a saturação dos neurônios em redes neurais artificiais com múltiplas camadas e garantir que cada atributo de entrada tenha mesmo intervalo de valores.
Em relação aos quatro tipos de normalização, avalie as afirmativas a seguir.
I. Normalização Max-Min: uma técnica de pré-processamento de dados que transforma os valores de um atributo em uma escala entre 0 e 1, usando 0 valor máximo e mínimo do atributo. Essa técnica é útil para padronizar os dados e evitar a influência de valores extremos ou discrepantes.
II. Normalização pelo escore-z: um método estatístico que unifica valores de uma variável em unidades de desvio padrão em relação à média. Esse método permite comparar variáveis iguais que possuem escalas ou unidades iguais.
III. Normalização pelo escalonamento decimal: um método de transformar dados numéricos em valores entre 0 e 1, dividindo cada valor pelo maior valor absoluto da coluna. Esse método preserva a proporção e a ordem dos valores originais, mas pode ser sensível a outliers.
IV. Normalização pelo range interquartil: um método estatístico que visa reduzir a influência de valores extremos nos dados. Consiste em subtrair a mediana dos dados e dividir pelo intervalo interquartil, que é a diferença entre terceiro e primeiro quartil.
a. I, III e IV, apenas.
b. II e IV apenas.
c. III, apenas.
d. II, I e III apenas.
e. I, apenas.

Material
páginas com resultados encontrados.
páginas com resultados encontrados.
left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Questões resolvidas

A normalização é um processo de transformação de dados que tem como objetivo torná-los mais adequados para a aplicação de algoritmos de mineração, tais como redes neurais artificiais ou métodos baseados em distância. A normalização pode ser necessária por diversos motivos, como prevenir a saturação dos neurônios em redes neurais artificiais com múltiplas camadas e garantir que cada atributo de entrada tenha mesmo intervalo de valores.
Em relação aos quatro tipos de normalização, avalie as afirmativas a seguir.
I. Normalização Max-Min: uma técnica de pré-processamento de dados que transforma os valores de um atributo em uma escala entre 0 e 1, usando 0 valor máximo e mínimo do atributo. Essa técnica é útil para padronizar os dados e evitar a influência de valores extremos ou discrepantes.
II. Normalização pelo escore-z: um método estatístico que unifica valores de uma variável em unidades de desvio padrão em relação à média. Esse método permite comparar variáveis iguais que possuem escalas ou unidades iguais.
III. Normalização pelo escalonamento decimal: um método de transformar dados numéricos em valores entre 0 e 1, dividindo cada valor pelo maior valor absoluto da coluna. Esse método preserva a proporção e a ordem dos valores originais, mas pode ser sensível a outliers.
IV. Normalização pelo range interquartil: um método estatístico que visa reduzir a influência de valores extremos nos dados. Consiste em subtrair a mediana dos dados e dividir pelo intervalo interquartil, que é a diferença entre terceiro e primeiro quartil.
a. I, III e IV, apenas.
b. II e IV apenas.
c. III, apenas.
d. II, I e III apenas.
e. I, apenas.

Prévia do material em texto

Quanto às categorias de estrutura de dados, escolha a alternativa que contém a sequência correta de formatos de arquivos estruturados, semiestruturados e não estruturados. Tabela de banco de dados (DBF), e-mail (EML) e arquivo de texto (TXT). Planilha (CSV), arquivo de áudio (MP3) e arquivo de imagem (JPG). Tabela de banco de dados (DBF), arquivo de texto (PDF) e planilha (CSV). Arquivo de texto (TXT), arquivo de dados (XML) e tabela de banco de dados (DBF). E-mail (EML), arquivo de texto (TXT) e arquivo de texto (PDF). A redução de uma base de dados pode impactar tanto nos atributos quanto nos objetos, permitindo a diminuição da dimensionalidade dos objetos ou a redução da quantidade de objetos presentes na base. No que diz respeito à redução do número de atributos, é possível empregar métodos para transformar os atributos existentes na base, permitindo a obtenção de uma representação mais compacta e eficiente dos dados. Esses métodos podem envolver desde a seleção dos atributos mais relevantes até a aplicação de técnicas de codificação ou transformação dos atributos, a fim de obter uma representação mais simples e de fácil interpretação dos dados. Com base nas informações referentes aos métodos de amostragem, identifique se são verdadeiras (V) ou falsas (F) as afirmativas a seguir. I. Amostragem aleatória sem substituição. II. Amostragem aleatória com substituição. III. Amostragem realizada por grupo. IV. Amostragem realizada por aleatoriedade. Assinale a alternativa que apresenta a sequência correta. Uma estratégia comum para lidar com grandes conjuntos de dados é a redução de sua dimensionalidade. Nesse método, dados podem ser removidos, (Lacuna 1) ou estimados por representações mais (Lacuna 2), como modelos que armazenam apenas parâmetros relevantes do conjunto de dados, em vez dos dados em si. Outros métodos não paramétricos, como agrupamento, amostragem e histogramas, também podem ser utilizados para simplificar a análise dos dados e (Lacuna 3) número de informações a serem processadas. Preencha as lacunas escolhendo a alternativa a. Removidos, simples, aumentar. b. Substituídos, complexos, reduzir. C. Substituídos, simples, reduzir. d. Transferidos, simples, aumentar. e. Transferidos, complexos, aumentar. Sobre redução do número de dados, escolha a alternativa que contém nome do método de amostragem correto de acordo com o processo descrito a seguir: Os objetos (registros) do conjunto de dados pertencem a um de cinco grupos distintos de mesmo tamanho. A amostra foi obtida escolhendo 10% dos objetos de cada grupo. Amostragem por grupo. Amostragem aleatória sem substituição. Amostragem estratificada. Amostragem sistemática. Amostragem aleatória com substituição.A normalização é um processo de transformação de dados que tem como objetivo torná-los mais adequados para a aplicação de algoritmos de mineração, tais como redes neurais artificiais ou métodos baseados em distância. A normalização pode ser necessária por diversos motivos, como prevenir a saturação dos neurônios em redes neurais artificiais com múltiplas camadas e garantir que cada atributo de entrada tenha mesmo intervalo de valores. Em relação aos quatro tipos de normalização, avalie as afirmativas a seguir. I. Normalização Max-Min: uma técnica de pré-processamento de dados que transforma os valores de um atributo em uma escala entre 0 e 1, usando 0 valor máximo e mínimo do atributo. Essa técnica é útil para padronizar os dados e evitar a influência de valores extremos ou discrepantes. II. Normalização pelo escore-z: um método estatístico que unifica valores de uma variável em unidades de desvio padrão em relação à média. Esse método permite comparar variáveis iguais que possuem escalas ou unidades iguais. III. Normalização pelo escalonamento decimal: um método de transformar dados numéricos em valores entre 0 e 1, dividindo cada valor pelo maior valor absoluto da coluna. Esse método preserva a proporção e a ordem dos valores originais, mas pode ser sensível a outliers. IV. Normalização pelo range interquartil: um método estatístico que visa reduzir a influência de valores extremos nos dados. Consiste em subtrair a mediana dos dados e dividir pelo intervalo interquartil, que é a diferença entre terceiro e primeiro quartil. Está correto que se afirma em: a.l, III e IV, apenas. e IV apenas. e III, apenas. d.ll e III apenas. e. I, apenas. Sobre os métodos de imputação de valores, indique a alternativa que contém somente afirmações corretas. I. Pode-se remover objetos que possuam valores ausentes. II. Pode-se imputar manualmente os valores ausentes. III. Podem ser usados modelos preditivos para imputar valores ausentes. IV. Pode-se usar a média de valores de um atributo para imputar valores ausentes. II, apenas. e IV, apenas. I, II, III e IV. I, e IV, apenas. III e IV, apenas.Sobre integração de dados, escolha a alternativa que faz a associação correta entre nomes e as definições dos três aspectos a serem observados durante a fase de integração. 1. Redundância 2. Duplicidade 3. Conflitos I. Tipo de redundância em que objetos ou atributos aparecem repetidamente nas bases de dados. II. Ocorre quando um mesmo objeto possui diferentes valores nas bases de dados. III. Ocorre quando um mesmo objeto ou atributo pode ser obtido por meio de um outro objeto ou atributo existente nas bases de dados. 1 I; 2 3 II 1 III; 2 I; 3 1 I; 2 II; 3 III Uma técnica que pode ser utilizada para facilitar a análise de atributos numéricos é a discretização, que consiste em dividir domínio do atributo em intervalos e transformá-los em valores discretos. Com isso, é possível ampliar a quantidade de métodos de análise disponíveis para aplicação, além de reduzir a quantidade de valores de um dado atributo contínuo, que pode tornar 0 processo de mineração mais simples em alguns casos. Com base no método de discretização, assinale a alternativa que melhor descreve histograma. a.A discretização é uma técnica que consiste em aplicar transformações matemáticas aos dados para melhorar sua distribuição. b.A discretização é uma técnica que permite detectar e remover outliers dos dados na mineração de dados. C. A discretização é usada para reduzir a dimensionalidade dos dados, eliminando variáveis desnecessárias. d.A discretização é uma técnica que permite agrupar valores numéricos em intervalos e transformá-los em valores discretos. e.A discretização é uma técnica que consiste em transformar dados numéricos em dados categóricos.

Mais conteúdos dessa disciplina