Logo Passei Direto
Buscar
A discretização também é denominada de mapeamento em intervalos. Ela é baseada em transformar valores numéricos em faixas de valores, categorias, classes ou valores ordinais. De acordo com Goldschmidt e Passos (2005, p. 41), “[...] a representação em intervalos pode ser obtida a partir de métodos que dividam o domínio de uma variável numérica em intervalos”. Esses autores ainda colocam que “alguns autores consideram o processo de Discretização como pertencente ao conjunto de operações voltadas à redução de valores das variáveis (Redução de Valores Contínuos)”. Entretanto, existem diversos desafios referentes à discretização. Com relação aos desafios da discretização, analise as sentenças a seguir: I- A representação das categorias também é vista como um desafio, devido a algumas delas poderem não ser representativas. II- Um desafio é transformar valores numéricos em atributos categóricos, implicando a perda de informação. III- A discretização envolve cuidado, pois ela deve ser utilizada com a menor perda de informação. IV- A solução para representação das categorias é definir a raiz quadrada do número de instâncias como o valor inicial (ou ponto de partida) do número de faixas de valores da discretização. Assinale a alternativa CORRETA:


A Somente a sentença IV está correta.
B As sentenças I, II, III e IV estão corretas.
C Somente a sentença II está correta.
D Somente a sentença III está correta.
User badge image
Progresso com Exercícios

há 2 anos

Respostas

User badge image

Ed Verified user icon

há 2 anos

A alternativa correta é a letra B: As sentenças I, II, III e IV estão corretas.

Essa resposta te ajudou?

0
Dislike0
left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar essa resposta. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Ainda com dúvidas?

Envie uma pergunta e tenha sua dúvida de estudo respondida!

Mais perguntas desse material

Sobre como os valores são organizados na semântica de dados, assinale a alternativa INCORRETA:


A Os valores são organizados de duas maneiras. Todo valor pertence a uma variável e a uma observação.
B Uma observação contém todos os valores medidos na mesma unidade (como uma pessoa, um dia ou uma corrida).
C Os valores são organizados de três formas, sendo que todo valor pertence a uma variável, a um atributo e a uma observação.
D Uma variável contém todos os valores que medem o mesmo atributo subjacente (como altura, temperatura, duração) nas unidades.

Analise as questões referentes à estrutura de dados e assinale a alternativa CORRETA:


A A estrutura dos dados se refere aos caracteres apresentados.
B A estrutura dos dados diz respeito aos números que apresentamos.
C A estrutura dos dados está relacionada com a coleção de seus valores.
D Os dados podem ser estruturados de diferentes formas, ou seja, os dados apresentados são os mesmos, contudo o layout é diferente.

Referente a Smooting, Agregação e Generalização, assinale a alternativa INCORRETA:


A Generalização dos dados é a etapa que possibilita transformar os dados primitivos (como linhas de tabelas) em hierarquias de mais alto nível.
B Agregação aplica operações de sumarização e agregação nos dados.
C Smooting remove os dados corrompidos (noisy data), usando técnicas de binning, agrupamento e regressão.
D Generalização é tipicamente utilizada para geração de dados no formato multidimensional em dados com alta granularidade (muitos detalhes).

Referente à Normalização e Construção de atributos, classifique V para as sentenças verdadeiras e F para as falsas:


( ) Um exemplo de construção de atributos é estipular um intervalo tal como entre –1.0 a 2.0.
( ) A normalização dos dados possibilita atribuir uma nova escala a um atributo de maneira que os valores desse atributo possam cair na nova escala em um intervalo especificado.
( ) Um exemplo da normalização de dados é por exemplo estipular um intervalo tal como entre –1.0 a 1.0 ou de 0.0 a 1.0.

( ) Na construção de atributos novos atributos podem ser construídos a partir dos atributos existentes, no sentido de apoiar o processo de análise. Assinale a alternativa que apresenta a sequência CORRETA:


A V - V - V - F.
B V - F - V - V.
C F - V - V - V.
D V - V - F - V.

Ao se falar em Z-Score, estamos nos referindo a um número de vezes que um determinado valor se distancia das outras amostras com relação ao desvio padrão e a média do atributo. Com relação à identificação de outliers por meio do Z-Score, analise as sentenças a seguir: I- A identificação de outliers por meio do Z-Score consiste em centralizar os dados em torno da média 0 e desvio padrão 1, e a partir dos novos dados, identificar aqueles que estão muito distantes de 0. II- A identificação de outliers por meio do Z-Score consiste em realizar a clusterização, randomicamente, k pontos de dados (dados numéricos) como sendo os centroides (elementos centrais) dos clusters. III- A identificação de outliers por meio do Z-Score consiste em identificar os outliers por meio da inspeção visual utilizando gráficos do tipo boxplot. IV- A identificação de outliers por meio do Z-Score consiste em encontrar a melhor linha de ajustamento para duas variáveis, desde que uma possa ser estimada (predita) pela outra. Assinale a alternativa CORRETA:


A As sentenças III e IV estão corretas.
B As sentenças I e IV estão corretas.
C As sentenças II e III estão corretas.
D Somente a sentença I está correta.

Valores com informações ausentes surgem em quase todas as análises estatísticas sérias. Primeiramente, para podermos lidar com valores ausentes, é importante sabermos o motivo deles estarem ausentes. Referente a como a linguagem R trata essas questões, classifique V para as sentenças verdadeiras e F para as falsas: ( ) Os valores ausentes são indicados pelos zeros e Nas. ( ) Os valores ausentes são indicados pelo Null. ( ) Os valores ausentes são indicados pelos Nas e Null. ( ) Os valores ausentes são indicados pelos Nas. Assinale a alternativa que apresenta a sequência CORRETA:


A F - V - V - V.
B V - F - V - V.
C F - F - V - F.
D F - F - F - V.

Com relação aos métodos de redução de valores do tipo nominal, analise as sentenças a seguir:


A As sentenças I, II e IV estão corretas.
B As sentenças I, II e III estão corretas.
C As sentenças I e III estão corretas.
D As sentenças II, III e IV estão corretas.

A função de limpeza de inconsistências compreende identificar e eliminar valores inconsistentes em conjuntos de dados. Uma inconsistência pode estar relacionada a um único registro (tupla) ou se referir a um conjunto de registros. A inconsistência em apenas uma tupla acontece quando os valores dessa tupla forem divergentes. Também podem existir inconsistências causadas por integrações de dados, em que um atributo pode ter nomes distintos em seus bancos de dados. Consequentemente, podem existir dados redundantes. Nesse sentido, existem alguns métodos para tratar os valores inconsistentes. Referente ao método de correção de erros para tratar os valores inconsistentes, classifique V para as sentenças verdadeiras e F para as falsas:


( ) Esse método é muito rápido.
( ) Esse método consome muito tempo.
( ) Esse método consiste em substituir valores errôneos ou inconsistentes identificados no conjunto de dados.
( ) Esse método pode envolver desde a correção manual até a atualização desses valores em um lote predeterminado de registros, usando comandos de atualização de dados em ambientes relacionais.

Mais conteúdos dessa disciplina