Baixe o app para aproveitar ainda mais
Prévia do material em texto
18/03/2024, 10:47 Avaliação II - Individual about:blank 1/4 Prova Impressa GABARITO | Avaliação II - Individual (Cod.:742462) Peso da Avaliação 1,50 Prova 47473297 Qtd. de Questões 10 Acertos/Erros 8/2 Nota 8,00 Dados organizados, ou seja, estruturados, proveem uma forma padronizada de vincular a estrutura de dados, isto é, seu layout físico, com sua semântica, ou seja, com seu significado. Ao termos um conjunto de dados organizados, conseguimos facilmente manipular, modelar e visualizar, possuindo uma estrutura específica. Portanto, é essencial compreendermos estrutura e a sua semântica. Analise as questões referentes à estrutura de dados e assinale a alternativa CORRETA: A A estrutura dos dados se refere aos caracteres apresentados. B Os dados podem ser estruturados de diferentes formas, ou seja, os dados apresentados são os mesmos, contudo o layout é diferente. C A estrutura dos dados diz respeito aos números que apresentamos. D A estrutura dos dados está relacionada com a coleção de seus valores. A função de limpeza de informações ausentes compreende a eliminação de valores ausentes em conjuntos de dados. Muitas abordagens de dados ausentes simplificam o problema jogando fora os dados, ou seja, removendo os valores. Jogar fora os dados pode levar a estimativas errôneas devido ao tamanho reduzido da amostra. Referente aos métodos existentes para tratar os valores ausentes, classifique V para as sentenças verdadeiras e F para as falsas: ( ) Exclusão de Casos. ( ) Preenchimento (imputar) de manual de valores. ( ) Preenchimento com valores globais constantes. ( ) Preenchimento com medidas estatísticas. Assinale a alternativa que apresenta a sequência CORRETA: A F - V - F - V. B V - F - V - V. C V - V - V - V. D F - F - V - F. A limpeza de dados diz respeito a todo e qualquer tipo de tratamento que se realize sobre os dados escolhidos de maneira que garanta a qualidade, ou seja, que se assegure a completude, veracidade e integridade dos fatos que aqueles dados representem. Nesse sentido, analise as sentenças a seguir: I- Informações ausentes, errôneas ou inconsistentes nas bases de dados devem ser corrigidas de forma a não comprometer a qualidade dos modelos de conhecimento a serem extraídos. II- Valores com informações ausentes dificilmente aparecem em análises estatísticas sérias. VOLTAR A+ Alterar modo de visualização 1 2 3 18/03/2024, 10:47 Avaliação II - Individual about:blank 2/4 III- Um exemplo simples de limpeza de dados seria a definição de um intervalo de possíveis valores para um determinado atributo. Assinale a alternativa CORRETA: A As sentenças II e III estão corretas. B Somente a sentença I está correta. C As sentenças I e III estão corretas. D As sentenças I e II estão corretas. A função de limpeza de inconsistências compreende identificar e eliminar valores inconsistentes em conjuntos de dados. Uma inconsistência pode estar relacionada a uma única tupla (registro) ou se referir a um conjunto de registros. A inconsistência em apenas uma única tupla acontece quando os valores desta tupla são divergentes. Referente aos métodos para tratar os valores inconsistentes, classifique V para as sentenças verdadeiras e F para as falsas: ( ) Preenchimento com valores globais constantes. ( ) Preenchimento com medidas estatísticas. ( ) Exclusão de Casos. ( ) Correção de erros. Assinale a alternativa que apresenta a sequência CORRETA: A F - F - V - F. B V - F - V - V. C F - V - F - V. D F - F - V - V. Os valores do conjunto de dados precisam ser trabalhados para que estejam limpos, e a estrutura também é fundamental nesse processo, facilitando as análises. Frequentemente, os dados não são fornecidos em um formato organizado. Referente aos cinco principais problemas encontrados em conjuntos de dados, classifique V para as sentenças verdadeiras e F para as falsas: ( ) Cabeçalhos de coluna são valores, não nomes de variáveis. ( ) Múltiplas variáveis são armazenadas em uma coluna. ( ) As variáveis são armazenadas tanto em linhas quanto em colunas. ( ) Múltiplos tipos de observação são armazenados na mesma tabela. ( ) Um único tipo de observação é armazenado em várias tabelas. Assinale a alternativa que apresenta a sequência CORRETA: A V - V - V - V - V. B F - V - F - V - F. C V - F - V - V - F. D F - F - V - F - V. 4 5 18/03/2024, 10:47 Avaliação II - Individual about:blank 3/4 A função da atividade de limpeza de informações ausentes compreende a eliminação de valores ausentes em conjunto de dados. Muitas abordagens de dados ausentes simplificam o problema jogando fora os dados, ou seja, removendo os valores. Jogar simplesmente fora os dados pode levar a estimativas errôneas devido ao tamanho reduzido da amostra. Existem algumas abordagens que tratam essa questão. Referente ao preenchimento (imputar) manual de valores, analise as sentenças a seguir: I- Esse método demanda pouquíssimo consumo de tempo e recursos, sendo um dos mais utilizados na prática. II- Esse método pode ser implementado por meio de pesquisas junto às fontes de dados originais que procurem captar as informações ausentes. III- Esse método não é indicado quando a base de dados for muito grande e possuir muitos valores ausentes. Assinale a alternativa CORRETA: A Somente a sentença III está correta. B As sentenças II e III estão corretas. C Somente a sentença I está correta. D As sentenças I e II estão corretas. Para um determinado conjunto de dados, na maioria das vezes, é fácil descobrir o que são observações e o que são variáveis, contudo é complicado definir as variáveis e as observações de forma precisa. Em um ambiente de detecção de fraude, o uso de um número de telefone para várias pessoas pode indicar fraude, dessa forma, podemos querer variáveis número de telefone e tipo de número. Analise as opções referentes ao exposto e assinale a alternativa INCORRETA: A É mais fácil descrever relações funcionais entre colunas do que entre linhas. B Em uma determinada análise, podem existir vários níveis de observação. C Em uma determinada análise pode existir apenas um nível de observação. D É mais fácil fazer comparações entre grupos de observações. Um conjunto de dados é uma coleção de valores, geralmente números quando quantitativos ou sequências de caracteres se qualitativas. Os valores são organizados de duas maneiras, pertencendo a uma variável e a uma observação. A semântica dos dados é fundamental na organização dos dados. Sobre essa observação, assinale a alternativa CORRETA: A A estrutura dos dados se refere aos caracteres apresentados. B A estrutura dos dados está relacionada com a coleção de seus valores. C Os dados podem ser estruturados de diferentes formas, ou seja, os dados apresentados são os mesmos, contudo o layout é diferente. D A estrutura dos dados diz respeito aos números que apresentamos. 6 7 8 18/03/2024, 10:47 Avaliação II - Individual about:blank 4/4 Valores com informações ausentes surgem em quase todas as análises estatísticas sérias. Primeiramente, para podermos lidar com valores ausentes, é importante sabermos o motivo deles estarem ausentes. Referente a como a linguagem R trata essas questões, classifique V para as sentenças verdadeiras e F para as falsas: ( ) Os valores ausentes são indicados pelos zeros e Nas. ( ) Os valores ausentes são indicados pelo Null. ( ) Os valores ausentes são indicados pelos Nas e Null. ( ) Os valores ausentes são indicados pelos Nas. Assinale a alternativa que apresenta a sequência CORRETA: A F - V - V - V. B F - F - F - V. C F - F - V - F. D V - F - V - V. A função de limpeza de inconsistências compreende identificar e eliminar valores inconsistentes em conjuntos de dados. Uma inconsistência pode estar relacionada a um único registro (tupla) ou se referir a um conjunto de registros. A inconsistência em apenas uma tupla acontece quando os valores dessa tupla forem divergentes. Também podem existir inconsistênciascausadas por integrações de dados, em que um atributo pode ter nomes distintos em seus bancos de dados. Consequentemente, podem existir dados redundantes. Nesse sentido, existem alguns métodos para tratar os valores inconsistentes. Referente ao método de correção de erros para tratar os valores inconsistentes, classifique V para as sentenças verdadeiras e F para as falsas: ( ) Esse método é muito rápido. ( ) Esse método consome muito tempo. ( ) Esse método consiste em substituir valores errôneos ou inconsistentes identificados no conjunto de dados. ( ) Esse método pode envolver desde a correção manual até a atualização desses valores em um lote predeterminado de registros, usando comandos de atualização de dados em ambientes relacionais. Assinale a alternativa que apresenta a sequência CORRETA: A F - F - V - F. B F - F - F - V. C F - V - V - V. D V - F - V - V. 9 10 Imprimir
Compartilhar