Buscar

Avaliação Final - Individual Analises Exploratoria de dados

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 6 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 6 páginas

Prévia do material em texto

Prova Impressa
GABARITO | Avaliação Final (Objetiva) - Individual
(Cod.:822554)
Peso da Avaliação 3,00
Prova 65193024
Qtd. de Questões 10
Acertos/Erros 5/5
Nota 5,00
Um conjunto de dados é composto por um ou mais atributos, que os definem e são chamados de 
descritores. Por exemplo, ao falarmos de imagens, há vários atributos genéricos que podem ser 
utilizados como descritores, ou seja, que podem ser aplicados em qualquer tipo de imagem, bem 
como podem ser definidos ao domínio da imagem usada. Os termos pixel e voxel são utilizados de 
forma intercambiável, representando a utilização de imagens 2D ou 3D. 
Sobre o termo pixel e a região de interesse, assinale a alternativa INCORRETA:
A O termo valor do pixel se refere à intensidade no caso de imagens representadas em tons de
cinza. 
B Uma região de interesse pode representar sempre uma imagem completa. 
C O termo valor do pixel se refere à intensidade no caso de imagens representadas com cor, no
caso de imagens coloridas. 
D Uma região de interesse pode representar uma parte de uma imagem ou mesmo uma imagem
completa. 
A reexpression se refere a ter uma expressão de mesma informação por números diferentes. 
Podemos exemplificar usando logit = log (p/(1-p)) ao invés da proporção p. Com relação à 
reexpression, analise as sentenças a seguir: 
I- Ela pode ser utilizada para se trabalhar com tabelas bidirecionais. 
II- O objetivo pode ser substituir a dispersão de pontos por uma smooth curve. 
III- O objetivo pode ser tanto a aditividade quanto obter retidão ou simetria ou ainda tornar a 
variabilidade mais uniforme. 
Assinale a alternativa CORRETA:
A Somente a sentença I está correta.
 VOLTAR
A+
Alterar modo de visualização
1
Revisar Conteúdo do Livro
2
B As sentenças I e III estão corretas.
C As sentenças II e III estão corretas.
D As sentenças I e II estão corretas.
A função de limpeza de inconsistências compreende identificar e eliminar valores inconsistentes 
em conjuntos de dados. Uma inconsistência pode estar relacionada a um único registro (tupla) ou se 
referir a um conjunto de registros. A inconsistência em apenas uma tupla acontece quando os valores 
dessa tupla forem divergentes. Também podem existir inconsistências causadas por integrações de 
dados, em que um atributo pode ter nomes distintos em seus bancos de dados. Consequentemente, 
podem existir dados redundantes. Nesse sentido, existem alguns métodos para tratar os valores 
inconsistentes. Referente ao método de correção de erros para tratar os valores inconsistentes, 
classifique V para as sentenças verdadeiras e F para as falsas:
( ) Esse método é muito rápido.
( ) Esse método consome muito tempo.
( ) Esse método consiste em substituir valores errôneos ou inconsistentes identificados no conjunto 
de dados.
( ) Esse método pode envolver desde a correção manual até a atualização desses valores em um lote 
predeterminado de registros, usando comandos de atualização de dados em ambientes relacionais.
Assinale a alternativa que apresenta a sequência CORRETA:
A F - V - V - V.
B F - F - F - V.
C V - F - V - V.
D F - F - V - F.
Os principais gráficos para representar valores numéricos dizem respeito ao gráfico de pontos (ou de 
dispersão), ao gráfico de caixas, ao histograma, aos gráficos de densidade e ao gráfico 
violino. Referente ao gráfico de pontos ou de dispersão, analise as sentenças a seguir: 
I- No gráfico de dispersão, os dados são mostrados em linhas, sendo que cada linha traz o valor de 
uma variável. 
II- O gráfico de dispersão são representações de dados de duas ou mais variáveis que são organizadas 
em um gráfico. 
Revisar Conteúdo do Livro
3
4
III- O gráfico de dispersão utiliza coordenadas cartesianas para exibir valores de um conjunto de 
dados. 
IV- No gráfico de dispersão, os dados são exibidos como uma coleção de pontos, cada um com o 
valor de uma variável determinando a posição no eixo horizontal e o valor da outra variável 
determinando a posição no eixo vertical, no caso de se ter duas variáveis. 
Assinale a alternativa CORRETA:
A As sentenças I, III e IV estão corretas.
B As sentenças I e II estão corretas.
C As sentenças II, III e IV estão corretas.
D As sentenças I, II e III estão corretas.
Ter dados de diferentes tipos (variedade) é uma das características do Big Data. Esses dados 
podem ser tanto do tipo estruturado como do tipo não estruturado. Lembre-se: dado é tudo o que é 
observado ou conceituado. Em uma visão um tanto restrita, os dados são algo que pode ser medido. 
Diante do exposto, classifique V para as sentenças verdadeiras e F para as falsas:
( ) Os dados representam fatos ou algo que realmente ocorreu, que foi observado e medido.
( ) Os dados podem resultar de observação passiva ou coleta ativa.
( ) Os dados são observados em cada unidade e armazenados em um dispositivo eletrônico. 
Assinale a alternativa que apresenta a sequência CORRETA:
A V - V - V.
B F - F - V.
C F - V - F.
D V - F - V.
Os dados quantitativos podem ser classificados quando é possível realizar operações aritméticas. 
Vamos exemplificar: quando é possível somar dois pesos ou duas temperaturas, peso e temperatura 
são quantitativos. Dentro dos dados quantitativos, também conhecidos como dados numéricos, existe 
Revisar Conteúdo do Livro
5
Revisar Conteúdo do Livro
6
um subnível de tipos de dados: dados discretos ou dados contínuos. Referente aos dados discretos, 
classifique V para as sentenças verdadeiras e F para as falsas:
( ) São aqueles dados que assumem valores com casas decimais e que admitem que entre dois 
números há uma infinidade de números quebrados.
( ) São dados que continuam indefinidamente.
( ) São dados quantitativos que não têm valores em casas decimais, como inteiros e naturais (1, 0, 
-5).
( ) São um número inteiro e não podem ser subdivididos em partes cada vez menores.
Assinale a alternativa que apresenta a sequência CORRETA:
A V - F - V - V.
B F - V - F - V.
C F - F - V - V.
D F - F - V - F.
A análise por componentes principais ajuda a identificar grupo com custo computacional baixo, 
podendo ser aplicada em qualquer conjunto de dados numéricos que tenha mais de duas dimensões. 
Na literatura, ela também é conhecida como Karhunen-Loeve ou Método K-L. Existem quatro 
procedimentos considerados básicos da análise por componentes principais. Com relação a esses 
quatro procedimentos, classifique V para as sentenças verdadeiras e F para as falsas:
( ) Ao utilizar os componentes principais mais fracos com relação à variância, consegue-se realizar a 
reconstrução aproximando-se bem dos dados originais. 
( ) Os dados de entrada são normalizados de maneira que os valores de todos os atributos fazem 
parte da mesma faixa de valores. 
( ) Os c vetores ortonormais computados pela análise de componentes principais são unitários, 
norma igual a 1, em que o rumo é perpendicular referente aos demais 
( ) Na redução dos componentes mais fracos, primeiramente, os componentes são ordenados de 
maneira decrescente relacionados à variância. O tamanho do conjunto de dados tem a possibilidade de 
ser reduzido a partir da eliminação dos componentes mais fracos, ou seja, daqueles que tiverem 
menor variância. 
Assinale a alternativa que apresenta a sequência CORRETA:
A V - F - V - V. 
7
B F - V - V - V. 
C F - V - V - F. 
D F - F - F - V. 
Volume de dados não significa qualidade de dados. Uma expressão usada é "Garbage in, 
Garbage out", além de ser uma ameaça para o sucesso do projeto. Isso acontece pelo fato de a 
qualidade do insumo ser uma peça fundamental na qualidade do produto. Dessa forma, podemos dizer 
que a preparação de dados é:
A Afeta minimamente a análise exploratória de dados dentro do projeto, devido ser uma parte
insignificante do projeto.
B Não afeta a análise exploratória de dados, apesar de fazer parte do projeto.
C Faz parte do processo da análise exploratória de dados, porém não é algo essencial para o
projeto como um todo.D Essencial para todo e qualquer projeto que envolve a análise exploratória de dados.
Dados organizados, ou seja, estruturados, proveem uma forma padronizada de vincular a 
estrutura de dados, isto é, seu layout físico, com sua semântica, ou seja, com seu significado. Ao 
termos um conjunto de dados organizados, conseguimos facilmente manipular, modelar e visualizar, 
possuindo uma estrutura específica. Portanto, é essencial compreendermos estrutura e a sua 
semântica. Analise as questões referentes à estrutura de dados e assinale a alternativa CORRETA:
A A estrutura dos dados está relacionada com a coleção de seus valores.
B A estrutura dos dados diz respeito aos números que apresentamos.
C A estrutura dos dados se refere aos caracteres apresentados.
D Os dados podem ser estruturados de diferentes formas, ou seja, os dados apresentados são os
mesmos, contudo o layout é diferente.
Os principais gráficos para representar valores categóricos dizem respeito ao gráfico de balões, 
gráfico de mosaicos, mapa de calor, análise de série de dados temporais (ou time series), nuvem de 
palavras (word cloud), mapa em árvore (ou treemap), dentre outros. Com relação ao mapa em árvore, 
classifique V para as sentenças verdadeiras e F para as falsas:
8
9
10
( ) A tonalidade indicada no mapa de árvore se refere sempre ao maior valor relacionado ao grupo, 
representado pelo retângulo. 
( ) O mapa de árvore também é conhecido como treemap. 
( ) O mapa de árvore é útil para visualizar de várias maneiras os valores, pois é possível determinar 
os conjuntos com mais registros e os com menos registros apenas analisando o tamanho do retângulo. 
( ) O mapa de árvore permite analisar uma terceira variável que é a tonalidade da cor do retângulo. 
Assinale a alternativa que apresenta a sequência CORRETA:
A F - F - V - F. 
B V - V - V - F. 
C F - V - V - V. 
D V - F - F - V. 
Revisar Conteúdo do Livro
Imprimir

Continue navegando