A maior rede de estudos do Brasil

Grátis
5 pág.
RevisãoIntrodução à Ciência de Dados

Pré-visualização | Página 1 de 1

Questão 20.
Descreva duas tarefas que os humanos fazem melhor que os computadores.?
São exemplos: realizar trabalhos que exijam criatividade, diagnosticar doenças, tomar decisões no nível da estratégia e produzir arte (embora, com os novos avanços em inteligência artificial, já exista arte gerada por computadores).
Questão 21.
De quais etapas do processo inerente à Ciência de Dados o ser humano participa diretamente?
Embora ainda não tenhamos visto, com detalhes, o processo inerente à Ciência de Dados, é possível depreender do texto as seguintes etapas: seleção da tarefa, seleção dos dados corretos e avaliação.
Questão 22.
Nesta unidade, vimos que o ser humano é essencialmente importante para a Ciência de Dados, pois muitos dos dados gerados são produtos de um processo que envolve decisões humanas. No entanto, a participação humana também pode gerar erros, o que ocorre quando:
a quantidade desejada de dados não é gerada.
a velocidade com que os dados são gerados é muito lenta.
a qualidade dos dados é afetada pelas decisões das pessoas.
os dados são gerados de forma irregular e em alta velocidade.
Um ponto que devemos considerar ao incluirmos o ser humano no processo inerente à Ciência de Dados é o fato de a qualidade dos dados poder ser afetada por crenças ou ideias do humano quando este toma decisões. No texto, há um exemplo que envolve uma empresa de telecomunicações.
Tanto a quantidade quanto a velocidade dos dados não são diretamente afetadas por decisões humanas.
Questão 23.
A opção que apresenta corretamente a principal diferença entre dados estruturados e não estruturados é:
Dados estruturados são os gerados por sensores e aparelhos de medição, enquanto dados não estruturados são os gerados por intervenção humana, como textos e imagens.
Dados estruturados são os que podem ser organizados no formato de linhas e colunas, enquanto dados não estruturados são os que não podem ser representados dessa forma.
Dados estruturados são os que possuem relações de ordem entre os seus elementos, permitindo que buscas possam ser feitas de forma eficiente, enquanto dados não estruturados são aqueles difíceis de ser pesquisados e analisados.
Dados estruturados são aqueles organizados em um formato de fácil tratamento computacional, como planilhas e matrizes, enquanto dados não estruturados são aqueles fornecidos como um aglomerado de informações que precisam ser organizadas para que possam ser processadas computacionalmente.
Afirmar que dados estruturados são os que podem ser organizados no formato de linhas e colunas, enquanto dados não estruturados não podem ser representados dessa forma não está errado, mas é uma informação incompleta.
Por outro lado, afirmar que “estruturados são os que possuem relações de ordem entre os seus elementos, permitindo que buscas possam ser feitas de forma eficiente, enquanto dados não estruturados são aqueles difíceis de ser pesquisados e analisados” não é verdadeiro, pois podemos ter dados categóricos estruturados que não possuem relação de ordem.
Por sua vez, afirmar que “dados estruturados são os gerados por sensores e aparelhos de medição, enquanto dados não estruturados são gerados por intervenção humana, como textos e imagens” não é correto já que os sensores também podem gerar dados não estruturados, como sons.
Questão 24.
Qual é a principal característica que diferencia os diversos tipos de dados?
O tipo de dado determina que operações podem ser empregadas sobre ele. Por exemplo, atributos quantitativos admitem operações aritméticas, enquanto atributos qualitativos são basicamente categóricos, admitindo contagem – e, em alguns casos, relação de ordem. O tipo de operação suportada pelos dados é, portanto, a principal característica que os diferencia.
Questão 25.
Apresente dois exemplos de dados categóricos que admitem relação de ordem e dois exemplos de dados categóricos que não admitem esse tipo de relação. Indique a ordem dos elementos nos casos em que essa relação pode ser aplicada?
Admitem relação de ordem: tamanho de roupa (pequeno < médio < grande) e nível social do IBGE (A > B1 > B2 > C1 > C2 > D > E). Não admitem relação de ordem: cor da pele (branco, preto, pardo) e tipo de residência (casa térrea, casa geminada, apartamento). Neste exercício, o importante é perceber que não é possível ordenar, claramente, os elementos categóricos, pois não existe um relação natural de ordem entre eles.
Questão 26.
A opção que apresenta uma afirmativa correta é:
A etapa de transformação visa eliminar inconsistências e ruídos presentes nos atributos de cada instância de dado.
A etapa de preparação visa, principalmente, estruturar os dados para que possam ser mais facilmente processados computacionalmente.
A transformação de atributos tem por objetivo a criação de novos atributos, que melhor caracterizem os fenômenos e as propriedades dos dados.
A etapa de preparação envolve, necessariamente, quatro subetapas: transformação de atributos, tratamento de dados faltantes, teste de consistência e remoção de atributos redundantes.
A etapa de transformação vai além de eliminar inconsistências e ruídos. A etapa de preparação não visa, principalmente, estruturar os dados, mas sim eliminar erros, redundâncias e inconsistências nos dados. Além disso, podem existir outras etapas de tratamento ou, dependendo da aplicação, algumas das indicadas podem ser desnecessárias.
Questão 27.
Dados inconsistentes são aqueles que:
não respeitam o formato de dados estruturados.
possuem conteúdo incompleto e sem significado semântico.
são redundantes com relação aos demais atributos do conjunto dos dados.
não condizem com o fenômeno ou processo a partir do qual foram obtidos.
Questão 28.
	
	Possuem informações correlatas que, tipicamente, não agregam valor aos dados.
	
	
	Podem ser de difícil detecção, demandando ferramentas sofisticadas de análise.
	
	
	Aumentam a complexidade dos modelos, piorando o seu desempenho em muitos casos.
	
	
No que diz respeito a atributos redundantes, assinale V para verdadeiro e F para falso.
Questão 29.
Quanto aos dados faltantes, é correto afirmar que:
são raros em problemas reais e podem ser facilmente evitados.
podem sempre ser tratados simplesmente removendo as instâncias nas quais eles aparecem.
Dados estruturados são os gerados por sensores e aparelhos de medição, e dados não estruturados são gerados por intervenção humana, como textos e imagens.
quando não aparecem com grande frequência, a opção de remover instâncias em que eles aparecem pode ser aplicada sem prejudicar as demais etapas do processo de análise.
Questão 30.
O que são métodos descritivos?
Métodos descritvos são aqueles que buscam encontrar padrões nos dados a partir de informações contidas nos atributos.
Questão 31.
O que são métodos preditivos?
Métodos preditivos são aqueles que buscam realizar predições a partir dos atributos.
Questão 32.
O que são métodos supervisionados e não supervisionados?
Os métodos supervisionados são aqueles que demandam um subconjunto de treinamento em que cada objeto está associado a uma resposta esperada. Já os métodos não supervisionados são aqueles que não demandam um subconjunto de treinamento – ou seja, operam diretamente nos atributos dos objetos.