Prévia do material em texto
QUESTÃO 4 Nesta unidade, vimos que o ser humano é essencialmente importante para a Ciência de Dados, pois muitos dos dados gerados são produtos de um processo que envolve decisões humanas. No entanto, a participação humana também pode gerar erros, o que ocorre quando: a quantidade desejada de dados não é gerada. a velocidade com que os dados são gerados é muito lenta. a qualidade dos dados é afetada pelas decisões das pessoas. os dados são gerados de forma irregular e em alta velocidade. A opção que apresenta corretamente a principal diferença entre dados estruturados e não estruturados é: Dados estruturados são os gerados por sensores e aparelhos de medição, enquanto dados não estruturados são os gerados por intervenção humana, como textos e imagens. Dados estruturados são os que podem ser organizados no formato de linhas e colunas, enquanto dados não estruturados são os que não podem ser representados dessa forma. Dados estruturados são os que possuem relações de ordem entre os seus elementos, permitindo que buscas possam ser feitas de forma eficiente, enquanto dados não estruturados são aqueles difíceis de ser pesquisados e analisados. Dados estruturados são aqueles organizados em um formato de fácil tratamento computacional, como planilhas e matrizes, enquanto dados não estruturados são aqueles fornecidos como um aglomerado de informações que precisam ser organizadas para que possam ser processadas computacionalmente. A opção que apresenta uma afirmativa correta é: A etapa de transformação visa eliminar inconsistências e ruídos presentes nos atributos de cada instância de dado. A etapa de preparação visa, principalmente, estruturar os dados para que possam ser mais facilmente processados computacionalmente. A transformação de atributos tem por objetivo a criação de novos atributos, que melhor caracterizem os fenômenos e as propriedades dos dados. A etapa de preparação envolve, necessariamente, quatro subetapas: transformação de atributos, tratamento de dados faltantes, teste de consistência e remoção de atributos redundantes. Dados inconsistentes são aqueles que: não respeitam o formato de dados estruturados. possuem conteúdo incompleto e sem significado semântico. são redundantes com relação aos demais atributos do conjunto dos dados. não condizem com o fenômeno ou processo a partir do qual foram obtidos. atributos redundades V F Possuem informações correlatas que, tipicamente, não agregam valor aos dados. Podem ser de difícil detecção, demandando ferramentas sofisticadas de análise. Aumentam a complexidade dos modelos, piorando o seu desempenho em muitos casos. Quanto aos dados faltantes, é correto afirmar que: são raros em problemas reais e podem ser facilmente evitados. podem sempre ser tratados simplesmente removendo as instâncias nas quais eles aparecem. Dados estruturados são os gerados por sensores e aparelhos de medição, e dados não estruturados são gerados por intervenção humana, como textos e imagens. quando não aparecem com grande frequência, a opção de remover instâncias em que eles aparecem pode ser aplicada sem prejudicar as demais etapas do processo de análise. problemas V F Seleção dos atributos que discriminam bons e maus pagadores. Predição de classes a partir de atributos associados aos objetos. Identificação de pessoas com perfis de compra semelhantes em uma base de dados. prolemas V F Identificação de fraudes a partir de dados cadastrais. Identificação de padrões musicais em bases de música. Identificação de objetos semelhantes em uma base de dados. Inferência de valores de temperatura a partir de informações de umidade e pressão. Quais dos agrupamentos a seguir podem ter sido gerados pela técnica K-means? Justifique a sua resposta. B e C. A e B. A, C e D. B, C e D. Suponha que um cientista de dados que atua no departamento de tecnologia da informação de determinada empresa precise trabalhar, diretamente, com um profissional da área comercial. No entanto, eles falam idiomas diferentes. A soft-skill a ser utilizada nesse caso envolve: persistência. escuta com empatia. reflexão acerca das ideias. flexibilidade de comunicação.