Baixe o app para aproveitar ainda mais
Prévia do material em texto
5/3/23, 6:32 PM Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2806601/5956655 1/4 Análise de dados Professor(a): Marcelo Osnar Rodrigues de Abreu (Doutorado) 1) 2) 3) Prepare-se! Chegou a hora de você testar o conhecimento adquirido nesta disciplina. A Avaliação Virtual (AV) é composta por questões objetivas e corresponde a 100% da média final. Você tem até cinco tentativas para “Enviar” as questões, que são automaticamente corrigidas. Você pode responder as questões consultando o material de estudos, mas lembre-se de cumprir o prazo estabelecido. Boa prova! A análise de dados fornece suporte para extrair informações e realizar inferências que tragam escopo e suporte para a tomada de decisão de um negócio. À medida que o mercado se torna mais impulsionado pela tecnologia e rapidez nas informações, a análise de dados tem um papel cada vez mais importante nos negócios. Acerca desse tema, analise as afirmativas a seguir e classifique-as em verdadeiras (V) ou falsas (F): ( ) Existem somente técnicas de visualização de dados. ( ) Um parâmetro faz uma descrição sobre as características da população. ( ) A análise de dados pode ser aplicada somente no setor gerencial de uma empresa. ( ) Gráficos facilitam a comunicação dos resultados. Assinale a alternativa que contenha a sequência correta: Alternativas: Código da questão: 58497 Medidas de tendência central são formas de descrever o valor central de uma distribuição de dados. Dentre essas medidas, podemos citar a mediana (Md) de um conjunto de elementos, a qual é o valor que divide um conjunto de dados (ordenados) em dois subconjuntos de mesmo número de elementos. Com base nesse conceito, determine a mediana do conjunto: [6,8,4.5,6.3,7.1,8.9,5.2,9.1,23,34,2.2] Alternativas: Código da questão: 58503 A correlação é uma técnica estatística que mostra o quão forte são os pares de variáveis. Ela denota a associação entre duas variáveis quantitativas. Sobre correlação, podemos afirmar que: I. Correlação e causalidade têm a mesma definição. II. A correlação avalia somente os relacionamentos entre variáveis V. III. A correlação avalia todos os fatores que levam aos relacionamentos entre variáveis. IV. O motivo de um determinado evento ocorrer junto com outro significa que os dois são dependentes. São verdadeiras: Alternativas: V – F – F – F. F – V – F – V. CORRETO F – F – F – V. V – V – F – V. V – V – V – F. 7.1. CORRETO 8. 5.2. 6. 6.3. I – IV. I – II – III – IV. II – IV. 5/3/23, 6:32 PM Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2806601/5956655 2/4 4) 5) 6) Código da questão: 58513 O tratamento é um dos momentos mais importantes da análise de dados, pois podemos remover os valores inconsistentes e faltosos. Uma boa limpeza define qualidade do que precisa ser analisado. Sobre o processo de limpeza, podemos afirmar que: Alternativas: Código da questão: 58521 O intervalo de confiança é simplesmente uma maneira de medir quão bem sua amostra representa a população. A probabilidade de o intervalo de confiança incluir o verdadeiro valor médio dentro de uma população é denominada nível de confiança do IC. Sobre o intervalo de confiança, podemos afirmar que: I. É uma maneira de medir somente a população. II. Antes de construir um intervalo de confiança, temos que, inicialmente, identificar uma estatística de amostra. III. Devemos calcular um IC apenas para 95%. IV. O intervalo de confiança (IC) inclui o valor verdadeiro da população com um certo grau de confiança, que é expresso por um valor em percentagem (%), indicando um intervalo superior e inferior. V. À medida que o tamanho da amostra aumenta, o intervalo de valores do intervalo aumenta. São verdadeiras: Alternativas: Código da questão: 58506 Python é uma aplicação web de código aberto que permite criar e compartilhar documentos. Ele permite resolver vários tipos de problemas, como: exploração de dados, estatística, limpeza e transformação de dados, visualização, entre outras funcionalidades. Sobre as funcionalidades do Python para exploração e limpeza de dados, identifique as opções corretas. I. Matplotlib: biblioteca fundamental para exploração de dados. II. Para modificar um valor nulo pela média dos valores: data.fillna(data.mean(0)). III. O comando data.drop('E', inplace=True, axis=1) é usado com frequência para excluir linhas e colunas no banco. IV. O comando data.dropna() remove do banco todos os valores com NaN. São verdadeiras: Alternativas: Apenas a II. CORRETO II – III. A manipulação dos dados é a única maneira de tratá-los. Com Python, podemos excluir linhas e colunas a partir do comando .fillna(). O Python oferece várias formas de tratar os dados, como exclusão da coluna ou linha que não é mais útil e manipulando valores nulos. CORRETO Com Python, podemos manipular os valores nulos a partir do comando drop(). Remover linhas e colunas é a maneira mais simples de tratar os dados. I – II – III. I – II – IV. II – V. II – III – V. III – V. INCORRETO Apenas a I. I – IV. I – II – III. 5/3/23, 6:32 PM Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2806601/5956655 3/4 7) 8) 9) 10) Código da questão: 58520 Uma variável é qualquer característica, número ou quantidade que possa ser medida ou contada. Baseando-se no contexto de variável, rotule o tipo de grandeza das variáveis: peso, altura, temperatura. Alternativas: Código da questão: 58496 Medidas de tendência central descrevem a posição de um elemento dentro do conjunto de dados, ou seja, são medidas que fornecem uma ideia de todo os elementos, como as de tendência central: média, mediana e moda. A média (x ̅) de um conjunto de dados é encontrada por meio da soma de todos os números no conjunto de dados e depois dividindo pelo número de valores no conjunto. Com base nesse conceito, determine a média da distribuição a seguir: [6,8,4.5,6.3,7.1,8.9,5.2,9.1,23,34,2.2] Alternativas: Código da questão: 58502 Vamos avaliar a situação: suponha que você precise avaliar um conjunto de dados sobre o grau de escolaridade dos habitantes de município X. Cite o tipo de mensuração correta para a variável escolaridade. Alternativas: Código da questão: 58501 Um conjunto de dados com valores inconsistentes pode não fornecer insumos suficientes para gerar uma boa análise. Informações consistentes, sem duplicação, atualizadas e formatadas são fundamentais para uma boa análise. A precisão é essencial para uma análise com alta qualidade. Dados com problemas precisam ser identificados e tratados. Em relação à qualidade dos dados, marque V para a opção verdadeira e F para a falsa. ( ) O pré-processamento de dados é uma técnica de exploração para transformar dados brutos coletados em informações mais limpas. ( ) No pré-processamento, os dados não são transformados ou codificados, a técnica II – IV. CORRETO I – II – III. Altura = discreta; peso e temperatura = contínua. Altura = contínua; peso e temperatura = discreta. Peso e altura = discreta; temperatura = contínua. Todas discretas. Todas contínuas. CORRETO 10.39. CORRETO 11.40. 13. 12. 14.5. Razão. Qualitativa. Intervalar. Nominal. Ordinal. CORRETO 5/3/23, 6:32 PM Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2806601/5956655 4/4 precisa do auxílio de algoritmos de machine learning para isso. ( ) A normalização reorganiza os dados de maneira que os valores se tornem úteis apenas para serem processados por algoritmos. ( ) A normalização formata os dados e os converte de forma que permite processamento e análise adicionais. Assinale a alternativa que contenha a sequência correta: Alternativas: Código da questão: 58518 V – F – V – V. F – F – V – F. V – F – F – V. CORRETO F – F – V – V. F – F – F – F. Arquivos e Links
Compartilhar