Baixe o app para aproveitar ainda mais
Prévia do material em texto
18/07/2022 23:53 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2573782/4116846 1/4 Análise de dados Professor(a): Marcelo Tavares De Lima (Mestrado acadêmico) 1) 2) 3) Prepare-se! Chegou a hora de você testar o conhecimento adquirido nesta disciplina. A Avaliação Virtual (AV) é composta por questões objetivas e corresponde a 100% da média final. Você tem até cinco tentativas para “Enviar” as questões, que são automaticamente corrigidas. Você pode responder as questões consultando o material de estudos, mas lembre-se de cumprir o prazo estabelecido. Boa prova! Medidas de dispersão são maneiras de resumir um grupo de dados descrevendo a variabilidade dos dados. Ela significa até que ponto é provável que os dados numéricos variem sobre um valor médio. Em outras palavras, a dispersão ajuda a entender a distribuição dos dados. Determine o desvio-padrão e a variância do conjunto de valores: [6,8,4.5,6.3,7.1,8.9,5.2,9.1,23,34,2.2]. Alternativas: Código da questão: 58505 Em um banco de dados, muitas vezes, encontramos dados nulos. Esses valores precisam ser removidos do DataFrame antes da exploração de dados. O Python fornece vários métodos para limpeza e tratamento. Portanto, ao analisar o conjunto de dados a seguir, notamos que existem alguns valores nulos. Figura 1 – Conjunto de dados Fonte: elaborada pela autora. Vamos supor que seja necessário substituir os valores nulos pelas médias dos valores. Qual opção a seguir indica o método para substituir os valores pela média? Alternativas: Código da questão: 58517 Uma distribuição de probabilidade é uma função que descreve a probabilidade de obter os possíveis valores que uma variável aleatória pode assumir. Dentre as distribuições de probabilidade, temos as do tipo discreta, que descreve a probabilidade de valores contábeis, como uma lista de números inteiros não negativos. Com uma distribuição de probabilidade discreta, cada valor possível da variável aleatória discreta pode ser associado a uma probabilidade diferente de zero. Sobre distribuição de probabilidade, podemos afirmar que: I. A mais básica de todas as variáveis aleatórias discretas é a binomial. Diz-se que X tem uma distribuição de binomial se X = 1 ocorrer com probabilidade π e X = 0. II. A distribuição Normal segue X1, X2,…, Xn como variáveis aleatórias Bernoulli independentes e identicamente distribuídas (iid). Desvio-padrão: 9.49 e variância: 90.15. CORRETO Desvio-padrão: 8.7 e variância: 90.15. Desvio-padrão: 8.7 e variância: 50.15. Desvio-padrão: 9.49 e variância: 50.15. Desvio-padrão: 8.1 e variância: 90.15. data.fillna(data.mean(0)). CORRETO data.fillna(data.mean(A e C)). data.drop('data', inplace=True, axis=media). data.fillna(data.mean(A)). data.drop('data', inplace=True, axis=mediana). 18/07/2022 23:53 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2573782/4116846 2/4 4) 5) 6) III. Na distribuição Bernoulli E(X) = V (X) = λ. IV. A distribuição contínua binomial é conhecida como n eventos de Bernoulli. V. A distribuição exponencial é utilizada para análise de sobrevivência. São verdadeiras: Alternativas: Código da questão: 58499 A distribuição de uma variável é definida como a quantidade de vezes que cada resultado possível pode ocorrer dentre várias tentativas. Com base nesse conceito, vamos supor que você trabalha em uma fábrica que produz geladeiras e precisa estimar o tempo de funcionamento esperado das geladeiras produzidas. Descreva qual distribuição de probabilidade que podemos usar para calcular esse tempo? Alternativas: Código da questão: 58498 As análises de correlação e regressão são frequentemente usadas dentro das pesquisas de todas as áreas de interesse. Embora parecidas, correlação e regressão não são sinônimos, e cada abordagem estatística é usada para uma finalidade determinada, baseada em um conjunto de suposições específicas. Sobre a correlação, podermos afirmar que: Alternativas: Código da questão: 58514 Medidas de tendência central descrevem a posição de um elemento dentro do conjunto de dados, ou seja, são medidas que fornecem uma ideia de todo os elementos, como as de tendência central: média, mediana e moda. A média (x ̅) de um conjunto de dados é encontrada por meio da soma de todos os números no conjunto de dados e depois dividindo pelo número de valores no conjunto. Com base nesse conceito, determine a média da distribuição a seguir: [6,8,4.5,6.3,7.1,8.9,5.2,9.1,23,34,2.2] Alternativas: Apenas V. CORRETO I – II – III – V. II – IV. II – V. I – II – IV. Distribuição Poisson. INCORRETO Distribuição normal. Distribuição exponencial. Distribuição uniforme. Distribuição binomial. A análise de correlação (r) fornece um valor que resume o grau de relacionamento linear somente em uma variável. Ao testar a correlação entre duas variáveis, usamos o coeficiente de correlação (r) para quantificar a força e a direção do relacionamento entre duas variáveis numéricas. CORRETO Em uma correlação negativa, não existe correlação entre as variáveis. Na correlação positiva, um valor diminui à medida que o outro aumenta. Os resultados do coeficiente de correlação (r) varia entre -1 a 0. 12. 18/07/2022 23:53 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2573782/4116846 3/4 7) 8) 9) Código da questão: 58502 Uma variável é uma característica de uma unidade observada que pode assumir mais de um conjunto de valores, tipos e mensurações. Logo, defina o tipo de mensuração que tem as variáveis: sexo, cor dos olhos e cor da pele. Alternativas: Código da questão: 58495 Normalização é uma técnica de organização dos elementos no banco de dados é uma abordagem para eliminar a redundância e pontos indesejáveis, como anomalias de inserção, atualização e exclusão. Em relação a pré-processamento e normalização, identifique a opção correta. Alternativas: Código da questão: 58519 Uma variável é qualquer característica, número ou quantidade que possa ser medida ou contada. Baseando-se no contexto de variável, rotule o tipo de grandeza das variáveis: peso, altura, temperatura. Alternativas: Código da questão: 58496 14.5. 11.40. 10.39. 13. INCORRETO Ordinal. Intervalar. Nominal. CORRETO Contínua. Razão. A normalização pega os dados e os converte em um formato que permite processamento e análise adicionais, porém, sempre é necessário apenas para análises com algoritmos de machine learning. O propósito do processo é agrupar os valores de maneira lógica. Na normalização, os valores dos elementos ficam sempre em um determinado intervalo específico. Esse intervalo é sempre de [1,0]. A normalização não é utilizada com frequência, pois quase sempre os dados são limpos. Processo em que os dados de um conjunto de valores são reorganizados de forma que se torne utilizável para consultas e análises exploratórias. Na normalização, os valores dos elementos ficam em um determinado intervalo específico, como [-1,0]. CORRETO A normalização é feita apenas com o auxílio de algoritmos de machine learning. Todas contínuas. CORRETO Altura = contínua; peso e temperatura = discreta. Altura = discreta; peso e temperatura = contínua. Todas discretas. Peso e altura = discreta; temperatura = contínua. 18/07/2022 23:53 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2573782/4116846 4/4 10) Sobre o que foi estudado em relação às distribuições estatísticas, que definem o número de vezes que cada resultado possível pode ocorrer em várias tentativas, vamos analisar a seguinte situação: podemos usar essa distribuição quando temos eventos nos pontos aleatórios de tempo. Classifique a que distribuição pertence esse conceito? Alternativas: Código da questão: 58500 Binomial. Exponencial. Bernoulli. Normal. Poisson. CORRETO Arquivos e Links
Compartilhar