Baixe o app para aproveitar ainda mais
Prévia do material em texto
02/12/2023, 10:28 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/3084040/8766652 1/5 Análise de dados Professor(a): Marcelo Osnar Rodrigues de Abreu (Doutorado) 1) 2) 3) Prepare-se! Chegou a hora de você testar o conhecimento adquirido nesta disciplina. A Avaliação Virtual (AV) é composta por questões objetivas e corresponde a 100% da média final. Você tem até cinco tentativas para “Enviar” as questões, que são automaticamente corrigidas. Você pode responder as questões consultando o material de estudos, mas lembre-se de cumprir o prazo estabelecido. Boa prova! Medidas de tendência central são formas de descrever o valor central de uma distribuição de dados. Dentre essas medidas, podemos citar a mediana (Md) de um conjunto de elementos, a qual é o valor que divide um conjunto de dados (ordenados) em dois subconjuntos de mesmo número de elementos. Com base nesse conceito, determine a mediana do conjunto: [6,8,4.5,6.3,7.1,8.9,5.2,9.1,23,34,2.2] Alternativas: 6.3. 8. 6. 5.2. 7.1. CORRETO Código da questão: 58503 A limpeza dos dados é um processo muito importante que antecede sua exploração, com base nesse processo, podemos extrair inconsistências e valores faltosos. A limpeza contém vários métodos para tratar as informações. Com base nesse texto, identifique o comando para remover a coluna B de um conjunto de dados Alternativas: data.fillna(data.mean(B)). data.drop('data', inplace=True, axis=B). data.fillna(data.mean(0)). data.drop('B', inplace=True, axis=0). data.drop('B', inplace=True, axis=1). CORRETO Código da questão: 58516 Dentre as formas de avaliar os dados, podemos citar a estatística descritiva. Ela permite apresentar os valores dentro de um conjunto de uma maneira mais significativa, o que possibilita uma interpretação mais simples, com base em coleta, resumo e simplificação dos dados. Com base nesse conceito, marque a alternativa correta. Alternativas: Medidas de posição descrevem a posição central de uma distribuição de frequência em um grupo de dados, como média, desvio-padrão e variância. No alcance, podemos calcular o range do conjunto de dados a partir da soma dos valores. Em um conjunto de dados amodal existem valores repetidos. A mediana (Md) de um conjunto de dados é o valor que divide um conjunto de dados (ordenados) em dois subconjuntos de mesmo número de elementos. CORRETO Resolução comentada: inicialmente, temos que ordenar os dados: 2.2,4.5,5.2,6,6.3,7.1,8,8.9,9.1,23,34. O valor central é 7.1. Resolução comentada: o método drop(). possui três parâmetros: • A coluna que queremos excluir. “B”. • A informação que as alterações devem ser feitas no DataFrame original, sem criar cópias. inplace=True. • A indicação que a alteração deve ser feita na coluna. “axis = 1”. 02/12/2023, 10:28 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/3084040/8766652 2/5 4) 5) A média aritmética ponderada é calculada somando cada valor do conjunto de dados pelo total de valores dos dados. Código da questão: 58508 Testes de hipóteses são métodos estatísticos em que um pesquisador testa uma suposição sobre um parâmetro populacional e realiza experimentos. Classifique em verdadeiro (V) ou falso (F) os resultados esperados de um teste de hipótese. ( ) Pesquisadores testam uma hipótese por meio dos dados da própria população em análise. ( ) Teste de hipóteses é usado para avaliar uma hipótese usando dados de amostra. ( ) O teste fornece evidências sobre a hipótese. ( ) O teste fornece não fornece evidências sobre a hipótese e assim precisamos fazer intervalos de confiança. Assinale a alternativa que contenha a sequência correta Alternativas: F – V – F – F. V – F – F – V. V – V – F – V. F – V – V – F. CORRETO V – V – V – F. Código da questão: 58504 As análises de correlação e regressão são frequentemente usadas dentro das pesquisas de todas as áreas de interesse. Embora parecidas, correlação e regressão não são sinônimos, e cada abordagem estatística é usada para uma finalidade determinada, baseada em um conjunto de suposições específicas. Sobre a correlação, podermos afirmar que: Alternativas: Na correlação positiva, um valor diminui à medida que o outro aumenta. Ao testar a correlação entre duas variáveis, usamos o coeficiente de correlação (r) para quantificar a força e a direção do relacionamento entre duas variáveis numéricas. CORRETO Os resultados do coeficiente de correlação (r) varia entre -1 a 0. A análise de correlação (r) fornece um valor que resume o grau de relacionamento linear somente em uma variável. Em uma correlação negativa, não existe correlação entre as variáveis. Resolução comentada: I. São medidas de posição: média, mediana e moda. II. A média aritmética ponderada é calculada multiplicando cada valor do conjunto de dados pelo seu respectivo peso. III. A mediana (Md) de um conjunto de dados é o valor que divide um conjunto de dados (ordenados) em dois subconjuntos de mesmo número de elementos. IV. No conjunto amodal não existem valores repetidos. V. Calcula-se o range do conjunto de dados a partir da subtração entre o maior e o menor valor. Resolução comentada: ( F ) Pesquisadores testam uma hipótese por meio dos dados da própria população em análise. Resposta: Pesquisadores testam uma hipótese através da amostra. ( V ) Teste de hipóteses é usado para avaliar uma hipótese usando dados de amostra. Resposta: Teste de hipóteses testa uma determinada hipótese sobre uma população através de uma amostra. ( V ) O teste fornece evidências sobre a hipótese. Resposta: O teste de hipóteses fornece ferramentas que nos permitem rejeitar ou não rejeitar uma hipótese estatística através da evidencia fornecida pela amostra. ( F) O teste fornece não fornece evidências sobre a hipótese e assim precisamos fazer intervalos de confiança. Resposta: Os testes de hipóteses estatísticos fornecem evidências e significância suficiente para provar uma hipótese. Resolução comentada: ao testar a correlação entre duas variáveis, usamos o coeficiente de correlação (r) para quantificar a força e a direção do relacionamento entre duas variáveis numéricas. Sejam x , x , ..., x e y , y , ..., y os valores observados de X e Y, respectivamente. Denomina-se coeficiente de correlação (amostral) entre X e Y o número dado por: 1 2 n 1 2 n. 02/12/2023, 10:28 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/3084040/8766652 3/5 6) 7) Código da questão: 58514 O teste pareado compara as médias de dois grupos dependentes para testar uma mudança ou diferença nas médias entre dois grupos relacionados, porém em períodos distintos. Em relação ao teste t de Student para amostras pareadas, determine a opção correta. Alternativas: A variável usada nesse teste é independente. Teste t de Student pareado compara as médias de apenas um grupo. Teste t pareado para uma amostra testa a média de um único grupo em relação a uma média conhecida. O teste t de Student pareado compara as médias de dois grupos para determinar se existe evidência estatística de que as médias da população associada são significativamente diferentes. O teste t pareado pode ser usado quando queremos analisar a amostra sob duas condições diferentes. CORRETO Código da questão: 58512 A análise de dados fornece suporte para extrair informações e realizar inferências que tragam escopo e suporte para a tomada de decisão de um negócio. À medida que o mercado se torna mais impulsionado pela tecnologia e rapidez nas informações, a análise de dados tem um papel cada vez mais importante nos negócios. Acerca desse tema, analise as afirmativas a seguir e classifique-as em verdadeiras (V) ou falsas (F): ( ) Existem somente técnicas de visualização de dados. ( ) Um parâmetro faz uma descrição sobre as características da população. ( ) A análise de dados pode ser aplicada somente no setor gerencial de uma empresa. ( ) Gráficos facilitam a comunicação dos resultados. Assinale a alternativa que contenha a sequência correta: Alternativas:V – V – V – F. V – V – F – V. F – F – F – V. V – F – F – F. F – V – F – V. CORRETO Em que: r = o coeficiente de correlação. x = os valores da variável x em uma amostra. y = os valores da variável y em uma amostra. x̅ = a média dos valores da variável i i Resolução comentada: o teste t dependente procura diferenças entre as médias quando os elementos são medidos sob a mesma variável dependente em duas condições diferentes. Podemos usar o teste para medir elementos em momentos diferentes. Resolução comentada: F – Na análise de dados, existem métodos estatísticos e matemáticos capazes de transformar dados em informações. V – Os atributos da população podem ser descritos por meio do parâmetro. F – A análise de dados fornece suporte para todos os setores da empresa, por exemplo, para o setor financeiro, reduz os custos e aumenta os lucros. V – Os gráficos são uma forma simples para transmitir os feedback das análises dos dados. 02/12/2023, 10:28 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/3084040/8766652 4/5 8) 9) Código da questão: 58497 O intervalo de confiança é simplesmente uma maneira de medir quão bem sua amostra representa a população. A probabilidade de o intervalo de confiança incluir o verdadeiro valor médio dentro de uma população é denominada nível de confiança do IC. Sobre o intervalo de confiança, podemos afirmar que: I. É uma maneira de medir somente a população. II. Antes de construir um intervalo de confiança, temos que, inicialmente, identificar uma estatística de amostra. III. Devemos calcular um IC apenas para 95%. IV. O intervalo de confiança (IC) inclui o valor verdadeiro da população com um certo grau de confiança, que é expresso por um valor em percentagem (%), indicando um intervalo superior e inferior. V. À medida que o tamanho da amostra aumenta, o intervalo de valores do intervalo aumenta. São verdadeiras: Alternativas: III – V. I – II – III. II – III – V. II – V. I – II – IV. CORRETO Código da questão: 58506 A correlação mostra a força de um relacionamento entre duas variáveis e é expressa numericamente pelo coeficiente de correlação, o qual expressa-se numericamente pelo coeficiente de correlação (r). Com base no que estudamos sobre correlação, marque V para as opções verdadeiras e F para as falsas. ( ) Correlação é positiva quando um valor diminui à medida que o outro aumenta. ( ) A correlação é negativa quando os valores aumentam juntos. ( ) Na análise de correlação, estimamos um coeficiente de correlação da amostra que varia entre -1 e +1 ( ) Valores altos/baixos de uma das variáveis não são capazes de implicar valores altos/baixos da outra variável. Assinale a alternativa que contenha a sequência correta: Alternativas: F – V – F – V. V – F – F – F. V – V – F – V. F – F – V – F. CORRETO V – F – V – V. Código da questão: 58511 Resolução comentada: I. Intervalo de confiança é simplesmente uma maneira de medir quão bem sua amostra representa a população. II. Antes de construir um intervalo de confiança, temos que, inicialmente, identificar uma estatística de amostra, pode ser a média ou proporção da população, e o nível de confiança de 90%, 95% ou no melhor valor para o experimento. III. Podemos calcular um IC para qualquer nível de confiança que desejar, mas o valor mais usado é 95%. IV. O intervalo de confiança (IC) inclui o valor verdadeiro da população com certo grau de confiança, que é expresso por um valor em percentagem (%), indicando um intervalo superior e inferior. V. À medida que o tamanho da amostra aumenta, o intervalo de valores do intervalo diminui, o que significa com uma amostra maior a precisão em comparação com uma amostra menor. Resolução comentada: I. Correlação é positiva quando os valores aumentam juntos. II. A correlação é negativa quando um valor diminui à medida que o outro aumenta. III. Na análise de correlação, estimamos um coeficiente de correlação da amostra que varia entre -1 e +1. IV. Valores altos/baixos de uma das variáveis implicam valores altos/baixos da outra variável. 02/12/2023, 10:28 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/3084040/8766652 5/5 10) Sobre o que foi estudado em relação às distribuições estatísticas, que definem o número de vezes que cada resultado possível pode ocorrer em várias tentativas, vamos analisar a seguinte situação: podemos usar essa distribuição quando temos eventos nos pontos aleatórios de tempo. Classifique a que distribuição pertence esse conceito? Alternativas: Bernoulli. Binomial. Normal. Exponencial. Poisson. CORRETO Código da questão: 58500 Resolução comentada: a distribuição de Poisson é aplicável em situações em que os eventos ocorrem em pontos aleatórios de tempo, no qual temos interesse apenas no número de ocorrências do evento. Arquivos e Links
Compartilhar