Buscar

Avaliação UNOPAR - Análise de dados

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 5 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

02/12/2023, 10:28 Cosmos · Cosmos
https://kroton.platosedu.io/lms/m/aluno/disciplina/index/3084040/8766652 1/5
Análise de dados
Professor(a): Marcelo Osnar Rodrigues de Abreu (Doutorado)
1)
2)
3)
Prepare-se! Chegou a hora de você testar o conhecimento adquirido nesta disciplina. A Avaliação Virtual (AV) é composta por questões objetivas e
corresponde a 100% da média final. Você tem até cinco tentativas para “Enviar” as questões, que são automaticamente corrigidas. Você pode
responder as questões consultando o material de estudos, mas lembre-se de cumprir o prazo estabelecido. Boa prova!
Medidas de tendência central são formas de descrever o valor central de uma distribuição de dados. Dentre essas medidas, podemos citar a
mediana (Md) de um conjunto de elementos, a qual é o valor que divide um conjunto de dados (ordenados) em dois subconjuntos de mesmo
número de elementos. Com base nesse conceito, determine a mediana do conjunto:
[6,8,4.5,6.3,7.1,8.9,5.2,9.1,23,34,2.2]
Alternativas:
6.3.
8.
6.
5.2.
7.1.  CORRETO
Código da questão: 58503
A limpeza dos dados é um processo muito importante que antecede sua exploração, com base nesse processo, podemos extrair
inconsistências e valores faltosos. A limpeza contém vários métodos para tratar as informações. Com base nesse texto, identifique o comando
para remover a coluna B de um conjunto de dados
Alternativas:
data.fillna(data.mean(B)).
data.drop('data', inplace=True, axis=B).
data.fillna(data.mean(0)).
data.drop('B', inplace=True, axis=0).
data.drop('B', inplace=True, axis=1).  CORRETO
Código da questão: 58516
Dentre as formas de avaliar os dados, podemos citar a estatística descritiva. Ela permite apresentar os valores dentro de um conjunto de
uma maneira mais significativa, o que possibilita uma interpretação mais simples, com base em coleta, resumo e simplificação dos dados. Com
base nesse conceito, marque a alternativa correta.
Alternativas:
Medidas de posição descrevem a posição central de uma distribuição de frequência em um grupo de dados, como média, desvio-padrão e
variância.
No alcance, podemos calcular o range do conjunto de dados a partir da soma dos valores.
Em um conjunto de dados amodal existem valores repetidos.
A mediana (Md) de um conjunto de dados é o valor que divide um conjunto de dados (ordenados) em dois subconjuntos de mesmo
número de elementos.  CORRETO
Resolução comentada:
inicialmente, temos que ordenar os dados:
2.2,4.5,5.2,6,6.3,7.1,8,8.9,9.1,23,34.
O valor central é 7.1.
Resolução comentada:
o método drop(). possui três parâmetros:
• A coluna que queremos excluir. “B”.
• A informação que as alterações devem ser feitas no DataFrame original, sem criar cópias. inplace=True.
• A indicação que a alteração deve ser feita na coluna. “axis = 1”.
02/12/2023, 10:28 Cosmos · Cosmos
https://kroton.platosedu.io/lms/m/aluno/disciplina/index/3084040/8766652 2/5
4)
5)
A média aritmética ponderada é calculada somando cada valor do conjunto de dados pelo total de valores dos dados.
Código da questão: 58508
Testes de hipóteses são métodos estatísticos em que um pesquisador testa uma suposição sobre um parâmetro populacional e realiza
experimentos. Classifique em verdadeiro (V) ou falso (F) os resultados esperados de um teste de hipótese.
( ) Pesquisadores testam uma hipótese por meio dos dados da própria população em análise.
( ) Teste de hipóteses é usado para avaliar uma hipótese usando dados de amostra.
( ) O teste fornece evidências sobre a hipótese.
( ) O teste fornece não fornece evidências sobre a hipótese e assim precisamos fazer intervalos de confiança.
Assinale a alternativa que contenha a sequência correta
Alternativas:
F – V – F – F.
V – F – F – V.
V – V – F – V.
F – V – V – F.  CORRETO
V – V – V – F.
Código da questão: 58504
As análises de correlação e regressão são frequentemente usadas dentro das pesquisas de todas as áreas de interesse. Embora parecidas,
correlação e regressão não são sinônimos, e cada abordagem estatística é usada para uma finalidade determinada, baseada em um conjunto
de suposições específicas. Sobre a correlação, podermos afirmar que:
Alternativas:
Na correlação positiva, um valor diminui à medida que o outro aumenta.
Ao testar a correlação entre duas variáveis, usamos o coeficiente de correlação (r) para quantificar a força e a direção do relacionamento
entre duas variáveis numéricas.  CORRETO
Os resultados do coeficiente de correlação (r) varia entre -1 a 0.
A análise de correlação (r) fornece um valor que resume o grau de relacionamento linear somente em uma variável.
Em uma correlação negativa, não existe correlação entre as variáveis.
Resolução comentada:
I. São medidas de posição: média, mediana e moda.
II. A média aritmética ponderada é calculada multiplicando cada valor do conjunto de dados pelo seu respectivo peso.
III. A mediana (Md) de um conjunto de dados é o valor que divide um conjunto de dados (ordenados) em dois subconjuntos de mesmo
número de elementos.
IV. No conjunto amodal não existem valores repetidos.
V. Calcula-se o range do conjunto de dados a partir da subtração entre o maior e o menor valor.
Resolução comentada:
( F ) Pesquisadores testam uma hipótese por meio dos dados da própria população em análise.
Resposta: Pesquisadores testam uma hipótese através da amostra.
( V ) Teste de hipóteses é usado para avaliar uma hipótese usando dados de amostra.
Resposta: Teste de hipóteses testa uma determinada hipótese sobre uma população através de uma amostra.
( V ) O teste fornece evidências sobre a hipótese.
Resposta: O teste de hipóteses fornece ferramentas que nos permitem rejeitar ou não rejeitar uma hipótese estatística através da
evidencia fornecida pela amostra.
( F) O teste fornece não fornece evidências sobre a hipótese e assim precisamos fazer intervalos de confiança.
Resposta: Os testes de hipóteses estatísticos fornecem evidências e significância suficiente para provar uma hipótese.
Resolução comentada:
ao testar a correlação entre duas variáveis, usamos o coeficiente de correlação (r) para quantificar a força e a direção do relacionamento
entre duas variáveis numéricas.
Sejam x , x , ..., x e y , y , ..., y os valores observados de X e Y, respectivamente. Denomina-se coeficiente de correlação (amostral)
entre X e Y o número dado por:
1 2 n 1 2 n.
02/12/2023, 10:28 Cosmos · Cosmos
https://kroton.platosedu.io/lms/m/aluno/disciplina/index/3084040/8766652 3/5
6)
7)
Código da questão: 58514
O teste pareado compara as médias de dois grupos dependentes para testar uma mudança ou diferença nas médias entre dois grupos
relacionados, porém em períodos distintos. Em relação ao teste t de Student para amostras pareadas, determine a opção correta.
Alternativas:
A variável usada nesse teste é independente.
Teste t de Student pareado compara as médias de apenas um grupo.
Teste t pareado para uma amostra testa a média de um único grupo em relação a uma média conhecida.
O teste t de Student pareado compara as médias de dois grupos para determinar se existe evidência estatística de que as médias da
população associada são significativamente diferentes.
O teste t pareado pode ser usado quando queremos analisar a amostra sob duas condições diferentes.  CORRETO
Código da questão: 58512
A análise de dados fornece suporte para extrair informações e realizar inferências que tragam escopo e suporte para a tomada de decisão
de um negócio. À medida que o mercado se torna mais impulsionado pela tecnologia e rapidez nas informações, a análise de dados tem um
papel cada vez mais importante nos negócios. Acerca desse tema, analise as afirmativas a seguir e classifique-as em verdadeiras (V) ou falsas
(F):
( ) Existem somente técnicas de visualização de dados.
( ) Um parâmetro faz uma descrição sobre as características da população.
( ) A análise de dados pode ser aplicada somente no setor gerencial de uma empresa.
( ) Gráficos facilitam a comunicação dos resultados.
Assinale a alternativa que contenha a sequência correta:
Alternativas:V – V – V – F.
V – V – F – V.
F – F – F – V.
V – F – F – F.
F – V – F – V.  CORRETO
Em que:
r = o coeficiente de correlação.
x = os valores da variável x em uma amostra.
y = os valores da variável y em uma amostra.
x̅ = a média dos valores da variável
i 
i
Resolução comentada:
o teste t dependente procura diferenças entre as médias quando os elementos são medidos sob a mesma variável dependente em duas
condições diferentes. Podemos usar o teste para medir elementos em momentos diferentes.
Resolução comentada:
F – Na análise de dados, existem métodos estatísticos e matemáticos capazes de transformar dados em informações.
V – Os atributos da população podem ser descritos por meio do parâmetro.
F – A análise de dados fornece suporte para todos os setores da empresa, por exemplo, para o setor financeiro, reduz os custos e
aumenta os lucros.
V – Os gráficos são uma forma simples para transmitir os feedback das análises dos dados.
02/12/2023, 10:28 Cosmos · Cosmos
https://kroton.platosedu.io/lms/m/aluno/disciplina/index/3084040/8766652 4/5
8)
9)
Código da questão: 58497
O intervalo de confiança é simplesmente uma maneira de medir quão bem sua amostra representa a população. A probabilidade de o
intervalo de confiança incluir o verdadeiro valor médio dentro de uma população é denominada nível de confiança do IC. Sobre o intervalo de
confiança, podemos afirmar que:
I. É uma maneira de medir somente a população.
II. Antes de construir um intervalo de confiança, temos que, inicialmente, identificar uma estatística de amostra.
III. Devemos calcular um IC apenas para 95%.
IV. O intervalo de confiança (IC) inclui o valor verdadeiro da população com um certo grau de confiança, que é expresso por um valor em
percentagem (%), indicando um intervalo superior e inferior.
V. À medida que o tamanho da amostra aumenta, o intervalo de valores do intervalo aumenta.
São verdadeiras:
Alternativas:
III – V.
I – II – III.
II – III – V.
II – V.
I – II – IV.  CORRETO
Código da questão: 58506
A correlação mostra a força de um relacionamento entre duas variáveis e é expressa numericamente pelo coeficiente de correlação, o qual
expressa-se numericamente pelo coeficiente de correlação (r). Com base no que estudamos sobre correlação, marque V para as opções
verdadeiras e F para as falsas.
( ) Correlação é positiva quando um valor diminui à medida que o outro aumenta.
( ) A correlação é negativa quando os valores aumentam juntos.
( ) Na análise de correlação, estimamos um coeficiente de correlação da amostra que varia entre -1 e +1
( ) Valores altos/baixos de uma das variáveis não são capazes de implicar valores altos/baixos da outra variável.
Assinale a alternativa que contenha a sequência correta:
Alternativas:
F – V – F – V.
V – F – F – F.
V – V – F – V.
F – F – V – F.  CORRETO
V – F – V – V.
Código da questão: 58511
Resolução comentada:
I. Intervalo de confiança é simplesmente uma maneira de medir quão bem sua amostra representa a população.
II. Antes de construir um intervalo de confiança, temos que, inicialmente, identificar uma estatística de amostra, pode ser a média ou
proporção da população, e o nível de confiança de 90%, 95% ou no melhor valor para o experimento.
III. Podemos calcular um IC para qualquer nível de confiança que desejar, mas o valor mais usado é 95%.
IV. O intervalo de confiança (IC) inclui o valor verdadeiro da população com certo grau de confiança, que é expresso por um valor em
percentagem (%), indicando um intervalo superior e inferior.
V. À medida que o tamanho da amostra aumenta, o intervalo de valores do intervalo diminui, o que significa com uma amostra maior a
precisão em comparação com uma amostra menor.
Resolução comentada:
I. Correlação é positiva quando os valores aumentam juntos.
II. A correlação é negativa quando um valor diminui à medida que o outro aumenta.
III. Na análise de correlação, estimamos um coeficiente de correlação da amostra que varia entre -1 e +1.
IV. Valores altos/baixos de uma das variáveis implicam valores altos/baixos da outra variável.
02/12/2023, 10:28 Cosmos · Cosmos
https://kroton.platosedu.io/lms/m/aluno/disciplina/index/3084040/8766652 5/5
10) Sobre o que foi estudado em relação às distribuições estatísticas, que definem o número de vezes que cada resultado possível pode
ocorrer em várias tentativas, vamos analisar a seguinte situação: podemos usar essa distribuição quando temos eventos nos pontos aleatórios
de tempo. Classifique a que distribuição pertence esse conceito?
Alternativas:
Bernoulli.
Binomial.
Normal.
Exponencial.
Poisson.  CORRETO
Código da questão: 58500
Resolução comentada:
a distribuição de Poisson é aplicável em situações em que os eventos ocorrem em pontos aleatórios de tempo, no qual temos interesse
apenas no número de ocorrências do evento.
Arquivos e Links

Continue navegando