Buscar

Teste de Estatística e Ciência de Dados

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 8 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 8 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Top of Form
Informações do teste
	Descrição
	
	Instruções
	Caso necessite a utilização do "EXCEL" clique no link ao lado -----------> excel.xlsx
	Várias tentativas
	Não permitido. Este teste só pode ser feito uma vez.
	Forçar conclusão
	Este teste pode ser salvo e retomado posteriormente.
 Estado de Conclusão da Pergunta:
PERGUNTA 1
1. Leia o excerto a seguir:
“A ciência dos dados é uma fusão de múltiplas disciplinas, incluindo estatística, ciência da computação, tecnologia da informação e campos de domínios específicos. Consequentemente, podem-se utilizar de muitos termos diferentes para se referir a um dado conceito.”
 
BRUCE, Peter; BRUCE, Andrew. Estatística prática para cientistas de dados : 50 conceitos iniciais. Rio de Janeiro: Alta Books, 2019, p. xv.
 A partir do apresentado, analise as asserções a seguir e a relação proposta entre elas.
 
I.  Sabemos que, na ciência dos dados, podem-se utilizar de muitos termos diferentes para se referir a um dado conceito.
Pois
II. A estatística usa, de forma profunda, a matemática como pilar do seu desenvolvimento. É considerada a ciência mais sutil, e a mais ampla, quanto o assunto são dados. É usada por todas áreas científicas.
	
	
	As asserções I e II são proposições falsas.
	
	
	A asserção I é uma proposição falsa, e a II é uma proposição verdadeira.
	
	
	As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da I.
	
	
	As asserções I e II são proposições verdadeiras, mas a II não é uma justificativa  da I.
	
	
	A asserção I é uma proposição verdadeira e a asserção II é uma proposição falsa.
1 pontos   
PERGUNTA 2
1. A análise descritiva dos dados é uma etapa muito importante no processo de descoberta de padrões em dados. Por vezes, ela se limita à análise descritiva, pois comumente já traz muitas descobertas. Em grande parte das vezes, é uma das etapas iniciais, seguida de etapas relacionadas à modelagem dos dados.
 
Em relação às ferramentas usadas por um estatístico ou um cientista de dados para a análise descritiva de dados, analise as afirmativas a seguir:
 
I. Gráficos são usados para a visualização de cada variável ou relação entre variáveis.
II. Tabelas, sumários e gráficos são as ferramentas básicas da análise descritiva.
III. Modelos preditivos são usados para a análise descritiva de dados.
IV. Tabelas e sumários estatísticos são usados na análise descritiva de dados.
 
Está correto o que se afirma em:
	
	
	I, II e IV, apenas.
	
	
	I, II e III, apenas.
	
	
	II, III e IV, apenas.
	
	
	II e III, apenas.
	
	
	I, III e IV, apenas.
1 pontos   
PERGUNTA 3
1. Vimos que uma jovem cientista de dados realizou o treino (ajuste) de um modelo de regressão logística múltipla aos dados da amostra. Os resultados que encontrou foram muito ricos, sugerindo uma série de explicações, aprendidas pelo algoritmo com base nos dados fornecidos. Veja que dizemos “explicações sugeridas”, pois qualquer resultado de um algoritmo deve ser confrontado com especialistas da área em estudo. Contudo, vamos rever o que o modelo de regressão múltipla treinado pela jovem cientista de dados sugere. Para isso, analise as afirmativas a seguir.
 
1. A probabilidade da inadimplência cresce com o aumento dos gastos médios com o cartão de crédito. Isto, que nos parece óbvio, foi o que os dados “contaram” para o algoritmo de regressão logística múltipla.
2. A probabilidade da inadimplência cresce com o aumento da renda média mensal das pessoas. Isto não é tão óbvio e provavelmente não teríamos coragem de generalizar para outras situações, mas foi o que os dados da amostra do gerente do banco “contaram” para o algoritmo de regressão logística múltipla.
3. Para duas pessoas com a mesma renda mensal e o mesmo gasto mensal com cartão de crédito, a probabilidade de inadimplência com o cartão é maior para aquela sem emprego estável. Novamente, isto foi o que os dados amostrados “contaram” para o algoritmo de regressão logística múltipla.
4. O modelo de regressão logística múltipla, ajustado aos dados da amostra, consegue predizer os efeitos da renda mensal da pessoa, do seu gasto médio mensal com cartão de crédito e se ela tem ou não um emprego estável, na probabilidade de a pessoa ficar inadimplente com o cartão de crédito. Um algoritmo desse tipo pode ajudar no processo decisório de um banco quanto à aprovação de cartão de crédito, ao lado de outros critérios e ferramentas analíticas disponíveis para o banco.
 
Está correto o que se afirma em:
 
 
	
	
	I e II, apenas.
	
	
	III e IV, apenas.
	
	
	II, III e IV, apenas.
	
	
	I, II, III e IV.
 
 
	
	
	II e III, apenas.
1 pontos   
PERGUNTA 4
1. Muitos dos modelos ou algoritmos usados na estatística e na ciência dos dados são denominados modelos paramétricos, ou seja, que possuem parâmetros. Esses parâmetros devem ser determinados quando se treina (se ajusta) o modelo ou algoritmo aos dados amostrados. Na regressão linear simples ou múltipla, esses parâmetros são denominados coeficientes do modelo.
 
A respeito dos coeficientes do modelo de regressão linear simples para o valor do imóvel em função da sua área, analise as afirmativas a seguir.
 
I. O estatístico usou o software R e obteve, para os coeficientes do modelo de regressão linear simples do valor do imóvel em função da sua área, b0 = 27,22  e b1 = 5,15.
II. Os coeficientes do modelo de regressão linear simples do valor do imóvel em função da sua área possuem unidades, que são, respectivamente, kR$ (mil reais) para b0 e kR$/m2 (mil reais dividido pela área do imóvel) para b1.
III. O coeficiente b0 é a intersecção da reta do modelo com o eixo vertical y quanto x1 = 0. Não tem um significado “real” nesse caso, pois não há imóveis com área igual a zero. Deve ser entendido, nessa situação, apenas como um parâmetro de ajuste do modelo aos dados da amostra.
IV. O coeficiente b1 indica quanto varia o valor esperado do imóvel para um aumento de 1 metro quadrado da sua área. Graficamente, esse coeficiente é a inclinação da reta que representa o modelo de regressão linear simples ajustado aos dados da amostra.
Está correto o que se afirma em:
 
 
	
	
	II e III, apenas.
	
	
	III e IV, apenas.
	
	
	I, II, III e IV.
 
	
	
	II, III e IV, apenas.
	
	
	I e II, apenas.
1 pontos   
PERGUNTA 5
1. A estatística, a ciência da computação, a mineração de dados e a ciência dos dados são áreas correlacionadas. Dentre essas, a mais antiga é a estatística, seguida da ciência da computação, depois da mineração de dados, e finalmente da ciência dos dados, a mais nova dessas quatro áreas de conhecimento.
 
Com referência ao relacionamento entre essas quatro áreas de conhecimento humano, analise as afirmativas a seguir:
 
I. Algoritmos de machine learning nasceram na ciência da computação. Hoje são usados na estatística, na mineração de dados e na ciência dos dados.
II. Dentre as diversas áreas citadas, é a estatística que possui os melhores fundamentos para a interpretação de fenômenos aleatórios.
III. A estatística é considerada a mais sutil, e a mais ampla, quando nos referimos a análise de dados. É aplicada a todas áreas de atividade humana.
IV. Sabemos que, na ciência dos dados, podem-se utilizar de muitos termos diferentes, herdados das outras áreas, para se referir a um mesmo conceito.
 
 
	
	
	I, III e IV apenas.
	
	
	I, II e III apenas.
	
	
	I, II, III e IV.
	
	
	I, II e IV apenas.
	
	
	II e III apenas.
1 pontos   
PERGUNTA 6
1. Modelos de regressão linear são os mais importantes modelos de regressão da estatística e da ciência dos dados. Eles são divididos em dois grupos: modelos de regressão linear simples e modelos de regressão linear múltipla.
 
Quanto ao modelo de regressão linear múltipla para o valor do imóvel em função da sua área e do seu andar, analise as afirmativas a seguir.
 
I. O estatístico desenvolveu um modelo para o valor esperado de   (valor do imóvel) em função de   (área do imóvel) e   (andar do imóvel), simultaneamente. Esse modelo ficou assim:
 
 
II. Quando se faz o ajuste simultâneo do modelo para duas variáveis deentrada, é natural que os valores dos coeficientes para cada variável sejam diferentes do que os mesmos coeficientes para cada variável sozinha em uma regressão linear simples. Isso vale sempre que adicionamos variáveis de entrada ou eliminamos variáveis de entrada de um modelo de regressão linear.
III. Os coeficientes b1 e b2 indicam, respectivamente, quanto varia o valor esperado para o apartamento com a variação unitária de sua área (em metros quadrados) e a variação unitária do seu andar (1 andar a mais).
IV. Ao usar esse modelo preditivo, podemos estimar o valor esperado de um apartamento com 40 metros quadrados localizado no quinto andar em 433 mil reais (arredondando para mil reais).
Está correto o que se afirma em:
 
 
	
	
	I, II, III e IV.
 
 
 
	
	
	III e IV, apenas.
	
	
	I e II, apenas.
	
	
	I, II e III, apenas.
	
	
	II e III, apenas.
1 pontos   
PERGUNTA 7
1. Árvores de decisão são muito populares na estatística e na ciência dos dados. Parte dessa popularidade advém do fato de que as árvores de decisão são de muito fácil interpretação, o que contribui com a interpretação do caso (fenômeno, processo) estudado. Porém sabe-se que florestas randômicas têm melhor performance preditiva que árvores de decisão. A partir do apresentado, analise as asserções a seguir e a relação proposta entre elas.
 
I. Mesmo sabendo-se que florestas randômicas têm melhor performance preditiva que árvores de decisão, muitas vezes o cientista de dados dá preferência a modelos de árvores de decisão frente a florestas randômicas.
Pois:
II. Florestas randômicas, que são constituídas de centenas ou mais árvores, não têm a fácil interpretabilidade que árvores de decisão têm. Essa facilidade de interpretação não só é útil para a análise do fenômeno estudado, mas ajuda sobremaneira na comunicação dos resultados aos clientes.
 
A seguir, assinale a alternativa correta:
	
	
	A asserção I é uma proposição verdadeira e a asserção II é uma proposição falsa.
	
	
	As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da I.
	
	
	As asserções I e II são proposições falsas.
	
	
	As asserções I e II são proposições verdadeiras, mas a II não é uma justificativa correta da I.
	
	
	A asserção I é uma proposição falsa e a II é uma proposição verdadeira.
1 pontos   
PERGUNTA 8
1. No decorrer desta unidade, apresentamos uma série de exemplos de problemas de regressão e de classificação. A diferença entre eles reside no tipo da variável resposta, se quantitativa ou qualitativa. Problemas de classificação são aqueles em que a variável resposta é qualitativa. As variáveis de entrada, também chamadas de regressoras ou preditoras, podem ser quantitativas ou qualitativas.
 
Em relação a problemas de classificação, analise as afirmativas a seguir e assinale V para a(s) Verdadeira(s) e F para a(s) Falsa(s).
 
I. ( ) A predição de se a pessoa é diabética em função de dados gerais sobre seu quadro clínico, seu histórico médico e dados sobre casos de diabetes na sua família é um problema de classificação.
II. ( ) A predição da falha de um componente estrutural em função das suas características químicas e físicas, da sua geometria e das condições de carga ao qual é submetido é um problema de classificação.
III. ( ) A predição de se um e-mail que chega à sua caixa de entrada é ou não um spam , em função das características gerais do e-mail e do seu texto (sua origem e palavras utilizadas no texto), é um problema de classificação.
IV. ( ) A predição de se o dólar vai subir ou não, em função do tipo de notícias políticas e econômicas divulgadas na tarde do dia anterior, tanto no âmbito nacional quanto internacional, é um problema de classificação.
 
Assinale a alternativa que apresenta a sequência correta:
	
	
	F, F, V, V.
	
	
	V, V, V, V.
	
	
	F, V, V, F.
	
	
	V, V, V, F.
	
	
	V, F, V, F.
1 pontos   
PERGUNTA 9
1. A atividade de venda de produtos financeiros por bancos, tais como cartões de crédito, requer que se faça uma avaliação do cliente. São focos dessa avaliação aprovar ou não um cartão de crédito para o cliente e, se aprovado, definir o limite do cartão, ou seja, o valor do crédito a conceder.
 
Com base nessa introdução, analise as afirmativas a seguir.
 
1. O primeiro foco da avaliação é um problema de regressão: aprovar (sim ou não) o cartão de crédito, uma variável qualitativa dicotômica, com dois níveis (classes).
2. O primeiro foco da avaliação é um problema de classificação: aprovar (sim ou não) o cartão de crédito, uma variável qualitativa dicotômica, com dois níveis (classes).
3. O segundo foco da avaliação é um problema de classificação, predizer o valor do limite (do crédito) do cartão.
4. O segundo foco da avaliação é um problema de regressão, predizer o valor do limite (do crédito) do cartão.
 
Está correto o que se afirma em:
 
 
	
	
	II, III e IV, apenas.
	
	
	II e IV, apenas.
	
	
	I e III, apenas.
	
	
	II e IV, apenas.
	
	
	I, II e III, apenas.
 
 
 
1 pontos   
PERGUNTA 10
1. Com o advento dos computadores, surgiu a necessidade de se estabelecer uma forma de comunicação dos seres humanos com eles, o que provocou a criação de linguagens de programação.
 
Relativamente a esse assunto, analise as afirmativas a seguir.
 
I. Linguagens de programação não são importantes para a estatística, mas só para a ciência dos dados.
II. Uma das funções de linguagens de programação é viabilizar a comunicação dos seres humanos com máquinas e das máquinas entre si.
III. São muitas as linguagens de programação que podem ser empregadas na estatística e na ciência dos dados, mas há uma preferência, atualmente, pelas linguagens R e Python.
IV. O R base já vem com todas as funções estatísticas e gráficas das quais precisaremos em um curso introdutório de aplicações da estatística  à ciência dos dados.
 
Está correto o que se afirma em:
 
 
	
	
	I, II e III, apenas.
	
	
	II e III, apenas.
	
	
	I, III e IV, apenas.
	
	
	II, III e IV, apenas.
	
	
	II e IV, apenas.
1 pontos   
Clique em Salvar e Enviar para salvar e enviar. Clique em Salvar todas as respostas para salvar todas as respostas.
  
Bottom of Form
S
alvar e Enviar

Continue navegando