Buscar

N2 (A5)_ Estatística Aplicada ao Data Sciense

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 10 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 10 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 10 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

23/06/2022 08:01 N2 (A5): Revisão da tentativa
https://ambienteacademico.com.br/mod/quiz/review.php?attempt=897097&cmid=343066 1/10
Minhas Disciplinas 221RGR0890A - ESTATISTICA APLICADA AO DATA SCIENCE PROVA N2 (A5) N2 (A5)
Iniciado em quinta, 23 jun 2022, 07:38
Estado Finalizada
Concluída em quinta, 23 jun 2022, 08:01
Tempo
empregado
22 minutos 30 segundos
Avaliar 10,00 de um máximo de 10,00(100%)
Questão 1
Completo
Atingiu 1,00 de 1,00
Em algumas situações, o cientista de dados pode decidir transformar dados quantitativos em dados qualitativos, o que chamamos
discretização. Por exemplo, em vez de tratar idade como uma variável quantitativa contínua, podemos transformá-la em uma variável
qualitativa com quatro níveis: criança, jovem, adulto, idoso. A partir do apresentado, analise as asserções a seguir e a relação proposta
entre elas. 
 
I. A discretização (transformação) de variáveis quantitativas em qualitativas é comum na estatística e na ciência dos dados. 
Pois: 
II. A discretização, em muitas situações, simplifica a análise e, principalmente, traz maior clareza à interpretação dos resultados. 
 
A seguir, assinale a alternativa correta:
a. As asserções I e II são proposições verdadeiras, mas a II não é uma justi�cativa correta da I.
b. A asserção I é uma proposição verdadeira e a asserção II é uma proposição falsa.
c. A asserção I é uma proposição falsa e a II é uma proposição verdadeira.
d. As asserções I e II são proposições verdadeiras, e a II é uma justi�cativa correta da I.
e. As asserções I e II são proposições falsas.
NAP CPA Responsabilidade Socioambiental
https://ambienteacademico.com.br/my/
https://ambienteacademico.com.br/course/view.php?id=12295
https://ambienteacademico.com.br/course/view.php?id=12295&section=6
https://ambienteacademico.com.br/mod/quiz/view.php?id=343066
https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html
https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html
https://portal.fmu.br/sustentabilidade
23/06/2022 08:01 N2 (A5): Revisão da tentativa
https://ambienteacademico.com.br/mod/quiz/review.php?attempt=897097&cmid=343066 2/10
Questão 2
Completo
Atingiu 1,00 de 1,00
É da estatística que a ciência dos dados herda uma forma muito bem estudada de classificação dos tipos de dados. Na estatística, os dados
são divididos entre dados quantitativos e dados qualitativos. Estes últimos, os dados qualitativos, podem ser dicotômicos ou politômicos. 
 
Acerca do exposto, analise as afirmativas a seguir e assinale V para a(s) Verdadeira(s) e F para a(s) Falsa(s). 
 
I. ( ) Dados qualitativos dicotômicos são dados observados de variáveis qualitativas que podem assumir apenas dois níveis (também
denominados classes) como seus valores, tais como sexo (feminino ou masculino), ocupação (empregado ou desempregado), localização
(bairro ou centro). 
II. ( ) Dados qualitativos politômicos são aqueles oriundos de variáveis qualitativas que podem assumir três ou mais níveis como seus
valores, tais como classe social (A, B, C, D e E), escolaridade (fundamental, médio, superior), gravidade da doença (baixa, média, alta). 
III. ( ) A função table() do R permite a contagem da frequência de cada nível assumido por uma variável qualitativa em uma dada amostra.
Foi usada pelo estatístico para contar a frequência de imóveis vendidos no bairro e no centro, na amostra cedida pela corretora. 
IV. ( ) O diagrama de barras permite a visualização gráfica da contagem da frequência dos níveis observados de uma variável qualitativa.
Foi usado pelo estatístico para a visualização de quantos imóveis foram vendidos no bairro e no centro. 
 
Assinale a alternativa que apresenta a sequência correta. 
 
 
a. V, V, F, F.
b. V, V, F, V.
c. F, V, F, V.
d. F, F, F, F.
e. V, V, V, V.
NAP CPA Responsabilidade Socioambiental
https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html
https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html
https://portal.fmu.br/sustentabilidade
23/06/2022 08:01 N2 (A5): Revisão da tentativa
https://ambienteacademico.com.br/mod/quiz/review.php?attempt=897097&cmid=343066 3/10
Questão 3
Completo
Atingiu 1,00 de 1,00
Quando acontece de haver várias variáveis quantitativas em uma determinada amostra de dados, é comum a realização da análise da
(possível) relação entre essas variáveis por meio do cálculo de suas correlações. Neste caso, o cálculo de suas correlações sempre é feito
de duas em duas variáveis. Comumente, também se apresenta a correlação de cada variável com ela mesma, o que sempre resulta em
uma correlação perfeita, igual a 1. 
 
A tabela adiante mostra o resultado do cálculo das correlações entre 5 variáveis quantitativas de uma determinada amostra. 
 
 x1 x2 x3 x4 x5
x1 1,00 - 0,85 - 0,78 - 0,87 0,42
x2 - 0,85 1,00 0,79 0,89 - 0,43
x3 - 0,78 0,79 1,00 0,66 - 0,71
x4 - 0,87 0,89 0,66 1,00 - 0,17
x5 0,42 - 0,43 - 0,71 - 0,17 1,00
 
Quadro: Correlações cruzadas entre as variáveis quantitativas x1, x2, x3, x4 e x5 
Fonte: Elaborado pelo autor. 
 
Com respeito a essa tabela de correlações, analise as afirmativas a seguir e assinale V para a(s) Verdadeira(s) e F para a(s) Falsa(s). 
 
I. ( ) Os valores 1,00 apenas indicam a correlação perfeita que existe entre uma variável e ela mesma, uma informação de pouco valor
prático. 
II. ( ) A maior correlação positiva é aquela entre as variáveis x2 e x4, no valor de 0,89, que indica uma forte associação entre essas duas
variáveis, e que uma aumenta com um aumento da outra. 
III. ( ) A maior (em valor absoluto) correlação negativa é aquela entre as variáveis x1 e x4, no valor de - 0,87, que indica uma forte
associação entre essas duas variáveis, e que uma diminui quanto a outra aumenta. 
IV. ( ) A menor (em valor absoluto) correlação negativa é aquela entre as variáveis x4 e x5, no valor de - 0,17, que indica uma fraca
associação entre essas duas variáveis, e que uma diminui quando a outra aumenta.
a. F, F, F, F.
b. V, V, V, V.
c. F, F, V, V.
d. V, F, F, V.
e. F, V, V, F.
NAP CPA Responsabilidade Socioambiental
https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html
https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html
https://portal.fmu.br/sustentabilidade
23/06/2022 08:01 N2 (A5): Revisão da tentativa
https://ambienteacademico.com.br/mod/quiz/review.php?attempt=897097&cmid=343066 4/10
Questão 4
Completo
Atingiu 1,00 de 1,00
A análise descritiva dos dados é uma etapa muito importante no processo de descoberta de padrões em dados. Por vezes, ela se limita à
análise descritiva, pois comumente já traz muitas descobertas. Em grande parte das vezes, é uma das etapas iniciais, seguida de etapas
relacionadas à modelagem dos dados. 
 
Em relação às ferramentas usadas por um estatístico ou um cientista de dados para a análise descritiva de dados, analise as afirmativas a
seguir: 
 
I. Gráficos são usados para a visualização de cada variável ou relação entre variáveis. 
II. Tabelas, sumários e gráficos são as ferramentas básicas da análise descritiva. 
III. Modelos preditivos são usados para a análise descritiva de dados. 
IV. Tabelas e sumários estatísticos são usados na análise descritiva de dados. 
 
Está correto o que se afirma em:
a. II e III, apenas.
b. I, II e IV, apenas.
c. I, III e IV, apenas.
d. I, II e III, apenas.
e. II, III e IV, apenas.
NAP CPA Responsabilidade Socioambiental
https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html
https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html
https://portal.fmu.br/sustentabilidade
23/06/2022 08:01 N2 (A5): Revisão da tentativa
https://ambienteacademico.com.br/mod/quiz/review.php?attempt=897097&cmid=343066 5/10
Questão 5
Completo
Atingiu 1,00 de 1,00
Quando os dados se referem a múltiplas variáveis quantitativas, é possível exibir múltiplos gráficos de dispersão entre pares dessas
variáveis, duas a duas.No software estatístico R, isto pode ser feito com a função gráfica pairs(). Adiante apresentamos um output típico da
função pairs() quando aplicada a quatro variáveis quantitativas de um determinado conjunto de dados. 
 
 
Figura 4: Múltiplos gráficos de dispersão entre as variáveis de USArrest 
Fonte: Elaborada pelo autor. 
 
A respeito deste output típico da função gráfica pairs() do software estatístico R, para a exibição de múltiplos gráficos de dispersão entre
variáveis quantitativas, analise as afirmativas a seguir e assinale V para a(s) Verdadeira(s) e 
F para a(s) Falsa(s). 
 
I. ( ) O gráfico de y = Murder versus x = Assault mostra uma tendência de aumento de Murder para um aumento de Assault. 
II. ( ) O gráfico de y = Murder versus x = UrbanPop mostra uma grande dispersão dos pontos sem uma tendência clara de subida ou
descida. 
III. ( ) O gráfico de y = Murder versus x = Rape mostra uma tendência de aumento de Murder para um aumento de Assault, porém com uma
dispersão dos pontos um pouco maior que para o caso de y = Murder versus x = Assault. 
IV. ( ) Como são quatro variáveis quantitativas (Murder, Assault, UrbanPop e Rape), então ao total são 12 gráficos de dispersão, de cada
uma delas contra as outras três.
a. F, V, F, V.
b. F, V, V, V.
c. V, V, V, V. 
 
d. F, V, V, F.
e. V, V, V, F.
NAP CPA Responsabilidade Socioambiental
https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html
https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html
https://portal.fmu.br/sustentabilidade
23/06/2022 08:01 N2 (A5): Revisão da tentativa
https://ambienteacademico.com.br/mod/quiz/review.php?attempt=897097&cmid=343066 6/10
Questão 6
Completo
Atingiu 1,00 de 1,00
Considere quatro apartamentos: o primeiro com 55 metros quadrados, no centro, no 4º andar; o segundo com 77 metros quadrados, no
bairro, no 5º andar; o terceiro com 54 metros quadrados, no centro, no 9º andar; o quarto com 60 metros quadrados, no bairro, no 12º
andar. 
 
 
Figura - Árvore de decisão ajustada aos valores dos imóveis 
Fonte: Elaborada pelo autor. 
 
Use a árvore que construímos para o caso dos imóveis (novamente exibida aqui) e assinale a alternativa que indica corretamente as
estimativas de preço desses apartamentos:
a. 319,20; 448,80; 366,50; 366,50 mil reais.
b. 319,20; 448,80; 390,40; 366,50 mil reais.
c. 319,20; 448,80; 366,50; 390,40 mil reais.
d. 390,40; 366,50; 390,40; 448,80 mil reais.
e. 366,50; 319,20; 390,40; 448,80 mil reais.
NAP CPA Responsabilidade Socioambiental
https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html
https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html
https://portal.fmu.br/sustentabilidade
23/06/2022 08:01 N2 (A5): Revisão da tentativa
https://ambienteacademico.com.br/mod/quiz/review.php?attempt=897097&cmid=343066 7/10
Questão 7
Completo
Atingiu 1,00 de 1,00
Discutimos o que são aprendizagem supervisionada e não supervisionada. Vimos que é na forma como tratamos as variáveis estudadas
que se dá a diferença entre esses dois tipos de aprendizagens, supervisionada e não supervisionada. Esses dois tipos são os mais
importantes dentre os diversos tipos de aprendizagem. 
 
Relativamente a esse assunto, analise as afirmativas a seguir: 
 
I. Na aprendizagem supervisionada, definimos uma das variáveis estudadas como sendo a variável resposta, a qual responde em função
dos valores assumidos pelas outras variáveis, as quais são chamadas de variáveis de entrada. 
II. Especificamente na aprendizagem supervisionada, também denominamos uma variável resposta de variável de saída ou variável
dependente. 
III. Especificamente na aprendizagem supervisionada, também denominamos uma variável de entrada de variável regressora, variável
preditora, variável explanatória ou variável independente. 
IV. Na aprendizagem não supervisionada, tratamos todas as variáveis estudadas da mesma forma, sem procurar explicar o comportamento
de uma delas em função dos valores assumidos pelas outras. 
 
 
a. II, III e IV, apenas.
b. I, II e IV, apenas. 
 
c. II e III, apenas.
d. I, III e IV, apenas.
e. I, II, III e IV.
NAP CPA Responsabilidade Socioambiental
https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html
https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html
https://portal.fmu.br/sustentabilidade
23/06/2022 08:01 N2 (A5): Revisão da tentativa
https://ambienteacademico.com.br/mod/quiz/review.php?attempt=897097&cmid=343066 8/10
Questão 8
Completo
Atingiu 1,00 de 1,00
O texto em referência explica que o processo de descoberta com a mineração de dados possui tanto um sentido romântico (um processo
emocionante e prazeroso), quanto técnico (um estudo criterioso sobre dados). Também defende a ideia que é preciso conhecer o ambiente
em que os dados são produzidos e que tipo de conhecimento esse ambiente necessita e espera receber.. Ou seja, o que as pessoas
necessitam e esperam receber.Lei 
 
SILVA, L. A. da; PERES, S. M.; BOSCARIOLI, C. Introdução à mineração de dados: com aplicações em R. Rio de Janeiro: Elsevier, 2016,
p.3. 
 
Considerando as ideias apresentadas acima e o que sabemos sobre ciência dos dados, mineração de dados e machine learning, analise as
afirmativas a seguir: 
 
I. Machine learning são algoritmos desenvolvidos, principalmente, pela ciência da computação. São usados na estatística, na ciência de
dados e na mineração de dados. 
II. O processo de descoberta de padrões e geração de conhecimento por meio de dados tem um sentido romântico, por ser emocionante e
prazeroso, e um sentido técnico, pois demanda estudos técnicos criteriosos. 
III. A estatística, a ciência da computação e a ciência de dados são áreas relacionadas, mas a mineração de dados e ciência de dados são
áreas independentes, sem nenhuma relação. 
IV. Não é importante conhecer o ambiente em que os dados são produzidos e que tipo de conhecimento esse ambiente necessita e espera
receber. 
 
Assinale a alternativa que apresenta a(s) afirmativa(s) correta(s):
a. I, II e III apenas;
b. II e III apenas;
c. I e II apenas;
d. II, III e IV apenas;
e. I, II e IV apenas.
NAP CPA Responsabilidade Socioambiental
https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html
https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html
https://portal.fmu.br/sustentabilidade
23/06/2022 08:01 N2 (A5): Revisão da tentativa
https://ambienteacademico.com.br/mod/quiz/review.php?attempt=897097&cmid=343066 9/10
Questão 9
Completo
Atingiu 1,00 de 1,00
Vimos que a análise descritiva de dados se consiste em sumários estatísticos relativos aos dados analisados, o que também denominamos
resumos estatísticos, e no emprego de gráficos que exibem o comportamento dos dados de uma forma visual, o que denominamos
visualização dos dados. O estatístico produziu alguns sumários relativos à área dos imóveis da amostra que a corretora lhe passou. 
 
Em relação a esses sumários, analise as afirmativas a seguir. 
 
I. O valor max(x1) se refere ao valor máximo da área entre todos imóveis observados na amostra cedida pela corretora ao estatístico. 
II. O valor sd(x1) fornece uma indicação de quão grande é a dispersão da área dos imóveis na amostra analisada. 
III. O valor mean(x1) pode ser menor que o valor min(x1) ou maior que o valor max(x1), a depender da amostra analisada. 
IV. Em alguns casos especiais, min(x1) pode ser maior que max(x1), ou seja, o valor mínimo maior que o valor máximo. 
 
Está correto o que se afirma em: 
 
 
a. II e III, apenas.
b. I e III, apenas.
c. I e II, apenas.
d. IV, apenas.
e. I, II e III, apenas.
NAP CPA Responsabilidade Socioambiental
https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html
https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html
https://portal.fmu.br/sustentabilidade
23/06/2022 08:01 N2 (A5): Revisão da tentativa
https://ambienteacademico.com.br/mod/quiz/review.php?attempt=897097&cmid=34306610/10
Questão 10
Completo
Atingiu 1,00 de 1,00
Naturalmente, dados ocupam uma posição central, tanto na estatística quanto na ciência dos dados. Entendê-los, saber da sua natureza, o
que representam, é de suma importância, antes da realização de qualquer análise ou projeto. Os dados são divididos entre quantitativos e
qualitativos, na estatística e na ciência dos dados. Relativamente aos qualitativos, analise as afirmativas a seguir e assinale V para a(s)
Verdadeira(s) e F para a(s) Falsa(s). 
 
I. ( ) Dados qualitativos dicotômicos são dados observados de variáveis qualitativas que podem assumir apenas dois níveis (também
chamados de classes) como seus valores, tais como sexo (feminino ou masculino), ocupação (empregado ou desempregado),
localização (bairro ou centro), emprego estável (sim ou não), inadimplente (sim ou não).
II. ( ) Dados qualitativos politômicos são aqueles oriundos de variáveis qualitativas que podem assumir três ou mais níveis como seus
valores, tais como classe social (A, B, C, D e E), escolaridade (fundamental, médio, superior), gravidade da doença (baixa, média,
alta).
III. ( ) A função table() do R permite a contagem da frequência de cada nível assumido por uma variável qualitativa em uma dada
amostra, e foi usada pela jovem cientista de dados para contar a frequência de pessoas com ou sem emprego estável e se ficaram ou
não inadimplentes com o pagamento das faturas do cartão no período amostrado.
IV. ( ) Um mosaicplot permite a visualização gráfica da relação entre duas variáveis qualitativas. Foi usado por uma jovem cientista de
dados para examinar a possível relação entre duas variáveis qualitativas dicotômicas: pessoas com ou sem emprego estável e se
ficaram ou não inadimplentes com o pagamento das faturas do cartão de crédito ao longo do período amostrado. Ela percebeu, ao ver
o gráfico resultante (ver figura adiante), que parece haver um maior nível de inadimplência com o cartão entre aquelas que não têm
emprego estável.
 
 
Assinale a alternativa que apresenta a sequência correta. 
 
 
a. V, V, V, V.
b. V, V, F, V.
c. F, F, F, F.
d. F, V, F, V.
e. V, V, F, F.
◄ Atividade 4 (A4)
Seguir para...
Revisão Prova N2 (A5) ►
NAP CPA Responsabilidade Socioambiental
https://ambienteacademico.com.br/mod/quiz/view.php?id=343064&forceview=1
https://ambienteacademico.com.br/mod/quiz/view.php?id=343068&forceview=1
https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html
https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html
https://portal.fmu.br/sustentabilidade

Continue navegando