Buscar

N2 (A5)_ estatística Aplicada

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 7 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 7 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Minhas Disciplinas 221RGR0890A - ESTATISTICA APLICADA AO DATA SCIENCE PROVA N2 (A5) N2 (A5)
Iniciado em quinta, 23 jun 2022, 08:42
Estado Finalizada
Concluída em quinta, 23 jun 2022, 09:03
Tempo
empregado
21 minutos 3 segundos
Avaliar 8,00 de um máximo de 10,00(80%)
Questão 1
Completo
Atingiu 1,00 de 1,00
A atividade de venda de produtos financeiros por bancos, tais como cartões de crédito, requer que se faça uma avaliação do cliente. São
focos dessa avaliação aprovar ou não um cartão de crédito para o cliente e, se aprovado, definir o limite do cartão, ou seja, o valor do
crédito a conceder. 
 
Com base nessa introdução, analise as afirmativas a seguir. 
 
I. O primeiro foco da avaliação é um problema de regressão: aprovar (sim ou não) o cartão de crédito, uma variável qualitativa
dicotômica, com dois níveis (classes).
II. O primeiro foco da avaliação é um problema de classificação: aprovar (sim ou não) o cartão de crédito, uma variável qualitativa
dicotômica, com dois níveis (classes).
III. O segundo foco da avaliação é um problema de classificação, predizer o valor do limite (do crédito) do cartão.
IV. O segundo foco da avaliação é um problema de regressão, predizer o valor do limite (do crédito) do cartão.
 
Está correto o que se afirma em: 
 
 
a. II e IV, apenas.
b. I e III, apenas.
c. II, III e IV, apenas.
d. I, II e III, apenas.
e. II e IV, apenas.
NAP CPA Responsabilidade Socioambiental
https://ambienteacademico.com.br/my/
https://ambienteacademico.com.br/course/view.php?id=12295
https://ambienteacademico.com.br/course/view.php?id=12295&section=6
https://ambienteacademico.com.br/mod/quiz/view.php?id=343066
https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html
https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html
https://portal.fmu.br/sustentabilidade
Questão 2
Completo
Atingiu 0,00 de 1,00
Questão 3
Completo
Atingiu 1,00 de 1,00
Leia o excerto a seguir: 
 
“Uma parte fundamental do kit de ferramentas do cientista de dados é a visualização de dados. Embora seja muito fácil criar visualizações é
bem mais difícil produzir algumas boas. Existem dois usos primários para a visualização de dados: - Para explorar dados. - Para comunicar
dados. Neste capítulo, nos concentraremos em construir habilidades das quais você precisará para começar a explorar seus próprios dados
e produzir visualizações que usaremos no decorrer do livro. Como a maioria dos nossos tópicos do capítulo, a visualização de dados é uma
rica área de estudos que merece seu próprio livro. Mas, mesmo assim, tentaremos mostrar o que é preciso e o que não é para uma boa
visualização.” 
 
GRUS, J. Data science do zero: primeiras regras com Python. Rio de Janeiro: Alta Books, 2016. p. 37. 
 
Considerando o excerto apresentado, em relação à visualização de dados, analise as afirmativas a seguir: 
 
I. O autor do texto considera a visualização de dados uma parte acessória ao trabalho do cientista de dados. 
II. O autor considera fácil criar visualizações de dados, porém acha difícil criar boas visualizações de dados. 
III. O autor considera que, por ser fácil criar visualizações de dados, não há razão para merecer seu próprio livro.
IV. O autor deixa claro que existem dois usos primários para a visualização de dados: explorar dados e comunicar dados. 
 
Está correto o que se afirma em:
a. II e III, apenas.
b. II, III e IV, apenas.
c. II e IV, apenas.
d. I, II e III, apenas.
e. I, II e IV, apenas.
Com o advento dos computadores, surgiu a necessidade de se estabelecer uma forma de comunicação dos seres humanos com eles, o
que provocou a criação de linguagens de programação. 
 
Relativamente a esse assunto, analise as afirmativas a seguir. 
 
I. Linguagens de programação não são importantes para a estatística, mas só para a ciência dos dados. 
II. Uma das funções de linguagens de programação é viabilizar a comunicação dos seres humanos com máquinas e das máquinas entre si. 
III. São muitas as linguagens de programação que podem ser empregadas na estatística e na ciência dos dados, mas há uma preferência,
atualmente, pelas linguagens R e Python. 
IV. O R base já vem com todas as funções estatísticas e gráficas das quais precisaremos em um curso introdutório de aplicações da
estatística à ciência dos dados. 
 
Está correto o que se afirma em: 
 
 
a. II, III e IV, apenas.
b. I, II e III, apenas.
c. II e IV, apenas.
d. I, III e IV, apenas.
e. II e III, apenas.
NAP CPA Responsabilidade Socioambiental
https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html
https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html
https://portal.fmu.br/sustentabilidade
Questão 4
Completo
Atingiu 1,00 de 1,00
Questão 5
Completo
Atingiu 1,00 de 1,00
Os métodos de aprendizagem estatística (statistical learning, em inglês) são divididos em métodos de aprendizagem supervisionada e
métodos de aprendizagem não supervisionada. Para cada uma dessas diferentes abordagens, há uma coleção relativamente grande de
diferentes métodos, cada um com seu próprio jeito de funcionamento. 
 
Assinale a alternativa que indica um problema de aprendizagem não supervisionada: 
 
 
a. Gostaríamos de saber que pessoas �carão inadimplentes com o pagamento das faturas de seus cartões de crédito.
b. Queremos estimar o valor de imóveis a partir das suas características, tais como sua área, seu andar e sua localização.
c. Desejamos entender se há similaridade entre observações (indivíduos) de uma certa amostra de dados.
d. Ajudaremos médicos se conseguirmos avaliar a gravidade de uma doença a partir de dados relativos às condições do
paciente.
e. Pretendemos ter uma ideia do volume de vendas de um produto de varejo a partir de algumas características do ponto de
venda.
A amostra relativa aos dados de inadimplência com cartões tinha 200 observações de 4 variáveis: a renda mensal da pessoa (R$), seu
gasto médio com cartão de crédito (R$), se a pessoa tinha um emprego estável (Sim ou Não) e se a pessoa havia, ao longo do período
pesquisado, ficado inadimplente com o pagamento de faturas do cartão ao menos uma vez (Sim ou Não). 
Reflita sobre esse caso, analise as afirmativas a seguir e assinale V para a(s) Verdadeira(s) e F para a(s) Falsa(s). 
 
I. ( ) Todos os dados fornecidos pelo gerente do banco à jovem cientista de dados são dados relativos a variáveis quantitativas.
II. ( ) Todos os dados fornecidos pelo gerente do banco à jovem cientista de dados são dados relativos a variáveis qualitativas.
III. ( ) Dentre os dados fornecidos pelo gerente do banco à jovem cientista de dados, dois são relativos a uma variável quantitativa e dois
são relativos a variáveis qualitativas.
IV. ( ) Dentre os dados fornecidos pelo gerente do banco à jovem cientista de dados, um é relativo a uma variável quantitativa e os outros
são relativos a variáveis qualitativas.
 
Assinale a alternativa que apresenta a sequência correta. 
 
 
a. F, F, V, F.
b. F, V, F, V.
c. V, V, F, V.
d. V, V, F, F.
e. F, V, V, V.
NAP CPA Responsabilidade Socioambiental
https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html
https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html
https://portal.fmu.br/sustentabilidade
Questão 6
Completo
Atingiu 1,00 de 1,00
Na Unidade 2 estudamos os modelos preditivos de classificação com regressão logística múltipla, para a predição da probabilidade de
inadimplência. Aqui, para a predição do volume de vendas de um produto de varejo (uma variável qualitativa com dois níveis, vendas altas
ou baixas), usamos como classificador uma árvore de decisão. 
 
Figura: Árvore de decisão ajustada às vendas do produto de varejo 
Fonte: Elaborada pelo autor. 
 
A respeito deste modelo de árvore de decisão aplicado ao problema de predição do volume de vendas da boneca falante (replicado aqui,
para sua conveniência), analise as afirmativas a seguir e assinale V para a(s) Verdadeira(s)e F para a(s) Falsa(s). 
 
I. ( ) Se o local de exposição da boneca for ruim, porém seu preço menor que 241,25 reais, as vendas serão altas, independentemente dos
gastos com publicidade e da idade média da população local. 
II. ( ) Se o local de exposição da boneca for ruim, seu preço igual ou maior que 241,25 reais, mas os gastos com publicidade forem menores
que 78 mil reais, as vendas serão altas, independentemente da idade média da população. 
III. ( ) Se o local de exposição da boneca for bom, porém seu preço for igual ou maior que 356,25 reais, as vendas serão baixas,
independentemente dos gastos com publicidade e da idade média da população. 
IV. ( ) Se o local de exposição da boneca for médio e seu preço for igual ou maior que 241,25 reais, mas os gastos com publicidade forem
iguais ou maiores que 78 mil reais e a idade média da população for menor que 44 anos, as vendas serão altas. 
 
Assinale a alternativa que apresenta a sequência correta:
a. F, V, V, F.
b. V, F, V, F.
c. F, F, V, F.
d. F, F, V, V.
e. V, F, V, V.
NAP CPA Responsabilidade Socioambiental
https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html
https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html
https://portal.fmu.br/sustentabilidade
Questão 7
Completo
Atingiu 1,00 de 1,00
Questão 8
Completo
Atingiu 1,00 de 1,00
Em algumas situações, o cientista de dados pode decidir transformar dados quantitativos em dados qualitativos, o que chamamos
discretização. Por exemplo, em vez de tratar idade como uma variável quantitativa contínua, podemos transformá-la em uma variável
qualitativa com quatro níveis: criança, jovem, adulto, idoso. A partir do apresentado, analise as asserções a seguir e a relação proposta
entre elas. 
 
I. A discretização (transformação) de variáveis quantitativas em qualitativas é comum na estatística e na ciência dos dados. 
Pois: 
II. A discretização, em muitas situações, simplifica a análise e, principalmente, traz maior clareza à interpretação dos resultados. 
 
A seguir, assinale a alternativa correta:
a. A asserção I é uma proposição verdadeira e a asserção II é uma proposição falsa.
b. A asserção I é uma proposição falsa e a II é uma proposição verdadeira.
c. As asserções I e II são proposições falsas.
d. As asserções I e II são proposições verdadeiras, mas a II não é uma justi�cativa correta da I.
e. As asserções I e II são proposições verdadeiras, e a II é uma justi�cativa correta da I.
Leia o excerto a seguir: 
“Os modelos de árvores, também chamados de Árvores de Classificação e Regressão, árvores de decisão ou apenas árvores, são um
método de classificação (e regressão) efetivo e popular, inicialmente desenvolvido por Leo Breiman e outros em 1984. Os modelos de
árvores e seus descendentes mais potentes, florestas aleatórias e boosting, formam a base das ferramentas de modelagem preditiva mais
potentes e amplamente usadas na ciência de dados tanto para regressão quanto para classificação.” 
BRUCE, P.; BRUCE, A. Estatística prática para cientistas de dados: 50 conceitos iniciais. Rio de Janeiro: Alta Books, 2019. p. 226. 
Quanto às árvores de decisão para classificação e regressão, analise as afirmativas a seguir: 
I. Uma árvore faz partição recursiva das variáveis de entrada, selecionando uma de cada vez, de forma hierárquica, das mais importante às
menos importantes, a cada estágio da sua construção, até chegar aos nós terminais, suas folhas, em que exibe os valores estimados para a
variável resposta. 
II. A cada estágio da construção da árvore, o nó inicial e depois os nós intermediários dividem o domínio da variável de entrada em questão,
de onde bifurcam os seus ramos para a esquerda e para a direita. Os valores exibidos no nó indicam como se deve ler a árvore, ao se
caminhar pelos ramos à esquerda ou à direita do nó em questão. 
III. Em cada um dos nós intermediários, assim como no nó inicial, há um valor quantitativo ou qualitativo, que representa o valor escolhido
pela árvore para fazer a partição da variável tratada naquele estágio da construção da árvore. 
IV. Em árvores de decisão de classificação ou regressão, folha é um termo que designa os nós terminais das árvores, nos quais são
exibidos os valores estimados para a variável resposta do modelo preditivo. Cada caminho da árvore indica, dessa forma, o valor a estimar
para os valores das variáveis de entrada, informadas no caminho do nó inicial até a folha. 
Está correto o que se afirma em:
a. I e IV, apenas.
b. I, II, III e IV.
c. II, III e IV, apenas.
d. I, II e III, apenas.
e. II e III, apenas.
NAP CPA Responsabilidade Socioambiental
https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html
https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html
https://portal.fmu.br/sustentabilidade
Questão 9
Completo
Atingiu 1,00 de 1,00
Os modelos de regressão são de enorme importância na estatística e na ciência dos dados. Dentre os diversos modelos de regressão que
existem, são justamente os modelos de regressão linear aqueles considerados os mais importantes e, sem dúvida, os mais difundidos, com
aplicações nas mais diversas áreas. 
 
Considerando as técnicas discutidas de desenvolvimento de modelos preditivos pautados em modelos de regressão linear simples ou
múltipla, analise as afirmativas a seguir e assinale V para a(s) Verdadeira(s) e F para a(s) Falsa(s). 
 
I. ( ) Modelos de regressão linear podem ser empregados na predição do peso médio (massa corporal média) de uma pessoa em função da
sua altura, idade e sexo. 
II. ( ) Modelos de regressão linear podem ser empregados na predição do consumo médio de combustível de um carro em função da
potência do seu motor e do seu peso. 
III. ( ) Modelos de regressão linear podem ser empregados na predição da renda média mensal de uma pessoa em função da sua
escolaridade, idade, sexo e classe social. 
IV. ( ) Modelos de regressão linear podem ser empregados na predição da classe social de uma pessoa em função da sua renda média
mensal, escolaridade, idade e sexo. 
 
Assinale a alternativa que apresenta a sequência correta. 
 
 
a. F, F, F, F.
b. F, V, F, V.
c. V, V, V, F.
d. V, V, V, V.
e. V, V, F, F.
NAP CPA Responsabilidade Socioambiental
https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html
https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html
https://portal.fmu.br/sustentabilidade
Questão 10
Completo
Atingiu 0,00 de 1,00
Estudamos algoritmos preditivos com base em (1) modelos de regressão linear e (2) modelos de regressão logística. Esses modelos são
aplicados em situações bem distintas, que dependem, essencialmente, da natureza da variável resposta, também chamada de variável
dependente. 
 
Com esses dois modelos em mente, analise as afirmativas a seguir. 
 
I. Modelos de regressão logística simples são usados na predição de uma variável resposta qualitativa quando há mais do que uma
variável de entrada.
II. Modelos de regressão linear simples são usados na predição de uma variável resposta qualitativa quando se considera apenas uma
variável de entrada.
III. Um possível modelo de regressão logística simples para a predição da probabilidade de inadimplência é:
 
 
em que e são os coeficientes do modelo, , o gasto médio mensal da pessoa com cartão de crédito e , o valor esperado para a
probabilidade de a pessoa ficar ou não inadimplente com o pagamento das faturas do cartão. 
 
IV. O método comumente usado para calcular os valores dos coeficientes e é o Método da Máxima Verossimilhança. Para isso,
pode-se fazer uso do software estatístico R.
 
Está correto o que se afirma em: 
 
 
a. II e III, apenas.
b. I, II e IV, apenas.
c. II, III e IV, apenas.
d. I e II, apenas.
e. III e IV, apenas.
◄ Atividade 4 (A4)
Seguir para...
Revisão Prova N2 (A5) ►
NAP CPA Responsabilidade Socioambiental
https://ambienteacademico.com.br/mod/quiz/view.php?id=343064&forceview=1
https://ambienteacademico.com.br/mod/quiz/view.php?id=343068&forceview=1https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html
https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html
https://portal.fmu.br/sustentabilidade

Continue navegando