Prova N2 - Estátistica aplicada ao data science (2)

•

UNIRITTER

Thalison Flores

09/12/2020

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 7 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 7 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Máquinas Hidráulicas

640 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

05/12/2020 Fazer teste: 20202 - PROVA N2 (A5) – AIM1836 ESTATISTICA...
https://uniritter.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 1/7
Informações do teste
Descrição
Instruções
Várias tentativas Não permitido. Este teste só pode ser feito uma vez.
Forçar conclusão Este teste pode ser salvo e retomado posteriormente.
Caso necessite a utilização do "EXCEL" clique no link ao lado -----------> excel.xlsx
PERGUNTA 1
Vimos que há dois principais tipos de aprendizagem supervisionada: problema de regressão
e problema de classi�cação. São os tipos de variáveis resposta dos dados em análise que
distinguem esses dois tipos entre si. 
  
Relativamente a esses dois tipos, analise as a�rmativas a seguir. 
 
1. Na aprendizagem supervisionada, um problema de regressão é um no qual a variável
resposta é qualitativa.
2. Na aprendizagem supervisionada, um problema de regressão é um no qual a variável
resposta é quantitativa.
3. Na aprendizagem supervisionada, um problema de classi�cação é um no qual a
variável resposta é qualitativa.
4. Na aprendizagem supervisionada, um problema de classi�cação é um no qual a
variável resposta é quantitativa.
  
Está correto o que se a�rma em:
III e IV, apenas.
II e III, apenas.
II e IV, apenas.
I e III, apenas. 
 
III, apenas.
1 pontos   Salva
PERGUNTA 2
Iniciamos a nossa jornada, pelo mundo da “Estatística Aplicada à Ciência dos Dados”, com
modelos preditivos denominados regressão linear, simples e múltipla. Vimos algumas coisas,
mas não vimos outras, pois esta é apenas uma jornada inicial motivadora. O seu propósito foi
o de apenas descortinar um pouquinho desse vasto mundo para você. Desse modo,
tentaremos fazer um breve resumo dessa jornada aqui. 
  
( ) ( )
1 pontos   Salvar resposta
 Estado de Conclusão da Pe
https://uniritter.blackboard.com/bbcswebdav/pid-14357147-dt-content-rid-84766551_1/xid-84766551_1
05/12/2020 Fazer teste: 20202 - PROVA N2 (A5) – AIM1836 ESTATISTICA...
https://uniritter.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 2/7
Para isso, analise as a�rmativas a seguir e assinale V para a(s) Verdadeira(s) e 
F para a(s) Falsa(s). 
  
I. ( ) Dados e amostras . Vimos que podemos fazer análise descritiva de um processo apenas
se tivermos dados sobre esse processo. Esses dados devem ser coletados do fenômeno ou
processo estudado (população). Denominamos esses dados como amostra. 
II. ( ) Análise descritiva . Tendo em mãos uma amostra, a análise descritiva se refere a
sumários (resumos) estatísticos calculados com base nessa amostra (mínimos, máximos,
frequências, médias, medianas, desvios-padrões etc.) e visualizações produzidas por meio de
grá�cos. 
III. ( ) Visualização dos dados relativos a uma variável . Esses grá�cos são divididos em duas
grandes famílias. Uma delas são de grá�cos que permitem a visualização do comportamento
de dados quantitativos. Aqui, mostramos o histograma, que é o mais importante dentro
dessa família. A outra família são de grá�cos que permitem a visualização de dados
qualitativos. Aqui, mostramos o diagrama de barras, que é o mais importante dentro dessa
família. 
IV. ( ) Visualização da relação entre duas variáveis . Finalmente, também na análise descritiva
do processo ou fenômeno observado, vimos grá�cos que se aplicam à visualização da relação
entre duas variáveis, a partir dos dados observados. Se as duas variáveis são quantitativas,
usamos, aqui, o grá�co de dispersão. Por exemplo, o valor do imóvel versus sua área. Quando
a relação é entre uma variável quantitativa e uma variável qualitativa, usamos, aqui, os
boxplots (diagramas de caixas), cada boxplot referente a um determinado nível da variável
qualitativa (bairro ou centro) e, dentro dele, como se comporta a variável quantitativa. 
V. (  ) Coisas que não vimos aqui . Há muitas coisas que não vimos aqui. São coisas sobre as
quais você poderá ver, caso decida aprender mais sobre essas poderosas áreas do
conhecimento humano, a estatística e a ciência dos dados, muito valorizadas pelo mercado
de trabalho. 
  
Assinale a alternativa que apresenta a sequência correta. 
  
 
V, V, V, V, V.
V, V, F, V, F.
F, V, V, F, V.
V, V, F, F, F.
V, F, F, V, V.
PERGUNTA 3
Continuando com o mesmo caso da questão anterior, relativa à aprovação, pelos bancos, de
crédito na forma de cartão de crédito, como se fazia, no passado, a aprovação da concessão
de cartões de crédito pelos bancos? E, hoje em dia, como os bancos fazem essa aprovação? 
  
Re�ita sobre essas perguntas e suas respostas, analise as a�rmativas a seguir e assinale V 
para a(s) Verdadeira(s) e F para a(s) Falsa(s). 
  
 
1. ( ) No passado, os bancos faziam, e ainda fazem, ao menos em parte, a aprovação da
concessão de cartões de crédito através da de�nição de regras que devem ser
atendidas por cada cliente, tais como idade, emprego estável, renda �xa, dívidas
pequenas, nome limpo e casa própria.
2. ( ) Hoje em dia, dentre outras alternativas, uma que é frequentemente usada pelos
bancos são algoritmos de aprendizagem supervisionada que classi�cam se o cliente é
um potencial bom ou mau pagador.
3. ( ) Para usarmos algoritmos de classi�cação com esse propósito de aprovar ou não
cartões de crédito, precisamos de dados. Ensinamos ao algoritmo, com base nos
dados que lhe são passados, a predizer clientes que são maus pagadores potenciais
das faturas do cartão Dessa forma se o algoritmo ao ser alimentado com os dados
1 pontos   Salva
 Estado de Conclusão da Pe
05/12/2020 Fazer teste: 20202 - PROVA N2 (A5) – AIM1836 ESTATISTICA...
https://uniritter.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 3/7
das faturas do cartão. Dessa forma, se o algoritmo, ao ser alimentado com os dados
referentes a  um novo cliente, classi�car esse cliente como um mau pagador potencial,
o banco não aprovará o cartão.
4. ( ) Para equipes de análise de crédito, poder contar com a ajuda de um software com a
capacidade de recomendar a aprovação ou não da concessão do cartão é de grande
valor.
5. ( ) A recomendação feita pelo software poderá ser tratada ao lado de outras regras de
crédito para uma decisão �nal sobre a concessão de cartão para o cliente.
  
Assinale a alternativa que apresenta a sequência correta. 
  
 
V, V, F, V.
F, V, F, V.
F, F, F, F.
V, V, F, F.
V, V, V, V. 
  
 
PERGUNTA 4
Em uma análise de agrupamento examinamos os dados observados (as linhas da tabela com
os dados) e procuramos identi�car, através de algum critério de similaridade, aquelas que
estão mais próximas entre si, e formamos grupos com essas observações similares. Quando
são apenas 2 variáveis e poucas observações (tamanho da amostra pequeno), por exemplo
10, podemos tentar fazer o agrupamento visualmente. 
  
Analise a �gura adiante e assinale a alternativa que indica a menor quantidade de grupos que
você naturalmente formaria para este caso: 
  
Figura - Massa corporal (kg) versus comprimento (m) dos animais 
Fonte: Elaborada pelo autor 
 
Dois grupos, um com 6 indivíduos e outro com 4 indivíduos.
1 pontos   Salva
 Estado de Conclusão da Pe
05/12/2020 Fazer teste: 20202 - PROVA N2 (A5) – AIM1836 ESTATISTICA...
https://uniritter.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 4/7
Dois grupos com 5 indivíduos cada.
Dois grupos, um com 1 indivíduo e um com 9 indivíduos. 
  
  
Três grupos, um com 5 indivíduos, um com 1 indivíduo, e um com 4 indivíduos.
Quatro grupos, um com 5 indivíduos, dois com 1 indivíduo cada, e um com 4 indivíduos.
PERGUNTA 5
Na análise descritiva do volume de vendas da boneca falante, foram estudadas as variáveis
relativas aos dados coletados pela gerente comercial do fabricante da boneca. Entre elas, há
a variável do local de exposição da boneca (ruim, médio, bom) no ponto de venda, cuja
relação com vendas altas ou baixas é exibida no grá�co adiante. 
  
Figura: Efeito do local de exposição nas vendas 
Fonte: Elaborada pelo autor. 
Quanto à relação entre o localde exposição da boneca (ruim, médio, bom) e o volume de
vendas (vendas altas ou baixas), analise as a�rmativas a seguir: 
I. Ao estudarmos este caso, percebemos que vendas altas ocorrem com mais frequência nos
pontos de venda onde o local de exposição da boneca é bom. 
II. Ao estudarmos este caso, percebemos que não há qualquer efeito do local de exposição
sobre o volume de vendas da boneca nos pontos de venda. 
III. O grá�co exibido acima mostra que a frequência de pontos com vendas altas é baixa
quando o local de exposição da boneca é ruim. 
IV. O grá�co de visualização da relação entre o local de exposição da boneca no ponto de
venda e o volume de vendas, por se tratarem ambas de variáveis qualitativas, é um grá�co do
tipo mosaic plot, apropriado para esta situação. 
Está correto o que se a�rma em:
II e III, apenas.
III e IV, apenas.
I, II e III, apenas.
I, III e IV, apenas.
I, II e IV, apenas.
1 pontos   Salva
PERGUNTA 6
1 pontos   Salvar resposta
 Estado de Conclusão da Pe
05/12/2020 Fazer teste: 20202 - PROVA N2 (A5) – AIM1836 ESTATISTICA...
https://uniritter.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 5/7
PERGUNTA 6
Já sabemos o que são resumos ou sumários estatísticos, que fazem parte da análise
descritiva dos dados, ao lado das técnicas grá�cas para a visualização dos dados. Nesta
unidade, usamos pela primeira vez a função summary() do software estatístico R. 
  
Em relação ao output dessa função, aplicada a dados quantitativos, analise as a�rmativas a
seguir e assinale V para a(s) Verdadeira(s) e F para a(s) Falsa(s). 
  
I. ( ) A ordem do output é valor máximo, terceiro quartil, mediana, média, segundo quartil e
valor mínimo observado. 
II. ( ) A ordem do output é valor mínimo, segundo quartil, mediana, média, terceiro quartil e
valor máximo observado. 
III. ( ) O segundo quartil informa o valor da variável, acima do qual se encontram 25% dos
dados observados. 
IV. ( ) A mediana informa o valor da variável, abaixo do qual se encontram 50% dos dados
observados. 
  
Assinale a alternativa que apresenta a sequência correta:
F, F, F, F.
F, V, V, F.
F, F, V, V.
F, V, F, V.
V, V, V, V.
PERGUNTA 7
O modelo de regressão linear simples desenvolvido pelo estatístico para a predição do valor
esperado para o imóvel em função da sua área foi: 
  
 
  
Ao tomar como base esse modelo, que foi ajustado aos dados da amostra cedida pela
corretora ao estatístico, podemos estimar que o valor esperado para um apartamento de
área igual a 58,0 metros quadrados é igual a (arredondando para mil reais): 
  
 
322.
329.
352.
253.
326. 
 
1 pontos   Salva
PERGUNTA 8
Os modelos de regressão são de enorme importância na estatística e na ciência dos dados.
Dentre os diversos modelos de regressão que existem, por exemplo, árvores de decisão para
regressão, k-vizinhos mais próximos para regressão e outros (não vimos nenhum desses aqui,
mas não se preocupe: o nosso curso é introdutório!), são justamente os modelos de
regressão linear aqueles considerados os mais importantes e, sem dúvida, os mais
difundidos, com aplicações nas mais diversas áreas. 
  
Desse modo, é sobre eles que queremos saber o que você já aprendeu. Para isso, analise as
a�rmativas a seguir. 
1 pontos   Salva
 Estado de Conclusão da Pe
05/12/2020 Fazer teste: 20202 - PROVA N2 (A5) – AIM1836 ESTATISTICA...
https://uniritter.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 6/7
  
I. Modelos de regressão linear são usados como modelos preditivos para casos em que a
variável resposta é quantitativa. As variáveis de entrada podem ser de qualquer tipo:
quantitativas ou qualitativas. 
II. As variáveis de entrada também são denominadas variáveis regressoras, variáveis
preditoras ou variáveis independentes. 
III. A variável resposta também pode ser denominada variável de saída ou variável
dependente. 
IV. Modelos de regressão linear são usados como modelos preditivos para casos em que a
variável resposta é qualitativa. As variáveis de entrada podem ser de qualquer tipo:
quantitativas ou qualitativas. 
  
Está correto o que se a�rma em: 
  
 
IV, apenas.
I e II, apenas.
I e III, apenas.
II e III, apenas.
I, II e III, apenas. 
 
PERGUNTA 9
Árvores de decisão são muito populares na estatística e na ciência dos dados. Parte dessa
popularidade advém do fato de que as árvores de decisão são de muito fácil interpretação, o
que contribui com a interpretação do caso (fenômeno, processo) estudado. Porém sabe-se
que �orestas randômicas têm melhor performance preditiva que árvores de decisão. A partir
do apresentado, analise as asserções a seguir e a relação proposta entre elas. 
  
I. Mesmo sabendo-se que �orestas randômicas têm melhor performance preditiva que
árvores de decisão, muitas vezes o cientista de dados dá preferência a modelos de árvores de
decisão frente a �orestas randômicas. 
Pois: 
II. Florestas randômicas, que são constituídas de centenas ou mais árvores, não têm a fácil
interpretabilidade que árvores de decisão têm. Essa facilidade de interpretação não só é útil
para a análise do fenômeno estudado, mas ajuda sobremaneira na comunicação dos
resultados aos clientes. 
  
A seguir, assinale a alternativa correta:
As asserções I e II são proposições verdadeiras, mas a II não é uma justi�cativa correta
da I.
A asserção I é uma proposição verdadeira e a asserção II é uma proposição falsa.
A asserção I é uma proposição falsa e a II é uma proposição verdadeira.
As asserções I e II são proposições falsas.
As asserções I e II são proposições verdadeiras, e a II é uma justi�cativa correta da I.
1 pontos   Salva
PERGUNTA 10
Modelos de regressão linear são os mais importantes modelos de regressão da estatística e
da ciência dos dados. Eles são divididos em dois grupos: modelos de regressão linear simples
e modelos de regressão linear múltipla. 
  
Quanto ao modelo de regressão linear múltipla para o valor do imóvel em função da sua área
e do seu andar analise as a�rmativas a seguir
1 pontos   Salva
 Estado de Conclusão da Pe
05/12/2020 Fazer teste: 20202 - PROVA N2 (A5) – AIM1836 ESTATISTICA...
https://uniritter.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 7/7
Clique em Enviar para enviar. Clique em Salvar todas as respostas para salvar todas as respostas.
 
e do seu andar, analise as a�rmativas a seguir. 
  
I. O estatístico desenvolveu um modelo para o valor esperado de  (valor do imóvel) em
função de  (área do imóvel) e  (andar do imóvel), simultaneamente. Esse modelo �cou
assim: 
  
 
  
II. Quando se faz o ajuste simultâneo do modelo para duas variáveis de entrada, é natural que
os valores dos coe�cientes para cada variável sejam diferentes do que os mesmos
coe�cientes para cada variável sozinha em uma regressão linear simples. Isso vale sempre
que adicionamos variáveis de entrada ou eliminamos variáveis de entrada de um modelo de
regressão linear. 
III. Os coe�cientes b1 e b2 indicam, respectivamente, quanto varia o valor esperado para o
apartamento com a variação unitária de sua área (em metros quadrados) e a variação
unitária do seu andar (1 andar a mais). 
IV. Ao usar esse modelo preditivo, podemos estimar o valor esperado de um apartamento
com 40 metros quadrados localizado no quinto andar em 433 mil reais (arredondando para
mil reais). 
Está correto o que se a�rma em: 
  
 
I, II e III, apenas.
III e IV, apenas.
I e II, apenas.
I, II, III e IV. 
  
  
 
II e III, apenas.
Salvar todas as respostas Fechar janela Enviar
 Estado de Conclusão da Pe