Baixe o app para aproveitar ainda mais
Prévia do material em texto
05/12/2020 Fazer teste: 20202 - PROVA N2 (A5) – AIM1836 ESTATISTICA... https://uniritter.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 1/7 Informações do teste Descrição Instruções Várias tentativas Não permitido. Este teste só pode ser feito uma vez. Forçar conclusão Este teste pode ser salvo e retomado posteriormente. Caso necessite a utilização do "EXCEL" clique no link ao lado -----------> excel.xlsx PERGUNTA 1 Vimos que há dois principais tipos de aprendizagem supervisionada: problema de regressão e problema de classi�cação. São os tipos de variáveis resposta dos dados em análise que distinguem esses dois tipos entre si. Relativamente a esses dois tipos, analise as a�rmativas a seguir. 1. Na aprendizagem supervisionada, um problema de regressão é um no qual a variável resposta é qualitativa. 2. Na aprendizagem supervisionada, um problema de regressão é um no qual a variável resposta é quantitativa. 3. Na aprendizagem supervisionada, um problema de classi�cação é um no qual a variável resposta é qualitativa. 4. Na aprendizagem supervisionada, um problema de classi�cação é um no qual a variável resposta é quantitativa. Está correto o que se a�rma em: III e IV, apenas. II e III, apenas. II e IV, apenas. I e III, apenas. III, apenas. 1 pontos Salva PERGUNTA 2 Iniciamos a nossa jornada, pelo mundo da “Estatística Aplicada à Ciência dos Dados”, com modelos preditivos denominados regressão linear, simples e múltipla. Vimos algumas coisas, mas não vimos outras, pois esta é apenas uma jornada inicial motivadora. O seu propósito foi o de apenas descortinar um pouquinho desse vasto mundo para você. Desse modo, tentaremos fazer um breve resumo dessa jornada aqui. ( ) ( ) 1 pontos Salvar resposta Estado de Conclusão da Pe https://uniritter.blackboard.com/bbcswebdav/pid-14357147-dt-content-rid-84766551_1/xid-84766551_1 05/12/2020 Fazer teste: 20202 - PROVA N2 (A5) – AIM1836 ESTATISTICA... https://uniritter.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 2/7 Para isso, analise as a�rmativas a seguir e assinale V para a(s) Verdadeira(s) e F para a(s) Falsa(s). I. ( ) Dados e amostras . Vimos que podemos fazer análise descritiva de um processo apenas se tivermos dados sobre esse processo. Esses dados devem ser coletados do fenômeno ou processo estudado (população). Denominamos esses dados como amostra. II. ( ) Análise descritiva . Tendo em mãos uma amostra, a análise descritiva se refere a sumários (resumos) estatísticos calculados com base nessa amostra (mínimos, máximos, frequências, médias, medianas, desvios-padrões etc.) e visualizações produzidas por meio de grá�cos. III. ( ) Visualização dos dados relativos a uma variável . Esses grá�cos são divididos em duas grandes famílias. Uma delas são de grá�cos que permitem a visualização do comportamento de dados quantitativos. Aqui, mostramos o histograma, que é o mais importante dentro dessa família. A outra família são de grá�cos que permitem a visualização de dados qualitativos. Aqui, mostramos o diagrama de barras, que é o mais importante dentro dessa família. IV. ( ) Visualização da relação entre duas variáveis . Finalmente, também na análise descritiva do processo ou fenômeno observado, vimos grá�cos que se aplicam à visualização da relação entre duas variáveis, a partir dos dados observados. Se as duas variáveis são quantitativas, usamos, aqui, o grá�co de dispersão. Por exemplo, o valor do imóvel versus sua área. Quando a relação é entre uma variável quantitativa e uma variável qualitativa, usamos, aqui, os boxplots (diagramas de caixas), cada boxplot referente a um determinado nível da variável qualitativa (bairro ou centro) e, dentro dele, como se comporta a variável quantitativa. V. ( ) Coisas que não vimos aqui . Há muitas coisas que não vimos aqui. São coisas sobre as quais você poderá ver, caso decida aprender mais sobre essas poderosas áreas do conhecimento humano, a estatística e a ciência dos dados, muito valorizadas pelo mercado de trabalho. Assinale a alternativa que apresenta a sequência correta. V, V, V, V, V. V, V, F, V, F. F, V, V, F, V. V, V, F, F, F. V, F, F, V, V. PERGUNTA 3 Continuando com o mesmo caso da questão anterior, relativa à aprovação, pelos bancos, de crédito na forma de cartão de crédito, como se fazia, no passado, a aprovação da concessão de cartões de crédito pelos bancos? E, hoje em dia, como os bancos fazem essa aprovação? Re�ita sobre essas perguntas e suas respostas, analise as a�rmativas a seguir e assinale V para a(s) Verdadeira(s) e F para a(s) Falsa(s). 1. ( ) No passado, os bancos faziam, e ainda fazem, ao menos em parte, a aprovação da concessão de cartões de crédito através da de�nição de regras que devem ser atendidas por cada cliente, tais como idade, emprego estável, renda �xa, dívidas pequenas, nome limpo e casa própria. 2. ( ) Hoje em dia, dentre outras alternativas, uma que é frequentemente usada pelos bancos são algoritmos de aprendizagem supervisionada que classi�cam se o cliente é um potencial bom ou mau pagador. 3. ( ) Para usarmos algoritmos de classi�cação com esse propósito de aprovar ou não cartões de crédito, precisamos de dados. Ensinamos ao algoritmo, com base nos dados que lhe são passados, a predizer clientes que são maus pagadores potenciais das faturas do cartão Dessa forma se o algoritmo ao ser alimentado com os dados 1 pontos Salva Estado de Conclusão da Pe 05/12/2020 Fazer teste: 20202 - PROVA N2 (A5) – AIM1836 ESTATISTICA... https://uniritter.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 3/7 das faturas do cartão. Dessa forma, se o algoritmo, ao ser alimentado com os dados referentes a um novo cliente, classi�car esse cliente como um mau pagador potencial, o banco não aprovará o cartão. 4. ( ) Para equipes de análise de crédito, poder contar com a ajuda de um software com a capacidade de recomendar a aprovação ou não da concessão do cartão é de grande valor. 5. ( ) A recomendação feita pelo software poderá ser tratada ao lado de outras regras de crédito para uma decisão �nal sobre a concessão de cartão para o cliente. Assinale a alternativa que apresenta a sequência correta. V, V, F, V. F, V, F, V. F, F, F, F. V, V, F, F. V, V, V, V. PERGUNTA 4 Em uma análise de agrupamento examinamos os dados observados (as linhas da tabela com os dados) e procuramos identi�car, através de algum critério de similaridade, aquelas que estão mais próximas entre si, e formamos grupos com essas observações similares. Quando são apenas 2 variáveis e poucas observações (tamanho da amostra pequeno), por exemplo 10, podemos tentar fazer o agrupamento visualmente. Analise a �gura adiante e assinale a alternativa que indica a menor quantidade de grupos que você naturalmente formaria para este caso: Figura - Massa corporal (kg) versus comprimento (m) dos animais Fonte: Elaborada pelo autor Dois grupos, um com 6 indivíduos e outro com 4 indivíduos. 1 pontos Salva Estado de Conclusão da Pe 05/12/2020 Fazer teste: 20202 - PROVA N2 (A5) – AIM1836 ESTATISTICA... https://uniritter.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 4/7 Dois grupos com 5 indivíduos cada. Dois grupos, um com 1 indivíduo e um com 9 indivíduos. Três grupos, um com 5 indivíduos, um com 1 indivíduo, e um com 4 indivíduos. Quatro grupos, um com 5 indivíduos, dois com 1 indivíduo cada, e um com 4 indivíduos. PERGUNTA 5 Na análise descritiva do volume de vendas da boneca falante, foram estudadas as variáveis relativas aos dados coletados pela gerente comercial do fabricante da boneca. Entre elas, há a variável do local de exposição da boneca (ruim, médio, bom) no ponto de venda, cuja relação com vendas altas ou baixas é exibida no grá�co adiante. Figura: Efeito do local de exposição nas vendas Fonte: Elaborada pelo autor. Quanto à relação entre o localde exposição da boneca (ruim, médio, bom) e o volume de vendas (vendas altas ou baixas), analise as a�rmativas a seguir: I. Ao estudarmos este caso, percebemos que vendas altas ocorrem com mais frequência nos pontos de venda onde o local de exposição da boneca é bom. II. Ao estudarmos este caso, percebemos que não há qualquer efeito do local de exposição sobre o volume de vendas da boneca nos pontos de venda. III. O grá�co exibido acima mostra que a frequência de pontos com vendas altas é baixa quando o local de exposição da boneca é ruim. IV. O grá�co de visualização da relação entre o local de exposição da boneca no ponto de venda e o volume de vendas, por se tratarem ambas de variáveis qualitativas, é um grá�co do tipo mosaic plot, apropriado para esta situação. Está correto o que se a�rma em: II e III, apenas. III e IV, apenas. I, II e III, apenas. I, III e IV, apenas. I, II e IV, apenas. 1 pontos Salva PERGUNTA 6 1 pontos Salvar resposta Estado de Conclusão da Pe 05/12/2020 Fazer teste: 20202 - PROVA N2 (A5) – AIM1836 ESTATISTICA... https://uniritter.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 5/7 PERGUNTA 6 Já sabemos o que são resumos ou sumários estatísticos, que fazem parte da análise descritiva dos dados, ao lado das técnicas grá�cas para a visualização dos dados. Nesta unidade, usamos pela primeira vez a função summary() do software estatístico R. Em relação ao output dessa função, aplicada a dados quantitativos, analise as a�rmativas a seguir e assinale V para a(s) Verdadeira(s) e F para a(s) Falsa(s). I. ( ) A ordem do output é valor máximo, terceiro quartil, mediana, média, segundo quartil e valor mínimo observado. II. ( ) A ordem do output é valor mínimo, segundo quartil, mediana, média, terceiro quartil e valor máximo observado. III. ( ) O segundo quartil informa o valor da variável, acima do qual se encontram 25% dos dados observados. IV. ( ) A mediana informa o valor da variável, abaixo do qual se encontram 50% dos dados observados. Assinale a alternativa que apresenta a sequência correta: F, F, F, F. F, V, V, F. F, F, V, V. F, V, F, V. V, V, V, V. PERGUNTA 7 O modelo de regressão linear simples desenvolvido pelo estatístico para a predição do valor esperado para o imóvel em função da sua área foi: Ao tomar como base esse modelo, que foi ajustado aos dados da amostra cedida pela corretora ao estatístico, podemos estimar que o valor esperado para um apartamento de área igual a 58,0 metros quadrados é igual a (arredondando para mil reais): 322. 329. 352. 253. 326. 1 pontos Salva PERGUNTA 8 Os modelos de regressão são de enorme importância na estatística e na ciência dos dados. Dentre os diversos modelos de regressão que existem, por exemplo, árvores de decisão para regressão, k-vizinhos mais próximos para regressão e outros (não vimos nenhum desses aqui, mas não se preocupe: o nosso curso é introdutório!), são justamente os modelos de regressão linear aqueles considerados os mais importantes e, sem dúvida, os mais difundidos, com aplicações nas mais diversas áreas. Desse modo, é sobre eles que queremos saber o que você já aprendeu. Para isso, analise as a�rmativas a seguir. 1 pontos Salva Estado de Conclusão da Pe 05/12/2020 Fazer teste: 20202 - PROVA N2 (A5) – AIM1836 ESTATISTICA... https://uniritter.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 6/7 I. Modelos de regressão linear são usados como modelos preditivos para casos em que a variável resposta é quantitativa. As variáveis de entrada podem ser de qualquer tipo: quantitativas ou qualitativas. II. As variáveis de entrada também são denominadas variáveis regressoras, variáveis preditoras ou variáveis independentes. III. A variável resposta também pode ser denominada variável de saída ou variável dependente. IV. Modelos de regressão linear são usados como modelos preditivos para casos em que a variável resposta é qualitativa. As variáveis de entrada podem ser de qualquer tipo: quantitativas ou qualitativas. Está correto o que se a�rma em: IV, apenas. I e II, apenas. I e III, apenas. II e III, apenas. I, II e III, apenas. PERGUNTA 9 Árvores de decisão são muito populares na estatística e na ciência dos dados. Parte dessa popularidade advém do fato de que as árvores de decisão são de muito fácil interpretação, o que contribui com a interpretação do caso (fenômeno, processo) estudado. Porém sabe-se que �orestas randômicas têm melhor performance preditiva que árvores de decisão. A partir do apresentado, analise as asserções a seguir e a relação proposta entre elas. I. Mesmo sabendo-se que �orestas randômicas têm melhor performance preditiva que árvores de decisão, muitas vezes o cientista de dados dá preferência a modelos de árvores de decisão frente a �orestas randômicas. Pois: II. Florestas randômicas, que são constituídas de centenas ou mais árvores, não têm a fácil interpretabilidade que árvores de decisão têm. Essa facilidade de interpretação não só é útil para a análise do fenômeno estudado, mas ajuda sobremaneira na comunicação dos resultados aos clientes. A seguir, assinale a alternativa correta: As asserções I e II são proposições verdadeiras, mas a II não é uma justi�cativa correta da I. A asserção I é uma proposição verdadeira e a asserção II é uma proposição falsa. A asserção I é uma proposição falsa e a II é uma proposição verdadeira. As asserções I e II são proposições falsas. As asserções I e II são proposições verdadeiras, e a II é uma justi�cativa correta da I. 1 pontos Salva PERGUNTA 10 Modelos de regressão linear são os mais importantes modelos de regressão da estatística e da ciência dos dados. Eles são divididos em dois grupos: modelos de regressão linear simples e modelos de regressão linear múltipla. Quanto ao modelo de regressão linear múltipla para o valor do imóvel em função da sua área e do seu andar analise as a�rmativas a seguir 1 pontos Salva Estado de Conclusão da Pe 05/12/2020 Fazer teste: 20202 - PROVA N2 (A5) – AIM1836 ESTATISTICA... https://uniritter.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 7/7 Clique em Enviar para enviar. Clique em Salvar todas as respostas para salvar todas as respostas. e do seu andar, analise as a�rmativas a seguir. I. O estatístico desenvolveu um modelo para o valor esperado de (valor do imóvel) em função de (área do imóvel) e (andar do imóvel), simultaneamente. Esse modelo �cou assim: II. Quando se faz o ajuste simultâneo do modelo para duas variáveis de entrada, é natural que os valores dos coe�cientes para cada variável sejam diferentes do que os mesmos coe�cientes para cada variável sozinha em uma regressão linear simples. Isso vale sempre que adicionamos variáveis de entrada ou eliminamos variáveis de entrada de um modelo de regressão linear. III. Os coe�cientes b1 e b2 indicam, respectivamente, quanto varia o valor esperado para o apartamento com a variação unitária de sua área (em metros quadrados) e a variação unitária do seu andar (1 andar a mais). IV. Ao usar esse modelo preditivo, podemos estimar o valor esperado de um apartamento com 40 metros quadrados localizado no quinto andar em 433 mil reais (arredondando para mil reais). Está correto o que se a�rma em: I, II e III, apenas. III e IV, apenas. I e II, apenas. I, II, III e IV. II e III, apenas. Salvar todas as respostas Fechar janela Enviar Estado de Conclusão da Pe
Compartilhar