Baixe o app para aproveitar ainda mais
Prévia do material em texto
14/11/2020 Revisar envio do teste: ATIVIDADE 2 (A2) ESTATISTICA Usuário Curso ESTATISTICA APLICADA AO DATA SCIENC - (EAD_20) - 202020.FMU79061.06 Teste ATIVIDADE 2 (A2) Iniciado 14/11/20 13:44 Enviado 14/11/20 14:07 Status Completada Resultado da tentativa 9 em 10 pontos Tempo decorrido 23 minutos Resultados exibidos Respostas enviadas, Respostas corretas, Comentários Pergunta 1 1 em 1 pontos A estatística descritiva usa de métodos numéricos para resumir dados, também chamados de sumários estatísticos, e de gráficos para a visualização dos dados. A jovem cientista de dados usou algumas técnicas de visualização de dados para analisar sua amostra, mas deixou outras de lado. Analise as afirmativas a seguir e veja quais estão coerentes com sua análise descritiva dos dados. Na sua análise descritiva dos dados da amostra, a jovem cientista de dados usou histogramas para a visualização dos dados quantitativos das amostras, que são a renda mensal das pessoas e seus gastos médios com o cartão de crédito. Na sua análise descritiva dos dados da amostra, a jovem cientista de dados usou diagramas de barras para a visualização dos dados quantitativos das amostras, que são a renda mensal das pessoas e seus gastos médios com o cartão de crédito. Histogramas e diagramas de barras são formas tradicionais de visualização gráfica de dados quantitativos e qualitativos, respectivamente, na estatística e na ciência dos dados. A jovem cientista de dados usou, para este caso, apenas histogramas, e preferiu apenas lançar mão da função table() do software estatístico R, para determinar a frequência com que os níveis das variáveis qualitativas se manifestaram na amostra estudada, sem fazer uso de diagramas de barras, o que poderia ter feito, se quisesse. https://fmu.blackboard.com/webapps/assessment/review/review.jsp?attempt_ld-• - 38964404 1&course 635805 1&content 14399970 1... 1/7 2 Está correto o que se afirma em: Resposta Selecionada: e l, III e IV apenas. 14/11/2020 Revisar envio do teste; — ESTATISTICA Resposta Correta: e l, III e IV apenas. Feedback Resposta correta. Histogramas e diagramas de barras são formas da tradicionais de visualização gráfica de dados quantitativos e qualitativos, resposta: respectivamente, na estatística e na ciência dos dados, e a jovem cientista de dados não lançou mão de diagramas de barras. Neste caso, para visualizar os dados qualitativos, poderia ter feito isso, se quisesse. Diagramas de barras são usados para a visualização de dados qualitativos, não quantitativos Pergunta 2 O em I pontos Entre as técnicas das quais lançou mão para a visualização dos dados da amostra, uma jovem cientista de dados usou gráficos de dispersão. Como cientista de dados, ela sabia exatamente em que situações empregar gráficos de dispersão E você, será que você também já sabe? Analise as afirmativas a seguir e assinale V para a(s) Verdadeira(s) e F para a(s) Falsa(s). ( ) Gráficos de dispersão, em inglês chamados de scatter plots, só podem ser usados para a Visualização de uma única variável, a qual deve ser obrigatoriamente uma variável qualitativa. ( ) Gráficos de dispersão são usados para a visualização da relação entre duas variáveis quantitativas, em que os dados das duas variáveis são plotados aos pares. Permite. dessa forma, a verificação visual, pelo estatístico ou pelo cientista de dados, se há uma tendência de uma variável aumentar quando a outra aumenta, diminuir quando a outra diminui. ou se não há uma relação aparente entre as duas. ( ) Um gráfico de dispersão foi usado para exibir, em pares, a relação entre o valor do imóvel e a sua área. Esse tipo de gráfico é chamado, em inglês, de scatter plot. ( ) Um gráfico de dispersão foi usado para exibir, em pares, a relação entre o valor do imóvel e o seu andar. Esse tipo de gráfico é chamado, em inglês, de scatter plot. Assinale a altemativa que apresenta a sequência correta Resposta Selecionada: O V, V, F, V. Resposta Correta: Feedback Sua resposta está 'ncorreta A única asserção falsa é a que afirma que da gráficos de dispersão só podem ser usados para a visualização de uma resposta: única variável, a qual deve ser obrigatoriamente uma variável qualitativa. É correto dizer que são usados para a visualização da relaçào entre duas variáveis quantitativas, permitindo a verificaçào visual de tendência de uma variável aumentar quando a outra aumenta, diminuir quando a outra aumenta, ou se não há uma relaçáo aparente entre as duas. Sendo assim, puderam ser usados para exibir, em pares, a relação entre 0 valor do imóvel e a sua área e 0 valor do imóvel e 0 seu andar. Pergunta 3 I em I pontos 2,7 _ 14/11/2020 Revisar envio do teste; ATIVIDAOE 2 (A2) — ESTATISTICA 3,10 O ser humano tem enorr-ne facilidade em agrupar, por similaridade, e classificar coisas, todos os tipos de coisas. Por conta disso, problemas de classificação são muito frequentes no mundo, mais frequentes que problemas de regressão. Fornecemos alguns exemplos de aplicação de métodos de classificação no mundo dos negócios. Dentre esses exemplos, encontramos: a Netiix usa dassificadores para recomendar filmes. Para a Netflix, o valor desse tipo de aplicação é que, quanto mais filmes assistirmos, maior será a sua receita; o Facebook usa classificadores para recomendar novas amizades para a nossa rede de relacionamento. Para o Facebook, o valor desse tipo de aplicação é que, quanto maior nossa rede de relacionamento, maior será a sua receita; um banco de varejo usa classificadores para detectar se uma operação com cartão de débito ou crédito é ou não uma operação fraudulenta. Para o banco, o valor dessa aplicação é que, quanto antes operaçOes fraudulentas forem detectadas, mais rapidamente o banco pode agir para impedir perdas para seus clientes e para ele próprio; uma concessionária de distribuição de energia elétrica usa classificadores para identificar casos potenciais de roubo de energia da rede, os famosos "gatos" para as concessionárias de distribuição de energia elétrica, 0 valor dessa aplicação é evitar prejuízo com 0 furto de energia da rede, além do relevante aspecto de prevenção de acidentes decorrentes de instalações clandestinas. Está correto 0 que se afirma em: Resposta Selecionada: e I II, Ille 1V. Resposta Correta: e l, II, Ilie lV. Feedback Resposta correta. Todos os exemplos listados nesta questão são da problemas de classificação, os quais, como dissemos no enunciado, são resposta: muito frequentes no mundo. Em todos eles, a variável resposta é uma variável qualitativa, ou dicotómica, ou politômica. Pergunta 4 1 em 1 pontos Vimos que são muitos os algoritmos de classificação usados na estatistica ou na ciência dos dados. Vimos também que podem ser divididos entre classificadores deterministicos ou probabilísticos, em que, dentre estes últimos, se encontra o modelo de regressão logística. Relativamente a modelos de regressão logística, que são aqui o nosso foco, analise as afirmativas a seguir. Modelos de regressão logistica são usados como modelos preditivos para casos em que a variável resposta é qualitativa, preferencialmente qualitativa dicotômica. As variáveis de entrada podem ser de qualquer tipo, quantitativas ou qualitativas Modelos de regressão logistica são chamados de regressão logística simples, quando só há uma variável de entrada, também denominada de variável regressara, variável preditora ou variável independente. Modelos de regressão logistica são chamados de regressão logística múltipla, quando há mais do que uma variável de entrada, também denominadas de variáveis regressoras, variáveis preditoras ou variáveis ndependentes Modelos de regressão logistlca são classificadores probabilísticos. Por exemplo, para dados sintomas de um certo paciente, um modelo de regressão logística, depois de adequadamente treinado, fará a predição da probabilidade destepaciente estar ou não infectado com 0 Vírus HIV. 14/11/2020 Revisar envio do teste; — ESTATISTICA Está correto 0 que se afirma em: 2 Resposta Selecionada: I II, Ilie lV. Resposta Correta: l, II, Ilie lV. Feedback Resposta correta. Modelos de regressão logística são usados quando a da variável resposta é qualitativa, preferencialmente qualitativa dicotómica. resposta: Regressão logistica simples e múltipla são, respectivamente, quanto só há uma ou há várias variáveis de entrada. Modelos de regressão logística são classificadores probabilísticos Ou seja, todas as asserções são verdadeiras. Pergunta 5 I em I pontos A amostra relativa aos dados de inadimpléncia com cartões tinha 200 observaçóes de 4 variáveis: a renda mensal da pessoa (R$), seu gasto médio com cartão de crédito (R$), se a pessoa tinha um emprego estável (Sim ou Não) e se a pessoa havia, ao longo do período pesquisado, ficado inadimplente com 0 pagamento de faturas do cartão ao menos uma vez (Sim ou Não). Renita sobre esse caso, analise as afirmativas a seguir e assinale V para a(s) Verdadeira(s) e F para a(s) Falsa(s). ( ) Todos os dados fornecidos pelo gerente do banco à jovem cientista de dados são dados relativos a variáveis quantitativas. ( ) Todos os dados fornecidos pelo gerente do banco à jovem cientista de dados são dados relativos a variáveis qualitativas. ( ) Dentre os dados fornecidos pelo gerente do banco à jovem cientista de dados. dois são relativos a uma variável quantitativa e dois são relativos a variáveis qualitativas. ( ) Dentre os dados fomecidos pelo gerente do banco à jovem cientista de dados, um é relativo a uma variável quantitativa e os outros são relativos a variáveis qualitativas Assinale a alternativa que apresenta a sequência correta Resposta Selecionada: Resposta Correta: Feedback Resposta correta. Dentre os dados fornecidos pelo gerente do banco à da jovem cientista de dados, dois são quantitativos, a renda mensal da resposta: pessoa (R$) e seu gasto médio com cartão de crédito (R$), e dois são qualitativos, se a pessoa tinha emprego estável (Sim ou Não) e se a pessoa havia, ao longo do 14/11/2020 Revisar envio do teste; ATIVIDAOE 2 (A2) — ESTATISTICA 5,10 período pesquisado, ficado inadimplente com 0 pagamento de faturas do cartão ao menos uma vez (Sim ou Não). Pergunta 6 I em I pontos Vimos que há dois principais tipos de aprendizagem supervisionada: problema de 417 _ regressão e problema de classificação São os tipos de variáve's resposta dos dados em análise que distinguem esses dois tipos entre si. Relativamente a esses dois tipos, analise as afirmativas a seguir. Na aprendizagem supervisionada, um problema de regressão é um no qual a variável resposta é qualitativa Na aprendizagem supervisionada, um problema de regressão é um no qual a variável resposta é quantitativa Na aprendizagem supervisionada, um problema de classificação é um no qual a variável resposta é qualitativa. Na aprendizagem supervisionada, um problema de classificação é um no qual a variável resposta é quantitativa Está correto o que se afirma em: Resposta Selecionada: e II e III, apenas. Resposta Correta: e II e III, apenas. Feedback Resposta correta. Na aprendizagem supeNisionada, um problema de da regressão é um no qual a variável resposta é quantitativa e um resposta: problema de dassificaçáo é um no qual a variável resposta é qualitativa Pergunta 7 I em I pontos Dados podem aparecer na forma de textos, imagens, Vídeos, sons, tabelas, listas, sequências, séries, etc. São muitos os dados que hoje coletamos de diferentes fontes, e muitas as formas de organizá-los e armazená-los. Uma dessas forma, talvez a mais importante delas. são os dados estruturados Relativamente a esse assunto, analise as afirmat'vas a seguir. Dados estruturados são dados que não possuem uma estrutura regular e repetitiva. seguindo um padrão comum adotado pelas ciências da computação, estatística e ciência dos dados. A forma de organização básica dos dados, preferida na estatística e na ciência dos dados. é a forma tabular. na qual as variáveis são dispostas nas linhas e as observações são dispostas nas colunas. Dados estruturados são dados que possuem uma estrutura regular e repetitiva, seguindo um padrão comum adotado pelas ciência da computação, estatística e ciência dos dados. A forma de organização básica dos dados, preferida na estatistica e na ciência dos dados, é a forma tabular, na qual as variáveis são dispostas nas colunas e as observações são dispostas nas linhas. Está correto o que se afirma em: 14/11/2020 Revisar envio do teste; — ESTATISTICA Resposta Selecionada: e III e IV, apenas. Resposta Correta: e III e IV, apenas Feedback Resposta correta. Dados estruturados são dados que possuem uma da estrutura regular e repetitiva, seguindo um padrão comum adotado pelas resposta: ciência da computação, estatistica e ciência dos dados. Também está correto dizer que a forma de organizaçáo básica dos dados, preferida na estatística e na ciência dos dados, é a forma tabular, na qual as variáveis são dispostas nas e as observações são dispostas nas linhas. ATIVIOAOE 2 (A2) 14/11/2020 Revisar envio do teste; ATIVIDAOE 2 (A2) — ESTATISTICA 7,10 Pergunta 8 1 em 1 pontos 14/11/2020 Revisar envio do teste; — ESTATISTICA A atividade de venda de produtos financeiros por bancos, tais como cartões de crédito, requer que se faça uma avaliação do diente. São focos dessa avaliação aprovar ou não um cartão de crédito para o cliente e, se aprovado, definir o limite do cartão, ou seja, o valor do crédito a conceder. Com base nessa introdução, analise as afirmativas a seguir. i O primeiro foco da aval ação é um problema de regressão: aprovar (sim ou não) o cartão de crédito, uma variável qualitativa dicotómica, com dois niveis (classes). O primeiro foco da avaliação é um problema de classificaçào: aprovar (sim ou não) o cartão de crédito, uma variável qualitativa dicotómica, com dois niveis (classes). O segundo foco da avaliaçào é um problema de classificação, predizer o valor do limite (do crédito) do cartão. O segundo foco da avaliaçào é um problema de regressão, predizer o valor do limite (do crédito) do cartão. Está correto 0 que se afirma em: Resposta Selecionada: II e IV, apenas. Resposta Correta: e II e IV, apenas. Feedback Resposta correta. O primeiro foco da avaliação é um problema de da classificação, aprovar (sim ou não) o cartão de crédito. uma variável resposta; qualitativa dicotómica, com dois niveis (classes), o segundo foco da avaliação é um problema de regressão. ou seja, predizer o valor do limite (de crédito) do cartão a ser concedido para o cliente. Esse valor é uma variável quantitativa, cuja predição é feita por algoritmos de regressao Pergunta 9 1 em 1 pontos Tarefas de classificação são muitos comuns na estatistica e na ciência dos dados, por serem muito comuns em todas atividades humanas, na ciência, na vida social ou nos negocios Especificamente, discutimos aplicações de modelos preditivos de classificação baseados em modelos de regressão logistica simples ou múltipla. Com isso em mente, analise as afirmativas a seguir e assinale V para a(s) Verdadeira(s) e F para a(s) Falsa(s). Regressão logistica pode ser empregada na predição do peso méd'o (massa corporal média) de uma pessoa em função de sua altura, 'dade e sexo Regressão logistica pode ser empregada na predição do consumo médio de combustível de um carro em função da potencia do seu motor e do seu peso Regressão logistica pode ser empregada na predição da probabilidade de uma pessoa votar em um determinado candidato e não nos outros em função de sua escolaridade, Idade, sexo e classe social. Regressão logistica pode ser empregada na predição da probabilidade de a pessoa ser diabética em função de um conjunto de sintomas clínicos que apresenta 14/11/2020 Revisar envio doteste; ATIVIDAOE 2 (A2) — ESTATISTICA 9,10 Assinale a alternativa que apresenta a sequência correta 14/11/2020 Revisar envio do teste; — ESTATISTICA 10,10 Resposta Selecionada: Resposta Correta: Feedback Resposta correta. As duas primeiras situações se referem à predição de da variáveis resposta quantitativas, o que não é possivel com modelos de resposta: regressão logística; já as duas últimas situações são adequadas ao emprego de modelos de regressão logística. Pergunta IO 1 em 1 pontos Ao longo das nossas discussões, demos foco a um classificador chamado de regressão logistica que, apesar do nome regressão (esse nome por razões históricas e por conta de algumas de suas caracteristicas), é usado como um classificador. Mas também vimos que existem outros tipos de classificadores. Relativamente a esse assunto de algoritmos de classificaçào, analise as afirmativas a seguir. Regressão logística é 0 único método de aprendizagem supervisionada que é utllzado para dassificaçào, todos outros métodos sá0 métodos de regressão Apesar do nome regressão logística, 0 que acaba sendo um pouco confuso para iniciantes, na verdade este é um dos vários métodos de aprendizagem supervisionada utilizado para classificação Dentre os métodos utilizados para dassificaçáo se encontram regressão logística, análise discriminante linear (LDA — Linear Discriminant Analysis), árvores de decisão para dassificaçáo, máquinas de vetores de suporte (SVM = support vector machines) e k-vizinhos mais próximos (KNN = k-nearest neighbors). Regressão linear não é um método de dassificaç-áo, mas, sim, um dos métodos preditivos de aprendizagem supervisionada usados na predição de valores de variáveis respostas quantitativas. Está correto o que se afirma em: Resposta Selecionada: II, III e IV, apenas. Resposta Correta: II, III e IV, apenas. Feedback Resposta correta. A única asserção incorreta desta questão é a primeira, que afirma que regressão logistica é o único método de resposta: aprendizagem supervisionada que é utilizado para classificação, todos outros métodos são métodos de regressão. Sábado, 14 de Novembro de 2020 14h11min55s BRT OK
Compartilhar