Buscar

estatística aplicada ao data science atividade 2

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 10 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 10 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 10 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

14/11/2020 Revisar envio do teste: ATIVIDADE 2 (A2) ESTATISTICA 
 
 
Usuário 
Curso ESTATISTICA APLICADA AO DATA SCIENC - (EAD_20) - 
202020.FMU79061.06 
Teste ATIVIDADE 2 (A2) 
Iniciado 14/11/20 13:44 
Enviado 14/11/20 14:07 
Status Completada 
Resultado da 
tentativa 
9 em 10 pontos 
Tempo decorrido 23 minutos 
Resultados exibidos Respostas enviadas, Respostas corretas, Comentários 
Pergunta 1 1 em 1 pontos 
A estatística descritiva usa de métodos numéricos para resumir dados, também 
chamados de sumários estatísticos, e de gráficos para a visualização dos dados. A 
jovem cientista de dados usou algumas técnicas de visualização de dados para 
analisar sua amostra, mas deixou outras de lado. 
Analise as afirmativas a seguir e veja quais estão coerentes com sua análise 
descritiva dos dados. 
Na sua análise descritiva dos dados da amostra, a jovem cientista de dados 
usou histogramas para a visualização dos dados quantitativos das amostras, 
que são a renda mensal das pessoas e seus gastos médios com o cartão de 
crédito. 
Na sua análise descritiva dos dados da amostra, a jovem cientista de dados 
usou diagramas de barras para a visualização dos dados quantitativos das 
amostras, que são a renda mensal das pessoas e seus gastos médios com o 
cartão de crédito. 
Histogramas e diagramas de barras são formas tradicionais de visualização 
gráfica de dados quantitativos e qualitativos, respectivamente, na estatística 
e na ciência dos dados. 
A jovem cientista de dados usou, para este caso, apenas histogramas, e 
preferiu apenas lançar mão da função table() do software estatístico R, para 
determinar a frequência com que os níveis das variáveis qualitativas se 
manifestaram na amostra estudada, sem fazer uso de diagramas de barras, o 
que poderia ter feito, se quisesse. 
https://fmu.blackboard.com/webapps/assessment/review/review.jsp?attempt_ld-• - 38964404 1&course 635805 1&content 14399970 1... 1/7 
2 
Está correto o que se afirma em: 
Resposta Selecionada: 
e 
l, III e IV apenas. 
14/11/2020 Revisar envio do teste; — ESTATISTICA 
 
Resposta Correta: 
e 
l, III e IV 
apenas. 
Feedback Resposta correta. Histogramas e diagramas de barras são formas da 
tradicionais de visualização gráfica de dados quantitativos e qualitativos, resposta: 
respectivamente, na estatística e na ciência dos dados, e a jovem cientista de 
dados não lançou mão de diagramas de barras. Neste caso, para visualizar os 
dados qualitativos, poderia ter feito isso, se quisesse. Diagramas de barras são 
usados para a visualização de dados qualitativos, não quantitativos 
 Pergunta 2 O em I pontos 
Entre as técnicas das quais lançou mão para a visualização dos dados da amostra, 
uma jovem cientista de dados usou gráficos de dispersão. Como cientista de dados, 
ela sabia exatamente em que situações empregar gráficos de dispersão E você, 
será que você também já sabe? 
Analise as afirmativas a seguir e assinale V para a(s) Verdadeira(s) e F para a(s) 
Falsa(s). 
( ) Gráficos de dispersão, em inglês chamados de scatter plots, só podem ser 
usados para a Visualização de uma única variável, a qual deve ser 
obrigatoriamente uma variável qualitativa. 
( ) Gráficos de dispersão são usados para a visualização da relação entre duas 
variáveis quantitativas, em que os dados das duas variáveis são plotados aos 
pares. Permite. dessa forma, a verificação visual, pelo estatístico ou pelo 
cientista de dados, se há uma tendência de uma variável aumentar quando a 
outra aumenta, diminuir quando a outra diminui. ou se não há uma relação 
aparente entre as duas. 
( ) Um gráfico de dispersão foi usado para exibir, em pares, a relação entre o 
valor do imóvel e a sua área. Esse tipo de gráfico é chamado, em inglês, de 
scatter plot. 
( ) Um gráfico de dispersão foi usado para exibir, em pares, a relação entre o 
valor do imóvel e o seu andar. Esse tipo de gráfico é chamado, em inglês, de 
scatter plot. 
Assinale a altemativa que apresenta a sequência correta 
Resposta Selecionada: O V, V, F, V. 
Resposta Correta: 
Feedback Sua resposta está 'ncorreta A única asserção falsa é a que afirma que da 
gráficos de dispersão só podem ser usados para a visualização de uma resposta: 
única variável, a qual deve ser obrigatoriamente uma variável qualitativa. É correto 
dizer que são usados para a visualização da relaçào entre duas variáveis 
quantitativas, permitindo a verificaçào visual de tendência de uma variável 
aumentar quando a outra aumenta, diminuir quando a outra aumenta, ou se não 
há uma relaçáo aparente entre as duas. Sendo assim, puderam ser usados para 
exibir, em pares, a relação entre 0 valor do imóvel e a sua área e 0 valor do imóvel 
e 0 seu andar. 
 Pergunta 3 I em I pontos 
2,7 
_ 
14/11/2020 Revisar envio do teste; ATIVIDAOE 2 (A2) — ESTATISTICA 
3,10 
O ser humano tem enorr-ne facilidade em agrupar, por similaridade, e classificar 
coisas, todos os tipos de coisas. Por conta disso, problemas de classificação são 
muito frequentes no mundo, mais frequentes que problemas de regressão. 
Fornecemos alguns exemplos de aplicação de métodos de classificação no mundo 
dos negócios. Dentre esses exemplos, encontramos: 
a Netiix usa dassificadores para recomendar filmes. Para a Netflix, o valor 
desse tipo de aplicação é que, quanto mais filmes assistirmos, maior será a 
sua receita; o Facebook usa classificadores para recomendar novas amizades 
para a nossa rede de relacionamento. Para o Facebook, o valor desse tipo de 
aplicação é que, quanto maior nossa rede de relacionamento, maior será a 
sua receita; um banco de varejo usa classificadores para detectar se uma 
operação com cartão de débito ou crédito é ou não uma operação 
fraudulenta. Para o banco, o valor dessa aplicação é que, quanto antes 
operaçOes fraudulentas forem detectadas, mais rapidamente o banco pode 
agir para impedir perdas para seus clientes e para ele próprio; uma 
concessionária de distribuição de energia elétrica usa classificadores para 
identificar casos potenciais de roubo de energia da rede, os famosos "gatos" 
para as concessionárias de distribuição de energia elétrica, 0 valor dessa 
aplicação é evitar prejuízo com 0 furto de energia da rede, além do relevante 
aspecto de prevenção de acidentes decorrentes de instalações clandestinas. 
Está correto 0 que se afirma em: 
Resposta Selecionada: e I II, Ille 1V. 
 Resposta Correta: e l, II, Ilie lV. 
Feedback Resposta correta. Todos os exemplos listados nesta questão são da 
problemas de classificação, os quais, como dissemos no enunciado, são resposta: 
muito frequentes no mundo. Em todos eles, a variável resposta é uma variável 
qualitativa, ou dicotómica, ou politômica. 
 Pergunta 4 1 em 1 pontos 
Vimos que são muitos os algoritmos de classificação usados na estatistica ou na 
ciência dos dados. Vimos também que podem ser divididos entre classificadores 
deterministicos ou probabilísticos, em que, dentre estes últimos, se encontra o 
modelo de regressão logística. Relativamente a modelos de regressão logística, que 
são aqui o nosso foco, analise as afirmativas a seguir. 
Modelos de regressão logistica são usados como modelos preditivos para 
casos em que a variável resposta é qualitativa, preferencialmente 
qualitativa dicotômica. As variáveis de entrada podem ser de qualquer tipo, 
quantitativas ou qualitativas 
Modelos de regressão logistica são chamados de regressão logística simples, 
quando só há uma variável de entrada, também denominada de variável 
regressara, variável preditora ou variável independente. 
Modelos de regressão logistica são chamados de regressão logística múltipla, 
quando há mais do que uma variável de entrada, também denominadas de 
variáveis regressoras, variáveis preditoras ou variáveis ndependentes 
Modelos de regressão logistlca são classificadores probabilísticos. Por 
exemplo, para dados sintomas de um certo paciente, um modelo de 
regressão logística, depois de adequadamente treinado, fará a predição da 
probabilidade destepaciente estar ou não infectado com 0 Vírus HIV. 
14/11/2020 Revisar envio do teste; — ESTATISTICA 
 
Está correto 0 que se afirma em: 
2 
Resposta Selecionada: I II, Ilie 
lV. 
Resposta Correta: 
l, II, Ilie 
lV. 
Feedback Resposta correta. Modelos de regressão logística são usados quando a 
da variável resposta é qualitativa, preferencialmente qualitativa dicotómica. 
resposta: Regressão logistica simples e múltipla são, respectivamente, quanto só 
há uma ou há várias variáveis de entrada. Modelos de regressão logística são 
classificadores probabilísticos Ou seja, todas as asserções são verdadeiras. 
Pergunta 5 I em I pontos 
A amostra relativa aos dados de inadimpléncia com cartões tinha 200 observaçóes 
de 
4 variáveis: a renda mensal da pessoa (R$), seu gasto médio com cartão de crédito 
(R$), se a pessoa tinha um emprego estável (Sim ou Não) e se a pessoa havia, ao 
longo do período pesquisado, ficado inadimplente com 0 pagamento de faturas 
do cartão ao menos uma vez (Sim ou Não). 
Renita sobre esse caso, analise as afirmativas a seguir e assinale V para a(s) 
Verdadeira(s) e F para a(s) Falsa(s). 
( ) Todos os dados fornecidos pelo gerente do banco à jovem cientista de 
dados são dados relativos a variáveis quantitativas. 
( ) Todos os dados fornecidos pelo gerente do banco à jovem cientista de 
dados são dados relativos a variáveis qualitativas. 
( ) Dentre os dados fornecidos pelo gerente do banco à jovem cientista de 
dados. dois são relativos a uma variável quantitativa e dois são relativos a 
variáveis qualitativas. 
( ) Dentre os dados fomecidos pelo gerente do banco à jovem cientista de 
dados, um é relativo a uma variável quantitativa e os outros são relativos a 
variáveis qualitativas 
Assinale a alternativa que apresenta a sequência correta 
Resposta Selecionada: 
Resposta Correta: 
Feedback Resposta correta. Dentre os dados fornecidos pelo gerente do banco à 
da jovem cientista de dados, dois são quantitativos, a renda mensal da resposta: 
pessoa (R$) e seu gasto médio com cartão de crédito (R$), e dois são qualitativos, 
se a pessoa tinha emprego estável (Sim ou Não) e se a pessoa havia, ao longo do 
14/11/2020 Revisar envio do teste; ATIVIDAOE 2 (A2) — ESTATISTICA 
5,10 
período pesquisado, ficado inadimplente com 0 pagamento de faturas do cartão 
ao menos uma vez (Sim ou Não). 
Pergunta 6 I em I pontos 
Vimos que há dois principais tipos de aprendizagem supervisionada: problema de 
417 
_ regressão e 
problema de classificação São os tipos de variáve's resposta dos dados em análise 
que distinguem esses dois tipos entre si. 
Relativamente a esses dois tipos, analise as afirmativas a seguir. 
Na aprendizagem supervisionada, um problema de regressão é um no qual a 
variável resposta é qualitativa 
Na aprendizagem supervisionada, um problema de regressão é um no qual a 
variável resposta é quantitativa 
Na aprendizagem supervisionada, um problema de classificação é um no 
qual a variável resposta é qualitativa. 
Na aprendizagem supervisionada, um problema de classificação é um no 
qual a variável resposta é quantitativa 
Está correto o que se afirma em: 
Resposta Selecionada: e II e III, apenas. 
Resposta Correta: e II e III, apenas. 
Feedback Resposta correta. Na aprendizagem supeNisionada, um problema de da 
regressão é um no qual a variável resposta é quantitativa e um resposta: 
problema de dassificaçáo é um no qual a variável resposta é qualitativa 
Pergunta 7 I em I pontos 
Dados podem aparecer na forma de textos, imagens, Vídeos, sons, tabelas, listas, 
sequências, séries, etc. São muitos os dados que hoje coletamos de diferentes 
fontes, e muitas as formas de organizá-los e armazená-los. Uma dessas forma, 
talvez a mais importante delas. são os dados estruturados 
Relativamente a esse assunto, analise as afirmat'vas a seguir. 
Dados estruturados são dados que não possuem uma estrutura regular e 
repetitiva. seguindo um padrão comum adotado pelas ciências da 
computação, estatística e ciência dos dados. 
A forma de organização básica dos dados, preferida na estatística e na 
ciência dos dados. é a forma tabular. na qual as variáveis são dispostas nas 
linhas e as observações são dispostas nas colunas. 
Dados estruturados são dados que possuem uma estrutura regular e 
repetitiva, seguindo um padrão comum adotado pelas ciência da 
computação, estatística e ciência dos dados. 
A forma de organização básica dos dados, preferida na estatistica e na 
ciência dos dados, é a forma tabular, na qual as variáveis são dispostas nas 
colunas e as observações são dispostas nas linhas. 
Está correto o que se afirma em: 
14/11/2020 Revisar envio do teste; — ESTATISTICA 
 
Resposta Selecionada: e III e IV, apenas. 
Resposta Correta: e III e IV, apenas 
Feedback Resposta correta. Dados estruturados são dados que possuem uma da
 estrutura regular e repetitiva, seguindo um padrão comum adotado pelas 
resposta: ciência da computação, estatistica e ciência dos dados. Também está 
correto dizer que a forma de organizaçáo básica dos dados, preferida na 
estatística e na ciência dos dados, é a forma tabular, na qual as variáveis são 
dispostas nas e as observações são dispostas nas linhas. 
ATIVIOAOE 2 (A2) 
14/11/2020 Revisar envio do teste; ATIVIDAOE 2 (A2) — ESTATISTICA 
7,10 
Pergunta 8 1 em 1 pontos 
14/11/2020 Revisar envio do teste; — ESTATISTICA 
 
A atividade de venda de produtos financeiros por bancos, tais como cartões de 
crédito, requer que se faça uma avaliação do diente. São focos dessa avaliação 
aprovar ou não um cartão de crédito para o cliente e, se aprovado, definir o limite 
do cartão, ou seja, o valor do crédito a conceder. 
Com base nessa introdução, analise as afirmativas a seguir. 
i 
O primeiro foco da aval ação é um problema de regressão: aprovar (sim ou 
não) o cartão de crédito, uma variável qualitativa dicotómica, com dois 
niveis (classes). 
O primeiro foco da avaliação é um problema de classificaçào: aprovar (sim 
ou não) o cartão de crédito, uma variável qualitativa dicotómica, com dois 
niveis (classes). 
O segundo foco da avaliaçào é um problema de classificação, predizer o 
valor do limite (do crédito) do cartão. 
O segundo foco da avaliaçào é um problema de regressão, predizer o valor 
do limite (do crédito) do cartão. 
Está correto 0 que se afirma em: 
 Resposta Selecionada: II e IV, apenas. 
Resposta Correta: e II e IV, apenas. 
Feedback Resposta correta. O primeiro foco da avaliação é um problema de da 
classificação, aprovar (sim ou não) o cartão de crédito. uma variável resposta; 
qualitativa dicotómica, com dois niveis (classes), o segundo foco da avaliação é 
um problema de regressão. ou seja, predizer o valor do limite (de crédito) do 
cartão a ser concedido para o cliente. Esse valor é uma variável quantitativa, cuja 
predição é feita por algoritmos de regressao 
Pergunta 9 1 em 1 pontos 
Tarefas de classificação são muitos comuns na estatistica e na ciência dos dados, por 
serem muito comuns em todas atividades humanas, na ciência, na vida social ou nos 
negocios 
Especificamente, discutimos aplicações de modelos preditivos de classificação 
baseados em modelos de regressão logistica simples ou múltipla. 
Com isso em mente, analise as afirmativas a seguir e assinale V para a(s) 
Verdadeira(s) e F para a(s) Falsa(s). 
Regressão logistica pode ser empregada na predição do peso méd'o (massa 
corporal média) de uma pessoa em função de sua altura, 'dade e sexo 
Regressão logistica pode ser empregada na predição do consumo médio de 
combustível de um carro em função da potencia do seu motor e do seu peso 
Regressão logistica pode ser empregada na predição da probabilidade de uma 
pessoa votar em um determinado candidato e não nos outros em função de 
sua escolaridade, Idade, sexo e classe social. 
Regressão logistica pode ser empregada na predição da probabilidade de a 
pessoa ser diabética em função de um conjunto de sintomas clínicos que 
apresenta 
14/11/2020 Revisar envio doteste; ATIVIDAOE 2 (A2) — ESTATISTICA 
9,10 
Assinale a alternativa que apresenta a sequência correta 
14/11/2020 Revisar envio do teste; — ESTATISTICA 
10,10 
 
Resposta Selecionada: 
Resposta Correta: 
Feedback Resposta correta. As duas primeiras situações se referem à predição de 
da variáveis resposta quantitativas, o que não é possivel com modelos de 
resposta: regressão logística; já as duas últimas situações são adequadas ao 
emprego de modelos de regressão logística. 
 Pergunta IO 1 em 1 pontos 
Ao longo das nossas discussões, demos foco a um classificador chamado de 
regressão logistica que, apesar do nome regressão (esse nome por razões históricas 
e por conta de algumas de suas caracteristicas), é usado como um classificador. 
Mas também vimos que existem outros tipos de classificadores. 
Relativamente a esse assunto de algoritmos de classificaçào, analise as afirmativas a 
seguir. 
Regressão logística é 0 único método de aprendizagem supervisionada que é 
utllzado para dassificaçào, todos outros métodos sá0 métodos de regressão 
Apesar do nome regressão logística, 0 que acaba sendo um pouco confuso 
para iniciantes, na verdade este é um dos vários métodos de aprendizagem 
supervisionada utilizado para classificação 
Dentre os métodos utilizados para dassificaçáo se encontram regressão 
logística, análise discriminante linear (LDA — Linear Discriminant Analysis), 
árvores de decisão para dassificaçáo, máquinas de vetores de suporte (SVM 
= support vector machines) e k-vizinhos mais próximos (KNN = k-nearest 
neighbors). 
Regressão linear não é um método de dassificaç-áo, mas, sim, um dos 
métodos preditivos de aprendizagem supervisionada usados na predição de 
valores de variáveis respostas quantitativas. 
Está correto o que se afirma em: 
 Resposta Selecionada: II, III e IV, apenas. 
 Resposta Correta: II, III e IV, apenas. 
Feedback Resposta correta. A única asserção incorreta desta questão é a 
primeira, que afirma que regressão logistica é o único método de resposta: 
aprendizagem supervisionada que é utilizado para classificação, todos outros 
métodos são métodos de regressão. 
Sábado, 14 de Novembro de 2020 14h11min55s BRT 
OK

Outros materiais