Buscar

Estatistica Aplicada ao Data Science - Atividade 4

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 6 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 6 páginas

Prévia do material em texto

26/11/2020 Revisar envio do teste: ATIVIDADE 4 (A4) – GRA1561 ...
https://fmu.blackboard.com/webapps/assessment/review/review.jsp?attempt_id=_39628064_1&course_id=_610557_1&content… 1/6
 
 Revisar envio do teste: ATIVIDADE 4 (A4)
GRA1561 ESTATISTICA APLICADA AO DATA SCIENCE GR0890202 - 202020.ead-29775026.06
Unidade 4
Revisar envio do teste: ATIVIDADE 4 (A4) 
Usuário HIAGO RAFAEL DE SOUZA
Curso GRA1561 ESTATISTICA APLICADA AO DATA SCIENCE GR0890202 - 202020.ead-29775026.06
Teste ATIVIDADE 4 (A4)
Iniciado 26/11/20 12:40
Enviado 26/11/20 12:44
Status Completada
Resultado da tentativa 10 em 10 pontos  
Tempo decorrido 3 minutos
Resultados exibidos Respostas enviadas, Respostas corretas, Comentários
Pergunta 1
Resposta Selecionada: 
Resposta Correta: 
Feedback
da
resposta:
A estatística, a ciência da computação, a mineração de dados e a ciência dos dados são áreas
correlacionadas. Dentre essas, a mais antiga é a estatística, seguida da ciência da computação, depois da
mineração de dados, e finalmente da ciência dos dados, a mais nova dessas quatro áreas de
conhecimento. 
 
Com referência ao relacionamento entre essas quatro áreas de conhecimento humano, analise as
afirmativas a seguir:
 
I. Algoritmos de machine learning nasceram na ciência da computação. Hoje são usados na estatística, na
mineração de dados e na ciência dos dados.
II. Dentre as diversas áreas citadas, é a estatística que possui os melhores fundamentos para a
interpretação de fenômenos aleatórios.
III. A estatística é considerada a mais sutil, e a mais ampla, quando nos referimos a análise de dados. É
aplicada a todas áreas de atividade humana.
IV. Sabemos que, na ciência dos dados, podem-se utilizar de muitos termos diferentes, herdados das
outras áreas, para se referir a um mesmo conceito.
 
 
I, II, III e IV.
I, II, III e IV.
Resposta correta. A alternativa está correta, pois algoritmos de machine learning nasceram
na ciência da computação e hoje são usados na estatística, na mineração de dados e na
ciência dos dados. De fato, é a estatística que possui os melhores fundamentos para a
interpretação de fenômenos aleatórios, e é considerada a mais sutil, e a mais ampla, quando
nos referimos a análise de dados. Já há muitos anos é aplicada a todas áreas de atividade
humana. Por outro lado, também sabemos que, na ciência dos dados, podem-se utilizar de
muitos termos diferentes, herdados das outras áreas, para se referir a um mesmo conceito.
Pergunta 2
Quando os dados se referem a múltiplas variáveis quantitativas, é possível exibir múltiplos gráficos de
dispersão entre pares dessas variáveis, duas a duas. No software estatístico R, isto pode ser feito com a
função gráfica pairs(). Adiante apresentamos um output típico da função pairs() quando aplicada a quatro
Minha Área
1 em 1 pontos
1 em 1 pontos
HIAGO RAFAEL DE SOUZA
https://fmu.blackboard.com/
https://fmu.blackboard.com/webapps/blackboard/execute/courseMain?course_id=_610557_1
https://fmu.blackboard.com/webapps/blackboard/content/listContent.jsp?course_id=_610557_1&content_id=_14850824_1&mode=reset
https://fmu.blackboard.com/webapps/portal/execute/tabs/tabAction?tab_tab_group_id=_361_1
https://fmu.blackboard.com/webapps/login/?action=logout
26/11/2020 Revisar envio do teste: ATIVIDADE 4 (A4) – GRA1561 ...
https://fmu.blackboard.com/webapps/assessment/review/review.jsp?attempt_id=_39628064_1&course_id=_610557_1&content… 2/6
Resposta Selecionada:
 
Resposta Correta:
 
Feedback
da
resposta:
variáveis quantitativas de um determinado conjunto de dados.
 
 
 
Figura 4: Múltiplos gráficos de dispersão entre as variáveis de USArrest
Fonte: Elaborada pelo autor.
 
A respeito deste output típico da função gráfica pairs() do software estatístico R, para a exibição de
múltiplos gráficos de dispersão entre variáveis quantitativas, analise as afirmativas a seguir e assinale V
para a(s) Verdadeira(s) e
F para a(s) Falsa(s). 
 
I. ( ) O gráfico de y = Murder versus x = Assault mostra uma tendência de aumento de Murder para um
aumento de Assault.
II. ( ) O gráfico de y = Murder versus x = UrbanPop mostra uma grande dispersão dos pontos sem uma
tendência clara de subida ou descida.
III. ( ) O gráfico de y = Murder versus x = Rape mostra uma tendência de aumento de Murder para um
aumento  de Assault, porém com uma dispersão dos pontos um pouco maior que para o caso de y =
Murder versus x = Assault.
IV. ( ) Como são quatro variáveis quantitativas (Murder, Assault, UrbanPop e Rape), então ao total são 12
gráficos de dispersão, de cada uma delas contra as outras três.
V, V, V, V.
 
V, V, V, V.
 
Resposta correta.  A sequência está correta. O gráfico de y = Murder versus x = Assault de
fato mostra uma tendência de aumento de Murder para um aumento de Assault, assim como
gráfico de y = Murder versus x = UrbanPop mostra uma grande dispersão dos pontos sem
uma tendência clara de subida ou descida. O gráfico de y = Murder versus x = Rape mostra
uma tendência de aumento de Murder para um aumento  de Assault, porém com uma
dispersão dos pontos um pouco maior que para o caso de y = Murder versus x = Assault e,
como são quatro variáveis quantitativas, então ao total são 12 gráficos de dispersão, de cada
uma delas contra as outras três.
Pergunta 3
O texto em referência apresenta como exemplo de agrupamento uma companhia de vendas online que
deseja agrupar seus clientes com base em suas características comuns (renda, idade, número de filhos,
estado civil, grau de educação, etc.). Com o resultado do agrupamento, eles definirão campanhas de
marketing e de divulgação específicas para cada um dos diferentes grupos que vierem a ser definidos.
 
DUHAM, Margareth H. Data mining : introductory and advanced topics. Upper Saddle River, NJ: Pearson
Education, 2003, p.125.
A respeito das fontes que originaram os contos de fadas, analise as afirmativas a seguir e assinale V para
1 em 1 pontos
26/11/2020 Revisar envio do teste: ATIVIDADE 4 (A4) – GRA1561 ...
https://fmu.blackboard.com/webapps/assessment/review/review.jsp?attempt_id=_39628064_1&course_id=_610557_1&content… 3/6
Resposta Selecionada: 
Resposta Correta: 
Feedback
da
resposta:
a(s) Verdadeira(s) e F para a(s) Falsa(s). 
 
I. ( ) Algoritmos de agrupamento só conseguem lidar com variáveis quantitativas. Sendo assim, parte das
variáveis disponíveis para esse caso são irrelevantes.
II. ( ) Algoritmos de agrupamento são especializados no tratamento de conjuntos de dados exclusivamente
qualitativos.
III. ( ) Algoritmos de agrupamento podem ter as suas soluções verificadas por um supervisor e, dessa
forma, saberemos se o resultado é bom ou ruim.
IV. ( ) Seres humanos não possuem habilidade natural para agrupar e depois classificar, já que isso só
pode ser realizado por meio de algoritmos.
F, F, F, F.
F, F, F, F.
Resposta correta.  A sequência está correta. Há algoritmos de agrupamento que lidam
variáveis quantitativas, ou qualitativas, ou mistas. Portanto, as asserções I e II são falsas. 
Algoritmos de agrupamento não podem ter as suas soluções verificadas por um supervisor,
pois fazem parte dos métodos de aprendizagem não supervisionada. E seres humanos
possuem habilidade natural para agrupar e depois classificar. Portanto, as asserções III e IV
também são falsas.
Pergunta 4
Resposta
Selecionada:
Resposta
Correta:
Feedback
da
resposta:
Na estatística ou, genericamente, na análise de dados, muito frequentemente analisamos dados ditos
retangulares ou estruturados, onde as variáveis - quantitativas ou qualitativas - são dispostas nas colunas
e as observações na linhas de uma tabela. Em algumas situações é vantajoso se fazer a padronização
das variáveis quantitativas. 
 
Assinale a alternativa correta relativamente ao assunto de padronização de variáveis quantitativas na
estatística:
  
 
Na padronização, se subtrai de cada variável sua média, e depois se divide o
resultado pelo seu desvio padrão.
Na padronização, se subtrai de cada variável sua média, e depois se divide o
resultado pelo seu desvio padrão.
Resposta correta.A alternativa está correta. Na estatística, assim como nas suas ciências
correlatas, como a ciência dos dados e a mineração de dados, a padronização de uma
variável quantitativa é feita subtraindo-se dessa variável a sua média e depois dividindo-se o
resultado pelo seu desvio padrão.
Pergunta 5
O texto em referência fornece os seguintes exemplos de agrupamento: análise de perfil de usuários e perfil
de itens para sistemas de recomendação; análise de padrões de comportamento de multidões;
identificação de grupos de risco para empresas seguradoras; análise de emoções em redes sociais;
reconhecimento de padrões em imagens de satélites ou imagens médicas; análise de padrões em cliques
em páginas da internet, etc.
 
SILVA, L. A. da; PERES, S. M.; BOSCARIOLI, C. Introdução à mineração de dados : com aplicações em
R. Rio de Janeiro: Elsevier, 2016, p.146.
A respeito dos campos de aplicação da análise de agrupamento, analise as afirmativas a seguir e assinale
V para a(s) Verdadeira(s) e F para a(s) Falsa(s). 
 
I. ( ) A análise de emoções por meio de agrupamento pode servir ao propósito de averiguar o índice de
aceitação de um candidato a um cargo eletivo público por região.
II. ( ) O reconhecimento de padrões em imagens de satélites pode servir ao propósito de averiguar regiões
com processos acelerados de desertificação.
III. ( ) A identificação de grupos de risco para empresas seguradoras pode servir ao propósito de
precificação correta do valor do seguro para cada grupo de risco.
1 em 1 pontos
1 em 1 pontos
26/11/2020 Revisar envio do teste: ATIVIDADE 4 (A4) – GRA1561 ...
https://fmu.blackboard.com/webapps/assessment/review/review.jsp?attempt_id=_39628064_1&course_id=_610557_1&content… 4/6
Resposta Selecionada: 
Resposta Correta: 
Feedback
da
resposta:
IV. ( ) A análise de padrões em cliques em páginas da internet pode servir ao propósito de identificar a
procura de páginas da web por cada bairro de um município.
V, V, V, V.
V, V, V, V.
Resposta correta.  A sequência está correta. Todos exemplos citados são propósitos válidos
para a realização da análise de agrupamento. Como explicado no texto em referência, a
quantidade de domínios de aplicação da análise de agrupamento é muito vasta.
Pergunta 6
Resposta Selecionada: 
Resposta Correta: 
Feedback
da
resposta:
Na estatística, quanto duas variáveis quantitativas comportam-se uma em relação à outra de forma
aproximadamente linear, é comum se calcular a correlação entre elas. Esse cálculo, entretanto, ao estudo
da relação entre duas variáveis qualitativas, ou entre uma variável quantitativa e uma variável qualitativa. 
 
A respeito do cálculo da correlação entre duas variáveis quantitativas, analise as afirmativas a seguir e
assinale V para a(s) Verdadeira(s) e F para a(s) Falsa(s). 
 
I. ( ) Uma correlação positiva indica que quando uma das variáveis aumenta a outra variável diminui.
II. ( ) Uma correlação positiva indica que quando uma das variáveis aumenta a outra variável também
aumenta.
III. ( ) Uma correlação negativa indica que quando uma das variáveis aumenta a outra variável diminui.
IV. ( ) Uma correlação negativa indica que quando uma das variáveis diminui a outra também diminui.
 
F, V, V, F.
F, V, V, F.
Resposta correta.  A sequência está correta. É correto afirmar que uma correlação positiva
indica que quando uma das variáveis aumenta a outra variável também aumenta, e que uma
correlação negativa indica que quando uma das variáveis aumenta a outra variável diminui. É
incorreto afirmar que uma correlação positiva indica que quando uma das variáveis aumenta
a outra variável diminui, ou que uma correlação negativa indica que quando uma das
variáveis diminui a outra também diminui.
Pergunta 7
Resposta Selecionada: 
Resposta Correta: 
Feedback
da
resposta:
 Depois que formamos grupos de observações de um conjunto de dados (amostra), por meio de um
algoritmo de agrupamento, podemos dar nomes aos mesmos, e cada indivíduo de cada grupo será
classificado de acordo com esse nome. O ser humano faz isso com naturalidade, primeiro agrupar e,
depois de formados os grupos, dar nomes aos grupos. Por exemplo, animais vertebrados ou
invertebrados, carros ou aviões, homens ou mulheres.
 
A partir do apresentado, analise as asserções a seguir e a relação proposta entre elas. e assinale a
alternativa correta:
 
I.  Ao usarmos de algoritmos de agrupamento, depois que formados e nomeados (classificados) os grupos
de observações resultantes do algoritmo, não é possível usar essas classes como variáveis respostas e, a
partir desse ponto, executar tarefas preditivas com algoritmos de classificação.
Pois
II. Algoritmos de agrupamento fazem parte dos métodos da chamada aprendizagem não supervisionada.
Não são modelos preditivos.
 
A asserção I é uma proposição falsa, e a II é uma proposição verdadeira.
A asserção I é uma proposição falsa, e a II é uma proposição verdadeira.
Resposta correta. A alternativa está correta, pois mesmo que algoritmos de agrupamento
sejam parte dos métodos da aprendizagem não supervisionada, e não serem modelos
preditivos, como afirmado na asserção II, depois que formamos e nomeamos os grupos
(classificamos os grupos), podemos usar essas classes como variáveis respostas e, a partir
desse ponto, executar tarefas preditivas com algoritmos de classificação. Ou seja, a asserção
I é falsa.
1 em 1 pontos
1 em 1 pontos
26/11/2020 Revisar envio do teste: ATIVIDADE 4 (A4) – GRA1561 ...
https://fmu.blackboard.com/webapps/assessment/review/review.jsp?attempt_id=_39628064_1&course_id=_610557_1&content… 5/6
Pergunta 8
Resposta Selecionada: 
Resposta Correta: 
Feedback
da
resposta:
Em uma análise de agrupamento examinamos os dados observados (as linhas da tabela com os dados) e
procuramos identificar, através de algum critério de similaridade, aquelas que estão mais próximas entre
si, e formamos grupos com essas observações similares. Quando são apenas 2 variáveis e poucas
observações (tamanho da amostra pequeno), por exemplo 10, podemos tentar fazer o agrupamento
visualmente. 
 
Analise a figura adiante e assinale a alternativa que indica a menor quantidade de grupos que você
naturalmente formaria para este caso:
  
Figura - Massa corporal (kg) versus comprimento (m) dos animais
Fonte: Elaborada pelo autor
 
Dois grupos, um com 6 indivíduos e outro com 4 indivíduos.
Dois grupos, um com 6 indivíduos e outro com 4 indivíduos.
Resposta correta. A alternativa está correta. A questão solicita a alternativa com o menor
número de grupos que você naturalmente formaria. Há três alternativas com dois grupos,
porém aquela que parece ser a mais natural é a que agrupa 6 indivíduos do lado esquerdo
do gráfico e 4 indivíduos do lado direito, pois as outras alternativas com dois grupos não são
tão naturais quanto essa opção.
Pergunta 9
Discutimos o que são aprendizagem supervisionada e não supervisionada. Vimos que é na forma como
tratamos as variáveis estudadas que se dá a diferença entre esses dois tipos de aprendizagens,
supervisionada e não supervisionada. Esses dois tipos são os mais importantes dentre os diversos tipos
de aprendizagem.
 
Relativamente a esse assunto, analise as afirmativas a seguir:
  
I. Na aprendizagem supervisionada, definimos uma das variáveis estudadas como sendo a variável
resposta, a qual responde em função dos valores assumidos pelas outras variáveis, as quais são
chamadas de variáveis de entrada. 
II. Especificamente na aprendizagem supervisionada, também denominamos uma variável resposta de
variável de saída ou variável dependente. 
III. Especificamente na aprendizagem supervisionada, também denominamos uma variável de entrada de
variável regressora, variável preditora, variável explanatória  ou variável independente. 
IV. Na aprendizagem não supervisionada, tratamos todas as variáveis estudadas da mesma forma, sem
procurar explicar o comportamento de uma delas em função dos valores assumidos pelas outras. 
1 em 1 pontos
1 em 1 pontos
26/11/2020 Revisar envio do teste: ATIVIDADE4 (A4) – GRA1561 ...
https://fmu.blackboard.com/webapps/assessment/review/review.jsp?attempt_id=_39628064_1&course_id=_610557_1&content… 6/6
Quinta-feira, 26 de Novembro de 2020 12h45min26s BRT
Resposta Selecionada: 
Resposta Correta: 
Feedback
da
resposta:
 
 
I, II, III e IV.
I, II, III e IV.
Resposta correta. Na aprendizagem supervisionada, definimos uma das variáveis estudadas
como sendo a variável resposta, a qual responde em função dos valores assumidos pelas
outras variáveis, as quais são chamadas de variáveis de entrada; na aprendizagem
supervisionada, também chamamos a variável resposta de variável de saída ou variável
dependente e as variáveis de entrada, de variáveis regressoras, preditoras ou
independentes. Na aprendizagem não supervisionada, tratamos todas as variáveis estudadas
da mesma forma, sem procurar explicar o comportamento de uma delas em função dos
valores assumidos pelas outras.
Pergunta 10
Resposta Selecionada: 
Resposta Correta: 
Feedback
da
resposta:
Quando acontece de haver várias variáveis quantitativas em uma determinada amostra de dados, é
comum a realização da análise da (possível) relação entre essas variáveis por meio do cálculo de suas
correlações. Neste caso, o cálculo de suas correlações sempre é feito de duas em duas variáveis.
Comumente, também se apresenta a correlação de cada variável com ela mesma, o  que sempre resulta
em uma correlação perfeita, igual a 1.
 
A tabela adiante mostra o resultado do cálculo das correlações entre 5 variáveis quantitativas de uma
determinada amostra. 
  
  x1 x2 x3 x4 x5
x1 1,00 - 0,85 - 0,78 - 0,87 0,42
x2 - 0,85 1,00 0,79 0,89 - 0,43
x3 - 0,78 0,79 1,00 0,66 - 0,71
x4 - 0,87 0,89 0,66 1,00 - 0,17
x5 0,42 - 0,43 - 0,71 - 0,17 1,00
 
Quadro: Correlações cruzadas entre as variáveis quantitativas x1, x2, x3, x4 e x5
Fonte: Elaborado pelo autor.
 
Com respeito a essa tabela de correlações, analise as afirmativas a seguir e assinale V para a(s)
Verdadeira(s) e F para a(s) Falsa(s). 
 
I. ( ) Os valores 1,00 apenas indicam a correlação perfeita que existe entre uma variável e ela mesma,
uma informação de pouco valor prático.
II. ( ) A maior correlação positiva é aquela entre as variáveis x2 e x4, no valor de 0,89, que indica uma forte
associação entre essas duas variáveis, e que uma aumenta com um aumento da outra. 
III. ( ) A maior (em valor absoluto) correlação negativa é aquela entre as variáveis x1 e x4, no valor de -
0,87, que indica uma forte associação entre essas duas variáveis, e que uma diminui quanto a outra
aumenta. 
IV. ( ) A menor (em valor absoluto) correlação negativa é aquela entre as variáveis x4 e x5, no valor de -
0,17, que indica uma fraca associação entre essas duas variáveis, e que uma diminui quando a outra
aumenta.
V, V, V, V.
V, V, V, V.
Resposta correta.  A sequência está correta. Os valores 1,00 apenas indicam a correlação
perfeita que existe entre uma variável e ela mesma. A maior correlação positiva é aquela
entre as variáveis x2 e x4, indicando uma forte associação entre essas duas variáveis, e que
uma aumenta com um aumento da outra. A maior (em valor absoluto) correlação negativa é
aquela entre as variáveis x1 e x4, indicando uma forte associação entre essas duas
variáveis, e que uma diminui quanto a outra aumenta. A menor (em valor absoluto)
correlação negativa é aquela entre as variáveis x4 e x5, indicando uma fraca associação
entre essas duas variáveis, e que uma diminui quando a outra aumenta.
← OK
1 em 1 pontos
javascript:launch('/webapps/gradebook/do/student/viewAttempts?course_id=_610557_1&method=list&nolaunch_after_review=true');

Continue navegando