Buscar

A4 -Big Data - Laureate

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 6 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 6 páginas

Prévia do material em texto

14/11/2021 15:16 Revisar envio do teste: ATIVIDADE 4 (A4) – GRA0806 ...
https://anhembi.blackboard.com/webapps/late-course_engine_soap-BBLEARN/Controller?COURSE_ID=_736261_1 1/6
Usuário TIAGO DA SILVA FONSECA
Curso GRA0806 INTRODUÇÃO A PROGRAMAÇÃO EM BIG DATA GR1708-212-9 -
202120.ead-17582.01
Teste ATIVIDADE 4 (A4)
Iniciado 14/11/21 14:52
Enviado 14/11/21 15:15
Status Completada
Resultado da
tentativa
10 em 10 pontos  
Tempo decorrido 22 minutos
Resultados
exibidos
Respostas enviadas, Respostas corretas, Comentários
Pergunta 1
Resposta
Selecionada:
Resposta Correta:
Comentário
da
resposta:
Após prever os valores baseados no modelo de regressão linear, o estagiário da
empresa fictícia EAD Corp S/A necessita criar um gráfico para explicar o modelo
criado e as conclusões obtidas dessa análise. Esse gráfico deve conter informações
sobre as variáveis e o modelo gerado. Assinale a alternativa que indique qual o tipo
de gráfico ele deve criar:
Um grá�co de dispersão com uma reta indicando o modelo de
regressão.
Um gráfico de dispersão com uma reta indicando o modelo de
regressão.
Resposta correta. A alternativa está correta, pois uma regressão linear
tem como característica a identi�cação do relacionamento entre 2
variáveis. De forma semelhante, o grá�co de dispersão também possui
essa característica. Uma vez que o modelo de regressão cria uma
fórmula semelhante a uma reta, basta plotar essa reta sob o grá�co de
dispersão para representá-lo sob a ótica do mesmo conjunto de dados.
Pergunta 2
O cientista de dados da empresa fictícia EAD Corp S/A está analisando o total de
furtos no primeiro semestre de 2019 no estado de São Paulo, que foi de 271 mil
casos - o que  representa uma média diária de 1500 crimes dessa natureza.
1 em 1 pontos
1 em 1 pontos
14/11/2021 15:16 Revisar envio do teste: ATIVIDADE 4 (A4) – GRA0806 ...
https://anhembi.blackboard.com/webapps/late-course_engine_soap-BBLEARN/Controller?COURSE_ID=_736261_1 2/6
Resposta Selecionada: 
Resposta Correta: 
Comentário
da
resposta:
Assinale a alternativa que indique qual seria a probabilidade de em um dia ocorra
até 1350 crimes:
0,0004379296%.
0,0004379296%.
Resposta correta. A alternativa está correta, pois por se tratar da
probabilidade de ocorrências de um evento discreto independente em
um intervalo de tempo, a distribuição a ser considerada é de Poisson.
Como o enunciado pede o percentual até 1350 crimes por dia (90% de
1500), a ideia é calcular a probabilidade acumulada usando a função
ppois(1350, 1500).
Pergunta 3
Resposta Selecionada: 
Resposta Correta: 
Comentário
da
resposta:
Em estatística, existem diversas medidas e métricas para avaliar informações sobre
um determinado conjunto de dados. Dentro do dia-a-dia de um cientista de dados,
saber utilizar essas medidas e métricas é considerado um requisito fundamental
para realizar uma boa análise de dados. Assim, média, mediana e moda são
consideradas medidas de:
 
Considerando o apresentado, analise as afirmativas a seguir:
 
 Medidas de tendência central
 Medidas de dispersão
 Medidas de associação
 Métodos gráficos
 Métodos de análise de frequência
 
Assinale  a alternativa que apresenta a sequência correta:
V, F, F, F, F.
V, F, F, F, F.
Resposta correta. A alternativa está correta, pois as medidas de
tendência central são a descrição mais básica e, muitas vezes, a mais
informativa das características de uma população. Eles descrevem o
membro “médio” da população de interesse. No enunciado, o as
medidas de média, mediana e moda levam em consideração o
posicionamento dentro do grupo, sendo medidas de tendência central.
1 em 1 pontos
1 em 1 pontos
14/11/2021 15:16 Revisar envio do teste: ATIVIDADE 4 (A4) – GRA0806 ...
https://anhembi.blackboard.com/webapps/late-course_engine_soap-BBLEARN/Controller?COURSE_ID=_736261_1 3/6
Pergunta 4
Resposta Selecionada: 
Resposta Correta: 
Comentário
da
resposta:
A empresa fictícia EAD Corp S/A está trabalhando em um projeto para a
construção de telhados com placas para geração de energia. Foi identificado que a
luminosidade nos telhados segue uma distribuição normal. Além disso, a média
energia gerada por dia é de 2Kwh e o desvio padrão é 17,4,. A empresa deseja
saber qual é a porcentagem telhados que geram mais com 84Kwh ou mais notas no
exame. Assinale a alternativa que indique o comando em R que realiza o cálculo:
1- pnorm(84, mean=112, sd=17.4).
1- pnorm(84, mean=112, sd=17.4).
Resposta correta. A alternativa está correta, pois uma vez indicado no
enunciado a média e desvio padrão, signi�ca que trata-se de uma
distribuição normal. Por se tratar de probabilidades acumuladas (ou
seja, de mais de um valor), aplicamos a função pnorm da distribuição
normal com média 112 e desvio padrão 17.4. Como a intenção é
identi�car a porcentagem de telhados que gerem mais de 84 Kwh,
estamos interessados na parte superior da distribuição normal,
portanto subtraímos de 1 o percentual calculado para notas até 84..
Pergunta 5
Resposta Selecionada: 
Resposta Correta: 
Comentário
da
resposta:
O estagiário e o cientista de dados da empresa fictícia EAD Corp S/A estão
trabalhando em conjunto em uma atividade, e devido a ela acabaram discutindo
sobre medidas para apresentar média de valores. Ambos apresentaram algumas
medidas que julgam serem as mais apropriadas para demonstrar esses tipos de
valores. Considerando o apresentado, assinale a alternativa que indique quais das
medidas podem ser usadas para apresentar uma média de dados:
Média, moda e mediana.
Média, moda e mediana.
Resposta correta. A alternativa está correta, pois uma vez que a
discussão do cientista de dados e do estagiário é sobre medidas que
apresentam média de valores, seus argumentos estão referindo à
medidas de tendência central. Sendo assim, o cientista de dados e o
estagiário estão falando sobre a média, a moda e a mediana.
Pergunta 6
O estagiário da empresa fictícia EAD Corp S/A está trabalhando em uma análise
sobre gastos com plano de saúde por família, e valores de multas de trânsito nas
imediações de um determinado hospital. A idéia é identificar se existe uma relação
1 em 1 pontos
1 em 1 pontos
14/11/2021 15:16 Revisar envio do teste: ATIVIDADE 4 (A4) – GRA0806 ...
https://anhembi.blackboard.com/webapps/late-course_engine_soap-BBLEARN/Controller?COURSE_ID=_736261_1 4/6
Resposta
Selecionada:
Resposta
Correta:
Comentário
da
resposta:
entre essas duas variáveis. Ele realizou uma análise e obteve um valor 0,4503.
Nesse sentido, assinale a alternativa que indique corretamente qual análise foi
realizada e qual conclusão foi obtida, respectivamente:
Ele realizou um teste de correlação e concluiu que existe uma
indicação de relação moderada entre valor gasto por família em plano
de saúde e valores das multas de trânsito.
Ele realizou um teste de correlação e concluiu que existe uma
indicação de relação moderada entre valor gasto por família em
plano de saúde e valores das multas de trânsito.
Resposta correta. A alternativa está correta, pois ao analisar as
informações de valores gastos em plano de saúde e valores de multas, é
possível identi�car que essas variáveis são numéricas e contínuas.
Sendo assim, a análise a ser utilizada é o teste de correlação, sendo que
o valor positivo indica uma relação direta moderada entre as variáveis.
Pergunta 7
Resposta Selecionada: 
Resposta Correta: 
Comentário
da
resposta:
Em uma determinada prova de língua estrangeira, constam doze perguntas de
múltipla escolha em um teste de aula de inglês. Cada pergunta tem cinco respostas
possíveis e apenas uma delas está correta. O R possui comandos que permitem que
cálculos matemáticos sejam realizados para identificar probabilidades. Utilizando  o
R, realize os cálculos e assinale a alternativa que indica e qual a probabilidade de ter
exatamente quatro respostas corretas se um aluno tentar responder todas as
perguntas aleatoriamente:
0.1328756.
0.1328756.
Resposta correta. A alternativa está correta, pois a probabilidade é de
1/5= 0,2. Podemos encontrar a probabilidade de ter exatamente 4
respostas corretas por tentativas aleatórias (ou seja, de forma binomial),
utilizando a função dbinom(4, size=12, prob=0.2) do R.
Pergunta 8
O estagiário da empresa fictícia EAD Corp S/A realizou uma análise em alguns
dados da empresa e calculou as medidas de tendência central desses valores.
Entretanto, após uma análise mais detalhada, descobriu que coletou um dos valores
errados e será necessário recalcular as medidas novamente. Nesse sentido,
1 em 1 pontos
1 em 1 pontos
14/11/2021 15:16 Revisar envio do teste: ATIVIDADE 4 (A4) – GRA0806 ...
https://anhembi.blackboard.com/webapps/late-course_engine_soap-BBLEARN/Controller?COURSE_ID=_736261_1 5/6
Resposta Selecionada: 
Resposta Correta: 
Comentário
da
resposta:
assinale a alternativa que indique qual(is) da(s) seguinte(s) medida(s) de tendência
central sempre mudará se um único valor nos dados mudarem:
Média
Média
Resposta correta. A alternativa está correta, pois a média do conjunto de
dados sempre mudará se alterarmos qualquer valor do conjunto de
dados. Como estamos somando todos os valores para obtê-lo, todo valor
do conjunto de dados contribui para esse valor. A mediana e a moda
podem ou não mudar com a alteração de um único valor no conjunto de
dados.
Pergunta 9
Resposta Selecionada: 
Resposta Correta: 
Comentário
da
resposta:
Uma fábrica produz 150 dispositivos eletrônicos por dia. Os dispositivos
eletrônicos com defeito devem ser reformulados. Sabe-se que existe uma taxa de
erro de 5%. O primeiro passo é estimar quantos dispositivos eletrônicos precisam
ser corrigidos todos os dias de uma semana. Nesse sentido, assinale a alternativa
que indique qual o comando em R que deve ser utilizado para fazer essa simulação:
rbinom(7, 150,.05).
rbinom(7, 150,.05).
Resposta correta. A alternativa está correta, pois segundo as
características descritas no enunciado, a produção de dispositivos
eletrônicos possui uma taxa de erro de 5%. Sabendo que dentro de uma
linha de produção, a produção de um dispositivo com defeito não in�ui
a existência de defeito em outro dispositivo (ou seja, são
independentes), temos uma característica de distribuição binomial.
Assim, o comando a ser executado é o comando que refere-se a uma
distribuição desse tipo.
Pergunta 10
Analise o gráfico a seguir:
 
1 em 1 pontos
1 em 1 pontos
14/11/2021 15:16 Revisar envio do teste: ATIVIDADE 4 (A4) – GRA0806 ...
https://anhembi.blackboard.com/webapps/late-course_engine_soap-BBLEARN/Controller?COURSE_ID=_736261_1 6/6
Domingo, 14 de Novembro de 2021 15h15min52s BRT
Resposta
Selecionada:
 
Resposta Correta:
Comentário
da
resposta:
Fonte: Elaborada pelo autor
 
Os modelos de regressão linear são bastante utilizados para diversas finalidades,
como previsão de vendas no mercado, identificação de perfis de compra e até
mesmo sugestões de produtos. Eles levam em consideração os pontos em 2
dimensões para que seja possível prever, dado um valor x, o valor de y. Sabendo
disso, assinale a alternativa que indique qual ponto em negrito, se removido, terá o
maior efeito na linha de regressão ajustada, como mostrado na figura (tracejado):
Pelas informações fornecidas, conclui-se que é o ponto d.
Pelas informações fornecidas, conclui-se que é o ponto d.
Resposta correta. A alternativa está correta, pois a regressão linear é
sensível aos valores discrepantes nos dados. Embora uma outra 
alternativa  também indiquem erro externo em determinado espaço de
dados, ele está próximo da linha de regressão (o residual é baixo),
portanto não afetará muito se removido o ponto.

Continue navegando