Baixe o app para aproveitar ainda mais
Prévia do material em texto
14/11/2021 15:16 Revisar envio do teste: ATIVIDADE 4 (A4) – GRA0806 ... https://anhembi.blackboard.com/webapps/late-course_engine_soap-BBLEARN/Controller?COURSE_ID=_736261_1 1/6 Usuário TIAGO DA SILVA FONSECA Curso GRA0806 INTRODUÇÃO A PROGRAMAÇÃO EM BIG DATA GR1708-212-9 - 202120.ead-17582.01 Teste ATIVIDADE 4 (A4) Iniciado 14/11/21 14:52 Enviado 14/11/21 15:15 Status Completada Resultado da tentativa 10 em 10 pontos Tempo decorrido 22 minutos Resultados exibidos Respostas enviadas, Respostas corretas, Comentários Pergunta 1 Resposta Selecionada: Resposta Correta: Comentário da resposta: Após prever os valores baseados no modelo de regressão linear, o estagiário da empresa fictícia EAD Corp S/A necessita criar um gráfico para explicar o modelo criado e as conclusões obtidas dessa análise. Esse gráfico deve conter informações sobre as variáveis e o modelo gerado. Assinale a alternativa que indique qual o tipo de gráfico ele deve criar: Um grá�co de dispersão com uma reta indicando o modelo de regressão. Um gráfico de dispersão com uma reta indicando o modelo de regressão. Resposta correta. A alternativa está correta, pois uma regressão linear tem como característica a identi�cação do relacionamento entre 2 variáveis. De forma semelhante, o grá�co de dispersão também possui essa característica. Uma vez que o modelo de regressão cria uma fórmula semelhante a uma reta, basta plotar essa reta sob o grá�co de dispersão para representá-lo sob a ótica do mesmo conjunto de dados. Pergunta 2 O cientista de dados da empresa fictícia EAD Corp S/A está analisando o total de furtos no primeiro semestre de 2019 no estado de São Paulo, que foi de 271 mil casos - o que representa uma média diária de 1500 crimes dessa natureza. 1 em 1 pontos 1 em 1 pontos 14/11/2021 15:16 Revisar envio do teste: ATIVIDADE 4 (A4) – GRA0806 ... https://anhembi.blackboard.com/webapps/late-course_engine_soap-BBLEARN/Controller?COURSE_ID=_736261_1 2/6 Resposta Selecionada: Resposta Correta: Comentário da resposta: Assinale a alternativa que indique qual seria a probabilidade de em um dia ocorra até 1350 crimes: 0,0004379296%. 0,0004379296%. Resposta correta. A alternativa está correta, pois por se tratar da probabilidade de ocorrências de um evento discreto independente em um intervalo de tempo, a distribuição a ser considerada é de Poisson. Como o enunciado pede o percentual até 1350 crimes por dia (90% de 1500), a ideia é calcular a probabilidade acumulada usando a função ppois(1350, 1500). Pergunta 3 Resposta Selecionada: Resposta Correta: Comentário da resposta: Em estatística, existem diversas medidas e métricas para avaliar informações sobre um determinado conjunto de dados. Dentro do dia-a-dia de um cientista de dados, saber utilizar essas medidas e métricas é considerado um requisito fundamental para realizar uma boa análise de dados. Assim, média, mediana e moda são consideradas medidas de: Considerando o apresentado, analise as afirmativas a seguir: Medidas de tendência central Medidas de dispersão Medidas de associação Métodos gráficos Métodos de análise de frequência Assinale a alternativa que apresenta a sequência correta: V, F, F, F, F. V, F, F, F, F. Resposta correta. A alternativa está correta, pois as medidas de tendência central são a descrição mais básica e, muitas vezes, a mais informativa das características de uma população. Eles descrevem o membro “médio” da população de interesse. No enunciado, o as medidas de média, mediana e moda levam em consideração o posicionamento dentro do grupo, sendo medidas de tendência central. 1 em 1 pontos 1 em 1 pontos 14/11/2021 15:16 Revisar envio do teste: ATIVIDADE 4 (A4) – GRA0806 ... https://anhembi.blackboard.com/webapps/late-course_engine_soap-BBLEARN/Controller?COURSE_ID=_736261_1 3/6 Pergunta 4 Resposta Selecionada: Resposta Correta: Comentário da resposta: A empresa fictícia EAD Corp S/A está trabalhando em um projeto para a construção de telhados com placas para geração de energia. Foi identificado que a luminosidade nos telhados segue uma distribuição normal. Além disso, a média energia gerada por dia é de 2Kwh e o desvio padrão é 17,4,. A empresa deseja saber qual é a porcentagem telhados que geram mais com 84Kwh ou mais notas no exame. Assinale a alternativa que indique o comando em R que realiza o cálculo: 1- pnorm(84, mean=112, sd=17.4). 1- pnorm(84, mean=112, sd=17.4). Resposta correta. A alternativa está correta, pois uma vez indicado no enunciado a média e desvio padrão, signi�ca que trata-se de uma distribuição normal. Por se tratar de probabilidades acumuladas (ou seja, de mais de um valor), aplicamos a função pnorm da distribuição normal com média 112 e desvio padrão 17.4. Como a intenção é identi�car a porcentagem de telhados que gerem mais de 84 Kwh, estamos interessados na parte superior da distribuição normal, portanto subtraímos de 1 o percentual calculado para notas até 84.. Pergunta 5 Resposta Selecionada: Resposta Correta: Comentário da resposta: O estagiário e o cientista de dados da empresa fictícia EAD Corp S/A estão trabalhando em conjunto em uma atividade, e devido a ela acabaram discutindo sobre medidas para apresentar média de valores. Ambos apresentaram algumas medidas que julgam serem as mais apropriadas para demonstrar esses tipos de valores. Considerando o apresentado, assinale a alternativa que indique quais das medidas podem ser usadas para apresentar uma média de dados: Média, moda e mediana. Média, moda e mediana. Resposta correta. A alternativa está correta, pois uma vez que a discussão do cientista de dados e do estagiário é sobre medidas que apresentam média de valores, seus argumentos estão referindo à medidas de tendência central. Sendo assim, o cientista de dados e o estagiário estão falando sobre a média, a moda e a mediana. Pergunta 6 O estagiário da empresa fictícia EAD Corp S/A está trabalhando em uma análise sobre gastos com plano de saúde por família, e valores de multas de trânsito nas imediações de um determinado hospital. A idéia é identificar se existe uma relação 1 em 1 pontos 1 em 1 pontos 14/11/2021 15:16 Revisar envio do teste: ATIVIDADE 4 (A4) – GRA0806 ... https://anhembi.blackboard.com/webapps/late-course_engine_soap-BBLEARN/Controller?COURSE_ID=_736261_1 4/6 Resposta Selecionada: Resposta Correta: Comentário da resposta: entre essas duas variáveis. Ele realizou uma análise e obteve um valor 0,4503. Nesse sentido, assinale a alternativa que indique corretamente qual análise foi realizada e qual conclusão foi obtida, respectivamente: Ele realizou um teste de correlação e concluiu que existe uma indicação de relação moderada entre valor gasto por família em plano de saúde e valores das multas de trânsito. Ele realizou um teste de correlação e concluiu que existe uma indicação de relação moderada entre valor gasto por família em plano de saúde e valores das multas de trânsito. Resposta correta. A alternativa está correta, pois ao analisar as informações de valores gastos em plano de saúde e valores de multas, é possível identi�car que essas variáveis são numéricas e contínuas. Sendo assim, a análise a ser utilizada é o teste de correlação, sendo que o valor positivo indica uma relação direta moderada entre as variáveis. Pergunta 7 Resposta Selecionada: Resposta Correta: Comentário da resposta: Em uma determinada prova de língua estrangeira, constam doze perguntas de múltipla escolha em um teste de aula de inglês. Cada pergunta tem cinco respostas possíveis e apenas uma delas está correta. O R possui comandos que permitem que cálculos matemáticos sejam realizados para identificar probabilidades. Utilizando o R, realize os cálculos e assinale a alternativa que indica e qual a probabilidade de ter exatamente quatro respostas corretas se um aluno tentar responder todas as perguntas aleatoriamente: 0.1328756. 0.1328756. Resposta correta. A alternativa está correta, pois a probabilidade é de 1/5= 0,2. Podemos encontrar a probabilidade de ter exatamente 4 respostas corretas por tentativas aleatórias (ou seja, de forma binomial), utilizando a função dbinom(4, size=12, prob=0.2) do R. Pergunta 8 O estagiário da empresa fictícia EAD Corp S/A realizou uma análise em alguns dados da empresa e calculou as medidas de tendência central desses valores. Entretanto, após uma análise mais detalhada, descobriu que coletou um dos valores errados e será necessário recalcular as medidas novamente. Nesse sentido, 1 em 1 pontos 1 em 1 pontos 14/11/2021 15:16 Revisar envio do teste: ATIVIDADE 4 (A4) – GRA0806 ... https://anhembi.blackboard.com/webapps/late-course_engine_soap-BBLEARN/Controller?COURSE_ID=_736261_1 5/6 Resposta Selecionada: Resposta Correta: Comentário da resposta: assinale a alternativa que indique qual(is) da(s) seguinte(s) medida(s) de tendência central sempre mudará se um único valor nos dados mudarem: Média Média Resposta correta. A alternativa está correta, pois a média do conjunto de dados sempre mudará se alterarmos qualquer valor do conjunto de dados. Como estamos somando todos os valores para obtê-lo, todo valor do conjunto de dados contribui para esse valor. A mediana e a moda podem ou não mudar com a alteração de um único valor no conjunto de dados. Pergunta 9 Resposta Selecionada: Resposta Correta: Comentário da resposta: Uma fábrica produz 150 dispositivos eletrônicos por dia. Os dispositivos eletrônicos com defeito devem ser reformulados. Sabe-se que existe uma taxa de erro de 5%. O primeiro passo é estimar quantos dispositivos eletrônicos precisam ser corrigidos todos os dias de uma semana. Nesse sentido, assinale a alternativa que indique qual o comando em R que deve ser utilizado para fazer essa simulação: rbinom(7, 150,.05). rbinom(7, 150,.05). Resposta correta. A alternativa está correta, pois segundo as características descritas no enunciado, a produção de dispositivos eletrônicos possui uma taxa de erro de 5%. Sabendo que dentro de uma linha de produção, a produção de um dispositivo com defeito não in�ui a existência de defeito em outro dispositivo (ou seja, são independentes), temos uma característica de distribuição binomial. Assim, o comando a ser executado é o comando que refere-se a uma distribuição desse tipo. Pergunta 10 Analise o gráfico a seguir: 1 em 1 pontos 1 em 1 pontos 14/11/2021 15:16 Revisar envio do teste: ATIVIDADE 4 (A4) – GRA0806 ... https://anhembi.blackboard.com/webapps/late-course_engine_soap-BBLEARN/Controller?COURSE_ID=_736261_1 6/6 Domingo, 14 de Novembro de 2021 15h15min52s BRT Resposta Selecionada: Resposta Correta: Comentário da resposta: Fonte: Elaborada pelo autor Os modelos de regressão linear são bastante utilizados para diversas finalidades, como previsão de vendas no mercado, identificação de perfis de compra e até mesmo sugestões de produtos. Eles levam em consideração os pontos em 2 dimensões para que seja possível prever, dado um valor x, o valor de y. Sabendo disso, assinale a alternativa que indique qual ponto em negrito, se removido, terá o maior efeito na linha de regressão ajustada, como mostrado na figura (tracejado): Pelas informações fornecidas, conclui-se que é o ponto d. Pelas informações fornecidas, conclui-se que é o ponto d. Resposta correta. A alternativa está correta, pois a regressão linear é sensível aos valores discrepantes nos dados. Embora uma outra alternativa também indiquem erro externo em determinado espaço de dados, ele está próximo da linha de regressão (o residual é baixo), portanto não afetará muito se removido o ponto.
Compartilhar