Buscar

GRA0806 INTRODUÇÃO A PROGRAMAÇÃO EM BIG DATA _AV3

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 6 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 6 páginas

Continue navegando


Prévia do material em texto

Curso
	GRA0806 INTRODUÇÃO A PROGRAMAÇÃO EM BIG DATA
	Teste
	ATIVIDADE 4 (A4)
	Status
	Completada
	Resultado da tentativa
	10 em 10 pontos  
	Resultados exibidos
	Respostas enviadas, Respostas corretas, Comentários
· Pergunta 1
1 em 1 pontos
	
	
	
	A empresa fictícia EAD Corp S/A está trabalhando em um projeto para a construção de telhados com placas para geração de energia. Foi identificado que a luminosidade nos telhados segue uma distribuição normal. Além disso, a média energia gerada por dia é de 2Kwh e o desvio padrão é 17,4,. A empresa deseja saber qual é a porcentagem telhados que geram mais com 84Kwh ou mais notas no exame. Assinale a alternativa que indique o comando em R que realiza o cálculo:
	
	
	
	
		Resposta Selecionada:
	 
1- pnorm(84, mean=112, sd=17.4).
	Resposta Correta:
	 
1- pnorm(84, mean=112, sd=17.4).
	Comentário da resposta:
	Resposta correta. A alternativa está correta, pois uma vez indicado no enunciado a média e desvio padrão, significa que trata-se de uma distribuição normal. Por se tratar de probabilidades acumuladas (ou seja, de mais de um valor), aplicamos a função pnorm da distribuição normal com média 112 e desvio padrão 17.4. Como a intenção é identificar a porcentagem de telhados que gerem mais de 84 Kwh, estamos interessados na parte superior da distribuição normal, portanto subtraímos de 1 o percentual calculado para notas até 84..
	
	
	
· Pergunta 2
1 em 1 pontos
	
	
	
	O estagiário da empresa fictícia EAD Corp S/A está tentando criar uma regressão linear entre os gastos com plano de saúde por família e valores de multas de trânsito nas imediações de um determinado hospital. Ele possui as informações carregadas em 2 vetores, x e y, respectivamente. Assinale a alternativa que mostra o comando em R para criar o modelo de regressão linear:
	
	
	
	
		Resposta Selecionada:
	 
lm(y~x).
	Resposta Correta:
	 
lm(y~x).
	Comentário da resposta:
	Resposta correta. A alternativa está correta, pois a regressão linear é a criação de uma fórmula matemática do tipo y = a + bx, onde y é o valor que deve ser previsto a partir do valor x. Sendo que essa fórmula assemelha-se a de uma reta, os valores “a” e “b” são os coeficientes dessa reta, sendo “a” o ponto de interceptação da reta com o eixo y e “b” inclinação dessa reta. O comando para a criação da regressão linear em R é o comando lm().
	
	
	
· Pergunta 3
1 em 1 pontos
	
	
	
	O estagiário e o cientista de dados da empresa fictícia EAD Corp S/A estão trabalhando em conjunto em uma atividade, e devido a ela acabaram discutindo sobre medidas para apresentar média de valores. Ambos apresentaram algumas medidas que julgam serem as mais apropriadas para demonstrar esses tipos de valores. Considerando o apresentado, assinale a alternativa que indique quais das medidas podem ser usadas para apresentar uma média de dados:
	
	
	
	
		Resposta Selecionada:
	 
Média, moda e mediana.
	Resposta Correta:
	 
Média, moda e mediana.
	Comentário da resposta:
	Resposta correta. A alternativa está correta, pois uma vez que a discussão do cientista de dados e do estagiário é sobre medidas que apresentam média de valores, seus argumentos estão referindo à medidas de tendência central. Sendo assim, o cientista de dados e o estagiário estão falando sobre a média, a moda e a mediana.
	
	
	
· Pergunta 4
1 em 1 pontos
	
	
	
	O estagiário da empresa fictícia EAD Corp S/A realizou uma análise em alguns dados da empresa e calculou as medidas de tendência central desses valores. Entretanto, após uma análise mais detalhada, descobriu que coletou um dos valores errados e será necessário recalcular as medidas novamente. Nesse sentido, assinale a alternativa que indique qual(is) da(s) seguinte(s) medida(s) de tendência central sempre mudará se um único valor nos dados mudarem:
	
	
	
	
		Resposta Selecionada:
	 
Média
	Resposta Correta:
	 
Média
	Comentário da resposta:
	Resposta correta. A alternativa está correta, pois a média do conjunto de dados sempre mudará se alterarmos qualquer valor do conjunto de dados. Como estamos somando todos os valores para obtê-lo, todo valor do conjunto de dados contribui para esse valor. A mediana e a moda podem ou não mudar com a alteração de um único valor no conjunto de dados.
	
	
	
· Pergunta 5
1 em 1 pontos
	
	
	
	Após prever os valores baseados no modelo de regressão linear, o estagiário da empresa fictícia EAD Corp S/A necessita criar um gráfico para explicar o modelo criado e as conclusões obtidas dessa análise. Esse gráfico deve conter informações sobre as variáveis e o modelo gerado. Assinale a alternativa que indique qual o tipo de gráfico ele deve criar:
	
	
	
	
		Resposta Selecionada:
	 
Um gráfico de dispersão com uma reta indicando o modelo de regressão.
	Resposta Correta:
	 
Um gráfico de dispersão com uma reta indicando o modelo de regressão.
	Comentário da resposta:
	Resposta correta. A alternativa está correta, pois uma regressão linear tem como característica a identificação do relacionamento entre 2 variáveis. De forma semelhante, o gráfico de dispersão também possui essa característica. Uma vez que o modelo de regressão cria uma fórmula semelhante a uma reta, basta plotar essa reta sob o gráfico de dispersão para representá-lo sob a ótica do mesmo conjunto de dados.
	
	
	
· Pergunta 6
1 em 1 pontos
	
	
	
	O estagiário da empresa fictícia EAD Corp S/A está trabalhando em uma análise sobre gastos com plano de saúde por família, e valores de multas de trânsito nas imediações de um determinado hospital. A idéia é identificar se existe uma relação entre essas duas variáveis. Ele realizou uma análise e obteve um valor 0,4503. Nesse sentido, assinale a alternativa que indique corretamente qual análise foi realizada e qual conclusão foi obtida, respectivamente:
	
	
	
	
		Resposta Selecionada:
	 
Ele realizou um teste de correlação e concluiu que existe uma indicação de relação moderada entre valor gasto por família em plano de saúde e valores das multas de trânsito.
	Resposta Correta:
	 
Ele realizou um teste de correlação e concluiu que existe uma indicação de relação moderada entre valor gasto por família em plano de saúde e valores das multas de trânsito.
	Comentário da resposta:
	Resposta correta. A alternativa está correta, pois ao analisar as informações de valores gastos em plano de saúde e valores de multas, é possível identificar que essas variáveis são numéricas e contínuas. Sendo assim, a análise a ser utilizada é o teste de correlação, sendo que o valor positivo indica uma relação direta moderada entre as variáveis.
	
	
	
· Pergunta 7
1 em 1 pontos
	
	
	
	O estagiário da empresa fictícia EAD Corp S/A está realizando uma pesquisa a respeito das notas dos clientes sobre os projetos da empresa. Ele obteve acesso a cinco notas (em uma escala variando de 0 a 20) fornecidas pelos clientes a projetos terminados recentemente: (5, 10, 15, 5, 15). Nesse sentido, assinale a alternativa que indique qual seria a soma dos desvios (valor - média) dos pontos de dados individuais em relação à sua média:
	
	
	
	
		Resposta Selecionada:
	 
0.
	Resposta Correta:
	 
0.
	Comentário da resposta:
	Resposta correta. A alternativa está correta, pois segundo a estatística, a soma dos desvios de todos os elementos de um conjunto será sempre zero. Para comprovar, primeiramente é necessário identificar a média e desvio para cada ponto. Sendo a média igual a 10 e os desvios (-5, 0, 5, -5, 5), ao somar esses valores constatará que o valor é igual a zero.
	
	
	
· Pergunta 8
1 em 1 pontos
	
	
	
	Após criar o modelo linear usando a função lm(), o estagiário da empresa fictícia EAD Corp S/A precisa utilizar esse modelo para prever valores de gastos com planos de saúde baseado no valores das multas de trânsito. Ele já dispõe de um conjunto de valores de multas de trânsito ocorridas na semana passada. Nesse sentido, assinale a alternativa que indique o comando a ser utilizado para a criar as previsões:
	
	
	
	
		Resposta Selecionada:
	 
predict().
	RespostaCorreta:
	 
predict().
	Comentário da resposta:
	Resposta correta. A alternativa está correta, pois a previsão utiliza um modelo de regressão linear para, a partir de um conjunto de dados x, tentar adivinhar os valores de y. Segundo a documentação do R, o comando para a criação de um conjunto de previsões baseadas em regressão linear em R é o comando predict().
	
	
	
· Pergunta 9
1 em 1 pontos
	
	
	
	O cientista de dados da empresa fictícia EAD Corp S/A está realizando uma análise dos dados de alunos de uma escola. Ele observou que existe uma correlação muito alta entre os resultados dos testes de matemática e a quantidade de exercício físico realizado por um aluno no dia do teste. Considerando o apresentado, analise as afirmativas a seguir:
 
1. Alta correlação implica que, após o exercício, os resultados dos testes são altos.
2. Correlação não implica em causa.
3. A correlação mede a força do relacionamento linear entre a quantidade de exercícios e as pontuações dos testes.
4. A correlação prova que existe uma relação formal entre o exercício e os resultados dos testes
 
Está correto o que se afirma em:
	
	
	
	
		Resposta Selecionada:
	 
II e III, apenas.
	Resposta Correta:
	 
II e III, apenas.
	Comentário da resposta:
	Resposta correta. A alternativa está correta, pois embora às vezes a causalidade possa ser intuitiva a partir de uma alta correlação, na verdade, a correlação não implica nenhuma inferência causal. Apenas nos diz a força do relacionamento entre as duas variáveis. Se ambas as variáveis se movem juntas, há uma alta correlação entre elas.
	
	
	
· Pergunta 10
1 em 1 pontos
	
	
	
	O cientista de dados da empresa fictícia EAD Corp S/A está analisando o total de furtos no primeiro semestre de 2019 no estado de São Paulo, que foi de 271 mil casos - o que  representa uma média diária de 1500 crimes dessa natureza. Assinale a alternativa que indique qual seria a probabilidade de em um dia ocorra até 1350 crimes:
	
	
	
	
		Resposta Selecionada:
	 
0,0004379296%.
	Resposta Correta:
	 
0,0004379296%.
	Comentário da resposta:
	Resposta correta. A alternativa está correta, pois por se tratar da probabilidade de ocorrências de um evento discreto independente em um intervalo de tempo, a distribuição a ser considerada é de Poisson. Como o enunciado pede o percentual até 1350 crimes por dia (90% de 1500), a ideia é calcular a probabilidade acumulada usando a função ppois(1350, 1500).