Buscar

222RGR0890A - ESTATÍSTICA APLICADA AO DATA SCIENCE

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 11 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 11 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 11 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

222RGR0890A - ESTATÍSTICA APLICADA AO DATA SCIENCE
1. Minhas Disciplinas
2. 222RGR0890A - ESTATÍSTICA APLICADA AO DATA SCIENCE
3. PROVA N2 (A5)
4. N2 (A5)
	Iniciado em
	sexta, 16 dez 2022, 15:58
	Estado
	Finalizada
	Concluída em
	sexta, 16 dez 2022, 16:29
	Tempo empregado
	30 minutos 39 segundos
	Avaliar
	10,00 de um máximo de 10,00(100%)
Parte superior do formulário
Questão 1
Completo
Atingiu 1,00 de 1,00
Marcar questão
Texto da questão
Na análise descritiva do volume de vendas da boneca falante, foram estudadas as variáveis relativas aos dados coletados pela gerente comercial do fabricante da boneca. Dentre elas, há a variável dos gastos do fabricante da boneca com publicidade, cuja relação com vendas altas ou baixas é exibida no gráfico adiante.
 
 Figura: Efeito dos gastos com publicidade nas vendas
Fonte: Elaborada pelo autor.
 
Quanto à relação entre gastos mensais com publicidade e o volume de vendas (vendas altas ou baixas), analise as afirmativas a seguir:
I. Ao estudarmos este caso, percebemos que vendas altas ocorrem mesmo quando os gastos com publicidade são apenas ligeiramente maiores.
II. Visualmente, podemos perceber que a mediana (linha sólida dentro da caixa) dos gastos com publicidade é da ordem de 20 mil reais por mês para vendas altas e da ordem de 8 mil reais por mês para vendas baixas.
III. O gráfico de visualização da relação entre os gastos mensais com publicidade e o volume de vendas não mostra qualquer efeito dos gastos com publicidade sobre o volume de vendas da boneca.
IV. O gráfico de visualização da relação entre os gastos mensais com publicidade e o volume de vendas mostra que vendas altas ocorrem quando os gastos com publicidade são significativamente maiores.
Está correto o que se afirma em:
a.
II e IV, apenas.
b.
III e IV, apenas.
c.
I e II, apenas.
d.
I, apenas.
e.
III, apenas.
Questão 2
Completo
Atingiu 1,00 de 1,00
Marcar questão
Texto da questão
Leia o excerto a seguir:
“Normalização: É comum normalizar (padronizar) variáveis contínuas através da subtração da média e divisão pelo desvio-padrão, ou então as variáveis com grande escala dominarão o processo de agrupamento (veja Padronização (Normalização, Escores Z), no Capítulo 6).”
 
BRUCE, Peter; BRUCE, Andrew. Estatística prática para cientistas de dados: 50 conceitos iniciais. Rio de Janeiro: Alta Books, 2019, p. 265.
 A partir do apresentado, analise as asserções a seguir e a relação proposta entre elas.
 
I.  Sabemos que, na estatística ou na ciência dos dados, é comum normalizar (padronizar) variáveis quantitativas, ou variáveis contínuas, antes da realização de uma análise de agrupamento.
Pois
II. No conjunto de dados observados (a amostra de dados), podem existir variáveis que estão em uma escala muito maior que as outras, e a medida de distância entre observações dessas variáveis dominarão o resultado da análise de agrupamento, na formação dos grupos de observações similares entre si.
a.
As asserções I e II são proposições falsas.
b.
A asserção I é uma proposição falsa, e a II é uma proposição verdadeira.
c.
A asserção I é uma proposição verdadeira e a asserção II é uma proposição falsa.
d.
As asserções I e II são proposições verdadeiras, mas a II não é uma justificativa correta da I.
e.
As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da I.
Questão 3
Completo
Atingiu 1,00 de 1,00
Marcar questão
Texto da questão
Tarefas de classificação são muitos comuns na estatística e na ciência dos dados, por serem muito comuns em todas atividades humanas, na ciência, na vida social ou nos negócios.
Especificamente, discutimos aplicações de modelos preditivos de classificação baseados em modelos de regressão logística simples ou múltipla.
Com isso em mente, analise as afirmativas a seguir e assinale V para a(s) Verdadeira(s) e F para a(s) Falsa(s).
 
I. Regressão logística pode ser empregada na predição do peso médio (massa corporal média) de uma pessoa em função de sua altura, idade e sexo.
II. Regressão logística pode ser empregada na predição do consumo médio de combustível de um carro em função da potência do seu motor e do seu peso.
III. Regressão logística pode ser empregada na predição da probabilidade de uma pessoa votar em um determinado candidato e não nos outros em função de sua escolaridade, idade, sexo e classe social.
IV. Regressão logística pode ser empregada na predição da probabilidade de a pessoa ser diabética em função de um conjunto de sintomas clínicos que apresenta.
 
Assinale a alternativa que apresenta a sequência correta.
 
 
a.
F, V, F, V.
b.
F, F, V, V.
c.
F, F, F, F.
d.
V, V, F, F.
e.
V, V, V, V.
Questão 4
Completo
Atingiu 1,00 de 1,00
Marcar questão
Texto da questão
Os modelos de regressão são de enorme importância na estatística e na ciência dos dados. Dentre os diversos modelos de regressão que existem, são justamente os modelos de regressão linear aqueles considerados os mais importantes e, sem dúvida, os mais difundidos, com aplicações nas mais diversas áreas.
 
Considerando as técnicas discutidas de desenvolvimento de modelos preditivos pautados em modelos de regressão linear simples ou múltipla,  analise as afirmativas a seguir e assinale V para a(s) Verdadeira(s) e F para a(s) Falsa(s).
 
I. ( ) Modelos de regressão linear podem ser empregados na predição do peso médio (massa corporal média) de uma pessoa em função da sua altura, idade e sexo.
II. ( ) Modelos de regressão linear podem ser empregados na predição do consumo médio de combustível de um carro em função da potência do seu motor e do seu peso.
III. ( ) Modelos de regressão linear podem ser empregados na predição da renda média mensal de uma pessoa em função da sua escolaridade, idade, sexo e classe social.
IV. ( ) Modelos de regressão linear podem ser empregados na predição da classe social de uma pessoa em função da sua renda média mensal, escolaridade, idade e sexo.
 
Assinale a alternativa que apresenta a sequência correta.
 
 
a.
V, V, V, V.
b.
F, V, F, V.
c.
V, V, F, F.
d.
V, V, V, F.
e.
F, F, F, F.
Questão 5
Completo
Atingiu 1,00 de 1,00
Marcar questão
Texto da questão
Em uma análise de agrupamento examinamos os dados observados (as linhas da tabela com os dados) e procuramos identificar, através de algum critério de similaridade, aquelas que estão mais próximas entre si, e formamos grupos com essas observações similares. Quando são apenas 2 variáveis e poucas observações (tamanho da amostra pequeno), por exemplo 10, podemos tentar fazer o agrupamento visualmente.
 
Analise a figura adiante e assinale a alternativa que indica a menor quantidade de grupos que você naturalmente formaria para este caso:
 
Figura - Massa corporal (kg) versus comprimento (m) dos animais
Fonte: Elaborada pelo autor
 
a.
Dois grupos com 5 indivíduos cada.
b.
Dois grupos, um com 1 indivíduo e um com 9 indivíduos.
c.
Dois grupos, um com 6 indivíduos e outro com 4 indivíduos.
d.
Três grupos, um com 5 indivíduos, um com 1 indivíduo, e um com 4 indivíduos.
e.
Quatro grupos, um com 5 indivíduos, dois com 1 indivíduo cada, e um com 4 indivíduos.
Questão 6
Completo
Atingiu 1,00 de 1,00
Marcar questão
Texto da questão
Vimos que dados podem ser classificados em dados estruturados e dados não estruturados. Atribuímos um foco aos dados estruturados, de enorme importância para a estatística e para a ciência dos dados. Ademais, há, na estatística e na ciência dos dados, uma forma básica preferida de organização dos dados.
 
Com base no exposto, analise as afirmativas a seguir.
 
I. Dados retangulares são dados organizados na forma de tabelas, em que as variáveis são dispostas nas colunas e as observações são dispostas nas linhas.
II. Os dados cedidos pela corretora ao seu amigo estatístico foram organizados na forma de uma tabela, porém essa tabela não é um exemplo de dados retangulares, pois as variáveis estão dispostas nas linhas e as observações nas colunas.
III. No R, as estruturas de dados organizados em tabelas, com as variáveis dispostas nas colunas e as observações nas linhas,são denominadas data-frames. Esse conceito é copiado no Python por meio da sua biblioteca “Pandas”.
IV. Na estatística, ou na ciência de dados, não há preferência por dados estruturados na forma de data-frames, já que estatísticos e cientistas de dados podem trabalhar com dados organizados em qualquer tipo de estrutura.
 
Está correto o que se afirma em:
 
 
a.
II e IV, apenas.
b.
II e III, apenas.
c.
I e II, apenas
d.
I e III, apenas.
e.
III e IV, apenas.
Questão 7
Completo
Atingiu 1,00 de 1,00
Marcar questão
Texto da questão
Na análise descritiva do volume de vendas da boneca falante, foram estudadas as variáveis relativas aos dados coletados pela gerente comercial do fabricante da boneca. Entre elas, há a variável do preço da boneca praticado em cada ponto de venda, cuja relação com vendas altas ou baixas é exibida no gráfico adiante.
 
 
Figura: Efeito do preço nas vendas
Fonte: Elaborada pelo autor.
 
Quanto a relação entre o preço da boneca e o volume de vendas (vendas altas ou baixas), analise as afirmativas a seguir:
I. Ao estudarmos este caso, percebemos que não há qualquer efeito do preço da boneca falante sobre o volume de vendas em cada ponto (de venda).
II. O gráfico de visualização da relação entre o preço de venda da boneca e o volume de vendas mostra que vendas altas ocorrem quando o preço da boneca é significativamente menor.
III. O gráfico de visualização da relação entre o preço de venda da boneca e o volume de vendas mostra que vendas altas ocorrem mesmo quando o preço da boneca não é significativamente menor.
IV. A asserção III é um indicativo que o efeito de outras variáveis sobre o volume de vendas da boneca pode ser tão relevante ou mesmo maior que o efeito da diferença de preço.
Está correto o que se afirma em:
a.
I e III, apenas.
b.
III e IV, apenas.
c.
I e II, apenas.
d.
II e III, apenas.
e.
I, III e IV, apenas.
Questão 8
Completo
Atingiu 1,00 de 1,00
Marcar questão
Texto da questão
Muitos dos modelos ou algoritmos usados na estatística e na ciência dos dados são denominados modelos paramétricos, ou seja, que possuem parâmetros. Esses parâmetros devem ser determinados quando se treina (se ajusta) o modelo ou algoritmo aos dados amostrados. Na regressão linear simples ou múltipla, esses parâmetros são denominados coeficientes do modelo.
 
No que tange aos coeficientes do modelo de regressão linear simples para o valor do imóvel em função do seu andar, analise as afirmativas a seguir.
 
I. O estatístico usou o software R e obteve, para os coeficientes do modelo de regressão linear simples do valor do imóvel em função do seu, b0 = 333,71 e b2 = 6,55.
II. Os coeficientes do modelo de regressão linear simples do valor do imóvel em função da sua área possuem unidades, que são, respectivamente, kR$ (mil reais) para b0 e kR$/andar(mil reais dividido pelo andar do imóvel) para b2.
III. O coeficiente b0 é a intersecção da reta do modelo com o eixo vertical y quanto x2 = 0. Pode ser interpretado como o valor estimado de um apartamento localizado no térreo, porém isso é uma extrapolação, pois, na amostra analisada, não há nenhum apartamento no andar térreo.
IV. O coeficiente b2 indica quanto varia o valor esperado do imóvel para um aumento de seu andar em exatamente 1 andar. Graficamente, esse coeficiente é a inclinação da reta que representa o modelo de regressão linear simples ajustado aos dados da amostra.
Está correto o que se afirma em:
 
a.
III e IV, apenas.
b.
II, III e IV, apenas.
c.
I e II, apenas.
d.
I, II, III e IV.
e.
II e III, apenas.
Questão 9
Completo
Atingiu 1,00 de 1,00
Marcar questão
Texto da questão
No decorrer desta unidade, apresentamos uma série de exemplos de problemas de regressão e problemas de classificação. A diferença entre eles reside no tipo da variável resposta, se quantitativa ou qualitativa. Problemas de regressão são aqueles em que a variável resposta é quantitativa. As variáveis de entrada, também chamadas de regressoras ou preditoras, podem ser quantitativas ou qualitativas.
 
Em relação a problemas de regressão, analise as afirmativas a seguir e assinale V para a(s) Verdadeira(s) e F para a(s) Falsa(s).
 
I. ( ) A predição da redução da massa corporal de uma pessoa, em quilos, em função do tipo de dieta alimentar e das horas semanais dedicadas à prática de atividades físicas, é um problema de regressão.
II. ( ) A predição da resistência à tração de uma liga metálica, em Pascal (1 Pascal = 1 Newton/m2), em um ensaio de tração, em função da sua composição, granulometria e condições gerais do processo de fabricação da liga, é um problema de regressão.
III. ( ) A predição da taxa de mortalidade anual por melanoma maligno, em mortes a cada 100.000 habitantes, em função da latitude da região na qual habita a pessoa, é um problema de regressão.
IV. ( ) A predição do consumo de combustível de um veículo, em litros de combustível por quilômetro rodado, em função do seu peso, do número de cilindros do seu motor, e do volume do seu motor, é um problema de regressão.
 
Assinale a alternativa que apresenta a sequência correta:
a.
F, F, V, V.
b.
V, V, V, V.
c.
V, F, V, F.
d.
F, F, V, F.
e.
F, V, V, F.
Questão 10
Completo
Atingiu 1,00 de 1,00
Marcar questão
Texto da questão
Leia o excerto a seguir:
“O quadro típico para uma análise em ciência de dados é um objeto de dados retangulares, como uma planilha ou tabela de banco de dados. Dado retangularé basicamente uma matriz bidimensional com linhas indicando registros (caso) e colunas indicando características (variáveis). Os dados nem sempre começam dessa forma: dados não estruturados (por exemplo, texto) devem ser processados e tratados de modo a serem representados como um conjunto de características nos dados retangulares.”
BRUCE, P.; BRUCE, A. Estatística prática para cientistas de dados: 50 conceitos iniciais. Rio de Janeiro: Alta Books, 2019. p. 5–6.
Tomando como base esse texto e o que já discutimos sobre dados estruturados, tabulares e retangulares, analise as afirmativas a seguir e assinale V para a(s) Verdadeira(s) e F para a(s) Falsa(s).
I. ( ) É impossível converter dados não estruturados em representações estruturadas, para que possam ser analisados pela ciência dos dados.
II. ( ) Dados retangulares não são uma forma típica de organização de dados para análise em ciência dos dados.
III. ( ) Textos são dados estruturados, pois sempre vêm em estruturas bem padronizadas, como aquelas que estudamos em gramática.
IV. ( ) Dados retangulares, dados tabulares ou dados estruturados são termos usados como sinônimos na ciência dos dados.
 
Assinale a alternativa que apresenta a sequência correta:
a.
F, V, F, V.
b.
F, F, V, F.
c.
F, F, V, V.
d.
F, F, F, V.
e.
F, F, F, F.
Parte inferior do formulário

Continue navegando