Buscar

Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original

1- A estatística descritiva usa de métodos numéricos para resumir dados, também chamados de sumários estatísticos, e de gráficos para a visualização dos dados. A jovem cientista de dados usou algumas técnicas de visualização de dados para analisar sua amostra, mas deixou outras de lado.
 
Analise as afirmativas a seguir e veja quais estão coerentes com sua análise descritiva dos dados.
I. Na sua análise descritiva dos dados da amostra, a jovem cientista de dados usou histogramas para a visualização dos dados quantitativos das amostras, que são a renda mensal das pessoas e seus gastos médios com o cartão de crédito
II. Na sua análise descritiva dos dados da amostra, a jovem cientista de dados usou diagramas de barras para a visualização dos dados quantitativos das amostras, que são a renda mensal das pessoas e seus gastos médios com o cartão de crédito.
III. Histogramas e diagramas de barras são formas tradicionais de visualização gráfica de dados quantitativos e qualitativos, respectivamente, na estatística e na ciência dos dados.
IV. A jovem cientista de dados usou, para este caso, apenas histogramas, e preferiu apenas lançar mão da função table() do software estatístico R, para determinar a frequência com que os níveis das variáveis qualitativas se manifestaram na amostra estudada, sem fazer uso de diagramas de barras, o que poderia ter feito, se quisesse.
 
Está correto o que se afirma em:
R: I, III e IV apenas 
2- O modelo de regressão linear simples desenvolvido pelo estatístico para a predição do valor esperado para o imóvel em função da sua área foi:
 
image0115e2b1e8b_20211113002200.gif
 
Ao tomar como base esse modelo, que foi ajustado aos dados da amostra cedida pela corretora ao estatístico, podemos estimar que o valor esperado para um apartamento de área igual a 58,0 metros quadrados é igual a (arredondando para mil reais):
R: 326
3- Considere dois pontos de venda da boneca falante com as seguintes características: primeiro ponto com local de exposição ruim da boneca, preço da boneca de 289,99 reais, gastos mensais com publicidade de 90 mil reais e idade média da população local de 39 anos. Segundo ponto com bom local de exposição da boneca e preço da boneca de 399,99 reais.
 
Use a árvore que construímos para o caso da boneca falante (novamente exibida aqui) e assinale a alternativa que indica corretamente a estimativa de vendas para esse ponto de venda:
R: Vendas altas e baixas, respectivamente.
4- Quando acontece de haver várias variáveis quantitativas em uma determinada amostra de dados, é comum a realização da análise da (possível) relação entre essas variáveis por meio do cálculo de suas correlações. Neste caso, o cálculo de suas correlações sempre é feito de duas em duas variáveis. Comumente, também se apresenta a correlação de cada variável com ela mesma, o que sempre resulta em uma correlação perfeita, igual a 1.
 
A tabela adiante mostra o resultado do cálculo das correlações entre 5 variáveis quantitativas de uma determinada amostra.
 
 
Com respeito a essa tabela de correlações, analise as afirmativas a seguir e assinale V para a(s) Verdadeira(s) e F para a(s) Falsa(s).
 
I. ( ) Os valores 1,00 apenas indicam a correlação perfeita que existe entre uma variável e ela mesma, uma informação de pouco valor prático.
II. ( ) A maior correlação positiva é aquela entre as variáveis x2 e x4, no valor de 0,89, que indica uma forte associação entre essas duas variáveis, e que uma aumenta com um aumento da outra.
III. ( ) A maior (em valor absoluto) correlação negativa é aquela entre as variáveis x1 e x4, no valor de - 0,87, que indica uma forte associação entre essas duas variáveis, e que uma diminui quanto a outra aumenta.
IV. ( ) A menor (em valor absoluto) correlação negativa é aquela entre as variáveis x4 e x5, no valor de - 0,17, que indica uma fraca associação entre essas duas variáveis, e que uma diminui quando a outra aumenta.
R: V, V, V, V.
5- Árvores de decisão são muito populares na estatística e na ciência dos dados. Parte dessa popularidade advém do fato de que as árvores de decisão são de muito fácil interpretação, o que contribui com a interpretação do caso (fenômeno, processo) estudado. Porém sabe-se que florestas randômicas têm melhor performance preditiva que árvores de decisão. A partir do apresentado, analise as asserções a seguir e a relação proposta entre elas.
 
I. Mesmo sabendo-se que florestas randômicas têm melhor performance preditiva que árvores de decisão, muitas vezes o cientista de dados dá preferência a modelos de árvores de decisão frente a florestas randômicas.
Pois:
II. Florestas randômicas, que são constituídas de centenas ou mais árvores, não têm a fácil interpretabilidade que árvores de decisão têm. Essa facilidade de interpretação não só é útil para a análise do fenômeno estudado, mas ajuda sobremaneira na comunicação dos resultados aos clientes.
 
A seguir, assinale a alternativa correta:
R: As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da I.
6- Em uma análise de agrupamento examinamos os dados observados (as linhas da tabela com os dados) e procuramos identificar, através de algum critério de similaridade, aquelas que estão mais próximas entre si, e formamos grupos com essas observações similares. Quando são apenas 2 variáveis e poucas observações (tamanho da amostra pequeno), por exemplo 10, podemos tentar fazer o agrupamento visualmente.
 
Analise a figura adiante e assinale a alternativa que indica a menor quantidade de grupos que você naturalmente formaria para este caso:
R: Dois grupos, um com 6 indivíduos e outro com 4 indivíduos.
7- Usamos gráficos para a visualização do comportamento (a descoberta de padrões), tanto de cada variável individualmente quanto da relação entre variáveis (o comportamento de uma em relação à outra). Ambas visualizações, seja da variável individualmente, seja da sua possível relação com outra variável, são de grande utilidade.
 
Quanto aos gráficos para a visualização da relação entre duas variáveis, analise as afirmativas a seguir:
I. Gráficos de dispersão são usados para a visualização da relação entre duas variáveis quantitativas.
II. Boxplots são usados para a visualização da relação entre uma variável quantitativa e uma variável qualitativa (ou os níveis de uma variável qualitativa).
III. Mosaic plots são usados para a visualização entre duas variáveis qualitativas (ou, em outras palavras, entre os níveis de duas variáveis qualitativas).
IV. Em qualquer uma das situações descritas acima, sempre exibiremos uma das variáveis no eixo horizontal e a outra no eixo vertical.
Está correto o que se afirma em:
R: I,II,III e IV.
8- Quando os dados se referem a múltiplas variáveis quantitativas, é possível calcular a correlação entre pares dessas variáveis, duas a duas. No software estatístico R, isto pode ser feito com a função cor(). Adiante apresentamos um output típico da função cor() quando aplicada ao cálculo da correlação entre quatro variáveis quantitativas de um determinado conjunto de dados.
 
 
A respeito deste output típico da função cor() do software estatístico R, para o cálculo da correlação entre múltiplas variáveis quantitativas, analise as afirmativas a seguir e assinale V para a(s) Verdadeira(s) e F para a(s) Falsa(s).
I. ( ) Todas correlações são positivas, o que indica que, para todas variáveis quantitativas dessa amostra, quando uma aumenta, a outra também aumenta.
II. ( ) Uma correlação igual a 1 entre uma variável e ela mesma apenas indica uma correlação perfeita dela com ela mesma.
III. ( ) A maior correlação positiva entre essas variáveis é aquela entre Murder e Assault, cujo valor é de 0,80.
IV. ( ) A segunda maior correlação positiva entre essas variáveis é aquela entre Rape e Assault, cujo valor é de 0,67 e não de 0,56.
R: V, V, V, V
9- O estatístico empregou gráficos
clássicos, isto é, de emprego consagrado, para a visualização de dados quantitativos e qualitativos, que são histogramas e diagramas de barras.
 
Diante do exposto, analise as afirmativas a seguir.
 
I. O estatístico usou de histogramas para a visualização dos dados quantitativos das amostras, quais sejam: a área, o andar e o valor do imóvel.
II. O estatístico usou de diagramas de barras para a visualização do único dado qualitativo da amostra: a localização do imóvel.
III. Histogramas e diagramas de barra são formas tradicionais de visualização gráfica de dados quantitativos e qualitativos, respectivamente, na estatística e na ciência dos dados.
IV. Gráficos de pizza são uma alternativa aos diagramas de barras para a representação visual de dados qualitativos.
 
Está correto o que se afirma em:
R: IV, apenas.
10- Na Unidade 1, usamos um modelo de regressão múltipla para a predição do valor de imóveis. Aqui, para o mesmo problema, usamos como modelo uma árvore de decisão. Dizemos que este modelo é um modelo de árvore de decisão para regressão, já que a variável resposta, o valor do imóvel, é quantitativa.
 
 
A respeito deste modelo de árvore de decisão aplicado ao problema de predição do valor dos imóveis (replicado aqui, para sua conveniência), analise as afirmativas a seguir e assinale V para a(s) Verdadeira(s) e F para a(s) Falsa(s).
 
I. ( ) Se o apartamento tiver uma área menor que 73,6 metros quadrados e for localizado no bairro, a estimativa para seu valor é de 319,20 mil reais, se seu andar for menor ou igual ao 6º andar.
II. ( ) Se o apartamento tiver uma área menor que 73,6 metros quadrados, for localizado no centro e seu andar for menor ou igual ao 6º andar, a estimativa para seu valor é de 366,50 mil reais.
III. ( ) Se o apartamento tiver uma área maior que 73,6 metros quadrados, a estimativa para seu valor é de 448,80 mil reais, independentemente da sua localização, bairro ou centro, e do seu andar.
IV. ( ) Se o apartamento tiver uma área menor que 73,7 metros quadrados, for localizado no centro e seu andar for igual ou maior que o 7º andar, a estimativa para seu valor é de 366,50 mil reais.
 
Assinale a alternativa que apresenta a sequência correta:
R: F, F, V, V.

Teste o Premium para desbloquear

Aproveite todos os benefícios por 3 dias sem pagar! 😉
Já tem cadastro?

Mais conteúdos dessa disciplina