Buscar

N2 (A5)_ Revisão da tentativa-Estatistica

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 8 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 8 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

12/12/2022 19:16 N2 (A5): Revisão da tentativa
https://ambienteacademico.com.br/mod/quiz/review.php?attempt=1665037&cmid=509714 1/8
Minhas Disciplinas 222RGR0890A - ESTATÍSTICA APLICADA AO DATA SCIENCE PROVA N2 (A5) N2 (A5)
Iniciado em segunda, 12 dez 2022, 19:03
Estado Finalizada
Concluída em segunda, 12 dez 2022, 19:15
Tempo
empregado
12 minutos 21 segundos
Avaliar 9,00 de um máximo de 10,00(90%)
Questão 1
Completo
Atingiu 1,00 de 1,00
Questão 2
Completo
Atingiu 1,00 de 1,00
Na estatística ou, genericamente, na análise de dados, muito frequentemente analisamos dados ditos retangulares ou estruturados, onde as
variáveis - quantitativas ou qualitativas - são dispostas nas colunas e as observações na linhas de uma tabela. Em algumas situações é
vantajoso se fazer a padronização das variáveis quantitativas.
 
Assinale a alternativa correta relativamente ao assunto de padronização de variáveis quantitativas na estatística:
a. Na padronização, se subtrai de cada variável seu desvio padrão, e não se faz nada com respeito à sua média.
b. Na padronização, se subtrai de cada variável sua média, e depois se divide o resultado pelo seu desvio padrão.
c. Na padronização, se subtrai de cada variável seu desvio padrão, e depois se divide o resultado pela média da variável.
d. Na padronização, se calcula a média geral entre todas variáveis e depois se subtrai este valor de cada uma das variáveis.
e. Na padronização, se subtrai de cada variável sua média, e não se faz nada com respeito ao seu desvio padrão.
Usamos gráficos para a visualização do comportamento (a descoberta de padrões), tanto de cada variável individualmente quanto da
relação entre variáveis (o comportamento de uma em relação à outra). Ambas visualizações, seja da variável individualmente, seja da sua
possível relação com outra variável, são de grande utilidade.
 
Quanto aos gráficos para a visualização da relação entre duas variáveis, analise as afirmativas a seguir:
I. Gráficos de dispersão são usados para a visualização da relação entre duas variáveis quantitativas.
II. Boxplots são usados para a visualização da relação entre uma variável quantitativa e uma variável qualitativa (ou os níveis de uma
variável qualitativa).
III. Mosaic plots são usados para a visualização entre duas variáveis qualitativas (ou, em outras palavras, entre os níveis de duas variáveis
qualitativas).
IV. Em qualquer uma das situações descritas acima, sempre exibiremos uma das variáveis no eixo horizontal e a outra no eixo vertical.
Está correto o que se afirma em:
a. II e III, apenas.
b. I, II e III, apenas.
c. I e IV, apenas.
d. II, III e IV, apenas.
e. I, II, III e IV.
Guia Digital Carreiras e Internacionalização NAP CPA Responsabilidade Socioambiental
https://ambienteacademico.com.br/my/
https://ambienteacademico.com.br/course/view.php?id=18312
https://ambienteacademico.com.br/course/view.php?id=18312&section=7
https://ambienteacademico.com.br/mod/quiz/view.php?id=509714
https://codely-fmu-content.s3.amazonaws.com/Moodle/GuiaDigital/Guia+digital/index.html
https://informa.fmu.br/carreiras/
https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html
https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html
https://portal.fmu.br/sustentabilidade
12/12/2022 19:16 N2 (A5): Revisão da tentativa
https://ambienteacademico.com.br/mod/quiz/review.php?attempt=1665037&cmid=509714 2/8
Questão 3
Completo
Atingiu 0,00 de 1,00
Questão 4
Completo
Atingiu 1,00 de 1,00
Vimos que dados podem ser classificados em dados estruturados e dados não estruturados. Atribuímos um foco aos dados estruturados, de
enorme importância para a estatística e para a ciência dos dados. Ademais, há, na estatística e na ciência dos dados, uma forma básica
preferida de organização dos dados.
 
Com base no exposto, analise as afirmativas a seguir.
 
I. Dados retangulares são dados organizados na forma de tabelas, em que as variáveis são dispostas nas colunas e as observações são
dispostas nas linhas.
II. Os dados cedidos pela corretora ao seu amigo estatístico foram organizados na forma de uma tabela, porém essa tabela não é um
exemplo de dados retangulares, pois as variáveis estão dispostas nas linhas e as observações nas colunas.
III. No R, as estruturas de dados organizados em tabelas, com as variáveis dispostas nas colunas e as observações nas linhas, são
denominadas data-frames. Esse conceito é copiado no Python por meio da sua biblioteca “Pandas”.
IV. Na estatística, ou na ciência de dados, não há preferência por dados estruturados na forma de data-frames, já que estatísticos e
cientistas de dados podem trabalhar com dados organizados em qualquer tipo de estrutura.
 
Está correto o que se afirma em:
 
 
a. I e II, apenas
b. II e III, apenas.
c. II e IV, apenas.
d. III e IV, apenas.
e. I e III, apenas.
Em algumas situações, o cientista de dados pode decidir transformar dados quantitativos em dados qualitativos, o que chamamos
discretização. Por exemplo, em vez de tratar idade como uma variável quantitativa contínua, podemos transformá-la em uma variável
qualitativa com quatro níveis: criança, jovem, adulto, idoso. A partir do apresentado, analise as asserções a seguir e a relação proposta
entre elas.
 
I. A discretização (transformação) de variáveis quantitativas em qualitativas é comum na estatística e na ciência dos dados.
Pois:
II. A discretização, em muitas situações, simplifica a análise e, principalmente, traz maior clareza à interpretação dos resultados.
 
A seguir, assinale a alternativa correta:
a. A asserção I é uma proposição verdadeira e a asserção II é uma proposição falsa.
b. As asserções I e II são proposições falsas.
c. A asserção I é uma proposição falsa e a II é uma proposição verdadeira.
d. As asserções I e II são proposições verdadeiras, e a II é uma justi�cativa correta da I.
e. As asserções I e II são proposições verdadeiras, mas a II não é uma justi�cativa correta da I.
Guia Digital Carreiras e Internacionalização NAP CPA Responsabilidade Socioambiental
https://codely-fmu-content.s3.amazonaws.com/Moodle/GuiaDigital/Guia+digital/index.html
https://informa.fmu.br/carreiras/
https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html
https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html
https://portal.fmu.br/sustentabilidade
12/12/2022 19:16 N2 (A5): Revisão da tentativa
https://ambienteacademico.com.br/mod/quiz/review.php?attempt=1665037&cmid=509714 3/8
Questão 5
Completo
Atingiu 1,00 de 1,00
Quando os dados se referem a múltiplas variáveis quantitativas, é possível exibir múltiplos gráficos de dispersão entre pares dessas
variáveis, duas a duas. No software estatístico R, isto pode ser feito com a função gráfica pairs(). Adiante apresentamos um output típico da
função pairs() quando aplicada a quatro variáveis quantitativas de um determinado conjunto de dados.
 
 
Figura 4: Múltiplos gráficos de dispersão entre as variáveis de USArrest
Fonte: Elaborada pelo autor.
 
A respeito deste output típico da função gráfica pairs() do software estatístico R, para a exibição de múltiplos gráficos de dispersão entre
variáveis quantitativas, analise as afirmativas a seguir e assinale V para a(s) Verdadeira(s) e F para a(s) Falsa(s).
 
I. ( ) O gráfico de y = Murder versus x = Assault mostra uma tendência de aumento de Murder para um aumento de Assault.
II. ( ) O gráfico de y = Murder versus x = UrbanPop mostra uma grande dispersão dos pontos sem uma tendência clara de subida ou
descida.
III. ( ) O gráfico de y = Murder versus x = Rape mostra uma tendência de aumento de Murder para um aumento de Assault, porém com uma
dispersão dos pontos um pouco maior que para o caso de y = Murder versus x = Assault.
IV. ( ) Como são quatro variáveis quantitativas (Murder, Assault, UrbanPop e Rape), então ao total são 12 gráficos de dispersão, de cada
uma delas contra as outras três.
a. V, V, V, F.
b. F, V, F, V.
c. F, V, V, F.
d. V, V, V, V.
e. F, V, V, V.Guia Digital Carreiras e Internacionalização NAP CPA Responsabilidade Socioambiental
https://codely-fmu-content.s3.amazonaws.com/Moodle/GuiaDigital/Guia+digital/index.html
https://informa.fmu.br/carreiras/
https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html
https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html
https://portal.fmu.br/sustentabilidade
12/12/2022 19:16 N2 (A5): Revisão da tentativa
https://ambienteacademico.com.br/mod/quiz/review.php?attempt=1665037&cmid=509714 4/8
Questão 6
Completo
Atingiu 1,00 de 1,00
Considere quatro apartamentos: o primeiro com 55 metros quadrados, no centro, no 4º andar; o segundo com 77 metros quadrados, no
bairro, no 5º andar; o terceiro com 54 metros quadrados, no centro, no 9º andar; o quarto com 60 metros quadrados, no bairro, no 12º
andar.
 
 
Figura - Árvore de decisão ajustada aos valores dos imóveis
Fonte: Elaborada pelo autor.
 
Use a árvore que construímos para o caso dos imóveis (novamente exibida aqui) e assinale a alternativa que indica corretamente as
estimativas de preço desses apartamentos:
a. 390,40; 366,50; 390,40; 448,80 mil reais.
b. 366,50; 319,20; 390,40; 448,80 mil reais.
c. 319,20; 448,80; 366,50; 390,40 mil reais.
d. 319,20; 448,80; 390,40; 366,50 mil reais.
e. 319,20; 448,80; 366,50; 366,50 mil reais.
Guia Digital Carreiras e Internacionalização NAP CPA Responsabilidade Socioambiental
https://codely-fmu-content.s3.amazonaws.com/Moodle/GuiaDigital/Guia+digital/index.html
https://informa.fmu.br/carreiras/
https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html
https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html
https://portal.fmu.br/sustentabilidade
12/12/2022 19:16 N2 (A5): Revisão da tentativa
https://ambienteacademico.com.br/mod/quiz/review.php?attempt=1665037&cmid=509714 5/8
Questão 7
Completo
Atingiu 1,00 de 1,00
Leia o excerto a seguir:
 
“Uma parte fundamental do kit de ferramentas do cientista de dados é a visualização de dados. Embora seja muito fácil criar visualizações é
bem mais difícil produzir algumas boas. Existem dois usos primários para a visualização de dados: - Para explorar dados. - Para comunicar
dados. Neste capítulo, nos concentraremos em construir habilidades das quais você precisará para começar a explorar seus próprios dados
e produzir visualizações que usaremos no decorrer do livro. Como a maioria dos nossos tópicos do capítulo, a visualização de dados é uma
rica área de estudos que merece seu próprio livro. Mas, mesmo assim, tentaremos mostrar o que é preciso e o que não é para uma boa
visualização.”
 
GRUS, J. Data science do zero: primeiras regras com Python. Rio de Janeiro: Alta Books, 2016. p. 37.
 
Considerando o excerto apresentado, em relação à visualização de dados, analise as afirmativas a seguir:
 
I. O autor do texto considera a visualização de dados uma parte acessória ao trabalho do cientista de dados.
II. O autor considera fácil criar visualizações de dados, porém acha difícil criar boas visualizações de dados.
III. O autor considera que, por ser fácil criar visualizações de dados, não há razão para merecer seu próprio livro.
IV. O autor deixa claro que existem dois usos primários para a visualização de dados: explorar dados e comunicar dados.
 
Está correto o que se afirma em:
a. I, II e IV, apenas.
b. II, III e IV, apenas.
c. I, II e III, apenas.
d. II e III, apenas.
e. II e IV, apenas.
Guia Digital Carreiras e Internacionalização NAP CPA Responsabilidade Socioambiental
https://codely-fmu-content.s3.amazonaws.com/Moodle/GuiaDigital/Guia+digital/index.html
https://informa.fmu.br/carreiras/
https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html
https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html
https://portal.fmu.br/sustentabilidade
12/12/2022 19:16 N2 (A5): Revisão da tentativa
https://ambienteacademico.com.br/mod/quiz/review.php?attempt=1665037&cmid=509714 6/8
Questão 8
Completo
Atingiu 1,00 de 1,00
Na Unidade 1, usamos um modelo de regressão múltipla para a predição do valor de imóveis. Aqui, para o mesmo problema, usamos como
modelo uma árvore de decisão. Dizemos que este modelo é um modelo de árvore de decisão para regressão, já que a variável resposta, o
valor do imóvel, é quantitativa.
 
 
Figura: Árvore de decisão ajustada aos valores dos imóveis
Fonte: Elaborada pelo autor.
 
A respeito deste modelo de árvore de decisão aplicado ao problema de predição do valor dos imóveis (replicado aqui, para sua
conveniência), analise as afirmativas a seguir e assinale V para a(s) Verdadeira(s) e F para a(s) Falsa(s).
 
I. ( ) Se o apartamento tiver uma área menor que 73,6 metros quadrados e for localizado no bairro, a estimativa para seu valor é de 319,20
mil reais, se seu andar for menor ou igual ao 6º andar.
II. ( ) Se o apartamento tiver uma área menor que 73,6 metros quadrados, for localizado no centro e seu andar for menor ou igual ao 6º
andar, a estimativa para seu valor é de 366,50 mil reais.
III. ( ) Se o apartamento tiver uma área maior que 73,6 metros quadrados, a estimativa para seu valor é de 448,80 mil reais,
independentemente da sua localização, bairro ou centro, e do seu andar.
IV. ( ) Se o apartamento tiver uma área menor que 73,7 metros quadrados, for localizado no centro e seu andar for igual ou maior que o 7º
andar, a estimativa para seu valor é de 366,50 mil reais.
 
Assinale a alternativa que apresenta a sequência correta:
a. V, F, V, F.
b. F, F, V, F.
c. F, V, V, V.
d. F, F, V, V.
e. F, V, V, F.
Guia Digital Carreiras e Internacionalização NAP CPA Responsabilidade Socioambiental
https://codely-fmu-content.s3.amazonaws.com/Moodle/GuiaDigital/Guia+digital/index.html
https://informa.fmu.br/carreiras/
https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html
https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html
https://portal.fmu.br/sustentabilidade
12/12/2022 19:16 N2 (A5): Revisão da tentativa
https://ambienteacademico.com.br/mod/quiz/review.php?attempt=1665037&cmid=509714 7/8
Questão 9
Completo
Atingiu 1,00 de 1,00
Estudamos algoritmos preditivos com base em (1) modelos de regressão linear e (2) modelos de regressão logística. Esses modelos são
aplicados em situações bem distintas, que dependem, essencialmente, da natureza da variável resposta, também chamada de variável
dependente.
 
Com esses dois modelos em mente, analise as afirmativas a seguir.
 
I. Modelos de regressão logística simples são usados na predição de uma variável resposta qualitativa quando há mais do que uma
variável de entrada.
II. Modelos de regressão linear simples são usados na predição de uma variável resposta qualitativa quando se considera apenas uma
variável de entrada.
III. Um possível modelo de regressão logística simples para a predição da probabilidade de inadimplência é:
 
em que e são os coeficientes do modelo, , o gasto médio mensal da pessoa com cartão de crédito e , o valor esperado para a
probabilidade de a pessoa ficar ou não inadimplente com o pagamento das faturas do cartão.
 
IV. O método comumente usado para calcular os valores dos coeficientes e é o Método da Máxima Verossimilhança. Para isso,
pode-se fazer uso do software estatístico R.
 
Está correto o que se afirma em:
a. II, III e IV, apenas.
b. I e II, apenas.
c. III e IV, apenas.
d. II e III, apenas.
e. I, II e IV, apenas.
Guia Digital Carreiras e Internacionalização NAP CPA Responsabilidade Socioambiental
https://codely-fmu-content.s3.amazonaws.com/Moodle/GuiaDigital/Guia+digital/index.html
https://informa.fmu.br/carreiras/
https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html
https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html
https://portal.fmu.br/sustentabilidade
12/12/2022 19:16 N2 (A5): Revisão da tentativa
https://ambienteacademico.com.br/mod/quiz/review.php?attempt=1665037&cmid=509714 8/8
Questão10
Completo
Atingiu 1,00 de 1,00
No decorrer desta unidade, apresentamos uma série de exemplos de problemas de regressão e problemas de classificação. A diferença
entre eles reside no tipo da variável resposta, se quantitativa ou qualitativa. Problemas de regressão são aqueles em que a variável
resposta é quantitativa. As variáveis de entrada, também chamadas de regressoras ou preditoras, podem ser quantitativas ou qualitativas.
 
Em relação a problemas de regressão, analise as afirmativas a seguir e assinale V para a(s) Verdadeira(s) e F para a(s) Falsa(s).
 
I. ( ) A predição da redução da massa corporal de uma pessoa, em quilos, em função do tipo de dieta alimentar e das horas semanais
dedicadas à prática de atividades físicas, é um problema de regressão.
II. ( ) A predição da resistência à tração de uma liga metálica, em Pascal (1 Pascal = 1 Newton/m ), em um ensaio de tração, em função da
sua composição, granulometria e condições gerais do processo de fabricação da liga, é um problema de regressão.
III. ( ) A predição da taxa de mortalidade anual por melanoma maligno, em mortes a cada 100.000 habitantes, em função da latitude da
região na qual habita a pessoa, é um problema de regressão.
IV. ( ) A predição do consumo de combustível de um veículo, em litros de combustível por quilômetro rodado, em função do seu peso, do
número de cilindros do seu motor, e do volume do seu motor, é um problema de regressão.
 
Assinale a alternativa que apresenta a sequência correta:
a. F, F, V, V.
b. F, F, V, F.
c. V, V, V, V.
d. F, V, V, F.
e. V, F, V, F.
2
◄ Revisão Atividade 4 (A4)
Seguir para...
Revisão Prova N2 (A5) ►
Guia Digital Carreiras e Internacionalização NAP CPA Responsabilidade Socioambiental
https://ambienteacademico.com.br/mod/quiz/view.php?id=509713&forceview=1
https://ambienteacademico.com.br/mod/quiz/view.php?id=509716&forceview=1
https://codely-fmu-content.s3.amazonaws.com/Moodle/GuiaDigital/Guia+digital/index.html
https://informa.fmu.br/carreiras/
https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html
https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html
https://portal.fmu.br/sustentabilidade

Continue navegando