Buscar

Teste_ Desafio do Módulo 2

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 7 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 7 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

14/11/21, 02:02 Teste: Desafio do Módulo 2
https://online.igti.com.br/courses/3930/quizzes/43801/take 1/7
Desa�o do Módulo 2
Iniciado: 13 nov em 16:53
Instruções do teste
O Desafio do Módulo 2 está disponível!
1. Instruções para realizar o desafio
Consulte a data de entrega no teste e em seu calendário.
Reserve um tempo para realizar a atividade, leia as orientações e enunciados com atenção. Em
caso de dúvidas utilize o "Fórum de dúvidas do Desafio do Módulo 2".
Para iniciá-lo clique em "Fazer teste". Você tem somente uma tentativa e não há limite de tempo
definido para realizá-lo. Caso precise interromper a atividade, apenas deixe a página e, ao retornar,
clique em "Retomar teste".
Clique em "Enviar teste" somente quando você concluí-lo. Antes de enviar confira todas as
questões.
O gabarito será disponibilizado partir de sexta-feira, 19/11/2021, às 23h59.
Bons estudos!
2. O arquivo abaixo contém o enunciado do desafio
Enunciado do Desafio - Módulo 2 - Bootcamp Cientista de Dados.pdf
2,67 ptsPergunta 1
910
51110
67135
74100
Quantos registros existem no arquivo?
2,67 ptsPergunta 2
https://online.igti.com.br/courses/3930/files/243091/download?wrap=1
14/11/21, 02:02 Teste: Desafio do Módulo 2
https://online.igti.com.br/courses/3930/quizzes/43801/take 2/7
12 e 6
12 e 0
12 e 12
12 e 1
Quantas colunas existem no arquivo, e quantas são numéricas (inteiro ou ponto
flutuante)? Ao ler o arquivo com spark.read.csv, habilite inferSchema=True. Use a
função printSchema() da API de Dataframes.
2,67 ptsPergunta 3
40287 e 26848
40284 e 26841
40281 e 26843
40282 e 26842
No conjunto de dados, quantos pacientes tiveram derrame (stroke) e quantos não
tiveram?
2,67 ptsPergunta 4
23711, 10807, 520, 5164.
520, 10807, 5164, 23711.
A partir do dataframe, crie uma tabela temporária usando
df.createOrReplaceTempView('table') e a seguir use spark.sql para escrever uma
consulta SQL que obtenha quantos pacientes tiveram derrame por tipo de
trabalho (work_type). Quantos pacientes sofreram derrame trabalhavam,
respectivamente, no setor privado, de forma independente, no governo e quantas
são crianças?
14/11/21, 02:02 Teste: Desafio do Módulo 2
https://online.igti.com.br/courses/3930/quizzes/43801/take 3/7
23711, 10807, 5164, 520.
10807, 23711, 5164, 520.
2,67 ptsPergunta 5
Feminina.
Homens e mulheres foram estudados na mesma proporção.
Outro gênero.
Masculina.
Escreva uma consulta com spark.sql para determinar a proporção, por gênero, de
participantes do estudo. A maioria dos participantes é:
2,67 ptsPergunta 6
A hipertensão, neste conjunto de dados, aumenta a probabilidade de derrame.
A hipertensão, neste conjunto de dados, diminui a probabilidade de derrame.
Não é possível extrair esta informação do conjunto de dados.
As probabilidades de derrame não são afetadas por este atributo.
Escreva uma consulta com spark.sql para determinar quem tem mais
probabilidade de sofrer derrame: hipertensos ou não-hipertensos. Você pode
escrever uma consulta para cada grupo. A partir das probabilidades que você
obteve, você conclui que:
2,67 ptsPergunta 7
Escreva uma consulta com spark.sql que determine o número de pessoas que
sofreram derrame por idade. Com qual idade o maior número de pessoas do
14/11/21, 02:02 Teste: Desafio do Módulo 2
https://online.igti.com.br/courses/3930/quizzes/43801/take 4/7
80
79
78
81
conjunto de dados sofreu derrame?
2,67 ptsPergunta 8
30189
28938
31091
26121
Usando a API de dataframes, determine quantas pessoas sofreram derrames
após os 50 anos.
2,67 ptsPergunta 9
136 e 130
128 e 100
119 e 103
120 e 91
Usando spark.sql, determine qual o nível médio de glicose para pessoas que,
respectivamente, sofreram e não sofreram derrame.
2,67 ptsPergunta 10
wande
Realce
14/11/21, 02:02 Teste: Desafio do Módulo 2
https://online.igti.com.br/courses/3930/quizzes/43801/take 5/7
30,01 e 29,98
28,91 e 28,72
29,81 e 27,86
28,01 e 27,81
Qual é o BMI (IMC = índice de massa corpórea) médio de quem sofreu e não
sofreu derrame?
2,67 ptsPergunta 11
Menor que 70%.
Menor que 50%.
Menor que 30%.
Menor que 10%.
Crie um modelo que contém apenas uma variável preditora: uma coluna aleatória.
Você pode adicionar uma coluna aleatória ao seu dataframe da seguinte forma:
 
df = df.withColumn("random", rand())
df.describe('random').show()
 
Qual a acurácia de um modelo construído apenas a partir de uma variável
preditora aleatória?
2,67 ptsPergunta 12
 Ajuste um modelo de árvore de decisão a partir de pelo menos as seguintes
variáveis: gênero, fuma / não fuma, BMI, idade, hipertensão, doença do coração,
nível médio de glicose. A acurácia deste modelo ficou entre:
wande
Realce
14/11/21, 02:02 Teste: Desafio do Módulo 2
https://online.igti.com.br/courses/3930/quizzes/43801/take 6/7
Acima de 80%.
Acima de 60%.
Acima de 70%.
Acima de 95%.
2,67 ptsPergunta 13
Ter doença cardíaca.
Ter hipertensão.
Status sobre fumo.
Nível médio de glicose.
Qual destas variáveis é mais importante no modelo de árvore de decisão que
você construiu?
2,67 ptsPergunta 14
Menor que 1.
Menor que 2.
Maior que 5.
Entre 2 e 5.
Qual a profundidade da árvore de decisão?
2,62 ptsPergunta 15
 Quantos atributos foram considerados na árvore?
14/11/21, 02:02 Teste: Desafio do Módulo 2
https://online.igti.com.br/courses/3930/quizzes/43801/take 7/7
Salvo em 2:01 
Mais que 5.
3.
1.
2.
Enviar teste

Continue navegando