Baixe o app para aproveitar ainda mais
Prévia do material em texto
14/11/21, 02:02 Teste: Desafio do Módulo 2 https://online.igti.com.br/courses/3930/quizzes/43801/take 1/7 Desa�o do Módulo 2 Iniciado: 13 nov em 16:53 Instruções do teste O Desafio do Módulo 2 está disponível! 1. Instruções para realizar o desafio Consulte a data de entrega no teste e em seu calendário. Reserve um tempo para realizar a atividade, leia as orientações e enunciados com atenção. Em caso de dúvidas utilize o "Fórum de dúvidas do Desafio do Módulo 2". Para iniciá-lo clique em "Fazer teste". Você tem somente uma tentativa e não há limite de tempo definido para realizá-lo. Caso precise interromper a atividade, apenas deixe a página e, ao retornar, clique em "Retomar teste". Clique em "Enviar teste" somente quando você concluí-lo. Antes de enviar confira todas as questões. O gabarito será disponibilizado partir de sexta-feira, 19/11/2021, às 23h59. Bons estudos! 2. O arquivo abaixo contém o enunciado do desafio Enunciado do Desafio - Módulo 2 - Bootcamp Cientista de Dados.pdf 2,67 ptsPergunta 1 910 51110 67135 74100 Quantos registros existem no arquivo? 2,67 ptsPergunta 2 https://online.igti.com.br/courses/3930/files/243091/download?wrap=1 14/11/21, 02:02 Teste: Desafio do Módulo 2 https://online.igti.com.br/courses/3930/quizzes/43801/take 2/7 12 e 6 12 e 0 12 e 12 12 e 1 Quantas colunas existem no arquivo, e quantas são numéricas (inteiro ou ponto flutuante)? Ao ler o arquivo com spark.read.csv, habilite inferSchema=True. Use a função printSchema() da API de Dataframes. 2,67 ptsPergunta 3 40287 e 26848 40284 e 26841 40281 e 26843 40282 e 26842 No conjunto de dados, quantos pacientes tiveram derrame (stroke) e quantos não tiveram? 2,67 ptsPergunta 4 23711, 10807, 520, 5164. 520, 10807, 5164, 23711. A partir do dataframe, crie uma tabela temporária usando df.createOrReplaceTempView('table') e a seguir use spark.sql para escrever uma consulta SQL que obtenha quantos pacientes tiveram derrame por tipo de trabalho (work_type). Quantos pacientes sofreram derrame trabalhavam, respectivamente, no setor privado, de forma independente, no governo e quantas são crianças? 14/11/21, 02:02 Teste: Desafio do Módulo 2 https://online.igti.com.br/courses/3930/quizzes/43801/take 3/7 23711, 10807, 5164, 520. 10807, 23711, 5164, 520. 2,67 ptsPergunta 5 Feminina. Homens e mulheres foram estudados na mesma proporção. Outro gênero. Masculina. Escreva uma consulta com spark.sql para determinar a proporção, por gênero, de participantes do estudo. A maioria dos participantes é: 2,67 ptsPergunta 6 A hipertensão, neste conjunto de dados, aumenta a probabilidade de derrame. A hipertensão, neste conjunto de dados, diminui a probabilidade de derrame. Não é possível extrair esta informação do conjunto de dados. As probabilidades de derrame não são afetadas por este atributo. Escreva uma consulta com spark.sql para determinar quem tem mais probabilidade de sofrer derrame: hipertensos ou não-hipertensos. Você pode escrever uma consulta para cada grupo. A partir das probabilidades que você obteve, você conclui que: 2,67 ptsPergunta 7 Escreva uma consulta com spark.sql que determine o número de pessoas que sofreram derrame por idade. Com qual idade o maior número de pessoas do 14/11/21, 02:02 Teste: Desafio do Módulo 2 https://online.igti.com.br/courses/3930/quizzes/43801/take 4/7 80 79 78 81 conjunto de dados sofreu derrame? 2,67 ptsPergunta 8 30189 28938 31091 26121 Usando a API de dataframes, determine quantas pessoas sofreram derrames após os 50 anos. 2,67 ptsPergunta 9 136 e 130 128 e 100 119 e 103 120 e 91 Usando spark.sql, determine qual o nível médio de glicose para pessoas que, respectivamente, sofreram e não sofreram derrame. 2,67 ptsPergunta 10 wande Realce 14/11/21, 02:02 Teste: Desafio do Módulo 2 https://online.igti.com.br/courses/3930/quizzes/43801/take 5/7 30,01 e 29,98 28,91 e 28,72 29,81 e 27,86 28,01 e 27,81 Qual é o BMI (IMC = índice de massa corpórea) médio de quem sofreu e não sofreu derrame? 2,67 ptsPergunta 11 Menor que 70%. Menor que 50%. Menor que 30%. Menor que 10%. Crie um modelo que contém apenas uma variável preditora: uma coluna aleatória. Você pode adicionar uma coluna aleatória ao seu dataframe da seguinte forma: df = df.withColumn("random", rand()) df.describe('random').show() Qual a acurácia de um modelo construído apenas a partir de uma variável preditora aleatória? 2,67 ptsPergunta 12 Ajuste um modelo de árvore de decisão a partir de pelo menos as seguintes variáveis: gênero, fuma / não fuma, BMI, idade, hipertensão, doença do coração, nível médio de glicose. A acurácia deste modelo ficou entre: wande Realce 14/11/21, 02:02 Teste: Desafio do Módulo 2 https://online.igti.com.br/courses/3930/quizzes/43801/take 6/7 Acima de 80%. Acima de 60%. Acima de 70%. Acima de 95%. 2,67 ptsPergunta 13 Ter doença cardíaca. Ter hipertensão. Status sobre fumo. Nível médio de glicose. Qual destas variáveis é mais importante no modelo de árvore de decisão que você construiu? 2,67 ptsPergunta 14 Menor que 1. Menor que 2. Maior que 5. Entre 2 e 5. Qual a profundidade da árvore de decisão? 2,62 ptsPergunta 15 Quantos atributos foram considerados na árvore? 14/11/21, 02:02 Teste: Desafio do Módulo 2 https://online.igti.com.br/courses/3930/quizzes/43801/take 7/7 Salvo em 2:01 Mais que 5. 3. 1. 2. Enviar teste
Compartilhar