Baixe o app para aproveitar ainda mais
Prévia do material em texto
18/11/2022 14:26 Colaborar - Av - Subst. 2 - Linguagem de Programação https://www.colaboraread.com.br/aluno/avaliacao/index/3349514602?atividadeDisciplinaId=13700593 1/5 Linguagem de Programação (/aluno/timelin… Av - Subst. 2 - Linguagem de Programação Sua avaliação foi confirmada com sucesso (/notific × Informações Adicionais Período: 15/11/2022 00:00 à 19/11/2022 23:59 Situação: Cadastrado Pontuação: 750 Protocolo: 811523539 Avaliar Material a) b) c) 1) O termo mineração de dados, segundo Castro (2016) pode ser definido como: "etapa do processo corresponde à aplicação de algoritmos capazes de extrair conhecimentos a partir dos dados pré- processados. Nessa etapa são usadas técnicas de análise descritiva (medidas de distribuição, tendência central e variância, e métodos de visualização), agrupamento (segmentação de bases de dados), predição (classificação e estimação), associação (determinação de atributos que ocorrem) e detecção de anomalias (CASTRO, p. 5, 2016). Sobre a utilização da biblioteca pandas voltada para o trabalho com dados na linguagem Python, avalie as asserções a seguir. I. Para mineração, transformação dos dados e extração de informações é preciso criar filtros. O comando df_dados['taxa'] < 0.01, retorna um DataFrame com o filtro aplicado a coluna. II. A criação de filtros booleanos compostos na biblioteca pandas, pode ser feita com os operadores lógicos. Nesse caso, usa-se o comando "and" para o o operador E e "or" para o operador OU. III. O comando df_dados.loc[df_dados['nome'] == "João"], retornará um novo DataFrame, contendo todos os registros cujo valor na coluna "nome" é João. Escolha a opção correta. Alternativas: Somente a asserção I está correta. Somente as asserções I e II estão corretas. Somente as asserções II e III estão corretas. https://www.colaboraread.com.br/aluno/timeline/index/3349514602?ofertaDisciplinaId=1843266 https://www.colaboraread.com.br/notificacao/index javascript:void(0); 18/11/2022 14:26 Colaborar - Av - Subst. 2 - Linguagem de Programação https://www.colaboraread.com.br/aluno/avaliacao/index/3349514602?atividadeDisciplinaId=13700593 2/5 d) e) a) b) c) d) e) 2) 3) Somente a asserção III está correta. Alternativa assinalada Todas as asserções estão corretas. Sob uma perspectiva de armazém de dados (data warehouse), o processo de mineração de dados pode ser visto como um estágio avançado do processamento analítico on-line (on-line analytical processing – OLAP). Entretanto, a mineração de dados vai muito além do escopo restrito típico de um OLAP, baseado em métodos de resumo ou sumarização de dados, incorporando técnicas mais avançadas para a compreensão e a extração de conhecimentos dos dados (CASTRO, p. 6, 2016). A Figura 1 apresenta um código que trabalha com dados em Python. Figura 1 - Trabalho com dados em Python Fonte: Elaborada pela autora. Considerando o código na Figura 1, julgue as afirmativas a seguir em (V) Verdadeiras ou (F) Falsas. I. ( ) O arquivo dados.csv é estruturado e seus campos são separados por vírgula. II. ( ) O DataFrame novo_df possui a quantidade de colunas igual ou menor que o DataFrame df. III. ( ) O DataFrame novo_df será substituído por um novo DataFrame, cuja quantidade de linhas será menor ou igual ao novo_df criado na linha 4. Escolha a opção correta Alternativas: V - V - V Alternativa assinalada V - V - F V - F - V F - V - V V - F - F De um modo geral, existem duas categorias de visualização de dados: exploração e explicação. Os dois servem a propósitos diferentes e, portanto, existem ferramentas e abordagens que podem ser apropriadas apenas para um e não para o outro. As visualizações exploratórias de dados são apropriadas quando você tem um monte de dados e não tem certeza do que está nele. Esse tipo de visualização geralmente faz parte da fase de análise de dados e é usado para encontrar a história que os dados têm para lhe contar (ILIINSKY e STEELE, 2011). A Figura 1 apresenta um gráfico gerado com biblioteca pandas. 18/11/2022 14:26 Colaborar - Av - Subst. 2 - Linguagem de Programação https://www.colaboraread.com.br/aluno/avaliacao/index/3349514602?atividadeDisciplinaId=13700593 3/5 a) b) c) d) e) 4) Figura 1 - Gráfico gerado com biblioteca pandas Fonte: Elaborada pela autora. Sobre o gráfico da Figura 1, julgue as afirmativas a seguir em (V) Verdadeiras ou (F) Falsas. I. ( ) Para gerar o gráfico foi necessário selecionar três colunas. II. ( ) O parâmetro "rot" foi alterado do seu valor padrão. III. ( ) No eixo x, foram usados os dados de uma coluna chamada "ANO". Escolha a opção correta. Alternativas: V - V - F V - F - V V - F - F F - V - V V - V - V Alternativa assinalada A visualização explicativa dos dados é apropriada quando você já sabe o que os dados têm a dizer e está tentando contar essa história para outra pessoa. Pode ser o chefe do seu departamento, um comitê de doações ou o público em geral. Quem quer que seja o público, a história que você está tentando contar (ou a resposta que você está tentando compartilhar) é conhecida por você desde o início e, portanto, você pode projetar para acomodar e destacar especificamente essa história. Em outras palavras, você precisa tomar certas decisões editoriais sobre quais informações ficam. Este é um processo de seleção de dados focados que darão suporte à história que você está tentando contar (ILIINSKY e STEELE, 2011). Figura 1 - Gráfico gerado com biblioteca pandas 18/11/2022 14:26 Colaborar - Av - Subst. 2 - Linguagem de Programação https://www.colaboraread.com.br/aluno/avaliacao/index/3349514602?atividadeDisciplinaId=13700593 4/5 a) b) c) d) e) a) b) c) 5) Fonte: Elaborada pela autora. Escolha a opção que contém o comando usado para gerar o gráfico da Figura 1. Alternativas: df_etanol[['ANO', 'JAN', 'FEV']].plot(x='ANO', kind='bar', figsize=(12, 5), rot=45, fontsize=12) Alternativa assinalada df_etanol.loc[['ANO', 'JAN', 'FEV']].plot(x='ANO', kind='bar', figsize=(12, 5), fontsize=12) df_etanol[['ANO', 'JAN', 'FEV']].plot(x='ANO', kind='barh', figsize=(12, 5), rot=45, fontsize=12) df_etanol.loc[['ANO', 'JAN', 'FEV']].plot(x='ANO', kind='barh', rot=45, figsize=(12, 5), fontsize=12) df_etanol['ANO', 'JAN', 'FEV'].plot(x='ANO', kind='bar', figsize=(12, 5), rot=45, fontsize=12) Uma visualização informativa serve principalmente ao relacionamento entre o leitor e os dados. Ele visa a uma apresentação neutra dos fatos de maneira a educar o leitor (embora não necessariamente o persuadir). As visualizações informativas são frequentemente associadas a amplos conjuntos de dados e buscam destilar o conteúdo de forma gerenciável e consumível. Idealmente, eles formam a maior parte das visualizações que a pessoa comum encontra no dia-a-dia, seja no trabalho, no jornal ou no site de um provedor de serviços (ILIINSKY e STEELE, 2011). Sobre a biblioteca seaborn, avalie as asserções a seguir. I. A biblioteca seaborn possui o método barplot(), que é usado para construir gráficos de barras. O parâmetro estimator=count é usado para construir uma barra contando a quantidade de elementos. II. O parâmetro "estimator" do método barplot(), possui como valor padrão a média, ou seja, para o dado selecionado, será exibida uma barra com a média dos valores. III. O parâmetro estimator=len, usado no método barplot() cria o mesmo gráfico da função countplot(). Escolha a opção correta. Alternativas: Somente a asserção III está correta. Somente as asserções I e II estão corretas. Somente as asserções I e III estão corretas. 18/11/2022 14:26 Colaborar - Av - Subst. 2 - Linguagem de Programação https://www.colaboraread.com.br/aluno/avaliacao/index/3349514602?atividadeDisciplinaId=13700593 5/5 d) e) Somente as asserções II e III estão corretas. Alternativa assinalada Todas as asserções estão corretas.
Compartilhar