Logo Passei Direto
Buscar
Material
páginas com resultados encontrados.
páginas com resultados encontrados.

Prévia do material em texto

Av - Subst. 2 - Linguagem de Programação
1)
O termo mineração de dados, segundo Castro (2016) pode ser definido como: "etapa do processo corresponde à aplicação de algoritmos capazes de extrair conhecimentos a partir dos dados pré-processados. Nessa etapa são usadas técnicas de análise descritiva (medidas de distribuição, tendência central e variância, e métodos de visualização), agrupamento (segmentação de bases de dados), predição (classificação e estimação), associação (determinação de atributos que ocorrem) e detecção de anomalias (CASTRO, p. 5, 2016).
 
Sobre a utilização da biblioteca pandas voltada para o trabalho com dados na linguagem Python, avalie as asserções a seguir.
I. Para mineração, transformação dos dados e extração de informações é preciso criar filtros. O comando df_dados['taxa'] < 0.01, retorna um DataFrame com o filtro aplicado a coluna.
II. A criação de filtros booleanos compostos na biblioteca pandas, pode ser feita com os operadores lógicos. Nesse caso, usa-se o comando "and" para o o operador E e "or" para o operador OU.
III. O comando df_dados.loc[df_dados['nome'] == "João"], retornará um novo DataFrame, contendo todos os registros cujo valor na coluna "nome" é João.
Escolha a opção correta.
Alternativas:
d)Somente a asserção III está correta.
2)
Sob uma perspectiva de armazém de dados (data warehouse), o processo de mineração de dados pode ser visto como um estágio avançado do processamento analítico on-line (on-line analytical processing – OLAP). Entretanto, a mineração de dados vai muito além do escopo restrito típico de um OLAP, baseado em métodos de resumo ou sumarização de dados, incorporando técnicas mais avançadas para a compreensão e a extração de conhecimentos dos dados (CASTRO, p. 6, 2016). A Figura 1 apresenta um código que trabalha com dados em Python.
 
Figura 1 - Trabalho com dados em Python
Fonte: Elaborada pela autora.
 
Considerando o código na Figura 1,
julgue as afirmativas a seguir em (V) Verdadeiras ou (F) Falsas.
I. (     ) O arquivo dados.csv é estruturado e seus campos são separados por vírgula.
II. (     ) O DataFrame novo_df possui a quantidade de colunas igual ou menor que o DataFrame df.
III. (     ) O DataFrame novo_df será substituído por um novo DataFrame, cuja quantidade de linhas será menor ou igual ao novo_df criado na linha 4.
Escolha a opção correta
Alternativas:
a)V - V - V
3)
De um modo geral, existem duas categorias de visualização de dados: exploração e explicação. Os dois servem a propósitos diferentes e, portanto, existem ferramentas e abordagens que podem ser apropriadas apenas para um e não para o outro. As visualizações exploratórias de dados são apropriadas quando você tem um monte de dados e não tem certeza do que está nele. Esse tipo de visualização geralmente faz parte da fase de análise de dados e é usado para encontrar a história que os dados têm para lhe contar (ILIINSKY e STEELE, 2011). A Figura 1 apresenta um gráfico gerado com biblioteca pandas.
 
Figura 1 - Gráfico gerado com biblioteca pandas
Fonte: Elaborada pela autora.
 
Sobre o gráfico da Figura 1, julgue as afirmativas a seguir em (V) Verdadeiras ou (F) Falsas.
I. (    ) Para gerar o gráfico foi necessário selecionar três colunas.
II. (    ) O parâmetro "rot" foi alterado do seu valor padrão.
III. (    ) No eixo x, foram usados os dados de uma coluna chamada "ANO".
Escolha a opção correta.
Alternativas:
e)V - V - V
4)
A visualização explicativa dos dados é apropriada quando você já sabe o que os dados têm a dizer e está tentando contar essa história para outra pessoa. Pode ser o chefe do seu departamento, um comitê de doações ou o público em geral. Quem quer que seja o público, a história que você está tentando contar (ou a resposta que você está tentando compartilhar) é conhecida por você desde o início e, portanto, você pode projetar para acomodar e destacar especificamente essa história. Em outras palavras, você precisa tomar certas decisões editoriais sobre quais informações ficam. Este é um processo de seleção de dados focados que darão suporte à história que você está tentando contar (ILIINSKY e STEELE, 2011).
 
Figura 1 - Gráfico gerado com biblioteca pandas
Fonte: Elaborada pela autora.
Escolha a opção que contém o comando usado para gerar o gráfico da Figura 1.
Alternativas:
a)df_etanol[['ANO', 'JAN', 'FEV']].plot(x='ANO', kind='bar', figsize=(12, 5), rot=45, fontsize=12)
5)
Uma visualização informativa serve principalmente ao relacionamento entre o leitor e os dados. Ele visa a uma apresentação neutra dos fatos de maneira a educar o leitor (embora não necessariamente o persuadir). As visualizações informativas são frequentemente associadas a amplos conjuntos de dados e buscam destilar o conteúdo de forma gerenciável e consumível. Idealmente, eles formam a maior parte das visualizações que a pessoa comum encontra no dia-a-dia, seja no trabalho, no jornal ou no site de um provedor de serviços (ILIINSKY e STEELE, 2011).
 
Sobre a biblioteca seaborn, avalie as asserções a seguir.
I. A biblioteca seaborn possui o método barplot(), que é usado para construir gráficos de barras. O parâmetro estimator=count é usado para construir uma barra contando a quantidade de elementos.
II.  O parâmetro "estimator" do método barplot(), possui como valor padrão a média, ou seja, para o dado selecionado, será exibida uma barra com a média dos valores.
III. O parâmetro estimator=len, usado no método barplot() cria o mesmo gráfico da função countplot().
Escolha a opção correta.
Alternativas:
d)Somente as asserções II e III estão corretas.

Mais conteúdos dessa disciplina