Colaborar - Av - Subst 2 - Linguagem de Programação

•

UNOPAR

9

0

9

0

bruno.santos

04/06/2022

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 5 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Linguagem de Programação.

8.711 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

Av - Subst. 2 - Linguagem de Programação 
 
 
 
 
1) O termo mineração de dados, segundo Castro (2016) pode ser definido como: "etapa do processo 
corresponde à aplicação de algoritmos capazes de extrair conhecimentos a partir dos dados pré-processados. 
Nessa etapa são usadas técnicas de análise descritiva (medidas de distribuição, tendência central e variância, e 
métodos de visualização), agrupamento (segmentação de bases de dados), predição (classificação e estimação), 
associação (determinação de atributos que ocorrem) e detecção de anomalias (CASTRO, p. 5, 2016). 
 
Sobre a utilização da biblioteca pandas voltada para o trabalho com dados na linguagem Python, avalie as 
asserções a seguir. 
I. Para mineração, transformação dos dados e extração de informações é preciso criar filtros. O 
comando df_dados['taxa'] < 0.01, retorna um DataFrame com o filtro aplicado a coluna. 
II. A criação de filtros booleanos compostos na biblioteca pandas, pode ser feita com os operadores lógicos. 
Nesse caso, usa-se o comando "and" para o o operador E e "or" para o operador OU. 
III. O comando df_dados.loc[df_dados['nome'] == "João"], retornará um novo DataFrame, contendo todos os 
registros cujo valor na coluna "nome" é João. 
Escolha a opção correta. 
 
Alternativas: 
 
a) Somente a asserção I está correta. 
 
b) Somente as asserções I e II estão corretas. 
 
c) Somente as asserções II e III estão corretas. 
d) Somente a asserção III está correta. Alternativa assinalada 
e) Todas as asserções estão corretas. 
 
 
3) De um modo geral, existem duas categorias de visualização de dados: exploração e explicação. Os dois 
servem a propósitos diferentes e, portanto, existem ferramentas e abordagens que podem ser apropriadas 
apenas para um e não para o outro. As visualizações exploratórias de dados são apropriadas quando você tem 
um monte de dados e não tem certeza do que está nele. Esse tipo de visualização geralmente faz parte da fase 
de análise de dados e é usado para encontrar a história que os dados têm para lhe contar (ILIINSKY e STEELE, 
2011). A Figura 1 apresenta um gráfico gerado com biblioteca pandas. 
Figura 1 - Gráfico gerado com biblioteca pandas 
2) Sob uma perspectiva de armazém de dados (data warehouse), o processo de mineração de dados pode ser 
visto como um estágio avançado do processamento analítico on-line (on-line analytical processing – OLAP). 
Entretanto, a mineração de dados vai muito além do escopo restrito típico de um OLAP, baseado em métodos de 
resumo ou sumarização de dados, incorporando técnicas mais avançadas para a compreensão e a extração de 
conhecimentos dos dados (CASTRO, p. 6, 2016). A Figura 1 apresenta um código que trabalha com dados em 
Python. 
 
Figura 1 - Trabalho com dados em Python 
 
 
 
 
 
 
Fonte: Elaborada pela autora. 
 
Considerando o código na Figura 1, 
julgue as afirmativas a seguir em (V) Verdadeiras ou (F) Falsas. 
I. ( ) O arquivo dados.csv é estruturado e seus campos são separados por vírgula. 
II. ( ) O DataFrame novo_df possui a quantidade de colunas igual ou menor que o DataFrame df. 
III. ( ) O DataFrame novo_df será substituído por um novo DataFrame, cuja quantidade de linhas será menor ou 
igual ao novo_df criado na linha 4. 
Escolha a opção correta 
 
Alternativas: 
 
a) V - V - V Alternativa assinalada 
b) V - V - F 
c) V - F - V 
d) F - V - V 
e) V - F - F 
 
 
4) A visualização explicativa dos dados é apropriada quando você já sabe o que os dados têm a dizer e está 
tentando contar essa história para outra pessoa. Pode ser o chefe do seu departamento, um comitê de doações 
ou o público em geral. Quem quer que seja o público, a história que você está tentando contar (ou a resposta 
que você está tentando compartilhar) é conhecida por você desde o início e, portanto, você pode projetar para 
acomodar e destacar especificamente essa história. Em outras palavras, você precisa tomar certas decisões 
editoriais sobre quais informações ficam. Este é um processo de seleção de dados focados que darão suporte à 
história que você está tentando contar (ILIINSKY e STEELE, 2011). 
Figura 1 - Gráfico gerado com biblioteca pandas 
 
 
 
 
 
 
 
 
 
 
 
Fonte: Elaborada pela autora. 
 
Sobre o gráfico da Figura 1, julgue as afirmativas a seguir em (V) Verdadeiras ou (F) Falsas. 
I. ( ) Para gerar o gráfico foi necessário selecionar três colunas. 
II. ( ) O parâmetro "rot" foi alterado do seu valor padrão. 
III. ( ) No eixo x, foram usados os dados de uma coluna chamada "ANO". 
Escolha a opção correta. 
 
Alternativas: 
 
V - V - F 
a) 
 
V - F - V 
b) 
 
c) V - F - F 
d) F - V - V 
e) V - V - V Alternativa assinalada 
 
 
 
 
5) Uma visualização informativa serve principalmente ao relacionamento entre o leitor e os dados. Ele visa a 
uma apresentação neutra dos fatos de maneira a educar o leitor (embora não necessariamente o persuadir). As 
visualizações informativas são frequentemente associadas a amplos conjuntos de dados e buscam destilar o 
conteúdo de forma gerenciável e consumível. Idealmente, eles formam a maior parte das visualizações que a 
pessoa comum encontra no dia-a-dia, seja no trabalho, no jornal ou no site de um provedor de serviços (ILIINSKY 
e STEELE, 2011). 
 
Sobre a biblioteca seaborn, avalie as asserções a seguir. 
I. A biblioteca seaborn possui o método barplot(), que é usado para construir gráficos de barras. O parâmetro 
estimator=count é usado para construir uma barra contando a quantidade de elementos. 
II. O parâmetro "estimator" do método barplot(), possui como valor padrão a média, ou seja, para o dado 
selecionado, será exibida uma barra com a média dos valores. 
III. O parâmetro estimator=len, usado no método barplot() cria o mesmo gráfico da função countplot(). 
Escolha a opção correta. 
 
Alternativas: 
 
a) Somente a asserção III está correta. 
 
b) Somente as asserções I e II estão corretas. 
 
c) Somente as asserções I e III estão corretas. 
d) Somente as asserções II e III estão corretas. Alternativa assinalada 
Fonte: Elaborada pela autora. 
Escolha a opção que contém o comando usado para gerar o gráfico da Figura 1. 
Alternativas: 
 
a) df_etanol[['ANO', 'JAN', 'FEV']].plot(x='ANO', kind='bar', figsize=(12, 5), rot=45, fontsize=12) Alternativa assinalada 
b) df_etanol.loc[['ANO', 'JAN', 'FEV']].plot(x='ANO', kind='bar', figsize=(12, 5), fontsize=12) 
c) df_etanol[['ANO', 'JAN', 'FEV']].plot(x='ANO', kind='barh', figsize=(12, 5), rot=45, fontsize=12) 
d) df_etanol.loc[['ANO', 'JAN', 'FEV']].plot(x='ANO', kind='barh', rot=45, figsize=(12, 5), fontsize=12) 
e) df_etanol['ANO', 'JAN', 'FEV'].plot(x='ANO', kind='bar', figsize=(12, 5), rot=45, fontsize=12) 
 
e) Todas as asserções estão corretas.