Baixe o app para aproveitar ainda mais
Prévia do material em texto
� Bases Computacionais da Ciência (BC-0005) Bases de Dados David Correa Martins Jr david.martins@ufabc.edu.br Universidade Federal do ABC (UFABC) Motivação � Nos tempos atuais, convivemos com a necessidade constante de interação e manipulação de dados � Muitas atividades rotineiras estão invariavelmente ligadas a operações diversas de gerenciamento de dados, tais como: � Tratamento � Armazenamento � Apresentação � Interpretação � Geração ou recuperação Motivação � Após a revolução causada pela Internet: � O acesso à informação tornou-se mais fácil, amplo e democrático � Provocou um sério e crescente problema de organização de dados � Necessidade de prover melhores maneiras de tratá-los Motivação “Banco de dados” Dados na nuvem Objetivos da aula O objetivos desta aula são: � Introduzir a idéia de bases de dados � Entender a relação existente entre informação e dado � Compreender a importância: � da escolha das formas de representação de dados � do controle de qualidade da base de dados � da organização dos dados � do planejamento voltado para uma correta utilização futura � Construir bases de dados simples Objetivos da aula � A objetivo desta aula NÃO é discutir formas mais avançadas de modelagem de dados. modelagem relacional → Arquivos flat Base/Gerenciamento de dados � Base de Dados � Empregadas em computadores e sistemas de informática. � É uma forma de representação que possibilita controle de qualidade, organização e planejamento dos dados. � Gerenciamento de dados trata do � Armazenamento, � Organização, e � Recuperação (buscas, consultas). � Disciplinas de Computação estudam a forma de representação (modelagem de dados) e o uso de sistemas de gerenciamento de banco de dados (SGBD). Dados e informações Dado = Símbolo; qualquer elemento que possa ser processado por um computador. Ex.: números, caracteres, imagens, código de barras: Informação = Significado; interpretação do dado, tornando-os significativos em algum contexto. Ex.: código de barras identifica um livro, um vinho ou uma nota fiscal: Base de dados � Base de dados: qualquer conjunto/coleção de dados cujo conteúdo se deseja armazenar, recuperar e visualizar. � Exemplo (sem uso de computador): Lista de supermercado é uma base simples. � Principais características: � Armazenamento (persistente): permite uso futuro. � Recuperação: acesso deve ser fácil. � Visualização: forma de apresentação. Base de dados Exemplo (sistemas computacionais): problemas maiores como controle de clientes, correntistas, alunos etc. Características para grande volume de dados e grande quantidade de usuários: � Compartilhamento: troca de informação entre usuários; acesso compartilhado aos dados. � Segurança de infra-estrutura (garante funcionamento do hardware) e de acesso (controla permissões de usuários). � Regras de Consistência: garantem coerência e qualidade dos dados; evitam valores inválidos. Conceitos básicos � Dados = “elementos de interesse coletados” − números, caracteres, imagens etc. � Banco de Dados (BD) = “coleção de dados” − potencialmente muito grande e logicamente relacionados (integrados) Conceitos básicos � Sistema Gerenciador de Bancos de Dados (SGBD) = “software de propósito geral” − facilita a definição, a criação e a manipulação do BD − Exs.: Access, DB2, Oracle, SQLServer, BrOfficeBase, etc. � Sistema de Banco de Dados (SBD) = “BD + SGBD + programas aplicativos” − Exs.: sistemas de BD genômicos, sistemas bancários, telefônicos. Sistema de banco de dados Objetivos: armazenar e recuperar informações com segurança, eficiência e flexibilidade Usuários/Programadores Consulta/Programas de Aplicações Software p/ processar consultas/programas Software p/ acessar o banco de dados SGBD SBD Banco de Dados Organização dos Dados Organização de dados com planilha Planilhas são constituídas de TABELAS (matrizes de dados), sendo úteis para organizar dados, fazer cálculos com esses dados e apresentar gráficos. Vantagens: - Facilita visualização global dos dados. - Identifica a posição de cada item de dado (linhas) - Identifica os atributos dos dados (colunas) Exemplo: base de dados (lista de supermercado) Organização de dados com planilha � Linhas da tabela: � Armazenam itens de dados � Colunas da tabela: � Armazenam atributos (propriedades ou características) vinculados a cada item de dado armazenado nas linhas Elementos de uma tabela de dados Tabela: conjunto de tuplas Colunas: atributos Linhas: tuplas, itens de dados ou instâncias Campos: valores dos atributos Tabelas como base de dados Regras de Consistência � Não pode haver linha em branco entre os rótulos e a última linha de dados. � Cada coluna (atributo) possui um único rótulo (nome). � Os rótulos ficam todos no topo da tabela. Regras de Validação � Restringe valores e tipos de dados em cada coluna. � Evita digitação de valores inválidos Tipos de dados e domínio Tipo: evita entrar tipo errado de dado � Número: inteiro (1, 2, 3 …), fracionário (1,23), etc. � Texto (cadeias de caracteres): “José Silva”. � Moeda: 120,00, R$ 12,0 etc. � Data: 13/06/2011 (DD/MM/AAAA). � Hora: 12:45:00 (hh:mm:ss). � Lógico: VERDADEIRO, FALSO. Domínio: evita entrar com valor inválido de dado Exemplos: Arquivos estruturados � Arquivos estruturados (ou flat files) são arquivos de dados organizados sob uma estrutura rígida e pré-definida � Os arquivos estruturados são muito usados para a troca de dados entre sistemas computacionais diferentes. � Definem-se caracteres que exercerão o papel de delimitadores de linha e de coluna Arquivos estruturados � Por exemplo, podemos assumir � O caractere ‘;’ como separador de colunas � O caractere quebra de linha como separador de linhas � Note que, obrigatoriamente, todas as linhas possuem cinco(5) separadores de coluna, evidenciando que a tabela possui seis(6) colunas � Esse formato é uma variação do conhecido CSV (Comma-Separated Values), em que as vírgulas (,) são usadas como separadores de colunas � Como nosso exemplo usa vírgulas na coluna Preço para compor o valor (fracionário), não podemos usá-las diretamente como separador CSV: comma separated values Parte Prática Parte Prática: LibreOffice � Cálculos e gráficos em programas de planilhas � Todos os procedimentos apresentados aqui podem ser realizados em qualquer programa de planilha. � O pacote LibreOffice pode ser baixado para uso livre em casa do endereço http://www.libreoffice.org/ � Abre (botão início): � → programas→ LibreOffice→ LibreOffice Calc Clique no menu Inserir >> Planilha do arquivo e escolha o arquivo atividade1.csv (Tidia >> Repositório >> Aula 4). Trata-se de um arquivo texto com os dados separados por ponto e vírgula Selecione os dados das colunas Produto, Fabricante, Medida e Supermercado Formatar >> Formatar células Tipo de dado: Texto Repita para as colunas Qtd., Preço e Data, atribuindo, respectivamente, os tipos Número (Geral), Moeda (Português Brasil) e Data Para evitar que sejam introduzidos dados inválidos, ainda é possível definir um domínio para os dados. Por exemplo, selecione os dados da coluna Qtd e clique no menu Dados >> Validação Irá aparecer a janela abaixo na qual se escolheu: Permitir Números Inteiros, Permitir Células em Branco, Intervalo Válido (ou Dados entre), no Mínimo 0 e, no Máximo, 100. Clique na aba Alerta de erro e deixe ativado Mostrar mensagem de erro... No campo Mensagem de erro, digite uma mensagem bem informativa. Agora experimente digitar um valor inválido na coluna Qtd... Selecione toda a tabela e clique no menuDados >> Classificar. Como primeiro critério escolha Classificar por Produto (Coluna A). E, em seguida, por Fabricante (Coluna B). Ambos em ordem Crescente. Clique em OK e veja o resultado... Selecione toda a tabela e clique no menu Dados >> Subtotais. Escolha Agrupar por Produto, Calcular subtotais de Preço e Utilizar função Soma. Clique no botão OK. Agora você tem um relatório com o subtotal gasto em cada produto e, no final, total geral. Os subtotais podem ser removidos abrindo novamente a janela Subtotais e acionando o botão Excluir. Alternativamente, pode-se empregar o atalho Ctrl-z para desfazer a operação Atividade 6 Planilha: notas-bc0005.ods (Tidia, Repositorio>>Aula 4) Atividade 6 Planilha: notas-bc0005.ods -Qual é a nota média (e desvio padrão) das turmas de BCH e BCT? -Qual é a máxima nota em cada turma de BCH e BCT? -Qual é o número de horas totais que todos os alunos estudaram? -Qual é o número médio de horas de estudo de cada aluno? Atividade 6 Mostre o gráfico de dispersão e interprete os dados. - Existe correlação positiva entre notas e horas de estudo? • Calcule o coeficiente de correlação. •Mostre a linha de tendência. 0 2 4 6 8 10 12 0 5 10 15 20 25 30 35 40 45 50 f(x) = 3,31x + 8,74 Nota H o r a s d e e s t u d o Atividade 7 Avaliação da Produção Acadêmica de um Grupo des Pesquisadores. Arquivo: publicacoes-qualis.ods (Tidia, Repositório>>Aula 4) - Planilha: publicacoes (produção do grupo) - Planilha: notas (~ peso de cada revista) Atividade 7 A) Associe as notas (planilha notas) na lista de publicacoes (planilha publicacoes) usando a função PROCV(). Atividade 7 A) Associe as notas (planilha notas) na lista de publicacoes (planilha publicacoes) usando a função PROCV(). - Primeiramente, usando o PROCV() vamos fazer com que o Qualis da primeira publicação apareça na célula correspondente em Publicacoes de acordo com a informação do Qualis da revista encontrado na planilha Notas Atividade 7 A) Com a célula selecionada, clique em Inserir Função e selecione PROCV() Atividade 7 A) Critério de pesquisa: por quem estamos procurando? - Nesse caso, procuramos pelo nome da revista na célula D2 Atividade 7 A) matriz: onde vamos procurar? - Nesse caso, procuramos na planilha Notas (clique e arraste para selecionar toda a planilha) Atividade 7 A) Índice: Qual é o índice da coluna resultante que contém o valor desejado? - Nesse caso, queremos o resultado do Qualis, que é a terceira coluna da seleção (ou seja, 3) Atividade 7 A) Sucesso! - Agora, falta aplicar a mesma função para todo o restante das linhas: basta clicar no quadradinho preto na célula atual e arrastar para baixo até abranger todas as linhas Atividade 7 A) Quase! Temos um pequeno problema... - Algumas células estão com #NDISP (não disponível)! Por quê??? Atividade 7 A) Quase! Temos um pequeno problema... - Eis a raiz do problema! A) Quase! Temos um pequeno problema... - Eis a raiz do problema! - Ao clicar e arrastar para copiar e colar todas as funções em todas as linhas de uma mesma coluna, os índices das linhas acompanham - Precisamos então fixar os índices da matriz selecionada Notas - Para isso, podemos usar o símbolo ‘$’ para fixar os índices Atividade 7 A) Acrescentando ‘$’ nos índices da planilha Notas Atividade 7 A) Clicando no quadradinho e arrastando, voilá! Deu certo! Atividade 7 B) Crie uma tabela de frequências de notas usando a função CONT.SE() e gere o histograma correspondente Atividade 7 Atividades para Casa • Capítulo 5 do livro – Slides da aula 4 (referentes ao capítulo 5 do livro) • Tidia, seção Repositório – Estudar e fazer os exercícios • Prova 1 na próxima aula (03/09) – Revisar todo o conteúdo das 4 primeiras aulas
Compartilhar