Baixe o app para aproveitar ainda mais
Prévia do material em texto
INTRODUÇÃO E COLETA DE DADOS UNIVERSIDADE DO ESTADO DO RIO DE JANEIRO INSTITUTO DE QUÍMICA DEPARTAMENTO DE QUÍMICA ANALÍTICA INTRODUÇÃO À QUIMIOMETRIA INTRODUÇÃO o Estatística é uma área da Matemática que tem por objetivo organizar, descrever e analisar dados, determinando correlações entre estes, de forma a que, com base na descrição e explicação de comportamento passados, se possam prever comportamentos futuros. o Aplicações em diversas áreas: � Psicologia: Psicometria. � Biologia: Biometria. � Economia: Econometria. � Química: Quimiometria. INTRODUÇÃO Químico (Concepção geral) Químico (Concepção atual) Quimiometria Avanço tecnológico e instrumental Bruce R. Kowalski, Jurs, Kowalski, Isenhour e Reilly Diversos trabalhos na década de 60 utilizando métodos inovadores no tratamento de dados químicos. Quimiometria - Termo quimiometria = primeira vez por Svant Wold, em 1971 - Em sueco kemometri, porém foi Bruce Kowalski quem definiu a quimiometria como um novo ramo da química. Definição da quimiometria (de acordo com Wold): A disciplina da química que usa matemática, estatística e lógica formal para: a) procedimentos de planejamento e otimização de experimentos; b) prover de informação química relevante através de análise de dados químicos e c) obter conhecimento sobre sistemas químicos. Quimiometria INTRODUÇÃO o Areas da Quimiometria: � Planejamento e otimização de experimentos (conteúdo abordado em Quimiometria I) � Análise exploratória � Reconhecimento de padrões � Calibração multivariada � Seleção de variáveis � Processamento de sinais � Inteligência artificial � Relação estrutura química-atividade biológica (QSAR) INTRODUÇÃO o Algumas aplicações: � Apresentar, descrever dados e informações de um negócio adequadamente. � Tirar conclusões sobre grandes populações usando informações coletadas das amostras. � Fazer previsões confiáveis sobre a atividade empresarial. � Melhorar os processos dos negócios. INTRODUÇÃO Estatística: Descritiva: Coleta, sintetiza e apresenta os dados. Inferencial: Utiliza dados de amostras para tirar conclusões sobre uma população ESTATÍSTICA DESCRITIVA o Coleta de dados: Pesquisa o Apresentação dos dados: Tabelas e gráficos o Caracterização dos dados: Média amostral ESTATÍSTICA INFERENCIAL o Estimação: Estimar a altura média da população usando a altura média amostral. o Teste de Hipóteses: Teste a afirmação de que a altura média da população é 1,80 m. ALGUMAS DEFINIÇÕES o Variável: Corresponde a uma característica de um item ou de indivíduo (ex: índice de refração, massa, temperatura, etc). o Dados: Valores diferentes associados com uma variável (ex: valores de massa, valores de temperatura, valores de índice de refração). o População: Consiste em todos os itens ou indivíduos, com pelo menos uma característica em comum, em relação aos quais você deseja tirar uma conclusão. ALGUMAS DEFINIÇÕES o Amostra: corresponde à parcela da população selecionada para análise. o Parâmetro: medida numérica que descreve uma característica de uma população. É um operador que ajuda na produção de uma visão global dos dados. o Estatística: medida numérica que descreve uma característica de uma amostra. POPULAÇÃO X AMOSTRA o População: Conjunto de pessoas, itens ou eventos sobre os quais você quer fazer inferências. Totalidade! Nem sempre é conveniente ou possível examinar todos os membros de uma população inteira! o Amostra: Subconjunto de pessoas, itens ou eventos de uma população maior que você coleta e analisa para fazer inferências. População Amostra Exemplo: Intenção de votos Se a amostra é aleatória e grande o suficiente, é possível usar as informações coletadas a partir da amostra para fazer inferências sobre a população. COLETA DE DADOS a. Avaliação da eficácia de um novo anúncio de televisão. b. Verificação da eficácia de um novo medicamento c. Monitoração de um processo de fabricação (controle de qualidade) d. Auditoria fiscal (verificação de contas) FONTE DE DADOS o Fontes Primárias: O coletor dos dados é um dos pesquisadores que utiliza os dados para análise � Dados de uma pesquisa política. � Dados coletados de um experimentalista. FONTE DE DADOS o Fontes Secundárias: A pessoa que executa a análise de dados não é o coletor dos dados. � Dados do censo. � Examinando dados de periódicos impressos ou dados publicados na internet. TIPOS DE VARIÁVEIS o Variável Categórica (variável qualitativa) é aquela que somente apresenta valores que só podem ser colocados em categorias, tais como "sim" e "não". o Questão: Você é solteiro? Você tem carro? o Variável Numérica (variável quantitativa) é aquela que têm valores que representam quantidades. o Questão: Qual é a sua idade? Qual o seu peso? TIPOS DE VARIÁVEIS Dados Categóricos Numéricos Discretos Contínuos � Estado Civil � Time de futebol � Cor dos olhos � Número de filhos � Defeitos por hora (Itens Contados) � Massa � Potencial Elétrico (Medidas características) NÍVEIS DE MENSURAÇÃO o Escalas nominais: � Escalas qualitativas (dados representados por etiquetas) em que não existe uma ordem para os resultados que o fenômeno pode ter. � Classificam os dados em categorias distintas no qual nenhum posicionamento está implícito. NÍVEIS DE MENSURAÇÃO Varáveis categóricas Categorias Possui computador de uso pessoal? Sim / Não Tipo de conta bancária Corrente / Poupança Provedor de Internet NetVirtua / Oi Velox / GVT Tabela 1: Exemplos de variáveis categóricas NÍVEIS DE MENSURAÇÃO o Escalas ordinais: � Utilizam um critério lógico e consensual. � Estabelecem uma ordem entre os resultados possíveis. � Classificam os dados em categorias distintas no qual o posicionamento está implícito. NÍVEIS DE MENSURAÇÃO Variável categórica Categorias ordenadas Alunos na faculdade Calouro, Veterano Satisfação com o produto Totalmente Insatisfeito, Insatisfeito, Satisfeito, Muito Satisfeito, Totalmente Satisfeito Notas dos alunos, da pós- graduação (PPGEQ-UERJ) A, B, C, D Tabela 2: Exemplos de variáveis categóricas NÍVEIS DE MENSURAÇÃO Variável numérica Nível de mensuração Temperatura (ºC) Intervalo Resultado de um exame padronizado (ex.: SAT) Intervalo Altura de uma pessoa (cm) Razão Peso de uma pessoa (kg) Razão Idade (anos ou meses) Razão Salário (real ou dólar) Razão Tabela 3: Exemplos de escala intervalar e de razão CRIAÇÃO DE BASE DE DADOS EFICIENTE o Associe as variáveis aos intervalos das células relativos às colunas. o Você não deve pular nenhuma linha quando você insere os dados, pois os intervalos de células jamais irão conter quaisquer células vazias. o Permita que o usuário seja capaz de ver explicitamente a cadeia de cálculos a partir dos dados iniciais. o Crie cópias de suas planilhas: uma otimizada para a tela, na pen- drive, no DropBox®, no e-mail, etc... SOFTWARES Entre outros. SOFTWARE R http://www.r-project.org/ SOFTWARE R o Sistema de computação gráfica e estatística. o Linguagem de programação, gráficos, interfaces para outros idiomas e instalações de depuração. o Foi desenvolvido por Ross Ihaka e Robert Gentleman, da Universidade de Auckland, Nova Zelândia (1996), inspirada na linguagem S, desenvolvida nos laboratórios Bell da AT & T por Rick Becker, John Chambers e Allan Wilks (anos 80). o O principal autor do ambiente S, John M. Chambers, foi agraciado com o Prêmio ACM Software Systems Award (EUA, 1998), em função do ambiente S. SOFTWARE R o Empresas diversas, como por exemplo Google, Pfizer, Merck, Bank of America, InterContinental Hotels Group e Shell, estão usando a linguagem R. o Diversos colaboradores ao redor do mundo desenvolvem e disponibilizam pacotes de funções, ou seja, desenvolvimento contínuo. o É gratuito! SOFTWARE R Site do software R. SOFTWARE R Ambiente R. SOFTWARE R: Exemplos de comandos getwd() Verifica o diretório atual setwd() Modifica para o diretório de interesse ls()Lista objetos no ambiente de trabalho rm() Remove objeto rm(list=ls()) Remove todos os objetos history() Lista últimos comandos utilizados search() Verifica os pacotes carregados require() Acessa funções de um pacote detach(package:nome) Desabilita o pacote carregado library() Verifica lista de pacotes instalados save.image() salva a área de trabalho save(nome, file="nome.Rdata") Salva um objeto em um arquivo load("nome.RData") Carrega o objeto matrix(0, 2, 3) Matriz de zeros, com 2 linhas e 3 colunas SOFTWARE R A <- (c(1.1, 1.2, 1.3, 2.1), 2, 2) Matriz com 2 linhas e 3 colunas dim(A) Dimensão da matriz t(matriz) Matriz transposta da matriz solv(matriz) Inversa da matriz det(matriz) Determinante da matriz rownames(A) <- c("linha1", "linha2") Insere nomes nas linhas colnames(A) <- c("coluna1", "coluna2","coluna3") Insere nomes nas colunas sort() Dados do objeto em ordem crescente sort(x, decreasing=TRUE) Dados do objeto em ordem decrescente SOFTWARE R + Adição - Subtração * Multiplicação / Divisão ^ Exponenciação %% Módulo %/% Divisão integral %*% Multiplicação de matrizes sum() Somatório prod() Produtório ?nome Abre a ajuda da função Ctrl+Tab Alterna as janelas do R Ctrl+L Limpa a área de trabalho https://www.tutorialspoint.com/execute_r_online.php SOFTWARE R - ONLINE
Compartilhar