Buscar

AULA 01 INTRODUCAO E COLETA DE DADOS

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 36 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 36 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 36 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

INTRODUÇÃO E 
COLETA DE DADOS
UNIVERSIDADE DO ESTADO DO RIO DE JANEIRO
INSTITUTO DE QUÍMICA
DEPARTAMENTO DE QUÍMICA ANALÍTICA
INTRODUÇÃO À QUIMIOMETRIA
INTRODUÇÃO
o Estatística é uma área da Matemática que tem por objetivo organizar, descrever e
analisar dados, determinando correlações entre estes, de forma a que, com base
na descrição e explicação de comportamento passados, se possam prever
comportamentos futuros.
o Aplicações em diversas áreas:
� Psicologia: Psicometria.
� Biologia: Biometria.
� Economia: Econometria.
� Química: Quimiometria.
INTRODUÇÃO
Químico (Concepção geral) 
Químico (Concepção atual) 
Quimiometria
Avanço tecnológico e 
instrumental
Bruce R. Kowalski,
Jurs, Kowalski, Isenhour e Reilly
Diversos trabalhos na década de 60 utilizando 
métodos inovadores no tratamento de dados 
químicos.
Quimiometria
- Termo quimiometria = primeira vez por Svant Wold, em 1971
- Em sueco kemometri, porém foi Bruce Kowalski quem definiu a quimiometria como
um novo ramo da química.
Definição da quimiometria (de acordo com Wold):
A disciplina da química que usa matemática, estatística e lógica formal para:
a) procedimentos de planejamento e otimização de experimentos;
b) prover de informação química relevante através de análise de dados químicos e
c) obter conhecimento sobre sistemas químicos.
Quimiometria
INTRODUÇÃO
o Areas da Quimiometria:
� Planejamento e otimização de experimentos (conteúdo abordado em
Quimiometria I)
� Análise exploratória
� Reconhecimento de padrões
� Calibração multivariada
� Seleção de variáveis
� Processamento de sinais
� Inteligência artificial
� Relação estrutura química-atividade biológica (QSAR)
INTRODUÇÃO
o Algumas aplicações:
� Apresentar, descrever dados e informações de um negócio
adequadamente.
� Tirar conclusões sobre grandes populações usando informações coletadas
das amostras.
� Fazer previsões confiáveis sobre a atividade empresarial.
� Melhorar os processos dos negócios.
INTRODUÇÃO
Estatística:
Descritiva:
Coleta, sintetiza e 
apresenta os dados.
Inferencial:
Utiliza dados de amostras para tirar
conclusões sobre uma população
ESTATÍSTICA DESCRITIVA
o Coleta de dados: Pesquisa
o Apresentação dos dados: Tabelas e
gráficos
o Caracterização dos dados: Média
amostral
ESTATÍSTICA INFERENCIAL
o Estimação: Estimar a altura média da população usando a altura
média amostral.
o Teste de Hipóteses: Teste a afirmação de que a altura média da
população é 1,80 m.
ALGUMAS DEFINIÇÕES
o Variável: Corresponde a uma característica de um item ou de
indivíduo (ex: índice de refração, massa, temperatura, etc).
o Dados: Valores diferentes associados com uma variável (ex:
valores de massa, valores de temperatura, valores de índice de
refração).
o População: Consiste em todos os itens ou indivíduos, com pelo
menos uma característica em comum, em relação aos quais você
deseja tirar uma conclusão.
ALGUMAS DEFINIÇÕES
o Amostra: corresponde à parcela da população selecionada para
análise.
o Parâmetro: medida numérica que descreve uma característica de
uma população. É um operador que ajuda na produção de uma
visão global dos dados.
o Estatística: medida numérica que descreve uma característica de
uma amostra.
POPULAÇÃO X AMOSTRA
o População: Conjunto de pessoas, itens ou eventos sobre os
quais você quer fazer inferências. Totalidade!
Nem sempre é conveniente ou possível examinar todos os
membros de uma população inteira!
o Amostra: Subconjunto de pessoas, itens ou eventos de uma
população maior que você coleta e analisa para fazer
inferências.
População
Amostra
Exemplo: Intenção de votos
Se a amostra é aleatória e grande o 
suficiente, é possível usar as informações 
coletadas a partir da amostra para fazer 
inferências sobre a população.
COLETA DE DADOS
a. Avaliação da eficácia de um novo anúncio de televisão.
b. Verificação da eficácia de um novo medicamento
c. Monitoração de um processo de fabricação (controle de
qualidade)
d. Auditoria fiscal (verificação de contas)
FONTE DE DADOS
o Fontes Primárias: O coletor dos dados é um dos pesquisadores que
utiliza os dados para análise
� Dados de uma pesquisa política.
� Dados coletados de um experimentalista.
FONTE DE DADOS
o Fontes Secundárias: A pessoa que executa a análise de dados não é
o coletor dos dados.
� Dados do censo.
� Examinando dados de periódicos impressos ou dados publicados
na internet.
TIPOS DE VARIÁVEIS
o Variável Categórica (variável qualitativa) é aquela que somente
apresenta valores que só podem ser colocados em categorias,
tais como "sim" e "não".
o Questão: Você é solteiro? Você tem carro?
o Variável Numérica (variável quantitativa) é aquela que têm
valores que representam quantidades.
o Questão: Qual é a sua idade? Qual o seu peso?
TIPOS DE VARIÁVEIS
Dados
Categóricos Numéricos
Discretos Contínuos
� Estado Civil
� Time de futebol
� Cor dos olhos
� Número de filhos
� Defeitos por hora
(Itens Contados)
� Massa
� Potencial Elétrico
(Medidas características)
NÍVEIS DE MENSURAÇÃO
o Escalas nominais:
� Escalas qualitativas (dados representados por etiquetas) em
que não existe uma ordem para os resultados que o
fenômeno pode ter.
� Classificam os dados em categorias distintas no qual
nenhum posicionamento está implícito.
NÍVEIS DE MENSURAÇÃO
Varáveis categóricas Categorias
Possui computador de uso pessoal? Sim / Não
Tipo de conta bancária Corrente / Poupança
Provedor de Internet NetVirtua / Oi Velox / GVT
Tabela 1: Exemplos de variáveis categóricas
NÍVEIS DE MENSURAÇÃO
o Escalas ordinais:
� Utilizam um critério lógico e consensual.
� Estabelecem uma ordem entre os resultados possíveis.
� Classificam os dados em categorias distintas no qual o
posicionamento está implícito.
NÍVEIS DE MENSURAÇÃO
Variável categórica Categorias ordenadas
Alunos na faculdade Calouro, Veterano
Satisfação com o produto Totalmente Insatisfeito, Insatisfeito, 
Satisfeito, Muito Satisfeito, 
Totalmente Satisfeito
Notas dos alunos, da pós-
graduação (PPGEQ-UERJ)
A, B, C, D
Tabela 2: Exemplos de variáveis categóricas
NÍVEIS DE MENSURAÇÃO
Variável numérica Nível de mensuração
Temperatura (ºC) Intervalo
Resultado de um exame padronizado (ex.: 
SAT)
Intervalo
Altura de uma pessoa (cm) Razão
Peso de uma pessoa (kg) Razão
Idade (anos ou meses) Razão
Salário (real ou dólar) Razão
Tabela 3: Exemplos de escala intervalar e de razão
CRIAÇÃO DE BASE DE DADOS EFICIENTE
o Associe as variáveis aos intervalos das células relativos às colunas.
o Você não deve pular nenhuma linha quando você insere os dados,
pois os intervalos de células jamais irão conter quaisquer células
vazias.
o Permita que o usuário seja capaz de ver explicitamente a cadeia
de cálculos a partir dos dados iniciais.
o Crie cópias de suas planilhas: uma otimizada para a tela, na pen-
drive, no DropBox®, no e-mail, etc...
SOFTWARES
Entre outros.
SOFTWARE R
http://www.r-project.org/
SOFTWARE R
o Sistema de computação gráfica e estatística.
o Linguagem de programação, gráficos, interfaces para outros
idiomas e instalações de depuração.
o Foi desenvolvido por Ross Ihaka e Robert Gentleman, da
Universidade de Auckland, Nova Zelândia (1996), inspirada na
linguagem S, desenvolvida nos laboratórios Bell da AT & T por
Rick Becker, John Chambers e Allan Wilks (anos 80).
o O principal autor do ambiente S, John M. Chambers, foi agraciado
com o Prêmio ACM Software Systems Award (EUA, 1998), em
função do ambiente S.
SOFTWARE R
o Empresas diversas, como por exemplo Google, Pfizer, Merck,
Bank of America, InterContinental Hotels Group e Shell, estão
usando a linguagem R.
o Diversos colaboradores ao redor do mundo desenvolvem e
disponibilizam pacotes de funções, ou seja, desenvolvimento
contínuo.
o É gratuito!
SOFTWARE R
Site do software R.
SOFTWARE R
Ambiente R.
SOFTWARE R: Exemplos de comandos
getwd() Verifica o diretório atual
setwd() Modifica para o diretório de interesse
ls()Lista objetos no ambiente de trabalho
rm() Remove objeto
rm(list=ls()) Remove todos os objetos
history() Lista últimos comandos utilizados
search() Verifica os pacotes carregados
require() Acessa funções de um pacote
detach(package:nome) Desabilita o pacote carregado
library() Verifica lista de pacotes instalados
save.image() salva a área de trabalho
save(nome, file="nome.Rdata") Salva um objeto em um arquivo
load("nome.RData") Carrega o objeto
matrix(0, 2, 3) Matriz de zeros, com 2 linhas e 3 colunas
SOFTWARE R
A <- (c(1.1, 1.2, 1.3, 2.1), 2, 2) Matriz com 2 linhas e 3 colunas
dim(A) Dimensão da matriz
t(matriz) Matriz transposta da matriz
solv(matriz) Inversa da matriz
det(matriz) Determinante da matriz
rownames(A) <- c("linha1", 
"linha2")
Insere nomes nas linhas
colnames(A) <- c("coluna1", 
"coluna2","coluna3")
Insere nomes nas colunas
sort() Dados do objeto em ordem crescente
sort(x, decreasing=TRUE) Dados do objeto em ordem decrescente
SOFTWARE R
+ Adição
- Subtração
* Multiplicação
/ Divisão
^ Exponenciação
%% Módulo
%/% Divisão integral
%*% Multiplicação de matrizes
sum() Somatório
prod() Produtório
?nome Abre a ajuda da função
Ctrl+Tab Alterna as janelas do R
Ctrl+L Limpa a área de trabalho
https://www.tutorialspoint.com/execute_r_online.php
SOFTWARE R - ONLINE

Outros materiais