Buscar

01 - Aula 1

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 44 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 44 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 44 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

*
Introdução
Análise Exploratória de Dados
*
Comentários Gerais
Quem pretende efetuar estudos ou tomar decisões começa normalmente por recolher os fatos que lhe parecem relevantes.
Os fatos recolhidos devem conter informações e serem acumulados de forma organizada, por isso são denominados por dados.
*
Estamos denominando por dados um ou mais conjunto de valores, numéricos ou não.
Exemplos de dados:
Marca da calculadora dos estudantes (A, B ou C).
Número de defeitos graves em automóveis recentemente fabricados (1, 2, 3 ou 4).
*
Não parece errado afirmar que hoje, muitas pessoas, das mais variadas profissões, têm necessidade de trabalhar com dados; quer queiram, quer não, consciente ou inconscien-temente, recorrem à Estatística.
Economia: utiliza a estatística para tomar decisões (governamentais e privadas).
Administração: utiliza a estatística para estimar posições futuras (de vendas, propaganda, produção e desempenho das empresas).
*
Por que aprender estatística?
Hoje, alguma familiaridade com os princípios básicos da estatística deve fazer parte da educação geral de todo ser humano.
Afinal, é difícil ser um cidadão informado sem uma compreensão dos vários índices governamentais, dos gráficos e médias publicados diariamente na imprensa e das pesquisas de opinião pública.
*
Motivação
Em uma linha de empacotamento de leite, se medirmos o volume de cada saquinho, vamos descobrir que nenhum deles contém exatamente uma mesma quantidade de leite. 
Duas unidades produzidas por um processo de fabricação nunca são idênticas. Alguma variação é inevitável (caso contrário, uma única observação revelaria todas as informações desejadas).
*
Por que aprender estatística?
A estatística nos ensina a fazer julgamentos inteligentes e a tomar decisões na presença de incertezas e variações.
*
O que é estatística?
A palavra estatística lembra, à maioria das pessoas, recenseamentos. 
Os censos são feitos pelos governos como o objetivo de conhecer seus habitantes, sua condição socioeconômica, sua cultura, religião, etc... Portanto, associar estatística a censo é perfeitamente natural.
*
Definição de Estatística
A estatística é um conjunto de técnicas que permite, de forma sistemática, recolher e organizar => explorar e descrever => analisar e interpretar dados oriundos de estudos ou experimentos, realizados em qualquer área do conhecimento. 
*
Áreas da Estatística
Estatística Descritiva e Análise exploratória de dados
Probabilidade
Inferência Estatística
*
Estatística Descritiva e Análise Exploratória de Dados
O presente curso tem o propósito de fazer uma introdução à análise exploratória de dados (EDA) e à estatística descritiva sem grandes preocupações sobre a distinção entre os dois conceitos, em relação ao qual parece não haver consenso.
*
Etapa inicial da análise, quando tomamos conta-to com os dados pela primeira vez. 
Crítica, organização, resumo e apresentação de dados.
A disponibilidade de uma grande quantidade de dados e de métodos computacionais muito eficientes revigoraram esta área da estatística => Minitab, R, SPSS, SAS, etc...
Análise Exploratória de Dados
*
Motivação
A utilidade da estatística descritiva é bastante geral. 
Quem vê os jornais sabe quão frequente é o uso de médias, índices e gráficos na descrição de uma realidade social ou econômica, por exemplo.
*
Exemplo I
O INPC, Índice Nacional de Preços ao Consumidor, construído pelo IBGE – Instituto Brasileiro de Geografia e Estatística, é um índice muito importante em nossa sociedade. Basta dizer que os aumentos salariais são reivindicados com base nesse índice. 
Sua construção envolve a sintetização, em um único número, dos aumentos dos produtos de uma cesta básica. Seu processo de cálculo é um sucessivo cálculo de médias.
*
Exemplo II
Anuário Estatístico Brasileiro. O IBGE publica esse anuário, apresentando em várias tabelas os mais diversos dados sobre o Brasil: educação, saúde, transporte, economia, cultura, etc...
Embora simples e fáceis de serem entendidas, as tabelas são fruto de um processo demorado e extremamente dispendioso de coleta e apuração de dados.
*
Exemplo III
Perfil do consumidor. A informação obtida pelos prestadores de serviços é guardada em grandes bancos de dados, usados na construção de perfis de consumidores.
Esses perfis são usados, por exemplo, para identificar roubos de cartões de crédito e para a criação de listas de clientes potenciais. 
*
Probabilidade
A probabilidade é a base matemática sob a qual a Estatística é construída. Fornece métodos para quantificar a incerteza existente em determinada situação.
A teoria de probabilidades nos permite descrever os fenômenos aleatórios, ou seja, aqueles em que está presente a incerteza.
*
Motivação 
O cálculo das probabilidades é fundamental para se conviver de forma inteligente com o risco, inerente a tantos processos sociais. 
No caso de seguros, isso é evidente.
*
Exemplo IV
Cálculo do prêmio do seguro: 
 Uma companhia de seguros deve saber calcular o valor a se cobrar para segurar, por exemplo, a saúde de um indivíduo. Se seu valor é alto demais, ela não terá clientes; se é baixo demais, pode não ter recursos para honrar seus compromissos.
*
Inferência Estatística
É o estudo de técnicas que possibilitam a extrapolação, a um grande conjunto de dados (população), das informações e conclusões obtidas a partir de subconjuntos de valores (amostra), usualmente de dimensão menor.
Problema central: Tomada de decisões sobre a população com base em estudos feitos sobre os dados da amostra.
*
Exemplo V
Comparação: Testes sobre medicamentos.
Um experimento médico testa um novo analgésico para ver se ele é melhor que o produto padrão correspondente. 
Dez pessoas selecionadas aleatoriamente tomam o novo medicamento, e as dez outras tomam o remédio padrão. 
*
O experimento é do tipo “duplo cego”, isto é, nem o paciente nem o médico sabem qual dos dois remédios está sendo administrado. Essa informação é do conhecimento apenas do estatístico.
*
 Podemos concluir que o novo remédio é melhor só porque mais pessoas, no grupo das que o tomaram, relataram diminuição da dor?
É preciso saber se a margem de 8 para 5 é real ou se os dois remédios são igualmente eficientes, tendo a diferença ocorrido apenas por uma variação aleatória.
*
Exemplo VI
Previsão: Demanda por produtos e serviços.
Os planejadores tanto no Estado quanto no setor privado precisam estimar a demanda por serviços. 
Quantos leitos hospitalares serão necessários? Quantas vagas nas diferentes séries escolares? Quantos médicos cardiologistas devem prestar serviços em uma comunidade?
*
População
Amostra
Variável
Conceitos Básicos 
*
População
Coleção completa de todos os elementos (escores, pessoas, medidas e outros) a serem estudados. A coleção é completa no sentido que inclui todos os sujeitos a serem estudados.
Conjunto de dados com alguma característica comum e com potencial interesse para o estudo.
*
Exemplos
Todos os habitantes de Juiz de Fora.
Todas as lâmpadas produzidas por uma fábrica em um certo período de tempo.
Todo o sangue no corpo de uma pessoa.
*
Os elementos da população são em geral denominados por unidades estatísticas: objeto da observação qualquer que seja a sua natureza, desde que tenha uma definição precisa.
Exemplos: 
Seres Vivos (homem, cabeça de gado, ...)
Instituições (família, empresa, ...)
Objetos (automóvel, trator, ...)
*
Uma população pode ser finita ou infinita.
Exemplos:
População constituída por todos os parafusos produzidos numa fábrica em certo dia é finita.
População constituída de todos os resultados (cara ou coroa) em sucessivos lances de uma moeda é infinita.
*
Raramente é possível coletar dados de todos os elementos de uma população (censo). 
População finita: razões econômicas, razões éticas, tempo, observações destrutivas, etc.
E é impossível observar todos os elementos de uma população infinita.
Tendo em vista adificuldade de várias naturezas para se observar todos os elementos da população, tomaremos alguns deles para formar um grupo a ser estudado.
*
Desenho Esquemático
*
Amostra
Subconjunto da população, em geral, com dimensão sensivelmente menor. 
Corresponde à parcela da população selecionada para a análise. 
*
Exemplos: População versus Amostra
População: Todos os estudantes matriculados em horário integral em uma faculdade.
Amostra: 50 alunos de horário integral selecionados para um estudo de marketing.
*
Exemplos: População versus Amostra
População: Todos os eleitores registrados em Juiz de Fora.
Amostra: 500 eleitores registrados em Juiz de Fora contactados por telefone para uma pesquisa de intenção de voto.
*
Amostra
Subconjunto da população que se supõe ser representativo.
Se uma amostra é representativa de uma população, conclusões importantes sobre a população podem ser inferidas de sua análise.
*
População versus Amostra
*
Relação entre Probabilidade e Inferência Estatística
A probabilidade faz considerações da popula-ção para a amostra (raciocínio dedutivo) e a inferência estatística faz considerações da amostra para a população (raciocínio indutivo).
População
Amostra
Probabilidade
Inferência Estatística
*
Etapas da Análise Estatística
*
Existem tantos modos de obtenção de uma amostra que estes procedimentos constituem uma especialidade dentro da Estatística, conhecida como Amostragem.
Como selecionar uma amostra?
*
Devemos ressaltar que, em princípio, a seleção da amostra tenta fornecer um subconjunto de elementos o mais parecido possível com a população que lhe dá origem.
Para procurar assegurar a representatividade da amostra são necessários os maiores cuidados.
O método mais simples de assegurar uma seleção representativa é obter uma amostra aleatória simples.
*
Amostra aleatória simples: todos os elementos da população têm chance igual de serem incluídos nela e a chance dela ser escolhida é a mesma que qualquer outra de mesmo tamanho.
O fundamento das técnicas correntemente empregues para colher amostras consiste em deixar ao acaso (seleção aleatória) a indicação dos elementos da população que devem ser incluídos na amostra.
*
Quando ao colher uma amostra se dá preferência a determinados elementos da população, a amostra diz-se viciada ou tendenciosa.
Tais como, amostras intencionais, onde os elementos são selecionados com auxílio de especialistas e amostras de voluntários, como ocorre em 
Pesquisas feitas pela internet, nas quais os sujeitos podem decidir se respondem ou não.
Pesquisas feitas pelo correio, nas quais os sujeitos podem decidir se enviam respostas ou não.
*
Exercício
Logo após a destruição das torres do World Trade Center por terroristas, uma revista realizou uma pesquisa online com seus assinantes e fez a seguinte pergunta “As torres devem ser reconstruídas?”
Entre as 1.304.240 respostas, 768.731 responderam “sim”, 286.756 responderam “não” e 248.753 diziam ser “muito cedo para decidir”.
*
Exercício
Defina a população e a amostra dessa pesquisa.
Dado que essa amostra é muito grande, as respostas podem ser consideradas representativas da população dos Estados Unidos? Explique.

Outros materiais