283 pág.

Pré-visualização | Página 1 de 48
1 INTRODUÇÃO À AMOSTRAGEM Prof. Thiago Rezende DEST-UFMG 2 Capítulo II: Introdução ao Curso 2. Estatística: definição, motivação e conceitos importantes “A Estatística nada mais é que o bom senso em números. ” Pierre Simon, Marquês de Laplace Matemático francês do século XVIII. Todo dia ouvimos ou lemos essa frase, aplicada às informações a respeito de todo tipo de assunto: Desemprego Acidentes Saúde Pública Infração Educação Divórcio Turismo Comércio Etc., etc., etc... É cada vez mais freqüente a necessidade de se compreender as informações veiculadas. Estar “alfabetizado” também supõe saber ler e interpretar dados. As “Estatísticas” são usadas para o conhecimento, fazer previsões e tomar decisões. 2.1. Definição Estatística é a ciência da coleta, organização, análise e interpretação de dados com o objetivo de conhecimento e tomada de decisão. A palavra Estatística vem do latim status, que significa estado. 3 Isto porque os primeiros usos da Estatística envolviam compilação de dados e confecção de gráficos que descreviam alguns aspectos demográficos e sociais (como nascimentos e mortes) de um estado, o Império Romano. Objetivos do Aprendizado de Estatística Saber fazer ou criticar o que está feito. Tornar-se mais crítico em sua análise de informações quantitativas; Tornar-se menos sujeito as afirmações enganosas baseadas em números ou gráficos distorcidos. Aguçar sua capacidade de reconhecer dados estatísticos distorcidos e de interpretar adequadamente dados não distorcidos. Os Dados - Dados são observações documentadas (sobre pessoas, plantas, objetos e etc.) ou resultado de um processo de medição, contagem ou classificação. - Os dados podem ser estruturados (linha x coluna) e não estruturados (textos, imagens e etc.). - As diversas características associadas a uma coleção de indivíduos são chamados de variáveis. - A base de dados é formada pelos indivíduos e pelas variáveis. - A disponibilidade dos dados oferece oportunidades para a obtenção de informações objetivas/evidências. Exemplos: Medição de pressão sanguínea de um paciente; Circunferência do tronco de uma árvore; Classificação de uma peça produzida: defeituosa ou não; PIB de um país; Número de alunos de uma escola. Construção de Modelos Estatísticos I. Descrever a relação entre variáveis para entender um fenômeno. Ex.: Entender o efeito no preço de venda de um imóvel, de características como área construída, número de cômodos, idade, localização, etc. 4 II. Prever o valor de uma variável a partir dos valores de outras variáveis. Ex.: Calcular a probabilidade de ocorrência de um tornado a partir de medições de vento, umidade, temperatura, pressão, etc. III. Substituir a medição de uma variável pela observação dos valores de outras variáveis. Ex.: Substituir a medição da quantidade de gordura abdominal feita através de tomografia (muito cara, disponível em poucos consultórios médicos) por medidas de fácil obtenção como circunferência da cintura, circunferência e prega cutânea do abdômen. 2.2. População e Amostra Podemos inferir (deduzir) determinadas características de uma população se extraímos uma amostra representativa desta. População: Coleção de unidades individuais (pessoas ou resultados experimentais) com uma ou mais características comuns, que se pretendem estudar. Amostra: Conjunto de dados ou observações, recolhidos a partir de um subconjunto da população, que se estuda com o objetivo de tirar conclusões para a população de onde foi recolhida. 5 População: Coleção de unidades individuais (pessoas ou resultados experimentais) com uma ou mais características comuns, que se pretendem estudar. Amostra: Conjunto de dados ou observações, um subconjunto escolhido a partir da população. OBS.: Podemos inferir determinadas características de uma população se extraímos uma amostra representativa da população. Exemplo: 6 2.3. Censo e Amostragem Um censo consiste da coleta dos dados da população inteira. Usualmente, é impraticável observar toda a população: - A população é muito grande. Ex .: Respostas de todos os adolescentes brasileiros sobre fumo. - A população é infinita. Ex .: As medições de poluição em um rio. Na maioria dos casos os dados são obtidos via amostragem. Entende-se Censo como o levantamento ou registro estatístico de uma certa população, de acordo com alguns critérios como sexo, idade, religião, estado civil, profissão. 2.4. Parâmetro e estatística Dois conceitos importantes agora: parâmetro e estatística. Parâmetro: Descrição numérica de uma característica da população. Será conhecido apenas se toda a população for observada. Estatística: Descrição numérica de uma característica da amostra. Exemplo 1: Uma pesquisa foi realizada com 1000 adolescentes brasileiros sobre o (mau!) hábito de fumar: _ 280 responderam que “fumam” e _ 720 responderam que “não fumam”. População: Consiste das respostas de todos os (milhões de) adolescentes brasileiros. 7 Amostra: Consiste das 1000 respostas obtidas na pesquisa. Um Censo consiste da coleta dos dados da população inteira. Usualmente, é impraticável observar toda a população. A população é muito grande. Exemplo: Resposta de todos os adolescentes brasileiros sobre o fumo. Parâmetro: Descrição numérica de uma característica da população. Será conhecido apenas se toda a população for observada. Estatística: Descrição numérica de uma característica da amostra. Exemplo 2: Proporção de adolescentes brasileiros que fumam – parâmetro (Valor desconhecido, pois não há pesquisa com todos os adolescentes do Brasil). Proporção de adolescentes na amostra que responderam “fumo” – estatística. 2.5. Variável Podemos definir uma variável como uma característica associada a uma coleção de indivíduos algum valor ou atributo que pode variar de um indivíduo a outro. Exemplo 3: - Estatura é uma variável porque esse atributo variar de uma pessoa a outra. - O número de acidentes em uma estrada é uma variável, porque é uma característica de uma coleção de indivíduos. 2.5.1. Os tipos de variáveis Variáveis qualitativas: Atributos ou classificações não numéricas. Exemplo 4: Sexo (masculino, feminino), Escolaridade (nenhuma, primário, ensino médio, etc.). Essas variáveis se subdividem em: 8 i) Nominais: Variáveis qualitativas classificadas por nomes ou rótulos, mas a ordenação não az sentido. ii) Ordinais: Variáveis qualitativas que podem ser ordenadas, mas a operação de diferença não faz sentido. Variáveis quantitativas: Contagens ou medições numéricas. Exemplo 5: Idade, número de filhos, altura, peso. Essas variáveis se subdividem em: i) Discretas: O número de valores possíveis é finito ou infinito enumerável. ii) Contínuas: Têm infinitos valores possíveis numa escala contínua de medição, sem vazios, interrupções ou saltos. Importante: 1) Uma variável originalmente quantitativa pode ser coletada de forma qualitativa. Exemplo 6: Variável idade. _ Anos completo (0,1,2,...100,...) - Quantitativa _ Faixa etária (anos) {0 a5; 6 a 10; ...; > 100} - Qualitativa 2) Nem toda variável