Baixe o app para aproveitar ainda mais
Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original
* Introdução à Estatística Referências: BUSSAB e MORETTIN, Cap. 1. WEBSTER, Cap. 1. BARBETTA, Cap. 1. * * Introdução Em alguma fase do seu trabalho um pesquisador se depara com o problema e analisar e entender um conjunto de dados relevante ao seu objeto de estudos. Ele precisará transformar esses dados em informações, para compará-los com outros resultados, ou ainda para julgar se eles confirmam alguma teoria. Pode-se dizer a grosso modo que a essência da Ciência é a observação e que seu objetivo básico é a inferência, que pode ser dedutiva (na qual se argumenta das premissas às conclusões) ou indutiva (por meio do qual se vai do específico ao geral). A inferência estatística é uma das partes da Estatística. Esta é a parte da metodologia da Ciência que tem por objetivo a coleta, redução, análise e modelagem dos dados, a partir do que se faz a inferência para uma população da qual os dados (a amostra) foram obtidos. Um aspecto importante da modelagem dos dados é fazer previsões, a partir das quais se podem tomar decisões. * * Análise exploratória dos dados Na primeira parte do estudo da estatística, veremos como melhor resumir, analisar e interpretar um conjunto de dados de nosso interesse: é a chamada análise exploratória dos dados ou análise descritiva. Na análise descritiva buscamos extrair a maior quantidade possível de informações desses dados que nos indiquem modelos plausíveis de serem utilizados numa segunda etapa - a análise confirmatória dos dados ou inferência estatística. Uma análise descritiva tradicional limita-se a calcular algumas medidas de posição e variabilidade, como média e variância, por exemplo. Há também uma outra corrente de análise descritiva, que privilegia o uso de técnicas gráficas, em oposição a resumos numéricos. As duas abordagens serão estudadas neste curso. Na análise dos dados, seja ela mais descritiva ou através de técnicas gráficas, o que se busca é alguma forma de regularidade, um padrão ou modelo presente nas observações. * * Análise exploratória dos dados Exemplo: a relação entre taxa de exportações e investimento em P&D para um conjunto de firmas apresenta algum padrão ? É uma relação linear ou exponencial? Dados = Modelo + Resíduos (I) ou D = M + R A parte R é muito importante no trabalho estatístico: são os resíduos que nos dizem se o modelo M é adequado ou não para representar os dados. Uma análise exploratória busca informações para estabelecer a relação D= M + R * * Definições básicas População e parâmetro: População: é o objeto de interesse do estatístico/pesquisador e constitui-se no conjunto de todos os elementos sob investigação. Ex: Alunos de graduação UFU Trabalhadores infromais no Brasil Jovens de 18 a 24 anos gestantes de Uberlândia, etc. (tudo depende do objeto de interesse do pesquisador!) Parâmetro: qualquer medida que descreva uma característica da população. EX: Média de idade dos alunos de graduação da UFU Proporçãode trabalhadores informais no setor primário Escolaridade média das gestantes de 18 a 24 anos * * Definições básicas b) Amostra e Estatística Amostra: é um subconjunto da população de interesse que, em geral, é muito grande para ser estudada inteira. Ex: 100 alunos de graduação UFU 3.400 trabalhadores infromais no Brasil 50 jovens de 18 a 24 anos gestantes de Uberlândia Estatística: qualquer medida que descreva uma característica da amostra. EX: Média de idade da amostra de 100 alunos de graduação da UFU Proporção dos 3.400 trabalhadores informais empregados no setor primário Média da escolaridade das 50 gestantes de 18 a 24 anos As estatísticas servem como estimativas dos parâmetros! * * Definições básicas c) Variáveis Uma variável é uma característica da amostra ou da população. Ex: idade dos alunos de graduação UFU; trabalhadores informais empregados no setor primário; escolaridade das gestantes de 18 a 24 anos. As variáveis podem ser qualitativas ou quantitativas: Qualitativas: sexo, raça, religião, grau de escolaridade, nacionalidade, ocupação, estado civil, classe social, etc. Neste caso, podem ser variáveis qualitativas nominais (sexo, raça, religião, nacionalidade, estado civil, etc.) e variáveis qualitativas ordinais (grau de escolaridade, classe social). Quantitativas: idade, altura, peso, renda do trabalho principal, número de filhos, nota no Enem, número de pessoas que moram no mesmo domicílio, quantidade de irmãos, etc. Neste caso, classificam-se ainda em variáveis quantitativas contínuas (altura, peso, renda, nota no Enem, etc.) e variáveis quantitativas discretas ( número de filhos, número de pessoas que moram no mesmo domicílio, quantidade de irmãos). * E onde se encaixa a variável idade? * * A importância da amostra Amostras são necessárias: testes de qualidade nos equipamentos de segurança, exames de sangue, duração das lâmpadas, qualidade das frutas, intenção de votos dos eleitores, etc. Como foi dito, a análise da amostra determina 2 ramos da Estatística: * Estatística descritiva: coletar, organizar, apresentar os dados de forma simples e fácil de interpretar. * Estatística inferencial: usa-se a amostra para se tirar alguma conclusão sob as características da população → importância da exatidão!!! A exatidão de qualquer estimativa a partir da amostra depende muito da forma em que esta foi colhida, ou seja, do processo de amostragem. * * Erro amostral Toda estimação a partir de uma amostra está sujeita a erro. Erro amostral: é a diferença entre a estatística usada para estimar o parâmetro da população (a partir de uma amostra) e o verdadeiro parâmetro da população. Fontes de erro amostral: * Processo de escolha da amostra Ex: Para estimar a altura média dos alunos da UFU, um grupo de pesquisadores entrevista 50 alunos de graduação que, por acaso, apresentam estatura bem elevada… Neste caso, a fonte do possível erro amostral é o mero acaso! * Amostra viciada Ex: Para saber o grau de satisfação dos alunos da UFU com o RU, um grupo de pesquisadores realiza entrevistas com vários alunos dentro do restaurante durante uma semana… Qual o problema com essa amostra? * * Tipos de Medidas Há outros critérios para classificar variáveis, além dos que já mencionamos (variáveis qualitativas e quantitativas), por exemplo, com base nas escalas que adotamos para medi-las. A forma com que medimos uma variável afeta nossas interpretações. Existem quatro escalas de medidas que podem ser adotadas: Escala nominal: nesta escala somente podemos afirmar que uma medida é diferente ou não da outra, e um número ou nome é usado para definir em que categoria uma observação se encaixa. Ex: sexo do indivíduo. Podemos associar os números 1=homem, 0=mulher ou as letras F e M. Mas não podemos realizar operações aritméticas. Uma medida de posição apropriada, neste caso, é a moda (veremos a definição de moda mais à frente). * * Tipos de Medidas Escala ordinal: Neste caso podemos dizer que uma medida é diferente e maior (ou menor) do que a outra. Como no caso anterior, também pode-se atribuir um número ou um nome a cada medida, mas as categorias são ordenadas de acordo com alguma regra pré-estabelecida. Ex: calsse social de um indivíduo pode ser alta (1 ou A), média (2 ou B) ou baixa (3 ou C). Medidas de posição apropriadas são a média ou a moda. Medida escalar ou intervalar: Nesta escala podemos afirmar que uma medida é “igual”, “diferente”, “maior” e “quanto maior” que outra. Podemos quantificar a diferença entre as categorias da escala ordinal. Necessitamos de uma origem arbitrária e de uma unidade de medida. Ex: temperatura de um indivíduo na escala Fahrenheit. A origem é 0oF e a unidade é 1oF. Para essa escala, podemos fazer operações aritméticas, e as medidas de posição apropriadas são a média, mediana e moda. * * Tipos de Medidas Escala razão: de todos os tipos de medidas, as medidads de razão são as únicas em que o ponto zero tem significado: zero de distância, zero de altura, zero kilos, zero de renda, etc. Neste caso, as contas de comparação de grandezas fazem sentido: se uma unidade A dista 200 km de Uberlândia, ela é duas vezes mais longe do que outra unidade B que dista 100km. Além disso, a estrutura da escala não é alterada por transformações da forma y=cx, c > 0. Ex: y = x*1000 transforma kilômetros em metros, mas as comparações de distância de A e B com relação a Uberlândia permanecem constantes. * * Exercícios Para cada uma das variáveis abaixo, indique a escala usualmente adotada: Salários dos empregados de uma indústria Ocupação Opinião de consumidores sobre determinado produto Número de respostas certas de alunos num teste com 10 itens Temperatura diária na cidade de Manaus Percentagem da receita de municípios aplicada em educação Opinião dos empregados da Companhia MB sobre a realização ou não de cursos obrigatórios de treinamento QI de um indivíduo Estado civil. * * Respostas dos exercícios Para cada uma das variáveis abaixo, indique a escala usualmente adotada: Salários dos empregados de uma indústria RAZÃO Ocupação NOMINAL Opinião de consumidores sobre determinado produto ORDINAL Número de respostas certas de alunos num teste com 10 itens RAZÃO Temperatura diária na cidade de Manaus ESCALAR OU INTERVALAR Percentagem da receita de municípios aplicada em educação RAZÃO Opinião dos empregados da Companhia MB sobre a realização ou não de cursos obrigatórios de treinamento ORDINAL QI de um indivíduo. ESCALAR OU INTERVALAR Estado civil NOMINAL * * * * * * * * * * * * * *
Compartilhar