Buscar

Aula 1 - Introdução à Estatística

Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original

*
Introdução à Estatística 
Referências: 
	BUSSAB e MORETTIN, Cap. 1.
	WEBSTER, Cap. 1.
	BARBETTA, Cap. 1.
	
*
*
Introdução
Em alguma fase do seu trabalho um pesquisador se depara com o problema e analisar e entender um conjunto de dados relevante ao seu objeto de estudos. Ele precisará transformar esses dados em informações, para compará-los com outros resultados, ou ainda para julgar se eles confirmam alguma teoria. 
Pode-se dizer a grosso modo que a essência da Ciência é a observação e que seu objetivo básico é a inferência, que pode ser dedutiva (na qual se argumenta das premissas às conclusões) ou indutiva (por meio do qual se vai do específico ao geral).
A inferência estatística é uma das partes da Estatística. Esta é a parte da metodologia da Ciência que tem por objetivo a coleta, redução, análise e modelagem dos dados, a partir do que se faz a inferência para uma população da qual os dados (a amostra) foram obtidos. Um aspecto importante da modelagem dos dados é fazer previsões, a partir das quais se podem tomar decisões. 
*
*
Análise exploratória dos dados
Na primeira parte do estudo da estatística, veremos como melhor resumir, analisar e interpretar um conjunto de dados de nosso interesse: é a chamada análise exploratória dos dados ou análise descritiva. 
Na análise descritiva buscamos extrair a maior quantidade possível de informações desses dados que nos indiquem modelos plausíveis de serem utilizados numa segunda etapa - a análise confirmatória dos dados ou inferência estatística.
Uma análise descritiva tradicional limita-se a calcular algumas medidas de posição e variabilidade, como média e variância, por exemplo. Há também uma outra corrente de análise descritiva, que privilegia o uso de técnicas gráficas, em oposição a resumos numéricos. As duas abordagens serão estudadas neste curso.
Na análise dos dados, seja ela mais descritiva ou através de técnicas gráficas, o que se busca é alguma forma de regularidade, um padrão ou modelo presente nas observações. 
*
*
Análise exploratória dos dados
Exemplo: a relação entre taxa de exportações e investimento em P&D para um conjunto de firmas apresenta algum padrão ? É uma relação linear ou exponencial?
Dados = Modelo + Resíduos (I)
ou 
D = M + R 
A parte R é muito importante no trabalho estatístico: são os resíduos que nos dizem se o modelo M é adequado ou não para representar os dados.
Uma análise exploratória busca informações para estabelecer a relação D= M + R
*
*
Definições básicas
População e parâmetro:
População: é o objeto de interesse do estatístico/pesquisador e constitui-se no conjunto de todos os elementos sob investigação. 
	Ex: Alunos de graduação UFU
		 Trabalhadores infromais no Brasil
		 Jovens de 18 a 24 anos gestantes de Uberlândia, etc. 
(tudo depende do objeto de interesse do pesquisador!)
Parâmetro: qualquer medida que descreva uma característica da população.
	EX: Média de idade dos alunos de graduação da UFU
		 Proporçãode trabalhadores informais no setor primário
		 Escolaridade média das gestantes de 18 a 24 anos
*
*
Definições básicas
b) Amostra e Estatística
Amostra: é um subconjunto da população de interesse que, em geral, é muito grande para ser estudada inteira.
	Ex: 100 alunos de graduação UFU
		 3.400 trabalhadores infromais no Brasil
		 50 jovens de 18 a 24 anos gestantes de Uberlândia 
Estatística: qualquer medida que descreva uma característica da amostra. 
	EX: Média de idade da amostra de 100 alunos de graduação da UFU
		 Proporção dos 3.400 trabalhadores informais empregados no setor primário
		 Média da escolaridade das 50 gestantes de 18 a 24 anos
As estatísticas servem como estimativas dos parâmetros!
*
*
Definições básicas
c) Variáveis 
Uma variável é uma característica da amostra ou da população. 
	Ex: idade dos alunos de graduação UFU; trabalhadores informais empregados no setor primário; escolaridade das gestantes de 18 a 24 anos. 
As variáveis podem ser qualitativas ou quantitativas:
Qualitativas: sexo, raça, religião, grau de escolaridade, nacionalidade, ocupação, estado civil, classe social, etc. Neste caso, podem ser variáveis qualitativas nominais (sexo, raça, religião, nacionalidade, estado civil, etc.) e variáveis qualitativas ordinais (grau de escolaridade, classe social). 
Quantitativas: idade, altura, peso, renda do trabalho principal, número de filhos, nota no Enem, número de pessoas que moram no mesmo domicílio, quantidade de irmãos, etc. Neste caso, classificam-se ainda em variáveis quantitativas contínuas (altura, peso, renda, nota no Enem, etc.) e variáveis quantitativas discretas ( número de filhos, número de pessoas que moram no mesmo domicílio, quantidade de irmãos). 
* E onde se encaixa a variável idade?
*
*
A importância da amostra
Amostras são necessárias: testes de qualidade nos equipamentos de segurança, exames de sangue, duração das lâmpadas, qualidade das frutas, intenção de votos dos eleitores, etc.
Como foi dito, a análise da amostra determina 2 ramos da Estatística:
	* Estatística descritiva: coletar, organizar, apresentar os dados de forma simples e fácil de interpretar.
	* Estatística inferencial: usa-se a amostra para se tirar alguma conclusão sob as características da população → importância da exatidão!!!
A exatidão de qualquer estimativa a partir da amostra depende muito da forma em que esta foi colhida, ou seja, do processo de amostragem. 
*
*
Erro amostral
Toda estimação a partir de uma amostra está sujeita a erro.
Erro amostral: é a diferença entre a estatística usada para estimar o parâmetro da população (a partir de uma amostra) e o verdadeiro parâmetro da população. 
Fontes de erro amostral:
* Processo de escolha da amostra
Ex: Para estimar a altura média dos alunos da UFU, um grupo de pesquisadores entrevista 50 alunos de graduação que, por acaso, apresentam estatura bem elevada… Neste caso, a fonte do possível erro amostral é o mero acaso!
* Amostra viciada
Ex: Para saber o grau de satisfação dos alunos da UFU com o RU, um grupo de pesquisadores realiza entrevistas com vários alunos dentro do restaurante durante uma semana… Qual o problema com essa amostra? 
*
*
Tipos de Medidas
Há outros critérios para classificar variáveis, além dos que já mencionamos (variáveis qualitativas e quantitativas), por exemplo, com base nas escalas que adotamos para medi-las. A forma com que medimos uma variável afeta nossas interpretações.
Existem quatro escalas de medidas que podem ser adotadas:
Escala nominal: nesta escala somente podemos afirmar que uma medida é diferente ou não da outra, e um número ou nome é usado para definir em que categoria uma observação se encaixa. Ex: sexo do indivíduo. Podemos associar os números 1=homem, 0=mulher ou as letras F e M. Mas não podemos realizar operações aritméticas. Uma medida de posição apropriada, neste caso, é a moda (veremos a definição de moda mais à frente).
*
*
Tipos de Medidas
Escala ordinal: Neste caso podemos dizer que uma medida é diferente e maior (ou menor) do que a outra. Como no caso anterior, também pode-se atribuir um número ou um nome a cada medida, mas as categorias são ordenadas de acordo com alguma regra pré-estabelecida. Ex: calsse social de um indivíduo pode ser alta (1 ou A), média (2 ou B) ou baixa (3 ou C). Medidas de posição apropriadas são a média ou a moda. 
Medida escalar ou intervalar: Nesta escala podemos afirmar que uma medida é “igual”, “diferente”, “maior” e “quanto maior” que outra. Podemos quantificar a diferença entre as categorias da escala ordinal. Necessitamos de uma origem arbitrária e de uma unidade de medida. Ex: temperatura de um indivíduo na escala Fahrenheit. A origem é 0oF e a unidade é 1oF. Para essa escala, podemos fazer operações aritméticas, e as medidas de posição apropriadas são a média, mediana e moda.
*
*
Tipos de
Medidas
Escala razão: de todos os tipos de medidas, as medidads de razão são as únicas em que o ponto zero tem significado: zero de distância, zero de altura, zero kilos, zero de renda, etc. Neste caso, as contas de comparação de grandezas fazem sentido: se uma unidade A dista 200 km de Uberlândia, ela é duas vezes mais longe do que outra unidade B que dista 100km. Além disso, a estrutura da escala não é alterada por transformações da forma y=cx, c > 0. Ex: y = x*1000 transforma kilômetros em metros, mas as comparações de distância de A e B com relação a Uberlândia permanecem constantes. 
*
*
Exercícios
Para cada uma das variáveis abaixo, indique a escala usualmente adotada:
Salários dos empregados de uma indústria 
Ocupação 
Opinião de consumidores sobre determinado produto 
Número de respostas certas de alunos num teste com 10 itens 
Temperatura diária na cidade de Manaus 
Percentagem da receita de municípios aplicada em educação 
Opinião dos empregados da Companhia MB sobre a realização ou não de cursos obrigatórios de treinamento
QI de um indivíduo
Estado civil.
*
*
Respostas dos exercícios
Para cada uma das variáveis abaixo, indique a escala usualmente adotada:
Salários dos empregados de uma indústria RAZÃO
Ocupação NOMINAL
Opinião de consumidores sobre determinado produto ORDINAL
Número de respostas certas de alunos num teste com 10 itens RAZÃO
Temperatura diária na cidade de Manaus ESCALAR OU INTERVALAR
Percentagem da receita de municípios aplicada em educação RAZÃO
Opinião dos empregados da Companhia MB sobre a realização ou não de cursos obrigatórios de treinamento ORDINAL
QI de um indivíduo. ESCALAR OU INTERVALAR
Estado civil NOMINAL
*
*
*
*
*
*
*
*
*
*
*
*
*
*

Teste o Premium para desbloquear

Aproveite todos os benefícios por 3 dias sem pagar! 😉
Já tem cadastro?

Outros materiais