Baixe o app para aproveitar ainda mais
Prévia do material em texto
ESTATÍSTICA E PROBABILIDADE - GST1079 1 – INTRODUÇÃO À ESTATÍSTICA A Estatística trata da coleta, apresentação, descrição e análise de dados, transformando em informação, com objetivo de formular ou validar hipóteses sobre um fenômeno obser- vado. Podemos defini-la em três grandes áreas: Estatística Descritiva ou Dedutiva – organização, resumo e descrição dos dados. Teoria das Probabilidades – base racional para situações relacionadas ao acaso. Estatística Indutiva ou Inferência Estatística – análise e interpretação de dados amos- trais. 1.1 - COLETA DE DADOS Método: A coleta de dados pode ser feita por meio de observação ou através de questionários que podem ser preenchidos pelo próprio informante ou por um pesquisador de campo. Quan- do colhidos dessa forma, diretamente na fonte, são chamados de dados primários. Po- dem-se obter também os dados estatísticos em agências governamentais ou privadas, e neste caso, são chamados dados secundários. Questionário: Procedimentos: - especificar os objetivos gerais - conhecer o uso das respostas obtidas para melhor elaboração das perguntas - se possível, planejar os tipos de tabelas - certificar-se de que todas as informações podem ser obtidas (cuidados: ida- de/renda/datas/gastos – passado ideal 6 meses) - perguntas claras e precisas - evitar sugerir respostas - evitar redações longas - seguir alguma ordem lógica (mais simplesmais complexa) - incluir as instruções, se necessárias, no corpo do questionário - cuidado na aparência (gráfica e material utilizado para preenchimento) Campo: - decidir a que tipo de informantes será endereçado Piloto: - “experimentar” o questionário Crítica dos Questionários: - prever perda natural 1.2 - APRESENTAÇÃO DE DADOS ESTATÍSTICOS 1.2.1 - Apresentação Tabular Resolução 886 de 26/10/1966 - Fundação IBGE - “Normas de Apresentação Tabular “ Elementos Essenciais: - Título = designação do fenômeno observado, local e época (o quê? onde? quando?) - Corpo = conjunto de colunas e linhas casa - Cabeçalho = especifica o conteúdo da coluna - Coluna Indicadora = especifica o conteúdo das linhas (pode haver várias colunas indicadoras) ESTATÍSTICA E PROBABILIDADE - GST1079 - Fonte = indicação do órgão ou entidade responsável pelos dados (colocada no roda- pé) Elementos Complementares: Colocados no rodapé, após a fonte. - Notas = esclarecer o conteúdo da tabela ou indicar a metodologia na coleta ou preparo dos dados - Chamadas = esclarecer informação específica sobre determinada parte da tabela. In- dicadas por algarismos arábicos entre parênteses, à esquerda nas casas e à direita na coluna indicadora. A numeração será sucessiva, de cima para baixo, e da esquerda para a direita. A separação das chamadas será por ponto (.) Quando uma tabela ocupar mais de uma página, as chamadas devem figurar no rodapé da última página. Sinais Convencionais: – quando o dado não existir (pela natureza do fenômeno) ... quando não se dispõe do dado (ignorado) 0 0,0 0,00 quando valor do dado for menor que a unidade ou fração decimal adotada x quando houver omissão do dado para não haver individualização da informação Z quando o dado for rigorosamente zero Os números inteiros (ou sua parte inteira) serão separados por espaçamentos. 11 222 413 OBS.: O significado, dos sinais convencionais, deve figurar no relatório, antecedendo a tabela. Data de Referência dos Dados: A data não deve ter ponto separando grupo de três - algarismos, nem espaço entre alga- rismos. meses = 3 primeiras letras anos = consecutivos - 1896-915 1970-75 não consecutivos - 1966-1974 período de 12 meses do ano civil - 1980/81 OBS.: O uso de algarismos romanos deve ser evitado, inclusive para as datas. Apresentação de Tabelas As tabelas serão delimitadas na parte superior e inferior, por traços horizontais, não de- limitadas lateralmente. No caso da tabela ter de ocupar mais de uma página, não será delimitada na parte inferior e o cabeçalho será repetido na página seguinte, usando-se a expressão continua no cabeçalho. As tabelas devem ser: Exaustivas: - não devem existir itens sem alguma classe Ex.: estado civil : casado / solteiro (não é exaustivo) solteiro/casado/viúvo/divorciado/separado/outros (é exaustivo) Mutuamente Exclusivas: - não deve existir o mesmo item em mais de uma classe Ex.: 20 ׀–׀ 25 o 25 não pode estar nas duas classes 25 ׀–׀ 30 20 25 mutuamente excludente 25 30 Ter significação própria ESTATÍSTICA E PROBABILIDADE - GST1079 SÉRIES ESTATÍSTICAS Séries Históricas / Temporais / em Marchas - Elemento variável: época - Elementos fixos: local fenômeno Ex.: dia, mês, ano, século PREVISÃO DA POPULAÇÃO PARA A CIDADE DE SÃO PAULO 1984-2020 ANOS POPULAÇÃO (1.000 Hab.) 1984 9.439 1990 11.160 1995 12.224 2000 13.410 2010 14.910 2020 15.532 FONTE: SABESP Séries Geográficas / Territoriais / de Áreas - Elemento variável: local - Elementos fixos: época, fenômeno Ex.: Estado, Município NÚMERO DE EMISSORAS DE RÁDIO NAS GRANDES REGIÕES DO BRASIL 1980 GRANDES REGIÕES QUANTIDADE NORTE 43 NORDESTE 215 SUDESTE 517 SUL 403 CENTRO-OESTE 85 BRASIL 1.263 FONTE: SEEC-ME/IBGE Séries Específicas / Categóricas - Elemento variável: fenômeno - Elementos fixos: época, local Ex.: tipo sanguíneo, peso, altura, produto MATRÍCULAS NO ENSINO DE 3o. GRAU NO BRASIL 1983 (CICLO BÁSICO) ÁREAS DE ENSINO MATRÍCULAS C. BIOLÓGICAS 1.800.176 C. EXATAS 334.694 C. AGRÁRIAS 38.181 C. HUMANAS 761.367 LETRAS 94.618 ARTES 24.612 BÁSICO 5.344 FONTE: Serviço de Estatística da Educação e Cultura / IBGE ESTATÍSTICA E PROBABILIDADE - GST1079 Séries Mistas - Combinação das anteriores CONTINGENTE OPERACIONAL DA EMPRESA X Rio de Janeiro 1986 SEXO TIPO MASCULINO FEMININO TOTAL MAIORES 60 30 90 MENORES 40 10 50 TOTAL 100 40 140 FONTE: DEPARTAMENTO DE RELAÇÕES INDUSTRIAIS Série de Freqüências ou Distribuição de Freqüências - Todos os elementos: época, local e fenômeno, são fixos. Dispõe os valores da variá- vel e suas respectivas frequências. Xi fi 0 1 1 2 2 5 3 3 4 2 5 1 S = 14 fi 23 |— 38 5 38 |— 53 14 53 |— 68 13 68 |— 83 6 83 |— 98 8 46 Xi S = 1.2.2 - Apresentação Gráfica O gráfico torna compreensível uma tabela. Deve conter título, legenda e fonte. 2.1 - Tipos de Gráficos: Curvas: representam séries temporais (t 5) ESTATÍSTICA E PROBABILIDADE - GST1079 Barras e Colunas: representam séries geográficas, específicas, temporais (t < 5) Compara grandezas, por meio de retângulos de igual largura e alturas proporcionais às respectivas grandezas. Setores: representam séries geográficas, específicas com poucas ocorrências. Repre- sentam valores absolutos ou porcentagens complementares 57% 17% 13% 13% Polares: representam séries geográficas, específicas, temporais. Representa a varia- ção de um determinado fenômeno mensal, nos doze meses do ano, comparativo com a média0 50 100 1.2.3 – Análise e Interpretação dos Dados É a fase dos cálculos de medidas que permitem descrever o fenômeno que está sendo estudado. Nesta etapa fazem-se as conclusões e generalizações, baseadas nas tabelas, gráficos e medidas. 1.3 - ÓRGÃOS E NORMAS OFICIAIS Os dados nacionais, Brasil, podem ser obtidos junto ao Instituto Brasileiro de Geografia e Estatística – IBGE. Existe uma infinidade de fontes de dados de pesquisas que podem ser adquiridas através de outros órgãos públicos ou empresas privadas, nacionais e internacionais. As normas técnicas para apresentação tabular da estatística brasileira podem ser adqui- ridas junto a qualquer agência do IBGE. ESTATÍSTICA E PROBABILIDADE - GST1079 2 - DADOS ESTATÍSTICOS 2.1 - Origem Os dados estatísticos são os resultados da observação de um caráter quantitativo ou qualitativo relativo a um determinado fenômeno e podem ser provenientes de uma popu- lação ou de uma amostra. 2.2 - População e Amostra População: Total de objetos ou pessoas que apresentam as mesmas características dentro do mes- mo universo. Amostra: Subconjunto não vazio da população. 2.3 - Variáveis 2.3.1 - Conceito São características que são medidas, controladas ou manipuladas em um levantamento de dados. Diferem em muitos aspectos, principalmente no papel que a elas é dado em uma pesquisa e na forma como podem ser medidas. 2.3.2 - Tipos de variáveis Qualitativa: apresenta como realização qualidades, a característica é um atributo. . Nominal: não existe ordenação, envolvem categorias. Os elementos do conjunto são agrupados em classes ou categorias distintas. As categorias servem apenas para nomear. A ordem em que aparecem as alternativas não implica hierarquia, maior ou menor distância ou proporção entre elas. A alocação de um código numé- rico a essas categorias é completamente arbitrária. Ex. sexo, região, estado civil, cor dos olhos, religião, classificação de defeitos em uma máquina Ordinal: categorias ordenadas, existe certa ordem nos possíveis resultados. Esta- belece-se uma ordem hierárquica entre as categorias. A ordem resulta da distinção dos elementos de acordo com o maior ou menor grau com que possuem determi- nada característica. Ex. educação, nível socioeconômico, salinidade (baixa, média, alta) ESTATÍSTICA E PROBABILIDADE - GST1079 Quantitativa: apresenta como realização quantidades, a característica é a continuida- de da variável. Discreta: os valores formam um conjunto finito ou enumerável resultante de uma contagem. A variável é categorizada pela presença ou ausência da característica que a define. Ex. n.º de filhos, n.º de alunos em sala, n.º de defeitos, n.º de acidentes, n.º de alunos matriculados Contínua: os valores formam um intervalo de números reais resultante de uma mensuração podendo assumir um conjunto ordenado de valores dentro de deter- minados limites. Ex. peso, altura, idade, comprimento, espessura, velocidade, temperatura 2.3.3 - Variação em relação aos fenômenos Conforme a característica da variável, um aspecto observável, é o fenômeno ligado a ou- tras variáveis com determinada relação. Relação de covariação relação entre peso e estrutura. As variáveis mudam conjun- tamente. Relação de associação relação entre o desempenho escolar em Matemática e o desempenho escolar em Biologia. As variáveis podem mudar conjuntamente, mas as mu- danças em uma não produzem necessariamente mudanças na outra. Relação de dependência relação entre posição social e renda pessoal. A variável posição social depende da variável renda pessoal. Relação de causalidade relação entre o preço do produto e a procura por esse pro- duto. Mudanças em uma variável (preço) produzem mudanças na outra (procura). A análise estatística dependerá das relações presentes entre as variáveis em estudo. ESTATÍSTICA E PROBABILIDADE - GST1079 2.3.4 - Princípios para classificação das variáveis O não cumprimento de alguns princípios na definição das variáveis leva a uma perda de informação essencial ou à inutilidade completa da medição. 1º. Os valores de uma variável devem ser mutuamente excludentes. Uma e somente uma categoria da mesma classe (um valor da mesma variável) pode ser atribuída a cada um dos indivíduos em estudo. 2º. O conjunto dos valores possíveis deve ser exaustivo. Todos os elementos da amostra devem ser classificados em alguma das categorias estabelecidas. Observações: Notação Sigma: S - letra grega sigma maiúscula = soma de parcelas = n 1i iX 2 n 1i i n 1i 2 i XX == Arredondamento: Quando o 1º algarismo a ser abandonado for 0, 1, 2, 3 ou 4, fica inalterado o últi- mo algarismo a permanecer. 48,23 para 1 casa decimal 48,2 48,23 para inteiro 48 23,07 para inteiro 23 10,25 para inteiro 10 Quando o 1º algarismo a ser abandonado for 5, 6, 7, 8 ou 9, aumenta-se de uma unidade o último algarismo a permanecer. 23,07 para 1 casa decimal 23,1 34,59 para 1 casa decimal 34,6 34,59 para inteiro 35 12,50252 para 3 casas decimais 12,503 ESTATÍSTICA E PROBABILIDADE - GST1079 Exercícios: 1) Para pesquisar o esporte preferido dos alunos de uma escola com 1.500 alunos, foram selecionados, de modo imparcial, 900 alunos. Com base nessas informações, responda: a) Quantas pessoas tem a população dessa amostra? b) A amostra dessa pesquisa é formada de quantas pessoas? c) Qual variável foi estudada nessa pesquisa? 2) Luciano é o dono de uma loja de automóveis. Para ampliar a qualidade da loja, Lucia- no resolveu pesquisar o perfil dos clientes em relação à renda mensal, ao modelo de au- tomóvel preferido, ao número de automóveis que cada cliente possui e à qualidade dos serviços prestados. Dos 3.000 clientes cadastrados nessa loja, 1.600 foram entrevista- dos. a) Quantas pessoas tem a população dessa pesquisa? b) A amostra pesquisada foi de quantas pessoas? c) Determine as variáveis pesquisadas e classifique-as. 3) Classifique as variáveis a seguir em quantitativas (discretas ou contínuas) ou qualitati- vas (nominal ou ordinal). a) Cor dos olhos. b) Número de peças produzidas por hora. c) Diâmetro externo. d) Número de pontos em uma partida de futebol. e) Produção de algodão. f) Salários dos executivos de uma empresa. g) Número de ações negociadas na bolsa de valores. h) Sexo dos filhos. i) Tamanho de pregos produzidos por uma máquina. j) Quantidade de água consumida por uma família em um mês. k) Grau de escolaridade. l) Nível social. m) Tipo sanguíneo. n) Estado civil.
Compartilhar