Baixe o app para aproveitar ainda mais
Prévia do material em texto
GRADUAÇÃO ENGENHARIA CIVIL DOCENTE: Ms. ADRIANA EMA NOGUEIRA ESTATÍSTICA O que é a Estatística? Considerada um ramo da matemática aplicada, a estatística trabalha com dados numéricos relativos, fenômenos sociais ou naturais, objetivando medir ou estimar a extensão desses fenômenos e suas inter-relações. A palavra Estatística surge, pela primeira vez, no séc. XVIII. Alguns autores atribuem esta origem ao alemão Gottfried Achemmel (1719-1772), que teria utilizado pela primeira vez o termo statistik, do grego statizein; outros dizem ter origem da mesma raiz latina da palavra Estado (organização política): status: pois as estatísticas eram coletadas para as finalidades relacionadas com o Estado (objetivos militares, tributários, recenseamentos, entre outros). ESTATÍSTICA: É uma ciência que tem por base a coleta dos dados, do passado ou presente, os quais submetidos a um tratamento científico, a transformam numa ciência de previsão para o futuro. Evolução histórica da Estatística O primeiro dado disponível sobre um levantamento estatístico foi referido por Heródoto, que afirmava ter-se efetuado em 3050 a. C. um estudo das riquezas da população do Egito com a finalidade de averiguar quais os recursos humanos e econômicos disponíveis para a construção das pirâmides. Há também notícia de que no ano 2238 a. C. se realizou um levantamento estatístico com fins industriais e comerciais ordenado pelo imperador chinês Yao. Existem indícios, que constam na Bíblia, relativamente a recenseamentos feitos por Moisés (1490 a.C.). Outra estatística referida pelos investigadores foi feita no ano 1400 a. C., quando Ramsés II mandou realizar um levantamento das terras do Egito. Também os romanos faziam o recenseamento dos cidadãos e dos bens. Eram os censores, magistrados romanos, que asseguravam o censo dos cidadãos. Guilherme, “O Conquistador”, que reinou entre 1066 e 1087, ordenou que se fizesse um levantamento estatístico da Inglaterra. Este levantamento deveria incluir informações sobre terras, proprietários, uso da terra, animais... e serviria de base, também, para o cálculo de impostos. Para responder ao desenvolvimento social surgiram estas primeiras técnicas estatísticas: classificar, apresentar e interpretar os dados recolhidos foram para os censos e são para a Estatística um aspecto essencial do método utilizado. A Estatística é dividida em duas áreas: ESTATÍSTICA INDUTIVA (Inferência Estatística) ESTATÍSTICA DESCRITIVA ESTATÍSTICA INDUTIVA É A PARTE DA ESTATÍSTICA QUE TEM POR OBJETIVO OBTER E GENERALIZAR CONCLUSÕES PARA A POPULAÇÃO A PARTIR DE UMA AMOSTRA, ATRAVÉS DO CÁLCULO DE PROBABILIDADE. A TAIS CONCLUSÕES ESTÃO SEMPRE ASSOCIADAS A UM GRAU DE INCERTEZA E CONSEQUENTEMENTE, A UMA PROBABILIDAE DE ERRO. ESTATÍSTICA DESCRITIVA É A PARTE DA ESTATÍSTICA QUE PROCURA SOMENTE DESCREVER E AVALIAR UM CERTO GRUPO, SEM TIRAR QUAISQUER CONCLUSÕES OU INFERÊNCIAS SOBRE UM GRUPO MAIOR. A Estatística Descritiva pode ser resumida nas seguintes etapas: Definição do problema; Planejamento; Coleta dos dados; Crítica dos dados. Apresentação dos dados; Tabelas Gráficos Descrição dos dados. ATRIBUIÇÕES: A obtenção ou coleta de dados: é normalmente feita através de um questionário ou de observações direta de uma população ou amostra; A organização dos dados: consiste na ordenação e crítica quanto à correção dos valores observados, falhas humanas, omissões, abandono de dados duvidosos; A representação dos dados: através de gráficos e tabelas, que permitem a visualização instantânea de todos os dados. Estatística descritiva teremos dois métodos para a apresentação dos dados: Métodos gráficos (apresentação gráfica e tabular); Métodos Numéricos (apresentações de medidas de posição e/ou dispersão). Apresentação gráfica e tabular Gráficos: mais eficientes para apresentar dados; Indicadores de situações; Visão mais rápida e fácil dos dados; Um gráfico é uma figura construída a partir de uma tabela; Tabelas: mais precisas e possibilitam um rigor maior. ARREDONDAMENTO : PRECISÃO DESEJADA I. NÚMEROS APROXIMADOS Valores discretos ou descontínuos: são as variáveis que podem tomar um número finito ou uma infinidade numerável de valores. Valores contínuos: são as variáveis que podem tomar qualquer valor de um determinado intervalo. ARREDONDAMENTO DE DADOS Resolução nº 886/66 da Fundação IBGE (Instituto Brasileiro de Geografia e Estatística) 0,1,2,3,4 : Inaltera o último algarismo ex: 53,24 = 53,2 6, 7, 8, 9 : Aumenta-se uma unidade ao algarismo que permanecer. ex:42,87 = 42,9 Quando terminar em 5, existirá 2 soluções: Antes do nº 5 (nº par) = permanece inalterado ex: 25,65 = 25,6 Antes do nº 5 (nº ímpar) = aumenta-se uma casa decimal ex: 25,75 = 25,8 REPRESENTAÇÃO GRÁFICA Apresenta alguns requisitos: 1) Uso de escalas: divide o eixo em partes iguais; 2) Sistema de coordenadas: plano cartesiano; 3) Simplicidade: destituído de detalhes (secundários); 4) Clareza: interpretação correta dos valores; 5) Veracidade: expressa a verdade do dado estudado. GRÁFICOS II. GRÁFICOS Os gráficos mais utilizados são: 1. Gráficos de informação: Público em geral; Objetivo: clareza e rapidez; Expositórios. 2. Gráficos de análise: Análise estatística; Acompanhado de tabela; Texto: atenção pontos principais. TIPOS DE GRÁFICOS Classificação dos gráficos: Diagramas Estereogramas Cartogramas Pictogramas DIAGRAMAS Gráficos geométricos dispostos em duas dimensões; São os mais usados em análises estatísticas. Podem ser: a) Gráfico em Linha • Utiliza a linha poligonal para representar uma série estatística; • São freqüentemente usados para representação de séries cronológicas com um grande número de períodos de tempo. • Objetivo: Mostrar a tendência do fenômeno ao longo do tempo • As linhas são mais eficientes do que as colunas, quando existem intensas flutuações nas séries ou quando há necessidade de se representarem várias séries em um mesmo gráfico. • Para construí-lo, basta marcar os pontos e uni-los por meio de segmentos de reta. Produção Brasileira de Carvão 1987-92 0 10 20 30 40 50 60 70 80 19 87 19 88 19 89 19 90 19 91 19 92 anos qu an tid ad e (1 .0 00 t) b) Gráfico em colunas ou em barras: Representação de uma série por meio de retângulos, dispostos verticalmente (Coluna ou Histograma) ou horizontalmente (Barras); Retângulos têm a mesma base e as alturas são proporcionais aos respectivos dados. Histograma: é um gráfico de barras em que a área destas é proporcional à frequência, não havendo espaço entre as mesmas. Só se utiliza em variáveis quantitativas contínuas. 0 20 40 60 80 100 Minas Gerais Parana Rio de janeiro São Paulo População do Brasil População do Brasil c) Gráfico em colunas ou em barras múltiplas: Usado para empregar, simultaneamente, 2 ou mais fenômenos, com o propósito de comparação; d) Gráfico emsetores Utilizado para ressaltar a participação total; Dados qualitativos; Somente deve ser empregado quando há, no máximo, 7 dados. e) Gráfico polar: Ideal para representar séries temporais cíclicos. ESTEREOGRAMAS São gráficos geométricos em 3 dimensões (volume); Utilizados em tabelas de dupla entrada ou de contingência. CARTOGRAMAS Representações sobre uma carta geográfica (mapas); Objetivo: figurar dados estatísticos relacionados a áreas geográficas ou políticas; PICTOGRAMAS Representação gráfica contém figuras. III. TABELAS TABELA: É uma unidade autônoma e deve ser de acordo com IBGE (Instituto Brasileiro de Geografia e Estatística), resumindo um conjunto de observações. As tabelas servem para apresentar séries estatísticas. Constitui-se dos seguintes elementos: • Legenda: ordem e título da tabela; • Cabeçalho: conjunto de títulos de cada coluna; • Corpo da tabela: linhas e colunas separados por traços verticais • Coluna indicadora: 1ª coluna indica conteúdo de cada uma delas; • Rodapé: fonte e dados explicativos em NOTA, mais de um (1,2,..). IV. SÉRIES ESTATÍSTICAS SÉRIE ESTATÍSTICA: É qualquer tabela que apresenta a distribuição de um conjunto de dados estatísticos em função da época, do local ou da espécie. Os três caracteres presentes na tabela que as apresenta são: O Fenômeno (espécie do fato ou fator especificativo) – que é descrito; O Local (fator espacial ou geográfico) – onde o fenômeno acontece; A Época (fator temporal ou cronológico) – a que se refere o fenômeno analisado; As séries são divididas em dois grupos: Séries Homógradas: aquelas em que a variável descrita apresenta variação discreta ou descontínua. São séries homógradas a série temporal, a série geográfica e a série específica. Séries Heterógradas: aquelas nas quais o fenômeno ou o fato apresenta gradações ou subdivisões. Embora fixo, o fenômeno varia em intensidade. A distribuição de freqüências é uma série heterógrada. Tipos de Séries Estatísticas As séries estatísticas diferenciam-se de acordo com a variação de um dos três elementos: época, local e fenômeno. Série Temporal Também chamada de série cronológica, série histórica, série evolutiva ou marcha, identifica-se pelo caráter variável do fator cronológico. Elemento variável: Época Elementos Fixos: Local e Fenômeno Tabela 1 ABC VEÍCULOS LTDA. Vendas no 1º bimestre de 1996 PERÍODO UNIDADES VENDIDAS JAN/96 20000 FEV/96 10000 TOTAL 30000 Fonte: Relatório da empresa Série Geográfica Também chamada de série territorial, série espacial ou série de localização, identifica-se pelo caráter variável do fator geográfico. Elementos variável: Local Elementos Fixos: Época e Fenômeno Tabela 2 ABC VEÍCLULOS LTDA. Vendas no 1º bimestre de 1996 FILIAIS UNIDADES VENDIDAS * São Paulo 1 3 Rio de Janeiro 1 7 TOTAL 3 0 Fonte: Relatório da empresa * Em mil unidades Série Específica Também chamada de série categórica, série por categoria, identifica-se pelo caráter variável de fator especificativo. Elemento variável: Fenômeno Elemento Fixos: Local e Época Tabela 3 ABC VEÍCLULOS LTDA. Vendas no 1º bimestre de 1996 MARCA UNIDADES VENDIDAS * FIAT 1 8 GM 1 2 TOTAL 3 0 Fonte: Relatório da empresa * Em mil unidades Tabelas de Dupla Entrada = Séries Conjugadas São apropriadas à apresentação de duas ou mais séries de maneira conjugada, havendo duas ordens de classificação: uma horizontal e outra vertical. Exemplos: A) Série específico-temporal B) Série geográfico-temporal Tabela 4 ABC VEÍCLULOS LTDA. Vendas no 1º bimestre de 1996 FILIAIS Janeiro/96 Fevereiro/96 São Paulo 1 0 3 Rio de Janeiro 1 2 5 TOTAL 2 2 8 Fonte: Relatório da empresa * Em mil unidades Tabela 5 População economicamente ativa por setor de atividades – Brasil Setor População ( 1 000 Hab.) 1940 1950 1960 Primário 8 968 10 255 12 163 Secundário 1 414 2 347 2 962 Terciário 3 620 4 516 7 525 Fonte : IPEA V. DISTRIBUIÇÃO DE FREQUÊNCIA Constitui-se no tipo de tabela importante para a Estatística Descritiva. Tabela primitiva ou dados brutos Após a coleta, os dados são registrados de forma desordenada. Portanto, sendo difícil extrair os dados. Organizasr, retirar informações e conclusões sobre o fenômeno estudado. Organização dos dados. (crescente ou decrescente). ROL: é quando os dados da tabela são organizados. Distribuição de frequência sem intervalo de classe Frequência: nº de indivíduos que fica relacionado a um determinado intervalo fixado. Obtemos uma tabela que recebe o nome de distribuição de frequência. 1º PASSO: Definir o nº de classes que a tabela terá; 2º PASSO: Amplitude; 3º PASSO: Limites dos intervalos de classe. Sem intervalo de classe Tabela 6 Número de acidentes por dia na rodovia X em Janeiro de 2007 N° de acidentes por dia N° de dias 0 10 1 7 2 4 3 5 4 3 5 2 Fonte: DNER Com intervalo de classe Tabela 87 Retiradas diárias no Banco do Brasil na cidade X em Janeiro de 2006. Retirada Freqüência 500 ├ 600 12 600 ├ 700 36 700 ├ 800 63 800 ├ 900 81 900 ├ 1.000 77 1.000 ├ 1.100 42 1.100 ├ 1.200 24 Fonte: Arquivos do BB OBTENÇÃO DO Nº DE CLASSES As classes podem ser obtidas de 3 formas: a) Regra de Sturges; b) Truman L. Kelley; c) Para n≤ 25 e para n≥ 25 REGRA DE STURGES Dados: i = intervalo de classes e n = nº total de dados i= 1+ 3,3. log n i = 1+ 3,3. log 40 i = 1+ 3,3. 1,60206 i = 1+ 5,2868 i = 6,2868 i = 7 classes TRUMAN L. KELLEY n 5 10 25 50 100 200 500 1000 i 2 4 6 8 10 12 15 15 n = 40 i = sugere o nº total de observações i = 8 classes PARA n≤25 e para n≥25 Para n≤ 25 , o i = 5 Para n ≥ 25, o i = √n i = √40 i = 7 classes. Mesmo utilizando algumas sugestões é necessário ajustar o número de classes que a tabela terá, englobando todas as variáveis em estudo. AMPLITUDE DO INTERVALO DE CLASSE (h) REGRA DE STURGES i = nº classes h = AT/ i h = (173 – 150)/7 h = 3,29 h = 4 (amplitude do intervalo de classe) Sempre arredondamos para cima, sem levar em consideração as regras de arredondamento. CONSTRUÇÃO DA DISTRIBUIÇÃO DE FREQUÊNCIA COM INTERVALO DE CLASSE ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA Tipos de Frequências Representação gráfica de uma distribuição de frequência Representada por: Histograma; Polígono de frequência; Polígono de frequência acumulada (Ogiva de Galton). Histograma: • Retângulos justapostos; • Amplitude proporcional a soma das frequências; • Frequências relativas: área unitária; • Comparar 2 distribuições, histograma de frequência relativa. Polígono de Frequência: gráfico em linha; marca-se o ponto médio das classes e depois é só traçar a linha. POPULAÇÃO População: conjunto da totalidade dos indivíduos sobre o qual se faz uma inferência. Linguagem mais formal: é o conjunto constituído por todos os indivíduos que apresentam pelo menos uma característica comum, cujo comportamento interessa analisar(inferir). A população pode ser: Finita: quando apresenta um número limitado de indivíduos; ex: população constituída por todos os parafusos produzidos em uma empresa; nascimento de crianças em Rondônia; Infinita: quando o número de observações for infinito. ex: população de todos os resultados de cara e coroa em sucessivos lances de uma moeda. AMOSTRA É um conjunto de elementos retirados de uma população, ou seja, o processo (criterioso) de escolha da amostra, constituindo a parte inicial de qualquer estudo estatístico. Através da análise dessa amostra estaremos aptos para analisar os resultados da mesma forma que se estudássemos toda a população. A amostra é sempre FINITA. Quanto maior for a amostra , mais significativa é o estudo. PARÂMETRO É UMA CARACTERÍSTICA NÚMERICA ESTABELECIDA POR TODA UMA POPULAÇÃO. DADO ESTATÍSTICO É SEMPRE UM NÚMERO REAL. Pode ser: Primitivo ou Bruto: é aquele que não sofreu nenhuma transformação matemática. Número direto. Elaborado ou secundário: é aquele que sofreu transformação matemática. Ex: porcentagem, média, etc. Preparação de dados para a análise estatística DEFINIÇÃO DO PROBLEMA Formulação correta do problema a ser estudado ou a informação a ser obtida; Além do problema o analista fará outros levantamentos já realizados a campo. PLANEJAMENTO Determinar o procedimento para resolver o problema; Perguntas: que dados deverão ser obtidos? Como obtê- los? Fase que será escolhido o tipo de levantamento a ser utilizado. Sob esse aspecto, pode haver dois tipos de levantamento: 1) Levantamento censitário: quando a contagem for completa, abrangendo todo o universo; 2) Levantamento por amostragem: quando a contagem for parcial. Outros elementos importantes deverão ser trabalhados nessa fase, como: cronograma das atividades, custos, examinar as informações disponíveis, delineamento da amostra e a forma como serão escolhidos os dados. Coleta contínua: os dados são obtidos ininterruptamente, por um determinado período: um ano,por exemplo; Coleta periódica: realizada em períodos curtos; Coleta ocasional: dados coletados esporadicamente, atendendo a uma emergência. COLETA INDIRETA: é inferida através da coleta direta, ou através do conhecimento de outros fenômenos que, estejam relacionados com o fenômeno estudado. APURAÇÃO DOS DADOS Apuração dos dados ou sumarização, consiste em resumir os dados, através de sua contagem e agrupamento. ANÁLISE E INTERPRETAÇÃO DOS DADOS Última fase e a mais importante e a mais delicada, onde o interesse maior está em retirar conclusões que auxiliem o pesquisador a resolver o problema, ou responder a informação que se deseja obter. AMOSTRAGEM E TÉCNICAS DE AMOSTRAGEM AMOSTRAGENS OU SONDAGENS: são procedimentos de seleção de subconjuntos de populações- as amostras-, destinados ao conhecimento de uma ou várias características dos universos investigados. Quando se estuda uma população por sondagens, é necessário selecionar suas amostras representativas, a fim de que os resultados obtidos possam ser inferidos para o conjunto objeto da investigação. Essa técnica será definida na fase do planejamento, e será aplicada na fase da coleta dos dados. As amostragens dividem-se em dois grupos: a) Amostragens probabilísticas; a) Amostragens não-probabilísticas. Amostragens Probabilísticas São amostragens em que a seleção é aleatória de tal forma que cada elemento da população tem uma probabilidade conhecida de fazer parte da amostra. Assim se N é o tamanho da população e se todos os elementos da população possuem igual probabilidade, teremos que 1/N é a probabilidade de cada elemento participar da amostra. Amostragens Não-Probabilísticas Não-probabilística ou intencional: são amostragens em que há uma escolha deliberada dos elementos da amostra. Para se fazer inferências estatísticas, ou seja, tirar conclusões sobre a população, a partir de observações da amostra, há necessidade de que o processo seja probabilístico, pois somente neste caso poderemos avaliar a probabilidade de erro. Tipos de Amostras Probabilísticas 1) AMOSTRAS ALEATÓRIAS SIMPLES: São aquelas cujos indivíduos foram obtidos ao acaso da população, tendo cada amostra a mesma chance de ser escolhida dentre todas aquelas possíveis do mesmo tamanho. Os termos aleatório, randômico, casual e ao acaso são sinônimos. As amostras aleatórias simples podem ser obtidas por sorteio, em tabelas de números aleatórios e por computação. 3) AMOSTRAS ESTRATIFICADAS: Trata-se de amostras obtidas de subconjuntos de uma população designados por estratos ou grupos, sem superposição de unidades entre eles, retirando-se amostra randômica de cada um. Há maior homogeneidade dos elementos dentro de cada grupo e maior diversidade entre os estratos, possibilitando maximizar as informações sobre todo o universo investigado. Deve-se definir cuidadosamente a quantidade de estratos, os limites de cada um e o número de variáveis a investigar. ex: A população de uma cidade de 600 habitantes foi dividida em dois estratos: urbano e rural, com a finalidade de se estudar a incidência de malária em cada grupo de seus residentes. O estrato urbano possui 400 habitantes e o rural, 200. O tamanho total da amostra deve compreender 60 pessoas. Deve-se notar que o tamanho da amostra retirada de cada subconjunto é proporcional ao tamanho de cada estrato em relação ao tamanho da população. 4) AMOSTRAS POR CONGLOMERADOS: Os elementos simples das amostras são obtidos de unidades coletivas denominadas conglomerados ou cluters. Os conglomerados têm acentuada similitude á variação de seus indivíduos, como as colméias, blocos residenciais, as aldeias de um mesmo grupo indígena, etc. Por esse procedimento é possível a listagem de todos os cluters, a escolha randômica de alguns, a relação completa das unidades simples daqueles já sorteados e, finalmente, a obtenção casual dos indivíduos dos conglomerados selecionados. A retirada da amostra pode ser efetuada em dois ou mais estágios: duplo, triplo, múltiplo, conforme o caso. ex: Calcular o peso médio de estudantes da quinta série do ensino fundamental das escolas públicas de um município. O total de estabelecimentos de ensino é de 52 escolas (conglomerados do 1º estágio), cada uma com 10 turmas da quinta série (conglomerados do 2º estágio), e cada turma apresentando 40 alunos matriculados (unidades simples, 3º estágio). Foram selecionadas, 5, 4 e 8 unidades dos estágios 1º, 2º e 3º, respectivamente, constituindo, ao final, amostra de 160 discentes (5x4x8). VARIÁVEIS Uma variável é qualquer característica de um elemento observado (pessoa, objeto ou animal). Algumas variáveis como o sexo, enquadram os indivíduos em categoriais; Outras, como altura, peso, tomam valores numéricos com os quais podemos fazer cálculos; As variáveis podem ser: Qualitativa e Quantitativa Tipos de Variáveis QUALITATIVA: quando seus valores são expressos por atributos: Sexo: masculino, feminino. Cor da pele: branca, preta, amarela. Tipo sanguíneo: A, O, AB B. Ou seja, quando trabalhamos com letras. QUANTITATIVA: quando seus valores são expressos em números (salários, idadedos alunos de uma escola, número de filhos, etc.). Uma variável quantitativa que pode assumir, teoricamente, qualquer valor entre dois limites recebe o nome de variável contínua (altura, peso, etc.); Uma variável que só pode assumir valores pertencentes a um conjunto enumerável recebe o nome de variável discreta ( número de filhos, números de vitórias, etc.). Portanto, variável quantitativa mexe com números e estes podem ser quantitativos contínuos ou discretos).
Compartilhar