Baixe o app para aproveitar ainda mais
Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original
Estatística Descritiva Wanderley de Oliveira Pereira 2017.1 O que é a estatística ? Para muitos, a estatística não passa de conjuntos de tabelas de dados numéricos. Os estatísticos são pessoas que coletam esses dados. Associar estatística a censo é perfeitamente correto do ponto de vista histórico. Estatística e Estado têm a mesma origem latina: status. Definição de Estatística A estatística é um conjunto de técnicas que permite, de forma sistemática, organizar, descrever, analisar e interpretar dados (numéricos ou não) oriundos de estudos ou experimentos, realizados em qualquer área do conhecimento. Estatística /Estatísticas • Estatística: indica uma metodologia desenvolvida para a coleta, a classificação, a apresentação, a análise e a interpretação de dados quantitativos e a utilização desses dados para a tomada de decisões. • Estatísticas: indica qualquer coleção de dados numéricos, reunidos com a finalidade de fornecer informações acerca de uma atividade qualquer. Importância A Estatística trabalha com informações, associando os dados a algum problema, descobrindo como e o que coletar, assim capacitando o pesquisador (ou profissional ou cientista) a obter conclusões a partir dessas informações, de tal forma que possam ser entendidas por outras pessoas. Áreas da Estatística • Estatística Descritiva: Conjunto de técnicas que objetivam coletar, organizar, apresentar, analisar e sintetizar os dados numéricos de uma população, ou amostra; • Estatística Inferencial: Processo de se obter informações sobre uma população a partir de resultados observados na amostra; • Probabilidade: Modelos matemáticos que explicam os fenômenos estudados pela Estatística em condições normais de experimentação. Exemplos • Anuário Estatístico Brasileiro O IBGE publica esse anuário apresentando, em várias tabelas, os mais diversos dados sobre o Brasil: educação, saúde, transporte, economia, cultura, etc. Embora simples, fáceis de serem entendidas, as tabelas são o produto de um processo demorado e extremamente dispendioso de coleta e apuração de dados. Exemplos • Análise financeira. Os analistas financeiros estudam dados sobre a situação da economia, visando explicar tendências dos níveis de produção e de consumo, projetando-os para o futuro. Probabilidade • O processo de generalização, que é característico do método indutivo, está associado a uma margem de incerteza. A existência da incerteza deve-se ao fato de que a conclusão, que se pretende obter para o conjunto de todos os indivíduos analisados quanto a determinadas características comuns, baseia-se em uma parcela do total das observações. A medida da incerteza é tratada mediante técnicas e métodos que se fundamentam na Teoria da Probabilidade. Essa teoria procura quantificar a incerteza existente em determinada situação. Fases do Método Estatístico • Definição do problema • Planejamento • Coleta de dados • Apuração dos dados • Apresentação dos dados • Análise e Interpretação dos dados Definição do problema Consiste na: • formulação correta do problema; • examinar outros levantamentos realizados no mesmo campo (revisão da literatura); • saber exatamente o que se pretende pesquisar é definir o problema corretamente (variáveis, população, hipóteses, etc.) Planejamento Determinar o procedimento necessário para resolver o problema: • Como levantar informações; • Tipos de levantamentos: - Por Censo (completo); - Por Amostragem (parcial). • Cronograma, Custos, etc. Coleta dos dados Consiste na obtenção dos dados referentes ao trabalho que desejamos fazer. • A coleta pode ser: Direta - diretamente da fonte – contínua, periódica e ocasional; Indireta - feita através de outras fontes – feitas por analogia, proporcionalização, indícios e avaliação. Apuração dos dados Consiste em resumir os dados, através de uma contagem e agrupamento. É um trabalho de coordenação e de tabulação. • Apuração: manual, mecânica, eletrônica e eletromecânica. Apresentação dos dados É a fase em que vamos expor os resultados obtidos na coleta e na organização. • Esta apresentação pode ser: Tabular (apresentação numérica) Gráfica (apresentação geométrica) Análise e Interpretação dos dados É a fase mais importante e também a mais delicada. O pesquisador tira conclusões que o auxiliam a resolver seu problema. Conceitos Fundamentais e Definições • População: conjunto de elementos que tem pelo menos uma característica em comum. • Amostra: subconjunto de elementos de uma população. Este subconjunto deve ter dimensão menor que o da população e seus elementos devem ser representativos da população. • Finitos: possuem um número limitado de elementos. • Infinitos: possuem um número ilimitado de elementos. • Amostragem Aleatória: Cada elemento da população tem a mesma chance de ser escolhido. • Amostragem Estratificada: Classificar a população em, ao menos dois estratos e extrair uma amostra de cada um. • Amostragem Sistemática: Escolher cada elemento de ordem k. • Amostragem por Conglomerados: Dividir em seções a área populacional, selecionar aleatoriamente algumas dessas seções e tomar todos os elementos das mesmas. • Amostragem de Conveniência: Utilizar resultados de fácil acesso. • Variável: é a característica que vai ser observada, medida ou contada nos elementos da população ou da amostra e que pode variar, ou seja, assumir um valor diferente de elemento para elemento. • Variável qualitativa: é uma variável que assume como possíveis valores: atributos ou qualidades. Também são denominadas variáveis categóricas. • Variável qualitativa nominal: atributos ou qualidades que não apresentam uma ordem natural de ocorrência. • Variável qualitativa ordinal: atributos ou qualidades que apresentam uma ordem natural de ocorrência. Exemplos • Exemplo 01: meios de informação utilizados pelos alunos da disciplina Estatística Descritiva do curso de Matemática da FAFIDAM: televisão, revista, internet, jornal. • Exemplo 02: estado civil dos alunos da disciplina Estatística Descritiva do curso Matemática da FAFIDAM: solteiro, casado, separado. • Variável quantitativa: é uma variável que assume como possíveis valores, números. • Variável quantitativa discreta: representadas geralmente por números inteiros, formando um conjunto finito ou enumerável. • Variável quantitativa contínua: representadas por números, em intervalos da reta real e, em geral, resultantes de mensurações. Exemplos • Exemplo 03: Idade dos alunos da disciplina Estatística Descritiva do curso de Matemática da FAFIDAM: 18, 18, 19, 17, 21, 25, 30,... • Exemplo 04: peso (quilogramas) dos alunos da disciplina Estatística Descritiva do curso de Matemática da FAFIDAM: 46,5; 48,85; 49; 51,30; 55,12; 62,0 ... Representação tabular Série Estatística Uma série estatística é um conjunto de dados ordenados segundo uma característica comum, as quais servirão posteriormente para se fazer análises e inferências. Série Homógrada: a variável descrita tem variação discreta. Série Heterógrada: o fenômeno ou fato é apresentado em graduações ou subdivisões. Série Temporal ou Cronológica: É a série cujos dados estão dispostos em correspondência com o tempo, ou seja, varia o tempo e permanece constante o fato e o local. Série Geográfica ou Territorial: É a série cujos dados estão dispostos em correspondência com o local, ou seja, varia o local e permanece constante a época e o fato. Série Específica ou Qualitativa: É a série cujos dados estão dispostos em correspondência com a espécie ou qualidade, ou seja, varia o fato e permanece constante a época e o local. Série Mista ou Composta: A combinação entre duas ou mais séries constituem novas séries denominadas compostas e apresentadas em tabelas de dupla entrada. O nome da série mista surge de acordo com a combinação de pelo menos dois elementos. Distribuição de Frequências É o tipo de série estatística na qual permanece constante o fato, o local e a época. Os dados são colocados em classes preestabelecidas, registrando a frequência de ocorrência. Algumas definições • Dados Brutos: dados originais que ainda não se encontram prontos para análise. • Rol: são os dados brutos organizados em ordem crescente ou decrescente. Distribuição de Frequência Discreta ou Pontual: Os valores das variáveis aparecem individualmente. Distribuição de Frequências Intervalar: os valores da variável não aparecem individualmente, mas agrupados em classes. Distribuição de Frequência Discreta Distribuição de Frequências Intervalar Elementos de uma distribuição de frequências. • Amplitude total (A): é a diferença entre o maior e o menor número do rol. Elementos de uma distribuição de frequências. • Amplitude total (A): é a diferença entre o maior e o menor número do rol. • Número de classes (K). A Regra de Sturges, que nos dá o número de classes em função do número de valores da variável. Para uma série com n elementos (valores): K=1+3,3.logn ou K=5, se n for menor ou igual a 25 K ≈ 𝑥 = 𝑛, se n for maior que 25 • Amplitude de um intervalo de classe (h): é o comprimento que define a classe. h=A/K. • Amplitude de um intervalo de classe (h): é o comprimento que define a classe. h=A/K. • Limites de Classe (i): os extremos de cada classe li = limite inferior (linf) e Li = limite superior (Lsup) Observação: Vamos trabalhar com intervalos fechados à esquerda e abertos à direita; isso significa que valores iguais ou superiores ao limite inferior são considerados nessa classe e valores iguais e/ou superiores ao limite superior são considerados na classe abaixo. • Ponto Médio da Classe - (xi): o ponto que divide o intervalo de classe em duas partes iguais. 𝑥𝑖 = 𝑙𝑖 + 𝐿𝑖 2 • Frequências • Frequências simples ou absoluta da classe i (fi): são os valores que realmente representam o número de dados de cada classe. • A soma das frequências simples é igual ao número total dos dados. • Frequências relativas (fri) – são os valores das razões entre as frequências simples e o número total de dados. fr𝑖 = 𝑓𝑖 𝑛 • Frequência acumulada (Fi) – é o total das frequências de todos os valores inferiores ao limite superior do intervalo de uma dada classe. • Frequência acumulada relativa (Fri) – é a frequência acumulada da classe, dividida pela frequência total da distribuição. Fr𝑖 = 𝐹𝑖 𝑛 Conceitos básicos Proporção x Porcentagem x Razão x Taxa Arredondamentos • 1°. Se o primeiro algarismo após aquele que formos arredondar for de 0 a 4, conservamos o algarismo a ser arredondado e desprezamos os seguintes. • 2°. Se o primeiro algarismo após aquele que formos arredondar for de 6 a 9, acrescenta-se uma unidade no algarismo a ser arredondado e desprezamos os seguintes. • 3°. Se o primeiro algarismo após aquele que formos arredondar for 5, seguido apenas de zeros, conservamos o algarismo se ele for par ou aumentamos uma unidade se ele for ímpar, desprezando os seguintes. • 4°. Se o 5 for seguido de outros algarismos dos quais, pelo menos um é diferente de zero, aumentamos uma unidade no algarismo e desprezamos os seguintes. • 5°. Quando, arredondarmos uma série de parcelas, e a soma ficar alterada, devemos fazer um novo arredondamento (por falta ou por excesso), na maior parcela do conjunto, de modo que a soma fique inalterada. Exemplo 01 • Construa a Tabela de Frequência sobre os dados abaixo: Alturas (em cm) de 50 estudantes da Universidade ABC 140 141 141 143 143 143 145 146 1470 149 149 149 150 150 151 152 152 153 153 154 155 155 156 157 157 159 159 160 160 160 160 162 163 164 164 165 167 168 168 168 169 171 171 172 172 174 176 178 182 192 Exemplo 02 20 observações relativas ao índice pluviométrico em determinados municípios do Estado MILÍMETROS DE CHUVA 144 152 159 160 160 151 157 146 154 145 141 150 142 146 142 141 141 150 143 158 GRÁFICOS • Histograma: é formado por um conjunto de retângulos justapostos, cujas bases se localizam sobre o eixo horizontal, de tal modo que seus pontos médios coincidem com os pontos médios dos intervalos de classe. HISTOGRAMA • As larguras dos retângulos são iguais às amplitudes dos intervalos de classe. • As alturas dos retângulos devem ser proporcionais às frequências das classes, sendo igual a amplitude dos intervalos. • Polígono de frequência: é um gráfico em linha, sendo as frequências marcadas sobre perpendiculares ao eixo horizontal, levantada pelos pontos médios dos intervalos de classe. • Polígono de frequência acumulada: é traçado marcando-se as frequências acumuladas sobre perpendiculares ao eixo horizontal, levantadas nos pontos correspondentes aos limites superiores dos intervalos de classe. • Distribuição de frequência sem intervalos de classe: é representada graficamente por um diagrama em que cada valor da variável é representado por um segmento de reta vertical e de comprimento proporcional à respectiva frequência. Exemplo 01 Construir um Histograma, um polígono de frequências e um polígono de frequências acumuladas para representar os dados abaixo. Alturas (em cm) de 50 estudantes da Universidade ABC 140 141 141 143 143 143 145 146 1470 149 149 149 150 150 151 152 152 153 153 154 155 155 156 157 157 159 159 160 160 160 160 162 163 164 164 165 167 168 168 168 169 171 171 172 172 174 176 178 182 192 Gráficos de Linhas • Geralmente utilizado para ilustrar uma Série Temporal. • Num plano de 2 dimensões, marcamos um ponto no par ordenado correspondente a variável e ao valor observado. • Em seguida, unimos cada ponto ao seu sucessor por um segmento de reta. Gráfico de Linhas • Geralmente utilizado para ilustrar uma Série Mista, em que uma série é a Série Temporal. Gráficos de colunas ou barras • Usado para ilustrar qualquer tipo de série (variáveis nominais e ordinais). Gráficos de colunas ou barras • Características: • Os retângulos devem ter a mesma largura; • O comprimento do retângulo é proporcional a frequência (escolher uma escala); • A distância entre os retângulos deve ser de 2/3 da largura do retângulo. • O número de retângulos não deve ser maior que 12. Gráfico de colunas comparativas (Justapostas) • Ilustrar uma Série Mista Gráfico de colunas comparativas (Sobrepostas) Gráfico de Barras • Séries com variáveis com designações extensas. Características iguais ao de Colunas. Gráfico de Barras comparativo
Compartilhar