Baixe o app para aproveitar ainda mais
Prévia do material em texto
Aula 1: Conceitos fundamentais de Estatística Estatística Caruaru - 2014 Definição � Estatística: É uma parte da matemática aplicada que fornece métodos para coleta, organização, descrição, análise e interpretação dos dados e utilização dos mesmos na tomada de decisões. A estatística divide-se em duas partes: – estatística descritiva: preocupa-se com a forma pela qual podemos apresentar um conjunto de dados em tabelas e gráficos, e também resumir as informações contidas nestes dados mediante a utilização de medidas estatísticas. – inferência estatística: baseia-se na teoria das probabilidades para estabelecer conclusões sobre todo – inferência estatística: baseia-se na teoria das probabilidades para estabelecer conclusões sobre todo um grupo (chamado população), quando se observou apenas uma parte (amostra) representativa desta população. � Fases do método estatístico: � Coleta de dados � Contínua: frequência de alunos, nascimento e etc � Periódica: trimestral, de 10 em 10 anos e etc. � Ocasional: epidemias e etc. � Apuração de dados � Exposição ou apresentação de dados � Análise dos resultados � Estatística nas empresas: � É necessário ter em mente que a estatística é uma ferramenta para o gestor ou executivo, nas respostas dos “porquês” de seus problemas que podem ser explicados por uma análise de dados. � Para estatística ser bem usada, é necessário conhecer os seus fundamentos e princípios, e acima de tudo que o gestor ou executivo desenvolva um espírito crítico. � Atualmente, as empresas têm procurado profissionais como executivos que tenham um nível de conhecimento de estatística alto, pois este conhecimento tem feito uma diferença grande nos processos decisórios em empresas. � A estatística ajudará o administrador na tomada de decisão: � Através da coleta de dados, ele conhece as informações necessárias para análise; � Assim, ele é capaz de estabelecer metas e objetivos commaior probabilidade de serem alcançados. � O planejamento pode ser resumido com auxilio da estatística, em tabelas e gráficos que facilitarão a compreensão visual dos cálculos. � Ao analisar os dados através de tabelas e gráficos disponíveis, é possível ao administrador tomar a melhor decisão sobre o assunto. � População e amostra: � Variável: conjunto de variáveis possíveis de um fenômeno. � Qualitativa: quando seus valores são expressos por atributos. � Nominal: pode assumir atributos nominais. Ex: sexo, cor da pele e etc. � Ordinal: pode assumir atributos ordinais. Ex: [pequeno, médio, grande] � Quantitativa: quando seus valores são expressos em números. Ex: salários , idade etc. � Variável contínua: pode assumir qualquer valor entre dois limites. Ex: [valores entre 0 e 10] � Variável discreta: pode assumir valores pertencentes a um conjunto enumerável. Ex: [1,2,3] � Exercícios � Diga quais as variáveis abaixo são discretas e quais são contínuas: � Os números de ovos que as galinhas botam?� Os números de ovos que as galinhas botam? � Comprimento dos pregos produzidos por uma máquina? � Funcionários de uma empresa? � Quantidades de leite produzidos pelas vacas de uma fazenda? � Diga quais as variáveis abaixo são qualitativas nominais e qualitativas ordinais: � Cor dos olhos dos alunos de uma escola? � Tamanho de uma empresa? � População: conjunto portador de pelo menos uma característica comum. � Amostra: subconjunto finito de uma população. • Uma AMOSTRA tem que ser; – Representativa: conter em proporção tudo o que a população possui qualitativa e quantitativamente. – Imparcial: todos os elementos da população tem igual oportunidade de fazer parte da amostra. • Uma AMOSTRA é a redução de uma população a dimensões menores, porém sem perda de suas características • Ao processo de definição da amostra chama-se AMOSTRAGEM. • Técnicas de amostragens: – Aleatória Simples – Estratificada – Sistemática � Amostragem Aleatória Simples: • Vamos denotar o tamanho da população por N e o tamanho da amostra por n. Em uma amostra aleatória simples, todos os itens da população de N tem a mesma chance de serem escolhidos na amostra de n itens. • Estabelece-se o tamanho da amostra e aleatoriamente selecionam-se os elementos que a compõe. • Exemplo – uma escola com 400 alunos (meninos, idades entre 6 e 16 anos) para realizarmos um estudo sobre qual a estatura média? Exemplo – uma escola com 400 alunos (meninos, idades entre 6 e 16 anos) para realizarmos um estudo sobre qual a estatura média? � Amostragem Aleatória Simples: � Amostragem Aleatória Simples: � Vamos supor que os 30 alunos da primeira série são os seguintes: � Amostragem Aleatória Simples: � Para garantir Representatividade e Imparcialidade � Amostragem Aleatória Simples: � Para garantir Representatividade e Imparcialidade � Amostragem Aleatória Simples • Agora vamos sortear os alunos de cada serie,obedecendo a seguinte regra: 1.Utilize a tabela de números aleatórios 2.Escolha as colunas e a linha 3.Escolha o sentido de consulta � Vamos agora ver as alturas e temos a seguinte tabela: � Amostragem Proporcional estratificada • Muitas vezes a população se divide em subpopulações – estratos. Neste caso, de estrato em estrato podemos ter um comportamento heterogêneo e dentro de cada estrato, um comportamento homogêneo, é importante que o sorteio leve em consideração tais estratos. • Ex: Supondo que temos uma população de estatura de 90 alunos e queremos pesquisar uma amostra de 10%, porém queremos uma amostra proporcional estratificada em relação ao gênero. Se na população, temos 54 meninos e 36 meninas, então: • Temos dois estratos (sexo masculino e feminino):• Temos dois estratos (sexo masculino e feminino): 54,5 100 5410 ≈= × 46,3 100 3610 ≈= × SEXO: M F � Amostragem Sistemática • Quando os elementos da população já se encontram ordenados, não há necessidade de construir um sistema de referência. Ex: prontuários médicos de um hospital, prédios de uma rua, linha de produção e etc. • Exemplo: Suponhamos uma rua contendo novecentos prédios, dos quais desejamos obter uma amostra formada de cinquenta prédios. Neste caso, procedemos da seguinte maneira: 1. Escolhe-se por sorteio um número de 1 a 18. 2. Se por acaso o número sorteado for 4, tomaríamos pelo lado direito da rua, o 40 prédio, depois o 220, 400 e assim por diante, até voltarmos ao início da rua pelo lado esquerdo. � Tamanho da amostra � Parâmetro: característica da população. � Estatística: característica descritiva de elementos de uma amostra. � Estimativa: valor acusado por uma estatística que estima o valor de um parâmetro populacional. � ERRO AMOSTRAL: diferença entre o valor que a estatística pode acusar e o verdadeiro valor do parâmetro que se deseja estimar. � ERRO AMOSTRAL TOLERÁVEL: quanto um pesquisador admite errar na avaliação dos parâmetros de interesse numa população. EXEMPLO: o resultado de uma pesquisa eleitoral: Candidato A = 20%, com 2% de erro amostral (18% - 22%) • Fórmula para cálculo do tamanho da amostra: – N = Tamanho da população – E0 = erro amostral tolerável – n0 = primeira aproximação do tamanho da amostra – n = tamanho da amostra Nn Nn n + × = 0 0 2 0 0 1 E n = • Fórmula para cálculo do tamanho da amostra: – N = 200 famílias – E0 = erro amostral tolerável = 4% (E0 = 0,04) – n0 = 1/(0,04)2 = 625 famílias – n (tamanho da amostra corrigido) = – n = 200x625/200+625 = 125000/825 = 152 famílias – E se a população fosse de 200.000 famílias? – n = (200.000)x625/(200.000+625) = 623 famílias • Fórmula para cálculo do tamanho da amostra: – Observe que: N = 200 famílias, E0 = 4% – n = 152 famílias 76% da população – Observeque: N = 200.000 famílias, E0 = 4% – n = 623 famílias 0,3% da população � Tamanho da amostra 1. Numa pesquisa para uma eleição presidencial, qual deve ser o tamanho de uma amostra aleatória simples, se existe o desejo garantir um erro amostral não superior a 2% ? 2. Numa empresa com 1000 funcionários, deseja-se estimar a percentagem dos2. Numa empresa com 1000 funcionários, deseja-se estimar a percentagem dos favoráveis a certo treinamento. Qual deve ser o tamanho da amostra aleatória simples que garanta um erro amostral não superior a 5%? � Séries Estatísticas: Toda tabela que apresenta a distribuição de um conjunto de dados estatísticos em função da época (tempo), do local (lugar) e da espécie. � Tabela: É um quadro que resume um conjunto de dados dispostos segundo linhas e colunas de maneira sistemática. � De acordo com a Resolução 886 do IBGE, nas casas ou células da tabela devemos colocar : • um traço horizontal ( - ) quando o valor é zero; • três pontos ( ... ) quando não temos os dados; • três pontos ( ... ) quando não temos os dados; • zero ( 0 ) quando o valor é muito pequeno para ser expresso pela unidade utilizada; • um ponto de interrogação ( ? ) quando temos dúvida quanto à exatidão de determinado valor. Obs: O lado direito e esquerdo de uma tabela oficial deve ser aberto.. � SÉRIES HOMÓGRADAS: são aquelas em que a variável descrita apresenta variação discreta ou descontínua. Podem ser do tipo temporal, geográfica ou específica. � GRÁFICO EM LINHAS É muito simples, nesse sistema, para cada ano do eixo x, encontraremos uma quantidade de matrículas correspondente y, formando, assim, o par ordenado (x; y). Em 1999, temos 4.235.278 matrículas, formando o par ordenado (1999; 4.235.278); em 2000, o par ordenado será (2000; 4.421.332); e assim sucessivamente. Pronto, a tarefa está realizada! Veja o resultado, abaixo. � GRÁFICO EM BARRAS Nesse tipo de gráfico, a representação será em forma de retângulos, dispostos horizontalmente (em barras). Poderíamos também, dispor a série histórica verticalmente, então, teríamos um gráfico em colunas. Vamos representar desta vez, a evolução das matrículas na Creche. Dessa vez, o eixo x será representado pelo número de matrículas na Creche e o período está representado no eixo y. Veja como fica o gráfico: � GRÁFICO EM COLUNAS OU BARRAS MÚLTIPLAS O Gráfico abaixo é um exemplo de gráfico em colunas ou barras múltiplas. Nele, podemos comparar, rapidamente e com clareza, a evolução das matrículas na educação infantil brasileira, na Creche e na Pré-Escola, ao mesmo tempo. � GRÁFICO EM SETORES O gráfico em setores é empregado sempre que desejamos ressaltar a participação do dado no total, dessa maneira, ele serve para mostrar proporções relativas; o total é representado pelo círculo, que fica dividido em tantos setores quantas são as partes. � CARTOGRAMAS Cartogramas são representações sobre uma carta geográfica. Eles são muito úteis quando queremos relacionar dados estatísticos com áreas geográficas ou políticas. Essas representações são muito úteis para expressarem população e densidade. � PICTOGRAMAS Os pictogramas são os processos gráficos de maior aceitação pública por sua forma atraente e sugestiva. � DISTRIBUIÇÃO DE FREQUENCIAS O objetivo é partir dos dados brutos, isto é, desorganizados, para uma apresentação formal. Nesse percurso, destacaremos a diferença entre tabela primitiva e rol, bem como a importância do resumo dos dados por meio de uma técnica que agrupa as repetições, chamadas de freqüência. � DADOS BRUTOS E ROL Na Unidade anterior, trabalhamos com exposição de dados. Mas, infelizmente, os dados, raramente, apresentam-se organizados. Por exemplo, vamos supor que um professor entregue as notas de seus alunos, conforme a Tabela abaixo: Observe que as notas não estão numericamente organizadas. Esse tipo de tabela denomina-se Tabela primitiva. Partindo dessa Tabela, é difícil identificar o comportamento das notas, isto é: onde se concentram? Qual a maior? Qual a menor? Quantos alunos estão abaixo ou acima de uma determinada nota? Esses dados estão, de fato, desorganizados, por isso, vamos organizá-los. A maneira mais simples é realizando uma ordenação (crescente ou decrescente). Após essa ordenação dos dados, a Tabela recebe o nome de rol. Veja como fica: � DADOS BRUTOS E ROL De fato, com os dados assim organizados, podemos saber, com facilidade, qual a menor nota (1,5) e qual a maior (10,0). E também, podemos encontrar a amplitude de variação, isto é, a diferença entre o maior valor e o menor valor: 10,0 – 1,5 = 8,5. Além dessas informações, com um pequeno esforço, podemos ainda identificar que as notas se concentram em dois valores (5,0 e 10,0) Convém destacar que os dados são úteis, apenas, se conseguirmos transformá-los em informação. h (amplitude)= L (limite superior) – l (limite inferior) � DADOS BRUTOS E ROL �Rol é um arranjo de dados numéricos brutos em ordem: crescente ou decrescente. �Com os dados organizados em um rol, identificamos que existem repetições de muitos valores. Essa repetição recebe o nome de freqüência. � TABELA DE FREQUENCIA �Dispor os dados dessa maneira é melhor do que da forma anterior, mas ainda é inconveniente. Isso porque exige muito espaço. Uma alternativa é agrupar os dados. Para desenvolver tal tarefa, é comum, em primeiro lugar, distribuir os dados em classes ou categorias em uma Tabela. Essa Tabela receberá o nome de Distribuição de Freqüência ou Tabela de Freqüência. �Para construir a tabela de freqüência das notas, consideraremos, por exemplo, quatro classes: da nota 0,0 até a nota 4,9 (0,0–4,9); da nota 5,0 até a nota 6,9 (5,0–6,9); da nota 7,0 até a nota 8,9 (7,0–8,9); por fim, da nota 9,0 até a nota 10,0 (9,0–10,0). Agrupando os dados dessa maneira, é comum chamá-los de dados agrupados. Vejamos:comum chamá-los de dados agrupados. Vejamos: � Aplicação das regras ao exemplo � Bem, primeiro, vamos calcular a diferença entre o maior e o menor número: 10,0 – 1,5 = 8,5. Isso significa que entre a maior nota e a menor nota há uma distância de 8,5. Essa é a amplitude total, isto é, os valores variam, no máximo, 8,5. De outra forma, a distância do menor valor para o maior valor é de 8,5. � Agora, na segunda etapa das regras acima, vamos escolher o número de intervalos de classe. Vamos tentar o menor número sugerido: 5. Se quero 5 classes e minha amplitude total é 8,5, basta dividir a amplitude total pelo número de classes escolhido para determinar os intervalos de classe. Assim, � Observe que arredondamos o valor para 2 (assim temos um número fácil de trabalhar). O que esse resultado significa? Significa que teremos cinco intervalos de amplitude 2. �Desse modo, nossa nova tabela de distribuição de freqüência será:
Compartilhar