Baixe o app para aproveitar ainda mais
Prévia do material em texto
Universidade Salvador – UNIFACS Estatística Aplicada Elizabete Pinto 2013.2 A Estatística Ciência que trata do delineamento, coletas, organização, sumarização, apresentação e análise de dados, bem como, na obtenção de conclusões válidas e tomada de decisões em diversos campos, a saber, engenharias, campo da saúde, biologia, biofísica, administração etc. Etapas do Planejamento de uma Pesquisa Por que o profissional necessita do conhecimento estatístico Por que estudar estatística? Apresentar e descrever informações de forma apropriada; Tirar conclusões a partir de grandes populações, com base somente na informação obtida a partir de amostras; Melhorar os processos; Obter previsões confiáveis; Métodos estatísticos são essenciais no estudo de situações em que os fatores de interesse apresentam grande variabilidade. Esquema da Estatística A essência de uma análise estatística é tirar conclusões sobre uma população, ou universo, com base em uma amostra de observações. (BARBETA, 2010) Conceitos fundamentais População Amostra Amostragem Parâmetro Estatística Conceitos fundamentais População Conjunto de elementos que apresentam pelo menos uma característica (observável) comum cujo comportamento interessa-nos analisar. Conceitos fundamentais EX. População e característica de interesse Deseja-se saber se nas indústrias situadas no Estado da Bahia, em 1997, existia algum tipo de controle ambiental. Conceitos fundamentais Amostra Qualquer subconjunto finito de elementos extraídos da população, em geral com dimensão sensivelmente menor, sobre o qual se faz as observações. Conceitos fundamentais Amostragem É o processo de escolha da amostra. É a parte inicial de qualquer estudo estatístico; consiste na escolha criteriosa dos elementos a serem submetidos ao estudo. Conceitos fundamentais Parâmetro Uma medida que descreve certa característica dos elementos da população. Estatística Uma medida que descreve certa característica dos elementos da amostra. Tipos de Erros Existem dois tipos de erros: Amostral e não amostral • Erro amostral Tipos de Erros • Erro não amostral Como as informações provêm de um conjunto menor que a população, cometem-se erros ao se fazer uma inferência. Esses erros são quantificados por um valor numérico, denominado probabilidade. O erro mencionado neste contexto não deve ser confundido com engano, erro de mensuração. É conseqüência inevitável da tentativa de generalizações ou da flutuação de amostra para amostra. Grandes áreas da Estatística Estatística Descritiva coleta de dados, organização, apresentação e sintetização dos dados Estatística Inferencial consiste em inferir (deduzir ou tirar conclusões) a respeito das propriedades de um universo a partir de uma amostra. Análise Exploratória dos Dados Classificação de Variáveis • As características da população são comumente chamadas de variáveis. Estas, quanto à sua natureza, são classificadas como qualitativas e quantitativas. Variáveis qualitativas Se os resultados das observações serão expressos através de categorias, que se distinguem por alguma característica não-numérica. Variáveis quantitativas Se os resultados das observações serão expressos sempre através de números, que representam contagens ou medidas. As variáveis qualitativas podem ser classificadas em: Nominal Caracteriza-se por dados que consistem apenas em nomes, rótulos ou categorias. Os dados não são dispostos segundo uma ordem. Ordinal Envolve dados que podem ser dispostos em alguma ordem, mas as diferenças entre os valores dos dados não tem sentido. As variáveis qualitativas podem ser classificadas em: Nominal Ex.: sexo, naturalidade, religião, disciplinas do curso, estado civil. Ordinal Ex.: escolaridade do chefe da familia, classe social, conceito de nota (A, B e C), dia da semana, mês. As variáveis quantitativas podem ser classificadas em: Discreta Quando os resultados possíveis da observação formam um conjunto finito ou infinito enumerável de números e que resultam, frequentemente de uma contagem. Contínua Pode assumir qualquer valor pertencente a um determinado intervalo do conjunto dos números reais e que resultam, normalmente, de uma mensuração (medição). As variáveis quantitativas podem ser classificadas em: Discreta Ex.: número de estudantes na disciplina de probabilidade e estatística; número de aprovados numa disciplina, número de faltas, número de irmãos. Contínua Ex.: medidas de tempo; altura, peso, volume. Coleta e Armazenamento de dados Os dados estatísticos podem ser obtidos de duas maneiras. Dados Primários ou Secundários. As coletas de dados, geralmente, são feitas através do preenchimento de fichas pelo pesquisador e/ou através de resposta a questionários. Alguns dados são coletados através de medições e avaliações. Depois de coletados, os dados devem ser armazenados e sistematizados numa planilha de dados. Coleta e Armazenamento de dados (Exemplo extraído - BARBETA,2010) Apresentação dos dados Dado brutos: são aqueles que ainda não sofreram qualquer processo de síntese ou análise. • Forma de apresentação do dados: Tabela Gráfico Apresentação Tabular Dispõe os dados de uma forma ordenada e resumida, facilitando a compreensão das conclusões da análise apresentadas ao leitor. Uma tabela é constituída dos seguintes elementos: Título (O quê? Quando? Onde?) Corpo da tabela Cabeçalho Coluna indicadora Fonte Apresentação Tabular Recomendações para construção de tabelas • Deve ser suficientemente completa para ser entendida, dispensando consulta ao texto; • Conter somente os dados necessários ao seu entendimento; • Ser estruturada da forma mais simples e objetiva; • Apresentar dados, unidades e símbolos consistentes com o texto. • Uniformidade com o número de casas decimais • Não analise a tabela descrevendo-a, mas sim comentando as principais tendências sugeridas pelos dados. Distribuição de Frequência Distribuição de freqüência é uma tabela resumida na qual os dados são organizados em grupos de classe ou categorias convenientemente estabelecidas e numericamente ordenadas. A construção da distribuição de freqüência depende do tipo de dado Distribuição de Frequencia – Variáveis Qualitativas Distribuição de Frequencia – Variáveis Quantitativas Dado Discreto Consideremos os seguintes dados relativos ao número de acidentes diários em um grande estacionamento, durante o período de 50 dias. 1 6 3 6 2 4 5 3 7 9 5 4 5 3 4 5 6 0 8 4 4 1 9 5 7 5 5 4 5 8 4 5 3 2 6 7 4 3 1 4 0 0 5 4 2 6 6 2 8 7 Distribuição de Frequência – Variáveis Quantitativas Dado Contínuo Os dados a seguir representam o tempo (em minutos) que 45 operadores de máquina demoraram para fazer o setup de umamáquina. 6,5 4,0 7,1 8,3 5,4 7,6 9,0 15,7 16,7 6,4 5,0 8,5 5,7 7,7 7,2 12,4 7,1 5,5 9,7 4,4 7,0 6,3 8,3 6,9 5,7 7,6 7,9 7,9 6,0 8,2 10,4 9,9 3,9 9,8 8,2 5,6 7,9 6,4 7,4 7,0 13,0 8,7 6,4 6,7 7,4 Os valores não são apresentados individualizados, mas sim em intervalos de valores agrupados em um determinado número de classes. Determinação do número de classes • Não existe uma fórmula exata para o cálculo. Seja n o tamanho da amostra selecionada. Existem alternativas: Para n ≤ 25, k = 5 e para n > 25, Alguns autores sugerem a regra de Sturges ou regra do logaritmo. nlog 3,3+1=k 10 nk Os principais estágios são: 1. Estabelecer a quantidade de classes ou intervalos de grupamento dos dados. 2. Determinar a amplitude das classes. 3. Enquadrar os dados nas classes, mediante contagem e apresentar os resultados em uma tabela ou gráfico Amplitude Total (At) É a diferença entre o maior valor e o menor valor observado. Número de classes (k) Representa o total de classes da variável. Amplitude da classe (h) É a divisão inteira entre a amplitude total e o número de classes, minmax xxAt k At h Ponto médio da classe (m) Corresponde ao valor que se encontra no centro do intervalo de classe, Etapas para construção de tabelas de frequências para dados agrupados em classes Encontrar o mínimo (menor valor) e máximo (maior valor) do conjunto de dados; kihlm iii ,2,1; 2 1 Etapas para construção de tabelas de frequências para dados agrupados em classes • Escolher um número de sub-intervalos ou classes, preferencialmente de igual tamanho (amplitude), que englobem todos os dados sem haver superposição dos intervalos. Os extremos dos intervalos são conhecidos como limites de classes; • Contar o número de elementos que pertencem a cada classe; este número é denominado frequência absoluta simples; • Determinar a frequência relativa simples de cada classe, dividindo-se a frequência absoluta simples da classe pelo número total de observações. Complete a seguinte tabela de distribuição de freqüências: Baseado nos dados da tabela anterior complete o seguinte parágrafo: “A analise do QI dos alunos da escola estudada mostrou que _________ escolares apresentaram um QI entre 92 e 104; _______ % apresentaram um QI inferior a 104; e ________% apresentaram um QI entre 116 e 128. Aplicação Aplicação Segundo o colegiado do curso de Estatística, no semestre 2008.2, a situação dos alunos do curso de Engenharia Civil ao final do semestre na disciplina de Estatística foi a seguinte: dos 88 alunos matriculados, 36 foram aprovados e desses, 34 faziam a disciplina pela primeira vez e os demais eram repetentes. Houve 15 trancamentos, sendo que nenhum aluno repetente trancou a disciplina. Apenas 16 alunos foram reprovados, sendo que destes apenas um era repetente. Porém, 19 alunos iniciantes abandonaram a disciplina enquanto que apenas 2 repetentes seguiram a mesma conduta. Sabendo-se que a fonte destes dados é fictícia, pede-se: a. Faça uma tabela que resuma a situação exposta acima.
Compartilhar