Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 Estatística 2 É a ciência que se preocupa com: (i) Organização; (ii) Descrição; (iii) Análises; (iv) Interpretações. Estatística Descritiva Estatística Indutiva ou Estatística Inferencial de dados experimentais. 3 O que é Estatística? DADOS ? ANÁLISE DECISÕES Em linhas gerais, a Estatística fornece métodos que auxiliam o processo de tomada de decisão na presença de incerteza. ? 4 O que é Estatística? Parte de perguntas/desafios: Tecnologia de Queijos: Influência do Tratamento da Farinha de Soja Integral Pré-Cozida para Produção de Queijos Análise sensorial de alimentos: Iogurte light sabor morango: equivalência de doçura, caracterização sensorial e impacto da embalagem na intenção de compra do consumidor. Embalagem Ativas para Alimentos: Avaliar a incorporação de diferentes compostos químicos em filmes plásticos, com a finalidade de estender a vida de prateleira dos produtos embalados. Por que usar Estatística? Por que a natureza apresenta VARIABILIDADE: Variações de indivíduo para indivíduo; Variações no mesmo indivíduo; “A Estatística estuda como controlar, minimizar e observar a variabilidade INEVITÁVEL de todas as medidas e observações”. Sem métodos estatísticos... sem validade científica!!! 5 Por que usar Estatística? Tomada de decisões Comparação de resultados Previsões de curto, médio e longo prazo 6 7 Tipos de pesquisa Levantamento Características de interesse de uma população são levantadas (observadas ou medidas), mas sem manipulação. Pode apenas indicar a existência de associações/correlações. Experimento Grupos de indivíduos, de plantas, ou animais, ou objetos, são manipulados, em condições controladas, para se avaliar os efeitos de diferentes tratamentos. Pode provar relações de causa e efeito. 2 Raciocínio Estatístico 8 POPULAÇÃO DADOS Estatística descritiva Estatística Inferencial (Probabilidade) 9 População Alguns Conceitos é o conjunto de indivíduos ou objetos sobre os quais desejamos desenvolver algum estudo e que têm alguma característica em comum. Amostra é todo subconjunto de elementos retirados da população para obter a informação desejada. Subdivisões da Estatística AMOSTRAGEM: técnicas para obter uma amostra representativa, suficiente e que possa ser generalizada para a população. ANÁLISE EXPLORATÓRIA DE DADOS: técnicas para resumir, organizar e interpretar os dados, de uma amostra ou da população, para obter informações. INFERÊNCIA ESTATÍSTICA: técnicas para generalizar estatisticamente os resultados de uma amostra para a população. PROBABILIDADE: técnicas que permitem calcular a confiabilidade das conclusões de Inferência Estatística. 10 11 Alguns Conceitos OBJETIVO DA ESTATÍSTICA: “tirar conclusões sobre populações com base nos resultados observados em amostras extraídas dessas populações”. Variável •É a característica dos elementos da amostra que nos interessa averiguar estatisticamente. •Ex.: variável Idade - se houver “n” elementos fisicamente considerados no estudo, esses elementos fornecerão “n” valores da variável idade, os quais serão tratados convenientemente pela Estatística Descritiva e/ou pela Estatística Inferencial. 12 Tipos de Variáveis As variáveis de interesse podem ser classificadas em: (i) Qualitativas => quando resultar de uma classificação por tipos ou atributos. (ii) Quantitativas => quando seus valores forem expressos em números. Podem ser subdivididas: (a) Discretas; (b) Contínuas. (a) Nominal; (b) Ordinal. 13 Tipos de Variáveis Exemplos de Discretas: População: casais residentes em uma cidade Variável: número de filhos (1, 2, 3 etc) População: jogadas possíveis com um dado Variável: ponto obtido em cada jogada (1, 2, 3, 4, 5 ou 6) População: peças produzidos em uma linha de montagem Variável: número de defeitos por unidade (1, 2, 3 etc) (a) Variáveis Quantitativas Discretas Assumem apenas valores pertencentes a um conjunto enumerável. São obtidos mediante alguma forma de contagem. 3 14 Tipos de Variáveis (b) Variáveis Quantitativas Contínuas São aquelas, teoricamente, que podem assumir qualquer valor em um certo intervalo de variação. Resultam, em geral, de uma medição, sendo frequentemente dados em alguma unidade. Exemplos de Contínuas: População: pessoas residentes em uma cidade Variável: idade, anos (25; 25,5; 30; 30,58 = 30 anos e 07 meses etc) População: alunos de uma turma Variável: peso, em kg (27; 27,3; 24,2; 25,1 etc) População: peças produzidas por uma máquina Variável: diâmetro externo, em cm ( 22; 22,1; 22,3; 22,2 etc) 15 Tipos de Variáveis Cor dos olhos Mês de observação (janeiro, fevereiro,..., dezembro) Escolaridade (1o, 2o, 3o graus) Doente/Sadio; Número de bactérias por litro de leite; Número de sementes/vagem; Peso de 100 sementes de feijão; Diâmetro à altura do peito de frangos de corte (DAP), em cm; Raça do Animal; Cultivar de trigo; Produção de grãos kg/ha; Número de frutos/planta; Classe de fertilidade dos solos; Tempo de vida útil do caqui. • Altura (em cm) de um cultivar híbrido de tomate para processamento industrial. • O que se pode dizer sobre este cultivar com base nestes dados? • É possível ter uma idéia clara apenas observando os números? 114 102 97 122 103 101 102 100 99 99 89 107 108 110 104 107 109 115 106 108 112 98 105 111 121 107 101 115 119 98 Análise Exploratória de Dados Tabelas (frequências ou percentuais) Variáveis qualitativas Gráficos Tabelas (frequências ou percentuais) Variáveis quantitativas Gráficos Medidas de síntese: média, mediana, desvio padrão 18 Técnica de Descrição Gráfica (a) Descrição Gráfica das Variáveis Qualitativas Exemplo: 135 candidatos a vagas de RH de uma empresa Formação específica de graduação Formação Número de pessoas Frequências % Engenheiros Economistas Administradores Contadores Outros 38 30 35 15 17 28,1 22,2 25,9 11,1 12,7 Total 135 100 19 Técnica de Descrição Gráfica (a) Descrição Gráfica das Variáveis Qualitativas Exemplo: 135 candidatos a vagas de RH de uma empresa 0 5 10 15 20 25 30 35 40 Outros Contadores Administradores Economistas Engenheiros Frequência Formação específica de graduação Outros 13% Contadores 11% Administradores 26% Economistas 22% Engenheiros 28% Formação de graduação dos candidatos 4 20 Técnica de Descrição Gráfica (a) Descrição Gráfica das Variáveis Qualitativas Exemplo: Superfície de 5 regiões geográficas do Brasil Regiões geográficas do Brasil Região Superfície (Km2) Norte 3.869.637,9 Centro-Oeste 1.612.077,2 Nordeste 1.561.177,8 Sudeste 927.286,2 Sul 577.214,0 Total 8.547.393,1 Sul 7% Sudeste 11% Nordeste 18% Centro-Oeste 19% Norte 45% 21 Técnica de Descrição Gráfica (b) Descrição Gráfica das Variáveis Quantitativas Discretas Exemplo: “Número de Defeitos por unidade” em uma linha de produção 2 4 2 1 2 3 1 0 5 1 0 1 1 2 0 1 3 0 1 2 22 Técnica de Descrição Gráfica (b) Descrição Gráfica das Variáveis Quantitativas Discretas Exemplo: “Número de Defeitos por unidade” em uma linha de produção Distribuição de frequências xi (número de defeitos) fi (absoluta) fr (relativa) 0 4 0,20 1 7 0,35 2 5 0,25 3 2 0,10 4 1 0,05 5 1 0,05 20 1,00 23 Técnica de Descrição Gráfica (b) Descrição Gráfica das Variáveis Quantitativas Discretas Exemplo: “Número de Defeitos por unidade” em uma linha de produção 0 1 2 3 4 5 6 7 8 0 1 2 3 4 5 Freq u ên ci a ab so lu ta Número de defeitos Histograma ou gráfico de colunas 24 Técnica de Descrição Gráfica (c) Descrição Gráfica das Variáveis Quantitativas Contínuas Exemplo: “Diâmetro de peças produzidas por uma máquina”, em milímetros 21,5 21,4 21,8 21,5 21,6 21,7 21,6 21,4 21,2 21,7 21,3 21,5 21,7 21,4 21,4 21,5 21,9 21,6 21,3 21,5 21,4 21,5 21,6 21,9 21,5 25 Técnica de Descrição Gráfica (c) Descrição Gráfica das Variáveis Quantitativas Contínuas Exemplo: “Diâmetro de peças produzidas por uma máquina”, em milímetros Distribuição das frequências xi fi Fi fr Fr 21,2 1 1 0,04 0,04 21,3 2 3 0,08 0,12 21,4 5 8 0,20 0,32 21,5 7 15 0,28 0,60 21,6 4 19 0,16 0,76 21,7 3 22 0,12 0,88 21,8 1 23 0,04 0,92 21,9 2 25 0,08 1,00 25 1 5 26 Técnica de Descrição Gráfica (c) Descrição Gráfica das Variáveis Quantitativas Contínuas Exemplo: “Diâmetro de peças produzidas por uma máquina”, em milímetros 0.0 1.0 2.0 3.0 4.0 5.0 6.0 7.0 8.0 21.1 21.2 21.3 21.4 21.5 21.6 21.7 21.8 21.9 Fr e q u ê n ci a (f i) Diâmetro das peças (X) Histograma 27 Técnica de Descrição Gráfica (c) Descrição Gráfica das Variáveis Quantitativas Contínuas Exemplo: “Diâmetro de peças produzidas por uma máquina”, em milímetros 0.0 1.0 2.0 3.0 4.0 5.0 6.0 7.0 8.0 21.1 21.2 21.3 21.4 21.5 21.6 21.7 21.8 21.9 22.0 f X Polígono 28 Técnica de Descrição Gráfica (c) Descrição Gráfica das Variáveis Quantitativas Contínuas Exemplo: “Diâmetro de peças produzidas por uma máquina”, em milímetros 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 21.15 21.25 21.35 21.45 21.55 21.65 21.75 21.85 21.95 22.05 Fr X Polígono de frequências relativas acumuladas 29 Técnica de Descrição Gráfica (c) Descrição Gráfica das Variáveis Quantitativas Contínuas => No Exemplo, a consideração das variáveis contínuas é fundamental para a correta representação gráfica. => As classes consideradas tinham por “pontos médios” os próprios valores originais do conjunto de dados disponíveis. => Entretanto, muitas vezes, uma representação satisfatória dos dados só é conseguida pelo “agrupamento de classes de frequências”, que englobam diversos valores da variável. => Neste caso, a frequência de cada classe será igual à soma das frequências de todos os valores existentes dentro da classe. 30 Técnica de Descrição Gráfica (c) Descrição Gráfica das Variáveis Quantitativas Contínuas => Este “agrupamento de classes de frequências” corresponde a uma diminuição proposital da precisão com que os dados foram computados, uma vez que deixamos de lado uma parcela de informação contida nos dados originais. => Alguns problemas práticos a resolver: (i) Qual o número de classes a construir? (ii) Qual o tamanho ou amplitude dessas classes? (iii) Quais os seus limites ? 31 Técnica de Descrição Gráfica (c) Descrição Gráfica das Variáveis Quantitativas Contínuas => A Figura a seguir é um diagrama que pode ser utilizado para a determinação do número aproximado de classes e fornece resultados satisfatórios em muitos casos. Regra Prática: Não se recomenda o agrupamento de classes quando o número de valores é pequeno (n<25). 6 32 Técnica de Descrição Gráfica 33 Técnica de Descrição Gráfica (c) Descrição Gráfica das Variáveis Quantitativas Contínuas Adiantando que a Amplitude de um conjunto de dados é diferença entre o maior e o menor dos valores (H = Xmax – Xmin) e uma vez fixado k, temos: k=1+3,3log(n) Utilizando a notação: n = número de dados disponíveis; k = número de classes disponíveis; h = amplitude das classes, quando supostas todas iguais. => h H / k 34 Técnica de Descrição Gráfica (c) Descrição Gráfica das Variáveis Quantitativas Contínuas Exemplo 2: Tempo (em segundos) gasto por um funcionário para preencher certo tipo de formulário 61 65 43 53 55 51 58 55 59 56 52 53 62 49 68 51 50 67 62 64 53 56 48 50 61 44 64 53 54 55 48 54 57 41 54 71 57 53 46 48 55 46 57 54 48 63 49 55 52 51 35 Técnica de Descrição Gráfica (c) Descrição Gráfica das Variáveis Quantitativas Contínuas 0 1 2 3 4 5 6 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 67 68 69 70 71 72 f Tempo (seg) Histograma dos dados não agrupados 36 Técnica de Descrição Gráfica (c) Descrição Gráfica das Variáveis Quantitativas Contínuas Vamos adotar uma agrupamento de 7 classes com amplitude h = 5. Agrupamento em classes de frequências Classes fiLimites aparentes Limites reais 1ª Notação 2ª Notação 40 45 40 — 44 39,5—44,4 3 45 50 45 — 49 44,5—49,4 8 50 55 50 — 54 49,5—54,4 16 55 60 55 — 59 54,5—59,4 12 60 65 60 — 64 59,5—64,4 7 65 70 65 — 69 64,5—69,4 3 70 75 70 — 74 69,5—74,4 1 50 37 Técnica de Descrição Gráfica (c) Descrição Gráfica das Variáveis Quantitativas Contínuas Exemplo 2: 50 determinações do tempo (em segundos) 0 2 4 6 8 10 12 14 16 18 37 42 47 52 57 62 67 72 Fr e q u ê n ci a ab so lu ta Classes (X) Histograma 7 Exercício 1. Os dados abaixo são provenientes do estudo que tem como objetivo verificar o potencial de utilização do ácido ascórbico em pepinos ‘caipira’ minimamente processados quanto ao teor de umidade. Dados obtidos: - % de umidade 58,5 60,0 62,1 63,4 64,0 65,7 66,4 67,3 67,4 68,5 68,7 69,7 70,0 71,4 72,0 73,5 74,0 74,6 75,3 75,6 78,4 81,0 81,9 82,2 82,5 82,8 86,0 87,0 87,1 88,1 Com base nos dados, pede-se: -a distribuição de frequência da variável em estudo;
Compartilhar