Baixe o app para aproveitar ainda mais
Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original
* * * Estatística Prof. Gerson L. Bassani * * * Programa Competências: Aplicar fundamentos básicos de estatística na interpretação de dados relacionados a área de alimentos. * * * Programa Habilidades Realizar tabelas e gráficos. Interpretar dados estatísticos relacionados a área de alimentos. * * * Programa Conhecimentos Estatística descritiva: variáveis contínuas e discretas, medidas de tendência central, Medidas de dispersão. Erro, precisão e exatidão. Correlação e Regressão.; Introdução à amostragem; Probabilidades; Distribuições de variáveis contínuas e discretas * * * Bibliografia * * * Avaliação Atitudes Responsabilidade, pró-atividade, postura profissional, ética; relacionamento interpessoal; comprometimento Conhecimentos/habilidades Duas provas escritas individuais; Participação na realização dos exercícios em aula. * * * Aplicações da estatística na indústria Controle estatístico do processo Medir e analisar a variação nos processos Controle estatístico da qualidade Medir e aprimorar a qualidade dos processos Inclui CEP e ferramentas da qualidade * * * O que é estatística? É a ciência da análise dos dados Conjunto de instrumentos (ferramentas) para recolher, classificar, apresentar e interpretar conjuntos de dados numéricos. * * * Métodos estatísticos Métodos Estatísticos Estatística Descritiva Estatística Inferencial * * * Estatística descritiva 1. Envolve Coleta de dados Caracterização dos dados Apresentação dos dados 2. Propósito Descrever os dados X = 21,3 S2 = 0,54 * * * Estatística inferencial Envolve Estimativas Teste de hipóteses Propósito Tomar decisões baseadas nas características da população * * * Estatística inferencial * * * Definições População (universo) Todos os itens de interesse Amostra Porção da população Parâmetro Valores singulares existentes na população Atributo Característica qualitativa do dado Variável Conjunto de resultados possíveis de um fenômeno * * * Variáveis Variáveis Quantitativas (números) Qualitativas(atributos) Nominais Ordinais Contínuas Discretas * * * Variáveis * * * Exercício Classifique as variáveis em qualitativas e quantitativas: Classifique as variáveis em nominais e ordinais * * * Exercício Classifique as variáveis quantitativas em discretas e contínuas: * * * Tabelas Título: deve explicar o conteúdo da tabela; Corpo: números e informações, em linhas e colunas: a) cabeçalho: indica o que a coluna contém; b) Coluna indicadora: diz o que a linha contém; Total: se houver, entre traços horizontais; Fonte: obrigatória, deve estar no rodapé; Notas: se tiver, no rodapé. * * * Tabelas Escola Z – Quantidade de alunos nas turmas Fonte: Secretaria – Escola Z * * * Tabelas * * * Distribuição de freqüências Os dados coletados sem nenhuma organização são chamados de dados brutos; * * * Distribuição de freqüências Rol é a organização dos dados em ordem crescente ou decrescente; * * * Distribuição de freqüências A tabela de distribuição de freqüências é uma maneira de organizar os dados para facilitar a análise; Distribuindo-se os dados em classes e contando as observações, tem-se a freqüência de classe; Os dados agrupados em classes juntamente com a freqüência são a distribuição de freqüência. * * * Distribuição de freqüência k = número de classes Para n<25, usar a fórmula de Sturges: k = 1 + 3,3 log n Para n>25: k = √n c = amplitude do intervalo de classe * * * Distribuição de freqüência Ponto médio da classe: Os intervalos podem ser: Abertos: 100 – 200 (os valores não pertencem ao intervalo) Fechados: 100 |–| 200 (os valores pertencem ao intevalo) Mistos: 100 |– 200 (um pertence ao intervalo, outro não) * * * Freqüências absoluta e relativa Freqüência absoluta: número de observações em uma determinada classe ou atributo de uma variável qualitativa. Freqüência relativa: Proporção do número de observações de uma determinada classe em relação ao total de observações. * * * Exercício Os dados a seguir apresentam um conjunto de tempos para uma determinada operação. Elabore uma tabela de distribuição de freqüências. Plan1 11.2 12.7 5.3 5.6 5.8 5.9 6.0 6.1 6.2 6.2 6.3 6.3 6.3 11.8 14.9 7.9 8.0 8.0 8.1 8.2 8.3 8.3 8.4 8.5 8.5 8.6 7.1 7.2 7.2 7.3 7.4 7.5 7.5 7.6 7.6 7.6 7.7 7.7 7.8 6.4 6.4 6.4 6.5 6.5 6.6 6.7 6.7 6.8 6.8 6.9 6.9 7.0 7.1 8.7 8.8 8.8 8.9 9.0 9.1 9.2 9.4 10.4 10.8 5.1 5.3 9.8 9.9 10.0 10.2 10.2 9.4 9.5 9.5 9.6 10.6 10.9 7.8 7.9 * * * Distribuição de freqüência No excel: função FREQUENCIA Importante: O XL seleciona os valores até o número indicado * * * Distribuição de freqüência Copie a fórmula até uma casa a mais e press F2 Pressione Shift + Ctrl + Enter * * * Histograma Para conhecer as características da distribuição associada a uma população de interesse, retiramos uma amostra e medimos os valores da variável considerada. O histograma resume as características da distribuição. * * * Histograma É um gráfico de barras justapostas que relaciona os valores da variável de interesse com a freqüência com que eles ocorrem, facilitando a visualização da sua distribuição * * * Histograma – Como fazer 1. Colete “n” dados (n>50) referentes à variável cuja distribuição será analisada. 2. Determine a amplitude dos dados (R) 3. Estabeleça o nº de classes (k) 4. Determine o intervalo de classe c=R/(k-1), ou c=R/k 5. Construa a tabela de freqüências 6. Construa o diagrama baseado na tabela. * * * Histogramas no excel Entre com os dados Marque o primeiro item Classifique em ordem crescente * * * Histogramas no excel Selecione Ferramentas Selecione Análise de dados * * * Histogramas no excel Escolha Histograma Clique em OK * * * Histogramas no excel Clique em intervalo de entrada Selecione todos os dados Escolha intervalo de saída Especifique a célula inicial Resultado do gráfico Clique em OK * * * Histogramas no excel * * * Histogramas * * * Histogramas * * * Polígono de freqüência * * * Gráfico de setores Gráf3 48.1 42.4 29.9 27.5 21.1 Faturamento Plan1 Região Faturamento Sul 48.1 Sudeste 42.4 Centro-Oeste 29.9 Nordeste 27.5 Norte 21.1 Plan1 Faturamento Plan2 Faturamento Plan3 Faturamento Plan4 Plan5 Plan6 Plan7 Plan8 Plan9 Plan10 * * * Gráficos de coluna e de barras Gráf2 48.1 42.4 29.9 27.5 21.1 Faturamento Plan1 Região Faturamento Sul 48.1 Sudeste 42.4 Centro-Oeste 29.9 Nordeste 27.5 Norte 21.1 Plan1 0 0 0 0 0 Faturamento Plan2 0 0 0 0 0 Faturamento Plan3 0 0 0 0 0 Faturamento Plan4 Plan5 Plan6 Plan7 Plan8 Plan9 Plan10 Gráf1 48.1 42.4 29.9 27.5 21.1 Faturamento Plan1 Região Faturamento Sul 48.1 Sudeste 42.4 Centro-Oeste 29.9 Nordeste 27.5 Norte 21.1 Plan1 0 0 0 0 0 Faturamento Plan2 0 0 0 0 0 Faturamento Plan3 0 0 0 0 0 Faturamento Plan4 Plan5 Plan6 Plan7 Plan8 Plan9 Plan10 * * * Conceitos Básicos Medidas de tendência central Média Aritmética: Quando n cresce, a média da amostra tende para a média da população. * * * Conceitos Básicos Medidas de tendência central No Excel: =MEDIA(CI:CF) * * * Conceitos Básicos Medidas de tendência central Mediana (Termo Médio): 10.0; 10.1; 10.4; 10.6; 10.7; 10.9; 12.2 10.0; 10.1; 10.4; 10.6; 10.7; 10.9 Mediana = (10.4 + 10.6)/2 = 10.5 * * * Conceitos Básicos Medidas de dispersão Amplitude: 10.0; 10.1; 10.4; 10.6; 10.7; 10.9; 12.2 12.2-10.0 = 2.2 Desvio-padrão da amostra: * * * Conceitos Básicos Medidas de dispersão No Excel: =DESVPADA(CI:CF) Desvio padrão da AMOSTRA * * * Conceitos Básicos Medidas de dispersão Desvio-padrão da população: * * * Conceitos Básicos Medidas de dispersão No Excel: =DESVPADP(CI:CF) Desvio padrão da POPULAÇÃO * * * Conceitos Básicos Medidas de dispersão Desvio-padrão da média: * * * Conceitos Básicos Medidas de dispersão Quando n cresce, o desvio-padrão das médias tende para zero e o desvio-padrão da amostra tende a crescer: * * * Distribuição Normal Levando ao limite máximo o número de intervalos e ao limite mínimo o tamanho destes, teremos uma linha contínua * * * Distribuição Normal Principais características A variável x pode assumir qualquer valor real (-∞ a +∞) Os valores de y são assintóticos em relação ao eixo x A curva é simétrica, com ponto de inflexão à esquerda em µ-1σ e à direita em µ+1σ x * * * Distribuição Normal Principais características À medida que a curva se afasta da média, aproxima-se cada vez mais do eixo x, mas nunca o toca. Os pontos em que a curvatura muda são chamados pontos de inflexão. O gráfico curva-se para baixo entre os pontos de inflexão e, para cima, à esquerda e à direita deles. x Ponto de inflexão Ponto de inflexão * * * Distribuição Normal Médias e desvios-padrão * * * Distribuição Normal Probabilidades a b a b * * * Distribuição Normal Probabilidades Cerca de 68% da área está a um desvio padrão da média. 68% * * * Distribuição Normal Probabilidades Curva Normal Reduzida µ=0 σ=1 * * * Distribuição Normal Probabilidades – escores z * * * Distribuição Normal Transformação para z E quando o desvio padrão for diferente de 1? O escore padrão, ou escore z, representa o número de desvios padrão que separa uma variável aleatória x da média. valor – média desvio padrão * * * Distribuição Normal Usando o excel No excel, não precisamos calcular o z, a planilha calcula as áreas diretamente a partir do desvio padrão * * * Distribuição Normal Usando o excel * * * Distribuição Normal Usando o excel * * * Distribuição Normal Usando o excel * * * Distribuição Normal Exercícios * * * Diagrama de dispersão Gráf2 10 11 15 16 19 21 22 23 24 23 25 26 28 29 26 27 29 24 32 31 35 34 33 35 36 34 32 38 39 41 40 42 43 45 46 47 44 49 48 Variável 1 Variável 2 Aspecto geral do Diagrama de Dispersão Plan1 1 10 1.2 11 1.2 15 2 16 2.2 19 3.1 21 3.6 22 3.6 23 3.6 24 3.3 23 3.3 25 3 26 4.1 28 4 29 4.8 26 4.8 27 4.7 29 4.7 24 5.1 32 5.2 31 5 35 5.2 34 6.2 33 6.2 35 6.2 36 6.5 34 6.6 32 6 38 6.2 39 7 41 7.3 40 7.3 42 8.1 43 8.3 45 8.3 46 8.4 47 8 44 9.2 49 9 48 Plan1 Variável 1 Variável 2 Aspecto geral do Diagrama de Dispersão Plan2 Plan3 * * * Diagrama de dispersão A existência de uma correlação entre as variáveis consideradas não implica necessariamente na existência de uma relação de causa e efeito entre x e y. Este resultado apenas indica que existe um relacionamento significativo entre as duas variáveis Relações estatisticamente significativas entre x e y podem estar presentes sempre que estas variáveis apresentarem um relacionamento monotônico, isto é, a medida que uma variável aumenta a outra variável sempre aumenta ou sempre diminui, devido a atuação de outros fatores * * * Diagrama de dispersão Um diagrama de dispersão mostra a direção, a forma e a intensidade da relação entre duas variáveis quantitativas A correlação é a medida que vamos utilizar para suplementar o gráfico A correlação mede a intensidade e a direção da relação linear entre duas variáveis quantitativas. Costuma-se representar a correlação pela letra r Suponha que tenhamos dados sobre variáveis x e y para n amostras. Os valores para a primeira amostra são x1 e y1, os valores para a segunda amostra são x2 e y2, e assim por diante. * * * Padrões de diagramas de dispersão Elevada correlação positiva Moderada correlação positiva * * * Padrões de diagramas de dispersão Elevada correlação negativa Moderada correlação negativa * * * Padrões de diagramas de dispersão Ausência de correlação * * * Regressão linear r = coeficiente de correlação a = coeficiente angular b = coeficiente linear * * * Exercícios – planilha curva P * * * Diagrama de dispersão Um valor positivo de r indica associação positiva entre as variáveis, e um valor negativo de r indica uma associação negativa A correlação r estará sempre entre –1 e 1 Pode ser calculada através de fórmulas específicas ou fornecida por softwares que tenham análise estatística, tais como MS Excel. * * * Controle por frações defeituosas Requisitos: Amostrar pelo menos 20% do lote. Exames “não destrutivos”. Ensaios simples e não onerosos. Exames rápidos. * * * Distribuição de Poisson Para X = 0; 1; 2; 3; ....... n-1; n a = Média de itens defeituosos na amostra. e = 2,7183 (base dos logaritmos neperianos). * * * Distribuição de Poisson X representa o número de itens defeituosos na amostra. * * * Distribuição Binomial Para x = 0; 1; 2; 3; ....... n-1; n: p + q = 1. p = probabilidade de ocorrência de itens defeituosos. q = probabilidade de ocorrência de itens sem defeitos. * * * Distribuição Binomial X representa o número de itens defeituosos na amostra. p + q = 1 * * * Distribuição de Poisson Se “a” representa a média de itens defeituosos na amostra temos: P(0) - probabilidade de não existir itens defeituoso na amostra; P(1) - probabilidade de existir apenas um item defeituoso na amostra; p(2) - probabilidade de existir apenas dois itens defeituosos na amostra. * * * Binomial x Poisson Binomial é exata. Poisson é uma aproximação. Poisson tende para binomial quando “a” tende para zero. exemplo * * * Distribuição de Poisson Para a = 1,1 temos: P(0) = e-a = 0,3329 (x=0) P(1) = ae-a = 0,3662 (x=1) p(2) = (a2e-a)/2! = 0,2014 (x=2) p(3) = (a3e-a)/3! = 0,0738 (x=3) P(4) = (a4e-a)/4! = 0,0203 (x=4) * * * Distribuição Binomial Para p = 0,022 e n = 50 temos: * * * Binomial ou Poisson P(≤1) = p(0) + p(1) p(≤1) = 0,3329 + 0,3662 = 0,6991 P(≤2) = p(0) + p(1) + p(2) P(≤2) = 0,6991 + 0,2014 = 0,9005 P(≤3) = p(0) + p(1) + p(2) + p(3) P(≤3) = 0,9005 + 0,0738 = 0,9743 * * * Binomial ou Poisson P(>1) = 1- P(≤1) = 1 - (p(0) + p(1)) P(>1) = 1 - 0,6991 = 0,3009 ou 30,09% P(>2) = 1- P(≤ 2) = 1 - (p(0) + p(1) + p(2)) P(>2) = 1 - 0,9005 = 0,0995 ou 9,95% P(>3) = 1 - P(≤3) P(>3) = 1 - 0,9743 = 0,0257 ou 2,57% * * * Exercícios De acordo com certo instituto 25% das televisões são sintonizadas em uma novela chamada Os Mensaleiros do Apocalipse quando esta é exibida. Calcule as probabilidades de, durante a exibição da novela, tomando-se televisões escolhidas aleatoriamente: 5 entre 15 estejam sintonizadas na novela ao menos 5 entre 15 estejam sintonizadas na novela no máximo 5 entre 10 esteja sintonizadas na novela nenhuma entre 6 estar sintonizada Um fábrica tem uma média semanal de 0,5 acidentes de trabalho. Determine a probabilidade de que em uma semana qualquer se tenha: 0 acidentes 1 acidente 2 acidentes algum acidente * * * Distribuição Normal E se a distribuição não for normal??? Amostra 1 – X1 Amostra 2 – X2 Amostra 3 – X3 . . . * * * Distribuição Normal Distribuição da média amostral A distribuição da média amostral x, de uma amostra de tamanho n extraída de uma população qualquer, que tem média µ e desvio padrão σ, tem as seguintes características: Média = E( x )= µ Desvio padrão = DP ( x ) = σ/√n * * * Distribuição normal Teorema central do limite A distribuição da média amostral x, de uma amostra de tamanho n extraída de uma população não-normal, com média µ e desvio padrão σ, é aproximadamente normal com média µ e desvio padrão σ/√n. Este resultado significa que: é aproximadamente N(0,1). * * * Distribuição normal Teorema central do limite * * * Tamanho da amostra O erro amostral é dado por O tamanho da amostra para obter uma média com um erro predeterminado é: * * * Amostragem Amostragem sistemática Amostragem estratificada – proporcional Aleatória simples * * * Sistemática Amostragem * * * Estratificada Amostragem * * * Precisão e Exatidão * * * Número de classes Número de valores da tabulação Número de classes (k) Abaixo de 50 5 – 7 50 – 100 6 –10 100 – 250 7 – 12 Acima de 250 10 – 20 Calcular a média, para mostrar como os valores se distribuem em torno dela.
Compartilhar