Baixe o app para aproveitar ainda mais
Prévia do material em texto
Probabilidade e Estatística Daniela Pereira Aulas 1 a 13 Plano de Ensino 2 Objetivos Apresentar os elementos da Estatística descritiva e da teoria elementar da probabilidade, que servirão de base para o estudo da Estatística indutiva, com o objetivo de tornar o acadêmico apto a tomar decisões empresariais com o uso do ferramental estatístico. 3 Conteúdo Programático (geral) Tipos de Dados, Arredondamentos, Medidas Estatísticas, Preparação de Dados para Análises Estatísticas Gráficos, Séries Estatísticas, Técnicas de Amostragem, Intervalo de Confiança, Distribuição Normal de Probabilidade, Probabilidade, Variáveis Aleatórias Discretas, Noções de Testes de Hipóteses e Correlação e Regressão Linear Simples. 4 Bibliografia FREUND, John E., SIMON, Gary A. Estatística aplicada à economia, administração e contabilidade. São Paulo: Bookman, 2000, TRIOLA, Mario F. Introdução a Estatística 7ª edição. Rio de Janeiro: LTC, 1999. TOLEDO, Geraldo L.; OVALLE, Ivo I. Estatística básica. São Paulo: Atlas,1998. 5 Objetivos da aula – UNIDADE 1 apresentar a importância e o significado da estatística. Compreender os objetivos da estatística descritiva Compreender e identificar os conceitos básicos da estatística Organizar e agrupar dados em uma tabela de frequência Compreender o conceito das medidas de posição / tendência central Resumir dados através do cálculo de medidas de tendência central 6 Informações em jornais e revistas Vendas no varejo variam -0,5% em dezembro e fecham 2012 em 8,4%. Emprego industrial recua 1,4% em 2012. Em janeiro, IBGE prevê safra de grãos 13,1% maior que a safra obtida em 2012. Vendas no varejo variam -0,5% em dezembro e fecham 2012 em 8,4%. Estatística na prática Os dados numéricos -0,5%, 8,4%, 1,4% e 13,1% denominam-se estatísticas. Definição de Estatística Ciência que trata de métodos científicos para coleta, organização, descrição, análise e interpretação (conclusão) de um conjunto de dados, visando à tomada de decisões. Fases do método estatístico • Coleta • Resumo • Apresentação • Análise • Resolução de Problemas • Tomada de decisões • Estimativas •Planejamento e desenvolvimento de produtos ou procedimentos Aplicação da Estatística Podemos dividir a aplicação da Estatística basicamente em três etapas, que são descritas resumidamente a seguir: 1. Primeira Etapa - Refere-se à coleta de dados, na qual devemos utilizar técnicas estatísticas que garantirão uma amostra representativa da população. 11 h tt p :/ /a fo n s o fe lix .c o m .b r http://afonsofelix.com.br/services_item/coleta-de-dados/ Aplicação da Estatística 2. Depois dos dados coletados, devemos resumí-los em tabelas de frequências e/ou gráficos e, posteriormente, encontrar as medidas de posição e variabilidade (quantidades). Esta etapa também é conhecida como Estatística Descritiva ou Dedutiva. 12 p ro in fo d a ta .c 3 s l. u fp r. b r http://proinfodata.c3sl.ufpr.br/attendance/ Aplicação da Estatística 3. Esta etapa envolve a escolha de um possível modelo que explique o comportamento dos dados para posteriormente se fazer a inferência dos dados para a população de interesse. Esta etapa também é chamada de Estatística Inferencial ou Indutiva. Nesta etapa, se faz necessário um conhecimento mais aprofundado, principalmente no que se refere aos tópicos de probabilidades. 13 w w w .a b q .o rg .b r http://www.abq.org.br/biocom/2010/trabalhos/30-7310.htm 14 Para refletir Na sua opinião, observando a definição de estatística, o que é mais importante: coletar, analisar, apresentar ou interpretar os dados? Conceitos Básicos População Coleção de medidas de todos os elementos de um universo sobre o qual desejamos tirar conclusões ou tomar decisões. Amostra Subconjunto da população; dados disponíveis (acessíveis) da população. 15 Conceitos Básicos Estatística Descritiva Trata da organização e resumo do conjunto de dados em tabelas, gráficos, medidas. Estatística Indutiva Apresenta métodos conclusivos sobre uma população a partir do estudo de uma amostra retirada da mesma. 16 Conceitos Básicos Variável Conjunto de resultados possíveis de um fenômeno. fenômeno variabilidade Exemplo 1 • Consumo residencial de energia elétrica. • Quantidade de itens vendidos mensalmente. • Valores de saques em uma agência bancária. • Grau de escolaridade. • Sexo. • Quantidade de itens defeituosos por lote. 17 Tipos de variáveis 18 Contínuas Ex.: altura, salário, tempo. Discretas Ex.: no de filhos, quantidade de atendimentos. Ordinais Ex.: grau de escolaridade. Nominais Ex.: sexo, estado civil, religião. Quantitativas Qualitativas Distribuições de frequências - agrupando dados 19 Coleta de Dados Dados Brutos Resumo / Organização Tabelas de frequências Quantidade de vezes que cada valor ou atributo ocorre no conjunto de dados. Tabelas de frequências Distribuição de frequências é uma tabela em que se resumem grandes quantidades de dados, determinando o número de vezes que cada dado ocorre (frequência) e a porcentagem com que aparece (frequência relativa). Para facilitar a contagem do número de vezes que cada dado ocorre, podemos ordenar os dados. A uma sequência ordenada (crescente ou decrescente) de dados brutos damos o nome de Rol. Os tipos de frequências com os quais iremos trabalhar são: Frequência absoluta ou simplesmente frequência (f): é o nº de vezes que cada dado aparece na pesquisa. 20 Tabelas de frequências Frequência relativa ou percentual (fr): é o quociente da frequência absoluta pelo número total de dados. Esta frequência pode ser expressa em porcentagem. O valor de (fr x100) é definido como fr (%). Frequência acumulada (fa): é a soma de cada frequência com as que lhe são anteriores na distribuição. Frequência relativa acumulada (fra): é o quociente da frequência acumulada pelo número total de dados. Esta frequência também pode ser expressa em porcentagem. O valor de (fra x100) é definido como fra (%). 21 Tabelas de frequências Exemplo 1.1: Dada a tabela abaixo, vamos definir qual é a variável em estudo e qual o tipo de variável. Depois, completaremos a tabela de distribuição de frequências encontrando a frequência relativa (%). 22 Tabelas de frequências No exemplo 1.1, a variável em estudo é a renda dos operários de uma determinada empresa. Esta variável é classificada como quantitativa contínua, pois pode assumir qualquer valor dentro de um intervalo numérico. As frequências absolutas (f) são fornecidas no problema. As frequências relativas (fr(%)) são encontradas dividindo cada frequência absoluta (de cada classe de frequência) pelo total de operários (110) e multiplicando por 100. Em todos os nossos exemplos, na distribuição de frequências construída com intervalos de classes, vamos considerar que o intervalo de classe é fechado à esquerda e aberto à direita. Por exemplo, no caso dessa tabela, considerando a terceira classe de frequência, podemos dizer que os 16 operários que estão nesta classe recebem de 4 a menos que 6 salários mínimos por mês. 23 Tabelas de frequências A coluna frequência acumulada (fa) de cada classe é obtida somando a frequência da respectiva classe com as que lhe são anteriores e a fra (%) é obtida dividindo a fa pelo número total de dados e multiplicando por 100. 24 Dados não agrupados Dados agrupados em classes em classes Tabelas de frequências Quantidade de filhos por funcionário 0 1 2 3 4 Renda (em salários mínimos) 0 2 2 4 4 6 6 8 8 10 Frequência absoluta (f): é a quantidade de vezes que cada valor (ou atributo) aparece na pesquisa. Tipos de frequências Renda (em salários mínimos) f 0 2 86 2 4 58 4 6 32 6 8 16 8 10 8 Total 200 Frequência relativa ou percentual (fr): é o quociente da frequência absoluta pelo número total de dados. Tipos de frequências Renda (em salários mínimos) f Frequência relativa(fr) 0 2 86 0,43 (43%) 2 4 58 0,29 (29%) 4 6 32 0,16 (16%) 6 8 16 0,08 (8%) 8 10 8 0,04 (4%) Total 200 Frequência acumulada (fa ou F): é a soma de cada frequência com as que lhe são anteriores na distribuição. Tipos de frequências Renda (em salários mínimos) f Frequência relativa (fr) Frequência acumul. (fa) 0 2 86 0,43 (43%) 86 2 4 58 0,29 (29%) 144 4 6 32 0,16 (16%) 176 6 8 16 0,08 (8%) 192 8 10 8 0,04 (4%) 200 Total 200 Tabelas de frequências Exemplo 8: Número de filhos de 65 funcionários de uma empresa (não agrupados) 29 Número de filhos Frequência 0 12 1 30 2 18 3 4 4 1 Total 65 Tabelas de frequências Exemplo 8 Número de filhos (não agrupados) 30 Número de filhos Frequência Porcentagem Freq. Acumul. 0 12 18,5% 12 1 30 46,2% 42 2 18 27,7% 60 3 4 6,2% 64 4 1 1,5% 65 Total 65 100% Tabelas de frequências Definições Importantes Limite inferior (Li): é o menor valor que a variável pode assumir em uma classe de frequência. Limite superior (Ls): serve de limite para estabelecer qual o maior valor que a variável pode assumir em uma classe de frequência, mas, geralmente, os valores iguais ao limite superior não são computados naquela classe e sim na seguinte. Ponto médio (Pm): é a média aritmética entre o Li e o Ls da mesma classe, ou seja, Pm = (Li + Ls) / 2 Amplitude (h): é a diferença entre o Ls e o Li da classe, ou seja, h = Ls – Li. Amplitude total (ht): é a diferença entre o Ls da última classe de frequência e o Li da primeira classe, ou seja: ht = Ls – Li. 31 Tabelas de frequências Como determinar o número k de classes? E o tamanho das classes? Sugestão: regra da raiz Onde n é o tamanho total da amostra Exemplo, se n= 50 Tamanho (amplitude - h) de cada intervalo: h = R / K, onde R é a amplitude total dos dados. Exemplo, se R = 5600, a amplitude será dada por h = 5600/ 7 = 800 32 nk (faixas) classes 7071,750 k Para montar uma tabela de frequências devemos: •Achar o mínimo e o máximo dos dados. •Determinar as classes de frequências, o que na verdade nada mais é do que escolher intervalos de mesmo comprimento que cubra a amplitude entre o mínimo e o máximo. Para determinar o número de classes, usaremos e para determinar o “tamanho” das classes usaremos h = R / K, onde R é a amplitude total dos dados. •Contar o número de observações que pertencem a cada intervalo de classe. Esses números são as frequências observadas da classe. •Calcular as frequências relativas e acumuladas de cada classe. •De modo geral, a quantidade de classes não deve ser inferior a 5 e nem superior a 25. 33 nk Atividade 34 (ENADE 2006) A tabela seguinte mostra como se distribui o tipo de ocupação dos jovens de 16 a 24 anos que trabalham em 5 Regiões Metropolitanas e no Distrito Federal. 35 Das regiões estudadas, aquela que apresenta o maior percentual de jovens sem carteira assinada, dentre os jovens que são assalariados do setor privado, é (A) Belo Horizonte. (B) Distrito Federal. (C) Recife. (D) Salvador. (E) São Paulo. 36 Exercício 2 38 Antes de enviar um lote de aparelhos elétricos para venda, o Departamento de Inspeção da empresa produtora selecionou uma amostra casual de 32 aparelhos avaliando o desempenho através de uma medida especifica, obtendo os seguintes resultados: Construa uma tabela de frequências. Exercício 3 39 Complete a tabela Exercício 4 40 Dada a tabela a seguir, agrupe os dados em uma tabela de frequências, contemplando a frequência absoluta, relativa e acumulada. Tabelas de frequências Exercício 3: salários de 50 funcionários (agrupados) Tabela 1.4 – Salários dos 50 funcionários da empresa XYZ. 41 452,00 890,00 1.000,00 1.425,00 2.200,00 452,00 890,00 1.000,00 1.425,00 2.200,00 452,00 960,00 1.200,00 1.425,00 2.200,00 680,00 960,00 1.200,00 1.450,00 3.000,00 750,00 960,00 1.200,00 1.450,00 3.000,00 780,00 960,00 1.200,00 1.450,00 3.000,00 800,00 960,00 1.252,00 1.500,00 3.000,00 800,00 960,00 1.332,00 1.500,00 5.600,00 800,00 1.000,00 1.332,00 1.500,00 5.600,00 800,00 1.000,00 1.332,00 2.200,00 5.600,00 Tabelas de frequências Exemplo 9: salários de 50 funcionários (agrupados) 42 Salário (em reais) f fr (%) fa 450 1.186 22 44,0% 22 1.186 1.922 17 34,0% 39 1.922 2.658 4 8,0% 43 2.658 3.394 4 8,0% 47 3.394 4.130 0 0,0% 47 4.130 4.866 0 0,0% 47 4.866 5.602 3 6,0% 50 Total 50 100,0% Medidas de tendência central São valores calculados a partir de um conjunto de dados e cuja função é apresentar um valor que tipifica ou que “melhor” representa o conjunto de números. Algumas medidas •Média aritmética •Média ponderada •Mediana •Moda 43 Média aritmética É o quociente (divisão) entre a soma de todos os valores do conjunto e a quantidade de elementos do mesmo. Média populacional: Média amostral: N X N x N i i 1 n X n x x n i i 1 44 Média aritmética Exemplo 10: Calcular a média de faturas emitidas nos 5 dias desta semana pela empresa ABC Ferragens: 10 15 13 12 50 faturas 20 5 100 5 5012131510 55 54321 5 1 xxxxx x x i i 45 Média aritmética Exemplo 11 Calcular a média dos salários da tabela seguinte. salários (R$) freq. (fi) p. médio (xi) xi fi 450 1.186 22 818 17.996 1.186 1.922 17 1.554 26.418 1.922 2.658 4 2.290 9.160 2.658 3.394 4 3.026 12.104 3.394 4.130 0 3.762 0 4.130 4.866 0 4.498 0 4.866 5.602 3 5.234 15.702 Total 50 81.380 46 Média aritmética Exemplo 11: 60,627.1 50 00,380.81 1 1 k i i k i ii f xf 47 Média ponderada Cada valor é ponderado de acordo com sua importância no conjunto total de valores. wi é o peso atribuído à observação xi. k i i k i ii w w xw 1 1 48 49 Aplicação 1 Em uma instituição de ensino, para cada disciplina, anualmente, há 4 avaliações com pesos, respectivamente, iguais a 1, 2, 3 e 4. A média necessária para aprovação na disciplina deve ser igual ou maior que 7. Um aluno que obteve (nessas avaliações) as notas 7, 4, 5 e 10 conseguiu ser aprovado? Resolução 7 10 70 10 401587 10 104534271 4 1 4 1 i i i ii w w xw 50 Mediana Divide o conjunto (ordenado) ao meio. É o valor que ocupa a posição central do conjunto • Se n é ímpar, a mediana é dada por: • Se n é par, a mediana é dada por: 2 1n xMd 2 1 22 nn xx Md 51 Mediana Exemplo 12 – VARIÁVEL DISCRETA Calcular a mediana de faturas emitidas nos 5 dias desta semana pela empresa ABC Ferragens: 10 15 13 12 50 NOTE QUE O CONJUNTO JÁ ESTÁ ORDENADO E N= 5 Md = 13 52 2 1n xMd Mediana Exemplo 13 VARIÁVEL DISCRETA Calcular a mediana do conjunto: 2 3 4 0 1 1 5 9 1) CONJUNTO ORDENADO 0 1 1 2 3 4 5 9 2) VERIFICAR SE N É PAR OU É IMPAR = > N=8 Md = (2 + 3) / 2 = 2,5 53 2 1 22 nn xx Md Mediana E A MEDIANA DE UMA TABELA DE FREQUÊNCIA? 54 Mediana E A MEDIANA DE UMA TABELA DE FREQUÊNCIA COM VARIÁVEIS DISCRETAS? 55 2 1n xMd Mediana MEDIANA DE UMA TABELA DE VARIÁVEIS CONTÍNUAS. classes freq. (fi) F 35 45 5 5 45 55 12 17 55 65 18 35 65 75 14 49 75 85 6 55 85 95 3 58 Total 58 56 Mediana MEDIANA DE UMA TABELA DE VARIÁVEIS CONTÍNUAS. 57 Mediana MEDIANA DE UMA TABELA DE VARIÁVEIS CONTÍNUAS. classes freq. (fi) Fa 35 45 5 5 45 55 12 17 55 65 18 35 65 75 14 49 75 85 6 55 85 95 3 58 Total 58 58 Mediana MEDIANA DE UMA TABELA DE VARIÁVEIS CONTÍNUAS. 59 Mediana MEDIANA DE UMA TABELA DE VARIÁVEIS CONTÍNUAS. 60 Moda Valor(es) com maior frequência no conjunto. Exemplo 14 – VARIÁVEL DISCRETA Determinar a(s) moda(s) de cada conjunto a) 28 4 7 5 7 8 2 7 b) 54 5 3 4 5 3 4 3 c) 0 5 2 0 5 5 0 261 Moda 62 Salários (US$) freq. (fi) F 0 1 3 3 1 2 10 13 2 3 17 30 3 4 8 38 4 5 5 43 Total 43 Moda MEDIANA DE UMA TABELA DE VARIÁVEIS CONTÍNUAS. 63 Moda 64 Salários (US$) freq. (fi) F 0 1 3 3 1 2 10 13 2 3 17 30 3 4 8 38 4 5 5 43 Total 43 Moda MEDIANA DE UMA TABELA DE VARIÁVEIS CONTÍNUAS. 65 Exemplo de aplicação da moda Apresentar o artigo: Universitário "padrão" é mulher e estuda à noite, mostra Censo. http://educacao.uol.com.br/noticias/2012/05/27/universitario-padrao- e-mulher-e-estuda-a-noite-mostra-censo-uol-acompanha-dia-de- aluna.htm 66 Perfil do universitário brasileiro Presencial A Distância Sexo Feminino Feminino Categoria Privada Privada Grau Bacharelado Licenciatura Turno Noturno -- Idade 21 29 Idade de ingresso 19 28 Idade de conclusão 23 31 Fo n te : M EC /I n ep Para construção do perfil do aluno, foi considerada a moda: medida de posição que identifica o atributo com maior frequência na distribuição dos aspectos selecionados. 67 Exemplo de aplicação da mediana PARA REFLEXÃO AO LONGO DA SEMANA Um levantamento sobre a quantidade de empresas atendidas diariamente por um representante comercial revelou os seguintes números. É possível calcular a média de empresas atendidas diariamente? E a mediana? 68 Quant. de empresas 2 3 4 5 6 ou mais frequências 15 9 6 5 3 Finalizando a aula 69 SEPARATRIZES QUARTIS - Q DECIS - D PERCENTIL - P 70 SEPARATRIZES As SEPARATRIZES não são medidas de tendência central, mas estão ligadas à mediana relativamente à sua característica de separar a série em duas partes que apresentam o mesmo número de valores. Essas medidas - os quartis, os decis e os percentis - são, juntamente com a mediana, conhecidas pelo nome genérico de separatrizes. 71 QUARTIS - Q Denominamos quartis os valores de uma série que a dividem em quatro partes iguais. Precisamos portanto de 3 quartis (Q1 , Q2 e Q3) para dividir a série em quatro partes iguais. Obs: O quartil 2 ( Q2 ) SEMPRE SERÁ IGUAL A MEDIANA DA SÉRIE. 72 Quartis em dados não agrupados 73 • Se a divisão resultar num número fracionário, arredonde-o para cima e o valor do quartil será a resposta da variável encontrada nesta posição. • Se a divisão for um número inteiro, o quartil será a média aritmética da resposta da variável que ocupar a posição encontrada com a resposta da variável que ocupar a posição seguinte. Quartis em dados não agrupados 74 Cálculo do quartil para o rol 1° Passo: Determina-se a posição do Quartil. 2° Passo: Identifica-se a posição mais próxima do rol – verificar se o valor é fracionário 3° Passo: Calcular o valor do Quartil Exemplo 1: Um escritório que presta consultoria em administração levantou os tempos de espera de pacientes que chegam a uma clínica de ortopedia para atendimento de emergência. Foram coletados os seguintes tempos, em minutos, durante uma semana. Encontre os quartis. 2 5 10 11 3 14 8 8 7 12 3 4 7 3 4 2 6 7 Quartis em dados não agrupados 75 Quartis em dados não agrupados 76 Quartis em dados não agrupados 77 Quartis em dados agrupados EXEMPLO 3 78 Quartis em dados agrupados 79 Classes Frequência = F Frequência acumulada FA 50 |------------ 54 4 4 54 |------------ 58 9 13 58 |------------ 62 11 24 62 |------------ 66 8 32 66 |------------ 70 5 37 70 |------------ 74 3 40 Total 40 Quartis em dados agrupados 80 Quartis – dados agrupados em uma tabela de frequência com classes Exemplo 4 – Dada a tabela abaixo, calcular os quartis Quartis em dados agrupados 81 Classes Frequência = F Frequência acumulada FA 50 |------------ 54 4 4 54 |------------ 58 9 13 58 |------------ 62 11 24 62 |------------ 66 8 32 66 |------------ 70 5 37 70 |------------ 74 3 40 Total 40 Quartis em dados agrupados 82 Quartis em dados agrupados Considere a distribuição dos pesos de um grupo de turistas que visita um parque temático em Fortaleza/CE/Julho/16. Calcule os Quartis Tabela 3.2 - Pesos de um grupo de turistas do Parque Temático Fortaleza/CE/Julho/16. 83 Quartis em dados agrupados 84 Quartis em dados agrupados 85 Quartis em dados agrupados 86 Quartis em dados agrupados 87 PERCENTIS - P A definição dos Percentis obedece ao mesmo princípio dos quartis. A diferença é que dividimos o conjunto em 100 partes iguais. Desta forma, precisamos calcular 100 percis: P1, P2,..., P98,P99 88 PERCENTIS - P 1º PASSO – para calcular os percentis, o conjunto deve estar organizado como um rol 2º PASSO – identificamos a posição dos percentil usando a fórmula Adotaremos a seguinte convenção: • Se a divisão resultar num número fracionário, arredonde-o para cima e o valor do percentil será a resposta da variável encontrada nesta posição. • Se a divisão for um número inteiro, o percentil será a média aritmética da resposta da variável que ocupar a posição encontrada com a resposta da variável que ocupar a posição seguinte. 89 PERCENTIS - P variáveis discretas e não agrupadas Exemplo: Vamos encontrar o trigésimo quinto percentil do conjunto de dados do exemplo 2.4. 2 2 3 3 3 4 4 5 6 7 7 7 8 8 10 11 12 14 O percentil P35 será a resposta da variável que ocupar a posição (35 X18 )/100 = 6,3 Como a divisão resultou em um valor fracionário, vamos arredondar para 7. Portanto, o trigésimo quinto percentil é o valor que está na sétima posição. P35 = 4 Então, aproximadamente 35% das observações são menores ou iguais a 4 minutos 90 DECIS - D A definição dos Decis obedece ao mesmo princípio dos quartis. A diferença é que dividimos o conjunto em 10 partes iguais. Desta forma, precisamos calcular 9 Decis: D1, D2, D3, D4, D5, D6, D7, D8 e D9 O quinto decil divide o conjunto em duas partes iguais. Assim sendo,o QUINTO DECIL É IGUAL AO SEGUNDO QUARTIL, que por sua vez É IGUAL À MEDIANA 91 DECIS - D O Decil DK será dado pela variável que ocupar a posição DK = (Kxn) / 10 • Se a divisão resultar num número fracionário, arredonde-o para cima e o valor do decil será a resposta da variável encontrada nesta posição. • Se a divisão for um número inteiro, o decil será a média aritmética da resposta da variável que ocupar a posição encontrada com a resposta da variável que ocupar a posição seguinte. 92 Gráficos UTILIZANDO O MICROSOFT EXCEL 93 Gráficos O objetivo da utilização de gráficos em análise de dados é o de facilitar a compreensão do fenômeno estatístico por meio do efeito visual imediato que os gráficos proporcionam. Os tipos de gráfico mais usados: • GRÁFICO EM LINHAS • DIAGRAMAS DE ÁREA ( gráfico em colunas, gráfico em barras e gráfico em setores) • GRÁFICO PARA REPRESENTAR DISTRIBUIÇÃO DE FREQUENCIA COM INTERVALOS DE CLASSES (polígono de frequências, histograma e ogiva) 94 Gráfico em Linhas Usado sempre que os dados estiverem distribuídos segundo uma variável no tempo (meses, anos, etc) Esse tipo de gráfico retrata as mudanças nas quantidades com respeito ao tempo através de uma série de segmentos de reta. É muito eficiente para mostrar possíveis tendências no conjunto de dados. Note que o eixo X do Gráfico (linha horizontal), representa a passagem de tempo e o eixo Y (linha vertical) representa os dados, os números. Exemplos: 1) Bolsa de valores 2) Precipitação pluviométrica 95 Gráfico em Linhas ANO ASSINANTES EM MILHÕES 1997 1,1 1998 1,3 1999 1,5 2000 1,9 2001 2,4 2002 2,6 2003 3,1 2004 7,4 2005 18,6 2006 21,5 2007 29 96 A tabela abaixo fornece uma lista do número de assinantes de telefones celulares, em milhões, de 1997 a 2007, do país X. Construa um gráfico para resumir os dados da tabela a seguir. Gráfico em Linhas 97 Gráfico em Linhas 98 O gráfico de linhas no Excel pode ser usado em diversas situações, como: Resultado de vendas ao longo do ano; Controle de custos aolongo do ano; Controle de peso ao longo do ano; Taxa de crescimento de clientes ao longo do ano. Gráficos de linhas podem mostrar dados contínuos ao longo do tempo em um eixo com escalas iguais e, portanto, são ideais para mostrar tendências de dados em intervalos iguais, como meses, trimestres ou anos fiscais. Diagramas de barras – Gráficos em coluna Os diagramas em barras (ou colunas) são bastante utilizados quando trabalhamos com variáveis qualitativas (dados categóricos). No eixo horizontal especificamos os nomes das categorias e no eixo vertical construímos uma escala com a frequência ou a frequência relativa. As barras terão bases de mesma largura e alturas iguais à frequência ou à frequência relativa. O gráfico em barras, quando as barras estão dispostas no sentido vertical, também é chamado de gráfico em colunas. ATENÇÃO 99 Diagramas de barras – Gráficos em coluna 100 Exemplos Note que o eixo X do Gráfico (linha horizontal), representa a categoria dos dados, também poderia ser a passagem de tempo e o eixo Y (linha vertical) representa a porcentagem, os números. Diagramas de barras – Gráficos em coluna 101 Diagramas de barras – Gráficos em coluna 102 Exemplo: observe a figura 2.2. O gráfico ilustrado compara a audiência de quatro canais de TV aberta durante 7 dias da semana Diagramas de barras – Gráficos em coluna 103 Exemplo: Uma grande indústria de materiais de construção, com diversas lojas espalhadas pelo país, fez um levantamento das principais causas de perda de ativos durante o ano de 2007 e as informações estão dispostas na tabela seguinte. CAUSAS VALOR PERDIDO - MILHÕES DE R$ Má administração 5,2 Roubos de funcionários 3,9 Fraudes nas vendas 5,5 Assaltos às lojas 1,8 Perda do estoque 1,6 Atendimento ruim 0,8 Diagramas de barras – Gráficos em coluna Você pode usar Gráfico de Barras no Excel em diversas situações, como: •Resultado de vendas por categorias específicas (por vendedor, por local, por tempo, etc.) •Controle de custos por categorias específicas (por vendedor, por local, por tempo, etc.) •Controle de peso ao longo do ano; •Taxa de crescimento de clientes ao longo do ano e também por categorias específicas. 104 Gráfico ou Diagrama de Setores O diagrama em setores, também conhecido como gráfico de pizza, é um dos gráficos mais utilizados para representar variáveis qualitativas (ou categóricas) e é bastante apropriado quando se deseja visualizar a proporção que cada categoria representa do total. 105 Gráfico ou Diagrama de Setores 106 Gráfico ou Diagrama de Setores 107 Exemplo: Uma grande indústria de materiais de construção, com diversas lojas espalhadas pelo país, fez um levantamento das principais causas de perda de ativos durante o ano de 2007 e as informações estão dispostas na tabela seguinte. CAUSAS VALOR PERDIDO - MILHÕES DE R$ Má administração 5,2 Roubos de funcionários 3,9 Fraudes nas vendas 5,5 Assaltos às lojas 1,8 Perda do estoque 1,6 Atendimento ruim 0,8 Gráfico ou Diagrama de Setores Considere a utilização de um gráfico de pizza quando: Você tiver apenas uma série de dados. Nenhum dos valores nos seus dados for negativo. Quase nenhum dos valores nos seus dados for igual a zero. Você não tiver mais de sete categorias, todas elas representando partes da pizza inteira. •Para apresentar resultado de pesquisas por região; •Para apresentar resultado de vendas de um determinado período de tempo; •Para apresentar relatório de despesas administrativas por determinadas categorias; 108 GRÁFICO PARA REPRESENTAR DISTRIBUIÇÃO DE FREQUENCIA POLÍGONO DE FREQUÊNCIAS HISTOGRAMA OGIVA 109 Histograma Um histograma é semelhante ao diagrama de barras, porém refere-se a uma distribuição de frequências para dados quantitativos contínuos. Por isso, apresenta uma diferença: não há espaços entre as barras. Os intervalos de classes são colocados no eixo horizontal enquanto as frequências são colocadas no eixo vertical. As frequências podem ser absolutas ou relativas. 110 Histograma 111 Histograma 112 Histograma A tabela a seguir apresenta o salário de funcionários de uma empresa no interior de Minas Gerais 113 SALÁRIO FREQUENCIA ABSOLUTA FREQUENCIA ACUMULADA [400;800) 38 38 [800;1200) 18 56 [1200;1600) 12 68 [1600; 2000) 8 76 [2000,2400) 8 84 [2400;2800) 5 89 [2800;3200) 3 92 [3200;3600) 0 92 [3600;4000) 2 94 [4000; 4400) 0 94 [4400;4800) 1 95 Total 95 38 56 68 76 84 89 92 92 94 94 95 0 10 20 30 40 50 60 70 80 90 100 V al o r d a Fr eq u en ci a Classes Frequencia Acumulada 38 18 12 8 8 5 3 0 2 0 1 0 5 10 15 20 25 30 35 40 Fr eq u en ci a Sakários Frequencia Absoluta Polígono de Frequências O polígono de frequências é um gráfico de linha de uma distribuição de frequências. No eixo horizontal são colocados os pontos médios de cada intervalo de classe e no eixo vertical são colocadas as frequências absolutas ou relativas (como no histograma). Para se obter as intersecções do polígono com o eixo das abscissas, devemos encontrar o ponto médio da classe anterior à primeira e o ponto médio da classe posterior à última. 114 Polígono de Frequencia A tabela a seguir apresenta o salário de funcionários de uma empresa no interior de Minas Gerais 115 SALÁRIO FREQUENCIA ABSOLUTA FREQUENCIA ACUMULADA [400;800) 38 38 [800;1200) 18 56 [1200;1600) 12 68 [1600; 2000) 8 76 [2000,2400) 8 84 [2400;2800) 5 89 [2800;3200) 3 92 [3200;3600) 0 92 [3600;4000) 2 94 [4000; 4400) 0 94 [4400;4800) 1 95 Total 95 0 5 10 15 20 25 30 35 40 200 600 100 1400 1800 2000 2200 2400 2600 2800 3000 3200 3400 Fr eq u en ci a Ponto Médio das Classes Salários dos Funcionários Polígono de Frequência com Histograma A tabela a seguir apresenta o salário de funcionários de uma empresa no interior de Minas Gerais 116 SALÁRIO FREQUENCIA ABSOLUTA FREQUENCIA ACUMULADA [400;800) 38 38 [800;1200) 18 56 [1200;1600) 12 68 [1600; 2000) 8 76 [2000,2400) 8 84 [2400;2800) 5 89 [2800;3200) 3 92 [3200;3600) 0 92 [3600;4000) 2 94 [4000; 4400) 0 94 [4400;4800) 1 95 Total 95 0 5 10 15 20 25 30 35 40 200 600 100 1400 1800 2000 2200 2400 2600 2800 3000 3200 3400 Fr eq u en ci a A b so lu ta Ponto Médio das Classes Salário dos Funcionários Ogiva Uma ogiva é um gráfico para uma distribuição de frequências acumuladas. 117 Ogiva Para construir um gráfico de ogiva, devemos usar o limite superior de cada intervalo no eixo horizontal e a frequência acumulada no eixo vertical. A frequência acumulada relacionada com o limite inferior da primeira classe é sempre zero. 118 Ogiva A tabela a seguir apresenta o salário de funcionários de uma empresa no interior de Minas Gerais 119 SALÁRIO FREQUENCIA ABSOLUTA FREQUENCIA ACUMULADA [400;800) 38 38 [800;1200) 18 56 [1200;1600) 12 68 [1600; 2000) 8 76 [2000,2400) 8 84 [2400;2800) 5 89 [2800;3200) 3 92 [3200;3600) 0 92 [3600;4000) 2 94 [4000; 4400) 0 94 [4400;4800) 1 95 Total 95 0 10 20 30 40 50 60 70 80 90 100 400 800 1200 1600 2000 2400 2800 3200 3600 4000 4400 4800 Fr eq u en ci a ac u m u la d a Salário Ogiva - Salários dos Funcionários Diagrama de Pareto CURVA ABC 120 Diagrama de Pareto O princípio de Pareto, também conhecido como o princípio 80/20, foi criado em 1897 por Vilfredo Pareto Esse diagrama também conhecido como curva ABC, é uma técnica estatística que auxilia na tomada de decisão, permitindo aos gestores selecionar prioridades quando há um grande número de problemas. É um gráfico de colunas que ordena as frequências das ocorrências, da maior para a menor, permitindo a priorização dos problemas, procurando levar a cabo o princiípio de Pareto (80% das consequências advêm de 20% das causas), isto é, há muitos problemas sem importância diante de outros mais graves. Recomenda-se que, antes de fazer a aplicação da regra de Pareto, tenha-seum objetivo dentro da empresa. Esse objetivo pode ser o aumento da taxa de retorno dos clientes, a redução de estoques, a redução nas devoluções de produtos, a venda exclusiva dos produtos mais rentáveis, dentre outros. 121 122 Gráfico de Pareto 123 Gráfico de Pareto 124 Defeito/Problema Quantidade Frequencia Relativa % Frequencia Relativa Acumulada % Ranhura 151 30% 30% Rebarba 133 26% 56% Ovalização 116 23% 79% Fissura 46 9% 88% Quebra 24 5% 93% Tonalidade 15 3% 96% Espessura 12 2% 98% Outros 8 2% 100% Total 505 100% 151 133 116 46 24 15 12 8 30% 56% 79% 88% 93% 96% 98% 100% 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% 0 100 200 300 400 500 Ranhura Rebarba Ovalização Fissura Quebra Tonalidade Espessura Outros Diagrama de Pareto Quantidade Frequencia Relativa Acumulada % Gráfico de Pareto 125 Problema Total `% `% acumulada Lubrificação da máquina 863 41,13% 41,13% Qualidade do material 759 36,18% 77,31% Corte desregulado 177 8,44% 85,75% Torno descalibrado 77 3,67% 89,42% Sensor desregulado 73 3,48% 92,90% Erro na galvanizaçãp 40 1,91% 94,80% Erro humano 29 1,38% 96,19% Mistura de metais 29 1,38% 97,57% Defeitos na refrigeração 28 1,33% 98,90% Velocidade da máquina 23 1,10% 100,00% 2098 863 759 177 77 73 40 29 29 28 23 41,13% 77,31% 85,75% 89,42% 92,90% 94,80% 96,19% 97,57% 98,90% 100,00% 0,00% 10,00% 20,00% 30,00% 40,00% 50,00% 60,00% 70,00% 80,00% 90,00% 100,00% 0 500 1000 1500 2000 Causas e impactos na geração de defeitos Total `% acumulada Gráfico de Pareto 126 Descrição Causa Quantidade ´% Relativa ´% acumulada Lentidão no sistema causa 1 62 30% 30% Central sempre ocupada causa 2 48 23% 53% Feedback tira dúvidas demorado causa 3 35 17% 69% Falta de conhecimento dos produtos por parte dos atendentes causa 4 19 9% 78% Descontentamento da Cortesia por parte do atendimento causa 5 15 7% 86% Alta rotatividade no quadro de atendentes causa 6 12 6% 91% Erro no envio dos pedidos por parte dos atendentes causa 7 10 5% 96% Tempo excessivamente alto para entre gos produtos causa 8 8 4% 100% 209 100% 62 48 35 19 15 12 10 8 30% 53% 69% 78% 86% 91% 96% 100% 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% 0 50 100 150 200 causa 1 causa 2 causa 3 causa 4 causa 5 causa 6 causa 7 causa 8 Causas e impactos na queda do número de vendas Quantidade ´% acumulada Tutorial completo para gráficos no Excel https://www.baboo.com.br/arquivo/software/trabalhando-com- graficos-no-office-2013/ 127 https://www.baboo.com.br/arquivo/software/trabalhando-com-graficos-no-office-2013/ Medidas de Dispersão AMPLITUDE – TOTAL E INTERQUARTIL DESVIO PADRÃO VARIANCIA 128 129 Informações sobre Honolulu e Huston •Temperatura média diária quase iguais – em torno de 23,9° • A temperatura em Honolulu varia muito pouco ao longo do ano, oscilando, em geral, entre 21,1ºC e 26,7ºC. • A temperatura em Houston pode diferir estacionalmente, isto é, apresentar-se baixa em janeiro (cerca de 4,4ºC) e alta em julho e agosto (bem perto de 37,8ºC). APESAR DA MESMA MÉDIA, AMBAS AS CIDADES APRESENTAM VARIAÇÕES DIFERENTES DE TEMPERATURA A distribuição de temperatura em Houston (Texas) tem maior variabilidade do que a distribuição de temperaturas em Honolulu (Havaí). 130 Um exemplo ... Considere os seguintes conjuntos de valores das variáveis X, Y e Z: X: 70, 70, 70, 70, 70. Y: 68, 69, 70, 71, 72. Z: 5, 15, 50, 120, 160. Calculando a média aritmética de cada um destes conjuntos, obtemos: Média X = 70 Média Y = 70 Média Z = 70 Os três conjuntos apresentam a mesma média aritmética: 70, entretanto é fácil notar que o conjunto X é mais homogêneo que os conjuntos Y e Z. Para quantificar o quão os dados são heterogêneos precisamos encontrar algumas medidas de dispersão. 131 Amplitude Amplitude total (R): a amplitude total é a diferença entre o maior e o menor valor observado: 132 A amplitude só leva em conta dois valores de todo o conjunto de dados Desvio Padrão (S) O desvio-padrão é a medida mais usada na comparação de diferenças entre grupos, por ser mais precisa e estar na mesma medida do conjunto de dados. Ele determina a dispersão dos valores em relação a média. Sua formulação é dada pela raiz quadrada da média aritmética dos quadrados dos desvios, ou seja: onde, é cada uma das observações do conjunto de dados, é a média do conjunto de dados e n é o número total de observações do conjunto de dados. 133 Variância 134 Coeficiente de Variação (CV) O coeficiente de variação (cv) é definido como o quociente entre o desvio- padrão e a média. É freqüentemente expresso em porcentagem. (Ele mede o “grau” de variabilidade do conjunto de dados). Alguns autores consideram a seguinte regra empírica para a interpretação do coeficiente de variação: • Baixa dispersão: C.V ≤ 15% • Média: C.V . 15% – 30% • Alta: C.V ≥ 30% 135 Exemplos 1) Sabendo-se que a produção leiteira diária da vaca A, durante uma semana, foi de: 10, 14, 13, 15, 16, 18 e 12 litros, pede-se calcular a amplitude, o desvio-padrão (S), a variância ( S2) e o coeficiente de variação (cv). Organizando a amostra em um rol temos: 10 12 13 14 15 16 18 AMPLITUDE R = 18 – 10 = 8 136 Exemplo - continuação Para calcular o desvio padrão, precisamos antes da média do conjunto Média = ( 10 + 12 + 13 + 14 + 15 + 16 + 18) / 7 = 14 137 Exemplo - continuação 138 Dados agrupado em uma tabela de frequencia Atenção: 139 Exemplo – Dados Agrupados em uma tabela de Frequencia Consideremos a distribuição relativa a 34 famílias de quatro filhos, tomando para variável o número de filhos do sexo masculino: Para calcular as medidas de dispersão do conjunto, precisamos saber a média e criar novas colunas na tabela. 140 Exemplo – continuação Média = ( 0x2 + 1x6 + 2x10 + 3x12 + 4x4) / 34 ◦ Média = 2,9 ◦ Amplitude = R = 4 – 0 = 4 meninos 141 Exemplo - Continuação 142 Exemplo - Continuação 143 Exemplo - continuação Ou seja, o número médio de filhos homens por família de 4 filhos é de 2,3 com uma variabilidade de aproximadamente 1 filho, ou seja, a maior parte das famílias com 4 filhos têm entre: 2,3 +/- 1 = (1,3 e 3,3) (1 e 3) filhos homens. 144 Exemplo – Dados em uma tabela de frequencia com classes Custos R$ Fi Classes de fr. 450 |- 550 8 550 |- 650 10 650 |- 750 11 750 |- 850 16 850 |- 950 13 950 |- 1050 5 1050 |- 1150 1 Total 64 145 Considere a seguinte distribuição de freqüência referente aos salários de operários de uma determinada fábrica: Exemplo - continuação 146 Exemplo - continuação Amplitude: R= 1150 – 450 = 700 ou seja, a maior diferença existente entre os salários dos operários desta determinada fábrica é de R$ 700,00. OBS: Sabemos que a média para este conjunto de dados é =754,69 filhos Desvio-padrão: 147 Exemplo - Continuação ou seja, o número médio de salários é de R$754,68 com uma variabilidade de aproximadamente R$155,26, ou seja, a maior parte dos operários recebem entre: 754,68 155,26 = (599,42 e 909,94) reais. 148 Exemplo - Continuação 149
Compartilhar