Baixe o app para aproveitar ainda mais
Prévia do material em texto
�PAGE � �� � � CAPÍTULO I CONCEITOS BÁSICOS 1.1 O que é Estatística É a ciência dos dados. Envolve a coleta , classificação, resumo, organização, análise e interpretação da informação numérica. A Estatística tem importante papel no pensamento crítico, seja no trabalho, na pesquisa ou no dia- a-dia. Tem muita aplicação em economia, administração, nos negócios, ciências contábeis, ciências físicas, turismo, etc. Muitos empregos na indústria , no governo, em medicina, em engenharia e em outras áreas exige que se tome decisões com base nos dados disponíveis. Esses conjuntos de dados podem ser diários, semanais, etc. Podemos citar como exemplo o preço diário do fechamento de ações, ouro, soja, etc; valores diários de taxas de juros, vendas mensais de um produto e consumo mensal de energia elétrica. 1.2 EXEMPLOS DE APLICAÇÕES: Encerrada a votação em uma eleição é anunciado que determinado candidato é o provável vencedor e a previsão é realizada com apenas 2% dos votos apurados. O governo informa que a renda média de uma família com 4 pessoas aumentou 5% O meteorologista informa que a probabilidade de chover hoje é de 30% Um fabricante de lâmpadas deve determinar a porcentagem de lâmpadas que não funcionarão pois se essa porcentagem for muito grande sua reputação estará em risco Estimativa de audiência de um show na TV com base em uma pequena amostra de lares Uma firma está para lançar um novo produto e precisa conhecer as preferências dos consumidores no mercado de interesse O consumo de sorvete depende do preço do produto, da renda média local, do número de crianças na comunidade e da temperatura. Deve-se fazer um levantamento estatístico com tais variáveis. Antes de lançar um novo remédio é necessário fazer várias experiências para garantir que o produto é seguro e eficiente. 1.3 ATIVIDADES BÁSICAS DA ESTATÍSTICA TÉCNICA DE AMOSTRAGEM ESTATÍSTICA DESCRITIVA INFERÊNCIA ESTATÍSTICA DESCRITIVA: Utiliza métodos numéricos e gráficos para mostrar os padrões de comportamento dos dados, para resumir a informação contida nesses dados e para apresentar a informação de forma conveniente. INFERÊNCIA: Utiliza dados de amostras para obter estimativas sobre a população.Ex: Duração média da vida útil de uma calculadora, comparar o efeito de duas dietas para reduzir peso, determinar a dosagem ideal de um novo medicamento. TEORIA DA PROBABILIDADE: Permite descrever fenômenos incertos. Em cada situação vai existir incertezas porque dispomos apenas de informações parciais (amostra), essas incertezas são tratadas com métodos probabilísticos. 1.4 NATUREZA DA ESTATÍSTICA O termo Estatística provém da palavra Estado. Era utilizada para levantar dados e orientar o Estado em decisões. Levantava-se dados para determinar o valor de impostos cobrados dos cidadãos e determinar estratégias de uma nova batalha em guerra (fazer o levantamento de quantos homens, armas e cavalos dispunham após a última batalha). 1.5 DEFINIÇÕES BÁSICAS 1.5.1 DADOS: São matéria prima da Estatística. Definindo o assunto de interesse , os dados são obtidos da medição de determinada característica ou propriedade desse objeto, pessoa ou coisa. Podem se dividir em dois tipos: DADOS QUANTITATIVOS: Se referem a quantidade, isto é , são medidos numa escala numérica. Podem ser divididos em : Dados Discretos: Podem assumir valores inteiros. Exemplo: Número de vendas diárias de uma empresa, número de transações financeiras com erro de lançamentos, número de turistas que chegam por dia em certa cidade turística , etc. Dados Contínuos : Podem assumir qualquer valor do conjunto do números reais.Exemplo: Consumo mensal de energia elétrica, valor das vendas diárias de uma empresa, etc. DADOS QUALITATIVOS: Que não são numéricos. Podem ser classificados em : Dados Nominais: Podem assumir categorias sem ordenamento Exemplo: Sexo, cor dos olhos, etc Dados Ordinais: Podem assumir categorias onde existe um ordenamento ou hierarquia.Exemplo: Hierarquia numa empresa: presidente, diretor, gerente; Respostas a um questionário de pesquisa onde existe uma escala : bom, regular, péssimo; etc. VARIÁVEL: Qualquer característica associada a uma população. Pode assumir qualquer um de um conjunto de valores que lhe são atribuídos (domínio). Exemplos: Uma única variável: lucro líquido mensal de uma empresa , saldo médio dos clientes de um banco comercial , quantidade de turista na semana em certa região. Nessa série de dados serão aplicados métodos estatísticos para resumir as propriedades desses dados como determinação do valor central, da dispersão etc. Duas variáveis: Valores mensais do faturamento e do lucro líquido de uma empresa, Rentabilidade anual de um investimento e a taxa anual de inflação. Entre os objetivos de analisar experimentos com duas variáveis podem ser destacados: verificação da existência e o grau da relação entre as duas variáveis; a possibilidade de prever uma variável em função da outra. A ferramenta Estatística a ser usada dependerá da natureza dos dados. 1.5.3 POPULAÇÃO E AMOSTRA POPULAÇÃO: É um conjunto ou coleção de dados que descreve algum fenômeno do nosso interesse..Muitas vezes o tamanho da população é muito grande , como é o censo demográfico do Brasil ou as populações não podem ser medidas integralmente, como é o caso da medição da vida útil de lâmpadas produzidas que obrigaria a testar todas as lâmpadas produzidas destruindo o estoque. Devido a isto precisamos selecionar uma amostra da população de interesse. AMOSTRA: É um subconjunto de dados selecionados de uma população. População finita Exemplos:Alunos matriculados no 2º ano de Biologia da UNISANTA; Todas as pessoas que compram telefone celular; População infinita Exemplos: Conjunto de medidas de determinado comprimento; Gases, líquidos e alguns sólidos, como o talco porque as unidades não podem ser identificadas e contadas. 1.5.4 FASES DO MÉTODO ESTATÍSTICO COLETA DE DADOS: Após cuidadoso planejamento e a devida determinação das características do fenômeno que se quer pesquisar, damos inicio à coleta de dados numéricos necessários à sua descrição. CRÍTICA DOS DADOS: Obtidos os dados eles devem ser cuidadosamente criticados, à procura de possíveis falhas ou imperfeições afim de incorrermos em erros grosseiros ou que possam influir sensivelmente nos resultados. APURAÇÃO: Processamento e disposição dos dados mediante critérios de classificação EXPOSIÇÃO OU APRESENTAÇÃO DOS DADOS: Apresentação sobre forma adequada dos dados em tabelas ou gráficos ANÁLISE DOS RESULTADOS: O objetivo aqui é tirar conclusões sobre a população a partir de informações fornecidas pela amostra. Após as fases apresentadas fazemos uma análise através da Estatística Inferencial e tiramos conclusões e previsões dos dados. CAPÍTULO II 2 APRESENTAÇÃO DE DADOS O sucesso de uma decisão dependerá da nossa habilidade em compreender as informações contidas nos dados. Administradores gastam muito do seu tempo passando informações para os outros e se a informação estiver mal apresentada ou for mal transmitida será na melhor das hipóteses perdida e na pior, entendida de maneira errada. Para apresentar informações numéricas devemos lembrar que muitas pessoas tem dificuldades para entender tal informação. Como apresentar a organização, apresentação e análise gráfica de uma série de dados será mostrado abaixo: 2.1 TABELAS Os dados apurados são apresentados em tabelas. Existem normas nacionais para organização de tabelas ditadas pela ABNT ( Associação Brasileirade Normas Técnicas). Essas normas não serão tratadas aqui, mas convém saber que as tabelas devem ter os componentes: Título : Precede a tabela e explica o dado em estudo, tempo e lugar a que os dados se referem. Cabeçalho: Especifica o conteúdo de cada coluna indicadora. O conteúdo de cada linha da tabela Corpo da tabela: apresenta os dados Exemplo: Para saber quais são as melhores cidades para se fazer negócio no Brasil, a revista Exame fez uma pesquisa em parceria com a Simonsen Associados. Foram levantados dados de disponibilidade de vôos, número de agências bancárias, número de quartos na rede hoteleira, etc, em 101 municípios. Veja os dados que mostram as cidades com maior potencial de consumo em 1998 Título: As dez melhores cidades brasileiras para fazer negócios CIDADE POPULAÇÃO(MILHARES) CONSUMO ANUAL PER CAPITA(US$ / HAB) São Paulo 9927 5680 Rio de Janeiro 5584 5486 Belo Horizonte 2124 4742 Brasília 1923 5192 Curitiba 1550 6249 Porto Alegre 1306 7040 Salvador 2274 3872 Fortaleza 2056 3160 Campinas 937 5943 Recife 1368 3993 Fonte: IBGE / Ibope/Simonsen Associados (1999) ALGUMAS NORMAS PARA CONSTRUÇÃO DE TABELAS 2.2 SÉRIES ESTATÍSTICAS Toda tabela que apresenta a distribuição de um conjunto de dados em função da época , local ou espécie é chamada de série estatística. Temos os tipos de séries mais conhecidos designados abaixo. 2.2.1 SÉRIES HISTÓRICAS, CRONOLÓGICAS OU TEMPORAIS. Descrevem os valores da variável discriminadas em um intervalo de tempo Exemplo: Título: Preço do Acém no varejo – São Paulo 1989 / 1994 Anos Preço Médio (US$) 89 2,24 90 2,73 91 2,12 92 1,89 93 2,04 94 2,62 Fonte : APA SÉRIES GEOGRÁFICAS, ESPACIAIS, TERRITORIAIS OU DE LOCALIZAÇÃO Descrevem os valores das variáveis discriminadas segundo regiões. Exemplo: Título: Duração média dos estudos superiores - 1994 Países Nro de anos Itália 7.5 Alemanha 7.0 França 7.0 Holanda 5.9 Inglaterra Menos de 4 Fonte : Revista Veja SÉRIES ESPECÍFICAS OU CATEGÓRICAS Descrevem os valores da variável segundo especificações ou categorias. Exemplo: Título: Rebanhos Brasileiros - 1992 Espécies Quantidade (1000 cabeças) Bovinos 154.440,8 Bubalinos 1.423,3 Eqüinos 549,5 Asininos 47,1 Muares 208,5 Suínos 34.532,2 Ovinos 19.959,9 Caprinos 12.159,6 Coelhos 6,1 Fonte : IBG SÉRIES CONJUGADAS Conjugação de duas ou mais séries. Exemplo: Título:Terminais telefônicos em serviço 1991 - 1993 Regiões 1991 1992 1993 Norte 342.938 375.658 403.494 Nordeste 1.287.813 1.379.101 1.486.649 Sudeste 6.234.501 6.729.467 7.231.634 Sul 1.497.315 1.608.989 1.746.232 Centro Oeste 713.357 778.925 884.822 Fonte : IBGE DISTRIBUIÇÃO DE FREQUÊNCIA COM DADOS DISCRETOS Distribuição de freqüências: É uma tabela onde os valores de uma variável se agrupam em classes, registrando-se o número de valores observados em cada classe. Freqüência de uma observação: É o número de repetições dessa observação. Distribuição de freqüências relativas: É o número de repetições dessa observação dividida pelo tamanho da amostra.A compreensão dos dados pode aumentar se as freqüências forem expressadas como porcentagem do total das observações da amostra. Distribuição de freqüências acumuladas: É a soma das freqüências absolutas ou relativas, desde a observação inicial da série.Em alguns casos o interesse da análise está na determinação da quantidade de observações que são menores ou maiores que um determinado valor. A construção de uma tabela de freqüências consiste em 3 etapas: - Escolha das classes (intervalos ou categorias) - Enquadramento dos dados nessas classes - Contagem do número de elementos em cada classe. Exemplo: Considere o número de negócios fechados por dia pelo operador A nos últimos 2 anos (500 dias) investigando uma amostra de 26 dias. 14 12 13 11 12 13 16 14 14 15 17 14 11 13 14 15 13 12 14 13 14 13 15 16 12 12 Através dos dados podemos utilizar uma tabela de distribuição de freqüências absolutas, relativas e acumuladas para resumir a informação: Nro de operações fechadas por dia Freqüência absoluta Freqüência relativa Freqüência acumulada % acumulada 11 2 7,69 2 7,69 12 5 19,23 7 26,92 13 6 23,08 13 50 14 7 26,92 20 76,92 15 3 11,54 23 88,46 16 2 7,69 25 96,15 17 1 3,85 26 100 Total 26 100 Conclusões: A partir dos resultados da tabela acima podemos analisar os resultados das operações fechadas diariamente pelo operador A: DAS FREQUÊNCIAS ABSOLUTAS: O valor máximo de 17 operações fechados por dia pelo operador A se deu em apenas um dia da amostragem. O valor mínimo de 11 operações fechadas por dia se repetiu em 2 dias Em 7 dias da amostragem, o operador A fechou 14 operações por dia. DAS FREQÊNCIAS RELATIVAS: Foram fechados 17 negócios por dia em 3,85% dos 26 dias amostrados Em 7,69% dos 26 dias amostrados, o operador A fechou 11 negócios por dia Durante 26,92% dos dias da amostra foram fechados 14 negócios por dia. Em 50% dos dias da amostra, foram fechados entre 13 e 14 negócios por dia DAS FREQUÊNCIAS ACUMULADAS: Em 76,92% dos dias o operador A fechou 14 ou menos operações Em 23,08% dos dias o operador A fechou 15 ou mais operações por dia Em 61,54% dos dias o operador A fechou entre 13 e 15 negócios, incluindo os valores limites. 2.4 DISTRIBUIÇÃO DE FREQUÊNCIAS COM DADOS CONTÍNUOS Quando os dados da série são contínuos, pode acontecer que poucos ou nenhum desses dados apresente freqüência. O procedimento que deve ser usado é selecionar classes onde podemos agrupar os dados. Exemplo: Título: Gasto médio per capita / dia (US$) dos principais emissores de turistas para o Brasil em 2000. Países Gasto médio per capita/dia (US$) Argentina 69.44 Estados Unidos 122.35 Paraguai 36.02 Uruguai 80.84 Alemanha 85.73 França 66.07 Espanha 94.19 Inglaterra 106.71 Portugal 79.01 Chile 77.19 Itália 114.9 Canadá 111.36 Fonte: Embratur e Fade Queremos apresentar os dados em questão, em uma tabela de distribuição de freqüência agrupados em classes mostrando para tanto a quantidade de países que se encontram nas classes selecionadas. Procedimento: 1 – Definir o número de classes. Não existe regra geral mas é recomendado que o número de classes seja um valor entre 5 e 15. Se o número de classes for pequeno (por exemplo 3 classes) , perde-se muita informação e se o número de classes for grande (por exemplo 30 classes) tem-se pormenores desnecessários. Um critério para designar o número de classes pode ser calculado da seguinte maneira: K = raiz de n Onde n = número de dados O resultado da fórmula deverá ser arredondado para o menor ou maior inteiro . Para o nosso exemplo : N = 12 K= 3,46 Deveremos usar 4 classes 2 - Calcular o intervalo de variação: Diferença entre o maior e menor valor da série. Para o exemplo: Intervalo variação = 122.35 – 36.02 = 86.33 3- Calcular a amplitude das classes: Amplitude = Intervalo de variação dividido pelo número de classes Amplitude = 86,33 / 4 = 21,58 (arredondar para 22) 4 - Preparar a tabela de classes classes LI LS 1 36 58 2 58 80 3 80 102 4 102 124 O limite superior de cada classe é aberto, isto é , a classe não inclui o valor do seu limite superior com exceção da última classe. 5 - Selecionaros dados por classe Classe frequência Freqüência relativa [36 , 58[ 1 8,33 [58 , 80[ 4 33,33 [80,102[ 3 25,00 [102,124] 4 33,33 2.5 GRÁFICOS ESTATÍSTICOS 2.5.1 CONSTRUINDO BONS GRÁFICOS Sua qualidade depende de como ele apresenta o padrão dos dados e quão claramente conta a história nele contida para o público. Tem o formato mais fácil de ler do que uma tabela mas gráficos mal desenhados pode confundir e conduzir à uma interpretação errada. A representação gráfica de um fenômeno deve obedecer certos requisitos fundamentais para ser útil como: Simplicidade: O gráfico deve ser destituído de importância secundária, assim como traços desnecessários que possam levar o observador à uma análise morosa ou com erros. Clareza: Deve possibilitar uma correta interpretação dos valores representativos do fenômeno Veracidade: Deve expressar a verdade sobre o fenômeno em estudo. 2.5.2 TIPOS DE GRÁFICOS: GRÁFICO DE LINHAS: Apresentam bem flutuações, crescimento, quedas e ponto de inflexão. Além da forma , as escalas nos eixos devem ser observadas. Diferentes escalas podem dar impressões diferentes. Procurar aquela que aumente as chances de o público entender e detectar corretamente o padrão de comportamento dos dados. Exemplo 1: Os gráficos de linhas abaixo mostram as vendas de um vendedor no ano de 2000 e 2001. Gráfico I Gráfico II Os dois gráficos são referente ao mesmo vendedor mas as mudanças na escala nos dão impressões diferentes, parecendo-nos no gráfico II uma maior estabilidade nas vendas do que no gráfico I. Exemplo 2: As figuras abaixo mostram um aumento no volume de vendas de dois modelos de um produto da empresa X entre os anos de 1996 e 1997. Gráfico I Gráfico II No Gráfico I, olhando as retas crescentes podemos concluir que houve um aumento gradual no volume de vendas. A figura II nos dá uma melhor impressão e mostra as retas crescendo mais rapidamente sendo as vendas do modelo A aumentadas com taxa maior do que as vendas do modelo B. Na primeira figura isso já não é tão aparente.A impressão de maior crescimento é dada pelas escalas dadas nos eixos. Porque então usar gráficos se as tendências são tão afetadas pelas escalas? A resposta é porque apesar disso os gráficos apresentam bem flutuações, crescimentos, quedas e pontos de inflexão, entretanto para lê-lo é preciso observar além das formas as escalas utilizadas. Exemplo 3: O exemplo abaixo mostra as vendas nos anos de 1985 à 1997 Gráfico I Gráfico II Analisando o gráfico I, verificamos que as vendas se apresentam relativamente estáveis com pequenas flutuações. Em geral o espaço vazio no corpo do gráfico traz certo embaraço, a escala pode então ser quebrada. A quebra do eixo atua como telescópio. Vemos com mais clareza no gráfico II, as vendas aumentando e diminuindo. GRÁFICO DE BARRAS: É utilizado para comparar dados de diferentes categorias como por exemplo renda de trabalhadores de diferentes regiões. Serve também para monitorar as mudanças no tempo. O tamanho de cada barra depende da importância da ilustração no texto. Exemplo: Número de carros vendidos pelo vendedor A nas 20 últimas semanas GRÁFICO DE PONTOS: É uma alternativa para o gráfico de barras. Exemplo: Número de carros vendidos pelo vendedor A nas 20 últimas semanas GRÁFICO DE SETORES: É utilizado para mostrar a composição de um total. Exemplo: Porte de 40 empresas dentre as clientes selecionadas de um banco PICTOGRAMAS: Usa-se símbolos para designar um certo número de unidades. Os símbolos são auto-explicativos. Por exemplo o desenho de um hambúrguer pode significar 250 hambúrgueres vendidos no Mcdonald. Exemplo: Faturamento real do comércio / veículos 1996 MAPAS: Mostra a variação de uma área geográfica Exemplo: Taxa de mortalidade infantil nas regiões brasileiras em 1984 HISTOGRAMAS: Representa uma tabela de freqüências. São conjuntos de retângulos justapostos cujas bases se localizam sobre o eixo horizontal, de tal forma que seus pontos médios coincidam com os pontos médios do intervalo de classe. Exemplo: As 50 maiores empresas em 1999 Fonte : Revista Exame / Junho de 2000 Notas: - A área de um histograma é proporcional a soma das freqüências - No caso de usarmos as freqüências relativas, obtemos um gráfico de área unitária - Quando quisermos comparar duas distribuições , o ideal é usarmos as freqüências relativas. POLÍGONO DE FREQUÊNCIA: É uma versão suavizada do histograma. É construído unindo-se os pontos médios de cada bloco do histograma. Exemplo: Alturas de 46 alunos de uma escola. Como em geral os dados coletados pertencem a uma amostra extraída de uma população, podemos imaginar as amostras tornando-se cada vez mais amplas e a amplitude das classes do histograma ficando cada vez menor o que nos permite fazer o contorno ou analisar a forma da distribuição de freqüência de maneira a se transformar numa curva. Algumas formas são características das distribuições de freqüência , são elas: Forma de Sino Assimétrica Positiva Assimétrica Negativa Forma de Jota Forma de Jota invertido Forma de U ALGUMAS NORMAS PARA CONSTRUÇÃO DE GRÁFICOS Mais exemplos de gráficos: Gráfico de Barras Preço de Remédios em Reais (R$) Gráfico de setores Gráfico: Distribuição das respostas à pergunta “Você utilizaria um medicamento genérico após o tratamento de uma determinada patologia clinica. Gráfico de Colunas GRÁFICO: MÉDIAS DE DESEMPENHO DOS SUJEITOS NA PROVA DE MATEMÁTICA EM RELAÇÃO AO GRUPO CAPÍTULO III 3 – MEDIDAS DE TENDÊNCIA CENTRAL Para resumir a quantidade de informação contida em um conjunto de dados, os estatísticos definem medidas que descrevem , através de um só número, características dos dados. As medidas mais utilizadas são média, moda e mediana. MEDIANA (Md): É o valor que ocupa a posição central do conjunto dos dados ordenados. É um valor tal que metade dos dados são iguais ou menores do que ela e metade são iguais ou maiores que ela. Com os dados organizados de forma crescente: Se o número de dados é ímpar, a Md é o valor que está no centro da série, isto é, o elemento de ordem (n+1) / 2. Se o número de dados for par, a Md é a média aritmética dos dois valores que ocupam a posição central, isto é , os valores com ordem n / 2 e (n / 2) + 1. Exemplo1: Calcule a mediana dos dados: 3 , 9, 5, 7, 9, 1, 9 Série Ordenada: 1 , 3, 5, 7, 9, 9, 9 N = 7 elementos Posição = = 4a posição na série ordenada Md = 7 Exemplo2: Calcule a mediana dos dados: 42, 3, 9, 5, 7, 9, 1, 9 Série Ordenada: 1, 3, 5, 7, 9, 9, 9, 42 N = 8 elementos Posição: = 4a e 4 + 1 = 5a posições Md = MODA (Mo) É o valor que mais se repete na série, isto é , que tem maior frequência. Exemplo: A moda do conjunto de dados abaixo é o 7 pois ocorre o maior número de vezes. 0, 0, 2, 5, 3, 7, 4, 7, 8, 7, 9, 6 Um conjunto de dados pode não ter moda (amodal) porque nenhum valor se repete , ou ter mais que uma moda (Multimodal). 3.3 MÉDIA É a medida de posição mais usada de uma série. Se refere a soma de todos os valores do conjunto dividida pelo número deles. Notação: Quando alguém fala sobre um conjunto de dados, pode estar se referindo a uma amostra ou uma população. Dessa forma abaixorelacionamos as fórmulas da média para as duas condições mudando as notações para diferencia-las. Média da população : Média Amostra: Exemplo: Calcule a média dos dados amostrais : 0 , 2, 4, 6, 8 Nota: a média tem a mesma unidade de medida dos dados. MÉDIA PONDERADA: Todos os valores da série recebem um peso ou uma importância. Exemplo: O capital de uma empresa está formado pelo aporte de acionistas, financiamento de longo prazo e emissão de debêntures dada por uma taxa de juros anual. Calcular a taxa de juros média das fontes de capital da empresa. Fonte de capital Participação Taxa de juros Acionistas 1.000.000 12% Financiamentos 600.000 8% Debêntures 400.000 14% A taxa de juros média das fontes de capital da empresa é 11,20% ao ano. MEDIDAS DE TENDÊNCIA CENTRAL PARA DADOS GRUPADOS EM CLASSES OU CATEGORIAS Média em categorias Onde fi são as freqüências de cada classe. Exemplo 1: Durante uma manhã, um feirante vendeu determinado produto a preços variados: 12 unidades foram vendidas a 2 reais; 10 à 3 reais; 8 à 6 reais. Qual o preço médio? O preço médio do produto na manhã foi de R$ 3,40 Exemplo2: Número de filhos do sexo masculino relativo à 34 famílias com 4 filhos Nro de filhos meninos(Xi) Freqüência fi Xifi 0 2 0 1 6 6 2 10 20 3 12 36 4 4 16 Total 34 78 Número de filhos é uma variável discreta, como interpretar 2,3 filhos, ou seja, 2 meninos e 3 décimos de menino? 2,3 sugere que o maior número de famílias tem 2 meninos e 2 meninas, sendo a tendência geral de uma leve superioridade numérica em relação ao número de meninos. Média em classes Exemplo 3: Imagine a margem de lucro na venda de um produto ao longo de 6 meses foram registrados os valores da tabela abaixo: Título: Margem de lucro, em termos de percentualdo valor da compra, segundo a classe Classe Valor central Freqüência [15 , 25[ 20 30 [25 , 35[ 30 45 [35,45[ 40 150 [45,55] 50 45 [55,65] 60 30 Média em classes : É o valor central de cada classe multiplicado pela respectiva freqüência cuja soma de cada multiplicação é dividida pela soma das freqüências. A margem de lucro foi em média 40%. 3.5.3 Moda em categorias A moda também pode ser usada para descrever dados qualitativos. A moda nesse caso é a categoria de maior freqüência. Exemplo1: O site da veja na internet perguntou que gastos as pessoas cortaram devido a crise econômica. Qual é a moda? Cortes % Jantar fora 24 Viagens 23 Curso de idioma 10 Cinema 7 Nenhum 36 A moda foi não cortar gastos, o que não significa que esse seja o comportamento da população em geral. Moda em classes A idéia da moda quando os dados estão em classes mostra a área em que os dados estão mais concentrados através da classe modal. Exemplo1: Sejam as estaturas de 40 estudantes de uma escola: Estaturas fi [150,154[ 4 [154,158[ 9 [158,162[ 11 [162,166[ 8 [166,170[ 5 [170,174] 3 Onde LI = limite inferior da classe modal = 158 LS = limite superior da classe modal = 162 A classe modal é a classe de maior freqüência, que corresponde aos 11 alunos que estão entre as alturas 158 à 162 centímetros. Logo a moda bruta será : Mediana em categorias Exemplo: Considerando o exemplo já mencionado acima: Nro de filhos meninos(Xi) Freqüência Fi Freqüência Acumulada 0 2 2 1 6 8 2 10 18 3 12 30 4 4 34 N = 34 valores Posição da Mediana = 17a Mediana = 2 Mediana em classes A idéia é utilizar uma fórmula citada abaixo que aproxime o valor da mediana real Onde: LI = Limite inferior da classe mediana Faant = Freqüência acumulada da classe anterior à classe mediana Freqmd = Frequencia da classe mediana H = amplitude da classe mediana Exemplo: Sejam as estaturas de 40 estudantes de uma escola: Estaturas fi Frequencia acumulada [150,154[ 4 4 [154,158[ 9 13 [158,162[ 11 24 [162,166[ 8 32 [166,170[ 5 37 [170,174] 3 40 Classe mediana = [158,162[ LI = 158 Faant = 13 freqmd = 11 h = 4 3.6 VANTAGENS E DESVANTAGENS DAS MEDIDAS DE TENDÊNCIA CENTRAL Qual das medidas usar? A escolha depende do tipo de problema. Vantagens Desvantagens Moda - Fácil de calcular - Não é afetada por valores extremos - Pode estar afastada do centro das observações - Difícil de incluir em equações matemáticas - A distribuição pode ter mais de uma moda - Não usa todos os dados disponíveis Mediana - Fácil de determinar - Não é afetada por valores extremos - Parece ser uma medida correta pois divide a série em duas partes iguais a 50% - Difícil de incluir em equações matemáticas - Não usa todos os dados disponíveis Média - Fácil de compreender e usar - Usa todos os dados disponíveis - Fácil de incluir em equações matemáticas - É afetada pelos extremos - É necessário conhecer todos os valores da distribuição Exemplo : A tabela abaixo fornece a taxa média de inflação para 106 países. Médias Taxa anual média Média Aritmética 134 Média Ponderada 11,1 Média aritmética sem a Bolívia 22,2 Média Ponderada sem a Bolívia 8,2 Mediana 6,8 Moda 3,6 A média aritmética das taxas anuais para os 106 países mostra um valor muito grande (134% aa), ou seja, os preços mais que dobram. Obtendo uma média ponderada, tratamos países grandes e pequenos dando nos cálculos proporcionalmente mais peso para países que produzem mais usando a participação no PIB mundial, nos últimos 3 anos. Assim economias menores com taxas de inflação maiores, tem menos peso nos cálculos o que reduz a inflação para 11,1% aa. Podemos remover a Bolívia como observação atípica Sendo um país que produz pouco e tem grande taxa de inflação, o que reduz o impacto de valores extermos ou usar a mediana ou a moda. Todas as medidas podem ser justificadas, o que significa que a inflação pode ser da ordem que se queira. A escolha depende dos objetivos. 3.7 Relações entre Moda, Média e Mediana Quando a distribuição de freqüências de uma série de observações é simétrica, os valores da média, da mediana e da moda coincidem. Os valores das medidas de posição de uma série de observações , permitem definir a forma da distribuição de freqüência dessa série. Quando Média > Mediana > Moda, a distribuição tem inclinação positiva ou inclinação na parte direita da distribuição. Ë chamada de Assimétrica Positiva. Quando Média < Mediana < Mo, a distribuição tem inclinação negativa ou inclinação na parte esquerda da distribuição. É chamada de Assimétrica Negativa CAPÍTULO IV 4 MEDIDAS DE DISPERSÃO Após calcular uma medida de tendência central para um conjunto de dados, você precisa associá-la a uma medida de dispersão ou variabilidade . Só assim será possível avaliar o grau de confiança com que a média , mediana ou moda resumem a informação. Exemplo 1: Em um hospital onde se mede a pulsação de cada paciente três vezes por dia, o paciente A acusou as taxas de 72 , 76 e 74 e o paciente B acusou 72, 91 e 59. A taxa média de ambos é a mesma, 74, entretanto a diferença na variabilidade é muito diferente. Enquanto a pulsação de A é estável, a de B apresenta grande flutuação. Exemplo 2: Um jogador de basquete faz 22 , 26 e 24 pontos em seus 3 primeiros jogos. Um parceiro de equipe faz 41, 13 e 18 nesse jogo. Ambos tem a mesma média mas o primeiro é muito mais consistente. As medidas de dispersão são utilizadas para avaliar o grau de variabilidade oudispersão em torno da média Dispersão ou variabilidade: É a maior ou menor diversificação de valores de uma variável em torno da média.Existem várias formas de tentar medir a dispersão ou variabilidade das observações de uma série como a amplitude, variância , desvio-padrão e coeficiente de variação que serão aqui tratados. 4.1 AMPLITUDE É a Diferença entre o maior e o menor valor do conjunto de dados. Exemplo: Conjunto A: 4, 6,4 , 6, 5, 5 amplitude = 6 - 4 = 2 Conjunto B: 9, 1, 5, 5, 1, 9 amplitude = 9 – 1 = 8 É fácil verificar que os conjuntos A e B tem a mesma média , a mesma mediana e a mesma moda. No entanto B tem maior amplitude que A PROBLEMA: A amplitude não mede bem a dispersão pois utiliza apenas os valores extremos da série. É importante utilizar todos os dados nos cálculos da medida de dispersão. Uso: É uma medida de cálculo rápido e fácil compreensão. É utilizada principalmente para medir a amplitude de temperatura em um dia, no controle de qualidade industrial para manter controle permanente sobre matérias-primas ou produtos acabados observando e registrando a amplitude de pequenas amostras extraídas a intervalos regulares de tempo. VARIÂNCIA DA AMOSTRA: É a soma dos quadradros dos desvios de cada observação em relação a média dividida por n-1, onde n é o número de observação da amostra. DA POPULAÇÃO: É a soma dos quadradros dos desvios de cada observação em relação a média dividida Por n, onde n é o número de observação da amostra. PROBLEMA: A divisão por n-1 na fórmula da amostra se dá pois , tendo poucos valores disponíveis, a estimativa da variância da população, assim como a média, é de baixa precisão. Exemplo1: Retira-se uma amostra da população da qual se desconhece a média e a variância. Suponha que estamos medindo altura e usamos uma pessoa na amostra cuja altura é 193 centímetros e a Média é também 193. Dessa forma o cálculo da variância dividida por n é igual a , o que não é verdadeiro porque é uma variância indeterminada já que não existe valores suficientes para seu cálculo. Deve ser calculada pela expressão dividida por n –1 . n –1 representa também os graus de liberdade, isto é, a quantidade de comparações independentes que podem ser feitas entre as n unidades da amostra. Se a média e (n-1) dos valores são fornecidos, o último estará determinado. PROPRIEDADES: O valor da variância é sempre positivo Quando todos os elementos são iguais, a variância é igual a zero. A soma dos desvios em relação à média é sempre zero. Em resumo : A finalidade do cálculo de uma estatística amostral é estimar o parâmetro populacional. Se extrairmos muitas amostras de uma população que tem média (, calcularmos as médias amostrais e tomarmos as médias de todas as estimativas de (, veremos que essa média fica muito próxima do valor populacional. Entretanto se calculássemos a variância para cada amostra pela fórmula: Se tomássemos a média de todas essas estimativas , obteríamos uma média inferior a variância populacional.Mostra-se que podemos compensar essa desvantagem dividindo por n-1 ao invés de n na fórmula da variância amostral. Exemplo: Calcule a variância para os dados do conjunto: 4, 6, 4 ,6, 5, 5 X X - 5 (X - 5)2 4 -1 1 6 1 1 4 -1 1 6 1 1 5 0 0 5 0 0 Total = 30 Total = 0 Total = 4 Como medida de dispersão a variância tem a desvantagem de apresentar unidade de medida igual ao quadrado da unidade de medida dos dados. Se os dados estão em metros, a variância fica em metros ao quadrado. Isso acontece porque a variância é obtida a partir da soma de quadrados dos desvios. Uma medida de dispersão associada a variância mas com a mesma unidade de medida dos dados é o desvio-padrão. 4.3 DESVIO-PADRÃO É a raiz quadrada da variância com sinal positivo. 4.4 DESVIO-PADRÃO PARA DADOS AGRUPADOS EM CLASSES Basta aproximar cada valor pelo ponto médio de cada classe. 4.5 COMO APLICAR O DESVIO-PADRÃO Seja uma série de observações com média x e desvio-padrão Sx. A série com desvio-padrão grande tem a distribuição de freqüência mais aberta enquanto que séries com desvio-padrão pequeno se apresenta com distribuição de freqüência mais fechada. Entre 60% e 80% das observações, em geral estão contidas do intervalo x ( Sx Para distribuições simétricas esse valor é 70%. Para distribuições assimétricas com acentuada inclinação para um dos lados esse valor se aproxima de 90%. 90% das observações estão contidas no intervalo x ( 2 Sx, para distribuições simétricas. Para distribuições assimétricas esse valor se aproxima de 100% Quase 100% das observações estão contidas no intervalo x ( 3 Sx, para todas as distribuições. Exemplo: Seja a série de dados: 14, 16, 12,17, 19, 17, 14, 18, 10, 17, 18 Média = 15,64 Desvio-padrão da amostra = 2,8 Média ( desvio-padrão = 15,64 ( 2,8 = [12,83 ; 18,44 ] Quantidade de observações contidas nesse intervalo = 8 Porcentagem de observações contidas no intervalo = 73% Média ( 2 desvios-padrão = 15,64 ( 2 x 2,8 = [10,03; 21,24 ] Quantidade de observações contidas nesse intervalo = 10 Porcentagem de observações contidas no intervalo = 91% Média ( 3 desvios-padrão = 15,64 ( 3x 2,8 = [7,23 ; 24,04 ] Quantidade de observações contidas nesse intervalo = 11 Porcentagem de observações contidas dentro do intervalo = 100% 4.6 COEFICIENTE DE VARIAÇÃO É uma medida relativa de dispersão, útil para comparação em termos relativos do grau de concentração em torno da média de séries distintas. É dado pela fórmula: Nas operações financeiras o investidor tenta estabelecer um valor médio de rentabilidades. Os desvios entre o valor médio e os possíveis valores de rentabilidades estabelecem o risco da operação e o desvio-padrão mede o risco da operação. Podemos usar o coeficiente de variação para comparar duas séries ou mais. A série que tiver menor CV, terá menor risco (menor dispersão). Exemplo1: As rentabilidades dos últimos 6 meses das carteiras de investimentos A e B estão na tabela abaixo. Qual das duas tem maior dispersão? A B 5% 6% 9% 7% 15% 9% 12% 7% 9% 6% 6% 8% E sejam as medidas resumidas : A B ( 9,33 7,17 ( 3,40 1,07 S 3,72 1,17 Cvpop 0,36 0,15 CVamos 0,40 ,016 Podemos perceber que a carteira A tem maior CV, ou seja, maior variabilidade. Dessa forma a carteira A tem maior risco que a carteira B. Exemplo2: Numa empresa os salários médio dos homens é de 4.000,00 com desvio-padrão de 1500,00 e o das mulheres é em média 3.000,00 com desvio-padrão 1.200,00 O salário das mulheres apresenta maior dispersão relativa do que o salário dos homens. REGRA GERAL: CV ( 15% BAIXA DISPERSÃO 15% < CV < 30% MÉDIA DISPERSÃO CV ( 30% ALTA DISPERSÃO. Exemplo 3: O preço do chá com creme em 5 diferentes lanchonetes de uma cidade turística vários anos atrás está abaixo: 0.9 0.95 1.0 1.05 1.10 Em 10 anos os preços dobraram: 1.8 1.9 2.0 2.1 2.2 DESVIO –PADRÃO anos atrás = 0,0707 DESVIO-PADRÃO atual = 0,1414 MÉDIA anos atrás = 1.0 MÉDIA atual = 2.0 Notamos que a dispersão dobra. A diferença entre cada valor e a média é duas vezes o que era antes. Os números dispersam-se mais em torno da média. CONCEITO RELATIVO: Não ocorreu mudança na dispersão. Os fregueses que se acostumaram com a nova média de preços verificam uma diferença de 40 centavos entre os novos preços, quando antes era de 20 centavos. Os 40 centavos relativo a média 2,0 pode ser equivalente aos 20 centavos relativo a média 1.0 dólar. CAPÍTULO V APLICAÇÕES NO EXCEL -NOÇÃO 5.1 DISTRIBUIÇÃO DE FREQUÊNCIAS PARA DADOS EM CATEGORIAS Exemplo 1: A instalação financeira tem 3 operadores trabalhando diariamente com opções de ações negociadasna bolsa de valores . Querendo conhecer o negociador B foi realizada uma amostragem de 26 de todos os negócios fechados por B em 2 anos, e os dados estão dados abaixo 14 12 13 11 12 13 16 14 14 15 17 14 11 13 14 15 13 12 14 13 14 13 15 16 12 12 FERRAMENTA fx Registrar dados de B2 A B27 Número de observações = CONTNUM(B2:B27) Valor Mínimo = MINÍMO(B2:B27) Valor Máximo = MÁXIMO(B2:B27) Registras os valores que serão usados para as classes de D6 à D12 11 12 13 14 15 16 17 FREQUÊNCIA Selecionar coluna de E6 à E13 Em E6 digitar FREQUÊNCIA(B2:B27,D6:D12) OU Usar a ferramenta FREQUENCIA em fx Pressionar CONTROL+SHIFT+ENTER O objetivo da última série é mostrar quantos dados deixaram de ser classificados RESULTADOS DO EXCEL A B C D E F 1 SÉRIE 2 14 tamanho 26 3 12 mínimo 11 4 13 máximo 17 5 11 Tabela de Freqüências 6 12 11 2 7 13 12 5 8 16 13 6 9 14 14 7 10 14 15 3 11 15 16 2 12 17 17 1 13 14 0 14 11 15 13 16 14 17 15 18 13 19 12 20 14 21 13 22 14 23 13 24 15 25 16 26 12 27 12 DISTRIBUIÇÃO DE FREQUENCIAS PARA DADOS EM CLASSES Exemplo 1: VENDAS DIÁRIAS EM $ 1.000 DE UMA EMPRESA DE PRODUTOS ALIMENTÍCIOS 280 305 320 330 310 340 330 341 369 355 370 360 370 365 280 375 380 400 371 390 400 370 401 420 430 CLASSES LI LS 1 280 310 2 310 340 3 340 370 4 370 400 5 400 430 Registrar os dados na coluna A( A2 à A26) Registrar os dados em ordem crescente (B2 à B26) Registrar os valores que serão usados para as classes. Em C registrar os limites superiores das classes Usar a ferramenta FREQUENCIA EM fx. Pressionar CONTROL+SHIFT+ENTER RESULTADO DO EXCEL A B C F G H 1 SÉRIE ORDEM LS Bloco Freqüência % cumulativo 2 280 280 309 309 3 12,00% 3 305 280 339 339 4 28,00% 4 320 305 369 369 6 52,00% 5 330 310 399 399 7 80,00% 6 310 320 430 430 5 100,00% 7 340 330 Mais 0 100,00% 8 330 330 9 341 340 10 369 341 11 355 355 12 370 360 13 360 365 14 370 369 15 365 370 16 280 370 17 375 370 18 380 371 19 400 375 20 371 380 21 390 390 22 400 400 23 370 400 24 401 401 25 420 420 26 430 430 5.4 HISTOGRAMA Utilizando os mesmos dados do exemplo anterior Registrar os dados de B2 à B27 Seleção em D4 à D10 11 12 13 14 15 16 17 MENU FERRAMENTAS / ANÁLISE DE DADOS INTERVALO DE ENTRADA: B2:B27 INTERVALO DE BLOCO:D6:D12 PORCENTAGEM CUMULATIVA RESULTADO DO GRÁFICO RESULTADOS DO EXCEL A B C D E SELEÇÃO Bloco Freqüência % cumulativo 11 11 2 7,69% 12 12 5 26,92% 13 13 6 50,00% 14 14 7 76,92% 15 15 3 88,46% 16 16 2 96,15% 17 17 1 100,00% Mais 0 100,00% 5.5 MEDIDAS DESCRITIVAS Série de dados. Digitar valores em B 31 38 19 27 24 42 32 18 43 15 39 FERRAMENTAS / ANÁLISE DE DADOS/ ESTATÍSTICA DESCRITIVA INTERVALO DE ENTRADA: B3:B14 AGRUPADO POR : COLUNA POIS A SÉRIE FOI DIGITADA EM COLUNA RÓTULO NA PRIMEIRA LINHA ( 1a célula registrada a palavra série) INTERVALO DE SAÍDA: Qualquer célula RESUMO ESTATÍSTICO RESULTADO DO EXCEL SÉRIE SÉRIE 31 38 Média 29,81818 19 Erro padrão 3,011548 27 Mediana 31 24 Modo #N/D 42 Desvio padrão 9,988175 32 Variância da amostra 99,76364 18 Curtose -1,46891 43 Assimetria -0,11748 15 Intervalo 28 39 Mínimo 15 Máximo 43 Soma 328 Contagem 11 Maiores detalhes do estudo da Estatística no Excel consultar: “Estatística aplicada à Administração usando Excel”- John L. Neufeld “Estatística usando Excel 5 e 7” – Juan Carlos Lapponi ANEXO I OBS: Abaixo temos exemplos sobre as possíveis aplicações da Estatística em diversas situações. MEDICINA “ Depois do câncer de pele, que é o tipo de tumor mais freqüente em homens com mais de 50 anos. 10% dos homens vão ter câncer de próstata em algum momento da vida” (folha de S. Paulo, 28/09/99) “ (Ataque cardíaco é 50% mais fatal em mulheres). Mulheres com menos de 50 anos tem mais que o dobro de chances de morrer ao sofrer ataque cardíaco do que os homens da mesma idade... (Folha de S. Paulo, 23/07/99)”. “Atualmente, 90% das mortes por câncer no pulmão são provocadas pelo cigarro. Quem começa a fumar na juventude tem 2 vezes mais chances de ter a doença” (folha de S. Paulo, 05/07/99) TRANSPORTES E TRÂNSITO “No Rio, 89.9% dos passageiros de transporte público andam de ônibus. Os trens são usados por 5,5% e o metrô por 5,7%. A prefeitura tem um plano para mudar estes percentuais nos próximos 10 anos baixando para 58.8% a taxa de uso de 6onibus e subindo para 22.4% a de trem e 16.8% a de metrô “(Jornal do Brasil, 08/01/00) LOTERIAS “Acumulada à nove semanas, a previsão é que o concurso 188 da Mega Sena pague 60 milhões de reais no sorteio de sábado, recorde das loterias do país. A chance de cada apostador é de 1 em 50 milhões. Segundo a caixa, o número de apostas deve ultrapassar os 70 milhões” (Jornal do Brasil, 04/10/99) “Curiosidades da Sorte: As chances de ganhar com uma aposta Mega Sena ( 1 em 50 milhões), Quina (1 em 24 milhões), Raspadinha ( 1 em 5 milhões), Loteria Federal (1 em 80 mil). Para Comparar: Morrer atingido por um raio ( 1 em 1 milhão), morrer num desastre de avião no Brasil (1 em 1.6 milhões), viver até os 100 anos no Brasil ( 1 em 10 mil), morrer em um acidente de carro no Brasil (1 em 4.7 mil). O prêmio de 46 milhões equivale a : 23 coberturas na avenida Vieira Souto (valor imobilário mais caro do Brasil), 106 carros populares, 28 mil colares de ouro, 20 vezes o orçamento do município de Braga, um dos mais pobres do Brasil, etc “(Jornal do Brasil, 01/10/99) “Mega Sena deve ter 2 ganhadores. As chances de o prêmio da Mega Sena sem ganhador há oito semanas, estimado até o momento em 46 milhões, voltar a acumular é de apenas 10%. A estimativa é do .... ele acredita que o sorteio tenha ao menos dois vencedores e no máximo 4 “(folha, 30/09/99) FUTEBOL “Aprendi , durante seis anos como estudante e dezesseis como médico e professor, que a medicina é uma ciência humana, biológica e principalmente, estatística. Todo ato médico, seja a prescrição de um remédio, uma cirurgia ou uma orientação, tem riscos calculados. Nunca se tem a certeza do resultado final. ... O médico que não conhece as possibilidades estatísticas de sucesso e fracasso de seu procedimento e somente confia na sua observação clínica será no mínimo um profissional soberbo. Por outro lado se o médico atender aos pacientes raciocinando somente as chances matemáticas esperadas, sem entender que aquele paciente éúnico, especial e diferente de todos os outros, ele não será um médico e sim um técnico em medicina. No futebol não é diferente. Se faço uma avaliação de um jogador num campeonato sem contar com seus dados estatísticos e a história de sua trajetória , a análise será deficiente. Se analiso um atleta somente pelos frios números, sem as observações técnicas de sua atuação em campo, ela também será falha. O exemplo clássico é o do jogador de meio-campo que não erra passe , mas que não arrisca e somente passa a bola para o jogador mais próximo. (Tostão, Jornal do Brasil, 29/12/99) “Ligado nos bastidores e trocando jogadores , paulistas e mineiros dominaram o Campeonato Brasileiro – 99. Dos oito clubes que se classificaram para o final da competição, seis foram para São Paulo ou Minas Gerais. Em média , cada um dos dez times dos dois estados no Nacional conquistou 49/9% dos pontos que disputou, contra 41.8% dos outors clubes” (Folha 17/12/99) DIA - A - DIA “As academias de ginástica se multiplicam em todo o Brasil. Estima-se que já movimentam 1,9 bilão em receita” (Jornal do Brasil 17/07/99) “ Esses números podem até impressionar ... - mas não tanto como os números que cercam um cidadão comum em São Paulo. Durante um ano ele terá 1,2 chance em 1000 de bater o carro em um dia de chuva, 1,7 chance em 1000 de ser assaltado e se morrer 1,8 chance em 100 de que seja atropelamento. Se nada disso acontecer com esse cidadão, sobra a certeza estatística de que alguém teve um ano pior que ele” (folha 10/11/96) GOVERNO “Tempo médio gasto com processo, pelos 37 ministros é inferior a 1 minuto. BRASÍLIA – Os 37 ministros do Tribunal Superior do Trabalho (TST) julgaram, no ano passado 121 mil processos. Tendo havido 321 sessões que duram de 4 a 5 horas, a matemática mostra que foram gastos , em média, 40 a 50 segundos por processo julgado. Como nos demais tribunais superiores, a grande maioria das ações era repetitivas ... “(Folha de S.Paulo, 5/1/2000) SOCIEDADE “ Analisar o desemprego apenas pela média – no caso 18,6% - é o caminho mais rápido para se manter desinformado. A bomba social brasileira aparece quando a média é desconsiderada e vemos o desemprego por faixa etária – e aí vemos a periculosidade da armadilha já montada. Se entre os chefes de família o desemprego gira em torno de 11%. Abaixo da média a estatística assume ares de calamidade pública quando se analisa a população mais jovem. Na camada dos 18 aos 24 anos atinge-se 26.7%. Pior ainda entre 15 e 17 anos quase beira os 50% mais precisamente 48.4%” (folha S. Paulo, 26/12/99) “No restaurante já tomado pela desconfiança, raciocinei assim: ‘há muita chance de eu ter sido enganada=º Mas prefiro ter dados o dinheiro a um malandro do que ser hostil a um inocente’. Claro que depois de saber que o golpe é aplicado freqüentemente pelo americano mudei de idéia” (Marcel Coelho, folha 19/01/00) ECONOMIA E INFLAÇÃO “ Para DIEESE , inflação em 99 em SP atinge 9.6%. A inflação medida pelo Dieese em São Paulo ficou em 0.8% em dezembro, recuando em relação ao 1.34% de novembro. A taxa fechou 1999 em 9.57% contra 0.49% em 1998. O Dieese conclui que o grande responsável pela inflação do ano passado foram os preços públicos que contribuíram com 3,86 pontos percentuais na taxa geral de 9.57%. Amaior pressão veio dos transportes, devido ao aumento da gasolina e álcool” (folha 05/1/00) POPULAÇÃO AMOSTRA INFORMAÇÕES CONTIDAS CONCLUSÕES SOBRE AS CARACTERÍSTICAS DA POPULAÇÃO 1 – As tabelas devem ter títulos e se existir mais de uma tabela , elas devem ser numeradas. O título deve explicar os dados com poucas palavras simples e salientar em que tempo e lugar, unidade de medida dos dados . 2 – Como os títulos das linhas e colunas devem ser pequenos, acrescentar notas no rodapé para dar definições, destacar dados diferenciados, evitando notas muito longas. 3 – A fonte dos dados deve ser sempre fornecida (no rodapé), de maneira que os leitores possam achar os dados originais 4 – Decida-se sobre a precisão dos números antes de fazer a tabela, isto é, sobre o número de casas decimais, arredondamento e se os dados devem ser apresentados em unidade, dezena ou milhares, etc. Como regra geral arredondar para dois algarismos significativos, a menos que se precise de grande exatidão. A razão é que é mais fácil para o leitor memorizar números redondos. 5 - Escreva os totais das linhas e colunas, médias ou qualquer outro resultado que interesse ao leitor. 6 - Quando possível os números grandes devem estar no início da tabela 7 – Não use tabelas para mostrar tendências ou correlações, os gráficos são melhores para isto. � EMBED Excel.Chart.8 \s ��� � EMBED Excel.Chart.8 \s ��� � EMBED Excel.Chart.8 \s ��� � EMBED Excel.Chart.8 \s ��� � EMBED Excel.Chart.8 \s ��� 1 – As palavras tem papel importante no gráfico. “Tabelas e gráficos sem o devido comentário são como filme mudo”. 2 – Dois gráficos são melhores que um só sobrecarregado. 3 – Podem ser feitas linhas de grade horizontais para ajudar a leitura. 4 – Nos gráficos feitos para o público (não técnico), seja criativo e use a imaginação para colocar títulos, que torna o gráfico mais fácil de ser entendido. 5 - O título deve ser claro. Use unidades de medida, identifique áreas geográficas , período, defina variáveis, fonte de dados. Se houver mais de um gráfico, cada um deve ter número próprio para referência 6 - Sempre que possível não usar legenda para que o público não tenha que olhar em dois pontos diferentes. 7 – Use sombreamento ou cores e símbolos para distinguir setores, barras ou linhas � EMBED MSGraph.Chart.8 \s ��� � EMBED MSGraph.Chart.5 \s ��� � EMBED MSGraph.Chart.5 \s ��� � EMBED MSGraph.Chart.5 \s ��� � EMBED Equation.3 ��� � EMBED Equation.3 ��� � EMBED Equation.3 ��� � EMBED Equation.3 ��� � EMBED Equation.3 ��� � EMBED Equation.3 ��� � EMBED Equation.3 ��� � EMBED Equation.3 ��� � EMBED Equation.3 ��� � EMBED Equation.3 ��� � EMBED Equation.3 ��� �PAGE � _1072513608.xls Gráf2 100 80 18 17 15 9 10 15 20 50 Plan1 140 50 100 100 142 20 80 50 144 15 18 20 146 10 17 10 148 9 15 5 150 15 9 5 152 17 10 10 154 18 15 20 160 80 20 50 180 100 50 100 Gráficos da Moda Plan1 0 0 0 0 0 0 0 0 0 0 Plan2 0 0 0 0 0 0 0 0 0 0 Plan3 0 0 0 0 0 0 0 0 0 0 MBD0022E7DA.xls Gráf7 0 0 1 2 3 6 8 9 8 5 3 Plan4 144 Freqüência % cumulativo 144 Freqüência % cumulativo 148 8 100.00% 148 8 100.00% 152 0 100.00% 152 0 100.00% 156 0 100.00% 156 0 100.00% 160 0 100.00% 160 0 100.00% 164 0 100.00% 164 0 100.00% 168 0 100.00% 168 0 100.00% 172 0 100.00% 172 0 100.00% 176 0 100.00% 176 0 100.00% Mais 0 100.00% Mais 0 100.00% Plan4 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Freqüência % cumulativo144 Freqüência Histograma Plan1 140 0 3 0 144 2 5 0 148 4 8 1 152 6 9 2 156 8 8 3 160 10 6 6 164 8 3 8 168 6 2 9 172 4 1 8 176 2 0 5 180 0 0 3 Plan1 0 0 0 0 0 0 0 0 0 0 0 Plan2 0 0 0 0 0 0 0 0 0 0 0 Plan3 _1102838173.unknown _1358925655.unknown _1358925788.unknown _1358925857.unknown _1453535660.unknown _1358925819.unknown _1358925671.unknown _1358925783.unknown _1358925769.unknown _1358925661.unknown _1121842650.xls _1358768060.xls Gráf3 60 55 58 56 57 56 55 53 52 56 51 52 50 valor das vendas em milhões Plan1 1985 60 1986 55 1987 58 1988 56 1989 57 1990 56 1991 55 1992 53 1993 52 1994 56 1995 51 1996 52 1997 50 Plan1 valor das vendas em milhões Plan2 Plan3 _1358768068.xls Gráf2 60 55 58 56 57 56 55 53 52 56 51 52 50 valor das vendas em milhões Plan1 1985 60 1986 55 1987 58 1988 56 1989 57 1990 56 1991 55 1992 53 1993 52 1994 56 1995 51 1996 52 1997 50 Plan1 valor das vendas em milhões Plan2 Plan3 _1232177566.unknown _1106726679.xls Gráf2 12 14 30 15 8 6 5 4 3 0 Freqüência Plan4 Plan5 Plan6 Plan7 Bloco Freqüência 1 4 2 5 3 5 4 6 5 8 6 10 7 14 8 25 9 17 10 8 Mais 0 Plan7 0 0 0 0 0 0 0 0 0 0 0 Freqüência Plan8 Coluna1 Média 6.7058823529 Erro padrão 0.241568451 Mediana 7 Modo 8 Desvio padrão 2.4397217635 Variância da amostra 5.9522422831 Curtose -0.2708907342 Assimetria -0.7892899012 Intervalo 9 Mínimo 1 Máximo 10 Soma 684 Contagem 102 Plan9 1 Freqüência % cumulativo 2 8 7.92% 3 5 12.87% 4 6 18.81% 5 8 26.73% 6 10 36.63% 7 14 50.50% 8 25 75.25% 9 17 92.08% 10 8 100.00% Mais 0 100.00% Plan9 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Freqüência % cumulativo Plan10 1 Freqüência % cumulativo 2 12 11.88% 3 14 25.74% 4 30 55.45% 5 15 70.30% 6 8 78.22% 7 6 84.16% 8 5 89.11% 9 4 93.07% 10 7 100.00% Mais 0 100.00% Plan10 0 0 0 0 0 0 0 0 0 0 Freqüência Plan11 1 Freqüência % cumulativo 2 12 12.12% 3 14 26.26% 4 30 56.57% 5 15 71.72% 6 8 79.80% 7 6 85.86% 8 5 90.91% 9 4 94.95% 10 5 100.00% Mais 0 100.00% Plan11 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Freqüência % cumulativo 1 Freqüência Histograma Plan12 1 Freqüência % cumulativo 2 12 12.37% 3 14 26.80% 4 30 57.73% 5 15 73.20% 6 8 81.44% 7 6 87.63% 8 5 92.78% 9 4 96.91% 10 3 100.00% Mais 0 100.00% Plan12 0 0 0 0 0 0 0 0 0 0 Freqüência Plan1 1 1 1 2 1 3 1 4 2 5 2 6 2 7 2 8 2 9 2 10 2 2 2 3 3 3 3 3 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 6 6 6 6 6 6 6 6 7 7 7 7 7 7 8 8 8 8 8 9 9 9 9 10 10 10 Plan2 Plan3 _1106726777.xls Gráf1 8 0.0792079208 5 0.1287128713 6 0.1881188119 8 0.2673267327 10 0.3663366337 14 0.504950495 25 0.7524752475 17 0.9207920792 8 1 0 1 Freqüência % cumulativo Plan4 Plan5 Plan6 Plan7 Bloco Freqüência 1 4 2 5 3 5 4 6 5 8 6 10 7 14 8 25 9 17 10 8 Mais 0 Plan7 0 0 0 0 0 0 0 0 0 0 0 Freqüência Plan8 Coluna1 Média 6.7058823529 Erro padrão 0.241568451 Mediana 7 Modo 8 Desvio padrão 2.4397217635 Variância da amostra 5.9522422831 Curtose -0.2708907342 Assimetria -0.7892899012 Intervalo 9 Mínimo 1 Máximo 10 Soma 684 Contagem 102 Plan9 1 Freqüência % cumulativo 2 8 7.92% 3 5 12.87% 4 6 18.81% 5 8 26.73% 6 10 36.63% 7 14 50.50% 8 25 75.25% 9 17 92.08% 10 8 100.00% Mais 0 100.00% Plan9 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Freqüência % cumulativo Plan1 1 1 1 2 1 3 1 4 2 5 2 6 2 7 2 8 2 9 3 10 3 3 3 3 4 4 4 4 4 4 5 5 5 5 5 5 5 5 6 6 6 6 6 6 6 6 6 6 7 7 7 7 7 7 7 7 7 7 7 7 7 7 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 10 10 10 10 10 10 10 10 Plan2 Plan3 _1102838272.unknown _1072513818.xls Gráf1 50 20 15 10 9 15 17 18 80 100 Plan1 140 50 100 100 142 20 80 50 144 15 18 20 146 10 17 10 148 9 15 5 150 15 9 5 152 17 10 10 154 18 15 20 160 80 20 50 180 100 50 100 Gráficos da Moda Plan1 0 0 0 0 0 0 0 0 0 0 Plan2 0 0 0 0 0 0 0 0 0 0 Plan3 0 0 0 0 0 0 0 0 0 0 MBD0022E7DA.xls Gráf7 0 0 1 2 36 8 9 8 5 3 Plan4 144 Freqüência % cumulativo 144 Freqüência % cumulativo 148 8 100.00% 148 8 100.00% 152 0 100.00% 152 0 100.00% 156 0 100.00% 156 0 100.00% 160 0 100.00% 160 0 100.00% 164 0 100.00% 164 0 100.00% 168 0 100.00% 168 0 100.00% 172 0 100.00% 172 0 100.00% 176 0 100.00% 176 0 100.00% Mais 0 100.00% Mais 0 100.00% Plan4 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Freqüência % cumulativo 144 Freqüência Histograma Plan1 140 0 3 0 144 2 5 0 148 4 8 1 152 6 9 2 156 8 8 3 160 10 6 6 164 8 3 8 168 6 2 9 172 4 1 8 176 2 0 5 180 0 0 3 Plan1 0 0 0 0 0 0 0 0 0 0 0 Plan2 0 0 0 0 0 0 0 0 0 0 0 Plan3 _1102838046.unknown _1102838106.unknown _1102533176.unknown _1072513788.xls Gráf3 100 50 20 10 5 5 10 20 50 100 Plan1 140 50 100 100 142 20 80 50 144 15 18 20 146 10 17 10 148 9 15 5 150 15 9 5 152 17 10 10 154 18 15 20 160 80 20 50 180 100 50 100 Gráficos da Moda Plan1 0 0 0 0 0 0 0 0 0 0 Plan2 0 0 0 0 0 0 0 0 0 0 Plan3 0 0 0 0 0 0 0 0 0 0 MBD0022E7DA.xls Gráf7 0 0 1 2 3 6 8 9 8 5 3 Plan4 144 Freqüência % cumulativo 144 Freqüência % cumulativo 148 8 100.00% 148 8 100.00% 152 0 100.00% 152 0 100.00% 156 0 100.00% 156 0 100.00% 160 0 100.00% 160 0 100.00% 164 0 100.00% 164 0 100.00% 168 0 100.00% 168 0 100.00% 172 0 100.00% 172 0 100.00% 176 0 100.00% 176 0 100.00% Mais 0 100.00% Mais 0 100.00% Plan4 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Freqüência % cumulativo 144 Freqüência Histograma Plan1 140 0 3 0 144 2 5 0 148 4 8 1 152 6 9 2 156 8 8 3 160 10 6 6 164 8 3 8 168 6 2 9 172 4 1 8 176 2 0 5 180 0 0 3 Plan1 0 0 0 0 0 0 0 0 0 0 0 Plan2 0 0 0 0 0 0 0 0 0 0 0 Plan3 _1071665586.unknown _1072459498.xls Gráf2 20 50 30 Plan1 A 20 B 50 C 30 Plan1 0 0 0 Plan2 Plan3 _1072512478.xls Gráf3 0 5 9 12 9 5 4 2 0 Plan1 144-148 0 148-152 5 152-156 9 156-160 12 160-164 9 164-168 5 168-172 4 172-176 2 176-180 0 Plan1 0 0 0 0 0 0 0 0 0 Plan2 Plan3 _1072512858.xls Gráf7 0 0 1 2 3 6 8 9 8 5 3 Plan4 144 Freqüência % cumulativo 144 Freqüência % cumulativo 148 8 100.00% 148 8 100.00% 152 0 100.00% 152 0 100.00% 156 0 100.00% 156 0 100.00% 160 0 100.00% 160 0 100.00% 164 0 100.00% 164 0 100.00% 168 0 100.00% 168 0 100.00% 172 0 100.00% 172 0 100.00% 176 0 100.00% 176 0 100.00% Mais 0 100.00% Mais 0 100.00% Plan4 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Freqüência % cumulativo 144 Freqüência Histograma Plan1 140 0 3 0 144 2 5 0 148 4 8 1 152 6 9 2 156 8 8 3 160 10 6 6 164 8 3 8 168 6 2 9 172 4 1 8 176 2 0 5 180 0 0 3 Plan1 0 0 0 0 0 0 0 0 0 0 0 Plan2 0 0 0 0 0 0 0 0 0 0 0 Plan3 _1071760561.unknown _1072458534.xls Gráf1 1.7 2 3 6 B B 2 6 VOLUME DE VENDAS EM MILHARES Plan1 ANO MODELOA MODELOB 1996 1.7 2 1997 3 6 Plan1 0 0 0 0 2 6 VOLUME DE VENDAS EM MILHARES Plan2 0 0 0 0 2 6 VOLUME DE VENDAS EM MILHARES Plan3 _1072459389.xls Gráf1 1 2 3 6 4 3 0 1 automóveis vendidos frequência Plan1 0 1 1 2 2 3 3 6 4 4 5 3 6 0 7 1 Plan1 0 0 0 0 0 0 0 0 automóveis vendidos frequência Plan2 Plan3 _1072458417.xls Gráf2 1.7 2 3 6 B 2 6 VOLUME DE VENDAS EM MILHARES Plan1 ANO MODELOA MODELOB 1996 1.7 2 1997 3 6 Plan1 0 0 0 0 2 6 VOLUME DE VENDAS EM MILHARES Plan2 0 0 0 0 2 6 VOLUME DE VENDAS EM MILHARES Plan3 _1071758732.unknown _1010698963.unknown _1058613163.xls _1058614015.xls _1010699160.unknown _1010699288.unknown _1010699511.unknown _1010699069.unknown _1009191049.unknown _1009191279.unknown _896556722.xls _1009189477.unknown _896556717.xls
Compartilhar