Baixe o app para aproveitar ainda mais
Prévia do material em texto
PPPRRROOOFFFAAA... MMMSSS... DDDAAANNNIIIEEELLLAAA BBBRRRAAASSSSSSOOOLLLAAATTTTTTIII Prof. Ms. Daniela Brassolatti Estatística - CONRE- no. 10248 Docente - UNIP – Araraquara Analista Administrativo – Estatística/Gerência de Ensino e Pesquisa HU-UFSCar-EBSERH daniela.brassolatti@docente.unip.br daniela.belo@terra.com.br ESTATÍSTICA DESCRITIVA Profa. Ms. Daniela Brassolatti 2 CONTEÚDO PROGRAMÁTICO Introdução à Estatística A ciência estatística e suas técnicas. Visão global do processo estatístico. Motivações e usos da Estatística na Administração. Populações e Amostras. Variáveis qualitativas e quantitativas; Contínuas e discretas. Dados Estatísticos: Coleta de Dados Tabelas de frequências e agrupamento de dados Representações Gráficas dos dados estatísticos. Recursos Computacionais Medidas de Tendência Central Média Moda Mediana Recursos Computacionais Aplicações práticas das medidas de Tendências Centrais na Administração. Medidas de Dispersão Desvio Padrão e Variância Coeficientes de Variação. Assimetria e Curtose Recursos Computacionais Aplicações práticas das medidas de dispersão na Administração. ESTATÍSTICA DESCRITIVA Profa. Ms. Daniela Brassolatti 3 CCCAAAPPPÍÍÍTTTUUULLLOOO III ESTATÍSTICA DESCRITIVA Profa. Ms. Daniela Brassolatti 4 CCCOOONNNCCCEEEIIITTTOOOSSS BBBÁÁÁSSSIIICCCOOOSSS 1.1 O que é Estatística É a ciência dos dados. Envolve a coleta, classificação, resumo, organização, análise e interpretação da informação numérica. A Estatística tem importante papel no pensamento crítico, seja no trabalho, na pesquisa ou no dia a dia. Tem muita aplicação em economia, administração, nos negócios, ciências contábeis, ciências físicas, turismo, etc. Muitos empregos na indústria, no governo, em medicina, em engenharia e em outras áreas exige que se tome decisões com base nos dados disponíveis. Esses conjuntos de dados podem ser diários, semanais, etc. Podemos citar como exemplo o preço diário do fechamento de ações, ouro, soja, etc; valores diários de taxas de juros, vendas mensais de um produto e consumo mensal de energia elétrica. 1.2 EXEMPLOS DE APLICAÇÕES: Encerrada a votação em uma eleição é anunciado que determinado candidato é o provável vencedor e a previsão é realizada com apenas 2% dos votos apurados. O governo informa que a renda média de uma família com 4 pessoas aumentou 5% O meteorologista informa que a probabilidade de chover hoje é de 30% Um fabricante de lâmpadas deve determinar a porcentagem de lâmpadas que não funcionarão pois se essa porcentagem for muito grande sua reputação estará em risco Estimativa de audiência de um show na TV com base em uma pequena amostra de lares Uma firma está para lançar um novo produto e precisa conhecer as preferências dos consumidores no mercado de interesse O consumo de sorvete depende do preço do produto, da renda média local, do número de crianças na comunidade e da temperatura. Deve-se fazer um levantamento estatístico com tais variáveis. Antes de lançar um novo remédio é necessário fazer várias experiências para garantir que o produto é seguro e eficiente. ESTATÍSTICA DESCRITIVA Profa. Ms. Daniela Brassolatti 5 1.3 ATIVIDADES BÁSICAS DA ESTATÍSTICA TÉCNICA DE AMOSTRAGEM ESTATÍSTICA DESCRITIVA INFERÊNCIA ESTATÍSTICA DESCRITIVA: Utiliza métodos numéricos e gráficos para mostrar os padrões de comportamento dos dados, para resumir a informação contida nesses dados e para apresentar a informação de forma conveniente. A estatística descritiva tem por objetivo a observação de fenômenos da mesma natureza para descrevê-los resumidamente. Assim, a estatística descritiva é o ramo que reúne a coleta de dados numéricos, a sua organização e classificação, a sua apresentação e a definição de características que permitem a sua análise e interpretação, que podem ser de variáveis quantitativas ou qualitativas. Os métodos e técnicas da estatística descritiva são especialmente importantes na organização e apresentação dos resultados de pesquisas quantitativas descritivas. Os procedimentos, técnicas e métodos de estatística descritiva mais utilizados serão apresentados nos seguintes capítulos: Tabelas, Gráficos, Medidas de Tendência Central, Medidas de Dispersão e de Variabilidade e Medidas de Assimetria e Curtose. INFERÊNCIA: Utiliza dados de amostras para obter estimativas sobre a população. A estatística indutiva ou inferência estatística refere-se a um processo de generalização a partir de amostras. Consiste em obter e generalizar conclusões, ou seja, inferir propriedades para o todo (população) com base na parte (amostra), no particular. Ex: Duração média da vida útil de uma calculadora, comparar o efeito de duas dietas para reduzir peso, determinar a dosagem ideal de um novo medicamento. POPULAÇÃO AMOSTRA INFORMAÇÕES CONTIDAS CONCLUSÕES SOBRE AS CARACTERÍSTICAS DA POPULAÇÃO ESTATÍSTICA DESCRITIVA Profa. Ms. Daniela Brassolatti 6 O processo de generalização está associado a uma margem de incerteza, que se deve ao fato de a conclusão, que se pretende obter para o conjunto de todos os indivíduos analisados quanto a determinadas características comuns, basear-se em uma parcela do total de observações. A medida de incerteza é tratada mediante técnicas e métodos que se fundamentam na Teoria da Probabilidade. Tudo o que acontece na estatística provém de dados reais e o que possa ser observado. Todas as conclusões estatísticas se baseiam na inferência estatística que apresenta a “solidez científica”, que é o nível de certeza e incerteza dado em percentagem. TEORIA DA PROBABILIDADE: Permite descrever fenômenos incertos. Em cada situação vai existir incertezas porque dispomos apenas de informações parciais (amostra), essas incertezas são tratadas com métodos probabilísticos. 1.4 NATUREZA DA ESTATÍSTICA O termo Estatística provém da palavra Estado. Era utilizada para levantar dados e orientar o Estado em decisões. Levantava-se dados para determinar o valor de impostos cobrados dos cidadãos e determinar estratégias de uma nova batalha em guerra (fazer o levantamento de quantos homens, armas e cavalos dispunham após a última batalha). 1.5 USO PRÁTICO Na atualidade, a alta competitividade pela buscade tecnologias e de mercados tem provocado uma constante corrida pela informação. Com o advento da melhoria da qualidade e da produtividade, as empresas estão empenhadas em compreender e otimizar os processos produtivos, os quais estão constantemente gerando dados. A transformação desses dados em informações é eficientemente realizada mediante o uso de métodos estatísticos, permitindo tomadas de decisão mais seguras. Isso ocorre pois mesmo que as máquinas usadas no processo de produção tenham sido desenvolvidas com base em alta tecnologia, elas poderão se desregular devido ao seu uso, levando os seus operadores a cometer erros. Assim, há necessidade de um controle constante para monitorar o resultado da produção de forma que problemas sejam detectados rapidamente, para que o processo de produção seja ajustado ou corrigido. A Estatística está presente em todas as ciências que se envolvem com coleta e análise de dados quantitativos e sua consequente transformação em informação, para postular, refutar ou validar hipóteses científicas sobre um fenômeno observável. Portanto, qualquer ciência experimental não pode prescindir das técnicas proporcionadas pela Estatística. Essa é uma tendência crescente e irreversível, de maneira que a Estatística possui um papel vital na tomada de decisões e na produção de conhecimentos ou de novas tecnologias, podendo, assim, ser considerada a “tecnologia da ciência”. A pesquisa científica é um processo interativo de acumulação de conhecimentos e envolve a formulação de hipóteses, modelos e teorias, a observação de fenômenos e a verificação e rejeição de hipóteses sobre eles. A Estatística procura tornar esse processo o mais eficiente possível, por meio de suas técnicas de coleta de ESTATÍSTICA DESCRITIVA Profa. Ms. Daniela Brassolatti 7 dados (amostragem e planejamento de experimentos); apresentação de dados (análise exploratória e descrição: tabelas e gráficos); modelagem (probabilidade e processos estocásticos); análise indutiva (inferência: testes e estimação) e verificação (ajustamento, previsão e controle). Assim, o método estatístico pode ser usado pelo industrial ao controlar a qualidade de um produto; pelo comerciante ao pesquisar as condições do mercado consumidor; pelo governo ao indagar aspectos da vida econômica, social, cultural, administrativa e política; pelo político ao avaliar as condições potenciais de uma campanha eleitoral; pelo pesquisador para saber se as suas hipóteses são confirmadas. Dessa forma, a Estatística tem um campo bastante diversificado, podendo ser aplicada em diversas áreas, entre as quais: Economia, Administração de Empresas, Agronomia, Engenharia, Física, Biologia, Medicina, Agricultura, Psicologia, Sociologia, Meteorologia, Informática, Contabilidade, Comunicação, Turismo etc. 1.6 DEFINIÇÕES BÁSICAS 1.6.1 DADOS: São matéria prima da Estatística. Definindo o assunto de interesse , os dados são obtidos da medição de determinada característica ou propriedade desse objeto, pessoa ou coisa. Podem se dividir em dois tipos: DADOS QUANTITATIVOS: Se referem a quantidade, isto é , são medidos numa escala numérica. Podem ser divididos em : Dados Discretos: Podem assumir valores inteiros. Exemplo: Número de vendas diárias de uma empresa, número de transações financeiras com erro de lançamentos, número de turistas que chegam por dia em certa cidade turística , etc. Dados Contínuos : Podem assumir qualquer valor do conjunto do números reais.Exemplo: Consumo mensal de energia elétrica, valor das vendas diárias de uma empresa, etc. DADOS QUALITATIVOS: Que não são numéricos. Podem ser classificados em : Dados Nominais: Podem assumir categorias sem ordenamento Exemplo: Sexo, cor dos olhos, etc Dados Ordinais: Podem assumir categorias onde existe um ordenamento ou hierarquia.Exemplo: Hierarquia numa empresa: presidente, diretor, gerente; Respostas a um questionário de pesquisa onde existe uma escala : bom, regular, péssimo; etc. ESTATÍSTICA DESCRITIVA Profa. Ms. Daniela Brassolatti 8 1.6.2 VARIÁVEL: Qualquer característica associada a uma população. Pode assumir qualquer um de um conjunto de valores que lhe são atribuídos (domínio). Exemplos: Uma única variável: lucro líquido mensal de uma empresa , saldo médio dos clientes de um banco comercial , quantidade de turista na semana em certa região. Nessa série de dados serão aplicados métodos estatísticos para resumir as propriedades desses dados como determinação do valor central, da dispersão etc. Duas variáveis: Valores mensais do faturamento e do lucro líquido de uma empresa, Rentabilidade anual de um investimento e a taxa anual de inflação. Entre os objetivos de analisar experimentos com duas variáveis podem ser destacados: verificação da existência e o grau da relação entre as duas variáveis; a possibilidade de prever uma variável em função da outra. A ferramenta Estatística a ser usada dependerá da natureza dos dados. 1.6.3 CLASSIFICAÇÃO DAS VARIÁVEIS: As variáveis estatísticas também podem ser divididas em duas categorias: variável qualitativa e variável quantitativa. Variável qualitativa: Uma variável é classificada como qualitativa quando seus valores são expressos por atributos, como, por exemplo: sexo, cor da pele, nível cultural, preferências por marcas, estilos de vida, atitudes, opiniões (grau de importância, grau de satisfação), conscientização, conhecimento, motivações, comportamentos e intenções, também é conhecida por variável categórica, classificatória ou nominal e é utilizada para segmentação de pesquisas. Essas variáveis não podem ser operadas matematicamente. No entanto, se utilizarmos alguma escala de medida, as quais serão apresentadas a seguir, podemos transformá-las em quantitativas. Nesse caso, a escala de medida mais utilizada é a escala Likert, em que cada variável é associada a uma resposta em formato numérico, o que permitirá o cálculo de medidas como a média e o seu desvio-padrão. No entanto, vale lembrar que esses números não têm significado como tal, sendo apenas usados como símbolos. ESTATÍSTICA DESCRITIVA Profa. Ms. Daniela Brassolatti 9 Por exemplo, na aplicação de um questionário, as respostas de sondagem sobre um assunto poderiam ser: não, não sei ou sim, sendo tais respostas associadas a valores: 1. Não; 2. Não sei, e 3. Sim. Variável quantitativa: Por outro lado, as variáveis quantitativas são aquelas cujos valores são expressos em números, como, por exemplo: salários de operários, idade das pessoas, renda familiar, número de acidentes, vendas mensais de uma empresa etc, essa variável, também conhecida como variável cardinal, representa a base da estatística quantitativa ou estatística de variável, pois os resultados das observações serão expressos sempre por valores numéricos. Essas variáveis podem ser transformadas, no entanto, em qualitativas quando os dados forem agrupados em grupos ou classes nominais ou ordinais. Por exemplo: a renda é uma variável quantitativa, no entanto, pode ser transformada em uma variável qualitativa quando os dados foram classificados por classes de renda: classe A, classeB, classe C, classe D ou classe E. Outro exemplo ocorre quando agrupamos as pessoas por classe de idade: jovem, adulto ou idoso; assim, deixamos de utilizar a idade em números, e passamos a utilizar o atributo por característica de idade. As variáveis quantitativas são expressas de duas formas: variáveis discretas e variáveis contínuas. Variáveis discretas podem assumir apenas um valor inteiro, incluído o zero, de maneira que, se elas assumirem outros valores não previstos, elas se destroem e perdem a essência de valor. Normalmente, a variável discreta resulta de contagem, razão pela qual seus valores são expressos por meio de números inteiros não negativos. Como exemplo de variável discreta citam - se: no de filhos, no de sapatos, no de alunos, no de acidentes, quantidade de livros, número de vendas diárias de uma empresa, número de movimentos de conta corrente em um banco, número de peças com defeito, número de erros de lançamento etc. Variáveis contínuas podem assumir qualquer valor intermediário entre dois limites de valores inteiros reais. A variável contínua resulta normalmente de mensurações e a escala numérica dos seus possíveis valores corresponde ao conjunto dos números reais. ESTATÍSTICA DESCRITIVA Profa. Ms. Daniela Brassolatti 10 Como exemplos de variável contínua tem-se: idade, peso, comprimento, altura, valor das vendas diárias de uma empresa, consumo mensal de energia elétrica, valor do movimento mensal das contas correntes, rentabilidade diária das ações na bolsa de valores etc. Escalas de medidas de variáveis qualitativas e quantitativas: As escalas de medida são formas de medição de um conjunto de dados levantados de variáveis estatísticas. Como existem diversos tipos de variáveis, existem também diversas formas de medi-las. Assim, há quatro tipos básicos de escalas de medidas: nominais, ordinais, intervalares e razão. Escala nominal: É aquela em que as informações servem apenas para nomear, identificar e (ou) categorizar dados sobre pessoas, objetos ou fatos. As escalas nominais são muito utilizadas em pesquisas de mercado para nomear, identificar e classificar variáveis, como: marcas, cores, modelos, sexo, tipo de loja, regiões, uso/não uso, gosta/não gosta, ocupação etc. Escala ordinal: É aquela em que os dados servem para, além de nomear, identificar e (ou) categorizar, ordenar, segundo um processo de comparação, as pessoas, objetos ou fatos, em relação à determinada característica. Essa escala permite definir a marca preferida pelos consumidores sem, no entanto, estabelecer quanto é essa preferência. As escalas ordinais são usadas para obter o ordenamento das preferências, opiniões, atitudes e percepções de consumidores. Como exemplo, podemos citar: as notas usadas em alguns cursos sob a forma de conceitos (A, B, C, D, E); postos de trabalho (primeiro, segundo, terceiro); classificação de hotéis (cinco estrelas, quatro estrelas, três estrelas); escolaridade (fundamental, média, superior). Escala de intervalo (ou intervalar): É aquela em que os dados quantitativos são organizados em intervalos de classe ou faixas de valores que informam a posição e quantificam a situação em termos de pessoas, objetos ou fatos em relação à determinada característica. As escalas de intervalo permitem comparar diferenças entre as medições, mas não permitem concluir quanto à magnitude absoluta das medições, pois não consideram um ponto de partida zero inerente ou natural. São exemplos de variáveis intervalares a temperatura e o tempo, pois essas variáveis não existem quando a informação for igual a zero absoluto (nulo), pois esse valor é arbitrado. No exemplo da temperatura, as escalas de centígrado e Fahrenheit medem ESTATÍSTICA DESCRITIVA Profa. Ms. Daniela Brassolatti 11 um mesmo fenômeno, mas seus pontos zero indicam diferentes graus de temperatura. Assim, 0ºC não é uma temperatura inexistente, mas sim representa uma temperatura fria. Em pesquisas de mercado, as escalas de intervalo são muito utilizadas para medir atitudes, opiniões, conscientização e preferências, em que a preocupação é estabelecer medidas relativas e não absolutas. Nesse caso, variáveis qualitativas são transformadas em quantitativas, conforme já informado anteriormente. Escalas de razão: Têm as mesmas propriedades das escalas de intervalo, além da propriedade adicional de possuírem o zero absoluto. Em função disso, as medidas tomadas nessas escalas permitem concluir quanto a sua magnitude absoluta, além de informar a posição e quanto as pessoas, objetos ou fatos estão distantes entre si em relação à determinada característica. Essa escala se aplica em pesquisas de mercado para variáveis como: renda, número de consumidores, número de lojas, quantidade de produtos consumidos, número de vezes que o produto é comprado ao mês, volume de vendas, valores de venda, lucros, participação no mercado etc. Nas escalas de razão, é perfeitamente possível e correto comparar as medições absolutas das características e inferir conclusões sobre quanto uma medida é maior ou menor que outras. 1.6.4 POPULAÇÃO E AMOSTRA POPULAÇÃO: É um conjunto ou coleção de dados que descreve algum fenômeno do nosso interesse. Muitas vezes o tamanho da população é muito grande, como é o censo demográfico do Brasil ou as populações não podem ser medidas integralmente, como é o caso da medição da vida útil de lâmpadas produzidas que obrigaria a testar todas as lâmpadas produzidas destruindo o estoque. Devido a isto precisamos selecionar uma amostra da população de interesse. A população congrega todas as observações que sejam relevantes para o estudo de uma ou mais características dos indivíduos, os quais podem ser concebidos tanto como seres animados ou inanimados. A população estatística é estudada em termos de observações de características nos indivíduos e não em termos de pessoas ou objetos em si. Assim, por exemplo, as alturas dos cidadãos do Brasil constituem uma população. Poderia haver também uma população correspondente aos pesos desses mesmos cidadãos. Essas características determinadas para toda uma população são denominadas de parâmetros. ESTATÍSTICA DESCRITIVA Profa. Ms. Daniela Brassolatti 12 AMOSTRA: É um subconjunto de dados selecionados de uma população. Quando se examina um subconjunto do conjunto maior (população) com características, senão idênticas, bastante assemelhadas ao universo, ele é denominado de amostra, sendo essas características denominadas de estatísticas, e seu valor pode variar de amostra para amostra. Ao coletar os dados referentes às características de um grupo de objetos ou indivíduos, é muitas vezes impossível de observar toda a população ou universo pelas seguintes razões: custos elevados, tempo necessário e a própria característica do objeto que não permite a sua análise no seu conteúdo completo, como, por exemplo, o exame de sangue. Nesse caso coleta- se uma parte de dados que é chamada de amostra. Outros exemplos, como medir a inteligência de toda a população brasileira, testar a qualidade de cada saco de café exportado pelo Brasil, aplicar um questionário de status socioeconômicoa cada escolar do Estado do Rio Grande do Sul, não é possível e racional de ser feito. Assim, recorre-se ao exame de uma amostra (uma fração da população) e coleta-se uma parte de dados. Se escolhermos a amostra por um processo aleatório (em que a probabilidade de escolha de cada indivíduo é a mesma), a amostra terá a maior probabilidade possível de reproduzir os parâmetros da população. E, ainda, as tabelas de probabilidade permitem avaliar a magnitude provável do erro cometido. Dessa forma, se uma amostra é representativa de uma população, conclusões importantes sobre essa população podem ser inferidas de sua análise. O tamanho de uma amostra depende do grau de certeza que se quer ter na inferência, da disponibilidade de informantes e de dados, dos custos aprovados e do grau de dispersão dos dados estatísticos. Quanto menor é a homogeneidade da população maior deverá ser a amostra. DADOS BRUTOS: São os dados que ainda não foram numericamente ordenados. São representados pelos dados levantados como, por exemplo, os pesos de 6 pessoas: 40, 60, 30 , 80, 50, 60. 1.12.2 Rol: Representa o arranjo dos dados brutos em ordem de grandeza crescente ou decrescente. O exemplo do peso das seis pessoas apresentadas em ordem crescente representa um rol: 30, 40, 50, 60, 60, 80. AMPLITUDE AMOSTRAL: É a magnitude de variação existente entre os dados levantados. Quando se está analisando dados de variáveis contínuas, pode-se calcular essa magnitude pela diferença entre o valor máximo e o valor mínimo da amostra ou do rol. População finita Exemplos:Alunos matriculados no 2º ano de Biologia da UNISANTA; Todas as pessoas que compram telefone celular; População infinita Exemplos: Conjunto de medidas de determinado comprimento; Gases, líquidos e alguns sólidos, como o talco porque as unidades não podem ser identificadas e contadas. ESTATÍSTICA DESCRITIVA Profa. Ms. Daniela Brassolatti 13 1.6.5 FASES DO MÉTODO ESTATÍSTICO COLETA DE DADOS: Após cuidadoso planejamento e a devida determinação das características do fenômeno que se quer pesquisar, damos inicio à coleta de dados numéricos necessários à sua descrição. CRÍTICA DOS DADOS: Obtidos os dados eles devem ser cuidadosamente criticados, à procura de possíveis falhas ou imperfeições afim de incorrermos em erros grosseiros ou que possam influir sensivelmente nos resultados. APURAÇÃO: Processamento e disposição dos dados mediante critérios de classificação EXPOSIÇÃO OU APRESENTAÇÃO DOS DADOS: Apresentação sobre forma adequada dos dados em tabelas ou gráficos ANÁLISE DOS RESULTADOS: O objetivo aqui é tirar conclusões sobre a população a partir de informações fornecidas pela amostra. Após as fases apresentadas fazemos uma análise através da Estatística Inferencial e tiramos conclusões e previsões dos dados. FASES QUE ANTECEDEM A ESTATÍSTICA Definição do problema: Saber exatamente aquilo que se pretende pesquisar, ou seja, uma pergunta que busca respostas para uma questão não resolvida e que é objeto de discussão em qualquer domínio do conhecimento conceitua-se como um problema de natureza científica. Planejamento: Definir que dados deverão ser obtidos são alguns aspectos a serem planejados. Como obtê-los, por meio de censo ou amostra? Como analisá-los e como proceder na inferência? Inicialmente, deve ser elaborado um anteprojeto de pesquisa, com as definições dos instrumentos de coleta, o processo de observação (entrevista direta ou via postal), a determinação do número de entrevistadores, supervisores. Após, concretiza-se o planejamento de pesquisa mediante a elaboração de um projeto, que é documento explicitador das ações a serem desenvolvidas ao longo de um processo de pesquisa. O projeto deve, portanto, especificar os objetivos da pesquisa, apresentar a justificativa de sua realização, definir a modalidade de pesquisa e determinar procedimentos de coleta e análise de dados. Deve, ainda, esclarecer acerca do cronograma a ser seguido no desenvolvimento da pesquisa e proporcionar a indicação de recursos humanos, financeiros e materiais necessários para assegurar o êxito da pesquisa. Um projeto de pesquisa apresenta o roteiro de ações para o pesquisador, além de ser um documento fundamental ESTATÍSTICA DESCRITIVA Profa. Ms. Daniela Brassolatti 14 para quem contrata a pesquisa, pois esclarece acerca do que será pesquisado e apresenta a estimativa de custos, sendo, também, um documento requerido por entidades que financiam pesquisas. A elaboração de um projeto depende de inúmeros fatores, sendo a natureza do problema o mais importante. Assim, existem projetos bastante simples, como a pesquisa de intenção de voto, e mais complexos, como uma pesquisa que visa a identificar fatores que influenciam determinada situação constatada. Rigorosamente, um projeto só pode ser definitivamente elaborado quando se tem o problema claramente formulado, os objetivos, assim como o plano de coleta e análise dos dados, bem determinados. A estrutura é definida pelo tipo de problema. É necessário, no entanto, que o projeto esclareça como se processará a pesquisa, ou seja, o seu delineamento, e quais os recursos que devem ser alocados para atingir seus objetivos. Os elementos habitualmente requeridos num projeto são os seguintes: - formulação do problema; - delineamento da pesquisa ou metodologia a ser utilizada; - cronograma da execução da pesquisa; - definição dos recursos humanos, materiais e financeiros a serem alocados. Antes de iniciar a pesquisa propriamente dita, deve ser definido o tipo de estatística a ser calculado (média, mediana, total, proporção, variabilidade etc.). Como passo seguinte, deve ser analisada a caracterização da população a ser pesquisada quanto a sua distribuição espacial, sua estrutura, existência de cadastros atualizados e completos, informações resultantes de pesquisas anteriores e, finalmente, deve-se verificar a existência de mapas geográficos, censitários, sensoriamentos, aerofotogrametrias e plantas topográficas. Após a realização da investigação, deve ser elaborado, como conclusão, um relatório final em que são apresentados os dados estatísticos relevantes resultantes da investigação. Ex.: marcas preferidas, unidades consumidas por família, por ano etc. Fenômenos estatísticos: A Estatística dedica-se ao estudo de fenômenos de massa, que são resultantes do concurso de um grande número de causas, total ou parcialmente desconhecidas, denominadas de fenômenos estatísticos ou variáveis estatísticas. O fenômeno estatístico é representado por qualquer evento que se pretende analisar, em cujo estudo seja possível a aplicação da técnica estatística. Dados estatísticos: Os dados estatísticos são a matéria-prima da estatística, portanto são elementos importantes que precisam ser confiáveis e verdadeiros para evitar riscos e erros de interpretação. São elementos quaisquer que podem ser medidos e que representam a intensidade efetiva de um caráter variável em cada um dos objetos ou pessoas observados. Como exemplo, temos: tamanho dos sapatos, altura das pessoas, renda da população etc. A unidade do dado estatístico é chamada de elemento, que pode ser um objeto, peça, indivíduo ou conjunto agregado, como um fardo ou uma caixa com produtos. Exemplo: Variável: Venda de produtos Dados: valor das vendas (R$); quantidade de unidades comercializadas;nº de clientes atendidos (pessoas) Os dados estatísticos podem ser classificados em primários e secundários. ESTATÍSTICA DESCRITIVA Profa. Ms. Daniela Brassolatti 15 Primários: Os dados primários são obtidos a partir da realização de pesquisas diretas ou pela observação experimental. Exemplos: aplicação de questionários, pesquisas de campo, experimentação agrícola. Secundários: Os dados secundários são elaborados a partir da existência de dados primários, já disponíveis em anuários, bancos de dados, livros, periódicos. Exemplos: Censo Demográfico, Censo Agropecuário etc. Normalmente é vantajoso usar dados secundários, pois não oneram o orçamento da pesquisa e estão imediatamente disponíveis. Além disso, permite reduzir o tempo necessário para obter os resultados. Em muitas situações, no entanto, faz sentido coletar os próprios dados, como, por exemplo, a situação óbvia em que o dado coletado não existe. Exercícios propostos 1) Classifique cada variável abaixo em qualitativa e quantitativa, e informe a mensuração mais adequada (nominal, ordinal, discreta, contínua): a) As respostas de sondagem em um questionário: sim, não, e indeciso. b) As cores dos carros dirigidos por estudantes de uma faculdade. c) A produção leiteira de um município do Vale do Taquari. d) Faturamento diário em uma loja de confecções. e) Nacionalidade dos atletas de uma olimpíada. f) Tamanho das camisas em um mostruário. g) Temperatura no início de um dia. h) Número de reclamações diárias em um SAC. i) Classificação da categoria de hotéis (uma, duas, três, quatro ou cinco estrelas). j) Marca dos computadores utilizados pelos alunos de uma turma de fundamentos de estatística. 2) Diga quais das variáveis abaixo são discretas e quais são contínuas: a) Quantidade de livros retirados em uma biblioteca durante o mês de março. b) Peso dos recém-nascidos em uma maternidade. c) Distância existente entre os municípios de Lajeado e Encantado. d) Número de clientes atendidos em uma loja de telefonia em um determinado mês. e) Altura dos alunos da turma. f) Número de aparelhos eletrônicos com defeitos produzidos mensalmente. g) Faturamento diário da loja de vestuário feminino. h) Acidentes de trabalho ocorridos durante o último ano. i) Número de consultas anuais realizadas por pacientes que apresentam plano de saúde. j) Produção agrícola do Vale do Taquari em toneladas. 3) Em um levantamento de dados, observou-se que os salários pagos em determinada empresa da cidade no último mês foram os seguintes: R$ 2.620,00; R$ 3.735,00; R$ 1.590,00; R$ 1.040,00; R$ 1.750,00; R$ 910,00; R$ 985,00; R$ 800,00; R$ 1.340,00; R$ 2.100,00. A partir desses dados, pede- se: ESTATÍSTICA DESCRITIVA Profa. Ms. Daniela Brassolatti 16 a) Coloque os dados em forma de rol. b) Calcule a amplitude amostral. 4) O número mensal de funcionários ausentes sem justificativa em uma determinada empresa da região no último ano foram os seguintes: 12, 14, 4, 1, 4, 5, 8, 3, 2, 0, 2, 9. a) Coloque os dados em forma de rol. b) Calcule a amplitude amostral. ESTATÍSTICA DESCRITIVA Profa. Ms. Daniela Brassolatti 17 CCCAAAPPPÍÍÍTTTUUULLLOOO IIIIII ESTATÍSTICA DESCRITIVA Profa. Ms. Daniela Brassolatti 18 AAAPPPRRREEESSSEEENNNTTTAAAÇÇÇÃÃÃOOO DDDEEE DDDAAADDDOOOSSS O sucesso de uma decisão dependerá da nossa habilidade em compreender as informações contidas nos dados. Administradores gastam muito do seu tempo passando informações para os outros e se a informação estiver mal apresentada ou for mal transmitida será na melhor das hipóteses perdida e na pior, entendida de maneira errada. Para apresentar informações numéricas devemos lembrar que muitas pessoas tem dificuldades para entender tal informação. Como apresentar a organização, apresentação e análise gráfica de uma série de dados será mostrado abaixo: 2.1 TABELAS Os dados apurados são apresentados em tabelas. Existem normas nacionais para organização de tabelas ditadas pela ABNT (Associação Brasileira de Normas Técnicas). Essas normas não serão tratadas aqui, mas convém saber que as tabelas devem ter os componentes: Título : Precede a tabela e explica o dado em estudo, tempo e lugar a que os dados se referem. Título: é representado por um conjunto de informações, as mais completas possíveis, localizado no topo da tabela, que respondem às seguintes perguntas: O quê?, Quando?, Onde?, ou seja, o fato, a época e o lugar a que se referem as informações apresentadas na tabela. O título deve ser claro e conciso. O título é precedido da palavra Tabela e seu número de ordem é apresentado em algarismos arábicos, sempre que um trabalho apresentar duas ou mais tabelas, para identificá-la, permitir a sua fácil localização e a referência no texto. Cabeçalho: Especifica o conteúdo de cada coluna indicadora. O conteúdo de cada linha da tabela Cabeçalho: parte superior da tabela que especifica o conteúdo das colunas. Os títulos das colunas podem ser digitados verticalmente, quando necessário, para economizar espaços. Corpo da tabela: apresenta os dados. Corpo: é representado pelo conjunto de linhas, colunas e casas ou células que apresentam as informações sobre a variável em estudo, em relação ao corpo da tabela. Os dados devem ser dispostos de modo a possibilitar comparações e ressaltar as relações existentes, destacando o que se pretende demonstrar. ESTATÍSTICA DESCRITIVA Profa. Ms. Daniela Brassolatti 19 Coluna indicadora: é a parte da tabela representada pela primeira coluna que especifica o conteúdo das linhas. Linhas: retas imaginárias que facilitam a leitura, no sentido horizontal, de dados que se inscrevem nos seus cruzamentos com as colunas. Utilizam-se “fios horizontais para separar os títulos das colunas no cabeçalho e fechá-las na parte inferior, evitando-se fios verticais para separar colunas e fios horizontais para separar as linhas” (ABNT, NBR 14724:2001, p.6). A tabela não deve ser fechada lateralmente. Casa ou célula: espaço destinado a um só número. Rodapé: serve para colocar a legenda e todas as observações que venham a esclarecer a interpretação dos dados, também conhecidos por fonte, notas e chamadas. Fonte: deve-se indicar o autor, ou autores, o título do livro ou revista, a coluna, a página, a data etc., de tal modo que, se alguém quiser comprovar a informação, poderá fazê-lo com facilidade. Também é usada para mostrar cortesia com o autore a responsabilidade pelos dados. A fonte da tabela indica a origem dos dados ou a instituição responsável pelo fornecimento ou elaboração dos dados e informações nela contidos. A palavra “Fonte” deve ser colocada após o traço inferior da tabela, alinhando-se à margem esquerda da primeira coluna. A fonte de dados pode ser de diversas origens. Quando os dados se originarem de mais de uma fonte, os nomes ou siglas são separados por vírgula. Em caso de a fonte tratar-se de pessoa física, responsável pelos dados levantados, utiliza-se como fonte o autor. Quando as tabelas são elaboradas com base em fontes que constituem documentos do próprio autor do trabalho (apresentação dos dados, por exemplo), a partir de pesquisa de campo (com o uso de questionários, entrevistas ou observação), podem ser utilizadas como fonte as seguintes expressões: “pesquisa de campo”, “formulários preenchidos”, “entrevistas realizadas”, “questionários aplicados”, “observação direta”, conforme o caso. Quando do uso de tabelas extraídas de outros documentos, é obrigatória a indicação da fonte. Notas: são informações de natureza geral, destinadas a conceituar ou esclarecer o conteúdo da tabela, ou para indicar a metodologia adotada no levantamento ou redação dos dados. Chamadas: informações de natureza específica sobre determinada parte da tabela destinada para conceituar ou esclarecer dados. ESTATÍSTICA DESCRITIVA Profa. Ms. Daniela Brassolatti 20 Observação: é usada para esclarecimentos, tais como o uso de percentuais que devem ser explicados sobre o que se referem e se são sobre o total, de diminuição ou aumento. Quando os números foram arredondados, explicar o sistema de arredondamento. Serve também para algum outro esclarecimento sobre as informações constantes no título ou no cabeçalho que serão apresentadas com asteriscos. Nenhuma “casa” da tabela deve estar vazia. De acordo com a convenção internacional e Resolução 886 da Fundação IBGE, nas casas ou células, ou quando existem dúvidas quanto à exatidão dos dados, deve- se usar os seguintes critérios: - Um traço horizontal ( - ) quando, pela natureza do fenômeno, o dado não existir; - Três pontos (...) quando não se dispuser dos dados; - Um ponto de interrogação (?) quando se tem dúvida quanto à exatidão de determinado valor; - Zero ( 0 ) quando o valor é zero, não só quanto à natureza das coisas como quanto ao resultado do inquérito, ou quando o valor é muito pequeno para ser expresso pela unidade utilizada; - - ou + quando os dados anteriores ao símbolo não forem comparáveis aos posteriores; - X quando o dado for omitido para evitar a individualização da informação. Se a tabela não couber em uma folha, deve ser continuada na folha seguinte e, neste caso, não é delimitada por traço horizontal na parte inferior, sendo o título e o cabeçalho repetidos na folha seguinte. Quando a tabela continuar na página seguinte, cada página deve ter uma das seguintes indicações: ‘Continua’ para a primeira, ‘Conclusão’ para a última, e ‘Continuação’ para as demais (NBR 14724:2011). A referência à tabela no texto se faz pela indicação: Tabela ou Tab, acompanhada do número de ordem na forma direta, ou entre parênteses no final da frase (TAB. 6, ou TABELA 6). Para as tabelas apresentadas em anexo, a referência no texto pode seguir o exemplo: TAB. 20, Anexo A. Não se deve usar o plural na abreviatura (TAB. 6 e 7). A tabela deve estar alinhada, preferencialmente, às margens laterais do texto, ou, quando a sua largura for pequena, deve ser centralizada. Roteiro para a elaboração de uma tabela de frequências: Para a construção de uma tabela de frequências, é conveniente adotar um roteiro que facilite e torne mais operacional o trabalho de quem irá montar a tabela. O roteiro consta dos seguintes passos: a) Criar lista de dados brutos que pode ou não ser transformada em rol; b) encontrar a amplitude amostral; ESTATÍSTICA DESCRITIVA Profa. Ms. Daniela Brassolatti 21 c) escolher o número de classes. Para tanto, usar a fórmula de Sturges, ou escolher, arbitrariamente, entre um mínimo de 5 e máximo de 20 classes, considerando que quanto maior o número de observações maior deverá ser o número de classes; d) determinar a amplitude do intervalo de classe pela seguinte fórmula: Amplitude do intervalo de classe = Amplitude Amostral/ Número de Classes Observação: o resultado deve ser arredondado arbitrariamente para um número mais adequado que facilite os cálculos conforme os tipos de intervalos para dados discretos ou contínuos; a) determinar os limites inferiores e superiores dos intervalos de classe; b) construir a tabela de frequência; c) apresentar a tabela conforme as normas da ABNT. Exemplo: Para saber quais são as melhores cidades para se fazer negócio no Brasil, a revista Exame fez uma pesquisa em parceria com a Simonsen Associados. Foram levantados dados de disponibilidade de vôos, número de agências bancárias, número de quartos na rede hoteleira, etc, em 101 municípios. Veja os dados que mostram as cidades com maior potencial de consumo em 1998. Título: As dez melhores cidades brasileiras para fazer negócios CIDADE POPULAÇÃO(MILHARES) CONSUMO ANUAL PER CAPITA(US$ / HAB) São Paulo 9927 5680 Rio de Janeiro 5584 5486 Belo Horizonte 2124 4742 Brasília 1923 5192 Curitiba 1550 6249 Porto Alegre 1306 7040 Salvador 2274 3872 Fortaleza 2056 3160 Campinas 937 5943 Recife 1368 3993 Fonte: IBGE / Ibope/Simonsen Associados (1999) ESTATÍSTICA DESCRITIVA Profa. Ms. Daniela Brassolatti 22 ALGUMAS NORMAS PARA CONSTRUÇÃO DE TABELAS 2.2 SÉRIES ESTATÍSTICAS Toda tabela que apresenta a distribuição de um conjunto de dados em função da época, local ou espécie é chamada de série estatística. Temos os tipos de séries mais conhecidos designados abaixo. 2.2.1 SÉRIES HISTÓRICAS, CRONOLÓGICAS OU TEMPORAIS. Descrevem os valores da variável discriminadas em um intervalo de tempo Exemplo: Título: Preço do Acém no varejo – São Paulo 1989 / 1994 Anos Preço Médio (US$) 89 2,24 90 2,73 91 2,12 92 1,89 93 2,04 94 2,62 Fonte : APA 1 – As tabelas devem ter títulos e se existir mais de uma tabela , elas devem ser numeradas. O título deve explicar os dados com poucas palavras simples e salientar em que tempo e lugar, unidade de medida dos dados . 2 – Como os títulos das linhas e colunas devem ser pequenos, acrescentar notas no rodapé para dar definições, destacar dados diferenciados, evitando notas muito longas. 3 – A fonte dos dados deve ser sempre fornecida (no rodapé), de maneira que os leitores possam achar os dados originais 4 – Decida-se sobre a precisão dos números antes de fazer a tabela, isto é, sobre o número de casas decimais, arredondamento e se os dados devem ser apresentados em unidade, dezena ou milhares, etc. Como regra geral arredondar para dois algarismos significativos, a menos que se precise de grande exatidão. A razão é que é mais fácil para o leitor memorizar números redondos.5 - Escreva os totais das linhas e colunas, médias ou qualquer outro resultado que interesse ao leitor. 6 - Quando possível os números grandes devem estar no início da tabela 7 – Não use tabelas para mostrar tendências ou correlações, os gráficos são melhores para isto. ESTATÍSTICA DESCRITIVA Profa. Ms. Daniela Brassolatti 23 2.2.2 SÉRIES GEOGRÁFICAS, ESPACIAIS, TERRITORIAIS OU DE LOCALIZAÇÃO Descrevem os valores das variáveis discriminadas segundo regiões. Exemplo: Título: Duração média dos estudos superiores - 1994 Países Nro de anos Itália 7.5 Alemanha 7.0 França 7.0 Holanda 5.9 Inglaterra Menos de 4 Fonte : Revista Veja 2.2.3 SÉRIES ESPECÍFICAS OU CATEGÓRICAS Descrevem os valores da variável segundo especificações ou categorias. Exemplo: Título: Rebanhos Brasileiros - 1992 Espécies Quantidade (1000 cabeças) Bovinos 154.440,8 Bubalinos 1.423,3 Eqüinos 549,5 Asininos 47,1 Muares 208,5 Suínos 34.532,2 Ovinos 19.959,9 Caprinos 12.159,6 Coelhos 6,1 Fonte : IBG ESTATÍSTICA DESCRITIVA Profa. Ms. Daniela Brassolatti 24 2.2.4 SÉRIES CONJUGADAS Conjugação de duas ou mais séries. Exemplo: Título:Terminais telefônicos em serviço 1991 - 1993 Regiões 1991 1992 1993 Norte 342.938 375.658 403.494 Nordeste 1.287.813 1.379.101 1.486.649 Sudeste 6.234.501 6.729.467 7.231.634 Sul 1.497.315 1.608.989 1.746.232 Centro Oeste 713.357 778.925 884.822 Fonte : IBGE 2.3 DISTRIBUIÇÃO DE FREQUÊNCIA COM DADOS DISCRETOS Distribuição de freqüências: É uma tabela onde os valores de uma variável se agrupam em classes, registrando-se o número de valores observados em cada classe. Freqüência de uma observação: É o número de repetições dessa observação. Distribuição de freqüências relativas: É o número de repetições dessa observação dividida pelo tamanho da amostra. A compreensão dos dados pode aumentar se as freqüências forem expressadas como porcentagem do total das observações da amostra. Distribuição de freqüências acumuladas: É a soma das freqüências absolutas ou relativas, desde a observação inicial da série.Em alguns casos o interesse da análise está na determinação da quantidade de observações que são menores ou maiores que um determinado valor. A construção de uma tabela de freqüências consiste em 3 etapas: - Escolha das classes (intervalos ou categorias) - Enquadramento dos dados nessas classes - Contagem do número de elementos em cada classe. ESTATÍSTICA DESCRITIVA Profa. Ms. Daniela Brassolatti 25 Exemplo: Considere o número de negócios fechados por dia pelo operador A nos últimos 2 anos (500 dias) investigando uma amostra de 26 dias. 14 12 13 11 12 13 16 14 14 15 17 14 11 13 14 15 13 12 14 13 14 13 15 16 12 12 Através dos dados podemos utilizar uma tabela de distribuição de freqüências absolutas, relativas e acumuladas para resumir a informação: Conclusões: A partir dos resultados da tabela acima podemos analisar os resultados das operações fechadas diariamente pelo operador A: DAS FREQUÊNCIAS ABSOLUTAS: O valor máximo de 17 operações fechados por dia pelo operador A se deu em apenas um dia da amostragem. O valor mínimo de 11 operações fechadas por dia se repetiu em 2 dias Em 7 dias da amostragem, o operador A fechou 14 operações por dia. DAS FREQÊNCIAS RELATIVAS: Foram fechados 17 negócios por dia em 3,85% dos 26 dias amostrados Em 7,69% dos 26 dias amostrados, o operador A fechou 11 negócios por dia Nro de operações fechadas por dia Freqüência absoluta Freqüência relativa Freqüência acumulada % acumulada 11 2 7,69 2 7,69 12 5 19,23 7 26,92 13 6 23,08 13 50 14 7 26,92 20 76,92 15 3 11,54 23 88,46 16 2 7,69 25 96,15 17 1 3,85 26 100 Total 26 100 ESTATÍSTICA DESCRITIVA Profa. Ms. Daniela Brassolatti 26 Durante 26,92% dos dias da amostra foram fechados 14 negócios por dia. Em 50% dos dias da amostra, foram fechados entre 13 e 14 negócios por dia DAS FREQUÊNCIAS ACUMULADAS: Em 76,92% dos dias o operador A fechou 14 ou menos operações Em 23,08% dos dias o operador A fechou 15 ou mais operações por dia Em 61,54% dos dias o operador A fechou entre 13 e 15 negócios, incluindo os valores limites. 2.4 DISTRIBUIÇÃO DE FREQUÊNCIAS COM DADOS CONTÍNUOS Quando os dados da série são contínuos, pode acontecer que poucos ou nenhum desses dados apresente freqüência. O procedimento que deve ser usado é selecionar classes onde podemos agrupar os dados. Exemplo: Título: Gasto médio per capita / dia (US$) dos principais emissores de turistas para o Brasil em 2000. Países Gasto médio per capita/dia (US$) Argentina 69.44 Estados Unidos 122.35 Paraguai 36.02 Uruguai 80.84 Alemanha 85.73 França 66.07 Espanha 94.19 Inglaterra 106.71 Portugal 79.01 Chile 77.19 Itália 114.9 Canadá 111.36 Fonte: Embratur e Fade ESTATÍSTICA DESCRITIVA Profa. Ms. Daniela Brassolatti 27 Queremos apresentar os dados em questão, em uma tabela de distribuição de freqüência agrupados em classes mostrando para tanto a quantidade de países que se encontram nas classes selecionadas. Procedimento: 1 – Definir o número de classes. Não existe regra geral mas é recomendado que o número de classes seja um valor entre 5 e 15. Se o número de classes for pequeno (por exemplo 3 classes) , perde-se muita informação e se o número de classes for grande (por exemplo 30 classes) tem-se pormenores desnecessários. Um critério para designar o número de classes pode ser calculado da seguinte maneira: K = raiz de n Onde n = número de dados O resultado da fórmula deverá ser arredondado para o menor ou maior inteiro . Para o nosso exemplo : N = 12 K= 3,46 Deveremos usar 4 classes 2 - Calcular o intervalo de variação: Diferença entre o maior e menor valor da série. Para o exemplo: Intervalo variação = 122.35 – 36.02 = 86.33 3- Calcular a amplitude das classes: Amplitude = Intervalo de variação dividido pelo número de classes Amplitude = 86,33 / 4 = 21,58 (arredondar para 22) ESTATÍSTICA DESCRITIVA Profa. Ms. Daniela Brassolatti 28 4 - Preparar a tabela de classes classes LI LS 1 36 58 2 58 80 3 80 102 4 102 124 O limite superior de cada classe é aberto, isto é , a classe não inclui o valor do seu limite superiorcom exceção da última classe. 5 - Selecionar os dados por classe Classe frequência Freqüência relativa [36 , 58[ 1 8,33 [58 , 80[ 4 33,33 [80,102[ 3 25,00 [102,124] 4 33,33 2.5 ELEMENTOS DE UMA TABELA DE FREQUÊNCIAS A organização de uma tabela de frequência exige alguns conhecimentos básicos em relação aos seus elementos principais, que são os seguintes: marca de classe, frequência, limites de classes, amplitude dos intervalos, amplitude total e ponto médio dos intervalos de classe. ESTATÍSTICA DESCRITIVA Profa. Ms. Daniela Brassolatti 29 Marca de classe: a primeira coluna é chamada marca de classe de frequência ou simplesmente classe, na qual são apresentados os valores individuais observados de uma variável. Muitas vezes, mesmo com risco de se sacrificar algum detalhe manifestado na ordenação de valores individuais, há vantagem em resumir os dados originais em uma distribuição de frequência, em que os valores não mais aparecerão individualmente, mas agrupados em intervalos de classes. Frequência (fi): a segunda coluna é chamada de frequência e representa o número de vezes que o dado ou fato do intervalo de classe ocorre no rol de observações. O somatório de todas as frequências é igual ao número total de observações. Limites de classe: são os números extremos de cada intervalo de classe. Sendo assim, há dois limites: o inferior e o superior. No exemplo do intervalo de classe 500 |— 600, o limite inferior é 500 e o superior 600. Exemplo: Retiradas diárias no Banco Alfa no município Beta em Janeiro de 2014. Valor da Retirada (R$) Ponto médio Número de contas bancárias 500 |― 600 550 12 600 |― 700 650 36 700 |― 800 750 63 800 |― 900 850 81 900 |― 1000 950 77 1000 |― 1100 1050 42 1100 |― 1200 1150 24 Total 335 Fonte: Dados fictícios, apenas para fins ilustrativos. Amplitude de um intervalo de classe: é a medida do intervalo que define a classe. Ela é obtida pela diferença entre os limites superior e inferior dessa classe. Assim, no exemplo no exemplo mostrado, para o intervalo de classe 500 |— 600, a amplitude é 600 - 500 = 100. Para facilitar os cálculos com uma distribuição de frequências, é importante que a amplitude de todos os intervalos de classe seja a mesma. MARCA DE CLASSE FREQUÊNCIA LIMITES DE CLASSE AMPLITUDE DO INTERVALO DE CLASSE 600-500 = 100 AMPLITUDE TOTAL 1200 – 500 = 700 PONTO MÉDIO ESTATÍSTICA DESCRITIVA Profa. Ms. Daniela Brassolatti 30 Amplitude total ou Range: é a diferença entre o limite superior do último intervalo de classe (limite superior máximo) e o limite inferior do primeiro intervalo de classe (limite inferior mínimo). No exemplo, a amplitude total é igual a 700, ou seja, 1200 - 500 = 700 Ponto médio das classes: é a média aritmética entre o limite superior e o limite inferior de cada classe. É o número que representa todos os valores observados dentro de um intervalo de classe dado. Ex.: (500 + 600)/2 = 1100/2 = 550 Determinação do número de intervalos de classe: Para determinar o número de classes, há diversas formas a adotar, podendo ser conforme a preferência do pesquisador, definição de algum critério para fazer comparações com pesquisas já realizadas ou então com base em critérios matemáticos. A rigor, não existe nenhuma exigência em termos de opção a adotar, mas, no entanto, não se recomenda usar mais de 15 intervalos, para não dificultar a análise da variável. Em não havendo nenhuma recomendação especial, pode se adotar o cálculo matemático do número de intervalos por meio da regra de Sturges que estabelece que o número de classes é igual a: k = 1 + 3,3 log n onde: k = número de classes n = número total de observações Exemplo: Se o número de observações for 500: n = 500 k = 1 + 3,3 log. 500 log 500 = 2,69897 k = 1 + ( 3,3 x 2,69897) = 1 + 8,906601 k = 9,906601 e, arredondando, k = 10, logo, recomenda-se usar 10 intervalos de classe. Outra alternativa para definição do número de intervalos é usar a função: k =√n conforme já mostrado nos procedimentos na página 24. Assim, usando o mesmo exemplo de 500 observações, temos: k =√500 = 22,36, e arredondando, k = 22 Como o número 22 ultrapassa o limite de intervalos recomendados, escolhe-se o resultado mais adequado que é o da primeira alternativa, ou seja, 10 intervalos. ESTATÍSTICA DESCRITIVA Profa. Ms. Daniela Brassolatti 31 2.5 GRÁFICOS ESTATÍSTICOS 2.5.1 CONSTRUINDO BONS GRÁFICOS Sua qualidade depende de como ele apresenta o padrão dos dados e quão claramente conta a história nele contida para o público. Tem o formato mais fácil de ler do que uma tabela mas gráficos mal desenhados pode confundir e conduzir à uma interpretação errada. A representação gráfica de um fenômeno deve obedecer certos requisitos fundamentais para ser útil como: Simplicidade: O gráfico deve ser destituído de importância secundária, assim como traços desnecessários que possam levar o observador à uma análise morosa ou com erros. Clareza: Deve possibilitar uma correta interpretação dos valores representativos do fenômeno Veracidade: Deve expressar a verdade sobre o fenômeno em estudo. 2.5.2 TIPOS DE GRÁFICOS: GRÁFICO DE LINHAS: Apresentam bem flutuações, crescimento, quedas e ponto de inflexão. Além da forma , as escalas nos eixos devem ser observadas. Diferentes escalas podem dar impressões diferentes. Procurar aquela que aumente as chances de o público entender e detectar corretamente o padrão de comportamento dos dados. Exemplo 1: Os gráficos de linhas abaixo mostram as vendas de um vendedor no ano de 2000 e 2001. Gráfico I Gráfico II ESTATÍSTICA DESCRITIVA Profa. Ms. Daniela Brassolatti 32 Os dois gráficos são referentes ao mesmo vendedor mas as mudanças na escala nos dão impressões diferentes, parecendo-nos no gráfico II uma maior estabilidade nas vendas do que no gráfico I. Exemplo 2: As figuras abaixo mostram um aumento no volume de vendas de dois modelos de um produto da empresa X entre os anos de 1996 e 1997. Gráfico I Gráfico II No Gráfico I, olhando as retas crescentes podemos concluir que houve um aumento gradual no volume de vendas. A figura II nos dá uma melhor impressão e mostra as retas crescendo mais rapidamente sendo as vendas do modelo A aumentadas com taxa maior do que as vendas do modelo B. Na primeira figura isso já não é tão aparente.A impressão de maior crescimento é dada pelas escalas dadas nos eixos. Porque então usar gráficos se as tendências são tão afetadas pelas escalas? A resposta é porque apesar disso os gráficos apresentam bem flutuações, crescimentos, quedas e pontos de inflexão, entretanto para lê- lo é preciso observar além das formas as escalasutilizadas. Exemplo 3: O exemplo abaixo mostra as vendas nos anos de 1985 à 1997 Gráfico I Gráfico II 0 1 2 3 4 5 6 7 1996 1997 VO LU M E DE V EN DA S EM M IL HA RE S BB 0 1 2 3 4 5 6 7 1996 1997 VO LU M E DE V EN DA S EM M IL HA RE S B 0 10 20 30 40 50 60 70 va lo r d as ve nd as e m m ilh õe s 50 51 52 53 54 55 56 57 58 59 60 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 va lo r d as ve nd as em m ilh õe s ESTATÍSTICA DESCRITIVA Profa. Ms. Daniela Brassolatti 33 Analisando o gráfico I, verificamos que as vendas se apresentam relativamente estáveis com pequenas flutuações. Em geral o espaço vazio no corpo do gráfico traz certo embaraço, a escala pode então ser quebrada. A quebra do eixo atua como telescópio. Vemos com mais clareza no gráfico II, as vendas aumentando e diminuindo. GRÁFICO DE BARRAS: É utilizado para comparar dados de diferentes categorias como por exemplo renda de trabalhadores de diferentes regiões. Serve também para monitorar as mudanças no tempo. O tamanho de cada barra depende da importância da ilustração no texto. Exemplo: Número de carros vendidos pelo vendedor A nas 20 últimas semanas GRÁFICO DE PONTOS: É uma alternativa para o gráfico de barras. Exemplo: Número de carros vendidos pelo vendedor A nas 20 últimas semanas 0 1 2 3 4 5 6 7 0 1 2 3 4 5 6 7 8 automóveis vendidos fre qu ên cia 0 1 2 3 4 5 6 7 0 1 2 3 4 5 6 7 automóveis vendidos fre qü ên cia ESTATÍSTICA DESCRITIVA Profa. Ms. Daniela Brassolatti 34 GRÁFICO DE SETORES: É utilizado para mostrar a composição de um total. Exemplo: Porte de 40 empresas dentre as clientes selecionadas de um banco 20% 50% 30% A B C PICTOGRAMAS: Usa-se símbolos para designar um certo número de unidades. Os símbolos são auto- explicativos. Por exemplo o desenho de um hambúrguer pode significar 250 hambúrgueres vendidos no Mcdonald. Exemplo: Faturamento real do comércio / veículos 1996 ESTATÍSTICA DESCRITIVA Profa. Ms. Daniela Brassolatti 35 MAPAS: Mostra a variação de uma área geográfica Exemplo: Taxa de mortalidade infantil nas regiões brasileiras em 1984 HISTOGRAMAS: Representa uma tabela de freqüências. São conjuntos de retângulos justapostos cujas bases se localizam sobre o eixo horizontal, de tal forma que seus pontos médios coincidam com os pontos médios do intervalo de classe. Exemplo: As 50 maiores empresas em 1999 Fonte : Revista Exame / Junho de 2000 0 2 4 6 8 10 12 14 1. 00 0 |- 1. 40 0 1. 40 0 |- 1. 80 0 1. 80 0 |- 2. 20 0 2. 20 0 |- 2. 60 0 2. 60 0 |- 3. 00 0 3. 00 0 |- 3. 40 0 3. 40 0 |- 3. 80 0 3. 80 0 |- 4. 20 0 4. 20 0 |- 4. 60 0 4. 60 0 |- 5. 00 0 faixas de faturamento qt de e m pr es as ESTATÍSTICA DESCRITIVA Profa. Ms. Daniela Brassolatti 36 Notas: - A área de um histograma é proporcional a soma das freqüências - No caso de usarmos as freqüências relativas, obtemos um gráfico de área unitária - Quando quisermos comparar duas distribuições , o ideal é usarmos as freqüências relativas. POLÍGONO DE FREQUÊNCIA: É uma versão suavizada do histograma. É construído unindo-se os pontos médios de cada bloco do histograma. Exemplo: Alturas de 46 alunos de uma escola. 0 2 4 6 8 10 12 14 14 4-148 1 48 -1 52 152-156 156-160 160-164 164-168 168-172 172-176 176-180 Como em geral os dados coletados pertencem a uma amostra extraída de uma população, podemos imaginar as amostras tornando-se cada vez mais amplas e a amplitude das classes do histograma ficando cada vez menor o que nos permite fazer o contorno ou analisar a forma da distribuição de freqüência de maneira a se transformar numa curva. Algumas formas são características das distribuições de freqüência , são elas: Forma de Sino Assimétrica Positiva Assimétrica Negativa ESTATÍSTICA DESCRITIVA Profa. Ms. Daniela Brassolatti 37 Forma de Jota Forma de Jota invertido Forma de U DIAGRAMA DE PARETO: Um diagrama de Pareto é um tipo específico de gráfico de colunas ou histograma, ordenado por frequência de ocorrência, que mostra quantos defeitos foram gerados por tipo ou categoria de causa identificada. A técnica de Pareto é usada principalmente para identificar e avaliar não conformidades. Nos diagramas de Pareto, a classificação é usada para orientar as ações corretivas. A equipe do projeto deve tomar ações para resolver primeiramente os problemas que estão causando o maior número de defeitos. Os diagramas de Pareto estão conceitualmente relacionados à Lei de Pareto, que afirma que um número relativamente pequeno de causas normalmente produzirá a grande maioria dos problemas ou defeitos. Isso geralmente é chamado de princípio 80/20, em que 80% dos problemas se devem a 20% das causas. Exemplo Uma banca de jornal não pode expor 100% a capa de todas as revistas e por isso ela escolhe 20% das mais vendidas que geram 80% do faturamento; Alguns estudos mostram que 80% do faturamento de uma empresa advém de 20% dos clientes; 20% dos estoques respondem por 80% dos custos; 20% dos defeitos geram 80% das reclamações; 20% das causas de paradas de máquinas industriais são responsáveis por 80% do tempo em que a máquina fica parada. Ou seja, o princípio de Pareto mostra a relação desigual entre causas e efeitos. ESTATÍSTICA DESCRITIVA Profa. Ms. Daniela Brassolatti 38 ALGUMAS NORMAS PARA CONSTRUÇÃO DE GRÁFICOS 1 – As palavras tem papel importante no gráfico. “Tabelas e gráficos sem o devido comentário são como filme mudo”.2 – Dois gráficos são melhores que um só sobrecarregado. 3 – Podem ser feitas linhas de grade horizontais para ajudar a leitura. 4 – Nos gráficos feitos para o público (não técnico), seja criativo e use a imaginação para colocar títulos, que torna o gráfico mais fácil de ser entendido. 5 - O título deve ser claro. Use unidades de medida, identifique áreas geográficas , período, defina variáveis, fonte de dados. Se houver mais de um gráfico, cada um deve ter número próprio para referência 6 - Sempre que possível não usar legenda para que o público não tenha que olhar em dois pontos diferentes. 7 – Use sombreamento ou cores e símbolos para distinguir setores, barras ou linhas ESTATÍSTICA DESCRITIVA Profa. Ms. Daniela Brassolatti 39 Mais exemplos de gráficos: Gráfico de Barras Preço de Remédios em Reais (R$) Gráfico de setores Gráfico: Distribuição das respostas à pergunta “Você utilizaria um medicamento genérico após o tratamento de uma determinada patologia clinica. 0 10 20 30 Remédio 1 Remédio 2 Remédio 3 Farmácia 3 Farmácia 2 Farmácia 1 82% 12% SIM NÃO 90% 10% ESTATÍSTICA DESCRITIVA Profa. Ms. Daniela Brassolatti 40 Gráfico de Colunas GRÁFICO: MÉDIAS DE DESEMPENHO DOS SUJEITOS NA PROVA DE MATEMÁTICA EM RELAÇÃO AO GRUPO 0 1 2 3 4 5 6 7 8 9 10 PRÉ-TESTE PÓS-TESTE GRUPO EXPERIMENTAL GRUPO CONTROLE ESTATÍSTICA DESCRITIVA Profa. Ms. Daniela Brassolatti 41 CCCAAAPPPÍÍÍTTTUUULLLOOO IIIIIIIII ESTATÍSTICA DESCRITIVA Profa. Ms. Daniela Brassolatti 42 MMMEEEDDDIIIDDDAAASSS DDDEEE TTTEEENNNDDDÊÊÊNNNCCCIIIAAA CCCEEENNN TTTRRRAAALLL Para resumir a quantidade de informação contida em um conjunto de dados, os estatísticos definem medidas que descrevem, através de um só número, características dos dados. As medidas mais utilizadas são: média, moda e mediana. 3.1 MEDIANA (Md): É o valor que ocupa a posição central do conjunto dos dados ordenados. É um valor tal que metade dos dados são iguais ou menores do que ela e metade são iguais ou maiores que ela. Com os dados organizados de forma crescente: Se o número de dados é ímpar, a Md é o valor que está no centro da série, isto é, o elemento de ordem (n+1) / 2. Se o número de dados for par, a Md é a média aritmética dos dois valores que ocupam a posição central, isto é , os valores com ordem n / 2 e (n / 2) + 1. Exemplo1: Calcule a mediana dos dados: 3 , 9, 5, 7, 9, 1, 9 Série Ordenada: 1 , 3, 5, 7, 9, 9, 9 N = 7 elementos Posição = 2 )17( 2 )1N( = 4a posição na série ordenada Md = 7 Exemplo2: Calcule a mediana dos dados: 42, 3, 9, 5, 7, 9, 1, 9 Série Ordenada: 1, 3, 5, 7, 9, 9, 9, 42 N = 8 elementos Posição: 1 2 N e 2 N 2 8 = 4a e 4 + 1 = 5a posições Md = 8 2 97 ESTATÍSTICA DESCRITIVA Profa. Ms. Daniela Brassolatti 43 3.2 MODA (Mo) É o valor que mais se repete na série, isto é , que tem maior frequência. Exemplo: A moda do conjunto de dados abaixo é o 7 pois ocorre o maior número de vezes. 0, 0, 2, 5, 3, 7, 4, 7, 8, 7, 9, 6 Um conjunto de dados pode não ter moda (amodal) porque nenhum valor se repete , ou ter mais que uma moda (Multimodal). 3.3 MÉDIA É a medida de posição mais usada de uma série. Se refere a soma de todos os valores do conjunto dividida pelo número deles. Notação: Quando alguém fala sobre um conjunto de dados, pode estar se referindo a uma amostra ou uma população. Dessa forma abaixo relacionamos as fórmulas da média para as duas condições mudando as notações para diferenciá-las. Média da população : Onde N é o tamanho da população Média Amostra: Onde n é o tamanho da amostra Exemplo: Calcule a média dos dados amostrais : 0 , 2, 4, 6, 8 Nota: a média tem a mesma unidade de medida dos dados. N 1i i N x n 1i i n x x 4 5 20 5 86420 x ESTATÍSTICA DESCRITIVA Profa. Ms. Daniela Brassolatti 44 3.4 MÉDIA PONDERADA: Todos os valores da série recebem um peso ou uma importância. Exemplo: O capital de uma empresa está formado pelo aporte de acionistas, financiamento de longo prazo e emissão de debêntures dada por uma taxa de juros anual. Calcular a taxa de juros média das fontes de capital da empresa. Fonte de capital Participação Taxa de juros Acionistas 1.000.000 12% Financiamentos 600.000 8% Debêntures 400.000 14% A taxa de juros média das fontes de capital da empresa é 11,20% ao ano. 3.5 MEDIDAS DE TENDÊNCIA CENTRAL PARA DADOS GRUPADOS EM CLASSES OU CATEGORIAS Média em categorias Onde fi são as freqüências de cada classe. Exemplo 1: Durante uma manhã, um feirante vendeu determinado produto a preços variados: 12 unidades foram vendidas a 2 reais; 10 à 3 reais; 8 à 6 reais. Qual o preço médio? O preço médio do produto na manhã foi de R$ 3,40 i n 1i ii f fx x 40,3 30 102 81012 6x83x102x12 x %20,11 000.000.2 %14000.400%8000.600%12000.000.1 média ESTATÍSTICA DESCRITIVA Profa. Ms. Daniela Brassolatti 45 Exemplo2: Número de filhos do sexo masculino relativo à 34 famílias com 4 filhos Nro de filhos meninos(Xi) Freqüência fi Xifi 0 2 0 1 6 6 2 10 20 3 12 36 4 4 16 Total 34 78 3,2 34 78 x Número de filhos é uma variável discreta, como interpretar 2,3 filhos, ou seja, 2 meninos e 3 décimos de menino? 2,3 sugere que o maior número de famílias tem 2 meninos e 2 meninas, sendo a tendência geral de uma leve superioridade numérica em relação ao número de meninos. 3.5.1 Média em classes Exemplo 3: Imagine a margem de lucro na venda de um produto ao longo de 6 meses foram registrados os valores da tabela abaixo: ESTATÍSTICA DESCRITIVA
Compartilhar