Baixe o app para aproveitar ainda mais
Prévia do material em texto
Universidade regional do noroeste do estado do rio grande do sUl – UnijUí vice-reitoria de gradUação – vrg coordenadoria de edUcação a distância – cead coleção educação a distância série livro-texto Ijuí, Rio Grande do Sul, Brasil 2009 ruth Marilda Fricke iara denise endruweit Battisti antonio Édson corrente MÉtodos estatísticos e a adMinistração 2009, Editora Unijuí Rua do Comércio, 1364 98700-000 - Ijuí - RS - Brasil Fone: (0__55) 3332-0217 Fax: (0__55) 3332-0216 E-mail: editora@unijui.edu.br Http://www.editoraunijui.com.br Editor: Gilmar Antonio Bedin Editor-adjunto: Joel Corso Capa: Elias Ricardo Schüssler Revisão: Véra Fischer Designer Educacional: Vanessa Francieli da Frota Responsabilidade Editorial, Gráfica e Administrativa: Editora Unijuí da Universidade Regional do Noroeste do Estado do Rio Grande do Sul (Unijuí; Ijuí, RS, Brasil) Catalogação na Publicação: Biblioteca Universitária Mario Osorio Marques – Unijuí F897m Fricke, Ruth Marilda. Métodos estatísticos e a administração / Ruth Marilda Fricke, Iara Denise Endruweit Battisti, Antonio Édson Corrente. – Ijuí : Ed. Unijuí, 2009. – 164 p. - (Coleção educação a distância. Série livro-texto). ISBN 978-85-7429-840-5 1. Estatística. 2. Administração. 3. Amostragem. 4. Ban- co de dados. 5. Excel. I. Battisti, Iara Denise Endruweit. II. Corrente, Antonio Édson. III. Título. IV. Série. CDU : 311 311:658 Sumário CONHECENDO OS PROFESSORES ...........................................................................................7 APRESENTAçãO ...........................................................................................................................9 UNIDADE 1 – CONCEITOS BÁSICOS ESTATÍSTICA NA ADMINISTRAçãO .....................11 Seção 1.1 – A Estatística e a Administração ...........................................................................11 1.1.1 Um Olhar na Ciência da Administração ...................................................................12 1.1.2 Um Olhar na Ciência da Estatística – Métodos Estatísticos ....................................14 1.1.3 Interligando o Potencial das Duas Ciências .............................................................15 Seção 1.2 – Ajustando a Linguagem por meio dos Conceitos Básicos da Estatística ...........16 1.2.1 Informantes .................................................................................................................17 1.2.2 Informações ................................................................................................................20 Seção 1.3 – Aplicações .............................................................................................................22 Resumo da Unidade 1 .........................................................................................................24 UNIDADE 2 – BANCO DE DADOS, TABELAS E GRÁFICOS: Sistematização e Apresentação de Dados ..........................................................25 Seção 2.1 – Banco de Dados ...................................................................................................26 Seção 2.2 – Tabelas Simples – Univariadas e Bivariadas – Com Variáveis Qualitativas ......29 Seção 2.3 – Tabelas em Série Numérica e Distribuição de Frequências com Variáveis Quantitativas ................................................................................36 Seção 2.4 – Representação Gráfica e sua Leitura ...................................................................45 Seção 2.5 – Aplicações .............................................................................................................49 Resumo da Unidade 2 .........................................................................................................54 UNIDADE 3 – MEDIDAS QUE DESCREVEM O CONJUNTO DE DADOS ...........................55 Seção 3.1 – Quadro-Resumo das Fórmulas ............................................................................56 Seção 3.2 – Medida de Tendência Central e de Variabilidade – conceitos e operacionalização ..........................................................................58 3.2.1 Operacionalização de Medidas Descritivas em Série Numérica ............................62 3.2.2 Operacionalização de Medidas Descritivas em Distribuição de Frequências ........70 Seção 3.3 – Aplicações .............................................................................................................83 Resumo da Unidade 3 .........................................................................................................85 UNIDADE 4 – INTRODUçãO À AMOSTRAGEM ....................................................................87 Seção 4.1 – Padrões a Seguir no Processo Amostral ..............................................................89 4.1.1 Fatores Intervenientes ...............................................................................................89 4.1.2 Métodos de Cálculo da Amostra ...............................................................................90 Seção 4.2 – Delineamento Amostral: dimensionamento e seleção .......................................93 Seção 4.3 – Aplicações .............................................................................................................99 Resumo da Unidade 4 .......................................................................................................101 UNIDADE 5 – NOçõES DE INFERêNCIA ESTATÍSTICA ....................................................103 Seção 5.1 – Conceitos e Definições .......................................................................................104 Seção 5.2 – Estimativas e sua Projeção .................................................................................104 5.2.1 ESTIMATIVAS ........................................................................................................105 5.2.2 TESTES DE HIPÓTESES PARA GENERALIZAçãO DE ESTATÍSTICAS AMOSTRAIS ...........................................................................106 Seção 5.3 – Aplicações ...........................................................................................................117 Resumo da Unidade 5 .......................................................................................................118 UNIDADE 6 – REGRESSãO LINEAR SIMPLES .....................................................................119 Seção 6.1 – Correlação Entre Variáveis ................................................................................120 Seção 6.2 – Diagrama de Dispersão ......................................................................................121 Seção 6.3 – Coeficiente de Correlação ..................................................................................122 Seção 6.4 – Coeficiente de Determinação ( 2R ) ....................................................................124 Seção 6.5 – Análise de Regressão ..........................................................................................125 Seção 6.6 – Banco de Dados ..................................................................................................127 Resumo da Unidade 6 .......................................................................................................128 UNIDADE 7 – FERRAMENTAS DE ANÁLISE ESTATÍSTICA NO EXCEL ...........................129 Seção 7.1 – Elaborando um Banco de Dados no Excel ........................................................131 Seção 7.2 – Utilizando as Técnicas Estatísticas para Analisar os Dados no Excel .............133 Seção 7.3 – Medidas Descritivas para as Variáveis Quantitativas ......................................134 Seção 7.4 – Tabelas Simples para as Variáveis Qualitativas e para as Variáveis Quantitativas com Pouca Variabilidade ............................136Seção 7.5 – Tabelas Cruzadas ................................................................................................142 Seção 7.6 – Gráficos de Setores, Colunas e Barras ..............................................................145 Seção 7.7 – Histograma e Polígono de Frequências .............................................................154 Seção 7.8 – Gráfico de Linha .................................................................................................159 Resumo da Unidade 7 .......................................................................................................161 REFERêNCIAS ...........................................................................................................................163 EaD 7 MÉtodos estatísticos e a adMinistraçãoConhecendo os Professores São três os professores contribuindo para este material didá- tico: A doutora Ruth Marilda Fricke nasceu em Ijuí (RS) no dia 16 de março de 1946. Foi professora estadual e é professora de Estatística desde 1976, na Unijuí (RS) com Graduação em Pedagogia pela Unijuí (Ijuí – RS-1977), Aperfeiçoamento em Estatística na FDRH (PoA – RS – 1975), Especialização em Metodologia do Ensino Superior na Unijuí (Ijuí – RS – 1978), Especialização em Estatística na UPF (Passo Fundo – RS – 1979), Mestrado em Estatística pela Unicamp (Campi- nas – SP– 1990), Doutorado em Educação pela Unicamp (Campinas – SP– 1999). Vem lecionando em diversos cursos da Unijuí desde essa época atuando como professora titular de Estatística. Sua produção como pesquisadora centra-se em quatro campos: 1) Educação Esta- tística e na produção de material didático para o ensino de Estatística na Educação Básica: Fundamental e Médio; 2) Modelagem Estatís- tica na Produção de Indicadores de Qualidade de Vida Urbana; 3) Modelagem Estatística para o Tratamento de Variáveis Qualitativas: Questões Abertas na Pesquisa de campo, 4) Relações entre formação e desemprego dos trabalhadores urbanos. Neste material didático é autora da introdução e das unidades 1 a 5. A doutora Iara Denise Endruweit Battisti é a autora da Uni- dade 7 deste material didático. Nasceu em 8 de outubro de 1974 no município de Ijuí (Rio Grande do Sul). Cursou Informática na Universidade Regional do Noroeste do Estado do Rio Grande do Sul (Unijuí) de 1992 a 1996, fez Especialização em Estatística e Mode- lagem Quantitativa na Universidade Federal de Santa Maria (Rio Grande do Sul) entre 1997 e 1998. De 1999 a 2001 fez Mestrado em Estatística e Experimentação Agropecuária na Universidade Federal de Lavras (Minas Gerais). Fez Doutorado em Epidemiologia na Uni- versidade Federal do Rio Grande do Sul com tese sobre amostragem complexa e modelos multiníveis entre 2004 e 2008. Atua como professora de Estatística no magistério superior desde agosto de 1998 na Unijuí e nos cursos de Especialização desta universidade. É docente e pesquisadora do Mestrado em Modelagem Matemática da Unijuí. Antonio Édson Corrente nasceu em 16 de outubro de 1962 em Ijuí (RS), e neste material didático é o autor da unidade 6. Possui Gra- duação em Ciências e Matemática – Licenciatura Curta – pela Univer- sidade Regional do Noroeste do Estado do Rio Grande do Sul (1988), Graduação em Matemática – Habilitação Plena – pela Universidade Regional do Noroeste do Estado do Rio Grande do Sul (1990) e Mes- trado em Modelagem Matemática pela mesma universidade (1999). Atualmente é professor assistente na Unijuí. Tem experiência na área de Matemática, com ênfase em Estatística, lecionando em diferentes cursos esta disciplina e atualmente atua nos seguintes temas: mode- lagem estatística, comunicação comunitária, formas de codificação de dados e elaboração de questionários e análise multivariada. EaD 9 MÉtodos estatísticos e a adMinistraçãoApresentação Estamos começando uma relação de conhecimento dos métodos estatísticos relacionados com a profissão do administrador. Algumas etapas são comuns a todas as áreas, algumas são mais específicas, no entanto ao longo de todo conhecimento vamos tentar fazer a conexão entre essas áreas de forma que o próprio estudo gere conhecimento válido para você. Entendemos que as aplicações técnicas são cada dia mais facilitadas em virtude dos avanços das novas tecnolo- gias, mas visualizamos que estas só fazem sentido quando pensadas e interpretadas por nós, seres humanos. Então este aspecto nos leva a dominar o desenvolvimento de todas as etapas e direciona a metodologia que pretendemos empregar: • compreensão dos conceitos; • domínio das técnicas; • entendimento da pertinência das aplicações; • capacidade de utilizar a informática como ferramenta que permite a obtenção de resultados mais ágeis, dinâmicos e corretos, potencializando o tempo da análise; • a sistematização e avaliação dos conhecimentos adquiridos acompanhará todo o desenvolvimen- to dos capítulos. Ademais, é proposta uma aplicação que será realizada por meio de pesquisa de campo numa temática definida na área de Administração e tratada estatisticamente. Procuraremos partir sempre de uma situação de estudo, real e prática, que desencadeie a utilização da Estatística pertinente, de forma a potencializar maior compreensão do conteú- do. Você deve acompanhar este desenvolvimento, refazer os passos que foram desenvolvidos, realizar as atividades previstas, buscar apoio didático para suas dúvidas ou certezas, plenificar seu conhecimento fazendo uma resenha do mesmo para que em suas próprias palavras e na sua compreensão os conceitos trabalhados se solidifiquem. O objetivo deste material é introduzir o educando nos conhecimentos básicos dos métodos estatísticos que permitem a sistematização de dados e a sua projeção em pesquisas amostrais de modo a transformá-los em informações confiáveis contribuindo para melhorar a performance do profissional da área de Administração. Para tal desenvolveremos: 1) noções conceituais que permitam estabelecer uma linguagem comum e conhecer a conexão estreita entre os métodos estatísticos e a Administração; EaD ruth Marilda Fricke – iara denise endruweit Battisti – antonio Édson corrente 10 2) estatísticas descritivas que sistematizam as informações obtidas em forma de tabelas e gráficos descrevendo os fenômenos em suas ocorrências; 3) medidas descritivas que buscam descrever o padrão dos dados sintetizando-os por meio de números típicos e a análise do comportamento dos mesmos em relação a estes números típi- cos. Uma vez conhecendo o comportamento padrão dos dados e podendo descrevê-los e apre- sentá-los, passamos a uma segunda fase do tratamento estatístico: o conhecimento dos padrões populacionais a partir de um estudo por amostragem. 4) noções de amostragem que delimitam as restrições essenciais para obtermos uma amostra com potencial representativo corretamente definido; 5) noções de inferência que permitem a generalização da amostra para a população, intensifi- cando o uso de proporções; 6) relações entre variáveis quantitativas que tratam de expor o que estudos descritivos não visualizam, ou seja, as relações que estão por trás dos fenômenos; 7) estatística no excel por que após o conhecimento detalhado dos métodos estatísticos é im- portante que os mesmos possam ser obtidos por meio de técnicas informacionais, de modo que as análises sejam relatadas com uma base mais confiável de resultado. Todos os métodos estatísticos avaliados da unidade 1 a 6 serão retomados nesta unidade com o software Excel. Ruth Marilda Fricke EaD 11 MÉtodos estatísticos e a adMinistraçãoUnidade 1 conceitos BÁsicos estatística na adMinistração Ruth Marilda Fricke oBjetivo desta Unidade: • Conhecer a relação entre a Estatística e a Administração, principalmente, dominando os con- ceitos básicos que as inter-relacionam. as seçÕes desta Unidade: • Seção 1.1 – A Estatística e a Administração. • Seção 1.2 – Ajustando alinguagem por meio dos conceitos básicos da Estatística. • Seção 1.3 – Aplicações. As áreas da Administração e da Estatística fazem parte do mesmo campo de estudos das Ciências: o das Ciências Aplicadas. Muitos alocam a Estatística no campo das Ciências Exatas, no entanto, ela é uma ciência não determinística, trata do conhecimento dos fenômenos sociais e/ ou naturais como o retrato de um momento, propiciando uma visão das tendências futuras como um evento probabilístico, com chances conhecidas/estimadas de ocorrer, portanto não exata, que trata dos fenômenos sociais e/ou naturais em sua evolução. Então, a partir desta breve introdução, você consegue estabelecer a diferença entre deter- minístico e não determinístico? Busque maiores conhecimentos para ampliar seu conhecimento sobre este assunto. Vejamos, a seguir, a relação existente entre a Administração e a Estatística. seção 1.1 a estatística e a administração Iniciamos com observações sobre cada uma das ciências para depois entender como se estabelecem os links entre elas. EaD ruth Marilda Fricke – iara denise endruweit Battisti – antonio Édson corrente 12 1.1.1 UM olHar na ciÊncia da adMinistração As áreas preferenciais da Administração são: • Administração financeira. • Administração da produção. • Administração pública. • Administração de materiais. • Marketing. • Gestão de pessoas. • Gestão sistêmica. • Administração de sistemas de informação. • Organização, sistemas e métodos. • Comércio internacional. A existência da Administração, segundo a Wikipédia, está relacionada a “normas e funções elaboradas para disciplinar elementos de produção, que têm como objetivo alcançar um resultado eficaz e retorno financeiro”. Pode-se afirmar, conforme a Wikipédia, que se trata do gerenciamento dessa operacionalização mediante o conhecimento e uso de técnicas de Administração: • Planos: Um conjunto de propostas resultantes de um processo de planejamento econômico, urbano, regional, etc., que visam a determinado objetivo. • Pareceres: Avaliação de conjunturas no sentido de emitir um parecer sobre o comportamento do fenômeno analisado. • Relatórios: Produzir um relato das ocorrências de uma etapa de trabalho. • Projetos: Elaboração de linhas de ação e estratégias sobre uma determinada realidade para atin- gir determinados fins. Tem um tempo finito de execução, e pretende criar um produto, serviço ou resultado único. Segundo a Wikipédia: pode ser uma demanda de mercado, necessidade organizacional, solicitação de um cliente, avanço tecnológico ou requisito legal. Apresentam: objetivos, hipóteses, cronograma, orçamento, responsabilidades. • Laudos: Relato de técnico ou especialista designado para avaliar determinada situação que estava dentro de seus conhecimentos. EaD 13 MÉtodos estatísticos e a adMinistração Segundo John Riegel: o êxito do desenvolvimento de executivos em uma empresa é resultado, em grande parte, da atuação e da capacidade dos seus gerentes no seu papel de educadores. Cada superior assume este papel quando ele procura orientar e facilitar os esforços dos seus subordinados para se desenvolverem (1995). Atualmente as principais funções administrativas são: • Planejamento. • Conhecimento dos problemas. • Busca e encaminhamento de soluções. • Definição dos recursos (humanos, financeiros e tecnológicos). • Liderar as ações na empresa. • Gerenciar os fenômenos organizacionais que envolvem as transações da empresa. • Tomadas de decisão. • Controle dos fatos e fenômenos mediante técnicas de conhecimento, mensuração, acompanha- mento, avaliação das informações relacionadas ao negócio da empresa. Essas perspectivas de atuação dependem efetivamente da capacidade do administrador de encontrar as alternativas mais viáveis e potencialmente bem-sucedidas nas diferentes etapas do processo decisório. Para tal precisa essencialmente identificar o problema e seu entorno. Isto é, deve ser capaz de definir o que parece, e o que realmente é, contextualizado no âmbito da ocorrência dos fatos e fenômenos, com pesquisa, levantamento e sistematização estatística dos mesmos. Dessa forma começamos a compreender a importância dessa interação entre a Adminis- tração e os métodos estatísticos. Estes, na sua essencialidade, subsidiam a ação do administrador/ gestor, tanto o público quanto o privado. Os tipos de decisões envolvendo aspectos quantificáveis que são tomadas em uma orga- nização: • Identificação dos custos para poder valorar os produtos, incluindo a produção (matéria-prima, equipamentos, ferramentaria, maquinaria), recursos humanos, distribuição, logística, armaze- namento. • Planejamento das despesas e orçamento das diferentes áreas da organização. • Análise das margens e da rentabilidade dos produtos. • Análise dos custos de venda. • Planejamento do marketing (pesquisa de mercado, aceitação, satisfação do cliente). EaD ruth Marilda Fricke – iara denise endruweit Battisti – antonio Édson corrente 14 Segundo Araújo (2004), entende-se como características do gestor suas funções, habilidades e competências: planejar, organizar, liderar e controlar. O planejamento envolve a determinação no presente do que se espera para o futuro da organização, incluindo quais as decisões que deverão ser tomadas para que as metas e propósitos sejam alcançados. As metas organizacionais adaptam as funções aos recursos da empresa e aos recursos humanos necessários para concretizá-los. O gestor precisa conduzir o processo de forma a influenciar todas as pessoas a trabalharem em torno de objetivos comuns, suscitando participação e adesão, gerenciando democraticamente o processo. O controle integra as ações para o acompanhamento do processo em busca do sucesso do empreendimento. Estas características dão conta de que somente a união de todos permite atingir com sucesso os objetivos. Vamos agora abordar a ciência Estatística, como ela se organiza no tratamento de dados. 1.1.2 UM olHar na ciÊncia da estatística – MÉtodos estatísticos As áreas preferenciais da Estatística são: • Estatística descritiva. • Probabilidade. • Amostragem. • Inferência. • Relações entre variáveis. • Estatística paramétrica. • Estatística não paramétrica. • Estatística Bayesiana. • Bioestatística. • Estatística aplicada: medicina, sociedade, gestão pública e privada, indústria, comércio, agri- cultura, psicologia, saúde... A teoria da Estatística preocupa-se em construir modelos com base em técnicas estatís- ticas capazes de descrever, relacionar e fazer projeções a partir das situação reais na empresa. A criação de modelos, sejam eles descritivos ou inferenciais, pretende subsidiar a resolução de problemas de tomada de decisão, uma vez que sistematizam os dados obtidos e permitem uma apresentação mais didática e compreensível. EaD 15 MÉtodos estatísticos e a adMinistração É por meio de tabelas, gráficos, medidas descritivas, amostragem, inferências, relações entre variáveis, que se fazem representações da realidade. Com isso pretendemos descrever os fenômenos como eles ocorrem, simular situações futuras e avaliar a probabilidade de sua ocorrência. Simplificam, dão visibilidade para os fenômenos e permitem que representemos a realidade, com condições de projetar as tendências e interferências na realidade de modo a melhorar nosso poder decisório. Com isso: • entendemos melhor os fatos reais; • damos visibilidade a relações existentes entre distintas variáveis que compõem o problema em estudo, não perceptíveis apenas ao primeiro olhar; • os métodos estatísticos trabalham o problema como um todo e de forma multivariada, com múltiplas variáveis ao mesmo tempo; • conseguem acompanhar a evolução do fenômeno no tempo e no espaço, acompanhando os resultados parciais, incluindo novos fatores no desenvolver do estudo; • conduzem a soluções quantitativas, mais compreensíveis e mais argumentativas; • permitem uso de computadores para processar grandesvolumes de dados. 1.1.3 interligando o Potencial das dUas ciÊncias Um candidato ou candidata a um emprego leva, seguramente, vantagem se tiver em sua bagagem de conhecimento o domínio dos métodos estatísticos, uma vez que essa habilidade pode ser de grande interesse para as empresas contratantes. A leitura de um gráfico, de uma tabela, a interpretação e análise de relações e de tendências permitem uma nova linguagem a serviço da organização empresarial. Para fazer essa interligação entre a Administração e os métodos estatísticos apresentamos diferentes níveis de aprofundamento nessa leitura da realidade dos fatos e fenômenos sociais e/ ou naturais: a. Estatística Descritiva: nesse âmbito, como o próprio nome diz, pretende-se descrever os fenô- menos. Trata-se de técnicas estatísticas para sistematização, sintetização e apresentação de fenômenos de forma compreensível, dando visibilidade ao que realmente aconteceu ou acon- tece. Como compreender os diferentes estágios do nível de pobreza nos municípios gaúchos, N = 496, sem uma descrição completa de sua localização, magnitude, permitindo avaliar e traçar metas em relação aos bolsões de miserabilidade no Estado. Qual o gestor público que não deseja ter à disposição essa descrição do fenômeno ao traçar planos e metas, definir prio- ridades? EaD ruth Marilda Fricke – iara denise endruweit Battisti – antonio Édson corrente 16 b. Estatística Inferencial: observamos que o termo “inferência” provém do verbo inferir, quer dizer, que pretendemos olhar um quadro de resultados e projetá-los para um universo maior. A inferência reúne um conjunto de métodos que permitem fazer essas projeções com garantia e conhecimento da margem de erro máxima inerente às inferências realizadas com base em uma amostra. Como podemos projetar o sucesso do lançamento de um novo produto no merca- do sem antecipar seu potencial de vendas? Para tal busca é impossível represar o lançamento esperando que se conheça qual a fatia do mercado que se interessaria pela sua aquisição, portanto é um caso típico para inferir o resultado populacional mediante uma amostra dos possíveis clientes. c. Estatística Aplicada: nos dois itens anteriores passamos uma ideia sobre a existência de um conjunto de métodos e técnicas estatísticas, construindo descrições e inferências dos dados. Após o uso das mesmas, estando aptos a traçar um perfil descritivo do nosso conjunto de dados, vamos aplicar algumas técnicas que revelam relações entre variáveis de forma a mostrar o que está por trás dessas relações descritivas. Podemos descobrir, por exemplo, que as mulheres compram preferencialmente determinados produtos; podemos conhecer o quanto a idade pode estar relacionada à quantidade de gastos com multas de trânsito; podemos avaliar os limites permitidos de diâmetro de uma determinada peça; podemos avaliar a resposta em termos de volume de vendas com o passar dos meses... Nós, seres humanos, e até mesmo os animais e as plantas, temos diferentes formas de nos expressar. Dependendo da situação, empregamos as mesmas palavras para expressar diferentes ideias. O mesmo se dá nas diversas Ciências. A palavra “população” na Demografia expressa os habitantes de uma determinada região; já na Estatística sob a idéia de população agregamos todos os indivíduos, animais, objetos, lugares, períodos ou máquinas, etc., que apresentam ca- racterísticas comuns predefinidas que constituem o nosso universo de informantes. Na seção a seguir vamos apresentar os principais conceitos da Estatística. seção 1.2 ajustando a linguagem por meio dos conceitos Básicos da estatística Os principais conceitos da Estatística dizem respeito aos informantes e às informações que formam as bases do tratamento estatístico. Os métodos estatísticos aparecem, então, intimamente relacionados com esse contexto, pois permitem conhecer e explorar os fenômenos. Dois são os âmbitos da perspectiva estatística: INFORMANTES E INFORMAÇÕES. EaD 17 MÉtodos estatísticos e a adMinistração 1.2.1 inForMantes O que queremos dizer com Informantes? Trata-se da proveniência dos dados, quem os fornece. Nossos informantes podem ser as empresas, os trabalhadores, os produtos... Eles são a origem das informações. Ao analisar as empresas posso obter delas uma série de informações que constituirão o objeto da estatística. Os informantes podem se constituir numa população ou numa amostra. a. POPULAÇÃO: É o conjunto de todas as unidades que reunimos a partir de características que as definem e que são o espaço temático de nosso estudo. Segundo o dicionário Aurélio: “População é o conjunto de habitantes de um território, de um país, de uma região, de uma cidade, etc.” Ainda no Dicionário Aurélio (1995, p. 1.115): “Estat. Conjunto, em geral infinito ou com um grande número de membros, cujas propriedades se investigam por meio das características dos subconjuntos que lhes pertencem, universo”. Segundo a Wikipédia Português: Genericamente, uma população é o conjunto de pessoas ou organismos de uma mesma espécie que habitam uma determinada área, num espaço de tempo definido. O termo população tem, consoante a disciplina a que se refere, distintas definições. Em Biologia define-se como um grupo de indivíduos que acasalam uns com os outros, produzindo descendência. Em Estatística chama-se população ao conjunto de todos os valores que descrevem o fenômeno que interessa ao investigador (grifo nosso). Em Sociologia define-se como um conjunto de pessoas adscritas a um determinado espaço, num dado tempo (p. 1.115). E assim por diante. Na Geografia, população são os indivíduos que fazem parte de um mesmo grupo: habitantes de um país, de uma tribo, de uma região, de um Estado, ou ainda mais específica, economicamente ativa, desocupados, inativos... Entendemos que na área da Administração, sob o ponto de vista dos métodos estatísticos, população é um conjunto de instituições, empreendimentos, clientes, negócios, produtos, traba- lhadores, indicadores, etc. Nesse caso, basta que nosso estudo esteja centrado nessa população, de forma que como nossos informantes, eles forneçam as informações que estão no entorno de nossa temática. Para serem população é necessário que se constituam de um grupo exaustivo de elemen- tos que são definidos sob as características mencionadas. Um grupo exaustivo quer dizer que é composto por todas as unidades possíveis que só podem ser avaliadas censitariamente, isto é, EaD ruth Marilda Fricke – iara denise endruweit Battisti – antonio Édson corrente 18 por meio de um censo, em que nenhuma das unidades fique de fora. As características tornam único aquele conjunto de dados, de forma que se distingue logo se uma unidade pertence ou não àquela população. Vejamos no Quadro 1 alguns exemplos de população: Quadro 1: exemplos de população e sua descrição estatística População Características Tamanho Definição Trabalhadores Pessoas com 10 anos ou mais que são a PEA – região Metropol i tana de Porto Alegre – março de 2008. N = 1.875 mil pessoas Ωx : { x ∈ (1 , 2 , 3 , . . . . , 1 .875.000} Empresas Da construção de I juí registradas no Cadastro da Prefei tura Muni- cipal de I juí – 2006. N = 121 Ωx : { x ∈ (1 , 2 , 3 , . . . . , 121} Produtos Comercial izados pela empresa X de I juí – março de 2009. 2 mil i tens Ωx : { x ∈ (1 , 2 , 3 , . . . . , 2000} Fonte: Elaboração da autora. b) AMOSTRA: entendemos por amostra quando temos um conjunto significativo da população que apresenta as mesmas características e que a distingue de outros informantes. Nesse caso, nenhuma características particular pode dominar a amostra e não estar presente em toda a população. Por exemplo: se nossa população são os cães de nossa cidade, não pode a amostra constituir-se só de fêmeas, pois nesse caso acrescentaria uma nova característica, que excluiria uma parte dos cães da cidade.No Dicionário Aurélio (1995, p. 88), a definição 2 de amostra afirma que é uma porção, fragmento ou unidade de um produto natural ou fabricado destituído de valor comercial, e apresentado para demonstrar sua natureza, qualidade ou tipo (...). Em Farm. Amostra grátis de me- dicamentos que laboratórios farmacêuticos distribuem, como propaganda, para conhecimento dos médicos. Amostra indeformada Constr. Amostra de solo obtida de tal modo que se podem considerar como subsistentes nela todas as características que se verificam no local em que foram extraídas. Reunindo todos os resultados do Dicionário Aurélio (1995, p. 88), que se referem ao conceito estatístico observamos que amostra é EaD 19 MÉtodos estatísticos e a adMinistração Subconjunto de uma população por meio do qual se estabelecem ou estimam as propriedades ou ca- racterísticas dessa população (...) Amostra acidental, obtida por meio de um processo de amostragem casual; (...) Amostra pequena que tem um número de elementos insuficientes para permitir fazer uma estimativa não viciada1 dos parâmetros2 da população; (...) Amostra representativa que foi obtida por um processo isento de vício. A partir destas explicações podemos constatar que em quase todas as áreas do conheci- mento a amostra apresenta finalidades que têm suas bases apoiadas no sentido estatístico, isto é, pretende de forma sintética, rápida, menos custosa e eficiente conhecer, estimar o comporta- mento da população. Em Estatística, pretendemos obter uma amostra que tenha um potencial comprovado de fazer essas inferências, de modo que dependemos de um bom delineamento amostral: dimensionamento formal (por meio de fórmula) do tamanho necessário de unidades amostrais, seleção aleatória e representatividade das características do perfil que interessa manter, tais como por sexo (50% de mulheres e 50% de homens se for esta a composição da população), faixa etária, escolaridade... Exemplificando: uma auditoria numa empresa identificou telefonemas dados a sua prin- cipal concorrente, e como foi constatado que algumas das promoções planejadas pela empresa vazaram antes de serem postas em prática, há necessidade de rapidamente detectar de qual(is) linha(s) interna(s) partiu (partiram) as chamadas e verificar a demanda e o responsável por elas. Entendeu-se que inicialmente o processo por amostragem seria o mais rápido de realizar. Na empresa existem 240 ramais telefônicos, e foram constatadas ligações em 15% deles. Neste caso definimos como: • População: Ramais com ligações efetuadas para o principal concorrente • N = 36 ramais, N: tamanho da população • Dimensionamento da amostra: n = 20 • Numerados os ramais de U1 a U60, procedemos ao sorteio das unidades amostrais • Unidades amostrais conforme sorteio: 1 Não viciada é uma expressão estatística que significa não tendenciosa, isto é, um resultado confiável, que não sofreu interferências externas que o deturpassem. 2 Parâmetros são os números típicos, tipo média aritmética, obtidos em dados populacionais, enquanto que estatísticas são estimativas destes parâmetros obtidos num processo amostral. EaD ruth Marilda Fricke – iara denise endruweit Battisti – antonio Édson corrente 20 Quadro 2: amostras sorteadas3 para a pesquisa e as reservas RAMAL SORTEADO RESERVAS Ordem Ramal Ordem Ramal Ordem Ramal Ordem Ramal Ordem Ramal 1 3 6 13 11 21 16 28 21 17 2 5 7 15 12 22 17 29 22 9 3 8 8 16 13 23 18 30 23 24 4 10 9 19 14 25 19 31 5 12 10 20 15 27 20 35 Fonte: Elaboração da autora. Na seção seguinte vamos conhecer o outro lado do tratamento estatístico. Se por um lado precisamos dos informantes, por outro necessitamos saber quais as informações sobre a popu- lação/amostra nos interessam e que são importantes para tirarmos conclusões que respondam as nossas perguntas/hipóteses. 1.2.2 inForMaçÕes Por informações entendemos os próprios dados que serão trabalhados estatisticamente com os métodos estatísticos. O tema a ser investigado, as hipóteses e os objetivos é que definem quais são as informações de interesse nesse campo. Estas informações são denominadas de variável aleatória. variÁvel aleatÓria (va) Um problema bem estruturado tem suas principais variáveis conhecidas. Por variável entendemos o conjunto de informações de interesse que estão envolvidas no problema. Essas informações são aleatórias, isto é, podem ser definidas num conjunto possível de respostas, porém se combinam ao acaso e não são predeterminadas. Não são informações isoladas, únicas, mas cada unidade investigada apresenta uma resposta, que mostra diferenças entre elas, isto é, tem variedade, e apresenta respostas esperadas num grande conjunto de repetições. Se avaliamos as características físicas do produto principal da empresa podemos encontrar informações sobre tamanho, espessura, finalidade, valor, custo, cor, formato, tempo de produção, materiais empregados na sua fabricação, máquinas utilizadas na produção, função dos trabalha- 3 Sorteio realizado com o auxílio do Excel por meio da função: Aleatório ()*36, que gerou 20 nºs entre os 36 ramais da População e mais 3 para reserva em caso de problemas de acesso ao ramal sorteado. EaD 21 MÉtodos estatísticos e a adMinistração dores envolvidos na produção, locais e formas de comercialização, durabilidade... Estas, portan- to, são variáveis envolvidas no produto. Observamos que algumas delas apresentam respostas quantitativas e outras qualitativas. Se considerarmos o exemplo utilizado para explicar a questão da amostra, podemos consi- derar que a metodologia a ser empregada na obtenção dos dados é a de quebra do sigilo telefô- nico nos ramais sorteados (este procedimento deve ser previamente autorizado). Serão colhidas algumas informações como: X1: autor da ligação, X2: cargo do autor da ligação, X3: tempo de serviço na empresa e X4: destinatário da ligação; X5: cargo do destinatário da ligação na empresa concorrente, X6: data e X7: tempo da ligação; X8: assunto abordado na ligação, X9: abordagem de assunto relacionado com os pré-lançamentos, X10: nº de ligações realizadas para a empresa concorrente, X11: nº total de ligações, X12: frequência de realização, X13: relação das datas com períodos de pré-lançamento de produtos, etc. Algumas respostas são categóricas (qualitativas) outras são numéricas (quantitativas). a. Variáveis aleatórias qualitativas: são informações cujas respostas são categóricas que podem apresentar uma ordem ou não entre as diferentes categorias de respostas. Permitem que se codifique as diferentes alternativas possíveis, são obtidas por meio de contagem de suas repeti- ções, chamadas de frequências (fi). Entre as variáveis relacionadas anteriormente encontramos como variável qualitativa (VA Qualitativa): Quadro 3: exemplos de variável qualitativa e sua classificação estatística Variável Categorias Classificação Cor branca, cinza, verde, azul, ver- melha... Variável Aleatória Qualitativa Não Ordenável Função dos trabalhadores envol- vidos na produção Projetista, operador de máquina, alimentador de matéria-prima, carregador, pintor... Variável Aleatória Qualitativa Não Ordenável Durabilidade Mínima, Média, Máxima Variável Aleatória Qualitativa Ordenável Fonte: Elaboração da autora. b) Variáveis aleatórias quantitativas: são variáveis que apresentam valores quantitativos como respostas. Podem ser somente valores inteiros (VA Quantitativas discretas) ou admitem valores fracionários (VA Quantitativas contínuas) como respostas. São finitas (N conhecido) ou infinitas (N desconhecido). Podem ser enumeradas em ordem crescente ou decrescente, apresentam valores mínimos (Li) e valores máximos (Ls), são obtidas por meio de técnica de mensuração. Entre as variáveis relacionadas anteriormente encontramos como variável qualitativa (VA Qualitativa): EaD ruth Marilda Fricke – iara denise endruweit Battisti – antonio Édson corrente 22 Quadro 4: exemplosde variável quantitativa e sua classificação estatística Variável Valores Classif icação Custo de produção X > R$ 00,00 Variável Aleatória Quantitativa Contínua Nº de trabalhadores envol- vidos na produção X ∈ (0, 1, 2, 3, . . . . . ) Variável Aleatória Quantitativa Discreta Fonte: Elaboração da autora. Com esse Quadro 4 concluímos a apresentação da base necessária para constituir um tra- balho estatístico, isto é, seu objeto e seu objetivo, construídos na ótica de buscar os informantes e por meio deles obter as informações necessárias para conhecer de forma ampla a temática de nosso interesse. Com as aplicações pretendemos abrir um espaço de uso desse conteúdo de forma que possa alargar os horizontes do conhecimento estatístico. Lembre-se de que esta adequação inicial em termos de linguagem, conceitos, identificações, vão permitir que o seu tratamento dos dados seja adequado e pertinente. seção 1.3 aplicações a. Considere o exemplo dos ramais, as variáveis sugeridas, complementando-as e classificando- as organizando um quadro como os utilizados anteriormente. b. Organize três estudos definindo: A temática, população, N, amostra, n, sorteio, variáveis e sua classificação. No banco de dados (Inep/IBGE/PNAD) a seguir, defina Temática, População, N, Variáveis e sua classificação: EaD 23 MÉtodos estatísticos e a adMinistração tabela 1: rendimento médio mensal e número de profissionais por tipo de profissão segundo regiões geográficas e Brasil – 2001 (Em R$ 1,00) Nº de profissio- nais Brasil Norte Nordeste Sudeste Sul Centro– Oeste Professor da educação infantil 201.232 422,78 388,89 232,79 522,44 435,87 749,61 Professor de 1a a 4a série 881.623 461,67 443,17 293,18 599,19 552,72 567,38 Professor de 5a a 8a série 521.268 599,85 600,99 372,81 792,82 633,92 593,52 Funções adm. de nível superior em educação 139.575 849,16 753,20 549,60 1.092,85 738,27 834,86 Professor de nível médio 348.831 866,23 826,28 628,08 979,16 804,32 872,20 Suboficial das Forças Armadas 517.038 868,73 817,55 723,52 986,19 747,23 910,93 Professor-pesquisador no E. Superior 6.448 898,80 215,33 1.150,16 946,56 712,65 875,47 Agente administrativo público 316.761 911,82 661,40 679,31 1.072,50 926,14 1.103,37 Administrador de empresas 502.895 1.202,86 986,87 774,85 1.411,18 1.057,85 1.123,93 Técnico de nível superior – público 421.318 1.310,56 1.053,94 794,02 1.586,97 1.308,30 1.876,79 Policial civil 72.743 1.510,64 1.344,46 1.320,40 1.457,90 1.488,02 2.087,23 Oficial das Forças Armadas 89.387 2.091,53 2.129,41 1.674,46 2.250,53 1.949,68 2.321,03 Economista 44.772 2.254,66 1.700,77 2.009,08 2.227,19 1.641,35 3.592,64 Auditor 68.870 2.408,40 3.512,94 1.584,94 2.588,47 1.986,32 3.133,88 Advogado 271.241 2.496,76 3.893,83 2.245,35 2.431,04 2.597,39 2.768,25 Professor de nível superior 136.977 2.565,47 1.800,30 2.252,08 3.086,95 2.122,77 2.190,10 Delegado/Perito 13.973 2.660,52 2.753,91 1.347,25 2.650,73 3.714,45 5.969,61 Médico 257.414 2.973,06 4.429,82 2.576,78 2.801,77 3.260,41 4.110,87 Juiz 10.036 8.320,70 5.905,38 8.038,88 9.018,42 9.750,00 7.331,08 Fonte: Pesquisa Nacional por Amostra de Domicílios (Pnad) – 2001. Nota: (1) Valor em R$ de setembro de 2001. Obs. Não estamos enfatizando o processo amostral nestas aplicações da Unidade 1, posto que esta será tratada mais detalhadamente na Unidade 4. EaD ruth Marilda Fricke – iara denise endruweit Battisti – antonio Édson corrente 24 resUMo da Unidade 1 Esta é uma unidade essencial, pois nela conhecemos termos e sig- nificados que vão acompanhar nossos estudos até o final deste livro e muito além. Aprendemos que a Estatística basicamente utiliza In- formantes (População e Amostra) e Informações (Variáveis aleatórias quantitativas e qualitativas) para descrever (Estatística Descritiva), projetar (Estatística Inferencial) e estabelecer relações (Estatística Aplicada). Neste curso vamos trabalhar esses três níveis de conhe- cimento estatístico. Referências que consultamos especificamente para esta Unidade e sugerimos aos alunos que consultem: • CHIAVENATO, Idalberto. Introdução à Teoria Geral da Administração. 4. ed. São Paulo: Makron, 1993. • DRUCKER, Ferdinand P. A profissão de administrador. São Paulo: Pioneira Thompson Learning, 1998. • FERREIRA, Aurélio Buarque de Holanda. Dicionário da Língua Portuguesa. Rio de Janeiro: Nova Fronteira, 1995. • LACOMBE, F. J. M.; Heilborn, G. L. J. Administração: princípios e tendências. 1. ed. São Paulo: Saraiva, 2003. • MONTANA, Patrick J. Administração. 2. ed. São Paulo: Saraiva, 2003. • ARAÚJO, Luis César G. Teoria geral da Administração: aplicação e resultados nas empresas brasileiras. São Paulo: Ed. Atlas, 2004. • RIEGEL, John. Employee interest in company success-how can it be stimulated and maintained? Address on industrial relations. Bureau of Industrial Relations; University of Michigan; Ann Arbor, 1955. p. 25. EaD 25 MÉtodos estatísticos e a adMinistração Banco de dados, taBelas e grÁFicos: sistematização e apresentação de dados Ruth Marilda Fricke oBjetivo desta Unidade: • Dominar três formas especiais de sistematizar e apresentar dados estatísticos transformando-os em informações de apoio na área administrativa: bancos de dados, tabelas e gráficos. seçÕes desta Unidade: Seção 2.1 – Banco de Dados Seção 2.2 – Tabelas Simples – Univariadas e Bivariadas – com Variáveis Qualitativas Seção 2.3 – Tabelas em Série Numérica e Distribuição de frequências com Variáveis Quantitativas Seção 2.4 – Representação Gráfica e sua Leitura Seção 2.5 – Aplicações As áreas da Administração e da Estatística interagem a partir do momento em que ambas trabalham com informações da realidade. Estas informações são mais bem conhecidas a partir do tratamento estatístico, que permite uma visão mais global do comportamento dos dados quando visualizados em sua individualidade, e das relações que elas estabelecem entre si quando ana- lisadas conjuntamente, em um plano bidimensional ou tridimensional. Esse tratamento, que se inicia com o banco de dados, é organizado em forma de tabelas e apresentado em forma de grá- ficos. Com isso a Administração potencializa as tomadas de decisão embasada em informações estatísticas que conduzem as ideias e sustentam os projetos da área administrativa. Unidade 2 EaD ruth Marilda Fricke – iara denise endruweit Battisti – antonio Édson corrente 26 Utilizaremos na apresentação deste conteúdo alguns indicadores calculados a partir de estatísticas dos municípios gaúchos apresentados pelo IBGE; disponível em: <www.ibge.gov.br/ cidades/default.php>. Acesso em: jun. 2009. Inicialmente precisamos entender que a divisão po- lítica do RS é realizada em mesorregiões, em número de 7, 35 microrregiões e 496 municípios. Vamos então iniciar pela utilização do banco de dados, uma espécie de planilha de dados que apresenta não apenas os dados, mas as variáveis, informa a população, número de registros e dados pareados1 de todas as unidades (populacionais ou amostrais) que estão sendo apresen- tadas. seção 2.1 Banco de dados Para dar início ao tratamento estatístico necessitamos coletar dados que provêm das per- guntas que nos fazemos em relação à nossa população dentro da temática que nos interessa. Assim, se formos estudar a distribuição dos municípios da Microrregião de Três Passos, suas potencialidades econômicas e capacidade de atender à demanda na região em que está estabelecida, podemos buscar dados sobre: 1 Pareados significa que todos os dados apresentados numa mesma linha referem-se à mesma unidade e não podem ser isolados nem misturados, pertencem àquela unidade. Por exemplo, se temos idade, sexo, escolaridade, data de admissão na empresa, estas são sempre informações particulares do sujeito e não podem desconectar-se dele. EaD 27 MÉtodos estatísticos e a adMinistração Quadro 1: codificação e variável com classificação e categorias do banco de dadosX N Nº de ordem do município X1 Mun Município X2 POP População Residente – Variável aleatória quantitativa discreta X3 PIB_cap PIB per capita – Variável aleatória quantitativa contínua X4 Cls_PIB Classificação do PIB per capita – Variável aleatória qualitativa ordenável –[1) Pobre: <7 mil dólares /ano; 2) Em desenvolvimento: de 7 a 24,99 mil dólares/ano; 3) Rico: > 25 mil dólares/ano ou mais] X5 N_agFin Nº de agências financeiras no município -– Variável aleatória quantitativa discreta X6 Valor_ FPM Valor retorno do Fundo de Participação dos Municípios– Variável aleatória quantita- tiva contínua X7 Valor_ITR Valor do Imposto Territorial Rural– Variável aleatória quantitativa contínua X8 Ind_Res Nº de indústrias por mil hab. – Variável aleatória quantitativa contínua X9 Cls_ind Classificação da relação entre indústrias por mil habitantes– Variável aleatória qualitativa ordenável – [1) Não industrializado < 1 indústria por 1000 hab.; 2) Pouco industrializado – 2 a 4,9 indústrias por 1000 hab.; 3) Média industrialização 5 a 10,9 indústrias por 1000 hab.; 4) Bem Industrializado – 11 a 19,9 indústrias por 1000 hab.; 5) Industrial – ≥ 20 indústrias por 1000 hab.;] X10 Área Área territorial do município em km²– Variável aleatória quantitativa contínua X11 Cls_Área Classificação da área territorial – Variável aleatória qualitativa ordenável– [1) Peque- na – < 200 km²; 2) Médio – 200 a 500 km²; 3) Grande 501 a 1000 km²; 4) Extenso – > 1000 km²] X12 Densidade Densidade demográfica Hab/km² – Variável aleatória quantitativa contínua X13 Cls_Dens Classificação da Densidade demográfica– Variável aleatória qualitativa ordenável– [1) Alta densidade: > 1000 hab./km²; 2) Grande densidade: 501 a 1000 hab./km²; 3) média densidade: 100 a 500 hab./km²; 4) baixa densidade: < 100 hab./km²] Fonte: Elaboração da autora. Nossa população são todos os municípios da Microrregião de Três Passos. Isso se consti- tui no nosso N, numeradas de 1 a N. Todas as informações que obtivermos às nossas perguntas constituirão nossas variáveis. As informações referem-se a cada um dos municípios, portanto constituem informações casadas, relacionadas, e não podem ser misturadas, pois cada uma está ligada a um município em particular. Trata-se, portanto, de uma relação de dados obtidos por meio de uma pesquisa, de um levantamento de dados e contém todas as informações que foram levantadas e as transforma- ções que foram realizadas para conseguir ampliar a base das mesmas. No banco de dados nº 1, EaD ruth Marilda Fricke – iara denise endruweit Battisti – antonio Édson corrente 28 as variáveis básicas são X1, X2, X3, X5, X6, X7, X8, X10. Com estas variáveis foram feitas algumas transformações que resultaram nas variáveis X4, X9, X11, X12, X13. Assim, o banco de dados vai se constituindo com as variáveis originais e as que são geradas a partir das mesmas. As informações dos municípios entrarão nas linhas e as variáveis nas colunas. O total de municípios é o N = 20, neste caso Quadro 2: Banco de dados nº 1– Municípios da Microrregião de três Passos X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12 X13 X1 N Mun POP PIB_ cap Cls_ PIB N_ agFin Valor_FPM Valor_ ITR Ind_ Res Clsind Area Cls area Den- sida- de Cls dens 1 Barra do Guarita 2.969 6.508 1 0 2.797.615,36 533,7 2 2 65 1 45,7 5 2 Boa Vista do Buricá 6.468 10.114 1 2 2.797.615,36 1.902,02 17 4 109 1 59,3 5 3 Bom Pro- gresso 2.441 7.338 1 0 2.797.615,36 2.369,08 5 3 89 1 27,4 3 4 Braga 3.826 6.984 1 0 2.797.615,36 4.145,13 3 2 129 1 29,7 3 5 Campo Novo 5.581 9.658 1 2 2.810.105,39 15.989,17 7 3 222 2 25,1 3 6 Crissiumal 14.726 9.687 1 3 5.267.727,46 5.417,75 8 3 362 2 40,7 5 7 Derrubadas 3.378 8.957 1 0 2.410.580,60 4.060,42 1 1 361 2 9,4 1 8 Dr Maurício Cardoso 5.494 10.597 1 2 3.512.012,00 7.660,00 6 3 256 2 21,5 3 9 Esperança do Sul 3.445 7.821 1 0 2.798.876,06 1.724,62 3 2 148 1 23,3 3 10 Horizontina 18.305 19.805 2 4 5.595.230,83 8.291,42 8 3 229 2 79,9 5 11 Humaitá 4.923 11.774 1 1 2.797.615,36 2.519,68 8 3 135 1 36,5 4 12 Miraguaí 4.869 6.473 1 1 2.797.615,36 1.324,74 4 2 130 1 37,5 4 13 Nova Can- delária 2.739 12.368 1 0 2.797.615,39 946,85 4 2 98 1 27,9 3 14 Redentora 9.600 5.122 1 1 2.810.105,36 6.674,59 2 2 303 2 31,7 4 15 São Marti- nho 5.853 10.212 1 2 2.797.615,36 5.514,40 10 4 172 1 34,0 4 16 Sede Nova 2.968 11.782 1 0 2.797.615,36 4.554,22 7 3 119 1 24,9 3 17 Tenente Portela 13.906 7.301 1 2 4.340.091,71 3.703,25 7 3 338 2 41,1 5 18 Tiradentes do Sul 6.928 6.765 1 0 2.797.615,36 2.944,97 2 2 234 2 29,6 3 19 Três Passos 23.467 12.755 1 5 9.657.490,50 5.196,27 8 3 268 2 87,6 5 20 Vista Gaú- cha 2.713 9.920 1 0 2.797.615,76 922,33 8 3 89 1 30,5 4 Fonte: IBGE/cidades. O banco de dados é na verdade uma listagem de todas as informações obtidas, sejam elas originais ou transformações. Nos casos em que as variáveis forem qualitativas, utilizamos um código para representar as diversas categorias de resposta, como fizemos com a variável – Classificação do PIB per capita, na qual utilizamos os seguintes códigos, com as respectivas classificações e faixa de dados: EaD 29 MÉtodos estatísticos e a adMinistração 1) Pobre– < 7 mil dólares/ano. 2) Em desenvolvimento – 7 a 24,99 mil dólares/ano. 3) Rico-> 25 mil dólares/ano. Se não obtivermos informação podemos assumir um código único para todo o banco de dados representando a Não Resposta: 99, 999 por exemplo. Essa informação será contabilizada como um valor não válido e será descontada do total para obtermos um percentual válido sobre as respostas válidas. É importante obtermos todas as respostas para os questionamentos feitos, pois o excesso de “Não resposta” pode inviabilizar a análise e a retirada de conclusões, isto é, nossa base de informações pode não estar realmente “informando”. Na próxima seção vamos estudar os tipos de tabelas simples – univariadas (uma única variável na tabela) e bivariadas (duas variáveis tratadas conjuntamente numa única tabela, apresentando o comportamento interativo das duas). Esse tratamento abrange as variáveis qua- litativas na maioria dos casos. seção 2.2 taBelas siMPles – Univariadas e Bivariadas – com variáveis Qualitativas A tabela univariada apresenta uma única variável e é também chamada de tabela simples. É utilizada para representar variáveis qualitativas, cujas respostas são nominais, são categorias. A estatística neste caso está limitada a descrever o que ocorreu em termos de repetições. As partes da tabela são: título, barra de informações, dados obtidos, barra de totais e fonte das informações. Nenhuma dessas partes pode faltar para que o trabalho estatístico tenha validade, seja feita uma leitura das informações obtidas e possam ser compreendidas. 1) Uma tabela deve apresentar um título que apresenta a variável que está sendo apresentada, população, local e tempo em que os dados foram coletados. 2) Na parte superior da tabela simples existe uma barra de informações, em que constam todos os tipos de informações que serão apresentadas ou trabalhadas na tabela. 3) No corpo da tabela contabilizamos as repetições das respostas e calculamos o valor percentual. As repetições são números reais e absolutos, permitem avaliar a importância das diferentes categorias, no entanto só podemos comparar com outras variáveis se o número de dados for igual. Nesse caso, se a intenção é fazer comparações temos de utilizar um valor relativo, que é a porcentagem. EaD ruth Marilda Fricke – iara denise endruweit Battisti – antonio Édson corrente 30 • Nº: são as repetições de uma determinada resposta no banco de dados; • %: é o valor relativo do Nº em relação ao total de respostas, o n º% *100N n = • % válido: é o valor relativo calculado sobre o total de respostas válidas, isto é, n* = n – NR, não respostas. º % *100, * * N n n NR n = = − , ou seja: • *100 %. % i f n = ; *100 %.. % :. sin i válido f n NI NI mis g = −; Na parte inferior, uma barra com os totais, ou seja, as somatórias das colunas do Nº (fi) que no caso representa o n, Total de dados, (∑ fi = n) e dos percentuais, cuja soma deve ser 100%. Neste cálculo vários arredondamentos são possíveis de serem utilizados: a) em primeiro lugar, optamos por trabalhar com duas casas após a vírgula para que os arredondamentos não possuam efeito muito drástico, capaz de alterar a interpretação do resultado; b) utilizamos, pre- ferencialmente, os seguintes critérios: se a 3ª casa for um nº no intervalo de 0 a 4, eliminamos (exemplo % = 5/26*100 = 19,23077 ≅ 19,23); se a 3ª casa for um nº no intervalo de 5 a 9, elimi- namos e aumentamos um ponto na 2ª casa (exemplo % = 6/26*100 = 23,07692 ≅ 23,08). • Fonte: informa a proveniência dos dados, potencializando que se busquem mais informações, que as atualizemos e também referem a credibilidade dos dados. Estes detalhes podem ser vistos na Tabela 1 a seguir. Apresentamos um exemplo com base no banco de dados sobre a participação da população com 100 anos ou mais na população com 60 anos ou mais segundo o local de moradia e sexo nas UF/BR – 2007. Esta tabela demonstra as duas possibilidades – Presença de todas as Respostas e presença de dados censurados NI (missing) – ou seja, falta de informação: *100 %. . . . . .100 6 % 23,08% 26 deRaros Mulher Rural com de anos> = = ; *100 %.. . . . . . 100. 6 % 24% .......26 1 :. sin 1 válido de raros MR c anos NI mis g > = = − = EaD 31 MÉtodos estatísticos e a adMinistração tabela 1: Participação de idosos com 100 anos ou mais no grupo de pessoas com 60 anos ou mais, considerando sexo e local de moradia, nas diversas UF/Br – 2007 Participação MR % MR % MR válido HR % HR MU % MU HU % HU Raros (0 a 4/10 mil idosos) 6 23,08 24,00 19 73,08 8 30,77 19 73,08 Nº Médio (5 a 14/10 mil idosos) 14 53,85 56,00 7 26,92 17 65,38 7 26,92 Grande Nº (15 ou +/10 mil idosos) 5 19,23 20,00 1 3,85 Total 25 96,15 100,00 26 100,00 26 100,00 26 100,00 NR 1 3,85 Total 26 100,00 Fonte: IBGE/cidades. Obs.: Siglas: MR – Mulheres da área Rural; HR – Homens da área Rural; MU – Mulheres da área Urbana; HU – Homens da área Urbana; Categorias da participação: Raros: % < 0,05; Nº Médio: 0,05 a 0,14; Grande Nº: % > 0,14 Na Tabela 1 estamos avaliando a variável Participação de Idosos com 100 anos ou mais no grupo de Idosos da População com 60 anos ou mais, considerando diferentes informações que potencializam obter diferentes aspectos que podem ser comparados. Estamos comparando os Estados segundo sua distribuição de longevidade a partir de di- ferenças apresentadas por sexo (H ou M) e por localização (R ou U). Nesse caso a variável é a mesma, as populações apresentam características diferenciadas. O comentário que vamos apresentar a seguir de cada tratamento específico dos dados é uma das diversas “leituras” dos resultados estatísticos. Procuramos, especialmente, nesse tipo de comentário: • apresentar inicialmente uma idéia geral à qual o tratamento estatístico permitiu chegar, au- xiliando o leitor a “enxergar” nos resultados o que estes nos revelam, isto é, encaminhando a leitura na direção que é compatível com os objetivos para os quais os dados foram coletados; • sustentar as ideias, argumentações com as estatísticas calculadas. Estas são argumentativas por si próprias e devem convencer o leitor. Por exemplo, não basta dizer “a maioria” dos Esta- dos, é necessário informar de quanto é essa proporção para que ela convença o leitor sobre a superioridade em termos de presença dessa categoria; • evitar referir todos os dados da tabela, apenas os que queremos colocar em destaque; • procurar apresentar informações que estão subjacentes, retrabalhadas, tipo a soma de dois dados, o complementar de algum deles. Comentário 1: Com base nesta tabela constatamos que a maior participação de pessoas com 100 anos ou mais na população idosa são as mulheres do meio ru- ral (MR), que apresentam em 76% dos Estados um número médio de idosos, EaD ruth Marilda Fricke – iara denise endruweit Battisti – antonio Édson corrente 32 em torno de 5 a 14 idosos com 100 anos ou mais em cada 10 mil idosos (56%), 15 ou mais idosos com 100 anos ou mais em cada 10 mil idosos (20%). A menor presença é de homens com mais de 100 anos, tanto no meio urbano como no rural. São raros (menos de 5 idosos com 100 anos ou mais em cada 10 mil idosos) em 73% dos Estados em ambos os casos. Outro exemplo deste tratamento utilizando múltiplas tabelas para traçar o perfil pode ser vista na Tabela 2. Nesse caso, diferentes variáveis são consideradas para uma mesma população, mas ainda tratadas isoladamente. O que muda é a apresentação conjunta. Vejamos então, na Tabela 2, variáveis da Microrregião de Três Passos, apresentando seu perfil econômico a partir de 5 delas: Porte dos municípios, Classificação da densidade demográ- fica, Classificação pelo PIB per capita, Nº de Agências Financeiras e Classificação nº indústrias/ mil hab. tabela 2: classificação dos municípios segundo potencial econômico da Microrregião de três Passos com 20 municípios 2 N=20 Nº % Porte dos Municípios2 1 – Pequeno Porte I (até 20 mil hab.) 11 55,00 2 – Pequeno Porte II (20 a 50 mil hab.) 9 45,00 Classificação da densidade demográfica* 1 – (< 10hab. /km²) 1 5,00 3 – (20 a 29 hab./km²) 8 40,00 4 – (30 a 39 hab./km²) 5 25,00 5 – (40 e mais hab./km²) 6 30,00 Classificação pelo PIB per capita 1 – Pobre 19 95% 2 – Em desenvolvimento 1 5% Nº de Agências Financeiras 0 9 45,00 1 3 15,00 2 5 25,00 3 1 5,00 4 1 5,00 5 1 5,00 Classificação nº indústrias/mil hab. 1) Não industrializado (<1/mil hab.) 1 5,00 2) Pouco industrializado (2 a 4,9/mil hab.) 7 35,00 3) Média industrialização ( 5 a 10,9 /mil hab.) 10 50,00 4) Bem Industrializado – (11 a 19,9/mil hab.) 2 10,00 Fonte: IBGE/cidades. * Todos os municípios apresentam densidade inferior a 100 hab./km2, logo tem baixa densidade demo- gráfica. A classificação evidencia 5 níveis (1 a 5) sendo 1 o menor e 5 o maior dentro do grupo 2 Fonte: Atlas de Desenvolvimento Humano, 2002. EaD 33 MÉtodos estatísticos e a adMinistração Estas variáveis oferecem uma visão geral da Microrregião, não permitindo fazer desta- ques de municípios individualmente, mas pretende dar uma visão da Microrregião em termos econômicos. Comentário 2: Utilizando o banco de dados da Microrregião de Três Passos, buscamos fazer uma avaliação do potencial econômico da riqueza da região. Constata-se na Tabela 2 que são 20 municípios de pequeno porte (55% de nível I com até 20 mil habitantes e 45% de nível II com 20 a 50 mil habitantes), em sua maioria com baixo rendimento econômico e baixa densidade demográfica: menos de 100 hab./km2. Apenas três municípios apresentam um destaque em termos econômicos: Três Passos, Crissiumal e Horizontina. Os demais apresentam populações pobres, com baixo rendimento e baixo potencial de desenvolvimento. Podemos observar que em termos de PIB per capita (fatia do PIB por residente nos municípios da Microrregião), 95% dos municípios podem ser considerados subdesenvolvidos/pobres, uma vez que o PIB per capita/ ano é inferior a US $ 7 mil dólares/ano, o que daria uma base em torno de R$ 1000,00/mês. Nessa Microrregião 45% dos municípios não dispõem sequer de uma agência financeira, e o número médio de agências financeiras por município é de 1,25. O número de indústrias para cada mil habitantes indica que existem apenas dois municípios que apresentam uma maior industrialização, com 11 a 20 indústrias por mil habitantes. 40% dos municípios são pouquís- simo ou nada industrializados (menos de 5 indústrias por mil habitantes). As tabelas bivariadas, por sua vez, apresentam simultaneamente duas ou mais variáveis, cada variável é uma dimensão. Quando trabalhamos com uma ou até duas dimensões os resul- tados do tratamento são simples de explicar e compreender, porém se trabalharmos com três oumais dimensões torna-se bem mais complexo. Por isso vamos nos restringir a duas dimensões. Ao sistematizar duas variáveis vamos construir uma tabela bivariada, também chamada de tabela cruzada, ou tabela de dupla entrada. Estas variáveis devem ser qualitativas ou então transformadas em qualitativas pela orga- nização de dados quantitativos em intervalos tipo faixa etária, por exemplo. Uma variável entra na linha (li) e outra na coluna (cj) da matriz. Nas margens da Tabela teremos os dados de cada variável em separado, e no interior a frequência conjunta (fi j), em que i representa a informação da linha e j a informação da coluna. Se estamos tratando de sexo e consumo de determinado bem, podemos ter os seguintes pares de informações conjuntas: masculino e consome; mascu- lino e não consome; feminino e consome; feminino e não consome. Resumidamente, temos os seguintes pares: (M;C); (M;N); (F;C); (F;N). Vamos contar a repetição de cada par para formar a frequência conjunta. Se tivermos seis homens que consomem este bem, então a primeira fre- quência conjunta é 6. EaD ruth Marilda Fricke – iara denise endruweit Battisti – antonio Édson corrente 34 Nas tabelas cruzadas temos três tipos de frequência relativa: • de linha (em relação a cada categoria da variável que está na linha), permitindo saber como essa categoria se distribuiu ante as que estão na coluna; • de coluna (em relação a cada categoria da variável que está na coluna), permitindo saber como essa categoria se distribuiu ante as que estão na linha; • do total (em relação ao total geral), permitindo saber como essa categoria se distribuiu ante o grupo todo, total geral. As fórmulas para o cálculo desses percentuais são estas: , *100 , %. . % i ji j i de linha f l = ∑ ; , *100 , %. . % i ji j j de coluna f c = ∑ ; , *100 , %. . % i ji j de total f n = No exemplo: *100 1,1 %. . 6 % 20,0% 30 de sexo = = ; *1001,1 %. . 6 % 11,8% 51 de consumo = = ; , *100 , %. . % i ji j de total f n = Para apresentar a tabela bivariada, ou tabela conjunta, estamos utilizando um exemplo do banco de dados sobre o padrão alimentar de um grupo de alunos. Encontramos inicialmente as frequências conjuntas e as frequências marginais (estas formam os resultados como se fossem uma tabela simples). A seguir, empregando as fórmulas apresentadas anteriormente, calculamos os percentuais, realizando logo a seguir o comentário (leitura) das informações sistematizadas nessa tabela: tabela 3: consumo de alimento “light” por sexo Sexo\consumo Consome Não Consome Total p/sexo Masculino 6 24 30 % sexo 20,0 80,0 100,0 % consumo 11,8 58,5 32,6 % do total 6,5 26,1 32,6 Feminino 45 17 62 % sexo 72,6 27,4 100,0 % consumo 88,2 41,5 67,4 % do total 48,9 18,5 67,4 Total p/consumo 51 41 92 % sexo 55,4 44,6 100,0 % consumo 100,0 100,0 100,0 % do total 55,4 44,6 100,0 Fonte: Registro de aula. EaD 35 MÉtodos estatísticos e a adMinistração Comentário 3: Observa-se que a preocupação com o consumo de alimentos “light”, conside- rados com menor potencial de prejuízo à saúde, está associado com o sexo do consumidor: mulheres consomem mais do que homens. Constata-se que é maior entre as mulheres (72,6% das mulheres) do que entre os homens (apenas 20% dos homens), referindo portanto que 88,2% do consumo é realizado por pessoas do sexo feminino e 58,5% dos que não consomem são homens. Para fazer a análise da tabela bivariada realizamos o mesmo tipo de recorte permitido nas tabelas simples. • apresentar a idéia síntese da intenção que motivou a tabela; • um cuidado é o de não rediscutir todos os percentuais; • não utilizar todos os percentuais referentes a uma frequência conjunta. Escolher o que melhor expressa a intenção da pesquisa; • procurar embasar os comentários com as estatísticas mais adequadas, isto é, escolher o que vai sustentar melhor, convencer melhor o leitor. Ao fazermos a leitura da tabela temos de nos conscientizar de que o fazemos para terceiros, que não terão a visão dos dados brutos e nem das diferentes maneiras pelas quais os mesmos podem ser sistematizados, apresentados ou interpretados. Muitas relações que estão subjacentes aos dados podem ser ressaltadas nesses comentários pelo autor, encaminhando a compreensão que o leitor vai ter da temática. Com isso, alertamos para a parcialidade do comentário, não há neutralidade nele. O autor deve assumir que conduz o leitor à interpretação. A seguir vamos apresentar outro exemplo: Condições Econômicas dos Municípios da Mi- crorregião de Três Passos, a partir do banco de dados nº 1. tabela 4: nº de agências financeiras segundo o porte dos municípios da Microrregião de três Passos em 2007. Por te dos munic íp ios Nº Agênc ias 0 1 2 ou mais Tota l por Agênc ias Pequeno Por te I 7 2 2 11 % área 63 ,6 18 ,2 18 ,2 100 ,0 % agênc ias 77 ,8 66 ,7 40 ,0 55 ,0 % to ta l 35 ,0 10 ,0 10 ,0 55 ,0 Pequeno Por te I I 2 1 6 9 % área 22 ,2 11 ,1 66 ,8 100 ,0 % agênc ias 22 ,2 33 ,3 83 ,3 45 ,0 % to ta l 10 ,0 5 ,0 30 ,0 45 ,0 Tota l por Por te 9 3 8 20 % área 45 ,0 15 ,0 40 ,0 100 ,0 % agênc ias 100 ,0 100 ,0 100 ,0 100 ,0 % to ta l 45 ,0 15 ,0 40 ,0 100 ,0 Fonte: IBGE/cidades. EaD ruth Marilda Fricke – iara denise endruweit Battisti – antonio Édson corrente 36 Comentário 4: O número de agências financeiras no município depende do porte do mesmo. Na Microrregião de Três Passos observa-se que três municípios apresentam melhores con- dições econômicas em termos de PIB per capita. O porte do município explica o número de agências financeiras observado em cada município. Assim, constata-se que 35% deles são de Pequeno Porte nível I, isto é, com até 20 mil habitantes e não apresentam agência finan- ceira, enquanto que 30% são de Pequeno Porte nível II, de 20 a 50 mil habitantes, e possuem 5 agências financeiras. Agora que construímos tabelas simples e cruzadas para sistematizar e apresentar as variáveis qualitativas, vamos ver como se organizam dados quantitativos. Basicamente a organização de dados quantitativos é realizada com dois procedimentos distintos: Série Numérica (uma relação de dados não agrupados) e Distribuição de frequências (os dados agrupados em intervalos). seção 2.3 tabelas em série numérica e distribuição de Frequências com variáveis Quantitativas A sistematização dos dados de variáveis quantitativas permite um pouco mais de trata- mento estatístico. O número de informações com as quais trabalhamos e a apresentação de um comportamento padronizado ou não vão definir se a sistematização será feita por meio de Série Numérica (pequenas amostras, n<20), que trabalha com toda a informação individualizada, isto é, listada uma a uma, ou de Distribuição de frequências (grandes amostras, n≥20), que distribui as repetições dentro de intervalos, informando, portanto, que naquela faixa de valores existem fi (frequência, nº), que são as observações. Na Série Numérica, quando trabalhamos com pequenas amostras de tamanho menor do que 20, listamos os valores de Xi (variável aleatória) ordenados em ordem crescente, do menor para o maior. Consideramos a listagem dos dados absolutos nesse caso, pois devido ao pequeno tamanho da Amostra ou População, o agrupamento dos valores observados em intervalos signi- ficaria uma perda de informações que inviabilizaria a compreensão do fenômeno. Após fazer a listagem dos dados ordenados o máximo que podemos obter, nessa fase inicial, são: • Informações sobre o n, valor mínimo (Li – Limite Inferior), o valor máximo (Ls – Limite Supe- rior), a amplitude total (At = Ls – Li, Faixa de variação dos dados entre o maior e o menor). • Referências para um agrupamento qualitativo, formação de categorias que reagrupem os valores de forma nominal. EaD 37 MÉtodos estatísticos e a adMinistração • Avaliação da composição do total pelo valor relativo da parte considerada. 1 *100in i i x VR x = = ∑ Empregamos, para exemplificar,os dados referentes aos municípios que estão separados por Porte, como municípios de Pequeno Porte Nível I e II, da Microrregião de Três Passos. No caso dos Municípios de Pequeno Porte I ou II, observa-se que: Quadro 3: informações básicas da Microrregião de três Passos Municípios de Pequeno Porte I Municípios de Pequeno Porte II nI = 11 nII = 9 Li = R$ 533,70 Li = R$ 2.944,97 Li = R$ 5.514,40 Li = R$ 15.989,17 At = R$ 4.980,70 At = R$ 13.044,20 Fonte: Elaboração da autora. Apesar do número diferenciado de municípios de Pequeno porte por Nível, n = 11 no caso do Nível I e n = 9 no Nível II, a variação entre o menor valor do ITR no primeiro caso é de aproximadamente R$ 5.000,00 (0,5 a 5,5 mil reais), enquanto no segundo caso é de quase 3 vezes mais (2,9 a 15,9 mil reais). tabela 5: valor do itr (imposto territorial rural) nos municípios de Pequeno Porte nível i e ii da Microrregião de três Passos – rs – 2007. Pequeno Porte I Pequeno Porte II N Município Valor_ITR VR N Município Valor_ITR VR 1 Barra do Guarita 533,70 2,02 1 Tiradentes do Sul 2.944,97 4,91 2 Vista Gaúcha 922,33 3,49 2 Tenente Portela 3.703,25 6,18 3 Nova Candelária 946,85 3,58 3 Derrubadas 4.060,42 6,77 4 Miraguaí 1.324,74 5,01 4 Três Passos 5.196,27 8,67 5 Esperança do Sul 1.724,62 6,52 5 Crissiumal 5.417,75 9,04 6 Boa Vista do Buricá 1.902,02 7,19 6 Redentora 6.674,59 11,14 7 Bom Progresso 2.369,08 8,95 7 Dr Maurício Cardoso 7.660,00 12,78 8 Humaitá 2.519,68 9,52 8 Horizontina 8.291,42 13,83 9 Braga 4.145,13 15,67 9 Campo Novo 15.989,17 26,68 10 Sede Nova 4.554,22 17,21 Total 59.937,84 100,00 11 São Martinho 5.514,40 20,84 Total 26.456,77 100,00 Fonte: IBGE/cidades. EaD ruth Marilda Fricke – iara denise endruweit Battisti – antonio Édson corrente 38 Estes dados são apresentados em forma de série numérica pois em ambos os casos, n<20:3 municípios de Pequeno Porte I, nPPI = 11; Municípios de Pequeno Porte I, nPPII = 9. Agrupá-los e distribuí-los em intervalos é inviável porque ocorre muita perda de informação. Como são valores quantitativos, procurou-se avaliar a contribuição total em cada grupo de municípios e a participação de cada um deles nesse montante. Para calcular essa participação utilizamos o VR = valor relativo, isto é, a parte da cada município dentro do total do grupo. Comentário 5: O montante arrecadado de ITR nos Municípios de Pequeno Porte nível II é aproximadamente o dobro do outro grupo, perfazendo quase 60 mil reais. O município que mais contribui para o primeiro montante (R$ 26.456,77) é São Martinho, que arrecada 20,84% do valor total. O município que mais contribui para o segundo montante (R$ 59.937,84) é Campo Novo, que arrecada 26,86% do valor total. Aproximadamente 90,9% dos municípios de Pequeno Porte I apresentam baixa arrecadação de ITR, enquanto que no grupo de municípios de Pequeno Porte II, 66,7% dos municípios apresentam arrecadação média. Com esse resultado poderíamos formar 2 grupos de arrecadações do ITR, apresentados a seguir mediante tabelas simples, pois criaram-se a partir dessa informação estatística dois grupos: com baixa e média arrecadação, visualizados na Tabela 6: tabela 6: classificação dos municípios segundo o porte e valor de itr arrecadado na Microrregião de três Passos Arrecadação Intervalo Pequeno Porte I Pequeno Porte II Nº % Nº % Baixa < R$ 5.000,00 10 90,91 3 33,33 Média ≥ R$ 5.000,00 1 9,09 6 66,67 Total 11 100,00 9 100,00 Fonte: Elaboração da autora com base nos dados do IBGE/cidades. Na Distribuição de frequências, quando trabalhamos com grandes amostras de tamanho maior ou igual a 20, podemos adotar essa técnica de agrupamento de dados, que é uma ferra- menta poderosa na sistematização dos dados, pois apresenta bastante flexibilidade na escolha da amplitude parcial e dos limites dos intervalos com pequena perda de informações. As únicas exigências que se fazem nesse caso são: a. que o Li seja incluído no 1º intervalo, entendendo-se neste caso que o limite inicial do 1º intervalo não precisa necessariamente ser o Li, mas este deve estar obrigatoriamente contido nele; 3 N PPI: número de municípios de pequeno porte I. N PPII: número de municípios de Pequeno Porte II. EaD 39 MÉtodos estatísticos e a adMinistração b. que o Ls seja incluído no último intervalo, entendendo-se neste caso que o limite final do último intervalo não pode ser o Ls, mas tem de estar obrigatoriamente contido nele; c. que todos intervalos precisam ter frequência maior do que zero, isto é, fi > 0. Observadas à risca estas exigências, iniciamos o tratamento dos dados para um conjunto de dados cujo n > 20. Essa tarefa de sistematização passa pelo levantamento das informações básicas, ordenação em forma crescente do menor para o maior valor com o Ramo e Folhas, avaliação da ocorrência de valores soltos, fora do padrão, por meio do Diagrama de Pontos, dimensionamento dos intervalos mediante a Amplitude Parcial, construção da Distribuição de Frequências (DF): • Informações básicas dos dados Para iniciar o processo de agrupar os dados em intervalos precisamos saber o montante de variação que deve ser distribuído em intervalos, usualmente de tamanho regular. Essas in- formações podem ser obtidas sem qualquer tratamento prévio: n – número de dados; Li – valor mínimo da distribuição de valores; Ls – valor máximo do conjunto de observações. De posse destas informações podemos calcular a faixa de variação dos dados pela diferença entre o mínimo e o máximo. Este dado é denominado de At = Amplitude total. Quadro 4: informações básicas necessárias para a construção de uma distribuição de frequências n = Nº de valores Li = Menor valor Ls = Maior valor At = Faixa de Variação Fonte: Elaboração da autora. • Ordenação dos dados por meio do Ramo e Folhas Na natureza ou na sociedade quando obtemos os dados eles seguem uma sequência ale- atória que no mais das vezes não cumpre um ordenamento crescente. A distribuição de frequ- ências pressupõe a construção de intervalos com padrões regulares e crescentes de forma que nos primeiros intervalos serão alocados os valores mais baixos e nos últimos serão contados os valores mais altos. Por isso, precisamos ordenar os dados de forma crescente. Como cada valor representa uma observação, mesmo repetidas, cada uma deve constar para posterior contagem da frequência. EaD ruth Marilda Fricke – iara denise endruweit Battisti – antonio Édson corrente 40 Esta ordenação pode ser feita usando o programa Excel que classifica os dados por uma variável ou fazer uma ordenação manual. O modo manual comumente utilizado, o da ordenação visual, é muito demorado em grandes amostras. Temos uma outra alternativa, que é da organi- zação em ramos e folhas. Esta técnica busca nos dados duas faixas de variação: uma para os ramos – de variação mais demorada, construída a partir da avaliação dos limites Li e Ls computada anteriormente para o caso. Observamos de quanto a quanto os dados variam e construímos faixas de referên- cias de maior amplitude; outra para as folhas, que é uma faixa de variação mais rápida dentro da maior. Por exemplo, se escolhemos uma variação nas dezenas para os Ramos, nas Folhas a va- riação será das unidades. Após organizar o Ramo e folhas, alocamos cada observação no Ramo adequado e registramos a parte da observação que não aparece no ramo. A apresentação do Ramo e Folhas fica assim, se as informações básicas fossem estas (referentes ao ITR dos municípios de Pequeno Porte I da Microrregião de Três Passos): Quadro 5: informações básicas necessárias para a construção de uma distribuição de frequências Li = R$ 0.533,00 Ls = R$ 15.989,00 Observações: 534 1902 2369 4145 15989 5418 4060 7660 1725 8291 2520 1325 947 6675 5514 4554 3703 2945 5196 922 Fonte: Elaboração da autora. Usando as informações básicas vamos considerar os valores de Li (R$ 0.533,00) e da Ls (R$ 15.989,00) estrategicamente colocados um sobre o outro.
Compartilhar