Baixe o app para aproveitar ainda mais
Prévia do material em texto
RACIOCÍNIO ANALÍTICO E QUANTITATIVO Alessandro Ferreira Alves *Todos os gráficos, tabelas e esquemas são creditados à autoria, salvo quando indicada a referência. Imagens da capa: © bubble86 // Shutterstock; © grmarc // Shutterstock. Informamos que é de inteira responsabilidade da autoria a emissão de conceitos. Nenhuma parte desta publicação poderá ser reproduzida por qualquer meio ou forma sem autorização. A violação dos direitos autorais é crime estabelecido pela Lei n.º 9.610/98 e punido pelo artigo 184 do Código Penal. Copyright Universidade Positivo 2016 Rua Prof. Pedro Viriato Parigot de Souza, 5300 – Campo Comprido Curitiba-PR – CEP 81280-330 Superintendente Reitor Pró-Reitor Acadêmico Coordenador Geral de EAD Coordenadora Editorial Autoria Supervisão Editorial Parecer Técnico Validação Institucional Layout de Capa Prof. Paulo Arns da Cunha Prof. José Pio Martins Prof. Carlos Longo Prof. Renato Dutra Profa. Manoela Pierina Tagliaferro Prof. Alessandro Ferreira Alves Bianca de Brito Nogueira Prof. José Clair Menezes Júnior Francine Ozaki e Regiane Rosa Valdir de Oliveira FabriCO KOL Soluções em Gestão do Conhecimento Ltda EPP Análise de Qualidade, Edição de Texto, Design Instrucional, Edição de Arte, Diagramação, Design Gráfico e Revisão Ícones Afirmação Contexto Biografia Conceito Esclarecimento Dica Assista Curiosidade Exemplo Sumário Apresentação ....................................................................................................................9 O autor .............................................................................................................................10 Capítulo 1 Fundamentos da estatística, etapas do estudo estatístico, amostragem e interpretação dos resultados ...............................................11 1.1 Aspectos Introdutórios da Estatística ........................................................................12 1.1.1 Notas Históricas e Importância ..............................................................................................................................12 1.1.2 A Importância da Estatística no Meio Empresarial e o Processo Decisório ............................................................13 1.1.3 Conceitos Fundamentais .........................................................................................................................................14 1.1.4 Etapas de uma pesquisa ........................................................................................................................................ 16 1.2 Processos estatísticos de abordagem e técnicas de amostragem ............................18 1.2.1 Levantamento por recenseamento e levantamento por amostragem ..................................................................19 1.2.2 Amostragem probabilística e não probabilística .................................................................................................. 20 1.2.3 Principais tipos de amostragem probabilística ..................................................................................................... 20 1.3 Variáveis, dados e erros .............................................................................................23 1.3.1 Tipos de variáveis ................................................................................................................................................... 23 1.3.2 Tipos de dados .......................................................................................................................................................24 1.3.3 Tipos de Erros ........................................................................................................................................................ 25 1.4 Representação tabular e representação gráfica de dados .........................................26 1.4.1 Tabelas de distribuição de frequências .................................................................................................................. 26 1.4.2 Principais tipos de gráficos .................................................................................................................................... 30 Referências ......................................................................................................................34 Capítulo 2 Medidas Descritivas ........................................................................................................35 2.1 Medidas de Centralidade ...........................................................................................36 2.1.1 Média Aritmética, Média Geométrica e Média Ponderada ................................................................................... 36 2.1.2 Média Harmônica e Média Quadrática .................................................................................................................. 40 2.1.3 Mediana e Moda .................................................................................................................................................... 42 2.1.4 Cálculo das medidas de centro para dados agrupados em classes ....................................................................... 44 2.2 Medidas Separatrizes ................................................................................................47 2.2.1 Quartis ................................................................................................................................................................... 47 2.2.2 Decis ...................................................................................................................................................................... 50 2.2.3 Percentis .................................................................................................................................................................51 2.3 Medidas de Dispersão ...............................................................................................54 2.3.1 Variabilidade .......................................................................................................................................................... 54 2.3.2 Variância e Desvio Padrão ..................................................................................................................................... 55 2.3.3 Coeficiente de Variação de Pearson e Erro Padrão ................................................................................................ 57 2.3.4 Escore Padronizado e Outliers ............................................................................................................................... 60 2.4 Assimetria e Curtose ..................................................................................................62 2.4.1 Aspectos Introdutórios da Assimetria ou Enviesamento....................................................................................... 62 2.4.2 Principais Medidas de Assimetria ......................................................................................................................... 62 2.4.3 Aspectos Introdutórios da Curtose ou Grau de Achatamento .............................................................................. 64 2.4.4 Principais Medidas de Curtose .............................................................................................................................. 65 Referências ......................................................................................................................68 Capítulo 3 Análise Combinatória .....................................................................................................69 3.1 Introdução a Análise Combinatória ...........................................................................70 3.1.1 Princípio Fundamental da Contagem ....................................................................................................................71 3.1.2 Técnicas de Contagem ........................................................................................................................................... 75 3.2 Permutações ..............................................................................................................76 3.2.1 Notação Fatorial ..................................................................................................................................................... 77 3.2.2 Permutações Simples ............................................................................................................................................ 78 3.2.3 Permutações com Repetições ............................................................................................................................... 79 3.2.4 Aplicações Envolvendo Permutações ................................................................................................................... 83 3.3 Arranjos e Combinações ............................................................................................84 3.3.1 Arranjos Simples .................................................................................................................................................... 85 3.3.2 Combinações Simples ........................................................................................................................................... 86 3.3.3 Aplicações Envolvendo Arranjos e Combinações .................................................................................................. 88 3.4 Binômio de Newton ..................................................................................................89 3.4.1 Números Binomiais e Binomiais Consecutivos ...................................................................................................... 90 3.4.2 Triângulo de Pascal ................................................................................................................................................ 91 3.4.3 Descrição formal do Binômio de Newton ............................................................................................................. 93 Referências ......................................................................................................................95 Capítulo 4 ........................................................................................................................... Probabilidade .................................................................................................................97 4.1 Introdução a Teoria de Probabilidades ......................................................................97 4.1.1 Conceitos Básicos ................................................................................................................................................... 98 4.1.2 Regras Básicas e Teorema de Bayes .................................................................................................................... 100 4.1.3 Distribuições de Probabilidades ........................................................................................................................... 105 4.2 Aspectos Introdutórios ............................................................................................105 4.2.1 Função Densidade de Probabilidade ................................................................................................................... 107 4.2.2 Função Distribuição Cumulativa .......................................................................................................................... 107 4.2.3 Tipos de Variáveis Aleatórias ............................................................................................................................... 109 4.3 Variáveis Aleatórias Contínuas .................................................................................110 4.3.1 A Curva Normal de Gauss .....................................................................................................................................110 4.3.2 A Distribuição Normal Padronizada .....................................................................................................................112 4.3.3 A Distribuição Exponencial ..................................................................................................................................117 4.4 Variáveis Aleatórias Discretas ..................................................................................119 4.4.1 Distribuição Binomial e Medidas Características ..................................................................................................119 4.4.2 Distribuição de Poisson e Propriedades .............................................................................................................. 120 4.4.3 Aplicações Diversas Envolvendo a Distribuição Binomial e a Distribuição de Poisson ....................................... 122 Referências ....................................................................................................................124 Bem-vindo à disciplina de Raciocínio Analítico e Quantitativo. Nesta disciplina, apresentaremos um vasto campo de conhecimento no qual você encontrará uma variedade de temas que englobam os quatro capítulos, compondo a disciplina desde as informações iniciais sobre a aplicabilidade da Estatística e avançan- do para variáveis e distribuições de probabilidade, que são fundamentais para a pes- quisa analítica e quantitativa de mercado. Conhecer métodos estatísticos é muito importante para vários profissionais, in- dependentemente da área de atuação, porque propicia o domínio de ferramentas quantitativas que servem de alicerce para interpretação e resolução de problemas que aparecem no seu cotidiano profissional. Nesse sentido, o entendimento dos conceitos apresentados é fundamental para sua sólida formação específica e possibilitará a resolução de diversas aplicações. Bons estudos! Apresentação Aos meus alunos, que sabem que, para se tornarem profissionais diferenciados no mercado, a dedicação e a leitura contínua são pré-requisitos básicos para o sucesso. O autor O professor Alessandro Ferreira Alves é Doutor em Matemática Aplicada a Engenharia Elétrica pela Faculdade de Engenharia Elétrica e Computação da Universidade Estadual de Campinas (FEEC-UNICAMP), Mestre em Matemática Pura pelo Instituto de Matemática, Estatística e Computação da Universidade Estadual de Campinas (IMECC- UNICAMP) e possui Licenciatura Plena em Matemática pela Universidade Federal de Uberlândia (UFU). É Atua como coordenador de cursos de licenciatura à distância desde 2007 e presta consultoria na área de Finanças, Estatística Aplicada a Mercado e Controle Estatístico de Processos (CEP). Currículo Lattes: <lattes.cnpq.br/7860986142316472> 1 Fundamentos da estatística, etapas do estudo estatístico, amostragem e interpretação dos resultados Não é novidade para ninguém que o mundo globalizado exige profissionais cada vez mais qualificados e dinâmicos. As organizações estão à procura de profissionais gabaritados, que tenham o domínio de ferramentas quantitativas. Isso nos diz que a habilidade na resolução de problemas, independentemente do grau de complexidade, seja por meio de métodos analíticos ou quantitativos, é um diferencial de mercado, já que as organizações buscam a maximização de resultados, minimizando custos ou aumentando receitas, por meio de decisões gerenciais tomadas com confiabilidade. Logicamente, temos um grande leque de informações a serem trabalhadas. Segundo Levine (2012), cresce a procura pela análise de dados e, consequentemente, a Estatística surge como uma ferramenta indispensável para as empresas, sejam elas públicas ou privadas. A Estatística está diretamente relacionada ao planejamento, desenvolvimento e acompanhamento de produtos, projetos, serviços e processos diversos.Cabe ressaltar que ela está presente em todas as áreas do conhecimento: engenharias (controle esta- tístico de processos), publicidade e propaganda (tabulação de dados em pesquisas de mercado), ciências contábeis e ciências econômicas (mensuração de indicadores), ciên- cias biológicas (descrição de resultados de testes), entre outras. Salienta-se que, em termos empresariais, a Estatística é importante para que um negócio organizacional obtenha sucesso, porém, não o garante. O sucesso pode vir pela introdução de medidas objetivas, que tendem a viabilizar a atividade empresarial. É no conjunto delas que se encontra a Estatística, propondo, a partir de suas técnicas específicas, a coleta, análise e interpretação de dados estatísticos. Ressalta-se que dados não são apenas números, podendo ser também atributos. Exemplificando: quando descrevemos a idade de pessoas (18, 27, 32, 21, 42, etc.), temos números; quando descrevemos o sexo (masculino ou feminino), temos atributos ou classes. Nesse contexto, este capítulo tem como objetivo apresentar conceitos introdutó- rios fundamentais, assim como métodos de amostragem e apresentação de dados em forma tabular e gráfica. Esses aspectos teóricos contribuirão para que você tenha uma sólida formação na sua área de atuação e poderão ser aplicados em diversas situações do seu dia a dia. Raciocínio analítico e Quantitativo 12 1.1 Aspectos Introdutórios da Estatística Segundo Tiboni (2010), a Estatística é a ciência de coletar, organizar e inter- pretar fatos, que chamamos de dados. A todo momento, no cotidiano, estamos diante de uma grande infinidade deles: Da mídia (jornais, televisão, internet, rádio), por exemplo, recebemos: • informações sobre a venda de carros nacionais e importados; • o índice de popularidade do presidente nas últimas pesquisas de opinião; • os valores de indicadores médios do mercado financeiro; • dados que apontam para a superioridade de um produto que está sendo anunciado. Em uma linguagem simples, o objetivo da Estatística é obter compreensão a partir de dados. Para conseguirmos isso, frequentemente trabalhamos com um conjunto de números. Por exemplo: calculamos a média, criamos um gráfico de valores ou, até mesmo, reunimos os dados em uma tabela. Todavia, é necessário fazer mais que isso, afinal, os dados não são somente números. Ao utilizar a Estatística para a resolução de qualquer problema, temos que nos preocupar em compreender os números obtidos, interpretando o conjunto dessas informações (dados). Não basta apenas nos limitar aos números em si. 1.1.1 Notas Históricas e Importância Na linha do tempo, as ideias e métodos da estatística foram se desenvolvendo aos poucos, à medida que aumentava o interesse da sociedade na coleta e utilização de dados para os seus objetivos próprios. Segundo Novaes e Coutinho (2013), as origens mais remotas da Estatística vinculam-se ao desejo dos governantes de contar o número de habitantes ou medir o valor de terras tributáveis em seus domínios. Alguns autores dizem, inclusive, que o termo provém da palavra Estado. Com o desenvolvimento das ciências físicas, nos séculos XVII e XVIII, cresceu a relevância da mensuração de pesos, distâncias e outras quantidades físicas. Astrônomos e agrimensores, que buscavam a exatidão de suas contas, tiveram que lidar com a variação de suas medidas (variabilidade ou dispersão). Entenderam que diversas medidas podem ser melhores do que uma única, ainda que elas variem entre si. Mas de que maneira é possível combinar diversas observações variáveis? Nesse contexto, os métodos estatísticos foram, então, inventados, com o propósito de mensurar medidas científicas. Raciocínio analítico e Quantitativo 13 A Estatística antigamente era considerada um conjunto de métodos e processos quantitativos, que serviam para estudar e mensurar os fenômenos coletivos. No século XIX, as ciências biológicas e comportamentais também começaram a se basear em dados para responder a suas questões fundamentais. Qual é a relação das alturas de pais e filhos? É possível medir a capacidade mental e o comportamento de um indivíduo da mesma maneira que medimos a altura e seu tempo de reação? A Estatística se tornou uma importante ferramenta para responder essas e outras perguntas. No século XX, as decisões no âmbito econômico e financeiro também se tornaram de caráter quantitativo. Em verdade, ideias de mensuração utilizadas pelo Estado passaram a ser utilizadas para a descrição de economias dos países e para o estudo de carteiras de investimentos. Hoje, essas ideias se juntaram para formar uma “ciência de dados” unificada, a fim de nos ajudar na tomada de decisão em diversas pesquisas, principalmente em pesquisas de marketing. O desenvolvimento da Estatística ao longo do tempo © F ab ri CO - Estado - Negócios voltados para o Estado - Ciências físicas - Informações diversas - Pacotes estatísticos - Decisões: �nanceiras, econômicas e empresariais Início SéculosXVII e XVIII Atualidade 1.1.2 A Importância da Estatística no Meio Empresarial e o Processo Decisório Atualmente, a concorrência acirrada faz com que as organizações recorram a ferramentas quantitativas para a obtenção de dados que possibilitem a tomada de decisões gerenciais com confiabilidade. Segundo Moore (2006), com relação ao processo de tomada de decisão a nível gerencial, pode-se enumerar de forma bastante simples as características principais do processo decisório, que têm importância na conceituação de racionalidade da ação gerencial. São elas: sequencialidade, complexidade, subjetividade e a existência de regras institucionais. A sequencialidade diz respeito à sequência de passos que temos Raciocínio analítico e Quantitativo 14 que dar para a tomada de decisão, passando pela análise dos sintomas e discussão de resultados; a complexidade reside no fato de que não é uma tarefa simples tomar uma decisão, enquanto a subjetividade nos mostra que os pontos de vista podem variar e até mesmo divergir de pessoas para pessoa; por fim, em cada organização existem regras institucionais que devemos seguir. Todos esses aspectos estão implicados na racionalidade da ação gerencial. Nessa direção, a Estatística surge como um diferencial de mercado, atualmente compreendida como um ramo da Matemática Aplicada que se preocupa com a variabi- lidade e com o impacto desta na tomada de decisão. Desta maneira, podemos visualizar aplicações práticas da Estatística no contexto empresarial, como: • No marketing, leitoras ópticas estão sendo utilizadas para a mensuração de dados, com uma diversidade de aplicações em pesquisas de mercado; • O controle da qualidade é uma importante aplicação da Estatística em empre- sas e indústrias, já que uma série de cartas estatísticas de controle da qualidade são usadas para monitorar a saída de um processo produtivo, com a ideia de di- minuição do número de itens produzidos não conformes; • Na gestão financeira, os gestores financeiros utilizam um leque de informa- ções estatísticas para conduzir suas recomendações de futuros investimentos; • No âmbito econômico, os economistas são comumente solicitados a forne- cer mensurações futuras de índices econômicos ou até mesmo de modelos econométricos. A Estatística hoje é de fundamental importância para a tomada de decisão com confiabilidade no meio empresarial, tornando-se, com o passar do tempo, uma ferra- menta indispensável para o estudo de fenômenos diversos e de problemas cotidianos. 1.1.3 Conceitos Fundamentais Segundo Martins (2010), para a descrição de um estudo em termos estatísticos é necessária a definição de alguns conceitos, que são as células fundamentais de construção de todos os métodos a serem abordados. Estamos falando dos conceitos fundamentais ou definições básicas da Estatística. Raciocínio analítico e Quantitativo 15 Conceitos fundamentais da Estatística © F ab ri CO População Amostra Parâmetro EstimadorDados Elementos Variável Observação Definimos cada um deles como segue: • População: é o conjunto formado pelas medidas que se fazem sobre elementos do universo, ou seja, do todo. • Amostra: é qualquer subconjunto não vazio de uma população. • Parâmetro: é uma característica numérica estabelecida para uma população. • Estimador: é uma característica numérica estabelecida para uma amostra. • Dados: são os fatos e números obtidos, ana- lisados e sumarizados para apresentação e interpretação. • Elementos: são as entes (pessoas, itens, etc) nas quais os dados são coletados. • Variável: é uma característica de interesse para os elementos. • Observação: é o conjunto de medidas coleta- das para um elemento particular. Sendo assim, citamos: • Em um estudo sobre a audiência de um referido programa de TV na grande Rio de Janeiro, a população de interesse é o conjunto de todos os domicílios da região que possuem TV, enquanto a amostra é o conjunto dos domicílios que serão visitados. © M ar zo lin o // Sh ut te rs to ck Raciocínio analítico e Quantitativo 16 • Na caracterização da idade média do cidadão brasileiro, temos que a variável de interesse é a idade e os elementos são os brasileiros. Se o estudo for reali- zado sobre toda a população, a idade média é um parâmetro; se pegarmos um conjunto de brasileiros qualquer, a idade média agora seria um estimador; se consideramos a idade do brasileiro João, que possui 42 anos, esta é uma obser- vação. Observe também que os dados são exatamente os valores das idades dos cidadãos pesquisados. É interessante observarmos que a Estatística por sua vez, está dividida em esta- tística descritiva (ou dedutiva) e estatística inferencial (ou indutiva). A primeira trata em essência da apuração, apresentação, análise e interpretação dos dados obser- vados (descreve as amostras ou a população), enquanto que a segunda é um método que parte do particular para o geral, ou seja, do processo pelo qual são feitas generali- zações para a população, a partir da amostra. 1.1.4 Etapas de uma pesquisa De acordo com Crespo (2009), o planejamento é o principal fator para a obtenção de sucesso em uma dada pesquisa. Para tal, deve-se levar em consideração algumas etapas básicas ao se planejar uma pesquisa. A sequencialidade de tais etapas não são únicas, dentre elas citamos as descritas na figura a seguir. Etapas básicas para o planejamento de uma pesquisa Descrever o objetivo Caracterizar população De�nir dados a serem coletados De�nir métodos de metidas De�nir unidade de amostragem Escolher tipo de amostragem Fazer veri�cação preliminar Analisar os dados coletados CRESPO, 2009. (Adaptado). © F ab ri CO Raciocínio analítico e Quantitativo 17 Podemos descrever cada uma das etapas como segue: • Descrição do objetivo: Quais os objetivos da pesquisa? Esses objetivos devem estar bem definidos, porque é o caminho diretor para sua boa execução. • População: Qual população a ser estudada? A população a ser estudada deve estar claramente definida, com identificação correta dos seus elementos, a fim de que a amostra coletada represente fielmente os dados populacionais. • Dados a serem coletados: Quais os dados a serem trabalhados? Quando cole- tamos as informações, é importante averiguar se elas realmente estão casadas com os objetivos da pesquisa. • Métodos de medidas: Antecipando as informações, é necessário e importan- te que a metodologia de coleta seja coerente e estruturada. Deve-se verificar se os dados serão coletados por meio de formulários, por declarativas de en- trevistados, por telefone, por respostas a um questionário estruturado etc. Seja qual for o método escolhido, existe a necessidade de um bom treinamen- to de toda a equipe de pesquisa. Para questionários, é necessário validá-los previamente. • Unidade de amostragem: Se a pesquisa for feita via levantamento por amos- tragem, deve-se definir qual é a unidade de amostragem, que pode ser: um indivíduo, um grupo de pessoas, uma família, uma empresa, um item, um al- queire etc. • Escolha do tipo de amostragem: A partir do tipo da pesquisa e população, de- vemos escolher qual a técnica de amostragem que dará origem à amostra. • Verificação preliminar: Em qualquer pesquisa é interessante termos uma veri- ficação prévia, ou seja, é necessário averiguarmos a eficiência da metodologia a ser empregada. Testamos em uma pequena parcela da população se a técnica a ser utilizada para a coleta é a mais coerente, se a forma proposta para registro dos dados não deve ser alterada e se a equipe da pesquisa está bem treinada. • Análise dos dados coletados: Obtidos os resultados, eles devem ser analisados em termos das técnicas estatísticas, para termos confiabilidade na tomada de decisão. Pode-se representá-los em gráficos e tabelas, utilizar medidas descriti- vas, realizar inferências ou testes específicos. Na sequência, é preciso descrever um relatório completo com as informações importantes para as respostas dos objetivos projetados anteriormente. Além disso, não se deve esquecer da biblio- grafia e anexos, como cópia de questionários aplicados etc. Raciocínio analítico e Quantitativo 18 Agora que visualizamos as informações iniciais da aplicabilidade da Estatística, conceitos fundamentais e etapa de desenvolvimento de uma pesquisa, nosso inte- resse, na sequência, é a descrição dos processos estatísticos de abordagem e das prin- cipais técnicas de amostragem. 1.2 Processos estatísticos de abordagem e técnicas de amostragem Segundo Martins (2010), os processos estatísticos de abordagem, comumente chamados de processos estatísticos de pesquisa, dividem-se em dois tipos: o levanta- mento por recenseamento e o levantamento por amostragem. Assim sendo, quando são coletadas informações de toda a população, dizemos que foi feito um levantamento por recenseamento. Em particular, chamamos de censo ao conjunto de dados mensurados por meio do recenseamento, ou seja, quando o estudo é realizado tomando como base toda a população. Levantamento por amostragem © A rt hi m ed es / / S hu tt er st oc k Contrariamente, quando coletamos as informações apenas de uma parcela da população, dizemos que realizamos um levantamento por amostragem ou amos- tragem. Aqui, os dados obtidos também recebem o nome de amostra. Raciocínio analítico e Quantitativo 19 1.2.1 Levantamento por recenseamento e levantamento por amostragem Uma questão recorrente é como escolher o processo estatístico de abordagem para determinado estudo. Num primeiro momento, poderíamos considerar que, na maior parte dos casos, é interessante o estudo com relação a uma amostra, e não a uma população, ou seja, o levantamento por amostragem. Porém, podemos ter, sim, situações muito peculiares, em que é mais interessante a utilização do levantamento por recenseamento. Dessa maneira, temos, independentemente da escolha, vantagens e desvantagens. O quadro que segue nos mostra as vantagens da amostragem sobre o recenseamento. Vantagens da amostragem sobre o recenseamento Vantagem Descrição Tempo Quando utilizamos amostragem, em vez de recenseamento, gastamos um tempo menor. Custo O custo da pesquisa é menor quando se realiza uma amostragem. Aprofundamento A pesquisa amostral pode ser mais aprofundada. Erros Com um número menor de elementos, o número de pesquisadores deve ser menor, logo, temos menos erros. Testes destrutivos Quando a pesquisa envolve testes destrutivos, não é possível realizar o recenseamento (mensurar durabilidade de lâmpadas, por exemplo). Por outro lado, as vantagens do recenseamento sobre a amostragem estão demonstradas no quadro a seguir. Vantagens do recenseamento sobre a amostragem Vantagem Descrição Precisão Completa Se a pesquisa busca precisão completa do estudo, então não se pode fazer um levantamento por amostragem. População Pequena Quando a população é pequena, não é interessante trabalhar com a amostragem.Vejamos na sequência a diferenciação entre amostragem probabilística e não probabilística, assim como seus principais tipos, que são importantes para o levanta- mento dos dados. Vamos lá? Raciocínio analítico e Quantitativo 20 1.2.2 Amostragem probabilística e não probabilística Definindo-se a população de estudo e averiguando-se que o processo estatís- tico de abordagem a ser utilizado é o levantamento por amostragem, é prudente esta- belecer com coerência e clareza qual a técnica de amostragem a ser utilizada, ou seja, o procedimento que será adotado para escolher os elementos que irão compor a amostra. De acordo com Martins (2010), especificamente falando nesse contexto, existem dois tipos de amostragem: amostragem probabilística e amostragem não probabilística. Dessa maneira, temos que: • Amostragem probabilística: é caracterizada se todos os elementos da popu- lação tiverem probabilidade conhecida e não nula de pertencer à amostra. Às vezes chamada de aleatória ou randômica. Exemplificando, a escolha aleató- ria de indivíduos no centro da cidade para participarem de uma pesquisa é uma amostragem probabilística. Salientamos ainda que somente a amostragem probabilística nos permite calcular o erro amostral. • Amostragem não probabilística: é usada quando a chance de ocorrência e de- terminando elemento da população na amostra é um número desconhecido ou igual a zero. Às vezes chamada de não aleatória ou por escolha justificada. Ela é subjetiva, já que pode se basear nas decisões pessoais do pesquisador. Seus principais tipos são a amostragem acidental, amostragem intencional ou por conveniência, e amostragem por quotas. Exemplificando: em uma pesquisa sobre preferência de determinada marca de shampoo, o pesquisa- dor dirige-se a um grande salão de beleza e entrevista as pessoas presentes no recinto. Sempre que possível, para a obtenção de uma amostra que represente fielmente a população, deve-se escolher a amostragem probabilística. 1.2.3 Principais tipos de amostragem probabilística De acordo com Martins (2010), é possível usarmos combinações de várias técnicas de amostragem probabilística, entretanto, é mais comum usar as técnicas isentas de misturas. Entre elas, os principais tipos de amostragem probabilística são as apresentadas no quadro a seguir. RACIOCÍNIO ANALÍTICO E QUANTITATIVO 21 Principais Tipos de Amostragem Probabilística © F ab ri CO Aleatória Simples Sistemática Estrati�cada Conglomerados Vejamos a descrição detalhada e exemplos de cada uma delas a seguir: • Amostragem Casual Simples (ou Amostragem Aleatória simples): consis- te na enumeração dos elementos de uma população (N elementos) e escolha de n elementos dessa sequência, que comporão a amostra, por meio de um dispositivo aleatório qualquer, comumente um sorteio ou tabela de números aleatórios. Cada elemento da população, tem como chance de ocorrência na amostra a fração n N , que recebe o nome de fração de amostragem. Citamos como situações envolvendo a amostragem aleatória simples: • Sorteio aleatório de colaboradores de uma empresa no ramo automobilístico. • Computadores gerando números aleatórios. • Entrevistar indivíduos no centro de São Paulo para uma dada pesquisa de ca- racterização do perfil do consumidor. • Amostragem Sistemática: é uma particularidade da amostragem aleatória. É comumente usada quando os elementos da população se apresentam (em cer- ta ordem) e a retirada dos elementos da amostra é feita por meio de períodos. Sendo assim, é sorteado o 1° elemento (ordem k) e, a seguir, os demais são re- tirados numa progressão aritmética de razão r, a partir do 1° elemento escolhi- do, até gerarmos o montante de elementos da amostra. Citamos como exemplos de amostragem sistemática: • Uma gravadora seleciona cada vigésimo CD de sua linha de produção para um teste rigoroso de qualidade. • Se uma grande empresa quisesse fazer uma pesquisa sobre seus 50.000 cola- boradores, poderia partir de uma relação ordenada do quadro de funcionários e selecionar cada 50º colaborador, obtendo uma amostra de 500 elementos. Raciocínio analítico e Quantitativo 22 As amostras sistemáticas são muito utilizadas, mas exigem especial preocupação com o sistema de seleção. • Amostragem Estratificada: dividimos a população em pelo menos duas par- tes, ou subpopulações ou estratos, que compartilham das mesmas carac- terísticas (como por exemplo, sexo) e, em seguida, realizamos uma amostra aleatória em cada estrato, formando assim, uma amostra com a junção dos elementos selecionados aleatoriamente em cada estrato. Desta forma, podemos citar como exemplos de amostragem estratificada: • Dividir o curso de Administração de uma faculdade ou universidade por perío- dos: cada período seria um estrato. • Dividir o quadro de colaboradores de uma indústria de acordo com o turno de trabalho (manhã, tarde e noite). Assim, cada turno seria um estrato. Se os vários estratos têm tamanhos amostrais que refletem a população como um todo, dizemos que a amostragem estratificada é proporcional. • Amostragem por Conglomerados (ou clusters): iniciamos com a divisão da população em pelo menos duas seções (ou conglomerados). A seguir, sele- cionamos aleatoriamente alguns desses conglomerados e, por fim, tomamos todos os elementos dos conglomerados escolhidos. Esse tipo de amostragem é muito empregado pelo governo e por organizações particulares de pesquisa. Citamos como casos envolvendo a amostragem por conglomerados: • Em uma dada pesquisa pré-eleitoral para governador, escolhemos aleatoria- mente dez zonas eleitorais e pesquisamos todos os elementos de cada uma das zonas escolhidas de modo aleatório. • Um psicólogo de uma multinacional faz uma pesquisa sobre todos os colabora- dores de cada uma das 20 turmas produtivas selecionadas aleatoriamente. Depois de identificarmos e nos familiarizarmos com os processos estatísticos de abordagem e suas principais técnicas de amostragem, vamos descrever agora as variá- veis e dados, além de identificar os possíveis erros que podem ser cometidos em um dado estudo. Raciocínio analítico e Quantitativo 23 1.3 Variáveis, dados e erros Outro aspecto importante que o pesquisador deve ter em mente é a correta caracterização do nível de mensuração das variáveis a serem analisadas, que irão levar diretamente aos tipos de dados. Salienta-se que, de acordo com o tipo de mensuração, podemos realizar ou não operações aritméticas, assim como agrupar em classes ou não. Além disso, o tipo de erro associado ao estudo também deve ser identificado e reconhecido de modo preciso. Para que você compreenda o assunto, nesta seção vamos estudar a descrição das variáveis, dados e tipos de erros. 1.3.1 Tipos de variáveis Com relação aos tipos de variáveis, podemos dividi-las em dois grandes grupos, que são: as quantitativas e as qualitativas. As variáveis quantitativas são aquelas que apresentam como possíveis resultados números oriundos de uma contagem ou mensuração. Citamos: salário, idade, número de filhos, estatura, massa corporal, diâmetro de parafusos, comprimento de peças etc. Contrariamente, as variáveis qualitativas apresentam como possíveis resultados uma qualidade (ou atributo ou classe) do indivíduo ou item estudado. Aqui, podemos incluir: sexo, estado civil, grau de instrução, peça produzida (defeituosa ou não defei- tuosa), profissão (contador, administrador, engenheiro, professor etc). Além disso, segundo Martins (2010), cada um desses dois grupos se subdividem em outros dois grupos, conforme observamos a seguir. © F ab ri CO Variáveisquantitativas Variáveisqualitativas Discretas Nominais Contínuas Ordinais Raciocínio analítico e Quantitativo 24 O quadro a seguir demonstra as especificidades de cada um dos subgrupos e traz exemplos. Caracterização dos tipos de variáveis Variável Descrição Q ua nt it at iv a Discreta Os possíveis valores formam um conjunto finito ou enumerável de números(contagem). Por exemplo: idade, número de filhos, salário, número de defeitos etc. Contínua Os possíveis valores pertencem a um intervalo de números reais. Aqui citamos: estatura, massa corporal de um indivíduo, diâmetro de um parafuso etc. Q ua lit at iv a Nominal Não existe nenhuma ordenação nos possíveis resultados. Por exemplo, sexo (masculino e feminino) e conformidade de peças produzidas (defeituosa e não defeituosa). Ordinal Existe uma ordem nos seus resultados. Assim, citamos: grau de instrução (ensino fundamental, médio e superior) e classe social (alta, média e baixa). Agora que entendemos a classificação das variáveis, vamos descrever os tipos de dados que elas originam. 1.3.2 Tipos de dados Vimos que os dados são as informações de determinado estudo, que podem ser numéricas ou não. Ressalta-se que os tipos de dados surgem de forma natural do tipo de variável mensurada. Portanto, temos quatro tipos de dados, que são: • Dados Discretos: surgem na contagem do número de itens com determinada característica (provém de uma variável discreta). Por exemplo, número diário de clientes de uma agência bancária, o número de defeitos numa motocicleta recém lançada, o número de acidentes em uma fábrica, número de filhos etc. • Dados Contínuos: oriundos das variáveis contínuas que podem assumir virtual- mente qualquer valor numa classe intervalar de valores. Por exemplo: a quanti- dade de soja comercializada em uma cooperativa diariamente (variável: peso), a quantidade de gasolina vendida por hora em um posto de combustível (variá- vel: volume) etc. • Dados Nominais: aparecem a partir da mensuração de variáveis nominais de- finidas por categorias. Por exemplo: (masculino ou feminino), cor dos olhos (azuis, castanhos, verdes), campo de estudo (matemática, administração) etc. Raciocínio analítico e Quantitativo 25 • Dados Ordinais (ou por Postos): nascem diretamente de variáveis que se re- ferem tipicamente a avaliações subjetivas, quando os itens são dispostos se- gundo preferência ou desempenho. Por exemplo, nos concursos de chefes de cozinha e de estética, os elementos se classificam como primeiro, segundo, terceiro etc. Outro ponto importante a que devemos estar atentos é que uma mesma popu- lação pode nos levar a distintos tipos de dados, conforme averiguamos a seguir. Tipos de dados Populações Discreto Contínuo Nominal Ordinal Alunos do Ensino Médio Número da Classe Idades / Massa Corporal Masculino / Feminino 2° Grau Automóveis Número de defeitos por automóvel Alcance em Km/h Cores Limpeza Venda de mpreen- dimentos Imobiliários Número de Ofertas Valor (R$) Acima do Preço Despesa Alta A seguir, vamos descrever nas entrelinhas os dois tipos de erros que podem ser cometidos em estudos envolvendo a Estatística. 1.3.3 Tipos de Erros Com relação aos erros que podemos cometer quando realizamos um estudo sob o ponto de vista da Estatística, de acordo com Martins (2010), temos dois tipos, que são o Erro Amostral e o Erro Não Amostral. Em qualquer pesquisa, seja ela mais simples ou mais complexa, podem aparecer os erros amostrais e não amostrais. Tecnicamente falando, o erro amostral pode ser visto como a diferença entre o valor estimado e o verdadeiro valor (resultantes de flutuações amostrais aleatórias), enquanto que o erro não amostral se origina a partir do momento em que tivemos falhas na coleta, no registro ou até mesmo nas análises dos dados (não resultantes de flutuações amostrais simples). Os erros não amostrais podem aparecer em qualquer passo do levantamento amostral e, se não forem observados e interpretados, provocar alterações que podem comprometer e muito o plano amostral. Já conhecemos e classificamos as variáveis, os dados e reconhecemos os tipos de erros possíveis em uma abordagem estatística. Chegou a hora de aprendermos as primeiras ferramentas voltadas para uma melhor organização de dados, que são as representações em tabelas e gráficos. Raciocínio analítico e Quantitativo 26 1.4 Representação tabular e representação gráfica de dados Com certeza você já deve ter notado que jornais impressos ou telejornais, revistas, artigos científicos ou outras fontes de notícias normalmente apresentam os dados na forma de disposição tabular ou na forma da representação gráfica. Você acha que existe um motivo em especial para isso? Por quê seria? A resposta é que sim, temos uma razão em especial. A representação dos dados em tabelas e gráficos faz com que possamos tirar conclusões de uma forma mais rápida, ou seja, permite uma melhor organização e, consequentemente, uma melhor apresentação dos dados. Assim, quando falamos na organização, sumarização e descrição dos dados, as mesmas são feitas tendo como referência as tabelas e os gráficos. Antes de anali- sarmos tais ferramentas, temos associadas à forma de apresentação dos dados duas definições básicas, que são: dados brutos e rol. • Dados Brutos: trata-se de uma sequência de dados numéricos não organiza- dos, obtidos da observação de um fenômeno coletivo (são os dados na sua for- ma bruta). Por exemplo, as idades de três pessoas: Bruno tem 42 anos, Daiana tem 28 anos e Cauã tem 20 anos. Assim, estaríamos descrevendo os dados da forma natural que os coletamos, sem uma dada ordem. • Rol: é a sequência ordenada dos dados brutos. Logo, para os dados brutos des- critos anteriormente, teríamos como rol 20, 28, 42. A seguir, vamos descrever o procedimento de criação de tabelas envolvendo alguns tipos de frequências em conjunto com os intervalos de classes. Vamos lá? 1.4.1 Tabelas de distribuição de frequências Salientamos que uma distribuição de frequências é um procedimento da Estatística pertinente para a apresentação de grandes massas de dados, numa forma que torna mais clara a tendência dos dados em questão. Uma distribuição de frequência é um agrupamento de dados em classes, exibindo o número ou percentagem de observações em cada classe. Pode ser apresentada sob a forma gráfica ou tabular (LEVINE, 2012). Quando este agrupamento é feito em disposição retangular ou tabelas, aparece a nomenclatura tabela de distribuição de frequências. Para ilustrarmos como proceder na organização de um conjunto de dados em uma tabela de distribuição de frequên- cias, vamos considerar uma situação específica: construir a tabela de distribuição de frequências para os tempos de serviço (em meses) de uma amostra de 50 colabora- dores da empresa fictícia AFA Logística. Raciocínio analítico e Quantitativo 27 Tempos de serviço ordenados dos funcionários da AFA Logística 18 – 20 – 20 – 21 – 22 – 24 – 25 – 25 – 26 – 27 – 29 – 29 – 30– 30 – 31 – 31 – 32 – 33 – 34 – 35 – 36 – 36 – 37 – 37– 37 – 37 – 38 – 38 – 38 – 40 – 41 – 43 – 44 – 44 – 45– 45 – 45 – 46 – 47 – 48 – 49 – 50 – 51 – 53 – 54 – 54 – 56 – 58 – 62 – 65 De acordo com Martins (2010), a construção de uma tabela de distribuição de frequências engloba três passos fundamentais, que são: construção do rol e cálculo da amplitude total dos dados, determinação do número de classes e descrição do tamanho dos intervalos de classe. Vejamos como utilizar esses passos na situação que estamos analisando: 1° Passo: Construção do rol e Cálculo da Amplitude Total (R): Inicialmente, observe que os dados da nossa situação já estão organizados em ordem crescente. Além disso, saiba que a amplitude total (R) é dada por: R = Maior medida – Menor medida Logo: R = 65 – 18 = 47 A amplitude total da nossa amostra, 47, será utilizada diretamente para a descrição da dimensão do intervalo das nossas classes. 2° Passo: Como a ideia é de agrupamento em classes, é necessário dizermos quantas classes e qual a dimensão do intervalo de classes da nossa tabela. Denotemos por (K) o número de classes e por (h) o tamanho do intervalo de classes. Pode-se utilizar intervalos com tamanhos iguais ou desiguais. Comumente, esco- lhem-se tamanhos iguais, sendo que existem alguns critérios para a determinação do númerode classes, desde expressões específicas até regras empíricas. Aqui, esta- remos utilizando a Fórmula de Sturges, que é descrita por: K ≅ 1 + 3,33 . log n Onde: n = número de elementos que se deseja representar log n: denota o logaritmo decimal de n RACIOCÍNIO ANALÍTICO E QUANTITATIVO 28 Desta maneira, para os nossos propósitos, escrevemos: K ≅ 1 + 3,33.log 50 = 1 + 3,33 . (1,698970004) = 6,657570114 ≅ 7 3° Passo: Quanto ao tamanho dos intervalos (iguais) das classes h: h ≅ R ÷ K Logo, temos que: h ≅ 47 ÷ 7 = 6,714285714 ≅ 7 Tanto para o valor do número de classes quanto para o tamanho dos intervalos, sempre arre- dondar para o primeiro número inteiro logo acima. Quanto aos limites das classes, que são os valores que limitam as classes ou extremos das classes, de acordo com Martins (2010), usa-se: Classe: 18 |---- 25 Interpretamos que nessa classe encontram-se todos os elementos que são maiores ou iguais a 18 e estritamente menores do que 25 (não considerando o 25). Observe que iniciamos a descrição das classes a partir do menor valor do conjunto somando 7 (amplitude da classe) e, consequentemente, utilizando-se do mesmo racio- cínio para todas as classes. Chamamos de Fi a frequência absoluta de elementos da classe i, ou seja, a quan- tidade de elementos que pertencem à classe i. Note que a frequência absoluta de cada classe representa o número de valores que temos em cada classe. Similarmente, a frequência relativa da classe i, denotada por Fi , é definida pelas expressões Fi n fi= ou Fi N fi= , onde: n: é o número de elementos da amostra (para amostragem) N: é o número de elementos da população (para recenseamento) Observe que a frequência relativa nada mais é do que a divisão da frequência absoluta pelo número total de casos que temos, independentemente de termos uma amostra ou população. Como a nossa variável de estudo deve ser agrupada em classes, às vezes é inte- ressante a caracterização de seus pontos médios, os quais designaremos por xi, que nada mais é do que a soma entre os limites da classe dividido por 2. Os pontos médios, por exemplo, podem ser utilizados na caracterização da média quando os dados são representados em classes. Também pode ser importante os valores das frequências absolutas acumuladas Fac e das frequências relativas acumuladas fac. Acumulada no sentido de irmos somando os valores das anteriores. Raciocínio analítico e Quantitativo 29 Observe então que, de acordo com os nossos dados referentes aos tempos de serviço dos colaboradores da AFA Logística, a nossa primeira classe incluirá todos os tempos maiores ou iguais a 18 meses e menores do que 25 meses, pois os limites da 1° classe são 18 e 25, já que 25 = 18 + 7. Assim, montamos a tabela da distribuição de frequências dos tempos de serviço da AFA Logística como segue: Distribuição de frequências dos 50 colaboradores da AFA Logística © F ab ri CO Classes 1 2 3 4 5 6 7 Somas 6 10 13 8 6 5 2 50 12 20 26 16 12 10 4 100 6 16 29 37 43 48 50 0.12 0.32 0.58 0.74 0.86 0.96 1.00 12 32 58 74 86 96 100 21.5 28.5 35.5 42.5 49.5 56.5 63.5 6/50=0.12 0.20 0.26 0.16 0.12 0.10 0.04 1 18 |---- 25 25 |---- 32 32 |---- 39 39 |---- 46 46 |---- 53 53 |---- 60 60 |---- 67 Intervalos de Classes Ft ft Fac fac %ac% xt Podemos concluir, a partir da tabela anterior, que: • A grande maioria dos colaboradores da AFA Logística têm tempo de serviço entre 32 e 38 meses (observe o maior valor na coluna fi); • Somente 4% dos colaboradores possuem tempos de serviço iguais ou superio- res a 60 meses, sendo 65 meses o maior tempo de serviço do grupo; • 58% dos colaboradores da amostra têm tempos de serviço inferiores a 38 me- ses, sendo 18 meses o menor tempo de serviço do grupo. Os gráficos e tabelas são importantes para uma representação mais organizada e estruturada das informações obtidas a partir de determinado estudo, permitindo assim conclusões mais rápidas e relevantes sobre o conjunto de dados pesquisados. É por esse motivo que recorrentemente vemos em revistas e outras publicações a apre- sentação dos dados na forma gráfica ou tabular. A seguir, vamos aprender a apre- sentar os dados em forma de gráficos. Raciocínio analítico e Quantitativo 30 1.4.2 Principais tipos de gráficos Como já dizia um velho ditado chinês: “O gráfico ou figura consegue transmitir a ideia de mil palavras”. Já sabemos que os gráficos representam uma das mais simples formas de transmissão das informações contidas em diferentes conjuntos de dados, além de permitirem a compreensão de maneira simples e eficiente de aspectos e rela- ções numéricas. Quando falamos sobre a representação de dados na forma gráfica, primeira- mente ressaltamos que existe um grande quantidade de tipos de gráficos, que, obvia- mente, serão utilizados de acordo com o estudo em questão. Temos gráficos que exprimem simplesmente a tendência dos dados, outros que descrevem os valores que fogem da realidade do conjunto ou até mesmo os que reproduzem informações importantes a respeito da quantidade de itens produzidos com defeito em uma linha de produção, por exemplo, e que, por consequência, esclarece-nos com relação ao controle estatístico do processo em questão. Dentre os diversos tipos de gráficos existentes nos procedimentos (métodos e técnicas da Estatística), citamos alguns a seguir. Modelos de gráficos de Estatística © F ab ri CO Histograma Grá�co de barras Grá�co de pizza Grá�co de dispersão Boxplot Grá�cos de linha Descrevemos alguns deles, como segue: • Gráfico de barras: é uma disposição gráfica formada por barras retangulares cujo comprimento depende dos valores que ele representa. Em outras pala- vras, é uma representação que se utiliza de barras na vertical ou na horizontal para a representação dos dados. Comumente, este tipo de gráfico é conhecido como gráfico de colunas. Raciocínio analítico e Quantitativo 31 • Gráfico de pizza: é uma disposição gráfica ou um diagrama na forma de círculo em que descrevemos os valores de cada categoria estatística. Comumente ele é chamado de gráfico de setores ou gráfico circular. • Gráfico de Linhas: é uma disposição gráfica na qual exibimos as informações por meio de vários pontos, denominados de marcadores, que ligamos por seg- mentos de linhas. © P la n- B / / S hu tt er st oc k © k ol op ac h / / S hu tt er st oc k © b ill da yo ne / / S hu tt er st oc k © K m an nn / / S hu tt er st oc k © R am cr ea ti v / / S hu tt er st oc k © N _B el on og ov / / S hu tt er st oc k Raciocínio analítico e Quantitativo 32 • Histograma: é uma disposição gráfica de barras que permite a visualização da distribuição de frequências de um conjunto de dados, isto é, permite visualizar a frequência de ocorrência dos valores observados. • Gráfico de Dispersão: é um gráfico no qual cada ponto representa um par orde- nado de valores, permitindo visualizar a relação entre duas variáveis em estudo. 5,005,00 4,50 4,00 3,50 3,00 2,50 2,00 10/09 17/09 24/09 01/10 05/10 LIC 5 10 15 200 295,8 295,6 295,4 295,2 295 294,8 294,6 294,4 294,2 294 ITENS DA AMOSTRA RE SU LT A D O S O BT ID O S GRÁFICO DE DISPERSÃO DA AMOSTRA Amostra 1 LSC LM • Boxplot: também conhecido como gráfico de caixa, é uma ferramenta gráfica ex- ploratória de dados. Utiliza basicamente um retângulo e dois segmentos de reta, sendo possível a verificação da posição central do conjunto ordenado dos dados. 100.000 90.000 80.000 70.000 60.000 50.000 40.000 30.000 20.000 10.000 1 2 3 4 5 6 A B C 50 45 40 35 30 25 20 15 10 5 0 © Fa br iC O © Fa br iC O © Fa br iC O © Fa br iC O © m ar ek ul ia sz / / S hu tt er st oc k © H ilc h / / S hu tt er st oc k Raciocínio analítico e Quantitativo 33 É pertinente comentarmos que nem sempre,para criarmos um gráfico de modo algébrico, teremos uma tarefa fácil e cômoda. Por isso, é interessante a utilização da implementação numérica com o uso de alguns programas computacionais. Temos várias opções de softwares voltados para a construção de gráficos diversos. Entre eles, citamos: SPSS, MInitab, R e Excel. No que se refere especificamente ao SPSS, de acordo com Moore (2006), trata-se de um software aplicativo (programa de compu- tador) do tipo científico. Originalmente, o nome era acrónimo de Statistical Package for the Social Sciences, “Pacote Estatístico para as Ciências Sociais”. Patenteado pela IBM, é um dos programas computacio- nais mais utilizados em todo mundo, conhecido em mais de 100 países. Pode-se observar, então, que a habilidade na resolução de problemas, seja analiticamente ou quantitativamente, pode estar ligada ao domínio de ferramentas quantitativas. Desta forma, surge a Estatística, com as suas técnicas e métodos para estudo dos fenômenos coletivos. Ressalta-se que a procura por profissionais que possuam uma formação mais sólida e dinâmica cresce cada vez mais por conta da acir- rada concorrência no mundo globalizado. O conhecimento de Estatística é atualmente indispensável para a obtenção do sucesso organizacional, pois permite tomar decisão com confiabilidade e, por conse- guinte, a maximização dos resultados. Especificamente falando, fica evidente, então, que a interpretação de um conjunto de dados se torna uma etapa indispensável. É importante lembrar que um estudo qualquer em Estatística está fundamentado nos conceitos funda- mentais: população, amostra, parâmetro, estimador, variável, elementos, observação e dados, sendo que o estudo em si pode ser realizado sobre a população (recenseamento) ou amostra (amostragem). Quando se realiza a amostragem, deve-se ter o cuidado de que o subconjunto escolhido para estudo (amostra), que tende a representar fielmente a população, tenha sido selecionado de forma coerente e estruturada, por meio dos tipos de amos- tragem probabilística, que são a aleatória simples, sistemática, por conglomerados ou estratificada. Deve ficar claro que a Estatística é de fundamental importância para a o plane- jamento, desenvolvimento e acompanhamento de produtos, serviços, projetos e processos diversos. Raciocínio analítico e Quantitativo 34 Referências CRESPO, A. A. Estatística Fácil. 19. ed. São Paulo: Saraiva, 2009. LEVINE, D. M.; BERENSON, M. L.; Stephan, D. Estatística: teoria e aplicações. 6. ed. Rio de Janeiro: LTC, 2012. MARTINS, Gilberto de Andrade. Estatística geral e aplicada. 03 ed. Rio de Janeiro: Atlas, 2010. MOORE, David. A Prática da Estatística Empresarial: como usar dados para tomar deci- sões. Rio de Janeiro: LTC Editora, 2006. NOVAES, D. V.; COUTINHO, C. de Q. e S. Estatística para Educação Profissional e Tecnológica. 02 ed. São Paulo: Atlas, 2013. TIBONI, C. G. R. Estatística Básica: para os cursos de administração, ciências contábeis, tecnológicos e de gestão. São Paulo: Atlas, 2010. 2 Medidas Descritivas A Estatística Descritiva trata de descrever e organizar os dados mensurados, para que seja possível visualizar as informação mais importantes ao analisar o material na etapa que conceituamos como Estatística Indutiva. Em outras palavras, as medidas descritivas que constituem a Estatística Descritiva servem como alicerce para o desenvolvimento de metodologias de reso- lução de problemas na Estatística Indutiva, que interpreta e analisa os dados. Sabe-se, por exemplo, que as tabelas de distribuição de frequências permitem estabelecer o padrão de variabilidade de uma dada variável ou conjunto de dados. Todavia, trabalhar com distribuição de frequências pode ser complicado, o que torna necessária a caracterização de medidas descritivas de dados. As tabelas de distribuição de frequência são tabelas que trazem as frequências absolutas e relativas, apresentando os dados no formato de faixa de valores ou intervalos de classes. A Estatística Descritiva tem como ferramentas um leque de medidas descritivas, chamadas de medidas de centralidade, de dispersão, separatrizes, de assimetria e de achatamento. As medidas de centralidade e de dispersão são, sem dúvida, as mais importantes. São ferramentas primordiais na resolução de problemas práticos, desde a descrição de indicadores financeiros até a caracterização de medidas envolvendo o controle de processos que visam mensurar a variabilidade em sistemas produtivos. As medidas de assimetria, por outro lado, descrevem o desvio de uma distri- buição de uma curva padrão, enquanto que as medidas de curtose mensuram o grau de achatamento das distribuições estudadas. Nesse contexto, este capítulo tem como objetivo apresentar as medidas descri- tivas, desde as de centralidade até as de achatamento, assim como suas principais propriedades e especificidades. Discutiremos aspectos teóricos que, sem dúvida, contribuirão para a uma sólida formação na área de atuação que você escolheu e que poderão ser aplicados a diversas situações do seu cotidiano. Raciocínio analítico e Quantitativo 36 2.1 Medidas de Centralidade As medidas de centralidade, comumente conhecidas como medidas de posição ou medidas de tendência central ou promédias, são medidas de tipificação de um conjunto de dados, ou seja, que descrevem o valor mais típico daquele conjunto. Elas podem ser visualizadas de diversas maneiras distintas. A opção mais adequada depende do que se deseja descrever em cada estudo estatístico. As medidas de centralidade servem para localizar a distribuição de frequências sobre o eixo de variação da variável em estudo. As mais relevantes medidas de centralidade são a média aritmética, a mediana e a moda, cada uma com as suas propriedades específicas de definição e aplicação. As médias geométrica, harmônica, ponderada, quadrática, cúbica e biquadrática são também medidas de tendência central, porém, com utilização limitada na descrição formal de dados. A seguir, vamos apresentar as médias aritmética, geométrica e ponderada. Você já deve estar familiarizado com a média aritmética, que aparece frequentemente no dia a dia. 2.1.1 Média Aritmética, Média Geométrica e Média Ponderada Quando falamos da descrição de valores centrais para um conjunto de dados, por conta de propriedades matemáticas importantes, a média aritmética, a média geomé- trica e a média ponderada são as mais utilizadas. Vamos descrevê-las a seguir. A média aritmética é a mais comum das medidas de centro (MARTINS, 2010). Ela pode ser entendida como a divisão entre a soma dos valores do conjunto e o número total de valores do conjunto. Utilizamos a média aritmética para calcular a média de uma população, que chamamos de média populacional, ou a média de uma amostra, que conhecemos por média amostral. A média populacional considera todas as observações, o seja, o total dos elementos de um universo, o todo. Já a média amostral considera parte das obser- vações de uma população, ou seja, uma parte dos elementos que compõem o todo. Quando se trata de calcular a média de uma população (com n observações x1, x2, ..., xn), a média aritmética é usualmente representada pela letra grega μ e chamada média populacional. Já para calcular uma amostra (com n observações x1, x2, ..., xn), falamos em média amostral e denotamos por x. Raciocínio analítico e Quantitativo 37 Simbolicamente, escrevemos: μ = ∑ i = 1 n xi n (média populacional) E x = ∑ i = 1 n xi n (média amostral) Vejamos a seguir dois casos ilustrativos de aplicabilidade das médias aritméticas populacional e amostral. Problema: O gestor responsável por um super- mercado tem interesse em mensurar a movimen- tação de clientes em seu estabelecimento pelo cálculo da média populacional de pessoas que circulam no estabelecimento. Realizou um estudo em determinada semana e registrou o seguinte: 295 pessoas passaram por lá no primeiro dia, 1002 no segundodia, 941 no terceiro dia, 768 no quarto dia e 1283 no quinto dia. Qual é o número médio de clientes (média populacional) que transitaram no estabelecimento durante o período de mensuração? Solução: Para cálculo da média populacional (μ), temos que: μ = ∑ i = 1 n xi n Nos últimos cinco dias (n), transitaram no supermercado um total de: 295 + 1002 + 941 + 768 + 1283 = 4289 pessoas. Portanto: μ = ∑ i = 1 n xi n = 295 + 1002 + 941 + 768 + 1283 5 = 4289 5 = 857,80 Resposta: A média populacional ou número médio de indivíduos que passaram pelo supermercado naqueles cinco dias foi 857,80. © ro bu ar t / / Sh ut te rs to ck Raciocínio analítico e Quantitativo 38 Agora, vamos analisar um problema em que trabalharemos com uma média amostral. Problema: Em uma pesquisa de mercado para a caracterização do perfil de consumidores de refrigerantes em uma dada escola, foram amostradas as idades de seis alunos conforme os valores descritos a seguir: 18, 20, 16, 22, 20, 18 Qual a idade média da amostra de alunos pesquisada? Solução: Neste caso, para calcularmos a idade média devemos encontrar o valor da média dos valores amostrados. Utilizaremos a expressão apresentada anterior- mente para o cálculo de média amostral, ou seja: x = ∑ i = 1 n xi n = 18, 20, 16, 22, 20, 18 6 = 114 6 = 19 anos Resposta: Neste caso, a idade média da amostra de alunos pesquisados é igual a 19 anos. A média geométrica, por sua vez, para n valores x1, x2, ..., xn, é encarada como o produto de todos os valores do conjunto elevado ao inverso do número dos membros, ou seja, ela é a raiz n-ésima do produto de todos eles. Ela é usada para a determinação de taxas médias em ocasiões específicas. Observe que, contrariamente à média aritmética simples, que utiliza a soma dos valores, a média geométrica descreve a centralidade do conjunto de valores usando o produto deles. Ela é denotada por xg. Em símbolos matemáticos, escrevemos: xg = √x1 · x2 · ... · xn Exemplificando: se tivermos um conjunto formado pelos valores 10, 60 e 360, a média geométrica é determinada por xg = √10 · 60 · 360 = √216000 = 60. Vejamos uma situação prática, adaptada de Martins (2010), envolvendo a média geométrica na resolução de um problema de investimento financeiro pessoal. n 3 3 Raciocínio analítico e Quantitativo 39 Problema: Luiza investiu a quantia de R$ 500,00 no fundo de investimento de um banco estatal. Após um ano de aplicação, essa importância resultou em R$ 650,00. Reaplicando novamente essa última quantia, ao final de mais um ano, Luiza tinha um montante de R$ 910,00. Para saber qual é a taxa média de aumento do seu capital, que cálculo Luiza deve fazer? Solução: Aqui temos uma situação típica de utilização da média geométrica, que será nosso instrumento para calcular a taxa média do aumento de capital da Luiza. Vamos determinar, inicialmente, as taxas de aumento de capital, período a período. Vejamos o quadro a seguir. Taxas de aumento de capital a cada período Período Taxa 2003 – 2004 650 500 = 1,3 2004 – 2005 910 650 = 1,4 Assim sendo, a taxa média é igual a: √(1,3) · (1,4) = 1,3491 Resposta: A taxa média de aumento do capital investido por Luiza no período de 2003 a 2005 (dois anos) foi de 34,91%. A média ponderada é um outro tipo de média, utilizada para o cálculo da média de valores que têm pesos diferentes. É muito utilizada em concursos, para o cálculo da nota dos candidatos quando as provas têm pesos distintos. Obtemos a média ponderada por meio do cálculo da razão, cujo numerador é o produto dos valores do conjunto pelos respectivos pesos e o denominador é a soma dos pesos. Ela é indicada pela simbologia xw. Vejamos uma situação ilustrativa para aplicarmos o conceito de média ponderada. Problema: Consideremos os dados de um estudo estatístico realizado em três cidades do Rio de Janeiro. O objetivo era obter a porcentagem de imóveis que eram ocupados pelos próprios donos. © M or ga nk a / / S hu tt er st oc k Raciocínio analítico e Quantitativo 40 Porcentagens de residências ocupadas pelos proprietários Volta Redonda 40,3 Juiz de Fora 56,4 Petropólis 62,1 De acordo com o estudo, existem 1135 unidades residenciais nos bairros de Volta Redonda, 113 em Juiz de Fora e 210 em Petropólis. Com base nessas informações, qual a taxa média de ocupação de imóveis pelos próprios proprietários nas três cidades consideradas? Solução: Inicialmente, devemos reconhecer as observações e seus respectivos pesos. Em representação simbólica, temos que: x1 = 40,3 e w1 = 1135 x2 = 56,4 e w2 = 113 x3 = 62,1 e w3 = 210 Logo, de acordo com a definição formal da média ponderada, escrevemos: xw = [(1135) · (40,3)] + [(113) · (56,4)] + [(210) · (62,1)] 1135 + 113 + 210 = 44,7 Resposta: A taxa média de ocupação de imóveis pelos próprios proprietários nas cidades estudadas no Rio de Janeiro é igual a 44,7%. A seguir, estudaremos mais dois tipos de médias: a média harmônica e a média quadrática. Vamos conhecê-las? 2.1.2 Média Harmônica e Média Quadrática A média harmônica e a média quadrática são dois outros tipos de médias aritméticas, talvez não tão frequentes para você como as citadas anteriormente. A média harmônica está associada ao cálculo matemático de problemas envol- vendo grandezas inversamente proporcionais. A média harmônica de um conjunto de valores xi é o inverso da média aritmética dos inversos, conforme descrito na expressão a seguir. Dessa maneira, se tivermos um conjunto com n valores x1, x2, ..., xn, matematicamente, a média harmônica xh é dada por: Raciocínio analítico e Quantitativo 41 xh = 1 1 x1 + 1 x2 + ... + 1 xn n = 1 ∑ i = 1 n 1 xi Vejamos uma situação ilustrativa envolvendo a média harmônica Problema: Cauã estava voltando do trabalho quando passou por uma loja de roupas em promoção. Adquiriu quatro camisetas ao preço unitário de R$ 30,00 e duas camisetas a R$ 50,00 cada uma. Qual o preço médio pago por Cauã por cada camiseta? Solução: Observe que podemos, inicialmente, interpretar o problema e registrar que Cauã gastou R$ 120,00 em camisetas (4 camisetas de R$ 30,00 a unidade) e R$ 100,00 (comprando 2 camisetas de R$ 50,00 a unidade). Nesse caso, os valores seriam os preços das camisetas, e seus pesos as quantidades pagas em cami- setas. Dessa forma, a partir da expressão da média harmônica, temos que: xh = 1 120 · ( 1 30 ) + 100 · ( 1 50 ) 120 + 100 = 1 120 30 + 100 50 220 = 1 4 + 2 220 = 220 4 + 2 = 36,67 Resposta: O preço médio pago por Cauã por camiseta foi de R$ 36,67. Dando seguimento ao nosso estudo, vamos conhecer a média quadrática. Denominamos de média quadrática de um conjunto de n valores x1, x2, ..., xn a raiz quadrada da média aritmética dos quadrados. Denotando a média quadrática por xq, escrevemos: xq = ∑ i = 1 n xi 2 n © s ho ck fa ct or .d e / / S hu tt er st oc k Raciocínio analítico e Quantitativo 42 Dessa maneira: • Se tivermos o conjunto de valores {2, 2, 2}, então sua média quadrática será dada por: xq = ∑ i = 1 n xi 2 n = 2 2 + 22 + 22 3 = 12 3 = √4 = 2. • Se tivermos o conjunto de valores {2, 3, 4, 5}, então sua média quadrática será dada por: xq = ∑ i = 1 n xi 2 n = 2 2 + 32 + 42 + 52 4 = 54 4 = √13,5 = 3,67. A média quadrática pode ser diretamente utilizada na descrição da variabilidade, mais especi- ficamente no cálculo do desvio padrão, uma das principais medidas de dispersão que estuda- remos mais adiante. Agora que já tratamos da média aritmética e de suas derivativas, é nosso inte- resse descrever a mediana e a moda, que são consideradas duas importantes medidas de centralidade. Esse é o tema do tópico a seguir. 2.1.3 Mediana e Moda A mediana é a medida de centro que divide um conjunto de dados em duas partes iguais. Isso significa que em qualquer conjunto de valores a mediana deixa 50% dos valores acima ou 50% dosvalores abaixo. A mediana é, portanto, o valor que centra um conjunto de valores ordenados, que o divide em duas partes de frequências iguais. Interpretação da mediana © F ab ri COMediana Md 0% 50% 100% Raciocínio analítico e Quantitativo 43 Para obter a mediana, considera-se, inicialmente, o número de elementos do conjunto ordenado. Para um conjunto de dados com n valores, se n for ímpar, a mediana Md será o elemento central (de ordem n + 1 2 ). Caso contrário, se n for par, a mediana Md será a média aritmética entre os elementos centrais (de ordem n 2 e n 2 + 1). Vejamos os exemplos apresentados a seguir. Calculando a mediana de um conjunto com n valores. n par Mediana 2, 3, 3, 4 3 1, 18, 19, 20 18,5 4, 8, 8, 40 8 n ímpar Mediana 1, 2, 3, 5, 6, 7, 8 5 1, 18, 19, 20, 34 19 4, 8, 8,8, 40 8 Agora que vimos o conceito de mediana e sua aplicação, vamos entender o que é a moda. Segundo Crespo (2009), a moda é o valor que mais aparece em uma distribuição, o mais frequente. Observe que, no caso de distribuições em que não temos os inter- valos de classes, uma simples investigação acerca das frequências nos possibilita a descrição formal da moda. Sendo assim, observe que: • O conjunto de dados 3, 3, 8, 8, 8, 6, 10, 32 tem moda igual a 8, isto é, Mo = 8. É um conjunto unimodal (com uma única moda). • O conjunto de dados 1, 5, 5, 5, 6, 7, 8, 8, 8, 9 apresenta duas modas, 5 e 8, logo, é chamado de bimodal. • O conjunto 1, 2, 9, 6, 3, 5 não tem moda. Até esse momento, discutimos o cálculo das medidas de centro para dados não agrupados em classes, ou seja, considerando variáveis discretas. Agora, estaremos apresentando o cálculo da média, moda e mediana para dados agrupados em classes. Raciocínio analítico e Quantitativo 44 2.1.4 Cálculo das medidas de centro para dados agrupados em classes Neste tópico vamos descrever os cálculos envolvendo a média aritmética, a mediana e a moda para dados agrupados em classes, ou seja, o procedimento de cálculos para uma variável contínua. Nesse sentido, a média para dados agrupados em classes é caracterizada pela expressão: x = ∑ xi · Fi n , Onde: n: número de elementos xi: ponto médio da classe i Fi: frequência absoluta da classe i Fac: frequência acumulada Para o cálcuo da mediana envolvendo uma distribuição apresentada em classes, de acordo com Martins (2010), devemos utilizar a seguinte sequência de passos. 1° Passo: Calcula-se a ordem n 2 , independentemente de n ser par ou ímpar. 2° Passo: Por meio da Fa, identifica-se a classe que contém a mediana (classe Md). 3º Passo: Utilizamos a expressão Md = lMd + n 2 – ∑ f · h FMd , onde: lMd = limite inferior da classe Md; n = tamanho da amostra ou número de elementos; ∑ f = soma das frequências anteriores à classe Md; h = amplitude da classe Md; FMd = frequência da classe Md. Com relação ao cálculo da moda, Martins (2010) esclarece que temos uma série de expressões com esse propósito. Aqui, nos basearemos na conhecida fórmula de Czuber. Nesse caso, o cálculo da moda envolve os passos seguintes. Raciocínio analítico e Quantitativo 45 1° Passo: Identificamos a classe modal (classe com maior frequência). 2° Passo: Aplicamos a fórmula MO = lMo + ∆1 ∆1 + ∆2 · h, onde: lMo = limite inferior da classe modal ∆1 = diferença entre a frequência da classe modal e a frequência da classe imediatamente anterior ∆2 = diferença entre a frequência da classe modal e a frequência da classe imediatamente superior h = amplitude da classe modal Vejamos um exemplo ilustrativo para apli- cação das expressões descritas anteriormente envolvendo média, mediana e moda para uma variável contínua. Problema: Alessandra é a engenheira de produção de uma determinada multinacional que fabrica peças para automóveis. Em uma amostra de 56 parafusos produzidos, Alessandra registrou os seguintes dados de comprimento (em mm): Dados do problema Escala de Valores dos Comprimentos (mm) Fi Fac xi 7 |---- 17 6 6 12 17 |---- 27 15 21 22 27 |---- 37 20 41 32 37 |---- 47 10 51 42 47 |---- 57 5 56 52 ∑ 56 Fi: frequência absoluta da classe i Fac: frequência acumulada xi: ponto médio da classe i © M ilo s S to jil jk ov ic / / S hu tt er st oc k Raciocínio analítico e Quantitativo 46 A partir dos dados da tabela apresentada, pede-se: a. O comprimento médios dos parafusos da amostra pesquisada. b. O valor que divide o conjunto de dados em duas partes iguais. c. O valor mais frequente. Solução: Nesse caso, temos que: a. Média = x = ∑ xi · Fi n = 12.6 + 22.15 + 32.20 + 42.10 + 52.5 56 = 1722 56 = 30,75 b. Observe que o valor que divide o conjunto de dados em duas partes iguais é a mediana. Desta maneira, como n = 56, temos que: n 2 = 56 2 = 28°, logo a classe Md = 27 |---- 37, lMd = 27, ∑ f = 21, h = 10 e FMd = 20 (que representa a frequência absoluta da classe que contém a mediana). Desta forma, escrevemos: Md = lMd + n 2 – ∑ f · h FMd = 27 + 56 2 – 21 · 10 20 = 30,50 c. O valor mais frequente é a moda, assim, temos que a classe modal é 27 |---- 37, logo: h = 10, lMo= 27 e ∆1 = 20 – 15 = 5 e ∆2 = 20 – 10 = 10, então: MO = lMo + ∆1 ∆1 + ∆2 · h = 27 + 5 5 + 10 · 10 = 30,33 Resposta: No exemplo, a engenheira Alessandra identificou que: a) o comprimento médio dos parafusos é de 30,75 mm; b) o valor que divide o conjunto em duas partes iguais (mediana) é 30,50 mm; c) a medida de parafuso mais frequente é 30,33 mm. Perceba que as medidas de centralidade nos mostram o centro do conjunto de dados, ou seja, os valores mais típicos do conjunto. Podemos dizer também que as medidas de centralidade são valores que representam, de alguma forma, todo o grupo. Entre as medidas de centro, a mediana é uma medida que divide o conjunto de dados em duas partes iguais. Todavia, temos outras medidas que também dividem um conjunto de dados, conhecidas como medidas separatrizes. Vamos conhecê-las na próxima seção. Raciocínio analítico e Quantitativo 47 2.2 Medidas Separatrizes As medidas separatrizes são medidas que dividem o conjunto de dados em partes homogêneas, ou seja, em partes iguais. As medias separatrizes são os quartis, decis e percentis, que serão trabalhados logo na sequência, cada um com as suas especificidades. 2.2.1 Quartis Os quartis são as medidas separatrizes que dividem um conjunto de dados em quatro partes homogêneas ou iguais. Temos três quartis, que são comumente repre- sentados por: Q1 = 1 0 quartil, deixa 25% dos elementos. Q2 = 2 0 quartil, coincide com a mediana, deixa 50% dos elementos. Q3 = 3 0 quartil, deixa 75% dos elementos. Veja a seguir: Interpretação dos quartis © F ab ri CO 0% 25% Q1 50% 75% 100% Q2=Md Q3 O segundo quartil Q2 na verdade é a própria mediana, já que também divide o conjunto de dados em duas partes exatamente iguais. Logo, a determinação do segundo quartil é exata- mente igual ao cálculo da mediana. Desta forma, vejamos agora a caracterização de cada um deles, de acordo com as suas particularidades. Cabe ressaltar que, basicamente, de acordo com Levine (2012), o procedimento é muito semelhante ao cálculo da mediana apresentado anterior- mente para dados agrupados em classes. Raciocínio analítico e Quantitativo 48 Determinação do 1°quartil 1° Passo: Calcula-se a ordem n 4 . 2° Passo: Identificamos a classe que contém Q1 pela Fac. 3° Passo: Aplicamos a fórmula: Q1 = lQ1 + n 4 – ∑ f · h FQ1 Onde: lQ1 = limite inferior da classe Q1 n = tamanho da amostra ou número de elementos ∑ f = soma das frequências anteriores à classe que contém Q1 h = amplitude da classe que contém Q1 FQ1 = frequência da classe que contém Q1 Determinação do 2°quartil Usamos o mesmo cálculo para determinar a mediana, como demostrado anteriormente. Determinação do 3°quartil 1° Passo: Calcula-se a ordem 3 · n 4 . 2° Passo: Identificamos a classe que contém Q3 pela
Compartilhar