Prévia do material em texto
RACIOCÍNIO ANALÍTICO E QUANTITATIVO Alessandro Ferreira Alves *Todos os gráficos, tabelas e esquemas são creditados à autoria, salvo quando indicada a referência. Imagens da capa: © bubble86 // Shutterstock; © grmarc // Shutterstock. Informamos que é de inteira responsabilidade da autoria a emissão de conceitos. Nenhuma parte desta publicação poderá ser reproduzida por qualquer meio ou forma sem autorização. A violação dos direitos autorais é crime estabelecido pela Lei n.º 9.610/98 e punido pelo artigo 184 do Código Penal. Copyright Universidade Positivo 2016 Rua Prof. Pedro Viriato Parigot de Souza, 5300 – Campo Comprido Curitiba-PR – CEP 81280-330 Superintendente Reitor Pró-Reitor Acadêmico Coordenador Geral de EAD Coordenadora Editorial Autoria Supervisão Editorial Parecer Técnico Validação Institucional Layout de Capa Prof. Paulo Arns da Cunha Prof. José Pio Martins Prof. Carlos Longo Prof. Renato Dutra Profa. Manoela Pierina Tagliaferro Prof. Alessandro Ferreira Alves Bianca de Brito Nogueira Prof. José Clair Menezes Júnior Francine Ozaki e Regiane Rosa Valdir de Oliveira FabriCO KOL Soluções em Gestão do Conhecimento Ltda EPP Análise de Qualidade, Edição de Texto, Design Instrucional, Edição de Arte, Diagramação, Design Gráfico e Revisão Ícones Afirmação Contexto Biografia Conceito Esclarecimento Dica Assista Curiosidade Exemplo Sumário Apresentação ....................................................................................................................9 O autor .............................................................................................................................10 Capítulo 1 Fundamentos da estatística, etapas do estudo estatístico, amostragem e interpretação dos resultados ...............................................11 1.1 Aspectos Introdutórios da Estatística ........................................................................12 1.1.1 Notas Históricas e Importância ..............................................................................................................................12 1.1.2 A Importância da Estatística no Meio Empresarial e o Processo Decisório ............................................................13 1.1.3 Conceitos Fundamentais .........................................................................................................................................14 1.1.4 Etapas de uma pesquisa ........................................................................................................................................ 16 1.2 Processos estatísticos de abordagem e técnicas de amostragem ............................18 1.2.1 Levantamento por recenseamento e levantamento por amostragem ..................................................................19 1.2.2 Amostragem probabilística e não probabilística .................................................................................................. 20 1.2.3 Principais tipos de amostragem probabilística ..................................................................................................... 20 1.3 Variáveis, dados e erros .............................................................................................23 1.3.1 Tipos de variáveis ................................................................................................................................................... 23 1.3.2 Tipos de dados .......................................................................................................................................................24 1.3.3 Tipos de Erros ........................................................................................................................................................ 25 1.4 Representação tabular e representação gráfica de dados .........................................26 1.4.1 Tabelas de distribuição de frequências .................................................................................................................. 26 1.4.2 Principais tipos de gráficos .................................................................................................................................... 30 Referências ......................................................................................................................34 Capítulo 2 Medidas Descritivas ........................................................................................................35 2.1 Medidas de Centralidade ...........................................................................................36 2.1.1 Média Aritmética, Média Geométrica e Média Ponderada ................................................................................... 36 2.1.2 Média Harmônica e Média Quadrática .................................................................................................................. 40 2.1.3 Mediana e Moda .................................................................................................................................................... 42 2.1.4 Cálculo das medidas de centro para dados agrupados em classes ....................................................................... 44 2.2 Medidas Separatrizes ................................................................................................47 2.2.1 Quartis ................................................................................................................................................................... 47 2.2.2 Decis ...................................................................................................................................................................... 50 2.2.3 Percentis .................................................................................................................................................................51 2.3 Medidas de Dispersão ...............................................................................................54 2.3.1 Variabilidade .......................................................................................................................................................... 54 2.3.2 Variância e Desvio Padrão ..................................................................................................................................... 55 2.3.3 Coeficiente de Variação de Pearson e Erro Padrão ................................................................................................ 57 2.3.4 Escore Padronizado e Outliers ............................................................................................................................... 60 2.4 Assimetria e Curtose ..................................................................................................62 2.4.1 Aspectos Introdutórios da Assimetria ou Enviesamento....................................................................................... 62 2.4.2 Principais Medidas de Assimetria ......................................................................................................................... 62 2.4.3 Aspectos Introdutórios da Curtose ou Grau de Achatamento .............................................................................. 64 2.4.4 Principais Medidas de Curtose .............................................................................................................................. 65 Referências ......................................................................................................................68 Capítulo 3 Análise Combinatória .....................................................................................................69 3.1 Introdução a Análise Combinatória ...........................................................................70 3.1.1 Princípio Fundamental da Contagem ....................................................................................................................71 3.1.2 Técnicas de Contagem ........................................................................................................................................... 75 3.2 Permutações ..............................................................................................................76 3.2.1 Notação Fatorial ..................................................................................................................................................... 77 3.2.2 Permutações Simples ............................................................................................................................................ 78 3.2.3 Permutações com Repetições ............................................................................................................................... 79 3.2.4 Aplicações Envolvendo Permutações ................................................................................................................... 83 3.3 Arranjos e Combinações ............................................................................................84 3.3.1 Arranjos Simples .................................................................................................................................................... 85 3.3.2 Combinações Simples ........................................................................................................................................... 86 3.3.3 Aplicações Envolvendo Arranjos e Combinações .................................................................................................. 88 3.4 Binômio de Newton ..................................................................................................89 3.4.1 Números Binomiais e Binomiais Consecutivos ...................................................................................................... 90 3.4.2 Triângulo de Pascal ................................................................................................................................................ 91 3.4.3 Descrição formal do Binômio de Newton ............................................................................................................. 93 Referências ......................................................................................................................95 Capítulo 4 ........................................................................................................................... Probabilidade .................................................................................................................97 4.1 Introdução a Teoria de Probabilidades ......................................................................97 4.1.1 Conceitos Básicos ................................................................................................................................................... 98 4.1.2 Regras Básicas e Teorema de Bayes .................................................................................................................... 100 4.1.3 Distribuições de Probabilidades ........................................................................................................................... 105 4.2 Aspectos Introdutórios ............................................................................................105 4.2.1 Função Densidade de Probabilidade ................................................................................................................... 107 4.2.2 Função Distribuição Cumulativa .......................................................................................................................... 107 4.2.3 Tipos de Variáveis Aleatórias ............................................................................................................................... 109 4.3 Variáveis Aleatórias Contínuas .................................................................................110 4.3.1 A Curva Normal de Gauss .....................................................................................................................................110 4.3.2 A Distribuição Normal Padronizada .....................................................................................................................112 4.3.3 A Distribuição Exponencial ..................................................................................................................................117 4.4 Variáveis Aleatórias Discretas ..................................................................................119 4.4.1 Distribuição Binomial e Medidas Características ..................................................................................................119 4.4.2 Distribuição de Poisson e Propriedades .............................................................................................................. 120 4.4.3 Aplicações Diversas Envolvendo a Distribuição Binomial e a Distribuição de Poisson ....................................... 122 Referências ....................................................................................................................124 Bem-vindo à disciplina de Raciocínio Analítico e Quantitativo. Nesta disciplina, apresentaremos um vasto campo de conhecimento no qual você encontrará uma variedade de temas que englobam os quatro capítulos, compondo a disciplina desde as informações iniciais sobre a aplicabilidade da Estatística e avançan- do para variáveis e distribuições de probabilidade, que são fundamentais para a pes- quisa analítica e quantitativa de mercado. Conhecer métodos estatísticos é muito importante para vários profissionais, in- dependentemente da área de atuação, porque propicia o domínio de ferramentas quantitativas que servem de alicerce para interpretação e resolução de problemas que aparecem no seu cotidiano profissional. Nesse sentido, o entendimento dos conceitos apresentados é fundamental para sua sólida formação específica e possibilitará a resolução de diversas aplicações. Bons estudos! Apresentação Aos meus alunos, que sabem que, para se tornarem profissionais diferenciados no mercado, a dedicação e a leitura contínua são pré-requisitos básicos para o sucesso. O autor O professor Alessandro Ferreira Alves é Doutor em Matemática Aplicada a Engenharia Elétrica pela Faculdade de Engenharia Elétrica e Computação da Universidade Estadual de Campinas (FEEC-UNICAMP), Mestre em Matemática Pura pelo Instituto de Matemática, Estatística e Computação da Universidade Estadual de Campinas (IMECC- UNICAMP) e possui Licenciatura Plena em Matemática pela Universidade Federal de Uberlândia (UFU). É Atua como coordenador de cursos de licenciatura à distância desde 2007 e presta consultoria na área de Finanças, Estatística Aplicada a Mercado e Controle Estatístico de Processos (CEP). Currículo Lattes: <lattes.cnpq.br/7860986142316472> 1 Fundamentos da estatística, etapas do estudo estatístico, amostragem e interpretação dos resultados Não é novidade para ninguém que o mundo globalizado exige profissionais cada vez mais qualificados e dinâmicos. As organizações estão à procura de profissionais gabaritados, que tenham o domínio de ferramentas quantitativas. Isso nos diz que a habilidade na resolução de problemas, independentemente do grau de complexidade, seja por meio de métodos analíticos ou quantitativos, é um diferencial de mercado, já que as organizações buscam a maximização de resultados, minimizando custos ou aumentando receitas, por meio de decisões gerenciais tomadas com confiabilidade. Logicamente, temos um grande leque de informações a serem trabalhadas. Segundo Levine (2012), cresce a procura pela análise de dados e, consequentemente, a Estatística surge como uma ferramenta indispensável para as empresas, sejam elas públicas ou privadas. A Estatística está diretamente relacionada ao planejamento, desenvolvimento e acompanhamento de produtos, projetos, serviços e processos diversos.Cabe ressaltar que ela está presente em todas as áreas do conhecimento: engenharias (controle esta- tístico de processos), publicidade e propaganda (tabulação de dados em pesquisas de mercado), ciências contábeis e ciências econômicas (mensuração de indicadores), ciên- cias biológicas (descrição de resultados de testes), entre outras. Salienta-se que, em termos empresariais, a Estatística é importante para que um negócio organizacional obtenha sucesso, porém, não o garante. O sucesso pode vir pela introdução de medidas objetivas, que tendem a viabilizar a atividade empresarial. É no conjunto delas que se encontra a Estatística, propondo, a partir de suas técnicas específicas, a coleta, análise e interpretação de dados estatísticos. Ressalta-se que dados não são apenas números, podendo ser também atributos. Exemplificando: quando descrevemos a idade de pessoas (18, 27, 32, 21, 42, etc.), temos números; quando descrevemos o sexo (masculino ou feminino), temos atributos ou classes. Nesse contexto, este capítulo tem como objetivo apresentar conceitos introdutó- rios fundamentais, assim como métodos de amostragem e apresentação de dados em forma tabular e gráfica. Esses aspectos teóricos contribuirão para que você tenha uma sólida formação na sua área de atuação e poderão ser aplicados em diversas situações do seu dia a dia. Raciocínio analítico e Quantitativo 12 1.1 Aspectos Introdutórios da Estatística Segundo Tiboni (2010), a Estatística é a ciência de coletar, organizar e inter- pretar fatos, que chamamos de dados. A todo momento, no cotidiano, estamos diante de uma grande infinidade deles: Da mídia (jornais, televisão, internet, rádio), por exemplo, recebemos: • informações sobre a venda de carros nacionais e importados; • o índice de popularidade do presidente nas últimas pesquisas de opinião; • os valores de indicadores médios do mercado financeiro; • dados que apontam para a superioridade de um produto que está sendo anunciado. Em uma linguagem simples, o objetivo da Estatística é obter compreensão a partir de dados. Para conseguirmos isso, frequentemente trabalhamos com um conjunto de números. Por exemplo: calculamos a média, criamos um gráfico de valores ou, até mesmo, reunimos os dados em uma tabela. Todavia, é necessário fazer mais que isso, afinal, os dados não são somente números. Ao utilizar a Estatística para a resolução de qualquer problema, temos que nos preocupar em compreender os números obtidos, interpretando o conjunto dessas informações (dados). Não basta apenas nos limitar aos números em si. 1.1.1 Notas Históricas e Importância Na linha do tempo, as ideias e métodos da estatística foram se desenvolvendo aos poucos, à medida que aumentava o interesse da sociedade na coleta e utilização de dados para os seus objetivos próprios. Segundo Novaes e Coutinho (2013), as origens mais remotas da Estatística vinculam-se ao desejo dos governantes de contar o número de habitantes ou medir o valor de terras tributáveis em seus domínios. Alguns autores dizem, inclusive, que o termo provém da palavra Estado. Com o desenvolvimento das ciências físicas, nos séculos XVII e XVIII, cresceu a relevância da mensuração de pesos, distâncias e outras quantidades físicas. Astrônomos e agrimensores, que buscavam a exatidão de suas contas, tiveram que lidar com a variação de suas medidas (variabilidade ou dispersão). Entenderam que diversas medidas podem ser melhores do que uma única, ainda que elas variem entre si. Mas de que maneira é possível combinar diversas observações variáveis? Nesse contexto, os métodos estatísticos foram, então, inventados, com o propósito de mensurar medidas científicas. Raciocínio analítico e Quantitativo 13 A Estatística antigamente era considerada um conjunto de métodos e processos quantitativos, que serviam para estudar e mensurar os fenômenos coletivos. No século XIX, as ciências biológicas e comportamentais também começaram a se basear em dados para responder a suas questões fundamentais. Qual é a relação das alturas de pais e filhos? É possível medir a capacidade mental e o comportamento de um indivíduo da mesma maneira que medimos a altura e seu tempo de reação? A Estatística se tornou uma importante ferramenta para responder essas e outras perguntas. No século XX, as decisões no âmbito econômico e financeiro também se tornaram de caráter quantitativo. Em verdade, ideias de mensuração utilizadas pelo Estado passaram a ser utilizadas para a descrição de economias dos países e para o estudo de carteiras de investimentos. Hoje, essas ideias se juntaram para formar uma “ciência de dados” unificada, a fim de nos ajudar na tomada de decisão em diversas pesquisas, principalmente em pesquisas de marketing. O desenvolvimento da Estatística ao longo do tempo © F ab ri CO - Estado - Negócios voltados para o Estado - Ciências físicas - Informações diversas - Pacotes estatísticos - Decisões: �nanceiras, econômicas e empresariais Início SéculosXVII e XVIII Atualidade 1.1.2 A Importância da Estatística no Meio Empresarial e o Processo Decisório Atualmente, a concorrência acirrada faz com que as organizações recorram a ferramentas quantitativas para a obtenção de dados que possibilitem a tomada de decisões gerenciais com confiabilidade. Segundo Moore (2006), com relação ao processo de tomada de decisão a nível gerencial, pode-se enumerar de forma bastante simples as características principais do processo decisório, que têm importância na conceituação de racionalidade da ação gerencial. São elas: sequencialidade, complexidade, subjetividade e a existência de regras institucionais. A sequencialidade diz respeito à sequência de passos que temos Raciocínio analítico e Quantitativo 14 que dar para a tomada de decisão, passando pela análise dos sintomas e discussão de resultados; a complexidade reside no fato de que não é uma tarefa simples tomar uma decisão, enquanto a subjetividade nos mostra que os pontos de vista podem variar e até mesmo divergir de pessoas para pessoa; por fim, em cada organização existem regras institucionais que devemos seguir. Todos esses aspectos estão implicados na racionalidade da ação gerencial. Nessa direção, a Estatística surge como um diferencial de mercado, atualmente compreendida como um ramo da Matemática Aplicada que se preocupa com a variabi- lidade e com o impacto desta na tomada de decisão. Desta maneira, podemos visualizar aplicações práticas da Estatística no contexto empresarial, como: • No marketing, leitoras ópticas estão sendo utilizadas para a mensuração de dados, com uma diversidade de aplicações em pesquisas de mercado; • O controle da qualidade é uma importante aplicação da Estatística em empre- sas e indústrias, já que uma série de cartas estatísticas de controle da qualidade são usadas para monitorar a saída de um processo produtivo, com a ideia de di- minuição do número de itens produzidos não conformes; • Na gestão financeira, os gestores financeiros utilizam um leque de informa- ções estatísticas para conduzir suas recomendações de futuros investimentos; • No âmbito econômico, os economistas são comumente solicitados a forne- cer mensurações futuras de índices econômicos ou até mesmo de modelos econométricos. A Estatística hoje é de fundamental importância para a tomada de decisão com confiabilidade no meio empresarial, tornando-se, com o passar do tempo, uma ferra- menta indispensável para o estudo de fenômenos diversos e de problemas cotidianos. 1.1.3 Conceitos Fundamentais Segundo Martins (2010), para a descrição de um estudo em termos estatísticos é necessária a definição de alguns conceitos, que são as células fundamentais de construção de todos os métodos a serem abordados. Estamos falando dos conceitos fundamentais ou definições básicas da Estatística. Raciocínio analítico e Quantitativo 15 Conceitos fundamentais da Estatística © F ab ri CO População Amostra Parâmetro EstimadorDados Elementos Variável Observação Definimos cada um deles como segue: • População: é o conjunto formado pelas medidas que se fazem sobre elementos do universo, ou seja, do todo. • Amostra: é qualquer subconjunto não vazio de uma população. • Parâmetro: é uma característica numérica estabelecida para uma população. • Estimador: é uma característica numérica estabelecida para uma amostra. • Dados: são os fatos e números obtidos, ana- lisados e sumarizados para apresentação e interpretação. • Elementos: são as entes (pessoas, itens, etc) nas quais os dados são coletados. • Variável: é uma característica de interesse para os elementos. • Observação: é o conjunto de medidas coleta- das para um elemento particular. Sendo assim, citamos: • Em um estudo sobre a audiência de um referido programa de TV na grande Rio de Janeiro, a população de interesse é o conjunto de todos os domicílios da região que possuem TV, enquanto a amostra é o conjunto dos domicílios que serão visitados. © M ar zo lin o // Sh ut te rs to ck Raciocínio analítico e Quantitativo 16 • Na caracterização da idade média do cidadão brasileiro, temos que a variável de interesse é a idade e os elementos são os brasileiros. Se o estudo for reali- zado sobre toda a população, a idade média é um parâmetro; se pegarmos um conjunto de brasileiros qualquer, a idade média agora seria um estimador; se consideramos a idade do brasileiro João, que possui 42 anos, esta é uma obser- vação. Observe também que os dados são exatamente os valores das idades dos cidadãos pesquisados. É interessante observarmos que a Estatística por sua vez, está dividida em esta- tística descritiva (ou dedutiva) e estatística inferencial (ou indutiva). A primeira trata em essência da apuração, apresentação, análise e interpretação dos dados obser- vados (descreve as amostras ou a população), enquanto que a segunda é um método que parte do particular para o geral, ou seja, do processo pelo qual são feitas generali- zações para a população, a partir da amostra. 1.1.4 Etapas de uma pesquisa De acordo com Crespo (2009), o planejamento é o principal fator para a obtenção de sucesso em uma dada pesquisa. Para tal, deve-se levar em consideração algumas etapas básicas ao se planejar uma pesquisa. A sequencialidade de tais etapas não são únicas, dentre elas citamos as descritas na figura a seguir. Etapas básicas para o planejamento de uma pesquisa Descrever o objetivo Caracterizar população De�nir dados a serem coletados De�nir métodos de metidas De�nir unidade de amostragem Escolher tipo de amostragem Fazer veri�cação preliminar Analisar os dados coletados CRESPO, 2009. (Adaptado). © F ab ri CO Raciocínio analítico e Quantitativo 17 Podemos descrever cada uma das etapas como segue: • Descrição do objetivo: Quais os objetivos da pesquisa? Esses objetivos devem estar bem definidos, porque é o caminho diretor para sua boa execução. • População: Qual população a ser estudada? A população a ser estudada deve estar claramente definida, com identificação correta dos seus elementos, a fim de que a amostra coletada represente fielmente os dados populacionais. • Dados a serem coletados: Quais os dados a serem trabalhados? Quando cole- tamos as informações, é importante averiguar se elas realmente estão casadas com os objetivos da pesquisa. • Métodos de medidas: Antecipando as informações, é necessário e importan- te que a metodologia de coleta seja coerente e estruturada. Deve-se verificar se os dados serão coletados por meio de formulários, por declarativas de en- trevistados, por telefone, por respostas a um questionário estruturado etc. Seja qual for o método escolhido, existe a necessidade de um bom treinamen- to de toda a equipe de pesquisa. Para questionários, é necessário validá-los previamente. • Unidade de amostragem: Se a pesquisa for feita via levantamento por amos- tragem, deve-se definir qual é a unidade de amostragem, que pode ser: um indivíduo, um grupo de pessoas, uma família, uma empresa, um item, um al- queire etc. • Escolha do tipo de amostragem: A partir do tipo da pesquisa e população, de- vemos escolher qual a técnica de amostragem que dará origem à amostra. • Verificação preliminar: Em qualquer pesquisa é interessante termos uma veri- ficação prévia, ou seja, é necessário averiguarmos a eficiência da metodologia a ser empregada. Testamos em uma pequena parcela da população se a técnica a ser utilizada para a coleta é a mais coerente, se a forma proposta para registro dos dados não deve ser alterada e se a equipe da pesquisa está bem treinada. • Análise dos dados coletados: Obtidos os resultados, eles devem ser analisados em termos das técnicas estatísticas, para termos confiabilidade na tomada de decisão. Pode-se representá-los em gráficos e tabelas, utilizar medidas descriti- vas, realizar inferências ou testes específicos. Na sequência, é preciso descrever um relatório completo com as informações importantes para as respostas dos objetivos projetados anteriormente. Além disso, não se deve esquecer da biblio- grafia e anexos, como cópia de questionários aplicados etc. Raciocínio analítico e Quantitativo 18 Agora que visualizamos as informações iniciais da aplicabilidade da Estatística, conceitos fundamentais e etapa de desenvolvimento de uma pesquisa, nosso inte- resse, na sequência, é a descrição dos processos estatísticos de abordagem e das prin- cipais técnicas de amostragem. 1.2 Processos estatísticos de abordagem e técnicas de amostragem Segundo Martins (2010), os processos estatísticos de abordagem, comumente chamados de processos estatísticos de pesquisa, dividem-se em dois tipos: o levanta- mento por recenseamento e o levantamento por amostragem. Assim sendo, quando são coletadas informações de toda a população, dizemos que foi feito um levantamento por recenseamento. Em particular, chamamos de censo ao conjunto de dados mensurados por meio do recenseamento, ou seja, quando o estudo é realizado tomando como base toda a população. Levantamento por amostragem © A rt hi m ed es / / S hu tt er st oc k Contrariamente, quando coletamos as informações apenas de uma parcela da população, dizemos que realizamos um levantamento por amostragem ou amos- tragem. Aqui, os dados obtidos também recebem o nome de amostra. Raciocínio analítico e Quantitativo 19 1.2.1 Levantamento por recenseamento e levantamento por amostragem Uma questão recorrente é como escolher o processo estatístico de abordagem para determinado estudo. Num primeiro momento, poderíamos considerar que, na maior parte dos casos, é interessante o estudo com relação a uma amostra, e não a uma população, ou seja, o levantamento por amostragem. Porém, podemos ter, sim, situações muito peculiares, em que é mais interessante a utilização do levantamento por recenseamento. Dessa maneira, temos, independentemente da escolha, vantagens e desvantagens. O quadro que segue nos mostra as vantagens da amostragem sobre o recenseamento. Vantagens da amostragem sobre o recenseamento Vantagem Descrição Tempo Quando utilizamos amostragem, em vez de recenseamento, gastamos um tempo menor. Custo O custo da pesquisa é menor quando se realiza uma amostragem. Aprofundamento A pesquisa amostral pode ser mais aprofundada. Erros Com um número menor de elementos, o número de pesquisadores deve ser menor, logo, temos menos erros. Testes destrutivos Quando a pesquisa envolve testes destrutivos, não é possível realizar o recenseamento (mensurar durabilidade de lâmpadas, por exemplo). Por outro lado, as vantagens do recenseamento sobre a amostragem estão demonstradas no quadro a seguir. Vantagens do recenseamento sobre a amostragem Vantagem Descrição Precisão Completa Se a pesquisa busca precisão completa do estudo, então não se pode fazer um levantamento por amostragem. População Pequena Quando a população é pequena, não é interessante trabalhar com a amostragem.Vejamos na sequência a diferenciação entre amostragem probabilística e não probabilística, assim como seus principais tipos, que são importantes para o levanta- mento dos dados. Vamos lá? Raciocínio analítico e Quantitativo 20 1.2.2 Amostragem probabilística e não probabilística Definindo-se a população de estudo e averiguando-se que o processo estatís- tico de abordagem a ser utilizado é o levantamento por amostragem, é prudente esta- belecer com coerência e clareza qual a técnica de amostragem a ser utilizada, ou seja, o procedimento que será adotado para escolher os elementos que irão compor a amostra. De acordo com Martins (2010), especificamente falando nesse contexto, existem dois tipos de amostragem: amostragem probabilística e amostragem não probabilística. Dessa maneira, temos que: • Amostragem probabilística: é caracterizada se todos os elementos da popu- lação tiverem probabilidade conhecida e não nula de pertencer à amostra. Às vezes chamada de aleatória ou randômica. Exemplificando, a escolha aleató- ria de indivíduos no centro da cidade para participarem de uma pesquisa é uma amostragem probabilística. Salientamos ainda que somente a amostragem probabilística nos permite calcular o erro amostral. • Amostragem não probabilística: é usada quando a chance de ocorrência e de- terminando elemento da população na amostra é um número desconhecido ou igual a zero. Às vezes chamada de não aleatória ou por escolha justificada. Ela é subjetiva, já que pode se basear nas decisões pessoais do pesquisador. Seus principais tipos são a amostragem acidental, amostragem intencional ou por conveniência, e amostragem por quotas. Exemplificando: em uma pesquisa sobre preferência de determinada marca de shampoo, o pesquisa- dor dirige-se a um grande salão de beleza e entrevista as pessoas presentes no recinto. Sempre que possível, para a obtenção de uma amostra que represente fielmente a população, deve-se escolher a amostragem probabilística. 1.2.3 Principais tipos de amostragem probabilística De acordo com Martins (2010), é possível usarmos combinações de várias técnicas de amostragem probabilística, entretanto, é mais comum usar as técnicas isentas de misturas. Entre elas, os principais tipos de amostragem probabilística são as apresentadas no quadro a seguir. RACIOCÍNIO ANALÍTICO E QUANTITATIVO 21 Principais Tipos de Amostragem Probabilística © F ab ri CO Aleatória Simples Sistemática Estrati�cada Conglomerados Vejamos a descrição detalhada e exemplos de cada uma delas a seguir: • Amostragem Casual Simples (ou Amostragem Aleatória simples): consis- te na enumeração dos elementos de uma população (N elementos) e escolha de n elementos dessa sequência, que comporão a amostra, por meio de um dispositivo aleatório qualquer, comumente um sorteio ou tabela de números aleatórios. Cada elemento da população, tem como chance de ocorrência na amostra a fração n N , que recebe o nome de fração de amostragem. Citamos como situações envolvendo a amostragem aleatória simples: • Sorteio aleatório de colaboradores de uma empresa no ramo automobilístico. • Computadores gerando números aleatórios. • Entrevistar indivíduos no centro de São Paulo para uma dada pesquisa de ca- racterização do perfil do consumidor. • Amostragem Sistemática: é uma particularidade da amostragem aleatória. É comumente usada quando os elementos da população se apresentam (em cer- ta ordem) e a retirada dos elementos da amostra é feita por meio de períodos. Sendo assim, é sorteado o 1° elemento (ordem k) e, a seguir, os demais são re- tirados numa progressão aritmética de razão r, a partir do 1° elemento escolhi- do, até gerarmos o montante de elementos da amostra. Citamos como exemplos de amostragem sistemática: • Uma gravadora seleciona cada vigésimo CD de sua linha de produção para um teste rigoroso de qualidade. • Se uma grande empresa quisesse fazer uma pesquisa sobre seus 50.000 cola- boradores, poderia partir de uma relação ordenada do quadro de funcionários e selecionar cada 50º colaborador, obtendo uma amostra de 500 elementos. Raciocínio analítico e Quantitativo 22 As amostras sistemáticas são muito utilizadas, mas exigem especial preocupação com o sistema de seleção. • Amostragem Estratificada: dividimos a população em pelo menos duas par- tes, ou subpopulações ou estratos, que compartilham das mesmas carac- terísticas (como por exemplo, sexo) e, em seguida, realizamos uma amostra aleatória em cada estrato, formando assim, uma amostra com a junção dos elementos selecionados aleatoriamente em cada estrato. Desta forma, podemos citar como exemplos de amostragem estratificada: • Dividir o curso de Administração de uma faculdade ou universidade por perío- dos: cada período seria um estrato. • Dividir o quadro de colaboradores de uma indústria de acordo com o turno de trabalho (manhã, tarde e noite). Assim, cada turno seria um estrato. Se os vários estratos têm tamanhos amostrais que refletem a população como um todo, dizemos que a amostragem estratificada é proporcional. • Amostragem por Conglomerados (ou clusters): iniciamos com a divisão da população em pelo menos duas seções (ou conglomerados). A seguir, sele- cionamos aleatoriamente alguns desses conglomerados e, por fim, tomamos todos os elementos dos conglomerados escolhidos. Esse tipo de amostragem é muito empregado pelo governo e por organizações particulares de pesquisa. Citamos como casos envolvendo a amostragem por conglomerados: • Em uma dada pesquisa pré-eleitoral para governador, escolhemos aleatoria- mente dez zonas eleitorais e pesquisamos todos os elementos de cada uma das zonas escolhidas de modo aleatório. • Um psicólogo de uma multinacional faz uma pesquisa sobre todos os colabora- dores de cada uma das 20 turmas produtivas selecionadas aleatoriamente. Depois de identificarmos e nos familiarizarmos com os processos estatísticos de abordagem e suas principais técnicas de amostragem, vamos descrever agora as variá- veis e dados, além de identificar os possíveis erros que podem ser cometidos em um dado estudo. Raciocínio analítico e Quantitativo 23 1.3 Variáveis, dados e erros Outro aspecto importante que o pesquisador deve ter em mente é a correta caracterização do nível de mensuração das variáveis a serem analisadas, que irão levar diretamente aos tipos de dados. Salienta-se que, de acordo com o tipo de mensuração, podemos realizar ou não operações aritméticas, assim como agrupar em classes ou não. Além disso, o tipo de erro associado ao estudo também deve ser identificado e reconhecido de modo preciso. Para que você compreenda o assunto, nesta seção vamos estudar a descrição das variáveis, dados e tipos de erros. 1.3.1 Tipos de variáveis Com relação aos tipos de variáveis, podemos dividi-las em dois grandes grupos, que são: as quantitativas e as qualitativas. As variáveis quantitativas são aquelas que apresentam como possíveis resultados números oriundos de uma contagem ou mensuração. Citamos: salário, idade, número de filhos, estatura, massa corporal, diâmetro de parafusos, comprimento de peças etc. Contrariamente, as variáveis qualitativas apresentam como possíveis resultados uma qualidade (ou atributo ou classe) do indivíduo ou item estudado. Aqui, podemos incluir: sexo, estado civil, grau de instrução, peça produzida (defeituosa ou não defei- tuosa), profissão (contador, administrador, engenheiro, professor etc). Além disso, segundo Martins (2010), cada um desses dois grupos se subdividem em outros dois grupos, conforme observamos a seguir. © F ab ri CO Variáveisquantitativas Variáveisqualitativas Discretas Nominais Contínuas Ordinais Raciocínio analítico e Quantitativo 24 O quadro a seguir demonstra as especificidades de cada um dos subgrupos e traz exemplos. Caracterização dos tipos de variáveis Variável Descrição Q ua nt it at iv a Discreta Os possíveis valores formam um conjunto finito ou enumerável de números(contagem). Por exemplo: idade, número de filhos, salário, número de defeitos etc. Contínua Os possíveis valores pertencem a um intervalo de números reais. Aqui citamos: estatura, massa corporal de um indivíduo, diâmetro de um parafuso etc. Q ua lit at iv a Nominal Não existe nenhuma ordenação nos possíveis resultados. Por exemplo, sexo (masculino e feminino) e conformidade de peças produzidas (defeituosa e não defeituosa). Ordinal Existe uma ordem nos seus resultados. Assim, citamos: grau de instrução (ensino fundamental, médio e superior) e classe social (alta, média e baixa). Agora que entendemos a classificação das variáveis, vamos descrever os tipos de dados que elas originam. 1.3.2 Tipos de dados Vimos que os dados são as informações de determinado estudo, que podem ser numéricas ou não. Ressalta-se que os tipos de dados surgem de forma natural do tipo de variável mensurada. Portanto, temos quatro tipos de dados, que são: • Dados Discretos: surgem na contagem do número de itens com determinada característica (provém de uma variável discreta). Por exemplo, número diário de clientes de uma agência bancária, o número de defeitos numa motocicleta recém lançada, o número de acidentes em uma fábrica, número de filhos etc. • Dados Contínuos: oriundos das variáveis contínuas que podem assumir virtual- mente qualquer valor numa classe intervalar de valores. Por exemplo: a quanti- dade de soja comercializada em uma cooperativa diariamente (variável: peso), a quantidade de gasolina vendida por hora em um posto de combustível (variá- vel: volume) etc. • Dados Nominais: aparecem a partir da mensuração de variáveis nominais de- finidas por categorias. Por exemplo: (masculino ou feminino), cor dos olhos (azuis, castanhos, verdes), campo de estudo (matemática, administração) etc. Raciocínio analítico e Quantitativo 25 • Dados Ordinais (ou por Postos): nascem diretamente de variáveis que se re- ferem tipicamente a avaliações subjetivas, quando os itens são dispostos se- gundo preferência ou desempenho. Por exemplo, nos concursos de chefes de cozinha e de estética, os elementos se classificam como primeiro, segundo, terceiro etc. Outro ponto importante a que devemos estar atentos é que uma mesma popu- lação pode nos levar a distintos tipos de dados, conforme averiguamos a seguir. Tipos de dados Populações Discreto Contínuo Nominal Ordinal Alunos do Ensino Médio Número da Classe Idades / Massa Corporal Masculino / Feminino 2° Grau Automóveis Número de defeitos por automóvel Alcance em Km/h Cores Limpeza Venda de mpreen- dimentos Imobiliários Número de Ofertas Valor (R$) Acima do Preço Despesa Alta A seguir, vamos descrever nas entrelinhas os dois tipos de erros que podem ser cometidos em estudos envolvendo a Estatística. 1.3.3 Tipos de Erros Com relação aos erros que podemos cometer quando realizamos um estudo sob o ponto de vista da Estatística, de acordo com Martins (2010), temos dois tipos, que são o Erro Amostral e o Erro Não Amostral. Em qualquer pesquisa, seja ela mais simples ou mais complexa, podem aparecer os erros amostrais e não amostrais. Tecnicamente falando, o erro amostral pode ser visto como a diferença entre o valor estimado e o verdadeiro valor (resultantes de flutuações amostrais aleatórias), enquanto que o erro não amostral se origina a partir do momento em que tivemos falhas na coleta, no registro ou até mesmo nas análises dos dados (não resultantes de flutuações amostrais simples). Os erros não amostrais podem aparecer em qualquer passo do levantamento amostral e, se não forem observados e interpretados, provocar alterações que podem comprometer e muito o plano amostral. Já conhecemos e classificamos as variáveis, os dados e reconhecemos os tipos de erros possíveis em uma abordagem estatística. Chegou a hora de aprendermos as primeiras ferramentas voltadas para uma melhor organização de dados, que são as representações em tabelas e gráficos. Raciocínio analítico e Quantitativo 26 1.4 Representação tabular e representação gráfica de dados Com certeza você já deve ter notado que jornais impressos ou telejornais, revistas, artigos científicos ou outras fontes de notícias normalmente apresentam os dados na forma de disposição tabular ou na forma da representação gráfica. Você acha que existe um motivo em especial para isso? Por quê seria? A resposta é que sim, temos uma razão em especial. A representação dos dados em tabelas e gráficos faz com que possamos tirar conclusões de uma forma mais rápida, ou seja, permite uma melhor organização e, consequentemente, uma melhor apresentação dos dados. Assim, quando falamos na organização, sumarização e descrição dos dados, as mesmas são feitas tendo como referência as tabelas e os gráficos. Antes de anali- sarmos tais ferramentas, temos associadas à forma de apresentação dos dados duas definições básicas, que são: dados brutos e rol. • Dados Brutos: trata-se de uma sequência de dados numéricos não organiza- dos, obtidos da observação de um fenômeno coletivo (são os dados na sua for- ma bruta). Por exemplo, as idades de três pessoas: Bruno tem 42 anos, Daiana tem 28 anos e Cauã tem 20 anos. Assim, estaríamos descrevendo os dados da forma natural que os coletamos, sem uma dada ordem. • Rol: é a sequência ordenada dos dados brutos. Logo, para os dados brutos des- critos anteriormente, teríamos como rol 20, 28, 42. A seguir, vamos descrever o procedimento de criação de tabelas envolvendo alguns tipos de frequências em conjunto com os intervalos de classes. Vamos lá? 1.4.1 Tabelas de distribuição de frequências Salientamos que uma distribuição de frequências é um procedimento da Estatística pertinente para a apresentação de grandes massas de dados, numa forma que torna mais clara a tendência dos dados em questão. Uma distribuição de frequência é um agrupamento de dados em classes, exibindo o número ou percentagem de observações em cada classe. Pode ser apresentada sob a forma gráfica ou tabular (LEVINE, 2012). Quando este agrupamento é feito em disposição retangular ou tabelas, aparece a nomenclatura tabela de distribuição de frequências. Para ilustrarmos como proceder na organização de um conjunto de dados em uma tabela de distribuição de frequên- cias, vamos considerar uma situação específica: construir a tabela de distribuição de frequências para os tempos de serviço (em meses) de uma amostra de 50 colabora- dores da empresa fictícia AFA Logística. Raciocínio analítico e Quantitativo 27 Tempos de serviço ordenados dos funcionários da AFA Logística 18 – 20 – 20 – 21 – 22 – 24 – 25 – 25 – 26 – 27 – 29 – 29 – 30– 30 – 31 – 31 – 32 – 33 – 34 – 35 – 36 – 36 – 37 – 37– 37 – 37 – 38 – 38 – 38 – 40 – 41 – 43 – 44 – 44 – 45– 45 – 45 – 46 – 47 – 48 – 49 – 50 – 51 – 53 – 54 – 54 – 56 – 58 – 62 – 65 De acordo com Martins (2010), a construção de uma tabela de distribuição de frequências engloba três passos fundamentais, que são: construção do rol e cálculo da amplitude total dos dados, determinação do número de classes e descrição do tamanho dos intervalos de classe. Vejamos como utilizar esses passos na situação que estamos analisando: 1° Passo: Construção do rol e Cálculo da Amplitude Total (R): Inicialmente, observe que os dados da nossa situação já estão organizados em ordem crescente. Além disso, saiba que a amplitude total (R) é dada por: R = Maior medida – Menor medida Logo: R = 65 – 18 = 47 A amplitude total da nossa amostra, 47, será utilizada diretamente para a descrição da dimensão do intervalo das nossas classes. 2° Passo: Como a ideia é de agrupamento em classes, é necessário dizermos quantas classes e qual a dimensão do intervalo de classes da nossa tabela. Denotemos por (K) o número de classes e por (h) o tamanho do intervalo de classes. Pode-se utilizar intervalos com tamanhos iguais ou desiguais. Comumente, esco- lhem-se tamanhos iguais, sendo que existem alguns critérios para a determinação do númerode classes, desde expressões específicas até regras empíricas. Aqui, esta- remos utilizando a Fórmula de Sturges, que é descrita por: K ≅ 1 + 3,33 . log n Onde: n = número de elementos que se deseja representar log n: denota o logaritmo decimal de n RACIOCÍNIO ANALÍTICO E QUANTITATIVO 28 Desta maneira, para os nossos propósitos, escrevemos: K ≅ 1 + 3,33.log 50 = 1 + 3,33 . (1,698970004) = 6,657570114 ≅ 7 3° Passo: Quanto ao tamanho dos intervalos (iguais) das classes h: h ≅ R ÷ K Logo, temos que: h ≅ 47 ÷ 7 = 6,714285714 ≅ 7 Tanto para o valor do número de classes quanto para o tamanho dos intervalos, sempre arre- dondar para o primeiro número inteiro logo acima. Quanto aos limites das classes, que são os valores que limitam as classes ou extremos das classes, de acordo com Martins (2010), usa-se: Classe: 18 |---- 25 Interpretamos que nessa classe encontram-se todos os elementos que são maiores ou iguais a 18 e estritamente menores do que 25 (não considerando o 25). Observe que iniciamos a descrição das classes a partir do menor valor do conjunto somando 7 (amplitude da classe) e, consequentemente, utilizando-se do mesmo racio- cínio para todas as classes. Chamamos de Fi a frequência absoluta de elementos da classe i, ou seja, a quan- tidade de elementos que pertencem à classe i. Note que a frequência absoluta de cada classe representa o número de valores que temos em cada classe. Similarmente, a frequência relativa da classe i, denotada por Fi , é definida pelas expressões Fi n fi= ou Fi N fi= , onde: n: é o número de elementos da amostra (para amostragem) N: é o número de elementos da população (para recenseamento) Observe que a frequência relativa nada mais é do que a divisão da frequência absoluta pelo número total de casos que temos, independentemente de termos uma amostra ou população. Como a nossa variável de estudo deve ser agrupada em classes, às vezes é inte- ressante a caracterização de seus pontos médios, os quais designaremos por xi, que nada mais é do que a soma entre os limites da classe dividido por 2. Os pontos médios, por exemplo, podem ser utilizados na caracterização da média quando os dados são representados em classes. Também pode ser importante os valores das frequências absolutas acumuladas Fac e das frequências relativas acumuladas fac. Acumulada no sentido de irmos somando os valores das anteriores. Raciocínio analítico e Quantitativo 29 Observe então que, de acordo com os nossos dados referentes aos tempos de serviço dos colaboradores da AFA Logística, a nossa primeira classe incluirá todos os tempos maiores ou iguais a 18 meses e menores do que 25 meses, pois os limites da 1° classe são 18 e 25, já que 25 = 18 + 7. Assim, montamos a tabela da distribuição de frequências dos tempos de serviço da AFA Logística como segue: Distribuição de frequências dos 50 colaboradores da AFA Logística © F ab ri CO Classes 1 2 3 4 5 6 7 Somas 6 10 13 8 6 5 2 50 12 20 26 16 12 10 4 100 6 16 29 37 43 48 50 0.12 0.32 0.58 0.74 0.86 0.96 1.00 12 32 58 74 86 96 100 21.5 28.5 35.5 42.5 49.5 56.5 63.5 6/50=0.12 0.20 0.26 0.16 0.12 0.10 0.04 1 18 |---- 25 25 |---- 32 32 |---- 39 39 |---- 46 46 |---- 53 53 |---- 60 60 |---- 67 Intervalos de Classes Ft ft Fac fac %ac% xt Podemos concluir, a partir da tabela anterior, que: • A grande maioria dos colaboradores da AFA Logística têm tempo de serviço entre 32 e 38 meses (observe o maior valor na coluna fi); • Somente 4% dos colaboradores possuem tempos de serviço iguais ou superio- res a 60 meses, sendo 65 meses o maior tempo de serviço do grupo; • 58% dos colaboradores da amostra têm tempos de serviço inferiores a 38 me- ses, sendo 18 meses o menor tempo de serviço do grupo. Os gráficos e tabelas são importantes para uma representação mais organizada e estruturada das informações obtidas a partir de determinado estudo, permitindo assim conclusões mais rápidas e relevantes sobre o conjunto de dados pesquisados. É por esse motivo que recorrentemente vemos em revistas e outras publicações a apre- sentação dos dados na forma gráfica ou tabular. A seguir, vamos aprender a apre- sentar os dados em forma de gráficos. Raciocínio analítico e Quantitativo 30 1.4.2 Principais tipos de gráficos Como já dizia um velho ditado chinês: “O gráfico ou figura consegue transmitir a ideia de mil palavras”. Já sabemos que os gráficos representam uma das mais simples formas de transmissão das informações contidas em diferentes conjuntos de dados, além de permitirem a compreensão de maneira simples e eficiente de aspectos e rela- ções numéricas. Quando falamos sobre a representação de dados na forma gráfica, primeira- mente ressaltamos que existe um grande quantidade de tipos de gráficos, que, obvia- mente, serão utilizados de acordo com o estudo em questão. Temos gráficos que exprimem simplesmente a tendência dos dados, outros que descrevem os valores que fogem da realidade do conjunto ou até mesmo os que reproduzem informações importantes a respeito da quantidade de itens produzidos com defeito em uma linha de produção, por exemplo, e que, por consequência, esclarece-nos com relação ao controle estatístico do processo em questão. Dentre os diversos tipos de gráficos existentes nos procedimentos (métodos e técnicas da Estatística), citamos alguns a seguir. Modelos de gráficos de Estatística © F ab ri CO Histograma Grá�co de barras Grá�co de pizza Grá�co de dispersão Boxplot Grá�cos de linha Descrevemos alguns deles, como segue: • Gráfico de barras: é uma disposição gráfica formada por barras retangulares cujo comprimento depende dos valores que ele representa. Em outras pala- vras, é uma representação que se utiliza de barras na vertical ou na horizontal para a representação dos dados. Comumente, este tipo de gráfico é conhecido como gráfico de colunas. Raciocínio analítico e Quantitativo 31 • Gráfico de pizza: é uma disposição gráfica ou um diagrama na forma de círculo em que descrevemos os valores de cada categoria estatística. Comumente ele é chamado de gráfico de setores ou gráfico circular. • Gráfico de Linhas: é uma disposição gráfica na qual exibimos as informações por meio de vários pontos, denominados de marcadores, que ligamos por seg- mentos de linhas. © P la n- B / / S hu tt er st oc k © k ol op ac h / / S hu tt er st oc k © b ill da yo ne / / S hu tt er st oc k © K m an nn / / S hu tt er st oc k © R am cr ea ti v / / S hu tt er st oc k © N _B el on og ov / / S hu tt er st oc k Raciocínio analítico e Quantitativo 32 • Histograma: é uma disposição gráfica de barras que permite a visualização da distribuição de frequências de um conjunto de dados, isto é, permite visualizar a frequência de ocorrência dos valores observados. • Gráfico de Dispersão: é um gráfico no qual cada ponto representa um par orde- nado de valores, permitindo visualizar a relação entre duas variáveis em estudo. 5,005,00 4,50 4,00 3,50 3,00 2,50 2,00 10/09 17/09 24/09 01/10 05/10 LIC 5 10 15 200 295,8 295,6 295,4 295,2 295 294,8 294,6 294,4 294,2 294 ITENS DA AMOSTRA RE SU LT A D O S O BT ID O S GRÁFICO DE DISPERSÃO DA AMOSTRA Amostra 1 LSC LM • Boxplot: também conhecido como gráfico de caixa, é uma ferramenta gráfica ex- ploratória de dados. Utiliza basicamente um retângulo e dois segmentos de reta, sendo possível a verificação da posição central do conjunto ordenado dos dados. 100.000 90.000 80.000 70.000 60.000 50.000 40.000 30.000 20.000 10.000 1 2 3 4 5 6 A B C 50 45 40 35 30 25 20 15 10 5 0 © Fa br iC O © Fa br iC O © Fa br iC O © Fa br iC O © m ar ek ul ia sz / / S hu tt er st oc k © H ilc h / / S hu tt er st oc k Raciocínio analítico e Quantitativo 33 É pertinente comentarmos que nem sempre,para criarmos um gráfico de modo algébrico, teremos uma tarefa fácil e cômoda. Por isso, é interessante a utilização da implementação numérica com o uso de alguns programas computacionais. Temos várias opções de softwares voltados para a construção de gráficos diversos. Entre eles, citamos: SPSS, MInitab, R e Excel. No que se refere especificamente ao SPSS, de acordo com Moore (2006), trata-se de um software aplicativo (programa de compu- tador) do tipo científico. Originalmente, o nome era acrónimo de Statistical Package for the Social Sciences, “Pacote Estatístico para as Ciências Sociais”. Patenteado pela IBM, é um dos programas computacio- nais mais utilizados em todo mundo, conhecido em mais de 100 países. Pode-se observar, então, que a habilidade na resolução de problemas, seja analiticamente ou quantitativamente, pode estar ligada ao domínio de ferramentas quantitativas. Desta forma, surge a Estatística, com as suas técnicas e métodos para estudo dos fenômenos coletivos. Ressalta-se que a procura por profissionais que possuam uma formação mais sólida e dinâmica cresce cada vez mais por conta da acir- rada concorrência no mundo globalizado. O conhecimento de Estatística é atualmente indispensável para a obtenção do sucesso organizacional, pois permite tomar decisão com confiabilidade e, por conse- guinte, a maximização dos resultados. Especificamente falando, fica evidente, então, que a interpretação de um conjunto de dados se torna uma etapa indispensável. É importante lembrar que um estudo qualquer em Estatística está fundamentado nos conceitos funda- mentais: população, amostra, parâmetro, estimador, variável, elementos, observação e dados, sendo que o estudo em si pode ser realizado sobre a população (recenseamento) ou amostra (amostragem). Quando se realiza a amostragem, deve-se ter o cuidado de que o subconjunto escolhido para estudo (amostra), que tende a representar fielmente a população, tenha sido selecionado de forma coerente e estruturada, por meio dos tipos de amos- tragem probabilística, que são a aleatória simples, sistemática, por conglomerados ou estratificada. Deve ficar claro que a Estatística é de fundamental importância para a o plane- jamento, desenvolvimento e acompanhamento de produtos, serviços, projetos e processos diversos. Raciocínio analítico e Quantitativo 34 Referências CRESPO, A. A. Estatística Fácil. 19. ed. São Paulo: Saraiva, 2009. LEVINE, D. M.; BERENSON, M. L.; Stephan, D. Estatística: teoria e aplicações. 6. ed. Rio de Janeiro: LTC, 2012. MARTINS, Gilberto de Andrade. Estatística geral e aplicada. 03 ed. Rio de Janeiro: Atlas, 2010. MOORE, David. A Prática da Estatística Empresarial: como usar dados para tomar deci- sões. Rio de Janeiro: LTC Editora, 2006. NOVAES, D. V.; COUTINHO, C. de Q. e S. Estatística para Educação Profissional e Tecnológica. 02 ed. São Paulo: Atlas, 2013. TIBONI, C. G. R. Estatística Básica: para os cursos de administração, ciências contábeis, tecnológicos e de gestão. São Paulo: Atlas, 2010. 2 Medidas Descritivas A Estatística Descritiva trata de descrever e organizar os dados mensurados, para que seja possível visualizar as informação mais importantes ao analisar o material na etapa que conceituamos como Estatística Indutiva. Em outras palavras, as medidas descritivas que constituem a Estatística Descritiva servem como alicerce para o desenvolvimento de metodologias de reso- lução de problemas na Estatística Indutiva, que interpreta e analisa os dados. Sabe-se, por exemplo, que as tabelas de distribuição de frequências permitem estabelecer o padrão de variabilidade de uma dada variável ou conjunto de dados. Todavia, trabalhar com distribuição de frequências pode ser complicado, o que torna necessária a caracterização de medidas descritivas de dados. As tabelas de distribuição de frequência são tabelas que trazem as frequências absolutas e relativas, apresentando os dados no formato de faixa de valores ou intervalos de classes. A Estatística Descritiva tem como ferramentas um leque de medidas descritivas, chamadas de medidas de centralidade, de dispersão, separatrizes, de assimetria e de achatamento. As medidas de centralidade e de dispersão são, sem dúvida, as mais importantes. São ferramentas primordiais na resolução de problemas práticos, desde a descrição de indicadores financeiros até a caracterização de medidas envolvendo o controle de processos que visam mensurar a variabilidade em sistemas produtivos. As medidas de assimetria, por outro lado, descrevem o desvio de uma distri- buição de uma curva padrão, enquanto que as medidas de curtose mensuram o grau de achatamento das distribuições estudadas. Nesse contexto, este capítulo tem como objetivo apresentar as medidas descri- tivas, desde as de centralidade até as de achatamento, assim como suas principais propriedades e especificidades. Discutiremos aspectos teóricos que, sem dúvida, contribuirão para a uma sólida formação na área de atuação que você escolheu e que poderão ser aplicados a diversas situações do seu cotidiano. Raciocínio analítico e Quantitativo 36 2.1 Medidas de Centralidade As medidas de centralidade, comumente conhecidas como medidas de posição ou medidas de tendência central ou promédias, são medidas de tipificação de um conjunto de dados, ou seja, que descrevem o valor mais típico daquele conjunto. Elas podem ser visualizadas de diversas maneiras distintas. A opção mais adequada depende do que se deseja descrever em cada estudo estatístico. As medidas de centralidade servem para localizar a distribuição de frequências sobre o eixo de variação da variável em estudo. As mais relevantes medidas de centralidade são a média aritmética, a mediana e a moda, cada uma com as suas propriedades específicas de definição e aplicação. As médias geométrica, harmônica, ponderada, quadrática, cúbica e biquadrática são também medidas de tendência central, porém, com utilização limitada na descrição formal de dados. A seguir, vamos apresentar as médias aritmética, geométrica e ponderada. Você já deve estar familiarizado com a média aritmética, que aparece frequentemente no dia a dia. 2.1.1 Média Aritmética, Média Geométrica e Média Ponderada Quando falamos da descrição de valores centrais para um conjunto de dados, por conta de propriedades matemáticas importantes, a média aritmética, a média geomé- trica e a média ponderada são as mais utilizadas. Vamos descrevê-las a seguir. A média aritmética é a mais comum das medidas de centro (MARTINS, 2010). Ela pode ser entendida como a divisão entre a soma dos valores do conjunto e o número total de valores do conjunto. Utilizamos a média aritmética para calcular a média de uma população, que chamamos de média populacional, ou a média de uma amostra, que conhecemos por média amostral. A média populacional considera todas as observações, o seja, o total dos elementos de um universo, o todo. Já a média amostral considera parte das obser- vações de uma população, ou seja, uma parte dos elementos que compõem o todo. Quando se trata de calcular a média de uma população (com n observações x1, x2, ..., xn), a média aritmética é usualmente representada pela letra grega μ e chamada média populacional. Já para calcular uma amostra (com n observações x1, x2, ..., xn), falamos em média amostral e denotamos por x. Raciocínio analítico e Quantitativo 37 Simbolicamente, escrevemos: μ = ∑ i = 1 n xi n (média populacional) E x = ∑ i = 1 n xi n (média amostral) Vejamos a seguir dois casos ilustrativos de aplicabilidade das médias aritméticas populacional e amostral. Problema: O gestor responsável por um super- mercado tem interesse em mensurar a movimen- tação de clientes em seu estabelecimento pelo cálculo da média populacional de pessoas que circulam no estabelecimento. Realizou um estudo em determinada semana e registrou o seguinte: 295 pessoas passaram por lá no primeiro dia, 1002 no segundodia, 941 no terceiro dia, 768 no quarto dia e 1283 no quinto dia. Qual é o número médio de clientes (média populacional) que transitaram no estabelecimento durante o período de mensuração? Solução: Para cálculo da média populacional (μ), temos que: μ = ∑ i = 1 n xi n Nos últimos cinco dias (n), transitaram no supermercado um total de: 295 + 1002 + 941 + 768 + 1283 = 4289 pessoas. Portanto: μ = ∑ i = 1 n xi n = 295 + 1002 + 941 + 768 + 1283 5 = 4289 5 = 857,80 Resposta: A média populacional ou número médio de indivíduos que passaram pelo supermercado naqueles cinco dias foi 857,80. © ro bu ar t / / Sh ut te rs to ck Raciocínio analítico e Quantitativo 38 Agora, vamos analisar um problema em que trabalharemos com uma média amostral. Problema: Em uma pesquisa de mercado para a caracterização do perfil de consumidores de refrigerantes em uma dada escola, foram amostradas as idades de seis alunos conforme os valores descritos a seguir: 18, 20, 16, 22, 20, 18 Qual a idade média da amostra de alunos pesquisada? Solução: Neste caso, para calcularmos a idade média devemos encontrar o valor da média dos valores amostrados. Utilizaremos a expressão apresentada anterior- mente para o cálculo de média amostral, ou seja: x = ∑ i = 1 n xi n = 18, 20, 16, 22, 20, 18 6 = 114 6 = 19 anos Resposta: Neste caso, a idade média da amostra de alunos pesquisados é igual a 19 anos. A média geométrica, por sua vez, para n valores x1, x2, ..., xn, é encarada como o produto de todos os valores do conjunto elevado ao inverso do número dos membros, ou seja, ela é a raiz n-ésima do produto de todos eles. Ela é usada para a determinação de taxas médias em ocasiões específicas. Observe que, contrariamente à média aritmética simples, que utiliza a soma dos valores, a média geométrica descreve a centralidade do conjunto de valores usando o produto deles. Ela é denotada por xg. Em símbolos matemáticos, escrevemos: xg = √x1 · x2 · ... · xn Exemplificando: se tivermos um conjunto formado pelos valores 10, 60 e 360, a média geométrica é determinada por xg = √10 · 60 · 360 = √216000 = 60. Vejamos uma situação prática, adaptada de Martins (2010), envolvendo a média geométrica na resolução de um problema de investimento financeiro pessoal. n 3 3 Raciocínio analítico e Quantitativo 39 Problema: Luiza investiu a quantia de R$ 500,00 no fundo de investimento de um banco estatal. Após um ano de aplicação, essa importância resultou em R$ 650,00. Reaplicando novamente essa última quantia, ao final de mais um ano, Luiza tinha um montante de R$ 910,00. Para saber qual é a taxa média de aumento do seu capital, que cálculo Luiza deve fazer? Solução: Aqui temos uma situação típica de utilização da média geométrica, que será nosso instrumento para calcular a taxa média do aumento de capital da Luiza. Vamos determinar, inicialmente, as taxas de aumento de capital, período a período. Vejamos o quadro a seguir. Taxas de aumento de capital a cada período Período Taxa 2003 – 2004 650 500 = 1,3 2004 – 2005 910 650 = 1,4 Assim sendo, a taxa média é igual a: √(1,3) · (1,4) = 1,3491 Resposta: A taxa média de aumento do capital investido por Luiza no período de 2003 a 2005 (dois anos) foi de 34,91%. A média ponderada é um outro tipo de média, utilizada para o cálculo da média de valores que têm pesos diferentes. É muito utilizada em concursos, para o cálculo da nota dos candidatos quando as provas têm pesos distintos. Obtemos a média ponderada por meio do cálculo da razão, cujo numerador é o produto dos valores do conjunto pelos respectivos pesos e o denominador é a soma dos pesos. Ela é indicada pela simbologia xw. Vejamos uma situação ilustrativa para aplicarmos o conceito de média ponderada. Problema: Consideremos os dados de um estudo estatístico realizado em três cidades do Rio de Janeiro. O objetivo era obter a porcentagem de imóveis que eram ocupados pelos próprios donos. © M or ga nk a / / S hu tt er st oc k Raciocínio analítico e Quantitativo 40 Porcentagens de residências ocupadas pelos proprietários Volta Redonda 40,3 Juiz de Fora 56,4 Petropólis 62,1 De acordo com o estudo, existem 1135 unidades residenciais nos bairros de Volta Redonda, 113 em Juiz de Fora e 210 em Petropólis. Com base nessas informações, qual a taxa média de ocupação de imóveis pelos próprios proprietários nas três cidades consideradas? Solução: Inicialmente, devemos reconhecer as observações e seus respectivos pesos. Em representação simbólica, temos que: x1 = 40,3 e w1 = 1135 x2 = 56,4 e w2 = 113 x3 = 62,1 e w3 = 210 Logo, de acordo com a definição formal da média ponderada, escrevemos: xw = [(1135) · (40,3)] + [(113) · (56,4)] + [(210) · (62,1)] 1135 + 113 + 210 = 44,7 Resposta: A taxa média de ocupação de imóveis pelos próprios proprietários nas cidades estudadas no Rio de Janeiro é igual a 44,7%. A seguir, estudaremos mais dois tipos de médias: a média harmônica e a média quadrática. Vamos conhecê-las? 2.1.2 Média Harmônica e Média Quadrática A média harmônica e a média quadrática são dois outros tipos de médias aritméticas, talvez não tão frequentes para você como as citadas anteriormente. A média harmônica está associada ao cálculo matemático de problemas envol- vendo grandezas inversamente proporcionais. A média harmônica de um conjunto de valores xi é o inverso da média aritmética dos inversos, conforme descrito na expressão a seguir. Dessa maneira, se tivermos um conjunto com n valores x1, x2, ..., xn, matematicamente, a média harmônica xh é dada por: Raciocínio analítico e Quantitativo 41 xh = 1 1 x1 + 1 x2 + ... + 1 xn n = 1 ∑ i = 1 n 1 xi Vejamos uma situação ilustrativa envolvendo a média harmônica Problema: Cauã estava voltando do trabalho quando passou por uma loja de roupas em promoção. Adquiriu quatro camisetas ao preço unitário de R$ 30,00 e duas camisetas a R$ 50,00 cada uma. Qual o preço médio pago por Cauã por cada camiseta? Solução: Observe que podemos, inicialmente, interpretar o problema e registrar que Cauã gastou R$ 120,00 em camisetas (4 camisetas de R$ 30,00 a unidade) e R$ 100,00 (comprando 2 camisetas de R$ 50,00 a unidade). Nesse caso, os valores seriam os preços das camisetas, e seus pesos as quantidades pagas em cami- setas. Dessa forma, a partir da expressão da média harmônica, temos que: xh = 1 120 · ( 1 30 ) + 100 · ( 1 50 ) 120 + 100 = 1 120 30 + 100 50 220 = 1 4 + 2 220 = 220 4 + 2 = 36,67 Resposta: O preço médio pago por Cauã por camiseta foi de R$ 36,67. Dando seguimento ao nosso estudo, vamos conhecer a média quadrática. Denominamos de média quadrática de um conjunto de n valores x1, x2, ..., xn a raiz quadrada da média aritmética dos quadrados. Denotando a média quadrática por xq, escrevemos: xq = ∑ i = 1 n xi 2 n © s ho ck fa ct or .d e / / S hu tt er st oc k Raciocínio analítico e Quantitativo 42 Dessa maneira: • Se tivermos o conjunto de valores {2, 2, 2}, então sua média quadrática será dada por: xq = ∑ i = 1 n xi 2 n = 2 2 + 22 + 22 3 = 12 3 = √4 = 2. • Se tivermos o conjunto de valores {2, 3, 4, 5}, então sua média quadrática será dada por: xq = ∑ i = 1 n xi 2 n = 2 2 + 32 + 42 + 52 4 = 54 4 = √13,5 = 3,67. A média quadrática pode ser diretamente utilizada na descrição da variabilidade, mais especi- ficamente no cálculo do desvio padrão, uma das principais medidas de dispersão que estuda- remos mais adiante. Agora que já tratamos da média aritmética e de suas derivativas, é nosso inte- resse descrever a mediana e a moda, que são consideradas duas importantes medidas de centralidade. Esse é o tema do tópico a seguir. 2.1.3 Mediana e Moda A mediana é a medida de centro que divide um conjunto de dados em duas partes iguais. Isso significa que em qualquer conjunto de valores a mediana deixa 50% dos valores acima ou 50% dosvalores abaixo. A mediana é, portanto, o valor que centra um conjunto de valores ordenados, que o divide em duas partes de frequências iguais. Interpretação da mediana © F ab ri COMediana Md 0% 50% 100% Raciocínio analítico e Quantitativo 43 Para obter a mediana, considera-se, inicialmente, o número de elementos do conjunto ordenado. Para um conjunto de dados com n valores, se n for ímpar, a mediana Md será o elemento central (de ordem n + 1 2 ). Caso contrário, se n for par, a mediana Md será a média aritmética entre os elementos centrais (de ordem n 2 e n 2 + 1). Vejamos os exemplos apresentados a seguir. Calculando a mediana de um conjunto com n valores. n par Mediana 2, 3, 3, 4 3 1, 18, 19, 20 18,5 4, 8, 8, 40 8 n ímpar Mediana 1, 2, 3, 5, 6, 7, 8 5 1, 18, 19, 20, 34 19 4, 8, 8,8, 40 8 Agora que vimos o conceito de mediana e sua aplicação, vamos entender o que é a moda. Segundo Crespo (2009), a moda é o valor que mais aparece em uma distribuição, o mais frequente. Observe que, no caso de distribuições em que não temos os inter- valos de classes, uma simples investigação acerca das frequências nos possibilita a descrição formal da moda. Sendo assim, observe que: • O conjunto de dados 3, 3, 8, 8, 8, 6, 10, 32 tem moda igual a 8, isto é, Mo = 8. É um conjunto unimodal (com uma única moda). • O conjunto de dados 1, 5, 5, 5, 6, 7, 8, 8, 8, 9 apresenta duas modas, 5 e 8, logo, é chamado de bimodal. • O conjunto 1, 2, 9, 6, 3, 5 não tem moda. Até esse momento, discutimos o cálculo das medidas de centro para dados não agrupados em classes, ou seja, considerando variáveis discretas. Agora, estaremos apresentando o cálculo da média, moda e mediana para dados agrupados em classes. Raciocínio analítico e Quantitativo 44 2.1.4 Cálculo das medidas de centro para dados agrupados em classes Neste tópico vamos descrever os cálculos envolvendo a média aritmética, a mediana e a moda para dados agrupados em classes, ou seja, o procedimento de cálculos para uma variável contínua. Nesse sentido, a média para dados agrupados em classes é caracterizada pela expressão: x = ∑ xi · Fi n , Onde: n: número de elementos xi: ponto médio da classe i Fi: frequência absoluta da classe i Fac: frequência acumulada Para o cálcuo da mediana envolvendo uma distribuição apresentada em classes, de acordo com Martins (2010), devemos utilizar a seguinte sequência de passos. 1° Passo: Calcula-se a ordem n 2 , independentemente de n ser par ou ímpar. 2° Passo: Por meio da Fa, identifica-se a classe que contém a mediana (classe Md). 3º Passo: Utilizamos a expressão Md = lMd + n 2 – ∑ f · h FMd , onde: lMd = limite inferior da classe Md; n = tamanho da amostra ou número de elementos; ∑ f = soma das frequências anteriores à classe Md; h = amplitude da classe Md; FMd = frequência da classe Md. Com relação ao cálculo da moda, Martins (2010) esclarece que temos uma série de expressões com esse propósito. Aqui, nos basearemos na conhecida fórmula de Czuber. Nesse caso, o cálculo da moda envolve os passos seguintes. Raciocínio analítico e Quantitativo 45 1° Passo: Identificamos a classe modal (classe com maior frequência). 2° Passo: Aplicamos a fórmula MO = lMo + ∆1 ∆1 + ∆2 · h, onde: lMo = limite inferior da classe modal ∆1 = diferença entre a frequência da classe modal e a frequência da classe imediatamente anterior ∆2 = diferença entre a frequência da classe modal e a frequência da classe imediatamente superior h = amplitude da classe modal Vejamos um exemplo ilustrativo para apli- cação das expressões descritas anteriormente envolvendo média, mediana e moda para uma variável contínua. Problema: Alessandra é a engenheira de produção de uma determinada multinacional que fabrica peças para automóveis. Em uma amostra de 56 parafusos produzidos, Alessandra registrou os seguintes dados de comprimento (em mm): Dados do problema Escala de Valores dos Comprimentos (mm) Fi Fac xi 7 |---- 17 6 6 12 17 |---- 27 15 21 22 27 |---- 37 20 41 32 37 |---- 47 10 51 42 47 |---- 57 5 56 52 ∑ 56 Fi: frequência absoluta da classe i Fac: frequência acumulada xi: ponto médio da classe i © M ilo s S to jil jk ov ic / / S hu tt er st oc k Raciocínio analítico e Quantitativo 46 A partir dos dados da tabela apresentada, pede-se: a. O comprimento médios dos parafusos da amostra pesquisada. b. O valor que divide o conjunto de dados em duas partes iguais. c. O valor mais frequente. Solução: Nesse caso, temos que: a. Média = x = ∑ xi · Fi n = 12.6 + 22.15 + 32.20 + 42.10 + 52.5 56 = 1722 56 = 30,75 b. Observe que o valor que divide o conjunto de dados em duas partes iguais é a mediana. Desta maneira, como n = 56, temos que: n 2 = 56 2 = 28°, logo a classe Md = 27 |---- 37, lMd = 27, ∑ f = 21, h = 10 e FMd = 20 (que representa a frequência absoluta da classe que contém a mediana). Desta forma, escrevemos: Md = lMd + n 2 – ∑ f · h FMd = 27 + 56 2 – 21 · 10 20 = 30,50 c. O valor mais frequente é a moda, assim, temos que a classe modal é 27 |---- 37, logo: h = 10, lMo= 27 e ∆1 = 20 – 15 = 5 e ∆2 = 20 – 10 = 10, então: MO = lMo + ∆1 ∆1 + ∆2 · h = 27 + 5 5 + 10 · 10 = 30,33 Resposta: No exemplo, a engenheira Alessandra identificou que: a) o comprimento médio dos parafusos é de 30,75 mm; b) o valor que divide o conjunto em duas partes iguais (mediana) é 30,50 mm; c) a medida de parafuso mais frequente é 30,33 mm. Perceba que as medidas de centralidade nos mostram o centro do conjunto de dados, ou seja, os valores mais típicos do conjunto. Podemos dizer também que as medidas de centralidade são valores que representam, de alguma forma, todo o grupo. Entre as medidas de centro, a mediana é uma medida que divide o conjunto de dados em duas partes iguais. Todavia, temos outras medidas que também dividem um conjunto de dados, conhecidas como medidas separatrizes. Vamos conhecê-las na próxima seção. Raciocínio analítico e Quantitativo 47 2.2 Medidas Separatrizes As medidas separatrizes são medidas que dividem o conjunto de dados em partes homogêneas, ou seja, em partes iguais. As medias separatrizes são os quartis, decis e percentis, que serão trabalhados logo na sequência, cada um com as suas especificidades. 2.2.1 Quartis Os quartis são as medidas separatrizes que dividem um conjunto de dados em quatro partes homogêneas ou iguais. Temos três quartis, que são comumente repre- sentados por: Q1 = 1 0 quartil, deixa 25% dos elementos. Q2 = 2 0 quartil, coincide com a mediana, deixa 50% dos elementos. Q3 = 3 0 quartil, deixa 75% dos elementos. Veja a seguir: Interpretação dos quartis © F ab ri CO 0% 25% Q1 50% 75% 100% Q2=Md Q3 O segundo quartil Q2 na verdade é a própria mediana, já que também divide o conjunto de dados em duas partes exatamente iguais. Logo, a determinação do segundo quartil é exata- mente igual ao cálculo da mediana. Desta forma, vejamos agora a caracterização de cada um deles, de acordo com as suas particularidades. Cabe ressaltar que, basicamente, de acordo com Levine (2012), o procedimento é muito semelhante ao cálculo da mediana apresentado anterior- mente para dados agrupados em classes. Raciocínio analítico e Quantitativo 48 Determinação do 1°quartil 1° Passo: Calcula-se a ordem n 4 . 2° Passo: Identificamos a classe que contém Q1 pela Fac. 3° Passo: Aplicamos a fórmula: Q1 = lQ1 + n 4 – ∑ f · h FQ1 Onde: lQ1 = limite inferior da classe Q1 n = tamanho da amostra ou número de elementos ∑ f = soma das frequências anteriores à classe que contém Q1 h = amplitude da classe que contém Q1 FQ1 = frequência da classe que contém Q1 Determinação do 2°quartil Usamos o mesmo cálculo para determinar a mediana, como demostrado anteriormente. Determinação do 3°quartil 1° Passo: Calcula-se a ordem 3 · n 4 . 2° Passo: Identificamos a classe que contém Q3 pelaFa. 3° Passo: Aplicamos a fórmula: Q3 = lQ3 + 3 · n 4 – ∑ f · h FQ3 Raciocínio analítico e Quantitativo 49 Onde: lQ3 = limite inferior da classe Q3 n = tamanho da amostra ou número de elementos ∑ f = soma das frequências anteriores à classe que contém Q3 h = amplitude da classe que contém Q3 FQ3 = frequência da classe que contém Q3 Vejamos um exemplo ilustrativo para aplicarmos as expressões descritas ante- riormente envolvendo o cálculo dos quartis para uma variável contínua. Problema: Vamos considerar os mesmos dados do processo de fabricação dos para- fusos descritos no problema anterior. Ou seja, temos a amostra de 56 parafusos produ- zidos. Os comprimentos dos parafusos da amostra foram mensurados como segue: Dados do problema Escala de Valores dos Comprimentos (mm) Fi Fac 7 |---- 17 6 6 17 |---- 27 15 21 27 |---- 37 20 41 37 |---- 47 10 51 47 |---- 57 5 56 ∑ 56 Fi: frequência absoluta da classe i Fac: frequência acumulada Com base nesses dados, pede-se as medidas que deixam 25% e 75% das observa- ções deste processo de fabricação de parafusos, assim como as suas interpretações. Solução: Nesse caso, temos que seguir exatamente a sequência de passos descritas anteriormente. 1° Passo: Como n = 56, tem-se que: Ordem de Q1: n 4 = 56 4 = 14° e Ordem de Q3: n 4 = 56 4 = 3 · n 4 = 3 · 56 4 = 42° Raciocínio analítico e Quantitativo 50 2° Passo: Pela Fac identificamos a classe Q1 (que é a 2° classe), pois a ordem de Q1 é 14. Do mesmo modo, ideitificamos a classe Q3 (que é a 4° classe), já que a ordem de Q3 é 42º. Agora, aplicamos as fórmulas, como segue: Para Q1 temos: Q1 = lQ1 + n 4 – ∑ f · h FQ1 = 17 + 56 4 – 6 · 10 15 = 22,33 Para Q3 temos: Q3 = lQ3 + 3 · n 4 – ∑ f · h FQ3 = 37 + 3 · 56 4 – 41 · 10 10 = 38 Resposta: Diante desses resultados, podemos afirmar que, nessa distribuição que descreve o processo de produção dos parafusos: • 25% das observações estão entre 7 e 22,33. • 25% das observações estão entre 22,33 e 30,5. • 25% das observações estão entre 30,5 e 38. • 25% das observações estão entre 38 e 57. Assim como o quartis, outra medida separatriz que também é usada para dividir um conjunto de dados em partes homogêneas são os decis, como veremos a seguir. 2.2.2 Decis Os decis são as medidas separatrizes que dividem um conjunto de dados em dez partes homogêneas ou iguais. Existem nove decis, que são comumente representados por Di com i = 1, 2, 3, 4, 5, 6, 7, 8 e 9. Observe: Interpretação dos decis 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% D1 D2 D3 D4 D5 D6 D7 D8 D9 100% © F ab ri CO Raciocínio analítico e Quantitativo 51 Veja a seguir os passos de cálculo do i-ésimo decil Di, de acordo com Crespo (2009). 1° Passo: Calculamos a ordem i · n 10 , em que: i = 1, 2, 3, 4, 5, 6, 7, 8 e 9. 2° Passo: Identificamos a classe que contém o i-ésimo Di pela Fa. 3° Passo: Aplicamos a fórmula: Di = lDi + i · n 10 – ∑ f · h FDi Onde: lDi = limite inferior da classe Di, i = 1, 2, 3, ..., 9. n = tamanho da amostra ∑ f = soma das frequências anteriores à classe que contém Di h = amplitude da classe que contém Di FDi = frequência da classe que contém Di As aplicações envolvendo os decis serão apresentadas na próxima seção, junto com a conceituação de percentis, que são as medias separatrizes que dividem o conjunto de dados em 100 partes iguais ou homogêneas. 2.2.3 Percentis São as medidas separatrizes que dividem um conjunto de dados em cem partes homogêneas ou iguais. São também chamados de centis. Temos noventa e nove percentis, que são comumente representados por Pi com i = 1, 2, 3, ..., 99. Veja a seguir. Interpretação dos percentis 0% 1% 2% 3% . . . 50% . . . 97% 98% 99% P1 P2 P3 P50 P97 P98 P99 100% De forma análoga aos decis, os passos de cálculo do i-ésimo percentil Pi estão © F ab ri CO Raciocínio analítico e Quantitativo 52 descritos a seguir, conforme Tiboni (2010). 1° Passo: Calcula-se a ordem i · n 100 , em que: i = 1, 2, 3, ..., 98, 99 e 100. 2° Passo: Identificamos a classe que contém o i-ésimo Pi pela Fac. 3° Passo: Aplicamos a fórmula: Pi = lPi + i · n 100 – ∑ f · h FPi Onde: lPi= limite inferior da classe Pi, i = 1, 2, 3, ..., 98, 99 e 100. n = tamanho da amostra ∑ f = soma das frequências anteriores à classe Pi h = amplitude da classe Pi FPi = frequência da classe Pi Vejamos um exemplo ilustrativo de aplicação das expressões descritas anterior- mente envolvendo o cálculo dos decis e percentis para uma variável contínua. O percentil de ordem 75 pode ser visualizado como o quartil de ordem 3, enquanto que o percentil de ordem 80 pode ser visto como o oitavo decil. Problema: A empresa AFA Logísitica é uma empresa de logística conceituada no interior de Minas Gerais, que domina o mercado nacional para a distribuição de mercadorias para grandes empresas automobilísticas e alimentícias. Além do preço e da qualidade dos serviços prestados, outro diferencial da empresa está centrado no tempo de serviço dos funcionários: a grande maioria está há vários anos na empresa. Considere uma amostra de n = 40 funcionários e veja, no quadro a seguir, as classes envolvendo o tempo de empresa (em anos) desse grupo. Raciocínio analítico e Quantitativo 53 Tempos de serviço dos 40 funcionários da AFA Logística Tempos de Serviço (em anos) Fi Fac 4 |---- 9 8 8 9 |---- 14 12 20 14 |---- 19 17 37 19 |---- 24 3 40 ∑ 40 Fi: frequência absoluta da classe i Fac: frequência acumulada A partir dos dados apresentados, pede-se o decil de ordem 4, o percentil de ordem 72 e as interpretações de ambos no contexto do problema. Solução: Neste caso, como n = 40, temos o seguinte desenvolvimento: 1° Passo: Ordem de D4: i · n 10 = 4 · (40) 10 = 16° e Ordem de P72: i · n 100 = 72 · (40) 10 = 28,8° 2° Passo: Pela Fa identificamos a classe que contém D4 (2° classe) e a classe que contém P72 (3° classe). 3° Passo: Agora, utilizamos as fórmulas, como segue: Para D4: D4 = lD4 + 4 · n 10 – ∑ f · h FD4 = 9 + 4 · (40) 10 – 8 · 5 12 = 12,33 Para P72: P72 = lP72 + 72 · n 100 – ∑ f · h FP72 = 14 + 72 · (40) 100 – 20 · 5 17 = 16,59 Resposta: Nessa distribuição, o valor 12,33 divide-a em duas partes: 40% dos elementos da amostra (funcionários) têm tempo de empresa inferior a 12,33 anos e 60% deles têm mais do que 12,33 anos de empresa. O valor 16,59 indica que 72% dos elementos da distribuição (funcionários) possuem tempo de empresa inferior a 16,59 anos, enquanto que 28% dos funcionários apresentam tempo de empresa superior a 16,59 anos. Raciocínio analítico e Quantitativo 54 Agora que já trabalhamos com as medidas de centralidade e com as medidas sepa- ratrizes, vamos descrever os valores que caracterizam a variabilidade de um conjunto de dados. As medidas de dispersão ou variabilidade são o assunto do tópico a seguir. 2.3 Medidas de Dispersão Para a descrição completa de um conjunto de dados, é necessário, além das medidas de centralidade, caracterizar a dispersão ou variabilidade do conjunto em questão. Assim surgem as medidas de dispersão ou variabilidade. Esse aparato diferencia a aplicabilidade da Estatística no mundo cotidiano. As principais medidas de dispersão ou de variabilidade são a variância, o desvio padrão, o Coeficiente de Variação de Pearson e o Erro Padrão, que serão descritas na sequência. 2.3.1 Variabilidade A variabilidade ou dispersão de um conjunto de dados é mensurada diretamente por meio das medidas de dispersão. De acordo com Martins (2010), são medidas esta- tísticas utilizadas para avaliar o grau de variabilidade ou dispersão dos valores em torno da média. Ou seja, mensuram a representatividade da média. Para exemplificar, consideremos as séries numéricas (a) 20, 20, 20 e (b) 10, 30, 20. Observe que as médiasdas duas séries são iguais a 20, ou seja, temos xa = 20 e xb = 20. Além disso, como observa Martins (2010), é interessante notar que, apesar de as séries terem médias iguais, a série (a) não apresenta dispersão em torno da média xa = 20; todavia, os valores da série (b) apresentam dispersão em torno da média xb = 20. Para descrever essa variabilidade, surgem as medidas estatísticas de avaliação do grau de dispersão ou variabilidade de uma variável. Interpretando a variabilidade © F ab ri CO Dispersão x xi Cabe salientar que, na prática empresarial, dividimos a dispersão em absoluta e relativa de acordo com a medida analisada. Neste sentido, a dispersão absoluta é comu- mente dada pelo valor do desvio padrão ou da variância, enquanto que a dispersão relativa é dada pelo Coeficiente de Variação de Pearson ou pelo Erro Padrão. Raciocínio analítico e Quantitativo 55 A dispersão é dita relativa por conta da medida que a caracteriza, já que para o cálculo do Coeficiente de Variação de Pearson ou do Erro Padrão suas expressões levam em consideração o desvio padrão. Vejamos então os detalhes de cada uma das principais medidas de variabilidade ou dispersão. 2.3.2 Variância e Desvio Padrão Como é de interesse mensurar a dispersão dos dados em relação à média, é necessário o cálculo dos desvios de cada valor (xi) em relação à média x, isto é: di = (xi – x) ← desvio de ordem i Nesse sentido, se os desvios di forem baixos, teremos pouca dispersão. Caso contrário, se os desvios forem altos, teremos elevada dispersão. Um fato importante a ser ressaltado é que a soma dos desvios em torno da média é zero (∑di = 0). De acordo com Martins (2010), para o cálculo da variância devemos levar em consideração os quadrados dos desvios, di 2. A variância, S2, de uma amostra de n medidas é igual à soma dos quadrados dos desvios: ∑di 2, dividida por (n – 1). Logo: S2 = ∑di 2 n – 1 = ∑(xi – x) 2 n – 1 (Variância Amostral) Para dados agrupados em classes, temos: S2 = ∑di 2 · Fi n – 1 = ∑(xi – x) 2 · Fi n – 1 Onde, Fi = frequência. Salientamos que, a partir do desenvolvimento do quadrado das diferenças (xi – x) 2 e a soma dos termos comuns, encontramos as seguintes fórmulas práticas para o cálculo da variância amostral: S2 = 1 n – 1 · ∑ xi 2 – (∑ xi) 2 n ou S2 = 1 n – 1 · ∑ xi 2 · Fi – (∑ xi · Fi) 2 n É importante observar que quanto maior o valor de S2, maior a dispersão dos dados amostrais. Raciocínio analítico e Quantitativo 56 Na prática, quando o cálculo é de uma variância populacional σ2, trocamos o denominador n – 1 por n nas fórmulas citadas anteriormente. De acordo com Novaes e Coutinho (2013), para melhor interpretação da dispersão de uma variável ou conjunto de dados, calculamos a raiz quadrada da variância, obtendo o desvio padrão que será expresso na unidade de medida original. Dessa maneira: S = √S2 ← desvio padrão amostral e σ = √σ2 ← desvio padrão populacional Em termos específicos, com relação ao desvio padrão, podemos interpretá-lo a partir do Teorema de Tchebycheff, como segue: Teorema de Tchebycheff Para qualquer distribuição amostral com média x e desvio padrão S, temos que: • O intervalo x ± 2.S, no mínimo, 75% de todas as observações amostrais. • O intervalo x ± 3.S contém, no mínimo, 89% de todas as obser- vações amostrais. Fonte: MARTINS, 2010, p.55. Neste sentido, deve ficar claro que, quanto maior o valor do desvio padrão, maior é a dispersão absoluta do conjunto de dados, ou mais heterogêneo é o conjunto, ou mais dispersos estão seus valores, ou mais afastados. Cabe ressaltar, mais uma vez, que a variância e o desvio padrão são utilizados para mensurar a dispersão absoluta do conjunto de dados, ou seja, a sua verdadeira dispersão. Vamos analisar um problema prático envolvendo o cálculo de variância amostral e padrão amostral. Raciocínio analítico e Quantitativo 57 Problema: Consideremos a distribuição amostral do número de defeitos encon- trados em uma linha de produção de peças automobilísticas da indústria CAR, dada por 2, 3, 4, 5, 7, 10, 12. Pede-se: a. Qual o valor da variância amostral? b. Qual o valor do desvio padrão amostral? Solução: Nesse caso, temos que descrever a variância e o desvio padrão a partir da amostra apresentada pelo problema, utilizando-nos das expressões descritas ante- riormente para amostras. Desse modo, temos que: a. Variância Amostral: S2 ∑ xi2 = [2² + 3² + 4² + 5² + 7² + 10² + 12²) = (4 + 9 + 16 + 25 + 49 + 100 + 144) = 347 (∑ xi)2 = (2 + 3 + 4 + 5 + 7 + 10 + 12)² = (43)² = 1849 Logo: S2 = 1 n – 1 · ∑ xi 2 – (∑ xi) 2 n = 1 7 – 1 · 347 – 1849 7 = 1 6 · [347 – 264,14] = 82,86 6 = 13,81 Portanto, a variância amostral é de 13,81. b. O desvio padrão amostral S é igual a raiz quadrada positiva da variância, ou seja, escrevemos: S = √ S2 =√13,81 = 3,72 Ou seja: o desvio padrão amostral é de 3,72. Resposta: a) A variância amostral é de 13,81 e b) o desvio padrão amostral é 3,72. Vamos apresentar agora as medidas que descrevem a dispersão relativa: o Coeficiente de Variação de Pearson e o Erro Padrão. 2.3.3 Coeficiente de Variação de Pearson e Erro Padrão O Coeficiente de Variação de Pearson, denotado por (C.V), é dado em porcen- tagem e definido como sendo o quociente do desvio padrão pela média, ou seja: C.V = S x x 100, em que, S = desvio padrão amostral e x = média amostral. Raciocínio analítico e Quantitativo 58 No âmbito empresarial, temos algumas regras experimentais para interpre- tarmos o CV. De acordo com Martins (2010), uma das mais usadas é a que segue: • Se: C.V < 15% – tem-se baixa dispersão relativa • Se: 15% ≤ C.V < 30% – tem-se média dispersão relativa • Se: C.V ≥ 30% – tem-se alta dispersão relativa Outra medida de dispersão relativa é o Erro Padrão ou Erro Padrão da Média. Trata-se de uma medida alicerçada no desvio padrão que visa expressar a variabilidade da média, e não a variabilidade dos dados como um todo. Esta é dada pela expressão: Erro padrão = desvio padrão √número de observações = S √n . Vejamos um exemplo ilustrativo para que possamos interpretar as medidas de dispersão citadas anteriormente. Problema: A Companhia XIS é uma empresa especializada na produção de caixas, trabalhando de forma específica com três modelos distintos. Para testar a resistência de cada modelo, tomou-se uma amostra de 100 caixas por tipo e mensurou-se a pressão necessária para romper cada modelo de caixa. Os resultados desses testes estão expostos no quadro a seguir. Teste de resistência Tipos de Caixas A B C Pressão média de ruptura (bária) 160 180 250 Variância das pressões (bária ao quadrado) 1600 2500 3600 Com base nos dados apresentados na tabela, resolveremos as questões a seguir. a. Que tipo de caixa apresenta a menor variação absoluta na pressão de ruptura? Por quê? b. Que tipo de caixa apresenta maior variação relativa na pressão de ruptura? Por quê? c. A dispersão relativa de cada tipo de caixa é baixa, média ou alta? d. Qual é o Erro Padrão para cada tipo de caixa? © R ed D ee r / / Sh ut te rs to ck Raciocínio analítico e Quantitativo 59 Solução: De acordo com os aspectos teóricos e expressões apresentados ante- riormente, as questões são solucionadas da seguinte forma: a. Primeiramente, observe que o problema nos dá as informações a respeito do desvio padrão de cada caixa. Dessa forma, o tipo de caixa que apresenta me- nor variação absoluta na pressão de ruptura será o tipo de caixa com menor desvio padrão. Temos que: Desvio Padrão da Caixa A = sA = √1600 = 40 Desvio Padrão da Caixa B = sB = √2500 = 50 Desvio Padrão da Caixa C = sC = √3600 = 60 Portanto, a caixa A tem menor variação absoluta, pois seu desvio padrão é o menor. b. O tipo de caixa que apresenta maior variação relativa é o tipo de caixa que apresentar maior C.V. Temos que: Coeficiente de Variação da Caixa A = C.VA = SA xA x100 = 40 160 x 100 = 25% Coeficiente de Variação da Caixa B = C.VB = SB xB x 100 = 50 180 x 100 = 27,78% Coeficiente de Variação da Caixa C = C.VC = SC xC x 100 = 60 250 x 100 = 24% Portanto, a Caixa B apresenta a maior dispersão relativa. c. Todos os três tipos de caixas apresentam média de dispersão relativa, já que, para os três tipos, 15% ≤ C.V. < 30%. d. Como n = 100 para cada tipo de caixa, escrevemos: Erro Padrão da Caixa A = SA √n = 40 √100 = 4 Erro Padrão da Caixa B = SB √n = 50 √100 = 5 Erro Padrão da Caixa C = SC √n = 60 √100 = 6 Raciocínio analítico e Quantitativo 60 Observe então que, a partir dos valores encontrados para o Erro Padrão de cada caixa, a caixa C apresenta maior variabilidade relativa a partir da medida do Erro Padrão. Note que no cálculo do Erro Padrão não levamos em consideração o valor da média, o que diferencia essa conclusão da que encontramos na questão “b”. Agora que você já conhece o Coeficiente de Variação de Pearson e entende o que é o Erro Padrão, na próxima seção vamos seguir com nossos estudos caracterizando aqueles pontos que fogem à realidade de um conjunto de dados, que são os outliers, descritos a partir do escore padronizado. 2.3.4 Escore Padronizado e Outliers O Escore Padronizado é outra medida relativa de dispersão associada a uma medida xi. É caracterizado pela expressão z i = xi – x S , em que S é o desvio padrão amostral e x a média amostral. Observe que um escore Zi negativo indica que a observação xi está à esquerda da média, enquanto um escore positivo indica que a observação está à direita da média. Vejamos um exemplo ilustrativo. Problema: São dadas as médias e os desvios das avaliações de duas linhas de produção de uma montadora multinacional na cidade de Betim-MG, como segue. © F ab ri CO Produção 1 Produção 2 x1= 6,5 x2= 5,0 S1= 1,2 S2= 0,9 Imagine que um funcionário que trabalha nas duas linhas de produção apresentou um indicador 7,5 na Produção 1 e um indicador 6,0 na Produção 2. Em qual linha de produção esse funcionário apresentou uma performance melhor? Solução: Para responder a essa indagação, vamos utilizar o escore padronizado relativo a cada uma das produções. Nesse caso, temos que: © w el lp ho to / / S hu tt er st oc k Raciocínio analítico e Quantitativo 61 Rendimento na Linha de Produção 1: Z1 = 7,5 – 6,5 1,2 = 0,83 Rendimento na Linha de Produção 2: Z2 = 6,0 – 5,0 0,9 = 1,11 Resposta: A melhor performance relativa para esse colaborador foi na linha de produção 2, já que Z2 > Z1. Dando seguimento ao nosso estudo, vamos entender agora o que são outliers e por quê é importate descrevê-los na análise de um conjunto de dados. Outliers são encarados como observações discrepantes do conjunto, que podem aumentar a sua dispersão. Ou seja, são os valores que fogem à realidade do conjunto de dados. Para encontrá-los, Martins (2010) diz que podemos calcular o escore padro- nizado zi e considerar outliers as observações cujos escores, em valor absoluto, sejam superiores a 3. Vejamos um exemplo ilustrativo. Problema: Os dados de uma pesquisa de mercado revelaram média 0,243 e desvio padrão 0,052 para uma dada variável quantitativa. As observações 0,380 e 0,455 podem ser consideradas valores da variável em questão? Solução: Tal conclusão será baseada exatamente nos valores dos escores padro- nizados associados, ou seja, aqui temos que: Para xi = 0,380 zi = 0,380 – 0,243 0,052 = 2,63 Para xi = 0,455 zi = 0,455 – 0,243 0,052 = 4,08 Observe que o primeiro escore é menor do que 3 e o segundo é maior do que 3. Portanto, concluímos que o valor 0,380 pode ser considerado uma observação da variável em questão, enquanto que o valor 0,455 é um outlier, portanto, descartável. Agora que trabalharmos com as medidas de dispersão, no próximo tópico vamos estudar a descrição de assimetria e curtose com relação a um conjunto de dados. Raciocínio analítico e Quantitativo 62 2.4 Assimetria e Curtose As medidas chamadas de assimetria e curtose são as que restam para completarmos o leque das estatísticas descritivas, que proporcionam, juntamente com as medidas de posição e de dispersão, a caracterização e a interpretação completa de um conjunto de dados no âmbito da estatística descritiva. Vejamos então os principais pontos e medidas envolvendo a assimetria e curtose. 2.4.1 Aspectos Introdutórios da Assimetria ou Enviesamento Segundo Levine (2012), assimetria significa o grau de afastamento de uma distri- buição com relação a uma unidade de simetria, ou seja, o grau de deformação de uma curva de frequências. É interessante notarmos que, em uma distribuição simétrica, a média, a mediana e a moda têm o mesmo valor. Interpretando a assimetria Simétrica x = Md = Mo f xSimétrica f xAssimétrica positiva Assimétrica à Direita Mo < Md < x f xAssimétrica negativa Assimétrica à Esquerda x< Md < Mo Na imagem anterior, perceba que, com relação a assimetria, temos três situa- ções distintas: na primeira, não temos assimetria e falamos em distribuição simétrica (as medidas de tendência central são todas iguais); na segunda, os dados apresentam anomalia à direita (a moda é menor do que a mediana, que é menor do que a média); na terceira, a assimetria aparece à esquerda (média menor do que a mediana que por sua vez é menor do que a moda). Vejamos agora como mensurar a assimetria por meio de uma medida. 2.4.2 Principais Medidas de Assimetria Segundo Levine (2012), uma medida comumente usada para descrever o grau de assimetria de um conjunto de dados é o coeficiente proposto por Karl Pearson, que pode ser calculado por meio das expressões: © Fa br iC O Raciocínio analítico e Quantitativo 63 AS = x – MO S (1° Coeficiente de Assimetria de Pearson) AS = 3 · (x – Md) S (2° Coeficiente de Assimetria de Pearson) Neste sentido, temos que: • AS = 0, dizemos que a Distribuição é Simétrica. • AS > 0, dizemos que a Distribuição é Assimétrica à Direita. • AS < 0, dizemos que Distribuição é Assimétrica à Esquerda. Aplicaremos a seguir o Coeficiente de Assimetria de Pearson para resolver uma situação ilustrativa. Problema: Consideremos a distribuição de horas extras pagas aos colaboradores da empresa XIS apresentada no quadro a seguir. Salários (R$) 30 |--- 50 50 |--- 100 100 |--- 150 Colaboradores 80 50 30 Qual o tipo de assimetria desta distribuição? Solução: Para respondermos tal indagação é necessário o cálculo do primeiro coeficiente de assimetria de Pearson. Neste caso, a partir dos dados do problema escrevemos a disposição de valores a seguir. Classes Fi xi xi . Fi xi 2 . Fi Fi ÷ h Fa 30 |--- 50 80 40 3.200 128.000 80 ÷ 20 = 4 80 50 |--- 100 50 75 3.750 281.250 500 ÷ 50 = 1 130 100 |--- 150 30 125 3.750 468.750 30 ÷ 50 = 0,6 160 ∑ 160 10.700 878.000 Fi: frequência absoluta da classe i xi: ponto médio da classe i, ou seja, a média entre os limites da classe h: amplitude da classe, ou seja, a diferença entre os limite superior e inferior da classe Fac: frequência acumulada © T C m ak ep ho to / / S hu tt er st oc k Raciocínio analítico e Quantitativo 64 • Média: x = ∑ i = 1 n xi n = 10.700 160 = 66,875, no caso, o resultado da divisão de xi · Fi por ∑Fi • Moda: MO = lMo + ∆1 ∆1 + ∆2 · h = 30 + 80 80 + 30 · 20 = 45,545, sendo que: lMo = limite inferior da classe modal; ∆1 = diferença entre a frequência da classe modal e a frequência da classe imediatamente anterior; ∆2 = diferença entre a frequência da classe modal e a frequência da classe imediatamente superior; h = amplitude da classe modal. • Variância Amostral: S2 = ∑di 2 · Fi n – 1 = ∑(xi – x) 2 · Fi n – 1 = 1 159 878.000 – (10.700) 2 160 = 1.021,62 • Desvio Padrão Amostral: S = √S2 = √1.021,62 = 31,96 • Mediana (Md): x = lMd + n 2 – ∑ f · h FMd = 30 + (80 – 0) 80 ·20 = 50 Segue, então, a aplicação do Primeiro Coeficiente de Pearson: AS = 66,875 – 44,545 31,96 = 0,698 Assim, como AS > 0, dizemos que a distribuição é Assimétrica à Direita. Analogamente à descrição feita para a assimetria, vamos trabalhar agora com a curtose. 2.4.3 Aspectos Introdutórios da Curtose ou Grau de Achatamento De acordo com Martins (2010), a curtose ou “excesso” indica até que ponto a curva de frequências de uma distribuição se apresenta mais afilada ou mais achatada do que uma dada curva padrão, a qual chamamos de curva normal de Gauss. Raciocínio analítico e Quantitativo 65 Interpretando a assimetria f xMesocúrtica Achatamento IGUAL ao da normal de Gauss f xPlaticúrtica Achatamento MAIOR do que o da curva normal de Gauss f xLeptocúrtica Achatamento MENOR do que o da curva normal de Gauss No caso da curtose, note que temos três situações distintas: na primeira, a distri- buição é mesocúrtica (quando possui achatamento equivalente a da normal de Gauss); na segunda, platicúrtica (quando o achatamento é maior com relação à normal de Gauss); na terceira, é leptocúrtica (quando o achatamento é inferior ao da normal de Gauss). Vejamos agora como mensurar a curtose por meio de uma medida. 2.4.4 Principais Medidas de Curtose Segundo Martins (2010), a avaliação do grau de curtose de uma curva pode ser feita comumente por meio do coeficiente percentílico de curtose, o qual é denotado por k. Esse coeficiente é caracterizado pela expressão: k = Dq C90 – C10 , onde: • Dq = desvio quartílico = Q3 – Q1 2 • C90 = nonagésimo centil • C10 = décimo centil Para os resultados dessa expressão, temos as seguintes interpretações: • Se k = 0,263 ⇒ Curva Mesocúrtica • Se k > 0,263 ⇒ Curva Platicúrtica • Se k < 0,263 ⇒ Curva Leptocúrtica © F ab ri CO Raciocínio analítico e Quantitativo 66 Agora, para facilitar o entendimento da aplicação desses conceitos, vamos analisar um caso prático. Problema: Consideremos novamente os dados do processo de fabricação dos parafusos (amostra de 56 parafusos produzidos). Os comprimentos dos parafusos da amostra foram mensurados como segue. Dados do problema Escala de Valores dos Comprimentos (mm) Fi Fac 7 |---- 17 6 6 17 |---- 27 15 21 27 |---- 37 20 41 37 |---- 47 10 51 47 |---- 57 5 56 ∑ 56 Fi: frequência absoluta da classe i Fac: frequência acumulada Nesse caso, qual o tipo de curtose apresentado por essa distribuição amostral? Solução: No problema proposto, temos que: Para Q1 temos: Q1 = lQ1 + n 4 – ∑ f · h FQ1 = 17 + 56 4 – 6 · 10 15 = 22,33 Para Q3 temos: Q3 = lQ3 + 3 · n 4 – ∑ f · h FQ3 = 37 + 3 · 56 4 – 41 · 10 10 = 38 Logo, Dq = desvio quartílico = Q3 – Q1 2 = 38 – 22,33 2 = 15,67 2 = 7,835 Além disso, para o cálculo do coeficiente de curtose k, devemos encontrar também P90 e P10, ou seja: Raciocínio analítico e Quantitativo 67 P10 = lP10 + 10·n 100 – ∑ f · h FP10 = 7 + 10·(56) 100 – 0 · 10 6 = 16,33 P90 = lP90 + 90·n 100 – ∑ f · h FP90 = 37 + 90·(56) 100 – 41 · 10 10 = 46,4 Portanto, temos que: k = Dq P90 – P10 = 7,835 46,4 – 16,33 = 7,835 30,07 = 0,260 Resposta: Como k = 0,260 < 0,263 k, concluímos que, com relação à curtose, a distribuição amostral em questão é leptocúrtica. Neste capítulo, vimos que, para a sumarização de um conjunto de dados, além da descrição tabular por meio das distribuições de frequências e da descrição gráfica por meio de gráficos, é de fundamental importância descrevê-los por meio das medidas descritivas, que são as células fundamentais da Estatística Descritiva. Em resumo, as medidas descritivas se dividem em medidas de centro e medidas de dispersão ou medidas de variabilidade. Uma medida de centralidade tende a repre- sentar o meio do conjunto de dados, ou seja, o valor mais típico, enquanto que uma medida de dispersão tende a representar a variação dos valores das observações a contar da média. A medida de centralidade mais conhecida é a média aritmética, por conta de suas propriedades matemáticas importantes para a solução de problemas do dia a dia. Já o desvio padrão pode ser encarado como a principal medida de dispersão, já que caracteriza a verdadeira dispersão de um conjunto de dados. As medidas de centralidade e de dispersão, juntamente com as medidas separar- tizes, de assimetria e curtose, são medidas descritivas importantes para a caracteri- zação e sumarização de um conjunto de dados envolvendo números. Elas nos mostram os valores típicos do conjunto e a sua dispersão, além de informações importantes com relação a simetria e achatamento. Raciocínio analítico e Quantitativo 68 Referências CRESPO, A. A. Estatística Fácil. 19. ed. São Paulo: Saraiva, 2009. LEVINE, D. M; STEPHAN, D. M; KREHBIEL, T. C; BERENSON, M. L. Estatística: teoria e aplicações. 06. ed. Rio de Janeiro: LTC, 2012. MARTINS, G. A. Estatística geral e aplicada. 03. ed. Rio de Janeiro: Atlas, 2010. NOVAES, D. V.; COUTINHO, C. Q. S. Estatística para Educação Profissional e Tecnológica. 02. ed. São Paulo: Atlas, 2013. TIBONI, C. G. R. Estatística Básica: para os cursos de administração, ciências contábeis, tecnológicos e de gestão. São Paulo: Atlas, 2010. 3 Análise Combinatória Um dos tópicos da Matemática bastante presente em situações do nosso coti- diano é a Análise Combinatória. Você já deve ter observado, por exemplo, que temos um número excessivo de veículos automotivos e motocicletas no Brasil, perguntando- -se: quantas placas de carros diferentes podemos formar com três ou quatro alga- rismos? Se alguma vez jogou ou conhece alguém que joga na loteria, provavelmente já se perguntou qual a quantidade de combinações diferentes que podemos fazer com os números de um cartão e qual a chance de ganhar com uma única aposta. Questões como essas, que exigem a organização e a contagem de grupos, constituem o objeto básico de estudo da Análise Combinatória. Podemos considerar que a Análise Combi- natória é a parte da Matemática que estuda os critérios e regras para a descrição da quan- tidade de possibilidades de acontecimentos em um agrupamento sem que seja necessário desenvolvê-los. Em outras palavras, é o ramo da Matemática que estuda as técnicas de contagem de agrupamentos que podem ser feitos com os elementos de um conjunto. É interessante observar que, basicamente, podemos formar dois tipos de agru- pamentos: um em que se leva em consideração a ordem dos elementos dentro do agrupamento e outro no qual a ordem dos elementos é indiferente. Especificamente falando, se desejarmos contar quantas placas de licença de veículos automotivos podem ser confeccionadas, compostas por 3 letras em sequência seguidas de 4 alga- rismos, devemos levar em conta a ordem das letras e dos algarismos, conforme nos mostra a figura a seguir. Agrupamento em que a ordem importa APA 1973 FAA 1973 São dois agrupamentos diferentes para duas placas diferentes. © L eo na rd Z hu ko vs ky // S hu tt er st oc k RACIOCÍNIO ANALÍTICO E QUANTITATIVO 70 Contrariamente, se for de nosso objetivo a contagem de quantas quinas são possíveis de serem sorteadas na loteria, a ordem dos números escolhidos para compor a quina em questão não importa. Observe a figura a seguir. Agrupamento em que a ordem não importa 01, 11, 13, 91, 00 91, 11, 01, 00, 13 São dois agrupamentos diferentes para um mesmo jogo. As duas ilustrações anteriores nos mostram como é importante descrevermos uma técnica de contagem, mesmo que seja de forma indireta, ou seja, sem listar um por um os elementos e depois contá-los – tarefa que, além de ser mais complexa, pode nos levar ao erro por omissão ou até mesmo pela repetição de algum agrupamento. A Análise Combinatória é aplicada nas mais diversas áreas do conhecimento e campos de ativi- dade. Em particular,ela é muito utilizada na teoria de probabilidades e no desenvolvimento do Binômio de Newton. Este capítulo aborda a interpretação e a aplicação das principais ferramentas da Análise Combinatória na resolução de diversos problemas simulados do dia a dia, assim como as suas principais propriedades e especificidades. Sem dúvida nenhuma, esses aspectos teóricos contribuirão para que você tenha uma formação sólida na sua área, pois poderão ser aplicados em diversas situações do seu cotidiano profissional. 3.1 Introdução a Análise Combinatória Segundo Bezerra (2001), os problemas associados à Análise Combinatória são, na verdade, problemas de contagem. Dessa forma, a abordagem desses problemas tem como alicerce um fato de fácil comprovação, segundo Bezerra (2001, p. 23), comu- mente conhecido como Princípio Fundamental da Contagem ou, simplesmente, Regra do Produto, que apresentaremos e exemplificaremos a seguir. Raciocínio analítico e Quantitativo 71 3.1.1 Princípio Fundamental da Contagem De acordo com Bezerra (2001), primeiramente, é necessário entender que o Princípio Fundamental da Contagem descreve de quantas formas dois ou mais eventos correlacionados podem ocorrer. Esse princípio pode ser enunciado como segue: Um acontecimento é composto de dois estágios sucessivos e independentes. O primeiro estágio pode ocorrer de m modos diferentes; em seguida, o segundo estágio pode ocor- rer de n modos diferentes. Nestas condições, dizemos que “o número de maneiras dife- rentes de ocorrer este acontecimento é igual ao produto m.n”. (MACHADO, 1986, p. 121. Grifo nosso). Falando em problemas de contagem, devemos lembrar, em um primeiro momento, do prin- cípio fundamental de contagem ou regra do produto. Para entender melhor o Princípio Fundamental da Contagem, vejamos um exemplo ilustrativo. Problema: Para fazer a inscrição no vesti- bular, Cauã deve escolher o curso e a universi- dade que deseja cursar. Ele pode escolher entre cinco cursos: Engenharia, Medicina, Odontologia, Arquitetura e Direito. Além disso, todos são ofer- tados em três instituições diferentes: uma univer- sidade estadual, uma federal e uma particular. Nesse contexto, qual é o número total de opções que Cauã tem? Solução: Observemos inicialmente que, de acordo com o Princípio Fundamental da Contagem, o número total de opções que Cauã possui é 5 x 3, ou seja, 15 opções. A ilustração de cada uma dessas opções que Cauã pode escolher é apresentada na figura a seguir, com a utilização da árvore de possibilidades. © a lp ha sp ir it / / S hu tt er st oc k Raciocínio analítico e Quantitativo 72 A árvore de possibilidades de Cauã F E P E F E E E P E F E P M F M E M P M F E P O F O E O P O E E P A F A E A P A F E P D F D E D P D Curso Faculdade Resultado De acordo com Bezerra (2001), uma árvore de possibilidades ou árvore de probabilidades é utilizada para a representação das várias possibilidades de uma permutação ou combinação, ou seja, é um diagrama conveniente para a organização das informações do conjunto de eventos. É interessante observarmos também que o princípio que acabamos de enunciar e exemplificar pode ser generalizado. Em outras palavras, temos que: um aconteci- mento é composto por k estágios sucessivos e independentes, com, respectivamente, n1,n2,…,nk possibilidades cada. Portanto, o número total de maneiras diferentes de ocorrer este evento é dado pelo produto n1.n2...nk. Se uma ação é composta de duas ou mais etapas sucessivas, sendo que cada uma delas pode ser realizada de vários modos distintos, então o número de modos para realizar essa ação é dado pelo produto, cujos fatores são exatamente os modos distintos de realizar cada uma delas. Vejamos mais alguns exemplos que ilustram a aplicabilidade do Princípio Fundamental da Contagem. © F ab ri CO Raciocínio analítico e Quantitativo 73 Problema: Daiana tem uma festa no próximo fim de semana para ir e deseja montar um conjunto calça-blusa para a ocasião. Se Daiana pode esco- lher entre 6 calças e 10 blusas, de quantos modos distintos ela pode formar o seu conjunto? Solução: Primeiramente, devemos observar que a formação do conjunto calça-blusa, a ser realizado por Daiana, envolve duas etapas: escolher a calça e escolher a blusa. Além disso, a escolha da calça pode ser feita de 6 modos diferentes e, para cada um deles, a escolha da blusa pode ocorrer de 10 modos distintos. Portanto, pelo Princípio Fundamental da Contagem, existem 6 x 10 = 60 modos diferentes de Daiana realizar a ação, ou seja, de formar o conjunto calça-blusa. É interessante observar ainda que Daiana, com essas 6 calças e 10 blusas, pode se vestir durante 60 dias sem repetir o mesmo conjunto. Problema: O processo seletivo para trainee de uma grande empresa multinacional era composto por uma prova escrita em que apareceu a questão de contagem descrita a seguir: utilizando os algarismos 1, 2, 3, 4 e 5, quantos números natu- rais com 3 algarismos na sua composição podemos escrever? Destes números naturais, quantos são formados por algarismos diferentes? Solução: Observemos que descobrir quantos números naturais podem ser escritos com 3 algarismos é equivalente a descobrirmos quantos são os modos de formar os números citados. Para formarmos um número com 3 algarismos, temos uma ação composta de 3 etapas sucessivas, que são: a escolha do algarismo das centenas, a escolha do algarismo das dezenas e a escolha do algarismo das unidades. Caracterizando um número com três algarismos Algarismo das centenas Algarismo das dezenas Algarismo das unidades O algarismo das centenas pode ser igual a 1 ou 2 ou 3 ou 4 ou 5. Existem, então, 5 possibilidades para ele. Para cada uma destas possibilidades, o algarismo das dezenas também pode ser escolhido de 5 modos, ou seja, ele pode ser 1 ou 2 ou 3 ou 4 ou 5. Para cada uma das possibilidades anteriores, o algarismo das unidades pode também ser escolhido de 5 modos: 1 ou 2 ou 3 ou 4 ou 5. © M ar id av / / S hu tt er st oc k © R ob er t K ne sc hk e / / S hu tt er st oc k Raciocínio analítico e Quantitativo 74 Portanto, pelo Princípio Fundamental da Contagem, existem 5 x 5 x 5 = 125 modos de realizar a ação, como vemos a seguir: Caracterizando um número com três algarismos Algarismo das centenas Algarismo das dezenas Algarismo das unidades 5 x 5 x 5 = 125 Concluímos, assim, que podemos escrever 125 números diferentes, como 111, 112, 113, 114 etc. Por outro lado, se houver a exigência de que em cada número os algarismos sejam diferentes, há alteração nas possibilidades de escolha para o algarismo das dezenas e o algarismo das unidades. Para as centenas, continuamos com as 5 possibilidades, logo, vamos escolher entre os algarismos 1, 2, 3, 4 ou 5. Para as dezenas, iremos escolher um dos 4 alga- rismos restantes, pois não temos a opção de repetir o primeiro algarismo escolhido. Para as unidades, vamos escolher um dos 3 algarismos restantes, pois não podemos repetir o primeiro e o segundo algarismos escolhidos para as etapas anteriores. Portanto, nesse caso existem 5 x 4 x 3 = 60 modos de formarmos um número com três algarismos distintos. Caracterizando um número com três algarismos distintos Algarismo das centenas Algarismo das dezenas Algarismo das unidades 5 x 4 x 3 = 60 Ou seja, podemos escrever 60 números distintos com algarismos diferentes entre si na situação proposta: 123, 132, 156 etc. Problema: Quantas placas de licença de veículos automotivos podem ser confec- cionadas com 3 letras e 4 algarismos, sendo as letras apenas vogais e sendo os alga- rismos diferentes entre si? Solução: Notemos que confeccionar uma placacom esse formato significa realizar uma ação composta de 7 etapas, como vemos a seguir: Raciocínio analítico e Quantitativo 75 Confeccionando uma placa veicular com 3 letras e 4 algarismos distintos 1a letra 2a letra 3a letra 1o Alg 2o Alg 3o Alg 4o Alg 5 x 5 x 5 x 10 x 9 x 8 x 7 = 630.000 possibilidades. Portanto, com essas especificações, é possível confeccionar 630 000 placas diferentes. A seguir, vamos introduzir as técnicas de contagem que se baseiam exatamente nos três tipos básicos de agrupamentos que são usados nos problemas envolvendo contagem, que são as permutações, arranjos e combinações: 3.1.2 Técnicas de Contagem Para interpretarmos as técnicas de contagem, vamos considerar A = {a, b, c, d, e, f, g, h, i, j}, um conjunto formado por 10 elementos distintos, e vamos considerar os agrupamentos abc, abd e acb. Os agrupamentos abc e abd são considerados sempre diferentes, pois diferem pela natureza de um elemento. Já os agrupamentos abc e acb, que diferem pela ordem dos elementos, podem ser considerados diferentes ou não. Se, por exemplo, os elementos do conjunto A forem algarismos, com A = {0, 1, 2, 3, 4, 5, 6, 7, 8, 9}, e dese- jarmos descrever números com esses algarismos, nesse caso os agrupamentos 12 e 21 são diferentes, pois a diferença de ordem faz com que representem números distintos. Os casos em que os agrupamentos de um problema de contagem são conside- rados diferentes entre si são classificados em: 1. Combinações: quando os agrupamentos diferem pela natureza de pelo menos um de seus elementos. Caso típico: o conjunto A é formado por pontos e o problema é contar as retas determinadas por esses pontos. 2. Arranjos: quando os agrupamentos diferem pela natureza e pela ordem de seus elementos. Caso típico: o conjunto A é formado por algarismos e o problema é contar os números determi- nados por esses pontos. Raciocínio analítico e Quantitativo 76 Diferenciando combinações e arranjos. São agrupamentos que diferem pela natureza de pelo menos um de seus elementos.Combinações São agrupamentos que diferem tanto pela natureza como pela ordem de seus elementos.Arranjos Vamos agora estudar formalmente os três tipos de agrupamentos mais utili- zados na resolução de problemas simulados sobre contagem: Permutações, Arranjos e Combinações. 3.2 Permutações De acordo com Machado (1986), chamamos de permutação a qualquer sucessão de n termos formados com n elementos dados. Assim, observe que com os símbolos +, – e x podemos formar as seguintes sucessões: (+, –, x), (+, x, –), (x, +, –), (x, –, +), (–, +, x), (–, x, +) Cada uma dessas sucessões é uma permutação dos três símbolos em questão. Cabe ressaltar que duas permutações dos mesmos objetos são diferentes caso sejam compostas por objetos em ordem diferente, ou seja, se a ordem dos objetos numa delas é diferente da ordem em que os objetos são colocados na outra. Em linhas gerais, as permutações são representadas com a utilização de parên- teses e separando os termos por vírgula ou ponto e vírgula, como fazemos com as sucessões. Por exemplo, com a palavra LIA podemos formar 6 anagramas, que são: (LIA), (LAI), (ALI), (AIL), (IAL), (ILA). Anagramas são as palavras formadas com as mesmas letras de uma dada palavra colocada. Ou seja, ao alterar a sequência das letras de uma palavra formamos uma nova palavra ou anagrama. Raciocínio analítico e Quantitativo 77 Nas aplicações da Análise Combinatória, geral- mente estamos interessados na quantidade de permutações, arranjos e combinações que podem ser criadas a partir de elementos dados. Para tanto, é necessário o conceito de fatorial, que apresenta- remos na sequência. 3.2.1 Notação Fatorial Podemos dizer, num primeiro momento, que a notação fatorial e, por conse- guinte, o fatorial é utilizado para tornar mais práticas a representação e a execução dos cálculos relativos aos problemas de contagem. Assim, de acordo com Moraes (2013), dado um número natural n > 1, o produto n.(n – 1).(n – 2).(n – 3)...3.2.1 é denominado n fatorial ou fatorial de n e, usualmente, denotado por n!. Em símbolos, escrevemos: n! = n.(n – 1).(n – 2).(n – 3)...3.2.1 (n ∈ ℕ) Observe que: • Para os casos particulares n = 1 e n = 0, define-se 1! = 1 e 0! = 1. • 2! = 2.1 = 2 • 3! = 3.2.1 = 6 • 5! = 5.4.3.2.1 = 120 • = = 7.6 = 42 • (n – 2)! = (n – 2).(n – 3)! • = = = Agora, iniciaremos de forma específica o tratamento das formas de agrupa- mento, estudando as permutações simples. © W in ik i / / S hu tt er st oc k 7! 5! 7.6.5.4.3.2.1 5.4.3.2.1 (n - 1)! (n + 1)! (n - 1)! (n + 1).n.((n - 1)! 1 n.(n + 1) 1 n2 + 1 Raciocínio analítico e Quantitativo 78 3.2.2 Permutações Simples As permutações simples são também conhecidas como permutações sem repe- tição ou permutações de elementos diferentes. Para a tratativa das permutações simples, vamos considerar a seguinte inda- gação: quantas permutações podemos formar com as letras a, b, c, d e e? Note que formar uma destas permutações é uma ação composta de 5 etapas sucessivas: ( ___ , ___ , ___ , ___ , ___ ) Nesse caso, temos que: • 1° etapa: escolha da 1° letra da permutação. Ela pode ser a ou b ou c ou d ou e. Existem, portanto, 5 possibilidade para esta etapa. • 2° etapa: escolha da 2° letra da permutação. Note que para cada possibilidade da 1° etapa, aqui temos 4 possibilidades, uma vez que uma das letras já foi es- colhida na etapa anterior. Por exemplo, se escolhermos a letra a para a etapa inicial, então a 2° letra poderá ser b ou c ou d ou e. • 3° etapa: escolha da 3° letra da permutação. Ela pode ser a ou b ou c ou d ou e. Existem, portanto, 5 possibilidade para essa etapa. Por exemplo, a partir da escolha de d e a, a 3° letra poderá ser b ou c ou e. • 4° etapa: escolha da 4° letra da permutação. Note que aqui temos 2 possibili- dades para escolha das três letras escolhidas nas etapas anteriores. • 5° etapa: Colocação da 5° letra da permutação. Haverá apenas uma única letra para cada escolha das quatro letras anteriores. ( ___ , ___ , ___ , ___ , ___ ) Possibilidades: 5 x 4 x 3 x 2 x 1 = 5! = 120 Pelo Princípio Fundamental da Contagem, concluímos que podemos formar 5.4.3.2.1 permutações diferentes, isto é, existem 120 permutações das cinco letras a, b, c, d e e (ou de cinco objetos distintos quaisquer). Indicamos o número de permutações de cinco elementos por P5, ou seja, temos que P5 = 5! = 120. Em termos gerais, com a mesma argumentação, conclui-se que o número de permutações de n elementos distintos é dado por: Pn = n! Raciocínio analítico e Quantitativo 79 Vejamos mais dois exemplos que ilustram a aplicabilidade da permutação simples. Problema: Quantas anagramas podemos formar com a palavra que dá nome ao nosso país? Solução: Nesse caso, sem dificuldades, percebemos que cada anagrama equi- vale a uma permutação das letras B, R, A, S, I, L. Como temos 6 letras diferentes, o número de anagramas é dado pela permutação de 6 elementos diferentes, ou seja, por P6. Portanto, o número de anagramas da palavra BRASIL é P6 = 6.5.4.3.2.1 = 720. Problema: É sabido que um número par é aquele que é múltiplo de 2 e que o complementar do conjunto dos números pares em relação ao conjunto dos naturais é exatamente o conjunto dos números ímpares. Desse modo, quantos números pares com 6 algarismos distintos podemos escrever, se considerarmos apenas os algarismos 1, 3, 4, 6, 7 e 9? Solução: Observe que aqui, para formarmos um número par, devemos inicial- mente escolher o algarismo da casa das unidades, que, de acordo com os algarismos apresentados, só pode ser 4 ou 6. Logo: ( ___ , ___ , ___ , ___ , ___ , ___ )2 Possibilidades Para cada uma das possibilidades, os outros cinco algarismos faltantes poderão ser permutados nas cinco casas restantes. Como são algarismos diferentes, a quanti- dade de números pares que podemos montar é dado por: 2 . P5 = 2 . 5! = 2 . 120 = 240 Acabamos de conhecer a permutação simples. Vamos agora generalizar para os casos envolvendo permutações com repetições. 3.2.3 Permutações com Repetições Para introduzirmos as permutações com repetições, consideremos a pergunta inicial: quantas permutações podemos formar com elementos entre os quais existe repetições? Exemplificando, com as letras A, A e B temos 3 permutações, que são: (A, A, B), (A, B, A) e (B, A, A) É importante observar que se as letras A fossem diferentes, por exemplo, A1 e A2, cada uma destas permutações geraria duas permutações distintas. Depois veremos também o desenvolvimento desse tipo de situação. RACIOCÍNIO ANALÍTICO E QUANTITATIVO 80 Voltando ao nosso problema, já sabemos que o número de permutações de 3 elementos diferentes é igual a P3 = 3! = 6. Nesse sentido, vemos que se entre os 3 elementos tivermos 2 repetidos, esse número ficará dividido por 2! (número de permu- tações dos 2 elementos se eles forem considerados diferentes). Indicamos o número de permutações de 3 elementos sendo 2 repetidos por P3 2. Assim, nesse caso podemos escrever: P3 2 = = = 3 Vamos ilustrar agora um contexto envolvendo 5 elementos, sendo três deles repetidos: +, +, +, –, x. Porém, vamos considerar que os sinais +, + e + são distintos, dados por +1, +2 e +3, de modo que cada permutação desses símbolos geraria 3! permu- tações. Observe a seguir: (+1, +3, +2,–, x) (+2, +1, +3, –, x) (+2, +3, +1, –, x) (+3, +1, +2, –, x) (+3, +2, +1, –, x) Logo, o número de permutações destes 5 elementos é igual ao número de permutações obtidas se eles fossem diferentes dividido por 3!, ou seja, dado por: P5 3 = = = 20 As 20 permutações nessa situação estão apresentadas na figura a seguir: Descrevendo as permutações dos símbolos +, +, +, –, x (+, +, +, –, x), (+, +, x, –, +), (+, x, +, –, +), (x, +, +, +, –), (x, +, –, +, +) (+, +, +, x, –), (+, +, –, x, +), (+, –, +, x, +), (–, +, +, +, x), (–, +, x, +, +) (+, +, x, +, –), (+, x, +, +, –), (+, x, –, +, +), (x, +, +, –, +), (x, –, +, +, +) (+, +, –, +, x), (+, –, +, +, x), (+, –, x, +, +), (–, +, +, x, +), (–, x, +, +, +) 3! 2! 6 2 5! 3! 5.4.3. 3! Raciocínio analítico e Quantitativo 81 Ressaltamos ainda que, se trocarmos o sinal – por x, isto é, se considerarmos os sinais, +, +, +, x e x, as 20 permutações anteriores ficariam reduzidas a 10 apenas. Só para entendermos melhor tal fato, a permutação (+, +, +, –, x) e (+, +, +, x, –) ficariam iguais a (+, +, +, x, x). Logo, o número de permutações ficará dividido por 2!. Assim, a representação da quantidade de permutações de 5 elementos, sendo 3 repetidos e 2 repetidos de outro, é dada pela simbologia P5 3,2. Logo, escrevemos: P5 3,2 = = = 10 Generalizando, quando temos n elementos dos quais n1 são repetidos de um tipo, n2 são repetidos de outro tipo, n3 são repetidos de outro tipo e assim sucessivamente, segundo Bezerra (2001, p. 130), o número de permutações que podemos formar é dado por: Pn n1, n2, ..., nk = Vejamos dois exemplos do dia a dia que ilustram a aplicabilidade da permutação com repetições. Problema: Sabemos que “eleger” significa a escolher um candidato ou candidata por meio de votação. Por exemplo: a população elegeu o candidato a senador ou o povo elegeu a candidata a presidente da república. Temos que as palavras “eleger” e “candidata” estão diretamente asso- ciadas ao termo eleição. Quantos anagramas possui a palavra ELEGER? E a palavra CANDIDATA? Solução: Já vimos anteriormente que cada anagrama está relacionado a uma permutação das letras que compõem determinada palavra. Observe que, nesse caso, estamos trabalhando com palavras que têm letras repetidas. Logo, temos que: • ELEGER ⟶ 6 letras, sendo 3 E, 1 L, 1G e 1R. Então, o número de anagramas é dado por: P6 3 = = = 120 5! 3!2! 5.4.3! 3!.2 n! n1! n2! n3!... nk! © D el ig ht so ft / / S hu tt er st oc k 6! 3! 6.5.4.3! 3! Raciocínio analítico e Quantitativo 82 • CANDIDATA ⟶ 9 letras, sendo 3A, 2D, 1C, 1N, 1I e 1T. Portanto, o número de anagramas é dado por: P9 3,2 = = = 30.240 Portanto, neste problema temos 120 anagramas possíveis a partir da palavra ELEGER e 30 240 anagramas da palavra CANDIDATA. Problema: Qual a quantidade de números pares que podemos obter permu- tando-se os algarismos 1, 2, 2, 3, 3, 3 e 4? Solução: Aqui é importante observar que devemos contar as permutações que terminam com o algarismo 2 ou 4, para que os números criados sejam pares. Assim, temos: • Terminado por 2: (___, ___, ___, ___, ___, ___, _ 2 __) Fixo Deixando um algarismo 2 fixo na casa das unidades, devemos permutar as outras casas com os algarismos 1, 2, 3, 3, 3 e 4. O número de permutações então é dado por: P6 3 = = = 120 • Terminado por 4: (___, ___, ___, ___, ___, ___, _ 4__) Fixo Deixando o algarismo 4 fixo na casa das unidades, devemos permutar as outras casas com os algarismos 1, 2, 2, 3, 3 e 3. O número de permutações então é dado por: P6 3,2 = = = 60 Portanto, o total de números pares é dado por 120 + 60 = 180. Para que você se familiarize ainda mais com o conteúdo que estamos estudando, na próxima seção vamos conferir mais alguns exemplos que ilustram a resolução de problemas baseados nas permutações simples e permutações com repetições. 9! 3!2! 9.8.7.6.5.4.3! 3!.2 6! 3! 6.5.4.3! 3! 6! 3!.2! 6.5.4.3! 3!.2 Raciocínio analítico e Quantitativo 83 3.2.4 Aplicações Envolvendo Permutações Neste tópico vamos nos dedicar a análise de outros problemas cuja resolução envolve o emprego das fórmulas características das permu- tações simples e das permutações com repetições. Você vai perceber que esse conhecimento pode ser aplicado nas mais diversas situações do dia a dia. Problema: Uma família de interior reside na capital paulista há vários anos e comumente nos feriados viajam em carro próprio para visitação a família no interior do estado. Especificamente falando, para uma viagem ao interior no feriado de final de ano, a família em questão composta por 5 membros, todos devidamente habilitados, possui um veículo automotivo que comporta exatamente 5 lugares. De quantas formas distintas essa família pode se acomodar para a viagem? Solução: Observemos que, como o veículo automotivo em questão possui 5 lugares, que é exatamente o número de pessoas da família, nessa situação as cinco pessoas só podem trocar de lugar. Portanto, o número de maneiras distintas em que isso poderá ser feito é dado por: P5 = 5! = 5.4.3.2.1 = 120 Problema: Numa biblioteca de uma insti- tuição de ensino situada no interior de São Paulo, tem-se 4 livros distintos de Matemática, 6 de Física e 2 de Química Geral que devem ser devidamente arrumados em uma prateleira. Calcule quantas arrumações diferentes podem ser feitas se tivermos cada uma das situações a seguir: e. Os livros de cada matéria devem ficar juntos na prateleira. f. Apenas os livros de Matemática devem ficar juntos na prateleira. Solução: Nesse caso, temos que: a. Notemos que os livros de Matemática podem ser ajeitados entre si de P4 = 4! modos, os de Física de P6 = 6! modos e os de Química Geral de P2 = 2! modos, e os três grupos de P3 = 3! modos. Dessa maneira, o número de arrumações que podem ser realizadas é dado por: 4! . 6! . 2! . 3! = 207 360 arrumações. © k ol op ac h / / S hu tt er st oc k ©c on ne l / / Sh ut te rs to ck Raciocínio analítico e Quantitativo 84 b. Aqui, devemos considerar os quatro livros de Matemática como sendo um úni- co. Então, existem 9 livros que podem ser arrumados de P9 = 9! modos. Em qualquer uma dessas maneiras, os livros de Matemática estão juntos, mas es- ses livros podem ser arrumados de P4 = 4! modos entre si. Portanto, o número total de arrumações é dado por 9! . 4! = 8 709 120 arrumações. Problema: No mundo globalizado, o processo de tomada de decisão no meio empre- sarial é complexo, subjetivo, sequencial e envolve as regras institucionais da organização em questão. Ressalta-se que a tomada de decisão deve ser pautada exatamente em números, que podem ser conhecidos como indicadores. Neste sentido, quantos números de oito algarismos podemos escrever utilizando quatro vezes o algarismo 1, três vezes o algarismo 5 e uma vez o algarismo 2? Solução: Notemos que aqui é de nosso inte- resse saber quantos números podemos formar com a utilização simultânea dos algarismos 1, 1, 1, 1, 5, 5, 5 e 2. Sendo assim, devemos calcular P8 4,3. Logo, escrevemos: P8 4,3 = = 280 Agora que já analisamos diversos problemas envolvendo permutações simples e permutações com repetições, nosso interesse se voltará para a descrição das especi- ficidades e expressões características dos arranjos e combinações, que, como vimos, também são dois tipos possíveis de agrupamento. Esse é o assunto da próxima seção. 3.3 Arranjos e Combinações Arranjos e combinações são dois tipos específicos de agrupamentos. No caso das combinações, a ordem não importa, enquanto que, para os arranjos, a ordem deve ser levada em consideração. Vejamos então as particularidades e cálculos envolvendo as quantidades de cada um destes dois tipos de agrupamento, que permitem a resolução de vários problemas nas mais diversas áreas do conhecimento. © P re ss m as te r / / Sh ut te rs to ck 8! 4!.3! Raciocínio analítico e Quantitativo 85 3.3.1 Arranjos Simples Para compreendermos como interpretar esse tipo de agrupamento, vamos consi- derar uma ilustração introdutória. O professor Alessandro dispõe de um ingresso de cinema e um de teatro para sortear entre os alunos que conseguirem solucionar um problema proposto sobre contagem. Os alunos que acertaram o problema foram: Aldo, Júlia, Daiana e Carlos. Vamos imaginar também que o professor Alessandro decidiu que o primeiro aluno sorteado receberia o ingresso de cinema e que o segundo aluno ficaria com o ingresso de teatro. Nesse caso, se os alunos sorteados fossem Aldo e Júlia, nessa ordem, Aldo receberia o ingresso de cinema e Júlia o ingresso de teatro. Por outro lado, se os alunos sorteados fossem Júlia e Aldo, nessa ordem, Júlia receberia o ingresso de cinema e Aldo o de teatro. Dessa maneira, temos uma descrição em que os agrupamentos Aldo e Júlia e Júlia e Aldo são considerados agrupamentos distintos, já que a ordem de sorteio dos elementos deve ser levada em consideração, ou seja, a ordem importa. Quando agrupamos elementos de modo que em cada agrupamento importa a ordem dos elementos, esses agrupamentos são conceitualmente conhecidos como arranjos. No linguajar matemático, os arranjos podem ser vistos como sucessões cujos termos são escolhidos entre os elementos dados. Assim, de acordo com Bezerra (2001, p. 133), chamamos de arranjos de n elementos diferentes, tomados k a k, as sucessões formadas de k termos diferentes escolhidos entre os n elementos dados. Na nossa situação ilustrativa, considerando os elementos Aldo, Júlia, Daiana e Carlos, descrevemos os arranjos destes 4 elementos, tomados 2 a 2, como segue: (Aldo, Júlia), (Aldo, Daiana), (Aldo, Carlos) (Júlia, Aldo), (Daiana, Aldo), (Carlos, Aldo) (Júlia, Daiana), (Júlia, Carlos), (Daiana, Carlos) (Daiana, Júlia), (Carlos, Júlia) (Carlos, Daiana) Os arranjos geralmente são denotados colocando-se os elementos entre parên- tesis (como acontecem nas sucessões). Observe também que dois arranjos são distintos se tiverem elementos distintos ou se tiverem os mesmos elementos em orde- nação distinta. RACIOCÍNIO ANALÍTICO E QUANTITATIVO 86 Vamos denotar por An,k ou An k o número de arranjos de n elementos tomados k a k. Logo, a partir do Princípio Fundamental da Contagem, segundo Bezerra (2001, 135), An,k é caracterizado pela expressão: An,k = n.(n–1).(n–2)...(n–(k–1)) produto de k fatores As permutação simples são um caso particular de arranjo simples. Tomando A como um conjunto com n elementos, os arranjos simples n a n dos n elementos de A são chamados permutações simples de n elementos. Vejamos a seguir mais um exemplo ilustrativo de arranjos simples. Problema: Quantos números com algarismos diferentes e compreendidos entre os múltiplos de 10, 100 e 1000 podem ser obtidos com a utilização dos algarismos 1, 2, 3, 5 e 6? Solução: Notemos que os números em questão são compostos por três alga- rismos diferentes, escolhidos entre os 5 algarismos dados. Além disso, é claro que a ordem dos algarismos em cada agrupamento, por si só, distingue dois agrupamentos, por representarem números diferentes. Logo, o número procurado é dado pelo arranjo de 5 elementos tomados 3 a 3. Portanto, escrevemos: A5,3 = 5.4.3 = 60. Agora, vamos trabalhar com o agrupamento em que a ordem não é levada em consideração, ou seja, a ordem dos elementos não importa: a combinação, que deta- lharemos na sequência. 3.3.2 Combinações Simples Para entendermos esse tipo de agrupamento que chamamos de combinações simples, vamos considerar a situação ilustrativa anterior. Dessa vez, o professor Alessandro dispõe de dois ingressos de cinema para sortear entre os alunos. Digamos que quatro alunos resolveram corretamente o problema. São eles: Aldo, Júlia, Daiana e Carlos. Observe então que poderíamos ter como alunos premiados: Aldo e Júlia, ou Aldo e Daiana, ou Aldo e Carlos, ou Júlia e Daiana, ou Júlia e Carlos, ou Daiana e Carlos Deve ficar claro que cada uma dessas possibilidades pode ser encarada como um agrupamento de 4 alunos tomados 2 a 2, ressaltando que, em cada um desses agru- pamentos, a ordem dos elementos não importa. Exemplificando: dar os ingressos de cinema para Aldo e Júlia ou dar para Júlia e Aldo é a mesma coisa. Raciocínio analítico e Quantitativo 87 A situação que acabamos de analisar é um exemplo de combinação: quando agru- pamos elementos de modo que a ordem não importa. Matematicamente falando, as combinações são conjuntos cujos elementos são escolhidos entre os elementos dados. De acordo com Bezerra (2001), chamamos de combinações de n elementos dife- rentes, tomados k a k, os conjuntos formados de k elementos diferentes escolhidos entre os n elementos dados. Observe que na nossa ilustração, considerando os elementos Aldo, Júlia, Daiana e Carlos, descrevemos as combinações destes 4 elementos, tomados 2 a 2, como segue: {Aldo, Júlia}, {Aldo, Daiana}, {Aldo, Carlos}, {Júlia, Daiana}, {Júlia, Carlos}, {Daiana, Carlos} As combinações são comumente representadas com a utilização de chaves e separando os elementos por vírgula ou ponto e vírgula (como conjuntos). Salientamos que duas combinações são distintas apenas quando têm elementos distintos. Vamos denotar por Cn,k ou Cn k o número de combinações de n elementos, tomados k a k. De acordo com Bezerra (2001, 137), Cn,k é dado pela expressão: Cn,k = = Vejamos mais um exemplo ilustrativo de combinações simples. Problema: Em uma sessão extraordi- nária da câmara federal de deputados, com a presença de 18 deputados, 4 deles serão esco- lhidos para uma comissão que vai estudar um projeto de lei na área ambiental. De quantos modos diferentes poderá ser formada a comissão em questão? Solução: Observe que, dos 18 deputados presentes, devemos escolher 4 deles para compor a comissão. Vamos imaginar que uma comissão possível seja formada pelos deputadosA, B, C e D. A ordem em que citamos os deputados não importa, uma vez que se falarmos, por exemplo, que a comissão é composta por C, B, D e A estamos nos referindo a mesma comissão. Isso nos diz que cada possível comissão equivale a uma combinação dos 18 deputados tomados 4 a 4. Portanto, o número de modos dife- rentes de compormos a comissão em questão é dado por: C18,4 = = = = 3060 An,k k! n! k!.(n – k)! © s tu di os to ks / / S hu tt er st oc k n! k!.(n – k)! 18! 4!.(18 – 4)! 18.17.16.15.14! 4.3.2.1.14! Raciocínio analítico e Quantitativo 88 Vejamos, no próximo tópico, mais alguns exemplos que ilustram a resolução de problemas baseados em combinações e arranjos. 3.3.3 Aplicações Envolvendo Arranjos e Combinações Os problemas a seguir são exemplos de como as fórmulas características das combina- ções e arranjos podem ser utilizadas em situa- ções cotidianas. Problema: Em um determinado sistema lotérico, o apostador deve acertar a classificação do 1° ao 6° colocado entre os 54 times partici- pantes de uma Liga Nacional de Futebol brasi- leira. Pede-se: a. Quantos resultados distintos podemos ter nesta situação? b. Se um jogador resolvesse jogar em todos os resultados possíveis, quanto tem- po (aproximadamente) levaria, em anos, para preencher todos os cartões, con- siderando que fizesse um cartão (resultado) por minuto? Solução: Neste caso, temos que: a. Para o 1° lugar, temos 54 possibilidades; para o 2° lugar, 53; para o 3° lugar, 52; para o 4°, lugar 51; para o 5° lugar, 50 e para o 6° lugar, 49. O número total de resultados possíveis é dado por: A54,6= 54 . 53 . 52 . 51 . 50 . 49 = 18 595 558 800 b. Como 1 ano = 12 meses = 12 . 30 dias = 12 . 30 . 24 horas = 12 . 30 . 24 . 60 minu- tos = 518 400 minutos ≈ 5,18 . 105 minutos, logo o número 18 595 558 800 de resultados pode ser expresso por 1,86 . 1010 aproximadamente. Desta forma, se for feito um cartão por minuto, o tempo gasto será: ano = 3,59 . 104 ano = 35 900 anos Problema: Um fabricante de doces situado no interior de Minas Gerais dispõe de invólucros com capacidade para 4 doces cada uma. Sabendo-se que a fábrica de doces em questão trabalha com 10 tipos diferentes de doces, pede-se: a. Quantos tipos de invólucros com 4 doces o fabricante poderá oferecer? © V la di sC he rn / / S hu tt er st oc k 1,86.1010 5,18.105 Raciocínio analítico e Quantitativo 89 Solução: Observe que a fábrica deve escolher 4 doces diferentes e que só importa a natureza dos doces, pois se alterarmos a ordem dentro do invólucro o resul- tado não se modifica. Logo, temos que o número procurado é dado por: C10,4 = = = = 210 Problema: Cauã é um químico recém-formado que trabalha com 10 tipos de subs- tâncias específicas para a produção de solventes diversos. De quantas formas possíveis poderá misturar 6 destas substâncias se, entre as 10, somente 2 não podem ser mistu- radas porque produzem solvente que pode resultar em uma pequena explosão? Solução: Notemos que cada mistura de 6 das 10 substâncias corresponde a uma combinação das 10 substâncias tomadas 6 a 6, uma vez que não importa a ordem das substâncias na mistura. Assim, o total de misturas seria C10,6 se não tivéssemos problemas com nenhuma mistura. Devemos, todavia, subtrair desse número as combi- nações em que entrariam as duas substâncias que, se misturadas, provocam explosão. As combinações em que entram estas duas substâncias são formadas por elas duas e mais quatro substâncias escolhidas entre as outras oito substâncias (retirando aquelas duas). O número de modos de escolher 4 substâncias em 8 é dado por C8,4. Assim, temos que: C10,6 – C8,4 = – = 210 – 70 = 140 Portanto, conclui-se que o número de misturas não explosivas que Alessandro pode produzir é igual a 140. Na próxima seção, vamos discutir o Binômio de Newton, que constitui uma apli- cação direta da Análise Combinatória e, mais precisamente, do fatorial e da combinação. 3.4 Binômio de Newton A Análise Combinatória está intimamente ligada ao desenvolvimento do Binômio de Newton. De acordo com Bezerra (2001, p. 259), um dos primeiros matemáticos a elaborar estudos sobre o número de combinações possíveis para um determinado estudo foi o italiano Niccolo Tartaglia (1500 – 1557), que criou uma tabela contendo o número de combinações possíveis no lançamento de dois dados. A notação do Binômio de Newton, que foi posteriormente desenvolvida por Isaac Newton, apareceu nessas combinações. Newton... n! k!.(n – k)! 10! 4!.(10 – 4)! 10.9.8.7.6! 6!.4.3.2.1 10! 6!.4! 8! 4!.4! Raciocínio analítico e Quantitativo 90 Diretamente relacionado ao conceito do Binômio de Newton, temos o fatorial e as combinações, que já estudamos neste capítulo, e os números chamados de números binomiais, que são elementos muito importantes nos cálculos envolvendo o Binômio de Newton. É interessante perceber que em algumas situações matemáticas, direta ou indiretamente relacionadas a várias áreas do conhecimento, há a necessidade de aplicar certos métodos de solução para modelá-las e solucioná-las. Outras podem ser desenvolvidas por meio de genera- lizações e, nesse sentido, citamos o Binômio de Newton. Vejamos, a seguir, os números binomiais e binomiais consecutivos, que são as células fundamentais do Binômio de Newton. 3.4.1 Números Binomiais e Binomiais Consecutivos Vamos considerar n e p dois números naturais quaisquer, sendo que n ≥ p. Segundo Bezerra (2001), denominamos de número binomial e indicamos pela simbologia n p o número definido pela expressão: n p = , com n, p ∈ ℕ e n ≥ p. Ressaltamos que o número n é o numerador do binomial e p é chamado classe do binomial. Podemos ler n p como binomial de n sobre p. Assim, citamos: • 7 3 = = = = 35 • 10 6 = = = = 210 Dois números binomiais são complementares se apresentarem o mesmo nume- rador e se a soma de suas classes for igual a esse numerador. Dois números binomiais de mesmo numerador são consecutivos se suas classes são números consecutivos. n! p!(n – p)! 7! 3!.(7– 3)! 7! 3!.4! 7.6.5.4! 3.2.1.4! 10! 6!.(10– 6)! 10! 6!.4! 10.9.8.8.7.6! 6!4.3.2.1 Raciocínio analítico e Quantitativo 91 Desse modo, temos que: • Os binomiais 15 6 e 15 9 são complementares, pois 6 + 9 = 15. • Os binomiais 7 0 e 7 7 são complementares, pois 0 + 7 = 7. • Os binomiais 11 7 e 11 8 são consecutivos, pois 7 e 8 são números consecutivos. • Os binomiais 20 2 e 20 3 são consecutivos, pois 2 e 3 são números consecutivos. É interessante observar que, com as condições de existência de dois binomiais consecutivos sendo válidas, temos uma importante relação, chamada de relação de Stifel, dada pela expressão: n p + n p+1 = n+1 p+1 Deve ficar claro que a relação de Stifel nos dá a soma de dois números binomiais consecutivos em função de um único binomial. Observe que: • 10 3 + 10 4 = 11 4 • 21 15 + 21 16 = 22 16 Veremos na sequência uma disposição tabelar composta por números binomiais conceitualmente conhecidos como Triângulo de Pascal. Vamos conhecê-lo? 3.4.2 Triângulo de Pascal O Triângulo de Pascal é uma tabela formada por números binomiais dispostos de tal forma que os binomiais de mesmo numerador situam-se na mesma linha e os de mesma classe na mesma coluna. Foi desenvolvido pelo matemático Blaise Pascal, quedescreveu a maior parte de suas propriedades. Pascal tinha o objetivo de... RACIOCÍNIO ANALÍTICO E QUANTITATIVO 92 O matemático Blaise Pascal descreveu formalmente a maior parte das propriedades do Triângulo de Pascal (que, por isso, foi batizado em sua homenagem). Porém, já era conhecido pelos chineses 500 anos antes de Pascal. A tabela assume a forma de um triângulo, como mostramos na figura a seguir. Construindo o Triângulo de Pascal 0 0 1 0 1 1 2 0 2 1 3 0 3 1 3 2 3 3 2 2 ................................................................ Se calculamos os valores dos números binomiais, o Triângulo de Pascal fica repre- sentado como mostra a figura que segue: Descrevendo os valores dos binomiais no Triângulo de Pascal 1 1 1 1 2 1 1 3 3 1 1 4 6 4 1 1 5 10 10 5 1 ................................... RACIOCÍNIO ANALÍTICO E QUANTITATIVO 93 O Triângulo de Pascal também pode ser caracterizado com base na relação de Stifel, notando que cada uma de suas linhas começa e termina com 1, já que: n 0 = n n = 1. A seguir, vamos entender como o Triângulo de Pascal é utilizado no cálculo do Binômio de Newton, ou seja, como os números binomiais podem ser determinados exatamente a partir desse triângulo. 3.4.3 Descrição formal do Binômio de Newton Para determinar o binômio (x+a)n, o qual chamamos comumente de Binômio de Newton (com a real e n natural), utilizamos diretamente o Triângulo de Pascal. É interessante observarmos que, de acordo com a disposição de construção do Triângulo de Pascal, o Binômio de Newton é uma aplicação direta do triângulo em questão. Não por acaso, os coeficientes que são calculados no desenvolvimento de (x+a)n, a partir do valor de n = 0, formam exatamente o Triângulo de Pascal. Lembre-se de que o Triângulo de Pascal é uma tabela formada por números binomiais dispostos de tal forma que os binomiais de mesmo numerador situam-se na mesma linha, e os de mesma classe situam-se na mesma coluna. A descrição formal dos números que compõem o Binômio de Newton (ou do próprio Binômio de Newton) pode ser vista a seguir. Descrevendo os valores dos coefi cientes de (x+a)n (x + a)° = 1 (x + a)¹ = 1.x + 1.a (x + a)² = 1.x² + 2.a.x + 1.a² (x + a)³ = 1.x³ + 3.a.x² + 3.a².x + 1.a³ (x+a)4 = 1. x4 + 4.a.x³ + 6.a².x² + 4.a³.x + 1. a4 ............................................................. 1 1 1 1 2 1 1 3 3 1 1 4 6 4 1 1 5 10 10 5 1 ................................... Raciocínio analítico e Quantitativo 94 Observe que o Binômio de Newton é uma espécie de estudo complementar para o produto notável (x + a)². Neste capítulo, estudamos os problemas de contagem, que aparecem no nosso cotidiano nos mais diversos tipos de situações: desde a alocação de números e letras em placas automotivas até a determinação de combinações de roupas, substâncias etc. Você aprendeu que os principais tipos de agrupamentos são as permuta- ções, arranjos e combinações, que são interpretadas e descritas a partir da ordem dos agrupamentos em questão. Viu também que, associado diretamente à Análise Combinatória, temos o Binômio de Newton, os seus valores, chamados de números binomiais, e o elemento chave, que é o fatorial. Mais do que contribuir para qualificar você na área em que está se formando, esses conhecimentos são ferramentas para solucionar as mais diversas situações do seu dia a dia. Raciocínio analítico e Quantitativo 95 Referências MACHADO, Antônio dos Santos. Sistemas Lineares e Combinatória. São Paulo: Atual, 1986. BEZERRA, Manoel Jairo. Matemática para o Ensino Médio. São Paulo: Scipione, 2001. NOVAES, D. V.; COUTINHO, C. de Q. e S. Estatística para Educação Profissional e Tecnológica. 2. ed. São Paulo: Atlas, 2013. CRESPO, A. A. Estatística Fácil. 19. ed. São Paulo: Saraiva, 2009. LEVINE, D. M. et al. Estatística: teoria e aplicações. 6. ed. Rio de Janeiro: LTC, 2012. TIBONI, C. G. R. Estatística Básica: para os cursos de administração, ciências contábeis, tecnológicos e de gestão. São Paulo: Atlas, 2010. MORAIS, J. L. de. Matemática e Lógica para Concursos. São Paulo: Saraiva, 2012. 4 Probabilidade Qual a chance de você ganhar um ingresso de teatro em um sorteio no seu ambiente de trabalho? Se você é aluno de uma turma de graduação com outros 50 estudantes, qual a chance de ser contemplado em um sorteio neste grupo? Jogando um único jogo na loteria, quais as chances de ganhar? Essas são perguntas frequentes, que fazem parte do nosso dia a dia e que podem ser respondidas por meio do conceito de probabilidade. Probabilidade significa “chance de ocorrência”. Popularmente, entende-se que falar sobre probabilidade significa, de alguma forma, utilizar a intuição para prever os possíveis desfechos e consequências de situações cotidianas. Na Estatística, porém, o estudo das probabilidades trata de situações em que é necessário e importante mensurar a possibilidade de ocorrência de determinados eventos. Neste capítulo, você vai conhecer os principais conceitos do campo teórico das probabilidades e estudar as especificidades das variáveis aleatórias contínuas e aleató- rias discretas. Agora que você já se familiarizou com o tema, vamos começar com uma introdução à Teoria de Probabilidades, assunto do nosso primeiro tópico. 4.1 Introdução a Teoria de Probabilidades A probabilidade está relacionada a situações que envolvem risco ou incerteza. Eventos que envolvem probabilidade constituem uma grande parte do nosso coti- diano e despertam o interesse de muitas pessoas sem que conheçam o assunto concei- tualmente. Quem joga na loteria, por exemplo, o faz por saber que, mesmo existindo milhares de resultados possíveis, existe uma chance de que o seu jogo seja sorteado. Essa “chance” é o que estudamos em probabilidade. Historicamente, o conceito de probabilidade surgiu no século XVI, diretamente relacionado a jogos que envolviam a sorte de ganhar ou não, como dados e cartas. De acordo com Crespo (2009), quando utilizamos de probabilidade, estamos inte- ressados em conhecer a possibilidade de ocorrência de um dado evento, e não o resul- tado deste evento. O resultado é impossível prever. Assim, ao lançar uma moeda em um © Iv an S m uk / / S hu tt er st oc k RACIOCÍNIO ANALÍTICO E QUANTITATIVO 98 jogo de cara ou coroa, podemos concluir que há 50% de chance de o resultado ser cara, e 50% de chance de ser coroa. Porém, não podemos afirmar qual será o resultado. Esta é uma característica geral dos eventos aleatórios e é um dos fundamentos da probabilidade: não se pode predizer no que resultará uma ocorrência. Entretanto, se observarmos o mesmo evento muitas vezes, poderemos inferir alguns padrões. Teoricamente, poderíamos calcular a trajetória da moeda com auxílio das Leis da Mecânica (Física), conhecendo a força inicial aplicada e as outras forças que atuam sobre a moeda Como isso é muito difícil, para fins práticos, consideramos que jogar uma moeda é um bom exemplo de evento aleatório. Apesar de as noções de probabilidades serem conteúdo da Matemática, nós também abordamos esse tópico em Estatística, pois grande parte dos fenô- menos estatísticos que estudamos são de natureza aleatória ou probabilística. De fato, independente da área de interesse, sempre existem situações em que se faz pertinente uma mensuração específica ou até mesmo a descrição numérica da probabilidade de ocor- rência de eventos futuros. Qual a probabilidade de lançamento de uma nova linha de produtos da empresa concorrente? De um determinado time vencer o próximo jogo de futebol no Campeonato Brasileiro? De o meu segundo filho ser uma menina? De obter bons lucros em uma operação mercantil? Esses são apenas algunsexemplos de um universo de fenômenos possíveis de analisar a partir do conceito de probabilidade. Agora que você entende como e por que que a probabilidade faz parte do coti- diano, no próximo tópico, vamos apresentar os fundamentos básicos que alicerçam todo o campo de estudos da probabilidade e suas teorias derivativas. 4.1.1 Conceitos Básicos A Teoria das Probabilidades é um modelo matemático que permite estudar, de forma abstrata, um fenômeno físico ao qual esteja associada uma incerteza. Logo, quando anali- samos um experimento, interessa-nos prever o seu comportamento. Há dois tipos de experimentos: Experimentos Determinísticos e Experimentos Aleatórios. Segundo Martins (2010), experimentos determinísticos são aqueles que sempre dão o mesmo resultado se repetidos sob condições específicas. Podemos citar a acele- ração da gravidade no vácuo e as leis da gravitação. © h ap py m ay / / S hu tt er st oc k Raciocínio analítico e Quantitativo 99 Contrariamente, experimentos aleatórios são procedimentos cujo resultado é incerto, ou seja, são experiências em não se sabe qual dos seus possíveis resultados vai acontecer até que o experimento esteja concluído. Mesmo realizadas sob condições iguais, as experiências aleatórias apresentam variações nos resultados. É para os fenômenos aleatórios que a teoria das probabilidades auxilia na análise e previsão de um resultado futuro. Segundo Martins (2010), podemos citar como exem- plos de experimentos aleatórios (E): • E1 – A jogada de um dado não vicia- do e a observação da face obtida. • E2 – Jogar uma moeda não viciada quatro vezes e observar o número de caras obtida. • E3 – Em um ciclo produtivo sequencial, a descrição de peças produzidas com defeitos em um determinado dia do mês de janeiro. • E4 – Caracterização da vida útil de uma lâmpada em horas a partir do momen- to em que ela é ligada na tomada. A partir das ilustrações anteriores, percebe-se que os experimentos aleatórios: • podem ser repetidos de forma ilimitada, ou seja, indefinida, sob condi- ções definidas; • não se caracterizam pelos resultados em si, mas pela descrição do conjunto dos possíveis resultados que podem acontecer no experimento em questão; • se repetidos diversas vezes, podemos apresentar uma regularidade nos resultados. Conceitualmente, Martins (2010) explica que, para um dado fenômeno físico, define-se uma experiência e admite-se que pode ser repetida diversas vezes em “iguais condições”. Inclui-se, explicitamente, o que se entende por resultado da expe- riência, dando origem a um conjunto. Cada elemento do conjunto é denominado ponto amostral. O conjunto de todos os resultados possíveis de um experimento aleatório é denominado espaço amostral (denotado por Ω) ou representado pela letra S. Como explica Crespo (2009), o espaço amostral está relacionado com o fato de que, embora não se possa prever com certeza o resultado de um experimento aleatório (E), os possíveis resultados deste experimento podem ser identificados previamente. Veja os exemplos a seguir: © B ri an A J ac ks on / / S hu tt er st oc k Raciocínio analítico e Quantitativo 100 • E1 – Jogue um dado e observe o nº mostrado na face de cima. S1: Ω1 = {1,2,3,4,5,6} • E2 – Jogue uma moeda quatro vezes e observe o nº de caras obtidas. S2: Ω2 = {0,1,2,3,4}. • E3 – Jogue uma moeda quatro vezes e observe a sequência obtida de caras e coroas. • E4 – Em um ciclo produtivo sequencial, a descrição de peças produzidas com defeitos em um determinado dia do mês de janeiro. S4: Ω4 = {0,1, 2, ..., N}, onde N é o nº máximo que pode ser produzido em 24 horas. O espaço amostral, pelo número de elementos que contém, pode classificar-se como: • Finito ou Infinito. • Discreto ou Contínuo. Observações: • Discreto quer dizer “contável” ou enumerável. • Discreto não quer dizer necessariamente finito. • Infinito não quer dizer necessariamente contínuo. Segundo Levine (2012), um espaço amostral é discreto quando ele for finito ou infinito enumerável, enquanto que será considerado contínuo quando for infinito e formado por uma escala intervalar de valores reais. Além disso, qualquer subconjunto A do espaço amostral S associado a um experimento aleatório E é chamado de evento. Os resultados individuais de um experimento são chamados de eventos elementares (s - minúsculo). Observe então que qualquer que seja o experimento E, se E está contido em S, então E é um evento de S. 4.1.2 Regras Básicas e Teorema de Bayes Vejamos agora a definição clássica de probabilidade. Vamos considerar o espaço amostral finito S = {a1, a2, ..., an}, no qual os pontos amostrais ai são equiprováveis, ou seja, apresentam a mesma probabilidade de ocorrência. Logo, de acordo com Martins (2010), fala-se que todo subconjunto A do espaço amostral é um evento com probabili- dade igual a P(A), expresso por: P(A) = = , m n número de casos favoráveis ao evento A número de casos possíveis RACIOCÍNIO ANALÍTICO E QUANTITATIVO 101 isto é, a probabilidade de um evento é definida como o quociente do número m de casos que lhe são favoráveis, pelo número n de resultados possíveis. Por exemplo, se um dado é não viciado, esperamos que as várias faces sejam equiprováveis, assim: P(1) = P(2) = ... = P(6) = , e, nesse caso, se A é o evento que consiste na obtenção de uma face par, temos P(A) = = ½ . A seguir, vamos conhecer algumas regras bastante simples que são utilizadas nos cálculos de probabilidade. • A probabilidade do evento A necessariamente é um número situado entre 0 e 1, ou seja, 0 ≤ P(A) ≤ 1 ou 0% ≤ P(A) ≤ 100%. A probabilidade do espaço amos- tral S é igual a 1 ou 100%, sendo chamado de evento certo, ou seja, P(S) = 1 ou P(S) 100%. • De modo contrário, o evento impossível é aquele que não pode ocorrer, logo, sua probabilidade é igual a zero (por exemplo, no lançamento de um dado qual a probabilidade de encontrarmos uma face igual a 7? A resposta é zero). • No lançamento de duas moedas não viciadas, temos quatro possíveis resultados: S = {cc, ck, kc, kk}, onde c = cara e k = coroa. Note que cada resultado é igual- mente provável e, neste caso, podemos associar a probabilidade 0,25 ou ¼. • Dizemos que dois eventos A e B são estatisticamente independentes se a ocor- rência de um deles não afetar a ocorrência do outro. Desta forma, no lança- mento da moeda por duas vezes, a probabilidade de obter cara ou coroa, no segundo lance, não é afetada pelo resultado do primeiro. E a probabilidade associada a união? Como a caracterizamos? De acordo com Levine (2012), a probabilidade de ocorrência do evento A ou do evento B (ou de ambos) é dada por P(A⋃B) = P(A) + P(B) – P(A⋂B). Caso os eventos A e B sejam mutuamente exclusivos, isto é: A⋂B =∅, então escrevemos: P(A⋃B) = P(A) + P(B). Se A é o evento complementar do evento A, então P(A) = 1 – P(A). Por outro lado, segundo Tiboni (2010), se tivermos dois eventos estatistica- mente independentes A e B, a probabilidade de ocorrência conjunta é definida pela regra da multiplicação: P(A.B) = P(A⋂B) = P(A).P(B). 1 6 3 6 Raciocínio analítico e Quantitativo 102 Essa regra pode ser generalizada para n eventos estatisticamente independentes, a partir do momento em que sejam verificadas as condições para a multiplicação de probabilidades para quaisquer combinações de dois ou mais eventos. Caso a condição de independência não seja verificada, devemos proceder com outra expressão. Surge então o que chamamos de probabilidades condicionadas. Segundo Tiboni (2010), se tivermos dois eventos, A e B, a probabilidade de que o evento B ocorra, dado que o evento A já ocorreu, é a probabilidade condicionada de B, a qual denotamos por P(B/A) e lemos como segue: “probabilidade de B dado que A tenha ocorrido”. Similarmente, descreve-se a probabilidade da ocorrência de A, condi- cionada à ocorrênciade B, como P(A/B). A seguir, vamos analisar um exemplo de aplicação de probabilidades condicionadas. Exemplo: Vamos considerar uma situação em uma pape- laria que apresente 10 rolos de cartolina que podem ser diferenciados pelo número e pela cor. Por exemplo, os numerados por 1, 2 e 3 são da cor verde, e os demais, da cor azul. Se todos forem colocados em uma caixa e retirados de forma aleatória, a probabilidade de extrairmos um rolo específico é igual a 0,10 ou 1/10. Se, entretanto, após retirarmos um rolo ao acaso, ele for verde, qual seria a probabili- dade de que um certo rolo extraído seja o de número 1? Resolução: Para respondermos a essa indagação, temos que recorrer à probabilidade condi- cional. Observe que o número possível de casos favoráveis está agora reduzido de 10 para apenas 3, pois o rolo de cartolina desejado deve ter o número 1 e ser da cor verde. Logo, a probabilidade condicional desejada é igual a: Portanto, escrevemos que P (rótulo n° 1 / verde) = 1/3. Em diversas situações, é conveniente descrever a probabilidade condicionada dividindo o numerador e o denominador da fórmula anterior pelo número total de casos possíveis no dado experimento. Em particular, para a nossa ilustração, são 10 © M ar ia U sp en sk ay a / / S hu tt er st oc k número de casos favoráveis aos eventos: rótulo no 1 e verde número de casos favoraveis ao evento: verde Raciocínio analítico e Quantitativo 103 rótulos diferentes e, portanto, no total, temos 10 possíveis casos. Então, reescrevemos como segue: P (rótulo no 1/amarelo) = = 1 10 3 10 = Geralmente, segundo Crespo (2009), se tivermos dois eventos A e B, que não são independentes, a probabilidade condicional de A dado B é caracterizada pela fórmula: P(A|B) = = Em outras palavras, a probabilidade condicional é o quociente entre a probabili- dade de o evento conjunto A e B ocorrer e a probabilidade da ocorrência de B. Agora que temos a definição de probabilidade condicional, podemos descrever a regra geral para a multiplicação envolvendo probabilidades. Tiboni (2010) define que “[...] a probabilidade da ocorrência simultânea de dois eventos, A e B, no mesmo espaço amostral, é igual ao produto da probabilidade de um deles pela probabilidade condicionada do outro, dado o primeiro” (TIBONI, 2010, p. ??). Em símbolos temos que: P(A.B) = P(A⋂B) = P(A) P(B|A) = P(B) P(A|B) Em diversos casos, é útil dispor de um processo sistemático de revisão das proba- bilidades na medida em que forem obtidas novas informações. Veja o exemplo ilustrativo a seguir: Exemplo: Suponha que temos três gavetas iguais. A gaveta G1 contém duas moedas de R$ 0,50; a gaveta G2; duas moedas de R$ 1,00; e a gaveta G3 uma moeda de R$ 0,50 e uma moeda de R$ 1,00. P (rótulo no 1 e amarelo) P (amarelo) 1 3 P(A⋂B) P(B) P(A.B) P(B) Raciocínio analítico e Quantitativo 104 Escolhemos ao acaso uma gaveta e retiramos uma moeda. A probabilidade de a gaveta G1 (ou G2, ou G3) ter sido escolhida anteriormente à escolha efetiva é 1/3, ou seja, P(G1) = P(G2) = P(G3) = 1/3. Essas probabilidades são chamadas de probabilidade a priori. Agora, tiramos uma moeda ao acaso da gaveta escolhida e verificamos que é de R$ 1,00. As probabilidades a priori podem agora ser ajustadas em função dessa nova informação. Assim, com a informação de que a moeda é de R$1,00, as probabilidades revisadas serão: P(G1) = 0 P(G2) = 2/3 e P(G3) = 1/3 Essas probabilidades denominam-se probabilidades a posteriori. O processo usado para obter as probabilidades a posteriori baseia-se no Teorema de Bayes. De acordo com Martins (2010), o Teorema de Bayes é descrito da seguinte forma: Teorema de Bayes: Sejam E1, E2, ..., Ek eventos mutuamente exclusivos, tais que: P(E1) + P(E2) + ... + P(Ek) = 1. Seja A um evento qualquer, que se sabe ocorrerá em conjunto com, ou em consequência de, um dos eventos Ei. Então a probabilidade de ocorrência de um evento Ei, dada a ocorrência de A, é dada por: P(Ei|A) = = Esse resultado relaciona probabilidades a priori P(E i) com probabilidades a posteriori: P(E i|A) = probabilidade de E1 depois da ocorrência de A. Nesse presente caso, temos: E1 = selecionar a gaveta G1, E2 = selecionar a gaveta G2, E3 = selecionar a gaveta G3, A = escolher uma moeda de R$1,00. Logo: P(E i|A) = = = 0 2 1 0 2 1. 3 1 2 2. 3 10. 3 1 0.3/1 == ++ P(Ei) P(A|Ei) P(E1) P(A| E1) + P(E2) (A|E2) + ... + P(Ek) (A|Ek) P(Ei⋂A) P (A) P(E1⋂A) P (A) P(E1) P(A|E1) P(E1) P(A| E1) + P(E2) (A|E2) + P(E3) (A|E3) Raciocínio analítico e Quantitativo 105 3 2 2 1 2 2 . 3 1 2 1 )/()( )( )( )/( 2222 === ∩ = EAPEP AP AEP AEP 3 1 2 1 2 1. 3 1 )( )/()( )( )( )/( 3333 === ∩ = AP EAPEP AP AEP AEP Notemos que: 1)( 1 =∑ = k i iEP (soma das probabilidades a priori é 1) ∑ = = k i i AEP 1 1)/( (soma das probabilidades a posteriori é 1) Neste tópico, estudamos as regras básicas da teoria de probabilidades e conhe- cemos o Teorema de Bayes. Na sequência, vamos entender o que é uma distribuição de probabilidades, que associa conjuntamente o termo probabilidade com uma variável aleatória. 4.1.3 Distribuições de Probabilidades A fim de definirmos uma distribuição de probabilidades é necessário inicialmente entendermos a noção de variável aleatória. Cabe ressaltarmos que o tipo de distri- buição de probabilidades está intimamente ligado ao tipo de variável em questão. 4.2 Aspectos Introdutórios Como vimos no início do capítulo, o conjunto de todos os possíveis resultados de um experimento aleatório é o espaço amostral. Em vários casos experimentais, é necessário atribuir um número real x a todo elemento do espaço amostral: uma variável aleatória. Segundo Martins (2010), considerando E um experimento e S um espaço amos- tral associado ao experimento, podemos definir uma função X que associe a cada elemento s ∈ S um número real. X(s) é a variável aleatória. Raciocínio analítico e Quantitativo 106 Uma variável aleatória é uma função cujo domínio é o conjunto S, e o contradomínio é o conjunto de todos os valores possíveis de X, os X(s). É importante observar que os elementos do espaço amostral podem ser numé- ricos ou não, o que influencia o tipo de variável possível no conjunto. Exemplificando, se o experimento for escolher um aluno da turma e descrever a sua altura, teremos um conjunto numérico; todavia, se indagarmos o time de futebol preferido do aluno (se ele falar Flamengo, veremos que ele é lógico), teremos um conjunto não numérico. Quando os elementos forem numéricos, podemos ter as variáveis aleatórias discretas e as variáveis aleatórias contínuas. Dessa forma, de acordo com Martins (2010), sendo X uma variável aleatória, se o número de valores possíveis de X for finito ou infinito enumerável, dizemos que X é uma variável aleatória discreta. Por outro lado, sendo X uma variável aleatória, se o contradomínio de X for um intervalo ou uma coleção de intervalos, então X é dita uma variável aleatória contínua. Portanto: • Sendo X a variável número de caras obtidas no lan- çamento de duas moedas, então seus possíveis re- sultados são 0, 1 e 2, o que significa que X é uma variável discreta. • Se X é a variável que descreve o número de clien- tes que entram em um supermercado de São Paulo no período da manhã, então seus possíveis resultados são 0, 1, 2, 3, 4, ..., então, X é discreta. • Se X denota a altura dos estudantes de uma fa- culdade, então X é uma variável contínua. • Se X descreve o comprimento de um parafuso em um ciclo produtivo em mm, então X é uma variável contínua. Perceba, a partir dos exemplos apresentados, que variáveis aleatórias discretas são... Por outrolado, as variáveis aleatórias contínuas têm a característica... A seguir, vamos aprofundar nossos conhecimentos sobre vaiáveis aleatórias contínuas estudando o que é uma função densidade de probabilidade. © C or aM ax / / S hu tt er st oc k Raciocínio analítico e Quantitativo 107 4.2.1 Função Densidade de Probabilidade Já sabemos que uma variável aleatória pode ser discreta ou contínua e que, sendo contínua, assume valores em intervalos da reta real. As variáveis contínuas envolvem modelos que descrevem o comportamento de uma série de variáveis utilizadas no mundo dos negócios e também de distribuições teóricas de probabilidades que são o alicerce para os métodos de estimação estatística. Tais modelos são expressos por funções matemáticas que são chamadas de funções densidade de probabilidade. Segundo Martins (2010), a área sob a curva que descreve a função densidade de probabilidade é igual a 1, representando o total das probabilidades. A probabili- dade de uma peculiar observação (por exemplo, o preço de ações da bolsa de valores) pertencer a um intervalo é caracterizada pela área sob a curva correspondente ao intervalo. Vejamos a figura a seguir. P(a<x<b) a b x Fonte: MARTINS, 2010, p. 121. Vamos descrever formalmente a seguir, a função distribuição cumulativa, que é um aparato diretamente associado a uma variável aleatória discreta. 4.2.2 Função Distribuição Cumulativa Considere que X é uma variável aleatória discreta e x1, x2, x3, x4... seus possíveis valores. Segundo Martins (2010), a cada resultado xi pode-se associar um número, denotado por p(xi) = P(X = xi), chamado de probabilidade de xi, tal que: a. p(xi) ≥ 0 para todos xi b. 1 ( )i i p x ∞ = ∑ = 1 © F ab ri CO Raciocínio analítico e Quantitativo 108 Essa função é denominada de função de probabilidade da variável aleatória X, com distribuição de probabilidade caracterizada pelos pares [xi, p(xi)], i = 1, 2, ..., 3 e expressa por uma tabela, gráfico ou fórmula. Vejamos o exemplo a seguir. Exemplo: Consideremos o lançamento de três moedas. Vamos descrever a distribuição discreta de probabilidade da variável relacionada ao número de caras encontradas nestes lançamentos. Temos que: � = lançamento de três moedas, S = {ccc, cck, ckk, ckc, kcc, kkc, kkk}, X = número de caras = 0, 1, 2, 3 Logo: x = 0 → kkk, x = 1 → kkc, kck, ckk, x = 2 → cck, ckc, kcc, x = 3 → ccc Desta maneira, a distribuição de probabilidade de X pode ser visualizada na figura a seguir. Distribuição de probabilidade de X x1 0 1 2 3 p(xi) Dando continuidade ao nosso estudo, sendo X uma variável discreta, Martins (2010, p. 98) define a Função de Distribuição Acumulada ou Cumulativa em um ponto x como a soma das probabilidades dos valores xi menores ou iguais a x. Assim, escrevemos: F(x) = ( ) i i x x p x ≤ ∑ A partir dos dados anteriores, temos que: • F(1) = ( ) i i x 1 p x ≤ ∑ = + = ½ 1 8 3 8 3 8 1 8 1 8 3 8 Raciocínio analítico e Quantitativo 109 • F(1,5) = ( ) i i x 1,5 p x ≤ ∑ = + = ½ • F(2,5) = + + = • F(3) = + + + = 1 • F(5) = 1 e F(– 0,5) = 0 No próximo tópico, vamos conhecer os principais tipos de variáveis aleatórias que temos no âmbito das variáveis discretas e contínuas. 4.2.3 Tipos de Variáveis Aleatórias Uma variável aleatória é considerada discreta se toma valores que podem ser contados, como número de acidentes semanal, número de defeitos em itens, número de falhas numa safra, número de terremotos, número de jogos empatados, número de livros numa estante; por outro lado, é considerada contínua quando pode tomar qual- quer valor de determinado intervalo, como pesos de caixas de peças, alturas de árvores, duração de uma ligação telefônica, tempo necessário para completar um ensaio etc. Estamos interessados nas principais distribuições discretas e contínuas de proba- bilidade e nas aplicações que as envolvem. A figura a seguir nos mostra as principais distribuições de probabilidades que temos. Distribuiç ão Bomial Distribuição de Poisson Distribuição Normal (ou de Gauss) Distribuição Exponencial Distribuições Discretas Distribuições Contínuas Praticamente 92% da estatística paramétrica é baseada na Curva Normal de Gauss (Distribuição Contínua), que também aparece frequentemente em problemas nas mais variadas áreas do conhecimento. 1 8 3 8 1 8 3 8 3 8 7 8 1 8 3 8 3 8 1 8 © F ab ri CO Raciocínio analítico e Quantitativo 110 4.3 Variáveis Aleatórias Contínuas Na sequência, vamos conhecer a descrição teórica e prática de duas das principais variáveis aleatórias contínuas: a Curva Normal de Gauss e a Distribuição Exponencial, cada uma com suas especificidades. 4.3.1 A Curva Normal de Gauss Segundo Crespo (2009), as distribuições normais são de grande importância para a Estatística e suas aplicabilidades, porque representam as distribuições de frequên- cias observadas em diversos fenômenos naturais e físicos. Elas foram descobertas no século XVIII, quando astrônomos e outros cien- tistas observaram que mensurações repetidas de uma mesma quantidade (como por exemplo, a distância da Terra à Lua ou a massa de um dado objeto) tendiam a variar. Observaram também que, quando se coletava grande número dessas mensurações, dispondo-as num gráfico, elas se apresentavam conforme a figura a seguir. Descrição geométrica da curva normal A curva normal é também conhecida pelo nome de distribuição Gaussiana, em razão da contri- buição de Karl F. Gauss (1777-1855) a esta teoria matemática. As principais propriedades da curva normal de Gauss são: P1) a curva normal tem a forma de um sino; P2) é simétrica em relação à média; P3) prolonga-se de -∞ a +∞ (como demonstra a figura a seguir); © F ab ri CO Raciocínio analítico e Quantitativo 111 Prolongamento de valores da curva normal P4) cada distribuição normal fica completamente caracterizada por sua média e seu desvio padrão (como na figura a seguir); Caracterização da normal pelos seus parâmetros A área total sob a curva normal é considerada como 100%, isto é, representa 100% da probabi- lidade associada à variável. P5) a área sob a curva entre dois pontos é a probabilidade de uma variável normalmente distribuída tomar valor entre esses pontos (como na figura a seguir); P(a ≤ x ≤ b) = área © F ab ri CO © F ab ri CO © F ab ri CO Raciocínio analítico e Quantitativo 112 P6) a área sob a curva entre a média e um ponto arbitrário, é função do número de desvios padrões entre a média e aquele ponto. Esta é a chave que nos permite calcular probabilidades para a curva normal. Área é função do número de desvios P7) Como há um número ilimitado de valores no intervalo de –∞ a +∞, a proba- bilidade de uma variável aleatória distribuída normalmente tomar exatamente deter- minado valor é aproximadamente zero. Desta forma, as probabilidades se referem sempre a intervalos de valores. Para a resolução de problemas envolvendo a normal de Gauss é necessária a reali- zação de uma padronização, que será apresentada na sequência. A distribuição normal padronizada, como a conceituamos, é o assunto do nosso próximo tópico. 4.3.2 A Distribuição Normal Padronizada A distribuição normal é constituída por uma família infinitamente grande de distribuições, uma para cada combinação possível de média e desvio padrão. Portanto, seria inútil elaborar tabelas que atendessem a todas as nossas necessi- dades. Além disso, a expressão característica da curva normal não é conveniente para o cálculo de probabilidades, em vista de sua complexidade. Segundo Martins (2010) a função densidade de probabilidade da distribuição normal é dada por: 2 . 2 1 2πσ 1 )( −− = σ μx exf . © F ab ri CO Raciocínio analítico e Quantitativo 113 As distribuições normais com desvio padrão maior são mais achatadas, mas simétricas e em forma de sino. As que apresentammaiores médias acham-se localizadas à direita das que têm menores médias. Deve-se salientar que todas as distribuições normais podem ser transformadas em distribuições normais padronizadas mudando-se a escala da distribuição original. A distribuição normal padronizada tem média zero e desvio padrão 1. Se X é uma variável aleatória continua, normalmente distribuída, com média μ e variância σ2, indica-se este fato escrevendo “X = N(μ, σ2). A variável normal padronizada, escreve-se Z = N(0,1). A variável Z é dada pela simples expressão Z = σ x - μ , na qual x é o valor da variável X a ser padronizado, μ é a média e σ é o desvio padrão de X. A área total sob a curva normal padronizada é igual a 1. Portanto as probabilidades podem ser apresen- tadas como áreas sob a curva normal padronizada entre dois valores distintos de Z. Escala da normal padronizada Na figura a seguir, apresentamos a tabela da normal padronizada, que é usada para o cálculo de probabilidades e áreas. © F ab ri CO Raciocínio analítico e Quantitativo 114 A tabela da normal padronizada 0,0 0,0000 0,1 0,0398 0,2 0,0793 0,3 0,1179 0,4 0,1554 0,5 0,1915 0,6 0,2257 0,7 0,2580 0,8 0,2881 0,9 0,3159 1,0 0,3413 1,1 0,3643 1,2 0,3849 1,3 0,4032 1,4 0,4192 1,5 0,4332 1,6 0,4452 1,7 0,4554 1,8 0,4641 1,9 0,4713 2,0 0,4772 2,1 0,4821 2,2 0,4861 2,3 0,4893 2,4 0,4918 2,5 0,4938 2,6 0,4953 2,7 0,4965 2,8 0,4974 2,9 0,4981 3,0 0,4987 3,1 0,4990 3,2 0,4993 3,3 0,4995 3,4 0,4997 3,5 0,4998 3,6 0,4998 3,7 0,4999 3,8 0,4999 3,9 0,5000 0,0040 0,0080 0,0438 0,0478 0,0832 0,0871 0,1217 0,1255 0,1591 0,1628 0, l 950 0,1985 0,2291 0,2324 0,2611 0,2642 0,2910 0,2939 0,3186 0,3212 0,3438 0,3461 0,3665 0,3686 0,3869 0,3888 0,4049 0,4066 0,4207 0,4222 0,4345 0,4357 0,4463 0,4474 0,4564 0,4573 0,4649 0,4656 0,4719 0,4726 0,4778 0,4783 0,4826 0,4830 0,4864 0,4868 0,4896 0,4898 0,4920 0,4922 0,4940 0,4941 0,4955 0,4956 0,4966 0,4967 0,4975 0,4967 0,4982 0,4982 0,4987 0,4987 0,4991 0,4991 0,4993 0,4994 0,4995 0,4995 0,4997 0,4997 0,4998 0,4998 0,4998 0,4999 0,4999 0,4999 0,4999 0,4999 0,5000 0,5000 0,0120 0,0160 0,0199 0,05]7 0,0557 0,0596 0,0910 0,0948 0,0987 0,1293 0,1331 0,1368 0,1664 0,1700 0,1736 0 2019 0,2054 0,2088 0,2357 0,2389 0,2422 0,2673 0,2703 0,2734 0,2961 0,2995 0,3023 0,3238 0,3264 0,3289 0,3485 0,3508 0,3531 0,3708 0,3729 0,3749 0,3907 0,3925 0,3944 0,4082 0,4099 0,4115 0,4236 0,4251 0,4265 0,4370 0,4382 0,4394 0,4484 0,4495 0,4505 0,4582 0,4591 0,4599 0,4664 0,4671 0,4678 0,4732 0,4738 0,4744 0,4788 0,4793 0,4798 0,4834 0,4838 0,4842 0,4871 0,4875 0,4878 0,4901 0,4904 0,4906 0,4925 0,4927 0,4929 0,4943 0,4945 0,4946 0,4957 0,4959 0,4960 0,4968 0,4969 0,4970 0,4977 0,4977 0,4978 0,4983 0,4984 0,4984 0,4988 0,4988 0,4989 0,4991 0,4992 0,4992 0,4994 0,4994 0,4994 0,4996 0,4996 0,4996 0,4997 0,4997 0,4997 0,4998 0,4998 0,4998 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,5000 0,5000 0,5000 0,0239 0,0279 0,0319 0,0359 0,0636 0,0675 0,0714 0,0753 0,1026 0,1064 0,1103 0,1141 0,1406 0,1443 0,1480 0,1517 0,1772 0,1808 0,1844 0,1879 0,2123 0,2157 0,2190 0,2224 0,2454 0,2466 0,2517 0,2549 0,2764 0,2794 0,2823 0,2852 0,3051 0,3078 0,3106 0,3133 0,3315 0,3340 0,3365 0,3389 0,3554 0,3577 0,3599 0,3621 0,3770 0,3790 0,3810 0,3830 0,3962 0,3980 0,3997 0,4015 0,4131 0,4147 0,4162 0,4177 0,4279 0,4292 0,4306 0,4319 0,4406 0,4418 0,4429 0,4441 0,4515 0,4525 0,4535 0,4545 0,4608 0,4616 0,4625 0,4633 0,4686 0,4693 0,4699 0,4706 0,4750 0,4756 0,4761 0,4767 0,4803 0,4808 0,4812 0,4817 0,4846 0,4850 0,4854 0,4857 0,4881 0,4884 0,4887 0,4890 0,4909 0,4911 0,4913 0,4916 0,4931 0,4932 0,4934 0,4936 0,4948 0,4949 0,4951 0,4952 0,4961 0,4962 0,4963 0,4964 0,4971 0,4972 0,4973 0,4974 0,4979 0,4979 0,4980 0,4981 0,4985 0,4985 0,4986 0,4986 0,4989 0,4989 0,4990 0,4990 0,4992 0,4392 0,4993 0,4993 0,4994 0,4995 0,4995 0,4995 0,4996 0,4996 0,4996 0,4991 0,4997 0,4997 0,4997 0,4998 0,4998 0,4998 0,4998 0,4998 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,5000 0,5000 0,5000 0,5000 0 z Tabela A6.2 Distribuição normal -- valores de P(0 < Z < 0) 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 Fonte: MARTINS, 2010, p. 128. Vejamos a seguir alguns exemplos ilustrativos sobre a aplicabilidade da curva normal e, por conseguinte, da curva normal padronizada. Problema: Utilizando a tabela da normal padronizada que apresentamos antes, determine as seguintes probabilidades, justificando em todos os casos a sua resposta. © F ab ri CO Raciocínio analítico e Quantitativo 115 a. P(Z > 1,13) = ? b. P(Z < 1,13) = ? c. P(-1,13 < Z < 0) = ? d. P(2,10 < Z < 2,95) = ? Solução: Neste caso, temos que: a. P(Z > 1,13): Para encontrarmos tal probabilidade, inicialmente vamos construir o gráfico relacionado na disposição da distribuição normal. Como sabemos, P(Z > 0) = 0,5, logo: P(Z > 1,13) = 0,5 – 0,3708 = 0,1292, ou seja, 12,92%. b. Para caracterizarmos P(Z < 1,13), mais uma vez construindo o gráfico, observa- mos que: E como P(Z < 0) = 0,5, Temos que: P(Z < 1,13) = 0,5 + 0,3708 = 0,8709 ou 87,09% c. Construindo o gráfico: © F ab ri CO © F ab ri CO Raciocínio analítico e Quantitativo 116 Lembrando que P(0 < Z < z0) = P(-z0 < Z < 0), devido à simetria da curva normal, então: P(-1,13 < Z < 0) = P(0 < Z < 1,13) = 0,3708 ou 37,08% d. Construindo novamente o gráfico, temos: 0 2,10 2,95 Z1 Desta maneira, observemos que: P(0 < Z < 2,10) = 0,4821 e P(0 < Z < 2,95) = 0,4984 Portanto, da simetria da distribuição escrevemos: P(2,10 < Z < 2,95) = P(0 < Z < 2,95) – P(0 < Z < 2,10) = 0,4984 – 0,4821 = 0,0163 ou 1,63% Problema: Ao projetar assentos para serem instalados em aviões comerciais, os engenheiros desejam construí-los de forma a acomodar 98% de todos os homens. (acomodar 100% dos homens resultaria em assentos muito largos que seriam muito caros). Os homens têm larguras de quadris que são normalmente distribuídas, com uma média de 14,4 u.c e desvio padrão de 1,0 u.c (dados fornecidos por uma companhia aérea multinacional). Qual a largura de quadril de homens que separa os 98% inferiores dos 2% superiores? Solução: Neste caso, vamos denotar a largura de quadril de homens que separa os 98% inferiores dos 2% superiores por x0 , sendo assim, temos que σ x0 - μz = . E para a área igual a 48%, temos que z = 2,05 e, portanto 2,05 = σ x0 - μz = . Ou seja: © F ab ri CO © F ab ri CO Raciocínio analítico e Quantitativo 117 2,05 = σ x0 - 14,4 ou ainda x0 = 16,45 u.c. Vejamos agora os aspectos teóricos envolvendo a distribuição exponencial, que constitui um outro exemplo de distribuição contínua de probabilidade. Vamos lá? 4.3.3 A Distribuição Exponencial Segundo Crespo (2009), a distribuição exponencial é uma distribuição que envolve probabilidades ao longo do tempo ou da distância entre ocorrências num inter- valo contínuo. Pode ser usada como, por exemplo, modelo do tempo entre falhas de equipamentos elétricos, modelo entre chegada de clientes a uma agência bancária, modelo de tempo entre chamadas telefônicas etc. As probabilidades exponenciais se exprimem em termos de tempo ou distância até que um evento ou ocorrência se verifique. A representação geométrica da expo- nencial é mostrada na figura a seguir. Gráfico da distribuição exponencial f (t) λ 0 t1 100% Para os cálculos de probabilidades, temos a disposição geométrica a seguir. © fr ee se ri es / / S hu tt er st oc k © F ab ri CO Raciocínio analítico e Quantitativo 118 Cálculo de probabilidades de uma distribuição exponencial f (t) λ 0 tt0 P(T>t0) = e -λt0 P(T<t0) = 1-e -λt0 Para a distribuição exponencial, a sua média é E[T] = λ 1 e variância dada por Var[T] = λ 1 2 , em que λ = o número médio de ocorrências no intervalo de interesse. A seguir, vamos solucionar um problema que exemplifica o assunto. Problema: Suponha que em determinado período do dia o tempo médiode atendimento no caixa de um banco seja de 5 minutos. Admitindo que o tempo para atendimento tenha distribuição exponencial, determine a probabilidade de um cliente: a. esperar mais do que 5 minutos; b. esperar menos do que 5 minutos; c. esperar entre 3 e 8 minutos. Solução: Neste caso, temos que: a. Pela média exponencial: E[T] = μ = λ 1 , daí 5 = λ 1 e então λ = 0,2. Portanto: P(T > 5) = e-λ.t0 = e-0,2(5) = e-1 = 0,3679 ou 36,79% Ou seja, a probabilidade de esperar mais de 5 minutos é de 0,3679 ou 36,79%. b. Temos que: P(T < 5) = 1 – e -λ.t0 = 1 – e-0.2(5) = 1 – e-1 = 0,6321 ou 63,21%. c. Temos que P(3 < T < 8) = P(T > 3) – P(T > 8) = e-0,2(3) – e-0,2(8) = 0,5488 – 0,2019 = 0,3469 ou 34,69%. Ou seja, a probabilidade de esperar 3 a 8 minu- tos é de 34,69%. © F ab ri CO © ro bu ar t / / Sh ut te rs to ck Raciocínio analítico e Quantitativo 119 Vejamos agora a descrição teórica acerca das principais variáveis aleatórias discretas, que são a variação Binomial e Poisson. Vamos lá? 4.4 Variáveis Aleatórias Discretas Vejamos agora a descrição teórica e prática envolvendo duas das principais variáveis aleatórias discretas, que são a Binomial e a Poisson, cada uma com suas particularidades. 4.4.1 Distribuição Binomial e Medidas Características A distribuição binomial é um modelo que dá a probabilidade do número de sucessos quando são realizadas n provas do mesmo tipo, ou seja, o experimento é repetido n vezes. São exemplos de experiências binomiais: o lançamento de uma moeda n vezes, respostas de um teste com diversas questões V ou F, escolha entre um produto bom ou com defeito etc. Cada experimento admite dois resultados, sucesso ou insucesso, com probabili- dade p de sucesso e 1 – p = q de insucesso, constantes em cada uma das provas. Para utilizarmos a distribuição binomial, é preciso que: • sejam realizadas n provas do mesmo tipo (idênticas); • cada prova admita dois resultados possíveis, um chamado sucesso e o outro insucesso. • as probabilidades p de sucesso e 1 – p de fracasso permaneçam constantes em todas as provas. • os resultados das provas sejam independentes uns dos outros. Segundo Martins (2010), para o cálculo de uma probabilidade binomial é neces- sário especificarmos n, o número de provas, k, o número de sucessos, e p, a proba- bilidade de sucesso em cada prova. Desta forma, temos que a probabilidade de k sucessos em n provas é dada por: P( X = k) = n k [P(sucesso)]k [P( fracasso)]n-k Ou ainda, P( X = k) = n k . pk (1 - p) n-k onde n k = . Vejamos uma situação ilustrativa envolvendo a distribuição binomial. n! k!(n – k)! Raciocínio analítico e Quantitativo 120 Problema: A probabilidade de que um presumível cliente aleatoriamente esco- lhido faça uma compra é 0,20 em um hipermercado da cidade de São Paulo. Um vendedor está oferecendo um novo iogurte para prova, entre as prateleiras da seção de laticínios. Se ele distribuir a prova para seis presumíveis clientes, qual é a probabili- dade de que exatamente quatro deles compre o novo iogurte? Solução: Neste caso, é de nosso interesse caracterizar P(X = 4). Olhando para o enunciado do problema, percebe-se que n = 6, k = 4, p = 0,20 e 1 – p = 1 – 0, 20 = q. Assim, escrevemos: P(X = 4) = knk pp k n −− )1.(. = 464 ),2001),200 4 6 −− .( .( = 24 ),200),200 !2!.4 !6 .( .( P(X = 4) = 0,01536 ≅ 0,015 Ou seja, a probabilidade de que quatro pessoas comprem o produto (sucessos) é de aproximadamente 1,5% entre seis possíveis clientes que provarem o produto. Já estudamos a distribuição binomial. A seguir, vamos descrever a teoria da distribuição de Poisson, que também constitui um exemplo de distribuição discreta de probabilidades. 4.4.2 Distribuição de Poisson e Propriedades A distribuição de Poisson é amplamente utilizada para determinar a probabilidade de um dado número de sucessos quando os eventos ocorrem em um conti- nuum de tempo ou espaço. Um exemplo do processo de Poisson é a chegada de chamadas de uma central tele- fônica, chamadas telefônicas por unidade de tempo, defeitos por unidade de área, acidentes por unidade de tempo e chegada de clientes ao caixa de um supermer- cado por unidade de tempo. A seguir, veja as condições de aplicação da distribuição de Poisson: • A probabilidade de uma ocorrência em um intervalo ∆t (ou ∆s) é constante e proporcional ao tamanho do intervalo. Isto é: P(X = 1, ∆t) = λ.∆t. • A probabilidade de mais de uma ocorrência em um intervalo ∆t (ou ∆s, ou ...) é igual a zero. Isto é: P(X > 1, ∆t) = 0. • O número de ocorrências constituem variáveis aleatórias independentes. © M ac ro ve ct or / / S hu tt er st oc k Raciocínio analítico e Quantitativo 121 A expressão (ou fórmula) que dá a probabilidade de k sucessos em um intervalo t (tempo, área, ...) é: P(X = k, t) = ! .).( . k et tk ll − Onde: λ = coeficiente de proporcionalidade, ou taxa de frequência por unidade de tempo, área, t = tempo, área, e = base dos logaritmos decimais (e = 2,71828) k = número de ocorrências (sucessos) Considerando que a média da população é dada por λ.t, ou seja, μ = λ.t, temos que P( X = k) = P(X = k, t) = ! . k ek μμ − . Além disso, a variância da distribuição de Poisson é dada por λ.t, ou seja: σ2 = λ.t. Por outro lado, a moda corresponde ao maior inteiro contido em λ.t. Se λ.t for inteiro, então haverá duas modas nos pontos: k = λ.t e k – 1 = λ.t – 1. Vejamos uma situação ilustrativa envolvendo a distribuição de Poisson. Problema: O setor de qualidade de uma multinacional afirma que os rolos de fita isolante apresentam, em média, uma emenda a cada 50 metros. Admitindo-se que a distri- buição do número de emendas é modelada como Poisson, determine as probabilidades: a. De nenhuma emenda em um rolo de 125 metros; b. De ocorrerem no máximo duas emendas em um rolo de 125 metros; c. De ocorrer pelo menos uma emenda em um rolo de 100 metros. Solução: a. Neste caso, temos que: μ = λ.t = λ.50 logo λ =, logo para t = 125 metros, te- mos: λ.t = .125 = 2,5, então P(X = 0,125 m) = !0 .)5,2( 5,20 −e = 0,0821 ou 8,21%. b. Da letra (a), temos que: λ = e λ.t = 2,5. Então: 1 50 1 50 1 50 Raciocínio analítico e Quantitativo 122 P(X ≤ 2,125 m) = P(0) + P(1) + P(2) = 0,0821 + !1 .)5,2( 5,21 −e + !2 .)5,2( 5,22 −e P(X ≤ 2,125 m) = 0,0821 + 0,2053 + 0,2566 = 0,5440 ou 54,40% c. Temos λ = , logo λ.t = .100 = 2, daí: P(X ≥ 1,100 m) = P(1) + P(2) + P(3) + P(4) + ... = 1 – P(0) = 1 – e-2 = 0,8647 ou 86,47% 4.4.3 Aplicações Diversas Envolvendo a Distribuição Binomial e a Distribuição de Poisson Vejamos a seguir mais alguns exemplos que ilustram a aplicabilidade da distribuição binomial e da distribuição de Poisson em problemas simulados. Problema: Se a probabilidade de que um possível cliente realize uma compra é 0,20 em uma loja de discos, determine a probabili- dade do vendedor Cauã, abordando 15 clientes presumíveis, realizar pelo menos 3 vendas? Solução: Neste caso, queremos encontrar P(X < 3), ou seja: P(X < 3) = P(X = 0) + P(X = 1) + P(X = 2) P(X < 3) = 0,0352 + 0,1319 + 0,2309 P(X < 3) = 0,3980 ≅ 0,40 Portanto, a probabilidade de Cauã realizar pelo menos 3 vendas é de... Problema: Na revisão tipográfica de um e-book achou-se em média 1,5 erros por página. Das 800 páginas do e-book, estime quantas não precisam ser modificadas por não apresentarem erros. Solução: A probabilidade de não ter erro em uma página será: p = P(X = 0) = !0 .)5,1( 5,10 −e = 0,223 1 50 1 50 © D ie go C er vo / / S hu tt er st oc k Raciocínio analítico e Quantitativo 123 Portanto, média = μ = n.p = 800 x 0,223 = 178. É de se esperar que 178 páginas não apresentem erros. Problema: Considere um posto de pedágio na rodovia Fernão Dias, que liga Belo Horizonte a São Paulo capital. Sabendo que nela passam, em média, 5 carros porminuto, qual a probabilidade de passarem exatamente 10 carros por minuto? Solução: Queremos encontrar, neste caso, P(X = 3), com μ = 5 e X = 3, daí: P(X = 3) = !3 .5 53 −e = 0,146 = 14,6% Ou seja, a probabilidade de passarem exatamente 10 carros por minuto é igual a 14,6%. 350 pt © y it ew an g / / S hu tt er st oc k Raciocínio analítico e Quantitativo 124 Referências MARTINS, Gilberto de Andrade. Estatística geral e aplicada. 3. ed.. Rio de Janeiro: Atlas, 2010. NOVAES, D. V.; COUTINHO, C. de Q. e S. Estatística para Educação Profissional e Tecnológica. 2. ed. São Paulo: Atlas, 2013. CRESPO, A. A. Estatística Fácil. 19. ed. São Paulo: Saraiva, 2009. LEVINE, D. M; STEPHAN, D. M; KREHBIEL, T. C; BERENSON, M. L. Estatística: teoria e aplicações. 06. ed. Rio de Janeiro: LTC, 2012. TIBONI, C. G. R. Estatística Básica: para os cursos de administração, ciências contábeis, tecnológicos e de gestão. São Paulo: Atlas, 2010.