Baixe o app para aproveitar ainda mais
Prévia do material em texto
Brasília - DF. Estatística básica Autores Heitor Achilles Dutra da ROSA Produção Equipe Técnica de Avaliação, Revisão Linguística e Editoração Sumario Organização do caderno de estudos e pesquisa ..................................................................................................... 4 Introdução ............................................................................................................................................................................. 6 Aula 1 Pensamentos Estatísticos .......................................................................................................................................... 7 Aula 2 Organização e Descrição de Dados ......................................................................................................................23 Aula 3 Medidas de tendência central e medidas de variabilidade .........................................................................35 Aula 4 Probabilidade ...............................................................................................................................................................52 Aula 5 Distribuição de probabilidade de variáveis aleatórias discretas ...............................................................75 Aula 6 Distribuição de probabilidade de variáveis aleatórias contínuas..............................................................82 Tabelas estatísticas ..........................................................................................................................................................95 Referências ..........................................................................................................................................................................96 4 Organização do caderno de estudos e pesquisa Para facilitar seu estudo, os conteúdos são organizados em unidades, subdivididas em capítulos, de forma didática, objetiva e coerente. Eles serão abordados por meio de textos básicos, com questões para reflexão, entre outros recursos editoriais que visam a tornar sua leitura mais agradável. Ao final, serão indicadas, também, fontes de consulta, para aprofundar os estudos com leituras e pesquisas complementares. A seguir, uma breve descrição dos ícones utilizados na organização dos Cadernos de Estudos e Pesquisa. Provocação Textos que buscam instigar o aluno a refletir sobre determinado assunto antes mesmo de iniciar sua leitura ou após algum trecho pertinente para o autor conteudista. Para refletir Questões inseridas no decorrer do estudo a fim de que o aluno faça uma pausa e reflita sobre o conteúdo estudado ou temas que o ajudem em seu raciocínio. É importante que ele verifique seus conhecimentos, suas experiências e seus sentimentos. As reflexões são o ponto de partida para a construção de suas conclusões. Sugestão de estudo complementar Sugestões de leituras adicionais, filmes e sites para aprofundamento do estudo, discussões em fóruns ou encontros presenciais quando for o caso. Praticando Sugestão de atividades, no decorrer das leituras, com o objetivo didático de fortalecer o processo de aprendizagem do aluno. 5 Organização do caderno de estudos e pesquisa Atenção Chamadas para alertar detalhes/tópicos importantes que contribuam para a síntese/conclusão do assunto abordado. Saiba mais Informações complementares para elucidar a construção das sínteses/conclusões sobre o assunto abordado. Sintetizando Trecho que busca resumir informações relevantes do conteúdo, facilitando o entendimento pelo aluno sobre trechos mais complexos. Para (não) finalizar Texto integrador, ao final do módulo, que motiva o aluno a continuar a aprendizagem ou estimula ponderações complementares sobre o módulo estudado. 6 Introdução Este caderno de estudos se destina a alunos do curso de Graduação a distância em Administração da AVM e apresenta uma introdução conceitual do campo da estatística e algumas aplicações. As aplicações correspondem a problemas contextualizados que exigem a análise de certos dados apresentados, bem como a escolha de um método conveniente para tratá-los estatisticamente. Sendo assim, ao longo de cada aula serão discutidas, desenvolvidas e ampliadas algumas técnicas estatísticas a fim de, posteriormente, serem aplicadas em situações-problema. Vale ressaltar que as questões apresentadas irão, constantemente, exigir que o estudante se posicione criticamente frente às mesmas, isto é, a partir de resultados estatísticos, o estudante deverá fornecer critérios para tomada de decisões na solução de problemas. Apesar do forte caráter das aplicações, é importante lembrar que, em todos os momentos, o rigor característico da linguagem matemática está presente, uma vez que um dos objetivos deste módulo é articular teoria e prática. Vale observar ainda que não existe preocupação de esgotar por completo os conceitos abordados, embora estejam incluídas referências bibliográficas para aqueles que assim desejam. Este caderno de estudos tem como objetivos: » Servir de instrumento de reflexão, discussão e problematização em torno de temas e questões fundamentais presentes na prática de uma empresa e/ou organização. » Entender e usar de forma eficiente e eficaz informações estatísticas extraídas de um banco de dados. » Analisar relatórios estatísticos visando avaliar e tomar decisões acertadas. Enfatizar o desenvolvimento do pensamento estatístico e avaliar a credibilidade do valor das inferências feitas a partir de dados, não só para aqueles que consomem, mas também para aqueles que produzem. 7 Apresentação Esta aula apresenta algumas definições básicas de conceitos relacionados à estatística. Além disso, busca demonstrar o papel-chave que a estatística desempenha no raciocínio crítico, seja ele, elaborado no decorrer desse curso, no trabalho ou na vida diária. Objetivos Esperamos que, após o estudo do conteúdo desta aula, você seja capaz de: » Identificar quais os objetivos da ciência estatística. » Identificar tipos de aplicações estatísticas na empresa. » Reconhecer quais são os elementos fundamentais da estatística. » Identificar e escolher adequadamente um método estatístico para análise de populações. » Classificar dados estatísticos. » Estabelecer um critério para coleta de dados. » Entender o papel da estatística no gerenciamento da tomada de decisões. 1AulAPEnSAMEnTOS ESTATíSTIcOS 8 AulA 1 • PEnSAMEnTOS ESTATíSTIcOS O que é estatística? Você pode ainda não ter notado, mas seja qual for a sua opinião sobre questões cotidianas, você sempre encontra ou poderá encontrar estatísticas ou pesquisas estatísticas para apoiar seus pontos de vista – quer seja para tomar algum tipo de vitamina ou para saber se o ensino integral é mais eficaz no desenvolvimento das crianças, ou até mesmo se um alimento faz mal ou bem. Existe um infinito fluxo de informações para auxiliá-lo a tomar decisões, podendo essas serem seguras ou não, parciais ou imparciais. Mas, qual o significado da estatística? Sabe-se, por exemplo, que ela pode ser capaz de fazer alguém pensar na média de gols por rodada de um campeonato, fazer com que se possa refletir sobre os números do desemprego no país e no mundo ou até mesmo em distorções numéricas de fatos. Dessa forma, a estatística aparece como uma ciência importante, útil e com um escopo abrangente de aplicações em negócios, administração, política, física e ciências sociais, quase ilimitado. Definição 1.1 Estatística é a ciência da coleta, organização e interpretação de fatos numéricos, chamados de dados. Vale lembrar que um estatístico além de calcular médias e/ou tabular resultados é também capaz de coletar informações numéricas em forma de dados, a fim de avaliá-los e a partir delestirar determinadas conclusões. Os estatísticos também são capazes de determinar qual informação é relevante em um dado problema e se as conclusões obtidas a partir de certo estudo podem ou não ser confiáveis. Muitas descrições numéricas como, por exemplo, taxas mensais de desemprego, índice de falência para um novo negócio e proporção de mulheres executivas em um setor particular representam descrições estatísticas de um grande conjunto de dados coletados sobre algum fenômeno. Muitas vezes, os dados selecionados pertencem a algum conjunto maior do qual se deseja obter alguma característica. Este processo de seleção é chamado de amostragem. Por exemplo, você pode coletar as idades de uma amostra de consumidores em uma videolocadora para estimar a idade média de todos os consumidores da loja. Assim, você poderia usar suas estimativas nos anúncios da loja para atingir o grupo ou faixa etária apropriada. Nesse exemplo, a estatística envolve dois diferentes processos: » Descrever conjuntos de dados; » Obter conclusões (fazer estimativas, previsões, tomar decisões) sobre os conjuntos de dados baseados na amostragem. 9 PEnSAMEnTOS ESTATíSTIcOS • AulA 1 O exemplo sugere duas aplicações da estatística, sendo assim, esta pode ser dividida em duas grandes áreas: estatística descritiva e estatística inferencial. Definição 1.2 A estatística descritiva utiliza métodos numéricos e gráficos para coletar, organizar e descrever dados. Exemplo 1.1 – “Divisão do mercado norte-americano de cartões de crédito e débito” (U.S. Payment Card Information Network, 22 nov. 2005). A CardWeb.com, Inc. é líder em publicações on-line de informações referentes a cartões de pagamento (isto é, crédito, débito, smart, pré- pago e cartões telefônicos). Em 2005, a empresa rastreou, nos EUA, todas as compras efetuadas com cartões de crédito ou débito. A quantidade de cada compra foi gravada e classificada de acordo com o tipo de cartão usado. Os resultados são mostrados na figura 1.1 a seguir. Figura 1.1 – Divisão do mercado de cartões de crédito norte-americano em 2005. (Fonte: www.carddata.com) Definição 1.3 A estatística inferencial utiliza uma amostra de dados para fazer estimativas, decisões, previsões ou outras generalizações acerca de um conjunto maior de dados. Exemplo 1.2 – “O Índice de preços ao consumidor” (Departamento do trabalho Norte-americano). Saiba mais Um dos maiores usos do IPC como um índice de inflação é o de indicador do sucesso ou fracasso das políticas econômicas do governo. Outro uso é o de índice de reajuste dos salários. Milhões de trabalhadores possuem dissídios salariais em seus acordos sindicais coletivos; estas cláusulas indicam os aumentos nas taxas salariais com base em aumentos do IPC. Além disso, os benefícios da Previdência Social, a aposentadoria militar e os salários do funcionalismo público estão atrelados ao IPC. 10 AulA 1 • PEnSAMEnTOS ESTATíSTIcOS Um conjunto de dados que virtualmente interessa à população de qualquer país é o conjunto de preços cobrados por bens e serviços na economia desse país. A tendência geral de aumento nesses preços é chamada inflação e a queda nos preços é conhecida como deflação. De modo a estimar a alteração nos preços ao longo do tempo, o Bureau de Estatísticas do Trabalho (BLS) do Departamento de Trabalho norte-americano desenvolveu o Índice de Preços ao Consumidor (IPC). A cada mês, o BLS coleta dados de preços de uma seleção específica de bens e serviços (chamados de cesta de bens e serviços) de 85 áreas urbanas do país. Procedimentos estatísticos são usados para calcular o IPC dessa amostra de dados de preços e de outras informações sobre os hábitos de consumo das pessoas. Ao comparar o IPC em diferentes momentos, é possível estimar (fazer uma inferência sobre) a taxa de inflação em um intervalo de tempo e comparar o poder de compra do dólar em diferentes momentos no tempo. Este é um exemplo de estatística inferencial, os dados de preço da cesta de bens e serviços coletados de uma amostra de áreas urbanas (usados para calcular o IPC) são usados nas inferências sobre a taxa de inflação e o aumento dos salários. conceitos fundamentais da estatística Métodos estatísticos são particularmente úteis para estudar, analisar e aprender sobre populações de unidades experimentais. Definição 1.4 Chama-se unidade experimental um objeto a partir do qual correlatamos dados. Definição 1.5 Chama-se população um conjunto universo qualquer, do qual desejamos obter informações, cujos elementos devem apresentar pelo menos uma característica em comum. Exemplo 1.3 – Exemplos de Populações. Todos os trabalhadores desempregados no Brasil; todos os eleitores da cidade do Rio de Janeiro; todos os carros produzidos no ano de 2007 no Brasil; todas as vendas realizadas no drive-thry de uma lanchonete da rede McDonald´s durante o ano de 2008; o conjunto de todos os atropelamentos ocorridos no 1º semestre de 2006 em Copacabana. Ao estudar uma população, focamos uma ou mais características ou propriedades das unidades experimentais na população. Essas características são denominadas variáveis. Definição 1.6 Chama-se variável uma característica ou propriedade de uma unidade experimental. 11 PEnSAMEnTOS ESTATíSTIcOS • AulA 1 Ao estudar uma variável em particular, é útil obter-lhe uma representação numérica. Muitas vezes para obter essa representação é necessário estabelecer um processo de medição. Sendo assim, a medição é o processo que utilizamos para atribuir números às variáveis de unidades populacionais distintas. Pode-se, por exemplo, medir a qualidade de um serviço solicitando a um cliente para avaliar a eficiência do serviço em uma escala de 1 a 10. Ou pode-se mensurar a idade da força de trabalho simplesmente fazendo a pergunta: “qual a sua idade?” De acordo com o caso, a medição pode envolver instrumentos específicos como cronômetros, réguas e calibradores. Quando a população estudada é pequena, pode-se medir uma variação para cada unidade dessa população. Por exemplo, deseja-se medir o salário inicial de todos os graduados em Administração do IAVM em um determinado ano. É pelo menos factível obter cada salário. Nesse caso, em que se consegue medir uma variável para cada unidade experimental de uma população, o resultado obtido é denominado censo. Definição 1.7 Chama-se censo o levantamento total da população. Nesse caso, cada elemento da população é analisado individualmente. Porém, em muitos casos, a população de interesse envolve talvez muitos milhares ou ainda um número infinito de unidades. Sendo assim em vez de considerar toda a população, pode-se analisar uma parte dela. Mesmo porque, dependendo do caso, conduzir um censo para populações muito grandes pode ocasionar um custo proibitivo em termos de tempo e dinheiro. Uma alternativa razoável é selecionar e estudar um subconjunto (ou porção) das unidades na população. Definição 1.8 Chama-se amostra todo subconjunto de unidades de uma população. Exemplo 1.4 – Auditoria de faturamento. Suponha que uma empresa está sendo auditada em seu faturamento. Em vez de examinar todas as 25.487 faturas emitidas durante certo ano, um auditor pode selecionar e examinar uma amostra de apenas 100 faturas. Se o interesse for a variável “fatura com erro”, gravaria (mediria) a condição (erro ou não erro) de cada fatura da amostra. Após cada variável de interesse de unidade experimental na amostra (ou população) ser medida, os dados são analisados por métodos estatísticos descritivos ou inferenciais. O auditor, por exemplo, pode apenas descrever a taxa de erro na amostra de 100 faturas. Contudo, é mais provável que ele utilize a informação obtida para fazer inferências sobre a população de todas as 25.487 faturas. 12 AulA 1 • PEnSAMEnTOS ESTATíSTIcOS Definição1.9 Uma inferência estatística é uma estimativa ou previsão ou alguma outra generalização sobre uma população com base em informações contidas numa amostra. EXERCÍCIO RESOLVIDO A Guerra das “Colas” é o termo popular para a intensa competição entre Coca-Cola e Pepsi mostrada em suas campanhas de marketing. As campanhas têm estrelas do cinema e televisão, vídeos de rock, apoio de atletas e afirmações preferenciais dos consumidores com base em testes de sabor. Como uma parte de uma campanha de marketing da Pepsi, suponha que 1 000 consumidores de refrigerante sabor cola submetam-se a um teste cego de sabor (isto é, as marcas estão encobertas). Cada consumidor é questionado quanto à sua preferência em relação à marca A ou B. ( A ) Descreva a população. ( B ) Descreva a variável de interesse. ( C ) Descreva a amostra. ( D ) Descreva a inferência. SOLUÇÃO ( A ) Uma vez que estamos interessados nas respostas dos consumidores de refrigerantes sabor cola no teste de sabor, um consumidor desse tipo de refrigerante é uma unidade experimental. Assim, a população de interesse é a coleção ou conjunto de todos esses consumidores. ( B ) A característica que a Pepsi deseja medir é a preferência do consumidor de refrigerante sabor cola revelada sob a aplicabilidade de um teste cego, logo, a preferência pelo tipo de refrigerante é a variável de interesse. ( C ) A amostra é de 1 000 consumidores de refrigerantes, sabor cola, selecionados da população de todos os consumidores desse tipo de refrigerante. ( D ) A inferência de interesse é a generalização da preferência de refrigerante sabor cola dos 1 000 consumidores da amostra para a população de todos os consumidores desse tipo de refrigerante. Em particular, as preferências dos consumidores da amostra podem ser usadas para estimar o percentual de todos os consumidores que preferem cada marca. Ao se fazer inferências, surgem questões em torno do quanto essas podem ser válidas ou “boas” para o que se pretende analisar e/ou interpretar, isto é, precisa-se determinar a sua confiabilidade. 13 PEnSAMEnTOS ESTATíSTIcOS • AulA 1 A única forma de se ter certeza de que uma inferência sobre uma população está correta é incluir a população inteira na amostra a ser estudada. Mas, devido aos recursos limitados (isto é, tempo insuficiente e/ou dinheiro), normalmente não se trabalha com populações inteiras, logo as inferências passam a ser baseadas apenas numa parte da população (amostra). Como consequência, sempre que possível, é importante determinar e relatar a confiabilidade de cada inferência. Portanto, o grau de confiabilidade de uma inferência é o responsável em separar a ciência estatística da arte de “adivinhar a sorte”. Exemplo 1.5 – Idade média dos telespectadores do programa ABC World News Tonight. De acordo com The Satte of the News Media, 2006, a idade média dos telespectadores do programa ABC World News Tonight é de 59 anos. Suponha que uma executiva de uma rede rival presuma que a média de idade dos telespectadores do ABC News é menor que 59 anos. Para testar a sua hipótese, ela coleta uma amostra de 500 telespectadores do noticiário noturno ABC e determina a idade de cada um. Neste exemplo, temos que a população é todo o conjunto de telespectadores do noticiário noturno da ABC, a idade (em anos) de cada telespectador é a variável de interesse, a amostra são os 500 telespectadores do ABC News selecionados pela executiva e a inferência é estimar se a idade média dos telespectadores é menor do que 59 anos. Se a executiva estivesse interessada no erro de estimativa (isto é, a diferença entre a idade média para a população de telespectadores de TV e a idade média de uma amostra de telespectadores de TV), usando métodos estatísticos, poder-se-ia determinar um limite do erro da estimativa. Este limite é simplesmente um número que nosso erro de estimativa não pode exceder. Nas próximas aulas, veremos que essa fronteira é uma medida de incerteza da nossa inferência. A confiabilidade das inferências estatísticas será discutida ao longo das aulas apresentadas nesse caderno de estudos. Definição 1.10 Uma medida de confiabilidade é uma afirmação (geralmente quantificada) sobre o grau de incerteza associado a uma inferência estatística. TIPOS DE DADOS Todos os dados (e, por conseguinte, as variáveis que medimos) podem ser classificados como um dos dois tipos gerais: quantitativo e qualitativo. Exemplo 1.6 – Dados quantitativos. A temperatura (em graus Celsius) em que cada unidade em uma amostra de 25 peças plásticas resistentes ao calor começam a derreter, a atual taxa de desemprego de cada um dos estados brasileiros da região sudeste, o salário dos administradores empregados em multinacionais, Atenção Geralmente, atribuem-se valores numéricos arbitrários aos dados qualitativos para facilitar a entrada dos dados no computador e a análise. Esses valores numéricos atribuídos são apenas códigos: eles não podem ser somados, subtraídos, multiplicados ou divididos. Por exemplo, podemos atribuir os seguintes códigos: democrata = 1; republicano = 2 e independente = 3. 14 AulA 1 • PEnSAMEnTOS ESTATíSTIcOS o número de mulheres executivas empregadas em cada uma das amostras de 75 empresas de manufatura. Definição 1.11 Dados quantitativos são medidas registradas em uma escala numérica de ocorrência natural. Quanto aos dados qualitativos, temos que estes não podem ser medidos em escalas numéricas naturais, ou seja, eles podem apenas ser classificados em categorias. Exemplo 1.7 – Dados qualitativos. A afiliação de um partido político (democrata, republicano ou independente), a condição de defeito (defeito ou não) de cada uma das 100 peças de um microcomputador, a nacionalidade de 100 turistas em visita a cidade do Rio de Janeiro. Definição 1.12 Dados qualitativos são mensurações que não podem ser medidas em uma escala numérica natural, eles só podem ser classificados em grupo de categorias. COLETA DE DADOS Após ter decidido o tipo de dados (quantitativos ou qualitativo) apropriados para o problema em questão a ser estudado, é preciso coletá-los. Essa coleta de dados pode ser feita de quatro formas: » Dados de fonte publicada. » Dados de estudo controlado. » Dados de pesquisa. » Dados coletados por meio de observação. Em muitos estudos, o conjunto de dados de interesse já foi coletado e está disponível numa fonte publicada, tais como um livro, jornal, periódico ou site da internet. Por exemplo, você pode querer examinar e sintetizar as taxas de pessoas que possuem o 3º grau completo na região sudeste. Atenção Se o nosso interesse está voltado para certa variável de um determinado grupo de elementos, esta pode ser classificada em: » Qualitativa, isto é, quando resulta de uma classificação por tipos ou atributos. Sendo assim, pode ser: › Nominal - como, por exemplo, sexo ou cor dos olhos; › Ordinal - como, por exemplo, classe social ou grau de instrução. » Quantitativa, isto é, quando os seus valores indicam quantidades. Dessa forma, a variável pode ser: › Discreta - quando seus possíveis valores formam um conjunto enumerável, finito ou infinito como, por exemplo, número de peças defeituosas, número de filhos ou números de carros; › Contínua - quando assume qualquer valor dentro de um intervalo de variação como, por exemplo, peso, altura, tempo ou renda. 15 PEnSAMEnTOS ESTATíSTIcOS • AulA 1 Esse conjunto de dados (assim como outros inúmeros dados relacionados à educação) pode ser encontrado no site do INEP que, por meio de pesquisas, publica anualmente esses resultados. Um segundo método de coleta de dados envolve a condução de um estudo controlado, no qual o pesquisador exerce um estrito controle sobre as unidades sob estudo (pessoas, objetosou eventos). Por exemplo, um recente estudo médico investigou o poder preventivo da aspirina em ataques do coração. Médicos voluntários foram divididos em dois grupos – o grupo experimental e o grupo de controle. No grupo experimental, cada médico tomou uma drágea de aspirina por dia, durante um ano; enquanto que, no grupo de controle, os médicos, tomaram um placebo imitando uma drágea de aspirina. Os pesquisadores, não os médicos sob estudo, controlavam quem recebia a drágea de aspirina (tratamento) e quem recebia o placebo. A partir daí, são extraídas informações dos dados do que seria possível nesse estudo não controlado. As pesquisas são a terceira fonte de dados. Com uma pesquisa, o pesquisador tira uma amostra de um grupo de pessoas e submete-as a uma entrevista, sendo feitas uma ou mais perguntas, registrando as respostas dadas. As pesquisas eleitorais, realizadas por institutos de pesquisas (como, por exemplo, o DATAFOLHA, o IBOBE e o GALLUP) são provavelmente as mais conhecidas. Os estudos observacionais também podem ser empregados na coleta de dados. Em um estudo observacional, o pesquisador observa unidades experimentais em seu ambiente natural e registra a(s) variável(is) de interesse. Por exemplo, um psicólogo corporativo pode observar e registrar o comportamento “Tipo A” de uma amostra de trabalhadores da linha de montagem de uma fábrica. Seja qual for o método adotado para a coleta de dados, provavelmente, os dados consistirão em uma amostra da população e, ao aplicá-los na estatística inferencial, torna-se imprescindível que essa amostra seja representativa. Definição 1.13 Uma amostra representativa exibe as características de uma população de interesse. Por exemplo, considere a apuração de votos conduzida durante uma eleição presidencial. Suponha que se deseja estimar um percentual de todos os eleitores no Brasil em função de um determinado candidato. O instituto de pesquisa poderia cometer o erro de basear a sua estimativa sobre a coleta de dados de uma amostra de eleitores que pertencem ao “curral” eleitoral de um dos candidatos. Tais números certamente produziriam estimativas muito enviesadas. Dessa forma, para satisfazer as exigências de uma amostra representativa deve-se selecionar uma amostra aleatória. Uma amostra aleatória assegura que cada subconjunto de dados de tamanho predeterminado numa população tenha a mesma chance de ser incluído na amostra. 16 AulA 1 • PEnSAMEnTOS ESTATíSTIcOS Definição 1.14 Uma amostra aleatória de n unidades experimentais será uma amostra selecionada da população, de forma que cada amostra de tamanho n tenha a mesma probabilidade de seleção. EXERCÍCIO RESOLVIDO Como se sentem os consumidores em relação às compras feitas pela internet? Para descobrir, uma empresa de software encomendou um estudo nacional a respeito da experiência do consumidor que envolveu 1980 brasileiros na idade adulta que tivessem feito uma transação on-line durante o último ano em websites de bancos, compras, viagens ou seguros. A conclusão foi publicada numa revista de negócios e revelou que 1600 entrevistados, ou 81%, aproximadamente, tiveram problemas técnicos com a transação on-line. Mais de um terço dos consumidores também procurou os sites concorrentes quando uma pequena falha na transação on-line ocorreu. ( A ) Identifique o método de coleta de dados. ( B ) Identifique a população-alvo. ( C ) As amostras de dados da população são representativas? SOLUÇÃO ( A ) O método de coleta de dados é uma pesquisa: 1980 pessoas que completaram o questionário. ( B ) A população-alvo é composta por todos os consumidores que fizeram transações on-line. ( C ) Como os 1980 entrevistados claramente formam um subconjunto da população-alvo, eles compõem uma amostra. Se a amostra é ou não representativa, não se sabe, uma vez que a revista de negócios não apresentou informações detalhadas sobre como os 1980 entrevistados foram selecionados. O papel da estatística no gerenciamento da tomada de decisões O crescimento na coleta de dados, associado ao fenômeno científico, às operações de negócios e às atividades governamentais (controle de qualidade, auditoria estatística, previsões), tem sido marcante nas últimas décadas. A cada dia, a mídia apresenta resultados e pesquisas políticas, econômicas e sociais. Na ênfase cada vez maior do governo a respeito das drogas e dos testes de produtos, por exemplo, testemunha-se a clara evidência da necessidade de ser capaz de avaliar os dados inteligentemente. Como consequência, cada um de nós tem desenvolvido um 17 PEnSAMEnTOS ESTATíSTIcOS • AulA 1 discernimento – uma habilidade de raciocínio para interpretar e entender o significado dos dados. Essa habilidade pode ajudar a fazer escolhas inteligentes, inferências e generalizações, isto é, ajudar a pensar criticamente, usando a estatística. O pensamento estatístico envolve a aplicação do pensamento racional e da ciência da estatística para avaliar criticamente dados e inferências. É fundamental para o processo que exista variação na população e no processamento de dados. Definição 1.15 O pensamento estatístico envolve a aplicação do pensamento racional e da ciência da estatística para avaliar criticamente dados e inferências. É fundamental para o processo que exista variação na população e no processamento de dados. Gestores de sucesso confiam muito no uso do pensamento estatístico para ajudá-los a tomar decisões. O fluxograma a seguir, da figura 2, mostra o papel da estatística na tomada de decisão. Figura 2 – O papel da estatística na tomada de decisão gerencial. 18 AulA 1 • PEnSAMEnTOS ESTATíSTIcOS Cada problema de tomada de decisão inicia-se no mundo real. Esse problema é, então, formulado em termos gerenciais e estruturado como uma questão gerencial. Os próximos passos (seguindo o fluxograma no sentido anti-horário) identificam os papéis que a estatística pode representar nesse processo. Os problemas gerenciais são traduzidos para problemas estatísticos, os dados da amostra são coletados e analisados, e a questão estatística é respondida. O próximo passo é usar a resposta para resolver o problema gerencial. A resposta para o problema gerencial pode sugerir uma reformulação do problema original, uma nova questão ou levar à solução do problema gerencial. Recurso tecnológico O excel como ferramenta auxiliar Ao iniciar o Excel, você encontrará uma tela semelhante à da figura 3. Boa parte dessa tela compreende uma planilha – chamada pasta de trabalho do Excel – com colunas (denominadas A, B, C etc) representando variáveis e linha representando observações (ou casos). Na parte superior da tela do Excel está a barra de menu principal, com botões para diferentes funções e procedimentos disponíveis no Excel. Figura 3 – Tela inicial do Excel. 19 PEnSAMEnTOS ESTATíSTIcOS • AulA 1 como entrar com dados? Primeiro, deve-se criar uma pasta de trabalho no Excel entrando com dados diretamente em linhas e colunas da planilha. A figura 4 apresenta dados registrados na 1a coluna (A). Opcionalmente, podem-se adicionar nomes para as variáveis (colunas) na primeira linha da pasta de trabalho. Figura 4 – Entrada de dados. como acessar dados de um arquivo? Se os dados estão salvos em um arquivo externo, você pode acessá-los usando as opções disponíveis no Excel. Clique em “Personalizar barras de ferramentas de acesso rápido” como indica a figura 5. Figura 5 - Personalizar barras de ferramentas de acesso rápido. 20 AulA 1 • PEnSAMEnTOS ESTATíSTIcOS Em seguida, aparecerá uma caixa de diálogo semelhante à apresentada na figura 6, selecione a opção “Abrir”. Figura 6 – Selecionando a opção abrir. A tela contendo a planilha do Excel terá incluído na sua barra de ferramentas o ícone marcado na figura 7. Figura 7 – ícone abrir. Apósclicar no ícone grifado na figura 7, aparecerá uma caixa de diálogo semelhante à da Figura 8; em seguida, selecione o arquivo do Excel que deseja acessar e clique em “Abrir”. 21 PEnSAMEnTOS ESTATíSTIcOS • AulA 1 Figura 8 – Abrindo arquivo. como imprimir planilha de dados no Excel? Para imprimir dados da planilha do Excel, clique no ícone assinalado na figura 9. Figura 9 – Impressão de uma planilha no Excel. 22 AulA 1 • PEnSAMEnTOS ESTATíSTIcOS RESUMO Vimos até agora: » O conceito de estatística. » Os tipos de aplicações da estatística: descritiva e inferencial. » Os quatro elementos dos problemas estatísticos descritivos: identificar a população ou amostra, identificar a(s) variável(is), coletar dados e descrever os dados. » Os cinco elementos dos problemas estatísticos inferenciais: identificar a população, identificar a(s) variável(is), coletar dados da amostra, inferir (deduzir) sobre a população baseando-se na amostra e medir a confiabilidade para fazer a inferência. » A caracterização dos tipos de dados: quantitativos (de natureza numérica) e qualitativos (de natureza categórica). » Os métodos de coleta de dados: observacional, fontes publicadas, pesquisa e plano experimental. » O papel da estatística no gerenciamento da tomada de decisões. 23 Apresentação Esta aula apresenta como pode ser realizada a descrição de dados qualitativos e quantitativos de uma pesquisa estatística. A ênfase é dada aos métodos gráficos e a construção de tabelas. Objetivos: Esperamos que, após o estudo do conteúdo desta aula, você seja capaz de: » Descrever dados qualitativos de uma pesquisa estatística. » Estabelecer métodos gráficos para descrever dados quantitativos. » Interpretar e utilizar dados apresentados graficamente. » Selecionar a maneira mais adequada para representar um conjunto de dados graficamente. 2 AulA ORgAnIzAçãO E DEScRIçãO DE DADOS 24 AulA 2 • ORgAnIzAçãO E DEScRIçãO DE DADOS Preliminares Suponha que se deseja avaliar a habilidade matemática de 400 estudantes de administração do AVM, com base nas notas do curso de Estatística. Sendo assim, a primeira questão a ser estudada é “Como podemos descrever essas 400 medições?”. Vale lembrar que as características do grupo de dados incluem o grau típico ou mais frequente obtido no componente curricular Estatística e incluem, ainda, a variabilidade dessas notas, as maiores e as menores notas, o formato dos dados e, também, se o grupo a ser estudado contém ou não dados com resultados não usuais. Para fazer tal estudo, é necessário estabelecer um método formal a fim de restringir e caracterizar a informação obtida por meio da pesquisa realizada. Vale ressaltar que esses métodos também são essenciais para a inferência estatística. Muitas vezes, numa pesquisa estatística, a população corresponde a um grande grupo de dados. Daí se faz necessário utilizar um método para descrever uma amostra do grupo de dados pela qual sejamos capazes de fazer afirmativas descritivas (inferências) sobre a população da qual a amostra foi extraída. Nesta aula, estudaremos o método gráfico para descrever um conjunto de dados. Descrição de dados qualitativos Iniciaremos nossos estudos a partir do seguinte exemplo: Suponha que um determinado órgão consultor esteja interessado em investigar o perfil dos executivos brasileiros quanto ao seu grau de escolaridade, isto é: “A maior parte dos executivos é formada nos níveis mais altos de escolaridade?”. Para responder a essa pergunta, a tabela a seguir fornece algumas informações a respeito dos 20 executivos mais bem pagos do Brasil. Tabela 2.1 – Os 20 executivos mais bem pagos do Brasil. Executivo Empresa Salário (R$) Idade (Anos) Formação Antonio Silva LSW 7 000 50 Doutorado Ricardo Amaral capital 4 500 38 MBA Felipe cunha MAS 4 450 45 MBA Paulo Magalhães Atenas 4 000 42 Bacharelado Maicon Alves Sigma 4 600 32 MBA Antônio Serqueira Miragem 5 300 45 Mestrado Anderson Figueiredo Alfa 4 500 51 MBA Ronaldo Barbosa Empreendimentos 5 250 52 Mestrado Pedro Firmino Moreti 7 000 49 Doutorado 25 ORgAnIzAçãO E DEScRIçãO DE DADOS • AulA 2 Executivo Empresa Salário (R$) Idade (Anos) Formação cassio Ladeiras KWY 4 600 53 MBA Renato Marchi Sensorial 4 550 42 MBA Ronaldo Teixeira compacto 4 000 39 Bacharelado Renato O. Rocha Trema 5 200 38 Mestrado Bernardo Oliveira W System 5 200 38 Mestrado Paulo S. Dantas Economic 4 600 40 MBA Angelo Rosas Ponto 4 800 35 Bacharelado José carlos Toll Rossi 4 600 42 MBA Fabio coutinho contato 4 500 50 MBA Ricardo Santos grupo RSA 5 200 28 Mestrado Daniel Dutra cardmaster 4 800 32 MBA Nesse estudo, a variável de interesse, mais alto nível de formação escolar, é qualitativa. Dessa forma, o valor de uma variável qualitativa só pode ser classificado em categorias denominadas classes. A tabela indica os possíveis tipos de formação, ou seja, Bacharelado, MBA, Mestrado ou Doutorado. Portanto, esses representam as classes para a variável qualitativa a ser estudada. Esses dados podem ser resumidos numericamente de duas formas: » Calculando a frequência de classe; » Calculando a frequência relativa de classe. Definição 2.1 Chama-se classe a categoria dentro da qual dados qualitativos podem ser classificados. Definição 2.2 Chama-se frequência simples de classe ou frequência absoluta de classe, denotada por , o número de ocorrências no grupo de dados entrando em uma classe particular. Definição 2.3 Chama-se frequência relativa de classe o quociente obtido pela divisão do número total de observações de uma classe pelo total de observações no grupo de dados. Definição 2.4 Chama-se porcentagem de classe o produto da frequência relativa por 100. A partir da tabela 2.1, pode-se obter uma nova tabela denominada tabela de frequências. Isto é, podem-se definir 4 classes que estão relacionadas a formação dos 20 executivos mais bem 26 AulA 2 • ORgAnIzAçãO E DEScRIçãO DE DADOS pagos do Brasil. Observa-se que há 3 executivos que têm apenas o Bacharelado, 10 executivos que possuem curso de MBA, 5 mestres e 2 doutores. Os números 3, 10, 5 e 2 representam as frequências de classes para as 4 classes definidas. Sendo assim, podem-se obter as frequências relativas de cada classe, ou seja: Bacharelados: = 3 0,15 20 MBA: = 10 0,50 20 Mestrado: = 5 0,25 20 Doutorado: = 5 0,25 20 A tabela a seguir ilustra uma tabela de distribuição de frequências da tabela 2.1. Tabela 2.2 – Distribuição de frequências. Classes Frequência absoluta Frequência relativa Porcentagem Bacharelado 3 0,15 15% MBA 10 0,50 50% Mestrado 5 0,25 25% Doutorado 2 0,10 10% Total 20 1,00 100% A tabela 2.2 permite auxiliar a descrição dos dados em questão por meio de uma representação gráfica. Os métodos gráficos mais usados para descrever dados qualitativos são o gráfico de barras e o gráfico de pizza. Abaixo segue cada uma dessas representações. Figura 2.1 – Gráfico de barras (Escolaridade dos 20 executivos mais bem pagos do Brasil). 27 ORgAnIzAçãO E DEScRIçãO DE DADOS • AulA 2 Figura 2.3 – Gráfico de pizza (Escolaridade dos 20 executivos mais bem pagos do Brasil). No gráfico de barras (figura 2.2), a altura de cada retângulo, ou “barra”, sobre cada classe é igual à frequência de classe. O gráfico de pizza (figura 2.3) apresenta as frequências relativas (expressa em porcentagens) dos 4 tipos de escolaridade. Esse gráfico corresponde a um círculo (com circunferência de 360º). O tamanho de cada (ângulo), “fatia” atribuída a cada classe, é proporcional à frequência relativa da classe. Por exemplo, a fatia atribuída à escolaridade MBA é de 50% de 360º, isto é, 180º. Chama-se diagrama de Pareto o gráfico de barras com as categorias (classes) da variávelqualitativa (isto é, as barras) organizado por altura em ordem descendente da esquerda para a direita. A figura 2.4 apresenta o diagrama de Pareto relacionado à tabela 2.2 de distribuição de frequências. Figura 2.4 – Diagrama de Pareto (Escolaridade dos 20 executivos mais bem pagos do Brasil). 28 AulA 2 • ORgAnIzAçãO E DEScRIçãO DE DADOS Descrição de dados quantitativos Considere a distribuição das alturas de 50 alunos de uma turma do curso de administração do IAVM. 1,75 1,68 1,57 1,82 1,76 1,71 1,70 1,74 1,58 1,57 1,67 1,64 1,69 1,56 1,59 1,93 1,50 1,74 1,72 1,88 1,84 1,78 1,67 1,69 1,76 1,67 1,76 1,74 1,81 1,88 1,93 1,68 1,59 1,73 1,82 1,82 1,69 1,67 1,74 1,71 1,58 1,64 1,65 1,68 1,74 1,62 1,69 1,81 1,77 1,76 Pode-se, a partir dos dados brutos acima, construir uma tabela de frequências e, para isso, basta realizar os seguintes passos: Passo 1: definir o número de classes Pode-se, normalmente, definir tal número utilizando-se uma das seguintes regras: » Regra de Sturges: 1 3,3= +i logN » Regra do quadrado: =i N onde é o número de dados. Saiba mais Notação para intervalos de classe Considere os extremos a e b de um intervalo, então: a b: intervalo fechado à esquerda e aberto à direita. Inclui o limite inferior a e exclui o limite superior b; a b: intervalo aberto à esquerda e fechado à direita. Exclui o limite inferior a e inclui o limite superior b; a b: intervalo fechado à esquerda e à direita. Inclui os dois extremos; a – b: intervalo aberto à esquerda e à direita. Exclui os dois limites a e b. Passo 2: calcular a amplitude da amostra (A) A amplitude da amostra é obtida fazendo a diferença entre o seu maior e o seu menor elemento quando feito o rol do conjunto. :: Dados brutos: Chamam-se dados brutos os resultados das variáveis dispostos aleatoriamente, isto é, sem nenhuma ordem de grandeza crescente ou decrescente. :: Rol: Chama-se rol a ordenação dos dados brutos, de um modo crescente ou decrescente. 29 ORgAnIzAçãO E DEScRIçãO DE DADOS • AulA 2 Passo 3: Calcular a amplitude do intervalo de classe (h) A amplitude de um intervalo de classe deve ser sempre maior que o quociente entre a amplitude da amostra e o número de classes de uma distribuição de frequências. Isto é: > Ah i Passo 4: Escolher os limites de classe Os limites de classe devem ser, sempre que possível, números inteiros. Passo 5: Construir a tabela de frequências. Para a distribuição das alturas dos 50 alunos do curso de administração do IAVM, podem-se estabelecer 5 classes de amplitude igual a 0,10. Sendo assim, obtém-se a seguinte tabela de frequências: Tabela 2.3 – Distribuição de frequências das alturas de 50 alunos do IAVM. Alturas (em metros) Frequência absoluta 1,50 |- 1,60 8 1,60 |- 1,70 15 1,70 |- 1,80 17 1,80 |- 1,90 8 1,90 |-| 2,00 2 Total 50 A organização dos dados brutos por classes, junto com as frequências correspondentes, é chamada de Distribuição de Frequências. No caso de dados quantitativos percebe-se que as definições 2.5, 2.6, 2.7 e 2.8, a seguir, são análogas às definições 2.1, 2.2, 2.3 e 2.4 respectivamente. Definição 2.5 Chama-se classe a categoria dentro da qual dados quantitativos podem ser classificados. Definição 2.6 Chama-se frequência simples de classe ou frequência absoluta de classe o número de elementos de dados entrando em uma classe particular. Definição 2.7 Chama-se frequência relativa de classe o quociente obtido pela divisão do número total de observações de uma classe pelo total de observações no grupo de dados. 30 AulA 2 • ORgAnIzAçãO E DEScRIçãO DE DADOS Definição 2.8 Chama-se porcentagem de classe o produto da frequência relativa por 100. A partir da tabela 2.3, aplicando as definições 2.7 e 2.8, podem-se obter os seguintes resultados expostos na tabela 2.4 a seguir. Alturas (em metros) Frequência absoluta Frequência relativa Porcentagem 1,50 |- 1,60 8 0,16 16% 1,60 |- 1,70 15 0,30 30% 1,70 |- 1,80 17 0,34 34% 1,80 |- 1,90 8 0,16 16% 1,90 |-| 2,00 2 0,04 4% Total 50 1,00 100% Tabela 2.4 – Distribuição das frequências absoluta, relativa e das porcentagens das alturas de 50 alunos do IAVM. Definição 2.9 Chama-se intervalo de classe o conjunto de números que constitui o intervalo. Definição 2.10 Chama-se limite de classe os extremos de uma classe. Denota-se por l o limite inferior da classe e por L o limite superior da classe. Definição 2.11 Chama-se ponto médio de uma classe o ponto que divide o intervalo de classe em partes iguais. Daí, denotando o ponto médio de uma classe por PM, tem-se: 2 + = L lPM Observação 2.1 O ponto médio de um intervalo de classe é o seu legítimo representativo. Os pontos médios de uma distribuição de frequência estão em progressão aritmética, isto é, a diferença entre eles é constante. Definição 2.12 Chama-se amplitude de um intervalo de classe a medida do intervalo que define a classe. Denotando por h a amplitude do intervalo de classe, tem-se que: = −h L l 31 ORgAnIzAçãO E DEScRIçãO DE DADOS • AulA 2 Definição 2.13 Chama-se amplitude total da distribuição a diferença entre o limite superior da última classe (limite superior máximo) e o limite inferior da primeira classe (limite inferior mínimo). Os conjuntos de dados quantitativos são definidos como conjuntos de dados em uma escala numérica com significados. Para resumir e detectar padrões desses dados, podem-se usar métodos gráficos para a descrição dos mesmos. Geralmente, é mais comum representar dados em gráficos dispostos em duas dimensões como, por exemplo, gráficos de pontos, gráfico de ramos e folhas e histogramas. Gráfico de pontos e gráfico de ramos e folhas No gráfico de pontos, o valor numérico de cada medição quantitativa do conjunto de dados é representado por um ponto em uma escala horizontal. Quando os valores se repetem, os pontos são posicionados um sobre o outro verticalmente. Outro tipo de representação gráfica é o gráfico de ramos e folhas. Neste gráfico, o valor numérico da variável quantitativa é particionado em um “ramo” e uma “folha”. Os galhos possíveis estão listados em ordem, em uma coluna. A folha para cada medição quantitativa no conjunto de dados está posicionada no ramo da linha correspondente. Folhas para observações no mesmo ramo de valor são listadas em ordem crescente, horizontalmente. Exemplo 2.1 (Adaptado de MC CLVE, 2009 pp. 42 – 43) Suponha que uma analista financeira esteja interessada no montante de recursos gastos por empresas de hardware e software em pesquisa e desenvolvimento (P&D). Ela obtém uma amostra de 20 firmas de tecnologia e calcula o total que cada uma gastou no último ano como uma porcentagem de sua receita total. A tabela 2.5 apresenta os resultados encontrados pela analista financeira. Tabela 2.5 – Porcentagem de receitas gastas em pesquisa e desenvolvimento. Empresa Porcentagem(%) Empresa Porcentagem(%) 1 6,2 11 4,2 2 8,3 12 7,1 3 6,2 13 6,2 4 6,2 14 7,1 5 4,2 15 13,1 6 10,1 16 10,2 7 6,7 17 6,2 8 7,8 18 4,1 9 9,2 19 7,8 10 6,2 20 7,1 32 AulA 2 • ORgAnIzAçãO E DEScRIçãO DE DADOS Vale lembrar que como as medidas numéricas feitas sobre a amostra de 20 unidades (as firmas), essas porcentagens representam dados quantitativos. O objetivo da analista é resumir e descrever esses dados de forma a extrair informações relevantes. No gráfico de pontos (Figura 2.5) para as 20 porcentagens P&D, o eixo horizontal da figura é uma escala para a variável quantitativa, percentual. O valor numérico da cada medida do grupo de dados está localizado na escala horizontal por um ponto. Quando os valores se repetem, os pontos são colocados um sobre o outro, formando uma pilha naquela localização numérica. Figura 2.5 – Gráfico de pontos para as20 porcentagens de P&D. A partir da tabela 2.5, pode-se obter o seguinte gráfico de ramo e folhas da figura 2.6. Figura 2.6 – Gráfico de ramo e folhas para as 20 porcentagens de P&D. Gráfico de Ramo e folhas para 20 porcentagens de P&D 4 1 2 6 2 2 2 2 2 2 7 7 1 1 1 8 8 8 3 9 2 10 1 2 Histogramas Os histogramas podem ser usados para mostrar tanto a frequência absoluta quanto a frequência relativa das medidas em cada intervalo de classes. No histograma, os valores numéricos da variável quantitativa estão divididos em intervalos de classe de mesma largura. Esses intervalos formam a escala do eixo horizontal. A frequência absoluta ou relativa das observações em cada intervalo de classe é determinada por uma barra vertical posicionada sobre cada intervalo de classe, cuja altura corresponde à frequência absoluta ou relativa do intervalo de classe em questão. 33 ORgAnIzAçãO E DEScRIçãO DE DADOS • AulA 2 Ao interpretar um histograma, devem-se considerar dois importantes fatores. O primeiro é a porção da área total abaixo do histograma que fica sobre um intervalo particular do eixo horizontal que é igual à frequência relativa de medidas no intervalo. O segundo é que se pode imaginar a aparência do histograma da frequência relativa para um conjunto de dados muito grande (uma população). Exemplo 2.2 Considere a variável X = idade, em anos, de um grupo de empregados com 30 anos ou mais, do setor de vendas de uma empresa. Tabela 2.6 - Idade, em anos, de um grupo de empregados do setor de vendas de uma empresa. 35 42 33 59 63 31 55 42 77 54 66 44 41 33 39 48 41 31 65 70 36 40 40 52 62 39 37 74 50 58 62 31 34 42 33 35 Note que, nesse grupo de 36 pessoas, a pessoa mais jovem tem 31 anos, enquanto a mais velha possui 77 anos, ou seja, a amplitude dos dados é 77 – 31 = 46 anos. Usando a regra do quadrado, segue que o número de classes = =36 6i . O número de classes i deve ser maior que 6, sendo assim, a cada classe deve ser dada a amplitude 46 : 6 ≅ 8 anos. A tabela 2.7 a seguir apresenta a distribuição de frequências da variável X. Tabela 2.7 – Distribuição das idades, em anos, de um grupo de empregados do setor de vendas de uma empresa. Idade (em anos) Frequência absoluta Frequência relativa Porcentagem 30 |- 38 7 0,22 22% 38 |- 46 9 0,28 28% 46 |- 54 3 0,09 9% 54 |- 62 5 0,16 16% 62 |- 70 5 0,16 16% 70 |-| 78 3 0,09 9% Total 32 1,00 100% A partir da tabela 2.7, obtém-se o histograma representativo da distribuição de frequências em questão, como pode ser observado na figura 2.7. 34 AulA 2 • ORgAnIzAçãO E DEScRIçãO DE DADOS Figura 2.7 – Histograma da distribuição das idades, em anos, de um grupo de empregados do setor de vendas de uma empresa. Observação 2.2 Enquanto os histogramas proporcionam uma melhor descrição visual dos grupos de dados (particularmente grupos muito grandes), eles não permitem identificar medidas individuais. Mas cada uma das medidas originais é visível de alguma forma em um gráfico de pontos e claramente visíveis em um gráfico de ramo e folhas. Resumo Vimos até agora: » Como descrever dados qualitativos, isto é, identificar classes de categorias, determinar as frequências absoluta e relativas das classes e representar tais frequências em gráficos de barras, de pizza e de Pareto; » Como descrever dados quantitativos, isto é, identificar classes de categorias, determinar as frequências absoluta e relativas das classes e a representar tais frequências em gráficos de pontos, de ramos e folhas e em histogramas; 35 Apresentação Esta aula apresenta conceitos e métodos para se obter medidas de tendência centrais e medidas de variabilidade, bem como critérios para interpretar o significado dessas medidas. Objetivos Esperamos que, após o estudo do conteúdo desta aula, você seja capaz de: » Calcular e interpretar medidas de tendência central. » Calcular e interpretar medidas numéricas de variabilidade. » Calcular e interpretar medidas numéricas de posicionamento relativo. 3 AulA MEDIDAS DE TEnDêncIA cEnTRAL E MEDIDAS DE vARIABILIDADE 36 AulA 3 • MEDIDAS DE TEnDêncIA cEnTRAL E MEDIDAS DE vARIABILIDADE Medidas numéricas de tendência central Nesta secção, o objetivo é apresentar medidas numéricas descritivas da amostra a fim de fazer inferências sobre medições correspondentes da população. Existem muitos métodos numéricos para descrever conjuntos de dados quantitativos. A maior parte deles mede uma de duas características: A tendência central do conjunto de medições, isto é, a tendência dos dados observados se agruparem em torno de valores centrais. A variabilidade do conjunto de medições, isto é, a dispersão dos dados. Média aritmética DEFInIçãO 2.14 A média aritmética de um conjunto de dados quantitativos é a soma das medições dividida pelo número de medições contadas no conjunto de dados. Notação: x . Isto é: 1== ∑ n ii x x n Exemplo 2.3 A venda diária de certo produto alimentício, durante uma semana, foi de 12, 14, 15, 13, 18 e 12 quilos. Portanto, a venda média diária na semana é dada por: 12 14 15 13 18 12 14quilos 6 + + + + + = =x Definição 2.15 Chama-se desvio em relação à média, denotado por di , a diferença entre cada elemento de um conjunto de valores e a média aritmética, isto é: = −i id x x onde xi é o i-ésimo valor elemento do conjunto. 37 MEDIDAS DE TEnDêncIA cEnTRAL E MEDIDAS DE vARIABILIDADE • AulA 3 como calcular a média de dados agrupados CASO 1: Sem intervalos de classe (por pontos) Basta usar a seguinte caracterização: = ∑ i ix fx n Exemplo 2.4 Considere a distribuição relativa de 30 famílias de 4 filhos, tomando por variável o número de filhos do sexo masculino, apresentada na tabela 2.8 abaixo. Tabela 2.8 - Distribuição relativa de 30 famílias de 4 filhos. Número de pessoas Frequência (fi) 0 2 1 6 2 8 3 10 4 4 Total n = 30 Portanto, segue que: 0 2 1 6 2 8 3 12 4 4 74 2,46 meninospor família 30 30 ⋅ + ⋅ + ⋅ + ⋅ + ⋅ = = ≅x CASO 2: Com intervalos de classe (por classe) Basta considerar todos os valores incluídos num intervalo de classe coincidir com o seu ponto médio e, assim, determinar a média ponderada por meio da fórmula: = ∑ i iPM fx n Exemplo 2.5 A partir da tabela 2.7 (página 50), de distribuição das idades, em anos, de um grupo de empregados do setor de vendas de uma empresa obtém-se como idade média: ⋅ + ⋅ + ⋅ + ⋅ + ⋅ + ⋅ = = = 34 7 42 9 50 3 58 5 66 5 74 3 1608 50,25 32 32 x Além da média aritmética temos também outros tipos de média como a média geométrica e a média harmônica. Para maiores detalhes ver GONZÁLEZ, N. 2008. 38 AulA 3 • MEDIDAS DE TEnDêncIA cEnTRAL E MEDIDAS DE vARIABILIDADE Mediana Definição 2.19 Chama-se mediana de um conjunto de dados quantitativos o número do “meio” quando as medidas são organizadas em ordem ascendente (ou decrescente). Notação: . No cálculo da mediana, primeiramente devem-se organizar as n medições dadas da menor para a maior. Se n é ímpar, então, a mediana é o número do meio. Se n é par, então, a mediana é a média aritmética entre dois números. Exemplo 2.9 Considere os seguintes dados: 13, 15, 6, 7, 17, 23, 25, 8, 10. Para obter a mediana, primeiramente, se organiza os dados em um rol: 6, 7, 8, 10, 13, 15, 17, 23, 25 Como o número de dados é ímpar, segue que a mediana é o valor central obtido a partir do rol acima, isto é: me = 13. Exemplo 2.10 Considere os seguintes dados: 1, 3, 0, 0, 2, 4, 1, 3, 5, 6. Organizando esses dados num rol, obtém-se: 0, 0, 1, 1, 2, 3, 3, 4, 5, 6 Sendo par o número de dados, segue que a mediana é a média aritmética dos dois valores centrais, isto é: 2 3 2,5 2 + = =em como calcular a mediana de dados agrupados CASO 1: sem intervalosde classe (por ponto) Neste CASO, obtém-se a frequência acumulada imediatamente superior à metade da soma das frequências. A mediana será o valor que corresponde a tal frequência acumulada. Saiba mais A frequência absoluta acumulada (fac) indica o número inferior ao limite superior da classe. Sendo assim a soma da frequência absoluta de uma classe com as frequências absolutas de todas as classes anteriores. Saiba mais A frequênci a relativa acumulada (Fac) indica a porcentagem inferior ao limite superior da classe. Isto é, a soma da frequência relativa de uma classe com as frequências relativas de todas as classes anteriores. 39 MEDIDAS DE TEnDêncIA cEnTRAL E MEDIDAS DE vARIABILIDADE • AulA 3 » Se o somatório das frequências for um número ímpar então o valor mediano será o termo de ordem dado pelo quociente: 1 2 +∑ if » Se o somatório das frequências for par, o valor mediano será o termo de ordem dado pelo quociente: ( ) ( )/2 /2 1 2 + +∑ ∑i if f CASO 2: com intervalos de classe Neste caso, basta seguir os seguintes passos: Passo 1: determinar a frequência simples acumulada crescente; Passo 2: Calcular 2 ∑ if Passo 3: Marcar a classe correspondente à frequência simples acumulada crescente, imediatamente, superior a 2 ∑ if . Tal classe será a classe mediana. Passo 4: Calcular a mediana usando a fórmula: 2 −= + ant e cme cme icme n f m l h f em que: lcme = limite inferior da classe mediana fant = frequência simples acumulada crescente da classe anterior à classe mediana ficine = frequência simples da classe mediana hcme = amplitude do intervalo da classe mediana Exemplo 2.11 Considere a distribuição das idades, em anos, de um grupo de pessoas de uma clínica de repouso apresentada na tabela 8 abaixo. Tabela 2.11 - Distribuição das idades, em anos, de um grupo de pessoas de uma clínica de repouso. Classes Frequência (fi) Frequência acumulada 50 54 4 4 54 58 9 13 40 AulA 3 • MEDIDAS DE TEnDêncIA cEnTRAL E MEDIDAS DE vARIABILIDADE Classes Frequência (fi) Frequência acumulada 58 62 11 24 62 66 8 32 68 70 5 37 70 74 6 40 Total 43 Segue que: 43 21,5 2 2 = =∑ if Logo, a classe mediana será a 3ª classe da distribuição. Portanto: − = + ⋅ = 43 9258 4 62,54 11e m Moda Definição 2.20 Chama-se moda a medição que ocorre com mais frequência no conjunto de dados. Notação: m0 Em dados não agrupados, a moda é facilmente reconhecida: basta, de acordo com a definição, procurar o valor que mais se repete de preferência após ter organizado os dados em um rol. como obter a moda de dados agrupados CASO 1: sem intervalos de classe Neste caso, basta identificar o valor da variável com maior frequência. CASO 2: com intervalos de classe A classe que apresenta a maior frequência é denominada classe modal. A moda, neste caso, é o valor dominante que está compreendido entre os limites da classe modal. O método mais simples para o cálculo da moda consiste em tomar o ponto médio da classe modal, isto é: 2 + =o l Lm 41 MEDIDAS DE TEnDêncIA cEnTRAL E MEDIDAS DE vARIABILIDADE • AulA 3 Onde é o limite inferior da classe modal e o limite superior da classe modal. Exemplo 2.12 A tabela 2.12, a seguir, indica as temperaturas de certa cidade da América do Norte durante um mês de inverno. Tabela 2.12 – Temperaturas de uma cidade da América do norte. Temperaturas Frequências 0ºc 4 1ºc 9 2ºc 14 3ºc 5 4ºc 4 Segue que 2ºC é a temperatura modal, pois é a de maior frequência. Exemplo 2.13 Considere a tabela 2.7 de frequências apresentada no exemplo 2.2. A 2ª classe é a classe modal, pois é a de maior frequência. Portanto, a idade modal é dada por: 38 46 48 2 + = =om Medidas separatrizes São medidas ligadas à mediana, isto é, ligadas a sua característica de separar uma série em duas partes, que apresentam o mesmo número de valores. Essas medidas são os quartis, os decis, os centis (percentis) que juntamente com a mediana são conhecidas como medidas separatrizes. Os Quartis, por exemplo, são valores que dividem a distribuição em quatro partes, ou seja, a partir da ordenação dos dados, define-se: 1o Quartil: o valor que deixa 25% dos dados abaixo dele e 75% dos dados acima dele. 2o Quartil: o valor que deixa 50% dos dados abaixo dele e 50% dos dados acima dele, ou seja, é a mediana. 3o Quartil: o valor que deixa 75% dos dados abaixo dele e 25% dos dados acima dele. Exemplo 2.14 Considere os seguintes dados: 5, 3, 7, 8, 11, 14, 16. 42 AulA 3 • MEDIDAS DE TEnDêncIA cEnTRAL E MEDIDAS DE vARIABILIDADE Organizando os dados num rol, obtém-se: 3, 5, 7, 8, 11, 14, 16 Daí, temos que: Q2 = me = 8 A mediana divide a série acima em duas partes com a mesma quantidade de dados: 3, 5, 7 e 11, 14, 16. Para o cálculo do 1º e do 3º quartil, basta determinar, respectivamente, as medianas de cada um dos grupos determinados, isto é: Q1 = 5 e Q3 = 14. Para maiores detalhes de como obter quartis, decis, percentis de dados agrupados em classes ver WALPOLE, R. E. et al 2008. Medidas numéricas de variabilidade As medidas numéricas de variabilidade ou medidas de dispersão quantificam a variabilidade dos dados. Conhecer a variabilidade dos dados, juntamente com seu centro, pode ser útil para visualizar o formato do conjunto de dados em questão, assim como os seus valores externos. Como exemplo de medidas de dispersão, tem-se a amplitude, a variância e o desvio padrão. Amplitude Definição 2.21 Chama-se amplitude de um conjunto de dados quantitativos a diferença entre a maior e a menor medição. Vale lembrar que a amplitude é de fácil cálculo e compreensão, mas é uma medida não muito apropriada de variação de dados quando os conjuntos de dados são muito grandes. Isto porque dois conjuntos de dados podem ter a mesma amplitude, mas serem diferentes no que diz respeito à variação dos dados. variância Definição 2.22 A variância, indicada por s2, representa a variabilidade em torno da média da variável, ou seja, consideram-se as diferenças −ix x e calcula-se a média dos quadrados dessas diferenças: ( )22 1= −= ∑ n ii x x s n 43 MEDIDAS DE TEnDêncIA cEnTRAL E MEDIDAS DE vARIABILIDADE • AulA 3 Se os dados representam uma amostra (e não toda a população), a expressão acima deve ser usada colocando-se (n – 1) no denominador, ou seja: ( )22 1 1 = − = − ∑ n ii x x s n Desvio padrão Definição 2.23 Chama-se desvio padrão e indica-se por s, a raiz quadrada da variância. Observação 2.3 Quando os dados estão em tabelas de classes de frequências, os valores das medidas de dispersão podem ser obtidos por meio de um valor aproximado, se considerarmos que cada classe de frequência pode ser representada pelo seu ponto médio. Neste caso, a variância e o desvio padrão são obtidos, respectivamente, pelas seguintes fórmulas: ( )22 2 1 − = − ∑∑ i ii i x f x f ns n e ( )22 1 − = − ∑∑ i ii i x f x f ns n Observação 2.4 Uma pequena dispersão absoluta dos dados pode ser considerável quando comparada à ordem de grandeza dos valores da variável. Para perceber o tamanho da dispersão dos dados, define-se o coeficiente de variação (CV): = sCV x Observação 2.5 Chama-se medida de assimetria a medida usada para quantificar a assimetria da distribuição de um conjunto de dados. Pearson definiu um coeficiente, denotado por A, dado por: − = o x mA s » Se 0,15<A , considera-se a distribuição simétrica; » Se 0,15 1≤ ≤A , considera-se a distribuição moderadamente simétrica; » Se 0,15 1≤ ≤A , considera-se a distribuição fortemente simétrica. 44 AulA 3 • MEDIDAS DE TEnDêncIA cEnTRAL E MEDIDAS DE vARIABILIDADE EXERCÍCIO RESOLVIDO SejaX = número de defeitos por peça produzida em um lote de 16 peças, representadas pelos valores abaixo: 1 1 3 1 2 2 2 2 0 0 0 0 0 1 0 2 ( A ) Construa a tabela de frequências. ( B ) Construa um histograma representativo da distribuição de frequências. ( C ) Calcule a média, a mediana e a moda da distribuição. ( D ) Encontre a variância e o desvio padrão da distribuição. ( E ) Determine o coeficiente de variação e a medida de assimetria. SOLUÇÃO A) Número de defeitos por peça (xi) Frequência absoluta (fi) Frequência absoluta acumulada (fac) Frequência relativa (Fi) Frequência relativa acumulada (Fac) Porcentagem (%) 0 6 6 0,3750 0,3750 37,50 1 4 10 0,2500 0,6250 25,00 2 5 15 0,3125 0,9375 31,25 3 1 16 0,0625 1,0000 6,25 Total 16 1,0000 100 B) 45 MEDIDAS DE TEnDêncIA cEnTRAL E MEDIDAS DE vARIABILIDADE • AulA 3 C) 0 6 1 4 2 5 3 1 17 1,0625 16 16 × + × + × + × = == = =∑ i ix fx n Como n = 16, a mediana é o valor que ocorre entre a 8ª e a 9ª posições. Portanto, me = 1. A moda é o valor de maior frequência, isto é, mo = 0. D) ( )2 22 2 1733 16 0,9958 1 15 − − = = ≅ − ∑∑ i ii i x f x f ns n VARIÂNCIA 0,9958 0,9978= ≅s DESVIO PADRÃO E) 0,9978 0,9391 93,91 1,0625 = ≅ =CV % 1,0625 0 1,0648 0,9978 − = ≅A DISTRIBUIÇÃO FORTEMENTE SIMÉTRICA Distorção da realidade Muitas vezes, a Estatística descritiva pode servir como instrumento de distorção, mesmo que não intencionalmente ou como resultado de práticas estatísticas não éticas. Dessa forma, é preciso tomar certos cuidados ao observar e ao interpretar um gráfico ou uma medida descritiva numérica. Distorções gráficas Os gráficos geram impressões a respeito de dados representados. Essas impressões podem ser alteradas, por exemplo, quando se altera a escala de um dos eixos do gráfico. Observe o gráfico da figura 2.8 abaixo: 46 AulA 3 • MEDIDAS DE TEnDêncIA cEnTRAL E MEDIDAS DE vARIABILIDADE Figura 2.8 – Participação moderada da empresa S&A no mercado de vendas. A escala escolhida para o eixo horizontal e eixo vertical indica, visualmente, uma participação moderada no mercado de vendas da empresa S&A. Os mesmos dados podem ser usados e representados de forma a causar uma nova impressão visual sobre a participação da empresa S&A no mercado de vendas. Ou seja, aumentando a distância entre as unidades sucessivas do eixo vertical e diminuindo as distâncias entre os anos indicados, obtém-se a representação contida na figura 2.9 a seguir: Figura 2.9 – Participação crescente da empresa S&A no mercado de vendas. A distorção visual também pode ser percebida quando se faz a largura das barras proporcional à altura. Algumas vezes, não se faz necessário manipular os gráficos para distorcer a impressão que ele cria. Modificar a descrição verbal que acompanha o gráfico pode mudar a impressão que será feita pelo leitor. Observe a figura 2.10. 47 MEDIDAS DE TEnDêncIA cEnTRAL E MEDIDAS DE vARIABILIDADE • AulA 3 Figura 2.10 – Mudando a descrição verbal para mudar a interpretação do leitor. Para a produção, não precisamos nem mudar o gráfico, simplesmente muda-se o título para indicar uma má performace. Para o público em geral, dizemos que ainda estamos nos 1ºs anos. Estatísticas descritivas numéricas enganosas As informações de um conjunto de dados também podem ser distorcidas usando-se medidas descritivas numéricas. Ou seja: Exemplo 2.15 Uma pequena empresa de advocacia possui um membro sênior e três membros juniores. Paulo interessado em trabalhar nesta empresa pergunta: “Que salário se deve esperar, caso eu venha trabalhar para essa empresa?” Ele recebe duas respostas: Resposta A: o membro sênior diz que um “trabalhador médio” ganha R$ 87.500,00 anualmente. Resposta B: um dos membros Junior depois diz que um “trabalhador médio” ganha R$ 75.000,00 anualmente. Em qual resposta Paulo deve acreditar? A confusão existe porque não está claro o significado da expressão “trabalhador médio”. Suponha que os quatro salários pagos sejam: R$ 75.000,00 anuais, para cada um dos três membros Junior e R$ 125.000,00 anual, para o membro sênior. Então: ⋅ + = = 3 75000 125000 87500 4 x me = 75.000 48 AulA 3 • MEDIDAS DE TEnDêncIA cEnTRAL E MEDIDAS DE vARIABILIDADE Dessa forma, percebe-se que o membro sênior reportou-se à média dos quatro salários, enquanto que o membro júnior, à mediana. As duas informações dadas foram distorcidas, pois nenhum dos dois membros definiu qual medida de tendência central estava sendo usada. Vale lembrar que neste caso a mediana é a medida que melhor descreve o salário do “trabalhador médio”. Outro tipo de distorção de uma informação em uma amostra ocorre quando apenas uma medida de tendência central é reportada. Medidas de tendência central e de variabilidade devem ser mencionadas a fim de se obter uma imagem mental precisa de um conjunto de dados. Exemplo 2.16 Ana deseja comprar um carro novo e está em dúvida entre dois modelos. Como combustível e economia são ambos assuntos importantes, Ana escolhe o modelo A, pois a relação km/l é de 13,6 Km/l rodados: para o modelo B, no entanto, a relação é de apenas 12,7 Km/l. Será que Ana fez uma boa escolha? Neste caso, faltou verificar quanta variabilidade está associada às relações. Por exemplo, suponha que numa avaliação mais aprofundada revele que o desvio padrão para o modelo A é de 2,12 Km/l, e para o modelo B é de apenas 0,42 Km/l. Assim, existe uma maior variabilidade associada ao modelo A, o que implica um maior risco na compra desse modelo. Isto é, o modelo A está mais propenso a ter uma relação que difere muito de 13,6 Km/l. Recurso tecnológico Gráficos no excel Para fazer gráficos de dados de uma única variável no Excel, primeiramente digite a tabela de frequências (como ilustração faremos a representação dos dados do exemplo 2.10). Então: 49 MEDIDAS DE TEnDêncIA cEnTRAL E MEDIDAS DE vARIABILIDADE • AulA 3 Em seguida, selecione o menu inserir: Então, teremos a seguinte tela: Selecione na barra de ferramentas o tipo de gráfico que deseja obter, por exemplo, gráfico de colunas: 50 AulA 3 • MEDIDAS DE TEnDêncIA cEnTRAL E MEDIDAS DE vARIABILIDADE Com isso você poderá escolher um dos modelos listados (a título de ilustração será escolhido o modelo marcado abaixo): 51 MEDIDAS DE TEnDêncIA cEnTRAL E MEDIDAS DE vARIABILIDADE • AulA 3 clicar no modelo, o gráfico é gerado. Selecionando a opção layout do gráfico, você pode personalizar o gráfico de acordo com os padrões apresentados, a aparência pode ser alterada ao escolher no menu estilos de gráficos um modelo proposto. RESUMO Vimos até agora: » Como calcular medidas de tendência central como a média, a mediana e a moda. » Como calcular medidas de variabilidade como a amplitude, a variância e o desvio padrão. » Como determinar o coeficiente de variação de uma distribuição, bem como determinar a medida de assimetria das mesmas. 52 Apresentação Esta aula apresenta métodos e conceitos combinatórios, que consistem no estudo de situações em que a contagem se reduz, a saber, a quantas maneiras um determinado grupo de objetos pode ser escolhido, sem e com repetições em relação à ordem em que são selecionados. Tais situações envolvem o desenvolvimento de competências como o planejamento de estratégias na resolução de problemas, a divisão de problemas em casos, a análise envolvendo números pequenos levando à generalização e a crítica dos resultados obtidos. Essas técnicas, muitas vezes, serão aplicadas em outros tipos de situações-problema, cujo objetivo é investigar qual é a chance de um evento ocorrer, isto é, obter um número que indica a frequência relativa de ocorrência de um evento. Obteras chances de um determinado evento ocorrer permite, racionalmente, tomar decisões prevendo eventos futuros. Objetivos: Esperamos que, após o estudo do conteúdo desta aula, você seja capaz de: » Resolver problemas de contagem utilizando listagens, diagrama de árvores e/ou o princípio multiplicativo. » Resolver problemas que envolvam o cálculo do número de elementos da união de conjuntos. » Identificar em situações-problema agrupamentos associados a conjuntos e sequências. » Reconhecer situações em que os agrupamentos são distinguíveis pela ordem de seus elementos ou não e resolver problemas que envolvam arranjos, combinações e/ou permutações simples, com elementos repetidos e circulares. » Reconhecer o caráter aleatório de variáveis em situações-problema e identificar o espaço amostral nessas situações-problema. » Resolver problemas que envolvam o cálculo de probabilidades de eventos equiprováveis. » Utilizar o princípio multiplicativo no cálculo de probabilidades. 4AulAPROBABILIDADE 53 PROBABILIDADE • AulA 4 » Resolver problemas que envolvem o cálculo da probabilidade de eventos. » Identificar eventos independentes e não independentes em situações-problema. » Resolver problemas que envolvam o conceito de probabilidade condicional e binomial. » Utilizar probabilidades para fazer previsões aplicadas em diferentes áreas do conhecimento. combinatória Entende-se por combinatória a parte da Matemática que analisa estruturas e relações discretas. Dessa forma, é muito comum a ocorrência de dois tipos de problemas em Combinatória: » Demonstrar a existência de subconjuntos de elementos de um conjunto finito dado e que satisfazem certas condições. » Contar ou classificar os subconjuntos de um conjunto finito e que satisfazem certas condições dadas. A resolução de problemas combinatórios exige, muitas vezes, engenhosidade e a compreensão plena da situação descrita, embora a Combinatória apresente técnicas gerais que permitem atacar certos tipos de problemas. Nesta secção, serão apresentadas ferramentas básicas que nos permitem determinar o número de elementos de conjuntos formados de acordo com certas regras, sem que seja necessário enumerar seus elementos. Princípio da adição “Se A e B são dois conjuntos disjuntos, com m e n elementos, respectivamente, então AÈB possui m + n elementos.” Princípio Fundamental da contagem (PFc) ou princípio multiplicativo “Se há X modos de tomar uma decisão d1 e, tomada a decisão d1, há y modos de tomar a decisão d2, então o número de modos de tomar sucessivamente as decisões d1 e d2 é x y.” Assim, podemos utilizar esta ideia para enunciar esse mesmo princípio, só que de uma forma mais geral, isto é: “Se um acontecimento Ai pode ocorrer de mi maneiras distintas para i = 1,2,3,...,n), então a sequência (A1, A2, ..., An) de n acontecimentos sucessivos pode ocorrer de m1.m2. ... .mn maneiras distintas.” 54 AulA 4 • PROBABILIDADE EXERCÍCIO RESOLVIDO Com 4 homens e 3 mulheres, de quantos modos se pode formar um casal? SOLUÇÃO Formar um casal equivale a tomar as decisões: d1: escolher um homem d2: escolher uma mulher Assim, #d1 = 4 e #d2 = 3. Portanto pelo PFC, 4x3 = 12 modos de formar um casal. EXERCÍCIO RESOLVIDO Uma bandeira é formada por 7 listras que devem ser coloridas usando apenas as cores branco, preto e vermelho. Se cada listra deve ter apenas uma cor e não se pode usar cores iguais em listras adjacentes, de quantos modos se pode colorir a bandeira? SOLUÇÃO Colorir a bandeira equivale a escolher a cor de cada listra. d1: escolher uma cor para pintar a primeira listra d2: escolher uma cor para pintar a segunda listra, após ter ocorrido d1 d3: escolher uma cor para pintar a terceira listra, após terem ocorrido d1 e d2 . . . d7: escolher uma cor para pintar a sétima listra, após terem ocorrido d1,d2,...,d6 Assim, #d1 = 3, #d2 = 2, #d3 = 2, ..., #d7 = 2. Portanto, pelo PFC, 3 x 2 x 2 x ... x 2 = 192 modos de distintos de pintar a bandeira. EXERCÍCIO RESOLVIDO Quantos são os números de 3 dígitos que podem ser escritos no sistema de base 10? SOLUÇÃO Um número de três dígitos é representado por p1 p2 p3, onde p1, p2 e p3 denotam a posição de cada algarismo que compõe o número. Então: Atenção Denotamos por #d o número de possibilidades para se tomar a decisão d. 55 PROBABILIDADE • AulA 4 d1: escolher um número para a posição p1, diferente de zero d2: escolher um número para a posição p2, após ter ocorrido d1 d3: escolher um número para a posição p2, após terem ocorrido d1 e d2 Assim, #d1 = 9, #d2 = 10 e #d3 = 10. Portanto, pelo PFC, 9 x 10 x 10 = 900 EXERCÍCIO RESOLVIDO Quantos são os números de 3 dígitos distintos que podem ser escritos no sistema de base 10? SOLUÇÃO Um número de três dígitos distintos é representado por p1 p2 p3, onde p1, p2 e p3 denotam a posição de cada algarismo que compõe o número. Então: d1: escolher um número para a posição p1, diferente de zero d2: escolher um número para a posição p2, após ter ocorrido d1 d3: escolher um número para a posição p2, após terem ocorrido d1 e d2 Assim, #d1 = 9, #d2 = 9 e #d3 = 8. Portanto, pelo PFC, 9 x 9 x 8 = 648. Permutações simples Dados objetos distintos , de quantos modos é possível ordená-los? Por exemplo, para os objetos 1, 2, 3, há 6 ordenações: 123, 132, 213, 231, 312 e 321. No caso geral, temos n modos de escolher o objeto que ocupará o primeiro lugar, modos de escolher o que ocupará o segundo lugar, ... , 1 modo de escolher o objeto que ocupará o último lugar. Portanto, o número de modos de ordenar n objetos distintos é: !1)...1( nnn =− Cada ordenação dos objetos é chamada uma permutação simples de objetos e o número de permutações simples de objetos distintos é representado por Pn . Assim, Pn=! (já que 0! = 1, define-se P0 =1). PROBLEMA RESOLVIDO a. Quantos são os anagramas da palavra “CALOR”? Atenção A notação n! representa o fatorial de n. Isto é: 3! (lê-se: três fatorial ou o fatorial de 3) Nesse caso: 3! = 3 • 2 • 1 = 6 4! = 4 • 3 • 2 • 1 = 24 Atenção: por definição 0! = 1 56 AulA 4 • PROBABILIDADE b. Quantos começam por consoante? SOLUÇÃO A) Cada anagrama corresponde a uma ordem de colocação dessas 5 letras. d: Permutar as 5 letras Assim, d = P5 = 5 ! = 120. Logo, existem 120 anagramas da palavra CALOR. B) Agora, temos uma restrição, isto é, queremos contar o número de anagramas da palavra CALOR que começam por consoante. Então: d1: escolher uma consoante para ser a primeira letra d2: permutar as letras restantes Assim, #d1 = 3 e #d2 = P4 = 4! = 24. Portanto, pelo PFC, 3 x 24 = 72 anagramas que começam por consoante. PROBLEMA RESOLVIDO De quantos modos podemos arrumar em fila 5 livros diferentes de Matemática, 3 livros diferentes de Estatística e 2 livros diferentes de Física, de modo que os livros de uma matéria permaneçam juntos? SOLUÇÃO d1: Escolher a ordem das matérias d2: Permutar os livros de matemática, após ter ocorrido d1 d3: Permutar os livros de estatística após terem ocorrido d1 e d2 d4: Permutar os livros de física, após terem ocorrido d1, d2, e d3 Assim, #d1 = P3 = 3! = 6, #d2 = P5 = 5! =120, #d3 = P3 = 3! = 6 e #d4 = P2 = 2! = 2. Logo, pelo PFC, temos 3!5!3!2! = 6 x 120 x 6 x 2 = 8640. Permutações de elementos nem todos distintos Vejamos, primeiramente, o seguinte exemplo: Exemplo 3.3 Quantos são os anagramas da palavra “BOTAFOGO”? 57 PROBABILIDADE • AulA 4 Se as letras fossem diferentes, a resposta seria 8!. Como temos três letras O, isto é, três letras que são iguais, quando as trocamos entre si obtemos o mesmo anagrama e não um anagrama distinto. Isso faz com que, na nossa contagem de 8!, tenhamos contado o mesmo anagrama várias
Compartilhar