Baixe o app para aproveitar ainda mais
Prévia do material em texto
FUNDAMENTOS DE ESTATÍSTICA FUNDAMENTOS DE ESTATÍSTICA Fundam entos de Estatística Marco Alexandre Garcia Sandrini Marco Alexandre Garcia Sandrini GRUPO SER EDUCACIONAL gente criando o futuro Nos primórdios dos tempos, a Estatística teve um papel meramente descritivo e servia apenas para o registro de fatos do dia a dia, como levantamento da população e da pro- dução agrícola na China. Suas primeiras atividades datam de 2000 a.C. Nos tempos atuais, conhecemos como Estatística um conjunto de métodos de pesquisa que envolve o planejamento de um certo experimento que podemos realizar, bem como a coleta dos dados e o processamento e análise das informações desse experimento. A Estatística é a parte da matemática que prima em coletar, analisar e organizar dados, e fazer a relações entre os fatos analisados. Com essas � nalidades em mãos, elaborar todo processo de relacionamento entre os dados para que possamos, no presente ou no futuro, de� nir estratégias para qualquer trabalho referente a nossa pesquisa. Com o avanço da informática, a Estatística é uma ferramenta primordial para o de- senvolvimento da Economia, da Medicina, da Psicologia, da Linguística etc., como você poderá observar no decorrer do curso. Capa_Fundamentos_da_estatística_A5.indd 1,3 24/09/19 15:12 © Ser Educacional 2019 Rua Treze de Maio, nº 254, Santo Amaro Recife-PE – CEP 50100-160 *Todos os gráficos, tabelas e esquemas são creditados à autoria, salvo quando indicada a referência. Informamos que é de inteira responsabilidade da autoria a emissão de conceitos. Nenhuma parte desta publicação poderá ser reproduzida por qualquer meio ou forma sem autorização. A violação dos direitos autorais é crime estabelecido pela Lei n.º 9.610/98 e punido pelo artigo 184 do Código Penal. Imagens de ícones/capa: © Shutterstock Presidente do Conselho de Administração Diretor-presidente Diretoria Executiva de Ensino Diretoria Executiva de Serviços Corporativos Diretoria de Ensino a Distância Autoria Projeto Gráfico e Capa Janguiê Diniz Jânyo Diniz Adriano Azevedo Joaldo Diniz Enzo Moreira Prof. Marco Sandrini DP Content DADOS DO FORNECEDOR Análise de Qualidade, Edição de Texto, Design Instrucional, Edição de Arte, Diagramação, Design Gráfico e Revisão. Fundamentos_da_estatística_Uni_01_A5.indd 2 24/09/19 15:31 Boxes ASSISTA Indicação de filmes, vídeos ou similares que trazem informações comple- mentares ou aprofundadas sobre o conteúdo estudado. CITANDO Dados essenciais e pertinentes sobre a vida de uma determinada pessoa relevante para o estudo do conteúdo abordado. CONTEXTUALIZANDO Dados que retratam onde e quando aconteceu determinado fato; demonstra-se a situação histórica do assunto. CURIOSIDADE Informação que revela algo desconhecido e interessante sobre o assunto tratado. DICA Um detalhe específico da informação, um breve conselho, um alerta, uma informação privilegiada sobre o conteúdo trabalhado. EXEMPLIFICANDO Informação que retrata de forma objetiva determinado assunto. EXPLICANDO Explicação, elucidação sobre uma palavra ou expressão específica da área de conhecimento trabalhada. Fundamentos_da_estatística_Uni_01_A5.indd 3 24/09/19 15:31 Unidade 1 - Introdução à Estatística Objetivos da unidade ........................................................................................................... 12 Aspectos introdutórios ........................................................................................................ 13 Objetivos da Estatística .................................................................................................. 13 População e amostra ........................................................................................................... 14 Amostra aleatória ........................................................................................................... 14 Fases do método de análise estatística .......................................................................... 17 Distribuição de frequências ......................................................................................... 19 Intervalos de classe ....................................................................................................... 22 Histogramas e polígono de frequência ........................................................................... 23 Frequência acumulada e relativa ................................................................................ 25 Representação gráfica .................................................................................................. 28 Sintetizando ........................................................................................................................... 29 Referências bibliográficas ................................................................................................. 30 Sumário Fundamentos_da_estatística_Uni_01_A5.indd 4 24/09/19 15:31 Unidade 2 - Introdução à estatística Objetivos da unidade ........................................................................................................... 32 Estatística descritiva ........................................................................................................... 33 Medidas de posição............................................................................................................. 33 Média aritmética ............................................................................................................. 34 Mediana e moda .............................................................................................................. 37 Medidas de dispersão ......................................................................................................... 38 Amplitude .......................................................................................................................... 38 Desvio médio .................................................................................................................... 39 Desvio padrão ................................................................................................................. 40 Variância e coeficiente de variação ........................................................................... 41 Outras estatísticas descritivas ......................................................................................... 41 Mínimo .............................................................................................................................. 42 Máximo ............................................................................................................................. 42 Quartis .............................................................................................................................. 42 Decis e percentis ............................................................................................................ 43 Teoria Elementar da Probabilidade ................................................................................. 44 Eventos independentes, dependentes e mutuamente exclusivos ......................... 47 Valor esperado ................................................................................................................ 50 Probabilidade condicional ................................................................................................ 51 Distribuição discreta e contínua .................................................................................. 51 Distribuição binomial ..................................................................................................... 52 Sintetizando ........................................................................................................................... 53 Referências bibliográficas ................................................................................................. 54 Sumário Fundamentos_da_estatística_Uni_01_A5.indd5 24/09/19 15:31 Unidade 3 - Análise combinatória: fundamentos Objetivos da unidade ........................................................................................................... 56 Análise combinatória .......................................................................................................... 57 Variáveis aleatórias ......................................................................................................... 63 Testes de hipóteses .............................................................................................................. 64 Teste de diferenças entre médias ................................................................................ 65 Determinação do tamanho da amostra ....................................................................... 69 Teste Qui-quadrado ............................................................................................................. 70 Distribuição T-student ................................................................................................... 73 Distribuição binomial ..................................................................................................... 75 Distribuição F .................................................................................................................. 76 Teste de diferença entre variâncias .............................................................. 78 Sintetizando ........................................................................................................................... 81 Referências bibliográficas ................................................................................................. 82 Sumário Fundamentos_da_estatística_Uni_01_A5.indd 6 24/09/19 15:31 Unidade 4 - Construção de índices Objetivos da unidade ........................................................................................................... 84 Números índices................................................................................................................... 85 Construção de índices simples e compostos ............................................................. 86 Mudança de base de um número índice ..................................................................... 89 Índice de preço ao consumidor ......................................................................................... 89 Deflação ............................................................................................................................ 91 Regressão e correlação ................................................................................................. 93 Teoria da correlação ............................................................................................................ 95 Medidas de correlação ................................................................................................. 96 Mínimos quadrados ....................................................................................................... 98 Erro padrão .................................................................................................................... 101 Variação explicada e não explicada ......................................................................... 102 Equação de regressão ....................................................................................................... 102 Diagrama de dispersão ............................................................................................... 105 Análise de correlação e regressão ........................................................................... 108 Sintetizando ......................................................................................................................... 110 Referências bibliográficas ............................................................................................... 111 Sumário Fundamentos_da_estatística_Uni_01_A5.indd 7 24/09/19 15:31 Fundamentos_da_estatística_Uni_01_A5.indd 8 24/09/19 15:31 Nos primórdios dos tempos, a Estatística teve um papel meramente descri- tivo e servia apenas para o registro de fatos do dia a dia, como levantamento da população e da produção agrícola na China. Suas primeiras atividades datam de 2000 a.C. Nos tempos atuais, conhecemos como Estatística um conjunto de métodos de pesquisa que envolve o planejamento de um certo experimento que pode- mos realizar, bem como a coleta dos dados e o processamento e análise das informações desse experimento. A Estatística é a parte da matemática que prima em coletar, analisar e orga- nizar dados, e fazer a relações entre os fatos analisados. Com essas fi nalidades em mãos, elaborar todo processo de relacionamento entre os dados para que possamos, no presente ou no futuro, defi nir estratégias para qualquer traba- lho referente a nossa pesquisa. Com o avanço da informática, a Estatística é uma ferramenta primordial para o desenvolvimento da Economia, da Medicina, da Psicologia, da Linguísti- ca etc., como você poderá observar no decorrer do curso. FUNDAMENTOS DA ESTATÍSTICA 9 Apresentação Fundamentos_da_estatística_Uni_01_A5.indd 9 24/09/19 15:31 Aos meus pais, que apesar de pouca escolaridade sempre me ensinaram a sonhar. Aos meus mestres, que sempre me ensinaram como conquistar meus sonhos e à minha esposa, que sempre me ajudou a realizar meus sonhos. O Professor Marco Alexandre Garcia Sandrini é especialista em Matemáti- ca. Graduado em 1996 pela Universida- de de São Paulo, especialista em Física graduado pela FAI. Possui ênfase em Estatística pela Faculdade de Matemá- tica da USP. Elaborador de atividades para várias editoras nas áreas de Mate- mática, Estatística e Física. FUNDAMENTOS DA ESTATÍSTICA 10 O autor Fundamentos_da_estatística_Uni_01_A5.indd 10 24/09/19 15:31 INTRODUÇÃO À ESTATÍSTICA 1 UNIDADE Fundamentos_da_estatística_Uni_01_A5.indd 11 24/09/19 15:32 Objetivos da unidade Tópicos de estudo Levar o aluno a coletar dados para pesquisa de forma correta para produção de dados que retratem a realidade do evento; Desenvolver seu senso crítico para a realidade dos eventos; Ser capaz de aplicar medidas qualitativas e quantitativas do evento; Desenvolver seu raciocínio lógico. Aspectos introdutórios Objetivos da Estatística População e amostra Amostra aleatória Fases do método de análise estatística Distribuição de frequência Intervalos de classe Histogramas e polígono de frequência Frequência acumulada e relativa Representação gráfica FUNDAMENTOS DA ESTATÍSTICA 12 Fundamentos_da_estatística_Uni_01_A5.indd 12 24/09/19 15:32 Aspectos introdutórios Nesta parte da Estatística, estudaremos aspectos importantíssimos, principalmente para coleta de dados, fazendo a distinção de dados quali- tativos e quantitativos. Mas, antes de qualquer coisa, precisamos entender quais são os objetivos da Estatística enquanto ciência. Objetivos da Estatística Para determinar ou estimar uma certa quantidade ou estabelecer uma hipótese, utiliza-se métodos estatísticos, que devem ser ao mesmo tempo qualitativos e quantitativos, e devem destacar de forma segura o potencial da pesquisa, usando técnicas confiáveis e seguras. Literalmente, a Teoria Estatística é definida em função de uma amos- tra em que a função por si mesma é única em relação à distribuição que gerou o evento. Esse termo é utilizado usualmente tanto para a função quanto para o valor numérico da função utilizada a uma dada amostra. Na parte de estatística descritiva, preocupa-se em fazer a dissertação de dados obtidos através da pesquisa, formando, assim, uma tabela ou tabulação de todas as informações obtidas durante a fase de coleta. Quando falamos sobre gráficos, que são uma forma de apresentação dos dados e suas respectivas consequências, devemos ressaltar que são a forma mais rápida de apresentar o objeto em estudo.Na estatística, temos três grandes divisões: 1. ESTATÍSTICA DESCRITIVA DIAGRAMA 1. DIVISÕES 2. ESTATÍSTICA INFERENCIAL 3. ESTATÍSTICA DE PROBABILIDADE FUNDAMENTOS DA ESTATÍSTICA 13 Fundamentos_da_estatística_Uni_01_A5.indd 13 24/09/19 15:32 Amostra aleatória Podemos dizer que a amostragem aleatória é um dos principais méto- dos usados nas técnicas estatísticas e de probabilidade. Esse método é um dos mais populares e serve como base para todos outros métodos de cole- ta de dados para uma amostragem real e compatível com o fato estudado. Podemos também definir outro tipo de amostragem, onde to- dos os elementos que fazem parte do conjunto amostral e estão interligados no espaço amostral têm a mesma probabilidade de serem usados para o evento. Dessa forma, o objetivo primaz da estatística é nos fornecer informações e modos diferentes de trabalhar com dados coletados (completos ou incom- pletos), de forma que possamos extrair as informações necessárias para um bom estudo da situação apresentada. População e amostra Neste tópico, estudaremos as características principais de individualiza- ção entre população e amostra e suas técnicas de ensaio, além de entender mais sobre a amostra aleatória, método muito importante para a Estatísti- ca. Para isso, vamos introduzir dois conceitos: POPULAÇÃO É o conjunto de pessoas ou itens quaisquer que compõe o universo a ser estudado. Essas pessoas ou itens precisam ter ao menos uma característica em comum, para que possamos delimitar nossa pesquisa. AMOSTRA São os subconjuntos de uma população, que são adequados para estudar a característica de interesse da população. A seleção dos elementos que irão compor a amostra pode ser feita de várias maneiras e irá depender do conhe- cimento que se tem da população e da quantidade de recursos disponíveis. compor a amostra pode ser feita de várias maneiras e irá depender do conhe- cimento que se tem da população e da quantidade de recursos disponíveis. São os subconjuntos de uma população, que são adequados para estudar a característica de interesse da população. A seleção dos elementos que irão compor a amostra pode ser feita de várias maneiras e irá depender do conhe- cimento que se tem da população e da quantidade de recursos disponíveis. São os subconjuntos de uma população, que são adequados para estudar a característica de interesse da população. A seleção dos elementos que irão compor a amostra pode ser feita de várias maneiras e irá depender do conhe- cimento que se tem da população e da quantidade de recursos disponíveis. São os subconjuntos de uma população, que são adequados para estudar a característica de interesse da população. A seleção dos elementos que irão compor a amostra pode ser feita de várias maneiras e irá depender do conhe- cimento que se tem da população e da quantidade de recursos disponíveis. estudado. Essas pessoas ou itens precisam ter ao menos uma característica São os subconjuntos de uma população, que são adequados para estudar a característica de interesse da população. A seleção dos elementos que irão compor a amostra pode ser feita de várias maneiras e irá depender do conhe- cimento que se tem da população e da quantidade de recursos disponíveis. É o conjunto de pessoas ou itens quaisquer que compõe o universo a ser estudado. Essas pessoas ou itens precisam ter ao menos uma característica São os subconjuntos de uma população, que são adequados para estudar a característica de interesse da população. A seleção dos elementos que irão compor a amostra pode ser feita de várias maneiras e irá depender do conhe- cimento que se tem da população e da quantidade de recursos disponíveis. É o conjunto de pessoas ou itens quaisquer que compõe o universo a ser estudado. Essas pessoas ou itens precisam ter ao menos uma característica São os subconjuntos de uma população, que são adequados para estudar a característica de interesse da população. A seleção dos elementos que irão compor a amostra pode ser feita de várias maneiras e irá depender do conhe- cimento que se tem da população e da quantidade de recursos disponíveis. É o conjunto de pessoas ou itens quaisquer que compõe o universo a ser estudado. Essas pessoas ou itens precisam ter ao menos uma característica em comum, para que possamos delimitar nossa pesquisa. São os subconjuntos de uma população, que são adequados para estudar a característica de interesse da população. A seleção dos elementos que irão compor a amostra pode ser feita de várias maneiras e irá depender do conhe- cimento que se tem da população e da quantidade de recursos disponíveis. É o conjunto de pessoas ou itens quaisquer que compõe o universo a ser estudado. Essas pessoas ou itens precisam ter ao menos uma característica em comum, para que possamos delimitar nossa pesquisa. São os subconjuntos de uma população, que são adequados para estudar a característica de interesse da população. A seleção dos elementos que irão compor a amostra pode ser feita de várias maneiras e irá depender do conhe- cimento que se tem da população e da quantidade de recursos disponíveis. É o conjunto de pessoas ou itens quaisquer que compõe o universo a ser estudado. Essas pessoas ou itens precisam ter ao menos uma característica em comum, para que possamos delimitar nossa pesquisa. São os subconjuntos de uma população, que são adequados para estudar a característica de interesse da população. A seleção dos elementos que irão compor a amostra pode ser feita de várias maneiras e irá depender do conhe- cimento que se tem da população e da quantidade de recursos disponíveis. É o conjunto de pessoas ou itens quaisquer que compõe o universo a ser estudado. Essas pessoas ou itens precisam ter ao menos uma característica em comum, para que possamos delimitar nossa pesquisa. São os subconjuntos de uma população, que são adequados para estudar a característica de interesse da população. A seleção dos elementos que irão compor a amostra pode ser feita de várias maneiras e irá depender do conhe- cimento que se tem da população e da quantidade de recursos disponíveis. É o conjunto de pessoas ou itens quaisquer que compõe o universo a ser estudado. Essas pessoas ou itens precisam ter ao menos uma característica em comum, para que possamos delimitar nossa pesquisa. AMOSTRA São os subconjuntos de uma população, que são adequados para estudar a característica de interesse da população. A seleção dos elementos que irão compor a amostra pode ser feita de várias maneiras e irá depender do conhe- É o conjunto de pessoas ou itens quaisquer que compõe o universo a ser estudado. Essas pessoas ou itens precisam ter ao menos uma característica em comum, para que possamos delimitar nossa pesquisa. AMOSTRA São os subconjuntos de uma população, que são adequados para estudar a É o conjunto de pessoas ou itens quaisquer que compõe o universo a ser estudado. Essas pessoas ou itens precisam ter ao menos uma característica em comum, para que possamos delimitar nossa pesquisa. AMOSTRA É o conjunto de pessoas ou itens quaisquer que compõe o universo a ser estudado. Essas pessoas ou itens precisam ter ao menos uma característica em comum, para que possamos delimitar nossa pesquisa. POPULAÇÃO É o conjunto de pessoas ou itens quaisquer que compõe o universo a ser estudado. Essas pessoas ou itens precisam ter ao menos uma característica em comum, para que possamos delimitar nossa pesquisa. POPULAÇÃO É o conjunto de pessoas ou itens quaisquer que compõe o universo a ser POPULAÇÃO FUNDAMENTOS DA ESTATÍSTICA 14 Fundamentos_da_estatística_Uni_01_A5.indd 14 24/09/19 15:32 Seria como realizar um sorteio entre os funcionários de um escritório: dar a cada funcionário um bilhete com um número de série, colocar os nú- meros em uma roleta e sortear um número ao acaso. Todos funcionários possuem esse bilhete dentro da urna-roleta e formam uma amostra. Na verdade, esses métodos podem ser realizados com o uso de computado-res (Figs. 1 e 2). Figura 1. Diferença entre população e amostra simples. Fonte: Saber Matemática, 2014. Figura 2. Representação visual da seleção de uma amos- tra aleatória simples.Fonte: Netquest, 2015. Devemos levar em consideração que os elementos de uma amostra po- dem ser usados mais de uma vez. Estamos avaliando com repetição ou sem repetição. Ao utilizarmos a forma com repetição, se eu escolho um indivíduo ao acaso em um sorteio, isso não me impede de selecioná-lo novamente em um sorteio seguinte. Seria igual a dizer que toda vez em que vou sortear um número de minha urna ao acaso, eu reponho novamente este número para o próximo sorteio. Mas, se nós não usamos a repetição, um número selecionado para a amostra só poderá ser usado ou sorteado uma única vez. O que é melhor, usar a reposição ou não? É uma questão lógica. Olhando do ponto de vista de que a técnica nos dá dados mais precisos, também permite ter a mesma precisão se utilizamos uma amostra menor. Concluímos, então, que a amostragem aleatória e sem reposi- ção é sempre melhor. Portanto, o tamanho da amostra utilizada quando não usamos reposição é sempre menor em relação ao com reposição. Se estamos utilizando a reposição e, por acaso, sorteamos um indivíduo mais de uma vez na mesma amostra, o fato é igual ao da redução do tamanho da amostra, onde vemos uma menor probabilidade de sortearmos indivíduos dife- FUNDAMENTOS DA ESTATÍSTICA 15 Fundamentos_da_estatística_Uni_01_A5.indd 15 24/09/19 15:33 rentes. Do mesmo jeito, se o nosso conjunto de dados é infinito, os dois métodos terão o mesmo valor, uma vez que a chance de selecionar o mesmo indivíduo duas vezes no mesmo evento tende a ser muito pequena ou quase infinita. EXEMPLIFICANDO Imagine uma pesquisa para sabermos o time mais popular do estado de São Paulo. Se usarmos como base a pesquisa real, teremos de entrevistar todas as pessoas residentes no estado de São Paulo, o que, convenha- mos, não é impossível, mas a dificuldade que teríamos seria enorme em relação à quantidade de pessoas entrevistadas. Portanto, apesar de não ser 100% confiável, devemos criar um espaço ou quantidade que possa representar com confiança nossa pesquisa, a fim de que possa represen- tar uma grande porcentagem da realidade do fato a ser estudado. Por todos esses motivos, podemos ter a plena convicção de que o melhor para uma amostragem real é o uso da amostragem sem repetição, para que possamos ter cálculos estatísticos que demonstrem bem melhor a realidade do evento estudado. Usando amostra aleatória simples Com o uso de computadores cada vez mais avançados, é possível retratar uma amostra aleatória simples de forma rápida e totalmente confiável. A geração de números aleatórios mediante softwares (são números estritamente aleatórios) é cada vez mais con- fiável. Desta forma, ao utilizar MAS (mostra aleatória simples), asseguramos a obtenção de amostras re- presentativas, de modo que uma das únicas chan- ces de erro que poderá alterar nossos resultados será o azar adverso. Aspectos negativos da amostra aleatória simples Um dos aspectos negativos é a dificuldade de se aplicar nas pesquisas reais. Por essa técnica ser probabilística, é necessário um universo amostral considerando todos os participantes, em que todos possam ser selecionados para a amostra. O objetivo é de alto grau de dificuldade a ser cumprido, pois, na maioria dos estudos reais, nos obrigam a apli- car outros métodos. FUNDAMENTOS DA ESTATÍSTICA 16 Fundamentos_da_estatística_Uni_01_A5.indd 16 24/09/19 15:33 Fases do método de análise estatística Para termos um bom trabalho estatístico, devemos ter em mente a seguinte problemática: a defi nição do problema visa determinar como a escolha de dados pode solucionar um problema, e a coleta de dados busca reunir dados após o planejamento do trabalho pretendido, bem como estabelecer a defi nição da pe- riodicidade da coleta (contínua, periódica, ocasional ou indireta). As fases do método estatístico devem ser: 1. DEFINIÇÃO DO PROBLEMA DETERMINAR COMO A RECOLHA DE DADOS PODE SOLUCIONAR UM PROBLEMA. 2. PLANEJAMENTO ELABORAR COMO FAZER O LEVANTAMENTO DOS DADOS. 3. COLETA DE DADOS REUNIR DADOS APÓS O PLANEJAMENTO DO TRABALHO PRETENDIDO, BEM COMO DEFINIR A PERIODICIDADE DA COLETA. 4. CORREÇÃO DOS DADOS COLETADOS CONFERIR DADOS PARA AFASTAR ALGUM ERRO POR PARTE DA PESSOA QUE OS COLETOU. 6. DEMONSTRAÇÃO DOS DADOS MONTAGEM DE TABELAS OU GRÁFICOS QUE DEMONSTREM O RESULTADO DA COLETA DOS DADOS. 7. ANÁLISE DOS DADOS VISTA DETALHADA QUALITATIVA, QUANTITATIVA E INTERPRETAÇÃO DOS DADOS 5. CONFERÊNCIA DOS DADOS ORGANIZAÇÃO E CONTAGEM DOS DADOS. Para um melhor entendimento, devemos estudar alguns dos itens apresen- tados de forma um pouco mais efetiva. Coleta de dados Por meio de análises feitas para um certo evento, vamos organizar os dados obtidos por meio de tabelas. O passo principal para um procedimento estatístico é o trabalho que envol- ve os dados de um estudo. Os dados que podemos usar precisam estar defi ni- dos, sejam eles primários ou secundários. Para qualquer tipo de levantamento de dados, devemos ter o máximo de cui- dado durante a coleta de informações. São cometidos grandes erros quando se realiza uma coleta de dados e é dada a defi nição errada do público-alvo, como distorções nas perguntas e dados insufi cientes. Dados de pesquisa são os materiais comumente registrados e aceitos na comunidade científi ca como necessários para validar os resultados de pesqui- FUNDAMENTOS DA ESTATÍSTICA 17 Fundamentos_da_estatística_Uni_01_A5.indd 17 24/09/19 15:33 sas. Eles incluem fatos e estatísticas recolhidas para posterior referência ou análise. Recenseamento Pesquisa que determina o número de habitantes de uma região, cidade, país etc., especificando-os por sexo, ida- de, religião, estado civil. Também pode ser a relação das pessoas que possuem as condições previstas pela lei para pos- suir certos cargos ou funções (como re- censeamento eleitoral e recenseamento militar). É a ação de listar ou enumerar um tipo de população, podendo ser também gado ou outros animais. Organização de dados Coletar dados é o ato de pesquisar, juntar documentos e provas, procurar informações sobre um determinado tema ou conjunto de temas correlacionados e agrupá-los de forma a facilitar uma posterior análise. Dados são itens primordiais do sistema de pesquisa. São fatos científicos que tem como finalidade os resultados de pesquisa, publi- cados ou não. Após escolhermos os dados, é necessária uma revisão crítica de modo a eli- minar valores não necessários ou eliminar erros que possam provocar enganos futuros de análise. Valores não necessários possam vir de erros na recolha ou do não entendimento da pessoa que está analisando esses dados. Para isso, nossa base de dados deve ser totalmente confiável. Conjunto de dados é um depósito de informação relacionado com certo assun- to a ser pesquisado, ou seja, é uma coletânea de dados ou tópicos de informação arranjados de determinado modo que nos permita sua consulta e atualização. Organizar os dados é uma atividade que tem como finalidade a melhor com- preensão desses dados, dando-lhes, ao mesmo tempo, uma finalidade de ser e uma análise correta. É analisar os dados de um problema e identificá-los. FUNDAMENTOS DA ESTATÍSTICA 18 Fundamentos_da_estatística_Uni_01_A5.indd 18 24/09/19 15:33 Variável São características comuns aos elementos de uma população à qual atri- buímos um número ou categoria, assumindo valores diferentes de unidade. Podemos chamar essa população como a variável que vamos estudar, pelo fato de que a população é formada pelos valores que a variável pode assumir ou ter. A esse método, que consiste em reconhecer uma observação de uma variá- vel, damos o nome de experimento aleatório. Por exemplo, suponhamos que pretendemosestudar o número de celulares de cada família dos alunos que frequentam a escola XXX, no ano letivo 2017/2018. Podemos dizer que a nossa população é constituída por todos os resultados obtidos para o número de celulares das famílias dos referidos alunos. Quando se considera um desses alunos e se questiona quanto ao número de celulares, estamos a realizar uma experiência aleatória. Por esse fato, a variável tomará uma forma quantitativa, pois poderá ser medida, ou seja, poderá ser contada. Podemos ainda ter uma variável que poderá ser medida e contada, chamada de variável contínua. A variável será qualitativa se não for passível de medição ou contagem, mas unicamente de uma classifi cação, podendo assumir várias modalidades ou categorias. Distribuição de frequências Vamos calcular, agora, o tamanho amostral, ou seja, o número de ob- servações obtidas na amostra. Após uma coleta de dados, temos um conjunto de informações e devemos colocá-las em uma tabela de distribuição de frequência, ou simplesmente uma tabela de frequência. Todos os dados dessa tabela serão divididos em classes pre- determinadas, colocando-se a frequência de cada classe. Portanto, uma tabela de frequência é um conjunto de dados agrupados de forma organizada e sequencial, a fi m de que os dados sirvam de base para a construção de futuros gráfi cos. Vamos, agora, estudar cada item em separado. • Frequência absoluta: é a frequência que leva em consideração a quantida- de de eventos que temos em uma classe. • Frequência relativa: é o quociente entre a frequência absoluta e a soma de todas as frequências. FUNDAMENTOS DA ESTATÍSTICA 19 Fundamentos_da_estatística_Uni_01_A5.indd 19 24/09/19 15:33 • Frequência percentual: é a multiplicação da frequência relativa por 100. • Frequência acumulada: é a somatória de todas as classes. • Distribuição de frequência pontual: são os dados quantitativos. A construção de uma tabela de frequência pontual é feita da mesma forma que a construção de uma tabela simples, em que se organizam todos os dife- rentes valores anotados da variável com suas respectivas frequências absolu- tas, representadas por ƒi (em que i corresponde ao número de linhas da tabela) como é mostrado na Tabela 1 a seguir. Usamos a distribuição de frequência pontual quando se trabalha com dados discretos. O melhor tipo de gráfi co uti- lizado para representar esse tipo de distribuição de frequência é o gráfi co de barras. Considere os dados do exemplo. Em uma cidade, foram totalizados o número de pessoas com diabetes em 20 grupos de 1.000 pessoas cada. Nesse caso, obtemos os seguintes dados: 10, 12, 9, 11, 10, 8, 9, 10, 7, 10, 8, 9, 9, 10, 10, 11, 9, 11, 10, 10. Um possível resumo dos dados é desenvolvido na Tabela 1: Pessoas com diabetes Apuração dos grupos Nº de grupos 7 / 1 8 / / 2 9 / / / / / 5 10 / / / / / / / / 8 11 / / / 3 12 / 1 7 8 9 11 12 / / / / / / / // / / / / / / / / / / / // / / / / / / / / / / / 1 2 3 1 TABELA 1. RESUMO DE DADOS Portanto, a variável “quantidade de pessoas com diabetes” assume valores discretos, ou seja, inteiros: ...,7, 8, 9,... . Cuidado: ao construir sua tabela, tenha plena certeza da ordem de todos os dados colocados em suas respectivas células de localização para que um mesmo dado não apareça mais de uma vez em sua tabela. Com o exemplo da Tabela 2, temos a distribuição de frequências para esse conjunto de dados e o gráfico de barras. FUNDAMENTOS DA ESTATÍSTICA 20 Fundamentos_da_estatística_Uni_01_A5.indd 20 24/09/19 15:33 TABELA 2. FREQUÊNCIA DE PESSOAS COM DIABETES Número de pessoas com diabetes Frequência (ƒi) Frequência relativa (ƒri) Frequência percentual Frequência acumulada 7 1 0,05 5 5 8 2 0,1 10 15 9 5 0,25 25 40 10 8 0,4 40 80 11 3 0,15 15 95 12 1 0,05 5 100 9 10 1 11 12 0,05 8 0,1 3 0,25 1 0,25 5 0,4 10 0,15 25 0,05 40 15 15 40 5 80 95 100100 Observe como os dados dessa tabela são transferidos para o gráfi co de bar- ras (Gráfi co 1), e como fi ca muito mais fácil de constatar visualmente os dados. Seja para uma pesquisa rápida ou apenas a constatação de um certo dado, se torna muito melhor visualmente do que uma tabela repleta de dados. GRÁFICO 1. HISTOGRAMA DE FREQUÊNCIAS Fonte: Portal Action, 2018. Apenas como exemplo para a construção de uma distribuição de frequên- cia, temos os seguintes itens que farão parte de nosso estudo. FUNDAMENTOS DA ESTATÍSTICA 21 Fundamentos_da_estatística_Uni_01_A5.indd 21 24/09/19 15:33 • Dados brutos: 24-23-22-28-35-21-23-33-34-24-21-25- 36-26-22-30-32-25-26-33-34-21-31-25-31-26-25-35-33-31. A primeira coisa que fazemos é ordenar os dados do menor para o maior, formando o rol de dados: • Rol de dados: 21-21-21-22-22-23-23-24-25-25-25-25-26- 26-26-28-30-31-31-31-32-33-33-33-34-34-34-35-35-36. Em seguida, calculamos a amplitude total, ou seja, o maior valor obtido na amostra subtraído do menor valor obtido na amostra. Intervalos de classe Intervalo de classe é a medida do intervalo que defi ne a classe. A amplitude de uma classe é a diferença entre o maior e o menor valor de uma classe. Para um melhor entendimento, vamos estudar o assunto atra- vés de um exemplo. Foram coletas as alturas de 20 atletas de voleibol de um certo clube e os dados foram colocados em um rol aleatório. 1,91-1,78-1,69-1,82-1,80-1,72-1,73-1,76-1,77-1,94- 1,84-1,87-1,85-1,89-1,70-1,91-1,86-1,70-1,71-1,94 O ideal agora será colocar todas essas alturas em um rol crescente. Vamos agora calcular os intervalos da seguinte forma: Realizamos a subtração entre a maior e a menor altura: 1,94 – 1,69 = 0,25. Para um melhor estudo e cálculos, devemos escolher um número de clas- ses maior que quatro. Nesse exemplo, vamos escolher cinco intervalos de clas- se, dessa forma dividimos o intervalo total de alturas por cinco: 0,25:5 = 0,05. Veja os intervalos: 1,69 1,74 (1,69+0,05) 1,74 1,79 (1,74+0,05) 1,79 1,84 (1,79+0,05) 1,84 1,89 (1,84+0,05) 1,89 1,94 (1,89+0,05) Importante: o símbolo signifi ca fechado à esquerda e aberto à direita, isto é, as alturas, 1,74 – 1,79 – 1,84 – 1,89, serão usadas apenas uma vez. FUNDAMENTOS DA ESTATÍSTICA 22 Fundamentos_da_estatística_Uni_01_A5.indd 22 24/09/19 15:33 TABELA 3. TABELA DE FREQUÊNCIAS ALTURAS FREQUÊNCIAS RELATIVA PERCENTUALABSOLUTA RELATIVA 1,69 1,74 6 6/20 = 0,30 30% 1,74 1,79 3 3/20 = 0,15 15% 1,79 1,84 2 2/20 = 0,10 10% 1,84 1,89 4 4/20 = 0,20 20% 1,89 1,94 5 5/20 = 0,25 25% TOTAL 20 100% 1,69 1,74 1,79 1,74 1,79 1,79 1,84 1,79 1,84 1,84 1,89 1,84 1,89 TOTAL 1,89 1,94 TOTAL 3 2 4 20 6/20 = 0,306/20 = 0,30 3/20 = 0,15 2/20 = 0,10 6/20 = 0,30 3/20 = 0,15 2/20 = 0,10 4/20 = 0,20 3/20 = 0,15 2/20 = 0,10 4/20 = 0,20 5/20 = 0,25 2/20 = 0,10 4/20 = 0,20 5/20 = 0,255/20 = 0,25 30% 15% 10%10% 20% 25% 100% Você pode também calcular o número de classe através de “K”, em que: K = n E em que n é a quantidade de dados coletados. No nosso exemplo, a quantidade de dados foi 20. A raiz de 20 é igual a 4,472. Devemos arredondar para 5. Histogramas e polígono de frequência O histograma e o polígono de frequência são alguns dos meios de representar os dados recolhidos. Estes são os gráfi cos de melhor visualização de dados, que serão melhor abordados agora. Histograma Um histograma é uma representação das distribuições de frequências através de uma forma gráfi ca, no formato de colunas ou de barras retangula- res, de um conjunto de dados já divididos em classes. A base de cada retân- Fonte: Portal Action. Acesso em: 19/12/2018. gulo irá representar uma classe e a altura de cada retângu- lo irá representar a frequência absoluta ou quantidade com o valor de sua respectiva classe, que ocorre no conjunto de dados. É de suma importância ressaltar que esse tipo de gráfi co é uma ferramenta primordial para análises rápi- das de dados em uma pesquisa.FUNDAMENTOS DA ESTATÍSTICA 23 Fundamentos_da_estatística_Uni_01_A5.indd 23 24/09/19 15:33 GRÁFICO 2. GRÁFICO DE BARRAS VERTICAIS Retomando, o histograma é um conjunto de retângulos juntos, sabendo que cada um deles representa um intervalo de classes e sua área representa a respectiva frequência. Na elaboração de um histograma, devemos ficar atentos ao seguinte: 1. Os dados devem ser agrupados por classes; 2. No eixo horizontal são representados os intervalos de classe; 3. No eixo vertical são representadas as frequências de classe; 4. As barras são desenhadas verticalmente e não há qualquer espaço entre elas; 5. A área de cada uma das barras é proporcional à respectiva frequência. Polígono de frequências GRÁFICO 3. HISTOGRAMA DE FREQUÊNCIAS No DE ESTUDANTES Histograma Polígono de frequências simples 1,52 1,57 1,62 1,67 1,72 1,77 1,82 1,87 2 A ALTURA B 4 6 8 10 12 14 FUNDAMENTOS DA ESTATÍSTICA 24 Fundamentos_da_estatística_Uni_01_A5.indd 24 24/09/19 15:34 Também podemos representar os dados agrupados em classes na forma de polígono de frequência, que é uma outra forma gráfi ca. Os polígonos de frequências são usados, normalmente, para comparar duas distribuições de dados semelhantes. Para construirmos um polígono de frequência, primei- ramente devemos construir o histograma, onde vamos achar o ponto médio do lado superior dos retângulos e uni-los. Atenção: para que a área do polígono de frequências seja igual à somató- ria das áreas dos retângulos do histograma, parte-se do extremo esquerdo do polígono (ponto B) com o ponto médio (A) do dado anterior, de frequên- cia nula, e procede-se do mesmo modo para o extremo direito do polígono. Frequência acumulada e relativa Em estatística, a frequência absoluta corresponde ao nome dado ao nú- mero de vezes que um valor aparece em um determinado conjunto de dados. A frequência acumulada é diferente: ela representa a soma de todas as fre- quências até o ponto atual no conjunto de dados. Classifi cando um conjunto de dado Primeiro passo Vamos iniciar fazendo um rol de todos os dados coletados, colocan- do todos esses dados em ordem crescente. Exemplo: o conjunto de dados representam a quantidade de livros lidos por 8 alunos no decorrer do ano de 2017. Depois de classifi car os valores, ele fi cará da seguinte maneira: 3, 3, 5, 6, 6, 6, 8. Segundo passo Calcule a frequência absoluta de cada valor. A frequência absoluta é a que representa quantas vezes ele aparece em seu rol (não confundir frequência ab- soluta com frequência acumulada). Coloque no início da primeira coluna uma descrição para o que esse termo representa. Agora, escreva “frequência” no topo da segunda coluna. Complete a tabela com cada dado correspondente. Exemplo: escreva “número de livros” no alto da primeira coluna e “frequên- cia” no topo da segunda coluna. Na linha seguinte, escreva o primeiro valor FUNDAMENTOS DA ESTATÍSTICA 25 Fundamentos_da_estatística_Uni_01_A5.indd 25 24/09/19 15:34 sob “número de livros”: 3. Veja quantos 3 existem nos dados. Já que há dois 3, escreva 2 abaixo de “frequência”, na mesma linha. Esse procedimento deve ser repetido para cada valor, até o final da tabela. 3 ] F = 2 5 ] F = 1 6 ] F = 3 8 ] F = 1 Terceiro passo Calcule a frequência acumulada do valor inicial. Essa frequência acumula- da nos aponta a quantidade de vezes que aparece esse mesmo valor (ou um valor menor). Comece sempre com o valor menor dos dados. Se por acaso não tivermos valores menores, a solução sempre será igual a frequência acumulada do mesmo valor. Exemplo: o nosso valor mais baixo é 3. A quantidade de livros lidos foram 3 que é igual a 2. Ninguém leu menos do que isso, deste modo a frequência acumulada será 3. Coloque esse valor na primeira linha da tabela: 3 ] F = 2 | CF = 2 Quarto passo Calcule a frequência acumulada do valor seguinte. Acabamos de achar quantas vezes os menores aparecem. Para calcularmos a frequência acumu- lada desse valor, precisamos somar sua frequência absoluta ao total, ou seja, pegue a última frequência acumulada que você encontrou e some com a fre- quência absoluta do respectivo valor. Exemplo: 3 ] F = 2 | CF = 2 5 ] F = 1 | CF = 2 + 1 = 3 Quinto passo Vamos repetir todos os procedimentos para os valores seguintes, calculando sempre os valores seguintes em ordem crescente. Para cada um desses valores, some a última frequência acumulada à frequência absoluta do valor seguinte. Cuidado com os cálculos. Nessa fase é quando acontece o maior índice de erros de uma pesquisa. Exemplo: 3 ] F = 2 | CF = 2 FUNDAMENTOS DA ESTATÍSTICA 26 Fundamentos_da_estatística_Uni_01_A5.indd 26 24/09/19 15:34 5 ] F = 1 | CF = 2 + 1 = 3 6 ] F = 3 | CF = 3 + 3 = 6 8 ] F = 1 | CF = 6 + 1 = 7 Sexto passo Faça uma conferência de seu trabalho. Quando fi nalizar, você terá somado o número de vezes que cada valor apareceu. A frequência acumulada fi nal deve ser exatamente igual ao número total de pontos de valores em seu total de dados. Há dois modos de conferir o que foi feito: • Some todas as frequências individuais: 2 + 1 + 3 + 1 = 7, que é a nossa fre- quência acumulada. • Calcule a quantidade de pontos de dados. Como nosso rol era 3, 3, 5, 6, 6, 6, 8, temos 7 itens, sendo esse valor nossa frequência acumulada. Frequência relativa A frequência relativa é o quociente (divisão) da frequência absoluta da va- riável e o número de vezes que ela aparece. Deste modo, chamamos de fre- quência relativa de certa classe, calculando a frequência dessa classe através da soma das frequências das demais classes. Para que tenhamos certeza que os dados sejam representativos, vamos usar a frequência relativa já calculada em nosso estudo, através dos percentuais cal- culados, como a divisão da frequência absoluta e o número total de ocorrências. Em uma empresa foi realizada uma pesquisa a fi m de saber a quantidade de fi lhos de cada funcionário. Os dados da pesquisa foram organizados na seguinte tabela: TABELA 4. TABELA DE FREQUÊNCIA NÚMERO DE FILHOS FREQUÊNCIA ABSOLUTA FREQUÊNCIA RELATIVA 0 30 30/160 = 0,1875 = 18,75% 1 36 36/160 = 0,225 = 22,5% 2 60 60/160 = 0,375 = 37,5% 3 24 24/160 = 0,15 = 15% 4 10 10/160 = 0,0625 = 6,25% TOTAL 160 100% 0 4 TOTAL 30 36 60 24 160 30/160 = 0,1875 = 18,75%30/160 = 0,1875 = 18,75% 36/160 = 0,225 = 22,5% 30/160 = 0,1875 = 18,75% 36/160 = 0,225 = 22,5% 60/160 = 0,375 = 37,5% 30/160 = 0,1875 = 18,75% 36/160 = 0,225 = 22,5% 60/160 = 0,375 = 37,5% 24/160 = 0,15 = 15% 30/160 = 0,1875 = 18,75% 36/160 = 0,225 = 22,5% 60/160 = 0,375 = 37,5% 24/160 = 0,15 = 15% 10/160 = 0,0625 = 6,25% 30/160 = 0,1875 = 18,75% 36/160 = 0,225 = 22,5% 60/160 = 0,375 = 37,5% 24/160 = 0,15 = 15% 10/160 = 0,0625 = 6,25% 36/160 = 0,225 = 22,5% 60/160 = 0,375 = 37,5% 24/160 = 0,15 = 15% 10/160 = 0,0625 = 6,25% 100% 60/160 = 0,375 = 37,5% 24/160 = 0,15 = 15% 10/160 = 0,0625 = 6,25% 100% 10/160 = 0,0625 = 6,25% A melhor interpretação, é feita através da frequência relativa, os dados percentuais mostram de forma melhor a comparação de cada caso: 18,75% dos funcionários não tem filhos; 22,5% tem somente um filho; FUNDAMENTOS DA ESTATÍSTICA 27 Fundamentos_da_estatística_Uni_01_A5.indd 27 24/09/19 15:34 DICA Leia o livro Introdução à história da matemática, de Howard Eves, traduzi- do por Hygino H. Domingues e editado pela Editora UNICAMP, em 2004. 37,5% tem dois filhos; 15% tem três filhos; 6,25% tem quatro filhos. TABELA 5. DISTRIBUIÇÃO DE FREQUÊNCIA i Classes fi xi fri % Fi Fri xifi Fri 1 150| — 160 4 155,00 0,20 20,00 4 20,00 620 20,00 2 160| — 170 5 165,00 0,25 25,00 9 45,00 825 45,00 3 170| — 180 6 175,00 0,30 30,00 15 75,00 1050 75,00 4 180| — 190 4 185,00 0,20 20,00 19 95,00 740 95,00 5 190| — 200 1 195,00 0,05 5,00 20 100,00 195 100,00 ∑ 20 ∑ 100,00 ∑ 3430 ∑ 1 2 150| — 160 3 150| — 160 160| — 170 4 150| — 160 160| — 170 170|— 180 160| — 170 170| — 180 180| — 190 190| — 200 170| — 180 180| — 190 190| — 200 155,00 6 190| — 200 ∑ 155,00 165,00 4 0,20 165,00 175,00 1 0,25 185,00 195,00 20 20,00 0,30 195,00 20,00 25,00 0,20 4 30,00 0,05 9 20,00 20,00 15 5,00 100,00 45,00 19 100,00 620 75,00 20 825 95,00 100,00 20,00 1050 100,00 20,00 45,00 740 45,00 75,00 195 3430 95,00 3430 100,00 GRÁFICO 4. GRÁFICOS DE FREQUÊNCIA Representação gráfica A representação gráfi ca nos permite uma visão e conclusão mais rápida de nossa pesquisa. Agora é a hora de sintetizar tudo o que você aprendeu nessa unidade. Vamos lá? FUNDAMENTOS DA ESTATÍSTICA 28 Fundamentos_da_estatística_Uni_01_A5.indd 28 24/09/19 15:34 Sintetizando Caro aluno, nesse primeiro momento temos como objetivo a introdução da Estatística de modo geral e seus primeiros parâmetros. Não podemos esquecer nunca dos primeiros passos para que nosso es- tudo seja bem realizado, como: uma boa e confiável escolha da população de onde vamos tirar nossa amostra e os questionamentos (perguntas) para montagem de nossos dados, perguntas que demonstrem ao máximo a reali- dade do fato em questão. A tabulação correta de todos os dados obtidos é importante, assim como a realização dos cálculos de todas as frequências de forma harmônica e correta, além da construção perfeita das tabelas e gráficos para que, quando apresentada a totalidade do trabalho, eles retratem a mais pura realidade do estudo pedido. FUNDAMENTOS DA ESTATÍSTICA 29 Fundamentos_da_estatística_Uni_01_A5.indd 29 24/09/19 15:34 Referências bibliográficas BONJORNO, J. Matemática fundamental. São Paulo: FTD, 2008. CENTURION, M. Conteúdo e metodologia da matemática. São Paulo: Scipio- ne, 1994. CAsSTELNUOVO, E. Didáctica de la matemática moderna: números y opera- ciones. México: Trilhas, 1993. EVES, H. Introdução à história da matemática. Campinas: Editora Unicamp, 2004. NETQUEST. Amostragem probabilística: amostra aleatória simples. Disponí- vel em: <https://www.netquest.com/blog/br/blog/br/amostra-probabilistica- -aleatoria-simples>. Acesso em: 14 dez. 2018. PORTAL ACTION. Distribuição de frequências. Disponível em: <http://www. portalaction.com.br/estatistica-basica/16-distribuicao-de-frequencias>. Aces- so em: 14 dez. 2018. SABER MATEMÁTICA. A diferença entre população e amostra. Disponível em: <https://sabermatematica.com.br/diferenca-entre-populacao-e-amostra. html>. Acesso em: 14 dez. 2018. FUNDAMENTOS DA ESTATÍSTICA 30 Fundamentos_da_estatística_Uni_01_A5.indd 30 24/09/19 15:34 INTRODUÇÃO À ESTATÍSTICA 2 UNIDADE Fundamentos_da_estatística_Uni_02_A5.indd 31 24/09/19 15:31 Objetivos da unidade Tópicos de estudo Levar o aluno a coletar dados para pesquisa de forma correta e para a produção de dados que retratem a realidade do evento. Desenvolver seu senso crítico para a realidade dos eventos; Ser capaz de aplicar medidas qualitativas e quantitativas do evento; Desenvolver seu raciocínio lógico. Apresentar o conceito de probabilidade. Estatística descritiva Medidas de posição Média aritmética Mediana e moda Medidas de dispersão Amplitude Desvio médio Desvio padrão Variância e coeficiente de variação Outras estatísticas descritivas Mínimo Máximo Quartis Decis e percentis Teoria Elementar da Probabilidade Eventos independentes, depen- dentes e mutuamente exclusivos Valor esperado Probabilidade condicional Distribuição discreta e contínua Distribuição binomial FUNDAMENTOS DA ESTATÍSTICA 32 Fundamentos_da_estatística_Uni_02_A5.indd 32 24/09/19 15:31 Estatística descritiva Estatística descritiva é a parte da estatística que tem como objetivo resumir e descrever todo e qualquer grupo de dados coletados. De outra forma, é a es- tatística que tem como função primordial, sintetizar os dados de modo direto, não se preocupando tanto com variações de confi ança dos dados. Podemos ter como exemplos de estatísticas descritivas: média, desvio padrão, mediana. A estatística descritiva, como já enunciada, se preocupa em descrever os dados. A tabela é um modo que resume um conjunto de dados, enquanto os gráfi cos são as apresentações dos dados, que têm como objetivo produzir uma impressão mais rápida e viva do fato estudo. Quando temos muitos dados, é necessário acharmos um modo de relacio- ná-los. Podemos reduzir a quantidade de dados, mas corremos o risco de ocor- rer uma falta de informação. Essa suposta falta de dados pode ser suprida pelo uso de outras medidas que nos per- mitam o cruzamento de informações. Por esse motivo, a média (medida de tendência central) é apresentada em junção com o valor do desvio padrão (medida de dispersão). As medidas da estatística descritiva são, também, a base para a estatística inferencial – aquela que relaciona os dados da nos- sa distribuição. A estatística descritiva, como o próprio nome diz, descreve a amostra, e a estatística inferencial permi- te ir além dos resultados calculados. Isso nos permite chegar a variadas conclu- sões sobre o conjunto em estudo. Medidas de posição As medidas de posição são valores que representam a tendência de concen- tração dos dados observados. Dentre as medidas de posição, as mais utilizadas são as medidas de tendência central. São três medidas de tendência central mais utilizadas: média aritmética, moda e mediana. FUNDAMENTOS DA ESTATÍSTICA 33 Fundamentos_da_estatística_Uni_02_A5.indd 33 24/09/19 15:32 Média aritmética Média aritmética, ou amostral, é a simples somatória de todos os valores coletados divididos pela quantidade de valores da soma. A média aritmética é calculada somando os valores que foram coletados da amostra e dividindo o resultado pelo número de valores. Desse modo, a média amostral é calculada através da seguinte fórmula: Exemplo: Em uma fábrica de parafusos que são vendidos em pacotes por quilogra- ma, foram retirados 5 pacotes para serem pesados da linha de produção e seus pesos foram medidos. Os valores foram: 4,5; 4,6; 4,5; 4,4; 4,5. Desta forma, a média é dada por: Veja os valores e a frequência das faixas salariais em uma escola, na Tabela 1: Salário Média dos salários Frequência 0 500 250 14 500 1000 750 4 1000 1500 1250 2 1500 2000 1750 2 2000 2500 2250 6 0 500 500 500 1000 1000 1000 1500 1500 1500 2000 2000 2000 250 2500 750 1250 17501750 2250 14 4 2 2 6 TABELA 1. MÉDIA SALARIAL Média aritmética ponderada Quando calculamos a média aritmética simples, todos os dados têm exatamente a mesma importância ou o mesmo peso. Portanto, todos têm o mesmo peso relativo. FUNDAMENTOS DA ESTATÍSTICA 34 Fundamentos_da_estatística_Uni_02_A5.indd 34 24/09/19 15:32 Porém, há casos em que os dados têm importância específica diferen- te. Nesses casos, o cálculo da média deve levar em conta a importância específica ou o peso relativo. Este tipo de caso se chama média aritmé- tica ponderada. No cálculo da média ponderada, multiplicamos cada valor do conjunto por seu “peso”, isto é, por sua importância específica. A média aritmética ponderada xp de um conjunto de números x1, x2, x3, ..., xn cuja importância relativa (“peso”) é respectivamente p1, p2, p3, ..., pn, é calculada da seguinte maneira: Σ (pi * xi)k = 0n Devemos somar os produtos dos valores pelos seus pesos e dividirmos o resultado pela soma dos pesos. Exemplo: Giovanna participou de um exame final, no qual foram realizadas as seguintes provas: Português, Matemática, Biologia e História. Os pesos dessas provas são respectivamente 3, 3, 2 e 2. Sabendo que Giovanna tirou nota 8,0 em Português, 7,5 em Matemática, 5,0 em Biologia e 4,0 em História, qual foi a média final obtida? 8,0 * 3 + 7,5 * 3 + 5,0 * 2 + 4,0 * 2 3 + 3 + 2 + 2 = 6,45 Portanto, a média de Giovanna foi de 6,45. Vamos calcular a nota final de um aluno em uma disciplina da faculdade com a média ponderadadas notas A, B e C, cujos pesos são 1, 2 e 3, respectiva- mente. Flávio obteve A = 3,0 e B = 6,0. Quanto ele precisa obter em C para que sua nota final seja 6,0? Vamos usar a média ponderada colocando os valores conhecidos. Devemos também substituir a nota final pelo resultado e calcularemos a nota que falta. Veja: FUNDAMENTOS DA ESTATÍSTICA 35 Fundamentos_da_estatística_Uni_02_A5.indd 35 24/09/19 15:32 A.1 + B.2 + C.3 1 + 2 + 3 MP = 3,0.1 + 6,0.2 C.3 1 + 2 + 3 6,0 = 3,0 + 12,0 + C.3 6 6,0 = 6.6,0 = 3,0 + 12,0 + C.3 36,0 = 15,0 + 3C 36,0 - 15,0 = 3C 3C = 21,0 C = 7,0 C = 21,0 3 A média geométrica é usada, para números positivos, com a raiz enésima do produto dos n elementos de um conjunto de dados. Assim como a média arit- mética, a média geométrica também é uma medida de tendência central. Essa é usada de forma mais eficiente com valores que aumentam de forma sucessiva. Se tivermos os números 2, 4 e 8 para calcularmos o valor médio aritmético deste conjunto, multiplicamos os elementos e obtemos o produto 64. Pega- mos, então, o produto e extraímos sua raiz cúbica, chegando ao valor médio 4. Calculamos a raiz cúbica, pois o conjunto é composto de 3 elementos. Se fossem n elementos, extrairíamos a raiz de índice n. Nesse exemplo, teríamos a seguinte solução: x = 2*4.8 64 = 43 3 Aplicação prática da média geométrica Quando devemos trabalhar com variações de percentuais em sequência, a média geométrica também é de grande ajuda para simplificarmos nossos cálculos. Veja o exemplo: Vamos supor que você recebeu um aumento salarial da seguinte forma: 20% no primeiro mês, 12% no segundo mês e 7% no terceiro mês. Qual foi a média de seu percentual de aumento? Devemos multiplicar nosso salário por: 1,2, 1,12 e 1,07. Deste modo, calcula- mos a média geométrica: FUNDAMENTOS DA ESTATÍSTICA 36 Fundamentos_da_estatística_Uni_02_A5.indd 36 24/09/19 15:32 Assim, nosso fator é de 1,128741, que é o mesmo que 12,8741%. Logo, esse é o percentual médio de seu aumento. Mediana e moda Quando temos um conjunto de valores, ordenados em ordem crescente ou decrescente, o valor que ocupa a posição central é chamado de mediana. Se tivermos uma distribuição com um número ímpar de valores, a moda será o valor central da distribuição. Exemplo: foram anotadas as medidas dos com- primentos de alguns rolos de tecidos. Considerando que os valores medidos foram (1,54 m; 1,67 m; 1,50 m; 1,65 m; 1,75 m; 1,69 m; 1,60 m; 1,55 m e 1,78 m), qual é o valor da mediana do comprimento desses rolos? Vamos colocar os valores em ordem. Nesse caso, colocaremos em ordem crescente. Assim, o conjunto de dados será: 1,50; 1,54; 1,55; 1,60; 1,65; 1,67; 1,69; 1,75; 1,78. Sendo nosso rol formado por 9 elementos, e sendo este um número ímpar, então a mediana será igual ao 5º elemento. Ou seja: Md = 1,65 m Se a distribuição tiver um número de dados, não teremos um valor central, mas dois valores centrais. Por esse motivo, a mediana será calculada pela média dos dois valores centrais. Exemplo: Calcule o valor da mediana da seguinte amostra de dados: 32, 27, 15, 44, 15, 32. Primeiro, precisamos colocar os dados em ordem. Assim, temos: 15, 15, 27, 32, 32, 44 Como essa amostra é formada por 6 elementos, que é um número par, a mediana será igual a média dos elementos centrais. Ou seja: X = 27 + 32 = 29,5 2 Em um conjunto de valores, o valor que aparece o maior número de vezes é chamado de moda, ou seja, é o valor de maior frequência absoluta. Exemplo: FUNDAMENTOS DA ESTATÍSTICA 37 Fundamentos_da_estatística_Uni_02_A5.indd 37 24/09/19 15:32 Em uma loja de calçados durante um certo período foram vendidas as se- guintes numerações de tênis: 34, 39, 35, 35, 37, 40, 36, 38, 35, 38 e 41. Calcule o valor da moda desta amostra? Observando os números vendidos notamos que o número 35 foi o que apresentou maior frequência (3 pares). Portanto, a moda é igual a: Mo = 35 Medidas de dispersão As medidas de dispersão são usadas para obter o grau de variabilidade dos elementos de um conjunto de informações. Amplitude e desvio são os mais fundamentais desses cálculos. Existem ainda outras medidas responsáveis para demonstrar o grau de va- riação entre os dados do conjunto. São elas: amplitude, desvio, variância e desvio padrão. Amplitude Para iniciarmos nosso estudo de amplitude, vamos considerar a Tabela 2 para entender de modo mais fácil os conceitos de amplitude total, amplitude de classe, limite superior da classe e limite inferior da classe. Classe Frequência 15 |-- 20 8 20 |-- 30 4 30 |-- 50 3 15 |-- 2015 |-- 20 20 |-- 30 15 |-- 20 20 |-- 30 30 |-- 50 20 |-- 30 30 |-- 5030 |-- 50 8 4 3 TABELA 2. RELAÇÃO CLASSE-FREQUÊNCIA Tendo como base a Tabela 2, note que todas as classes possuem o mesmo tamanho. A primeira é 15 |-- 20. O limite inferior da primeira classe é 15. O limite superior da primeira classe é 20. A amplitude de classe corresponde à diferença entre o limite superior e inferior. Ou seja: amplitude de classe = 20 - 15 = 5. FUNDAMENTOS DA ESTATÍSTICA 38 Fundamentos_da_estatística_Uni_02_A5.indd 38 24/09/19 15:32 Limite inferior sempre será o valor da esquerda. Vamos chamar o limite inferior por LI. Na primeira classe, temos que LI = 15. Na segunda classe, temos LI = 20. E na terceira classe, temos LI = 30. Limite superior sempre será o valor da direita. Vamos chamar o limite su- perior por LS. Na primeira classe, temos que LS = 20. Na segunda classe, temos LS = 30. E na terceira classe, temos LS = 50. Amplitude de classe é o tamanho equivalente ao intervalo da clas- se. A amplitude de classe, que chamamos de h, será a diferença entre o li- mite superior e inferior: h = LS - LI. Na primeira classe, a amplitude é 20 - 15 = 5. Na segunda, h = 30 - 20 = 10. E na terceira, h = 50 - 30 = 20. Para a amplitude total, vamos observar os extremos da Tabela 2. O míni- mo é 15, enquanto o máximo vale 50. Não nos interessa se o intervalo é aber- to ou fechado (no caso, é aberto em 50). Portanto, a amplitude total da Tabela 2 é calculada como AT = mín - máx. Ou seja, AT = 50 - 15 = 35. Em um rol de dados numéricos, a amplitude será a diferença entre o maior e o menor valor da amostra. Ela mostra a dispersão dos valores de uma série. Se a amplitude for um nú- mero alto, signifi ca que os valores estão afastados. Se a amplitude for um valor baixo, então signifi ca que os valores estão aproximados. Exemplo: na coleta de dados sobre as medidas de camisetas de um grupo de jovens, temos os seguin- tes valores: 38, 42, 44, 40, 46, 38, 48, 50, 52. Devemos achar a maior medida (52) e a menor medida (38). OBS.: Para melhor visualizarmos, é preferível colocar as medidas em ordem crescente Agora, fazemos a subtração entre a maior medida e a menor medida. 52 - 38 = 14 Pronto, nossa amplitude é 14. Em estatística, o conceito de desvio médio corresponde ao conceito de distância. É a diferença dos dados obtidos com a média desses dados, que pode ser calculada através dos desvios de cada elemento da sequên- cia em relação à média da sequência. O desvio médio é definido como Desvio médio FUNDAMENTOS DA ESTATÍSTICA 39 Fundamentos_da_estatística_Uni_02_A5.indd 39 24/09/19 15:32 sendo uma média aritmética dos desvios de cada elemento da série para a média da série. DM = Σfi * lxi - xl n Exemplo: Tomemos os números 2, 8, 5, 6. Determine o desvio médio. Primeiro, calculamos a média: X = 2 + 8 + 5 + 6 = 5,25 4 Agora, calculamos o desvio médio, lembrando que fi = 1, visto que cada um dos quatro valores apareceu uma única vez. DM = Σf1 |x1 - xl| n (2 - 5,25) + (8 - 5,25) + (5 - 5,25) + (6 - 5,25) = 1,75 4 OBS.: Todas as medidas são calculadas em módulo, pois se trata de distância Desvio padrão Desvio padrão é um cálculo que representa o grau de separação numérica de um conjunto de dados. O desvio padrão nos mostra o quanto um conjunto dedados é uniforme. Quanto mais esse valor se aproximar de 0, mais confi ável será o desvio padrão. O valor correspondente à média aritmética dos quadrados dos desvios em relação à média, recebe o nome de variância. A raiz quadrada dessa variância recebe o nome de desvio padrão. Para calcularmos o desvio padrão (DP), fazemos o seguinte: Exemplo: Σ = 1 (Xi - Ma)2 n i = 1 n FUNDAMENTOS DA ESTATÍSTICA 40 Fundamentos_da_estatística_Uni_02_A5.indd 40 24/09/19 15:32 As alturas de três irmãos são as seguintes: 1,55 m; 1,75 m e 1,80 m. Qual é o valor da média e do desvio padrão da altura desses irmãos? Cálculo da média, sendo n = 3: Ma = 1,55 + 1,70 + 1,80 = 1,68 3 Cálculo do desvio padrão: DP = (1,55 - 1,62)2 + (1,70 - 1,68)2 + (1,80 - 1,68)2 3 DP = 0,0317 3 DP = 0,01005 1 = 0,1027 Variância e coeficiente de variação A variância é a medida que indica, em função de uma média aritmética, a regularidade de desvio de um rol de dados. O coefi ciente de variação (CV), que também pode ser chamado de desvio padrão (DP), é simplesmente uma medida padronizada de uma distribuição de dispersão de uma probabilidade ou de frequências. Outras estatísticas descritivas Por meio da estatística descritiva – que nos leva a entender todos os dados cole- tados –, podemos descrever, entender e resumir os dados de uma amostra usando vários tipos de medidas como: medidas de tendência central (média, mediana e moda), medidas de dispersão (valores mínimo e máximo, desvio padrão e variância), percentis, quartis e decis. Os tópicos a seguir vão nos ajudar a resolver alguns problemas que podem vir a aparecer em nosso estudo. Por exemplo: em uma casa com duas pessoas, uma come dois chocolates e a outra nenhum, mas na média da casa cada pessoa comeu um. FUNDAMENTOS DA ESTATÍSTICA 41 Fundamentos_da_estatística_Uni_02_A5.indd 41 24/09/19 15:33 Mínimo É o menor valor que encontramos em uma série. Exemplo: 9, 8, 12, 7, 5, 11, 4, 15. O valor mínimo é 4. Máximo É o maior valor que encontramos em uma série. Exemplo: 9, 8, 12, 7, 5, 11, 4, 15. O valor máximo é 15. Quartis Quartis nada mais são que divisões de um conjunto de observações coloca- das em ordem crescente e divididas em quatro partes iguais. Cada quartil terá sua numeração: Q1, Q2 e Q3. O quartil Q1 é o valor que deixa 25% dos valores para baixo e 75% dos valores para cima. O quartil Q2 é o valor que será a mediana, ou seja, 50% dos valores para baixo e 50% dos valores para cima. O quartil Q3 é o valor que deixa 75% dos valo- res para baixo e 25% dos valores para cima. Vamos calcular os quartis. Qi = i = (n + 1) 4 Dados: 1,0; 2,0; 2,3; 2,5; 3,0; 3,2; 3,3; 3,6; 6,2; 6,8. Nesse exemplo, temos n = 10. Ou seja, temos 10 dados em nosso rol. Q1 = i (n + 1) 0,25 (10 + 1) = 2,75 4 Com o valor achado acima, sabemos que devemos usar o 2º e 3º elemen- tos. Agora, calculamos a média entre o 2º e 3º elementos. Q1 = 2,0 + 2,3 = 2,15 2 Q1 = 2,15 FUNDAMENTOS DA ESTATÍSTICA 42 Fundamentos_da_estatística_Uni_02_A5.indd 42 24/09/19 15:33 Agora, o Q2: Q2 = i (n + 1) 1 (10 + 1) = 5,5 4 2 Com o valor achado acima, sabemos que devemos usar o 5º e 6º elemen- tos. Agora, calculamos a média entre o 5º e 6º elementos: 3 + 3,2 2 = 3,1 Q2 = 3,1 Agora, o Q3: Q3 = i (n + 1) 0,75 (10 + 1) = 8,25 4 Com o valor achado acima, sabemos que devemos usar o 8º e 9º elemen- tos. Agora, calculamos a média entre o 8º e 9º elementos. 3,6 + 6,2 = 4,9 2 Q3 = 4,9 Decis e percentis Decis e percentis são valores que dividem o rol na décima rol. Com eles, achamos o valor correspondente. Vamos usar o rol do item anterior como exemplo. Dados: 1,0; 2,0; 2,3; 2,5; 3,0; 3,2; 3,3; 3,6; 6,2; 6,8. Número de elemen- tos “n” = 10. D1 = n 10 = 1 10 10 Ou seja, D1 será o primeiro elemento 1. D2 = 2n 20 = 2 10 10 FUNDAMENTOS DA ESTATÍSTICA 43 Fundamentos_da_estatística_Uni_02_A5.indd 43 24/09/19 15:33 Caso o resultado da divisão seja um número decimal, arredondamos o valor para cima. Trata-se do mesmo cálculo feito no item anterior. Apenas dividimos por 100. Vamos usar o rol do item anterior como exemplo. Seguem os mesmos dados: 1,0; 2,0; 2,3; 2,5; 3,0; 3,2; 3,3; 3,6; 6,2; 6,8. Número de elementos “n” = 10. P1 = n 10 = 0,1 100 100 Teoria Elementar da Probabilidade A Teoria Elementar da Probabilidade nasceu no século XVII por um inte- resse comum de Blaise Pascal e Pierre Fermat. Na Teoria Elementar da Probabilidade, também chamada de processo aleatório, quando os diferentes tipos de fatos do acaso podem ocasionar interferências na ocorrência de um dos resultados do evento que esta- mos querendo testar. Tendo em vista o alinhamento de um determinado número de condições, os resultados aleatórios podem ou não ocorrer. Por meio de um conjunto de téc- nicas numéricas, temos uma ideia inicial da distribuição de frequências da variável em questão, porém, as medidas de posição, dispersão e assi- metria são simples estimativas de quantidades desconhecidas, enquanto as frequências calculadas são das probabilidades de ocorrência de certos eventos. Ao tirarmos conclusões de uma amostra de dados que sejam úteis à tomada de decisões no planejamento e projeto de sistema, será preciso estabelecer modelos matemáticos que contenham os principais elementos do processo. Como já visto, tal modelo deve ser probabilístico pela não pos- sibilidade de podermos resumir as equações e uma lei que representem as variáveis de um evento. Para um certo modelo probabilístico, embora seja incapaz de prever com exatidão datas de eventos, proporções ou consequências deles, é de muita uti- Figura 1. Blaise Pascal (1623-1662), à esquerda, e Pierre Fermat (1601-1665), à direita. FUNDAMENTOS DA ESTATÍSTICA 44 Fundamentos_da_estatística_Uni_02_A5.indd 44 24/09/19 15:33 lidade o estudo das principais características do evento, especificando com que pro- babilidade o fato poderá ocorrer. Esta Unidade tem por objetivo mostrar os princípios da teoria de probabilidades, necessários à construção de modelos probabilísticos. Nos eventos aleatórios, a teoria de probabilidades trabalha com a concreti- zação de experimentos – naturais ou planejados –, sendo que seus resultados não podem ser previstos com exatidão. Apesar de os resultados de um experi- mento, realizado sob condições normais e imparciais, não possam ser anteci- pados. Será possível elaborar um conjunto que contenha todos os resultados possíveis ou esperados de tal experimento. Nem sempre fatos que damos como certezas poderão acontecer. O acaso estará sempre presente em nosso dia a dia, e muitas pessoas têm medo que acontecimentos ruins apareçam por acaso. No início das navegações, alguns achavam que o oceano acabaria em um grande abismo. Se pensarmos no fato de um meteorito nos atingir na Terra, devemos saber que uma quantidade mínima de meteoritos chega ao solo, já que se desinte- gram em nossa atmosfera. Deste modo, a probabilidade de atingir uma pessoa é bastante reduzida. É sabido que há milhares de anos atrás, vários meteoritos chegaram ao solo terrestre, fazendo grandes estragos e mudando, de certa forma, as caracte- rísticas do solo terrestre; como exemplo, temos grandes crateras no planeta. Estudiosos dizem, inclusive, que esses meteoritos foram os responsáveis pela extinção de vários animais na Terra, como os dinossauros. Muitos fatos podem acontecer em nosso dia a dia, como uma queda, per- dermos um objeto, sofrermos um assalto, esquecermos um compromisso etc. Porém, se prestarmos atenção em nossos atos e tivermos cuidado em tudo que fizermos, a probabilidade de um evento ruim acontecer será minimizada. Vamos entender um pouco mais com o texto do prof. Kiber Sitherc: Em dias de trovoada, será que a probabilidade de nos cair um raio é grande? Será quedevemos temer tan- to e orar pela santa Bárbara e por todos os santos do Céu? Na realidade, não é muito vulgar ouvirmos notícias de pessoas que sejam atingidas pelos raios, por isso a probabilidade de sermos atingidos é muito reduzida. As probabilidades de se morrer fulminado FUNDAMENTOS DA ESTATÍSTICA 45 Fundamentos_da_estatística_Uni_02_A5.indd 45 24/09/19 15:33 por um raio são, durante um ano, conforme a estatís- tica, uma em um milhão. Muitas pessoas entram em pânico só de pensarem que terão que viajar de avião, amedrontam-se quan- to aos noticiários dos aviões que se despenham ou que têm acidentes. Assim mais se confirmam no seu receio, mas na verdade milhões de pessoas viajam diariamente, e nem todos os dias cai um avião, se- gundo as estatísticas o avião ainda é o meio de trans- porte mais seguro do mundo. As companhias de seguros, ganham milhões de eu- ros, com a preocupação de coisas que raramente acontecem. As seguradoras apostam com as pes- soas em como as catástrofes que as preocupam ja- mais acontecerão. Na verdade, não chamam a isso apostas; mas sim seguros. Mas a verdade é que não passa de uma aposta, baseada na lei das probabili- dades. No entanto, os seguros fazem-se de coisas incríveis: desde grandes navios até pormenores do corpo como coxas e seios femininos. Tudo é assegu- rado, por vezes contra calamidades e derrotas que, segundo a lei das probabilidades, não acontecem com a frequência que se imagina. Segundo a lei das probabilidades todos estamos condenados à morte, tanto os jovens como os idosos, e na verdade a maioria faz uma vida nor- mal, como se durassem toda a vida Na verdade a probabilidade de um idoso morrer é muito maior que uma criança ou um jovem, o idoso poderá cessar de existir dentro de um ano ou uma déca- da! No entanto ele poderá sentir-se feliz e realizá- vel. Como poderá ser isso? Temos o segredo: vi- ver um dia de cada vez, o mais positivo possível. Com a lei das probabilidades podemos ajudar-nos FUNDAMENTOS DA ESTATÍSTICA 46 Fundamentos_da_estatística_Uni_02_A5.indd 46 24/09/19 15:33 a manter a mente tranquila. Será que acontece isso frequentemente? É provável que aconteça? Será que acontece mesmo? Segundo as probabilidades pode- mos analisar todos os factos racionalmente. As más notícias, espalham-se rapidamente, porém as boas, demoram, e às vezes lamentavelmente não chegam a ser reveladas. Se desenvolver a sua auto-estima e confi ança, sentirá que nada o poderá afetar.(SI- THERC, 2010). Eventos independentes, dependentes e mutuamente exclusivos Em probabilidade, eventos independentes são eventos distintos de um único espaço amostral, ou seja, dois eventos diferentes usando os mesmos dados. Quando temos um certo espaço amostral e calculamos dois eventos independentes, calculamos sua probabilidade de forma separada. P (B/A) = P (B) e P (B/A) = P (A) Exemplo: Um baralho é composto de 52 cartas, no qual temos a presença de quatro naipes: copas, ouro, paus e espadas. Deste modo, cada naipe é representado por 13 cartas. Calcule a probabilidade de escolhermos ao acaso e, sucessivamente, três cartas de um mesmo naipe sem reposição. 1a retirada = 13 / 52 2a retirada = 12 / 51 3a retirada = 11 / 50 P = 13 . 12 . 11 = 0,0129 = 1,29% 52 51 50 Exemplo: Ao lançarmos uma moeda duas vezes, qual é a probabilidade de ob- termos cara no segundo lançamento? Vamos indicar C para cara e K para coroa. Assim, temos as seguintes possibilidades: FUNDAMENTOS DA ESTATÍSTICA 47 Fundamentos_da_estatística_Uni_02_A5.indd 47 24/09/19 15:33 E = {(C,C), (C,K), (K,K), (K,C)} A probabilidade é de aproximadamente 1,29%. Total de probabilidades 4 ou n (E) = 4 As possibilidades de cara são: A = {(C,C), (K,C)}, n (A) = 2 Então: P (A) = P (A) = 2 = 1 ou seja, 50% n (E) 4 2 Vamos, agora, calcular a probabilidade de obtermos no segundo lançamen- to, também, cara, sabendo que já tivemos cara no primeiro lançamento. Como temos dois eventos – cara no primeiro e cara no segundo –, e já tendo ocorrido o evento A, temos que o evento B só pode ter acontecido na intersecção de A e B. P A = n (A B) = 1 B n (B) 2 Então, temos: P A = P (A) = 1 B 2 Por esse motivo, dizemos que A e B são eventos independentes. Eventos dependentes são aqueles que, para acontecerem, dependem necessariamen- te um do outro. Vamos utilizar a fórmula de probabilidade independente. P A = p (A B) B p (B) Agora, vamos desenvolver a fórmula da probabilidade de dois even- tos simultâneos: p (A B) = p (A/B) * p (B) Para que tenhamos a probabilidade de dois eventos dependentes, ou seja, simultâneos, devemos fazer o produto da probabilidade de o primeiro FUNDAMENTOS DA ESTATÍSTICA 48 Fundamentos_da_estatística_Uni_02_A5.indd 48 24/09/19 15:33 evento acontecer pela probabilidade de o segundo evento acontecer, isto é, p (A B). Veja o exemplo: uma moeda e um dado são lançados simultaneamente. Qual é a probabilidade de ocorrer coroa e número par? Devemos achar primeiro o espaço amostral S, o conjunto com todas as possibilidades. Iremos estabelecer C para cara e K para coroa. Dessa forma, S = {(C, 1); (C, 2); (C, 3); (C, 4); (C, 5); (C, 6); (K, 1); (K, 2); (K, 3); (K, 4); (K, 5); (K, 6)} n (S) = 12. Temos os eventos A e B. A indica que temos coroa, B indica que temos número par. P (A B) = p (A) * p (B) Em p (A) = ½, ao lançarmos uma moeda, há metade de chance de sair cara e metade de sair coroa. Em p(B) = 3/6 = ½, há 6 possíveis resultados no lança- mento de um dado, e três deles são números pares. Logo: P (A B) = ½ * ½ = 1 4 Serão denominados eventos mutuamente exclusivos aqueles que não po- dem ocorrer ao mesmo tempo. Um exemplo disso é o lançamento de um dado, no qual podemos ter como resultado o número 2 ou 5, mas não ambos juntos. Para que dois eventos sejam mutuamente exclusivos, a probabilidade de que um dos dois eventos ocorra é igual à soma das probabilidades de que cada um deles ocorra, ou seja, os elementos desses eventos não vão se repetir. P (A U B) = P (A) + P (B) Se considerarmos dois eventos A e B que pertençam a um mesmo espaço amostral, haverá a presença de elementos repetidos. Desse modo: P (A U B) = P (A) + P(B) - P (A B) Veja o exemplo: Vamos imaginar que você tem três vasos diferentes. Vamos chamá-los de A, B e C. Você quer colocá-los um ao lado do outro em uma mesa que está pre- FUNDAMENTOS DA ESTATÍSTICA 49 Fundamentos_da_estatística_Uni_02_A5.indd 49 24/09/19 15:33 parando para um jantar. Qual será a probabilidade que a ordem em que eles sejam colocados na mesa seja ABC? Primeiro, vamos determinar o espaço amostral para o evento. Como esses vasos podem ser colocados em qualquer ordem, e cada uma das possibilidades de ordem corresponde a um evento di- ferente – pois a ordem importa neste caso –, o espaço amostral será {ABC, ACB, BAC, BCA, CAB, CBA}. Percebam que o espaço amostral é formado por seis elementos, a permutação entre os três vasos. Portanto, a probabilidade de que os vasos tenham sido colocados na sequência ABC é de P (ABC) = 1/6. Isso se deve pela junção de todas as teorias de probabilidade. Essa jun- ção foi feita em 1933 pelo matemático russo A. N. Kolmogorov. Valor esperado Na estatística, ou Teoria das Probabilidades, o valor esperado – também chamado de esperança matemática de uma variável – é a soma do produto de cada probabilidade do evento pelo seu valor nominal. Figura 2. Andrey Kolmogorov (1903-1987). Uma fabricante de bicicletas está participando de três licitações públicas, para fornecimento de bikes para as ciclovias de uma cidade. Seus possíveis lucros são: 30, 50 e 60 mil reais, respectivamente. Como a probabilidade desse fabricante vencer as licitações são de 0,3; 0,7 e 0,2, respectivamente,
Compartilhar