Baixe o app para aproveitar ainda mais
Prévia do material em texto
PROBABILIDADE E ESTATÍSTICA PROF.ª MARIANA RODRIGUES BARBOSA DOS SANTOS SUMÁRIO AULA 01 AULA 02 AULA 03 AULA 04 AULA 05 AULA 06 AULA 07 AULA 08 AULA 09 AULA 10 AULA 11 AULA 12 AULA 13 AULA 14 AULA 15 AULA 16 INTRODUÇÃO À ESTATÍSTICA 4 TABELAS 10 GRÁFICO DE BARRAS 16 GRÁFICO DE SETORES 22 MEDIDAS DE TENDÊNCIA CENTRAL: MÉDIA, MEDIANA E MODA 28 MEDIDAS DE DISPERSÃO: DESVIO MÉDIO 35 MEDIDAS DE DISPERSÃO: VARIÂNCIA 40 MEDIDAS DE DISPERSÃO: DESVIO PADRÃO 46 COEFICIENTE DE VARIAÇÃO 51 PROBABILIDADE BÁSICA 55 EVENTOS MUTUAMENTE EXCLUSIVOS E NÃO EXCLUSIVOS E REGRAS DE PROBABILIDADE 62 EVENTOS INDEPENDENTES E EVENTOS DEPENDENTES 66 REGRA DA ADIÇÃO 72 REGRA DA MULTIPLICAÇÃO 77 PROBABILIDADE CONDICIONAL 80 DIAGRAMAS DE VENN 86 INTRODUÇÃO A Estatística é uma área de estudo que analisa dados de uma determinada população. Além de analisar, fornece-nos ferramentas para representar e orga- nizar esses dados, de forma que tais ferramentas são muito utilizadas na área de gestão para efetuar inferência e tomar decisão sobre diferentes situações. Logo, é de extrema importância o estudo da estatística para que possamos tomar as decisões corretas, refletir, controlar e utilizar corretamente as informações apre- sentadas por meio de dados. Já a Probabilidade teve sua origem em jogos de azar, mas diariamente fazemos cálculos probabilísticos intuitivamente, por exemplo, verificar a possibilidade de chover, analisar quais são as combinações de roupas disponíveis, decidir se aposta ou não na loteria, empresas utilizam a probabilidade em processos de deliberação de tarefas, enfim a probabilidade é um ramo que estuda a tomada de decisão a partir de situações que ocorrem ao acaso. Ementa: Introdução à Estatística. Estatística Descritiva: tabelas e gráficos, tabe- las de distribuição de frequência, gráficos de barras, colunas e setores; medidas de posição, médias, mediana, moda, medidas de dispersão, desvio médio, desvio padrão, coeficiente de variação; introdução à teoria da amostragem. Probabilida- des: definições básicas de probabilidade, eventos mutuamente exclusivos e não exclusivos, eventos independentes, dependentes e probabilidade condicional, teoremas de cálculo de probabilidade, teorema da soma, teorema do produto, diagrama de Venn. Variáveis aleatórias discretas. Variáveis aleatórias contínuas. Tabelas estatísticas. INTRODUÇÃO À ESTATÍSTICA AULA 01 5 Estatística é o ramo da Matemática que transforma dados em informações úteis para indivíduos responsáveis pela tomada de decisão. Sendo assim, nos aju- da a apresentar e descrever corretamente dados e informações de uma empresa, tirar conclusões de grandes populações a partir de dados de amostras e realizar prognósticos confiáveis. Vocabulário Básico de Estatística Alguns termos são utilizados com frequência em Estatística, então vamos co- nhecer quais são os principais termos adotados. • Variável Uma variável corresponde a uma característica de um item ou de um indivíduo. Está relacionada a alguma coisa que se modifica ou varia, por exemplo: vendas, lucro líquido, despesa, etc. • População Uma população consiste em todos os itens ou indivíduos em relação aos quais você deseja tirar uma conclusão. • Amostra Uma amostra corresponde à parcela da população selecionada para análise. • Parâmetro Um parâmetro é uma medida numérica que descreve uma característica de uma população. Agora que você já conhece os principais termos utilizados em estatística, vamos conhecer quais são os tipos de variáveis utilizadas. Variáveis Estatísticas As variáveis estatísticas podem ser classificadas em dois grupos: variáveis qua- litativas e variáveis quantitativas. • Variáveis Qualitativas As variáveis qualitativas são as que descrevem qualidades da amostra analisada. Elas podem ser classificadas em: Nominais e Ordinais. 6 • Variáveis Qualitativas Nominais As variáveis qualitativas nominais classificam os dados em categorias distintas, nas quais não está implícito nenhum tipo de classificação. Não existe ordenação dentro das categorias. Por exemplo: a cor dos olhos de uma determinada população, não existe ordenação em relação à cor dos olhos, ou seja, não conseguimos classi- ficar qual cor de olho vem primeiro em grau de importância. • Variáveis Qualitativas Ordinais As variáveis qualitativas ordinais classificam dados em categorias distin- tas, nas quais está implícita uma classificação. Existe ordenação dentro das categorias. Por exemplo: o tipo de seleção de atendimento em pronto-socorro é feito a partir da análise de uma variável qualitativa ordinal, o estado de saúde do paciente, então os pacientes são classificados em ordem de prioridade, tem-se a classificação de riscos: casos leves, casos menos graves, casos de urgência, casos muito urgentes e casos de emergência. • Variáveis Quantitativas As variáveis quantitativas representam características que podem ser representadas numericamente. Tais variáveis também são classificadas em dois grupos: Discretas e Contínuas. • Variáveis Quantitativas Discretas As variáveis quantitativas discretas apresentam valores numéricos que surgem de um processo de contagem. Por exemplo: quantidade de pessoas que frequentam o ensino superior. • Variáveis Quantitativas Contínuas As variáveis quantitativas contínuas produzem respostas numéricas que surgem de um processo de mensuração. Por exemplo: a taxa de açúcar presente no sangue pode ser obtida a partir de um processo de mensuração, ou seja, é preciso medir quanto tem de açúcar no sangue. 7 A Figura 1 apresenta a diferença entre os tipos de variáveis estatísticas. Figura 1- Variáveis Estatísticas Fonte: Canal Youtube: Ciência Exata Exemplos: 1) Para cada uma das variáveis seguintes, determine se a variável é qualitativa ou quantitativa. Classifique-as. • Número de telefones por domicílio. • Para verificar a quantidade de telefones que os domicílios possuem é necessário efetuar um processo de contagem de telefones por casa, logo temos uma variável quantitativa discreta. • Duração (em minutos) da chamada de longa distância mais demorada, a cada mês. • Para determinar a duração em minutos de uma chamada precisamos de um instrumento de medida, logo temos uma variável quantitativa contínua. • Se alguém no domicílio possui telefone celular. • Esta resposta pode ser dada somente com sim ou não, logo é uma qua- litativa nominal. 8 Exemplo: 2) Para cada uma das variáveis seguintes, determine se a variável é qualitativa ou quantitativa. Se a variável for quantitativa, determine se a variável é discreta ou contínua. a) Número de telefones por domicílio. b) Para verificar a quantidade de telefones que os domicílios possuem é necessário efetuar um processo de contagem de telefones por casa, logo temos uma variável quantitativa discreta. c) Duração (em minutos) da chamada de longa distância mais demorada, a cada mês. d) Para verificar a duração (em minutos) de uma chamada de longa dis- tância, precisamos de um instrumento de medidas, logo a variável é quantitativa contínua. e) Se alguém no domicílio possui telefone celular. f) Para responder a essa questão, podemos apenas dizer “sim” ou “não”, logo temos uma variável qualitativa nominal. g) Se existe, no domicílio, uma conexão de internet de banda larga. Para responder a essa questão, podemos apenas dizer “sim” ou “não”, logo temos uma variável qualitativa nominal. 3) As seguintes informações são coletadas de alunos na saída da livraria do campus universitário, ao longo da primeira semana de aulas: • Quantidade de tempo gasto fazendo compras na livraria. • Número de livros didáticos comprados. • Área de especialização do aluno. • Sexo do aluno. Isto acontece na prática Você já deve ter passado em um pronto atendimentoe após a triagem foi classificado em um grupo de risco. As classificações de riscos são fei- tas, na maioria das vezes, como: não urgente, pouco urgente, urgente, emergência. Como temos uma ordem de classificação, temos uma variá- vel qualitativa ordinal. No seu cotidiano você está rodeado de variáveis aleatórias quantitativas e qualitativas. 9 Classifique cada uma dessas variáveis como qualitativas ou quantitativas. • Quantidade de tempo gasto fazendo compras na livraria. Variável quantitativa contínua, pois é feita a partir de um processo de mensuração. • Número de livros didáticos comprados. Variável quantitativa discreta, pois surge de um processo de contagem. • Área de especialização do aluno. Variável qualitativa nominal, pois dentro do grupo especialização, não há uma ordem de classificação das especializações. • Sexo do aluno. Variável qualitativa nominal, pois não existe uma ordem de classificação. 10 TABELAS AULA 02 11 Porcentagem Em estudos de Probabilidade e Estatística é imprescindível estudar o cálculo das porcentagens, pois nas duas áreas citadas tal conhecimento é muito impor- tante e utilizado. Há várias formas de calcular a porcentagem, vamos trabalhar o cálculo de porcentagens a partir da regra de três. Entendemos por porcentagem a razão centesimal utilizada para expressar situações envolvendo valores comparativos. É muito comum utilizar a regra de três simples para o cálculo de porcentagens. Quando utilizamos a regra de três simples, sempre conhecemos três valores e buscamos encontrar um quarto valor, porém em muitas situações é comum não conhecermos três valores e sim apenas dois, é muito comum isto acontecer no cálculo de porcentagens e um recurso muito utilizado é conhecer o total que estamos trabalhando, pois sabemos que o total sempre representa 100% em porcentagem. Podemos representar porcentagem através de fração e número decimal. Veja a Tabela 1: Tabela 1- Transformação de porcentagem em número decimal e fração irredutível Porcentagem % Número Decimal Fração Irredutível 12% 0,12 12 :4 100:4 3 25 = 40% 0,40 = 0,4 40 :20 100:20 2 5 = 210% 2,10 = 2,1 210 :10 100:10 21 10 = 5% 0,05 5 :5 100:5 1 20 = Fonte: Desenvolvido pela autora Para escrever uma porcentagem em forma de número decimal, basta copiar o número representado pela porcentagem e “andar duas casas com a vírgula” para direita. Caso não tenham duas casas para andar com a vírgula, acrescente zeros. Para escrever a fração irredutível coloque no numerador o número referente à porcentagem e no denominador 100, pois porcentagem considera o todo dividido 12 em 100 partes. Sempre que possível, simplifique a fração, dividindo o numerador e o denominador pelo mesmo número. Exemplo: 1) Em uma promoção uma calça que custa 80 reais está sendo vendida com 16 reais de desconto, qual a porcentagem de desconto dessa calça? Neste caso temos apenas dois valores conhecidos, o preço da calça e o valor do desconto, porém iremos utilizar a informação do valor total da calça que corres- ponde a 100% do preço da calça. Lembre-se que quando trabalhamos com regra de três, simples ou composta, precisamos analisar se as grandezas são diretas ou inversamente proporcionais. Neste caso, as grandezas são diretamente propor- cionais, então precisamos apenas efetuar a multiplicação em cruz. Preço Porcentagem 80 100 16 x Multiplicando os valores em cruz, fazemos: 80x = 16.100 80x = 1600 x = 20 % Logo, a porcentagem de desconto será de 20%. 2) Uma mercadoria custava R$300,00 e teve um aumento de 20%. Como as vendas caíram a mercadoria teve um desconto de 20%. Qual o preço da merca- doria considerando o desconto? Tenha cuidado nesse exercício para não dizer que o preço permaneceu R$300,00. Quando obtemos uma nova quantidade, a porcentagem se altera para essa nova quantidade. Então, vamos calcular quanto representa 20% de R$300,00 e descobrir o valor em reais do aumento. Preço Porcentagem 300 100 x 20 100x = 6000 x = 60 reais de aumento Logo, o novo preço será de R$360,00. 13 Sobre os R$360,00 iremos calcular 20% e obter o valor em reais do desconto. Preço Porcentagem 360 100 x 20 100x = 7200 x = 72 reais Logo o novo preço do produto, considerando o desconto de R$72,00 será: 360 – 72 = 288 reais. Tabelas As tabelas indicam cada valor distinto de uma variável, juntamente com uma contagem do número de vezes que esse valor ocorre, esta contagem é denomi- nada de frequência. As tabelas de frequência podem apresentar as porcentagens relativas às frequências. Regras para a construção de uma tabela • Na construção de uma tabela os dados são apresentados em linhas e colunas. • A tabela deve ser simples e autoexplicativa. • Nenhuma casa da tabela deve ficar em branco. • Os totais devem ser destacados. • O título aparece sempre na parte superior da tabela e deve ser claro. • Frequência absoluta: Frequência Absoluta de um valor é o número de vezes em que uma determinada variável assume um valor. • A frequência relativa apresenta a porcentagem de observações. Isto acontece na prática Em artigos científicos as tabelas são muito utilizadas para demonstração de resultados e comprovação de teses através de dados numéricos, logo é importante saber construir uma tabela de forma clara e que transmita resumidamente os dados. 14 2) Numa faculdade pretende-se analisar a classificação de 80 alunos no 1º se- mestre. Para isso, uma tabela de frequência e porcentagem foi construída. Nível de classificação Frequência absoluta Frequência relativa Nível 1 20 Nível 2 10 Nível 3 30 Nível 4 15 Nível 5 5 Total 80 Precisamos preencher a última coluna da frequência relativa. Lembre-se que frequência relativa representa a porcentagem. Para calcular a porcentagem de cada frequência absoluta, vamos fazer regra de três. Isto acontece na prática Exemplo A Tabela 2 apresenta os dados obtidos a partir do levantamento de vendas em uma concessionária e preencha os campos em branco na tabela. Tabela 2: Vendas na concessionária Veículos Frequência absoluta Frequência relativa Carros 150 Motos 200 Caminhões 50 Fonte: Elaborada pela autora Para a construção da tabela, você preencherá a coluna de frequência relati- va utilizando regra de três. Lembre-se o total (100%) será 150+200+50 = 400. 15 Nível 1 Frequência Absoluta Porcentagem 80 100 20 x 80x = 2000 x = 25% Nível 2 Frequência Absoluta Porcentagem 80 100 10 x 80x = 1000 x = 12,5% Nível 3 Frequência Absoluta Porcentagem 80 100 30 x 80x = 3000 x = 37,5% Nível 4 Frequência Absoluta Porcentagem 80 100 15 x 80x = 1500 x = 18,75% Nível 5 Frequência Absoluta Porcentagem 80 100 5 x 80x = 500 x = 6,25% 16 GRÁFICO DE BARRAS AULA 03 17 Os gráficos transmitem informações numéricas de forma simplificada, facilitan- do a compreensão de tais informações. Os gráficos podem ser de: linha, colunas, barras, setores, áreas, em rede e pictogramas. Os gráficos de barras representam os dados através de retângulos, com o intuito de analisar as projeções no período determinado. As barras podem ser verticais ou horizontais. Se as barras forem verticais, no eixo horizontal colocaremos as variáveis qualitativas e no eixo vertical as variáveis quantitativas. As variáveis quantitativas podem ser expressas a partir de porcen- tagens (frequência relativa) ou quantidades numéricas (frequência absoluta). Se as barras forem horizontais, no eixo vertical colocaremos as variáveis qualitativas e no eixo horizontal, as variáveis quantitativas. É importante que num gráfico de barras, as colunas tenham a mesma largura e a altura de cada barra, ou coluna, deve ser proporcional à frequência (relativa ou absoluta) à qual a variável se refere. O título, assim como na tabela, deve ser claro e representar corretamente a informação do gráfico. É comum alguns gráficos de barras apresentarem mais de uma informação. Neste caso, as colunas são justapostas.Por este motivo é imprescindível a legenda em um gráfico. O gráfico de barras a seguir, é um gráfico no qual as variáveis qualitativas são apresentadas no eixo vertical. Gráfico 1- Opinião de estudantes de Engenharia Civil sobre a extensão da prova ENADE Fonte: MATTOS, Viviane Leite de, AZAMBUJA, Ana Maria de KONRATH, Andréa Cristina. Introdução à Estatística - Aplicações em Ciências Exatas 18 O Gráfico 2 exemplifica um gráfico de colunas justapostas. Gráfico 2- Opinião de estudantes de Engenharia Civil sobre a extensão da prova ENADE, compa- rativo entre respondentes da FURG e Brasil Fonte: MATTOS, Viviane Leite de, AZAMBUJA, Ana Maria de, KONRATH, Andréa Cristina. Introdução à Estatística - Aplicações em Ciências Exatas. O Gráfico 3 exemplifica um gráfico de barras horizontais. Gráfico 3- Gráfico de barras horizontais Fonte: Wikipedia Isto está na rede Segue um link para a construção de gráficos utilizando o Excel. Essa fer- ramenta será muito útil para seus trabalhos. https://www.youtube.com/watch?v=ArjZJXEEa9o 19 Exemplo: 1) O Gráfico 4 mostra o resultado de uma pesquisa sobre a atividade de lazer preferida de um grupo de pessoas. Gráfico 4- Atividade de Lazer Preferida Fonte:Desenvolvido pela autora A partir do Gráfico 4 podemos construir uma tabela com as informações. Va- mos adicionar uma coluna extra com as porcentagens correspondentes de cada quantidade. Para calcular as porcentagens, vamos fazer regra de três. Esportes Frequência Absoluta Porcentagem 39 100 12 x 39x = 1200 x = 30,76% Leitura Frequência Absoluta Porcentagem 39 100 6 x 39x = 600 x = 15,38% 20 Passeio Frequência Absoluta Porcentagem 39 100 8 x 39x = 800 x = 20,51% TV Frequência Absoluta Porcentagem 39 100 5 x 39x = 500 x = 12,82% Videogame Frequência Absoluta Porcentagem 39 100 8 x 39x = 800 x = 20,51% Agora que possuímos os valores das porcentagens podemos construir a tabela do Gráfico 4. Atividade Frequência Absoluta Frequência Relativa Esporte 12 30,76% Leitura 6 15,38% Passeio 8 20,51% TV 5 12,82% Videogame 8 20,51% Total 39 100% 21 2) Uma mercadoria custava R$700,00 em maio. Em junho, sofreu um aumento de 10%. Em julho, por causa de uma redução de impostos, o preço sofreu queda de 10%. De acordo com as informações, responda: a. Qual era o preço em junho? R$ Porcentagem 700 100 x 10 100x = 7000 x = 70 Como 10% é referente ao aumento corresponde a R$70,00, o preço da merca- doria passou a ser R$770,00. b Qual era o preço em julho? Frequência Absoluta Porcentagem 770 100 x 10 100x = 7700 X = 77 Logo a queda foi de R$77,00, então o preço em julho é de R$693,00. 22 GRÁFICO DE SETORES AULA 04 23 Gráfico de setores também conhecido como gráfico de pizza Fonte: https://pixabay.com/pt Nesta aula apresentaremos o gráfico de setores. Este tipo de gráfico é utilizado quando queremos representar as informações através de porcentagens. Para a construção do gráfico de setores, consideramos 100% como sendo 360° e então calculamos o ângulo correspondente à cada quantidade apresentada. Veja abaixo o gráfico de setores referente ao Gráfico 1. Gráfico 5- Opinião de estudantes de Engenharia Civil sobre a extensão da prova ENADE Fonte: Desenvolvido pela autora Temos um total de 4050 respondentes, sendo que 250 classificaram a prova como curta. Como 4050 representa 100% e 360º é a área total do setor, primeiro calculamos qual a porcentagem correspondente a 250. 24 Respondentes Porcentagem 4050 100 250 x Logo, concluímos que é 6,17%. O que está representado, aproximadamente, no gráfico como 6%. Respondentes Ângulo 4050 360° 250 x Efetuando os cálculos concluímos que o ângulo correspondente aos respon- dentes “Curto” é de 22°. As pessoas que responderam que a prova é muito curta foram 1%, temos: Ângulo % 360º 100% x 1 100x = 360 x = 3,6° Adequada: 56% Ângulo % 360º 100% x 56% 100x = 20160 x = 201,6° Longa: 25% Ângulo % 360º 100% x 25% 100x = 9000 x = 90° 25 Muito longa: 12% Ângulo % 360º 100% x 12% 100x = 4320 x = 43,2° Anote isso Você pode também, a partir de um valor de ângulo dado, calcular a quan- tidade ou porcentagem correspondente, estamos utilizando regra de três simples. Vamos construir um gráfico de setores a partir do Gráfico 4. Temos tanto as porcentagens quanto as quantidades, vamos então calcular os valores dos ângulos correspondentes. Esportes: 12 respondentes Frequência Absoluta Ângulo 39 360° 12 x 39x = 4320 x = 110,7° Leitura: 6 respondentes Frequência Absoluta Ângulo 39 360° 6 x 39x = 2160 x = 55,3° 26 Passeio: 8 respondentes Frequência Absoluta Ângulo 39 360° 8 x 39x = 2880 x = 73,8° TV: 5 respondentes Frequência Absoluta Ângulo 39 360° 5 x 39x = 1800 x = 46,1° Videogame: 8 respondentes Frequência Absoluta Ângulo 39 360° 8 x 39x = 2880 x = 73,8° Atenção que a soma de todos os ângulos encontrados tem que ser aproxi- madamente 360º, falamos aproximadamente, pois muitas casas decimais foram descartadas quando aproximamos os valores dos ângulos. Então, somando os valores temos: 110,7°+ 55,3°+73,8°+46,1°+73,8° = 359,7° Veja que tivemos uma pequena diferença entre o valor total de 360°, pois como citado anteriormente, desconsideramos várias casas decimais que causaram essa diferença numérica. 27 Atividade Frequência Absoluta Frequência Relativa Ângulo Esporte 12 30,76% 110,7° Leitura 6 15,38% 55,3° Passeio 8 20,51% 73,8° TV 5 12,82% 46,1° Videogame 8 20,51% 73,8° Total 39 100% 359,7° Agora que temos os valores dos ângulos vamos construir o gráfico de setores. Gráfico 6- Atividade de Lazer Preferidas Fonte: Desenvolvido pela autora Observe que as porcentagens de Passeio e Videogame deram diferentes (de- veriam ser iguais), pois o Excel fez aproximações. 28 MEDIDAS DE TENDÊNCIA CENTRAL: MÉDIA, MEDIANA E MODA AULA 05 29 Em Estatísticas temos as medidas descritivas que nos permite analisar como os dados estão distribuídos ao longo da amostra, ou seja, podemos analisar a tendência de comportamento das variáveis. Média A média aritmética (também conhecida como média) é a medida de tendência central mais comum. A média aritmética é a única medida comum na qual todos os valores desempenham igual papel. Calcula-se a média aritmética por meio da soma de todos os valores numéricos observados para uma variável em um conjunto de dados, seguida pela divisão desse total pelo número de valores no conjunto de dados. (1) Em que: : média : valor da variável n = total de dados Na Matemática, (somatório) é um símbolo utilizado para indicar a soma de todos os valores. Exemplo: 1) Uma pessoa calculou o tempo necessário para chegar ao trabalho desde o momento que sai de sua casa. Para isso ela coletou os dados durante 14 dias, veja os dados na Tabela 3, os dados são apresentados em minutos: Tabela 3- Tempo para chegar no trabalho Dia 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Tempo 15 16 17 12 11 14 15 18 16 17 13 14 16 17 Fonte: Desenvolvido pela autora Para calcular a média de tempo que a pessoa gasta para chegar ao trabalho, primeiramente, devemos somar todos os valores correspondentes ao tempo e depois dividir pelo total de valores disponíveis. 30 No nosso conjunto de dados, chamaremos o primeiro termo do conjunto de dados, ou seja, = 15, x2 o segundo termo do conjunto de dados, x2 = 16 e assim sucessivamente até o x14 = 17. Concluímos que em média essa pessoa leva 15,07 minutos para ir de sua casa até o trabalho. A média pode ser um valor diferente de todos os valores presente no conjunto de dados, isto se deve ao fato da média ser um valor representativo do conjunto de dados. Observe o exemplo a seguir para o cálculo da média. Exemplo: 2) Uma indústria fabrica parafusos. As caixas devem conter 100 parafusos cada. Porém, é tolerável que algumas caixas tenham parafusos a mais ou a menos que a quantidade esperada. A seguir são apresentados os dados referentes a uma amostrade 30 caixas e a quantidade de parafusos em cada. Tabela 4- Quantidade de parafusos por caixa Caixa Quantidade de Parafusos 1 100 2 99 3 101 4 100 5 100 6 98 7 102 8 101 9 100 31 Caixa Quantidade de Parafusos 10 99 11 102 12 100 13 103 14 99 15 99 16 100 17 100 18 103 19 95 20 98 21 100 22 101 23 100 24 102 25 99 26 98 27 100 28 100 29 101 30 99 Fonte: Desenvolvido pela autora Nesse exemplo, percebemos que alguns valores se repetem com frequência, então somar todos os valores pode ser um trabalho mais complexo, neste tipo de conjunto de dados dizemos que os dados estão agrupados, logo, é mais simples verificar com que frequência cada dado aparece. Vamos construir uma tabela, adicionando uma coluna referente à frequência de cada dado. 32 No caso de caso de dados agrupados, calculamos a média de acordo com apresentado em (2): (2) Onde Fi representa a quantidade de vezes que o dado i aparece, logo o cálculo da média para dados agrupados ficará da seguinte forma: Logo, em média, as caixas contêm 99,99 parafusos, ou seja, muito próximo da quantidade esperada de parafusos. Moda A moda é o valor que aparece com mais frequência em um conjunto de dados. Em um conjunto de dados podem existir várias modas, ou seja, se dois ou mais valo- res aparecem com a mesma frequência no conjunto de dados, todos serão a moda. Anote isso Frequência é a quantidade de vezes que um determinado valor aparece no conjunto de dados. Tabela 5- Quantidade de parafusos: frequência Quantidade de Parafusos Frequência 95 1 98 3 99 6 100 11 101 4 102 3 103 2 Total 30 Fonte: Desenvolvido pela autora 33 Exemplo 1) Observe as séries de dados a seguir e indique qual é a moda: a. 2, 3, 4, 7, 10 Observe que este conjunto de dados não existe valor que apareça mais de uma vez, logo, o conjunto de dados não possui moda, dizemos que o conjunto de dados é amodal. b. 2, 3, 3, 5, 6, 7 Já neste conjunto de dados podemos perceber que o número 3 aparece com maior frequência que os outros dados, logo a moda é 3. c. 6, 12, 12, 15, 17, 17 Neste conjunto de dados podemos ver que o número 12 aparece com frequên- cia 2 e o número 17 também aparece com frequência 2, logo 12 e 17 representam a moda do conjunto de dados. d. 1, 3, 4, 4, 6, 7, 7, 7, 9, 10, 10 Neste conjunto de dados os valores 4, 7 e 10 se repetem, porém, a moda é representada pelo valor ou pelos valores que aparecem com maior frequência, logo, o número 7 é a moda, pois aparece com frequência 3, enquanto 4 e 10 apa- recem com frequência 2. Mediana A mediana é o valor central em um conjunto ordenado de dados. Para calcular a mediana para um conjunto de dados você inicialmente ordena os valores do menor para o maior e, depois, utiliza as seguintes regras: Regra 1: Se existir uma quantidade ímpar de valores no conjunto de dados, a mediana corresponde ao valor que está no meio na ordem de classificação. Regra 2: Se existir uma quantidade par de valores no conjunto de dados, a mediana corresponde à média entre os dois valores que estão no meio da ordem de classificação. Exemplo: 1) Calcule a mediana nos seguintes casos: a. 54, 74, 21, 01, 12, 33, 03, 76, 40, 56, 89, 102, 04 Para calcular a mediana é importante que os dados estejam em ordem, então antes de iniciar o cálculo vamos ordenar os dados. 34 01, 03, 04, 12, 21, 33, 40, 54, 56, 74, 76, 89, 102. Agora que os dados já estão ordenados, verificamos que temos 13 números, logo, uma quantidade ímpar de números, então utilizaremos a Regra 1. Portanto, a mediana é o número 40, pois separa o conjunto de dados ao meio, 6 termos para cada lado e o termo central é 40. b. 45, 12, 100, 05, 34, 02, 09, 19, 29, 01. Ordenando os dados, temos: 01, 02, 05, 09, 12, 19, 29, 34, 45, 100. Como temos uma quantidade par de números utilizaremos a Regra 2. Os dois valores que estão no meio na ordem de classificação são 12 e 19, quatro termos para cada lado e 12 e 19 como termos centrais, então calculando a média entre 12 e 19 temos: Logo a mediana é 15,5. Fonte: https://pixabay.com 35 MEDIDAS DE DISPERSÃO: DESVIO MÉDIO AULA 06 36 Ainda na análise de tendência central, outro valor importante é o Desvio Mé- dio. Ele nos informa a diferença entre cada número do conjunto de dados e a média. Calculamos o Desvio Médio a partir da fórmula apresentada em (3): (3) Onde: di representa o valor do desvio de cada valor xi em relação à média . Anote isso Os desvios xi baixos representam que temos pouca dispersão de dados, por outro lado se os desvios forem altos, a dispersão dos dados é grande, ou seja, quando há grande dispersão de dados, o conjunto de dados não é uniforme, porém para analisar essa dispersão, iremos estudar nas próxi- mas seções as medidas de dispersão: variância e desvio padrão. Exemplo: 1) Dado o conjunto de dados: 2, 3, 7, 8, 14, 20 e 35 Calcule o desvio médio referente a cada dado. Para calcular o desvio médio é necessário calcular a média do conjunto de dados. Vamos adotar para a resolução do exemplo uma casa decimal, então Agora que já calculamos a média, vamos calcular cada desvio médio. 37 Analisando os desvios médios podemos perceber que x5 = 14 é o valor mais próximo da média, pois seu desvio médio é d5 = 1,3 e x7 = 35 é o valor mais distante da média, pois seu desvio médio d7 = 22,3. Propriedade da Média (4) A propriedade apresentada em (4) nos mostra que o somatório dos desvios médios é nulo. Observando o exemplo 1 podemos confirmar que a propriedade é verdadeira, veja: O resultado que encontramos é 0,1 essa diferença ocorre porque na resolução do exemplo adotamos apenas uma casa decimal para 12,7142..., se utilizarmos mais casas decimais chegaremos a um resultado mais próximo de zero, que é o que a propriedade nos diz. Os desvios médios medem quando um dado em específico se afasta da média. A seguir, vamos calcular os quartis que são dados não relacionados com a média, mas que mostram como o conjunto de dados está dividido. Quartis Quartis dividem um conjunto de dados em quatro partes iguais: Primeiro quar- til,Q1 : 25% dos valores são menores ou iguais a Q1. Terceiro quartil, Q3 : 75% dos valores são menores ou iguais a Q3. Figura 2- Distribuição dos quartis Fonte: Desenvolvido pela autora 38 Podemos observar na Figura 2 que o quartil divide a distribuição dos dados em quatro partes iguais: Q1;Q2;Q3, primeiro, segundo e terceiro quartil respecti- vamente. O primeiro quartil, Q1 é o número que deixa 25% das observações abaixo desse valor e 75% das observações acima desse valor, o segundo quartil, Q2 é o número que deixa 50% das observações abaixo e 50% das observações acima e o terceiro quartil, Q3 é o número que deixa 75% das observações abaixo e 75% das observações acima. Cálculo do Quartil Para calcular o primeiro e o terceiro quartil utilizamos as fórmulas a seguir. Não utilizaremos fórmulas para calcular o segundo quartil, pois ele corresponde à mediana que já foi apresentado o cálculo na aula 5. As fórmulas (5) e (6) são para calcular a posição dos quartis e não o valor dos quartis em si. (5) Em que é a posição do quartil 1. (6) Em que é a posição do quartil 3. Em que n é a quantidade de termos na distribuição de dados. O cálculo do quartil fornecerá como resultado a posição do número no con- junto de dados. Esse cálculo pode fornecer um número exato ou decimal, logo utilizaremos as duas regras a seguir para decidir qual número devemos escolher. • Regra 1: se o resultado corresponder a um número inteiro, então o quartil é igual ao valor na ordem de classificação. • Regra 2: se o resultado for uma parte fracionária (2,5;4,5; 3,25; 4,75, etc.), então o quartil é igual à medida entre os valores correspondentes na ordem de classificação. Exemplo: 1) Calcular o primeiro e terceiro quartil do conjunto de dados. 39, 29, 43, 52, 39, 44, 40, 31, 44, 35 Paraefetuar o cálculo dos quartis devemos colocar os números em ordem: 29, 31, 35, 39, 39, 40, 43, 44, 44, 52 39 Vamos calcular a posição do primeiro quartil: Logo, o primeiro quartil ocupa a posição 2; 75 do conjunto de dados, como essa posição não existe, calcularemos a média dos termos que ocupam a segunda e a terceira posição na distribuição numérica. Logo, o primeiro quartil é 33, ou seja, abaixo do 33 estão 25% dos menores valores da distribuição de dados. Agora, vamos calcular a posição do terceiro quartil: Logo, o terceiro quartil ocupa a posição 8,25 do conjunto de dados, como essa posição não existe calcularemos a média dos termos que ocupam a oitava e a nona posição na distribuição numérica. O terceiro quartil é o número 44, ou seja, acima do 44 estão 25% dos maiores valores da distribuição de dados. Anote isso Observe que a média entre os valores pode ser um número decimal, o que não pode ser um número decimal é a posição do quartil. 40 MEDIDAS DE DISPERSÃO: VARIÂNCIA AULA 07 41 As medidas de tendência central vistas: média, mediana e moda são impor- tantes para analisar um conjunto de dados, porém não suficientes para retratar a homogeneidade ou heterogeneidade dos nossos valores. Dizer que a média de parafusos por caixa é 99,99 não nos fala o quanto esses parafusos estão dispersos por caixa, podem haver variações entre caixas com muitos parafusos e caixas com pouco parafusos. No exemplo que resolvemos sobre a média de parafusos na cai- xa, vimos que há uma tolerância para maior quantidade de parafusos ou menor quantidade de parafusos por caixa, mas não foi dito qual é essa tolerância. Com a tolerância dada e as informações sobre a variação desses dados conseguiremos dizer quais dados são realmente importantes na análise. Anote isso Duas medidas de variação habitualmente utilizadas que levam em consi- deração o modo como todos os valores nos dados estão distribuídos são a variância e o desvio padrão. Essas estatísticas medem a dispersão “média” em torno da média aritmética. Neste capítulo dedicaremos atenção à análise da Variância e posteriormente à construção do gráfico boxplot ou diagrama da caixa como também é conhecido. Dado um conjunto de dados, a variância é uma medida de dispersão que mos- tra o quão distante cada valor desse conjunto está do valor central (médio). Quan- to menor a variância, mais próximo os valores estão da média. (5) Onde S² representa a variância. Na variância utilizamos os dados dos desvios médios calculados no capítulo anterior. Exemplo: 1) Calcule a variância dos dados a seguir: 5, 7, 8, 10, 15 Para calcular a variância, vamos construir uma tabela. Lembre-se que para calcular a variância necessitamos da média 42 Tabela 6 - Cálculo da variância Fonte: Desenvolvido pela autora Agora que temos , vamos dividir o resultado por n-1. Lembre-se que n = 5. Logo a variância é 14,5, dizemos que S² = 14,5. Gráfico Boxplot Na aula 6 você estudou sobre os quartis, que separam o conjunto de dados em quatro partes iguais. Usaremos esses cálculos para construir um gráfico de distribuição de dados, o gráfico boxplot. O boxplot ou diagrama da caixa é um gráfico utilizado para avaliar a distribui- ção dos dados de um conjunto de dados. Para isso, precisamos de alguns valores importantes, eles são: valor mínimo do conjunto de dados, primeiro quartil, me- diana, terceiro quartil e o valor máximo. A partir do boxplot podemos identificar os valores chamados de outliers, ou seja, os valores que estão fora do limite de mínimo e máximo do conjunto de dados. 43 Veja a Figura 3 que mostra um boxplot e os valores importantes para serem colocados nele: Figura 3: Boxplot Fonte: Desenvolvido pela autora Veja a seguir um passo a passo para a construção do boxplot: 1. Calcule primeiro quartil, mediana e terceiro quartil. 2. Calcule a amplitude interquartil: AIQ = Q3 – Q2 3. Calcule a separação de valores atípicos: Q1 -1,5.AIQ e Q3 +1,5.AIQ 4. Construa uma linha vertical e localize estes valores em uma escala apro- priada. 5. Construa um retângulo que vá do primeiro ao terceiro quartil. 6. Dentro do retângulo trace uma linha na mediana. 7. Traçar uma linha do Q1 até o valor mínimo do conjunto de dados e do Q3 até o valor máximo do conjunto de dados. 8. Complete o boxplot com os valores atípicos. 44 Exemplos: 1) Dado o conjunto de dados Construa o boxplot do conjunto de dados: Seguindo os passos para a construção do boxplot precisaremos calcular: me- diana, primeiro quartil, terceiro quartil, amplitude interquartil e a separação entre os valores atípicos. Temos então os dados necessários: Mediana: 5; Primeiro quartil:4; Terceiro quartil: 8; Amplitude interquartil: AIQ = Q3 - Q1 = 8 - 4 = 4; Agora vamos calcular a separação de valores: Q1 – 1,5.AIQ = 4 – 1.5.4 = -2; Q3 + 1,5.AIQ = 8 + 1,5.4 = 14; Com os valores necessários calculados, podemos construir o gráfico boxplot. Figura 4- Gráfico Boxplot Fonte: Desenvolvido pela autora 45 Observe que quando encontramos a separação dos valores típicos, não que- remos números menores que -2, olhando no conjunto de dados, não temos nú- meros menores que -2, logo o valor mínimo será 3. E na separação de valores não queremos valores maiores que 14, no conjunto de dados dois valores são maiores que 14: 15 e 17, então excluímos estes valores e ficamos com o valor máximo do conjunto de dados: 10. Observe que apesar de 15 e 17 serem excluídos são registrados no gráfico boxplot. Fonte: https://pixabay.com 46 MEDIDAS DE DISPERSÃO: DESVIO PADRÃO AULA 08 47 O Desvio Padrão indica a medida da variação dos dados em torno da média. Quando calculamos o desvio médio, verificamos o quão distante cada dado está da média, enquanto o desvio padrão indica a dispersão de todos os dados em torno da média, ou seja, analisa o conjunto de dados por inteiro. Para calcular o desvio padrão você precisará calcular a variância, pois o desvio padrão é a raiz quadrada da variância. Ou utilizando a fórmula apresentada em (6): (6) Em que S é o desvio padrão da amostra. Os desvios padrões nunca indicarão números negativos. Caso o desvio padrão dê zero, significa que todos os valores são iguais, ou seja, não há variação. Quanto maior o desvio padrão, mais distantes os dados estão da média. Quanto menor o desvio padrão, mais perto os dados estão da média. Exemplo: 1) No Capítulo 7 resolvemos um exemplo para o cálculo da variância. Vamos calcular o desvio padrão do mesmo conjunto de dados. Para calcular o desvio padrão não precisamos efetuar todos os cálculos no- vamente, como já temos o valor da variância, basta tirar a raiz quadrada desses valores. S² = 14,5 Utilizando (6) temos: 2) Uma empresa fez uma pesquisa para analisar o perfil de seus trabalhado- res. Um dos tópicos da pesquisa era analisar a idade de seus funcionários que trabalham no setor de logística. O responsável pelo RH da empresa apresentou os dados, representados na Tabela 7. 48 Tabela 7- Idades dos funcionários que trabalham no setor de logística Idade Frequência 18 3 19 4 21 5 26 4 27 5 32 2 Fonte: Desenvolvido pela autora Para calcular o desvio padrão precisamos calcular a variância. Antes observe que as idades se repetem, calcular a variância para cada dado a quantidade de vezes que ele se repete será um pouco extenso, então nos concentraremos em calcular apenas das idades diferentes. Apenas fique atento, pois todos os dados e suas frequências serão considerados. Calculando a média, temos: Vamos utilizar apenas uma casa decimal, portanto 23,3. Agora, utilizando a fórmula (5) vamos calcular a variância. 49 Calculada a variância, calcularemos o desvio padrão. A Figura 5 mostra um exemplo de amostras de duas populações com médias iguais e desvios padrões diferentes. A população representada em vermelho tem média 100 e desvio padrão 10. A populaçãorepresentada em azul tem média 100 e desvio padrão 50. Figura 5- Desvio padrão para uma amostra Fonte: Wikipédia 3) Calcule o desvio padrão do conjunto de dados: Tabela 8- Dados para o desvio padrão Dado Valor x1 1 x2 2 x3 3 x4 4 x5 5 Fonte: Desenvolvido pela autora 50 Para calcular o desvio padrão, precisamos calcular a variância. Primeiramente, devemos calcular a média: Agora vamos calcular Tabela 9- Cálculo de Variância e Desvio Padrão Fonte: Desenvolvido pela autora Observe neste exemplo que a soma dos desvios médios resultou em zero. Isto se deve ao fato de não aproximarmos a média, já que ela foi um número inteiro. Agora, utilizando a fórmula (5) vamos calcular a variância. Calculada a variância, calcularemos o desvio padrão. 51 COEFICIENTE DE VARIAÇÃO AULA 09 52 Quando calculamos o desvio padrão e a variância, analisamos a variação dos dados em torno da média. O coeficiente de variação, por sua vez, calcula a disper- são relativa dos dados, ou seja, expressa a dispersão em forma de porcentagem. Calculamos o coeficiente de variação a partir da fórmula (7): (7) Onde: : coeficiente de variação S: desvio padrão : média Anote isso Valor absoluto está relacionado à quantidade de vezes que uma variável aparece em um conjunto de dados e valor relativo está relacionado à por- centagem que o valor absoluto representa. Por isso, que o coeficiente de variação representa uma porcentagem. Exemplos: 1) Vamos calcular o coeficiente de variação do exemplo resolvido no capítulo 7. Temos: Aplicando a fórmula apresentada em (7): 53 De acordo com Martins, podemos analisar os resultados obtidos com os coe- ficientes de variação da seguinte forma: Se : há baixa dispersão Se há média dispersão Se : há elevada dispersão Logo, o exemplo resolvido 1 há elevada dispersão. 2) Vamos calcular do exemplo 2 do capítulo 8. Logo, a idade dos funcionários do setor de logística tem média dispersão. 3) Vamos calcular o coeficiente de variação do exemplo 3 do capítulo 8. 4) Calcule o coeficiente de variação do conjunto de dados: 2,4,6,8 54 Para calcular o coeficiente de variação precisamos do desvio padrão. Calculando a média temos: Tabela 10- Cálculo de Variância e Desvio Padrão Fonte:Desenvolvido pela autora Calculada a variância, calcularemos o desvio padrão. 55 PROBABILIDADE BÁSICA AULA 10 56 A teoria das probabilidades é muito ligada aos jogos, chance de ganhar ou perder A probabilidade estuda a chance de determinado evento ocorrer: chance de chover, chance de nascer menino ou menina, chance de sair cara ou coroa, ou seja, Martins (2010) indica o quão provável é a ocorrência de determinado evento. O campo de estudo das probabilidades tem sido amplamente utilizado por empresas, indústrias, medicina e as mais diversas áreas para analisar situações em que é desejável ter uma medida para prever um evento futuro: probabilidade de aumento de preço de determinada ação, de chover, uma unidade de produção fora dos padrões, lançamento de um produto, compra de ações, investimento em projetos, etc. (MARTINS, 2010). Em cada exemplo a probabilidade envolvida corresponde a uma porção cujo valor se estende entre 0 e 1. Em probabilidade consideramos o espaço amostral como sendo a amostra da população à qual iremos analisar. Por exemplo, se a população de uma cidade tem 20.000 habitantes e vamos selecionar 200 pessoas para realizar uma pesquisa, então essas pessoas selecionadas constituirão o espaço amostral, ou seja, fazem parte da amostra de pessoas que realmente iremos consultar. Dentro desse espaço amostral temos o evento. O evento é um subconjunto do espaço amostra e ele pode conter elementos ou não conter elementos, neste caso dizemos que o evento é vazio, ou improvável, pois não tem possibilidade de acontecer. Um evento que não tem nenhuma probabilidade de ocorrer (impossível) pos- sui probabilidade igual a zero. Um evento cuja ocorrência seja garantida (evento certo) possui probabilidade igual a 1. Entendemos que se um evento tem pouca probabilidade de ocorrer, por exem- plo, probabilidade 0,0002, este evento é chamado de “não usual”, segundo Triola (2008), pois sua chance de ocorrer é muito pequena, ou seja, o evento raramente ocorre, porém, não podemos descartar a possibilidade de sua ocorrência. Em uma probabilidade básica, a probabilidade de sucesso (ocorrer o evento) é baseada no conhecimento prévio do processo envolvido. No caso mais simples, no qual cada um dos resultados é igualmente provável, ou seja, possuem a mesma chance de ocorrência. 57 Exemplo: a. Jogar um dado e tirar um número ímpar. Neste exemplo, o evento é tirar um número ímpar, é a característica que que- remos que ocorra, logo os elementos favoráveis ao evento fazendo parte do con- junto {1,3,5}. b. Lançar uma moeda e sair face cara. Neste exemplo, o evento é sair face cara, logo temos apenas uma possibilidade {cara}. c. Lançar um dado e sair o número sete. Note que o evento é sair sete no lançamento de um dado, porém esse evento não é possível. Calculamos a probabilidade de ocorrência de determinado evento de acordo com a fórmula (8): (8) Em que: P = probabilidade de ocorrência do evento X = corresponde ao número de maneiras por meio das quais um evento ocorre T = total de resultados possíveis que esse evento pode ter Exemplo 1) Um dado padronizado possui seis lados. Cada um dos lados contém um, dois, três, quatro, cinco ou seis pontos. Caso você jogue um dado, qual é a proba- bilidade de que você consiga que o resultado seja a face com cinco pontos? Resolução: Para resolver um problema de probabilidade precisamos identificar qual é o evento que vai ocorrer. X que é a quantidade de maneiras que o evento desejado ocorra e T que re- presenta o total de resultados possíveis desse evento. Nesse caso, o evento desejado é que saia a face do dado com cinco pontos. 58 Então, X = 1, pois no dado há apenas uma possibilidade de sair a face com cinco pontos e T = 6, pois o dado tem um total de seis faces possíveis para sair em uma jogada. Logo, utilizando (8), temos: Observe que o resultado é um número compreendido entre 0 e 1, como foi abordado anteriormente. Esse valor deve ser multiplicado por 100 para obtermos o resultado em forma de porcentagem. Logo, 0,166666... .100 = 16,66%. Temos então que, a chance de jogar um dado e sair a face 5 é 16,66%. 2) Considere um baralho de cartas padrão que possui 26 cartas vermelhas e 26 cartas pretas. Qual a probabilidade de selecionar uma carta preta? Figura 6 - Cartas de um baralho Fonte: Wikipedia Resolução: A probabilidade que queremos calcular é a de selecionar uma carta preta, então X deve representar o total de opções que contribuem para sair uma carta preta na seleção, observando a Figura 6, temos um total de 26 cartas pretas, logo X = 26. T representa o total de possibilidade que podem ocorrer durante a seleção de cartas do baralho, então T = 52. 59 Isto está na rede Na área de Engenharia, a probabilidade tem aplicação no controle de qualidade de produção, em análises de distribuições de probabilidades, conhecendo dados da produção é possível decidir se ocorrerá ou não o descarte de certa peça produzida; tomadas de decisão através de mo- delos probabilísticos; disponibilizar produtos em filas de solicitação de serviços, etc. 3) Uma empresa de produtos eletrônicos apresenta os resultados para a amos- tra de 1.000 domicílios, em termos do comportamento de compra de aparelhos de televisão de tela grande. Qual a probabilidade de selecionar um domicílio que tenha planejado comprar um aparelho de televisão de tela grande? Resolução: Atenção para o fato de atentar ao que o exercício pede. Queremos selecionar um domicílio que tenha planejado comprar um aparelho de televisão de tela grande. Então, olharemos parao total da terceira linha que é a linha das pessoas que planejaram comprar um aparelho de televisão de tela grande. Veja que se a pessoa efetivamente comprou o aparelho de televisão não irá afetar o resultado final, o que importa para nós é que a pessoa tenha planejado comprar. As pessoas que planejaram comprar o aparelho de televisão de tela grande são 250 pessoas e o total de pessoas foi de 1000 respondentes, ou seja, a amostra corresponde a 1000 pessoas. 60 Logo, a probabilidade de selecionar um domicílio que tenha planejado comprar um aparelho de televisão de tela grande será: 4) Algumas perguntas foram feitas a 300 domicílios que efetivamente compra- ram aparelhos de televisão de tela grande. A tabela a seguir indica as respostas de consumidores em relação ao fato de o aparelho de televisão comprado ser de tela de plasma e de eles também terem comprado um gravador de DVD nos últimos 12 meses. Qual a probabilidade de que, caso um domicílio tenha adquirido um aparelho de televisão de tela grande seja aleatoriamente selecionado, o aparelho de tele- visão adquirido tenha tela de plasma? Resolução: A tabela deste exercício é chamada de tabela de contingência, na qual existe o cruzamento de informações. Apenas tome cuidado para o fato de não escolher informação errada no momento de resolver o exercício. Estamos interessados em selecionar um domicílio que comprou um aparelho de televisão de tela grande e que essa televisão seja de tela de plasma. Os domicílios que compraram um aparelho de televisão de tela grande com tela de plasma são 38 domicílios. Atenção para o cruzamento correto de informa- ções. O total de domicílios que participaram da pesquisa é 300. 61 Logo, a probabilidade procurada é de: Fonte: https://pixabay.com 62 EVENTOS MUTUAMENTE EXCLUSIVOS E NÃO EXCLUSIVOS E REGRAS DE PROBABILIDADE AULA 11 63 O ato de lançar dois dados é um evento não exclusivo. O que sai na face de um dos dados não exclui nenhuma chance de sair qualquer número na outra face. O estudo de probabilidade podemos classificar os eventos em algumas cate- gorias, vamos conhecer algumas delas: Eventos Mutuamente Exclusivos Como o próprio nome diz, eventos mutuamente exclusivos se excluem auto- maticamente, ou seja, a ocorrência de um evento impede a ocorrência de outro evento, ou seja, eventos mutuamente exclusivos não podem ocorrer simultanea- mente. Quando utilizamos diagramas de Venn, representamos eventos mutuamente exclusivos através de dois diagramas que não possuem elementos em comum, logo sua intersecção é vazia. Veja a Figura 7. Figura 7- Conjuntos sem elementos em comum A B Fonte: Desenvolvido pela autora Exemplo: 1) Em uma universidade existem os cursos de Engenharia Civil, Arquitetura e Sistemas de Informação. O evento de selecionar um aluno dentre os estudantes é um evento mutuamente exclusivo, pois se selecionarmos um aluno de Enge- nharia Civil não poderemos selecionar um aluno de Arquitetura ou Sistemas de Informação. Logo, a seleção dos alunos não pode ocorrer simultaneamente. Como não temos alunos comuns aos três cursos, podemos fazer a represen- tação através de diagrama de Venn. 64 Figura 8- Organização dos alunos em diagramas de Venn Engenharia Civil Sistema de Informação Arquitetura Fonte: Desenvolvido pela autora Eventos Não Exclusivos Os eventos não exclusivos diferente dos eventos mutuamente exclusivos, são eventos que podem ocorrer simultaneamente. Perceba que eles têm a chance de ocorrer em conjuntos, porém não é necessário que ocorram ao mesmo tempo. Considere os eventos “mulher” e “estudante de Engenharia Civil”, estes even- tos são não exclusivos, pois podemos em um processo de seleção escolher uma mulher que estuda Engenharia Civil. Regras de Probabilidade Vamos conhecer algumas regras importantes para o estudo de probabilidades. Regra 1: Campo de variação das probabilidades Como já citamos no capítulo 10, temos: Para você compreender o que é um evento complementar, veja o exemplo. 65 Exemplo 2) Você tem uma urna para um sorteio. Dentro dessa urna há fichas numeradas do 1 ao 20. Vamos supor que o vencedor sairá quando forem sorteados números menores que 10. Logo o evento complementar são as fichas que não podem sair no sorteio, ou seja: 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 e 20. Regra 2: Probabilidade do evento complementar (9) Onde, representa o evento complementar. Exemplo 3) Seja A = {número par no dado}, logo = {número ímpar no dado}. Desta forma, a probabilidade de retirar um número ímpar em um lançamen- to de dado será o total de possibilidades (que consideramos como 1, ou 100%) menos a probabilidade de retirar um número par no dado, ou seja, excluímos do total o evento que não queremos que ocorra. Assim temos: Logo, temos que há 50% de chance de sair um número ímpar no lançamento de um dado. Fonte: https://pixabay.com 66 EVENTOS INDEPENDENTES E EVENTOS DEPENDENTES AULA 12 67 Você já deve ter participado de um sorteio, quando uma bolinha é retirada da urna há uma alteração na quantidade de bolinhas totais, logo a chance de retirar outra bolinha se altera em relação à chance inicial da retirada da primeira bolinha. Estudamos no capítulo 11 a possibilidade de um evento excluir a ocorrência de outro ou a possibilidade desses eventos ocorrerem simultaneamente. No capítulo 12 vamos estudar sobre eventos independentes e eventos dependentes. Eventos Dependentes Dois ou mais eventos são dependentes, quando a ocorrência de um evento é afetada pela ocorrência de outro evento. Por exemplo, em uma urna com fichas numeradas de 1 a 20, a retirada de uma ficha irá influenciar na probabilidade de retirada da outra ficha, pois a urna não terá mais a mesma quantidade de fichas que anteriormente. Você irá estudar probabilidade de eventos dependentes após estudar sobre probabilidade condicional. Vamos aprender a utilizar o diagrama da árvore, ele é útil quando você quer analisar as possibilidades de ocorrência de determinado evento. Vamos supor que você tenha em sua carteira moedas de 1 real e notas de 2 reais e você saber de quantas formas você pode retirar 4 reais da sua carteira. No diagrama da árvore, colocaremos as possibilidades iniciais e em cada ramificação as próximas possibilidades. Figura 9- Diagrama da árvore para eventos dependentes Fonte:Desenvolvido pela autora 68 Observe que as possibilidades correspondem a eventos dependentes, se já retiramos uma nota de 2 reais e depois uma moeda de 1 real a única possibilidade que nos resta é retirar uma moeda de 1 real. Eventos Independentes Dois ou mais eventos são independentes quando a ocorrência de um deles não afetar a ocorrência do outro. Por exemplo, o lançamento de uma moeda. Sair cara no primeiro lançamento não irá influenciar sair cara ou coroa nos demais lançamentos. Para eventos independentes também podemos construir o diagrama da árvo- re. Vamos construir o diagrama para 4 lançamentos de uma moeda. Figura 10- Diagrama da árvore para eventos independentes Fonte:Desenvolvido pela autora Observe que o exemplo desenvolvido mostra eventos independentes, sair cara ou coroa, não influenciou a possibilidade de saída de cara ou coroa nos próximos eventos. 69 Isto está na rede Os termos “provável” e “probabilidade” e seus cognatos em outras línguas modernas derivam do latim medieval ensinado probabilis, derivando de Cícero e, geralmente, aplicado a um parecer plausível ou, geralmente, aprovado. O sentido matemático do termo é de 1718. No século XVIII, o termo oportunidade também foi usado no sentido matemático de “proba- bilidade” (e a teoria da probabilidade foi chamada Doutrina das Chances). Esta palavra é, em última análise, originária a partir do termo cadentia do latim, ou seja, “uma queda”. O adjetivo Inglês provável é de origem germâ- nica, provavelmente a partirdo termo likligr do Old Norse (língua nórdica antiga) , enquanto no Inglês Antigo teve o termo geliclic com o mesmo sentido, significando originalmente “ter a aparência de ser forte ou capaz” ou “tendo a aparência ou qualidades semelhantes”, com um significado de “provavelmente” gravado a partir do final do século XIV. Da mesma forma, o substantivo derivado likelihood tinha um significado de “simila- ridade, semelhança”, mas assumiu um significado de “probabilidade” em meados do século XV. A “lei de evidências” antiga e medieval desenvolveu uma classificação dos graus de provas, probabilidades, presunções e meia prova (semi- plena probatio) para lidar com as incertezas de evidências (provas) em tribunais. Nos tempos da Renascença, as apostas foram discutidas em termos de probabilidades (chances), como “dez a um” e prêmios de se- guro marítimos foram estimados com base nos riscos intuitivos, mas não havia nenhuma teoria sobre a forma de calcular essas probabilidades ou prêmios. Os métodos matemáticos de probabilidade surgirá na correspondência de Gerolamo Cardano, Pierre de Fermat e Blaise Pascal (1654) sobre ques- tões como a divisão justa da participação em um jogo de azar interrompi- do. Christiaan Huygens (1657) deu um tratamento abrangente do assunto. Fonte: Wikipedia 70 Exemplo: Paulo e José estão jogando cara e coroa. Eles combinaram que farão três lan- çamentos e que se sair coroa seguida de cara, Paulo vence e se sair duas caras seguidas, José vence. Qual a probabilidade de José vencer? Resolução: Vamos construir uma árvore com as possibilidades de desenvolvimento do jogo, considerando as regras estipuladas por Paulo e José. Figura 11- Diagrama da árvore do desenvolvimento do jogo Fonte:Desenvolvido pela autora Observando o diagrama do desenvolvimento do jogo, podemos perceber que existem 8 possibilidades do jogo se desenrolar, sendo que José vence em uma única possibilidade, Paulo vence em 5 possibilidades e em 2 possibilidades nin- guém vence o jogo. Como queremos calcular a probabilidade de José vencer temos: Logo, a probabilidade de José ganhar é de 12,5 %. Se quisermos determinar a probabilidade de Paulo ganhar podemos utilizar a fórmula do cálculo de probabilidade: 71 E para determinar a probabilidade desse jogo terminar sem nenhum ganhador podemos utilizar a fórmula de probabilidade: Podemos ainda utilizar a fórmula para evento complementar: Fonte: https://pixabay.com 72 REGRA DA ADIÇÃO AULA 13 73 Em alguns casos, precisamos analisar a probabilidade de ocorrência de um evento ou outro evento, para isso utilizamos a regra da adição de probabilidades. Para a adição de probabilidades vamos analisar dois casos: soma de probabilida- des em eventos não exclusivos e em eventos mutuamente exclusivos. Regra da adição para eventos não exclusivos Quando consideramos eventos não exclusivos sabemos que eles têm a possi- bilidade de ocorrer simultaneamente, logo a probabilidade de ocorrer o evento A ou o evento B é dada pela fórmula (10): (10) Onde: : probabilidade de ocorrer A ou B : probabilidade de ocorrer A : probabilidade de ocorrer B : probabilidade de ocorrer A e B simultaneamente Exemplo: 1) Ao jogar baralho, determine a probabilidade de retirar uma carta preta ou um 2. Atenção que é possível retirar um 2 que é uma carta preta. Vamos calcular as probabilidades de forma separadas. A = retirar uma carta preta B = retirar um 2 : probabilidade de retirar um 2 preto 74 Utilizando (10) temos: Figura 12- Representação de probabilidade através de conjuntos A B 26 52 2 52 4 52 ; Fonte: Desenvolvido pela autora Neste exemplo, há a possibilidade dos eventos ocorrerem simultaneamente, logo temos que excluir essa probabilidade para não somar o mesmo valor de probabilidade mais de uma vez. Regra da adição para eventos mutuamente exclusivos Quando os eventos são mutuamente exclusivos, sabemos que eles não podem ocorrer simultaneamente, logo, Então, o cálculo para a soma de probabilidades fica: (11) Exemplo: 2) Qual a probabilidade de retirar um dois ou um reis no baralho? Observe que não há a possibilidade de retirar um dois e um reis ao mesmo tempo, então precisamos utilizar (11) para calcular a probabilidade da soma. A = retirar um dois 75 B = retirar um reis Neste exemplo, não há possibilidade desses eventos ocorrerem em conjunto, logo basta apenas somar seus valores. Se representarmos esse exemplo através de diagramas teremos a seguinte representação: Figura 13- Representação de probabilidades através de diagramas A B 4 52 4 52 Fonte: Desenvolvido pela autora Anote isso Na regra da adição de probabilidades não significa que devemos adicionar as probabilidades de cada evento. Atente-se aos fatos dos conjuntos com os quais o exercício está trabalhando. Se os eventos forem não exclusivos, devemos excluir a probabilidade de ocorrência conjunta dos eventos. 76 3) Você jogou dois dados, qual a probabilidade de sair a face 5 em um dado e a face 6 no outro? Observe que nesse exemplo não há a possibilidade desses eventos ocorrerem simultaneamente, então vamos apenas somar os valores das probabilidades. Para tirar 5 no primeiro dado temos 1 possibilidade de sair o número 5 e um total de 6 possibilidades de sair as faces de um dado. Para tirar a face 6 no outro dado temos 1 possibilidade de sair o número 6 e um total de 6 possibilidade de sair as faces de um dado. Logo: Probabilidade de sair 5: Probabilidade de sair 6: Como queremos a probabilidade de sair 5 ou 6 temos: 77 REGRA DA MULTIPLICAÇÃO AULA 14 78 A regra da multiplicação pode ser utilizada tanto para eventos independentes quanto para eventos dependentes. Quando utilizamos a regra da multiplicação para eventos dependentes precisamos estudar a probabilidade condicional que será vista no capítulo 15. (12) Sendo A e B eventos independentes. Onde: : probabilidade de ocorrer A e B : probabilidade de ocorrer A : probabilidade de ocorrer B Exemplo: 1) Ao jogar um dado, qual a probabilidade de sair 2 no primeiro dado e 5 no segundo dado? Note que os eventos são independentes, pois sair 2 no primeiro dado não influencia no que vai sair no segundo dado. Observe a diferença para este exemplo e o resolvido na aula 13. Na aula 13 queríamos saber a probabilidade de tirar 5 no primeiro lançamento OU seis no segundo lançamento. A = sair 2 B = sair 5 2) Calcule a probabilidade de sair duas caras em dois lançamentos de moedas. A = sair cara 79 B = sair cara Faremos agora o cálculo de probabilidade através do diagrama da árvore: Figura 14- Diagrama da árvore Fonte: Desenvolvido pela autora Podemos perceber que temos uma opção de sair cara e depois coroa, dentre 4 opções, logo 25% de chance. Fonte: https://pixabay.com 80 PROBABILIDADE CONDICIONAL AULA 15 81 Em probabilidade, nos casos de eventos dependentes, se o evento A e o evento B são dependentes, então se B já ocorreu e A for ocorrer, dizemos que B é condi- cionado à ocorrência de A, ou seja, B é condição para que A ocorra. A probabili- dade de ocorrer A dado que B já tenha ocorrido é dada pela fórmula (13): (13) Onde: : probabilidade de ocorrer A, já que B ocorreu. Em decorrência de (13) temos a fórmula da multiplicação para eventos depen- dentes: Exemplo: 1) Uma carta é retirada do baralho, qual a probabilidade de retirar um rei ver- melho, dado que já foi retirada uma carta com figura? A = evento que vai ocorrer: rei vermelho B = evento que já ocorreu: carta com figura = probabilidade de retirar um rei vermelho com figura 2) Uma pesquisa foi feita com 100 pessoas sobre a preferência por canais de televisão, veja as informações na Tabela 13: Tabela 11- Preferência por canais Canal Quantidade A 60 B 50 Os dois 10 Fonte: Desenvolvido pela autora Foi selecionadoum dos entrevistados sabendo que ele prefere o canal B, qual a probabilidade do próximo entrevistado preferir o canal A? 82 A = evento que vai ocorrer: preferir o canal A B = evento que já ocorreu: preferir o canal B Consideramos 50 que preferem somente o canal B adicionado dos 10 que gostam do A e do B. = probabilidade de preferir os dois canais Anote isso A probabilidade condicional indica que um evento já aconteceu, ou seja, teremos um evento condicionado a outro. Se de uma urna de bolinhas pretas e brancas foi sorteada uma bolinha preta, próximo sorteio fica con- dicionado, pois a probabilidade de retirada de bolinha branca ou preta será alterada pelo fato de ter uma bolinha a menos na urna. Distribuição de Probabilidade Vamos estudar a distribuição binomial. Uma distribuição de probabilidades muito utilizada. Essa distribuição verifica quantos sucessos uma observação tem. Exemplo: Uma indústria produz parafusos e deseja-se saber quantos parafusos produ- zidos são perfeitos, isto é, não são devolvidos para a produção. Para este tipo de problema, utilizamos a distribuição binomial, em que que- remos que ocorra produção de parafusos perfeitos, nesse caso, o sucesso do exercício. Para estudarmos a distribuição binomial precisamos fazer uma breve revisão sobre fatorial. Seja n um número natural, tal que . Chamamos fatorial de n e representamos por n!, o produto de todos os números naturais de n a 1. Exemplos: a. 5! = 5.4.3.2.1 = 120 83 b. 4! = 4.3.2.1 = 24 c. 1! = 1 d. 0! = 1 Para calcular a distribuição binomial utilizamos a seguinte fórmula: Onde: P(X): probabilidade de ocorrer X sucessos. n = tamanho da amostra. p = probabilidade de sucessos. 1-p = probabilidade de insucessos. X = número de sucessos da amostra. Não confunda X com p, X é quantidade de sucessos, enquanto p é a probabi- lidade de ocorrer um sucesso. Exemplo: 1) Em uma amostra de tamanho 4, a probabilidade de ocorrência de sucesso é 0,1. Determine a probabilidade de que existam: a. Exatamente 3 sucessos na amostra. No exemplo temos que: n = 4 p = 0,1 1-p = 0,9 X = 3 Vamos substituir esses valores na fórmula da distribuição binomial: 84 b. Exatamente 4 sucessos na amostra. n = 4 p = 0,1 1-p = 0,9 X = 4 Vamos substituir esses valores na fórmula da distribuição binomial: c. Exatamente 1 sucesso na amostra. n = 4 p = 0,1 1-p = 0,9 X = 1 Vamos substituir esses valores na fórmula da distribuição binomial: 85 d. Nenhum sucesso na amostra. n = 4 p = 0,1 1-p = 0,9 X = 0 Vamos substituir esses valores na fórmula da distribuição binomial: Fonte: https://pixabay.com 86 DIAGRAMAS DE VENN AULA 16 87 Podemos representar elementos de um conjunto em forma de desenho, utili- zando círculos e dentro destes círculos colocamos os elementos correspondentes. A esses círculos damos o nome de diagramas de Venn. Isto está na rede Os diagramas adotam o nome do seu criador John Venn, matemático e filósofo britânico do século XIX. Foi estudante e mais tarde professor no Caius College da Universidade de Cambridge, onde viria a desenvolver toda sua obra teórica. Venn introduziu os diagramas em um trabalho de lógica formal publicado em Julho de 1880 na Philosophical Magazine and Journal of Science, intitula- do Da representação mecânica e diagramática de proposições e raciocínios. Figura 15- John Venn Fonte: Wikipedia 88 Os diagramas de Venn podem ser: 1) Sem elementos em comum Figura 16- Diagramas disjuntos Fonte: Desenvolvido pela autora Os diagramas da Figura 16 são disjuntos, pois não têm nenhuma área em comum, ou seja, não possuem elementos comuns. Em probabilidade estes con- juntos representam os eventos mutuamente exclusivos, pois não podem ocorrer simultaneamente. 2) Com alguns elementos em comum Figura 17- Diagramas de Venn com área em comum Fonte: Desenvolvido pela autora Os diagramas de Venn que possuem uma parte em comum, possuem a área de intersecção, chamados de . 89 3) Conjuntos contidos em outros conjuntos Figura 18- Conjunto contido Fonte: Desenvolvido pela autora Os conjuntos apresentados na Figura 18 são conjuntos contidos. Nesse caso, dizemos que o conjunto A está contido no conjunto B, e representamos por Neste tipo de situação, todos os elementos do conjunto B também são elementos do conjunto A. Exemplo: 1) Em uma escola de línguas 300 alunos fazem inglês, 200 espanhol e 150 as duas línguas. Quantos alunos têm na escola de línguas? Vamos, a partir das informações, construir um diagrama de Venn. Perceba que o diagrama terá área em comum, pois têm alunos que fazem duas línguas ao mesmo tempo. Figura 19- Alunos da escola de línguas Fonte: Desenvolvido pela autora 90 Observe na Figura 19 que em vermelho foi feita a diferença entre a quantidade de alunos respondentes de cada língua e os alunos que fazem as duas línguas, isso pelo fato dos alunos que fazem inglês e espanhol ao mesmo tempo estarem repetidos no grupo dos alunos que fazem inglês e dos alunos que fazem espanhol. Sendo assim, 150 alunos estudam somente inglês e 50 alunos estudam somente espanhol. Logo o total de alunos na escola é 150+50+150 = 350. 2) Vamos construir o diagrama de Venn referente ao exemplo 2 do capítulo 15. Figura 20- Preferência por canais Fonte: Desenvolvido pela autora A partir da análise da Figura 20 vemos que 50 entrevistados preferem somente o canal A, 40 entrevistados preferem somente o canal B e 10 entrevistados pre- ferem os dois canais. 3) Um pesquisa foi feita sobre os esportes preferidos de alguns alunos.100 responderam que preferem futebol, 60 preferem vôlei e 40 preferem natação. 10 responderam que preferem futebol e vôlei, 12 preferem vôlei e natação, 10 preferem futebol e natação e 5 alunos preferem os três esportes. Qual a proba- bilidade de selecionar alguém que tenha respondido que prefere apenas vôlei? 91 Construindo o diagrama excluindo elementos simultâneos, temos: Figura 21- Diagrama de Venn Fonte: Desenvolvido pela autora Como queremos selecionar uma pessoa que disse que prefere apenas vôlei, de acordo com o diagrama temos que 43 pessoas responderam que preferem apenas vôlei. O total de pessoas respondentes foi: 85+5+5+5+7+43+23 = 173. Calculando a probabilidade temos: 92 CONCLUSÃO Chegamos ao final do curso de Probabilidade e Estatística, a partir de tudo o que estudamos você está preparado para realizar pesquisa, analisar dados, analisar informações quantitativas em textos científicos e a partir desses dados realizar inferências, tomar decisões e tirar conclusões. Você também será capaz de calcular as chances de ocorrências de eventos e analisar os riscos e pontos favoráveis à tomada de decisão. 93 ELEMENTOS COMPLEMENTARES O Andar do Bêbado Título: O Andar do Bêbado Autor: Leonar Mlodinow Editora: Zahar Sinopse: O livro traz relatos e exemplos de como o aleatório pode influenciar na nossa vida. Best-seller internacional e livro notável do New York Times. Um dos 10 Me- lhores Livros de Ciência, segundo a Amazon.com. Não estamos preparados para lidar com o aleatório e, por isso, não percebemos o quanto o acaso interfere em nossas vidas. Num tom irreverente, citando exemplos e pesquisas presentes em todos os âmbitos da vida, do mercado financeiro aos esportes, de Hollywood à medicina, Leonard Mlodinow apresenta de forma divertida e curiosa as ferra- mentas necessárias para identificar os indícios do acaso. Como resultado, nos ajuda a fazer escolhas mais acertadas e a conviver melhor com fatores que não podemos controlar. Prepare-se para colocar em xeque algumas certezas sobre o funcionamento do mundo e para perceber que muitas coisas são tão previsíveis quanto o próximo passo de um bêbado depois de uma noitada... “Um guia maravilhoso e acessível sobre como o aleatório afeta nossas vidas” Stephen Haw- king “Mlodinow escreve num estilo leve, intercalando desafios probabilísticos com perfis de cientistas... O resultadoé um curso intensivo, de leitura agradável, sobre aleatoriedade e estatística.” George Johnson, The New York Times. 94 REFERÊNCIAS MARTINS, G. A. Estatística geral e aplicada. 3 ed. São Paulo: Atlas, 2010. MATTOS, Viviane Leite de; AZAMBUJA, Ana Maria de; KONRATH, Andréa Cristi- na. Introdução à Estatística. Aplicações em Ciências Exatas. 1 ed. Rio de Janeiro, LTC, 2017. TRIOLA, M. F. Introdução à estatística. 10. ed. Rio de Janeiro: LTC, 2008.
Compartilhar