Baixe o app para aproveitar ainda mais
Prévia do material em texto
PROBABILIDADE E ESTATÍSTICA Dr. Marcos Antonio S. de Jesus GUIA DA DISCIPLINA 2021 1 Probabilidade e Estatística Universidade Santa Cecília - Educação a Distância Objetivo Geral A disciplina Probabilidade e Estatística tem como objetivo geral no curso de Análise e Desenvolvimento de Sistemas, apresentar fundamentos matemáticos básicos de análise combinatória, probabilísticos e estatísticos, para servir como ponto de ancoragem dos conceitos que serão apresentados nas próximas disciplinas técnicas do curso e que estão relacionados à ideias probabilísticas também desenvolvidas no curso, bem como intervir no processo de ensino e aprendizagem, como elemento facilitador, nos problemas que envolvam procedimentos e ideias probabilísticas e estatísticas no decorrer de todo curso. Introdução Caro participante do Curso de Análise e Desenvolvimento de Sistemas, na modalidade EAD da UNISANTA, na disciplina de probabilidade e estatística, você terá acesso a alguns tópicos fundamentais de análise combinatória, probabilidades, e estatística descritiva, como conhecimentos prévios, de fundamental importância em sua formação como Analista de Desenvolvimento de Sistemas. Sabemos que a formação de Analista, o tornará apto a exercer suas atribuições técnicas com qualidade, requer conhecimentos matemáticos básicos, necessários para interpretação de problemas, criação de variáveis, estruturação e resolução através de linguagem matemática. Por esse motivo, essa disciplina aparece no começo do curso, como meio de você retomar conhecimentos adquiridos no ensino fundamental e médio e dar continuidade no ensino superior, com uma formação sólida e consistente no âmbito da Tecnologia da Informação. 2 Probabilidade e Estatística Universidade Santa Cecília - Educação a Distância 1. ANÁLISE COMBINATÓRIA: 1ª AULA 1.1 Introdução A análise combinatória é um dos conteúdos matemáticos que estuda métodos e técnicas que possibilitam resolver problemas que estão relacionados com contagem. Geralmente a análise combinatória é utilizada em estudos sobre probabilidade, realizando análise das possibilidades e das combinações possíveis entre um conjunto de elementos. 1.2 Princípio Fundamental da Contagem O princípio fundamental da contagem, que também pode ser chamado de princípio multiplicativo mostra que: quando um evento é composto por n etapas sucessivas e independentes, de tal modo que as possibilidades da primeira etapa é 𝑥 e o número de possibilidades da segunda etapa é 𝑦, resulta no número total de possibilidades do evento ocorrer é dado pelo produto (𝑥. 𝑦). Uma pessoa tem três camisetas, dois pares de sapatos e duas calças. Com essas peças do vestiário, de quantos formas diferentes ele pode ser vestir, usando uma camiseta, um par de sapato e uma calça de cada vez? Podemos começar a resolução desse problema, construindo uma árvore de possibilidades, conforme ilustrado a seguir: Sapatos Camisetas Calças 3 Probabilidade e Estatística Universidade Santa Cecília - Educação a Distância Então o acontecimento se dará de 𝟑. 𝟐. 𝟐 = 𝟏𝟐 𝒑𝒐𝒔𝒔𝒊𝒃𝒍𝒊𝒅𝒂𝒅𝒆𝒔 O que fizemos foi multiplicar o número de opções de camisetas, sapatos e calças. Nesse caso podemos afirmar que a pessoa poderá se vestir de 12 formas distintas, somente com essas peças do seu vestuário. Devemos também entender que basta trocar uma das peças, já é outra forma diferente de se vestir. Numa festa há 8 mulheres e 10 homens. Quantos casais distintos, é possível formar parar ensaiar uma dança? 𝟖 . 𝟏𝟎 = 𝟖𝟎 𝒄𝒂𝒔𝒂𝒊𝒔 𝒅𝒊𝒔𝒕𝒊𝒏𝒕𝒐𝒔 Mulheres Homens 1.3 Técnicas de Contagem O princípio fundamental da contagem pode ser usado em grande parte dos problemas relacionados com contagem. Em outros problemas utilizamos algumas técnicas para resolver problemas com determinadas características. Antes de conhecermos essas técnicas de contagem, vamos definir um conceito muito utilizado em problemas de contagem, que é o fatorial. O fatorial de um número natural é definido como o produto deste número por todos os seus antecessores. Utilizamos o símbolo (!), para indicar o fatorial de um número. Define-se ainda que o fatorial de zero é igual a 1. n! = n. (n − 1). (n − 2)…1 0! = 1 3! = 3.2.1 = 6 5! = 5.4.3.2.1 = 120 8! = 8.7.6.5! (n+1)! (n−1)! = (n+1).n.(n−1)! (n−1)! = n. (n + 1) https://www.todamateria.com.br/fatorial/ 4 Probabilidade e Estatística Universidade Santa Cecília - Educação a Distância Observe que que o valor do fatorial cresce rapidamente, conforme cresce o número. Então, frequentemente usamos simplificações para efetuar os cálculos de análise combinatória. 1.3.1 Arranjos Nos arranjos, os agrupamentos dos elementos dependem da ordem e da natureza dos elementos envolvidos. Para obter o arranjo simples de n elementos tomados, p a p (p ≤ n), utiliza-se a seguinte expressão: 𝑨𝒏,𝒑 = 𝒏! (𝒏 − 𝒑)! Com os algarismos {1, 2, 3,4,6 }, quantos números formados por dois algarismos distintos (dezenas), existem? Devemos considerar, por exemplo, que o número 21 é diferente do número 12. Assim vamos utilizar da técnica dos arranjos, pois o arranjo 12 é diferente do arranjo 21. Então teremos: 𝑨𝟓,𝟐 = 𝟓! (𝟓−𝟐)! = 𝟓! 𝟑! = 𝟏𝟐𝟎 𝟔 = 𝟐𝟎 dezenas 5 Probabilidade e Estatística Universidade Santa Cecília - Educação a Distância 2. ANÁLISE COMBINATÓRIA: 2ª AULA 2.1 Permutações Simples As permutações são agrupamentos ordenados, onde o número de elementos (𝑛) do agrupamento é igual ao número de elementos disponíveis. Observe que a permutação é um caso particular dos arranjos, quando o número de elementos é igual ao número de agrupamentos. Assim podemos considerar que a permutação pode ser calculada por: 𝑨𝒏,𝒏 = 𝑷𝒏 = 𝒏! = 𝒏. (𝒏 − 𝟏). (𝒏 − 𝟐)…𝟏 De quantas maneiras diferentes 5 pessoas podem se sentar em um banco com 5 lugares? Como a ordem em que irão se sentar importa e o número de lugares é igual ao número de pessoas, podemos usar a permutação: 𝑷𝟓 = 𝟓! = 𝟓. 𝟒. 𝟑. 𝟐. 𝟏 = 𝟏𝟐𝟎. Então existem 120 formas diferentes das 5 pessoas se sentarem no banco com 5 lugares. Numa fila indiana com 6 pessoas, duas delas, (Pedro e Joana) não querem se separar. De quantas maneiras é possível ficar na fila satisfazendo essa condição? Solução: Vamos considerar os dois como uma única pessoa, já que não querem se separar. Assim vamos permutar 5, ou seja, 4 + 1. Mas, os dois podem estar juntos independente da ordem que estejam sentados. Dessa forma, poderá ser Pedro e Joana ou Joana e Pedro, o que dará 2!. ∎∎⏟ 1 ∎∎∎∎⏟ 4 = 𝟐!. 𝑷𝟓 = 𝟐!. 𝟓! = 𝟐. (𝟏𝟐𝟎) = 𝟐𝟒𝟎 6 Probabilidade e Estatística Universidade Santa Cecília - Educação a Distância 2.2 Combinações As combinações são subconjuntos de um conjunto. Sabemos que em um subconjunto, a ordem dos elementos não importa. Dessa forma, para calcular uma combinação simples de n elementos tomados p a p (p ≤ n), é utilizada a seguinte expressão: 𝑪𝒏,𝒑 = 𝒏! 𝒑! (𝒏 − 𝒑)! Dentre um grupo de 12 pessoas, 3 serão escolhidas para formar uma comissão organizadora de um evento acadêmico. De quantas maneiras distintas essa comissão poderá ser formada? Observe que diferentemente dos arranjos, nas combinações a ordem dos elementos não importa. Isso quer dizer que uma comissão formada por Pedro, José e Telma, é a mesma comissão que é formada por Telma, José e Pedro. 𝑪𝟏𝟐,𝟑 = 𝟏𝟐! 𝟑!(𝟏𝟐−𝟑)! = 𝟏𝟐! 𝟑!(𝟗)! = 𝟏𝟐.𝟏𝟏.𝟏𝟎.𝟗! 𝟑!.𝟗! = 𝟏𝟐.𝟏𝟏.𝟏𝟎 𝟑! = 𝟏𝟑𝟐𝟎 𝟔 = 𝟐𝟐𝟎 Então, podemos afirmar queé possível formar 220 comissões. Dispomos de 10 tipos produtos para montagem de cestas básicas. Qual é o número de cestas distintas que podemos formar com 6 desses produtos, de modo que dois determinados produtos sejam sempre incluídos? Explicação: Total de produtos: 10 produtos. Condição: os produtos a e b devem sempre estar presente. Então, nesse caso, vamos separar dois lugares para sempre colocar esses dois produtos. Desta forma sobrarão apenas 8 produtos dos 10 iniciais e apenas 4 espaços para colocar os 4 produtos que ainda faltam em cada sexta. Esses 4 produtos serão escolhidos entre os 8 restantes. 𝑪𝟖,𝟒 = 𝟖! 𝟒!(𝟖−𝟒)! = 𝟖! 𝟒!(𝟒)! = 𝟒𝟎𝟑𝟐𝟎 𝟓𝟕𝟔 = 𝟕𝟎 Portanto, é possível formar 70 diferentes tipos de sexta, satisfazendo essa condição. 2.3 Permutações com Repetição 𝑃𝑛 𝑛1,𝑛2,𝑛3…,𝑛𝑛, = 𝑛! 𝑛1.! 𝑛2! … 𝑛𝑛! n é o total de elementos. n1., n2,…nn são os elementos repetidos ou não. 7 Probabilidade e Estatística Universidade Santa Cecília - Educação a Distância Quantos anagramas tem a palavra Perereca? Sabemos que um anagrama é qualquer permutação da palavra, mesmo sem sentido. Nesse exemplo a palavra perereca tem 8 letras, onde algumas tem repetição. Assim temos, 1p, 3e, 2r, 1c e 1a. 𝑷𝟖 𝟑,𝟐,𝟏,𝟏 = 𝟖! 𝟑!.𝟐!𝟏!𝟏! = 𝟒𝟎𝟑𝟐𝟎 𝟏𝟐 = 𝟑𝟑𝟔𝟎. Assim podemos dizer, que a palavra perereca, produz 3360 anagramas, ou seja, 3360 permutações da própria palavra. 2.4 Agora faça você mesmo! 2.4.1Uma comissão de 5 pessoas é formada de membros de uma diretoria que é composta por 6 homens e 5 mulheres. De quantas maneiras é possível formar a comissão de modo que ela tenha: Exatamente 3 mulheres? Pelo menos 4 mulheres? 2.4.2 Dispomos de 12 pessoas para formar equipes com 7 pessoas. Sabendo que Pedro e Paula são duas dessas 12 pessoas e que os dois devem sempre estar em todas as equipes formadas. Nessas condições, qual é o número de equipes distintas que podemos formar? 2.4.3 Com relação à palavra IMPUT: a) quantos anagramas existem que começam com a letra I? b) quantos anagramas começam e acaba em vogal? c) quantos anagramas tem as letas T e U juntas? 2.4.4 Um Químico possui 8 (oito) tipos de substâncias. De quantos modos possíveis poderá associar 5 (cinco) dessas substâncias se, entre as oito, duas somente não podem ser juntadas porque produzem uma mistura explosiva. 8 Probabilidade e Estatística Universidade Santa Cecília - Educação a Distância 3. ELEMENTOS E CÁLCULO DE PROBABILIDADES: 1ª AULA 3.1 O experimento aleatório Experimento aleatório é todo experimento cujo resultado não seja prioritariamente conhecido. Por exemplo: ao jogar um dado, antes de observar a face superior, será impossível saber qual das faces do dado ficará voltada para cima, com exceção de casos em que dado seja viciado, ou seja, modificado para ter um resultado mais frequente. 3.2 O espaço amostral O espaço amostral é o conjunto formado por todos os pontos amostrais de um experimento aleatório, ou seja, por todos os seus resultados possíveis. Dessa maneira, o resultado de um experimento aleatório, mesmo que não seja previsível, sempre pode ser encontrado dentro do espaço amostral referente a ele. Como os espaços amostrais são conjuntos de resultados possíveis, utilizamos as representações de conjuntos para esses espaços. Por exemplo: O espaço amostral referente ao experimento “lançamento de um dado” é o conjunto S, tal que: S = {1, 2, 3, 4, 5, 6} nesse caso temos 6 casos possíveis. N(S) = 6 Esse conjunto também pode ser representado por um diagrama de venn ou, dependendo do experimento, por alguma lei de formação. O número de elementos dos espaços amostrais é representado por n(S). Os elementos de um espaço amostral são os resultados possíveis de um experimento aleatório. 3.3 O Evento Todos os eventos são subconjuntos de um espaço amostral. Um evento pode conter desde nenhum ao total de casos possíveis de um experimento aleatório, ou seja, o evento pode ser um conjunto vazio ou o próprio espaço amostral. 3.4. Cálculo de Probabilidades As probabilidades são obtidas dividindo-se o número de resultados favoráveis pelo número de resultados possíveis, ou seja: 𝑷 = 𝒏(𝑬) 𝒏(𝑺) . Nesse caso, E é um evento que se quer conhecer a probabilidade, e S é o espaço amostral que o contém. 9 Probabilidade e Estatística Universidade Santa Cecília - Educação a Distância Dado um espaço amostral (S) e um evento (A), a probabilidade ocorrer A em S é dada por: 𝑛(𝐴) = é o número de casos favoráveis ao evento que que desejamos investigar. 𝑛(𝑆) = é o número de casos favoráveis a todo espaço amostral, ou seja, é o total de casos possíveis. Um dado é lançado uma única vez. Qual a probabilidade de ocorrer face virada para cima com número ímpar? n(A) = 3 (três números ímpares) {1, 3, 5} n(S) = 6 (Total de faces de um dado P(A) = n(A) n(S) = 3 6 = 0,5 ou P = 50% Um dado é lançado duas vezes. Qual a probabilidade de ocorrer números iguais em nas duas faces que ficarem viradas para cima? n(A) = faces iguais {(1,1), (2,2), (3,3), (4,4), 5,5), (6,6)} Nesse caso temos 6 casos favoráveis ao que desejamos n(S) = 6.6 = 36 casos possíves P(A) = n(A) n(S) = 6 36 = 0,16666 ou P = 16,66% Você deve ter observado que os valores das probabilidades encontradas sempre resultaram em um número dentro do intervalo 0 ≤ x ≤ 1. Isso sempre irá acontecer porque A é um subconjunto de S. Dessa maneira, A pode conter desde zero até, no máximo, o mesmo número de elementos que S. 3.5. Probabilidade Condicional Probabilidade condicional é um segundo evento de um espaço amostral que ocorre em um evento depois que já tenha ocorrido o primeiro. Por exemplo, vamos considerar um espaço amostral S finito não vazio e um evento A de S, se quisermos outro evento B desse espaço amostral S, essa nova probabilidade é indicada por P(B/A) e afirmamos que é a probabilidade condicional de A em relação a B. Sempre consideramos que ao calcularmos o valor da probabilidade B, então A ocorreu. Essa probabilidade condicional irá formar um novo espaço amostral, pois agora o 𝑃(𝐴) = 𝑛(𝐴) 𝑛(𝑆) 10 Probabilidade e Estatística Universidade Santa Cecília - Educação a Distância espaço amostral será A e os elementos do evento B irão pertencer a intersecção de B e A, seja B ∩ A. Então temos: 𝐏(𝐁/𝐀) = 𝐧(𝐁∩𝐀) 𝐧(𝐀) ou 𝐏(𝐁/𝐀) = 𝐏(𝐁∩𝐀) 𝐏(𝐀) Para calcular a probabilidade P(B∩A) basta multiplicar as probabilidades de A e B: 𝐏(𝐁 ∩ 𝐀) = 𝐏(𝐁). 𝐏(𝐀) No lançamento de dois dados não viciados, qual a probabilidade de obtermos faces voltadas para cima com a soma entre elas seja 6? Nesse caso temos o lançamento de dois dados. O espaço amostral é determinado através do produto entre os eventos decorrentes de cada universo de resultados possíveis. No dado, o espaço amostral é composto de 6 eventos e como são dois dados temos que o espaço amostral terá 6 x 6 resultados possíveis. Nesse caso, 36 resultados diferentes. No lançamento dos dois dados as possibilidades de parceria entre as faces para que a soma seja 6, será: (1 e 5), (5 e 1), (2 e 4), (4 e 2), (3 e 3). 𝐏 = 𝟓 𝟑𝟔 → 𝐏 ≅ 𝟎, 𝟏𝟑𝟗 𝐨𝐮 𝐏 ≅ 𝟏𝟑, 𝟗% Então concluímos que no lançamento de dois dados a probabilidade de obtermos soma das faces voltadas para cima igual a 6 é aproximadamente 13,9%. Ao lançarmos uma moeda e um dado, qual a probabilidade de obtermos o resultado dado por coroa e o número 1? Veja que o espaço amostral do dado corresponde a 6 eventos e que o espaço amostral da moeda equivale a 2 eventos. Envolvendo o dado e a moeda temos um espaço amostral de 12 eventos. A probabilidade de obtermos o resultado dado por coroa e onúmero 1 é determinada por: 𝐏 = 𝟏 𝟏𝟐 → 𝐏 ≅ 𝟎, 𝟎𝟖𝟑𝟑 𝐨𝐮 𝐏 ≅ 𝟖, 𝟑𝟑% Então ao lançarmos um dado e uma moeda, a probabilidade de obtermos o par coroa e o número 1 é de aproximadamente 8,33%. 11 Probabilidade e Estatística Universidade Santa Cecília - Educação a Distância 4. ELEMENTOS E CÁLCULO DE PROBABILIDADES: 2ª AULA 4.1. Probabilidade da União de Eventos Dados dois eventos A e B de um mesmo espaço amostral S, a probabilidade de ocorrer o evento A ou evento B, é determinada por: 𝐏(𝐀𝐔𝐁) = 𝐏(𝐀) + 𝐏(𝐁) − 𝐏(𝐀 ∩ 𝐁). P(A OU B) = P(A) + P(B) – P(A∩B), então temos a probabilidade de ocorrer o evento A ou evento B. Somamos as probabilidades P(A) mais P(B) e subtraímos a intersecção entre ambas, caso exista. Uma carta de um baralho com 52 cartas é retirada. Qual a probabilidade de ocorrer um ÁS ou uma DAMA? Sabemos que em um baralho existe um total de 52 cartas, assim distribuídas: 13 cartas de paus, 13 cartas de ouro, 13 cartas de espadas e 13 cartas de copas. Além disso qualquer carta aparece 4 vezes. Por exemplo: existem 4 damas, distribuídas da seguinte forma: Uma dama de paus, uma dama de ouro, uma dama de copas e uma de espadas. Dessa forma acontece para qualquer carta. Então, nesse problema queremos: P (A ou B) = P (DAMA OU ÁS) = 4 52 + 4 52 = 8 52 = 2 13 = 0,1538 ou P = 15,38% Uma carta de um baralho com 52 cartas é retirada. Qual a probabilidade de ocorrer um ÁS ou carta de COPAS? Veja que nesse exemplo existe intersecção. Então, nesse problema queremos: P (A ou B) = P (ÁS ou UMA CARTA DE COPAS) = 4 52 + 13 52 - 1 52 = 16 52 = 4 13 = 0,3076 ou P = 30,76% 4.2. Probabilidade da Intersecção de Eventos 4.2.1 Introdução O cálculo da probabilidade de eventos simultâneos determina a possibilidade de dois ou mais eventos ocorrerem simultaneamente ou sucessivamente, e irá considerar que o evento que antecede aquele que está sendo calculado ocorreu. A fórmula para o cálculo dessa probabilidade é decorrente da fórmula para cálculo 12 Probabilidade e Estatística Universidade Santa Cecília - Educação a Distância da probabilidade condicional, considerando que os eventos sejam independentes 𝒑(𝑨 ∩ 𝑩) = 𝒑(𝑩/𝑨) . 𝒑(𝑨) = 𝒑(𝑩). (𝑨/𝑩) O fato do evento B não alterar a probabilidade de ocorrer o evento A, a fórmula para cálculo da probabilidade condicional é dada por: 𝒑(𝑨 ∩ 𝑩) = 𝒑(𝑨). 𝒑(𝑩). Uma moeda é lançada duas vezes. Qual a Probabilidade de ocorrer cara nas duas vezes. P(A e B) = P(A). P(B/A) = 1 2 . 1 2 = 1 4 = 0,25 ou P = 25% Uma urna contém duas bolas brancas e uma vermelha. Retiram-se duas bolas da urna ao acaso, uma e sem seguida a outra e sem que a primeira tenha sido recolocada. Qual a probabilidade de as duas serem brancas. P(A) é bola branca na primeira retirada P(B) é bola branca na segunda retirada P(A e B) = P(A). P(B/A) = 2 3 . 1 2 = 2 6 ≅ 0,3333 ou P ≅ 33,33% Numa escolha de 3 (três) minhocas de uma amostra com 50 minhocas, onde 3/5 das minhocas têm menos que 10 cm de tamanho e o restante tem mais que 10 cm de tamanho, qual a probabilidade que as três escolhidas tenham mais que 10 cm de tamanho? A escolha é sem reposição. 3 5 de 50 é 30. Então existem 30 minhocas com menos de 10 cm de tamanho. Logo concluímos que 20 minhocas, tem mais de 10 cm de tamanho. P(3 minhocas com mais de 10 cm) = 20 50 . 19 49 . 18 48 = 6840 117600 = 𝟎, 𝟎𝟓𝟖𝟏𝟔 Ou P = 5,81% Em dois lançamentos sucessivos de um mesmo dado, qual a probabilidade de ocorrer um número maior que 4 e o número 3? 13 Probabilidade e Estatística Universidade Santa Cecília - Educação a Distância Observe que a ocorrência de um evento não influencia a probabilidade de outro ocorrer, portanto são dois eventos independentes. Vamos diferenciar os dois eventos: A: sair um número maior que 4. Como possíveis resultados temos os números 5 e 6. B: sair o número 3 Calculemos a probabilidade de ocorrência de cada um dos eventos. Observe que no lançamento de um dado, temos 6 valores possíveis. 𝑝(𝐴) = 2 6 = 1 3 e 𝑝(𝐵) = 1 6 Então teremos, P(A ∩ B) = P(A). P(B/A) = 1 3 . 1 6 = 1 18 = 0,055555 ou P = 5,555% Numa urna há 20 bolinhas numeradas de 1 a 20. Serão retiradas dessa urna duas bolinhas, ao acaso, uma após a outra, sem reposição. Qual a probabilidade de sair um múltiplo de 5 na primeira e um número primo maior que dez na segunda retirada? o fato de a retirada das bolinhas ocorrer sem reposição, implica que a ocorrência do primeiro evento interfere na probabilidade do segundo ocorrer. Portanto, esses eventos não são independentes. Vamos escrever cada um dos eventos. A: sair um número múltiplo de 5: {5, 10, 15, 20} B: sair um número primo maior que dez: {11, 13, 17, 19} A probabilidade de ocorrer os dois eventos sucessivamente será dada por: Então teremos: P(A∩B)=P(A).P(B/A).Calculando separadamente fica: 𝑝(𝐴) = 4 20 = 1 5 Para o cálculo de p(B|A) é necessário observar que não teremos mais 20 bolinhas na urna, pois uma foi retirada e não houve reposição, restando apenas 19 bolinhas na urna. P(B/A) = 4 19 Portanto, P(A∩B)=P(A).P(B) = 1 5 . 4 19 = 4 95 ≅ 0,210526 ≅ 21,05 14 Probabilidade e Estatística Universidade Santa Cecília - Educação a Distância 5. ELEMENTOS E CÁLCULO DE PROBABILIDASDES: 3ª AULA 5.1 Distribuição Binomial de Probabilidades Imaginemos que uma mulher teve 3 filhos e queremos saber qual a probabilidade de ter nascido exatamente dois homens? Poderíamos ter as seguintes situações possíveis para dois homens: MHH, HHM, HMH. Então temos 3 casos num total de 8 possíveis. Quem são os oito possíveis? MHH, HHM, HMH, MMM, HHH, HMM, MMH e MHM. Nesse caso a probabilidade será igual a: 𝑝 = 3 8 = 0,375 ou 37,5% Na distribuição binomial temos o mesmo problema sendo interpretado de outra forma: p é a probabilidade favorável a nascer um homem, que nesse caso é 𝑝 = 1 2 q é a probabilidade não favorável, que nesse caso, também é meio, q = 1 2 Podemos calcular de quantos modos em 3 nascimentos, tem-se 3 homens. Assim: 𝐶3,2 =? (Lê-se: Combinação de 3 a 2) ou 𝐶3,2 = ( 3 2 ) (Lê-se: Binomial de 3 a 2) ( 𝑛 𝑝) = 𝑛! 𝑝!.(𝑛−𝑝)! Lembrando que n! = n.(n - 1).(n - 2).(n - 3)....1 5! = 5.4.3.2.1 = 120 3! = 3.2.1 = 6 6! = 720 Por exemplo: ( 𝟓 𝟐 ) = 𝟓! 𝟐!.(𝟓−𝟐)! = 𝟓! 𝟐!.𝟑! = 𝟓.𝟒.𝟑! 𝟐!.𝟑! = 10 5.2 Fórmula Para Cálculo em Problemas de Distribuição Binomial 𝑃 = ( 𝑛 𝑥 ).(𝑝)𝑥. (𝑞)𝑛−𝑥 n = total de realizações do evento x = número de casos desejados p = probabilidade favorável ao evento desejado q = probabilidade não favorável ao evento desejado 15 Probabilidade e Estatística Universidade Santa Cecília - Educação a Distância Então o problema apresentado na introdução ficaria assim: Uma mulher teve 3 filhos e queremos saber qual a probabilidade de ter nascido exatamente dois homens? n = 3 x = 2 homens p = 1 2 probabilidade favorável a nascer homem q = 1 2 probabilidade não favorável a nascer homem 𝑷 = ( 𝟑 𝟐 ).( 𝟏 𝟐 )𝟐. ( 𝟏 𝟐 ) 𝟑−𝟐 ( 𝟑 𝟐 ) = 𝟑! 𝟐!.(𝟑−𝟐)! = 𝟔 𝟐 = 𝟑 𝑝 = 3. 1 4 . 1 2 = 3 8 = 0,375 ou 37,5% Uma moeda é lançada 5 vezes; qual a probabilidade de se obter exatamente duas caras? 𝑝 = 1 2 𝑒 𝑞 = 1 2 (𝑛 𝑘 ) = 𝐶𝑛,𝑘 = 𝑛! 𝑘!.(𝑛−𝑘)! 𝑃2 = ( 5 2 ). ( 1 2 )2. ( 1 2 )3 𝐶5,2 = 5! 2!.(5−2)! =10 𝑃2 = 10. 1 4 . 1 8 = 0,3125 ou P = 31,25% Um dado é lançado 6 vezes; qual a probabilidade de ser obter face 5 no máximo duas vezes? 𝑝 =1 6 𝑒 𝑞 = 5 6 teremos que calcular 𝑃0 + 𝑃1 + 𝑃2 𝑃0 = ( 6 0 ) . ( 1 6 )0. ( 5 6 )6 𝑃0 = 1. 1 . ( 5 6 )6 = 0,3349 𝑃0 = 33,49% 𝑃1 = ( 6 1 ) . ( 1 6 )1. ( 5 6 )5 𝑃1 = 6. 1 6 . ( 5 6 )6 = 0,401877 𝑃1 = 40,19% 16 Probabilidade e Estatística Universidade Santa Cecília - Educação a Distância 𝑃2 = ( 6 2 ) . ( 1 6 )2. ( 5 6 )4 𝑃2 = 15. 1 36 . ( 5 6 )4 = 0,2009 𝑃2 = 20,09% Então, 𝑃0 + 𝑃1 + 𝑃2 = 93,77% Cinco peças são extraídas de um lote com peças defeituosas e não defeituosas, ao acaso; qual a probabilidade de que todas sejam defeituosas, sabendo que 10% das peças do lote são defeituosas? 𝑝 = 10 100 = 0,1 𝑙𝑜𝑔𝑜 𝑞 = 0,9 Para defeito 𝑃5 = ( 5 5 ) . (0,1)5. (0,9)0 𝑃5 = 1. (0,1) 5. 1 = 0,00001 𝑷𝟓 = 𝟎, 𝟎𝟎𝟏% De um grupo de 20 pessoas; qual a probabilidade de que exatamente duas sejam do gênero masculino? 𝑝 = 1 2 𝑒 𝑞 = 1 2 𝑃2 = ( 20 2 ) . ( 1 2 )2. ( 1 2 )18 𝑃2 = 190. 1 4 . ( 1 2 )18 = 0,000181198 ou Aproximadamente igual a 0,0181198120% 5.3 Agora faça você mesmo! 5.3.1 Na fabricação de placas para computadores, é sabido que 2 em cada 100 são defeituosas. Qual a probabilidade de que uma amostra casual de tamanho dez, contenha: a) nenhuma defeituosa; b) exatamente duas defeituosas; c) exatamente uma defeituosa; d) no máximo duas defeituosas. 17 Probabilidade e Estatística Universidade Santa Cecília - Educação a Distância 6. ESTATÍSTICA DESCRITIVA: 1ª AULA 6.1 Introdução A estatística é o campo de estudo que procura relacionar fatos e números em que há um conjunto de métodos que nos possibilita coletar dados e analisá-los, dessa forma é possível realizar alguma interpretação deles. A estatística é dividida em duas partes: descritiva e inferencial. A estatística descritiva é caracterizada pela organização, análise e apresentação dos dados, enquanto a estatística inferencial tem como característica principal o estudo do comportamento de uma amostra de determinada população e, com base nela, a realização de análises e a apresentação de dados. 6.2 Medidas de Posição ou Tendência Central As medidas de posição são utilizadas em casos em que é possível construir-se um rol numérico com os dados ou uma tabela de frequência. Essas medidas indicam a posição dos elementos em relação ao rol. As três principais medidas de posição são: Média, Moda e Mediana. 6.2.1 Média Considere o rol com os elementos (a1, a2, a3, a4, …, an), a média aritmética desses n elementos é dada por: �̅� = 𝑎1+𝑎2+𝑎3+⋯𝑎𝑛 𝑛 ou �̅� = ∑ 𝑎𝑖.𝑓𝑖 𝑛 𝑛 1 Em um grupo de atletas, as idades dos integrantes foram coletadas e representadas no rol: (18, 20, 20, 20, 21, 23, 23, 25, 28, 28). Vamos agora determinar a idade média dos integrantes desse grupo de atletas. 𝑥𝑖 𝑓𝑖 𝑥𝑖 . 𝑓𝑖 18 1 18 20 3 60 21 1 21 23 2 46 25 1 25 28 2 56 Σ 10 226 �̅� = ∑ 𝑎𝑖 . 𝑓𝑖 𝑛 𝑛 1 �̅� = 226 10 �̅� = 22,6 𝑎𝑛𝑜𝑠 18 Probabilidade e Estatística Universidade Santa Cecília - Educação a Distância 6.2.2 Moda É chamado de moda o dado mais frequente de um conjunto de dados. Utilizando o exemplo apresentado para cálculo da média, teremos como moda a idade de 20 anos, pois é essa idade que mais vezes aparece na distribuição. 6.2.3 Mediana Se o conjunto de informações for numérico e estiver organizado em ordem crescente ou decrescente, a sua mediana será o número que ocupa a posição central. A mediana é dada pelo elemento central de um rol que possui uma quantidade ímpar de elementos. Caso o rol possua uma quantidade par de elementos, devemos considerar os dois elementos centrais e calcular a média aritmética entre eles. Veja na Tabela a seguir, que o número de elementos desse rol é igual a 12 (N = 12), logo, não é possível dividir o rol em duas partes iguais e considerar um único dado de ordem central, para isso precisaríamos uma quantidade ímpar de dados. Assim devemos tomar dois elementos centrais e realizar a média aritmética desses valores. 𝑥𝑖 𝑓𝑖 𝑥𝑖 . 𝑓𝑖 18 1 18 20 3 60 21 1 21 23 2 46 25 1 25 28 2 56 Σ 10 226 Mo = 20 anos 20 anos é a idade de maior frequência 19 Probabilidade e Estatística Universidade Santa Cecília - Educação a Distância Como o N = 12 (par), devemos identificar quais elementos estão no meio da amostra. Nesse caso são dois. Os valores 21 e o próprio 21 ocupam as posições de número 6 e 7 respectivamente (6º e 7º) elementos. Esses valores dividem a amostra em duas partes iguais. Então temos 𝑀𝑑 = 21+21 2 = 21 As idades em anos de 25 pessoas presentes nesta sala de aula são: 20, 19, 22, 24, 25, 26, 18, 19, 18, 20, 21, 22, 23, 21, 19, 20, 19, 22, 21, 23, 24, 25, 22, 20, 22. Determine a média, moda e mediana de idade desse grupo de pessoas. 𝑥𝑖 𝑓𝑖 𝑥𝑖 . 𝑓𝑖 18 2 36 20 3 60 21 2 42 23 2 46 25 1 25 28 2 56 Σ 12 265 Idade em Anos ( 𝑥𝑖) Frequência 𝑓𝑖 𝑥𝑖𝑓𝑖 18 2 36 19 4 76 20 4 80 21 3 63 22 5 110 23 2 46 24 2 48 25 2 50 26 1 26 Σ 25 535 𝑀𝑑 = 21 anos 21 anos é a idade que ocupa a ordem central. 20 Probabilidade e Estatística Universidade Santa Cecília - Educação a Distância Média aritmética (�̅�) = ∑ 𝑥𝑖𝑓𝑖 𝑛 𝑖 𝑛 = 535 25 = 𝟐𝟏, 𝟒 𝒂𝒏𝒐𝒔 A moda (𝑴𝒐), nesse caso é 22 anos. Pois é esse valor que aparece com maior frequência. A mediana (𝑴𝒅), nesse caso, é o valor que ocupa a posição de ordem 𝑛+1 2 , n é ímpar, (N = 25). Assim temos o 13º como o elemento de ordem central. Portanto a mediana é 21 anos. 21 Probabilidade e Estatística Universidade Santa Cecília - Educação a Distância 7. ESTATÍSTICA DESCRITIVA: 2ª AULA 7.1 Medidas de Dispersão As medidas de dispersão são utilizadas nos casos em que somente a média já não é suficiente. Servem para verificar a representatividade das medidas de posição. É possível encontrar séries de valores que têm a mesma média, porém são compostas de forma diferentes. Sejam as séries abaixo: 1ª) 10, 15, 25, 10, 5, 25 2ª) 15, 15, 15, 15, 15, 15 Façamos a verificação para cada série. Média aritmética (�̅�) = ∑ 𝑥𝑖𝑓𝑖 𝑛 𝑖 𝑛 �̅� = 90 6 = 15. Note que em ambos os casos a média é igual a 15. Observe que, o comportamento dos dados, nas duas séries são totalmente diferentes. Assim se faz necessário o uso de medidas de dispersão para uma melhor interpretação dos dados. As medidas de dispersão nos indicarão o quanto os elementos do rol numérico estão afastados da média aritmética. Temos algumas importantes medidas de dispersão. 7.1.1 Variância 𝜎2 Chamamos de variância a média aritmética dos quadrados da diferença entre cada elemento do rol e a média aritmética desse rol. A variância é representada por σ2. Consideremos o rol (𝑥1, 𝑥2, 𝑥3, … 𝑥𝑛) e que ele possua média aritmética �̅�. A variância é dada por: 𝝈𝟐 = ∑(𝒙𝒊−�̅�) 𝟐 𝒏 7.1.2 Desvio - Padrão 𝜎 O desvio-padrão é dado pela raiz da variância, ele nos indica o quanto um dado está disperso em relação à média. O desvio padrão é representado por σ e determinado da seguinte forma: 𝝈 = √𝝈𝟐 22 Probabilidade e Estatística Universidade Santa Cecília - Educação a Distância 7.1.3 Coeficiente de Variação ou de Dispersão Este valor é uma medida relativa de dispersão, e é utilizada para comparar em termos relativos do grau de concentração em torno da média de um conjunto de dados distintos. O coeficiente de dispersão é a razão entre o desvio – padrão e a média (𝐂𝐕 = 𝛔 �̅� ). Geralmente é expresso em porcentagemCalcular a variância, desvio padrão e o coeficiente de variação da amostra descrita abaixo. N = 25 Média aritmética: (�̅�) = ∑ 𝑥𝑖𝑓𝑖 𝑛 𝑖 𝑛 �̅� = 𝟏𝟓𝟒 𝟐𝟓 = 𝟔, 𝟏𝟔 Variância: 𝜎2 = ∑(𝑥𝑖−�̅�) 2 𝑛 = 𝟗𝟓,𝟒𝟒 𝟐𝟓 = 3,82 Desvio – Padrão: 𝝈 = √3,82 = 1,95 Coeficiente de Variação: 𝐶𝑉 = 𝜎 �̅� = 1,95 6,16 =𝟎, 𝟑𝟏𝟔𝟓 𝐨𝐮 𝟑𝟏, 𝟔𝟓% xi 3 4 5 7 8 10 if 2 4 6 8 2 3 Variável ( 𝒙𝒊) Frequência 𝒇𝒊 𝒙𝒊𝒇𝒊 (𝑥𝑖 − �̅�)2. 𝑓𝑖 3 2 6 (3 − 6,16)2.2 = 19,9712 4 4 16 (4 − 6,16)2. 4 = 18,6624 5 6 30 (5 − 6,16)2.6 = 0,1536 7 8 56 (7 − 6,16)2.8 = 5,6448 8 2 16 (8 − 6,16)2.2 = 6,7712 10 3 30 (10 − 6,16)2.3 = 44,2368 Σ 25 154 95,44 23 Probabilidade e Estatística Universidade Santa Cecília - Educação a Distância 8. CORRELAÇÃO ENTRE VARIÁVEIS 8.1 Introdução Nos estudos estatísticos que envolvem o coeficiente de correlação de Pearson (r), que também pode ser chamado de coeficiente de correlação produto-momento, mede a relação que existe entre duas variáveis dentro de uma mesma escala métrica. A finalidade do coeficiente de correlação é determinar qual é a intensidade da relação que existe entre conjuntos de dados ou informações conhecidas sobre duas variáveis expressas numericamente. O valor do coeficiente de correlação pode variar entre -1 e 1 e o resultado obtido define se a correlação é negativa ou positiva ou nula. Condições: r é sempre um valor entre 1 e –1 ou seja: -1 r 1 Se r = 1 as duas variáveis relacionadas têm correlação perfeitamente positivas; Se r = -1 as duas variáveis relacionadas têm correlação perfeitamente negativa; 8.2 Diagrama de Dispersão É importante lembrar que os gráficos são suposições, o gráfico não é uma análise confirmatória, ele é simplesmente uma análise exploratória, ou seja, podemos ter uma ideia gráfica do comportamento das variáveis. Mas, quando temos uma quantidade de dados muita elevada, nossa visão gráfica pode nos levar a uma interpretação errônea. Correlação Positiva – Nesse caso costumamos dizer que as variáveis andam juntas, ou seja, quando uma delas cresce a outra tende a crescer e quando decresce, a outra também tende a decrescer. 0 1 2 3 4 5 6 7 8 0 1 2 3 4 5 6 Série1 24 Probabilidade e Estatística Universidade Santa Cecília - Educação a Distância Correlação Negativa – Nesse caso costumamos dizer que as variáveis andam em sentidos opostos, ou seja, quando uma delas cresce a outra decresce e, quando uma delas decresce a outra tende a crescer. Correlação Nula – Nesse caso, dizemos que há uma baixa relação entre as variáveis, ou não existe (muito fraca) a relação. Veja que no gráfico a seguir, não é possível definir qual o comportamento entre as variáveis. 0 2 4 6 8 10 12 0 1 2 3 4 5 6 Série1 0 2 4 6 8 10 12 0 1 2 3 4 5 6 7 Série1 25 Probabilidade e Estatística Universidade Santa Cecília - Educação a Distância 8.3 Cálculo do Coeficiente de Correlação de Pearson Considere os dados contidos nas tabelas a seguir, construa um diagrama de dispersão para as variáveis x e y e determine o valor do coeficiente de correlação. X Y X2 Y2 X.Y 1 2 1 4 2 2 3 4 9 6 3 4 9 16 12 4 5 16 25 20 5 7 25 49 35 15 21 55 103 75 Fórmula de Pearson 𝒓 = ∑𝒙𝒚− ∑𝒙∑𝒚 𝒏 √(∑𝒙𝟐− (∑𝒙)𝟐) 𝒏 ).(∑𝒚𝟐− (∑𝒚)𝟐 𝒏 ) 𝒓 = 75− 15.21 5 √(55− (15)2 5 ).(103− (21)2 5 ) r = 75 − 63 √(55 − 45). (103 − 88,2) 0 1 2 3 4 5 6 7 8 0 1 2 3 4 5 6 Série1 26 Probabilidade e Estatística Universidade Santa Cecília - Educação a Distância r = 75 − 63 √(55 − 45). (103 − 88,2) r = 12 √(10). (14,8) r = 12 √148 = 12 12,165525206 = 𝟎, 𝟗𝟖𝟔 (correlação positiva) Considere os dados contidos nas tabelas a seguir, construa um diagrama de dispersão para as variáveis x e y e determine o valor do coeficiente de correlação. X Y X2 Y2 X.Y 1 10 1 100 10 2 8 4 64 16 3 6 9 36 18 4 5 16 25 20 5 1 25 1 5 15 30 55 226 69 Fórmula de Pearson 𝒓 = ∑𝒙𝒚− ∑𝒙∑𝒚 𝒏 √(∑𝒙𝟐− (∑𝒙)𝟐) 𝒏 ).(∑𝒚𝟐− (∑𝒚)𝟐 𝒏 ) 0 2 4 6 8 10 12 0 1 2 3 4 5 6 Série1 27 Probabilidade e Estatística Universidade Santa Cecília - Educação a Distância 𝒓 = 𝟔𝟗 − 𝟏𝟓. 𝟑𝟎 𝟓 √(𝟓𝟓 − (𝟏𝟓)𝟐 𝟓 ) . (𝟐𝟐𝟔 − (𝟑𝟎)𝟐 𝟓 ) 𝒓 = 𝟔𝟗 − 𝟗𝟎 √(𝟓𝟓 − 𝟒𝟓). (𝟐𝟐𝟔 − 𝟏𝟖𝟎) 𝒓 = −𝟐𝟏 √(𝟓𝟓 − 𝟒𝟓). (𝟐𝟐𝟔 − 𝟏𝟖𝟎) 𝒓 = −𝟐𝟏 √(𝟏𝟎). (𝟒𝟔) 𝒓 = −𝟐𝟏 √𝟒𝟔𝟎 = −𝟐𝟏 𝟐𝟏,𝟒𝟒𝟕𝟔𝟏𝟎𝟓𝟗 = − 𝟎, 𝟗𝟕𝟗 Correlação negativa Assista o vídeo cujo endereço estar a seguir e conheça uma forma de calcular o coeficiente de correlação de Pearson no ambiente excel. https://www.youtube.com/watch?v=f7psvSOCGS4 8.4 Teste “t” para significância da Correlação de Pearson 8.4.1 Introdução O coeficiente de correlação de Pearson (r) varia de -1 até +1. Se o coeficiente de correlação entre duas variáveis for igual à zero ou muito próximo desse valor, dizemos que há ausência de correlação entre as variáveis. Mas, se o coeficiente de correlação linear entre as variáveis for igual a 0,48? Não se pode julgar o valor desse coeficiente sem saber o tamanho da amostra. Quando a amostra é muito pequena, mesmo coeficientes de correlação com valores altos tem pouco significado. Procedimentos para cálculo do teste “T”: Estabelecer o nível de significância (𝜶) e considerar 𝒏 o número de elementos da amostra. Seja 𝒓 = 𝟎, 𝟕𝟓 para uma amostra com n = 20. Assim ficará: 28 Probabilidade e Estatística Universidade Santa Cecília - Educação a Distância 𝑡 = 𝑟 √1−𝑟2 √𝑛 − 2 𝑡 = 0,75 √1 − (0,75)2 √20 − 2 𝑡 = 0,75 √0,4375 √18 𝑡 = 4,81 Para ∝= 5%, temos na Tabela (Anexo 1 na coluna para 5%) com n – 2 = 20 – 2 = 18 graus de liberdade o valor de t é igual a 2,1. Como o valor calculado em valor absoluto é igual 4,81, nesse caso 4,81 > 2,10, então concluímos que a correlação é significativa. Verificar se a correlação r = 0,38 é significativa calculada sobre uma amostra de tamanho 40, para ∝= 𝟎, 𝟎𝟓. Seja 𝒓 = 𝟎, 𝟑𝟖 para uma amostra com n = 40. Assim ficará: 𝑡 = 𝑟 √1−𝑟2 √𝑛 − 2 𝑡 = 0,38 √1 − (0,38)2 √40 − 2 𝑡 = 0,38 √0,8556 √38 𝑡 = 2,53. Para ∝ = 5%, temos na Tabela (Anexo 1 para 5%) com n – 2 = 40 – 2 = 38 graus de liberdade o valor de t é igual a 2,04 (veja Tabela no anexo 1 na coluna 5%). Como o valor calculado em valor absoluto é igual 2,53, nesse caso 2,53 > 2,04, então concluímos que a correlação é significativa. 29 Probabilidade e Estatística Universidade Santa Cecília - Educação a Distância 9. REGRESSÃO LINEAR 9.1 Introdução O que chamamos de regressão linear é uma fórmula matemática usada para fazer uma estimativa sobre o possível valor de uma variável dependente ou resposta, geralmente chamada de (y), quando são conhecidos os valores de outra variável independente ou explicativa (x). A regressão linear é usada, principalmente, para verificar como o valor de "y" pode sofrer variação em função da variável "x". A reta que contém os valores da verificação da variação é denominada de reta de regressão linear e expressa por 𝒚 = 𝒂 + 𝒃𝒙. Quando a variável explicativa "x" tem um valor único, a regressão será chamada de regressão linear simples. A verdadeira ideia central de uma regressão linear é estudar o que temos para entender como intervir no futuro. O método garante um aspecto importante no mercado. Temos cada vez mais, entrega de produtos mais customizados. O modelo de regressão linear é uma técnica que permite fazer previsões de cenários com indicadores concretos, otimização de processos, projeções em vários setores de uma empresa, tomadasde decisões gerenciais com previsões mais precisas e correção de erros. Inicialmente, construímos um gráfico de dispersão, com a finalidade de conhecer o comportamento entre as variáveis. A regressão nos diz qual é a melhor curva a ser traçada e que se ajusta melhor aos dados, podendo ser uma reta ou uma curva qualquer. 9.2 Ajustamento da reta de regressão do tipo 𝒚 = 𝒂 + 𝒃𝒙 Quando se estuda a variação de uma variável y em função de uma variável x, diz-se que y é a variável dependente e que x é a variável independente ou explanatória. Veja que o gráfico a seguir já apresenta a equação da reta que foi determinada a partir dos dados que envolvem a idade de um grupo de animais e a massa corporal de cada um deles. 30 Probabilidade e Estatística Universidade Santa Cecília - Educação a Distância y = 0,6684x - 1,1582 0,0 3,0 6,0 9,0 12,0 15,0 18,0 21,0 24,0 0 4 8 12 16 20 24 28 32 36 40 M A SS A D O A N IM A L EM K g IDADE DO ANIMAL EM MESES REGRESSÃO LINEAR DA MASSA EM FUNÇÃO DA IDADE Y Y previsto Linear (Y previsto) No caso expresso no gráfico qual será a massa esperada para um animal, se ele tem 38 anos de idade? Basta substituirmos na equação 𝑦 = 0,6684𝑥 − 1,1582 o valor para 𝑥 = 38 𝑎𝑛𝑜𝑠. Fica: 𝒚 = 𝟎, 𝟔𝟔𝟖𝟒. (𝟑𝟖) − 𝟏, 𝟏𝟓𝟖𝟐. y = 24,2 𝒂𝒏𝒐𝒔. Essa é a massa esperada para quando o animal estiver com a idade de 38 anos. Não esqueça que nesse caso já foi dado a equação da reta de regressão linear. Mas, o que queremos mesmo aprender a determiná- la para uma situação que nos interessa fazer estimativas baseadas no comportamento de um conjunto de dados. Portanto, a partir de um conjunto de dados numéricos, determinemos os valores dos coeficientes a e b da reta. Na questão a seguir a idade de crianças e, seu peso é possível estudar como o peso varia em função da idade. Idade (x) em anos Altura (y) em cm 1 64,8 2 94,5 3 99,4 31 Probabilidade e Estatística Universidade Santa Cecília - Educação a Distância 4 106,5 5 118,1 6 118,9 7 128.5 8 132.2 9 137,5 10 148,3 Vamos ajustar a reta y = a + b.x. Neste caso iremos estabelecer a dependência entre as variáveis, Massa e Idade. Teremos que calcular os valores dos coeficientes a e b. Em seguida, escreveremos a equação: 𝒚 = 𝒂 + 𝒃𝒙 𝑏 = 𝑛.∑𝑥.𝑦−∑𝑥.∑𝑦 𝑛.∑𝑥2−(∑𝑥)2 𝒂 = 𝒚 − 𝒃. 𝒙, n é o tamanho da amostra. 𝑥 é 𝑎 𝑚é𝑑𝑖𝑎 𝑑𝑜𝑠 𝑥𝑖 𝑥 = ∑𝑥𝑖 𝑛 𝑦 é 𝑎 𝑚é𝑑𝑖𝑎 𝑑𝑜𝑠 𝑦𝑖 𝑦 = ∑𝑦𝑖 𝑛 Vamos ajustar a reta 𝒚 = 𝒂 + 𝒃𝒙, para os dados abaixo. Neste caso iremos estabelecer a dependência entre as variáveis, Massa e Idade. n = 10. A tabela contém 10 dados. Calculemos primeiramente o valor do coeficiente b 𝐛 = 𝐧.∑ 𝐱. 𝐲 − ∑𝐱. ∑ 𝐲 𝐧. ∑ 𝐱𝟐 − (∑𝐱)𝟐 b = 10. (1218,8) − (55). (190,7) 10. (385) − (55)2 Idade (x) em anos Massa (y) Kg x.y x2 1 9,8 9,8 1 2 12,1 24,2 4 3 13,8 41,4 9 4 16,5 66 16 5 18,1 90,5 25 6 18,9 113,4 36 7 22,5 157,5 49 8 23,2 185,6 64 9 27,5 247,5 81 10 28,3 283 100 55 190,7 1218,9 385 32 Probabilidade e Estatística Universidade Santa Cecília - Educação a Distância 𝑏 = (12.188) − (10.488,5) (3850) − (3025) 𝑏 = (1700,5) (825) 𝒃 = 𝟐, 𝟎𝟔𝟏𝟐𝟏𝟐 Vamos calcular o valor de (a) com o valor de b = 2,06. 𝑎 = 𝑦 − 𝑏. 𝑥, n é o tamanho da amostra. n = 10 𝑥 é 𝑎 𝑚é𝑑𝑖𝑎 𝑑𝑜𝑠 𝑥𝑖 𝑥 = 55 10 = 5,5 𝑦 é 𝑎 𝑚é𝑑𝑖𝑎 𝑑𝑜𝑠 𝑦𝑖 𝑦 = 190,7 10 = 19,07 𝑎 = 𝑦 − 𝑏. 𝑥, a = 19,07 − 2,06. (5,5) 𝐚 = 𝟕, 𝟕𝟒 Então a equação da reta de regressão é: y = 7,74 + 2,06.x, Se quisermos saber a massa esperada de uma criança de 12 anos de idade, basta substituir na equação o valor de x por 12. y = 7,74 + 2,06.(12) y = 32,46 kg Os dados apresentados na tabela a seguir, apresentam o preço em dólares de um componente eletrônico e o índice de eficiência atribuído pelos compradores. Preço Em Dólares ($) x Índice de Eficiência (Pontos) y 𝑥2 𝑦2 𝑥𝑦 8 29 64 841 232 10 32 100 1024 320 12 33 144 1089 396 13 32 169 1024 416 14 33 196 1089 462 13 34 169 1156 442 16 36 256 1296 576 18 39 324 1521 702 17 40 289 1600 680 19 44 361 1936 836 140 352 2072 12576 5062 33 Probabilidade e Estatística Universidade Santa Cecília - Educação a Distância Determine o coeficiente de correlação de Pearson (r) e diga que tipo de correlação (positiva ou negativa) existe entre as variáveis Preço e Índice de Eficiência. r = ∑xy− ∑x∑y n √(∑x2− (∑x)2) n ).(∑y2− (∑y)2 n ) 𝒓 = 𝟓𝟎𝟔𝟐 − 𝟏𝟒𝟎. 𝟑𝟓𝟐 𝟏𝟎 √(𝟐𝟎𝟕𝟐 − (𝟏𝟒𝟎)𝟐 𝟏𝟎 ) . (𝟏𝟐𝟓𝟕𝟔 − (𝟑𝟓𝟐)𝟐 𝟏𝟎 ) 𝒓 = 𝟓𝟎𝟔𝟐 − 𝟒𝟗𝟐𝟖 √(𝟐𝟎𝟕𝟐 − 𝟏𝟗𝟔𝟎). (𝟏𝟐𝟓𝟕𝟔 − 𝟏𝟐𝟑𝟗𝟎, 𝟒) 𝒓 = 𝟏𝟑𝟒 √(𝟏𝟏𝟐). (𝟏𝟖𝟓, 𝟔) 𝐫 = 𝟏𝟑𝟒 √𝟐𝟎𝟕𝟖𝟕,𝟐 = 𝟎, 929 Correlação forte positiva. Já que determinamos a correlação, então vamos ajustar a reta de regressão linear e confirmar que o sinal da correlação (positivo ou negativo) é e mesmo sinal do coeficiente da variável x da reta de regressão, nesse caso estamos adotando como b. Ajuste uma reta de regressão Linear reta 𝒚 = 𝒂 + 𝒃𝒙, para o índice de eficiência em função do preço. Faça uma previsão de índice de eficiência para um componente de 22 dólares. n = 10. A tabela contém 10 dados. Calculemos primeiramente o valor do coeficiente b 𝑏 = 𝑛.∑ 𝑥. 𝑦 − ∑𝑥. ∑𝑦 𝑛. ∑ 𝑥2 − (∑𝑥)2 𝑏 = 10. (5062) − (140). (352) 10. (2072) − (140)2 𝑏 = (50620) − (49280) (20720) − (19600) 𝑏 = (𝟏𝟑𝟒𝟎) (𝟏𝟏𝟐𝟎) 𝒃 = 𝟏, 𝟏𝟗𝟔4 Vamos calcular o valor de (a) com o valor de b = 1,1964. 𝑎 = 𝑦 − 𝑏. 𝑥, n é o tamanho da amostra. n = 10 34 Probabilidade e Estatística Universidade Santa Cecília - Educação a Distância 𝑥 é 𝑎 𝑚é𝑑𝑖𝑎 𝑑𝑜𝑠 𝑥𝑖 𝑥 = 140 10 = 14 𝑦 é 𝑎 𝑚é𝑑𝑖𝑎 𝑑𝑜𝑠 𝑦𝑖 𝑦 = 352 10 = 35,2 𝑎 = 𝑦 − 𝑏. 𝑥, a = 35,2 − 1,1964. (14) a = 18,45 Então a equação da reta de regressão é: 𝒚 = 𝟏𝟖, 𝟒𝟓 + 𝟏, 𝟏𝟗𝟔𝟒𝒙 Assista o vídeo cujo endereço estar a seguir e conheça uma forma rápida de ajustar uma reta de regressão linear no ambiente excel. https://www.youtube.com/watch?v=KLQjfr0LyG0 35 Probabilidade e Estatística Universidade Santa Cecília - Educação a Distância 10. RESPOSTAS 2.4.1 a) 150 b) 31 2.4.2 252 equipes 2.4.3 a) 24 b) 12 c) 48 2.4.4 36 associações 5.3.1 a) nenhuma defeituosa; aproximadamente igual 81,7072806% b) exatamente duas defeituosas; aproximadamente igual a 1,5313734% c) exatamente uma defeituosa; aproximadamente igual 16,6749552% d) no máximo duas defeituosas. aproximadamente igual a 99,9136092% Anexo 1: Tabela dos Valores de t, segundo os graus de liberdade e o valor do nível de significância alfa (𝛼 ). Referência Bibliográfica: VIEIRA, S. Introdução à bioestatística. 3ª. ed. Rio de Janeiro: Campus, 1980. 196 p. 36 Probabilidade e Estatística Universidade Santa Cecília - Educação a Distância DEVORE, J. L. Probabilidade e Estatística para Engenharia e Ciências. Tradução: Marcos Tadeu Andrade Cordeiro. São Paulo, SP: Cengage Learning, 2015. LEVINE, D. M. et al. Estatística Teoria e Aplicações: usando o Microsoft Excel em português. Tradução: Teresa Cristina Padilha de Souza. Rio de Janeiro, RJ: LTC editora, 2012. MORETTIN, L. G. Estatística Básica: probabilidades e inferência. São Paulo, SP: Pearson Prentice Hall, 2010. Caro participante do Curso de Análise e Desenvolvimento de Sistemas na modalidade EAD da UNISANTA, como professor responsável poressa disciplina, espero que você tenha encontrado facilidade no processo de compreensão conceitual dos temas apresentados em videoaulas e textos. Esses tópicos de Análise combinatória, probabilidade e Estatística, que foram apresentados, discutidos e sugeridos em algumas questões, trarão a você, consistência teórica e prática na continuação do curso. Estou a sua disposição para eventuais dúvidas. Façam contato: jesusmar@unisanta.br Um grande abraço! Prof. Dr. Marcos Antonio S. de Jesus
Compartilhar