Baixe o app para aproveitar ainda mais
Prévia do material em texto
Estatística Aplicada Professor conteudista: Maurício Martins do Fanno Sumário Estatística Aplicada Unidade I 1 TEORIA ELEMENTAR DAS PROBABILIDADES ...........................................................................................3 1.1 Definições de probabilidade ................................................................................................................4 1.2 Cálculos das probabilidades elementares ......................................................................................5 1.3 Árvores de decisões ................................................................................................................................9 1.4 Análises combinatórias .......................................................................................................................11 1.5 Experimentos aproximadamente aleatórios .............................................................................. 17 1.6 Evento soma e evento produto ...................................................................................................... 19 1.7 Eventos independentes e eventos vinculados .......................................................................... 24 1.8 Revisão teórica dos conceitos estudados ................................................................................... 26 2 DISTRIBUIÇÕES DE PROBABILIDADES ..................................................................................................... 32 2.1 Distribuições de probabilidades ...................................................................................................... 33 2.2 Distribuição de probabilidades binomial .................................................................................... 34 2.3 Valor e variância esperados .............................................................................................................. 41 2.4 Distribuição normal ............................................................................................................................. 44 2.4.1 Conceitos básicos .................................................................................................................................... 44 2.4.2 Cálculo das áreas da curva normal .................................................................................................. 48 Unidade II 3 AMOSTRAGEM .................................................................................................................................................. 63 3.1 Teoria elementar da amostragem .................................................................................................. 66 3.2 Teoria da estimação estatística ...................................................................................................... 74 4 CORRELAÇÃO E REGRESSÃO LINEARES ................................................................................................. 81 4.1 Correlação linear .................................................................................................................................. 82 4.2 Regressão linear .................................................................................................................................... 85 1 ESTATÍSTICA APLICADA Re vi sã o: T at ia ne - D ia gr am aç ão : M ár ci o - 18 /0 5/ 10 Unidade I 5 10 15 20 Apresentação Prezado aluno, Este texto foi produzido como sequência do curso de Estatística. Todos os conceitos aprendidos lá serão utilizados aqui como matéria-prima para o aprofundamento dos conceitos estatísticos. Em Estatística Aplicada, veremos assuntos mais próximos da prática profissional do que vimos anteriormente, mas necessitaremos de ferramentas matemáticas mais elaboradas. Na medida do possível, iremos revê-las quando forem necessárias. Mas é sempre conveniente que você revise os conceitos matemáticos aprendidos em disciplinas anteriores. O estudo da estatística, como de todas as ciências exatas, obriga à repetição, o maior número de vezes possível, de exercícios de fixação. No presente material, os cálculos definidos são mostrados uma única vez, como exemplo, mas o aluno deve se lembrar de que terá à disposição nos materiais complementares uma grande quantidade de exercícios e problemas e que o aprendizado somente será garantido caso eles sejam feitos em sua totalidade. Na disciplina de Estatística, vimos e diferenciamos população e amostra e a seguir passamos ao estudo da estatística descritiva ou, em última análise, ao estudo das amostras. E agora iremos passar ao estudo das populações e das relações entre as populações e suas amostras. 2 Unidade I Re vi sã o: T at ia ne - D ia gr am aç ão : M ár ci o - 18 /0 5/ 10 A ideia geral é conhecer primeiro qual é o comportamento previsto para populações e amostras e, a seguir, relacioná-las, obtendo previsões com razoável grau de confiança. O curso de Estatística Aplicada foi dividido em quatro capítulos. No capítulo 1, trataremos dos assuntos referentes às probabilidades. Como são calculadas e quais seus limites de utilização. Esses conceitos são importantes para se ter a ideia exata do que significa algo ser provável, e não certo. É um assunto no qual o raciocínio lógico é fundamental. Procurou-se apresentá-lo de maneira progressiva e natural, não se prendendo a grandes refinamentos matemáticos. No final desse capítulo, você vai encontrar um resumo no qual as ferramentas matemáticas são apresentadas de modo mais formal. No capítulo 2, trataremos das distribuições de probabilidades, que a exemplo das distribuições de frequências já vistas apresentam os valores trabalhados de maneira mais resumida e direta. Devemos notar que, ao contrário das distribuições de frequências, as informações são prováveis, e não reais. Serão apresentadas as duas mais importantes distribuições de probabilidades – a distribuição binomial e a distribuição normal. A partir de seu estudo, pode-se estender o conhecimento para as outras distribuições, bem menos usadas na prática. O capítulo 3 refere-se à amostragem, ou seja, ao estudo das relações entre as populações e as amostras delas retiradas. São basicamente três vertentes de estudo: • a previsão do comportamento de amostras a partir do conhecimento da população da qual foram retiradas; • a previsão do comportamento de uma população a partir do estudo de amostras dela retirada; • e a previsão da comparação entre amostras e populações, na pesquisa de diferenças casuais ou causais. 5 10 15 20 25 30 3 ESTATÍSTICA APLICADA Re vi sã o: T at ia ne - D ia gr am aç ão : M ár ci o - 18 /0 5/ 10 O capítulo 4 aborda as relações e correlações entre duas variáveis e o comportamento matemático dessas relações. Procura-se verificar se, dadas duas variáveis, existe entre elas algum tipo de relacionamento e, se existir, qual é. Com esses assuntos abordados assimilados, poderemos entender como se pode prever um acontecimento futuro ou desconhecido, a partir de estudos relativamente menos trabalhosos, permitindo que se tenham ferramentas preciosas para a tomada de decisões, em última análise, a finalidade básica de qualquer ramo profissional. Esperamos que, com esse material, você tenha a oportunidade de completar o aprendizado de Estatística e que possa utilizá-la como instrumental básico para seu melhor desempenho profissional. Bons estudos! Prof. Mauricio Martins do Fanno PROBABILIDADES E DISTRIBUIÇÕES DE PROBABILIDADES 1 TEORIA ELEMENTAR DAS PROBABILIDADES Objetivos Em estatística indutiva quando nos referimos a uma previsão de comportamento de uma população a partir do conhecimento de uma amostra,ou, ao contrário, a previsão do comportamento esperado de uma amostra retirada de uma população conhecida, temos o cuidado de utilizar a palavra “provavelmente” antes de cada informação. Assim, por exemplo, quando após uma pesquisa eleitoral, um veículo de comunicação informa que, se a eleição fosse naquele 5 10 15 20 4 Unidade I Re vi sã o: T at ia ne - D ia gr am aç ão : M ár ci o - 18 /0 5/ 10 momento, o candidato X teria 35% dos votos, ele quer dizer que provavelmente o candidato X teria essa quantidade de votos. É uma afirmação provável de ocorrer, não quer dizer ocorrerá com certeza. Uma tolerância nessa informação é esperada. Neste capítulo, veremos o que significa e como são calculadas as probabilidades, ramo de estudo da matemática, e não exatamente da estatística. Inicialmente, verificaremos casos absolutamente teóricos e, posteriormente, evoluiremos para situações mais próximas da realidade. Tentaremos utilizar o raciocínio lógico para resolver as questões e no final do capítulo faremos uma revisão teórica, apresentando os conceitos e as fórmulas utilizadas na teoria elementar das probabilidades. O importante é você dominar o mecanismo de cálculo da probabilidade. 1.1 Definições de probabilidade Caso você procure a definição de probabilidade em um dicionário, o Aurélio, por exemplo, irá encontrar algo do tipo: Probabilidade: 1. Qualidade do provável. 2. Motivo ou indício que deixa presumir a verdade ou a possibilidade de um fato, verossimilhança. Como é fácil notar, essa definição não acrescenta nada ao conceito intuitivo que temos de probabilidade. Isso porque o conceito de probabilidade é circular, ou seja, define-se probabilidade utilizando seus próprios termos. Desse modo, desenvolve-se atualmente uma abordagem axiomática na definição de probabilidade, mantendo-se seu conceito indefinido, algo semelhante ao que acontece em geometria com as definições de ponto e reta. 5 10 15 20 25 5 ESTATÍSTICA APLICADA Re vi sã o: T at ia ne - D ia gr am aç ão : M ár ci o - 18 /0 5/ 10 Estatisticamente, no entanto, adotam-se três abordagens diferentes na definição de probabilidades: a abordagem clássica, a abordagem como frequência relativa e a abordagem subjetiva. Entretanto, antes de seguirmos na definição de probabilidade, é necessário definir alguns termos que serão utilizados: • Experimento amostral: é aquele que, apesar de ser repetido exatamente da mesma maneira, não apresenta resultados obrigatoriamente iguais. Por exemplo, você pode jogar um dado exatamente da mesma maneira duas vezes, e nada garantirá que obterá o mesmo resultado. • Espaço amostral (ou conjunto universo ou espaço das probabilidades): é o conjunto formado por todos os resultados possíveis de um experimento aleatório. Por exemplo, o espaço amostral de um jogo de um dado honesto é dado por: S = {1, 2, 3, 4, 5, 6} – Observe que o dado deve ser honesto, se não for, o experimento não é aleatório. • Evento: é um determinado subconjunto formado por um ou mais elementos do espaço amostral. Por exemplo, em um jogo de dados, o evento número primo é formado por: E = {1, 2, 3, 5} 1.2 Cálculos das probabilidades elementares Podemos definir estatisticamente a palavra probabilidade usando estes termos: • Abordagem clássica: é a razão (divisão) entre o número de elementos (ou resultados) favoráveis a um determinado 5 10 15 20 25 6 Unidade I Re vi sã o: T at ia ne - D ia gr am aç ão : M ár ci o - 18 /0 5/ 10 evento e o número total de elementos (ou resultados) do espaço amostral, ou seja: P A n A n S ( ) ( ) ( ) = Sendo P(A) a probabilidade de ocorrer o evento A. n(A), o número de elementos favoráveis ao evento A. n(S), o número total de elementos do espaço amostral. Por exemplo: Qual é a probabilidade de, ao se jogar um dado honesto, se obter um número primo? Enúmeros primos : A = {1, 3, 4, 5} ∴ n(A) = 4 S n A= { }∴ =12 3 4 5 6 6, , , , , ( ) P A n A n S P A( ) ( ) ( ) ( ) , , %= ⇒ = = =4 6 0 667 66 7 • Abordagem como frequência relativa: é a razão entre o número de vezes que determinado resultado ocorre, quando repetimos o experimento aleatório um número elevado de vezes. Por exemplo: jogamos uma moeda 1.000 vezes e em 512 dessas vezes saiu cara. Podemos dizer por esta definição que a probabilidade de sair cara nessa moeda é de 512/1.000, ou seja, 51,2%. Esse raciocínio seria simbolizado da seguinte forma: P A f f f P A fRA A T RA ( ) ( ) . , , %= = ⇒ = = = =512 1 000 0 512 512 5 10 15 20 7 ESTATÍSTICA APLICADA Re vi sã o: T at ia ne - D ia gr am aç ão : M ár ci o - 18 /0 5/ 10 Note que o resultado acima não é o mesmo que o calculado pela definição anterior (50%). Isso pode se dever ao fato de a moeda usada não ser honesta (portanto com resultados aleatórios) ou ao fato de o número de jogadas não ter sido suficientemente grande. Aumentando o número de jogadas, a probabilidade tenderá ao valor teórico de 50%, se a moeda for honesta. • Abordagem subjetiva: ao contrário das definições anteriores, nesta, a probabilidade não é um valor objetivo, mas algo que indica a “crença” do analista naquela ocorrência. Evidentemente que esta probabilidade não é fruto de um “palpite”, um “chute”, e sim algo embasado em dados objetivos, mas complementados por aspectos pessoais. É o caso, por exemplo, do meteorologista que prevê 80% de chances de ocorrerem chuvas em determinado período. Este capítulo da estatística é estudado em análise bayesiana de decisão. Durante nosso curso, utilizaremos as duas primeiras abordagens, de acordo com o campo de estudo em que estivermos. Deve-se notar que a primeira abordagem é eminentemente teórica e pressupõe experimentos aleatórios em que os elementos são equiprováveis. Já na segunda abordagem podem ser introduzidos fatores diversos, característicos de determinadas situações não totalmente aleatórias. Apesar de basicamente o cálculo de probabilidades envolver uma das duas relações descritas anteriormente, existem axiomas, teoremas e propriedades que devem ser conhecidos para o correto uso da teoria. Antes, porém, de nos preocuparmos com a teoria envolvida, iremos nos ater à lógica que permeia o cálculo de probabilidades. Para tanto, analisaremos a seguinte sequência de questões: 1. Uma moeda honesta é jogada uma única vez, qual é a probabilidade de que o resultado seja cara? 5 10 15 20 25 30 8 Unidade I Re vi sã o: T at ia ne - D ia gr am aç ão : M ár ci o - 18 /0 5/ 10 Pelo modo como o exercício é proposto, devemos calcular a probabilidade como uma razão entre o número de elementos favoráveis ao evento cara e o número total de elementos possíveis. Número de elementos do evento cara: n(A) = 1 Número de elementos total: n(S) = 2 P A n A n S P cara( ) ( ) ( ) ( )= ⇒ = 1 2 2. Duas moedas honestas são jogadas simultaneamente, qual é a probabilidade de que pelo menos uma seja cara? Note que neste caso o espaço amostral se tornou ligeiramente mais complexo: S = {CaraCara; CaraCoroa; CoroaCara; CoroaCoroa}. E o evento pedido é: E = {CaraCara; CaraCoroa; CoroaCara}, Logo, a probabilidade é: P n A n S P( ) ( ) ( ) ( )pelo menos uma cara pelo menos uma cara= ⇒ = =3 4 00 75 75, %= Observe que, do ponto de vista do cálculo de probabilidade, jogar simultaneamente duas moedas é o mesmo que jogar uma, anotar o resultado e depois jogar outra. 5 10 15 20 9 ESTATÍSTICA APLICADA Revi sã o: T at ia ne - D ia gr am aç ão : M ár ci o - 18 /0 5/ 10 1.3 Árvores de decisões 3. Quatro moedas são jogadas simultaneamente, qual é a probabilidade de que se obtenham pelo menos duas caras? Perceba que ficou muito mais complexo estabelecer o espaço amostral e o evento solicitado. O princípio é o mesmo dos exercícios anteriores, mas, como o número de moedas aumentou, as dificuldades envolvidas também aumentam. Para facilitar nosso raciocínio, iremos introduzir duas ferramentas: a árvore de decisões e a análise combinatória. A árvore de decisões consiste em representar graficamente todas as possibilidades de resultados dos experimentos aleatórios, de modo a não se perder nenhum evento e ao mesmo tempo se compreender a mecânica do experimento. Joga-se uma moeda honesta. Os resultados podem ser: cara coroa A seguir, está desenhada a árvore de decisões do experimento “jogar quatro moedas honestas simultaneamente”. Note que, com certeza, não esquecemos nenhum dos resultados possíveis. 5 10 15 10 Unidade I Re vi sã o: T at ia ne - D ia gr am aç ão : M ár ci o - 18 /0 5/ 10 Joga-se uma moeda honesta sucessivamente 4 vezes cara coroa cara coroa cara coroa coroa cara coroa cara coroa cara coroa cara coroa cara coroa cara coroa cara coroa cara coroa cara coroa cara coroa cara coroa cara Resultados da: 1ª moeda jogada 2ª moeda jogada 3ª moeda jogada 4ª moeda jogada Caminho 1 Caminho 2 Caminho 3 Caminho 4 Caminho 5 Caminho 6 Caminho 7 Caminho 8 Caminho 9 Caminho 10 Caminho 11 Caminho 12 Caminho 13 Caminho 14 Caminho 15 Caminho 16 De posse da árvore de decisões, conseguimos responder mais facilmente ao solicitado na questão 3. Perceba que, após se jogar a moeda pela quarta vez, nós teremos um total de 16 soluções (caminhos) possíveis. Observe o caminho número 1: na primeira vez que se jogou a moeda, saiu cara; na segunda jogada, saiu cara de novo; assim como na terceira e na quarta jogadas, ou seja, o caminho um é formado pelos eventos sucessivos: cara – cara – cara – cara. 5 11 ESTATÍSTICA APLICADA Re vi sã o: T at ia ne - D ia gr am aç ão : M ár ci o - 18 /0 5/ 10 Da mesma forma, teremos outras 15 combinações possíveis, das quais as de números 1,2,3,4,5,6,7,9,10,11,13 apresentam a resposta que desejamos, ou seja, pelo menos duas caras, as demais apresentam uma ou nenhuma cara, portanto não nos interessam. Assim, temos um total de 16 elementos no espaço amostral, sendo que 11 deles são favoráveis à nossa pergunta, portanto a probabilidade de que ocorra pelo menos uma cara é de 11 possibilidades em 16, ou seja: P A n A n S P( ) ( ) ( ) ( ) , , %= ⇒ = = =pelo menos uma cara 11 16 0 6875 68 75 Agora note que o número de possibilidades (ou seja, elementos) do espaço amostral cresce continuamente. Caso jogássemos uma quinta vez a moeda, teremos 32 resultados diferentes. Uma maneira de trabalharmos com essa grande quantidade de números é o uso da análise combinatória. (Atenção: aqui iremos trabalhar superficialmente com esse assunto. Utilizaremos apenas as ferramentas que nos são importantes neste capítulo.) 1.4 Análises combinatórias Perceba que o cálculo de probabilidade continuará a ser feito por meio da razão entre o número de elementos favoráveis ao evento que estamos estudando e o número total de elementos do espaço amostral. A análise combinatória nos servirá para calcular de maneira menos trabalhosa essas quantidades. Se você olhar a árvore de decisões do jogo de moedas, irá perceber que o espaço amostral cresce em número de elementos da seguinte maneira: 5 10 15 20 25 12 Unidade I Re vi sã o: T at ia ne - D ia gr am aç ão : M ár ci o - 18 /0 5/ 10 Número de jogadas da moeda Número de resultados diferentes 1 2 2 4 3 8 4 16 É fácil notar que a relação matemática existente entre o número de jogadas e o número de resultados possíveis é de ab, em que a é o número de resultados possíveis de ocorrer em uma única repetição do experimento (no caso, a = 2 porque os resultados possíveis são cara ou coroa) e b é o número de repetições do experimento (no caso na tabela anterior, temos n variando de 1 a 4). Desse modo, se quisermos saber o número de elementos do espaço amostral de 6 jogadas de uma moeda, bastaria fazermos o cálculo 26 = 64 resultados diferentes. Em análise combinatória, esse procedimento é conhecido como cálculo do número de arranjos com repetição. Aa,b=a b Observação: esta fórmula é lida da seguinte maneira: “número de arranjos com repetições de a elementos repetidos b vezes”. Por outro lado, observando a árvore de decisões, podemos contar o número de caras que pode aparecer na quarta jogada montando o quadro abaixo: Número de coroas que apareceu Número de caras que apareceu “Caminhos” Quantidade de caminhos quatro coroas zero cara 16 1 três coroas uma cara 8-12-14-15 4 duas coroas duas caras 4-6-7-10-11-13 6 uma coroa três caras 2-3-5-9 4 zero coroa quatro caras 1 1 5 10 15 13 ESTATÍSTICA APLICADA Re vi sã o: T at ia ne - D ia gr am aç ão : M ár ci o - 18 /0 5/ 10 Na análise combinatória, o número de caminhos é dado pelo número de combinações, obtido por meio da fórmula: C n x n xn x, ! !( )! = − Em que n = número total de repetições do experimento; no caso n = 4 (quatro vezes em que a moeda é jogada). E x = números de resultados desejados; no caso, x varia de 0 a 4 (número de caras desejadas). Observação: a fórmula anteriormente mencionada é lida da seguinte maneira: “número de combinações de n elementos tomados de x a x vezes”, e utiliza o conceito de fatorial (!). Fatorial de um número a, simbolizado por a!, é a multiplicação de todos os números inteiros e positivos desde a unidade até o valor a; ou seja: a!=1x2x3x4x... ...xa Por exemplo: 6! é igual a 720, porque: 6!=1x2x3x4x6=720 Notar que, por definição, 0! é igual a 1. O quadro a seguir mostra o cálculo das combinações do exemplo dado. Verifique que coincide com os números obtidos por meio da árvore de decisões. 5 10 15 20 14 Unidade I Re vi sã o: T at ia ne - D ia gr am aç ão : M ár ci o - 18 /0 5/ 10 Número de caras que queremos obter Fórmula do cálculo das combinações Número de combinações obtidas Zero cara C x4 0 4 0 4 0 4 0 4 24 1 24 1, ! !( )! ! !( )! = − = = = 1 Uma cara C x41 4 1 4 1 4 0 1 24 1 6 4, ! !( )! !( )! = − = = = 4 Duas caras C x4 2 4 2 4 2 4 2 2 24 2 2 6, ! !( )! ! !( )! = − = = = 6 Três caras C x4 3 4 3 4 3 4 3 1 24 6 1 4, ! !( )! ! !( )! = − = = = 4 Quatro caras C x4 4 4 4 4 4 4 4 0 24 24 1 1, ! !( )! ! !( )! = − = = = 1 Perceba que temos agora todas as informações necessárias para o cálculo das probabilidades envolvidas no experimento de “Quatro jogadas sucessivas de uma moeda honesta”. O quadro a seguir resume estes valores: Eventos Número total de resultados do espaço amostral (número de “caminhos”) Calculado usando-se arranjos com repetições Número total de resultados favoráveis ao evento Calculado usando-se combinações Probabilidade de ocorrência Obter zero cara 16 1 1 16 0 0625 6 25= =, , % Obter uma cara 16 4 416 0 2500 25 00= =, , % Obter duas caras 16 6 6 16 0 3750 37 50= =, , % Obter três caras 16 4 4 16 0 2500 25 00= =, , % Obter quatro caras 16 1 1 16 0 0625 6 25= =, , % Somatório 100% 15 ESTATÍSTICA APLICADA Re vi sã o: T at ia ne - D ia gr am aç ão : M ár ci o - 18 /0 5/ 10 Esse quadro resume todos os possíveis resultados do experimento: “jogar quatro vezes uma moeda honesta”. Cada um desses resultados é um evento diferente, e a probabilidade de cada evento ocorrer é obtida pela divisão do número de vezes em que ele ocorre pelo número de resultados totais do experimento. Obter pelo menos duas caras significa obter ou exatamente duas caras, ou exatamente três caras ou exatamente quatro caras. Assim sendo, a probabilidade de se obter pelo menos duas caras é a soma das probabilidades de se obter duas ou três ou quatro caras. Essas probabilidades foram calculadas no quadro anterior, portanto: P(obter pelo menos duas caras) = 0,3750 + 0,2500 + 0,0625 = 0,6875 ou 68,75% Note que é exatamente o valor obtido anteriormente, com a utilização da árvore de decisões. Com esses conceitos, poderíamos calcular o exemplo a seguir, que é mais trabalhoso: 4. Vinte moedas são jogadas simultaneamente, qual é a probabilidade de que se obtenham exatamente oito caras? Essa questão é muito semelhante à anterior, porém envolve uma quantidade de moedas e resultados que inviabiliza o uso da árvore de decisões. Mas sabemos calcular questões desse tipo usando os conceitos de análise combinatória: • O número total de resultados possíveis é o número de arranjos com repetições de 20 moedas que podem apresentar dois resultados diferentes. Aa,b=a b=220=1.048.576 • O número total de resultados que nos interessa é o número de combinações de 20 moedas, das quais oito sejam caras: 5 10 15 20 25 16 Unidade I Re vi sã o: T at ia ne - D ia gr am aç ão : M ár ci o - 18 /0 5/ 10 C n x n x Cn x, , ! !( )! ! !( )! ! ! ! . . .= − ⇒ = − = × =20 8 20 8 20 8 20 8 12 2 432 902 008.. . . . . . . 176 640 000 40 320 479 001 600 125 970 × = • A probabilidade de ocorrer oito caras é de: P A n A n S P( ) ( ) ( ) ( ) . . . = ⇒ = =exatamente oito caras 125 970 1 048 576 00 1201 12 01, , %= Observação: os números envolvidos anteriormente são relativamente grandes, mas, com uma calculadora científica ou na planilha Excel, o trabalho é relativamente simples. Mesmo o cálculo do número de combinações pode ser facilitado se utilizarmos o conceito de simplificação, como mostrado a seguir: C x x x x x x x x x x x x x20 8 2 20 8 12 12 13 14 15 16 17 18 19 20 1 2 3 4 5, ! ! ! != = • • • • • xx x x x6 7 8 12 125 970 ! .= Vamos utilizar esses conhecimentos adquiridos para fazer um cálculo que talvez não deixe você contente: 4. Qual é a probabilidade de se ganhar o prêmio máximo na Mega-Sena fazendo-se um jogo com sete dezenas? Observe que na Mega-Sena é necessário acertar seis dezenas para se ganhar o prêmio máximo. Caso se jogue sete dezenas, temos 7 chances de acertar as seis dezenas: C n x n x Cn x, , ! !( )! ! !( )! ! ! ! = − ⇒ = − = × = × =76 7 6 7 6 7 6 1 5040 720 1 7 Mas quantos resultados diferentes podem ocorrer? 5 10 15 17 ESTATÍSTICA APLICADA Re vi sã o: T at ia ne - D ia gr am aç ão : M ár ci o - 18 /0 5/ 10 Na Mega-Sena, existem 60 números possíveis, dos quais você deve acertar seis, ou seja: C n x n x Cn x, , ! !( )! ! !( )! ! ! ! = − ⇒ = − = × =60 6 60 6 60 6 60 6 54 50.063.860 Resumindo, você tem 7 chances em 50.063.860 de acertar na Mega-Sena, o que dá uma probabilidade de: P A n A n S P( ) ( ) ( ) ( ) . . = ⇒ = =ganhar na Mega-Sena 0,00000017 50 063 860 44 0,000014= % Melhor continuar estudando, não é? 1.5 Experimentos aproximadamente aleatórios Até aqui, sempre que nos referimos às moedas, frisamos que ela era honesta. Por que isso? Porque uma moeda honesta é absolutamente aleatória, ou seja, por mais que a joguemos, nunca iremos saber qual o próximo resultado que irá ocorrer, e também porque a probabilidade de cair cara em uma moeda honesta é de 50%, assim como de sair coroa. Nem sempre será assim. Podemos ter moedas viciadas, e, em situações mais próximas da realidade do dia a dia, com certeza os experimentos não serão absolutamente aleatórios, mas aproximadamente aleatórios, e as probabilidades de ocorrência serão dadas pelas frequências relativas observadas. Imagine que você tenha nas mãos uma moeda, que não sabe se é honesta ou viciada. Como poderia saber? Testando-a, ou seja, jogando-a repetidas vezes e anotando os resultados. 5 10 15 20 18 Unidade I Re vi sã o: T at ia ne - D ia gr am aç ão : M ár ci o - 18 /0 5/ 10 Caso os resultados tendam para 50% de sair cara e 50% de sair coroa, a moeda seria honesta, caso contrário, viciada. Obviamente, quanto maior o número de vezes que a testar maior a segurança que se terá nessa resposta. O quadro a seguir mostra uma sucessão teórica de testes em duas moedas: Número de vezes que a moeda foi lançada Moeda A Moeda B Nº de caras Probabilidade de cara Nº de coroas Probabilidade de coroa Nº de caras Probabilidade de cara Nº de coroas Probabilidade de coroa 10 6 60,0% 4 40,0% 5 50,0% 5 50,0% 30 14 46,7% 16 53,3% 16 53,3% 14 46,7% 40 19 47,5% 21 52,5% 23 57,5% 17 42,5% 50 27 54,0% 23 46,0% 29 58,0% 21 42,0% 100 52 52,0% 48 48,0% 57 57,0% 43 43,0% 500 249 49,8% 251 50,2% 290 58,0% 210 42,0% 1.000 505 50,5% 495 49,5% 589 58,9% 411 41,1% 10.000 5.010 50,1% 4.990 49,9% 5.809 58,1% 4.191 41,9% Note algumas características importantes: • Para poucos lançamentos, não é possível assumir se as moedas são honestas ou viciadas. O número de observações não é suficiente. Isso é constante na estatística indutiva. Precisamos de uma quantidade de observações mínima para se chegar a alguma conclusão. • À medida que o número de observações vai crescendo, cristalizamos a ideia de que a moeda A é honesta e a moeda B, viciada. Perceba que em 10 jogadas não há nada de estranho em se obter 6 caras e 4 coroas, mas, quando jogamos a moeda 100 vezes e obtemos 57 caras, algo não acidental está ocorrendo. Não é possível que seja uma questão de “sorte” ou “azar”. 5 10 15 19 ESTATÍSTICA APLICADA Re vi sã o: T at ia ne - D ia gr am aç ão : M ár ci o - 18 /0 5/ 10 • A partir dessas observações, podemos assumir que a moeda A é honesta e a probabilidade de se obter cara é igual à de se obter coroa, no valor de 50% (o fato de os cálculos não resultarem exatamente em 50% é efeito de variações aceitáveis). • Já a moeda B é viciada, e a probabilidade de se obter cara é de 58% (aproximadamente) e de a se obter coroa, 42%. A partir desses conceitos, podemos abrir um pouco mais o leque dos nossos cálculos, resolvendo a questão do próximo item. 1.6 Evento soma e evento produto 5. Jogamos a moeda B, mencionada anteriormente, três vezes em sequência. Qual é a probabilidade de que obtenhamos pelo menos duas caras? Vamos entender a questão mediante o uso da árvore de decisões. É a mesma árvore usada anteriormente, mas com uma diferença. Sobre cada decisão (simbolizada pelas flechas), colocaremos a probabilidade correspondente. Cada “caminho” será formado de várias decisões em sequência, cada uma delas com probabilidades diferentes.A probabilidade de ocorrência de um caminho em especial é dada pela multiplicação das probabilidades individuais. A isso chamamos de evento produto. 5 10 15 20 20 Unidade I Re vi sã o: T at ia ne - D ia gr am aç ão : M ár ci o - 18 /0 5/ 10 Observe na própria figura o cálculo dos vários caminhos: Joga-se uma moeda viciada sucessivamente 3 vezes cara coroa cara coroa cara coroa coroa cara coroa cara coroa cara coroa cara Resultados da: 1ª moeda jogada 2ª moeda jogada 3ª moeda jogada Caminho 1 0,58x0,58x0,58=0,583=0,1951 Caminho 2 0,58x0,58x0,42=0,582x0,42=0,1413 Caminho 3 0,58x0,42x0,58=0,582x0,42=0,1413 Caminho 4 0,58x0,42x0,42=0,58x0,422=0,1023 Caminho 5 0,42x0,58x0,58=0,582x0,42=0,1413 Caminho 6 0,42x0,58x0,42=0,58x0,422=0,1023 Caminho 7 0,42x0,42x0,58=0,58x0,422=0,1023 Caminho 8 0,42x0,42x0,42=0,423=0,0741 Somatório = 1 ou 100% 0,58 0,42 0,42 0,42 0,42 0,42 0,42 0,42 0,58 0,58 0,58 0,58 0,58 0,58 Probabilidades de cada caminho: “Pelo menos duas caras” significa duas ou três caras, logo, os caminhos 1, 2, 3 e 5 nos interessam, os demais ou têm apenas uma cara ou nenhuma. Qualquer um desses quatro caminhos que vier a ocorrer atenderá a nossa pergunta, ou seja, a probabilidade de ocorrer pelo menos duas caras é a soma das probabilidades de ocorrer o 5 21 ESTATÍSTICA APLICADA Re vi sã o: T at ia ne - D ia gr am aç ão : M ár ci o - 18 /0 5/ 10 caminho um ou então o dois ou então o três ou ainda o cinco. Poderíamos escrever isso assim: P(pelo menos uma cara)=P(ca-ca-ca)+P(ca-ca-co)+P(ca-co- ca)+P(co-ca-ca) Logo, o resultado seria: P(pelo menos uma cara)=0,1951+0,1413+0,1413+0,1413= 0,6190=61,90% Essa soma de eventos gera o que se chama de evento soma. Cada vez que se joga a moeda ocorre um resultado diferente. A cada um desses resultados damos o nome de evento. Vários eventos podem ser combinados, criando o evento soma e o evento produto, já mostrados anteriormente. O evento soma representa uma alternativa entre vários eventos simples, caracteriza-se pela palavra “ou”. Por exemplo, a questão “Qual é a probabilidade de um aluno passar em Estatística?” é respondida por um evento soma: o aluno pode passar sem exame ou com exame. A probabilidade será a soma das probabilidades dos dois eventos simples. O evento produto representa uma obrigação entre várias situações e caracteriza-se pela palavra “e”. Por exemplo: “Qual é a probabilidade de um aluno cursar administração e passar em Estatística?”. O aluno tem que cursar administração e passar em Estatística. A probabilidade será o produto entre probabilidade de um aluno estudar administração e a probabilidade de passar de Estatística. Vamos firmar esse conceito por meio do seguinte exemplo: 5 10 15 20 25 22 Unidade I Re vi sã o: T at ia ne - D ia gr am aç ão : M ár ci o - 18 /0 5/ 10 6. Dois caçadores, Pedro e João atiram contra uma caça simultaneamente. Sabemos que Pedro tem uma probabilidade de acertar esse tipo de caça de 40%, enquanto João acerta em 55% das vezes. Calcular a probabilidade de: a. a caça ser atingida; b. ambos atingirem a caça simultaneamente. Antes de resolvermos a questão, vamos sublinhar como foram obtidas essas probabilidades. Presume-se que Pedro e João já foram caçar diversas vezes esse tipo de caça e a cada tiro que deram anotaram o resultado. Após algum tempo, eles têm uma série de observações suficientemente grande para calcular as probabilidades relacionadas. Pedro atirou um número x de vezes e acertou quatro a cada dez tiros que deu, assim ele pode afirmar que tem 40% de chances de acertar um tiro qualquer nessas mesmas condições. João em raciocínio semelhante chegou à probabilidade de 55%. É evidente que, se Pedro tem 40% de chances de acertar, tem 60% de chances de errar, assim como João tem 55% de probabilidade de acertar e 45% de errar. Chega-se a essa conclusão porque os eventos acertar e errar são eventos complementares, ou seja, um completa o outro, sem a existência de um terceiro e com a soma dos dois resultando em 100%. Com essas probabilidades individuais, podemos montar a árvore de decisões apropriada: 5 10 15 20 25 23 ESTATÍSTICA APLICADA Re vi sã o: T at ia ne - D ia gr am aç ão : M ár ci o - 18 /0 5/ 10 Acerta o tiro Erra o tiro Pedro atira 0,40x0,55 = 0,22 ou 22% Cálculo das probabilidades 0,40 João atira João atira Erra o tiro Acerta o tiro Erra o tiro Acerta o tiro 0,60 0,55 0,55 0,45 0,45 0,40x0,45 = 0,18 ou 18% 0,60x0,55 = 0,33 ou 33% 0,60x0,45 = 0,27 ou 27% Podemos então responder às questões: A caça será atingida se Pedro ou João ou os dois a atingirem. Quer dizer, existe alternativa, portanto é um evento soma: P(caça a ser atingida) = = P(Pedro acertar e João acertar) + P(Pedro acertar e João errar) + P (Pedro errar e João acertar) P(caça ser atingida) = 0,22 + 0,18 + 0,33 = 0,73 ou 73% Portanto, a resposta ao item a é: a probabilidade de a caça ser atingida é de 73%. Já para ambos atingirem a caça, é necessário que Pedro e João a atinjam, ou seja, é um evento produto: 5 10 24 Unidade I Re vi sã o: T at ia ne - D ia gr am aç ão : M ár ci o - 18 /0 5/ 10 P(ambos atingirem a caça) = P(Pedro acertar) x P(João acertar) P(ambos atingirem a caça) = 0,40 x 0,55 = 0,22 = 22% Portanto, a resposta ao item b é: a probabilidade de ambos acertarem a caça é de 22%. 1.7 Eventos independentes e eventos vinculados Na questão acima, os tiros de Pedro não interferem nos tiros de João e vice-versa, ou seja, o fato de Pedro acertar ou errar não torna mais ou menos provável os acertos ou erros de João. É o que se chama de eventos independentes. Nem sempre, no entanto, isso ocorre. Eventualmente, a ocorrência de um evento altera a probabilidade de ocorrência do evento seguinte. São os eventos vinculados ou condicionados ou dependentes. A próxima questão exemplifica esse conceito: 6. Temos uma caixa que contém um total de 45 bolinhas, sendo 20 verdes, 15 brancas e 10 pretas. Retira-se dessa caixa uma bolinha, anota-se sua cor, coloca-se de lado e em seguida retira-se da caixa uma segunda bolinha. a. Qual é a probabilidade de que as duas bolinhas retiradas formem a agradável combinação verde e branca? b. Qual é a probabilidade de que as duas bolinhas retiradas formem a desagradável combinação preta e branca? Uma combinação verde e branca corresponde a retirar uma primeira bolinha verde e uma segunda bolinha branca ou uma 5 10 15 20 25 25 ESTATÍSTICA APLICADA Re vi sã o: T at ia ne - D ia gr am aç ão : M ár ci o - 18 /0 5/ 10 primeira bolinha branca e uma segunda bolinha verde. Raciocínio semelhante utiliza-se para a combinação preta e branca. Novamente vamos utilizar a árvore de decisões para entender e esquematizar o problema, seguindo o raciocínio anteriormente estabelecido: Bolinha verde Bolinha preta Caixa contendo: 19 bolinhas verdes, 15 brancas e 10 pretas Cálculo das probabilidades 20 45 Total de 45 bolinhas Bolinha branca 15 45 10 45 Depois de retirada a 1ª bolinha, a caixa irá ficar com: Depois de retirada a 1ª bolinha, a caixa irá ficar com: Depois de retirada a 1ª bolinha, a caixa irá ficar com: Total de 44 bolinhas Total de 44 bolinhas Totalde 44 bolinhas Caixa contendo: 20 bolinhas verdes, 14 brancas e 10 pretas Caixa contendo: 20 bolinhas verdes, 15 brancas e 9 pretas 20 45 19 44 380 1 980 0 1919x = = . , 20 45 15 44 300 1 980 0 1515x = = . , 20 45 10 44 200 1 980 0 1010x = = . , 15 45 20 44 300 1 980 0 1515x = = . , 15 45 14 44 210 1 980 0 1061x = = . , 15 45 10 44 150 1 980 0 0757x = = . , 10 45 20 44 200 1 980 0 1010x = = . , 10 45 15 44 150 1 980 0 0757x = = . , 10 45 9 44 90 1 980 0 0455x = = . , Bolinha verde Bolinha branca Bolinha preta Bolinha verde Bolinha branca Bolinha preta Bolinha verde Bolinha branca Bolinha preta 1 2 6 8 3 5 4 7 9 19 44 15 44 20 44 14 44 10 44 20 44 15 44 9 44 Caixa contendo: 20 bolinhas verdes, 15 brancas e 10 pretas Observe que, dos nove caminhos existentes (eventos produtos), dois correspondem a uma combinação verde e branca: os caminhos 2 e 4. Assim, um ou outro atendem ao solicitado (portanto, evento soma), dessa forma: P(combinação verde e branca) = P(1ª verde/2ª branca)+ +P(1ª branca/2ª verde) 5 10 26 Unidade I Re vi sã o: T at ia ne - D ia gr am aç ão : M ár ci o - 18 /0 5/ 10 P(combinação verde e branca) = 0,1515 + 0,1515 = 0,3030 = = 30,30% A probabilidade de se obter uma combinação verde e branca é de 30,30%. Raciocínio semelhante se faz para a combinação preta e branca (siga os caminhos 6 e 8): P(combinação preta e branca) = P(1ª branca/2ª preta) + + P(1ª preta/2ª branca) P(combinação preta e branca) = 0,0757 + 0,0757 = 0,1514 = = 15,14% 1.8 Revisão teórica dos conceitos estudados • Experimento: processo que descreve como ocorre uma determinada sucessão de acontecimentos. Exemplos: realizar uma reação química, investir em ações, jogar dados. • Experimento matemático ou determinístico: são aqueles em que os resultados podem ser previstos de modo exato utilizando a ciência. Exemplo: realizar uma reação química. • Experimento aleatório: são aqueles cujos resultados não são sempre os mesmos, apesar de se repetirem várias vezes em condições semelhantes. Exemplo: jogar dados. • Experimentos aproximadamente aleatórios: são aqueles que, apesar de terem uma tendência de ocorrência, não podem ter seus resultados definidos de modo exato pela ciência. Por exemplo: investir em ações. • Espaço amostral ou conjunto universo: conjuntos formados por todos os resultados possíveis de um 5 10 15 20 25 27 ESTATÍSTICA APLICADA Re vi sã o: T at ia ne - D ia gr am aç ão : M ár ci o - 18 /0 5/ 10 experimento. Exemplo: o conjunto formado pelos números 1,2,3,4,5 e 6, resultados possíveis de um jogo de dados. • Evento: é qualquer subconjunto de um espaço amostral. Exemplo, os números 2, 4 e 6, evento “números pares” de um jogo de dados. • Evento simples: aquele formado por um único elemento do espaço amostral. Exemplo, o número 5 em um jogo de dados. • Evento composto: aquele formado por mais de um elemento do espaço amostral. Exemplo: os números 1, 3 e 5, evento “números ímpares” de um jogo de dados. • Evento complementar: de um evento A qualquer, é o evento B (chamado complementar de A), tal que todos os elementos do espaço amostral que não pertençam a A pertençam a B e vice-versa. Observar que S = A+B. Exemplo: o conjunto A={1,3,5} é complementar ao conjunto B={2,4,6}, em um jogo de dados, visto que ao serem somados dão origem ao espaço amostral S={1,2,3,4,5,6}. Não falta nem sobra elemento algum. • Eventos mutuamente exclusivos: suponha dois eventos A e B, no qual a ocorrência de A impede a ocorrência de B e vice-versa. Dizemos que eles são mutuamente exclusivos. Exemplo: em um jogo de dados, a ocorrência de um número par (1,2,3) impede a ocorrência de um número ímpar (2,4,5), portanto são mutuamente exclusivos. Não confunda eventos complementares com eventos mutuamente exclusivos. Todos os eventos complementares são mutuamente exclusivos, mas o contrário não é verdade. • Eventos independentes: dizemos que dois ou mais eventos são independentes quando eles não exercem 5 10 15 20 25 30 28 Unidade I Re vi sã o: T at ia ne - D ia gr am aç ão : M ár ci o - 18 /0 5/ 10 ações recíprocas, comportando-se cada um da maneira que lhe é própria, sem influenciar os demais. Exemplo: o lançamento de duas moedas, simultaneamente. • Eventos vinculados ou condicionados: são eventos cujo aparecimento de um dependa ou seja influenciado pelo aparecimento de outro, do mesmo experimento. Exemplo: a retirada de duas cartas de um baralho. Quando você retira a primeira carta, existem 52 cartas no baralho, 26 vermelhas e 26 pretas. Quando você for retirar a segunda carta o baralho terá apenas 51 cartas e poderão ser 25 vermelhas e 26 pretas ou 26 vermelhas e 25 pretas, dependendo da cor da primeira carta. Portanto, o segundo evento está condicionado ou vinculado com o primeiro. • Evento soma: quando relacionamos dois eventos de um mesmo experimento e a ocorrência de um ou de outro nos interessa, temos o evento soma. Perceba a importância da palavra ou na formulação do princípio e da ideia de alternativa. Exemplo: jogo um dado e quero que saia um número par ou um número primo. Os números pares são: {2,4,6} e os número primos são {1,2,3,5}. Como me interessa os números pares ou primos, fico satisfeito com a ocorrência de qualquer um dos seguintes números {1,2,3,4,5}. Note que esse conjunto é a soma dos dois anteriores, descontadas as intersecções (no caso o número 2). • Evento produto: quando relacionamos dois eventos de um mesmo experimento e a ocorrência de um e simultaneamente do outro nos interessa, temos o evento produto. Perceba a importância da palavra e na formulação do princípio e da ideia de obrigação. Exemplo: jogo um dado e quero que saia um número par e primo. Os números pares são: {2,4,6} e os número primos são {1,2,3,5}. Como me interessa o número que seja par e simultaneamente primo, fico satisfeito somente com 5 10 15 20 25 30 29 ESTATÍSTICA APLICADA Re vi sã o: T at ia ne - D ia gr am aç ão : M ár ci o - 18 /0 5/ 10 a ocorrência de número: {2}. Note que esse conjunto é a intersecção dos dois anteriores, ou seja, valores que pertencem simultaneamente aos dois conjuntos. • Definição de probabilidade matemática: é a razão (divisão) entre o número de elementos do evento estudado pelo número de elementos do espaço amostral, ou seja: P A n A n S ( ) ( ) ( ) = • Definição de probabilidade estatística: presumindo que um experimento é repetido uma quantidade considerável de vezes e seus resultados anotados, definimos a probabilidade de ocorrência de eventos daquele experimento como sendo a frequência relativa do mesmo: P A f f fRA A T ( ) = = • Axiomas das probabilidades: são verdades a partir das quais se estabelecem os conceitos de probabilidades: 1. Dado um evento A, dentro de um espaço amostral S, temos: 0 1≤ ≤P A( ) 2. A probabilidade do espaço amostral ou da soma de todos os eventos possíveis é: P(S) = 1 3. Para dois eventos mutuamente exclusivos, temos: P A B P A P B( ) ( ) ( )∪ = + 5 10 15 20 30 Unidade I Re vi sã o: T at ia ne - D ia gr am aç ão : M ár ci o - 18 /0 5/ 10 4. Se o evento A é complementar de B, então: P A P B P A P B( ) ( ) () ( )+ = = −1 1 ou • Teorema da soma: se A e B são dois eventos não mutuamente exclusivos, a probabilidade da ocorrência de A ou B ou ambos é dada por: P A B P A P B P A B( ) ( ) ( ) ( )∪ = + − ∩ Exemplo: em uma caixa existem oito bolinhas idênticas, numeradas de 1 a 8. Qual a probabilidade de, ao se retirar uma bolinha, ela seja múltiplo de 2 ou de 5? Espaço amostral: S = {1,2,3,4,5,6,7,8,9,10} -> n(S) = 10 Evento A – múltiplos de 2: A = {2,4,6,8,10) -> n(A) = 5 Evento B – múltiplos de 5: B= {5,10) -> n(B) = 2 Intersecção entre A e B: A∩B = {10} -> n(A∩B) = 1 P A B P A P B P A B P A B n A n S nB n S n A B n S ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ∪ = + − ∩ ⇒ ∪ = + − ∪ )) P A B( ) , %∪ = + − = = =5 10 2 10 1 10 6 10 0 60 60 • Teorema do produto para eventos independentes: caso tenhamos dois eventos A e B que não sejam mutuamente exclusivos, a probabilidade de ocorrer um resultado que pertença simultaneamente aos dois eventos é dada por: P A B P A xP B( ) ( ) ( )∩ = 5 10 15 20 31 ESTATÍSTICA APLICADA Re vi sã o: T at ia ne - D ia gr am aç ão : M ár ci o - 18 /0 5/ 10 Esse conceito pode ser estendido para mais de dois eventos. Exemplo: temos duas caixas com bolinhas nas seguintes quantidades: Caixa A: 10 bolinhas azuis, 15 bolinhas brancas e 30 bolinhas vermelhas. Total: 55 bolinhas. Caixa B: 20 bolinhas azuis, 18 bolinhas brancas e 22 bolinhas vermelhas. Total: 60 bolinhas. Retiramos uma bolinha de cada urna. Qual é a probabilidade de que ambas as bolinhas retiradas sejam azuis? Caixa A: probabilidade de uma bolinha retirada ser azul: P Azul( ) = 10 55 Caixa B: probabilidade de uma bolinha retirada ser azul: P Azul( ) = 20 60 Probabilidade de ambas serem azuis: P Azul Azul P xP( ) ( ) ( )∩ = Urna A/bolinha Azul Urna B/bolinha Azul == × =10 55 20 60 200 3300 P Azul Azul( ) , , %∩ = =0 0606 6 06 • Teorema do produto para eventos vinculados: a probabilidade de ocorrência simultânea de dois eventos A e B vinculados é dada pelo produto da probabilidade de um dos eventos, pela probabilidade condicional do outro evento: P A B P A xP B A( ) ( ) ( / )∩ = 5 10 15 20 32 Unidade I Re vi sã o: T at ia ne - D ia gr am aç ão : M ár ci o - 18 /0 5/ 10 O símbolo P(B/A) lê-se probabilidade de ocorrência do evento B tendo ocorrido o evento A, e é a chamada probabilidade condicional. Esse conceito pode ser estendido para mais de dois eventos. O exemplo a seguir deixa essa situação mais evidente: Retiramos sem reposição três cartas de um baralho de 52 cartas. Qual a probabilidade de que as três sejam vermelhas: Probabilidade de a 1ª carta ser vermelha: P vermelha( ) = 26 52 Probabilidade de a 2ª carta ser vermelha: P vermelha( ) = 25 51 Probabilidade de a 3ª carta ser vermelha: P vermelha( ) = 24 50 Probabilidade de as três serem vermelhas: P Vrm Vrm Vrm P xP( ) ( ) ( /∩ ∩ = 1 2 1ª carta Vrm ª carta Vrm ª carta Vrm)) ( ª / ª )xP 3 2 carta Vrm carta Vrm P Vrm Vrm Vrm( ) . . ∩ ∩ = × × = × × × × =26 52 25 51 24 50 26 25 24 52 51 50 15 626 132 6000 0 1178 1178= =, , % 2 DISTRIBUIÇÕES DE PROBABILIDADES Objetivos Quando, na disciplina de Estatística, vimos as maneiras se apresentar os dados estatísticos, conceituamos frequência simples e posteriormente frequência relativa. No capítulo 1 de Estatística Aplicada vimos que probabilidades podem ser definidas como as frequências simples de eventos ocorridos em uma repetição considerável do experimento. 5 10 15 20 33 ESTATÍSTICA APLICADA Re vi sã o: T at ia ne - D ia gr am aç ão : M ár ci o - 18 /0 5/ 10 Como decorrência disso, podemos estabelecer o conceito de distribuição de probabilidades em analogia com as distribuições de frequências com algumas diferenças: • Na distribuição de frequências, normalmente, utilizávamos como informação principal a frequência simples. Na distribuição de probabilidades, priorizaremos as frequências relativas agora chamadas de probabilidades. • Distribuições de frequências são informações reais, exatas, decorrência de observações efetuadas. Distribuições de probabilidade são previsões feitas a partir de observações, portanto não são reais, são evidentemente prováveis. • Na disciplina de estatística, utilizamos nos nossos cálculos, primordialmente, as informações na forma de tabelas. Em Estatística Aplicada, será mais frequente o uso das informações na forma de gráficos. 2.1 Distribuições de probabilidades O fato de trabalharmos muitas vezes com variáveis discretas e outras tantas com variáveis contínuas nos conduz à divisão das distribuições de probabilidades em dois grandes grupos, cada um deles com modelos matemáticos específicos: • Distribuições de probabilidades discretas: – distribuição binomial; – distribuição de Poisson; – distribuição hipergeométrica. • Distribuições de probabilidades contínuas: – distribuição normal; – distribuição exponencial. 5 10 15 20 25 34 Unidade I Re vi sã o: T at ia ne - D ia gr am aç ão : M ár ci o - 18 /0 5/ 10 A maneira como se utiliza uma e outra difere de acordo com os aspectos específicos do problema estatístico que está sendo estudado. De modo geral, as distribuições discretas utilizam equações estatísticas para calcular as probabilidades e as contínuas, gráficos e tabelas deles decorrentes para o mesmo cálculo. Como as distribuições binomiais e em especial as distribuições normais são aquelas mais utilizadas na prática, vamos concentrar nossos estudos nelas. As demais distribuições apresentam aspectos matemáticos diferenciados, mas seguem padrões de cálculos semelhantes, o que facilitará o estudo futuro daqueles que o desejarem ou dele necessitarem. 2.2 Distribuição de probabilidades binomial A distribuição de binomial é uma distribuição para variáveis discretas e, como o próprio nome indica, é utilizada quando temos a presença de dois eventos complementares. É uma generalização do binômio de Newton e adapta-se às amostragens que seguem o princípio de Bernoille, que são as seguintes: 1. Em cada repetição do experimento, nomeado como tentativa, existem dois e apenas dois resultados possíveis, complementares chamados por conveniência de sucesso e insucesso. 2. A série de tentativas é composta de eventos independentes. 3. As probabilidades de sucesso e insucesso permanecem constantes ao longo das tentativas. É um processo estacionário. Para entender o funcionamento e a utilidade da distribuição binomial, vamos recuperar um tipo de problema que já equacionamos no capítulo anterior: 5 10 15 20 25 35 ESTATÍSTICA APLICADA Re vi sã o: T at ia ne - D ia gr am aç ão : M ár ci o - 18 /0 5/ 10 1. Um vendedor sabe que, ao sair para fazer um determinado tipo de venda, tem 20% de probabilidade de concretizá-la. Em um dia qualquer, ele sai para atender a três clientes. Qual é a probabilidade de ele fazer exatamente duas vendas? O problema pode ser resolvido usando os conceitos aprendidos no capítulo anterior. Mas veja bem, isso só é possível porque ele pretende fazer poucas visitas. Caso ele saísse para fazer dez visitas, a resolução seria demasiadamente trabalhosa. Vamos começar pelo caso mais fácil. A árvore de decisões apresentada a seguir mostra três caminhos nos quais o vendedor consegue efetivar exatamente duas vendas. São os caminhos 2, 3 e 5. Portanto, como vimos anteriormente a probabilidade de o vendedor realizar exatamente duas vendasé a soma das probabilidades dos três caminhos, ou seja: P(exatamente duas vendas)=P(caminho 2) + P(caminho 3) + + P(caminho 5) P(exatamente duas vendas)=0,0320 + 0,0320 + 0,0320 = = 0,0960 = 9,60% Portanto, a probabilidade de o vendedor conseguir efetivar exatamente duas vendas é de 9,60%. 5 10 15 20 36 Unidade I Re vi sã o: T at ia ne - D ia gr am aç ão : M ár ci o - 18 /0 5/ 10 0,2 1º cliente 1 2 3 4 5 6 7 8 Não efetua a venda Efetua a venda 2º cliente 2º cliente 3º cliente 3º cliente 3º cliente 3º cliente Não efetua a venda Efetua a venda Não efetua a venda Efetua a venda Não efetua a venda Efetua a venda Não efetua a venda Efetua a venda Não efetua a venda Efetua a venda Não efetua a venda Efetua a venda 0,2x0,2x0,2=0,23x0,80=0,0080 0,2x0,2x0,8=0,22x0,81=0,0320 0,2x0,8x0,2=0,22x0,81=0,0320 0,2x0,8x0,8=0,21x0,82=0,1280 0,8x0,2x0,2=0,22x0,81=0,0320 0,8x0,2x0,8=0,21x0,82=0,1280 0,8x0,8x0,2=0,21x0,82=0,1280 0,8x0,8x0,8=0,20x0,83=0,5120 0,8 0,8 0,2 0,8 0,2 0,8 0,2 0,8 0,2 0,8 0,2 0,8 0,2 Observe algumas coisas interessantes sobre esse cálculo que acabamos de fazer: • Todos os caminhos têm o mesmo cálculo: 0,22 x 0,81 = 0,0320. Note que 0,2 é a probabilidade de se concretizar a venda e o expoente dele, 2, é o número de vendas que queremos concretizar; 0,8 é a probabilidade de não se concretizar a venda e o expoente dele, 1, é o número de vendas que não iremos concretizar. • Observe também que existem três caminhos possíveis. Você deve lembrar que esse valor se refere às combinações possíveis de 3 elementos (os clientes visitados) tomados 2 5 10 37 ESTATÍSTICA APLICADA Re vi sã o: T at ia ne - D ia gr am aç ão : M ár ci o - 18 /0 5/ 10 a 2 (o número de vendas que queremos efetivar): C n x n x Cn x, , ! !( )! ! !( )! ! ! ! = − ⇒ = − = × = × × × × =32 3 2 3 2 3 2 1 1 2 3 1 2 1 3 Dessa forma, conseguimos encontrar uma fórmula para calcular qualquer quantidade de eventos, com muito menos trabalho. Como exemplo disso, vamos resolver a seguinte questão: 2. Um vendedor sabe que, ao sair para fazer um determinado tipo de venda, tem 30% de probabilidade de concretizá-la. Em um dia qualquer, ele sai para atender a vinte clientes. Qual é a probabilidade de ele fazer exatamente oito vendas? Nessa questão, os números envolvidos são muito maiores, causando um trabalho braçal muito grande se formos resolvê-la “na raça”, como a questão anterior. Mas agora já conhecemos o funcionamento na distribuição é só usá-lo: • Probabilidade de se efetivar uma venda: 30% ou 0,3. • Número de vendas que quero efetivar: 8. • Probabilidade de não se efetivar uma venda: 70% ou 0,7 (lembre-se: são eventos complementares). • Número de vendas que não irá se efetivar: 12 (lembre-se: se o vendedor vai fazer 20 visitas e concretiza a venda em 8 delas, não concretizará vendas em 12 delas, obviamente). Aplicando a fórmula: • Número de caminhos: C n x n x Cn x, , ! !( )! .= − ⇒ =20 8 125 970 5 10 15 20 25 38 Unidade I Re vi sã o: T at ia ne - D ia gr am aç ão : M ár ci o - 18 /0 5/ 10 • Probabilidade de cada caminho: 0,38 x 0,712 = 0,0000009081 • Probabilidade de se efetivarem exatamente oito vendas: 125.970 x 0,0000009081 = 0,1144 = 11,44% Perceba que, apesar dos números envolvidos serem difíceis de trabalhar, ainda é muito mais simples que o raciocínio da árvore. Com rigor formal, a fórmula para o cálculo da distribuição binomial, é a seguinte: P X x C p pn x x n x( ) ( ),= = × × − −1 Sendo: • P(X=x) é a probabilidade de que o número de sucessos obtidos seja exatamente igual a x; • n é o número de tentativas realizadas, ou seja, o número de vezes que o experimento é realizado; • X é o número de sucessos que desejamos obter; • p é a probabilidade de sucesso em uma única tentativa. Vamos praticar esse cálculo com a seguinte questão: 3. Em um ano qualquer, 55% das ações negociadas na Bolsa de Valores de São Paulo sofreram alta, enquanto 45% se mantiveram estáveis ou sofreram baixa. Uma corretora de ações separa dez ações de sua carteira ao acaso. Qual é a probabilidade de que dessas dez ações: a. Exatamente oito ações tenham tido alta? 5 10 15 20 25 39 ESTATÍSTICA APLICADA Re vi sã o: T at ia ne - D ia gr am aç ão : M ár ci o - 18 /0 5/ 10 b. Todas as dez ações tenham tido alta? c. No máximo duas ações tenham tido alta? Para todas as perguntas serão mantidas constantes as informações: • Número de tentativas: n = 10. • Probabilidade de sucesso: p = 0,55 (probabilidades de uma ação ter alta). Irá variar o valor de x para cada uma das perguntas: • Na pergunta a, o valor de x é oito: x = 8, logo, o cálculo será: P X x C p p P X Cn x x n x( ) ( ) ( ) , ( , ), ,= = × × − ⇒ = = × × −− −1 8 0 55 1 0 5510 8 8 10 8 P X( ) ! !( )! , ( , ) , ( , )= = − × × − = × × − =−8 8 8 10 8 0 55 1 0 55 45 0 55 1 0 55 48 10 8 8 0 55 0 0084 0 2025× ×, , P X( ) , , %= = =8 0 0765 7 65 • Na pergunta b, o valor de x é dez: x = 10, e o cálculo será: P X x C p p P X Cn x x n x( ) ( ) ( ) , ( , ), ,= = × × − ⇒ = = × × −− −1 10 0 55 1 0 551010 10 10 100 P X( ) ! !( )! , ( , ) , ( ,= = − × × − = × × −−10 10 10 10 10 0 55 1 0 55 1 0 55 1 010 10 10 10 555 1 0 0025 10) ,= × × P X( ) , , %= = =10 0 0025 0 25 5 10 15 40 Unidade I Re vi sã o: T at ia ne - D ia gr am aç ão : M ár ci o - 18 /0 5/ 10 • Na pergunta b, o valor de x é 0, 1 e 2, porque queremos no máximo duas ações com alta ou seja, nenhuma ação com alta ou uma ação com alta ou duas ações com alta. Devemos, então, fazer três cálculos e somar os valores: P X C( ) , ( , ) ,,= = × × − =−0 0 55 1 0 55 0 000310 0 0 10 0 P X C( ) , ( , ) ,,= = × × − =−1 0 55 1 0 55 0 0042101 1 10 1 P X C( ) , ( , ) ,,= = × × − =−2 0 55 1 0 55 0 022910 2 2 10 2 P(X - no máximo 2) = 0,0003 + 0,0042 + 0,0229 = 0,0274 = 2,74% A rigor, a distribuição de probabilidades binomial seria uma tabela, com todos os possíveis resultados associados às suas probabilidades correspondentes. O quadro a seguir faz isso para a questão anterior. Número de ações em alta Cálculo da probabilidade de ocorrência n = 10; p = 0,55 Probabilidade de ocorrência 0 P(X=0)=C10,0x0,55 0x(1-0,55)10-0 0,03% 1 P(X=1)=C10,1x0,55 1x(1-0,55)10-1 0,42% 2 P(X=2)=C10,2x0,55 2x(1-0,55)10-2 2,29% 3 P(X=3)=C10,3x0,55 3x(1-0,55)10-3 7,46% 4 P(X=4)=C10,4x0,55 4x(1-0,55)10-4 15,96% 5 P(X=5)=C10,5x0,55 5x(1-0,55)10-5 23,40% 6 P(X=6)=C10,6x0,55 6x(1-0,55)10-6 23,84% 7 P(X=7)=C10,7x0,55 7x(1-0,55)10-7 16,65% 8 P(X=8)=C10,8x0,55 8x(1-0,55)10-8 7,63% 9 P(X=9)=C10,9x0,55 9x(1-0,55)10-9 2,07% 10 P(X=10)=C10,10x0,55 10x(1-0,55)10-10 0,25% Somatório 100% Observe a tabela anterior e verifique a semelhança com a apresentação semelhante feita na disciplina de Estatística, para amostras. Lembre-se de que a partir de informações desse tipo definimos as medidas de posição e as medidas de dispersão para 5 10 15 41 ESTATÍSTICA APLICADA Re vi sã o: T at ia ne - D ia gr am aç ão : M ár ci o - 18 /0 5/ 10 as amostras. De maneira semelhante, iremos agora definir as mesmas medidas para as populações, com a diferença de que para as amostras são valores reais e para população,valores prováveis, ou esperados. 2.3 Valor e variância esperados A média de uma população é um valor provável ou, se preferir, esperado, e é calculado de maneira semelhante ao que foi calculado na amostra, mas utilizando-se os valores de probabilidades em vez das frequências. Utiliza-se como símbolo da média populacional a letra grega µ (mi) ou então o símbolo E(x), significando a esperança de x ou o valor esperado para x, e é obtida pela fórmula: E x p x p x p x p x p xn n i i n ( ) .....= + + + + = = ∑1 1 2 2 3 3 1 1 Observe o cálculo a seguir, feito para os dados da questão 3, e perceba a semelhança com o cálculo da média amostral feita na disciplina de Estatística: A B C D = AxC Número de ações em alta Probabilidade de ocorrência percentual Probabilidade de ocorrência decimal pix1 x1 pi 0 0,03% 0,0003 0,00 1 0,42% 0,0042 0,00 2 2,29% 0,0229 0,05 3 7,46% 0,0746 0,22 4 15,96% 0,1596 0,64 5 23,40% 0,2340 1,17 6 23,84% 0,2384 1,43 7 16,65% 0,1665 1,17 8 7,63% 0,0763 0,61 9 2,07% 0,0207 0,19 10 0,25% 0,0025 0,03 Somatório da coluna D E(x) 5,50 5 10 15 42 Unidade I Re vi sã o: T at ia ne - D ia gr am aç ão : M ár ci o - 18 /0 5/ 10 Isso significa que o valor esperado de ações em alta nessa Bolsa é de 5,5 ações, das dez consideradas. Podemos afirmar que, em cada dez ações acompanhadas, 5,5 devem estar em alta. Perceba que não é uma certeza, é um valor, sujeito a variabilidade. Essa variabilidade é medida pela variância, que tem a mesma definição e as mesmas características daquela definida para a amostra, e é calculada pela fórmula: Var x E x E x( ) ( ) ( )= − [ ]2 2 O quadro a seguir mostra o cálculo da variância, semelhante ao conhecido para a amostra: A B C D = AxC E = AxA F = ExC Número de ações em alta Probabilidade de ocorrência percentual Probabilidade de ocorrência decimal pix1 Valor ao quadrado pix1 2 x1 pi 0 0,03% 0,0003 0,00 0 0,00 1 0,42% 0,0042 0,00 1 0,00 2 2,29% 0,0229 0,05 4 0,09 3 7,46% 0,0746 0,22 9 0,67 4 15,96% 0,1596 0,64 16 2,55 5 23,40% 0,2340 1,17 25 5,85 6 23,84% 0,2384 1,43 36 8,58 7 16,65% 0,1665 1,17 49 8,16 8 7,63% 0,0763 0,61 64 4,88 9 2,07% 0,0207 0,19 81 1,68 10 0,25% 0,0025 0,03 100 0,25 Somatório da coluna D e F E(x) 5,50 E(x) 2 32,73 Var x E x E x Var x( ) ( ) ( ) ( ) , , , , ,= − [ ] ⇒ = −[ ] = − =2 2 232 73 5 5 32 73 30 25 2 48 Você se lembra de que o desvio padrão é a raiz quadrada da variância. O símbolo do desvio padrão populacional é a letra grega σ (sigma), portanto: 5 10 43 ESTATÍSTICA APLICADA Re vi sã o: T at ia ne - D ia gr am aç ão : M ár ci o - 18 /0 5/ 10 σ = Var x( ) Nessa questão, o desvio padrão é dado por: σ σ σ= ⇒ = ⇒ =Var x( ) , ,2 48 158 Todas essas informações estatísticas que acabamos de ver e calcular para o caso do lote de ações da Bolsa de Valores podem ser apresentadas na forma gráfica, de modo semelhante ao que fizemos para as amostras. Observar que, enquanto no eixo horizontal continuamos a colocar os valores envolvidos, no eixo vertical, colocamos agora as probabilidades, e não mais as frequências. De resto, são gráficos bastante semelhantes, com a já sabida diferença de que um apresenta valores reais (quando trabalhamos com amostras) e o outro, valores prováveis (para a população). Distribuição de probabilidades – ações em alta Pr ob ab ili da de s Número de ações em alta 25% 20% 15% 10% 5% 0% 0 1 2 3 4 5 6 7 8 9 10 µ-σ µ+σµ 5 10 44 Unidade I Re vi sã o: T at ia ne - D ia gr am aç ão : M ár ci o - 18 /0 5/ 10 No gráfico, podemos definir: • As probabilidades de cada ocorrência (determinado número de ações em alta), representadas pelas colunas verticais. • A média (µ) ou valor esperado para essa distribuição, representado pela linha tracejada central. • A variação de um desvio padrão (σ) para mais, representada pela linha traço e ponto da direita. • A variação de um desvio padrão (σ) para menos, representada pela linha traço e ponto da esquerda. • E uma curva que passa pelo topo de todas as colunas, centrada na média e com inflexões nos desvios padrões para mais e para menos. Essa curva é extremamente importante para a estatística e é assunto de nosso próximo item. Verifique, por ora, que é evidente o fato de que, quanto maior for o número de colunas, mais definida será a referida curva. 2.4 Distribuição normal 2.4.1 Conceitos básicos No tópico anterior, vimos a mais importante distribuição de probabilidades discretas, a distribuição binomial. Para variáveis contínuas, a mais importante distribuição é a distribuição normal ou de Gauss. Aliás, essa é a mais importante distribuição de probabilidades e a mais usada. Uma enorme quantidade de situações estatísticas recai na distribuição normal. O gráfico apresentado no final do item anterior mostra o surgimento da curva a partir de um histograma de probabilidade, com suas características principais: • centrada na média; • com sua forma definida pelo valor do desvio padrão. 5 10 15 20 25 45 ESTATÍSTICA APLICADA Re vi sã o: T at ia ne - D ia gr am aç ão : M ár ci o - 18 /0 5/ 10 Na tabela abaixo, temos relacionados dados referentes às ações em alta de três diferentes bolsas de valores. Foram acompanhadas 30 diferentes ações em cada uma das bolsas, e seu comportamento estatístico foi calculado. Cada uma delas com um comportamento diferente expresso pela média e pelo desvio padrão. Bolsa de valores Número de observações Probabilidade de ações em alta Média de ações em alta Desvio padrão de ações em alta A 30 30% 9 2,51 B 30 50% 15 2,74 C 30 80% 24 2,19 Essas mesmas informações estão mostradas no gráfico abaixo. Perceba que retiramos as colunas do histograma e mantivemos apenas a curva. Essas curvas são as chamadas distribuições normais. Quando o número de observações (tentativas) em uma distribuição binomial aumenta, ela se aproxima cada vez mais da distribuição normal, até que ficam indistinguíveis. Chama-se a isso de aproximação da binomial pela normal. 20% 18% 16% 14% 12% 10% 8% 6% 4% 2% 0% 0 Pr ob ab ili da de s Bolsa A (9;2,51) Bolsa B (15;2,74) Bolsa C (24;2,19) 5 10 15 20 25 30 Número de ações em alta 5 10 46 Unidade I Re vi sã o: T at ia ne - D ia gr am aç ão : M ár ci o - 18 /0 5/ 10 Observando atentamente o gráfico anterior, percebemos que na Bolsa C é praticamente impossível (ou seja, a probabilidade é muito próxima de zero) que existam menos de 15 ações em alta. Para a Bolsa A, é o oposto, é praticamente impossível que tenha mais do que 16 ou 17 ações em alta. Já para a Bolsa B, o mais provável é que tenha 15 ações em alta. Percebe-se também que a curva que apresenta o maior desvio padrão é a mais baixa e achatada (Bolsa B) e a que apresenta menor desvio padrão é a mais alta e afilada (Bolsa C). A bolsa que tem maior probabilidade de ter ações em alta (Bolsa C) tem o gráfico deslocado para a direita, enquanto a com menor probabilidade (Bolsa A) está deslocada para a esquerda. A Bolsa A que tem 50% de suas ações em alta está localizada exatamente em torno do valor central e, percebe-se, é mais regular, menos “deformada” que as outras. Resumindo, a curva normal é determinada em todos os seus aspectos pela média e pelo desvio padrão. Conhecendo esses dois parâmetros, conhecemos o comportamento probabilístico do experimento. Observe agoraa curva referente à Bolsa B. Perceba que ela é absolutamente simétrica em relação ao eixo vertical. O lado esquerdo dela em relação à média é idêntico ao lado direito. Em outras palavras, metade da área sob essa curva está do lado esquerdo da média e metade está do lado direito da média, e a probabilidade de se ter 15 ações ou mais em alta nessa bolsa é de 50%, assim como a probabilidade de se ter 15 ações ou menos. Essa é uma importante decorrência das distribuições contínuas, entre elas, a normal: as probabilidades são proporcionais às áreas definidas pelos valores envolvidos. A questão proposta a seguir demonstra a utilidade desses conceitos: 5 10 15 20 25 30 47 ESTATÍSTICA APLICADA Re vi sã o: T at ia ne - D ia gr am aç ão : M ár ci o - 18 /0 5/ 10 4. Uma empresa de pneumáticos acompanhou a vida útil de uma quantidade considerável de pneus de um determinado tipo e chegou à conclusão de que essa vida útil é normalmente distribuída e tem uma média de 42.000 km com desvio padrão de 5.800 km. Um cliente adquire um desses pneus e o instala no seu automóvel. Qual é a probabilidade de que ele dure mais do que 50.000 km? Antes de qualquer coisa, vamos entender os procedimentos operacionais envolvidos. O fabricante não acompanha todos os pneus que fabrica, evidentemente, acompanha uma pequena fração deles, anotando a quilometragem durante a qual eles foram utilizados. Com esses dados, que devem ser em quantidade considerável, ele calcula a média e o desvio padrão, como nós fizemos na disciplina de Estatística, e assume que, se ele tivesse acompanhado todos os pneus fabricados, os valores seriam muito próximos. Ele consegue observar também se o experimento segue ou não a curva normal. Feita essa observação, veja o gráfico a seguir: 0 Pr ob ab ili da de s 5 20 35 50 65 42 Vida útil em milhares de km Área na qual estão localizados os pneus que têm vida útil maior ou igual a 50.000 km 5 10 15 48 Unidade I Re vi sã o: T at ia ne - D ia gr am aç ão : M ár ci o - 18 /0 5/ 10 Na área sob a curva, estão representados todos os possíveis pneus desse tipo, desde o que menos rodou ou rodará até o que mais rodou ou rodará, ou seja, a população dos pneus desse tipo. Perceba que o pneu que menos roda faz isso por aproximadamente 25.000 km, e o que é mais resistente roda cerca de 65.000 km. Se todos os pneus estão representados pela área total (AT) e os pneus que duram 50.000 ou mais quilômetros na área cinza (Ap = área pedida), então é lógico deduzir a partir do que já sabemos: P A A p t (pneu rodar 50.000 km ou mais) = Nessas circunstâncias, calcular a probabilidade significa calcular duas áreas. Não é uma tarefa fácil, matematicamente, mas foram desenvolvidos procedimentos que facilitam esses cálculos. Logo a seguir, mostraremos como são esses procedimentos. Por ora, você acreditará quando digo que a área dada desse exercício corresponde a 8,38% da área total, portanto: P(pneu rodar 50.000 km ou mais) = 0,0838 = 8,38% 2.4.2 Cálculo das áreas da curva normal Como notamos na resolução da questão anterior, o cálculo de uma probabilidade que segue a distribuição normal é relativamente fácil e pouco trabalhoso; o grande problema é calcular as áreas envolvidas. Esse tipo de cálculo é matematicamente muito trabalhoso e deveria ser refeito a cada problema a se resolver, visto que, como cada curva normal é caracterizada pela média e pelo desvio 5 10 15 20 25 49 ESTATÍSTICA APLICADA Re vi sã o: T at ia ne - D ia gr am aç ão : M ár ci o - 18 /0 5/ 10 padrão, qualquer alteração nesses parâmetros provocaria uma mudança na curva e consequentemente o recálculo das áreas envolvidas. Para facilitar esses cálculos que são repetidos centenas de milhares de vezes, foi estabelecida uma curva padrão, chamada de curva normal reduzida, a partir da qual, por analogia, determinam-se as áreas de situações práticas. Essa curva tem várias características interessantes que irão facilitar nossos cálculos: • Utiliza-se a variável reduzida (padrão) z, para diferenciá-la da variável real, aquela de envolve os problemas práticos que continuaremos a chamar de x (por exemplo, vida útil do pneu do nosso exemplo). • É construída para uma média igual a zero e um desvio padrão igual a 1 (µ=0; σ=1). • A área total sob a curva normal reduzida é igual a 1. • A curva varia, no eixo z desde -4 até mais 4, ou seja, de menos quatro desvios padrões da média até mais quatro desvios padrões da média. • Todas as áreas são tabeladas. Veja tabela do anexo 1. • A relação entre a curva normal reduzida e a curva normal real é feita pela fórmula: z x= − µ σ Em que: • z é a variável reduzida. 5 10 15 20 25 50 Unidade I Re vi sã o: T at ia ne - D ia gr am aç ão : M ár ci o - 18 /0 5/ 10 • x é a variável real. • µ é a média real. • σ é o desvio padrão real. A curva reduzida pode ser vista a seguir. Perceba que entre um desvio padrão para menos, em relação à média, e um desvio padrão para mais, a área é de 68,2% do total. Entre dois desvios padrões para menos e dois desvios padrões para mais, a área é de 95,4% do total e assim por diante. Perceba que não existe área antes de quatro vezes o desvio padrão para menos e depois de quatro vezes o desvio padrão para mais, ou seja, é estatisticamente impossível ocorrer algo que diste mais do que 4 vezes o desvio padrão da média. P(z) z -4 -3 -2 -1 0 1 2 3 4 68,2% 95,4% 99,7% 100,0% Os cálculos das probabilidades envolvendo distribuições normais são basicamente a determinação das áreas envolvidas, por meio do uso da tabela da curva normal reduzida, acessada 5 10 15 51 ESTATÍSTICA APLICADA Re vi sã o: T at ia ne - D ia gr am aç ão : M ár ci o - 18 /0 5/ 10 por meio de analogia com a situação real que estamos trabalhando. Precisamos então entender o funcionamento da tabela da curva normal reduzida, a qual você encontra no anexo 1. O critério básico da tabela é que as áreas começam sempre da extrema esquerda da curva e terminam no valor de z que se está trabalhando, como mostrado a seguir: P(z) z -4 -3 -2 -1 0 1 2 3 4 At Z1 = -1,65 A área marcada começa na extrema esquerda e termina em z1=-1,65, portanto é uma área tabelada, o valor dela é obtido na tabela da seguinte forma: Z 0 1 2 3 4 5 6 7 8 9 -3,9 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 -3,8 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 -3,7 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 -1,7 0,0446 0,0436 0,0427 0,0418 0,0409 0,0404 0,0392 0,0384 0,0375 0,0367 -1,6 0,0548 0,0537 0,0526 0,0516 0,0505 0,0495 0,0485 0,0475 0,0465 0,0455 -1,5 0,0668 0,0655 0,0643 0,0630 0,0618 0,0600 0,0594 0,0582 0,0571 0,0559 -1,4 0,0808 0,0793 0,0778 0,0764 0,0749 0,0735 0,0721 0,0708 0,0694 0,0681 -1,3 0,0968 0,0951 0,0934 0,0918 0,0901 0,0885 0,0869 0,0853 0,0838 0,0823 5 10 52 Unidade I Re vi sã o: T at ia ne - D ia gr am aç ão : M ár ci o - 18 /0 5/ 10 Perceba que a tabela tem duas páginas. Uma para valores de z positivos e outra para valores de z negativos. No exemplo anterior, usamos a tabela para valores de z negativos, obviamente. Na coluna da esquerda, localizamos os dois primeiros algarismos do z dado, ou seja, 1,6. Na primeira linha, localizamos o valor do último algarismo de z, o algarismo 5. A área tabelada é
Compartilhar