Prévia do material em texto
<p>Estatística</p><p>Agosto</p><p>2009</p><p>UFU</p><p>Prof. Dr. Quintiliano Siqueira Schroden Nomelini</p><p>2</p><p>1 - ESTATÍSTICA DESCRITIVA</p><p>1.1 - A NATUREZA DA ESTATÍSTICA</p><p>• COMO SURGIU A ESTATÍSTICA?????</p><p>A Matemática surge do convívio social, da contagem, das trocas. Como a Estatística</p><p>é um ramo da Matemática Aplicada, ela também surge da experiência com o homem.</p><p>Na Antigüidade: registros do nº de habitantes, nascimentos, óbitos, impostos, etc.</p><p>Idade Média: registros bélicos e tributários as principais manipulações quantitativas.</p><p>Sec. XVI: começa a surgir análises de casamentos, batizados, gerando as primeiras</p><p>tábuas e tabelas.</p><p>No sec. XVIII: o estudo desses registros numéricos assume um caráter mais</p><p>científico.</p><p>A Estatística foi batizada por Godofredo Archenwall nessa época.</p><p>Antonio A. Crespo define Estatística como:</p><p>Estatística é uma parte da matemática aplicada que fornece métodos para a</p><p>coleta, a organização, a descrição, a análise e a interpretação de dados</p><p>quantitativos e qualitativos, e a utilização desses dados para a tomada de</p><p>decisão.</p><p>• Conceitos de Estatística e porque estudar Estatística</p><p>A Estatística estuda então os fenômenos com um conjunto muito numeroso de</p><p>indivíduos, com pelo menos uma característica comum.</p><p>A partir da análise quantitativa de uma determinada experiência ou de um determinado</p><p>grupo de indivíduos, se for observado certa regularidade nessa característica,</p><p>provavelmente existirá a mesma regularidade numa classe maior de experiências ou</p><p>indivíduos. Esse é um processo de generalização.</p><p>• Por que estudar Estatística:</p><p>� O raciocínio estatístico é muito utilizado no governo e na administração: emprego.</p><p>� O conhecimento estatístico serve para bem tomar decisões e não ser iludido.</p><p>� Os próximos cursos usam a Estatística.</p><p>� As revistas profissionais e artigos científicos se referem a estudos estatísticos.</p><p>� Usar a interpretação estatística nos artigos da imprensa e no cotidiano.</p><p>3</p><p>• Os ramos da Estatística</p><p>A Estatística pode ser dividida em duas partes:</p><p>� Estatística Descritiva: tem como objetivo a observação de fenômenos de mesma</p><p>natureza, a coleta de dados numéricos relativos a esses fenômenos, a organização e a</p><p>classificação desses dados observados e a sua apresentação através de gráficos e tabelas,</p><p>além da descrição desses dados através do cálculo de coeficientes.</p><p>Exemplos: taxa de desemprego, custo de vida, índice pluviométrico, quilometragem</p><p>média por litro de combustível, volume de vendas mensais de um produto, etc.</p><p>� Estatística Inferencial ou Dedutiva: tem como objetivo a análise e interpretação</p><p>dos dados amostrais. Refere-se a um processo de generalização a partir de resultados</p><p>particulares. Esse processo de generalização está associado a uma margem de incerteza,</p><p>pois a conclusão a respeito da característica comum de uma população é obtida</p><p>analisando-se uma parcela dessa população. Para medir essa incerteza, usa-se técnicas e</p><p>métodos da Teoria da Probabilidade.</p><p>Exemplos: Para calcular a voltagem necessária para que um dispositivo elétrico chegue</p><p>a falhar, submete-se uma amostra de tais dispositivos a voltagens cada vez mais</p><p>elevadas, até falhar cada dispositivo da amostra. Com base nos resultados, pode-se</p><p>estimar a probabilidade de falha nos dispositivos, a cada voltagem.</p><p>• O método Estatístico e suas fases</p><p>Na Antigüidade, os conhecimentos eram adquiridos ao acaso ou por necessidades</p><p>práticas. Atualmente, pode-se adquiri-los através de processos científicos de observação</p><p>e estudo.</p><p>O método estatístico, diante da impossibilidade de manter as causas constantes,</p><p>admite todas as causas presentes variando-as, registrando essas variações e</p><p>procurando determinar, no resultado final, que influências cabem a cada uma</p><p>delas.</p><p>Dados são números que exprimem a observação de elementos com uma</p><p>característica comum. Exemplo: os homens de uma comunidade.</p><p>Para se fazer um estudo estatístico, deve-se dividi-lo em fases:</p><p>As fases são:</p><p>Coletas de dados: é a obtenção, reunião e registro sistemático de dados, com um</p><p>objetivo determinado.</p><p>4</p><p>• Direta: quando é obtida diretamente da fonte e pode ser:</p><p>Contínua : Obtida ininterruptamente: Registro de nascimentos, etc.</p><p>Periódica : em períodos curtos: Censos</p><p>Ocasional : esporadicamente : Surto epidêmico</p><p>• Indireta: Quando é inferida ( deduzida ) a partir dos elementos conseguidos pela</p><p>coleta direta</p><p>- Mortalidade infantil</p><p>• Crítica dos dados: devem ser criticados à procura de erros grosseiros ou de certos</p><p>vultos, que possam influir sensivelmente nos resultados como:</p><p>- Externa: Informante</p><p>- Interna: dados da coleta</p><p>Apuração dos dados: é a soma e o processamento dos dados obtidos e a disposição</p><p>mediante critérios de classificação.</p><p>Exposição dos dados: devem ser apresentados sob forma de tabelas ou gráficos</p><p>tornando mais fácil e compreensão do objeto de tratamento estatístico</p><p>Análise dos resultados: É o estudo dos resultados com o objetivo de tirar conclusões sobre o</p><p>todo (população), a partir de informações fornecidas por parte representativa do todo (amostra).</p><p>a) A FIGURA A SEGUIR ILUSTRA O PRINCIPIO FUNDAMENTAL</p><p>DA ESTATÍSTICA</p><p>Onde: População: é o conjunto de entes portadores de, pelo menos, uma característica comum;</p><p>Amostra :é um subconjunto finito de uma população.</p><p>5</p><p>1.2 – FERRAMENTAS NECESSÁRIAS AO CÁLCULO ESTATÍSTICO</p><p>Talvez alguns assuntos tratados neste capítulo sejam apenas uma revisão para a</p><p>grande maioria de vocês. Todavia seu conhecimento será de extrema validade, não</p><p>só para o acompanhamento do curso como também para o aprendizado de vários</p><p>tópicos.</p><p>1 – Frações – par de números naturais em que o segundo representa um certo número de</p><p>partes em que p inteiro está dividido, e o primeiro representa uma ou mais dessas partes</p><p>iguais.Assim, 2/5 é uma fração onde 2 é o numerador e 5 o denominador.</p><p>Simplificação – Para simplificar frações devemos dividir o numerador e o denominador</p><p>pelo mesmo número, obtendo uma fração equivalente à fração dada. Assim:</p><p>5</p><p>2</p><p>15</p><p>6 = ,</p><p>que é conhecida como fração irredutível.</p><p>2 – Somatório.</p><p>REVISÃO:</p><p>1 Desenvolva cada uma das seguintes expressões, colocando-as na sua forma mais</p><p>simples possível:</p><p>a)</p><p>5</p><p>1</p><p>i</p><p>i</p><p>x</p><p>=</p><p>∑ ;</p><p>b)</p><p>5</p><p>2</p><p>1</p><p>i i</p><p>i</p><p>z x</p><p>=</p><p>∑ ;</p><p>c)</p><p>6</p><p>1</p><p>i i</p><p>i</p><p>x y</p><p>=</p><p>∑ ;</p><p>d)</p><p>4</p><p>1</p><p>i</p><p>i</p><p>x x</p><p>=</p><p>−∑ ;</p><p>e) ( )</p><p>26</p><p>1</p><p>i</p><p>i</p><p>x x</p><p>=</p><p>−∑ .</p><p>2. Escreva em notação sigma (somatório):</p><p>a) 1 2 ... nx x x+ + + ;</p><p>b) ( )2</p><p>1 2 ...</p><p>n</p><p>x x x+ + + ;</p><p>c) 1 2 7...x x x+ + + ;</p><p>d) 2 2 2</p><p>1 2 ...</p><p>n</p><p>x x x+ + + .</p><p>3. Calcule para os dados abraixo:</p><p>i 1 2 3 4 5 6</p><p>i</p><p>Z 7 3 8 9 4 3</p><p>i</p><p>X 9 13 15 21 25 29</p><p>6</p><p>a)</p><p>3</p><p>1</p><p>i</p><p>i</p><p>X</p><p>=</p><p>∑ ;</p><p>b)</p><p>6</p><p>3</p><p>i</p><p>i</p><p>X</p><p>=</p><p>∑ ;</p><p>c)</p><p>6</p><p>1</p><p>i</p><p>i</p><p>X</p><p>=</p><p>∑ ;</p><p>d)</p><p>6</p><p>2</p><p>1</p><p>i</p><p>i</p><p>X</p><p>=</p><p>∑ ;</p><p>e)</p><p>6</p><p>1</p><p>i</p><p>i</p><p>Z</p><p>=</p><p>∑ ;</p><p>f)</p><p>6</p><p>1</p><p>i i</p><p>i</p><p>Z X</p><p>=</p><p>∑ ;</p><p>g)</p><p>6</p><p>2</p><p>1</p><p>i i</p><p>i</p><p>Z X</p><p>=</p><p>∑ .</p><p>4. Sejam os conjuntos de dados: { }4,3,0,1X = , { }3,0,1,3Y = . Obtenha os</p><p>seguintes somatórios:</p><p>a)</p><p>4</p><p>1</p><p>i</p><p>i</p><p>X</p><p>=</p><p>∑ ;</p><p>b)</p><p>4</p><p>2</p><p>1</p><p>i</p><p>i</p><p>X</p><p>=</p><p>∑ ;</p><p>c)</p><p>4</p><p>1</p><p>i i</p><p>i</p><p>Y X</p><p>=</p><p>∑ ;</p><p>d)</p><p>24</p><p>1</p><p>i</p><p>i</p><p>X</p><p>=</p><p> </p><p> </p><p> </p><p>∑ .</p><p>7</p><p>1.3 – SÉRIES ESTATÍSTICAS</p><p>• Definição: Uma vez coletados os dados, o conjunto de valores é extenso e desorganizado e, no</p><p>seu exame, há o perigo de se perder a visão global do fenômeno analisado. Por isso, reunimos os</p><p>valores em tabelas compactas, que permitem uma visão mais sintética do fenômeno, sem tirar-lhe a</p><p>precisão primitiva. Essa condensação dos valores permite ainda a representação gráfica, uma forma</p><p>mais sutil e elegante de apresentação da característica estudada.</p><p>Uma tabela é um quadro que resume as observações de alguma variável.</p><p>Uma série estatística é toda tabela que apresenta a distribuição de um conjunto de dados</p><p>estatísticos em função da época, do local ou da espécie.</p><p>• Classificação das Séries Estatísticas</p><p>Podemos classificar uma</p><p>)</p><p>( ) ( )</p><p>| ?</p><p>| , 0</p><p>B</p><p>B</p><p>B</p><p>P V V</p><p>P V V</p><p>P V V P V</p><p>P V</p><p>=</p><p>∩</p><p>= ></p><p>Agora, vamos determinar ( ) ( )( ), e B BP V P V P V V∩ :</p><p>( ) ( )</p><p>( ) ( ) ( ) ( )</p><p>( )</p><p>30 3</p><p>( ) 40 4 1 2 1 4 2.|</p><p>3 4 2 3 320 1</p><p>( ) 40 2</p><p>B</p><p>B</p><p>B</p><p>B</p><p>n V</p><p>P V</p><p>n P V V</p><p>P V V</p><p>P Vn V V</p><p>P V V</p><p>n</p><p></p><p>= = = Ω ∩</p><p>⇒ = = = =</p><p>∩ ∩ = = =</p><p>Ω </p><p>.</p><p>Portanto, a probabilidade de se ter uma bola vermelha com mancha branca, dado que o evento bola</p><p>vermelha já ocorreu é de 2/3.</p><p>2.5.2 - INDEPENDÊNCIA DE EVENTOS</p><p>Dois eventos A e B são independentes se ( ) ( ) ( )P A B P A P B∩ = .</p><p>Exemplo 1: Considere o lançamento de uma moeda (não viciada) três vezes. Cujo evento A</p><p>corresponde ao primeiro lançamento da moeda sair cara e o evento B corresponde ao segundo</p><p>lançamento da moeda sair cara. Esses dois eventos são independentes?</p><p>O espaço amostral é: { }, , , , , , , .ccc ccr crc rcc crr rcr rrc rrrΩ = Os eventos favoráveis aos eventos A e</p><p>B são { } { }, , , e , , , .A ccc ccr crc crr B ccc ccr rcc rcr= = Conseqüente, { },A B ccc ccr∩ = .</p><p>Agora, vamos verificar se este dois eventos são independentes.</p><p>51</p><p>( ) ( )</p><p>( ) ( )</p><p>( ) 4 1( )</p><p>( ) 8 2 ( )1 1 1 2 1. e ( )</p><p>2 2 4 ( ) 8 4( ) 4 1( )</p><p>( ) 8 2</p><p>1( )</p><p>4</p><p>n A</p><p>P A</p><p>n n A B</p><p>P A P B P A B</p><p>nn B</p><p>P B</p><p>n</p><p>P A B P A P B</p><p>= = = Ω ∩</p><p>⇒ = = ∩ = = = Ω</p><p>= = =Ω </p><p>∴ ∩ = =</p><p>Portanto, os eventos A e B são independentes.</p><p>Exemplo 2: Distribuição de alunos matriculados em um determinado instituto de Matemática. Com</p><p>base na Tabela abaixo, determine:</p><p>Sexo</p><p>Curso</p><p>Masculino Feminino</p><p>Total</p><p>Mat. Pura 70 40 110</p><p>Mat. Aplicada 15 15 30</p><p>Estatística 10 20 30</p><p>Computação 20 10 30</p><p>Total 115 85 200</p><p>a) Probabilidade do sexo masculino.</p><p>b) Probabilidade do sexo feminino.</p><p>c) Probabilidade matemática pura.</p><p>d) Probabilidade matemática aplicada.</p><p>e) Probabilidade computação</p><p>f) Probabilidade matemática pura e sexo feminino.</p><p>g) Probabilidade matemática pura e sexo masculino.</p><p>h) Probabilidade matemática pura dado que ele é do sexo feminino.</p><p>i) Probabilidade matemática pura dado que ele é do sexo masculino.</p><p>j) Verifique se sexo feminino e matemática pura são eventos independentes.</p><p>k) Verifique se sexo feminino e matemática aplicada são eventos independentes.</p><p>l) Verifique se sexo feminino e estatística são eventos independentes.</p><p>m) Verifique se sexo feminino e computação são eventos independentes.</p><p>n) Verifique se sexo masculino e matemática pura são eventos independentes.</p><p>o) Verifique se sexo masculino e matemática aplicada são eventos independentes.</p><p>p) Verifique se sexo masculino e estatística são eventos independentes.</p><p>q) Verifique se sexo masculino e computação são eventos independentes.</p><p>2.5.3 - TEOREMA DA PROBABILIDADE TOTAL</p><p>52</p><p>Suponha que um espaço amostral Ω de um experimento seja dividido em três eventos R1, R2 e</p><p>R3, mutuamente exclusivos e considere um evento B qualquer, como mostra a figura abaixo:</p><p>Então )()()()()()()( 332211 RPRBPRPRBPRPRBPBP ⋅+⋅+⋅=</p><p>O Teorema da Probabilidade Total pode ser generalizado para n eventos:</p><p>)()()()()()()( 2211 nn RPRBPRPRBPRPRBPBP ⋅++⋅+⋅= ⋯</p><p>Exemplos:</p><p>1) Um piloto de fórmula 1 tem 50% de probabilidade de vencer determinada corrida, quando esta</p><p>se realiza sob chuva. Caso não chova durante a corrida, sua probabilidade de vitória é de 25%. Se o</p><p>serviço de meteorologia estimar em 30% a probabilidade de que chova durante a corrida, qual é a</p><p>probabilidade deste piloto vencer esta corrida?</p><p>( ) ( ) ( ) ( ) ( ) 0,5 0,3 0, 25 0,7 0,325 32,5%P V P V CH P CH P V NCH P NCH= ⋅ + ⋅ = ⋅ + ⋅ = =</p><p>2.6 - TEOREMA DE BAYES</p><p>É um importante teorema que expressa o conceito de uma probabilidade condicional em função de</p><p>outras probabilidades condicionais e marginais.</p><p>R1</p><p>R2</p><p>R3 B</p><p>Ω</p><p>Ω</p><p>CH NCH</p><p>V</p><p>25%</p><p>50%</p><p>30% 70%</p><p>53</p><p>Teorema de Bayes: Se B1, B2,..., Bk são conjuntos mutuamente exclusivos cuja união resulta em Ω ,</p><p>então:</p><p>( ) ( ) ( )</p><p>( ) ( )</p><p>1</p><p>|</p><p>|</p><p>|</p><p>i i</p><p>i k</p><p>i i</p><p>i</p><p>P B P A B</p><p>P B A</p><p>P B P A B</p><p>=</p><p>=</p><p>∑</p><p>.</p><p>Exemplo: Considere cinco urnas cada uma com seis bolas. Duas dessas urnas (tipo C1), tem três</p><p>bolas brancas, duas outras urnas (tipo C2), tem duas bolas brancas e a última (tipo C3) tem seis bolas</p><p>brancas. Escolhe-se uma urna ao acaso e retira-se uma bola desta. Qual a probabilidade de que a</p><p>urna escolhida seja do tipo C3, sabendo-se que a bola retirada á branca?</p><p>Resolução:</p><p>O evento bola branca será denotado por B, e o que se quer determinar é: ( )3 | ?P C B =</p><p>Sabe-se que existe 5 urnas (2 do tipo C1, 2 do tipo C2 e 1 do tipo C3).</p><p>Pelo teorema de bayes temos:</p><p>( ) ( ) ( )</p><p>( ) ( )</p><p>( ) ( ) ( )</p><p>( ) ( )</p><p>( ) ( ) ( )</p><p>( ) ( ) ( ) ( ) ( ) ( )</p><p>1</p><p>3 3</p><p>3 3</p><p>1</p><p>3 3</p><p>3</p><p>1 1 2 2 3 3</p><p>. |</p><p>|</p><p>. |</p><p>. |</p><p>|</p><p>. |</p><p>. |</p><p>| ?</p><p>. | . | . |</p><p>i i</p><p>i k</p><p>i i</p><p>i</p><p>i i</p><p>i</p><p>P C P B C</p><p>P C B</p><p>P C P B C</p><p>P C P B C</p><p>P C B</p><p>P C P B C</p><p>P C P B C</p><p>P C B</p><p>P C P B C P C P B C P C P B C</p><p>=</p><p>=</p><p>=</p><p>=</p><p>= =</p><p>+ +</p><p>∑</p><p>∑</p><p>A probabilidade de selecionar aleatoriamente a urna do tipo C1 é:</p><p>( ) ( )</p><p>( )</p><p>1 1</p><p>1</p><p>º 2</p><p>º 5u</p><p>n C n de urnas C</p><p>P C</p><p>n n total deurnas</p><p>= = =</p><p>Ω</p><p>.</p><p>Analogamente, a probabilidade de selecionar aleatoriamente a urna do tipo C2 e a urna do tipo C3 é:</p><p>( ) ( )</p><p>( ) ( ) ( )</p><p>( )</p><p>2 3 32</p><p>2 3</p><p>º º 2 1</p><p>e</p><p>º 5 º 5u u</p><p>n C n C n de urnas Cn de urnas C</p><p>P C P C</p><p>n n total deurnas n n total deurnas</p><p>= = = = = =</p><p>Ω Ω</p><p>.</p><p>Agora, determinaremos as seguintes probabilidades condicionais:</p><p>( )1 1</p><p>6 1</p><p>| Prob. de sair bola branca dado que a urna é do tipo C</p><p>12 2</p><p>P B C = = =</p><p>( )2 2</p><p>4 1</p><p>| Prob. de sair bola branca dado que a urna é do tipo C</p><p>12 3</p><p>P B C = = =</p><p>( )3 3</p><p>6</p><p>| Prob. de sair bola branca dado que a urna é do tipo C 1</p><p>6</p><p>P B C = = = .</p><p>Então:</p><p>( ) ( ) ( )</p><p>( ) ( ) ( ) ( ) ( ) ( )</p><p>3 3</p><p>3</p><p>1 1 2 2 3 3</p><p>. |</p><p>|</p><p>. | . | . |</p><p>P C P B C</p><p>P C B</p><p>P C P B C P C P B C P C P B C</p><p>=</p><p>+ +</p><p>54</p><p>( )3</p><p>1</p><p>.1</p><p>5|</p><p>2</p><p>P C B =</p><p>1</p><p>.</p><p>5 2</p><p>1 1 1</p><p>15 5 5</p><p>2 2 6 2 82 1 1 5</p><p>. .1</p><p>5 15 15 15 155 3 5</p><p>= = = =</p><p>+ ++ +</p><p>15</p><p>.</p><p>3</p><p>3</p><p>0,375.</p><p>8 8</p><p>= =</p><p>Exercício</p><p>Uma empresa produz circuitos integrados em três fábricas. A fábrica 1 produz 40% dos circuitos</p><p>enquanto que as fábricas 2 e 3, produzem 30% cada. A probabilidade de que um circuito produzido</p><p>por estas fábricas não funcione é de 0,01; 0,04 e 0,03 respectivamente. Qual a probabilidade de se</p><p>pegar um circuito ao acaso da produção total da companhia, sendo ele da fábrica 1 e sabendo que</p><p>ele não funciona.?</p><p>Solução:</p><p>( ) ( ) ( )</p><p>( ) ( ) ( ) ( ) ( ) ( )</p><p>( )</p><p>1 1</p><p>1</p><p>1 1 2 2 3 3</p><p>1</p><p>. |</p><p>|</p><p>. | . | . |</p><p>0,40*0,01</p><p>| 0,16</p><p>0,40*0,01 0,30*0,04 0,30*0,03</p><p>P F P def F</p><p>P F def</p><p>P F P def F P F P def F P F P def F</p><p>P F def</p><p>=</p><p>+ +</p><p>= =</p><p>+ +</p><p>3 - VARIÁVEL ALEATÓRIA UNIDIMENSIONAL</p><p>Para entendermos este conceito de variável aleatória (v.a.), imagine um lançamento de um</p><p>dado. Tente dizer qual será o número resultante. É claro que, antes do lançamento, não podemos</p><p>dizer com exatidão qual é o número que ocorrerá, pois o resultado depende do fator sorte e, por</p><p>isso, é uma variável aleatória.</p><p>Variável Aleatória (v.a.) é uma variável cujos valores são determinados pelos resultados de</p><p>experiências aleatórias, isto é, uma função que associa valores reais aos eventos de um espaço</p><p>amostral.</p><p>Uma v.a. pode ser entendida como uma variável quantitativa, ou seja, uma v.a. pode ser</p><p>classificada como discreta ou contínua. As variáveis aleatórias dizem-se discretas, quando</p><p>assumem um número determinado de valores contáveis (valores oriundos de um processo de</p><p>contagem), ou contínuas, quando assumem qualquer valor num dado intervalo (valores oriundos de</p><p>um processo de mensuração).</p><p>3.1 - VARIÁVEL ALEATÓRIA DISCRETA</p><p>O conceito de v.a. discreta será introduzido por meio de exemplos.</p><p>Exemplo 1: Se um experimento consiste no lançamento de dois dados, a função: X = “soma das</p><p>faces dos dois dados”, define uma variável aleatória discreta, que pode assumir onze valores</p><p>possíveis: 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 ou 12.</p><p>55</p><p>Exemplo 2: Se um experimento consiste</p><p>em verificar o número de circuitos defeituosos num</p><p>sistema formado por quatro circuitos, a função: Y = “número de circuitos defeituosos”, define uma</p><p>variável aleatória discreta, que pode assumir onze valores possíveis: 0, 1, 2, 3 ou 4.</p><p>Com base nos exemplos acima fica claro que a variável aleatória discreta está vinculada a</p><p>valores de uma contagem que resultam a números inteiros.</p><p>3.2 - VARIÁVEL ALEATÓRIA CONTÍNUA</p><p>A variável aleatória é dita contínua se corresponder a dados de medida, pertencentes aos ℝ .</p><p>O conceito de v.a. contínua será mais bem entendido por meio do exemplo a seguir.</p><p>Exemplo 3: Se um experimento consiste em verificar as alturas de 30 universitários, a função: X =</p><p>“Altura de um universitário”, define uma variável aleatória contínua, que pode assumir quaisquer</p><p>valores entre 130 e 220 cm.</p><p>Exemplo 4: Se um experimento consiste em verificar (mensurar) os pesos dos 30 universitários, a</p><p>função: Y = “Peso de um universitário”, define uma variável aleatória contínua, que pode assumir</p><p>quaisquer valores entre 60 e 130 kg.</p><p>Exemplo 5: Se um experimento consiste em verificar a durabilidade de um lote de 50 pneus, a</p><p>função: Z: “tempo de vida útil de um pneu”, define uma v.a. contínua, que pode assumir quaisquer</p><p>valores entre 50.000 e 70.000 km.</p><p>Com base nos exemplos apresentados, a v.a. contínua está vinculada a dados oriundos de</p><p>uma mensuração que resultam a um intervalo de números reais.</p><p>4 - DISTRIBUIÇÃO DE PROBABILIDADES</p><p>Se uma variável aleatória Y pode assumir os valores 1 2, , , ny y y… com probabilidades</p><p>respectivamente [ ] [ ] [ ]1 2, , ,</p><p>n</p><p>P Y y P Y y P Y y= = =… , tais que [ ]</p><p>1</p><p>1</p><p>n</p><p>i</p><p>i</p><p>P Y y</p><p>=</p><p>= =∑ , tem-se definida uma</p><p>distribuição de probabilidade.</p><p>No tocante a variáveis aleatórias discretas, a cada realização y corresponde uma</p><p>probabilidade P[Y = y]. Isso define uma função, chamada função de probabilidade, a qual deve</p><p>obedecer a algumas condições, quais sejam:</p><p>i) [ ] 0, para todo iP Y y i= ≥ ;</p><p>ii) [ ]</p><p>1</p><p>1i</p><p>i</p><p>P Y y</p><p>∞</p><p>=</p><p>= =∑</p><p>em que o índice i é empregado para identificar os diferentes valores que a variável pode assumir.</p><p>Essa função é denominada por inúmeros autores como função distribuição de probabilidade da</p><p>variável aleatória discreta Y.</p><p>56</p><p>Nota: [ ] [ ]</p><p>i</p><p>b</p><p>i</p><p>y a</p><p>P Y y P a y b</p><p>></p><p>= = < ≤∑</p><p>Exemplo 1: Y: número de circuitos defeituosos num sistema formado por quatro circuitos tem-se:</p><p>Y 0 1 2 3 4</p><p>P[Y = y] 1/8 2/8 2/8 2/8 1/8 [ ]</p><p>5</p><p>1</p><p>1i</p><p>i</p><p>P Y y</p><p>=</p><p>= =∑</p><p>Observa-se que a distribuição de probabilidade acima é uma função de probabilidade pois, as</p><p>condições (i) e (ii) foram satisfeitas, isto é, todas as probabilidades são maiores que zero e, a soma</p><p>das probabilidades é igual a um.</p><p>Se, a variável Y for contínua, somente haverá interesse na probabilidade de que a variável</p><p>assuma valores dentro de determinados intervalos, sendo sua distribuição de probabilidades</p><p>caracterizada por uma função densidade de probabilidade (f.d.p.), f(y), a qual deverá possuir as</p><p>seguintes propriedades:</p><p>i) ( ) 0, f y y≥ ∀ ∈ ℝ ;</p><p>ii) ( ) 1f y dy</p><p>∞</p><p>−∞</p><p>=∫ .</p><p>Nota: [ ] [ ] [ ] [ ] ( ) , e</p><p>b</p><p>a</p><p>P a y b P a y b P a y b P a y b f y dy a b≤ ≤ = < ≤ = ≤ < = < < = ∀∫ .</p><p>Exemplo 2: Para o caso das alturas dos universitários têm-se:</p><p>( ) ( )2</p><p>2</p><p>1</p><p>exp</p><p>22</p><p>x</p><p>f x</p><p>µ</p><p>σσ π</p><p> −</p><p>= − </p><p> </p><p>,</p><p>que é a distribuição normal.</p><p>4.1 - FUNÇÃO REPARTIÇÃO OU FUNÇÃO DISTRIBUIÇÃO ACUMULADA</p><p>A função de distribuição acumulada nos fornece a probabilidade de que a variável em</p><p>questão esteja abaixo de um determinado valor. Em geral, ela é representada por ( ) ( ) ou F y yφ .</p><p>Assim,</p><p>( ) [ ]F y P Y y= ≤ .</p><p>i) Para uma variável aleatória discreta a função distribuição acumulada será definida como:</p><p>( ) [ ] [ ] [ ] [ ] [ ]1 2</p><p>1</p><p>k</p><p>k k k i</p><p>i</p><p>F y P Y y P Y y P Y y P Y y P Y y</p><p>=</p><p>= ≤ = = + = + + = = =∑⋯ .</p><p>ii) Para uma variável aleatória contínua a função distribuição acumulada será definida como:</p><p>( ) [ ] ( )</p><p>ky</p><p>k k</p><p>F y P Y y f y dy</p><p>−∞</p><p>= ≤ = ∫ .</p><p>57</p><p>Exemplo 3: Numa plantação de café, cujas folhas possuem um número Y variado de lesões</p><p>provocadas pela praga bicho mineiro (Perileucoptera coffeella), obedecendo as seguintes</p><p>proporções:</p><p>Nº lesões 0 1 2 3 4 5</p><p>proporção 0,32 0,28 0,20 0,12 0,06 0,02</p><p>Essas proporções podem ser interpretadas como probabilidades no sentido de que, se uma folha for</p><p>tomada à plantação ao acaso, existe uma probabilidade, por exemplo, de 28% de que ela contenha</p><p>apenas uma lesão. A probabilidade de que ela tenha 3 lesões, ou menos, é dada por:</p><p>( ) ( ) [ ] [ ]</p><p>( ) ( ) [ ] [ ] [ ] [ ] [ ]</p><p>( ) ( ) [ ]</p><p>3 3 3 0 ou 1 ou 2 ou 3</p><p>3 3 3 0 1 2 3</p><p>3 3 3 0,32 0,28 0, 20 0,12 0,92.</p><p>F Y F P Y P Y Y Y Y</p><p>F Y F P Y P Y P Y P Y P Y</p><p>F Y F P Y</p><p>= = = ≤ = = = = =</p><p>= = = ≤ = = + = + = + =</p><p>= = = ≤ = + + + =</p><p>Exemplo 4: Seja a função densidade de probabilidade:</p><p>( )</p><p>0, 0</p><p>, 0 2</p><p>0, 2</p><p>x</p><p>f x kx x</p><p>x</p><p><</p><p>= ≤ ≤</p><p> ></p><p>.</p><p>Encontre F(1).</p><p>Antes de encontrar F(1) é necessário determinar o valor de k. Sabe-se que:</p><p>( ) ( ) 1f x dx f x</p><p>∞</p><p>−∞</p><p>= ⇔∫ ( )</p><p>00</p><p>dx f x</p><p>−∞</p><p>+∫ ( )2</p><p>0</p><p>kx</p><p>dx f x+∫</p><p>( )</p><p>0</p><p>2</p><p>2 222 2 2 2 2</p><p>0 0</p><p>00</p><p>1</p><p>1 1 1 1 2 0 1</p><p>2 2 2</p><p>4 1 2 1 1 2</p><p>2</p><p>dx</p><p>x k k</p><p>kx dx k x dx k x</p><p>k</p><p>k k</p><p>∞</p><p>=</p><p>= ⇔ = ⇔ = ⇔ = ⇔ − =</p><p>= ⇔ = ⇔ =</p><p>∫</p><p>∫ ∫</p><p>Dessa forma, a função densidade de probabilidade fica:</p><p>( )</p><p>0, 0</p><p>1</p><p>, 0 2</p><p>2</p><p>0, 2</p><p>x</p><p>f x x x</p><p>x</p><p><</p><p></p><p>= ≤ ≤</p><p></p><p>></p><p>.</p><p>Agora, temos condição de determinar F(1). Por definição, tem-se que:</p><p>( ) [ ] ( ) ( )</p><p>1</p><p>1 1F P X f x dx f x</p><p>−∞</p><p>= ≤ = =∫ ( )</p><p>0 0</p><p>dx f x</p><p>−∞</p><p>+∫</p><p>1 1/ 2 1</p><p>2</p><p>00 0</p><p>1 1</p><p>0,25</p><p>2 4 4</p><p>x x</p><p>dx dx x= = = =∫ ∫ .</p><p>Propriedades da Função Distribuição Acumulada ou Função Repartição</p><p>i) ( )0 1F y≤ ≤ ;</p><p>ii) se 1 2y y< , então, ( ) ( )1 2F y F y≤ ;</p><p>iii) ( ) ( )lim 0</p><p>y</p><p>F F y</p><p>→−∞</p><p>−∞ = = ;</p><p>58</p><p>iv) ( ) ( )lim 1</p><p>y</p><p>F F y</p><p>→+∞</p><p>+∞ = = , corresponde ao evento certo;</p><p>v) [ ] ( ) ( )1 2 2 1P y Y y F y F y< ≤ = − ;</p><p>vi) [ ] ( ) ( ) [ ]1 2 2 1 1P y Y y F y F y P Y y≤ ≤ = − + = ;</p><p>vii) [ ] ( ) ( ) [ ]1 2 2 1 2P y Y y F y F y P Y y< < = − − = .</p><p>Gráfico da Função Distribuição Acumulada ou Função Repartição</p><p>Seja X a variável aleatória discreta com a seguinte função de probabilidade:</p><p>X 0 1 2 3 4</p><p>P[X = x] 0,1 0,3 0,4 0,1 0,1 1,0</p><p>Então, sua função distribuição acumulada é:</p><p>X 0 1 2 3 4</p><p>F(x) 0,1 0,4 0,8 0,9 1,0</p><p>Portanto, o gráfico da função distribuição acumulada da variável aleatória X é:</p><p>Figura 1 – Gráfico da função distribuição acumulada da variável aleatória X.</p><p>Seja X a variável aleatória contínua, então o gráfico genérico da função distribuição acumulada</p><p>terá o seguinte comportamento:</p><p>Figura 2 – Gráfico genérico da função distribuição acumulada de uma v.a. contínua X.</p><p>Exemplo 5: Plote o gráfico da seguinte função distribuição acumulada:</p><p>59</p><p>( ) 2</p><p>0, 0</p><p>, 0 1</p><p>0, 1</p><p>x</p><p>F x x x</p><p>x</p><p>≤</p><p>= < <</p><p> ≥</p><p>Figura 3 – Gráfico da função distribuição acumulada de uma v.a. contínua X.</p><p>Observação: Pode-se encontrar a função densidade de probabilidade, se existir, a partir de F(x),</p><p>pois:</p><p>( ) ( )d</p><p>F x f x</p><p>dx</p><p>= ,</p><p>nos pontos onde F(x) é derivável.</p><p>4.2 - PARÂMETROS CARACTERÍSTICOS DE UMA DISTRIBUIÇÃO DE</p><p>PROBABILIDADE</p><p>4.2.1 - ESPERANÇA MATEMÁTICA</p><p>Muitas vezes estamos interessados em estimar parâmetros característicos de uma</p><p>distribuição de probabilidade de uma variável aleatória qualquer. Um primeiro parâmetro é a</p><p>Esperança Matemática. A esperança matemática é uma média aritmética ponderada ou um valor</p><p>esperado de uma variável aleatória. Na prática, a esperança pode ser entendida como um “centro de</p><p>distribuição de probabilidade”, isto é, a média de uma distribuição de probabilidade.</p><p>A Esperança Matemática é definida da seguinte forma:</p><p>i) Se X é uma variável aleatória discreta, então a esperança matemática é:</p><p>( ) [ ]</p><p>1</p><p>n</p><p>i i</p><p>i</p><p>E X X P X xµ</p><p>=</p><p>= = =∑</p><p>ii) Se X é uma variável aleatória contínua, então a esperança matemática é:</p><p>( ) ( )E X x f x dxµ</p><p>∞</p><p>−∞</p><p>= = ∫ .</p><p>Exemplo 6: Uma seguradora paga</p><p>R$ 30.000,00 em caso de acidente de carro e cobra uma taxa de</p><p>R$ 1.000,00. Sabe-se que a probabilidade de que um carro sofra acidente é de 3%. Quanto espera a</p><p>seguradora ganhar por carro segurado?</p><p>Suponhamos que entre 100 carros segurados, 97 dão lucro de R$ 1.000,00 e 3 dão prejuízo de R$</p><p>29.000,00 (R$30.000,00 – R$1.000,00)</p><p>60</p><p>Lucro total = 97 x 1.000,00 – 3 x 29.000,00 = R$ 10.000,00</p><p>Lucro médio por carro = 10.000,00/100 = R$ 1.00,00</p><p>Se chamarmos de X: lucro por carro e o lucro médio por carro de E(X), teremos:</p><p>( )</p><p>( )</p><p>( )</p><p>( )</p><p>97 1.000,00 3 29.000,00</p><p>100</p><p>97 1.000,00 3 29.000,00</p><p>100 100</p><p>0,97 1.000,00 0,3 29.000,00</p><p>$100,00</p><p>x x</p><p>x x</p><p>x x</p><p>E X</p><p>E X</p><p>E X</p><p>E X R</p><p>−=</p><p>= −</p><p>= −</p><p>=</p><p>Outra forma de calcular o lucro médio da seguradora seria:</p><p>Define-se a variável aleatória X como “Lucro” por carro. Os dois resultados possíveis da variável</p><p>aleatória X são: 1.000,00 e -29.000,00 (R$1.000,00 – R$30.000,00). Dado que a probabilidade de</p><p>que um carro sofrer acidente é de 3% (0,03), então, a probabilidade de um carro não sofrer acidente</p><p>seria 97% (0,97). Dessa forma, a distribuição de probabilidade é:</p><p>X 1.000,00 -29.000,00 ∑</p><p>P[X = xi] 0,97 0,03 1,0</p><p>Portanto, o lucro médio por carro é:</p><p>( ) [ ] ( )</p><p>1</p><p>1.000 0,97 29.000,00 0,3 $100,00x x</p><p>n</p><p>i i</p><p>i</p><p>E X X P X x R</p><p>=</p><p>= = = + − =∑ .</p><p>Propriedades da Esperança Matemática</p><p>As propriedades da esperança são:</p><p>1) ( )E k k= , sendo k uma constante.</p><p>Demonstração:</p><p>( ) [ ] [ ]</p><p>1 1</p><p>n n</p><p>i i</p><p>i i</p><p>E k kP X x k P X x</p><p>= =</p><p>= = = =∑ ∑</p><p>1</p><p>1xk k= = .</p><p>2) ( ) ( )E kX kE X= , sendo k uma constante.</p><p>Demonstração:</p><p>( ) [ ] [ ] ( )</p><p>1 1</p><p>n n</p><p>i i i i</p><p>i i</p><p>E kX kx P X x k x P X x kE X</p><p>= =</p><p>= = = = =∑ ∑ .</p><p>3) ( ) ( )E aX b aE X b± = ± , sendo a e b constantes.</p><p>Demonstração:</p><p>( ) ( ) ( ) ( )E aX b E aX E b aE X b± = ± = ± .</p><p>4) ( ) 0xE X µ− =</p><p>Demonstração:</p><p>( ) ( ) ( ) 0x xE X E X Eµ µ µ µ− = − = − = .</p><p>61</p><p>5) ( ) ( ) ( )E X Y E X E Y± = ±</p><p>Essa propriedade será demonstrada posteriormente, quando abordarmos o assunto de variáveis</p><p>aleatórias bidimensionais.</p><p>6) ( )</p><p>1 1</p><p>n n</p><p>i i</p><p>i i</p><p>E X E X</p><p>= =</p><p> = </p><p> </p><p>∑ ∑</p><p>Nota: Para demonstração das propriedades acima foi utilizada a definição de esperança matemática</p><p>de uma variável aleatória discreta. Analogamente, é possível demonstrar as propriedades da</p><p>esperança por meio da definição de esperança de uma variável aleatória contínua.</p><p>4.2.3 - VARIÂNCIA</p><p>Já comentamos anteriormente que a esperança matemática nos fornece a média de uma</p><p>distribuição de probabilidade. Porém, não temos informação a respeito do grau de dispersão das</p><p>probabilidades em torno da média. Portanto, a medida que usaremos para estimar o grau de</p><p>dispersão (ou de concentração) de probabilidade em torno da média será a variância, que é dada</p><p>por:</p><p>( ) ( ) [ ]2 22V X E X E X E Xσ µ= = − = − ;</p><p>Aplicando a definição de esperança matemática temos que a variância pode ser dada por:</p><p>( ) ( ) ( )2</p><p>i</p><p>i</p><p>V X x P X xµ= − =∑ , se a variável aleatória for discreta e</p><p>( ) ( ) ( )2</p><p>iV X x f x dxµ</p><p>+∞</p><p>−∞</p><p>= −∫ , se a variável aleatória for contínua.</p><p>Pela dificuldade dos cálculos acima podemos calcular a variância de uma forma mais</p><p>prática:</p><p>( ) ( ) ( ) ( )( )</p><p>( ) ( ) ( ) ( )</p><p>( ) ( )( )</p><p>2 22</p><p>22</p><p>22</p><p>2</p><p>2</p><p>V X E X E X E X XE X E X</p><p>E X E X E X E X</p><p>E X E X</p><p> = − = − + = </p><p> = − + =</p><p> </p><p>= −</p><p>Onde, ( ) [ ]2 2</p><p>1</p><p>n</p><p>i i</p><p>i</p><p>E X X P X x</p><p>=</p><p>= =∑ para discreta e ( ) ( )2 2E X x f x dx</p><p>∞</p><p>−∞</p><p>= ∫ para contínua.</p><p>5 - DISTRIBUIÇÕES DISCRETAS DE PROBABILIDADE</p><p>5.1 – DISTRIBUIÇÃO DE BERNOULLI</p><p>Seja um experimento onde só podem ocorrer dois possíveis resultados, “sucesso” e “fracasso”,</p><p>como por exemplo:</p><p>62</p><p>• Um jogador de basquete converter ou não um arremesso;</p><p>• Um indivíduo portador de certa doença morrer ou não;</p><p>• Uma peça produzida por uma Cia. ser perfeita ou defeituosa;</p><p>• O sexo do primeiro filho de um casal ser masculino ou feminino;</p><p>• Um consumidor que entra numa loja comprar ou não um produto.</p><p>Associando-se uma variável aleatória X aos possíveis resultados do experimento, de forma que:</p><p>1 se o resultado for "sucesso" e</p><p>0 se o resultado for "fracasso".</p><p>X</p><p>X</p><p>=</p><p>=</p><p>Então, a variável aleatória X, assim definida tem distribuição Bernoulli, com p sendo a</p><p>probabilidade do ocorrer “sucesso”, e q = (1 - p) a probabilidade de ocorrer “fracasso”.</p><p>A função de probabilidade da Distribuição de Bernoulli é dada por:</p><p>para 1;</p><p>( ) 1 para 0;</p><p>0 para outros valores de x.</p><p>p x</p><p>P X x q p x</p><p>=</p><p>= = = − =</p><p></p><p></p><p>Parâmetros característicos:</p><p>2</p><p>( ) ;</p><p>( ) .</p><p>E X p</p><p>V X pq</p><p>µ</p><p>σ</p><p>= =</p><p>= =</p><p>5.2 - DISTRIBUIÇÃO BINOMIAL</p><p>Quando iniciamos o estudo de probabilidade, resolvemos problemas do tipo:</p><p>Dois times de futebol, A e B, jogam entre si 4 vezes. Se a probabilidade do time A ganhar um</p><p>jogo é de 1/3 qual a probabilidade de o time A ganhar 2 jogos.</p><p>Solução: Então a probabilidade do time A não ganhar um jogo é 2/3. Se os times jogam 4 vezes</p><p>e o time A ganha 2 delas, colocando as possibilidades de ordem nesses resultados, temos:</p><p>A, A, não-A, não-A ou A, não-A, não-A, A ou A, não-A, A, não-A ou não-A, não-A, A, A</p><p>Logo, calculando as probabilidades usando as regras do “e” e do “ou”, a probabilidade de A</p><p>ganhar 2 jogos é:</p><p>2 2</p><p>2 4 2</p><p>4,2</p><p>1 1 2 2 1 2 2 1 1 2 1 2 2 2 1 1 2 1 2 1 2 1 1 2</p><p>. . . . . . .</p><p>3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3</p><p>1 1 2 2</p><p>6</p><p>3 3 3 3</p><p>1 2</p><p>6 ( ) .( )</p><p>3 3</p><p>29, 62%</p><p>p</p><p>p</p><p>p C p q</p><p>p</p><p>−</p><p>= ⋅ ⋅ ⋅ + ⋅ ⋅ ⋅ + ⋅ ⋅ ⋅ + ⋅ ⋅ ⋅ + +</p><p>= ⋅ ⋅ ⋅ ⋅</p><p> = ⋅ ⋅ = </p><p> </p><p>=</p><p>63</p><p>Uma grande quantidade de problemas que envolvem cálculo de probabilidades apresenta</p><p>exatamente as mesmas características do problema descrito, o que leva à construção de um modelo</p><p>estatístico teórico, para resolvê-los, que é a distribuição binomial.</p><p>A utilização da distribuição binomial se dará quando os experimentos apresentarem as</p><p>seguintes condições:</p><p>a) A variável aleatória deve ser discreta.</p><p>b) O experimento deve ser repetido, nas mesmas condições, um número finito de vezes (n).</p><p>c) As provas repetidas devem ser independentes, isto é, o resultado de uma não deve afetar os</p><p>resultados das sucessivas.</p><p>d) Em cada prova deve aparecer um dos dois resultados possíveis: sucesso e fracasso.</p><p>e) No decorrer do experimento, a probabilidade p do sucesso e a probabilidade q (q = 1 - p) de</p><p>fracasso devem se manter constantes.</p><p>Resolveremos problemas do tipo: determinar a probabilidade de se obterem k sucessos em n</p><p>tentativas. Para isso, temos a função de probabilidade da Distribuição de Binomial que é dada por:</p><p>onde:</p><p>P(X = k) é a probabilidade de que o evento se realize k vezes em n provas;</p><p>p é a probabilidade de um sucesso;</p><p>q é a probabilidade de fracasso (q = 1 - p) e ,</p><p>!</p><p>!( )!n k</p><p>n</p><p>C</p><p>k n k</p><p>=</p><p>−</p><p>;</p><p>Parâmetros característicos:</p><p>2</p><p>( ) ;</p><p>( ) .</p><p>E X np</p><p>V X npq</p><p>µ</p><p>σ</p><p>= =</p><p>= =</p><p>Há muitos exemplos de variáveis aleatórias que podem ser classificadas como distribuições</p><p>binomiais: respostas a um teste do tipo V ou F, respostas do tipo sim ou não a um questionário,</p><p>produtos manufaturados classificados como perfeitos ou defeituosos, alunos de uma escola</p><p>vacinados ou não vacinados, exames do tipo passa ou não passa, candidatos contratados ou não a</p><p>um emprego, chamadas telefônicas locais ou interurbanas.</p><p>Observe ainda que a distribuição Binomial nada mais é que a distribuição de Bernoulli</p><p>repetida n vezes ou em uma quantidade finita de vezes.</p><p>Exemplo 1: Uma empresa produz 10% de peças defeituosas. As peças são embaladas em caixas que</p><p>contêm 12 peças. Calcule a probabilidade de um cliente comprar uma caixa contendo:</p><p>,( ) k n k</p><p>n kP X k C p q −= =</p><p>64</p><p>a) nenhuma peça defeituosa</p><p>b) uma peça defeituosa.</p><p>Solução:</p><p>a) 0 sucessos: ( ) ( ) %24,282824,02824,0</p><p>!12!0</p><p>!12</p><p>9,01,0</p><p>0</p><p>12</p><p>)0( 120 ==</p><p>⋅</p><p>=</p><p></p><p></p><p></p><p></p><p></p><p>==XP</p><p>b) 1 sucesso: ( ) ( ) %66,373766,0)03138,0(</p><p>!11</p><p>!1112</p><p>)3138,0)(1,0(</p><p>!11!1</p><p>!12</p><p>9,01,0</p><p>1</p><p>12</p><p>)1( 111 ==⋅=</p><p>⋅</p><p>=</p><p></p><p></p><p></p><p></p><p></p><p>==XP</p><p>Exemplo 2: A probabilidade de que um presumível cliente aleatoriamente escolhido faça uma</p><p>compra é 0,20. Se um vendedor visita seis presumíveis clientes, a probabilidade de que ele fará</p><p>exatamente quatro vendas é:</p><p>( ) ( ) ( ) ( ) %53,101536,0)64,0)(0016,0(</p><p>2234</p><p>23456</p><p>80,020,0</p><p>!2!4</p><p>!6</p><p>80,020,0</p><p>4</p><p>6</p><p>)4( 2424 ==</p><p>⋅⋅⋅</p><p>⋅⋅⋅⋅=</p><p>⋅</p><p>=</p><p></p><p></p><p></p><p></p><p></p><p>==XP</p><p>Como a fórmula binomial envolve um número considerável de cálculos, são freqüentemente</p><p>utilizadas tabelas de probabilidades da binomial.</p><p>Exemplo 3: Se a probabilidade de que um possível cliente realize uma compra é 0,20, então a</p><p>probabilidade de que um vendedor que visita 15 clientes presumíveis realizar menos do que 3</p><p>vendas é:</p><p>%403980,0)3(</p><p>2309,01319,00352,0)3(</p><p>)2()1()0()2()3(</p><p>≅=<</p><p>++=<</p><p>=+=+==≤=<</p><p>XP</p><p>XP</p><p>XPXPXPXPXP</p><p>Exemplo 4: Uma firma de pedidos pelo correio envia uma carta circular que terá uma taxa de</p><p>respostas de 10%. Suponha que 20 cartas circulares são endereçadas a uma nova área geográfica</p><p>como um teste de mercado. Supondo que na nova área é aplicável uma taxa de respostas de 10%,</p><p>determinar as probabilidades de:</p><p>a) ninguém responder</p><p>b) exatamente duas pessoas responderem</p><p>c) a maioria das pessoas responder</p><p>d) menos do que 20% das pessoas responder.</p><p>Solução:</p><p>a) %16,121216,0)0( ===XP</p><p>b) %52,282852,0)2( ===XP</p><p>65</p><p>c) %00000,0)12()11()11( ≅=+=+==≥ ⋯XPXPXP</p><p>d)</p><p>( 20% 20 ) ( 4) ( 0) ( 1) ( 2) ( 3)</p><p>( 20% 20 ) 0,1216 0, 2702 0,2852 0,1901 0,8671 86,71%</p><p>P X de cartas P X P X P X P X P X</p><p>P X de cartas</p><p>< = < = = + = + = + =</p><p>< = + + + = =</p><p>5.3 - DISTRIBUIÇÃO DE POISSON</p><p>A distribuição de Poisson é empregada em experimentos nos quais não se esta interessado</p><p>no número de sucessos obtidos em n tentativas, como ocorre no caso da distribuição Binomial, mas</p><p>sim no número de sucessos ocorridos durante um intervalo contínuo, que pode ser um intervalo de</p><p>tempo, espaço, etc. Como por exemplo: chegada de chamadas em uma central telefônica, número de</p><p>suicídios em uma cidade durante um ano, número de acidentes automobilísticos ocorridos numa</p><p>rodovia em um mês, número de defeitos encontrados em um rolo de arame ovalado de 500m.</p><p>Note que nos exemplos acima, não há como determinar a probabilidade de ocorrência de um</p><p>sucesso, mas sim a freqüência média de sua ocorrência, como por exemplo dois suicídios por ano, a</p><p>qual será denominada λ. Em um experimento com estas características, e assumindo que os</p><p>sucessos sejam independentes, a variável aleatória número de sucessos em um intervaloX = , terá</p><p>uma distribuição Poisson, com parâmetro λ.</p><p>Para determinar a probabilidade de um dado número de sucessos em um processo de</p><p>Poisson, basta conhecer o número médio de sucessos para uma específica dimensão de tempo ou</p><p>espaço de interesse. Este número médio geralmente é representado por λ (letra grega ‘lambda’). A</p><p>função de probabilidade da Distribuição de Poisson é:</p><p>Aqui e é a constante 2,7183, base dos logaritmos neperianos.</p><p>A distribuição de Poisson tem muitas aplicações em problemas de filas de espera; controle</p><p>de estoques; controle de qualidade; programação de equipamentos, etc.</p><p>Parâmetros característicos:</p><p>( ) ( ) .E X V X λ= =</p><p>Exemplo 1: Um departamento de conserto de máquinas recebe uma média de 5 chamadas por hora.</p><p>a) A probabilidade de que, em uma hora selecionada aleatoriamente, sejam recebidas exatamente</p><p>três chamadas é:</p><p>Obs.: Poderíamos também utilizar a tabela de probabilidades de Poisson.</p><p>1404,0</p><p>6</p><p>00674,0125</p><p>!3</p><p>5</p><p>)5|3(</p><p>53</p><p>=⋅=⋅===</p><p>−e</p><p>XP λ</p><p>!</p><p>)|(</p><p>k</p><p>e</p><p>kXP</p><p>k λλλ</p><p>−⋅==</p><p>66</p><p>b) A probabilidade de que menos de três chamadas sejam recebidas durante uma hora</p><p>aleatoriamente escolhida é:</p><p>Como estamos supondo que o processo de Poisson é constante, a média do processo será</p><p>sempre proporcional à extensão do tempo ou espaço. Assim, o valor de λ deve ser correspondente</p><p>ao intervalo considerado.</p><p>Exemplo 2: Na média, 12 pessoas por hora consultam um especialista em decoração de uma</p><p>fábrica. A probabilidade de que três ou mais pessoas consultarão o especialista durante um período</p><p>de dez minutos é determinada como se segue:</p><p>12 60 min</p><p>10 min</p><p>12 10</p><p>2</p><p>60</p><p>tempo</p><p>x</p><p>x</p><p>λ</p><p>λ</p><p>→</p><p>→</p><p>→</p><p>⋅= = =</p><p>Exemplo 3: Cada rolo de lâminas de aço de 500 metros contém, em média, duas imperfeições. Tal</p><p>imperfeição prejudica o uso, no produto final, daquele segmento da lâmina. Qual a probabilidade de</p><p>que um segmento específico de 100 metros não contenha nenhuma imperfeição?</p><p>Solução: Média por rolo de 500 metros = 2</p><p>λ = média por rolo de 100 metros = 2/5 = 0,4</p><p>Da tabela de Poisson, temos 6703,0)4,0|0( === λXP</p><p>Quando o número n de observações numa distribuição binomial for muito grande, os</p><p>cálculos se tornam extremamente cansativos. Além disso, não estão disponíveis geralmente</p><p>probabilidades tabeladas para valores muito pequenos de p. Por isso, a distribuição de Poisson será</p><p>apropriada como uma aproximação da binomial, desde que n seja muito grande ( 50n ≥ ) e p seja</p><p>muito pequena ( 0,10p ≤ ). Substituindo a média da Poisson pela média da Binomial, como segue,</p><p>( )E X npλ = = .</p><p>0,12460,08420,03370,0067)5|3(</p><p>)2()1()0()2()5|3(</p><p>=++==<</p><p>=+=+==≤==<</p><p>λ</p><p>λ</p><p>XP</p><p>XPXPXPXPXP</p><p>0,32320,00020,00090,00340,01200,03610,09020,1804)2|3(</p><p>)2|5()2|4()2|3()2|3(</p><p>=++++++==≥</p><p>+==+==+====≥</p><p>λ</p><p>λλλλ</p><p>XP</p><p>XPXPXPXP ⋯</p><p>67</p><p>MODELOS TEÓRICOS DE PROBABILIDADE – VARIÁVEIS CONTÍNUAS –</p><p>DISTRIBUIÇÃO NORMAL</p><p>• Distribuições de Probabilidades: sua natureza</p><p>Considere os seguintes problemas:</p><p>Problema 1: Um vendedor recebe 20 endereços para visitar a cada dia. Um morador de cada</p><p>endereço manifestou, por correspondência, interesse de receber o vendedor e discutir o produto. A</p><p>experiência do vendedor é que é feita uma venda em um de cada 10 domicílios. Qual é a</p><p>probabilidade de que sejam feitas cinco vendas em determinado dia?</p><p>Problema 2: Determinado tipo de copiadora pára em média uma vez a cada 2000 cópias. Qual é</p><p>a probabilidade de que ocorram mais de duas paradas quando se fazem 2000 cópias?</p><p>Problema 3: A vida média de uma marca e de um tipo de bateria de um toca-fitas é 20 horas,</p><p>com um desvio-padrão de 0,5 hora. Qual a probabilidade de que essa bateria não dure mais do que</p><p>21 horas?</p><p>No problema 1, a variável aleatória de interesse é o nº de vendas por dia, que é uma variável</p><p>discreta, pois assume valores finitos, que se pode contar. O experimento é visitar, a cada dia, 20</p><p>domicílios tentando vender o produto. Existe uma probabilidade associada a cada valor possível da</p><p>variável aleatória e o interesse é calcular a probabilidade de que a variável aleatória X assuma o</p><p>valor 5, isto é, P(X = 5). Uma distribuição de probabilidades mostra como as probabilidades são</p><p>distribuídas sobre todos os valores possíveis de uma variável aleatória. Nesse problema 1, a</p><p>distribuição adequada será a distribuição binomial, que já foi estudada. No problema 2, o nº de</p><p>paradas a cada 2000 cópias também é uma variável aleatória discreta e, nesse caso, a distribuição</p><p>adequada será a de Poisson, também já estudada. No caso do problema 3, a vida de uma bateria será</p><p>uma variável aleatória contínua, pois pode assumir qualquer valor dentro de um dado intervalo. As</p><p>distribuições de probabilidades que envolvem variáveis aleatórias contínuas não podem ser</p><p>desenhadas como são as discretas, porque as probabilidades são sempre infinitesimais. Nesse caso,</p><p>as probabilidades são representadas pela área sob a curva no intervalo de valores da variável</p><p>aleatória.</p><p>Cada distribuição de probabilidades aplica-se a determinadas situações. Primeiro, precisamos</p><p>saber que o problema exige a aplicação de uma distribuição de probabilidades. Segundo,</p><p>precisamos determinar qual das distribuições de probabilidades aplica-se ao problema em estudo (já</p><p>vimos Binomial e de Poisson, veremos agora a distribuição normal). Finalmente, precisamos saber</p><p>como</p><p>calcular probabilidades usando os parâmetros de cada distribuição.</p><p>• Distribuição Normal</p><p>68</p><p>Podemos então definir: Para uma variável aleatória contínua X, a função f(X) é chamada de</p><p>função densidade de probabilidade (f.d.p.), ou distribuição de probabilidades, se:</p><p>1. 0)( ≥Xf</p><p>2. A área da região compreendida sob o gráfico da função e o eixo x é igual a 1.</p><p>Observamos que )( bXaP ≤≤ , que corresponde à área delimitada pela função f(x), pelo eixo x</p><p>e pelas retas X = a e X = b.</p><p>1. Definição</p><p>Uma variável aleatória contínua X tem distribuição normal de probabilidade se a sua f.d.p. é dada</p><p>por:</p><p>onde π é a constante 3,1416; e é a constante 2,7183; µ é a média da distribuição e σ é o desvio</p><p>padrão da distribuição.</p><p>O gráfico de f(x) é:</p><p>17,515,012,510,07,55,0</p><p>0,20</p><p>0,15</p><p>0,10</p><p>0,05</p><p>0,00</p><p>X</p><p>D</p><p>e</p><p>n</p><p>s</p><p>it</p><p>y</p><p>Normal; Mean=12; StDev=2</p><p>Distribution Normal</p><p>As principais características dessa função são:</p><p>a) o ponto de máximo de f(x) é o ponto X=µ</p><p>b) a curva é simétrica com relação a µ</p><p>c) valores da variável aleatória X mais próximos da média µ ocorrem com maior freqüência.</p><p>d) valores da variável aleatória X simétricos em relação à média µ ocorrem com a mesma</p><p>freqüência.</p><p>e) A região definida pelo gráfico da função e pelo eixo x tem área unitária.</p><p>2</p><p>2</p><p>( )</p><p>21</p><p>( )</p><p>2</p><p>X</p><p>f X e</p><p>µ</p><p>σ</p><p>πσ</p><p>−−</p><p>= ⋅</p><p>69</p><p>Uma curva que apresenta essas características é chamada de curva de Gauss, e ela está</p><p>associada à f.d.p. definida acima.</p><p>A distribuição de probabilidade normal é importante na inferência estatística por três motivos:</p><p>1. As medidas produzidas em diversos processos aleatórios seguem essa distribuição.</p><p>2. Probabilidades normais podem ser usadas como aproximações de outras distribuições de</p><p>probabilidades, como a binomial e a de Poisson.</p><p>3. As distribuições de estatísticas da amostra tais como a média e a proporção freqüentemente</p><p>seguem a distribuição normal independentemente da distribuição da população.</p><p>Se quisermos calcular a probabilidade indicada na figura abaixo, região rachurada?</p><p>0,20</p><p>0,15</p><p>0,10</p><p>0,05</p><p>0,00</p><p>X</p><p>D</p><p>e</p><p>n</p><p>s</p><p>it</p><p>y</p><p>12 16</p><p>Distribution Plot</p><p>Normal; Mean=12; StDev=2</p><p>Para Solucionar esse problema, uma particular distribuição normal z com média µ = 0 e</p><p>desvio padrão 1=σ foi utilizada. Uma tabela contendo os valores positivos de z e a área</p><p>compreendida sob a curva entre 0 e z foi construída.</p><p>Esta distribuição foi escolhida pelo fato de apresentar os parâmetros mais simples. Qualquer</p><p>outra distribuição normal X com média µ e desvio padrão σ (representada por ),( σµN ) pode ser</p><p>transformada, para efeito do cálculo de áreas (ou seja, de probabilidades), na distribuição normal</p><p>padrão z ( )1,0(N ), através da mudança de variável:</p><p>Conhecendo-se a área especificada na tabela, qualquer outro tipo de área poderá ser</p><p>calculado usando-se a simetria da curva.</p><p>2. Uso da tabela</p><p>Exemplo 1: Calcule a probabilidade da variável normal padrão z assumir:</p><p>a) valores entre 0 e 1</p><p>σ</p><p>µ−</p><p>=</p><p>x</p><p>z</p><p>70</p><p>b) valores maiores que 1</p><p>c) o valor 1</p><p>d) valores entre –1,34 e 2,16</p><p>e) valores entre –2,25 e –1,27</p><p>f) valores entre 1,55 e 3,67</p><p>Neste primeiro exemplo, fornecemos os valores de z para que fossem calculadas as probabilidades</p><p>através das áreas correspondentes. Porém, existem aplicações em que devemos determinar valores</p><p>de z a partir de conhecimento das probabilidades assumidas por estes valores.</p><p>EXEMPLOS DE APLICAÇÃO</p><p>Voltemos então ao problema 3 do começo deste módulo:</p><p>Problema 3: A vida média de uma marca e de um tipo de bateria de um toca-fitas é 20 horas,</p><p>com um desvio-padrão de 0,5 hora. Qual a probabilidade de que essa bateria não dure mais do que</p><p>21 horas?</p><p>Exemplo 1: Sabe-se que a altura dos alunos de uma determinada escola segue uma distribuição</p><p>normal com média 1,75 m e desvio padrão 0,15 m. Calcular a probabilidade de que um aluno</p><p>aleatoriamente escolhido tenha altura:</p><p>a) maior que 1,85 m.</p><p>b) entre 1,50m e 1,85m.</p><p>Exemplo 2: A duração de um certo tipo de pneu, em quilômetros rodados, é uma variável normal</p><p>com duração média de 60000 km e desvio padrão de 10000 km.</p><p>a) Qual a probabilidade de um pneu aleatoriamente escolhido durar mais de 75000 Km?</p><p>b) Qual a probabilidade de um pneu aleatoriamente escolhido durar entre 50000 e 70000 Km?</p><p>c) Qual a probabilidade de um pneu aleatoriamente escolhido durar entre 63000 e 70000 Km?</p><p>d) Qual a probabilidade de um pneu aleatoriamente escolhido durar exatamente 70000 Km?</p><p>e) O fabricante deseja fixar prazo de garantia, em quilômetros, de tal modo que, se a duração do</p><p>pneu for inferior à garantia, o pneu será trocado. De quantos quilômetros deve ser este prazo, para</p><p>que somente 1% dos pneus sejam trocados?</p><p>Exemplo 3: Um fabricante de baterias sabe, por experiência passada, que as baterias de sua</p><p>fabricação têm vida média de 600 dias e desvio padrão de 100 dias, sendo que a duração tem</p><p>aproximadamente distribuição normal. Oferece uma garantia de 312 dias, isto é, troca as baterias</p><p>71</p><p>que apresentarem falhas nesse período. Fabrica 10.000 baterias mensalmente. Quantas deverá trocar</p><p>pelo uso da garantia, mensalmente?</p><p>Exemplo 4: Uma fábrica de carros sabe que os motores de sua fabricação têm duração normal com</p><p>média de 150.000 km e desvio padrão de 5.000 km. Qual a probabilidade de que um carro,</p><p>escolhido ao acaso, dos fabricados por essa firma, tenha um motor que dure:</p><p>a) menos de 170.000 km?</p><p>b) Entre 140.000 km e 165.000 km?</p><p>c) Se a fábrica substitui o motor que apresenta duração inferior à garantia, qual deve ser esta</p><p>garantia para que a porcentagem de motores substituídos seja inferior a 0,2%?</p><p>série estatística de acordo com os seus três fatores: tempo, espaço e</p><p>espécie.</p><p>1.Séries históricas (ou temporais, cronológicas, marchas): descrevem os valores da variável em</p><p>determinado local segundo intervalos de tempo variáveis.</p><p>Exemplo: O diretor de marketing de uma empresa, fabricante de componentes eletrônicos, deseja</p><p>examinar a evolução de suas vendas em 2000, mês a mês.</p><p>Título</p><p>Cabeçalho</p><p>Coluna</p><p>Numérica</p><p>Casa ou</p><p>Célula</p><p>Linhas</p><p>Coluna</p><p>Indicadora</p><p>Corpo</p><p>Rodapé</p><p>Cabeçalho</p><p>8</p><p>GLT S.A. – Indústria de Componentes Eletrônicos, Vendas – Mercado Interno – 2000</p><p>Meses Vendas ($1.000)</p><p>Janeiro 2.300</p><p>Fevereiro 1.800</p><p>Março 2.200</p><p>Abril 2.210</p><p>Maio 2.360</p><p>Junho 2.600</p><p>Julho 2.690</p><p>Agosto 3.050</p><p>Setembro 3.500</p><p>Outubro 3.440</p><p>Novembro 3.100</p><p>Dezembro 2.760</p><p>TOTAL ANUAL 31.510</p><p>Fonte: Departamento de Análise de Mercado.</p><p>2. Séries geográficas (ou espaciais, territoriais, de localização): descrevem os valores da variável</p><p>em determinado instante segundo regiões.</p><p>Exemplo: Se agora o diretor deseja saber o comportamento das vendas dessa empresa nos estados</p><p>do Brasil, no ano 2000.</p><p>GLT S.A. – Indústria de Componentes Eletrônicos, Vendas por Unidade de Federação – 2000</p><p>Unidades de Federação Vendas ($1.000)</p><p>Minas Gerais 4.000</p><p>Paraná 2.230</p><p>Rio Grande do Sul 6.470</p><p>Rio de Janeiro 8.300</p><p>São Paulo 10.090</p><p>Outros 420</p><p>TOTAL – BRASIL 31.510</p><p>Fonte: Departamento de Análise de Mercado.</p><p>3. Séries específicas (ou categóricas): descrevem os valores da variável, em determinado tempo e</p><p>local, segundo especificações ou categorias.</p><p>Exemplo: Suponha que o diretor esteja interessado em conhecer o comportamento das vendas de</p><p>cada um dos produtos, que foram agrupados em três categorias ou linhas. A tabela revela que</p><p>aproximadamente 50% do faturamento da empresa são representados pelos produtos da linha C.</p><p>9</p><p>GLT S.A. – Indústria de Componentes Eletrônicos, Vendas por Linha de Produto – 2000</p><p>Linha do Produto Vendas ($1.000)</p><p>Linha A 6.450</p><p>Linha B 9.310</p><p>Linha C 15.750</p><p>TODOS OS PRODUTOS 31.510</p><p>Fonte: Departamento de Análise de Mercado.</p><p>4. Distribuição de freqüências: neste caso, todos os elementos estão fixos, estando os dados</p><p>agrupados de acordo com a intensidade ou variação quantitativa do fenômeno. O processo de</p><p>construção das tabelas de distribuição de freqüência será feito mais adiante.</p><p>Exemplo: Agrupar as vendas da empresa em classes de faturamento e analisar o número de meses</p><p>em que se verificaram os vários faturamentos.</p><p>GLT S.A. – Indústria de Componentes Eletrônicos, Nº de Meses Segundo o Faturamento</p><p>Vendas ($1.000) Meses</p><p>De 1.800 a 2.199 1</p><p>2.200 a 2.599 4</p><p>2.600 a 2.999 3</p><p>3.000 a 3.399 3</p><p>3.400 a 3.799 1</p><p>TOTAL DE MESES 12</p><p>Fonte: Departamento de Análise de Mercado.</p><p>Nº de Empregados das Várias Classes de Salários no Estado de São Paulo – 2000</p><p>Classes de Salários (R$) Nº de Empregados</p><p>Até 80 41.326</p><p>De 80 a 119 123.236</p><p>De 120 a 159 428.904</p><p>De 160 a 199 324.437</p><p>De 200 a 399 787.304</p><p>De 400 a 599 266.002</p><p>De 600 a 799 102.375</p><p>De 800 a 999 56.170</p><p>1.000 ou mais 103.788</p><p>TOTAL 2.233.542</p><p>Fonte: Serviço de Estatística da Previdência e Trabalho.</p><p>10</p><p>• Séries conjugadas – tabelas de dupla entrada</p><p>Muitas vezes há necessidade de apresentar, em uma única tabela, a variação de valores de mais de</p><p>uma variável, obtendo assim uma tabela de dupla entrada. Nesse tipo de tabela ficam criadas duas</p><p>ordens de classificação: horizontal e vertical.</p><p>Exemplos:</p><p>Série específico-temporal:</p><p>População Economicamente Ativa por Setor de Atividade – Brasil</p><p>População (1000 habitantes) Setor</p><p>1940 1950 1960</p><p>Primário 8.968 10.255 12.163</p><p>Secundário 1.414 2.347 2.962</p><p>Terciário 3.620 4.516 7.525</p><p>Fonte: IPEA.</p><p>Série geográfico-temporal:</p><p>Produção Brasileira de Borracha</p><p>Produção Unidade de</p><p>Produção 1937 1938 1939</p><p>Acre 5.007 4.765 4.727</p><p>Amazonas 6.858 5.998 5.631</p><p>Pará 4.945 4.223 4.500</p><p>Mato Grosso 1.327 1.285 1.235</p><p>Outros Estados 333 539 337</p><p>Fonte: Anuário Estatístico do Brasil - IBGE.</p><p>É importante ressaltar que nem toda tabela representa uma série estatística. Algumas vezes, os</p><p>dados não são uniformes, sendo meramente um aglomerado de informações gerais sobre</p><p>determinado assunto.</p><p>Exemplo:</p><p>Situação dos Espetáculos Cinematográficos no Brasil – 1970</p><p>Especificação Dados Numéricos</p><p>Número de cinemas 2.488</p><p>Lotação dos cinemas 1.722.348</p><p>Sessões por dia 3.933</p><p>Filmes de longa metragem 131.330.488</p><p>Meia entrada 89.581.234</p><p>Fonte: Anuário Estatístico do Brasil - IBGE.</p><p>11</p><p>• Dados absolutos e dados relativos</p><p>Dados absolutos são os dados estatísticos resultantes da coleta direta da fonte, sem manipulação a</p><p>não ser contagem ou medida. Sua leitura é inexpressiva.</p><p>Dados relativos é o resultado de comparações por razões que se estabelecem entre dados absolutos</p><p>e têm por finalidade facilitar as comparações entre quantidades. São as porcentagens, índices,</p><p>coeficientes e taxas.</p><p>1. Porcentagens</p><p>Destaca a participação da parte no todo. São razões que consistem em considerar um total qualquer</p><p>igual a 100% e através de uma regra de três simples, estabelecermos qualquer relação com as</p><p>parcelas que compõe o total. Assim: Total ----- 100%</p><p>Parcela ---- x%</p><p>Exemplo 1:</p><p>b) MATRÍCULAS NAS ESCOLAS DA CIDADE A - 1995</p><p>Categorias Nº de alunos %</p><p>1º grau 19.286</p><p>2º grau 1.681</p><p>3ºgrau 234</p><p>Total 21.201</p><p>Exemplo 2: Quando quisermos analisar a estrutura de um fato, deveremos ratear as porcentagens</p><p>entre os itens que compõem este fato.</p><p>Custo mensal dos ventiladores A e B (10 unidades)</p><p>Despesas Ventilador A Ventilador B</p><p>Valores (R$) % Valores (R$) %</p><p>Mão-de-obra 1120,00 44,8 2280,00</p><p>Matérias – primas 720,00 28,8 2600,00</p><p>Despesas gerais 320,00 12,8 1360,00</p><p>Propaganda 340,00 13,6 1760,00</p><p>TOTAL 2500,00 100 8000,00 100</p><p>2. Índices</p><p>São razões entre duas grandezas tais que uma não inclui a outra. Exemplo:</p><p>Índices econômicos:</p><p>população</p><p>produção da lvalor tota</p><p>capitaper Produção =</p><p>superfície</p><p>população</p><p>ademográfic Densidade =</p><p>12</p><p>população</p><p>renda</p><p>capitaper Renda =</p><p>população</p><p>consumo</p><p>capitaper Consumo =</p><p>acronológic idade</p><p>mental idade</p><p>QI =</p><p>3. Coeficientes</p><p>São razões entre o nº de ocorrências e o nº total. Exemplos:</p><p>totalpopulação</p><p>óbitos de nº</p><p>emortalidad de eCoeficient =</p><p>totalpopulação</p><p>snascimento de nº</p><p>natalidade de eCoeficient =</p><p>matrículas de inicial nº</p><p>evadidos alunos de nº</p><p>escolar evasão de eCoeficient =</p><p>matrículas de final nº</p><p>aprovados alunos de nº</p><p>escolar entoaproveitam de eCoeficient =</p><p>4. Taxas</p><p>São os coeficientes multiplicados por uma potência de 10n (10, 100, 1000) para tornar o resultado</p><p>mais inteligível. Exemplos: Taxa de mortalidade = coeficiente de mortalidade . 10n</p><p>Taxa de evasão escolar = coeficiente de evasão escolar . 10n</p><p>Ex.: número de óbitos=80080; população total = 520000</p><p>Coeficiente mortalidade = 154,0</p><p>520000</p><p>80080 = . Então o coef. de mortalidade é de 0,154 óbito por</p><p>habitante. Porém se multiplicarmos por 1000 teremos:</p><p>taxa de mortalidade=0,154*1000=154, ou seja, 154 óbitos por mil habitantes.</p><p>13</p><p>Lista de exercícios sobre Séries e Dados Estatísticos</p><p>1) Considere a série estatística. Complete-a, determinando as porcentagens com uma casa decimal</p><p>e fazendo o arredondamento.</p><p>Séries Alunos</p><p>Matriculados</p><p>%</p><p>1ª 546</p><p>2ª 328</p><p>3ª 280</p><p>4ª 120</p><p>Total 1.274</p><p>2)Analisar a estrutura do fato abaixo, utilizando porcentagens.</p><p>Especificação Despesa família X Despesa família Y</p><p>Alimentação 5600 1140</p><p>Vestuário 1600 680</p><p>Habilitação 3600 1300</p><p>Outras despesas 1700 880</p><p>TOTAL 12500 4000</p><p>3)Em um magazine, as vendas de certos produtos se processam da seguinte maneira:</p><p>Dias Unidades</p><p>Segunda 47</p><p>Terça 32</p><p>quarta-feira 58</p><p>quinta-feira 66</p><p>sexta-feira 30</p><p>Sábado 47</p><p>Pode-se indicar por meio de porcentagem:</p><p>a)Como se distribuem as vendas diárias com relação ao total da semana?</p><p>b) Qual o desenvolvimento das vendas com relação a 50 unidades (venda considerada base para a</p><p>empresa).</p><p>c) Qual o desenvolvimento das vendas de um dia para o outro?</p><p>4) Considerando que Minas Gerais, em 1992, apresentou (dados fornecidos pelo IBGE):</p><p>• População: 15.957,6 mil habitantes Superfície: 586.624 km2</p><p>• Nascimentos: 292.036 Óbitos: 99.281</p><p>14</p><p>Calcule:</p><p>a) o índice da densidade demográfica b) a taxa de natalidade c) a taxa de mortalidade</p><p>5) Um professor preencheu um quadro, enviado pela secretaria da escola, com os seguintes dados:</p><p>Total Geral Série</p><p>E</p><p>Turm</p><p>a</p><p>Nº de</p><p>Aluno</p><p>s</p><p>30.03</p><p>Nº de</p><p>Aluno</p><p>s</p><p>30.11</p><p>Promovidos</p><p>sem</p><p>Recuperaçã</p><p>o</p><p>Retidos</p><p>sem</p><p>Recupe</p><p>ração</p><p>Em</p><p>Recupe</p><p>ração</p><p>Recupe</p><p>rados</p><p>Não-</p><p>Recupe</p><p>rados</p><p>Promo</p><p>-vidos</p><p>Retido</p><p>s</p><p>1º B 49 44 35 03 06 05 01 40 04</p><p>1º C 49 42 42 00 00 00 00 42 00</p><p>1º E 47 35 27 00 08 03 05 30 05</p><p>1º F 47 40 33 06 01 00 01 33 07</p><p>Total 192 161 137 09 15 08 07 145 16</p><p>Calcule:</p><p>a) a taxa de evasão, por turma b) a taxa de evasão total</p><p>c) a taxa de aprovação, por turma d) a taxa de aprovação geral</p><p>e) a taxa de recuperação, por turma f) a taxa de recuperação geral</p><p>g) a taxa de reprovação na recuperação geral h) a taxa de aprovação, sem a recuperação</p><p>h) a taxa de retidos, sem a recuperação.</p><p>6)Classifique as séries abaixo:</p><p>a)Produção de fertilizantes Fosfatados – Brasil – 1985 – 1989</p><p>Anos Quantidade (toneladas)</p><p>1985 3570115</p><p>1986 4504201</p><p>1987 5448835</p><p>1988 4373226</p><p>1989 4024813</p><p>b) Despesas com viagens dos departamentos das 3 filiais da Empresa</p><p>SETOR FILIAIS</p><p>RJ MG SP</p><p>Logística R$3000 R$3500 R$4000</p><p>Marketing R$2000 R$2300 R$2800</p><p>RH R$3200 R$1700 R$2200</p><p>15</p><p>7- Uma pessoa comprou dois automóveis por R$52500,00. Vendeu o primeiro com 8% de lucro e o</p><p>segundo com 3% de prejuízo. O lucro líquido total foi de R$2000,00. Calcular o preço de compra</p><p>de cada automóvel.</p><p>8 – Em uma inspeção de qualidade verificou-se que tinham 12 peças estragadas, representando 15%</p><p>do total de peças examinadas. Queremos saber quantas peças foram examinadas.</p><p>9 – Um objeto é oferecido por R$600; este preço sofre um desconto de 20% e depois de 15%. O</p><p>novo preço corresponde a que porcentagem de R$600?</p><p>1.4 - ORGANIZAÇÃO E APRESENTAÇÃO DOS DADOS</p><p>As observações é o material básico com que o pesquisador trabalha. Estas observações</p><p>podem ser, por exemplo, a produtividade de uma planta, a velocidade de processamento de um</p><p>computador, a resistência à ruptura de determinado cabo, suscetibilidade ou não de indivíduo a</p><p>determinada doença, cor de uma flor, sexo do primeiro filho de um casal, opinião dos alunos quanto</p><p>a didática de um professor, etc. Estas observações apresentam uma característica em comum que é a</p><p>variação ou variabilidade, ou seja assumem diferentes valores de indivíduo para indivíduo.</p><p>Uma característica que pode assumir diferentes valores de indivíduo para indivíduo é</p><p>denominada variável. Caso contrário é denominado constante. As variáveis são classificadas em:</p><p>VARIÁVEIS</p><p>QUALITATIVAS</p><p>(atributos)</p><p>QUANTITATIVAS</p><p>(numéricas)</p><p>• Sexo;</p><p>• Religião;</p><p>• Naturalidade;</p><p>• Cor dos olhos;</p><p>• Altura de uma planta (baixa, média, alta);</p><p>• Cor de flor;</p><p>• Sabor;</p><p>ORDINAL</p><p>Ex: classe social;</p><p>NOMINAL</p><p>Ex: região;</p><p>DISCRETAS CONTÍNUAS</p><p>• Quantidades</p><p>de estudantes</p><p>em uma</p><p>disciplina;</p><p>• Quantidades</p><p>de cômodos</p><p>em uma</p><p>residência;</p><p>• Número de</p><p>filhos;</p><p>• Tempo de vôo</p><p>entre cidades;</p><p>• Duração da</p><p>bateria do</p><p>celular;</p><p>• Peso corporal;</p><p>Exemplos:</p><p>Exemplos: Exemplos:</p><p>16</p><p>Exercício: Classifique as variáveis apresentadas na tabela abaixo:</p><p>Os dados coletados no campo e trazidos para o laboratório (escritório), na forma em que se</p><p>encontram, como apresentados na Tabela 1.1, são denominados dados brutos. Normalmente este</p><p>tipo de dados trás pouca ou nenhuma informação ao leitor, sendo necessário uma elaboração</p><p>(organização) destes dados, a fim de aumentar sua capacidade de informação.</p><p>Tabela 1.1: Dados dos alunos da disciplina MLI54 do curso de Matemática (UFU) em 01/2002.</p><p>Indivíduo Altura Sexo Número de Irmãos</p><p>1 1,87 M 5</p><p>2 1,67 F 2</p><p>3 1,75 F 0</p><p>4 1,80 M 2</p><p>5 1,72 M 4</p><p>6 1,64 F 2</p><p>7 1,73 F 2</p><p>8 1,78 M 1</p><p>9 1,83 M 0</p><p>10 1,78 M 1</p><p>11 1,67 F 3</p><p>12 1,70 F 1</p><p>13 1,65 F 1</p><p>14 1,53 F 1</p><p>15 1,62 M 1</p><p>16 1,56 F 0</p><p>17 1,51 F 1</p><p>18 1,68 F 1</p><p>19 1,72 F 1</p><p>20 1,73 F 1</p><p>21 1,75 F 5</p><p>17</p><p>22 1,67 F 2</p><p>23 1,88 M 1</p><p>24 1,87 M 1</p><p>25 1,75 M 3</p><p>26 1,63 F 6</p><p>27 1,70 M 6</p><p>28 1,88 M 6</p><p>29 1,76 F 3</p><p>30 1,78 M 2</p><p>A mais simples organização numérica é a ordenação dos dados em ordem crescente ou</p><p>decrescente, chamada de ROL. Como pode-se observar na Tabela 1.2, a simples organização dos</p><p>dados em um Rol, aumenta muito a capacidade de informação destes. Pois enquanto a Tabela 1.1</p><p>nos informava apenas que tínhamos 30 alunos, e algumas alturas, sexo e número de irmãos, na</p><p>Tabela 1.2, verificamos que a menor altura observada foi 1,51 m e a maior 1,88 m, o que nos</p><p>fornece uma amplitude total de variação da ordem de 0,37 m.</p><p>maior valor observado - menor valor observado</p><p>1,88 1,51 0,37</p><p>A</p><p>A m m m</p><p>=</p><p>= − =</p><p>Pode-se observar ainda que algumas alturas como 1,67m, 1,75m e 1,78m são mais comuns.</p><p>Tabela 1.2: Rol das alturas dos alunos da disciplina MLI54 do curso de Matemática (UFU) em</p><p>01/2002.</p><p>1,51 1,53 1,56 1,62 1,63 1,64 1,65</p><p>1,67 1,67 1,67 1,68 1,70 1,70 1,72</p><p>1,72 1,73 1,73 1,75 1,75 1,75 1,76</p><p>1,78 1,78 1,78 1,80 1,83 1,87 1,87</p><p>1,88 1,88</p><p>Tabela 1.3: Rol do nº de irmãos dos alunos da disciplina MLI54 do curso de Matemática (UFU) em</p><p>01/2002.</p><p>0 0 0 1 1 1 1</p><p>1 1 1 1 1 1 1</p><p>1 2 2 2 2 2 2</p><p>3 3 3 4 5 5 6</p><p>6 6</p><p>18</p><p>1.4.1– APRESENTAÇÃO TABULAR</p><p>1.4.1.3 VARIÁVEIS QUANTITATIVAS CONTÍNUAS</p><p>• DISTRIBUIÇÃO DE FREQÜÊNCIAS</p><p>Após esta primeira organização dos dados, podemos ainda agrupá-los em classes de menor</p><p>tamanho, a fim de aumentar sua capacidade de informação.</p><p>Distribuindo-se os dados observados em classes e contando-se o número de indivíduos</p><p>contidos em cada classe, obtém-se a freqüência de classe. A disposição tabular dos dados agrupados</p><p>em classes, juntamente com as freqüências correspondentes denomina-se distribuição de freqüência.</p><p>Para identificar uma classe, deve-se conhecer os valores dos limites inferior e superior da</p><p>classe, que delimitam o intervalo de classe. Por exemplo, para o caso das alturas dos alunos, pode-</p><p>se desejar incluir em uma única classe todos os indivíduos que possuam altura entre 1,70 e 1,75 m</p><p>assim, o intervalo de classe seria de 1,70 m a 1,75 m.</p><p>Neste ponto surge uma dúvida fundamental. Indivíduos que apresentem alturas exatamente</p><p>iguais a 1,70 m ou a 1,75 m pertencem ou não a esta classe? Deste modo surge a necessidade de</p><p>definir a natureza do intervalo de classe, se é aberto ou fechado. Quando o intervalo de classe é</p><p>aberto, os limites da classe não pertencem a ela, e quando o intervalo é fechado, os limites de classe</p><p>pertencem a classe em questão. Notação:</p><p>• Intervalos abertos: ]1,70 – 1,75[ ou somente, 1,70 – 1,75;</p><p>• Intervalos fechados: [1,70 – 1,75] ou 1,70├┤1,75;</p><p>• Intervalos mistos: [1,70 – 1,75[ ou 1,70├1,75;</p><p>CONSTRUÇÃO DE UMA DISTRIBUIÇÃO DE FREQÜÊNCIA:</p><p>Para montar uma distribuição de freqüência é necessário que primeiramente se determine o</p><p>número de classes (k) em que os dados serão agrupados. Por questões de ordem prática e estética</p><p>sugere-se utilizar de 5 a 20 classes. Na bibliografia pode-se encontrar vários critérios para indicação</p><p>do número</p><p>de classes a ser utilizado, em função do número de dados (n), os mais utilizados são:</p><p>i) Critério de Oliveira (1994):</p><p>, 100</p><p>5.log( ), 100</p><p>k n n</p><p>k n n</p><p> = ≤</p><p></p><p>= ></p><p>(iremos adotar este critério);</p><p>ii) Critério de Scott(1979):</p><p>3</p><p>3,49</p><p>A n</p><p>k S= ,</p><p>em que A é amplitude e S o desvio padrão. As estatísticas A e S são definidas nas equações abaixo</p><p>da seguinte forma:</p><p>19</p><p>2</p><p>12</p><p>( ) (1)</p><p>1</p><p>1</p><p>e</p><p>1</p><p>n</p><p>in</p><p>i</p><p>n i</p><p>i</p><p>X</p><p>A X X S X</p><p>n n</p><p>=</p><p>=</p><p> </p><p> </p><p> = − = −</p><p> −</p><p> </p><p> </p><p>∑</p><p>∑ ;</p><p>iii) Critério de Sturges: 1 3,3.log( )k n= + .</p><p>Após determinar o número de classes (k) em que os dados serão agrupados, deve-se então</p><p>determinar o intervalo de classe (c), que é dado pela seguinte expressão:</p><p>1</p><p>A</p><p>c</p><p>k</p><p>=</p><p>−</p><p>;</p><p>em que: c é amplitude de classe;</p><p>A é a amplitude total;</p><p>k é o número de classes.</p><p>Conhecida a amplitude de classe, determina-se então os intervalos de classe. Os limites</p><p>inferior e superior das classes devem ser escolhidos de modo que o menor valor observado esteja</p><p>localizado no ponto médio da primeira classe, que é dado por:</p><p>inf sup</p><p>2</p><p>L L</p><p>PM</p><p>+</p><p>= ,</p><p>em que: infL é o limite inferior da classe;</p><p>supL é o limite superior da classe.</p><p>Assim, o limite inferior da primeira classe será:</p><p>inf 1ª menor valor observado</p><p>2</p><p>c</p><p>LI = − .</p><p>E os demais limites são obtidos somando-se c ao limite anterior. A título de ilustração</p><p>agruparemos dos dados referentes às alturas dos alunos em classes.</p><p>Temos que a amplitude total observado na Tabela 1.2 é:</p><p>maior valor observado - menor valor observado 1,88 1,51 0,37A = = − =</p><p>1º Passo) Determinar o número de classe (k):</p><p>30 100n = < 30 5,5k = ≅ , como o número de classe é inteiro usaremos 6k = ;</p><p>2º Passo) Determinar a amplitude de classe (c):</p><p>0,37</p><p>0,074</p><p>1 6 1</p><p>A</p><p>c</p><p>k</p><p>= = =</p><p>− −</p><p>;</p><p>3º Passo) Determinar o limite inferior da primeira classe:</p><p>inf 1ª</p><p>0,074</p><p>menor valor observado 1,51 1,473</p><p>2 2</p><p>c</p><p>LI = − = − =</p><p>4º Passo) Determinar o limite superior da primeira classe:</p><p>20</p><p>sup1ª inf 1ª 1,473 0,074 1,547L L c= + = + = ;</p><p>5º Passo) Montar a distribuição de freqüência:</p><p>Tabela 1.4: Distribuição de freqüência das alturas de30 alunos da disciplina MLI54 do curso de</p><p>Matemática (UFU) em 01/2002.</p><p>Alturas (m)</p><p>af rf rf % PM</p><p>1,473├1,547 2 0,066 6,6 1,51</p><p>1,547├1,621 2 0,066 6,6 1,584</p><p>1,621├1,695 7 0,234 23,4 1,658</p><p>1,695├1,769 10 0,334 33,4 1,732</p><p>1,769├1,843 5 0,166 16,6 1,806</p><p>1,843├1,917 4 0,134 13,4 1,88</p><p>TOTAL 30 1,00 100</p><p>em que: af é a freqüência absoluta e indica o número de observações pertencentes a cada classe;</p><p>rf é a freqüência relativa que é dada por: a</p><p>r</p><p>f</p><p>f</p><p>n</p><p>= ;</p><p>n é o número de observações e PM é o ponto médio da classe.</p><p>Interpretação: Apresentando os dados na forma de distribuição de freqüência, sintetiza-se a</p><p>informação contida nos mesmos, além de facilitar sua visualização. Pois pode-se verificar</p><p>claramente na Tabela 1.4 que as alturas dos 30 alunos apresentam uma amplitude total de 0,37 m.</p><p>Não foi observada nenhuma altura inferior a 1,473 m e nem superior a 1,917 m. Alturas localizadas</p><p>no extremo inferior da distribuição (1,473 a 1,547 m) são menos freqüentes do que as do extremo</p><p>superior (maiores que 1,843 m). Observa-se uma tendência de concentração das alturas na região</p><p>central a superior da distribuição. A apresentação dos dados em forma de distribuição de freqüência</p><p>facilita ainda o cálculo de várias medidas estatísticas de interesse, além de permitir a apresentação</p><p>gráfica dos mesmos.</p><p>APRESENTAÇÃO GRÁFICA</p><p>As mesmas informações fornecidas pelas distribuições de freqüências podem ser obtidas, e</p><p>mais facilmente visualizada através de gráficos, tais como histograma, polígono de freqüência e</p><p>outros.</p><p>HISTOGRAMAS: são constituídos por um conjunto de retângulos, com as bases assentadas sobre</p><p>um eixo horizontal, tendo o centro da mesma no ponto médio da classe que representa, e cuja altura</p><p>é proporcional à freqüência da classe. Se as amplitudes de classes forem todas iguais, as alturas</p><p>21</p><p>serão numericamente iguais as freqüências das classes. Porem, se os intervalos de classe não</p><p>tiverem todos a mesma amplitude de classe, as alturas dos retângulos deverão ser convenientemente</p><p>ajustadas, afim de que as áreas dos mesmos sejam proporcionais às freqüências das classes e assim</p><p>suas áreas permaneçam fieis à sua freqüência. Esse ajuste pode ser feito através da densidade de</p><p>freqüência, dada por: r</p><p>r</p><p>f</p><p>df</p><p>c</p><p>= .</p><p>Figura 1: Histograma da distribuição de freqüência das alturas de 30 alunos da disciplina MLI54 do</p><p>curso de Matemática (UFU) em 01/2002.</p><p>POLÍGONO DE FREQÜÊNCIA: é um gráfico de análise no quais as freqüências das classes são</p><p>localizadas sobre perpendiculares levantadas nos pontos médios das classes. E pode ser obtido pela</p><p>simples união dos pontos médios dos topos dos retângulos de um histograma. Completa-se o</p><p>polígono unindo-se as extremidades da linha que une os pontos representativos das freqüências de</p><p>classe aos pontos médios das classes imediatamente anterior e posterior as classes extremas, que</p><p>têm freqüência nula.</p><p>0</p><p>2</p><p>4</p><p>6</p><p>8</p><p>10</p><p>12</p><p>1</p><p>.4</p><p>7</p><p>3</p><p>1</p><p>.5</p><p>4</p><p>7</p><p>1</p><p>.6</p><p>2</p><p>1</p><p>1</p><p>.6</p><p>9</p><p>5</p><p>1</p><p>.7</p><p>6</p><p>9</p><p>1</p><p>.8</p><p>4</p><p>3</p><p>1</p><p>.9</p><p>1</p><p>7</p><p>1</p><p>.9</p><p>5</p><p>4</p><p>Figura 2: Polígono de freqüência das alturas de 30 alunos da disciplina MLI54 do curso de</p><p>Matemática (UFU) em 01/2002.</p><p>Além das aplicações já comentadas, os histogramas e polígonos de freqüências podem</p><p>indicar ainda qual é o tipo de distribuição que os dados seguem como pode ser visto a seguir:</p><p>22</p><p>Figura 7: Distribuição simétrica.</p><p>Figura 8: Distribuição assimétrica à</p><p>esquerda.</p><p>Figura 9: Distribuição assimétrica à direita.</p><p>Figura 10: Distribuição jota.</p><p>Figura 11: Distribuição jota invertido.</p><p>Figura 12: Distribuição bimodal.</p><p>Figura 13: Distribuição multimodal.</p><p>23</p><p>• DISTRIBUIÇÕES DE FREQÜÊNCIAS ACUMULADAS</p><p>Muitas vezes pode-se estar interessado não em saber a quantidade de observações que existe</p><p>numa determinada classe, mas sim a quantidade de observações acima ou abaixo de um</p><p>determinado ponto na distribuição.</p><p>Deste modo, a soma das freqüências de todos os valores abaixo do limite superior de uma</p><p>determinada classe é definida como freqüência acumulada para baixo deste ponto, assim como a</p><p>soma das freqüências de todos os valores acima do limite inferior de uma classe é denominada</p><p>freqüência acumulada para cima.</p><p>A título de ilustração, estão apresentadas nas Tabelas 1.5 e 1.6, respectivamente, as</p><p>freqüências acumuladas para cima e para baixo das alturas dos 30 alunos da disciplina MLI54 do</p><p>curso de Matemática (UFU) em 01/2002.</p><p>Tabela 1.5: Distribuição de freqüência acumulada para baixo das alturas de 30 alunos da disciplina</p><p>MLI54 do curso de Matemática (UFU) em 01/2002.</p><p>Freqüência Acumulada</p><p>Alturas (m) Absoluta ( af ) Relativa % ( rf %)</p><p>Abaixo de 1,473 0 0,0</p><p>Abaixo de 1,547 2 6,6</p><p>Abaixo de 1,621 4 13,3</p><p>Abaixo de 1,695 11 36,6</p><p>Abaixo de 1,769 21 70,0</p><p>Abaixo de 1,843 26 86,6</p><p>Abaixo de 1,917 30 100,0</p><p>Tabela 1.6: Distribuição de freqüência acumulada para cima das alturas de 30 alunos da disciplina</p><p>MLI54 do curso de Matemática (UFU) em 01/2002.</p><p>Freqüência Acumulada</p><p>Alturas (m) Absoluta ( af ) Relativa % ( rf %)</p><p>acima de 1,473 30 100,0</p><p>acima de 1,547 28 93,3</p><p>acima de 1,621 26 86,6</p><p>acima de 1,695 19 63,3</p><p>acima de 1,769 9 30,0</p><p>acima de 1,843 4 13,3</p><p>acima de 1,917 0 0,0</p><p>Para verificar qual a porcentagem de alunos que possuem altura inferior a 1,621 m basta</p><p>consultar diretamente a Tabela 1.5 e verificar a freqüência acumulada abaixo deste valor (13,3%),</p><p>pois o valor 1,621 m é um dos limites de classe apresentados nesta tabela. Mas como proceder para</p><p>24</p><p>obter as freqüências acumuladas para valores intermediários aos apresentados na tabela? Como por</p><p>exemplo a freqüência acumulada acima de 1,70 m?</p><p>Para este tipo de cálculo, pressupõe-se</p><p>que as alturas estejam uniformemente distribuídos</p><p>dentro das classes, e procede-se do seguinte modo:</p><p>Freqüência acumulada acima, da classe imediatamente inferior a 1,70 (acima de 1,695) é de</p><p>19 alunos. Freqüência acumulada acima, da classe imediatamente superior a 1,70 (acima de 1,769) é</p><p>de 9 alunos.</p><p>Assim, temos que: Freq. entre 1,695 e 1,769 19 9 10= − = alunos; temos ainda que de 1,695</p><p>m a 1,769 m são 0,074 m; e de 1,695 m a 1,70 m são 0,005 m; então,</p><p>0,074 10</p><p>0,005</p><p>0,005 10</p><p>0,67</p><p>0,074</p><p>m alunos</p><p>m x</p><p>x alunos</p><p>→</p><p>→</p><p>⋅= =</p><p>Como acima de 1,695 m existe 19 alunos, e entre 1,695 e 1,70 m existem 0,67, conclui-se</p><p>que acima de 1,70 m existem 19 0,67 18,33− = alunos com alturas acima de 1,70 m.</p><p>APRESENTAÇÃO GRÁFICA</p><p>OGIVAS: é o nome dado a um polígono de freqüências acumuladas, nas quais as freqüências</p><p>acumuladas são localizadas sobre perpendiculares levantadas nos limites inferiores ou superiores</p><p>das classes, dependendo se a ogiva representar as freqüências acumuladas abaixo ou acima,</p><p>respectivamente.</p><p>0</p><p>5</p><p>10</p><p>15</p><p>20</p><p>25</p><p>30</p><p>35</p><p>1</p><p>.3</p><p>9</p><p>9</p><p>1</p><p>.4</p><p>7</p><p>3</p><p>1</p><p>.5</p><p>4</p><p>7</p><p>1</p><p>.6</p><p>2</p><p>1</p><p>1</p><p>.6</p><p>9</p><p>5</p><p>1</p><p>.7</p><p>6</p><p>9</p><p>1</p><p>.8</p><p>4</p><p>3</p><p>1</p><p>.9</p><p>1</p><p>7</p><p>1</p><p>.9</p><p>9</p><p>1</p><p>Alturas</p><p>F</p><p>re</p><p>q</p><p>ü</p><p>ê</p><p>n</p><p>c</p><p>ia</p><p>s</p><p>Abaixo de</p><p>Acima de</p><p>Figura 3: Ogivas, acima e abaixo de, da distribuição de freqüências acumuladas das alturas de 30</p><p>alunos da disciplina MLI54 do curso de Matemática (UFU) em 01/2002.</p><p>25</p><p>1.4.1.3 VARIÁVEIS QUANTITATIVAS DISCRETAS</p><p>Para variáveis quantitativas discretas não se faz necessário a distribuição dos dados em</p><p>classes intervalares, pois cada “valor” da variável já apresenta uma classe distinta como pode ser</p><p>observado na Tabela 1.7. A título de ilustração, iremos construir a distribuição de freqüência do</p><p>número de irmãos dos alunos da Tabela 1.1, para isso, devemos primeiro dispor os dados em uma</p><p>tabela de Rol, como segue a Tabela 1.3 abaixo. Logo depois construímos a distribuição de</p><p>freqüência com as classes sendo os próprios valores observados e completar a tabela com as</p><p>freqüências observadas.</p><p>Tabela 1.3: Rol do nº de irmãos dos alunos da disciplina MLI54 do curso de Matemática (UFU) em</p><p>01/2002.</p><p>0 0 0 1 1 1 1</p><p>1 1 1 1 1 1 1</p><p>1 2 2 2 2 2 2</p><p>3 3 3 4 5 5 6</p><p>6 6</p><p>Tabela 1.7: Distribuição de freqüência do nº de irmãos dos alunos da disciplina MLI54 do curso de</p><p>Matemática (UFU) em 01/2002.</p><p>Nº de Irmãos</p><p>af rf (%) aF rF (%)</p><p>0 3 10 3 10</p><p>1 12 40 15 50</p><p>2 6 20 21 70</p><p>3 3 10 24 80</p><p>4 1 3,33 25 83,33</p><p>5 2 6,67 27 90</p><p>6 3 10 30 100</p><p>TOTAL 30 100</p><p>APRESNTAÇÃO GRÁFICA</p><p>GRÁFICO DE BARRAS: é um gráfico formado por barras verticais, cujas alturas são</p><p>proporcionais às freqüências das classes.</p><p>26</p><p>0</p><p>2</p><p>4</p><p>6</p><p>8</p><p>10</p><p>12</p><p>14</p><p>0 1 2 3 4 5 6</p><p>Número de irmãos</p><p>F</p><p>re</p><p>q</p><p>ü</p><p>ê</p><p>n</p><p>c</p><p>ia</p><p>s</p><p>Figura 4: Gráfico de Barras da distribuição de freqüência do nº de irmãos dos alunos da disciplina</p><p>MLI54 do curso de Matemática (UFU) em 01/2002.</p><p>GRÁFICO DE BARRAS PARA DISTRIBUIÇÕES DE FREQÜÊNCIAS ACUMULADAS: é</p><p>um gráfico formado por barras horizontais, cujas alturas são proporcionais às freqüências</p><p>acumuladas das classes.</p><p>Figura 5: Gráfico de Barras da distribuição de freqüência acumulada do nº de vendas.</p><p>1.4.1.3 VARIÁVEIS QUALITATIVAS</p><p>Do mesmo modo que as variáveis quantitativas discretas as qualitativas também não</p><p>se faz necessário a distribuição dos dados em classes intervalares. A título de ilustração, iremos</p><p>construir a tabela de distribuição de freqüência para a variável sexo dos alunos observados na</p><p>Tabela 1.1. Então, da mesma forma que fizemos para a variável discreta faremos aqui também.</p><p>Tabela 1.8: Distribuição de freqüência da variável sexo dos alunos da disciplina MLI54 do curso de</p><p>Matemática (UFU) em 01/2002.</p><p>27</p><p>Sexo</p><p>af rf rf (%)</p><p>Feminino 17 0,5667 56,67</p><p>Masculino 13 0,4333 43,33</p><p>TOTAL 30 1,0 100</p><p>APRESNTAÇÃO GRÁFICA</p><p>GRÁFICO DE SETORES (PIZZA): é um gráfico em formato de circulo dividido em setores</p><p>cujas áreas são proporcionais à freqüências da classe. O processo de construção é simples, pois</p><p>sabe-se que setor de circunferência é formado por um ângulo de 360º e equivale a 100% da área da</p><p>circunferência, assim para obter-se o setor cuja área representa uma determinada freqüência, basta</p><p>resolver uma regra de três simples, como a apresentada a seguir:</p><p>%</p><p>360º 100</p><p>º rx f</p><p>α</p><p>→</p><p>→</p><p>Para o exemplo da Tabela 1.8 para o sexo feminino e masculino, respectivamente, temos:</p><p>%</p><p>360º 100</p><p>º 56,67</p><p>360 56,67</p><p>204,01º</p><p>100</p><p>F</p><p>F</p><p>x</p><p>x</p><p>α</p><p>→</p><p>→</p><p>⋅= =</p><p>%</p><p>360º 100</p><p>º 43,33</p><p>360 43,33</p><p>155,99º</p><p>100</p><p>M</p><p>M</p><p>x</p><p>x</p><p>α</p><p>→</p><p>→</p><p>⋅= =</p><p>;</p><p>ou poderíamos achar o ângulo do sexo masculino pela diferença: 360º 204,01º 155,99ºMx = − = .</p><p>Daí temos os ângulos que formarão as áreas do gráfico de setor, como pode ser visto na</p><p>Figura 6.</p><p>56.67%</p><p>43.33%</p><p>Feminino</p><p>Masculino</p><p>Figura 6: Gráfico de Setor da distribuição de freqüência da variável sexo dos alunos da disciplina</p><p>MLI54 do curso de Matemática (UFU) em 01/2002.</p><p>1.5 - MEDIDAS DE POSIÇÃO E DISPERSÃO</p><p>1.5.1 - MEDIDAS DE POSIÇÃO OU DE TENDÊNCIA CENTRAL</p><p>28</p><p>As medidas de posição ou de tendência central constituem uma forma mais sintética de</p><p>apresentar os resultados contidos nos dados observados, pois representam um valor central, em</p><p>torno dos quais os dados se concentram. As medidas de posição mais empregadas são a média, a</p><p>mediana e a moda.</p><p>1.5.1.1 – MÉDIA ARITMÉTICA</p><p>È a mais usada das três medidas de posição mencionadas, por ser a mais comum e</p><p>compreensível delas, bem como pela relativa simplicidade do seu cálculo, além de prestar-se bem</p><p>ao tratamento algébrico.</p><p>A média aritmética ou simplesmente média de um conjunto de n observações, 1 2, ,..., nx x x é</p><p>definida como:</p><p>1</p><p>n</p><p>i</p><p>i</p><p>x</p><p>x</p><p>n</p><p>==</p><p>∑</p><p>,</p><p>onde n é número de valores observados e 1 2</p><p>1</p><p>...</p><p>n</p><p>i n</p><p>i</p><p>x x x x</p><p>=</p><p>= + + +∑ (soma dos valores observados).</p><p>Notação: x para amostras e µ para populações.</p><p>Exemplo1: Dados os pesos de cinco recém-nascidos (kg) de certo hospital: 2,750; 3,100;</p><p>2,850; 3,330; 2,240. Temos que o peso médio dos recém-nascidos é:</p><p>5</p><p>1 1 2,750 3,100 2,850 3,330 2,240 14, 270</p><p>2,854</p><p>5 5 5</p><p>n</p><p>i i</p><p>i i</p><p>x x</p><p>x</p><p>n</p><p>= = + + + += = = = =</p><p>∑ ∑</p><p>kg.</p><p>Interpretação: o peso médio dos cinco recém-nascidos foi de 2,854kg, isto quer dizer que</p><p>alguns recém-nascidos pesaram menos de 2,854kg, outros pesaram mais, mas em média, o peso dos</p><p>recém-nascidos foi de 2,854kg. Ou seja, 2,854kg é um valor em torno do qual os pesos dos cinco</p><p>recém-nascidos se concentra.</p><p>Para os dados da Tabela 1.1 podemos calcular a média das variáveis alturas e número de</p><p>irmãos, respectivamente:</p><p>30</p><p>1 1 1,87 ... 1,78</p><p>1,72</p><p>30 30</p><p>n</p><p>i i</p><p>i i</p><p>x x</p><p>x m</p><p>n</p><p>= = + += = = =</p><p>∑ ∑</p><p>;</p><p>30</p><p>1 1 5 ... 2</p><p>2</p><p>30 30</p><p>n</p><p>i i</p><p>i i</p><p>x x</p><p>x irmãos</p><p>n</p><p>= = + += = = ≅</p><p>∑ ∑</p><p>Propriedades da Média:</p><p>29</p><p>Seja o seguinte conjunto de observações: 2,0,5,3. A média desses valores é dada por</p><p>2,5x = . O desvio (d) deles em relação à média é dado por:</p><p>1 1</p><p>2 2</p><p>3 3</p><p>4 4</p><p>2 2,5 0,5</p><p>0 2,5 2,5</p><p>5 2,5 2,5</p><p>3 2,5 0,5</p><p>d x x</p><p>d x x</p><p>d x x</p><p>d x x</p><p>= − = − = −</p><p>= − = − = −</p><p>= − = − =</p><p>= − = − =</p><p>i. Soma dos desvios de um conjunto de dados em relação a média é nula, ou seja,</p><p>1</p><p>0</p><p>n</p><p>i</p><p>i</p><p>d</p><p>=</p><p>=∑ ;</p><p>Exemplo 2:</p><p>4</p><p>1 2 3 4</p><p>1</p><p>0,5 2,5 2,5 0,5 0i</p><p>i</p><p>d d d d d</p><p>=</p><p>= + + + = − − + + =∑ ;</p><p>Prova:</p><p>( )</p><p>1 1 1 1</p><p>1</p><p>1 1</p><p>1 1</p><p>1</p><p>0</p><p>Logo, 0</p><p>n n n n</p><p>i i i</p><p>i i i i</p><p>n</p><p>in n</p><p>i</p><p>i i</p><p>i i</p><p>n n</p><p>i i</p><p>i i</p><p>n</p><p>i</p><p>i</p><p>d x x x x</p><p>x</p><p>x nx x n</p><p>n</p><p>x x</p><p>d</p><p>= = = =</p><p>=</p><p>= =</p><p>= =</p><p>=</p><p>= − = − =</p><p>− = − =/</p><p>/</p><p>= − =</p><p>−</p><p>∑ ∑ ∑ ∑</p><p>∑</p><p>∑ ∑</p><p>∑ ∑</p><p>∑</p><p>ii. Somando-se ou subtraindo-se uma constante (k) a todas as observações, a média também fica</p><p>somada ou subtraída deste valor, ou seja, *</p><p>i ix x k= ± então</p><p>*</p><p>x x k= ± .</p><p>Exemplo 3: Dados os valores observados igual a [ ] [ ]1 2 3 4, , , 2,0,5,3x x x x x= = de 2,5x = . Se</p><p>somarmos uma constante ( 3k = ) tem-se a nova variável [ ]* 5,3,8,6x = com</p><p>média</p><p>*</p><p>5,5 2,5 3x x k= = + = + .</p><p>Prova:</p><p>30</p><p>( )</p><p>( )</p><p>*1</p><p>*</p><p>*</p><p>1 1</p><p>1 1</p><p>1</p><p>1</p><p>*</p><p>fazendo tem-se:</p><p>1</p><p>1</p><p>Logo,</p><p>n</p><p>i</p><p>i</p><p>i i</p><p>n n</p><p>i i n n</p><p>i i</p><p>i</p><p>i i</p><p>n</p><p>in</p><p>i</p><p>i</p><p>i</p><p>x</p><p>x x x k</p><p>n</p><p>x x k</p><p>x x k</p><p>n n n</p><p>x</p><p>nk</p><p>x nk x k</p><p>n n n</p><p>x x k</p><p>=</p><p>= =</p><p>= =</p><p>=</p><p>=</p><p>= = ±</p><p>±</p><p> = = = ± = </p><p> </p><p> /= ± = ± = ± / </p><p>= ±</p><p>∑</p><p>∑ ∑</p><p>∑ ∑</p><p>∑</p><p>∑</p><p>iii.Multiplicando ou dividindo todas as observações por uma constante (k) a média também fica</p><p>multiplicada ou dividida por essa constante, ou seja, * * ou i</p><p>i i i</p><p>x</p><p>x x k x</p><p>k</p><p>= ⋅ = então</p><p>* *</p><p>ou</p><p>x</p><p>x x k x</p><p>k</p><p>= ⋅ = .</p><p>Exemplo 4: Dados os valores observados igual a [ ] [ ]1 2 3 4, , , 2,0,5,3x x x x x= = de 2,5x = . Se</p><p>multiplicarmos por constante ( 3k = ) tem-se a nova variável [ ]* 6,0,15,9x = com média</p><p>*</p><p>7,5 2,5 3x x k= = ⋅ = ⋅ .</p><p>Prova:</p><p>Para o caso de dividir por k, idem ao caso acima.</p><p>Características e importância da Média:</p><p>i. É muito influenciada pelos valores extremos da distribuição;</p><p>ii. Localiza-se, em geral, na classe de maior freqüência;</p><p>iii. Na sua determinação são considerados todos os dados da distribuição;</p><p>iv. A sua precisão está na razão direta do número de observações com que é calculada;</p><p>v. É única para um conjunto de dados;</p><p>vi. Não pode ser calculada para dados agrupados que apresentem limites indeterminados.</p><p>� Cálculo de Médias para Dados Agrupados:</p><p>( )</p><p>( )</p><p>*1</p><p>*</p><p>* 1 1 1 1</p><p>*</p><p>fazendo tem-se:</p><p>Logo,</p><p>n</p><p>i</p><p>i</p><p>i i</p><p>n n n n</p><p>i i i i</p><p>i i i i</p><p>x</p><p>x x x k</p><p>n</p><p>x x k k x x</p><p>x k k x</p><p>n n n n</p><p>x k x</p><p>=</p><p>= = = =</p><p>= = ⋅</p><p>⋅</p><p>= = = = =</p><p>=</p><p>∑</p><p>∑ ∑ ∑ ∑</p><p>31</p><p>1) Variável Discreta:</p><p>1</p><p>1</p><p>i</p><p>i</p><p>k</p><p>i a</p><p>i</p><p>k</p><p>a</p><p>i</p><p>x f</p><p>x</p><p>f</p><p>=</p><p>=</p><p>=</p><p>∑</p><p>∑</p><p>, onde</p><p>ia</p><p>f é a freqüência absoluta da classe i,</p><p>i</p><p>x é a classe i e</p><p>1</p><p>i</p><p>k</p><p>a</p><p>i</p><p>f n</p><p>=</p><p>=∑ .</p><p>Exemplo 5: Sejam os dados agrupados abaixo, calcule a média.</p><p>Tabela 1.7: Distribuição de freqüência do nº de irmãos dos alunos da disciplina MLI54 do curso de</p><p>Matemática (UFU) em 01/2002.</p><p>Nº de Irmãos</p><p>a</p><p>f</p><p>0 3</p><p>1 12</p><p>2 6</p><p>3 3</p><p>4 1</p><p>5 2</p><p>6 3</p><p>TOTAL 30</p><p>1 0 3 1 12 2 6 3 3 4 1 5 2 6 3 65</p><p>2</p><p>30 30</p><p>i</p><p>k</p><p>i a</p><p>i</p><p>x f</p><p>x irmãos</p><p>n</p><p>= ⋅ + ⋅ + ⋅ + ⋅ + ⋅ + ⋅ + ⋅= = = ≅</p><p>∑</p><p>2) Variável Contínua:</p><p>1</p><p>1</p><p>i</p><p>i</p><p>k</p><p>i a</p><p>i</p><p>k</p><p>a</p><p>i</p><p>PM f</p><p>x</p><p>f</p><p>=</p><p>=</p><p>≅</p><p>∑</p><p>∑</p><p>, onde</p><p>i</p><p>PM é o ponto médio da i-ésima classe.</p><p>Exemplo 6: Sejam os dados agrupados abaixo, calcule a média.</p><p>Tabela 1.4: Distribuição de freqüência das alturas de 30 alunos da disciplina MLI54 do curso de</p><p>Matemática (UFU) em 01/2002.</p><p>Alturas (m)</p><p>a</p><p>f PM</p><p>1,473├1,547 2 1,51</p><p>1,547├1,621 2 1,584</p><p>1,621├1,695 7 1,658</p><p>1,695├1,769 10 1,732</p><p>1,769├1,843 5 1,806</p><p>32</p><p>1,843├1,917 4 1,88</p><p>TOTAL 30</p><p>1 1,51 2 1,584 2 1,658 7 1,732 10 1,806 5 1,88 4</p><p>1,722</p><p>30</p><p>i</p><p>k</p><p>i a</p><p>i</p><p>PM f</p><p>x m</p><p>n</p><p>= ⋅ + ⋅ + ⋅ + ⋅ + ⋅ + ⋅≅ ≅ ≅</p><p>∑</p><p>1.5.1.2 – MEDIANA</p><p>Para um conjunto de dados ordenados (Rol) a mediana é o valor que é precedido e seguido</p><p>pelo mesmo número de dados (observações). Isto é, 50% dos dados são superiores à mediana e 50%</p><p>são inferiores.</p><p>Cálculo da mediana:</p><p>i. Quando o número de dados (n) for ímpar, a mediana é dada por:</p><p>1</p><p>2</p><p>n</p><p>Md x + </p><p> </p><p> </p><p>= , onde</p><p>1</p><p>2</p><p>n + </p><p> </p><p> </p><p>é o índice da variável (x).</p><p>Exemplo 1: Seja a variável [ ]0,1, 2,3,4X = , calcule a mediana.</p><p>Sabe-se que 5n = , ou seja, n é ímpar logo a mediana é dada por: 31 5 1</p><p>2 2</p><p>2</p><p>n</p><p>Md x x x+ + </p><p> </p><p> </p><p>= = = = .</p><p>ii. Quando o número de dados (n) for par, a mediana é dada por:</p><p>2</p><p>2 2</p><p>2</p><p>n n</p><p>x x</p><p>Md</p><p>+ </p><p> </p><p> </p><p>+</p><p>= , onde</p><p>2</p><p>n </p><p> </p><p> </p><p>e</p><p>2</p><p>2</p><p>n + </p><p> </p><p> </p><p>são índices da variável (x).</p><p>Exemplo 2: Seja a variável [ ]0,1,2,3X = , calcule a mediana.</p><p>Sabe-se que 4n = , ou seja, n é par logo a mediana é dada por:</p><p>( ) ( )</p><p>2 4 4 2</p><p>2 32 2 2 2 1 2</p><p>1,5</p><p>2 2 2 2</p><p>n n</p><p>x x x x</p><p>x x</p><p>Md</p><p>+ + </p><p> </p><p> </p><p>+ +</p><p>+ += = = = =</p><p>� Cálculo da Mediana para Dados Agrupados:</p><p>1) Variável Discreta: usa-se o mesmo procedimento feito anteriormente para cálculos de mediana.</p><p>Exemplo 3: Seja a Tabela 1.7, dos dados agrupados dos nº de irmãos, calcule a mediana.</p><p>Sabe-se que 30n = , ou seja, n é par logo a mediana é dada por:</p><p>( ) ( )</p><p>2 30 30 2</p><p>15 162 2 2 2 1 2</p><p>1,5</p><p>2 2 2 2</p><p>n n</p><p>x x x x</p><p>x x</p><p>Md</p><p>+ + </p><p> </p><p> </p><p>+ +</p><p>+ += = = = = ,</p><p>ou seja, 50% do número de irmãos estão abaixo 1,5 e 50% estão acima.</p><p>2) Variável Contínua:</p><p>33</p><p>inf</p><p>2 antMd</p><p>Md</p><p>Md</p><p>a</p><p>Md</p><p>a</p><p>n</p><p>F</p><p>Md L c</p><p>f</p><p> − </p><p>≅ + ⋅ </p><p> </p><p> </p><p>,</p><p>onde: infMd</p><p>L é o limite inferior da classe mediana;</p><p>antMda</p><p>F é a freqüência acumulada da classe anterior à classe mediana;</p><p>Mda</p><p>f é a freqüência absoluta da classe mediana;</p><p>Mdc é a amplitude da classe mediana;</p><p>n é o número de observações ou dados.</p><p>Exemplo 4: Seja a Tabela 1.4, dos dados agrupados das alturas, calcule a mediana.</p><p>Temos que a classe mediana é aquela classe que contém o 15º valor, ou seja, a quarta classe é a</p><p>mediana. Logo a mediana é dada por:</p><p>Alturas (m)</p><p>af aF</p><p>1,473├1,547 2 2</p><p>1,547├1,621 2 4</p><p>1,621├1,695 7 11</p><p>1,695├1,769 10 21</p><p>1,769├1,843 5 26</p><p>1,843├1,917 4 30</p><p>TOTAL 30</p><p>inf</p><p>30</p><p>11</p><p>2 21,695 0,074 1,725</p><p>10</p><p>antMd</p><p>Md</p><p>Md</p><p>a</p><p>Md</p><p>a</p><p>n</p><p>F</p><p>Md L c m</p><p>f</p><p> − − </p><p>≅ + ⋅ ≅ + ⋅ ≅ </p><p> </p><p> </p><p>Interpretação: A mediana igual a 1,725m indica que 50% das alturas estão abaixo de 1,725m</p><p>e 50% estão acima de 1,725m.</p><p>Propriedades da Mediana:</p><p>i. Somando-se ou subtraindo-se uma constante (k) a todos as observações, a mediana também fica</p><p>somada ou subtraída deste valor, ou seja, *</p><p>i ix x k= ± então *Md Md k= ± .</p><p>Exemplo 5: Dados os valores observados igual a [ ] [ ]1 2 3 4, , , 2,0,5,3x x x x x= = de 2,5Md = . Se</p><p>somarmos uma constante ( 3k = ) tem-se a nova variável [ ]* 5,3,8,6x = com mediana</p><p>* 5,5 2,5 3Md Md k= = + = + .</p><p>Classe Mediana</p><p>34</p><p>ii. Multiplicando ou dividindo todas as observações por uma constante (k) a mediana também fica</p><p>multiplicada ou dividida por essa constante, ou seja, * * ou i</p><p>i i i</p><p>x</p><p>x x k x</p><p>k</p><p>= ⋅ = então</p><p>* * ou</p><p>Md</p><p>Md Md k Md</p><p>k</p><p>= ⋅ = .</p><p>Exemplo 6: Dados os valores observados igual a [ ] [ ]1 2 3 4, , , 2,0,5,3x x x x x= = de 2,5Md = . Se</p><p>multiplicarmos por constante ( 3k = ) tem-se a nova variável [ ]* 6,0,15,9x = com mediana</p><p>* 7,5 2,5 3Md Md k= = ⋅ = ⋅ .</p><p>Características e Importância da Mediana:</p><p>i. Pode ser obtida em distribuições de freqüências que apresentem classes com limites indefinidos;</p><p>ii. É muito empregada em pesquisas nas quais os valores extremos têm pouca importância;</p><p>iii. Não é influenciada por valores extremos e sim pelo número de observações;</p><p>iv. É mais realista do que a média para representar certas variáveis com distribuições assimétricas,</p><p>como a renda dos brasileiros (existem valores discrepantes).</p><p>v. Não considera todas as observações no seu cálculo.</p><p>1.5.1.3 – MODA</p><p>A moda de um conjunto de dados é o valor que ocorre com maior freqüência, isto é, o valor</p><p>mais comum. Para um conjunto de dados a moda pode não ser única, bem como pode não existir.</p><p>Exemplo 1: 2,3, 4,5,7,7,7,8,9 a moda é 7Mo = ;</p><p>1, 2,3, 4,7,9,10,13, 20 não possui moda;</p><p>1, 2,3, 4, 4,8,10,10,13 as modas são 4Mo = e 10Mo = , dizemos que esta série e bi</p><p>modal.</p><p>� Cálculo da Moda para Dados Agrupados:</p><p>1) Variável Discreta: usa-se o mesmo procedimento feito anteriormente para cálculos da moda, ou</p><p>seja, a classe que aparece com a maior freqüência absoluta.</p><p>Exemplo 2: Seja a Tabela 1.7, dos dados agrupados dos nº de irmãos, calcule a moda.</p><p>Observando a coluna da freqüência absoluta, vemos que a de maior freqüência é a segunda classe</p><p>com 12af = , logo a moda é dada por: 1Mo = .</p><p>35</p><p>2) Variável Contínua: quando os dados estão agrupados, na forma de uma distribuição de</p><p>freqüências de uma variável contínua, a moda é o ponto do eixo das abscissas, correspondente à</p><p>ordenada máxima da distribuição. O processo</p><p>para cálculo da moda em dados agrupados é o</p><p>geométrico, a partir do histograma de freqüências, conhecido como Método de Czuber. Este método</p><p>é baseado na influencia que as classes adjacentes exercem sobre a moda, deslocando-se no sentido</p><p>da classe de maior freqüência. Algebricamente obtém-se a moda da seguinte forma:</p><p>1</p><p>inf</p><p>1 2</p><p>Mo MoMo L c</p><p>∆≅ + ⋅</p><p>∆ + ∆ ,</p><p>onde 1 Mo antesMoa a</p><p>f f∆ = − ;</p><p>2 Mo depoisMoa a</p><p>f f∆ = − ;</p><p>infMo</p><p>L é o limite inferior da classe modal;</p><p>Moc é a amplitude da classe modal.</p><p>Exemplo 3: Seja a Tabela 1.4, dos dados agrupados das alturas, calcule a moda.</p><p>Temos que a classe modal é aquela classe que contém a maior freqüência, ou seja, a quarta classe é</p><p>a modal. Logo a moda é dada por:</p><p>Alturas (m)</p><p>af</p><p>1,473├1,547 2</p><p>1,547├1,621 2</p><p>1,621├1,695 7</p><p>1,695├1,769 10</p><p>1,769├1,843 5</p><p>1,843├1,917 4</p><p>TOTAL 30</p><p>1 10 7 3</p><p>Mo antesMoa a</p><p>f f∆ = − = − = 2 10 5 5</p><p>Mo depoisMoa af f∆ = − = − =</p><p>1</p><p>inf</p><p>1 2</p><p>3</p><p>1,695 0,074 1,723</p><p>3 5Mo MoMo L c m</p><p>∆≅ + ⋅ ≅ + ⋅ ≅</p><p>∆ + ∆ +</p><p>Propriedades da Moda:</p><p>i. Somando-se ou subtraindo-se uma constante (k) a todos as observações, a moda também fica</p><p>somada ou subtraída deste valor, ou seja, *</p><p>i ix x k= ± então *Mo Mo k= ± .</p><p>Classe Modal</p><p>36</p><p>Exemplo 4: Dados os valores observados igual a [ ] [ ]1 2 3 4, , , 2,2,0,5,3x x x x x= = de 2Mo = . Se</p><p>somarmos uma constante ( 3k = ) tem-se a nova variável [ ]* 5,5,3,8,6x = com moda</p><p>* 5 2 3Mo Mo k= = + = + .</p><p>ii. Multiplicando ou dividindo todas as observações por uma constante (k) a moda também fica</p><p>multiplicada ou dividida por essa constante, ou seja, * * ou i</p><p>i i i</p><p>x</p><p>x x k x</p><p>k</p><p>= ⋅ = então</p><p>* * ou</p><p>Mo</p><p>Mo Mo k Mo</p><p>k</p><p>= ⋅ = .</p><p>Exemplo 5: Dados os valores observados igual a [ ] [ ]1 2 3 4, , , 2,2,0,5,3x x x x x= = de 2Mo = . Se</p><p>multiplicarmos por constante ( 3k = ) tem-se a nova variável [ ]* 6,6,0,15,9x = com moda</p><p>* 6 2 3Mo Mo k= = ⋅ = ⋅ .</p><p>Características e Importância da Moda:</p><p>i. Não é afetada por valores extremos, a não ser que estes constituam a classe modal;</p><p>ii. É uma medida bastante utilizada em Estatística Econômica;</p><p>Posição relativa da média, mediana e moda:</p><p>Crespo (1999) cita que quando uma distribuição é simétrica, as três medidas coincidem.</p><p>Porém, a assimetria as torna diferentes de modo que quanto maior a assimetria maior será essa</p><p>diferença entre as três medidas. Assim, em uma distribuição em forma de sino, temos:</p><p>a) X Md Mo= = , no caso de curva simétrica;</p><p>b) X Md Mo> > , no caso de curva assimétrica positiva (assimétrica à direita);</p><p>c) X Md Mo< < , no caso de curva assimétrica negativa (assimétrica à esquerda);</p><p>(a) (b) (c)</p><p>Figura 7: Formas de distribuições em situações reais: (a) distribuição em forma de sino simétrica; (b) distribuição</p><p>assimétrica à direita; e (c) distribuição assimétrica à esquerda.</p><p>1.5.2 - MEDIDAS DE DISPERSÃO</p><p>A utilização de uma medida de posição para substituir um conjunto de dados é insuficiente</p><p>para sintetizar a informação nele contida, como pode ser observado a seguir:</p><p>37</p><p>{ }</p><p>{ }</p><p>{ }</p><p>10,10,10,10,10,10,10</p><p>1,8,10,10,11,12,18</p><p>1, 2,10,10,10,13, 24</p><p>A</p><p>B</p><p>C</p><p>=</p><p>=</p><p>=</p><p>Calculando a média, mediana e moda desses três conjuntos tem-se:</p><p>x Md Mo</p><p>A 10 10 10</p><p>B 10 10 10</p><p>C 10 10 10</p><p>Assim, verifica-se que os três conjuntos (A,B,C) apresentam médias, medianas e modas</p><p>iguais a 10 unidades, porém observando-os, percebe-se que eles são bem diferentes entre si, pois</p><p>enquanto no conjunto A os dados são todos iguais, os demais apresentam uma certa variação, sendo</p><p>que esta variação é maior no conjunto C. Deste modo, para sintetizarmos eficientemente a</p><p>informação de um conjunto de dados temos que associar à medida de posição utilizada, uma medida</p><p>de dispersão, que vai informar como estes dados se comportam em torno da medida de posição em</p><p>questão.</p><p>1.5.2.1 – AMPLITUDE TOTAL (A)</p><p>A amplitude total é a diferença entre o maior e o menor valor observado,</p><p>A MVO mvo= −</p><p>em que:</p><p>MVO é o maior valor observado, e mvo é o menor valor observado.</p><p>Para os conjuntos A, B e C tem-se:</p><p>10 10 0</p><p>18 1 17</p><p>24 1 23</p><p>A</p><p>B</p><p>C</p><p>A unidades</p><p>A unidades</p><p>A unidades</p><p>= − =</p><p>= − =</p><p>= − =</p><p>Nota-se, então, que a amplitude do conjunto C é bem maior que nos demais. A amplitude é</p><p>uma medida fácil de ser calculada e é certamente a maneira mais natural e comumente utilizada</p><p>para descrever a variabilidade de um conjunto de dados. Porém sua interpretação depende do</p><p>número de observações, mas, no seu calculo não são consideradas todas as observações, pois só</p><p>utiliza os valores extremos.</p><p>1.5.2.2 – VARIÂNCIA E DESVIO PADRÃO</p><p>1.5.2.2.1 – VARIÂNCIA</p><p>38</p><p>Uma boa medida de dispersão deve basear-se em todos os dados, ser facilmente calculável e</p><p>compreensível, além de prestar-se bem ao tratamento algébrico. Uma medida com todas estas</p><p>características é obtida considerando-se os desvios de cada observação em relação a média,</p><p>chamados erros: ï ie x x= − .</p><p>Para obter um único número que represente a dispersão dos dados, pensou-se inicialmente</p><p>em obter-se a média destes desvios, mas deve-se lembrar que a soma dos desvios de um conjunto de</p><p>dados em relação a sua média é nula. Então, optou-se por utilizar a soma dos quadrados dos</p><p>desvios, pois elevando-se cada desvio ao quadrado elimina-se o sinal negativo, que estava trazendo</p><p>complicações, e dividindo-se a soma dos quadrados dos desvios pelo número de observações</p><p>obtém-se a variância populacional que é uma medida quantitativa da dispersão de um conjunto de</p><p>dados entorno da sua média, além do fato, de esta soma de quadrados de desvios ser mínima.</p><p>( )2</p><p>2 1( )</p><p>N</p><p>i</p><p>i</p><p>x x</p><p>SQD</p><p>V x</p><p>N N</p><p>σ =</p><p>−</p><p>= = =</p><p>∑</p><p>Para os exemplos anteriores tem-se:</p><p>( ) ( ) ( ) ( )</p><p>( ) ( ) ( )</p><p>( ) ( ) ( )</p><p>2</p><p>2 2 2</p><p>2 21</p><p>2 2 2</p><p>2 2</p><p>2 2 2</p><p>2 2</p><p>10 10 10 10 ... 10 10</p><p>0</p><p>7</p><p>1 10 8 10 ... 18 10</p><p>22</p><p>7</p><p>1 10 2 10 ... 24 10</p><p>50</p><p>7</p><p>N</p><p>i</p><p>i</p><p>A</p><p>B</p><p>C</p><p>x x</p><p>unidades</p><p>N</p><p>unidades</p><p>unidades</p><p>σ</p><p>σ</p><p>σ</p><p>=</p><p>− − + − + + −</p><p>= = =</p><p>− + − + + −</p><p>= =</p><p>− + − + + −</p><p>= =</p><p>∑</p><p>Observação: Quando estiver trabalhando com amostras, a variância é dada pela soma dos</p><p>quadrados dos desvios dividida por 1n − (número de observações menos um) que é denominado</p><p>graus de liberdade. Assim, a variância amostral é dada por:</p><p>( )2</p><p>2 1</p><p>1 1</p><p>n</p><p>i</p><p>i</p><p>x x</p><p>SQD</p><p>s</p><p>n n</p><p>=</p><p>−</p><p>= =</p><p>− −</p><p>∑</p><p>Fórmulas computacionais (método prático) para o cálculo da variância são dadas por:</p><p>2</p><p>12 2</p><p>1</p><p>1</p><p>N</p><p>iN</p><p>i</p><p>i</p><p>i</p><p>x</p><p>x</p><p>N N</p><p>σ =</p><p>=</p><p> </p><p> </p><p> = −</p><p> </p><p> </p><p> </p><p>∑</p><p>∑ e</p><p>2</p><p>12 2</p><p>1</p><p>1</p><p>1</p><p>n</p><p>in</p><p>i</p><p>i</p><p>i</p><p>x</p><p>s x</p><p>n n</p><p>=</p><p>=</p><p> </p><p> </p><p> = −</p><p> −</p><p> </p><p> </p><p>∑</p><p>∑</p><p>Prova:</p><p>39</p><p>( )</p><p>( )</p><p>2</p><p>22 21</p><p>1</p><p>22</p><p>1 1</p><p>2</p><p>12 1</p><p>2</p><p>1 1</p><p>2 2</p><p>1 12</p><p>1</p><p>1</p><p>2</p><p>1 1</p><p>1</p><p>2</p><p>1</p><p>1</p><p>2</p><p>1</p><p>1</p><p>2</p><p>1</p><p>n</p><p>i n</p><p>i</p><p>i i</p><p>i</p><p>n n</p><p>i i</p><p>i i</p><p>nn</p><p>iin n</p><p>ii</p><p>i i</p><p>i i</p><p>n n</p><p>i in</p><p>i i</p><p>i</p><p>i</p><p>x x</p><p>s x x x x</p><p>n n</p><p>x x x n x</p><p>n</p><p>xx</p><p>x x n</p><p>n n n</p><p>x x</p><p>x</p><p>n n n</p><p>=</p><p>=</p><p>= =</p><p>==</p><p>= =</p><p>= =</p><p>=</p><p>−</p><p>= = − + =</p><p>− −</p><p> = − + = − </p><p> </p><p> </p><p> = − + =</p><p> −</p><p> </p><p> </p><p> </p><p> </p><p> = − +</p><p>−</p><p></p><p> </p><p>∑</p><p>∑</p><p>∑ ∑</p><p>∑∑</p><p>∑ ∑</p><p>∑ ∑</p><p>∑</p><p>2</p><p>12</p><p>1</p><p>1</p><p>.</p><p>1</p><p>n</p><p>in</p><p>i</p><p>i</p><p>i</p><p>x</p><p>x</p><p>n n</p><p>=</p><p>=</p><p> =</p><p></p><p></p><p></p><p> </p><p> </p><p> = −</p><p> −</p><p> </p><p> </p><p>∑</p><p>∑</p><p>� Cálculo da variância para dados agrupados:</p><p>1) Variável Discreta:</p><p>2</p><p>12 2</p><p>1</p><p>1</p><p>1</p><p>k</p><p>i aik</p><p>i</p><p>i ai</p><p>i</p><p>X f</p><p>s X f</p><p>n n</p><p>=</p><p>=</p><p> </p><p> </p><p> = −</p><p> −</p><p> </p><p> </p><p>∑</p><p>∑ ,</p><p>onde</p><p>i</p><p>X é a classe i e</p><p>ai</p><p>f é a freqüência absoluta na classe i.</p><p>Exemplo 1 (FERREIRA, 2005): Na Tabela 1, abaixo, estão apresentados os dados referentes ao</p><p>número de ovos danificados da inspeção feita em uma amostra de 30 embalagens de uma dúzia</p><p>cada, de um carregamento para o mercado municipal de Lavras. Determine a variância.</p><p>Tabela 1: Número de ovos danificados em uma inspeção feita em 30 embalagens, de uma dúzia</p><p>cada, em um carregamento para o mercado municipal de Lavras proveniente de uma cidade</p><p>distante.</p><p>Número de ovos quebrados ( )iX fai</p><p>0 13</p><p>1 9</p><p>2 3</p><p>3</p><p>3</p><p>4 1</p><p>5 1</p><p>40</p><p>Σ 30</p><p>Para calcular a variância temos:</p><p>( ) ( )* * *</p><p>* * *</p><p>k</p><p>i ik</p><p>i</p><p>i i</p><p>i</p><p>X f</p><p>s X f</p><p>n n</p><p>=</p><p>=</p><p> </p><p> + + + = − = + + + − − − </p><p> </p><p>∑</p><p>∑</p><p>⋯</p><p>⋯</p><p>2</p><p>2</p><p>12 2 2 2 2</p><p>1</p><p>0 13 1 9 5 11 1</p><p>0 13 1 9 5 1</p><p>1 30 1 30</p><p>( ) [ ] ( ), , .s</p><p> </p><p>= − = − = </p><p> </p><p>2</p><p>22 331 1</p><p>89 89 36 3 1 8172 ovos danificados</p><p>29 30 29</p><p>2) Variável Contínua:</p><p>2</p><p>12 2</p><p>1</p><p>1</p><p>1</p><p>k</p><p>i aik</p><p>i</p><p>i ai</p><p>i</p><p>PM f</p><p>s PM f</p><p>n n</p><p>=</p><p>=</p><p> </p><p> </p><p> = −</p><p> −</p><p> </p><p> </p><p>∑</p><p>∑ ,</p><p>onde</p><p>i</p><p>PM é o ponto médio da classe i e</p><p>ai</p><p>f é a freqüência absoluta na classe i.</p><p>Exemplo 2: Em uma fábrica de pneus automotivos a matéria prima para a fabricação consiste em</p><p>materiais derivados do petróleo, materiais sintéticos e borracha. As características dos diversos tipos</p><p>de pneus fabricados são determinadas pela qualidade do material empregado em sua fabricação, e,</p><p>neste sentido diversos testes são aplicados a estes produtos para a medição e verificação de sua</p><p>qualidade. Em uma sessão de testes foram realizadas 40 medições e o coeficiente de atrito medido</p><p>foi dividido em quatro classes cujos resultados estão mostrados na Tabela 2, abaixo. Determine a</p><p>variância.</p><p>Tabela 2: Distribuição de freqüências do coeficiente de atrito medido.</p><p>Classes de Coeficiente de Atrito Cinético</p><p>if</p><p>i</p><p>X</p><p>0,15 ├ 0,35 5 0,25</p><p>0,35 ├ 0,55 10 0,45</p><p>0,55 ├ 0,75 8 0,65</p><p>0,75 ├ 0,95 17 0,85</p><p>41</p><p>TOTAL 40 -</p><p>k</p><p>i ik</p><p>i</p><p>i i</p><p>i</p><p>PM f</p><p>s PM f</p><p>n n</p><p>=</p><p>=</p><p> </p><p> </p><p> = −</p><p> −</p><p> </p><p> </p><p>∑</p><p>∑</p><p>2</p><p>12 2</p><p>1</p><p>1</p><p>1</p><p>( ) ( )</p><p>( )</p><p>[ ]</p><p>, * , *</p><p>, * , *</p><p>,</p><p>,</p><p>,</p><p>s</p><p>s</p><p>s</p><p>s</p><p> + +</p><p>= + + − </p><p>− </p><p> </p><p>= − </p><p> </p><p>= −</p><p>=</p><p>⋯</p><p>⋯</p><p>2</p><p>2 2 2</p><p>2</p><p>2</p><p>2</p><p>2</p><p>0 25 5 0 85 171</p><p>0 25 5 0 85 17</p><p>40 1 40</p><p>25 41</p><p>18</p><p>39 40</p><p>1</p><p>18 16 129</p><p>40</p><p>0 0480</p><p>Propriedades da variância:</p><p>i. A variância de uma constante é nula.</p><p>( ) 0, k=constanteV k =</p><p>ii. A variância de uma soma ou diferença entre variáveis é a soma das variâncias das variáveis se</p><p>estas forem independentes.</p><p>( ) ( ) ( ) se X e Y forem independentesV X Y V X V Y± = +</p><p>iii. Somando-se ou subtraindo-se uma constante (k) a todos dos dados a variância não se altera.</p><p>* *( ) ( )x x k V x V x= ± ⇒ =</p><p>iv. Multiplicando-se todos os dados por uma constante (k), a variância fica multiplicada por k2.</p><p>* * 2( ) ( )x x k V x k V x= ⋅ ⇒ = ⋅</p><p>1.5.2.2.2 – DESVIO PADRÃO</p><p>Um inconveniente da variância é que ela é expressa em unidades ao quadrado, ou seja, caso</p><p>esteja-se trabalhando com o peso corporal de indivíduos, tomados em kg, a variância destes pesos é</p><p>expresso em kg2, o que causa algumas dificuldades de interpretação. No intuito de resolver este</p><p>problema trabalha-se com o desvio padrão que é definido como a raiz quadrada positiva da</p><p>variância, o qual é expresso na mesma unidade em que os dados foram coletados.</p><p>Desvio Padrão Populacional:</p><p>2</p><p>12 2</p><p>1</p><p>1</p><p>N</p><p>iN</p><p>i</p><p>i</p><p>i</p><p>X</p><p>X</p><p>N N</p><p>σ σ =</p><p>=</p><p> </p><p> </p><p> = = −</p><p> </p><p> </p><p> </p><p>∑</p><p>∑ .</p><p>42</p><p>Desvio Padrão Amostral:</p><p>2</p><p>12 2</p><p>1</p><p>1</p><p>1</p><p>n</p><p>in</p><p>i</p><p>i</p><p>i</p><p>X</p><p>s s X</p><p>n n</p><p>=</p><p>=</p><p> </p><p> </p><p> = = −</p><p> −</p><p> </p><p> </p><p>∑</p><p>∑ .</p><p>Para dados agrupados em classe o estimador do desvio padrão é:</p><p>2</p><p>12</p><p>1</p><p>1</p><p>1</p><p>k</p><p>ai ik</p><p>i</p><p>ai i</p><p>i</p><p>f PM</p><p>s f PM</p><p>n n</p><p>=</p><p>=</p><p> </p><p> </p><p> = −</p><p> −</p><p> </p><p> </p><p>∑</p><p>∑ .</p><p>O estimador acima pode ser usado substituindo</p><p>i</p><p>PM , ponto médio da classe i, por Xi, valor</p><p>da categoria ou atributo da classe i, quando os dados são quantitativos discretos, isto é:</p><p>2</p><p>12</p><p>1</p><p>1</p><p>1</p><p>k</p><p>i aik</p><p>i</p><p>i ai</p><p>i</p><p>X f</p><p>s X f</p><p>n n</p><p>=</p><p>=</p><p> </p><p> </p><p> = −</p><p> −</p><p> </p><p> </p><p>∑</p><p>∑ .</p><p>A variância e o desvio padrão são medidas que só podem assumir valores não negativos</p><p>(positivo e igual a zero) e quanto maior for, maior será a dispersão dos dados, ou seja, maior será a</p><p>variabilidade dos dados. Em outras palavras o desvio padrão e a variância medem a dispersão dos</p><p>dados em torno da média.</p><p>Exemplo 3: Para ilustrar cálculos de desvio padrão utilizou-se os dados dos exemplos 1 e 2 feitos</p><p>anteriormente. Tem-se que o desvio padrão dos coeficientes de atrito cinético do pneu automotivo e</p><p>o desvio padrão de ovos danificados são respectivamente:</p><p>, ,s s= = =2 0 0480 0 2190 e , ,s s= = =2 1 8172 1 3480 ovos danificados.</p><p>Propriedades do desvio padrão:</p><p>i. Somando-se ou subtraindo-se uma constante (k) a todos dos dados o desvio padrão não se altera.</p><p>* *( ) ( )x x k s x s x= ± ⇒ =</p><p>ii. Multiplicando-se todos os dados por uma constante (k), o desvio padrão fica multiplicado por k.</p><p>* *( ) ( )x x k s x k s x= ⋅ ⇒ = ⋅</p><p>1.5.2.2.3 - COEFICIENTE DE VARIAÇÃO</p><p>O desvio padrão e a variância são medidas da variabilidade absoluta dos dados. Essas</p><p>medidas são dependentes da grandeza, escala ou unidade de medida empregada para mensurar os</p><p>dados. Conjuntos de dados com diferentes unidades de medidas não podem ter suas dispersões</p><p>comparadas pela variância ou pelo desvio padrão. Mesmo para uma única unidade, se os conjuntos</p><p>possuem médias de diferentes magnitudes, suas variabilidades não podem ser comparadas por essas</p><p>medidas de dispersão apresentadas anteriormente. Para esta situação utiliza-se o coeficiente de</p><p>43</p><p>variação (CV), pois ele não depende da grandeza, da escala ou unidade de medida empregada para</p><p>mensurar os dados, ou seja, não possui unidade de medida (medida adimensional). Portanto, fica</p><p>evidente que se deve usar o CV quando se tem diferentes unidades de medida e/ou médias de</p><p>diferentes magnitudes.</p><p>O coeficiente de variação populacional é: 100%CV</p><p>σ</p><p>µ</p><p>= .</p><p>O coeficiente de variação amostral é: 100%</p><p>S</p><p>CV</p><p>X</p><p>= .</p><p>Exemplo 4: A média e o desvio padrão do tempo de vida das lâmpadas de marca A e B são</p><p>respectivamente: ,</p><p>A</p><p>X 4 0 meses= ,</p><p>A</p><p>S 0,8 meses= ,</p><p>B</p><p>X 8,0 meses= e</p><p>B</p><p>S 1,2 meses= . Qual das</p><p>lâmpadas possui maior uniformidade de tempo de vida?</p><p>Se, ao inspecionar as estatísticas, apresentadas você fosse induzido a responder que a</p><p>lâmpada (A) seria a que possui maior uniformidade e que a razão seria o menor desvio padrão</p><p>apresentado por ela (0,8 meses), você teria cometido um erro. O fundamento usado aqui para</p><p>comparar a variabilidade das lâmpadas não foi correto, uma vez que o desvio padrão é uma medida</p><p>de variabilidade absoluta. Embora as unidades não sejam diferentes, as médias das amostras o são.</p><p>O procedimento adequado seria o de estimar o CV para ambas as lâmpadas e compará-los. Logo o</p><p>coeficientes de variação são :</p><p>,</p><p>%</p><p>,</p><p>A</p><p>A</p><p>A</p><p>S</p><p>CV</p><p>X</p><p>= = =0 8</p><p>x100 x100 20</p><p>4 0</p><p>e</p><p>,</p><p>%</p><p>,</p><p>B</p><p>B</p><p>B</p><p>S</p><p>CV</p><p>X</p><p>= = =1 2</p><p>x100 x100 15</p><p>8 0</p><p>.</p><p>É fácil verificar que a lâmpada (B) é a mais uniforme, pois possui um menor CV que a</p><p>lâmpada (A).</p><p>1.5.2.2.4 - ERRO PADRÃO DA MÉDIA</p><p>É uma medida da dispersão das médias amostrais em torno da media da população, ou seja,</p><p>é uma medida que fornece uma idéia da precisão com que a média foi estimada.</p><p>O erro padrão da média é:</p><p>X</p><p>s</p><p>s</p><p>n</p><p>= , em que s é o desvio padrão amostral e n é o tamanho da</p><p>amostra.</p><p>2 - PROBABILIDADES</p><p>2.1 – INTRODUÇÃO</p><p>As origens da probabilidade remontam ao século XVI e suas aplicações se limitavam a jogos</p><p>de azar. Hoje, a utilização das probabilidades ultrapassou o âmbito dos jogos. O governo e as</p><p>empresas incorporaram a teoria das probabilidades em seus processos diários de deliberações.</p><p>44</p><p>O estudo das probabilidades indica que existe um elemento de acaso, ou de incerteza, quanto</p><p>à ocorrência ou não de um evento futuro. Assim, em muitos casos é impossível afirmar por</p><p>antecipação o que irá ocorrer, mas através de dados históricos e da experiência, é possível dizer o</p><p>quão provável é a ocorrência de um determinado evento. Exemplos dessa situação nos negócios e</p><p>no governo: a previsão da procura de um novo produto, o cálculo dos custos de produção, a compra</p><p>de apólices de seguro, o preparo de um orçamento, a avaliação do impacto da redução de impostos</p><p>sobre a inflação. Tudo isso contém algum elemento de acaso.</p><p>As probabilidades são úteis no desenvolvimento de</p><p>estratégias. Por exemplo: se as chances</p><p>de lucro são boas, os investidores sentem-se mais inclinados a aplicar seu dinheiro; uma empresa</p><p>pode negociar seriamente com um sindicato, quando há forte ameaça de greve; ou pode investir em</p><p>novo equipamento, se há boa chance de recuperar o dinheiro.</p><p>As probabilidades são utilizadas para exprimir a chance de ocorrência de determinado</p><p>evento.</p><p>2.2 - PROBABILIDADES E ESPAÇO AMOSTRAL</p><p>Antes de entrarmos no contexto de probabilidade é necessário entendermos alguns conceitos</p><p>como: experimento, espaço amostral e eventos.</p><p>Denominamos de experimento aleatório a todo fenômeno ou ação que geralmente pode ser</p><p>repetido indefinidamente sob mesmas condições e cujo resultado é aleatório.</p><p>Exemplo: Quando lançamos uma moeda, uma única vez, estamos fazendo um experimento cujo</p><p>resultado será cara ou coroa.</p><p>Denominamos de espaço amostral (Ω) ao conjunto de todos os possíveis resultados de um</p><p>determinado experimento.</p><p>Exemplos: No lançamento de um dado, o espaço amostral é: Ω = {1, 2, 3, 4, 5, 6}. No lançamento</p><p>de uma moeda, o espaço amostral é: Ω = {cara, coroa}. Na inspeção de uma fábrica, contando o</p><p>número de acidentes: Ω = {0, 1, 2, 3, ...}.</p><p>Denominamos de evento a todo subconjunto do espaço amostral.</p><p>Exemplos: Obter um número par na face superior do dado: A = {2, 4, 6}. Obter um número menor</p><p>que 7 no dado: B = {1, 2, 3, 4, 5, 6} = Ω (evento certo). Obter um número negativo no dado:</p><p>C = { }= Φ (evento impossível)</p><p>Outras definições importantes:</p><p>i) Evento certo → Ω (caracterizado pelo espaço amostral)</p><p>ii) Evento impossível→ Φ.</p><p>iii) Processo aleatório: Qualquer fenômeno que gere um resultado incerto ou casual.</p><p>45</p><p>Exemplo: lançamento de moeda, lançamento de dado, sexo do primeiro filho de um casal, peso de</p><p>pessoas, etc.</p><p>Características</p><p>1) Pode ser repetido indefinidamente sob as mesmas condições.</p><p>2) Não se conhece a priori (inicialmente) o resultado, mas todos os resultados possíveis podem</p><p>ser descritos.</p><p>Dentro deste contexto, Probabilidade pode ser definida como o número de eventos (pontos ou</p><p>elementos) favoráveis divididos pelo número de elementos do espaço amostral:</p><p>X</p><p>P</p><p>n</p><p>= .</p><p>Em que X é o número de eventos favoráveis, e n número de eventos do espaço amostral.</p><p>OPERAÇÕES</p><p>A seguir apresentaremos o Diagrama de Venn para ilustrarmos algumas propriedades:</p><p>Figura1: Diagrama de Venn.</p><p>1) União ( ∪ ): A B B A∪ = ∪</p><p>2) Intersecção ( ∩ ): A B B A∩ = ∩</p><p>3) Complementar: CA A= Ω − (lê-se: complementar de A ou não A).</p><p>46</p><p>Observação Importante: Se A e B são conjuntos mutuamente exclusivos (disjuntos) então,</p><p>A B∩ = Φ .</p><p>Exercícios</p><p>1) Um casal pretende ter 3 filhos.</p><p>a) Determine o espaço amostral referente ao sexo dos filhos.</p><p>Ω = {(M,M,M); (M,M,F); (M,F,M); (F,M,M); (F,F,M); (F,M,F); (M,F,F); (F,F,F)}</p><p>b) Qual o número de elementos (eventos) do espaço amostral?</p><p>O espaço amostral possui oito elementos (eventos).</p><p>c) Qual a probabilidade do casal ter exatamente 3 filhas?</p><p>Evento: X = número de filhas.</p><p>( ) 1</p><p>3 0,125</p><p>8</p><p>P X = = =</p><p>d) Qual a probabilidade do casal ter exatamente dois filhos?</p><p>Evento: Y = número de filhos.</p><p>( ) 3</p><p>2 0,375</p><p>8</p><p>P Y = = =</p><p>e) Qual a probabilidade do casal ter apenas um filho?</p><p>Evento: Y = número de filhos.</p><p>( ) 3</p><p>1 0,375</p><p>8</p><p>P Y = = =</p><p>2) Jogando-se dois dados, calcular a probabilidade da soma dos pontos ser superior a nove.</p><p>Evento: X = soma dos pontos</p><p>47</p><p>( )</p><p>11 21 31 41 51 61</p><p>12 22 32 42 52 62</p><p>13 23 33 43 53 63 6 1</p><p>9 0,1667</p><p>14 24 34 44 54 36 6</p><p>15 25 35 45</p><p>16 2</p><p>64</p><p>55 65</p><p>46 56 666 36</p><p>P X</p><p> </p><p> </p><p> </p><p> </p><p>Ω = ⇒ > = = = </p><p> </p><p> </p><p> </p><p> </p><p>Dessa forma podemos sintetizar a definição de Probabilidade de ocorrer um evento A</p><p>( )( ) P A como a razão entre o número de possíveis resultados favoráveis ao evento A (n(A)) e todos</p><p>os possíveis resultados do experimento (n(Ω)), ou seja, número de elementos do espaço amostral.</p><p>( )( )</p><p>( )</p><p>n A</p><p>P A</p><p>n</p><p>= Ω .</p><p>2.3 - AXIOMAS DE PROBABILIDADE</p><p>Axioma 1: A probabilidade de um certo evento ocorrer corresponde a um número não negativo.</p><p>( ) 0P A ≥ .</p><p>Axioma 2: A probabilidade de ocorrer todo o espaço amostral é igual a um.</p><p>( ) 1P Ω = .</p><p>2.4 - TEOREMAS</p><p>Teorema 1: A probabilidade de um evento impossível ocorrer é ( ) 0P Φ = .</p><p>Demonstração:</p><p>Seja Ω o espaço amostral. Sabe-se que Ω = Ω + Φ , então aplicando a função probabilidade de</p><p>ambos os lados têm-se:</p><p>( ) ( ) ( )</p><p>( )</p><p>( )</p><p>1 1</p><p>0</p><p>P P P</p><p>P</p><p>P</p><p>Ω = Ω + Φ</p><p>Ω = Ω + Φ</p><p>= + Φ</p><p>Φ =</p><p>Teorema 2 (Probabilidade do complemento): Seja Ω o espaço amostral. Então, a probabilidade de</p><p>um evento A não ocorrer é:</p><p>( ) ( )1CP A P A= − .</p><p>Demonstração:</p><p>48</p><p>Sabe-se que CA A= Ω − , então aplicando a função probabilidade de ambos os lados têm-se:</p><p>( ) ( ) ( )</p><p>( ) ( )1</p><p>C</p><p>C</p><p>C</p><p>A A</p><p>P A P P A</p><p>P A P A</p><p>= Ω −</p><p>= Ω −</p><p>= −</p><p>Teorema 3 (Teorema da soma): Se A e B são dois eventos do espaço amostral Ω a probabilidade</p><p>que ocorra A ou B é:</p><p>( ) ( ) ( ) ( )P A B P A P B P A B∪ = + − ∩ .</p><p>Corolário: Se dois eventos A e B são mutuamente exclusivos (disjuntos), isto é, A B∩ = Φ , então:</p><p>( ) ( ) ( )P A B P A P B∪ = +</p><p>Baseado no Axioma 1 e no Corolário acima segue-se que ( )0 1P A≤ ≤ .</p><p>Exercícios</p><p>1) Um lote é formado por 11 peças boas, 3 com defeitos leves, e 2 com defeitos graves. Considere</p><p>como evento A defeito leve, evento B defeito grave, e evento C nenhum defeito.</p><p>Uma peça é retirada ao acaso desse lote. Qual a probabilidade que essa peça:</p><p>a) seja boa?</p><p>b) tenha defeito leve?</p><p>c) tenha defeito grave?</p><p>d) seja defeituosa?</p><p>Duas peças são retiradas ao acaso com reposição desse lote. Qual a probabilidade de:</p><p>e) ambas serem boas?</p><p>f) pelo menos uma boa?</p><p>Duas peças são retiradas ao acaso sem reposição desse lote. Qual a probabilidade de:</p><p>g) ambas serem boas?</p><p>2) Se um dado é lançado duas vezes. Determine qual a probabilidade de ocorrer maior do que 3 no</p><p>primeiro lance e menor do que 5 no segundo lance.</p><p>3) Em uma bolsa tem-se duas moedas de 1 centavo, três de 10 centavos e quatro de 1 real. Duas</p><p>moedas são retiradas aleatoriamente da bolsa, determine as seguintes possibilidades (sem</p><p>reposição).</p><p>a) ambas moedas serem de 1 centavo.</p><p>b) uma moeda de 1 centavo e a outra moeda de 1 real.</p><p>49</p><p>c) ambas do mesmo valor.</p><p>d) pelo menos uma de 10 centavos.</p><p>e) Nenhuma moeda de 10 centavos.</p><p>2.5 - PROBABILIDADE CONDICIONAL E INDEPENDÊNCIA</p><p>2.5.1 - PROBABILIDADE CONDICIONAL</p><p>A probabilidade condicional do evento A em relação ao evento B é denotada por:</p><p>( ) ( )</p><p>( ) ( )| , 0</p><p>P A B</p><p>P A B P B</p><p>P B</p><p>∩</p><p>= > .</p><p>A probabilidade condicional do evento B em relação ao evento A é denotada por:</p><p>( ) ( )</p><p>( ) ( )| , 0</p><p>P A B</p><p>P B A P A</p><p>P A</p><p>∩</p><p>= > .</p><p>Exemplo 1: Qual a probabilidade no lançamento de um dado, a face superior do dado ser maior ou</p><p>igual a 4 sabendo que ela é par?</p><p>No lançamento de um dado, o espaço amostral é { }1, 2,3,4,5,6 .Ω = Vamos definir o evento A</p><p>como sendo face superior par, e o evento B face superior maior ou igual a 4. Então,</p><p>{ } { }2,4,6 e 4,5,6 .A B= =</p><p>( )</p><p>( ) ( )</p><p>( ) ( )</p><p>| ?</p><p>| , 0</p><p>P B A</p><p>P A B</p><p>P B A P A</p><p>P A</p><p>=</p><p>∩</p><p>= ></p><p>Agora, vamos determinar ( ) ( )( ), e P A P B P A B∩ :</p><p>( )</p><p>( ) ( )</p><p>( )</p><p>( ) 3 1( )</p><p>( ) 6 2</p><p>1 3( ) 3 1 1 2 2.( ) |</p><p>( ) 6 2 1 2 3 1 3</p><p>( ) 2 1</p><p>( ) 6 3</p><p>n A</p><p>P A</p><p>n</p><p>P A Bn B</p><p>P B P B A</p><p>n P A</p><p>n A B</p><p>P A B</p><p>n</p><p>= = = Ω</p><p> ∩= = = ⇒ = = = =Ω</p><p></p><p>∩ ∩ = = = Ω </p><p>.</p><p>Portanto, a probabilidade de que a face superior do dado seja maior ou igual a 4 sabendo que ela é</p><p>par é de 2/3.</p><p>50</p><p>Exemplo 2: Em uma urna tem-se 40 bolas, sendo10 pretas e 30 vermelhas (20 com manchas</p><p>brancas e 10 sem manchas). Qual a probabilidade de se ter uma bola vermelha com mancha branca,</p><p>sabendo que o evento bola vermelha já ocorreu.</p><p>Vamos definir o evento VB como sendo bola vermelha com mancha branca, e o evento V bola</p><p>vermelha.</p><p>( )</p><p>( ) (</p>