Baixe o app para aproveitar ainda mais
Prévia do material em texto
IíNDICE I UNIDADE 1- ANÁLlSI~ DE nADOS ESTATíSTICOS ~ OI 1. CONCEITOS FUNDAMENTAIS DE ESTATíSTICA OI 2. FASES DO MÉTODO OU TRABALHO ESTATíSTICO 07 3. DISTRIBUIÇÕES DE FREQUÜNCIAS 10 4. REPRESENTAÇÕES GRÁFICAS DAS DISTRIBlJlÇÜES D[~ FREQUÊNCIAS 15 5. MEDIDAS DE POSiÇÃO 18 6. MEDIDAS DE DISPERSÃO 24 7. REFERÊNCIAS BII3L10GRÁFICAS 27 UNIDADE 11- INTRODUÇÃO À I)RO nA UI LI DAD E ..............................•......•....•..... 28 1. INTRODUÇÃO 28 2. ESPAÇO AMOSTRAL E EVENTOS 29 3. NOÇÕES FUNDAMENTAIS DE PROBABILIDADE 31 4. PROBABILIDADE EM ESPAÇOS AMOSTRAIS FINITOS E EQUIPROV ÁVEIS 32 5. PROBABILIDADE CONDICIONADA 34 6. TEOREMA DE BAYES 38 7. EVENTOS INDEPENDENTES 39 8. REFERÊNCIAS BIBLIOGRÁFiCAS 41 APÊNDICE A - ALGUMAS NOÇÕES DA TEORIA DOS CONJUNTOS 42 APÊNDICE B - TÉCNICAS DE CONTAGEM 44 UNIDADE 111- DISTRIBUiÇÃO DE I)ROBABILlDADE 47 1. INTRODUÇÃO , " 47 2. VARIÁVEIS ALEATÓRIAS DISCRETAS 49 3. VARlÁ VEIS ALEATÓRIAS CONTÍNUAS 52 4. ESPERANÇA MATEMÁTICA E VARIÂNCIA 54 5. ALGUMAS DISTRIBUIÇÕES DE PROBABILIDADE 57 6. REFERÊNCIAS BIBLIOGRÁFiCAS 64 UNIDADE IV - ESTATÍSTICA INFERENCIAL 65 1. NOÇÕES ELEMENTARES DE AMOSTRAGEM 65 2. DISTRIBUIÇÃO AMOSTRAL 69 2.1. DISTRIBUIÇÃO AMOSTRAL DA MÉDIA 70 2.2. DISTRIBUIÇÃO AMOSTRAL DA PROPORÇÃO 74 2.3. DISTRIBUIÇÃO AMOSTRAL DA VARIÂNCIA 75 3. REFERÊNCIAS BIBLIOGRÁFICAS 76 J li..- UN IDA DE V - ESTIMA çÃO •..•••.••....••.••..•.....••.••••..•.•..••..•.••.••.•....•.•...••...•••••.•••••...•...•.77 1. INTTtODUÇÃO , 77 2. ESTIMAÇÃO PONTUAL 77 2.1. PROPRIEDADES DOS ESTIMADORES , 78 2.2. ESTIMADORES PONTUAI S 80 3. ESTIMAÇÃO POR INTERVALO 81 3. I. INTERVALO DE CONFIANÇA PARA A MÉDIA DA POPULAÇÃO 82 3.2. INTERVALO DE CONFIANÇA PARA A PROPORÇÃO DA POPULAÇÃO 85 4. REFERÊNCIAS lJlI3L10GRÁFI CAS 86 UN lDAD E VI - TESTES DE 111PÓTES ES ••..•.•;•.......•.•.•.•...•...•.•...•.•..•..•••.•••••..••....••.••••87 1. INTRODUÇÃO 87 2. CONCEITOS fUNDAMENTA IS 87 . 3. PASSOS PARA CONSTRUÇÃO DE UM TESTE DE HIPÓTESES 88 4. TESTES. SOBRE A MÉDIA DA POPULAÇÃO 89 5. TESTES SOBRE A PROPORÇÃO DA POPULAÇÃO 93 6. REFERÊNCIAS BIBLIOGRÁFl CAS 95 UNIDADE VII - REGRESSÃO E CORRELAÇÃO 96 1. INT'RODUÇÃO 96 2. COItRELA çÃO 96 3. REGRESSÃO : 99 4. REFERÊNCIAS BIBLlOG RÁFICAS 104 TA nELAS .•.•...•..•.....••.•.•.....•......•.•..•....••..................... ... ....................................•..... ..... 105 IUNIDADE l. ANÁLISE DE DADOS ESTATÍSTlCOSj J. CONCEITOS FUNDAMENTAIS DE ESTATíSTICA -ESTATíSTICA "Podemos considerar a Estatística como 11m cmrjllllto ele métodos e processos qllaJltitaJil'oS qlle sen'e para e.'itlldar e medir os fenômellos coletÍl'os". A estatística teve acelerado desenvolvimento a partir do século XVII, através dos estudos de BERNOULLI, FERMAT, PASCAL. LAPLACE. GAUSS, GALTON, PEARSON, FISHER, POISSON, KOLMOGOROV e outros que estabeleceram suas características essenciais. Ela não alcançou ainda um estado definitivo. Continua a progredir na ação direta do desejo de investigação dos fenômenos coletivos. A Estatística é considerada como Ciência no sentido do estudo de uma população. Mantém com a Matemática uma relação de dependência, solicitando-lhe auxílio, sem o qual não poderia desenvolver-se. Com as outras Ciências mantém a relação de complemento, quando utilizada como instrumento de pesquisa. Em especial a relação de complemento é a forma que a Estatística, através de seus MÉTODOS ESTATÍSTICOS, mantém com as Áreas Tecnológicas, as Ciências Exatas e outras, servindo como instrumento auxiliar na tomada de decisões. A Estatística tem como OBJETIVO o estudo dos fenômenos coletivos. Objetivando o estudo quantitativo e qualitativo dos dados (ou informações), obtidos nos vários campos da atividade cientílica, a Estatística manipula dois conjuntos de dados fundamentais: a "pop"lação" e a "amostra". POPULAÇÃO ( ou Universo) É o conjunto dos seres, objetos ou informações que interessam ao estudo de um fenômeno coletivo segundo alguma(s} característica(.'l). É, portanto, u~ conjunto definido de informações relativas a qualquer área de interesse, podendo, quanto ao número de elementos, ser: finita (tamanho N) ou infinita. Na maioria das vezes, não é conveniente, ou mesmo possível realizar o levantamento dos dados referentes a todos os elementos de uma população. Portanto, analisamos parte da população, isto é amo,stramos. AMOSTRA É um subconjunto não vazio ou parte da população. Duas considerações devem ser feitas sobre o estudo amostrai dos fenômenos. Uma diz respeito aos cuidados que se deve tomar para assegurar que a amostra seja representativa da população. Para atender a essa exigência, deve-se selecionar os elementos de forma aleatória, de modo que todo e qualquer elemento da população tenha a mesma chance de participar da amostra. A outra exigência diz respeito à precisão dos dados coletados, buscando minimizar os erros que poderiam induzir a conclusões equivocadas. O número de elementos de uma amostra é chamado o tamanho da amostra, e denotado por n. --------, ..,j _ PROCESSOS ESTATÍSTICOS DE ABORDAGEM Em. aplicações efetivas, onde aplica-se o processo de amostragem, o número de elementos componentes de uma amostra é, geralmente, bastante reduzido em relação ao núm~ro de elementos componentes da população. para toda uma população é denominada b) AMOSTRAGEM (Inferência) - avaliação indireta de um parâmetro, com base em um estimador através do cálculo das probabilidades. Propriedades Principais da Estimação: Admite erro processual positivo e tem confiabilidade menor que 100% - É barata - É rápida - É atualizada - É sempre viável. I) ESTATÍSTICA DESC1UTIVA - é a parte da Estatística que tem por objetivo descrever os dados observados. São atribuições da Estatística Descritiva: 2 Quando solicitados a estudar um fenômeno coletivo podemos optar entre os seguintes processos estatísticos: .a) CENSO - avaliação direta de um parâmetro, utilizando-se todos os componentes da população. Propriedades Principais do Censo: Admite ~rro processual zero e tem confiabilidade 100% - E caro. É lento - É quase semp'rc desatualizado - Nem sempre é viável. a) A organização dos dados. b) A redução dos dados. c) A representação dos dados. No sentido de disciplimi, a Estatística ensina métodos racionais para a obtenção de informações a respeito de um fenômeno coletivo, além de obter conclusões válidas para o fenômeno e também permitir tomada de decisões, através de alguma(s) característica(s) de valores numéricos observados. Desta forma, a Estatística. pode ser dividida em duas grandes áreas: DCSCI'itiv:l c lnfcrcncial. Por exemplo: no fenômeno coletivo eleição para prefeito do município de João Pessoa, a população é o conjunto de todos os eleitores habilitados na respectiva cidade. Um parâmetro é a proporção de votos do candidato A. Uma amostra pode ser um grupo de 1.000 eleitores selecionados em todo o município. Um cstimador é a proporção de votos do candidato A obtida na amostra. O valor resultante do estimador, a proporção amostrai, é a estimativa. 085: Parâmetro. Estimador e Estimativa a) Uma característica numérica estabelecida parâmetro. b) Uma característica numérica estabelecida para uma amostra é denominada estimeu/or. c) O valor numérico assumido pelo estimador numa determinada amostra é denominada estimatiJ'a. ~ ------------ "j 3 DADOS e VARIÁVEIS ESTATíSTICAS Isto encerra as atribuições da Estatística Descritiva. "0 ~ IAmostragem I ~ 1 Cálculo dasProbabilidades ~IE ,. I Lê"~statlstlca lnferencial Estatística Descritiva " Figura 1:Esquema Geral de um Curso de Estatística Complementando o processamento estatístico, no caso de uma estimação, a Estatística Indutiva estuda os parâmetros. a partir do uso de estimadores usando o cálculo das probabilidades, elemento este que viabiliza a inferência estatística.Em resumo, um estudo estatístico completo que recorra às técnicas de Estatística Inferencial irá envolver também, direta ou indiretamente, tópicos de Estatística Descritiva, Cálculo das Probabilidades e Amostragem. Logo, para se desenvolver um curso completo e razoável de Estatística, todos esses assuntos devem ser abordados. No diagrama abaixo está indicado como essas áreas estão j-c1acionadas. Normalmente, no trabalho estatístico o pesquisador se vê obrigado a lidar com grande quantidade de valores numéricos resultantes de um censo ou de uma amostragem. Estes valores numéricos são chamados dadm; estatísticos. • A organização dos dados consiste na ordenação e crítica quanto à correção dos valores observados, falhas humanas, omissões, abandono de dados duvidosos, etc . • Redução dos dados - O entendimento e compreensão de grande quantidade de dados através de simples leitura de seus valores individuais é uma tarefa extremamente árdua e dificil mesmo para o mais experimentado pesquisador, portanto deveremos tabular os dados . • A representação dos dados - Os dados estatísticos podem ser mais facílmente compreendidos quando apresentados através de uma representação gráfica, a qual permite uma visualização instantânea de todos os dados. Os gráficos quando bem representativos, tornam-se importantes instrumentos de trabalho. • A obtenção de algumas informações que sumarizam os dados, facilitando a descrição dos fenômenos observados. 11) K,)TA 1iSTlCA lNl'1~RI';NCIAL (ou II/dufiva) - é a parte da Estatística que tem por objetivo obter e generalizar conclusões para a população a partír de uma amostra. d) A obtenção de algumas informações que auxiliam a descrição do fenômeno observado . ... As informações ou dados característicos dos fenômcnos ou populaçõcs são denominados variál'ei.'i e.'ttatí.'itica.'i ou simplesmcnte l'arÍth'ei.'i. Conforme suas características particulares, podem ser classificadas como: QUlultitatÍl'll.'i c Qu.alitativlls. QUANTIT ATl VAS - São aquelas que podem ser expressas em termos numéricos. Em geral são as resultantes de medições, enumerações ou contagens. São subdivididas em cOlltíllUas e discretas. conforme abaixo. ContínuD.'i - são aquelas que podem assumir qualquer valor num certo intervalo de medida, podendo ser associados ao conjunto dos números reais, ou seja, seus valores possíveis formam um conjunto não enumerável. Entre outras, enquadram-se nesta categoria as medidas de tempo, comprimento, espessura, área, volume, peso e velocidade. Discretas (ou desc{mtímlD.'.) - quando só podem assumir determinados valores num certo intervalo, podendo ser associadas ao conjunto dos númcros inteiros, ou seja, seus possíveis valores formam um conjunto finito ou enumerável. Em geral, representam númcros inteiros resultantes do processo de contagem, como o número de alunos por sala, de créditos por disciplinas, de pacientes atendidos diariamente num hospital, etc. De modo geral, as medições dão origem as variáveis contínuas e as contagens ou enumerações, as variáveis discretas. Designamos estas variáveis por letras latinas, em geral , as últimas: X, Y, Z. QUALITATIVAS - Nem sempre os elementos de uma população são exclusivamente contáveis. Muitas vezes, eles podem ser qualificados também segundo algumas de suas características típicas. Nesses casos, as variáveis podcm ser agrupadas em lIomillais ou ordil,ais( por postos ). Nominais - quando puderem ser reunidas em categorias ou espécies com idênticos atributos. Aqui se incluem os agrupamentos por sexo, área de estudo, desempenho, cor, raça, nacionalidade e religião. Ordillais - quando os elcmentos forem reunidos segundo a ordem em quc aparecem dispostos numa lista ou rol. São típicos desta forma de agrupamento, as listas classificatórias de concursos e as tabelas de campeonatos. . Em geral, uma mesma população pode scr caracterizada por mais de um tipo. de variável. Assim os inscritos num vestibular, por exemplo, podem ser contados, medidos ou pesados, podem ser agrupados segundo o sexo ou área de estudo e podcm ainda ser classificados segundo a,s notas obtidas nas provas prestadas . .-. 1- NíVEIS DE MENSURAÇÃO - I o objetivo de estudarmos os níveis de mensuração das variáveis cstatísticas consiste em determinar a complexidade da análise das variáveis (características de interesse) envolvidas no estudo de uma população ou de uma amostra. As pessoas de uma comunidade podem ser estudadas sob diversos ângulos. Por exemplo, podem ser classificadas quanto ao SEXO (masculino/feminino), quanto à 4 -~ ESTATURA (baixa/média/alta), quanto à REN DA (pobres/ricas) etc. SEXO, ESTATURA, RENDA são variávcÍs, isto é, são características às quais podemos associar conceitos ou números e assim expressar, de certa maneira, informações sob a forma de medidas. 1". nível: _ É o nível de mensuração mais baixo, mais rudimentar possível. A escala de medida desse nível chama-se NOMINAL. O fundamento para a atribuição dos números é de natureza qualitativa. Exemplos: VAIUÁVEL QUALITATIVA NOlvflNAL - 1° Nível - Escala Nominal (classificação por tipos ou atributos). a) População: moradores de um cidade Va,riáve/: cor dos olhos (pretos, castanhos, azuis, etc.) b) População: funcionários da empresa X Variável: sexo (masculino, feminino) 20. nível: _ Este nível já é um pouco mais elaborado que o anterior e corresponde ao que popularmente se designa por ordellllçào; a escala de medida chama-s.e ORDINAL. As grandezas de 20• nível podem ser avaliadas em termos de 11lai.~ lJue ou I1U!IWS lJue, embora a quantificação precisa seja impossível. Exemplos: VAJUÁVEL QUALITATIVA OlWINAL - 2° Nível - Escala Ordinal ( ordenação ou postos). c) População: estudantes de uma escola de 2". grau Variável: grau de escolaridade ( 13• série, 23• série, 33• série) d) População: pessoas adultas economicamente ativas Variável: renda (baixa, média, alta) 30. nível: _ É no 30. nível que surge, pela primeira vez, uma escala de medida propriamente dita. É a escala INTERVALAR, onde a contagem rcsulta números inteiros e com eIes são possíveis algumas das operações aritméticas ( adição, subtração e multiplicação). Neste nível o ZERO da escala é relativo. Exemplos: As Esca~.~sTermométric:ls, fuso horário. 4". nívcl: O 40• nível define a c1úlmada escala das raztJes ou RACIONAL. Essa escala é muito parecida com a de 3". níveI, exccto quanto à origem. O ZCIOO é absoluto, isto é, é zero mesmo. No 40• nível todas as operações aritméticas são possíveis, isto é, adição, subtração, multiplicação c divisão. 5 "j :=J Escala das Razões 140. NÍVELI Escala Inter\'alar 130. Nívr::L I Escala Ordinal 120. NÍVELI Escala Nominal 110.NÍVELI (, A Complexidade da análise das variáveis aumenta quanto maior for o nível desta variável, como é indicado no diagrama abaixo. VA1UA Vr-L QUANTITA TIVA CONJiNUA - 4° Nível - Escala das Razões (processo de medição). g) POjJulaç{io: peças produzidas por uma máquina Variável: diâmetro externo (p. ex., 0,96 cm) h) Populaçlio: estudantes de uma escola Variável: tempo de estudo diário em certa disciplina (p. ex., 2,30 h) Exemplos: VAIUA VEL QUANTITA TlVA f)/,SCR/~TA - 4° Nível - Escala das Razões (processo de contagem e ordenação). e) População: casais residentes em uma cidade Variável: número de filhos (O, 1,2, 3,4 ou mais filhos) f) POjJulaçlio: peças produzidas por uma máquina Variável: número de defeituosas da produção diária (O, 1,2,3,4,5, ." ) Figura 2: Grau de complexidade da análise dos dados " '-- 2. FASES DO MÉTODO OUTRAUALHOESTATÍSTICO Em linhas gerais, podemos distinguir na análise estatística as seguintes etapas: Planejamento, Coleta, Crítica, Apuração e Exposição dos dados, além da análise dos dados. PLANEJAMENTO É o trabalho inicial de coordenação no qual define-se a população a ser estudada estatisticamente,formulando-se o trabalho de pesquisa através da elaboração de questionário, entrevistas, etc. A organização do plano geral, implica em obter respostas para uma série tradicional de perguntas, antes mesmo do exame das informações disponíveis sobre o assunto, perguntas que procuram justificar a necessidade efetiva da pesquisa, a saber: _ "quem", "o que", "sempre", "por que", "para que", "para quando". Imaginemos, por exemplo, que a Biblioteca Central da UFPb tenha necessidade de .obter informações acerca dos usuários em potencial que utilizam-na. O primeiro trabalho da equipe encarregada -da pesquisa, será evidentemente, o de obter resposta para aquelas perguntas. Seriam então: - Quem deseja as informações? _ O que devemos perguntar no questionário? _ Será executada sempre? A pesquisa será periódica ou ocasional? - Por que desejam as informações? - Para que desejam as informações? _ Quando deverá estar concluída a pesquisa? _ Qual a época oportuna-para a aplicação dos questionários? Ainda na fase do planejamento, temos: o EXAME DAS INFORMAÇÕES DISPONíVEIS, ou seja, análise da reunião de tudo que foi publicado sobre o assunto, obtendo-se relatórios sobre atividades semelhantes ou correlatas. A DEFINIÇÃO DO UNIVERSO, isto é, saber qual o conjunto a ser pesquisado, distribuindo, classificando ou agrupando os elementos desse conjunto em populações, para permitir um trabalho mais fácil, mais lógico, mais racional. O tipo de levantamento, CENSO ou AMOSTRAGEM, deverá ser decidido com a devida antecedência c-a necessária análise das vantagens e desvantagens de um e de outro, em virtude do custo financeiro e .do prazo determinado para a conclusão do trabalho. COLETA DE DADOS Após cuidadoso planejamento e a devida determinação das características mensuráveis do fenômeno coletivamente típico que se quer pesquisar, damos início à coleta dos dados numéricos necessários à sua descrição. 7 l A coleta dos dados poderá ser feita de diversas formas. A ideal é aquela que maximiza os recursos disponíveis, dados os objetivos e a precisão previamente estipulados. No seu planejamento, deve-se considerar o tipo de dado a ser coletado, o local onde este se manifestará, a frequência de sua ocorrência, e outras particularidades julgadas importantes. Quando os dados se referirem ou estiverem em poder de pessoas, sua coleta poderá ser realizada mediante respostas a questionários previamente' elaborados. Esses questionários podem ser enviados aos entrevistados para devolução posterior ou podem ser .aplicados pelos próprios pesquisadores ou por- entrevistadores externos ou contratados, devidamente treinados. Os dados ou informações representativas dos fenômenos ou problema em estudo podem ser obtidos de duas formas: por via direta ou por l'ia i"direta, Por via direta - quando feita sobre elementos informativos de registro obrigatório (p. ex.: nascimentos, casamentos, óbitos, matrículas de alunos etc.) ou, ainda, quando os dados são coletados pelo próprio pesquisador através de cntrevistas ou questionários. A coleta direta de dados, com relação ao fator tempo, pode ser classificada em: a) contínua, também denominada registro, é feita continuamente, tal como a de nascimentos, óbitos, etc.; b) periódica, quando feita em intervalos constantes de tempo, como os censos( de 10 em 1O anos), os balanços de uma empresa comercial, etc.; . c) ocasional, quando feita extemporaneamente, a fim de atender a uma conjuntura ou a uma emergência, como no caso de epidemias que assolam ou dizimam seres humanos Por l'ia i"direta - quando é inferida de elementos conhecidos (coleta direta) e/ou conhecimento de outros fenômenos relacionados com o fenômeno estudado. Como exemplo, podemos citar a pesquisa sobre a mortalidade infantil, que é feita através de dados colhidos via coleta direta. CIÚTICA DOS DADOS Os dados colhidos por qualquer via ou forma e não previamente organizados são chamados de dados brutos. Esses dados brutos, antes de serem submetidos ao processamento estatístico propriamente dito, devem ser "criticados", visando eliminar valores impróprios e erros grosseiros que possam interferir nos resultados finais do estudo. A crítica é exter"a quando visa às causas dos erros por parte do informante, por distração ou má interpretação das perguntas que lhe foram feitas; é illterlla quando se observa o material constituído pelos dados coletados. É o caso, por exemplo, da verificação de somas de valores anotados. APURAÇÃO OU PROCESSAMENTO DOS DADOS Uma vez assegurado que os dados brutos são consistentes, devemos submetê-los ao processamento adequado aos fins pretendidos. A apuração ou processamento dos dados pode ser manual ou clctr-ônica. Os processos e métodos estatísticos a que um conjunto de dados pode ser submetido serão nosso objeto de estudo nas seções seguintes. 8 EXI)OSIÇÃO ou AI)RESENTAÇÃO DOS DADOS Por mais diversa que seja a finalidade que se tenha em vista, os dados devem ser apresentados sob forma adequada (üabclas ali gl"áficos), tornando niais fácil o exame daquilo que está sendo objeto de tratamento estatístico e ulterior obtenção de medidas típicas. No caso particular da estatística descritiva, ó objetivo do estudo se limita, na maioria dos casos, à simples apresentação dos dados, assim entendida a exposição organizada e resumida das informações coletadas através de tabelas ou quadro .••, bem como dos gráficos resultantes. ANÁLISE DOS RESULTADOS Como já dissemos, o objetivo último da Estatística é tirar conclusões sobre o todo (população) a partir de informações fornecidas por parte representativa do todo (amostra). Assim, realizadas as fases anteriores (Estatística dcscl"itiva), fazemos uma análise dos resultados obtidos, através dos métodos da Estatística Infcrcncial, que tem por base a indução ou inferência, e tiramos desses resultados conclusões e previsões. 9 c 3. DISTJUnUICÔES J)E FIU~Q(JI~NCIAS Os dados numéricos, após coletados suo colocados em série e apresentados em tabelas ou quadros. Quando se estuda orna variável (qualitativa ou quantitativa), o maior interesse do pesquisador é eonhecer a distribuição dessa variável através das 'possíveis realizações (valores) da mesma. Iremos, pois, ver uma maneira de se dispor um cOI~unto de valores, de modo a se ter uma boa idéia global subre esses valores, ou seja, de sua distribuição. Consideremos, para efeito de estudo, o qmuln» (hanco de dados) apresentado abaixo: TABELA 1.1 - Infonnações sobre sexo, curso, idade (anos), pr(}(.:edência, renda .fámiliar, nlÍmero de disciplinas malriclIiado(a), peso (kg) e allllra (cm) de 31 alunos matriculados na . disciplina CÁLC. das PROBo e ESTATíSTICA I, período 97.1 - turma: 04 - tumo da manhã. lO SEXO CURSO lDAlJE PROCEDf~NClJ\ RENDA NU. DISCIP PESO ALTURA (anos) FAMIIJAR MATRIC (kg) (em) OI Masc Ciências 27 Capital Baixa 3 68 170 02 Masc Eng Civil 18 Interior Média 7 60 175 03 Fem Ciências 21 Capital Média 6 57 168 04 Masc Eng Mec 23 Interior Baixa 5 54 N.lnf 05 Masc Eng Mec 23 Interior Baixa 5 54 N.lnf 06 Fcm Ciências 21 O.Re.gião Média 7 47 153 07 Fem Ciências 21 Capital Médià 8 46 162 08 Masc Eng Mec 27 Interior Média 4 90 174 09 Masc Eng Civil 21 Capital Alta 5 51 172 10 Fem Eng Civil 19 Capital Média 6 43 158 II Masc Eng Civil 18 O.Região Média 5 73 177 12 Masc Eng Civil 18 O.Região Alta 6 69 175 13 Fem Eng Mec 22 Capital Média 6 70 172 14 Fem Ellg Civil 19 Capital Média 5 57 165 15 Masc Eng Civil 19 Capital Média 5 73 183 16 Masc Eng Civil 18 Capital Alta 6 55 167 17 Masc Eng Civil 19 Capital Média 5 82 181 18 Masc Ellg Civil 23 Capital Média 4 65 175 19 Masc Eng Civil 19 O.Re~ião Média 5 71 170 20 Fem Eng Civil 18 Capital Média 5 68 170 21 Masc Eng Civil 18 Capital Média 5 70 170 22 Masc Eng Civil 20 Capital Média 5 67 177 23 N.lnf Eng Civil' 19 Capital Média. 7 68 170 24 Masc Ellg Civil 24 .. Capital Média 770 170 25 Fem Eng Civil 20 Capital Média 6 58 161 26 Fem Eng Civil 21 Capital Média 5 51 158 27 Masc Eng Civil 20 Capital Média 5 84 180 28 Masc Eng Civil 21 Interior Média 6 65 167 29 Masc Eng Civil 20 Interior Baixa 6 62 164 30 Masc Eng Civil N.1nf Capital Média 3 84 170 31 Fem Eng Civil 21 Capital Média 6 62 173 FONTE: Questionário aplicado - aula 18/03/97 10 DISTRIBUIÇÃO DE FREQUÊNCIAS rOR INTERVALOS OU CLASSES (variável quantitativa).Constrói-se classes de valores, quando a variabilidade dos dados é grande, levando em consideração o número de valores que pertencem a cada classe. A construção de tabelas de frequências para variáveis cóntínuas necessita de certos cuidados. Uma distribuição de frequências pode ser apresentada nas seguintes maneiras: _ DISTRIBUIÇÃO DE FREQUÊNCIAS POR VALORES (variável qualitativa ou quantitativa discreta) Tabela 1.2 _ Frequências e Percentuais dos 31 estudantes de Calco Probo Est 1 - Turno: Manhã, Turma: 04, Período: 97.1 - segundo a Região de Procedência j 1I Percclltua! (;% 6,5 6,5 41,9 29,0 12,9 3,2 \00 1'ercellllllll f, I}/íl C>7,7 19,4 129-' 100 N° dc Estudalltcs (; 2 2 13 9 4 1 3\ ,..p ele 1',:,illllolJles L 21 Ó 4 31 OBS.: L=> letra grega "SIGMA", indica total ou somatório. Tabela 1.3 _Distribuição de frequências e percentuais do Nº de Disciplinas Matriculado(a) dos 31 estudantes de Cale. Probo Est 1- Turno: Manhã, Turma: 04, Periodo: 97.1. lf2 DisC MA TIUC 19- 3 4 5 6 7 8 Total ou L FONTE: Tabela 1.1 EXEMPLO 2 _ A tabela 1.3 apresenta a distribuição de frequência da variável Nº DE DISCIPLINAS MATRlCULADO(A), usando-se os dados da tabela 1.1 - ( DADOS NÃO -AGRUPADOS) Capital Interior O. Região Total FONTE: Tabela 1.1 PUOCI'.:J)£NC1A EXEMPLO 1 _ A tabela 1.2 apresenta a distribuição de frequência da variável PROCEDÊNCIA, usando-se os dados da tabela 1.1 . É construída considerando-se todos os diferentes valores ou categorias, levando em consideração suas respectivas repetições . 1. Efetua-se um ROL ESTATÍSTICO (ordenação crescente ou decrescente de grandeza) nos Dados Brutos (aqueles ainda não organizados numericamente). _ REGRAS BÁSICAS PARA ELABORAÇÃO DE UMA DISTRIBUIÇÃO DE FREQUÊNCIAS POR INTERVALOS - (DADOS AGRUPADOS) EXEMPLO 3 - A tabela 1.4 apresenta a distribuição de frequências da variável ALTURA (medida em cm), usando-se os dados da tabela 1.1 - (DADOS AGRUPADOS) OBSERVAÇÃO: 1) De um modo geral tem-se a destacar cm uma t:abcln (disposição escrita que se obtém referindo-se a uma coleção de dados numéricos a uma determinada ordem de classificação ): Percenlual .f,~oo 3,4 13,8 41,5 31,0 .1°,3 JOO,O i) Elementos essenciais: Títlllo: Indicação que precede a tabela e que contém a designação do fato observado, o local e a época em foi registrado. Cabeçalho: Parte superior da tabela que especifica o conteúdo das colunas. Col'llla Indicadora: Parte da tabela que especifica o conteúdo das linhas. Corpo da tabela: Conjunto de colunas e linhas que contém as informações sobre a variável em estudo. ii) Elementos complementares: Fonte: Indicação da entidade responsável pelo fornecimento dos dados 'ou pela sua elaboração. Notas: Informações de natureza geral destinadas a conceituar ou esclarecer o conteúdo das tabelas ou a indicar a metodologia adotada no levantamento ou na elaboração dos dados. Chamadas: Informações de natureza especifica sobre determinada parte da tabela, destinada a conceituar ou a esclarecer dados 12 2) As tabelas apresentadas oficialmente devem atender às normas do IBGE. Tabela 1.4 - Frequências e percentuais das ALTURAS dos 31 estudantes de CALe. PROBo EST I _ _ I~E!!<?:..~.~~!~ãl ..T.~..f]~~.él.:..9~.!..~~rí~~().:.,9.?:.1.:, ALTURAS N° de l:"~\'//ldallles ...._.._........._..(~'.?~)o , .00 •••••••••••• • ••••• f; . ISO 1-- 157 I 157 1---- 164 4 164 1- 171 12 171 1--- 178 9 ..................P~.J:~==..185 . . 3 Total OUL 29 FONTE: Tabchl 1.I NOTA: Dos 31 respondentes, 2 não informaram a altura. L J] W- Estudanles £. 12 11 4 1 2 30 HOL [STATíSTlCO (crcsccntc) 18 18 18 18 18 18 19 19 19 19 19 19 20 20 20 20 21 2 I 21 21 21 21 21 22 23 23 23 24 27 27 DADOS BRUTOS Tabela 1.5 _ DISTRIBUiÇÃO DE FREQUÊNCIAS DAS IDADES (em GIIO.\) DE 30 ESTUDANTES DE CALCo PROBo ESTATíSTICA 1- TURNO: MANHÃ, TURMA: 04, PERíODO: 97.1 i IDADES (allo.\) 18 1--"""'-- 20 20 \------ 22 22 1------' 24 24 1------ 26 ~\------ 28 Total ou L FONTE: Tabela 1.1 NOTA: Dos 31 respondentes, 1 não informou a idade. 27 18 21 23 23 21 21 27 21 19 18 18 22 19 19 18 19 23 19 18 18 20 19 24 20 21 20 21 20 21 Passo 4: AGRUPAMENTO EM CLASSES + FREQUÊNCIAS SIMPLES DE CLASSES Passo 3: Número de classes ---> k = J3õ ~ 5 (aproximação por falta) AT 9 e Amplitude de classe c:) h ~k = 5" = 1,8 == 2 anos Passo 2: Amplitude TotaI----> AI' = 27 - 18= 9 Passo 1: Efetuar o Rol Estatístico EXEMPLO 4 _ Elabore uma tabela de distribuição c)e /i'equências (dados agrupados) da variávcllDADE (em anos) dos 30 estudantes de Cale. probo Est I, Turno: Manhã, Turma 04, Período: 97.1, conforme U:ulos Bmlos abaixo: 4. Efetua-se o AGRUI)AMHNTO l~M CLAS,)'/~'S e, a seguir, toma-se as i'1~EQUJ~'NCIAS SIMPLES DE CLASSES, elaborando-se, portanto, a tabela de distribuição de frequências. 3. Escolhe-se convenientemente o número de classes K (n". inteÍro) , 5::;;K::;; 15 onde podemos tomar K =...r;; ou a fórmula de Slurges K == 1+ 3,3. iogJl, 1I ~ 25 (totai de observações). Se possível determina-se, ou seja, constrói-se classes de mesma amplitude, AT tomando h == --.K 2. Determina-se a AMI)LITUDE TOTAL dos dados Ar = Xmáx - Xmín ,onde Xmáx : maior valor observado e XmÍn menor valor observado ii. AMPLITUDE DE CLASSE: Iti = Ls - Li, amplitude da i-ésima classe. 1ª classe -----> Li = 181----- Ls = 20 , 2ª classe -----> Li = 20 1----- Ls = 22, etc. A seguir, analisaremos alguns CONCEITOS ESSENCIAIS numa Distribuição de Frequência por Intervalos ou Classes. Classe ou Intervalo de classe -------> Li (incluir) 1------ Ls (excluir) L.I; = /I = 30 ,... , e Ls : Limite superior de classe /5=2 x,.. = Xi +17 , ou seja por ex.: ponto médio da i-ésima classe. /4= I 2ª classe --> "2 = 22 - 20 = 2 /]=4/2 = 11 I:';i':'u:",,',','um' ;-TI~ºS'I)E:F1U1QUÊNCIAS,- I i=1 a 18 + 20 a 20 + 22 1- classe ---> XI = - 19 . 2- classe ---> Xl = --- = 21 2' 2 fi : frequência simples da i-ésima classe (número de observações) k L/; =L/; = 11 (húmero total de observações) Porex.~/1 = 12 LIMITES DE CLASSES: Li : Limite inferior de classe ~ Como as classes têm mesma amplitude denominamos, simplesmente, por ,,= Li - Ls = 2 Por exemplo, distribuição das Idades, tabela 1.5: I. Por exemplo, distribuição das Idades, tabela 1.5: 1ª classe --> It 1 = 20 - I8 = 2 sª classe --> 115 = 28 - 26 = 2 . L +L 11I. PONTO MEDIO DE CLASSE: X = I S,, 2 Por exemplo, distribuição das Idades, tabela 1.5: No caso de classes com mesma amplitude It, tomamos: 2ª classe -----> Xl + Iz = 19 + 2 = 21 3ª classe -----> Xl + It = 21 + 2 = 23 etc. IV. FREQUÊNCIA SIMPLES OU ABSOLUTA DE CLASSE 14 '- -- 5. FREQUÊNCIA RELATIVA E PERCENTlJAL DE CLASSE FREQUÊNClA UELATIVA (i-ésima classe ou valor) : fi ,1; (R - fi ~" 1 Id b -')J~ =- azao cntrc a Tcquencla Slll1Pes e o to ta e o servaçoesn Lfli = 1 (soma das frequências relativas) FREQUÊNCIA PERCENTUAL (i-ésima classe ou valor) : f/lo = fli ' 100 ou ,I;% = .1: , 100 11 L.I: % = 100 (soma das frequências percentuais) 6. FREQUÊNCIA SIMPL~S ACUMlJLADA (do tipo "abaixo de") F; = /1 + /2 + /3 +'" +.1: , frequência simples acumulada da i-ésima classe ou valor 7. FREQUÊNCIA RELATIVA E PERCENTlJAL ACUMULADA Fr; = /r J + fr2 + fr3 +'" + fi~ , frequência relativa acumulada da i-ésima classeou valor P~%= /1%+ /2% + /3%+---+,1;% frequência percentual acumulada da i-ésima classe ou valor 150 1- 157 153,5 1 157 1----- 164 160,5 4 164 \-- 171 167,5 12 171 1-- 178 174,5 9 178 L 185 181,5 3--_.[- ..•......_~_ __ •...............•...•. _ •...._ . Total ouL ~ 29 ___ T_a._b_c~~.ie..~te~ldida) - !?J.~T~1Bl:!~S.~_Q..o._~..~~.~q.~~.~~9.~DAS.:~~T~R..i\~ .__._ . ALTURAS P. Médio Freq. Simples Freq. Relativa Freq. Percentual Freq.Simples Freq.Perc. (cm) Xi fi fr; fi % ACUI11. Acum. ...... .. .......I'i....................F;OJo . 0,034 3,4 1 3,4 0,138 13,8 5 17,2 0,415 41;5 1-7 58,7 0,310 31,0 26 89,7 0,103, __ .. _ ..... _.IO,} .__.__ 29 100,0 1,000 100,0 4 _REPRESENTACÕES GRÁFICAS DAS DISTRlllUlCÕES DE FREOUÊNCIAS o gráfico cstàtístico é uma forma de apresentação dos dados estatisticos, cujo objetivo é o de produzir, no investigador ou no público em geral, uma impressão rápida e viva do fenômeno em estudo, já que os gráficos falam mais rápidos que as séries ( tabelas ). Para tornarmos possível uma representação gráfica, estabelecemos uma correspondência entre os termos da série e determinada figura geométrica, de tal modo que cada elemento da série seja representado por uma figura proporcional. 15 - REQUISITOS A representação gráfica de um fcnômcno dcve ohcdcccr aos seguintcs rcquisitos primurdiais: Capilal Gráfico 2 O,Região Inlerior O.Região Gráfico] Interior Procedência dos Estudantes ele Calco Probo Estatística I Turno: Manhã, Turma: 04, Pcríodo: 97.] . Capital Procedência 30 lU 'õ c:c<ll :J t:r <Il Li: o 16 • GRÁFICO EM COLUNAS OU BARRAS - É a representação de uma série por meio dc retângulos, dispostos ho,oizontalrnente (em barras) ou vCloticalrncntc (cm colunas). Exemplo: Gráfico 1. • GRÁFICO POR SETORES - É o gráfico que representa as partes de um todo, por setores de um círculo, visando justamente comparar estas partes entre si e em relação ao todo. Excmplo: Gráfico 2. a) Simplicidade - indispensável devido à neccssidade de levar a uma rápida apreensão do scntido geral du fcnômcno aprcscntado a fim dc não 110S perdcrlllos na observação de minúcias de importância secundária. b) Clarcza - o gráfico deve possibilitar uma correta interpretação dos valores represcntativos do fcnômeno cm cstudo. c) Veroacidadc - indispensável qualqucr cOlllcntilrio, posto que, sc não reprcsenta uma realidade, o gráfico perdc sua linalidade. Variável Qualitativa" GRÁFICOS EM BARRAS OU COLUNAS, GRÁFICOS EM SETORES rDistribuição por Valores to) GRÁFICO EM COLUNAS (ou Bastão) Variável Quantitativa •• ~ . lDistribuição por Intervalos "') HISTOGRAMA, POLíGONO DE FREQUÊNClAS Os principais tipos de gráficos cstatísticos para as distribuiçõcs de frequências são os DIAGRAMAS, os quais são gráficos geométricos de, no máximo duas dimensões. Para sua construção, em geral, fazemos uso do sistema cartesiano. Dentre os principais tipos de diagramas destacamos, segundo a variável em estudo: c • POLÍGONO. DE FREQUÊNCIAS - É a representação gráfica de uma distribuição de frequências por meio de uma linha poligonal fechada ou polígono, cuja área total é igual a do histograma. Exemplo: Gráfico 4. • HISTOGRAMA _ É a representação grúlica de ullIa distrihuição de fj'equências de uma variável quantitativa (dados agrupados) por meio de retflngulos justapostos centrados nos pontos médios das classes e cujas áreas são propoll.:ionais ús li'clJuências das c1asscs. Exemplo: Grálico 3 17 Polígono de frequência r=.-::.::::::::::::: :=;':=':=:::t-:::::=:::=----~E..._.-....----- ~.,._....•.•~ --_ .........• --,,--.- t===.;~E~.------...E--.r.::::=::: --.:::--=...-=:-_ ..•.....•....•....•._ ...-- ..............•. _ ..-.. .::::=;===t::::::::::~:-:=' ~..__ ._- I •• ll ----------_ .•..._. Alturas dos estudantes de Calc. Probo Est I Turno: Manhã, Turma: 04, Período: 97.1 Alturas dos estudantes de Cale. Probo Estatística I Turno: Manhã, Turma: 04, Período: 97.1 =:,~E:;:::-==F.~=..::=:=:=:;t:-..::.:.::.:..:-==E:'=-=.::~-_.-=~ .._._..._ ..__~::-':::E:?:;:::::"::-:'E==.:: ---===- =r:: ...:~~:-:=t::~::~r.:::--~ ..=:"00;=:' 146,5 153,5 160,5 167,5 174,5 181,5 188,5 Altura 146,5153,5160.5 167,5174,5181,5188,5 Altura Gráfico 4: 14 Frequência 12 10 8 6 4 2 O Gráfico 3: F ~. 14. requenCla 12 10 8 6 4 2 O 18 1. MÉDIA ARITMÉTICA (ou simplesmente MÉDIA) 15 - MEDIDAS DE POSiÇÃO I Exemplo: Determinar a média do seguinte conjunto (amostra) de valores Xi: 3, 7,8, 10, I] ( Média populacional). Eg. (I) - LXX = --' (Média amostrai) Eq. (2) 11 :LX; J1=}j ou ou x= XI +X2 +"""+X" 11 XI + X2+. ..+X Nfl=----- N LX; _ 3+7+8 + 10+ 11 => X = 7,8Logo, X = -- - 5 11 Estes índices estatísticos são as MEDIDAS DE POSiÇÃO e, dentre as mais importantes, citamos as Mcdidas dc Tcndência Ccnh"al, que recebem tal denominação pelo fato dos dados observados tenderem, em geral, a se concentrar em torno de valores centrais. Dentre as medidas de tendência central, destacamos: • a Média aritmética ou Média; • :1 Mod:l; • a Mcdi:lna. Vimos anteriormente a sintetização dos dados sob a forma de tabelas, gráficos e distribuições de frequências. Aqui, vamos aprender o cálculo de medidas que possibilitem representar um conjunto de dados (valores de uma variável quantitativa, isto é, informações numéricas), relativos à observação de determinado fenômeno de forma reduzida. As outras medidas de posição são as SEIlARATRIZES, que englobam: • a própria I11cdian:l; • os q uar.tis; • os pCI'ccntis. Dcfinição 5.1: (a) Dada uma população constituída de N elementos, Xl, X2, ..., XN sua média, denotada por ~ , mede o valor médio do cOl~unto de dados, sendo expressa na mesma unidade, e definida por: (b) Dada uma amostra constítuída de n elementos, X" X2, ..., XIl , sua média,- . denotada X, será definida por: l ---- (c) MÉDIA ARITMÉTICA PARA DISTRIBUIÇÕES DE FREQUÊNCIA Seja um conjunto de dados ( uma amostra) constituída de 11 valores da variúvcl X, isto é, X Z, X2, ... , Xk ocorrendo com respectivas n.equênciasll' 12, ...,Ik de modo que ~fi". li . A média aritmética (ou simplesmente média) de X, dcnotada X, é definida por: - 2:X.X = I .r L.r ou simplcsmcnte -~; _ '" X . r../\ _ L-J 1.' li El). (J) onde "O~ ~/i é o IIÚlllCIOde dClllclllos do COlljlllllo. 013S.: A expressão acima é usada tanto no caso dc distrihui~:élo dc lIcquêlll.:ias por vallllcs, como para dados agrupados CllI dasscs. No scgulldo caso, os X 'i.••' rcprcsclltalllos pontos médios de classes. Exemplo: Determinar a média do scguinlc conjunto de valorcs, Xi: 2, 3, 8, 8, 5, 2, 2, 2, 8, 5, 3, 8, 2, 2, 5, 8, 2, 5, 8 e 2 Xi ti Xi*~ 2 8 16 3 2 6 5 4 20 8 6 48 L 20 90 Portanto, aplicando a Eq. (3), vem: - "X.fX = L. i.; 90 Li; = 20 => 11 = L/i = 20 x = -1,5 OB5.: A Equação (3) é uma adequação da equação (2) no caso de um conjunto de valores X' is com elementos repetidos. VANTAGENS E DESVANTAGENS DA MÉDIA 1. É uma medida de tendência central que por uniformizar os valores de um cOI~unto de dados, não representa bem os conjuntos que revelam tendências extremas. Ou seja, é grandemente influenciada pelos valores extremos (grandes) do COI~unto. 2. Não pode ser calculada para distribuições de frequências com limites indeterminados (indefinidos). 19 20 2. MODA 4. É facilmcntc calculávcl. Propriedades: Desprezando as classes aherlas, islo é, com limites indeterminadus, aí sim, poderi.1I110S calcular a rclc.ida lIIédia. NJ de /Jesso(JS ~ I 21 52 I XC> JX 2 JOO IJ.JAIJ/';S (AI/fJ.\) Mcnos dc 33 33 1------- 35 35 1------- 37 37 1------- 3<) 3<) 1------- 4 I 4 I 011 mais TolnJ ou L " 1 - A soma dos desvios tomados em relação à média é nula, isto é, L (X; - x) = O. ;~I 8. Dcpendc detodos os valores do cOltiunto de dados. 5. Pode ser tratada algebricamcnte (ver propricdadcs). 7. É particularmente indicada para séries (conjuntos) que possucm os valores simétricos cm relação a um valor médio e de frequência máxima. 6. Serve para compararmos cOI~untos semelhantes. 3. É o promédio mais cOllhccido e de lIIaior elllprego. Excmplo: Ú impossível calcular a IIIl~dia da dislribui(,:;'lo abaixo, reprcsclllaliva das id;l<les dc um grupo de 300 pessoas. 2 - Somando-se ou subtraindo-se uma constantc (c) a todos os valorcs de uma variável, a média do conjunto fica aumentada ou diminuída dessa constante, isto é, 1'; = Xi :t c=> Y = X :f: c . 3 - Multíplicando-sc ou dividindo-se todos os valores de lima variável por uma constante (c), a média do conjunto fica multiplicada ou dividida por essa constante, isto é, - - - - y = X * c => Y = X'" c ou Y = X -;-c => Y = X -;-c, I)ara c:;t:O.I I I , t Definição 5.2: Dado úm conjunto de valores, a moda, denotada A/o, é o valor que ocorre com maior frecjuência, ou seja, é o valor mais frequente do conjunto de dados. '-- _ CÁLCULO DA MODA PARA DADOS AGRUPADOS Exemplo: Determine a moda dos seguintes conjuntos de dados abaixo a) 2, 2, 3, 3, 5, 5, 8, 8 => Não existe moda. b) 2,2,3, 5,5,5,8,8 => }\.t/o = 5 c) 2,2,2, 3, 3, 5, 5, 5,8 => Mo = 2 e Alo = 5 (bimodal) ~ h1l0 = 12,' hmo = 7 21 ______________________________ 1 FÓRMULA de CZUBER (il1terpreta~~ão geométrica através de Histograma) Mo ~ L., +C" ~'l1J.".. onde: Lmo : limite inferior da classe modal hmo : amplitude da classe modal !J.l = [moda/ - [allterior !J.2 =hll(J(lal-fpo.'iterior Ll110 = 164 , Classes f' (unímodal) ~(C) f (b) Mo classe modal (não existe moda) f Classe modal (2a.) 164 1----- 171 , Exemplo: Utilizando os dados apresentados na tabela 1.4, determine a ALTURA MODAL dos 29 estudantes de Cálc~lo das. Probabilidades. e Estatística I - Turno: Manhã, Turma: 04, Período: 97.1 Em uma distribuição de frequências com dados agrupados em classes, denominamos classe modal à que possui a maior frequência, e, conseqüentemente, será esta classe que conterá a moda. (a) OBS.: i) A moda de um conjunto de dados pode não existir (figura (a) ) ii) A moda de um conjunto de dados pode não ser única (figura (c) ) f 3. MEDIANA VANTAGENS E DESVANTAGENS DA MODA Exemplos: 2. Não é influenciada por valores extremos (grandes) do cOI~unto de dados. se 11 for par. X +X 11 11 -+1 ]. 2 2 Me = XliiI se 11 for ímpar; 1 11+ 1 2 3. Pode ser calculada para distrtbuições com limites indetcrminados (indefinidos) na maioria dos casos. (8 + 9) .Me = -2- = 8,5 (Média aritmética dos termos de ordens centrais) 1. Não depende de todos os valores do conjunto de dados, podendo mesmo não se alterar com a modificação de alguns dcles. .11 = /'mx - fwll = 12 - 4 = 8; L1.z = /,IUX - ~}arJ = 12 - 9 = 3 Logo, Mo = 164+(_8_)*7 = 169,lcl1l ou Mo = 169cI11 8+3 Definição 5.3: Considere uma série (conjunto de dados) ordenada, constituído de li valores. A mediana, denotada Me , é o valor que divide o conjunto em duas partes iguais ( isto é, em duas partes de 50% cada). a) Calcular a mediana do seguinte conjunto de dados: 2, 3, 5, 8, 9, 11, 13 (n = 7 ímpar) Me = 8 (termo de ordem central) b) Calcular a mediana do seguínte cOI~unto de dados: 2, 3, 5, 8, 9, 11, 13, 15 (n = 8 par) Verificamos que, estando ordenados os valores de uma série (conjunto de dados) e sendo 11 o número de elementos da série, o valor mediano será: - o termo de ordem central 'd. . ,. d d d 11 11 hj- a me la antmetlca os termos e or em - e - + I , }\I e =2 2 22 '---------' b) Dados Agrupados em Clas.'.es a) Dados Não-agrllpados CÁLCULO DA MEDIANA NUMA DISTR.lI3UIÇÃO DE FREQUÊNCIAS 2] Md = 170clIlou F1lI1t = 5 Lme é o limite inferior da classe mediana; fme é a frcquência simples da classe mediana; Fali! é a frequência acumulada da classe anterior à classe mediana; hme é a amplitude da classe mediana; n é o total de observações. onde: classes hme=7 ; 50% ou nJ2 Md flfle = 12; 50% ou nJ2 ( 14,5-5J-Md == 164+ 12 *7 == 164+5,5 == 169,5cl1l [ li. J---i'2 flui Me = Ln,. + Ime • 17m• f => Lme = 164 ., 1';2 = 29/2 = 14,5 (50%) ==> Classe mediana (2à.) : 164 1----- 171 (Classe mediana: primeira classe que ultrapassar 50% (n/2) ou mais das observações) Exemplo: Determinar a ALTURA MEDIANA dos 29 estudantes da turma de Cal. Probo Est I, Turno: Manhã, Turma: 04, Período: 97.1 - Turno da tarde, conforme os dados agrupados na tabela 1.4 (estendida). Assim, para dados agrupados, a mediana é obtida através de interpolação de acordo eom a seguinte fórmula: No caso de dados agrupados, rc1embramos que uma distribuição de frequências pode ser representada por meio de um Histograma. Dizemos então que a mediana será o valor de X (abscissa) cuja ordenada divide a área total do Histograma em duas partes iguais. Neste caso, para a série de valores ordenados em ordem crescente de grandeza (i. e., em um rol), a mediana é o valor médio ou a média aritmética dos valores centrais, caso tenhamos um número ímpar ou par de valores na série. 24 2- A VARlÂNCIA 1 - A AMPLITUDE TOTAL PROPRIEDADES DA MEDIANA A variância de Um conjunto de dados ( amostra ou população) mede a variabilidade do conjunto em termos de desvios quadrados em relação à média aritmética do conjunto. É uma AT = Xn,A' - Xn"." onde X . = maior valor do conjunto e X. = menor valor dow.4 , nlQX nu" conjunto. Para representarmos cada conjunto, podemos calcular a sua respectiva média (Eq.( 1»,encontrando - - - - XA = XIJ = Xc = X D = 7. Vemos assim que apesar de constituidos de valores diferentes, os grupos revelam uma mesma média aritmética. Observando-os mais detalhadamente, notamos que em cada grupo os valores se distribuem diferentemente em relação à média 7. Necessitamos assim de uma medida estatística complementar para melhor caracterizar cada COI~unto apresentado. As medidas estatísticas responsáveis pela variação ou dispersão dos valores de um conjunto são as medidas de dispersão ou de variabilidade, onde se destacam a' amplitude total, a l'ar;âllcia, (} desl';o padrão e o coeficiente de l'ariaçáo. Em princípio, diremos que entre dois ou mais conjuntos de dados, o mais disperso ( ou menos homogêneo ) é aquele que tem a maior medida de dispersão. Medida já apresentada na elaboração de uma distribuição de frequências com dados agrupados em classes, denotamos AT. ~ Conjunto A => 7, 7, 7, 7, 7 Conjunto B ==> 5, 6, 7, 8, 9 Conjunto C ==> 4, 5, 7, 9, 10 Conjunto D ==> O, 5, 10, 10, la ii) A mediana de uma série de dados agrupados de classes extremas indefinidas pode ser calculada. i) A mediana não é influenciada por valores extremos (grandes) de uma série ou conjunto de dados. Na seção anterior, aprendemos a calcular e entender convenientemente as medidas de 'posição representativas de um determinado conjunto de dados, onde destacamos a média, a moda e a mediana. Sejam quatro conjuntos A, B, C e O com os seguintes valores: 16. MEDIDAS DE DISPEJ{SÃol 25 Definição 6.1: Analogamente, a definição apresentada na Equação (6), temos 013S.: No caso de dados ag.-upados os X'i.> são os pontos médios de classes. X= LX; 25 11 =5= 5onde onde fj: frequencias de classes e /1 = 2:f - LXEq (6) , onde X = --' é a média amostrai /1 Eq (5) , onde p = k_XI é a média populacional N Eq. ( 7 ) , S2 = L:(X; - xf 11- 1 (52 = L:(X/ -)Ir N L(X; - Xr ..1; /1- 1 S2 .2 (2_5)2 +(3_5)2 +(5_5)2 +(7_5)2 +(8_5)2 .5 =--------------5-1 CÁLCULO DA VARIÂNCIA EM UMA DISTRIBUIÇÃO DE FREQUÊNCIAS ( Caso de amostra) Exemplo 2: petermine a variância do seguinte conjunto (amostra) Xi : 2, 3, 5, 7, 8 . S'2 _ (_3)2 +(_2)2 +(0)2 +(2)2 +(3)2= 9+4+0+4 +9 = 26 ==> S2 = 6,5 .. - 4 4 4 De acordo com a equação (6)temos: OBS.: A equação (6) é utilizada quando -nosso interesse não se restringe à descrição dos dados mas, partindo da amostra, visamos tirar inferências válidas para sua respectiva população. No caso de estarmos interessados apenas na descrição dos dados, podemos usar no divisor "em lugar de " - J b) Seja um conjunto ( amostra ) constituído de Il elementos X I, X2, ... , Xn. Sua variância, denotada S2, é definida por: a) Seja um conjunto ( população) constituído de N elementos XI, X2 .... , XN Sua variância denotada cl, é definida por: _quantidade sempre não negativa e expressa em unidades quadradas do conjunto de dados, sendo de dificil interpretação. " 26 Do exemplo 2 , dado acima, temos o desvio padrão dado por S = J6:5 =:;===> S = 2,55 Desvio Padrão ==> S = ~Variâl1cia = ~45,86cm2 = 6,77cl1l L(Xj -xf /1-1 Eq. ( 8 ) Amostra =--> S =' ( Raiz quadrada positiva da Variância ) L 2 (L )2/1 X'. - .S2 = ,.1; Xj .1; 1/ x (/1-1)ou ALTURAS No. Est P. Médio Xl X. I; X2. t:J ., (cm) J ' • I fi Xi 150 1---- 157 1 153,5 23562,25 153,5 23562,5 1571---- 164 4 ]60,5 25760,25 642 10304] ,0 ]64 1---- I 71 ]2 167,5 28056,25 2010 336675,0 171 T---- 178 9 174,5 30450,25 1570,5 274052,25 ]781---- 185 3 18],5 32942,25 544,5 98826,75 Total ou L; 29 4920,5 836157,5 População =->cr =.tI L(X; - PY . V N Desvio Padrão = + .JVaric.í/1cia s' = LX,' -i. - (LX, -f.)' /1 /1-1 Exemplo 3: Calcular a variância e o desvio padrão para a distribuição de frequências das ALTURAS dos 29 estudantes de Cálculo das Probabilidades e Estatistica I - Turno: Manhã, Turma: 04, Período: 97.1. â Portanto, a variância das alturas será: S2 = 45,86cm2 Conforme, o conjunto de dados, trate-se de uma população ou uma amostra, teremos o desvio padrão dado por: Variância . 2 11'L;X.2*.f. -t[.X/.fi)2 29*836157,25-(4920,5)2 _ 37239,95 _ 4586.S I I ----------_ _, ==> = 11*(11-]) - 29*28 812 3 - O DESVIO PADRÃo É urna outra medida de dispersão mais comumente empregada do que a variância, por ser expresso na mesma unidade do conjunto de dados. Mede a "DISPERSÃO ABSOLUTA" de um conjunto de valores e é obtida a partir da variància. FÓRMULA ALTERNATIVA derivada da Equação ( 7 ) : 27 Desvio Padrão ===> .\'= 6,77c11le o S 6,77cl11Cv == x 100 = ---- x 100 = 3 99 ou seja. CV = 3 99% X I69,67cm " .. ' 1. Costa Neto, P.L.O. Estatística. Editora Edgar Dlucher. 2. Mendenhall, W. Probabilidade e E'sta/Íslica. Editora Campus, VaI. I e 11. 7. REFERÊNCIAS BIBLIOGRÁFICAS Altura média => X = 169 67cm . ' Da distribuição das alturas, (tabela 1.4), temos: Exemplo 4: Calcule o coeficiente de variação (dispersão relativa) das ALTURAS dos 29 estudantes da Turma 04 - Turno da Manhã de Calc. Probo Est 1 - Período: 97.1 - Tabela 1.4 É uma quantidade adimensional e selVe para comparar dois ou mais conjuntos de dados de unidades diferentes. Mede a "DISPERSÃO RELATIVA" de um conjunto de dados. É expresso, usualmente, em percentagem (% ). (Y População ====> CV = - x 100, sendo que ~l :j:; O11 . S Amostra => CV = = x 100, sendo que X =f:. O. X 4 - O COEFICiENTE DE VARIAÇÃO ••••••••••••••••••••••••••••••••••••••••••••••••• 11.INTRODUCÃO I o objetivo básico da teoria das probabilidades é criar um modelo teórico que represente estes experimentos. As principais características de um experimento aleatório são: a) Pode-se repetir indefinidamente sob as mesmas condições. b) Pode-se descrever todos os possíveis resultados do experimento. c) Depois de um grande número de repetições do experimento, surge uma configuração definida ou uma regularidade. É esta regularidade que torna possível construir um modelo matemático preciso, com o qual se analisará o experimento. 1. Jogar um dado e observar o número mostrado na face de cima. 2. Jogar uma moeda duas vezes e observar a sequência de caras e coroas obtidas. 3. Jogar uma moeda duas vezes e observar o número de caras obtidas. 4. Peças são produzidas até que 10 peças perfeitas sejam produzidas. O número total de peças fabricadas é contado. 5. Uma lâmpada é fabricada e em seguida é ensaida quanto à duração de vida, pela colocação em um soquete. O tempo decorrido (em horas) até queimar é anotado. ~ 28 EXEMPLOS: o cálculo das probabilidades pertence ao campo da Matemática. Sua inclusão, neste curso, cujo objetivo é essencialmente a Estatística, encontra explicação no fato de que a maioria dos fenômenos de que trata a Estatística é de natureza aleatória ou. não- determinística. Consequentemente, o conhecimento dos aspectos mais fundamentais do cálculo da probabilidades é uma necessidade essencial para o estudo da Estatística Inferencial ou Indutiva. Vamos examinar, inicialmente, o que se pode adequadamente denominar modelo determinístico. Por essa expressão pretendemos nos referir a um modelo que estipule as condições sob as quais um experimento é executado delerminem exatamente; ou com um erro que pode ser considerado desprezível, o seu resultado. Por exemplo, se introduzirmos uma bateria em um circuito simples, o modelo matemático que descreveria o Ouxo de corrente elétrica seria I = E/R, isto é, a Lei de Ohm. O modelo determina com exatidão o valor de I ao fornecermos os valores de E eR, diferença de potencial e resistência, respectivamente. Para um grande número. de situações, o modelo matemático determinístico apresentado acima é suficiente. Contudo, existem também muitos fenômenos que requerem um modelo matemático diferente para sua investigação. Existem experimentos em que, mesmo considerando todos os fatores que influenciam no resultado, existe algum fator casual que não consegue-se controlar. Tais experimentos são, frequentemente, denominados não-determinísticos ou aleatórios. De fato, estamos falando de um modelo não-determinístico para um experimento. UN1DADEll- INTRODUÇÃO À PIlOBABILIDADE E3 ~ .03= {O,1,2} E4 ~ .04= {IO,11,12, .... } Es ~ .os = {t E ~H/ t ~O) EXEMPLO 2.1: Determine os espaços amostrais associados aos cxperimentos dos excmplos anteriores. A partir das operações entre cOI~untos (Apêndice A) podemos formar novos eventos, tais como: 12. ESPAÇO AMOSTRALEEVENTOS I Definiremos e.\paço amostraI, para cada experimento aleatório E, como o conjunto de todos os possíveis resultados do experimento, e o denotaremos porO. A uB é o evento que ocorrerá se e somente se A ou B ou ambos ocorrerem. A (1B é o evento que ocorrerá se e somente se A .£. B ocorrerem simultancamcntc. A ocorrerá se e somente se não ocorrer A. A - B ocorrerá se.e somente se ocorrer A e não ocorrer n. Definição 2.1: E1 ~ .o) = {I ,2,3,4,5,6} £2 ~ .02 = {(Ca,Ca), (Ca,Co), (Co,Ca), (Co,Co)}, onde Ca c Co reprcsentam a ocorrência de cara e coroa, respectivamente. SOLUÇÃO: A fim de descrever um espaço amostrai associado a um experimento, devemos ter bastante claro o que estamos mensurando ou observando. Por isso, devemos falar de "um" espaço amostrai e não de "o",espaço amostraI. Vcja a diferença entre .o2e fh Saliente-se, também, que o rcsultado de um cxperimcnto não é nccessariamente, um número. Por exemplo, em E2, cada resultado é.um sequência de Caras (Ca) e Coroas (Co). Definição 2.2: Um evento A (relativo a um particular espaço amostrai .o, associado a um experimento E) é um conjunto de resultados do experimento, isto é, qualquer subconjunto do espaço amostrai é um evento. Diz-se que "ocorre o evento A", quando o resultado do experimeno aleatório for um elemento de A. Em particular, o conjunto universo, .o, e o conjunto vazio, ~, são também eventos, onde .o é denominado de evento certo e q, evento impossível. Se A contém apenas um elemento, dizemos que A é um evento elementar ou simples. * * * * Definição 2.3: Dois eventos A e B, são ditos mutuamente excludentes (M.E.), se elesnão puderem ocorrer simultaneamente, isto é, A (1B = ljJ . 29 , EXEMPLO 2.2: Lançar um dado e observar a face voltada para Cima. Considere os seguintes cventos: Obs: Note que o item c) exemplifica as leis de "De Morgan". (ver Apêndice A) a) n= {1,2,3,4,5,6}, A = {2,4,6}, B = {l,3,5}, C = {5,6}, 0= {l,2} 30 AnD=(2} BnD={I} . . J d) A n C = {6} : cvcnto elcmentar BnC= {5} CnD=<I> Os eventos A e B, assim como os eventos C e O, são mutuamente excludentes. c) A = {l,3,5} B = 12,4,6} - - --AuB = {1,2,3,4,5,6} =.Q= AnB - - -- AnB =<1>= AuIJ b) A u B = {1,2,3,4,5,6} = n :é o evento certo A n B = <I>: é o evento impossível AuB =<1> AnB=n SOLUÇÃO: Determine os eventos: . a) n, A, B, C e D. b) A u B, A n B, A u 13, A n B - - - - - - c) A, B, A u B, A n H d) Quais os eventos mutuamentc excludentes? A: o número é par. B: o número é impar. C: o número é maior que 4. D: o número é menor ou igual a 2. 31 Portanto, P( 4» = O 3. NOCÕESFUNDAMENTAJSDE rl{OBAllILlDADE PROPRIEDADES FUNDAMENTAIS <fi=AnA A n<p=~ e e D.=AuA A=Au~ Propriedade 3.2: Se A for o evcnto complcmcntar dc A, cntão P(A) = I - P(A). P(A) = P(A u<fi) = P(A) + P(<fi), logo P(A) = P(A) + P(~) Então, A e 4> são eventos mutuamente cxcludentes. De 3. temos Então, A c A são eventos mutuamente excludcntes. De 3. tcmos p(n)=p(Au A) = P(A) + P( A ). De 2. Temos Demonstração: Para qualquer evento A, sabemos que Propriedade j.1: Se ~ for o cOI~unto vazio, então P(4,)=O. '" P(u: 1 AJ = P(A,) + P(Az )+ ... +P(A,,)+ ... =L P(A;) kl Demonstração: Para qualquer evento A, sabemos que Por enquanto, não sabemos como calcular P(A). Nós apenas arrolamos algumas propriedades gerais que P(A) possui. Vamos, inicialmente, enunciar e demonstrar algumas consequências relacionadas a P(A) que decorrem das condições acima e que não dependem da maneira pela qual nós reâlmente calculamos P(A). Definição 3.1: Seja E um experimento e D. um espaço amostrai associado a E. Probabilidade é uma função P que associa a cada evento A E F(D.) a um número real representada por P(A) e denominada probabilidade do evento A, satisfazendo aos seguintes axiomas: 1. O::;;P(A) ::;;1. 2. P(D.) = 1. .3. Se A e B forem evento.s mutuamente excludentes, P(A u 13)= P(A) + P(B) Se AI, A2, ... , An, ••. forem, dois a dois, eventos mutuamente excludentes, então, 1 = P(A) + P( A) . Logo, P(A) = 1- P(A). Propriedade 3.3:Se A e B forem eventos quaisquer tais que A c B então P(A) ~ P(B). Demollstração: Sabemos que B = A u (B nA) , onde A e (8 nA) são eventos mutuamente excludentes. Consequentemente, P(B) = P(A) + P(B nA) ~ P(A), porque P(B nA) ;::O, pelo axioma 1. Propriedade 3.4: Se 'A e B são dois eventos quaisquer, então P(A u B) = P(A) + P(B) - P(A n B) Denumstração: Podemos escrever A u B = A u (Bn A) , onde A e (B nA) são eventos mutuamente excludentes e - -B = (A n B) u (B nA), onde (A tl B) e (B nA) são eventos mutuamente excludentes Do axioma 3. temos, P(A u B) = P(A) + P(B nA) e- - P(B) = P(A n B) + P(B nA). Assim, P(B nA) = P(I3) - P(A tl B) Então, P(A u B) = P(A) + P(B) - P(A n I3) Como exercício pode-se facilmente provar a propriedade acima para três eventos. Se A, B e C são três eventos quaisquer, então P(A uB uC) = P(A) + P(B) + P(C) - P(A nI3) - P(A nC) - P(B nC) + P(A nBne) 4.PROBABJLIDADE EM 'ESPAÇOS AMOSTRAIS FINITOS EEQUIPROVÁ VEIS Definição 4.1:Seja .n um espaço amostrai associado a um experimento aleatório E com um número finito de resultados possiveis, Então, .n pode ser escrito da seguinte forma:-, .n = {a\,a2,...,a ll } e seja Ai = {ad i=I,2, ...,n todos os eventos elementares de Q. A cada evento elementar {ai} associaremos um número pi, denominado de probabilidade de {ai}, que satisfaça às seguintes condições: ]2 ----, f I 1. Pi ~ o, i= 1,2, ... , n. 2. PI + P2+ ... + p" = I Como {ad é um evento, essas condições são coerentes com aquelas postuladas para as probabilidades dos eventos em geral, isto é, com os axiomas da definição 3.1. Suponha, agora, que um evento I3 seja constituído de k resultados, I S; k S; n, a saber, B= {a l,a2, ... ,al;}, onde 1,2, ... ,k representam qualquer dos k índices, de I até n. Consequentemente, conclui-se do axioma 3 da definição de probabilidade (3. I) que P(B) = 1'1 -I- Pl + ... + 1'1; EXEMPLO 4.1: Três cavalos, A, I3 e C, estão numa corrida; A é duas vezes mais provável de ganhar que B e I3 é duas vezes mais do que C. Quais são as probabilidades de vitória de cada um, isto é, P(A), P(B) e P(C) ? SOLUÇÃO: Seja P(C) = P; como B é duas vezes mais provável de ganhar do que C, P(B)=2p; e como A é duas vezes mais provável do que B, P(A) = 2P(B) = .2(2p) = 4p. Como a soma das probabilidades tem que ser I; então p+2p-l-4p=1 ou 7p=1 ou 1'=1/7. Logo, P(A) = 4/7; P(B) = 2/7 e P(C) = 1/7 Pergunta: Qual é a probabilidade de que B ou C ganhe? Por definição, P(B uC) = P(B) + P(C) = 2/7 + 1/7 = 3/7 Definição 4.2: Seja um espaço amostrai .o. = {a\,a2,... ,an} associado a um experimento E e consideremos Ai = {ad i= I ,2, ... ,n os eventos elementares de .0.. O espaço amostrai .o. é dito equiprováve! se P(Ai) = p, i= 1,2, ... , n, ou seja, se todos os eventos elementares são igualmente prováveis. Consequentemente, das condições 1. e 2. da definição 4.1, vem: 1. pi=P~O, i=1,2, ... ,n. 2. Pi + P2 + ... + pn':: P + P + ... + p = 1 De 2. tem-se que np = 1 e consequentemcnte, p = 1/n. 33 IS.PROBABILlDADECONDICIONADA I 34 Um lote é formado pelos seguintes artigos: 80 não defeituosos e 20 defeituosos. Dois artigos são retirados do lote. Sejam A= {o 10 artigo é defeituoso} e B={o 2° artigo é defeituoso}. Calcule P(A) e 1'(13),a) com reposição; b) scm reposição. Estl? ex.emplo mostra a necessiuade de se introduzir o seguinte conceito. P(A n B) = /I'" defigllras de e.\]Jadas 3 lI'"~de carlas = 52 /lO'de fi~lIras 12. 3 P(B) = . < =-=- 11'" de cartas 52 13 /10' de e.\fJadas 13 I P(A)=----=-=- /10' de carlas 52 4 Disto decorre que, para qualquer evento B formado de k resultados, I~ k ~ 11, tem-se Logo, se o espaço amostrai é equiprovávcl, a probabilidade de cada um dos pontos é Sejam A e B dois eventos associados ao experimento E. Denotaremos por P(BI A) a probabilidade condicionada do evento B, qua/ldo A tiver ocorrido. b) Se estivermos extraindo sem reposição, é ainda verdade que P(A) =X. Mas e sobre P(B)? É evidente que, a fim de calcularmos P(B) é necessário conhecer a composição do lote no momento de se extrair a segunda peça. Isto é, devemos saber se A ocorreu ou nao. a) Se extrairmos com reposição, P(A) = PC}]) = 29{00 =X, pois cada vez que estivermos extraindo do lote, existirão 20 peças defeituosas no total de 100. SOLUÇÃO: EXEMPLO 5.1: SOLUÇÃO: Como temos um espaço cquiprovável, EXEM PLO 4.2: Selecione aleatoriamente uma carta de um baralho comum de 52 cartas. Sejam A: a carta é uma espada e B: a carta é uma figura. Calcule P(A), P(B) e P(A n 13) k . l1(lJ) n°' de casos favoravcis P(B) = -, ou seja, P(B) =--= . . 11 /1(0) n°' de casos pOSSlvels 1/n. 35 Obsen'ações: Se fizermos um exame cuidadoso dos vários números calculados, concluiremos que 1. Se P(B) = O, nada podemos afirmar a respeito da probabilidade condicional. n(A n B) = 1 A n 13={(6,4)}c P(A / 13) = f}(A n B) P(B) n(B) = 15 e B= {(2, 1),(3, I),(3,2), ... ,(6,5)} P(B / A)= P(A nB) . P(A) n(A) = 3 (6,1), (6,2), ... , (6,6) A= {(5,5),( 4,6),(6,4)}, 3 15 I Portanto, P(A)=-, P(B)=-, P(AnH)=-, 36 36 36 P(B I A) =..!., uma vez que o espaço amostrai é, agora, formado por A. 3 De modo equivalente, ternos P( A / B) = _1 . 15 Sempre que calcularmos P(I3/A), estaremos essencialmente calculando P(B) em relação ao espaço amoslral reduzido A, em lugar de fazê-lo em relação ao espaçooriginal n. (1,1),(1,2), , (1,6), (2,1), (2,2), , (2 :6), .o = ~. . ~, 11(.0)=36,..................... . SOLUÇÃO: O espaço amostraI .o pode ser representado pela seguinte lista de 36 resultados igualmente prováveis. EXEMPLO 5.2: Dois dados honestos são lançados, registrando-se o resultado como (XI,X2), onde Xi é o resultado do i-ésimo dado, i=1,2. Considere os seguintes eventos: A={(xI,xz)/ XI + X2= lO} e 13={(xl,x2)1 XI> X2}. Determine: P(A), P(B), P(A n B), P(B/A) e I>(NB). Essas relações não surgiram apenas neste caso particular. Ao contrário, são bastante gerais, e nos dão caminho para definir a probabilidade condicionada. Defi"ição 5.1: Sejam A e B dois eventos quaisquer de um mesmo espaço amostrai Q. Chamamos probabilidade do evento A, dado que o evento 13 ocorreu, ao seguinte quociente: P(A / li) = _P_(A_n_IJ_) se P(B) > O P(J-J) , Obsen'ação: O teorema da multiplicação de probabilidades pode ser generalizado para mais de dois eventos. A mais importante consequência da definição de probabilidade condicional acima, é o seguinte teorema. Sejam AI, A2, .•• , Ao eventos quaisquer de um mesmo espaço amostrai 0., a probabilidade da ocorrência simultânea de AI, A2, .•. , Ao é dada por: SOLUÇÃO: Considerando-se somente o espaço amostrai reduzido N (isto é, as 7 máquinas novas), temos P(M / N) = 4 / 7. Empregando a definição de probabilidade condicional, temos ](, P(A n H) = P(A)* P(lJ / A) I/(A n H)/ l'(A / H) = In(D.) _ n(A n H) 1/( H)/ - n(/1) /1/(0.) ou Mãe uinas Tempo de uso M E Total N 4 3 7 lJ 2 I 3 Total 6 4 10 P(M / N) = P(M n N) = 4/ 10_ 4 P(N) 7 /l0-7 P(AI n A2 n...n An) = P(AI)*P(A2/At)* ...*P(A,,/At n A2 (\ ... (\ Ao-I) Sejam A e B dois eventos quaisquer de um mesmo espaço amostrai .o, então: P(A n B) = P(B)* P(A / B) Teorema 5.1 (Teorema da Multiplicação de Probabilidade.\): EXEMPLO 5.3: Um laboratório de pesquisa possui 10 terminais dé computadores. Algumas dessas máquinas são micro-computadores (M) e outras são estações de trabalho (E); algumas são novas (N) enquanto outras são muito usadas (U), de acordo com a tabela abaixo. Uma pessoa entra no laboratório, pega uma 'máquina ao acaso, e descobre que é nova. Qual a probabilidade de que seja um micro-computador? 3. No espaço amostrai finito equiprovável, . . P(t/J) 2. Se A e B forem mutuamcntc excludentcs, cntão P(A / H) = -- = O.P(H) ~ SOLUÇÃO: Seja Ai: a i-ésima lâmpada é boa, então Pelo teorema da multiplicação de probabilidades, temos SOLUÇÃO: Comojá vimos P(A) =~. Logo, pela propriedade 3.2, temos que F(A) =~.5 . 5 EXEMI)LO 5.5: Voltando ao exemplo 5.1, calcule a P(U) se as retiradas dos artigos são feitas sem reposição. P(A) = P(A íl B1) + P(A n B2) + ." + P(A n Bk). P(A) = P(N B1)P(31) + P(N B2)P(B2) + ...+ £l(AI 3k)P(Uk) - - 19 1 20 4 1 P(Bp= P(B / A)P(A) + P(/J / A)P(A) = -*- +-*- = -. :: 99 5 99 5 5 Agora, P(B / A) = ~, porque se A tiver ocorrido, então na segunda extração 99 restarão somente 99 peças, das quais 19 delas serão defeituosas. De modo similar, temos que P(JJ / A) = 20 . Pelo teorema da probabilidade total, temos 99 4 3 2 I P(A1 n A2 n A3) = P(A1)*P(A2/A1)*P(A"/A1 nA2) = - * - * - = -.6 5 4 5 k P(A) =.P(N B1)P(BJ) + P(AI B2)P(132) + ... + P(AI UdP(Bd = L P(A / H; )P(Hj);=. 37 Demonstração: Como A = (A íl B1) u (A n B2) u u (A íl Bk) e (A nB.), (A íl B2), ... , (A n I3k) são eventos mutuall'n"fn " r-I"ri,-.'ltes,temos Teorema 5.2 (Teorema da Probabilidade Total):Sejam A um evento qualquer do espaço amostraI n e BI, B2, ... , Bk uma partição do mesmo espaço amostrai n, então: Até aqui, empregamos o conceito de probabilidade condicional a lim de avaliar a probabilidade de ocorrência conjunta de dois ou mais eventos. Veremos, no próximo teorema, como aplicar esse conceito para calcular, de outra maneira, ti probabilidade de um evento qualquer A. EXEMPLO 5.4: Uma caixa contém 4 lâmpadas boas e 2 queimadas. Retira-se ao acaso 3 . . lâmpadas, sem reposição. Calcule a probabilidade dessas 3 lâmpadas serem boas. Pelo enunciado do problema, temos que P(D/A) = P(DIB) = 0,02, enquanto P(D/C) = 0,04. Levando-se esses valores à expressão acima, encontraremos SOLUÇÃO: Seja os eventos A={a peça provém da fábrica A}, B={a peça provém da fábrica B}, C= {a peça provém da fábrica C} e D= {a peça é defeituosa} . 16• TEOREMADEBAYES I Como queremos determinar P(D) e os eventos A, B e C formam uma partição do espaço amostraI, podemos aplicar o teorema da probabilidade total, o qual escreveremos como 38 , i = 1,2, ... , k 1 1 1 P(D) = O 02* - + O 02* - + O 04* - == O 025, 2' 4' 4' P(D) = P(D/A)P(A) + P(D/B)P(B) + P(D/C)P(C). PC A I Ri) PC Bi ) P(B; I A) = 'L:=1 P(A / B)P(B) Temos que P(A)=2P(B), e P(B)=P(C). Substituindo essas relações em P(A)+P(B)+P(C)=l, temos que 2P(B)+P(il)+P(B) = 1, logo, . P(B)=P(C)= 1/4, enqualito que 1'(1\) = 1/2. Poderemos calcular esta probabilidade pelo seguinte teorema. Teorema 6.1 (Teorema de Bayes): Sejam BI, B2, ... , Bk uma partição do espaço amostrai n e A um evento qualquer associado a .Q , então: Poderemos empregar o Exemplo 5.6 para sugerir outro importante resultado. Suponha-se que uma peça seja retirada do depósito e se verifique ser ela defeituosa. Qual a probabilidade de que tenha sido produzida na fábrica A ? EXEMPLO 5.6: Uma determinada peça é manufatura por três fábricas, digamos A, B e C. Sabe-se que A. produz o dobro de peças que 13, e que fi e C produzem o mesmo número de peças. Sabe-se também que 2% de peças produzidas por A assim como por fi são defeituosas, enquanto que 4% daquelas produzidas por C são defeituosas. Todas as peças são colocadas em um depósito, e depois uma peça é extraída ao acaso. Qual a probabilidade de que essa peça seja defeituosa? SOLUÇÃO: Sejam A={estudantes de menos de 1,60m. de altura} k Pelo teorema da probabilidade total, P (A)= LP (A / B) P (B ) . Logo,./ ./ ./=\ EXEMPLO 6.1:Voltando ao problema proposto acima, e agora aplicando o teorema 6.1, obtcmos . 17• EVENTOS INDEPENDENTES I P(A () B) = P(A) * P(B/A) = P(A) * P(B) P(B j / A) = I'(A / U; )I'(IJ,)'Ll P(A / J3)P(J-') , i = 1,2, ... ,k }=1 ./) j P(B; / A) = P(H; () A) ~ P(A / R, )P(H,) . .P ( A ) P ( A ) , I = 1,2, ... , k M={ estudantes do sexo feminino} e H={ estudantcs do sexo masculino}. P(A / D) = (0,02)* (I /2) = 040 (0,02)* (1/2) + (0,02)* (1 / 4) + (0,04)* (1/4) , Podemos, então, formaliz,ar a seguinte definição. Pelo Teorema de Multiplicação de Probabilidades, temos: 39 Consideremos dois eventos A e B quaisquer de um mesmo espaço amostrai O. Dizemos que A e B são dois eventos independentes se a probabilidade de ocorrência do evento A não altera a probabilidade de ocorrência do evento B, isto é, P(B) = P(B/A). P H / A = I'(A / II)I'(I/) = _ (0,01)*(0.(,0) = ~ ( ) P(A / H)P(H) + P(A / M)P(M) (0,01)* (0,60) + (0,04)* (0,40) 1i Pelo teorema de Baycs, EXEMPLO 6.2: Numa certa turma, 1% dos homcns e 4% das mulheres têm menos que 1,60m. de altura. Além disso, 60% dos estudantes são homens. Ora, se um estudante é selecionado aleatoriamente e tem menos que 1,60m. de altura, qual é a probabilidade do estudante ser um homem? 1JemOltstraçâ(}: 40 Podemos estender este conceito para 11 eventos. Determine P(A), P(B), P(A n 13), P(A/13) e P(131A). Ob.~en'ação:No caso de n eventos tcrÍamos 2" - li -I relaçõcs a serem verificadas. { (2,1), (2,2),"', (2,6)} A= (4,1),(4,2), ... ,(4,6) , (6,1), (6,2),.':, (6,6) P(A nH) =~=2=p(lJ) P(JJ I A) = P(A) l/2 3c (1,1), (1,2), .. ', (1,6), 1 (2,1), (2,2),.", (2,6), . . J '...................... . (6,1), (6,2),'.', (6,6) .0= P(A I B) = P(A nB) _ 1I 6 1P(B) --=-= P(A)1/3 2 ' P(A nA.) = P(A )* f)(A ) i :t:. 1°= 1 2 .,. n , J ' J ' • ", P(A; nA J n Ak ) = P(A;)* I)(A J)* P(Ak), j:t:..i:t:. k = 1,2,... ,1/ Definição7.2: Sejam AI, A2, ... , Ali, n evenlos de um mesmo espaço amostrai .o. Dizemos que AI, A2,... , Ali são eventos illdependentes, se: A={o primeiro dado mostra um número par}, B= {o segundo dado mostra um 5 oU um 6} . B= {(I,5), (2,5),'" (6,5) } e A n IJ = {(2,5), (2,6), (4,5), (4,6), (6,5), (6,6)} .. (1,6), (2,6),. .. , (6,6) ... J " P(A. nA .n ...nA ) = n P(A) I ". J " , . ;=1 Consequentemcnte, _ 18 1 12 1 . 6 1 Entao P(A) = - = - PC/)~ = - = - enquanto P(A n13)= - = - . , 36 2' 36 3' 36 6 SOLUÇÃO: Temos o seguinte espaço amostrai, Consequentemente, P(NB) = P(A) e P(B/A) = P(B), se P(A) e P(B) são não-nulos. EXEMPLO 7.1: Suponha que um dado equilibrado seja jogado duas vezes. Definamos os eventos A e B, da seguinte forma: Definição 7.1: Dois eventos A e B são il1depel1dentes se e somente se P(A nB)= P(A)*P(Il) 41 8. REFERÊNCIAS DIBLIOGRÁFICAS Determine 1'(A), 1'(B), 1'(C), 1'(A (l B), P(A (l C), 1'(B (1C) c P(A (l B (l C). 2. Lipschutz, S. (1972). Prohahilidade. Editora I\!IcGraw Ilill do 13rasil Ltda. e C= {(Ca,Co ),(Co,Ca)}e I' P(A n/J)= P({Ca,Cil})=~, 4 /)(IJ (l C) = /)( {Cu, C£l}) = ~ 4 c B= {(Ca,Ca),(Co,Ca)} C C",. IP(A(l .)=P({.£l,CO})=-, 4 P(A (l B (l C) = P(ljJ) = O:t: P(A)* P(B)* P(C) Este exemplo mostra que os eventos são dois a dois independentes, mas os três eventos não são independentes. 1. Meyer, r.L. (1984). Probabilidade: aplicaçi'Jes à estatística. Livros Técnicos Científicos Editora S.A. 2 I Logo, P(A) = P(H) = P(C) = 4' ="2 A={(Ca,Ca),(Ca,Co) }, SOLUÇÃO: Temos o seguinte espaço amostraI, n = {(Ca,Ca),(Ca,Co),(Co,Ca),(Co,Co)}, onde Ca é cara c Co é coroa, então EXEMPLO '7.2: Suponha que um par de moedas não viciadas seja jogada. Definamos os eventos: A= {cara na primeira moeda l, B= {cara na segunda moeda} e C= {cara em exatamente uma moeda} . L 42 APÊNDICEA :'ALGUMAS NOÇÕES DA TEORIA DOS CONJUNTOS BA 2. Interseção: A n B = {x: x E A e x E B} É o conjunto dos elementos que pertencem simultaneamente a A e a B. 1. União: A uB ={x: x E A 011 X E B}. É o conjunto dos elementos que pertencem a A ou a B (}II a ambos. Consideremos, agora, a importância de combinar conjuntos a fim de formar novos conjuntos. No que segue, consideramos A e.B dois conjuntos arbitrários. Um C()/~ill11to é uma colcção de objetos. Gcralmcntc os conjuntos são reprcscntados por letras maiúscula: A, B, .... Os objetos que formam o conjunto A são denominados elementos de A. Quando a for um elemento de A denotaremos a E A c quando a não for um elemento de A escrevemos a ~ A. Definiremos o conjunto vazio como sendo o conjunto que não contenha qualquer elemento e o conjunto universal como aquele que é formado por todos os objetos que estejam em estudo. A partir do conjunto vazio (~) e do conjunto universal (U), podemos enumerar as duas seguintes propriedades: • 1. <p c A, para qualquer A. 2. A c U, desde que já se tenha definido o conjunto universal. Este apêndice apresenta alguns conceitos elementares da Teoria dos Conjuntos que são fundamentais à Teoria das Probabilidades. f 3. Complementação: Sejam A e B dois conjuntos tais que A c B, A = {x: x fi A e x E B I. A EXEMPLO: Seja U = { 1,2,3,4,5,6}, A = { 1,2,3}, B = { 2,3,4}. Então, A = {4,5,6},AuB= (l,2,3,4) e Anl3= {2,3) Enunciaremos abaixo algumas propriedades importantes: Sejam A, B e C três conjuntos quaisquer. 1. ldcmpotência: A u A = A ~ A n A = A. 2. Comutativa: A u B = B u A ~ A n B = B n A. 3. Associativa: A n (B n C) = (A n B) n C ~ A u (B u C) = (A u B) u C. 4. Distributiva: A u (B n C) = (A u B) n (A u C) ~ A n (B u C) = (A n B) u (A n C). 5. Absorção: A u (A n B) = A ~ A n (A u 13)= A. 6. Identidade: A nU = A~ A n cP= cP~ A u U = U~ A u cP= A.- - - - 7. Complementar: U = ifJ; r/J= (j ; A n A = ifJ; A u A = U . 8. Leis da dualidade ou Leis de "De Morgan": (An li) = (A v B) ~ (AvH)=(AnB). A partir dessas identidades podemos enunciar as seguintes definições. 1Jefinição A.I: Dá-se o nome de CUl~iulIl() das classes de A, e denota-se por F(A), à classe de todos os possivcis subconjuntos de A. Para efcito de exemplo, considerc A = {a,b,c}, então F(A) ={cP, {a}, {b}, {c}, {a,b}, {a,c}, {b,c}, {a,b,c}=A} Em geral, se A é finito c tem 11 elemcntos, então F(A) tcm 2/1clementos. 1Jefinição A.2: Uma partição de um conjunto A é uma subdivisão de A cm subconjuntos Ai, i=1,2, ...n, tal que: 1. A;:j:. ifJ, Vi = 1,2, ... , 11 2. Ai n Ai = ifJ, Vi:j:. j /I 3. UA; =A ;=\ 43 EXEMPLO: Seja A = {a,b,c}, então . AI = {a} e A2 = {b,c} representam uma partição, enquanto que AI = {a}, A2 = {a,b} e A3 = {b} não representaria. APÊNDICE B- TÉCNICAS DE CONTAGEJtf Nem sempre é possível enumerar de forma simples o espaço amostraI e o evento. Por esta razão, são necessários alguns procedimentos de contagem qu~ são estudados pela análise combinatória. Existem várias maneiras de dispor os objetos de uma coleção em grupos. Esses grupos denominam-se agrupamentos e os objetos que os constituem chama-se de elementos. Em qualquer das maneiras de disposição dos elementos, existem dois casos: 1. Em cada agrupamento todos os elementos são distintos - agrupamento simples. 2. Em cada agrupamento pode haver repetições dos elementos - agrupamento com repetição. Os agrupamentos, quanto ao modo de formação, podem ser classificados em : Arralljos, Perm.lltaç(ies e COl1lbillaçijes. Os agrupamentos simples diferem pela ordem ou pela l1atureza de seus elementos. Diferem pela natureza quando pelo menos, um dos elementos de um dos agrupamentos não for elemento do outro. Defillição B.l: Sendo 11 um inteiro positivo, definimos 11! = (11)(11-1)(11-2).... f e o denominamos de/atorial de 11.Também definimos O! = 1. 1. PERMUTAÇÕES A. PERN[UTAÇÕES SIMPLES DE OBJETOS DISTINTOS São os agrupamentos simples de 11 elementos que podemos formar com eles. Diferem um do outro pela ordem dos elementos. O número de permutações é Pn = n ! EXEMPLO B.l: Com as. primeiras quatro letras do alfabeto, quantos agrupamentos de 4 elementos podemos formar? SOLUÇÃO: P4 = 41 = 4.3.2.1 = 24. A saber, temos, o seguinte conjunto, {abcd, abdc, acbd, acdb, adbc,adcb, baed, bade, bead, beda, bdae, bdea, eabd,cadb, cbad,cbda,cdab, cdba, dabe,dacb,dbac,dbca,dcab,dcba} 44 SOLUÇÃO: Temos 2 letras C, 3 letras A c 2 letras R, num total de 7 letras. Então, teremos, EXEMPLO B.2:Quantos anagramas podemos formar com as letras da palavra CARCARA? São as permútações que podcmos formar com 11 elementos, dos quais nl são iguais, n2 são iguais, o •• , nr são iguais. Diferem pela ordem. O númcro de permutações é EXEMPLO DA: Com as quatro primeiras letras do alfabeto, quantos agrupamentos de 2 elementos podcmos formar se a cscolha for feita sucessivamcnte e com reposição do elemento cscolhido ? A• ,(1I,r) = /I li!-AI' = _ A(II,,) - 11 (11 _ r)! li! - I} ' I - I'1 I... 11 .11'''1 ,"2 •...• 1 , 11.. 1.' ,. P72 ' 1 = 7! - 2 IO anagramas difercntes. o o," 2!3!2! {ab, ac, ad, ba, bc, bd, ca, cb, cd, da, db, de} . São os agrupamentos de r elementos dentre 11 elementos distintos. Difcrem úm agrupamento do outro, pela natureza ou pela ordem de seus elementos. O número de arranjos é 2. ARRANJOS EXEMPLO D.3: Com as quatro primciras Ictras do alfabeto, quantos agrupamentos dc 2 elementos podemos formar? SOLUÇÃO:Podemos formar A~ = ~ = 12 agrupamentos diferentes, a saber, temos 2! B. PERMUTAÇÕES COM OBJETO."; REPETIDO,"; A. ARRANJOS •.\'It.1PLE.\' DE OBJETOS DISTINTOS São os agrupamentos de r elementos que podemos formar com /I elementos (O<r<II). Diferem um do outro pela ordem, pela natureza ou pela repetição de r c1emcntos dentro do mesmo agrupamento. O número de agrupamentos é: B. ARRANJOS COjt,f REPOSIÇÃO DO OBJETO SELECIONADO 45 OBSERVAÇÕES: {ab, ac, ad, bc, bd, cd} {aa, ab, ac,
Compartilhar