Prévia do material em texto
MEDIDAS DEMEDIDAS DE POSIÇÃO E DISPERSÃOPOSIÇÃO E DISPERSÃO UNIVERSIDADE FEDERALUNIVERSIDADE FEDERAL DA PARAÍBADA PARAÍBA POSIÇÃO E DISPERSÃOPOSIÇÃO E DISPERSÃO Departamento de EstatísticaDepartamento de Estatística Luiz MedeirosLuiz Medeiros ►►VimosVimos queque éé possívelpossível sintetizarsintetizar osos dadosdados sobsob aa formaforma dede distribuiçõesdistribuições dede frequênciafrequência ee gráficosgráficos.. ►► PodePode serser dede interesseinteresse apresentarapresentar essesesses dadosdados atravésatravés dede medidasmedidas descritivasdescritivas queque sintetizamsintetizam asas característicascaracterísticas dada distribuiçãodistribuição..característicascaracterísticas dada distribuiçãodistribuição.. ►► ParaPara representarrepresentar umum conjuntoconjunto dede dadosdados dede formaforma condensadacondensada utilizaremosutilizaremos algumasalgumas medidasmedidas dede posiçãoposição ee dede dispersãodispersão.. MEDIDAS DE POSIÇÃO MEDIDAS DE POSIÇÃO -- MÉDIAMÉDIA MédiaMédia AritméticaAritmética SimplesSimples:: ÉÉ aa somasoma dasdas observaçõesobservações divididadividida pelopelo númeronúmero dede observaçõesobservações.. SeusSeus valoresvalores tendemtendem aa sese localizarlocalizar emem umum pontoponto centralcentral dentrodentro dede umum conjuntoconjunto dede dadosdados.. ÉÉ aa medidamedida dede posiçãoposição maismais utilizadautilizada.. �� AA médiamédia aritméticaaritmética dede XX éé dadadada porpor:: �� Para dados agrupados por valor:Para dados agrupados por valor: ►► NosNos cálculoscálculos envolvendoenvolvendo médiamédia aritméticaaritmética simples,simples, todastodas asas ocorrênciasocorrências têmtêm exatamenteexatamente aa mesmamesma importânciaimportância ouou oo mesmomesmo pesopeso.. ►► NoNo entanto,entanto, existemexistem casoscasos ondeonde asas ocorrênciasocorrências têmtêm importânciaimportância relativarelativa diferentediferente.. NestesNestes casos,casos, oo cálculocálculo dada MÉDIA ARITMÉTICA PONDERADAMÉDIA ARITMÉTICA PONDERADA importânciaimportância relativarelativa diferentediferente.. NestesNestes casos,casos, oo cálculocálculo dada médiamédia devedeve levarlevar emem contaconta estaesta importânciaimportância relativarelativa ouou pesopeso relativorelativo.. MEDIDAS DE POSIÇÃO MEDIDAS DE POSIÇÃO -- MEDIANAMEDIANA MedianaMediana ((MeMe)):: OcupaOcupa aa posiçãoposição centralcentral dede umauma sériesérie dede observaçõesobservações ordenadas,ordenadas, ouou seja,seja, éé oo valorvalor queque dividedivide osos dadosdados emem duasduas partespartes iguaisiguais (isto(isto é,é, emem duasduas partespartes dede 5050%% cadacada)).. ParaPara aa sériesérie dede valoresvalores ordenadosordenados emem ordemordem crescentecrescente dede grandezagrandeza (isto(isto é,é, umum rol),rol), aa medianamediana éé oo valorvalor central,central, istoisto éé Me Me = elemento que está na posição= elemento que está na posição (n+1)/2(n+1)/2;; 11 11 –– 12 12 –– 13 13 –– –– 17 17 –– 20 20 –– 25251611 11 –– 12 12 –– 13 13 –– –– 17 17 –– 20 20 –– 2525 MeMe=16=16 ObsObs:: QuandoQuando oo nn éé par,par, aa medianamediana éé sempresempre aa médiamédia aritméticaaritmética entreentre oo pontoponto acimaacima dodo qualqual recaemrecaem 5050%% dosdos casoscasos ee abaixoabaixo dodo qualqual tambémtambém recaemrecaem 5050%% dosdos casoscasos.. 11 11 –– 12 12 –– 13 13 –– -- –– 20 20 –– 25 25 –– 2626 MeMe=(16+17)/2 = 16,5=(16+17)/2 = 16,5 16 16 17 MEDIDAS DE POSIÇÃO MEDIDAS DE POSIÇÃO -- MODAMODA ModaModa ((MMOO)):: ÉÉ oo valorvalor (valores)(valores) maismais frequentefrequente emem umauma distribuiçãodistribuição.. aa.. SeSe todostodos osos valoresvalores sese repetemrepetem aa mesmamesma quantidadequantidade dede vezes,vezes, dizemosdizemos queque nãonão háhá moda,moda, ouou seja,seja, aa distribuiçãodistribuição éé amodalamodal;; b. Se um valor ocorre com mais freqüência, dizemos que a distribuição é b. Se um valor ocorre com mais freqüência, dizemos que a distribuição é unimodalunimodal;; cc.. SeSe doisdois valoresvalores sese repetemrepetem aa mesmamesma quantidadequantidade dede vezesvezes ee comcom maismais freqüência,freqüência, dizemosdizemos queque aa distribuiçãodistribuição éé bimodalbimodal..freqüência,freqüência, dizemosdizemos queque aa distribuiçãodistribuição éé bimodalbimodal.. d. Se mais de dois valores se repetem a mesma quantidade de vezes e d. Se mais de dois valores se repetem a mesma quantidade de vezes e com a mesma freqüência, dizemos que a distribuição é multimodalcom a mesma freqüência, dizemos que a distribuição é multimodal.. ObsObs: Esta medida é a única de que dispomos para variáveis qualitativas.: Esta medida é a única de que dispomos para variáveis qualitativas. ►► ExemploExemplo:: KamileKamile participouparticipou dede umum concurso,concurso, ondeonde foramforam realizadasrealizadas provasprovas dede Português,Português, Matemática,Matemática, BiologiaBiologia ee HistóriaHistória.. EssasEssas provasprovas tinhamtinham pesopeso 33,, 33,, 22 ee 22,, respectivamenterespectivamente.. SabendoSabendo queque KamileKamile tiroutirou 88 emem Português,Português, 77,,55 emem Matemática,Matemática, 55 emem BiologiaBiologia ee 44 emem História,História, qualqual foifoi aa médiamédia queque eleele obteve?obteve? Exemplo: Calcular a média, moda e mediana Exemplo: Calcular a média, moda e mediana para os seguintes casospara os seguintes casos 1)1) Idade dos alunosIdade dos alunos 18 18 –– 25 25 –– 20 20 –– 19 19 –– 22 22 –– 22 22 –– 21 21 –– 1919 2)2) Altura dos alunosAltura dos alunos 1,75 1,75 –– 1,69 1,69 –– 1,81 1,81 –– 1,72 1,72 –– 1,73 1,73 –– 1,66 1,66 –– 1,591,59 MEDIDAS DE POSIÇÃO MEDIDAS DE POSIÇÃO -- QUARTIS, DECIS E QUARTIS, DECIS E PERCENTISPERCENTIS EmEm algunsalguns casos,casos, oo pesquisadorpesquisador temtem interesseinteresse emem conhecerconhecer outrosoutros aspectosaspectos relativosrelativos aoao conjuntoconjunto dede dadosdados.. NessaNessa direção,direção, osos quartisquartis,, decisdecis ee percentispercentis podempodem fornecerfornecer informaçõesinformações relevantesrelevantes àà pesquisapesquisa.. ►► QuartisQuartis: São as observações que dividem o rol em 4 partes : São as observações que dividem o rol em 4 partes ►► QuartisQuartis: São as observações que dividem o rol em 4 partes : São as observações que dividem o rol em 4 partes iguais e são denotadas por Qiguais e são denotadas por Q11, Q, Q22 e Qe Q33.. ►► DecisDecis: São as observações que dividem o rol em 10 partes : São as observações que dividem o rol em 10 partes iguais e são denotadas por Diguais e são denotadas por D11,D,D22, . . . ,D, . . . ,D99.. ►► PercentisPercentis: São as observações que dividem o rol em 100 : São as observações que dividem o rol em 100 partes iguais e são denotadas por Ppartes iguais e são denotadas por P11, P, P22, . . . , P, . . . , P9999.. Note ainda que QNote ainda que Q22 = D= D55 = P= P5050 = Me.= Me. ASSIMETRIAASSIMETRIA ►► Média = mediana = moda Média = mediana = moda --> distribuição simétrica> distribuição simétrica ►► Média > Mediana > Moda Média > Mediana > Moda --> distribuição assimétrica positiva> distribuição assimétrica positiva ►► Média < Mediana < Moda Média < Mediana < Moda --> distribuição assimétrica negativa> distribuição assimétrica negativa MEDIDAS DE DISPERSÃOMEDIDAS DE DISPERSÃO ►►AsAs medidasmedidas dede posiçãoposição apresentadasapresentadas fornecemfornecem aa informaçãoinformação dosdos dadosdados apenasapenas aa nívelnível pontual,pontual, semsem ilustrarilustrar outrosoutros aspectosaspectos referentesreferentes àà formaforma comocomo osos dadosdados estãoestão distribuídosdistribuídos nana amostraamostra.. ►►AsAs medidasmedidas dede dispersãodispersão sãosão utilizadasutilizadas parapara avaliaravaliar oo graugrau dede variabilidade,variabilidade, ouou dispersão,dispersão, dosdos valoresvalores.. MEDIDAS DE DISPERSÃOMEDIDAS DE DISPERSÃO Exemplo: Notas de três turmas de Estatística da UFPBExemplo: Notas de três turmas de Estatística da UFPB ObservaçõesimportantesObservações importantes i)i) As três turmas possuem a mesma média.As três turmas possuem a mesma média. ii)ii) As notas estão distribuídas sob diferentes formas.As notas estão distribuídas sob diferentes formas. iii)iii) A média resume o conjunto de dados apenas posição central.A média resume o conjunto de dados apenas posição central. iv)iv) A média não fornece informações sobre a variabilidade dos dados.A média não fornece informações sobre a variabilidade dos dados. SoluçãoSolução:: ApresentarApresentar juntojunto dada médiamédia umauma medidamedida queque sumarizesumarize aa variabilidadevariabilidade dodo conjuntoconjunto dede dadosdados.. MEDIDAS DE DISPERSÃO MEDIDAS DE DISPERSÃO –– AMPLITUDE TOTALAMPLITUDE TOTAL ►► AmplitudeAmplitude TotalTotal:: UmaUma formaforma simplessimples dede medirmedir aa dispersãodispersão emem umum conjuntoconjunto dede observaçõesobservações éé atravésatravés dada amplitudeamplitude totaltotal:: AT = Maior valor − Menor valorAT = Maior valor − Menor valor VerificaVerifica--sese queque aa amplitudeamplitude comocomo medidamedida dede dispersãodispersão éé limitadalimitada.. EssaEssa medidamedida sósó dependedepende dosdos valoresvalores extremos,extremos, ouou seja,seja, nãonão éé afetadaafetada pelapela dispersãodispersão dosdos valoresvalores internosinternos MEDIDAS DE DISPERSÃO MEDIDAS DE DISPERSÃO –– DESVIO MÉDIODESVIO MÉDIO ►► OO desviodesvio médiomédio éé umauma medidamedida dede “VARIABILIDADE“VARIABILIDADE ABSOLUTA”ABSOLUTA”.. ElaEla medemede aa variabilidadevariabilidade dodo conjuntoconjunto emem termostermos dede desviosdesvios emem relaçãorelação àà médiamédia aritméticaaritmética.. ÉÉ umauma quantidadequantidade sempresempre nãonão negativanegativa ee expressaexpressa nana mesmamesma unidadeunidade dede medidamedida dada variávelvariável.. ObsObs:: EssaEssa medidamedida nãonão éé tãotão utilizadautilizada comocomo medidamedida dede variabilidadevariabilidade.. MEDIDAS DE DISPERSÃO MEDIDAS DE DISPERSÃO -- VARIÂNCIAVARIÂNCIA ►► AA variânciavariância dede umum conjuntoconjunto dede dadosdados (amostra(amostra ouou população)população) éé umauma medidamedida dede “VARIABILIDADE“VARIABILIDADE ABSOLUTA”ABSOLUTA”.. ElaEla medemede aa variabilidadevariabilidade dodo conjuntoconjunto emem termostermos dede desviosdesvios quadradosquadrados emem relaçãorelação àà médiamédia aritméticaaritmética.. ÉÉ umauma quantidadequantidade sempresempre nãonão negativanegativa ee expressaexpressa emem unidadesunidades quadradasquadradas dodo conjuntoconjunto dede dados,dados, sendosendo dede difícildifícil interpretaçãointerpretação.. a)a) Para dados agrupados por valor:Para dados agrupados por valor: MEDIDAS DE DISPERSÃO MEDIDAS DE DISPERSÃO –– DESVIO PADRÃODESVIO PADRÃO ÉÉ umauma outraoutra medidamedida dede dispersãodispersão maismais comumentecomumente empregadaempregada dodo queque aa variância,variância, porpor serser expressaexpressa nana mesmamesma unidadeunidade dede medidamedida dodo conjuntoconjunto dede dadosdados.. MedeMede aa "DISPERSÃO"DISPERSÃO ABSOLUTA"ABSOLUTA" dede umum conjuntoconjunto dede valoresvalores ee éé obtidaobtida aa partirpartir dada variânciavariância..aa partirpartir dada variânciavariância.. SS 2 = MEDIDAS DE DISPERSÃO MEDIDAS DE DISPERSÃO –– COEFICIENTE DE VARIAÇÃOCOEFICIENTE DE VARIAÇÃO ÉÉ umauma medidamedida dede “VARIABILIDADE“VARIABILIDADE RELATIVA”,RELATIVA”, útilútil parapara compararcomparar aa variabilidadevariabilidade dede observaçõesobservações comcom diferentesdiferentes unidadesunidades dede medidamedida.. ÉÉ definidadefinida porpor:: Exemplo:Exemplo: VALORESVALORES MÉDIAMÉDIA D.P.D.P. C.V.C.V. 1 1 -- 2 2 -- 33 22 11 50 %50 % ►► É importante expressar a variabilidade em termos relativos porque, por exemplo, É importante expressar a variabilidade em termos relativos porque, por exemplo, um desvioum desvio--padrão igual a 1 pode ser muito pequeno se a magnitude dos dados padrão igual a 1 pode ser muito pequeno se a magnitude dos dados é da ordem de 1.000, mas pode ser considerado muito elevado se esta é da ordem de 1.000, mas pode ser considerado muito elevado se esta magnitude for da ordem de 10.magnitude for da ordem de 10. ►► Observe também que o coeficiente de variação é adimensional e por este motivo Observe também que o coeficiente de variação é adimensional e por este motivo permite a comparação das variabilidades de diferentes conjuntos de dados.permite a comparação das variabilidades de diferentes conjuntos de dados. 1 1 -- 2 2 -- 33 22 11 50 %50 % 100 100 -- 200 200 -- 300300 200200 100100 50 %50 % 101 101 -- 102 102 -- 103103 102102 11 1 %1 % BoxplotBoxplot CurtoseCurtose ExemploExemplo:: NaNa tabelatabela abaixoabaixo encontraencontra--sese aa estruturaestrutura dodo produtoproduto internointerno brutobruto dodo Brasil,Brasil, emem bilhõesbilhões dede reais,reais, segundosegundo asas atividadesatividades econômicaseconômicas.. a)a) EmEm qualqual dosdos setoressetores ocorreocorre aa maiormaior variabilidade?variabilidade? PERÍODOPERÍODO AGROPECUÁRIAAGROPECUÁRIA INDÚSTRIAINDÚSTRIA SERVIÇOSSERVIÇOSPERÍODOPERÍODO AGROPECUÁRIAAGROPECUÁRIA INDÚSTRIAINDÚSTRIA SERVIÇOSSERVIÇOS 20022002 6,66,6 27,127,1 66,366,3 20032003 7,47,4 27,827,8 64,864,8 20042004 6,96,9 30,130,1 6363 20052005 5,75,7 29,329,3 6565 20062006 5,55,5 28,828,8 65,865,8 20072007 5,65,6 27,827,8 66,666,6 ExemploExemplo:: UmaUma certacerta empresaempresa queque fabricafabrica duasduas linhaslinhas dede produtosprodutos (A(A ee B)B) necessitanecessita reestruturarreestruturar suasua produçãoprodução.. FoiFoi realizadorealizado umum estudoestudo parapara taltal finalidadefinalidade ee umauma dasdas variáveisvariáveis consideradasconsideradas foifoi VENDAVENDA (quantidade(quantidade mensal)mensal) dede cadacada tipotipo dede produtoproduto (A(A ee B)B).. ParaPara esteeste estudoestudo foifoi tomadotomado comocomo referênciareferência oo primeiroprimeiro semestresemestre dede determinadodeterminado ano,ano, ondeonde foramforam verificadosverificados asas seguintesseguintes VENDASVENDAS:: PRODUTO A 13 32 28 25 24 25 a)a) EmEm relaçãorelação aa estaesta variável,variável, qualqual dosdos produtosprodutos (A(A ouou B)B) apresentouapresentou maiormaior estabilidadeestabilidade nasnas VENDASVENDAS mensais?mensais? b)b) AA empresaempresa decidedecide penalizarpenalizar aa equipeequipe queque obteve,obteve, emem algumalgum mês,mês, umum volumevolume dede vendavenda inferiorinferior aa --11,,55SS.. AlgumaAlguma equipeequipe foifoi penalizada?penalizada? PRODUTO A 13 32 28 25 24 25 PRODUTO B 25 20 29 30 26 20 X