Baixe o app para aproveitar ainda mais
Prévia do material em texto
Parte I Introduc¸a˜o a` Teoria dos Erros 1 O Que Sa˜o Erros ? A teoria dos erros e´ a a´rea da estat´ıstica que trata a imprecisa˜o da medida efetuada e dos erros sucessivos na inserc¸a˜o de dados nume´ricos nos modelos matema´ticos. Isto se deve a` imprecisa˜o dos dados. Figura 1: Precisao Origem dos Erros Ao mensurarmos qualquer varia´vel, grac¸as a suas fluturac¸o˜es naturais, nunca saberemos qual e´ o verdadeiro valor da medida. Dizemos verdadeiro aquele valor puro e real, somente definido pela natureza do fenoˆmeno. Observe este exemplo: suponha que queiramos mensurar o comprimento de qualquer objeto com uma re´gua simples. Digamos, o tamanho do la´pis, depen- dendo da constituic¸a˜o do material em que a re´gua e´ composta, o seu tamnaho e expessura variara´ grac¸as ao seu coeficiente de dilatac¸a˜o te´rmico - problema termodinaˆmico. Sob dias de sol havera´ aumento da temperatura e por sequinte a dilatac¸a˜o da mesma supervalorizando a medida do tamanho do la´pis, ocasio- nando assim um erro para cima. Por outro lado, em dias frios, a re´gua tende a compactar-se aproximando as marcas milimetradas subvalorizando o valor me- dido do comprimento do la´pis, agora o erro e´ para baixo. Vamos para o exemplo matema´tico: sabemos que existem nu´meros irra- cionais (I), aqueles que na˜o podem ser descritos sob forma de raza˜o. Suponha um modelo matema´tico polinomial, qualquer fog para o polinomio afetara´ a 3 4 precisa˜o do valor amplificando a variac¸a˜o causada pelo erro - propagac¸a˜o dos erros. Agora respoda esta pergunta: como um c´ırculo de raio r = 1 pode ser fechado se o valor de pi = 3, 141592654... e´ um nu´mero irracional e portanto infinito? Matematicamente nunca. Outros exemplos sa˜o: • Natural: Sa˜o os erros oriundos do meio em que vivemos e por isso na˜o podemos isola´-los completamente. Podemos sim diminuir seus efeitos sob condic¸a˜o de controle experimental. Sa˜o exemplos de erros naturais a di- latac¸a˜o te´rmica, as condic¸o˜es clima´ticas, as oscilac¸o˜es sonoras (ru´ıdos), efeitos ele´tricos (descargas), etc... Figura 2: A dilatac¸a˜o te´rmica de uma re´gua afeta a precisa˜o da mensurac¸a˜o. • Humano: Sa˜o aqueles erros inerentes ao indiv´ıduo humano. Podem ser considerados os efeitos de cansac¸o, falta de atenc¸a˜o, limitac¸o˜es pessoais entre outros motivos. Figura 3: Falta de atenc¸a˜o humana. • Te´cnico: Sa˜o os erros devidos aos procedimentos cient´ıficos ou te´cnicos atualmente aceitos. Uma vez que achamos que chegamos no melhor e 5 mais avanc¸ado do conhecimento te´cnico-cient´ıfico, pelo menos em nossa e´poca histo´rica, esperamos que na˜o haja mais descobertas. Breve engano! Pois como sabemos, quanto mais estudamos muito mais informac¸o˜es novas aparecem a cada segundo. Talvez, a falta do conhcecimento cient´ıfico mais apurado em determinado assunto (exemplo da relac¸a˜o de nanotransmis- sores cerebrais e os efeitos da distorc¸a˜o de memo´ria) ou pela incapacidade tecnolo´gica atual (contagem a tempo real da populac¸a˜o brasileira) podem interferir na boa conduc¸a˜o das medidas. Exemplo C = 2 ∗Π ∗R. Definic¸a˜o O erro tambe´m e´ uma medida. E´ definido como o valor nume´rico da diferenc¸a entre a medic¸a˜o efetuada e o valor verdadeiro (real ou natural). Alguns teo´ricos consideram o valor verdadeiro como a medida ”de fato desconhecida µ”, enquanto outros consideram-a como a convergeˆncia da me´dia. Apresentaremos aqui as duas formas de interpretac¸a˜o sobre o tratamento destes erros. A definic¸a˜o de erro puro e´ � = valor medido − valor verdadeiro (1) Considera-se o erro puro como sendo a diferenc¸a entre o valor medido e o real sem levar em considerac¸a˜o o mo´dulo. Portanto, na˜o se trata de uma distaˆncia mas sim do deslocamento para mais (+) ou para menos (-) do valor real e verdadeiro. Aqui o valor do sinal torna o ca´lculo importante para a distinc¸a˜o do sentido do erro. Figura 4: Valor verdadeiro e valor medido 6 Erro absoluto de x |�x| O erro absoluto de x e´ a distaˆncia do valo verdadeiro (real) ao valor medido. Na˜o faz sentido o sinal no qual o erro esta´ atribu´ıdo (se para mais ou para menos), mas sim a amplitude do erro, ou melhor, o qua˜o distante esta´ o valor medido do verdadeiro valor. Devido a esta interpretac¸a˜o, devemos levar em considerac¸a˜o o mo´dulo para caraterizar distaˆncia. �x = |valor medido− valor verdadeiro| (2) e´ o erro absoluto. O erro na˜o se mede, o erro se estima pelo simples motivo de na˜o conhe- cemos o valor verdadeiro da medida. Da´ı a necessidade da interpretac¸a˜o do desvio onde trocamos o valor verdadeiro por uma medida de tendenciosidade central como substituto (considerado va´lido). Veremos isso em outro cap´ıtulo: Medida de Dispersa˜o ou Variabilidade. Erro relativo de x |δx| E´ o quanto que a diferenc¸a esta´ longe do valor verdadeiro. Mede a precisa˜o da medida. Se ocorrer que: valor verdadeiro = valor medido, o erro relativo e´ nulo e dificilmente isto ocorrera´. δ� = �x valor verdadeiro = |valor medido− valor verdadeiro| valor verdadeiro (3) Experimentac¸a˜o E´ o estudo dos fenoˆmenos em condic¸o˜es determinadas pelo pesquisador - con- toladas. Enquanto a observac¸a˜o esta´ sujeita ao erro sistema´tico, devido a variac¸a˜o na˜o controlada do fenoˆmeno (ou do fato), a experimentac¸a˜o, ao contra´rio, exige que toda a ana´lise obtida tenha a precisa˜o mı´nima requerida (rigor). Isto na˜o ocorre na observac¸a˜o que esta´ sujeita a` gerac¸a˜o do erro sistema´tico (por exem- plo na coleta). O na˜o controle experimental pode induzir a uma interpretac¸a˜o equivocada dos dados. A ana´lise torna-se uto´pica, a interpretac¸a˜o na˜o esta´ sendo assistida por nenhuma teoria de controle, pois a sua base observacional esta´ sob as condic¸o˜es dos nossos sentidos. Segue, portanto, um cara´ter pessoal, viesado e sem relac¸a˜o alguma com o experimento em si. A experimentac¸a˜o deve ser planejada por te´cnicas de controle, de custo, na˜o condicionada e com um bom desempenho de seguranc¸a. A parte da estat´ıstica que trata da formatac¸a˜o da experimentac¸a˜o chama-se Planejamento de Experimentos (Design of Experiments DOE), constitui-se de variadas te´cnicas de ajustes e modelagens experimentais que formulam croquis espec´ıficos para o bom levantamento/isolamento das causas de variac¸a˜o. 7 Tipos de Erros Toda medida realizada sera´ afetada por fontes de erros. Por maior que a pre- cisa˜o possa ser alcanc¸ada nunca e´ suficiente sendo poss´ıvel a sua melhora. O problema e´ saber ate´ quando/quanto a precisa˜o pode ser mantida. Na˜o levando em considerac¸a˜o o tamanho da precisa˜o veremos quais podem ser as suas causas. • Sistema´ticos: E´ o erro devido a desvios da conduc¸a˜o experimental. Toda falta de planejamento gera erros sistema´ticos de controle podendo acar- retar uma simples ma´ calibrac¸a˜o dos equipamentos ate´ a erroˆnea for- matac¸a˜o do preparo experimental (croqui). Este erro e´ responsa´vel pelas flutuac¸o˜es origina´rias. Sa˜o falhas normalmente ocasionadas pelo me´todo empregado na experimentac¸a˜o. Figura 5: Erro Sistema´tico: Paralaxe 1. instrumental: Erros de ajuste da calibrac¸a˜o dos equipamentos/escala. Ex. Ajuste da cronometragem zerada do relo´gio. 2. observacional: Erro devido ao tempo da leitura (adiantada/atrazada). Ex. paralaxe na leitura de escalas de instrumentos. 3. ambiental: Erro devido a subestimar ou superestimar os valores a serem medidos. Ex. Num experimento qu´ımico na˜o limpar o recipi- ente apo´s uma reac¸a˜o qu´ımica. Devido a sua natureza, este erro afeta igualmente todas as medic¸o˜es, desloca a informac¸a˜o para mais ou para menos. Os erros sistema´ticos produzem distorc¸o˜es que alteram a acuracidade. As te´cnicas para diminuir estes efeitos sa˜o: a amostragem, o planejamento experimental, uso de equipamentos de qualidade, procedimentos dos bonsha´bitos na pesquisa - lavar as ma˜os, zerar os medidores, uso de taras, entre outras formas. 8 • Aleato´rios ou Acidentais: Sa˜o erros inesperados de origem normal- mente desconhecidas e incertas, oriundas das causas acidentais e fortuitas. Decorrem da pro´pria experieˆncia, afetam a precisa˜o e a reprodutibilidade dos dados. Figura 6: Erro Acidental 1. Paralaxe1: capacidade de observac¸a˜o. Ex. Posicionamento para efe- tuar a leitura. 2. Reflexivo: Erro devido ao operador. Ex. Ao apertar o cronoˆmetro. 3. Natural: Erros devidos aos eventos naturiais. Ex. Oxidac¸a˜o devido a umidade. As te´cnicas para diminuir estes efeitos sa˜o: maior cuidado e atenc¸a˜o para evitar alguns efeitos inesperados. Boas pra´ticas de manutenc¸a˜o preventiva ajudam a diminuir os efeitos acidentais como a troca perio´dica dos extin- tores, cuidados ao formatar ma´quinas e equipamentos, atenc¸a˜o no uso e instalac¸a˜o do sistemas hidra´ulico e ele´trico. • Grosseiros: Sa˜o erros devidos a` imper´ıcia e negligeˆncia do operador. Normalmente ccaracterizam-se pela falta de atenc¸a˜o. Os erros grosseiros podem ser provocados por falhas ocasionais e/ou anormlias dos instru- mentos causados por quedas. Produzem leituras/medic¸o˜es distorcidas do restante da amostra afetando uma ou todas a coletas. 1. : Imper´ıcia: Incapacidade da habilidade. O que e´ imperfeito naquilo que se faz. Na˜o ha´ destreza ou experieˆncia adequada para a te´cnica ou func¸a˜o - dizemos: ”algo mal feito.” 2. Negligeˆncia: Incapacidade de cuidado. Indoleˆncia, isto e´, desleixo em proceder algo. 1Muitos autores consideram apenas como observacional sistema´tico e na˜o como aleato´rio 9 Figura 7: Erro Grosseiro 3. Necessidades Ba´sicas: O sono e´ um dos maiores resposa´veis por danos em ma´quinas e equipamentos. O dormir bem na˜o e´ um luxo, mas uma necessidade orgaˆnica como qualquer outra. A organizac¸a˜o efi- caz das informac¸o˜es processadas pelo ce´rebro ajuda na eficieˆncia da memo´ria e do racic´ınio. As te´cnicas para diminuir estes efeitos sa˜o: nos casos em que de- sconhec¸as alguma a´rea ou te´cnica, por exemplo a da eletricidade, passe adiante a`quele que e´ detentor da pra´tica, evite que a sua in- abilidade se tranforme em imper´ıcia. No caso da negligeˆncia foque o trabalho naquilo que se faz, exclusivamente sob aquele momento. Na˜o pratique outra decisa˜o com base em distrac¸a˜o. Erros deste tipo podem causar perda de vidas. Na˜o existe controle estat´ıstico para isso, apenas procedimentos e´ticos e atenciosos. Vemos que a origem dos erros sa˜o as mais variadas poss´ıveis, devido a pre- senc¸a da incerteza na precisa˜o das medidas. O erro na˜o pode ser exclu´ıdo, mas pelo contra´rio, deve ser tratado. Veremos na parte II deste assunto algumas te´cnicas de tratamento dos erros. 10 Parte II Revisa˜o em Ana´lise Combinato´ria 1 ANA´LISE COMBINATO´RIA Se existe algo dif´ıcil de executar e´ contar. A parte da matema´tica responsa´vel pela contagem e´ conhecida por Ana´lise Combinato´ria. Muitas sa˜o as neces- sidades da contagem: uma simples disposic¸a˜o de um conjunto de letras (ANA- GRAMA) ou a mais complexa ligac¸a˜o de/entre redes neurais sa˜o extremos de exemplos de contagem. Muitos cientistas se debruc¸aram horas a fio para enten- der o fenoˆmeno da contagem, foram eles: Pascal, Newton, Leibniz, Bernoulli, entre outros ta˜o importantes quanto os citados aqui. A contagem carrega as cla´ssicas propriedades matema´ticas para auxiliar no desenvolvimento, tal como os polinoˆmios, progresso˜es geome´tricas, aritime´ticas, matrizes, geome- tria anal´ıtica entre outras. Portanto, caso tenha du´vias em algum ponto da matema´tica ba´sica, aconselhamos o reforc¸o. Contar Alguns exemplos de contagem: 1. A palavra AMOR, sem repetic¸a˜o das letras, pode ser reformulada de quan- tas formas poss´ıveis? (ANAGRAMA) 2. Das palavras formadas no ı´tem anterior quais sa˜o encontradas na l´ıngua portuguesa? 3. Em uma corrida com 8 participantes treˆs lugares no po´dium esperam para serem ocupados, quantas opc¸o˜es existem? 4. Seis candidatos a` duas vagas na CIPA devem ser preenchidas. Quantos grupos de pessoas podem ser formados? 5. Em um jogo de azar seis casas podem ser ocupadas por seis coelhos di- ferentes e numerados de 0 a 5. Quais as opc¸o˜es de alocac¸a˜o dos coelhos sa˜o poss´ıveis? O maior problema de toda a contagem e´ a quantidade e a ordem na dis- posic¸a˜o dos elementos dentro de um conjunto. 3 4 O PRINCI´PIO FUNDAMENTAL DA CONTAGEM Boa parte da matema´tica necessita de um princ´ıpio lo´gico. Este princ´ıpio deve ser ou pode carregar alguma propriedade de padra˜o. O padra˜o e´ o responsa´vel pelas mais diversas leis do universo. Grac¸as a ela, todas as leis sa˜o formuladas gerando-se um teorema e por fim o seu colora´rio (consequeˆncias). Garante-se aqui um regra do funcionamento dos sistemas naturais: o padra˜o. Por exemplo, o crescimento de uma a´rvore, embora tortuosa, exibe um padra˜o no crescimento de seus galhos. Ou as leis regentes do movimento planeta´rio tambe´m seguem alguns padro˜es de reconhecimento orbital. A pro´pria matema´tica apresenta seus padro˜es, intr´ıscico, e´ verdade, entre elas o Princ´ıpio Fundamental da Con- tagem. Observe a figura abaixo: Suponha que um elemento reproduz outros dois elementos. Se esta sequeˆncia for evolutiva, a n-e´sima etapa sera´ dada por 2n, ou a evoluc¸a˜o=1,2,4,8,16,.... Portanto a contagem e´ efetuada no n´ıvel n. Existe algum modelo matema´tico que possa descrever a evoluc¸a˜o deste seistema sem que tenhamos que contar toda a vez que necessitamos? Sim, existe e sa˜o dois modelos. O primeiro modelo e´ a func¸a˜o exponencial f(x) = ax, com base a = 2, portanto: f(n) = 2n. A sequeˆncia tambe´m pode ser definida por uma progressa˜o geome´trica, ou P.G. an = an−1qn, com q = 2 e a1 = a0 = 1, tal que an = 2 n. Isto mostra o quanto uma contagem pode ser complexa em termos evolutivos. Mesmo assim e´ poss´ıvel encontrar algum padra˜o - reprodutibilidade em 2 co´pias, u´til em dois modelos matema´ticos dis- tintos. Observamos que tanto a P.G quanto a func¸a˜o exponencial f(x) = ax o valor 2 determina a quantidade de elementos n´ıvel a n´ıvel na evoluc¸a˜o do sistema. Figura 8: A´rvore 2n 5 Evoluc¸a˜o em um u´nico sub-sistema recorre tanto a func¸a˜o exponencial como a progressa˜o geome´trica. No caso demais de um sub-sistema interagindo en- tre si a fenomenologia torna-se mais complexa. Gera-se portanto uma interac¸a˜o entre va´rias func¸o˜es exponenciais ou entre va´rias P.G.’s de cada conjunto evo- lutivo. Devido a este problema os matema´ticos tentaram encontrar algum outro padra˜o evolutivo. Desta vez a observac¸a˜o levou a dois padro˜es evolutivos: a) ordem b) natureza. A primeira refere-se a alocac¸a˜o ou a posic¸a˜o dentro de algum conjunto, portanto a ordem faz diferenc¸a: AMOR e ROMA. A se- gunda refere-se a` formac¸a˜o dos elementos componentes (conjuntos): {A}, {R}, {M}, {O}, {AR}, {MO}, {MA}...{ROMA} Para melhor exemplificar o pada˜o, suponha 4 sub-sistemas: verde (c1), vermelho (c2), amarelo (c3)e azul (c4); tal que procuramos todas as opc¸o˜es de natureza e ordem. • Inicialmente temos 4 opc¸o˜es originais • Na primeira evoluc¸a˜o 3 formas de ordem distintas sa˜o poss´ıveis • Na segunda evoluc¸a˜o 2 formas de ordem podemos gerar As opc¸o˜es de natureza foram 1 conjunto com 4 possibilidades (1 • 4 = 4), 4 conjuntos com 3 possibilidades (4•3 = 12) e 12 conjuntos com 2 sossibilidades (12 • 2 = 24). ==> 1 • 4 = 4→ 4 • 3 = 12→ 12 • 2 = 24 As opo˜es de ordem foram 24 ou 4 • 3 • 2 = 24. Tomamos como princ´ıpio fundamental da contagem a seguinte regra: Figura 9: Princ´ıpio Fundamental da Contagem 6 A caracter´ıstica observada e´ n(n− 1)(n− 2)(n− 3)(n− 4)...3.2.1. Define-se por esta caracter´ıstica o fatorial de n. n! = n(n− 1)(n− 2)(n− 3)(n−4)...3.2.1 sendo • n e´ um valor conta´bil e discreto pertencente aos nu´meros naturais. n ∈ N ;n > 1 • Define-se a identidade por 0! = 1 1 0! = 1 Resumo: O Princ´ıpio Fundamental da Contagem e´ o princ´ıpio mul- tiplicativo das possibilidades das ocorreˆncias de eventos distintos. ARRANJO PERMUTAC¸A˜O E COMBINAC¸A˜O Observe a figura abaixo. Arranjo e´ a forma de alocac¸a˜o de elementos em difer- entes ordens e em diferentes formas de natureza (conjuntos). Mais simplesmente e´ uma organizac¸a˜o ine´dita e sem repetic¸a˜o. A permutac¸a˜o e´ tambe´m um arranjo, mas com todos os elementos participantes - u´ltima escala do arranjo. A com- binac¸a˜o e´ um arranjo onde a ordem na˜o importa, apenas a natureza (conjuntos). ARRANJO O Arranjo e´ a ordenac¸a˜o de elementos em diferentes agrupamentos. Ao organizar suas canetas, la´pis e borracha em um u´nico penal voceˆ esta´ arranjando. Mesmo quando sepa´ra-los em penais diferentes voceˆ tambe´m esta´ os arranjando em grupos separados (conjuntos). Ao arrumar uma mesa de sala ou de jantar voceˆ esta´ arranjando. Pornanto arranjar e´ organizar em ordenac¸a˜o independente da quantidade de elementos sendo organizados. Encontramos os fenoˆmenos de arranjos em va´rias a´reas do conhecimento: nas aplicac¸o˜es financeiras, na gene´tica, na ecologia de agrupamentos de seres vivos, na gerac¸a˜o de cores, nas composic¸o˜es musicais, na ordenac¸a˜o de filas em bancos, supermercados... Quando arrumamos objetos em nossa casa estamos institivamente gerando arranjos. Todas os eventos poss´ıveis sa˜o dados pelo arranjo. 7 Figura 10: Arranjo - Permutac¸a˜o - Combinac¸a˜o 8 A equac¸a˜o do arranjo Como o arranjo depende de quantos conjuntos ”r”sera˜o formados, o arranjo ordena em func¸a˜o da quantidade de elementos que queira ordenar, isto e´, An,r e´ o nu´mero de arranjo simples tomados r em r. PrincipioFundamentalContagem = n(n− 1)(n− 2)(n− 3)...[n− (r − 1)] PrincipioFundamentalContagem = [n− (r − 1)]! = (n− r + 1)! ou seja, An,r = {PrincipioFundamentalContagem} · {[n− r + 1 + (−1)]!} [n− r + 1 + (−1)]! An,r = n(n− 1)(n− 2) · · · (n− r + 1) · [(n− r)!] (n− r)! pore´m n(n− 1)(n− 2) · · · (n− r + 1)(n− r)! = n! An,r = n! (n− r)! Portanto, o aranjo nada mais e´ do que o nu´mero de alocac¸o˜es poss´ıveis dos n elementos cohecidos em grupos de r elementos agrupados, ou conjuntos de r elementos. 9 Exercise 1 a Suponha ordenar cinco funciona´rios de uma rede se supermercado em grupos de um caixa e um empacotador. n = 5 p = 2 An,p = n! (n− p)! A5,2 = 5! (5− 2)! = 5! 3! = 1 · 2 · 3 · 4 · 5 1 · 2 · 3 = 20 Sa˜o 20 opc¸o˜es de grupos Figura 11: Opc¸o˜es caixa empacotador b E se fossem: • 1 caixa: An,p = A5,1 = 24 • 1 caixa e 1 empacotador: An,p = A5,2 = 20 (desenvolvido acima) • 1 caixa, 1 empacotador e 1 fiscal:An,p = A5,3 = 60 • 1 caixa, 1 empacotador, 1 fiscal e 1 gerente:An,p = A5,4 = 120 • 1 caixa, 1 empacotador, 1 fiscal, 1 gerente e 1 auxiliar:An,p = A5,5 = 120 c Quantas senhas de treˆs algarismos sem repetic¸a˜o de 0 a 9 existem? n = {0, 1, 2, 3, 4, 5, 6, 7, 8, 9} → 10 elementos 10 p = 3 An,p = n! (n− p)! A10,3 = 10! (10− 3)! = 10! 7! = 7!8 · 9 · 10 7! = 8 · 9 · 10 = 720 Sa˜o 720 opc¸o˜es de senhas. PERMUTAC¸A˜O E´ simplesmente o limite ma´ximo poss´ıvel do arranjo. Permutamos quando trocamos todas as posic¸o˜es de todos os elementos. Por exemplo, no jogo de futebol temos 11 jogadores, ao pemuta´-los em posic¸o˜es difeentes obteremos 39.916.800 formas de arranja´-los. Este e´ o limite ma´ximo de trocas que o te´cnico consiguira´ fazer sem repitir alguma forma anterior. Onde permutamos? Permutamos quando trocamos o pneu do carro, quando procuramos a chave certa para abria a porta em um molho de chaves, quando retiramos todos os la´pis, canetas e borrachas dentro de um penal e os reton- amos de volta ao mesmo penal, simplesmente estamos permutando o dia todo. A permutac¸a˜o e´ uma ferramenta muito u´til na formac¸a˜o de anagramas. Um anagrama e´ a ordenac¸a˜o de todas as letras de uma palavra ou um conjunto de letras que geram outras formas de escrita, por exemplo: a palavra TIO tem seis anagramas que sa˜o eles: TIO, IOT, OIT, ITO, TOI e OTI. Para que serve isso? Senhas. Def. Permutac¸a˜o e´ o tipo de agrupamento ordenado, sem repetic¸a˜o, em que todos os elementos participam. A equac¸a˜o da permutac¸a˜o Na˜o e´ nada mais do que o caso especial do arranjo: p=n. An,p = n! (n− p)! An=p,p = n! (p− p)! Ap,p = n! (0)! Ap,p = n! 1 Ap,p = n! 1 11 Pn = Ap,p = n! Pn = n! O pro´prio fatorial simples e´ uma permutac¸a˜o. Exercise 2 a De quantas formas posso colocar 5 camisas no guarda roupa? Pn = n! = P5 = 5! = 1 · 2 · 3 · 4 · 5 = 120 sa˜o 120 formas de organizac¸a˜o. b Um artista pode pintar uma tela usando 3 cores (verde-azul-vermelho). Quais opc¸o˜es de arte no ma´ximo ele consequira´ executar? P3 = 3! = 6 c A pol´ıcia sabe que quatro informantes indicaram outros 3 envolvidos no caso criminal. O problema e´ que a rede e´ composta por todos eles e, tendo ela que encontrar a forma de organizac¸a˜o do grupo, do chefe ao executador, a pol´ıcia precisa montar a hierarquia do bando. Quantas sa˜o as opc¸o˜es de chefia da rede criminosa? Pn = n! P(n+m) = (n+m)! P(3 + 4) = (3 + 4)! = 7! = 1 · 2 · 3 · 4 · 5 · 6 · 7 = 40.320 Formam-se 40.320 formas de hierarquia criminosa COMBINAC¸A˜O A combinac¸a˜o e´ outro caso especial do arranjo. Desta vez e´ simplesmente a exclusa˜o da ordenac¸a˜o. Em outras palavras a combinac¸a˜o e´ a organizac¸a˜o de elementos diferentes em va´rias formas de agrupamentos, desde que na˜o leve em conta a troca da posic¸a˜o dos elementos. Por exemplo: ”na casa moram treˆs pessoas”. Na˜o ha´ a necessidade de dizer quem sa˜o estas pessoas, pois ja´ se sabe a quantidade de moradores e pronto! Na˜o interessa se mora ”Joa˜o, Maria e Carla”ou ”Carla, Maria e Joa˜o”ou qualquer outra forma de permutac¸a˜o. Basta saber que moram treˆs indiv´ıduos e basta. Vamos a um exemplo pra´tico. Suponha um partido pol´ıtico participara´ da eleic¸a˜o, podera´ eleger 5 cargos para vereador, 1 para prefeito e 2 para deputado estadual em um total de 30 candidatos para vereador, 1 para prefeito e 8 para deputado. Quantas combinac¸o˜es sa˜o poss´ıveis para a eleic¸a˜o? 142.506 opc¸o˜es para vereador com 5 candidatos, 1 opc¸a˜o para prefeito e 56 opc¸o˜es de 2 can- didatos para deputado estadual. Como fizemos isso? 12 Por isso que para um partido pol´ıtico a representac¸a˜o por vereadores e´ mais fa´cil do que consequir um representante para deputado ou para prefeito, devido a` quantidade de opc¸o˜es, que e´ maior. Def. A combinac¸a˜o simples e´ o tipo de agrupamento sem repetic¸a˜o em que um grupo e´ diferente de outro apenas pela natureza dos elementos componentes. Desta forma combinac¸o˜es simples de ne elementos distintos tomados p a p, sa˜o todos os subconjuntos de p elementos que e´ poss´ıvel formar a partir de um conjunto com n elementos. A equac¸a˜o da combinac¸a˜o Considere um conjunto p de treˆs lugares p1, p2 e p3 sendo p = {[p1], [p2], [p3]}. Quantas sa˜o as permutac¸o˜es existentes para alocar estes elementos? Existem p! - Isso no´s ja´ vimos em permutac¸a˜o e neste caso 3! = 6. E´ o equivalemte anagrama. Como a combinac¸a˜o e´ o arranjo sem levar em conta a ordem dos elemen- tos dentro do conjunto, enta˜o: Cn,p = An,p p! por isso da divisa˜o. Queremos apenas um conjunto representativo. De novo, a combinac¸a˜o e´ um caso especial do arranjo: Cn,p = n! p!(n− p)! Exercise 3 a) Com 30 candidatos para ocupar 5 vagas para vereador, quantas opc¸o˜es tere- mos? Cn,p = n! p!(n− p)! = 30! 5!(30− 5)! = 30! 25! = 25!26 · 27 · 28 · 29 · 30 25! = 26·27·28·29·30 = 142.506 teremos 142.506combinac¸o˜es de grupos com 5 candidatos. Observe que na˜o interessa que foi eleito por primeiro ou por u´ltimo, o que interessa e´ que foi eleito e pronto! Isso e´ combinac¸a˜o - aordem na˜o faz sentido. a) Com 1 candidatos para ocupar 1 vagas para prefeito, quantas opc¸o˜es teremos? Cn,p = n! p!(n− p)! = 1! 1!(1− 1)! = 1! 0! = 1 1 = 1 apenas um conjunto unita´rio com um candidato apenas. c) Com 8 candidatos para ocupar 2 vagas para deputado estadual, quantas opc¸o˜es teremos? Cn,p = n! p!(n− p)! = 8! 2!(8− 2)! = 8! 6! = 6!7 · 8 6! = 7 · 8 = 56 13 existem portanto 56 conjuntos distintos formados com 2 elementos representa- tivos para deputado estadual. Exercise 4 a) Qual a distribuic¸a˜o da combinac¸a˜o de um concurso pu´blico com 20 can- didatos? Observe que a maior combinac¸a˜o e´ quando houver a metade de vagas sendo a metade de candidatos. 14 BINOˆMIO DE NEWTON Isaac Newton foi o f´ısico ingleˆs que ficou mundialmente conhecido por inter- pretar a gravitac¸a˜o com a queda de uma mac¸a˜ em sua cabec¸a. Histo´rias a parte, Newton tambe´m foi responsa´vel por deduzir de forma clara os chamados nu´meros binomiais. O que e´ um binoˆmio? Binoˆmio e´ aquilo que tem dois nomes. De fato, mas neste caso seriam dois numeros n e p. Como estamos tratando de contagem, estes dois nu´meros n e p, que definem a contagem binomial, sa˜o nada mais e nada menos do que a quantidade n de elementos e o tamanho do conjunto p formado (natureza). A fo´rmula do binoˆmio de Newton E´ a pro´pria fo´rmula da combinato´ria, mas com uma ressalva: como todo nu´mero os binomiais tambe´m podem somar, subtrair, dividir e multi- plicar. Numero binomiais sa˜o chamados assim por apresentarem em sua com- posic¸a˜o dois nu´meros naturais N ou contadores. Cn,p = An,p p!( n p ) = Cn,p = n! p!(n− p)! Esta escrita ( n p ) na˜o e´ uma divisa˜o, mas um duplo nu´mero ou um binoˆmio. Este nu´mero apresenta treˆs propriedades importantes: Propriedades do binoˆmio de Newton As treˆs principais propriedades do binoˆmio de newton sa˜o: • Identidade na extremidade 0!:( n 0 ) = 1 ∀n ∈ ℵ 15 16 • Identidade na extremidade n:( n n ) = 1 ∀n ∈ ℵ • Quantidade: ( n 1 ) = n ∀n > 1 e n ∈ ℵ Outras propriedades do binoˆmio de Newton • Propriedade Complementar: A utilizac¸a˜o das propriedades acima com a equac¸a˜o binomial Cn,p = n! p!(n− p)! gera outras propriedades u´teis da binomial, observe: Cn,n−p = n! (n− p)!(n− (n− p))! = n! (n− p)!(n− n+ p))! = n! (n− p)!p! Cn,p = Cn,n−p = n! p!(n− p)! = n! (n− p)!p! Portanto: ( n p ) = ( n n− p ) sa˜o chamados complementares pois p+ (n− p) = n. • A relac¸a˜o de STIFFEL: E´ o resultado das propriedades do Triaˆnculo de Pascal. Cada binomial e´ a soma sequenciada de dois binomiais da linha anterior. Veremos esta propriedade mais adiante.( n− 1 p− 1 ) + ( n− 1 p ) = ( n p ) • A fo´rmula do Termo Geral Qualquer polinoˆmio gerado por (x + a)n, com n ∈ ℵ pode ser descrito por (x+ a)n = ( n 0 ) a0 · xn + ( n 1 ) a1 · xn−1 + ( n 2 ) a2 · xn−2 + ...+ ( n n ) an · x0 geramos assim uma equac¸a˜o a` diferenc¸a; Tp+1 = ( n p ) ap · xn−p 17 TRIAˆNGULO DE PASCAL O triaˆngulo de pascal e´ uma disposic¸a˜o nume´rica conta´bil formatada por nu´meros binomiais, ou melhor, por dois coeficientes. A figura abaixo mostra o triangulo de Pascal: uma figura triangular com padro˜es pro´prios expansivos dos pro- dutos notaveis de ordem n. Por exemplo: (x + a)2 = x2 + 2 · x · a + a2 sa˜o os coeficientes 1-2-1 na segunda linha do triaˆngulo, representativo do expoente quadra´tico. O mesmo acontece para (x+ a)0, (x+ a)1, (x+ a)3 ... (x+ a)n. Figura 12: Triaˆngulo de Pascal I: Padro˜es Uma propriedade interessante do triaˆngulo de Pascal e´ que a soma da linha do triaˆngulo e´ exatamente o pro´prio valor da func¸a˜o exponencial f(n) = 2n. Este fenoˆmeno esta´ realacionado com a quantidade dos termos elevados ao expoente n. O termo da expansa˜o e´ (x + a)n, sendo o par (x,a), possui 2 elementos. Como ambos esta˜o elevados a` n-esima poteˆncia os produtos nota´veis gerara˜o polinoˆmios de inu´meras ordens (x+ a)n → 2n Observe o seguite: • Expansa˜o de 0 ordem: (x+ a)0 = 1 · x0 · a0 1. coeficientes: 1 2. Expoentes de x: x0 3. Expoentes de a: a0 18 • Expansa˜o de 1o ordem: (x+ a)2 = x2 + 2 · x · a+ a2 1. coeficientes: 1-2-1 2. Expoentes decrescentes de x: x2 − x1 − x0 3. Expoentes crescentes de a: a0 − a1 − a2 • Expansa˜o de 2o ordem: (x+ a)2 = x3 + 3 · x2 · a+ 3 · x · a2 + a3 1. coeficientes: 1-3-3-1 2. Expoentes decrescentes de x: x3 − x2 − x1 − x0 3. Expoentes crescentes de a: a0 − a1 − a2 − a3 • Expansa˜o de no ordem: (x+ a)n = xn + [?] · xn−1 · a+ ...+ [?] · x · an−1 + an 1. coeficientes: 1-[?]-[?]-1 *problema !!!!!!* 2. Expoentes decrescentes de x: xn − xn−1 − xn−2...x0 3. Expoentes crescentes de a: a0 − a1 − a2 − a3...xn Veja se consegue reconhecer a existeˆncia de algum padra˜o nas expanso˜es acima. Observe a dificuldade quando obtemos a n-e´sima ordem, esta complicac¸a˜o dos coeficientes so´ pode ser corrigida pela substituic¸a˜o dos nu´meros naturais dentro do triaˆngulo de pascal pelos binoˆmios de Newton. Uma outra caracter´ıstica do triaˆngulo de pascal e´ devido ao padra˜o interno. Existem cinco principais padro˜es de reconhecimento que sa˜o: 1. O primeiro elemento da linha vale a unidade, ou identidade: ( n 0 ) = 1 2. O u´ltimo elemento da linha vale a unidade, ou identidade: ( n n ) = 1 3. Binomiais equidistantes sa˜o iguais: - 1o linha: 1 (1) - 2o linha: 1-2-1 (1) - 3o linha: 1-3-3-1 (3,1) - 4a linha: 1-4-6-4-1 (4,1) - 5o linha: 1-5-10-10-5-1 (1,5,10) 4. A soma da linha fornece o valor da func¸a˜o exponencial f(n) = 2n. Exem- plo: 19 - 1o linha 1→ 20 - 2o linha 1 + 1→ 21 - 3o linha 1 + 2 + 1→ 22 - 4o linha 1 + 3 + 3 + 1→ 23 - 5o linha 1 + 4 + 6 + 4 + 1→ 24 5. Em uma linha a soma de dois coeficientes consecutivos e´ igual ao valor do coeficiente da linha inferior - 2o linha 1+1→ 21. Observe que 1+1 = 2→ 2, o segundo coeficiente da 3o linha. - 3o linha 1 + 2+ 1→ 22. Observe que 1 + 2 = 3→ 3, e´ o segundo e o terceiro coeficiente da 4o linha. - 4o linha 1+ 3+ 3+ 1→ 23. Observe que 1+ 3 = 4→ 4, e´ o segundo e o quarto coeficiente da 5o linha. Observe que 3 + 3 = 6 → 6, e´ o terceiro coeficiente da 5o linha - 5o linha 1 + 4 + 6 + 4 + 1→ 24 ....segue... Figura 13: Triaˆngulo de Pascal II 20 A fo´rmula do binoˆmio de Newton E´ poss´ıvel escrever os coeficientes do triaˆngulo de Pascal em substituic¸a˜o ao nu´mero binomial de Newton? Sim e e´ isso que faremos agora: 1o linha ( 0 0 ) = 1 2o linha ( 1 0 ) = 1 e ( 1 1 ) = 1 3o linha ( 2 0 ) = 1 e ( 2 1 ) = 2 e ( 2 2 ) = 1 4o linha ( 3 0 ) = 1 e ( 3 1 ) = 3 e ( 3 2 ) = 3 e ( 3 3 ) = 1 5o linha ( 4 0 ) = 1 e ( 4 1 ) = 4 e ( 4 2 ) = 6 e ( 4 3 ) = 4 e ( 4 4 ) = 1 Devido a estes recursos podemos substituir os nu´meros naturais dentro do triaˆngulo de Pascal pelos nu´meros binomiais de Newton e desta forma desen- hamos um novo triaˆngulo, desta vez com duas informac¸ eos, ou melhor, dois nu´meros: n e p. Figura 14: Triaˆngulo de Pascal III As propriedades do triaˆngulo de Pascal sa˜o: • Substituic¸a˜o dos Coeficientes Nume´ricos por Binoˆmios nas Ex- panso˜es 21 1. Expansa˜o de 2o linha:(x+ a)2 = 1 · x2 + 2 · x · a+ 1 · a2 para 2. Expansa˜o de 2o linha:(x+ a)2 = ( 2 0 ) · x2 + (21) · x · a+ ( 212) · a2 3. Existeˆncia da relac¸a˜o de troca: 1→ (20); 2→ (21); 1→ (22); • Relac¸a˜ode Stiffel 1. Observe que 4 + 6 = 10 2. Observe que ( 4 1 ) + ( 4 2 ) = ( 5 2 ) 3. A relac¸a˜o torna-se, por induc¸a˜o matema´tica: ( n−1 p−1 ) + ( n−1 p ) = ( n p ) A fo´rmula do Termo Geral Quando expandimos os termos em func¸a˜o do triaˆngulo de Pascal modificado por nu´mero binomial envontramos as sequintes expanso˜es: • (x+ a)0 = (00)x0 · a0 • (x+ a)1 = (10)x1 · a0 + (11)x0 · a1 • (x+ a)2 = (20)x2 · a0 + (21)x1 · a1 + (22)x0 · a2 • (x+ a)3 = (30)x3 · a0 + (31)x2 · a1 + (32)x1 · a2 + (33)x0 · a3 • ...”Adivinha” Finalmente encontramos a fo´rmula do bino˜mio de Newton por induc¸a˜o: (x+ a)n = ( n 0 ) a0 · xn + ( n 1 ) a1 · xn−1 + ( n 2 ) a2 · xn−2 + ...+ ( n n ) an · x0d Podemos reescrever termos da equac¸a˜o acima como: Tp+1 = ( n p ) ap · xn−p Finalmente a expansa˜o binomial pode ser escrita como: (x+ a)n = n∑ p=1 ( n p ) ap · xn−p ou (x+ a)n = n∑ p=1 Cn,pa p · xn−p 22 Natureza dos Dados Natureza dos dados significa classificar os dados de acordo com as suas pro- priedades e caracter´ısticas. Conjuntos Nume´ricos A finalidade dos conjuntos nume´ricos e´ organizar os dados de acordo com a sua utilidade, por exemplo, quando comec¸amos a contar iniciamos por um, dois, treˆs, etc... e na˜o por ”um terc¸o”ou ”menos um”ou algo parecido. Existem casos em que o interesse na˜o e´ uma simples contagem, mas sim uma gerac¸a˜o de refereˆncias, isto e´, algo que nos proporcione a indicac¸a˜o de direc¸a˜o e sen- tido, quando queremos saber se estamos distantes de algo suficientemente para a ”esquerda”ou para a ”direita”. Vemos que o importante e´ identificar no qual grupo-conjunto o valor nume´rico pertence conforme a sua utilizac¸a˜o. Equivale em descobrir a qual famı´lia ou grupo de origem a varia´vel pode ser classi- ficada. De acordo com a teoria dos conjuntos nume´ricos podemos classificar os dados em: • Naturais: Sa˜o aqueles nu´meros que naturalmente contamos objetos ou eventos. Uma contagem de fato. A inclusa˜o do algarismo zero, sim- bolizado por 0, e´ devido ao caso em que a inexisteˆncia do elemento em cotagem pode ocorrer - auseˆncia. Por exemplo, conte quantas pessoas vivem dentro de um vulca˜o: nenhuma. E´ aqui que a contagem dita e´ ”na˜o existe”, ”na˜o tem”, ”na˜o ha´”ou ”na˜o pertence”. Os nu´meros naturais sa˜o classificados como contagem natural. ℵ = {0, 1, 2, 3, 4, 5, 6, 7...} • Inteiros: Sa˜o aqueles nu´meros em que classificamos como referenciais ou, como muitos autores preferem dizer, base posicional. O zero de novo! Atribu´ımos a este, o zero, o conceito de ”partida”ou ”origem”da distaˆncia para mais ”+”ou para -”cuja interpretac¸a˜o deduz o conceito de ”esquerda/direita”, ”para cima/ para baixo”, ”frente/tra´s”de modo a compatibilizar a ordenac¸a˜o dos valores em sentido. Portanto, a simbolo- gia dos sinais ”+”ou -”serve para gerar o conceito de equidistaˆncia entre 23 24 valores. Portanto os nu´meros inteiros representam refereˆncia de escala. Z = {...− 7,−6,−5,−4,−3,−2,−1, 0, 1, 2, 3, 4, 5, 6, 7...} ou Z = {...− 7,−6,−5,−4,−3,−2,−1, (ℵ)} • Racionais: Devido a motivos histo´ricos os nu´meros inteiros na˜o apresen- tam as propriedades de subdivisa˜o de escala. Na˜o e´ poss´ıvel com eles dizer - Vou para a esquerda a 2 metros e meio”; mas somente - Vou para a esquerda a 2 metros”. Esta falta de subdivisa˜o atrapalha a utilizac¸a˜o de escalas. Imagine a dificuldade em medir uma sala, por exemplo, sem a subdivisa˜o da medida de metro! Seria imposs´ıvel. Dessa forma necessita- mos de particionar os inteiros, o que equivale a dizer em racionaliza´-los: Q = ZZ ou Q = {...−12 , 0, 12 ...} ou Q = {−Z∗Z∗ , 0, Z ∗ Z∗ } Obs: O s´ımbolo * significa a auseˆncia do zero. Por isso o zero dentro do conjunto. • Irracionais: simples. Todos os nu´meros que na˜o podem ser calssifi- cados em nenhum dos casos acima dizemos ser irracionais. Por isso este conjunto esta´ posicionado fora dos demais, nao˜ sendo nem um sub- conjunto e ta˜o menos um conjunto maior. A figura 15 demonstra, por diagrama de Venn, como as classes dos conjuntos esta˜o organizadas (classificados). Figura 15: Conjuntos Nume´ricos 25 Resumo: 1. ℵ → Contagem 2. Z → Refereˆncia 3. Q→ Subdivisa˜o (frac¸a˜o) 4. I → Outros na˜o classificados Mas esta classificac¸a˜o somente e´ va´lida para os dados ditos quantitativos ou nume´ricos. Os demais dados, como por exemplo a classificac¸a˜o de sexo masculino e feminino, na˜o podem ser agrupados em nenhum dos conjuntos referidos acima devido a sua propriedade de classe na˜o nume´rico, afinal que nu´mero e´ ”masculino”? Que nu´mero e´ ”feminino”? Em outras palavras exis- tem outros tipos de varia´veis que devemos nos atentar de sua existeˆncia. Na estat´ıstica ha´ outras varia´veis de interesse ta˜o importantes quanto as nume´ricas: o me´dico quer saber se o tratamento surtiu ou na˜o surtiu o efeito desejado no paciente, o administrador quer saber se suas vendas foram classificadas como o´timas, boas, regulares ou insuficientes, o psico´logo quer saber se um teste psicote´cnico tem o poder de selecionar as pessoas como aptas ou na˜o aptas, enfim existem inumerosas outras varia´veis que na˜o esta˜o dentro do conjunto nume´rico dos reais <. Estas mensurac¸o˜es sa˜o poss´ıveis sob classes de dados qualitativos: ”gosto (sim,na˜o)”,”alto/me´dio/baixo”, ”apto/na˜o apto”, ”classe A,B,C,D,E...”entre outras varia´veis ditas na˜o nume´ricas. Portanto, na˜o basta apenas classificar as varia´veis nume´ricas! Dados quantitativos e qualitativos • Quantitativos: Constituem nu´meros que representam contagens ou medi- das, como as discutidas na sec¸a˜o anterior. 1. Discretos: Resultam num conjunto finito de valores poss´ıveis, ou de um conjunto enumera´vel de valores poss´ıveis. 2. Cont´ınuos: Resultam em nu´mero infinito de valores poss´ıveis que podem ser assiciados a pontos em uma escala cont´ınua de tal maneira que na˜o haja lacunas ou interrupc¸o˜es. • Qualitativos: Sa˜o atributos que podem ser separados em diferentes cate- gorias que se destinguem por alguma caracter´ıstica na˜o-nume´rica. Esta classificac¸a˜o deve ser cuidadosa, pois muitas das vezes no´s mesmos nos confundimos se as espe´cies das varia´veis podem (ou na˜o) apresentar al- guma ordenac¸a˜o, como o que ocorre com os conjuntos nume´ricos. Vide a varia´vel ”stress”: em um sentido mais restrito esta varia´vel pode estar presente ou ausente em uma determinada pessoa e, neste caso, classifi- camos tal como ”sim”ou ”na˜o”. Neste formato a sua resposta n~ao pode ser ordenada. Afinal, a sequ¨eˆncia correta e´ ”sim-na˜o”ou ”na˜o-sim”? Por 26 outro lado podemos propor ”graus de stress”referindo-nos aos estados de n´ıveis estressantes ”maior, me´dio e menor”e, que desta forma, pode sim e deve ser ordenado. Nı´veis de Mensurac¸a˜o dos dados Iniciaremos este estudo por uma pergunta: ”Como voceˆ classificaria estas varia´veis: Maior/Menor; Feminino/Masculino; Pequeno/Me´dio/Alto e os anos de 2010/2011/2014?” Por incr´ıvel que parec¸a estas varia´veis qualitativas tambe´m apresentam inu´meras propriedades suficientes e classificato´rias. Estas possibiliades propciam a criac¸a˜o de subconjuntos que podem ser dispostos em diagramas de Venn - iguais aos conjuntos nume´ricos. Figura 16: Nı´veis de Mensurac¸a˜o • Nominal: e´ o n´ıvel que caracteriza-se apenas por nomes, ro´tulos ou categorias. Sa˜o muito comuns nas varia´veis ditas dicotomizadas, isto e´, sa˜o respostas com ”dupla entrada”como as representadas por 0 e 1 (sim/na˜o). Uma restric¸a˜o importante deste n´ıvel de mensurac¸a˜o e´ a im- possibilidade da disposic¸a˜o ordenada - na˜o tem sentido! Um exemplo simples e´ saber qual a ordem correta dos sexos, se Feminino/Masculino ou Masculino/Feminino, qual seria a mais adequada? Por vezes, os nu´meros inteirosZ podem aparecer como unidades deste n´ıvel nominal, mas classi- ficados na˜o como nu´meros mas sim como categorias na˜o ordenadas. Na˜o teˆm significado algum em termos de ordenac¸a˜o. Estes casos sa˜o cla´ssicos em n´ıveis nominiais de estados de status: ligado (1) ou desligado (0) - e- xemplo de sistemas eletroˆnicos, ou em estados de alocac¸a˜o: ”voto em...”(1) ”na˜o voto em...”(0) nos estudos de opinia˜o pu´blica, ou em estados de 27 aceitac¸a˜o: ”aceito”(1) ”na˜o aceito”(0) como nos casos do controle de quali- dade dos atributos de pec¸as em compras. A classificac¸a˜o nominal e´ o n´ıvel qualitativo de rotulac¸a˜o ou categorizac¸a˜o da varia´vel desde que na˜o ordenado. • Ordinal: e´ o n´ıvel que caracteriza-se por dados que podem ser dispostos por alguma ordem. Este n´ıvel de mensurac¸a˜o e´ mais evoluido que o n´ıvel anterior nominal de mensurac¸a˜o, uma vez que a sua ordenac¸a˜o ja´ faz sentido. E´ comum algum n´ıvel de mensurac¸a˜o nominal dividir-se em va´rios subn´ıveis ordina´rio, e´ o caso da varia´vel de estados status. Embora a sua resposta e´ pela presenc¸a ou pela falta de algum fator de reconhecimento (sim ou na˜o - por exemplo), pode-se atribuir ao reconhecimento de padra˜o os subn´ıveis de ordenac¸a˜o chamado de subestados de gradac¸a˜o (grau). Vamos a um exemplo: pessoas com/sem stress. Esta medida pode ser decomposta em subn´ıveis de stress alto, stress me´dio e stress baixo, ou enta˜o a gradac¸a˜o A,B,C. Por outro lado este n´ıvel de mensurac¸a˜o na˜o e´ completo! Existe a impossibilidade de mensurar a diferenc¸a entre os subn´ıveis. Na˜o faz sentido tirar a diferenc¸a entre o nu´meros de pessoas com stress alto do nu´mero de pessoas com stress baixo, pois sa˜o n´ıveis de gradac¸a˜o distintos, e portanto, qualidades bem diferentes. E´ o mesmo caso que ocorre com os subn´ıveis ”alto”, ”me´dio”e ”baixo”. Teria algum sentido a diferenc¸a entre 10 pessoas baixas com 5 pessoas altas? A resposta seria enta˜o 5 pessoas, mas seriam elas altas ou baixas? A classificac¸a˜o ordinal e´ o n´ıvel qualitativo de categorizac¸a˜o ordinal da varia´vel desde que as diferenc¸as entre os n´ıveis na˜o fac¸am sentido. • Intervalar: e´ o n´ıvel que caracteriza-se por dados que permitem a diferenc¸a entre seus valores. Equivalente e ana´logo ao n´ıvel ordi- nal com a possibilidade do sentido da diferenc¸a entre as suas varia´veis tornarem-se reais. Faz com que o n´ıvel intervalar e´ o n´ıvel mais evolu´ıdo que o ordinal e, por sua vez, bem mais evolu´ıdo que o nominal. Podemos determinar diferenc¸as significativas entre dados. Vamos a um exemplo simples: suponha um partido pol´ıtico que ganhou as eleic¸o˜es para va´rios cargos pol´ıticos no munic´ıpio durante os anos de 1990, 1998, 2003, 2007, 2009 e 2010. Nota-se que a sequeˆncia de vito´rias foram em 8 anos (1998- 1990), 5 anos (2003-1998), 4 anos (2007-2003), 2 anos (2009-2007) e 1 ano (2010 - 2009), o que podemos concluir? Conclu´ımos que a ac¸a˜o par- tida´ria foi eficaz para alcanc¸ar a vito´ria nas urnas, a diferenc¸a entre as seguidas vito´rias nas urnas tendem a ser menores no decorrer da evoluc¸a˜o dos anos. Isto e´ um exemplo de medida intervalar. Mas qual seria a in- terpretac¸a˜o da raza˜o entre 2010 e 1990? Seria 20101990 = 1, 01005? Qual o significado deste nu´mero? Seria um ano e treˆs dias? Vemos que a raza˜o entre as varia´veis na˜o tem sentido. E´ o que dizemos ”inexisteˆnia de um ponto de partida inerente”, isto e´, na˜o existe uma refereˆncia de escala ”zero”atribu´ıvel a` raza˜o entre varia´veis. Como nem tudo e´ perfeito, este n´ıvel de mensurac¸a˜o ainda na˜o e´ completo porque e´ incapaz de interpretar a raza˜o entre as varia´veis. A classificac¸a˜o nominal e´ o n´ıvel qualitativo 28 ou o quantitativo de escala particionada cuja varia´vel apresenta sentido na diferenc¸a entre varia´veis, mas, por outro lado, na˜o ha´ interpretac¸a˜o na raza˜o entre as suas varia´veis. Idade 0 —- 7 7 —- 12 12 —- 14 14 —- 16 16 —- 18 18 —- 21 21 —- 24 24 —- 63 63 —- ... Tabela 1: Exemplo de Classes Intervalares • Raza˜o: e´ o n´ıvel que caracteriza-se por dados que permitem a raza˜o entre seus valores e todas as propriedades antecessoras a ele. Sendo o mais evolu´ıdo dos n´ıveis de mensurac¸a˜o na˜o ha´ restric¸o˜es. Esta´ associado a alguma escala de mensurac¸a˜o. Em sua maioria e´ classificado como qualitativo cont´ınuo e e´ o caso das escalas te´rmicas, bariome´tricas ou qualquer medida poss´ıvel de particionamento do valor em teste. Vamos a um exemplo da calibrac¸a˜o dos pneus de um carro. Suponhamos os sequintes calibres (em libras): 25 lb, 30 lb, 32 lb e 50 lb. A diferenc¸a entre valores faz sentido? Sim, significa que 30 lb carregou 5 libras a mais que as 25lb, por exemplo. Enta˜o ”possui”as caracter´ısticas intervalares. A raza˜o faz sentido? Sim, 50 lb e´ o dobro de 25lb. O que isto significa? Queremos dizer que 50lb25lb = 2 ou 50lb = 2X25lb, de fato e´ uma raza˜o em Q. A classificac¸a˜o racional e´ o n´ıvel mais alto e completo, caracteriza-se pela propriedade de raza˜o entre varia´veis e e´ na˜o restitivo. Nı´vel Caracter´ıstica Principal Restric¸a˜o Exemplo Nominal Nomes, ro´tulos ou categorias ordem Machos e Feˆmeas Ordinal Catego´rico ordina´rio diferenc¸a Alto/ Me´dio/ Baixo Intervalar Permite determinar diferenc¸as entre raza˜o Idade: 0—-7 / 7—-12 ... Raza˜o Permite determinar raza˜o entre na˜o ha´ 16km/h, 32km/h ... Tabela 2: Niveis de Mensurac¸a˜o dos Dados Exerc´ıcios Exercise 5 Identifique se Qualitativo ou Quantitativo. No caso Quantitativo atribua os conceitos de cont´ınuo ou discreto. 29 1. A pesquisa IBOPE entrevistou 5000 pessoas nas duas principais cidades brasileras Sa˜o Paulo e Rio de Janeiro. 2. Cada comprimido tem 9,87 mg de a´cido asco´rbico. 3. Os escores de marcac¸a˜o das pessoas fumantes variam de 0 a 100 unidades. 4. Considera-se dois grupos: um caso e outro controle. 5. Sa˜o entrevistados 3.858 pessoas para respoder um questiona´rio de 6 per- guntas. 6. Dois grupos meninos e meninas foram avaliadas em seu grau de concen- trac¸a˜o numa escala que varia entre 0 a 10. 7. Ao terminar o trabalho no computador, este ficou ligado 22h34min45seg. Exercise 6 Classifique quanto ao n´ıvel de mensurac¸a˜o 1. Nu´mero de participantes em um campeonato de footbal. 2. Dificulade da prova: 1, 2 ou 3. 3. Idade entre classes dos grupos de menores: Idade 0 —- 7 7 —- 12 12 —- 14 4. Considera-se dois grupos: I) distaˆncias em 2 e 20 metros e II) distaˆncias em 21 a 34 metros. 5. Sa˜o entrevistados 3.858 pessoas para respoder um questiona´rio de 6 per- guntas nas Classes A, B, D, D e E. 6. Mede-se a voltagem nos terminais de um cicuito ele´trico de 12 Volts e 24 Volts. 30 Medidas de Tendeˆncia Central A categoria das medidas estat´ısticas que sa˜o representadas por um u´nico valor e que definem o conceito de centralidade, para quaisquer conjunto de dados, e´ dita ser uma ”Medida de Tendeˆncia Central (Central Tendence of Measuring - CTM)”. Esta medida e´ conhecida como sendo a primeira das duas medidas estat´ısticas. Sua principal caracter´ıstica e´ a capacidade de gerac¸a˜o ou de criac¸a˜o de um e u´nico nu´mero com valor pontual, o qual exprime alguma propriedade matema´tica de refereˆncia: equil´ıbrio, meio ou aglomerac¸a˜o. Pre´ requisitos Antes de nos aprofundarmos nas medidas de centralidade, iremos apresentar resumidamente alguns conceitos importantes de sequeˆncias, se´ries, notac¸a˜o de somato´rio e de produto´rio. Conceitos Iniciais Sabemos que a soma e´ efetuada por um conjunto de parcelas, cujo resultado e´ a soma propriamente dita. Por exemplo: 5 + 3 + 1 = 9 Por outro lado, a soma dos termos com de mesma parcela e´ dita ser um produto (ou uma multiplicac¸a˜o): 3 + 3 + 3 + 3 = 3X4 = 12 e 4 + 4 + 4 = 4X3 = 12 Sequeˆncias e Se´ries O conjunto de valores somados S = {5, 3, 1} e oconjunto dos valores multipli- cados M1 = {3, 3, 3, 3} e M2 = {4, 4, 4} sa˜o ditas sequeˆncias. Qualquer colec¸a˜o 31 32 de dados que define um conjunto nu´me´rico e que apresentem em sua es- trutura alguma regra de relac¸a˜o entre os seus elementos e´ dito ser uma sequeˆncia. • Definic¸a˜o de sequeˆncia: A sequeˆncia e´ qualquer conjunto de nu´meros dispostos ordenamente, de forma que seja poss´ıvel indicar o primeiro ele- mento do conjunto, o segundo, o terceiro e o n-e´simo elemento do conjunto. • Definic¸a˜o de se´rie: Se o conjunto {an} e´ uma sequeˆncia infinita, enta˜o uma expressa˜o da forma a1+a2+ ...+an−k+ ... e´ dita ser uma se´rie infinita ou simplesmente se´rie. Observe a sequinte sequeˆncia: S = {5, 3, 1}. x1 = 5 (4) x2 = 5-2 = 3 (5) x3 = 3-2 = 1 (6) a regra de relac¸a˜o entre os termos de S = {x1, x2, x3} e´ uma progressa˜o a- ritime´tica (P.A.) de passo r = −2. Como existe alguma relac¸a˜o lo´gica interna entre todos os termos do conjunto S e, ale´m disso, podemos indentificar or- denadamente todos os termos que pertencem ao conjunto, onde o primeiro elemento do conjunto esta´ identificado por x1, o segundo elemento do conjunto por x2 e o u´ltimo termo do conjunto por x3. Dizemos que o conjunto S e´ uma sequeˆncia. Notac¸a˜o de Somato´rio Por outro lado ficaria dif´ıcil representar o conjunto S por inu´meros termos. Re- presentar qualquer conjunto por 14 elementos ja´ e´ suficientemente extenso, ob- serve: S = {5, 3, 1,−1,−3,−5,−7,−9,−11,−13,−15,−19,−21,−23}. Imagine a representac¸a˜o com 1289 elementos? Isto com certeza e´ invia´vel e impratica´vel. Suponha agora que queiramos somar todos os termos do conjunto S: (5) + (3) + (1) + (−1) + (−3) + (−5) + (−7) + (−9) + (−11) + (−13) + (−15) + (−19) + (−21) + (−23). Seria via´vel a soma com 1289 elementos? Por este motivo, representaremos adiante todas as sequeˆncias de dados nu´me´ricos pela inclusa˜o da notac¸a˜o matema´tica do somato´rio: Σ. Esta notac¸a˜o grega e´ acompanhada por termos representativos de inicializac¸a˜o da soma chamado de initial value i e da finalizac¸a˜o da mesma pelo n-e´simo valor n, dada uma sequeˆncia de soma: ∑n i . Poder´ıamos reescrever a soma da sequeˆncia acima como sendo: S = {5, 3, 1,−1,−3,−5,−7,−9,−11,−13,−15,−19,−21,−23} S = n=14∑ i=0 (5− 2i) 33 onde o somato´rio ∑n=14 i=0 pode ser verificado por: S = n=14∑ i=0 (5− 2i) i = 0→ (5− 2[0]) = 5 i = 1→ (5− 2[1]) = 3 i = 2→ (5− 2[2]) = 1 i = 3→ (5− 2[3]) = −1 ... i = n = 14→ (5− 2[14]) = −23 soma = 5 + 3 + 1− 1− 3− 5− 7− 9− 11− 13− 15− 19− 21− 23 = −135 portanto, S = n=14∑ i=0 (5− 2i) = −135 De fato, podemos representar as somas das sequeˆncias por S = {a1, a2, a3..., an} ou pela notac¸a˜o de somato´rio, quaisquer que sejam os termos que compo˜em o conjunto. Desde que os elementos apresentem alguma lo´gica: s = n∑ i=1 ai Se a soma fosse realizada com os 1289 elementos transcrever´ıamos no formato de somato´rio como S = n=1289∑ i=1 (5− 2i) Por outro lado, se o conjunto S apresentar uma quantidade infinita de elementos (∞), torna-se muito mais pra´tico e agrada´vel reescrever a se´rie com o aux´ılio do somato´rio. Ficaria representado na sequinte forma: S = {5, 3, 1,−1,−3,−5,−7,−9,−11,−13,−15,−19,−21,−23, ...} S = ∞∑ i=0 (5− 2i) ou mesmo para as soma em todo o espectro de (−∞) ate´ (∞): 34 S = {..., 5, 3, 1,−1,−3,−5,−7,−9,−11,−13,−15,−19,−21,−23, ...} S = ∞∑ i=−∞ (5− 2i) Notac¸a˜o de Produto´rio A mesma proposta pode ser utilizada para o produto. A diferenc¸a e´ que ao inve´s de usarmos o s´ımbolo de somato´rio Σ utilizaremos o s´ımbolo do pi: Π. Exemplo: Representar´ıamos a multiplicac¸a˜o dos termos da sequeˆncia S = {5, 3, 1,−1,−3,−5,−7,−9,−11,−13,−15,−19,−21,−23} por S = n=14∏ i=0 (5− 2i) Produto = (5)∗(3)∗(1)∗(−1)∗(−3)∗(−5)∗(−7)∗(−9)∗(−11)∗(−13)∗(−15)∗(−19)∗(−21)∗(−23) que fornece o valor de 4, 744.1012. Quando a necessidade for a multipicac¸a˜o dos termos da sequeˆncia utilizamos o s´ımbolo do produto´rio Π. Todas as regras explicitadas acima valem comu- mente para ambos os procedimentos de soma e do produto. Exercise 7 Desenvolva o somato´rio∑4 i=0(2 2 i − 1)∑5 i=1 ( ai+3 i+1 ) ∑n i=0 ai Exercise 8 Desenvolva o produto´rio∏4 i=1 2 i+1∏5 i=2(−1)i∏n i=0 ai Exercise 9 Escreva as sequeˆncias em forma de somato´rio Soma de A = 1 + 2 + 3 + 4 + 5 + 6 + 7 + 8 Soma de B = 2 + 4 + 6 + 8 + 10 + ... Soma de C = ...− 1 + 1− 1 + 1− 1 + 1... Exercise 10 Escreva as sequeˆncias em forma de produto´rio 35 Produto de A = 1 ∗ 2 ∗ 3 ∗ 4 ∗ 5 ∗ 6 ∗ 7 ∗ 8 Produto de B = 2 ∗ 22 ∗ 23 + 24 + ... Produto de C = ...− 1 + 1− 1 + 1− 1 + 1... Exercise 11 Problema: Dada a progressa˜o geome´trica PG: {2,4,8,16,32}. Qual a soma destes termos? 36 Tipos de Medidas CTM Me´dia E´ a medida que representa o ponto de equil´ıbrio de um conjunto de dados. O conceito de me´dia vai ale´m da conhecida me´dia aritime´tica. Em f´ısica, por exemplo, a posic¸a˜o exata do equil´ıbrio mecaˆnico para um sistema de part´ıculas e´ dada pela me´dia poderada entre a distribuic¸a˜o das massas e a distaˆncia destas massas ate´ um certo ponto de refereˆncia cartesiano, normalmente escolhido pelo calculista. Sua equac¸a˜o e´ dada por: xcm = m1x1 +m2x2 m1 +m2 (7) Figura 17: Sistemas de Part´ıculas Por este motivo e´ que a me´dia foi comparada pelos estat´ısticos como sendo uma medida de equil´ıbrio. De fato, todo e qualquer equil´ıbrio dependera´ da distribuic¸a˜o das part´ıculas (ou das massas, ou da disposic¸a˜o dos corpos) em torno de algum eixo de refereˆncia. A melhor medida de equil´ıbrio para qualquer distribuic¸a˜o das part´ıculas, ou da massa, ou dos corpos e´ calculada atrave´s da centralidade dada pela me´dia poderada em relac¸a˜o a` disposic¸a˜o destas massas ate´ o eixo de refereˆncia. • Definic¸a˜o Cla´ssica: E´ uma medida de centralidade que designa o ponto de equil´ıbrio dos dados. • S´ımbolo: barra acima da letra representante do conjunto de dados: x¯ (ex. me´dia dos pesos p¯, me´dia das alturas h¯, etc...). 37 • Formalismo: Em um conjunto de valores, a me´dia aritime´tica e´ sim- plesmente dada pela soma de todos os valores pertencentes ao conjunto dividindo-os pelo total da quantidade destes dados pertencentes a este conjunto de interesse. x¯ = x1 + x2 + x3 + ...+ xn−2 + xn−1 + xn n (8) x¯ = ∑n i=1 xi n (9) A medida de me´dia no formato aritime´tico na˜o e´ a u´nica, existem outras formas que tambe´m representam algum ponto de equil´ıbrio dos dados, sa˜o elas: – Aritime´tica: e´ a formulac¸a˜o mais simples. x¯ = ∑n i=1 xi n = x1 + x2 + x3 + ...+ xn−2 + xn−1 + xn n Exemplo: Qual a me´dia do conjunto de observac¸o˜es C = {2, 5, 6, 7, 8}? C¯ = ∑5 i=1 xi n = 2 + 5 + 6 + 7 + 8 5 = 5, 6 Interpretac¸a˜o: A me´dia do conjunto C e´ dado por 5,6 valores. – Geome´trica: e´ devido aos resultados dos valores oriundos das se- queˆncias em progressa˜o geome´trica (P.G.). Muito utilizadas em econo- mia, conta´beis e administrac¸a˜o como sendo o valor de equil´ıbrio das taxas me´dias de variac¸a˜o, crescimento ou das razo˜es me´dias. Esta me- dida geome´trica torna os ca´lculos de variac¸a˜o de taxas mais fided´ıgnas do que a me´dia aritime´tica, por exemplo. Estudos em ana´lise finan- ceira dependem de algumas das propriedades de crescimento (de- crescimento) geome´trico. Portanto, a me´dia, como consequeˆncia de processos geome´tricos, e´ formulada por: x¯ = ( n∏ i=1 xi) 1 n = n √ x1 ∗ x2 ∗ ...xn Exemplo: De acordo com os juros estipulados pelo Banco Central do Brasil, calcule o fator de crescimento me´dio para o dinheiro, com- posto por taxas mensais de juro durante os treˆs primeiros meses do 38 ano Taxas = {4%, 3%, 2%}? ¯Taxas = ( n∏ i=1 xi)1 n = 3 √ 1, 04 ∗ 1, 03 ∗ 1, 02 = 1, 0299 = 2, 99% Interpretac¸a˜o: A me´dia das taxas trimenstrais foram de 2,99% ao meˆs. – Harmoˆnica: Sinais e sistemas harmoˆnicos dependem de ca´lculos mais avanc¸ados para caracterizar va´rios comportamentos oscilantes. Existem inu´meros detalhes quanto a`s taxas de variac¸a˜o, os quais na˜o veremos neste curso devido a dependeˆncia da ana´lise em se´ries de Fourier. Mas, e´ justamente o tempo a principal varia´vel responsa´vel pelo controle: x¯ = n∑n i=1 1 xi = n 1 x1 + 1x2 + 1 x3 ...+ 1xn Exemplo: Um torno CNC trabalha com as sequintes velocidades angulares: ω = {1 rad/s, 4 rad/s, 8 rad/s}. Qual me´dia harmoˆnica das velocidades de trabalho do torno? x¯ = n∑n i=1 1 xi = 3 1 1 + 1 4 + 1 8 = 2, 182 rad/s Interpretac¸a˜o: A me´dia harmoˆnica das velocidades que o torno sustenta esta´ em 2,182 radianos por segundo. – Quadra´tica (RMS): Sa˜o medidas mais frequentemente utilizadas em experimentos f´ısicos, como por exemplo nos casos da distribuic¸a˜o de sistemas de energia ele´trica, sendo a sua tensa˜o e a corrente fornecidas em termos de valores RMS. x¯ = √√√√ 1 n n∑ i=1 x2i = √ x21 + x 2 2 + x 2 3...+ x 2 n n Exemplo: Suponha que o tranformador opere nas seguintes tenso˜es de linha VAB = {221, 220, 224, 219}. Quanto vale a a tensa˜o de operac¸a˜o me´dia V¯ em RMS deste transformador? x¯ = √√√√ 1 n n∑ i=1 x2i = √ 2212 + 2202 + 2242 + 2192 4 = 221, 00V olts 39 Interpretac¸a˜o: O transformador opera a uma tensa˜o nominal de 221 Volts (RMS). – Generalizada: E´ a extensa˜o para a RMS em termos superiores de poteˆncia e radiciac¸a˜o. Esta te´cnica e´ muito utilizada em bioin- foma´tica. x¯ = p √√√√ 1 n n∑ i=1 xpi = p √ xp1 + x p 2 + x p 3...+ x p n n Exemplo: Um contador e um adminstrador precisam utilizar uma me´dia generalizada para compor o ca´lculo das bolsas de Mercado- rias e de Futuros M&F . Com base nos sequintes ı´ndices de mercado Dts = {47, 70, 120} encontre a me´dia generalizada para compor o ca´lculo da bolsa? x¯ = p √√√√ 1 n n∑ i=1 xpi = 3 √ 473 + 703 + 1203 3 = 89, 8pontos Interpretac¸a˜o: I´ndice de composic¸a˜o da taxa: 89,8 pontos na˜o per- centuais. – Aparada: Na˜o muito conhecida pore´m muito importante quando se trata da computac¸a˜o avanc¸ada (High Computer Analisys - HC). Como a me´dia e´ muito sens´ıvel aos valores extremos, alguns progra- mas computacionais podem ser prejudicados por valores de fronteiras devido ao problema do ca´lculo nume´rico na˜o apresentar aproximac¸o˜es das propriedades matema´ticas devidas. Utiliza-se do mecanismo da me´dia aparada com a finaldiade de corrigir os valores discrepantes que viesam o ca´lculo anal´ıtico em deterimento do ca´lculo nume´rico. x¯ = ∑n i=1 xi [−(k%) ↑↓] n – Heroniana: Seu uso e´ mais abrangente na matema´tica pura e avanc¸ada, principalmente em teoria da medida. x¯ = 2 n(n+ 1) n∑ i=1 n∑ j=1 √ xixj – Poderada: Esta sera´ discutida mais profundamente por se tratar da mais importante de todas as me´dias. 40 Como mostramos, a me´dia pode ser formulada das mais diversas maneiras, desde que as suas equac¸o˜es contenham o conceito matema´tico de equil´ıbrio. • Definic¸a˜o Formal: A definic¸a˜o formal da me´dia e´ dada por: E(X) = ∞∑ i=1 xiP (xi) → discretos (10) E(X) = ∫ ∞ i=1 xiP (xi)dx → continuos (11) que chamamos de Esperanc¸a Matema´tica. Todas as equac¸o˜es acima que apresentamos, tais como a me´dia aritime´tica, a geome´trica, a harmoˆnica e entre outras formas sa˜o originadas a partir da pro´pria definic¸a˜o formal apresentada aqui. Os ca´lculos na˜o sa˜o tiviais e muitas das vezes necessitam de ca´lculos da computac¸a˜o avanc¸ada. Me´dia Poderada Iniciaremos este conceito com um exemplo pra´tico. Exemplo: Suponha os pesos e as notas de um certo aluno na disciplina de estat´ıstica. Qual seria a me´dia do aluno? Peso Nota Prova 1 40% 97 Prova 2 40% 80 Trabalho 20% 68 Tabela 3: Notas da Prova x¯ = 40% ∗ 97 + 40% ∗ 80 + 20% ∗ 68 40% + 40% + 20% = 84, 4 o que equivale a escrever como: x¯ = ∑n i=1 ωixi∑n i=1 ωi (12) onde ωi sa˜o os pesos referentes a` prova. Dizemos que a equac¸a˜o 12 e´ a me´dia ponderada dos valores de xi vinculados e dependentes dos pesos ωi. Isto significa que cada peso da´ uma maior importaˆncia a determinadas varia´veis. Em nosso caso seriam ambas as provas terem valores de importaˆncia maior do que o valor do trabalho. 41 Figura 18: Media Ponderada • Definic¸a˜o da Me´dia Poderada: E´ a soma de todos os valores com as suas respectivas e destintas importaˆncias em relac¸a˜o a todos os outros dados do conjunto. Define-se o formalismo por: x¯ = ∑n i=1 ωixi∑n i=1 ωi (13) x¯ = n∑ i=1 xi ∗ ( ωi∑n i=1 ωi ) (14) fazendo p(xi) = ( ωi∑n i=1 ωi ) (15) x¯ = n∑ i=1 xipi (16) Define-se a me´dia ponderada por x¯ = ∑n i=1 ωixi∑n i=1 ωi (17) ou x¯ = n∑ i=1 xipi (18) onde pi pode ser a func¸a˜o referente a uma proporc¸a˜o - p̂i, a algum peso qualquer-ω ou a alguma frequeˆncia de observac¸o˜es-f nos (dos) da- 42 dos. – Quando os pesos referem-se a`s proporc¸o˜es escrevemos a me´dia pon- derada por x¯ = n∑ i=1 xip̂(xi) (19) com p̂(xi) = ( p̂i∑n i=1 p̂i ) (20) – Quando os pesos referem-se a quaisquer ponderac¸a˜o ω escrevemos a me´dia ponderada por x¯ = n∑ i=1 xipi (21) com pi = ( ωi∑n i=1 ωi ) (22) Este formato e´ utilizado em todos os casos. – Quando os pesos referem-se a`s frequeˆncias escrevemos a me´dia pon- derada por x¯ = n∑ i=1 xifi(xi) (23) com f(xi) = ( fi∑n i=1 fi ) (24) Ete formato e´ oficialmente utilizado em tabelas de frequeˆncias. Espereanc¸a Matema´tica Se definirmos pi como sendo a probabilidade de ocorrer xi, a equac¸a˜o 18 torna-se a esperanc¸a matema´tica: x¯ = n∑ i=1 xip(xi, θ) (25) com p(xi, θ) = ( p(θ)∑n i=1 p(θ) ) (26) • Definic¸a˜o rigorosa da esperanc¸a matema´tica: Se X e´ uma varia´vel aleato´ria discreta com probabilidade p(xi, θ), tal que ∑∞ i=1 p(xi, θ) = 1 e 0 < p(xi, θ) < 1, temos que a esperanc¸a matema´tica e´ definida por: 43 E(X) = ∞∑ i=1 xip(xi; θ) = ∞∑ i=1 P (X = xi) (27) se o espectro e´ discreto com p(xi) a probailidade e, E(X) = ∫ ∞ i=1 xif(xi; θ)dx = ∫ ∞ i=1 F (X = xi)dx (28) se o espectro for cont´ınuo, dizemos que f(xi) e´ a densidade de probabili- dade. Se o espectro for discreto, dizemos que p(xi) e´ a probabilidade verdadeira. Para o caso discreto, a soma na˜o depende da ordem dos termos e a se´rie em particular devera´ ser absolutamente convergente - quanto a` soma ∑ i |xi|p(xi) < ∞. A definic¸a˜o tambe´m sera´ va´lida para o espectro cont´ınuo sob condic¸o˜es de extrapolac¸a˜o via o teorema fundamental do ca´lculo. A esperanc¸a de X e´ tambe´m chamada de me´dia. Mediana E´ a medida que representa o valor do meio entre os dados. Numericamente este dado encontra-se exatamente entre os 50% dos valores maiores e 50% dos valores menores. Antes de nos aprofundarmos mais sobre o assunto, entenda sobre a definic¸a˜o de Rol. Rol Grupos que se diferenciam pela ordem ou pela natureza dos seus elementos sa˜o chamados de arranjos. Para n elementos distintos, o nu´mero de grupos com k elementos cada pode ser expresso por Akn = n! (n− k)! (29) desde que sem repetic¸a˜o e k ≤ p. Por exemplo, os elementos do conjunto S = {2, 8, 4} podem ser alocados da sequinte forma: • Treˆs conjuntos cada qual com um e u´nico elemento (k = 1), isto e´: – Ca´lculo: A13 = 3! (3−1)! = 3! 2! = 3, – Conjuntos: S1 = {2}, S2 = {4} e S3 = {8}. • Seis conjuntos com dois elementos cada (k = 2), isto e´: –Ca´lculo: A23 = 3! (3−2)! = 3! 1! = 6, 44 – Conjuntos: S1 = {2, 8}, S2 = {8, 2}, S3 = {2, 4}, S4 = {4, 2}, S5 = {8, 4} e S6 = {4, 8}. • Seis conjuntos com treˆs elementos cada (k = 3), isto e´: – Ca´lculo: A23 = 3! (3−3)! = 3! 0! = 6, – Conjuntos: S1 = {2, 8, 4}, S2 = {2, 4, 8}, S3 = {8, 2, 4}, S4 = {2, 4, 8}, S5 = {8, 4, 2}, S6 = {4, 8, 2}. Observe a u´ltima formac¸a˜o (k = 3). Neste arranjo, em que k = n, mostra-nos que sempre havera´ uma classe de arranjos com a mesma quantidade de elemen- tos de sua formac¸a˜o original, isto e´, seis conjuntos com a quantidade de treˆs elementos cada. Isto significa que para um arranjo a ordem da alocac¸a˜o faz muito sentido. Portanto, podemos propor a composic¸a˜o da sequinte formac¸a˜o k = n: Ann = P n = n!, (30) em que dizemos ser uma permutac¸a˜o do conjunto S. Classificamos como rol qualquer um dos conjuntos formados pela permutac¸a˜o de seus elementos desde que os seus dados estejam em ordem crescente ou em ordem decrescente. No caso acima, o rol crescente e´ formado por S4 = {2, 4, 8} e o rol decrescente por S5 = {8, 4, 2}. Caracter´ısticas da Mediana • Definic¸a˜o Cla´ssica: E´ uma medida de centralidade que designa o valor do meio em um rol de valores dos dados. • S´ımbolo: Til abaixo da letra representante do conjunto de dados: x (ex. me´dia dos pesos p, me´dia das alturas h, etc...). • Formalismo:Dado um rol crescente de valores oriundos de um conjunto de observac¸o˜es, a mediana e´ calculada pela posic¸a˜o – I´mpar: Uma vez formado o rol crescente, o valor desconhecido da mediana X esta´ alocado na posic¸a˜o [n+12 ] dentro dos colhetes. x = X [ n+ 1 2 ] , (31) – Par: Uma vez formado o rol crescente, o valor desconhecido da mediana de X esta´ alocado entre as posic¸o˜es [n2 ] e [ n 2 + 1]. Este caso em espec´ıfico precisara´ da ajuda de outra medida de tendeˆncia central: a me´dia. Devido a esta complicac¸a˜o a mediana torna-se dependente de conceito quando a quantidade de elementos de um conjunto qualquer e´ par. Torna-se comum retirar a me´dia de ambos os valores alocados nas posic¸o˜es referidas. x = X[n2 ] +X[ n 2 + 1] 2 , (32) 45 Em um conjunto de valores, a mediana e´ dada pelo valor alocado na posic¸a˜o do segundo quartil pela ordenac¸a˜o do rol crescente. E´ o valor do aritime´tico de valor ”inter-meio”e por isso e´ chamado de ”medi- ana”do conjunto. Exemplo 1 . Suponha o sequinte conjunto de medidas do comprimento da circunfereˆncia C = {6.280; 6.282; 6.284; 6.294; 6.282} Figura 19: Uma vez alocado em rol crescente, o valor da mediana e´ 6,282 por exclusa˜o dos valores extremos. Podemos encontrar o valor da mediana pelo ca´lculo2 # ı´mpar: 1. Nu´mero de elementos do conjunto C: #C = 5 valores 2. A mediana e´ dada por x = X [ n+1 2 ] = X [ 5+1 2 ] = X[3], 3. A mediana X encontra-se exatamente na 3o posic¸a˜o, isto e´, X[3] = 6, 282 Exemplo 2. Suponha a inclusa˜o de mais uma medida de circunfereˆncia: C = {6.280; 6.282; 6.284; 6.294; 6.282;6.300} Podemos encontrar o valor da mediana pelo ca´lculo # ı´mpar: 1. Nu´mero de elementos do conjunto C: #C = 6 valores 2. A mediana e´ dada por x = X[n2 ]+X[ n 2+1] 2 = X[ 62 ]+X[ 6 2+1] 2 = X[3]+X[4] 2 , 2O s´ımbolo # aqui representado significa a quantidade, ou o nu´mero total de elementos que compo˜em o conjunto de dados. Ex. A = {2, 8, 3, 9} enta˜o #A = 4 46 3. A mediana X encontra-se entre a 3o e a 4o posic¸a˜o, isto e´, x = X[3]+X[4]2 = 6, 283 Moda E´ a medida que representa o valor com a maior repetic¸a˜o dos dados. Temos que tomar cuidado com a distinc¸a˜o em func¸o˜es de ma´ximo local e ma´ximo global. A moda e´ o ma´ximo global de uma func¸a˜o ou distribuic¸a˜o. Nem todas as func¸o˜es apresentam moda, e´ o caso da func¸a˜o afim y = ax + b. Seu ma´ximo global encontra-se no infinito (±∞), o que inviabiliza a utilizac¸a˜o da moda como uma medida de tendeˆncia central. • Definic¸a˜o Cla´ssica: E´ uma medida de centralidade que designa o valor com a maior repetic¸a˜o de valores no conjunto de dados ou, no caso de func¸o˜es, o ma´ximo global. • S´ımbolo: A mediana pode ser representada por um ı´ndice de MOda: xmo; ou por um chape´u: xˆ. • Formalismo:A moda pode ser encontrada por duas formas: ou pelo valor de maior repetic¸a˜o em um conjunto de dados ou pelo estudo das func¸o˜es. – Maior Repetic¸a˜o: E´ dada pela frequeˆncia com que determinado valor aparece. xˆ =Max{freq(x)} – Ma´ximo Global: E´ dado pela maximizac¸a˜o da func¸a˜o quando sua primeira derivada e´ nula e a segunda derivada for negativa, o que exprime a concavidade para baixo. df(x) dx = 0 (33) d2f(x) dx2 < 0 (34) Exemplo 1: Suponha o conjunto de dados C = {2,3,5,5,5,5,6,8,7}. Qual a moda? A moda sera´ dada pelo valor nume´rico que mais se repete (ma´ximas repetic¸o˜es). Neste caso e´ o nu´mero xˆ = 5, pois o valor 5 repete-se quatro vezes (ou #5 = 4). Exemplo 2: Dada a equac¸a˜o y = −3x2 + 2x+ 10 representativa de alguma distribuic¸a˜o de frequeˆncias. Qual o valor da moda? A resoluc¸a˜o e´ dada por df(x) dx = d(−3x2 + 2x+ 10) dx = −3(2)x+ 2 = 0→ x = 6 2 = 3 (35) d2f(x) dx2 = d2(−3x2 + 2x+ 10) dx2 = d(−3(2)x+ 2) dx = −6 < 0→ c.q.d (36) 47 A moda e´ xˆ = 3, cuja frequencia e´ dada por y = −3(3)2+2(3)+10 = 7. Exemplo 3: Existe moda em C = {2, 4, 5, 6, 7}? Na˜o, pois na˜o ha´ repetic¸a˜o de valores. Ponto Me´dio E´ a medida que representa o ponto de pseudo-equil´ıbrio entre os extremos dos valores. Na˜o e´ uma medida muito utilizada devido a sua fragilidade de interpretac¸a˜o. Normalmente aplica-se esta medida de ponto me´dio em ca´lculos que envolvam varia´veis intervalares como nas tabelas de frequeˆncias para encontrar o ponto me´dio da classe. • Definic¸a˜o Cla´ssica: E´ uma medida de quasi centralidade que designa o valor de pseudo-equil´ıbrio entre os extremos dos valores no conjunto de dados. • S´ımbolo: O ponto me´dio pode ser representada pelo pro´prio s´ımbolo da me´dia, mas com o ı´ndice PM: x¯PM . • Formalismo:Simplesmente a me´dia dos extremos x¯PM = X[maior] +X[menor] 2 No caso de tabelas de frequeˆncias a me´dia de uma tabela destas e´ dada pela me´dia poderada: x¯ = n∑ i=1 xifi(xi) (37) com f(xi) = ( fi∑n i=1 fi ) (38) sendo que a varia´vel xi ≡ x¯PM em uma classe e´ definida pelo ponto me´dio como x¯pm = valor superior + valor inferior 2 (39) Exemplo 1 . Frequeˆncia de pessoas e jovens que apresentam distu´rbios alimentares nos u´ltimos 20 dias em um consulto´rio: Relac¸a˜o Emp´ırica entre as Treˆs Principais Medidas de CTM: Me´dia/Moda/Mediana Para curvas de frequeˆncia unimodal moderadamente inclinadas podemos rela- cionar empiricamente a distaˆncia entre as treˆs medidas principais de tendeˆncia 48 Classes (Idade) frequencias Ponto medio 01-09 9 x¯[01−09] = 09+012 = 4 10-19 3 x¯[10−19] = 19+102 = 14, 5 20-29 5 x¯[20−29] = 20+292 = 24, 5 Tabela 4: Se´rie Espec´ıfica central. Esta verificac¸a˜o na˜o e´ uma propriedade geral das distribuic¸o˜es e por- tanto devemos tomar cuidado com a sua utilizac¸a˜o e principalmente com a sua interpretac¸a˜o. A relac¸a˜o emp´ırica pode ser modelada por: Media − Moda = 3( Media − Mediana) (40) ou (x¯− xˆ) = 3(x¯− x) (41) Figura 20: Curvatura. Esta relac¸a˜o sera´ u´til para caracterizar futuramente as treˆs possibilidades de deslocamento da curva: assimetria para a esquerda, assimetria para a direita e simetria completa. Ale´m destas opc¸o˜es existem ainda outras treˆs possibilidades de achatamento da curva que sa˜o: leptocurticidade, platicurticidade e mesocur- ticidade. Veremos na sequeˆncia deste estudo como mensurar estas formas de caracterizac¸a˜o das distribuic¸o˜es dos dados e, que em muitas das vezes, sa˜o de- pendentes das demais propriedades demedida de tendeˆncia central e de medida de dispersa˜o (ou variabilidade). Para isso, torna-se necessa´rio interpretar a segunda medida estat´ıstica: Medidas de Dispersa˜o e Variabilidade. 49 RESUMO TCM (nome) S´ımbolo Definic¸a˜o Fo´rmula Existeˆncia Me´dia x¯ ”Equil´ıbrio” ∑∞ i=1 xip(xi) Existe Sempre∫∞ i=1 xif(xi)dx Existe Sempre Mediana x ”Meio” impar → X [n+12 ] Pode Existir par → X[n2 ]+X[n2+1]2 Pode Existir Moda xˆ ”Maior repetic¸a˜o” Max{freq(x)} Pode Na˜o Existir Ponto Me´dio x¯PM ”Entre extremos” maior+menor 2 Existe Sempre Tabela 5: Resumo 50 Exerc´ıcios Exercise 12 Encontre a me´dia, a moda e a mediana dos sequintes conjuntos: 1. Conjunto A = {1, 8, 7, 6, 8, 7, 5, 2, 3, 7, 8, 1, 5}. 2. Conjunto B = {2.054; 1.658; 2.365; 0.635; 2.602}. 3. Conjunto C = {7%; 8%} 4. Conjunto D = {6.280; 6.282; 6.284; 6.294; 6.282}. 5. Conjunto E = {−5.6;−8.47; 9.3;−9.45; 8.00; 4.58}. Exercise 13 Utilize a me´dia ponderada nos sequintes problemas: 1. Quantidade de produtos vendidos. O peso e´ a importaˆncia do produto para o vendedor (participac¸a˜o nos lucros). Peso ωi Quantidade 2 5 4 9 6 6 8 7 Tabela 6: Exercicio 2.1 2. Frequeˆncia dos crimes X Nu´mero de criminosos envolvidos no u´ltimo car- naval. Tipo de Ac¸a˜o Criminosa Frequeˆncia fi Nu´mero Roubo de Cargas 1 28 Assalto a ma˜o armada 4 19 Roubo em joalherias 12 8 Estelionato 20 2 Tabela 7: Exercicio 2.2 51 3. Quantidade de pessoas satisfeitas com um certo produto por classe de idade. Faixa de Idade Frequeˆncia 20 - 25 1024 26 - 31 580 32 - 37 256 38 - 43 128 44 - 49 45 Tabela 8: Exercicio 2.3 Exercise 14 Defina o arranjo em conjuntos de um, treˆs e quatro elementos; a permutac¸a˜o e o rol do seguinte conjunto de dados: A = {1, 8, 7, 6, 8, 5}. Ache a mediana. Exercise 15 Teste a relac¸a˜o emp´ırica nos conjuntos abaixo e fac¸a o gra´fico (se existir): Conjunto A = {1, 9, 5, 4, 8, 5, 6, 5, 2, 5, 5}. Conjunto B = {1.65, 1.59, 1.56, 1.65, 1.65, 1.62}. Conjunto C = {1, 2, 3, 4, 5, 6, 7, 8, 9}. 52 Medidas de Dispersa˜o ou Variabilidade Medidas de Dispersa˜o ou de Variabilidade e´ a mensurac¸a˜o do grau de distan- ciamento, afastamento ou deslocamento em que todos os dados medidos esta˜o dispostos em relac¸a˜o a uma Medida de Tendeˆncia Central (sempre). Conceitos Matema´ticos Fundamentais Diferenc¸a entre Distaˆncia e Deslocamento • Deslocamento: tambe´m conhecida como variac¸a˜o na posic¸a˜o ∆x. O deslocamento e´ a diferenc¸a matema´tica entre o valor da posic¸a˜o final e da posic¸a˜o inicial. Assume os sinais positivo e negativo como sendo refereˆncias por convenc¸a˜o, ora para mais ora para menos, respecti- vamente. Ex: −2 + 3 = −1 ou 4 − 2 = 2. Os sinais podem pressupor tambe´m os n´ıveis de mensurac¸a˜o de ”ganho (+)”e ”perda (−)”, ”direita (+)”e ”esquerda (−)”, ”para cima (+)”e ”para baixo (−)”, etc... • Distaˆncia: e´ somente uma aritime´tica de subtrac¸a˜o, apenas. Na˜o leva em conta o sinal dos valores. Na˜o faz sentido nenhum qualquer convenc¸a˜o de grupo, apenas exprime uma diferenc¸a nume´rica. Em matema´tica a simbologia para estes casos e´ o uso do mo´dulo |x|, indicativo de distaˆncia. ”Qual a distaˆncia entre o trabalho e a sua casa? Talvez 42 km”. Na˜o dizemos se para mais ou para menos. Teorema de Pita´goras O teorema de pita´goras e´ um dos principais teoremas matema´ticos. A sua uti- lizac¸a˜o e´ ilimitada, inclusive nos conceitos em estat´ıstica. Mas o que vem a ser este teorema de Pita´goras? Tudo parte de uma figura, portanto vide o desenho esquema´tico em 21. Note que o triaˆngulo retaˆngulo e´ formado por treˆs arestas conhecidas como: cateto 1, cateto 2 e a maior aresta chamada de hipotenusa. Se criarmos treˆs a´reas quadradas, cada qual com os seus lados formados pelas arestas do triaˆngulo retaˆngulo, um resultado interessante encontraremos: ”a 53 54 soma das a´reas dos quadrados formados pelos catetos e´ igual ao quadrado cuja a´rea e´ formada pela hipotenusa”, ou como conhecido ”a soma do quadado dos catetos e´ igual ao quadrado da hipotenusa”. Figura 21: Pita´goras Matematicamente poderemos expressar este conceito por: h2 = c21 + c 2 2 h2 = n=2∑ i=1 c2i A definic¸a˜o da hipotenusa pode ser extendida para inu´meros catetos no hiper- espac¸o: h2 = n=k∑ i=1 c2i Erros Qual o valor de Π exato? Pois bem, esta e´ uma questa˜o que nunca saberemos. O u´nico conhecimento seguro sobre a constante de Π e´ que ela e´ o resultado da raza˜o sempre existente entre o comprimento de qualquer circunfeˆncia com o seu diaˆmetro, isto e´, Π = CD . O fato da aproximac¸a˜o do valor exato ser imprecisa, gera-se o conceito de erro34, isto e´, o erro � e´ a diferenc¸a entre o valor medido e o valor verdadeiro, esta u´ltima nunca e jamais teremos acesso. � = valor medido − V ERDADE (42) 3Existe um cap´ıtulo apenas para esta definic¸a˜o. 4Muitos autores o tratam como sendo � = valor real − valor medido, na verdade tanto faz, desde que fique impl´ıcito a diferenc¸a existente entre ambos valores. 55 A equac¸a˜o acima e´ conceitual pelo simples motivo de na˜o podermos jamais calcular o seu valor �. Se na˜o soubermos qual e´ o valor verdadeiro nunca sabe- remos a diferenc¸a entre este e o medido. Figura 22: Valor Pi Natural Para resolver esta questa˜o teremos que voltar ao conceito da ”Medida de Tendeˆncia Central”. Desvio E´ uma medida de deslocamento. Lembramos que a me´dia pode ser interpre- tada como um ponto de equil´ıbrio entre os dados. Foi definido exatamente pela esperanc¸a matema´tica E(x), esta u´ltima que nos faz remeter a uma medida de centralidade de equil´ıbrio: a me´dia; a melhor estimativa para representar o valor desconhecido e, de fato, verdadeiro. Pois bem, iremos substituir o valor verdadeiro (natural) de Π por um valor artificial, uma medida retirada da me´dia das inu´meras sequeˆncias sucessivas cujas aproximac¸o˜es sa˜o poss´ıveis ora por arredondamento, ora por truncamento, ora por outra aproximac¸a˜o justamente para encontrar uma medida de tendeˆncia central para a constante Π¯ = ∑n i=1 Πi n . Mecanismo Valor Aproximado Exclusa˜o 3,140 Truncamento 3,141 Arredondamento 3,142 Erro Grosseiro 3,143 Truncamento 3,141 Valor da Me´dia: Π¯ p¯i = 3,1414 Tabela 9: Aproximac¸o˜es do valor de Π→ Π¯: Medida de Tendeˆncia Central Designaremos uma nova medida: o desvio, como sendo a diferenc¸a entre o valor medido x e a me´dia do conjunto de observac¸o˜es x¯, em troca 56 Figura 23: Valor Pi aproximado (me´dio) deste u´ltimo pelo valor verdadeiro. Ta´ı a diferenc¸a entre o erro � e o desvio d: a substituic¸a˜o do valor verdadeiro e imposs´ıvel por um certo valor conhecido, fict´ıcio, poss´ıvel e acess´ıvel, existente na maioria de todos os conjuntos de dados: a me´dia. d = valor medido − MEDIA (43) d = valor medido − x¯ (44) Mecanismo Valor Aproximado Me´dia calculada desvio d Exclusa˜o 3,140 p¯i =3,1414 -0,00140 Truncamento 3,141 p¯i =3,1414 -0,00040 Arredondamento 3,142 p¯i =3,1414 0,00060 Erro Grosseiro 3,143 p¯i =3,1414 0,00160 Truncamento 3,141 p¯i =3,1414 0,00040 Valor da Me´dia: Π¯ p¯i = 3,1414 Tabela 10: Ca´lculo do desvio d = medido− p¯i O valor verdadeiro e´ natural e somente a natureza sabe e teˆm acesso im- prescidivelmente. Totalmente contra´rio de no´s. Temos inu´meras fontes de erros que podem influenciar na mensurac¸a˜o dos dados, esta incerteza gera a impre- cisa˜o impl´ıcita na coleta e no registro dos mesmos. Ja´ a me´dia e´ um valor artificial com base em alguns teoremas e colora´rios matema´ticos que demons- tram a sua capacidade de convergeˆncia para o valor natural. Vamos analisar a tabela 9. Observamos que os valores aproximados para Π dependem apenas do tipo de erro que estamos comentendo. Devido ao erro sistema´tico e por forc¸a de arredondamento, aproximac¸a˜o
Compartilhar