Baixe o app para aproveitar ainda mais
Prévia do material em texto
NOTAS DE AULA: ESTATI´STICA BA´SICA Curso: Geografia Bacharelado Profs. Fla´vio Bittencourt/Adriana Dias UNIFAL-MG / ALFENAS 2014 SUMA´RIO LISTA DE TABELAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . i LISTA DE FIGURAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ii 1 SOMATO´RIO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.1 I´ndices ou notac¸a˜o por ı´ndices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.2 Notac¸a˜o de somato´rio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.3 Propriedades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.4 Somato´rios mais usados na Estat´ıstica . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 1.5 Exerc´ıcios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 2 INTRODUC¸A˜O . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 3 ALGUMAS DEFINIC¸O˜ES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 3.1 Varia´vel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 3.1.1 Varia´veis qualitativas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 3.1.2 Varia´veis quantitativas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 3.1.3 Varia´veis independentes e dependentes . . . . . . . . . . . . . . . . . . . . . . . . . . 5 3.2 Dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 3.3 Populac¸a˜o . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 3.4 Censo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 3.5 Amostra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 3.6 Paraˆmetro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 3.7 Estimador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 3.8 Estimativa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 3.9 Exerc´ıcios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 4 ESTATI´STICA DESCRITIVA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 4.1 Apresentac¸a˜o dos dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 4.1.1 Tabelas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 4.1.2 Construc¸a˜o de tabelas de distribuic¸a˜o de frequeˆncias . . . . . . . . . . . . . . . . . . 13 4.1.3 Tipos de distribuic¸a˜o de frequeˆncias . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 4.1.4 Exerc´ıcios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 4.1.5 Gra´ficos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 4.1.6 Exerc´ıcios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 4.2 Medidas Estat´ısticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 4.2.1 Medidas de Tendeˆncia Central . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 4.2.2 Exerc´ıcios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 4.2.3 Medidas Separatrizes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 4.2.4 Exerc´ıcios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 4.2.5 Medidas de Variabilidade (Dispersa˜o) . . . . . . . . . . . . . . . . . . . . . . . . . . 35 4.2.6 Exerc´ıcios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 5 PROBABILIDADE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 5.1 Definic¸o˜es . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 5.1.1 Experimento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 5.1.2 Experimento determin´ıstico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 5.1.3 Experimento aleato´rio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 5.1.4 Espac¸o amostral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 5.1.5 Evento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 5.2 Probabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 5.2.1 Probabilidade a priori . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 5.2.2 Probabilidade a posteriori . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 5.2.3 Importante saber! . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 5.3 Probabilidade condicional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 5.3.1 Exerc´ıcios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46 5.4 Regra do produto e independeˆncia de eventos . . . . . . . . . . . . . . . . . . . . . . . 47 5.5 Independeˆncia de treˆs ou mais eventos . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 5.6 Ensaios de Bernoulli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50 5.6.1 Exerc´ıcios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 5.6.2 Exerc´ıcios extras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 6 DISTRIBUIC¸A˜O DE PROBABILIDADE . . . . . . . . . . . . . . . . . . . . . . . . . . 55 6.1 Varia´vel aleato´ria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 6.2 Distribuic¸a˜o de probabilidade ou func¸a˜o de probabilidade . . . . . . . . . . . . . . . . 56 6.2.1 Propriedades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57 6.2.2 Me´dia e variaˆncia de uma varia´vel aleato´ria discreta . . . . . . . . . . . . . . . . . . 57 6.2.3 Distribuic¸a˜o binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 6.2.4 Distribuic¸a˜o Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 6.2.5 Exerc´ıcios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60 6.3 Distribuic¸a˜o normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 6.3.1 Ca´lculo de probabilidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 6.3.2 Condic¸o˜es para que uma func¸a˜o seja func¸a˜o densidade de probabilidade . . . . . . . 63 6.3.3 A distribuic¸a˜o normal: informac¸o˜es adicionais . . . . . . . . . . . . . . . . . . . . . . 63 6.3.4 Ca´lculo de probabilidades de varia´veis normais . . . . . . . . . . . . . . . . . . . . . 64 6.3.5 Distribuic¸a˜o normal padronizada ou distribuic¸a˜o normal padra˜o . . . . . . . . . . . 64 6.3.6 Exerc´ıcios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68 7 AMOSTRAGEM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69 7.1 Importaˆncia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70 7.2 Nu´meros aleato´rios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70 7.3 Tipos de amostragem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71 7.3.1 Amostragem na˜o probabil´ıstica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71 7.3.2 Amostragem probabil´ıstica . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . 72 7.4 Exerc´ıcios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 8 TEORIA DA ESTIMAC¸A˜O . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79 8.1 Introduc¸a˜o . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79 8.2 Distribuic¸a˜o de amostragem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80 8.2.1 Distribuic¸a˜o amostral das me´dias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80 8.2.2 Teorema do Limite Central . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82 8.2.3 Distribuic¸a˜o amostral das proporc¸o˜es . . . . . . . . . . . . . . . . . . . . . . . . . . 83 8.2.4 Exerc´ıcios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84 8.3 Estimac¸a˜o pontual . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84 8.4 Estimac¸a˜o intervalar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84 8.4.1 Intervalo de confianc¸a para a me´dia µ de uma populac¸a˜o normal com variaˆncia po- pulacional σ2 conhecida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85 8.4.2 Intervalo de confianc¸a para a me´dia µ de uma populac¸a˜o normal com variaˆncia po- pulacional σ2 desconhecida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87 8.4.3 Intervalo de confianc¸a para uma proporc¸a˜o . . . . . . . . . . . . . . . . . . . . . . . 89 8.4.4 Determinac¸a˜o do tamanho amostral . . . . . . . . . . . . . . . . . . . . . . . . . . . 90 8.4.5 Exerc´ıcios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92 9 TEORIA DA DECISA˜O . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93 9.1 Introduc¸a˜o . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93 9.2 Erros envolvidos num teste de hipo´tese . . . . . . . . . . . . . . . . . . . . . . . . . . 93 9.3 Mecaˆnica operacional dos testes de hipo´teses . . . . . . . . . . . . . . . . . . . . . . . 94 9.4 Teste de hipo´teses para uma me´dia de uma populac¸a˜o normal quando a variaˆncia populacional for desconhecida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94 9.4.1 Exerc´ıcios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96 9.5 Teste de hipo´teses para proporc¸o˜es . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97 9.5.1 Exerc´ıcios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98 9.6 Teste de hipo´teses para comparac¸a˜o das variaˆncias de duas populac¸o˜es normais . . . . 98 9.7 Teste de hipo´teses para duas me´dias de populac¸o˜es normais com variaˆncias populaci- onais desconhecidas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99 9.7.1 Testes de hipo´teses para duas me´dias, sendo σ21 = σ 2 2 = σ 2 . . . . . . . . . . . . . . . 100 9.7.2 Testes de hipo´teses para duas me´dias, sendo σ21 6= σ22 . . . . . . . . . . . . . . . . . . 101 9.7.3 Exerc´ıcios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103 10TESTES QUI-QUADRADO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104 10.1Teste de Adereˆncia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104 10.2Teste de Independeˆncia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105 10.3Teste de Homogeneidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107 10.3.1Exerc´ıcios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109 11CORRELAC¸A˜O LINEAR E REGRESSA˜O LINEAR SIMPLES . . . . . . . . . . . . . 111 11.1Diagrama de dispersa˜o . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111 11.2Coeficiente de Correlac¸a˜o Linear . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111 11.3Regressa˜o Linear Simples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114 11.3.1Exerc´ıcios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118 12Tabelas de distribuic¸o˜es de probabilidade teo´ricas . . . . . . . . . . . . . . . . . . . . . 120 REFEREˆNCIAS BIBLIOGRA´FICAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125 LISTA DE TABELAS 1 Rede rodovia´ria federal policiada. Brasil, 2005 a 2010 . . . . . . . . . . . . . . . 10 2 Internac¸o˜es por acidente de traˆnsito segundo a Unidade de Federac¸a˜o, faixa eta´ria de 25 a 29 anos, nov-2013 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 3 Pessoas envolvidas em acidente de traˆnsito segundo o estado f´ısico, Brasil, 2010 . 11 4 Acidentes de traˆnsito segundo o tipo. Brasil, 2008 a 2010* . . . . . . . . . . . . . 11 5 Nu´mero de filhos de 50 casais entrevistados numa fila de um PSF, Cidade Gama, abril-maio de 2010* . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 6 Nu´mero de jogos das 116 edic¸o˜es do Campeonato Carioca de futebol . . . . . . . 12 7 Altura de estudantes do ensino me´dio da Escola EST, 2010 . . . . . . . . . . . . 12 8 Nu´mero de filhos de 50 casais entrevistados numa fila de um PSF, Cidade Gama, abril-maio de 2010* . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 9 Taxa de urbanizac¸a˜o municipal (em porcentagem) do estado de Minas Gerais, 2010 16 10 Valores relativos de taxa de urbanizac¸a˜o municipal (em porcentagem) do estado de Minas Gerais, em 94 munic´ıpios, 2010 . . . . . . . . . . . . . . . . . . . . . . . 17 11 Nu´mero de cartas entregues, diariamente, em um edif´ıcio residencial, durante 60 dias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 12 Nu´mero de cartas entregues, diariamente, em um edif´ıcio residencial, durante 60 dias e o ponto me´dio das classes . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 13 Notas dos treˆs alunos em quatro provas de determinada disciplina e suas respec- tivas me´dias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 14 Nu´mero de cartas entregues, diariamente, em um edif´ıcio residencial, durante 60 dias e ca´lculos preliminares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 15 Pacientes com diabetes em Minas Gerais, segundo o sexo, no per´ıodo de janeiro a junho de 2009 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 16 Ta´bua de nu´meros aleato´rios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71 17 Divisa˜o de 500 pessoas em observac¸a˜o em um hospital em estratos e tamanho de estratos e amostras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76 18 Divisa˜o de 1000 pessoas em observac¸a˜o em um hospital em estratos e tamanho de estratos e amostras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 20 Todas as amostras e me´dias amostrais de tamanho n = 2 . . . . . . . . . . . . . 81 21 Todas as k amostras de tamanho n e proporc¸o˜es pˆi . . . . . . . . . . . . . . . . . 83 22 Probabilidades (α) da distribuic¸a˜o normal padronizada . . . . . . . . . . . . . . . 120 23 Valores do quantil t segundo os graus de liberdade (gl) e probabilidades α . . . . 121 24 Valores do quantil χ2 segundo os graus de liberdade (gl) e probabilidades α . . . 122 25 Valores do quantil F segundo os graus de liberdade do numerador (v1) e graus de liberdade do denominador (v2) e probabilidade 5% . . . . . . . . . . . . . . . . . 123 i LISTA DE FIGURAS 1 Classificac¸a˜o das varia´veis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 2 Relac¸a˜o entre varia´veis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 3 Dados parciais da pesquisada empresa . . . . . . . . . . . . . . . . . . . . . . . . 8 4 Rede rodovia´ria federal policiada. Brasil, 2005 a 2010 . . . . . . . . . . . . . . . . . . 19 5 Internac¸o˜es por acidente de traˆnsito segundo a Unidade de Federac¸a˜o, faixa eta´ria de 25 a 29 anos, nov-2013 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 6 Nu´mero de pessoas envolvidas em acidentes de traˆnsito segundo o estado f´ısico. Brasil, 2010 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 7 Internac¸o˜es por acidente de tra˜nsito segundo a Unidade de Federac¸a˜o, faixa eta´ria de 25 a 29 anos, nov-2013 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 8 Taxa de urbanizac¸a˜o municipal (em porcentagem) do estado de Minas Gerais, 2010 . . . 22 9 Taxa de urbanizac¸a˜o municipal (em porcentagem) do estado de Minas Gerais, 2010 . . . 22 10 Tipos de frequeˆncias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 11 Relac¸a˜o entre me´dia, mediana e moda . . . . . . . . . . . . . . . . . . . . . . . . 29 12 Boxplot: modelo e nomes das partes . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 13 Boxplot: distribuic¸a˜o do nu´mero de filhos por casal: Amostra A e Amostra B . . . . . . 36 14 Distribuic¸o˜es normais com diferentes valores para µ e σ . . . . . . . . . . . . . . 62 15 Exemplo de P (a < X < b) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 16 Curva normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64 17 P (X > 190) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64 18 P (Z > 2) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 19 Valor tabelado para P (Z > 2): a´rea sob a curva para Z > 2 . . . . . . . . . . . . 66 20 P (−1,6 < Z < 0,1) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 21 P (Z > 0,2) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67 22 P (Z < 1) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67 23 P (−1,6 < Z < 0,2) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67 24 P (0 < Z < 1,2) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68 25 Esquematizac¸a˜o do processo de amostragem . . . . . . . . . . . . . . . . . . . . . 70 26 Esquematizac¸a˜o da amostragem por conglomerado . . . . . . . . . . . . . . . . . 74 27 Esquematizac¸a˜o da amostragem estratificada . . . . . . . . . . . . . . . . . . . . 75 28 Charge sobre amostragem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 29 Gra´fico dos valores populacionais . . . . . . . . . . . . . . . . . . . . . . . . . . . 81 30 Gra´fico da distribuic¸a˜o das me´dias . . . . . . . . . . . . . . . . . . . . . . . . . . 81 31 Distribuic¸a˜o de probabilidade da populac¸a˜o e distribuic¸o˜es amostrais para dife- rentes n . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83 32 A´rea entre −1,96 e 1,96 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85 33 Regio˜es cr´ıticas conforme H1 : µ 6= µ0; H1 : µ > µ0 ou H1 : µ < µ0 . . . . . . . . 95 34 Regio˜es cr´ıticas conforme H1 : p 6= p0; H1 : p > p0 ou H1 : p < p0 . . . . . . . . . 97 35 Regia˜o cr´ıtica conforme H1 : σ 2 M > σ 2 m . . . . . . . . . . . . . . . . . . . . . . . . 99 36 Regia˜o cr´ıtica conforme H1 : µ1 − µ2 6= 0 . . . . . . . . . . . . . . . . . . . . . . . 100 37 Regia˜o cr´ıtica conforme H1 : µ1 − µ2 6= 0 . . . . . . . . . . . . . . . . . . . . . . . 102 38 Conjunto de dados de I´ris de Fisher . . . . . . . . . . . . . . . . . . . . . . . . . 111 39 Diagrama de dispersa˜o: n´ıvel de colesterol e n´ıvel de triglicer´ıdeos . . . . . . . . 113 40 Gra´fico das varia´veis X e Y . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115 41 Diagrama de dispersa˜o e gra´fico da equac¸a˜o ajustada . . . . . . . . . . . . . . . . 116 42 Gra´ficos referentes ao exerc´ıcio . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118 ii Estat´ıstica Ba´sica 1 SOMATO´RIO 1 SOMATO´RIO 1.1 I´ndices ou notac¸a˜o por ı´ndices O s´ımbolo xi (leia-se x ı´ndice i) representa qualquer um dos n valores, x1, x2, x3, . . . , xn assumidos pela varia´vel X, na amostra ou no conjunto de dados. Evidentemente pode ser usada qualquer outra letra ale´m de i. 1.2 Notac¸a˜o de somato´rio O s´ımbolo n∑ i=1 xi e´ usado para representar a soma de todos os valores de xi desde i = 1 ate´ i = n, ou seja: n∑ i=1 xi = x1 + x2 + · · ·+ xn Exemplo: Considere a varia´vel X = {1, 0, − 1, 2, 1}, cada valor (ou elemento) de X corresponde, respectivamente, a x1, x2, x3, x4, x5. Enta˜o: i. 3∑ i=1 xi = x1 + x2 + x3 = 1 + 0 + (−1) = 0 ii. 5∑ i=1 xi = x1 + x2 + x3 + x4 + x5 = 1 + 0 + (−1) + 2 + 1 = 3 iii. 5∑ i=3 xi = x3 + x4 + x5 = −1 + 2 + 1 = 2 iv. 5∑ i=1 i 6=3, 4 xi = x1 + x2 + x5 = 1 + 0 + 1 = 2 1.3 Propriedades Sejam: a, b e k constantes; X e Y varia´veis e xi e yi os valores que as varia´veis X e Y assumem, enta˜o: (P1) Somato´rio de uma constante vezes uma varia´vel e´ igual a` constante vezes o somato´rio da varia´vel: n∑ i=1 axi = ax1 + ax2 + ax3 + ...+ axn = a n∑ i=1 xi (P2) Somato´rio de uma constante e´ igual ao nu´mero de termos vezes a constante: n∑ i=1 k = k · k · k . . . k · k︸ ︷︷ ︸ (n−1+1 ) vezes = n · k n∑ i=a k = k · k · k . . . k · k︸ ︷︷ ︸ (n−a+1 ) vezes = (n− a+ 1) · k UNIFAL-MG/Alfenas Profs. Fla´vio Bittencourt/Adriana Dias 1 Estat´ıstica Ba´sica 1 SOMATO´RIO (P3) Somato´rio de uma soma e´ igual a` soma dos somato´rios: n∑ i=1 (axi ± byi) = a n∑ i=1 xi ± b n∑ i=1 yi (P4) Somato´rios de um produto de varia´veis e´ igual ao produto dos somato´rios destas varia´veis: n∑ i=1 m∑ j=1 xiyj = n∑ i=1 xi × m∑ j=1 yj E´ importante lembrar que: n∑ i=1 xiyi 6= n∑ i=1 xi × n∑ i=1 yi n∑ i=1 ( xi yi ) 6= n∑ i=1 xi n∑ i=1 yi ( n∑ i=1 xi )2 6= n∑ i=1 x2i 1.4 Somato´rios mais usados na Estat´ıstica i. n∑ i=1 xi = x1 + x2 + ...+ xn, soma simples ii. n∑ i=1 x2i = x 2 1 + x 2 2 + ...+ x 2 n, soma de quadrados iii. ( n∑ i=1 xi )2 = (x1 + x2 + ...+ xn) 2, quadrado da soma iv. n∑ i=1 xiyi = x1y1 + x2y2 + ...+ xnyn, soma de produtos v. n∑ i=1 xi n∑ i=1 yi = (x1 + x2 + ...+ xn) (y1 + y2 + ...+ yn), produto da soma. Observac¸a˜o: quando o somato´rio na˜o apresentar ı´ndices efetua-se a soma de todos os elementos: ∑ x = n∑ i=1 xi 1.5 Exerc´ıcios 1. Desenvolver os termos de cada uma das seguintes somas: 2 Profs. Fla´vio Bittencourt/Adriana Dias UNIFAL-MG/Alfenas Estat´ıstica Ba´sica 2 INTRODUC¸A˜O a) 6∑ i=1 xi b) 4∑ i=1 (yi − 3)2 c) N∑ i=1 a d) n∑ i=a b e) 5∑ k=1 fkxk f) 3∑ j=1 (xj − a) 2. Indicar, por meio da notac¸a˜o de somato´rio, cada uma das expresso˜es seguintes: a) x21 + x 2 2 + x 2 3 + ...+ x 2 10 b) (x1 + y1) + (x2 + y2) + ...+ (x8 + y8) c) f1x 3 1 + f2x 3 2 + f3x 3 3 + ...+ f20x 3 20 d) (y21 − 1)2 + (y22 − 1)2 + . . .+ (y212 − 1)2 e) (x1 − 1) + (x2 − 2)2 + (x3 − 3)3 + . . .+ (xn − n)n 3. As varia´veis, X e Y , assumem os valores: x1 = 2; x2 = 4; x3 = −5; x4 = −8 e y1 = −3; y2 = −8; y3 = 10; y4 = 6, respectivamente. Calcular: a) ∑ x b) ∑ y c) ∑ xy d) ∑ x2 e) ∑ y2 f) ∑ x ∑ y g) ∑ xy2 h) ∑ (x+ y)(x− y) 4. Dados os valores das varia´veis: X = {2, 4, 4, 3, 2}, Y = {1, 2, 3, 6, 7}, obtenha: a) 4∑ i=1 xi b) 5∑ i=1 yi c) 5∑ i=1 4x2i d) 5∑ i=1 xiyi e) 5∑ i=1 (3xi + 2yi) f) 4∑ i=2 xiyi + 5∑ i=1 y2i 5. Na Estat´ıstica usa-se comfrequeˆncia calcular a me´dia e a variaˆncia amostral, representadas na forma de somato´rios por: x¯ = n∑ i=1 xi n e s2 = 1 n− 1 n∑ i=1 x2i − ( n∑ i=1 xi )2 n , respectivamente, sendo n uma constante que representa o nu´mero de elementos (ou dados, ou observac¸o˜es) de um conjunto qualquer ou de uma varia´vel. Considere os valores assumidos por uma varia´vel X qualquer: X = {2, 4, 5, 6, 1, 6}; calcule a me´dia e a variaˆncia. 6. a) Usando os valores da varia´vel X do exerc´ıcio anterior demonstre numericamente que n∑ i=1 (xi − x¯) = 0. b) Use as propriedades de somato´rio, lembre-se que x¯ e´ uma constante, para demonstrar algebricamente que n∑ i=1 (xi − x¯) = 0. 2 INTRODUC¸A˜O A Estat´ıstica como cieˆncia somente se estruturou no se´culo passado, sendo uma ferra- menta indispensa´vel na vida moderna. Hoje, cada vez mais pessoas encontram-se expostas a ela em maior ou menor intensidade. E´ a cieˆncia que se ocupa da organizac¸a˜o, descric¸a˜o, ana´lise e interpretac¸a˜o de dados. a) no plural (estat´ısticas), indica qualquer colec¸a˜o consistente de dados nume´ricos reunidos com a finalidade de fornecer informac¸o˜es acerca de uma atividade qualquer. Por exemplo, estat´ıs- ticas demogra´ficas referem-se a dados nume´ricos sobre nascimentos, falecimentos, matrimoˆnios, UNIFAL-MG/Alfenas Profs. Fla´vio Bittencourt/Adriana Dias 3 Estat´ıstica Ba´sica 3 ALGUMAS DEFINIC¸O˜ES desquites, etc. b) no singular (estat´ıstica), indica um corpo de te´cnicas, ou ainda uma metodologia te´cnica desenvolvida para a coleta, a classificac¸a˜o, a apresentac¸a˜o, a ana´lise, a interpretac¸a˜o de dados quantitativos e a utilizac¸a˜o desses dados para a tomada de deciso˜es. Qualquer cieˆncia experimental na˜o pode prescindir das te´cnicas proporcionadas pela Estat´ıstica. Nos diversos ramos do conhecimento ha´ necessidade de um instrumental que se preocupa com o tratamento quantitativo dos fenoˆmenos de massa ou coletivos, cuja mensurac¸a˜o e ana´lise requerem um conjunto de observac¸o˜es de fenoˆmenos ou particulares. 3 ALGUMAS DEFINIC¸O˜ES 3.1 Varia´vel As varia´veis sa˜o as caracter´ısticas pesquisadas ou registradas. E´ por meio das varia´- veis que se torna poss´ıvel descrever o fenoˆmeno. As varia´veis sa˜o caracter´ısticas que podem ser observadas ou medidas em cada elemento pesquisado (seja por censo ou por amostragem, le- vantamento ou experimento), sob as mesmas condic¸o˜es. Para cada varia´vel, para cada elemento pesquisado, em um dado momento, ha´ apenas um resultado poss´ıvel. As varia´veis podem ser basicamente classificadas de acordo com o seu n´ıvel de mensu- rac¸a˜o (o quanto de informac¸a˜o cada varia´vel apresenta) e seu n´ıvel de manipulac¸a˜o (como uma varia´vel relaciona-se com as outras no estudo). 3.1.1 Varia´veis qualitativas Tambe´m denominadas de varia´veis catego´ricas, sa˜o aquelas cujas realizac¸o˜es sa˜o atri- butos (categorias) do elemento pesquisado, como sexo, grau de instruc¸a˜o, espe´cie. Estas podem ser nominais ou ordinais. As varia´veis nominais podem ser medidas apenas em termos de quais itens pertencem a diferentes categorias, mas na˜o pode quantificar nem mesmo ordenar tais ca- tegorias. Por exemplo, pode se dizer que dois indiv´ıduos sa˜o diferentes em termos da varia´vel A (sexo, por exemplo), mas na˜o se pode dizer qual deles “tem mais” da qualidade representada pela varia´vel. Exemplos t´ıpicos de varia´veis nominais sa˜o: sexo, naturalidade, etnia etc. As varia´veis ordinais permitem ordenar os itens medidos em termos de qual tem menos e qual tem mais da qualidade representada pela varia´vel, mas ainda na˜o permitem que se diga “o quanto mais”. Um exemplo t´ıpico de uma varia´vel ordinal e´ o status so´cio-econoˆmico das famı´lias residentes em uma localidade: sabe-se que me´dia-alta e´ mais “alta” do que me´dia, mas na˜o se pode dizer, por exemplo, que e´ 20% mais alta. A pro´pria distinc¸a˜o entre mensurac¸a˜o nominal, ordinal e intervalar representa um bom exemplo de uma varia´vel ordinal. Pode-se dizer que uma medida nominal proveˆ menos informac¸a˜o do que uma medida ordinal, mas na˜o se pode dizer “quanto menos” ou como esta diferenc¸a se compara a` diferenc¸a entre mensurac¸a˜o ordinal e quantitativa. 3.1.2 Varia´veis quantitativas Sa˜o aquelas cujas realizac¸o˜es sa˜o nu´meros resultantes de contagem ou mensurac¸a˜o, como nu´mero de filhos, nu´mero de visitantes, velocidade em km/h, peso, altura, etc. As varia´veis quantitativas sa˜o discretas ou cont´ınuas. As varia´veis quantitativas discretas sa˜o aquelas que podem assumir apenas alguns valores nume´ricos que geralmente podem ser listados (nu´mero de filhos, nu´mero de acidentes). As varia´veis quantitativas cont´ınuas sa˜o aquelas que podem assumir qualquer valor em um intervalo (velocidade, peso, altura). Muitos pesquisadores preferem as varia´veis quantitativas por acharem que estas conteˆm mais informac¸o˜es do que as qualitativas. Observe os seguintes exemplos: quando a varia´vel distaˆncia de uma localidade e´ descrita em termos de “longe” e “perto”, sabemos que longe e´ mais distante que perto, mas na˜o temos ide´ia de qua˜o mais distante; se, contudo, descreve-se 4 Profs. Fla´vio Bittencourt/Adriana Dias UNIFAL-MG/Alfenas Estat´ıstica Ba´sica 3 ALGUMAS DEFINIC¸O˜ES a distaˆncia de forma nume´rica, medida em metros, e uma localidade dista de um ponto de refereˆncia 600 metros e outra dista 400, na˜o so´ sabemos que a segunda e´ mais perto do que a primeira, mas sa˜o 200 metros mais perto. E´ importante ressaltar que a forma como a varia´vel esta´ sendo medida definira´ o seu n´ıvel de mensurac¸a˜o. Por exemplo, a varia´vel velocidade de um carro; se definirmos velocidade como resultado de uma medic¸a˜o por meio de radar resultando em um valor em km/h, trata-se de uma varia´vel quantitativa cont´ınua; se, pore´m, definirmos a velocidade como resultado de uma medic¸a˜o em que algue´m declara a velocidade como “baixa”, “me´dia” ou “alta”, ela passa ser qualitativa ordinal. Esquematicamente a classificac¸a˜o das varia´veis segundo o n´ıvel de mensurac¸a˜o pode ser visualizada na Figura 1. FIGURA 1 Classificac¸a˜o das varia´veis 3.1.3 Varia´veis independentes e dependentes Uma outra forma de classificar as varia´veis refere-se ao n´ıvel de manipulac¸a˜o: varia´veis independentes e dependentes, Figura 2. FIGURA 2 Relac¸a˜o entre varia´veis As varia´vies independentes sa˜o aquelas que sa˜o manipuladas, enquanto que as depen- dentes sa˜o apenas medidas ou registradas (como manipulac¸a˜o das varia´veis independentes). Esta distinc¸a˜o confunde muitas pessoas que dizem que“todas as varia´veis dependem de alguma coisa”. Entretanto, uma vez que se esteja acostumado a esta distinc¸a˜o ela se torna indispensa´vel. As varia´veis independentes sa˜o aquelas que podem influenciar os valores das varia´veis dependentes. Somente a realizac¸a˜o do estudo vai permitir verificar se ha´ realmente tal influeˆncia e, somente, poderemos afirmar que a varia´vel independente e´ a causa da varia´vel dependente assumir determinado resultado se o estudo for um experimento (pesquisa experimental). Os termos varia´vel dependente e independente aplicam-se principalmente a` pesquisa experimental, onde algumas varia´veis sa˜o manipuladas, e neste sentido sa˜o “independentes” dos padro˜es de reac¸a˜o inicial, intenc¸o˜es e caracter´ısticas das unidades experimentais. Espera-se que outras varia´veis sejam “dependentes” da manipulac¸a˜o ou das condic¸o˜es experimentais. Ou seja, UNIFAL-MG/Alfenas Profs. Fla´vio Bittencourt/Adriana Dias 5 Estat´ıstica Ba´sica 3 ALGUMAS DEFINIC¸O˜ES elas dependem “do que as unidades experimentais fara˜o” em resposta. 3.2 Dados Sa˜o os valores ou fenoˆmenos obtidos na mensurac¸a˜o ou observac¸o˜es de alguma varia´vel em estudo. Logo, os dados podem ser qualitativos (nominaisou ordinais) ou quantitativos (discretos ou cont´ınuos) e independentes ou dependentes. Por exemplo, se a varia´vel estudada for sexo de indiv´ıduos que visitam um santua´rio, os dados sa˜o, masculino, masculino, feminino, feminino etc. Outro exemplo: considerando que a varia´vel estudada seja nu´mero de filhos de um grupo de 20 casais, as respostas obtidas, 0, 2, 3, 1, 2, 0, ... sa˜o os dados, e neste caso, os dados sa˜o discretos. Considerando altura dos estudantes desta sala de aula, os dados obtidos sa˜o denominados cont´ınuos, pois alguns valores podem ser: 1,59m, 1,75m, 1,80m etc. 3.3 Populac¸a˜o Os dados sa˜o coletados para estudar uma ou mais caracter´ısticas de uma populac¸a˜o de interesse. Populac¸a˜o e´ o conjunto de medidas da(s) caracter´ıstica(s) de interesse em todos os elementos que a(s) apresenta(m). Se, por exemplo, estamos avaliando as opinio˜es de eleito- res sobre os candidatos a presidente, a populac¸a˜o da pesquisa seria constitu´ıda pelas opinio˜es declaradas pelos eleitores em questa˜o. 3.4 Censo E´ o exame completo de todas as unidades ou elementos que compo˜em uma populac¸a˜o. O IBGE (Instituto Brasileiro de Geografia e Estat´ıstica) realiza o Censo Demogra´fico a cada dez anos, onde sa˜o reunidas informac¸o˜es sobre toda a populac¸a˜o brasileira. O primeiro Censo aconteceu em 1872 e recebeu o nome de Recenseamento da Populac¸a˜o do Impe´rio do Brasil e o mais recente foi o Censo 2010 Os resultados do Censo Demogra´fico sa˜o importantes para a sociedade ter informac¸o˜es atualizadas sobre a populac¸a˜o e para o governo planejar suas ac¸o˜es de forma mais adequada. E´ importante ressaltar que o censo de uma populac¸a˜o muito grande (ou infinita), pode ser ta˜o inu´til quanto invia´vel, especialmente se o estudo for muito demorado. Nesses casos, a populac¸a˜o pode modificar-se ta˜o significativamente enquanto ele estiver sendo realizado com acre´scimos, eliminac¸o˜es e mudanc¸as nas posic¸o˜es geogra´ficas dos indiv´ıduos que ha´ grandes pos- sibilidades de alguns elementos particulares serem considerados mais de uma vez (ou nenhuma), tornando quase imposs´ıvel a interpretac¸a˜o exata dos resultados finais. 3.5 Amostra Como o interesse maior esta´ na populac¸a˜o o ideal seria pesquisar toda a populac¸a˜o, em suma, realizar um censo. Contudo, por razo˜es econoˆmicas ou pra´ticas (para obter rapidamente a informac¸a˜o ou evitar a extinc¸a˜o ou exausta˜o da populac¸a˜o) nem sempre e´ poss´ıvel realizar um censo. Quando esse e´ o caso, e´ prefer´ıvel conhecer a populac¸a˜o a partir de uma parte dela (amostra). Uma amostra da populac¸a˜o e´ um subconjunto finito e representativo da populac¸a˜o. Uma das principais subdiviso˜es da Estat´ıstica e´ a amostragem, que reu´ne os me´todos necessa´rios para coletar adequadamente amostras representativas e suficientes para que os resul- tados obtidos possam ser generalizados para a populac¸a˜o de interesse. A vantagem do processo de amostragem em relac¸a˜o ao censo e´ o menor custo e tempo para a operac¸a˜o ale´m de melhor investigac¸a˜o dos elementos observados. 6 Profs. Fla´vio Bittencourt/Adriana Dias UNIFAL-MG/Alfenas Estat´ıstica Ba´sica 3 ALGUMAS DEFINIC¸O˜ES 3.6 Paraˆmetro E´ uma constante que caracteriza uma populac¸a˜o. Sa˜o exemplos de paraˆmetros: • µ: me´dia populacional • σ2: variaˆncia populacional • σ: desvio padra˜o populacional • p: proporc¸a˜o populacional • etc. 3.7 Estimador E´ uma expressa˜o alge´brica (fo´rmula) utilizada para obter um valor aproximado de um paraˆmetro. Sa˜o exemplos de estimadores: • x¯ = n∑ i=1 xi n : me´dia amostral • s2 = 1 n− 1 n∑ i=1 x2i − ( n∑ i=1 xi ) n : variaˆncia amostral • s = √ s2: desvio padra˜o amostral • pˆ = y n : proporc¸a˜o amostral, em que y representa o nu´mero de sucessos em uma amostra de tamanho n • etc. 3.8 Estimativa E´ o valor nume´rico de um estimador. E´ determinada usando os dados amostrais. Exemplo: O objetivo de uma pesquisa e´ conhecer o consumo me´dio semanal de tinta das impressoras do ICEx em um dado ano. Varia´vel: Consumo semanal de tinta das impressoras do ICEx Populac¸a˜o: Todos os consumos semanais de tinta das impressoras do ICEx de um ano: N = 52 registros de consumo Paraˆmetro: Consumo me´dio semanal de tinta das impressoras: µ Amostra: parte da populac¸a˜o: alguns registros de consumos, por exemplo n = 20 consumos Estimador: x¯ = n∑ i=1 xi n Estimativa: 1,5 L de tinta por semana. 3.9 Exerc´ıcios 1. Uma empresa quer conhecer o perfil dos seus 474 funciona´rios para responder a`s seguintes perguntas: - Identificar se ha´ predominaˆncia masculina ou feminina UNIFAL-MG/Alfenas Profs. Fla´vio Bittencourt/Adriana Dias 7 Estat´ıstica Ba´sica 3 ALGUMAS DEFINIC¸O˜ES - Mensurar a qualificac¸a˜o do pessoal (pelos anos de escolaridade) - Verificar como esta´ o turnover: avaliando as idades, tempo de servic¸o e experieˆncia pre´via do pessoal Para tanto dispo˜e dos seguintes dados, parcialmente apresentados na Figura 3: FIGURA 3 Dados parciais da pesquisa da empresa a) Identificar os n´ıveis de mensurac¸a˜o das 9 varia´veis: - Sexo (SEXO) - Idade em anos completos (IDADE) - Anos de educac¸a˜o completos (ANOSEDUC) - Func¸a˜o: servic¸os gerais, escrito´rio, gereˆncia (FUNCAO) - Sala´rio atual mensal (SALARIOA) - Sala´rio inicial mensal (SALARIOI) - Anos de servic¸o em anos (ANOSSERV) - Experieˆncia pre´via em anos (EXPERPR) - Nacionalidade (NACIONAL) b) Ha´ interesse em obter suma´rios descrevendo: - as func¸o˜es exercidas de acordo com o sexo do funciona´rio - os sala´rios atuais em func¸a˜o do sexo do funciona´rio - os sala´rios atuais em func¸a˜o dos anos de educac¸a˜o do funciona´rio Quais sa˜o as varia´veis independentes e dependentes em cada caso? 2. Observando a varia´vel relacione o tipo de dado que pode ser obtido assinalando com um “X” a respectiva coluna. 8 Profs. Fla´vio Bittencourt/Adriana Dias UNIFAL-MG/Alfenas Estat´ıstica Ba´sica 4 ESTATI´STICA DESCRITIVA Varia´vel Dado Qualitativo Quantitativo Nominal Ordinal Discreto Cont´ınuo Cor da pele Idade em anos Grau de instruc¸a˜o Renda familiar Nu´mero de filhos de um grupo de casais Classe social (A, B, C, ...) Sexo Nu´mero de moradores de uma casa Nu´mero de faltas em uma disciplina Estado civil Religia˜o Nu´mero de gols de um time em um campeonato Altura de um grupo de pessoas Temperatura corporal Distaˆncia percorrida por um maratonista Volume de reservato´rios de usinas Nu´mero de calouros de uma universidade Profissa˜o 4 ESTATI´STICA DESCRITIVA A estat´ıstica descritiva e´ um ramo da estat´ıstica que se ocupa da organizac¸a˜o, apresen- tac¸a˜o e descric¸a˜o de um conjunto de dados sem tirar quaisquer concluso˜es ou infereˆncias sobre um grupo maior. Neste cap´ıtulo sera˜o mostrados exemplos de tabelas e gra´ficos que podera˜o representar, objetivamente, as informac¸o˜es e caracter´ısticas de uma varia´vel e, posteriormente, medidas esta- t´ısticas que podem representar uma amostra: medidas de posic¸a˜o, separatrizes e variabilidade. 4.1 Apresentac¸a˜o dos dados 4.1.1 Tabelas A tabela e´ uma ferramenta que tem por objetivo demonstrar o comportamento de varia´vel(is) para facilitar a compreensa˜o do fenoˆmeno sem muito esforc¸o. Uma tabela deve ser composta basicamente por: • cabec¸alho • corpo • rodape´ O cabec¸alho deve conter informac¸o˜es que respondam a`s perguntas: • o que esta´ representando? • onde ocorreu? • quando ocorreu? UNIFAL-MG/Alfenas Profs. Fla´vio Bittencourt/Adriana Dias 9 Estat´ıstica Ba´sica 4 ESTATI´STICA DESCRITIVA O corpo e´ representado por colunas e subcolunas dentro das quais sera˜o registrados os dados e informac¸o˜es. O rodape´ (nem sempre necessa´rio) e´ reservado para notas e identificac¸a˜o dos dados.De acordo com o crite´rio de organizac¸a˜o dos dados, as tabelas classificam-se em: Se´rie temporal Tambe´m chamada de se´rie cronolo´gica, se´rie evolutiva ou histo´rica. E´ a se´rie em que os dados sa˜o observados de acordo com o tempo em que ocorrem, permanecendo constantes o local e o fenoˆmeno. Exemplo: TABELA 1 Rede rodovia´ria federal policiada. Brasil, 2005 a 2010 Ano Rede rodovia´ria 2005 56.097 2006 57.352 2007 57.352 2008 57.352 2009 66.984 2010 64.124 Fonte: DNIT. Dispon´ıvel em: http://www.dnit.gov.br/rodovias/operacoes-rodoviarias/estatisticas-de- acidentes/anuario-2010.pdf * Informac¸o˜es parciais Se´rie geogra´fica Tambe´m chamada de se´rie de localizac¸a˜o, se´rie regional ou se´rie territorial. E´ a se´rie em que os dados sa˜o observados de acordo com a localidade em que ocorreram, permanecendo constantes a e´poca e o fenoˆmeno. Exemplo: TABELA 2 Internac¸o˜es por acidente de traˆnsito segundo a Unidade de Federac¸a˜o, faixa eta´ria de 25 a 29 anos, nov-2013 Regia˜o Nu´mero de internac¸o˜es Sudeste 144 Nordeste 94 Centro-Oeste 10 Sul 9 Norte 4 Fonte: Ministe´rio da Sau´de. Dispon´ıvel em: http://www.datasus.gov.br Se´rie espec´ıfica ou catego´rica E´ a se´rie em que os dados sa˜o agrupados de acordo com categorias ou espe´cies, perma- necendo constantes a e´poca e o local. Exemplo: 10 Profs. Fla´vio Bittencourt/Adriana Dias UNIFAL-MG/Alfenas Estat´ıstica Ba´sica 4 ESTATI´STICA DESCRITIVA TABELA 3 Pessoas envolvidas em acidente de traˆnsito segundo o estado f´ısico, Brasil, 2010 Estado f´ısico Nu´mero de pessoas Ileso 594.818 Leso˜es leves 75.044 Leso˜es graves 27.852 Morto 8.616 Na˜o informado 14.968 Fonte: DNIT. Dispon´ıvel em: http://www.dnit.gov.br/rodovias/operacoes-rodoviarias/estatisticas-de- acidentes/anuario-2010.pdf * Informac¸o˜es parciais Se´rie de dupla entrada E´ a se´rie que e´ constitu´ıda da conjugac¸a˜o ou junc¸a˜o de uma ou mais se´ries. E´ u´til para mostrar dois ou mais tipos de varia´veis em relac¸a˜o a um item. Deve ser lida na vertical e na horizontal simultaneamente para que as linhas e as colunas sejam relacionadas. TABELA 4 Acidentes de traˆnsito segundo o tipo. Brasil, 2008 a 2010* Tipo Ano 2008 2009 2010 Choque com objeto fixo 11.342 16.835 19.222 Capotagem 3.967 4.273 4.513 Atropelamento 5.403 5.659 6.486 Atropelamento de animal 3.886 3.765 4.286 Choque com ve´ıculo estacionado 1.091 1.280 1.886 Colisa˜o traseira 37.872 44.726 51.355 Colisa˜o frontal 4.469 4.864 5.312 Queda de ve´ıculo 3.114 4.692 5.338 Fonte: DNIT. Dispon´ıvel em: http://www.dnit.gov.br/rodovias/operacoes-rodoviarias/estatisticas-de- acidentes/anuario-2010.pdf * Informac¸o˜es parciais Distribuic¸a˜o de frequeˆncia E´ a se´rie estat´ıstica em que os dados quantitativos ou dados qualitativos sa˜o agrupados segundo suas respectivas frequeˆncias. Tem como objetivo fornecer uma boa visualizac¸a˜o do comportamento dos dados. E´ usada, tambe´m para discriminar a distribuic¸a˜o de probabilidade de uma amostra (ou populac¸a˜o). Tem-se dois tipos: distribuic¸a˜o de frequeˆncia para dados discretos e para dados cont´ınuos. Distribuic¸a˜o de frequeˆncia para dados discretos E´ uma se´rie que possui uma coluna para as classes e outra coluna para as frequeˆncias. As classes (1a coluna da tabela) sa˜o formadas por nu´meros inteiros, na˜o possuem diviso˜es, representam o valor observado na varia´vel estudada. As frequeˆncias representam o nu´mero de vezes que o valor da classe aparece no conjunto de dados. Pore´m, quando temos uma varia´vel quantitativa discreta que apresenta muitas observa- c¸o˜es, levando a um nu´mero grande de classes, e´ mais racional considera´-la como varia´vel cont´ınua e realizar o agrupamento dos valores em va´rios intervalos de classe. Nas Tabelas 5 e 6 esta˜o apresentadas exemplos de tabelas de distribuic¸a˜o de frequeˆncias para varia´veis quantitativas discretas. UNIFAL-MG/Alfenas Profs. Fla´vio Bittencourt/Adriana Dias 11 Estat´ıstica Ba´sica 4 ESTATI´STICA DESCRITIVA TABELA 5 Nu´mero de filhos de 50 casais entrevistados numa fila de um PSF, Cidade Gama, abril-maio de 2010* Nu´mero de Filhos Nu´mero de Casais 0 6 1 16 2 9 3 8 4 3 5 3 6 3 7 2 Total 50 * Dados fict´ıcios TABELA 6 Nu´mero de jogos das 116 edic¸o˜es do Campeonato Carioca de futebol Classes de jogos Nu´mero de edic¸o˜es 86 ` 94 12 94 ` 102 11 102 ` 110 8 110 ` 118 10 118 ` 126 24 126 ` 134 25 134 ` 142 15 142 ` 150 11 Total 116 * Dados fict´ıcios Distribuic¸a˜o de frequeˆncia para dados cont´ınuos Nesta se´rie as classes (1a coluna da tabela) sa˜o formadas por intervalos de valores agrupados definidos de alguma forma. As frequeˆncias representam o nu´mero de valores que esta˜o compreendidos em cada intervalo (classe). A construc¸a˜o desta tabela na˜o e´ padronizada, a maioria das vezes fica a cargo do pesquisador (pela experieˆncia) do que por meio de algoritmos. Exemplo: TABELA 7 Altura de estudantes do ensino me´dio da Escola EST, 2010 Classes de alturas (m) Nu´mero de estudantes 1,68 ` 1,71 7 1,71 ` 1,74 28 1,74 ` 1,77 33 1,77 ` 1,80 14 1,80 ` 1,83 24 1,83 ` 1,86 17 1,86 ` 1,89 2 1,89 ` 1,92 5 1,92 ` 1,95 0 1,95 ` 1,98 1 1,98 ` 2,01 1 Total 132 Fonte: Dados fict´ıcios 12 Profs. Fla´vio Bittencourt/Adriana Dias UNIFAL-MG/Alfenas Estat´ıstica Ba´sica 4 ESTATI´STICA DESCRITIVA 4.1.2 Construc¸a˜o de tabelas de distribuic¸a˜o de frequeˆncias Uma distribuic¸a˜o de frequeˆncias e´ a disposic¸a˜o dos valores observados com as respectivas frequeˆncias. O nu´mero de observac¸o˜es ou repetic¸o˜es de um valor ou de uma modalidade, em um levantamento qualquer, e´ chamado frequeˆncia desse valor ou dessa modalidade. Uma tabela de frequeˆncias e´ uma tabela onde se procura fazer corresponder os valores observados (que podem estar agrupados em intervalos ou na˜o) da varia´vel em estudo e as respectivas frequeˆncias. Quando a varia´vel for discreta Quando a varia´vel for discreta e houver poucas categorias ou poucos valores desde que na˜o sejam muito diversos, pode-se confeccionar a tabela usando os pro´prios valores observados como classes. Exemplo: Numa fila de um PSF da cidade Gama foram entrevistados 50 casais durante os meses abril e maio de 2010 (dados fict´ıcios). O objetivo da pesquisa era descobrir o nu´mero de filhos por casal. O resultado da pesquisa esta´ apresentado abaixo, sendo os dados apresentados conforme foram coletados (dados brutos), seguindo-se pelas linhas como se leˆ um livro. 2 3 0 2 1 1 1 3 2 5 6 1 1 4 0 1 5 6 0 2 1 4 1 3 1 7 6 2 0 1 3 1 3 5 7 1 3 1 1 0 3 0 4 1 2 2 1 2 3 2 Os dados como sa˜o apresentados anteriormente sa˜o denominados de dados brutos, ou seja, sa˜o aqueles que na˜o foram numericamente organizados, esta˜o na forma como foram coletados. Para iniciar a tabulac¸a˜o e´ necessa´rio ordenar os dados, em ordem crescente ou decres- cente. Os dados ordenados sa˜o chamados de rol. Assim, para os dados anteriores: 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 4 4 4 5 5 5 6 6 6 7 7 Por ter poucas categorias e na˜o ter valores diversos pode-se agrupar os dados de acordo com a frequeˆncia, conforme e´ apresentado na Tabela 8: TABELA 8 Nu´mero de filhos de 50 casais entrevistados numa fila de um PSF, Cidade Gama, abril-maio de 2010* Nu´mero de Filhos Nu´mero de Casais 0 6 1 16 2 9 3 8 4 3 5 3 6 3 7 2 Total 50 * Dados fict´ıcios UNIFAL-MG/Alfenas Profs. Fla´vio Bittencourt/Adriana Dias 13 Estat´ıstica Ba´sica 4 ESTATI´STICA DESCRITIVA Quando a varia´vel for cont´ınua ou discreta Quando a varia´vel objeto de estudo for cont´ınua, recomenda-se agrupar os valores observados em classes. Pode acontecer de a varia´vel ser discreta, mas o nu´mero de valores observados ser muito grande ou estes valores apresentarem muito diversos. O agrupamento evitatabelas com grande extensa˜o, a na˜o interpretac¸a˜o dos valores do fenoˆmeno e, tambe´m, classes com valores nulos. Na˜o existe uma regra u´nica para construc¸a˜o da tabela de distribuic¸a˜o de frequeˆncia, mas e´ importante que a distribuic¸a˜o conte com um nu´mero adequado de classes. Se o nu´mero de classes for excessivamente pequeno acarretara´ perda de detalhe e pouca informac¸a˜o se podera´ extrair da tabela. Por outro lado, se for utilizado um nu´mero excessivo de classes, havera´ alguma classe com frequeˆncia nula ou muito pequena, na˜o atingindo o objetivo de classificac¸a˜o que e´ tornar o conjunto de dados supervisiona´veis. Procedimentos que sera˜o adotados para construc¸a˜o de uma tabela de distribuic¸a˜o de frequeˆncias para varia´veis cont´ınuas: • Ordenar os valores • Determinar o nu´mero de classes1 k: a) k entre 5 e 20 classes, conforme a familiaridade do pesquisador com os dados; b) k = 1 + 3,222× log n, em que n representa o nu´mero de dados; c) k = √ n quando n ≤ 100 e k = 5× log n quando n > 100, sendo n o nu´mero de dados2. • Determinar o intervalo das classes c: Se adotar as duas u´ltimas maneiras de determinar k, c e´ dado por: c = A k − 1 Em que: c: e´ o intervalo ou amplitude da classe; A: amplitude total, dada pela diferenc¸a entre a maior e menor observac¸o˜es; k: nu´mero de classes. • Determinar o limite inferior da primeira classe LI1: LI1 = menor observac¸a˜o− c 2 • Determinar o limite superior da primeira classe LS1: LS1 = LI1 + c • Determinar os demais limites das outras classes (ate´ a classe k): LI2 = LS1 LS2 = LI2 + c LI3 = LS2 LS3 = LI3 + c LI4 = LS3 LS4 = LI4 + c ... ... LIk = LSk−1 LSk = LIk + c 1 Na˜o existe um consenso sobre como determinar o nu´mero de classes e o intervalo das classes, cada autor usa o que acha melhor 2 Esta sera´ a fo´rmula adotada em todas as situac¸o˜es 14 Profs. Fla´vio Bittencourt/Adriana Dias UNIFAL-MG/Alfenas Estat´ıstica Ba´sica 4 ESTATI´STICA DESCRITIVA Exemplo: Considere a varia´vel quantitativa cont´ınua “Taxa de urbanizac¸a˜o municipal (em porcentagem) do estado de Minas Gerais, 2010”. 8 24 46 13 38 54 44 20 17 14 18 15 30 24 20 8 24 18 9 10 38 79 15 62 23 13 62 18 8 22 11 17 9 35 23 22 37 36 8 13 10 6 92 16 15 23 37 36 8 13 44 17 9 30 26 18 37 43 14 9 28 41 42 35 35 42 71 50 52 17 19 7 28 23 29 29 58 77 72 34 12 40 25 7 32 34 22 7 44 15 9 16 31 30 * Dados fict´ıcios Os dados anteriores sa˜o brutos. Portanto, e´ necessa´rio ordena´-los (rol) de alguma forma. Assim: 6 6 7 7 7 8 8 8 8 9 9 9 9 9 10 10 11 12 13 13 13 13 14 14 14 15 15 15 15 16 16 17 17 17 17 18 18 18 18 19 20 20 22 22 22 23 23 23 23 24 24 24 25 26 28 28 29 29 30 30 30 31 32 34 34 34 35 35 35 36 37 37 38 38 40 41 42 42 43 44 44 44 46 50 52 54 58 62 62 71 72 77 79 92 Agora, calcula-se o nu´mero de classes: k = √ 94 = 9,69 Como k representa o nu´mero de classes, logo tem que ser um valor inteiro, assim sera´ adotado k = 9, mas poderia ser k = 10. Como k = 9 sabe-se que a tabela de distribuic¸a˜o de frequeˆncias tem 9 classes, ou seja, 9 intervalos de valores. O tamanho de cada intervalo, amplitiude da classe, e´ dado por c, assim: c = A k − 1 = 92− 6 9− 1 = 10,75 Como os valores (dados) sa˜o nu´meros inteiros na˜o justifica trabalhar com casas decimais, assim adotar-se-a´ c = 11, por convenieˆncia, podendo ser adotado c = 10 desde de que ao final da construc¸a˜o da tabela se observe que todos os valores foram agrupados nas k = 9 ou k = 10 classes. O pro´ximo ca´lculo e´ a determinac¸a˜o dos limites de cada classe. O limite inferior da primeira classe LI1 e´ determinado por: LI1 = menor observac¸a˜o− c 2 Logo, LI1 = 6− 11 2 = 0,5 O limite superior da primeira classe LS1 e´ calculado por: LS1 = LI1 + c UNIFAL-MG/Alfenas Profs. Fla´vio Bittencourt/Adriana Dias 15 Estat´ıstica Ba´sica 4 ESTATI´STICA DESCRITIVA LS1 = 0,5 + 11 = 11,5 Os demais limites ate´ a 9a classe, sa˜o: Classe Limite inferior Limite superior 2a LI2 = LS1 LS2 = LI2 + c LI2 = 11,5 LS2 = 11,5 + 11 = 22,5 3a LI3 = LS2 LS3 = LI3 + c LI3 = 22,5 LS3 = 22,5 + 11 = 33,5 4a LI4 = LS3 LS4 = LI4 + c LI4 = 33,5 LS4 = 33,5 + 11 = 44,5 5a LI5 = LS4 LS5 = LI5 + c LI5 = 44,5 LS5 = 44,5 + 11 = 55,5 6a LI6 = LS5 LS6 = LI6 + c LI6 = 55,5 LS6 = 55,5 + 11 = 66,5 7a LI7 = LS6 LS7 = LI7 + c LI7 = 66,5 LS7 = 66,5 + 11 = 77,5 8a LI8 = LS7 LS8 = LI8 + c LI8 = 77,5 LS8 = 77,5 + 11 = 88,5 9a LI9 = LS8 LS9 = LI9 + c LI9 = 88,5 LS9 = 88,5 + 11 = 99,5 Apo´s realizar todas as operac¸o˜es, monta-se a tabela de distribuic¸a˜o de frequeˆncias. Para isto apo´s montar as classes volta-se aos dados e verifica-se quantos valores (frequeˆncias) esta˜o em cada classe. O resultado de toda esta operac¸a˜o e´ apresentado na Tabela 9. TABELA 9 Taxa de urbanizac¸a˜o municipal (em porcentagem) do estado de Minas Gerais, 2010 Taxas Nu´mero de munic´ıpios 0,5 ` 11,5 17 11,5 ` 22,5 28 22,5 ` 33,5 18 33,5 ` 44,5 19 44,5 ` 55,5 04 55,5 ` 66,5 03 66,5 ` 77,5 03 77,5 ` 88,5 01 88,5 ` 99,5 01 Total 94 Fonte: Dados fict´ıcios 4.1.3 Tipos de distribuic¸a˜o de frequeˆncias Numa tabela de distribuic¸a˜o de frequeˆncias as frequeˆncias podem ser: Tipos de frequeˆncias Simples { Absolutas Relativas Acumuladas Crescentes { Absolutas Relativas Decrescentes { Absolutas Relativas Distribuic¸a˜o de frequeˆncias simples a) Frequeˆncia simples absoluta: e´ o nu´mero de repetic¸o˜es de um valor individual ou de uma classe de valores da varia´vel estudada. Exemplo: Na Tabela 9 cada frequeˆncia fi, i = 1, . . . , 9, representa o nu´mero de valores que esta˜o em cada classe. 16 Profs. Fla´vio Bittencourt/Adriana Dias UNIFAL-MG/Alfenas Estat´ıstica Ba´sica 4 ESTATI´STICA DESCRITIVA b) Frequeˆncia simples relativa: representa a proporc¸a˜o de observac¸o˜es de um valor individual ou de uma classe em relac¸a˜o ao nu´mero total de observac¸o˜es. Para calcular a frequeˆn- cia relativa basta dividir a frequeˆncia absoluta da classe ou do valor individual pelo nu´mero total de observac¸o˜es. E´ um valor importante para comparac¸o˜es. fri = fi n Em que: fri: frequeˆncia simples relativa da classe i, i = 1, . . . , k; fi: frequeˆncia simples absoluta da classe i, i = 1, . . . , k; n: nu´mero de observac¸o˜es. Exemplo: Com os dados obtidos na Tabela 9 tem-se a seguinte tabela de distribuic¸a˜o de frequeˆncias relativas: TABELA 10 Valores relativos de taxa de urbanizac¸a˜o municipal (em porcentagem) do estado de Minas Gerais, em 94 munic´ıpios, 2010 Taxas Nu´mero de munic´ıpios 0,5 ` 11,5 0,1809 11,5 ` 22,5 0,2979 22,5 ` 33,5 0,1915 33,5 ` 44,5 0,2021 44,5 ` 55,5 0,0426 55,5 ` 66,5 0,0319 66,5 ` 77,5 0,0319 77,5 ` 88,5 0,0106 88,5 ` 99,5 0,0106 Total 1,0000 Fonte: Dados fict´ıcios Cada frequeˆncia relativa foi calculada por: fr1 = 17 94 = 0,1809 fr2 = 28 94 = 0,2979 fr3 = 18 94 = 0,1915 fr4 = 19 94 = 0,2021 fr5 = 04 94 = 0,0505 fr6 = 03 94 = 0,0319 fr7 = 03 94 = 0,0319 fr8 = 01 94 = 0,0106 fr9 = 01 94 = 0,0106 Para expressar os resultados em termos percentuais, multiplica-se o quociente obtido por 100: fpi = fri × 100% Importante: para fins de ana´lises matema´ticas todas as observac¸o˜es contidas num intervalo de classe sera˜o consideradas iguais ao ponto me´dio da classe. Essa hipo´tese e´ a hipo´tese tabular ba´sica (HTB). O ponto me´dio da classe i e´ dado por: X¯i = LIi + LSi 2 Em que: UNIFAL-MG/Alfenas Profs. Fla´vio Bittencourt/Adriana Dias 17 Estat´ıstica Ba´sica 4 ESTATI´STICA DESCRITIVA X¯i: e´ o ponto me´dio da classe i; LIi e LSi: sa˜o, respectivamente, o limite inferior e superior da classe i. 4.1.4 Exerc´ıcios 1. No Pronto Socorro da Santa Casa (2012), foi contabilizadoo nu´mero de pessoas que foram atendidas na emergeˆncia por acidente de carro em 20 grupos de 100 pessoas cada. Os dados obtidos foram: 9, 10, 10, 8, 12, 11, 8, 11, 7, 9, 10, 10, 9, 11, 9, 10, 10, 10, 9, 10. Construa uma tabela de distribuic¸a˜o de frequeˆncias. 2. Dez alunos da UNIFAL-MG/Alfenas (2014/1) foram selecionados e se submeteram a um exame de sangue apresentando os seguintes valores de glicemia em mg/dL: 80, 60, 68, 79, 62, 76, 70, 78, 78, 77. Monte uma tabela de distribuic¸a˜o de frequeˆncias. 3. Foi realizada uma pesquisa a qual tinha por objetivo conhecer a altura dos estudantes do sexo masculino (em metros) da Faculdade X, 2010. Os dados sa˜o os apresentados abaixo: 1,70 1,71 1,72 1,73 1,74 1,75 1,76 1,77 1,78 1,79 1,80 1,80 1,83 1,85 1,95 1,70 1,71 1,72 1,73 1,74 1,75 1,76 1,77 1,78 1,79 1,80 1,80 1,83 1,85 2,00 1,70 1,71 1,72 1,73 1,74 1,75 1,76 1,77 1,78 1,80 1,80 1,82 1,83 1,85 1,70 1,72 1,72 1,73 1,75 1,75 1,76 1,77 1,78 1,80 1,80 1,82 1,84 1,86 1,70 1,72 1,72 1,73 1,75 1,75 1,76 1,78 1,78 1,80 1,80 1,82 1,84 1,87 1,70 1,72 1,72 1,74 1,75 1,75 1,76 1,78 1,79 1,80 1,80 1,82 1,84 1,90 1,70 1,72 1,73 1,74 1,75 1,75 1,76 1,78 1,79 1,80 1,80 1,83 1,85 1,90 1,71 1,72 1,73 1,74 1,75 1,75 1,76 1,78 1,79 1,80 1,80 1,83 1,85 1,90 1,71 1,72 1,73 1,74 1,75 1,75 1,77 1,78 1,79 1,80 1,80 1,83 1,85 1,90 1,71 1,72 1,73 1,74 1,75 1,75 1,77 1,78 1,79 1,80 1,80 1,83 1,85 1,90 Monte uma tabela com a distribuic¸a˜o de frequeˆncias absolutas, relativas e percentuais. 4.1.5 Gra´ficos A representac¸a˜o gra´fica e´ outro recurso que tem por objetivo dar uma ideia, a mais imediata poss´ıvel, dos dados nume´ricos, proporcionando maior facilidade de compreensa˜o deles, para chegar a concluso˜es sobre o comportamento do fenoˆmeno em estudo. Um gra´fico deve ter, dentre outras, as seguintes caracter´ısticas: - Clareza: possibilita a leitura e interpretac¸o˜es correta dos valores do fenoˆmeno; - Simplicidade: possibilita a ana´lise ra´pida do fenoˆmeno observado. Evita-se perder com parti- cularidades sem importaˆncia; - Veracidade: indispensa´vel, pois, se o gra´fico na˜o representar uma realidade, perde sua finali- dade. Classificac¸a˜o quanto a` forma: a) Diagramas: gra´ficos geome´tricos dispostos em duas dimenso˜es. Sa˜o mais usados na repre- sentac¸a˜o de se´ries estat´ısticas. b) Cartogramas: e´ a representac¸a˜o sobre uma carta geogra´fica, sendo muito usado na Geografia, Histo´ria e Demografia. c) Estereogramas: representam volumes e sa˜o apresentados em treˆs dimenso˜es. d) Pictogramas: a representac¸a˜o gra´fica que consta de figuras representativas do fenoˆmeno. Desperta logo a atenc¸a˜o do pu´blico. Classificac¸a˜o quanto ao objetivo: a) Gra´ficos de informac¸a˜o - o objetivo e´ proporcionar uma visualizac¸a˜o ra´pida e clara da in- tensidade das categorias ou dos valores relativos ao fenoˆmeno. Sa˜o gra´ficos tipicamente expositivos, devendo ser o mais completo poss´ıvel, dispensando comenta´rios explicativos. 18 Profs. Fla´vio Bittencourt/Adriana Dias UNIFAL-MG/Alfenas Estat´ıstica Ba´sica 4 ESTATI´STICA DESCRITIVA Caracter´ısticas: - deve conter t´ıtulo em letra de forma; - as legendas podem ser omitidas, desde que as informac¸o˜es presentes possibilitem a inter- pretac¸a˜o do gra´fico. b) Gra´ficos de ana´lise - estes gra´ficos fornecem informac¸o˜es importantes na fase de ana´lise dos dados, sendo tambe´m informativos. Os gra´ficos de ana´lise, geralmente, veˆm acompanhados de uma tabela e um texto onde se destacam os pontos principais revelados pelo gra´fico ou pela tabela. Gra´fico em linha Os gra´ficos lineares sa˜o usados frequentemente para a representac¸a˜o de se´ries temporais. Para constru´ı-lo, basta marcar os pontos e uni-los por meio de segmentos de reta, formando uma poligonal. Considerando os dados apresentados na Tabela 1, pode-se representa´-los graficamente segundo a Figura 4: FIGURA 4 Rede rodovia´ria federal policiada. Brasil, 2005 a 2010 Gra´fico em colunas Os gra´ficos em colunas tornam poss´ıveis as comparac¸o˜es das grandezas, representando- as por meio de retaˆngulos de mesma base e alturas proporcionais a`s respectivas grandezas. Estes gra´ficos sa˜o mais utilizados, quando as inscric¸o˜es a serem inseridas sob os retaˆngulos forem curtas. As orientac¸o˜es para construc¸a˜o de um gra´fico em colunas sa˜o: a) os retaˆngulos so´ diferem no comprimento, e na˜o na base, a qual e´ atribu´ıda; b) os retaˆngulos devem ser separados por espac¸os, um dos outros, sendo estes todos iguais, mas na˜o devem ser menores do que a metade da base dos retaˆngulos; c) os retaˆngulos devem ser desenhados, observando-se a ordem de grandeza, para facilitar a leitura e a ana´lise comparativa dos valores. Entretanto, se a se´rie representada for temporal, os dados a serem dispostos no eixo horizontal devem ser colocados em ordem crescente de tempo. Observac¸a˜o: O espac¸o entre as colunas pode variar de 1/3 a 2/3 do tamanho da base da coluna. As informac¸o˜es apresentadas na Tabela 2 podem ser visulizadas na Figura 5: UNIFAL-MG/Alfenas Profs. Fla´vio Bittencourt/Adriana Dias 19 Estat´ıstica Ba´sica 4 ESTATI´STICA DESCRITIVA 0 20 40 60 80 100 120 140 160 Sudeste Nordeste Centro-Oeste Sul Norte N ú m e ro d e in te rn aç õ e s Regiões FIGURA 5 Internac¸o˜es por acidente de traˆnsito segundo a Unidade de Federac¸a˜o, faixa eta´ria de 25 a 29 anos, nov-2013 Gra´fico em barras Os gra´ficos em barras teˆm a mesma finalidade que os gra´ficos em colunas, sendo prefer´ı- veis estes, quando as inscric¸o˜es a serem inseridas forem longas. Sa˜o mais usados para representar se´ries espec´ıficas, com uma u´nica diferenc¸a que e´ a posic¸a˜o em que esta˜o dispostos os retaˆngu- los, na horizontal. As alturas dos retaˆngulos sa˜o iguais e arbitra´rias e os comprimentos sa˜o proporcionais aos respectivos dados. As barras devem ser separadas uma das outras pelo mesmo espac¸o de forma que as inscric¸o˜es identifiquem as diferentes barras. O espac¸o entre as barras pode ser a metade (1/2) ou dois terc¸os (2/3) de suas larguras. As barras devem ser colocadas em ordem de grandeza de forma decrescente para facilitar a comparac¸a˜o dos valores. A categoria“outros” (quando existir) e´ representada na barra inferior, mesmo que o seu comprimento exceda o de alguma outra. Os dados da Tabela 3 sa˜o apresentados graficamente como pode ser visualizado na Figura 6: Le sõ es le v es Le sõ es gr av es N ão in fo rm ad o M o rt o Estado físico 0 10 0. 00 0 20 0. 00 0 30 0. 00 0 40 0. 00 0 50 0. 00 0 60 0. 00 0 70 0. 00 0 Ile so Le sõ es le v es N úm er o de pe ss o a s FIGURA 6 Nu´mero de pessoas envolvidas em acidentes de traˆnsito segundo o estado f´ısico. Brasil, 2010 20 Profs. Fla´vio Bittencourt/Adriana Dias UNIFAL-MG/Alfenas Estat´ıstica Ba´sica 4 ESTATI´STICA DESCRITIVA Gra´fico em setores E´ a representac¸a˜o gra´fica de uma se´rie estat´ıstica em um c´ırculo de raio qualquer, por meio de setores com aˆngulos centrais proporcionais a`s ocorreˆncias. Para constru´ı-lo, parte-se do princ´ıpio de que o nu´mero total de valores observados corresponde ao total de graus de uma circunfereˆncia: 360o. A a´rea do c´ırculo sera´ esta˜o dividida em setores proporcionais aos valores da se´rie. Essa divisa˜o se faz por meio de uma regra de treˆs simples. Com o aux´ılio de um transferidor, efetua-se a marcac¸a˜o dos aˆngulos correspondentes a cada divisa˜o. E´ utilizado quando se pretende comparar cada valor da se´rie com o total. O gra´fico em setores representa valores absolutos ou porcentagens complementares. As se´ries geogra´ficas, espec´ıficas e as categorias em n´ıvel nominal sa˜o mais representadasem gra´ficos de setores, desde que na˜o apresentem muitas parcelas (no ma´ximo sete). Os dados da Tabela 2 tambe´m podem ser representados por meio do gra´fico de setores (Figura 7): 144; 55% 94; 36% 10; 4% 9; 3% 4; 2% Sudeste Nordeste Centro-Oeste Sul Norte FIGURA 7 Internac¸o˜es por acidente de tra˜nsito segundo a Unidade de Federac¸a˜o, faixa eta´ria de 25 a 29 anos, nov-2013 Histograma e pol´ıgono de frequeˆncias HISTOGRAMA Sa˜o gra´ficos de superf´ıcies utilizados para representar distribuic¸o˜es de frequeˆncias com dados agrupados em classes. O histograma e´ composto por retaˆngulos (denominados ce´lulas), cada um deles representando um conjunto de valores pro´ximos (as classes). A largura da base de cada ce´lula deve ser proporcional a` amplitude do intervalo da classe que ela representa e a a´rea de cada ce´lula deve ser proporcional a` frequeˆncia da mesma classe. Se todas as classes tiverem igual amplitude, enta˜o as alturas dos retaˆngulos sera˜o proporcionais a`s frequeˆncias das classes que eles representam. Exemplo: A Tabela 9 e´ uma tabela de distribuic¸a˜o de frequeˆncias, o histograma refe- rente a ela esta´ representado na Figura 8: UNIFAL-MG/Alfenas Profs. Fla´vio Bittencourt/Adriana Dias 21 Estat´ıstica Ba´sica 4 ESTATI´STICA DESCRITIVA FIGURA 8 Taxa de urbanizac¸a˜o municipal (em porcentagem) do estado de Minas Gerais, 2010 POLI´GONO DE FREQUEˆNCIAS E´ o gra´fico feito ligando-se, por meio de segmentos de retas, os pontos correspondentes aos pontos me´dios das classes com suas respectivas frequeˆncias. No in´ıcio e no fim do gra´fico ligamos os pontos nas extremidades dos retaˆngulos para o gra´fico na˜o ficar “voando”. Exemplo: Do histograma apresentado na Figura 8, o respectivo pol´ıgono de frequeˆncias e´ o apresentado na Figura 9: FIGURA 9 Taxa de urbanizac¸a˜o municipal (em porcentagem) do estado de Minas Gerais, 2010 Tipos de curvas de frequeˆncias Curvas de frequeˆncia aparecem, na pra´tica, sob diversas formas caracter´ısticas, como as indicadas na Figura 10: a) Curvas de frequeˆncia sime´trica ou em forma de sino: caracterizam-se pelo fato das ob- servac¸o˜es equidistantes do ponto central ma´ximo ter a mesma frequeˆncia. Um exemplo importante e´ a curva normal, Figura 10a. b) Curvas moderadamente assime´tricas: nestas a cauda da curva de um lado da ordenada ma´xima e´ mais longa do que do outro. Se o ramo mais alongado fica a` direita, a curva e´ dita assime´trica a` direita, ou assime´trica positiva, exemplo a Figura 10b1. Enquanto que, se ocorre o inverso, diz-se que a curva e´ assime´trica a` esquerda, ou assime´trica negativa, Figura 10b2. c) Curva em forma de J, ou em J invertido: o ponto de ordenada ma´xima ocorre em uma das extremidades, Figuras 10c1 e c2, respectivamente. 22 Profs. Fla´vio Bittencourt/Adriana Dias UNIFAL-MG/Alfenas Estat´ıstica Ba´sica 4 ESTATI´STICA DESCRITIVA a b1 b2 c1 c2 d e f FIGURA 10 Tipos de frequeˆncias d) Curva em forma de U: a curva possui ordenadas ma´ximas em ambas as extremidades: Figura 10d. e) Curva de frequeˆncia bimodal: nesta curva ha´ dois ma´ximos (duas modas), Figura 10e f) Curva de frequeˆncia multimodal: teˆm mais de dois ma´ximos, Figura 10f. 4.1.6 Exerc´ıcios 1. Para os dados dos vinte grupos de pessoas atendidas na emergeˆncia por acidente de carro do exerc´ıcio da sec¸a˜o 4.1.4 construa o gra´fico de colunas e o gra´fico de barras. 2. Para dos dados dos dez alunos do exerc´ıcio da sec¸a˜o 4.1.4 construa o histograma e o pol´ıgono de frequeˆncia para os dados percentuais. 3. Para os dados de altura dos estudantes do sexo masculino (em metros) da Faculdade X, 2010, apresentados no exerc´ıcio da sec¸a˜o 4.1.4, confeccione: a) histograma b) pol´ıgono de frequeˆncia 4.2 Medidas Estat´ısticas 4.2.1 Medidas de Tendeˆncia Central Os valores que em estat´ıstica caracterizam os valores me´dios sa˜o chamados de medidas de tendeˆncia central. Entre as principais medidas de tendeˆncia central destacam-se a me´dia aritme´tica, a moda e a mediana. Me´dia A mais importante medida de locac¸a˜o e´ a me´dia aritme´tica. E´ um conceito, sem du´vida, bastante familiar. Por exemplo, a altura me´dia de um grupo de estudantes, ou a temperatura me´dia em uma cidade em determinado dia, ou a nota me´dia de uma turma de 30 alunos. A me´dia aritme´tica de um conjunto de n observac¸o˜es x1, x2, . . . , xn e´ o quociente da divisa˜o de n pela soma dos valores dessas observac¸o˜es. E´ denotada por x¯ (leia-se x barra): x¯ = n∑ i=1 xi n = x1 + x2 + ...+ xn n Em que: xi: indica a observac¸a˜o de ordem i, i = 1, 2, 3, . . . , n. UNIFAL-MG/Alfenas Profs. Fla´vio Bittencourt/Adriana Dias 23 Estat´ıstica Ba´sica 4 ESTATI´STICA DESCRITIVA Exemplo: dados os pesos, em quilos, de 10 rece´m-nascidos: 3,3; 3,1; 2,8; 2,7; 2,9; 3,1; 3,2; 3,0; 3,5; 3,4 o peso me´dio sera´: x¯ = 3,3 + 3,1 + 2,8 + 2,7 + 2,9 + 3,1 + 3,2 + 3,0 + 3,5 + 3,4 10 = 31,0 10 = 3,1 kg Me´dia Ponderada Em algumas situac¸o˜es, os nu´meros que se quer sintetizar teˆm graus de importaˆncia diferentes. Estes graus de importaˆncia sa˜o considerados na hora de calcular a me´dia. Recebem o nome de pesos. A me´dia ponderada dos nu´meros x1, x2, . . . , xn, com pesos p1, p2, ..., pn, representada por x¯p, e´ definida como: x¯p = n∑ i=1 xipi n∑ i=1 pi = x1p1 + x2p2 + ...+ xnpn p1 + p2 + ...+ pn A me´dia aritme´tica pode ser considerada como uma me´dia ponderada em que os pesos sa˜o todos iguais a 1. Exemplo 1: a nota final do sistema acadeˆmico e´ calculado por meio de uma me´dia ponderada dada por: Mfinal = n∑ i=1 Notai Maxi × Pesoi n∑ i=1 Pesoi × 10 Em que: Mfinal: e´ a me´dia final do aluno na disciplina; Notai: e´ a nota atribu´ıda para cada avaliac¸a˜o da disciplina; Maxi: e´ o valor ma´ximo da avaliac¸a˜o; Pesoi: e´ a ponderac¸a˜o da nota em relac¸a˜o a`s demais. Exemplo 2: Considere 5 provas aplicadas as quais possuem os seguintes pesos, respec- tivamente: 1, 2, 3, 4 e 5. Um determinado aluno conseguiu as seguintes notas ordenadas: 40, 50, 80, 90 e 20. A sua me´dia e´ calculada por: x¯p = 5∑ i=1 pixi n∑ i=1 pi = p1x1 + p2x2 + ...+ p5x5 p1 + p2 + ...+ p5 = 1 · 40 + 2 · 50 + 3 · 80 + 4 · 90 + 5 · 20 1 + 2 + 3 + 4 + 5 = 56 pontos Ao calcular uma me´dia para dados distribu´ıdos numa tabela de distribuic¸a˜o de frequeˆn- cias (dados agrupados) usa-se a me´dia ponderada. Para calcular a me´dia quando os dados esti- verem agrupados (tabela de distribuic¸a˜o de frequeˆncias) e se as classes forem formadas por intervalos e´ necessa´rio calcular o ponto me´dio X¯i de cada classe. As frequeˆncias fi funcionam como pesos e os pontos me´dios X¯i’s representam os valores que a varia´vel assume (hipo´tese tabular ba´sica). Considere um experimento em que durante 60 dias anotou-se o nu´mero de cartas en- tregues, diariamente, em um edif´ıcio residencial. Os resultados sa˜o os apresentados a seguir. Calcule a me´dia de cartas entregues no condomı´nio. 24 Profs. Fla´vio Bittencourt/Adriana Dias UNIFAL-MG/Alfenas Estat´ıstica Ba´sica 4 ESTATI´STICA DESCRITIVA TABELA 11 Nu´mero de cartas entregues, diariamente, em um edif´ıcio residencial, durante 60 dias Nu´mero de cartas entregues por dia Nu´mero de dias 20 ` 30 05 30 ` 40 09 40 ` 50 20 50 ` 60 18 60 ` 70 08 Total 60 Nesta situac¸a˜o e´ necessa´rio calcular o ponto me´dio de cada classe, lembre-se que o ponto me´dio da classe i e´ dado por: X¯i = LIi + LSi 2 A Tabela 12 ira´ apresentar mais uma coluna referente aos pontos me´dios das classes para facilitar os ca´lculos: TABELA 12 Nu´mero de cartas entregues, diariamente, em um edif´ıcio residencial, durante 60 dias e o ponto me´dio das classes Nu´mero de cartas entregues por dia Ponto me´dio X¯i das classes Nu´mero de dias fi20 ` 30 25 05 30 ` 40 35 09 40 ` 50 45 20 50 ` 60 55 18 60 ` 70 65 08 Total 60 Assim, o nu´mero me´dio de cartas entregues diariamente e´ dado por: x¯ = k∑ i=1 fi × X¯i k∑ i=1 fi = 5∑ i=1 fi × X¯i 5∑ i=1 fi = f1 · X¯1 + f2 · X¯2 + f3 · X¯3 + f4 · X¯4 + f5 · X¯5 f1 + f2 + f3 + f4 + f5 = 25 · 5 + 35 · 9 + 45 · 20 + 55 · 18 + 65 · 8 5 + 9 + 20 + 18 + 8 = 47,5 cartas/dia Propriedade da me´dia Dentre outras: • A soma alge´brica dos desvios de um conjunto de valores em relac¸a˜o a` me´dia aritme´tica e´ zero: n∑ i=1 (xi − x¯) = 0 UNIFAL-MG/Alfenas Profs. Fla´vio Bittencourt/Adriana Dias 25 Estat´ıstica Ba´sica 4 ESTATI´STICA DESCRITIVA • A soma alge´brica dos quadrados dos desvios de um conjunto de valores em relac¸a˜o a` me´dia aritme´tica e´ mı´nima: D = n∑ i=1 (xi − x¯)2 Vantagens do emprego da me´dia • Como se faz uso de todos os dados para o seu ca´lculo e´ determinada com precisa˜o mate- ma´tica; • E´ determinada quando somente o valor total e o nu´mero de elementos forem conhecidos. Desvantagens do emprego da me´dia • Na˜o pode ser empregada para dados qualitativos; • E´ influenciada por valores extremos, podendo, em alguns casos, na˜o representar a se´rie; • Em distribuic¸o˜es de frequeˆncias em que o limite inferior da primeira classe e/ou o limite superior da u´ltima classe na˜o forem definidos, a me´dia na˜o podera´ ser calculada. Moda Como o pro´prio nome indica, e´ o valor que ocorre com maior frequeˆncia em um conjunto de valores. Em outras palavras, e´ o valor que esta´ na moda. As distribuic¸o˜es que apresentam uma moda u´nica sa˜o chamadas de unimodais; quando apresentam duas modas, bimodais e mais de duas modas, multimodais. Existem ainda distri- buic¸o˜es que na˜o apresentam nenhuma moda: sa˜o chamadas de amodais. Exemplo: Calcule a moda dos seguintes conjuntos de dados: a) 39; 52; 40; 45; 46; 55; 48; 40; 43; 47; 44 mo = 40 b) 2,4; 1,2; 1,4; 2,4; 1,1; 1,8; 1,9; 1,4; 1,8; 3,2; 2,4; 2,2; 2,4; 1,8; 3,6; 1,8; 1,2; 2,4; 2,0; 3,4 mo = 2,4 c) 1, 1, 2, 2, 3, 3 mo = @ (na˜o tem moda) d) 100, 121, 202, 1022, 1500 mo = @ (na˜o tem moda) Moda para dados agrupados Quando os dados esta˜o agrupados em distribuic¸o˜es de frequeˆncias em que as classes na˜o sa˜o formadas por intervalos, na˜o existe uma fo´rmula matema´tica para o ca´lculo da moda, ficando pois, a cargo do pesquisador identificar o elemento que apresentar o maior nu´mero de ocorreˆncias. Esse valor sera´ o valor modal. Para dados agrupados em distribuic¸a˜o de frequeˆncias cujas classes sa˜o formadas por intervalos, o me´todo mais empregado para o ca´lculo da moda e´ o me´todo de Czuber, cuja fo´rmula e´ definida por: mo = LImo + ( ∆1 ∆1 + ∆2 ) Cmo Em que: LImo: limite inferior da classe modal; ∆1: diferenc¸a entre a frequeˆncia absoluta da classe modal e a classe anterior; ∆2: diferenc¸a entre a frequeˆncia absoluta da classe modal e a classe posterior; Cmo: amplitude da classe modal. 26 Profs. Fla´vio Bittencourt/Adriana Dias UNIFAL-MG/Alfenas Estat´ıstica Ba´sica 4 ESTATI´STICA DESCRITIVA Exemplo: Durante 60 dias anotou-se o nu´mero de cartas entregues, diariamente, em um edif´ıcio residencial. Os resultados foram apresentados na Tabela 11. Calcule o valor mais frequente, ou seja, o nu´mero modal de cartas entregues. Soluc¸a˜o: A classe de maior frequeˆncia e´ a 3a classe. O limite inferior da classe modal e´ igual 40 A diferenc¸a entre a frequeˆncia absoluta da classe modal e a classe anterior e´: 20− 9 = 11 A diferenc¸a entre a frequeˆncia absoluta da classe modal e a classe posterior e´: 20− 18 = 2 A amplitude da classe modal e´: 50− 40 = 10 Substituindo estes valores na fo´rmula abaixo, mo = LImo + ( ∆1 ∆1 + ∆2 ) Cmo = 40 + ( 11 11 + 2 ) 10 = 48,46 cartas Vantagens do emprego da moda • E´ de uso pra´tico. Exemplificando: os empregados geralmente adotam a refereˆncia modal de sala´rio, ou seja, o sala´rio pago por muitos outros empregados. Tambe´m, carros e roupas sa˜o produzidos tomando como refereˆncia o tamanho modal; • A moda geralmente e´ um valor verdadeiro e, por conseguinte, pode mostrar-se mais real e coerente. Desvantagens do emprego da moda • Na˜o inclui todos os valores de uma distribuic¸a˜o; • Mostra-se ineficiente quando a distribuic¸a˜o e´ largamente dispersa. Mediana Sejam x1 ≤ x2 ≤ . . . ≤ xn os n valores ordenados de uma varia´vel qualquer. A mediana e´ o valor que centra a distribuic¸a˜o do conjunto de valores, ou seja, que divide este conjunto de valores ordenados em duas partes de frequeˆncias iguais. Para dados na˜o agrupados a mediana e´ um valor que se localiza por: md = Nu´mero ı´mpar de dados : x(n+12 ) Nu´mero par de dados : x(n2 ) + x(n2 +1) 2 Em que: x(n+12 ) : e´ o elemento (valor) que ocupa a n+12 -e´sima posic¸a˜o no conjunto ordenado dos dados; x(n2 ) : e´ o elemento (valor) que ocupa a n2 -e´sima posic¸a˜o no conjunto ordenado dos dados; x(n2 +1) : e´ o elemento (valor) que ocupa a ( n 2 + 1 ) -e´sima posic¸a˜o no conjunto ordenado dos dados. Exemplo: Calcule a mediana dos seguintes conjuntos de dados: a) 39; 52; 40; 45; 46; 55; 48; 40; 43; 47; 44 1o) Ordene os dados: 39; 40; 40; 43; 44; 45; 46; 47; 48; 52; 55 2o) Como ha´ nu´mero ı´mpar de dados, a mediana e´ encontrada por: x(n+12 ) = x( 11+12 ) = x(6) = 45 b) 2,4; 1,2; 1,4; 2,4; 1,1; 1,8; 1,9; 1,4; 1,8; 3,2; 2,4; 2,2; 2,4; 1,8; 3,6; 1,8; 1,2; 2,4; 2,0; 3,4 1o) Ordene os dados: 1,1; 1,2; 1,2; 1,4; 1,4; 1,8; 1,8; 1,8; 1,8; 1,9; 2,0; 2,2; 2,4; 2,4; 2,4; 2,4; 2,4; UNIFAL-MG/Alfenas Profs. Fla´vio Bittencourt/Adriana Dias 27 Estat´ıstica Ba´sica 4 ESTATI´STICA DESCRITIVA 3,2; 3,4; 3,6 2o) Como ha´ nu´mero par de dados, a mediana e´ encontrada por: x(n2 ) + x(n2 +1) 2 = x( 202 ) + x( 202 +1) 2 = x(10) + x(11) 2 = 1,9 + 2,0 2 = 1,95 Para dados agrupados a mediana e´ calculada por: md = LImd + [ n 2 − FA Fmd ] Cmd Em que: LImd: limite inferior da classe mediana; FA: frequeˆncia acumulada das classes anteriores a` classe mediana; Fmd: frequeˆncia absoluta da classe mediana; Cmd: amplitude da classe mediana. Exemplo: Considerando os dados apresentados na Tabela 11, calcule a mediana. Soluc¸a˜o: n = 60. O limite inferior da classe mediana e´: 40, pois sa˜o 60 dias (ou seja 60 observac¸o˜es). Assim a mediana esta´ entre o dia 30 e o dia 31. Observa-se que os dias 30 e 31 esta˜o na 3a classe e, portanto, o limite inferior da 3a classe e´ 40. A frequeˆncia absoluta da classe mediana e´: 20 A frequeˆncia acumulada das classes anteriores a` classe mediana (1a e 2a classes) e´: 5 + 9 = 14. A amplitude da classe mediana e´: 50− 40 = 10. Substituindo estes valores na fo´rmula abaixo, md = LImd + [ n 2 − FA Fmd ] Cmd = 40 + [ 60 2 − 14 20 ] 10 = 48 cartas Propriedades da me´dia, moda e mediana Sejam X e Y duas varia´veis e k uma constante qualquer. • Se X = Y ± k, enta˜o: x¯ = y¯ ± k mo(x) = mo(y)± k md(x) = md(y)± k • Se X = Y · k, enta˜o: x¯ = y¯ · k mo(x) = mo(y) · k md(x) = md(y) · k Relac¸a˜o entre me´dia, moda e mediana A melhor medida de tendeˆncia central de um conjunto de dados depende frequentemente do modo pelo qual os valores esta˜o distribu´ıdos: Se sa˜o sime´tricos e unimodais: a me´dia, a mediana e a moda deveriam ser aproxima- damente as mesmas (Figura 11a). Se sa˜o sime´tricos e bimodais: a me´dia e a mediana seriam, mais uma vez, aproximada- mente as mesmas. Nesse caso a me´dia e a mediana estariam entre os dois picos e seria, portanto, uma medida improva´vel de ocorrer. Indica que os seus dados possuem dois subgrupos distin- tos que diferem na caracter´ıstica medida; nessa situac¸a˜o seria melhor adotar as duas modas ou tratar os dois subgrupos separadamente. Exemplo: Figura 10e. 28 Profs. Fla´vio
Compartilhar