Baixe o app para aproveitar ainda mais
Prévia do material em texto
UENF Universidade Estadual do Norte Fluminense Centro de Ciência e Tecnologia Laboratório de Engenharia de Produção INTRODUÇÃO À PROBABILIDADE E ESTATÍSTICA Notas de Aula Prof. André Policani 2004 SUMÁRIO CAPÍTULO 1: A NATUREZA DA ESTATÍSTICA 1.1 Introdução .............................................................................................................................. 1 1.2 Método Estatístico ................................................................................................................. 1 1.3 Conceitos Básicos da Estatística .......................................................................................... 2 1.4 Amostragem .......................................................................................................................... 3 1.5 Séries Estatísticas ................................................................................................................. 4 1.6 Interpretação de Tabelas ....................................................................................................... 6 1.7 Gráficos Estatísticos .............................................................................................................. 6 1.8 Arredondamento de Dados ................................................................................................... 9 CAPÍTULO 2: DISTRIBUIÇÃO DE FREQUÊNCIA 2.1 Tabela Primitiva ou Dados Brutos ....................................................................................... 10 2.2 Rol ....................................................................................................................................... 10 2.3 Distribuição de Freqüência .................................................................................................. 10 2.4 Elementos de Uma Distribuição de Freqüência .................................................................. 10 2.5 Distribuição de Frequência sem Intervalos de Classe ........................................................ 13 2.6 Representação Gráfica de Uma Distribuição ...................................................................... 13 2.7 A Curva de Frequência (Curva Polida) ................................................................................ 15 2.7.1 O Formato das Curvas de Frequência ............................................................................. 16 CAPÍTULO 3: MEDIDAS DE TENDÊNCIA CENTRAL 3.1 Introdução ............................................................................................................................ 18 3.2 Média Aritmética .................................................................................................................. 18 3.3 Desvio em Relação À Média ............................................................................................... 20 3.4 Propriedades da Média ....................................................................................................... 20 3.5 Outras Médias ..................................................................................................................... 21 3.6 Mediana (Md) ...................................................................................................................... 22 3.7 Moda .................................................................................................................................... 25 3.8 Considerações Sobre o Emprego da Média Aritmética, Mediana e Moda .......................... 26 3.9 Posição Relativa da Média, Mediana e Moda ..................................................................... 27 3.10 Separatrizes ...................................................................................................................... 27 CAPÍTULO 4: MEDIDAS DE DISPERSÃO OU VARIABILIDADE 4.1 Introdução ............................................................................................................................ 29 4.2 Amplitude Total .................................................................................................................... 29 4.3 Desvio Médio ....................................................................................................................... 30 4.4 Desvio Padrão (S) ............................................................................................................... 31 4.5 Variância (S2) ...................................................................................................................... 32 4.6 Coeficiente de Variação (Cv) ............................................................................................... 32 4.7 Exemplos ............................................................................................................................. 33 CAPÍTULO 5: MEDIDAS DE ASSIMETRIA E MEDIDAS DE CURTOSE 5.1 Assimetria ........................................................................................................................... 36 5.2 Curtose ............................................................................................................................... 37 5.3 Exemplos ............................................................................................................................. 38 CAPÍTULO 6: INTRODUÇÃO À PROBABILIDADE 6.1 Introdução ............................................................................................................................ 39 6.2 Conceitos Iniciais ................................................................................................................. 39 6.3 Probabilidades ..................................................................................................................... 41 6.4 Eventos Independentes ....................................................................................................... 43 6.5 Análise Combinatória .......................................................................................................... 43 6.6 Probabilidade Condicional ................................................................................................... 46 6.7 Partição de Um Espaço Amostral ........................................................................................ 47 6.8 Teorema de Bayes .............................................................................................................. 48 6.9 Distribuição de Probabilidade de Uma Variável Aleatória Discreta ..................................... 48 6.10 Modelos Probabilísticos para Variáveis Aleatórias Discretas ............................................ 53 6.11 Variáveis Aleatórias Multidimensionais ............................................................................. 61 CAPÍTULO 7: DISTRIBUIÇÕES DE PROBABILIDADE DE VARIÁVEIS ALEATÓRIAS CONTÍNUAS 7.1 Introdução ............................................................................................................................ 68 7.2 Função de Distribuição de Probabilidade ............................................................................ 69 7.3 Valor Esperado e a Variância de Uma V.A. Contínua ......................................................... 70 7.4 Modelos Probabilísticos para V.A. Contínuas ..................................................................... 71 7.5 Distribuição Conjunta de Variáveis Aleatórias Contínuas ................................................... 83 7.6 Funções Densidade Marginais de Variáveis Aleatórias Contínuas ..................................... 83 7.7 Distribuições Condicionais Contínuas ................................................................................. 84 7.8 Exercícios ............................................................................................................................84 CAPÍTULO 8: INTRODUÇÃO À INFERÊNCIA ESTATÍSTICA 8.1 Introdução ........................................................................................................................... 86 8.2 Amostragem ........................................................................................................................ 87 8.3 Amostragem Casual Simples .............................................................................................. 88 8.4 Estatísticas e Parâmetros .................................................................................................... 89 8.5 Distribuições Amostrais ....................................................................................................... 90 8.6 Distribuição Amostral da Média ........................................................................................... 91 8.7 Teorema do Limite Central .................................................................................................. 91 8.8 Distribuição Amostral da Proporção .................................................................................... 94 CAPÍTULO 9: ESTIMAÇÃO DE PARÂMETROS 9.1 Introdução ............................................................................................................................ 96 9.2 Estimação Pontual ............................................................................................................... 96 9.3 Processos para Obter Estimadores ..................................................................................... 97 9.4 Estimação por Intervalos de Confiança ..............................................................................100 CAPÍTULO 10: TESTES DE HIPÓTESES 10.1 Introdução .........................................................................................................................106 10.2 Objetivo do Teste de Hipótese .........................................................................................106 10.3 Teste da Hipótese Nula ....................................................................................................107 10.4 Nível de Significância do Teste ........................................................................................107 10.5 Etapas para Construção de um Teste de Hipóteses ....................................................... 107 10.6 Testes de Hipótese Sobre a Média ................................................................................. 108 10.7 Testes de Hipótese para Proporções .............................................................................. 116 10.8 Teste de Hipótese para a Variância ................................................................................ 117 REFERÊNCIAS BIBLIOGRÁFICAS EXERCÍCIOS RESOLVIDOS EXERCÍCIOS PROPOSTOS CAPÍTULO 1 A NATUREZA DA ESTATÍSTICA 1.1 INTRODUÇÃO ESTATÍSTICA: é o ramo da matemática que trata da coleta, organização, resumo, apresentação e análise dos dados, assim como obtenção de conclusões que auxiliam nos processos de tomada da decisão. A coleta, a organização ,a descrição dos dados, o cálculo e a interpretação de coeficientes pertencem à ESTATÍSTICA DESCRITIVA, enquanto a análise e a interpretação dos dados, associado a uma margem de incerteza, ficam a cargo da ESTATÍSTICA INDUTIVA ou INFERENCIAL, também chamada como a medida da incerteza ou métodos que se fundamentam na teoria da probabilidade. Assim, a análise e a interpretação dos dados tornam possível o diagnóstico de uma empresa, o conhecimento de seus problemas (condições de funcionamento, produtividade, etc.) a formulação de soluções apropriadas e um planejamento objetivo de ação. 1.2 MÉTODO ESTATÍSTICO Muitas dos conhecimentos atuais foram obtidos por acaso, por necessidades práticas, sem a utilização de um método de pesquisa. Atualmente, quase todo acréscimo de conhecimento resulta de observações e de estudo. Neste sentido, busca-se assegurar que todas as conclusões obtidas sejam cientificamente comprovadas. • Método: é um conjunto de meios (procedimentos) devidamente organizados para se atingir um determinado objetivo. Dentre os métodos utilizados para fins científicos destacam-se o método experimental e o método estatístico. • Método Experimental: consiste em manter constante todas as causas, exceto uma, que deverá ter variações, permitindo assim determinar os efeitos destas variações, caso existam. Ex: Estudos da Química, Física, etc. • Método Estatístico: diante da impossibilidade de manter as causas constantes (nas ciências sociais), admitem todas essas causas presentes variando-as, registrando essas variações e procurando determinar, no resultado final, que influências cabem a cada uma delas. Ex: Quais as causas que definem o preço de uma mercadoria quando a sua oferta diminui? Ou seja: seria impossível, no momento da pesquisa, manter constantes a uniformidade dos salários, o gosto dos consumidores, nível geral de preços de outros produtos, etc. .2.1 FASES DO MÉTODO ESTATÍSTICO 1 1º - DEFINIÇÃO DO PROBLEMA : nesta etapa deve-se definir exatamente o que se pretende esquisar/analisar e qual o objetivo da pesquisa. p Introdução à Probabilidade e Estatística - IPE Prof. André Policani 2 2º - PLANEJAMENTO : Como obter informações ? Que dados deverão ser obtidos ? Quais as etapas da pesquisa (cronograma de atividades)? Quais os custos envolvidos ?, etc. 3º - COLETA DE DADOS : esta etapa consiste no registro sistemático de dados, com um objetivo determinado. Deve ser precedida de um planejamento experimental adequado e de uma técnica de amostragem conveniente. Os dados podem ser classificados em • Dados primários: quando são publicados pela própria pessoa ou organização que os haja recolhido. Ex: tabelas do censo demográfico do IBGE. • Dados secundários: quando são publicados por outra organização. Ex: quando determinado jornal publica estatísticas referentes ao censo demográfico extraídas do IBGE. OBS: as fontes primárias são mais confiáveis. O uso da fonte secundária traz o grande risco de rros de transcrição. e • Coleta Direta: quando é obtida diretamente da fonte. Ex: Empresa que realiza uma pesquisa para saber a preferência dos consumidores pela sua marca. A coleta direta pode ser: contínua (registros de nascimento, óbitos, casamentos, etc.), periódica (recenseamento demográfico, censo industrial) e ocasional (registro de casos de dengue). Coleta Indireta: É feita por deduções a partir dos elementos c• onseguidos pela coleta direta, por analogia, por avaliação, indícios ou proporcionalização. dos coletados e disposição (distribuição e agrupamento) mediante critérios de classificação. dos onstitui uma apresentação geométrica permitindo uma visão rápida e clara do fenômeno. . Na estatística indutiva interpretação dos dados se fundamentam na teoria da probabilidade. .3 CONCEITOS BÁSICOS DA ESTATÍSTICA r, cujo estudo eja possível da aplicação do método estatístico. São divididos em três grupos: • de criminalidade no Rio de Janeiro, o preço médio do litro de gasolina em São Paulo, etc. ssa. Ex: cada o se 4º - APURAÇÃO DOS DADOS : Representa a soma e o processamento dos da a 5º - APRESENTAÇÃO DOS DADOS : Há duas formas usuais de apresentação, que não se excluem mutuamente. A apresentação em tabelas ou quadros, ou seja é uma apresentação numérica dos dados em linhas e colunas distribuídas de modo ordenado, segundo regras práticas fixadas pelo Conselho Nacional de Estatística. A apresentação gráfica dos da c 6º - ANÁLISE E INTERPRETAÇÃO DOS DADOS : A última fase do trabalho estatístico é a mais importante e delicada. Está ligada essencialmente ao cálculo de medidas e coeficientes, cuja finalidadeprincipal é descrever o fenômeno (estatística descritiva) a 1 1.3.1 FENÔMENO ESTATÍSTICO: é qualquer evento que se pretenda analisa s Fenômenos de massa ou coletivo: são aqueles que não podem ser definidos por uma única observação. A estatística dedica-se ao estudo desses fenômenos. Ex: A taxa Fenômenos individuais: são aqueles que irão compor os fenômenos de ma• crime no Grande Rio, o preço da gasolina em cada posto de São Paulo, etc. • Fenômenos de multidão: quando as características observadas para a massa nã verificam para o fenômeno individual. Introdução à Probabilidade e Estatística - IPE Prof. André Policani 3 1.3.2 DADO ESTATÍSTICO: é uma característica observada ou medida de alguma forma. 1.3.3 VARIÁVEL: é, convencionalmente, o conjunto de resultados possíveis de um fenômeno. uando os dados são de caráter nitidamente quantitativo, e o conjunto dos - de contagens finitas. - portadores de, pelo menos, uma existem na população e que servem para essíveis opulação muito grande ou infinita, alto custo para obtenção e tratamento de todos os dados empo para coletar e analisar todas os dados da população, etc.). , a amostra deve possuir as • • (es e tais estratos. As variáveis podem ser: • Qualitativas: Quando seu valores são expressos por atributos: sexo, cor da pele, etc. Quantitativas: Q• resultados possui uma estrutura numérica, trata-se portanto da estatística de variável e se subdividem em : Variável discreta ou descontínua: Seus valores são expressos geralmente através de úmeros inteiros não negativos. Resulta normalmenten Ex: Nº de alunos candidatos aprovados no vestibular 2002, por curso. Direito= 80, Administração = 50; Medicina= 100, Engenharia= 35. Variável contínua: Resulta normalmente de uma mensuração, e a escala numérica de seus possíveis valores corresponde ao conjunto R dos números Reais, ou seja, podem assumir, teoricamente, qualquer valor entre dois limites. Ex.: o tempo necessário para percorrer a ponte Rio-Niterói. Ao cronometrar o percurso, o tempo necessário poderá ser qualquer valor dentro da escala de tempo utilizada. .3.4 POPULAÇÃO: é o conjunto total de elementos 1 característica comum. A população pode ser finita (quando é possível enumerar os elementos) e infinita (quando não é possível enumerar os elementos). 1.3.5 AMOSTRA: é uma parcela representativa e finita da população que é examinada com o propósito de tirarmos conclusões sobre a essa população. .3.5 PARÂMETROS: São valores singulares que 1 caracterizá-la. Para definirmos um parâmetro devemos examinar toda a população. Exemplo de parâmetros média, mediana, desvio padrão, etc. 1.3.6 ESTIMATIVA: é um valor aproximado do parâmetro estudado e é calculado com o uso da mostra. Isto porque muitas vezes os dados de toda a população não estão aca (p da população, muito t 1.4 AMOSTRAGEM Através do emprego de uma técnica conveniente de amostragem, busca-se assegurar que a mostra coletada seja representativa da população, ou sejaa mesmas características básicas da população, no que diz respeito ao fenômeno que está sendo investigado. Os tipos de amostragem mais comuns são: Amostragem aleatória simples: este tipo de amostragem é equivalente a um sorteio lotérico, onde todos os elementos da população têm iguais chances de pertencer à amostra. Para realizá-la basta identificar todos os elementos da população e sortear, por um meio aleatório qualquer, os elementos que deverão pertencer à amostra. Amostragem estratificada: muitas vezes a população se divide em subpopulações tratos), sendo possível que a variável em estudo apresente, de estrato para estrato, um comportamento heterogêneo e, dentro de cada estrato, um comportamento homogêneo. Neste caso, é conveniente que o sorteio dos elementos da amostra consider Introdução à Probabilidade e Estatística - IPE Prof. André Policani 4 Ex: Em uma classe de 60 alunos, 38 são do sexo masculino e 22 do sexo feminino. Deseja-se am da corre ente a 10 os da turma (população). Como são dois estratos (sexo masculino e sexo feminino), temos: POPU ÇÃO 10% AMOSTRA obter uma ostra estratifica spond % dos alun SEXO LA Masculino 38 3,8 4 Feminino 22 2,2 2 Total 60 6 6 Logo, deverão ser sorteados 4 alunos e 2 alunas para compor a amostra. Amostragem sistemática: é quando os elementos da população apresentam-se ordenados e a • retirada dos elementos da amostra é feita periodicamente. Por exemplo, em uma linha de produção, a cada dez itens produzidos, pode-se retirar um para pertencer a Neste caso, o tamanho da amostra estaria fixado em 10% adro que resume um conjunto de dados dispostos segundo linhas e olunas de maneira siste ática (a seguir apresenta-se um exemplo que contém os elementos ção 886 do IBGE, nas casas ou células da • zero ( 0 ) quando o valor é muito pequeno para ser expresso pela unidade utilizada; se os são expressos em numerais decimais, deve-se acrescentar à parte decimal um número correspondente de zeros (0,0; 0,00; 0,000; ...). • um ponto de interrogação (?) quando há dúvida quanto à exatidão de determinado valor. Exemp Produção de Café (Brasil: 1991 – 1995) PRODUÇÃO (1000 t) uma amostra da produção diária. da população. 1.5 SÉRIES ESTATÍSTICAS Denomina-se série estatística qualquer tabela que apresenta a distribuição de um conjunto de dados estatísticos em função da época, do local ou da espécie. 1.5.1 TABELA: É um qu c m que compõem uma tabela). De acordo com a Resolu tabela deve-se colocar: um traço horizontal ( - ) quando o valor é zero; • três pontos ( ... ) quando os dados não estão acessíveis; • valores lo: ANOS 1991 2535 1992 2700 1993 2200 1994 3570 1995 1950 Fonte: IBGE Título Cabeçalho Casa ou célula Introdução à Probabilidade e Estatística - IPE Prof. André Policani 5 1.5.2 SÉRIE TEMPORAL R os valores da variável, em determinado local, discriminados segundo intervalos de tempo variáveis. Produção de Televisores (Brasil: 1995 – 1999) UNIDADES PRODUZIDAS (x 1000) , HISTÓ ICA OU CRONOLÓGICA: descrevem ANOS 1995 125 1996 150 1997 138 1998 179 1999 213 Fonte: Eletroban 1.5.3 SÉRIE GEOGRÁFICA, ESPACIAL, TERRITORIAL OU DE LOCALIZAÇÃO: descrevem os valores da variável em determinado instante, discriminados segundo regiões. DIDAS Vendas da Autocar Veículos Ltda em 1999. DESTINO UNIDADES VEN Cidade 140 Interior 50 Outra cidade 23 Fonte: Autocar Veículos Ltda 1.5.4 SÉRIE ESPECÍFICA EGÓRIC valores da variável, em determinado tempo e local, discriminados segundo especificações ou categorias. vendidos em 199 UNIDADES (x 1000) OU CAT A: descrevem os Itens 7 ARTIGO R 82 oupa feminina Roupa masculina 60 Roupa infantil 53 brinquedos 20 Fonte: Casa do Povo 1.5.5 SÉRIES CONJUGADAS: Também chamadas de tabelas de dupla entrada. São apropriadas à apresen jugada, havendo duas ordens de classificação: uma horizontal e outra vertical. O exemplo abaixo é de uma série geográfica-temporal. nais T em 91 RE O tação de duas ou mais séries de maneira con Termi elefônicos Serviço (19 - 1993) GIÃ 1991 1992 1993 Norte 342.938 375.658 403.494 Nordeste 1.287.813 1.379.101 1.486.649 Sudeste 6.234.501 6.729.467 7.231.634 Sul 1.497.315 1.608.989 1.746.232 Centro-oeste 713.357 778.925 884.822 Fonte: Ministério das Comunicações 1.5.6 DISTRIBUIÇÕES DE FREQUÊNCIA: por serem de grande utilização na Estatística, este conceito será tratado posteriormente em outro capítulo. Introdução à Probabilidade e Estatística - IPE Prof. André Policani6 1.6 INTERPRETAÇÃO DE TABELAS onclusões precisas a partir dos ados contidos nas mesmas. .6.2 DADOS RELATIVOS: são o resultado de comparações por quociente (razões) que se bsolutos e têm por finalidade realçar ou facilitar as comparações ntre quantidades. Os dados relativos geralmente são expressos em termos de percentagens, índices, c 1.6.2.1 PERCENTAGENS: ALUNOS DO INSTITUTO QI APRO OS NO CONCU TURMAS ALUNOS APROVADOS PERCENTUAL (%) A interpretação de tabelas consiste fundamentalmente em tirar c d 1.6.1 DADOS ABSOLUTOS: são os dados estatísticos resultantes da coleta direta da fonte, sem outra manipulação, a não ser a contagem ou mensuração. 1 estabelecem entre dados a e oeficientes e taxas. VAD RSO DO TRT- 1997 TURMA A 87 (87x100)/203 = 42, 9 TURMA B 62 (62x100)/203 = 30,5 203 100,0 TURMA C 54 (54x100)/203 = 26,6 TOTAL 1. 2.2 ÍNDICES: são razões entre duas g6. randezas tais que uma não inclui a outra. Como xemplo, citam-se os índices econômicos: 6. ro total ( número e ocorrências e número de não-ocorrências). Coef. de aprovação escolar = n. de alunos aprovados / n.o de matrículas .6.2.4 TAXAS: são os coeficientes multiplicados por uma pot6encia de 10 (10, 100, 1000, etc.) ara facilitar o entendimento do resultado. Taxa de evasão escolar = Coef. de evasão escolar x 100 denadas, veracidade sobre o e • renda per capita = renda / população • receita per capita = receita / população 1. 2.3 COEFICIENTES: são razões entre o número de ocorrências e o núme d • Coef. de evasão escolar = n.o de alunos desistentes / n.o de matrículas o• 1 p • • Taxa de aprovação escolar = Coef. de aprovação escolar x 100 .7 GRÁFICOS ESTATÍSTICOS 1 São representações visuais dos dados estatísticos contidos nas tabelas. Estas representações ão caracterizadas pelo uso de escalas de valor, sistema de coors fenômeno em estudo, clareza e simplicidade na interpretação dos valores. Os gráficos são classificados em: Diagramas, Pictogramas e Cartogramas. 1.7.1 DIAGRAMAS: São gráficos geométricos dispostos em duas dimensões. São os mais usados na representação de séries estatísticas. Eles podem ser : Introdução à Probabilidade e Estatística - IPE Prof. André Policani 7 1.7.1.1 GRÁFICOS EM LINHAS OU EM CURVAS: são frequentemente usados para retângulos proporcionais, dispostos verticalmente (em colunas) ou horizontalmente (em barras). • s. A ordem a ser observada é a cronológica, se a série for histórica, e a decrescente, se for • Gráficos m as partes. • Os setores são tais que suas áreas são respectivamente proporcionais aos dados da série. O gráfico em setores só deve ser empregado quando há, no máximo, sete dados. • Cada setor é obtido por meio de uma regra de três simples e direta, onde o valor total corresponde a 360o. Ou seja: busca-se determinar quantos graus deve possuir cada setor. • As séries temporais geralmente não são representadas por este tipo de gráfico. representação de séries cronológicas com um grande número de períodos de tempo. As linhas são mais eficientes do que as colunas em situações onde existem grandes flutuações nas séries ou quando há necessidade de se representarem várias séries em um único gráfico. Fonte: Empresa ABC 1.7.1.2 GRÁFICOS EM COLUNAS OU EM BARRAS: uma série é representada por meio de Se as informações a serem escritas forem extensas, é comum optar pelo gráfico de barra • geográfica ou categórica. em colunas (ou em barras) superpostas e compostas são utilizados para representação simultânea de dois ou mais fenômenos, com o propósito de comparação. Fonte: Seminário (Coppe, 2001) 1.7.1.3 GRÁFICOS EM SETORES: são construídos com base em um círculo, e é empregado se pre que deseja-se ressaltar a participação do dado no total. • O total é representado pelo círculo, que é dividido em tantos setores quantas são Investimentos no Setor Elétrico 13,3 11,1 9 9,1 8,6 7,1 5,7 4,5 4,9 5,9 6 6 8 10 12 14 6 1997 1998 $( bi lh õe s) 0 1988 1989 1990 1991 1992 1993 1994 1995 199 2 4U S De m anda (Produto X e Y) 50 100 150 200 250 300 n/7 5 r/7 5 ai/ 75 l/7 5 t/7 5 v/7 5 n/7 6 ar/ 76 i/7 6 l/7 6 76 /76 M ilh ar es d e un id ad es 0 Ja Ma M Ju Se No Ja M M a Ju Se t/ No v X Y Introdução à Probabilidade e Estatística - IPE Prof. André Policani 8 Grau de Instrução na Empresa InfoMarketing 13% 38% 49% fundamental médio superior Fonte: InfoMarketing (2001) 1.7.2 CARTOGRAMAS: são representações relativas a cartas geográficas (mapas). O objetivo desse gráfico é o de figurar os dados estatísticos diretamente relacionados com áreas geográficas ou políticas. Fonte: IBGE (1996) MG 28 34 SP 137 14 RJ 305 32 ES 60 69 Densidade Demográfica 1.7.3 PICTOGRAMAS: são constituídos de elementos gráficos e de figuras representativas do fenômeno em estudo. Devido a sua forma atraente e sugestiva, despertam a atenção do público leigo. Índice de Aprovação no Vestibular (Pré Vestibular Isaac Newton) 65% 73% 78% 90% 53% 40% 0% 20% 40% 60% 80% 100% 1997 1998 1999 2000 2001 2002 Fonte: Pré Vestibular Isaac Newton (2002) Introdução à Probabilidade e Estatística - IPE Prof. André Policani 9 1.8 ARREDONDAMENTO DE DADOS Frequentemente o pesquisador realiza mensurações em seus experimentos que resultam em números decimais. Neste sentido, é conveniente estabelecer algumas regras de arredondamento de dados, baseadas na resolução 886/66 do IBGE. Em suma, tais regras são: 1.8.1 quando o primeiro algarismo a ser abandonado é 0, 1, 2, 3, ou 4: fica inalterado o último algarismo a permanecer. Ex: 53,24 ⇒ 53,2 42,13 ⇒ 42,1 1.8.2 quando o primeiro algarismo a ser abandonado é 6, 7, 8 ou 9: aumenta-se de uma unidade o último algarismo a permanecer. Ex: 42,86 ⇒ 42,9 53,99 ⇒ 54,00 23,378 ⇒ 23, 38 1.8.3 quando o primeiro algarismo a ser abandonado é 5 existem duas possibilidades a) se após o 5 seguir, em qualquer casa, um algarismo diferente de zero, aumenta-se uma unidade do algarismo a permanecer. Ex: 2, 352 ⇒ 2,4 76,2500001 ⇒ 76,3 b) se o 5 for o último algarismo ou se após o 5 somente existirem zeros, o último algarismo a ser conservado somente será aumentado de uma unidade se for ímpar. Ex: 24,75 ⇒ 24, 8 24,65 ⇒ 24,6 24,650000 ⇒ 24,6 CAPÍTULO 2 DISTRIBUIÇÃO DE FREQUÊNCIA 2.1 TABELA PRIMITIVA OU DADOS BRUTOS: é uma tabela ou relação de elementos que não foram numericamente organizados. É difícil formar uma idéia exata do comportamento do grupo como um todo, a partir de dados não ordenados. Ex: Na tabela abaixo, cada valor representa a quantidade vendida (em milhares de unidades) por cada um dos 36 representantes de uma determinada multinacional em 2001. 120 102 95 95 108 100 140 92 97 111 140 132 102 125 89 135 87 82 85 145 124 92 120 85 90 120 110 97 78 89 75 105 128 105 115 91 2.2 ROL: é uma tabela composta por dados ordenados (crescente ou decrescente). Ex: A tabela (rol) abaixo apresenta o volume de vendas com os valores ordenados crescentemente. 75 85 90 95 100 105 115 124 135 78 87 91 95 102 108 120 125 140 82 89 92 97 102 110 120 128 140 85 89 92 97 105 111 120 132 145 2.3 DISTRIBUIÇÃO DE FREQUÊNCIA: é um tipo de tabela que condensa uma coleção de dados conforme as frequências (repetições de seus valores). No exemplo acima, denomina-se frequência o número de vendedores que está relacionado a um determinado valor de vendas. Obs: Para umrol de tamanho relativamente razoável e com muitos valores distintos, é conveniente agrupar os valores em intervalos de classe. 2.4 ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA 2.4.1 AMPLITUDE AMOSTRAL (AA): é a diferença entre o valor máximo e o valor mínimo dos dados disponíveis. Ou seja: AA = xmáx - xmín No exemplo, tem-se que: AA = 145 – 75 = 70. 2.4.2 CLASSES: são intervalos de variação da variável e é simbolizada por i, onde i = 1, 2, .., k. (k é o número total de classes da distribuição). • A regra de Sturges é uma das fórmulas mais empregadas para determinar o número de classes (i) que deverá ter a distribuição em função do n.o de dados existentes (n). Ou seja: i = 1 +3,3log (n) No exemplo dado, tem-se seis classes pois: i = 1 + 3,3log(36) = 6,14 (6 classes). Introdução à Probabilidade e Estatística - IPE Prof. André Policani 10 • O uso da fórmula de Sturges não conduz uma decisão final. Na realidade busca-se definir um número de classes que inclua todos os dados da distribuição, não permita a existência de classes com frequência nula ou com frequência relativa muito elevada. 2.4.3 AMPLITUDE DOS INTERVALOS DE CLASSE: representa a medida do intervalo que define uma classe. É calculada pela seguinte fórmula: i AAh = No exemplo, tem-se que: 126611 6 70h ≅== , 2.4.4 LIMITES DE CLASSE: correspondem aos extremos de cada classe. Designa-se por li e Li, respectivamente, o limite inferior e o limite superior da classe i. Uma vez definidos o número de classes e a amplitude dos intervalos de classe, o próximo passo consiste em determinar os limites de cada uma das classes. De acordo com o exemplo, tem-se a seguinte tabela: VENDAS (x 1000) APURAÇÃO FREQUÊNCIA (fi) 75 ⊢ 87 87 ⊢ 99 99 ⊢ 111 111 ⊢ 123 123 ⊢ 135 135 ⊢ 147 TOTAL • Para definir a primeira classe, utilizou-se o menor nº da amostra e o intervalo de classe (h). No exemplo, a primeira classe possui os seguintes valores: l1 = 75 e L1 = 75 + 12 = 87. • Os intervalos de classe devem ser escritos de acordo com a Resolução 886/66 do IBGE. Utiliza-se o símbolo ⊢ para indicar a inclusão de li e a exclusão de Li . Ou seja: o vendedor que vendeu 99000 unidades estaria incluso na terceira classe (i = 3) e não na segunda. 2.4.5 FREQUÊNCIA SIMPLES OU ABSOLUTA: ou simplesmente frequência de uma classe ou de um valor individual é o número de observações correspondentes a essa classe ou a esse valor. Para determinar a frequência de cada classe, deve-se realizar a apuração dos dados bservações). De acordo com os dados do exemplo, temos que: (o VENDAS (x 1000) APURAÇÃO FREQUÊNCIA (f ) i 75 ⊢ 87 � ׀ 5 87 ⊢ 99 � � П 11 99 ⊢ 111 � П 7 111 ⊢ 123 � ׀ 5 123 ⊢ 135 � 4 135 ⊢ 147 � 4 TOTAL 36 ∑k if =1i = 36 Introdução à Probabilidade e Estatística - IPE Prof. André Policani 11 • A frequência da classe i é simbolizada por f . i • A soma de todas as frequências (frequências de todas as classes) é representada pelo símbolo de somatório: ∑ = n. = k 1i if 2.4.6 PONTO MÉDIO DE UMA CLASSE: é o ponto que divide o intervalo de classe em duas artes iguais. É o valor que representa cada classe. Calcula-se da seguinte forma: p 2 Llx iii += tabela abaixo apresenta o ponto médio de cada classe para o exemplo em questão: A VENDAS (x 1000) APURAÇÃO FREQUÊNCIA (fi) P.M. (xi) 75 ⊢ 87 � ׀ 5 81 87 ⊢ 99 � � П 11 93 99 ⊢ 111 � П 7 105 111 ⊢ 123 � ׀ 5 117 123 ⊢ 135 � 4 129 135 ⊢ 147 � 4 141 TOTAL 36 ∑ = k 1i if = 36 .4.7 OUTROS TIPOS DE FREQUÊNCIA: 2 2.4.7.1 FREQUÊNCIAS RELATIVAS (fri): são os valores das razões entre as frequências imples e a frequência total. Ou seja: s ∑= iii f ffr 2.4.7.2 FREQUÊNCIA ACUMULADA (FI): é o somatório das frequências de todas as classes té a classe em questão, inclusive a própria. Ou seja: a Fk = f1 + f2 + .... + fk tabela abaixo apresenta o cálculo destas frequências para o exemplo dado: A VENDAS (x 1000) APURAÇÃO FREQUÊNCIA (fi) P.M. (xi) fri Fi 75 ⊢ 87 � ׀ 5 81 5/36 5 87 ⊢ 99 � � П 11 93 11/36 16 99 ⊢ 111 � П 7 105 7/36 23 111 ⊢ 123 � ׀ 5 117 5/36 28 123 ⊢ 135 � 4 129 4/36 32 135 ⊢ 147 � 4 141 4/36 36 TOTAL 36 ∑ = k 1i if = 36 ∑ = k 1i ifr = 1 Introdução à Probabilidade e Estatística - IPE Prof. André Policani 12 2.5 DISTRIBUIÇÃO DE FREQUÊNCIA SEM INTERVALOS DE CLASSE: é empregada quando se trata de variável discreta de variação relativamente pequena, onde cada valor pode ser considerado como um intervalo de classe. Se a variável assume numerosos valores distintos, é comum tratá-la como uma variável contínua, formando intervalos de classe diferente de um. Esse tratamento abrevia o trabalho, mas ocasiona alguma perda de precisão. Uma distribuição sem intervalos de classe apresenta a seguinte forma: xi fi x1 f1 x2 f2 M M xn fn ∑ = n 1i if =n Exemplo: Considere a variável x como sendo “o número de filhos de 50 famílias entrevistadas”. A tabela abaixo apresenta os outros tipos de frequências: i xi fi fri Fi 1 0 7 0,14 7 2 1 8 0,16 15 3 2 15 0,30 30 4 3 8 0,16 38 5 4 7 0,14 45 6 5 4 0,08 49 7 Mais de 5 filhos 1 0,02 50 ∑ = n 1i if = 50 ∑ = n 1i ifr 1,00 2.6 REPRESENTAÇÃO GRÁFICA DE UMA DISTRIBUIÇÃO Todos os gráficos que representam uma distribuição de frequências utilizam o primeiro quadrante do sistema de eixos coordenados cartesianos ortogonais. Na linha horizontal (eixo das abscissas) colocam-se os valores da variável e na linha vertical (eixo das ordenadas), as frequências. A seguir, apresentam-se os gráficos usualmente utilizados: 2.6.1 HISTOGRAMA: é formado por um conjunto de retângulos justapostos, cujas bases se localizam sobre o eixo horizontal, de tal modo que seus pontos médios coincidam com os pontos médios dos intervalos de classe. As larguras dos retângulos são iguais às amplitudes dos intervalos de classe. As alturas dos retângulos devem ser proporcionais às frequências de classe. A área de um histograma é proporcional à soma das frequências simples ou absolutas. Introdução à Probabilidade e Estatística - IPE Prof. André Policani 13 2.6.2 POLÍGONO DE FREQUÊNCIA: é um gráfico em linha, sendo as frequências marcadas sobre perpendiculares ao eixo hotizontal, levantadas pelos pontos médios dos intervalos de classe. Para realmente obtermos um polígono (linha fechada), devemos completar a figura, ligando os extremos da linha obtida aos pontos médios da classe anterior à primeira e da posterior à última, da distribuição. Obs: uma distribuição de frequência sem intervalos de classe é representada graficamente por um diagrama onde cada valor da variável é representado por um segmento de reta vertical e de comprimento proporcional à respectiva frequência. No exemplo abaixo, tem-se a seguinte representação: 75 87 99 111 123 135 147 2 4 6 8 10 12 0 f x VENDAS (x 1000) (fi) P.M. (xi) 75 ⊢ 87 5 81 87 ⊢ 99 11 93 99 ⊢ 111 7 105 111 ⊢ 123 5 117 123 ⊢ 135 4 129 135 ⊢ 147 4 141 TOTAL ∑ = k 1i if = 36 75 87 99 111 123 135 147 2 4 6 8 10 12 0 f x 5 11 7 5 4 4 11 VENDAS (x 1000) (fi) P.M. (xi) 75 ⊢ 87 5 81 87 ⊢ 99 11 93 99 ⊢ 111 7 105 111 ⊢ 123 5 117 123 ⊢ 135 4 129 135 ⊢ 147 4 141 TOTAL ∑ = k 1i if = 36 i xi fi 1 0 7 2 1 8 3 2 15 4 3 8 5 4 7 6 5 4 7 Mais de 5 filhos 1 ∑ = n 1i if = 50 1 2 3 4 5 mais de 5 2 4 6 8 10 12 0 f x 14 16 Introdução à Probabilidadee Estatística - IPE Prof. André Policani 14 2.6.3 POLÍGONO DE FREQUÊNCIA ACUMULADA: é traçado marcando-se as frequências acumuladas sobre perpendiculares ao eixo horizontal, levantadas nos pontos correspondentes aos limites superiores dos intervalos de classe. Obs: No caso de uma distribuição de frequência sem intervalos de classe, o gráfico da frequência acumulada se apresentará com pontos de descontinuidade nos valores observados da variável. Por exemplo, tem-se a seguinte representação: VENDAS (x 1000) fi Fi 75 ⊢ 87 5 5 87 ⊢ 99 11 16 99 ⊢ 111 7 23 111 ⊢ 123 5 28 123 ⊢ 135 4 32 135 ⊢ 147 4 36 TOTAL ∑ = k 1i if = 36 75 87 99 111 123 135 147 10 20 30 40 0 F x i xi fi Fi 1 0 7 7 2 1 8 15 3 2 15 30 4 3 8 38 5 4 7 45 6 5 4 49 7 Mais de 5 filhos 1 50 ∑ = n 1i if = 50 7 49 1 2 3 4 5 mais de 5 10 6 30 40 0 F x 50 20 50 45 38 30 15 2.7 A CURVA DE FREQUÊNCIA (CURVA POLIDA): Enquanto o polígono de frequência fornece a imagem real do fenômeno estudado, a curva de frequência fornece a imagem tendencial. O polimento (geometricamente, corresponde à eliminação dos vértices da linha poligonal) de um polígono de frequência representa o que seria tal polígono com um número maior de dados em amostras mais amplas. Isto pode ser obtido através do emprego da seguinte fórmula: 4 ff2ffc 1ii1ii +− ++= onde: • fc = frequência calculada da classe considerada (freq. polida) i • fi frequência simples da classe considerada = • fi-1 = frequência simples da classe anterior à da classe considerada • fi+1 = frequência simples da classe posterior à da classe considerada . Introdução à Probabilidade e Estatística - IPE Prof. André Policani 15 VENDAS (x 1000) fi fci 75 ⊢ 87 5 5,3 87 ⊢ 99 11 8,5 99 ⊢ 111 7 7,5 111 ⊢ 123 5 5,3 123 ⊢ 135 4 4,3 135 ⊢ 147 4 3,0 TOTAL ∑ = k 1i if = 36 75 87 99 111 123 135 147 2 4 6 8 10 12 0 fci x 2.7.1 O FORMATO DAS CURVAS DE FREQUÊNCIA As curvas de frequência geralmente assumem as seguintes formas características: 2.7.1.1 CURVAS EM FORMA DE SINO: caracterizam-se por apresentarem um valor máximo na região central. De acordo com os dados da distribuição, podem apresentar-se de forma simétrica e assimétrica. • Curva simétrica: caracteriza-se por apresentar o valor máximo no ponto central e os pontos equidistantes deste ponto terem a mesma frequência. • Curva assimétrica: na realidade não existem curvas perfeitamente simétricas. Deste modo, as curvas correspondentes às distribuições apresentam uma cauda mais alongada em um dos lados da curva. Se a cauda mais alongada fica à direita, a curva é chamada assimétrica positiva ou enviesada à direita. Se a cauda se alonga à esquerda, a curva é chamada assimétrica negativa ou assimétrica à esquerda. 2.7.1.2 CURVAS EM FORMA DE JOTA: representam distribuições fortemente assimétricas, caracterizando-se por apresentarem o ponto de ordenada máxima em uma das extremidades. Introdução à Probabilidade e Estatística - IPE Prof. André Policani 16 2.7.1.3 CURVAS EM FORMA DE U: caracterizam-se por apresentarem ordenadas máximas em ambas as extremidades. 2.7.1.3 DISTRIBUIÇÃO RETANGULAR: é uma distribuição muito rara. Apresenta todas as classes com a mesma frequência. Representa-se através de um histograma em que todas as colunas possuem a mesma altura ou por um polígono de frequência reduzido a um segmento de reta horizontal. CAPÍTULO 3 MEDIDAS DE TENDÊNCIA CENTRAL 3.1 INTRODUÇÃO São medidas cujo valor numérico permite ter uma noção da localização do centro de uma distribuição de frequência. Estas medidas permitem verificar a tendência dos dados observados a se agruparem em torno dos valores centrais. As medidas de tendência central mais utilizadas são: as médias (aritmética, harmônica, geométrica, quadrática), a mediana e a moda. 3.2 MÉDIA ARITMÉTICA Sejam x1, x2, x3, ...., xn os valores de um conjunto de observações e n a quantidade de observações. 3.2.1 MÉDIA ARITMÉTICA SIMPLES (Dados não-agrupados) Quando deseja-se conhecer a média dos dados não-agrupados em tabelas de frequências, determinamos a média aritmética simples através da seguinte equação: n x x n i i∑ == 1 Exemplo: Sabendo-se que a venda diária de arroz tipo A, durante uma semana, foi de 10, 14, 13, 15, 16, 18 e 12 toneladas, temos, para venda média diária na semana de: 7 12181615131410x ++++++= = 14 toneladas 3.2.2 MÉDIA ARITMÉTICA PONDERADA (Dados agrupados) Quando cada dado da distribuição está associado a um valor de frequência, diz-se que a média é ponderada (possui peso). Lembre-se que frequência é o número de vezes que um dado se repete. 3.2.2.1 Sem intervalos de classe: Neste caso a média aritmética ponderada é calculada pela equação: n fx x n 1i ii∑ == Introdução à Probabilidade e Estatística - IPE Prof. André Policani 19 Exemplo: Considere a variável x como sendo “o número de televisores de 50 famílias entrevistadas”. i xi fi fri Fi xifi 1 0 3 0,06 3 0 2 1 15 0,30 18 15 3 2 18 0,36 36 36 4 3 10 0,20 46 30 5 4 4 0,08 50 16 ∑ = n 1i if = 50 ∑ = n 1i ifr =1,00 i n 1i ifx∑ = =97 Assim, tem-se que: n fx x n 1i ii∑ == = 50 97 = 1,94 Obs: Como x (quantidade de televisores) é uma variável discreta, como interpretar o resultado obtido? Afinal, não existem 1,94 televisores. O valor médio de 1,94 televisores identifica uma tendência de que as famílias entrevistadas possuem, em média, dois televisores. 3.2.2.2 Com intervalos de classe: Neste caso, convenciona-se que todos os valores incluídos em um determinado intervalo de classe são representados pelo seu ponto médio. Assim, determina-se a média aritmética ponderada por meio da equação: ∑ ∑ = == k 1i i k 1i ii f fx x , onde: • x é o ponto médio da classe i. i • k é o número total de classes xemplo: Calcular a média de vendas dos 36 vendedores de uma empresa (vide capítulo 2). E Solução: Após estabelecer o rol para organizar os dados e distribuí-los em intervalos de lasses, têm-se a seguinte tabela: c VENDAS (x 1000) APURAÇÃO fi P.M. (xi) fri Fi xifi 75 ⊢ 87 � ׀ 5 81 5/36 5 405 87 ⊢ 99 � � П 11 93 11/36 16 1023 99 ⊢ 111 � П 7 105 7/36 23 735 111 ⊢ 123 � ׀ 5 117 5/36 28 585 123 ⊢ 135 � 4 129 4/36 32 516 135 ⊢ 147 � 4 141 4/36 36 564 TOTAL 36 ∑ = k 1i if = 36 ∑ = k 1i ifr = 1 ∑ = k 1i iifx = 3828 Assim, tem-se que: ∑ ∑ = == k 1i i k 1i ii f fx x = 36 3828 = 106,3 Introdução à Probabilidade e Estatística - IPE Prof. André Policani 20 3.3 DESVIO EM RELAÇÃO À MÉDIA ento de um conjunto de alores e a média aritmética. Sendo o desvio denotado por di, temos: Denomina-se desvio em relação à média a diferença entre cada elem v xdi −= xi na: 10, 14, 13, 15, 16, 18 e 12 toneladas; venda média diária na semana de: Para o exemplo apresentado: • venda diária de arroz tipo A, durante a uma sem • ton 14x = xxd ii −= ⇒ d1 = 10 –14 = -4 xxd 22 −= ⇒ d2 = 14 –14 = 0 xxd 33 −= ⇒ d3 = 13 –14 = -1 xx44 −= ⇒ d4 = 15 –14 = 1 d xxd 55 −= ⇒ d5 = 16 –14 = 2 xxd 66 −= ⇒ d6 = 18 –14 = 4 xxd 77 −= ⇒ d7 = 12 –14 = -2 .4 PROPRIEDADES DA MÉDIA .4.1 A soma algébrica dos desvios tomados em relação à média é nula: 1i i = 3 3 0d k =∑ onformeo exemplo ante C rior, temos: ( ) ( ) ( ) =−++++−++−=∑ 2421104d7 = i 0 os valores de uma variável, a édia do conjunto é aumentada (o nte: 1i .4.2 Somando-se ou subtraindo-se uma constante (c) de todos 3 m u diminuída) desta consta cxycxy ±=±= ii ⇒ Seja c=3. Somando y1 = 13; y2 = 17; y3 = 16; y4 = 18; y5 = 19; y6 = 21; y7 = 15. Donde: i =++++++=∑ endo n = 7: 3 a cada um dos valores da variável x, temos que: 11915211918161713y 7 1i= S 17314cxy17119y =+=+=⇒== el por uma constante ), a média do conjunt dida) p 7 .4.3 Multiplicando-se (ou dividindo-se) todos os valores de uma variáv3 (c o é multiplicada (ou divi or essa constante: cxycxy ii •=⇒•= ou cycy i i =⇒= xx Introdução à Probabilidade e Estatística - IPE Prof. André Policani 21 Seja c=3. Multiplica y1 = 30; y = 42; y = 39; y = 45; y = 48; y = 54; y = 36. Donde: 29436544845394230y i =++++++=∑ endo n = 7: ndo por 3 cada um dos valores da variável x, temos que: 2 3 4 5 6 7 7 1 i = S 42314cxy42 7 294y =•=+=⇒== 3.5.1 MÉDIA HARMÔNICA: 3.5 OUTRAS MÉDIAS é calculada pela equação: fx M 1 n n 1i i 1 i H − = − ⎥⎥ ⎥⎤ ⎢⎢ ⎢⎡ = ∑ . f 1i i = ⎥⎦⎢⎣ ∑ ) xi =: 2, 4, 6, 8 f = 1, i = 1, 2,...., n (média harmônica simples) MH = Exemplo: Calcule a média harmônica para os seguintes dados: a i 843 25 96 424 25 4 24 34612 4 8 1 6 1 4 1 2 1 1 11 ,==⎥⎦ ⎤⎢⎣ ⎡ ⋅=⎥ ⎥⎤⎢⎢ ⎡ +++ =⎥⎥ ⎤ ⎢⎢ ⎡ +++ − −− ⎥⎥⎦⎢⎢⎣⎥⎥⎦⎢⎢⎣ ) xi =: 2, 4, 6, 8 f = 4, 3, 2, 1 (média harmônica ponderada) MH= b i 123 77 240 240 77 10 24 381848 1234 1 8 12 6 13 4 14 2 1 1 11 ,==⎥⎦ ⎤⎢⎣ ⎡= ⎥⎥ ⎥⎤ ⎢⎢ ⎢⎡ +++ =⎥⎥ ⎥⎤ ⎢⎢ ⎢⎡ +++ ⎟⎠ ⎞⎜⎝ ⎛ ⋅+⎟⎠ ⎞⎜⎝ ⎛ ⋅+⎟⎠ ⎞⎜⎝ ⎛ ⋅+⎟⎠ ⎞⎜⎝ ⎛ ⋅ − −− ⎥⎦⎢⎣⎥⎦⎢⎣ 3.5.2 MÉDIA GEOMÉTRICA: é calculada pela equação: xxxM n fn f 2 f 1G n21 ⋅⋅⋅= L Introdução à Probabilidade e Estatística - IPE Prof. André Policani 22 Exemplo: Calcule a média geométrica para os seguintes dados: a) xi =: 2, 4, 6, 8 ) MG = fi = 1, i = 1, 2,...., n (média geométrica simples 4343848642 44 111 ,==⋅⋅⋅ b) xi =: 2, 4, 6, 8 MG= 1 fi = 4, 3, 2, 1 (média geométrica ponderada) 52383664168642 1010 1234 ,=⋅⋅⋅=⋅⋅⋅ 3.5.3 MÉDIA QUADRÁTICA: é calculada através da equação: fxfx M n n 1i i 2 i 2 1 n n 1i i 2 i Q ∑∑ == =⎥⎥ ⎥⎤ ⎢⎢ ⎢⎡ = .. ff 1i i 1i i ∑∑ == ⎥⎦⎢⎣ ) xi =: 2, 4, 6, 8 fi = 1, i = 1, 2,...., n (média quadrática simples) MQ = Exemplo: Calcule a média quadrática para os seguintes dados: a 485 41111 ,==+++ b) xi =: 2, 4, 6, 8 MQ= 1208642 2222 +++ fi = 4, 3, 2, 1 (média quadrática ponderada) ( ) ( ) ( ) ( ) 474 101234 ,==+++ s, estando estes úmeros ordenados de forma crescente ou decrescente. A mediana é o valor que separa o onjunto de números em dois subconjuntos de mesmo número de elementos. de-se da seguinte forma: ) ordenar os dados (de forma crescente ou decrescente); b) determinar a posição (p) da mediana, através da equação: 20018263442 2222 ⋅+⋅+⋅+⋅ 3.6 MEDIANA (Md) A mediana é o número que se encontra no centro de uma série de número n c 3.6.1 A MEDIANA EM DADOS NÃO AGRUPADOS Para determinar a mediana em dados não agrupados, proce a 2 p = 1N + , onde N é o número de elementos da série. Introdução à Probabilidade e Estatística - IPE Prof. André Policani 23 c) identificação da mediana: se o número de elementos (N) for ímpar, a mediana representa exatamente o valor central dos dados, definido pela posição (p). Se o número de elementos for par, a mediana corresponde a média dos dois valores centrais da série. Exemplo A: Determine a mediana da seguinte série de valores: 1, 7, 5, 11, 9. a) ordenação: 1, 5, 7, 9, 11. b) posição (p) da mediana: 5p = to) c) como o número de elementos ediana é Md = 7. Exemplo B: Determine a median a) ordenação: 1, 5, 7, 9, 11, 50. b) posição (p) da mediana: 6p = c) como o número de elemento valores centrais da série. Sendo a série ordenada (1, 5, 3.6.2 A MEDIANA EM DADOS A Assim como no estudo das intervalos de classe ou em uma d 3.6.2.1 SEM INTERVALOS DE C Identifica-se a frequência acum frequências. A mediana será o va Exemplo: Seja x “o número de te a) posição: 525 2 150p ,=+= (a m b) Md = 2 ( o 25,5.o elemento po 2 1+ = 3 (a mediana é o 3.o elemen da série é ímpar (5), o valor da m (1, 5, 7, 9, 11) a da seguinte série de valores: 1, 7, 5, 11, 50, 9. 2 1+ = 3,5 (a mediana está entre o 3.o e o 4.o elemento) s da série é par (6), o valor da mediana é a média dos dois 7, 9, 11, 50), então: Md = 8 2 97 =+ GRUPADOS médias, a mediana pode ser agrupada em frequências sem istribuição de frequência. LASSE ulada imediatamente superior à metade da soma das lor da variável que corresponde a tal frequência acumulada. levisores de 50 famílias entrevistadas”. i xi fi Fi 1 0 3 3 2 1 15 18 3 2 18 36 4 3 10 46 5 4 4 50 ∑ = n 1i if = 50 ediana é o 25,5.o elemento) ssui 2 televisores) Introdução à Probabilidade e Estatística - IPE Prof. André Policani 24 3.6.2.2 COM INTERVALOS DE CLASSE Neste caso, deve-se realizar os seguintes passos: a) calcular as frequências acumuladas; b) calcular a posição da mediana: p = 2 N c) determinar a classe na qual se encontra a mediana: a classe mediana (a classe correspondente à frequência acumulada imediatamente superior a p = 2 N ). d) determinar o limite inferior da classe mediana: Linf e) determinar a amplitude do intervalo da classe mediana: h f) determinar a frequência acumulada da classe anterior à da classe mediana: Fant g) determinar a frequência da classe mediana: f * h) Determinar o valor da mediana através da expressão: f FphLMd antinf ⎟⎠ ⎞⎜⎝ ⎛ −⋅+= * Exemplo: Calcule a mediana para a distribuição abaixo. VENDAS (x 1000) APURAÇÃO fi P.M. (xi) fri Fi xifi 75 ⊢ 87 � ׀ 5 81 5/36 5 405 87 ⊢ 99 � � П 11 93 11/36 16 1023 99 ⊢ 111 � П 7 105 7/36 23 735 111 ⊢ 123 � ׀ 5 117 5/36 28 585 123 ⊢ 135 � 4 129 4/36 32 516 135 ⊢ 147 � 4 141 4/36 36 564 TOTAL 36 ∑ = k 1i if = 36 ∑ = k 1i ifr = 1 ∑ = k 1i iifx = 3828 a) as frequências acumuladas estão ilustradas na sexta coluna; b) a posição da mediana: p = 2 N = 18 2 36 = c) a classe mediana: [99, 111[ d) o limite inferior da classe mediana: Linf = 99 e) a amplitude do intervalo da classe mediana: h = 12 f) a frequência acumulada da classe anterior à da classe mediana: Fant = 16 g) a frequência da classe mediana: f * = 7 h) o cálculo da mediana: ⎟⎠ ⎞⎜⎝ ⎛ −⋅+= *f FphLMd antinf = =⎟⎠ ⎞⎜⎝ ⎛ −⋅+ 7 16181299 102,43 Introdução à Probabilidade e Estatística - IPE Prof. André Policani 25 3.7 MODA A moda (Mo) é o valor que ocorre com maior frequência em uma série de valores. Assim, o salário modal dos empregados de uma fábrica é o salário mais comum, isto é, o salário recebido pelo maior número de empregados dessa fábrica. 3.7.1 A MODA EM DADOS NÃO AGRUPADOS A moda é facilmente obtida, bastan mais se repete. Exemplo A: Na série { 1, 2, 7, 8, 9, 10. • Háséries nas quais não exis apareça mais vezes que outros. Exemplo B: A série { 2, 3, 5, 9 • Em outros casos, pode haver série tem dois ou mais valores Exemplo C: { 2, 3, 5, 5, 5, 6, bimodal. . .7.2 A MODA EM DADOS AGRU3 .7.2.1 SEM INTERVALOS DE CL3 Uma vez agrupados os dados, de ariável de maior frequência. v Exemplo: Seja x “o número de quantos televisores cada família po amílias possui? f De acordo com a tabela acima, M elevisores). t do somente encontrar o valor que 10, 10, 10, 15 } a moda é igual a te moda, isto é, não há um valor , 10, 15 } não apresenta moda. A série é amodal. dois ou mais valores de concentração. Diz-se, então, que a modais. 6, 9, 9, 9, 11, 12 } apresenta duas modas: 5 e 9. A série é PADOS ASSE termina-se imediatamente a moda encontrando o valor da televisores”. Entrevistam-se 50 famílias para determinar ssui. Qual a quantidade de televisores que a maioria das 50 o = 2 (a maioria das 50 famílias entrevistadas possui 2 i xi fi Fi 1 0 3 3 2 1 15 18 3 2 18 36 4 3 1 0 46 5 4 4 50 ∑ = n 1i if = 50 Introdução à Probabilidade e Estatística - IPE Prof. André Policani 26 3.7.2.2 COM INTERVALOS DE CLASSE stá compreendido entre os mites da classe modal. Para calcular a moda é preciso determinar: a classe modal: Fpost se modal: FMo ) o cálculo da Moda: A classe que apresenta a maior frequência é denominada classe modal. Pela definição, podemos afirmar que a moda, neste caso, é o valor dominante que e li a) a classe modal b) limite inferior da classe modal: Linf c) a amplitude do intervalo da classe modal: h d) a frequência da classe anterior à da classe modal: Fant e) a frequência da classe posterior à d f) a frequência da clas g F2FF FFhLMo antMoinf ⎟⎟ ⎞ ⎜⎜ ⎛ −+ −⋅−= Moantpost ⎠⎝ xemplo: Calcule a moda para a distribuição abaixo. E VENDAS (x 1000) APURAÇÃO fi P.M. (xi) fri Fi xifi 75 ⊢ 87 � ׀ 5 81 5/36 5 405 87 ⊢ 99 � � П 11 93 11/36 16 1023 99 ⊢ 111 � П 7 105 7/36 23 735 111 ⊢ 123 � ׀ 5 117 5/36 28 585 123 ⊢ 135 � 4 129 4/36 32 516 135 ⊢ 147 � 4 141 36 564 4/36 TOTAL 36 =1i = 36 ∑ = k 1i ifr = 1 ∑ = k 1i iifx = 3828 ∑k if a) a classe modal: [87, 99[ b) limite inferior da classe modal: Linf = 87 c) a amplitude do intervalo da classe modal: h =12 d) a frequência da classe anterior à da classe modal: Fant = 5 e) a frequência da classe posterior à da classe modal: Fpost = 7 se modal: FMo = 11 ) o cálculo da Moda: f) a frequência da clas g ⎟⎟ ⎞ ⎜⎜ ⎛ −+ −⋅−= antMoinf F2FF FFhLMo ⎠⎝ Moantpost = ( ) =⎟⎟⎠ ⎞ ⎜⎜⎝ ⎛ −+ −⋅− 11.275 5111287 94,2 .8 CONSIDERAÇÕES SOBRE O EMPREGO DA MÉDIA ARITMÉTICA, MEDIANA E MODA na e com a oda. A média aritmética é a medida de posição que possui a maior estabilidade. 3 A média aritmética pode ser calculada a partir de dados brutos, sem a necessidade de agrupamento ou ordenação dos valores originais, o que não ocorre com a media m Introdução à Probabilidade e Estatística - IPE Prof. André Policani 27 A mediana é preferível à media aritmética quando: a) onto médio da distribuição: aquele valor que divide a ) Quando há valores extremos que afetam de maneira acentuada a média aritmética. o entral ou quando a medida de posição deva ser o valor mais típico (comum) da distribuição. .9 POSIÇÃO RELATIVA DA MÉDIA, MEDIANA E MODA e acordo com a curva da distribuição em forma de sino, tem-se que: .10 SEPARATRIZES quartis, os percentis e os decis – ssom como a mediana, são conhecidas por separatrizes. os valores de uma série que dividem em quatro partes iguais. Existem, ortanto, três quartis. deseja-se conhecer exatamente o p distribuição em duas partes iguais. b A moda é utilizada quando deseja-se obter uma medida rápida e aproximada de posiçã c 3 D • Curva simétrica: x = Md = Mo • Curva assimétrica positiva: Mo < Md < x • Curva assimétrica negativa: x < Md < Mo x = Md = Mo Curva simétrica xMo < Md < x < Md < Mo Curva assimétrica positiva Curva assimétrica negativa 3 Além das medidas de posição apresentadas, existem outras que consideradas isoladamente, não são medidas de tendência central. Tais medidas – os a 3.10.1 QUARTIS: São p Introdução à Probabilidade e Estatística - IPE Prof. André Policani 28 • primeiro quartil (Q1): valor situado de tal modo na série que uma quarta parte (25%) dos dados é menor que ele e as três quartas partes restantes (75%) são maiores. • segundo quartil (Q2): coincide com a mediana (Q2 = Md). • terceiro quartil (Q3): valor situado de tal modo que as três quartas partes (75%) dos dados são menores que ele e uma quarta parte (25%) é maior. uando os dados estão agrupados, determinam-se os quartis a partir das equações: Q f* F 4 f hLQ ant i inf1 ⎟⎟ ⎟⎟ ⎠ ⎞ ⎜⎜ ⎜⎜ ⎝ ⎛ − ⋅+= ∑ e f* F 4 f3 hLQ ant i inf3 ⎟⎟ ⎟⎟ ⎠ ⎞ ⎜⎜ ⎜⎜ ⎝ ⎛ − ⋅+= ∑ 3.10.2 PERCENTIS: são os noventa e nove valores que separam uma série em 100 partes uais. Indicamos estes valores por: P , P , ...., P . ig 1 2 99 50 25 1 75 3 ode-se notar que: P = Md, P = Q e P = QP cálculo de um percentil é obtido pela fórmula: O f* F 100 fk hLP ant i infk ⎟⎟ ⎟⎟ ⎠ ⎞ ⎜⎜ ⎜⎜ ⎝ ⎛ − ⋅+= ∑ or exemplo, para o 32.o percentil temos: P f* F 100 f32 hLP ant i inf32 ⎟⎟ ⎟⎟ ⎠ ⎞ ⎜⎜ ⎜⎜ ⎝ ⎛ − ⋅+= ∑ CAPÍTULO 4 MEDIDAS DE DISPERSÃO OU VARIABILIDADE 4.1 INTRODUÇÃO As medidas de dispersão servem para indicar o quanto os dados de uma distribuição apresentam-se dispersos em torno de um valor de tendência central (média ou mediana) tomado como ponto de comparação. Exemplo intuitivo: Considere os seguintes conjuntos de valores das variáveis X, Y e Z: X = {80, 80, 80, 80, 80} Y = {78, 79, 80, 81,82} Z = { 15, 25, 60, 130, 170 } É possível observar que: • os três conjuntos apresentam a mesma média aritmética = 400/5 = 80 • o conjunto X é mais homogêneo que Y e Z, já que todos os valores são iguais à média. • O conjunto Y é mais homogêneo que o conjunto Z, pois há menor diversificação entre cada um de seus valores e a média representativa. Logo o conjunto X apresenta dispersão nula e o conjunto Y apresenta uma dispersão menor ue o conjunto Z. Apresentam-se a seguir as medidas de dispersão. q .2 AMPLITUDE TOTAL 4 É a única medida de dispersão que não tem na média o ponto de referência. É a diferença ntre o maior e o menor valor observado: AT = X - X . e máx mín X Y Z .2.1 DADOS NÃO AGRUPADOS 4 xemplo: Considere os conjuntos X, Y e Z apresentados anteriormente. A amplitude total será: E T = 80 – 80 = 0 AT = 82 – 78 = 4 AT = 170 – 15 = 155. A .2.2 DADOS AGRUPADOS 4 .2.2.1 SEM INTERVALOS DE CLASSE: neste caso ainda temos: 4 xemplo: Considere a variável x como sendo “o número de TVs de 50 famílias entrevistadas”. AT = X - X .máx mín E i xi fi fri Fi xifi 1 0 3 0,06 3 0 2 1 15 0,30 18 15 3 2 18 0,36 36 36 4 3 10 0,20 46 30 5 4 4 0,08 50 16 ∑ = n if 1i 1i 1i = 50 ∑ = n ifr =1,00 i n ifx∑ = =97 Assim, temos que: AT = 4 – 0 = 4 Introdução à Probabilidade e Estatística - IPE Prof. André Policani 30 4.2.2.2 COM INTERVALOS DE CLASSE: A amplitude total é a diferença entre o limite superior da últimaclasse e o limite inferior da primeira classe. AT = Lmáx - lmín. Exemplo: Considere a distribuição abaixo. VENDAS (x 1000) fi 75 l⎯ 87 5 87 l⎯ 99 11 99 l⎯ 111 7 111 l⎯ 123 5 123 l⎯ 135 4 135 l⎯ 147 4 TOTAL ∑k if = 36 AT = 147 – 75 = 72.000 unidades 4.3 DESVIO MÉDIO Desvio médio ou média dos desvios é igual a média aritmética dos valores absolutos dos desvios tomados em relação à média ou à mediana. Apresentam-se a seguir as equações para calcular o desvio médio em diferentes situações. 4.3.1 DESVIO MÉDIO EM RELAÇÃO À MÉDIA a) para dados não agrupados: n xx D n 1i i x ∑ = − = b) para dados agrupados: ∑ ∑ = = •− = n 1i i k 1i ii x f fxx D 4.3 ÃO À MEDIANA a) p Mdx D k 1i i∑ = − = b) p .2 DESVIO MÉDIO EM RELAÇ ara dados não agrupados: nMd ara dados agrupados: ∑ ∑ = = •− = k 1i i k 1i ii Md f fMdx D Introdução à Probabilidade e Estatística - IPE Prof. André Policani 31 4.4 DESVIO PADRÃO (S) É a medida de dispersão mais utilizada na Estatística. Esta medida representa a raiz quadrada da média aritmética dos quadrados dos desvios, sendo estes desvios tomados em relação à média aritmética. As inferências estatísticas podem ser realizadas considerando-se toda a população ou uma amostra desta (caso mais freqüente na estatística). Apresentam-se a seguir as expressões para calcular o desvio padrão. 4.4.1 DADOS NÃO AGRUPADOS a) Desvio padrão populacional: ( ) ⎥⎥ ⎥⎥ ⎥ ⎦ ⎤ ⎢⎢ ⎢⎢ ⎢ ⎣ ⎡ ⎟⎟⎠ ⎞⎜⎜⎝ ⎛ −= − = ∑ ∑∑ = == n 1i 2n 1i i 2 i n 1i 2 i n x x n 1 n xx S b) Desvio padrão amostral: ( ) ⎥⎥ ⎥⎥ ⎥ ⎦ ⎤ ⎢⎢ ⎢⎢ ⎢ ⎣ ⎡ ⎟⎟⎠ ⎞⎜⎜⎝ ⎛ −−=− − = ∑ ∑∑ = == n 1i 2n 1i i 2 i n 1i 2 i n x x n 1 n xx S 11 4.4.2 DADOS AGRUPADOS a) Desvio padrão populacional: ( ) ⎥⎥ ⎥⎥ ⎥ ⎦ ⎤ ⎢⎢ ⎢⎢ ⎢ ⎣ ⎡ ⎟⎟⎠ ⎞⎜⎜⎝ ⎛ −= ⋅− = ∑ ∑∑ = == k 1i 2k 1i ii i 2 i k 1i i 2 i n fx fx n 1 n fxx S b) Desvio padrão amostral: ( ) ⎥⎥ ⎥⎥ ⎥ ⎦ ⎤ ⎢⎢ ⎢⎢ ⎢ ⎣ ⎡ ⎟⎟⎠ ⎞⎜⎜⎝ ⎛ −⋅−=− ⋅− = ∑ ∑∑ = == k 1i 2k 1i ii i 2 i k 1i i 2 i n fx fx 1n 1 1n fxx S 4.4.3 OBSERVAÇÕES a) observe que quando a inferência abrange toda a população, o divisor nas expressões é n. Caso seja considerada uma amostra da população, o divisor é n –1. b) as expressões expandidas são mais práticas e frequentemente utilizadas para facilitar o cálculo computacional. c) Somando-se (ou subtraindo-se) uma constante k a (de) todos os valores de uma variável, o desvio padrão não se altera: xyii SS kxy =⇒±= d) Multiplicando-se todos os valores de uma variável por uma constante k (k diferente de zero), o desvio padrão é multiplicado por esta constante: xii Sk xky ⋅⇒⋅= Introdução à Probabilidade e Estatística - IPE Prof. André Policani 32 4.5 VARIÂNCIA (S2) Em termos práticos, a variância representa o quadrado do desvio padrão. Esta medida de dispersão em geral tem pouca utilidade na Estatística Descritiva, mas é extremamente importante para a Estatística Indutiva e em combinações de amostras. Analogamente ao desvio padrão, a variância é calculada considerando-se o agrupamento de dados (não agrupados ou agrupados) e os dados (populacional ou amostral). 4.5.1 DADOS NÃO AGRUPADOS a) Variância populacional: ( ) ⎥⎥ ⎥⎥ ⎥ ⎦ ⎤ ⎢⎢ ⎢⎢ ⎢ ⎣ ⎡ ⎟⎟⎠ ⎞⎜⎜⎝ ⎛ −= − = ∑ ∑∑ = == n 1i 2n 1i i 2 i n 1i 2 i 2 n x x n 1 n xx S b) Variância amostral: ( ) ⎥⎥ ⎥⎥ ⎥ ⎦ ⎤ ⎢⎢ ⎢⎢ ⎢ ⎣ ⎡ ⎟⎟⎠ ⎞⎜⎜⎝ ⎛ −−=− − = ∑ ∑∑ = == n 1i 2n 1i i 2 i n 1i 2 i 2 n x x n 1 n xx S 11 4.5.2 DADOS AGRUPADOS a) Variância populacional: ( ) ⎥⎥ ⎥⎥ ⎥ ⎦ ⎤ ⎢⎢ ⎢⎢ ⎢ ⎣ ⎡ ⎟⎟⎠ ⎞⎜⎜⎝ ⎛ −= ⋅− = ∑ ∑∑ = == k 1i 2k 1i ii i 2 i k 1i i 2 i 2 n fx fx n 1 n fxx S b) Variância amostral: ( ) ⎥⎥ ⎥⎥ ⎥ ⎦ ⎤ ⎢⎢ ⎢⎢ ⎢ ⎣ ⎡ ⎟⎟⎠ ⎞⎜⎜⎝ ⎛ −−=− ⋅− = ∑ ∑∑ = == k 1i 2k 1i ii i 2 i k 1i i 2 i 2 n fx fx 1n 1 1n fxx S 4.6 COEFICIENTE DE VARIAÇÃO (CV) É definido como o quociente entre o desvio padrão e a média aritmética. É frequentemente expresso em porcentagem. ( ) x xSCV = Sua vantagem é caracterizar a dispersão dos dados em termos relativos ao seu valor médio. Assim, uma pequena dispersão absoluta pode ser, na verdade, considerável quando comparada com a ordem de grandeza dos valores da variável e vice-versa. Introdução à Probabilidade e Estatística - IPE Prof. André Policani 33 4.7 EXEMPLOS Nos exemplos a seguir apresentam-se os cálculos das medidas de dispersão apresentadas neste capítulo. 4.7.1 DADOS NÃO AGRUPADOS: Seja o conjunto de dados X = { 15, 25, 60, 130, 170 } Para resolver este exemplo, elabora-se uma tabela que auxiliará o cálculo das medidas de tendência central e das medidas de dispersão apresentadas nos capítulos 3 e 4, respectivamente. xi xxi − xx i − Mdxi − Mdxi− 2ix 15 -65 65 -45 45 225 25 -55 55 -35 35 625 60 -20 20 0 0 3600 130 50 50 70 70 16900 170 90 90 110 110 28900 Σ = 400 Σ =280 Σ =260 Σ =50250 Medidas de tendência central (vide capítulo 3): a) Média Aritmética: 80 5 400 n x x n 1i i === ∑ = b) Mediana: Md = 60 ( o valor central da distribuição) Medidas de Dispersão: após o cálculo da média e da mediana, completam-se as colunas da tabela acima convenientemente. a) Amplitude Total: ATX = Xmáx –Xmin = 170 – 15 = 155 b) Desvio Médio em relação à média: 56,00 5 280 n xx D n 1i i x == − = ∑ = c) Desvio Médio em relação à mediana: 52,00 5 260 n Mdx D n 1i i Md == − = ∑ = d) Desvio padrão: ( ) 67,55 5 40050250 4 1 n x x 1n 1S 2 1i 2n 1i i 2 i =⎥⎥⎦ ⎤ ⎢⎢⎣ ⎡ −= ⎥⎥ ⎥⎥ ⎥ ⎦ ⎤ ⎢⎢ ⎢⎢ ⎢ ⎣ ⎡ ⎟⎟⎠ ⎞⎜⎜⎝ ⎛ −−= ∑ ∑ = =n e) Variância: S = (67,55)2 = 4562,5 f) Coeficiente de Variação: ( ) 84,44%100* 80 67,55 x xSCV === Introdução à Probabilidade e Estatística - IPE Prof. André Policani 34 4.7.2 DADOS AGRUPADOS SEM INTERVALOS DE CLASSE Seja x “o número de televisores de 50 famílias entrevistadas”. i xi fi fri Fi xifi xxi − ifxxi ⋅− Mdxi − ii fMdx ⋅− i2i fx ⋅ 1 0 3 0,06 3 0 -1,94 5,82 -2 6 0 2 1 15 0,30 18 15 -0,94 14,10 -1 15 15 3 2 18 0,36 36 36 0,06 1,08 0 0 72 4 3 10 0,20 46 30 1,06 10,6 1 10 90 5 4 4 0,08 50 16 2,06 8,24 2 8 64 Σ = 50 Σ =1,00 Σ = 97 Σ=39,84 Σ=39,00 Σ=241 Medidas de Posição: a) Média: ∑ ∑ = == n 1i i n 1i ii f fx x = 50 97 = 1,94 b) Mediana: 525 2 150p ,=+= (a mediana é o 25,5.o elemento) Md = 2 Medidas de Dispersão: a) Amplitude Total: AT = Xmáx –Xmin = 4 – 0 = 4 b) Desvio Médio em relação à média: 0,80 50 39,84 f fxx D n 1i i n 1i ii x == − = ∑ ∑ = = c) Desvio Médio em relação à mediana: 0,78 50 39,00 f fMdx D n 1i i n 1i ii Md == ⋅− = ∑ ∑ = = d) Desvio padrão: ( ) 1,04 50 97241 49 1 n fx fx 1n 1S 2k 1i 2k 1i iii 2 i =⎥⎥⎦ ⎤ ⎢⎢⎣ ⎡ −= ⎥⎥ ⎥⎥ ⎥ ⎦ ⎤ ⎢⎢ ⎢⎢ ⎢ ⎣ ⎡ ⎟⎟⎠ ⎞⎜⎜⎝ ⎛ ⋅ −⋅−= ∑ ∑ = = e) Variância: S = (1,04)2 = 1,08 f) Coeficiente de Variação: ( ) 53,61%100* 1,94 1,04 x xSCV === Observação: Embora o emprego do Coeficiente de Variação aparentemente seja mais atraente para avaliar a dispersão de uma distribuição, é conveniente ressaltar novamente que a o desvio padrão e a variância são de grande utilização na Estatística Indutiva. Introdução à Probabilidade e Estatística - IPE Prof. André Policani 35 4.7.3 DADOS AGRUPADOS EM INTERVALOS DE CLASSE Considere a distribuição de frequências apresentada nos Capítulos 2 e 3. VENDAS (x 1000) Apuração fi PM (xi) fri Fi xifi xxi − ifxxi ⋅− Mdxi − ii fMdx ⋅− i2i fx ⋅ 75 I⎯ 87 � ׀ 5 81 5/36 5 405 -25,3 126,50 -21,43 107,15 32.805 87 l⎯ 99 � � П 11 93 11/36 16 1023 -13,3 146,30 -9,43 103,73 95.139 99 I⎯ 111 � П 7 105 7/36 23 735 -1,3 9,10 2,57 17,99 77.175 111I⎯ 123 � ׀ 5 117 5/36 28 585 10,7 53,50 14,57 72,85 68.445 123 I⎯ 135 � 4 129 4/36 32 516 22,7 90,80 26,57 106,28 66.564 135 I⎯ 147 � 4 141 4/36 36 564 34,7 138,80 38,57 154,28 79.524 Σ 36 36 1 3828 565,0 562,28 419652 Medidas de tendência central: a) Média: ∑ ∑ = == k 1i i k 1i ii f fx x = 36 3828 = 106,30 b) Mediana: ⎟⎠ ⎞⎜⎝ ⎛ −⋅+= *f FphLMd antinf = =⎟⎠ ⎞⎜⎝ ⎛ −⋅+ 7 16181299 102,43 Medidas de Dispersão: a) Amplitude Total: AT = 147.000 – 75.000 = 72.000 unidades b) Desvio Médio em relação à média: 15,69 36 565,0 f fxx D n 1i i n 1i ii x == − = ∑ ∑ = = c) Desvio Médio em relação à mediana: 15,62 36 562,28 f fMdx D n 1i i n 1i ii Md == ⋅− = ∑ ∑ = = d) Desvio padrão: ( ) 18,71 36 3828419652 36 1 n fx fx n 1S 2k 1i 2k 1i ii i 2 i =⎥⎥⎦ ⎤ ⎢⎢⎣ ⎡ −= ⎥⎥ ⎥⎥ ⎥ ⎦ ⎤ ⎢⎢ ⎢⎢ ⎢ ⎣ ⎡ ⎟⎟⎠ ⎞⎜⎜⎝ ⎛ ⋅ −⋅= ∑ ∑ = = e) Variância: S = (18,71)2 = 350,06 f) Coeficiente de Variação: ( ) %17,100* 106,30 18, x xSCV 6071 === CAPÍTULO 5 MEDIDAS DE ASSIMETRIA E MEDIDAS DE CURTOSE 5.1 ASSIMETRIA Conforme visto no Capítulo 3, a assimetria de uma distribuição pode ser verificada ao compararmos os valores das medidas de tendência central: média, mediana e moda. Ou seja, de acordo com a curva da distribuição em forma de sino, tem-se que: • Curva simétrica: x = Md = Mo • Curva assimétrica positiva: Mo < Md < x • Curva assimétrica negativa: x < Md < Mo x = Md = Mo Curva simétrica Mo < Md < x x < Md < Mo Curva assimétrica positiva Curva assimétrica negativa 5.1.1 COEFICIENTE DE ASSIMETRIA Uma das formas mais usuais de avaliar a assimetria dos dados de uma distribuição é através do coeficiente de assimetria de Pearson, dado por: ( ) S Mdx3As −= , onde: • Md é a mediana, e • S é desvio padrão. Introdução à Probabilidade e Estatística - IPE Prof. André Policani 37 Convencionalmente afirma-se que se: • 0,15As < , a assimetria é considerada pequena • 1As0,15 << , a assimetria é considerada moderada • 1As > , a assimetria é forte. Obs: Se o valor de As é positivo, a assimetria é positiva. A assimetria será negativa, caso contrário. 5.2 CURTOSE A curtose representa o grau de achatamento de uma distribuição em relação a uma distribuição padrão, denominada curva normal (curva correspondente a uma distribuição teórica de probabilidade). Existem três tipos de curvas, segundo o grau de achatamento: • curva leptocúrtica: quando a distribuição apresenta uma curva de frequência mais fechada que a curva normal (ou mais aguda na parte superior). • curva platicúrtica: quando a distribuição apresenta uma curva de frequência mais aberta que a curva normal (ou mais achatada na parte superior). • curva mesocúrtica: é a distribuição normal propriamente dita. .2 COEFICIENTE DE CURTOSE ma fórmula para medida da curtose é: onvenciona-se que: mesocúrtica leptocúrtica platicúrtica 5 U ( ) 4 k ou n 1i i k ou n 1i i 4 i S f fxx K ∑ ∑ = = ⋅− = C • K = 3 ⇒ curva mesocúrtica • K > 3 ⇒ curva leptocúrtica • K < 3 ⇒ curva platicúrtica Introdução à Probabilidade e Estatística - IPE Prof. André Policani 38 5.3 EXEMPLOS 5.3.1 EXEMPLO A eja x o nú ro e e i t : S “ me de tel visores d 50 famíl as entrevis adas”. i Xi fi fri Fi xi if xxi − ifxi ⋅−x M− dxi ii fx ⋅− Md ii f⋅2x ( ) ifx 4i x− 1 0 3 0,06 3 0 -1,94 5,82 -2 6 0 42,49 2 1 15 0,30 18 15 -0,94 14,10 -1 15 15 11,71 3 2 18 0,36 36 36 0,06 1,08 0 0 72 0,00 4 3 10 0,20 4 1, 6 30 06 10,6 1 10 90 12,62 5 4 4 0,08 50 16 2,06 8,24 2 8 64 72,03 Σ = 50 Σ =1,00 Σ = 97 Σ=39,84 Σ=39,00 Σ=241 Σ= 138,86 Conforme visto anteriormente: 1,94x = Md = 2 S=1,04 : a) Coeficiente de Assimetria ( ) ( ) -0,172,001,943Mdx3As =−=−= (moderada negativa) b) Coeficiente de Curtose: .3.2 EXEMPLO B: Considere a distribuição de frequências apresentada nos Capítulos 2 e 3. 1,04S 5 VENDAS (x 1000) fi PM (xi) Fi x fi i xxi − ifxxi ⋅− Mdx −i ii fMd ⋅−x ii fx ⋅ 2 ( )4 ii fxx − 75 I⎯ 87 5 81 5 405 -25,3 126,50 -21,43 107,15 2048576,04 32.805 87 l⎯ 9 9 11 93 16 1023 -13,3 146,30 -9,43 103,73 95.139 344190,793 99 I⎯ 11 1 7 105 23 735 -1,3 9,10 2,57 17,99 77.175 19,99 111I⎯ 123 5 117 28 585 10,7 53,50 14,57 72,85 68.445 65539,80 123 I 1 32 22,7 26 7 ⎯ 135 4 29 516 90,80 ,5 106,28 66.564 1062095,14 135 I⎯ 147 5799330,91 4 141 36 564 34,7 138,80 38,57 154,28 79.524 Σ 36 3828 562,28 9 9319752,68 565,0 41 652 Conforme visto anteriormente: 106,30x = Md= 102,43 S= 18,71 a) Coef. de Assimetria: ( ) ( ) 2 71 0,6 18, 102,43106,303 S Mdx3 =−=−= (moderada positiva) b) Coeficiente de Curto As se: ( ) ( ) 2,371,0450 138,86 S f fxx K 44 k ou n 1i i k ou n 1i i 4 i == ⋅− = ∑ ∑ = = Curva platicúrtica ( ) ( ) =2,11 18,71 9319752,68 S f K 44 n 1 i n 1 i i 4 f i xx i k ou k ou = ⋅ = − ∑ ∑ = = 36 Curva platicúrtica CAPÍTULO 6 INTRODUÇÃO À PROBABILIDADE 6.1 INTRODUÇÃO A Probabilidade é o campo da Matemática que trata do estudo dos fenômenos aleatórios. Este estudo é de grande importância, pois a maioria dos fenômenos de que trata a Estatística são de natureza aleatória ou probabilística. O conhecimento dos aspectos fundamentais do cálculo da probabilidades é uma necessidade essencial para o estudo da Estatística Indutiva ou Inferencial. 6.2 CONCEITOS INICIAIS 6.2.1 EXPERIMENTO ALEATÓRIO São fenômenos que, mesmo repetido várias vezes sob condições semelhantes, apresentam resultados imprevisíveis. O resultado final depende do acaso. Exemplo: Considere o lançamento de uma moeda e observação da sua face superior. Este experimento pode ser caracterizado por: • Poder ser realizado inúmeras vezes sob condições essencialmente iguais • O resultado do experimento não é conhecido “a priori”, mas todos os resultados possíveis podem ser conhecidos: Cara ou coroa. • Regularidade estatística: quando a quantidade de experimentos realizados é grande, a frequência de ocorrência de um resultado particular se aproxima de um valor constante. Assim, a regularidade estatística mostrará que a frequência de ocorrência do resultado “cara” se aproxima de 0,5. .2.2 ESPAÇO AMOSTRAL 6 É o conjunto de todos os
Compartilhar