Baixe o app para aproveitar ainda mais
Prévia do material em texto
Estatística Prof. Otair Pelisson Página 1 Estatística. 1.0 - Dados Estatístico: no sentido da disciplina, a estatística ensina métodos racionais para a obtenção de informação a respeito de um fenômeno coletivo, alem de obter conclusões de válidas para o fenômeno e também permitir a tomada de decisões, através de dados estatísticos observados. Desta forma, a estatística pode ser dividida em duas áreas: a) Estatística Descritiva – é a parte da Estatística que tem por objetivo descrever os dados observados. b) Estatística indutiva – é a parte da Estatística que tem por objetivo obter e generalizar conclusões para a população a partir de uma amostra, através do cálculo de probabilidade. 1.2 - Estatística Descritiva, na sua função de descrição dos dados , tem as seguintes atribuições a) Obtenção dos dados estatísticos – normalmente feita através de um questionamento ou de observações direta de uma população ou amostral. b) Organização dos dados – consiste na ordenação e crítica quanto à correção dos valores observados, falhas humanas, omissões , abandono de dados duvidosos. c) Redução dos dados - o entendimento e compreensão de grande quantidade de dados através da simples leitura de seus valores individuais é uma tarefa extremamente árdua e difícil mesmo para o mais experimentado pesquisador. d) Representação dos dados - podem ser facilmente compreendidos quando apresentados através de uma representação gráfica o que permite uma visualização instantânea de todos os dados. 1.2 - Dados Brutos. Quando fazemos n observações diretas em um fenômeno coletivo ou observamos as respostas a uma pergunta em uma coleção de n questionários, obtemos uma seqüência de n valores numéricos. Tal seqüência é denominados dados brutos. Representamos por X a característica observada no fenômeno coletivo o na pergunta dos questionários, então 𝑥1 representa o valor da característica obtida na primeira observação do fenômeno coletivo ou o valor de característica observado no primeiro questionário; 𝑥2 representa o valor da característica X na segunda observação do fenômeno coletivo ou o valor da característica observada no segundo questionário e assim sucessivamente. Desta forma, os dados brutos podem ser representados por X; 𝑥1 , 𝑥2, 𝑥3, …… . 𝑥𝑛 Dados brutos é uma seqüência de valores numéricos não organizados, obtidos diretamente da observação de um fenômeno coletivo Estatística Prof. Otair Pelisson Página 2 * Rol: Quando ordenamos na forma crescente ou decrescente, os dados brutos passam a se chamar de Rol. Por definição Rol é uma seqüência ordenada dos dados brutos. Exemplo. Notas de uma avaliação de matemática 4 – 8 – 7,5 – 6 – 6,5. Neste exemplo, X representa as notas das avaliações e pode ser apresentadas na forma. X : 4 – 8 – 7,5 – 6 – 6,5 (dados brutos) X: 4 – 6 – 6,5 – 7,5 – 8 . (Rol ordenado) 2 .0 - Séries estatísticas. 2.1 – Apresentação dos dados Estatísticos: Quando lidamos com poucos valores numéricos, o trabalho estatístico fica sensivelmente reduzido. No entanto, normalmente teremos que trabalhar com grande quantidade de dados. Um dos objetivos da Estatística Descritiva neste caso, é obter uma significativa redução na quantidade de dados com os quais devemos operar diretamente. Isto pode ser conseguido modificando-se a forma de apresentação destes dados. Suponha que observamos as notas de 30 alunos em uma prova e obtivermos os seguintes valores : X = 3,5 – 5 – 4,5 – 4 – 4,5 – 5 – 3,5 – 4 – 4 – 5 2 – 3 – 4,5 – 3,5 – 4 – 4,5 – 3 – 4 – 3 – 4 3,5 – 3,5 – 3,5 – 4 – 4 – 3 – 4 – 4 – 5 – 3. Se entendermos como freqüência simples de um elemento o numero de vezes que este elementos figura no conjunto de dados, podemos reduzir significativamente o número de elementos com os quais devemos trabalhar. Para isto organiza-se o conjunto de dados na forma de uma série chamada variável discreta. 2.2 – Distribuição de freqüência – Variável discreta. É uma representação tabular de um conjunto de valores em que colocamos na primeira coluna em ordem crescente apenas os valores distintos da série e na segunda coluna colocamos os valores das freqüência simples correspondentes. Se usarmos 𝑓 para representar freqüência simples, a sequência simples pode ser representada pela tabela. 𝑋𝑖 𝑓𝑖 2 1 3 5 3,5 6 4 10 4,5 4 5 4 Estatística Prof. Otair Pelisson Página 3 2.3 - Construção da Variável Continua Suponha que a observação das notas de 30 alunos em uma proa nos conduzisse aos seguintes valores: X : 3 – 4 – 2,5 – 4 – 4,5 – 6 – 5 – 5,5 – 6,5 – 7 7,5 – 2 – 3,5 – 5 – 5,5 – 8 – 8,5 – 7,5 – 9 – 9,5 5 – 5,5 – 4,5 – 4 – 7,5 – 6,5 – 5 – 6 – 6,5 – 6 . Observando estes valores notamos grande número de elementos distintos, o que significa que neste caso a variável discreta não é aconselhável na redução de dados. Nesta situação é conveniente agrupar os dados por faixa de valores ficando a série com a seguinte apresentação. Classe Intervalo de classe 𝑓𝑖 1 2 |-------- 4 4 2 4 |-------- 6 12 3 6 |-------- 8 10 4 8 |-------- 10 4 2.4 – Construção da Variável discreta. A construção de uma variável discreta é bastante simples. Basta observar quais são os elementos distintos da sequência, ordená-los, e colocá-los na primeira coluna da tabela. Em seguida computar a freqüência simples cada elemento distintos e colocá-los na segunda coluna da tabela. Exemplo: X : 0 – 2 – 0 – 1 – 1 – 0 – 0 – 0 – 3 – 2 – 1 – 0 – 1 – 2 – 0 – 1 – 3 – 2 – 2 – 0 . Valores distintos das sequência: 0, 1, 2 , 3 As freqüências simples respectivamente: 8, 5, 5, 2. Portanto , a variável discreta representativa desta sequência é: 𝑋𝑖 𝑓𝑖 0 8 1 5 2 5 3 2 2.5 – Construção da variável contínua. A construção da variável continua requer o conhecimento de alguns conceitos que vamos estabelecer aproveitando a tabela abaixo para exemplificação: Classe Intervalo de classe 𝑓𝑖 1 2 |-------- 4 4 2 4 |-------- 6 12 3 6 |-------- 8 10 4 8 |-------- 10 4 Estatística Prof. Otair Pelisson Página 4 1- Amplitude Total de uma Seqüência: é a diferença entre o maior e o menor elemento de uma seqüência. Representando a amplitude total por At , o maior elemento da seqüencia por X por Xmax e o menor por Xmin , a amplitude total e denotada por: No exemplo da sequencia que deu origem a tabela Xmax = 9,5 e Xmin =2 portanto At= 9,5 – 2 = 7,5 A amplitude total representa o comprimento total da sequencia e é dada na mesma unidade de medida dos dados da sequência 2 - Intervalo de Classe: : é qualquer subdivisão da amplitude total de uma série estatística. No exemplo da tabela de variável contínua , subdividimos a amplitude total em quatro classe, obtendo os intervalos 2 |-----4 ; 4|----- 6 ; 6 |------ 8 ; 8|------ 10. Note que na realidade não trabalhamos com a At = 7,5 e sim com a amplitude total ajustada para 8 como justificaremos mais adiante. 3 - Limite de classe: Definição: cada intervalo de classe fica caracterizado por dois números reais. O menor é chamado de limite inferior de classe e será indicado por I ; O maior valor será chamado de limite de superior da classe e será chamado indicado por L. Exemplo: 2 |------- 4 Onde: 2 é o limite inferior “I” 4 é o limite superior “L” Lê –se :2 | ----- limite inferior fechado em 2 (com o valor de dois incluso) ----- 4 limite superior aberto em 4 (com o valor de 4 não incluso) 4 - Amplitude: Definição: Amplitude do intervalode classe, é a diferença entre os limites superior e o limite inferior de classe. Se usarmos a letra “h” para representar a amplitude do intervalo de classe, então podemos estabelecer que. 𝐴𝑡 = 𝑋𝑚𝑎𝑥 - Xmin = 𝐿 − 𝐼 Estatística Prof. Otair Pelisson Página 5 5 - Numero de Classe. O numero de classes a ser utilizados depende muito da experiência do pesquisador e das questões que ele pretende responder com a variável continua. Para efeito de nossos exemplos, utilizaremos o critério da raiz para a determinação do número de classes. Critério da Raiz. Se a seqüência estatística contém 𝒏 elementos e se indicarmos por 𝒌 o número de classes a ser utilizado, então pelo critério da raiz; Como o número de 𝒌 deve ser necessariamente um número inteiro e como dificilmente 𝑛 ,é um número inteiro, deixaremos como opção para o valor de 𝑘 o valor inteiro mais próximo de 𝑛 , uma unidade a menos ou a mais que este valor. A amplitude do intervalo de classe que designamos por é determinada da seguinte forma: Fórmula de Sturges: existe outro critério para a determinação de número de classe, como a fórmula de Sturges apresentada abaixo. Exemplo: 1)Com base nas informações abaixo monte uma tabela de variável contínua Dados 111 – 90 – 121 - 105 – 122 – 61 – 128 – 112 – 128 – 93 108 – 138 – 88 – 110 – 112 – 112 – 97 - 128 – 102 – 125 87 – 119 – 104 – 116 – 96 – 114 – 107 – 113 – 80 – 113 123 – 95 – 115 – 70 – 115 – 101 – 114 – 127 – 92 – 103 78 - 118 – 100 – 115 – 116 – 98 – 119 – 72 – 125 – 109 79 – 139 – 75 – 109 – 123 – 124 – 108 – 125 – 116 – 83 94 – 106 – 117 – 82 – 122 – 99 – 124 – 84 – 91 – 130 . Resolvendo: n=70 𝑘 = 𝑛 = 𝐴𝑡 𝑘 𝑘 = 1 + 3,3 log 𝑛 Estatística Prof. Otair Pelisson Página 6 Usando o critério da Raiz => 𝑘 = 𝑛 => 𝑘 = 70 => 𝑘= 8,37 ; como 𝑘 tem que ser um número inteiro adotamos o numero 8. O maior valor 𝑋𝑚𝑎𝑥 = 139 e 𝑋𝑚𝑖𝑛 = 61 Calculando a Amplitude total : 𝐴𝑡 = 𝑋𝑚𝑎𝑥 – Xmin => 𝐴𝑡 = 139 – 61 => 𝐴𝑡 = 78 Obs. No entanto, sabemos que pelo fato de o critério adotado do intervalo de classe a ser semi-aberto à direita, devemos ajustar o valor. = 𝐴𝑡 𝑘 => = 80 8 => = 10 Portanto a tabela de variável continua terá 8 linhas com intervalo de classe de 10 em 10 Classe Intervalo de classe 𝑓𝑖 1 60 |---------- 70 1 2 70 |---------- 80 5 3 80 |---------- 90 6 4 90 |---------- 100 10 5 100 |---------- 110 12 6 110 |---------- 120| 19 7 120 |---------- 130 14 8 130 |---------- 140 3 Exercício 1)Dados os valores brutos abaixo: X = 2 – 4 – 2,4 – 4 – 4,5 – 6 – 5 – 5,5 – 6 – 5 – 7 – 7,5 – 2 – 3,5 – 5 – 5,5 – 8 – 8,5 – 7,5 – 9 – 9,5 – 5 – 5,5 – 4,5 – 4 – 7,5 – 6,5 – 5 – 6 – 6,5 – 6 . Pede-se a) Montar um rol ordenados crescente b) Uma tabela de freqüência c) Uma tabela com intervalo com intervalo de classe 3 em 3 (amplitude). 2) Monte uma tabela de freqüência. a) Idade em “anos” em grupos de 10 pessoas. I 13 14 15 16 Fa 3 2 4 1 b) Altura em metros em um grupo de 21 pessoas. Estatística Prof. Otair Pelisson Página 7 Altura Fa 1,61 |------- 1,65 3 1,65 |------- 1,69 9 1,73 |------- 1,77 4 1,77 |------- 1,81 5 Total 21 Distribuição de Freqüência s – Variável Discreta. Uma vez que o interessado tenha colocado os dados na forma de uma distribuição de freqüência, ele poderá rapidamente obter algumas informações adicionais e úteis para a compreensão da série, se considerar os seguintes conceitos: Freqüência Relativa de um Elemento da série – 𝑓r. É a divisão da freqüência simples deste elemento pelo número total de elementos da série. Exemplo: Considere a variável discreta: Xi 𝑓i 2 3 3 7 4 8 6 6 7 1 O total de elementos desta série é 25. Portanto a freqüência relativa do primeiro elemento distinto da série, que é 2 vale: 𝑓r1 = f1 = 3 = 0,12 ou 12% n 25 A freqüência relativa do segundo elemento distinto que é 3 , vale : 𝑓r2 = f2 = 7 = 0,28 ou 28% n 25 fri = fi n Estatística Prof. Otair Pelisson Página 8 𝑓r3 = f3 = 8 = 0,32 ou 32% n 25 𝑓r4 = f4 = 6 = 0,24 ou 24% n 25 𝑓r5 = f5 = 1 = 0,04 ou 4% n 25 Freqüência Acumulada de um elemento da série - Fi É a soma da freqüência simples deste elemento com as freqüências simples dos elementos que o antecedem. Fi= f1 + f2 + ............fi Desta forma , a freqüência acumulada para os elementos 2, 3, 4 , 6 e 7 valem respectivamente: F1 = f1 = 3 F2 = f1 + f2 = 3 + 7 = 10 F3 = f1 + f2 + f3 =3 + 7 + 8 = 18 F4 = f1 + f2 + f3 + f4 = 3 + 7 + 8 + 6 = 24 F5 = f1 + f2 + f3 + f4 + f5 = 3 + 7 + 8 + 6 + 1 = 25 Estes valores podem ser interpretados da seguintes forma: - 3 elementos componentes da série são valores menores ou iguais a 2 - 10 elementos componentes da série são valores menores ou iguais a 3 - 18 elementos componentes da série são valores menores ou iguais a 4 - 24 elementos componentes da serei são valores menores ou iguais a 6 - 25 elementos componentes da serei são valores menores ou iguais a 7 Freqüência Acumulada Relativa de um elemento da Série – Fri É a divisão da freqüência acumulada deste elemento pelo número total de elementos da série. Assim a freqüência acumulada relativa dos elementos 2,3,4,6 e 7 valem respectivamente: Fr1 = F1 = 3 = 0,12 ou 12% N 25 Fr2 = F2 = 10 = 0,4 ou 40% N 25 Fr3 = F3 = 18 = 0,72 ou 72% N 25 Fri = Fi N Estatística Prof. Otair Pelisson Página 9 Fr4 = F4 = 24 = 0,96 ou 96% N 25 Fr5 = F5 = 25 = 1,00 ou 100% N 25 Estes valores podem ser interpretados da seguinte forma: - 12% dos valores da série são menores ou iguais a 1 - 40% dos valores da série são menores ou iguais a 3 - 72% dos valores da série são menores ou iguais a 5 - 96% dos valores da série são menores ou iguais a 6 - 100% dos valores da série são menores ou iguais a 7 Quando acrescentamos estes valores à tabela original, esta passa se chamar de distribuição de freqüência . Para o exemplo estabelecido, a distribuição de freqüência é: Exercícios 01) Construa a distribuição de freqüência para a serie representativa da idade de 50 alunos do primeiro ano de uma faculdade. Idade em anos Xi Nº de alunos 17 3 18 18 19 17 20 8 21 4 2) Complete o quadro. Xi fi fri % Fi Fri % 2 16 5 24 8 57 10 76 13 200 Xi 𝑓i 𝑓ri % Fi Fri % 2 3 12 3 12 3 7 28 10 40 4 8 32 18 72 6 6 24 24 96 7 1 4 25 100 Estatística Prof. Otair Pelisson Página 10 03) Construa a distribuição de freqüência para a série abaixo que representa uma amostra dos salários de 25 funcionários selecionados em uma empresa. Classe Salários US$ Números de funcionários 1 1.000,00 |------- 1.200,00 2 2 1.200,00 |------- 1.400,006 3 1.400,00 |------- 1.600,00 10 4 1.600,00 |------- 1.800,00 5 5 1.800,00 |------- 2.000,00 2 04) Uma empresa automobilística selecionou ao acaso uma amostra de 40 revendedores autorizados em todo o Brasil e anotou em determinado mês o número de unidades adquiridas por estes revendedores. Obteve os seguintes dados. 10 – 15 – 25 – 21 – 6 – 23 – 15 – 21 – 26 – 32 9 – 14 – 19 – 20 – 32 – 18 – 16 – 26 – 24 – 20 7 – 18 – 17 – 28 – 35 – 22 – 19 – 39 – 18 – 21 15 – 18 – 22 – 20 – 25 – 28 – 30 – 16 – 12 – 20 Pede-se : a) Organizar o rol de informações em ordem crescente b) Montar uma tabela de freqüência. c) Montar uma coluna de freqüência em porcentagem (𝑓𝑟𝑖) 05) Uma industria embala peças em caixas com 100 unidades. O controle de qualidade selecionou 48 caixas na linha de produção e anotou em cada caixa o número de peças defeituosas. Obteve os seguintes dados. 2 – 0 – 0 – 4 – 3 – 0 – 0 – 1 – 0 – 0 1 – 1 – 2 – 1 – 1 – 1 – 1 – 1 – 1 – 1 0 – 0 – 3 – 0 – 0 – 0 - 2 – 0 – 0 – 1 1 – 2 – 0 – 2 – 0 – 0 – 0 – 0 – 0 – 0 0 – 0 – 0 – 0 – 0 – 0 – 1 – 0 . Pede-se : agrupe, por freqüência, estes dados. Distribuição de Freqüência – Variável Contínua. No caso da variável contínua, pelo fato de termos utilizados intervalo de classe, semi- aberto à direita, as interpretações são diferentes. Portanto, redefiniremos este tipos de freqüência. Freqüência Relativa de uma Classe – 𝒇𝒓𝒊. É a divisão da freqüência simples desta classe pelo número total de elementos da série. 𝑓𝑟i = 𝑓𝑖 n Estatística Prof. Otair Pelisson Página 11 Exemplo: Considerando a distribuição de freqüência . Classe Interv. Classe 𝐹𝑖 1 2 |------- 4 6 2 4 |------- 6 18 3 6 |------- 8 10 4 8 |------- 10 6 O total de elementos desta série é 40. Portanto, a freqüência relativa da primeira classe é : 𝑓𝑟1 = 𝑓1 = 6__ = 0,15 ou 15% n 40 A freqüência relativa da segunda classe é : 𝑓𝑟2 = 𝑓2 = 18 = 0,45 ou 45% n 40 𝑓𝑟3 = 𝑓3 = 10 = 0,25 ou 25% n 40 𝑓𝑟4 = 𝑓4 = 6 = 0,15 ou 15% n 40 Obs. Estes valores representam a participação percentual dos elementos por classe . A interpretação para estes valores é : - 15% dos valores da série são maiores ou iguais 2 e menores que 4 -45% dos valores da série são maiores ou iguais a 4 e menores que 6. -25% dos valores da série são maiores ou iguais a 6 e menores que 8. -15% dos valores da série são maiores ou iguais a 8 e menores que 10. Freqüência Acumulada de uma Classe – Fi É a soma da freqüência simples desta classe com as freqüências simples das classes anteriores. Desta forma, as freqüência acumuladas para estas classes são: F1 = f1 = 6 F2= f1 + f2 = 6 + 18 = 24 F3= f1 + f2 + f3 = 6 + 18 + 10 = 34 F2= f1 + f2 + f3 + f4 = 6 + 18 + 10 + 6 = 40 Fi = f1 + f2 +............+ fi Estatística Prof. Otair Pelisson Página 12 Estes valores podem ser interpretados da seguinte forma, lembrando que são todos maiores ou iguais a 2. - 6 dos elementos da série são valores menores que 4 . - 24 dos elementos da série são valores menores que 6 - 34 dos elementos da série são valores menores que 8 - 40 dos elementos da série são valores menores que 10. Freqüência Acumulada Relativa de uma Classe - Fri. É a divisão da freqüência acumulada desta classe pelo numero total de elementos da série. Deste modo, a freqüência acumulada relativa para cada classe é: Fr1 = F1 = 6 = 0,15 ou 15% N 40 Fr2 = F2 = 24 = 0,60 ou 60% N 40 Fr3 = F3 = 34 = 0,85 ou 85% N 40 Fr1 = F1 = 40 = 1,00 ou 100% N 40 Estes valores podem ser interpretados da seguinte forma, lembrando que são todos maiores ou iguais a 2: - 15% dos valores da série são menores que 4. - 60% dos valores da série são menores que 6 - 85% dos valores da série são menores que 8 - 100% dos valores da série são menores que 10. Quando acrescentamos estes valores à tabela original, esta passa a se chamar Distribuição de Freqüências. Para exemplo estabelecido, a distribuição de freqüência è: Classe Int. classe fi fri % Fi Fri % 1 2 |----- 4 6 15 6 15 2 4 |----- 6 18 45 24 60 3 6 |----- 8 10 25 34 85 4 8 |----- 10 6 15 40 100 Fri = Fi N Estatística Prof. Otair Pelisson Página 13 Representação Gráfica de Séries Estatísticas. Definição. Existem muitas formas de se representar graficamente uma série estatística . Podemos citar entre elas : gráficos em linhas; em barras, em setores; e porcentagem; complementares; gráficos polares; gráficos pictóricos, cartogramas etc. São representações visuais dos dados estatísticos que devem corresponder, mas nunca substituir as tabelas estatísticas. Características: Uso de escalas, sistema de coordenadas, simplicidade, clareza e veracidade. Gráficos de informação: São gráficos destinados principalmente ao público em geral, objetivando proporcionar uma visualização rápida e clara. São gráficos tipicamente expositivos, dispensando comentários explicativos adicionais Gráficos de Análise Definição. São gráficos que prestam-se melhor ao trabalho estatístico, fornecendo elementos úteis à fase de análise dos dados, sem deixar de ser também informativos. Os gráficos de análise freqüentemente vêm acompanhados de uma tabela estatística. Inclui-se, muitas vezes um texto explicativo, chamando a atenção do leitor para os pontos principais revelado pelo gráfico. Estatística Prof. Otair Pelisson Página 14 Diagramas: São gráficos geométricos dispostos em duas dimensões. São os mais usados na representação de séries estatísticas. Gráficos em barras horizontais Gráficos em barras verticais Gráficos em barras compostas Gráficos em colunas superpostas Gráficos em linhas ou lineares Gráficos em setores ESTEREOGRAMAS: São gráficos geométricos dispostos em três dimensões, pois representam volume. São usados nas representações gráficas das tabelas de dupla entrada. Em alguns casos este tipo de gráfico fica difícil de ser interpretado dada a pequena precisão que oferecem. PICTOGRAMAS: São construídos a partir de figuras representativas da intensidade do fenômeno. Este tipo de gráfico tem a vantagem de despertar a atenção do público leigo, Leste Oeste Norte 0 5 10 15 20 25 30 35 40 45 50 1 ° T ri m Região Metros cúbicos Volume de Chuvas por Região Estatística Prof. Otair Pelisson Página 15 pois sua forma é atraente e sugestiva. Os símbolos devem ser auto-explicativos. A desvantagem dos pictogramas é que apenas mostram uma visão geral do fenômeno, e não de detalhes minuciosos. CARTOGRAMAS: São ilustrações relativas a cartas geográficas (mapas). O objetivo desse gráfico é o de figurar os dados estatísticos diretamente relacionados com áreas geográficas ou políticas. Gráfico de setores ou diagrama de setores. O gráfico ou diagrama de setores representa freqüência relativas ou simples sob a forma de setores de círculo. Geralmente, sua aplicação somente deve ser feira quanto todo os dados analisados correspondem ao universo de observações. Não se deve usar por exemplo , um diagrama de setorespara representar dados distribuídos ao longo do tempo, como séries temporais. Estatística Prof. Otair Pelisson Página 16 Para elaborar o gráfico, encontrando os ângulos da divisão de cada setor, basta uma regra de três do tipo: 100 % está para 360º assim como x% esta para y º Exemplo: a) Feita uma pesquisa sobre os meios de comunicação de uma pequena cidade do interior de São Paulo e obteve as seguintes informações Variável Freqüência Freqüência relativa % Radio 276 46 Televisão 210 35 Jornal 72 12 Revista 42 7 600 Montando o gráfico; 46% = 0,46 . 360 = 165,6 º 35% = 0,35 . 360 = 126º 12% = 0,12 . 360 = 43,2º 7 % = 0,07 . 360 = 25,2º 7% 12 % 46% 35 % Exercícios. 01) Construa a distribuição de freqüência para a série representativa da idade de 50 alunos do primeiro ao de faculdade. Estatística Prof. Otair Pelisson Página 17 Idade (anos) Xi Nº de alunos fi fri % Fi Fri% 17 3 18 18 19 17 20 8 21 4 02) Complete o quadro. Xi fi Fri % Fi Fri% 2 25 5 24 8 60 10 40 13 250 03) Construa um histograma para a distribuição de freqüência. Xi fi 1 2 2 3 3 5 4 4 5 3 6 1 04) Construa a distribuição de freqüência para a série abaixo que representa o saldo de 25 contas de pessoas físicas em uma agencia em determinado dia. Classe Saldo US$ Nº de funcionários 1 0 |------ 10.000,00 5 2 10.000,00 |------ 20.000,00 10 3 20.000,00 |------ 30.000,00 8 4 30.000,00 |------ 40.000,00 2 MEDIDAS DE TENDENCIA CENTRAL Medidas de Tendência Central. No estudo de uma série estatística é conveniente o calculo de algumas medidas que a caracterizam. Estas medidas, quando bem interpretadas, podem fornecer-nos informações muitos valiosas com respeito a série estatística. Estatística Prof. Otair Pelisson Página 18 Somatória – Notação Sigma ( ∑ ) Quando queremos representar uma soma de n valores do tipo X1 + X2 + .....+ Xn, podemos codifica-la através da expressão: Onde: ∑ - é utilizada para representar as operações de adição entre as parcelas. Xi – é a parcela genérica. Exemplo: 5 1) X1 + X2 + .X3 + X4 + X5 = 𝑋𝑖 i=1 5 2) X1 + X2 + X3 + X4 + X5 = Xi i=1 8 3) 2 X4 +2 X5 + 2X6 + 2X7 + 2X8 = (2 Xi) i=5 O somatório de uma soma é a soma dos somatórios. n n n ( Xi + Yi) = Xi + Yi i=1 i=1 i=1 O somatório de uma diferença é a diferença dos somatórios. n n n ( Xi − Yi) = Xi - Yi i=1 i=1 i=1 Médias. Do ponto de vista teórico, vários tipos de média podem ser calculados para uma massa de dados. Média Aritmética Simples n X1 + X2 + .....+ Xn = 𝑋𝑖 i=1 Estatística Prof. Otair Pelisson Página 19 Para a seqüência numérica X : X1, X2, ........ Xn a média aritmética simples, que designaremos por X é definida por: __ 𝑥𝑖 X = N Exemplo : Se X: 2; 0; 5; 3 então 𝑥 = 2 + 0 + 5 + 3 => 𝑥 = 2,5 4 Média Aritmética Ponderada: Para uma seqüência numérica X: X1, X2, ........ Xn, a média aritmética simples, que designaremos por X, e definida por: __ 𝑥𝑖.𝑝𝑖 X = 𝑝𝑖 Exemplo: 1) Se X: 2 , 4 , 5 com pesos 1,2,3 respectivamente, então: 𝑥𝑖.𝑝𝑖 𝑥 = = 2 x1 + 4 x 3 + 5 x 2 = 2 + 12 + 10 = 4 𝑝𝑖 1 + 2 + 3 6 Médias Geométricas Simples Para uma seqüência numérica X : X1, X2, ........ Xn, a média geométrica simples, que designaremos por Xg,é definida por: 𝑋𝑔 = 𝑥𝑖 × 𝑥2 × … .× 𝑥𝑛 𝑛 Exemplo: Se X = 2,3,6,9 𝑋𝑔 = 2 . 4 . 6 . 9 4 => Xg = 432 4 => 𝑋𝑔 = 4,559 Cálculo da Média Aritmética. 1º Caso – Dados Brutos ou Rol Exemplo: Calcule a média da variável X: 3, 5, 8, 12, 7, 12, 15, 18, 20, 20. 𝑥 = 𝑥𝑖 𝑛 Estatística Prof. Otair Pelisson Página 20 __ Solução : X = 3 + 5 + 8 + 12 + +7 + 12 + 15 + 18 + 20 + 20 = 120 = 12 10 10 Interpretação: O valor médio desta sério é 12, ou seja os valores desta série concentram-se em torno do valor 12. 2º Caso – Variável Discreta. Se os dados estão apresentados na forma de uma variável discreta utilizaremos a média aritmética ponderada, considerando as freqüências simples como sendo as ponderações dos elementos Xi correspondentes. 𝑥 = 𝑥𝑖𝑓𝑖 𝑓𝑖 Exemplo: 1) Determinar à media da distribuição: Xi fi 2 1 5 4 6 3 8 2 Solução: Multiplicar o xi pelo fi linha por linha 2 x 1 = 2 5 x 4 = 20 6 x 3 = 18 8 x 2 = 16 Adicionar os resultados obtidos na 3ª coluna (Xi fi) Xi fi Xi fi 2 1 2 5 4 20 6 3 18 8 2 16 𝑓𝑖 = 10 𝑥𝑖𝑓𝑖= 56 Na seqüência substituímos estes valores na expressão 𝑋 obtendo: 𝑋 = 56 = 5,6 10 Interpretação: O valor médio da série é 5,6 , isto é 5,6 é o ponto de concentração dos valores da série. Estatística Prof. Otair Pelisson Página 21 3º Caso – Variável Contínua Se os dados estão apresentados na forma de uma variável contínua, utilizaremos a média aritmética ponderada, considerando as freqüências simples das classes como sendo as ponderações desta classe. O ponto médio, de cada classe é definido por: PM = I + L onde: I limite inferior e L limite superior. 2 A fórmula de cálculo de X passa a ser escrito como: __ X = 𝑋𝑖 𝑓𝑖 𝑓𝑖 Exemplo: Determinar á média da distribuição. Classe Inter. Classe 𝑓i 1 2 |-------- 5 1 2 5 |-------- 8 10 3 8 |-------- 11 8 4 11|-------- 14 1 Solução: Inicialmente, devemos somar a coluna das freqüência simples 𝑓𝑖 = 20. Na seqüência, calcularmos os pontos médios de classe: o ponto médio da primeira classe 2 + 5 / 2 = 3,5 ; na segunda classe 5 + 8 / 2 = 6,5 ;o terceiro ponto 8 + 11 / 2 = 9,5 e o quarto classe 11 + 14 / 2 = 12,5 Classe Inter. Classe 𝑓i Xi Xi 𝑓i 1 2 |-------- 5 1 3,5 3,5 2 5 |-------- 8 10 6,5 65 3 8 |-------- 11 8 9,5 76 4 11|-------- 14 1 12,5 12,5 𝑓𝑖 = 20 𝑋𝑖 𝑓𝑖 = 157 Portanto, X = 𝑋𝑖 𝑓𝑖 = 157 = 7,85 𝑓𝑖 20 Calculo da Mediana. Estatística Prof. Otair Pelisson Página 22 É um valor real que separa o rol em duas partes deixando à sua esquerda o mesmo número de elementos que a sua direita. Portanto, a mediana é um valor que ocupa a posição central em uma série. 1º - Caso – Dados Brutos ou Rol. Inicialmente devemos ordenar os elementos caso sejam dados brutos, obtendo o Rol. Em seguida determinar o número n de elementos do Rol. 1.1- Se n é impar – O Rol admite apenas um termo central que ocupa a posição Fórmula (𝑛 + 1)/2 onde n é o numero de elementos e o numero 2 é constante da fórmula O valor do elemento que ocupa esta posição é a mediana. Exemplo: Determinar a mediana do conjunto X : 2, 20 , 12, 23, 20 , 8, 12. Solução: 1º- Ordenar os elementos: 2, 8, 12 , 12, 20 , 20, 23 2º- O numero de elementos é n = 7 (impar), a posição do termo central é Md = 7+1 2 = 4 ou seja 4º elemento da séria nesse caso nº 12 Então a mediana é o quarto elemento do Rol: md =12 1.2 - Se n é par – Neste caso, o rol admite dois termos centrais que ocupam as posições 𝑛 2 e 𝑛 2 + 1 . A mediana é convencionada como sendo a média dos valores que ocupam estas posições centrais Exemplo: Determinar a mediana da serei X : 7, 21, 13, 15, 10, 8, 9, 13. Solução: Ordenar estes elementos, obtendo o rol X: 7 , 8 , 9, 10, 13, 13, 15, 21. O numero de elementos é n = 8 (par) As posições centrais são: 8 2 = 4º e 8 2 + 1 = 5º, os elementos que ocupa a quarta posição na série é 10 e o elemento que ocupa a quinta posição é 13. Portanto md = 10+13 2 = 11,5 Interpretação: 50% dos valores do rol são valores menores ou iguais a 11,5 e 50% dos valores do rol são valores maiores ou iguais a 11,5. 2º Caso - Variável Discreta: Exemplo: Determinar a mediana da série. Xi fi 2 1 Estatística Prof. Otair Pelisson Página 23 5 4 8 10 10 6 12 2 Solução: O numero da série é n = 𝑓𝑖 = 23 (impar), portanto a série admite apenas um termo central que ocupa a posição ( 23 + 1 / 2) = 12º termo. Construindo a freqüência acumulada podemos localizar com facilidade o décimo segundo elemento da série. Xi fi Fi 2 1 1 5 4 5 8 10 15 10 6 21 12 2 23 Note que o elementos iguais a 5 . Estes elementos ocuparam na serie as posições de segundo ao quinto. Depois aparecem mais dez elementos iguais a 8 que ocupam na série as posições de sexto a décimo quinto. Conseqüentemente, o elemento que ocupa a décima segunda posição vale 8 e podemos afirmar que md = 8. Interpretação: 50% dos valores da série são menores ou iguais a 8 e 50% dos valores da série são maiores ou iguais a 8. Variável Contínua. Se os dados são apresentados na forma de uma variável contínua o raciocínio anterior não pode ser utilizado, uma vez que mesmo identificada a posição da mediana na série, o valor do elemento da série que ocupa esta posição não é identificável Considere a distribuição de freqüência; Classe Int. Classe fi 1 3|------- 6 2 2 6|------- 9 5 3 9|------- 12 8 4 12|------- 15 3 5 15|------- 18 1 O número de elemento da série é n = 𝑓𝑖 = 19 A mediana, por definição, separa o número de elementos da série em dois grupos, contendo cada um deles 50% dos elementos. Estatística Prof. Otair Pelisson Página 24 Portanto, a posição da mediana na série é n/2 . No exemplo (19/2) = 9,5 o valor decimal 9,5 indica que a mediana é um elemento posicionado entre o nono e décimo elemento da série. Construiremos a freqüência acumulada para identificar em qual classe estão situados o nono e o décimo elemento da série. Classe Int. Classe fi fa 1 3|------- 6 2 2 2 6|------- 9 5 7 3 9|------- 12 8 15 4 12|------- 15 3 18 5 15|------- 18 1 19 𝐹𝑖 = 19 Note que o nono e o décimo elementos estão posicionados na terceira classe, o que índica que a mediana é um valor compreendido entre 9 e 12. A classe que contém a mediana será identificada como classe mediana. 7ª 9,5 15ª |---------|--------| 9 x md 12 Ou seja: 15 – 7 = 9,5 – 7 simplificando: 8 = 9,5 – 7 x = 9,5 – 7 . 3 3 x 3 x 8 Portanto: md + x Md = 9,9375 Observando na formula em destaque acima que: - 9 é o limite inferior da classe mediana -9,5 é a metade dos elementos da série, isto é, n/2 - 7 é a freqüência acumulada da classe anterior à classe mediana - 8 é a freqüência simples da classe mediana. - 3 é amplitude do intervalo de classe, poderemos generalizar a fórmula de cálculo da mediana para variável contínua: Md = 9 + 9,5 – 7 . 3 8 Md = 𝑛 2 −𝐹𝑎𝑛𝑡 𝑓𝑚𝑑 × Estatística Prof. Otair Pelisson Página 25 Onde: Md (me) = mediana Imd = limite da mediana inferior Fant = freqüência acumulada anterior Fmd = freqüência da mediana h = amplitude n/2 = número de elementos Moda É o valor de maior freqüência em um conjunto de dados . Notação : A moda será denotada por Mo Cálculo da Moda 1º Caso – Dados Brutos ou Rol. Basta identificar o elemento de maior freqüência . Exemplos: a) X : 2, 8, 3, 5, 4, 5, 3, 5, 5, 1 O elemento de maior freqüência é 5. Portanto mo = 5 É uma seqüência unimodal. b) X: 6,10, 5, 6, 10, 2 . Esta seqüência apresenta o elemento 6 e o elemento 10 como elemento de maior freqüência . Portando mo = 6 e mo = 10 . É uma seqüência bimodal Podemos encontrar seqüência trimodal, tetramodal e assim sucessivamente. Estas seqüências serão chamadas de forma genérica por seqüência polimodal. 2º Caso – Variável discreta. Este caso é ainda mais simples. Basta identificar o elemento de maior freqüência. Exemplos. a) Xi fi 0 2 2 5 3 8 4 3 5 1 Estatística Prof. Otair Pelisson Página 26 A maior freqüência observada na segunda coluna é 8 e corresponde ao elemento 3 da série. Portanto, é uma série unimodal com mo= 3 b) Xi fi 1 2 2 5 3 4 4 5 5 1 A maior freqüência observada na segunda coluna é 5 e corresponde aos valores 2 e 4. Portanto, é uma série bimodal com mo = 2 e mo = 4. 3º Caso - Variável Contínua. Para determinar a moda de uma variável continua , podemos optar por vários processos. Daremos destaque a moda de Pearson. 1º Processo Moda de Pearson Mo = 3 md – 2 𝑥 Exemplo: Calcule a moda de Pearson para a distribuição de freqüência . Classe Inter. Classe fi 1 0 |-------- 10 1 2 10 |-------- 20 3 3 20 |-------- 30 6 4 30 |-------- 40 2 Classe Inter. Classe fi Xi Xi fi 1 0 |-------- 10 1 5 5 2 10 |-------- 20 3 15 45 3 20 |-------- 30 6 25 150 4 30 |-------- 40 2 35 70 𝐹𝑖=12 𝑥𝑖. 𝑓𝑖 = 270 𝑥 = 𝑋𝑖 𝑓𝑖=> 𝑥 = 270 = 22,5 𝑓𝑖 12 Estatística Prof. Otair Pelisson Página 27 Calculo da mediana: n = 12 => n = 12 = 6 2 2 A mediana corresponde ao sexto elemento da série está na terceira classe. Esta classe mediana vale: md = 20 + 6 – 4 . 10 => md = 23,33 6 2º Processo Moda de KING. KING levou em consideração, em sua fórmula, a freqüência simples da classe anterior e a freqüência simples da classe posterior à classe modal: Onde : Imo = limite inferior da classe fpost = freqüência simples da classe posterior a classe modal fant = freqüência simples da classe anterior à classe modal h = amplitude do intervalo de classe. Exemplo: Calcular a moda de King para a distribuição. Classe Int. classe fi 1 0 |--------- 10 1 2 10 |--------- 20 3 3 20 |--------- 30 6 4 30 |-------- 40 2 Classe Inter. Classe fi Fa 1 0 |-------- 10 1 1 2 10 |-------- 20 3 4 3 20 |-------- 30 6 10 4 30 |-------- 40 2 12 Md = 𝑛 2 −𝐹𝑎𝑛𝑡 𝑓𝑚𝑑 × fpost mo = Imo + . h fant + fpost Estatística Prof. Otair Pelisson Página 28 Solução: A classe modal é a que mais se repete (maior ) freqüência portanto é a terceira classe e a moda vale: Mo = 20 + 2 . 10 = 24 3 + 2 3º Processo Moda de Czuber: Czuber levou em consideração, em sua fórmula a freqüência simples da classe anterior, a freqüência da classe posterior, além da freqüência simples da classe modal. Onde: Imo = limite inferior da classe modal fmo = freqüência simples da classe modal fant = freqüência simples da classe anterior da classe modal fpost = freqüência simples da classe posterior à classe modal. h = amplitude Exemplo: Classe Int. classe Fi 1 0 |--------- 10 1 2 10 |--------- 20 3 3 20 |--------- 30 6 4 30 |-------- 40 2 Solução : A classe modal é a terceira classe,portanto a moda vale: mo = Imo (20) + fmo (6) – fant (3) . ho (10) 2.fmo (6) - (fant (3) + fpost (2) ) mo = 20 + 6 – 3 . 10 => mo = 24,29 2(6) – (3 +2) mo = Imo + f mo - fant . h 2 fmo - ( fant + fpost) Estatística Prof. Otair Pelisson Página 29 Exercícios. 1) Calcule a moda das séries abaixo: a) X : 2 ;3 ;5 ;4 ;5 ;2 ;5 ;7. b) Y : 4; 12 ; 5 ; 9 ; 12; 4; 3. c) J : 7 ;7 ; 7; 7 ;7 . d) Z : 4,5 ;6 ,6 ;6 ,7 ; 8, 8; 8, 9 ; 10 ; 10 ; 10 ; 11. e) T : 2 ;5 ;9 ;8 ;10 ; 12 2) Calcule a moda da distribuição: Xi Fi 2 1 3 7 4 2 5 2 3) Calcule a moda de King para a série de distribuição representativa dos salários de 25 funcionários selecionados em uma empresa. Classe Salários R$ Nº de funcionário 1 1.000,00 |------- 1.200,00 2 2 1.200,00 |------- 1.400,00 6 3 1.400,00 |------- 1.600,00 10 4 1.600,00 |------- 1.800,00 5 5 1.800,00 |------- 2.000,00 2 4) Calcule a moda de Czuber para a tabela anterior. 05) Calcule a moda de Czuber para a distribuição abaixo que representa a nota de 60 alunos em uma prova de matemática. Classe Notas dos alunos Nº de alunos 1 0 |------ 2 5 2 2 |------ 4 20 3 4 |------ 6 12 4 6 |------ 8 20 5 8 |------ 10 3 06) Calcule a moda de King para a tabela anterior. Medidas de Dispersão Absoluta. Estatística Prof. Otair Pelisson Página 30 Amplitude total: é a diferença entre o maior e o menor valor da seqüência. Cálculos da Amplitude total: basta identificar o maior e o menor valor da seqüência e efetuar a diferença entre estes valores. Exemplo: Determinar a amplitude total da seqüência X ; 11, 12, 09, 10, 10 e 15 Solução O maior valor desta seqüência é 15 e o menor é 9 ; portanto At = 15 – 9 = 6 unidades Variável Discreta. Como os valores já se apresentam ordenados, a amplitude total é a diferença entre o último e o primeiro elemento da série. Exemplo: Determine a amplitude total da série. Xi fi 2 1 3 6 5 10 7 3 Solução: O maior valor da série é o 7 e o menor valor da série é o 2 ; portanto At = 7 – 2 = 5 unidades. Variável Contínua. Nesta situação, por desconhecer o maior e o menor valor da série devemos fazer um cálculo aproximado da amplitude total da série. Considerando como maior valor da série o ponto médio da última classe e como menor valor da série o ponto médio da primeira classe . A amplitude total é a diferença entre estes valores. Exemplo: Determinar a amplitude total da série: Classe Inter. Classe fi 1 02 |------ 04 5 2 04 |------ 06 10 3 06 |------ 08 20 4 08 |------ 10 7 5 10 |------ 12 2 Estatística Prof. Otair Pelisson Página 31 Solução: O ponto médio da última classe é 11 e o ponto médio da primeira classe é 3; portanto, At= 11 – 3 = 8 unidades. Desvio Médio Simples. O conceito estatístico de desvio corresponde ao conceito matemático de distância. A dispersão dos dados em relação à média de uma seqüência pode ser avaliada através dos desvios de cada elemento em relação a média da seqüência. O desvio médio simples que indicaremos por DMS é definido como sendo uma média aritmética de cada elemento da série para média da série. Calculo do Desvio Médio Simples. Dados Brutos: Calcular inicialmente a média da seqüência , em seguida identificarmos a distancia de cada elemento da seqüência para a sua média e finalmente calculamos a média desta distancia. Fórmula. DMS = | 𝑥𝑖 − 𝑥 | n Exemplo: Calcule o DMS para a seqüência: X : 2 , 8 , 5 , 6. Solução: Determinamos inicialmente a média da série. 𝑥 = 𝑋 𝑖 = 2 + 8 + 5 + 6 = 5,25 n 4 Em seguida determinamos a distancia de cada elemento da série para a média da série: | X1 – 𝑥 | = | 2 – 5,25 | = 3,25 | X1 – 𝑥 | = | 8 – 5,25 | = 2,75 | X1 – 𝑥 | = | 5 – 5,25 | = 0,25 | X1 – 𝑥 | = | 6 – 5,25 | = 0,75 O DMS é a média aritmética simples deste valores. DMS = 3,25 + 2,75 + 0,25 + 0,75 = 7 = 1,75 4 4 Estatística Prof. Otair Pelisson Página 32 Interpretação: Em média, cada elemento da seqüência esta afastado do valor 5,25 por 1,75 unidades. Variável Discreta. No caso da apresentação de uma variável discreta, lembramos que a freqüência simples de cada elemento representa o numero de vezes que este valor figura na série, e conseqüentemente haverá repetições de distancias iguais de cada elemento distinto da série para a média da série, para este caso usamos a notação Desvio Médio Absoluto ou DMA. Fórmula. DMA = xi − xi . fi 𝑓𝑖 Exemplo: Determine o DMA para a série: Xi fi 1 2 3 5 4 2 5 1 Solução: O numerode elementos da série n = 𝑓𝑖 = 10 A média da série é: X = 𝑥𝑖 𝑓𝑖 𝑓𝑖 Xi fi xi fi 1 2 2 2 5 15 4 2 8 5 1 5 𝑓𝑖 = 10 𝑥𝑖 𝑓𝑖 =30 A média da série é: __ X = 𝑥𝑖 𝑓𝑖 = 30 = 3 𝑓𝑖 10 O DMA é dado por: DMA = xi − xi . fi Estatística Prof. Otair Pelisson Página 33 𝑓𝑖 Incluiremos outra coluna para efetuar este cálculo Xi fi xi fi | Xi - X | fi 1 2 2 4 2 5 15 0 4 2 8 2 5 1 5 2 𝑓𝑖 = 10 𝑥𝑖 𝑓𝑖 =30 |𝑥𝑖 – 𝑥 | 𝑓𝑖 = 8 O desvio médio absoluto é: DMS = | 𝑥𝑖 − 𝑥 | 𝑓𝑖 = 8 = 0,8 𝑓𝑖 10 Variável Contínua. Nesta situação , por desconhecer os valores individuais dos elementos componentes da série, substituiremos estes valores xi , pelos pontos médios da classe. Desta forma, o desvio médio absoluto tem por cálculo a fórmula; DMA = xi − xi . fi onde o xi é o ponto médio da classe i 𝑓𝑖 Exemplo: Determine o DMA para a série. Classe Inter. Classe fi 1 02 |------ 04 5 2 04 |------ 06 10 3 06 |------ 08 4 4 08 |------ 10 1 Acrescentar a coluna dos pontos médios das classes. Classe Inter. Classe fi Xi 1 02 |------ 04 5 3 2 04 |------ 06 10 5 3 06 |------ 08 4 7 4 08 |------ 10 1 9 𝑓𝑖 = 20 Calcular a média da série . Estatística Prof. Otair Pelisson Página 34 Classe Inter. Classe fi Xi Xi fi 1 02 |------ 04 5 3 15 2 04 |------ 06 10 5 50 3 06 |------ 08 4 7 28 4 08 |------ 10 1 9 9 𝑓𝑖 = 20 𝑥𝑖 𝑓𝑖 =102 Á média da série é: 𝑋 = 102 = 5,1 20 O DMA será. Classe Inter. Classe fi Xi Xi fi |xi – x| fi 1 02 |------ 04 5 3 15 10,50 2 04 |------ 06 10 5 50 1,00 3 06 |------ 08 4 7 28 7,60 4 08 |------ 10 1 9 9 3,90 𝑓𝑖 = 20 𝑥𝑖 𝑓𝑖 =102 |𝑥𝑖 – 𝑥 | 𝑓𝑖 = 23 DMA = xi − xi . fi = 23 = 1,15 unidades 𝑓𝑖 20 Variância e Desvio Padrão. Para dados brutos ou rol. 1) Se a seqüência representa uma população, a variância é calculada pela formula: 𝜎2(x) = 𝜎 (𝑥i - 𝑥 )2 n Exemplo a) Calcular a variância e o desvio padrão da seqüência X: 4 ,5 , 8 , 5 a seqüência contém n = 4 elementos e tem por média; X = 𝑥𝑖 => 4 + 5 + 8 + 5 = 22 = 5,5 n 4 4 __ Os quadrados das diferenças ( Xi – X ) 2 valem: (𝑋1 – 𝑥 )2 = ( 4 – 5,5 )2 = 2,25 (𝑋2 – 𝑥 )2 = ( 5 – 5,5 )2 = 0,25 Estatística Prof. Otair Pelisson Página 35 (𝑋3 – 𝑥 )2 = ( 8 – 5,5 )2 = 6,25 (𝑋4 – 𝑥 )2 = ( 5 – 5,5 )2 = 0,25 Somando-se estes valores obtém - se: (𝑋𝑖 – 𝑥 )2 = 9 Substituindo esses valores na fórmula da variância, teremos: 𝜎2 (x) = ( 𝑋𝑖 – 𝑋 )2 = 9 = 2,25 n 4 Como o desvio padrão é a raiz quadrada positiva da variância. 𝜎(x) = 𝜎2 => 𝜎(x) = 2,25 = 1,5 unidades Se a seqüência anterior representasse apenas uma amostra a variância seria denotada por s 2 (x) e o desvio padrão por s(x) Neste caso; s 2 (x) = (𝑋𝑖 − 𝑥 )2 e s(x) = 𝑠2 (𝑥) n – 1 Note que a única diferença entre a formula de 𝜎2 (x) ( indicado para populações) e s2 (indicado para amostras) é o denominador. Assim s 2 (x) = (𝑋𝑖 − 𝑋 )2 = 9 => 3 e o desvio padrão s(x) = 3 = 1,73 n – 1 3 Variável Discreta: Como há repetições de elementos na série, definimos a variância como sendo uma média aritmética dos desvios dos elementos da série média da série. a) Se a variável discreta é representativa de uma população, então a variância é dada por: Fórmula. 𝜎2(x) = (𝑋𝑖 − 𝑥 )2 𝑓𝑖 𝑓𝑖 O desvio padrão é ; 𝜎(x) = 𝜎2(𝑥) Estatística Prof. Otair Pelisson Página 36 b) Se a variável discreta é representativa de uma amostra, então a variância é: Fórmula; . s 2 (x) = (𝑋𝑖 − 𝑥 )2 𝑓𝑖 𝑓𝑖 - 1 e do desvio padrão é : s(x) = 𝑠2(𝑥) Exemplo 1: Calcular a variância da série abaixo, representativa de uma população. Xi fi Xifi (xi – x) 2 .fi 2 3 6 8,1675 3 5 15 2,1125 4 8 32 0,9800 5 4 20 7,2900 𝑓𝑖= 20 𝑥𝑖.𝑓𝑖 = 73 (𝑥𝑖 – 𝑥 )2.fi = 18,55 A variância é : 𝜎2(x) = (𝑋𝑖 − 𝑥 )2 𝑓𝑖 = 18,55 = 0,9275 e o desvio padrão = 0,9275 = 0,963 𝑓𝑖 20 Exemplo 2 : Se a variável discreta fosse representativa de uma amostra, a variância seria indicada por ; s 2 (x) = (𝑋𝑖 − 𝑥 )2 𝑓𝑖 => 18,55 = 0,9763 e o desvio padrão 0,9763 = 0,988 𝑓𝑖 – 1 19 Variável contínua. Novamente, por desconhecer os particulares valores de Xi da série, substituiremos nas fórmulas anteriores estes valores pelos pontos médios de classe. __ Fórmula : 𝜎2(x) = (Xi - X )2 fi 𝑓𝑖 Se a variável contínua representa uma amostra então a variância é denotada por s 2 (x) e a sua formula de cálculo é : Exemplo 1 : Calcular a variância e o desvio padrão para a série representativa de uma população: Estatística Prof. Otair Pelisson Página 37 Classe Int. cl. fi Xi Xifi (xi – x) 2 fi 1 0 |----- 4 1 2 2 40,96 2 4 |----- 8 2 6 18 17,28 3 8 |----- 12 5 10 50 12,80 4 12 |----- 16 1 14 14 31,36 𝑓𝑖 =10 xifi = 84 (𝑥𝑖 – 𝑥)2.𝑓𝑖 = 102,4 A variância é portanto: 𝜎2(x) = (Xi − 𝑥 )2 fi = 102,4 => 10,24 e o desvio padrão é = 10,14 = 3,2𝑓𝑖 10 Exemplo 2: Se a variância contínua fosse representativa de uma amostra, a variância seria indicada por s 2 (x) e sua fórmula do cálculo seria: s 2 (x) = (𝑋𝑖 − 𝑥 )2 𝑓𝑖 𝑓𝑖 - 1 Desta forma s 2 (x) = 102,4 = 11,38 e o desvio padrão s(x) = 11,38 = 3,373. 9 Exercícios 1) A produção de manteiga dos últimos seis meses do Laticínio Sabor de Leite Ltda. Está apresentada a seguir. Com base nós números apresentados, calcule : (a) média; (b) desvio médio ; (c) variância populacional; o desvio padrão populacional . Produção mensal de manteiga em toneladas: {11; 8; 4; 10; 9; 12 } 2) As notas de um determinado aluno em estatística foram iguais 5, 3, 2 e 4. Pergunta-se: qual o desvio médio destas notas ? 03) Empregando os dados disponibilizados na tabela a seguinte, pede-se obter à média, o desvio médio simples, a variância (amostral e populacional) e o desvio padrão (amostral e populacional). xi 𝑓i 2 1 4 3 Estatística Prof. Otair Pelisson Página 38 6 4 10 3 12 3 16 6 04) Os dado a seguir apresentam a quantidade (em milhares) de passageiros transportados em diferentes épocas do ano por uma grande empresa de transporte urbano. Com base nos números apresentados, pede-se obter: a – a média aritmética b –o desvio médio c – variância (amostral e populacional) d – desvio padrão (amostral e populacional) Intervalo de Classe 𝑓i 1,5 |------- 4,5 5 4,5 |------- 7,5 10 7,5 |------- 10,5 12 10,5|------- 13,5 6 13,5|------- 16,5 7
Compartilhar