Baixe o app para aproveitar ainda mais
Prévia do material em texto
AULA 1: ESTATÍSTICA E SEUS DADOS DEPARTAMENTO DE CIÊNCIAS CONTÁBEIS Disciplina: MÉTODOS QUANTITATIVOS VOLTADOS PARA PESQUISA EM CONTABILIDADE Professor: ALAN CARTER KULLACK 01 ESTATÍSTICA Definição: É o conjunto de métodos e processos quantitativos que servem para estudar, avaliar e conceituar as medidas e os valores de um determinado fenômeno. A Estatística é dividida em duas partes: 1º) ESTATÍSTICA DESCRITIVA ou DEDUTIVA 2º) ESTATÍSTICA INDUTIVA ou INFERENCIAL ESTATÍSTICA DESCRITIVA ou DEDUTIVA (Parte I) Definição: Refere-se a organização e descrição dos dados a serem estudados de uma população. A Estatística Descritiva é composta pelos seguintes fatores estatísticos: Variáveis População e Amostra Técnicas de Amostragem Séries Estatísticas Gráficos Estatísticos Distribuição de Frequências Estudaremos cada um deles posteriormente ! ESTATÍSTICA INDUTIVA ou INFERENCIAL (Parte I) Definição: Refere-se à análise e interpretação de dados de uma população,a qual é baseada em amostras de probabilidade da mesma. 02 A Estatística Indutiva é composta pelos seguintes fatores estatísticos: Resultados baseados em Amostras Conclusões baseadas em População Teorias baseadas em Probabilidade RESUMO DE ESTATÍSTICA OBS: Para entendermos os fenômenos estudados pela estatística,devemos concei- tuar primeiramente o conjunto de elementos que fazem parte destes estudo,o qual chamaremos de POPULAÇÃO. POPULAÇÃO Definição: É o conjunto de todos os elementos e valores que se pretende estudar, isto é, o que possa ser medido. Ex: Pessoas; Salários; Objetos, Animais; Etc. OBS: Portanto, a população é um fenômeno mensurável,pois compreende o conjunto de todos os dados em observação,sobre os quais queremos obter uma determinada conclusão. ESTATÍSTICA DESCRITIVA INDUTIVA POPULAÇÃO AMOSTRA HIPÓTES PROBABILIDADE GRÁFICO S AMOSTRAGEM ANÁLISE DE RESULTADO TABELA S VARIÁVEIS 03 CLASSIFICAÇÃO DA POPULAÇÃO A classificação da População é dividida em: 1º) População Finita: N ≤ 100.000 (Menor que cem mil elementos) 2º) População Infinita: N ≥ 100.000 (Maior que cem mil elementos) OBS: Como a quantidade de elementos de cada população possui um valor muito expressivo, então devemos fragmentá-la em uma pequena porcentagem para analisarmos e obtermos os seus resultados. Essa pequena porcenta- gem da população,definiremos como AMOSTRA. AMOSTRA ( ou Amostragem) Definição: É um subconjunto de elementos extraídos de uma população, mas com um grau de representatividade confiável. Ex: População = Amostra = , OBS1: Essa representatividade dará confiança a Amostra, resultando assim em uma probabilidade de acertos muito grande, referente as informações retiradas da população. OBS2: Quando estudamos a totalidade de um conjunto populacional, não podemos mais utilizar o conceito de amostra, para isso,definiremos este estudo como um CENSO. , , , , , , Conjunto de Maçãs Vermelhas e de Maçãs Verdes ! 04 CENSO x AMOSTRA Censo: É o estudo de uma população em sua totalidade (100%). Amostra: É o estudo de um determinado percentual da população. Portanto: Quando o Censo não consegue atingir a sua totalidade é recorrido a Amostra para expressar a probabilidade estatística do estudo que queremos obter. A forma que será realizada a Amostra é fundamental, pois se os fatores estatísticos não forem bem claros o processo do estudo será perdido. FASES DO MÉTODO ESTATÍSTICO Para realizar um determinado estudo, devemos estabelecer parâmetros mensuráveis e seguir uma ordem cronológica dos fatores a serem estudados: 1º) Definir o Problema : O que devemos pesquisar exatamente ? 2º) Planejar: a) Como iremos coletar as informações; b) Quais são os dados a serem levantados; c) Qual instrumento será utilizado para a pesquisa(Censo ou Amostra); d) Cronograma das atividades; e) Quanto custará a pesquisa ? 3º) Fases Operacionais: Desenvolvimento prático do estudo estatístico,o qual é dividido em: FASE 1 : Coleta de Dados ( Amostragem, Pesquisa e Questionário) 05 Esta é a fase inicial, a qual determina a Amostra do objeto de estudo, além da pesquisa e o questionário que serão realizados para a coleta de dados do processo estatístico. Portanto, os Dados são um conjunto de informações que constituem os objetos de estudo estatístico, sendo estes de fundamental importância para a credibilidade das demais fases. OBS: As coletas de Dados se dividem em Direta e Indireta! Coleta de Dados Direta: Quando o estudo é realizado por um pesquisador, de maneira contínua,periódica ou ocasional. Coleta de Dados Indireta: Quando o estudo é baseado em dados já pesquisados e publicado em revistas,jornais,livros,etc. FASE 2: Apuração dos Dados ( Tabulação,Contagem e Softwares) Nesta fase o pesquisador terá uma gama de informações a sua disposição, as quais deverão ser tabuladas, isto é, processadas e organizadas em gráficos estáticos ou mapas de análise estatística. Feito esse procedimento, devemos aplicar os cálculos estatísticos e matemáticos ou ainda utilizar softwares específicos para obtenção dos resultados. FASE 3: Apresentação dos Dados ( Tabelas, Gráficos e Planilhas) Consiste na utilização de um software para apresentação de tabelas, gráficos e planilhas que esbocem o resultado da pesquisa. FASE 4: Análise, Interpretação e Conclusão das Informações É a última fase do processo estatístico, a qual deverá processar todas as informações coletadas, sendo que estas serão interpretadas de forma analítica, isto é, são analisados minuciosamente os resultados e retiradas determinadas conclusões que poderão ser utilizadas como tomadas de decisões ou somente ficam a disposição como fonte de pesquisas futuras. 06 VARIÁVEIS Definição: São valores que recebem um tratamento estatístico. As variáveis se dividem em: NOMINAL (Ex: Sexo;Religião,Estado Civil, Etc. QUALITATIVA ORDINAL(Ex: Dia da Semana,Mês,Grau de Instrução) DISCRETA( Ex: Número de Faltas,Irmãos, Etc.) QUANTITATIVA CONTÍNUA ( Ex: Altura, Área, Peso, Volume, Etc)FONTES DE PESQUISA Definição: São as bases de informações do pesquisador, as quais são utilizadas para fundamentar a pesquisa do estudo estatístico. CLASSIFICAÇÃO DAS FONTES DE PESQUISA 1º) Primária: O pesquisador realiza as perguntas(pesquisa de campo) Ex: Questionário(coleta de dados) 2º) Secundária: O pesquisador utiliza outras pesquisas já realizadas. Ex: Livros, artigos, etc. 3º) Terciária: Direcionam o pesquisador para realizar a pesquisa primária e secundária. Ex: Bibliotecas, resumos, etc. 07 EXERCÍCIOS DE FIXAÇÃO 01) De entre os 3000 alunos de uma escola selecionaram-se 30 e inquiriram-se sobre o programa de televisão preferido. Os resultados obtidos foram os seguintes: PROGRAMA PREFERIDO Nº. DE ALUNOS Telejornal 10 Novelas 12 Cinema 8 Neste conjunto de dados indique: a) a população_________ b) a amostra.___________ 02) Classifique as seguintes variáveis em: (QN) Qualitativa nominal, (QO) Qualitativa ordinal (QC) Quantitativa contínua, (QD)Quantitativa discreta a) ( ) Cor dos olhos b) ( ) Número de filhos de um casal c) ( ) Peso de um indivíduo d) ( ) Altura de um indivíduo e) ( ) Número de alunos de uma escola f) ( ) Tipo sanguíneo g) ( ) Posicionamento das empresas no mercado h) ( ) Fator RH i) ( ) Sexo j) ( ) Comprimento de um segmento de reta k) ( ) Área de um círculo l) ( ) Raça m) ( ) Quantidade de livros de uma biblioteca n) ( ) Escolaridade dos funcionários de uma empresa o) ( ) Religião p) ( ) Salário dos empregados de uma empresa q) ( ) Comprimento dos parafusos produzidos em uma fábrica r) ( ) Estado civil s) ( ) O nível socioeconômico dos residentes em um bairro de Ipatinga t) ( ) Tempo de vida de uma lâmpada u) ( ) Profissão v) ( ) Número de ações negociadas diariamente na bolsa de valores w) ( ) Volume de água contida numa piscina x) ( ) A classificação dos alunos no último vestibular 08 03) O método aplicado por um Instituto de Pesquisa, nas prévias eleitorais, pertence ao ramo da: a) Estatística Descritiva b) Estatística Indutiva c) Estatística Aplicada d) Estatística Geral e) Estatística Dedutiva 04) Ao nascer,os bebês são pesados e medidos para saber se estão dentro das tabelas padrão. Estas duas variáveis são: a) Qualitativas b) Discretas c) Contínuas d) Contínuas e Discretas, respectivamente e) Quantitativas 05) Parcela da População convenientemente escolhida para representá-la: a) Variável b) Rol c) Dados d) Amostra e) Atributo 06) População ou Universo é: a) Conjunto de Pessoas b) Conjunto de Indivíduos que apresentam características especiais c) Conjunto de elementos que apresentam uma característica comum d) Subconjunto confiável para um estudo qualquer e) N.D.A 07) Numere a segunda coluna, de acordo com a primeira, e registre a opção correta: 1) Estudo de números associados a fenômenos. 2) Parte da população observada. 3) Denominação dada a atributos ou a quantidades, que variam quanto à grandeza. 4) Grupo de indivíduos ou coisas cujas características são estudadas em forma de um todo, não interessando um elemento em particular. 5) Cada valor observado de uma variável. 09 ( ) Amostra ( ) Estatística ( ) População ( ) Variável ( ) Dado GABARITO: 01 a) 3000 b) 30 02 a) QN b) QO c) QC d) QC e) QD f) QN g) QN h) QN i) QN j) QC k) QC l) QN m) QD n) QN o) QN p) QN q) QC r) QN s) QN t) QD u) QN v) QD w) QC x) QN 03 B 04 C 05 D 06 C 07 E a) 5 -1 -4 -3 -2 b) 2 -3 -4 -1 -5 c) 3 -1 -4 -2 -5 d) 2 -1 -4 -5 -3 e) 2 -1 -4 -3 -5 AULA 2 ESTATÍSTICA DESCRITIVA OU DEDUTIVA DEPARTAMENTO DE CIÊNCIAS CONTÁBEIS Disciplina: MÉTODOS QUANTITATIVOS VOLTADOS PARA PESQUISA EM CONTABILIDADE Professor: ALAN CARTER KULLACK 10 ESTATÍSTICA DESCRITIVA ou DEDUTIVA (Parte II) Definição: Refere-se a organização dos dados a serem estudados de uma população. Possibilita a construção de planilhas, tabelas e gráficos, os quais serviram como fatores determinantes para explicações do comportamento das variáveis numa distribuição estatística, dando assim consistência aos nossos estudos. OBS: Para obtermos uma análise final da estatística descritiva devemos seguir algumas etapas, tais como: 1º) Distribuição de Frequência; 2º) Medidas; 3º) Análise. DISTRIBUIÇÃO DE FREQUÊNCIA Definição: É uma série estatística, na qual as variáveis quantitativas são divididas em classes e categorias, conforme as frequências correspondentes. ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA 1º) Relação de Valores (ROL) : É o arranjo dos dados em ordem crescente. Ex: Seja o ROL: 2,3,4,5,6 ( Esta distribuição esta na ordem crescente) 2º) Amplitude Total (AT): É a diferença entre o maior (>) e o menor (<) valor observado no ROL. Ex: 6 – 2 = 4. Portanto, AT = 4 3º) Classes: São as divisões nas variações apresentadas na distribuição de frequência. 11 4º) Frequência Simples (fi):. É o número de observações ocorridas em cada Classe. 5º) Limite de Classes: São os valores extremos de cada classe. São divididos em: li = Limite inferior ls = Limite superior 6º) Intervalo de Classes: É um mecanismo de representação das classes, podendo ser representado das seguintes maneiras: a) li ___ ls : Todos os valores serão considerados, menos os seus extremos (li e ls). b) li __ ls: Todos os seus valores serão considerados. c) li ls: Todos os valores serão considerados, excluindo o ls. d) li ls: Todos os valores serão considerados, excluindo o li. Ex: Seja x Є |N, onde x é o intervalo de classes de { 2,3,4,5,6 }; temos então: a) li ___ ls ► 2 __6 = { 3,4,5} b) li __ ls ► 2 __ 6 = {2,3,4,5,6} c) li __ ls: ► 2 ___6 = {2,3,4,5} d) li __ ls: ► 2___ 6 = {3,4,5,6} 7º) Ponto Médio (Xi): É o número que representa uma classe. Fórmula: Xi = li + ls 2 8º) Números de Classe: . É a quantidade de classes referente a uma distribuição de frequência. Fórmula de Sturges: K = 1 + 3,3.log N ; onde: K = números de classe N = números de elementos observados.12 9º) Tipos de Frequência: São os valores distribuídos em uma tabela de estatística. Elas podem ser divididas em: a) Frequência Relativa Simples (fri): É o quociente entre a frequência simples e o número de elementos observados. b) Frequência Acumulada Crescente (Fi↓): É a soma das frequências simples de cada classe com as suas anteriores. OBS: Para tornarmos o estudo mais didático, usaremos a simbologia (Fac.) ou invés de (Fi↓), facilitando assim, uma melhora significativa na assimilação do conteúdo. c) Frequência Acumulada Decrescente (Fi ↑) : É a soma das frequências simples de cada classe com as suas posteriores. OBS: Para tornarmos o estudo mais didático, usaremos a simbologia (Fad) ou invés de (Fi↑),facilitando assim,um melhora significativa na assimilação do conteúdo. RESOLUÇÃO DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA Devemos obedecer a ordem dos seguintes critérios: 1º) Fazer o Rol: ( colocar os números na ordem crescente.) Ex: 15,20,10,11,30,28,10,13,23,19,13,29,19,15,24,17,19,28,24,29,24,25,11,27 Temos então: ROL= 10,10,11,11,13,13,14,15,15,17,19,19,19,20,22,23,24,24,25,27, 28,28,29,29,30 13 2º) Encontrar a Amplitude Total. (AT) Temos então: AT = Xmáx – Xmín AT = 30 – 10 AT = 20 3º). Calcular o número de Classes. (Utilizar a fórmula de Sturges: K = 3,3.logN) Temos então: N = 25 e K = 3,3Log25; logo fica: K= 3,3.(1,40) K = 4,62 K = 5 4º) Calcular a Amplitude do Intervalo de Classe. (h): (Utilizar a fórmula: h = AT) K Onde: AT = Amplitude Total K = Número de Classes Logo temos: h = 20 h = 4 5 5º) definir os limites de Classe( __ ) Será obtido através do valor inferior do ROL com um intervalo do valor da Amplitude Total e sucessivamente; finalizando o limite de classe no valor superior do ROL. Como temos o Xmín = 10 e Xmáx = 30 e h = 4 ; então os limites de classe ficam da seguinte maneira : 10 14 14 18 18 22 22 26 26 30 6º) Calcular o Ponto Médio(Xi): Devemos somar o limite inferior com o limite superior de cada classe e dividir por 2. Ex: 10 14 10 + 14 = 24 = 12 e assim sucessivamente. 2 2 14 7º). Devemos calcular a frequência relativa simples (fri) para cada classe,conforme a seguinte fórmula: fri = fi onde: fi = frequência simples e N N = Número de elementos observados 1º Classe: fri = 6 fri = 0,24 25 2º Classe: fri = 4 fri = 0,16 e assim sucessivamente ! 25 Devemos calcular a fri (%) em porcentagem, isto é, multiplicamos cada fri por 100%,temos: 1º Classe: 0,24 x 100% = 24% 2º Classe: 0,16 x 100% = 16% OBS: A ∑fri(%) de todas as classes deverá dar o valor de 100%,caso contrário,os cálculos estarão errados. 8º). Devemos calcular a frequência acumulada crescente (Fac) e a frequência acumulada decrescente (Fad) de cada classe, sendo: Fac: 1º Classe: 6 2º classe: 6 + 4 = 10 e assim por em diante! Fad: 1º Classe: 25 2º classe: 25 - 6 = 19 e assim por em diante ! 9º). Devemos montar a Planilha com todos os dados já apresentados: 15 fi Xi fri fri(%) Fac Fad 10 14 6 12 0,24 24% 6 25 14 18 4 16 0,16 16% 10 19 18 22 4 20 0,16 16% 14 15 22 26 5 24 0,20 20% 19 10 26 30 6 28 0,24 24% 25 4 TOTAL: 25 100% ________________________________\\______________________________ Exercício: Uma sala de aula possui 30 alunos, sendo que a idade do mais novo é de 18 anos e do mais velho é 50 anos. Estes alunos estão dispostos em uma tabela, referente a sua idade, da seguinte maneira: (Utilize log 30= 1,48) 28,25,19,22,44,50,22,25,33,20, 18,19,21,35,48,24,32,26,33,40, 42,22,30,40,45,19,20,25,32,21 1º) Passo: Organizar o ROL de Maneira crescente. 18,19,19,19,20,20,21,21,22,22 22,24,25,25,25,26,28,30,32,32 33,33,35,40,40,42,44,45,48,50 2º) Passo: Encontrar a Amplitude Total (AT);então temos: AT = Xmáx – Xmín AT = 50 – 18 AT = 32 3º) Passo: Calcular o número de classes, temos: K = 3,3.logN , fica: K = 3,3log30 K = 3,3.(1,48) K = 4,884 K = 5 16 4º) Passo: Calcular a Amplitude do Intervalo (h) Temos: h = AT h = 32/5 h = 6,4 h = 6 K 5º) Passo: Definir os limites de classes, portanto temos: (18 | 22) ; ( 22| 26) ; (26 | 30) ; ( 30 | 34) ; (34 | 38) ; ( 38 | 42) (42| 46) ; ( 46 | 50). 6º) Passo: Construir a montagem da distribuição. Idade fi Xi fri Fri(%) Fac Fad 18 | 22 8 22| 26 7 26 | 30 2 30 | 34 5 34 | 38 1 38 | 42 2 42| 46 3 46 | 50 2 TOTAL 30 7º) Ponto Médio (Xi) Xi = li + ls Xi = 18 + 22 Xi = 40 Xi = 20 2 2 2 e assim sucessivamente! Portanto, temos: Idade fi Xi fri Fri(%) Fac Fad 18 | 22 8 20 22| 26 7 24 26 | 30 2 28 30 | 34 5 32 34 | 38 1 36 38 | 42 2 40 42| 46 3 44 46 | 50 2 48 TOTAL 30 17 8º) Passo: Calcular a frequência relativa simples (fri),temos: Fri = fi fri = 8/30 fri = 0,27 (1º classe) e assim por em diante! N Calculando fri (%),temos: fri (%) = 0,27 x 100% = 27% . Portanto, temos: Idade fi Xi fri Fri(%) Fac Fad 18 | 22 8 20 0,27 27% 22| 26 7 24 0,23 23% 26 | 30 2 28 0,06 7% 30 | 34 5 32 0,17 16% 34 | 38 1 36 0,03 3% 38 | 42 2 40 0,06 7% 42| 46 3 44 0,10 10% 46 | 50 2 48 0,06 7% TOTAL 30 100% 9º) Passo: Calcular a Frequência Acumulada Crescente (Fac) e a frequência Acumulada Decrescente (Fad). Fac: 1º Classe: 8 2º classe: 8 + 7 = 15 e assim por em diante! Fad: 1º Classe: 30 2º classe: 30 - 8 = 22 e assim por em diante! Portanto, temos: Idade fi Xi fri Fri(%) Fac Fad 18 | 22 8 20 0,27 27% 8 30 22|26 7 24 0,23 23% 15 22 26 | 30 2 28 0,06 7% 17 15 30 | 34 5 32 0,17 16% 22 13 34 | 38 1 36 0,03 3% 23 8 38 | 42 2 40 0,06 7% 25 7 42| 46 3 44 0,10 10% 28 5 46 | 50 2 48 0,06 7% 30 2 TOTAL 30 100% 18 CONCLUSÕES DA PESQUISA: Metade dos alunos da sala (50%) estão entre 18 à 26 anos. Apenas 3% dos alunos da sala estão na faixa etária de 34 a 38 anos. 73% dos alunos da sala estão abaixo dos 34 anos. ______________________________\\_________________\\______________________ EXERCÍCIOS DE FIXAÇÃO Responda às questões de 1 a 6, sabendo que log 40 vale aproximadamente 1,6. Foi feito uma pesquisa em uma sala de aula com 40 alunos, referente ao peso de cada um. A Tabela abaixo representa esses pesos em kg, desses alunos.Portanto, responda: 1) De acordo com a fórmula de Sturges, qual o número recomendável de classes para uma distribuição de frequências contínua? 2) Qual a amplitude total da amostra? 3) Qual a amplitude a ser usada para a distribuição? 4) Qual a amplitude de cada um dos intervalos? 5) Qual o limite inferior da primeira classe? 6) Qual o limite superior da última classe? 07) Preencha a 2º coluna,conforme as respostas apresentadas na 1º coluna: (A) frequência relativa ( ) É o ponto central de um intervalo de classe. (B) frequência absoluta ( ) É o valor do extremo superior de um intervalo. (C) limite de intervalo ( ) Simbologia: f / _f (D) ponto médio ( ) Número de observações de cada dado. 44,5 62 72 72 39,5 41,6 58 73,5 73,5 52,5 40 58,5 42 42 50,4 40 69 58 58 56 42 65 87 47,5 55 55 65 56,5 46,8 65 62 39,5 60 45,7 66,5 63,5 44,5 60 55,9 68 (E) população observada ( ) Simbologia: _f i 19 Uma escola apresenta as matrículas efetuadas no começo do ano (Mês:Fevereiro) e no final do ano (Mês: Dezembro) faz uma pesquisa para verificar a permanência dos alunos em sala de aula. A tabela abaixo apresenta a quantidade de alunos matriculados em cada série: As questões 08, 09 e 10 serão baseadas na tabela acima. 08) Qual a taxa de evasão escolar da primeira série? a) 2,34 % b) 4,35 % c) 1,45 % d) 1,04 % e) 3,23 % 09) Qual é o coeficiente de evasão escolar, com aproximação a milésimos, da terceira série? a) 0,014 b) 0,14 c) 0,14 % d) 0,013 e)1,3% 10) Qual a taxa de evasão escolar da escola ? a) 0,75 % b) 0,71 c) 0,72 % d) 1,2 % e) 0,15 % SÉRIES FEVEREIRO DEZEMBRO 1º 480 475 2º 458 456 3º 436 430 4º 420 420 TOTAL 1794 1781 20 GABARITO 01) 6 classes 02) 47,5 03) 48 04) 8 05) 39,5. 06) 87,5 07) D – C – A – B – E 08) D 09) A 10) C AULA 3 (PARTE 01) MEDIDAS DE POSICIONAMENTO ou POSIÇÃO DEPARTAMENTO DE CIÊNCIAS CONTÁBEIS Disciplina: MÉTODOS QUANTITATIVOS VOLTADOS PARA PESQUISA EM CONTABILIDADE Professor: ALAN CARTER KULLACK 21 MEDIDAS DE POSICIONAMENTO ou POSIÇÃO Definição: As Medidas de posicionamento ou de posição são valores estatísticos que determinam a localização das premissas que estudamos em uma distribuição de frequência, para análise e conclusão de uma pesquisa. Essas medidas são classificadas em: MEDIDAS DE TENDÊNCIA CENTRAL; SEPARATRIZES. MEDIDAS DE TENDÊNCIA CENTRAL Definição: As medidas de tendência central são números que determinam o posicionamento dos valores presentes na distribuição de frequência. Elas são divididas em: Média Aritmética (X); Mediana (Md) Moda (Mo) MÉDIA ARITMÉTICA ( X ) Definição: É a medida que corresponde ao grau de concentração dos valores de uma distribuição. 22 FÓRMULAS: I) X = ∑Xi II) X = ∑Xi.fi N N Ex: Determine a média aritmética da seguinte distribuição numérica: { 3,2,7,5,10,8} SOLUÇÂO: X = ∑Xi , onde: ∑Xi = 35 e N = 6 ,logo fica: N X = 3+2+7+5+10+8 X = 35 X = 5,83 6 6 MEDIANA (Md) Definição: É o valor do elemento do meio de uma distribuição,se “ n” for ímpar, ou é a média dos valores do meio se “n” for par. Ex:1 N =7, onde temos: { 2 ,4, 6, 8, 10, 12, 16} Md = 8 ,pois este número é o valor central ! Ex2: N = 4,onde temos: {2, 4, 6, 8} Md = 5 , pois 4 + 6 = 10 = 5 2 2 Média aritmética para uma distribuição de frequência. 23 FÓRMULA DA MEDIANA: Uma vez descoberta qual a Classe Mediana da Distribuição de Frequências, restará apenas aplicar a Fórmula da Mediana: Md = li + Emd - Facant . h e Emd = N fmd 2 Onde: li = Limite inferior da classe mediana; Emd = Elemento mediano; Facant = Frequência acumulada da classe anterior à classe mediana; fmd = Frequência simples da classe mediana; h = Amplitude do intervalo de classe. Exemplo: Calcular a Md do conjunto abaixo: Xi fmd 10 |--- 20 20 |--- 30 30 |--- 40 40 |--- 50 50 |--- 60 60 |--- 70 70 |--- 80 2 7 11 20 11 7 2 n=60 24 1o Passo) Calculamos o n e h. Neste caso, temos que n=60.e h = 10 2o Passo) Calculamos (n/2), que será: (60/2)=30, logo temos: Emd = 30 3o Passo) Construiremos a coluna da Facant : Xi fmd Facant 10 !--- 20 20 !--- 30 30 !--- 40 40 !--- 50 50 !--- 60 60 !--- 70 70 !--- 80 2 7 11 20 11 7 2 2 9 20 40 51 58 60 n=60 4o Passo) Compararemos os valores da Facant com nosso valor de referência Emd= 30. Xi fmd Facant 10 |--- 20 20 |--- 30 30 |--- 40 40 |--- 50 50 |--- 60 60 |--- 70 70 |--- 80 2 7 11 20 11 7 2 2 9 20 40 51 58 60 3 é maior ou igual a 30 ? NÃO! 9 é maior ou igual a 30 ? NÃO! 20 é maior ou igual a 30 ? NÃO! 40 é maior ou igual a 30 ? SIM! n=60 Encontramos a Classe Mediana: (40 |--- 50). 25 Temos que: Facant = 20 e fmd = 20 5o Passo) Devemos preencher os dados da distribuição na fórmula da Mediana: Md = li + Emd - Facant . h 10 20 203040 Md Md = 45 fmd OBS: Quando existir uma frequência acumuladaexatamente igual a (∑fi) : 2, a mediana será o limite superior da classe correspondente. Ex2: Numa pesquisa realizada por um órgão de fiscalização tributária, foi coletado o seguinte número de reclamações por dia: 1º) Passo: Determinar o elemento mediano(Emd). Temos: Emd = N/2 Emd = 60/2 Emd = 30º elemento. Xi Fi Fac 10 |--- 20 20 |--- 30 30 |--- 40 40 |--- 50 50 |--- 60 60 |--- 70 70 |--- 80 2 7 11 20 11 7 2 2 9 20 40 51 58 60 Classe Anterior! Classe Mediana! n=60 RECLAMAÇÕES Fi(dias) 100|---180 8 180|---260 12 260|---340 16 340|---420 10 420|---500 9 500|---580 5 TOTAL 60 26 2º) Passo: Devemos utilizar a tabela de distribuição de frequência para determinarmos a Facant , para verificar qual classe pertence o Emd. Portanto,temos: 3º) Passo: Utilizamos a fórmula da Mediana: Md = li + Emd - Facant . h; onde: fmd li = 260 Emd = 30 Facant = 20 fmd = 16 h = 80 QUANDO UTILIZAR A MEDIANA ? Quando desejarmos obter o ponto que divide a distribuição em partes iguais; Quando existirem valores extremos que afetem de maneira acentuada a média, Quando a variável em estudo for o salário. Classe Reclamações Fi(dias) Facant 1º 100|---180 8 8 2º 180|---260 12 20 3º 260|---340 16 36 4º 340|---420 10 46 5º 420|---500 9 55 6º 500|--580 5 60 3º classe (36 elementos observados).Portanto, o Emd Є 3º classe,pois compreende os elementos do 21º a 36º + 60 Md = 260 + 30 - 20 .80 Md = 260 + 10 .80 16 16 Md = 260 + 800 Md = 260 + 50 Md = 310 16 Portanto,ocorreu 310 Reclamações ! 27 PROPRIEDADES DA MEDIANA: A Mediana será, assim como a Média, influenciada pelas quatro operações básicas da matemática(Adição,Subtração,Multiplicação e Divisão) 1º) Se somarmos todos os elementos de um conjunto por uma constante, a nova Mediana será (a Mediana anterior) também somada àquela mesma constante; 2º) Se subtrairmos todos os elementos de um conjunto de uma constante, a nova Mediana será (a Mediana anterior) também subtraída daquela mesma constante; 3º) Se multiplicarmos todos os elementos de um conjunto por uma constante, a nova Mediana será (a Mediana anterior) também multiplicada àquela mesma constante; 4º) Se dividirmos todos os elementos de um conjunto por uma constante, a nova Mediana será (a Mediana anterior) também dividida por aquela mesma constante. MODA (Mo) Definição: É a medida que determina o valor de maior frequência na distribuição, isto é, o valor que mais aparece na distribuição. Ex: { 3,6,6,6,7,8,8,9,10}; então Mo = 6 ; pois o nº 6 aparece mais vezes na distribuição. 28 OBS1: Quando dois números aparecem na mesma quantidade em uma distribuição, teremos então uma distribuição BIMODAL. Ex: { 3,6,6,6,7,7,7,2}; temos Mo = 6 e Mo = 7 OBS2: Quando não ocorre nenhuma repetição de número na frequência, teremos uma distribuição AMODAL. Ex: {2,3,4}; logo Mo = ᴓ ( Conjunto Vazio ! ) FÓRMULA DA MODA Mo = li + d1 .h ; onde: d1 + d2 Ex: Utilizando o exercício anterior,temos: Classe Reclamações Fi(dias) 1º 100|---180 8 2º 180|---260 12 3º 260|---340 16 4º 340|---420 10 5º 420|---500 9 6º 500|---580 5 li = limite inferior da classe que contém o valor da moda; d1 = Diferença entre o valor da moda com o valor anterior; d2 = Diferença entre o valor da moda com o valor posterior; h = Amplitude do intervalo de classe. 60 Temos: li = 260 fica: Mo = 260 + 4 . 80 d1 = (16-12) = 4 4 + 6 d2 = (16-10) = 6 Mo = 260 + 32 h = 80 Mo = 292 Portanto, o dia que houve + reclamações, tivemos 292 pessoas reclamando. 29 SEPARATRIZ Definição: São os valores que dividem uma distribuição em partes iguais. A Separatriz se divide em: Quartil; Decil; Percentil. QUARTIL Definição: É quando a distribuição é dividida em 4(quatro) partes iguais e cada parte corresponde a 25% dos valores. Ex: Em uma empresa de contabilidade, temos 16 funcionários,onde os mesmos ocupam o cargo de Auxiliar Administrativo, Técnico Contábil, Analista Financeiro e Serviço Gerais. Com isso, podemos afirmar que 25% dos funcionários ocupam cada cargo mencionado anteriormente. Quartil ! 30 NOTAÇÃO: Por extensão do conceito da mediana, podemos dividir um conjunto em 4 partes iguais. Cada parte representará 25% do conjunto, surgindo assim a designação de quartil. Veja a figura abaixo: Na figura, visualiza-se com facilidade que: 1. O primeiro quartil: o Q1 é um número onde abaixo dele se situam 25% dos casos e acima, é óbvio, se situam 75%. 2. O segundo quartil: o Q2 = Md, pois abaixo ou acima dele se situam 50% dos casos. 3. O terceiro quartil: o Q3 é um número onde abaixo dele se situam 75% dos casos e acima 25%. Para calcular os três quartis: Q1, Q2 e Q3 de dados não agrupados, o método mais prático é o de utilizar o princípio do cálculo da mediana para os três quartis. Na realidade serão calculadas "três medianas" em uma mesma série ordenada. FÓRMULA: Pq = p.n q OBS: A fórmula usada para o Decil e Percentil é a mesma,somente com a referência de decil(10) e Percentil (1oo) no denominador. Temos: Pq = posição do quartil p = posição desejada n= quantidade de elementos q = quartil(4) 31 EXERCÍCIO RESOLVIDO: 01) Calcule Q1, Q2 e Q3 para o seguinte conjunto de valores: A = { 4,1,8,0,11,10,7,8,6,2,9,12 } 1º) Passo: Colocar os valores em ordem (rol),então temos: A ={ 0,1,2,4,6,7,8,8,9,10,11,12 } 2º) Passo: Calcular a posição do 1º Quartil; quartildoposiçãoPQ 1 34 121 1 OBS1: Valor do 1º Quartil esta na posição 3 ! OBS2: O valor do 1º Quadril é 2, isto é, o número que corresponde a 25% no Rol é 2. 3º) Passo: Calcular a posição do 2º Quartil;quartildoposiçãoPQ 2 64 122 2 OBS1: Valor do 2º Quartil esta na posição 6 ! x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11 x12 0 1 2 4 6 7 8 8 9 10 11 12 x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11 x12 0 1 2 4 6 7 8 8 9 10 11 12 Posição 32 OBS2: O número que corresponde a 50% do rol é o valor 7 ! 4º) Passo: Calcular a posição do 3° quartil: quartildoposiçãoPQ 3 94 123 3 OBS1: Valor do 3º Quartil esta na posição 9 ! OBS2: O número que corresponde a 75% do rol é o valor 9 ! DECIL Definição: A distribuição é dividida em 10 partes iguais,sendo que a cada parte corresponde a 10% dos valores. Temos: 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% D1 D2 D3 D4 D5 D6 D7 D8 D9 D10 OBS: D1: É o primeiro decil, corresponde à separação dos primeiros 10 % de elementos da série. D5: É o quinto decil, coincide com a mediana (D5 = Md). D9: É o nono decil, corresponde à separação dos últimos 10% elementos da série. x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11 x12 0 1 2 4 6 7 8 8 9 10 11 12 33 CÁLCULO DE DECIS 1º) Cálculo do Decil para o Rol: Os passos são os mesmos que foram utilizados para o cálculo do quartil para o Rol; Exemplo: Calcular D1 e D8 do conjunto dado: A = { 7,12,15,20,2,4,6,18,10,24 } a) Inicialmente vamos colocar o conjunto em ordem crescente: X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 2 4 6 7 10 12 15 18 20 24 b) Calcular D1 )( 1 10 101 10 1 1 posição nPD OBS: O valor do D1=2 que corresponde a 10% do Rol b) Calculo do D8 )( 8 10 108 10 8 8 posição nPD OBS: O valor do D8=18 que corresponde a 80% do Rol 2º) Cálculo do Decil para tabela sem Intervalo de Classe.: Os procedimentos são os mesmos utilizados para o cálculo dos quartís. Exemplo: A Tabela retrata a quantidade de filhos dos funcionários de uma pequena empresa.Calcule então D3 e D7 desta tabela. 34 filhos f fa 0 18 18 1 35 53 2 46 99 3 28 127 4 25 152 5 10 162 6 5 167 7 3 170 170f a) Cálculo do D3: D3 = 3∑ f = 3.170 = 51ª (posição) 10 10 OBS1: A posição do D3 está na 2° classe (fa 53) OBS2: O valor da variável na segunda classe é 1 filho, que corresponde a 30% da pesquisa. 170-----100% 51------x% b) Cálculo do D7 D7 = 7∑ f = 7.170 = 119ª (posição) 10 10 OBS1: A posição do D7 está na 4° classe (fa 127) OBS2: O valor da variável na quarta classe são 3 filhos, que corresponde a 70% da pesquisa. 170-----100% 119------x% 30% 70% 35 3º) Cálculo do Decil para tabela com Intervalo de Classe Devemos determinar primeiramente a classe que contém o valor do Decil a ser calculado pela seguinte expressão: K∑ f , (Para K = 1,2,3,...,9) 10 Esse termo está localizado numa classe que recebe o nome de classe Decil. Para o cálculo dos decis, utilizamos técnicas semelhantes às do cálculo dos quartis. FÓRMULA DO DECIL K. K∑ f i _ Fant Dx = lDx + 10 . hDK fDK Sendo: lDx = Limite inferior da classe de Decil considerado; Fant = Frequência acumulada da classe anterior à classe de Decil considerado; hDK = Amplitude do intervalo de classe do Decil considerado; fDK = Frequência simples da classe do Decil considerado; hDx = Amplitude do Decil considerado. 36 Exemplo: Calcule os Decis (D1,D2,...),utilizando a tabela abaixo,sendo que a mesma organiza as estaturas de adolescentes, colhidas durante o período em que participaram de um acampamento, durante as férias. Estaturas dos participantes de um acampamento! i Estaturas (cm) Frequência (fi) Frequência acumulada (Fa) 1 120 ├ 128 6 6 2 128 ├ 136 12 18 3 136 ├ 144 16 34 4 144 ├ 152 13 47 5 152 ├ 160 7 54 54 OBS: Calculam-se os decis D1, D2, ...D7, ..., de forma semelhante ao cálculo dos quartis. a) Primeiro decil (K=1): 4,5 10 54 10 1 if (O primeiro Decil pertence à 1º Classe). Logo temos: 1. K∑ f i _ Fant D1 = lD1 + 10 . hDK = 120 + 5,4 –0 .8 = D1= 127,5 cm fDK 6 37 b) Segundo Decil (K=2): 8,10 10 542 10 2 if (O segundo decil pertence à 2º Classe). 2. K∑ f i _ Fant D2 = lD2 + 10 . hDK = 128 + 10,8 – 6 .8 = fDK 12 D2 = 131,2 cm E assim por em diante! PERCENTIL O Percentil (ou Centil) dividirá o conjunto em cem partes iguais. Por analogia, já podemos concluir que a fração do numerador da fórmula para o Primeiro Centil será (n/100)! E para os demais Percentis, teremos que: 2º Parte = P2 = 2n/100 3º Parte = P3 = 3n/100 E assim por em diante. OBS: Percentis de ordem 25, 50 e 75 são denominados quartis e, mais especificamente, primeiro, segundo e terceiro quartis. Os símbolos usuais são Q1, Q2 e Q3 respectivamente. OBS2: Percentis de ordem 10, 20, 30 ... 90 são denominados decis e simbolizados por D1 (primeiro decil), D2 (segundo decil), etc. 38 MEDIDAS DE DISPERSÃO OU DE VARIABILIDADE Definição: São os valores que complementam as informações fornecidas pelas medidas de posição e caracterizam o grau de variação existentes em um conjunto de valores. As Medidas de Dispersão se dividem em : Amplitude Total (AT); Variância (S2); Desvio- padrão (S) Coeficiente de Variação (CV). AMPLITUDE TOTAL (AT) Definição: Refere-se à diferença entre o maior e o menor valor observado na Amostra. FÓRMULA: AT = X máx - X mín Exemplo: A altura de 5 alunos estão entre os seguintes medidas: B = { 160 cm, 170 cm, 180 cm, 190 cm, 200 cm } Então, temos: AT = X máx - X mín AT = 200cm – 160 cm AT = 40 cm Portanto, o intervalo da Amostra corresponde a 40. 39 VARIÂNCIA (S2) Definição: Refere-se a dispersão dos valores em uma distribuição,isto é, determina o quanto essesvalores estão distante da própria média aritmética. FÓRMULA: S2 = ∑ ( x - x )2 ou S2 = ∑x2 – (∑x)2 n - 1 2 n - 1 Onde: x = Valor da Amostra; x = Valor médio da Amostra ; n = Número de elementos observados . Exemplo: Em uma Amostra de 5 residências de uma determinada rua, foram registrados os seguintes números de moradores: Com isso, calcule a variância desta pesquisa. Solução: 1º) x = ∑x 20 = 4 (Valor médio da Amostra); n 5 2º) Usamos a fórmula: S2 = ∑ ( x - x )2 , temos: n - 1 CASA A CASA B CASA C CASA D CASA E Nº MORADOES 3 6 2 7 2 40 S2 = (3 - 4)2 + (6 - 4)2 + (2 – 4)2 + (7 - 4)2 + (2 – 4)2 = 1 + 4 + 4 + 9 + 4 = 5 - 1 4 S2 = 22 S2 = 5,5 4 OBS: O valor da variância é um referencial para analisarmos os elementos presentes na distribuição. DESVIO – PADRÃO (S) Definição: É o valor que representa um intervalo de valores que estão dispostos em um distribuição. FÓRMULA: S = √S2 Utilizando o exercício anterior, temos: S = √ 5,5 S = 2,34 OBS1: O valor do desvio-padrão indica a variabilidade dos valores à volta da Média,em outras palavras,..., “Indica a dispersão dos dados; quanto mais dispersos, maior o desvio padrão”. OBS2: Se o desvio-padrão for igual a zero,isso indica que não há variabilidade, isto é, todos os valores seriam igual a média. OBS3: Existe uma variável que mede a precisão da média,a qual identificamos por: Erro-Padrão da Média FÓRMULA: S(x) = Sx n 41 COEFICIENTE DE VARIAÇÃO (CV) Definição: É o valor que representa o percentual de valores dispersos em uma distribuição. FÓRMULA: CV = S x 100 x onde: CV < 30% Série estatística homogenia e x é representativa. CV ≥ 30% série estatística heterogênea e Md é representativa. Ex: Seja o Desvio – padrão (S) no valor de 215 e o ponto médio ( x ) igual a 300, então temos: Solução: Cv = 215. 100 = 71,67% 300 Portanto, a Série Estatística é heterogênea. OBS: O coeficiente de variação é útil para compararmos a variabilidade (dispersão) de dois conjuntos de dados de ordem de grandezas Diferentes. MEDIDAS DE ASSIMETRIA (As) Definição: É o coeficiente assimétrico que demonstra o posicionamento dos valores na distribuição. Ex: 2 | 1 | 3 | | 8 | 10 | 4 | 7 | 8 | 9 | 6| ESQUERDA DIREITA 42 OBS: Os valores concentrados à direta da distribuição, são os números Maiores. Os valores concentrados à esquerda da distribuição, são os números Menores. FÓRMULA: As = x - Mo ou As = 3 ( x – Md) S S Onde: As = Medida de Assimetria; x = Média; Mo = Moda; S = Desvio – padrão; Md = Mediana. OBS2: Se As = 0, isto implica que a distribuição será simétrica !!! MEDIDAS DE ACHATAMENTO OU CURTOSE (K) Definição: É a medida que proporciona o grau de achatamento de uma distribuição de valores. Essas Medidas se dividem em 3 situações: Distribuição de Frequência Mesocúrticas; Distribuição de Frequência Platicúrticas; Distribuição de Frequência Leptocúrticas 43 GRAU DE CURTOSE Para calcular a medida de achatamento utilizamos o grau de curtose, através do coeficiente da própria curtose: FÓRMULA: K = Q3 - Q1 2(P90 - P10) Onde: Q3 = 3º Quartil Q1 = 1º Quartil P90 = 90º Percentil P10 = 10º Percentil Exemplo: 01) ( AFRF-2002.1): Em um ensaio para o estudo da distribuição de um atributo financeiro (X), foram examinados 200 itens de natureza contábil do balanço de uma empresa. Esse exercício produziu a tabela de frequência abaixo. A coluna Classes representa intervalos de valores de X em reais e a coluna P representa a frequência relativa acumulada. Não existem observações coincidentes com os extremos das classes. Leptocúrticas Mesocúrticas Platicúrticas 44 Classes P(%) 70 |– 90 90 |– 110 110 |– 130 130 |– 150 150|– 170 170 |– 190 190 |- 210 5 15 40 70 85 95 100 Entende-se por curtose de uma distribuição seu grau de achatamento em geral medido em relação à distribuição normal. Uma medida de curtose é dada pelo quociente k = Q / (P90-P10), onde Q é a metade da distância interquartílica e P90 e P10 representam os percentis de 90% e 10%, respectivamente. Assinale a opção que dá o valor da curtose k para a distribuição de X. a) 0,263 b) 0,250 c) 0,300 d) 0,242 e) 0,000 Solução: No enunciado, o elaborador tentou complicar um pouco a compreensão da fórmula do índice percentílico de Curtose. Além disso, usou Percentis em lugar de Decis. Todavia, sabemos perfeitamente que Décimo Percentil (P10) é o mesmo que Primeiro Decil (D1), e que Nonagésimo Percentil (P90) é a mesma coisa que Nono Decil (D9). Daí, tudo esclarecido. Usaremos, de fato, para encontrar esta resposta, o Índice Percentílico de Curtose, exatamente da forma como o conhecemos: K = Q3 - Q1 2(P90 - P10) 45 Aproveitaremos que todo esse trabalho de encontrar os Quartis (Q1 e Q3) e os Decis (D1 e D9) já foram feitos para este mesmo enunciado, e reproduziremos aqui a resolução desta questão. Obviamente que todos perceberam que havia um trabalho preliminar a ser realizado, que era exatamente o de chegarmos à coluna da frequência absoluta simples – fi. Como já foi falado exaustivamente sobre este procedimento de usar o Caminho das Pedras para chegar às frequências desejadas, expomos a seguir o resultado destas operações e, finalmente, a coluna da fi. Classes Fac Fi fi 70 – 90 5%5% 10 90 – 110 15% 10% 20 110 – 130 40% 25% 50 130 – 150 70% 30% 60 150 – 170 85% 15% 30 170 – 190 95% 10% 20 190 – 210 100% 5% 10 Cálculo do Primeiro Quartil – Q1: 1º Passo: Encontraremos n e calcularemos (n/4) 46 Xi fi 70 !--- 90 90 !--- 110 110 !--- 130 130 !--- 150 150 !--- 170 170 !--- 190 190 !--- 210 10 20 50 60 30 20 10 n=200 Temos então: n=200, portanto, (n/4)=50 2º Passo: Construiremos o Fac ( Frequência Acumulada Crescente) Xi fi fac 70 !--- 90 90 !--- 110 110 !--- 130 130 !--- 150 150 !--- 170 170 !--- 190 190 !--- 210 10 20 50 60 30 20 10 10 30 80 140 170 190 200 n=200 47 3º Passo: Comparamos os valores de Fac com o valor de n/4 Xi fi fac 70 !--- 90 90 !--- 110 110 !--- 130 130 !--- 150 150 !--- 170 170 !--- 190 190 !--- 210 10 20 50 60 30 20 10 10 30 80 140 170 190 200 10 é maior ou igual a 50? NÃO! 30 é maior ou igual a 50? NÃO! 80 é maior ou igual a 50? SIM! n=200 Como a resposta foi afirmativa na terceira fac, procuramos a classe correspondente (110 !--- 130) e dizemos que esta será nossa Classe do Primeiro Quartil. 4º) Passo: Aplicaremos a fórmula do Primeiro Quartil,tomando como referência a Classe do Q1. Portanto, temos: 20 50 30501101 Q E: Q1=118,0 hfi facn lQ ANT 4inf1 48 Cálculo do Terceiro Quartil: Q3 1º Passo: Devemos calcular 3n/4 Xi fi 70 !--- 90 90 !--- 110 110 !--- 130 130 !--- 150 150 !--- 170 170 !--- 190 190 !--- 210 10 20 50 60 30 20 10 n=200 Temos então: n=200, portanto, (3n/4)=150 2º) Passo: Devemos calcular o Fac Xi fi fac 70 !--- 90 90 !--- 110 110 !--- 130 130 !--- 150 150 !--- 170 170 !--- 190 190 !--- 210 10 20 50 60 30 20 10 10 30 80 140 170 190 200 n=200 49 3º) Passo: Comparamos os valores da Fac com os valores de 3n/4 Xi fi fac 70 !--- 90 90 !--- 110 110 !--- 130 130 !--- 150 150 !--- 170 170 !--- 190 190 !--- 210 10 20 50 60 30 20 10 10 30 80 140 170 190 200 10 é maior ou igual a 150? NÃO! 30 é maior ou igual a 150? NÃO! 80 é maior ou igual a 150? NÃO! 140 é maior ou igual a 150? NÃO! 170 é maior ou igual a 150? SIM! n=200 Como a resposta SIM surgiu na fac da quinta classe (150 !--- 170), diremos que esta será nossa Classe do Terceiro Quartil. 4º) Passo: Usaremos a fórmula do Q3,com os dados da Classe do Q3. hfi facn lQ ANT 4 3 inf3 20 30 1401501503 Q Logo, temos: Q3=156,6 50 Cálculo do Primeiro Decil (D1) 1º Passo: Devemos calcular n/10 Xi fi 70 !--- 90 90 !--- 110 110 !--- 130 130 !--- 150 150 !--- 170 170 !--- 190 190 !--- 210 10 20 50 60 30 20 10 n=200 Temos: n=200 e, portanto, (n/10)=20 2º) Passo: Devemos calcular o Fac: Xi fi Fac 70 !--- 90 90 !--- 110 110 !--- 130 130 !--- 150 150 !--- 170 170 !--- 190 190 !--- 210 10 20 50 60 30 20 10 10 30 80 140 170 190 200 n=200 51 3º) Passo: Comparamos os valores do Fac com os valores de n/10. Xi fi fac 70 !--- 90 90 !--- 110 110 !--- 130 130 !--- 150 150 !--- 170 170 !--- 190 190 !--- 210 10 20 50 60 30 20 10 10 30 80 140 170 190 200 10 é maior ou igual a 20? NÃO! 30 é maior ou igual a 20? SIM! n=200 Portanto, que a classe correspondente (90 !--- 110) será nossa Classe do Primeiro Decil! 4º) Passo: Usaremos a fórmula do Primeiro Decil hfi facn lD ANT 10inf1 20 20 1020901 D E: D1=100,0 Calculo do Nono Decil (D9): 1º Passo) Devemos calcular (9n/10): 52 Xi fi 70 !--- 90 90 !--- 110 110 !--- 130 130 !--- 150 150 !--- 170 170 !--- 190 190 !--- 210 10 20 50 60 30 20 10 n=200 Portanto,temos: n=200 e (9n/10)=180 2º) Passo: Devemos calcular o Fac Xi fi Fac 70 !--- 90 90 !--- 110 110 !--- 130 130 !--- 150 150 !--- 170 170 !--- 190 190 !--- 210 10 20 50 60 30 20 10 10 30 80 140 170 190 200 n=200 53 3º) Passo: Comparamos os valores do Fac com os valores do 9n/10. Xi fi fac 70 !--- 90 90 !--- 110 110 !--- 130 130 !--- 150 150 !--- 170 170 !--- 190 190 !--- 210 10 20 50 60 30 20 10 10 30 80 140 170 190 200 10 é maior ou igual a 180? NÃO! 30 é maior ou igual a 180? NÃO! 80 é maior ou igual a 180? NÃO! 140 é maior ou igual a 180? NÃO! 170 é maior ou igual a 180? NÃO! 190 é maior ou igual a 180? SIM! n=200 Portanto, que a classe correspondente (170 !--- 190) será nossa Classe do Nono Decil. 4º) Passo: Usaremos a fórmula do Nono Decil: hfi facn lD ANT 10 9 inf9 20 20 1701801709 D =: D9 = 80 Utilizando a fórmula de Curtose,temos: K = Q3 - Q1 K = (156,6 – 118) K = 0,242 2(P90 - P10) 2(180 – 100) Portanto: Letra D 54 EXERCÍCIOS DE FIXAÇÃO 01) Determinar a moda dos seguintes conjuntos: a) 1, 6, 9, 3, 2, 7, 4 e 11 b) 6, 5, 5, 7, 5, 6, 5, 6, 3, 4 e 5 c) 8, 4, 4, 4, 4, 6, 9, 10, 10, 15, 10, 16 e 10 d) 23, 28, 35, 17, 28, 35, 18, 18, 17, 18, 18, 18, 28, 28 e 18 02) Determinar a mediana dos seguintes conjuntos: a) 9; 14 ; 2 ; 8; 7; 14; 3; 21; 1 b) 0,02; 0,25; 0,47; 0,01; -0,30; -0.5 c) 1/2 ; 3/4 ; 4/7 ; 5/4 ; -2/3 ; -4/5 ; -1/5 ; 3/8 03) Para os conjuntos abaixo, determinar com aproximação centesimal, as seguintes medidas: A= { 0,04 ; 0,18 ; 0,45 ; 1,29 ; 2.35} e B = {-7/4 ; -1/3 ; 3/5 ; 7/20 ; 1 4/3 } a) A amplitude (AT) b) A variância (S2) c) O desvio padrão (S) d) O coeficiente de variação. (CV) 04) Dados os seguintes conjuntos de valores: A = { 1, 3, 7, 9, 10 } B = {20, 60, 140 ,180, 200} C = {10, 50, 130, 170 ,190} Calculando a média e o desvio padrão do conjunto em A, determinar, através das propriedades, a média e o desvio padrão dos conjuntos em B e C. 55 Gabarito: 01 a) Amodal b) 5 c) 4 e 10 d) 18 02 a) 8 b) 0,02 c) 7/16 03 Conjunto A AT = 2,31 S2 = 0,74 S = 0,86 CV = 99,90% Conjunto BAT = 37/12 = 3,08 S2 = 1,03 S = 1,02 CV = 508,01% 04 Observe que o conjunto em B é igual ao conjunto em A multiplicado por 20 e o conjunto em C é igual ao conjunto em A multiplicado por 20 e subtraído de 10 unidades.Logo,temos: Conjunto A: X = 6 S = 3,87 Conjunto B: X = 120 S = 77,4 Conjunto C: X = 110 S = 67,4 AULA 3 (PARTE 02) AMOSTRAGEM DEPARTAMENTO DE CIÊNCIAS CONTÁBEIS Disciplina: MÉTODOS QUANTITATIVOS VOLTADOS PARA PESQUISA EM CONTABILIDADE Professor: ALAN CARTER KULLACK 56 AMOSTRAGEM Definição: É a técnica de seleção de uma Amostra, que possibilita o estudo das características de uma população. Para compreendermos melhor o princípio da Amostragem, devemos estudar a distribuição de valores. Esta distribuição esta dividida em 2 partes fundamentais para estatística,as quais são: Distribuição Normal; Distribuição Amostral. DISTRIBUIÇÃO NORMAL Definição: É uma distribuição contínua,a qual possui dois parâmetros estatísticos fundamentais: 1º) Média; (Parâmetro de localização) 2º) Desvio-padrão (Parâmetro de dispersão) OBS1: A distribuição normal é uma distribuição de probabilidade ! OBS2: Os resultados da probabilidade(posicionamento dos valores),são obtidos por meio de uma tabela de escore,denominada de Tabela Z. OBS3: A curva da distribuição normal é conhecida como a Curva de Gauss. 57 Veja: Curva de Gauss 50% 50% Md = X = Mo FÓRMULA DA DISTRIBUIÇÃO NORMAL Z = X - µ onde: σ CARACTERÍSTICAS DA CURVA DE GAUSS Sua Média, Mediana e Moda são iguais. Tem forma de Sino e é simétrica em torno da média. A área total sob a curva é de 100% Fonte: <http://www.tomcoelho.com.br/index.aspx/s/Artigos_Exibir/221/ O_mal_da_mediocridade> Z = Valor da tabela Z X = Valor aleatório µ = Média aritmética σ = Desvio-padrão 58 TABELA DE DISTRIBUIÇÃO NORMAL VALORES DE Z 59 OBS1: Desde que a distribuição normal é simétrica, para calcular a área entre −∞ e z das curvas probabilísticas,devemos somar o valor de 0,5 aos valores da tabela. OBS2: No caso de valores acima de 3,9 considera-se que o valor é praticamente 1 pelo que não esta tabelado. ALGUNS EXEMPLOS DE USO DA TABELA 1º) Exemplo: Probabilidade de Z ≤ 1,53: Na interseção da linha 1,5 com a coluna 0,03 há o valor 0,4370. Precisa-se somar 0,5 porque, conforme visto, a tabela dá valores a partir de zero. Assim, P( Z ≤ 1,53 ) ≈ 0,4370 + 0,5 = 0,9370. 2º) Exemplo: Probabilidade de Z ≤ −1,53: A simetria da curva permite deduzir a fórmula para valores negativos de z: P( Z ≤ v ) = 1 − P( Z ≤ |v| ) para v < 0 Portanto, P( Z ≤ −1,53 ) ≈ 1 − 0,9370 = 0,0630. 3º) Exemplo: Probabilidade de −1 ≤ Z ≤ 0,5: A ideia gráfica permite concluir que é igual à diferença entre os valores calculados para cada extremo. P( Z ≤ 0,5 ) = 0,5 + 0,1915 = 0,6915. P( Z ≤ −1 ) = 1 − P( Z ≤ 1 ) = 1 − (0,5 + 0,3413) = 0,1587. Portanto o resultado é dado por P( −1 ≤ Z ≤ 0,5 ) = 0,6915 − 0,1587 = 0,5328. 60 Ex: Um estudo dos aumentos percentuais dos preços, no atacado de produ- tos industrializados, mostrou que ha distribuição normal com media de 50% e desvio- padrão de 10%. Qual a porcentagem dos artigos que: a) Sofreram aumentos superiores a 75%? Resposta: (0,62%) b) Sofreram aumentos entre 30% e 80%? Resposta: (97,59%) Solução: Dados: µ = 50% (média) σ = 10% (Desvio-padrão) X = modificações percentuais de preços (valor aleatório) a) Superiores a 75% P (x>75) = P(z > 2,5) Para: x= 75, Temos: z: x - µ = z: 75 - 50 = z: 25 = 2,5 σ 10 10 Portanto: P(z > 2,5) = 0,5- 0,4938 = 0,0062 ou 0,62 % b) Entre 30% e 80% P ( 30 < x < 80) = P(-2 < z < 3) Para: x= 30 , Temos: z: x - µ = z: 30 - 50 = z: - 20 = -2 σ 10 10 Para: x= 80, Temos: z: x - µ = z: 80 - 50 = z: 30 = 3 σ 10 10 Portanto: P(-2 < z < 3) = - 0,4772 –0,4987 = - 0,9759 ou 97,59% 61 Portanto,a representação da curva Gaussiana fica: 0,62% 12% 25% 50% 97,59% OBS1: Os valores 0,4772 foi retirado da Tabela Z; para Z = 2 ! OBS2: O valor negativo de – 0,4772 e -0,9759 devem ser ignorados! DISTRIBUIÇÃO AMOSTRAL Definição: É a distribuição de probabilidade de uma medida estatística, baseada em uma amostra aleatória, a qual é determinada o posicionamento dos valores dentro dos parâmetros da média e do Desvio-padrão. OBS: Para estudarmos uma população, necessitamos de uma amostra, a qual necessita de uma fundamentação específica para validar os seus dados. Portanto essa validação é reconhecida por Inferências Estatísticas. 62 INFERÊNCIAS ESTATÍSTICAS: Definição: É o processo estatístico que se refere-se à possibilidade de obtermos informações sobre a população por meio de resultados amostrais. As Inferências estatísticas são divididas em 2 áreas: Os Testes de Hipótese (Veremos mais adiante !) Estimação de Parâmetros. Estimação de Parâmetros: É o valor retirado diretamente da Amostra para medir e comprovar a eficácia dos possíveis resultados da pesquisa. OBS1: Os parâmetros utilizados na População e na Amostra,são: População: µ (Média) Amostra: X = Média ρ 2 (Variância) S2 = Variância OBS2: A variância Amostral das médias é igual à razão da variância populacional pelo número de elementos da Amostra. Então temos: S2x = ρ 2 n Nesta fórmula a variância amostral é menor que a variância populacional! S2 < ρ 2 63 DICA: Na página 106 do livro a variância populacional esta sendo representada pela letra σ, para não confundirmos com Desvio-padrão,o qual utiliza a mesma letra Sigma,trocamos esta pela letra grega (Rho) = ρ. Então: σ2 = ρ2 (Variância) TIPOS DE AMOSTRAGEM Temos 2 tipos de amostragem com as suas características bem definidas, as quais se apresentam como: Amostragem Probabilística; Amostragem Não probabilística; 1º) AMOSTRAGEM PROBABILÍSTICA: Todos os elementos da população tem a mesma chance de fazer parte da Amostra. Ela se divide em: a) Aleatória Simples: Escolhe os elementos sem utilizar nenhum critério. b) Sistemática: Escolhemos os elementos por processo de repetição. c) Proporcional: Escolhemos os elementos por proporção pré estabelecida. 64 2º) AMOSTRAGEM NÃO PROBABILÍSTICA Os elementos da população são escolhidos de forma aleatória. Ela se divide em: a) Por conveniência: Escolhe os elementos, conforme a distribuição mais favorável e facilitada. b) Intencional: Escolhemos os elementos, conforme a sua vontade. c) Por Tráfego: Escolhemos os seus elementos,conforme a concentração, volume ou tráfego contidos na população. d) Por Quotas: Escolhemos os seus elementos, seguindo um critério específico. CÁLCULO DO TAMANHO DA AMOSTRA Para determinarmos um estudo estatístico por meio de uma amostra, devemos ter uma quantidade mínima de elementos que possibilite realizar uma cálculo estatístico,o qual dará uma perspectiva confiável ao resultado apresentado do que queremos pesquisar.Para isso,temos que utilizar a seguinte fórmula: n = Z2.p.q e2 Onde: n = Número de indivíduos da Amostra; Z = Nível de confiança Z; p = proporção favorável; q = proporção desfavorável; e = Erro máximo provável (Erro-padrão) α = Limite de confiança 65 OBS: Quando não for mencionado em um exercício o valor da proporção,subentendemos que elas serão iguais,isto é, 50% para cada lado,logo podemos concluir que p = q, e que p e q = R,onde temos: 2 n = Z2.R2 n = Z.R e2 e OBS: Para aplicarmos esta fórmula,devemos seguir o nível de limite de confiança para o tamanho de cada Amostra. Estes limites estão expressos na tabela à seguir: OBS: Com as informações sobre o tipo de amostragem e o tamanho da amostra,podemos fornecer informações extremamente relevantes para a parte administrativa de uma empresa. Exemplo: 01) Uma assistente social, deseja saber o tamanho da amostra necessário para determinar a proporção da população atendida por uma Unidade de Saúde,a qual pertence ao Município de São José dos Pinhais, região metropolitana de Curitiba - Pr. Não foi feito um levantamento prévio da proporção amostral e, portanto, seu valor é desconhecido. Ela quer ter 90% de confiança e estima um o erro máximo de 5% . Quantas pessoas necessitam ser entrevistadas? Limite de Confiança Valor Z 80% 1,28 90% 1,65 95% 1,96 99% 2,58 66 SOLUÇÃO: Dados: e= 5% = 0,05 (Erro máximo) α = 90% (Limite de Confiança) Z = 1,65 (Nível de Confiança,verificar tabela !) p = q =R = 50% = 0,5 ( Proporção favorável e desfavorável) n = ? (Nº de Indivíduos da amostra) Temos: 2 2 n = Z.R n = 1,65. 0,5 (16,5)2 = 272,25 e 0,05 n = 272 pessoas Portanto, precisamos uma Amostra de 272 pessoas para determinar a proporção da população atendida na Unidade de Saúde. De São José dos Pinhais. OBS: Caso a população seja finita,isto é, N< 100.000 elementos, devemos utilizar a seguinte fórmula: n = Z2.p.q.N Com N = População ! (N-1).e2 + Z2.p.q 67 EXERCÍCIOS DE FIXAÇÃO 01) Analisando as curvas abaixo marque a resposta correta. (I) (II) (III) a) a curva I é simétrica - x > med > mo; b) a curva II é assimétrica positiva - mo > > x 2 ; c) a curva I é simétrica x = med = mo ; d) a curva III é simétrica positiva x = med = mo ; e) a curva II e III são aasimétricas: x = med = mo 02) A vida média útil de um aquecedor elétrico é de 1,5 anos, com um desvio – padrão de 0,3 anos. Se são vendidos 12.000 unidades por uma empresa fabricante ao mês, quantos aquecedores necessitarão de conserto antes que expire o período de um ano de garantia ? a) 510 aquecedores b) 530 aquecedores c) 550 aquecedores d) 570 aquecedores e) 590 aquecedores 68 03) Um processo industrial produz canos com diâmetro médio de 2 polegadas e com desvio-padrão de 0,01 polegada. Os canos com diâmetro de mais de 0,03 polegadas acima da média, são considerados defeituosos. Em uma produção de 10.000 canos, quantos canos estariam com defeito ? a) 20 b) 27 c) 32 d) 36 e) 44 04) Um pesquisador deseja estimar a proporção de ratos nos quais se desenvolve um certo tipo de tumor quando submetidos a radiação. Ele deseja que sua estimativa não se desvie da proporção verdadeira por mais de 0,02 com uma probabilidade de pelo menos 90%.Portanto,quantos animais ele precisa examinar para satisfazer essa exigência? a) 1285 b) 1302 c) 1447 d) 1528 e) 1681 05) Antes de uma eleição, um determinado partido está interessado em estimar a proporção de eleitores favoráveis a seu candidato. Determine o tamanho de amostra necessário para que o erro cometido na estimação seja de, no máximo 0,01, com probabilidade de 80%. a) 3942 eleitores b) 4096 eleitores c) 4595 eleitores d) 5029 eleitores e) N.D.A 69 Gabarito: 01 - C 02 - D 03 - B 04 - E 05 - B AULA 4 INTERVALO DE CONFIANÇA DEPARTAMENTO DE CIÊNCIAS CONTÁBEIS Disciplina: MÉTODOS QUANTITATIVOS VOLTADOS PARA PESQUISA EM CONTABILIDADE Professor: ALAN CARTER KULLACK 70 INTERVALO DE CONFIANÇA (IC) Definição1: É um intervalo (espaço) estimado de um parâmetro estatístico,o qual possibilita o cálculo deste parâmetro estatístico desconhecido. Definição2: É quando fazemos uma estimativa de um intervalo de valores possíveis, no qual se admite esteja o parâmetro populacional. Em outras palavras: “O intervalo de confiança é um intervalo matemático que mede a confiabilidade de uma amostra retirada de uma determinada população.” Profº Alan Carter Kullack
Compartilhar