Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 UNIVERSIDADE ESTADUAL DO PARANÁ – UNESPAR Professor Mestre Maurício Barbosa mauricioskai@gmail.com 1-INTRODUÇÃO 1.1-DEFINIÇÃO: Estatística é uma parte da matemática aplicada que fornece métodos para a coleta, a organização, a descrição, a análise e a interpretação de dados experimentais, visando a tomada de decisões. 1.1-POPULAÇÃO: O termo população se refere a todos os indivíduos ou a todos objetos do grupo com mesmas características. Exemplos: a totalidade dos habitantes de uma determinada região, população de parafusos, livros, árvores, etc. 1.3-AMOSTRA: É um subconjunto de uma população. Este subconjunto pode ou não ser representativo da população. 1.4-ESTATÍSTICAS: São medidas obtidas através de dados coletados em amostras. 1.5-PARÂMETROS: São medidas populacionais que podem ser obtidas por um censo ou estimadas por meios de dados amostrais. 1.6-ESTATÍSTICA DESCRITIVA: Parte da estatística que procura somente descrever e analisar um certo grupo, sem tirar quaisquer conclusões ou inferências sobre um grupo maior. 1.7-ESTATÍSTICA INDUTIVA: Parte da estatística que utiliza métodos científicos para fazer afirmações e tirar conclusões sobre características ou parâmetros de uma população, baseando-se em resultados de uma amostra. 1.8-VARIÁVEIS: É o que esta sendo analisado no interior de uma população e que possibilita a geração de dados distintos ao longo dessa mesma população. Podem ser: 2 1.8.1-QUALITATIVAS: Quando seus valores forem expressos por atributos(não numéricos). Podem ser: a) NOMINAIS (sexo, estado civil, ...) b) ORDINAIS (Cultura: ensino fundamental, ensino médio,...) 1.8.2-QUANTITATIVAS: São as inerentemente numéricas. Podem ser: a) CONTÍNUAS: Quando podem assumir qualquer valor em certo intervalo da reta real. Exemplos( peso, altura,...) b) DISCRETAS: Quando assumem valores pontuais, geralmente de números inteiros. ( número de filhos, números de erros em um livro,...). 2-ESTATÍSTICA DESCRITIVA 2.1-COLETA DE DADOS: Após a definição do problema a ser estudado e o estabelecimento do planejamento da pesquisa (forma pelo qual os dados serão coletados; cronograma das atividades; custos envolvidos, exames das informações disponíveis, delineamento da amostra) o passo seguinte é a coleta de dados, que consiste na busca ou compilação dos dados das variáveis, componentes do fenômeno a ser estudado. Podem ser classificadas como: 2.1.1-Quanto ao tempo: a) Contínua: quando realizada permanentemente.(nascimento, casamentos, óbitos, etc). b) Periódica: quando é feita em intervalos de tempo.(censo) c) Ocasional: quando efetuada sem época preestabelecida. (epidemias, catástrofe). COLETA DE DADOS CRÍTICA DOS DADOS APRESENTAÇÃO DOS DADOS TABELAS GRÁFICOS ANÁLISE E CONCLUSÕES 3 2.1.2-Quanto à forma: a) Direta: quando os dados são obtidos na fonte originária.(nascimento registrados nos cartórios, opiniões obtidas em pesquisa de opinião pública, vendas registradas em notas da empresa, etc.) b) Indireta: quando os dados obtidos provêm da coleta direta.(pesquisa agrícola obtida em uma secretaria específica do governo ou no IBGE, etc.) 2.2-CRÍTICA DOS DADOS: Objetivando a eliminação de erros capazes de provocar futuros enganos de apresentação e análise, procede-se a uma revisão crítica dos dados, suprimindo os valores estranhos ao levantamento. Podem ser: 2.2.1-Crítica Externa: quando visa às causas dos erros por parte do informante, tais como a distração ou má interpretação das perguntas de um questionário. 2.2.2-Crítica Interna: quando se observa o material constituído pelos dados coletados. Verificação de erros na digitação dos dados,cópias. 2.3-APRESENTAÇÃO DOS DADOS: Após a crítica, convém organizarmos os dados de maneira prática e racional, para o melhor entendimento do fenômeno que se está estudando. Sua apresentação pode ocorrer por meios de tabelas ou gráficos. 2.3.1-TABELA: é uma matriz onde se registra os dados de um evento. É composta em: a) Cabeçalho: é a apresentação do que a tabela está procurando representar. Deve conter o suficiente para que sejam respondidas as seguintes questões: O quê? Onde? Quando? b) Corpo: é à parte da tabela composta por colunas e sub-colunas, dentro das quais são colocados os dados apurados. c) Rodapé: parte inferior, onde se registra a fonte dos dados. 4 EXEMPLOS: 2.3.1.2-TABELA SIMPLES: É a representação de valores de uma única variável. Vendas de imóveis realizadas pelas maiores imobiliárias da cidade de São Paulo em 2003 IMOBILIÁRIA UNIDADES VENDIDAS Altaplan Lopes Nosso Teto Procasa 5186 4273 4992 3426 TOTAL 17877 Fonte: Setor Imobiliário de São Paulo 2.3.1.2-TABELA DE DUPLA ENTRADA OU DE CONTIGÊNCIA: é a representação, em uma única tabela, de valores de mais de uma variável, isto é, a conjunção de duas tabelas. Taxa de desemprego grande São Paulo –2002/2007 MÊS/ANO PORCENTAGEM (%) DEZEMBRO MASCULINO FEMININO 2002 2003 2004 2005 2006 2007 13,0 12,4 10,7 12,0 12,6 14,4 16,3 14,6 15,3 15,1 16,4 19,4 TOTAL 75,1 97,1 Fonte: DIEESE *DIEESE: Departamento Intersindical de Estatística e Estudos Sócio-Econômicos Instituição de pesquisa, análise e assessoria, sem fins lucrativos, mantida por sindicatos, federações, confederações e centrais de trabalhadores 5 2.3.1.3-DISTRIBUIÇÃO DE FREQÜÊNCIA: É uma série estatística onde os dados encontram-se dispostos em classes ou categorias. Média geral dos alunos segundo o sexo colégio São Paulo – 1º bimestre - 2008 SEXO MÉDIAS MASCULINO FEMININO. TOTAL 40|--- 50 1 0 1 50|--- 60 3 0 3 60|--- 70 14 6 20 70|--- 80 11 16 27 80|--- 90 2 8 10 90|---100 0 4 4 TOTAL 31 34 65 Fonte: Colégio São Paulo 2.3.2-GRÁFICOS: A representação gráfica dos dados de um fenômeno tem por finalidade dar uma idéia, a mais imediata possível, dos resultados obtidos, permitindo chegar-se a conclusões sobre a evolução do fenômeno ou sobre como se relacionam os valores da série. Não há apenas uma maneira de representar graficamente uma série estatística. A escolha do gráfico mais apropriado ficará a critério do analista. 2.3.2.1-CARACTERÍSTICAS DO GRÁFICO SIMPLICIDADE CLAREZA VERACIDADE 2.3.2.2-ELEMENTOS E NORMAS Título: acima do gráfico, completo, claro e conciso; Fonte: abaixo do gráfico; Moldura: para dar efeito estético ao gráfico; Legenda: não deve prejudicar a leitura do gráfico; Desenho: no desenho incluem-se apenas as coordenadas necessárias para guiar a leitura do gráfico; Escala: a escala horizontal deve ser lida da esquerda para a direita e a vertical de baixo para cima; 6 Cor: o colorido não deve causar ilusões de ótica. Forma: a altura do gráfico deve ter, aproximadamente, 75 % da largura, de modo que, incluindo o título e o rodapé, a moldura do gráfico assuma mais ou menos , a forma quadrada. 2.3.2.3-TIPOS DE GRÁFICOS Diagramas: construídos com o auxílio de figuras geométricas em duas dimensões. Cartogramas: é a representação sobre cartas geográficas. Esteriogramas:gráficos representados por meio de volumes. Pictogramas: é a representação gráfica através de figuras. Os gráficos mais utilizados na Estatística são os diagramas, dentre os quais destacam-se: A) Gráficos em Colunas ou em Barras: é a representação de uma série por meio de retângulos, dispostos verticalmente ( em colunas ) ou horizontalmente ( em barras); B) Gráficos de Linhas: é a representação de uma série por meio de uma linha poligonal; C) Gráfico de Setores: é constituído com base em um círculo, e é empregado sempre que se deseja ressaltar a participação do dado no total; D) Gráficos Comparativos: é a representação de mais de uma variável em um mesmo gráfico; GRÁFICOS DE DISTRIBUIÇÃO DE FREQÜÊNCIA i) Histogramas ii) Polígonos de Freqüência 7 EXEMPLOS: Iremos representar exemplos de tabelas e os gráficos correspondentes. 2.3.2.4-GRÁFICOS DE COLUNAS Importação de Petróleo – Brasil - 2006 Meses Volume (1000 m 3 ) Janeiro Fevereiro Março Abril Maio Junho Julho Agosto Setembro Outubro Novembro Dezembro 1291 1837 2089 1717 2160 2484 1941 2754 2146 1701 1481 1494 Fonte: Secretaria de Comércio Exterior (SECEX). Nota: (m3) = metro cúbico. Os dados relativos à importação de petróleo incluem óleo cru e condensado 0 500 1000 1500 2000 2500 3000 JAN FEV MAR ABR MAI JUN JUL AGO SET OUT NOV DEZ Vo lu m e (1 00 0 m 3) Meses Importação de Petróleo - Brasil - 2006 Fonte: Secretaria de Comércio Exterior (SECEX). Nota: (m3) = metro cúbico. Os dados relativos à importação de petróleo incluem óleo cru e condensado 8 2.3.2.5-GRÁFICO DE BARRAS Brasileiros residentes no exterior – 2004 Pais Nº de Brasileiros África Alemanha Argentina Espanha Estados Unidos Itália Japão Paraguai 3.126 36.096 15.404 10.361 598.526 40.118 201.139 460.846 Fonte:Relatório da Divisão de Assistência Consular do Ministério de Relações Exteriores 0 100 200 300 400 500 600 700 Áfr ica Aleman ha Argentina Espanha Estados Unidos Itália Japão Paraguai Nº de Brasileiros (1000) P a ís es Brasileiros residentes no exterior - 2004 9 2.3.2.6-GRÁFICO DE LINHAS TAXA DE CRESCIMENTO DA POPULAÇÃO, POR DÉCADA BRASIL – ANOS 40 / ANOS 90 ANOS TAXA DE CRESCIMENTO (%) 40 50 60 70 80 90 * 26,2 34,9 32,9 27,7 22,0 14,5 Fonte: revista Isto É, julho/98 Nota: * Projeção. TAXA DE CRESCIMENTO DA POPULAÇÃO, POR DÉCADA - BRASIL - ANOS 40/ ANOS 90 0 5 10 15 20 25 30 35 40 40 50 60 70 80 90* ANOS P E R C EN T U A L Fonte: revista Isto É, julho/98 Nota: * Projeção. 10 2.3.2.7-GRÁFICO DE SETORES Fonte: AUM-FECEA 2.3.2.8-GRÁFICOS COMPARATIVOS Migração rural, em milhões, por década, em alguns Estados Brasileiros - Anos 70 e 80 ESTADOS ANOS 70 80 BAHIA RIO GRANDE DO SUL PARANÁ MINAS GERAIS 0,7 1,4 2,4 2,4 1,0 1,1 1,5 1,6 Fonte: revista Isto É, julho/98 Primeiro atendimento que os moradores de Apucarana procuram em caso de doenças - 2000 60,33% 16,49% 10,51% 4,17% 8,51% Posto de Saúde/PAM Médico ou Hospital Particular Convênio de Saúde Trata por conta própria Outras 11 Fonte: revista Isto É, julho/98 2.3.2.9-HISTOGRAMA Média geral dos alunos segundo o sexo Colégio São Paulo – 1º bimestre - 2008 MÉDIAS Nº de Alunos 40|--- 50 1 50|--- 60 3 60|--- 70 20 70|--- 80 27 80|--- 90 10 90|---100 4 TOTAL 65 Fonte: Colégio São Paulo 12 0 5 10 15 20 25 30 N º d e Al un os Médias Média geral dos alunos - Colégio São Paulo - 2008 40 50 60 70 80 90 100 Fonte: Colégio São Paulo 2.3.2.10-POLÍGONO DE FREQÜÊNCIA Média geral dos alunos segundo o sexo colégio São Paulo – 1º bimestre – 2008 MÉDIAS Nº de Alunos 40|--- 50 1 50|--- 60 3 60|--- 70 20 70|--- 80 27 80|--- 90 10 90|---100 4 TOTAL 65 Fonte: Colégio São Paulo 13 0 5 10 15 20 25 30 N º d e Al un os Médias Média Geral dos Alunos - Colégio São Paulo 2008 40 50 60 70 80 90 100 14 3. MEDIDAS DE POSIÇÃO As medidas de posição de uma distribuição são valores que representam as tendências de concentração dos dados observados. Possibilitam representar um conjunto de dados relativos à observação de determinado fenômeno de forma resumida. 3.1-MÉDIA A medida de tendência central mais usada para descrever resumidamente uma distribuição de freqüência é a média. São valores centrais que caracterizam uma distribuição. 3.1.1-“MÉDIA ARITMÉTICA” a) Média Aritmética Simples n xxxx x n 321 n x x n i i 1 (dados amostrais) N x n i i 1 (dados populacionais) b) Média Aritmética Ponderada n nn ppp pxpxpx x ... ... 21 2211 n i i n i ii p px x 1 1 (dados amostrais) n i i n i ii p px 1 1 (dados populacionais) 15 EXEMPLOS 01) Se um estudante fez quatro provas e obteve as notas 83, 94, 95 e 86, determine sua nota média. 02) Se um estudante fez quatro provas com os sues respectivos pesos na relação abaixo: Nota Peso 40 60 40 90 1 2 3 4 Determine sua média 03) Determinar a média da distribuição: Renda Familiar (milhares de $) Nº de Famílias 2 |-------- 4 4 |-------- 6 6 |-------- 8 8 |-------- 10 10 |-------- 12 5 10 14 8 3 Total EXERCÍCIOS 01) Calcule a média das séries: a) 1 ,2, 8, 10, 12, 16, 21, 30. b) 5, 6, 6, 10, 11, 11, 20 c) 3,4; 7,8; 9,23; 12,15 02) Calcule a idade média dos alunos de uma classe de primeiro ano de determinada Faculdade, em anos. Idade(anos) Nº de alunos 17 18 19 20 21 3 18 17 8 4 16 03) Calcule o número de acidentes por dia em uma determinada esquina. Nº de acidentes por dia: xi Nº de dias 0 1 2 3 4 30 5 3 1 1 04) O salário de 40 funcionários de um escritório está distribuído segundo o quadro abaixo. Calcule o salário médio destes funcionários. Salários $ Nº de Funcionários 400 |----500 500 |----600 600 |----700 700 |----800 800 |----900 900 |----1000 12 15 8 3 1 1 05) Um imobiliária gerencia o aluguel de residências particulares, segundo o quadro abaixo: Aluguel $ Nº de Casas 0 |----200 200 |----400 400 |----600 600 |----800 800 |----1000 30 52 28 7 3 Calcule o aluguel médio para estas residências 06) Uma empresa de aviação observou em seus registros recentes, o tempo de mão-de-obra gasto na revisão completa deum motor de jato. O seguinte quadro foi obtido: Tempo de mão-de-obra (horas) Nº de motores 0 |------4 4 |------8 8 |------12 12 |------16 16 |------20 1 5 10 12 4 17 a) Determine o número médio de horas de mão-de-obra necessário para a revisão de cada motor. b) Com base nesta informação, qual deve ser o tempo total de mão-de-obra para a revisão de dez motores que aguardam revisão? c) Se a empresa dispõe no momento de dois homens trabalhando 12 horas por dia nestas revisões conseguirá provavelmente revisar estes dez motores em quatro dias? 07) A média para aprovação em determinada disciplina é 5,0 pontos. Se um estudante obtém as notas 7,5; 8,0; 3,5; 6,0; 2,5; 2,0; 5,5; 4,0 nos trabalhos mensais da disciplina em questão, pergunta-se se ele foi ou não aprovado. 3.2- MEDIANA É o valor que ocupa exatamente o meio de uma série, quando seus valores estão dispostos em ordem crescente ou decrescente. 3.2.1-Dados simples: a) Se n for ímpar, a mediana será o elemento central: Exemplo: 3, 5 ,8, 10, 15 Md = 8 b) Se n for par, a mediana será a média entre os elementos centrais. Exemplo: 5, 6, 10, 13, 18, 21 Md = 10 13 2 115 , 3.2.2-Dados Agrupados: a) Distribuição Discreta Se os dados estão apresentados em uma distribuição discreta, eles já estão naturalmente ordenados. Assim, basta verificar se o número de elementos da série é impar ou par e aplicar o mesmo raciocínio do caso anterior. Se n for ímpar, a mediana será o elemento central de ordem 2 1n . 18 Caso n seja par, a mediana será a média entre os elementos centrais de ordem 2 n e 1 2 n EXEMPLOS: Determine a mediana das séries: a) xi fi 2 5 8 10 12 1 4 10 6 2 b) xi fi 2 5 8 10 12 10 6 2 1 4 c) xi fi 0 1 2 3 5 3 5 8 10 6 b) Distribuição Contínua 1º Passo: independente se n par ou ímpar, na distribuição contínua, determina- se a posição da mediana, através de: 2 n p 19 2º Passo: identifica-se a classe que contém a mediana pela freqüência acumulada. 3º Passo: aplica-se a fórmula fi hFaa n liMd 2 na qual: li = limite inferior da classe da mediana; n = número de elementos da série; Faa = freqüência acumulada anterior à classe que contém a mediana; fi = freqüência absoluta da classe da mediana; h = amplitude de classe ou tamanho da classe; EXEMPLO: Dada a distribuição dos salários da companhia Beta , determine o salário mediano. Nº de Salários Mínimos Nº de Funcionários 3|------- 6 6|------- 9 9|-------12 12|-------15 15|-------18 18|-------21 12 18 20 10 5 3 3.3- MODA É o valor que ocorre com maior freqüência em uma série de dados. Existem séries de dados em que nenhum valor aparece mais vezes que outros. Neste caso não apresenta moda. São séries amodais. Em outros casos, pode aparecer dois ou mais valores de concentração. Dizemos, então, que a série tem duas ou mais modas (bimodal, trimodal). 20 3.3.1. Dados Simples: Para a distribuição simples, a identificação da moda é facilitada pela simples observação do elemento que apresenta maior freqüência. Exemplo: 4, 6, 6, 7, 9, 9, 9, 14. Mo = 9 3.3.2. Dados Agrupados: a) Distribuição Discreta Uma vez agrupados os dados, é possível determinar imediatamente a moda: basta fixar o valor da variável de maior freqüência. EXEMPLO: Consideremos a distribuição relativa a 34 famílias de quatro filhos, tomando como variável o número de filhos do sexo masculino: Nº de Meninos Nº de Famílias 0 1 2 3 4 2 6 10 12 4 A freqüência máxima 12 corresponde o valor 3 da variável. Logo: Mo = 3 b) Distribuição Contínua Para dados agrupados em uma distribuição contínua, temos diversas fórmulas para o cálculo da Moda. Apresentaremos a fórmula de Czuber. 1º Passo: Identifica-se a classe modal (aquela que possuir maior freqüência) 2º Passo: Aplica-se a fórmula: 21 h. li Mo 21 1 , em que: li = limite inferior da classe modal 1 = diferença entre a freqüência da classe modal e a imediatamente anterior. 2 = diferença entre a freqüência da classe modal e a imediatamente posterior. h = amplitude da classe. EXEMPLO: Dada a distribuição dos salários da companhia Beta , determine o salário modal. Nº de Salários Mínimos Nº de Funcionários 3|------- 6 6|------- 9 9|-------12 12|-------15 15|-------18 18|-------21 12 18 20 10 5 3 3.3- MEDIDAS SEPARATRIZES 3.3.1-QUARTIS Os quartis dividem um conjunto de dados em quatro partes iguais. Assim: 0% 25% 50% 75% 100% Q1 Q2 Q3 Q1 = 1º Quartil, deixa 25% dos elementos. Q2 = 2º Quartil, coincide com a mediana, deixa 50% dos elementos. Q3 = 3º Quartil, deixa 75% dos elementos. 22 3.3.1.1-DETERMINANÇÃO DO Qi 1º Passo: Calcula-se a ordem in 4 , onde i = 1, 2 ou 3. 2º Passo: Identifica-se a classe que contém o Qi pela Fac. 3ºPasso: Aplica-se a fórmula i ii f hFaa in lQ 4 3.3.2-DECIS São valores que dividem a série em 10 partes iguais. Assim: 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% D1 D2 D3 D4 D5 D6 D7 D8 D9 3.3.2.1-DETERMINANÇÃO DO Di 1º Passo: Calcula-se a ordem in 10 , onde i = 1, 2, 3, 4, 5, 6, 7, 8 e 9. 2º Passo: Identifica-se a classe que contém o Di pela Fac. 3ºPasso: Aplica-se a fórmula i ii f hFaa in lD 10 3.3.3-PERCENTIS São as medidas que dividem a amostra em 100 partes iguais. 23 3.3.3.1-DETERMINANÇÃO DO Pi 1º Passo: Calcula-se a ordem in 100 , onde i = 1, 2, 3, ..., 98, 99. 2º Passo: Identifica-se a classe que contém o Pi pela Fac. 3ºPasso: Aplica-se a fórmula i ii f hFaa in P 100 EXEMPLO: Dada a distribuição dos salários da companhia Beta , determine : a) O primeiro quartil; b) O sétimo decil; c) O quadragésimo quinto percentil. Nº de Salários Mínimos Nº de Funcionários 3|------- 6 6|------- 9 9|-------12 12|-------15 15|-------18 18|-------21 12 18 20 10 5 3 EXERCÍCIOS 01) A tabela refere-se a idade de 50 alunos de uma classe do primeiro ano de uma Faculdade. Idade(anos) Nº de Alunos Determine: 17 18 19 20 21 3 18 17 8 4 a) Média b) Mediana c) Moda 24 02) Umamáquina produz peças que são embaladas em caixas contendo 48 unidades. Uma pesquisa realizada com 59 caixas revelou a existência de peças defeituosas seguindo a tabela: Nº de Peças Defeituosas por Caixa Nº de Caixas Determine: a) Média 0 1 2 3 4 5 20 15 12 6 4 2 b) Mediana c) Moda 03) A distribuição a seguir representa os salários de 25 funcionários selecionados em uma empresa. Salários ($) Nº De Funcionários Determine 1.000|----1.200 1.200|----1.400 1.400|----1.600 1.600|----1.800 1.800|----2.000 2 6 10 5 2 a) Média b) Mediana c) Moda d) 3º Quartil e) 2º Decil f) 65º Percentil 04) Uma loja de departamentos selecionou um grupo de 54 notas fiscais, durante um dia, e obteve o seguinte quadro: Consumo por Nota $ Nº de Notas Determine: a) Média 0|---- 50 50|----100 100|-----150 150|----200 200|----250 250|----300 10 28 12 2 1 1 b) Mediana c) Moda d) 1º Quartil e) 7º Decil f) 12º Percentil 25 05) O departamento de recursos humanos de uma empresa, tendo em vista o aumento de produtividade de seus vendedores, resolveu, premiar com um aumento de 5% no salário, a metade de seus vendedores mais eficientes. Para isto, fez um levantamento de vendas semanais, por vendedor, obtendo a tabela; Salários ($) Nº De Vendedores Determine 0|----10.000 10.000|----20.000 20.000|----30.000 30.000|----40.000 40.000|----50.000 1 12 27 31 10 a) Média b) Mediana c) Moda d) 2º Quartil e) 9º Decil f) 33º Percentil 3.3- MEDIDAS DE DISPERSÃO São medidas estatísticas que visam fornecer o grau de variabilidade dos dados pesquisados, utilizando como referência uma medida de tendência central. As medidas de dispersão são importantes em termos de análise, pois dois ou mais conjuntos de dados podem estar centrados em um mesmo valor (medidas de tendência central), mas seus valores poderão estar muito mais dispersos num conjunto do que no outro. 3.3.1- VARIÂNCIA É uma média aritmética calculada a partir dos quadrados dos desvios obtidos entre os elementos da série e sua média. Em particular, para estas medidas levaremos em consideração o fato de a seqüência de dados representar toda uma população ou apenas uma amostra de uma população. Notações: quando a seqüência de dado representar uma população a variância será denotada por 2 e quando representar uma amostra por S 2 . 3.3.1.1-Dados não agrupados N xi 2 2 para dados populacionais 1 2 2 n xx S i para dados amostrais 26 3.3.1.2-Dados agrupados N fx ii 2 2 para dados populacionais 1 2 2 n fxx S ii para dados amostrais 3.3.2- DESVIO PADRÃO Sendo a variância calculada a partir dos quadrados dos desvios, ela é um número em unidade quadrada em relação à variável em questão, o que, sob o ponto de vista prático é um inconveniente. Por isso mesmo, imaginou-se uma nova medida que tem utilidade e interpretação prática, denominada desvio padrão, definida como a raiz quadrada da variância e representada por: 2 para dados populacionais 2SS para dados amostrais 3.3.3-COEFICIENTE DE VARIAÇÃO É uma medida relativa da dispersão ou variabilidade dos dados. E por ser uma medida adimensional, pois o desvio-padrão e a média têm a mesma unidade dos dados, permite a comparação das variabilidades de diferentes conjuntos de dados. É calculado pela expressão: CV ou x S CV EXEMPLO: Numa empresa, o salário médio dos homens é de R$ 4000,00, com desvio- padrão de R$ 1.500,00, e o das mulheres é em média de R$ 3.000,00, com desvio-padrão de R$ 1.200,00. Então: Para os homens 000.4 500.1 CV = 0,375 Para as mulheres 000.3 200.1 CV =0,4 27 Logo,podemos concluir que os salários das mulheres apresentam maior dispersão relativa que os dos homens. Para obtermos o resultado do CV em porcentagem, basta multiplicarmos o resultado por 100. No caso: CV para homens 37,5% CV para mulheres 40% 3.3.3.1-Critérios Para Interpretação Se 0% CV < 30%, conclui-se pela baixa variabilidade dos dados e a média é uma ótima medida para representar os dados. Se 30% CV < 50 %, conclui-se pela média variabilidade dos dados e a média é uma boa medida para representar os dados. Se CV 50%, conclui-se pela alta variabilidade dos dados e a média não é uma medida apropriada para representar os dados. Neste caso, deve-se pensar na mediana ou moda. Quanto menor for o coeficiente de variação, mais representativa dos dados será a média. EXEMPLOS 01) Ao examinar a estatura dos membros de uma família, os valores ( em cm ) encontrados foram: 172, 168, 181, 173 e 164. Determine: a) a média; b) a variância; c) o desvio-padrão; d) o coeficiente de variação. 02) O número de passageiros, da cidade A para a cidade B, por viagem, em um dia foram: 40, 40, 40, 42, 42, 42, 42, 43, 43, 44, 44, 45, 45, 45, 47 e 48.Encontre sua: a) média; b) variância; c) desvio padrão; d) coeficiente de variação. 28 03) A tabela abaixo representa o tempo para os funcionários da empresa X se deslocarem de casa para o trabalho. Tempo(min) Nº de Funcionários 28|---- 33 33|---- 38 38|---- 43 43|---- 48 48|---- 53 53|---- 58 3 13 11 10 7 1 EXERCÍCIOS 01) CIEPE – Quantia de funcionários faltosos ao dia, no mês de setembro de 1999. 0 0 2 4 2 1 1 2 2 1 0 0 0 2 1 4 3 2 3 2 1 4 0 1 1 0 0 0 0 0 Com os dados pede-se: a) Construir uma distribuição de freqüência discreta; b) Determine as freqüências (absoluta, relativa e acumuladas); c) Calcule o numero de faltas mediana. (interprete o resultado) d) Qual é o número médio de faltas? (interprete o resultado) e) Qual é o número de faltas modal? (interprete o resultado) f) Calcule a variância das faltas. g) Calcule o desvio-padrão das faltas. h) Calcule o coeficiente de variação das faltas. (interprete o resultado) 02) A tabela abaixo se refere ao consumo diário de carne do restaurante RS no 1º semestre de 1999. Consumo (kg) Nº de Dias 90|---- 100 100|---- 110 110|---- 120 120|---- 130 130|---- 140 140|---- 150 150|---- 160 12 23 35 46 30 21 10 Total 177 Utilizando-se da tabela acima, calcule: 29 a) O consumo médio diário de carne no semestre em questão; b) Os 25% dos dias que consumiram menos carne, foi de qual consumo? c) O ponto mediano é de quantos quilos de carne? (interprete o resultado) d) Os 30% dos dias de maior consumo está em qual faixa de consumo? e) O ponto modal é de quantos quilos de carne?(interprete o resultado) f) Determine a variância. g) Calcule o desvio padrão. h) Calcule o coeficiente de variação. (interprete o resultado) 03) Os dados abaixo referem-se a produção diária de açúcar da Destilaria de Cana WS. Produção(ton) Nº de Dias 4|----- 6 6|----- 8 8|----- 10 10|----- 12 12|-----14 26 37 31 23 21 Total 138 Com as informações acima, calcule: a) Média; (interprete o resultado) b) Mediana; (interprete o resultado) c) Moda; (interprete o resultado) d) 1º Quartil; (interprete o resultado) e) 9º Decil; (interprete o resultado) f) 63º Percentil; (interprete o resultado) g) Variância; h) Desvio-padrão; i) Coeficiente de variação. (interprete o resultado) 04) Na aplicação de um teste de motricidade, conseguiram-se os resultados da tabela abaixo: Pontos Nº de Candidatos 5 |------- 10 10 |------- 15 15 |------- 20 20 |------- 25 25 |------- 30 30 |------- 35 2 4 10 15 9 5 Determine: a) a média de pontos por candidato.(interprete o resultado) b) a mediana dos pontos. .(interprete o resultado) c) a moda dos pontos. (interprete o resultado) 30 d) 0 1º quartil dos pontos. (interprete o resultado) e) 0 7º decil. (interprete o resultado) f) a variância. g) o desvio padrão. h) o coeficiente de variação. (interprete o resultado)
Compartilhar