Baixe o app para aproveitar ainda mais
Prévia do material em texto
UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO DE CIÊNCIAS EXATAS E DA TERRA DEPARTAMENTO DE ESTATÍSTICA DOCENTE: Mariana Oliveira Cedraz ESTATÍSTICA DESCRITIVA O QUE É ESTATÍSTICA? Pode-se entender estatística como um conjunto de técnicas que permite, de forma sistemática, planejar, organizar, descrever, analisar e interpretar um conjunto de dados oriundos de estudos ou experimentos, realizados em qualquer área do conhecimento. INTRODUÇÃO À ESTATÍSTICA Ao contrario do que se pensa, a estatística não se ocupa apenas na análise dos dados, ela também se ocupa em planejar como os dados serão coletados para análise. INTRODUÇÃO À ESTATÍSTICA Sem o planejamento adequado nunca se sabe se os dados coletados servirão para alguma coisa, por mais sofisticadas que sejam as análises depois. FASES DO MÉTODO ESTATÍSTICO Definição do Problema Planejamento Coleta dos dados Crítica dos dados Apresentação dos dados Tabelas e Gráficos Análise e Interpretação DEFINIÇÃO DO PROBLEMA Saber exatamente o que se pretende pesquisar é o mesmo que definir corretamente o problema. Portanto, a primeira fase consiste em uma definição ou formulação correta do problema a ser estudado. PLANEJAMENTO Nele se determina o procedimento necessário para resolver o problema, como levantar informações sobre o objeto do estudo. Nesta fase é importante a escolha das perguntas, que, na medida do possível, devem ser fechadas. No caso de um experimento, deve-se atentar para os objetivos que se pretende alcançar. COLETA DOS DADOS O levantamento de dados pode ser de dois tipos: Censitário – quando envolve toda a população; Por amostragem – quando é utilizada uma fração da população. Outros elementos do planejamento de uma pesquisa são: cronograma das atividades, custos envolvidos, exame das informações disponíveis... CRÍTICA DOS DADOS Objetiva a eliminação de erros capazes de provocar futuros enganos. Faz-se uma revisão crítica dos dados, suprimindo os valores estranhos ao levantamento. APRESENTAÇÃO DOS DADOS A organização dos dados denomina-se Série Estatística. Sua apresentação pode ocorrer por meio de tabelas ou gráficos. ANÁLISE E INTERPRETAÇÃO Esta fase consiste em tirar conclusões que auxiliem o pesquisador a resolver seu problema, descrevendo o fenômeno através do cálculo de medidas estatísticas, especialmente as de posição e as de dispersão. DESCRITIVA x INFERENCIAL DESCRITIVA: Trata da observação de fenômenos de mesma natureza, da coleta de dados numéricos referentes a esses fenômenos, da sua organização e classificação por meio de tabelas e gráficos, bem como da análise e interpretação. INFERENCIAL: Estuda as características de uma população, com base em dados obtidos de amostras. ESQUEMA Conjunto de todos os elementos que contém a mesma característica População Amostra Inferência Estatística: Estimação de quantidades desconhecidas, extrapolação dos resultados, testes de hipóteses Estatísticas descritivas: Tabular os dados, construir tabelas. Tirar conclusões informais Subconjunto da população CONCEITOS BÁSICOS EXEMPLO DE POPULAÇÃO: População de residentes no município de Natal (elementos: pessoas residentes no município) População de pacientes internados no HUOL (elementos: pacientes internados no HUOL) Pessoas portadoras de HIV (elementos: pessoas soropositivos) TIPOS DE COLETA DOS DADOS A coleta direta de dados pode ser classificada relativamente ao fator tempo em: CONTÍNUA (REGISTRO): Quando feita continuamente, tal como a de nascimentos e óbitos e a de frequência dos alunos às aulas; PERIÓDICA: Quando feita em intervalos constantes de tempo, como os censos (de 10 em 10 anos) e as avaliações periódicas dos alunos; OCASIONAL: Quando feita extemporaneamente, a fim de atender a uma conjuntura ou a uma emergência, como no caso de epidemias que assolam ou dizimam rebanhos inteiros. TIPOS DE COLETA DOS DADOS Coleta direta: Quando a informação é obtida a partir do próprio elemento. Já a coleta é indireta quando é inferida de elementos conhecidos (coleta direta) e/ou do conhecimento de outros fenômenos relacionados com o fenômeno estudado. Dados colhidos em sites como DATASUS, IBGE são considerados como coleta indireta. TIPOS DE VARIÁVEIS Variável: Em estatística define-se variável como um atributo, uma característica que pode mudar de observação para observação. Podendo ser qualitativa ou quantitativa. Exemplo: Vamos supor, que estamos interessados em estudar o estado civil e a idade dos estudantes da disciplina de estatística aplicada a Engenharia Elétrica. VARIÁVEL QUALITATIVA A variável qualitativa revela certo tipo de característica relacionada ao grupo que não pode ser mensurada numericamente. Exemplo: Cor dos olhos (azuis, verdes, castanhos...), gênero (masculino, feminino), grau de satisfação (muito satisfeito, satisfeito, nada satisfeito), nível de instrução dos funcionários da UFRN (fundamental, médio, superior). Estas variáveis podem ainda ser identificadas em subcategorias, nominal ou ordinal. VARIÁVEL QUALITATIVA A variável qualitativa se diz nominal quando não se pode estabelecer uma relação de ordem ou de hierarquia entre os possíveis valores a serem assumidos pela variável. Exemplo: Considerando o exemplo anterior temos a cor dos olhos (azuis, verdes, castanhos...) e o gênero (masculino, feminino). Outros exemplos, estado civil dos aposentados, país de origem dos funcionários públicos. VARIÁVEL QUALITATIVA Uma variável qualitativa ordinal permite que se estabeleça uma hierarquia coerente ou uma relação de ordem entre os valores assumidos. Exemplo: Grau de satisfação (muito satisfeito, satisfeito, nada satisfeito), nível de instrução dos funcionários da UFRN (fundamental, médio, superior). VARIÁVEL QUANTITATIVA A variável quantitativa é uma variável que pode ser mensurada numericamente. Tal como a idade de pessoas em anos, número de pessoas que moram numa mesma residência, altura dos alunos em metros, quantidade de baterias em um estoque, variação da voltagem em uma pilha AA, circunferência de cabos fase em centímetros . A variável quantitativa pode ser discreta ou contínua. VARIÁVEL QUANTITATIVA As variáveis quantitativas discretas podem ser vistas como resultante de uma contagem, assumindo assim, em geral, valores inteiros. De uma maneira mais formal o conjunto de valores assumidos é finito enumerável. Exemplos: a idade de pessoas (1 ano, 2 anos, ..., n anos), quantidade de baterias em um estoque (1,2,3,..., n baterias) VARIÁVEL QUANTITATIVA As variáveis contínuas assumem valores em intervalos de números reais e, geralmente, são provenientes de uma mensuração. Exemplos: altura dos alunos em metros (1,50 a 2,00 metros), variação de volts em uma pilha AA (0 a 1,5 V), circunferência de cabos fase em centímetros (1,5 a 2,5 mm²) . TIPOS DE VARIÁVEIS Qualitativa Quantitativa Nominal Ordinal Discreta Contínua André Edson Jarbas 1º colocado 2º colocado 3º colocado 1 atleta 2 atletas 3 atletas 12 segundos 14 segundos 16 segundos TIPOS DE VARIÁVEIS Nominal Ordinal Discreta Contínua Qualitativa Quantitativa Variável CONCEITOS BÁSICOS PARÂMETROS: Medidas numéricas de características mensuráveis de uma população. ESTATÍSTICA: Função definida sobre os valores numéricos de uma amostra (estimativas dos parâmetros da população). DADOS: São as informações obtidas, seja com base nos elementos da população ou da amostra. ESTATÍSTICA DESCRITIVA Conjunto de técnicas estatísticas que permite explorar grandes massas de dados para uma primeira aproximação à realidade estudada, na procura de algum padrão ou comportamento relevante que esteja presente no conjunto de dados. Os dados podem ser organizados: Em tabelas quando é importante a apresentação dos valores Em gráficos ou mapas quando necessita-se da apresentação de distribuições, tendências ou relacionamentos entre variáveis Resumidos com o uso de estatísticas. DISTRIBUIÇÃO DE FREQUÊNCIAS A distribuição de frequência nada mais é do que a representação tabular dos dados, que consiste em dispor os dados em linhas e colunas, distribuídas de modo ordenado, segundo algumas regras práticas e obedecendo à Resolução nº 886/66, de 26 de outubro de 1966, do Conselho Nacional de Estatística. NORMAS PARA CRIANÇÃO DE TABELAS Toda tabela deve ser autoexplicativa (IBGE): As tabelas devem ser fechadas no alto e embaixo por linhas horizontais, não sendo fechadas à direita nem à esquerda por linhas verticais. É facultativo o emprego de traços verticais para a separação de colunas no corpo da tabela; Em publicações que compreendem muitas tabelas, estas devem ser numeradas em ordem crescente, conforme a ordem de aparecimento; NORMAS PARA CRIAÇÃO DE TABELAS Os totais e subtotais são destacados (negrito, itálico, caracteres afastados etc); O título deve conter a descrição básica do conteúdo, local e época em que foram coletados os dados; Deverá ser mantida uniformidade quanto ao número de casas decimais. BASE DE DADOS Nº INICIAIS SEXO IDADE BAIRRO_RESIDENCIAL ESCOLA2OGR ALTURA BRACO --- -------- ---- ----- ------------------------- ---------- ------ ----- 1 PAMS F 19 JACAREPAGUA PRIV 168 24.5 2 ACPP F 21 JACAREPAGUA PUB 160 28.0 3 LTK F 19 PIEDADE PRIV 173 28.0 4 JAC F 22 PIEDADE PUB 174 32.0 5 LSS F 19 MEIER PRIV 158 24.0 6 PAGAC M 20 TIJUCA PRIV 177 29.0 7 KNL F 20 TIJUCA PRIV 162 22.5 8 VPR F 19 ENGENHO NOVO PRIV 168 27.0 9 WFC F 21 WONA/BELFORD ROXO PUB 170 33.0 10 PFS F 19 ILHA DO GOVERNADOR PRIV 161 26.5 11 RRS F 19 CENTENARIO/DUQUE CAXIAS PRIV 175 26.0 12 ARP F 19 VILA DA PENHA PUB 169 26.0 13 AAN F 24 BAIRRO DE FATIMA/NITEROI PRIV 166 25.0 14 PCCN F 21 ICARAI/NITEROI PRIV 171 25.0 15 ALM F 22 PARAISO/SAO GONCALO PUB 164 23.5 16 SM F 18 COPACABANA PRIV 170 25.5 17 RCF F 19 CATETE PRIV 168 24.0 18 TAG F 19 ICARAI/NITEROI PRIV 163 26.5 19 AHM F 21 FLAMENGO PUB 168 21.0 20 ASC F 18 CAMPO GRANDE PRIV 155 26.0 TABULAÇÃO DE VARIÁVEIS QUANTITATIVAS CONTÍNUAS Peso em gramas Nº de prematuros % 400 ├ 600 120 24,0 600 ├ 800 80 16,0 800 ├ 1000 130 26,0 1000 ├ 1200 70 14,0 1200 ├ 1400 100 20,0 Total 500 100,0 Distribuição dos pesos dos prematuros, nascidos na MEJC OBS: Chamamos de distribuição em classes TABULAÇÃO DE VARIÁVEIS QUANTITATIVAS DISCRETAS Consultas de pré-natal Nº de consultas % 0 106 42,1 1 15 6,0 2 34 13,5 3 50 19,8 4 47 18,7 Total 252 100 Número de consultas de pré-natal realizadas durante a gestação OBS: Quando a variável tem poucos valores, podemos fazer uma tabela simples, caso contrário, a tabela deve ser em classes. TABULAÇÃO DE VARIÁVEIS QUALITATIVAS NOMINAIS Distribuição do sexo dos recém nascidos na MEJC Sexo Nº de entrevistados % Masculino 207 45,39 Feminino 249 54,61 Total 456 100,00 TABULAÇÃO DE VARIÁVEIS QUALITATIVAS ORDINAIS Recém nascidos, segundo o grau de anorexia Grau de Anorexia Nº de bebês % Sem Anóxia 94 22,12 Moderada 157 36,94 Severa 174 40,94 Total 425 100,00 OBS: Respeitar a ordem da variável. TIPOS DE GRÁFICOS 45% 55% Sexo dos entrevistados do RN Feminino Masculino 0 10 20 30 40 50 Fórcipe Pélvico Normal Cesária Tipos de parto na MEJC Gráfico de setores ou pizza Gráfico de barras TIPOS DE GRÁFICOS Feminino Masculino 45,0 55,0 Sexo dos entrevistados do RN Gráfico de colunas 80 90 100 110 120 130 140 150 2007 2008 2009 2010 Casos de dengue detectados nas grandes cidades do RN Natal Mossoró Caicó Gráfico de linhas TIPOS DE GRÁFICOS 0 5 10 15 20 25 30 600 800 1000 1200 1400 1600 peso (g) Re cé m- na sc ido s ( %) 0 0.02 0.04 0.06 0.08 0.1 0.12 0.14 300 500 700 900 1100 1300 1500 1700 Peso (g) (%) Histograma Polígono TIPOS DE GRÁFICOS Boxplot DISTRIBUIÇÃO DE FREQUÊNCIAS Considere o seguinte exemplo: Um questionário foi aplicado em uma escola para alunos do fundamental ao ensino médio. Uma amostra de 20 alunos foi selecionada. Fornecendo as seguinte informações. • Id: Identificação do aluno • Nº irmãos: Número de irmãos dos alunos • Sexo: Sexo do aluno, F se feminino e M se masculino • Idade: Idade em anos dos alunos • Alt: Altura em metros dos alunos • Rend. Escolar: Rendimento escolar dos alunos Os dados tabulados encontram-se na Tabela 1. Tabela 1 - Informação de dados estudantis - Dados brutos Id N° de irmãos Sexo Idade Alt Rend. Escolar 1 0 F 17 1.50 Ótimo 2 1 F 18 1.69 Bom 3 1 M 18 1.95 Bom 4 2 M 25 1.85 Ruim 5 0 F 19 1.48 Ótimo 6 1 M 19 1.76 Bom 7 1 F 20 1.60 Ruim 8 2 F 18 1.64 Bom 9 3 F 18 1.62 Ótimo 10 4 F 17 1.64 Ruim 11 2 F 18 1.72 Ótimo 12 2 F 18 1.66 Bom 13 1 F 21 1.70 Bom 14 4 M 19 1.78 Bom 15 1 F 18 1.65 Ótimo 16 1 F 19 1.63 Bom 17 2 F 17 1.82 Bom 18 1 M 18 1.80 Ruim 19 1 F 20 1.60 Bom 20 0 F 18 1.68 Ótimo Fonte: Dados fictícios DISTRIBUIÇÃO DE FREQUÊNCIAS DISTRIBUIÇÃO DE FREQUÊNCIAS Tabelas com grandes números de dados são cansativas e não dão uma visão rápida e geral do fenômeno. Dessa forma, é necessário que os dados sejam organizados em uma tabela de distribuição de frequências para facilitar ao analista o seu estudo. DISTRIBUIÇÃO DE FREQUÊNCIAS: SIMPLES • Série estatística para dados nominais, ordinais e discretos, organizados em uma tabela. POR CLASSES • Série estatística para dados contínuos. • Pode ser utilizada para dados discretos se os mesmos foram em sua maioria ou num todo, diferentes. DISTRIBUIÇÃO DE FREQUÊNCIA CONSTRUÇÃO DE UMA DISTRIBUIÇÃO DE FREQUÊNCIAS SIMPLES: 1. Ordenar os dados brutos em forma de rol (ordem crescente) 2.Listar todos os elementos diferentes, numa coluna de nome “X”. 3. Listar a frequência de todos os elementos diferentes numa coluna de nome "fi" ou "frequência". 4. Somar todos os elementos da coluna "fi" (total). CONSTRUÇÃO DA DISTRIBUIÇÃO DE FREQUÊNCIAS Exemplo: Considere a variável Nº de irmãos na Tabela 1. 0 1 1 2 0 1 1 2 3 4 2 2 1 4 1 1 2 1 1 0 Rol (dados em ordem crescente): 0 0 0 1 1 1 1 1 1 1 1 1 2 2 2 2 2 3 4 4 DISTRIBUIÇÃO DE FREQUÊNCIA Tabela de Distribuição de Frequências Simples: Algumas considerações ou conclusões: • Qual o número de estudantes que não tem irmãos? • Quantos estudantes têm 4 irmãos? • A maioria dos estudantes tem quantos irmãos? E a minoria? Tabela 2– Distribuição de frequência do número de irmãos. Nº de irmãos f 0 3 1 9 2 5 3 1 4 2 Total 20 Fonte: Dados fictícios DISTRIBUIÇÃO DE FREQUÊNCIA Vamos supor que agora queremos responder as seguinte perguntas: • Qual o percentual de estudantes que não tem irmãos? • Qual o percentual estudantes têm quatro irmãos? • Informe o percentual dos estudantes que tem o maior número de irmãos? E dos que tem o menor número de irmãos. Para responder essa pergunta temos que utilizar a seguinte fórmula chamada de frequência relativa: % .100i n f N DISTRIBUIÇÃO DE FREQUÊNCIA Aplicando na fórmula os valores da tabela, obtemos os seguintes resultados: Tabela 3– Distribuição de frequência e porcentagem do número de irmãos. Nº de irmãos f f % 0 3 15 1 9 45 2 5 25 3 1 5 4 2 10 Total 20 100 Fonte: Dados fictícios 3 .100 15 20 DISTRIBUIÇÃO DE FREQUÊNCIA Outros questionamentos que podem surgir são os seguintes: •Quantos estudantes têm até 2 irmãos? • Quantos estudantes têm ao menos 3 irmãos? • Qual o percentual de estudantes com no máximo 1 irmão? • Qual o percentual de estudantes com no mínimo 2 irmãos? Tabela 4 – Distribuição de frequência acima de a abaixo de e porcentagem do número de irmãos. Nº de irmãos f f % F↓ F↓% F↑ F↑% 0 3 15 3 15 20 100 1 9 45 12 60 17 55 2 5 25 17 85 8 30 3 1 5 18 90 3 25 4 2 10 20 100 1 15 Total 20 100 - - - - DISTRIBUIÇÃO DE FREQUÊNCIAS POR CLASSES CONSTRUÇÃO DE UMA DISTRIBUIÇÃO DE FREQUÊNCIAS POR CLASSES: 1. Ordenar os dados brutos em forma de rol (ordem crescente) 2. Calcular a amplitude total: A = LS - LI 3. Calcular o número de classes e arredondar o valor final para um número inteiro: C = 1 + (3,33333.....) • log(n) 4. Calcular o intervalo entre classes: i = A / C. Construa de uma Distribuição de Frequências com CLASSES para os dados referentes ao Peso (kg) de 14 blocos de concreto: SOLUÇÃO: Amplitude Total (A): A = LS – LI = 95 – 56 = 39. DISTRIBUIÇÃO DE FREQUÊNCIAS POR CLASSES 56 57 58 60 62 64 69 74 74 74 76 80 81 95 Número de Classes (C) – Fórmula de Sturges: C = 1 + (3,33333.....) · log(n) C = 1 + 3,333 · log (14) = 4,82 5 Intervalo de Classe (i): A=39 e C=5 i = A/C = 39/5 = 7,8. DISTRIBUIÇÃO DE FREQUÊNCIAS POR CLASSES Peso de blocos de concreto Fonte: Dados Fictícios Peso (kg) fi Fi% 56,0 |- 63,8 5 35,71 63,8 |- 71,6 2 14,28 71,6 |- 79,4 4 28,58 79,4 |- 87,2 2 14,28 87,2 |-| 95 1 7,14 Total 14 100 DISTRIBUIÇÃO DE FREQUÊNCIAS POR CLASSES EXEMPLO Um determinado professor está interessado em analisar a altura (m) dos alunos da disciplina de Estatística. Os dados são os seguintes: Construa uma distribuição de frequência em classes. 1,51 1,65 1,58 1,54 1,65 1,40 1,61 1,08 1,81 1,38 1,56 1,83 1,69 1,22 1,22 1,68 1,49 1,80 1,33 1,83 1,50 1,46 1,67 1,23 1,54 MÉDIDAS DE TENDÊNCIA CENTRAL Os dados quantitativos, apresentados em tabelas e gráficos, constituem a informação básica do problema. Mas é conveniente apresentar medidas que mostrem a informação de maneira resumida. MEDIDAS DE TENDÊNCIA CENTRAL: São medidas que tendem para o centro da distribuição e têm a capacidade de representá-la como um todo. Dão o valor do ponto em torno do qual os dados se distribuem. As principais são: Média Aritmética, Mediana e Moda e algumas. MÉDIA ARITMÉTICA A média aritmética pode ser definida em dois tipos: populacional (μ) e amostral (X ). Nos dois casos existem três situações quanto aos cálculos. 1. Dados apresentados em forma de rol: A média será: MÉDIA ARITMÉTICA Ex: Número de tomadas a serem trocadas em 12 hotéis de Natal Dados: 50, 62, 70, 86, 60, 64, 66, 77, 58, 55, 82, 74 Análise: O número médio de tomadas para serem trocadas é de 67 por hotel. MÉDIA ARITMÉTICA 2. Dados apresentados em forma de distribuição de frequência simples: A média será: Ex: Número de peças com defeitos produzidas em 27 dias em certa fábrica X 0 1 2 3 4 Total F 2 4 10 6 5 27 Podemos verificar que a média de peças defeituosas 2,3 por dia. MÉDIA ARITMÉTICA EXERCÍCIO As informações abaixo apresentam a idade dos usuários de drogas internos numa clínica para tratamento. Determine a idade média dos internos. MÉDIA ARITMÉTICA 3. Dados apresentados em forma de distribuição de frequência em classes: A média é: MÉDIA ARITMÉTICA Ex: Nascidos vivos segundo o peso ao nascer, em kg. MÉDIA ARITMÉTICA Verifica-se que o peso médio dos 100 nascidos vivos é de 3kg. EXEMPLO Temperatura (Cº) para o derretimento de certo material eletrônico Temperatura Fi Pm 150 |- 200 35 200 |- 250 164 250 |- 300 31 300 |- 350 344 350 |- 400 112 400 |- 450 32 450 |- 500 10 Total 728 - MEDIANA Valor que divide a distribuição em duas partes iguais, em relação à quantidade de elementos. Isto é, é o valor que ocupa o centro da distribuição, de onde se conclui que 50% dos elementos ficam abaixo dela e 50% ficam acima. Colocados em ordem crescente, a mediana (Med ou Md) é ou valor que divide a amostra, ou população, em duas partes iguais. MEDIANA Variável Discreta: 1º Colocar os elementos em forma de ROL 2º Verificar se n é par ou ímpar -> Se n for ímpar: -> Se n for par: MEDIANA Ex1: n sendo ímpar Ex2: n sendo par MEDIANA Variável contínua: 1º Calcular a ordem (n/2)º Obs: Não importar se é par o ímpar 2º Através da F identificar onde está a posição da mediana 3º Utilizar a forma: MEDIANA Temperatura (ºC) para o derretimento de certo material eletrônico. MEDIANA Resolução: EXEMPLO Quantidade de creatinina (ml) encontrada na urina de 84 pacientes com problemas renais. MODA É o valor que ocorre com maior frequência na série, ou seja, aquele que mais se repete. Ex: ROL: 3, 4, 5, 7, 7, 7, 9, 9 Moda igual a 7 MODA Série Unimodal: Existe apenas uma moda Ex: 1,1,3,4,5,6,6,6,7 -> Moda igual a 6 Série Bimodal: Existe duas modas Ex: 1,2,3,3,4,5,6,7,7,8 -> Moda igual a 3 e 7 Série Trimodal: Ocorrem três modas Ex: 4,4,4,5,6,7,7,7,8,8,8 -> Moda igual a 4, 7 e 8 MODA Série Polimodal: Ocorrem quatro ou mais modas Ex: 1,1,2,3,3,4,5,6,6,7,7 -> Moda igual a 1, 3, 6, 7 Série Amodal: Não há moda Ex: 1, 3, 4, 6, 7, 8 -> Não há moda MODA Dados apresentados em uma distribuição de frequência simples: Moda = elemento de maior frequência Ex: Moda = 6 MODA (DISTRIBUIÇÃO EM CLASSES) Moda Bruta: Moda de Pearson: Moda de King: Moda de Czuber: OBS: Para achar a classe modal (classe que será referência para o cálculo da moda), olha a classe com maior frequência. MODA Temperatura (ºC) para o derretimento de certo material eletrônico. MODA Tendo a média e mediana, calcularemos a moda de Pearson, para o cálculo das outras modas, usaremos a classe com maior frequência, que nesse caso é a 4ª classe. SEPARATRIZES Individualmente não são medidas de tendência central, mas como são medidas de posição na série, podemos considerá-las. Essas medidas (Quartis, Decis e Percentis) juntamente com a mediana são chamadas genericamente de separatrizes. SEPARATRIZES A mediana divide a distribuição em duas partes iguais. Mediana (Me) divide em duas partes iguais Quartis (Q1, Q2 e Q3) dividem em quatro partes iguais Decis (D1, D2, ..., D9) dividem em dez partes iguais Percentis (P1, P2, ..., P99 ) dividem em cem partes iguais SEPARATRIZES SEPARATRIZES (DADOS EM ROL) Primeiro encontra-se a posição e em seguida identifica o elemento. 1 ) Posição da Mediana: 2 ) Posição dos Quartis: 3 ) Posição dos Decis: 4) Posição dos Percentis: SEPARATRIZES Ex: Considere o tempo (em anos) de 24 máquinas utilizadas numa indústria. Calcule os quartis. Calculando os quartis: 17 18 19 20 21 22 23 24 25 26 27 29 32 33 35 38 39 42 44 46 48 50 54 57 SEPARATRIZES Interpretação: 25% das máquinas têm idade até 22 anos de uso, como também metade delas têm até 29 anos e 25% das máquinas têm mais de 42 anos de uso na indústria. SEPARATRIZES Ex: Considere o tempo (em anos) de 24 máquinas utilizadas numa indústria. Calculando os Decis: 17 18 19 20 21 22 23 24 25 26 27 29 32 33 35 38 39 42 44 46 48 50 54 57 SEPARATRIZES Interpretação: Pode concluir que 30% das máquinas têm até 23,5 anos de uso, como também metade delas têm até 29 anos e 90% tem no mínimo 49 anos (10% delas têm mais de 49 anos). SEPARATRIZES Ex: Considere o tempo (em anos) de 24 máquinas utilizadas numa indústria. Calculando os Percentis 17, 35 e 83: 17 18 19 20 21 22 23 24 25 26 27 29 32 33 35 38 39 42 44 46 48 50 54 57 SEPARATRIZES Interpretação: Assim pode concluir que, 17% das máquinas têm até 20,5 anos de uso, como também 35% delas têm até 24,5 anos e 65% das máquinas tem mais de 24,5 anos. SEPARATRIZES (EM CLASSES) Para os cálculos quando os dados estão agrupados em classes, o cálculo é semelhante ao da mediana: 1) Calcula-se a posição da separatriz; 2) Procura a posição na frequência “abaixo de”; 3) Usa a fórmula: SEPARATRIZES Calcule o 1º quartil (Q1) e interprete: Tabela 1 – Idades dos alunos da turma Educação Física para a terceira idade Classes Fi F 50 |- 54 4 4 54 |- 58 9 13 58 |- 62 11 24 62 |- 66 8 32 66 |- 70 5 37 70 |- 74 3 40 Total 40 - SEPARATRIZES 1) Calcula a posição do 1º Quartil 2) Usando a 2ª classe como referência 25% dos alunos da turma de Educação Física para a terceira idade tem idade inferior a 56,6 anos EXERCÍCIO Nascidos vivos segundo o peso ao nascer, em kg. Calcule o D2 e o P88 e interprete. Classes Fi F 1,5 |- 2,0 3 3 2,0 |- 2,5 16 19 2,5 |- 3,0 31 50 3,0 |- 3,5 34 84 3,5 |- 4,0 11 95 4,0 |- 4,5 4 99 4,5 |-| 5,0 1 100 Total 100 - MEDIDAS DE DISPERSÃO Utilizaremos o termo dispersão para indicar o grau de afastamento de um conjunto de números em relação a sua média, pois ainda que consideremos a média como um número que tem a faculdade de representar uma série de valores ela não pode por si mesma, estacar o grau de homogeneidade ou heterogeneidade que existe entre os valores que compõem o conjunto. O nosso objetivo é construir medidas que avaliem a representatividade da média, para isto usaremos as medidas de dispersão. MEDIDAS DE DISPERSÃO Uma breve reflexão sobre as medidas de tendência central permite-nos concluir que elas não são suficientes para caracterizar totalmente uma sequência numérica. Se observarmos as seguintes sequências: OBS: Sequência distinta se pensarmos na variabilidade dos dados. X: 70, 70, 70, 70, 70 Y: 68, 69, 70, 71, 72 Z: 1, 38, 70, 76, 165 MEDIDAS DE DISPERSÃO As principais medidas de dispersão absolutas são: amplitude total, variância, desvio padrão e coeficiente de variação. Nosso objetivo é construir medidas que avaliem a representatividade da média. VARIÂNCIA È a medida de dispersão mais utilizada. É definida como sendo o quociente entre a soma dos quadrados dos desvios e o número de elementos. É classificada em dois tipos: VARIÂNCIA Calcule a variância da estatura dos funcionários de certa indústria automobilística: Primeiro calcula-se a média: 1,92 1,72 1,82 1,80 1,84 VARIÂNCIA Quando os dados estão em frequência simples: Quando os dados estão em frequências em classes: VARIÂNCIA As informações abaixo apresentam a idade dos usuários de drogas internos numa clínica para tratamento. Idade Fi Xi.Fi Xi².Fi 17 2 34 578 18 4 72 1296 19 5 95 1805 20 6 120 2400 21 3 63 1323 22 4 88 1936 23 2 46 1058 Total 26 518 10396 VARIÂNCIA Nascidos vivos segundo o peso ao nascer, em kg. Classes Fi Pm Pm.Fi Pm ².Fi 1,5 |- 2,0 3 1,75 5,25 15,75 2,0 |- 2,5 16 2,25 36 576 2,5 |- 3,0 31 2,75 85,25 2642,75 3,0 |- 3,5 34 3,25 110,5 3757 3,5 |- 4,0 11 3,75 41,25 453,75 4,0 |- 4,5 4 4,25 17 68 4,5 |-| 5,0 1 4,75 4,75 4,75 Total 100 - 300 7518 VARIÂNCIA “DESVANTAGEM” DO USO DA VARIÂNCIA No cálculo da variância, quando elevamos ao quadrado a diferença (xi − x) , a unidade de medida da série fica também elevada ao quadrado. Portanto, a variância é dada sempre no quadrado da unidade de medida da série. Se os dados são expressos em metros, a variância é expressa em metros quadrados. Em algumas situações, a unidade de medida da variância nem faz sentido. É o caso, por exemplo, em que os dados são expressos em litros. A variância será expressa em litros quadrados. Logo, o valor da variância não pode ser comparado diretamente com os dados da série, ou seja: variância não tem interpretação. SOLUÇÃO: Usar o desvio padrão DESVIO PADRÃO Medida de dispersão que apresenta as propriedades da variância e tem a mesma unidade de medida dos dados. É a raiz quadrada da variância. OBS: Quanto maior o valor do desvio padrão significa que mais dispersos estão os elementos em torno da média. COEFICIENTE DE VARIAÇÃO O CV mede a dispersão em relação à média. É a razão entre o desvio padrão e a média. O resultado obtido dessa operação é multiplicado por 100, para que o coeficiente de variação seja dado em porcentagem. COEFICIENTE DE VARIAÇÃO Alturas e Pesos de Homens. Usando os dados amostrais de alturas e pesos de 40 homensde uma turma de estatística, encontramos as estatísticas dadas na tabela a seguir. Altura (cm) Peso (kg) CV = (7,56/168).100 CV = (10,98/72).100 CV = 4,5% 15,25% EXERCÍCIO Em um grupo de pacientes, foram tomadas as pulsações (batidas por minuto) e dosadas as taxas de ácido úrico (mg/100ml). As médias e os desvios- padrão foram: Compare a dispersão da Pulsação com as taxas de ácido úrico.
Compartilhar