Baixe o app para aproveitar ainda mais
Prévia do material em texto
BIOESTATÍSTICA Profa. Dra: Bárbara Borges 2019 Ementa Bioestatística (40 h) Considerações Iniciais: Bioestatística – A estatística das ciências médica e biológica Conceitos Preliminares Planejamento da Pesquisa e as Técnicas de Amostragem Organização e apresentação de dados * Uso de programas estatísticos e aplicações em ciências da saúde Distribuição de Freqüência Apresentação Gráfica. Medidas de posição e variabilidade Bibliografia VIEIRA, Sônia. Introdução à bioestatística. São Paulo: Campus, 1997. CRESPO, Antônio Arnot. Estatística fácil. São Paulo: Saraiva, 1998. GALLEGARI-JACQUES, Sidia M.. Bioestatística: princípios e aplicações. Porto Alegre: Artmed,. MURRAY R.. Estatística. São Paulo: Pearson Education do Brasil, 1994. DOWNING, Douglas. Estatística Aplicada. São Paulo: Saraiva, 1999. Apostila de estudo e roteiros * * * * * * Área social pesquisa de opinião Área de saúde medicamentos genéricos epidemia de meningite Área industrial controle de qualidade Área financeira investimentos no mercado financeiro � EMBED PBrush ��� � EMBED PBrush ��� � EMBED PBrush ��� � EMBED PBrush ��� Cronograma das aulas * Data Conteúdo 04/02 Início do semestre; apresentação da ementa/professor/alunos; Introdução: Conceitos Fundamentais de Estatística. Estatística Descritiva, Inferência Estatística. 09/02- sábado letivo 10:00 Fases do trabalho estatístico e tipos de estudo Pesquisa na biblioteca para busca de artigo do 1TDES. Impressão do artigo escolhido 11/02 Tipos de Variáveis. População e Amostra. Tipos de estudo TDES1 : Uso do artigo para identificação da população , amostra e variáveis. Fazer classificação de todas as variáveis e tipo de estudo do artigo. 18/02 Correção do TDES1 Técnicas de Amostragem. 25/02 Busca bibliográfica do segundo artigo TDES 2: Identificação e apresentação da técnica de amostragem do artigo escolhido – grupo de 4 pessoas. 04/03 FERIADO Cronograma das aulas * Data Conteúdo 11/03 Organização e apresentação de dados Gráficos e tabelas Coleta de dados –trabalho de campo 18/03 TDES 3- Elaboração de projeto de pesquisa equivalente ao TCC1 e defesa do mesmo – valor 15 pontos. 25/03 1 va 01/04 Correção da 1 va Medidas de Posição ROTEIRO 1 -Exercícios e correções 08/04 Medidas de Variabilidade ROTEIRO 2 – Exercícios e correções 15/04 2 VA 20/04 Prova final - Na área de saúde... Busca de respostas sobre agravos e o contexto que estão inseridos Necessidade de informações para planejamento e gestão em saúde – COLECIONADORES DE DADOS Estudo da DISTRIBUIÇÃO, CONDICIONANTES e DETERMINANTES dos eventos ou padrões de saúde em POPULAÇÕES definidas, bem como da aplicação deste estudo no controle de problemas de saúde. EPIDEMIOLOGIA PESQUISA Coleta de grandes volumes de dados Técnicas para organização e síntese dos dados - Verificar padrão nos dados Análise descritiva INFERÊNCIAS e INTERVENÇÕES PESQUISA EPIDEMIOLÓGICA ESTATÍSTICA Histórico clínico, exames subsidiários, laboratoriais... Preconceito ! Estatística é ruim??? Estatística Estatística descritiva ou Análise exploratória de dados Estatística Indutiva e Inferencial Bioestatística e exemplos População e amostra Parâmetro e estatística Dados primários e secundários Censo Variável Conceitos básicos da bioestatística Estatística: o que é ? No nosso cotidiano, precisamos tomar decisões, muitas vezes decisões rápidas. Em linhas gerais, a Estatística fornece métodos que auxiliam o processo de tomada de decisão na presença de incerteza. * 2.unknown 3.unknown A Estatística é uma coleção de métodos para planejar experimentos, obter dados e organizá-los, resumi-los, analisá-los, interpretá-los e deles extrair conclusões. (TRIOLA, 1998). Objetivo é o de apresentar informações sobre dados em análise para que se tenha maior compreensão dos fatos que os mesmos representam. Áreas: Estatística Descritiva e Estatística Inferencial ou Indutiva e Probabilidade. Bioestatística: aplicação da estatística nos campos relacionados a saúde, biologia, biotecnologia etc. Conceitos básicos da bioestatística - A Bioestatística torna o observador mais crítico - Atitude científica Provar 1º - DEFINIÇÃO DO PROBLEMA : Saber exatamente aquilo que se pretende pesquisar; 2º - PLANEJAMENTO : Como levantar informações ? Que dados obter ? Qual levantamento usar ? Censitário ? Amostragem ? E o cronograma? Os custos? etc. 3º - COLETA DE DADOS : Fase operacional. Registro sistemático de dados, com um objetivo determinado. FASES DO MÉTODO ESTATÍSTICO * População: é o conjunto de elementos (valores, pessoas, medidas etc.) que tem pelos menos uma característica em comum. Alunos de 5 a 12 anos da rede pública do município de São Francisco- MG (para verificação de parasitas intestinais). Idosos integrantes da Unati - Universadade Aberta à Terceira Idade (importância da relação farmacêutico – paciente, percepção sobre a atuação do farmacêutico) Amostra: é um subconjunto de elementos extraídos de uma população. Conceitos básicos da bioestatística Censo: é uma coleção de dados relativos a todos os elementos de uma população. Variável: é a característica de interesse que é medida em cada elemento da amostra ou população, podendo ter resultados numéricos ou não. Seus valores variam de elemento a elemento. Conceitos básicos da bioestatística Tipos de dados ( Variável) Profissão Sexo Raça religião Qualitativo Quantitativo Nominal Ordinal Discreto Contínuo Escolaridade Estadiamento tumoral Nº de filhos Contagem de células Nº de parceiros sexais Peso Altura Glicemia Parâmetro: é uma medida numérica que descreve uma característica de uma população. Estatística: é uma medida numérica que descreve uma característica da amostra. Dados primários: dados coletados pelo próprio pesquisador e sua equipe. Dados secundários: não foram obtidos pelo pesquisador e sua equipe (diversas fontes como artigos em periódicos, institutos de pesquisa, DATASUS, IBGE, OMS, OPAS). Conceitos básicos da bioestatística Tipos de estudo Estudo observacional: verificamos e medimos características específicas, mas não tentamos manipular ou modificar os elementos a serem estudados. Estudo transversal: dados são observados, medidos e coletados em um ponto no tempo. Estudo retrospectivo ou de caso controle: os dados são coletados do passado, voltando-se no tempo. Estudo prospectivo ou longitudinal ou de coorte: os dados são coletados no decorrer do tempo, de grupos (coortes) que compartilham fatores comuns. Tipos de estudo Experimentos Controlando os efeitos das variáveis Experimentos cegos: o sujeito não sabe se está recebendo o tratamento ou o placebo. Blocos: para testar a eficácia de um ou mais tratamentos é importante colocar os sujeitos em grupos diferentes (ou blocos) de tal modo que os grupos sejam muito semelhantes. Planejamento experimental completamente aleatorizado: os sujeitos são colocados nos blocos através de um processo de seleção aleatória. Planejamento rigorosamente controlado: sujeitos são escolhidos cuidadosamente de modo que em cada bloco sejam similares. Levantamento de dados Problemas usuais – Representatividade Fator associado à forma de amostragem. Na seleção da amostra procura-se reproduzir as características observáveis da população - uso do critério de proporcionalidade. Em caso de desconhecimento da composição da população deve-se utilizar algum critério de aleatoriedade (sorteio). Amostra tendenciosa – conclusões sem consistência. Problemas usuais – Fidedignidade Relacionada à precisão ou qualidade dos dados. Motivos da falta de precisão: Falhas nos instrumentos de aferição; Problemas nos questionários empregados na obtenção dos dados;Falha humana. * Levantamento de dados A importância da coleta de dados Bom Questionário; Perguntas abertas e fechadas; Cuidado na hora de coletar informações; Não adianta uma metodologia perfeita e um bom planejamento se na hora da coleta dos dados houver alguma influência do entrevistador perante o entrevistado; As pessoas que são contratadas para fazer as entrevistas devem passar por um bom treinamento. Levantamento de dados AMOSTRAGEM Profa. Dra: Bárbara Borges É o ramo da estatística responsável pelo estudo da seleção de observações colhidas de uma parcela da população sob investigação, a amostra, com o propósito de produzir afirmações sobre características desta população. O que é amostragem ? B C Quer Pesquisar Efetivamente Pesquisa Delineamento do estudo Amostragem ... A C deve ser representativa perante A População: é o conjunto de todos os elementos ou resultados sob investigação. Amostra: é uma parte da população. Censo : Método em que todos os elementos da população são investigados. (Recenseamento) População amostra relembrando ... População alvo: conjunto de elementos para os quais se deseja que as conclusões da pesquisa tenham validade. EX: Lactantes assistidas pelos PSFs de Montes Claros. População fonte ou Universo amostral: conjunto de elementos elegíveis para fazer parte da amostra. EX: Lactantes assistidas pelo PSF do Alfreu de Quadros de MOC. Amostra ou População de estudo: sub-conjunto da população fonte sobre os quais se fazem a observação e se coleta os dados. EX: 450 Lactantes assistidas pelo PSF do Alfreu de Quadros de MOC. B C População alvo População Fonte ou universo amostral População de estudo A amostra permitem extrapolar os resultados obtidos para a população A Lactantes assistidas pelos PSFs de MOC Lactantes assistidas pelo PSF do Alfreu de Quadros de MOC. 450 Lactantes assistidas pelo PSF do Alfreu de Quadros de MOC. Unidades amostrais ou elementares: São os elementos que integram a população de estudo. EX. Pessoas, domicílios, comunidades. Estrato: é o agrupamento de unidades amostrais, feito com base em alguma característica comum. EX. sexo, idade, raça, tipo de produção, nível de escolaridade, etc. Dificuldade de se trabalhar com todos os elementos; Limitações de recursos humanos e tempo Limitações de recursos materiais Populações grandes ou infinitas Processo de observação pode exigir sacrifícios de indivíduos Questões éticas. Razões para o uso de amostras DESVANTAGENS de um estudo por amostras As amostras, geralmente se revelam distintas em relação ao universo, devido à variabilidade dos indivíduos de uma população. ERRO DE AMOSTRAGEM (VIÉS) Amostragem probabilística Amostragem Aleatória Simples Amostragem proporcional estratificada - Amostragem Sistemática Amostragem por conglomerados ou ‘clusters’ Amostragem não-probabilística - Amostragem por conveniência - Amostragem por julgamento Amostragem A escolha da amostra é deixada inteiramente ao investigador. A seleção da amostra não é tendenciosa Amostragem Não-Probabilística Amostragem por conveniência: Trata-se da seleção de unidades amostrais mais facilmente acessíveis para o pesquisador. Vantagem : método rápido e barato Desvantagem: a amostra nem sempre é representativa da população alvo. Ex: 1) Pesquisas com animais de um determinado hospital veterinário. 2) Pesquisa com uso de voluntários . 2) Amostragem por julgamento: Não tem sorteio. Peritos na matéria selecionam indivíduos típicos ou representativos da população que se deseja estudar. Desvantagens: Os resultados não necessariamente são válidos para toda a população e o viés dos estimadores tende a crescer com o tamanho da amostra Ex: Mulheres de 40 a 45 anos, com HPV da Santa Casa de Montes Claros são selecionadas para um estudo sobre o câncer de colo de útero na cidade. Cada unidade amostral no grupo tem alguma probabilidade conhecida (e diferente de zero) de ser selecionada. 1) Amostragem Aleatória Simples (AAS): As observações da amostra são selecionadas de tal forma que todas têm a mesma probabilidade de serem escolhidas. (SORTEIRO) Amostragem Probabilística Ex: Vamos obter uma amostra representativa para a pesquisa da estatura de 12 alunos de uma escola: 1º - numeramos os alunos de 1 a 12. 2º - escrevemos os números dos alunos, de 1 a 12, em pedaços iguais de papel, colocamos na urna e após mistura, retiramos, um a um, 4 números que formarão a amostra. AMOSTRAGEM ALEATÓRIA SIMPLES A população alvo é dividida em estratos e depois a AAS é utilizada na seleção de uma amostra de cada estrato. A estratificação também anula a possível tendência da AAS que um certo grupo do quadro amostral seja super ou sub representado. AMOSTRAGEM PROPORCIONAL ESTRATIFICADA AMOSTRAGEM SISTEMÁTICA A amostragem obedece alguma regra específica como por exemplo a seleção de unidades amostrais em intervalos iguais. Vantagem: não requer o conhecimento do tamanho total da população em estudo. Ex: Entrevistas feitas de 2 em 2 domicílios para aplicação de um questionário sobre população canina. Os estratos da população de interesse serem definidos pela localização geográfica (Ex: bairros) então estes estratos são os clusters. Usa-se AAS e então todas as unidades amostrais dentro dos conglomerados selecionados são investigadas. EX: leishmaniose em Belo Horizonte,MG - regionais. AMOSTRAGEM POR CONGLOMERADO (CLUSTERS) Vantagem: Técnica barata e conveniente pois as observações podem ser concentradas numa só parcela de todo o quadro amostral. Desvantagem: em comparação com a AAS ou com a amostragem sistemática, a amostragem por conglomerado é menos precisa, pois prevalências de doenças, para citar um exemplo, tendem a ter maior variabilidade de um grupo para outro do que entre elementos do próprio grupo. AMOSTRAGEM POR CONGLOMERADO (CLUSTERS) COMO DEFINIR UMA AMOSTRA? 1º - Radicalmente definida pelos objetivos da pesquisa. O que se quer observar? O que se deseja conhecer? O que se quer medir? 2º - Que variáveis permitem observar os objetivos? EX: Estudo da sobrevida de pacientes com AIDS, é recomendável saber sobre a idade, uso de medicamentos, adesão ao tratamento, doenças oportunistas... A amostra deve ser REPRESENTATIVA O comportamento da variável em estudo na amostra deve refletir o seu comportamento na população. Vamos ao planejamento ... PLANEJAMENTO DA AMOSTRA 1 – CONSIDERAÇÕES: Objetivos da pesquisa. Exigência de dados. Definições conceituais. Definições operacionais. Recursos disponíveis (inclusive tempo). PLANEJAMENTO DA AMOSTRA 2 – PLANO AMOSTRAL (desenho): Obtenção, avaliação e preparação de cadastros disponíveis. Seleção das unidades a pesquisar. Procedimentos para controle da amostra. PLANO AMOSTRAL - Deve especificar: População alvo. População de pesquisa. Cadastros a serem utilizados. Variáveis e parâmetros de interesse. Unidade(s) de amostragem. Unidades de informação. Método(s) para a seleção da amostra. Tamanho da amostra. Profa. Dra: Bárbara Borges ESTATÍSTICA DESCRITIVA Estatística Descritiva O que fazer com as observações que coletamos? Resumo dos dados = Estatística descritiva Primeira Etapa: TABELA: É um quadro que resume um conjunto de dados dispostos segundo linhas e colunas de maneira sistemática. A tabela simples contém as classes e a freqüência das observações. TABELAS DE DUPLA ENTRADA ou SÉRIES CONJUGADAS : São apropriadas à apresentação de duas ou mais séries de maneira conjugada, havendo duas ordens de classificação: uma horizontal e outra vertical. DESCRIÇÃO DA AMOSTRA Presença de Câncer Set/2007 Out/2007 Sim 1 0 3 Não 1 2 5 TOTAL 2 2 8 Princípios gerais para construção de tabelas 1 – SIMPLICIDADE: É melhor que exista duas tabelas pequenas do que um muito extensa. 2 – AUTO-EXPLICATIVA: sem ser preciso recorrera textos. Códigos, abreviações ou símbolos explicados no rodapé; Cada coluna e linha com cabeçalhos concisos e claros; Unidades de medidas sejam indicadas; O título deve ser claro, conciso e adequado; Totais e subtotais devem aparecer para facilitar a análise. GRÁFICOS Recurso visual utilizado para representar um fenômeno. Bastante usado por meios de comunicação social, técnica e científica. VANTAGENS: Alta capacidade de refletir padrões gerais e particulares dos dados; Grande facilidade de interpretação; Eficiência com que resume informações do conjunto de dados; Colocam em evidência as tendências,as ocorrências ocasionais, os valores extremos e também as ordens de grandeza dos fenômenos observados. DESVANTAGEM: - Fornecem menor grau de detalhes que as tabelas; Todo gráfico deve ser simples, claro e primar pela veracidade das informações! Deve-se questionar : Um gráfico realmente é a melhor opção? Qual é o público- alvo? Qual é o objetivo do gráfico? Que tipo de gráfico usar/ Que tamanho o gráfico deve ter? Existem diversos tipos de gráficos. Porém, serão destacados aqueles de maior interesse na representação das variáveis qualitativas e quantitativas. GRÁFICOS PARA VARIÁVEIS QUALITATIVAS Gráfico de barras É um gráfico formado por retângulos horizontais ou verticais de larguras iguais, onde cada um deles representa a intensidade de uma modalidade ou atributo. Cada coluna conserve uma distância entre si de aproximadamente 2/3 da largura da base de cada barra, evidenciando deste modo, a não continuidade na seqüência dos dados. O objetivo deste gráfico é de comparar grandezas e é recomendável para variáveis quantitativas cujas categorias tenham designações extensas. Gráfico de colunas É o gráfico mais utilizado para representar variáveis qualitativas. Composto por dois eixos: Horizontal: colunas com variações do agravo. Vertical: intensidade das variações. Difere do gráfico de barras por serem seus retângulos dispostos verticalmente ao eixo das abscissas sendo mais indicado quando as designações das categorias são breves. O número barras < 12 (doze). Gráfico 2- Distribuição dos entrevistados, subdivididos em grupos, segundo a idade, Montes Claros/ MG, 2009. Gráfico de setores – “ Pizza” Gráfico 3: Distribuição dos alunos da Escola de veterinária da UFMG, segunda a renda familiar, 2003. Tipo de gráfico onde a variável em estudo é projetada num círculo, dividido em setores com áreas proporcionais às freqüências das suas categorias. São indicados quando se deseja comparar cada valor da série com o total. Recomenda-se seu uso para o caso em que o número de categorias é pequeno e não obedecem a alguma ordem específica. Os valores são expressos em números ou em percentuais (%). POLÍGONO DE FREQÜÊNCIA RMBH incluindo Belo Horizonte RMBH excluindo Belo Horizonte Gráfico 4: Distribuição de casos de LV em Minas Gerais, no período de 1994 a 1999. - Mais fácil de traçar e comparar! Gráfico em linhas, freqüências ficam no eixo vertical e os intervalos de classe no eixo horizontal. Sua aplicação é mais indicada para representações de séries temporais sendo por tal razão,conhecidos também como gráficos de séries cronológicas. Liga-se os pontos médios das classes para se traçar a imagem do evento. B Anos Número de casos HISTOGRAMA Horizontal (eixo das abscissas) : valores da variável; Vertical (eixo das ordenadas): começa em zero e representa as freqüências. Número de alcoólatras 0 5 10 15 20 25 30 35 40 45 Idade Figura 1. Histograma relativos a alcoólatras crônicos segunda a idade, São Paulo, SP Fonte: Vieira, 1985 Altura = 3 base 4 GRÁFICO PARA VARIÁVEIS QUANTITATIVAS CONTÍNUAS É um gráfico de colunas justapostas que representa uma distribuição de freqüência para dados contínuos ou uma variável discreta quando esta apresentar muitos valores distintos. Vamos fazer grupos de 5 alunos e iniciar nossas análises de artigos científicos. Cada grupo deverá ler o artigo de forma crítica quanto a amostragem e a representação gráfica. Os grupos irão apresentar o artigo na próxima aula, enfatizando o processo de amostragem e a representação gráfica. Bom trabalho!!! COLETA DE DADOS • Questionário: instrumento de recolha de dados /informação preenchido pelo informante. • Formulário: instrumento de recolha de dados /informação que requer a presença de alguém (um entrevistador) que colete as respostas do informante; em certos casos substitui, com vantagem, o questionário. Utilização de questionários / formulários – fácil de ser administrado em população de estudo; – barato (envio pelo correio, etc.); – Ajuda na confiança em responder- anonimato (condição necessária para a autenticidade da resposta); – não implica uma resposta imediata (permite ao inquirido a escolha da hora mais conveniente para o efeito). Vantagens do questionário – Não é aplicável a analfabeto e a pessoas com dificuldade de compreensão das questões; – A pessoa pode ler todas as questões antes de responder; – Pode perturbar a informação (facilita a resposta em grupo); – Uso viável apenas em populações semelhantes; – Atraso freqüente na devolução. Desvantagens do questionário Uso do formulário Vantagens: Tempo e execução controláveis; Facilitam a compreensão dos resultados da pesquisa Desvantagens: – exige recursos humanos devidamente preparados; – implica resposta imediata- viés de lembrança; – passa certa insegurança – anonimato; – Necessita de bons recursos financeiros e humanos; – aplicação inviável no caso de grande amostragem Erros no processo de coleta de informações Devidos ao questionário / formulário: Tamanho, ordem das perguntas, redação das perguntas, utilização de conceitos incorretos ou desatualizados. Devidos ao entrevistador: Características do entrevistador, ansiedade, registro incorreto das respostas; Erros no processo de coleta de informações Devidos ao informante: Falta de conhecimento, má compreensão das perguntas, omissão de informações importantes, desejo de confundir e memória fraca (viés de lembrança). Devidos ao ambiente: Local da entrevista, assunto abordado e confidencialidade dos resultados. Medidas descritivas FUNÇÕES: Descrever o conjunto de dados de forma organizada e compacta por meio de suas estatísticas. Com um tratamento estatístico a avaliação poderá ser mais clara e precisa. Permitem o confronto de dois ou mais grupos Não significa que estes cálculos e conclusões possam ser levados para a população !!! Medidas descritivas Geralmente a distribuição de freqüências possui: Tendência central Dispersão (variabilidade) A forma da distribuição determina qual o tipo de medida descritiva mais adequada a ser usada. Medidas descritivas Medidas de tendência central ou de posição: média, mediana e moda. Medidas de dispersão ou de variabilidade: amplitude, variância e desvio padrão. MEDIDAS DE POSIÇÃO Tendência dos dados de se agruparem em torno de um valor central. O valor central é a característica dos dados e o mesmo pode ser usado para representá-los. Média- Mais usada pela sua exatidão de resultados e pela utilização no cálculo de outras medidas estatísticas. Moda- O valor mais freqüente. Mediana- O valor central da distribuição de valores MÉDIA ARITMÉTICA EX: Vamos considerar o peso de três recém-nascidos: 2,75kg, 3,25 kg e 3,80kg. Então n é igual a 3; x1 é 2,75kg, x2 é 3,25kg e x3 é 3,80kg. Vejamos... X = (2,75 + 3,25 + 3,80) 3 = 9,80 3 3,27 Peso médio = É o resultado da soma dos valores de todas as observações, dividida pelo número de observações. x1 + x2 + x3 + ... + xn X = N Notas finais dos alunos de três turmas Turma notas finais média A4 5 5 6 6 7 7 8 6,00 B 1 2 4 6 6 9 10 10 6,00 C 0 6 7 7 7 7,5 7,5 6,00 EX: A: 4 5 5 6 6 7 7 8 - Diagrama de Pontos X = X n 4 Média 5 6 7 8 Ex: Calcular a estatura média de bebês conforme a tabela abaixo. Aplicando a fórmula ao lado temos: 2.440 / 40 = 61 Logo... X = 61 cm MÉDIA DE DADOS AGRUPADOS X= ∑Xi.fi n ESTATURAS (CM) FREQUÊNCIA = fi PONTO MÉDIO = xi ..xi.fi. 50 |--------- 54 4 52 208 54 |--------- 58 9 56 504 58 |--------- 62 11 60 660 62 |--------- 66 8 64 512 66 |--------- 70 5 68 340 70 |--------- 74 3 72 216 Total 40 2.440 A distância entre cada um dos valores e a média é dada pela operação: X – X (subtração) = DESVIOS (pode ser – ou +) Notar que (X – X) = 0 ATENÇÃO: A média é afetada por valores extremos !!! média No cálculo da média são incluídos, inclusive, os valores nulos!!! Centro de gravidade Você não acha, entretanto, que se o zero não fosse incluído, o aproveitamento desse aluno seria representado mais convenientemente? Um estudante começou a freqüentar a faculdade em maio e obteve as seguintes notas: abril = zero maio = 80 junho = 80 agosto = 100 setembro = 100 outubro = 90 EX: Média = 75 Ímpar: nº do valor central da série Par: é igual a média dos dois valores centrais. MEDIANA - Md 50% Md 50% rol ou ordem crescente Xmín Xmáx 0 70 80 90 90 95 100 ---------- ^ -------------- 3 valores 3 valores mediana Medida da tendência central que não utiliza todos os valores É o valor que fica no centro da série dos dados ordenados. Ponto mediano Ponto mediano onde: n = fi = número total de observações; PMd = posição da mediana. PMd = n +1 (n par) 2 PMd = n+1 (n ímpar) 2 1 2 3 4 5 6 7 8 9 --------- Md ----------- 4 valores 4 valores 2 3 4 5 6 7 8 9 ---------- ---------- 4 valores 4 valores EX: Numa série de 8 valores a mediana estará entre o 4o e o 5o valor. 4 e 5 Será a média dos dois valores centrais da série Md =4,5 Então, achamos a posição da mediana. Agora queremos conhecer, ou melhor, calcular o valor da mediana propriamente dito !!! Dados: {2, 0, 5, 7, 9, 1, 3, 4, 6, 8} Cálculo da mediana n = 10; (n + 1) / 2 = 5,5 Posição !!! Valor da mediana !!! Lembrete: Os dois valores, entre os quais se situa a mediana, são chamados valores centrais. Md = 4,5 0 1 2 3 4 5 6 7 8 9 EX: Qual a mediana do conjunto de pesos, 65, 80, 55, 60 e 62 Kg? 1º) colocamos em ordem numérica e obtemos 55,60, 62, 65, 80 (Kg). 2) Aplicamos a fórmula (N + 1 / 2) 5+1 / 2 = 3 ou seja 62 Se fossem 4 pesos a mediana seria a média das 2º e 3º observações (60 E 62) , ou seja, 61Kg Quando a população é muito grande pega-se como mediana o nº abaixo do qual está 50% da população na curva de distribuição. Em outras palavras mediana: é o valor intermediário que separa a metade superior da metade inferior do conjunto de dados. No entanto esse valor pode ser encontrado de formas diferentes caso o número de dados seja par ou ímpar, vejamos: Número de elementos ímpar: Para a seguinte população: Comparação entre Média e mediana Se tem valores extremos usa-se a mediana! A média é o centro de equilíbrio da série 50% 50% média = mediana (a) distribuição simétrica 50% 50% mediana média (b) distribuição assimétrica É o valor que mais repete na série de valores. MODA - Mo Moda de dados não agrupados: ver o valor que mais se repete. Ex: Na série { 7 , 8 , 9 , 10 , 10 , 10 , 11 , 12 } mo = 10. Série amodal : não existe valor modal na série Ex: { 3 , 5 , 8 , 10 , 12 } Série bimodal : existem dois ou mais valores de concentração. Ex: { 2 , 3 , 4 , 4 , 4 , 5 , 6 , 7 , 7 , 7 , 8 , 9 } apresenta duas modas: 4 e 7. A. Cálculo da moda pelo processo Pearson: Mo = 3Md - 2 X EX: Você aplicou em seus alunos uma prova de 5 questões. Depois de corrigir as provas, contou a freqüência de erros e obteve a seguinte tabela. Questão Erros 1a 2 2a 3 3a 5 4a 4 5a 1 Qual questão pode ser considerada mais difícil? Evidente que se houve mais erros na 3a essa deve ser a mais difícil !!! Ao analisarmos a imagem com o time de futebol poderemos notar que a Moda corresponde à altura 1,66 metro que é a mais comum no grupo de 11 jogadores apresentados. - Sem intervalos de classe: Uma vez agrupados os dados, basta fixar o valor da variável de maior freqüência. Ex: Qual o tipo de sangue mais comum na tabela? O tipo O é a moda dessa amostra. Moda de dados agrupados Indivíduos segundo o tipo de sangue Tipo de sangue Frequência O 547 A 441 B 123 AB 25 Fonte: Garcia (1977) b) Com intervalos de classe: A classe que mais repete é a classe modal. O método mais simples é calcular o ponto médio da classe modal. Damos a esse valor a denominação de moda bruta. Ex: Calcule a estatura modal conforme a tabela abaixo. A classe modal é 58|-------- 62, l*=58 e L*=62 Mo = (58+62) / 2 = 60cm (valor é estimado, pois não se sabe o valor real da moda). Onde: l* = limite inferior da classe modal L*= limite superior da classe modal Mo = ( l* + L* ) / 2 Classes (em cm) Freqüência 54 |------------ 58 9 58 |------------ 62 11 62 |------------ 66 8 66 |------------ 70 5 MEDIDAS SEPARATRIZES Mediana (Md): divide em 2º partes Quartis (Q): divide em 4 partes (mediana = 2º quartil) Decis (D): divide em 10 partes (mediana = 5º decil) Percentis (P): divide em 100 partes (mediana = 50º percentil) Dividem um conjunto de dados em quatro partes iguais. QUARTIS Quartis em dados não agrupados 0% 25% 50% 75% 100% |--------------------|--------------------|--------------------|--------------------| Q1 Q2 =Md Q3 PQi = i . n i = 1,2,3 4 Q1 = 1. 100 = 25 4 Q2 = 2. 100 = 50 4 Q3 = 3. 100 = 75 4 25% 25% 25% 25% 25% 25% 25% 25% Cálculo dos quartis Q1 = 2 Q3 = 7 0 1 2 3 4 5 6 7 8 9 Md = 4,5 Ei = 0 Es = 9 Ex: Calcule os quartis da série: { 5, 2, 6, 9, 10, 13, 15 } 1º - ordene (crescente ou decrescente) os valores: { 2, 5, 6, 9, 10, 13, 15 } 2º - veja o valor que divide a série em 2 partes iguais : 9 Se a Md = 9 logo 9 = Q2. Assim.... { 2, 5, 6, 9, 10, 13, 15 } Temos agora {2, 5, 6 } e {10, 13, 15 } que são os dois grupos de valores iguais proporcionados pela mediana (quartil 2). Para o cáculo do quartil 1 e 3 basta calcular as medianas das partes iguais provenientes da verdadeira Mediana da série (quartil 2). Logo em { 2, 5, 6 } a mediana é = 5 . Ou seja: será o Q1 em {10, 13, 15 } a mediana é =13 . Ou seja: será o Q3 Q1 Md Q3 ES EI Medidas de Dispersão São mais apropriadas para descrever amostras que possuem grande dispersão dos dados. Medidas de dispersão ou de variabilidade: Amplitude, variância e desvio padrão. Pouco informativa e sensível a valores extremos. Muito usada por ser fácil de calcular e interpretar. Xmáx - Xmín = at 4 – 0 = 4 Amplitude total = 4 Amplitude É o intervalo entre o valor máximoe o mínimo das observações. turma notas X A 4 5 5 6 6 7 7 8 6 B 1 2 4 6 6 9 10 10 6 C 0 6 7 7 7 7,5 7,5 6 Vamos comparar essas turmas ? Como medir a dispersão? Ex: Turma A (4 5 5 6 6 7 7 8) Desvio é a distância entre cada dado e a média da série Notar que (X – X) = 0 Valores + e – se anulam 4 5 6 7 8 DESVIO MÉDIO É a média dos valores absolutos dos desvios em relação a média. ( xi – x ) DM = n DM = SDA n = Pouco usado, serve aqui para introduzir a variância e o desvio padrão. Valores X 4 5 5 6 6 7 7 8 Média X 6 Desvio (X – X) -2, -1, -1, 0, 0, 1, 1, 2 Soma = 0 Desvios Quadráticos Para tais cálculos precisamos conhecer .... Soma Valores X 4 5 5 6 6 7 7 8 48 Média X 6 - Desvios X - X -2 -1 -1 0 0 1 1 2 0 Desvios quadráticos (X-X) 2 4 1 1 0 0 1 1 4 12 VARIÂNCIA S2 É a soma dos quadrados dos desvios (ou desvios quadráticos) dividida pelo número de observações menos 1. Obs: N – 1 = graus de liberdade S2 = SQD n - 1 S2 = (4 + 1 + 1 + 0 + 0 + 1 + 1 + 4) / 7 = =12 / 7 = 1,71 EX: Valores 4, 5, 5, 6, 6, 7, 7, 8 X = 6 Desvios (X– X) -2, -1, -1, 0, 0, 1, 1, 2 Desvantagem da S² : Possui a unidade de medida igual ao quadrado da unidade de medida dos dados. EX: dados = m S² = m² Então... DESVIO PADRÃO (S) Possui as características da variância porém, tem a mesma unidade de medida dos dados. Representa o padrão de oscilações que os valores da série apresentam em relação à média. É fundamental em Estatística, sendo um importante marcador de variação. É freqüentemente usado em conjunto com a média e, como esta, também é afetado por valores extremos. DESVIO PADRÃO (S) É a raiz quadrada da variância. DP = S = √ SQD n - 1 S2 = SQD n - 1 = Cálculo de S X: 4 5 5 6 6 7 7 8 S2 = (4 + 1 + 1 + 0 + 0 + 1 + 1 + 4) / 7 = 12 / 7 = 1,71 Desvios (X– X) -2, -1, -1, 0, 0, 1, 1, 2 S = √1,71 = 1,31 DP = S = √ SDQ n - 1 = Comparação das três turmas pela média e desvio padrão turma notas X S A 4 5 5 6 6 7 7 8 6 1,31 B 1 2 4 6 6 9 10 10 6 3,51 C 0 6 7 7 7 7,5 7,5 6 2,69 Coeficiente de variação É a razão entre o desvio padrão e a média. O resultado é multiplicado por 100, para que o CV seja dado em porcentagem. CV = S x 100 x A = CV = S x 100 CV = 2 x 100 CV =66,67% 2 3 B = CV = S x 100 CV = 2 x 100 CV =3,64% 2 55 EX: Imaginem dois grupos de pessoas (idades) A=( 3,1 e 5 ) e B=( 55, 57 e 53) Média: A = 3 anos e de B = 55 anos Variância: 4 Desvio padrão: 2 Sabemos que a diferença de 2 anos no 1º grupo é mais importante que no 2º, então calculamos CV. Conclusão: Os alunos são, aproximadamente, duas vezes mais dispersos quanto ao peso do que quanto à altura. Altura 1,143m 0,063m 5,5% Peso 50 kg 6kg 12% Média Desvio Padrão Coef. de Variação Altura e peso de alunos Exemplo 2: Hora de exercitar o que acabamos de estudar! Podem fazer em dupla, assim vocês podem trocar saberes! Os exercícios deverão ser entregues na próxima aula. Obrigada ! “Algumas pessoas usam a estatística como um bêbado utiliza um poste de iluminação – para servir de apoio e não para iluminar.” Andrew Lang Área social pesquisa de opinião Área de saúde medicamentos genéricos epidemia de meningite Área industrial controle de qualidade Área financeira investimentos no mercado financeiro 1 7 53 16 13 29 84 53 60 64 53 29 0 10 20 30 40 50 60 70 80 90 949596979899 î í ì ® ® amostra X população m ( ) 1 2 2 - - = å n X X S 1 ( ) i - = = å - N x x S DP 2 6 = X Grupo indeterminadopositivonegativo Frequencia 120 100 80 60 40 20 0 sim não Presença de cães errantes 0 0,05 0,1 0,15 0,2 0,25 0,3 0,35 0,4 0,45 0 1 2 3 4 X P ( X = x )
Compartilhar