Baixe o app para aproveitar ainda mais
Prévia do material em texto
Prof. Dr. Giovani Peres UNIDADE I Bioestatística Aplicada à Biomedicina Estatística e Biomedicina. Introdução à Estatística Fonte: Pete Ellis. Disponível em: <https://www.nature.com/articles/492180a>. Objetivo: Fornecer ferramentas descritivas e de análise de dados que permitam uma melhor compreensão de eventos e estimação de probabilidades, para que sejam tomadas decisões a partir disso. Introdução à Estatística Objetivo: Fornecer ferramentas descritivas e de análise de dados que permitam uma melhor compreensão de eventos e estimação de probabilidades, para que sejam tomadas decisões a partir disso. A estatística é a ciência que tem por objetivos planejar e otimizar experimentos; orientar sua condução; coletar, descrever e analisar suas respostas, retirando o maior número possível das informações nelas contidas. Introdução à Estatística A estatística traz ordem ao caos. É uma ciência que se preocupa com: Organização; Descrição; Análises; Interpretações. Introdução à Estatística Estatística Descritiva Estatística Indutiva ] ] A estatística traz ordem ao caos. Introdução à Estatística Tabela 1 – Número de casos prováveis e casos confirmados de dengue em 2017, por unidade da Federação, organizados de forma aleatória Fonte: BRASIL. Ministério da Saúde. Monitoramento dos casos de dengue, febre de chikungunya e febre pelo vírus Zika até a Semana Epidemiológica 52, 2017. Boletim epidemiológico, Brasília, v. 49, n. 2, 2018. Unidade da Federação Casos prováveis Casos confirmados Rio de Janeiro 10.592 83 São Paulo 13.211 82 Rio Grande do Sul 227 1 Santa Catarina 256 0 Amapá 886 11 Amazonas 3.984 16 Ceará 40.604 119 Paraíba 3.837 19 Paraná 4.195 10 Bahia 9.819 17 Roraima 316 1 Minas Gerais 28.779 140 Piauí 5.184 11 Sergipe 609 2 Alagoas 2.930 15 Rondônia 2.460 5 Rio Grande do Norte 7.311 20 Mato Grosso do Sul 2.112 36 Pará 7.813 9 Espírito Santo 7.019 115 Maranhão 7.049 53 Pernambuco 9.043 52 Distrito Federal 4.210 103 Mato Grosso 8.977 18 Tocantins 5.077 102 Acre 2.124 1 Goiás 63.430 1.820 A estatística traz ordem ao caos. Introdução à Estatística Tabela 2 – Número de casos prováveis e casos confirmados de dengue em 2017, por unidade da Federação, em ordem alfabética Fonte: BRASIL. Ministério da Saúde. Monitoramento dos casos de dengue, febre de chikungunya e febre pelo vírus Zika até a Semana Epidemiológica 52, 2017. Boletim epidemiológico, Brasília, v. 49, n. 2, 2018. Unidade da Federação Casos prováveis Casos confirmados Acre 2.124 1 Alagoas 2.930 15 Amapá 886 11 Amazonas 3.984 16 Bahia 9.819 17 Ceará 40.604 119 Distrito Federal 4.210 103 Espírito Santo 7.019 115 Goiás 63.430 1.820 Maranhão 7.049 53 Mato Grosso 8.977 18 Mato Grosso do Sul 2.112 36 Minas Gerais 28.779 140 Pará 7.813 9 Paraíba 3.837 19 Paraná 4.195 10 Pernambuco 9.043 52 Piauí 5.184 11 Rio de Janeiro 10.592 83 Rio Grande do Norte 7.311 20 Rio Grande do Sul 227 1 Rondônia 2.460 5 Roraima 316 1 Santa Catarina 256 0 São Paulo 13.211 82 Sergipe 609 2 Tocantins 5.077 102 A estatística traz ordem ao caos. Introdução à Estatística Tabela 3 – Número de casos prováveis e casos confirmados de dengue em 2017, por unidade da Federação, em ordem decrescente de casos confirmados Fonte: BRASIL. Ministério da Saúde. Monitoramento dos casos de dengue, febre de chikungunya e febre pelo vírus Zika até a Semana Epidemiológica 52, 2017. Boletim epidemiológico, Brasília, v. 49, n. 2, 2018. Unidade da Federação Casos prováveis Casos confirmados Goiás 63.430 1.820 Minas Gerais 28.779 140 Ceará 40.604 119 Espírito Santo 7.019 115 Distrito Federal 4.210 103 Tocantins 5.077 102 Rio de Janeiro 10.592 83 São Paulo 13.211 82 Maranhão 7.049 53 Pernambuco 9.043 52 Mato Grosso do Sul 2.112 36 Rio Grande do Norte 7.311 20 Paraíba 3.837 19 Mato Grosso 8.977 18 Bahia 9.819 17 Amazonas 3.984 16 Alagoas 2.930 15 Amapá 886 11 Piauí 5.184 11 Paraná 4.195 10 Pará 7.813 9 Rondônia 2.460 5 Sergipe 609 2 Acre 2.124 1 Rio Grande do Sul 227 1 Roraima 316 1 Santa Catarina 256 0 Processo de pesquisa Introdução à Estatística Dados Identificação das variáveis Mensuração das variáveis Gráficos Modelos Observação inicial (pergunta de pesquisa) Geração de uma teoria Geração de hipóteses Coleta de dados para testar a teoria Análise dos dados Fonte: FIELD, A. Discovering statistics using IBM SPSS statistics. 4. ed. Thousand Oaks: Sage, 2013. Adaptada. Processo de pesquisa Introdução à Estatística Dados Identificação das variáveis Mensuração das variáveis Gráficos Modelos Observação inicial (pergunta de pesquisa) Geração de uma teoria Geração de hipóteses Coleta de dados para testar a teoria Análise dos dados Fonte: FIELD, A. Discovering statistics using IBM SPSS statistics. 4. ed. Thousand Oaks: Sage, 2013. Adaptada. Fonte: <http://www.supercoloring.com> Processo de pesquisa Pergunta de pesquisa: Objetividade versus subjetividade. Introdução à Estatística Dados Identificação das variáveis Mensuração das variáveis Gráficos Modelos Observação inicial (pergunta de pesquisa) Geração de uma teoria Geração de hipóteses Coleta de dados para testar a teoria Análise dos dados Fonte: FIELD, A. Discovering statistics using IBM SPSS statistics. 4. ed. Thousand Oaks: Sage, 2013. Adaptada. Processo de pesquisa Pergunta de pesquisa: Objetividade versus subjetividade. São os Beatles a melhor banda de todos os tempos? São os Beatles a banda que mais vendeu discos/emplacou sucessos? Introdução à Estatística Fonte: <http://www.supercoloring.com> Variáveis Qualitativas (ou categóricas) Nominais. Ordinais. Quantitativas (ou numéricas) Discretas. Contínuas. Introdução à Estatística Fonte: <https://pixabay.com/illustrations/birth-cow-cattle- animals-calf-1472656/> Relacione as variáveis de uma pesquisa estatística, apresentadas à esquerda, com as características de uma população, apresentadas à direita: 1. Qualitativa nominal ( ) Temperatura corporal (ºC) 2. Qualitativa ordinal ( ) Número de portadores de esquizofrenia 3. Quantitativa discreta ( ) Sexo 4. Quantitativa contínua ( ) Intensidade da perda de peso em atletas (leve, moderada ou forte) a) 3, 4, 2, 1. b) 2, 3, 1, 4. c) 4, 3, 1, 2. d) 2, 1, 4, 3. e) 4, 1, 3, 2. Interatividade Relacione as variáveis de uma pesquisa estatística, apresentadas à esquerda, com as características de uma população, apresentadas à direita: 1. Qualitativa nominal ( ) Temperatura corporal (ºC) 2. Qualitativa ordinal ( ) Número de portadores de esquizofrenia 3. Quantitativa discreta ( ) Sexo 4. Quantitativa contínua ( ) Intensidade da perda de peso em atletas (leve, moderada ou forte) a) 3, 4, 2, 1. b) 2, 3, 1, 4. c) 4, 3, 1, 2. d) 2, 1, 4, 3. e) 4, 1, 3, 2. Resposta Erro Em medição, é a discrepância entre o valor real do que se mede e os números utilizados para representar essa medição. Exemplo hemocitômetro: Suspensão contendo exatamente 8,0x104 células/mL. Contagens independentes: 7,5x104, 7,0x104, 9,0x104 e 8,5x104. Conceitos importantes Fonte: <https://bitesizebio.com/13687/c ell-counting-with-a- hemocytometer-easy-as-1-2-3/> Erro Uma forma de assegurar que o erro de medição seja mínimo é determinar propriedades daquela medição que nos dê confiança no registro. Validade e confiabilidade. Repetição. Conceitos importantes Fonte: <http://www.unityinstrumentos.com.br/ voce-conhece-a-diferenca-entre- precisao-e-exatidao/> População conjunto de todos os elementos ou resultados sob investigação. Amostra qualquer subconjunto da população. Conceitos importantes Fonte: CORTY, E. W. Using and Interpreting Statistics. 3. ed. New York: Worth Publishers, 2016. Adaptada. Quandofor possível estudar todos os membros da população, estamos diante de um censo. Dificuldades: alto custo; tempo; levantamento de dados. Conceitos importantes Fonte: CORTY, E. W. Using and Interpreting Statistics. 3. ed. New York: Worth Publishers, 2016. Adaptada. Amostragem aleatória (probabilística); determinística (não probabilística). Técnicas de amostragem A escolha da técnica de amostragem: o objetivo da pesquisa; o erro aceitável nos resultados; a acessibilidade aos elementos da população; a representatividade desejada; o tempo despendido; a disponibilidade de recursos. Técnicas de amostragem Fonte: FÁVERO, L. P.; BELFIORE, P. Manual de análise de dados. 1. ed. Rio de Janeiro: Elsevier, 2017. Adaptada. Técnicas de amostragem Aleatória Determinística Simples Sistemática Estratificada Por conglomerados Por conveniência Por julgamento Por quotas Bola de neve Vantagens: critérios de seleção rigorosamente definidos; evita subjetividade; possibilidade de determinar o tamanho da amostra matematicamente. Desvantagens: dificuldade em obter listagens atuais e completas da população; aleatoriedade pode gerar uma amostra muito dispersa. As amostras aleatórias apresentam condições ideais para o tratamento estatístico, o que nem sempre é viável com amostras determinísticas. Amostragem aleatória Vantagens: menor custo; menor tempo de estudo; menor necessidade de pessoal. Desvantagens: existem unidades que não têm possibilidade de serem escolhidas; pode haver um viés de opinião pessoal; não se sabe grau de confiança que as conclusões podem ser inferidas. Portanto, há de se ter cuidado ao optar pela utilização desse tipo de amostragem, uma vez que ela é subjetiva. Amostragem não aleatória Amostragem aleatória Probabilística (ou aleatória) Simples EstratificadaSistemática Conglomerado Sorteio aleatório de elementos provenientes da população, até que o tamanho desejado da amostra seja atendido. Quando um elemento sorteado for removido antes do próximo sorteio, estamos diante de uma amostra aleatória simples sem reposição. Caso seja permitido o sorteio de um mesmo elemento mais de uma vez, estamos diante de uma amostra aleatória simples com reposição. Amostragem aleatória simples Exemplo: Quantas amostras de 6 números diferentes podem ser extraídas de um total de 60 números? Amostragem aleatória simples Fonte: <https://pt.wikipedia.org/wiki/Mega-Sena> Amostragem aleatória Probabilística (ou aleatória) Simples EstratificadaSistemática Conglomerado Quando os elementos da população estiverem ordenados e forem retirados periodicamente, teremos uma amostragem sistemática. Primeiramente, deve-se selecionar o intervalo da amostra (k) obtido pelo quociente entre o tamanho da população e o tamanho da amostra. Escolher um elemento a cada k-ésimo elemento da lista de forma sucessiva, até atingir o tamanho da amostra (n). Amostragem aleatória sistemática Exemplo: Em uma fábrica de reagentes químicos, 500 frascos de 1 kg de NaCl, grau de pureza analítico, foram produzidos na última hora. Um funcionário responsável pelo controle de qualidade necessita retirar uma amostra com 20 elementos dessa população para avaliar se a massa dos frascos está dentro dos valores aceitáveis de erro. Selecione 20 frascos com base no procedimento de amostragem sistemática. Amostragem aleatória sistemática Amostragem aleatória Probabilística (ou aleatória) Simples EstratificadaSistemática Conglomerado A população é dividida (ou estratificada) em certo número de subpopulações que não se superpõem, chamadas estratos ou camadas e, em cada estrato, uma amostra é definida. Essa técnica é bastante aplicada para populações com grupos bastante homogêneos internamente, mas cujas características variam muito entre si. Amostragem aleatória estratificada Exemplo: Deseja-se realizar uma pesquisa sobre “dieta e saúde” com mulheres da cidade de São Paulo. Para isso, a população é dividida em categorias de idade (5-14, 15-24, 25-34, 35-44, 45-54, 55-64, 65-74) e, para cada intervalo, 5% da população será entrevistada, ou seja, haverá um respeito à proporção de cada faixa etária na população total. Tem-se portanto, um exemplo de amostragem estratificada. Amostragem aleatória estratificada Amostragem aleatória Probabilística (ou aleatória) Simples EstratificadaSistemática Conglomerado Se a população for subdividida em grupos e a amostragem for realizada a partir dos grupos e não dos indivíduos da população, estamos diante de uma amostragem por conglomerados (grupos). Dentro de cada conglomerado, podem-se selecionar todos os elementos ou apenas parte deles. Amostragem aleatória por conglomerado Exemplo: Deseja-se estudar a renda da população da cidade de São Paulo e, para isso, a população foi dividida em bairros. Alguns bairros (10% deles) foram selecionados aleatoriamente e, para cada bairro, selecionou-se, de forma aleatória, 10% do total de moradores. Tem-se, portanto, um exemplo de amostragem por conglomerados em dois estágios. Amostragem aleatória por conglomerado Quantas amostras de 3 pacientes diferentes podem ser extraídas de um total de 10? a) 720. b) 240. c) 120. d) 10. e) 3. Interatividade Quantas amostras de 3 pacientes diferentes podem ser extraídas de um total de 10? a) 720. b) 240. c) 120. d) 10. e) 3. Resposta A organização e a apresentação de dados não são independentes da classificação das variáveis em quantitativas ou qualitativas. Uma distribuição de frequência é uma forma intuitiva de organizar e sumariar os resultados, para se ter uma ideia global sobre eles. Tabelas de distribuição de frequência: de forma não agrupada; contagem de quão frequente é cada valor de uma variável em um conjunto de dados; agrupada. Contagem se refere a valores de grupos ou intervalos da variável. Organização e apresentação de dados Tabelas de distribuição de frequência para dados não agrupados, geralmente, são utilizadas quando os valores que uma variável pode assumir são limitados. Imaginemos que 31 indivíduos responderam à pergunta “quantas crianças existem em sua família?”, sendo que: 9 entrevistados disseram haver apenas 1 criança; 14 disseram haver 2; 5 disseram haver 3; 2 responderam 4; e apenas 1 respondeu 6. Organização e apresentação de dados Note: Frequência observada. Existe um título. As colunas possuem nomes. Uma linha do total. Não houve nenhuma observação para cinco crianças. Organização e apresentação de dados Número de crianças na família Frequência (ni) 1 9 2 14 3 5 4 2 5 0 6 1 Total 31 Tabela 4 – Distribuição de frequência dos 31 entrevistados por número de crianças na família Fonte: livro-texto A tabela a seguir traz algumas informações a mais: Organização e apresentação de dados Tabela 5 – Distribuição de frequência e porcentagens dos 31 entrevistados por número de crianças na família Número de crianças na família Frequência (n) Frequência acumulada Porcentagem (%) Porcentagem acumulada (%) 1 9 9 29,03 29,03 2 14 23 45,16 74,19 3 5 28 16,13 90,32 4 2 30 6,45 96,77 5 0 30 0,00 96,77 6 1 31 3,23 100,00 Total 31 - 100 - Fonte: livro-texto Para transformar um valor em porcentagem, basta dividir a frequência pelo total de elementos do conjunto e, em seguida, multiplicar por 100. Por exemplo, na terceira linha: Organização e apresentação de dados Número de crianças na família Frequência (n) Frequência acumulada Porcentagem (%) Porcentagem acumulada (%) 1 9 9 29,03 29,03 2 14 23 45,16 74,19 3 5 28 16,13 90,32 4 2 30 6,45 96,77 5 0 30 0,00 96,77 6 1 31 3,23 100,00 Total 31 - 100 - Fonte: livro-texto Quando lidamos com uma variável que possui uma grande amplitudecom muitas possibilidades de respostas, uma distribuição de frequência para dados agrupados faz mais sentido. Organização e apresentação de dados Casos com alterações no crescimento e no desenvolvimento possivelmente relacionadas à infecção pelo vírus Zika. Organização e apresentação de dados Unidade da Federação Casos suspeitos notificados Casos confirmados Bahia 2.657 549 Pernambuco 2.779 465 Rio de Janeiro 1.177 290 Paraíba 1.174 203 Maranhão 501 187 São Paulo 1.637 169 Ceará 835 162 Rio Grande do Norte 633 151 Sergipe 317 138 Goiás 506 126 Minas Gerais 976 123 Piauí 301 119 Alagoas 708 105 Mato Grosso 447 79 Amazonas 140 73 Espírito Santo 435 71 Rio Grande do Sul 404 44 Distrito Federal 248 33 Rondônia 132 33 Mato Grosso do Sul 74 31 Tocantins 397 30 Pará 157 22 Santa Catarina 48 21 Roraima 49 18 Amapá 37 17 Paraná 70 10 Acre 61 10 Fonte: BRASIL. Ministério da Saúde. Monitoramento integrado de alterações no crescimento e desenvolvimento relacionadas à infecção pelo vírus Zika e outras etiologias infecciosas, até a Semana Epidemiológica 45 de 2018. Boletim epidemiológico, Brasília, v. 49, n. 54, 2018. Não existe um número fixo de intervalos sempre possíveis, mas uma regra prática habitualmente utilizada é de 7±2, ou seja, de cinco a nove intervalos. Note que essa é uma regra prática – se for melhor usar menos de cinco ou mais de nove intervalos para a comunicação da mensagem desejada, que assim seja. Usemos seis intervalos (0 a 99, 100 a 199, 200 a 299, 300 a 399, 400 a 499 e 500 a 599) nesse exemplo. Organização e apresentação de dados Organização e apresentação de dados Número de casos confirmados Frequência (n) Frequência acumulada Porcentagem (%) Porcentagem acumulada (%) 0-99 14 14 51,85 51,85 100-199 9 23 33,33 85,19 200-299 2 25 7,41 92,59 300-399 0 25 0,00 92,59 400-499 1 26 3,70 96,30 500-599 1 27 3,70 100,00 Total 27 - 100 - Tabela 7 – Distribuição de frequência para dados agrupados e porcentagens referentes ao número de casos confirmados de alterações no crescimento e no desenvolvimento possivelmente relacionadas à infecção pelo vírus Zika e outras etiologias infecciosas, entre as semanas epidemiológicas 45/2015 e 45/2018 Fonte: BRASIL. Ministério da Saúde. Boletim epidemiológico, Brasília, v. 49, n. 54, 2018. Adaptado. Gráficos podem ser utilizados para apresentar informações referentes a conjuntos de dados e suas distribuições de frequência. Vamos destacar, inicialmente, três gráficos diferentes que apresentam frequências: gráfico de barras (ou de colunas); histograma; polígono de frequência. Organização e apresentação de dados Gráfico de barras Organização e apresentação de dados Sexo Frequência (n) Porcentagem (%) Masculino 12 26,67 Feminino 33 73,33 Total 45 100 0 5 10 15 20 25 30 35 Masculino Feminino F re q u ê n c ia Sexo Tabela 8 – Distribuição de frequência da variável sexo em uma amostra hipotética de 45 estudantes Figura 1 – Gráfico de barras mostrando a frequência da variável sexo em uma amostra hipotética de 45 estudantes. As barras não se encostam uma na outra, pois a variável categórica nominal representada no eixo x assume valores discretos Fonte: livro-texto Histograma e polígono de frequências: Organização e apresentação de dados 0 5 10 15 20 25 30 35 40 22 25 28 31 34 37 40 43 46 49 52 55 58 61 64 67 70 73 76 79 82 85 88 91 F re q u ê n c ia Umidade (%) 0 5 10 15 20 25 30 35 40 22 25 28 31 34 37 40 43 46 49 52 55 58 61 64 67 70 73 76 79 82 85 88 91 F re q u ê n c ia Umidade (%) Histograma e polígono de frequências para a média diária do percentual de umidade na cidade de Goiânia, entre 26/01/2018 e 25/01/2019. Intervalos correspondem a variações de 3 pontos percentuais. Fonte: livro-texto Conhecendo o formato da distribuição dos dados com os quais se trabalha, é possível avaliar se certos cálculos podem ou não ser empregados. Curva normal. Modelo fundamental em probabilidades e inferências estatísticas. Formatos das distribuições de frequência F re q u ê n c ia Variável numérica Fonte: livro-texto Aspectos utilizados para descrever o formato de uma distribuição: Modalidade. Assimetria. Curtose. Formatos das distribuições de frequência Aspectos utilizados para descrever o formato de uma distribuição: Modalidade. Assimetria. Curtose. Formatos das distribuições de frequência F re q u ê n c ia Variável numérica F re q u ê n c ia Variável numérica Fonte: livro-texto Aspectos utilizados para descrever o formato de uma distribuição: Modalidade. Assimetria. Curtose. Formatos das distribuições de frequência Fonte: adaptado de: BUSSAB, W. O.; MORETTIN, P. A. Estatística básica. 8. ed. São Paulo: Saraiva, 2013. Assimétrica à direita Assimétrica à esquerda Aspectos utilizados para descrever o formato de uma distribuição: Modalidade. Assimetria. Curtose. Formatos das distribuições de frequência Fonte: FÁVERO, L. P.; BELFIORE, P. Análise de dados. Rio de Janeiro: Elsevier, 2009 Figura 3.5: Curva mesocúrtica Figura 3.6: Curva platicúrtica Figura 3.6: Curva leptocúrtica Imaginemos que um grupo de estudantes solicitou uma porção de batatas fritas e, com auxílio de uma régua, mediu o comprimento de cada batata (n = 99), aproximando o valor para o milímetro mais próximo. Visando a inspecionar o formato da distribuição de frequências dessa variável, o que poderia ser feito? a) Construir um gráfico de barras. b) Construir um histograma. c) Organizar os dados em uma tabela de distribuição de frequência para dados não agrupados. d) Organizar os dados em uma tabela de distribuição de frequência para dados agrupados. e) Ordenar os dados em ordem crescente. Interatividade Imaginemos que um grupo de estudantes solicitou uma porção de batatas fritas e, com auxílio de uma régua, mediu o comprimento de cada batata (n = 99), aproximando o valor para o milímetro mais próximo. Visando a inspecionar o formato da distribuição de frequências dessa variável, o que poderia ser feito? a) Construir um gráfico de barras. b) Construir um histograma. c) Organizar os dados em uma tabela de distribuição de frequência para dados não agrupados. d) Organizar os dados em uma tabela de distribuição de frequência para dados agrupados. e) Ordenar os dados em ordem crescente. Resposta Vimos que o resumo de dados por meio de tabelas de frequências e gráficos fornece muito mais informações sobre o comportamento de uma variável do que a própria tabela original de dados. Veremos aqui que é possível resumir ainda mais esses dados, apresentando um ou alguns valores que sejam representativos de toda a série. Os estatísticos chamam esses valores de medidas de posição (ou localização) central e, usualmente, emprega-se a média aritmética, a mediana ou a moda. Medidas resumo A média aritmética é um conceito familiar a todos e corresponde ao somatório das observações dividido pelo número delas. Sendo M = a média amostral σ𝑋= o somatório dos valores da variável X n = o número de observações da amostra Medidas resumo Exemplo: Supondo que um estudante deseje avaliar a média de altura de cinco colegas. A altura em centímetros dos cinco indivíduos aleatoriamente selecionados em sua classe foi de: 157, 165, 167, 175 e 185. Aplicando-se a equação anterior, tem-se: Medidas resumo A mediana é o valor que ocupa a posição central de um conjunto ordenado de dados. Em outras palavras, ela é o número que separa os valores de um conjunto em duas metades. Medidas resumo Posição Altura (cm) 1 157 2 165 3 167 4 175 5 185 Fonte: livro-texto A terceira medida de posição central chama-se moda e corresponde ao valor que ocorre com a maior frequência em um conjunto de dados. Para o conjunto hipotético utilizado até então (variável altura), não há moda, pois todos os valores ocorrem com a mesma frequência (apenas uma vez cada). Medidas resumo O resumo de um conjunto de dados por uma única medida representativa da posição central esconde toda a informação sobre a variabilidade desse conjunto. Variabilidade: grau de espalhamento dos dados em um conjunto. Medidas de variabilidade (ou de dispersão). Medidas resumo 0 50 100 150 200 F re q u ê n c ia Variável numérica hipotética Fonte: livro-texto Medidas de variabilidade (ou de dispersão). A medida de variabilidade mais simples é a amplitude, a variação entre o maior e o menor valor de um conjunto. 157, 165, 167, 175 e 185. Medidas resumo Medidas de variabilidade (ou de dispersão). Existe um problema com o uso da amplitude: ela depende apenas do maior e do menor valor para ser calculada, de tal forma, ignorando a maior parte dos dados e sofrendo efeito de valores extremos (outliers). Uma solução consiste em retirar do total do conjunto os 25% que estiverem na porção inferior e os 25% que estiverem na porção superior do conjunto ordenado. Dessa forma, a amplitude será calculada entre os 50% centrais do conjunto. Essa medida é conhecida como amplitude interquartílica. Medidas resumo Medidas de variabilidade (ou de dispersão). A amplitude interquartílica é assim chamada pois os dados são divididos em quatro partes iguais (quartis). Cada quartil contém 25% das observações de um conjunto. Medidas resumo Fonte: livro-texto Medidas de variabilidade (ou de dispersão). Considere os seguintes valores de idade (anos) de 20 indivíduos em uma amostra: 16, 17, 18, 21, 22 23, 24, 25, 26, 29 32, 34, 34, 35, 36 42, 43, 46, 46, 49. Medidas resumo ll l Média Erros negativos Erros positivos Medidas de variabilidade (ou de dispersão). Erro ou desvio: a média também é útil, pois é possível avaliar o quanto um valor individual se distancia dela. Erros positivos indicam que os valores observados estão acima da média, já erros negativos indicam que estão abaixo. Medidas resumo Fonte: livro-texto Medidas de variabilidade (ou de dispersão). Medidas resumo Altura Desvio (X - M) 157 -12,8 165 -4,8 167 -2,8 175 5,2 185 15,2 σ = 0,0 - 20,4 20,4 Fonte: livro-texto Medidas de variabilidade (ou de dispersão). Medidas resumo Altura Desvio (X - M) Desvios quadrados (X - M)2 157 -12,8 163,84 165 -4,8 23,04 167 -2,8 7,84 175 5,2 27,04 185 15,2 231,04 σ = 0,0 σ = 452,80 Fonte: livro-texto Altura Desvio (X - M) Desvios quadrados (X - M)2 157 -12,8 163,84 165 -4,8 23,04 167 -2,8 7,84 175 5,2 27,04 185 15,2 231,04 σ = 0,0 σ = 452,80 Medidas de variabilidade (ou de dispersão). Variância amostral: A interpretação da variância pode ser confusa, uma vez que ela é dada em unidades quadráticas. Medidas resumo Fonte: livro-texto Medidas de variabilidade (ou de dispersão). Uma simples solução é tirar a raiz quadrada da variância, transformando a medida de volta para sua unidade original. Essa medida é conhecida como desvio padrão, uma das medidas de variabilidade mais comumente empregadas. Para a amostra de cinco estudantes, descreveríamos que o conjunto possui uma média de 169,80 cm, com desvio padrão de 10,64 cm. Medidas resumo Cinco alunos em uma aula prática cronometraram o tempo necessário para cumprir todas as etapas de preparo de uma amostra para dosagem espectrofotométrica. Os tempos gastos, em minutos, foram 15, 12, 10, 17 e 16. A média aritmética e a mediana são, respectivamente: a) 10 e 70. b) 70 e 10. c) 15 e 14. Interatividade d) 14 e 15. e) 70 e 15. Cinco alunos em uma aula prática cronometraram o tempo necessário para cumprir todas as etapas de preparo de uma amostra para dosagem espectrofotométrica. Os tempos gastos, em minutos, foram 15, 12, 10, 17 e 16. A média aritmética e a mediana são, respectivamente: a) 10 e 70. b) 70 e 10. c) 15 e 14. Resposta d) 14 e 15. e) 70 e 15. ATÉ A PRÓXIMA!
Compartilhar