Baixe o app para aproveitar ainda mais
Prévia do material em texto
T002 MEDIDAS DESCRITIVAS: MEDIDAS DE TENDÊNCIA CENTRAL E DE VARIABILIDADE Prof. Simone Soares Echeveste Nesta unidade temática, você vai aprender • A resumir e representar um conjunto de dados através das Medidas de Tendência Central; • A compreender a variabilidade de um conjunto de dados através das Medidas de Variabilidade; • A compreender os procedimentos de cálculo e interpretação das Medidas de Tendência Central e das Medidas de Variabilidade. Muitas vezes, ao finalizar uma coleta, os pesquisadores deparam-se com uma grande quantidade de dados, surgindo a necessidade do cálculo de algumas MEDIDAS DESCRITIVAS que auxiliem no resumo de toda essa informação. Podemos aprofundar um pouco mais a nossa análise estatística para o caso em que as variáveis analisadas sejam QUANTITATIVAS através das medidas estatísticas. Essas medidas dividem-se em dois grupos de medidas: as Medidas de tendência central e as Medidas de variabilidade. As medidas de tendência central objetivam através de um ÚNICO VALOR obtido REPRESENTAR todos os demais valores coletados em uma pesquisa, já as medidas de variabilidade revelam como os dados variam em torno desse valor. As principais medidas de tendência central são: a média, mediana e moda. As principais medidas de dispersão são a variância, desvio padrão e coeficiente de variação. Muitas pesquisas apresentam em seus resultados apenas estatísticas descritivas e, com isso, cumprem com os objetivos propostos. Em outros casos, é necessário o uso de testes estatísticos para a comprovação de hipóteses. Nesses casos, essas medidas são utilizadas como um passo inicial para a escolha do teste estatístico adequado. Você conhecerá cada uma dessas medidas no que se refere à aplicabilidade, ao cálculo e à interpretação dos resultados obtidos. Ao final desse estudo, deverá ser capaz de calcular e interpretar as medidas estatísticas apresentadas no contexto de uma pesquisa. MEDIDAS DESCRITIVAS: MEDIDAS DE TENDÊNCIA CENTRAL E MEDIDAS DE VARIABILIDADE MEDIDAS DE TENDÊNCIA CENTRAL Estas medidas têm por objetivo encontrar a “tendência central” de um conjunto de dados, ou seja, encontrar o valor do meio ou ainda os valores típicos de uma distribuição. São medidas úteis para caracterizar e representar um conjunto de dados através de um único valor utilizando critérios distintos para isso. As medidas de tendência central são: média, mediana e moda. A média é a medida de tendência central mais conhecida e mais utilizada de todas. Existem vários tipos de médias, a que T002 https://www.sites.google.com/ulbra.br/G000302GS001/t002 1 of 13 22/05/2022 06:58 utilizamos em pesquisas é a Média aritmética, obtida através da soma de todos os valores da variável investigada (valores de x) dividida pelo número total de valores no conjunto de dados (n). Os dados abaixo representam o tempo de relacionamento (em anos) de uma amostra de 7 clientes com a sua operadora de telefonia celular. T002 https://www.sites.google.com/ulbra.br/G000302GS001/t002 2 of 13 22/05/2022 06:58 https://drive.google.com/file/d/1n2Qh6HVOiPeZ3U-It77N9z_Zyunpi_ol/view?usp=sharing https://drive.google.com/file/d/1n2Qh6HVOiPeZ3U-It77N9z_Zyunpi_ol/view?usp=sharing https://drive.google.com/file/d/1Iucm60ODJpHO7Yc6c6avGWYbUNw2UevT/view?usp=sharing https://drive.google.com/file/d/1Iucm60ODJpHO7Yc6c6avGWYbUNw2UevT/view?usp=sharing Elementos importantes: Amostra (n): 7 clientes Variável (x): tempo de relacionamento com a operadora de telefonia celular Média: “Em média, o tempo de relacionamento dos clientes com sua operadora de telefonia celular é de 17,4 anos”. T002 https://www.sites.google.com/ulbra.br/G000302GS001/t002 3 of 13 22/05/2022 06:58 https://drive.google.com/file/d/1Iucm60ODJpHO7Yc6c6avGWYbUNw2UevT/view?usp=sharing https://drive.google.com/file/d/1Iucm60ODJpHO7Yc6c6avGWYbUNw2UevT/view?usp=sharing https://drive.google.com/file/d/1QLpTIiCBo49oDsJmQIL95SNj2lvOoq2q/view?usp=sharing https://drive.google.com/file/d/1QLpTIiCBo49oDsJmQIL95SNj2lvOoq2q/view?usp=sharing MÉDIA PARA DADOS AGRUPADOS EM TABELAS DE FREQUÊNCIA Quando os dados estão organizados na forma de uma tabela de frequências, devemos multiplicar os diferentes valores “x” pelas respectivas frequências “f”. A fórmula utilizada deverá ser neste caso: Considere a seguinte tabela referente ao Número de faltas no período de uma ano em uma amostra de 62 funcionários de uma empresa: Número de faltas no período de um ano T002 https://www.sites.google.com/ulbra.br/G000302GS001/t002 4 of 13 22/05/2022 06:58 https://drive.google.com/file/d/19FORjxFv_8KFLYvPYSOpMI6lZdtSlZHa/view?usp=sharing https://drive.google.com/file/d/19FORjxFv_8KFLYvPYSOpMI6lZdtSlZHa/view?usp=sharing https://drive.google.com/file/d/1vlgCJtv_jBUBg-N4SkPX97WZqheM3JCW/view?usp=sharing https://drive.google.com/file/d/1vlgCJtv_jBUBg-N4SkPX97WZqheM3JCW/view?usp=sharing “Em média, os funcionários tiveram 2,9 faltas em um ano”. Ordenados os elementos da amostra em ordem crescente, a mediana é o valor considerado o ponto do meio, que a divide ao meio. Isto é, metade dos elementos da amostra é menor ou igual à mediana e a outra metade é maior ou igual à mediana. T002 https://www.sites.google.com/ulbra.br/G000302GS001/t002 5 of 13 22/05/2022 06:58 https://drive.google.com/file/d/1vlgCJtv_jBUBg-N4SkPX97WZqheM3JCW/view?usp=sharing https://drive.google.com/file/d/1vlgCJtv_jBUBg-N4SkPX97WZqheM3JCW/view?usp=sharing https://drive.google.com/file/d/1izy5luoyyndltxc8U49r9FMlLibRuYIz/view?usp=sharing https://drive.google.com/file/d/1izy5luoyyndltxc8U49r9FMlLibRuYIz/view?usp=sharing Notação: Md ou Me Como obter a Mediana: 1º) todos os valores do conjunto de dados devem ser colocados em ordem crescente; se houver algum valor que se repita mais de uma vez, ele deve ser repetido na ordenação também. 2º) devemos encontrar a posição da mediana considerando a seguinte regra: se o tamanho da amostra (n) é ímpar, a mediana é o valor central; se o tamanho da amostra (n) for par, a mediana será a média dos dois valores centrais. EXEMPLO 1: Quando o tamanho da amostra “n” for ímpar. Uma pesquisa foi realizada com o objetivo de verificar a renda, em salários mínimos, de uma amostra de 5 clientes de uma loja. 8,0 9,1 8,5 9,7 9,2 Amostra (n): 5 clientes de uma loja Variável (x): Renda em salários mínimos Mediana (Md) 1º) Colocar os valores em ordem crescente 8,0 8,5 9,1 9,2 9,7 2º) Encontrar o valor central no conjunto de dados 8,0 8,5 9,1 9,2 9,7 “Metade dos clientes dessa loja possuem renda de 9,1 salários mínimos ou menos, e metade dos clientes possui renda de 9,1 salários mínimos ou mais.” T002 https://www.sites.google.com/ulbra.br/G000302GS001/t002 6 of 13 22/05/2022 06:58 EXEMPLO 2: Quando o tamanho da amostra “n” for par. Uma pesquisa foi realizada com o objetivo de verificar a renda, em salários mínimos, de uma amostra de 6 clientes de uma loja. 8,0 8,8 8,5 9,7 9,5 9,2 Amostra (n): 6 clientes de uma loja Variável (x): Renda em salários mínimos 1º) Colocar os valores em ordem crescente 8,0 8,5 8,8 9,2 9,5 9,7 2º) Encontrar os dois valores centrais no conjunto de dados 8,0 8,5 8,8 9,2 9,5 9,7 3º) Calcular o ponto médio entre estes dois valores centrais (somando os dois valores e dividindo por dois) Md = (8,8+9,2)/2 = 18/2 = 9,0 Md = 9,0 salários mínimos “Metade dos clientes dessa loja possuem renda de 9 salários mínimos ou menos e metade dos clientes possui renda de 9 salários mínimos ou mais.” A moda de um conjunto de dados é simplesmente o valor do conjunto de dados que ocorreu com maior frequência, ou seja, que mais se repetiu. Notação: Mo T002 https://www.sites.google.com/ulbra.br/G000302GS001/t002 7 of 13 22/05/2022 06:58 Os dados apresentados a seguir referem-se aos valores da diária (em reais) para um casal em uma amostra de 8 Hotéis na cidade de Porto Alegre: 200 210 200 210 210 250 230 210 Amostra (n): 8 Hotéis em Porto Alegre Variável (x): Valor da diária para um casal (em reais) Mo = 210 reais (esse valor se repete quatro vezes na amostra,foi o valor de diária que mais se repetiu). 200 210 220 210 210 250 230 210 “O valor da diária para um casal que ocorreu com maior frequência foi de 210 reais”. Tão importante quanto representarmos todos os valores de um conjunto de dados através das medidas de tendência central é ter o conhecimento da variação que ocorre em torno dessa medida. As medidas de variabilidade ou ainda medidas de dispersão são extremamente úteis no tratamento de dados, pois estas indicam a variação existente em torno da média. A variância de uma amostra corresponde à média dos quadrados dos desvios dos valores em relação à média. Quanto maior for a variação dos valores do conjunto de dados, maior será a variância. T002 https://www.sites.google.com/ulbra.br/G000302GS001/t002 8 of 13 22/05/2022 06:58 No cálculo da variância, pode-se observar que a unidade da variável estudada é elevada ao quadrado, dificultando assim, a interpretação de seu resultado final. A solução para esse problema é extrair a raiz quadrada da variância, permitindo assim que se volte à unidade original da variável. Essa nova medida (a raiz quadrada da variância) é chamada de desvio-padrão. O desvio-padrão corresponde à raiz quadrada da variância. Essa medida expressa a variação média do conjunto de dados em torno da média, para mais ou para menos na mesma unidade de medida da média. Os dados apresentados a seguir referem-se ao número de carros vendidos em uma concessionária em uma amostra de 8 meses. T002 https://www.sites.google.com/ulbra.br/G000302GS001/t002 9 of 13 22/05/2022 06:58 https://drive.google.com/file/d/1rw8W1ZDsIXsGxC9z1enDp_a5d4GpbV1U/view?usp=sharing https://drive.google.com/file/d/1rw8W1ZDsIXsGxC9z1enDp_a5d4GpbV1U/view?usp=sharing https://drive.google.com/file/d/1HVfs01PJiUlh0DUQix38xLtre1_baOb8/view?usp=sharing https://drive.google.com/file/d/1HVfs01PJiUlh0DUQix38xLtre1_baOb8/view?usp=sharing Amostra (n): 8 meses Variável (x): Número de carros vendidos T002 https://www.sites.google.com/ulbra.br/G000302GS001/t002 10 of 13 22/05/2022 06:58 https://drive.google.com/file/d/16WtTSt0SGu_rsdUrbwnpEp-b5fUq9dlp/view?usp=sharing https://drive.google.com/file/d/16WtTSt0SGu_rsdUrbwnpEp-b5fUq9dlp/view?usp=sharing https://drive.google.com/file/d/16WtTSt0SGu_rsdUrbwnpEp-b5fUq9dlp/view?usp=sharing https://drive.google.com/file/d/16WtTSt0SGu_rsdUrbwnpEp-b5fUq9dlp/view?usp=sharing “Em média, são vendidos 215 carros ao mês com uma variação (desvio-padrão) de 16,9 carros”. [215 ± 16,9 carros] T002 https://www.sites.google.com/ulbra.br/G000302GS001/t002 11 of 13 22/05/2022 06:58 https://drive.google.com/file/d/1c1q1IF5QUg2tllTazKKsbNh4FjslCdU8/view?usp=sharing https://drive.google.com/file/d/1c1q1IF5QUg2tllTazKKsbNh4FjslCdU8/view?usp=sharing https://drive.google.com/file/d/1nCBdHe-AaBlp6vMr5gqMXfpGz-XwIH-2/view?usp=sharing https://drive.google.com/file/d/1nCBdHe-AaBlp6vMr5gqMXfpGz-XwIH-2/view?usp=sharing Neste momento, poderemos questionar: quando um desvio-padrão é grande e quando ele é pequeno? Na verdade, um desvio padrão pode ser considerado grande ou pequeno dependendo da ordem de grandeza da variável. Por esse motivo, quando desejamos comparar a variabilidade entre métodos, ou ainda entre grupos de valores, é indicada a utilização do Coeficiente de Variação que representa o desvio-padrão expresso como uma porcentagem da média. Notação: C.V. – Coeficiente de variação Para o exemplo anterior dos carros vendidos em uma concessionária no período de 8 meses, o coeficiente de variação seria: Interpretação: “Existe uma variação em torno da média de 7,9% T002 https://www.sites.google.com/ulbra.br/G000302GS001/t002 12 of 13 22/05/2022 06:58 https://drive.google.com/file/d/12F_kPF99Os2FnCBndIULrKplLRvvFAZG/view?usp=sharing https://drive.google.com/file/d/12F_kPF99Os2FnCBndIULrKplLRvvFAZG/view?usp=sharing https://drive.google.com/file/d/1a24aDlwgtNrSoLqW_W1sXkgicxbgBxnf/view?usp=sharing https://drive.google.com/file/d/1a24aDlwgtNrSoLqW_W1sXkgicxbgBxnf/view?usp=sharing https://drive.google.com/file/d/1vcxrz05lfBLKWgEqdjpx7GKAXV5FFd7o/view?usp=sharing https://drive.google.com/file/d/1vcxrz05lfBLKWgEqdjpx7GKAXV5FFd7o/view?usp=sharing https://drive.google.com/file/d/14PblU9D3XuiRBGVFbGckQvN2gEliiXp2/view?usp=sharing https://drive.google.com/file/d/14PblU9D3XuiRBGVFbGckQvN2gEliiXp2/view?usp=sharing LARSON, R.; FARBER, B. Estatística Aplicada. 4. ed. São Paulo: Ed. Pearson, 2010. LEVIN, J.; FOX, J. A.; FORDE, D. R. Estatística para ciências humanas. São Paulo: Ed. Pearson, 2012. Coordenação e Revisão Pedagógica: Claudiane Ramos Furtado Design Instrucional: Gabriela Rossa Diagramação: Marcelo Ferreira Ilustrações: Marcelo Germano Revisão ortográfica: Igor Campos Dutra T002 https://www.sites.google.com/ulbra.br/G000302GS001/t002 13 of 13 22/05/2022 06:58 https://drive.google.com/file/d/14PblU9D3XuiRBGVFbGckQvN2gEliiXp2/view?usp=sharing https://drive.google.com/file/d/14PblU9D3XuiRBGVFbGckQvN2gEliiXp2/view?usp=sharing
Compartilhar