Baixe o app para aproveitar ainda mais
Prévia do material em texto
Estatística descritiva Medidas de Tendência central e dispersão MEDIDAS Tendência central e dispersão 2 DISTRIBUIÇÕES Para dar sentido ao aparente caos dos resultados brutos, os investigadores começam por dar uma ordem aos dados. O primeiro passo consiste em formar uma distribuição, isto é, a disposição de qualquer conjunto de resultados por ordem de magnitude. 3 Resultados de QI não ordenados 75 100 105 95 120 130 95 90 115 85 115 100 110 100 110 Distribuição de resultados de QI 130 120 115 115 110 110 105 100 100 100 95 95 90 85 75 MEDIDAS Tendência central e dispersão 4 A distribuição permite ao observador perceber as tendências gerais mais rapidamente do que seria capaz com um conjunto de resultados brutos desordenados. Podemos apresentá-los como uma distribuição de frequências. Uma distribuição de frequências é uma listagem de cada resultado, alcançado, acompanhada pelo número de indivíduos que obtiveram esse resultado. X (Resultado bruto) 130 120 115 110 105 100 95 90 85 75 f (frequência de ocorrência) 1 1 2 2 1 3 2 1 1 1 5 EIXO DO X E EIXO DO Y Para além de apresentarem as distribuições de frequências sob a forma de tabelas, os estatísticos apresentam frequentemente os dados sob a forma gráfica. Um gráfico tem a vantagem de constituir uma espécie de “imagem” dos dados. É habitual indicar os resultados brutos, ou valores reais da variável, no eixo horizontal, eixo dos X, chamado abcissa. A frequência de ocorrência é apresentada na vertical, ou eixo dos Y, chamado ordenada. 6 6 Histogramas e polígonos de frequências 7 Para construir um histograma, é desenhado um retângulo sobre cada resultado bruto. A altura do retângulo indica a frequência de ocorrência de cada resultado. 7 Histogramas e polígonos de frequências 8 Para construir um polígono de frequências, em vez dos rectângulos, utiliza-se um único ponto para designar a frequência de cada resultado. Estes pontos são depois unidos por uma série de linhas retas. 8 Média Aritmética Para nos ajudar a compreender as semelhanças e as diferenças entre os indivíduos, possuímos algumas técnicas úteis para descobrir a média, ou valor típico, de uma distribuição. Conhecer a média do QI para uma determinada turma pode ajudar-nos a planear o currículo, a decidir o nível a que devem ser ensinados alguns dos temas, ou a escolher livros na biblioteca. A informação acerca do valor típico de uma distribuição permite-nos interpretar de forma mais significativa todos os resultados da distribuição. 9 Exemplo: 3,3,3,4,15 Média (X) = 3+3+3+4+15 = 5,6 5,6 5 9 MÉDIA ARITMÉTICA Se lhe for dado um conjunto de resultados de QI, e lhe pedirem para descobrir o valor médio, o mais provável é que calcule a média aritmética. Isto é, que some todos os resultados de QI e divida depois a soma pelo número total de resultados. 10 X=130+120+115+115+115+110+110+105+100+100+95+95+90+85+75 15 X=1660 = 110,66 15 Exemplo 2 Gênio: acima de 144 pontos; Superdotado: de 130 a 144 pontos; Acima da média: de 115 a 129 pontos; Média alta: de 100 a 114 pontos; Média baixa: de 85 a 99 pontos; Abaixo da média: de 70 a 84 pontos; Baixo: de 55 a 69 pontos; Muito baixo: menos de 55 pontos. A tabela com a escala de classificação é: 10 A interpretação da média Pode, por vezes, ser enganadora, especialmente em grupos em que a própria população, ou dimensão da população, se modifiquem. Por exemplo, a média de QI numa turma típica de “calouros” universitários é habitualmente cerca de cinco pontos mais baixa do que a média da mesma turma quando os alunos mais tarde chegam a finalistas. Será que isto indica que os alunos aumentam os seus QI á medida que frequentam a faculdade? X=130+120+115+115+115+110+110+105+100+100+95+95+90+85+75 15 X=1660 = 110,66 15 Gênio: acima de 144 pontos; Superdotado: de 130 a 144 pontos; Acima da média: de 115 a 129 pontos; Média alta: de 100 a 114 pontos; Média baixa: de 85 a 99 pontos; Abaixo da média: de 70 a 84 pontos; Baixo: de 55 a 69 pontos; Muito baixo: menos de 55 pontos. A tabela com a escala de classificação é: 11 A interpretação da média Não, Porque dado que a dimensão da turma de finalistas é quase sempre menor do que a dos “calouros”, as duas já não constituem uma única população. Os que têm o QI mais baixo da turma de “calouros” têm tendência a abandonar a faculdade, e a nunca chegar a finalistas. 12 EXEMPLO: 19,1717= 19,172 = 19,17 19,1618= 19,162 = 19,16 19,1565= 19,16 19,1415= 19,14 > 5 = PRÓX. INTEIRO < 5 = NÃO ARREDONDO = 5 = ARREDONDO OU NÃO REGRA DE ARREDONDAMENTO 13 A MEDIANA Em algumas situações, no entanto, a utilização da média pode conduzir a uma imagem extremamente distorcida do valor típico de uma distribuição. Observemos a distribuição seguinte de vencimentos mensais (em escudos) 14 50 - 150 - 150 – 98 - 97 – 97- 97- 96,5 – 95 - 92, 5 – 90 – 90 - 88 Mediana de distribuição Par Mediana de distribuição Impar 50 – 88 – 90 - 90 - 92,5 - 95 – 96,5 -97 – 97 – 97 – 98 – 150 – 150 50 – 88 – 90 - 90 - 92,5 – 95 - 95 – 96,5 -97 – 97 – 97 – 98 – 150 – 150 Mediana = 95 + 96,5 = 191,5/2 = 95,75 MEDIANA = 96,5 N 7 2 14 Se houver um número par de resultados numa distribuição, a mediana é calculada determinando o ponto que se situa exactamente a meio do caminho entre os dois valores centrais, ou seja, 114,5. 15 120 118 115 114,5 Mediana 114 114 112 ____ 693 X = 115,50 Média 120 118 115 114,5 Mediana 114 114 6 ____ 587 X = 97,83 Média Ao contrário da média, a mediana não é afectada pela presença de um resultado extremo em qualquer direção, como se pode ver no exemplo da direita. A MEDIANA 15 A MODA A terceira medida de tendência central é denominada moda. A moda é o resultado que ocorre com maior frequência numa distribuição. Num polígono de frequências, a moda é o ponto em que a curva atinge o seu nível mais elevado; num histograma localiza-se na barra mais alta. Algumas distribuições, designadas bimodais, têm duas modas. Distribuições deste tipo ocorrem quando os resultados se agrupam em dois locais separados, ou quando o grupo que está a ser medido se compõe possivelmente de dois subgrupos. 16 Mo = 114 120 118 115 114 114 6 ____ 587 16 A MODA AMODAL BIMODAL 17 Mo = AMODAL EX4 120 118 115 114 114 114 6 ____ 701 EX2 120 118 115 114 114 6 ____ 587 EX3 120 120 118 115 114 114 6 ____ 707 EX1 120 118 115 114 112 6 ____ 585 Mo = 114 Mo = 114, 120 BIMODAL Mo = 114 17 As distribuições são classificadas de acordo com a direcção da sua “cauda”. Quando a cauda está do lado direito, diz-se que a curva tem uma assimetria positiva.; quando a “cauda” é para a esquerda, tem uma assimetria negativa. 18 Representação gráfica de distribuições assimétricas: (a) negativamente assimétrica; (b) positivamente assimétrica. Assimétrica a esquerda Assimétrica a direita Medidas de assimetria A curva normal se classifica em curva normal simétrica e curva normal assimétrica. X=3; x=3,5 M=4 X=5; x=4,5 M=4 18 QUARTIS De forma análoga à mediana, definem-se duas outras medidas estatísticas que têm, por vezes, bastante interesse para o conhecimento de uma distribuição estatística – os quartis. A separação da distribuição (ordenada) é feita em três valores: Q1, Q2 e Q3, em que o Q2 é, naturalmente, a mediana. O valor (Q1) 1º Quartil, que separa os primeiros 25% dos dados ordenados por ordem crescente dos restantes 75%. O 3º Quartil é o valor Q3 que divide a distribuição em duas partes, sendo 75% dos dados menores ou iguais a Q3 e os restantes 25% maiores ou iguais. 19 19 CÁLCULO DOS QUARTIS 20 Determinação do Q1 1º calcula-se 2º identifica-se a classe Q1 3º aplica-se a fórmula 3. Determinação do Q3 1º calcula-se 2º identifica-se a classe Q3 pela Fac 3º aplica-se a fórmula 5 5 6 7 8 9 11 12 15 16 25% 50% 25% 25% 25% 2. Determinação do Q2=Md 1º calcula-se 2º identifica-se a classe FAC 3º aplica-se a fórmula20 QUARTIS O cálculo do 1º e do 3º quartil faz-se de modo análogo ao do cálculo da mediana. Com efeito, uma vez ordenados os dados, o 1º quartil é o valor correspondente à mediana da primeira metade da distribuição e o 3º quartil é o valor mediano da segunda metade. 3 7 8 8 8 9 10 10 10 11 11 11 11 11 12 13 14 21 Q1 Md Q3 Q1=8+8/2 = 8 Q2= Md = 10 Q3= 11+11/ 2 = 11 21 DECIS São os valores que dividem a distribuição em 10 partes iguais 3 7 8 8 8 9 10 10 10 11 11 11 11 11 12 13 14 22 1º calcula-se 2º identifica-se a classe Di pela Fac 3º aplica-se a fórmula 22 PERCENTIS São os valores que dividem a distribuição em 100 partes iguais 3 7 8 8 8 9 10 10 10 11 11 11 11 11 12 13 14 23 1º calcula-se 2º identifica-se a classe Di pela Fac 3º aplica-se a fórmula P1 P100 1% 4% 100% P50 50% Dados agrupados P10= P90= 23 PERCENTIS São os valores que dividem a distribuição em 100 partes iguais 3 7 8 8 8 9 10 10 10 11 11 11 11 11 12 13 14 24 1º calcula-se 2º identifica-se a classe Di pela Fac 3º aplica-se a fórmula Dados agrupados 24 25 Esta medida se define pelo grau de achatamento da curva Medidas de curtose 25 Exercício As classificações obtidas por um aluno ao longo do ano letivo foram as seguintes: 8 11 15 16 7 12 5 6 9 5 1. Determine a classificação mediana, modal e os quartis 2. Determine a amplitude. 3. Supondo que a média mínima exigida para aprovação nesta disciplina é de 10 valores, qual a situação final deste aluno? Justifique. 26 26 VARIABILIDADE Do mesmo modo que as medidas de tendência central nos dão informações acerca da semelhança existente entre as medições, as medidas de variabilidade informam-nos acerca de como os resultados diferem ou variam. As medidas de variabilidade são cruciais em educação, uma vez que nos dão informação vital acerca de um dos temas fundamentais da Psico-pedagogia – as diferenças individuais. 27 27 A AMPLITUDE Uma forma de descrever a variabilidade em qualquer distribuição de resultados é calcular a amplitude (A). A amplitude é a diferença entre o resultado mais elevado e o resultado mais baixo, e constitui uma medida da extensão total da distribuição. A amplitude é representada por um único valor. Por exemplo, se o resultado mais alto numa distribuição de QI for 140 e o resultado mais baixo for 60, então A é igual a 80. 28 28 DESVIO-PADRÃO O DESVIO-PADRÃO (DP): Representa a essência do conceito de variabilidade. Embora a amplitude seja importante, ao dar algum significado a um conjunto de resultados, tem uma limitação bastante significativa: baseia-se em apenas dois resultados, o mais elevado e o mais baixo. O desvio-padrão, pelo contrário, toma em consideração todos os resultados existentes na distribuição. Por conseguinte, o desvio-padrão é uma medida de variabilidade que indica o grau em que todos os valores de uma distribuição se desviam da média. 29 29 DESVIO PADRÃO Quanto maior for o valor numérico do DP, mais os valores se distanciam da média. Quanto mais pequeno o valor do DP, menos os resultados se distanciam da média, agrupando-se mais estreitamente à sua volta. Uma distribuição com um desvio-padrão baixo diz-nos que o grupo que está a ser medido é homogéneo enquanto uma distribuição com um desvio-padrão elevado descreve um grupo heterogéneo de resultados. O desvio-padrão, ou desvio típico, é sempre expresso por um único valor. Para se calcular o DP, seguem-se os seguintes passos: 30 30 X X² 15 225 X = ∑X/N = 72/8 = 9,00 12 144 10 100 DP = 9 81 9 81 DP = 3,535 = 3,54 8 64 7 49 2 4 __ ___ 72 748 31 CÁLCULO DA VARIÂNCIA (X²) (2-9,0)²+ (7-9)²+( 8-9)²+ (9-9)²+ (9-9)²+ (10-9)²+ (12-9)²+ (15-9)² 8 49+ 4+1+ 0+ 0+ 1+ 9+ 36 8 100 = 12,5 8 CÁLCULO DO DESVIO PADRÃO (DP) 31 Some os X´s para obter ∑X Divida por N para obter X Eleve ao quadrado cada X para obter X² Some esses quadrados para obter ∑X² Divida o valor de ∑X² por N e subtraia o quadrado da média, X². Extraia a raiz quadrada para obter o DP 32 32 PROPRIEDADES DA MÉDIA, MEDIANA, MODA, VARIÂNCIA E DP MÉDIA: BEM DEFINIDA, FÁCILMENTE INTERPRETÁVEL E FÁCIL DE CALCULAR PRESTA-SE BEM A TRATAMENTOS ALGÉBRICOS PÕES EM JOGO OS VALORES DE TODOS OS DADOS MUITO INFLUENCIADA PELOS DADOS EXTREMOS MEDIANA: BEM DEFINIDA, FÁCIL DE INTERPRETAR E DE DETERMINAR NÃO É INFLUENCIADA PELOS CASOS EXTREMOS OU ABERRANTES NÃO SE CALCULA TENDO EM CONTA TODOS OS DADOS NÃO SE PRESTA AO TRATAMENTO ALGÉBRICO 33 33 Propriedades (Cont.) MODA: FÁCIL DE INTERPRETAR E FÁCIL DE DETERMINAR NÃO É INFLUENCIADA PELOS EXTREMOS PODE PÔR EM EVIDÊNCIA A HETEROGENEIDADE DUM GRUPO NÃO TEM EM CONTA TODOS OS DADOS NÃO SE PRESTA A TRATAMENTO ALGÉBRICO VARIÂNCIA (Média dos quadrados dos desvios) É UMA BOA MEDIDA DE DISPERSÃO É SEMPRE POSITIVA NÃO TEM A MESMA UNIDADE QUE OS DADOS DESVIO PADRÃO UMA DAS MAIS USADAS MEDIADS DE DISPERSÃO É SEMPRE POSITIVA TEM A MESMA UNIDADE QUE OS DADOS 34 34
Compartilhar