Baixe o app para aproveitar ainda mais
Prévia do material em texto
ESTATÍSTICA INFERENCIAL OU INDUTIVA HISTOGRAMA A utilização de tabelas para resumir um conjunto de dados é de extrema importância, mas os gráficos fornecem um impacto visual alternativo e muito adequado. Normalmente, contém menos informações que as tabelas, mas são de fácil leitura. TIPOS DE GRÁFICOS Existem várias formas de representar graficamente uma série estatística. A escolha do gráfico mais apropriado fica a critério do analista, mas sempre levando em consideração a simplicidade, clareza e veracidade. O tipo de gráfico depende da variável em estudo. Os principais gráficos utilizados nas representações estatísticas são: 1- GRÁFICO EM LINHA Serve para representar séries simples (Exemplo 1) ou compostas (Exemplo 2), geralmente utilizado para ilustrar uma série temporal (ao longo do tempo). Quando se utiliza um gráfico de linhas compostas, ele servirá tanto para informação quanto para se fazer comparações (Exemplo 2). Exemplo 1: Número de ressonâncias magnéticas realizadas no Hospital Infantil Nossa Sra. da Glória, jan à out/2005 Fonte: www.hinsg.org.br/dados_hospitalares.html Exemplo 2: Número de eletrocardiogramas e eletroencefalogramas realizados no Hospital Infantil Nossa Sra. da Glória, 1ºsem/2005 Fonte: www.hinsg.org.br/dados_hospitalares.html 2- GRÁFICO DE COLUNAS Os gráficos de colunas são formados por retângulos no eixo horizontal. Podem-se construir gráficos de colunas simples, que serve para a representação de uma série simples e o gráfico de colunas compostas, que é indicado para séries compostas, podendo ser de colunas justapostas ou sobrepostas. Esses tipos de gráficos compostos são utilizados para ilustrar qualquer tipo de série e também servem para comparação. 2.1- COLUNAS SIMPLES Utilizados nos casos em que os dados são oriundos de contagens (número de filhos, número de acidentes de trânsito, etc.). Exemplo: Procedimentos em pacientes internados na oncologia do Hospital Infantil Nossa Sra. da Glória, out/2005 Fonte: www.hinsg.org.br/dados_hospitalares.html As larguras das colunas devem ser todas iguais e não tem nenhum significado neste caso, podendo ser adotada qualquer dimensão conveniente, desde que não se superponham. 2.2 – COLUNAS JUSTAPOSTAS Também utilizados nos casos em que os dados são oriundos de contagens, mas quando queremos fazer alguma comparação entre categorias (sexo, escolaridade, estado civil, etc). Exemplo: Distribuição das crianças internadas e do ambulatório por sexo no Hospital Infantil Nossa Sra. da Glória, 2005 Fonte: www.hinsg.org.br/dados_hospitalares.html 3- GRÁFICO DE BARRAS As regras usadas para o gráfico de barras são iguais àquelas usadas no gráfico de colunas, porém com a inversão dos eixos. Exemplo: Atendimentos realizados a pacientes com doenças metabólicas no Hospital Infantil Nossa Sra. da Glória, out/2005 Fonte: www.hinsg.org.br/dados_hospitalares.html 4 – GRÁFICO DE SETORES (pizza) É a representação gráfica da freqüência relativa (percentagem) de cada categoria dos dados. Este gráfico é utilizado para variáveis nominais e ordinais. Poderá ser uma opção ao gráfico de barras, quando se pretende dar ênfase à comparação das percentagens de cada categoria. A construção do gráfico de setores segue uma regra de três simples, onde as freqüências de cada classe correspondem ao ângulo que se deseja representar em relação à freqüência total que representa o total de 360º. Exemplo: Evolução das Internações no Hospital Infantil Nossa Sra. da Glória, out/2005 Fonte: www.hinsg.org.br/dados_hospitalares.html Características: - A área do gráfico equivale à totalidade de casos (100%); - Cada 'fatia' representa a percentagem de cada categoria representada. 5- GRÁFICOS PICTORAIS Tipo de gráfico cuja característica principal é a analogia entre o dado representado e o tipo de figura utilizado na sua representação. É bastante utilizado na propaganda, fazendo o apelo visual e percepção imediata do que se está falando. Tem por objetivo despertar a atenção do público em geral. Muitos desses gráficos apresentam grande dose de originalidade e de habilidade na arte de apresentação dos dados. Evolução da frota nacional de carros a álcool, de 1979 à 1987 Fonte: Anfavea Os métodos mais eficientes para deixar de fumar segundo 30.000 fumantes entrevistados no Canadá - 2000 Fonte: Sem origem da informação 6- HISTOGRAMA Destina-se a representar uma distribuição de freqüência intervalar. Os dados são representados por colunas justapostas, onde a base representa os intervalos e altura apresenta as freqüências absolutas ou freqüências relativas dentro de cada intervalo. É uma ferramenta usada para registrar, cronologicamente, a evolução de um fenômeno dentro de certo período de tempo, ou as freqüências de vários fenômenos em um momento ou período definido. É um gráfico de barras que mostra a variação de um grupo de dados relativos a uma mesma variável, por meio da distribuição de freqüência. Nele, o eixo vertical se refere à freqüência da ocorrência. Por isso, a altura da coluna vertical é proporcional a essa freqüência. O eixo horizontal, por sua vez, mostra a característica de medida dividida em classes. É uma forma de descrição gráfica de dados quantitativos, agrupados em classes de freqüência. O Histograma dispõe as informações de modo que seja possível a visualização da forma da distribuição de um conjunto de dados e também, a percepção da localização do valor central e da dispersão dos dados em torno deste valor central. Cuidados a serem observados em um histograma: Forma (deve ter uma certa simetria) Dispersão (deve ser pequena ) Centralização (deve estar na média) Exemplo - Considere uma coleta de dados relativos às estaturas de 40 alunos, que compõem uma amostra dos alunos da Faculdade ABC, resultando a seguinte tabela de valores: ESTATURAS DE 40 ALUNOS DA FACULDADE ABC Altura (cm) xi Fi Fac Fr Fra 150 |--- 154 152 4 4 10,0% 10,0% 154 |--- 158 156 9 13 22,5% 32,5% 158 |--- 162 160 11 24 27,5% 60,0% 162 |--- 166 164 8 32 20,0% 80,0% 166 |--- 170 168 5 37 12,5% 92,5% 170 |--- 174 172 3 40 7,5% 100,0% TOTAL ---- 40 100% Histograma das freqüências absolutas Histograma das freqüências acumuladas 7- POLÍGONOS DE FREQUÊNCIAS É a representação gráfica de uma distribuição por meio de um polígono, unindo-se os pontos médios das classes. Ou seja, os pontos médios são ligados por retas. No gráfico abaixo, é representado pela linha que liga os pontos médios das classes. 8 FORMAS DE UMA CURVA DE FREQUÊNCIA Os polígonos de freqüências ajudam-nos a visualizar a diversidade de formas por distribuições de freqüência. 8.1 CURVA EM FORMA DE SINO Se os dados coletados forem contínuos e extraídos de uma amostra de grande população, podemos imaginar que à medida que a amostra se torne cada vez maior, teoricamente é possível a escolha de classes muito pequenas, de modo que a linha poligonal do polígono de freqüência tenderá a se confundir com uma curva denominada curva de freqüência. A aproximação se torna cada vez maior à medida que se aumenta o numero de intervalos, com amplitudes cada vez menores. Muitos fenômenos oferecem distribuições em forma de sino. Por exemplo Estaturas e peso de adultos A inteligência média em testes mentais Os preços relativos Assim, podemos dizer que, enquanto o polígono de freqüência nos dá a imagem real do fenômeno estudado, a curva de freqüência nos dá a imagem tendencial. Após o traçado de um polígono de freqüência, é desejável, muitas vezes,que se lhe faça um polimento, de modo a mostrar o que seria tal polígono com um número maior de dados. 8.2 FORMA DE UMA CURVA DE DISTRIBUIÇÃO DE FREQUÊNCIA 8.2.1 DISTRIBUIÇÕES SIMÉTRICAS E ASSIMÉTRICAS Dependendo da distribuição, as curvas de freqüências podem assumir algumas formas características, que recebem denominações apropriadas. Em relação às curvas em forma de sino, elas podem ser simétricas ou assimétricas. CURVAS SIMÉTRICAS Caracteriza-se por apresentar o valor máximo no ponto central e os pontos eqüidistantes desse ponto terem a mesma freqüência. Ou seja, “dobrando” a curva no centro criam-se duas metades idênticas, e por isso, tais distribuições contêm o mesmo número de valores extremos em ambas as direções, para cima e para baixo. Figura 1 – Curva simétrica CURVAS ASSIMÉTRICAS Na prática, não se encontram distribuições perfeitamente simétricas. As distribuições obtidas de medidas reais são mais ou menos assimétricas, em relação à freqüência máxima. Assim, as curvas correspondentes a tais distribuições apresentam a cauda de um lado da ordenada máxima mais longa do que o outro. Ou seja, os dados se concentram mais em uma direção do que outra. A posição da cauda indica onde os relativamente poucos escores estão localizados e indica a direção da assimetria. Se a cauda mais longa fica à direita é chamada assimétrica positiva ou enviesada à direita (Figura 2), e se a cauda se alonga a esquerda, a curva é chamada assimétrica negativa ou enviesada à esquerda (Figura 3). Figura 2 - Assimétrica positiva Figura 3 - Assimétrica negativa OBS: É a cauda que indica o tipo de assimetria e não a direção do ponto mais alto da curva. Se os gráficos acima representassem a distribuição de notas de estatística dos alunos de psicologia, poderíamos dizer que na Figura 1 o número de alunos que estão abaixo de uma nota mediana é o mesmo que está acima desta nota, sendo que poucos alunos receberam notas muito altas e poucos receberam notas muito baixas. Na Figura 2 a maioria dos alunos foi muito mal, e poucos se saíram bem, enquanto, na Figura 3 a maioria dos alunos foi muito bem, e poucos se saíram mal. 9 MEDIDAS DE ASSIMETRIA Denomina-se assimetria, o grau de afastamento, de uma distribuição, da unidade de simetria. Em uma distribuição simétrica, a média ( ) a mediana ( ) e a moda (Mo) tem igualdade de valores. POSIÇÕES RELATIVAS DA MÉDIA, MEDIANA E MODA EM FUNÇÃO DA ASSIMETRIA DAS DISTRIBUIÇÕES Curva simétrica – a média, a mediana e a moda coincidem: = = Mo Figura 4 = = Mo Curva assimétrica positiva (ou assimétrica à direita) – a média é maior que a moda: Mo < < Figura 5 Mo < < Curva assimétrica negativa (ou assimétrica à esquerda) – a média é menor que a moda: < < Mo Figura 6 < < Mo Baseado na relação entre média e moda, pode-se determinar o tipo de assimetria, calculando o valor da diferença: Se: - Mo = 0 ( curva simétrica ou assimétrica nula: = Mo - Mo < 0 ( curva assimétrica negativa ou à esquerda: < Mo - Mo > 0 ( curva assimétrica positiva ou à direita: Mo < Exemplo: Considere as distribuições: = 12 Kg = 12,9 Kg = 11,1 Kg = 12 Kg = 13,5 Kg = 10,5 K Mo = 12 Kg Mo = 16 Kg Mo = 8 Kg s = 4,42 Kg s = 4,2 Kg s = 4,2 Kg Logo, calculando a diferença - Mo, temos: Distribuição A : 12 – 12 = 0 ( a distribuição é simétrica Distribuição B : 12,9 – 16 = - 3,1 ( a distribuição é assimétrica negativa Distribuição C : 11,1 – 8 = 3,1 ( a distribuição é assimétrica positiva COEFICIENTE DE ASSIMETRIA DE PEARSON A medida anterior, por ser absoluta, apresenta a mesma deficiência do desvio padrão, isto é, não permite a possibilidade de comparação entre as medidas de duas distribuições com unidades distintas. Por esse motivo, daremos preferência ao coeficiente de assimetria de Pearson é dado por: Se: AS = 0 ( a distribuição é simétrica AS < 0 ( a distribuição é assimétrica negativa AS > 0 ( a distribuição é assimétrica positiva Se: 0,15 < |AS| < 1 ( a assimetria é considerada moderada |AS| > 1 ( a assimetria é considerada forte Calculando o coeficiente de assimetria de Pearson das distribuições A, B e C, temos: Distribuição A: AS = = = 0 ( simétrica Distribuição B: AS = = = - 0,74 ( assimetria negativa moderada Distribuição C: AS = = = 0,74 ( assimetria positiva moderada OBSERVAÇÕES Note que a fórmula do coeficiente de assimetria pede, além da média e moda, o desvio padrão. Esta fórmula do coeficiente de assimetria é recomendada para distribuições MODAIS (apenas uma moda). Caso não se tenha a moda ou ocorra distribuições bimodais, trimodais ou multimodais, deve se utilizar esta fórmula, que utiliza a mediana: 10 COMPARAÇÕES ENTRE MODA, MEDIANA E MÉDIA Um dos objetivos de calcular estas medidas de tendência central é extrair informações e verificar o comportamento dos dados em uma situação de pesquisa. Mas em um determinado momento o pesquisador deverá escolher qual ou quais das medidas melhor se adéqua à sua pesquisa. Esta decisão envolve diversos fatores. Três deles são: Nível de mensuração. Forma da distribuição dos dados. Objetivo da pesquisa. 1 NÍVEL DE MENSURAÇÃO A moda exige apenas contagem dos dados, ou seja, a freqüência. Ela pode ser aplicada tanto em conjuntos de dados em termos de mensuração ordinal, nominal, discreta ou contínua (ou intervalar). A mediana exige a ordenação dos dados, sejam eles ordinais, discretos ou intervalares, e não de dados nominais. A média é utilizada exclusivamente em dados discretos ou intervalares. Sua aplicação a dados ordinais ou nominais produz resultados sem sentido. Por exemplo, calcular a média de cores (azul + branco + Preto + vermelho, dividido por quatro dá que resultado? 2 FORMA DA DISTRIBUIÇÃO DOS DADOS A forma, ou o formato, de uma distribuição é outro fator que pode influenciar o pesquisador na escolha de medidas de tendência central. Em uma distribuição simétrica e unimodal, moda, mediana e média são idênticas, como definido anteriormente. Neste caso, a escolha do pesquisador pela medida central será fundamentalmente baseada em seus objetivos específicos de pesquisa e no nível em que seus dados são medidos. Se a distribuição é assimétrica, a decisão é muito influenciada pelo formato, ou forma, de seus dados. Pelas Figuras 5 e 6 na página 9 podemos observar que a média, a mediana e a moda não coincidem. A moda está no pico da curva, pois esse é o ponto em que a maioria dos escores freqüentes ocorrem. Diferentemente, a média se encontra mais próxima da cauda, onde a menor parte dos escores é encontrada. Neste caso, a média se encontra na direção dos escores mais altos (Figura 5 – assimetria positiva) ou se encontra na direção dos escores mais baixos (Figura 6 – assimetria negativa). Isto significaque a média é muito afetada por valores extremos: escores muito baixos acabam puxando a média para baixo, enquanto escores muito altos puxam a média para cima. Exemplo DISTRIBUIÇÃO A: 5 6 6 7 8 9 10 10 ( Média = 7,63 DISTRIBUIÇÃO B: 5 6 6 7 8 9 10 95 ( Média = 18,25 Enquanto a média é muito influenciada por valores extremos em qualquer uma das direções, a mediana é pouco modificada, ou não é modificada, por valores extremos. Isso é devido ao fato de que a média leva em consideração todos os dados para o seu cálculo, enquanto a mediana leva em consideração apenas o valor do escore que está no centro da distribuição. Observe o exemplo anterior: Exemplo DISTRIBUIÇÃO A: 5 6 6 7 8 9 10 10 ( Mediana = 7,5 DISTRIBUIÇÃO B: 5 6 6 7 8 9 10 95 ( Mediana = 7,5 Observe que a mudança do escore 10 em A para 95 em B não alterou o valor da mediana, enquanto que, para a média, a mudança foi significativa. Sendo assim, numa distribuição assimétrica, a mediana se torna uma medida mais conveniente do que a média. 3 OBJETIVO DA PESQUISA A questão agora é o que o pesquisador pretende fazer com essas medidas. Caso esteja em busca de uma medida descritiva rápida, simples, mas que seja “crua”, ou esteja trabalhando com uma distribuição bimodal, ele geralmente escolherá a moda. Mas se ele busca uma medida de tendência central mais precisa, normalmente a decisão será pela média ou mediana. Para descrever uma distribuição assimétrica, o pesquisador geralmente escolhe a mediana, tendo em vista que ela proporciona um quadro equilibrado dos escores extremos. Além disso, a mediana às vezes utilizada como um ponto na distribuição em que os escores podem ser divididos em duas categorias que contêm o mesmo número de elementos. Para uma medida precisa de distribuições que sejam pelo menos ligeiramente simétricas, a média tende a ser preferida em relação à mediana, tendo em vista que ela pode ser utilizada facilmente em uma análise estatística mais avançada, como as que estudaremos mais adiante. EXERCÍCIOS 1- Considerando as distribuições abaixo, confeccione para cada uma: (A) Histograma das freqüências absolutas e acumuladas. (B) Polígono de freqüências absolutas e acumuladas. � (I) Peso (Kg) 40 |-- 44 44 |-- 48 48 |-- 52 52 |-- 56 56 |-- 60 5 10 12 6 4 37 (II) Estaturas (cm) 500 |-- 700 700 |-- 900 900 |-- 1100 1100 |-- 1300 1300 |-- 1500 1500 |-- 1700 1700 |-- 1900 8 20 7 5 2 1 1 44 (III) Salários (R$) 150 |-- 156 156 |-- 162 162 |-- 168 168 |-- 174 174 |-- 184 1 5 8 13 3 30 (IV) T.I. No de candidatos 80 |-- 90 20 90 |--100 70 100|--110 120 110|--120 50 120|--130 10 TOTAL 270 � 2- Considere os seguintes resultados relativos a três distribuições de freqüência: DISTRIBUIÇÕES Mo A B C 52 45 48 52 50 46 Determine o tipo de assimetria de cada distribuição. 3- Uma distribuição de freqüência apresenta as seguintes medidas: = 33,18, = 31,67, Mo = 27,50 e s = 2,12. (A) Calcule o coeficiente de assimetria de Pearson (B) Classifique o tipo de assimetria. 4- Calcule o coeficiente de assimetria de Pearson e classifique a assimetria para as distribuições do exercício 1. GRÁFICOS ESTATÍSTICOS � EMBED Equation.3 ��� - Mo - Distribuição C Peso (Kg) � EMBED Equation.3 ��� 2 |-- 6 6 6 |-- 10 30 10 |-- 14 24 14 |-- 18 12 18 |-- 22 6 � EMBED Equation.3 ��� 78 - Distribuição B Peso (Kg) � EMBED Equation.3 ��� 2 |-- 6 6 6 |-- 10 12 10 |-- 14 24 14 |-- 18 30 18 |-- 22 6 � EMBED Equation.3 ��� 78 - Distribuição A Peso (Kg) � EMBED Equation.3 ��� 2 |-- 6 6 6 |-- 10 12 10 |-- 14 24 14 |-- 18 12 18 |-- 22 6 � EMBED Equation.3 ��� 60 AS = � EMBED Equation.3 ��� AS = � EMBED Equation.3 ��� PSICOLOGIA – ESTATÍSTICA INFERENCIAL – 1/2014 Página � PAGE \* MERGEFORMAT �9� _1392542057.unknown _1392542073.unknown _1392542085.unknown _1392542089.unknown _1392542093.unknown _1392542095.unknown _1455460486/ole-[42, 4D, 8A, 9F, 04, 00, 00, 00] _1456128655.unknown _1392542094.unknown _1392542091.unknown _1392542092.unknown _1392542090.unknown _1392542087.unknown _1392542088.unknown _1392542086.unknown _1392542083.unknown _1392542084.unknown _1392542077.unknown _1392542079.unknown _1392542081.unknown _1392542082.unknown _1392542080.unknown _1392542078.unknown _1392542074.unknown _1392542075.unknown _1392542065.unknown _1392542066.unknown _1392542071.unknown _1392542070.unknown _1392542059.unknown _1392542060.unknown _1392542061.unknown _1392542058.unknown _1392542054.unknown _1392542056.unknown _1392542053.unknown
Compartilhar