Baixe o app para aproveitar ainda mais
Prévia do material em texto
Estatística para Psicólogos (que não gostam de números) Copyright © desta edição: ESETec Editores Associados, Santo André, 2007. Todos os direitos reservados Morais, P. R. Estatística para psicologos (que não gostam de números). Paulo Rogério Morais. 1a ed. Santo André, SP: ESETec Editores Associados, 2007. 156p. 21cm 1. Estatística 2. Psicologia ESETec Editores Associados Solicitação de exemplares: comercial@uol.com.br Trav. João Rela, 120 B – Vila Bastos – Santo André – SP CEP 09041-070 Tel. 4990 56 83/ 4438 68 66 www.esetec.com.br ISBN 85 88303 83 - 3 Paulo Rogério Morais Estatística para Psicólogos (que não gostam de números) ESETec 2007 SUMÁRIO Apresentação 7 PPPPParararararte 1 – Pte 1 – Pte 1 – Pte 1 – Pte 1 – Para conhecer a Estatística ara conhecer a Estatística ara conhecer a Estatística ara conhecer a Estatística ara conhecer a Estatística 11 Capitulo 1 – Conceitos Básicos 13 – O que é Estatística 13 – População e amostra 15 – Tipos de variáveis 26 – Níveis de mensuração 28 – Fases do método estatístico 36 Capitulo 2 – Estatística Descritiva 42 – Descrevendo variáveis qualitativas 42 – Descrevendo variáveis quantitativas 45 – Descrevendo a simetria de um conjunto – Descrevendo correlações 62 – Apresentação dos resultados: tabelas e gráficos 64 Capítulo 3 – Estatística Inferencial 67 – Teste de hipóteses 80 – Decisão e erro 84 – Nível de significância 87 – A escolha de um teste estatístico 89 – Testes de significância estatística 92 PPPPParararararte 2 – Pte 2 – Pte 2 – Pte 2 – Pte 2 – Para empregar a Estatística 111ara empregar a Estatística 111ara empregar a Estatística 111ara empregar a Estatística 111ara empregar a Estatística 111 Capítulo 4 – Psicologia, avaliação em psicologia e estatística: por que esta união é fundamental? 113 Makilim Nunes Baptista Capitulo 5 – Análise fatorial 123 Altemir José Gonçalves Barbosa Capitulo 6 – Análise de dados com o computador: breve descrição dos programas atualmente disponíveis 137 Marcos Aguiar de Souza e Israel Souza Com quase toda certeza (e a Estatística lida com “quase certezas”) você, assim como eu e tantos outros psicólogos e estu- dantes de Psicologia, deve ter ficado no mínimo surpreso ao se deparar com a disciplina de Estatística em um curso que é tido por alguns como ligado às ciências humanas ou considerado por ou- tros como relacionado às ciências biológicas, mas nem de longe um curso associado às ciências ditas exatas. Só bem mais tarde, quase terminando a graduação, quando preparava meu trabalho de conclusão de curso, pude perceber por- que um psicólogo, da mesma forma que muitos outros profissio- nais, precisa saber lidar com os conceitos estatísticos. Mas, perce- ber que se necessita um dado conhecimento não é o mesmo que, de fato, possuir tal conhecimento. Ao longo de toda a graduação, e também durante boa parte do meu curso de mestrado, os termos e conceitos estatísticos pareciam-me uma linguagem esotérica, à qual somente alguns poucos iluminados poderiam ter acesso. Infelizmente, em muitos cursos de Psicologia, a Estatística é uma disciplina ministrada por um professor que, embora domine os conceitos e cálculos, não consegue estabelecer a ligação entre a Estatística e a Psicologia, sendo na maior parte dos casos um professor “emprestado” de outros cursos, como a Matemática ou alguma outra área que “realmente” lida com números. A conseqü- ência disto são aulas com linguagem fortemente matemática, com grande ênfase às fórmulas e pouca atenção ao significado dos con- ceitos apresentados e, principalmente, nenhuma conexão com a prática profissional do psicólogo. Como muitos que se engajam na Psicologia, eu nunca mor- ri de amores pela Matemática e, quando fui aprender Estatística na minha graduação, tive aulas justamente com um professor ligado muito mais à Matemática do que à Psicologia. Resultado: aprendi APRESENTAÇÃO - 8 - Paulo Rogério Morais fazer alguns dos cálculos, mas não sabia como usar (e interpretar) os resultados de tais cálculos. A isso alguns dão o nome de “efeito papa- gaio” – repete muito bem o que se ouve (ou “aprende”), mas não tem qualquer critica sobre o que está repetindo. Felizmente, mais tarde, tive a oportunidade de ter aulas de Esta- tística não com um matemático ou estatístico, mas com um profissio- nal ligado à área da saúde, na verdade um dentista. O Professor Neil F. Novo, da UNIFESP, apresentou a mim e a muitos outros a Estatística não como um amontoado de fórmulas, testes, jargões e conceitos pu- ramente abstratos, mas como uma ferramenta bastante útil e também fácil de ser utilizada. No entanto, simplesmente dispor de uma ferramenta não é o suficiente. Como qualquer ferramenta, a Estatística precisa ser “manuseada”, da mesma forma que um martelo ou um alicate. Assim como um marceneiro precisa saber utilizar suas ferramentas, quem vai utilizar a Estatística também precisa conhecê-la. Imagine como ficaria um armário se, no lugar onde deveriam ser fixados parafusos este marceneiro martelasse alguns pregos. Lamentavelmente, quando o assunto o é Estatística, parafusos são martelados e poucos se dão conta disso. Quem não tem nenhum conhecimento da natureza da Es- tatística ou dos parafusos não é capaz de notar qualquer diferença. Atualmente, quem precisa utilizar a Estatística em sua vida pro- fissional ou acadêmica não é mais obrigado a decorar fórmulas gigan- tescas e saber aplicar tais fórmulas aos seus dados, embora este co- nhecimento seja algo muito interessante e auxilia a compreensão dos conceitos estatísticos. Com uma simples calculadora de bolso pode-se aplicar, de maneira simples e rápida, fórmulas que permitem saber a média e a dispersão de um conjunto de dados. Além disso, a popularização dos recursos da informática associada à criação de di- versos softwares estatísticos, tornou a utilização dos laboriosos recur- sos da Estatística algo relativamente fácil. Testes estatísticos, com suas fórmulas assustadoras, podem ser executados rapidamente com o au- xílio do computador, bastando que os dados sejam introduzidos ade- quadamente e que sejam dadas as instruções corretas. Mas de nada adianta dispor de todos estes recursos quando não se conhecem os conceitos básicos subjacentes. O computador executa e apresenta os resultados, mas ainda cabe ao humano intro- duzir os dados em um programa estatístico, dar as instruções a este programa, entender e interpretar os resultados fornecidos pelo compu- tador. Ou seja, o computador é somente um executor de cálculos e nada mais. O mundo ainda precisa de pessoas que saibam interpretar os resultados apresentados pelo computador. - 9 - Estatística para o curso de Psicologia Embora existam muitos livros ótimos sobre Estatística, o merca- do nacional carece de títulos direcionados especificamente a psicólogos e estudantes de Psicologia, uma parcela da população caracterizada pela sua aversão a números, fórmulas e tudo mais que seja ligeiramente ligado à Matemática. O típico profissional ou estudante de Psicologia, ao consultar um livro clássico de Estatística assusta-se com as fórmulas e equações e, usando um termo comum a estes profissionais, sofrem um “bloqueio” generalizado também aos conceitos estatísticos. Ao contrário de outros profissionais que podem não gostar de números e exercer suas atividades profissionais sem maiores proble- mas, constantemente os psicólogos se deparam com situações que lhes exigem, pelo menos, conhecimentos básicos de Estatística. Seja lendo o manual de algum instrumento de avaliação psicológica, ou um artigo em que são apresentados resultados de alguma pesquisa, ou realizando a análise dos dados de sua pesquisa, ou simplesmente as- sistindo uma palestra, lá estão os conceitos estatísticos que necessi- tam ser compreendidos adequadamente. No exercício da profissão, são relativamente poucas as situações em que o psicólogo está imune aos números e à Estatística. Da mesma forma que outros profissionais ligados às ciências davida, o psicólogo não pode mais se dar ao luxo de negligenciar o poder da Estatística. Há algum tempo, leciono Estatística para estudantes de Psico- logia e, todos os anos, me deparo com alunos assustados ou até hostis com esta disciplina. É freqüente a indagação: “Mas por que um Psicó- logo precisa saber disso?”. Como poderá ser constatado na Introdução deste livro, o relacionamento semântico entre Estatística e Matemáti- ca, associado aos métodos amplamente utilizados na apresentação desta última disciplina nos ensinos fundamental e médio, certamente podem ajudar a explicar esta aversão generalizada. Neste livro, procurei apresentar a Estatística com uma lingua- gem desprovida de jargões e, sempre que possível, usando exemplos ligados aos objetivos práticos da Psicologia. Além disso, não enfatizei os cálculos (as fórmulas apresentadas nem precisam ser lidas), uma vez que atualmente o usuário da Estatística precisa dominar seus con- ceitos e aplicações – como já citei, os cálculos podem ser deixados por conta do computador. Trata-se de um livro que é propositalmente de caráter introdutório, mas são apresentadas as indicações bibliográfi- cas para aqueles leitores que desejarem conhecer de maneira mais profunda os temas aqui abordados. Este livro foi dividido em 2 partes, cada uma delas subdivididas em capítulos. Nos capítulos que compõem a primeira são apresenta- dos os conceitos básicos da Estatística e as formas de utilizar a Esta- tística para descrever e analisar conjuntos de dados. A segunda parte é composta por capítulos que abordam te- mas mais específicos. O texto de Makilim N. Baptista aborda a uti- lização da Estatística na Psicologia, mais exatamente na avaliação psicológica. Na següência, o capítulo escrito por Altemir J. G. Bar- bosa descreve um tipo de análise bastante utilizado em pesquisas psicológicas e também na elaboração de instrumentos de avalia- ção psicológica, a análise fatorial. E, para finalizar, Marcos A. de Souza e Israel Souza apresentam e descrevem alguns dos muitos programas de computador que podem ser empregados para o tra- tamento estatístico de conjuntos de dados. Espero que o conteúdo deste livro sirva tanto para mostrar que a Estatística não é necessariamente só matemática, como tam- bém auxiliar o leitor a compreender e aplicar melhor os conceitos estatísticos necessários ao seu exercício profissional ou acadêmico. Paulo R. Morais Prof. titular do curso de Psicologia da UNESC – União das Escolas Superiores de Cacoal Parte 1 PPPPPara conhecerara conhecerara conhecerara conhecerara conhecer a Estatísticaa Estatísticaa Estatísticaa Estatísticaa Estatística 1. O QUE É ESTATÍSTICA? A palavra estatística tem sua origem no termo em latim status (estado), empregado originalmente para descrever assuntos de interesse do Estado. Ainda que a palavra “estatística” tenha sido empregada da maneira como a conhecemos somente no final do século XVIII, sabe-se que, cerca de 5000 anos a.C., algumas civilizações já efetuavam levantamentos populacionais com finalidades militares e tributárias. Por caracterizar a estatística como uma ciência que agrupava as informações de recenseamentos socioeconômicos e políticos que, em última análise, eram informações que diziam respeito ao Estado, o então universitário alemão Gottfried Achenwall ficou conhecido como o “Pai da Estatística”. Em um de seus usos mais corriqueiros, o termo pode significar um conjunto qualquer de dados numéricos, como, por exemplo, as estatísticas de desemprego, inflação, natalidade, acidentes e mortes nas estradas em um final de semana prolongado. De fato, tal significado parece estar fortemente ligado à origem histórica do termo. A palavra “estatística” pode ser utilizada em diferentes contextos e com diferentes significados. De modo geral, o termo é utilizado com dois significados: a) estatística – é uma parte da Matemática Aplicada que fornece métodos e técnicas para coletar, organizar, resumir, analisar e apresentar conjuntos de informações numéricas. Neste sentido, a Estatística, é uma ferramenta utilizada por I. Conceitos básicos - 14 - Paulo Rogério Morais várias ciências, entre elas a Psicologia, para, entre outras coisas, tornar compreensíveis e mais confiáveis os resultados de pesquisas; e b) estatística – o termo também é empregado (geralmente com letra minúscula) para referir-se a qualquer parâmetro utilizado para descrever um conjunto de dados. Por exemplo, a média das estaturas de um grupo de estudantes é uma estatística, ou as taxas oficiais de inflação, as estatísticas de desemprego, entre outras. Por muito tempo, o emprego das técnicas estatísticas ficou restrito aos recenseamentos estatais. Somente na segunda metade do século XVII, a estatística foi aplicada para a descrição e análise de variáveis biológicas. John Graunt, matemático inglês, fez o levantamento e análise acerca dos nascimentos e mortes ocorridos em Londres no qual observou, entre outras coisas, que o número de nascimentos de meninas era maior do que o de meninos e que a taxa de mortalidade era maior entre as pessoas do sexo masculino em todas as faixas etárias pesquisadas. Desde então, os biologistas passaram a dar grande importância à mensuração objetiva dos dados em suas pesquisas, sofisticando cada vez mais a análise quantitativa dos fenômenos biológicos. Nas Ciências Biológicas e da Saúde, costuma-se fazer referência à Bioestatística ao tratar do emprego de técnicas e métodos da estatística para as Ciências Biológicas. A Estatística pode ser subdividida com base em seus dois principais usos: Estatística Descritiva – é a parte da Estatística usada com o objetivo de descrever conjuntos de dados utilizando-se de técnicas adequadas para o resumo e apresentação de tais dados. A Estatística Descritiva não tem a função, nem o objetivo, de extrapolar as conclusões tiradas de um pequeno conjunto de dados para conjuntos maiores. Ainda que muitas pessoas não compreendam adequadamente o significado de alguns conceitos da Estatística Descritiva, diariamente temos contato com conceitos como “média”, “normal”, “porcentagens”, e outros. É raro um jornal ou uma revista semanal não empregar gráficos ou tabelas para ilustrar as notícias e tornar mais atraentes e compreensíveis alguns de seus artigos. Estatística Inferencial – trata-se da parte da estatística que é utilizada para auxiliar o pesquisador na tomada de decisões, na comparação de dados de diferentes grupos e generalização de resultados obtidos de amostras para toda a população. Embora a Estatística Inferencial seja de fundamental importância na atividade científica e na vida de - 15 - Estatística para o curso de Psicologia qualquer pesquisador, raramente temos contato com este tipo de Estatística em meios de comunicação de massa ou em nosso dia-a- dia fora do ambiente científico ou acadêmico. Podemos dizer, sem corrermos grandes riscos, que as únicas vezes que temos contato com este tipo de Estatística, fora de tais ambientes, são nas pesquisas eleitorais. Sempre que são apresentadas as porcentagens de intenções de votos para o candidato A ou B, são também apresentadas as margens de erro de tais dados. Estas margens de erro são obtidas por meio do emprego de técnicas da Estatística Inferencial. 2. POPULAÇÃO E AMOSTRA Nos mais diferentes campos, o emprego de técnicas estatísticas baseia-se no tratamento de dados que podem ser obtidos de dois diferentes conjuntos de elementos: população ou amostra . 2.1 – População (ou universo) Em Estatística, define-se população como o conjunto composto por todos os elementos, adequadamente definidos em função de tempo e espaço, que possuem com uma ou mais características comuns. Desta forma podemos ter populações formadas por pessoas, animais de laboratório, dados experimentais, prontuários, canetas produzidas por uma empresa etc. O número de elementos que compõe uma população é representado por N (maiúsculo). Logo, um arquivo contendo os 3.152 prontuários de pacientes atendidos em um determinado hospital aolongo do mês de agosto de 2005 é uma população com N= 3.152. Com base nesta definição, é virtualmente impossível tomar contato com muitas populações, a menos que seus elementos sejam definidos em função de tantas características em comum que torne o N consideravelmente pequeno. Por exemplo, quando se faz referência à população de estudantes, será impossível se realizar uma pesquisa com tal população, pois ela é composta por todos os estudantes do mundo e por todos os indivíduos que, um dia, foram estudantes, no momento em que possuíam este atributo (ser estudante). Mas se a população é definida como os estudantes do curso X, matriculados no ano Y, na escola Z, o número de elementos que possuirão tais características é limitado e passível de estudo. No entanto, quanto mais características são empregadas para se definir a população, mais restritos à tal população são os resultados obtidos. - 16 - Paulo Rogério Morais Além disso, podemos ter populações infinitas, que são compostas por um número indeterminado de elementos, ou populações finitas, que são aquelas compostas por um número claramente delimitado de elementos. Para fins práticos, populações finitas com N muito grande podem ser consideradas infinitas. Imagine os estudantes matriculados em escolas públicas no estado de São Paulo no ano de 2005. Esta população possui um N finito, mas tão grande e de tão difícil acesso que é mais conveniente considerar que esta população é virtualmente infinita. 2.2 – Amostra Independentemente de se pretender estudar características de populações finitas ou infinitas, geralmente as pesquisas possuem vários elementos que limitam, ou mesmo, impedem que seja estudada toda a população. Limitações relacionadas ao tempo, recursos econômicos e humanos, entre outras, fazem com que os pesquisadores estudem apenas uma parte da população. Esta parcela da população que é estudada recebe o nome de amostra . Conceitualmente, uma amostra é um subconjunto composto por um número limitado e conhecido de elementos extraídos da população (o tamanho da amostra, isto é, o número de elementos ou observações que a compõe, é representado por n – minúsculo). Na grande maioria das vezes, tal subconjunto é estudado com o objetivo de tirar conclusões que possam ser generalizadas para toda a população que o originou. Para que se possam generalizar as conclusões tiradas de um pequeno grupo para toda a população, a amostra deve ser representativa da população que a originou. Para tanto alguns preceitos devem ser obedecidos: 1. Com base no conhecimento que o pesquisador possui acerca das características tanto quantitativas quanto qualitativas da população a proporção de tais características deve ser respeitadas na constituição da amostra. Como exemplo, imagine a distribuição por gênero entre os estudantes de Psicologia brasileiros. Vários levantamentos têm demonstrado que nas universidades brasileiras, algo em torno de 90% dos estudantes de Psicologia são do sexo feminino e os cerca de 10% restantes são do sexo masculino. Uma amostra com n=20, para ser representativa da população de estudantes de Psicologia brasileiros, precisaria ser constituída por algo em torno de 18 garotas e 2 rapazes. - 17 - Estatística para o curso de Psicologia 2. Os elementos que irão compor a amostra devem ser extraídos da população aleatoriamente, isto é, ao acaso. A seleção dos elementos ao acaso deve possibilitar que cada elemento que compõe a população tenha a mesma chance de ser incluído na amostra. Com isto, a amostra também se torna imparcial . O princípio da imparcialidade também deve ser aplicado quando se pretende alocar elementos em diferentes grupos (por exemplo, grupo controle e grupo tratado). Este cuidado evita a distribuição tendenciosa dos elementos nos grupos. Além disso, a amostra deve ter tamanho adequado. Ainda que, como regra geral, quanto maior o n, maior seja a chance de se ter uma amostra representativa da população, muitas vezes o pesquisador trabalha com uma amostra de tamanho mínimo, seja por questões éticas, econômicas ou outras. Devemos, ainda, considerar que o uso de amostras com n de tamanho inadequado podem mascarar os resultados. Amostras muito pequenas podem deixar que diferenças importantes não sejam detectadas, e amostras muito grandes podem fazer com que diferenças que não tenham quaisquer significados práticos sejam interpretadas como estatisticamente significantes. Algumas questões importantes devem ser consideradas para se estabelecer o tamanho das amostras: a) Variabilidade dos dados: quanto maior a variabilidade dos dados, maior deve ser o tamanho da amostra. b) Tamanho da diferença que se pretende localizar: quanto mais sutil for a diferença que se pretende localizar, maior deve ser a amostra. c) Tamanho do risco que o pesquisador se dispõe a correr: quanto menor o risco que o pesquisador pretende correr ao tomar suas decisões, maior deve ser o tamanho de sua amostra. Existem técnicas estatísticas que permitem ao pesquisador estabelecer quantos elementos são necessários para compor sua amostra. Dado o caráter introdutório deste livro, tais técnicas não serão abordadas. Além das limitações já citadas no início desta seção, o uso de amostras também se justifica por outros motivos, tais como: – populações finitas com n muito grande só podem ser estudadas por meio de amostras. Por exemplo, embora o número de ratos existentes no mundo no momento que se vai fazer um experimento seja finito, o pesquisador jamais terá acesso a todos os ratos que existem para que possa sorteá-los e distribuí-los em diferentes grupos. – o estudo pode acabar com a população, ou inviabilizar estudos futuros com a mesma população. - 18 - Paulo Rogério Morais – o estudo de uma amostra pode ter mais valor científico do que o estudo de toda a população. Se um pesquisador pretende estudar as variáveis relacionadas à prevenção do consumo de drogas entre estudantes do ensino médio de uma região, as conclusões obtidas a partir da avaliação cuidadosa de uma amostra serão muito mais confiáveis do que aquelas obtidas em um levantamento superficial de dados de toda a população. O uso de amostras possibilita um tipo de raciocínio científico bastante utilizado: o raciocínio indutivo. Com este tipo de raciocínio, podemos chegar a conclusões sobre o todo (a população) a partir da observação somente de uma fração deste todo (a amostra). Por exemplo, a partir da observação dos sintomas de estresse presentes em alguns profissionais que trabalham em uma empresa, podemos ter uma idéia geral do estresse entre todos os funcionários desta empresa. É certo que este tipo de raciocínio pode gerar conclusões equivocadas, mas, com o auxílio de técnicas da estatística inferencial, podemos pelo menos saber qual o grau de confiança que podemos depositar em tais conclusões. Uma crítica feita, à forma indutiva de se fazer ciência, é que premissas verdadeiras não garantem a verdade de sua conclusão, uma vez que não foram observadas todas as possibilidades de um dado fenômeno. Durante a Segunda Guerra Mundial, cães foram treinados para explodirem tanques de guerra. O treino consistia em alimentar, repetidas vezes, os animais próximos a tanques. No entanto, em combate, os cães carregavam consigo, presas às costas, bombas que eram detonadas quando se aproximavam do tanque inimigo. Se tivessem a possibilidade de acrescentar mais uma observação à sua amostra do comportamento “aproximar-se de tanques”, certamente tais cães teriam outra idéia acerca de tanques de guerra. Desta mesma maneira, o estresse observado em alguns funcionários da empresa anteriormente citada, pode não ser verdadeiro para todos os funcionários da mesma, mas, quando compreendemos os significados dos conceitos estatísticos e as limitações da própria Estatística, somos capazes de avaliar mais criteriosamente as conclusões que nos são apresentadas. 2.2.1 – Seleção de elementos para a(s) amostra(s) Um dos passos mais importantes em qualquer pesquisa é a obtenção dos dados a partir de elementoscom características que representem adequadamente a população. Na Psicologia, bem como - 19 - Estatística para o curso de Psicologia em outras ciências, a validade das conclusões de uma pesquisa, e as generalizações possíveis, estão fortemente ligadas à representatividade das amostras das quais os dados foram coletados. Imagine uma pesquisa na qual se fez o levantamento de consumo de álcool, tabaco e outras substâncias psicoativas entre jovens, na qual os dados foram coletados junto a um grupo de indivíduos com características bastante específicas como, por exemplo, freqüentadores de bares e danceterias. Certamente, a generalização das conclusões obtidas com tal grupo para a população de jovens terá sérias restrições, dada à especificidade da amostra utilizada que não contempla importantes características da população que se pretendeu representar. Para maximizar a chance de se obter amostras representativas da população, são utilizadas as técnicas de amostragem . Tais técnicas são procedimentos utilizados para se extrair da população os elementos que irão compor a amostra e podem ser divididas em: • Casuais: com o emprego das técnicas casuais todos os elementos da população devem ter a mesma probabilidade de serem selecionados para compor a amostra. Tal definição, muitas vezes, pode tornar inviável o emprego de amostras obtidas de forma estritamente casual. Para fins práticos, pode ser considerada casual toda amostra em que o pesquisador ou o responsável pela coleta dos dados não tem o poder de “escolher” que elemento irá ou não fazer parte da amostra. • Não-casuais: nas amostras obtidas de forma não-casual, os elementos que compõem a amostra serão aqueles que, de alguma forma, convém ao pesquisador. A chance de serem incluídos na amostra não é igual para todos os elementos da população. Como já foi citado, nas amostras obtidas a partir de técnicas casuais, todo elemento da população deve ter a mesma chance de ser incluído na amostra. Isto implica na necessidade de se identificar todos os elementos que compõem a população, o que nem sempre é uma tarefa possível ou viável. Como exemplo, imagine que você pretende fazer o screening (detecção de casos) de sintomas psicopatológicos entre os habitantes de uma pequena cidade. Onde poderia ser encontrada uma listagem de todos os habitantes desta cidade? E, se tal lista fosse encontrada, o que garantiria que ela está atualizada? Será que nesta lista estão incluídos os eventuais moradores de rua, ou as pessoas que se mudaram recentemente para esta cidade, foram excluídos os indivíduos que faleceram ou que se mudaram? - 20 - Paulo Rogério Morais Desta forma, a menos que se disponha de tempo e recursos humanos e financeiros suficientes para se identificar todos os elementos da população, quase sempre o uso de amostras obtidas de maneira rigorosamente casual não é possível. Mas, para respeitar o princípio da imparcialidade, as técnicas de amostragem casuais são preferíveis às não-casuais. A seguir são apresentadas duas técnicas para se obter amostras de forma casual: Amostra casual simples Neste tipo de amostra, os elementos da população são literalmente sorteados. Com uma listagem contendo todos os elementos da população, o pesquisador estabelece qual será o tamanho de sua amostra e faz o sorteio dando a cada elemento a mesma chance de ser sorteado. Este procedimento é bem parecido com os sorteios de nomes nas brincadeiras de amigo secreto (ou oculto), em que pedaços de papel com os nomes dos participantes são colocados em uma caixa e sorteados. Com populações pequenas, este pode ser um procedimento bastante prático, mas, quando trabalhamos com populações compostas por um grande número de elementos, o mais indicado é o uso de uma tabela de números aleatórios como a apresentada no quadro 1.1: Para se utilizar tal tabela, cada elemento que compõe a população deve ser identificado com um (e somente um) número e o pesquisador estabelece algum método para buscar na tabela, aleatoriamente, os números de identificação dos elementos que irão compor a amostra (por exemplo, fechar os olhos e colocar o dedo sobre a tabela). No entanto, o uso de algum programa de computador que faça o sorteio de elementos a partir de uma listagem pode poupar bastante trabalho. Quadro 1.1: Exemplo de tabela de números aleatórios Colunas Linhas 1 2 3 4 5 6 7 8 9 10 1 9 8 9 6 9 9 0 9 6 3 2 3 5 6 1 7 4 1 3 2 6 3 4 0 6 1 6 9 6 1 5 9 4 6 5 6 3 1 6 8 6 7 2 5 2 4 9 7 9 1 0 3 9 6 6 7 6 1 2 7 5 6 9 4 8 7 8 2 1 3 4 7 4 6 3 0 8 6 9 5 6 5 6 0 9 0 7 9 6 2 5 7 9 4 3 0 6 6 10 9 6 9 2 6 8 0 7 1 3 - 21 - Estatística para o curso de Psicologia Amostra sistemática Esta técnica de amostragem apresenta uma grande vantagem sobre a técnica casual simples: não é necessário ter a identificação de cada elemento da população para posterior sorteio. Mesmo assim, o princípio da imparcialidade é mantido, pois o pesquisador não tem o poder de “escolher” qual elemento irá compor ou não sua amostra. Para se obter este tipo de amostra o pesquisador estabelece uma regra, geralmente numérica, que ira obedecer para realizar a seleção dos elementos que irão compor a sua amostra. O pesquisador pode, por exemplo, estabelecer que ira coletar os dados de um a cada cinco elementos. Desta forma, todo quinto elemento contado terá seus dados coletados. Imagine um pesquisador que pretende fazer o levantamento do tempo médio de espera de pacientes para serem atendidos em uma clínica escola usando uma amostra composta por 25% dos pacientes que estão na lista de espera. Com os prontuários de tais pacientes em mãos, o pesquisador pode coletar os dados de um a cada 4 prontuários contados. A figura 1.1 ilustra este sistema: Figura 1.1 – Exemplo de amostragem sistemática Prontuário 23 Prontuário 22 Prontuário 21 Prontuário 20 Prontuário 19 Prontuário 18 Prontuário 17 Prontuário 16 Prontuário 15 Prontuário 14 Prontuário 13 Prontuário 12 Prontuário 11 Prontuário 10 Prontuário 9 Prontuário 8 Prontuário 7 Prontuário 6 Prontuário 5 Prontuário 4 Prontuário 3 Prontuário 2 Prontuário 1 - 22 - Paulo Rogério Morais A partir da regra estabelecida, o pesquisador coletará dados somente dos prontuários em destaque na figura. Ele não tem qualquer poder sobre a escolha de qual prontuário estará, por exemplo, na quarta ou na décima segunda posição. É claro que, neste caso, para usar tal regra o pesquisador deverá saber como tais prontuários foram ordenados. Se estiverem ordenados de acordo com a data de entrada, o pesquisador irá obter resultados que podem não refletir a realidade, pois os primeiros estarão a mais tempo esperando atendimento do que os últimos. Com o uso de uma técnica sistemática, o pesquisador não necessita que os elementos estejam identificados. Além disso, o pesquisador não tem o poder de determinar qual elemento estará ocupando a posição determinada pelo seu sistema, o que confere imparcialidade na composição de amostras obtidas de maneira sistemática. Um pesquisador que pretende avaliar a sintomatologia depressiva de puérperas em um posto de vacinação pode, por exemplo, estabelecer que irá coletar os dados de toda oitava mãe que chegar ao posto e concordar em participar da pesquisa. O pesquisador não tem qualquer controle sobre quem será esta oitava mãe a chegar ao posto. Vale lembrar que, usando ainda este exemplo, nem toda oitava mãe estará obrigada a aceitar participar da pesquisa e, na impossibilidade de se coletar os dados de um dos elementos que a regra pré-determinou, devemos sempre estabelecer também uma regra que corrija esta situação, isto é, uma regra que será empregada caso a primeira falhe ou mostre-se inviável. Esta regra de correção deve serestabelecida no mesmo momento em que se estabelece a regra para a obtenção dos elementos amostrais. Da mesma forma que na amostragem casual simples, os elementos que irão compor uma amostra sistemática não são, a priori, escolhidos por quem coleta os dados. A seguir são apresentados dois tipos de amostras que nem sempre serão representativas da população, mas que são bastante utilizadas e, quando compostas com o uso de alguma técnica casual, podem produzir resultados válidos para os objetivos de muitos estudos. Amostra estratificada (ou proporcional) Neste tipo de amostra, a população é dividida em subgrupos (estratos) dos quais os elementos que formarão a amostra poderão ser extraídos de forma casual ou sistemática. Como exemplo, imagine que um pesquisador deseja avaliar a aceitação da liberação do aborto pelos estudantes de Psicologia de uma universidade. O pesquisador pode julgar que o sexo do sujeito pode ser uma variável que - 23 - Estatística para o curso de Psicologia influenciará seus resultados. Desta forma, o pesquisador pode estabelecer que sua amostra será dividida em diferentes estratos: rapazes e garotas. Após identificar os estratos, os elementos que irão compor cada estrato podem ser selecionados da população por meio de um sorteio ou obedecendo algum sistema. Vale salientar que, para ser uma amostra rigorosamente representativa da população, as proporções dos estratos devem ser semelhantes às da população. Se, no Brasil, somente 10% dos estudantes de Psicologia são do sexo masculino, o estrato da amostra composto pelos rapazes deverá corresponder a algo em torno dos 10% do número total de elementos da amostra. Entretanto, para os objetivos da pesquisa proposta, seria muito mais razoável o pesquisador utilizar uma amostra com um número semelhante de rapazes e de garotas. Tais adequações ficam sempre a critério de quem realiza a pesquisa. Amostra de conveniência Este tipo de amostra é composto por elementos que estão facilmente disponíveis ao pesquisador. As amostras de conveniência são tidas por muitos estatísticos como o exemplo clássico da amostragem não-casual e fonte de amostras tendenciosas ou enviesadas, por este motivo é alvo de sérias restrições. No entanto, a utilização deste tipo de amostra é bastante comum na área de saúde. Muitas pesquisas são feitas com pacientes atendidos em um só hospital ou clínica e, não raro, estudantes são usados como sujeitos controle. Além disso, algumas pesquisas na área de saúde só são possíveis de serem realizadas quando são utilizadas amostras que, a rigor, são de conveniência. Se um pesquisador pretende avaliar aspectos familiares das famílias de indivíduos esquizofrênicos, ele certamente não terá como listar todos os elementos que compõem esta população para fazer um sorteio ou estabelecer um sistema para selecionar os elementos de sua amostra. Neste caso, o pesquisador poupara tempo, dinheiro e energia buscando seus sujeitos em algum centro especializado em tratar esta patologia ou em algum ambulatório de saúde mental. Mesmo dispondo de todos os recursos necessários, o pesquisador jamais teria contato, por exemplo, com indivíduos que possuem a doença, mas são considerados excêntricos ou têm seus sintomas interpretados como sinal de possessão demoníaca, encosto ou coisas do gênero. Mas, mesmo trabalhando com amostras que são por definição de conveniência, o pesquisador pode, e deve, empregar alguma técnica - 24 - Paulo Rogério Morais que priorize a aleatoriedade na seleção dos elementos dos quais que irá coletar os dados. Do mesmo modo, o pesquisador também precisa especial prudência na interpretação e apresentação de resultados obtidos a partir de amostras de conveniência. No exemplo do pesquisador que pretendia estudar aspectos familiares de portadores de esquizofrenia, é razoável inferir que famílias que têm um dos seus membros sendo tratado como portador de uma doença mental deve possuir aspectos bastante diferentes de uma outra família que interpreta os sintomas de esquizofrenia de um de seus membros como castigo divino ou coisa parecida. Com o uso de amostras de conveniência, aumentam as chances de o pesquisador obter, consciente ou inconscientemente, uma amostra não-representativa da população. Quando a amostra não representa adequadamente a população, é comum dizer que este tipo de amostra se trata de uma amostra enviesada ou tendenciosa . O uso deste tipo de amostra pode dar origem a resultados que podem representar interpretações equivocadas quando extrapoladas para a população, como pode ser visto nos seguintes exemplos: – coletar dados com idosos em dois locais, um posto de saúde e em um grupo atividades para a terceira idade, e concluir que a sintomatologia depressiva do primeiro grupo é maior do que a do segundo. Provavelmente os idosos que foram abordados no posto de saúde estavam se tratando de algum problema de saúde, o que já é um fator de risco para o surgimento de sintomas da depressão. – coletar dados de um grupo de alunos indicados pela diretoria de uma escola para avaliar o uso de substâncias entre os estudantes. A direção pode indicar os alunos que já apresentaram algum problema relacionado ou que têm muitas queixas disciplinares dos professores, como também o contrário, isto é, classes ou alunos com comportamento exemplar. Em ambos os casos, os resultados poderão não representar adequadamente a realidade da população dos estudantes, nem mesmo da pequena população de estudantes daquela escola na qual os dados foram coletados. Com o uso de amostras enviesadas qualquer pesquisador pode provar qualquer coisa que deseje. Por exemplo, para demonstrar que o uso de cigarro esta relacionado ao surgimento de tumores na garganta, o pesquisador poderá coletar seus dados em um centro de tratamento para câncer na garganta e perguntar aos pacientes se estes são (ou foram) fumantes. Certamente a proporção de pacientes com câncer na garganta que são ou foram fumantes será bem maior - 25 - Estatística para o curso de Psicologia do que a de fumantes que desenvolveram câncer na garganta. Conhecer alguns fundamentos estatísticos pode evitar graves erros metodológicos ou, pelo menos, auxiliar a identificação de tais erros permitindo que avaliemos mais criticamente os resultados e conclusões de uma pesquisa. Critérios de Inclusão e de Exclusão Além de tomar o cuidado de empregar alguma técnica adequada (sempre que possível que privilegie a imparcialidade na escolha dos elementos, pelo menos) para selecionar os elementos que irão compor a amostra, o pesquisador poderá economizar muito tempo, dinheiro e energia, além de obter resultados mais confiáveis, se estabelecer, previamente, e com base em seus objetivos e outras informações que possui acerca do fenômeno que está sendo estudado, algumas características que os elementos da população devem ou não possuir para que possam fazer parte da amostra. Para limitar e também controlar algumas características dos elementos que irão compor a amostra, tornando-a mais homogênea, é recomendado que sejam estabelecidos, previamente à coleta dos dados, os critérios de inclusão e os de exclusão. • Critérios de inclusão: são características que o elemento deve possuir para que possa ser um dos componentes da amostra. Cada um dos elementos da amostra deve possuir todas as características estabelecidas como critérios de inclusão. Uma forma bastante prática para se estabelecer tais características é responder à questão: “Quais as características que um elemento deve possuir para poder responder de forma confiável ao meu problema de pesquisa?”. • Critérios de exclusão: são características que, se o elemento possuir, o mesmo não poderá fazer parte da amostra. Os elementos não podem ter nenhuma destas características para serem incluídos na amostra. Normalmente, os critérios de exclusão são características que podem gerar resultados dúbios ou difíceis de serem interpretados. A questão que auxilia o pesquisador estabelecer os critérios de exclusão é: “Quais característicasque, se o elemento possuir, poderão enviesar a pesquisa ou impossibilitar a correta interpretação dos meus resultados?”. É bom lembrar que os critérios de exclusão não são as negativas ou os antônimos dos critérios de inclusão. Por exemplo, se o pesquisador - 26 - Paulo Rogério Morais estabelece como critério de inclusão “possuir diagnóstico de distimia”, não possuir tal diagnóstico não é critério de exclusão, pois os sujeitos sem o diagnóstico de distimia sequer foram inclusos na amostra. No entanto, os resultados poderão ser difíceis de serem interpretados se, além do diagnóstico de distimia, o individuo também possuir o diagnóstico de transtorno de ansiedade. Neste caso, “apresentar co-morbidade” seria um critério de exclusão. Pois, quando o pesquisador se deparar com os dados de um indivíduo com distimia e ansiedade que apresenta, por exemplo, dificuldades de relacionamento inter-pessoal, será difícil definir o que produziu este resultado. As dificuldades de relacionamento estariam associadas à distimia, à ansiedade ou a ambas? 3. TIPOS DE VARIÁVEIS Como o próprio nome sugere, variável é qualquer fenômeno, elemento ou atributo da natureza que seja passível de mensuração, contagem ou classificação e que pode assumir diferentes valores nas diferentes observações que são feitas, isto é, que variam. Por exemplo, a estatura é um atributo que pode adquirir diferentes valores em diferentes indivíduos e até no mesmo indivíduo, quando observado em diferentes momentos. De modo geral, as variáveis estudadas pelos psicólogos e outros biologistas são chamadas de variáveis aleatórias , pois seus valores são influenciados por um ou mais fatores não controlados. Os pesquisadores em Psicologia dependem da observação de fenômenos que, mesmo se acompanhados em todas as suas etapas, produzem resultados imprevisíveis. Imagine um biotério que crie somente ratos da linhagem Wistar (os populares ratos brancos), todos sendo submetidos às mesmas condições de alimentação, manipulação e alojamento. Mesmo com todas estas condições de controle, o valor da variável peso, por exemplo, não será necessariamente o mesmo em todos os animais. Alguns fatores, como, por exemplo, o sexo, a idade, características genéticas ou mesmo a posição hierárquica dos animais em suas gaiolas, podem explicar tal variabilidade. De acordo com a sua natureza, as variáveis podem ser classificadas em: Variáveis qualitativas: a variável é considerada qualitativa quando seus valores somente são passiveis de classificação e são expressos em categorias mutuamente exclusivas, com ou sem alguma ordenação lógica e, mesmo que sejam utilizados códigos numéricos para representar tais categorias, os mesmos não têm valor real para - 27 - Estatística para o curso de Psicologia operações matemáticas. Imagine que, para a variável gênero, sejam estabelecidos os códigos numéricos 1=masculino e 2=feminino, uma mulher dividida ao meio não resulta em dois homens. São exemplos de variáveis qualitativas: gênero, grau de instrução, diagnóstico psiquiátrico, nível sintomatológico (leve – moderado – grave), estado civil, nível socioeconômico, entre outras. A descrição de variáveis qualitativas é feita por meio dos valores absolutos (freqüência absoluta) observados em cada categoria da variável e/ou de seus valores percentuais (freqüência relativa). Variáveis quantitativas: estas variáveis são passiveis de contagem e/ou mensuração, tendo seus valores expressos em números com real valor para as diferentes operações matemáticas. As variáveis quantitativas são ainda divididas em: Discretas = o valor é passível de contagem, com claro limite entre um e outro valor da variável. Por exemplo, número de alunos em uma sala, número de palavras recordadas em um teste de memória, pontuação obtida em um inventário de estresse, número de vezes que um rato pressiona uma barra em uma caixa de Skinner etc. Contínuas = os possíveis valores das variáveis continuas estão localizados em intervalos que possuem infinitos valores, sendo que o valor que será atribuído a uma variável contínua depende do grau de precisão do instrumento utilizado para a medição. Um exemplo é a estatura de uma pessoa que pode ser expressa em metros, centímetros, milímetros etc. dependendo do grau de precisão do instrumento e da técnica utilizados para a mensuração. Quando se pergunta a idade de uma pessoa, geralmente a resposta é dada em anos, embora pudesse ser em meses, dias, horas, minutos, segundos, e por ai vai... Entre 20 e 21 anos existem infinitos valores, mas para fins práticos as variáveis contínuas são trabalhadas como se fossem discretas. A descrição das variáveis quantitativas deve ser feita usando- se uma medida capaz de representar todas as medidas observadas (medida de tendência central) e também uma medida que represente a variação dos valores no conjunto (medida de dispersão). Uma forma prática de diferenciar as variáveis qualitativas das quantitativas é: As variáveis qualitativas são mais claramente representadas por palavras, e as quantitativas são representadas mais precisamente por meio de números do que por palavras. Por exemplo, é mais simples avaliar a cor dos olhos de uma pessoa pelos nomes das cores (castanho, azul, verde, etc) do que pelo valor dos comprimentos de ondas do espectro eletromagnético refletidos por tais cores. Da mesma forma, é mais preciso dizer que uma pessoa tem 1,70 m do que dizer que é uma pessoa com estatura mediana. - 28 - Paulo Rogério Morais 4. NÍVEIS DE MENSURAÇÃO 4.1 Quantificação Dados arqueológicos indicam que a medição e a quantificação há muito tempo fazem parte da vida do ser humano. Desde épocas muito remotas, o ser humano já utilizava sistemas numéricos para representar as características quantificáveis de informações relevantes do seu dia-a-dia. Antes mesmo de existirem os símbolos numéricos, outros recursos (coleções de conchas ou pedras, por exemplo) já eram empregados com a finalidade de quantificar aspectos importantes para a nossa espécie. Conhecer e descrever a natureza somente em seus aspectos puramente qualitativos é bastante útil, mas a informação que temos, a partir de tal conhecimento, é bastante limitada e, muitas vezes, controverso. Eu posso qualificar uma cidade como violenta só por que presenciei ou fui vítima de algum ato violento nesta cidade, mas a minha impressão pessoal pode não ser uma informação que deva ser generalizada para toda a cidade. Saber que uma cidade é violenta é uma informação bastante proveitosa, mas se tivermos dados quantitativos que substanciem o porquê de tal rótulo para esta cidade, certamente teremos maior conhecimento e poderemos fazer afirmações menos vagas ou puramente emocionais acerca da realidade. O conhecimento qualitativo de algo é melhor do que conhecimento nenhum. Mas, se a esse conhecimento pudermos acrescentar alguma forma de quantificação, teremos um conhecimento mais refinado. Da mesma forma que para nossos antepassados não deveria ser muito funcional saber somente que possuía “muito” gado ou que dispunha de “pouca” comida. Assim como nós, eles necessitavam de informações quantitativas acerca de suas vidas. A quantificação de muitos aspectos da nossa vida foi útil no passado e é uma condição necessária para os dias atuais. Como afirmou o astrônomo Carl Sagan: “Ter medo da quantificação equivale a renunciar aos nossos direitos civis (...)”. Para as ciências, a quantificação oferece duas grandes vantagens: a) índices numéricos possibilitam que os resultados de uma pesquisa sejam apresentados com fineza de detalhes que não seria possível de outra forma; além disso, b) a quantificação também permite o uso de diferentes técnicas matemáticas, que são essenciais para o desenvolvimento de teorias e na análise de dados de pesquisa. A mensuração nada mais é do que regras empregadas para atribuir números ou categorias aos elementos da natureza de forma a representar numericamente seus atributos. Estas regras podem - 29 - Estatística para o curso de Psicologia ser baseadas em critériosbastante simples e até mesmo intuitivos, como contar quantas pessoas estão dentro de uma sala, ou podem exigir procedimentos mais complexos para os quais usar de simples intuição não contribuiria em nada, como, por exemplo, mesurar a sintomatologia depressiva de alguém ou a extensão exata de uma lesão no córtex cerebral de uma pessoa vítima de um acidente. Os fenômenos psicológicos (como inteligência, atenção, aprendizagem, sintomas psicopatológicos, entre outros) são ótimos exemplos para os quais o uso de procedimentos pouco rigorosos ou meramente intuitivos podem gerar mensurações equivocadas. Mas, independente de utilizar procedimentos rudimentares ou complexos, as mensurações, para serem realmente úteis, devem basear-se em critérios padronizados que permitem a diferentes pessoas mensurar um dado elemento ou fenômeno e obterem resultados muito parecidos. Além das já citadas, a utilização de métodos de mensuração padronizados apresenta outras vantagens para as ciências: • Objetividade: o uso de linguagem meramente qualitativa pode representar fonte de controvérsias e dificultar, ou mesmo impossibilitar, que se chegue a alguma conclusão. Se não há forma de quantificar um dado fenômeno como, por exemplo, a personalidade, dois psicólogos podem discordar em muitos aspectos ao avaliarem separadamente a personalidade de uma mesma pessoa. Quando um dado fenômeno é mensurado por métodos padronizados que envolvem procedimentos que dão pouco espaço para interpretações ambíguas, o espaço para divergência também é reduzido. • Comunicabilidade: a comunicação de resultados de pesquisas é muito facilitada quando são empregadas formas padronizadas de mensuração. Existe uma máxima afirmando que o progresso em uma determinada área de conhecimento está diretamente relacionado à eficiência e exatidão com que os pesquisadores desta área conseguem se comunicar. Se um psicólogo pretende apresentar aos seus pares uma técnica para o tratamento da ansiedade, ele será muito mais facilmente compreendido se utilizar dados numéricos que, de alguma forma, quantifiquem o fenômeno em questão do que se utilizasse o relato das experiências subjetivas da ansiedade. • Economia: a quantificação permite que grandes quantidades de informações sejam resumidas e apresentadas de forma bastante clara e não menos precisa. No exemplo anterior, se o psicólogo apresentar as medidas de ansiedade apresentadas pelos seus pacientes em uma escala padronizada irá gastar muito - 30 - Paulo Rogério Morais menos tempo (ou espaço em uma publicação) do que se ele se propusesse a descrever as diferentes particularidades da ansiedade experimentada por seus pacientes. Embora, para muitas áreas do conhecimento humano, a conversão dos atributos estudados em valores numéricos seja algo relativamente tranqüilo (a temperatura de uma superfície, quantos glóbulos vermelhos existem em uma amostra de sangue, qual a área de um terreno), na Psicologia a quantificação não é uma tarefa tão fácil e seus instrumentos de mensuração são constantemente questionados quanto às suas validade e confiabilidade. 4.2 – Níveis de mensuração Diferentes tipos de mensuração podem ser feitos de acordo com as características do fenômeno que se pretende quantificar. O nível de mensuração utilizado determina a quantidade de informação disponibilizada acerca do que foi mensurado. Além disso, o tipo de mensuração feita de um determinado fenômeno irá determinar quais as técnicas estatísticas podem ou não ser empregadas na descrição e análise dos dados. Nível Nominal É a escala de mensuração mais simples e rudimentar, permitindo somente a classificação dos elementos de acordo com algum de seus atributos. Os valores numéricos ou outros símbolos só são utilizados para classificar o elemento em diferentes categorias. Pode-se, por exemplo, usar o número 1 para representar o diagnóstico de depressão e o número 2 para representar o diagnóstico de ansiedade, como é mostrado na tabela 1.1: Neste caso, podemos dizer que: 4 X 1 = 4 deprimidos 3 X 2 = 3 ansiosos Tabela 1.1: Diagnósticos de pacientes atendidos em uma clínica-escola. Sujeito Diagnóstico João 1 Claudia 1 Pedro 2 Olavo 1 Ana 1 Marcos 2 Mara 2 - 31 - Estatística para o curso de Psicologia Como pode ser visto, o valor numérico utilizado para representar os diagnósticos não tem sentido matemático. Os valores da coluna de diagnóstico não representam quantidades, mas sim categoria. Muitas variáveis qualitativas são nominais, pois a única informação possível de se obter observando os diferentes valores que a variável assume é se os valores são iguais ou diferentes entre si. No exemplo acima, só podemos afirmar que o diagnóstico de depressão é diferente do diagnóstico de ansiedade, não existindo sequer uma ordem natural entre estas categorias. São exemplos de variáveis que têm seus “valores” classificados em nível nominal: sexo, estado civil, cor da pele, profissão, diagnóstico psiquiátrico, condição experimental (tratado ou controle), entre muitas outras. Dados nominais não são passiveis de graduação ou ordenação. Se classificarmos homens com 1 e mulheres com 2, isso não quer dizer que os homens sejam melhores, superiores ou anteriores às mulheres, diz somente que são diferentes para o atributo sexo. Nível Ordinal Esta escala fornece um pouco mais de informação do que a escala nominal, pois, além de informar que os elementos são iguais ou diferentes entre si, também existe uma ordem de grandeza entre os valores atribuídos à variável. Os elementos podem ser ordenados em termos de “maior”, ou “melhor que”, e “menor”, ou “pior que”. Desta forma, se atribuímos os seguintes códigos numéricos ao nível de sintomatologia depressiva: 1 – sintomatologia leve 2 – sintomatologia moderada 3 – sintomatologia severa E temos a seguinte situação: De acordo com os dados apresentados na tabela 1,2, podemos afirmar que a sintomatologia de João é maior do que a de Tabela 1.2: Níveis da sintomatologia depressiva em um grupo de pacientes Sujeito Nível da sintomatologia depressiva João 3 Claudia 1 Olavo 2 Ana 2 - 32 - Paulo Rogério Morais Pedro, que é maior do que a de Claudia. Mas não podemos afirmar que a Ana tem duas vezes mais sintomas do que a Claudia ou que a sintomatologia apresentada por João é três vezes mais grave do que a apresentada por Marcos. Uma pessoa com sintomatologia severa de depressão, apresenta mais sintomas do que uma outra pessoa com sintomatologia leve, mas não é, de modo algum, três vezes mais deprimida. Quando são empregados códigos numéricos em uma escala ordinal, os números indicaram postos ou ordem, mas não indica a magnitude das diferenças entre os valores. Por exemplo, sabendo que uma pessoa é considerada como “classe baixa” e outra é rotulada de “classe alta”, segundo algum critério de classificação sócio- econômica, não dá para saber o quanto uma é mais rica do que a outra para receber classificação diferente, só temos a informação de que uma é mais rica, ou possui mais bens, do que a outra. Em Psicologia, mensurações em escala ordinal são muito populares. Um exemplo bastante comum são os instrumentos que avaliam um determinado fenômeno por meio de instrumento com escalas do tipo Likert. As escalas nominal e ordinal são empregas na mensuração de variáveis qualitativas. Lembre-se sempre: quando são utilizados números para classificar ou indicar ordem dos atributos mensurados nestas duas escalas, tais números não têm valor para operações matemáticas. Escala Intervalar Nesta escala, são atribuídos valores numéricos para as observações feitas e tais valores têm representação real e podem ser submetidos à algumas operações matemáticas. A escala intervalar tem como principais características: • a existência de unidades constantes e intervalos fixos e conhecidos entre as unidades; • o ponto zero (ponto de início da mensuração) e a unidade de medida são arbitrários. Como exemplo, podemos citar duas escalas muito utilizadas para a avaliação da sintomatologia de depressão,as escalas de 1 A comparação destas duas escalas foi utilizada somente para o exemplo, pois ambas possuem diferenças relacionadas tanto ao conteúdo, objetivo e à forma de aplicação. - 33 - Estatística para o curso de Psicologia Hamilton e de Beck. Embora ambas se prestem a avaliar o mesmo fenômeno, as pontuações brutas fornecidas em cada uma das escalas não tem o mesmo significado, como pode ser visto na tabela 1.3: Pontos de corte propostos para duas Escalas para avaliação de sintomas de depressão1 Na tabela 1.4 são apresentadas as pontuações obtidas por dois indivíduos avaliados em cada uma das escalas: De acordo com as pontuações de corte de ambas as escalas, a sintomatologia de Nelson não é clinicamente relevante e Luciano apresenta sintomatologia moderada. Mas, a pontuação de Luciano na escala de Beck é quase o dobro da obtida na escala de Hamilton, enquanto que a pontuação de Nelson na escala de Beck não é nem 15% maior do que a obtida na escala de Hamilton. Ao contrário da escala ordinal, na qual sabemos somente que uma medida é maior do que a outra, mas não sabemos o quanto, na escala intervalar nós conhecemos o tamanho do intervalo. Podemos dizer que na escala de Beck Luciano pontuou mais do que Nelson, mas não podemos afirmar que a sintomatologia de depressão de Marcos é três vezes maior do que a de João. Isto acontece por que o ponto zero de ambas as escalas é relativo, isto é, não existe um ponto zero absoluto para a sintomatologia de depressão. De modo geral, quando são atribuídos valores numéricos para fenômenos subjetivos, tais como os sintomas depressivos, inteligência, ansiedade, medo, alegria e outros, podemos afirmas Tabela 1.3: Comparação das classificações atribuídas aos pacientes de acordo com as pontuações obtidas em duas diferentes escalas para avaliar sintomas de depressão Classificação Escala Beck Hamilton Não sintomático 0 -12 0 - 6 Sintomatologia leve 13 -20 7 - 17 Sintomatologia moderada 21 -25 18 -24 Sintomatologia severa 26 – 36 > 25 Tabela 1.4: Pontuação obtida por dois pacientes nas escalas de Hamilton e de Beck para depressão Sujeito Pontuação na Escala Hamilton Pontuação na Escala Beck Nelson 4 7 Luciano 18 21 - 34 - Paulo Rogério Morais que se tratam de medidas intervalares. Existem autores que afirmam que a estratégia de atribuir valores numéricos a tais fenômenos é uma tentativa de intervalizar medidas que são, no máximo, ordinal. Versiani (1989) chama isso de “pseudoquantificação”. Por este motivo, em Psicologia e também em outras ciências, há a necessidade de um senso crítico mais apurado ao se fazer afirmações com base em resultados obtidos a partir de instrumentos que utilizam este nível de mensuração. Se um clínico avalia a sintomatologia depressiva de um paciente com a escala de Beck em dois momentos, na primeira e na décima sessão de psicoterapia. Se a pontuação do paciente foi 24 na primeira avaliação e 12 na segunda, o clínico jamais poderá dizer que o paciente, depois de dez sessões de psicoterapia, só tem a metade da sintomatologia que tinha no início. Tem sim 12 pontos a menos na escala de Beck, e só. Nível Proporcional (ou de Razão) Esta escala é muito parecida com a escala intervalar, contudo, possui um ponto zero absoluto, isto é, o ponto de início da mensuração é constante. Os números utilizados para expressar os valores das variáveis avaliadas neste nível possuem valor empírico, isto é, os números representam verdadeiras quantidades. Mesmo que sejam utilizadas diferentes escalas para expressar a idade de duas pessoas, como mostra a tabela 1.5: Independente da escala (anos ou meses) João tem o dobro da idade de Marcos, pois a medida começa em um ponto zero que é o mesmo para ambas as escalas - os respectivos nascimentos de João ou de Marcos. Nenhuma escala que avalie fenômenos psicológicos atinge o nível proporcional de mensuração, que é tido como o nível ideal de quantificação. Este nível de medida é utilizado em Psicologia quando são feitas contagens de comportamentos, acertos em uma determinada tarefa ou medido o tempo utilizado para realizar tal tarefa, por exemplo. Tabela 1.5: Idades de dois indivíduos usando diferentes unidades de medida Sujeito Idade em anos Idade em meses Marcos 6 72 João 12 144 - 35 - Estatística para o curso de Psicologia Conhecer os diferentes níveis de mensuração e suas características é fundamental tanto para a descrição como também para a escolha de testes apropriados para a análise de dados e teste de hipóteses. Existe um acumulo de informações do nível nominal até o nível proporcional. Isto permite que avaliações feitas em nível proporcional sejam reduzidas a categorias nominais, mas não o contrario. Imaginando os diferentes níveis de mensuração como degraus de uma escada, percebe-se que as medidas podem descer degraus, mas nunca subir. Por exemplo, se avaliamos a sintomatologia depressiva de um indivíduo com o inventário de Beck, e ele obtém 23 pontos (intervalar), podemos dizer que: No entanto, se a avaliação inicial foi feita em uma escala nominal (deprimidos X saudáveis), não podemos transformá-la, sequer, em uma medida ordinal. Se soubermos somente que Nelson é deprimido, não temos como saber se sua sintomatologia é leve, moderada ou severa. Como se pode observar na figura 1.2, se for necessário, podemos converter a pontuação obtida em uma escala intervalar à uma classificação ordinal e até mesmo nominal. Esta é uma característica que deve ser sempre levada em consideração ao se fazer o planejamento de uma pesquisa, pois, se a variável for avaliada em escala nominal, algumas manipulações estatísticas não serão possíveis. Uma dica: sempre utilize a escala de mensuração mais alta possível. Figura 1.2 – Esquema de conve rsão dos níveis de mensuração Intervalar = 23 pontos Ordinal = sintomatologia moderada Nominal = deprimido - 36 - Paulo Rogério Morais Os níveis intervalar e proporcional são empregado na mensuração de variáveis de natureza quantitativa. Para fins de descrição e de análise, varáveis mensuradas nestes dois níveis recebem o mesmo tipo de tratamento estatístico. 5. FASES DO MÉTODO ESTATÍSTICO O trabalho estatístico confunde-se com o trabalho de pesquisa científica, uma vez que o passo inicial em ambos é a existência de um problema de pesquisa, isto é, precisa haver uma questão adequadamente formulada que, para ser respondida, necessita da busca de informações em diferentes fontes. Além disso, o trabalho estatístico também é composto por etapas que podem ser, da mesma forma que em uma pesquisa científica, claramente delimitadas. As etapas que compõe o trabalho estatístico são: 1. planejamento: após ter estabelecido claramente qual é o problema que se deseja responder, deve-se estabelecer alguns pontos fundamentais para que a pesquisa redunde em resultado que seja uma resposta válida para tal problema. Com base nos conhecimentos disponíveis acerca dos aspectos relacionados direta ou indiretamente ao problema de pesquisa, deve-se estabelecer de antemão a maior quantidade possível de elementos que podem exercer alguma influência sobre o bom andamento do trabalho e também sobre a confiabilidade dos resultados. Na fase de planejamento algumas questões devem ser respondidas: – Quais informações são necessárias para se responder o problema? (quais são as variáveis que precisam ser avaliadas / mensuradas) – Qual a natureza das variáveis em questão? (tipo da variável e seu nível de mensuração) – Como tais informações podem ser obtidas? (escolha do instrumento ou meio que será utilizado para se coletar os dados) – Quem ou o que pode fornecer as informações necessárias? (estabelecer os critérios de inclusão e de exclusão para a composição da amostra) – Quantas medições de cada variável serão feitas? (definir o tamanho da amostra) - 37 - Estatística para o curso de Psicologia – Qual será o método empregado para extrair os elementos da população para compora amostra? (definir a técnica de amostragem que será utilizada) – Os elementos que irão compor a amostra serão alocados em grupos diferentes? Se sim, como será feita a alocação dos diferentes elementos nos grupos de estudo? – Onde será feita a coleta dos dados? (condições para o acesso ou a necessidade de se buscar autorizações) – Como será feita a coleta dos dados? (definição do procedimento) – Quais são as hipóteses de trabalho, ou respostas possíveis para o problema pesquisado? (hipóteses nula e alternativa) – Quais as relações entre as variáveis serão estudadas? – Quais tratamentos estatísticos os dados receberão? – Qual será o tamanho do risco que o pesquisador assume correr ao expor suas conclusões? (nível de significância) – E assim por diante. Além destes aspectos diretamente envolvidos com a solução do problema de pesquisa, também é necessário pensar em alguns pontos de ordem prática, como por exemplo, os custos da pesquisa, cronograma de execução, treinamento dos pesquisadores, questões éticas relacionadas à coleta dos dados, e quaisquer outros fatores que poderão ter algum impacto sobre o andamento ou resultado da pesquisa. É importante salientar que todas as decisões tomadas nesta etapa terão conseqüências nas fases que a seguem. Um planejamento mal feito pode comprometer todo o trabalho, enquanto que um planejamento feito de maneira cuidadosa poderá evitar muitos contratempos. O tempo gasto para se fazer o planejamento dificilmente será um tempo perdido. 2. coleta dos dados: neste ponto, o pesquisador, ou indivíduos especialmente treinados para este fim, irá a campo coletar as informações necessárias para a solução do problema. É a coleta de dados que fornece a matéria-prima para o trabalho estatístico subseqüente. A coleta dos dados deve seguir as determinações estabelecidas no planejamento. Esta etapa do trabalho deve ser feita de maneira padronizada, com atenção e cuidadoso controle das variáveis envolvidas, pois, como ressalta Padovani (2000:155), - 38 - Paulo Rogério Morais “dados coletados de forma descuidada podem ser tão inúteis que não haverá procedimento estatístico capaz de salvá-los”. A coleta dos dados pode ser: • direta: quando o pesquisador obtém seus dados em uma fonte primária como, por exemplo, aplicando um questionário ou fazendo ele mesmo as observações e medições; • indireta: quando o pesquisador obtém seus dados a partir de dados já publicados. Neste tipo de coleta, o pesquisador deve ser rigoroso na escolha das publicações de onde irá obter seus dados. Vale ressaltar que, no Brasil, as pesquisas que envolvem a coleta de dados com seres humanos direta ou indiretamente (informações de prontuários ou materiais biológicos, por exemplo), devem observar as normas constantes na Resolução CNS/MS no 196/ 96. Esta resolução estabelece que , entre outras coisas, para a realização da coleta dos dados, o indivíduo que os fornecerá (ou seu representante legal) deverá assinar um termo de consentimento livre e esclarecido. Isto significa que os dados somente poderão ser coletados se o participante concordar em fornecê-los e se tal concordância ocorrer de forma livre (sem o uso de qualquer forma de coerção ou garantias de privilégios por parte do pesquisador ou das instituições envolvidas) e esclarecida (conhecendo plenamente todos os procedimentos aos quais será submetido). Aliás, as pesquisas envolvendo seres humanos deverão, antes de tudo, ter seus protocolos submetidos à análise de um Comitê de Ética em Pesquisa. Embora atualmente não exista, no Brasil, nenhuma resolução acerca das pesquisas que envolvam a coleta de dados em animais não humanos, nestes casos também devem ser tomados alguns cuidados. Além de toda orientação feita por algumas sociedades científicas acerca dos cuidados envolvendo alimentação, manuseio, procedimentos cirúrgicos e pós-operatórios, o pesquisador que trabalha com animais também deve tomar o cuidado de utilizar somente o número de animais necessários para se obter resultados válidos, isto é, não se deve utilizar mais animais do que o necessário. Neste ponto, o emprego de técnicas estatísticas para se definir o tamanho da amostra pode ser de grande utilidade. Independentemente de coletar seus dados de maneira direta ou indireta, o pesquisador deve criar uma forma de identificação dos elementos que compõe a amostra que lhe permita rastrear os dados de qualquer um dos elementos de maneira fácil e rápida quando for necessário. A numeração crescente dos elementos da amostra é uma forma prática e fácil de criar tal identificação. - 39 - Estatística para o curso de Psicologia 3. organização (ou tabulação) dos dados: dezenas de questionários respondidos ou pilhas de formulários com dados coletados não têm muita utilidade prática. Embora todas as informações necessárias para se responder ao problema de pesquisa estejam contidas em tais questionários e formulários, se não forem minimamente organizadas de alguma maneira, o pesquisador terá grande dificuldade em extrair tais informações. Geralmente, pilhas de questionários ou formulários não possibilitam o acesso aos elementos úteis neles contidos. Atualmente a maneira mais fácil de se fazer a organização dos dados é dispô-los em uma planilha de algum programa estatístico de computador. As planilhas de muitos programas estatísticos são compostas por colunas e linhas nas quais os dados devem ser dispostos. Em programas como o SPSS e o Statistica, cada coluna representa uma variável mensurada e cada linha corresponde aos dados de um dos elementos da amostra. O quadro 1.2 representa uma planilha contendo os dados de 10 sujeitos para as variáveis sexo, idade, escolaridade e desempenho em um teste de memória. Embora não seja uma variável a ser analisada, é bastante útil se reservar a primeira coluna da planilha para o número de identificação dos sujeitos. Seguindo esta dica, torna-se fácil e rápida a identificação de qualquer informação contida na planilha. Também é importante lembrar que o preenchimento da planilha deve ser feito com bastante rigor e cuidado, pois se os dados originais dos questionários ou formulários forem digitados de maneira equivoca, o programa estatístico irá trabalhar com informações que não correspondem à realidade. Os programas estatísticos de computadores são recursos que poupam muito trabalho. Aliás, as etapas posteriores à organização Quadro 1.2 – Modelo de planilha Sujeito Sexo idade escolaridade memória 1 masculino 23 ensino médio 10 2 masculino 21 ensino médio 9 3 feminino 19 ensino médio 10 4 masculino 23 ensino médio 8 5 feminino 29 ensino médio 8 6 feminino 32 ensino superior 7 7 masculino 19 ensino médio 9 8 masculino 24 ensino superior 10 9 feminino 20 ensino médio 8 10 masculino 35 ensino superior 8 - 40 - Paulo Rogério Morais dos dados são feitas quase totalmente com a utilização deste recurso, não exigindo do pesquisador conhecimentos acerca das fórmulas e cálculos, muitas vezes complexos, que tanto assustam muitos estudantes e até profissionais da Psicologia que necessitam utilizar a estatística em seu trabalho. 4. avaliação crítica dos dados: nesta fase, são procurados e, sempre que possível, corrigidas as possíveis imperfeições ou erros que podem ter ocorrido na transcrição dos dados dos questionários para a planilha, valores absurdos para as variáveis, omissões (ausência de dados) e outros elementos que podem gerar resultados errôneos. Por exemplo, ao avaliar sua planilha, o pesquisador encontra um indivíduo com 344 anos. Para a variável idade, este valor é absurdo. Qual seria a origem de tal dado, alguém teria respondido ter esta idade ou ocorreu um erro de digitação? Se os elementos que compõe a amostra foram devidamente identificados, torna-se fácil o rastreamento da informação. Quando o pesquisador se depara, durante a avaliação critica dos dados, com uma idade de 344 anos, basta verificar na planilha onde está este dado. Depois é só consultar o questionário correspondente ao sujeito que apresenta este dadoabsurdo na planilha. Se o dado absurdo se deve a um erro de digitação, basta que seja feita a correção. Mas se o dado absurdo é o mesmo que consta no instrumento no qual o dado foi originalmente coletado, o pesquisador deve estabelecer algum critério para fazer tal correção. O mesmo procedimento deve ser empregado para corrigir as eventuais omissões de dados. 5. resumo dos dados: mesmo depois de organizados, seja manual ou eletronicamente, os dados coletados, em seu estado bruto têm pouco a oferecer. Mesmo quando se possui as informações de poucos elementos, como é apresentado no quadro 1.2, não é muito funcional conhecer os valores da variável obtidos por cada um dos elementos avaliados. Imagine uma pesquisa que tenha coletado os dados de duzentas pessoas. Existem maneiras de se sintetizar tais informações a valores capazes de representar o comportamento da variável em todo o grupo. O resumo dos dados será feito de acordo com a natureza de variável em questão: Variáveis qualitativas: são resumidas com a apresentação dos valores absolutos e/ou relativos obtidos para cada categoria da variável. - 41 - Estatística para o curso de Psicologia Variáveis quantitativas: o resumo deste tipo de variável deve ser feito por meio de uma medida de tendência central e uma medida de variabilidade, no mínimo. O próximo capítulo abordará mais detalhadamente as diferentes maneiras de se fazer o resumo dos dados. 6. análise dos dados: nesta fase, são empregadas as técnicas da estatística inferencial. Somente após executar a análise dos dados é que o pesquisador poderá interpretar adequadamente o significado dos seus achados. Não é raro se encontrar artigos publicados em periódicos da área de Psicologia cujos autores negligenciaram a necessidade de submeter seus dados à rigorosa análise estatística, apresentando aos leitores conclusões baseadas tão somente em dados descritivos que podem não representar a realidade. Menos freqüentes, mas não tão raros, são os artigos que apresentam ou erros nos testes empregados para análise ou a interpretação equivocada dos resultados da análise. Mais adiante, no capítulo “Estatística Inferencial”, serão apresentadas as implicações associadas à tomada de decisões (e subseqüentes conclusões) sem que os dados sejam adequadamente analisados e também quais os critérios para se escolher um teste estatístico e como interpretar seus resultados. 7. apresentação dos resultados: os resultados, dados devidamente resumidos, analisados e interpretados, devem ser apresentados de maneira clara e direta. O uso de tabelas e/ou gráficos possibilita que o leitor faça um rápido exame e possa compreender quais são as informações que dão sustentação às afirmações feitas a partir do conjunto de dados coletados. No final do próximo capítulo são apresentadas em detalhes as diferentes maneiras de se fazer a apresentação dos resultados - 42 - Paulo Rogério Morais II - Estatística descritiva Uma das funções da Estatística é fornecer meios para que possamos descrever, de maneira simples e precisa, conjuntos de dados numéricos que, se descritos sem o uso de técnicas estatísticas, pouca informação forneceriam tanto a quem coletou os dados quanto a quem necessita consultar tais dados. A descrição deve ser feita de tal maneira que forneça informações suficientes para que o leitor possa ter o panorama mais completo e fidedigno possível dos dados originais sem, contudo, perder a objetividade. A descrição dos dados corresponde às etapas de “Resumo”, quando escolhemos e calculamos os parâmetros de um conjunto e de “Apresentação”, quando dispomos estes parâmetros em gráficos ou tabelas. A Estatística Descritiva fornece os meios para se resumir e apresentar de maneira simples, clara e adequada conjuntos de dados que não teriam seu significado compreendido se fossem apresentados em sua forma bruta (como foram coletados). Para fazer a descrição dos dados, deve-se considerar qual o tipo de variável a ser descrita. A descrição de variáveis de natureza qualitativa é diferente da descrição de variáveis quantitativas. 1. DESCREVENDO VARIÁVEIS QUALITATIVAS A descrição de variáveis qualitativas (variáveis com mensuração nominal ou ordinal) é bastante simples, não exigindo cálculos muito elaborados. De fato, a descrição deste tipo de dados se dá pela freqüência absoluta observada para cada categoria da variável e/ou pela sua respectiva porcentagem. - 43 - Estatística para o curso de Psicologia Imagine que um pesquisador fez a contagem e classificação de 1.400 prontuários de um ambulatório de saúde mental para conhecer a incidência das diferentes psicopatologias nos pacientes atendidos ao longo de um ano. Não é nada funcional apresentar o resultado citando a classificação de prontuário por prontuário, como mostrado no quadro 2.1: Esta forma de apresentação somente será útil se o objetivo do pesquisador for ter rápido acesso ao diagnóstico constante em cada um dos prontuários. Mas, se seu objetivo é saber qual a incidência das diferentes patologias entre os pacientes atendidos pelo ambulatório, será mais útil fazer a descrição dos dados como visto na tabela 2,2, apresentando quantos pacientes tem determinado diagnóstico e qual a porcentagem correspondente: Com esta forma de apresentação dos dados, fica muito mais fácil verificar que a psicopatologia com maior incidência foi a dependência química. Esta mesma informação estaria presente no quadro 2.1, mas para ser localizada exigiria tempo e paciência por parte do interessado. Número do prontuário Classificação 0001 Esquizofrenia 0002 Depressão maior 0003 Esquizofrenia 0004 Transtorno alimentar 0005 Esquizofrenia (...) (...) 1.398 Depressão maior 1.399 Transtorno bipolar 1.400 Dependência química Quadro 2.1. Tabela 2.1 – Diagnósticos de pacientes atendidos em um ambulatório durante o ano de 2004. Diagnósticos Freqüência % Dependência química 397 28,4 Transtornos de ansiedade 280 20,0 Transtornos de humor 170 12,1 Esquizofrenia 141 10,0 Outros diagnósticos 253 18,1 Sem diagnóstico 159 11,4 Total 1.400 100 - 44 - Paulo Rogério Morais O cálculo das porcentagens é bastante simples: Desta forma, para os diagnósticos de transtornos de humor, temos: A vantagem de se apresentar a freqüência absoluta e a respectiva porcentagem é possibilitar a comparação de grupos com n diferentes. Por exemplo, no ambulatório A 45 pacientes tem diagnóstico de distimia, enquanto que no ambulatório B somente 15 pacientes tem este mesmo diagnóstico. No entanto, no ambulatório A foram atendidos 200 pacientes (22,5% deles com distimia) e no ambulatório B foram atendidos somente 50 pacientes (30% com distimia). No ambulatório A a freqüência absoluta de diagnósticos de distimia é maior, mas o número total de pacientes também é. Os valores percentuais somente podem ser utilizados quando trabalhamos com amostras com um número de observações que justifiquem este tipo de descrição. Um pesquisador menos atento poderá fazer a seguinte descrição: “Trinta e três por cento dos prontuários apresentavam diagnóstico de esquizofrenia, 33% tinham depressão e o terceiro prontuário não tinha diagnóstico.” Usualmente, a representação gráfica de variáveis qualitativas é feita com os gráficos de coluna ou de setores. Porcentagem de X = Total de X observados no conjunto Total de observações x 100 Porcentagem de “transtornos de humor” Total de diagnósticos de “transtornos de humor” Total de prontuários x 100= Porcentagem de “transtornos de humor” 170 1400 x 100= - 45 - Estatística para o curso de Psicologia 2. DESCREVENDO VARIÁVEIS QUANTITATIVAS Para a descrição de variáveis quantitativas (mensuração intervalar ou proporcional) devemos apresentar pelo menos duas informações: uma medida de tendência central e uma medida de dispersão (ou de variabilidade) . 2.1 – MEDIDAS DE TENDENCIA CENTRAL As medidas de tendência central representam o valor da variável em torno do qual os outros valores observados tendem a se distribuir, isto é, são valores
Compartilhar