Prévia do material em texto
Introdução à Estatística Prof. Me. Júlio C. Abdala O que é Estatística? Estatística é um método de planejamento de estudos e experimentos para obtenção, organização, resumo, apresentação, análise e interpretação de dados para a utilização dos mesmos na tomada de decisões. Método Experimental Consiste em manter constantes todas as causas (fatores), menos uma, e variar esta causa de modo que o pesquisador possa descobrir seus efeitos, caso existam. É o método preferido no estudo das Ciências Naturais. Método Estatístico Lançamos mão do método estatístico quando temos necessidade de descobrir fatos em um campo em que o método experimental não se aplica (nas ciências sociais), já que os vários fatores que afetam o fenômeno em estudo não podem permanecer constantes enquanto fazemos variar a causa que, naquele momento, nos interessa. Método Científico Conjunto de ferramentas organizadas de maneira eficiente para alcançar um objetivo desejado. Método A Estatística Envolve a expressão numérica de observações em elementos com uma característica em comum, resultando em dados. A Estatística Descritiva trata da coleta, organização e descrição desses dados. A Estatística Indutiva ou Inferencial lida com a análise e interpretação dos dados, permitindo conclusões que vão além dos dados originais. O termo "estatística" muitas vezes é associado à organização e descrição dos dados, mas sua essência é proporcionar métodos inferenciais para conclusões mais amplas. A análise e interpretação dos dados estatísticos são essenciais para diagnosticar empresas (como escolas), compreender problemas, encontrar soluções adequadas e planejar ações objetivas. 1. Coleta de Dados • Planejamento e identificação das características mensuráveis do fenômeno. • Coleta direta (obrigatória ou por questionários) e indireta (inferida de dados conhecidos). • Coleta direta classificada por tempo (contínua, periódica, ocasional). Fases do Método Estatístico 2. Crítica dos Dados • Análise criteriosa dos dados obtidos em busca de falhas e imperfeições. • Crítica externa (causas dos erros pelo informante) e interna (observação dos elementos originais). 3. Apuração dos Dados • Soma e processamento dos dados com critérios de classificação. • Realizada manualmente, por meio eletromecânico ou eletrônico. 4. Exposição dos dados • Apresentação dos dados de forma adequada, como tabelas ou gráficos. • Facilita a análise estatística e a obtenção de medidas típicas. Fases do Método Estatístico 5. Análise dos resultados • Objetivo final da Estatística: tirar conclusões sobre uma (população) a partir de uma (amostra) representativa. • Utilização de métodos da Estatística Indutiva ou Inferencial. • Baseados em indução e inferência para tirar conclusões e fazer previsões. A Importância da Estatística Tomada de Decisões A estatística é fundamental para a tomada de decisões em diversos setores. Previsões Através da análise de dados, a estatística pode ser utilizada para fazer previsões sobre o futuro. Compreensão do Mundo A estatística pode ser vista como uma maneira científica de entender fenômenos do mundo. Vantagens e Desvantagens do Uso da Estatística 1 Vantagens Permite resumir informações em termos simples e compreensíveis; possibilita a simplificação da complexidade; ajuda na tomada de decisões; é eficiente e objetiva. 2 Desvantagens Pode ser aplicada de forma equivocada ou tendenciosa; nem todas as realidades se encaixam em um modelo estatístico; a necessidade de critérios para o agrupamento e classificação de itens pode levar à subjetividade. O que a Estatística faz? Essencialmente, a estatística fornece informações sobre fatores que podemos medir. Na pesquisa, as coisas que medimos são denominadas variáveis. As variáveis são o foco principal da pesquisa na ciência. O que são Variáveis? Uma variável é simplesmente algo que pode variar, isto é, que pode assumir valores ou categorias diferentes. Geralmente estamos interessados em variáveis porque queremos entender o motivo da sua variação. Para compreender essa variação, devemos ter a capacidade de medir e registrar as alterações em qualquer situação dada. Por que estamos interessados em variáveis? Variáveis Na pesquisa, as coisas que medimos são denominadas variáveis. Uma variável é simplesmente algo que pode variar, isto é, que pode assumir valores ou categorias diferentes. Exemplos de Variáveis: • Sexo • Velocidade de um carro • Número de sintomas de uma doença relatados • Temperatura • Público em um festival de música • Nível de ansiedade • Número de gols em uma partida de futebol • Inteligência • Número de encontros sociais ao levar o cachorro para passear • Número de crianças por família e cores favoritas Variáveis Contínuas Variáveis contínuas podem assumir valores precisos em um intervalo. Exemplos: • Temperatura, • Nível de ansiedade, • Velocidade máxima de carro, etc. Categorias de Variáveis Variáveis Discretas Variáveis discretas assumem valores específicos, muitas vezes contáveis. Exemplos: • Número de sintomas de doença, • Número de gols, • Público em festival de música, etc. Variáveis Categóricas Variáveis categóricas são aquelas nas quais alocamos pessoas ou objetos em categorias. Exemplos: • Sexo (masculino/feminino), Ocupação (professor, advogado), • Cor favorita. Variáveis podem apresentar diferentes características de medição. Categorias de Variáveis Um problema que surge quando lidamos com variáveis discretas e contínuas é o perigo de confundir a variável com a forma como ela é mensurada. Variáveis teoricamente contínuas, como ansiedade, são frequentemente medidas de forma discreta, por exemplo, em questionários. Exemplo: Medir ansiedade com um questionário de escores inteiros (38, 39, 61, 62) - medição discreta, variável subjacente contínua. Geralmente quando uma variável discreta pode assumir um grande número de valores dentro de certo intervalo, elas podem, para fins práticos, ser tratadas como se fossem contínuas na utilização do teste estatístico. Exemplo: Imagine que estamos medindo a quantidade de pessoas em um festival. A contagem de pessoas é uma variável discreta, no entanto, se estamos observando a contagem de pessoas a cada minuto durante várias horas, a variação da contagem pode ser suficientemente grande, e os valores podem se aproximar de uma distribuição contínua. Importante! Compreender o tipo de variável é crucial para decidir como analisar os dados de forma adequada. Ao lidar com variáveis, seja consciente da diferença entre o tipo de variável (contínua ou discreta) e como ela é medida, para realizar análises estatísticas precisas. Atividade Quais das seguintes variáveis são categóricas, quais são discretas e quais são contínuas? a) Velocidade do vento b) Tipos de diplomas oferecidos por uma universidade c) Nível de extroversão d) Marcas de carros e) Times de futebol f) Número de peças de xadrez “capturadas” em um jogo g) Peso de pandas gigantes h) Número de pinturas expostas em galerias de arte Dicotomizando variáveis contínuas e discretas A dicotomização (divisão em duas categorias) de variáveis discretas e contínuas é comum na Psicologia e permite que se encontrem diferenças entre grupos que podem estar nos extremos de variáveis discretas ou contínuas. No entanto, tal prática não é recomendada, pois reduz a sensibilidade da análise estatística. Frequentemente, os pesquisadores convertem variáveis discretas e contínuas em variáveis categóricas. Exemplos: • Comparar habilidade espacial entre pessoas altas e baixas, categorizando pessoas com mais de 193 cm como "altas" e menos de 147 cm como "baixas". • Comparação da habilidade de memória entre pessoas ansiosas e não ansiosas, através de escores obtidos em uma escala. Importante! A dicotomização (divisão em duas categorias) de variáveis discretas e contínuas é comumna psicologia e permite que se encontrem diferenças entre grupos que podem estar nos extremos de variáveis discretas ou contínuas (p. ex., pessoas altas e baixas). No entanto, tal prática não é recomendada, pois reduz a sensibilidade da análise estatística. Níveis de Mensuração Outra forma de distinguir entre variáveis ou escalas é em termos de nível de mensuração. Os níveis de mensuração são categorias que ajudam a classificar a natureza das variáveis em termos de como elas são medidas. Níveis de Mensuração Nominal Consistem em categorias que não podem ser ordenadas. Dados estão na forma de contagens de frequência. Exemplos: Sexo (masculino/feminino), Grupo étnico. Ordinal Têm algum tipo de ordem para as categorias, mas os intervalos entre os pontos adjacentes na escala não são necessariamente iguais. Exemplo: Escala Likert para medir nervosismo. Intervalar Têm intervalos iguais entre escores adjacentes, mas não têm um zero absoluto. Diferenças entre valores têm significado igual. Exemplo: Escala de temperatura (Celsius, Fahrenheit). De Razão Têm intervalos iguais entre escores adjacentes da escala e um zero absoluto. Exemplo: Tempo para ler um parágrafo, Velocidade de um carro. Há quatro níveis de mensuração e eles variam em função da maneira em que as variáveis são medidas. Importância dos Níveis de Mensuração Impacto nas Análises Estatísticas Escolha de testes estatísticos depende do nível de mensuração. Testes paramétricos para níveis intervalares e de razão. Testes não paramétricos para dados nominais e ordinais. Maximizando a Precisão das Análises Utilizar testes estatísticos adequados ao nível de mensuração. Evitar distorções ou conclusões errôneas. Delineamentos de Pesquisa A forma como o estudo foi projetado ou planejado é um fator crítico para a seleção dos testes estatísticos. Os pesquisadores podem querer observar diferenças entre dois grupos de participantes em relação a uma variável específica ou verificar se duas variáveis estão relacionadas de alguma maneira. Delineamentos de pesquisa Exemplo de Diferenças entre Condições Estudo de Guéguen e Ciccotti (2008) Exploração do papel dos cães em interações sociais e comportamentos entre adultos. Quatro estudos com abordagens distintas para examinar a influência dos cães. Observação do comportamento de ajuda em situações específicas com e sem cães. Exemplo de Relações entre Variáveis Estudo de Antonacopoulos e Pychyl (2014) Investigação sobre a conexão entre caminhar com cães e saúde mental. Utilização de questionários online para coletar dados. Identificação da relação entre conversas com outras pessoas e sentimentos de solidão. Variáveis Estranhas Variáveis estranhas são aquelas que podem ter um impacto em outras variáveis que estamos interessados, mas que falhamos em considerar quando delineamos nosso estudo. Variável de Confusão Uma variável de confusão é um tipo específico de variável estranha que está relacionado a ambas as variáveis principais em que estamos interessados. Variáveis Estranhas e de Confusão Variáveis Estranhas Variáveis estranhas são aquelas que podem ter um impacto em outras variáveis que estamos interessados, mas que falhamos em considerar quando delineamos nosso estudo. É preciso saber que, para cada variável que for medida, existirão várias outras que podem estar relacionadas a ela. Variáveis de Confusão Uma variável de confusão é um tipo específico de variável estranha que está relacionado a ambas as variáveis principais em que estamos interessados. Exemplo: Se estamos interessados nas diferenças entre os sexos na habilidade de sucessivamente jogar e acertar uma bola em uma cesta de basquete. Vamos presumir que executamos um estudo e descobrimos que os homens pontuaram mais do que as mulheres. Podemos concluir que os homens são melhores do que as mulheres no jogo de basquete. O problema é que poderia haver uma relação potencial entre o sexo dos participantes, a habilidade de pontuar e a altura. Pode acontecer que pessoas altas sejam melhores em pontuar no basquete, e também há o fato de que os homens são, em geral, mais altos do que as mulheres. Poderia, também, ser simplesmente a altura dos participantes, em vez de seu sexo, o que determinou sua habilidade de marcar pontos no nosso estudo. A altura, nesse caso, seria a variável de confusão. Delineamentos Correlacionais O objetivo principal dos delineamentos correlacionais é compreender relações entre variáveis Delineamentos Correlacionais Utilização de Delineamentos Correlacionais: Exploração das relações entre variáveis. Medição da variável de interesse. Observação das mudanças em outras variáveis conforme a variável de interesse muda. Uma das regras de ouro do delineamento correlacional é que não se pode inferir causalidade a partir de correlações. Quando usamos delineamentos correlacionais, no entanto, é difícil estabelecer se a alteração em uma variável causa uma mudança em outra variável. A razão disso é que em tais delineamentos estamos simplesmente observando e registrando mudanças em variáveis e tentando estabelecer se elas covariam de alguma forma significativa Causalidade Um dos principais objetivos da ciência é descobrir a causa dos acontecimentos. Em todos os ramos de pesquisa, os pesquisadores estão tentando determinar relações de causalidade entre variáveis. Causalidade Para identificar relações de causalidade, precisamos manipular uma das variáveis (mudá-la sistematicamente) e então observar o que acontece com as outras variáveis. Para estabelecermos relações de causalidade entre variáveis mais facilmente, precisamos manipular uma das variáveis sistematicamente e ver qual o efeito obtido nas outras variáveis. Tal processo é, essencialmente, o realizado em delineamentos experimentais*. Delineamento Experimental Delineamentos experimentais são aqueles em que o pesquisador manipula uma variável chamada de variável independente (VI) para ver que efeito ela tem sobre outra variável, chamada de variável dependente (VD). Em projetos experimentais estamos, geralmente, procurando por diferenças entre as condições da VI. Uma marca dos projetos experimentais é a alocação aleatória dos participantes às condições da VI. Delineamento Experimental Em um experimento, temos uma variável que estamos mensurando e queremos descobrir como ela é afetada por outra variável, chamada de variável independente. variável independente (VI) A variável manipulada pelo observador seu valor não depende (é independente) das outras variáveis investigadas variável dependente (VD) denominada assim porque se assume que ela depende dos valores da VI Uma hipótese de pesquisa é nossa previsão de como variáveis específicas podem estar relacionadas umas com as outras ou como grupos de participantes podem ser diferentes uns dos outros. Dessa forma, estabelecemos uma hipótese que será testada por meio de análise estatística. Uma das principais características definidoras de um projeto experimental é a alocação aleatória dos participantes às condições. Delineamento Quase-experimental Delineamentos quase-experimentais envolvem verificar se existem diferenças na variável dependente (VD) entre as condições da variável independente (VI). Diferentemente dos delineamentos experimentais, não há alocação aleatória dos participantes às várias condições da VI. Delineamento quase-experimental Em algumas situações na psicologia, não é possível manipular diretamente variáveis de interesse. Exemplo: Comparar homens e mulheres em certas condições. Delineamentos quase-experimentais são usados quando não é possível alocar aleatoriamente participantes às condições. Projetos quase-experimentais estão mais propensos a riscos de variáveis estranhas e de confusão. Devido aos riscos associados aos estudos quase-experimentais, projetos experimentais são preferidos sempre que possível. Experimentos permitem maiorcontrole, aleatorização e estabelecimento de relações causais mais fortes. Caso esteja inseguro se está lidando com um projeto experimental ou quase-experimental, procure por uma alocação aleatória dos participantes às condições. Se ela não for uma característica do estudo, então é mais provável que você esteja lidando com um estudo quase-experimental. Delineamentos entre e intraparticipantes Outra característica importante dos delineamentos de pesquisa é se os participantes fazem parte de mais de uma condição. Delineamentos intraparticipantes Delineamentos intraparticipantes têm os mesmos participantes em cada condição da variável independente (VI). Cada participante atua sob todas as condições no estudo. Esses delineamentos visam controlar variáveis de confusão e aumentar o poder estatístico. Maior probabilidade de detectar efeitos na população. Vantagens • Controle de variáveis de confusão entre indivíduos. • Menos variações externas entre condições devido ao uso das mesmas pessoas. • Necessidade de menos participantes, economizando recursos. Desafios • Possíveis problemas com efeitos de ordem: ordem de realização das condições pode influenciar os resultados. • Não aplicáveis em todos os casos de projetos quase-experimentais. Delineamentos intraparticipantes Consequência dos delineamentos intraparticipantes em que completar as condições em uma ordem em particular leva a diferenças na variável dependente que não são resultado da manipulação da variável independente (VI). As diferenças entre as condições da VI podem se dever a prática, fadiga ou tédio em vez da manipulação da VI pelo pesquisador. Contrabalanceamento Variação sistemática em que os participantes fazem parte das várias condições da variável independente (VI). O contrabalanceamento seria introduzido em um estudo com delineamento intraparticipantes. Efeitos de Ordem Delineamentos entre participantes Delineamentos entre participantes têm grupos diferentes de participantes em cada condição da variável independente (VI). Portanto, o grupo de participantes em uma condição da VI é diferente dos participantes em outra condição da VI. Vantagens • Ausência relativa de efeitos práticos e de fadiga • Participantes estão menos sujeitos a descobrir os objetivos do estudo Desafios • É necessário um número maior de participantes • Não há muito controle das variáveis de confusão entre condições Delineamento entre participantes Um problema do delineamento entre participantes é que pessoas diferentes trazem características diferentes às condições do experimento. Quando estamos alocando aleatoriamente participantes às condições, podemos, por acaso, alocar todos os participantes com uma determinada característica a um grupo, e isso talvez confunda ou mascare os resultados. Algumas técnicas estatísticas nos permitem decidir se podemos ou não descartar esses confundidores como explicações dos resultados do estudo. Slide 1 Slide 2 Slide 3 Slide 4 Slide 5 Slide 6 Slide 7 Slide 8 Slide 9 Slide 10 Slide 11 Slide 12 Slide 13 Slide 14 Slide 15 Slide 16 Slide 17 Slide 18 Slide 19 Slide 20 Slide 21 Slide 22 Slide 23 Slide 24 Slide 25 Slide 26 Slide 27 Slide 28 Slide 29 Slide 30 Slide 31 Slide 32 Slide 33 Slide 34 Slide 35 Slide 36 Slide 37 Slide 38