Manual Métodos Quantitativos

•

UNICSUL

V Claudio

15.12.2017

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 3, do total de 87 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 6, do total de 87 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 9, do total de 87 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Metodos Quantitativos Aplicados

1.273 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

INA – Instituto Nacional de Administração

COOPERAÇÃO CE COOPERAÇÃO CE COOPERAÇÃO CE COOPERAÇÃO CE ---- PALOP PALOP PALOP PALOP
Programa PIR PALOP II

Projecto
CONSOLIDAÇÃO DAS CAPACIDADES DA ADMINISTRAÇÃO
PÚBLICA

N.º IDENTIFICAÇÃO : REG/7901/013
N.° CONTABILÍSTICO : 8 ACP MTR 5 * 8 ACP TPS 126
ACORDO DE FINANCIAMENTO : 6520/REG

Manual de Técnicas e Métodos
Quantitativos
Tomo - I
CO-FINANCIAMENTO

COMISSÃO EUROPEIA
Fundo Europeu de Desenvolvimento
4,8 Milhões de Euros

GOVERNO PORTUGUÊS
Instituto Português de Apoio ao
Desenvolvimento
1,2 Milhões de Euros
COOPERAÇÃO CE – PALOP
Programa PIR PALOP II / Projecto Consolidação das Capacidades da Administração Pública

INA – Instituto Nacional de Administração 2

Manual de Técnicas e Métodos Quantitativos (Tomo 1)

Ficha Técnica

Autor:
Rui Brites

Resumo biográfico:

Rui Brites
Mestre em Sociologia, Área de Comunicação, doutorando em Sociologia (ISCTE).
Professor Auxiliar Convidado do Departamento de Métodos Quantitativos do ISCTE.
Investigador do CIES/ISCTE-Centro de Investigação e Estudos de Sociologia e membro do GIESTA/ISCTE-Grupo
de Investigação Estatística e Análise de Dados.
Foi coordenador do Centro de Informação sobre a Droga e a Toxicodependência do IPDT-Instituto Português da
Droga e Toxicodependência (Agosto 2000-Julho 2002).
Participa e tem participado em diversos projectos de investigação e investigação-acção, como coordenador das áreas
metodológicas e de análise de dados.

Título do manual:
Manual_Métodos Quantitativos_Tomo_1.doc

Mês e Ano de elaboração:
Junho de 2007

Coordenação do projecto:
Cabo Verde – Unidade de Gestão do Projecto
Coordenadora – Josefa Lopes

Assistência Técnica e Pedagógica
Portugal – Instituto Nacional de Administração – INA
Gestor de Projecto – Manuel Clarote Lapão

ISBN:
(número internacional integrante do sistema ISBN (International Standard Book Number), a solicitar pela entidade
responsável pela edição do documento, se possível).

Lisboa, Junho de 2007
COOPERAÇÃO CE – PALOP
Programa PIR PALOP II / Projecto Consolidação das Capacidades da Administração Pública

INA – Instituto Nacional de Administração 3

Índice
Pág.
Estruturação dos capítulos 5
Introdução 6
Capítulo 1 – Amostragem 7
Objectivos 7
Palavras-chave 7
Conteúdo temático
1.1. Noções de amostragem

8
1.2. Métodos de amostragem 10
1.3. Selecção das unidades amostrais 11
1.4. Margens de erro e intervalos de confiança 12
Avaliação 15
Bibliografia 15
Capítulo 2 – Introdução ao SPSS 16
Objectivos 16
Palavras-chave 16
Conteúdo temático
2.1. Editor de dados do SPSS

17
2.2. Output do SPSS 18
2.3. Menus SPSS 19
2.4. Criação de bases de dados 22
2.5. Tratamento Preliminar de dados 22
2.5.1. Transformação algébrica de variáveis 23
2.5.2. Transformação lógica de variáveis 28
2.5.3. Inversão da escala de uma variável 29
2.5.4. Variáveis de contagem de ocorrências 30
2.6. Selecção de casos 31
Avaliação 35
Referências 36
COOPERAÇÃO CE – PALOP
Programa PIR PALOP II / Projecto Consolidação das Capacidades da Administração Pública

INA – Instituto Nacional de Administração 4
Pág.
Capítulo 3 – Estatística aplicada com SPSS 37
Objectivos 37
Palavras-chave 37
Conteúdo temático
3.1. Análise de dados univariada

38
3.1.1. Frequências 38
3.1.2. Estatísticas descritivas e gráficos de perfil 41
3.1.3. Testes de aderência (para 1 amostra) 44
3.1.3.1. χ2 (Qui-quadrado) 44
3.1.3.2. Kolmogorov-Smirnov 45
3.1.3.3 Teste t de Student 46
3.2. Análise de dados bivariada 47
3.2.1. Cruzamentos e teste de independência χ2 (Qui-quadrado) 47
3.2.2. Testes não paramétricos – procedimento Non Parametric Tests 50
3.2.2.1. Duas amostras independentes (Mann-Whitney e Kolmogorov-Smirnov) 50
3.2.2.2. K amostras independentes (Kruskal-Wallis) 52
3.2.3. Testes não paramétricos – procedimento Compare Means 54
3.2.3.1. Duas amostras emparelhadas (t de Student amostras emparelhadas) 54
3.2.3.2. Duas amostras independentes (t de Student de independência) 55
3.2.3.3. k amostras independentes (Análise de Variância Simples Paramétrica -
ANOVA) 56
3.2.4. Correlação linear simples 59
3.3. Modelos de previsão 61
3.3.1. Análise de Regressão Simples 61
3.3.2. Análise de Regressão Múltipla 63
3.4. Análise de dados multivariada 66
3.4.1. Análise das Componentes Principais 66
3.4.2. Análise de Clusters 71
3.4.2.1. Análise hierárquica de Clusters 72
3.4.2.2. Análise não hierárquica de Clusters – método de optimização (K-Means) 76
3.4.3. Articulação entre a Análise das Componentes Principais r a Análise de
Clusters 76
Avaliação 79
Bibliografia 79
Anexo 1: Testes de inferência estatística mais utilizados em Análise bivariada 80
Anexo 2: European Social Survey (round 1 - 2002) - Questionário adaptado 83
COOPERAÇÃO CE – PALOP
Programa PIR PALOP II / Projecto Consolidação das Capacidades da Administração Pública

INA – Instituto Nacional de Administração 5
Estruturação dos capítulos
Em cada capítulo ou conteúdo temático, o participante visualizará uma estrutura que apresentará
as seguintes subdivisões, a saber:
����
Objectivos
Objectivo(s) específico(s), no qual cada participante conhecerá a proposta
de aprendizagem a ser alcançada no final dessa mesma (sub)temática e que
servirá de referência para a auto-avaliação;

����
Palavras
Palavras-chave, que pela sua relevância para a temática e como realce da
atenção do participante para determinada designação ou conceito, que terá a
sua definição e explicitação, no final do capítulo, no espaço reservado em
Glossário.

����
Conteúdo
Conteúdo programático, onde se procurará desenvolver, de modo claro,
objectivo e com rigor técnico, a (sub)temática em apreço, referenciando-se
os elementos de substância, julgados mais significativos e de interesse para
a aprendizagem do(a) participante(a).

����
Avaliação
Avaliação. Neste espaço será indicada a forma de avaliação do capítulo e
incluída a respectiva ficha de exercício.

����
Referências
Referências. Nesta subdivisão poder-se-á encontrar uma lista de elementos
bibliográficos referentes: às citações efectuadas ao longo do texto; às obras
consultadas pelo(s) autor(es), i. é, livros, artigos, monografias, trabalhos
académicos, endereços electrónicos, etc., que poderão ajudar no trabalho
de pesquisa ou de aprofundamento de saberes de cada participante(a).

COOPERAÇÃO CE – PALOP
Programa PIR PALOP II / Projecto Consolidação das Capacidades da Administração Pública

INA – Instituto Nacional de Administração 6
Introdução

O Manual de Técnicas e Métodos Quantitativos (Tomo 1) tem como objectivo principal orientar
os formandos na utilização do SPSS, constituindo-se simultaneamente como um guião da
matéria leccionada e de uma ficha técnica para realização dos exercícios propostos no âmbito do
Programa PIR PALOP II e do Projecto “Consolidação das Capacidades da Administração
Pública”.

Pretende-se, deste modo, disponibilizar aos formandos um guião que lhes permita acompanhar a
sequência dos pontos do programa e as respectivas aulas. Nesse sentido, este manual não
dispensa a necessidade de se tirar apontamentos nas aulas, nem a leitura e consulta de outra
bibliografia, que permitirá o aprofundamento dos temas, na medida em que aqui se situam
apenas os principais tópicos eas balizas das matérias abordadas.

A sua utilidade para os formandos, para além da já referida, assenta ainda no facto de poder
servir de apoio à elaboração de novo guião para futuras acções de formação que venham a
coordenar, já como formadores.

Procurou-se por isso apresentar o conteúdo dos vários pontos de uma forma clara, simples e
sintética, de maneira a que o essencial seja captado neste manual, podendo ser aprofundado a
partir das referências indicadas.

De acordo com o programa, este manual divide-se em três capítulos, que estão obviamente
relacionados intimamente:

- O primeiro pretende fornecer aos formandos elementos que lhes permitam construir uma
amostra representativa e proceder à selecção aleatória das unidades amostrais.

- O segundo tem como objectivo familiarizar os formandos com o SPSS, permitindo-lhes
criar, importar e manipular bases de dados, bem como proceder ao tratamento preliminar
dos dados, recodificar variáveis e construir novas variáveis a partir das variáveis
originais.

- O terceiro tem como objectivo dotar os formandos de competências técnicas e estatísticas
que lhes permitam proceder à análise de dados univariada, bivariada e multrivariada,
com SPSS.
INA – Instituto Nacional de Administração

Capítulo 1 –––– Amostragem

No final deste capítulo os formandos deverão ser capazes de:
1. seleccionar os tipos de amostra mais adequados a cada contexto;
2. calcular a dimensão da amostra e a margem de erro;
3. seleccionar as unidades amostrais.

- Amostra
- Erro amostral
- Unidades amostrais

Capítulo
1
����
Objectivos
����
Palavras
COOPERAÇÃO CE – PALOP
Programa PIR PALOP II / Projecto Consolidação das Capacidades da Administração Pública

INA – Instituto Nacional de Administração 8

1.1. Noções de amostragem1.1. Noções de amostragem1.1. Noções de amostragem1.1. Noções de amostragem

Em Estatística1, amostra é o conjunto de elementos extraídos de um conjunto
maior, chamado População. É um conjunto constituído de indivíduos (famílias
ou outras organizações), acontecimentos ou outros objectos de estudo que o
investigador pretende descrever ou para os quais pretende generalizar as suas conclusões ou
resultados.

Principais razões para se trabalhar com uma amostra:

- A população é infinita, ou considerada como tal, não podendo portanto ser analisada
na íntegra;
- Custo excessivo do processo de recolha e tratamento dos dados, como resultado da
grande dimensão da população ou da complexidade do processo de caracterização de
todos os elementos da população;
- Tempo excessivo do processo de recolha e tratamento dos dados, conduzindo à
obtenção de informação desactualizada;
- As populações são dinâmicas, de onde resulta que os elementos ou objectos da
população estão em constante renovação, de onde resulta a impossibilidade de
analisar todos os elementos desta população;

Se a constituição da amostra obedecer a determinadas condições, a análise das características da
amostra pode servir para se fazerem inferências sobre a população.

Nota: A dimensão da amostra é significativamente inferior à dimensão da população, de forma a
justificar a constituição da amostra. A amostragem é, por sua vez, um conjunto de
procedimentos através dos quais se selecciona uma amostra de uma população. Pode-se
dividir as técnicas de amostragem em vário tipos:

- Amostragem probabilística - procedimento em que todos os elementos da população
têm uma probabilidade conhecida e superior a zero de integrar a amostra;
- Amostragem não probabilística:
- Amostragem intencional - amostragem não probabilística subordinada a objectivos
específicos do investigador;
- Amostragem não intencional - amostragem não probabilística regida por critérios de
conveniência e/ou de disponibilidade dos inquiridos.

1
Amostra (estatística) . In Infopédia [Em linha]. Porto: Porto Editora, 2003-2008. [Consult. 2008-01-15]. Disponível na www:
<URL: http://www.infopedia.pt/$amostra-(estatistica)>.
����
Conteúdo
COOPERAÇÃO CE – PALOP
Programa PIR PALOP II / Projecto Consolidação das Capacidades da Administração Pública

INA – Instituto Nacional de Administração 9
Questões prQuestões préévias ao processo de amostragemvias ao processo de amostragem
de natureza quantitativade natureza quantitativa
1. Definição clara dos
objectivos do estudo
O que se pretende saber/conhecer
melhor/compreender
2. Quem deverá ser
entrevistado
População alvo* e população a
inquirir
3. Quantos deverão ser
entrevistados Dimensão da amostra
4. Como serão
seleccionados
Método de selecção da amostra
(escolha das unidades amostrais)
*Designa-se por população alvo a totalidade dos elementos sobre os quais se deseja obter determinado tipo
de informação
7

Amostra, n
(unidades de observação)
Universo ou População, N
(finito)
Unidades que poderiam ser
observadas
Conjunto de unidades existentes às
quais se aplica a teoria
Universo Hipotético
(praticamente infinito)
* in: Bravo, Sierra: Técnicas de Investigación Social, Madrid, Editorial Paraninfo, 1989
RepresentaRepresentaçção de uma Amostra*ão de uma Amostra*
8

COOPERAÇÃO CE – PALOP
Programa PIR PALOP II / Projecto Consolidação das Capacidades da Administração Pública

INA – Instituto Nacional de Administração 10
Desenvolvimento de um plano Desenvolvimento de um plano amostral*amostral*
* in: Reis, Melo, Andrade e Calapez: Estatística aplicada, vol. 2, Lisboa, Sílabo, 1999
População alvo
População a inquirir
Processo amostral
Dimensão da amostra
Método de recolha
de dados
Amostra final
9

1.2. Métodos amostrais1.2. Métodos amostrais1.2. Métodos amostrais1.2. Métodos amostrais

MMéétodos de selectodos de selecçção da amostra*ão da amostra*
* in: Reis, Melo, Andrade e Calapez: Estatística aplicada, vol. 2, Lisboa, Sílabo, 1999
Métodos probabilísticos
(amostragem casual)
•Amostragem aleatória simples
•Amostragem sistemática
•Amostragem estratificada
•Amostragem por clusters
•Amostragem multi-etapas
•Amostragem multifásica
Métodos não
probabilísticos
(amostragem dirigida)
•Amostragem por conveniência
•Amostragem intencional
•Amostragem snowball
•Amostragem sequencial
•Amostragem por quotas
10

COOPERAÇÃO CE – PALOP
Programa PIR PALOP II / Projecto Consolidação das Capacidades da Administração Pública

INA – Instituto Nacional de Administração 11

1.3. Selecção das unidades amostrais1.3. Selecção das unidades amostrais1.3. Selecção das unidades amostrais1.3. Selecção das unidades amostrais

MMéétodos de selectodos de selecçção da amostra ão da amostra ((contcont))**
* in: Reis, Melo, Andrade e Calapez: Estatística aplicada, vol. 2, Lisboa, Sílabo, 1999
Métodos probabilísticos - amostragem aleatória
Cada elemento da população tem a mesma probabilidade de ser
seleccionadoAleatória simples
Cálculo do rácio K=N/n; selecção aleatória do primeiro elemento
da população e sequencial dos restantes
Casual
sistemática
Separação dos elementos da população em estratos e selecção
aleatória dos elementos dentro de cada estratoEstratificada
A população encontra-se dividida em clusters que são
seleccionados aleatoriamente, constituindo as unidades amostraisClusters
Idêntico ao anterior mas em que as unidades amostrais são
seleccionadas aleatoriamente dentro de cada cluster Multi-etapas
Numa 1ª fase recolhem-se dados sobre determinadas
característicasdos respondentes (comportamentos e frequência de
consumos, variáveis demográficas, etc.) e da sua disponibilidade
para responder novamente a um inquérito. É então retirada desta
fase uma sub-amostra que será inquirida na 2ª fase.
Multi-fásica
11

12
Área
6500610184013902 660Total
24501706006101070Produto D
27001907005501260Produto C
5005023070150Produto B
850200310160180Produto A
Total
Outros
(Restantes
distritos)
Sul
(Lisboa,
Setúbal e
Santarém)
Centro
(Coimbra,
Aveiro e
Leiria)
Norte
(Braga e
Porto)Sector
Amostra estratificada*Amostra estratificada*
* Adaptado de: Reis, Melo, Andrade e Calapez: Estatística aplicada, vol. 2, Lisboa, Sílabo, 1999
U
n
iv
er
so
Área
65061184139266Total
245176061107Produto D
270197055126Produto C
50523715Produto B
8520311618Produto A
Total
Outros
(Restantes
distritos)
Sul
(Lisboa,
Setúbal e
Santarém)
Centro
(Coimbra,
Aveiro e
Leiria)
Norte
(Braga e
Porto)Sector
A
m
o
st
ra

( 10
%

d a

po
pu
la
çã
o
)

COOPERAÇÃO CE – PALOP
Programa PIR PALOP II / Projecto Consolidação das Capacidades da Administração Pública

INA – Instituto Nacional de Administração 12
MMéétodos de selectodos de selecçção da amostra ão da amostra ((contcont))**
* in: Reis, Melo, Andrade e Calapez: Estatística aplicada, vol. 2, Lisboa, Sílabo, 1999
A amostra é seleccionada em função da disponibilidade e
acessibilidade dos elementos que constituem a população alvo
Amostragem por
conveniência
A escolha dos elementos a incluir na amostra baseia-se na opinião
de uma ou mais pessoas que conhecem muito bem as
características específicas da população em estudo, que se
pretende analisar
Amostragem
intencional
Numa 1ª fase os inquiridos são escolhidos aleatoriamente, sendo,
numa segunda fase, os inquiridos adicionais escolhidos com base
na informação dos primeiros
Amostragem
snowball
Semelhante ao método multi-fásico. A realização da fase seguinte
só é decidida depois de analisados os resultados da fase anterior.
Amostragem
sequencial
Equivalente à amostragem aleatória estratificada. As proporções
dos vários sub-grupos reflectem a sua distribuição dentro da
população. Cada entrevistador dispõe das características que os
entrevistados deverão satisfazer, terminando as entrevistas
quando as quotas estiverem preenchidas.
Amostragem por
quotas
Métodos não probabilísticos - amostragem dirigida
13

1.4. Erro amostral1.4. Erro amostral1.4. Erro amostral1.4. Erro amostral

DeterminaDeterminaçção da margem de erro em funão da margem de erro em funçção do não do nºº de elementos*de elementos*
in: Bravo, Sierra: Técnicas de Investigación Social, Madrid, Editorial Paraninfo, 1989 14

COOPERAÇÃO CE – PALOP
Programa PIR PALOP II / Projecto Consolidação das Capacidades da Administração Pública

INA – Instituto Nacional de Administração 13

DeterminaDeterminaçção não nºº de elementos em funde elementos em funçção da margem de erro *ão da margem de erro *
in: Bravo, Sierra: Técnicas de Investigación Social, Madrid, Editorial Paraninfo, 1989 15

COOPERAÇÃO CE – PALOP
Programa PIR PALOP II / Projecto Consolidação das Capacidades da Administração Pública

INA – Instituto Nacional de Administração 14
DeterminaDeterminaçção não nºº de elementos em funde elementos em funçção da margem de erro e da ão da margem de erro e da
dimensão da populadimensão da populaçção *ão *
in: Bravo, Sierra: Técnicas de Investigación Social, Madrid, Editorial Paraninfo, 1989 16

COOPERAÇÃO CE – PALOP
Programa PIR PALOP II / Projecto Consolidação das Capacidades da Administração Pública

INA – Instituto Nacional de Administração 15

A avaliação deste capítulo consiste num exercício escrito, de resposta às
seguintes questões

Exercício de avaliação:

1) “Depois de se identificar os dados que deverão ser recolhidos e o instrumento (questionário
estruturado, por exemplo) a utilizar para essa recolha, o passo seguinte consiste em definir um
processo de amostragem adequado ao tipo de dados e ao instrumento de análise”2

Diga, sucintamente em que consistem os seguintes métodos de mostragem:
- Amostra aleatória simples;
- Amostra Estratificada;
- Amostra por quotas.

2) “O problema da Inferência Indutiva é, do ponto de vista da Estatística, encarado da seguinte
forma: a finalidade da investigação é descobrir algo sobre determinada população ou universo”.3

Comente a frase e diga quais os procedimentos para seleccionar as unidades amostrais (sujeitos)
numa amostra estratificada.

- Bravo, R. S. (1988), Técnicas de investigación social, 5ª ed.
corrigida y ampliada, Madrid, Paraninfo (Secção 1).
- Reis, E., P. Melo; R. Andrade e T. Calapez (1999) Estatística
Aplicada – volume 2, Lisboa, Sílabo, 3ª edição revista.
- Vicente, P.; E. Reis; F. Ferrão (2002), Sondagens-A amostragem
como factor decisivo de qualidade, Lisboa, Edições Sílabo.

2
Reis, E., P. Melo; R. Andrade e T. Calapez (1999) Estatística Aplicada – volume 2, Lisboa, Sílabo, 3ª edição revista.
3
Idem.
����
Avaliação
����
Referências
COOPERAÇÃO CE – PALOP
Programa PIR PALOP II / Projecto Consolidação das Capacidades da Administração Pública

INA – Instituto Nacional de Administração 16

Capítulo 2 – Introdução ao SPSS

O objectivo geral deste capítulo é o de familiarizar os formandos com o SPSS,
nomeadamente no que se refere:

- Janelas e menus;
- Criação e manipulação de bases de dados;
- Tratamento preliminar dos dados.

- Variável
- Nível de medida

Capítulo
2
����
Objectivos
����
Palavras
COOPERAÇÃO CE – PALOP
Programa PIR PALOP II / Projecto Consolidação das Capacidades da Administração Pública

INA – Instituto Nacional de Administração 17

2.1. Editor de dados do SPSS

O pakage estatístico SPSS para Windows é um poderoso sistema de análises
estatísticas e manuseamento de dados, em que a utilização mais frequente, para a
maioria das análises a efectuar, se resume à selecção das respectivas opções em
menus e caixas de diálogo

O editor de dados do SPSS (Data Editor) é composto por duas janelas sobrepostas: Data View e
Variable View. A função da primeira – Data View – é a de introduzir os dados e da segunda -
Variable View – é criar a estrutura da base de dados.

Muda-se de uma para outra clicando no respectivo separador.

O Data Editor do SPSS é um programa do tipo de folha de cálculo que permite facilmente criar ou
editar ficheiros de dados. Abre automaticamente quando se entra no SPSS.
O seu aspecto é o seguinte:

Janela Data View:

����
Conteúdo
COOPERAÇÃO CE – PALOP
Programa PIR PALOP II / Projecto Consolidação das Capacidades da Administração Pública

INA – Instituto Nacional de Administração 18
Janela Variable View:

2.2. Output do SPSS (Output Viewer)

É nesta janela que são apresentados todos os resultados estatísticos. Abre automaticamente sempre
que um determinado procedimento gera resultados. É possível editar as tabelas e gráficos
produzidos, clicando duas vezes com a tecla esquerda do rato e modificar a sua aparência.

Janela Output Viewer:

COOPERAÇÃO CE – PALOP
Programa PIR PALOP II / Projecto Consolidação das Capacidades da Administração Pública

INA – InstitutoNacional de Administração 19

2.3. Menus do SPSS

Os menus das janelas principais – Data Editor e Outpur Viewer - são idênticos e têm o seguinte
aspecto visual:

Principais funcionalidades dos menus
File

Criar, abrir, ler, exportar, gravar e imprimir
ficheiros.
Edit

Configuração/parametrização do SPSS
(Options), inserir novas variáveis e novos casos.
COOPERAÇÃO CE – PALOP
Programa PIR PALOP II / Projecto Consolidação das Capacidades da Administração Pública

INA – Instituto Nacional de Administração 20
View

Activar/desactivar barras de comandos, fontes,
grelha, barra de status e mostrar etiquetas
(labels) definidas.
Data

Alteração global dos dados;
Ordenar a base;
Juntar ficheiros (Merge Files);
Dividir a análise por grupos (Split File);
Criar subconjuntos de casos para análise (Select
Cases);
Activar ponderadores (Weight Cases).
Transform

Criar novas variáveis com base nas variáveis
originais;
Recodificar variáveis.
COOPERAÇÃO CE – PALOP
Programa PIR PALOP II / Projecto Consolidação das Capacidades da Administração Pública

INA – Instituto Nacional de Administração 21
Analyse

Procedimentos de análise estatística.
Graphs

Criar gráficos.
Utilities

Informação sobre as variáveis.
Window

Comuta entre janelas;
Minimizar janelas
Help

Ajuda em linha;
Tutorial.

COOPERAÇÃO CE – PALOP
Programa PIR PALOP II / Projecto Consolidação das Capacidades da Administração Pública

INA – Instituto Nacional de Administração 22
2.4. Criação de bases de dados

As bases de dados são criadas na janela Variable View, devendo a estrutura das variáveis obedecer
às seguintes regras:

Name
- Máximo 64 caracteres (versões anteriores à 13, apenas 8);
- Deve começar por uma letra; os restantes caracteres podem ser letras
(maiúsculas ou minúsculas são iguais), algarismos, ou os símbolos @, #, _, $.
- Não se podem usar espaços em branco, nem os seguintes caracteres: !, ?, ‘, “, *,
+, -, %, vírgula, ponto e vírgula, \, /, >, <
- Evitar terminar o nome com o caracter _ (underscore);
- Evitar usar caracteres acentuados ou com til.
Type Por defeito é numérico, pode alterar-se para outro tipo, por exemplo carácter (string), data, etc
Width Nº de caracteres do campo. Por defeito, 8. Pode ser aumentado – no caso das
variáveis string, até 255.
Decimals Define o número da casas decimais.
Label Etiquetas dos nomes (name) das variáveis. Admite o máximo de 128 caraecteres.
Values Etiquetas dos valores (códigos) das variáveis nominais ou ordinais.
Missing Define os códigos das respostas não válidas (não sabe, não responde, não tem que
responder) que serão excluídas da análise.
Columns Largura da coluna de introdução de dados. Por defeito, 8.
Align Permite alinhar os dados à esquerda, centro ou direita.
Measures Define o nível de medida das variáveis: nominal, ordinal ou scale.

A introdução dos dados processa-se na janela Variable View após ter sido criada a estrutura da
base.

2.5. Tratamento Preliminar de dados

Nota: A base de dados que vamos utilizar é um extracto da base de dados do European Social
Survey (round 1)4 com os resultados da aplicação do questionário em Portugal (ficheiro
ESS-Portugal 2002 (base1).sav).

4
A base de dados original está disponível em http://www.europeansocialsurvey.org/.
COOPERAÇÃO CE – PALOP
Programa PIR PALOP II / Projecto Consolidação das Capacidades da Administração Pública

INA – Instituto Nacional de Administração 23
2.5.1. Transformação algébrica de variáveis

Exemplo 1: Recodificação de variáveis

Pretende-se criar duas novas variáveis: a variável idade a partir da variável f3 (data de
nascimento) e recodificá-la, criando uma nova variável - idade2 - com 4 escalões: até 30 anos; 31
– 50 anos; 50 – 65 anos e > 65 anos.

a) Criação da variável idade:

COOPERAÇÃO CE – PALOP
Programa PIR PALOP II / Projecto Consolidação das Capacidades da Administração Pública

INA – Instituto Nacional de Administração 24
A variável idade acrescentou-se à base de dados. Vamos agora proceder à sua recodificação,
criando uma nova variável – idade2 – com 4 escalões5:

A variável idade2 acrescentar-se-á à base e deverá ser completada com a alteração do nível de
medida (scale para ordinal) e a definição dos respectivos value labels.

O resultado será o seguinte:

Idade
341 22.6 22.6 22.6
505 33.4 33.4 56.0
315 20.8 20.8 76.8
350 23.2 23.2 100.0
1511 100.0 100.0
Até 30 anos
31 - 50 anos
51 - 65 anos
> 65 anos
Total
Valid
Frequency Percent Valid Percent
Cumulative
Percent

5
Nota: na recodificação de variáveis é recomendável manter as variáveis originais e criar novas variáveis recodificadas,
escolhendo para o efeito a opção Into diferent variable.
COOPERAÇÃO CE – PALOP
Programa PIR PALOP II / Projecto Consolidação das Capacidades da Administração Pública

INA – Instituto Nacional de Administração 25
b) Recodificação da variável “escolaridade”:

Pretende-se recodificar a variável “escolaridade” (f7) criando uma nova variável (escol) com 3
escalões: até 9 anos; 10 – 12 anos e > 12 anos.

A variável escol acrescentar-se-á à base e deverá ser completada com a alteração do nível de
medida (scale para ordinal) e a definição dos respectivos value labels.

O resultado será o seguinte:

Escolaridade
1046 69.2 69.2 69.2
251 16.6 16.6 85.8
212 14.0 14.0 99.9
2 .1 .1 100.0
1511 100.0 100.0
Até 9 anos
10 - 12 anos
> 12 anos
NR
Total
Valid
Frequency Percent Valid Percent
Cumulative
Percent

COOPERAÇÃO CE – PALOP
Programa PIR PALOP II / Projecto Consolidação das Capacidades da Administração Pública

INA – Instituto Nacional de Administração 26
c) Recodificação da variável “autoposicionamento político”:

Pretende-se recodificar a variável “autoposicionamento político” (b28) criando uma nova variável
(b28r) com 3 escalões: esquerda; centro e direita.

A variável b28r acrescentar-se-á à base e deverá ser completada com a alteração do nível de
medida (scale para ordinal) e a definição dos respectivos value labels.

O resultado será o seguinte:

Autoposicionamento político
296 19.6 24.5 24.5
620 41.0 51.2 75.7
294 19.4 24.3 100.0
1211 79.9 100.0
304 20.1
1515 100.0
Esquerda
Centro
Direita
Total
Valid
SystemMissing
Total
Frequency Percent Valid Percent
Cumulative
Percent

COOPERAÇÃO CE – PALOP
Programa PIR PALOP II / Projecto Consolidação das Capacidades da Administração Pública

INA – Instituto Nacional de Administração 27
Exemplo 2: criação de Índices sintéticos

Pretende-se criar dois índices sintéticos: Confiança social (variáveis a8, a9 e a10) e Confiança
institucional (variáveis b7, b8, b9 e b10).

As 2 variáveis acrescentaram-se à base6:

Os resultados são os seguintes:

Descriptive Statistics
1480 .0 10.0 4.316 1.7469
1338 .0 9.3 4.097 1.7603
1319
Índice sintético de Confiança social
Índice sintético de Confiança institucional
Valid N (listwise)
N Minimum Maximum Mean Std. Deviation

6
Nota: tratando-se de variáveis rácio, deverão ter casas decimais (1 ou 2).
COOPERAÇÃO CE – PALOPPrograma PIR PALOP II / Projecto Consolidação das Capacidades da Administração Pública

INA – Instituto Nacional de Administração 28
2.5.2. Transformação lógica de variáveis

Exemplo: pretende-se criar uma variável - sexid - através da transformação lógica das variáveis f2
e idade2, com 4 categorias: “homens até 30 anos”, “homens com mais de 30 anos”,
“mulheres até 30 anos” e “mulheres com mais de 30 anos”.

Nota: repetir o comando para as restantes categorias, cujas expressões numéricas são as seguintes:
Categoria 2: f2 = 1 & idade2 > 2
Categoria 3: f2 = 2 & idade2 = 3
Categoria 4: f2 = 2 & idade2 > 4

A variável sexid acrescentar-se-á à base e deverá ser completada com a alteração do nível de
medida (scale para ordinal) e a definição dos respectivos label e value labels.

O resultado é o seguinte:

Sexo e Idade
158 10.5 10.5 10.5
472 31.2 31.2 41.7
183 12.1 12.1 53.8
698 46.2 46.2 100.0
1511 100.0 100.0
Homens até 30 anos
Homens com mais de 30 anos
Mulheres até 30 anos
Mulheres com mais de 30 anos
Total
Valid
Frequency Percent Valid Percent
Cumulative
Percent

COOPERAÇÃO CE – PALOP
Programa PIR PALOP II / Projecto Consolidação das Capacidades da Administração Pública

INA – Instituto Nacional de Administração 29
2.5.3. Inversão da escala de uma variável

Exemplo: pretende-se criar uma nova variável (ib1) com a inversão da escala da variável interesse
pela política (b1) de modo a que 1 corresponda a “nenhum interesse” e 4 a “muito
interesse”:

O resultado é o seguinte:

b1
Qual o seu interesse pela política
117 7.7 7.8 7.8
456 30.2 30.3 38.1
441 29.2 29.3 67.5
489 32.4 32.5 100.0
1503 99.5 100.0
6 .4
2 .1
8 .5
1511 100.0
Muito interesse
Algum interesse
Pouco interesse
Nenhum interesse
Total
Valid
Recusa
Não sabe
Total
Missing
Total
Frequency Percent Valid Percent
Cumulative
Percent

ib1
Qual o seu interesse pela política
489 32.4 32.5 32.5
441 29.2 29.3 61.9
456 30.2 30.3 92.2
117 7.7 7.8 100.0
1503 99.5 100.0
2 .1
6 .4
8 .5
1511 100.0
Nenhum interesse
Pouco interesse
Algum interesse
Muito interesse
Total
Valid
Não sabe
Recusa
Total
Missing
Total
Frequency Percent Valid Percent
Cumulative
Percent

COOPERAÇÃO CE – PALOP
Programa PIR PALOP II / Projecto Consolidação das Capacidades da Administração Pública

INA – Instituto Nacional de Administração 30
2.5.4. Variáveis de contagem de ocorrências

Exemplo: pretende-se criar uma variável – partciv – que traduza o Índice de participação cívica,
que integre (conte) apenas os inquiridos que responderam sim (1) às questões b15 a
b24.

A variável partciv acrescentar-se-á à base.

O resultado é o seguinte:

Índice sintético de Participação cívica
1174 77.7 77.7 77.7
145 9.6 9.6 87.3
85 5.6 5.6 92.9
39 2.6 2.6 95.5
30 2.0 2.0 97.5
16 1.1 1.1 98.5
9 .6 .6 99.1
11 .7 .7 99.9
1 .1 .1 99.9
1 .1 .1 100.0
1511 100.0 100.0
0
1
2
3
4
5
6
7
9
10
Total
Valid
Frequency Percent Valid Percent
Cumulative
Percent

A interpretação é a seguinte: 77,7% (1174) inquiridos não assinalaram nenhum indicador, 9,6%
(145) assinalaram apenas 1, 5,6% (85) assinalaram 2, etc.

COOPERAÇÃO CE – PALOP
Programa PIR PALOP II / Projecto Consolidação das Capacidades da Administração Pública

INA – Instituto Nacional de Administração 31
2.6. Selecção de casos

Exemplo 1: selecção de uma sub-amostra
Pretende-se seleccionar (filtrar) apenas os inquiridos da região de Lisboa e Vale do Tejo
(regiao=3).

Na base de dados (Data View) os registos não seleccionados (filtrados) aparecem tracejados,
mantendo-se assim até que se anule a selecção (filtro). A barra de status informa que a base está
filtrada:

Nota muito importante: não esquecer de desactivar o filtro quando não for necessário:
COOPERAÇÃO CE – PALOP
Programa PIR PALOP II / Projecto Consolidação das Capacidades da Administração Pública

INA – Instituto Nacional de Administração 32

Exemplo 2: Selecção de uma amostra aleatória simples
Pretende-se seleccionar uma amostra de 5% dos casos, aproximadamente:

INA – Instituto Nacional de Administração 33
Exemplo 3: Separar a análise por grupos

Pretende-se separar a análise pelas 4 categorias (sub-amostras) da variável sexid (sexo e idade).
É possível obter os resultados na mesma tabela, seleccionando a opção Compare groups ou em
tabelas diferentes, com a opção Output by groups:

No primeiro caso, os resultados são os seguintes:

Descriptive Statistics
156 1.0 9.0 4.859 1.4670
147 .0 8.5 4.248 1.7428
145
456 .0 10.0 4.259 1.8100
440 .0 9.3 4.066 1.8441
430
182 .0 9.3 4.604 1.6277
168 .0 8.0 4.116 1.6234
167
686 .0 10.0 4.153 1.7629
583 .0 9.3 4.075 1.7401
577
Índice sintético de Confiança social
Índice sintético de Confiança institucional
Valid N (listwise)
Índice sintético de Confiança social
Índice sintético de Confiança institucional
Valid N (listwise)
Índice sintético de Confiança social
Índice sintético de Confiança institucional
Valid N (listwise)
Índice sintético de Confiança social
Índice sintético de Confiança institucional
Valid N (listwise)
Sexo e Idade
Homens até 30 anos
Homens com mais
de 30 anos
Mulheres até 30
anos
Mulheres com mais
de 30 anos
N Minimum Maximum Mean Std. Deviation

COOPERAÇÃO CE – PALOP
Programa PIR PALOP II / Projecto Consolidação das Capacidades da Administração Pública

INA – Instituto Nacional de Administração 34
No segundo caso seriam produzidas 4 tabelas, uma por cada categoria da variável colocada em
split:

Descriptive Statisticsa
156 1.0 9.0 4.859 1.4670
147 .0 8.5 4.248 1.7428
145
Índice sintético de
Confiança social
Índice sintético de
Confiança institucional
Valid N (listwise)
N Minimum Maximum Mean Std. Deviation
Sexo e Idade = Homens até 30 anosa.
Descriptive Statisticsa
456 .0 10.0 4.259 1.8100
440 .0 9.3 4.066 1.8441
430
Índice sintético de
Confiança social
Índice sintético de
Confiança institucional
Valid N (listwise)
N Minimum Maximum Mean Std. Deviation
Sexo e Idade = Homens com mais de 30 anosa.
Descriptive Statisticsa
182 .0 9.3 4.604 1.6277
168 .0 8.0 4.116 1.6234
167
Índice sintético de
Confiança social
Índice sintético de
Confiança institucional
Valid N (listwise)
N Minimum Maximum Mean Std. Deviation
Sexo e Idade = Mulheres até 30 anosa.
Descriptive Statisticsa
686 .0 10.0 4.153 1.7629
583 .0 9.3 4.075 1.7401
577
Índice sintético de
Confiança social
Índice sintético de
Confiança institucional
Valid N (listwise)
N Minimum Maximum Mean Std. Deviation
Sexo e Idade = Mulheres com mais de 30 anosa.

COOPERAÇÃO CE – PALOP
Programa PIR PALOP II / Projecto Consolidação das Capacidades da Administração Pública

INA – Instituto Nacional de Administração 35

Avaliação deste módulo consiste em criar uma base de dados para o excerto do
seguinte questionário:

����
Avaliação
COOPERAÇÃO CE – PALOP
Programa PIR PALOP II / ProjectoConsolidação das Capacidades da Administração Pública

INA – Instituto Nacional de Administração 36

- Pereira, A. (1999), SPSS-Guia Prático de Utilização, Análise de
Dados para Ciências Sociais e Psicologia, Lisboa, Edições Sílabo, 6ª
edição revista e corrigida.
- Vinacua, B. V. (2002), Análisis Estadístico con SPSS para Windows. Volumen I.
Estadística básica, Madrid, McGraw-Hill, 2ª edición.

����
Referências
COOPERAÇÃO CE – PALOP
Programa PIR PALOP II / Projecto Consolidação das Capacidades da Administração Pública

INA – Instituto Nacional de Administração 37

Capítulo 3 – Estatística aplicada com SPSS

O objectivo geral deste capítulo é o de proceder à análise estatística de dados,
nomeadamente:
o Análise univariada – frequências e distribuições;
o Análise bivariada – Cruzamentos, testes de hipóteses e inferência
estatística;
o Análise multivariada:
� Previsão - Regressão linear simples e múltipla;
� Detectar dimensões latentes - Análise das componentes
principais;
� Segmentação: Análise de Clusters

– Frequências
– Cruzamentos
– Testes de hipóteses
– Inferência estatística
– Margem de erro
– Intervalo de confiança
– Significância estatística

Capítulo
3
����
Objectivos
����
Palavras
COOPERAÇÃO CE – PALOP
Programa PIR PALOP II / Projecto Consolidação das Capacidades da Administração Pública

INA – Instituto Nacional de Administração 38
3.1. Análise de dados univariada
3.1. 1. Frequências

a) Utilizando o comando Frequencies7

Variáveis de caracterização social:

Os resultados são os seguintes:

Sexo
630 41.7 41.7 41.7
881 58.3 58.3 100.0
1511 100.0 100.0
Masculino
Feminino
Total
Valid
Frequency Percent Valid Percent
Cumulative
Percent

Anos de escolaridade concluídos
1046 69.2 69.3 69.3
251 16.6 16.6 86.0
212 14.0 14.0 100.0
1509 99.9 100.0
2 .1
1511 100.0
Até 9 anos
10 - 12 anos
> 12 anos
Total
Valid
NRMissing
Total
Frequency Percent Valid Percent
Cumulative
Percent

7
Nota: as tabelas geradas pelo procedimento Frequencies são em formato “rascunho” destinando-se apenas ao
controlo e validação da base de dados, com o objectivo de eliminar erros de introdução de dados.
����
Conteúdo
COOPERAÇÃO CE – PALOP
Programa PIR PALOP II / Projecto Consolidação das Capacidades da Administração Pública

INA – Instituto Nacional de Administração 39
b) Utilizando o comando Tables

Os resultados são os seguintes8:

630 41.7
881 58.3
1511 100.0
341 22.6
505 33.4
315 20.8
350 23.2
1511 100.0
1046 69.2
251 16.6
212 14.0
2 .1
1511 100.0
Masculino
Feminino
Total
Sexo
Até 30 anos
31 - 50 anos
51 - 65 anos
> 65 anos
Total
Idade
Até 9 anos
10 - 12 anos
> 12 anos
NR
Total
Anos de
escolaridade
concluídos
N %

8
Nota: o quadro foi modificado no respectivo editor, a que se acede “clicando” duas vezes sobre o mesmo.
COOPERAÇÃO CE – PALOP
Programa PIR PALOP II / Projecto Consolidação das Capacidades da Administração Pública

INA – Instituto Nacional de Administração 40
c) Quadro de frequências (%) dos indicadores das questões d18 a d24

O resultado é o seguinte:

11.7 41.3 15.1 25.4 6.5 100.0
14.1 46.1 19.4 16.2 4.3 100.0
13.7 53.7 16.7 12.3 3.6 100.0
14.3 42.3 22.1 16.2 5.2 100.0
25.9 54.0 12.5 6.0 1.6 100.0
43.3 40.1 9.3 6.2 1.0 100.0
26.6 38.5 19.0 13.2 2.7 100.0
As pessoas que vêm viver e trabalhar para cá fazem
com que os salários baixem
As pessoas que vêm viver e trabalhar para cá, em
regra, prejudicam mais as expectativas económicas
dos pobres do que dos ricos
As pessoas que vêm viver e trabalhar para cá
ajudam a preencher lugares em que há falta de
trabalhadores
Se as pessoas que vieram viver e trabalhar para cá
estiverem desempregadas por muito tempo deviam
ser obrigadas a ir embora
As pessoas que vieram viver para cá devem ter os
mesmos direitos do que todas as outras pessoas
As pessoas que vieram viver para cá cometerem um
crime grave, devem ser obrigadas a ir embora
As pessoas que vieram viver para cá cometerem
qualquer crime, devem ser obrigadas a ir embora
Concorda
totalmente Concorda
Nem
concorda
nem
Discorda
Discorda
totalmente Total

COOPERAÇÃO CE – PALOP
Programa PIR PALOP II / Projecto Consolidação das Capacidades da Administração Pública

INA – Instituto Nacional de Administração 41
3.1. 2. Estatísticas descritivas e gráfico de perfil

Nota muito importante: A análise estatística, excepto nos quadros de frequências,
deve incidir apenas nas respostas válidas. Assim, antes de efectuar qualquer análise
estatística, torna-se necessário definir e activar os respectivos missing values (não
responde/não sabe/não se aplica) na coluna missing da base de dados.

a) Utilizando o comando Descriptives9

Indicadores das questões d10 a d17:

Os resultados são os seguintes:

Descriptive Statistics
1448 0 10 7.46 2.241
1449 0 10 7.11 2.442
1447 0 10 6.81 2.807
1454 0 10 6.48 2.425
1416 0 10 6.06 2.536
1466 0 10 6.05 2.633
1440 0 10 3.79 2.971
1451 0 10 2.85 2.874
1330
Ter qualificações profissionais de que o país precisa
Querer adaptar-se ao mesmo modo de vida do país
Ser rico
Ter familiares próximos a viver cá
Ter boas qualificações académicas
Saber falar a língua oficial do país
Ter formação cristã
Ser branco
Valid N (listwise)
N Minimum Maximum Mean Std. Deviation

9
Nota: as tabelas geradas pelo procedimento Descriptives são em formato “rascunho” destinando-se apenas ao
controlo e validação da base de dados, com o objectivo de eliminar erros de introdução de dados.
COOPERAÇÃO CE – PALOP
Programa PIR PALOP II / Projecto Consolidação das Capacidades da Administração Pública

INA – Instituto Nacional de Administração 42
b) Utilizando o comando Tables

Os resultados são os seguintes:

6.1 2.5
6.5 2.4
6.1 2.6
3.8 3.0
2.8 2.9
6.8 2.8
7.5 2.2
7.1 2.4
Ter boas qualificações académicas
Ter familiares próximos a viver cá
Saber falar a língua oficial do país
Ter formação cristã
Ser branco
Ser rico
Ter qualificações profissionais de que o país precisa
Querer adaptar-se ao mesmo modo de vida do país
Média Desvio-padrão

COOPERAÇÃO CE – PALOP
Programa PIR PALOP II / Projecto Consolidação das Capacidades da Administração Pública

INA – Instituto Nacional de Administração 43
c) Gráfico de perfil10:

0.0 1.0 2.0 3.0 4.0 5.0 6.0 7.0 8.0 9.0 10.0
Ter boas qualificações académicas
Ter familiares próximos a viver cá
Saber falar a língua oficial do país
Ter formação cristã
Ser branco
Ser rico
Ter qualificações profissionais de que o país precisa
Querer adaptar-se ao mesmo modo de vida do país
6.1
6.5
6.1
3.8
2.8
6.8
7.5
7.1
Nenhuma importância Muita importância

10
Para obter um gráfico interactivo de linhas, o procedimento é o seguinte: Graph/Interactive/Line, seleccionam-setodas as variáveis em simultâneo pressionando a tecla “Ctrl” e arrastam-se para “horizontal”.
O gráfico do exemplo foi editado e transformado, tendo-se alterado a escala para o formato real e a cor da linha e
acrescentado as etiquetas (valores e mínimo e máximo), a grelha e a linha de referência.
COOPERAÇÃO CE – PALOP
Programa PIR PALOP II / Projecto Consolidação das Capacidades da Administração Pública

INA – Instituto Nacional de Administração 44
3.1.3. Testes de aderência (para 1 amostra)
3.1.3.1. χ2 (Qui-quadrado)

Exemplo 1: Pretende-se testar se a classe social (classe2) tem uma distribuição uniforme11 no
universo.

Como a variável é nominal, o procedimento consiste em realizar o teste de aderência
do χ2 (All categories equal):

O resultado é o seguinte:

Classes sociais (ACM) próprio
175 256.6 -81.6
191 256.6 -65.6
81 256.6 -175.6
413 256.6 156.4
423 256.6 166.4
1283
Empresários, dirigentes
e profissionais liberais
Profissionais técnicos e
de enquadramento
Trabalhadores
independentes
Empregados executantes
Operários
Total
Observed N Expected N Residual

Test Statistics
366.123
4
.000
Chi-Squarea
df
Asymp. Sig.
Classes
sociais (ACM)
próprio
0 cells (.0%) have expected frequencies less than
5. The minimum expected cell frequency is 256.6.
a.

Interpretação: A variável classe social não segue uma distribuição uniforme no universo
(χ2(4)=366,123; p=0,000).

11
Testando se as frequências observadas são iguais às frequências esperadas.
COOPERAÇÃO CE – PALOP
Programa PIR PALOP II / Projecto Consolidação das Capacidades da Administração Pública

INA – Instituto Nacional de Administração 45
3.1.3.2. Kolmogorov-Smirnov

Exemplo: Pretende-se testar se o interesse pela política (ib1) segue uma distribuição normal ou
uniforme no universo.

Como a variável é ordinal, o procedimento consiste em realizar o teste de aderência
de Kolmogorov-Smirnov para as duas distribuições:

O resultado é o seguinte:

One-Sample Kolmogorov-Smirnov Test
1503
2.13
.961
.206
.206
-.198
8.001
.000
N
Mean
Std. Deviation
Normal Parametersa,b
Absolute
Positive
Negative
Most Extreme
Differences
Kolmogorov-Smirnov Z
Asymp. Sig. (2-tailed)
Qual o seu
interesse
pela política
Test distribution is Normal.a.
Calculated from data.b.

One-Sample Kolmogorov-Smirnov Test 2
1503
1
4
.325
.325
-.078
12.613
.000
N
Minimum
Maximum
Uniform Parameters a,b
Absolute
Positive
Negative
Most Extreme
Differences
Kolmogorov-Smirnov Z
Asymp. Sig. (2-tailed)
Qual o seu
interesse
pela política
Test distribution is Uniform.a.
Calculated from data.b.

Interpretação: A variável interesse pela política não segue uma distribuição normal
(K-S=8,001; p=0,000) nem uniforme (K-S=12,613; p=0,000) no universo.
COOPERAÇÃO CE – PALOP
Programa PIR PALOP II / Projecto Consolidação das Capacidades da Administração Pública

INA – Instituto Nacional de Administração 46
3.1.3.3 Teste t de Student

Exemplo: Pretende-se testar se a confiança social adere à média que corresponde ao centro da
escala (5)12 dos indicadores que compõem a variável (confsoc).

Como a variável é quantitativa, o procedimento consiste em realizar o teste t de
aderência (One-Sample T-Test), comparando se a média observada difere
significativamente de 5:

O resultado é o seguinte:

One-Sample Statistics
1480 4.316 1.7469 .0454Índice sintético deConfiança social
N Mean Std. Deviation
Std. Error
Mean

One-Sample Test
-15.073 1479 .000 -.684 -.774 -.595Índice sintético deConfiança social
t df Sig. (2-tailed)
Mean
Difference Lower Upper
95% Confidence
Interval of the Difference
Test Value = 5

Interpretação: A média observada é 4,3, diferindo significativamente da média de referência
(t(1479)= -15,073; p=0,000).

12
A escala de medida dos indicadores de confiança social varia entre 0=nenhuma e 10=toda.
COOPERAÇÃO CE – PALOP
Programa PIR PALOP II / Projecto Consolidação das Capacidades da Administração Pública

INA – Instituto Nacional de Administração 47
3.2. Análise de dados bivariada
3.2.1. Cruzamentos e teste de independência χ2 (Qui-quadrado)

Exemplo 1: Pretende-se saber se há relação entre o sexo e o facto de ter comprado produtos por
razões de ordem política, ética ou ambiental.

O procedimento consiste em cruzar as variáveis sexo (f2) e (b22) e solicitar o teste
de independência do χχχχ2*.

a) Utilizando o comando Crosstabs

O resultado é o seguinte:

Sexo * Comprou produtos por razões de ordem política,
ética ou ambiental Crosstabulation
% within Sexo
7.2% 92.8% 100.0%
7.7% 92.3% 100.0%
7.5% 92.5% 100.0%
Masculino
Feminino
Sexo
Total
Sim Não
Comprou produtos por
razões de ordem
política, ética ou
ambiental
Total

Chi-Square Tests
.121b 1 .728
.062 1 .804
.122 1 .727
.766 .404
.121 1 .728
1495
Pearson Chi-Square
Continuity Correction a
Likelihood Ratio
Fisher's Exact Test
Linear-by-Linear
Association
N of Valid Cases
Value df
Asymp. Sig.
(2-sided)
Exact Sig.
(2-sided)
Exact Sig.
(1-sided)
Computed only for a 2x2 tablea.
0 cells (.0%) have expected count less than 5. The minimum expected count is
46.75.
b.

*
Para a selecção dos testes estatísticos, ver o Anexo 1.
COOPERAÇÃO CE – PALOP
Programa PIR PALOP II / Projecto Consolidação das Capacidades da Administração Pública

INA – Instituto Nacional de Administração 48

Interpretação: As mulheres compram ligeiramente mais que os homens mas as diferenças não
são estatisticamente significativas (χ2 (1)=0,121; p>0,05).

b) Utilizando o comando Tables

COOPERAÇÃO CE – PALOP
Programa PIR PALOP II / Projecto Consolidação das Capacidades da Administração Pública

INA – Instituto Nacional de Administração 49

O resultado é o seguinte:

7.2 92.8 100.0
7.7 92.3 100.0
7.5 92.5 100.0
Masculino
Feminino
Total
Sexo
Sim Não Total
Comprou produtos por razões de
ordem política, ética ou ambiental

Pearson Chi-Square Tests
.121
1
.728
Chi-square
df
Sig.
Sexo
Comprou
produtos por
razões de
ordem
política, ética
ou ambiental
Results are based on nonempty rows and
columns in each innermost subtable.

COOPERAÇÃO CE – PALOP
Programa PIR PALOP II / Projecto Consolidação das Capacidades da Administração Pública

INA – Instituto Nacional de Administração 50

3.2.2. Testes não paramétricos (procedimento Non Parametric Tests)
3.2.2.1. Duas amostras independentes
(Mann-Whitney e Kolmogorov-Smirnov)

Exemplo 1: Pretende-se testar se há relação entre o sexo (f2) e o interesse pela política (ib1).

O procedimento consiste na realização do teste não paramétrico para 2 amostras
independentes (Mann-Whitney)13.

O resultado é o seguinte:

Ranks
628 815.82 512336.00
875 706.19 617920.00
1503
Sexo
Masculino
Feminino
Total
Qual o seu interesse
pela política
N Mean Rank Sum of Ranks

Test Statisticsa
234670.000
617920.000
-5.058
.000
Mann-Whitney U
Wilcoxon W
Z
Asymp. Sig. (2-tailed)
Qual o seu
interesse
pela política
Grouping Variable: Sexoa.

Interpretação: a média das ordenações (Mean Rank) é superior nos homens. Ou seja, oshomens
referem que têm mais interesse pela política do que as mulheres. As diferenças são
estatisticamente significativas (M-W=234670; p=0,000).

13
Consultar o Anexo 1.
COOPERAÇÃO CE – PALOP
Programa PIR PALOP II / Projecto Consolidação das Capacidades da Administração Pública

INA – Instituto Nacional de Administração 51
Exemplo 2: Pretende-se testar se há relação entre o sexo (f2) e o grau de escolaridade (escol).

O procedimento consiste na em fazer o cruzamento entre as 2 variáveis e realizar do
teste não paramétrico para duas amostras independentes (Kolmogorov-Smirnov)14.

14
Consultar o Anexo 1.
COOPERAÇÃO CE – PALOP
Programa PIR PALOP II / Projecto Consolidação das Capacidades da Administração Pública

INA – Instituto Nacional de Administração 52
O resultado é o seguinte:

67.9 18.9 13.2 100.0
70.3 15.0 14.7 100.0
69.3 16.6 14.0 100.0
Masculino
Feminino
Total
Sexo
Até 9 anos 10 - 12
anos
> 12 anos Total
Anos de escolaridade concluídos

Test Statisticsa
.025
.025
-.014
.476
.977
Absolute
Positive
Negative
Most Extreme
Differences
Kolmogorov-Smirnov Z
Asymp. Sig. (2-tailed)
Escolaridade
Grouping Variable: Sexoa.

Interpretação: Tanto no grau de escolaridade intermédio como no superior, verifica-se que há
mais homens do que mulheres, observando-se o inverso no grau de escolaridade mais baixo. No
entanto, as diferenças não são estatisticamente significativas (K-S=0,476; p>0,05).

3.2.2.2. K amostras independentes (Kruskal-Wallis)

Exemplo: Pretende-se testar se há relação entre a idade (idade2) e o interesse pela política (ib1).

O procedimento consiste na realização do teste não paramétrico para k amostras
independentes (Kruskal-Wallis)15.

15
Consultar o Anexo 1.
COOPERAÇÃO CE – PALOP
Programa PIR PALOP II / Projecto Consolidação das Capacidades da Administração Pública

INA – Instituto Nacional de Administração 53
O resultado é o seguinte:

27.4 33.6 31.9 7.1 100.0
28.0 28.8 32.9 10.3 100.0
30.7 30.4 29.7 9.3 100.0
45.8 25.1 25.6 3.5 100.0
32.5 29.3 30.3 7.8 100.0
Até 30 anos
31 - 50 anos
51 - 65 anos
> 65 anos
Total
Idade
Nenhum
interesse
Pouco
interesse
Algum
interesse
Muito
interesse Total
Qual o seu interesse pela política

Ranks
339 777.35
504 803.46
313 768.74
347 637.38
1503
Idade
Até 30 anos
31 - 50 anos
51 - 65 anos
> 65 anos
Total
Qual o seu interesse
pela política
N Mean Rank

Test Statisticsa,b
36.088
3
.000
Chi-Square
df
Asymp. Sig.
Qual o seu
interesse
pela política
Kruskal Wallis Testa.
Grouping Variable: Idadeb.

Interpretação: A média das ordenações (Mean Rank) é mais elevada nos que têm entre 31 e 50 anos,
sendo este escalão, por conseguinte, que refere ter mais interesse pela política, enquanto os mais
velhos são os que revelam menos interesse. As diferenças são estatisticamente significativas (K-W
(3)=36,088; p=0,000).

COOPERAÇÃO CE – PALOP
Programa PIR PALOP II / Projecto Consolidação das Capacidades da Administração Pública

INA – Instituto Nacional de Administração 54

3.2.3. Testes paramétricos (procedimento Compare Means)
3.2.3.1. Duas amostras emparelhadas (t de Student para amostras
emparelhadas)

Exemplo: Pretende-se testar se a média da confiança social (confsoc) é idêntica, ou não, à média
da confiança institucional (confinst).

O procedimento consiste na realização do teste paramétrico para duas amostras
emparelhadas (Paired-Samples T-Test)16.

O resultado é o seguinte:

Paired Samples Statistics
4.313 1319 1.7165 .0473
4.087 1319 1.7606 .0485
Índice sintético de
Confiança social
Índice sintético de
Confiança institucional
Pair 1
Mean N Std. Deviation
Std. Error
Mean

Paired Samples Correlations
1319 .310 .000
Índice sintético de
Confiança social &
Índice sintético de
Confiança institucional
Pair 1
N Correlation Sig.

Paired Samples Test
.225 2.0428 .0562 .115 .336 4.009 1318 .000
Índice sintético de
Confiança social -
Índice sintético de
Confiança institucional
Pair 1
Mean Std. Deviation
Std. Error
Mean Lower Upper
95%
Confidence
Interval of the
Difference
Paired Differences
t df Sig. (2-tailed)

16
Consultar o Anexo 1.
COOPERAÇÃO CE – PALOP
Programa PIR PALOP II / Projecto Consolidação das Capacidades da Administração Pública

INA – Instituto Nacional de Administração 55
Interpretação: A média da confiança social (4,313) é ligeiramente superior à média da confiança
institucional (4,087). A correlação entre as duas variáveis é média fraca (0,310) e estatisticamente
significativa (p=0,000), sendo igualmente estatisticamente significativa a diferença entre as duas
médias (t (1318)=4,009; p=0,000).

3.2.3.2. Duas amostras independentes
(t de Student de independência)

Exemplo: Pretende-se testar se há relação entre o sexo (f2) e a confiança social (confsoc).

O procedimento consiste na realização do teste paramétrico para duas amostras
independentes (Independent-Samples T-Test)17.

O resultado é o seguinte:

Group Statistics
612 4.412 1.7476 .0706
868 4.248 1.7442 .0592
Sexo
Masculino
Feminino
Índice sintético de
Confiança social
N Mean Std. Deviation
Std. Error
Mean

Independent Samples Test
.182 .669 1.781 1478 .075 .164 .0921 -.0167 .3448
1.780 1313.926 .075 .164 .0922 -.0167 .3449
Equal variances assumed
Equal variances not
assumed
Índice sintético de
Confiança social
F Sig.
Levene's Test
for Equality of
Variances
t df Sig. (2-tailed)
Mean
Difference
Std. Error
Difference Lower Upper
95%
Confidence
Interval of the
Difference
t-test for Equality of Means

17
Consultar o Anexo 1.
COOPERAÇÃO CE – PALOP
Programa PIR PALOP II / Projecto Consolidação das Capacidades da Administração Pública

INA – Instituto Nacional de Administração 56

Interpretação: Os homens (4,412) revelam mais confiança social que as mulheres (4,248)18,
embora a diferença não seja estatisticamente significativa, (t (1480)=1,808; p> 0,05).

3.2.3.3. k amostras independentes (Análise de Variância Simples Paramétrica -
ANOVA)

Exemplo: Pretende-se testar se há relação entre a idade (idade2) e a confiança social (confsoc).

O procedimento consiste na realização da Análise de Variância Simples Paramétrica
(One-way Anova)19.

O resultado é o seguinte:

Descriptives
Índice sintético de Confiança social
338 4.722 1.5585 .0848 4.555 4.889 .0 9.3
497 4.058 1.6747 .0751 3.911 4.206 .0 9.3
312 4.068 1.8340 .1038 3.864 4.273 .0 10.0
333 4.519 1.8500 .1014 4.319 4.718 .0 10.0
1480 4.316 1.7469 .0454 4.226 4.405 .0 10.0
Até 30 anos
31 - 50 anos
51 - 65 anos
> 65 anos
Total
N Mean Std. Deviation Std. Error Lower Bound Upper Bound
95% Confidence Interval for
Mean
Minimum Maximum

18
O índice de confiança social varia entre 0=nenhuma confiança e 10=toda a confiança.
19
Consultar o Anexo 1.
COOPERAÇÃO CE – PALOP
Programa PIR PALOP II / Projecto Consolidação das Capacidades da Administração Pública

INA – Instituto Nacional de Administração 57
Test of Homogeneity of VariancesÍndice sintético de Confiança social
4.050 3 1476 .007
Levene
Statistic df1 df2 Sig.

ANOVA
Índice sintético de Confiança social
121.466 3 40.489 13.607 .000
4391.954 1476 2.976
4513.420 1479
Between Groups
Within Groups
Total
Sum of
Squares df Mean Square F Sig.

Interpretação: São os mais novos (4,722), seguidos dos mais velhos (4,519) que mais confiam.
Os escalões intermédios 31-50 anos (4,058) e 51-65 anos ( (4,068) confiam um pouco menos. As
diferenças são estatisticamente significativas (F (3)=13,787; p=0,000).

Nota: sendo as diferenças estatisticamente significativas, importa saber quais os grupos que
diferem uns dos outros. Para o efeito realiza-se um teste à posteriori (Post Hoc). O SPSS
disponibiliza vários testes para este fim, sendo os mais utilizados, o teste de Scheffe20, no caso de
as variâncias serem iguais, e o teste Games-Howell no caso de serem diferentes.

Neste caso, uma vez que se rejeita a hipótese de as variâncias serem iguais (p=0,007), vamos
solicitar o teste Games-Howell:

20
Que é também o mais conservador,
COOPERAÇÃO CE – PALOP
Programa PIR PALOP II / Projecto Consolidação das Capacidades da Administração Pública

INA – Instituto Nacional de Administração 58

O resultado é o seguinte:

Multiple Comparisons
Dependent Variable: Índice sintético de Confiança social
Games-Howell
.664* .1133 .000 .372 .955
.654* .1340 .000 .308 .999
.203 .1321 .415 -.137 .544
-.664* .1133 .000 -.955 -.372
-.010 .1282 1.000 -.340 .320
-.460* .1262 .002 -.785 -.135
-.654* .1340 .000 -.999 -.308
.010 .1282 1.000 -.320 .340
-.450* .1451 .011 -.824 -.076
-.203 .1321 .415 -.544 .137
.460* .1262 .002 .135 .785
.450* .1451 .011 .076 .824
(J) Idade
Até 30 anos
31 - 50 anos
51 - 65 anos
> 65 anos
Até 30 anos
31 - 50 anos
51 - 65 anos
> 65 anos
Até 30 anos
31 - 50 anos
51 - 65 anos
> 65 anos
Até 30 anos
31 - 50 anos
51 - 65 anos
> 65 anos
(I) Idade
Até 30 anos
31 - 50 anos
51 - 65 anos
> 65 anos
Mean
Difference (I-J) Std. Error Sig. Lower Bound Upper Bound
95% Confidence Interval
The mean difference is significant at the .05 level.*.

Interpretação: os grupos que diferem estatisticamente entre si estão assinalados com um *. O
quadro seguinte sintetiza as diferenças significativas entre os quatro escalões etários

Até 30 anos 31-50 anos 51-65 anos > 65 anos
Até 30 anos
X X
31-50 anos X X
51-65 anos X X
> 65 anos
X X

COOPERAÇÃO CE – PALOP
Programa PIR PALOP II / Projecto Consolidação das Capacidades da Administração Pública

INA – Instituto Nacional de Administração 59
3.2.4. Correlação linear simples

A correlação linear simples permite obter uma medida (coeficiente de correlação – r de Pearson)
através da qual se determina a força ou intensidade de uma associação linear entre duas ou mais
variáveis quantitativas ou tratadas como tal (escalas tipo Likert).

O coeficiente de correlação varia entre –1 e 121 e deve ser interpretado da seguinte forma:
0: ausência de correlação;
+/- ]0 – 0,25]: correlação muito fraca;
+/- ]0,25 – 0,40] correlação fraca;
+/- ]0,40 – 0,60] correlação média;
+/- ]0,60 – 0,75] correlação média forte;
+/- ]0,75 – 0,90] correlação forte;
+/- ]0,90 – 1[ correlação muito forte;
+/- 1 correlação perfeita

Exemplo: Correlação entre as variáveis satisfação com a vida (b29), com a economia (b30), com o
Governo (b31), com a democracia (b32), com a educação (b33) e com os serviços de
saúde (b34):

21
O sinal – significa uma correlação negativa e a ausência de sinal uma correlação positiva.
COOPERAÇÃO CE – PALOP
Programa PIR PALOP II / Projecto Consolidação das Capacidades da Administração Pública

INA – Instituto Nacional de Administração 60
O resultado é o seguinte:

Correlations
.339**
.000
1441
.280** .578**
.000 .000
1413 1392
.348** .403** .507**
.000 .000 .000
1371 1353 1339
.205** .361** .289** .300**
.000 .000 .000 .000
1429 1389 1367 1338
.195** .396** .340** .294** .537**
.000 .000 .000 .000 .000
1489 1440 1412 1370 1433
Pearson Correlation
Sig. (2-tailed)
N
Pearson Correlation
Sig. (2-tailed)
N
Pearson Correlation
Sig. (2-tailed)
N
Pearson Correlation
Sig. (2-tailed)
N
Pearson Correlation
Sig. (2-tailed)
N
Pearson Correlation
Sig. (2-tailed)
N
Satisfação com a
vida em geral
Economia
Governo
Democracia
Educação
Serviços de Saúde
Satisfação
com a vida
em geral Economia Governo Democracia Educação
Serviços
de Saúde
Correlation is significant at the 0.01 level (2-tailed).**.

Interpretação: as correlações são positivas e significativas entre todas as variáveis ; (p=0,000),
sendo a menor entre a satisfação com a vida e com a educação (0,209e a maior entre a satisfação
com o Governo e com a economia (0,577
COOPERAÇÃO CE – PALOP
Programa PIR PALOP II / Projecto Consolidação das Capacidades da Administração Pública

INA – Instituto Nacional de Administração 61
3.3. Modelos de previsão
3.3.1. Análise de Regressão Simples

A regressão linear, como referem Bryman e Cramer, “é um poderoso instrumento para resumir a
natureza da associação entre variáveis e para fazer previsões acerca dos valores da variável
dependente”.22

Na regressão linear simples, o objectivo é sintetizar a associação entre duas variáveis
(independente e dependente), produzindo uma linha (recta de regressão) que se aproxime dos
dados recolhidos. Ou seja, prever Y (variável dependente) a partir de X (variável independente).

Exemplo: pretende-se saber em que medida é que a confiança social (confsoc) – variável
independente – explica a confiança institucional (confinst) – variável dependente.

O procedimento consiste na realização da Análise de regressão linear simples entre as
duas variáveis:

22
Alan Bryman e Duncan Cramer, op.cit.: 212
COOPERAÇÃO CE – PALOP
Programa PIR PALOP II / Projecto Consolidação das Capacidades da Administração Pública

INA – Instituto Nacional de Administração 62
O resultado é o seguinte:

Model Summary
.310a .096 .095 1.6746
Model
1
R R Square
Adjusted
R Square
Std. Error of
the Estimate
Predictors: (Constant), Índice sintético de Confiança
social
a.

ANOVAb
392.354 1 392.354 139.912 .000a
3693.263 1317 2.804
4085.617 1318
Regression
Residual
Total
Model
1
Sum of
Squares df Mean Square F Sig.
Predictors: (Constant), Índice sintético de Confiança sociala.
Dependent Variable: Índice sintético de Confiança institucionalb.

Coefficientsa
2.716 .125 21.778 .000
.318 .027 .310 11.828 .000
(Constant)
Índice sintético de
Confiança social
Model
1
B Std. Error
Unstandardized
Coefficients
Beta
Standardized
Coefficients
t Sig.
Dependent Variable: Índice sintético de Confiança institucionala.

Interpretação: A correlação entre as variáveis é fraca (R=0,310) e o coeficiente de determinação
é muito fraco (R2=0,096)23. Ou seja, apenas 9,6% da variação da confiança institucional – variável
dependente – é explicada pela variação da confiança social – variável independente.

O teste F (quadro Anova) dá-nos informação sobre a adequabilidade do modelo, testando a
hipótese do coeficiente de determinação R2 ser 0 na população. Neste caso (F (1)=141,178;
p=0,000), rejeita-se a hipótese de isso acontecer.

Os testes t (no quadro dos Coefficients), testam a nulidadedos coeficientes. No primeiro caso
(t=115,605; p=0,000) testa a probabilidade de a constante (recta de regressão na origem) ser 0, e
no segundo caso testa a probabilidade do coeficiente de regressão ser 0.
A recta da regressão24, neste caso, é a seguinte: Confiança institucional = 2,716 + 0,318 confiança
social.

23
O coeficiente de determinação quantifica a percentagem de variação da variável dependentes que é explicada pela
variação da variável independente.
24
A equação simplificada da recta da regressão é a seguinte: Yi = ββββ0 + ββββ1 Xi, em que Yi é a variável dependente, ββββ0 é a
ordenada na origem, ββββ1 é o coeficiente de regressão e Xi é a variável independente.
COOPERAÇÃO CE – PALOP
Programa PIR PALOP II / Projecto Consolidação das Capacidades da Administração Pública

INA – Instituto Nacional de Administração 63
3.3.2. Análise de Regressão Múltipla

A regressão, como referem Bryman e Cramer, “é um poderoso instrumento para resumir a
natureza da associação entre variáveis e para fazer previsões acerca dos valores da variável
dependente”.25

No nosso exemplo vamos usar a análise de regressão múltipla – em concreto a linear – para
modelar a relação entre as variáveis independentes e a variável dependente26.

Exemplo: com base nos dados do ESS, pretende-se saber se os níveis de satisfação com o estado
da Economia portuguesa (b30), com a forma como o Governo tem governado (b31),
com a qualidade da Democracia (b32), com o estado da Educação (b33) e com os
Serviços de Saúde (b33) são, ou não, predictores da satisfação com a vida em geral
(b29):

Variável dependente

Variáveis independentes
(b30, b31, b32, b33 e b34)
Método: Stepwise
(Neste método entram no modelo
apenas as variáveis independentes
com significância estatística, por
ordem de importância.)
Nota: é habitual usar-se o método
ENTER quando se pretende
testar um modelo e o método
Stepwise em contextos
exploratórios, como é o caso.

25
Bryman, A. e D. Cramer, Análise de Dados em Ciencias Sociais, Oeiras, Celta, 2003.
26
Quando se associa às variáveis o estatuto de independentes e dependente pretende-se analisar mais do que a
associação entre elas (entenda-se variação conjunta), descrever e explicar uma relação de dependencia que deverá
ser teóricamente fundamentada.
COOPERAÇÃO CE – PALOP
Programa PIR PALOP II / Projecto Consolidação das Capacidades da Administração Pública

INA – Instituto Nacional de Administração 64

Procedimentos seleccionados:

• Informação sobre a significância
estatística da mudança de R2;
• Informação sobre
multicolinearidade;
• Intervalo de confiança para cada
um dos coeficientes de regressão

Resultado:

Variables Entered/Removed a
Democracia . Stepwise (Criteria: Probability-of-F-to-enter
<= .050, Probability-of-F-to-remove >= .100).
Economia . Stepwise (Criteria: Probability-of-F-to-enter
<= .050, Probability-of-F-to-remove >= .100).
Model
1
2
Variables
Entered
Variables
Removed Method
Dependent Variable: Satisfação com a vida em gerala.

• Variáveis que
entraram nos
modelos
ANOVAc
760.940 1 760.940 174.812 .000a
5610.899 1289 4.353
6371.839 1290
1051.123 2 525.562 127.224 .000b
5320.716 1288 4.131
6371.839 1290
Regression
Residual
Total
Regression
Residual
Total
Model
1
2
Sum of
Squares df Mean Square F Sig.
Predictors: (Constant), Democraciaa.
Predictors: (Constant), Democracia, Economiab.
Dependent Variable: Satisfação com a vida em geralc.

O objectivo do teste F é
verificar se a variável
independente influencia a
variável dependente no
universo. O que equivale a
detectar se o modelo
ajustado é ou não
significativo.
Permite inferir sobre a
adequabilidade do modelo
linear para explicar a relação
entre as duas variáveis.

Model Summary
.346a .119 .119 2.086 .119 174.812 1 1289 .000
.406b .165 .164 2.032 .046 70.245 1 1288 .000
Model
1
2
R R Square
Adjusted
R Square
Std. Error of
the Estimate
R Square
Change F Change df1 df2 Sig. F Change
Change Statistics
Predictors: (Constant), Democraciaa.
Predictors: (Constant), Democracia, Economiab.
Coeficiente de correlação
múltipla em módulo
% de variação da satisfação
com a vida em geral explicada
pelas variáveis independentes
que entraram no modelo
Nota: Em modelos com mas do que 1
variável independente deve interprtar-
se o R2 ajustado
Contributo das variáveis
independentes para a
mudança verificada no R2;
Teste F e
respectiva
significância
estatística
COOPERAÇÃO CE – PALOP
Programa PIR PALOP II / Projecto Consolidação das Capacidades da Administração Pública

INA – Instituto Nacional de Administração 65
Coefficientsa
4.221 .133 31.764 .000 3.960 4.481
.350 .026 .346 13.222 .000 .298 .402 1.000 1.000
3.841 .137 28.013 .000 3.572 4.110
.254 .028 .251 9.002 .000 .199 .309 .835 1.197
.276 .033 .234 8.381 .000 .212 .341 .835 1.197
(Constant)
Democracia
Economia
(Constant)
Democracia
Economia
Model
1
2
B Std. Error
Unstandardized
Coefficients
Beta
Standardized
Coefficients
t Sig. Lower Bound Upper Bound
95% Confidence Interval for
B
Tolerance VIF
Collinearity
Statistics
Dependent Variable: Satisfação com a vida em gerala.
Coeficientes de regressão standardizados e não
standardizados que permitem escrever a equação da
recta:
Satisfação com a vida = 3,841 + 0,254 satisfação com a
democracia + 0,276 satisfação com a economia.
Quando a tolerância é baixa, a correlação
múltipla é elevada e existe a possibilidade de
multicolinearidade. Com estes valores, a
probabilidade de isso acontecer é baixa.
Varia entre [0, 1] e quanto mais perto de 0 maior
será a multicolinearidade entre certa variável
independente e as outras variáveis independentes.

COOPERAÇÃO CE – PALOP
Programa PIR PALOP II / Projecto Consolidação das Capacidades da Administração Pública

INA – Instituto Nacional de Administração 66
3.4. Análise de dados multivariada
3.4.1. Análise das Componentes Principais

A Análise das Componentes Principais é um dos métodos de redução de dados mais comum no
marketing e em pesquisas de mercado. É “uma técnica de análise exploratória multivariada que
transforma um conjunto de variáveis correlacionadas entre si num conjunto menor de variáveis
independentes, combinações lineares das variáveis originais, designadas por componentes
principais”27. No essencial, o seu objectivo “é identificar novas variáveis, em número menor que o
conjunto inicial, mas sem perda significativa da informação contida neste conjunto”28.

No nosso exemplo, pretendemos identificar as “componentes principais” latentes nos 8
indicadores relativos às atitudes face à imigração (d10 + d11 + d12 + d13 + d14 + d15 + d16 +
d17).

Vamos começar por solicitar uma ACP com a extracção das componentes por defeito (critério de
Kaiser: valor próprio das componentes ≥ a 1).

• Selecção das
variáveis;

27
Moroco, J. Análise Estatística com utilização do SPSS, Lisboa, Sílabo, 2003: 231.
28
Reis, E., Análise factorial das componentes principais: um método de reduzir sem perder informação, Lisboa
Giesta/Iscte, 1990.
COOPERAÇÃO CE – PALOP
Programa PIR PALOP II / Projecto Consolidação das Capacidades da Administração Pública

INA – Instituto Nacional de Administração 67

• Kaiser-Meyer-Olkin: quantifica
o nível de intercorrelações entre
as variáveis;
• Testa a hipótese de a matriz