Buscar

Estatística - Aula 01 (Conceitos)


Continue navegando


Prévia do material em texto

18/02/2014
1
ESTATÍSTICA PARA 
ADMINISTRAÇÃO
1º Semestre de 2014
Profª. Luciana B Nucci
Por que utilizar a Estatística?
� Formulação de suposições construtivas sobre eventos 
futuros de nossa vida => planos para novas situações ou 
experiências
� Explicar e predizer o comportamento humano
� Examinando características (variáveis) que diferem ou variam 
de um indivíduo para outro (idade, classe social, 
comportamento) ou de um instante para outro no decorrer 
do tempo (desemprego, taxa de criminalidade, população)
Métodos de Pesquisa
� Experimento
� Pesquisa Tipo Survey
� Análise de conteúdo
� Observação participativa
� Análise secundária
Experimento
� Controle do pesquisador
� Grupo experimental vs grupo controle
� Pesquisador divide aleatoriamente os grupos
� ‘Aplica’ o experimento
� Analisa o resultado
� Exemplo: frustração x agressividade
Pesquisa tipo Survey
� Retrospectiva – registro após ocorrência
� Investiga-se um número maior de variáveis
� Melhor generalização
� Amostra da população
Análise de Conteúdo
� Pesquisador descreve o conteúdo de mensagens 
previamente elaboradas
� Não se observa diretamente, estuda-se conteúdo de 
livros, revistas, jornais, filmes, programas de rádio, 
fotografias, desenhos, cartas, propaganda política ou 
música
� Exemplo: estudo sobre capa da revista People de 1974 a 
1998
� 1974 (1º ano) < 3% - razões negativas
� 1988 – quase metade enfocava características desfavoráveis
18/02/2014
2
Observação Participativa
� Pesquisador “participa da vida cotidiana das pessoas 
sujeitas ao estudo, seja abertamente, no papel de 
pesquisador, ou de maneira velada, sob algum disfarce, 
observando o que ocorre, ouvindo o que é dito ou 
interrogando pessoas durante certo período de tempo” 
(Becker & Geer, 1970)
� Exemplo: músicas heavy-metal início (anos 80/90)
Análise Secundária
� Pesquisador utiliza informações já coletadas
� Informações provém de fontes do governo, agências 
particulares ou mesmo faculdades e universidades
� Mais rápida e fácil, portanto limita-se ao que foi coletado
� Exemplos de fontes de dados: IBGE, Fundação SEADE
Estatística = Números?
� Plano nacional contra a obesidade quer avançar na publicidade de 
alimento (Fonte: Folha online de 07/08/2012)
� A obesidade infantil está no centro de um debate que coloca, de um lado, a 
indústria de alimentos e suas guloseimas e, do outro, as organizações de 
direito do consumidor e sociedades médicas. 
� A causa da discórdia é a publicidade de alimentos para crianças no Brasil, se 
seria ou não um dos fatores responsáveis pelo crescimento assustador dos 
índices de obesidade infantil no país. 
� O IBGE mostrou aumento de mais de 200% na incidência de 
sobrepeso entre crianças de cinco a nove anos nas últimas três 
décadas. Para especialistas, é uma tendência comparável à epidemia de 
obesidade nos EUA. 
Estatística = Números?
� Plano nacional contra a obesidade quer avançar na publicidade de 
alimento (Fonte: Folha online de 07/08/2012)
� ... Segundo Rafael Sampaio, vice-presidente da Associação Brasileira de 
Anunciantes, não há evidências precisas sobre o papel da publicidade na 
obesidade infantil. 
� "Um estudo encomendado pelo governo britânico mostrou que há dezenas de 
fatores que contribuem para o aumento da obesidade e a propaganda é só um 
deles, e nem é o mais influente", diz. 
� Outro dado que ele cita é da província de Québec, no Canadá, onde a 
publicidade para crianças é proibida há 30 anos. "Um estudo de 2004 
demonstrou que o índice de obesidade das crianças nessa província 
era de 7%, contra 8% do restante do país." 
� ... estudo de 2004 obesidade ... de 7%, contra 8% do restante do país." 
� Fatos numéricos contidos nas informações dadas denominam-se 
estatísticas
Estatística
� “Estatística é um conjunto de métodos e processos quantitativos 
que serve para estudar e medir os fenômenos coletivos” DUGÉ DE
BERNONVILLE
� A palavra estatística provém do latim status (estado) e é 
comumente associada a censos, pesquisas de opinião pública, 
aos vários índices governamentais, aos gráficos e médias 
publicadas diariamente na imprensa. Na realidade, como 
veremos adiante, a estatística engloba muitos outros aspectos.
Estatística
� Ciência que se preocupa com a organização, descrição, análise 
e interpretação dos dados experimentais
� Plural (estatísticas) => coleção consistente de dados
numéricos, reunidos com a finalidade de fornecer informações
sobre uma atividade qualquer
� Singular
� Atividade humana especializada
� Conjunto de técnicas
18/02/2014
3
Estágios de uma Pesquisa
1. O problema a ser estudado é reduzido a uma hipótese passível de 
teste (por exemplo, ‘famílias com apenas um pai geram maior 
delinquência do que famílias com pai+mãe’)
2. Elabora-se um conjunto apropriado de instrumentos (questionário 
ou esquema de entrevistas)
3. Coletam-se os dados (pesquisador sai a campo e faz a pesquisa)
4. Os dados são analisados quanto a sua influência sobre a hipótese 
inicial
5. Os resultados da análise são interpretados e comunicados a um 
público (conferência ou imprensa)
Estatística
� Metodologia desenvolvida para:
� Coleta
� Classificação
� Apresentação
� Análise
� Interpretação de dados quantitativos
� Utilização desses dados na tomada de decisões
Resumindo...
� No uso diário o termo
estatística(s) refere-se a fatos
numéricos
� Sentido amplo: Estatística é a
arte e a ciência de coletar,
analisar apresentar e interpretar
dados
� Transformar dados em
informação
Exemplo
� Uma pesquisa com assinantes norte-americanos indicou 
que 90% dos assinantes as Bussiness Week têm 
computadores em casa e que 64% articulam a compra de 
um computador no trabalho
� Artigos relacionados à informática
� Apresentação à potenciais assinantes
� Apresentação à potenciais anunciantes
Estatística
� A estatística divide-se em:
� Descritiva: preocupa-se com a organização e descrição dos
dados experimentais
� Indutiva (Estatística Inferencial ou Inferência Estatística): cuida
da análise e interpretação dos dados
População
� População ou universo, é um conjunto de elementos com pelo 
menos uma característica comum
� Essa característica deve delimitar inequivocamente quais os 
elementos que pertencem à população e quais os que não 
pertencem (Costa Neto, 1977)
� É o conjunto constituído por todos os indivíduos que apresentem 
pelo menos uma característica comum cujo comportamento 
interessa analisar (Toledo & Ovalle, 1985)
18/02/2014
4
Amostra
� É um subconjunto de uma população, necessariamente finita,
pois todos os seus elementos serão examinados para efeito da
realização do estudo estatístico desejado
(Costa Neto, 1977)
� Pode ser definida como um subconjunto, uma parte 
selecionada da totalidade de observações abrangidas pela 
população, através da qual se faz um juízo, ou inferência sobre 
as características da população
População vs Amostra
X
X
X
X
X
X
X
X
X
População vs Amostra
X
X
X
X X
X
X
X
X
X
Amostra 
enviesada
da população
TÉCNICAS DE AMOSTRAGEM
Amostragem Probabilística
(Aleatória)
Amostragem Não Probabilística
(Não Aleatória)
1. Aleatória (casual) Simples
2. Sistemática
3. Estratificada
4. Por Conglomerados
1. A esmo
2. Intencional (por julgamento)
3. Por Cotas
4. Bola de Neve
Fonte: http://www.inf.ufsc.br/~marcelo/Cap7.pdf
Amostragem Probabilística
� A amostragem probabilística também é chamada de aleatória
ou casual.
� A sua importância decorre do fato de que apenas os
resultados provenientes de uma amostra probabilística podem
ser generalizados estatisticamente para a população da
pesquisa
� O que significa estatisticamente? Significaque podemos
associar aos resultados uma probabilidade de que estejam
corretos, ou seja uma medida da confiabilidade das conclusões
obtidas. Se a amostra não for probabilística não há como saber
se há 95% ou 0% de probabilidade de que os resultados sejam
corretos, e as técnicas de inferência estatística porventura
utilizadas terão validade questionável
Amostragem Probabilística
� Condição primordial para uso da amostragem probabilística: "todos os 
elementos da população tenham uma probabilidade maior do que zero de 
pertencerem à amostra". Tal condição é materializada se: 
� Há acesso a toda a população. Ou seja, não há teoricamente problema em 
selecionar nenhum dos elementos, todos poderiam ser pesquisados
� Há possibilidade de obter uma listagem dos elementos da população. Se 
pensarmos em uma pesquisa de opinião, seria uma listagem com todos os 
possíveis respondentes
� Os elementos da amostra são selecionados através de alguma forma de 
sorteio não viciado: tabelas de números aleatórios, números pseudo-
aleatórios gerados por computador. Com a utilização de sorteio elimina-se 
a ingerência do pesquisador na obtenção da amostra, e garante-se que 
todos os integrantes da população tem probabilidade de pertencer à 
amostra
18/02/2014
5
1. Amostragem Aleatória (casual) Simples
1. Casual ou Aleatória Simples: equivalente a um sorteio, é 
utilizada quando a população encontra-se desordenada, 
sendo que por essa técnica, qualquer elemento tem a 
mesma chance de ser sorteado
- Quando a população é relativamente pequena (até 30, por 
exemplo), pode-se numerar os elementos e em seguida, 
realizar o sorteio.
- Tratando-se de uma quantidade grande, o processo de 
numeração torna-se trabalhoso. Deve-se usar um 
processo com números aleatórios.
Geração de Números Aleatórios
2. Amostragem Sistemática
� Novamente é feito o sorteio, sendo que nessa 
amostragem os elementos da população já se encontram 
ordenados e, nesses casos, não é necessário se construir 
um sistema de referência (números aleatórios).
� Exemplos de populações ordenadas: fichas individuais de 
empregados (alfabética), casas de uma rua (número), 
notas fiscais (data), etc.
Exemplo 1 (Amostragem Sistemática)
� Suponhamos que uma empresa tenha 720 colaboradores em determinado 
setor, dentre os quais deseja-se uma amostra formada por 30 destes 
empregados
� Procedimento:
� 1. Determinar o intervalo de amostragem.
� Intervalo = População / Amostra = 720 / 30 = 24
� 2.Escolhemos, por sorteio, um número de 01 a 24 (inclusive).
� Este número indicará o primeiro elemento da amostra.
� Os demais elementos serão escolhidos em intervalos de 24 em 24.
� 3. Se o primeiro número sorteado for o 16, escolhemos os demais 
colaboradores relacionado com o primeiro elemento da amostra:
� 2º -> 16 + 24 = 40 3º->40 + 24 = 64 4º->64 + 24 = 88 ....
Exemplo 2 (Amostragem Sistemática)
� Uma operadora telefônica pretende saber a opinião de seus assinantes comerciais sobre seus 
serviços na cidade de Florianópolis. Supondo que há 25.037 assinantes comerciais, e a 
amostra precisa ter no mínimo 800 elementos, mostre como seria organizada uma 
amostragem sistemática para selecionar os respondentes. 
� A operadora dispõe de uma lista ordenada alfabeticamente com todos os seus assinantes, o intervalo 
de retirada será: 
� k = N/n = 25.037/800 = 31,2965 
� Como o valor de k é fracionário algo precisa ser feito. Aumentar o tamanho da amostra não resolverá 
o problema, porque 25.037 é um número primo. Como não podemos reduzir o tamanho de amostra, 
devendo permanecer igual a 800, se excluirmos por sorteio 237 elementos da população, e 
refizermos a lista teremos: 
� k = N/n = 24800/800 = 31 
� A cada 31 assinantes um é retirado para fazer parte da amostra. Devemos sortear o ponto de 
partida: um número de 1 a 31 (do 1o ao 31o assinante). Imagine que o sorteio resultasse em 5, 
então amostra seria (número de assinantes): 
� {5, 36, 67, 98, ...., 24774} 
3. Amostragem Estratificada
� Utilizada quando a população encontra-se dividida em estratos (ou camadas, faixas, intervalos, 
etc). Ex: sexo; idade (criança, adolescente, adulto e idoso); setores de uma empresa (adm., 
vendas, tesouraria, serviços gerais, etc); Cursos de uma faculdade (C. Contábeis, Adm., Direito, 
Enfermagem, etc); Faixa salarial (até 1 SM, de 1 a 2 SM, de 2 a 4 SM, acima de 4 salários-
mínimos)
� Ex.: pesquisa eleitoral para governador - opinião difere dependendo da idade, classe social e mesmo profissão 
dos entrevistados. Contudo podemos supor que haja certa homogeneidade de opinião dentro de cada grupo. 
Então se supõe que haja heterogeneidade entre os estratos, mas homogeneidade dentro dos estratos, e que 
eles sejam mutuamente exclusivos (cada elemento da população pode pertencer a apenas um estrato). Para 
garantir que a amostra seja representativa da população precisamos garantir que os diferentes estratos sejam 
nela representados. 
� A seleção dos elementos de cada estrato pode ser feita usando amostragem aleatória simples 
ou sistemática
� A amostragem estratificada pode ser: 
� proporcional, quando o número de elementos selecionados de cada estrato é proporcional ao seu tamanho na 
população (por exemplo, se o estrato representa 15% da população, 15% da amostra deverá ser retirada dele); 
� uniforme, quando o mesmo número de elementos são selecionados de cada estrato. 
� A amostragem estratificada proporcional possibilita resultados melhores, mas exige um grande 
conhecimento da população (para saber quantos são e quais são os tamanhos dos estratos). A 
amostragem estratificada uniforme é mais usada em estudos comparativos
18/02/2014
6
Estrato 
(Nacionalidade)
População Cálculo 
Proporcional
Valor Amostra
Argentina 45 45 x 12,766% 5,745 6
Boliviana 18 18 x 12,766% 2,298 3
Colombiana 31 31 x 12,766% 3,957 4
Total 94 - - 13
Exemplo 1: (Amostragem Estratificada proporcional)
� Será realizada uma pesquisa, a partir de uma amostra, de 12 pessoas. 
Essa pessoas compõem um grupo de 94 que farão parte de uma 
expedição na Amazônia, sendo: 45 argentinos, 18 bolivianos e 31 
colombianos. Determinar a quantidade de pessoas de cada 
nacionalidade que responderá a pesquisa
� Calcula-se primeiramente percentual da amostra:
� % amostra = amostra / população x 100 = 12/94 x 100 = 12,766%
4. Amostragem por conglomerados
� Os conglomerados também são grupos mutuamente exclusivos de 
elementos da população, mas são definidos de forma mais arbitrária do que 
os estratos: é bastante comum definir os conglomerados geograficamente. 
Por exemplo, os bairros de uma cidade, que constituiriam conglomerados 
de domicílios.
� O procedimento para a amostragem por conglomerados: 
� divide-se a população em conglomerados; 
� sorteiam-se os conglomerados (usando tabela de números aleatórios ou qualquer 
outro método não viciado); 
� pesquisam-se todos os elementos dos conglomerados sorteados, ou sorteiam-se 
elementos deles. 
4. Amostragem por conglomerados
� Exemplo: Pesquisa Nacional por Amostra de Domicílios (PNAD) do IBGE. 
Coleta informações demográficas e sócio-econômicas sobre a população 
brasileira. Utiliza amostragem por conglomerados. 
� Primeiro estágio: amostras de municípios (conglomerados) para cada uma 
das regiões geográficas do Brasil; 
� Segundo estágio: setores censitários sorteados em cada município 
(conglomerado sorteado); 
� Terceiro estágio: domicílios sorteados em cada setor censitário. 
� A utilização de amostragem por conglomerados permite uma redução 
substancial nos custos de obtenção da amostra, sem comprometer em 
demasia a precisão, e em alguns casos é a única alternativa possível. 
Técnicas de Amostragem Não Probabilística
� A obtenção de uma amostra probabilística exige que se obtenha uma 
listagem com os elementosda população. Em suma, exige acesso a todos os 
elementos da população, que a população acessível seja igual à população 
alvo. Nem sempre é possível obter tal listagem na prática, o que 
teoricamente inviabilizaria a retirada de uma amostra aleatória. Então deve-
se recorrer à amostragem não probabilística. 
� Ao usar a amostragem não probabilística o pesquisador não sabe qual é a 
probabilidade de um elemento da população tem de pertencer à amostra. 
Portanto, os resultados da amostra não podem ser estatisticamente 
generalizados para a população, porque não se pode estimar o erro 
amostral. Se as características da população acessível forem semelhantes às 
da população alvo os resultados podem ser equivalentes aos de uma 
amostragem probabilística, mas não podemos garantir a sua confiabilidade.
Técnicas de Amostragem Não Probabilística
� Alguns dos usos habituais da amostragem não probabilística são os seguintes: 
� Como etapa preliminar em projetos de pesquisa; 
� em projetos de pesquisa qualitativa; 
� em casos onde a população de trabalho não pode ser enumerada. 
1. Amostragem a esmo. Neste caso o pesquisador procura ser o mais 
aleatório possível, mas sem fazer um sorteio formal. Imagine um lote de 
10000 parafusos, do qual queremos tirar uma amostra de 100, se fôssemos 
realizar uma amostragem aleatória simples o processo seria muito trabalhoso. 
Então simplesmente retiramos os elementos a esmo. 
2. Amostragem por julgamento (intencional). O pesquisador 
deliberadamente escolhe alguns elementos para fazer parte da amostra, com 
base no seu julgamento de aqueles seriam representativos da população. Este 
tipo de amostragem é bastante usado em estudos qualitativos. Obviamente o 
risco de obter uma amostra viciada é grande, pois se baseia totalmente nas 
preferências do pesquisador, que pode se enganar (involuntária ou 
"voluntariamente")
Técnicas de Amostragem Não Probabilística
� Amostragem por cotas. Parece semelhante a uma amostragem 
estratificada proporcional, da qual se diferencia por não empregar sorteio 
na seleção dos elementos. A população é dividida em vários subgrupos, na 
realidade é comum dividir em um grande número para compensar a falta 
de aleatoriedade, e seleciona-se uma cota de cada subgrupo, proporcional 
ao seu tamanho. 
� Por exemplo, em uma pesquisa de opinião eleitoral poderíamos dividir a população 
de eleitores por sexo, nível de instrução, faixas de renda entre outros aspectos, e 
obter cotas proporcionais ao tamanho dos grupos (que poderia ser obtido através 
das informações do IBGE). Na amostragem por cotas os elementos da amostra são 
escolhidos pelos entrevistadores (de acordo com os critérios...), geralmente em 
pontos de grande movimento, o que sempre acarreta certa subjetividade (e impede 
que qualquer um que não esteja passando pelo local no exato momento da pesquisa 
possa ser selecionado). Na prática muitas pesquisas são realizadas utilizando 
amostragem por cotas. 
18/02/2014
7
Técnicas de Amostragem Não Probabilística
� Amostragem "bola de neve". "Particularmente importante quando é 
difícil identificar respondentes em potencial. A cada novo respondente que 
é identificado e entrevistado, pede-se que identifique outros que possam 
ser qualificados como respondentes". 
� Há ainda a amostragem por conveniência (selecionam-se elementos 
supostos semelhantes à população, e que estão disponíveis) e a de 
passantes eventuais (selecionam-se aqueles que estejam passando pelos 
pesquisadores no momento; é comum conjugar este tipo com a 
amostragem por cotas). 
Conceitos Fundamentais
ELEMENTO, VARIÁVEL, OBSERVAÇÃO, CASO
� Elemento é cada uma das unidades consideradas no estudo
� Um conjunto de dados é composto por informações sobre as
características de interesse de cada elemento
� Variável é uma característica de interesse que se pode medir
� O nome Variável está relacionado ao fato desta característica 
apresentar distintos valores dependendo do elemento. Ex: 
idade, sexo, margem de lucro bruto, ... 
Conceitos Fundamentais
ELEMENTO, VARIÁVEL, OBSERVAÇÃO, CASO
� Observação é a informação sobre a variável para um elemento
específico
� Caso é o conjunto de observações de um elemento
determinado
Tabela: Conhecimento da Margem de Lucro Bruto da
Empresa
Nome Idade Sexo Margem de Lucro Bruto 
da Empresa (%)
José 26 M 36,7
Maria 37 F 59,3
Mário 28 M 44,8
Sheila 36 F 23,8
Josué 38 M 53,3
Carlos 38 M 4,1
Mariana 39 F 35,9
Variáveis
Elemento Observação
Caso
Dados Qualitativos nominais
� São aqueles nos quais os valores são classificados em
categorias ou classes não-ordenadas
� Exemplos: sexo, cor da pele
� Quando podem assumir um entre dois valores distintos – tal
como Homem e Mulher – são chamados dicotômicos ou
binários
Dados Qualitativos ordinais
� Quando a ordem entre as categorias se torna importante, as 
observações são referenciadas como dados ordenados
� Não há preocupação com a magnitude dos números
� Classificação de satisfação:
1 = Muito satisfeito
2 = Satisfeito
3 = Indiferente
4 = Insatisfeito
18/02/2014
8
Dados Quantitativos discretos
� Ordenação e magnitude são importantes
� Os números representam quantidades mensuráveis reais
� Dados estão restritos a ter somente valores específicos –
freqüentemente inteiros ou contagens. Neste caso, nenhum
valor intermadiário é possível
� Exemplos
1. Número de vezes que o cliente foi atendido no call
center
2. Número de pedidos com mais de 5 dias de atraso
Dados Quantitativos Discretos
� Para os dados discretos existe uma ordem natural
entre os valores possíveis
� Se estamos interessados no número de vezes que o
cliente foi atendido no call center, podemos começar a
analisar os clientes que mais ligam
Dados Quantitativos contínuos
� Dados que representam quantidades mensuráveis, 
mas que não são restritos a assumir certos valores 
especificados, são conhecidos como dados contínuos
� Exemplos
� Tempo
� Temperatura
� PIB
Tipos de Dados vs Variáveis
� Variável Qualitativa (ou Categórica)
� Nominal
� Ordinal
� Variáveis Quantitativa (ou Numérica)
� Discreta
� Contínua
Dados de Seção Transversal
e de Série Histórica
� Dados de Seção Transversal
� São dados coletados no mesmo intervalo de tempo 
(aproximadamente)
� Dados de Série Histórica
� São dados coletados ao longo de diversos períodos. Ex. 
cotação do dólar nos últimos 6 anos. 
Exemplo de Série de dados
R$0
R$100
R$200
R$300
R$400
R$500
R$600
R$700
R$800
Evolução do Salário Mínimo (em R$) de 1994 a 2014