Buscar

tmap_estatistica_1_aula(1)

Prévia do material em texto

ESTATÍSTICA 
 
 
Definições de Estatística 
Ciência que trata do 
delineamento, colheita, organização, 
sumarização, apresentação e análise 
de dados, bem como, na 
obtenção de conclusões válidas e 
tomada de decisões em diversos campos 
do conhecimento: engenharias, campo da 
saúde, biologia, farmácia, biofísica etc. 
ESTATÍSTICA 
 
 Estatística é o estudo das 
populações, das variações e dos 
métodos de redução de dados (R. 
A. Fisher) 
Considerações Importantes 
Uma etapa importante no trabalho 
científico é a divulgação à comunidade 
dos resultados obtidos. 
 
É assim que a contribuição do trabalho 
ao patrimônio científico da humanidade é 
colocada à disposição de todos. 
Essa divulgação é feita em revistas 
científicas especializadas de circulação 
nacional e internacional e obedece a 
certos padrões na sua apresentação. 
Durante os cursos de graduação e pós-
graduação (não importa a carreira 
escolhida), muitos, provavelmente, terão 
alguma bolsa de pesquisa, farão algum 
estágio e principalmente publicarão 
trabalhos em revistas científicas. 
 
 
Considerações Importantes (cont.) 
Tais atividades requerem do aluno a 
apresentação de seu trabalho (resultados) 
de forma compatível com os padrões 
acadêmicos nacionais e internacionais. 
Além disso, na atividade profissional de 
cada um, certamente haverá a necessidade 
de apresentar relatórios, projetos e estudos 
desenvolvidos para seus clientes. 
EVOLUÇÃO HISTÓRICA DA 
ESTATÍSTICA 
 Não basta a observação dos fenômenos, é 
 preciso estudar as causas, para que daí se 
chegue à determinação das leis segundo as 
 quais uma certa causa produz um determinado 
efeito. 
 Nascida como uma simples compilação de 
números, a Estatística evoluiu até hoje como um 
poderoso instrumento para pesquisar as 
ligações existentes entre os fenômenos. 
 http://www.ime.usp.br/~daniest/historia.pdf 
http://www.ime.usp.br/~daniest/historia.pdf
 A origem da Estatística pode ser buscada desde 
a época antes de Cristo, onde eram feitas 
simples enumerações para atender às 
necessidades do momento. 
 No tempo dos romanos, já havia uma tentativa 
de registro e o nascimento de Jesus Cristo 
aconteceu sua Família encaminhava-se para 
sua cidade natal, para ser recenseada. 
 Hoje a Estatística prova que é uma poderosa 
ferramenta necessária e indispensável no 
tratamento de grande quantidade de 
informações ou na tomada de decisões, 
baseada na inferência amostral. 
Desenvolvimento 
 PRIMEIRA FASE 
 
 Estados ordenaram estudos 
para melhor conhecerem 
determinadas características 
da população. 
 
 
 TERCEIRA FASE 
 
 Desenvolvimento do Cálculo 
de Probabilidades e o Início do 
uso da Inferência Estatística. 
 SEGUNDA FASE 
 
 Análise de observações 
numéricas de saúde pública, 
nascimentos, mortes e 
comércio para criar leis 
quantitativas com o intuito de 
traduzir fenômenos sociais e 
políticos. 
 
 
 QUARTA FASE 
 
 Início de uma dependência de 
diversas áreas do saber com a 
Estatística. 
Fluxo Necessário para Resultados 
Consistentes 
Importância do Fluxo 
O papel da Estatística na pesquisa 
científica é contribuir com o investigador 
 
-na formulação das hipóteses estatísticas e 
fixação das regras de decisão, 
 
- no fornecimento de técnicas para um eficiente 
delineamento de pesquisa, 
 
- na colheita, tabulação e análise dos dados 
(estatística descritiva) 
 
- e em fornecer testes de hipóteses a serem 
realizados, de tal modo que a incerteza da 
inferência possa ser expressa em um nível 
probabilístico pré-fixado (inferência 
estatística) 
 
 
Observações Importantes: 
Como as informações provêm de um conjunto 
menor que a população, cometem-se erros ao 
se fazer uma inferência. 
 
Esses erros são quantificados por um valor 
numérico, denominado probabilidade. 
 
O erro mencionado neste contexto não deve 
ser confundido com engano, erro de 
mensuração. É conseqüência inevitável da 
tentativa de generalizações ou da flutuação de 
amostra para amostra. 
Amostra e População 
• População (universo) = conjunto de 
todos os possíveis valores de uma 
variável ou característica. 
 
• Amostra = conjunto de observações 
extraída de uma população. 
Tipos de amostras e amostragem 
Amostragens 
Não probabilísticas 
Básicas: 
1. Conveniência( acidental) 
2. Intencional (julgamento) 
3. Cotas (proporcional) 
 
Variações 
1. Tráfego 
2. Autogerada 
3. Desproporcional 
Probabilísticas 
 
1.Aleatória simples 
2.Aleatória estratificada 
3.Conglomerado 
1. Sistemática 
2. Área 
 
Não probabilísticas 
Probabilísticas 
Cada elemento da população tem uma chance 
conhecida e diferente de zero de ser selecionado 
para compor a amostra 
• A seleção dos elementos da população são para 
compor a amostra depende, ao menos em parte, 
do julgamento do pesquisador ou do entrevistador 
no campo. 
• Não há nenhuma chance conhecida de que um 
elemento qualquer da população venha a fazer 
parte da amostra. 
Tipos de amostras e amostragem 
Tipos de amostras e amostragem 
Qual processo de amostragem escolher? 
 O problema e objetivo de pesquisa 
 O tipo de pesquisa 
 A acessibilidade aos elementos da população 
 A disponibilidade ou não de ter os elementos da população em um rol 
 A representatividade desejada ou necessária 
 A oportunidade apresentada pela ocorrência de fatos ou eventos 
 A disponibilidade de tempo 
 recursos financeiros e humanos 
 etc etc etc 
Deve-se levar em 
conta... 
Tipos de amostras e amostragem 
Razões para o uso de amostragens não probabilísticas 
• poder ser a de não existir outra alternativa viável (a população toda não está 
disponível para ser sorteada) 
• a amostragem probabilística é tecnicamente superior na teoria, mas na prática, 
ocorrem problemas em sua aplicação que enfraquecem essa superioridade 
• a obtenção de uma amostra de dados que reflita precisamente a população 
não seja o propósito principal da pesquisa: não há intenção de generalizar os 
dados obtidos na amostra para toda a população 
• não disponibilidade de tempo e recursos financeiros, materiais e humanos 
necessários para a realização de uma pesquisa com amostragem probabilística 
• os dados sobre a população(número, listagens, etc) não são ou não estão 
disponíveis 
Amostragem não probabilística 
Por conveniência 
• Os entrevistados são escolhidos por conveniência dos pesquisador (se encontram 
no lugar exato no momento certo) 
• é a menos confiável 
• é barato e simples 
• utiliza-se para testar ou para obter idéias sobre determinado assunto de interesse 
• prestam-se muito bem aos objetivos da pesquisa exploratória 
Exemplos: uso de estudantes, grupos de igrejas, membros de organizações sociais, 
lojas de departamentos, questionários destacáveis em revistas, entrevistas com 
“pessoas na rua”. 
Intencionais 
• São selecionados com base no julgamento do pesquisador, que usando sua 
experiência, escolhe os elementos a serem incluídas na amostra. 
Exemplos: testes de mercado para determinar potencial de um novo produto, 
seleção de distritos eleitorais representativos para uma pesquisa de voto. 
Amostragem não probabilística 
Por quotas 
Um dos métodos de amostragem mais comumente usados em levantamentos de 
mercado e em prévias eleitorais. Ele abrange três fases: 
1ª - classificação da população em termos de propriedades que se sabe, ou 
presume, serem relevantes para a característica a ser estudada; 
2ª - determinação da proporção da população para cada característica, com base na 
constituição conhecida, presumida ou estimada, da população; 
3ª - fixação de quotas para cada entrevistador a quem tocará a responsabilidade de 
selecionar entrevistados, de modo que a amostra total observada ou entrevistada 
contenha a proporção e cada classe tal como determinada na 2ª fase. 
Exemplo: Numa pesquisa sobre o "trabalho dasmulheres na atualidade". 
Provavelmente se terá interesse em considerar: a divisão cidade e campo, a 
habitação, o número de filhos, a idade dos filhos, a renda média, as faixas etárias 
etc. 
A primeira tarefa é descobrir as proporções (porcentagens) dessas características 
na população. Imagina-se que haja 47% de homens e 53% de mulheres na 
população. Logo, uma amostra de 50 pessoas deverá ter 23 homens e 27 mulheres. 
Então o pesquisador receberá uma "quota" para entrevistar 27 mulheres. A 
consideração de várias categorias exigirá uma composição amostral que atenda ao 
n determinado e às proporções populacionais estipuladas. 
Amostragem probabilística 
Probabilística simples(Aleatória simples) - AAS 
Cada elemento da população tem uma chance conhecida, diferente de zero, idêntica 
à dos outros elementos, de ser selecionado para compor a amostra 
Uma amostra de tamanho n  Retirada de uma população de tamanho 
N  toda amostra possível de tamanho n tenha a mesma 
probabilidade de ser selecionada  Cada elemento da população terá 
a mesma probabilidade de pertencer à amostra. 
Para selecionar de uma amostra aleatória simples precisamos ter uma 
lista completa de unidades amostrais). 
 
Amostragem probabilística 
Probabilística simples(Aleatória simples) -AAS 
EXEMPLO: 
Para realizar a seleção das unidades amostrais, devemos inicialmente atribuir 
um número a cada uma delas. 
QUADRO 1 – POPULAÇÃO DE CLIENTES 
Leonardo Fabiano Eric Kátia 
Renne Shirlei Paulo Danielle 
Mariana Valeria Renato Andréa 
Leandro Neila Antonio Claudia 
Jurandir Jose Pires Maria Tereza Renata 
Fernando Diego Aparecida Maristela 
Luis Carlos Emanuel Alessandra Flavia 
Fabio Marcelo Juliana Sandra 
 
Extraindo uma amostra, por exemplo, de tamanho n = 5, de forma 
aleatória, poderíamos ter a seguinte configuração: 
{02, 12, 32, 26, 9}  {Renne, Neila, Sandra, Danielle, Fabiano} 
QUADRO 2 – POPULAÇÃO DE CLIENTES 
01 Leonardo 09 Fabiano 17 Eric 25 Kátia 
02 Renne 10 Shirlei 18 Paulo 26 Danielle 
03 Mariana 11 Valeria 19 Renato 27 Andréa 
04 Leandro 12 Neila 20 Antonio 28 Claudia 
05 Jurandir 13 Jose Pires 21 Maria Tereza 29 Maristela 
06 Fernando 14 Diego 22 Aparecida 30 Flavia 
07 Luis Carlos 15 Emanuel 23 Alessandra 31 Renata 
08 Fabio 16 Marcelo 24 Juliana 32 Sandra 
 
Amostragem probabilística 
Probabilística simples(Aleatória simples) 
Amostragem probabilística 
Consiste na divisão da população em subgrupos internamente homogêneos 
e, externamente heterogêneos,, com respeito às variáveis em estudo. 
Escolhidos os diversos estratos  Seleção de uma AAS em cada estrato de 
forma independente. 
 
Amostragem Aleatória Estratificada 
– AAE 
Amostragem probabilística 
Amostragem Aleatória Estratificada 
– AAE 
Caso particular de AAS  A proporcionalidade do tamanho de cada estrato 
da população é mantida na amostra. 
 
Amostragem probabilística 
Amostragem Aleatória Estratificada 
– AAE 
População de clientes, segundo a loja e o valor gasto na compra 
Loja Cliente 
Valor da 
compra Loja Cliente 
Valor da 
compra Loja Cliente 
Valor da 
compra 
A1 18 B1 35 C1 60 
A2 26 B2 40 C2 65 
A3 20 B3 45 C3 68 
A4 28 B4 50 C4 70 
A5 25 B5 55 C5 75 
A6 30 B6 50 C6 70 
A7 30 B7 45 C7 70 
A8 25 B8 40 C8 75 
A9 18 B9 40 C9 65 
A 
A10 20 B10 40 C10 60 
 B11 35 C11 60 
 B12 35 C12 65 
 B13 50 C13 65 
 B14 50 
C 
C14 68 
 B15 45 
 
B 
B16 45 
 
Exemplo 
Vamos supor que obtivemos {A3, A6, A2, A8} para o estrato correspondente 
à Loja A. A amostra {B3, B1, B15, B12, B9, B10} para o estrato 
correspondente à Loja B atletismo e a amostra {C11, C14, C4, C7, C5} para 
o estrato correspondente à Loja C. 
TABELA 1 – CÁLCULO DO TAMANHO DA AMOSTRA EM CADA 
ESTRATO 
 
Loja 
 
Proporção na População 
Tamanho do subgrupo 
na amostra 
A 10/40 = 0,25 ou 25% 15  0,25 = 3,8 4 
B 16/40 = 0,40 ou 40% 15  0,40 = 6 
C 14/40 = 0,35 ou 35% 15  0,35 = 5,3  5 
 
Amostragem probabilística 
Amostragem Aleatória Estratificada 
– AAE 
Consiste na divisão da população em subgrupos internamente heterogêneos 
e externamente homogêneo, com respeito às variáveis em estudo. 
Escolhidos os diversos estratos  Seleção de uma AAS em cada 
conglomerado. 
Amostragem Aleatória por Conglomerados (cluster) – AAC 
Ex.: Uma amostra de eleitores pode ser obtida pelo sorteio de um número de 
domicílios, trabalhadores por uma amostra de empresas ou estudantes por 
uma amostra de escolas ou classes. O que caracteriza bem o planejamento 
amostral de conglomerados é que a unidade amostral contém mais de um 
elemento da população. 
n
N
k 
N = Tamanho da população; 
n = Tamanho da amostra. 
Requer uma listagem dos itens da população. Se os itens da lista não se 
apresentam numa ordem determinada, a amostragem sistemática pode dar 
uma amostra realmente aleatória, escolhendo-se cada k-ésimo item da 
lista, onde: 
EXEMPLO: N=32 n=5 = k=32/5=6,4  k  6 
Vamos supor que o número “03” é o sorteado(entre 1 a 6), ou seja, o primeiro 
cliente da amostra é a “Mariana”. Os demais são obtidos pelo intervalo de seleção 
“6”, a partir da Mariana, resultando na seguinte amostra: 
 (3) (9) (15) (21) (27) 
 {Mariana, Fabiano, Emanuel, Maria Tereza, Andréa} 
Amostragem Sistemática 
Amostragem probabilística 
DIMENSIONAMENTO DA AMOSTRA: 
• Tamanho da Amostra para Estimar a Média populacional (): 
222
22
z e)1N(
 z N
n



• Tamanho da Amostra para Estimar a Proporção populacional (p): 
2
22
e
 z 
n


N = Tamanho da população; 
Z2 = Ponto da distribuição normal padrão; 
2 = Variância populacional; 
e = Erro de estimação. 
2
2
e
qp z 
n


N = Tamanho da população; 
Z2 = Ponto da distribuição normal padrão; 
p = Proporção populacional da característica 
Estudada  q = 1 – p; 
e = Erro de estimação. 
Amostragem probabilística 
qpze)1N(
qpzN
n
22
2




EXEMPLO: Um banco privado deseja realizar uma pesquisa para estimar a proporção de 
funcionários que estão interessados em aderir ao Plano de Demissão Voluntária (PDV), 
a ser implementado pela empresa. Nesse banco existem 500 funcionários onde, em 
pesquisas anteriores sobre o grau de satisfação em relação às condições de trabalho, foi 
constatado que 30% deles não estavam satisfeitos com tais condições. 
 
Para determinarmos o tamanho da amostra, necessário para estimar p (proporção 
populacional de funcionários que querem aderir ao PDV), com um erro de 5% em ambos 
os sentidos, com 95% de confiança, podemos utilizar a proporção de funcionários 
insatisfeitos com as condições de trabalho oferecidas pelo banco para estimar p (p = 
30% = 0,3), partindo da suposição que os insatisfeitos tendem a aderir ao PDV. 
 
Sabe-se que: 
N = 500 
p = 0,3  1 – p = 0,7 
e = 0,05 
Z = 1,96 
 n  197 funcionários. 
 
4,196
)7,03,096,1()05,0()1500(
7,03,0)96,1(500
n
22
2




Amostragem probabilística

Continue navegando