Buscar

Apostila 01

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 7 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 7 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

1
INTRODUÇÃO À ESTATÍSTICA 
 
- Aspectos gerais 
 
A estatística é uma coleção de métodos para planejar experimentos, 
obter dados e organizá-los, resumi-los, analisá-los, interpretá-los e deles extrair 
informações. 
A coleta, a organização e a descrição dos dados estão a cargo da 
Estatística Descritiva, enquanto a análise e a interpretação desses dados 
ficam a cargo da Estatística Indutiva ou Inferencial. 
Em geral, as pessoas, quando se referem ao termo estatística, o fazem 
no sentido da organização e descrição dos dados, desconhecendo que o 
aspecto essencial da Estatística é o de proporcionar métodos inferenciais, que 
permitam conclusões que transcendam os dados obtidos inicialmente. 
Ela abrange muito mais do que o simples traçado de gráficos e o cálculo 
das médias. 
Em estatística, utilizamos extensamente os termos população e amostra. 
Esses termos, que passamos a definir, estão no próprio cerne da estatística. 
 
 Uma população é uma coleção completa de todos os elementos 
(valores, pessoas, medidas, etc.) a serem estudados. 
 
 Um censo é uma coleção de dados relativos a todos os elementos de 
uma população. 
 
 Uma amostra é uma subcoleção de elementos extraídos de uma 
população. 
 
 Estreitamente relacionados com os conceitos de população e amostra 
estão os conceitos de parâmetro e estatística. 
 
 Um parâmetro é uma medida numérica que descreve uma característica 
de uma população. 
 
 Uma estatística é uma medida numérica que descreve uma 
característica de uma amostra. 
 
 
 
Exemplo 
 
 Em uma pesquisa com 1015 pessoas escolhidas aleatoriamente, 269 
(ou 26,5%) possuíam computador. Como a cifra de 26,5% se baseia em uma 
amostra, e não em toda a população, trata-se de uma estatística (e não um 
parâmetro). Já se uma pesquisa feita entre os 27 governadores do Brasil 
mostra que 20 (ou 74%) possuem computador, a cifra 74% é um parâmetro 
porque se baseia em toda a população de governadores. 
 
 
 
 2
- A natureza dos dados 
 
Alguns conjuntos de dados (como alturas) consistem em números, 
enquanto outros são não-numéricos (como sexo, cor dos olhos). 
Aplicam-se as expressões dados qualitativos e dados quantitativos para 
distinguir esses dois tipos. 
 
Os dados qualitativos (ou dados categóricos, ou atributos) podem 
ser separados em diferentes categorias que se distinguem por alguma 
característica não-numérica. 
 
Os dados quantitativos consistem em números que representam 
contagens ou medidas. Eles se subdividem em 2 tipos: discretos e contínuos. 
 
Os dados discretos resultam de um conjunto finito de valores 
possíveis, ou de um conjunto enumerável desses valores. (Ou seja, o 
número de valores possíveis é 0, ou 1, ou 2, etc). 
Os dados contínuos (numéricos) resultam de um número 
infinito de valores possíveis que podem ser associados a pontos em uma 
escala contínua de tal maneira que não haja lacunas ou interrupções. 
Quando os dados representam contagens, são discretos; quando 
representam mensurações, são contínuos. 
 
 
- Usos e abusos da estatística 
 
Usos da estatística 
 
Hoje praticamente todo campo se beneficia da utilização de métodos 
estatísticos. Vamos ver alguns exemplos: 
o Técnicas de controle de qualidade de um produto; 
o Controle de doenças; 
o Espécies ameaçadas são protegidas; 
o Redução de taxas fatais. 
 
Abusos da estatística 
 
Algumas vezes os dados são apresentados de forma enganosa. Isso 
constitui um abuso da estatística. Alguns dos que abusam da estatística o 
fazem por descuido ou ignorância; outros, porém, têm objetivos pessoais. 
Passemos a alguns exemplos das diversas maneiras como os dados 
podem ser distorcidos. 
o Pequenas amostras: As pequenas amostras não são 
necessariamente más; entretanto, os resultados obtidos com 
pequenas amostras podem por vezes ser usados como uma 
forma de “mentira” estatística. As preferências de 10 dentistas por 
determinado dentifrício não devem servir de base para uma 
afirmação generalizada como “A pasta detifrícia X é recomendada 
por 7 a cada 10 dentistas”. Mesmo que a amostra seja grande ela 
não deve ser tendenciosa. Não adianta se uma amostra for 
 3
grande mas se forem feitas conclusões acerca de sub-grupos 
desta amostra. 
 
o Números precisos: Às vezes, os próprios números podem ser 
enganosos. Uma cifra $37.735,29 pode parecer muito precisa 
enquanto que a cifra $37.700,00 não infunde o mesmo senso de 
precisão. No entanto, uma estatística com muitas casas decimais 
não é necessariamente precisa. 
 
o Estimativas por suposição: Estimativas por suposição podem 
apresentar erros substanciais. É preciso considerar a fonte da 
estimativa e a maneira como foi estabelecida. Quando o Papa 
visitou Miami, as fontes oficiais estimaram uma multidão de 
250.000 pessoas, mas utilizando fotos aéreas e grades chegou-
se a uma cifra mais precisa de 150.000 pessoas. 
 
o Porcentagens distorcidas: Por vezes utilizam-se porcentagens 
confusas ou distorcidas. Num anúncio de página inteira, a 
Continental Airlines anuncia que no caso de bagagens 
extraviadas se trata de uma área em que já melhoraram 100% 
nos últimos 6 meses. Em uma crítica a esta estatística, o New 
York Times interpretou corretamente uma melhora de 100% 
significando que não se extravia mais qualquer bagagem, o que 
não é verdade. 
 
o Cifras parciais: “Noventa por cento dos carros vendidos nos 
EUA nos últimos 10 anos ainda estão rodando.” Milhões de 
consumidores ficaram com a impressão de que os carros devem 
ter sido muito bem construídos para durarem tanto. O que o 
fabricante não mencionou é que 90% dos carros por ele vendidos, 
o foram nos últimos 3 anos. 
 
o Perguntas tendenciosas: As perguntas em uma pesquisa 
podem ser formuladas de modo a “sugerirem” uma resposta. Um 
exemplo famoso envolve o candidato à presidência dos EUA que 
formulou a seguinte pergunta em um questionário: “O presidente 
deve ter o poder de vetar as decisões do Congresso?” Noventa e 
sete por cento das respostas foram “sim”. Entretanto, esse 
percentual caiu para 57% quando a pergunta foi “ O presidente 
deve ter, ou não, o poder de vetar as decisões do Congresso?” 
Às vezes, até mesmo a ordem dos itens a serem considerados 
pode influenciar na resposta. 
 
o Gráficos enganosos: Muitos dispositivos visuais podem ser 
utilizados para exagerar ou diminuir a verdadeira natureza de um 
conjunto de dados. 
 
 4
0
100
200
300
400
500
600
700
800
Homens Mulheres
G
an
ho
 s
em
an
al
 m
ed
ia
no
 e
m
 
dó
la
re
s
 
 
 
o Pictográficos: Os desenhos de objetos, chamados pictográficos, 
também podem levar a erros. Ao desenhar objetos para ilustrar 
dados o artista pode criar falsas impressões. Por exemplo, se 
duplicarmos o lado de um quadrado, a área desse quadrado não 
é apenas duplicada e, sim quadruplicada. 
 
o Pressão do pesquisador: Quando se formulam perguntas a 
indivíduos pesquisados, esses freqüentemente dão respostas 
favoráveis à sua auto-imagem. 
 
o Más amostras: Uma fonte de estatística enganosa são os 
métodos inadequados de coleta de dados. Um exemplo é uma 
pesquisa auto-selecionada. Esta constitui de uma pesquisa em 
que os próprios entrevistados serão incluídos. 
 
 
 
- Planejamento de experimentos 
 
Os estudos que utilizam métodos estatísticos vão desde os que são bem 
concebidos e executados, dando resultados confiáveis, aos que são 
concebidos deficientemente e mal executados, levando a conclusões 
enganosas e sem qualquer valor real. Eis alguns pontos importantes para o 
planejamento de um estudo capaz de produzir resultados válidos: 
 
1. Identificar com precisão a questão a ser respondida e definir com 
clareza a população de interesse. 
2. Estabelecer um plano para coleta de dados. Esse plano devedescrever detalhadamente a realização de um estudo 
observacional ou de um experimento (ambos definidos a seguir), 
e deve ser elaborado cuidadosamente, de modo que os dados 
coletados representem efetivamente a população em questão. 
3. Coletar os dados. Devemos ser extremamente cautelosos, para 
minimizar os erros que podem resultar de uma coleta tendenciosa 
de dados. 
4. Analisar os dados e tirar conclusões. Identificar também possíveis 
fontes de erros. 
500
550
600
650
700
750
800
Homens Mulheres
G
an
ho
 s
em
an
al
 m
ed
ia
no
 e
m
 d
ól
ar
es
 5
 
Obs.: Como já dissemos, o objetivo último da Estatística é tirar conclusões 
sobre o todo (população) a partir de informações fornecidas por parte 
representativa do todo (amostra). Assim, realizadas as fases correspondentes 
à estatística descritiva, fazemos uma análise dos resultados obtidos, através 
dos métodos da Estatística indutiva ou inferencial, que tem por base a indução 
ou inferência, e tiramos desses resultados conclusões e previsões. 
 
Os estudos que requerem métodos estatísticos decorrem tipicamente de 
duas fontes comuns: estudos observacionais e experimentos. 
 
Em um estudo observacional, verificamos e medimos características 
específicas, mas não tentamos manipular ou modificar os elementos a serem 
estudados. 
Em um experimento, aplicamos determinado tratamento e passamos 
então a observar seus efeitos sobre os elementos a serem pesquisados. 
 
Passamos agora a definir os cinco métodos mais comuns de 
amostragem. 
 
Amostragem aleatória 
 
Em uma amostra aleatória, os elementos da população são escolhidos 
de tal forma que cada um deles tenha igual chance de figurar na amostra. 
(Escolhe-se uma amostra aleatória simples de n elementos, de maneira que 
toda amostra de tamanho n possível tenha a mesma chance de ser escolhida. 
Exemplo: 
 
 Vamos obter uma amostra representativa para a pesquisa da estatura de 
noventa alunos de uma escola: 
a) numeramos os alunos de 01 a 90. 
b) Escrevemos os números, de 01 a 90, em pedaços iguais de um 
mesmo papel, colocando-os dentro de uma caixa. Agitamos sempre 
a caixa para misturar bem os pedaços de papel e retiramos, um a 
um, nove números que formarão a amostra. Neste caso, 10% da 
população. 
 
Amostragem estratificada 
 
Com a amostragem estratificada, subdividimos a população em, no 
mínimo, duas subpopulações (ou estratos) que compartilham das mesmas 
características (como sexo) e, em seguida, extraímos uma amostra de cada 
estrato. 
 
Exemplo: 
 
 Supondo, no exemplo anterior, que, dos noventa alunos, 54 sejam 
meninos e 36 sejam meninas, vamos obter a amostra proporcional 
estratificada. 
 6
 São, portanto, dois estratos (sexo masculino e sexo feminino) e 
queremos uma amostra de 10% da população. Logo, temos: 
 
Sexo População 10% Amostra 
M 54 5,4 5 
F 36 3,6 4 
total 90 9,0 9 
 
 A próxima fase consiste em selecionar, quer seja por sorteio, quer seja 
pelo uso de uma tabela de números aleatórios ou outro método qualquer, os 5 
meninos e as 4 meninas para comporem a amostra. 
 
 Amostragem sistemática 
 
 Na amostragem sistemática, escolhemos um ponto de partida, e 
selecionamos cada k-ésimo elemento (como por exemplo cada 50º elemento) 
da população. 
 
Exemplo: 
 
 Suponhamos uma rua contendo novecentos prédios, dos quais 
desejamos obter uma amostra formada de cinqüenta prédios. Podemos, neste 
caso, usar o seguinte procedimento: como 
50
900 =18, escolhemos por sorteio 
casual um número de 1 a 18 (inclusive), o qual indicaria o primeiro elemento 
sorteado para a amostra; os demais elementos seriam periodicamente 
considerados de 18 em 18. Assim, se o número sorteado fosse o 4, 
tomaríamos, pelo lado direito da rua, o 4º prédio, o 22º, o 40º etc., até 
voltarmos ao início da rua, pelo lado esquerdo. 
 
 Amostragem por conglomerados 
 
 Na amostragem por conglomerados, começamos dividindo a área da 
população em seções (ou conglomerados); em seguida escolhemos algumas 
dessas seções e, finalmente, tomamos todos os elementos das seções 
escolhidas. 
 
 Uma diferença importante entre a amostragem por conglomerados e a 
amostragem estratificada é que a amostragem por conglomerados utiliza todos 
os elementos dos conglomerados selecionados, enquanto a amostragem 
estratificada utiliza uma amostra de membros de cada estrato. 
 
Exemplo: 
 
 Numa pesquisa pré-eleitoral, onde escolhemos aleatoriamente 30 zonas 
eleitorais, pesquisamos todos os elementos de cada uma das zonas 
escolhidas. 
 
 
 
 7
 Amostragem de conveniência 
 
 Na amostragem por conveniência, simplesmente utilizamos resultados 
que já estão disponíveis. 
 
Obs.: Em alguns casos, os resultados da amostragem de conveniência podem 
até ser bons, mas em outros casos podem apresentar séria tendenciosidade. 
 
Exemplo: 
 
 Ao fazer uma pesquisa sobre pessoas canhotas, seria conveniente um 
estudante pesquisar seus próprios colegas de classe, porque estão ao seu 
alcance imediato. Mesmo que tal amostra não seja aleatória, os resultados 
devem ser bem satisfatórios. 
 
 Não importa quão bem planejemos e executemos o processo de coleta 
de amostras, há sempre a possibilidade de um erro nos resultados. 
 Um erro amostral é a diferença entre um resultado amostral e o 
verdadeiro resultado populacional; tais erros resultam de flutuações amostrais 
aleatórias. 
 Ocorre um erro não-amostral quando os dados amostrais são 
coletados, registrados ou analisados incorretamente. Tais erros resultam de um 
erro que não seja uma simples flutuação amostral aleatória, como a escolha de 
uma amostra não-aleatória e tendenciosa, a utilização de um instrumento de 
mensuração defeituoso, uma questão formulada de modo tendencioso, um 
grande número de recusas de resposta ou a cópia incorreta dos dados 
amostrais.

Outros materiais