Buscar

Estatística e o Método Científico

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 37 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 37 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 37 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Universidade Estadual de Campinas
Módulo III - D6
Análise Combinatória, Probabilidade
Noções de Estat́ıstica
Tema 3 - Noções de Estat́ıstica
Prof. Laura L. R. Rifo
- Janeiro, 2011 -
Sumário
1 Estat́ıstica e o método cient́ıfico 1
1.1 O método cient́ıfico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.2 Estat́ıstica como aprendizagem . . . . . . . . . . . . . . . . . . . . . . . 3
1.3 Estudo sobre a malária . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.4 Amostragem, população e previsões . . . . . . . . . . . . . . . . . . . . . 5
2 Representando dados 7
2.1 Gráfico de pontos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.2 Gráfico de barras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.3 Gráfico de setores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.4 Tabela de freqüências . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.5 Histograma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.6 Diagrama de ramo-e-folhas . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.7 Outros gráficos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
Série temporal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
Gráfico radial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
Cartogramas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
3 Resumindo dados 21
3.1 Média . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
3.2 Desvio-padrão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
3.3 Relação entre média e desvio-padrão . . . . . . . . . . . . . . . . . . . . 23
ii Sumário
3.4 Medianas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
3.5 Outros quantis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
3.6 Boxplot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
4 Elementos de Amostragem 27
4.1 Amostragem aleatória simples . . . . . . . . . . . . . . . . . . . . . . . . 28
4.2 Amostragem estratificada . . . . . . . . . . . . . . . . . . . . . . . . . . 29
4.3 Amostragem por conglomerado . . . . . . . . . . . . . . . . . . . . . . . 29
4.4 Amostragem sistemática 1-em-k . . . . . . . . . . . . . . . . . . . . . . . 30
Caṕıtulo 1
Estat́ıstica e o método cient́ıfico
Esta parte do curso pretende apresentar ferramentas que permitam analisar criticamente
informações como as que recebemos diariamente dos meios de comunicação.
Figura 1.1:
As inferências obtidas a partir dos dados são estat́ısticas, e tem essencialmente duas
caracteŕısticas: é posśıvel obter evidências por meio de experimentos ou observações, e
as conclusões obtidas envolvem um grau de incerteza.
A experimentação e a quantificação da incerteza são fundamentais em ciência. Os cien-
tistas aprendem usando o método cient́ıfico. Mas cientistas diferentes usam diferentes
metodologias, e algumas delas não tão cient́ıficas assim. É importante portanto ter uma
definição precisa do que significa o método cient́ıfico.
2 Estat́ıstica e o método cient́ıfico
1.1 O método cient́ıfico
De acordo com o f́ısico Stephen Hawking, o objetivo fundamental da ciência é entregar
uma descrição completa do universo em que vivemos. Os cientistas tentam alcançar este
objetivo contruindo teorias cient́ıficas e verificando as predições destas teorias. Hawking
não vê a ciência como uma forma de aproximar a realidade (seja lá o que possa ser
realidade), mas como uma forma de pensar sobre a realidade. Este ponto de vista é o
que será adotado nesta abordagem.
Uma teoria cient́ıfica pode ser vista como um modelo do universo, ou de uma parte
dele, e um conjunto de regras relacionando caracteŕısticas do modelo a observações que
podemos fazer.
Por exemplo, “a terra é redonda” é uma teoria cient́ıfica. Aristóteles e outros cien-
tistas da Grécia Antiga usaram o método cient́ıfico para verificar esta teoria, fazendo
observações e comparando-as com as previsões da teoria. Primeiro, se a terra fosse re-
donda, ela deveria deixar sempre uma sombra redonda sobre a lua durante um eclipse
lunar (e isto ocorre), enquanto que se ela fosse um disco plano, a imagem seria às vezes
eĺıptica. Segundo, se a terra fosse redonda a estrela do Norte deveria aparecer cada vez
mais baixa no céu quando vista de mais ao sul (isto acontece). Terceiro, se a terra fosse
redonda os mastros dos navios se aproximando deveriam aparecer antes que seus cascos
(e isto também acontece).
Estendendo o procedimento anterior, o método cient́ıfico é um processo que envolve
idealizar experimentos e atualizar o conhecimento usando a evidência dos experimentos.
Experimentos melhores são mais informativos. Mas experimentos são caros, com custos
envolvendo tempo, dinheiro e recursos em geral. Estes custos, mesmo parecendo estar
separados da metodologia, eles são centrais na metodologia e devem ser considerados
explicitamente.
Neste contexto, os métodos estat́ısticos entregam ferramentas matemáticas que per-
mitem otimizar este processo.
Basicamente, podemos identificar os seguintes estágios:
1. Formulação de uma hipótese, que terá certas conseqüências
2. Amostragem ou coleta de dados
3. Resumo, representação gráfica e comparação dos dados obtidos com o que seria de
se esperar de acordo com a hipótese estabelecida
Estat́ıstica como aprendizagem 3
4. Aceitação ou rejeição da hipótese. No caso de rejeição, formulação de uma nova
hipótese. No caso de aceitação, manter a hipótese até que novas amostras determinem
sua rejeição.
Figura 1.2: Diagrama do método de aprendizagem.
Estas etapas formam um ciclo iterativo entre o avanço teórico (hipótese) e os procedi-
mentos de obtenção de dados.
A formulação das hipóteses está relacionada ao levantamento de posśıveis respostas para
um problema espećıfico.
Ao coletar dados, estamos interessados em obter informação que permita manter a
validade de uma hipótese ou que entregue evidências suficientes para rejeitá-la e então
formular novas hipóteses, que serão testadas com uma nova coleta de dados e assim por
diante.
A estat́ıstica tem um papel fundamental no planejamento e na obtenção de conclusões
de experimentos.
1.2 Estat́ıstica como aprendizagem
A palavra estat́ıstica tem vários significados. Tecnicamente, estat́ısticas são números
que resumem os resultados de um estudo. No singular, estat́ıstica é uma disciplina
cient́ıfica que estuda a forma em que as pessoas aprendem quando obtém informações,
respondendo à questão: o que este estudo significa?
Aprender é apenas uma parte da estat́ıstica. Outra parte do pensamento estat́ıstico
consiste em usar o que se aprendeu, por exemplo, guiando o processo de tomada de
decisões, usando a informação dispońıvel.
4 Estat́ıstica e o método cient́ıfico
É importante levar em conta que o mesmo conjunto de dados pode levar a diferentes
conclusões dependendo de outras informações dispońıveis.
As duas partes principais do processo de aprendizagem são o planejamento de experi-
mentos (que dados devem ser coletados e de que maneira?) e a análise dos dados do
experimento (como aprendemos dos dados coletados?).
Aprender de uma informação numérica não é um processo intuitivo; às vezes damos
credibilidade demais a uma poucas informações, mas, por outro lado, com muitas in-
formações, o processo de aprendizagem é mais dif́ıcil.
Ao coletar informações, usualmente obtemos valores diferentes. A variabilidade não
invalida os resultados do experimento, mas é importante saber reconhecê-la e como
lidar com ela.
Precisamos também de um formalismo para incorporar os resultados obtidos em um
experimento à informação que já temos, permitindo assim descrever o conhecimentodispońıvel em um momento dado. Este conhecimento pode ser transformado em in-
ferências, decisões e planejamento de novos experimentos.
O problema de decidir entre diversas ações posśıveis ocorre nos negócios, medicina,
ciência, e nas diversas situações do cotidiano. A decisão apropriada depende dos nossos
objetivos, dos custos das diversas conseqüências de nossa escolha, e do nosso estado de
conhecimento sobre quais serão as conseqüências.
1.3 Estudo sobre a malária
Nos anos 50, foi realizado um estudo para determinar se portadores do gene de um certo
tipo de anemia (drepanocitose) eram mais resistentes à malária do que não-portadores.
Este tipo de anemia é mais comum em pessoas negras, de modo que foram recrutadas
30 pessoas negras voluntárias, das quais 15 eram portadores do gene e 15 não eram.
Os 30 voluntários foram injetados com malária, sendo que 14 dos 15 não-portadores
contráıram a doença contra apenas 2 dos portadores.
Antes de continuar a análise, observemos que este estudo é altamente questionável em
termos de custos: o estudo é claramente anti-ético. Das 30 pessoas expostas à doença
com o propósito de obter informação, 16 contráıram a doença. Este é um alto preço
pela informação.
O pensamento estat́ıstico mostra como usar a informação obtida para concluir se porta-
dores do gene são ou não mais resistentes à malária, ajudando a expressar este conheci-
Amostragem, população e previsões 5
mento adquirido.
Mas estat́ıstica não é simplesmente um apanhado de técnicas para analisar dados. Por
exemplo, suponha que cada um dos 30 indiv́ıduos do estudo anterior lançasse uma
moeda, tentando adivinhar qual face seria obtida, e que o resultado fosse que 14 dos
15 não-portadores e 2 dos 15 portadores adivinhassem. Os dados seriam os mesmos,
mas eu não começaria a acreditar que não-portadores tem mais dom de adivinhação que
portadores.
As conclusões seriam diferentes ao levar em conta o contexto em que os dados foram
coletados. A análise do contexto, ou seja, o entendimento do problema analisado, é
também importante.
1.4 Amostragem, população e previsões
Uma técnica comumente utilizada em estat́ıstica para estudar uma população é a rea-
lização de uma amostragem da população: escolhemos alguns indiv́ıduos da população
a fim de mensurar as caracteŕısticas de interesse nesses indiv́ıduos, para depois tirar
conclusões para a população completa.
Figura 1.3: Uma amostra é uma coleção de informações.
Uma das perguntas em um processo de amostragem é se a amostra obtida é realmente
representativa da população, ou seja, se o que observamos na amostra é semelhante ao
que ocorre na população, em termos das perguntas que devem ser respondidas.
O conjunto de todas as posśıveis observações (reais ou imaginadas) é chamado uma
população. Uma população pode ser finita ou infinita.
No experimento “Quantos peixes há no lago?”, o objetivo é a realização de um processo
de amostragem para estimar o tamanho de uma população.
http://www.mais.mat.br/wiki/Quantos_peixes_h%C3%A1_no_lago%3F
6 Estat́ıstica e o método cient́ıfico
Um problema t́ıpico de estat́ıstica envolve tirar conclusões sobre alguma caracteŕıstica
da população a partir de uma amostra da população. Estas conclusões podem levar à
tomada de decisões baseadas na amostra.
As inferências estat́ısticas extrapolam as informações de uma amostra para a população
que está sendo amostrada.
Um tipo particular de inferência é obter conclusões ou previsões para uma próxima
observação (ou conjunto de informações) da população. As previsões não são espećıficas,
como “a próxima observação será 7”, mas estão sujeitas também a incertezas. A análise
destas incertezas também faz parte do método estat́ıstico.
O v́ıdeo Sem discriminação aborda o problema de análisis precipitadas levarem a con-
clusões incorretas com um caso real ocorrido em universidade nos anos 70, nos Estados
Unidos.
http://www.mais.mat.br/wiki/Sem_discrimina%C3%A7%C3%A3o
Caṕıtulo 2
Representando dados
Um dos objetivos centrais da estat́ıstica é a formalização do processo de aprendizagem
sobre uma população de interesse através de uma amostra da população.
O primeiro passo deste processo consiste na apresentação e resumo da informação
amostral.
Figura 2.1: Descrição de dados.
Reportar a informação contida nos dados é um exerćıcio de comunicação: a forma de
graficar um conjunto de dados pode ser mais importante que as palavras que o acom-
panham. Aqui veremos alguns gráficos básicos, mas cada problema tem suas particu-
laridades: em um problema espećıfico você poderia precisar criar seu próprio tipo de
gráfico.
Alguns prinćıpios que devem ser seguidos ao construir um gráfico são:
1. ele deve ser entend́ıvel, agradável de ver e não complicado em excesso;
2. deve entregar toda a informação posśıvel (sem comprometer o item 1);
8 Representando dados
3. os aspectos do experimento ou dos dados que não aparecem no gráfico devem estar
explicados claramente na legenda.
O v́ıdeo 200 páıses, 200 anos em 4 minutos do Prof. Hans Rosling mostra uma forma
diferente e muito clara de mostrar alguns dados de saúde mundial. Estes dados rela-
cionam renda per capita média (em dólares) com expectativa média de vida (em anos)
para todos os páıses do mundo e sua evolução nos últimos 200 anos. Vale a pena ver.
Exerćıcio
Considere o seguinte conjunto de dados referentes ao peso, em kg, de uma turma de 92
alunos:
homens: 63.5, 65.5, 72.5, 85.5, 69, 74, 68, 85.5, 87, 62, 72.5, 69, 68.5, 65.5, 76.5, 79, 79,
76.5, 81, 62, 76.5, 70, 59, 83, 85.5, 69, 76.5, 69, 96, 68, 65.5, 69, 69, 68, 69, 68, 81, 72.5,
62, 72.5, 59, 69, 68, 65.5, 69, 68, 63.5, 81, 85.5, 65.5, 68, 74, 63.5, 65, 62, 55.4, 68
mulheres: 63.5, 54.5, 59, 62, 54.5, 56.5, 52, 65, 68, 50.5, 56.5, 59, 54.5, 59, 59, 54.5, 52,
56.5, 62, 56.5, 52, 55, 52, 46, 52, 68, 49.5, 52, 48.5, 43, 56.5, 59, 49.5, 68, 48.5
Registre estes dados em uma tabela com duas colunas: a primeira coluna indicando o
gênero do aluno (M/F) e a segunda, com o peso (em kg) do aluno. Você deve obter 92
linhas, referentes a cada aluno da amostra, com 57 homens e 35 mulheres.
2.1 Gráfico de pontos
Um gráfico de pontos é a forma mais simples de apresentar dados numéricos. Cada
observação é representada por um ponto colocado sobre uma reta, mostrando a posição
relativa entre as observações.
Exemplo. Para encontrar a viscosidade da dimetilanilina a 20◦C, são obtidas a se-
guintes mensurações: 146, 154, 141, 140, 136, 132, 147, 140, 147, 139, 140, 140 (em
centipoises ou cP). Os dados apresentam esta variabilidade porque não há controle de
todos os fatores que afetam a medição (precisão de instrumento de medição, expertise
da pessoa que realiza a mensuração, etc). O gráfico de pontos destes dados aparece na
Figura 2.2.
Neste gráfico, cada ponto representa uma mensuração, portanto para dados repetidos,
podemos colocar os pontos empilhados, como no exemplo. Podemos usar śımbolos (pon-
tos) menores se houver um grande número de dados. Observemos que os extremos são
http://www.youtube.com/watch?v=jbkSRLYSojo
Gráfico de pontos 9
Figura 2.2: Gráfico de pontos para os dados de viscosidade (em cP).
facilmente viśıveis neste gráfico, e que as mensurações estão concentradas próximas a
140cP.
Uma questão t́ıpica em ciências é se há relação entre duas mensurações. O gráfico de
pontos pode ser útil para comparar mensurações em diferentes grupos.
Exemplo. Em uma entrevista feita com 97 estudantes, foram coletados dados sobre
seu consumo de caféına (em mg) estimado a partir do consumo diário de café, chá e
outras bebidas contendo caféına, e seu consumo de bebidas alcólicas (em doses). Os
pesquisadores queriam saber se havia alguma relação entre as variáveis, classificandoa
quantidade de doses nas categorias 0, 1-2, 3-5, 6+. Os resultados são os mostrados na
Tabela 2.1.
Os dados da tabela podem ser graficados como na Figura 2.3. Em cada linha, temos
uma das categorias de consumo de bebida alcólica. Os pontos representam cada um
dos entrevistados e o tamanho do ponto representa o total de entrevistados na mesma
categoria com mesmo consumo de caféına diária.
Podemos perceber que de acordo com os dados coletados não há evidências de algum
tipo de relação entre o consumo diário de caféına e consumo de álcool.
O gráfico de pontos é adequado quando as observações são numéricas e o tamanho da
amostra é pequeno o suficiente para mostrar um ponto por observação.
Exerćıcio
Faça o gráfico de pontos para os dados do peso dos alunos: (a) considerando todos os
dados da classe juntos; (b) classificando os dados nas categorias M e F. Você observa
10 Representando dados
0 1-2 3-5 6+
68 0 0 210 505 68 260 390
180 0 68 260 598 68 260 390
180 68 68 260 805 68 260 390
210 93 68 278 810 98 260 398
210 98 98 373 975 98 260 525
323 165 98 390 98 260 570
368 210 98 390 98 270 665
368 210 98 398 113 323 860
698 210 113 405 165 323
260 165 405 180 328
293 180 405 180 373
323 180 435 210 373
405 180 435 210 373
405 210 480 225 373
435 210 495 260 373
Tabela 2.1: Consumo diário de caféına (em mg) por categoria de consumo de álcool (em
doses).
Figura 2.3: Gráfico de pontos para os dados de consumo de caféına (mg) por categoria
de consumo de bebida alcólica (em doses).
alguma relação entre peso e gênero?
Gráfico de barras 11
2.2 Gráfico de barras
O gráfico de pontos é adequado quando as observações são numéricas e o tamanho da
amostra é pequeno o suficiente para mostrar um ponto por observação. No entanto se
tivermos muitos valores repetidos, um gráfico de barras pode ser mais adequado.
Exemplo. No exemplo dos dados de consumo de caféına, podemos representar os
dados pelo gráfico de barras por categorias da Figura 2.4.
Figura 2.4: Gráfico de barras para os dados de consumo de caféına (mg) por categoria
de consumo de bebida alcólica (em doses).
Neste caso, dados repetidos são representados pela altura da barra. Se uma observação
aparece duas vezes mais que outra, a altura da barra correspondente deve ser o dobro da
altura da barra da outra. A largura da barra deve ser a mesma para todas as observações.
Exemplo Tratamento de leucemia. Um estudo foi realizado em 1963 para avaliar a
eficácia de um agente quimioterapêutico, 6-MP, para o tratamento de leucemia aguda.
Para realizar a avaliação é necessário um grupo de comparação, de modo que os pacientes
foram aleatorizados para dois grupos (6-MP ou placebo) mediante o lançamento de uma
moeda. O primeiro paciente receberia o 6-MP se a moeda indicasse cara ou placebo se
fosse coroa; o segundo paciente receberia o outro tratamento. O mesmo procedimento
foi seguido com o 3o e o 4o pacientes, com o 5o e o 6o, e assim por diante, com 21 pares
de pacientes. Para cada par, foi registrado se o procedimento 6-MP foi melhor (M) ou
pior (P) que o placebo, obtendo
MPMMM PMMMM MMMPM MMMMM M
12 Representando dados
Desta forma, o 6-MP foi mais eficaz em 18 dos 21 pares de pacientes. Podemos rep-
resentar estes dados com um gráfico de barras, onde a altura de cada barra indica a
proporção ou a quantidade de indiv́ıduos na categoria correspondente, como na Figura
2.5.
Figura 2.5: Gráfico de barras para os dados do tratamento 6-MP contra a leucemia
aguda.
Exerćıcio
Faça o gráfico de barras para os dados do peso dos alunos: (a) considerando todos os
dados da classe juntos; (b) classificando os dados nas categorias M e F. A relação entre
peso e gênero fica mais viśıvel, menos viśıvel ou não há diferença entre este gráfico e o
de pontos?
2.3 Gráfico de setores
Outra alternativa ao gráfico de barras, quando os dados estiverem classificados em ca-
tegorias, é o gráfico de setores. Neste gráfico a área de cada setor é proporcional à
freqüência de cada categoria na amostra completa.
Exemplo No exemplo do tratamento contra a leucemia aguda, podemos representar
os resultados como no gráfico da Figura
O experimento Dobra a ĺıngua e coça a orelha propõe uma análise de dados, através
de tabelas e de gráficos de barras e de setores, sobre duas informações antropométricas:
http://www.mais.mat.br/wiki/Dobra_a_l%C3%ADngua_e_co%C3%A7a_a_orelha
Tabela de freqüências 13
Figura 2.6: Gráfico de setores para os dados do tratamento 6-MP contra a leucemia
aguda.
“Você consegue dobrar a ĺıngua?”e “Qual é o formato do lóbulo da sua orelha?”.
Exerćıcio
Faça o gráfico de setores e o de barras para os dados do peso dos alunos, para representar
a proporção de homens e mulheres na classe.
2.4 Tabela de freqüências
Podemos resumir dados numéricos com uma tabela de freqüências. Dividimos a reta
numérica em intervalos e contamos o total de mensurações dentro de cada intervalo. A
freqüência é o total de observações em cada intervalo e a freqüência relativa é a proporção
de observações em cada intervalos, ou seja, é a freqüência dividida pelo tamanho da
amostra.
Cada intervalo é chamado intervalo de classe e seu ponto médio, marca de classe. Para
evitar confusão com os extremos de cada intervalo, e não contar informações duas vezes,
podemos considerar intervalos abertos à esquerda e fechados à direita, (a, b].
Exemplo No exemplo do consumo de caféına, observemos que o consumo mı́nimo é
0 e o consumo máximo é 975 mg, considerando todos os dados. Podemos dividir a reta
em intervalos de 100mg, entre 0 e 1000 mg, e contar o total de casos em cada intervalo,
como aparece na Tabela 2.2.
14 Representando dados
intervalo marca de freqüência freqüência
de classe classe relativa
0 - 100 50 21 0,216
100 - 200 150 12 0,124
200 - 300 250 24 0,247
300 - 400 350 20 0,206
400 - 500 450 10 0,103
500 - 600 550 4 0,042
600 - 700 650 2 0,021
700 - 800 750 0 0
800 - 900 850 3 0,031
900 - 1000 950 1 0,010
total 97 1
Tabela 2.2: Tabela de freqüências do consumo diário de caféına (em mg).
Um critério para escolher o total de intervalos nesta tabela é o mesmo que para a
escolha do gráfico: a tabela deve entregar a informação amostral, sem esconder dados
importantes e sem sobrecarregar a informação.
Eventualmente, podemos considerar intervalos de tamanhos diferentes, se for mais con-
veniente.
Exemplo No exemplo do consumo de caféına, observemos que os últimos 4 intervalos
contém poucos ou nenhum dado, em relação aos anteriores. Podemos considerar então
o intervalo (600-1000], como na Tabela 2.3
intervalo marca de freqüência freqüência
de classe classe relativa
0 - 100 50 21 0,216
100 - 200 150 12 0,124
200 - 300 250 24 0,247
300 - 400 350 20 0,206
400 - 500 450 10 0,103
500 - 600 550 4 0,042
600 - 1000 800 6 0,062
total 97 1
Tabela 2.3: Tabela de freqüências do consumo diário de caféına (em mg).
Histograma 15
Exerćıcio
Construa duas tabelas de freqüências para os dados do peso dos alunos, considerando
todos os dados. Faça uma das tabelas com intervalos de mesmo comprimento e a outra,
não.
2.5 Histograma
Podemos representar graficamente a informação dada na tabela de freqüências através
do chamado histograma. Um histograma é um gráfico de barras, onde a base de cada
barra é o intervalo de classe e a área de cada barra representa a freqüência do intervalo.
Observemos que se os intervalos tiverem todos o mesmo comprimento, então a freqüência
de cada intervalo é representada pela altura da barra correspondente.
Se os comprimentos não forem todos iguais, devemos escolher uma unidade de re-
ferência, como por exemplo o comprimento do menor intervalo, como veremos no exem-
plo seguinte.
Exemplo No exemplo do consumo de caféına, obtemos os seguintes histogramas, re-
ferentes a cadauma das tabelas de freqüências anteriores.
Figura 2.7: Histograma para os dados de consumo de caféına (mg): à esquerda com
intervalos de mesmo comprimento; à direita, o último intervalo é maior que os outros.
Lembremos que no histograma a área de cada barra deve representar a freqüência de
cada intervalo. Sendo assim, no último intervalo devemos dividir a freqüência observada
por 4, já que ele tem comprimento 4 vezes maior que os demais. Graficamente, este
16 Representando dados
procedimento nos leva a uma barra para o último intervalo cuja altura representa a
altura média dos intervalos combinados.
O v́ıdeo Cada gráfico no seu galho mostra diversos tipos de gráfico, entre eles o gráfico de
setores, o de barras e o histograma. Além disso, mostra como interpretar as informações
ali presentes e discute qual o tipo de gráfico mais adequado para cada tipo de variável.
Exerćıcio
O applet Histograma permite fazer um histograma com dados variando de a a w. Defina
estes limites para os dados de peso e ingresse os dados no applet. Observe o histograma
obtido.
2.6 Diagrama de ramo-e-folhas
O estat́ıstico John Tukey inventou uma forma rápida de resumir dados, mantendo a
informação original, chamada diagrama de ramo-e-folhas.
Exemplo Consideremos o seguinte conjunto de dados referente ao ganho de peso (em
kg) de 100 porquinhos submetidos a uma certa dieta, durante um mês:
3 , 7 , 11, 12, 13, 14, 15, 16, 17, 17, 18, 18, 18, 19, 19, 19, 20, 20, 21, 21, 21, 22, 22, 23,
23, 24, 24, 24, 25, 25, 25, 26, 26, 26, 26, 27, 27, 27, 28, 28, 28, 29, 29, 29, 29, 30, 30, 30,
30, 30, 30, 30, 30, 30, 30, 31, 31, 31, 31, 32, 32, 33, 33, 33, 33, 33, 34, 34, 34, 35, 35, 35,
36, 36, 36, 37, 37, 38, 38, 39, 39, 39, 40, 40, 41, 41, 41, 42, 42, 42, 43, 43, 44, 45, 46, 47,
48, 48, 53, 57
ramo folhas
0 3 7
1 1 2 3 4 5 6 7 7 8 8 8 9 9 9
2 0 0 1 1 1 2 2 3 3 4 4 4 5 5 5 6 6 6 6 7 7 7 8 8 8 9 9 9 9
3 0 0 0 0 0 0 0 0 0 0 1 1 1 1 2 2 3 3 3 3 3 4 4 4 5 5 5 6 6 6 7 7 8 8 9 9 9
4 0 0 1 1 1 2 2 2 3 3 4 5 6 7 8 8
5 3 7
Tabela 2.4: Diagrama de ramo-e-folhas para o ganho de peso.
Neste diagrama, os ramos representam as casas decimais e as folhas as unidades. Os
ramos são primeiramente colocados em uma linha vertical, depois adicionamos as folhas
em cada linha, mantendo a mesma distância entre elas e de forma ordenada, como na
Tabela 2.4.
http://www.mais.mat.br/wiki/Cada_gr%C3%A1fico_no_seu_galho
http://www.math.uah.edu/stat/applets/HistogramGame.html
http://www-groups.dcs.st-and.ac.uk/~history/Biographies/Tukey.html
Outros gráficos 17
Assim como na Tabela de freqüências, podemos definir os galhos de diversas maneiras.
Por exemplo, podeŕıamos considerar cada galho contendo apenas 5 d́ıgitos, de 0 a 4 ou
de 5 a 9. Assim, o diagrama anterior fica como na Tabela 2.5.
ramo folhas
0 3
0 7
1 1 2 3 4
1 5 6 7 7 8 8 8 9 9 9
2 0 0 1 1 1 2 2 3 3 4 4 4
2 5 5 5 6 6 6 6 7 7 7 8 8 8 9 9 9 9
3 0 0 0 0 0 0 0 0 0 0 1 1 1 1 2 2 3 3 3 3 3 4 4 4
3 5 5 5 6 6 6 7 7 8 8 9 9 9
4 0 0 1 1 1 2 2 2 3 3 4
4 5 6 7 8 8
5 3
5 7
Tabela 2.5: Diagrama de ramo-e-folhas para o ganho de peso, com 5 d́ıgitos em cada
ramo.
Exerćıcio
Construa o diagrama de ramo-e-folhas para os dados do peso dos alunos, considerando
todos os dados.
2.7 Outros gráficos
Série temporal
Muitas das informações que recebemos em nosso dia a dia dizem respeito a dados
numéricos que apresentam variabilidade no tempo. Em economia, por exemplo, o preço
do real em relação a alguma moeda estrangeira, a taxa mensal de desemprego no páıs
durante os últimos 5 anos. Em meio ambiente, temos as temperaturas média e máxima
diárias em uma certa região durante o último mês, ou os ńıveis de radiação observados.
Em estudos sociais, podemos considerar a evolução da proporção de votantes em um
certo candidato, e assim por diante.
Conjuntos de dados referentes a variáveis numéricas observadas durante um peŕıodo de
tempo são chamados séries temporais.
18 Representando dados
O gráfico da Figura 2.8 mostra a evolução do salário mı́nimo real brasileiro, desde
sua instituição em 1940, pelo governo do Estado Novo. Em 1943, foi incorporado à
Consolidação das Leis do Trabalho (CLT) e, em 1963, foi estendido ao campo por meio
do Estatuto do Trabalhador Rural.
Figura 2.8: Evolução temporal do salário mı́nimo real no Brasil.
Este tipo de gráfico permite visualizar claramente a evolução no tempo de variáveis
numéricas.
O experimento Séries Temporais realiza um estudo descritivo de um conjunto de dados
temporais com o fim de conhecer algumas das ferramentas utilizadas nesta área da
análise estat́ıstica.
Gráfico radial
Em 1855, a enfermeira Florence Nightingale produziu gráficos contundentes sobre a
mortalidade em hospitais militares na Grã-Bretanha.
Na Figura 2.9, o eixo radial mostra o total de mortes de soldados britânicos durante a
Guerra da Criméia.
A área de cada região colorida, medida a partir do centro, representa a proporção de
uma das variáveis medidas. A parte azul, mais externa, representa mortes por doenças
preveńıveis ou provenientes de infecções agudas, como cólera e tifo. A parte mais clara
central, representa morte por ferimentos e a parte escura intermediária, mortes por
outras causas.
Seus estudos estat́ısticos levaram a poĺıticas públicas para melhorar as condições nos
hospitais, diminuindo a taxa de mortalidade por infecções. Por seu trabalho, foi a
primeira mulher a ser eleita para a Royal Statistical Society, em 1858.
http://pt.wikipedia.org/wiki/Estado_Novo_(Brasil)
http://m3.ime.unicamp.br/portal/Midias/Experimentos/ExperimentosM3Matematica/series_temporais/
http://www-history.mcs.st-andrews.ac.uk/Biographies/Nightingale.html
http://pt.wikipedia.org/wiki/Guerra_da_Crimeia
Outros gráficos 19
Figura 2.9: Gráfico radial constrúıdo por Florence Nightingale, em 1855.
Cartogramas
Em 2004, os f́ısicos Michael Gastner do Imperial College London e Mark Newman da Uni-
versidade de Michigan desenvolveram uma ferramenta que permitiu criar este incŕıveis
gráficos a respeito do nosso mundo.
Na Figura 2.10, vemos à esquerda o mapa mundi usual, em que a área ocupada por
cada páıs representa sua extensão geográfica; à direita, a área ocupada por cada páıs
representa sua taxa de desnutrição infantil.
Figura 2.10: Cartogramas: à esquerda, a extensão territorial e, à direita, a taxa de
desnutrição infantil.
A taxa de desnutrição infantil consiste na proporção de crianças do páıs com um quadro
de desnutrição. Esta pode ser da ordem de 1%, como no Chile e no Japão, ou chegar a
quase 50%, como em Bangladesh, Nepal e Índia.
Mais cartogramas podem ser encontrados na página do projeto Worlmapper. Você nunca
mais verá o mundo do mesmo jeito.
http://www.worldmapper.org/textindex/text_index.html
20 Representando dados
Caṕıtulo 3
Resumindo dados
Passaremos dos gráficos para as fórmulas: nosso objetivo é obter umas poucas simples
mensurações das caracteŕısticas cruas de um conjunto de dados.
Qualquer conjunto de mensurações tem duas propriedades importantes: o valor t́ıpico
ou central, e a dispersão em torno desse valor. Podemos ter uma idéia destes conceitos
nos dois histogramas hipotéticos da Figura 3.1.
Figura 3.1: Medida central e de dispersão para dois histogramas.
Denotaremos um conjunto de n observações pela lista de valores x1, x2, . . . , xn.
Suponha que, por exemplo, perguntamos a 5 pessoas quantas horas elas assistem TV
por semana, obtendo a lista: x1 = 5, x2 = 7, x3 = 3, x4 = 38, x5 = 7.
Qual é o valor central destes dados? Há diversas formas de defini-lo, e veremos apenas
duas delas, a média e a mediana. Do mesmo modo, há diversas formas de definir a
dispersão; estudaremoso desvio-padrão e a distância interquartil.
22 Resumindo dados
3.1 Média
A média ou média amostral é representada por x̄, e é obtida somando todos os dados e
dividindopelo total de observações:
x̄ =
soma dos dados da amostra
n
=
x1 + x2 + · · ·+ xn
n
.
Em nosso exemplo, x̄ = (5 + 7 + 3 + 38 + 7)/5 = 60/5 = 12 horas, representa o tempo
médio semanal assistindo TV, na amostra obtida.
Podemos representar a soma pelo śımbolo
∑
, assim x1 + x2 + · · ·+ xn =
∑n
i=1 xi.
Geometricamente, imagine cada ponto da amostra na reta como um copo sobre uma
bandeja. A média representa o seu centro de massa, ou seja, o lugar onde segurar a
bandeja para que ela fique em equiĺıbrio.
Exerćıcio
Obtenha a média para os dados do peso dos alunos, considerando todos os dados, e
depois obtenha o peso médio das alunos e dos alunos, separadamente.
3.2 Desvio-padrão
O desvio-padrão representa uma medida da dispersão média dos dados da amostra em
torno do valor médio, veja a Figura 3.2.
Figura 3.2: Dispersão dos dados com relação à média.
Relação entre média e desvio-padrão 23
Consideremos uma amostra x1, x2, . . . , xn e sua média x̄. Obtenhamos primeiramente o
quadrado das distâncias de cada ponto da amostra até a média
(x1 − x̄)2, (x2 − x̄)2, . . . , (xn − x̄)2,
e obtenhamos sua média aritmética
1
n
(
(x1 − x̄)2 + (x2 − x̄)2 + · · ·+ (xn − x̄)2
)
.
O desvio-padrão, denotado por dp, é igual à raiz quadrada desta soma,
dp =
√
1
n
((x1 − x̄)2 + (x2 − x̄)2 + · · ·+ (xn − x̄)2),
e está na mesma unidade dos valores observados.
Exerćıcio
Obtenha o desvio-padrão para os dados do peso dos alunos, considerando todos os dados,
e depois obtenha o desvio-padrão do peso das alunos e dos alunos, separadamente.
3.3 Relação entre média e desvio-padrão
Uma relação emṕırica curiosa entre a média x̄ e o desvio-padrão dp, que ocorre em
grande parte dos conjuntos de dados, é que
aproximadamente 2/3 da amostra encontra-se à distância de 1dp da média
aproximadamente 95% da amostra encontra-se à distância de 2dp da média
aproximadamente 99% da amostra encontra-se à distância de 3dp da média
Esta propriedade ocorre para a maioria dos histogramas aproximadamente simétricos,
e mesmo para assimétricos, e permite estimar o desvio-padrão apenas olhando o his-
tograma.
A aproximação não é boa em conjuntos de dados com apenas dois valores diferentes,
como por exemplo, 0 0 0 0 0 0 0 1 1 1 1 1 1 1, em que os intervalos centrados na média
1/2 ou contém todos os dados ou não contém nenhum.
Exerćıcio
Verifique a proporção da amostra sobre peso dos alunos dentro de cada um destes três
intervalos em torno da média. Obtenha outros conjuntos de dados e verifique esta
relação.
24 Resumindo dados
Figura 3.3: Intervalos a 1dp, 2dp e 3dp da média.
3.4 Medianas
A mediana é uma outra forma de centro: é o “ponto médio” dos dados.
Formalmente, a mediana de um conjunto de valores x1, x2, . . . , xn é um valor m tal que:
pelo menos metade da amostra é menor ou igual a m, e
pelo menos metade da amostra é maior ou igual a m.
No exemplo das horas de TV, temos que 4 valores são menores ou iguais a 7 (3, 5, 7, 7)
e que 3 valores são maiores ou iguais a 7 (7, 7, 38), portanto 7 é uma mediana: o tempo
mediano de TV semanal da amostra é igual a 7.
Na lista de valores 2, 3, 7, 8, temos que 3 é uma mediana, pois 2 valores são menores
ou iguais e 3 valores são maiores ou iguais; que 7 é uma mediana, e que qualquer valor
entre 3 e 7 é um valor mediano. Neste caso, temos mais de uma mediana amostral.
Observe que a mediana não é afetada por valores extremos afastados da maioria dos
dados. De fato, no exemplo das horas de TV, se trocarmos 38 por 123, a mediana
continuará sendo 7, já a média passará para 29.
Por esta razão a mediana é uma medida mais representativa que a média ao analisar,
por exemplo, salários em uma empresa ou em uma cidade, onde os dados apresentam
uma dispersão assimétrica com relação ao seu ponto central.
Outros quantis 25
Exerćıcio
Obtenha a mediana para os dados do peso dos alunos, considerando todos os dados, e
depois obtenha o peso mediano das alunos e dos alunos, separadamente.
3.5 Outros quantis
Podemos generalizar o conceito de mediana para outra divisões da amostra. Dado
p ∈ [0, 1], definimos o quantil p, e o denotamos q(p), ao valor tal que:
pelo menos p ∗ 100% da amostra é menor ou igual a q(p), e
pelo menos (1− p) ∗ 100% da amostra é maior ou igual a q(p).
Os quantis mais usados são o primeiro quartil, correspondente a p = 0.25 também
denotado por q1, o terceiro quartil, para p = 0.75 e denotado por q3, e os decis, para
p = 0.1, 0.2, . . . , 0.9, denotados por d1, d2, . . . , d9, respectivamente.
Observe que a mediana corresponde ao segundo quartil e ao quinto decil.
Outra medida de dispersão para os dados é a chamada distância interquartil, definida
como a distância entre os quartis 1o e 3o, dq = q(0.75)− q(0.25).
Exerćıcio
Obtenha o primeiro e o terceiro quartis para os dados do peso dos alunos, considerando
todos os dados, e depois obtenha-os para o peso das alunos e dos alunos, separadamente.
3.6 Boxplot
Uma representação gráfica útil para comparar uma variável numérica em diferentes
categorias é o chamado boxplot.
A Figura 3.4 mostra o boxplot dos dados do consumo de caféına para as categorias de
doses. O eixo y representa a variável quantidade de caféına, e o eixo x, as categorias
comparadas.
Para cada retângulo que forma o gráfico, a base representa o primeiro quartil, q1, o topo
representa q3 e a linha interna, a mediana.
Podemos, neste gráfico, comparar uma medida central e a dispersão em cada categoria.
26 Resumindo dados
Figura 3.4: Boxplot para o consumo semanal de caféına, por categoria de doses.
Os pontos isolados fora dos retângulos representam dados at́ıpicos da amostra, ou seja,
valores afastados da grande massa dos dados. Por convenção, um dado é at́ıpico se
estiver afastado da amostra a uma distância de q1 ou q3 maior que 1.5dq.
As linhas verticais que saem do retângulo vão até o menor e o maior valores não-at́ıpicos
da amostra.
Os softwares Medidas do Corpo: Gráficos univariados e Medidas do Corpo: Boxplot
fazem parte de um conjunto de recursos educacionais que analisam, do ponto de vista
estat́ıstico, algumas medidas do corpo humano. Nestes recursos são apresentados e
discutidos os seguintes gráficos univariados: de barra, de setores, histograma e boxplot,
relacionando-os com as medidas resumo anteriores.
Exerćıcio
Grafique o boxplot para os dados do peso dos alunos, considerando todos os dados, e
depois grafique-os para o peso das alunos e dos alunos, separadamente. Que diferenças
você observa nas categorias? Compare pontos centrais e dispersão, assim como presença
ou ausência de pontos at́ıpicos.
http://www.mais.mat.br/wiki/Medidas_do_corpo:_gr%C3%A1ficos_univariados
http://www.mais.mat.br/wiki/Medidas_do_corpo:_boxplot
Caṕıtulo 4
Elementos de Amostragem
Ao estudar uma população, geralmente é imposśıvel realizar observações do todos os
indiv́ıduos. Um dos poucos casos em que podemos observar a população completa é a
população de votos, depois de contabilizá-los.
Nosso método é tomar uma amostra: uma parte relativamente pequena da população,
como fazem os institutos de pesquisa de opinião ou de intenção de voto.
Duas questões são fundamentais no processo de amostragem:
1. qual deve ser o tamanho da amostra?
2. quão representativa é a amostra coletada?
A primeira questão foge ao escopo deste curso, mas pode ser encontrada no livro de
Meyer, nas referências.
Figura 4.1: Amostragem aleatória.
28 Elementos de Amostragem
Trataremos aqui de alguns processos de seleção que permitem, em prinćıpio, obter
uma amostra representativa da população, os chamados processos probabiĺısticos ou
aleatórios de amostragem.
Estes procedimentos asseguram que cada elemento de uma população finita tem a mesma
chance de ser escolhido para a amostra.
4.1 Amostragem aleatória simples
Suponha que temos umagrande população de N objetos e que queremos extrair uma
amostra de tamanho n.
A amostragem aleatória simples (a.a.s.) consiste em sortear n elementos desta pop-
ulação, por exemplo, numerando todos os elementos da população e então sorteando n
valores de 1 até N .
Figura 4.2: Amostragem aleatória simples.
Na prática, não é sempre simples obter uma lista da população, e se for, as unidades
sorteadas podem ser de dif́ıcil acesso ou ter um custo alto ou mesmo ser imposśıvel de
coletar.
Além disso, se n for pequeno, nada garante que a amostra seja representativa: de um
grupo de 50 homens e 50 mulheres do qual queremos extrair 10 pessoas, podeŕıamos
sortear 9 mulheres e 1 homem para um estudo biomédico, viesando a resposta de uma
variável para a qual sexo seja uma caracteŕıstica relevante.
Existem outros métodos mais eficientes e baratos que a a.a.s., se tivermos informação
sobre a população em estudo, como os que veremos a seguir.
Amostragem estratificada 29
4.2 Amostragem estratificada
Quando a população é formada por subpopulações homogêneas com relação à variável
analisada, podemos realizar aas dentro de cada subpopulação (ou estrato): esta é a
chamada amostragem estratificada.
Figura 4.3: Amostragem estratificada.
Por exemplo, se estivermos interessados em estudar a altura das pessoas adultas de uma
região, podemos dividir a população entre homens e mulheres. Dentro de cada um destes
estratos, realizamos então uma aas.
Este procedimento permite diminuir a variabilidade das observações, obtendo estimati-
vas mais precisas dentro de cada grupo.
4.3 Amostragem por conglomerado
Se for natural dividir a população em conglomerados (cidades, quarteirões, salas de aula,
etc), a amostragem por conglomerado realiza uma aas para escolher alguns conglomer-
ados e depois amostra todos os indiv́ıduos dos conglomerados selecionados.
Esta metodologia pode ser muito eficiente em reduzir custos se os custos das viagens
entre unidades amostrais escolhidas aleatoriamente forem altos.
Um exemplo é dividir uma cidade em quarteirões, e então amostrar todas as casas de
quarteirões selecionados aleatoriamente.
30 Elementos de Amostragem
Figura 4.4: Amostragem por conglomerado.
4.4 Amostragem sistemática 1-em-k
Este tipo de amostragem começa ordenando a população de interesse, em uma lista de
nomes, em uma fila, no tempo, etc. Dado um valor natural k, selecionamos a primeira
unidade amostral aleatoriamente dentre os k primeiros. A seguir, selecionamos a amostra
escolhendo uma unidade a cada k unidades a partir da primeira.
Figura 4.5: Amostragem sistemática.
Por exemplo, um estudo sobre o trânsito nas rodovias poderia entrevistar um a cada
100 carros passando em um pedágio; uma pesquisa de boca de urna, normalmente usa
este sistema para evitar amostrar eleitores que compareçam em grupo para votar (e
provavelmente votantes de um mesmo candidato).
Amostragem sistemática 1-em-k 31
Este tipo de amostragem é fácil de ser aplicado, sendo mais eficiente se as unidades
variarem suavemente ao longo da lista ou do tempo.
32 Elementos de Amostragem
Referências Bibliográficas
[1] Carvalho, P.C.P., de Carvalho, J.B.P., Fernandez, P., Morgado, A.C.O. (2004)
Análise Combinatória e Probabilidade. Editora SBM.
[2] Feller, P. (1976) Introdução à Teoria de Probabilidades e suas Aplicações. Editora
Edgard Blücher.
[3] Gnedenko, B. (2008) A Teoria da Probabilidade. Editora Ciência Moderna.
[4] Halmos, P. (2001) Teoria Ingênua dos Conjuntos. Editora Ciência Moderna.
[5] James, B. (1996) Probabilidade: um curso em ńıvel intermediário. Coleção Projeto
Euclides.
[6] Meyer, P. (2000) Probabilidade: aplicações à estat́ıstica. Editora LTC.
[7] Revista do Professor de Matemática. SBM.
[8] Ross, S. (2010) Probabilidade: um curso moderno com aplicações. Editora Bookman
Co.
Páginas da internet
Em português
[9] ALEA, Acção Local de Estat́ıstica Aplicada, Portugal.
[10] Mais - Recursos Educacionais em Matemática, Brasil.
[11] Matemática Multimı́dia, Unicamp.
Em inglês
[12] História da Matemática, Universidade de St. Andrews, Escócia.
[13] Laboratório de Probabilidade e Estat́ıstica, Universidade do Alabama, EUA.
http://alea-estp.ine.pt/
http://www.mais.mat.br/recursos.html
http://www.m3.ime.unicamp.br/portal/
http://www-groups.dcs.st-and.ac.uk/~history/
http://www.math.uah.edu/stat/index.html
34 Referências Bibliográficas
[14] Cartogramas: informações gráficas sobre os páıses para saúde, economia, ciência,
poluição, etc.
http://www.worldmapper.org/textindex/text_index.html
	Estatística e o método científico
	O método científico
	Estatística como aprendizagem
	Estudo sobre a malária
	Amostragem, população e previsões
	Representando dados
	Gráfico de pontos
	Gráfico de barras
	Gráfico de setores
	Tabela de freqüências
	Histograma
	Diagrama de ramo-e-folhas
	Outros gráficos
	Série temporal
	Gráfico radial
	Cartogramas
	Resumindo dados
	Média
	Desvio-padrão
	Relação entre média e desvio-padrão
	Medianas
	Outros quantis
	Boxplot
	Elementos de Amostragem
	Amostragem aleatória simples
	Amostragem estratificada
	Amostragem por conglomerado
	Amostragem sistemática 1-em-k

Continue navegando