Buscar

Conceitos Básicos e Organização de Dados Estatísticos - AULA 01

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 53 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 53 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 53 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Unidade 1
Conceitos Básicos 
e
Organização de 
Dados Estatísticos
 
 
 
 
 
 
Estatística: É a ciência que coleta, organiza, analisa e 
interpreta dados para auxiliar na tomada de decisões.
Dados: São informações que vêm de observações, 
contagens, medições, respostas, etc.
Ex: “As pessoas que comem três porções diárias de grãos 
 integrais têm o risco de sofrer problemas cardíacos 
 reduzidos em 37%.” (Fonte: Whole Grains Concil.)
 “70% dos 1.500 danos à espinha dorsal em menores de 
 idade resultam de acidentes de carro e 68 dos feridos 
 não estavam usando o cinto de segurança.” (Fonte: UPI.)
 “Espera-se que a produção americana de carvão, que 
 aumentou 2,5% em 2006, sofra uma redução de 3,1% 
 em 2007.” (Fonte: Energy Information Administration) 
 
Conjuntos de Dados
Em Estatística existem dois tipos de conjuntos de dados:
População ► É o conjunto de todos os resultados, 
respostas, medidas ou contagens que são de interesse.
Amostra ► É um subgrupo de uma população.
Ex: Em uma pesquisa recente, foi perguntado a 1.708 adultos 
americanos se eles consideram o aquecimento global um 
problema que exige uma ação imediata do governo. 
Novecentos e trinta e nove deles responderam que sim. 
Identifique a população e a amostra. Descreva o conjunto de 
dados.
939 sim
769 não
Respostas de todos os adultos dos EUA (população)
Respostas dos adultos na pesquisa 
(amostra)
 
Parâmetro Populacional: É a descrição numérica de uma 
característica de uma população.
Ex: Os salários iniciais para os 667 MBAs graduados na 
Escola de Negócios da Universidade de Chicago 
aumentaram 8,5% em comparação com o ano anterior.
Estatística Amostral: É a descrição numérica de uma 
característica de uma amostra.
Ex: Uma pesquisa recente com uma amostra de MBAs 
reportou que o salário médio para um MBA é mais do que 
US$ 82.000,00 por ano. (Fonte: The Wall Street Journal)
Em uma checagem aleatória de uma amostra de lojas 
varejistas, o FDA (Food and Drug Administration) descobriu 
que 34% das lojas não estavam estocando peixes da forma 
apropriada. Descreva o conjunto de dados.
 
Classificação dos Dados
Dados Qualitativos: Consistem em atributos, rótulos ou 
registros não numéricos.
Dados Quantitativos: Consiste em medidas numéricas ou 
contagens.
Ex:
 
 
 Qualitativos Quantitativos 
Modelo Preço Básico (US$)
Ranger
Focus 
Taurus
Explorer
12.595,00
13.120,00
19.075,00
22.510,00
 
Estatística Descritiva: É o ramo da Estatística que trata da 
organização, resumo e apresentação dos dados.
Estatística Inferencial: É o ramo da Estatística que utiliza uma 
dada amostra para tirar conclusões sobre a população 
correspondente. A ferramenta básica utilizada pela Estatística 
Inferencial é a probabilidade.
Ex: Uma grande amostra de homens, com 48 anos de idade, foi 
estudada durante 18 anos. Para os solteiros, 70% ainda estavam 
vivos aos 65 anos. Para os casados, 90% estavam vivos aos 65 
anos. (Fonte: The Journal of Family Issues.)
Descritiva ► “Para os que são solteiros, 70% ainda ...”
Inferencial (Conclusão) ► Casados tem maior probabilidade de 
viver mais.
Em uma amostra dos analistas de Wall Street, a procentagem dos 
que previram incorretamente os lucros das empresas de alta 
tecnologia em um ano recente foi e 44%. (Fonte: Bloomberg.)
 
Planejamento de um Estudo Estatístico
1. Identifique a(s) variável(is) de interesse e a população 
de estudo.
2. Desenvolva um plano detalhado para coleta dos dados. 
Se usar uma amostra, certifique-se de ela é representativa 
da população.
3. Colete os dados.
4. Descreva os dados usando técnicas de Estatística 
Descritiva.
5. Interprete os dados e tome as decisões sobre a 
população usando Estatística Inferencial.
6. Identifique quaisquer erros possíveis.
 
1. Variáveis
Variável é a grandeza, atributo, característica, etc., 
que é coletada em um estudo estatístico. 
● Qualitativa ► Expressa por atributos.
Ex: sexo, cor do cabelo, etc.
● Quantitativa ► Expressa por números.
Discreta: Expressa por números bem definidos, em 
geral inteiros não negativos.
Ex: nº de alunos em sala de aula, hoje.
Contínua: Expressa por números com infinitas 
casas decimais.
Ex: alturas dos alunos.
 
● Independente ► Não depende de nenhuma outra variável.
● Dependente ► Depende do valor de outra variável.
Ex: Num estudo estatístico sobre como o nível de estresse 
afeta a frequência cardíaca, o nível de estresse é uma 
variável independente e a frequência cardíaca é uma variável 
dependente.
Classifique as variáveis em qualitativas ou quantitativas 
(contínuas ou discretas).
- Cor do olhos.
- Índice de liquidez das indústrias Tabajara.
- Produção de café no Brasil (em toneladas).
- Número de aparelhos de TV com defeito.
- Comprimento dos pregos produzidos por uma empresa.
- O nº obtido em cada jogada de um dado.
 
2. Planejamento Experimental
■ Controle: É importante controlar os diversos fatores 
que podem influenciar (e arruinar) os resultados de um 
experimento estatístico. 
Alguns deles são:
♦ Variáveis de Confusão: Ocorrem quando um 
pesquisador não consegue dizer a diferença entre os 
efeitos de diferentes fatores em uma variável.
Ex: Para atrair mais clientes, o dono de uma cafeteria 
faz uma reforma na loja usando cores vibrantes. Ao 
mesmo tempo, um novo shopping center é 
inaugurado na região. Se os negócios da cafeteria 
aumentam, não se sabe se é devido à reforma ou à 
presença do shopping center. Os dois efeitos se 
confundem.
 
♦ Efeito Placebo: Ocorre quando um sujeito reage 
favoravelmente a um placebo, ou seja, quando, de 
fato, ele(a) não recebeu tratamento algum.
Ex: Testes de eficácia de medicamentos, 
tratamentos, etc. 
OBS: Para ajudar a minimizar esse efeito, pode-se 
usar o chamado teste cego, onde o sujeito não 
sabe se está recebendo tratamento ou placebo. O 
teste duplo-cego é quando nem o sujeito nem o 
pesquisador sabem o que está sendo administrado. 
♦ Efeito Hawthorne: Ocorre quando os sujeitos 
mudam o comportamento simplesmente porque 
sabem que estão participando de um experimento.
Ex: Questionário para doação de sangue.
 
■ Aleatorização: É o processo de designar sujeitos 
aleatoriamente para diferentes grupos de tratamento. É 
importante para evitar resultados tendenciosos.
● Planejamento de Blocos Aleatórios: Os sujeitos com 
características similares são dividos em blocos e, então, 
são designados aletóriamente para os grupos.
Ex: Um pesquisador que está testanto os efeitos de uma nova 
bebida para perda de peso decide, primeiramente, dividir os 
sujeitos em categorias de idade, tais como 30 a 39 anos, 40 a 
49 anos e acima de 50 anos. Então, dentro de cada grupo de 
idade, designou-se aleatoriamente os sujeitos ou para o grupo 
de tratamento ou para o grupo de controle(?), conforme 
mostrado.
Todos os 
sujeitos
30 a 39 
anos
40 a 49 
anos
Mais de 
50 anos
Controle
Controle
Controle
Tratamento
Tratamento
Tratamento
 
● Planejamento de Pares Combinados: Os sujeitos 
são colocados em pares de acordo com a 
similaridade. Um sujeito no par é aleatoriamente 
selecionado para receber o tratamento e o outro 
sujeito do par recebe um tratamento diferente. 
Ex: Dois sujeitos podem ser colocados em pares por 
causa da idade, de uma localização geográfica ou 
uma característica física em particular.
■ Replicação: É a repetição de um experimento 
utilizando um grande número de indivíduos. É 
importante para aumentar a validade dos resultados.
Ex: Suponha que um experimento seja planejadopara 
testar uma vacina contra a gripe. No experimento, 
10.000 pessoas recebem a vacina e outras 10.000 
recebem um placebo. 
 
Uma empresa quer testar a eficácia de uma nova goma de mascar 
para ajudar as pessoas a pararem de fumar. Identifique um 
problema em potencial com o planejamento experimental dado em 
cada um dos casos abaixo e sugira um maneira de melhorá-lo.
(1) A empresa identifica dez adultos que são fumantes há bastante 
tempo. Cinco deles recebem a nova goma de mascar e os outros 
cinco recebem um placebo. Depois de dois meses, eles são 
avaliados e descobre-se que os cinco sujeitos que estão usando a 
nova goma pararam de fumar.
(2) A empresa indentifica mil adultos que são fumantes há bastante 
tempo. Eles são divididos em blocos de acordo com o gênero. As 
mulheres recebem a nova goma e os homens recebem o placebo. 
Depois de dois meses, o grupo de mulheres tinha um número 
significativo de sujeitos que pararam de fumar.
(3) A empresa identifica 240 adultos fumantes. Eles são designados 
aleatoriamente para estar no grupo de tratamento ou de controle. 
Cada sujeito também recebe um DVD sobre os perigos do cigarro. 
Depois de quatro meses, a maioria dos sujeitos no grupo de 
tratamento parou de fumar. 
 
3. Coleta de Dados 
► Estudo Observacional: O pesquisador observa e mede as 
caracterísiticas de interesse de parte da população, mas não muda 
as condições existentes.
Ex: Foi feito um estudo observacional no qual os pesquisadores 
observam e registram o comportamento oral de crianças acima de 
3 anos de idade com objetos não alimentícios. (Fonte: Pediatrics 
Magazine)
► Experimento: Um tratamento é aplicado a uma parte da 
população e as respostas são observadas. Outra parte da 
população pode ser usada como grupo de controle, no qual 
nenhum tratamento é aplicado.
Ex: Foi realizado um experimento no qual diabéticos tomaram 
extrato de canela diariamente enquanto o grupo de controle não 
tomou nada. Depois de 40 dias, os diabéticos que tomaram o 
extrato de canela reduziram seu risco de problemas cardíacos, 
enquanto o grupo de controle não experimentou mudanças. (Fonte: 
Diabetes Care)
 
► Simulação: É o uso de um modelo matemático ou 
físico para reproduzir as condições de uma situação 
ou processo. 
Ex: Os fabricantes de automóveis usam simulações 
com bonecos para estudar os efeitos das batidas em 
humanos.
► Levantamento ou Pesquisa de Mercado: Em 
geral, essas pesquisas são conduzidas diretamente 
com pessoas, por meio de perguntas.
Ex: Uma pesquisa é feita com médicas para 
determinar se o argumento principal para a escolhar 
profissional é a estabilidade financeira.
 
Considere os estudos estatísticos a seguir. Qual método de 
coleta de dados você usaria para cada estudo?
(1) Um estudo do efeito da mudança dos padrões de voo no 
número de acidentes com aviões.
(2) Um estudo dos efeitos da ingestão de farinha de aveia na 
redução da pressão arterial.
(3) Um estudo sobre como alunos da quarta série resolvem 
um quebra-cabeça.
(4) Um estudo sobre os índices de aprovação presidencial 
com os residentes no Brasil.
(5) Um estudo sobre os efeitos dos exercícios físicos no alívio 
da depressão.
(6) Um estudo do sucesso de graduandos de uma grande 
universidade para encontrar um emprego durante o primeiro 
ano de graduação.
 
Censo: É uma contagem ou medição de uma 
população inteira.
Amostragem: É uma contagem ou medição de parte 
representativa de uma população.
OBS: Um erro de amostragem é quando há 
diferença entre os resultados da amostra e da 
população.
Técnicas de Amostragem:
Amostra Aleatória ► É aquela em que todos os 
membros da população têm chances iguais de 
serem selecionados. 
OBS: Uma amostra aleatória simples é aquela na 
qual toda amostra possível de mesmo tamanho tem 
a mesma chance de ser selecionada. 
 
Ex: Para contar o número de pessoas que moram no 
Condado de West Ridge, você poderia designar um 
número diferente para cada residência, usar uma 
ferramenta tecnológica ou uma tabela de números 
aleatórios (ver instruções) para gerar uma amostra de 
números e então contar o número de pessoas que vive 
em cada uma das residências selecionadas.
OBS: Quando escolhemos os membros de uma amostra, 
precisamos decidir se é aceitável ter o mesmo membro 
da população mais de uma vez. Se for aceitável, o 
processo de amostragem é dito com reposição, do 
contrário, o processo é dito sem reposição.
Há 731 estudantes que se inscreveram no curso de 
Estatística em sua faculdade. Você deseja formar uma 
amostra de 8 estudantes para responder às questões de 
uma pesquisa. Selecione os estudantes que pertencerão à 
uma amostra aleatória simples.
 
Amostra Estratificada ► É utilizada quando for 
importante que a amostra tenha membros de cada 
segmento da população. 
Ex: Para coletar uma amostra estratificada do 
número de pessoas que moram no Condado de 
West Ridge, poderíamos dividir as residências em 
níveis socioeconômicos e, então, selecionar 
aleatoriamente residências de cada nível.
 
Amostra por Agrupamento ► É usada quando a 
população está em subgrupos que ocorrem naturalmente.
Ex: Para coletar uma amostra por agrupamento do número 
de pessoas que moram no Condado de West Ridge, 
podemos dividir as residências em grupos de acordo com 
os códigos postais, então, selecionar todas as residências 
em um ou mais (mas não todos) códigos postais e contar 
o número de pessoas que vivem em cada residência.
 
Amostra Sistemática ► É aquela na qual é 
atribuído um número a cada membro da população 
e a amostra é então formada tomando os membros 
a intervalos regulares.
Ex: Para coletar uma amostra sistemática do 
número de pessoas que moram em West Ridge, 
poderíamos designar um número diferente para 
cada residência, escolher aleatoriamente um 
número inicial, selecionar cada 100ª residência e 
contar o número de pessoas vivendo em cada 
uma. 
 
Você está realizando um estudo para determinar a opinião 
dos estudantes em sua faculdade sobre as pesquisas com 
células-tronco. Identifique a técnica de amostragem usada se 
selecionasse as amostras abaixo.
(1) Você seleciona uma classe aleatoriamente e questiona 
cada aluno da classe.
(2) Você divide a população de estudantes com relação às 
graduações, seleciona aleatoriamente e questiona alguns de 
cada curso de graduação.
(3) Você designa um número para cada aluno e gera 
números aleatoriamente. Então, você questiona cada 
estudante cujo número é selecionado aleatoriamente.
(4) Você seleciona estudantes de sua aula de Estatística.
(5) Você designa um número para cada estudante e, depois 
de escolher um número inicial, questiona cada 25º aluno.
 
4. Estatística Descritiva
Distribuição de Frequências: É uma tabela que 
mostra os dados divididos em classes com uma 
contagem do número de entradas de dados em cada 
classe. A frequência (f) de uma classe é o número de 
entradas de dados nessa classe.
Amplitude dos Dados: É a diferença entre os valores 
máximo e mínimo das entradas de dados.
Largura de Classe: É a distância entre os limites 
inferiores (ou superiores) de classes consecutivas.
Limite Inferior da Classe: É o menor valor que pode 
pertencer à classe.
Limite Superior da Classe: É o maior valor que pode 
pertencer à classe.
 
Roteiro para construir uma distribuição de frequências:
1) Decida o número de classes►Quando o nº de classes não for 
especificado, escolha sempre um número entre 5 e 20, de acordo com 
o conjunto de dados.
2) Encontre a largura de classe►Determine a amplitude dos dados, 
divida pelo número de classes e faça o arredondamento que for 
conveniente.
3) Encontre os limites de classe►Você pode usar a entrada de dados 
mínima como limite inferior da primeiraclasse. Para encontrar os 
limites inferiores das classes restantes, adicione a largura de classe ao 
limite inferior da primeira classe e assim sucessivamente até a última 
classe. Em seguida encontre o limite superior da primeira classe. 
Lembre-se que as classes não se sobrepõem. Encontre os limites 
superiores das classes restantes usando o mesmo procedimento.
4) Encontre a frequência de cada classe►A frequência de cada classe 
será o número de entradas de dados dentro dela. A soma de das 
frequências de todas as classes dever ser igual ao tamanho da 
amostra. 
 
Ex: O conjunto de dados amostrais a 
seguir lista o número de minutos que 50 
usuários de internet gastaram na rede 
durante a sessão mais recente. Construa 
uma distribuição de frequências para sete 
classes.
50 40 41 17 11 7 22 44 28 21 
19 23 37 51 54 42 86 41 78 56 
72 56 17 7 69 30 80 56 29 33 
46 31 39 20 18 29 34 59 73 77 
36 39 30 62 54 67 39 31 53 44
 
1) O número de classes (7) é dado no problema.
2) As entradas de dados mínima e máxima são, 
respectivamente, 7 e 86. Portanto, a amplitude dos dados é 
86 – 7 = 79. Dividindo pelo número de classes obtemos a 
largura de classe: 79 / 7 ≈ 11,29 ≈ 12.
3) Utilizando 7 como limite inferior da primeira classe, 
encontramos os limites inferiores das seis classes restantes 
adicionando a largura de classe (12) até chegarmos a última 
classe. Estes ficam: 7, 19, 31, 43, 55, 67 e 79. O limite 
superior da primeira classe é um a menos que o limite inferior 
da segunda classe e assim sucessivamente. Estes ficam: 18, 
30, 42, 54, 66, 78 e 90. Portanto, as sete classes de dados 
são: 7-18; 19-30; 31-42; 43-54; 55-66; 67-78 e 79-90.
4) O próximo passo é contar quantas entradas de dados há 
em cada classe. Por exemplo, a entrada de dado 51 está 
dentro da classe 43-54. 
 
Classe Marca Frequência (f) 
7 - 18 |||| | 6
19 - 30 |||| |||| 10
31 - 42 |||| |||| ||| 13
43 - 54 |||| ||| 8
55 - 66 |||| 5
67 - 78 |||| | 6
79 - 90 || 2
Soma = 50Limite Inferior Limite Superior
 
Construa uma distribuição de frequências 
para os dados abaixo, que representam o 
número de touchdowns marcados por todos 
os 119 times de futebol americano da 
primeira divisão da NCAA na temporada de 
2006. Use oito classes.
 
Ponto Médio de uma Classe: É a soma dos limites inferior e superior 
dessa classe dividido por dois.
 Ponto Médio = Limite Inferior + LimiteSuperior 
 2
OBS: Após encontrar o ponto médio da primeira classe basta 
adicionar a ele a largura de classe para encontrar os pontos médios 
das classes restantes.
Frequência Relativa de um Classe: É a fração ou porcentagem dos 
dados que está dentro dessa classe. Para encontrar a frequência 
relativa de uma classe, basta dividir a frequência f da classe pelo 
tamanho da amostra n.
 Frequência Relativa = Frequência da Classe = f 
 Tamanho da Amostra n
OBS: A soma das frequências relativas de todas as classes deve ser 
igual a 1 ou 100%.
Frequência Acumulada de um Classe: É a soma da frequência 
dessa classe com as frequências das classes anteriores.
OBS: A frequência acumulada da última classe é igual ao tamanho da 
amostra n. 
 
Ex: Usando a distribuição de frequências do exemplo 
de uso da internet, encontre o ponto médio, a 
frequência relativa e acumulada de cada classe. 
Identifique quaisquer padrões nos dados.
► O ponto médio da primeira classe é: (7+18)/2 = 
12,5. Para encontrar os demais basta somar a largura 
de classe 12. Estes ficam então: 24,5; 36,5; 48,5; 
60,5; 72,5 e 84,5.
► A frequência relativa da primeira classe é: 6/50 = 
0,12. As demais são: 0,2; 0,26; 0,16; 0,1; 0,12 e 0,04.
► A frequência acumulada de cada classe é: 6; 
6+10=16; 6+10+13=29; 6+10+13+8=39; 
6+10+13+8+5=42; 6+10+13+8+5+6=48 e 
6+10+13+8+5+6+2=50.
 
Classe Frequência (f) Ponto Médio Frequência Relativa
Frequência 
Acumulada
7 - 18 6 12,5 0,12 6
19 - 30 10 24,5 0,20 16
31 - 42 13 36,5 0,26 29
43 - 54 8 48,5 0,16 37
55 - 66 5 60,5 0,10 42
67 - 78 6 72,5 0,12 48
79 - 90 2 84,5 0,04 50
Soma = 50 Soma = 1
 
Um padrão que podemos observar é que o 
período de duração da conexão mais comum 
entre os usuários foi de 31 a 42 minutos e o 
menos comum foi de 76 a 90 minutos.
Outro ponto interessante é que aproximadamete 
17% dos usuários ficou conectado por mais de 
60 minutos, enquanto aproximadamente 58% 
ficou conectado por menos de 40 minutos.
Usando a distribuição de frequências do número 
de touchdowns, encontre o ponto médio, a 
frequência relativa e acumulada de cada classe. 
Identifique quaisquer padrões nos dados.
 
Gráficos de Distribuições de Frequências:
Histograma de Frequências: É um diagrama de barras que 
representa a distribuição de frequências de um conjunto de 
dados.
Um histograma possui as seguintes propriedades:
1) A escala horizontal é quantitativa e mede os valores dados.
2) A escala vertical mede as frequências das classes.
3) As barras consecutivas devem estar encostadas umas nas 
outras.
Ex: 
 
Fronteiras de Classe: São números que separam as 
classes sem deixar lacunas entre elas.
Ex: Construa um histograma de frequências para a 
distribuição de frequências do exemplo de uso da 
internet. Descreva qualquer padrão observado.
Primeiramente, encontremos as fronteiras de classe. A 
distância entre o limite superior da primeira classe e o 
limite inferior da segunda é: 19 – 18 = 1. Metade dessa 
distância é 0,5. Então as fronteira inferior e superior da 
primeira classe são: 
►Fronteira inferior da primeira classe: 7 – 0,5 = 6,5
►Fronteira superior da primeira classe: 18 + 0,5 = 18,5
OBS: As frontreiras das classes restantes podem ser 
obtidas adicionando a largura de classe até chegar à 
última classe.
 
 
Use a distribuição de frequências do número de 
touchdowns para construir um histograma rotulado pelos 
pontos médios e pelas fronteiras de classe. Descreva 
quaisquer padrões observados.
Polígono de Frequências: É um gráfico de linha que 
enfatiza as mudanças contínuas das frequências. É obtido 
unindo-se os pontos médios das classes num histograma.
Ex: 
 
Ex: Faça um polígono de frequências para a distribuição 
de frequências do exemplo de uso da internet.
OBS: Como o gráfico de um polígono de frequências deve 
começar e terminar no eixo horizontal, prolonga-se o lado 
esquerdo em uma largura de classe antes do ponto médio 
da primeira classe e prolonga-se o lado direito em uma 
largura de classe depois do ponto médio da última classe. 
 
Use a distribuição de frequências do número de 
touchdowns para construir um polígono de frequências. 
Descreva quaisquer padrões observados.
Histograma de Frequências Relativas: Possui a mesma 
forma e a mesma escala horizontal do histograma de 
frequências correspondente. A diferença é que a escala 
vertical mede a frequência relativa. 
Ex: Faça um histograma de frequências relativas para a 
distribuição de frequências do exemplo do uso da internet.
 
Use a distribuição de frequências do exemplo do 
número de touchdowns para construir um histograma 
de frequências relativas.
Gráfico de Frequências Acumuladas (ou Ogiva): É 
um gráfico de linha que mostra as frequências 
acumuladas de cada classe em sua fronteira de classe 
superior.
OBS: O gráfico deve começar na fronteira inferior da 
primeira classe (a frequência acumulada é zero) e deve 
terminar na fronteira superior da última classe (a 
frequência acumulada é igual ao tamanho da amostra).Ex: Desenhe uma ogiva para a distribuição de 
frequências do exemplo de uso da internet. Estime 
quantos usuários gastaram 60 minutos ou menos on-
line na sessão mais recente. 
 
Com base na ogiva acima, podemos ver que por volta de 40 
usuários gastaram 60 minutos ou menos conectados durante 
a última sessão. 
Use a distribuição de frequências do exemplo do número de 
touchdowns para construir uma ogiva. Estime o número de 
times que marcaram 44 touchdowns ou menos.
 
Gráfico de Setores (Pizza): Consiste em um círculo 
dividido em setores que representam as diferentes 
categorias presentes no conjunto de dados. A área de 
cada setor é proporcional à frequência de cada categoria.
Ex: O número de ocupantes de veículos motorizados 
mortos em acidentes em 1995 e 2005 é mostrado na 
tabela abaixo. Use um gráfico de setores para organizar os 
dados. O que podemos concluir? 
 (1995) (2005)
Tipo de 
Veículo Mortos
Carros 18.440
Caminhões 13.778
Motocicletas 4.553
Outros 823
(Fonte: U.S. Department of 
Transportation, National Highway 
Traffic Safety Administration)
Tipo de 
Veículo Mortos
Carros 22.423
Caminhões 10.216
Motocicletas 2.227
Outros 425
 
Comece encontrando a frequência relativa de cada 
categoria. Então, construa um gráfico de setores usando 
o ângulo central que corresponda a cada categoria. Para 
encontrar o ângulo central multiplique a frequência 
relativa da categoria por 360º. Por exemplo, o ângulo 
central para carros, em 2005, é: 360º∙(0,49) ≈ 176º.
Do gráfico, podemos ver que a maioria das fatalidades 
em acidentes com veículos motorizados ocorreu com 
ocupantes de carros. 
 
Gráfico de Colunas (Barras): Consiste em 
colunas (barras) verticais (horizontais) no qual a 
altura (comprimento) de cada coluna (barra) 
representa a frequência ou frequência relativa. 
OBS: Quando as colunas são ordenadas da 
mais alta para a mais baixa, o gráfico recebe o 
nome de Diagrama de Pareto. 
Ex:
 
Gráfico de Série Temporal: É usado para descrever 
um conjunto de dados cujas entradas foram tomadas 
a intervalos de tempo regulares.
Ex: A tabela a seguir lista o número de usuários de 
telefonia celular (em milhões) para o período de 1995 
até 2005. Construa um gráfico de série temporal para 
o número de usuários de celulares. O que podemos 
concluir? 
 
(1) Recentemente a indústria de varejo perdeu 41 
milhões com redução nos estoques. As causas da 
redução de estoque são: erro administrativo (7,8 
milhões), roubos por funcionários (15,6 milhões), 
roubo em lojas (14,7 milhões) e fraudes nas vendas 
(2,9 milhões). Construa um gráfico de colunas 
(barras) e um diagrama de Pareto para organizar os 
dados. Se você fosse um varejista, para qual causa 
de redução de estoques você olharia primeiro?
(2) Use a tabela do exemplo dos usuários de telefonia 
celular para construir um gráfico de série temporal 
para a conta média de celular de um usuário local no 
período de 1995 a 2005.
 
Cartograma: É uma representação de dados feita sobre uma 
carta geográfica. É empregado quando o objetivo é relacionar 
dados estatísticos diretamente com regiões geográficas.
Ex:
 
Pictograma: É uma represetação de dados feita através de 
figuras ilustrativas. Visa tornar a apresentação de dados 
mais atraente e de melhor compreensão para o público.
Ex:
	Slide 1
	Slide 2
	Slide 3
	Slide 4
	Slide 5
	Slide 6
	Slide 7
	Slide 8
	Slide 9
	Slide 10
	Slide 11
	Slide 12
	Slide 13
	Slide 14
	Slide 15
	Slide 16
	Slide 17
	Slide 18
	Slide 19
	Slide 20
	Slide 21
	Slide 22
	Slide 23
	Slide 24
	Slide 25
	Slide 26
	Slide 27
	Slide 28
	Slide 29
	Slide 30
	Slide 31
	Slide 32
	Slide 33
	Slide 34
	Slide 35
	Slide 36
	Slide 37
	Slide 38
	Slide 39
	Slide 40
	Slide 41
	Slide 42
	Slide 43
	Slide 44
	Slide 45
	Slide 46
	Slide 47
	Slide 48
	Slide 49
	Slide 50
	Slide 51
	Slide 52
	Slide 53

Continue navegando