Buscar

Aula 2 - Estatística e Probabilidade

Prévia do material em texto

Aula 2 
Distribuição de Frequência e 
Histogramas 
 
ESTATÍSTICA E 
PROBABILIDADE APLICADA 
Elizabete.silva@fmu.br 
2020.2 
Objetivos: 
 
 Identificar uma distribuição de Frequência absoluta, relativa 
e acumulada 
 
Esboçar e interpretar histogramas de frequência 
 
 
 
 
Tipos de ESTATÍSTICA 
Estatística Descritiva Estatística Inferencial 
 Dedutiva 
 Etapa inicial da análise 
 Coleta, organização, apresentação e 
conclusões iniciais 
 Indutiva 
 Extrapolação (grande conjunto de 
dados - população) 
 Tomada de decisão 
Na aula passada... 
População x Amostra 
Na aula passada... 
Na aula passada... 
Métodos comuns de AMOSTRAGEM 
Na aula passada... 
 
 Nas pesquisas estatísticas, as características sobre as quais queremos 
obter informação são chamadas variáveis. 
 
Variáveis 
Quantitativa Qualitativa 
Na aula passada... 
Quantitativa Qualitativa 
Variáveis 
Discreta Contínua Nominal Ordinal 
Na aula passada... 
Para onde você iria? 
https://forms.office.com/P
ages/ResponsePage.aspx?id
=nqplKssl7kiFm3JpfMgFXD
BM6ihWh1hGozcsp8-
UF4pUREZHUlpCNlhYSEVX
U0VROEY0TE1RVExBNC4u 
Distribuição de Frequências 
Uma distribuição de frequências de uma variável lista todas as categorias, 
bem como o número de elementos que pertencem a cada uma das categorias. 
 
 
Exemplo 
Foi perguntado a uma amostra de 30 pessoas que consomem rosquinhas com frequência, 
que variedades de rosquinhas é a sua favorita. As respostas dessas 30 pessoas se 
apresentaram do seguinte modo: 
 
Exemplo 
Com glacê..................... 8 pessoas 
 
Cobertura açucarada.... 5 pessoas 
 
Com recheio................. 7 pessoas 
 
Simples......................... 3 pessoas 
 
Outra ........................... 7 pessoas 
FREQUÊNCIA 
ABSOLUTA 
Distribuição de Frequências Relativas 
A frequência relativa de uma categoria é obtida pela divisão da frequência 
daquela categoria pela soma de todas as frequências. Dessa maneira, a 
frequência relativa mostra qual fração, ou proporção, da frequência total 
pertence à categoria correspondente. Uma distribuição de frequências 
relativas lista as frequências relativas para todas as categorias. 
𝑭𝒓𝒆𝒒𝒖ê𝒏𝒄𝒊𝒂 𝒓𝒆𝒍𝒂𝒕𝒊𝒗𝒂 𝒅𝒆 𝒖𝒎𝒂 𝒄𝒂𝒕𝒆𝒈𝒐𝒓𝒊𝒂 =
𝑭𝒓𝒆𝒒𝒖ê𝒏𝒄𝒊𝒂 𝒅𝒂𝒒𝒖𝒆𝒍𝒂 𝒄𝒂𝒕𝒆𝒈𝒐𝒓𝒊𝒂
𝑺𝒐𝒎𝒂 𝒅𝒆 𝒕𝒐𝒅𝒂𝒔 𝒂𝒔 𝒇𝒓𝒆𝒒𝒖ê𝒏𝒄𝒊𝒂𝒔
 
Distribuição de Frequências Relativas 
em Percentagem 
𝑷𝒆𝒓𝒄𝒆𝒏𝒕𝒂𝒈𝒆𝒎 = 𝑭𝒓𝒆𝒒𝒖ê𝒏𝒄𝒊𝒂 𝑹𝒆𝒍𝒂𝒕𝒊𝒗𝒂 X 𝟏𝟎𝟎 
A percentagem para uma categoria é obtida pela multiplicação da 
frequência relativa daquela categoria por 100. Uma distribuição de 
percentagens lista as percentagens para todas as categorias 
Exemplo 
Variedade de Rosquinha Frequência Relativa Percentagem 
Com glacê 8/30 = 0,267 0,267.100 = 26,7% 
Com recheio 7/30 = 0,233 0,233. 100 = 23,3% 
Cobertura açucarada 5/30 = 0,167 0,167.100 = 16,7% 
Simples 3/30 = 0,1 0,1.100 = 10% 
Outras 7/30 = 0,233 0,233.100= 23,3% 
SOMA = 1 SOMA = 100% 
Classes ou Intervalos 
• Quando o número de resultados obtidos em uma pesquisa é 
demasiadamente grande, é comum agruparmos esses resultados 
em faixas de valores, denominadas de classes ou intervalos. 
 
• No entanto, ao resumirmos os valores individuais em intervalos 
ou classes, estamos conscientes de que algum erro pode estar 
sendo inserido. 
 
Exemplo 
Como organizar dados obtidos, por meio de uma pesquisa sobre a 
faixa etária de grupo de alunos. 
Aos valores à esquerda de cada 
faixa etária, damos o nome de 
limites inferiores (Li), e aos valores 
à direita, damos o nome de limites 
superiores (Ls) das classes ou 
intervalos. 
Exemplo 
O símbolo representa que a classe ou intervalo é fechado à esquerda, ou seja, o valor escrito à 
esquerda (limite inferior) pertence ao intervalo e, como a classe ou intervalo é aberto à direita, o valor escrito à 
direita (limite superior) não pertence a mesma 
Exemplo 
Número de Classes 
Não há regras rápidas e absolutas sobre o número de classes ou a escolha das 
classes em si. Entre 5 e 20 classes serão satisfatórias para a maior parte dos 
conjuntos de dados. Normalmente, quanto maior o número de observações 
em um conjunto de dados, mais classes devem ser usadas 
 
 Lembre-se, esses números são apenas uma recomendação. 
 
Número de Classes 
A regra Sturges é um método empírico amplamente usado em estatística 
descritiva para determinar o número de classes que devem existir em um 
histograma de frequência, a fim de classificar um conjunto de dados 
representando uma amostra ou população. Ela fornece um número ideal de 
classes: 
 
𝒌 = 𝟏 + 𝐥𝐨𝐠𝟐(𝑵) 𝑜𝑢 𝒌 = 𝟏 + 𝟑, 𝟑𝟐𝟐 𝐥𝐨𝐠(𝑵) 
- k é o número de classes. 
- N é o número total de observações 
- log é o logaritmo comum da base 10 
Exemplo 
Uma pesquisa trouxe às idades de homens que se exercitam em uma 
academia local. 
 
 
 
 
Para determinar o número de classes é necessário conhecer o tamanho da 
amostra ou o número de observações. Nesse caso, temos 30. 
𝒌 = 𝟏 + 𝐥𝐨𝐠𝟐(𝑵) 𝑜𝑢 𝒌 = 𝟏 + 𝟑, 𝟐𝟐𝟐 𝐥𝐨𝐠(𝑵) 
Exemplo 
Em seguida, aplicando a regra Sturges, temos: 
 
𝑘 = 1 + 3,322. log(𝑁) 
𝑘 = 1 + 3,322. log(30) 
𝑘 = 1 + 3,322.1,4771 
𝑘 ≅ 5,90 (±6 𝑐𝑙𝑎𝑠𝑠𝑒𝑠) 
Amplitude 
A amplitude do intervalo (ou classe) é obtida subtraindo-se o limite superior 
(𝐿𝑠) do limite inferior (𝐿𝑖) de qualquer classe da série, isto é: 
 
𝑨 = 𝑳𝒔 − 𝑳𝒊 
Por exemplo, 
A = 25 – 20 = 5, então, na distribuição de frequências anterior, os intervalos 
(ou classes) têm amplitude A = 5. 
 
Esta é chamada de Amplitude total. 
Amplitude 
Agora, usando a regra de Sturges, a amplitude da classe é obtida subtraindo-se 
o limite superior do limite inferior de qualquer classe da série e depois, 
dividindo-se esse valor pelo número de classes (K), isto é: 
𝑨 =
𝑳𝒔 − 𝑳𝒊
𝒌
 
Amplitude 
Por exemplo, 
 
 
 
 
𝐴 =
𝐿𝑠 − 𝐿𝑖
𝑘
=
(46 − 13)
6
=
33
6
≅ 5,5 (𝑎𝑚𝑝𝑙𝑖𝑡𝑢𝑑𝑒 𝑑𝑒 6, 𝑠𝑒𝑚𝑝𝑟𝑒 𝑗𝑜𝑔𝑎 𝑝𝑎𝑟𝑎 𝑐𝑖𝑚𝑎) 
Amplitude 
Logo, ficaria com 6 classes e cada classe com amplitude de 6 (lembrando que 
acrescentamos o valor da amplitude ao limite inferior, ou seja, 13 + 6 = 19, por 
exemplo) 
 
 
 
 
Intervalos 
13 19 
19 25 
25 31 
31 37 
37 43 
43 49 
Distribuição de Frequência Acumulada 
Voltemos ao Exemplo dos alunos: 
 
 
 
 
 
 
 
 
E se quisermos saber quantos alunos tem 20 anos ou menos? 
 
 
Distribuição de Frequência Acumulada 
Pode-se responder a essa questão utilizando uma distribuição de 
frequências acumuladas. Cada uma das classes em uma tabela de 
distribuição de frequências acumuladas fornece o número total de 
valores que se posicionam abaixo de um determinado valor. Uma 
distribuição de frequências acumuladas é construída somente para 
dados quantitativos. 
Uma distribuição de frequências acumuladas fornece o número total de 
valores que se posicionam abaixo da fronteira superior 
Distribuição de Frequência Acumulada 
Faixa etária Frequência Absoluta Frequência Acumulada 
0 a 5 anos 0 0 
5 a 10 anos 6 0 + 6 = 6 
10 a 15 anos 14 0 + 6 + 14 = 20 
15 a 20 anos 20 0 + 6 + 14 + 20 = 40 
20 a 25 anos 8 0 + 6 + 14 + 20 + 8 = 48 
25 a 30 anos 2 0 + 6 + 14 + 20 + 8 + 2 = 50 
As frequências relativas acumuladas são obtidas dividindo-se as frequências acumuladas 
pelo número total de observações no conjunto de dados. As percentagens acumuladas são 
obtidas multiplicando-se as frequências relativas acumuladas por 100. 
Distribuição de Frequência Relativa 
Acumulada 
Faixa etária Frequência Relativa 
Acumulada 
Percentagem Acumulada 
0 a 5 anos 0/50 = 0 0 % 
0 a 10 anos 6/50 = 0,12 12% 
0 a 15 anos 20/50 = 0,4 40% 
0 a 20 anos 40/50 = 0,8 80% 
0 a 25 anos 48/50 = 0,96 96% 
0 a 30 anos 50/50 = 1 100% 
Exercício 
Para onde você iria? 
GRÁFICOS Gráfico é uma forma de organizar informações por meio de imagens 
 
 Uma imagem vale mais do que mil palavras. A importância de um gráfico 
está ligado à facilidade e rapidez na interpretação das informações e 
também à variedade de formas de ilustração dos dados apresentados. 
 
 Dependendo do tipo de variável, a leitura fica melhor com um tipo de 
gráfico do que outro 
GRÁFICOS 
GRÁFICO DE BARRAS 
 O gráfico de barras faz a representação dos valores por meio de retângulos 
na posição vertical. 
 
 Utilizado quando desejamos ressaltar a quantidade de valor em estudo 
 
 O gráfico de barras mede uma certa informação e não um grupo de dados 
 
 Os dados são indicados na posição vertical e as quantidades aparecem na 
posição horizontal 
 
Exemplo 
É possível, ao analisar o gráfico, determinar a nota de cada um dos alunos, 
por exemplo, Caio teve nota 5. 
HISTOGRAMA 
 O histograma é uma ferramenta estatística. Quando a variável de uma 
pesquisa é contínua, os dados podem ser agrupados em classes e, para 
representar essas classes, utiliza-se o histograma, que é um gráfico de 
barras justapostas (não há espaços entre as colunas) 
 
 Cada barra indica uma classe. 
 
 O histograma mede a distribuição das frequências ou dos intervalos 
em relação a determinados grupos. 
Exemplo 
Analisando o histograma, nota-se que há 5 alunos que tiraram uma nota 
entre 2 e 4 pontos 
GRÁFICO DE SETORES 
 O gráfico de setores é um diagrama circular onde os valores de cada 
categoria estatística representada são proporcionais às respectivas 
frequências. 
 
 Muitas vezes é utilizado para expressar uma relação de 
proporcionalidade, e todos os dados somados formam o todo (inteiro). 
 
 Este gráfico pode vir acompanhado de porcentagens. É utilizado para 
dados qualitativos nominais. 
Exemplo 
Analisando o gráfico é fácil perceber que o setor da indústria é maior que os 
demais. 
Exercício 
Para onde você iria? 
Exercício 
Exercício 
Boa noite!

Continue navegando