Baixe o app para aproveitar ainda mais
Prévia do material em texto
ESTATÍSTICA E PROBABILIDADE APLICADA Profª Ms. Elizabete Silva Aula 2 – Distribuição de Frequência e Histogramas elizabete.silva@fmu.br Objetivos: Identificar uma distribuição de Frequência absoluta, relativa e acumulada Esboçar e interpretar gráficos: barras, histogramas e setores Tipos de ESTATÍSTICA Estatística Descritiva Estatística Inferencial Dedutiva Etapa inicial da análise Coleta, organização, apresentação e conclusões iniciais Indutiva Extrapolação (grande conjunto de dados - população) Tomada de decisão Na aula passada... População x Amostra Na aula passada... Métodos comuns de AMOSTRAGEM Na aula passada... Nas pesquisas estatísticas, as características sobre as quais queremos obter informação são chamadas variáveis. Variáveis Quantitativa Qualitativa Na aula passada... Quantitativa Qualitativa Variáveis Discreta Contínua Nominal Ordinal Na aula passada... Para onde você iria? https://forms.office.com/P ages/ResponsePage.aspx?id =nqplKssl7kiFm3JpfMgFXD BM6ihWh1hGozcsp8- UF4pUREZHUlpCNlhYSEVX U0VROEY0TE1RVExBNC4u Distribuição de Frequências Uma distribuição de frequências de uma variável lista todas as categorias, bem como o número de elementos que pertencem a cada uma das categorias. Exemplo Foi perguntado a uma amostra de 30 pessoas que consomem rosquinhas com frequência, que variedades de rosquinhas é a sua favorita. As respostas dessas 30 pessoas se apresentaram do seguinte modo: Exemplo Com glacê..................... 8 pessoas Cobertura açucarada.... 5 pessoas Com recheio................. 7 pessoas Simples......................... 3 pessoas Outra ........................... 7 pessoas FREQUÊNCIA ABSOLUTA Distribuição de Frequências Relativas A frequência relativa de uma categoria é obtida pela divisão da frequência daquela categoria pela soma de todas as frequências. Dessa maneira, a frequência relativa mostra qual fração, ou proporção, da frequência total pertence à categoria correspondente. Uma distribuição de frequências relativas lista as frequências relativas para todas as categorias. 𝑭𝒓𝒆𝒒𝒖ê𝒏𝒄𝒊𝒂 𝒓𝒆𝒍𝒂𝒕𝒊𝒗𝒂 𝒅𝒆 𝒖𝒎𝒂 𝒄𝒂𝒕𝒆𝒈𝒐𝒓𝒊𝒂 = 𝑭𝒓𝒆𝒒𝒖ê𝒏𝒄𝒊𝒂 𝒅𝒂𝒒𝒖𝒆𝒍𝒂 𝒄𝒂𝒕𝒆𝒈𝒐𝒓𝒊𝒂 𝑺𝒐𝒎𝒂 𝒅𝒆 𝒕𝒐𝒅𝒂𝒔 𝒂𝒔 𝒇𝒓𝒆𝒒𝒖ê𝒏𝒄𝒊𝒂𝒔 Distribuição de Frequências Relativas em Percentagem 𝑷𝒆𝒓𝒄𝒆𝒏𝒕𝒂𝒈𝒆𝒎 = 𝑭𝒓𝒆𝒒𝒖ê𝒏𝒄𝒊𝒂 𝑹𝒆𝒍𝒂𝒕𝒊𝒗𝒂 X 𝟏𝟎𝟎 A percentagem para uma categoria é obtida pela multiplicação da frequência relativa daquela categoria por 100. Uma distribuição de percentagens lista as percentagens para todas as categorias Exemplo Variedade de Rosquinha Frequência Relativa Percentagem Com glacê 8/30 = 0,267 0,267.100 = 26,7% Com recheio 7/30 = 0,233 0,233. 100 = 23,3% Cobertura açucarada 5/30 = 0,167 0,167.100 = 16,7% Simples 3/30 = 0,1 0,1.100 = 10% Outras 7/30 = 0,233 0,233.100= 23,3% SOMA = 1 SOMA = 100% Classes ou Intervalos • Quando o número de resultados obtidos em uma pesquisa é demasiadamente grande, é comum agruparmos esses resultados em faixas de valores, denominadas de classes ou intervalos. • No entanto, ao resumirmos os valores individuais em intervalos ou classes, estamos conscientes de que algum erro pode estar sendo inserido. Exemplo Como organizar dados obtidos, por meio de uma pesquisa sobre a faixa etária de grupo de alunos. Aos valores à esquerda de cada faixa etária, damos o nome de limites inferiores (Li), e aos valores à direita, damos o nome de limites superiores (Ls) das classes ou intervalos. Exemplo O símbolo representa que a classe ou intervalo é fechado à esquerda, ou seja, o valor escrito à esquerda (limite inferior) pertence ao intervalo e, como a classe ou intervalo é aberto à direita, o valor escrito à direita (limite superior) não pertence a mesma Exemplo Número de Classes Não há regras rápidas e absolutas sobre o número de classes ou a escolha das classes em si. Entre 5 e 20 classes serão satisfatórias para a maior parte dos conjuntos de dados. Normalmente, quanto maior o número de observações em um conjunto de dados, mais classes devem ser usadas Lembre-se, esses números são apenas uma recomendação. Número de Classes A regra Sturges é um método empírico amplamente usado em estatística descritiva para determinar o número de classes que devem existir em um histograma de frequência, a fim de classificar um conjunto de dados representando uma amostra ou população. Ela fornece um número ideal de classes: 𝒌 = 𝟏 + 𝐥𝐨𝐠𝟐(𝑵) 𝑜𝑢 𝒌 = 𝟏 + 𝟑, 𝟑𝟐𝟐 𝐥𝐨𝐠(𝑵) - k é o número de classes. - N é o número total de observações - log é o logaritmo comum da base 10 Exemplo Uma pesquisa trouxe às idades de homens que se exercitam em uma academia local. Para determinar o número de classes é necessário conhecer o tamanho da amostra ou o número de observações. Nesse caso, temos 30. 𝒌 = 𝟏 + 𝐥𝐨𝐠𝟐(𝑵) 𝑜𝑢 𝒌 = 𝟏 + 𝟑, 𝟐𝟐𝟐 𝐥𝐨𝐠(𝑵) Exemplo Em seguida, aplicando a regra Sturges, temos: 𝑘 = 1 + 3,322. log(𝑁) 𝑘 = 1 + 3,322. log(30) 𝑘 = 1 + 3,322.1,4771 𝑘 ≅ 5,90 (±6 𝑐𝑙𝑎𝑠𝑠𝑒𝑠) Amplitude A amplitude do intervalo (ou classe) é obtida subtraindo-se o limite superior (𝐿𝑠) do limite inferior (𝐿𝑖) de qualquer classe da série, isto é: 𝑨 = 𝑳𝒔 − 𝑳𝒊 Por exemplo, A = 25 – 20 = 5, então, na distribuição de frequências, os intervalos (ou classes) têm amplitude A = 5. Esta é chamada de Amplitude total. Amplitude Agora, usando a regra de Sturges, a amplitude da classe é obtida subtraindo-se o limite superior do limite inferior de qualquer classe da série e depois, dividindo-se esse valor pelo número de classes (K), isto é: 𝑨 = 𝑳𝒔 − 𝑳𝒊 𝒌 Amplitude Por exemplo, 𝐴 = 𝐿𝑠 − 𝐿𝑖 𝑘 = (46 − 13) 6 = 33 6 ≅ 5,5 (𝑎𝑚𝑝𝑙𝑖𝑡𝑢𝑑𝑒 𝑑𝑒 6, 𝑠𝑒𝑚𝑝𝑟𝑒 𝑗𝑜𝑔𝑎 𝑝𝑎𝑟𝑎 𝑐𝑖𝑚𝑎) Amplitude Logo, ficaria com 6 classes e cada classe com amplitude de 6 (lembrando que acrescentamos o valor da amplitude ao limite inferior, ou seja, 13 + 6 = 19, por exemplo) Intervalos 13 19 19 25 25 31 31 37 37 43 43 49 Distribuição de Frequência Acumulada Voltemos ao Exemplo dos alunos: E se quisermos saber quantos alunos tem 20 anos ou menos? Distribuição de Frequência Acumulada Pode-se responder a essa questão utilizando uma distribuição de frequências acumuladas. Cada uma das classes em uma tabela de distribuição de frequências acumuladas fornece o número total de valores que se posicionam abaixo de um determinado valor. Uma distribuição de frequências acumuladas é construída somente para dados quantitativos. Uma distribuição de frequências acumuladas fornece o número total de valores que se posicionam abaixo da fronteira superior Distribuição de Frequência Acumulada Faixa etária Frequência Absoluta Frequência Acumulada 0 a 5 anos 0 0 5 a 10 anos 6 0 + 6 = 6 10 a 15 anos 14 0 + 6 + 14 = 20 15 a 20 anos 20 0 + 6 + 14 + 20 = 40 20 a 25 anos 8 0 + 6 + 14 + 20 + 8 = 48 25 a 30 anos 2 0 + 6 + 14 + 20 + 8 + 2 = 50 As frequências relativas acumuladas são obtidas dividindo-se as frequências acumuladas pelo número total de observações no conjunto de dados. As percentagens acumuladas são obtidas multiplicando-se as frequências relativas acumuladas por 100. Distribuição de Frequência Relativa Acumulada Faixa etária Frequência Relativa Acumulada Percentagem Acumulada 0 a 5 anos 0/50 = 0 0 % 0 a 10 anos 6/50 = 0,12 12% 0 a 15 anos 20/50 = 0,4 40% 0 a 20 anos 40/50 = 0,8 80% 0 a 25 anos 48/50 = 0,96 96% 0 a 30 anos 50/50 = 1 100% GRÁFICOS Gráfico é uma forma de organizar informações por meio de imagens Uma imagem vale mais do que mil palavras. A importância de um gráfico está ligado à facilidade e rapidez na interpretação das informações e também à variedade de formas de ilustração dos dados apresentados. Dependendo do tipo de variável, a leitura fica melhor com um tipo de gráfico do queoutro GRÁFICOS GRÁFICO DE BARRAS O gráfico de barras faz a representação dos valores por meio de retângulos na posição vertical. Utilizado quando desejamos ressaltar a quantidade de valor em estudo O gráfico de barras mede uma certa informação e não um grupo de dados Os dados são indicados na posição vertical e as quantidades aparecem na posição horizontal Exemplo É possível, ao analisar o gráfico, determinar a nota de cada um dos alunos, por exemplo, Caio teve nota 5. HISTOGRAMA O histograma é uma ferramenta estatística. Quando a variável de uma pesquisa é contínua, os dados podem ser agrupados em classes e, para representar essas classes, utiliza-se o histograma, que é um gráfico de barras justapostas (não há espaços entre as colunas) Cada barra indica uma classe. O histograma mede a distribuição das frequências ou dos intervalos em relação a determinados grupos. Exemplo Analisando o histograma, nota-se que há 5 alunos que tiraram uma nota entre 2 e 4 pontos GRÁFICO DE SETORES O gráfico de setores é um diagrama circular onde os valores de cada categoria estatística representada são proporcionais às respectivas frequências. Muitas vezes é utilizado para expressar uma relação de proporcionalidade, e todos os dados somados formam o todo (inteiro). Este gráfico pode vir acompanhado de porcentagens. É utilizado para dados qualitativos nominais. Exemplo Analisando o gráfico é fácil perceber que o setor da indústria é maior que os demais. Exercício Para onde você iria? Exercício Exercício
Compartilhar